CN107075486B - 表达巨细胞病毒抗原的哺乳动物细胞 - Google Patents

表达巨细胞病毒抗原的哺乳动物细胞 Download PDF

Info

Publication number
CN107075486B
CN107075486B CN201580059495.8A CN201580059495A CN107075486B CN 107075486 B CN107075486 B CN 107075486B CN 201580059495 A CN201580059495 A CN 201580059495A CN 107075486 B CN107075486 B CN 107075486B
Authority
CN
China
Prior art keywords
leu
ser
thr
val
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580059495.8A
Other languages
English (en)
Other versions
CN107075486A (zh
Inventor
A.卡菲
C.齐费里
I.霍夫曼
H.劳克斯
A.利尔雅
Y.温
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GlaxoSmithKline Biologicals SA
Original Assignee
GlaxoSmithKline Biologicals SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GlaxoSmithKline Biologicals SA filed Critical GlaxoSmithKline Biologicals SA
Publication of CN107075486A publication Critical patent/CN107075486A/zh
Application granted granted Critical
Publication of CN107075486B publication Critical patent/CN107075486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16151Methods of production or purification of viral material

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Cell Biology (AREA)
  • Reproductive Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本发明涉及适合于疫苗用途的巨细胞病毒(CMV)蛋白。本文提供了哺乳动物宿主细胞,特别是CHO细胞,其中编码CMV蛋白gH、gL、pUL128、pUL130、pUL131(或其复合物形成片段)的序列稳定整合至基因组中。

Description

表达巨细胞病毒抗原的哺乳动物细胞
发明领域
本发明涉及表达适合于疫苗用途的巨细胞病毒(CMV)蛋白的宿主细胞。
发明背景
巨细胞病毒是属于被称作疱疹病毒科或疱疹病毒的病毒科的病毒属。感染人类的物种通常称作人巨细胞病毒(HCMV)或人疱疹病毒-5 (HHV-5)。在疱疹病毒科中,HCMV属于乙型疱疹病毒亚科,其还包括来自其它哺乳动物的巨细胞病毒。
尽管它们可见于整个身体,但HCMV感染通常与唾液腺相关。HCMV感染了美国50%至80%的成年人(全世界40%),如抗体在大量普通人群中的存在所示。HCMV感染在健康人中通常是不引入注意的,但对于免疫功能低下者(诸如感染HIV的人、器官移植受体或新生婴儿)可以是致命的。HCMV是最频繁地传播至发育中的胎儿的病毒。感染后,HCMV具有在宿主终生在体内维持潜伏的能力,伴随偶尔地由潜伏再活化。鉴于该疾病的严重性和重要性,获得有效的疫苗被认为是公共卫生的顶级优先事项(Sung, H.,等人, (2010) Expertreview of vaccines 9, 1303-1314; Schleiss, Expert Opin Ther Pat. Apr 2010; 20(4): 597-602)。
已对超过20种不同HCMV毒株的基因组测序,包括实验室毒株和临床分离物的那些。例如,已对以下HCMV毒株测序:Towne (GL239909366)、AD169 (GI:219879600)、Toledo(GL290564358)和Merlin (GI:155573956)。HCMV毒株AD169、Towne和Merlin可获得自美国典型培养物保藏中心(分别为ATCC VR538、ATCC VR977和ATCC VR1590)。
CMV含有未知数目的膜蛋白复合物。在病毒包膜中的约30种已知糖蛋白中,gH和gL由于存在于几种不同的复合物中而显得特别令人感兴趣:二聚体gH/gL、三聚体gH/gL/gO(也称作gCIII复合物)和五聚体gH/gL/pUL128/pUL130/pUL131 (pUL131也称作“pUL131A”、“pUL131a”或“UL131A”;pUL128、pUL130和pUL131亚基有时也称作UL128、UL130、UL131)。认为CMV使用五聚体复合物以通过胞吞作用和低pH依赖的融合进入上皮和内皮细胞,但认为其在涉及gH/gL或可能gH/gL/gO的过程中在质膜处通过直接融合进入成纤维细胞。gH/gL和/或gH/gL/gO复合物对于成纤维细胞感染是足够的,然而需要五聚体复合物来感染内皮和上皮细胞。
认为五聚体复合物是CMV疫苗接种的主要靶标。病毒基因UL128、UL130和UL131是内皮进入所需的(Hahn, Journal of Virology 2004; 78:10023-33)。成纤维细胞适应的非内皮嗜性毒株在这三种基因中的至少一种中含有突变。例如,Towne毒株,含有引起UL130基因中的移框的2个碱基对的插入,而AD169含有在UL131基因中的1个碱基对的插入。Towne和AD169两者都可适应于内皮细胞中的生长,且在这两种情况下,修复了UL130或UL131基因中的移框突变。
US7704510公开了pUL131A是上皮细胞向性所需的。US7704510还公开了pUL128和pUL130与gH/gL形成复合物,其整合至病毒粒子中。该复合物对于感染内皮和上皮细胞、而非感染成纤维细胞所需的。已发现抗CD46抗体抑制上皮细胞的HCMV感染。
在临床试验中测试的CMV疫苗包括Towne疫苗、Towne-Toledo嵌合体、以gB作为抗原的α病毒复制子、gB/MF59疫苗、由GlaxoSmithKline生产的gB疫苗和使用gB和pp65的DNA疫苗。pp65是病毒蛋白,其为针对CMV的CD8+应答的有效诱导剂。这些疫苗都是阻断病毒进入内皮细胞/上皮细胞的抗体的不良诱导剂(Adler, S. P. (2013), British MedicalBulletin, 107, 57-68. doi:10.1093/bmb/ldt023)。
通常认为,针对五聚体复合物(gH/gLpUL128/pUL130/pUL131)的中和抗体将比针对CMV gB亚基或gH/gL二聚体复合体产生的中和抗体显著更有效。因此,为了开发针对CMV的有效疫苗,迫切需要生产大量(例如商业规模)的CMV五聚体复合物。
然而,CMV五聚体复合物的重组生产仍然有挑战性。所有五个亚基都需要被表达(优选以基本上相等的量,且优选在持续的时间段),正确地折叠,并且被适当组装成五聚体。此外,还需要避免污染复合物(诸如gH/gL二聚体,gH/gL四聚体(两个拷贝的gH和两个拷贝的gL),gH/gLpUL128/pUL130四聚体等)的不期望的组装。
重组表达此真核蛋白复合物将需要鉴定合适的构建体和合适的宿主,用于在持续的时间段,表达足量的正确折叠的蛋白,其然后可适当地组装成蛋白复合物。此外,合适的表达宿主的选择对蛋白产率和质量以及生产过程的实际成本具有显著影响。
发明概述
本文公开和示例的是哺乳动物宿主细胞,特别是CHO细胞,其中编码CMV蛋白gH、gL、pUL128、pUL130、pUL131 (或其复合物形成片段)的序列稳定整合至基因组中。此类宿主细胞提供可重组产生gH/gL/pUL128/pUL130/pUL131五聚体复合物的可靠来源。
在一个方面,本发明提供重组哺乳动物细胞,诸如啮齿动物细胞(例如,CHO细胞),其包含编码巨细胞病毒(CMV)五聚体复合物的一种或多种多核苷酸序列,其中所述五聚体复合物包含(i) gH或其复合物形成片段、(ii) gL或其复合物形成片段、(iii) pUL128或其复合物形成片段、(iv) pUL130或其复合物形成片段和(v) pUL131或其复合物形成片段,其中所述一种或多种多核苷酸序列整合至所述哺乳动物细胞的基因组DNA中。因为多核苷酸序列稳定整合至细胞的基因组DNA中,所以它们可作为基因组序列的一部分被传递至其后代。此类细胞在本领域中通常被称为稳定的细胞系。具体地,所述细胞不包含可导致感染性CMV病毒的产生的CMV病毒序列。在某些实施方案中,所述哺乳动物细胞是CHO细胞。当在合适的条件下培养时,所述CMV五聚体复合物由所述宿主细胞表达。
合适的CHO细胞包括例如在美国典型培养物保藏中心(ATCC)或欧洲细胞培养物保藏中心(ECACC)可得的任何CHO细胞系。示例性CHO细胞系包括例如CHO-K1细胞、CHO-DUXB11、CHO-DG44或CHO-S细胞。为了易于选择稳定整合的克隆,所述宿主细胞可以是二氢叶酸还原酶(DHFR)-缺陷的。DHFR缺陷的或具有DHFR活性的细胞系中的重组蛋白表达也可以通过甲氨蝶呤(MTX)选择进行筛选。
所述宿主细胞可以具有一个或多个另外的修饰以进一步增强CMV五聚体复合物的产生。在某些实施方案中,与对照相比,在宿主细胞中C12orf35蛋白的表达水平或活性降低。在某些实施方案中,与对照相比,在宿主细胞中FAM60A蛋白的表达水平或活性降低。在某些实施方案中,与对照相比,在宿主细胞中基质蛋白酶(matriptase)的表达水平或活性降低。本文所述的修饰可以单独或以任何组合使用。
重组产生的CMV五聚体复合物可以是可溶性的(例如,缺少gH的跨膜结构域)。为了易于产生,重组产生的CMV五聚体复合物可以从宿主细胞分泌至培养基中。
本文所述的哺乳动物宿主细胞特别适用于大规模生产,诸如尺寸为至少20升(例如,50升、100升等)的培养物。在某些实施方案中,CMV五聚体复合物的产率为至少0.05 g/L,或至少0.1 g/L。
附图简述
图1说明了用于共表达五聚体的五种组分的各种设计策略。
图2显示用于转染CHO细胞的表达载体的质粒图。
图3显示用最佳的12个克隆产生的纯化的五聚体的SDS-PAGE分析。
图4说明用于研究最佳的12个克隆的稳定性的实验设计。
图5显示由最佳克隆VF7产生的五聚体的产率。
发明详述
1. 概述
CMV疫苗接种的主要靶标之一是五聚体复合物(gH/gL/pUL128/pUL130/pUL131)。为了以商业规模生产重组CMV五聚体,需要鉴定合适的构建体和合适的宿主,使得五聚体的五种亚基可以以足够量表达持续时间段,并且可以适当地组装成五聚体复合物。CMV五聚体是针对人CMV的中和抗体的主要靶标。
已使用HEK293作为宿主细胞重组产生CMV五聚体。参见WO2014/005959。然而,HEK293细胞系在本领域中通常被认为是用于瞬时基因表达的最佳宿主细胞系之一。参见,Meyer等人, PLoS One, 2013 Jul 17;8(7):e68674. doi: 10.1371/journal.pone.0068674。然而,难以在瞬时转染的HEK293细胞中维持五聚体表达持续的时间段。此外,在WO 2014/005959中公开的实例中,经由五种不同质粒,将五聚体的五种亚基引入HEK293细胞。在此类配置下,难以将每个五聚体亚基的表达维持在基本相等水平。不均匀数量的亚基可降低五聚体组装的效率,特别是考虑到这些亚基已经具有形成污染复合物(诸如gH/gL二聚体、gH/gL四聚体(2个拷贝的gH和2个拷贝的gL)、gH/gLpUL128/pUL130四聚体)的趋势。此外,编码gH的质粒通过新霉素选择,分别编码gL、pUL128、pUL130和pUL131的四种质粒都通过卡那霉素选择。因此,因为所有四种质粒都通过卡那霉素选择,所以无法容易检测到宿主细胞中单一质粒的损失,但单一质粒的损失将阻止五聚体的组装。
如本文所公开和示例,本发明人通过使用中国仓鼠卵巢(CHO)细胞克服了重组生产CMV五聚体的困难。在这些CHO细胞中,编码gH、gL、pUL128、pUL130、pUL131 (或其复合物形成片段)的序列稳定整合至CHO细胞的基因组中。通过将五聚体编码序列整合至CHO细胞的基因组中,本发明人以高效率和基因组稳定性实现了重组五聚体的稳定的基因组表达。如实施例部分中所示例,发现与瞬时转染的HEK293细胞相比,CHO稳定系一致地实现了100倍更高的产率,使得这些CHO细胞系特别适用于商业生产CMV五聚体。与具有五种外源质粒的瞬时转染的HEK细胞相比,稳定整合还允许容易地操作大规模细胞培养。事实上,最佳的克隆产生五聚体,产率高达0.1g/L至0.5g/L。
本文还提供了用于CMV五聚体生产的宿主细胞的进一步改进。具体而言,示例三种修饰的宿主细胞:(i) 与对照相比,其中C12orf35蛋白的表达水平或活性降低的宿主细胞;(ii) 与对照相比,其中FAM60A蛋白的表达水平或活性降低的宿主细胞;(iii) 与对照相比,其中基质蛋白酶的表达水平或活性降低的宿主细胞。发现C12orf35蛋白或FAM60A蛋白的表达水平或活性的降低导致重组蛋白的表达水平的显著增加。还发现,基质蛋白酶的表达水平或活性的降低显著减少了重组蛋白的蛋白水解降解(“修剪”)。这些修饰可以单独或以任何组合使用。
因此,本文提供了哺乳动物宿主细胞,特别是CHO细胞,其中编码包含gH、gL、pUL128、pUL130、pUL131 (或其复合物形成片段)的CMV五聚体复合物的多核苷酸序列稳定整合至基因组DNA中。当在合适的条件下培养时,所述CMV五聚体复合物由所述宿主细胞表达。
本文还提供了由本文所述的哺乳动物细胞产生的巨细胞病毒(CMV)五聚体复合物。
本文还提供了产生巨细胞病毒(CMV)五聚体复合物的方法,其中所述五聚体复合物包含:gH或其复合物形成片段,gL或其复合物形成片段,pUL128或其复合物形成片段,pUL130或其复合物形成片段,和pUL131或其复合物形成片段,所述方法包括:(i)在合适的条件下培养如本文所述的哺乳动物细胞,从而表达所述五聚体复合物;和从培养物收获所述五聚体复合物。五聚体复合物可进一步包含纯化物。本文还提供了通过该方法产生的巨细胞病毒(CMV)五聚体复合物。
本文还提供了包含本文所述的五聚体复合物的组合物。所述组合物可以包含适合于体内施用的纯化的CMV五聚体复合物。例如,这种组合物中的五聚体复合物可以具有按质量计至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的纯度。所述组合物可以进一步包含佐剂,诸如铝盐,或MF59。
本文还提供了用于诱导针对CMV的免疫应答的组合物。还提供了本文描述的组合物用于诱导针对CMV的免疫应答的用途,以及本文所述的组合物在制备用于诱导针对CMV的免疫应答的药物中的用途。
2. CMV五聚体复合物和编码序列
A. CMV五聚体复合物
在一个方面,本发明提供了表达CMV五聚体复合物的哺乳动物宿主细胞,其中所述五聚体复合物包含(i) gH或其复合物形成片段、(ii) gL或其复合物形成片段、(iii)pUL128或其复合物形成片段、(iv) pUL130或其复合物形成片段和(v) pUL131或其复合物形成片段。将编码CMV五聚体复合物的多核苷酸序列整合至宿主细胞的基因组DNA中,并且当在合适的条件下培养时,所述CMV五聚体复合物由所述宿主细胞表达。
在某些实施方案中,所述五聚体复合物是可溶的。可以例如通过使用gH的片段(其中gH亚基的跨膜结构域缺失)来获得可溶性五聚体复合物,如下面所详细描述。
在某些实施方案中,所述五聚体复合物从宿主细胞分泌。已报道,所有五种亚基gH、gL、pUL128、pUL131和pUL131的存在足以在其输出至高尔基体之前在ER中组装五聚体复合物。参见,Ryckman等人, J Virol. Jan 2008; 82(1): 60–70。或者或另外,适当的信号肽可用于五种亚基中的一种或多种中(例如,通过制备具有分泌信号的融合蛋白)。用于产生分泌蛋白的信号序列(和表达盒)是本领域已知的。通常,前导肽长5-30个氨基酸,并且通常存在于新合成的蛋白的N末端。信号肽的核心通常含有疏水性氨基酸的长延伸,其具有形成单个α-螺旋的倾向。此外,许多信号肽以短的带正电荷的氨基酸延伸开始,其可有助于在易位期间强化多肽的适当拓扑学。在信号肽的末端,通常存在被信号肽酶识别和切割的氨基酸的延伸。信号肽酶可以在完成易位期间或之后切割,以生成游离信号肽和成熟蛋白。
由UL75基因编码的人CMV糖蛋白H(gH)是一种病毒粒子糖蛋白,其是感染性所必需的,且在α-、β-和γ-疱疹病毒的成员间是保守的。其可与gL形成稳定的复合物,且该复合物的形成便于gH的细胞表面表达。基于HSV-2和EBV gH/gL复合物的晶体结构,gL亚基和gH的N末端残基形成在该结构的一端(“头部”)的球形结构域,其参与和gB的相互作用和膜融合的活化。接近于病毒膜的gH的C末端结构域(“尾部”)也参与膜融合。gH展示被宿主因子TLR2识别的决定簇,且其与宿主因子TLR2和TLR1之间形成的异源二聚体直接相互作用。TLR2介导NF-κB活化和来自细胞的炎性细胞因子应答。
来自CMV毒株Merlin的gH显示为SEQ ID NO:1 (GI:52139248,742个氨基酸残基)。来自CMV毒株Towne的gH显示为SEQ ID NO:2 (GI:138314,也为742个氨基酸残基)。来自Towne的gH已被表征为具有:(i) 6个N-糖基化位点(在残基55、62、67、192、641和700处);(ii) 在其N末端的疏水信号序列(氨基酸残基1-23);(iii) 从细胞凸出至胞外空间的胞外结构域(残基24-717);(iv) 疏水跨膜(TM)结构域(残基718-736);和(v) C末端胞质结构域(残基737-742)。SEQ ID NO:2与SEQ ID NO: 1和来自CMV毒株AD169的gH (GI:138313, SEQID NO:3)分别共享99%和96%氨基酸相似性。
通常,全长gH蛋白的N末端信号序列被宿主细胞信号肽酶切割以产生成熟的gH蛋白。因此,由本文所述的宿主细胞表达的gH蛋白可缺少N末端信号序列(例如,gH由缺少N末端信号序列的编码序列的核苷酸序列编码)。
本发明中还涵盖gH的复合物形成片段,诸如缺少跨膜(TM)结构域(例如,SEQ IDNO:2的残基718-736)、C末端结构域(例如,SEQ ID NO:2的残基737-742)、N末端信号序列(例如,SEQ ID NO:2的残基1-23)或其组合的gH片段。gH的复合物形成片段可以是保留与另一CMV蛋白形成复合物的能力的gH蛋白的任何一部分(part)或部分(portion)。在某些实施方案中,gH的复合物形成片段形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分。例如,全长gH序列的表达可阻碍可溶性五聚体复合物的纯化,因为gH的TM结构域是疏水性的。相反,五聚体复合物可以包含缺失gH的TM结构域的至少一部分的gH片段。
例如,可以使用包含N末端信号序列和gH的胞外结构域、而不包含TM结构域的gH片段。合适的gH片段还可以包含gH的胞外结构域的一部分(例如,gH的胞外结构域序列的至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%),但不包含或仅包含TM结构域的一小部分。或者,本文所述的gH片段可以缺少在全长胞外结构域的N末端和/或C末端的1至20个氨基酸残基(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸残基,或缺少1-20个残基、1-15个残基、1-10个残基、2-20个残基、2-15个残基、2-10个残基、5-20个残基、5-15个残基或5-10个残基)。认为C末端结构域的残基对于免疫原性是不必要的。本文描述的合适的gH片段的一个实例显示为SEQ ID NO:4,其对应于SEQ ID NO:1的氨基酸残基1-715。本文所述的gH片段的另一个实例显示为SEQ ID NO:5,其缺少gH的N末端信号序列、TM结构域和C末端结构域,并且对应于SEQ ID NO:1的氨基酸残基24-715。所述gH片段的另一个实例包含整个N末端信号序列和胞外结构域,但缺少C末端结构域。
gH的胞外结构域对应于gH的细胞外结构域。可以基于其序列与SEQ ID NO:1、2、3、4或5的成对比对,例如通过将gH的氨基酸序列与SEQ ID NO:1比对,并鉴定与SEQ ID NO:1的残基24-717对齐的序列,来预测gH (或其同源物或变体)的胞外结构域的位置和长度。类似地,可以通过将gH的氨基酸序列与SEQ ID NO:1、2、3、4或5比对,并鉴定与相应区域(例如,分别为SEQ ID NO:1的残基1-23 (信号序列)、718-736 (TM)和737-742 (C末端结构域))对齐的序列,来预测信号序列、TM结构域和C末端结构域的位置。或者,可以基于沿着给定gH序列的长度的疏水性的计算分析来预测胞外结构域、信号序列、TM结构域和C末端结构域的位置和长度。信号序列和TM结构域具有最高的疏水性水平,并且这两个区域侧接疏水性较小的胞外结构域。
也可以通过本领域已知的标准测定法(诸如共免疫沉淀测定法、交联或通过荧光染色共定位等)获得或确定gH的合适的复合物形成片段。也可以使用SDS-PAGE或western印迹(例如,通过显示所有五种亚基都存在于凝胶电泳中)。在某些实施方案中,gH的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
其它合适的gH蛋白可以是与SEQ ID NO:1、2、3、4或5具有各种程度的同一性的gH变体,诸如与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5中所述的序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的gH变体。在某些实施方案中,gH变体蛋白:(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
人CMV糖蛋白L (gL)由UL115基因编码。gL被认为是病毒复制所必需的,并且gL的所有已知功能特性与其与gH的二聚化直接相关。gL/gH复合物是导致病毒进入宿主细胞的病毒和质膜的融合所必需的。已报道了来自CMV毒株Merlin (GI:39842115, SEQ ID NO:6)和CMV毒株Towne (GI:239909463, SEQ ID NO:7)的gL长度为278个氨基酸。已报道了来自HCMV毒株AD169的gL (GI:2506510, SEQ ID NO:8)长度为278个氨基酸,其具有在其N末端的信号序列(氨基酸残基1-35)、两个N-糖基化位点(在残基74和114处),并且缺少TM结构域。预测SEQ ID NO:6中的N末端信号序列包含氨基酸残基1-30。SEQ ID NO:7与SEQ ID NO:6共享98%氨基酸序列同一性。来自22至39种临床分离物以及实验室毒株AD169、Towne和Toledo的全长gL基因的测序揭示分离物之间的氨基酸序列的小于2%变异。
通常,全长gL蛋白的N末端信号序列被宿主细胞信号肽酶切割以产生成熟的gL蛋白。因此,由本文所述的宿主细胞表达的gL蛋白可缺少N末端信号序列(例如,gL由缺少N末端信号序列的编码序列的核苷酸序列编码)。缺少信号序列的gL的一个实例是SEQ ID NO:9,其包含SEQ ID NO:6的氨基酸残基31-278,并且缺少SEQ ID NO:6的N末端信号序列。其它gL蛋白的信号序列可以通过如上所述的序列比对或序列分析工具来确定。
本发明中还涵盖gL的复合物形成片段。gL的复合物形成片段可以是保留与另一CMV蛋白形成复合物的能力的gL蛋白的任何一部分(part)或部分(portion)。在某些实施方案中,gL的复合物形成片段形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分。
可以通过本领域已知的标准测定法(诸如共免疫沉淀测定法、交联或通过荧光染色共定位等)获得或确定gL的合适的复合物形成片段。也可以使用SDS-PAGE或western印迹(例如,通过显示所有五种亚基都存在于凝胶电泳中)。在某些实施方案中,gL的复合物形成片段(i) 形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii) 包含来自SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9的至少一个表位;和/或(iii) 可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
其它合适的gL蛋白可以是与SEQ ID NO:6、7、8或9具有各种程度的同一性,诸如与SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9中所述的序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的gL变体(和变体的片段)。在某些实施方案中,gL变体蛋白:(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
已经报道了来自人CMV毒株Merlin的pUL128 (GI:39842124, SEQ ID NO:10)具有130个氨基酸残基,并且具有引起过早终止的1个核苷酸取代。已经报道了来自人CMV毒株Towne (GI:39841882, SEQ ID NO:11)和AD169 (GI:59803078, SEQ ID NO:12)的pUL128具有171个氨基酸残基。SEQ ID NO:10和12在SEQ ID NO:10的全长共享超过99%序列同一性;然而,由于翻译的过早终止,SEQ ID NO:10不具有SEQ ID NO:12的C末端41个氨基酸残基(在SEQ ID NO:12的全长约75%序列同一性)。
预测pUL128具有N末端信号序列,其位于SEQ ID NO:10的残基1-27处,但预测其缺少TM结构域。全长pUL128蛋白的N末端信号序列可以被宿主细胞信号肽酶切割以产生成熟的pUL128蛋白。因此,由本文所述的宿主细胞表达的pUL128蛋白可缺少N末端信号序列(例如,pUL128由缺少N末端信号序列的编码序列的核苷酸序列编码)。成熟的pUL128蛋白的一个实例是SEQ ID NO:13,其缺少N末端信号序列,并且对应于SEQ ID NO:11的氨基酸残基28-171。SEQ ID NO:13还与SEQ ID NO:12的氨基酸残基28-171相匹配。
本发明中还涵盖pUL128的复合物形成片段。pUL128的复合物形成片段可以是保留与另一CMV蛋白形成复合物的能力的pUL128蛋白的任何一部分(part)或部分(portion)。在某些实施方案中,pUL128的复合物形成片段形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分。
可以通过本领域已知的标准测定法(诸如共免疫沉淀测定法、交联或通过荧光染色共定位等)获得或确定pUL128的合适的复合物形成片段。也可以使用SDS-PAGE或western印迹(例如,通过显示所有五种亚基都存在于凝胶电泳中)。在某些实施方案中,pUL128的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:13的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
其它合适的pUL128蛋白可以是与SEQ ID NO:10、11、12或13具有各种程度的同一性,诸如与SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:13中所述的序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的pUL128变体(和变体的片段)。在某些实施方案中,pUL128变体蛋白:(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:13的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
UL130是UL131A-128基因座的中心和最大(214个密码子)的基因。该基因的概念性翻译预测了在亲水性蛋白之前的长(25个氨基酸) N末端信号序列,和在推定的趋化因子结构域(氨基酸46至120)内的两个潜在的N-连接的糖基化位点(Asn85和Asn118)以及接近于独特C末端区域的末端的另外的N-糖基化位点(Asn201)。预测pUL130缺少TM结构域。已报道其为内腔糖蛋白(luminal glycoprotein),其从受感染的细胞无效分泌,但作为高尔基体成熟形式并入病毒粒子包膜中。来自人CMV毒株Merlin和Towne的pUL130的序列可公开获得(分别为GI:39842125, SEQ ID NO:14, 214个氨基酸残基;和GI:239909473, SEQ ID NO:15, 229个氨基酸残基)。已报道了SEQ ID NO:15在pUL130的C末端区域含有移框突变,并且在SEQ ID NO:14的全长上与HCMV SEQ ID NO:14共享94%同一性。
全长pUL130蛋白的N末端信号序列可以被宿主细胞信号肽酶切割以产生成熟的pUL130蛋白。因此,由本文所述的宿主细胞表达的pUL130蛋白可缺少N末端信号序列(例如,pUL130由缺少N末端信号序列的编码序列的核苷酸序列编码)。成熟的pUL130蛋白的一个实例是SEQ ID NO:16,其缺少N末端信号序列,并且对应于SEQ ID NO:14的氨基酸残基26-214。
本发明中还涵盖pUL130的复合物形成片段。pUL130的复合物形成片段可以是保留与另一CMV蛋白形成复合物的能力的pUL130蛋白的任何一部分(part)或部分(portion)。在某些实施方案中,pUL130的复合物形成片段形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分。
可以通过本领域已知的标准测定法(诸如共免疫沉淀测定法、交联或通过荧光染色共定位等)获得或确定pUL30的合适的复合物形成片段。也可以使用SDS-PAGE或western印迹(例如,通过显示所有五种亚基都存在于凝胶电泳中)。在某些实施方案中,pUL130的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
其它合适的pUL130蛋白可以是与SEQ ID NO:14、15或16具有各种程度的同一性,诸如与SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16中所述的序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的pUL130变体(和变体的片段)。在某些实施方案中,pUL130变体蛋白:(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
不仅在内皮细胞中,而且在上皮细胞中,pUL131A功能都是人CMV复制所需的。已报道了来自人CMV毒株Merlin (GI:39842126, SEQ ID NO:17, 129个氨基酸)和Towne (GI:239909474, SEQ ID NO:18, 129个氨基酸)以及AD169 (GI:219879712, SEQ ID NO:19,76个氨基酸)的pUL131A。预测pUL131A含有N末端信号序列,其位于SEQ ID NO:18的残基1-18处,但缺少TM结构域。已报道来自毒株AD169的pUL131A含有1-碱基对的插入,其引起移框。SEQ ID NO:17在N末端28个氨基酸上与SEQ ID NO:19具有96%同一性,但其在SEQ IDNO:17全长上与SEQ ID NO:19仅具有36%同一性,这是由于AD169 UL131A基因的移框。
全长pUL131蛋白的N末端信号序列可以被宿主细胞信号肽酶切割以产生成熟的pUL131蛋白。因此,由本文所述的宿主细胞表达的pUL131蛋白可缺少N末端信号序列(例如,pUL131由缺少N末端信号序列的编码序列的核苷酸序列编码)。成熟的pUL131蛋白的一个实例是SEQ ID NO:20,其缺少N末端信号序列,并且对应于SEQ ID NO:17的氨基酸残基19-129。SEQ ID NO:35还对应于SEQ ID NO:18的氨基酸残基19-129。
本发明中还涵盖pUL131的复合物形成片段。pUL131的复合物形成片段可以是保留与另一CMV蛋白形成复合物的能力的pUL131蛋白的任何一部分(part)或部分(portion)。在某些实施方案中,pUL131的复合物形成片段形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分。
可以通过本领域已知的标准测定法(诸如共免疫沉淀测定法、交联或通过荧光染色共定位等)获得或确定pUL31的合适的复合物形成片段。也可以使用SDS-PAGE或western印迹(例如,通过显示所有五种亚基都存在于凝胶电泳中)。在某些实施方案中,pUL31的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
其它合适的pUL131蛋白可以是与SEQ ID NO:17、18、19或20具有各种程度的同一性,诸如与SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20中所述的序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的pUL131变体(和变体的片段)。在某些实施方案中,pUL131变体蛋白:(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;(ii)包含来自SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20的至少一个表位;和/或(iii)可在体内引发与CMV病毒粒子免疫交叉反应的抗体。
在某些实施方案中,本文所述的gH、gL、pUL128、pUL130、pUL131(或其片段)可以含有另外的氨基酸残基,诸如N末端或C末端延伸。此类延伸可以包括一个或多个标签,其可以便于蛋白的检测(例如用于通过单克隆抗体检测的表位标签)和/或纯化(例如允许在镍螯合树脂上纯化的多组氨酸标签)。亲和纯化标签的实例包括,例如,His标签(六组氨酸(SEQID NO:36),结合金属离子)、麦芽糖结合蛋白(MBP)(结合直链淀粉)、谷胱甘肽-S-转移酶(GST)(结合谷胱甘肽)、FLAG标签(Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys (SEQ ID NO:37),结合抗flag抗体)、Strep标签(Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly (SEQ ID NO:38)或Trp-Ser- His-Pro-Gln-Phe-Glu-Lys (SEQ ID NO:39),结合链霉抗生物素蛋白或其衍生物)。
在某些实施方案中,可以使用可切割的接头。这允许标签与纯化的复合物分离,例如通过添加能够切割接头的试剂。许多不同的可切割接头是本领域技术人员已知的。此类接头可以例如通过光不稳定键的照射或酸催化的水解来切割。还存在并入蛋白酶识别位点且可以通过添加合适的蛋白酶来切割的多肽接头。
在其它实施方案中,可能更期望具有gH、gL、pUL128、pUL130、pUL131(或其片段)蛋白,例如,为了临床安全性或效力原因,其不包含外源性标签序列。
尽管gH、gL、pUL130蛋白有时被称为糖蛋白,但该命名不应被当作意指这些蛋白当与本发明一起使用时必须被糖基化。尽管上文已经提到特定毒株,但应当理解,可以使用来自不同CMV毒株的CMV蛋白gH、gL、pUL128、pUL130、pUL131(或其片段)。通过非限制性实例的方式,其它CMV毒株可以包括Towne、Toledo、AD169、Merlin、TB20和VR1814毒株。
B. 编码CMV蛋白和复合物的核酸
本文还提供了用于基因组整合和随后的CMV五聚体表达的编码CMV蛋白和复合物的核酸。
编码本文所述的CMV蛋白和复合物的一种或多种核酸构建体可用于基因组整合。例如,可以将编码所有五种亚基gH、gL、pUL128、pUL130、pUL131(或其片段)的单一核酸构建体引入宿主细胞。或者,五种亚基(或其片段)的编码序列可以由两种或更多种核酸构建体携带,然后将所述核酸构建体同时或依次引入宿主细胞。
例如,在一个示例性实施方案中,本发明提供了单一核酸构建体,其编码gH的胞外结构域、gL、pUL128、pUL130和pUL131。在另一个示例性实施方案中,本发明提供了两种核酸构建体,其编码:gH的胞外结构域、gL、pUL128、pUL130和pUL131。参见图1。在两个实例中,实现了成功的基因组整合。
所述核酸构建体可以包含含有一个或多个内含子的基因组DNA或cDNA。当内含子存在时,一些基因更有效地表达。编码pUL128的天然基因组序列包含两个内含子,编码pUL131的天然基因组序列包含一个外显子,而编码pUL130的天然基因组序列不包含任何内含子。编码pUL128的天然基因组序列包含三个外显子,编码pUL131的天然基因组序列包含两个外显子,而编码pUL130的天然基因组序列包含一个外显子。具体地,核酸序列适合于在所述哺乳动物细胞中表达外源多肽。
本文还提供了包含gH、gL、pUL128、pUL130和/或pUL131 (或其片段)的编码序列的载体。示例性载体包括能够自主复制或在哺乳动物细胞中复制的质粒。典型的表达载体含有可用于调节表达构建体中的编码序列的表达的合适的启动子、增强子和终止子。所述载体还可以包含选择标记,以提供用于选择转化的宿主细胞的表型性状(诸如赋予对抗生素诸如氨苄青霉素或新霉素的抗性)。
合适的启动子包括,例如,CMV启动子,腺病毒,EF1α,GAPDH金属硫蛋白启动子,SV-40早期启动子,SV-40晚期启动子,鼠乳腺肿瘤病毒启动子,劳斯肉瘤病毒启动子,多角体蛋白启动子等。启动子可以是组成型或诱导型的。可以使用一种或多种载体(例如,编码所有五种亚基或其片段的一种载体,或一起编码五种亚基或其片段两种或更多种载体);参见,例如图1。
当宿主细胞是CHO细胞时,启动子、增强子或终止子在CHO细胞中是有活性的。一个常用的启动子是人巨细胞病毒(hCMV)立即早期(IE)基因的启动子。该基因的启动子引导广泛多种细胞类型中的高水平的转基因表达。该启动子的活性取决于一系列17、18、19和21bp不完全重复,其中一些结合NF-κB cAMP反应性结合蛋白(CREB)和核因子-1家族的转录因子。
强启动子是在CHO细胞中引起mRNA以等于或高于hCMV核心启动子/增强子片段(描述于美国专利号5,168,062中)的高频率起始的启动子。此启动子可以是细胞型依赖性的强启动子(如描述于美国专利号5,589,392中),或普遍活性的强启动子。示例性组成型活性病毒启动子包括,例如,SV40病毒的早期和晚期启动子,人巨细胞病毒(hCMV)或鼠巨细胞病毒(mCMV)的立即早期启动子,单纯疱疹病毒的胸苷激酶启动子(TK)或劳斯肉瘤病毒长末端重复启动子(RS-LTR)。其它实例包括,例如,如通过美国专利号5,385,839和/或EP-323 997-A1中所述的2.1 kb Pst I片段所定义的hCMV-MIE启动子,或其具有启动子活性的功能部分。
也可以使用内部核糖体进入位点(IRES)和2A肽序列。IRES和2A肽提供了用于共表达多重序列的替代方法。IRES是核苷酸序列,其允许在信使RNA (mRNA)序列中间的翻译起始,这是作为蛋白合成的更大过程的一部分。通常,在真核生物中,仅可以在mRNA分子的5'末端开始翻译。IRES元件允许在一个转录物中表达多个基因。从一个转录物表达多个蛋白的基于IRES的多顺反子载体可以减少非表达克隆从选择的逃逸。
2A肽允许将单个开放阅读框中的多个蛋白翻译成多聚蛋白,所述多聚蛋白随后通过核糖体跳跃机制被切割成单个蛋白。2A肽可以提供多种蛋白产物的更平衡表达。
示例性IRES序列包括,例如,EV71 IRES、EMCV IRES、HCV IRES。
对于基因组整合,整合可以是位点特异性的或随机的。可以通过将同源序列引入本文所述的核酸构建体来实现位点特异性重组。此同源序列基本上匹配宿主基因组中特定靶位点的内源序列。或者,可以使用随机整合。有时,蛋白的表达水平可能根据整合位点而变化。因此,可能期望根据重组蛋白表达水平选择多个克隆以鉴定实现期望表达水平的克隆。
3. 宿主细胞
在另一个方面,本发明提供了宿主细胞,其中五聚体编码序列稳定整合至宿主细胞的基因组中,并且当在合适的条件下培养时,表达本文所公开的CMV五聚体。在某些实施方案中,所述宿主细胞是哺乳动物细胞。在某些实施方案中,所述宿主细胞是啮齿动物细胞。
啮齿动物细胞系的实例包括例如,幼仓鼠肾(BHK)(例如,BHK21、BH TK)、小鼠Sertoli (TM4)、Buffalo大鼠肝脏(BRL 3A)、小鼠乳腺肿瘤(MMT)、大鼠肝癌(HTC)、小鼠骨髓瘤(NS0)、鼠杂交瘤(Sp2/0)、小鼠胸腺瘤(EL4)、中国仓鼠卵巢(CHO)和CHO细胞衍生物、鼠胚胎(NIH/3T3、3T3 Li)、大鼠心肌(H9c2)、小鼠成肌细胞(C2C12)和小鼠肾(miMCD-3)。
在一个实施方案中,所述啮齿动物细胞是CHO细胞。合适的CHO细胞包括,例如,DUXB11和DG44系。这两种细胞系是二氢叶酸还原酶(DHFR)活性缺陷的,因此生长依赖于核苷酸前体的外源来源。DHFR缺陷型是适合于选择外源DNA的基因组整合和稳定表达的容易操作的表型。通过用目标基因和DHFR基因的表达盒转染细胞来完成基因组整合。转染后,将细胞置于缺乏核苷酸前体的选择培养基中。
可以通过向培养物中添加甲氨蝶呤(MTX),使得可以选择引入高拷贝数的表达载体,进一步增强DHFR缺陷细胞系中的重组蛋白表达。MTX是DHFR酶的竞争性抑制剂。在不存在核苷酸前体之外,应用这种另外的选择压力使得能够选择和分离已经经历整合表达载体的自发扩增的细胞的少数群体,所述表达载体含有DHFR选择性标记,并且在大多数情况下含有目标基因。多个基因拷贝的存在有助于实现外源蛋白的高水平表达。或者,可以独立于DHFR缺陷进行MTX选择(即,使用MTX来选择最初具有DHFR活性的宿主细胞),如本文公开的实施例中所示例的。
另一种合适的CHO细胞系是野生型CHO-K1细胞系及其衍生物CHO-K1SV。
一种常用的CHO-K1细胞系的选择方法是谷氨酰胺合成酶(GS)选择。不存在谷氨酰胺的外源来源的情况下,细胞存活依赖于GS酶来产生谷氨酰胺。用具有相对低的内源性GS酶活性的宿主细胞系,诸如鼠骨髓瘤来源的NS/0细胞和CHO细胞,当使用表达载体中的GS可选择标记和无谷氨酰胺的选择培养基时,该方法允许简单的选择方案。与DHFR/MTX系统类似,可将GS竞争性抑制剂甲硫氨酸砜亚胺(MSX)添加至培养基中,以应用额外的压力并选择驱动从整合载体的高水平表达的CHO细胞。
也可以基于如上所述的DHFR缺陷来选择CHO-K1细胞或任何其它常用的CHO细胞。例如,CHO-K1细胞或任何其它类型的CHO细胞可具有DHFR缺陷,诸如这样的缺失,其中缺失二氢叶酸还原酶(DHFR)基因的基因组序列的至少一个拷贝或所述DHFR基因的编码序列的至少30% (例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%)。引入DHFR缺陷的其它途径包括在内源性DHFR基因中产生突变。可以通过向培养物中添加甲氨蝶呤(MTX)来进一步增强细胞系,如上所述。
也可以基于MTX在有或无DHFR缺陷的情况下来选择CHO-K1细胞或任何其它常用的CHO细胞。在本文提供的实例中,基于MTX在无DHFR缺陷的情况下(即,用于基因组整合的原始CHO细胞是具有DHFR活性的),选择CHO细胞。在此系统中,通常,外源序列(例如,编码CMV蛋白的序列)的拷贝数通常低。据估计,本文所述的实施例中的细胞系在非常有限数目的整合位点(例如,1-2个整合位点)具有约1-10拷贝的编码CMV蛋白的外源序列。通常,当使用DFHR缺陷细胞系时,外源序列的拷贝数通常高得多,有时高达几百个拷贝。预期两种方法都适合于产生本文公开的CHO细胞系,尽管当拷贝数高时,宿主细胞在细胞系的传代和/或扩增期间可能丢失一个或多个拷贝的外源序列。
适合于本文所述的本发明的其它CHO细胞株包括,例如,CHO-ICAM-1细胞和CHO-hIFNγ细胞。这些遗传修饰的细胞允许将重组DNA稳定插入细胞的特定基因或表达区域,扩增插入的DNA以及选择表现出重组蛋白的高水平表达的细胞。
在欧洲细胞培养物保藏中心(ECACC)可得的示例性CHO细胞系列于表1中。可以使用表1中所列的任何CHO细胞。
表1
细胞系名称 关键词
CHO 中国仓鼠卵巢
CHO (无蛋白) 中国仓鼠卵巢
CHO-CHRM1 人胆碱能受体毒蕈碱M1,CHRM1,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO-CHRM2 人胆碱能受体毒蕈碱M2,CHRM2,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO-CHRM5 人胆碱能受体毒蕈碱M5,CHRM5,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO-CNR1 人大麻素受体I,CNR1 Gene ID 1268,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO-FFAR2 人游离脂肪酸受体2,FFAR2,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO-GPR120 人受体GPR120(孤儿),GPR120,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO-K1 中国仓鼠卵巢
CHO-K1-AC-无 中国仓鼠卵巢,无血清
CHO-K1/SF 中国仓鼠卵巢 (MEM调整的)
CHO-NPY1R 人神经肽Y受体,NPY1R,基因ID 4886,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO-OPRL1 人鸦片类受体样1,OPRL1,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO-SSTR1 人促生长素抑制素受体1,SSTR1 G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflexTM,CHO-K1宿主。
CHO/dhFr- 中国仓鼠卵巢
CHO/dhFr-AC-无 中国仓鼠卵巢,无血清
RR-CHOKI 中国仓鼠卵巢
T02J-10/10 (CHO-GCGR (GCGR)) 人胰高血糖素受体,GCGR,G蛋白偶联受体,GPCR,转染的,InSCREENeX SCREENflex<sup>TM</sup>,CHO-K1宿主。
各种CHO细胞系也可得自美国典型培养物保藏中心(ATCC),诸如CHO细胞系hCBE11(ATCC® PTA-3357™),E77.4 (ATCC® PTA-3765™),hLT-B: R-hG1 CHO #14 (ATCC®CRL-11965™),MOR-CHO- MORAb-003-RCB (ATCC® PTA-7552™),AQ.C2克隆11B (ATCC®PTA-3274™),AQ.C2克隆11B (ATCC® PTA-3274™),CHO-DG44中的hsAQC2 (ATCC® PTA-3356™),xrs5 (ATCC® CRL-2348™),CHO-K1 (ATCC® CCL-61™),Lec1 [初始命名为Pro-5WgaRI3C] (ATCC® CRL-1735™),Pro-5 (ATCC® CRL-1781™),ACY1-E (ATCC®65421™),ACY1-E (ATCC® 65420™),pgsE-606 (ATCC® CRL-2246™),CHO-CD36 (ATCC® CRL-2092™),pgsC-605 (ATCC® CRL-2245™),MC2/3 (ATCC® CRL-2143™),CHO-ICAM-1 (ATCC® CRL-2093™)和pgsB-618 (ATCC® CRL-2241™)。可以使用这些CHO细胞系中的任一种。
其它市售的CHO细胞系包括,例如,来自Life Technologies的FreeStyle™ CHO-S细胞和Flp-In™-CHO细胞系。
通常已经公开了用于在CHO细胞中表达重组蛋白的方法。参见例如美国专利号4,816,567和5,981,214。
除了CHO细胞之外,其它哺乳动物细胞也可以用作宿主。示例性啮齿动物细胞包括BHK21细胞、NS0细胞、Sp2/0细胞、EL4细胞、NIH/3T3细胞、3T3-L1细胞、ES-D3细胞、H9c2细胞、C2C12细胞、YB2/0、mimcd 3细胞等。示例性人细胞包括:SH-SY5Y细胞、IM 32细胞、LAN细胞、MCFIOA细胞、293T细胞、SK-BR3细胞、huvec细胞、huasmc细胞、HKB-1细胞、hmsc细胞、U293细胞、HE 293细胞、PERC6®细胞、Jurkai细胞、HT-29细胞、lncap.FGC细胞、A549细胞、MDA MB453细胞、hepg2细胞、THP-1细胞、bxpc-3细胞、Capan-1细胞、DU145细胞和PC-3细胞。
例如,细胞系PERC6®、小鼠骨髓瘤NS0细胞、幼仓鼠肾(BHK)细胞和人胚肾细胞系(HEK293)获得重组蛋白生产的监管批准。
可用于本文提供的方法的非人灵长动物细胞系的实例包括细胞系猴肾(CVI-76)、非洲绿猴肾(VERO-76)、绿猴成纤维细胞(COS-1)和通过SV40转化的猴肾(CVI)细胞(COS-7)。另外的哺乳动物细胞系是本领域普通技术人员已知的,并且在美国典型培养物保藏中心目录(Manassas, VA)上编目。
在一些实施方案中,所述宿主细胞适合于在悬浮培养物中生长。能够悬浮的宿主细胞通常是单分散的或以松散聚集体生长而没有显著的聚集。能够悬浮的宿主细胞包括适合于悬浮培养而无需调整或操纵的细胞(例如,造血细胞,淋巴样细胞)和已通过修饰或调整粘附依赖性细胞(例如上皮细胞,成纤维细胞)而使得能够悬浮的细胞。
在一些实施方案中,所述宿主细胞是粘附依赖性细胞,其在粘附培养物中生长和维持。可用于本文提供的方法种的人粘附细胞系的实例包括细胞系人成神经细胞瘤(SH-SY5Y、IMR32和LANS)、人宫颈癌(HeLa)、人乳腺上皮(MCFIOA)、人胚肾(293T)和人乳腺癌(SK-BR3)。
C12orf35基因和C12orf35蛋白
在某些实施方案中,所述宿主细胞是与对照相比,其中C12orf35蛋白的表达水平或活性降低的细胞。在某些实施方案中,此细胞是CHO细胞。2013年12月20日提交且通过引用并入本文的美国临时专利申请号61/919,313提供了哺乳动物细胞的详细描述,其中与对照相比,C12orf35蛋白的表达水平或活性降低。
可以使用各种对照。来自相应野生型细胞的C12orf35蛋白的表达水平或活性可用作对照。或者,对照可以是可以在文献或数据库中鉴定的预定水平或阈值水平。
人C12orf35基因是指编码染色体12开放阅读框35的核苷酸序列。编码的C12orf35蛋白是未表征的。人C12orf35基因的灰仓鼠(Cricetulus griseus)(中国仓鼠)同源物,被命名为Kiaa1551,据信位于染色体8中。人C12orf35基因的小家鼠(Mus musculus)同源物据信位于染色体6中。CHO C12orf35基因的基因ID作为GenBank基因ID号100762086公开;且人C12orf35基因的基因ID则作为GenBank基因ID号55196公开。关于灰仓鼠中的C12orf35基因、编码序列和预测的C12orf35蛋白的信息也通过登录号NCBI:XM_003512865得自GenBank。
C12orf35基因在真核细胞(诸如例如哺乳动物物种,诸如人、小鼠和仓鼠)中内源表达。预测由C12orf35基因编码的蛋白是超过1500个残基的大蛋白。序列表显示由不同哺乳动物物种,诸如仓鼠(SEQ ID NO:21和22)、人(SEQ ID NO:23和24)、小鼠(SEQ ID NO:35)的内源C12orf35基因编码的蛋白的示例性氨基酸序列或推定氨基酸序列。来自中国仓鼠的C12orf35的CDS (编码DNA序列)显示为SEQ ID NO:25。此外,对来自中国仓鼠的C12orf35mRNA的5'UTR (参见SEQ ID NO:26)和3'UTR (参见SEQ ID NO:27)的片段测序。
在人类中,C12orf35基因也称为KIAA1551。基因C12orf35在仓鼠中也称为C12orf35类似物或C12orf35同源物或在小鼠中也称为2810474O19Rik。可以在不同的物种中为蛋白或基因分配不同的名称,并且上文在表2中也列出了非限制性替代名称(别名)。为了简单起见,在本公开中,来自不同物种的同源物和直向同源物都被称为“C12orf35基因”或“C12orf35蛋白”。
针对该科学背景,令人惊讶和意料之外的是,当C12orf35蛋白的表达水平或活性与对照相比降低(例如,通过缺失C12orf35基因或引入突变)时,明显改善重组蛋白的产率。因此,C12orf35蛋白的表达水平或活性降低的哺乳动物宿主细胞(例如,CHO细胞)特别适合于五聚体复合物的重组生产。
降低C12orf35蛋白的表达水平或活性可以通过各种方式实现。例如,C12orf35蛋白的表达水平或活性可以通过基因敲除、基因突变、基因缺失、基因沉默或任何前述的组合来降低。基因敲除是一种基因技术,通过其经由破坏其功能使基因不起作用。例如,可将核酸插入编码序列,从而破坏基因功能。此外,可以缺失全长C12orf35基因(或其片段),从而基本上消除了功能性C12orf35蛋白的表达。例如,所述缺失可以是C12orf35基因的编码序列的至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%。另一个选择是将一个或多个突变引入编码序列中,其给出蛋白无功能或功能较低的C12orf35。例如,可以引入一个或多个移框突变,导致无功能或功能较低的C12orf35蛋白。或者或另外,可以将一个或多个终止密码子引入编码序列,使得获得截短的、无功能或功能较低的蛋白。其它选择包括但不限于启动子、5'-和/或3' UTR或其它调控元件中的一个或多个突变,例如,通过引入启动子缺失或通过在启动子和转录起始之间引入构建体。用于抑制或消除靶基因的表达的基因破坏的方法也是技术人员众所周知的。
由于每个细胞在其基因组中具有两个拷贝的C12orf35基因,在某些实施方案中,C12orf35基因的基因组序列的至少一个拷贝,或所述C12orf35基因的编码序列的至少50%被缺失。在某些实施方案中,C12orf35基因的基因组序列的所有两个拷贝(或来自每个拷贝的所述C12orf35基因的编码序列的至少50%)被缺失。
在某些实施方案中,缺失的序列包含CHO细胞的染色体8的端粒区域的一部分。端粒区域是染色单体的每个末端的重复核苷酸序列的区域,其保护染色体的末端免于退化,或与相邻染色体的融合。在某些实施方案中,CHO细胞的染色体8的端粒区域的核苷酸序列的至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%被缺失。
在某些实施方案中,缺失的序列还包含选自以下的基因的缺失:Bicd1、Amn1、甲基转移酶样蛋白20、Dennd5b、FAM60A、Caprin2、Ipo8、RPS4Y2及其组合。
在某些实施方案中,C12orf35基因(或其片段)的缺失是由于染色体断裂。可例如通过用促进染色体断裂的毒剂(诸如例如MTX、阿非迪霉素或潮霉素)处理真核细胞,来诱导染色体断裂。用于诱导染色体断裂的其它选择包括但不限于放射、照射、诱变剂、致癌物质和博来霉素。染色体断裂还可在转染,例如电穿孔期间自发发生。用于诱导染色体断裂的方法也是技术人员已知的,并且因此不需要本文任何详述。在诱导染色体断裂后,可以鉴定具有所需断点(其导致基因C12orf35基因或其片段的缺失)的真核细胞,例如,通过分析DNA或通过使用根据本公开的第五个方面的方法。例如,可以分析处理的细胞的表达概况,以确定C12orf35基因或位于基因C12orf35的着丝粒侧的基因是否表达,表达是否降低或基因是否未表达。例如,在小鼠或仓鼠细胞的情况下,可以分析C12orf35基因是否表达,且另外或除此之外,可以分析选自甲基转移酶样蛋白20、Dennd5b、FAM60A、Caprin2、Ipo8、Tmtc1或位于上述基因的端粒侧的基因(其中,端粒侧在此方面意味着朝向端粒末端的方向)的一种或多种基因是否由细胞表达和/或表达是否减少或基本上消除。
C12orf35蛋白的表达水平的降低可以通过转录后基因沉默(例如通过反义核酸分子或介导RNA干扰的分子)来实现。非限制性实例包括siRNA、shRNA、miRNA、反义寡核苷酸等,其中所有都是本领域众所周知的。
C12orf35蛋白的表达水平可以通过本领域已知的方法评价,例如通过测量编码C12orf35蛋白的mRNA或C12orf35蛋白本身的水平。此类方法包括例如northern印迹、FACS、ImageStream、western印迹、qPCR、RT-PCR、qRT-PCR、ELISA、Luminex、Multiplex等。
在某些实施方案中,与对照相比,C12orf35蛋白的表达水平或活性降低至少3倍、至少5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少75倍、至少80倍、至少90倍、至少100倍。
FAM60A基因和FAM60A蛋白
在某些实施方案中,所述宿主细胞是与对照相比,其中FAM60A蛋白的表达水平或活性降低的细胞。在某些实施方案中,此细胞是CHO细胞。2013年12月20日提交且通过引用并入本文的美国临时专利申请号61/919,340提供了哺乳动物细胞的详细描述,其中FAM60A蛋白的表达水平或活性降低。
可以如上所讨论使用各种对照。来自相应野生型细胞的FAM60A蛋白的表达水平或活性可用作对照。或者,对照可以是可以在文献或数据库中鉴定的预定水平或阈值水平。
FAM60A蛋白是在转录抑制中发挥功能的SIN3-组蛋白脱乙酰酶(HDAC)复合物(SIN3/HDAC复合物)的亚基(Munoz等人, 2012, THE Journal of Biological ChemistryVOL. 287, NO. 39, pp. 32346-32353; Smith等人, 2012, Mol Cell Proteomics 11(12): 1815-1828)。组蛋白脱乙酰酶(HDAC)催化从组蛋白移除乙酰基。赖氨酸上的组蛋白的乙酰化是用于调节染色质构象的主要机制。组蛋白乙酰化促进松弛的转录活性染色质状态,而由组蛋白脱乙酰酶(HDAC)催化的脱乙酰化有利于沉默、失活状态。数据库分析揭示在大多数后生动物中存在至少一种FAM60A直向同源物,但在线虫中没有。FAM60A基因在后生动物中是保守的,并且可见于已完全测序的所有脊椎动物和大多数无脊椎动物基因组中。FAM60A同源物的序列相似性研究表明基因组中主要仅存在该家族的单一代表性成员。仅存在少数例外。根据Smith等人, 2012,FAM60A蛋白具有缺少任何已知蛋白结构域的独特序列。此外,Smith等人2012描述了其未表现出与人蛋白质组中的其它已知蛋白的任何序列同源性。来自不同物种的FAM60A蛋白之间的序列比较显示FAM60A蛋白一般包含3个区域:(1)包含所有后生动物中高度保守区段的N-末端,(2)在脊椎动物中高度保守的中间区域,而在无脊椎动物中,其由可变长度的非保守间隔物组成,(3)包含所有后生动物中高度保守区段的C-末端。因此,在FAM60A N-和C-末端区域中观察到最高保守性。
研究表明FAM60A蛋白在各种真核细胞类型(诸如尤其是哺乳动物细胞)中与SIN3/HDAC复合物相关。然而,迄今为止,关于FAM60A蛋白的功能信息是有限的。最新功能研究(参见Smith等人, 2012)表明FAM60A蛋白可抑制基因表达并调节特定基因亚群。Smith等人2012报道了FAM60A蛋白在调节TGF-β信号传导途径中的作用,所述TGF-β信号传导途径在过程如癌症进展、转移、细胞迁移和免疫监视中发挥关键作用。有发现表明,FAM60A蛋白充当TGF-β信号传导途径组分的转录抑制物,而该FAM60A蛋白功能看来经由其在SIN3-HDAC复合物中的作用而得到允许。使用针对FAM60A编码序列的siRNA耗尽不同癌细胞系中的FAM60A蛋白,导致正常癌细胞形态的变化。此外,发现FAM60A蛋白水平确实在U2OS细胞的细胞周期进程内周期性变化(Munoz等人, 2012)。在U2OS人骨肉瘤细胞中使用FAM60A siRNA的FAM60A敲减实验揭示FAM60A蛋白限制细胞周期蛋白D1基因表达。
针对该科学背景,令人惊讶地发现,在哺乳动物细胞中降低FAM60A蛋白的表达或活性增加重组蛋白的表达的稳定性,而不会消极影响对重组表达重要的细胞的其它特征。在细胞的长时间培养期间,蛋白FAM60A的效果与表达稳定性之间的这种关联是出乎意料的。因此,FAM60A蛋白的表达水平或活性降低的哺乳动物宿主细胞(例如,CHO细胞)特别适合于五聚体复合物的重组生产。
FAM60A基因在后生动物并因此在哺乳动物物种诸如人、小鼠、大鼠和仓鼠中内源表达,并且FAM60A的氨基酸序列在哺乳动物物种以及脊椎动物中是高度保守的。可以在不同的物种中为蛋白或基因分配不同的名称,并且在(下文)表2上也列出了非限制性替代名称(别名)。为了简单起见,在本公开中,来自不同物种的同源物和直向同源物都被称为“FAM60A基因”或“FAM60A蛋白”。
序列表显示了不同脊椎动物种(即智人(SEQ ID NO:28)、小家鼠(SEQ ID NO:29)、灰仓鼠(SEQ ID NO:30))的已知和/或预测FAM60A蛋白的示例性氨基酸序列。灰仓鼠的预测的FAM60A cDNA显示于SEQ ID NO:31 (来自14-679的编码序列;还参见NCBI参考序列:XM_003505482.1)。文献中还没有详细描述FAM60A蛋白。因此,令人惊讶的是,如果改变宿主细胞基因组,使得与对照相比,内源蛋白FAM60A的表达水平或活性降低,则可改善重组宿主细胞的表达稳定性。出乎意料的是,FAM60A蛋白影响目标重组产物的表达稳定性。
在智人(NCBI Gene-ID:58516);褐家鼠(NCBI Gene-ID:686611);小家鼠(NCBIGene-ID:56306);家牛(NCBI Gene-ID:538649)和其它中已报道了编码FAM60A蛋白的FAM60A基因的序列。转录变体可以物种依赖性方式和不同数目存在(例如,人FAM60A基因表达3种推定转录物同种型,其在UTR中是不同的,但编码相同的蛋白)。
降低FAM60A蛋白的表达水平或活性可以通过各种方式实现。例如,FAM60A蛋白的表达水平或活性可以通过基因敲除、基因突变、基因缺失、基因沉默或任何前述的组合来降低。基因敲除是一种基因技术,通过其经由破坏其功能使基因不起作用。例如,可将核酸插入编码序列,从而破坏基因功能。此外,可以缺失全长FAM60A基因(或其片段),从而基本上消除了功能性FAM60A蛋白的表达。例如,所述缺失可以是FAM60A基因的编码序列的至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%。另一个选择是将一个或多个突变引入编码序列中,其给出无功能或功能较低的FAM60A蛋白。例如,可以引入一个或多个移框突变,导致无功能或功能较低的FAM60A蛋白。或者或另外,可以将一个或多个终止密码子引入编码序列,使得获得截短的、无功能或功能较低的蛋白。其它选择包括但不限于启动子、5'-和/或3' UTR或其它调控元件中的一个或多个突变,例如,通过引入启动子缺失或通过在启动子和转录起始之间引入构建体。用于抑制或消除靶基因的表达的基因破坏的方法也是技术人员众所周知的。
由于每个细胞在其基因组中具有两个拷贝的FAM60A基因,在某些实施方案中,FAM60A基因的基因组序列的至少一个拷贝,或所述FAM60A基因的编码序列的至少50%被缺失。在某些实施方案中,FAM60A基因的基因组序列的所有两个拷贝(或来自每个拷贝的所述FAM60A基因的编码序列的至少50%)被缺失。
在某些实施方案中,缺失的序列包含CHO细胞的染色体8的端粒区域的一部分。端粒区域是染色单体的每个末端的重复核苷酸序列的区域,其保护染色体的末端免于退化,或与相邻染色体的融合。在某些实施方案中,CHO细胞的染色体8的端粒区域的核苷酸序列的至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%被缺失。
在某些实施方案中,缺失的序列还包含选自以下的基因的缺失:Caprin2和Ipo8及其组合。
在某些实施方案中,FAM60A基因的缺失是由于染色体断裂。可以通过上述方法诱导染色体断裂。在诱导染色体断裂后,可以鉴定具有所需断点(其导致基因FAM60A的缺失)的细胞,例如,通过分析DNA或通过使用根据本公开的第五个方面的方法。例如,可以分析处理的细胞的表达概况,以确定FAM60A基因或位于基因FAM60A的着丝粒侧的基因是否表达,表达是否降低或基因是否未表达。例如,在小鼠或仓鼠细胞的情况下,可以分析FAM60A基因是否表达,且另外或除此之外,可以分析选自Bicd1、C12orf35、甲基转移酶样蛋白20、Dennd5b、Caprin2、Ipo8、Tmtc1或位于上述基因的端粒侧的基因(其中,端粒侧在此方面意味着朝向端粒末端的方向)的一种或多种基因是否由细胞表达和/或表达是否减少或基本上消除。
FAM60A蛋白的表达水平的降低可以通过转录后基因沉默(例如通过反义核酸分子或介导RNA干扰的分子)来实现。非限制性实例包括siRNA、shRNA、miRNA、反义寡核苷酸等,其中所有都是本领域众所周知的。
FAM60A蛋白的表达水平可以通过本领域已知的方法评价,例如通过测量编码FAM60A蛋白的mRNA,或FAM60A蛋白本身的水平。此类方法包括例如northern印迹、FACS、ImageStream、western印迹、qPCR、RT-PCR、qRT-PCR、ELISA、Luminex、Multiplex等。
在某些实施方案中,与对照相比,FAM60A蛋白的表达水平或活性降低至少3倍、至少5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少75倍、至少80倍、至少90倍、至少100倍。
基质蛋白酶基因和基质蛋白酶
在某些实施方案中,所述宿主细胞是与对照相比,其中基质蛋白酶的表达水平或活性降低的细胞。在某些实施方案中,此细胞是CHO细胞。2014年4月29日提交且通过引用并入本文的美国临时专利申请号61/985,589,以及2014年5月16日提交且通过引用并入本文的美国临时专利申请号61/994,310提供了哺乳动物细胞的详细描述,其中基质蛋白酶的表达水平或活性降低。
可以如上所讨论使用各种对照。来自相应野生型细胞的基质蛋白酶的表达水平或活性可用作对照。或者,对照可以是可以在文献或数据库中鉴定的预定水平或阈值水平。
基质蛋白酶在1993年作为培养的乳腺癌细胞中新的明胶分解活性而被首次描述。基质蛋白酶属于II型跨膜丝氨酸蛋白酶(TTSP)的家族。基质蛋白酶的直系同源物存在于不同脊椎动物种中,包括哺乳动物物种,并且例如在人、黑猩猩、狗、小鼠、大鼠、鸡、斑马鱼、斑点绿河豚和虎斑河豚中得到鉴定,这表明保守进化的功能。基质蛋白酶在IUBMB酶命名法中列为EC 3.4.21.109。基质蛋白酶也称为膜型丝氨酸蛋白酶1 (MT-SP1)和致瘤性的抑制物14 (ST14)(参见Chen等人, The Transmembrane Serine Protease Matriptase:Implications for Cellular Biology and Human Diseases J Med Sci 2012; 32 (3):097-108)。其为整合膜蛋白,其具有接近于胞质N末端的单跨膜结构域。胞外部分由茎区(包括单一SEA、2个CUB和4个LDLRA结构域)和结构高度类似于其它TTSP的C末端丝氨酸蛋白酶结构域组成,且包括对催化活性必要的保守的组氨酸/天冬氨酸/丝氨酸(HDS)催化三联体(参见例如List等人, Matriptase: Potent Proteolysis on the cell Surface; MolMed 12 (1-3) 1-7, January-March 2006和Chen等人, The Transmembrane SerineProtease Matriptase: Implications for Cellular Biology and Human Diseases JMed Sci 2012; 32 (3): 097-108)。基质蛋白酶被描述为表达于许多器官系统的上皮中,所述器官系统诸如皮肤、乳房、肺、表皮、角膜、唾液腺、口腔和鼻腔、甲状腺、胸腺、食管、气管、细支气管、肺泡、胃、胰腺、胆囊、十二指肠、小肠、结肠、直肠、肾、肾上腺、膀胱、尿管、精囊、附睾、前列腺、卵巢、子宫和阴道(参见List等人, 2006和Chen等人, 2012)。基质蛋白酶作为无活性酶原被合成,并通过复杂过程转变成其活性形式。对于人基质蛋白酶,关于涉及内切蛋白水解切割的活化过程的细节描述于List等人2006和Chen等人2012中。基质蛋白酶作为II型跨膜蛋白结合至膜,其中催化结构域朝向胞外空间。此外,文献中描述了在体内发生基质蛋白酶,其各自的胞外部分的明显脱落(参见List等人, 2006和Chen等人2012)。文献中描述了基质蛋白酶以(例如与Kunitz型丝氨酸蛋白酶抑制剂HAI-1复合的)复合物形式脱落。不同研究表明在人细胞中,特异性抑制剂HAI-1便于基质蛋白酶转运至细胞膜,因为显示移出HAI-1或甚至HAI-1中的单点突变导致基质蛋白酶在高尔基区室中的积聚。在文献中,已描述了除了HAI-1之外的基质蛋白酶的几种不同的内源抑制剂,诸如HAI-2、抗凝血酶、α-1抗胰蛋白酶和α-2-抗纤维蛋白溶酶。此外,也已描述了其它基质蛋白酶抑制剂(参见例如Chen等人, 2012)。文献中描述了基质蛋白酶可在正常生理(诸如皮肤屏障功能、上皮完整性、毛囊发育和胸腺内稳态)和人体病理学(诸如骨关节炎、动脉粥样硬化以及肿瘤进展、侵袭和转移)中发挥许多作用。
针对与蛋白的重组生产无关的该科学背景,本发现是非常令人惊讶的:基质蛋白酶是参与由宿主细胞分泌至细胞培养基中的重组产生的蛋白的剪切的蛋白酶。考虑到脊椎动物细胞(例如特别是哺乳动物细胞)中表达的大量和多种蛋白酶,甚至更令人惊讶的是,降低该蛋白的表达水平或活性可以显著减少细胞培养基中分泌的目标多肽的剪切。对于其它、甚至密切相关的蛋白酶,没有发现这些有益效果。因此,基质蛋白酶的表达水平或活性降低的哺乳动物宿主细胞(例如,CHO细胞)特别适合于五聚体复合物的重组生产。
序列表显示了来自不同脊椎动物种的基质蛋白酶的示例性氨基酸序列,诸如仓鼠(SEQ ID NO:32 – NCBI参考序列:XP_003495890)、人(SEQ ID NO:33 – NCBI参考序列:NP_068813)、小鼠(SEQ ID NO:34 – NCBI参考序列:NP_035306)。
也已报道了编码来自不同哺乳动物物种的片段的核苷酸序列。参见,例如中国仓鼠(NCBI Gene-ID:100755225);智人(NCBI Gene-ID:6768);小家鼠(NCBI Gene-ID:19143);褐家鼠(NCBI Gene-ID:114093);黑猩猩(NCBI Gene-ID:100188950)等。一些基质蛋白酶基因的同义词列于表3,常用的是“ST14”或“St14”。
如表3中所示,基质蛋白酶也被称为“致瘤性抑制剂14蛋白”(例如对于人)和“致瘤性抑制剂14蛋白同源物”(例如在小鼠和中国仓鼠中)。为了简单起见,在本公开中,来自不同物种的同源物和直向同源物都被称为“基质蛋白酶基因”或“基质蛋白酶”(蛋白)。
本文还描述了基质蛋白酶的功能变体(具有与野生型基质蛋白酶基本相同的催化活性的变体)。例如,基质蛋白酶变体可以包含与SEQ ID NO:32-34的任一序列具有至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性,且具有与野生型基质蛋白酶蛋白相同或基本上相同的催化活性的序列。可以例如通过切割在P1位置具有Arg或Lys且优选在P2位置具有小侧链氨基酸(诸如Ala和Gly)的各种合成底物的化学反应(参见,EC 3.4.21.109),来评价基质蛋白酶变体的催化活性。
本文还描述了基质蛋白酶的功能片段(具有全长基质蛋白酶的基本上相同的催化活性的片段)。基质蛋白酶的功能片段可以是本文公开的全长基质蛋白酶的连续氨基酸的子集,并且具有与全长蛋白序列相同或基本上相同的催化活性。可以例如通过切割在P1位置具有Arg或Lys且优选在P2位置具有小侧链氨基酸(诸如Ala和Gly)的各种合成底物的化学反应(参见,EC 3.4.21.109),来评价基质蛋白酶片段的催化活性。
降低基质蛋白酶的表达水平或活性可以通过各种方式实现。例如,基质蛋白酶的表达水平或活性可以通过基因敲除、基因突变、基因缺失、基因沉默或任何前述的组合来降低。基因敲除是一种基因技术,通过其经由破坏其功能使基因不起作用。例如,可将核酸插入编码序列,从而破坏基因功能。此外,可以缺失全长基质蛋白酶基因(或其片段),从而基本上消除了功能性基质蛋白酶的表达。例如,所述缺失可以是基质蛋白酶基因的编码序列的至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%。另一个选择是将一个或多个突变引入编码序列中,其给出无功能或功能较低的基质蛋白酶。例如,可以引入一个或多个移框突变,导致无功能或功能较低的基质蛋白酶。或者或另外,可以将一个或多个终止密码子引入编码序列,使得获得截短的、无功能或功能较低的蛋白。其它选择包括但不限于启动子、5'-和/或3' UTR或其它调控元件中的一个或多个突变,例如,通过引入启动子缺失或通过在启动子和转录起始之间引入构建体。用于抑制或消除靶基因的表达的基因破坏的方法也是技术人员众所周知的。
由于每个细胞在其基因组中具有两个拷贝的基质蛋白酶基因,在某些实施方案中,基质蛋白酶基因的基因组序列的至少一个拷贝,或所述基质蛋白酶基因的编码序列的至少50%,或所述基质蛋白酶基因的功能片段被缺失。在某些实施方案中,基质蛋白酶基因的基因组序列的所有两个拷贝(或来自每个拷贝的所述基质蛋白酶基因的编码序列的至少50%,或所述基质蛋白酶基因的功能片段)被缺失。
在某些实施方案中,所述宿主细胞包含基质蛋白酶基因的外显子2的突变。外显子2特别适合作为改变基质蛋白酶活性的靶标,因为存在几种不同的功能性剪接变体。因此,接近于基质蛋白酶的N末端的外显子,诸如例如外显子1、外显子2和外显子3对于引入一个或多个突变,特别是一个或多个移框突变是有利的。这些外显子之一中的移框突变最可能导致序列早期的终止密码子。也可以在随后的外显子之一中引入突变,例如,选自外显子4至19。
在某些实施方案中,所述基质蛋白酶在催化结构域中包含突变。所述催化结构域是与其底物相互作用以引起酶促反应的酶的区域。可以将一个或多个突变引入该结构域,使得与对照相比,蛋白的催化活性降低。催化结构域包含由外显子16、17、18和19编码的序列。突变可以是缺失、插入、取代或其组合。在编码催化结构域的序列中,突变可引起移框突变、特异性点突变、终止密码子突变或其重组。文献中也已描述了基质蛋白酶的催化无活性突变体,诸如例如G827R-基质蛋白酶或S805A-基质蛋白酶(参见Désilets例如, TheJournal of Biological Chemistry Vol. 283, No. 16, pp. 10535-10542, 2008)。此外,重组基质蛋白酶的催化结构域的晶体结构是已知的。根据该结构和序列数据,技术人员可以推导出用以削弱基质蛋白酶的催化功能的突变的其它特定靶标。
基质蛋白酶的表达水平的降低可以通过转录后基因沉默(例如通过反义核酸分子或介导RNA干扰的分子)来实现。非限制性实例包括siRNA、shRNA、miRNA、反义寡核苷酸等,其中所有都是本领域众所周知的。
基质蛋白酶的表达水平可以通过本领域已知的方法评价,例如通过测量编码基质蛋白酶的mRNA或基质蛋白酶本身的水平。此类方法包括例如northern印迹、FACS、ImageStream、western印迹、qPCR、RT-PCR、qRT-PCR、ELISA、Luminex、Multiplex等。可以例如根据其酶促活性,来评价基质蛋白酶的活性。
在某些实施方案中,与对照相比,基质蛋白酶的表达水平或活性降低至少3倍、至少5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少75倍、至少80倍、至少90倍、至少100倍。
表2:由位于中国仓鼠的染色体8或小鼠的染色体6的基因编码的产物的缩写和替代名称(别名)。
Figure 677258DEST_PATH_IMAGE002
Figure 404518DEST_PATH_IMAGE004
Figure 246572DEST_PATH_IMAGE006
表 3:文献中使用的基质蛋白酶基因和/或编码的蛋白产物基质蛋白酶的示例性替代名称(字母顺序)
乳腺癌80 kDa蛋白酶
CAP3
通道活化蛋白酶3
EC 3.4.21.109
Epithin
HAI
基质蛋白酶
基质蛋白酶-1
膜型丝氨酸蛋白酶1
MT-SP1; MTSP1
Prostamin
PRSS14 g.p. (智人), PRSS14
丝氨酸内肽酶SNC19
丝氨酸蛋白酶14
丝氨酸蛋白酶TADG-15; TADG-15; TADG15
SNC19
ST14 (根据HGNC的人类中的官方基因名称)
St14
致瘤性抑制-14蛋白;致瘤性抑制14 (结肠癌,基质蛋白酶,epithin)
致瘤性抑制物14蛋白
致瘤性抑制物14蛋白同源物(小鼠)
TMPRSS14
肿瘤相关的差异表达基因15蛋白
合适的宿主细胞可以具有本文所述修饰的任何组合,例如其中与对照相比,在所述细胞中C12orf35蛋白的表达水平或活性降低,且与对照相比,在所述细胞中FAM60A蛋白的表达水平或活性降低的细胞。其它组合包括,例如,C12orf35蛋白表达水平或活性的降低和基质蛋白酶表达水平或活性的降低;FAM60A蛋白表达水平或活性的降低和基质蛋白酶表达水平或活性的降低;C12orf35蛋白表达水平或活性的降低、FAM60A蛋白表达水平或活性的降低和基质蛋白酶表达水平或活性的降低;C12orf35蛋白表达水平或活性的降低和包括二氢叶酸还原酶(DHFR)序列作为选择标记等。
本文所述的宿主细胞适用于大规模培养物。例如,细胞培养物可以是10 L、30 L、50 L、100 L、150 L、200 L、300 L、500 L、1000 L、2000 L、3000 L、4000 L、5000 L、10,000L或更大。在一些实施方案中,细胞培养大小范围为10 L至5000 L、10 L至10,000 L、10 I,至20,000 L、10 I,至50,000 L、40 I,至50,000 L、100 L至50,000 L、500 L至50,000 L、1000 L至50,000 L、2000 L至50,000 L、3000 I,至50,000 L、4000 L至50,000 L、4500 L至50,000 L、1000 L至10,000 L、1000 L至20,000 L、1000 L至25,000 L、1000 L至30,000 L、15 L至2000 L、40 L至1000 L、100 L至500 L、200 L至400 L或其之间的任何整数。
用于细胞培养的培养基组分是本领域已知的,并且可以包括例如缓冲剂、氨基酸内容物、维生素内容物、盐内容物、矿物质内容物、血清内容物、碳源内容物、脂质内容物、核酸内容物、激素内容物、微量元素内容物、氨内容物、辅因子内容物、指示剂内容物、小分子内容物、水解产物内容物和酶调节剂内容物。
4. 从细胞培养物纯化五聚体复合物
根据本文所述的方法产生的五聚体复合物可以从宿主细胞收获,并使用任何合适的方法进行纯化。合适的方法包括沉淀和各种类型的色谱法,诸如疏水相互作用、离子交换、亲和力、螯合和大小排阻,其中所有都是本领域已知的。可以使用这些或其它合适方法中的两种或更多种来产生合适的纯化方案。如果期望,五聚体复合物的一个或多个亚基可以包含便于纯化的“标签”,诸如表位标签或HIS标签、STREP标签。可以通过螯合色谱法或亲和色谱法(例如从条件培养基)方便地纯化此类标记的多肽。任选地,标签序列可以在纯化后切割。
例如,WO2014/005959公开了通过亲和色谱法纯化五聚体复合物的示例性方法。
在某些实施方案中,五聚体复合物的一个或多个亚基包含用于亲和纯化的标签。亲和纯化标签的实例包括例如His标签(结合金属离子)、抗体(结合蛋白A或蛋白G)、麦芽糖结合蛋白(MBP)(结合直链淀粉)、谷胱甘肽-S-转移酶(GST)(结合谷胱甘肽)、FLAG标签(Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys (SEQ ID NO:37))(结合抗flag抗体)、Strep标签(结合链霉抗生物素蛋白或其衍生物)。
gH/gL/pUL128/pUL130/ pUL131五聚体复合物的结构是未知的。然而,如果亲和纯化标签连接奥干扰五聚体复合物形成的位点或包埋在复合物内的位点,则亲和纯化将不成功。以下位点据信适用于连接亲和纯化标签,因为标签不表现出干扰五聚体复合物的形成,并且表现为暴露在组装的五聚体的表面:(i) pUL130的C末端区域、(ii) pUL130的N末端区域、(iii) pUL131的C末端区域、(iv) pUL131的N末端区域、(v) pUL128的C末端区域、(vi)pUL128的N末端区域,或其组合。
在某些实施方案中,所述五聚体复合物不包含纯化标签。
另一种合适的方法是离子交换色谱法。可用于离子交换色谱法中的材料的实例包括DEAE-纤维素、QAE-纤维素、DEAE-头孢糖(cephalose)、QAE-头孢糖、DEAE-Toyopearl、QAE-Toyopearl、Mono Q、Mono S、Q琼脂糖、SP琼脂糖等。在一个示例性实施方案中,所述方法使用Mono S柱。在另一个示例性实施方案中,所述方法使用Mono Q柱。
在某些实施方案中,CMV五聚体复合物的产率为至少约0.01 g/L、至少约0.02 g/L、至少约0.03 g/L、至少约0.05 g/L、至少约0.06 g/L、至少约0.07 g/L、至少约0.08 g/L、至少约0.09 g/L、至少约0.1 g/L、至少约0.15 g/L、至少约0.20 g/L、至少约0.25 g/L、至少约0.3 g/L、至少约0.35 g/L、至少约0.4 g/L、至少约0.45 g/L、至少约0.5 g/L、至少约0.55 g/L、至少约0.6 g/L、至少约0.65 g/L、至少约0.7 g/L、至少约0.75 g/L、至少约0.8g/L、至少约0.85 g/L、至少约0.9 g/L、至少约0.95 g/L或至少约1.0 g/L。
5. 定义
术语CMV蛋白(诸如gH、gL、pUL128、pUL130或pUL131)的“复合物形成片段”是指保留与另一种CMV蛋白形成复合物的能力的蛋白的任何一部分(part)或部分(portion)。此类复合物包括,例如,gH/gL/pUL128/pUL130/pUL131五聚体复合物。保留形成五聚体复合物的能力的片段也被称为“五聚体形成片段”。
“大规模培养物”是指大小至少约10升(例如,体积为至少约10L、至少约20L、至少约30L、至少约40L、至少约50L、至少约60 L、至少约70L、至少约80L、至少约90L、至少约100L、至少约150L、至少约200L、至少约250L、至少约300L、至少约400L、至少约500L、至少约600L、至少约700L、至少约800L、至少约900L、至少约1000 L、至少约2000 L、至少约3000 L、至少约4000 L、至少约5000 L、至少约6000 L、至少约10,000 L、至少约15,000 L、至少约20,000 L、至少约25,000 L、至少约30,000 L、至少约35,000 L、至少约40,000 L、至少约45,000 L、至少约50,000 L、至少约55,000 L、至少约60,000 L、至少约65,000 L、至少约70,000 L、至少约75,000 L、至少约80,000 L、至少约85,000 L、至少约90,000 L、至少约95,000 L、至少约100,000 L等)的培养。
“可溶性”五聚体复合物是指gH/gL/pUL128/pUL130/pUL131复合物,其中gH亚基不包含跨膜结构域。
在整个说明书(包括权利要求书)中,在上下文允许的情况下,术语“包含(comprising)”及其变体,诸如“包含(comprises)”或“包含(comprising)”将被解释为包括一个或多个所述整数,而不必排除任何其它整数。
序列同一性根据使用标准化算法比对的,两个多核苷酸序列之间的残基匹配的百分比,或两个多核苷酸序列之间的核苷酸匹配的百分比来计算。此算法可以以标准化和可再现的方式在所比较的序列中插入缺口,以优化两个序列之间的比对,并因此实现两个序列的更有意义的比较。同一性百分比可以在整个定义的序列的长度上测量,或者可以在更短的长度上测量,例如在取自较大的定义的序列的片段(例如至少45、至少60、至少90、至少120、至少150、至少210或至少450个连续残基或核苷酸的片段)的长度上测量。如果未指定长度,则在两个序列中较短者的全长上计算序列同一性。
本发明通过以下实施例进一步说明,所述实施例不应被解释为限制性的。
实施例
本实施例涉及通过CHO细胞系(其中五聚体亚基的编码序列稳定整合至染色体中)产生CMV五聚体蛋白复合物。所述细胞系也被称为CHO稳定细胞系。
如本实施例中所示,这些稳定的CHO细胞系产生功能性CMV五聚体,其中所有五个亚基以天然构象组装。产量高,从而能够以大的商业规模产生五聚体复合物。这些细胞系尤其适合于使用五聚体大规模制造CMV疫苗。
如本实施例中所示,将编码gH胞外结构域、gL、pUL128、pUL130和pUL131的核苷酸序列克隆至具有亚基因组启动子和IRES的单或双表达载体中,所述亚基因组启动子和IRES驱动单个组分的表达(图1)。具体地,将gH胞外结构域、全长gL、pUL128、pUL130和pUL131的编码序列针对哺乳动物培养表达进行密码子优化,合成并克隆入由CMV启动子(用于gH和UL128)和EV71 IRES(用于gL、UL130、UL131)驱动的单一表达载体(具有Neo和DHFR选择)进行表达;或克隆入双重表达载体,一个具有Neo和DHFR选择(用于由CMV启动子驱动的gH以及由CMV启动子或EV71 IRES驱动的gL),而另一个具有Hyg和Frα选择(用于由CMV启动子驱动的UL128,由EV71 IRES驱动的UL130和UL131)(图1)。将亲和纯化标签诸如His标签和/或Strep标签引入gH胞外结构域和/或UL130的C末端以便于纯化。还在gH胞外结构域的C末端引入gH的终止密码子和跨膜结构域,以便于FACS亚克隆(图1)。
将一种或多种表达质粒转染入一组CHO宿主细胞,包括(i) CHOC8TD、(ii)CHOHPT3和(iii) CHOC8TD基质蛋白酶KO细胞系。
CHOC8TD衍生自CHO K1细胞系,并通过缺失染色体的端粒区进一步修饰,所以该细胞系具有以下特征:(i)染色体8端粒缺失;(ii)生产率高且细胞生长良好;和(iii)高蛋白水解降解的潜在问题。CHOHPT3是显示蛋白水解活性降低的CHO K1细胞系,所以该细胞系具有以下特征:(i)蛋白水解降解比CHOC8TD更低,和(ii)生长、生产率和克隆效率比CHOC8TD更低。CHOC8TD基质蛋白酶KO衍生自CHOC8TD,其中敲除基质蛋白酶,所以该细胞系具有以下特征:(i)基质蛋白酶(丝氨酸蛋白酶)敲除;和(ii)蛋白水解降解更少。
用AMAXA核转染法,将包含gH、gL、UL128、UL130和UL131的编码序列的一种或多种表达质粒转染至所有三种宿主细胞中。对于单载体策略,依次通过G418和MTX选择转染的细胞。对于双载体策略,依次通过Hyg、然后MTX选择转染的细胞。
将存活的细胞合并物分批培养以产生五聚体蛋白,以便使用间接ELISA评估蛋白的产率,用western和SDS-PAGE评估gH/gL污染和gL降解。基于五聚体产率和细胞生长,选择使用CHOC8TD宿主细胞的,用载体策略2 (图1)的CHO转染合并物,用于单细胞克隆(图2中所示的表达质粒)。选择的克隆显示高产率和较少的gH/gL污染。
使用五聚体特异性mAb用FACS分选单克隆(~200)。首先基于用间接ELISA评估的五聚体滴度选择最佳的30个克隆,并进一步向下选择至最佳的12个克隆。补料分批培养,随后Strep亲和纯化,显示最佳的12个可以产生产率>300 mg/L和高纯度的五聚体(图3)。事实上,最佳的克隆产生五聚体,且产率为约0.3g/L至约0.5g/L。评估纯化的蛋白复合物与一组针对五聚体的mAb的结合,并显示存在所有的关键表位。
通过14周稳定性研究进一步评估最佳的12个克隆(图4)。评估受控制和不受控制的批次的细胞生长和五聚体滴度,并选择克隆VF7。
还评价了具有最佳的克隆VF7的五聚体的生物反应器生产。该克隆产生>100 mg/L纯化的五聚体(图5)。
如本文中所示例,稳定的CHO细胞可用于表达五聚体。这不同于HEK293细胞的瞬时表达。本发明的CHO稳定细胞系可以以100倍更高的产率一致地产生五聚体蛋白。
产生如本文示例的稳定的CHO细胞系(其中五聚体的所有五个亚基的编码序列都整合至染色体中)的能力是相当显著的。关于是否可以产生稳定的细胞系(甚至对于单一蛋白)总是存在不确定性。例如,当将人IFG-1的编码序列引入CHO细胞以产生稳定系时,发现所得IGF-1/CHO细胞系显示细胞生长抑制和低滴度。该最大滴定度测量值为约8 ug/ml,其对应于100 mg/L的抗体滴度(基于摩尔质量)。相比之下,生物反应器过程中重组抗体的平均滴度测量值为约3 g/L。IGF-1的低滴度的一个原因是IGF-1表达细胞的细胞生长减少和低细胞活力。在抗体表达过程期间,CHO-K1衍生细胞生长直至2 x 107个细胞/ml,并且在培养时间的前230-260h期间的细胞活力超过97%。相比之下,表达IGF-1的CHO-K1衍生细胞仅生长直至0.5 x 107个细胞/ml,并且细胞活力在两天后已经下降至低于97%。对于另外的细节,参见2012年12月18日提交的美国临时申请号61/738466和2013年12月16日提交的PCT申请公开号WO/2014/097113。
因此,发明人面临重大的额外困难,因为所有五种CMV五聚体亚基的编码序列必须稳定整合至CHO细胞基因组中。发明人克服了这些困难,如所选的显示高产率的克隆所证明,其中重组生产的五聚体呈其天然构象且具有所有关键表位。
上文各个部分中提及的本发明的各种特征和实施方案适当时加上必要的更改适用于其它部分。因此,一个部分中指定的特征适当时可以与其它部分中指定的特征相组合。
参考本说明书内引用的参考文献的教导,最彻底地理解本说明书。本说明书内的实施方案提供了本发明的实施方案的说明,而不应被解释为限制本发明的范围。技术人员容易认识到,本发明涵盖了许多其它实施方案。本公开中引用的所有出版物、专利和GenBank序列以其整体通过引用并入本文。在通过引用并入的材料与本说明书矛盾或不一致的程度上,本说明书将替代任何此类材料。本文中任何参考文献的引用不是承认此类参考文献是本发明的现有技术。
仅仅使用常规实验,本领域技术人员将认识到或者能够确定本文所述的本发明的具体实施方案的许多等同方案。下列实施方案旨在涵盖此类等同方案。
本发明的具体实施方案包括:
1. 重组哺乳动物细胞,其包含:
一种或多种编码巨细胞病毒(CMV)五聚体复合物的多核苷酸序列,其中所述五聚体复合物包含:gH或其复合物形成片段、gL或其复合物形成片段、pUL128或其复合物形成片段、pUL130或其复合物形成片段和pUL131或其复合物形成片段,
其中所述一种或多种多核苷酸序列整合至所述哺乳动物细胞的基因组DNA中。
2. 实施方案1的哺乳动物细胞,其中所述哺乳动物细胞是中国仓鼠卵巢(CHO)细胞。
3. 实施方案2的哺乳动物细胞,其中所述CHO细胞是CHO-K1细胞、CHO-DUXB11或CHO-DG44细胞。
4. 实施方案1-3中任一项的哺乳动物细胞,其中与对照相比,在所述细胞中C12orf35蛋白的表达水平或活性降低。
5. 实施方案4的哺乳动物细胞,其中所述C12orf35基因的基因组序列的至少一个拷贝,或所述C12orf35基因的编码序列的至少50%被缺失。
6. 实施方案5的哺乳动物细胞,其中所述C12orf35基因的基因组序列的所有两个拷贝,或来自每个拷贝的所述C12orf35基因的编码序列的至少50%被缺失。
7. 实施方案4或5的哺乳动物细胞,其中包含所述C12orf35基因的CHO细胞的染色体8的端粒区域的至少一个拷贝被缺失。
8. 实施方案7的哺乳动物细胞,其中所述端粒区域还包含选自以下的基因:Bicd1、Amn1、甲基转移酶样蛋白20、Dennd5b、FAM60A、Caprin2、Ipo8、RPS4Y2及其组合。
9. 实施方案4-8中任一项的哺乳动物细胞,其中所述C12orf35蛋白包含与选自SEQ ID NO:21、22、23、24和35的序列中的任一种具有至少80%同一性的序列。
10. 实施方案4-9中任一项的哺乳动物细胞,其中所述C12orf35基因包含与SEQID NO:25具有至少80%同一性的序列。
11. 实施方案4的哺乳动物细胞,其中所述细胞包含在所述C12orf35基因的启动子、5'UTR或3'UTR中的突变。
12. 实施方案4的哺乳动物细胞,其中与对照相比,所述C12orf35蛋白包含降低其活性的突变。
13. 实施方案1-12中任一项的哺乳动物细胞,其中与对照相比,在所述细胞中FAM60A蛋白的表达水平或活性降低。
14. 实施方案13的哺乳动物细胞,其中所述FAM60A基因的基因组序列的至少一个拷贝,或所述FAM60A基因的编码序列的至少50%被缺失。
15. 实施方案14的哺乳动物细胞,其中所述FAM60A基因的基因组序列的所有两个拷贝,或来自每个拷贝的所述FAM60A基因的编码序列的至少50%被缺失。
16. 实施方案13或14的哺乳动物细胞,其中所述缺失的序列包含CHO细胞的染色体8的端粒区域的一部分。
17. 实施方案16的哺乳动物细胞,其中所述缺失的区域还包含选自以下的基因:Caprin2和Ipo8及其组合。
18. 实施方案13-17中任一项的哺乳动物细胞,其中所述FAM60A蛋白包含与选自SEQ ID NO:28、29和30的序列中的任一种具有至少80%同一性的序列。
19. 实施方案13-18中任一项的哺乳动物细胞,其中所述FAM60A基因包含与SEQID NO:31具有至少80%同一性的序列。
20. 实施方案13的哺乳动物细胞,其中所述细胞包含在所述FAM60A基因的启动子、5'UTR或3'UTR中的突变。
21. 实施方案13的哺乳动物细胞,其中与对照相比,所述FAM60A蛋白包含降低其活性的突变。
22. 实施方案1-21中任一项的哺乳动物细胞,其中与对照相比,在所述细胞中基质蛋白酶的表达水平或活性降低。
23. 实施方案22的哺乳动物细胞,其中所述基质蛋白酶基因的基因组序列的至少一个拷贝,或所述基质蛋白酶基因的编码序列的至少50%被缺失。
24. 实施方案23的哺乳动物细胞,其中所述基质蛋白酶基因的基因组序列的所有两个拷贝,或来自每个拷贝的所述基质蛋白酶基因的编码序列的至少50%被缺失。
25. 实施方案22-25中任一项的哺乳动物细胞,其中所述基质蛋白酶包含与选自SEQ ID NO:32、33和34的序列中的任一种具有至少80%同一性的序列。
26. 实施方案22的哺乳动物细胞,其中所述细胞包含在所述基质蛋白酶基因的外显子2中的突变。
27. 实施方案22的哺乳动物细胞,其中所述细胞包含在所述基质蛋白酶基因的启动子、5'UTR或3'UTR中的突变。
28. 实施方案22的哺乳动物细胞,其中与对照相比,所述基质蛋白酶包含降低其活性的突变。
29. 实施方案28的哺乳动物细胞,其中所述基质蛋白酶包含在催化结构域中的突变。
30. 实施方案1-29中任一项的哺乳动物细胞,其中所述哺乳动物细胞的内源二氢叶酸还原酶(DHFR)是缺陷的。
31. 实施方案1-29中任一项的哺乳动物细胞,其中所述哺乳动物细胞的内源二氢叶酸还原酶(DHFR)是有活性的。
32. 实施方案1-31中任一项的哺乳动物细胞,其中所述gH的复合物形成片段不包含全长gH蛋白的信号序列。
33. 实施方案1-32中任一项的哺乳动物细胞,其中所述gH的复合物形成片段不包含全长gH蛋白的跨膜结构域。
34. 实施方案1-33中任一项的哺乳动物细胞,其中所述gH的复合物形成片段包含全长gH蛋白的胞外结构域。
35. 实施方案1-34中任一项的哺乳动物细胞,其中所述gH包含选自SEQ ID NO:1、2、3、4和5的序列。
36. 实施方案1-35中任一项的哺乳动物细胞,其中所述gH的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;且(ii)包含来自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的至少一个表位。
37. 实施方案1-36中任一项的哺乳动物细胞,其中所述gL的复合物形成片段不包含全长gL蛋白的信号序列。
38. 实施方案1-37中任一项的哺乳动物细胞,其中所述gL包含选自SEQ ID NO:6、7、8和9的序列。
39. 实施方案1-38中任一项的哺乳动物细胞,其中所述gL的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;且(ii)包含来自SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9的至少一个表位。
40. 实施方案1-39中任一项的哺乳动物细胞,其中所述pUL128的复合物形成片段不包含全长pUL128蛋白的信号序列。
41. 实施方案1-40中任一项的哺乳动物细胞,其中所述pUL128包含选自SEQ IDNO:10、11、12和13的序列。
42. 实施方案1-41中任一项的哺乳动物细胞,其中所述pUL128的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;且(ii)包含来自SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:13的至少一个表位。
43. 实施方案1-42中任一项的哺乳动物细胞,其中所述pUL130的复合物形成片段不包含全长pUL130蛋白的信号序列。
44. 实施方案1-43中任一项的哺乳动物细胞,其中所述pUL130包含选自SEQ IDNO:14、15和16的序列。
45. 实施方案1-44中任一项的哺乳动物细胞,其中所述pUL130的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;且(ii)包含来自SEQ IDNO:14、SEQ ID NO:15或SEQ ID NO:16的至少一个表位。
46. 实施方案1-45中任一项的哺乳动物细胞,其中所述pUL131的复合物形成片段不包含全长pUL131蛋白的信号序列。
47. 实施方案1-46中任一项的哺乳动物细胞,其中所述pUL131包含选自SEQ IDNO:17、18、19和20的序列。
48. 实施方案1-47中任一项的哺乳动物细胞,其中所述pUL131的复合物形成片段(i)形成五聚体gH/gL/pUL128/pUL130/pUL131复合物的一部分;且(ii)包含来自SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20的至少一个表位。
49. 实施方案1-48中任一项的哺乳动物细胞,其中所述五聚体复合物是可溶的。
50. 实施方案1-49中任一项的哺乳动物细胞,其中所述五聚体复合物从所述宿主细胞分泌。
51. 大规模培养物,其包含实施方案1-50中任一项的哺乳动物细胞,其中所述培养物大小为至少20升。
52. 大规模培养物,其包含实施方案1-51中任一项的哺乳动物细胞,其中所述培养物大小为至少50升。
53. 51或52的大规模培养物,其中CMV五聚体复合物的产率为至少0.05 g/L。
54. 51或52的大规模培养物,其中CMV五聚体复合物的产率为至少0.1 g/L。
55. 由实施方案1-50中任一项的哺乳动物细胞或实施方案51-54中任一项的大规模培养物产生的巨细胞病毒(CMV)五聚体复合物。
56. 组合物,其包含实施方案55的五聚体复合物。
57. 产生巨细胞病毒(CMV)五聚体复合物的方法,其中所述五聚体复合物包含:gH或其复合物形成片段、gL或其复合物形成片段、pUL128或其复合物形成片段、pUL130或其复合物形成片段和pUL131或其复合物形成片段,所述方法包括:
(i) 在合适的条件下培养实施方案1-50中任一项的哺乳动物细胞,从而表达所述五聚体复合物;和
(ii) 从培养物中收获所述五聚体复合物。
58. 实施方案57的方法,其还包括纯化所述五聚体复合物。
59. 通过实施方案57或58的方法产生的巨细胞病毒(CMV)五聚体复合物。
60. 组合物,其包含实施方案59的五聚体复合物。
61. 实施方案56或60的组合物,其中所述五聚体复合物具有至少95质量%的纯度。
62. 实施方案61的组合物,其进一步包含佐剂,诸如铝盐,或MF59。
63. 实施方案61或62的组合物,其用于诱导针对CMV的免疫应答。
64. 实施方案55的巨细胞病毒(CMV)五聚体复合物,其中所述五聚体复合物是免疫原性的。
65. 实施方案64的巨细胞病毒(CMV)五聚体复合物,其中针对所述五聚体复合物的抗体是中和抗体。
序列表
<110> GLAXOSMITHKLINE BIOLOGICALS sa
<120> 表达巨细胞病毒抗原的哺乳动物细胞
<130> VN56323
<140> 14191385.5
<141> 2014-10-31
<160> 39
<170> PatentIn version 3.5
<210> 1
<211> 742
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(742)
<223> /注="毒株Merlin"
<400> 1
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Ile Leu Ala Val Cys Leu
1 5 10 15
Phe Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Val Ser Glu
20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro
35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gln Cys Thr Tyr Asn Ser Ser
50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe
65 70 75 80
Phe Gln Ser Tyr Asn Gln Tyr Tyr Val Phe His Met Pro Arg Cys Leu
85 90 95
Phe Ala Gly Pro Leu Ala Glu Gln Phe Leu Asn Gln Val Asp Leu Thr
100 105 110
Glu Thr Leu Glu Arg Tyr Gln Gln Arg Leu Asn Thr Tyr Ala Leu Val
115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gln Gln Leu Lys Ala
130 135 140
Gln Asp Ser Leu Gly Glu Gln Pro Thr Thr Val Pro Pro Pro Ile Asp
145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gln Thr Thr Pro His Gly
165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn
180 185 190
Gln Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val
195 200 205
Thr Pro Cys Leu His Gln Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr
210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile
225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val
245 250 255
Leu Phe Lys Ala Pro Tyr Gln Arg Asp Asn Phe Ile Leu Arg Gln Thr
260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gln Leu Asn Arg
275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe
290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr
305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gln Met Leu Asp Arg Arg
325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala
340 345 350
Arg Gln Glu Glu Ala Gly Ala Gln Val Ser Val Pro Arg Ala Leu Asp
355 360 365
Arg Gln Ala Ala Leu Leu Gln Ile Gln Glu Phe Met Ile Thr Cys Leu
370 375 380
Ser Gln Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val
385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gln Ile Thr Asp Ile
405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gln Asn Gln Gln
420 425 430
His Leu Ile Pro Gln Trp Ala Leu Arg Gln Ile Ala Asp Phe Ala Leu
435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg
450 455 460
Gln Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His
465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser
485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His His
500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg
515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val
530 535 540
Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln Pro
545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu
565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Ile Val Thr
580 585 590
Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val
595 600 605
Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys Cys
610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Val Ala Leu
625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu Glu
645 650 655
Tyr Asp Asp Thr Gln Gly Val Ile Asn Ile Met Tyr Met His Asp Ser
660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser
675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu
690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu Met
705 710 715 720
Met Ser Val Tyr Ala Leu Ser Ala Ile Ile Gly Ile Tyr Leu Leu Tyr
725 730 735
Arg Met Leu Lys Thr Cys
740
<210> 2
<211> 742
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(742)
<223> /注="毒株Towne"
<400> 2
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Val Leu Ala Val Cys Leu
1 5 10 15
Leu Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Ile Ser Glu
20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro
35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gln Cys Thr Tyr Asn Ser Ser
50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe
65 70 75 80
Phe Gln Ser Tyr Asn Gln Tyr Tyr Val Phe His Met Pro Arg Cys Leu
85 90 95
Phe Ala Gly Pro Leu Ala Glu Gln Phe Leu Asn Gln Val Asp Leu Thr
100 105 110
Glu Thr Leu Glu Arg Tyr Gln Gln Arg Leu Asn Thr Tyr Ala Leu Val
115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gln Gln Leu Lys Ala
130 135 140
Gln Asp Ser Leu Gly Glu Gln Pro Thr Thr Val Pro Pro Pro Ile Asp
145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gln Thr Thr Pro His Gly
165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn
180 185 190
Gln Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val
195 200 205
Thr Pro Cys Leu His Gln Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr
210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile
225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val
245 250 255
Leu Phe Lys Ala Pro Tyr Gln Arg Asp Asn Phe Ile Leu Arg Gln Thr
260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gln Leu Asn Arg
275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe
290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr
305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gln Met Leu Asp Arg Arg
325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala
340 345 350
Arg Gln Glu Glu Ala Gly Ala Gln Val Ser Val Pro Arg Ala Leu Asp
355 360 365
Arg Gln Ala Ala Leu Leu Gln Ile Gln Glu Phe Met Ile Thr Cys Leu
370 375 380
Ser Gln Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val
385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gln Ile Thr Asp Ile
405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gln Asn Gln Gln
420 425 430
His Leu Ile Pro Gln Trp Ala Leu Arg Gln Ile Ala Asp Phe Ala Leu
435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg
450 455 460
Gln Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His
465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser
485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His His
500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg
515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val
530 535 540
Pro Thr Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln Pro
545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu
565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Val Val Thr
580 585 590
Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val
595 600 605
Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys Cys
610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Ala Ala Leu
625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu Glu
645 650 655
Tyr Asp Asp Thr Gln Gly Val Ile Asn Ile Met Tyr Met His Asp Ser
660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser
675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu
690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu Met
705 710 715 720
Met Ser Val Tyr Ala Leu Ser Ala Ile Ile Gly Ile Tyr Leu Leu Tyr
725 730 735
Arg Met Leu Lys Thr Cys
740
<210> 3
<211> 743
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(743)
<223> /注="毒株AD169"
<400> 3
Met Arg Pro Gly Leu Pro Pro Tyr Leu Thr Val Phe Thr Val Tyr Leu
1 5 10 15
Leu Ser His Leu Pro Ser Gln Arg Tyr Gly Ala Asp Ala Ala Ser Glu
20 25 30
Ala Leu Asp Pro His Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg
35 40 45
Pro Ile Arg Phe Leu Arg Glu Asn Thr Thr Gln Cys Thr Tyr Asn Ser
50 55 60
Ser Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn
65 70 75 80
Phe Phe Gln Ser Tyr Asn Gln Tyr Tyr Val Phe His Met Pro Arg Cys
85 90 95
Leu Phe Ala Gly Pro Leu Ala Glu Gln Phe Leu Asn Gln Val Asp Leu
100 105 110
Thr Glu Thr Leu Glu Arg Tyr Gln Gln Arg Leu Asn Thr Tyr Ala Leu
115 120 125
Val Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gln Gln Leu Lys
130 135 140
Ala Gln Asp Ser Leu Gly Gln Gln Pro Thr Thr Val Pro Pro Pro Ile
145 150 155 160
Asp Leu Ser Ile Pro His Val Trp Met Pro Pro Gln Thr Thr Pro His
165 170 175
Asp Trp Lys Gly Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe
180 185 190
Asn Gln Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr
195 200 205
Val Thr Pro Cys Leu His Gln Gly Phe Tyr Leu Met Asp Glu Leu Arg
210 215 220
Tyr Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser
225 230 235 240
Ile Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg
245 250 255
Val Leu Phe Lys Ala Pro Tyr Gln Arg Asp Asn Phe Ile Leu Arg Gln
260 265 270
Thr Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Ala Gln Leu Asn
275 280 285
Arg His Ser Tyr Leu Lys Asp Ser Asp Phe Leu Asp Ala Ala Leu Asp
290 295 300
Phe Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg
305 310 315 320
Tyr Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gln Met Leu Asp Arg
325 330 335
Arg Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala
340 345 350
Ala Arg Gln Glu Glu Ala Gly Thr Glu Ile Ser Ile Pro Arg Ala Leu
355 360 365
Asp Arg Gln Ala Ala Leu Leu Gln Ile Gln Glu Phe Met Ile Thr Cys
370 375 380
Leu Ser Gln Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala
385 390 395 400
Val Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asp Gln Ile Thr Asp
405 410 415
Ile Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gln Asn Gln
420 425 430
Gln His Leu Ile Pro Gln Trp Ala Leu Arg Gln Ile Ala Asp Phe Ala
435 440 445
Leu Gln Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala
450 455 460
Arg Gln Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val
465 470 475 480
His Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys
485 490 495
Ser Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His
500 505 510
His Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg
515 520 525
Arg Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr
530 535 540
Val Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln
545 550 555 560
Pro Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly
565 570 575
Glu Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Val Val
580 585 590
Thr Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr
595 600 605
Val Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys
610 615 620
Cys Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Ala Ala
625 630 635 640
Leu Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu
645 650 655
Glu Tyr Asp Asp Thr Gln Gly Val Ile Asn Ile Met Tyr Met His Asp
660 665 670
Ser Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val
675 680 685
Ser Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val
690 695 700
Leu Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu
705 710 715 720
Met Met Ser Val Tyr Ala Leu Ser Ala Ile Ile Gly Ile Tyr Leu Leu
725 730 735
Tyr Arg Met Leu Lys Thr Cys
740
<210> 4
<211> 715
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(715)
<223> /注="毒株Merlin"
<400> 4
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Ile Leu Ala Val Cys Leu
1 5 10 15
Phe Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Val Ser Glu
20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro
35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gln Cys Thr Tyr Asn Ser Ser
50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe
65 70 75 80
Phe Gln Ser Tyr Asn Gln Tyr Tyr Val Phe His Met Pro Arg Cys Leu
85 90 95
Phe Ala Gly Pro Leu Ala Glu Gln Phe Leu Asn Gln Val Asp Leu Thr
100 105 110
Glu Thr Leu Glu Arg Tyr Gln Gln Arg Leu Asn Thr Tyr Ala Leu Val
115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gln Gln Leu Lys Ala
130 135 140
Gln Asp Ser Leu Gly Glu Gln Pro Thr Thr Val Pro Pro Pro Ile Asp
145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gln Thr Thr Pro His Gly
165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn
180 185 190
Gln Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val
195 200 205
Thr Pro Cys Leu His Gln Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr
210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile
225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val
245 250 255
Leu Phe Lys Ala Pro Tyr Gln Arg Asp Asn Phe Ile Leu Arg Gln Thr
260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gln Leu Asn Arg
275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe
290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr
305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gln Met Leu Asp Arg Arg
325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala
340 345 350
Arg Gln Glu Glu Ala Gly Ala Gln Val Ser Val Pro Arg Ala Leu Asp
355 360 365
Arg Gln Ala Ala Leu Leu Gln Ile Gln Glu Phe Met Ile Thr Cys Leu
370 375 380
Ser Gln Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val
385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gln Ile Thr Asp Ile
405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gln Asn Gln Gln
420 425 430
His Leu Ile Pro Gln Trp Ala Leu Arg Gln Ile Ala Asp Phe Ala Leu
435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg
450 455 460
Gln Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His
465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser
485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His His
500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg
515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val
530 535 540
Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln Pro
545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu
565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Ile Val Thr
580 585 590
Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val
595 600 605
Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys Cys
610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Val Ala Leu
625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu Glu
645 650 655
Tyr Asp Asp Thr Gln Gly Val Ile Asn Ile Met Tyr Met His Asp Ser
660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser
675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu
690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp
705 710 715
<210> 5
<211> 692
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(692)
<223> /注="毒株Merlin"
<400> 5
Arg Tyr Gly Ala Glu Ala Val Ser Glu Pro Leu Asp Lys Ala Phe His
1 5 10 15
Leu Leu Leu Asn Thr Tyr Gly Arg Pro Ile Arg Phe Leu Arg Glu Asn
20 25 30
Thr Thr Gln Cys Thr Tyr Asn Ser Ser Leu Arg Asn Ser Thr Val Val
35 40 45
Arg Glu Asn Ala Ile Ser Phe Asn Phe Phe Gln Ser Tyr Asn Gln Tyr
50 55 60
Tyr Val Phe His Met Pro Arg Cys Leu Phe Ala Gly Pro Leu Ala Glu
65 70 75 80
Gln Phe Leu Asn Gln Val Asp Leu Thr Glu Thr Leu Glu Arg Tyr Gln
85 90 95
Gln Arg Leu Asn Thr Tyr Ala Leu Val Ser Lys Asp Leu Ala Ser Tyr
100 105 110
Arg Ser Phe Ser Gln Gln Leu Lys Ala Gln Asp Ser Leu Gly Glu Gln
115 120 125
Pro Thr Thr Val Pro Pro Pro Ile Asp Leu Ser Ile Pro His Val Trp
130 135 140
Met Pro Pro Gln Thr Thr Pro His Gly Trp Thr Glu Ser His Thr Thr
145 150 155 160
Ser Gly Leu His Arg Pro His Phe Asn Gln Thr Cys Ile Leu Phe Asp
165 170 175
Gly His Asp Leu Leu Phe Ser Thr Val Thr Pro Cys Leu His Gln Gly
180 185 190
Phe Tyr Leu Ile Asp Glu Leu Arg Tyr Val Lys Ile Thr Leu Thr Glu
195 200 205
Asp Phe Phe Val Val Thr Val Ser Ile Asp Asp Asp Thr Pro Met Leu
210 215 220
Leu Ile Phe Gly His Leu Pro Arg Val Leu Phe Lys Ala Pro Tyr Gln
225 230 235 240
Arg Asp Asn Phe Ile Leu Arg Gln Thr Glu Lys His Glu Leu Leu Val
245 250 255
Leu Val Lys Lys Asp Gln Leu Asn Arg His Ser Tyr Leu Lys Asp Pro
260 265 270
Asp Phe Leu Asp Ala Ala Leu Asp Phe Asn Tyr Leu Asp Leu Ser Ala
275 280 285
Leu Leu Arg Asn Ser Phe His Arg Tyr Ala Val Asp Val Leu Lys Ser
290 295 300
Gly Arg Cys Gln Met Leu Asp Arg Arg Thr Val Glu Met Ala Phe Ala
305 310 315 320
Tyr Ala Leu Ala Leu Phe Ala Ala Ala Arg Gln Glu Glu Ala Gly Ala
325 330 335
Gln Val Ser Val Pro Arg Ala Leu Asp Arg Gln Ala Ala Leu Leu Gln
340 345 350
Ile Gln Glu Phe Met Ile Thr Cys Leu Ser Gln Thr Pro Pro Arg Thr
355 360 365
Thr Leu Leu Leu Tyr Pro Thr Ala Val Asp Leu Ala Lys Arg Ala Leu
370 375 380
Trp Thr Pro Asn Gln Ile Thr Asp Ile Thr Ser Leu Val Arg Leu Val
385 390 395 400
Tyr Ile Leu Ser Lys Gln Asn Gln Gln His Leu Ile Pro Gln Trp Ala
405 410 415
Leu Arg Gln Ile Ala Asp Phe Ala Leu Lys Leu His Lys Thr His Leu
420 425 430
Ala Ser Phe Leu Ser Ala Phe Ala Arg Gln Glu Leu Tyr Leu Met Gly
435 440 445
Ser Leu Val His Ser Met Leu Val His Thr Thr Glu Arg Arg Glu Ile
450 455 460
Phe Ile Val Glu Thr Gly Leu Cys Ser Leu Ala Glu Leu Ser His Phe
465 470 475 480
Thr Gln Leu Leu Ala His Pro His His Glu Tyr Leu Ser Asp Leu Tyr
485 490 495
Thr Pro Cys Ser Ser Ser Gly Arg Arg Asp His Ser Leu Glu Arg Leu
500 505 510
Thr Arg Leu Phe Pro Asp Ala Thr Val Pro Ala Thr Val Pro Ala Ala
515 520 525
Leu Ser Ile Leu Ser Thr Met Gln Pro Ser Thr Leu Glu Thr Phe Pro
530 535 540
Asp Leu Phe Cys Leu Pro Leu Gly Glu Ser Phe Ser Ala Leu Thr Val
545 550 555 560
Ser Glu His Val Ser Tyr Ile Val Thr Asn Gln Tyr Leu Ile Lys Gly
565 570 575
Ile Ser Tyr Pro Val Ser Thr Thr Val Val Gly Gln Ser Leu Ile Ile
580 585 590
Thr Gln Thr Asp Ser Gln Thr Lys Cys Glu Leu Thr Arg Asn Met His
595 600 605
Thr Thr His Ser Ile Thr Val Ala Leu Asn Ile Ser Leu Glu Asn Cys
610 615 620
Ala Phe Cys Gln Ser Ala Leu Leu Glu Tyr Asp Asp Thr Gln Gly Val
625 630 635 640
Ile Asn Ile Met Tyr Met His Asp Ser Asp Asp Val Leu Phe Ala Leu
645 650 655
Asp Pro Tyr Asn Glu Val Val Val Ser Ser Pro Arg Thr His Tyr Leu
660 665 670
Met Leu Leu Lys Asn Gly Thr Val Leu Glu Val Thr Asp Val Val Val
675 680 685
Asp Ala Thr Asp
690
<210> 6
<211> 278
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(278)
<223> /注="毒株Merlin"
<400> 6
Met Cys Arg Arg Pro Asp Cys Gly Phe Ser Phe Ser Pro Gly Pro Val
1 5 10 15
Ile Leu Leu Trp Cys Cys Leu Leu Leu Pro Ile Val Ser Ser Ala Ala
20 25 30
Val Ser Val Ala Pro Thr Ala Ala Glu Lys Val Pro Ala Glu Cys Pro
35 40 45
Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Glu Gly Asp Lys
50 55 60
Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Gly Arg Asp Gly
65 70 75 80
Pro Leu Ser Gln Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu Ala Ala
85 90 95
Asn Ser Val Leu Leu Asp Glu Ala Phe Leu Asp Thr Leu Ala Leu Leu
100 105 110
Tyr Asn Asn Pro Asp Gln Leu Arg Ala Leu Leu Thr Leu Leu Ser Ser
115 120 125
Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser Glu Cys
130 135 140
Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu Cys Arg
145 150 155 160
Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe Thr Glu
165 170 175
His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn Val Val
180 185 190
Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val Arg Leu
195 200 205
Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe Tyr Gly
210 215 220
Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gln Leu Asp Pro
225 230 235 240
Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro Pro Glu
245 250 255
Leu Lys Gln Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr Gly Pro
260 265 270
Gln Ala Val Asp Ala Arg
275
<210> 7
<211> 278
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(278)
<223> /注="毒株Towne"
<400> 7
Met Cys Arg Arg Pro Asp Cys Gly Phe Ser Phe Ser Pro Gly Pro Val
1 5 10 15
Ala Leu Leu Trp Cys Cys Leu Leu Leu Pro Ile Val Ser Ser Ala Thr
20 25 30
Val Ser Val Ala Pro Thr Val Ala Glu Lys Val Pro Ala Glu Cys Pro
35 40 45
Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Gln Gly Asp Lys
50 55 60
Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Arg Arg Asp Gly
65 70 75 80
Pro Leu Ser Gln Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu Ala Ala
85 90 95
Asn Ser Val Leu Leu Asp Asp Ala Phe Leu Asp Thr Leu Ala Leu Leu
100 105 110
Tyr Asn Asn Pro Asp Gln Leu Arg Ala Leu Leu Thr Leu Leu Ser Ser
115 120 125
Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser Glu Cys
130 135 140
Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu Cys Arg
145 150 155 160
Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe Thr Glu
165 170 175
His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn Val Val
180 185 190
Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val Arg Leu
195 200 205
Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe Tyr Gly
210 215 220
Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gln Leu Asp Pro
225 230 235 240
Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro Pro Glu
245 250 255
Leu Lys Gln Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr Gly Pro
260 265 270
Gln Ala Val Asp Ala Arg
275
<210> 8
<211> 278
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(278)
<223> /注="毒株AD169"
<400> 8
Met Cys Arg Arg Pro Asp Cys Gly Phe Ser Phe Ser Pro Gly Pro Val
1 5 10 15
Val Leu Leu Trp Cys Cys Leu Leu Leu Pro Ile Val Ser Ser Val Ala
20 25 30
Val Ser Val Ala Pro Thr Ala Ala Glu Lys Val Pro Ala Glu Cys Pro
35 40 45
Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Gln Gly Asp Lys
50 55 60
Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Arg Arg Asp Gly
65 70 75 80
Pro Leu Ser Gln Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu Ala Ala
85 90 95
Asn Ser Val Leu Leu Asp Asp Ala Phe Leu Asp Thr Leu Ala Leu Leu
100 105 110
Tyr Asn Asn Pro Asp Gln Leu Arg Ala Leu Leu Thr Leu Leu Ser Ser
115 120 125
Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser Glu Cys
130 135 140
Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu Cys Arg
145 150 155 160
Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe Thr Glu
165 170 175
His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn Val Val
180 185 190
Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val Arg Leu
195 200 205
Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe Tyr Gly
210 215 220
Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gln Leu Asp Pro
225 230 235 240
Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro Pro Glu
245 250 255
Leu Lys Gln Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr Gly Pro
260 265 270
Gln Ala Val Asp Ala Arg
275
<210> 9
<211> 248
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(248)
<223> /注="毒株Merlin"
<400> 9
Ala Ala Val Ser Val Ala Pro Thr Ala Ala Glu Lys Val Pro Ala Glu
1 5 10 15
Cys Pro Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Glu Gly
20 25 30
Asp Lys Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Gly Arg
35 40 45
Asp Gly Pro Leu Ser Gln Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu
50 55 60
Ala Ala Asn Ser Val Leu Leu Asp Glu Ala Phe Leu Asp Thr Leu Ala
65 70 75 80
Leu Leu Tyr Asn Asn Pro Asp Gln Leu Arg Ala Leu Leu Thr Leu Leu
85 90 95
Ser Ser Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser
100 105 110
Glu Cys Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu
115 120 125
Cys Arg Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe
130 135 140
Thr Glu His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn
145 150 155 160
Val Val Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val
165 170 175
Arg Leu Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe
180 185 190
Tyr Gly Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gln Leu
195 200 205
Asp Pro Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro
210 215 220
Pro Glu Leu Lys Gln Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr
225 230 235 240
Gly Pro Gln Ala Val Asp Ala Arg
245
<210> 10
<211> 130
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(130)
<223> /注="毒株Merlin"
<400> 10
Met Ser Pro Lys Asp Leu Thr Pro Phe Leu Thr Ala Leu Trp Leu Leu
1 5 10 15
Leu Gly His Ser Arg Val Pro Arg Val Arg Ala Glu Glu Cys Cys Glu
20 25 30
Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys Tyr Asp Phe Lys Met
35 40 45
Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro Asp Gly Glu Val Cys
50 55 60
Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly Ile Val Thr Thr Met
65 70 75 80
Thr His Ser Leu Thr Arg Gln Val Val His Asn Lys Leu Thr Ser Cys
85 90 95
Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly Arg Ile Arg Cys Gly
100 105 110
Lys Val Asn Asp Lys Ala Gln Tyr Leu Leu Gly Ala Ala Gly Ser Val
115 120 125
Pro Tyr
130
<210> 11
<211> 171
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(171)
<223> /注="毒株Towne"
<400> 11
Met Ser Pro Lys Asn Leu Thr Pro Phe Leu Thr Ala Leu Trp Leu Leu
1 5 10 15
Leu Gly His Ser Arg Val Pro Arg Val Arg Ala Glu Glu Cys Cys Glu
20 25 30
Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys Tyr Asp Phe Lys Met
35 40 45
Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro Asp Gly Glu Val Cys
50 55 60
Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly Ile Val Thr Thr Met
65 70 75 80
Thr His Ser Leu Thr Arg Gln Val Val His Asn Lys Leu Thr Ser Cys
85 90 95
Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly Arg Ile Arg Cys Gly
100 105 110
Lys Val Asn Asp Lys Ala Gln Tyr Leu Leu Gly Ala Ala Gly Ser Val
115 120 125
Pro Tyr Arg Trp Ile Asn Leu Glu Tyr Asp Lys Ile Thr Arg Ile Val
130 135 140
Gly Leu Asp Gln Tyr Leu Glu Ser Val Lys Lys His Lys Arg Leu Asp
145 150 155 160
Val Cys Arg Ala Lys Met Gly Tyr Met Leu Gln
165 170
<210> 12
<211> 171
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(171)
<223> /注="毒株AD169"
<400> 12
Met Ser Pro Lys Asp Leu Thr Pro Phe Leu Thr Thr Leu Trp Leu Leu
1 5 10 15
Leu Gly His Ser Arg Val Pro Arg Val Arg Ala Glu Glu Cys Cys Glu
20 25 30
Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys Tyr Asp Phe Lys Met
35 40 45
Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro Asp Gly Glu Val Cys
50 55 60
Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly Ile Val Thr Thr Met
65 70 75 80
Thr His Ser Leu Thr Arg Gln Val Val His Asn Lys Leu Thr Ser Cys
85 90 95
Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly Arg Ile Arg Cys Gly
100 105 110
Lys Val Asn Asp Lys Ala Gln Tyr Leu Leu Gly Ala Ala Gly Ser Val
115 120 125
Pro Tyr Arg Trp Ile Asn Leu Glu Tyr Asp Lys Ile Thr Arg Ile Val
130 135 140
Gly Leu Asp Gln Tyr Leu Glu Ser Val Lys Lys His Lys Arg Leu Asp
145 150 155 160
Val Cys Arg Ala Lys Met Gly Tyr Met Leu Gln
165 170
<210> 13
<211> 144
<212> PRT
<213> 人疱疹病毒5
<400> 13
Glu Glu Cys Cys Glu Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys
1 5 10 15
Tyr Asp Phe Lys Met Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro
20 25 30
Asp Gly Glu Val Cys Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly
35 40 45
Ile Val Thr Thr Met Thr His Ser Leu Thr Arg Gln Val Val His Asn
50 55 60
Lys Leu Thr Ser Cys Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly
65 70 75 80
Arg Ile Arg Cys Gly Lys Val Asn Asp Lys Ala Gln Tyr Leu Leu Gly
85 90 95
Ala Ala Gly Ser Val Pro Tyr Arg Trp Ile Asn Leu Glu Tyr Asp Lys
100 105 110
Ile Thr Arg Ile Val Gly Leu Asp Gln Tyr Leu Glu Ser Val Lys Lys
115 120 125
His Lys Arg Leu Asp Val Cys Arg Ala Lys Met Gly Tyr Met Leu Gln
130 135 140
<210> 14
<211> 214
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(214)
<223> /注="毒株Merlin"
<400> 14
Met Leu Arg Leu Leu Leu Arg His His Phe His Cys Leu Leu Leu Cys
1 5 10 15
Ala Val Trp Ala Thr Pro Cys Leu Ala Ser Pro Trp Ser Thr Leu Thr
20 25 30
Ala Asn Gln Asn Pro Ser Pro Pro Trp Ser Lys Leu Thr Tyr Ser Lys
35 40 45
Pro His Asp Ala Ala Thr Phe Tyr Cys Pro Phe Leu Tyr Pro Ser Pro
50 55 60
Pro Arg Ser Pro Leu Gln Phe Ser Gly Phe Gln Arg Val Ser Thr Gly
65 70 75 80
Pro Glu Cys Arg Asn Glu Thr Leu Tyr Leu Leu Tyr Asn Arg Glu Gly
85 90 95
Gln Thr Leu Val Glu Arg Ser Ser Thr Trp Val Lys Lys Val Ile Trp
100 105 110
Tyr Leu Ser Gly Arg Asn Gln Thr Ile Leu Gln Arg Met Pro Arg Thr
115 120 125
Ala Ser Lys Pro Ser Asp Gly Asn Val Gln Ile Ser Val Glu Asp Ala
130 135 140
Lys Ile Phe Gly Ala His Met Val Pro Lys Gln Thr Lys Leu Leu Arg
145 150 155 160
Phe Val Val Asn Asp Gly Thr Arg Tyr Gln Met Cys Val Met Lys Leu
165 170 175
Glu Ser Trp Ala His Val Phe Arg Asp Tyr Ser Val Ser Phe Gln Val
180 185 190
Arg Leu Thr Phe Thr Glu Ala Asn Asn Gln Thr Tyr Thr Phe Cys Thr
195 200 205
His Pro Asn Leu Ile Val
210
<210> 15
<211> 229
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(229)
<223> /注="毒株Towne"
<400> 15
Met Leu Arg Leu Leu Leu Arg His His Phe His Cys Leu Leu Leu Cys
1 5 10 15
Ala Val Trp Ala Thr Pro Cys Leu Ala Ser Pro Trp Ser Thr Leu Thr
20 25 30
Ala Asn Gln Asn Pro Ser Pro Pro Trp Ser Lys Leu Thr Tyr Ser Lys
35 40 45
Pro His Asp Ala Ala Thr Phe Tyr Cys Pro Phe Leu Tyr Pro Ser Pro
50 55 60
Pro Arg Ser Pro Leu Gln Phe Ser Gly Phe Gln Arg Val Leu Thr Gly
65 70 75 80
Pro Glu Cys Arg Asn Glu Thr Leu Tyr Leu Leu Tyr Asn Arg Glu Gly
85 90 95
Gln Thr Leu Val Glu Arg Ser Ser Thr Trp Val Lys Lys Val Ile Trp
100 105 110
Tyr Leu Ser Gly Arg Asn Gln Thr Ile Leu Gln Arg Met Pro Arg Thr
115 120 125
Ala Ser Lys Pro Ser Asp Gly Asn Val Gln Ile Ser Val Glu Asp Ala
130 135 140
Lys Ile Phe Gly Ala His Met Val Pro Lys Gln Thr Lys Leu Leu Arg
145 150 155 160
Phe Val Val Asn Asp Gly Thr Arg Tyr Gln Met Cys Val Met Lys Leu
165 170 175
Glu Ser Trp Ala His Val Phe Arg Asp Tyr Ser Val Ser Phe Gln Val
180 185 190
Arg Leu Thr Phe Thr Glu Ala Asn Asn Gln Thr Phe Thr Pro Ser Ala
195 200 205
Pro Ile Pro Ile Ser Ser Phe Glu Pro Val Ala Arg Ala Gly Asn Phe
210 215 220
Glu Asn Arg Ala Ser
225
<210> 16
<211> 189
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(189)
<223> /注="毒株Merlin"
<400> 16
Ser Pro Trp Ser Thr Leu Thr Ala Asn Gln Asn Pro Ser Pro Pro Trp
1 5 10 15
Ser Lys Leu Thr Tyr Ser Lys Pro His Asp Ala Ala Thr Phe Tyr Cys
20 25 30
Pro Phe Leu Tyr Pro Ser Pro Pro Arg Ser Pro Leu Gln Phe Ser Gly
35 40 45
Phe Gln Arg Val Ser Thr Gly Pro Glu Cys Arg Asn Glu Thr Leu Tyr
50 55 60
Leu Leu Tyr Asn Arg Glu Gly Gln Thr Leu Val Glu Arg Ser Ser Thr
65 70 75 80
Trp Val Lys Lys Val Ile Trp Tyr Leu Ser Gly Arg Asn Gln Thr Ile
85 90 95
Leu Gln Arg Met Pro Arg Thr Ala Ser Lys Pro Ser Asp Gly Asn Val
100 105 110
Gln Ile Ser Val Glu Asp Ala Lys Ile Phe Gly Ala His Met Val Pro
115 120 125
Lys Gln Thr Lys Leu Leu Arg Phe Val Val Asn Asp Gly Thr Arg Tyr
130 135 140
Gln Met Cys Val Met Lys Leu Glu Ser Trp Ala His Val Phe Arg Asp
145 150 155 160
Tyr Ser Val Ser Phe Gln Val Arg Leu Thr Phe Thr Glu Ala Asn Asn
165 170 175
Gln Thr Tyr Thr Phe Cys Thr His Pro Asn Leu Ile Val
180 185
<210> 17
<211> 129
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(129)
<223> /注="毒株Merlin"
<400> 17
Met Arg Leu Cys Arg Val Trp Leu Ser Val Cys Leu Cys Ala Val Val
1 5 10 15
Leu Gly Gln Cys Gln Arg Glu Thr Ala Glu Lys Asn Asp Tyr Tyr Arg
20 25 30
Val Pro His Tyr Trp Asp Ala Cys Ser Arg Ala Leu Pro Asp Gln Thr
35 40 45
Arg Tyr Lys Tyr Val Glu Gln Leu Val Asp Leu Thr Leu Asn Tyr His
50 55 60
Tyr Asp Ala Ser His Gly Leu Asp Asn Phe Asp Val Leu Lys Arg Ile
65 70 75 80
Asn Val Thr Glu Val Ser Leu Leu Ile Ser Asp Phe Arg Arg Gln Asn
85 90 95
Arg Arg Gly Gly Thr Asn Lys Arg Thr Thr Phe Asn Ala Ala Gly Ser
100 105 110
Leu Ala Pro His Ala Arg Ser Leu Glu Phe Ser Val Arg Leu Phe Ala
115 120 125
Asn
<210> 18
<211> 129
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(129)
<223> /注="毒株Towne"
<400> 18
Met Arg Leu Cys Arg Val Trp Leu Ser Val Cys Leu Cys Ala Val Val
1 5 10 15
Leu Gly Gln Cys Gln Arg Glu Thr Ala Glu Lys Asn Asp Tyr Tyr Arg
20 25 30
Val Pro His Tyr Trp Asp Ala Cys Ser Arg Ala Leu Pro Asp Gln Thr
35 40 45
Arg Tyr Lys Tyr Val Glu Gln Leu Val Asp Leu Thr Leu Asn Tyr His
50 55 60
Tyr Asp Ala Ser His Gly Leu Asp Asn Phe Asp Val Leu Lys Arg Ile
65 70 75 80
Asn Val Thr Glu Val Ser Leu Leu Ile Ser Asp Phe Arg Arg Gln Asn
85 90 95
Arg Arg Gly Gly Thr Asn Lys Arg Thr Thr Phe Asn Ala Ala Gly Ser
100 105 110
Leu Ala Pro His Ala Arg Ser Leu Glu Phe Ser Val Arg Leu Phe Ala
115 120 125
Asn
<210> 19
<211> 74
<212> PRT
<213> 人疱疹病毒5
<220>
<221> MISC_FEATURE
<222> (1)..(74)
<223> /注="毒株AD169"
<400> 19
Met Arg Leu Cys Arg Val Trp Leu Ser Val Cys Leu Cys Ala Val Val
1 5 10 15
Leu Gly Gln Cys Gln Arg Glu Thr Ala Glu Lys Lys Arg Leu Leu Pro
20 25 30
Ser Thr Ala Leu Leu Gly Arg Val Leu Ser Arg Ala Ala Arg Pro Asn
35 40 45
Pro Leu Gln Val Cys Gly Thr Ala Arg Gly Pro His Val Glu Leu Pro
50 55 60
Leu Arg Cys Glu Pro Arg Leu Gly Gln Leu
65 70
<210> 20
<211> 111
<212> PRT
<213> 人疱疹病毒5
<400> 20
Gln Cys Gln Arg Glu Thr Ala Glu Lys Asn Asp Tyr Tyr Arg Val Pro
1 5 10 15
His Tyr Trp Asp Ala Cys Ser Arg Ala Leu Pro Asp Gln Thr Arg Tyr
20 25 30
Lys Tyr Val Glu Gln Leu Val Asp Leu Thr Leu Asn Tyr His Tyr Asp
35 40 45
Ala Ser His Gly Leu Asp Asn Phe Asp Val Leu Lys Arg Ile Asn Val
50 55 60
Thr Glu Val Ser Leu Leu Ile Ser Asp Phe Arg Arg Gln Asn Arg Arg
65 70 75 80
Gly Gly Thr Asn Lys Arg Thr Thr Phe Asn Ala Ala Gly Ser Leu Ala
85 90 95
Pro His Ala Arg Ser Leu Glu Phe Ser Val Arg Leu Phe Ala Asn
100 105 110
<210> 21
<211> 1547
<212> PRT
<213> 灰仓鼠
<400> 21
Met Asn Trp Asn Ala Lys Pro Glu Asn Ala Ala Pro Asn Pro Pro Tyr
1 5 10 15
Ser Lys Ser Gln Ser Ser Leu Leu Gln Gln Phe Leu Met Pro Ser Thr
20 25 30
Thr Ser Gln Ser Ser Phe Ser Cys Leu Pro His Asn Gln Glu Ala Cys
35 40 45
Ile Tyr Pro Thr Asn Ser Asn Ser Val Ser Gln Pro Leu Leu Asn Val
50 55 60
Arg Ser Phe Ile Asn Pro Pro Ile Ser Val Ser Asn Val His Asn Arg
65 70 75 80
Thr Val Val Ala Ser Gln Thr Ser Val Glu Arg Val Thr Tyr Thr Asn
85 90 95
Val Lys Gly Ala Gln Gln Pro Asn His Asn Leu Gln Thr Val Ser Ser
100 105 110
Gly Val Val Gln Asn Ala Trp Met Asn Ser Thr Met Arg Asn Phe Met
115 120 125
Pro Ser Leu Thr Glu Ala Thr Ile Ser His Lys Pro Asp Gly Gly Pro
130 135 140
Ser Met Pro Tyr Met His Ala Pro Gln Ser His Leu Val Thr Ser Asp
145 150 155 160
Thr Tyr Ser Val Gln Leu Gln Met Thr Pro Ser Asn Ser Val Arg Gly
165 170 175
Pro Val Thr Tyr Gln Gly Asn Tyr Gln Gly Asn Pro Gly Leu Asn His
180 185 190
Ser Met Ala Gly Glu Leu Gly Trp Val Gln Cys Ala Ser Ser Glu Leu
195 200 205
Thr Tyr Pro Asp Tyr Arg Pro Pro Pro Lys Gln Tyr Pro Tyr Leu Pro
210 215 220
Gln Ser Phe Val Gln Asp Thr Ser Val Gln Lys Gln Asn Phe Val Ser
225 230 235 240
Ser Thr Ser Leu Gln Val Lys Asn Asn Gln Leu Pro Pro Ser Thr Gln
245 250 255
Thr Leu Pro Ser Lys Arg Pro Val Pro Val Ser Ser Tyr Gln Tyr Ala
260 265 270
Ala Glu Thr Ser Lys Arg Leu Pro Pro Pro Pro Tyr Ser Cys Arg Tyr
275 280 285
Gly Ser Gln His Val Gln Asn Ser Gln Ser Val Ser Arg His Leu Pro
290 295 300
Val Glu Val Pro Gln Ser Ser Glu Met His Ser Ser Glu Lys Lys Lys
305 310 315 320
Asp Ala Tyr Lys Val Phe Gln Gln Gln Trp Gln Ser Thr Ser Lys Asn
325 330 335
Val Ser Thr Ile Gly Lys Phe Cys Glu Leu Lys Ile Asn Thr Lys Gln
340 345 350
Ser Tyr Asn Asp Ser Ala Gly Ser Ser Gly Asp Gly Val His Thr Leu
355 360 365
Val Gln Asn Asn Gln Glu Glu Arg Lys Tyr Ser Tyr Asn Pro Ser Thr
370 375 380
Asn Gln Ile Leu Asp Thr Asn Val Thr Lys Glu Lys Leu Val Arg Asp
385 390 395 400
Ile Lys Ser Leu Val Glu Ile Lys Lys Lys Phe Ser Glu Leu Ala Arg
405 410 415
Lys Ile Lys Ile Asn Lys Lys Leu Leu Met Ala Ala Gly Cys Ser Lys
420 425 430
Thr Ala Asn Thr Ser Tyr Thr Glu Pro Thr Arg His Ser Glu Phe Ser
435 440 445
Ala Lys Glu Met Ser Ala Lys Arg Asp Asn Gln Cys Ser Met Glu Leu
450 455 460
Leu Ala Thr Cys Leu Ser Leu Trp Lys Asn Gln Pro Pro Lys Thr Thr
465 470 475 480
Glu Glu Asn Val Ser Lys Pro Leu Glu Glu Lys Gln Tyr Asn Ala Ser
485 490 495
Arg Thr Ser Thr Thr Ala Val Gly Pro Ser Asn Pro Met Asn Glu Val
500 505 510
His Val Lys Asn Phe Cys Ser Gly Val Arg Asn Ser Gln Lys Ile Thr
515 520 525
Thr Ser Ser Gln Thr Val Leu Ser Val Leu Thr Pro Val Tyr Asp Ser
530 535 540
Ser Asp Val Ala Val Gly Lys Gly Thr Glu Leu Gln Ile Ala Val Val
545 550 555 560
Ser Pro Leu Ile Leu Ser Asp Val Ser Thr Val Pro Gly Lys Glu Leu
565 570 575
Ala Pro Glu Val Val Ser Glu Thr Val Tyr Pro Val Val Lys Glu Gly
580 585 590
Ser Val Cys Ser Leu Gln Asn Gln Gln Ala Glu Asn Ala Thr Val Thr
595 600 605
Ala Gly Leu Pro Phe Asp Val Ile Arg Ala Val Ala Ser Ala Thr Val
610 615 620
Ser Ala Glu Leu Ser Leu Pro Gly His Lys Glu Lys Gln His Lys Pro
625 630 635 640
Thr Gln Ser Asp Leu Asp Ile Ala Asp Gly Ser Leu Gly Lys His Ser
645 650 655
Pro Gln Gly Ala Glu Ala Leu Pro Asn Pro Arg Asp Ser Thr Ile Val
660 665 670
Ser Gly Pro Ile Leu Gln Ile Glu Ser Ile Cys Ser Leu Ala Glu Gly
675 680 685
Asp Val Ser Tyr Asn Ser Gln Ile Ala Glu Ile Phe Asn Ser Val Gln
690 695 700
Asn Glu Pro Gln Lys Pro Ser Pro Asp Gln Gln Val Ile Asn Ser Gln
705 710 715 720
Gln Glu Glu Gln Val Asp Lys Val Ala Glu Asn Lys Asp Leu Ser Phe
725 730 735
Leu Lys Asp Lys Cys Met Gln Cys Thr Asp Val Pro His Glu Val Thr
740 745 750
Glu Gln Pro Glu Pro Leu Gln Pro Leu Glu Thr Thr Ser Asp Glu Tyr
755 760 765
Val Glu Ala Asn Gly Glu Ile Leu Glu Glu Ser Ser Lys Glu Asn Pro
770 775 780
Gly Glu Lys Glu Met Thr Lys Asp Ile Leu Cys Ser Pro Ala Ala Val
785 790 795 800
Gln Gln Asp Pro Gln Pro Gln Glu Ile Asp Thr Ala Ser Ser Lys Ser
805 810 815
Gly His Ser Phe Ser Thr Val Asn Glu Ile Asn Asp Glu Asn Glu Pro
820 825 830
Val Ser Tyr Leu His Asp Gln Leu Leu Glu Leu Leu Lys Glu Phe Pro
835 840 845
Tyr Gly Ile Glu Thr Ile Ala Arg Pro Glu Val Tyr Val Gly Gln Gln
850 855 860
Lys Thr His Glu Ile Leu Glu Asn Gln Thr Gly Ser Lys Thr Gly Asn
865 870 875 880
Val Ser Gly Asp Asn Thr Asp Gln Ile Lys Ile Thr Val Leu Asn Ser
885 890 895
Glu Gln Ile Lys Glu Leu Phe Pro Glu Glu Asp Gln Pro Cys Asp Val
900 905 910
Asp Lys Leu Ala Glu Pro Glu Asn Thr Lys Ile Ile Ala Glu Val Lys
915 920 925
Ser Leu Cys Asp Ser Gln Val Pro Arg Glu Glu Ser His Asn Pro Gly
930 935 940
Met Leu Asp Leu Glu Lys Asp Lys Ile His Cys Cys Ala Leu Gly Trp
945 950 955 960
Leu Ser Met Val Tyr Glu Gly Val Pro Gln Cys Gln Cys Ser Ser Met
965 970 975
Glu Glu Lys Glu Lys Asp Gln Cys Ser Leu Glu Ile Ser Asn Cys Lys
980 985 990
Gln Gly Glu Gln Ala Cys Asn Ser Gly Ile Thr Ile Phe Glu Ile Asn
995 1000 1005
Pro Ile Ser Asn Asn Ser Lys Ser Pro Leu Ile Gln Glu Ser Glu
1010 1015 1020
Lys Gly His Phe Ser Asp Ile His Gly Glu Lys Ile Lys Thr Ser
1025 1030 1035
Glu Thr Lys Asn Ser Ser Ser Pro Arg Val Glu Gln Glu Leu Thr
1040 1045 1050
Gly His Phe Ser Met Lys Cys Tyr Gln Lys Asp Lys Ser Thr Thr
1055 1060 1065
Lys Gln Asp Ser Ser Leu Lys Thr Glu Gln Lys Ile Lys Asn Leu
1070 1075 1080
Ser Ser Lys Cys Asp Lys Pro Asn Pro Leu Lys Ser Ser Lys Ile
1085 1090 1095
Pro Thr Pro Glu Thr Phe Asn Val Val Thr Ser Asn Ser Asp Lys
1100 1105 1110
Asn Met Pro Ala Phe Ser Lys Gln Asp Ser Gln Gly Ser Leu Gln
1115 1120 1125
Lys Lys His Leu Phe Gln Asp Ser Asp Pro Val Lys Gly His Val
1130 1135 1140
Trp Leu Leu Pro Asn Lys Asp Pro Arg Arg Arg Asn Thr Phe Leu
1145 1150 1155
Val Gln Ser Val Ser Pro Glu Lys Lys Lys Leu Lys Phe Lys Ser
1160 1165 1170
Gly Ser Ser Lys Leu Lys Tyr Phe Glu Lys Arg Lys Met Asp His
1175 1180 1185
Leu Leu Ile Ser Asp Val Glu Ile Lys Lys Lys Lys Tyr Glu Lys
1190 1195 1200
Gln Glu Gln Asn Lys Asn Ala Gly Gly Thr Leu Lys Leu Cys Ser
1205 1210 1215
Thr Leu Thr Glu Pro Asn Glu Arg Ala Cys Ala Lys Glu Lys Ile
1220 1225 1230
Val Thr Asn Ser Glu Pro Ser Asp Ser Lys Gly Ser Ser Ser Lys
1235 1240 1245
Ser Thr Arg Val Ile Thr Val Gln Glu Tyr Leu Gln Arg Lys Lys
1250 1255 1260
Asp Lys His Val Ile Gly Asn Asn Ala Ser Lys Asn Ile Cys Val
1265 1270 1275
Glu Asn Val Pro Cys Asp Ser Glu Pro Met Lys Ser Ser Lys His
1280 1285 1290
Ser Ala Ser Pro Ser Leu Gly Lys Leu Ile Glu Gly Gln Gly Val
1295 1300 1305
Ser Ala Glu Thr Leu Lys Glu Val Glu His Asn Ser Thr Ser His
1310 1315 1320
Gly Lys Asn Leu Lys Thr His Arg Ser Glu Glu Thr Arg Pro Tyr
1325 1330 1335
Ser Val Ser Asn Ser Lys Glu Lys Phe Tyr Arg Thr His Pro Asp
1340 1345 1350
Lys Ser Tyr Ile Asp Lys Ala Lys Leu Glu Arg Leu Thr Ser Met
1355 1360 1365
Ser Ser Lys Ser Ser Gln Leu Gln Val Lys Glu Lys Arg Lys Gln
1370 1375 1380
Tyr Leu Asn Arg Val Ala Phe Lys Cys Thr Glu Gln Glu Ser Ile
1385 1390 1395
Cys Leu Thr Lys Leu Asp Ser Ala Ser Lys Lys Leu Ser Lys Glu
1400 1405 1410
Lys Glu Lys Ser Thr Ala Cys Ala Pro Met Thr Lys Asp Tyr Thr
1415 1420 1425
His Lys Pro Met Leu Glu Phe Lys Leu Cys Pro Asp Val Leu Leu
1430 1435 1440
Lys Asn Thr Ser Ser Ile Asp Lys Gly Asp Asp Pro Arg Pro Gly
1445 1450 1455
Pro Glu Lys Glu Arg Ala Pro Val Gln Val Ser Gly Ile Lys Thr
1460 1465 1470
Thr Lys Glu Asp Trp Leu Lys Cys Ile Pro Thr Arg Thr Lys Met
1475 1480 1485
Pro Glu Ser Ser Glu Gln Thr Asp Arg Ala Asp Ser Arg Leu Ser
1490 1495 1500
Lys Arg Ser Phe Ser Ala Asp Glu Phe Glu Thr Leu Gln Asn Pro
1505 1510 1515
Val Lys Asp Ser Asn Val Met Phe Arg Thr Phe Lys Lys Met Tyr
1520 1525 1530
Leu Glu Lys Arg Ser Arg Ser Leu Gly Ser Ser Pro Val Lys
1535 1540 1545
<210> 22
<211> 1515
<212> PRT
<213> 灰鼠亚科种
<220>
<221> MOD_RES
<222> (879)..(879)
<223> 任何氨基酸
<400> 22
Met Asn Trp Asn Ala Lys Pro Glu Asn Ala Ala Pro Asn Pro Pro Tyr
1 5 10 15
Ser Lys Ser Gln Ser Ser Leu Leu Gln Gln Phe Leu Met Pro Ser Thr
20 25 30
Thr Ser Gln Ser Ser Phe Ser Cys Leu Pro His Asn Gln Glu Ala Cys
35 40 45
Ile Tyr Pro Thr Asn Ser Asn Ser Val Ser Gln Pro Leu Leu Asn Val
50 55 60
Arg Ser Phe Ile Asn Pro Pro Ile Ser Val Ser Asn Val His Asn Arg
65 70 75 80
Thr Val Val Ala Ser Gln Thr Ser Val Glu Arg Val Thr Tyr Thr Asn
85 90 95
Val Lys Gly Ala Gln Gln Pro Asn His Asn Leu Gln Thr Val Ser Ser
100 105 110
Gly Val Val Gln Asn Ala Trp Met Asn Ser Thr Met Arg Asn Phe Met
115 120 125
Pro Ser Leu Thr Glu Ala Thr Ile Ser His Lys Pro Asp Gly Gly Pro
130 135 140
Ser Met Pro Tyr Met His Ala Pro Gln Ser His Leu Val Thr Ser Asp
145 150 155 160
Thr Tyr Ser Val Gln Leu Gln Met Thr Pro Ser Asn Ser Val Arg Gly
165 170 175
Pro Val Thr Tyr Gln Gly Asn Tyr Gln Gly Asn Pro Gly Leu Asn His
180 185 190
Ser Met Ala Gly Glu Leu Gly Trp Val Gln Cys Ala Ser Ser Glu Leu
195 200 205
Thr Tyr Pro Asp Tyr Arg Pro Pro Pro Lys Gln Tyr Pro Tyr Leu Pro
210 215 220
Gln Ser Phe Val Gln Asp Thr Ser Val Gln Lys Gln Asn Phe Val Ser
225 230 235 240
Ser Thr Ser Leu Gln Val Lys Asn Asn Gln Leu Pro Pro Ser Thr Gln
245 250 255
Thr Leu Pro Ser Lys Arg Pro Val Pro Val Ser Ser Tyr Gln Tyr Ala
260 265 270
Ala Glu Thr Ser Lys Arg Leu Pro Pro Pro Pro Tyr Ser Cys Arg Tyr
275 280 285
Gly Ser Gln His Val Gln Asn Ser Gln Ser Val Ser Arg His Leu Pro
290 295 300
Val Glu Val Pro Gln Ser Ser Glu Met His Ser Ser Glu Lys Lys Lys
305 310 315 320
Asp Ala Tyr Lys Val Phe Gln Gln Gln Trp Gln Ser Thr Ser Lys Asn
325 330 335
Val Ser Thr Ile Gly Lys Phe Cys Glu Leu Lys Ile Asn Thr Lys Gln
340 345 350
Ser Tyr Asn Asp Ser Ala Gly Ser Ser Gly Asp Gly Val His Thr Leu
355 360 365
Val Gln Asn Asn Gln Glu Glu Arg Lys Tyr Ser Tyr Asn Pro Ser Thr
370 375 380
Asn Gln Ile Leu Asp Thr Asn Val Thr Lys Glu Lys Leu Val Arg Asp
385 390 395 400
Ile Lys Ser Leu Val Glu Ile Ser Trp Ala Met Val Ala His Ser Glu
405 410 415
Phe Ser Ala Lys Glu Met Ser Ala Lys Arg Asp Asn Gln Cys Ser Met
420 425 430
Glu Leu Leu Ala Thr Cys Leu Ser Leu Trp Lys Asn Gln Pro Pro Lys
435 440 445
Thr Thr Glu Glu Asn Val Ser Lys Pro Leu Glu Glu Lys Gln Tyr Asn
450 455 460
Ala Ser Arg Thr Ser Thr Thr Ala Val Gly Pro Ser Asn Pro Met Asn
465 470 475 480
Glu Val His Val Lys Asn Phe Cys Ser Gly Val Arg Asn Ser Gln Lys
485 490 495
Ile Thr Thr Ser Ser Gln Thr Val Leu Ser Val Leu Thr Pro Val Tyr
500 505 510
Asp Ser Ser Asp Val Ala Val Gly Lys Gly Thr Glu Leu Gln Ile Ala
515 520 525
Val Val Ser Pro Leu Ile Leu Ser Asp Val Ser Thr Val Pro Gly Lys
530 535 540
Glu Leu Ala Pro Glu Val Val Ser Glu Thr Val Tyr Pro Val Val Lys
545 550 555 560
Glu Gly Ser Val Cys Ser Leu Gln Asn Gln Gln Ala Glu Asn Ala Thr
565 570 575
Val Thr Ala Gly Leu Pro Phe Asp Val Ile Arg Ala Val Ala Ser Ala
580 585 590
Thr Val Ser Ala Glu Leu Ser Leu Pro Gly His Lys Glu Lys Gln His
595 600 605
Lys Pro Thr Gln Thr Asp Leu Asp Thr Ala Asp Gly Ser Leu Gly Lys
610 615 620
His Ser Pro Gln Gly Ala Glu Ala Leu Pro Asn Pro Arg Asp Ser Thr
625 630 635 640
Ile Val Ser Gly Pro Ile Leu Gln Ile Glu Ser Ile Cys Ser Leu Ala
645 650 655
Glu Gly Asp Val Ser Tyr Asn Ser Gln Ile Ala Glu Ile Phe Asn Ser
660 665 670
Val Gln Asn Glu Pro Gln Lys Pro Ser Pro Asp Gln Gln Val Ile Asn
675 680 685
Ser Gln Gln Glu Glu Gln Val Asp Lys Val Ala Glu Asn Lys Asp Leu
690 695 700
Ser Phe Leu Lys Asp Lys Cys Met Gln Cys Thr Asp Val Pro His Glu
705 710 715 720
Val Thr Glu Gln Pro Glu Pro Leu Gln Pro Leu Glu Thr Thr Ser Asp
725 730 735
Glu Tyr Val Glu Ala Asn Gly Glu Ile Leu Glu Glu Ser Ser Lys Glu
740 745 750
Asn Pro Gly Glu Lys Glu Met Thr Lys Asp Ile Leu Cys Ser Pro Ala
755 760 765
Ala Val Gln Gln Asp Pro Gln Pro Gln Glu Ile Asp Thr Ala Ser Ser
770 775 780
Lys Ser Gly His Ser Phe Ser Thr Val Asn Glu Ile Asn Asp Glu Asn
785 790 795 800
Glu Pro Val Ser Tyr Leu His Asp Gln Leu Leu Glu Leu Leu Lys Glu
805 810 815
Phe Pro Tyr Gly Ile Glu Thr Ile Ala Arg Pro Glu Val Tyr Val Gly
820 825 830
Gln Gln Lys Thr His Glu Ile Leu Glu Asn Gln Thr Gly Ser Lys Thr
835 840 845
Gly Asn Val Ser Gly Asp Asn Thr Asp Gln Ile Lys Ile Thr Val Leu
850 855 860
Asn Ser Glu Gln Ile Lys Glu Leu Phe Pro Glu Glu Asp Gln Xaa Val
865 870 875 880
Asp Lys Leu Ala Glu Pro Glu Asn Thr Lys Ile Ile Ala Glu Val Lys
885 890 895
Ser Leu Cys Asp Ser Gln Val Pro Arg Glu Glu Ser His Asn Pro Gly
900 905 910
Met Leu Asp Leu Glu Lys Asp Lys Ile His Cys Cys Ala Leu Gly Trp
915 920 925
Leu Ser Met Val Tyr Glu Gly Val Pro Gln Cys Gln Cys Ser Ser Met
930 935 940
Glu Glu Lys Glu Lys Asp Gln Cys Ser Leu Glu Ile Ser Asn Cys Lys
945 950 955 960
Gln Gly Glu Gln Ala Cys Asn Ser Gly Ile Thr Ile Phe Glu Ile Asn
965 970 975
Pro Ile Ser Asn Asn Ser Lys Ser Pro Leu Ile Gln Glu Ser Glu Lys
980 985 990
Gly His Phe Ser Asp Ile His Gly Glu Lys Ile Lys Thr Ser Glu Thr
995 1000 1005
Lys Asn Ser Ser Ser Pro Arg Val Glu Gln Glu Leu Thr Gly His
1010 1015 1020
Phe Ser Met Lys Cys Tyr Gln Lys Asp Lys Ser Thr Thr Lys Gln
1025 1030 1035
Asp Ser Ser Leu Lys Thr Glu Gln Lys Ile Lys Asn Leu Ser Ser
1040 1045 1050
Lys Cys Asp Lys Pro Asn Pro Leu Lys Ser Ser Lys Ile Pro Thr
1055 1060 1065
Pro Glu Thr Phe Asn Val Val Thr Ser Asn Ser Asp Lys Asn Met
1070 1075 1080
Pro Ala Phe Ser Lys Gln Asp Ser Gln Gly Ser Leu Gln Lys Lys
1085 1090 1095
His Leu Phe Gln Asp Ser Asp Pro Val Lys Gly His Val Trp Leu
1100 1105 1110
Leu Pro Asn Lys Asp Pro Arg Arg Arg Asn Thr Phe Leu Val Gln
1115 1120 1125
Ser Val Ser Pro Glu Lys Lys Lys Leu Lys Phe Lys Ser Gly Ser
1130 1135 1140
Ser Lys Leu Lys Tyr Phe Glu Lys Arg Lys Met Asp His Leu Leu
1145 1150 1155
Ile Ser Asp Val Glu Ile Lys Lys Lys Lys Tyr Glu Lys Gln Glu
1160 1165 1170
Gln Asn Lys Asn Ala Gly Gly Thr Leu Lys Leu Cys Ser Thr Leu
1175 1180 1185
Thr Glu Pro Asn Glu Arg Ala Cys Ala Lys Glu Lys Ile Val Thr
1190 1195 1200
Asn Ser Glu Pro Ser Asp Ser Lys Gly Ser Ser Ser Lys Ser Thr
1205 1210 1215
Arg Val Ile Thr Val Gln Glu Tyr Leu Gln Arg Lys Lys Asp Lys
1220 1225 1230
His Val Ile Gly Asn Asn Ala Ser Lys Asn Ile Cys Val Glu Asn
1235 1240 1245
Val Pro Cys Asp Ser Glu Pro Met Lys Ser Ser Lys His Ser Ala
1250 1255 1260
Ser Pro Ser Leu Gly Lys Leu Ile Glu Gly Gln Gly Val Ser Ala
1265 1270 1275
Glu Thr Leu Lys Glu Val Glu His Asn Ser Ser Ser His Gly Lys
1280 1285 1290
Asn Leu Lys Thr His Arg Ser Glu Glu Thr Arg Pro Tyr Ser Val
1295 1300 1305
Ser Asn Ser Lys Glu Lys Phe Tyr Arg Thr His Pro Asp Lys Ser
1310 1315 1320
Tyr Ile Asp Lys Ala Lys Leu Glu Arg Leu Thr Ser Met Ser Ser
1325 1330 1335
Lys Ser Ser Gln Leu Gln Val Lys Glu Lys Arg Lys Gln Tyr Leu
1340 1345 1350
Asn Arg Val Ala Phe Lys Cys Thr Glu Gln Glu Ser Ile Cys Leu
1355 1360 1365
Thr Lys Leu Asp Ser Ala Ser Lys Lys Leu Ser Lys Glu Lys Glu
1370 1375 1380
Lys Ser Thr Ala Cys Ala Pro Met Thr Lys Asp Tyr Thr His Lys
1385 1390 1395
Pro Met Leu Glu Phe Lys Leu Cys Pro Asp Val Leu Leu Lys Asn
1400 1405 1410
Thr Ser Ser Ile Asp Lys Gly Asp Asp Pro Arg Pro Gly Pro Glu
1415 1420 1425
Lys Glu Arg Ala Pro Val Gln Val Ser Gly Ile Lys Thr Thr Lys
1430 1435 1440
Glu Asp Trp Leu Lys Cys Ile Pro Thr Arg Thr Lys Met Pro Glu
1445 1450 1455
Ser Ser Glu Gln Thr Asp Arg Ala Asp Ser Arg Leu Ser Lys Arg
1460 1465 1470
Ser Phe Ser Ala Asp Glu Phe Glu Thr Leu Gln Asn Pro Val Lys
1475 1480 1485
Asp Ser Asn Val Met Phe Arg Thr Phe Lys Lys Met Tyr Leu Glu
1490 1495 1500
Lys Arg Ser Arg Ser Leu Gly Ser Ser Pro Val Lys
1505 1510 1515
<210> 23
<211> 1747
<212> PRT
<213> 智人
<400> 23
Met Asn Trp Asn Glu Lys Pro Lys Ser Ala Thr Leu Pro Pro Leu Tyr
1 5 10 15
Pro Lys Ser Gln Pro Pro Phe Leu His Gln Ser Leu Ile Asn Gln Ile
20 25 30
Thr Thr Thr Ser Gln Ser Ser Phe Ser Tyr Pro Gly Ser Asn Gln Glu
35 40 45
Ala Cys Met Tyr Pro Gly Asn Ser Asn Pro Ile Ser Gln Pro Leu Leu
50 55 60
Asn Ile Gln Asn Tyr Pro Gln Gln Ile Ser Val Ser Asp Met His Asn
65 70 75 80
Gly Thr Val Val Ala Ser His Thr Ser Val Glu Arg Ile Thr Tyr Ala
85 90 95
Asn Val Asn Gly Pro Lys Gln Leu Thr His Asn Leu Gln Met Ser Ser
100 105 110
Gly Val Thr Gln Asn Val Trp Leu Asn Ser Pro Met Arg Asn Pro Val
115 120 125
His Ser His Ile Gly Ala Thr Val Ser His Gln Thr Asp Phe Gly Ala
130 135 140
Asn Val Pro Asn Met Pro Ala Leu Gln Ser Gln Leu Ile Thr Ser Asp
145 150 155 160
Thr Tyr Ser Met Gln Met Gln Met Ile Pro Ser Asn Ser Thr Arg Leu
165 170 175
Pro Val Ala Tyr Gln Gly Asn Gln Gly Leu Asn Gln Ser Phe Ser Glu
180 185 190
Gln Gln Val Asp Trp Thr Gln Gln Cys Ile Ser Lys Gly Leu Thr Tyr
195 200 205
Pro Asp Tyr Arg Pro Pro Pro Lys Leu Tyr Arg Tyr Ser Pro Gln Ser
210 215 220
Phe Leu Pro Asp Ser Thr Ile Gln Lys Gln Asn Phe Ile Pro His Thr
225 230 235 240
Ser Leu Gln Val Lys Asn Ser Gln Leu Leu Asn Ser Val Leu Thr Leu
245 250 255
Pro Ser Arg Gln Thr Ser Ala Val Pro Ser Gln Gln Tyr Ala Thr Gln
260 265 270
Thr Asp Lys Arg Pro Pro Pro Pro Pro Tyr Asn Cys Arg Tyr Gly Ser
275 280 285
Gln Pro Leu Gln Ser Thr Gln His Ile Thr Lys His Leu Ser Met Glu
290 295 300
Val Pro Gln Ser Arg Glu Met Leu Ser Ser Glu Ile Arg Thr Ser Phe
305 310 315 320
Gln Gln Gln Trp Gln Asn Pro Asn Glu Asn Val Ser Thr Ile Gly Asn
325 330 335
Phe Thr Asn Leu Lys Val Asn Thr Asn Ser Lys Gln Pro Phe Asn Ser
340 345 350
Pro Ile Arg Ser Ser Val Asp Gly Val Gln Thr Leu Ala Gln Thr Asn
355 360 365
Glu Glu Lys Ile Met Asp Ser Cys Asn Pro Thr Ser Asn Gln Val Leu
370 375 380
Asp Thr Ser Val Ala Lys Glu Lys Leu Val Arg Asp Ile Lys Thr Leu
385 390 395 400
Val Glu Ile Lys Gln Lys Phe Ser Glu Leu Ala Arg Lys Ile Lys Ile
405 410 415
Asn Lys Asp Leu Leu Met Ala Ala Gly Cys Ile Lys Met Thr Asn Thr
420 425 430
Ser Tyr Ser Glu Pro Ala Gln Asn Ser Lys Leu Ser Leu Lys Gln Thr
435 440 445
Ala Lys Ile Gln Ser Gly Pro Gln Ile Thr Pro Val Met Pro Glu Asn
450 455 460
Ala Glu Arg Gln Thr Pro Thr Val Val Glu Ser Ala Glu Thr Asn Lys
465 470 475 480
Thr Gln Cys Met Leu Asn Ser Asp Ile Gln Glu Val Asn Cys Arg Arg
485 490 495
Phe Asn Gln Val Asp Ser Val Leu Pro Asn Pro Val Tyr Ser Glu Lys
500 505 510
Arg Pro Met Pro Asp Ser Ser His Asp Val Lys Val Leu Thr Ser Lys
515 520 525
Thr Ser Ala Val Glu Met Thr Gln Ala Val Leu Asn Thr Gln Leu Ser
530 535 540
Ser Glu Asn Val Thr Lys Val Glu Gln Asn Ser Pro Ala Val Cys Glu
545 550 555 560
Thr Ile Ser Val Pro Lys Ser Met Ser Thr Glu Glu Tyr Lys Ser Lys
565 570 575
Ile Gln Asn Glu Asn Met Leu Leu Leu Ala Leu Leu Ser Gln Ala Arg
580 585 590
Lys Thr Gln Lys Thr Val Leu Lys Asp Ala Asn Gln Thr Ile Gln Asp
595 600 605
Ser Lys Pro Asp Ser Cys Glu Met Asn Pro Asn Thr Gln Met Thr Gly
610 615 620
Asn Gln Leu Asn Leu Lys Asn Met Glu Thr Pro Ser Thr Ser Asn Val
625 630 635 640
Ser Gly Arg Val Leu Asp Asn Ser Phe Cys Ser Gly Gln Glu Ser Ser
645 650 655
Thr Lys Gly Met Pro Ala Lys Ser Asp Ser Ser Cys Ser Met Glu Val
660 665 670
Leu Ala Thr Cys Leu Ser Leu Trp Lys Lys Gln Pro Ser Asp Thr Ala
675 680 685
Lys Glu Lys Glu Cys Asp Lys Leu Arg Thr Asn Thr Thr Ala Val Gly
690 695 700
Ile Ser Lys Pro Ala Asn Ile His Val Lys Ser Pro Cys Ser Val Val
705 710 715 720
Gly Asn Ser Asn Ser Gln Asn Lys Ile Ser Asn Pro Ser Gln Gln Thr
725 730 735
Ala Leu Ser Met Val Met His Asn Tyr Glu Ser Ser Gly Ile Asn Ile
740 745 750
Thr Lys Gly Thr Glu Leu Gln Ile Ala Val Val Ser Pro Leu Val Leu
755 760 765
Ser Glu Val Lys Thr Leu Ser Val Lys Gly Ile Thr Pro Ala Val Leu
770 775 780
Pro Glu Thr Val Tyr Pro Val Ile Lys Glu Gly Ser Val Cys Ser Leu
785 790 795 800
Gln Asn Gln Leu Ala Glu Asn Ala Lys Ala Thr Ala Ala Leu Lys Val
805 810 815
Asp Val Ser Gly Pro Val Ala Ser Thr Ala Thr Ser Thr Lys Ile Phe
820 825 830
Pro Leu Thr Gln Lys Glu Lys Gln Asn Glu Ser Thr Asn Gly Asn Ser
835 840 845
Glu Val Thr Pro Asn Val Asn Gln Gly Lys His Asn Lys Leu Glu Ser
850 855 860
Ala Ile His Ser Pro Met Asn Asp Gln Gln Ile Ser Gln Glu Ser Arg
865 870 875 880
Asn Ser Thr Val Val Ser Ser Asp Thr Leu Gln Ile Asp Asn Ile Cys
885 890 895
Ser Leu Val Glu Gly Asp Thr Ser Tyr Asn Ser Gln Ile Ala Lys Ile
900 905 910
Phe Ser Ser Leu Pro Leu Lys Met Val Glu Pro Gln Lys Pro Ser Leu
915 920 925
Pro Asn Gln Gln Gly Ile Gly Ser Arg Glu Pro Glu Lys Gln Leu Asp
930 935 940
Asn Thr Thr Glu Asn Lys Asp Phe Gly Phe Gln Lys Asp Lys Pro Val
945 950 955 960
Gln Cys Thr Asp Val Ser His Lys Ile Cys Asp Gln Ser Lys Ser Glu
965 970 975
Pro Pro Leu Glu Ser Ser Phe Asn Asn Leu Glu Thr Asn Arg Val Ile
980 985 990
Leu Glu Lys Ser Ser Leu Glu His Ala Thr Glu Lys Ser Thr Ala Asn
995 1000 1005
Asp Thr Cys Ser Ser Ala Ala Ile Gln Glu Asp Ile Tyr Pro Gln
1010 1015 1020
Glu Ile Asp Ala Ser Ser Asn Tyr Thr Pro Gln Asp Pro Ala Arg
1025 1030 1035
Asn Glu Ile His Ser Asp Lys Ala Pro Val Leu Tyr Leu His Asp
1040 1045 1050
Gln Leu Ser Glu Leu Leu Lys Glu Phe Pro Tyr Gly Ile Glu Ala
1055 1060 1065
Val Asn Thr Arg Glu Gly Ser Val Gly Gln Gln Thr Thr Tyr Gln
1070 1075 1080
Thr Ser Glu Asp Gln Thr Ala Asp Lys Thr Ser Ser Asp Ser Lys
1085 1090 1095
Asp Pro Ala Asp Gln Ile Gln Ile Thr Ile Leu Ser Ser Glu Gln
1100 1105 1110
Met Lys Glu Ile Phe Pro Glu Gln Asp Asp Gln Pro Tyr Val Val
1115 1120 1125
Asp Lys Leu Ala Glu Pro Gln Lys Glu Glu Pro Ile Thr Glu Val
1130 1135 1140
Val Ser Gln Cys Asp Leu Gln Ala Pro Ala Ala Gly Gln Ser Arg
1145 1150 1155
Asp Ser Val Ile Leu Asp Ser Glu Lys Asp Asp Ile His Cys Cys
1160 1165 1170
Ala Leu Gly Trp Leu Ser Met Val Tyr Glu Gly Val Pro Gln Cys
1175 1180 1185
Gln Cys Asn Ser Ile Lys Asn Ser Ser Ser Glu Glu Glu Lys Gln
1190 1195 1200
Lys Glu Gln Cys Ser Pro Leu Asp Thr Asn Ser Cys Lys Gln Gly
1205 1210 1215
Glu Arg Thr Ser Asp Arg Asp Val Thr Val Val Gln Phe Lys Ser
1220 1225 1230
Leu Val Asn Asn Pro Lys Thr Pro Pro Asp Gly Lys Ser His Phe
1235 1240 1245
Pro Glu Leu Gln Asp Asp Ser Arg Lys Asp Thr Pro Lys Thr Lys
1250 1255 1260
His Lys Ser Leu Pro Arg Thr Glu Gln Glu Leu Val Ala Gly Gln
1265 1270 1275
Phe Ser Ser Lys Cys Asp Lys Leu Asn Pro Leu Gln Asn His Lys
1280 1285 1290
Arg Lys Lys Leu Arg Phe His Glu Val Thr Phe His Ser Ser Asn
1295 1300 1305
Lys Met Thr Ala Ser Tyr Glu Gln Ala Ser Gln Glu Thr Arg Gln
1310 1315 1320
Lys Lys His Val Thr Gln Asn Ser Arg Pro Leu Lys Thr Lys Thr
1325 1330 1335
Ala Phe Leu Pro Asn Lys Asp Val Tyr Lys Lys His Ser Ser Leu
1340 1345 1350
Gly Gln Ser Leu Ser Pro Glu Lys Ile Lys Leu Lys Leu Lys Ser
1355 1360 1365
Val Ser Phe Lys Gln Lys Arg Lys Leu Asp Gln Gly Asn Val Leu
1370 1375 1380
Asp Met Glu Val Lys Lys Lys Lys His Asp Lys Gln Glu Gln Lys
1385 1390 1395
Gly Ser Val Gly Ala Thr Phe Lys Leu Gly Asp Ser Leu Ser Asn
1400 1405 1410
Pro Asn Glu Arg Ala Ile Val Lys Glu Lys Met Val Ser Asn Thr
1415 1420 1425
Lys Ser Val Asp Thr Lys Ala Ser Ser Ser Lys Phe Ser Arg Ile
1430 1435 1440
Leu Thr Pro Lys Glu Tyr Leu Gln Arg Gln Lys His Lys Glu Ala
1445 1450 1455
Leu Ser Asn Lys Ala Ser Lys Lys Ile Cys Val Lys Asn Val Pro
1460 1465 1470
Cys Asp Ser Glu His Met Arg Pro Ser Lys Leu Ala Val Gln Val
1475 1480 1485
Glu Ser Cys Gly Lys Ser Asn Glu Lys His Ser Ser Gly Val Gln
1490 1495 1500
Thr Ser Lys Glu Ser Leu Asn Gly Leu Thr Ser His Gly Lys Asn
1505 1510 1515
Leu Lys Ile His His Ser Gln Glu Ser Lys Thr Tyr Asn Ile Leu
1520 1525 1530
Arg Asn Val Lys Glu Lys Val Gly Gly Lys Gln Pro Asp Lys Ile
1535 1540 1545
Trp Ile Asp Lys Thr Lys Leu Asp Lys Leu Thr Asn Ile Ser Asn
1550 1555 1560
Glu Ala Gln Phe Ser Gln Met Pro Pro Gln Val Lys Asp Gln Lys
1565 1570 1575
Lys Leu Tyr Leu Asn Arg Val Gly Phe Lys Cys Thr Glu Arg Glu
1580 1585 1590
Ser Ile Ser Leu Thr Lys Leu Glu Ser Ser Pro Arg Lys Leu His
1595 1600 1605
Lys Asp Lys Arg Gln Glu Asn Lys His Lys Thr Phe Leu Pro Val
1610 1615 1620
Lys Gly Asn Thr Glu Lys Ser Asn Met Leu Glu Phe Lys Leu Cys
1625 1630 1635
Pro Asp Ile Leu Leu Lys Asn Thr Asn Ser Val Glu Glu Arg Lys
1640 1645 1650
Asp Val Lys Pro His Pro Arg Lys Glu Gln Ala Pro Leu Gln Val
1655 1660 1665
Ser Gly Ile Lys Ser Thr Lys Glu Asp Trp Leu Lys Phe Val Ala
1670 1675 1680
Thr Lys Lys Arg Thr Gln Lys Asp Ser Gln Glu Arg Asp Asn Val
1685 1690 1695
Asn Ser Arg Leu Ser Lys Arg Ser Phe Ser Ala Asp Gly Phe Glu
1700 1705 1710
Met Leu Gln Asn Pro Val Lys Asp Ser Lys Glu Met Phe Gln Thr
1715 1720 1725
Tyr Lys Gln Met Tyr Leu Glu Lys Arg Ser Arg Ser Leu Gly Ser
1730 1735 1740
Ser Pro Val Lys
1745
<210> 24
<211> 1747
<212> PRT
<213> 智人
<400> 24
Met Asn Trp Asn Glu Lys Pro Lys Ser Ala Thr Leu Pro Pro Leu Tyr
1 5 10 15
Pro Lys Ser Gln Pro Pro Phe Leu His Gln Ser Leu Ile Asn Gln Ile
20 25 30
Thr Thr Thr Ser Gln Ser Ser Phe Ser Tyr Pro Gly Ser Asn Gln Glu
35 40 45
Ala Cys Met Tyr Pro Gly Asn Ser Asn Pro Ile Ser Gln Pro Leu Leu
50 55 60
Asn Ile Gln Asn Tyr Pro Gln Gln Ile Ser Val Ser Asp Met His Asn
65 70 75 80
Gly Thr Val Val Ala Ser His Thr Ser Val Glu Arg Ile Thr Tyr Ala
85 90 95
Asn Val Asn Gly Pro Lys Gln Leu Thr His Asn Leu Gln Met Ser Ser
100 105 110
Gly Val Thr Gln Asn Val Trp Leu Asn Ser Pro Met Arg Asn Pro Val
115 120 125
His Ser His Ile Gly Ala Thr Val Ser His Gln Thr Asp Phe Gly Ala
130 135 140
Asn Val Pro Asn Met Pro Ala Leu Gln Ser Gln Leu Ile Thr Ser Asp
145 150 155 160
Thr Tyr Ser Met Gln Met Gln Met Ile Pro Ser Asn Ser Thr Arg Leu
165 170 175
Pro Val Ala Tyr Gln Gly Asn Gln Gly Leu Asn Gln Ser Phe Ser Glu
180 185 190
Gln Gln Val Asp Trp Thr Gln Gln Cys Ile Ser Lys Gly Leu Thr Tyr
195 200 205
Pro Asp Tyr Arg Pro Pro Pro Lys Leu Tyr Arg Tyr Ser Pro Gln Ser
210 215 220
Phe Leu Pro Asp Ser Thr Ile Gln Lys Gln Asn Phe Ile Pro His Thr
225 230 235 240
Ser Leu Gln Val Lys Asn Ser Gln Leu Leu Asn Ser Val Leu Thr Leu
245 250 255
Pro Ser Arg Gln Thr Ser Ala Val Pro Ser Gln Gln Tyr Ala Thr Gln
260 265 270
Thr Asp Lys Arg Pro Pro Pro Pro Pro Tyr Asn Cys Arg Tyr Gly Ser
275 280 285
Gln Pro Leu Gln Ser Thr Gln His Ile Thr Lys His Leu Ser Met Glu
290 295 300
Val Pro Gln Ser Arg Glu Met Leu Ser Ser Glu Ile Arg Thr Ser Phe
305 310 315 320
Gln Gln Gln Trp Gln Asn Pro Asn Glu Asn Val Ser Thr Ile Gly Asn
325 330 335
Phe Thr Asn Leu Lys Val Asn Thr Asn Ser Lys Gln Pro Phe Asn Ser
340 345 350
Pro Ile Arg Ser Ser Val Asp Gly Val Gln Thr Leu Ala Gln Thr Asn
355 360 365
Glu Glu Lys Ile Met Asp Ser Cys Asn Pro Thr Ser Asn Gln Val Leu
370 375 380
Asp Thr Ser Val Ala Lys Glu Lys Leu Val Arg Asp Ile Lys Thr Leu
385 390 395 400
Val Glu Ile Lys Gln Lys Phe Ser Glu Leu Ala Arg Lys Ile Lys Ile
405 410 415
Asn Lys Asp Leu Leu Met Ala Ala Gly Cys Ile Lys Met Thr Asn Thr
420 425 430
Ser Tyr Ser Glu Pro Ala Gln Asn Ser Lys Leu Ser Leu Lys Gln Thr
435 440 445
Ala Lys Ile Gln Ser Gly Pro Gln Ile Thr Pro Val Met Pro Glu Asn
450 455 460
Ala Glu Arg Gln Thr Pro Thr Val Val Glu Ser Ala Glu Thr Asn Lys
465 470 475 480
Thr Gln Cys Met Leu Asn Ser Asp Ile Gln Glu Val Asn Cys Arg Arg
485 490 495
Phe Asn Gln Val Asp Ser Val Leu Pro Asn Pro Val Tyr Ser Glu Lys
500 505 510
Arg Pro Met Pro Asp Pro Ser His Asp Val Lys Val Leu Thr Ser Lys
515 520 525
Thr Ser Ala Val Glu Met Thr Gln Ala Val Leu Asn Thr Gln Leu Ser
530 535 540
Ser Glu Asn Val Thr Lys Val Glu Gln Asn Ser Pro Ala Val Cys Glu
545 550 555 560
Thr Ile Ser Val Pro Lys Ser Met Ser Thr Glu Glu Tyr Lys Ser Lys
565 570 575
Ile Gln Asn Glu Asn Met Leu Leu Leu Ala Leu Leu Ser Gln Ala Arg
580 585 590
Lys Thr Gln Lys Thr Val Leu Lys Asp Ala Asn Gln Thr Ile Gln Asp
595 600 605
Ser Lys Pro Asp Ser Cys Glu Met Asn Pro Asn Thr Gln Met Thr Gly
610 615 620
Asn Gln Leu Asn Leu Lys Asn Met Glu Thr Pro Ser Thr Ser Asn Val
625 630 635 640
Ser Gly Arg Val Leu Asp Asn Ser Phe Cys Ser Gly Gln Glu Ser Ser
645 650 655
Thr Lys Gly Met Pro Ala Lys Ser Asp Ser Ser Cys Ser Met Glu Val
660 665 670
Leu Ala Thr Cys Leu Ser Leu Trp Lys Lys Gln Pro Ser Asp Thr Ala
675 680 685
Lys Glu Lys Glu Cys Asp Lys Leu Arg Thr Asn Thr Thr Ala Val Gly
690 695 700
Ile Ser Lys Pro Ala Asn Ile His Val Lys Ser Pro Cys Ser Val Val
705 710 715 720
Gly Asn Ser Asn Ser Gln Asn Lys Ile Ser Asn Pro Ser Gln Gln Thr
725 730 735
Ala Leu Ser Met Val Met His Asn Tyr Glu Ser Ser Gly Ile Asn Ile
740 745 750
Thr Lys Gly Thr Glu Leu Gln Ile Ala Val Val Ser Pro Leu Val Leu
755 760 765
Ser Glu Val Lys Thr Leu Ser Val Lys Gly Ile Thr Pro Ala Val Leu
770 775 780
Pro Glu Thr Val Tyr Pro Val Ile Lys Glu Gly Ser Val Cys Ser Leu
785 790 795 800
Gln Asn Gln Leu Ala Glu Asn Ala Lys Ala Thr Ala Ala Leu Lys Val
805 810 815
Asp Val Ser Gly Pro Val Ala Ser Thr Ala Thr Ser Thr Lys Ile Phe
820 825 830
Pro Leu Thr Gln Lys Glu Lys Gln Asn Glu Ser Thr Asn Gly Asn Ser
835 840 845
Glu Val Thr Pro Asn Val Asn Gln Gly Lys His Asn Lys Leu Glu Ser
850 855 860
Ala Ile His Ser Pro Met Asn Asp Gln Gln Ile Ser Gln Glu Ser Arg
865 870 875 880
Asn Ser Thr Val Val Ser Ser Asp Thr Leu Gln Ile Asp Asn Ile Cys
885 890 895
Ser Leu Val Glu Gly Asp Thr Ser Tyr Asn Ser Gln Ile Ala Lys Ile
900 905 910
Phe Ser Ser Leu Pro Leu Lys Met Val Glu Pro Gln Lys Pro Ser Leu
915 920 925
Pro Asn Gln Gln Gly Ile Gly Ser Arg Glu Pro Glu Lys Gln Leu Asp
930 935 940
Asn Thr Thr Glu Asn Lys Asp Phe Gly Phe Gln Lys Asp Lys Pro Val
945 950 955 960
Gln Cys Thr Asp Val Ser His Lys Ile Cys Asp Gln Ser Lys Ser Glu
965 970 975
Pro Pro Leu Glu Ser Ser Phe Asn Asn Leu Glu Thr Asn Arg Val Ile
980 985 990
Leu Glu Lys Ser Ser Leu Glu His Ala Thr Glu Lys Ser Thr Ala Asn
995 1000 1005
Asp Thr Cys Ser Ser Ala Ala Ile Gln Glu Asp Ile Tyr Pro Gln
1010 1015 1020
Glu Ile Asp Ala Ser Ser Asn Tyr Thr Pro Gln Asp Pro Ala Arg
1025 1030 1035
Asn Glu Ile His Ser Asp Lys Ala Pro Val Leu Tyr Leu His Asp
1040 1045 1050
Gln Leu Ser Glu Leu Leu Lys Glu Phe Pro Tyr Gly Ile Glu Ala
1055 1060 1065
Val Asn Thr Arg Glu Gly Ser Val Gly Gln Gln Thr Thr Tyr Gln
1070 1075 1080
Thr Ser Glu Asp Gln Thr Ala Asp Lys Thr Ser Ser Asp Ser Lys
1085 1090 1095
Asp Pro Ala Asp Gln Ile Gln Ile Thr Ile Leu Ser Ser Glu Gln
1100 1105 1110
Met Lys Glu Ile Phe Pro Glu Gln Asp Asp Gln Pro Tyr Val Val
1115 1120 1125
Asp Lys Leu Ala Glu Pro Gln Lys Glu Glu Pro Ile Thr Glu Val
1130 1135 1140
Val Ser Gln Cys Asp Leu Gln Ala Pro Ala Ala Gly Gln Ser Arg
1145 1150 1155
Asp Ser Val Ile Leu Asp Ser Glu Lys Asp Asp Ile His Cys Cys
1160 1165 1170
Ala Leu Gly Trp Leu Ser Met Val Tyr Glu Gly Val Pro Gln Cys
1175 1180 1185
Gln Cys Asn Ser Ile Lys Asn Ser Ser Ser Glu Glu Glu Lys Gln
1190 1195 1200
Lys Glu Gln Cys Ser Pro Leu Asp Thr Asn Ser Cys Lys Gln Gly
1205 1210 1215
Glu Arg Thr Ser Asp Arg Asp Val Thr Val Val Gln Phe Lys Ser
1220 1225 1230
Leu Val Asn Asn Pro Lys Thr Pro Pro Asp Gly Lys Ser His Phe
1235 1240 1245
Pro Glu Leu Gln Asp Asp Ser Arg Lys Asp Thr Pro Lys Thr Lys
1250 1255 1260
His Lys Ser Leu Pro Arg Thr Glu Gln Glu Leu Val Ala Gly Gln
1265 1270 1275
Phe Ser Ser Lys Cys Asp Lys Leu Asn Pro Leu Gln Asn His Lys
1280 1285 1290
Arg Lys Lys Leu Arg Phe His Glu Val Thr Phe His Ser Ser Asn
1295 1300 1305
Lys Met Thr Ala Ser Tyr Glu Gln Ala Ser Gln Glu Thr Arg Gln
1310 1315 1320
Lys Lys His Val Thr Gln Asn Ser Arg Pro Leu Lys Thr Lys Thr
1325 1330 1335
Ala Phe Leu Pro Asn Lys Asp Val Tyr Lys Lys His Ser Ser Leu
1340 1345 1350
Gly Gln Ser Leu Ser Pro Glu Lys Ile Lys Leu Lys Leu Lys Ser
1355 1360 1365
Val Ser Phe Lys Gln Lys Arg Lys Leu Asp Gln Gly Asn Val Leu
1370 1375 1380
Asp Met Glu Val Lys Lys Lys Lys His Asp Lys Gln Glu Gln Lys
1385 1390 1395
Gly Ser Val Gly Ala Thr Phe Lys Leu Gly Asp Ser Leu Ser Asn
1400 1405 1410
Pro Asn Glu Arg Ala Ile Val Lys Glu Lys Met Val Ser Asn Thr
1415 1420 1425
Lys Ser Val Asp Thr Lys Ala Ser Ser Ser Lys Phe Ser Arg Ile
1430 1435 1440
Leu Thr Pro Lys Glu Tyr Leu Gln Arg Gln Lys His Lys Glu Ala
1445 1450 1455
Leu Ser Asn Lys Ala Ser Lys Lys Ile Cys Val Lys Asn Val Pro
1460 1465 1470
Cys Asp Ser Glu His Met Arg Pro Ser Lys Leu Ala Val Gln Val
1475 1480 1485
Glu Ser Cys Gly Lys Ser Asn Glu Lys His Ser Ser Gly Val Gln
1490 1495 1500
Thr Ser Lys Glu Ser Leu Asn Gly Leu Thr Ser His Gly Lys Asn
1505 1510 1515
Leu Lys Ile His His Ser Gln Glu Ser Lys Thr Tyr Asn Ile Leu
1520 1525 1530
Arg Asn Val Lys Glu Lys Val Gly Gly Lys Gln Pro Asp Lys Ile
1535 1540 1545
Trp Ile Asp Lys Thr Lys Leu Asp Lys Leu Thr Asn Ile Ser Asn
1550 1555 1560
Glu Ala Gln Phe Ser Gln Met Pro Pro Gln Val Lys Asp Gln Lys
1565 1570 1575
Lys Leu Tyr Leu Asn Arg Val Gly Phe Lys Cys Thr Glu Arg Glu
1580 1585 1590
Ser Ile Ser Leu Thr Lys Leu Glu Ser Ser Pro Arg Lys Leu His
1595 1600 1605
Lys Asp Lys Arg Gln Glu Asn Lys His Lys Thr Phe Leu Pro Val
1610 1615 1620
Lys Gly Asn Thr Glu Lys Ser Asn Met Leu Glu Phe Lys Leu Cys
1625 1630 1635
Pro Asp Ile Leu Leu Lys Asn Thr Asn Ser Val Glu Glu Arg Lys
1640 1645 1650
Asp Val Lys Pro His Pro Arg Lys Glu Gln Ala Pro Leu Gln Val
1655 1660 1665
Ser Gly Ile Lys Ser Thr Lys Glu Asp Trp Leu Lys Phe Val Ala
1670 1675 1680
Thr Lys Lys Arg Thr Gln Lys Asp Ser Gln Glu Arg Asp Asn Val
1685 1690 1695
Asn Ser Arg Leu Ser Lys Arg Ser Phe Ser Ala Asp Gly Phe Glu
1700 1705 1710
Met Leu Gln Asn Pro Val Lys Asp Ser Lys Glu Met Phe Gln Thr
1715 1720 1725
Tyr Lys Gln Met Tyr Leu Glu Lys Arg Ser Arg Ser Leu Gly Ser
1730 1735 1740
Ser Pro Val Lys
1745
<210> 25
<211> 4644
<212> DNA
<213> 灰仓鼠
<400> 25
atgaattgga atgcaaaacc agagaatgct gccccaaacc caccatattc taaaagccag 60
tcgtctcttt tgcagcagtt tttaatgcct tccacaactt ctcaaagttc tttcagctgt 120
ctcccacata accaagaagc atgcatatat cccactaatt caaattcagt ttcacagcca 180
cttctgaacg tcaggagttt cataaatcct ccgatctctg tttctaatgt gcataatagg 240
acagttgtgg cctcacagac ctcagtagaa agagtcacat atacaaatgt taaaggagcc 300
caacaaccaa accacaattt gcaaacagtg tcttctggag ttgtgcaaaa tgcctggatg 360
aattcaacaa tgaggaattt tatgccttct cttacagagg caaccatatc tcataaacct 420
gatggtgggc ctagtatgcc atatatgcat gcaccacaga gtcatcttgt cacatcagac 480
acctactctg tgcaactaca gatgactcct tcaaactctg taagaggccc tgtaacttac 540
caaggaaatt atcaaggaaa tccgggactt aaccactcga tggcaggtga gcttggctgg 600
gtacaatgtg catccagtga acttacttat ccagattaca gaccacctcc aaagcaatat 660
ccttatttac cacaaagctt tgtgcaagac acttctgttc agaaacaaaa ctttgtgtca 720
tctacatcat tacaagttaa aaataatcag cttccacctt ctacacagac cttaccatca 780
aagcgccctg tacctgtgtc gtcatatcag tatgctgcag aaaccagcaa aagactccct 840
cccccccctt acagctgtag atatggaagc caacatgtgc aaaattctca gtctgtttct 900
agacacttgc ctgtggaagt tcctcagagt tcagaaatgc actcgtctga aaaaaagaaa 960
gatgcttaca aagtctttca acagcagtgg cagagcacta gtaaaaatgt cagtacaata 1020
ggaaaattct gtgagttgaa aattaataca aaacagtctt acaatgactc tgctggctct 1080
tctggggatg gtgttcatac tcttgttcaa aataatcaag aagaaagaaa gtattcttat 1140
aatccaagta caaatcaaat actagacaca aatgtcacaa aagaaaagct ggtgagggat 1200
attaaatcac tagtagaaat taaaaagaaa ttttcagaac ttgcaagaaa aattaaaatc 1260
aacaaaaagc ttttgatggc agctggttgc agtaaaacag ctaatacttc ttatactgaa 1320
ccaactcggc attctgaatt ttcagcaaaa gaaatgtctg ctaaaaggga caatcagtgc 1380
tccatggaat tgctagcaac atgcctttct ctttggaaaa accaacctcc aaaaaccaca 1440
gaagaaaatg tttcaaaacc tttagaagaa aaacaatata atgcatcaag aactagtaca 1500
acagcggttg gcccttcaaa tcccatgaat gaagttcatg tgaagaattt ttgttcaggt 1560
gttagaaatt ctcagaaaat aaccacctcg tcacaaacag tcttgtcagt tctcacacca 1620
gtttacgatt cttcagatgt agctgttgga aaaggaacag agcttcagat tgctgtggtt 1680
tcacctttaa ttctttcaga tgtcagtact gtacctggga aagagttagc tcctgaagtc 1740
gtatctgaaa ctgtatatcc agttgtgaag gaaggcagtg tttgtagctt acaaaaccag 1800
caggcagaaa atgcaacagt aactgctggt ttgccctttg atgttatcag agcagtagca 1860
agtgctactg tatcagctga gctatcactg cctgggcata aagaaaagca gcacaaacca 1920
acacagagtg atctagacat cgctgatggc agcctaggga aacactctcc ccagggtgct 1980
gaagctttgc ctaaccctag ggacagcacc attgtgagtg ggcctatatt acagattgaa 2040
agtatctgtt ctcttgcaga aggtgatgta tcttacaatt cccaaatagc agagatattc 2100
aactctgtac aaaatgagcc ccagaaacct tcacctgatc agcaagtaat taatagtcaa 2160
caagaagaac aagtagataa ggttgctgaa aataaagact taagttttct gaaagacaag 2220
tgtatgcagt gtacagatgt tcctcatgaa gtcactgaac agccagagcc actgcagcct 2280
ttagagacaa catctgatga gtatgttgaa gcaaacggag aaatcctaga ggaaagcagt 2340
aaggagaatc ctggtgaaaa agagatgact aaggacatat tgtgttcacc agctgctgtt 2400
cagcaagatc ctcaacctca ggaaattgac acagccagca gtaagtcagg acacagtttt 2460
tctacagtaa atgagattaa tgatgaaaat gaacctgtct catacctaca tgaccagctg 2520
ttagaacttc taaaagagtt tccttatggc attgaaacta ttgccaggcc tgaagtttat 2580
gtgggccaac aaaagacaca tgaaatctta gaaaatcaaa ctggtagtaa aactggtaat 2640
gtgtctgggg ataacacaga ccaaataaaa attacagtat taaactcaga acaaatcaaa 2700
gaattatttc ctgaagagga tcagccatgt gatgtagaca aattggcaga acccgagaat 2760
acaaaaatca ttgcagaagt aaagagcctg tgtgattcac aggtccccag agaagaaagt 2820
cacaaccctg gaatgttgga tctggagaaa gataaaatcc attgctgtgc cttgggctgg 2880
ctctcaatgg tttatgaagg tgtgccacag tgtcagtgca gttccatgga agagaaagag 2940
aaagaccagt gttctttgga aatctctaat tgcaaacaag gagagcaggc ctgcaatagt 3000
ggaatcacta tttttgaaat taatcctatt tctaataact caaaaagtcc tctgatccaa 3060
gaatctgaga aaggccattt ttctgacata catggtgaaa agataaaaac atctgaaaca 3120
aaaaacagca gctcaccaag ggtagaacag gaattaactg gtcatttttc aatgaaatgt 3180
taccagaaag ataaatctac aacaaaacag gatagctcac tgaaaacaga gcaaaaaata 3240
aaaaatcttt cttctaaatg tgacaaacca aatcccttaa aaagcagtaa aataccaacc 3300
cctgaaacat ttaatgtggt aacttccaac tctgataaaa atatgccagc attttctaaa 3360
caagattctc agggaagcct gcagaagaaa cacctattcc aagactcaga tccagtaaaa 3420
ggacatgtat ggcttttgcc aaataaagat ccacgcagga ggaatacctt tttagtacag 3480
tcagtatcac cagaaaagaa aaagttaaaa ttcaaatcgg gtagctccaa actgaaatat 3540
tttgaaaaaa gaaaaatgga ccatttgctt atctcagatg tggaaataaa aaagaagaaa 3600
tacgaaaaac aagagcagaa caaaaatgct ggaggcacac tcaaattatg tagtactctg 3660
actgaaccaa atgaaagagc ctgtgctaaa gaaaagatag tgacaaattc tgagccctca 3720
gactcaaagg gaagctcctc taagagtact agagttataa ctgtgcagga atatttacag 3780
cggaaaaaag acaaacatgt aataggaaat aatgcctcca aaaacatctg tgtagaaaat 3840
gtgccatgtg actctgaacc catgaagtcc agtaaacatt ctgcatcacc tagtttggga 3900
aaattaattg agggccaggg tgtcagtgca gagactttaa aagaagtaga acataattcc 3960
accagccatg gcaaaaatct caagacccac cgttctgagg agactaggcc atacagtgtg 4020
tcaaatagta aagagaaatt ttataggaca catccagaca aatcttacat tgataaagct 4080
aaattagaaa gattgaccag tatgagtagt aagtccagcc agctccaggt aaaggaaaaa 4140
aggaaacagt acctgaatcg agttgcattc aaatgcacag aacaggaaag catttgtctc 4200
accaaattgg acagtgcatc caagaagctt agtaaagaga aagaaaagag tacagcatgt 4260
gcacccatga caaaagacta cacacacaag cccatgttgg agtttaaatt atgtccagat 4320
gtgctattga agaatacaag ctccattgac aaaggggatg atccaaggcc tgggcctgag 4380
aaggagcgag cacctgtgca agtttcagga ataaaaacta caaaagaaga ctggttaaaa 4440
tgtatcccaa caaggacaaa gatgcccgaa tcaagtgaac aaacagatcg ggctgactca 4500
agactctcta agagaagctt cagtgcagat gaatttgaaa ctctacaaaa cccagtaaaa 4560
gactcaaatg tcatgttccg gactttcaaa aagatgtacc tggagaagag aagcaggagc 4620
ctggggagca gtccagtgaa gtag 4644
<210> 26
<211> 112
<212> DNA
<213> 灰仓鼠
<400> 26
tgctgggatt taaggggaaa gctttaataa aagatcttta tttgtatttc ttgcagattt 60
gtgacattca aaaccacaga ctatgcaaca ctactactaa accaggtcaa at 112
<210> 27
<211> 36
<212> DNA
<213> 灰仓鼠
<400> 27
cttcgggata gagtggtttt gcttttacca ccagga 36
<210> 28
<211> 221
<212> PRT
<213> 智人
<400> 28
Met Phe Gly Phe His Lys Pro Lys Met Tyr Arg Ser Ile Glu Gly Cys
1 5 10 15
Cys Ile Cys Arg Ala Lys Ser Ser Ser Ser Arg Phe Thr Asp Ser Lys
20 25 30
Arg Tyr Glu Lys Asp Phe Gln Ser Cys Phe Gly Leu His Glu Thr Arg
35 40 45
Ser Gly Asp Ile Cys Asn Ala Cys Val Leu Leu Val Lys Arg Trp Lys
50 55 60
Lys Leu Pro Ala Gly Ser Lys Lys Asn Trp Asn His Val Val Asp Ala
65 70 75 80
Arg Ala Gly Pro Ser Leu Lys Thr Thr Leu Lys Pro Lys Lys Val Lys
85 90 95
Thr Leu Ser Gly Asn Arg Ile Lys Ser Asn Gln Ile Ser Lys Leu Gln
100 105 110
Lys Glu Phe Lys Arg His Asn Ser Asp Ala His Ser Thr Thr Ser Ser
115 120 125
Ala Ser Pro Ala Gln Ser Pro Cys Tyr Ser Asn Gln Ser Asp Asp Gly
130 135 140
Ser Asp Thr Glu Met Ala Ser Gly Ser Asn Arg Thr Pro Val Phe Ser
145 150 155 160
Phe Leu Asp Leu Thr Tyr Trp Lys Arg Gln Lys Ile Cys Cys Gly Ile
165 170 175
Ile Tyr Lys Gly Arg Phe Gly Glu Val Leu Ile Asp Thr His Leu Phe
180 185 190
Lys Pro Cys Cys Ser Asn Lys Lys Ala Ala Ala Glu Lys Pro Glu Glu
195 200 205
Gln Gly Pro Glu Pro Leu Pro Ile Ser Thr Gln Glu Trp
210 215 220
<210> 29
<211> 221
<212> PRT
<213> 小家鼠
<400> 29
Met Phe Gly Phe His Lys Pro Lys Met Tyr Arg Ser Ile Glu Gly Cys
1 5 10 15
Cys Ile Cys Arg Ala Lys Ser Ser Ser Ser Arg Phe Thr Asp Ser Lys
20 25 30
Arg Tyr Glu Lys Asp Phe Gln Ser Cys Phe Gly Leu His Glu Thr Arg
35 40 45
Ser Gly Asp Ile Cys Asn Ala Cys Val Leu Leu Val Lys Arg Trp Lys
50 55 60
Lys Leu Pro Ala Gly Ser Lys Lys Asn Trp Asn His Val Val Asp Ala
65 70 75 80
Arg Ala Gly Pro Ser Leu Lys Thr Thr Leu Lys Pro Lys Lys Val Lys
85 90 95
Thr Leu Ser Gly Asn Arg Met Lys Ser Asn Gln Ile Ser Lys Leu Gln
100 105 110
Lys Glu Phe Lys Arg His Asn Ser Asp Ala His Ser Thr Thr Ser Ser
115 120 125
Ala Ser Pro Ala Gln Ser Pro Cys Tyr Ser Asn Gln Ser Asp Glu Gly
130 135 140
Ser Asp Thr Glu Met Ala Ser Ser Ser Asn Arg Thr Pro Val Phe Ser
145 150 155 160
Phe Leu Asp Leu Thr Tyr Trp Lys Arg Gln Lys Ile Cys Cys Gly Ile
165 170 175
Ile Tyr Lys Gly Arg Phe Gly Glu Val Leu Ile Asp Thr His Leu Phe
180 185 190
Lys Pro Cys Cys Ser Ser Lys Lys Ala Ala Ala Glu Lys Pro Glu Glu
195 200 205
Gln Gly Pro Ala Pro Leu Pro Ile Ser Thr Gln Glu Trp
210 215 220
<210> 30
<211> 221
<212> PRT
<213> 灰仓鼠
<400> 30
Met Phe Gly Phe His Lys Pro Lys Met Tyr Arg Ser Ile Glu Gly Cys
1 5 10 15
Cys Ile Cys Arg Ala Lys Ser Ser Ser Ser Arg Phe Thr Asp Ser Lys
20 25 30
Arg Tyr Glu Lys Asp Phe Gln Ser Cys Phe Gly Leu His Glu Thr Arg
35 40 45
Ser Gly Asp Ile Cys Asn Ala Cys Val Leu Leu Val Lys Arg Trp Lys
50 55 60
Lys Leu Pro Ala Gly Ser Lys Lys Asn Trp Asn His Val Ser His Ser
65 70 75 80
Arg Ala Gly Pro Ser Leu Lys Thr Thr Leu Lys Pro Lys Lys Val Lys
85 90 95
Thr Leu Ser Gly Asn Arg Met Lys Ser Asn Gln Ile Ser Lys Leu Gln
100 105 110
Lys Glu Phe Lys Arg His Asn Ser Asp Ala His Ser Thr Thr Ser Ser
115 120 125
Ala Ser Pro Ala Gln Ser Pro Cys Tyr Ser Asn Gln Ser Asp Asp Gly
130 135 140
Ser Asp Thr Glu Met Ala Ser Ser Ser Asn Arg Thr Pro Val Phe Ser
145 150 155 160
Phe Leu Asp Leu Thr Tyr Trp Lys Arg Gln Lys Ile Cys Cys Gly Ile
165 170 175
Ile Tyr Lys Gly Arg Phe Gly Glu Val Leu Ile Asp Thr His Leu Phe
180 185 190
Lys Pro Cys Cys Ser Ser Lys Lys Ala Ala Pro Glu Lys Pro Glu Glu
195 200 205
Gln Gly Pro Ala Pro Leu Pro Ile Ser Thr Gln Glu Trp
210 215 220
<210> 31
<211> 1236
<212> DNA
<213> 灰仓鼠
<400> 31
ctcagaagaa aagatgtttg gttttcacaa gccaaagatg taccgaagta tagagggctg 60
ctgtatctgc agagccaagt cctccagctc tcggttcacg gacagtaaac gttatgaaaa 120
ggacttccag agctgttttg ggttgcacga gactcgctca ggagatatct gcaatgcctg 180
tgtgctgctt gtgaaaagat ggaagaagtt gccagcagga tcaaaaaaaa actggaatca 240
tgtgtcacac tcaagggcag gacccagtct aaagacaaca ttgaaaccaa agaaagtgaa 300
aactctatct ggaaacagga tgaaaagcaa ccagatcagt aaactgcaga aggagtttaa 360
acgccacaac tctgatgctc acagtaccac ctcaagtgcc tcgccagccc agtctccctg 420
ctacagtaac cagtcagatg atggctcaga cacagagatg gcttccagct ctaacagaac 480
tccagttttt tccttcttag atcttaccta ctggaaaaga cagaaaatat gttgtgggat 540
catctataag ggccgttttg gggaagtcct catcgacacg catctcttca agccttgctg 600
cagcagtaag aaggcagctc ctgagaagcc tgaggaacag ggaccagcgc ctctgcccat 660
ctctactcag gagtggtgac tgaggttcat gcagaaggga acaaagagca atttaaactt 720
tgaaaagacc acaaagcaac agactgaccc tcctattttt aacttggata cctgctattc 780
tgccaaaaga cattttctag aatagttttt aatgggttac ccatcccccc atccaacaaa 840
ctcggaagcc agttctagct tactgcaaga agagagtgta cataatattt aatatgctga 900
gtatttcata ggaaggctga atgctgctgt aaagtgctct ttaagtcttt tttttttttt 960
aatcccctct aatgaatgag attagggggg tttcagggga cagagatggg atttgttgtg 1020
tgataaacca tatgtagttt agtctttctg tggagaggca gtggttgggg cattttaaat 1080
ggctggctac acttgttttc ccctcatggt aatttgtcat aactcagtag cacgacctgc 1140
ccctagaagt agttaaagat ttttaaatgc taaggcgttg ccaaggttct gatgattcag 1200
acctgtacta ctgattatta agcaggacag actgag 1236
<210> 32
<211> 855
<212> PRT
<213> 灰仓鼠
<400> 32
Met Gly Ser Asn Arg Gly Arg Lys Ala Gly Gly Ser Ser Lys Asp Phe
1 5 10 15
Gly Ala Arg Leu Lys Tyr Ser Ser Gly Leu Glu Asn Met Asn Gly Phe
20 25 30
Glu Glu Gly Val Glu Phe Leu Pro Val Asn Asn Ala Lys Lys Val Glu
35 40 45
Lys Arg Gly Pro Arg Arg Cys Val Val Leu Val Val Leu Leu Val Ser
50 55 60
Phe Leu Phe Leu Ser Leu Val Ala Gly Phe Leu Val Trp His Phe Leu
65 70 75 80
Tyr Ser Asn Val Arg Ile Gln Lys Val Phe Asn Gly His Leu Arg Val
85 90 95
Thr Asn Glu Asn Phe Leu Asp Ala Tyr Glu Asn Ser Asn Ser Thr Glu
100 105 110
Phe Lys Asp Leu Ala Asn Gln Val Lys Glu Ala Leu Lys Leu Leu Tyr
115 120 125
Ser Glu Val Pro Val Leu Gly Pro Tyr His Lys Arg Ser Ala Val Thr
130 135 140
Ala Phe Ser Glu Gly Ser Val Ile Ala Tyr Tyr Trp Ser Glu Phe Ser
145 150 155 160
Ile Pro Pro His Leu Ala Glu Glu Val Asp Arg Ala Met Ala Val Glu
165 170 175
Arg Val Val Thr Leu Pro Pro Arg Ala Arg Ala Leu Lys Ser Phe Val
180 185 190
Leu Thr Ser Val Val Ala Phe Pro Thr Asp Pro Arg Leu Leu Gly Arg
195 200 205
Thr Gln Asp Asn Ser Cys Asn Phe Ala Leu His Ala His Gly Gly Glu
210 215 220
Val Met Arg Phe Thr Thr Pro Gly Phe Pro Asn Ser Pro Tyr Pro Ala
225 230 235 240
His Ala Arg Cys Gln Trp Val Leu Arg Gly Asp Ala Asp Ser Val Leu
245 250 255
Ser Leu Thr Phe Arg Ser Phe Asp Val Ala Pro Cys Asp Glu Leu Gly
260 265 270
Asn Asp Leu Val Thr Val Tyr Asp Thr Leu Ser Pro Met Glu Pro His
275 280 285
Ala Val Val Arg Leu Cys Gly Thr Tyr Pro Pro Ser Tyr Asn Leu Thr
290 295 300
Phe Leu Ser Ser Gln Asn Val Phe Leu Val Thr Leu Ile Thr Asn Thr
305 310 315 320
Asp Arg Arg His Pro Gly Phe Glu Ala Thr Phe Phe Gln Leu Pro Lys
325 330 335
Met Arg Ser Cys Gly Gly Ser Leu Ser Glu Ala Gln Gly Leu Phe Ser
340 345 350
Ser Pro Tyr Tyr Pro Gly His Tyr Pro Pro Asn Ile Asp Cys Thr Trp
355 360 365
Asn Ile Lys Val Pro Asn Asn Arg Asn Val Lys Val Arg Phe Lys Leu
370 375 380
Phe Tyr Leu Val Asp Pro Asn Ile Pro Leu Gly Thr Cys Pro Lys Asp
385 390 395 400
Tyr Val Glu Ile Asn Gly Glu Arg Tyr Cys Gly Glu Lys Ser Gln Phe
405 410 415
Val Val Ser Ser Asn Ser Ser Lys Ile Thr Val Arg Phe His Ser Asp
420 425 430
His Ser Tyr Thr Asp Thr Gly Phe Leu Ala Glu Tyr Leu Ser Tyr Asp
435 440 445
Ser Asn Asp Pro Cys Pro Gly Met Phe Met Cys Asn Thr Gly Arg Cys
450 455 460
Ile Arg Lys Asp Leu Arg Cys Asp Gly Trp Ala Asp Cys Pro Asp Tyr
465 470 475 480
Ser Asp Glu His Phe Cys Arg Cys Asn Thr Thr His Gln Phe Met Cys
485 490 495
Lys Asn Lys Leu Cys Lys Pro Leu Phe Trp Val Cys Asp Asn Ile Asn
500 505 510
Asp Cys Gly Asp Gly Ser Asp Glu Glu Gly Cys Ser Cys Pro Ala Glu
515 520 525
Thr Phe Lys Cys Ser Asn Gly Lys Cys Leu Pro Gln Ser Gln Lys Cys
530 535 540
Asp Gly Lys Asp Asn Cys Gly Asp Gly Ser Asp Glu Ala Ser Cys Asp
545 550 555 560
Arg Val Lys Val Val Ser Cys Thr Lys Tyr Thr Tyr Arg Cys His Asn
565 570 575
Gly Leu Cys Leu Ser Lys Gly Asn Pro Glu Cys Asp Gly Lys Lys Asp
580 585 590
Cys Ser Asp Gly Ser Asp Glu Lys Asn Cys Asp Cys Gly Leu Arg Ser
595 600 605
Phe Thr Lys Gln Ala Arg Val Val Gly Gly Thr Asn Ala Asp Glu Gly
610 615 620
Glu Trp Pro Trp Gln Val Ser Leu His Ala Leu Gly Gln Gly His Leu
625 630 635 640
Cys Gly Ala Ser Leu Ile Ser Pro Asn Trp Leu Val Ser Ala Ala His
645 650 655
Cys Phe Met Asp Asp Arg Asn Phe Lys Tyr Ser Asp His Thr Lys Trp
660 665 670
Thr Ala Phe Leu Gly Leu Leu Asp Gln Ser Lys Arg Ser Ser Thr Gly
675 680 685
Val Gln Glu His Lys Leu Lys Arg Ile Ile Thr His Pro Leu Phe Asn
690 695 700
Glu Ile Thr Phe Asp Tyr Asp Ile Ala Leu Leu Glu Leu Glu Lys Pro
705 710 715 720
Ala Glu Tyr Ser Thr Val Val Arg Pro Ile Cys Leu Pro Asp Thr Thr
725 730 735
His Val Phe Pro Ala Gly Lys Ala Ile Trp Val Thr Gly Trp Gly His
740 745 750
Thr Gln Glu Gly Gly Thr Gly Ala Leu Ile Leu Gln Lys Gly Glu Ile
755 760 765
Arg Val Ile Asn Gln Thr Thr Cys Glu Asp Leu Met Pro Gln Gln Ile
770 775 780
Thr Pro Arg Met Met Cys Val Gly Phe Leu Ser Gly Gly Val Asp Ser
785 790 795 800
Cys Gln Gly Asp Ser Gly Gly Pro Leu Ser Ser Val Glu Thr Glu Gly
805 810 815
Arg Ile Phe Gln Ala Gly Val Val Ser Trp Gly Glu Gly Cys Ala Gln
820 825 830
Arg Asn Lys Pro Gly Val Tyr Thr Arg Leu Pro Ala Val Arg Asp Trp
835 840 845
Ile Lys Glu Gln Thr Gly Val
850 855
<210> 33
<211> 855
<212> PRT
<213> 智人
<400> 33
Met Gly Ser Asp Arg Ala Arg Lys Gly Gly Gly Gly Pro Lys Asp Phe
1 5 10 15
Gly Ala Gly Leu Lys Tyr Asn Ser Arg His Glu Lys Val Asn Gly Leu
20 25 30
Glu Glu Gly Val Glu Phe Leu Pro Val Asn Asn Val Lys Lys Val Glu
35 40 45
Lys His Gly Pro Gly Arg Trp Val Val Leu Ala Ala Val Leu Ile Gly
50 55 60
Leu Leu Leu Val Leu Leu Gly Ile Gly Phe Leu Val Trp His Leu Gln
65 70 75 80
Tyr Arg Asp Val Arg Val Gln Lys Val Phe Asn Gly Tyr Met Arg Ile
85 90 95
Thr Asn Glu Asn Phe Val Asp Ala Tyr Glu Asn Ser Asn Ser Thr Glu
100 105 110
Phe Val Ser Leu Ala Ser Lys Val Lys Asp Ala Leu Lys Leu Leu Tyr
115 120 125
Ser Gly Val Pro Phe Leu Gly Pro Tyr His Lys Glu Ser Ala Val Thr
130 135 140
Ala Phe Ser Glu Gly Ser Val Ile Ala Tyr Tyr Trp Ser Glu Phe Ser
145 150 155 160
Ile Pro Gln His Leu Val Glu Glu Ala Glu Arg Val Met Ala Glu Glu
165 170 175
Arg Val Val Met Leu Pro Pro Arg Ala Arg Ser Leu Lys Ser Phe Val
180 185 190
Val Thr Ser Val Val Ala Phe Pro Thr Asp Ser Lys Thr Val Gln Arg
195 200 205
Thr Gln Asp Asn Ser Cys Ser Phe Gly Leu His Ala Arg Gly Val Glu
210 215 220
Leu Met Arg Phe Thr Thr Pro Gly Phe Pro Asp Ser Pro Tyr Pro Ala
225 230 235 240
His Ala Arg Cys Gln Trp Ala Leu Arg Gly Asp Ala Asp Ser Val Leu
245 250 255
Ser Leu Thr Phe Arg Ser Phe Asp Leu Ala Ser Cys Asp Glu Arg Gly
260 265 270
Ser Asp Leu Val Thr Val Tyr Asn Thr Leu Ser Pro Met Glu Pro His
275 280 285
Ala Leu Val Gln Leu Cys Gly Thr Tyr Pro Pro Ser Tyr Asn Leu Thr
290 295 300
Phe His Ser Ser Gln Asn Val Leu Leu Ile Thr Leu Ile Thr Asn Thr
305 310 315 320
Glu Arg Arg His Pro Gly Phe Glu Ala Thr Phe Phe Gln Leu Pro Arg
325 330 335
Met Ser Ser Cys Gly Gly Arg Leu Arg Lys Ala Gln Gly Thr Phe Asn
340 345 350
Ser Pro Tyr Tyr Pro Gly His Tyr Pro Pro Asn Ile Asp Cys Thr Trp
355 360 365
Asn Ile Glu Val Pro Asn Asn Gln His Val Lys Val Arg Phe Lys Phe
370 375 380
Phe Tyr Leu Leu Glu Pro Gly Val Pro Ala Gly Thr Cys Pro Lys Asp
385 390 395 400
Tyr Val Glu Ile Asn Gly Glu Lys Tyr Cys Gly Glu Arg Ser Gln Phe
405 410 415
Val Val Thr Ser Asn Ser Asn Lys Ile Thr Val Arg Phe His Ser Asp
420 425 430
Gln Ser Tyr Thr Asp Thr Gly Phe Leu Ala Glu Tyr Leu Ser Tyr Asp
435 440 445
Ser Ser Asp Pro Cys Pro Gly Gln Phe Thr Cys Arg Thr Gly Arg Cys
450 455 460
Ile Arg Lys Glu Leu Arg Cys Asp Gly Trp Ala Asp Cys Thr Asp His
465 470 475 480
Ser Asp Glu Leu Asn Cys Ser Cys Asp Ala Gly His Gln Phe Thr Cys
485 490 495
Lys Asn Lys Phe Cys Lys Pro Leu Phe Trp Val Cys Asp Ser Val Asn
500 505 510
Asp Cys Gly Asp Asn Ser Asp Glu Gln Gly Cys Ser Cys Pro Ala Gln
515 520 525
Thr Phe Arg Cys Ser Asn Gly Lys Cys Leu Ser Lys Ser Gln Gln Cys
530 535 540
Asn Gly Lys Asp Asp Cys Gly Asp Gly Ser Asp Glu Ala Ser Cys Pro
545 550 555 560
Lys Val Asn Val Val Thr Cys Thr Lys His Thr Tyr Arg Cys Leu Asn
565 570 575
Gly Leu Cys Leu Ser Lys Gly Asn Pro Glu Cys Asp Gly Lys Glu Asp
580 585 590
Cys Ser Asp Gly Ser Asp Glu Lys Asp Cys Asp Cys Gly Leu Arg Ser
595 600 605
Phe Thr Arg Gln Ala Arg Val Val Gly Gly Thr Asp Ala Asp Glu Gly
610 615 620
Glu Trp Pro Trp Gln Val Ser Leu His Ala Leu Gly Gln Gly His Ile
625 630 635 640
Cys Gly Ala Ser Leu Ile Ser Pro Asn Trp Leu Val Ser Ala Ala His
645 650 655
Cys Tyr Ile Asp Asp Arg Gly Phe Arg Tyr Ser Asp Pro Thr Gln Trp
660 665 670
Thr Ala Phe Leu Gly Leu His Asp Gln Ser Gln Arg Ser Ala Pro Gly
675 680 685
Val Gln Glu Arg Arg Leu Lys Arg Ile Ile Ser His Pro Phe Phe Asn
690 695 700
Asp Phe Thr Phe Asp Tyr Asp Ile Ala Leu Leu Glu Leu Glu Lys Pro
705 710 715 720
Ala Glu Tyr Ser Ser Met Val Arg Pro Ile Cys Leu Pro Asp Ala Ser
725 730 735
His Val Phe Pro Ala Gly Lys Ala Ile Trp Val Thr Gly Trp Gly His
740 745 750
Thr Gln Tyr Gly Gly Thr Gly Ala Leu Ile Leu Gln Lys Gly Glu Ile
755 760 765
Arg Val Ile Asn Gln Thr Thr Cys Glu Asn Leu Leu Pro Gln Gln Ile
770 775 780
Thr Pro Arg Met Met Cys Val Gly Phe Leu Ser Gly Gly Val Asp Ser
785 790 795 800
Cys Gln Gly Asp Ser Gly Gly Pro Leu Ser Ser Val Glu Ala Asp Gly
805 810 815
Arg Ile Phe Gln Ala Gly Val Val Ser Trp Gly Asp Gly Cys Ala Gln
820 825 830
Arg Asn Lys Pro Gly Val Tyr Thr Arg Leu Pro Leu Phe Arg Asp Trp
835 840 845
Ile Lys Glu Asn Thr Gly Val
850 855
<210> 34
<211> 855
<212> PRT
<213> 小家鼠
<400> 34
Met Gly Ser Asn Arg Gly Arg Lys Ala Gly Gly Gly Ser Gln Asp Phe
1 5 10 15
Gly Ala Gly Leu Lys Tyr Asn Ser Arg Leu Glu Asn Met Asn Gly Phe
20 25 30
Glu Glu Gly Val Glu Phe Leu Pro Ala Asn Asn Ala Lys Lys Val Glu
35 40 45
Lys Arg Gly Pro Arg Arg Trp Val Val Leu Val Ala Val Leu Phe Ser
50 55 60
Phe Leu Leu Leu Ser Leu Met Ala Gly Leu Leu Val Trp His Phe His
65 70 75 80
Tyr Arg Asn Val Arg Val Gln Lys Val Phe Asn Gly His Leu Arg Ile
85 90 95
Thr Asn Glu Ile Phe Leu Asp Ala Tyr Glu Asn Ser Thr Ser Thr Glu
100 105 110
Phe Ile Ser Leu Ala Ser Gln Val Lys Glu Ala Leu Lys Leu Leu Tyr
115 120 125
Asn Glu Val Pro Val Leu Gly Pro Tyr His Lys Lys Ser Ala Val Thr
130 135 140
Ala Phe Ser Glu Gly Ser Val Ile Ala Tyr Tyr Trp Ser Glu Phe Ser
145 150 155 160
Ile Pro Pro His Leu Ala Glu Glu Val Asp Arg Ala Met Ala Val Glu
165 170 175
Arg Val Val Thr Leu Pro Pro Arg Ala Arg Ala Leu Lys Ser Phe Val
180 185 190
Leu Thr Ser Val Val Ala Phe Pro Ile Asp Pro Arg Met Leu Gln Arg
195 200 205
Thr Gln Asp Asn Ser Cys Ser Phe Ala Leu His Ala His Gly Ala Ala
210 215 220
Val Thr Arg Phe Thr Thr Pro Gly Phe Pro Asn Ser Pro Tyr Pro Ala
225 230 235 240
His Ala Arg Cys Gln Trp Val Leu Arg Gly Asp Ala Asp Ser Val Leu
245 250 255
Ser Leu Thr Phe Arg Ser Phe Asp Val Ala Pro Cys Asp Glu His Gly
260 265 270
Ser Asp Leu Val Thr Val Tyr Asp Ser Leu Ser Pro Met Glu Pro His
275 280 285
Ala Val Val Arg Leu Cys Gly Thr Phe Ser Pro Ser Tyr Asn Leu Thr
290 295 300
Phe Leu Ser Ser Gln Asn Val Phe Leu Val Thr Leu Ile Thr Asn Thr
305 310 315 320
Asp Arg Arg His Pro Gly Phe Glu Ala Thr Phe Phe Gln Leu Pro Lys
325 330 335
Met Ser Ser Cys Gly Gly Phe Leu Ser Asp Thr Gln Gly Thr Phe Ser
340 345 350
Ser Pro Tyr Tyr Pro Gly His Tyr Pro Pro Asn Ile Asn Cys Thr Trp
355 360 365
Asn Ile Lys Val Pro Asn Asn Arg Asn Val Lys Val Arg Phe Lys Leu
370 375 380
Phe Tyr Leu Val Asp Pro Asn Val Pro Val Gly Ser Cys Thr Lys Asp
385 390 395 400
Tyr Val Glu Ile Asn Gly Glu Lys Tyr Cys Gly Glu Arg Ser Gln Phe
405 410 415
Val Val Ser Ser Asn Ser Ser Lys Ile Thr Val His Phe His Ser Asp
420 425 430
His Ser Tyr Thr Asp Thr Gly Phe Leu Ala Glu Tyr Leu Ser Tyr Asp
435 440 445
Ser Asn Asp Pro Cys Pro Gly Met Phe Met Cys Lys Thr Gly Arg Cys
450 455 460
Ile Arg Lys Glu Leu Arg Cys Asp Gly Trp Ala Asp Cys Pro Asp Tyr
465 470 475 480
Ser Asp Glu Arg Tyr Cys Arg Cys Asn Ala Thr His Gln Phe Thr Cys
485 490 495
Lys Asn Gln Phe Cys Lys Pro Leu Phe Trp Val Cys Asp Ser Val Asn
500 505 510
Asp Cys Gly Asp Gly Ser Asp Glu Glu Gly Cys Ser Cys Pro Ala Gly
515 520 525
Ser Phe Lys Cys Ser Asn Gly Lys Cys Leu Pro Gln Ser Gln Lys Cys
530 535 540
Asn Gly Lys Asp Asn Cys Gly Asp Gly Ser Asp Glu Ala Ser Cys Asp
545 550 555 560
Ser Val Asn Val Val Ser Cys Thr Lys Tyr Thr Tyr Arg Cys Gln Asn
565 570 575
Gly Leu Cys Leu Ser Lys Gly Asn Pro Glu Cys Asp Gly Lys Thr Asp
580 585 590
Cys Ser Asp Gly Ser Asp Glu Lys Asn Cys Asp Cys Gly Leu Arg Ser
595 600 605
Phe Thr Lys Gln Ala Arg Val Val Gly Gly Thr Asn Ala Asp Glu Gly
610 615 620
Glu Trp Pro Trp Gln Val Ser Leu His Ala Leu Gly Gln Gly His Leu
625 630 635 640
Cys Gly Ala Ser Leu Ile Ser Pro Asp Trp Leu Val Ser Ala Ala His
645 650 655
Cys Phe Gln Asp Asp Lys Asn Phe Lys Tyr Ser Asp Tyr Thr Met Trp
660 665 670
Thr Ala Phe Leu Gly Leu Leu Asp Gln Ser Lys Arg Ser Ala Ser Gly
675 680 685
Val Gln Glu Leu Lys Leu Lys Arg Ile Ile Thr His Pro Ser Phe Asn
690 695 700
Asp Phe Thr Phe Asp Tyr Asp Ile Ala Leu Leu Glu Leu Glu Lys Ser
705 710 715 720
Val Glu Tyr Ser Thr Val Val Arg Pro Ile Cys Leu Pro Asp Ala Thr
725 730 735
His Val Phe Pro Ala Gly Lys Ala Ile Trp Val Thr Gly Trp Gly His
740 745 750
Thr Lys Glu Gly Gly Thr Gly Ala Leu Ile Leu Gln Lys Gly Glu Ile
755 760 765
Arg Val Ile Asn Gln Thr Thr Cys Glu Asp Leu Met Pro Gln Gln Ile
770 775 780
Thr Pro Arg Met Met Cys Val Gly Phe Leu Ser Gly Gly Val Asp Ser
785 790 795 800
Cys Gln Gly Asp Ser Gly Gly Pro Leu Ser Ser Ala Glu Lys Asp Gly
805 810 815
Arg Met Phe Gln Ala Gly Val Val Ser Trp Gly Glu Gly Cys Ala Gln
820 825 830
Arg Asn Lys Pro Gly Val Tyr Thr Arg Leu Pro Val Val Arg Asp Trp
835 840 845
Ile Lys Glu His Thr Gly Val
850 855
<210> 35
<211> 1521
<212> PRT
<213> 小家鼠
<400> 35
Met Asn Trp Asn Thr Lys Gln Glu Asn Val Pro Lys Pro Pro Pro Tyr
1 5 10 15
Ser Lys Thr Gln Ser Ser Ile Leu Gln His Phe Leu Met Thr Ser Thr
20 25 30
Thr Ser Gln Ser Ser Phe Asn Tyr Ser Pro His Asn Gln Glu Ala Ser
35 40 45
Gln Thr Ser Phe Asn Tyr Ser Leu His Asn Gln Glu Ala Cys Met Tyr
50 55 60
Ser Gly Asn Ser Asn Ser Val Ser Gln Pro Leu Leu Ser Gly Arg Asn
65 70 75 80
Tyr Ile Thr Pro Gln Thr Gln Ile Ser Val Ser Asn Met Pro Thr Arg
85 90 95
Thr Ile Val Ala Ser Gln Ser Ser Met Glu Arg Val Val Ser Thr Asn
100 105 110
Gly Lys Gly Pro Gln Gln Pro Asn His Asn Leu Gln Thr Val Ser Ser
115 120 125
Gly Ile Met Gln Asn Val Trp Leu Pro Ser His Thr Glu Ala Thr Ile
130 135 140
Ser His Asn Pro Asp Gly Gly Thr Asn Met Pro Tyr Met His Pro Pro
145 150 155 160
Gln Asn Gln Leu Val Thr Ser Asp Thr Tyr Ser Met Gln Leu Gln Met
165 170 175
Ala Pro Leu His Ser Gly Lys Val Pro Met Thr His Gln Gly Ser Gln
180 185 190
Gly Leu Asn His Phe Ile Pro Asp Gln Leu Val Asp Trp Thr Gln Tyr
195 200 205
Thr Ser Asn Glu Leu Ser Tyr Pro Glu Tyr Arg Pro Pro Pro Lys Gln
210 215 220
Tyr Ser Tyr Ile Leu Pro Ala Thr Thr Ser Leu Gln Val Lys Asn Asn
225 230 235 240
Gln Leu Pro Thr Tyr Thr Gln Ser Leu Gln Ser Lys His Ser Val Pro
245 250 255
Leu Ser Ser His Gln Tyr Ala Ala Glu Ala Ser Lys Arg Leu Ser Ala
260 265 270
Leu Pro Tyr Ser Cys Arg Tyr Glu Asn Gln His Val Gln Asn Ala Gln
275 280 285
Pro Val Ser Lys His Leu Pro Met Glu Val Pro Gln Ser Ser Glu Val
290 295 300
His Ser Ser Glu Lys Lys Lys Asp Thr Tyr Arg Gly Phe Lys Gln Gln
305 310 315 320
Trp Gln Asn Pro Asn Glu Lys Val Ser Ile Gly Gln Phe Ser Glu Val
325 330 335
Lys Ile Asn Ile Lys Gln Pro Tyr Ser Glu Ser Val Arg Pro Ser Gly
340 345 350
Asp Gly Val Gln Ala Leu Val Gln Asn Asn Gln Glu Lys Arg Lys Tyr
355 360 365
Thr Tyr Asn Pro Asn Thr Asn Gln Val Ile Asp Thr Asn Ala Thr Lys
370 375 380
Glu Lys Leu Val Arg Asp Ile Lys Ser Leu Val Glu Ile Lys Lys Lys
385 390 395 400
Phe Ser Glu Leu Ala Arg Lys Ile Lys Ile Asn Lys Ser Leu Leu Met
405 410 415
Ala Ala Gly Cys Ser Lys Thr Ala Asn Thr Ser Tyr Thr Glu Pro Ile
420 425 430
Gln His Ser Glu Phe Ser Ala Lys Glu Met Ser Ala Lys Asn Gly Asn
435 440 445
Asp Cys Ser Met Glu Leu Leu Ala Thr Cys Leu Ser Leu Trp Lys Asn
450 455 460
Gln Pro Ser Lys Thr Thr Glu Glu Asn Val Pro Lys Pro Leu Glu Glu
465 470 475 480
Lys Gln Cys Asn Thr Ser Arg Ile Ser Thr Thr Val Val Gly Ser Ala
485 490 495
Asn Pro Thr Asn Glu Val His Val Lys Ser Leu Cys Ser Gly Val Gly
500 505 510
Asn Ser Gln Lys Met Met Ser Ser Ser Gln Thr Val Leu Pro Val Leu
515 520 525
Ile Pro Ser Cys Glu Ser Ser Gly Val Ala Val Gly Lys Gly Thr Glu
530 535 540
Leu Gln Ile Ala Val Val Ser Pro Leu Val Leu Ser Asp Thr Asn Thr
545 550 555 560
Leu Pro Gly Lys Asp Ser Val Pro Glu Val Leu Pro Glu Thr Leu Tyr
565 570 575
Pro Val Val Lys Glu Gly Ser Val Cys Ser Leu Gln Thr Gln Pro Thr
580 585 590
Glu Thr Val Ala Leu Pro Phe Asp Val Ile Gly Ala Val Ala Ser Asn
595 600 605
Asn Ile Ser Ala Glu Ile Pro Leu Pro Val Asp Lys Glu Lys Gln His
610 615 620
Lys Pro Ile Gln Gly Asp Pro Asp Ile Ala Asp Ser Ser Leu Gly Lys
625 630 635 640
His Ser Pro Leu Gly Thr Glu Val Leu Pro Lys Pro Met Asp Ser Thr
645 650 655
Ile Val Ser Gly Pro Met Leu Gln Ile Glu Ser Ile Cys Ser Leu Ala
660 665 670
Glu Gly Asp Val Ser Tyr Asn Ser Gln Ile Ala Glu Ile Phe Asn Ser
675 680 685
Val Gln Thr Glu Pro Gln Lys Pro Ser Pro Asn Gln Val Ile Asp Ser
690 695 700
Gln Gln Glu Gln Val Tyr Asp Thr Thr Glu Asn Lys Asp Phe Ser Leu
705 710 715 720
Gln Lys Asp Lys Cys Val Gln Cys Thr Asp Val Pro His Glu Val Pro
725 730 735
Glu Gln Pro Glu Pro Leu Gln Pro Glu Glu Pro Ala Ser Ser Glu Tyr
740 745 750
Val Glu Ala Asn Arg Glu Ala Thr Glu Glu Ser Cys Arg Glu Tyr Thr
755 760 765
Gly Arg Lys Glu Ser Thr Ala Lys Asp Val Cys Leu Pro Ala Ala Ile
770 775 780
Gln Gln Asp Pro His Pro Arg Glu Thr Asp Met Phe Ser Lys Ser Asp
785 790 795 800
His Ser Leu Pro Ala Ile Asn Glu Ile Asn Asp Glu Ser Glu Pro Ile
805 810 815
Ser Tyr Leu His Asp Gln Leu Ser Glu Leu Leu Lys Glu Phe Pro Tyr
820 825 830
Gly Ile Glu Thr Phe Asn Arg His Glu Val Ser Leu Asp Gln Gln Lys
835 840 845
Thr His Lys Ile Val Glu Asn Gln Thr Gly Gly Lys Thr Ser Asn Val
850 855 860
Ser Gly Asp Ser Thr Asp Gln Ile Lys Ile Thr Val Leu Asn Ser Glu
865 870 875 880
Gln Ile Lys Glu Leu Phe Pro Glu Asp Asp Gln Pro Cys Asp Lys Leu
885 890 895
Ala Glu Pro Glu Asn Lys Glu Ile Val Ala Glu Val Lys Ser Pro Cys
900 905 910
Asp Ser Gln Ile Pro Arg Glu Glu Ser His Asp Leu Gly Met Leu Asp
915 920 925
Pro Glu Lys Asp Lys Ile His Cys Cys Ala Leu Gly Trp Leu Ser Met
930 935 940
Val Tyr Glu Gly Val Pro Gln Cys His Cys Ser Ser Thr Glu Lys Lys
945 950 955 960
Glu Lys Asp Gln Cys Leu Asp Ile Asn Ser Ser Lys Gln Gly Glu Gln
965 970 975
Pro Cys Asn Ser Gly Ile Thr Ile Phe Glu Ile Asn Pro Val Ser Asn
980 985 990
Asn Ser Lys Thr Pro Leu Thr Gln Ala Thr Glu Glu Gly His Phe Ser
995 1000 1005
Ala Val His Gly Glu Lys Thr Lys Ala Ser Lys Thr Lys Asp Asn
1010 1015 1020
Arg Glu Gly Gln Glu Leu Ala Cys His Phe Ser Ala Lys Cys Tyr
1025 1030 1035
Lys Lys Asp Lys Lys Gly Asn Phe Lys Ile Arg His Asp Thr Ser
1040 1045 1050
Leu Lys Met Glu Gln Lys Leu Lys Asn Ile Ser Ser Lys Cys Asp
1055 1060 1065
Ile Pro Asn Pro Ser Lys Cys Asn Lys Ile Ala Ala Pro Glu Ile
1070 1075 1080
Leu His Val Thr Thr Ser Asn Ser Ala Lys Asn Met Pro Phe Ser
1085 1090 1095
Lys Gln Ala Ser Gln Glu Ser Leu Gln Lys Lys His Thr Ser Gln
1100 1105 1110
Asp Leu Gly Pro Val Lys Ala Pro Ile Glu Leu Ser Ser Asn Thr
1115 1120 1125
Asp Pro Cys Arg Ser Asn Thr Ser Ser Val Gln Ser Val Ser Pro
1130 1135 1140
Glu Lys Lys Lys Leu Lys Phe Lys Ala Gly Gly Ser Arg Leu Lys
1145 1150 1155
Tyr Phe Glu Lys Arg Lys Thr Asp His Val Ile Ile Pro Asp Val
1160 1165 1170
Glu Ile Lys Lys Lys Lys Tyr Glu Lys Gln Glu Gln Asn Lys Asn
1175 1180 1185
Ala Gly Asp Thr Leu Lys Leu Cys Ser Ile Leu Thr Glu Ser Asn
1190 1195 1200
Glu Arg Ala Ser Val Gln Glu Lys Thr Val Pro Ser Pro Glu Ser
1205 1210 1215
Ser Asp Pro Lys Gly Ser Ser Ser Lys Ser Thr Arg Val Ile Thr
1220 1225 1230
Val Gln Glu Tyr Leu Gln Arg Gln Lys Asp Lys Gln Ile Thr Gly
1235 1240 1245
Asn Asn Ala Ser Arg Asn Ile Cys Val Glu Thr Val Leu Cys Asp
1250 1255 1260
Ser Gly His Thr Lys Thr Ser Lys His Ser Ala Ala Val Ser Trp
1265 1270 1275
Gly Lys Leu Val Glu Gly Gln Ser Ile Ser Ala Glu Thr Ala Lys
1280 1285 1290
Glu Leu Glu His Asn Ser Ser Ser His Gly Lys Asp Phe Lys Ile
1295 1300 1305
His His Ser Glu Ala Ser Arg Thr His Ser Val Ser Asn Asn Asn
1310 1315 1320
Lys Gly Lys Phe Asp Gly Lys Gln Pro Asp Lys Met Phe Lys Asn
1325 1330 1335
Lys Thr Ser Met Asn Asn Glu Ser Asn Gln Met Pro Leu Gln Val
1340 1345 1350
Lys Glu Gln Arg Lys Gln Tyr Leu Asn Arg Val Ala Phe Lys Cys
1355 1360 1365
Thr Glu Arg Glu Ser Ile Cys Leu Thr Lys Leu Asp Ser Ala Ser
1370 1375 1380
Lys Lys Leu Ser Ile Glu Lys Lys Ser Gly Glu Tyr Thr Ser Lys
1385 1390 1395
Thr Lys Asp Thr Asp Lys Pro Ser Met Leu Glu Phe Lys Leu Cys
1400 1405 1410
Pro Asp Val Leu Leu Lys Asn Thr Ser Thr Val Asp Lys Gln Asp
1415 1420 1425
Cys Pro Gly Pro Gly Pro Glu Lys Glu Gln Ala Pro Val Gln Val
1430 1435 1440
Ser Gly Ile Lys Ser Thr Lys Glu Asp Trp Leu Lys Cys Ile Pro
1445 1450 1455
Thr Arg Thr Lys Met Pro Glu Ser Ser Gln Arg Asp Ser Ala Asp
1460 1465 1470
Ser Arg Leu Ser Lys Arg Ser Leu Ser Ala Asp Glu Phe Glu Ile
1475 1480 1485
Leu Gln Asn Pro Val Lys Glu Ser Asn Ile Met Phe Arg Thr Tyr
1490 1495 1500
Lys Lys Met Tyr Leu Glu Lys Arg Ser Arg Ser Leu Gly Ser Ser
1505 1510 1515
Pro Val Lys
1520
<210> 36
<211> 6
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成的6xHis标签"
<400> 36
His His His His His His
1 5
<210> 37
<211> 8
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<400> 37
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 38
<211> 9
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<400> 38
Ala Trp Arg His Pro Gln Phe Gly Gly
1 5
<210> 39
<211> 8
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<400> 39
Trp Ser His Pro Gln Phe Glu Lys
1 5

Claims (14)

1.重组CHO细胞,其包含:
一种或多种编码巨细胞病毒(CMV)五聚体复合物的多核苷酸序列,其中所述五聚体复合物由以下组成:gH或其五聚体复合物形成片段、gL或其五聚体复合物形成片段、pUL128或其五聚体复合物形成片段、pUL130或其五聚体复合物形成片段和pUL131或其五聚体复合物形成片段,
其中所述一种或多种多核苷酸序列整合至所述CHO细胞的基因组DNA中;并且
其中与野生型细胞相比,在所述CHO细胞中C12orf35蛋白的表达水平或活性降低。
2.权利要求1的CHO细胞,其中所述CHO细胞是CHO-K1细胞、CHO-DUXB11、CHO-DG44细胞或CHO-S细胞。
3.权利要求1或2的CHO细胞,其中所述C12orf35的基因的基因组序列的至少一个拷贝,或所述C12orf35基因的编码序列的至少50%被缺失。
4.权利要求3的CHO细胞,其中所述缺失的序列包含CHO细胞的染色体8的端粒区域的一部分。
5.权利要求1或2的CHO细胞,其中与对照相比,在所述细胞中FAM60A蛋白的表达水平或活性降低。
6.权利要求5的CHO细胞,其中所述FAM60A的基因的基因组序列的至少一个拷贝,或所述FAM60A基因的编码序列的至少50%被缺失。
7.权利要求1或2的CHO细胞,其中与对照相比,在所述细胞中基质蛋白酶的表达水平或活性降低。
8.权利要求7的CHO细胞,其中所述细胞包含在所述基质蛋白酶基因的外显子2中的突变。
9.权利要求1或2的CHO细胞,其中所述gH的复合物形成片段包含全长gH蛋白的胞外结构域。
10.权利要求1或2的CHO细胞,其中所述五聚体复合物是可溶的。
11.权利要求1或2的CHO细胞,其中所述五聚体复合物从所述CHO细胞分泌。
12.大规模培养物,其包含权利要求1-11中任一项的CHO细胞,其中所述培养物大小为至少20升。
13.权利要求12的大规模培养物,其中CMV五聚体复合物的产率为至少0.05 g/L。
14.产生巨细胞病毒(CMV)五聚体复合物的方法,其中所述五聚体复合物由以下组成:gH或其五聚体复合物形成片段、gL或其五聚体复合物形成片段、pUL128或其五聚体复合物形成片段、pUL130或其五聚体复合物形成片段和pUL131或其五聚体复合物形成片段,所述方法包括:(i) 在合适的条件下培养的权利要求1-11中任一项的CHO细胞,从而表达所述五聚体复合物;和(ii) 从(i)的培养物收获所述五聚体复合物。
CN201580059495.8A 2014-10-31 2015-10-29 表达巨细胞病毒抗原的哺乳动物细胞 Active CN107075486B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14191385.5A EP3015475A1 (en) 2014-10-31 2014-10-31 Mammalian cells expressing cytomegalovirus antigens
EP14191385.5 2014-10-31
PCT/IB2015/058349 WO2016067239A1 (en) 2014-10-31 2015-10-29 Mammalian cells expressing cytomegalovirus antigens

Publications (2)

Publication Number Publication Date
CN107075486A CN107075486A (zh) 2017-08-18
CN107075486B true CN107075486B (zh) 2021-06-22

Family

ID=51844603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580059495.8A Active CN107075486B (zh) 2014-10-31 2015-10-29 表达巨细胞病毒抗原的哺乳动物细胞

Country Status (19)

Country Link
US (1) US10414802B2 (zh)
EP (2) EP3015475A1 (zh)
JP (1) JP6688297B2 (zh)
CN (1) CN107075486B (zh)
AR (1) AR102464A1 (zh)
BE (3) BE1023364B1 (zh)
BR (1) BR112017008827A2 (zh)
CA (1) CA2964859C (zh)
CY (1) CY1123405T1 (zh)
DK (1) DK3212660T3 (zh)
ES (1) ES2799735T3 (zh)
HR (1) HRP20200932T1 (zh)
HU (1) HUE049356T2 (zh)
LT (1) LT3212660T (zh)
MX (1) MX2017005661A (zh)
PL (1) PL3212660T3 (zh)
PT (1) PT3212660T (zh)
SI (1) SI3212660T1 (zh)
WO (1) WO2016067239A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2513768B (en) 2012-07-06 2015-04-15 Novartis Ag Complexes of cytomegalovirus proteins and nucleic acids encoding such proteins
WO2015048744A2 (en) 2013-09-30 2015-04-02 Moderna Therapeutics, Inc. Polynucleotides encoding immune modulating polypeptides
AU2015254913B2 (en) * 2014-04-29 2018-05-17 Novartis Ag Novel vertebrate cells and methods for recombinantly expressing a polypeptide of interest
EP3048114A1 (en) 2015-01-22 2016-07-27 Novartis AG Cytomegalovirus antigens and uses thereof
WO2017070613A1 (en) 2015-10-22 2017-04-27 Modernatx, Inc. Human cytomegalovirus vaccine
JP6980780B2 (ja) 2016-10-21 2021-12-15 モデルナティーエックス, インコーポレイテッド ヒトサイトメガロウイルスワクチン
CN107723276B (zh) * 2017-11-02 2021-08-13 上海交通大学 一种稳定高表达目标产物的细胞株的构建方法和试剂盒
EP3787676A2 (en) 2018-05-04 2021-03-10 Spybiotech Limited Vaccine composition
CA3121915A1 (en) * 2018-12-10 2020-06-18 Km Biologics Co., Ltd. Vaccine for preventing or treating congenital infection with cytomegalovirus
US11406703B2 (en) 2020-08-25 2022-08-09 Modernatx, Inc. Human cytomegalovirus vaccine
CA3199996A1 (en) * 2020-12-02 2022-06-09 Pirada ALLEN Multicistronic rna vaccines and uses thereof

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US5168062A (en) 1985-01-30 1992-12-01 University Of Iowa Research Foundation Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence
GB8717430D0 (en) 1987-07-23 1987-08-26 Celltech Ltd Recombinant dna product
DK0747485T3 (da) 1989-11-06 1999-08-16 Cell Genesys Inc Fremstilling af proteiner ved anvendelse af homolog rekombination
US5589392A (en) 1991-01-14 1996-12-31 Stratagene Nucleic acid construct encoding a nuclear transport peptide operatively linked to an inducible promoter
US7704510B2 (en) 2006-06-07 2010-04-27 The Trustees Of Princeton University Cytomegalovirus surface protein complex for use in vaccines and as a drug target
US20140030292A1 (en) * 2010-10-11 2014-01-30 Novartis Ag Antigen delivery platforms
GB2513768B (en) 2012-07-06 2015-04-15 Novartis Ag Complexes of cytomegalovirus proteins and nucleic acids encoding such proteins
CN104884467A (zh) 2012-12-18 2015-09-02 诺华股份有限公司 在遗传修饰的哺乳动物细胞中生产治疗性蛋白质
US11203631B2 (en) 2013-12-20 2021-12-21 Novartis Ag Eukaryotic cells and methods for recombinantly expressing a product of interest
EP3083677B1 (en) 2013-12-20 2019-08-28 Novartis AG Novel eukaryotic cells and methods for recombinantly expressing a product of interest
WO2015165480A1 (en) 2014-04-30 2015-11-05 Institute For Research In Biomedicine Human cytomegalovirus vaccine compositions and method of producing the same
AU2015254913B2 (en) 2014-04-29 2018-05-17 Novartis Ag Novel vertebrate cells and methods for recombinantly expressing a polypeptide of interest

Also Published As

Publication number Publication date
EP3212660A1 (en) 2017-09-06
BR112017008827A2 (pt) 2018-03-27
LT3212660T (lt) 2020-07-10
BE1023841A1 (fr) 2017-08-09
PT3212660T (pt) 2020-06-23
CY1123405T1 (el) 2021-12-31
BE1023840A1 (fr) 2017-08-09
SI3212660T1 (sl) 2020-07-31
CA2964859C (en) 2023-04-04
PL3212660T3 (pl) 2020-10-05
CA2964859A1 (en) 2016-05-06
DK3212660T3 (da) 2020-06-15
AR102464A1 (es) 2017-03-01
BE1023364B1 (fr) 2017-02-20
ES2799735T3 (es) 2020-12-21
US20170362278A1 (en) 2017-12-21
HUE049356T2 (hu) 2020-09-28
HRP20200932T1 (hr) 2020-09-18
JP2017534283A (ja) 2017-11-24
WO2016067239A1 (en) 2016-05-06
BE1023841B1 (fr) 2017-08-10
EP3015475A1 (en) 2016-05-04
BE1023364A1 (fr) 2017-02-20
EP3212660B1 (en) 2020-03-25
BE1023840B1 (fr) 2017-08-10
JP6688297B2 (ja) 2020-04-28
CN107075486A (zh) 2017-08-18
US10414802B2 (en) 2019-09-17
MX2017005661A (es) 2017-06-26

Similar Documents

Publication Publication Date Title
CN107075486B (zh) 表达巨细胞病毒抗原的哺乳动物细胞
JP4138479B2 (ja) 動物細胞に使用する発現ベクター
CA2945965C (en) Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr)
KR101494072B1 (ko) 변이된 글루타민 합성효소 유전자를 포함하는 벡터 및 이를 이용한 목적 단백질의 생산방법
CA2024607C (en) Recombinant dna method and host cells
US20230323419A1 (en) Vertebrate cells and methods for recombinantly expressing a polypeptide of interest
WO2002048379A1 (en) Expression vector for animal cell containing nuclear matrix attachment region fo interferon beta
CN117015600A (zh) 高活性转座子和转座酶
EP2209891A1 (en) Improving the secretory capacity in host cells
US20210108188A1 (en) Non-covalent systems and methods for dna editing
CN110229849B (zh) 时空调控型uPA基因表达非病毒载体及其制备方法和应用
US20030236396A1 (en) Secretory signal sequences and uses thereof
EP2633058B1 (en) Method for mass production of factor vii/viia
Zucchetti Transposon based technology in DHFR knockout CHO cell line improves generation of AMH high producing clones for industrial applications
WO2001064947A1 (fr) Substrat utile pour detecter la protease du virus de l&#39;herpes et procede de production de ce dernier
WO2003104400A2 (en) Secretory signal sequences and uses thereof
WO2003064644A1 (fr) Methode de retroposition de sequences line
JP2001128680A (ja) ヒト脱ユビキチン化酵素

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant