CN101595220B - 减毒重组体新城疫病毒及包含该病毒的疫苗 - Google Patents

减毒重组体新城疫病毒及包含该病毒的疫苗 Download PDF

Info

Publication number
CN101595220B
CN101595220B CN2006800564366A CN200680056436A CN101595220B CN 101595220 B CN101595220 B CN 101595220B CN 2006800564366 A CN2006800564366 A CN 2006800564366A CN 200680056436 A CN200680056436 A CN 200680056436A CN 101595220 B CN101595220 B CN 101595220B
Authority
CN
China
Prior art keywords
leu
ser
ala
thr
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006800564366A
Other languages
English (en)
Other versions
CN101595220A (zh
Inventor
赵瑄熙
权赫俊
金善中
金兑恩
安映珍
高米订
金日焕
朴昤浩
金采铉
韩长赫
金泰焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BIOPOA株式会社
Biopoa Inc
KBNP Inc
Original Assignee
Biopoa Inc
KBNP Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biopoa Inc, KBNP Inc filed Critical Biopoa Inc
Publication of CN101595220A publication Critical patent/CN101595220A/zh
Application granted granted Critical
Publication of CN101595220B publication Critical patent/CN101595220B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/155Paramyxoviridae, e.g. parainfluenza virus
    • A61K39/17Newcastle disease virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5252Virus inactivated (killed)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5254Virus avirulent or attenuated
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/54Medicinal preparations containing antigens or antibodies characterised by the route of administration
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/55Medicinal preparations containing antigens or antibodies characterised by the host/recipient, e.g. newborn with maternal antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/55Medicinal preparations containing antigens or antibodies characterised by the host/recipient, e.g. newborn with maternal antibodies
    • A61K2039/552Veterinary vaccine
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55566Emulsions, e.g. Freund's adjuvant, MF59
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18111Avulavirus, e.g. Newcastle disease virus
    • C12N2760/18122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18111Avulavirus, e.g. Newcastle disease virus
    • C12N2760/18134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18111Avulavirus, e.g. Newcastle disease virus
    • C12N2760/18141Use of virus, viral particle or viral elements as a vector
    • C12N2760/18143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18111Avulavirus, e.g. Newcastle disease virus
    • C12N2760/18161Methods of inactivation or attenuation
    • C12N2760/18162Methods of inactivation or attenuation by genetic engineering

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Pulmonology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本发明涉及一种用于转录新城疫病毒(NDV)基因组的重组体载体、一个由该载体制备的具有致病性NDV表面抗原的减毒重组体NDV毒株、一种使用该载体制备具有低致病性和抗新城疫病(ND)的高防护效力的重组体NDV的方法以及一种抗包含所述重组体NDV的ND的疫苗。

Description

减毒重组体新城疫病毒及包含该病毒的疫苗
相关专利申请的交叉引用 
本申请要求以2006年9月26日提交给韩国知识产权局(KoreanIntellectual Property Office)的编号为10-2006-0093620的韩国专利申请为优先权基础,该申请通过引用的方式全文纳入本文。 
技术领域
本发明涉及一种用于转录新城疫病毒(NDV)基因组的重组体载体、一种由该载体制备的具有致病性NDV表面抗原的减毒重组体NDV毒株、一种使用该载体制备的具有低致病性和抗新城疫病(ND)的高防护效力的重组体NDV的方法以及一种包含该重组体NDV的ND疫苗。 
背景技术
新城疫病(ND)——已知为最重要的国际上已知的家畜疾病类之一——是一种急性热呼吸系统疾病,并且按照韩国规定(by law in Korea)为第一级传染病。如果未免疫家禽的感染,则死亡率为100%。由于新城疫病毒(NDV)在韩国普遍存在,预计消灭该疾病会有许多困难。同时,因为多种新城疫病毒广泛分布在东南亚、中国和中国台湾,而这些地区都与韩国贸易活跃,并且因为这些病毒是潜在的十分危险的因素,所以存在开发亚洲型新城疫病疫苗的迫切需求。 
新城疫病毒(NDV)是一种单链RNA病毒,属于禽副粘病毒(Avulavirus)属。新城疫病毒的包膜包括使该病毒与宿主结合的血凝素-神经氨酸酶(HN)蛋白,以及使包膜与宿主细胞融合的融合(F)蛋白。F和HN蛋白均是糖蛋白并均分布于所述病毒包膜的表面上。 
F蛋白属于I型膜糖蛋白组并形成一个三聚体结构(三聚体)。F蛋白形成为一种无活性前体形式(F0),并且在该前体F0分子经过高尔基膜 时被分成二硫键连接的亚基F1和F2。该过程在所述F1亚基的氨基末端暴露一个疏水结构域,其中该结构域在成熟蛋白的生物活性中发挥重要功能。被称为融合肽的该疏水结构域在副粘病毒的F蛋白中是高保守的,并且直接参与膜融合。副粘病毒的F蛋白包括共有的结构特征,例如七肽重复区域以及能够形成α螺旋结构的两个区域。所述重复区域的最长七肽重复区域A与F1的N末端疏水融合肽相邻,七肽重复区域B由一系列在每7个残基处高度保守的亮氨酸或异亮氨酸(Isoleusine)构成。 
HN蛋白属于II型膜糖蛋白,并且在病毒包膜的表面上形成四聚体,以穿透进入细胞膜中(Gorman et al.,1988;Ng et al.,1989)。HN蛋白通过结合于糖缀合物的唾液酸而使病毒体定位于宿主细胞表面上。HN蛋白可分成三个区域:跨膜结构域、茎结构域和球状结构域。抗原受体的结合位点和神经氨酸酶的活性位点都位于所述球状结构域上。融合诱导的活性位点位于所述茎结构域上,并与F蛋白相互作用(Sergei et al.,1993)。预计的茎区结构为α螺旋结构,具有包括七肽重复区域A(在第74-88位)和七肽重复区域B(在第96-110位)的两个七肽重复区域。还已经报道了,任何破坏该结构的突变都会降低受体结合和神经氨酸酶活性。而且还已经报道了,能够破坏结构的突变可引起受体结合和神经氨酸酶活性的降低。 
根据鸡中的疾病水平,将NDV分类为下列致病类型(致病型):1)呈现呼吸系统和神经学症状及高死亡率的嗜内脏速发型(高致病)NDV;主要呈现消化器官病变和高死亡率的嗜神经速发型NDV;2)呈现低死亡率但在一些家禽中呈现急性呼吸系统和神经学症状的中发型NDV;3)引起轻微疾病或无症状的呼吸系统感染的缓发型(lentogenic)(低致病)NDV和非致病NDV。 
为了使NDV感染细胞,前体糖蛋白Fo需要被切割成F1和F2。这种翻译后切割受到宿主细胞的蛋白酶的干涉。如果不发生该切割,就可形成无感染性的病毒体,并且病毒复制无法进行。强毒病毒的Fo蛋白可被多种蛋白酶切割,而低毒性病毒的Fo蛋白易感性受到限制——具体而言,低毒性病毒仅可在特定的宿主细胞类型中生长。 
鉴于缓发型病毒仅在包括呼吸系统器官或消化道的具有胰蛋白酶样酶的区域中繁殖,因为强毒病毒在包括组织和器官的多个区域中繁殖,所以所述强毒病毒会引起胎儿的全身感染。 
通过对Fo前体的氨基酸检查可鉴定,缓发型病毒具有一个连接F2和F1亚基的单精氨酸(R),而毒性超过中发型的毒株具有其他碱性氨基酸,在切割区上形成两个对例如K/R-X-K/R-R-F。而且,致病性超过中发型的毒株的F2链通常由苯丙氨酸残基表示,而致病性低于缓发型的病毒毒株的F2链通常由亮氨酸表示。 
在美国,灭活疫苗已被用于鉴定新城疫病(Hofstad,1953)。利用这样的观察结果,即部分的地方性动物病病毒仅产生轻度疾病,第一次开发了中发型活疫苗Roakin,随后开发了更温和的Hitchner B1和LaSota(Goldhaft,1980)。 
活疫苗的主要优点之一是能够通过使用低成本的批量施用方法给予。一种常规的施用方法为通过饮用水给予所述疫苗。 
通过喷雾和气雾剂批量施用活疫苗是非常有用的,这是因为可以更快地将该疫苗给予许多鸟,从而对其进行预防接种。对产生颗粒的喷嘴进行控制以获得严格的颗粒大小是重要的。 
最近使用的活疫苗出现了一些问题。因为这些疫苗仍具有小的致病性,所以偶尔会出现疫苗的副作用。而且,因为继承自母系的抗体可中和活疫苗病毒,所以成功的免疫性形成会受干扰。因此,使用非常温和的病毒来进行初次疫苗接种是重要的,并且需要一种能够克服母体抗体的疫苗。 
灭活疫苗通常产生自与合适的补充物混合的传染性尿囊液,并经福尔马林或β丙内酯处理以灭活病毒。将疫苗给予至肌肉或通过皮下注射给予,但是其缺点在于较高的生产和施用成本。 
最近,据推测,国内外产生的速发型NDV的抗原性与疫苗株相比表现出了许多差异。由于此原因,可以推断可能会发现与疫苗株的基因型有许多差异的野生毒株,并且如果疫苗的抗体滴度不足,它能防止死亡,但无法阻止产蛋率的降低等。 
根据基于F基因的部分序列的系统发生分析,将NDV的基因型分类成基因I型-基因IX型。在分子流行病学上,分布在韩国的大多数新城疫病毒属于基因VI型和基因VII型。对于基因VI型的情况,纵使由于密集疫苗接种可能出现变体毒株,其分离也相对低于基因VII型,并且在2000年后基本上仅分离到基因VII型,所以考虑了它消失的可能性。因此,测序分析(通过基因组项目确定最近的NDV基因序列)和通过与世 界范围内的登记在GenBank中的NDV进行基因比较的分子流行病学研究对于开发一种优化的疫苗株是很重要的。 
现在,常规使用的新城疫病(ND)的灭活油佐剂疫苗是通过使用例如克隆30(Clone 30)或LaSota毒株的缓发型NDV产生的,并且由于安全性的问题,禁止使用速发型NDV生产灭活疫苗是。因此,对于用于制备更安全的、更经济的且其中抗原类似于野毒株(field strain)的ND疫苗的技术,有不断增加的需求,并且使用反求遗传学技术来开发疫苗是最接近这种需求的技术。 
负链RNA病毒的反求遗传学技术作为一种技术被提出,用于从病毒基因组拯救传染性的病毒(美国专利5,166,057)。纵使最初提出该技术是为了操纵流感病毒基因组,但可将其成功地施用于多种分节段的和不分节段的负链RNA病毒,包括狂犬病病毒、呼吸道合胞病毒和仙台病毒。 
本发明使用如上文所述的反求遗传学技术开发了一种新型疫苗株;其结果是,发展了生产具有类似于野毒株的抗原性的安全ND疫苗株的技术。 
发明内容
本发明的一个目标是,提供一种用于转录NDV基因组的重组体载体。 
本发明的另一个目标是,提供一个具有致病性NDV表面抗原的减毒重组体NDV毒株。 
本发明的另一个目标是,提供一种使用该载体制备具有低致病性和抗新城疫病(ND)的高防护效力的重组体NDV的方法。 
本发明的另一个目标是,提供一种使用反求遗传学技术对NDV进行减毒以使其免疫原性增加并使其致病性降低的方法。 
本发明的又一个目标是,提供一种包含所述重组体NDV的抗ND疫苗。 
附图说明
图1示出了使用国内的速发型新城疫病毒KBNP-4152的基因组RNA进行的RT-PCT结果以及扩增的RT-PCR产物的名称和位置。 
图2示出了将图1的扩增产物克隆至TA-克隆载体中的结果。 
图3示出了在重组体NDV基因组两端插入限制性内切酶识别位点BsmB I和Bsa I的过程。 
图4示出了用于制备亲本载体的连接子序列、用于克隆NDV的基因组DNA的pTMH以及用于制备该连接子的引物序列。 
图5示出了制备pTMH载体的过程的原理图。 
图6示出了pTMH载体中主要位点的核苷酸序列。 
图7示出了pTMH载体的全核苷酸序列。 
图8示出了使用La Sota毒株的基因组RNA进行的RT-PCT结果以及扩增的RT-PCR产物的名称和位置。 
图9示出了将图8的扩增产物克隆至TA-克隆载体中的结果。 
图10示出了将NDV基因组DNA克隆至pBR322载体中的过程。 
图11示出了制备用于表达NDV的NP、P和L基因的质粒的过程,其中A的第2、3和4道分别表示NP、P和L基因的RT-PCR结果,A的第6、7和8道分别表示插入至载体中的基因,该载体是在将所述NP、P和L基因插入至pcDNA3.1/TOPO载体后经NotI处理的;B表示概要显示其的原理图。 
图12示出了使用PTDS技术的F和HN基因的半合成过程。 
图13示出了所述F蛋白的费林蛋白酶(furin)-样酶识别位点的核苷酸序列,以及所述重组体病毒的M和F基因的连接子。 
图14示出了一个基因的合成过程,其中使用PTDS和定向诱变在所述F蛋白的费林蛋白酶-样酶识别位点中引起一个突变。 
图15示出了用于将KBNP-4152的HN(1-566)基因与La Sota毒株的HN末端(567-577)基因连接的引物的设计图。 
图16示出了制备重组体病毒KBNP-C4152R2L的过程。 
图17示出了制备具有多个费林蛋白酶-样酶识别位点的重组体病毒的克隆的过程。 
图18为通过使用平板血凝试验显示接种于鸡胚中的KBNP-C4152R2L是否增加的结果。 
图19示出了用来确证KBNP-C4152R2L的致病性的致病型特异的RT-PCR结果。 
图20为KBNP-4152和KBNP-C4152R2L的F蛋白的费林蛋白酶-样酶识别位点的核苷酸序列的比较结果。 
图21示出了通过使用杂交血凝抑制试验得出的La Sota毒株、KBNP-4152和KBNP-C4152R2L之间的抗原关系。 
图22示出了KBNP-C4152R2L的细胞病变效应(cytophatic effect)。 
图23示出了克隆至pTMH载体的KBNP-C4251R2L基因组和该基因组的核苷酸序列的图谱。 
具体实施方式
本发明涉及一种用于转录新城疫病毒(NDV)基因组的重组体载体、一种由该载体制备的具有致病性新城疫病毒表面抗原的减毒重组体NDV毒株、一种使用该载体制备的具有低致病性和抗新城疫病(ND)的高预防效力的重组体NDV的方法以及一种包含该重组体新城疫病毒的抗新城疫病疫苗。 
本发明的F基因(384bp;定位于F基因的第1-384位核苷酸)和采用邻接法(neighbor-joining method)对新城病毒的进行系统发生分析的结果如下: 
Figure G2006800564366D00071
显示于图中的毒株仅为实例,现有的多种新城疫病毒毒株被分类为基因I-IX型。而且,已经多次报道通过分子流行病学分析来对新城病毒进行分类。因此,按照上文所述将毒株分类至各基因型是本发明所属技术领域技术人员可以很容易理解的。在该说明书中,其毒株分类的标准引用了以下参考文献中记载的内容,这些参考文献通过引用的方式全文纳入本文: 
1.Kwon H.J.PhD Thesis.Seoul National University,2000. 
2.Lomniczi B.,Wehmann E.,Herczeg J.,Ballagi-Pord□ny A.,Kaleta E.F.,Werner O.,Meulemans G.,Jorgensen P.H.,Mante A.P.,Gielkens A.L.J.,Capua I.,and Damoser J.,Arch Virol143,49-64, 1998. 
3.Herczeg J.,Wehmann E.,Bragg R.R.,Travassos Dias P.M.,Hadjiev G.,Werner O.,andLomniczi,B.Arch Virol144,2087-2099,1999. 
4.Yang C.Y.,Shieh H.K.,Lin Y.L.,Chang P.C.,Avian Dis 43,125-130,1999. 
5.Kwon H.J.,Cho S.H.,Ahn Y.J.,Seo S.H.,Choi K.S.,and KimS.J.Vet Microbiol95,39-48,2003. 
6.Liu X.F.,Wan H.Q.,Ni X.X.,Wu Y.T.,and Liu W.B.(2003).Pathotypical and genotypical characterization of strains of Newcastledisease virus isolated from outbreaks in chicken and goose flocks insome regions of China during 1985-2001.Arch Virol,148,1387-1403. 
7.Tsai H.J.,Chang K.H.,Tseng C.H.,Frost K.M.,Manvell R.J.,andAlexander D.J.Vet Microbiol,104,19-30,2004. 
现在,被用作疫苗株的La Sota/46为基因II型,而大多数被鉴定为野毒株属于基因VI-VII型,它们在遗传上与疫苗株La Sota/46较远。例如,在NDV的HN蛋白中,已知HN蛋白上的345-PDEQDYQIR-353位点是一种形成中和抗体的重要的线性表位。作为国内的致病性NDV,该病毒的基因VI型(95-98、99-70、99-71)和基因VII型已共存,并且更具体地,NDV的基因VI型在1999年被分离到,但从2000年至2006年根本没有再被分离到。在1995年,第一次从禽类中分离到NDV的基因VIIa型,然后就再没有分离到该病毒,仅分离到NDV的基因VIId型。在病毒的基因VI型的情况下,在1993年和1994年分离的毒株(SNU9358GG、SNU9444)中观察到线性表位(E347K)的第一个变体毒株,并继续在95-98、99-70和99-71中观察到所述变体。因此,这些变体毒株被认为可以避开免疫并存活较长时间,并且在韩国这些变体毒株被认为从2000年开始几乎被新出现的基因VII型所取代。对于该病毒的基因VII型的情况,1995年-2001年分离的所有病毒都类似于La Sota毒株的线性表位。然而,该线性表位(E347K)的变体毒株在2002年第一次被发现,具有其他突变的NDV大部分是在2005年被发现(参考下表)。 
Figure G2006800564366D00081
Figure G2006800564366D00091
考虑这一点,因为以前的疫苗株La Sota/46不能有效地用于预防现在新出现的抗原性不同的新城疫病毒,因此本发明提供的用于开发具有几乎类似于野毒株抗原性的疫苗株的技术是非常重要的。 
本文使用的术语“高致病性(速发型)新城疫病毒”包括具有等于或高于中发型毒株的致病性的致病性新城疫病毒,以及除非定义不同,否则通常被分类为高致病性的新城疫病毒。在本发明中,高致病性新城疫病毒是通过在感染至动物时在其体内的所有细胞中产生侵染性的病毒来显示其致病性的。在所述F蛋白的第113-116位的氨基酸序列由下式1表示的情况下,该F蛋白被存在于体内几乎所有细胞中的费林蛋白酶或费林-样蛋白酶(下文中称作“费林蛋白酶”)切割,从而被转化成一种活性结构并获得侵染能力。因此,致病性新城疫病毒可被定义为在F蛋白的第113-116位具有编码由下式1表示的氨基酸序列的核苷酸序列: 
式1 
113-X1X2X3X4-116 
其中 
X1、X3和X4独立地为精氨酸(R)或赖氨酸(K),并且 
X2选自丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、色氨酸、缬氨酸、天冬酰胺、半胱氨酸、谷氨酰胺、甘氨酸、丝氨酸、苏氨酸、酪氨酸、天冬氨酸、谷氨酸、精氨酸、组氨酸和赖氨酸。 
在这种情况下,如果F蛋白的第112位的氨基酸为例如精氨酸或赖氨酸的碱性氨基酸,那么该致病性新城疫病毒具有较高的致病性。 
同时,本文使用的术语“低致病性(缓发型)新城疫病毒”包括无致 病性的非致病性新城疫病毒,以及除非定义不同,否则通常被分类为缓发型的新城疫病毒。在本发明中,低致病性新城疫病毒在F蛋白的第113-116位具有编码由下式2表示的氨基酸序列的核苷酸序列,并且当感染至动物时,该病毒仅被消化器官和呼吸器官中某些特定的细胞外蛋白酶所激活,从而仅局部地感染而显示低致病性。因此,低致病性新城疫病毒被定义为在F蛋白的第113-116位具有编码以下式2表示的氨基酸序列的核苷酸序列: 
式2 
113-X4X5X7X8-116 
其中 
X5、X6和X7独立地选自丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、色氨酸、缬氨酸、天冬酰胺、半胱氨酸、谷氨酰胺、甘氨酸、丝氨酸、苏氨酸、酪氨酸、天冬氨酸、谷氨酸、精氨酸、组氨酸和赖氨酸,且X5和X7不同时为精氨酸(R)或赖氨酸(K),并且 
X8为精氨酸(R)或赖氨酸(K)。 
当位于新城疫病毒的F蛋白中的切割位点被费林蛋白酶切割并且F蛋白与细胞膜融合的融合区暴露时,该病毒获得致病性。费林蛋白酶是一种分布于整个动物体内的酶,因此费林蛋白酶对病毒侵染能力的激活可以在整个动物体内产生,籍此该病毒具有致病性。因此,新城疫病毒的致病性水平可依赖于费林蛋白酶对F蛋白中切割位点的识别和切割的程度。 
如果新城疫病毒的F蛋白的费林蛋白酶识别位点(第113-116位氨基酸)具有式1所示的至少3个碱性氨基酸(113-R-X-K/R-R-116),那么该病毒是可以全身感染的,并获得致病性。然而,如式2中所示,如果以非碱性氨基酸替换一个多个碱性氨基酸,那么切割和识别不是由费林蛋白酶而是由局部存在的细胞外蛋白酶进行,且不会发生病毒的致死性全身感染,从而呈现低致病性。 
本发明涉及通过以下方式基于低致病性新城疫病毒制备遗传稳定的且减毒的重组新城疫病毒的技术,该方式即将F蛋白和HN蛋白的编码区替换为国内和亚洲流行的高致病性病毒的这些区域以增强该病毒对高致病性病毒的防护效应;以及用非碱性氨基酸的密码子替换编码高致病性新城疫病毒的第115位氨基酸的密码子,其中在出现至少两个点突变时可将一个非碱性氨基酸的密码子转换成碱性氨基酸的密码子。如上文所述,根 据本发明的重组体新城疫病毒具有与野毒株相同或类似的表面抗原,从而呈现了对野毒株的高抗原性并且是被有效减毒的。另外,除非在F蛋白的第115位氨基酸的密码子出现至少两个点突变,否则根据本发明的重组体新城疫病毒不能被转换成高致病毒株,从而呈现出优良的稳定性和安全性。 
根据致病性新城疫病毒的细胞病变效应,可以将其分类至形成合胞体的合胞型和形成颗粒的颗粒型,并且通常已知合胞型具有比颗粒型更高的致病性。本发明的特征可以在于通过以下方式显著降低致病性,该方式即使用颗粒型病毒克隆作为高-速发型新城疫病毒来提供编码F和HN蛋白的区域。另外,在新城疫病毒的HN蛋白中,高致病性新城疫病毒的HN蛋白具有571个氨基酸,其长度相对较短,而低致病性新城疫病毒的HN蛋白具有577个或616个氨基酸,比高致病性病毒长,因此高致病毒株和低致病毒株可通过HN的C末端氨基酸序列来分类。因此,在本发明中,将HN蛋白的C末端改造成低致病毒株的对应的区域(577个氨基酸),从而制备一种更加减毒的重组新城疫病毒。 
如本文使用的,用于转录新城疫病毒基因组和重组体新城疫病毒的载体中所包含的编码P、M、F、HN和L蛋白的核苷酸序列应被理解为,包括存在于P、M、F、HN和L基因中的所有非编码核苷酸序列(条件是它们对所表达的蛋白没有影响),以及直接编码这些蛋白的核苷酸序列。 
更具体而言,本发明涉及一种用于转录新城疫病毒基因组的载体,包括一个由编码新城疫病毒的NP、P、M、F、HN和L蛋白的核苷酸序列组成的基因片段;以及一个启动子和一个终止子,它们可操作地连接至该基因片段, 
其中所述NP、P、M和L基因源自低致病性新城疫病毒La Sota毒株的基因组,F和HN基因源自高致病性新城疫病毒KBNP-4152的基因组, 
其中在所述载体中包含的F蛋白编码序列的特征在于,以任一选自以下的密码子替换编码速发型新城疫病毒(包括KBNP-4152)的F蛋白第115位的碱性氨基酸的密码子:包括GCA、GCC、GCG和GCU的丙氨酸密码子;包括GAC和GAU的天冬氨酸密码子;包括UUC和UUU的苯丙氨酸密码子;包括AUC和AUU的异亮氨酸密码子;包括UUA和UUG的亮氨酸密码子;包括UCA、UCC、UCG和UCU的丝氨酸密码 子;包括ACC和ACU的苏氨酸密码子;包括GUA、GUC、GUG和GUU的缬氨酸密码子;以及包括UAC和UAU的酪氨酸密码子。 
该载体的HN基因可以被额外地突变,使得HN蛋白的第1-569位氨基酸的密码子编码高致病性新城疫病毒的相应氨基酸,第570位之后的氨基酸的密码子编码低致病性新城疫病毒(包括La Sota毒株)的相应氨基酸。 
另外,所述启动子和终止子的使用可以没有特别的限制,条件是它们可以与所述质粒中的新城疫病毒基因组可操作地连接。本发明所属技术领域的技术人员可容易地选择并使用这种启动子和终止子。在本发明的一个实施方案中,所述启动子和终止子可以分别是T7启动子和T7终止子。 
在本发明的优选实施方案中,用于转录该病毒基因组的载体可包括编码SEQ ID NO:2-7的氨基酸序列的核苷酸序列或以下SEQ ID NO:1的核苷酸序列(参考图23,后文中称为pTNH-c4152R2L)。 
                                                         基因起始 
 1     accaaacagagaatccgtgagttacgataaaaggcgaaggagcaattgaagtcgcacggg
 61    tagaaggtgtgaatctcgagtgcgagcccgaagcacaaactcgagaaagccttctgccaa 
         M  S  S  V  F  D  E  Y  E  Q  L  L  A  A  Q  T  R  P  N  G  · 
121    cATGTCTTCCGTATTTGATGAGTACGAACAGCTCCTCGCGGCTCAGACTCGCCCCAATGG 
       ·A  H  G  G  G  E  K  G  S  T  L  K  V  D  V  P  V  F  T  L  · 
181    AGCTCATGGAGGGGGAGAAAAAGGGAGTACCTTAAAAGTAGACGTCCCGGTATTCACTCT 
       ·N  S  D  D  P  E  D  R  W  S  F  V  V  F  C  L  R  I  A  V  · 
241    TAACAGTGATGACCCAGAAGATAGATGGAGCTTTGTGGTATTCTGCCTCCGGATTGCTGT 
       ·S  E  D  A  N  K  P  L  R  Q  G  A  L  I  S  L  L  C  S  H  · 
301    TAGCGAAGATGCCAACAAACCACTCAGGCAAGGTGCTCTCATATCTCTTTTATGCTCCCA 
       ·S  Q  V  M  R  N  H  V  A  I  A  G  K  Q  N  E  A  T  L  A  · 
361    CTCACAGGTAATGAGGAACCATGTTGCCATTGCAGGGAAACAGAATGAAGCCACATTGGC 
       ·V  L  E  I  D  G  F  A  N  G  T  P  Q  F  N  N  R  S  G  V  · 
421    CGTGCTTGAGATTGATGGCTTTGCCAACGGCACGCCCCAGTTCAACAATAGGAGTGGAGT 
       ·S  E  E  R  A  Q  R  F  A  M  I  A  G  S  L  P  R  A  C  S  · 
481    GTCTGAAGAGAGAGCACAGAGATTTGCGATGATAGCAGGATCTCTCCCTCGGGCATGCAG 
       ·N  G  T  P  F  V  T  A  G  A  E  D  D  A  P  E  D  I  T  D  · 
541    CAACGGAACCCCGTTCGTCACAGCCGGGGCAGAAGATGATGCACCAGAAGACATCACCGA 
       ·T  L  E  R  I  L  S  I  Q  A  Q  V  W  V  T  V  A  K  A  M  · 
601    TACCCTGGAGAGGATCCTCTCTATCCAGGCTCAAGTATGGGTCACAGTAGCAAAAGCCAT 
       ·T  A  Y  E  T  A  D  E  S  E  T  R  R  I  N  K  Y  M  Q  Q  · 
661    GACTGCGTATGAGACTGCAGATGAGTCGGAAACAAGGCGAATCAATAAGTATATGCAGCA 
       ·G  R  V  Q  K  K  Y  I  L  Y  P  V  C  R  S  T  I  Q  L  T  · 
721    AGGCAGGGTCCAAAAGAAATACATCCTCTACCCCGTATGCAGGAGCACAATCCAACTCAC 
       ·I  R  Q  S  L  A  V  R  I  F  I  V  S  E  L  K  R  G  R  N  · 
781    GATCAGACAGTCTCTTGCAGTCCGCATCTTTTTGGTTAGCGAGCTCAAGAGAGGCCGCAA 
       ·T  A  G  G  T  S  T  Y  Y  N  L  V  G  D  V  D  S  Y  I  R  · 
 841    CACGGCAGGTGGTACCTCTACTTATTATAACCTGGTAGGGGACGTAGACTCATACATCAG 
        ·N  T  G  L  T  A  F  F  L  T  L  K  Y  G  I  N  T  K  T  S  · 
 901    GAATACCGGGCTTACTGCATTCTTCTTGACACTCAAGTACGGAATCAACACCAAGACATC 
        ·A  L  A  L  S  S  L  S  G  D  I  Q  K  M  K  Q  L  M  R  L  · 
 961    AGCCCTTGCACTTAGTAGCCTCTCAGGCGACATCCAGAAGATGAAGCAGCTCATGCGTTT 
        ·Y  R  M  K  G  D  N  A  P  Y  M  T  L  L  G  D  S  D  Q  M  · 
1021    GTATCGGATGAAAGGAGATAATGCGCCGTACATGACATTACTTGGTGATAGTGACCAGAT 
        ·S  F  A  P  A  E  Y  A  Q  L  Y  S  F  A  M  G  M  A  S  V  · 
1081    GAGCTTTGCGCCTGCCGAGTATGCACAACTTTACTCCTTTGCCATGGGTATGGCATCAGT 
        ·L  D  K  G  T  G  K  Y  Q  F  A  R  D  F  M  S  T  S  F  W  · 
1141    CCTAGATAAAGGTACTGGGAAATACCAATTTGCCAGGGACTTTATGAGCACATCATTCTG 
        ·R  L  G  V  E  Y  A  Q  A  Q  G  S  S  I  N  E  D  M  A  A  · 
1201    GAGACTTGGAGTAGAGTACGCTCAGGCTCAGGGAAGTAGCATTAACGAGGATATGGCTGC 
        ·E  L  K  L  T  P  A  A  M  K  G  L  A  A  A  A  Q  R  V  S  · 
1261    CGAGCTAAAGCTAACCCCAGCAGCAATGAAGGGCCTGGCAGCTGCTGCCCAACGGGTCTC 
        ·D  D  T  S  S  I  Y  M  P  T  Q  Q  V  G  V  L  T  G  L  S  · 
1321    CGACGATACCAGCAGCATATACATGCCTACTCAACAAGTCGGAGTCCTCACTGGGCTTAG 
        ·E  G  G  S  Q  A  L  Q  G  G  S  N  R  S  Q  G  Q  P  E  A  · 
1381    CGAGGGGGGGTCCCAAGCTCTACAAGGCGGATCGAATAGATCGCAAGGGCAACCAGAAGC 
        ·G  D  G  E  T  Q  F  L  D  L  M  R  A  V  A  N  S  M  R  E  · 
1441    CGGGGATGGGGAGACCCAATTCCTGGATCTGATGAGAGCGGTAGCAAATAGCATGAGGGA 
        ·A  P  N  S  A  Q  G  T  P  Q  S  G  P  P  P  T  P  G  P  S  · 
1501    GGCGCCAAACTCTGCACAGGGCACTCCCCAATCGGGGCCTCCCCCAACTCCTGGGCCATC 
        ·Q  D  N  D  T  D  W  G  Y 
1561    CCAAGATAACGACACCGACTGGGGGTATTGAtggacaaaacccagcctgcttccacaaaa 
1621    acatcccaatgccctcacccgtagtcgacccctcgatttgcggctctatatgaccacacc 
1681    ctcaaacaaacatccccctctttcctccctccccctgctgtacaactccgcacgccctag 
                                       基因结束 
1741    ataccacaggcacaatgcggctcactaacaatcaaaacagagccgagggaattagaaaaa
           基因起始 
1801    agtacgggtagaagagggatattcagagatcagggcaagtctcccgagtctctgctctct 
                                   M  A  T  F  T  D  A  E  I  D  E  L 
1861    cctctacctgatagaccaggacaaacATGGCCACCTTTACAGATGCAGAGATCGACGAGC 
        · F  E  T  S  G  T  V  I  D  N  I  I  T  A  Q  G  K  P  A  E  · 
1921    TATTTGAGACAAGTGGAACTGTCATTGACAACATAATTACAGCCCAGGGTAAACCAGCAG 
        · T  V  G  R  S  A  I  P  Q  G  K  T  K  V  L  S  A  A  W  E  · 
1981    AGACTGTTGGAAGGAGTGCAATCCCACAAGGCAAGACCAAGGTGCTGAGCGCAGCATGGG 
        · K  H  G  S  I  Q  P  P  A  S  Q  D  N  P  D  R  Q  D  R  S  · 
2041    AGAAGCATGGGAGCATCCAGCCACCGGCCAGTCAAGACAACCCCGATCGACAGGACAGAT 
        · D  K  Q  P  S  T  P  E  Q  T  T  P  H  D  S  P  P  A  T  S  · 
2101    CTGACAAACAACCATCCACACCCGAGCAAACGACCCCGCATGACAGCCCGCCGGCCACAT 
        · A  D  Q  P  P  T  Q  A  T  D  E  A  V  D  T  Q  F  R  T  G  · 
2161    CCGCCGACCAGCCCCCCACCCAGGCCACAGACGAAGCCGTCGACACACAGTTCAGGACCG 
        · A  S  N  S  L  L  L  M  L  D  K  L  S  N  K  S  S  N  A  K  · 
2221    GAGCAAGCAACTCTCTGCTGTTGATGCTTGACAAGCTCAGCAATAAATCGTCCAATGCTA 
             ApaI 
        · K  G  P  W  S  S  P  Q  E  G  N  H  Q  R  P  T  Q  Q  Q  G  · 
2281    AAAAGGGCCCATGGTCGAGCCCCCAAGAGGGGAATCACCAACGTCCGACTCAACAGCAGG 
        · S  Q  P  S  R  G  N  S  Q  E  R  P  Q  N  Q  V  K  A  A  P  · 
2341    GGAGTCAACCCAGTCGCGGAAACAGTCAGGAAAGACCGCAGAACCAAGTCAAGGCCGCCC 
        · G  N  Q  G  T  D  V  N  T  A  Y  H  G  Q  W  E  E  S  Q  L  · 
2401    CTGGAAACCAGGGCACAGACGTGAACACAGCATATCATGGACAATGGGAGGAGTCACAAC 
        · S  A  G  A  T  P  H  A  L  R  S  R  Q  S  Q  D  N  T  L  V  · 
2461    TATCAGCTGGTGCAACCCCTCATGCTCTCCGATCAAGGCAGAGCCAAGACAATACCCTTG 
        · S  A  D  H  V  Q  P  P  V  D  F  V  Q  A  M  M  S  M  M  E  · 
2521    TATCTGCGGATCATGTCCAGCCGCCTGTAGACTTTGTGCAAGCGATGATGTCTATGATGG 
        · A  I  S  Q  R  V  S  K  V  D  Y  Q  L  D  L  V  L  K  Q  T  · 
2581    AGGCGATATCACAGAGAGTAAGTAAGGTTGACTATCAGCTAGATCTTGTCTTGAAACAGA 
        · S  S  I  P  M  M  R  S  E  I  Q  Q  L  K  T  S  V  A  V  M  · 
2641    CATCCTCCATCCCTATGATGCGGTCCGAAATCCAACAGCTGAAAACATCTGTTGCAGTCA 
        · E  A  N  L  G  M  M  K  I  L  D  P  G  C  A  N  I  S  S  L  · 
2701    TGGAAGCCAACTTGGGAATGATGAAGATTCTGGATCCCGGTTGTGCCAACATTTCATCTC 
        · S  D  L  R  A  V  A  R  S  H  P  V  L  V  S  G  P  G  D  P  · 
2761    TGAGTGATCTACGGGCAGTTGCCCGATCTCACCCGGTTTTAGTTTCAGGCCCTGGAGACC 
        · S  P  Y  V  T  Q  G  G  E  M  A  L  N  K  L  S  Q  P  V  P  · 
2821    CCTCTCCCTATGTGACACAAGGAGGCGAAATGGCACTTAATAAACTTTCGCAACCAGTGC 
        · H  P  S  E  L  I  K  P  A  T  A  C  G  P  D  I  G  V  E  K  · 
2881    CACATCCATCTGAATTGATTAAACCCGCCACTGCATGCGGGCCTGATATAGGAGTGGAAA 
        · D  T  V  R  A  L  I  M  S  R  P  M  H  P  S  S  S  A  K  L  · 
2941    AGGACACTGTCCGTGCATTGATCATGTCACGCCCAATGCACCCGAGTTCTTCAGCCAAGC 
        · L  S  K  L  D  A  A  G  S  I  E  E  I  R  K  I  K  R  L  A  · 
3001    TCCTAAGCAAGTTAGATGCAGCCGGGTCGATCGAGGAAATCAGGAAAATCAAGCGCCTTG 
        · L  N  G 
3061    CTCTAAATGGCTAAttactactgccacacgtagcgggtccctgtccactcggcatcacac 
3121    ggaatctgcaccgagttcccccccgcagacccaaggtccaactctccaagcggcaatcct 
3181    ctctcgcttcctcagccccactgaatgatcgcgtaaccgtaattaatctagctacattta 
            基因结束   基因起始                         M  D  S  S · 
3241    agattaagaaaaaatacgggtagaattggagtgccccaattgtgccaagATGGACTCATC 
        · R  T  I  G  L  Y  F  D  S  A  H  S  S  S  N  L  L  A  F  P  · 
3301    TAGGACAATTGGGCTGTACTTTGATTCTGCCCATTCTTCTAGCAACCTGTTAGCATTTCC 
        · I  V  L  Q  D  T  G  D  G  K  K  Q  I  A  P  Q  Y  R  I  Q  · 
3361    GATCGTCCTACAAGACACAGGAGATGGGAAGAAGCAAATCGCCCCGCAATATAGGATCCA 
        · R  L  D  L  W  T  D  S  K  E  D  S  V  F  I  T  T  Y  G  F  · 
3421    GCGCCTTGACTTGTGGACTGATAGTAAGGAGGACTCAGTATTCATCACCACCTATGGATT 
        · I  F  Q  V  G  N  E  E  A  T  V  G  M  I  D  D  K  P  K  R  · 
3481    CATCTTTCAAGTTGGGAATGAAGAAGCCACTGTCGGCATGATCGATGATAAACCCAAGCG 
                                   AvrII 
        · E  L  L  S  A  A  M  L  C  L  G  S  V  P  N  T  G  D  L  I  · 
3541    CGAGTTACTTTCCGCTGCGATGCTCTGCCTAGGAAGCGTCCCAAATACCGGAGACCTTAT 
        · E  L  A  R  A  C  L  T  M  I  V  T  C  K  K  S  A  T  N  T  · 
3601    TGAGCTGGCAAGGGCCTGTCTCACTATGATAGTCACATGCAAGAAGAGTGCAACTAATAC 
        · E  R  M  V  F  S  V  V  Q  A  P  Q  V  L  Q  S  C  R  V  V  · 
3661    TGAGAGAATGGTTTTCTCAGTAGTGCAGGCACCCCAAGTGCTGCAAAGCTGTAGGGTTGT 
        · A  N  K  Y  S  S  V  N  A  V  K  H  V  K  A  P  E  K  I  P  · 
3721    GGCAAACAAATACTCATCAGTGAATGCAGTCAAGCACGTGAAAGCGCCAGAGAAGATTCC 
        · G  S  G  T  L  E  Y  K  V  N  F  V  S  L  T  V  V  P  K  K  · 
3781    CGGGAGTGGAACCCTAGAATACAAGGTGAACTTTGTCTCCTTGACTGTGGTACCGAAGAA    
        · D  V  Y  K  I  P  A  A  V  L  K  V  S  G  S  S  L  Y  N  L  · 
3841    GGATGTCTACAAGATCCCAGCTGCAGTATTGAAGGTTTCTGGCTCGAGTCTGTACAATCT 
        · A  L  N  V  T  I  N  V  E  V  D  P  R  S  P  L  V  K  S  L  · 
3901    TGCGCTCAATGTCACTATTAATGTGGAGGTAGACCCGAGGAGTCCTTTGGTTAAATCTCT 
        · S  K  S  D  S  G  Y  Y  A  N  L  F  L  H  I  G  L  M  T  T  · 
3961    GTCTAAGTCTGACAGCGGATACTATGCTAACCTCTTCTTGCATATTGGACTTATGACCAC 
        · V  D  R  K  G  K  K  V  T  F  D  K  L  E  K  K  I  R  S  L  · 
4021    CGTAGATAGGAAGGGGAAGAAAGTGACATTTGACAAGCTGGAAAAGAAAATAAGGAGCCT 
        · D  L  S  V  G  L  S  D  V  L  G  P  S  V  L  V  K  A  R  G  · 
4081    TGATCTATCTGTCGGGCTCAGTGATGTGCTCGGGCCTTCCGTGTTGGTAAAAGCAAGAGG 
        · A  R  T  K  L  L  A  P  F  F  S  S  S  G  T  A  C  Y  P  I  · 
4141    TGCACGGACTAAGCTTTTGGCACCTTTCTTCTCTAGCAGTGGGACAGCCTGCTATCCCAT 
        · A  N  A  S  P  Q  V  A  K  I  L  W  S  Q  T  A  C  L  R  S  · 
4201    AGCAAATGCTTCTCCTCAGGTGGCCAAGATACTCTGGAGTCAAACCGCGTGCCTGCGGAG 
        · V  K  I  I  I  Q  A  G  T  Q  R  A  V  A  V  T  A  D  H  E  · 
4261    CGTTAAAATCATTATCCAAGCAGGTACCCAACGCGCTGTCGCAGTGACCGCCGACCACGA 
        · V  T  S  T  K  L  E  K  G  H  T  L  A  K  Y  N  P  F  K  K  · 
4321    GGTTACCTCTACTAAGCTGGAGAAGGGGCACACCCTTGCCAAATACAATCCTTTTAAGAA 
4381    ATAAgctgcgtctctgagattgcgctccgcccactcacccagatcatcatgacacaaaaa 
                                                      基因结束   MluI 
4441    actaatctgtcttgattatttacagttagtttacctgtctatcaagttagaaaaaacacg
           基因起始                                     M  G  S  K · 
4501    cgtacgggtagaagagtctggatcccgaccggcacattcaggacgcaatATGGGCTCCAA 
        · L  S  T  R  I  P  A  P  L  M  L  T  T  R  I  T  L  I  L  S  · 
4561    ACTTTCTACCAGGATTCCAGCACCTCTGATGCTGACCACCCGGATTACGCTGATATTGAG 
        · C  I  R  P  T  S  S  L  D  G  R  P  L  A  A  A  G  I  V  V  · 
4621    CTGTATCCGTCCGACAAGCTCTCTTGACGGCAGGCCTCTTGCAGCTGCAGGAATTGTAGT 
        · T  G  D  K  A  V  N  V  Y  T  S  S  Q  T  G  S  I  I  V  K  · 
4681    AACAGGAGATAAGGCAGTCAATGTATACACCTCGTCTCAGACAGGGTCAATCATAGTCAA 
        · L  L  P  N  M  P  R  D  K  E  A  C  A  K  A  P  L  E  A  Y  · 
4741    GTTGCTCCCGAATATGCCCAGGGATAAAGAGGCGTGTGCAAAAGCCCCATTAGAGGCATA 
        · N  R  T  L  T  T  L  L  T  P  L  G  D  S  I  R  K  I  Q  G  · 
4801    TAACAGAACACTGACTACTTTGCTAACTCCTCTTGGCGACTCCATCCGCAAGATCCAAGG 
                                切割位点 
        · S  V  S  T  S  G  G  G  R  Q  A  R  L  I  G  A  V  I  G  S  · 
4861    GTCTGTGTCCACGTCTGGAGGAGGCAGACAAGCACGCCTGATAGGTGCTGTTATTGGCAG 
                                                  NotI 
        · V  A  L  G  V  A  T  A  A  Q  I  T  A  A  A  A  L  I  Q  A  · 
4921    TGTAGCTCTTGGGGTTGCAACAGCGGCACAGATAACAGCAGCGGCCGCCCTAATACAAGC 
        · N  Q  N  A  A  N  I  L  R  L  K  E  S  I  A  A  T  N  E  A  · 
4981    CAACCAGAATGCCGCCAACATCCTCCGGCTTAAGGAGAGCATTGCTGCAACCAATGAAGC 
        · V  H  E  V  T  D  G  L  S  Q  L  S  V  A  V  G  K  M  Q  Q  · 
5041    TGTGCATGAAGTCACCGACGGATTATCACAACTATCAGTGGCAGTTGGGAAGATGCAGCA 
        · F  V  N  D  Q  F  N  N  T  A  R  E  L  D  C  I  K  I  T  Q  · 
5101    GTTCGTCAATGACCAGTTTAATAATACAGCACGAGAATTGGACTGTATAAAAATCACACA 
        · Q  V  G  V  E  L  N  L  Y  L  T  E  L  T  T  V  F  G  P  Q  · 
5161    ACAGGTTGGTGTAGAGCTAAACCTATACCTAACTGAATTGACTACAGTATTCGGGCCACA 
        · I  T  S  P  A  L  T  Q  L  T  I  Q  A  L  Y  N  L  A  G  G  · 
5221    GATCACTTCCCCTGCATTAACTCAGTTGACCATCCAAGCACTTTATAATTTAGCTGGTGG 
        · N  M  N  Y  L  L  T  K  L  G  I  G  N  N  Q  L  S  S  L  I  · 
5281    CAATATGAATTACTTATTAACTAAGTTAGGTATAGGGAACAATCAACTCAGCTCATTAAT 
        · G  S  G  L  I  T  G  Y  P  I  L  Y  D  S  Q  T  Q  L  L  G  · 
5341    TGGTAGCGGCCTGATCACTGGTTACCCTATACTGTATGATTCACAGACTCAACTCTTGGG 
        · I  Q  V  N  L  P  S  V  G  N  L  N  N  M  R  A  T  Y  L  E  · 
5401    CATACAAGTGAATTTGCCCTCAGTCGGGAACTTAAATAATATGCGTGCCACCTATTTGGA 
        · T  L  S  V  S  T  T  K  G  Y  A  S  A  L  V  P  K  V  V  T  · 
5461    GACCTTATCTGTAAGTACAACCAAAGGATATGCCTCAGCACTTGTCCCGAAAGTAGTGAC 
        · Q  V  G  S  V  I  E  E  L  D  T  S  Y  C  I  E  S  D  L  D  · 
5521    ACAGGTCGGTTCTGTGATAGAAGAGCTCGACACCTCATACTGCATAGAGTCCGATCTGGA 
        · L  Y  C  T  R  I  V  T  F  P  M  S  P  G  I  Y  S  C  L  S  · 
5581    TTTATATTGTACTAGAATAGTGACATTCCCCATGTCCCCAGGTATTTATTCCTGCTTGAG 
        · G  N  T  S  A  C  M  Y  S  K  T  E  G  A  L  T  T  P  Y  M  · 
5641    CGGCAACACATCAGCTTGCATGTATTCAAAGACTGAAGGCGCACTCACTACGCCGTATAT 
        · A  L  K  G  S  V  I  A  N  C  K  I  T  T  C  R  C  T  D  P  · 
5701    GGCCCTTAAAGGCTCGGTTATTGCCAATTGTAAGATAACAACATGTAGATGTACAGACCC 
        · P  G  I  I  S  Q  N  Y  G  E  A  V  S  L  I  D  R  H  S  C  · 
5761    TCCTGGTATCATATCGCAAAATTATGGAGAAGCCGTATCCCTGATAGATAGACATTCGTG 
        · N  V  L  S  L  D  G  I  T  L  R  L  S  G  E  F  D  A  T  Y  · 
5821    CAATGTCTTATCATTAGACGGGATAACTCTGAGGCTCAGTGGGGAATTTGATGCAACTTA 
        · Q  K  N  I  S  I  L  D  S  Q  V  I  V  T  G  N  L  D  I  S  · 
5881    TCAAAAGAACATCTCAATACTAGATTCTCAAGTCATCGTGACAGGCAATCTTGATATCTC 
        · T  E  L  G  N  V  N  N  S  I  S  N  A  L  D  S  L  A  E  S  · 
5941    AACTGAACTTGGAAACGTCAACAATTCAATCAGCAATGCCTTGGATAGTTTGGCAGAAAG 
        · N  S  K  L  E  K  I  N  V  R  L  T  S  T  S  A  L  I  T  Y  · 
6001    CAACAGCAAGCTGGAAAAAATCAATGTCAGACTAACCAGCACATCTGCTCTCATTACCTA 
        · I  V  L  T  V  I  S  L  V  F  G  A  F  S  L  G  L  A  C  Y  · 
6061    TATTGTTCTAACTGTCATTTCTCTAGTTTTCGGTGCATTTAGTTTGGGTTTAGCGTGTTA 
        · L  M  Y  K  Q  K  A  Q  Q  K  T  L  L  W  L  G  N  N  T  L  · 
6121    CCTGATGTACAAACAGAAGGCACAACAAAAGACCTTGCTATGGCTTGGGAATAATACCCT 
        · D  Q  M  R  A  T  T  R  A 
6181    CGATCAGATGAGAGCCACTACAAGAGCATGAatgcagataagaggtgggtatatacccaa 
                                     基因结束 
6241    cagcagcctgtgtatcaattccgataacctgtcaagtagaagacttaagaaaaaactact 
                  基因起始 
6301    gggaataagcaaccaaagagcactacacgggtagaacgatcagaggagccacccttcaat 
                                                                  M 
6361    cggaaattaggcttcacaacatccgttctaccgcatcaccaacaacaagagtcaatcATG 
                  HpaI 
         D  R  A  V  N  R  V  V  L  E  N  E  E  R  E  A  K  N  T  W 
6421    GACCGCGCGGTTAACAGAGTCGTGCTGGAGAATGAGGAAAGAGAAGCAAAGAACACATGG 
         R  L  V  F  R  I  A  V  L  L  L  M  V  M  T  L  A  I  S  S 
6481    CGCCTGGTTTTCCGGATCGCAGTTTTACTTTTAATGGTAATGACTCTAGCTATCTCCTCA 
         A  A  L  A  Y  S  T  G  A  S  T  P  H  D  L  A  S  I  L  T 
6541    GCTGCCCTGGCATACAGCACGGGGGCCAGTACGCCGCACGACCTCGCAAGCATATTGACT 
         V  I  S  K  T  E  D  K  V  T  S  L  L  S  S  S  Q  D  V  I 
6601    GTGATCTCCAAGACAGAAGATAAGGTTACGTCTTTACTCAGTTCAAGTCAAGACGTGATA 
         D  R  I  Y  K  Q  V  A  L  E  S  P  L  A  L  L  N  T  E  S 
6661    GATAGGATATACAAGCAGGTGGCTCTTGAATCCCCGCTGGCACTACTAAACACTGAATCT 
         V  I  M  N  A  I  T  S  L  S  Y  Q  I  N  G  A  A  N  N  S 
6721    GTAATTATGAATGCAATAACCTCTCTTTCTTATCAAATTAACGGGGCTGCGAACAATAGC 
         G  C  G  A  P  V  H  D  P  D  Y  I  G  G  I  G  K  E  L  I 
6781    GGATGTGGGGCGCCTGTTCATGACCCAGATTATATCGGGGGGATAGGCAAAGAACTCATA 
         V  D  D  I  S  D  V  T  S  F  Y  P  S  A  Y  Q  E  H  L  N 
6841    GTGGACGACATCAGTGATGTTACATCATTTTATCCTTCTGCATATCAAGAACACTTGAAT 
         F  I  P  A  P  T  T  G  S  G  C  T  R  I  P  S  F  D  M  S 
6901    TTCATCCCGGCACCTACTACAGGATCCGGTTGCACTCGGATACCCTCGTTTGACATGAGC 
         T  T  H  Y  C  Y  T  H  N  V  I  L  S  G  C  R  D  H  S  H 
6961    ACCACCCATTATTGTTATACTCACAATGTGATACTATCCGGTTGCAGAGATCACTCACAC 
         S  H  Q  Y  L  A  L  G  V  L  R  T  S  A  T  G  R  V  F  F 
7021    TCACATCAATACTTAGCACTTGGTGTGCTTCGGACATCTGCAACAGGGAGGGTATTCTTT 
         S  T  L  R  S  I  N  L  D  D  T  Q  N  R  K  S  C  S  V  S 
7081    TCTACTCTGCGCTCTATCAATTTAGATGACACCCAAAATCGGAAGTCCTGCAGTGTGAGT 
         A  T  P  L  G  C  D  M  L  C  S  K  V  T  G  T  E  E  E  D 
7141    GCAACCCCTTTAGGTTGTGATATGCTGTGCTCCAAGGTCACAGGGACTGAAGAGGAGGAT 
         Y  K  S  V  A  P  T  S  M  V  H  G  R  L  G  F  D  G  Q  Y 
7201    TACAAGTCAGTTGCCCCCACATCAATGGTGCACGGAAGGCTAGGGTTTGACGGTCAATAC 
         H  E  K  D  L  D  T  T  V  L  F  K  D  W  V  A  N  Y  P  G 
7261    CATGAAAAGGACTTAGACACCACGGTCTTATTTAAGGATTGGGTGGCAAATTACCCAGGA 
         A  G  G  G  S  F  I  D  D  R  V  W  F  P  V  Y  G  G  L  K 
7321    GCGGGAGGAGGGTCTTTTATTGACGACCGTGTATGGTTCCCAGTTTACGGAGGGCTCAAA 
         P  D  S  P  S  D  T  A  Q  E  G  K  Y  V  I  Y  K  R  H  N 
7381    CCCGATTCACCCAGTGACACTGCACAAGAAGGGAAATACGTAATATACAAGCGCCATAAC 
         N  T  C  P  D  K  Q  D  Y  Q  I  R  K  A  K  S  S  Y  K  P 
7441    AACACATGCCCCGATAAACAAGATTACCAAATTCGGAAGGCTAAGTCTTCATATAAACCC 
         G  R  F  G  G  K  R  V  Q  Q  A  I  L  S  I  K  V  S  T  S 
7501    GGGCGATTTGGTGGGAAGCGCGTACAGCAAGCCATCTTATCCATCAAAGTGTCAACATCT 
         L  G  K  D  P  V  L  T  I  P  P  N  T  I  T  L  M  G  A  E 
7561    TTGGGTAAGGACCCGGTGCTGACTATTCCACCTAATACAATCACACTCATGGGAGCCGAA 
         G  R  I  L  T  V  G  T  S  H  F  L  Y  Q  R  G  S  S  Y  F 
7621    GGCAGAATTCTCACAGTGGGGACATCTCACTTCTTGTACCAACGAGGGTCTTCATATTTC 
         S  P  A  L  L  Y  P  M  T  V  N  N  K  T  A  T  L  H  S  P 
7681    TCCCCTGCCTTATTATATCCCATGACAGTAAATAACAAAACGGCTACACTCCATAGTCCT 
         Y  T  F  N  A  F  T  R  P  G  S  V  P  C  Q  A  S  A  R  C 
7741    TATACGTTTAATGCTTTCACTCGGCCAGGTAGTGTCCCTTGCCAGGCATCAGCAAGATGC 
         P  N  S  C  I  T  G  V  Y  T  D  P  Y  P  L  I  F  H  R  N 
7801    CCCAACTCATGCATTACTGGAGTCTATACTGATCCATATCCCTTAATCTTCCATAGGAAT 
         H  T  L  R  G  V  F  G  T  M  L  D  D  E  Q  A  R  L  N  P 
7861    CATACTCTACGAGGGGTCTTCGGAACGATGCTTGATGATGAACAAGCGAGACTTAACCCC 
         V  S  A  V  F  D  N  V  S  R  S  R  V  T  R  V  S  S  S  S 
7921    GTATCCGCAGTATTCGACAACGTATCCCGCAGTCGTGTCACCCGGGTGAGTTCAAGCAGC 
         T  K  A  A  Y  T  T  S  T  C  F  K  V  V  K  T  N  K  T  Y 
7981    ACCAAGGCAGCATACACGACATCGACATGTTTCAAAGTTGTCAAGACCAATAAAACTTAT 
         C  L  S  I  A  E  I  S  N  T  L  F  G  E  F  R  I  V  P  L 
8041    TGTCTTAGTATTGCAGAAATATCCAATACCCTGTTCGGGGAATTTAGGATCGTTCCCTTA
        SpeI 
         L  V  E  I  L  K  D  D  G  V  R  E  A  R  S  G 
8101    CTAGTTGAGATCCTCAAGGATGACGGGGTTAGAGAAGCCAGGTCTGGCTAGttgagtcaa 
8161    ttataaaggagttggaaagatggcattgtatcacctatcttctgtgacatcaagaatcaa 
8221    accgaatgccggcgcgtgctcgaattccatgttgccagttgaccacaatcagccagtgct 
                               基因结束 
8281    catgcgatcagattaagccttgtcaatagtctcttgattaagaaaaaatgtaagtggcaa 
                                           基因起始 M  A  S  S  G · 
8341    tgagatacaaggcaaaacagctcatggtaaataatacgggtaggacATGGCGAGCTCCGG 
        ·P  E  R  A  E  H  Q  I  I  L  P  E  S  H  L  S  S  P  L  V  · 
8401    TCCTGAAAGGGCAGAGCATCAGATTATCCTACCAGAGTCACACCTGTCTTCACCATTGGT 
        ·K  H  K  L  L  Y  Y  W  K  L  T  G  L  P  L  P  D  E  C  D  · 
8461    CAAGCACAAACTACTCTATTACTGGAAATTAACTGGGCTACCGCTTCCTGATGAATGTGA 
        ·F  D  H  L  I  L  S  R  Q  W  K  K  I  L  E  S  A  S  P  D  · 
8521    CTTCGACCACCTCATTCTCAGCCGACAATGGAAAAAAATACTTGAATCGGCCTCTCCTGA 
        ·T  E  R  M  I  K  L  G  R  A  V  H  Q  T  L  N  H  N  S  R  · 
8581    TACTGAGAGAATGATAAAACTCGGAAGGGCAGTACACCAAACTCTTAACCACAATTCCAG 
        ·I  T  G  V  L  H  P  R  C  L  E  E  L  A  N  I  E  V  P  D  · 
8641    AATAACCGGAGTGCTCCACCCCAGGTGTTTAGAAGAACTGGCTAATATTGAGGTCCCAGA 
        ·S  T  N  K  F  R  K  I  E  K  K  I  Q  I  H  N  T  R  Y  G  · 
8701    TTCAACCAACAAATTTCGGAAGATTGAGAAGAAGATCCAAATTCACAACACGAGATATGG 
        ·E  L  F  T  R  L  C  T  H  I  E  K  K  L  L  G  S  S  W  S  · 
8761    AGAACTGTTCACAAGGCTGTGTACGCATATAGAGAAGAAACTGCTGGGGTCATCTTGGTC 
                                             BsiWI 
        ·N  N  V  P  R  S  E  E  F  S  S  I  R  T  D  P  A  F  W  F  · 
8821    TAACAATGTCCCCCGGTCAGAGGAGTTCAGCAGCATTCGTACGGATCCGGCATTCTGGTT 
        ·H  S  K  W  S  T  A  K  F  A  W  L  H  I  K  Q  I  Q  R  H  · 
8881    TCACTCAAAATGGTCCACAGCCAAGTTTGCATGGCTCCATATAAAACAGATCCAGAGGCA 
        ·L  M  V  A  A  R  T  R  S  A  A  N  K  L  V  M  L  T  H  K  · 
8941    TCTGATGGTGGCAGCTAGGACAAGGTCTGCGGCCAACAAATTGGTGATGCTAACCCATAA 
        ·V  G  Q  V  F  V  T  P  E  L  V  V  V  T  H  T  N  E  N  K  · 
9001    GGTAGGCCAAGTCTTTGTCACTCCTGAACTTGTCGTTGTGACGCATACGAATGAGAACAA 
        ·F  T  C  L  T  Q  E  L  V  L  M  Y  A  D  M  M  E  G  R  D  · 
9061    GTTCACATGTCTTACCCAGGAACTTGTATTGATGTATGCAGATATGATGGAGGGCAGAGA 
        ·M  V  N  I  I  S  T  T  A  V  H  L  R  S  L  S  E  K  I  D  · 
9121    TATGGTCAACATAATATCAACCACGGCGGTGCATCTCAGAAGCTTATCAGAGAAAATTGA 
        ·D  I  L  R  L  I  D  A  L  A  K  D  L  G  N  Q  V  Y  D  V  · 
9181    TGACATTTTGCGGTTAATAGACGCTCTGGCAAAAGACTTGGGTAATCAAGTCTACGATGT 
        ·V  S  L  M  E  G  F  A  Y  G  A  V  Q  L  L  E  P  S  G  T  · 
9241    CGTATCACTAATGGAGGGATTTGCATACGGAGCTGTCCAGCTACTCGAGCCGTCAGGTAC 
        ·F  A  G  D  F  F  A  F  N  L  Q  E  L  K  D  I  L  I  G  L  · 
9301    ATTTGCAGGAGATTTCTTCGCATTCAACCTGCAGGAGCTTAAAGACATTCTAATTGGCCT 
        ·L  P  N  D  I  A  E  S  V  T  H  A  I  A  T  V  F  S  G  L  · 
9361    CCTCCCCAATGATATAGCAGAATCCGTGACTCATGCAATCGCTACTGTATTCTCTGGTTT 
        ·E  Q  N  Q  A  A  E  M  L  C  L  L  R  L  W  G  H  P  L  L  · 
9421    AGAACAGAATCAAGCAGCTGAGATGTTGTGTCTGTTGCGTCTGTGGGGTCACCCACTGCT 
        ·E  S  R  I  A  A  K  A  V  R  S  Q  M  C  A  P  K  M  V  D  · 
9481    TGAGTCCCGTATTGCAGCAAAGGCAGTCAGGAGCCAAATGTGCGCACCGAAAATGGTAGA 
        ·F  D  M  I  L  Q  V  L  S  F  F  K  G  T  I  I  N  G  Y  R  · 
9541    CTTTGATATGATCCTTCAGGTACTGTCTTTCTTCAAGGGAACAATCATCAACGGGTACAG 
        ·K  K  N  A  G  V  W  P  R  V  K  V  D  T  I  Y  G  K  V  I  · 
9601    AAAGAAGAATGCAGGTGTGTGGCCGCGAGTCAAAGTGGATACAATATATGGGAAGGTCAT 
        ·G  Q  L  H  A  D  S  A  E  I  S  H  D  I  M  L  R  E  Y  K  · 
9661    TGGGCAACTACATGCAGATTCAGCAGAGATTTCACACGATATCATGTTAAGAGAGTATAA 
        ·S  L  S  A  L  E  F  E  P  C  I  E  Y  D  P  V  T  N  L  S  · 
9721    GAGTTTATCTGCACTTGAATTTGAGCCATGTATAGAATATGACCCTGTCACCAACCTGAG 
        ·M  F  L  K  D  K  A  I  A  H  P  N  D  N  W  L  A  S  F  R  · 
 9781    CATGTTCCTAAAAGACAAGGCAATCGCACACCCCAACGATAATTGGCTTGCCTCGTTTAG 
          ·R  N  L  L  S  E  D  Q  K  K  H  V  K  E  A  T  S  T  N  R  · 
 9841    GCGGAACCTTCTCTCCGAAGACCAGAAGAAACATGTAAAAGAAGCAACTTCGACTAATCG 
          ·L  L  I  E  F  L  E  S  N  D  F  D  P  Y  K  E  M  E  Y  L  · 
 9901    CCTCTTGATAGAGTTTTTAGAGTCAAATGATTTTGATCCATATAAAGAGATGGAATATCT 
          ·T  T  L  E  Y  L  R  D  D  N  V  A  V  S  Y  S  L  K  E  K  · 
 9961    GACGACCCTTGAGTACCTTAGAGATGACAATGTGGCAGTATCATACTCGCTCAAGGAGAA 
          ·E  V  K  V  N  G  R  I  F  A  K  L  T  K  K  L  R  N  C  Q  · 
10021    GGAAGTGAAAGTTAATGGACGGATCTTCGCTAAGCTGACAAAGAAGTTAAGGAACTGTCA 
          ·V  M  A  E  G  I  L  A  D  Q  I  A  P  F  F  Q  G  N  G  V  · 
10081    GGTGATGGCGGAAGGGATCCTAGCCGATCAGATTGCACCTTTCTTTCAGGGAAATGGAGT 
          ·I  Q  D  S  I  S  L  T  K  S  M  L  A  M  S  Q  L  S  F  N  · 
10141    CATTCAGGATAGCATATCCTTGACCAAGAGTATGCTAGCGATGAGTCAACTGTCTTTTAA 
          ·S  N  K  K  R  I  T  D  C  K  E  R  V  S  S  N  R  N  H  D  · 
10201    CAGCAATAAGAAACGTATCACTGACTGTAAAGAAAGAGTATCTTCAAACCGCAATCATGA 
          ·P  K  S  K  N  R  R  R  V  A  T  F  I  T  T  D  L  Q  K  Y  · 
10261    TCCGAAAAGCAAGAACCGTCGGAGAGTTGCAACCTTCATAACAACTGACCTGCAAAAGTA 
          ·C  L  N  W  R  Y  Q  T  I  K  L  F  A  H  A  I  N  Q  L  M  · 
10321    CTGTCTTAATTGGAGATATCAGACAATCAAATTGTTCGCTCATGCCATCAATCAGTTGAT 
          ·G  L  P  H  F  F  E  W  I  H  L  R  L  M  D  T  T  M  F  V  · 
10381    GGGCCTACCTCACTTCTTCGAATGGATTCACCTAAGACTGATGGACACTACGATGTTCGT 
          ·G  D  P  F  N  P  P  S  D  P  T  D  C  D  L  S  R  V  P  N  · 
10441    AGGAGACCCTTTCAATCCTCCAAGTGACCCTACTGACTGTGACCTCTCAAGAGTCCCTAA 
          ·D  D  I  Y  I  V  S  A  R  G  G  I  E  G  L  C  Q  K  L  W  · 
10501    TGATGACATATATATTGTCAGTGCCAGAGGGGGTATCGAAGGATTATGCCAGAAGCTATG 
          ·T  M  I  S  I  A  A  I  Q  L  A  A  A  R  S  H  C  R  V  A  · 
10561    GACAATGATCTCAATTGCTGCAATCCAACTTGCTGCAGCTAGATCGCATTGTCGTGTTGC 
          ·C  M  V  Q  G  D  N  Q  V  I  A  V  T  R  E  V  R  S  D  D  · 
10621    CTGTATGGTACAGGGTGATAATCAAGTAATAGCAGTAACGAGAGAGGTAAGATCAGACGA 
          ·S  P  E  M  V  L  T  Q  L  H  Q  A  S  D  N  F  F  K  E  L  · 
10681    CTCTCCGGAGATGGTGTTGACACAGTTGCATCAAGCCAGTGATAATTTCTTCAAGGAATT 
          ·I  H  V  N  H  L  I  G  H  N  L  K  D  R  E  T  I  R  S  D  · 
10741    AATTCATGTCAATCATTTGATTGGCCATAATTTGAAGGATCGTGAAACCATCAGGTCAGA 
          ·T  F  F  I  Y  S  K  R  I  F  K  D  G  A  I  L  S  Q  V  L  · 
10801    CACATTCTTCATATACAGCAAACGAATCTTCAAAGATGGAGCAATCCTCAGTCAAGTCCT 
          ·K  N  S  S  K  L  V  L  V  S  G  D  L  S  E  N  T  V  M  S  · 
10861    CAAAAATTCATCTAAATTAGTGCTAGTGTCAGGTGATCTCAGTGAAAACACCGTAATGTC 
          ·C  A  N  I  A  S  T  V  A  R  L  C  E  N  G  L  P  K  D  F  · 
10921    CTGTGCCAACATTGCCTCTACTGTAGCACGGCTATGCGAGAACGGGCTTCCCAAAGACTT 
          ·C  Y  Y  L  N  Y  I  M  S  C  V  Q  T  Y  F  D  S  E  F  S  · 
10981    CTGTTACTATTTAAACTATATAATGAGTTGTGTGCAGACATACTTTGACTCTGAGTTCTC 
          ·I  T  N  N  S  H  P  D  L  N  Q  S  W  I  E  D  I  S  F  V  · 
11041    CATCACCAACAATTCGCACCCCGATCTTAATCAGTCGTGGATTGAGGACATCTCTTTTGT 
          ·H  S  Y  V  L  T  P  A  Q  L  G  G  L  S  N  L  Q  Y  S  R  · 
11101    GCACTCATATGTTCTGACTCCTGCCCAATTAGGGGGACTGAGTAACCTTCAATACTCAAG 
          ·L  Y  T  R  N  I  G  D  P  G  T  T  A  F  A  E  I  K  R  L  · 
11161    GCTCTACACTAGAAATATCGGTGACCCGGGGACTACTGCTTTTGCAGAGATCAAGCGACT 
          ·E  A  V  G  L  L  S  P  N  I  M  T  N  I  L  T  R  P  P  G  · 
11221    AGAAGCAGTGGGATTACTGAGTCCTAACATTATGACTAATATCTTAACTAGGCCGCCTGG 
          ·N  G  D  W  A  S  L  C  N  D  P  Y  S  F  N  F  E  T  V  A  · 
11281    GAATGGAGATTGGGCCAGTCTGTGCAACGACCCATACTCTTTCAATTTTGAGACTGTTGC 
          ·S  P  N  I  V  L  K  K  H  T  Q  R  V  L  F  E  T  C  S  N  · 
11341    AAGCCCAAATATTGTTCTTAAGAAACATACGCAAAGAGTCCTATTTGAAACTTGTTCAAA 
          ·P  L  L  S  G  V  H  T  E  D  N  E  A  E  E  K  A  L  A  E  · 
11401    TCCCTTATTGTCTGGAGTGCACACAGAGGATAATGAGGCAGAAGAGAAGGCATTGGCTGA 
          ·F  L  L  N  Q  E  V  I  H  P  R  V  A  H  A  I  M  E  A  S  · 
11461    ATTCTTGCTTAATCAAGAGGTGATTCATCCCCGCGTTGCGCATGCCATCATGGAGGCAAG 
          ·S  V  G  R  R  K  Q  I  Q  G  L  V  D  T  T  N  T  V  I  K  · 
11521    CTCTGTAGGTAGGAGAAAGCAAATTCAAGGGCTTGTTGACACAACAAACACCGTAATTAA 
          ·I  A  L  T  R  R  P  L  G  I  K  R  L  M  R  I  V  N  Y  S  · 
11581    GATTGCGCTTACTAGGAGGCCATTAGGCATCAAGAGGCTGATGCGGATAGTCAATTATTC 
          ·S  M  H  A  M  L  F  R  D  D  V  F  S  S  S  R  S  N  H  P  · 
11641    TAGCATGCATGCAATGCTGTTTAGAGACGATGTTTTTTCCTCCAGTAGATCCAACCACCC 
          ·L  V  S  S  N  M  C  S  L  T  L  A  D  Y  A  R  N  R  S  W  · 
11701    CTTAGTCTCTTCTAATATGTGTTCTCTGACACTGGCAGACTATGCACGGAATAGAAGCTG 
          ·S  P  L  T  G  G  R  K  I  L  G  V  S  N  P  D  T  I  E  L  · 
11761    GTCACCTTTGACGGGAGGCAGGAAAATACTGGGTGTATCTAATCCTGATACGATAGAACT 
          ·V  E  G  E  I  L  S  V  S  G  G  C  T  R  C  D  S  G  D  E  · 
11821    CGTAGAGGGTGAGATTCTTAGTGTAAGCGGAGGGTGTACAAGATGTGACAGCGGAGATGA 
          ·Q  F  T  W  F  H  L  P  S  N  I  E  L  T  D  D  T  S  K  N  · 
11881    ACAATTTACTTGGTTCCATCTTCCAAGCAATATAGAATTGACCGATGACACCAGCAAGAA 
          ·P  P  M  R  V  P  Y  L  G  S  K  T  Q  E  R  R  A  A  S  L  · 
11941    TCCTCCGATGAGGGTACCATATCTCGGGTCAAAGACACAGGAGAGGAGAGCTGCCTCACT 
          ·A  K  I  A  H  M  S  P  H  V  K  A  A  L  R  A  S  S  V  L  · 
12001    TGCAAAAATAGCTCATATGTCGCCACATGTAAAGGCTGCCCTAAGGGCATCATCCGTGTT 
          ·I  W  A  Y  G  D  N  E  V  N  W  T  A  A  L  T  I  A  K  S  · 
12061    GATCTGGGCTTATGGGGATAATGAAGTAAATTGGACTGCTGCTCTTACGATTGCAAAATC 
          ·R  C  N  V  N  L  E  Y  L  R  L  L  S  P  L  P  T  A  G  N  · 
12121    TCGGTGTAATGTAAACTTAGAGTATCTTCGGTTACTGTCCCCTTTACCCACGGCTGGGAA 
          ·L  Q  H  R  L  D  D  G  I  T  Q  M  T  F  T  P  A  S  L  Y  · 
12181    TCTTCAACATAGACTAGATGATGGTATAACTCAGATGACATTCACCCCTGCATCTCTCTA 
          ·R  V  S  P  Y  I  H  I  S  N  D  S  Q  R  L  F  T  E  E  G  · 
12241    CAGGGTGTCACCTTACATTCACATATCCAATGATTCTCAAAGGCTGTTCACTGAAGAAGG 
          ·V  K  E  G  N  V  V  Y  Q  Q  I  M  L  L  G  L  S  L  I  E  · 
12301    AGTCAAAGAGGGGAATGTGGTTTACCAACAGATCATGCTCTTGGGTTTATCTCTAATCGA 
           ClaI 
          ·S  I  F  P  M  T  T  T  R  T  Y  D  E  I  T  L  H  L  H  S  · 
12361    ATCGATATTTCCAATGACAACAACCAGGACATATGATGAGATCACACTGCACCTACATAG 
          ·K  F  S  C  C  I  R  E  A  P  V  A  V  P  F  E  L  L  G  V  · 
12421    TAAATTTAGTTGCTGTATCAGAGAAGCACCTGTTGCGGTTCCTTTCGAGCTACTTGGGGT 
          ·V  P  E  L  R  T  V  T  S  N  K  F  M  Y  D  P  S  P  V  S  · 
12481    GGTACCGGAACTGAGGACAGTGACCTCAAATAAGTTTATGTATGATCCTAGCCCTGTATC 
          ·E  G  D  F  A  R  L  D  L  A  I  F  K  S  Y  E  L  N  L  E  · 
12541    GGAGGGAGACTTTGCGAGACTTGACTTAGCTATCTTCAAGAGTTATGAGCTTAATCTGGA 
          ·S  Y  P  T  I  E  L  M  N  I  L  S  I  S  S  G  K  L  I  G  · 
12601    GTCATATCCCACGATAGAGCTAATGAACATTCTTTCAATATCCAGCGGGAAGTTGATTGG 
          ·Q  S  V  V  S  Y  D  E  D  T  S  I  K  N  D  A  I  I  V  Y  · 
12661    CCAGTCTGTGGTTTCTTATGATGAAGATACCTCCATAAAGAATGACGCCATAATAGTGTA 
          ·D  N  T  R  N  W  I  S  E  A  Q  N  S  D  V  V  R  L  F  E  · 
12721    TGACAATACCCGAAATTGGATCAGTGAAGCTCAGAATTCAGATGTGGTCCGCCTATTTGA 
          ·Y  A  A  L  E  V  L  L  D  C  S  Y  Q  L  Y  Y  L  R  V  R  · 
12781    ATATGCAGCACTTGAAGTGCTCCTCGACTGTTCTTACCAACTCTATTACCTGAGAGTAAG 
          ·G  L  D  N  I  V  L  Y  M  G  D  L  Y  K  N  M  P  G  I  L  · 
12841    AGGCCTAGACAATATTGTCTTATATATGGGTGATTTATACAAGAATATGCCAGGAATTCT 
          ·L  S  N  I  A  A  T  I  S  H  P  V  I  H  S  R  L  H  A  V  · 
12901    ACTTTCCAACATTGCAGCTACAATATCTCATCCCGTCATTCATTCAAGGTTACATGCAGT 
          ·G  L  V  N  H  D  G  S  H  Q  L  A  D  T  D  F  I  E  M  S  · 
12961    GGGCCTGGTCAACCATGACGGATCACACCAACTTGCAGATACGGATTTTATCGAAATGTC 
          ·A  K  L  L  V  S  C  T  R  R  V  I  S  G  L  Y  S  G  N  K  · 
13021    TGCAAAACTATTAGTATCTTGCACCCGACGTGTGATCTCCGGCTTATATTCAGGAAATAA 
          ·Y  D  L  L  F  P  S  V  L  D  D  N  L  N  E  K  M  L  Q  L  · 
13081    GTATGATCTGCTGTTCCCATCTGTCTTAGATGATAACCTGAATGAGAAGATGCTTCAGCT 
          ·I  S  R  L  C  C  L  Y  T  V  L  F  A  T  T  R  E  I  P  K  · 
13141    GATATCCCGGTTATGCTGTCTGTACACGGTACTCTTTGCTACAACAAGAGAAATCCCGAA 
          ·I  R  G  L  T  A  E  E  K  C  S  I  L  T  E  Y  L  L  S  D  · 
13201    AATAAGAGGCTTAACTGCAGAAGAGAAATGTTCAATACTCACTGAGTATTTACTGTCGGA 
          ·A  V  K  P  L  L  S  P  D  Q  V  S  S  I  M  S  P  N  I  I  · 
13261    TGCTGTGAAACCATTACTTAGCCCCGATCAAGTGAGCTCTATCATGTCTCCTAACATAAT 
          ·T  F  P  A  N  L  Y  Y  M  S  R  K  S  L  N  L  I  R  E  R  · 
13321    TACATTCCCAGCTAATCTGTACTACATGTCTCGGAAGAGCCTCAATTTGATCAGGGAAAG 
          ·E  D  R  D  T  I  L  A  L  L  F  P  Q  E  P  L  L  E  F  P  · 
13381    GGAGGACAGGGATACTATCCTGGCGTTGTTGTTCCCCCAAGAGCCATTATTAGAGTTCCC 
          ·S  V  Q  D  I  G  A  R  V  K  D  P  F  T  R  Q  P  A  A  F  · 
13441    TTCTGTGCAAGATATTGGTGCTCGAGTGAAAGATCCATTCACCCGACAACCTGCGGCATT 
          ·L  Q  E  L  D  L  S  A  P  A  R  Y  D  A  F  T  L  S  Q  I  · 
13501    TTTGCAAGAGTTAGATTTGAGTGCTCCAGCAAGGTATGACGCATTCACACTTAGTCAGAT 
          ·H  P  E  L  T  S  P  N  P  E  E  D  Y  L  V  R  Y  L  F  R  · 
13561    TCATCCTGAACTCACATCTCCAAATCCGGAGGAAGACTACTTAGTACGATACTTGTTCAG 
          ·G  I  G  T  A  S  S  S  W  Y  K  A  S  H  L  L  S  V  P  E  · 
13621    AGGGATAGGGACTGCATCTTCCTCTTGGTATAAGGCATCCCATCTCCTTTCTGTACCCGA 
          ·V  R  C  A  R  H  G  N  S  L  Y  L  A  E  G  S  G  A  I  M  · 
13681    GGTAAGATGTGCAAGACACGGGAACTCCTTATACTTAGCTGAAGGGAGCGGAGCCATCAT 
          ·S  L  L  E  L  H  V  P  H  E  T  I  Y  Y  N  T  L  F  S  N  · 
13741    GAGTCTTCTCGAACTGCATGTACCACATGAAACTATCTATTACAATACGCTCTTTTCAAA 
          ·E  M  N  P  P  Q  R  H  F  G  P  T  P  T  Q  F  L  N  S  V  · 
13801    TGAGATGAACCCCCCGCAACGACATTTCGGGCCGACCCCAACTCAGTTTTTGAATTCGGT 
          ·V  Y  R  N  L  Q  A  E  V  T  C  K  D  G  F  V  Q  E  F  R  · 
13861    TGTTTATAGGAATCTACAGGCGGAGGTAACATGCAAAGATGGATTTGTCCAAGAGTTCCG 
          ·P  L  W  R  E  N  T  E  E  S  D  L  T  S  D  K  A  V  G  Y  · 
13921    TCCATTATGGAGAGAAAATACAGAGGAAAGTGACCTGACCTCAGATAAAGCAGTGGGGTA 
          ·I  T  S  A  V  P  Y  R  S  V  S  L  L  H  C  D  I  E  I  P  · 
13981    TATTACATCTGCAGTGCCCTACAGATCTGTATCATTGCTGCATTGTGACATTGAAATTCC 
          ·P  G  S  N  Q  S  L  L  D  Q  L  A  I  N  L  S  L  I  A  M  · 
14041    TCCAGGGTCCAATCAAAGCTTACTAGATCAACTAGCTATCAATTTATCTCTGATTGCCAT 
          ·H  S  V  R  E  G  G  V  V  I  I  K  V  L  Y  A  M  G  Y  Y  · 
14101    GCATTCTGTAAGGGAGGGCGGGGTAGTAATCATCAAAGTGTTGTATGCAATGGGATACTA 
          ·F  H  L  L  M  N  L  F  A  P  C  S  T  K  G  Y  I  L  S  N  · 
14161    CTTTCATCTACTCATGAACTTGTTTGCTCCGTGTTCCACAAAAGGATATATTCTCTCTAA 
          ·G  Y  A  C  R  G  D  M  E  C  Y  L  V  F  V  M  G  Y  L  G  · 
14221    TGGTTATGCATGTCGAGGAGATATGGAGTGTTACCTGGTATTTGTCATGGGTTACCTGGG 
          ·G  P  T  F  V  H  E  V  V  R  M  A  K  T  L  V  Q  R  H  G  · 
14281    CGGGCCTACATTTGTACATGAGGTGGTGAGGATGGCAAAAACTCTGGTGCAGCGGCACGG 
          ·T  L  L  S  K  S  D  E  I  T  L  T  R  L  F  T  S  Q  R  Q  · 
14341    TACGCTTTTGTCTAAATCAGATGAGATCACACTGACCAGGTTATTCACCTCACAGCGGCA 
          ·R  V  T  D  I  L  S  S  P  L  P  R  L  I  K  Y  L  R  K  N  · 
14401    GCGTGTGACAGACATCCTATCCAGTCCTTTACCAAGATTAATAAAGTACTTGAGGAAGAA 
          ·I  D  T  A  L  I  E  A  G  G  Q  P  V  R  P  F  C  A  E  S  · 
14461    TATTGACACTGCGCTGATTGAAGCCGGGGGACAGCCCGTCCGTCCATTCTGTGCGGAGAG 
          ·L  V  S  T  L  A  N  I  T  Q  I  T  Q  I  I  A  S  H  I  D  · 
14521    TCTGGTGAGCACGCTAGCGAACATAACTCAGATAACCCAGATCATCGCTAGTCACATTGA 
          ·T  V  I  R  S  V  I  Y  M  E  A  E  G  D  L  A  D  T  V  F  · 
14581    CACAGTTATCCGGTCTGTGATATATATGGAAGCTGAGGGTGATCTCGCTGACACAGTATT 
          ·L  F  T  P  Y  N  L  S  T  D  G  K  K  R  T  S  L  K  Q  C  · 
14641    TCTATTTACCCCTTACAATCTCTCTACTGACGGGAAAAAGAGGACATCACTTAAACAGTG 
          ·T  R  Q  I  L  E  V  T  I  L  G  L  R  V  E  N  L  N  K  I  · 
14701    CACGAGACAGATCCTAGAGGTTACAATACTAGGTCTTAGAGTCGAAAATCTCAATAAAAT 
          ·G  D  I  I  S  L  V  L  K  G  M  I  S  M  E  D  L  I  P  L  · 
14761    AGGCGATATAATCAGCCTAGTGCTTAAAGGCATGATCTCCATGGAGGACCTTATCCCACT 
                                                          AvrII 
          ·R  T  Y  L  K  H  S  T  C  P  K  Y  L  K  A  V  L  G  I  T  · 
14821    AAGGACATACTTGAAGCATAGTACCTGCCCTAAATATTTGAAGGCTGTCCTAGGTATTAC 
          ·K  L  K  E  M  F  T  D  T  S  V  L  Y  L  T  R  A  Q  Q  K  · 
14881    CAAACTCAAAGAAATGTTTACAGACACTTCTGTACTGTACTTGACTCGTGCTCAACAAAA 
          ·F  Y  M  K  T  I  G  N  A  V  K  G  Y  Y  S  N  C  D  S 
14941    ATTCTACATGAAAACTATAGGCAATGCAGTCAAAGGATATTACAGTAACTGTGACTCTTA 
15001    Acgaaaatcacatattaataggctccttttttggccaattgtattcttgttgatttaatc 
                   基因结束 
15061    atattatgttagaaaaaagttgaaccctgactccttaggactcgaattcgaactcaaata 
15121    aatgtcttaaaaaaaggttgcgcacaattattcttgagtgtagtctcgtcattcaccaaa 
                  HDV ribozyme sequences 
15181    tctttgtttggtGGGTCGGCATGGCATCTCCACCTCCTCGCGGTCCGACCTGGGCATCCG 
15241    AAGGAGGACGTCGTCCACTCGGATGGCTAAGGGAGAGCtcggatccggctgctaacaaag 
                                       T7终止子 
15301    cccgaaaggaagctgagttggctgctgccaccgctgagcaataaCTAGCATAACCCCTTG 
15361    GGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGcatatgcggtgtgaaataccgcacagat 
15421    gcgtaaggagaaaataccgcatcaggcgctcttccgcttcctcgctcactgactcgctgc 
15481    gctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttat 
15541    ccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggcca 
15601    ggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagc 
15661    atcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagatacc 
15721    aggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccg 
15781    gatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgta 
15841    ggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccg 
15901    ttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagac 
15961    acgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtag 
16021    gcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtat 
16081    ttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgat 
16141    ccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgc 
16201    gcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagt 
16261    ggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacct 
16321    agatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaactt 
16381    ggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttc 
16441    gttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttac 
16501    catctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttat 
16561    cagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccg 
16621    cctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaata 
16681    gtttgcgcaacgttgttgccattgctgcaggcatcgtggtgtcacgctcgtcgtttggta 
16741    tggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgt 
16801    gcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcag 
16861    tgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaa 
16921    gatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggc 
16981    gaccgagttgctcttgcccggcgtcaacacgggataataccgcgccacatagcagaactt 
17041    taaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgc 
17101    tgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatctttta 
17161    ctttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaa 
17221    taagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagca 
17281    tttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaac 
17341    aaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccatta 
17401    ttatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtcttcaagaat 
              T7启动子 
17461    TCTAATACGACTCACTATAGG 
由用于转录该基因组(pTNH-c4152R2L)的载体所表达的NP、P、M、F、HN和L蛋白的氨基酸序列分别显示于SEQ ID NO:2-7中。 
在另一个方面,本发明涉及包括P、M、F、HM和L基因的编码区的重组体新城疫病毒,其中所述NP、P、M和L基因的编码区源自低致病性新城疫病毒,F和HN基因的编码区源自高致病性新城疫病毒,其中所述F蛋白编码序列的特征在于,以任一选自以下的密码子替换高致病性新城疫病毒的F蛋白第115位的氨基酸的密码子:包括GCA、GCC、GCG和GCU的丙氨酸密码子;包括GAC和GAU的天冬氨酸密码子;包括UUC和UUU的苯丙氨酸密码子;包括AUC和AUU的异亮氨酸密码子;包括UUA和UUG的亮氨酸密码子;包括UCA、UCC、UCG和UCU的丝氨酸密码子;包括ACC和ACU的苏氨酸密码子;包括GUA、GUC、GUG和GUU的缬氨酸密码子;以及包括UAC和UAU的酪氨酸密码子。 
该重组体新城疫病毒的HN基因可以被额外地突变,使得HN蛋白的第1-569位氨基酸的密码子编码高致病性新城疫病毒的相应氨基酸,第570位之后的氨基酸的密码子编码低致病性新城疫病毒(包括La Sota毒 株)的相应氨基酸。 
在本发明的一个优选实施方案中,该重组体新城疫病毒可以为KCTC10984BP 
根据本发明的重组体新城疫病毒的特征在于,其表面抗原和抗原性与高致病性野毒株相同或类似,且致病性低于现有的低致病性疫苗株的致病性。所述致病性新城疫病毒在F蛋白中具有费林蛋白酶的识别切割区,并且当该切割区被费林蛋白酶切割的时候,F蛋白与细胞膜融合的融合肽区被暴露,从而获得侵染性。因为费林蛋白酶分布于体内大多数细胞中,所以新城疫病毒在体内可全身性感染,从而呈现出高致病性。 
在用于转录本发明的病毒基因组的载体中,所述低致病性新城疫病毒与上文所定义的相同,例如所述低致病性新城疫病毒可选自I型和II型的新城疫病毒,并且优选可以是属于II型的La Sota/46毒株(AY845400)。所述高致病性新城疫病毒与上文所定义的相同,它可以是选自V型、VI型、VII型、VIII型和XI型的新城疫病毒(它们是全世界流行的野毒株)的任一种,并且优选地选自VI型和VII型的新城疫病毒。在本发明的一个优选实施方案中,所述高致病性新城疫病毒可以为KBNP-4152(保藏号KCTC10919BP)。制备KBNP-4152毒株的方法及其特征与韩国专利申请2006-0026667和′Cho SH,Ahn YJ,Kim SJ,Kwon HJ.Characterization ofa Newcastle disease virus with variation in the majorHemagglutinin-Neuraminidase(HN)linear epitope.The49th AnnualMeeting of the Korean Society of Veterinary Science 2005,45(3,suppl),199′中记载的相同,它们通过引用的方式纳入本文。只要本文使用的高致病性新城疫病毒和低致病性新城疫病毒被不同地定义,就按照上文所述对它们进行定义。 
在使用常规的反求遗传学对新城疫病毒进行减毒时,一个实例是以甘氨酸替换第115位氨基酸,但是对该替换的甘氨酸的密码子的仅一个碱基进行的任意突变均可导致第115位氨基酸变成碱性氨基酸例如赖氨酸和精氨酸,所述病毒可再次恢复其致病性。 
然而,在根据本发明的重组体新城疫病毒中,以编码非碱性氨基酸的密码子替换F蛋白的第115位氨基酸,其中除非出现至少两个点突变,否则编码该非碱性氨基酸的密码子不能被转换成编码碱性氨基酸的密码子。因此,重组体病毒恢复其致病性的可能性很低,并且与现有的其他减毒毒 株相比该病毒的稳定性显著增加。当根据本发明对F蛋白的切割位点进行突变的时候,F蛋白的切割位点不是由费林蛋白酶切割的——由此不会发生全身感染——而是由仅分布于体内少数器官(呼吸器官和消化器官)中的胰蛋白酶或胰蛋白酶样酶切割的,导致局部感染。 
为了达到这样的效果,以任一选自以下的密码子替换本发明的F蛋白的第115位氨基酸的密码子:包括GCA、GCC、GCG和GCU的丙氨酸密码子;包括GAC和GAU的天冬氨酸密码子;包括UUC和UUU的苯丙氨酸密码子;包括AUC和AUU的异亮氨酸密码子;包括UUA和UUG的亮氨酸密码子;包括UCA、UCC、UCG和UCU的丝氨酸密码子;包括ACC和ACU的苏氨酸密码子;包括GUA、GUC、GUG和GUU的缬氨酸密码子;以及包括UAC和UAU的酪氨酸密码子。 
在另一方面,本发明涉及一种制备重组体新城疫病毒的方法,包括以下步骤: 
将编码低致病性新城疫病毒的F和HN蛋白的核苷酸序列以高致病性新城疫病毒的相应序列替换;以任一选自以下的密码子替换高致病性新城疫病毒的F蛋白的第115位氨基酸的密码子:包括GCA、GCC、GCG和GCU的丙氨酸密码子;包括GAC和GAU的天冬氨酸密码子;包括UUC和UUU的苯丙氨酸密码子;包括AUC和AUU的异亮氨酸密码子;包括UUA和UUG的亮氨酸密码子;包括UCA、UCC、UCG和UCU的丝氨酸密码子;包括ACC和ACU的苏氨酸密码子;包括GUA、GUC、GUG和GUU的缬氨酸密码子;以及包括UAC和UAU的酪氨酸密码子, 
其中该病毒的特征在于具有等于或类似于高致病性新城疫病毒的抗原性,以及降低的致病性。 
在制备该重组体新城疫病毒过程中,所述HN基因可以被额外地突变,使得HN蛋白的第1-569位氨基酸的密码子编码高致病性新城疫病毒的相应氨基酸,第570位之后的氨基酸的密码子编码低致病性新城疫病毒(包括La Sota毒株)的相应氨基酸。 
另外,该方法包括以下步骤:将上述用于转录根据本发明的新城疫病毒基因组的载体转染至宿主细胞中;并拯救重组体新城疫病毒。对于用于转染的宿主细胞没有特别的限制,可优选地为选自Hep2和BHK21的动物细胞。 
在另一方面,本发明涉及一种弱化新城疫病毒的致病性并且提高其抗 原性和稳定性的方法,包括以下步骤: 
将编码低致病性新城疫病毒的F和HN蛋白的核苷酸序列以高致病性新城疫病毒的相应序列替换;以及 
以任一选自以下的密码子替换编码高致病性新城疫病毒的F蛋白的第115位氨基酸的密码子:包括GCA、GCC、GCG和GCU的丙氨酸密码子;包括GAC和GAU的天冬氨酸密码子;包括UUC和UUU的苯丙氨酸密码子;包括AUC和AUU的异亮氨酸密码子;包括UUA和UUG的亮氨酸密码子;包括UCA、UCC、UCG和UCU的丝氨酸密码子;包括ACC和ACU的苏氨酸密码子;包括GUA、GUC、GUG和GUU的缬氨酸密码子;以及包括UAC和UAU的酪氨酸密码子。 
在该方法中,所述载体的HN基因可以被额外地突变,使得HN蛋白的第1-569位氨基酸的密码子编码高致病性新城疫病毒的相应氨基酸,第570位之后的氨基酸的密码子编码低致病性新城疫病毒(包括La Sota毒株)的相应氨基酸。 
在另一方面,本发明涉及一种包含所述重组新城疫病毒的新城疫病疫苗,具有如上文所述的增加的抗原性和降低的致病性。该新城疫病疫苗可以是通过将重组新城疫病毒灭活获得的灭活疫苗。可通过应用本发明所属技术领域中已知的常规方法进行灭活,所述技术例如使用甲醛或氢溴酸溴甲基胺(bromomethyl amine hydrobromide)等。或者,由于重组新城疫病毒的低致病性、高稳定性和高安全性,还可能使用活疫苗形式或可直接应用至受精卵的卵内疫苗形式的新城疫病疫苗。当使用活疫苗形式的本发明的疫苗的时候,其给药途径没有限制,例如为与症状和目的相适应,可以通过皮下或肌肉途径给予它或者通过喷雾或饮水的方式给予它。本发明的疫苗剂量可能依赖于给予方法和被给予的受试者的状况,例如所述疫苗剂量可以为101EID50(50%卵感染剂量)至1012EID50毒株/个体。更具体而言,在灭活疫苗的情况下,疫苗用量可优选地为106.0~12EID50/个体,更优选108.0~10EID50/个体。在卵内疫苗的情况下,根据待给予的卵中母系抗体水平使用的疫苗可优选为101~9.0EID50/蛋的量,更优选103.0~7.0EID50/蛋的量。 
如上文所述,可通过F蛋白的费林蛋白酶的识别切割区的氨基酸序列来确定新城疫病毒的致病性。即,如果F蛋白的费林蛋白酶的识别切割区的氨基酸序列是R-X-K/R-R(位于第113-116位;在下文中,除非该位置 区间定义不同,否则它适用于所有的氨基酸四聚体),那么F蛋白可被存在于全身的所有细胞中的费林蛋白酶切割并被激活,导致全身性感染,从而显示高致病性。相反,如果仅有一个碱性氨基酸或有不连续的碱性氨基酸(例如R-Q-G-R或G-Q-G-R),那么F蛋白被仅存在于消化道和器官的部分上皮细胞中的胰蛋白酶或其类似物激活,导致局部的感染,从而显示低致病性。对于HN,高致病性病毒包含571个氨基酸,该氨基酸长度相对较短。相反,低致病性病毒包含577或616个氨基酸,该氨基酸长度相对较长,其中的额外C末端区使得有可能区别高致病性病毒与低致病性病毒。因此,通过制备具有HN的额外C末端区和F蛋白的切割位点的多种组合的重组体病毒,有可能制备具有多种致病性水平的病毒。 
具体而言,本发明的特征在于,F蛋白的切割位点的氨基酸序列被更安全的氨基酸序列替换,目的是抑制该重组体病毒通过任何可能的遗传变异获得致病性。如上文所述,低致病性病毒F蛋白的切割位点的氨基酸序列是R-Q-G-R或K-Q-G-R。为了将该低致病性病毒改造成高致病性病毒,应将上述氨基酸序列改变成R-X-K/R-R,因此位于第三位的甘氨酸(G)必须变成精氨酸(R)或赖氨酸(K)。这种从G至R或K的变化可很容易地仅通过一个点突变来实现。即,考虑到甘氨酸密码子为GGA、GGC、GGG或GGU,以及精氨酸或赖氨酸密码子为AGA、AGG、CGA、CGC、CGG、CGU、AAA或AAG,在任一甘氨酸密码子中出现甚至仅一个点突变即可将甘氨酸容易地改造成精氨酸或赖氨酸,导致低致病性病毒转换成高致病性病毒。事实上,2001年在澳大利亚已有报道称,非致病性新城疫病毒Ulster样毒株通过类似于上述的机制变成致病性的,从而引起新城疫病。 
因此,为了显著地降低所述疫苗株中任何点突变所导致的与现有株相比致病性增加的可能性,本发明提供了一种使用诸如PTDS(基于PCR的两步DNA合成)方法的任意常规方法来制备重组体病毒的技术,其中该重组体病毒呈现出较低的这种由点突变导致的氨基酸变成赖氨酸或精氨酸的可能性。即,在本发明中,位于常规低致病性病毒的F蛋白第115位的氨基酸——甘氨酸被选自以下的任一氨基酸替换:丙氨酸、天冬氨酸、苯丙氨酸、异亮氨酸、亮氨酸、丝氨酸、苏氨酸、缬氨酸和色氨酸,例如形成R-Q-A-R或G-Q-A-R,其中仅当第115位甘氨酸的替换氨基酸的密码子中所有或至少2个碱基突变时,所述第115位甘氨酸的替换氨基酸才 可变成赖氨酸或精氨酸,使得可制备更安全的疫苗株。 
重组体新城疫病毒的致病性水平通过测量平均死亡时间(MDT)和脑内病原指数(ICPI)来确定。重组体新城疫病毒的生物性质通过EID50(50%卵感染剂量)、血凝离解率等来确证。结果是,根据本发明的重组体新城疫病毒具有比现有低致病毒株显著更低的致病性。 
通过参考以下实施例,进一步对本发明进行更详细的说明。然而,不应将这些实施例解释为以任何方式的限制本发明的范围。 
[实施例] 
实施例1:克隆病毒基因 
1.1病毒DNA的合成 
选择一种代表新城疫病毒的病毒,该病毒是最近国内流行的速发型抗原变异毒株SNU4152毒株,由College of Veterinary Medicine of SeoulNational University的Avian Disease & Laboratory分离。在鸡胚成纤维细胞(CEF)进行3次斑块纯化后,克隆该病毒,并将其在SPF含胚卵中传代培养两次。所克隆的病毒毒株被命名为KBNP-4152(保藏号KCTC10919BP)。 
在无核糖核酸酶(RNase)的玻璃器皿和塑料器皿中进行RNA操作,所有溶液均使用高压灭菌并且以1%焦碳酸二乙酯(DEPC)处理的三蒸水(DEPC-DW)。然后,将该病毒在Beckman SW40转子中以21,000rpm离心70min,并将得到的沉淀片再悬浮于悬浮溶液(50mM Tris HClpH7.5、50mM EDTA、0.5%SDS)中。以蛋白酶K(200μg/ml,InvitrogenCo.)在37℃下处理90min后,通过酸性酚提取(acidic phenol extraction)来提取RNA。然后,在通过乙醇沉淀将所述RNA沉淀后,将所得到的沉淀经75%乙醇洗涤、干燥并再悬浮于DEPC-处理水中。 
将1μl的经紫外线分光计(Eppendorf,Biophotometer)定量的所述提取RNA、1μl的在表1中显示的引物(10pmol/μl)和10μl的DEPC-水混合,使该混合物在70℃下变性10min。向该混合物中添加4μl的5×RT缓冲溶液(250mM Tris-HCl,pH 8.3,375mM KCl,15mM MgCl2;GibcoBRL/Life Technologies)、2μl的0.1M DTT和2μl的10mM dNTP(各2.5mM)后,使该混合物在42℃下反应2min。然后,向该反应混合物中添加1μl的逆转录酶(200单位,Invitrogen co.),然后使其在42 ℃下反应60min。 
[表1]用于合成KBNP-4152 cDNA的引物 
Figure G2006800564366D00291
1.2.病毒基因的克隆 
基于以前的GenBank数据,通过PCR反应使用表2中列出的9组引物扩增9类相当于15,192bp的核苷酸序列的合成病毒cDNA,并将其克隆。所得到的克隆被命名为Z1至Z9。 
[表2]用于克隆KBNP-4152病毒基因的引物 
Figure G2006800564366D00292
Figure G2006800564366D00301
为了减少PCR反应过程中的人工突变,使用了具有DNA修复功能的Pwo聚合酶(Invitrogen co.)。另外,将PCR产物通过可溶的纯化试剂盒(soluble purification kit)(Boehringer Mannheim Co.)或通过琼脂糖胶纯化试剂盒(Qiagen Co.)进行纯化。 
通过RT-PCR所获得的KBNP-4152病毒基因的产物的定位显示于图1中。 
将该9类纯化产物分别克隆至TA载体中,例如XL-Topo、pCR8/GW/Topo或pcDNA3.1V5 Topo载体(Invitrogen co.),并得到3个以上的克隆。然后,制备这些克隆的质粒并确定质粒的核苷酸序列。 
使用循环测序试剂盒(PRISM Ready Reaction Dye终止子试剂盒)和自动DNA测序仪(ABI310,Applied Biosystems Co.)确定所有核苷酸序列。 
用于核苷酸序列分析的引物分别是M13正向引物和M13反向引物。对于未被引物识别(read)的片段的情况,依照引物步行方法使用在表3中显示的引物分析这些核苷酸序列。 
[表3]用于分析KBNP-4152病毒的核苷酸序列的引物 
Figure G2006800564366D00302
Figure G2006800564366D00311
如上述的TA-克隆载体显示于图2B中,通过PCR将插入至以EcoRI处理的所述载体中的片段的大小显示于图2A中。 
KBNP-4152毒株显示了与SF02(源自中国的鹅)的最大核苷酸序列同源性和氨基酸序列同源性,尤其是对于病毒蛋白NP、P、M和L,同源性高于约98%,而对于P、V和HN,显示了约97.6%和95.0%的相对低的同源性。序列同源性结果显示于表4中。 
[表4]KBNP-4152毒株和其他毒株之间的序列同源性 
Figure G2006800564366D00312
a:氨基酸序列同源的百分数(%) 
b:核苷酸序列同源的百分数(%) 
具体而言,可以认为V蛋白上的突变可大大阻碍细胞中干扰素的表达,这是因为这种氨基酸突变可在克服细胞的防御系统的过程中积累。另外,可以认为HN蛋白上的突变相对较大,这是因为具有特定氨基酸突变的病毒会在避免在线性抗原的突变中已知的体液免疫反应的过程中被筛选。KBNP-4152毒株的各基因的氨基酸序列和核苷酸序列被登记在GenBank中(登记号DQ839397)。另外测量了HN和F蛋白的半胱氨酸残基和N-连接的糖基化位点的变化、影响HN蛋白的结构和极性的氨基 酸的变化以及影响F蛋白的结构和极性的氨基酸的变化。这些变化显示于表5至7。 
[表5]HN和F蛋白的半胱氨酸残基和N-连接的糖基化位点的变化 
Figure G2006800564366D00321
[图6]影响HN蛋白的结构和极性的氨基酸的变化 
Figure G2006800564366D00322
a未测定 
[图7]影响F蛋白的结构和极性的氨基酸的变化 
如这些结果中显示的,证实了:本发明中使用的KBNP-4152毒株具有类似于基因VII型的基因型,并且该毒株与其他病毒型(与包括以前的疫苗株La Sota毒株)有遗传差异。 
实施例2:用La Sota毒株作为骨架制备用于转录新城疫病毒(NDV)基因组的重组体载体 
2.1.表达新城疫病毒(NDV)的亲本载体(pTMH)的设计和构建 
为了从NDV cDNA制备病毒,必须以与所述病毒基因组相同的结构转录该cDNA,而不能在所述病毒基因组的5’-末端和3’-末端添加不必要的碱基。为了获得这种结构,制备了具有以下特征的亲本载体pTMH(SEQ ID NO:84): 
1)一个T7启动子位于转录起始位点的前端(参考图1和图4)。 
2)一条肝炎δ病毒(HDV)核酶序列位于NDV反基因组序列(antigenomic sequence)后面,以发生自切割。 
3)一个用于克隆NDV基因组的多克隆位点(MCS)最终位于T7启动子和HDV核酶之间(参考图4)。 
4)使用pBR322的复制起点(ori),以使克隆载体稳定地存在于大肠杆菌中,即使在包括相当于约15kb核苷酸序列的全NDV反基因组的情况下。 
5)将两个不同的限制性内切酶识别位点BsmB I和Bsa I置于T7启动子和反基因组的5’-末端之间(NDV的转录在其中起始),以及置于HDV核酶和反基因组的3’-末端之间(NDV的转录在其中终止),以便具体地从NDV反基因组转录病毒基因组的两个末端(参考图3)。 
如图4中所示,将用于制备连接子的TM p1-p4引物中的TM p2引物和TM p3引物各1.5pmol、TM p1引物和TM p4引物各30pmol、5μl的10X PCR缓冲物、5μl的2.5mM dNTP以及2.5U的Taq聚合酶混合,然后在该混合物中添加DW以使总体积为50μl。然后,使该混合物反应在94℃下1min,随后是25个循环:在90℃下30sec、在55℃下45sec及在72℃下15sec,然后在72℃下进一步反应5min。在确证该PCR扩增子以后,将其克隆至pCR8/GW/Topo TA克隆载体中,所获得的具有全核苷酸序列的克隆被命名为pCR-TM载体。 
通过使用HDV的F和R引物以及模板pTV载体(获自MogamBiotechnology Research Institute的Park MH博士)的PCR方法,扩增了包括HDV核酶和T7终止子区的片段,所得到的片段也被克隆至pCR8/GW/Topo TA克隆载体中,所获得的具有全核苷酸序列的克隆被命名为pCR-HDV。 
将以限制性内切酶Bsa I和Nde I切割pCR-HDV载体产生的HDV片段以及以相同限制性内切酶切割的pCR-TM载体用T4 DNA连接酶连接,并将其转化至Top10F’感受态细胞中。然后,将所获得的转化载体命名为pCR-TMH。为了将所述载体稳定地克隆至大肠杆菌中,将通过限制性内切酶EcoR I和Nde I处理的pCR-TMH载体的T7启动子-MCS-HDV核酶区亚克隆至pBR322载体(Promega Co.,Cat.#D1511)中,并将所得到的克隆命名为pTMH载体(SEQ ID NO:84)。 
制备pTMH载体的过程的原理图显示于图5中,亲本载体pTMH的一般切割图谱和核苷酸序列显示于图6中,所制备的pTMH载体的核苷酸序列显示于图7中。 
在本发明的一个实施方案中,所制备的亲本载体pTMH的限制性内切酶识别位点如下: 
(未出现位点) 
AccI AflII AgeI AvaI BclI BglII BsaAI BsaBI BsmF IBsmI BspMI BssHII BstBI BstEII Bsu36I EagI EcoRVHindIII HpaI KpnI Mfe I MluI NaeI NcoI NheI NotI NsiIPmeI PvuII SalI SfiI SmaI SphI XbaI XcmI XhoI XmaI 
(出现一个位点) 
XmnI 1959  SspI 2166  SpeI 64  SacII 55 
SacI 175  RsrI 0  PstI 1605  NspI 471 
NruI 49  NdeI 293  HincII 1903  FspI 1584 
EcoRI 0  EaeI 1752  ClaI 43  BstXI 155 
BsmB I 30  BsiWI 70  Bmr I 1404  BglI 1478 
BanI 1312  BamHI 181  AvrII 76  AseI 1535 
Apo I 0  ApaI 35  AlwNI 882  AflIII 471 
(出现两个位点) 
StyI 76,256  RsaI 71,1843  HaeII 345,715 
ApaLI 785,2031  AatII 147,2282  Bsa I 82,1431* 
2.2.La Sota毒株的全cDNA的克隆 
La Sota/46毒株(AY845400)的RNA提取和cDNA合成通过实施例1的方法进行。 
2.2.1NDV全长cDNA的PCR 
基于GenBank数据,通过实施例1的方法,通过PCR反应使用在表8中显示的引物组来扩增相当于15,186bp的核苷酸序列的全NDV cDNA,并将其克隆。 
[表8]用于克隆La Sota毒株全基因组基因的引物 
Figure G2006800564366D00351
通过RT-PCR获得的La Sota毒株基因的产物的位置显示于图8中。 
分别将8部分的La Sota毒株基因插入至TA-克隆载体中的载体图显示于图9A,用PCR将插入至以EcoRI处理的该载体中的片段的大小显示于图9A中。 
2.2.2.NDV全长cDNA的克隆和序列分析 
在将所扩增的PCR产物经琼脂糖凝胶电泳评估后,将所得到的凝胶经GenClean IIITM(Qbio Co.)纯化,并用Topo克隆试剂盒(Invitrogen)或XL-Topo克隆试剂盒(Invitrogen)克隆。将得到的每个克隆的所有核苷酸序列用载体上的引物(例如M13正向、M13反向等)或者用在表9中显示的引物分析。结果是,选择了具有与以前已知的La Sota毒株相同核苷酸序列的克隆,即那些其中未发生突变的克隆。 
[表9]用于分析La Sota毒株基因组的核苷酸序列的引物 
Figure G2006800564366D00361
Figure G2006800564366D00371
将核苷酸序列未出现突变的所有克隆分别克隆至亲本载体pTMH的多克隆位点中,如图10中所示。同时,在L基因之间引入了新的限制性识别位点。该克隆过程显示于图10中。 
2.2.3.表达用于形成RNP复合体的NP、P和L蛋白的载体的制备 
为了制备用于表达新城病毒的NP、P和L蛋白的载体,通过RT-PCR反应使用在表10中显示的引物分别对La Sota毒株的NP、P和L基因进行扩增,并将扩增的产物克隆至TA-克隆载体中。在对这些克隆进行测序分析后,仅将核苷酸序列未出现突变的克隆以NotI处理,并将其亚克隆至pcDNA6/V5载体的NotI位点中。 
[表10]用于扩增并克隆La Sota毒株的NP、P和L基因的引物 
Figure G2006800564366D00372
通过RT-PCR获得的NP、P和L基因的扩增产物显示于图11A中。将每个基因克隆至TA-克隆载体中,并通过测序分析选择了核苷酸序列未出现突变的克隆。所选择的克隆显示于图11B中。 
2.3.具有速发型野NDV的表面抗原的重组体缓发型NDV的制备 
2.3.1.弱化了速发型KBNP-4152的F和HN基因的重组体克隆的制备 
在本发明的一个实施方案中,制备了一种用于转录NDV基因组的重组体载体,其中使用La Sota毒株作为骨架,将最近在国内流行的速发型新城疫病毒KBNP-4152的F和HN基因插入至用于转录La Sota毒株(rNDV)的载体中。 
2.3.2.重组体病毒基因的合成 
使用定向诱变或PTDS(PCR DNA合成)(Xiong,A.S.et al.,2004,Nucleic Acids Research,Vol32,No.12 e98)获得各个改造的F和HN基因。制备过程显示于图12-15中。 
(A)合成一个基因,该基因具有La Sota M基因的3’-末端、KBNP-4152F基因的连接子以及KBNP-4152F基因切割位点的经改造的核苷酸序列。 
为了制备重组体病毒,将两个基因融合,该两个基因具有La Sota毒株中最长至M基因3’-末端的基因组序列以及具有KBNP-4152最长至基因间序列和基因起始序列的核苷酸序列(参考图13)。为了弱化F基因,将该基因突变以使得即位于切割位点的氨基酸密码子编码一个或两个碱性氨基酸(即从112-RRQKRF-117变成112-GRQARL-117)。如图14中所示,合成引物,并添加依照箭头方向组合的引物。然后,通过定向诱变和PTDS人工合成该基因。 
(B)然后,将KBNP-4152HN(1-569)基因和La Sota毒株的HN基因末端(570-577)连接。结果是,连接位点的核苷酸序列如下(SEQ IDNO:85,下划线部分是La Sota毒株的HN C-末端编码序列)。 
ccctttACTAGTTGAGATTCTCAAGGATGATGGGGTTAGGGAGGCCAGGGCTGGCCGCTT 
GAGTCAATTGCGAGAGGGTTGGAAAGATGACATTGTATCACCTATCTTTTGCGACGCCAA 
GAATCAAACTGAGTACCGGCGTGAGCTCGAGTCTTACGCTGCCAGCTGGCCATAATCAGC
TAGCGCTAATGTGATTAGATTAAATCTTGTCGATAGTCACTTGATTAAGAAAAAATGTAA
GTGGCAATGAGATACAAGGCAAAACAGCTCATGGTAAATAATACGGGTAGGACATGGCGA
(C)如上文所述,为了连接KBNP-4152 HN(1-569)基因和La Sota毒株的HN基因末端(570-577),如图15中所示设计了引物,并进行了PTDS。 
2.3.3.嵌合体NDV(KBNP-C4152R2L)拯救 
在6-孔板中培养HEp-2(韩国典型培养物保藏中心(Korea Collectionfor Type Cultures))或BHK21(获自Mogam Biotechnology ResearchInstitute的Park MH博士)细胞系(37℃,5%CO2)至80%的汇合,然后感染牛痘苗T7病毒(获自Mogam Biotechnology Research Institute的Park MH博士)。为了在该细胞系上形成NDV的RNP复合体,制备了用于表达NP、P和L基因组基因的三种表达质粒pcDNA3.1-NP、pcDNA3.1-P和pcDNA3.1-L载体(图11B),以及一种NDV基因组的转录载体pTMH C4152-R2L(SEQ ID NO:1,参考图23)。为了制备重组体载体pTMH C4152-R2L,将KBNP-4152的弱化的F基因和HN基因(1-569)插入至La Sota毒株基因组的M基因后面的基因间序列位点和HN基因的第570位氨基酸编码位点之间。 
将10μl的Lipofectamine TM(Invitrogen Co.)与各质粒载体以1∶1∶0.1∶1比例混合的4μg质粒DNA混合,并转染HEp-2细胞系。然后,将1μl/ml的乙酰化胰蛋白酶添加至该培养基中。将该细胞系在37℃下在6-孔板中培养2-3天,收集培养的细胞和培养基并进行3次快速冷冻和快速解冻。然后,将该细胞和培养基接种至9-11日龄的SPF含胚卵中,并收集含胚卵的尿囊液。结果是,从尿囊液获得新城疫病毒并将该病毒命名为KBNP-C41152R2L毒株。该KBNP-C41152R2L毒株于2006年9月12日被保藏于韩国典型培养物保藏中心(Korea Research Institute ofBioscience and Biotechnology,Taejon,Republic of Korea),分配的保藏号为KCTC10984BP。 
制备KBNP-C4152R2L病毒的过程显示于图16中。 
依照与上述相同的方法,分别制备了在F蛋白的切割位点具有4个碱性氨基酸的速发型NDV(名称为RRQKRF;KBNP-4152R4L)以及具有1个碱性氨基酸的缓发型NDV(名称为GGQARL;KBNP-C4152R1L)。所述毒株名称是根据F蛋白的切割位点的碱性氨基酸数目确定的,其中R后面的数字表示112-116位氨基酸中的碱性氨基酸数目,L(长)表示具有类似于La Sota毒株的577个氨基酸的HN蛋白的长度。 
所获得的KBNP-C4152R1L、KBNP-C4152R2L和KBNP-C4152R4L的示意图显示于图17中。 
实施例3:分析KBNP-C4152R2L 
3.1.嵌合体NDV的一般特征分析 
将所获得的KBNP-C4152R2L接种于9-10日龄的SPF含胚卵中,并且在3-5天后收集该含胚卵的尿囊液。然后,通过使用平板血凝试验确证该重组体NDV是否生长。结果显示于图18中。如图18中所示,在从以KBNP-C4152R2L接种的含胚卵获得的尿囊液中出现了血凝,因此确证了KBNP-C4152R2L的生长。 
KBNP-C4152R2L与KBNP-4152相同,其中大多数的F和HN基因为野速发型的,但是该病毒的F蛋白的切割位点是被人工弱化的。具体而言,通过PCR使用速发型NDV-特异性的引物没有检测到该病毒RNA,但通过PCR使用所有NDV的通用检测引物检测到了这种RNA。这项事实可利用重组体NDV的基因标记物通过以下方式确证,该方式即确定通过RT-PCR使用在表5中显示的NDV-pt-R和NDVcomF156引物获得的扩增病毒RNA序列。通过RT-PCR方法,检测了所述嵌合体病毒,并确证了致病类型(致病型)。结果显示于图19中。如图19中所示,通过PCR使用NDV通用引物(NDVcomF156)可检测到KBNP-C4152R2L,但通过PCR使用致病毒株-特异性的引物(NDV-pt-R)不能检测到它(韩国专利0451883)。 
为了更详细地鉴定该病毒,在RT-PCR后分析了其核苷酸序列,并确证了人工合成的、编码F基因的切割位点的核苷酸序列。结果显示于图20中。如图20中所示,亲本毒株KBNP-4152的F蛋白的切割位点具有112-RRQKRF-117的结构,而KBNP-C4152R2L具有112-GRQARL-117的结构。具体而言,天然NDV在第115位氨基酸的位置不具有丙氨酸(A),而本发明的嵌合体病毒具有丙氨酸。这是仅所述嵌合体病毒具有的本发明的特征。 
3.2.嵌合体NDV的血清学特征分析 
因为KBNP-C4152R2L的F和HN类似于KBNP-4152,而明显不同于La Sota毒株,所以预期KBNP-C4152R2L在血清学上类似于KBNP-4152,但不同于La Sota毒株。为了确证这一点,通过使用交叉血凝抑制试验分析了血清学特征。结果显示于图21中。如图21中所示,KBNP-C4152R2L在血清学上类似于KBNP-4152。即,当与La Sota毒株比较时,在KBNP-C4152R2L和KBNP-4152中抗La Sota的抗血清显示 了低4-8倍的血凝单位,而在KBNP-4152自身或KBNP-C4152R2L中抗KBNP-4152的抗血清显示了几乎类似的血凝单位。 
3.3.KBNP-C4152R2L的致病指数的测量 
3.3.1.平均死亡时间(MDT)的测量 
依照Alexander(1998)的方法进行MDT的测量。将以10-6稀释的KBNP-C4152R2L病毒接种于每组5个含胚卵的两组中。第一组在上午9点接种,第二组在下午5点接种。在接种后,将所述卵于37℃下孵育7天,并在每天的上午9点和下午5点检查胚死亡时间。然后,记录死亡时间并计算MDT(平均死亡时间)。如果测量的MDT不超过60h,那么该病毒被确定为速发型,如果测量的MDT为60-90h,那么它被确定为中发型,如果测量的MDT为90-120h,那么它被确定为缓发型,如果测量的MDT超过120h,那么它被确定为非致病的。疫苗病毒的MDT必须超过90h。结果是,测得的KBNP-C4152R2L的平均死亡时间为168h以上,因此将KBNP-C4152R2L分类为非致病性NDV。 
3.3.2.脑内病原指数(ICPI)的测量 
在使用1cc的注射器将50μl以盐水稀释10倍的尿囊液(实施例2.3.3.)经脑内接种于1日龄的鸡(n=10)体内后,分别将正常鸡标记为0,显示疾病症状的鸡标记为1,死亡的鸡标记为2。然后,将经8天获得的每组的总分除以80。在这些结果中,非致病的被分类为0.0-0.2,缓发型被分类为0.2-0.5,中发型被分类为1.0-1.5,速发型被分类为1.5-2.0。为了在国内将该病毒用作疫苗病毒,因为致病指数必须低于0.5,所以选择具有0.0-0.5的致病指数的重组体病毒。 
KBNP-4152、KBNP-C4152R2L以及La Sota毒株的ICPI的测量结果分别显示于表11-13中。 
[表11]KBNP-4152的ICPI测量 
Figure G2006800564366D00411
总计=154 
ICPI=154/80=1.925 
[表12]KBNP-C4152R2L的ICPI测量 
Figure G2006800564366D00421
总计=154 
ICPI=0/80=0.0 
[表13]La Sota毒株的的ICPI测量 
Figure G2006800564366D00422
总计=20 
ICPI=20/80=0.25 
根据MDT和ICPI的结果,KBNP-C4152R2L的MDT超过168h,KBNP-C4152R2L的ICPI为0.0。因此,该病毒被确证为无任何致病性的病毒。这种致病性降低的结果表明,与常规的疫苗株La Sota相比,本发明的KBNP-C4152R2L毒株是更减毒的,因此KBNP-C4152R2L毒株的致病性低于La Sota毒株的致病性。细胞病变效应中致病性的突然降低可能出现于导入具有颗粒细胞病变效应的速发型野NDV毒株的F和HN基因的重组体病毒中,而不出现于导入具有优良合胞形成能力的病毒毒株的F和HN基因的重组体病毒中。迄今为止已有报道称,在速发型NDV中存在具有合胞型和颗粒型细胞病变效应的克隆。另外已有报道称,颗粒型克隆SNU9358GG(AF535861)的ICPI值(1.78)小于合胞型NDV克隆SNU9358GS(获自Avian Disease & Laboratory,College of VeterinaryMedicine of Seoul National University)的ICPI值(1.95),因此颗粒型克隆的致病性小于合胞型NDV克隆的致病性。然而,由于在具有其他基因型III、IV、V、VIII和XI(包括基因VII型)的致病性NDV中,具有这种颗粒型细胞病变效应的NDV克隆在以前是未知的,所以本发明人首次成功地从具有基因VII型的NDV克隆到了颗粒型NDV,并使用该病毒的F 和HN基因制备了一种重组体NDV,该重组体NDV的致病性比具有颗粒型细胞病变效应的La Sota毒株更低。 
3.4.KBNP-C4152R2L的遗传安全试验 
将本发明的重组体病毒KBNP-C4152R2L在鸡胚上传代培养9次后,将嵌合体基因组的4030-8889核苷酸序列通过RT-PCR扩增,并通过DNA测序分析。结果是,该核苷酸序列在核苷酸序列上没有变化,并且被确证为一种很稳定的核苷酸序列。 
3.5.KBNP-C4152R2L的生产力测量:EID50(50%卵感染剂量)的测量 
将0.1ml的以盐水溶液稀释10倍的病毒接种于5-7只9-10日龄的鸡胚的尿囊腔中以后,在37℃下培养所述接种的鸡胚5-7天。然后,冷却所获得的鸡胚,并从所述冷却的鸡胚中收集尿囊液。然后,通过使用血凝来确定所述病毒是否增加,这是依照测定公式来计算。结果是,观测到KBNP-C4152R2L的EID50为1010.1/Ml,并且所述病毒的生产力很高,类似于以前的La Sota毒株。 
3.6.血凝-洗脱模式的测量 
对血凝-洗脱的检查是依照Spalatin(1970)的方法进行的。也就是说,将各0.5ml的依次以CMF-PBS稀释2倍的La Sota毒株和KBNP-C4152R2L与0.25ml的1%鸡血在微孔板中混合。将该板在室温下孵育1h后,测量血凝效价。在第一次读数后,将该板在24℃下保持24h,并再次测量血凝效价。在2h后将该板再悬浮,并又一次测量血凝效价。该效价被表示为出现血凝的最大稀释因子的倒数。一种确定血凝-洗脱模式的方法如下,如果在24h时血凝后完全出现了血凝-洗脱,并且在2h时再悬浮后不出现血凝,那么血凝-洗脱模式被确定为快速洗脱洗型(eluter),而不是被确定为慢速洗脱型。 
结果是,La Sota毒株被发现为慢洗脱型,而KBNP-C4152R2L被发现为快洗脱型,这表明KBNP-C4152R2L具有与KBNP-4152相同的生物特征。 
3.7.细胞病变效应的测量 
在96-孔板上培养鸡胚成纤维细胞(CEF)并形成单层以后,分别以La Sota毒株、KBNP-4152和KBNP-C4152R2L(均200TCID50/孔)感染所述培养的细胞。然后,将培养基替换为包含0.5%FBS和20μg/Ml的 胰蛋白酶的培养基。培养3天后观测的结果显示于图22中。图22中部的红色箭头指示具有NDV典型细胞病变效应的合胞体的形成。实际上,确证了:在将胰蛋白酶添加至KBNP-C4152R2L毒株中的时候,该菌株可形成一种特异的NDV合胞体(图22的红色箭头)。 
这种细胞病变效应表明,所述嵌合体病毒为一种缓发型致病毒株,其合胞体形成具有胰蛋白酶依赖性。另外,该病毒具有图22D中所示的颗粒型细胞病变效应且不形成典型合胞体,这不同于La Sota毒株和KBNP-4152毒株。 
3.8.KBNP-C4152R2L的灭活疫苗试验 
通过添加0.3%的甲醛,将KBNP-C4152R2L的鸡胚培养基、从该培养基获得的10倍浓缩液以及La Sota毒株的鸡胚培养基均灭活。为了制备各灭活疫苗,将30%的各灭活病毒抗原上清液与70%ISA70油混合。将所制备的灭活疫苗接种至6周龄SPF鸡的皮下组织中。在3周后,将在检疫所(Quarantine service)中用作标准的校正周长(correctioncircumference)106TCID50(AY6304009)激发至鼻腔和口腔中。在激发后,观察直至10天的死亡率。结果显示于表14中。 
[表14] 
Figure G2006800564366D00441
如表14中所示,即使通过HA效价计算的KBNP-C4152R2L的抗原量比La Sota毒株低,KBNP-C4152R2L的抗体形成能力也大大优于以前的疫苗。具体而言,与使用La Sota毒株相比,使用KBNP-C4152R2L时的抗野毒株的血清学免疫是更优的。 
3.9.KBNP-C4152R2L的卵内疫苗试验 
KBNP-C4152R2L具有比用于当前疫苗的病毒毒株更低的致病性,其用于卵内疫苗的可能性较高。为了确证这一点,将卵内疫苗接种于18日龄鸡胚中,并将孵化率以及在孵化后两周得到的体重增加速率与对照组进行比较。通过检查2周龄或更大的接种鸡胚的抗体效价,确定了母体抗体是否被克服,并且比较了免疫水平。在2周后,用所述速发型病毒激发该鸡胚,并确定了抑制所述病毒的保护率。 
用于该试验的鸡胚为通常的产卵雌性小鸡,并将0.1cc的各稀释的疫苗株(107.0EID50/ml)接种于18日龄的鸡胚中。阴性对照组是以0.1cc的无菌PBS接种的。为了确证母体抗体的水平,在孵化后立即将阴性对照组的5只鸡胚安乐死,并取所述安乐死的鸡胚的血清。在17天后,测量每组个体的重量并取血。然后,将毒株KBNP-4152(106.5EID50)接种至其鼻腔和口腔中。在所述攻击接种后,观测直至10天的存活率。结果显示于表15中。 
[表15]KBNP-C4152R2L的卵内疫苗效应的比较 
如表15中所示,KBNP-C4152R2L接种组和阴性对照组的孵化率和体重增加速率在统计学上没有显著差异。然而,在孵化后17天时,KBNP-C4152R2L接种组中的抗体效价比对照组中的高。即,在对照组的 情况下,母体抗体对La Sota毒株的抑制(HI)效价从1天时的平均5.8±2.7降低2.7±1.7。在另一方面,在KBNP-C4152R2L接种组的情况下,在1天时母体抗体对La Sota毒株的HI效价为4.9±1.1,并显示5.5±1.4的相对较高的HI效价。另外,在激发后,对照组中出现33%的死亡率,而重组体疫苗接种组中出现100%的存活率。 
这些结果比Akzo Nobel N/6 V(NL)Company的题为“RecombinantNewcastle virus as an embryo vaccine”的美国专利“US6,699,479B1”好得多,其意义在于疫苗获自于通过不使用依照P基因编辑的减毒的新方法开发的KBNP-C4152R2L。 
最近,发达国家已优先选择可以在孵化前直接对鸡胚进行疫苗接种的卵内疫苗,这是因为这些疫苗具有接种简单和经济性的特点。然而,在现在已知的应用于新城疫病的活疫苗株中具有限制,因为这些毒株对于鸡胚有致病性。在另一方面,已确认本发明的KBNP-C4152R2L在鸡胚中无致病性,并且预期应用KBNP-C4152R2L作为卵内疫苗的价值是很高的。 
如上文所述,本发明的新城疫病毒具有与同时在国内及整个亚洲流行的速发型新城疫病毒类似的抗原性。另外,因为本发明的新城疫病毒具有与现在使用的疫苗株类似或显著较低的致病性,所以该疫苗可被用作卵内疫苗。另外,通过点突变获得致病性的可能性要显著低于以前的疫苗株。因此,本发明的新城疫病毒可用于制备灭活疫苗、活疫苗及卵内疫苗,用于在国内及整个亚洲预防新城疫病。 
<110>KBNP,INC.
<120>减毒重组体新城疫病毒及包含该病毒的疫苗
<160>85
<170>KopatentIn 1.71
<210>1
<211>17481
<212>DNA
<213>人工序列
<220>
<223>pTMH的全长基因组克隆的核苷酸序列
     c4152-R2L
<220>
<221>CDS
<222>(122)..(1588)
<223>NP蛋白编码位点
<220>
<221>CDS
<222>(1887)..(3071)
<223>P蛋白编码位点
<220>
<221>CDS
<222>(3290)..(4381)
<223>M蛋白编码位点
<220>
<221>CDS
<222>(4550)..(6208)
<223>F蛋白编码位点
<220>
<221>CDS
<222>(6418)..(8148)
<223>HN蛋白编码位点
<220>
<221>CDS
<222>(8387)..(14998)
<223>L蛋白编码位点
<400>1
accaaacaga gaatccgtga gttacgataa aaggcgaagg agcaattgaa gtcgcacggg     60
tagaaggtgt gaatctcgag tgcgagcccg aagcacaaac tcgagaaagc cttctgccaa    120
c          atg tct tcc gta ttt gat gag tac gaa cag ctc ctc gcg gct   163
           Met Ser Ser Val Phe Asp Glu Tyr Glu Gln Leu Leu Ala Ala
             1               5                  10
cag act cgc ccc aat gga gct cat gga ggg gga gaa aaa ggg agt acc       211
Gln Thr Arg Pro Asn Gly Ala His Gly Gly Gly Glu Lys Gly Ser Thr
 15                  20                  25                  30
tta aaa gta gac gtc ccg gta ttc act ctt aac agt gat gac cca gaa    259
Leu Lys Val Asp Val Pro Val Phe Thr Leu Asn Ser Asp Asp Pro Glu
                 35                  40                  45
gat aga tgg agc ttt gtg gta ttc tgc ctc cgg att gct gtt agc gaa    307
Asp Arg Trp Ser Phe Val Val Phe Cys Leu Arg Ile Ala Val Ser Glu
             50                  55                  60
gat gcc aac aaa cca ctc agg caa ggt gct ctc ata tct ctt tta tgc    355
Asp Ala Asn Lys Pro Leu Arg Gln Gly Ala Leu Ile Ser Leu Leu Cys
         65                  70                  75
tcc cac tca cag gta atg agg aac cat gtt gcc att gca ggg aaa cag    403
Ser His Ser Gln Val Met Arg Asn His Val Ala Ile Ala Gly Lys Gln
     80                  85                  90
aat gaa gcc aca ttg gcc gtg ctt gag att gat ggc ttt gcc aac ggc    451
Asn Glu Ala Thr Leu Ala Val Leu Glu Ile Asp Gly Phe Ala Asn Gly
 95                 100                 105                 110
acg ccc cag ttc aac aat agg agt gga gtg tct gaa gag aga gca cag    499
Thr Pro Gln Phe Asn Asn Arg Ser Gly Val Ser Glu Glu Arg Ala Gln
                115                 120                 125
aga ttt gcg atg ata gca gga tct ctc cct cgg gca tgc agc aac gga    547
Arg Phe Ala Met Ile Ala Gly Ser Leu Pro Arg Ala Cys Ser Asn Gly
            130                 135                 140
acc ccg ttc gtc aca gcc ggg gca gaa gat gat gca cca gaa gac atc    595
Thr Pro Phe Val Thr Ala Gly Ala Glu Asp Asp Ala Pro Glu Asp Ile
        145                 150                 155
acc gat acc ctg gag agg atc ctc tct atc cag gct caa gta tgg gtc    643
Thr Asp Thr Leu Glu Arg Ile Leu Ser Ile Gln Ala Gln Val Trp Val
    160                 165                 170
aca gta gca aaa gcc atg act gcg tat gag act gca gat gag tcg gaa    691
Thr Val Ala Lys Ala Met Thr Ala Tyr Glu Thr Ala Asp Glu Ser Glu
175                 180                 185                 190
aca agg cga atc aat aag tat atg cag caa ggc agg gtc caa aag aaa    739
Thr Arg Arg Ile Asn Lys Tyr Met Gln Gln Gly Arg Val Gln Lys Lys
                195                 200                 205
tac atc ctc tac ccc gta tgc agg agc aca atc caa ctc acg atc aga    787
Tyr Ile Leu Tyr Pro Val Cys Arg Ser Thr Ile Gln Leu Thr Ile Arg
            210                 215                 220
cag tct ctt gca gtc cgc atc ttt ttg gtt agc gag ctc aag aga ggc    835
Gln Ser Leu Ala Val Arg Ile Phe Leu Val Ser Glu Leu Lys Arg Gly
        225                 230                 235
cgc aac acg gca ggt ggt acc tct act tat tat aac ctg gta ggg gac    883
Arg Asn Thr Ala Gly Gly Thr Ser Thr Tyr Tyr Asn Leu Val Gly Asp
    240                 245                 250
gta gac tca tac atc agg aat acc ggg ctt act gca ttc ttc ttg aca    931
Val Asp Ser Tyr Ile Arg Asn Thr Gly Leu Thr Ala Phe Phe Leu Thr
255                 260                 265                 270
ctc aag tac gga atc aac acc aag aca tca gcc ctt gca ctt agt agc    979
Leu Lys Tyr Gly Ile Asn Thr Lys Thr Ser Ala Leu Ala Leu Ser Ser
                275                 280                 285
ctc tca ggc gac atc cag aag atg aag cag ctc atg cgt ttg tat cgg   1027
Leu Ser Gly Asp Ile Gln Lys Met Lys Gln Leu Met Arg Leu Tyr Arg
            290                 295                 300
atg aaa gga gat aat gcg ccg tac atg aca tta ctt ggt gat agt gac      1075
Met Lys Gly Asp Asn Ala Pro Tyr Met Thr Leu Leu Gly Asp Ser Asp
        305                 310                 315
cag atg agc ttt gcg cct gcc gag tat gca caa ctt tac tcc ttt gcc      1123
Gln Met Ser Phe Ala Pro Ala Glu Tyr Ala Gln Leu Tyr Ser Phe Ala
    320                 325                 330
atg ggt atg gca tca gtc cta gat aaa ggt act ggg aaa tac caa ttt      1171
Met Gly Met Ala Ser Val Leu Asp Lys Gly Thr Gly Lys Tyr Gln Phe
335                 340                 345                 350
gcc agg gac ttt atg agc aca tca ttc tgg aga ctt gga gta gag tac      1219
Ala Arg Asp Phe Met Ser Thr Ser Phe Trp Arg Leu Gly Val Glu Tyr
                355                 360                 365
gct cag gct cag gga agt agc att aac gag gat atg gct gcc gag cta      1267
Ala Gln Ala Gln Gly Ser Ser Ile Asn Glu Asp Met Ala Ala Glu Leu
            370                 375                 380
aag cta acc cca gca gca atg aag ggc ctg gca gct gct gcc caa cgg      1315
Lys Leu Thr Pro Ala Ala Met Lys Gly Leu Ala Ala Ala Ala Gln Arg
        385                 390                 395
gtc tcc gac gat acc agc agc ata tac atg cct act caa caa gtc gga      1363
Val Ser Asp Asp Thr Ser Ser Ile Tyr Met Pro Thr Gln Gln Val Gly
    400                 405                 410
gtc ctc act ggg ctt agc gag ggg ggg tcc caa gct cta caa ggc gga      1411
Val Leu Thr Gly Leu Ser Glu Gly Gly Ser Gln Ala Leu Gln Gly Gly
415                 420                 425                 430
tcg aat aga tcg caa ggg caa cca gaa gcc ggg gat ggg gag acc caa      1459
Ser Asn Arg Ser Gln Gly Gln Pro Glu Ala Gly Asp Gly Glu Thr Gln
                435                 440                 445
ttc ctg gat ctg atg aga gcg gta gca aat agc atg agg gag gcg cca      1507
Phe Leu Asp Leu Met Arg Ala Val Ala Asn Ser Met Arg Glu Ala Pro
            450                 455                 460
aac tct gca cag ggc act ccc caa tcg ggg cct ccc cca act cct ggg      1555
Asn Ser Ala Gln Gly Thr Pro Gln Ser Gly Pro Pro Pro Thr Pro Gly
        465                 470                 475
cca tcc caa gat aac gac acc gac tgg ggg tat         tg atggacaaaa    1600
Pro Ser Gln Asp Asn Asp Thr Asp Trp Gly Tyr
    480                 485
cccagcctgc ttccacaaaa acatcccaat gccctcaccc gtagtcgacc cctcgatttg    1660
cggctctata tgaccacacc ctcaaacaaa catccccctc tttcctccct ccccctgctg    1720
tacaactccg cacgccctag ataccacagg cacaatgcgg ctcactaaca atcaaaacag    1780
agccgaggga attagaaaaa agtacgggta gaagagggat attcagagat cagggcaagt    1840
ctcccgagtc tctgctctct cctctacctg atagaccagg acaaac     atg gcc acc   1895
                                                       Met Ala Thr
                                                         1
ttt aca gat gca gag atc gac gag cta ttt gag aca agt gga act gtc      1943
Phe Thr Asp Ala Glu Ile Asp Glu Leu Phe Glu Thr Ser Gly Thr Val
      5                  10                  15
att gac aac ata att aca gcc cag ggt aaa cca gca gag act gtt gga      1991
Ile Asp Asn Ile Ile Thr Ala Gln Gly Lys Pro Ala Glu Thr Val Gly
 20                  25                  30                  35
agg agt gca atc cca caa ggc aag acc aag gtg ctg agc gca gca tgg    2039
Arg Ser Ala Ile Pro Gln Gly Lys Thr Lys Val Leu Ser Ala Ala Trp
                 40                  45                  50
gag aag cat ggg agc atc cag cca ccg gcc agt caa gac aac ccc gat    2087
Glu Lys His Gly Ser Ile Gln Pro Pro Ala Ser Gln Asp Asn Pro Asp
             55                  60                  65
cga cag gac aga tct gac aaa caa cca tcc aca ccc gag caa acg acc    2135
Arg Gln Asp Arg Ser Asp Lys Gln Pro Ser Thr Pro Glu Gln Thr Thr
         70                  75                  80
ccg cat gac agc ccg ccg gcc aca tcc gcc gac cag ccc ccc acc cag    2183
Pro His Asp Ser Pro Pro Ala Thr Ser Ala Asp Gln Pro Pro Thr Gln
     85                  90                  95
gcc aca gac gaa gcc gtc gac aca cag ttc agg acc gga gca agc aac    2231
Ala Thr Asp Glu Ala Val Asp Thr Gln Phe Arg Thr Gly Ala Ser Asn
100                 105                 110                 115
tct ctg ctg ttg atg ctt gac aag ctc agc aat aaa tcg tcc aat gct    2279
Ser Leu Leu Leu Met Leu Asp Lys Leu Ser Asn Lys Ser Ser Asn Ala
                120                 125                 130
aaa aag ggc cca tgg tcg agc ccc caa gag ggg aat cac caa cgt ccg    2327
Lys Lys Gly Pro Trp Ser Ser Pro Gln Glu Gly Asn His Gln Arg Pro
            135                 140                 145
act caa cag cag ggg agt caa ccc agt cgc gga aac agt cag gaa aga    2375
Thr Gln Gln Gln Gly Ser Gln Pro Ser Arg Gly Asn Ser Gln Glu Arg
        150                 155                 160
ccg cag aac caa gtc aag gcc gcc cct gga aac cag ggc aca gac gtg    2423
Pro Gln Asn Gln Val Lys Ala Ala Pro Gly Asn Gln Gly Thr Asp Val
    165                 170                 175
aac aca gca tat cat gga caa tgg gag gag tca caa cta tca gct ggt    2471
Asn Thr Ala Tyr His Gly Gln Trp Glu Glu Ser Gln Leu Ser Ala Gly
180                 185                 190                 195
gca acc cct cat gct ctc cga tca agg cag agc caa gac aat acc ctt    2519
Ala Thr Pro His Ala Leu Arg Ser Arg Gln Ser Gln Asp Asn Thr Leu
                200                 205                 210
gta tct gcg gat cat gtc cag ccg cct gta gac ttt gtg caa gcg atg    2567
Val Ser Ala Asp His Val Gln Pro Pro Val Asp Phe Val Gln Ala Met
            215                 220                 225
atg tct atg atg gag gcg ata tca cag aga gta agt aag gtt gac tat    2615
Met Ser Met Met Glu Ala Ile Ser Gln Arg Val Ser Lys Val Asp Tyr
        230                 235                 240
cag cta gat ctt gtc ttg aaa cag aca tcc tcc atc cct atg atg cgg    2663
Gln Leu Asp Leu Val Leu Lys Gln Thr Ser Ser Ile Pro Met Met Arg
    245                 250                 255
tcc gaa atc caa cag ctg aaa aca tct gtt gca gtc atg gaa gcc aac    2711
Ser Glu Ile Gln Gln Leu Lys Thr Ser Val Ala Val Met Glu Ala Asn
260                 265                 270                 275
ttg gga atg atg aag att ctg gat ccc ggt tgt gcc aac att tca tct    2759
Leu Gly Met Met Lys Ile Leu Asp Pro Gly Cys Ala Asn Ile Ser Ser
                280                 285                 290
ctg agt gat cta cgg gca gtt gcc cga tct cac ccg gtt tta gtt tca    2807
Leu Ser Asp Leu Arg Ala Val Ala Arg Ser His Pro Val Leu Val Ser
            295                 300                 305
ggc cct gga gac ccc tct ccc tat gtg aca caa gga ggc gaa atg gca      2855
Gly Pro Gly Asp Pro Ser Pro Tyr Val Thr Gln Gly Gly Glu Met Ala
        310                 315                 320
ctt aat aaa ctt tcg caa cca gtg cca cat cca tct gaa ttg att aaa      2903
Leu Asn Lys Leu Ser Gln Pro Val Pro His Pro Ser Glu Leu Ile Lys
    325                 330                 335
ccc gcc act gca tgc ggg cct gat ata gga gtg gaa aag gac act gtc      2951
Pro Ala Thr Ala Cys Gly Pro Asp Ile Gly Val Glu Lys Asp Thr Val
340                 345                 350                 355
cgt gca ttg atc atg tca cgc cca atg cac ccg agt tct tca gcc aag      2999
Arg Ala Leu Ile Met Ser Arg Pro Met His Pro Ser Ser Ser Ala Lys
                360                 365                 370
ctc cta agc aag tta gat gca gcc ggg tcg atc gag gaa atc agg aaa      3047
Leu Leu Ser Lys Leu Asp Ala Ala Gly Ser Ile Glu Glu Ile Arg Lys
            375                 380                 385
atc aag cgc ctt gct cta aat ggc   taattacta ctgccacacg tagcgggtcc    3100
Ile Lys Arg Leu Ala Leu Asn Gly
        390                 395
ctgtccactc ggcatcacac ggaatctgca ccgagttccc ccccgcagac ccaaggtcca    3160
actctccaag cggcaatcct ctctcgcttc ctcagcccca ctgaatgatc gcgtaaccgt    3220
aattaatcta gctacattta agattaagaa aaaatacggg tagaattgga gtgccccaat    3280
tgtgccaag  atg gac tca tct agg aca att ggg ctg tac ttt gat tct gcc   3331
           Met Asp Ser Ser Arg Thr Ile Gly Leu Tyr Phe Asp Ser Ala
             1               5                  10
cat tct tct agc aac ctg tta gca ttt ccg atc gtc cta caa gac aca      3379
His Ser Ser Ser Asn Leu Leu Ala Phe Pro Ile Val Leu Gln Asp Thr
 15                  20                  25                  30
gga gat ggg aag aag caa atc gcc ccg caa tat agg atc cag cgc ctt      3427
Gly Asp Gly Lys Lys Gln Ile Ala Pro Gln Tyr Arg Ile Gln Arg Leu
                 35                  40                  45
gac ttg tgg act gat agt aag gag gac tca gta ttc atc acc acc tat      3475
Asp Leu Trp Thr Asp Ser Lys Glu Asp Ser Val Phe Ile Thr Thr Tyr
             50                  55                  60
gga ttc atc ttt caa gtt ggg aat gaa gaa gcc act gtc ggc atg atc      3523
Gly Phe Ile Phe Gln Val Gly Asn Glu Glu Ala Thr Val Gly Met Ile
         65                  70                  75
gat gat aaa ccc aag cgc gag tta ctt tcc gct gcg atg ctc tgc cta      3571
Asp Asp Lys Pro Lys Arg Glu Leu Leu Ser Ala Ala Met Leu Cys Leu
     80                  85                  90
gga agc gtc cca aat acc gga gac ctt att gag ctg gca agg gcc tgt      3619
Gly Ser Val Pro Asn Thr Gly Asp Leu Ile Glu Leu Ala Arg Ala Cys
 95                 100                 105                 110
ctc act atg ata gtc aca tgc aag aag agt gca act aat act gag aga      3667
Leu Thr Met Ile Val Thr Cys Lys Lys Ser Ala Thr Asn Thr Glu Arg
                115                 120                 125
atg gtt ttc tca gta gtg cag gca ccc caa gtg ctg caa agc tgt agg      3715
Met Val Phe Ser Val Val Gln Ala Pro Gln Val Leu Gln Ser Cys Arg
            130                 135                 140
gtt gtg gca aac aaa tac tca tca gtg aat gca gtc aag cac gtg aaa    3763
Val Val Ala Asn Lys Tyr Ser Ser Val Asn Ala Val Lys His Val Lys
        145                 150                 155
gcg cca gag aag att ccc ggg agt gga acc cta gaa tac aag gtg aac    3811
Ala Pro Glu Lys Ile Pro Gly Ser Gly Thr Leu Glu Tyr Lys Val Asn
    160                 165                 170
ttt gtc tcc ttg act gtg gta ccg aag aag gat gtc tac aag atc cca    3859
Phe Val Ser Leu Thr Val Val Pro Lys Lys Asp Val Tyr Lys Ile Pro
175                 180                 185                 190
gct gca gta ttg aag gtt tct ggc tcg agt ctg tac aat ctt gcg ctc    3907
Ala Ala Val Leu Lys Val Ser Gly Ser Ser Leu Tyr Asn Leu Ala Leu
                195                 200                 205
aat gtc act att aat gtg gag gta gac ccg agg agt cct ttg gtt aaa    3955
Asn Val Thr Ile Asn Val Glu Val Asp Pro Arg Ser Pro Leu Val Lys
            210                 215                 220
tct ctg tct aag tct gac agc gga tac tat gct aac ctc ttc ttg cat    4003
Ser Leu Ser Lys Ser Asp Ser Gly Tyr Tyr Ala Asn Leu Phe Leu His
        225                 230                 235
att gga ctt atg acc acc gta gat agg aag ggg aag aaa gtg aca ttt    4051
Ile Gly Leu Met Thr Thr Val Asp Arg Lys Gly Lys Lys Val Thr Phe
    240                 245                 250
gac aag ctg gaa aag aaa ata agg agc ctt gat cta tct gtc ggg ctc    4099
Asp Lys Leu Glu Lys Lys Ile Arg Ser Leu Asp Leu Ser Val Gly Leu
255                 260                 265                 270
agt gat gtg ctc ggg cct tcc gtg ttg gta aaa gca aga ggt gca cgg    4147
Ser Asp Val Leu Gly Pro Ser Val Leu Val Lys Ala Arg Gly Ala Arg
                275                 280                 285
act aag ctt ttg gca cct ttc ttc tct agc agt ggg aca gcc tgc tat    4195
Thr Lys Leu Leu Ala Pro Phe Phe Ser Ser Ser Gly Thr Ala Cys Tyr
            290                 295                 300
ccc ata gca aat gct tct cct cag gtg gcc aag ata ctc tgg agt caa    4243
Pro Ile Ala Asn Ala Ser Pro Gln Val Ala Lys Ile Leu Trp Ser Gln
        305                 310                 315
acc gcg tgc ctg cgg agc gtt aaa atc att atc caa gca ggt acc caa    4291
Thr Ala Cys Leu Arg Ser Val Lys Ile Ile Ile Gln Ala Gly Thr Gln
    320                 325                 330
cgc gct gtc gca gtg acc gcc gac cac gag gtt acc tct act aag ctg    4339
Arg Ala Val Ala Val Thr Ala Asp His Glu Val Thr Ser Thr Lys Leu
335                 340                 345                 350
gag aag ggg cac acc ctt gcc aaa tac aat cct ttt aag aaa taagctgcg  4390
Glu Lys Gly His Thr Leu Ala Lys Tyr Asn Pro Phe Lys Lys
                355                 360
tctctgagat tgcgctccgc ccactcaccc agatcatcat gacacaaaaa actaatctgt  4450
cttgattatt tacagttagt ttacctgtct atcaagttag aaaaaacacg cgtacgggta  4510
gaagagtctg gatcccgacc ggcacattca ggacgcaat  atg ggc tcc aaa ctt    4564
                                            Met Gly Ser Lys Leu
                                              l               5
tct acc agg att cca gca cct ctg atg ctg acc acc cgg att acg ctg    4612
Ser Thr Arg Ile Pro Ala Pro Leu Met Leu Thr Thr Arg Ile Thr Leu
                 10                  15                  20
ata ttg agc tgt atc cgt ccg aca agc tct ctt gac ggc agg cct ctt    4660
Ile Leu Ser Cys Ile Arg Pro Thr Ser Ser Leu Asp Gly Arg Pro Leu
             25                  30                  35
gca gct gca gga att gta gta aca gga gat aag gca gtc aat gta tac    4708
Ala Ala Ala Gly Ile Val Val Thr Gly Asp Lys Ala Val Asn Val Tyr
         40                  45                  50
acc tcg tct cag aca ggg tca atc ata gtc aag ttg ctc ccg aat atg    4756
Thr Ser Ser Gln Thr Gly Ser Ile Ile Val Lys Leu Leu Pro Asn Met
     55                  60                  65
ccc agg gat aaa gag gcg tgt gca aaa gcc cca tta gag gca tat aac    4804
Pro Arg Asp Lys Glu Ala Cys Ala Lys Ala Pro Leu Glu Ala Tyr Asn
 70                  75                  80                  85
aga aca ctg act act ttg cta act cct ctt ggc gac tcc atc cgc aag    4852
Arg Thr Leu Thr Thr Leu Leu Thr Pro Leu Gly Asp Ser Ile Arg Lys
                 90                  95                 100
atc caa ggg tct gtg tcc acg tct gga gga ggc aga caa gca cgc ctg    4900
Ile Gln Gly Ser Val Ser Thr Ser Gly Gly Gly Arg Gln Ala Arg Leu
            105                 110                 115
ata ggt gct gtt att ggc agt gta gct ctt ggg gtt gca aca gcg gca    4948
Ile Gly Ala Val Ile Gly Ser Val Ala Leu Gly Val Ala Thr Ala Ala
        120                 125                 130
cag ata aca gca gcg gcc gcc cta ata caa gcc aac cag aat gcc gcc    4996
Gln Ile Thr Ala Ala Ala Ala Leu Ile Gln Ala Asn Gln Asn Ala Ala
    135                 140                 145
aac atc ctc cgg ctt aag gag agc att gct gca acc aat gaa gct gtg    5044
Asn Ile Leu Arg Leu Lys Glu Ser Ile Ala Ala Thr Asn Glu Ala Val
150                 155                 160                 165
cat gaa gtc acc gac gga tta tca caa cta tca gtg gca gtt ggg aag    5092
His Glu Val Thr Asp Gly Leu Ser Gln Leu Ser Val Ala Val Gly Lys
                170                 175                 180
atg cag cag ttc gtc aat gac cag ttt aat aat aca gca cga gaa ttg    5140
Met Gln Gln Phe Val Asn Asp Gln Phe Asn Asn Thr Ala Arg Glu Leu
            185                 190                 195
gac tgt ata aaa atc aca caa cag gtt ggt gta gag cta aac cta tac    5188
Asp Cys Ile Lys Ile Thr Gln Gln Val Gly Val Glu Leu Asn Leu Tyr
        200                 205                 210
cta act gaa ttg act aca gta ttc ggg cca cag atc act tcc cct gca    5236
Leu Thr Glu Leu Thr Thr Val Phe Gly Pro Gln Ile Thr Ser Pro Ala
    215                 220                 225
tta act cag ttg acc atc caa gca ctt tat aat tta gct ggt ggc aat    5284
Leu Thr Gln Leu Thr Ile Gln Ala Leu Tyr Asn Leu Ala Gly Gly Asn
230                 235                 240                 245
atg aat tac tta tta act aag tta ggt ata ggg aac aat caa ctc agc    5332
Met Asn Tyr Leu Leu Thr Lys Leu Gly Ile Gly Asn Asn Gln Leu Ser
                250                 255                 260
tca tta att ggt agc ggc ctg atc act ggt tac cct ata ctg tat gat    5380
Ser Leu Ile Gly Ser Gly Leu Ile Thr Gly Tyr Pro Ile Leu Tyr Asp
            265                 270                 275
tca cag act caa ctc ttg ggc ata caa gtg aat ttg ccc tca gtc ggg    5428
Ser Gln Thr Gln Leu Leu Gly Ile Gln Val Asn Leu Pro Ser Val Gly
        280                 285                 290
aac tta aat aat atg cgt gcc acc tat ttg gag acc tta tct gta agt    5476
Asn Leu Asn Asn Met Arg Ala Thr Tyr Leu Glu Thr Leu Ser Val Ser
    295                 300                 305
aca acc aaa gga tat gcc tca gca ctt gtc ccg aaa gta gtg aca cag    5524
Thr Thr Lys Gly Tyr Ala Ser Ala Leu Val Pro Lys Val Val Thr Gln
310                 315                 320                 325
gtc ggt tct gtg ata gaa gag ctc gac acc tca tac tgc ata gag tcc    5572
Val Gly Ser Val Ile Glu Glu Leu Asp Thr Ser Tyr Cys Ile Glu Ser
                330                 335                 340
gat ctg gat tta tat tgt act aga ata gtg aca ttc ccc atg tcc cca    5620
Asp Leu Asp Leu Tyr Cys Thr Arg Ile Val Thr Phe Pro Met Ser Pro
            345                 350                 355
ggt att tat tcc tgc ttg agc ggc aac aca tca gct tgc atg tat tca    5668
Gly Ile Tyr Ser Cys Leu Ser Gly Asn Thr Ser Ala Cys Met Tyr Ser
        360                 365                 370
aag act gaa ggc gca ctc act acg ccg tat atg gcc ctt aaa ggc tcg    5716
Lys Thr Glu Gly Ala Leu Thr Thr Pro Tyr Met Ala Leu Lys Gly Ser
    375                 380                 385
gtt att gcc aat tgt aag ata aca aca tgt aga tgt aca gac cct cct    5764
Val Ile Ala Asn Cys Lys Ile Thr Thr Cys Arg Cys Thr Asp Pro Pro
390                 395                 400                 405
ggt atc ata tcg caa aat tat gga gaa gcc gta tcc ctg ata gat aga    5812
Gly Ile Ile Ser Gln Asn Tyr Gly Glu Ala Val Ser Leu Ile Asp Arg
                410                 415                 420
cat tcg tgc aat gtc tta tca tta gac ggg ata act ctg agg ctc agt    5860
His Ser Cys Asn Val Leu Ser Leu Asp Gly Ile Thr Leu Arg Leu Ser
            425                 430                 435
ggg gaa ttt gat gca act tat caa aag aac atc tca ata cta gat tct    5908
Gly Glu Phe Asp Ala Thr Tyr Gln Lys Asn Ile Ser Ile Leu Asp Ser
        440                 445                 450
caa gtc atc gtg aca ggc aat ctt gat atc tca act gaa ctt gga aac    5956
Gln Val Ile Val Thr Gly Asn Leu Asp Ile Ser Thr Glu Leu Gly Asn
    455                 460                 465
gtc aac aat tca atc agc aat gcc ttg gat agt ttg gca gaa agc aac    6004
Val Asn Asn Ser Ile Ser Asn Ala Leu Asp Ser Leu Ala Glu Ser Asn
470                 475                 480                 485
agc aag ctg gaa aaa atc aat gtc aga cta acc agc aca tct gct ctc    6052
Ser Lys Leu Glu Lys Ile Asn Val Arg Leu Thr Ser Thr Ser Ala Leu
                490                 495                 500
att acc tat att gtt cta act gtc att tct cta gtt ttc ggt gca ttt    6100
Ile Thr Tyr Ile Val Leu Thr Val Ile Ser Leu Val Phe Gly Ala Phe
            505                 510                 515
agt ttg ggt tta gcg tgt tac ctg atg tac aaa cag aag gca caa caa    6148
Ser Leu Gly Leu Ala Cys Tyr Leu Met Tyr Lys Gln Lys Ala Gln Gln
        520                 525                 530
aag acc ttg cta tgg ctt ggg aat aat acc ctc gat cag atg aga gcc    6196
Lys Thr Leu Leu Trp Leu Gly Asn Asn Thr Leu Asp Gln Met Arg Ala
    535                 540                 545
act aca aga gca    tg aatgcagata agaggtgggt atatacccaa cagcagcctg    6250
Thr Thr Arg Ala
550
tgtatcaatt ccgataacct gtcaagtaga agacttaaga aaaaactact gggaataagc    6310
aaccaaagag cactacacgg gtagaacgat cagaggagcc acccttcaat cggaaattag    6370
gcttcacaac atccgttcta ccgcatcacc aacaacaaga gtcaatc    atg gac cgc   6426
                                                       Met Asp Arg
                                                         1
gcg gtt aac aga gtc gtg ctg gag aat gag gaa aga gaa gca aag aac      6474
Ala Val Asn Arg Val Val Leu Glu Asn Glu Glu Arg Glu Ala Lys Asn
      5                  10                  15
aca tgg cgc ctg gtt ttc cgg atc gca gtt tta ctt tta atg gta atg      6522
Thr Trp Arg Leu Val Phe Arg Ile Ala Val Leu Leu Leu Met Val Met
 20                  25                  30                  35
act cta gct atc tcc tca gct gcc ctg gca tac agc acg ggg gcc agt      6570
Thr Leu Ala Ile Ser Ser Ala Ala Leu Ala Tyr Ser Thr Gly Ala Ser
                 40                  45                  50
acg ccg cac gac ctc gca agc ata ttg act gtg atc tcc aag aca gaa      6618
Thr Pro His Asp Leu Ala Ser Ile Leu Thr Val Ile Ser Lys Thr Glu
             55                  60                  65
gat aag gtt acg tct tta ctc agt tca agt caa gac gtg ata gat agg      6666
Asp Lys Val Thr Ser Leu Leu Ser Ser Ser Gln Asp Val Ile Asp Arg
         70                  75                  80
ata tac aag cag gtg gct ctt gaa tcc ccg ctg gca cta cta aac act      6714
Ile Tyr Lys Gln Val Ala Leu Glu Ser Pro Leu Ala Leu Leu Asn Thr
     85                  90                  95
gaa tct gta att atg aat gca ata acc tct ctt tct tat caa att aac      6762
Glu Ser Val Ile Met Asn Ala Ile Thr Ser Leu Ser Tyr Gln Ile Asn
100                 105                 110                 115
ggg gct gcg aac aat agc gga tgt ggg gcg cct gtt cat gac cca gat      6810
Gly Ala Ala Asn Asn Ser Gly Cys Gly Ala Pro Val His Asp Pro Asp
                120                 125                 130
tat atc ggg ggg ata ggc aaa gaa ctc ata gtg gac gac atc agt gat      6858
Tyr Ile Gly Gly Ile Gly Lys Glu Leu Ile Val Asp Asp Ile Ser Asp
            135                 140                 145
gtt aca tca ttt tat cct tct gca tat caa gaa cac ttg aat ttc atc      6906
Val Thr Ser Phe Tyr Pro Ser Ala Tyr Gln Glu His Leu Asn Phe Ile
        150                 155                 160
ccg gca cct act aca gga tcc ggt tgc act cgg ata ccc tcg ttt gac      6954
Pro Ala Pro Thr Thr Gly Ser Gly Cys Thr Arg Ile Pro Ser Phe Asp
    165                 170                 175
atg agc acc acc cat tat tgt tat act cac aat gtg ata cta tcc ggt      7002
Met Ser Thr Thr His Tyr Cys Tyr Thr His Asn Val Ile Leu Ser Gly
180                 185                 190                 195
tgc aga gat cac tca cac tca cat caa tac tta gca ctt ggt gtg ctt      7050
Cys Arg Asp His Ser His Ser His Gln Tyr Leu Ala Leu Gly Val Leu
                200                 205                 210
cgg aca tct gca aca ggg agg gta ttc ttt tct act ctg cgc tct atc     7098
Arg Thr Ser Ala Thr Gly Arg Val Phe Phe Ser Thr Leu Arg Ser Ile
            215                 220                 225
aat tta gat gac acc caa aat cgg aag tcc tgc agt gtg agt gca acc    7146
Asn Leu Asp Asp Thr Gln Asn Arg Lys Ser Cys Ser Val Ser Ala Thr
        230                 235                 240
cct tta ggt tgt gat atg ctg tgc tcc aag gtc aca ggg act gaa gag    7194
Pro Leu Gly Cys Asp Met Leu Cys Ser Lys Val Thr Gly Thr Glu Glu
    245                 250                 255
gag gat tac aag tca gtt gcc ccc aca tca atg gtg cac gga agg cta    7242
Glu Asp Tyr Lys Ser Val Ala Pro Thr Ser Met Val His Gly Arg Leu
260                 265                 270                 275
ggg ttt gac ggt caa tac cat gaa aag gac tta gac acc acg gtc tta    7290
Gly Phe Asp Gly Gln Tyr His Glu Lys Asp Leu Asp Thr Thr Val Leu
                280                 285                 290
ttt aag gat tgg gtg gca aat tac cca gga gcg gga gga ggg tct ttt    7338
Phe Lys Asp Trp Val Ala Asn Tyr Pro Gly Ala Gly Gly Gly Ser Phe
            295                 300                 305
att gac gac cgt gta tgg ttc cca gtt tac gga ggg ctc aaa ccc gat    7386
Ile Asp Asp Arg Val Trp Phe Pro Val Tyr Gly Gly Leu Lys Pro Asp
        310                 315                 320
tca ccc agt gac act gca caa gaa ggg aaa tac gta ata tac aag cgc    7434
Ser Pro Ser Asp Thr Ala Gln Glu Gly Lys Tyr Val Ile Tyr Lys Arg
    325                 330                 335
cat aac aac aca tgc ccc gat aaa caa gat tac caa att cgg aag gct    7482
His Asn Asn Thr Cys Pro Asp Lys Gln Asp Tyr Gln Ile Arg Lys Ala
340                 345                 350                 355
aag tct tca tat aaa ccc ggg cga ttt ggt ggg aag cgc gta cag caa    7530
Lys Ser Ser Tyr Lys Pro Gly Arg Phe Gly Gly Lys Arg Val Gln Gln
                360                 365                 370
gcc atc tta tcc atc aaa gtg tca aca tct ttg ggt aag gac ccg gtg    7578
Ala Ile Leu Ser Ile Lys Val Ser Thr Ser Leu Gly Lys Asp Pro Val
            375                 380                 385
ctg act att cca cct aat aca atc aca ctc atg gga gcc gaa ggc aga    7626
Leu Thr Ile Pro Pro Asn Thr Ile Thr Leu Met Gly Ala Glu Gly Arg
        390                 395                 400
att ctc aca gtg ggg aca tct cac ttc ttg tac caa cga ggg tct tca    7674
Ile Leu Thr Val Gly Thr Ser His Phe Leu Tyr Gln Arg Gly Ser Ser
    405                 410                 415
tat ttc tcc cct gcc tta tta tat ccc atg aca gta aat aac aaa acg    7722
Tyr Phe Ser Pro Ala Leu Leu Tyr Pro Met Thr Val Asn Asn Lys Thr
420                 425                 430                 435
gct aca ctc cat agt cct tat acg ttt aat gct ttc act cgg cca ggt    7770
Ala Thr Leu His Ser Pro Tyr Thr Phe Asn Ala Phe Thr Arg Pro Gly
                440                 445                 450
agt gtc cct tgc cag gca tca gca aga tgc ccc aac tca tgc att act    7818
Ser Val Pro Cys Gln Ala Ser Ala Arg Cys Pro Asn Ser Cys Ile Thr
            455                 460                 465
gga gtc tat act gat cca tat ccc tta atc ttc cat agg aat cat act    7866
Gly Val Tyr Thr Asp Pro Tyr Pro Leu Ile Phe His Arg Asn His Thr
        470                 475                 480
cta cga ggg gtc ttc gga acg atg ctt gat gat gaa caa gcg aga ctt    7914
Leu Arg Gly Val Phe Gly Thr Met Leu Asp Asp Glu Gln Ala Arg Leu
    485                 490                 495
aac ccc gta tcc gca gta ttc gac aac gta tcc cgc agt cgt gtc acc    7962
Asn Pro Val Ser Ala Val Phe Asp Asn Val Ser Arg Ser Arg Val Thr
500                 505                 510                 515
cgg gtg agt tca agc agc acc aag gca gca tac acg aca tcg aca tgt    8010
Arg Val Ser Ser Ser Ser Thr Lys Ala Ala Tyr Thr Thr Ser Thr Cys
                520                 525                 530
ttc aaa gtt gtc aag acc aat aaa act tat tgt ctt agt att gca gaa    8058
Phe Lys Val Val Lys Thr Asn Lys Thr Tyr Cys Leu Ser Ile Ala Glu
            535                 540                 545
ata tcc aat acc ctg ttc ggg gaa ttt agg atc gtt ccc tta cta gtt    8106
Ile Ser Asn Thr Leu Phe Gly Glu Phe Arg Ile Val Pro Leu Leu Val
        550                 555                 560
gag atc ctc aag gat gac ggg gtt aga gaa gcc agg tct ggc        ta  8150
Glu Ile Leu Lys Asp Asp Gly Val Arg Glu Ala Arg Ser Gly
    565                 570                 575
gttgagtcaa ttataaagga gttggaaaga tggcattgta tcacctatct tctgtgacat  8210
caagaatcaa accgaatgcc ggcgcgtgct cgaattccat gttgccagtt gaccacaatc  8270
agccagtgct catgcgatca gattaagcct tgtcaatagt ctcttgatta agaaaaaatg  8330
taagtggcaa tgagatacaa ggcaaaacag ctcatggtaa ataatacggg taggac      8386
atg gcg agc tcc ggt cct gaa agg gca gag cat cag att atc cta cca    8434
Met Ala Ser Ser Gly Pro Glu Arg Ala Glu His Gln Ile Ile Leu Pro
  1               5                  10                  15
gag tca cac ctg tct tca cca ttg gtc aag cac aaa cta ctc tat tac    8482
Glu Ser His Leu Ser Ser Pro Leu Val Lys His Lys Leu Leu Tyr Tyr
             20                  25                  30
tgg aaa tta act ggg cta ccg ctt cct gat gaa tgt gac ttc gac cac    8530
Trp Lys Leu Thr Gly Leu Pro Leu Pro Asp Glu Cys Asp Phe Asp His
         35                  40                  45
ctc att ctc agc cga caa tgg aaa aaa ata ctt gaa tcg gcc tct cct    8578
Leu Ile Leu Ser Arg Gln Trp Lys Lys Ile Leu Glu Ser Ala Ser Pro
     50                  55                  60
gat act gag aga atg ata aaa ctc gga agg gca gta cac caa act ctt    8626
Asp Thr Glu Arg Met Ile Lys Leu Gly Arg Ala Val His Gln Thr Leu
 65                  70                  75                  80
aac cac aat tcc aga ata acc gga gtg ctc cac ccc agg tgt tta gaa    8674
Asn His Asn Ser Arg Ile Thr Gly Val Leu His Pro Arg Cys Leu Glu
                 85                  90                  95
gaa ctg gct aat att gag gtc cca gat tca acc aac aaa ttt cgg aag    8722
Glu Leu Ala Asn Ile Glu Val Pro Asp Ser Thr Asn Lys Phe Arg Lys
            100                 105                 110
att gag aag aag atc caa att cac aac acg aga tat gga gaa ctg ttc    8770
Ile Glu Lys Lys Ile Gln Ile His Asn Thr Arg Tyr Gly Glu Leu Phe
        115                 120                 125
aca agg ctg tgt acg cat ata gag aag aaa ctg ctg ggg tca tct tgg    8818
Thr Arg Leu Cys Thr His Ile Glu Lys Lys Leu Leu Gly Ser Ser Trp
    130                 135                 140
tct aac aat gtc ccc cgg tca gag gag ttc agc agc att cgt acg gat    8866
Ser Asn Asn Val Pro Arg Ser Glu Glu Phe Ser Ser Ile Arg Thr Asp
145                 150                 155                 160
ccg gca ttc tgg ttt cac tca aaa tgg tcc aca gcc aag ttt gca tgg    8914
Pro Ala Phe Trp Phe His Ser Lys Trp Ser Thr Ala Lys Phe Ala Trp
                165                 170                 175
ctc cat ata aaa cag atc cag agg cat ctg atg gtg gca gct agg aca    8962
Leu His Ile Lys Gln Ile Gln Arg His Leu Met Val Ala Ala Arg Thr
            180                 185                 190
agg tct gcg gcc aac aaa ttg gtg atg cta acc cat aag gta ggc caa    9010
Arg Ser Ala Ala Asn Lys Leu Val Met Leu Thr His Lys Val Gly Gln
        195                 200                 205
gtc ttt gtc act cct gaa ctt gtc gtt gtg acg cat acg aat gag aac    9058
Val Phe Val Thr Pro Glu Leu Val Val Val Thr His Thr Asn Glu Asn
    210                 215                 220
aag ttc aca tgt ctt acc cag gaa ctt gta ttg atg tat gca gat atg    9106
Lys Phe Thr Cys Leu Thr Gln Glu Leu Val Leu Met Tyr Ala Asp Met
225                 230                 235                 240
atg gag ggc aga gat atg gtc aac ata ata tca acc acg gcg gtg cat    9154
Met Glu Gly Arg Asp Met Val Asn Ile Ile Ser Thr Thr Ala Val His
                245                 250                 255
ctc aga agc tta tca gag aaa att gat gac att ttg cgg tta ata gac    9202
Leu Arg Ser Leu Ser Glu Lys Ile Asp Asp Ile Leu Arg Leu Ile Asp
            260                 265                 270
gct ctg gca aaa gac ttg ggt aat caa gtc tac gat gtc gta tca cta    9250
Ala Leu Ala Lys Asp Leu Gly Asn Gln Val Tyr Asp Val Val Ser Leu
        275                 280                 285
atg gag gga ttt gca tac gga gct gtc cag cta ctc gag ccg tca ggt    9298
Met Glu Gly Phe Ala Tyr Gly Ala Val Gln Leu Leu Glu Pro Ser Gly
    290                 295                 300
aca ttt gca gga gat ttc ttc gca ttc aac ctg cag gag ctt aaa gac    9346
Thr Phe Ala Gly Asp Phe Phe Ala Phe Asn Leu Gln Glu Leu Lys Asp
305                 310                 315                 320
att cta att ggc ctc ctc ccc aat gat ata gca gaa tcc gtg act cat    9394
Ile Leu Ile Gly Leu Leu Pro Asn Asp Ile Ala Glu Ser Val Thr His
                325                 330                 335
gca atc gct act gta ttc tct ggt tta gaa cag aat caa gca gct gag    9442
Ala Ile Ala Thr Val Phe Ser Gly Leu Glu Gln Asn Gln Ala Ala Glu
            340                 345                 350
atg ttg tgt ctg ttg cgt ctg tgg ggt cac cca ctg ctt gag tcc cgt    9490
Met Leu Cys Leu Leu Arg Leu Trp Gly His Pro Leu Leu Glu Ser Arg
        355                 360                 365
att gca gca aag gca gtc agg agc caa atg tgc gca ccg aaa atg gta    9538
Ile Ala Ala Lys Ala Val Arg Ser Gln Met Cys Ala Pro Lys Met Val
    370                 375                 380
gac ttt gat atg atc ctt cag gta ctg tct ttc ttc aag gga aca atc    9586
Asp Phe Asp Met Ile Leu Gln Val Leu Ser Phe Phe Lys Gly Thr Ile
385                 390                 395                 400
atc aac ggg tac aga aag aag aat gca ggt gtg tgg ccg cga gtc aaa    9634
Ile Asn Gly Tyr Arg Lys Lys Asn Ala Gly Val Trp Pro Arg Val Lys
                405                 410                 415
gtg gat aca ata tat ggg aag gtc att ggg caa cta cat gca gat tca    9682
Val Asp Thr Ile Tyr Gly Lys Val Ile Gly Gln Leu His Ala Asp Ser
            420                 425                 430
gca gag att tca cac gat atc atg tta aga gag tat aag agt tta tct    9730
Ala Glu Ile Ser His Asp Ile Met Leu Arg Glu Tyr Lys Ser Leu Ser
        435                 440                 445
gca ctt gaa ttt gag cca tgt ata gaa tat gac cct gtc acc aac ctg    9778
Ala Leu Glu Phe Glu Pro Cys Ile Glu Tyr Asp Pro Val Thr Asn Leu
    450                 455                 460
agc atg ttc cta aaa gac aag gca atc gca cac ccc aac gat aat tgg    9826
Ser Met Phe Leu Lys Asp Lys Ala Ile Ala His Pro Asn Asp Asn Trp
465                 470                 475                 480
ctt gcc tcg ttt agg cgg aac ctt ctc tcc gaa gac cag aag aaa cat    9874
Leu Ala Ser Phe Arg Arg Asn Leu Leu Ser Glu Asp Gln Lys Lys His
                485                 490                 495
gta aaa gaa gca act tcg act aat cgc ctc ttg ata gag ttt tta gag    9922
Val Lys Glu Ala Thr Ser Thr Asn Arg Leu Leu Ile Glu Phe Leu Glu
            500                 505                 510
tca aat gat ttt gat cca tat aaa gag atg gaa tat ctg acg acc ctt    9970
Ser Asn Asp Phe Asp Pro Tyr Lys Glu Met Glu Tyr Leu Thr Thr Leu
        515                 520                 525
gag tac ctt aga gat gac aat gtg gca gta tca tac tcg ctc aag gag   10018
Glu Tyr Leu Arg Asp Asp Asn Val Ala Val Ser Tyr Ser Leu Lys Glu
    530                 535                 540
aag gaa gtg aaa gtt aat gga cgg atc ttc gct aag ctg aca aag aag   10066
Lys Glu Val Lys Val Asn Gly Arg Ile Phe Ala Lys Leu Thr Lys Lys
545                 550                 555                 560
tta agg aac tgt cag gtg atg gcg gaa ggg atc cta gcc gat cag att   10114
Leu Arg Asn Cys Gln Val Met Ala Glu Gly Ile Leu Ala Asp Gln Ile
                565                 570                 575
gca cct ttc ttt cag gga aat gga gtc att cag gat agc ata tcc ttg   10162
Ala Pro Phe Phe Gln Gly Asn Gly Val Ile Gln Asp Ser Ile Ser Leu
            580                 585                 590
acc aag agt atg cta gcg atg agt caa ctg tct ttt aac agc aat aag   10210
Thr Lys Ser Met Leu Ala Met Ser Gln Leu Ser Phe Asn Ser Asn Lys
        595                 600                 605
aaa cgt atc act gac tgt aaa gaa aga gta tct tca aac cgc aat cat   10258
Lys Arg Ile Thr Asp Cys Lys Glu Arg Val Ser Ser Asn Arg Asn His
    610                 615                 620
gat ccg aaa agc aag aac cgt cgg aga gtt gca acc ttc ata aca act   10306
Asp Pro Lys Ser Lys Asn Arg Arg Arg Val Ala Thr Phe Ile Thr Thr
625                 630                 635                 640
gac ctg caa aag tac tgt ctt aat tgg aga tat cag aca atc aaa ttg   10354
Asp Leu Gln Lys Tyr Cys Leu Asn Trp Arg Tyr Gln Thr Ile Lys Leu
                645                 650                 655
ttc gct cat gcc atc aat cag ttg atg ggc cta cct cac ttc ttc gaa   10402
Phe Ala His Ala Ile Asn Gln Leu Met Gly Leu Pro His Phe Phe Glu
            660                 665                 670
tgg att cac cta aga ctg atg gac act acg atg ttc gta gga gac cct   10450
Trp Ile His Leu Arg Leu Met Asp Thr Thr Met Phe Val Gly Asp Pro
        675                 680                 685
ttc aat cct cca agt gac cct act gac tgt gac ctc tca aga gtc cct    10498
Phe Asn Pro Pro Ser Asp Pro Thr Asp Cys Asp Leu Ser Arg Val Pro
    690                 695                 700
aat gat gac ata tat att gtc agt gcc aga ggg ggt atc gaa gga tta    10546
Asn Asp Asp Ile Tyr Ile Val Ser Ala Arg Gly Gly Ile Glu Gly Leu
705                 710                 715                 720
tgc cag aag cta tgg aca atg atc tca att gct gca atc caa ctt gct    10594
Cys Gln Lys Leu Trp Thr Met Ile Ser Ile Ala Ala Ile Gln Leu Ala
                725                 730                 735
gca gct aga tcg cat tgt cgt gtt gcc tgt atg gta cag ggt gat aat    10642
Ala Ala Arg Ser His Cys Arg Val Ala Cys Met Val Gln Gly Asp Asn
            740                 745                 750
caa gta ata gca gta acg aga gag gta aga tca gac gac tct ccg gag    10690
Gln Val Ile Ala Val Thr Arg Glu Val Arg Ser Asp Asp Ser Pro Glu
        755                 760                 765
atg gtg ttg aca cag ttg cat caa gcc agt gat aat ttc ttc aag gaa    10738
Met Val Leu Thr Gln Leu His Gln Ala Ser Asp Asn Phe Phe Lys Glu
    770                 775                 780
tta att cat gtc aat cat ttg att ggc cat aat ttg aag gat cgt gaa    10786
Leu Ile His Val Asn His Leu Ile Gly His Asn Leu Lys Asp Arg Glu
785                 790                 795                 800
acc atc agg tca gac aca ttc ttc ata tac agc aaa cga atc ttc aaa    10834
Thr Ile Arg Ser Asp Thr Phe Phe Ile Tyr Ser Lys Arg Ile Phe Lys
                805                 810                 815
gat gga gca atc ctc agt caa gtc ctc aaa aat tca tct aaa tta gtg    10882
Asp Gly Ala Ile Leu Ser Gln Val Leu Lys Asn Ser Ser Lys Leu Val
            820                 825                 830
cta gtg tca ggt gat ctc agt gaa aac acc gta atg tcc tgt gcc aac    10930
Leu Val Ser Gly Asp Leu Ser Glu Asn Thr Val Met Ser Cys Ala Asn
        835                 840                 845
att gcc tct act gta gca cgg cta tgc gag aac ggg ctt ccc aaa gac    10978
Ile Ala Ser Thr Val Ala Arg Leu Cys Glu Asn Gly Leu Pro Lys Asp
    850                 855                 860
ttc tgt tac tat tta aac tat ata atg agt tgt gtg cag aca tac ttt    11026
Phe Cys Tyr Tyr Leu Asn Tyr Ile Met Ser Cys Val Gln Thr Tyr Phe
865                 870                 875                 880
gac tct gag ttc tcc atc acc aac aat tcg cac ccc gat ctt aat cag    11074
Asp Ser Glu Phe Ser Ile Thr Asn Asn Ser His Pro Asp Leu Asn Gln
                885                 890                 895
tcg tgg att gag gac atc tct ttt gtg cac tca tat gtt ctg act cct    11122
Ser Trp Ile Glu Asp Ile Ser Phe Val His Ser Tyr Val Leu Thr Pro
            900                 905                 910
gcc caa tta ggg gga ctg agt aac ctt caa tac tca agg ctc tac act    11170
Ala Gln Leu Gly Gly Leu Ser Asn Leu Gln Tyr Ser Arg Leu Tyr Thr
        915                 920                 925
aga aat atc ggt gac ccg ggg act act gct ttt gca gag atc aag cga    11218
Arg Asn Ile Gly Asp Pro Gly Thr Thr Ala Phe Ala Glu Ile Lys Arg
    930                 935                 940
cta gaa gca gtg gga tta ctg agt cct aac att atg act aat atc tta    11266
Leu Glu Ala Val Gly Leu Leu Ser Pro Asn Ile Met Thr Asn Ile Leu
945                 950                 955                 960
act agg ccg cct ggg aat gga gat tgg gcc agt ctg tgc aac gac cca    11314
Thr Arg Pro Pro Gly Asn Gly Asp Trp Ala Ser Leu Cys Asn Asp Pro
                965                 970                 975
tac tct ttc aat ttt gag act gtt gca agc cca aat att gtt ctt aag    11362
Tyr Ser Phe Asn Phe Glu Thr Val Ala Ser Pro Asn Ile Val Leu Lys
            980                 985                 990
aaa cat acg caa aga gtc cta ttt gaa act tgt tca aat ccc tta ttg    11410
Lys His Thr Gln Arg Val Leu Phe Glu Thr Cys Ser Asn Pro Leu Leu
        995                1000                1005
tct gga gtg cac aca gag gat aat gag gca gaa gag aag gca ttg gct    11458
Ser Gly Val His Thr Glu Asp Asn Glu Ala Glu Glu Lys Ala Leu Ala
   1010                1015                1020
gaa ttc ttg ctt aat caa gag gtg att cat ccc cgc gtt gcg cat gcc    11506
Glu Phe Leu Leu Asn Gln Glu Val Ile His Pro Arg Val Ala His Ala
1025               1030                1035                1040
atc atg gag gca agc tct gta ggt agg aga aag caa att caa ggg ctt    11554
Ile Met Glu Ala Ser Ser Val Gly Arg Arg Lys Gln Ile Gln Gly Leu
               1045                1050                1055
gtt gac aca aca aac acc gta att aag att gcg ctt act agg agg cca    11602
Val Asp Thr Thr Asn Thr Val Ile Lys Ile Ala Leu Thr Arg Arg Pro
           1060                1065                1070
tta ggc atc aag agg ctg atg cgg ata gtc aat tat tct agc atg cat    11650
Leu Gly Ile Lys Arg Leu Met Arg Ile Val Asn Tyr Ser Ser Met His
       1075                1080                1085
gca atg ctg ttt aga gac gat gtt ttt tcc tcc agt aga tcc aac cac    11698
Ala Met Leu Phe Arg Asp Asp Val Phe Ser Ser Ser Arg Ser Asn His
   1090                1095                1100
ccc tta gtc tct tct aat atg tgt tct ctg aca ctg gca gac tat gca    11746
Pro Leu Val Ser Ser Asn Met Cys Ser Leu Thr Leu Ala Asp Tyr Ala
1105               1110                1115                1120
cgg aat aga agc tgg tca cct ttg acg gga ggc agg aaa ata ctg ggt    11794
Arg Asn Arg Ser Trp Ser Pro Leu Thr Gly Gly Arg Lys Ile Leu Gly
               1125                1130                1135
gta tct aat cct gat acg ata gaa ctc gta gag ggt gag att ctt agt    11842
Val Ser Asn Pro Asp Thr Ile Glu Leu Val Glu Gly Glu Ile Leu Ser
           1140                1145                1150
gta agc gga ggg tgt aca aga tgt gac agc gga gat gaa caa ttt act    11890
Val Ser Gly Gly Cys Thr Arg Cys Asp Ser Gly Asp Glu Gln Phe Thr
       1155                1160                1165
tgg ttc cat ctt cca agc aat ata gaa ttg acc gat gac acc agc aag    11938
Trp Phe His Leu Pro Ser Asn Ile Glu Leu Thr Asp Asp Thr Ser Lys
   1170                1175                1180
aat cct ccg atg agg gta cca tat ctc ggg tca aag aca cag gag agg    11986
Asn Pro Pro Met Arg Val Pro Tyr Leu Gly Ser Lys Thr Gln Glu Arg
1185               1190                1195                1200
aga gct gcc tca ctt gca aaa ata gct cat atg tcg cca cat gta aag    12034
Arg Ala Ala Ser Leu Ala Lys Ile Ala His Met Ser Pro His Val Lys
               1205                1210                1215
gct gcc cta agg gca tca tcc gtg ttg atc tgg gct tat ggg gat aat        12082
Ala Ala Leu Arg Ala Ser Ser Val Leu Ile Trp Ala Tyr Gly Asp Asn
           1220                1225                1230
gaa gta aat tgg act gct gct ctt acg att gca aaa tct cgg tgt aat        12130
Glu Val Asn Trp Thr Ala Ala Leu Thr Ile Ala Lys Ser Arg Cys Asn
       1235                1240                1245
gta aac tta gag tat ctt cgg tta ctg tcc cct tta ccc acg gct ggg        12178
Val Asn Leu Glu Tyr Leu Arg Leu Leu Ser Pro Leu Pro Thr Ala Gly
   1250                1255                1260
aat ctt caa cat aga cta gat gat ggt ata act cag atg aca ttc acc        12226
Asn Leu Gln His Arg Leu Asp Asp Gly Ile Thr Gln Met Thr Phe Thr
1265               1270                1275                1280
cct gca tct ctc tac agg gtg tca cct tac att cac ata tcc aat gat        12274
Pro Ala Ser Leu Tyr Arg Val Ser Pro Tyr Ile His Ile Ser Asn Asp
               1285                1290                1295
tct caa agg ctg ttc act gaa gaa gga gtc aaa gag ggg aat gtg gtt        12322
Ser Gln Arg Leu Phe Thr Glu Glu Gly Val Lys Glu Gly Asn Val Val
           1300                1305                1310
tac caa cag atc atg ctc ttg ggt tta tct cta atc gaa tcg ata ttt        12370
Tyr Gln Gln Ile Met Leu Leu Gly Leu Ser Leu Ile Glu Ser Ile Phe
       1315                1320                1325
cca atg aca aca acc agg aca tat gat gag atc aca ctg cac cta cat        12418
Pro Met Thr Thr Thr Arg Thr Tyr Asp Glu Ile Thr Leu His Leu His
   1330                1335                1340
agt aaa ttt agt tgc tgt atc aga gaa gca cct gtt gcg gtt cct ttc        12466
Ser Lys Phe Ser Cys Cys Ile Arg Glu Ala Pro Val Ala Val Pro Phe
1345               1350                1355                1360
gag cta ctt ggg gtg gta ccg gaa ctg agg aca gtg acc tca aat aag        12514
Glu Leu Leu Gly Val Val Pro Glu Leu Arg Thr Val Thr Ser Asn Lys
               1365                1370                1375
ttt atg tat gat cct agc cct gta tcg gag gga gac ttt gcg aga ctt        12562
Phe Met Tyr Asp Pro Ser Pro Val Ser Glu Gly Asp Phe Ala Arg Leu
           1380                1385                1390
gac tta gct atc ttc aag agt tat gag ctt aat ctg gag tca tat ccc        12610
Asp Leu Ala Ile Phe Lys Ser Tyr Glu Leu Asn Leu Glu Ser Tyr Pro
       1395                1400                1405
acg ata gag cta atg aac att ctt tca ata tcc agc ggg aag ttg att        12658
Thr Ile Glu Leu Met Asn Ile Leu Ser Ile Ser Ser Gly Lys Leu Ile
   1410                1415                1420
ggc cag tct gtg gtt tct tat gat gaa gat acc tcc ata aag aat gac        12706
Gly Gln Ser Val Val Ser Tyr Asp Glu Asp Thr Ser Ile Lys Asn Asp
1425               1430                1435                1440
gcc ata ata gtg tat gac aat acc cga aat tgg atc agt gaa gct cag        12754
Ala Ile Ile Val Tyr Asp Asn Thr Arg Asn Trp Ile Ser Glu Ala Gln
               1445                1450                1455
aat tca gat gtg gtc cgc cta ttt gaa tat gca gca ctt gaa gtg ctc        12802
Asn Ser Asp Val Val Arg Leu Phe Glu Tyr Ala Ala Leu Glu Val Leu
           1460                1465                1470
ctc gac tgt tct tac caa ctc tat tac ctg aga gta aga ggc cta gac        12850
Leu Asp Cys Ser Tyr Gln Leu Tyr Tyr Leu Arg Val Arg Gly Leu Asp
       1475                1480                1485
aat att gtc tta tat atg ggt gat tta tac aag aat atg cca gga att    12898
Asn Ile Val Leu Tyr Met Gly Asp Leu Tyr Lys Asn Met Pro Gly Ile
   1490                1495                1500
cta ctt tcc aac att gca gct aca ata tct cat ccc gtc att cat tca    12946
Leu Leu Ser Asn Ile Ala Ala Thr Ile Ser His Pro Val Ile His Ser
1505               1510                1515                1520
agg tta cat gca gtg ggc ctg gtc aac cat gac gga tca cac caa ctt    12994
Arg Leu His Ala Val Gly Leu Val Asn His Asp Gly Ser His Gln Leu
               1525                1530                1535
gca gat acg gat ttt atc gaa atg tct gca aaa cta tta gta tct tgc    13042
Ala Asp Thr Asp Phe Ile Glu Met Ser Ala Lys Leu Leu Val Ser Cys
           1540                1545                1550
acc cga cgt gtg atc tcc ggc tta tat tca gga aat aag tat gat ctg    13090
Thr Arg Arg Val Ile Ser Gly Leu Tyr Ser Gly Asn Lys Tyr Asp Leu
       1555                1560                1565
ctg ttc cca tct gtc tta gat gat aac ctg aat gag aag atg ctt cag    13138
Leu Phe Pro Ser Val Leu Asp Asp Asn Leu Asn Glu Lys Met Leu Gln
   1570                1575                1580
ctg ata tcc cgg tta tgc tgt ctg tac acg gta ctc ttt gct aca aca    13186
Leu Ile Ser Arg Leu Cys Cys Leu Tyr Thr Val Leu Phe Ala Thr Thr
1585               1590                1595                1600
aga gaa atc ccg aaa ata aga ggc tta act gca gaa gag aaa tgt tca    13234
Arg Glu Ile Pro Lys Ile Arg Gly Leu Thr Ala Glu Glu Lys Cys Ser
               1605                1610                1615
ata ctc act gag tat tta ctg tcg gat gct gtg aaa cca tta ctt agc    13282
Ile Leu Thr Glu Tyr Leu Leu Ser Asp Ala Val Lys Pro Leu Leu Ser
           1620                1625                1630
ccc gat caa gtg agc tct atc atg tct cct aac ata att aca ttc cca    13330
Pro Asp Gln Val Ser Ser Ile Met Ser Pro Asn Ile Ile Thr Phe Pro
       1635                1640                1645
gct aat ctg tac tac atg tct cgg aag agc ctc aat ttg atc agg gaa    13378
Ala Asn Leu Tyr Tyr Met Ser Arg Lys Ser Leu Asn Leu Ile Arg Glu
   1650                1655                1660
agg gag gac agg gat act atc ctg gcg ttg ttg ttc ccc caa gag cca    13426
Arg Glu Asp Arg Asp Thr Ile Leu Ala Leu Leu Phe Pro Gln Glu Pro
1665               1670                1675                1680
tta tta gag ttc cct tct gtg caa gat att ggt gct cga gtg aaa gat    13474
Leu Leu Glu Phe Pro Ser Val Gln Asp Ile Gly Ala Arg Val Lys Asp
               1685                1690                1695
cca ttc acc cga caa cct gcg gca ttt ttg caa gag tta gat ttg agt    13522
Pro Phe Thr Arg Gln Pro Ala Ala Phe Leu Gln Glu Leu Asp Leu Ser
           1700                1705                1710
gct cca gca agg tat gac gca ttc aca ctt agt cag att cat cct gaa    13570
Ala Pro Ala Arg Tyr Asp Ala Phe Thr Leu Ser Gln Ile His Pro Glu
       1715                1720                1725
ctc aca tct cca aat ccg gag gaa gac tac tta gta cga tac ttg ttc    13618
Leu Thr Ser Pro Asn Pro Glu Glu Asp Tyr Leu Val Arg Tyr Leu Phe
   1730                1735                1740
aga ggg ata ggg act gca tct tcc tct tgg tat aag gca tcc cat ctc    13666
Arg Gly Ile Gly Thr Ala Ser Ser Ser Trp Tyr Lys Ala Ser His Leu
1745               1750                1755                1760
ctt tct gta ccc gag gta aga tgt gca aga cac ggg aac tcc tta tac    13714
Leu Ser Val Pro Glu Val Arg Cys Ala Arg His Gly Asn Ser Leu Tyr
               1765                1770                1775
tta gct gaa ggg agc gga gcc atc atg agt ctt ctc gaa ctg cat gta    13762
Leu Ala Glu Gly Ser Gly Ala Ile Met Ser Leu Leu Glu Leu His Val
           1780                1785                1790
cca cat gaa act atc tat tac aat acg ctc ttt tca aat gag atg aac    13810
Pro His Glu Thr Ile Tyr Tyr Asn Thr Leu Phe Ser Asn Glu Met Asn
       1795                1800                1805
ccc ccg caa cga cat ttc ggg ccg acc cca act cag ttt ttg aat tcg    13858
Pro Pro Gln Arg His Phe Gly Pro Thr Pro Thr Gln Phe Leu Asn Ser
   1810                1815                1820
gtt gtt tat agg aat cta cag gcg gag gta aca tgc aaa gat gga ttt    13906
Val Val Tyr Arg Asn Leu Gln Ala Glu Val Thr Cys Lys Asp Gly Phe
1825               1830                1835                1840
gtc caa gag ttc cgt cca tta tgg aga gaa aat aca gag gaa agt gac    13954
Val Gln Glu Phe Arg Pro Leu Trp Arg Glu Asn Thr Glu Glu Ser Asp
               1845                1850                1855
ctg acc tca gat aaa gca gtg ggg tat att aca tct gca gtg ccc tac    14002
Leu Thr Ser Asp Lys Ala Val Gly Tyr Ile Thr Ser Ala Val Pro Tyr
           1860                1865                1870
aga tct gta tca ttg ctg cat tgt gac att gaa att cct cca ggg tcc    14050
Arg Ser Val Ser Leu Leu His Cys Asp Ile Glu Ile Pro Pro Gly Ser
       1875                1880                1885
aat caa agc tta cta gat caa cta gct atc aat tta tct ctg att gcc    14098
Asn Gln Ser Leu Leu Asp Gln Leu Ala Ile Asn Leu Ser Leu Ile Ala
   1890                1895                1900
atg cat tct gta agg gag ggc ggg gta gta atc atc aaa gtg ttg tat    14146
Met His Ser Val Arg Glu Gly Gly Val Val Ile Ile Lys Val Leu Tyr
1905               1910                1915                1920
gca atg gga tac tac ttt cat cta ctc atg aac ttg ttt gct ccg tgt    14194
Ala Met Gly Tyr Tyr Phe His Leu Leu Met Asn Leu Phe Ala Pro Cys
               1925                1930                1935
tcc aca aaa gga tat att ctc tct aat ggt tat gca tgt cga gga gat    14242
Ser Thr Lys Gly Tyr Ile Leu Ser Asn Gly Tyr Ala Cys Arg Gly Asp
           1940                1945                1950
atg gag tgt tac ctg gta ttt gtc atg ggt tac ctg ggc ggg cct aca    14290
Met Glu Cys Tyr Leu Val Phe Val Met Gly Tyr Leu Gly Gly Pro Thr
       1955                1960                1965
ttt gta cat gag gtg gtg agg atg gca aaa act ctg gtg cag cgg cac    14338
Phe Val His Glu Val Val Arg Met Ala Lys Thr Leu Val Gln Arg His
   1970                1975                1980
ggt acg ctt ttg tct aaa tca gat gag atc aca ctg acc agg tta ttc    14386
Gly Thr Leu Leu Ser Lys Ser Asp Glu Ile Thr Leu Thr Arg Leu Phe
1985               1990                1995                2000
acc tca cag cgg cag cgt gtg aca gac atc cta tcc agt cct tta cca    14434
Thr Ser Gln Arg Gln Arg Val Thr Asp Ile Leu Ser Ser Pro Leu Pro
               2005                2010                2015
aga tta ata aag tac ttg agg aag aat att gac act gcg ctg att gaa    14482
Arg Leu Ile Lys Tyr Leu Arg Lys Asn Ile Asp Thr Ala Leu Ile Glu
           2020                2025                2030
gcc ggg gga cag ccc gtc cgt cca ttc tgt gcg gag agt ctg gtg agc    14530
Ala Gly Gly Gln Pro Val Arg Pro Phe Cys Ala Glu Ser Leu Val Ser
       2035                2040                2045
acg cta gcg aac ata act cag ata acc cag atc atc gct agt cac att    14578
Thr Leu Ala Asn Ile Thr Gln Ile Thr Gln Ile Ile Ala Ser His Ile
   2050                2055                2060
gac aca gtt atc cgg tct gtg ata tat atg gaa gct gag ggt gat ctc    14626
Asp Thr Val Ile Arg Ser Val Ile Tyr Met Glu Ala Glu Gly Asp Leu
2065               2070                2075                2080
gct gac aca gta ttt cta ttt acc cct tac aat ctc tct act gac ggg    14674
Ala Asp Thr Val Phe Leu Phe Thr Pro Tyr Asn Leu Ser Thr Asp Gly
               2085                2090                2095
aaa aag agg aca tca ctt aaa cag tgc acg aga cag atc cta gag gtt    14722
Lys Lys Arg Thr Ser Leu Lys Gln Cys Thr Arg Gln Ile Leu Glu Val
           2100                2105                2110
aca ata cta ggt ctt aga gtc gaa aat ctc aat aaa ata ggc gat ata    14770
Thr Ile Leu Gly Leu Arg Val Glu Asn Leu Asn Lys Ile Gly Asp Ile
       2115                2120                2125
atc agc cta gtg ctt aaa ggc atg atc tcc atg gag gac ctt atc cca    14818
Ile Ser Leu Val Leu Lys Gly Met Ile Ser Met Glu Asp Leu Ile Pro
   2130                2135                2140
cta agg aca tac ttg aag cat agt acc tgc cct aaa tat ttg aag gct    14866
Leu Arg Thr Tyr Leu Lys His Ser Thr Cys Pro Lys Tyr Leu Lys Ala
2145               2150                2155                2160
gtc cta ggt att acc aaa ctc aaa gaa atg ttt aca gac act tct gta    14914
Val Leu Gly Ile Thr Lys Leu Lys Glu Met Phe Thr Asp Thr Ser Val
               2165                2170                2175
ctg tac ttg act cgt gct caa caa aaa ttc tac atg aaa act ata ggc    14962
Leu Tyr Leu Thr Arg Ala Gln Gln Lys Phe Tyr Met Lys Thr Ile Gly
           2180                2185                2190
aat gca gtc aaa gga tat tac agt aac tgt gac tct     ta acgaaaatca  15010
Asn Ala Val Lys Gly Tyr Tyr Ser Asn Cys Asp Ser
       2195                2200
catattaata ggctcctttt ttggccaatt gtattcttgt tgatttaatc atattatgtt    15070
agaaaaaagt tgaaccctga ctccttagga ctcgaattcg aactcaaata aatgtcttaa    15130
aaaaaggttg cgcacaatta ttcttgagtg tagtctcgtc attcaccaaa tctttgtttg    15190
gtgggtcggc atggcatctc cacctcctcg cggtccgacc tgggcatccg aaggaggacg    15250
tcgtccactc ggatggctaa gggagagctc ggatccggct gctaacaaag cccgaaagga    15310
agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa    15370
acgggtcttg aggggttttt tgcatatgcg gtgtgaaata ccgcacagat gcgtaaggag    15430
aaaataccgc atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt    15490
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc    15550
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa    15610
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa    15670
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc    15730
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc    15790
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag    15850
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga    15910
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc    15970
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac    16030
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg    16090
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca    16150
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa    16210
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa    16270
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt    16330
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag    16390
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat    16450
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc    16510
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa    16570
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca    16630
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa    16690
cgttgttgcc attgctgcag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt    16750
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc    16810
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact    16870
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc    16930
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg    16990
ctcttgcccg gcgtcaacac gggataatac cgcgccacat agcagaactt taaaagtgct    17050
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc    17110
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag    17170
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac    17230
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg    17290
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt    17350
tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac    17410
attaacctat aaaaataggc gtatcacgag gccctttcgt cttcaagaat tctaatacga    17470
ctcactatag g                                                         17481
<210>2
<211>489
<212>PRT
<213>人工序列
<400>2
Met Ser Ser Val Phe Asp Glu Tyr Glu Gln Leu Leu Ala Ala Gln Thr
  1               5                  10                  15
Arg Pro Asn Gly Ala His Gly Gly Gly Glu Lys Gly Ser Thr Leu Lys
             20                  25                  30
Val Asp Val Pro Val Phe Thr Leu Asn Ser Asp Asp Pro Glu Asp Arg
         35                  40                  45
Trp Ser Phe Val Val Phe Cys Leu Arg Ile Ala Val Ser Glu Asp Ala
     50                  55                  60
Asn Lys Pro Leu Arg Gln Gly Ala Leu Ile Ser Leu Leu Cys Ser His
 65                  70                  75                  80
Ser Gln Val Met Arg Asn His Val Ala Ile Ala Gly Lys Gln Asn Glu
                 85                  90                  95
Ala Thr Leu Ala Val Leu Glu Ile Asp Gly Phe Ala Asn Gly Thr Pro
            100                 105                 110
Gln Phe Asn Asn Arg Ser Gly Val Ser Glu Glu Arg Ala Gln Arg Phe
        115                 120                 125
Ala Met Ile Ala Gly Ser Leu Pro Arg Ala Cys Ser Asn Gly Thr Pro
    130                 135                 140
Phe Val Thr Ala Gly Ala Glu Asp Asp Ala Pro Glu Asp Ile Thr Asp
145                 150                 155                 160
Thr Leu Glu Arg Ile Leu Ser Ile Gln Ala Gln Val Trp Val Thr Val
                165                 170                 175
Ala Lys Ala Met Thr Ala Tyr Glu Thr Ala Asp Glu Ser Glu Thr Arg
            180                 185                 190
Arg Ile Asn Lys Tyr Met Gln Gln Gly Arg Val Gln Lys Lys Tyr Ile
        195                 200                 205
Leu Tyr Pro Val Cys Arg Ser Thr Ile Gln Leu Thr Ile Arg Gln Ser
    210                 215                 220
Leu Ala Val Arg Ile Phe Leu Val Ser Glu Leu Lys Arg Gly Arg Asn
225                 230                 235                 240
Thr Ala Gly Gly Thr Ser Thr Tyr Tyr Asn Leu Val Gly Asp Val Asp
                245                 250                 255
Ser Tyr Ile Arg Asn Thr Gly Leu Thr Ala Phe Phe Leu Thr Leu Lys
            260                 265                 270
Tyr Gly Ile Asn Thr Lys Thr Ser Ala Leu Ala Leu Ser Ser Leu Ser
        275                 280                 285
Gly Asp Ile Gln Lys Met Lys Gln Leu Met Arg Leu Tyr Arg Met Lys
    290                 295                 300
Gly Asp Asn Ala Pro Tyr Met Thr Leu Leu Gly Asp Ser Asp Gln Met
305                 310                 315                 320
Ser Phe Ala Pro Ala Glu Tyr Ala Gln Leu Tyr Ser Phe Ala Met Gly
                325                 330                 335
Met Ala Ser Val Leu Asp Lys Gly Thr Gly Lys Tyr Gln Phe Ala Arg
            340                 345                 350
Asp Phe Met Ser Thr Ser Phe Trp Arg Leu Gly Val Glu Tyr Ala Gln
        355                 360                 365
Ala Gln Gly Ser Ser Ile Asn Glu Asp Met Ala Ala Glu Leu Lys Leu
    370                 375                 380
Thr Pro Ala Ala Met Lys Gly Leu Ala Ala Ala Ala Gln Arg Val Ser
385                 390                 395                 400
Asp Asp Thr Ser Ser Ile Tyr Met Pro Thr Gln Gln Val Gly Val Leu
                405                 410                 415
Thr Gly Leu Ser Glu Gly Gly Ser Gln Ala Leu Gln Gly Gly Ser Asn
            420                 425                 430
Arg Ser Gln Gly Gln Pro Glu Ala Gly Asp Gly Glu Thr Gln Phe Leu
        435                 440                 445
Asp Leu Met Arg Ala Val Ala Asn Ser Met Arg Glu Ala Pro Asn Ser
    450                 455                 460
Ala Gln Gly Thr Pro Gln Ser Gly Pro Pro Pro Thr Pro Gly Pro Ser
465                 470                 475                 480
Gln Asp Asn Asp Thr Asp Trp Gly Tyr
                485
<210>3
<211>395
<212>PRT
<213>人工序列
<400>3
Met Ala Thr Phe Thr Asp Ala Glu Ile Asp Glu Leu Phe Glu Thr Ser
  1               5                  10                  15
Gly Thr Val Ile Asp Asn Ile Ile Thr Ala Gln Gly Lys Pro Ala Glu
             20                  25                  30
Thr Val Gly Arg Ser Ala Ile Pro Gln Gly Lys Thr Lys Val Leu Ser
         35                  40                  45
Ala Ala Trp Glu Lys His Gly Ser Ile Gln Pro Pro Ala Ser Gln Asp
     50                  55                  60
Asn Pro Asp Arg Gln Asp Arg Ser Asp Lys Gln Pro Ser Thr Pro Glu
 65                  70                  75                  80
Gln Thr Thr Pro His Asp Ser Pro Pro Ala Thr Ser Ala Asp Gln Pro
                 85                  90                  95
Pro Thr Gln Ala Thr Asp Glu Ala Val Asp Thr Gln Phe Arg Thr Gly
            100                 105                 110
Ala Ser Asn Ser Leu Leu Leu Met Leu Asp Lys Leu Ser Asn Lys Ser
        115                 120                 125
Ser Asn Ala Lys Lys Gly Pro Trp Ser Ser Pro Gln Glu Gly Asn His
    130                 135                 140
Gln Arg Pro Thr Gln Gln Gln Gly Ser Gln Pro Ser Arg Gly Asn Ser
145                 150                 155                 160
Gln Glu Arg Pro Gln Asn Gln Val Lys Ala Ala Pro Gly Asn Gln Gly
                165                 170                 175
Thr Asp Val Asn Thr Ala Tyr His Gly Gln Trp Glu Glu Ser Gln Leu
            180                 185                 190
Ser Ala Gly Ala Thr Pro His Ala Leu Arg Ser Arg Gln Ser Gln Asp
        195                 200                 205
Asn Thr Leu Val Ser Ala Asp His Val Gln Pro Pro Val Asp Phe Val
    210                 215                 220
Gln Ala Met Met Ser Met Met Glu Ala Ile Ser Gln Arg Val Ser Lys
225                 230                 235                 240
Val Asp Tyr Gln Leu Asp Leu Val Leu Lys Gln Thr Ser Ser Ile Pro
                245                 250                 255
Met Met Arg Ser Glu Ile Gln Gln Leu Lys Thr Ser Val Ala Val Met
            260                 265                 270
Glu Ala Asn Leu Gly Met Met Lys Ile Leu Asp Pro Gly Cys Ala Asn
        275                 280                 285
Ile Ser Ser Leu Ser Asp Leu Arg Ala Val Ala Arg Ser His Pro Val
    290                 295                 300
Leu Val Ser Gly Pro Gly Asp Pro Ser Pro Tyr Val Thr Gln Gly Gly
305                 310                 315                 320
Glu Met Ala Leu Asn Lys Leu Ser Gln Pro Val Pro His Pro Ser Glu
                325                 330                 335
Leu Ile Lys Pro Ala Thr Ala Cys Gly Pro Asp Ile Gly Val Glu Lys
            340                 345                 350
Asp Thr Val Arg Ala Leu Ile Met Ser Arg Pro Met His Pro Ser Ser
        355                 360                 365
Ser Ala Lys Leu Leu Ser Lys Leu Asp Ala Ala Gly Ser Ile Glu Glu
    370                 375                 380
Ile Arg Lys Ile Lys Arg Leu Ala Leu Asn Gly
385                 390                 395
<210>4
<211>364
<212>PRT
<213>人工序列
<400>4
Met Asp Ser Ser Arg Thr Ile Gly Leu Tyr Phe Asp Ser Ala His Ser
  1               5                  10                  15
Ser Ser Asn Leu Leu Ala Phe Pro Ile Val Leu Gln Asp Thr Gly Asp
             20                  25                  30
Gly Lys Lys Gln Ile Ala Pro Gln Tyr Arg Ile Gln Arg Leu Asp Leu
         35                  40                  45
Trp Thr Asp Ser Lys Glu Asp Ser Val Phe Ile Thr Thr Tyr Gly Phe
     50                  55                  60
Ile Phe Gln Val Gly Asn Glu Glu Ala Thr Val Gly Met Ile Asp Asp
 65                  70                  75                  80
Lys Pro Lys Arg Glu Leu Leu Ser Ala Ala Met Leu Cys Leu Gly Ser
                 85                  90                  95
Val Pro Asn Thr Gly Asp Leu Ile Glu Leu Ala Arg Ala Cys Leu Thr
            100                 105                 110
Met Ile Val Thr Cys Lys Lys Ser Ala Thr Asn Thr Glu Arg Met Val
        115                 120                 125
Phe Ser Val Val Gln Ala Pro Gln Val Leu Gln Ser Cys Arg Val Val
    130                 135                 140
Ala Asn Lys Tyr Ser Ser Val Asn Ala Val Lys His Val Lys Ala Pro
145                 150                 155                 160
Glu Lys Ile Pro Gly Ser Gly Thr Leu Glu Tyr Lys Val Asn Phe Val
                165                 170                 175
Ser Leu Thr Val Val Pro Lys Lys Asp Val Tyr Lys Ile Pro Ala Ala
            180                 185                 190
Val Leu Lys Val Ser Gly Ser Ser Leu Tyr Asn Leu Ala Leu Asn Val
        195                 200                 205
Thr Ile Asn Val Glu Val Asp Pro Arg Ser Pro Leu Val Lys Ser Leu
    210                 215                 220
Ser Lys Ser Asp Ser Gly Tyr Tyr Ala Asn Leu Phe Leu His Ile Gly
225                 230                 235                 240
Leu Met Thr Thr Val Asp Arg Lys Gly Lys Lys Val Thr Phe Asp Lys
                245                 250                 255
Leu Glu Lys Lys Ile Arg Ser Leu Asp Leu Ser Val Gly Leu Ser Asp
            260                 265                 270
Val Leu Gly Pro Ser Val Leu Val Lys Ala Arg Gly Ala Arg Thr Lys
        275                 280                 285
Leu Leu Ala Pro Phe Phe Ser Ser Ser Gly Thr Ala Cys Tyr Pro Ile
    290                 295                 300
Ala Asn Ala Ser Pro Gln Val Ala Lys Ile Leu Trp Ser Gln Thr Ala
305                 310                 315                 320
Cys Leu Arg Ser Val Lys Ile Ile Ile Gln Ala Gly Thr Gln Arg Ala
                325                 330                 335
Val Ala Val Thr Ala Asp His Glu Val Thr Ser Thr Lys Leu Glu Lys
            340                 345                 350
Gly His Thr Leu Ala Lys Tyr Asn Pro Phe Lys Lys
        355                 360
<210>5
<211>553
<212>PRT
<213>人工序列
<400>5
Met Gly Ser Lys Leu Ser Thr Arg Ile Pro Ala Pro Leu Met Leu Thr
  1               5                  10                  15
Thr Arg Ile Thr Leu Ile Leu Ser Cys Ile Arg Pro Thr Ser Ser Leu
             20                  25                  30
Asp Gly Arg Pro Leu Ala Ala Ala Gly Ile Val Val Thr Gly Asp Lys
         35                  40                  45
Ala Val Asn Val Tyr Thr Ser Ser Gln Thr Gly Ser Ile Ile Val Lys
     50                  55                  60
Leu Leu Pro Asn Met Pro Arg Asp Lys Glu Ala Cys Ala Lys Ala Pro
 65                  70                  75                  80
Leu Glu Ala Tyr Asn Arg Thr Leu Thr Thr Leu Leu Thr Pro Leu Gly
                 85                  90                  95
Asp Ser Ile Arg Lys Ile Gln Gly Ser Val Ser Thr Ser Gly Gly Gly
            100                 105                 110
Arg Gln Ala Arg Leu Ile Gly Ala Val Ile Gly Ser Val Ala Leu Gly
        115                 120                 125
Val Ala Thr Ala Ala Gln Ile Thr Ala Ala Ala Ala Leu Ile Gln Ala
    130                 135                 140
Asn Gln Asn Ala Ala Asn Ile Leu Arg Leu Lys Glu Ser Ile Ala Ala
145                 150                 155                 160
Thr Asn Glu Ala Val His Glu Val Thr Asp Gly Leu Ser Gln Leu Ser
                165                 170                 175
Val Ala Val Gly Lys Met Gln Gln Phe Val Asn Asp Gln Phe Asn Asn
            180                 185                 190
Thr Ala Arg Glu Leu Asp Cys Ile Lys Ile Thr Gln Gln Val Gly Val
        195                 200                 205
Glu Leu Asn Leu Tyr Leu Thr Glu Leu Thr Thr Val Phe Gly Pro Gln
    210                 215                 220
Ile Thr Ser Pro Ala Leu Thr Gln Leu Thr Ile Gln Ala Leu Tyr Asn
225                 230                 235                 240
Leu Ala Gly Gly Asn Met Asn Tyr Leu Leu Thr Lys Leu Gly Ile Gly
                245                 250                 255
Asn Asn Gln Leu Ser Ser Leu Ile Gly Ser Gly Leu Ile Thr Gly Tyr
            260                 265                 270
Pro Ile Leu Tyr Asp Ser Gln Thr Gln Leu Leu Gly Ile Gln Val Asn
        275                 280                 285
Leu Pro Ser Val Gly Asn Leu Asn Asn Met Arg Ala Thr Tyr Leu Glu
    290                 295                 300
Thr Leu Ser Val Ser Thr Thr Lys Gly Tyr Ala Ser Ala Leu Val Pro
305                 310                 315                 320
Lys Val Val Thr Gln Val Gly Ser Val Ile Glu Glu Leu Asp Thr Ser
                325                 330                 335
Tyr Cys Ile Glu Ser Asp Leu Asp Leu Tyr Cys Thr Arg Ile Val Thr
            340                 345                 350
Phe Pro Met Ser Pro Gly Ile Tyr Ser Cys Leu Ser Gly Asn Thr Ser
        355                 360                 365
Ala Cys Met Tyr Ser Lys Thr Glu Gly Ala Leu Thr Thr Pro Tyr Met
    370                 375                 380
Ala Leu Lys Gly Ser Val Ile Ala Asn Cys Lys Ile Thr Thr Cys Arg
385                 390                 395                 400
Cys Thr Asp Pro Pro Gly Ile Ile Ser Gln Asn Tyr Gly Glu Ala Val
                405                 410                 415
Ser Leu Ile Asp Arg His Ser Cys Asn Val Leu Ser Leu Asp Gly Ile
            420                 425                 430
Thr Leu Arg Leu Ser Gly Glu Phe Asp Ala Thr Tyr Gln Lys Asn Ile
        435                 440                 445
Ser Ile Leu Asp Ser Gln Val Ile Val Thr Gly Asn Leu Asp Ile Ser
    450                 455                 460
Thr Glu Leu Gly Asn Val Asn Asn Ser Ile Ser Asn Ala Leu Asp Ser
465                 470                 475                 480
Leu Ala Glu Ser Asn Ser Lys Leu Glu Lys Ile Asn Val Arg Leu Thr
                485                 490                 495
Ser Thr Ser Ala Leu Ile Thr Tyr Ile Val Leu Thr Val Ile Ser Leu
            500                 505                 510
Val Phe Gly Ala Phe Ser Leu Gly Leu Ala Cys Tyr Leu Met Tyr Lys
        515                 520                 525
Gln Lys Ala Gln Gln Lys Thr Leu Leu Trp Leu Gly Asn Asn Thr Leu
    530                 535                 540
Asp Gln Met Arg Ala Thr Thr Arg Ala
545                 550
<210>6
<211>577
<212>PRT
<213>人工序列
<400>6
Met Asp Arg Ala Val Asn Arg Val Val Leu Glu Asn Glu Glu Arg Glu
  1               5                  10                  15
Ala Lys Asn Thr Trp Arg Leu Val Phe Arg Ile Ala Val Leu Leu Leu
             20                  25                  30
Met Val Met Thr Leu Ala Ile Ser Ser Ala Ala Leu Ala Tyr Ser Thr
         35                  40                  45
Gly Ala Ser Thr Pro His Asp Leu Ala Ser Ile Leu Thr Val Ile Ser
     50                  55                  60
Lys Thr Glu Asp Lys Val Thr Ser Leu Leu Ser Ser Ser Gln Asp Val
 65                  70                  75                  80
Ile Asp Arg Ile Tyr Lys Gln Val Ala Leu Glu Ser Pro Leu Ala Leu
                 85                  90                  95
Leu Asn Thr Glu Ser Val Ile Met Asn Ala Ile Thr Ser Leu Ser Tyr
            100                 105                 110
Gln Ile Asn Gly Ala Ala Asn Asn Ser Gly Cys Gly Ala Pro Val His
        115                 120                 125
Asp Pro Asp Tyr Ile Gly Gly Ile Gly Lys Glu Leu Ile Val Asp Asp
    130                 135                 140
Ile Ser Asp Val Thr Ser Phe Tyr Pro Ser Ala Tyr Gln Glu His Leu
145                 150                 155                 160
Asn Phe Ile Pro Ala Pro Thr Thr Gly Ser Gly Cys Thr Arg Ile Pro
                165                 170                 175
Ser Phe Asp Met Ser Thr Thr His Tyr Cys Tyr Thr His Asn Val Ile
            180                 185                 190
Leu Ser Gly Cys Arg Asp His Ser His Ser His Gln Tyr Leu Ala Leu
        195                 200                 205
Gly Val Leu Arg Thr Ser Ala Thr Gly Arg Val Phe Phe Ser Thr Leu
    210                 215                 220
Arg Ser Ile Asn Leu Asp Asp Thr Gln Asn Arg Lys Ser Cys Ser Val
225                 230                 235                 240
Ser Ala Thr Pro Leu Gly Cys Asp Met Leu Cys Ser Lys Val Thr Gly
                245                 250                 255
Thr Glu Glu Glu Asp Tyr Lys Ser Val Ala Pro Thr Ser Met Val His
            260                 265                 270
Gly Arg Leu Gly Phe Asp Gly Gln Tyr His Glu Lys Asp Leu Asp Thr
        275                 280                 285
Thr Val Leu Phe Lys Asp Trp Val Ala Asn Tyr Pro Gly Ala Gly Gly
    290                 295                 300
Gly Ser Phe Ile Asp Asp Arg Val Trp Phe Pro Val Tyr Gly Gly Leu
305                 310                 315                 320
Lys Pro Asp Ser Pro Ser Asp Thr Ala Gln Glu Gly Lys Tyr Val Ile
                325                 330                 335
Tyr Lys Arg His Asn Asn Thr Cys Pro Asp Lys Gln Asp Tyr Gln Ile
            340                 345                 350
Arg Lys Ala Lys Ser Ser Tyr Lys Pro Gly Arg Phe Gly Gly Lys Arg
        355                 360                 365
Val Gln Gln Ala Ile Leu Ser Ile Lys Val Ser Thr Ser Leu Gly Lys
    370                 375                 380
Asp Pro Val Leu Thr Ile Pro Pro Asn Thr Ile Thr Leu Met Gly Ala
385                 390                 395                 400
Glu Gly Arg Ile Leu Thr Val Gly Thr Ser His Phe Leu Tyr Gln Arg
                405                 410                 415
Gly Ser Ser Tyr Phe Ser Pro Ala Leu Leu Tyr Pro Met Thr Val Asn
            420                 425                 430
Asn Lys Thr Ala Thr Leu His Ser Pro Tyr Thr Phe Asn Ala Phe Thr
        435                 440                 445
Arg Pro Gly Ser Val Pro Cys Gln Ala Ser Ala Arg Cys Pro Asn Ser
    450                 455                 460
Cys Ile Thr Gly Val Tyr Thr Asp Pro Tyr Pro Leu Ile Phe His Arg
465                 470                 475                 480
Asn His Thr Leu Arg Gly Val Phe Gly Thr Met Leu Asp Asp Glu Gln
                485                 490                 495
Ala Arg Leu Asn Pro Val Ser Ala Val Phe Asp Asn Val Ser Arg Ser
            500                 505                 510
Arg Val Thr Arg Val Ser Ser Ser Ser Thr Lys Ala Ala Tyr Thr Thr
        515                 520                 525
Ser Thr Cys Phe Lys Val Val Lys Thr Asn Lys Thr Tyr Cys Leu Ser
    530                 535                 540
Ile Ala Glu Ile Ser Asn Thr Leu Phe Gly Glu Phe Arg Ile Val Pro
545                 550                 555                 560
Leu Leu Val Glu Ile Leu Lys Asp Asp Gly Val Arg Glu Ala Arg Ser
                565                 570                 575
Gly
<210>7
<211>2204
<212>PRT
<213>人工序列
<400>7
Met Ala Ser Ser Gly Pro Glu Arg Ala Glu His Gln Ile Ile Leu Pro
  1               5                  10                  15
Glu Ser His Leu Ser Ser Pro Leu Val Lys His Lys Leu Leu Tyr Tyr
             20                  25                  30
Trp Lys Leu Thr Gly Leu Pro Leu Pro Asp Glu Cys Asp Phe Asp His
         35                  40                  45
Leu Ile Leu Ser Arg Gln Trp Lys Lys Ile Leu Glu Ser Ala Ser Pro
     50                  55                  60
Asp Thr Glu Arg Met Ile Lys Leu Gly Arg Ala Val His Gln Thr Leu
 65                  70                  75                  80
Asn His Asn Ser Arg Ile Thr Gly Val Leu His Pro Arg Cys Leu Glu
                 85                  90                  95
Glu Leu Ala Asn Ile Glu Val Pro Asp Ser Thr Asn Lys Phe Arg Lys
            100                 105                 110
Ile Glu Lys Lys Ile Gln Ile His Asn Thr Arg Tyr Gly Glu Leu Phe
        115                 120                 125
Thr Arg Leu Cys Thr His Ile Glu Lys Lys Leu Leu Gly Ser Ser Trp
    130                 135                 140
Ser Asn Asn Val Pro Arg Ser Glu Glu Phe Ser Ser Ile Arg Thr Asp
145                 150                 155                 160
Pro Ala Phe Trp Phe His Ser Lys Trp Ser Thr Ala Lys Phe Ala Trp
                165                 170                 175
Leu His Ile Lys Gln Ile Gln Arg His Leu Met Val Ala Ala Arg Thr
            180                 185                 190
Arg Ser Ala Ala Asn Lys Leu Val Met Leu Thr His Lys Val Gly Gln
        195                 200                 205
Val Phe Val Thr Pro Glu Leu Val Val Val Thr His Thr Asn Glu Asn
    210                 215                 220
Lys Phe Thr Cys Leu Thr Gln Glu Leu Val Leu Met Tyr Ala Asp Met
225                 230                 235                 240
Met Glu Gly Arg Asp Met Val Asn Ile Ile Ser Thr Thr Ala Val His
                245                 250                 255
Leu Arg Ser Leu Ser Glu Lys Ile Asp Asp Ile Leu Arg Leu Ile Asp
            260                 265                 270
Ala Leu Ala Lys Asp Leu Gly Asn Gln Val Tyr Asp Val Val Ser Leu
        275                 280                 285
Met Glu Gly Phe Ala Tyr Gly Ala Val Gln Leu Leu Glu Pro Ser Gly
    290                 295                 300
Thr Phe Ala Gly Asp Phe Phe Ala Phe Asn Leu Gln Glu Leu Lys Asp
305                 310                 315                 320
Ile Leu Ile Gly Leu Leu Pro Asn Asp Ile Ala Glu Ser Val Thr His
                325                 330                 335
Ala Ile Ala Thr Val Phe Ser Gly Leu Glu Gln Asn Gln Ala Ala Glu
            340                 345                 350
Met Leu Cys Leu Leu Arg Leu Trp Gly His Pro Leu Leu Glu Ser Arg
        355                 360                 365
Ile Ala Ala Lys Ala Val Arg Ser Gln Met Cys Ala Pro Lys Met Val
    370                 375                 380
Asp Phe Asp Met Ile Leu Gln Val Leu Ser Phe Phe Lys Gly Thr Ile
385                 390                 395                 400
Ile Asn Gly Tyr Arg Lys Lys Asn Ala Gly Val Trp Pro Arg Val Lys
                405                 410                 415
Val Asp Thr Ile Tyr Gly Lys Val Ile Gly Gln Leu His Ala Asp Ser
            420                 425                 430
Ala Glu Ile Ser His Asp Ile Met Leu Arg Glu Tyr Lys Ser Leu Ser
        435                 440                 445
Ala Leu Glu Phe Glu Pro Cys Ile Glu Tyr Asp Pro Val Thr Asn Leu
    450                 455                 460
Ser Met Phe Leu Lys Asp Lys Ala Ile Ala His Pro Asn Asp Asn Trp
465                 470                 475                 480
Leu Ala Ser Phe Arg Arg Asn Leu Leu Ser Glu Asp Gln Lys Lys His
                485                 490                 495
Val Lys Glu Ala Thr Ser Thr Asn Arg Leu Leu Ile Glu Phe Leu Glu
            500                 505                 510
Ser Asn Asp Phe Asp Pro Tyr Lys Glu Met Glu Tyr Leu Thr Thr Leu
        515                 520                 525
Glu Tyr Leu Arg Asp Asp Asn Val Ala Val Ser Tyr Ser Leu Lys Glu
    530                 535                 540
Lys Glu Val Lys Val Asn Gly Arg Ile Phe Ala Lys Leu Thr Lys Lys
545                 550                 555                 560
Leu Arg Asn Cys Gln Val Met Ala Glu Gly Ile Leu Ala Asp Gln Ile
                565                 570                 575
Ala Pro Phe Phe Gln Gly Asn Gly Val Ile Gln Asp Ser Ile Ser Leu
            580                 585                 590
Thr Lys Ser Met Leu Ala Met Ser Gln Leu Ser Phe Asn Ser Asn Lys
        595                 600                 605
Lys Arg Ile Thr Asp Cys Lys Glu Arg Val Ser Ser Asn Arg Asn His
    610                 615                 620
Asp Pro Lys Ser Lys Asn Arg Arg Arg Val Ala Thr Phe Ile Thr Thr
625                 630                 635                 640
Asp Leu Gln Lys Tyr Cys Leu Asn Trp Arg Tyr Gln Thr Ile Lys Leu
                645                 650                 655
Phe Ala His Ala Ile Asn Gln Leu Met Gly Leu Pro His Phe Phe Glu
            660                 665                 670
Trp Ile His Leu Arg Leu Met Asp Thr Thr Met Phe Val Gly Asp Pro
        675                 680                 685
Phe Asn Pro Pro Ser Asp Pro Thr Asp Cys Asp Leu Ser Arg Val Pro
    690                 695                 700
Asn Asp Asp Ile Tyr Ile Val Ser Ala Arg Gly Gly Ile Glu Gly Leu
705                 710                 715                 720
Cys Gln Lys Leu Trp Thr Met Ile Ser Ile Ala Ala Ile Gln Leu Ala
                725                 730                 735
Ala Ala Arg Ser His Cys Arg Val Ala Cys Met Val Gln Gly Asp Asn
            740                 745                 750
Gln Val Ile Ala Val Thr Arg Glu Val Arg Ser Asp Asp Ser Pro Glu
        755                 760                 765
Met Val Leu Thr Gln Leu His Gln Ala Ser Asp Asn Phe Phe Lys Glu
    770                 775                 780
Leu Ile His Val Asn His Leu Ile Gly His Asn Leu Lys Asp Arg Glu
785                 790                 795                 800
Thr Ile Arg Ser Asp Thr Phe Phe Ile Tyr Ser Lys Arg Ile Phe Lys
                805                 810                 815
Asp Gly Ala Ile Leu Ser Gln Val Leu Lys Asn Ser Ser Lys Leu Val
            820                 825                 830
Leu Val Ser Gly Asp Leu Ser Glu Asn Thr Val Met Ser Cys Ala Asn
        835                 840                 845
Ile Ala Ser Thr Val Ala Arg Leu Cys Glu Asn Gly Leu Pro Lys Asp
    850                 855                 860
Phe Cys Tyr Tyr Leu Asn Tyr Ile Met Ser Cys Val Gln Thr Tyr Phe
865                 870                 875                 880
Asp Ser Glu Phe Ser Ile Thr Asn Asn Ser His Pro Asp Leu Asn Gln
                885                 890                 895
Ser Trp Ile Glu Asp Ile Ser Phe Val His Ser Tyr Val Leu Thr Pro
            900                 905                 910
Ala Gln Leu Gly Gly Leu Ser Asn Leu Gln Tyr Ser Arg Leu Tyr Thr
        915                 920                 925
Arg Asn Ile Gly Asp Pro Gly Thr Thr Ala Phe Ala Glu Ile Lys Arg
    930                 935                 940
Leu Glu Ala Val Gly Leu Leu Ser Pro Asn Ile Met Thr Asn Ile Leu
945                 950                 955                 960
Thr Arg Pro Pro Gly Asn Gly Asp Trp Ala Ser Leu Cys Asn Asp Pro
                965                 970                 975
Tyr Ser Phe Asn Phe Glu Thr Val Ala Ser Pro Asn Ile Val Leu Lys
            980                 985                 990
Lys His Thr Gln Arg Val Leu Phe Glu Thr Cys Ser Asn Pro Leu Leu
        995                1000                1005
Ser Gly Val His Thr Glu Asp Asn Glu Ala Glu Glu Lys Ala Leu Ala
   1010                1015                1020
Glu Phe Leu Leu Asn Gln Glu Val Ile His Pro Arg Val Ala His Ala
1025               1030                1035                1040
Ile Met Glu Ala Ser Ser Val Gly Arg Arg Lys Gln Ile Gln Gly Leu
               1045                1050                1055
Val Asp Thr Thr Asn Thr Val Ile Lys Ile Ala Leu Thr Arg Arg Pro
           1060                1065                1070
Leu Gly Ile Lys Arg Leu Met Arg Ile Val Asn Tyr Ser Ser Met His
       1075                1080                1085
Ala Met Leu Phe Arg Asp Asp Val Phe Ser Ser Ser Arg Ser Asn His
   1090                1095                1100
Pro Leu Val Ser Ser Asn Met Cys Ser Leu Thr Leu Ala Asp Tyr Ala
1105               1110                1115                1120
Arg Asn Arg Ser Trp Ser Pro Leu Thr Gly Gly Arg Lys Ile Leu Gly
               1125                1130                1135
Val Ser Asn Pro Asp Thr Ile Glu Leu Val Glu Gly Glu Ile Leu Ser
           1140                1145                1150
Val Ser Gly Gly Cys Thr Arg Cys Asp Ser Gly Asp Glu Gln Phe Thr
       1155                1160                1165
Trp Phe His Leu Pro Ser Asn Ile Glu Leu Thr Asp Asp Thr Ser Lys
   1170                1175                1180
Asn Pro Pro Met Arg Val Pro Tyr Leu Gly Ser Lys Thr Gln Glu Arg
1185               1190                1195                1200
Arg Ala Ala Ser Leu Ala Lys Ile Ala His Met Ser Pro His Val Lys
               1205                1210                1215
Ala Ala Leu Arg Ala Ser Ser Val Leu Ile Trp Ala Tyr Gly Asp Asn
           1220                1225                1230
Glu Val Asn Trp Thr Ala Ala Leu Thr Ile Ala Lys Ser Arg Cys Asn
       1235                1240                1245
Val Asn Leu Glu Tyr Leu Arg Leu Leu Ser Pro Leu Pro Thr Ala Gly
   1250                1255                1260
Asn Leu Gln His Arg Leu Asp Asp Gly Ile Thr Gln Met Thr Phe Thr
1265               1270                1275                1280
Pro Ala Ser Leu Tyr Arg Val Ser Pro Tyr Ile His Ile Ser Asn Asp
               1285                1290                1295
Ser Gln Arg Leu Phe Thr Glu Glu Gly Val Lys Glu Gly Asn Val Val
           1300                1305                1310
Tyr Gln Gln Ile Met Leu Leu Gly Leu Ser Leu Ile Glu Ser Ile Phe
       1315                1320                1325
Pro Met Thr Thr Thr Arg Thr Tyr Asp Glu Ile Thr Leu His Leu His
   1330                1335                1340
Ser Lys Phe Ser cys cys Ile Arg Glu Ala pro Val Ala Val Pro phe
1345               1350                1355                1360
Glu Leu Leu Gly Val VaL Pro Glu Leu Arg Thr Val Thr Ser Asn Lys
               1365                1370                1375
Phe Met Tyr Asp Pro Ser Pro Val Ser Glu Gly Asp Phe Ala Arg Leu
           1380                1385                1390
Asp Leu Ala Ile Phe Lys Ser Tyr Glu Leu Asn Leu Glu Ser Tyr Pro
       1395                1400                1405
Thr Ile Glu Leu Met Asn Ile Leu Ser Ile Ser Ser Gly Lys Leu Ile
   1410                1415                1420
Gly Gln Ser Val Val Ser Tyr Asp Glu Asp Thr Ser Ile Lys Asn Asp
1425               1430                1435                1440
Ala Ile Ile Val Tyr Asp Asn Thr Arg Asn Trp Ile Ser Glu Ala Gln
               1445                1450                1455
Asn Ser Asp Val Val Arg Leu Phe Glu Tyr Ala Ala Leu Glu Val Leu
           1460                1465                1470
Leu Asp Cys Ser Tyr Gln Leu Tyr Tyr Leu Arg Val Arg Gly Leu Asp
       1475                1480                1485
Asn Ile Val Leu Tyr Met Gly Asp Leu Tyr Lys Asn Met Pro Gly Ile
   1490                1495                1500
Leu Leu Ser Asn Ile Ala Ala Thr Ile Ser His Pro Val Ile His Ser
1505               1510                1515                1520
Arg Leu His Ala Val Gly Leu Val Asn His Asp Gly Ser His Gln Leu
               1525                1530                1535
Ala Asp Thr Asp Phe Ile Glu Met Ser Ala Lys Leu Leu Val Ser Cys
           1540                1545                1550
Thr Arg Arg Val Ile Ser Gly Leu Tyr Ser Gly Asn Lys Tyr Asp Leu
       1555                1560                1565
Leu Phe Pro Ser Val Leu Asp Asp Asn Leu Asn Glu Lys Met Leu Gln
   1570                1575                1580
Leu Ile Ser Arg Leu Cys Cys Leu Tyr Thr Val Leu Phe Ala Thr Thr
1585               1590                1595                1600
Arg Glu Ile Pro Lys Ile Arg Gly Leu Thr Ala Glu Glu Lys Cys Ser
               1605                1610                1615
Ile Leu Thr Glu Tyr Leu Leu Ser Asp Ala Val Lys Pro Leu Leu Ser
           1620                1625                1630
Pro Asp Gln Val Ser Ser Ile Met Ser Pro Asn Ile Ile Thr Phe Pro
       1635                1640                1645
Ala Asn Leu Tyr Tyr Met Ser Arg Lys Ser Leu Asn Leu Ile Arg Glu
   1650                1655                1660
Arg Glu Asp Arg Asp Thr Ile Leu Ala Leu Leu Phe Pro Gln Glu Pro
1665               1670                1675                1680
Leu Leu Glu Phe Pro Ser Val Gln Asp Ile Gly Ala Arg Val Lys Asp
               1685                1690                1695
Pro Phe Thr Arg Gln Pro Ala Ala Phe Leu Gln Glu Leu Asp Leu Ser
           1700                1705                1710
Ala Pro Ala Arg Tyr Asp Ala Phe Thr Leu Ser Gln Ile His Pro Glu
       1715                1720                1725
Leu Thr Ser Pro Asn Pro Glu Glu Asp Tyr Leu Val Arg Tyr Leu Phe
   1730                1735                1740
Arg Gly Ile Gly Thr Ala Ser Ser Ser Trp Tyr Lys Ala Ser His Leu
1745               1750                1755                1760
Leu Ser Val Pro Glu Val Arg Cys Ala Arg His Gly Asn Ser Leu Tyr
               1765                1770                1775
Leu Ala Glu Gly Ser Gly Ala Ile Met Ser Leu Leu Glu Leu His Val
           1780                1785                1790
Pro His Glu Thr Ile Tyr Tyr Asn Thr Leu Phe Ser Asn Glu Met Asn
       1795                1800                1805
Pro Pro Gln Arg His Phe Gly Pro Thr Pro Thr Gln Phe Leu Asn Ser
   1810                1815                1820
Val Val Tyr Arg Asn Leu Gln Ala Glu Val Thr Cys Lys Asp Gly Phe
1825               1830                1835                1840
Val Gln Glu Phe Arg Pro Leu Trp Arg Glu Asn Thr Glu Glu Ser Asp
               1845                1850                1855
Leu Thr Ser Asp Lys Ala Val Gly Tyr Ile Thr Ser Ala Val Pro Tyr
           1860                1865                1870
Arg Ser Val Ser Leu Leu His Cys Asp Ile Glu Ile Pro Pro Gly Ser
       1875                1880                1885
Asn Gln Ser Leu Leu Asp Gln Leu Ala Ile Asn Leu Ser Leu Ile Ala
   1890                1895                1900
Met His Ser Val Arg Glu Gly Gly Val Val Ile Ile Lys Val Leu Tyr
1905               1910                1915                1920
Ala Met Gly Tyr Tyr Phe His Leu Leu Met Asn Leu Phe Ala Pro Cys
               1925                1930                1935
Ser Thr Lys Gly Tyr Ile Leu Ser Asn Gly Tyr Ala Cys Arg Gly Asp
           1940                1945                1950
Met Glu Cys Tyr Leu Val Phe Val Met Gly Tyr Leu Gly Gly Pro Thr
       1955                1960                1965
Phe Val His Glu Val Val Arg Met Ala Lys Thr Leu Val Gln Arg His
   1970                1975                1980
Gly Thr Leu Leu Ser Lys Ser Asp Glu Ile Thr Leu Thr Arg Leu Phe
1985               1990                1995                2000
Thr Ser Gln Arg Gln Arg Val Thr Asp Ile Leu Ser Ser Pro Leu Pro
               2005                2010                2015
Arg Leu Ile Lys Tyr Leu Arg Lys Asn Ile Asp Thr Ala Leu Ile Glu
           2020                2025                2030
Ala Gly Gly Gln Pro Val Arg Pro Phe Cys Ala Glu Ser Leu Val Ser
       2035                2040                2045
Thr Leu Ala Asn Ile Thr Gln Ile Thr Gln Ile Ile Ala Ser His Ile
   2050                2055                2060
Asp Thr Val Ile Arg Ser Val Ile Tyr Met Glu Ala Glu Gly Asp Leu
2065               2070                2075                2080
Ala Asp Thr Val Phe Leu Phe Thr Pro Tyr Asn Leu Ser Thr Asp Gly
               2085                2090                2095
Lys Lys Arg Thr Ser Leu Lys Gln Cys Thr Arg Gln Ile Leu Glu Val
           2100                2105                2110
Thr Ile Leu Gly Leu Arg Val Glu Asn Leu Asn Lys Ile Gly Asp Ile
       2115                2120                2125
Ile Ser Leu Val Leu Lys Gly Met Ile Ser Met Glu Asp Leu Ile Pro
   2130                2135                2140
Leu Arg Thr Tyr Leu Lys His Ser Thr Cys Pro Lys Tyr Leu Lys Ala
2145               2150                2155                2160
Val Leu Gly Ile Thr Lys Leu Lys Glu Met Phe Thr Asp Thr Ser Val
               2165                2170                2175
Leu Tyr Leu Thr Arg Ala Gln Gln Lys Phe Tyr Met Lys Thr Ile Gly
           2180                2185                2190
Asn Ala Val Lys Gly Tyr Tyr Ser Asn Cys Asp Ser
       2195                2200
<210>8
<211>32
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-1F引物
<400>8
cgtctcgacc aaacagagaa tctgtgaggt ac                                         32
<210>9
<211>20
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-1746F引物
<400>9
gacaacacag gcacagctcg                                                        20
<210>10
<211>22
<212>DNA
<213>人工序列
<220>
<223ND-ZJ-2827F引物
<400>10
catctcctta cgtgacacaa gg                                                     22
<210>11
<211>28
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-F-F引物
<400>11
tcgcgacgca atatggctcc aaactttc                                             28
<210>12
<211>30
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-HN-F引物
<400>12
ccgcggcacc gacaacaaga gtcaatcatg                                          30
<210>13
<211>27
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-8100F引物
<400>13
actagttgag atcctcaagg atgatag                                                27
<210>14
<211>22
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-11648F引物
<400>14
catgcaatgt tgtccagaga tg                                                    22
<210>15
<211>22
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-12539F引物
<400>15
tcagagagag atttcgcgag ac                                                    22
<210>16
<211>23
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-14021F引物
<400>16
cattgtgaca ttgagattcc tcc                                                  23
<210>17
<211>23
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-1844R引物
<400>17
tcgtcttggt ctctggatgt ctc                                                 23
<210>18
<211>21
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-2948R引物
<400>18
cttctccact cccatgtcag g                                                     21
<210>19
<211>22
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-4612R引物
<400>19
cagcataatc cgggtgatca gc                                                    22
<210>20
<211>30
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-F-R引物
<400>20
ccgcggtaga acggatgttg tgaagcctaa                                             30
<210>21
<211>31
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-HN-R引物
<400>21
ctcaactagt aagggaacga tcctaaattc c                                            31
<210>22
<211>24
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-11815R引物
<400>22
tatggtatca gggttggata cacc                                                   24
<210>23
<211>23
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-12591R引物
<400>23
agctcataac tcttgaagat agc                                                    23
<210>24
<211>22
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-14110R引物
<400>24
cacagaatgc atggcaatca gg                                                     22
<210>25
<211>22
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-15118R引物
<400>25
actgaatccg aatacgactt cc                                                     22
<210>26
<211>21
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-597F引物
<400>26
ctgacactct ggaaagaatc c                                                       21
<210>27
<211>20
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-3421F引物
<400>27
gatccagcgc cttgattcgt                                                         20
<210>28
<211>21
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-8662F引物
<400>28
caggtgttta gaagaactgg c                                                       21
<210>29
<211>20
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-5759F引物
<400>29
cctcctggta tcatatcgca                                                         20
<210>30
<211>21
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-4679引物
<400>30
gtaacaggag ataaggcagt c                                                        21
<210>31
<211>20
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-7670引物
<400>31
ttcttgtacc aacgagggtc                                                         20
<210>32
<211>21
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-9328F引物
<400>32
cctacaggag ctcaaagaca c                                                       21
<210>33
<211>20
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-9977F引物
<400>33
ctaagagatg acagtgtggc                                                        20
<210>34
<211>20
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-10588F引物
<400>34
acttgctgca gcaagatctc                                                         20
<210>35
<211>20
<212>DNA
<213>人工序列
<220>
<223>ND-ZJ-13052F引物
<400>35
gtggtctcag gcttatatgc                                                        20
<210>36
<211>33
<212>DNA
<213>人工序列
<220>
<223>S1-F引物
<400>36
cgtctcgacc aaacagagaa tccgtgagtt acg                                         33
<210>37
<211>26
<212>DNA
<213>人工序列
<220>
<223>S1-R引物
<400>37
ccatgggccc tttttagcat tggacg                                                26
<210>38
<211>22
<212>DNA
<213>人工序列
<220>
<223>S2-F引物
<400>38
aaaagggccc atggtcgagc cc                                                      22
<210>39
<211>23
<212>DNA
<213>人工序列
<220>
<223>S2-R引物
<400>39
tatcatcgat catgccgaca gtg                                                    23
<210>40
<211>23
<212>DNA
<213>人工序列
<220>
<223>S3-F引物
<400>40
catgatcgat gataaaccca agc                                                    23
<210>41
<211>28
<212>DNA
<213>人工序列
<220>
<223>S3-R引物
<400>41
tcgcgaatga gccggtcggg atccagac                                              28
<210>42
<211>28
<212>DNA
<213>人工序列
<220>
<223>S4-F引物
<400>42
tcgcgacgca atatggctcc aaactttc                                               28
<210>43
<211>30
<212>DNA
<213>人工序列
<220>
<223>S4-R引物
<400>43
ccgcggtaga acggatgttg tgaagcctaa                                            30
<210>44
<211>30
<212>DNA
<213>人工序列
<220>
<223>S5-F引物
<400>44
ccgcggcacc gacaacaaga gtcaatcatg                                              30
<210>45
<211>31
<212>DNA
<213>人工序列
<220>
<223>S5-R引物
<400>45
ctcaactagt aagggaacga tcctaaattc c                                             31
<210>46
<211>27
<212>DNA
<213>人工序列
<220>
<223>S6-F引物
<400>46
actagttgag atcctcaagg atgatag                                                27
<210>47
<211>25
<212>DNA
<213>人工序列
<220>
<223>S7-R引物
<400>47
gatccgtacg aatgcagctg aactc                                                 25
<210>48
<211>24
<212>DNA
<213>人工序列
<220>
<223>S9-F引物
<400>48
cctaggtatt accaaactca aaga                                                 24
<210>49
<211>30
<212>DNA
<213>人工序列
<220>
<223>S9-R引物
<400>49
ggtctcaacc aaacaaagat ttggtgaatg                                             30
<210>50
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-601引物
<400>50
taccctggag aggatcctc                                                         19
<210>51
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-1261引物
<400>51
cgagctaaag ctaaccccag                                                       20
<210>52
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-1901引物
<400>52
agatgcagag atcgacgagc                                                         20
<210>53
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-2581引物
<400>53
aggcgatatc acagagagta                                                         20
<210>54
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-3271引物
<400>54
gtgccccaat tgtgccaag                                                        19
<210>55
<211>27
<212>DNA
<213>人工序列
<220>
<223>S6-F-La引物
<400>55
actagttgag atcctcaaag atgacgg                                                 27
<210>56
<211>33
<212>DNA
<213>人工序列
<220>
<223>S6-R-La引物
<400>56
tgctctgccc tttcaggacc ggagctcgcc atg                                          33
<210>57
<211>33
<212>DNA
<213>人工序列
<220>
<223>S7-F-La引物
<400>57
catggcgagc tccggtcctg aaagggcaga gca                                          33
<210>58
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-5121引物
<400>58
cagctcagga attagactgc                                                         20
<210>59
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-5711引物
<400>59
gtcatcgcca actgcaagat                                                         20
<210>60
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-7042引物
<400>60
ctccggacat ctgcaacag                                                        19
<210>61
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-8591引物
<400>61
aaactcggaa gggcagtac                                                        19
<210>62
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-9311引物
<400>62
ttcgcattca acctgcagg                                                        19
<210>63
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-9971引物
<400>63
cttagagatg acaatgtggc                                                         20
<210>64
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-10661引物
<400>64
gtaagatcag acgactctcc                                                        20
<210>65
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-11321引物
<400>65
tttgagactg ttgcaagcc                                                        19
<210>66
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-12012引物
<400>66
tgtcgccaca tgtaaaggc                                                         19
<210>67
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-12721引物
<400>67
tacccgaaat tggatcagtg                                                        20
<210>68
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-13339引物
<400>68
catgtctcgg aagagcctc                                                         19
<210>69
<211>19
<212>DNA
<213>人工序列
<220>
<223>La-13981引物
<400>69
atctgcagtg ccctacaga                                                        19
<210>70
<211>45
<212>DNA
<213>人工序列
<220>
<223>La14976引物
<400>70
acagtaactg tgactcttaa cgaaaatcac atattaatag gctcc                          45
<210>71
<211>45
<212>DNA
<213>人工序列
<220>
<223>La15020R引物
<400>71
ggagcctatt aatatgtgat tttcgttaag agtcacagtt actgt                         45
<210>72
<211>25
<212>DNA
<213>人工序列
<220>
<223>S7-R引物
<400>72
gatccgtacg aatgctgctg aactc                                                  25
<210>73
<211>20
<212>DNA
<213>人工序列
<220>
<223>NDV-Pt-R引物
<400>73
tgccactgmt agttgygata                                                        20
<210>74
<211>20
<212>DNA
<213>人工序列
<220>
<223>NDcomF156引物
<400>74
atacacctcr tcycagacag                                                       20
<210>75
<211>26
<212>DNA
<213>人工序列
<220>
<223>La-8892R引物
<400>75
gagccatgca aacttggctg tggacc                                                26
<210>76
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-14708引物
<400>76
acagtgcacg agacagatcc                                                        20
<210>77
<211>20
<212>DNA
<213>人工序列
<220>
<223>La-15092R引物
<400>77
gtcctaagga gtcagggttc                                                         20
<210>78
<211>31
<212>DNA
<213>人工序列
<220>
<223>NDV-NP-F引物
<400>78
gagcggccgc accatgagta cgagcagctc c                                            31
<210>79
<211>29
<212>DNA
<213>人工序列
<220>
<223>NDV-NP-R引物
<400>79
gagcggccgc tcagtacccc cagtcggtg                                              29
<210>80
<211>32
<212>DNA
<213>人工序列
<220>
<223>NDV-P-F引物
<400>80
gagcggccgc accatggcca cctttacaga tg                                          32
<210>81
<211>30
<212>DNA
<213>人工序列
<220>
<223>NDV-P-R引物
<400>81
gagcggccgc ttagccattt agagcaaggc                                            30
<210>82
<211>36
<212>DNA
<213>人工序列
<220>
<223>NDV-L-F引物
<400>82
gagcggccgc accatggcga gcctccgatc ctgaaa                                       36
<210>83
<211>37
<212>DNA
<213>人工序列
<220>
<223>NDV-L-R引物
<400>83
gagcggccgc ttaagagtca cagttactgt aatatcc                                     37
<210>84
<211>2357
<212>DNA
<213>人工序列
<220>
<223>pTMH载体的核苷酸序列
<400>84
gaattctaat acgactcact ataggaccaa gagacgggcc catatcgatt cgcgaccgcg     60
ggatactagt cgtacgccta ggggtctctt ggtgggtcgg catggcatct ccacctcctc    120
gcggtccgac ctgggcatcc gaaggaggac gtcgtccact cggatggcta agggagagct    180
cggatccggc tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc accgctgagc    240
aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgcatatgc    300
ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt    360
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact    420
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag    480
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata    540
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc    600
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg    660
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc    720
tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg    780
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc    840
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga    900
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg    960
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa   1020
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg   1080
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt   1140
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat    1200
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct    1260
aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta    1320
tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa    1380
ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac    1440
gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa    1500
gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag    1560
taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg    1620
tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag    1680
ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg    1740
tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc    1800
ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat    1860
tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca cgggataata    1920
ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa    1980
aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca    2040
actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc    2100
aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc    2160
tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg    2220
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac    2280
ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga    2340
ggccctttcg tcttcaa                                                   2357
<210>85
<211>300
<212>DNA
<213>人工序列
<220>
<223>KBNP-4152的HN基因(1-569)和Lasota株的HN末端(570-577)
     的核苷酸序列
<400>85
ccctttacta gttgagattc tcaaggatga tggggttagg gaggccaggg ctggccgctt     60
gagtcaattg cgagagggtt ggaaagatga cattgtatca cctatctttt gcgacgccaa    120
gaatcaaact gagtaccggc gtgagctcga gtcttacgct gccagctggc cataatcagc    180
tagcgctaat gtgattagat taaatcttgt cgatagtcac ttgattaaga aaaaatgtaa    240
gtggcaatga gatacaaggc aaaacagctc atggtaaata atacgggtag gacatggcga    300
                                                                     300

Claims (3)

1.一个新城疫病毒株,其中所述病毒株为KCTC 10984BP。
2.一种新城疫病疫苗,含有在权利要求1中所限定的新城疫病毒毒株。
3.根据权利要求2的疫苗,其中所述疫苗的使用类型选自灭活死疫苗、活疫苗和卵内疫苗。
CN2006800564366A 2006-09-26 2006-09-27 减毒重组体新城疫病毒及包含该病毒的疫苗 Active CN101595220B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1020060093620 2006-09-26
KR10-2006-0093620 2006-09-26
KR1020060093620A KR100801180B1 (ko) 2006-09-26 2006-09-26 약독화된 재조합 뉴캐슬병 바이러스 및 이를 함유하는뉴캐슬병 백신
PCT/KR2006/003837 WO2008038845A1 (en) 2006-09-26 2006-09-27 Attenuated recombinant newcastle disease virus and vaccine containing the same

Publications (2)

Publication Number Publication Date
CN101595220A CN101595220A (zh) 2009-12-02
CN101595220B true CN101595220B (zh) 2013-03-20

Family

ID=39230270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800564366A Active CN101595220B (zh) 2006-09-26 2006-09-27 减毒重组体新城疫病毒及包含该病毒的疫苗

Country Status (6)

Country Link
US (1) US8173136B2 (zh)
JP (1) JP5216012B2 (zh)
KR (1) KR100801180B1 (zh)
CN (1) CN101595220B (zh)
MY (1) MY163972A (zh)
WO (1) WO2008038845A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090258035A1 (en) * 2008-03-21 2009-10-15 The United States Of America, As Represented By The Secretary Of Agriculture Avian virus vaccines and uses thereof
ES2380289T3 (es) 2009-11-30 2012-05-10 United Cancer Research Institute Nuevo clon del virus de la enfermedad de Newcastle, su fabricación y aplicación en el tratamiento médico del cáncer
MX346643B (es) 2010-11-18 2016-11-11 Investig Aplicada S A De C V Virus de la enfermedad de newcastle y su uso como vacuna.
SI2785373T1 (sl) * 2011-11-30 2020-02-28 Boehringer Ingelheim Animal Health USA Inc. Rekombinantni vektorji HVT, ki izražajo antigene aviarnih patogenov in uporabe le-teh
US9114108B2 (en) 2011-11-30 2015-08-25 Merial, Inc. Recombinant HVT vectors expressing antigens of avian pathogens and uses thereof
CN102776156B (zh) * 2012-07-12 2013-11-06 扬州大学 基因Ⅵb亚型新城疫病毒致弱株ⅥbI4及其构建方法
CN104059942B (zh) * 2013-03-20 2016-12-28 湖北省农业科学院畜牧兽医研究所 新城疫病毒耐热活疫苗载体系统及其应用
KR101636683B1 (ko) * 2013-08-28 2016-07-07 주식회사 바이오포아 내열성이 향상된 뉴캣슬병 바이러스 bp acndm
CA2922071C (en) * 2013-09-03 2022-05-03 Medimmune Limited Compositions featuring an attenuated newcastle disease virus and methods of use for treating neoplasia
CN105085686B (zh) * 2015-07-30 2018-09-14 青岛明勤生物科技有限公司 一种重组基因vii型新城疫多表位疫苗
CN107287168B (zh) * 2016-03-31 2020-11-27 普莱柯生物工程股份有限公司 一种新城疫病毒拯救方法及其应用
US10196616B2 (en) 2017-02-15 2019-02-05 The United States Of America, As Represented By The Secretary Of Agriculture Altered avian virus for in-ovo inoculation and methods of use thereof
EP3552608A1 (en) * 2018-04-09 2019-10-16 Rapo Yerape B.H. Ltd Increased activity of oncoloytic newcastle disease virus
CN110511270B (zh) * 2019-08-31 2020-06-23 中国农业科学院哈尔滨兽医研究所(中国动物卫生与流行病学中心哈尔滨分中心) 一种形成新城疫病毒f蛋白融合前构象的多肽、核苷酸及构建方法和应用
CN114164184B (zh) * 2020-09-10 2024-02-09 青岛易邦生物工程有限公司 一种新城疫病毒基因ⅵ型疫苗株及其应用
CN115386534B (zh) * 2022-10-26 2023-02-21 天信和(苏州)生物科技有限公司 利用无血清培养基培养bhk21细胞的方法及其在制备疫苗中的用途
CN116926022B (zh) * 2023-07-20 2024-05-24 华南农业大学 一种鸽源基因Ⅵ型新城疫病毒mGZ08、用途、制备方法、培养方法、疫苗

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6699479B1 (en) * 1999-07-27 2004-03-02 Akzo Nobal N.V. Recombinant newcastle disease virus as an embryo vaccine
CN1772909A (zh) * 2005-09-02 2006-05-17 中国农业科学院哈尔滨兽医研究所 新城疫LaSota疫苗株反向遗传操作系统及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0974660A1 (en) 1998-06-19 2000-01-26 Stichting Instituut voor Dierhouderij en Diergezondheid (ID-DLO) Newcastle disease virus infectious clones, vaccines and diagnostic assays
US6146642A (en) * 1998-09-14 2000-11-14 Mount Sinai School Of Medicine, Of The City University Of New York Recombinant new castle disease virus RNA expression systems and vaccines
AU4971500A (en) * 1999-05-05 2000-11-21 University Of Maryland Production of novel newcastle disease virus strains from cdnas and improved liveattenuated newcastle disease vaccines
DK1383795T3 (da) 2000-11-02 2007-05-29 Intervet Int Bv Rekombinant nucleoproteinmutant fra Newcastle disease-virus som markörvaccine
KR100454870B1 (ko) * 2001-07-30 2004-11-03 주식회사 인트론바이오테크놀로지 뉴캐슬병 바이러스의 f 단백질과 hn 단백질 및 그의유전자들
WO2007108568A1 (en) * 2006-03-23 2007-09-27 Kbnp, Inc. Hn epitope recognized by avian immune system and antigenic variant newcastle disease viruses carrying changes in the epitope

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6699479B1 (en) * 1999-07-27 2004-03-02 Akzo Nobal N.V. Recombinant newcastle disease virus as an embryo vaccine
CN1772909A (zh) * 2005-09-02 2006-05-17 中国农业科学院哈尔滨兽医研究所 新城疫LaSota疫苗株反向遗传操作系统及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MEBATSION T et al."A recombinant Newcastle disease virus with low-level V protein expression is immunogenic and lacks pathogenicity for chicken embryos".《Journal of Virology》.2001,第75卷(第1期),第420-428页.
张艳梅等."新城疫病毒ZJ1株F蛋白裂解位点突变对其融合活性的影响".《微生物学通报》.2006,第33卷(第4期),第69-73页.
曾黎平等."新城疫病毒F和HN核心片段在杆状病毒中的表达".《江西农业大学学报》.2005,第27卷(第1期),第114-118页.

Also Published As

Publication number Publication date
WO2008038845A1 (en) 2008-04-03
US8173136B2 (en) 2012-05-08
JP5216012B2 (ja) 2013-06-19
JP2010504751A (ja) 2010-02-18
MY163972A (en) 2017-11-15
US20100183664A1 (en) 2010-07-22
KR100801180B1 (ko) 2008-02-05
CN101595220A (zh) 2009-12-02

Similar Documents

Publication Publication Date Title
CN101595220B (zh) 减毒重组体新城疫病毒及包含该病毒的疫苗
CN1250731C (zh) 正链rna病毒复制子颗粒的包装
KR101742346B1 (ko) 리소솜 축적병 효소
CN107090441A (zh) 用于获得高产量重组蛋白表达的基于mgmt的方法
CN108642053A (zh) CRISPR-Cas9靶向敲除人肠癌细胞PPP1R1C基因及其特异性的sgRNA
CN108588071A (zh) CRISPR-Cas9靶向敲除人肠癌细胞CNR1基因及其特异性的sgRNA
CN107893075A (zh) CRISPR‑Cas9靶向敲除人肠癌细胞RITA基因及其特异性的sgRNA
KR100862049B1 (ko) 약독화된 재조합 뉴캐슬병 바이러스
CN110914439B (zh) 自灭活病毒载体
AU740768B2 (en) Rapid generation of stable mammalian cell lines producing high levels of recombinant proteins
JP2022542828A (ja) 組換え修飾アデノ随伴ウイルスのパッケージング効率を改善するための組換え修飾アデノ随伴ウイルスヘルパーベクターおよびそれらの使用
CN111304252B (zh) 基于pink1及park7的非治疗目的的将病毒注入动物特定脑区进行基因编辑的方法
CN105176936B (zh) 复制耐受型的西门利克森林病毒的亚克隆及制备方法和应用
CN111304245B (zh) 基于mecp2基因的非治疗目的的将病毒注入动物特定脑区进行基因编辑的方法
CN113355296A (zh) 一种表达人ccl19的重组溶瘤新城疫病毒及其应用
CN101775410B (zh) 一种鸡痘病毒载体穿梭质粒及其应用
CN113061626B (zh) 一种组织特异性敲除斑马鱼基因的方法及应用
CN114874332B (zh) 经修饰的rnf112作为治疗als药物的应用
CN111867625A (zh) 具有失活ul18和/或ul8的新ehv
CN113637672B (zh) 一种碱基编辑工具及其构建方法
KR20080030378A (ko) 염색체내 형광단백질 유전자 일부가 삽입된 세포를포함하는 이분자 형광 상보 시스템 및 이를 이용한 이분자형광 상보 기법
CN111304257B (zh) 基于psen1基因的非治疗目的的将病毒注入动物特定脑区进行基因编辑的方法
CN114015722B (zh) 一种构建重症免疫缺陷和肝损伤双重猪模型的方法及应用
CN112029798B (zh) 一种在胰腺腺泡细胞特异表达pik3c3 s282a的小鼠模型的构建方法
KR101016766B1 (ko) 티오레독신이 융합된 단백질 발현용 플라스미드 및 이를 이용한 목적 단백질의 생산방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant