CN1041535C - 编码氨甲酰磷酸合成酶ⅱ的核苷酸序列 - Google Patents

编码氨甲酰磷酸合成酶ⅱ的核苷酸序列 Download PDF

Info

Publication number
CN1041535C
CN1041535C CN93121697A CN93121697A CN1041535C CN 1041535 C CN1041535 C CN 1041535C CN 93121697 A CN93121697 A CN 93121697A CN 93121697 A CN93121697 A CN 93121697A CN 1041535 C CN1041535 C CN 1041535C
Authority
CN
China
Prior art keywords
sequence
gene
phosphate synthetase
carbamoyl phosphate
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN93121697A
Other languages
English (en)
Other versions
CN1090327A (zh
Inventor
托马斯·斯坦利·斯图尔特
玛丽亚·维加·弗洛里斯
威廉·詹姆斯·O·沙利文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisearch Ltd
Original Assignee
Unisearch Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisearch Ltd filed Critical Unisearch Ltd
Publication of CN1090327A publication Critical patent/CN1090327A/zh
Application granted granted Critical
Publication of CN1041535C publication Critical patent/CN1041535C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/05Carbon-nitrogen ligases with glutamine as amido-N-donor (6.3.5)
    • C12Y603/05005Carbamoyl-phosphate synthase (glutamine-hydrolysing) (6.3.5.5)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供了编码恶性疟原虫氨甲酰磷酸合成酶II的核苷酸序列。氨甲酰磷酸合成酶II催化嘧啶从头生物合成途径的第一步定型和限速步骤。恶性疟原虫仅仅依赖于嘧啶从头生物合成,因为它不能补救嘧啶。而且认为成熟的人血红细胞不需要嘧啶核酸。因此,该酶代表主要的化学治疗位点。本发明涉及编码氨甲酰磷酸合成酶II的序列在重组制备氨甲酰磷酸合成酶II中的用途,还涉及由该序列设计的反义分子、核糖酶及其他基因失活剂。

Description

编码氨甲酰磷酸合成酶Ⅱ的核苷酸序列
本发明涉及编码恶性疟原虫(Plasmodium falciparum)的氨甲酰磷酸合成酶II的核苷酸序列,用重组DNA技术生产该酶的方法,以及该序列和酶在治疗学上的用途。
由于对传统药物具有抗性的人疟原虫、主要是恶性疟原虫的演化,目前迫切需要开发新的治疗疟疾的化学治疗剂。对疫苗进行研究似乎是非常可能的替代方法。但是经过多年研究之后,到目前为止尚未有临床可接受的产品。而与此同时,抗蚊媒介昆虫的杀虫剂效力的下降却在增长。目前,多于三分之二的世界人口—约5亿人—被认为生活在疟区(Miller,1989)。在世界卫生组织(WHO)所列世界10种最流行疾病中它排在第8位(每年感染2亿7千万人口),在10种最致命疾病中排在第9位,每年夺取2百万以上生命(Cox;1991;Marshall,1991)。尽管主要限于贫困国家,但是目前在美国(Marshall,1991)和澳大利亚(Johnson,1991)都有报道,而且旅行者疟疾病例不断增加(Steffen和Behrens,1992)。
疟原虫、恶性疟原虫及其宿主的比较生物化学研究表明许多代谢途径不同。这些区别之一就是该寄生虫仅仅依赖于嘧啶从头合成,因为它不能补救预先形成的嘧啶(Sherman,1979)。而且认为成熟的人血红细胞不需要嘧啶核苷酸(Gero和O′Sullivan,1990)。主要努力方向是开发嘧啶生物合成途径的抑制剂(Hammond等人,1985;Scott等人,1986;Prapunwattana等人,1988;Queen等人,1990;Krunhkrai等人,1992),进一步证实该途径作为化学治疗位置的可能性。可以预期目前对关键嘧啶酶的分子生物学研究不仅可以作为更好地理解寄生虫生物化学的有效工具,也可以作为探察寄生虫与哺乳动物酶之间具体差异的有效工具。
谷氨酰胺依赖性氨甲酰磷酸合成酶(CSPII,EC 6.3.5.5)催化真核生物的嘧啶从头生物合成途径的第一步定型和限速步骤(Jones,1980)。而且由于它催化涉及三个催化单元和七种底物及中间体这样一个复杂的反应,从生物化学观点来看它是一种非常值得研究的酶。CPSII与其他嘧啶酶的结构关系随不同生物体而改变,这使其成为进行研究的一个好的主题。
可以从疟疾培养物得到的少量原料阻碍了分离足以进行分析量的纯蛋白质。而其固有的不稳定性更增加了纯化CPS的困难。用P.berghei(一种啮齿动物疟疾)粗提物进行研究显示了具有CPS活性的一种高分子量蛋白,据推测它与ATCase有关(Hill等人,1981),这种状况也发现于酵母中(Makoff和Radford,1978)。然而,Krungkrai及其同事目前的分析(1990)测定了CPSII和ATCase各自在P.berghai中的活性。尽管到目前的研究为止已经在恶性疟原虫中测得了CPS活性(Reyes等人,1982),但是未指出其大小,也没有指出其在该途径中与其他酶键合。
CPSII的谷氨酰胺依赖性活性可以分成两步:(1)谷氨酰胺酶(GLNase)反应,使谷氨酰胺(Gln)水解并将氨转移至氨甲酰磷酸合成酶的位点;和(2)合成酶反应,在该反应中从两分子三磷酸腺苷(ATP)、碳酸氢盐和氨合成氨甲酰磷酸。第二种活性涉及三部分反应:(a)碳酸氢盐被ATP活化;(b)活化的羧基磷酸与氨反应形成氨甲酸盐;和(c)氨甲酸盐的ATP依赖性磷酰化作用形成氨甲酰磷酸(Powers和Meister,1978)。因此,在CPSII中有两个主要的区,谷氨酰胺的酰胺转移酶区(GAT)和氨甲酰磷酸合成酶区(CPS)或简单合成酶区。谷氨酰胺酶区(GLNase)是GAT的亚区,而在合成酶区中有两个ATP-结合亚区。
考虑到CPS谷氨酰胺的酰胺转移酶区与其他酰胺转移酶之间的相似性,已经提出这些亚单位由表示GLNase区的共同祖代基因(=20kDa)趋异进化而产生,而且CPS GAT区(=42kDa,它包括仅存在于CPS中的推断结构区)的特殊进化一定包括其他序列的融合和/或插入(Werner等人,1985)。已经提出该哺乳动物CPSI基因的GAT可以通过在该祖代基因的5’末端与未知基因的简单基因融合来形成(Nyunoya等人,1985)。
假定各种生物体较大合成酶区的基因进行了祖代激酶基因的基因复制,得到具有相应两半的多肽(Simmer等人,1990)。与大肠杆菌的亚单位结构和酵母的精氨酸特异性CPS不同,有人提出编码GAT和合成酶区的基因进一步融合形成了对高级真核生物嘧啶生物合成具有特异性的单基因。相反,Simmer及其同事(1990)提出精氨酸特异性CPS(象酵母中的cpal和cpa2一样)以及大鼠线粒体CPSI是由嘧啶嵌合体消融而产生的。
本发明人已经分离出了编码恶性疟原虫CPSII酶(pfCPSII)的完整基因,并确定了其特征。本文报道的是包括5’和3’未转译区的CDNA序列。如此,本发明人已经识别了各个谷氨酰胺酶和合成酶区。与酵母、D.discoideum和哺乳动物中的CPSII基因不同,没有证据表明与随后的酶,精氨酸转氨甲酰酶(ATCase)键合。这与Hill等人(1981)有关P.berghei酶的报告形成对照。然而本发明人已经发现了在天然恶性疟原虫基因中的两种大插入物,而这在从前未描述过。
因此,本发明第一方面在于编码恶性疟原虫氨甲酰磷酸合成酶II的核酸分子,该核酸分子包括实质上如表1中1-7176、或1-750、或751-1446、或1447-2070、或20713762、或3763-5571、或5572-7173、或1-3360、或2071-6666、或2071-7173所示序列,或功能等同序列。
在本发明优选的具体方案中,该核酸分子包括表1中-1225-7695所示的序列或功能等同序列。
本发明第二方面在于分离的多肽,该多肽包括实质上如表1中1-2391、483-690、691-1254、1858-2391、1-1120、691-2222或691-2391所示的氨基酸序列。
本文所用术语“功能等同序列”是指该核酸序列中包括了少数变化,这种变化因密码简并所引起,而不会导致该序列编码不同的多肽。
本发明第三方面在于生产恶性疟原虫氨甲酰磷酸合成酶II的方法,该方法包括在本发明第一方面的核酸序列能够表达的条件下培养用该核酸分子转化的细胞,并回收该表达的氨甲酰磷酸合成酶II。
该细胞可以是细菌或真核细胞。优选细胞的例子包括大肠杆菌、酵母和Dictyosteliumdiscoideum。
正如本领域专业人员所容易理解的,阐明CPSII的核苷酸序列使得产生一系列治疗剂成为可能。这些包括反义核苷酸、核酶以及用其他途径使RNA和DNA序列成为靶向,例如形成三联体。
正如可以从表1中所列序列看出的,该恶性疟原虫CPSII基因包括在其他氨甲酰磷酸合成酶基因中未发现的两个插入序列。第一个插入序列分离出了推断结构区和谷氨酰胺酶区,而第二个插入序列分离出了两个该合成酶亚单位的ATP结合亚区CPSa和CPSb。表1.恶性疟原虫氨甲酰磷酸合成酶II基因的核苷酸与推断的氨基酸序列
           .         .         .         .         .         .-1225  GAATTCCTTCAGCCAAAAAAAATGACAACGCAAATTTTAAGAAAAGAAAAACAATCGACT         -1166
            .         .         .         .         .         .-1165  CGTCTTTGAATGAGGTTAGAAATTCGATACGTGAAAGGGACTTAAGAAGGCTTAACAGAG         -1106
            .         .         .         .         .         .-1105  AAAAGAGTAAAATCTTATAAGCATTTGAAGGAAAAAATAATAAAATAAAAAAATAAAAAG         -1046
            .         .         .         .         .         .-1045  ATAAAAAATATTTATATTTGATATGTAGTATATATAATGATTATTCATATTAATAACATA         -986
            .         .         .         .         .         .-985  GATAAAAAACTTTTTTTTTTTTTTTTTTTCTTTATATTTATTAACAATACATTTAAGTTA         -926
            .         .         .         .         .         .-925  TTTTATATATATATATATATATATATATATATATATATATATATATGTTTGTGTGTTCAT         -866
            .         .         .         .         .         .-865  TTGTTTATAAAATTACTTGAAATATAAAACTTATTAATATATTTCCAATTAATATGAATA         -806
            .         .         .         .         .         .-805  CAATTATTAATATTTTGATGTGTACACATTAATATAGTTTTACACTTCTTATAATAAAAC         -746
            .         .         .         .         .         .-745  CATCCTATATATTATACACAATATATAATACTCCCCAATATTGTGGTTCCTATAATTTTA         -686
            .         .         .         .         .         .-685  TTTATATATTTATTTATTAATTTATTCATTTATTTATTTTTTTTCTTAGTTTATAAAATA         -626
            .         .         .         .         .         .-625  GTAATTCTACTAATTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGAAAAAAAAAAAATT         -566
            .         .         .         .         .         .-565  TACATATGAAAAATGAACTTGTATATGTAAATTTATAAATATTTTAAACATAAATATAAA         -506
            .         .         .         .         .         .-505  TGTATAAAAAAAAAAAAGAAAAATGGGAAAAAATAATATAGATATATATATAAATATATA         -446
            .         .         .         .         .         .-445  TATATATATAATTATTGGGGATATTCTCTGAATCATAGGTCTTAAACAGTTTTATTCTTT         -386
            .         .         .         .         .         .-385  TAACATCACAAAGTTGTTATTAAAAGTATATATATCTTATTGGTTCCTATATAAAACTAT         -326
            .         .         .         .         .         .-325  AGTATTCTATAATATATTCTGTATATTTCATTTTATCATTTGTAAGCAATCCCTATTTAT         -266
            .         .         .         .         .         .-265  TATAATTATTATTTTTTTTTTTATAAAAGAGGTATAAAACAGTTTATTCAATTTTTTTCC         -206
            .         .         .         .         .         .-205  TAAAGGAGCAACCTTCAGTCAATTTACATTTTCCACCGGTTGGTTGGCACAACATAATGT         -146
            .         .         .         .         .         .-145  TACAGCTAAAAAAAGAAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAATATATATAT         -86
            .         .         .         .         .         .-85  ATATATATATATATACATAATATGTACAATGCTACCATACAAGTATATAAATTTTTCAAC         -26
            .         .-25  ATTGTTGTGATGTTGCATTTTTCTT                                            -1
                             表1(续)
                    .         .         .         .         .               .1      ATGTATATTTCTTTTAAATATAATTTATATATATATATATATATATATATATATATATTT         601      M  Y  I  S  F  K  Y  N  L  Y  I  Y  I  Y  I  Y  I  Y  I  F           20
               .         .         .         .         .         .61      GTTCTTATAGATTTTAAAACAGTTGGGAGGTTAATTCTTGAAGATGGTAACGAATTTGTA         12021      V  L  I  D  F  K  T  V  G  R  L  I  L  E  D  G  N  E  F  V           40
               .         .         .         .         .         .121      GGGTACAGTGTAGGTTACGAAGGGTGTAAAGGAAATAATAGTATATCATGTCATAAGGAG         18041      G  Y  S  V  G  Y  E  G  C  K  G  N  N  S  I  S  C  H  K  E           60
               .         .         .         .         .         .181      TATAGAAATATTATTAATAATGATAATAGCAAGAATAGTAATAATTCATTTTGTAATAAT         24061      Y  R  N  I  I  N  N  D  N  S  K  N  S  N  N  S  F  C  N  N           80
               .         .         .         .         .         .241      GAAGAAAACAATTTGAAAGATGATTTATTATATAAAAATAGTCGATTAGAAAATGAAGAT         30081      E  E  N  N  L  K  D  D  L  L  Y  K  N  S  R  L  E  N  E  D           100
               .         .        .          .         .         .301      TTTATTGTTACAGGTGAAGTTATATTTAATACAGCTATGGTTGGATATCCTGAAGCTTTA         360101      F  I  V  T  G  E  V  I  F  N  T  A  M  V  G  Y  P  E  A  L           120
               .         .        .          .         .         .361      ACGGACCCAAGTTATTTTGGTCAAATATTAGTTTTAACATTTCCTTCTATTGGTAATTAT         420121      T  D  P  S  Y  F  G  Q  I  L  V  L  T  F  P  S  I  G  N  Y           140
               .         .        .          .         .         .421      GGTATTGAAAAAGTAAAACATGATGAAACGTTTGGATTAGTACAAAATTTTGAAAGTAAT         480141      G  I  E  K  V  K  H  D  E  T  F  G  L  V  Q  N  F  E  S  N           160
               .         .        .          .         .         .481      AAAATTCAAGTACAAGGTTTAGTTATTTGTGAATATTCGAAGCAATCATATCATTACAAT         540161      K  I  Q  V  Q  G  L  V  I  C  E  Y  S  K  Q  S  Y  H  Y  N           180
               .         .        .          .         .         .541      TCTTATATTACCTTAAGTGAATGGTTAAAGATTTATAAAATTCCATGTATAGGTGGTATA         600181      S  Y  I  T  L  S  E  W  L  K  I  Y  K  I  P  C  I  G  G  I           200
               .        .         .          .         .         .601      GATACAAGAGCCTTAACAAAACTTTTAAGAGAAAAAGGTAGTATGTTAGGTAAAATAGTT         660201      D  T  R  A  L  T  K  L  L  R  E  K  G  S  M  L  G  K  I  V           220
               .        .         .          .         .         .661      ATATATAAAAACAGACAACATATTAATAAATTATATAAAGAAATTAATCTTTTTGATCCT         720221      I  Y  K  N  R  Q  H  I  N  K  L  Y  K  E  I  N  L  F  D  P           240
               .        .         .          .         .         .721      GGTAATATAGATACTCTAAAATATGTATGTAATCATTTTATACGTGTTATTAAGTTGAAT         780241      G  N  I  D  T  L  K  Y  V  C   N  H  F  I  R  V  I  K  L  N          260
                            表1(续)
           .         .         .         .         .         .781  AATATTACATATAATTATAAAAATAAGGAAGAATTTAATTATACCAATGAAATGATTACT   840261   N  I  T  Y  N  Y  K  N  K  E  E  F  N  Y  T  N  E  M  I  I    280
           .         .         .         .         .         .841  AATGATTCTTCAATGGAAGATCATGATAATGAAATTAATGGTAGTATTTCTAATTTTAAT   900281   N  D  S  S  M  E  D  H  D  N  E  I  N  G  S  I  S  N  F  N    300
           .         .         .         .         .         .901  AATTGTCCAAGTATCTCTAGTTTTGATAAAAGTGAATGGAAAAATGTTATTAATCATACA   960301   N  C  P  S  I  S  S  F  D  K  S  E  S  K  N  V  I  N  H  T    320
           .         .         .         .         .         .961  TTGTTAAGAGATAAAATGAACCTAATAACTTCATCTGAAGAATATCTGAAAGATCTTCAT   1020321   L  L  R  D  K  M  N  L  I  T  S  S  E  E  Y  L  K  D  L  H    340
           .         .         .         .         .         .1021  AATTGTAATTTTAGTAATAGTAGTGATAAAAATGATTCTTTTTTTAAGTTATATGGTATA   1080341   N  C  N  F  S  N  S  S  D  K  N  D  S  F  F  K  L  Y  G  I    360
           .         .         .          .        .         .1081  TGTGAATATGATAAATATTTAATTGACCTTGAAGAAAATGCTAGCTTTCATTATAATAAT   1140361   C  E  Y  D  K  Y  L  I  D  L  E  E  N  A  S  F  H  Y  N  N    380
           .         .         .          .        .         .1141  GTAGATGAATATGGATATTATGATGTTAATAAAAATACAAATATTCTATCTAATAATAAA   1200381   V  D  E  Y  G  Y  Y  D  V  N  K  N  T  N  I  L  S  N  N  K    400
           .         .         .          .        .         .1201  ATAGAACAAAACAACAATAACGAAAATAACAAAAATAACAAAAATAACAACAATAACGAG   1260401   I  E  Q  N  N  N  N  E  N  N  K  N  N  K  N  N  N  N  N  E    420
           .         .         .          .        .         .1261  GTTGATTATATAAAGAAAGATGAGGATAATAATGTCAATAGTAAGGTCTTTTATAGCCAA   1320421   V  D  Y  I  K  K  D  E  D  N  N  V  N  S  K  V  F  Y  S  Q    440
           .         .         .          .        .         .1321  TATAATAATAATGCACAAAATAATGAACATACCGAATTTAATTTAAATAATGATTATTCT   1380441   Y  N  N  N  A  Q  N  N  E  H  T  E  F  N  L  N  N  D  Y  S    460
           .         .         .          .        .         .1381  ACTTATATTAGAAAGAAAATGAAAAATGAAGAATTCCTTAATTTGGTAAACAAAAGAAAA   1440461   T  Y  I  R  K  K  M  K  N  E  E  F  L  N  L  V  N  K  R  K    480
           .         .         .          .        .         .1441  GTAGACCATAAAGAAAAAATTATTGTTATTGTTGATTGTGGTATTAAAAATAGTATAATC   1500481   V  D  H  K  E  K  I  I  V  I  V  D  C  G  I  K  N  S  I  I    500
           .         .         .          .        .         .1501  AAAAATTTAATAAGACACGGTATGGATCTTCCATTAACATATATTATTGTACCTTATTAT   1560501  K  N  L  I  R  H  G  M  D  L  P  L  T  Y  I  I  V  P  Y  Y     520
                                 表1(续)
               .         .         .         .         .         .1561      TACAATTTTAATCATATAGATTATGATGCAGTTCTTTTATCTAATGGTCCTGGAGATCCT         1620521      Y  N  F  N  H  I  D  Y  D  A  V  L  L  S  N  G  P  G  D  P           540
               .         .         .         .         .         .1621      AAAAAGTGTGATTTCCTTATAAAAAATTTGAAAGATAGTTTAACAAAAAATAAAATTATA         1680541      K  K  C  D  F  L  I  K  N  L  K  D  S  L  T  K  N  K  I  I           560
               .         .         .         .         .         .1681      TTTGGTATTTGTTTAGGTAATCAACTATTAGGTATATCATTAGGTTGTGACACATATAAA         1740561      F  G  I  C  L  G  N  Q  L  L  G  I  S  L  G  C  D  T  Y  K           580
               .         .         .         .         .         .1741      ATGAAATATGGTAATAGAGGTGTTAATCAACCCGTAATACAATTAGTAGATAATATATGT         1800581      M  K  Y  G  N  R  G  V  N  Q  P  V  I  Q  L  V  D  N  I  C           600
               .         .         .         .         .         .1801      TACATTACCTCACAAAATCATGGATACTGTTTAAAGAAAAAATCAATTTTAAAAAGAAAA         1860601      Y  I  T  S  Q  N  H  G  Y  C  L  K  K  K  S  I  L  K  R  K           620
               .         .         .         .         .         .1861      GAGCTTGCGATTAGTTATATAAATGCTAATGATAAATCTATAGAAGGTATTTCACATAAA         1920621      E  L  A  I  S  Y  I  N  A  N  D  K  S  I  E  G  I  S  H  K           640
               .         .         .         .         .         .1921      AATGGAAGATTTTATAGTGTCCAGTTTCATCCTGAGGGTAATAATGGTCCTGAAGATACA         1980641      N  G  R  F  Y  S  V  Q  F  H  P  E  G  N  N  G  P  E  D  T           660
               .         .         .         .         .         .1981      TCATTTTTATTTAAGAATTTTCTTTTAGATATCTTTAATAAGAAAAAACAATATAGAGAA         2040661      S  F  L  F  K  N  F  L  L  D  I  F  N  K  K  K  Q  Y  R  E           680
               .         .         .         .         .         .2041      TATTTAGGATATAATATTATTTATATAAAAAAGAAAGTGCTTCTTTTAGGTAGTGGTGGT         2100681      Y  L  G  Y  N  I  I  Y  I  K  K  K  V  L  L  L  G  S  G  G           700
               .         .         .         .         .         .2101      TTATGTATAGGACAAGCAGGAGAATTCGATTATTCAGGAACACAAGCAATTAAAAGTTTA         2160701      L  C  I  G  Q  A  G  E  F  D  Y  S  G  T  Q  A  I  K  S  L           720
               .         .         .         .         .         .2161      AAAGAATGTGGTATATATGTTATATTAGTTAATGCTAACATAGCAACTGTTCAAACATCA         2220721      K  E  C  G  I  Y  V  I  L  V  N  P  N  I  A  T  V  Q  T  S           740
               .         .         .         .         .         .2221      AAAGGTTTGGCAGATAAGGTATACTTTTTACCAGTTAATTGTGAATTTGTAGAAAAAATT        2280741      K  G  L  A  D  K  V  Y  F  L  P  V  N  C  E  F  V  E  K  I           760
               .         .         .         .         .         .2281      ATTAAAAAGGAAAAACCTGATTTTATTTTATGTACATTTGGTGGTCAGACAGCTTTAAAT         2340761      I  K  K  E  K  P  D  F  I  L  C  T  F  G  G  Q  T  A  L  N           780
                         表1(续)
           .         .         .         .         .         .2341  TGTGCTTTAATGTTAGATCAAAAAAAAGTATTGAAAAAGAATAATTGTCAATGTTTAGGT    2400781  C  A  L  M  L  D  Q  K  K  V  L  K  K  N  N  C  Q  C  L  G      800
           .         .         .         .         .         .2401  ACATCTTTAGAATCTATAAGAATAACAGAAAATAGAACATTATTTGCTGAAAAATTAAAA    2460801  T  S  L  E  S  I  R  I  T  E  N  R  T  L  F  A  E  K  L  K      820
           .         .         .         .         .         .2461  GAAATTAATGAAAGAATAGCTCCATATGGTAGTGCAAAAAATGTTAATCAAGCTATTGAT    2520821  E  I  N  E  K  I  A  P  Y  G  S  A  K  N  V  N  Q  A  I  D      840
           .         .         .         .         .         .2521  ATAGGTAATAAAATAGGATATCCAATATTAGTACGTACAACATTTTCGTTAGGAGGATTA    2580841  I  A  N  K  I  G  Y  P  I  L  V  R  T  T  F  S  L  G  G  L      860
           .         .         .         .         .         .2581  AATAGTAGTTTCATAAATAATGAAGAAGAACTTATCGAAAAATGTAATAAAATATTTTTA    2640861 N  S  S  F  I  N  N  E  E  E  L  I  E  K  C  N  K  I  F  L      880
           .         .         .         .         .         .2641  CAAACTGATAATGAAATATTTATAGATAAATCATTACAAGGATGGAAAGAAATAGAATAT    2700881 Q  T  D  N  E  I  F  I  D  K  S  L  Q  G  W  K  E  I  E  Y      900
           .         .         .         .         .         .2701  GAATTATTAAGAGATAATAAAAATAATTGTATAGCTATATGTAATATGGAAAATATAGAT    2760901  E  L  L  R  D  N  K  N  N  C  I  A  I  C  N  M  E  N  I  D      920
           .         .         .         .         .         .2761  CCATTAGGTATACATACAGGAGATAGTATAGTTGTTGCACCTTCACAAACATTAAGTAAT    2820921  P  L  G  I  H  T  G  D  S  I  V  V  A  P  S  Q  T  L  S  N      940
           .         .         .         .         .         .2821  TATGAATATTATAAATTTAGAGAAATAGCATTAAAGGTAATTAGACATTTAAATATTATA    2880941  Y  E  Y  Y  K  F  R  E  I  A  L  K  V  I  T  H  L  N  I  I      960
           .         .         .         .         .         .2881  GGAGAATGTAATATACAATTTGGTATAAATCCACAAACAGGAGAATATTGTATTATTGAA    2940961  G  E  C  N  I  Q  F  G  I  N  P  Q  T  G  E  Y  C  I  I  E      980
           .         .         .         .         .         .2941  GTTAATGCTAGGCTTAGTAGAAGTTCAGCATTAGCTTCTAAAGCTACTGGTTATCCACTT    3000981  V  N  A  R  L  S  R  S  S  A  L  A  S  K  A  T  G  Y  P  L      1000
           .         .         .         .         .         .3001  GCTTATATATCAGCAAAAATAGCCTTGGGATATGATTTGATAAGTTTAAAAAATAGCATA    30601001  A  Y  I  S  A  K  I  A  L  G  Y  D  L  I  S  L  K  N  S  I      1020
           .         .         .         .         .         .3061  ACTAAAAAAACAACTGCCTGTTTTGAACCCTCTCTAGATTACATTACAACAAAAATACCA    31201021  T  K  K  T  T  A  C  F  E  P  S  L  D  Y  I  T  T  K  I  P      1040
                              表1(续)
               .         .         .         .         .         .3121      CGATGGGATTTAAATAAATTTGAGTTTGCTTCTAATACAATGAATAGTAGTATGAAAAGT         31801041      R  W  D  L  N  K  F  E  F  A  S  N  T  M  N  S  S  M  K  S           1060
               .         .         .         .         .         .3181      GTAGGAGAAGTTATGTCTATAGGTAGAACCTTTGAAGAATCTATACAAAAATCTTTAAGA         32401061      V  G  E  V  M  S  I  G  R  T  F  E  E  S  I  Q  K  S  L  R           1080
               .         .         .         .         .         .3241      TGTATTGATGATAATTATTTAGGATTTAGTAATACGTATTGTATAGATTGGGATGAAAAG         33001081      C  I  D  D  N  Y  L  G  F  S  N  T  Y  C  I  D  W  D  E  K           1100
               .         .         .         .         .         .3301      AAAATTATTGAAGAATTAAAAAATCCATCACCAAAAAGAATTGATGCTATACATCAAGCT         33601101      K  I  I  E  E  L  K  N  P  S  P  K  R  I  D  A  I  H  Q  A           1120
               .         .         .         .         .         .3361      TTCCATTTAAATATGCCTATGGATAAAATACATGAGCTGACACATATTGATTATTGGTTC         34201121      F  H  L  N  M  P  M  D  K  I  H  E  L  T  H  I  D  Y  W  F           1140
               .         .         .         .         .         .3421      TTACATAAATTTTATAATATATATAATTTACAAAATAAGTTGAAAACGTTAAAATTAGAG         34801141      L  H  K  F  Y  N  I  Y  N  L  Q  N  K  L  K  T  L  K  L  E           1160
               .         .         .         .         .         .3481      CAATTATCTTTTAATGATTTGAAGTATTTTAAGAAGCATGGTTTTAGTGATAAGCAAATA         35401161      Q  L  S  F  N  D  L  K  Y  F  K  K  H  G  F  S  D  K  Q  I           1180
               .         .         .         .         .         .3541      GCTCACTACTTATCCTTCAACACAAGCGATAATAATAATAATAATAATAATATTAGCTCA         36001181      A  H  Y  L  S  F  N  T  S  D  N  N  N  N  N  N  N  I  S  S           1200
               .         .         .         .         .         .3601      TGTAGGGTTACAGAAAATGATGTTATGAAATATAGAGAAAAGCTAGGATTATTTCCACAT         36601201      C  R  V  T  E  N  D  V  M  K  Y  R  E  K  L  G  L  F  P  H           1220
               .         .         .         .         .         .3661      ATTAAAGTTATTGATACCTTATCAGCCGAATTTCCGGCTTTAACTAATTATTTATATTTA         37201221      I  K  V  I  D  T  L  S  A  E  F  P  A  L  T  N  Y  L  Y  L           1240
               .        .          .         .         .         .3721      ACTTATCAAGGTCAAGAACATGATGTTCTCCCATTAAATATGAAAAGGAAAAAGATATGC         37801241      T  Y  Q  G  Q  E  H  D  V  L  P  L  N  M   K  R  K  K  I  C          1260
               .        .          .         .         .         .3781      ACGCTTAATAATAAACGAAATGCAAATAAGAAAAAAGTCCATGTCAAGAACCACTTATAT         38401261       T  L  N  N  K  R  N  A  N  K  K  K  V  H  V  K  N  H  L  Y          1280
               .        .          .         .         .         .3841      AATGAAGTAGTTGATGATAAGGATACACAATTACACAAAGAAAATAATAATAATAATAAT         39001281       N  E  V  V  D  D  K  D  T  Q  L  H  K  E  N  N  N  N  N  N          1300
                              表1(续)
           .         .         .         .         .         .3901  ATGAATTCTGGAAATGTAGAAAATAAATGTAAATTGAATAAAGAATCCTATGGGTATAAT   39601301   M  N  S  G  N  V  E  N  K  C  K  L  N  K  E  S  Y  G  Y  N    1320
           .         .         .         .         .         .3961  AATTCTTCTAATTGTATCAATACAAATAATATTAATATAGAAAATAATATTTGTCATGAT   40201321   N  S  S  N  C  I  N  T  N  N  I  N  I  E  N  N  I  C  H  D    1340
           .         .         .         .         .         .4021  ATATCTATAAACAAAAATATAAAAGTTACAATAAACAATTCCAATAATTCTATATCGAAT   40801341   I  S  I  N  K  N  I  K  V  T  I  N  N  S  N  N  S  I  S  N    1360
           .         .         .         .         .         .4081  AATGAAAATGTTGAAACAAACTTAAATTGTGTATCTGAAAGGGCCGGTAGCCATCATATA   41401361   N  E  N  V  E  T  N  L  N  C  V  S  E  R  A  G  S  H  H  I    1380
           .         .         .         .         .         .4141  TATGGTAAAGAAGAAAAGAGTATAGGATCTGATGATACAAATATTTTAAGTGCACAAAAT   42001381   Y  G  K  E  E  K  S  I  G  S  D  D  T  N  I  L  S  A  Q  N    1400
           .         .         .         .         .         .4201  TCAAATAATAACTTTTCATGTAATAATGAGAATATGAATAAAGCAAACGTTGATGTTAAT   42601401   S  N  N  N  F  S  C  N  N  E  N  M  N  K  A  N  V  D  V  N    1420
           .         .         .         .         .         .4261  GTACTAGAAAATGATACGAAAAAACGAGAAGATATAAATACTACAACAGTATTTATGGAA   43201421   V  L  E  N  D  T  K  K  R  E  D  I  N  T  T  T  V  F  M  E    1440
           .         .         .         .         .         .4321  GGTCAAAATAGTGTTATTAATAATAAGAATAAAGAGAATAGTTCTTTATTGAAAGGTGAT   43801441   G  Q  N  S  V  I  N  N  K  N  K  E  N  S  S  L  L  K  G  D    1460
           .         .         .         .         .         .4381  GAAGAAGATATTGTGATGGTAAATTTAAAAAAGGAAAATAATTATAATAGTGTAATTAAT   44401461   E  E  D  I  V  M  V  N  L  K  K  E  N  N  Y  N  S  V  I  N    1480
           .         .         .         .         .         .4441  AATGTAGATTGTAGGAAAAAGGATATGGATGGAAAAAATATAAATGATGAATGTAAAACA   45001481   N  V  D  C  R  K  K  D  M  D  G  K  N  I  N  D  E  C  K  T    1500
           .         .         .         .         .         .4501  TATAAGAAAAATAAATATAAAGATATGGGATTAAATAATAATATAGTAGATGAGTTATCC   45601501   Y  K  K  N  K  Y  K  D  M  G  L  N  N  N  I  V  D  E  L  S    1520
           .         .         .         .         .         .4561  AATGGAACATCACATTCAACTAATGATCATTTATATTTAGATAATTTTAATACATCAGAT   46201521   N  G  T  S  H  S  T  N  D  H  L  Y  L  D  N  F  N  T  S  D    1540
           .         .         .         .         .         .4621  GAAGAAATAGGGAATAATAAAAATATGGATATGTATTTATCTAAGGAAAAAAGTATATCT   46801541   E  E  I  G  N  N  K  N  M  D  M  Y  L  S  K  E  K  S  I  S    1560
                                表1(续)
               .         .         .         .         .         .4681      AATAAAAACCCTGGTAATTCTTATTATGTTGTAGATTCCGTATATAATAATGAATACAAA        47401561       N  K  N  P  G  N  S  Y  Y  V  V  D  S  V  Y  N  N  E  Y  K         1580
               .         .         .         .         .         .4741      ATTAATAAGATGAAAGAGTTAATAGATAACCAAAATTTAAATGATGAATATAATAATAAT        48001581       I  N  K  M  K  E  L  I  D  N  E  N  L  N  D  E  Y  N  N  N         1600
               .         .         .         .         .         .4801      GTTAATATGAATTGTTCTAATTATAATAATGCTAGTGCATTTGTAAATGGAAAGGATAGA        48601601       V  N  M  N  C  S  N  Y  N  N  A  S  A  F  V  N  G  K  D  R         1620
               .         .         .         .         .         .4861      AATGATAATTTAGAAAATGATTGTATTGAAAAAAATATGGATCATACATACAAACATTAT        49201621       N  D  N  L  E  N  D  C  I  E  K  N  M  D  H  T  Y  K  H  Y         1640
               .         .         .         .         .         .4921      AATCGTTTAAACAATCGTAGAAGTACAAATGAGAGGATGATGCTTATGGTAAACAATGAA        49801641       N  R  L  N  N  R  R  S  T  N  E  R  M  M  L  M  V  N  N  E         1660
               .         .         .         .         .         .4981      AAAGAGAGCAATCATGAGAAGGGCCATAGAAGAAATGGTTTAAATAAAAAAAATAAAGAA        50401661       K  E  S  N  H  E  K  G  H  R  R  N  G  L  N  K  K  N  K  E         1680
               .         .         .         .         .         .5041      AAAAATATGGAAAAAAATAAGGGAAAAAATAAAGACAAAAAGAATTATCATTATGTTAAT        51001681       K  N  M  E  K  N  K  G  K  N  K  D  K  K  N  Y  H  Y  V  N         1700
               .         .         .         .         .         .5101      CATAAAAGGAATAATGAATATAATAGTAACAATATTGAATCGAAGTTTAATAATTATGTT        51601701       H  K  R  N  N  E  Y  N  S  N  N  I  E  S  K  F  N  N  Y  V         1720
               .         .         .         .         .         .5161      GATGATATAAATAAAAAAGAATATTATGAAGATGAAAATGATATATATTATTTTACACAT        52201721       D  D  I  N  K  K  E  Y  Y  E  D  E  N  D  I  Y  Y  F  T  H         1740
               .         .         .         .         .         .5221      TCGTCACAAGGTAACAATGACGATTTAAGTAATGATAATTATTTAAGTAGTGAAGAATTG        52801741       S  S  Q  G  N  N  D  D  L  S  N  D  N  Y  L  S  S  E  E  L         1760
               .         .         .         .         .         .5281      AATACTGATGAGTATGATGATGATTATTATTATGATGAAGATGAAGAAGATGACTATGAC        53401761       N  T  D  E  Y  D  D  D  Y  Y  Y  D  E  D  E  E  D  D  Y  D         1780
               .         .         .         .         .         .5341      GATGATAATGATGATGATGATGATGATGATGATGATGGGGAGGATGAGGAGGATAATGAT        54001781       D  D  N  D  D  D  D  D  D  D  D  D  G  E  D  E  E  D  N  D         1800
               .         .         .         .         .         .5401      TATTATAATGATGATGGTTATGATAGCTATAATTCTTTATCATCTTCAAGAATATCAGAT        54601801       Y  Y  N  D  D  G  Y  D  S  Y  N  S  L  S  S  S  R  I  S  D         1820
                          表1(续)
           .         .         .         .         .         .5461  GTATCATCTGTTATATATTCAGGGAACGAAAATATATTTAATGAAAAATATAATGATATA  55201821   V  S  S  V  I  Y  S  G  N  E  N  I  F  N  E  K  Y  N  D  I   1840
           .         .         .         .         .         .5521  GGTTTTAAAATAATCGATAATAGGAATGAAAAAGAGAAAGAGAAAAAGAAATGTTTTATT  55801841   G  F  K  I  I  D  N  R  N  E  K  E  K  E  K  K  K  C  F  I   1860
           .         .         .         .         .         .5581  GTATTAGGTTGTGGTTGTTATCGTATTGGTAGTTCTGTAGAATTTGATTGGAGTGCTATA  56401861  V  L  G  C  G  C  Y  R  I  G  S  S  V  E  F  D  W  S  A  I    1880
           .         .         .         .         .         .5641  CATTGTGTAAAGACCATAAGAAAATTAAACCATAAAGCTATATTAATAAATTGTAACCCA  57001881  H  C  V  K  T  I  R  K  L  N  H  K  A  I  L  I  N  C  N  P    1900
           .         .         .         .         .         .5701  GAAACTGTAAGTACAGATTATGATGAAAGTGATCGTCTATATTTTGATGAAATAACAACA  57601901  E  T  V  S  T  D  Y  D  E  S  D  R  L  Y  F  D  E  I  T  T    1920
           .        .          .         .         .         .5761  GAAGTTATAAAATTTATATATAACTTTGAAAATAGTAATGGTGTGATTATAGCTTTTGGT  58201921  E  V  I  K  F  I  Y  N  F  E  N  S  N  G  V  I  I  A  F  G    1940
           .        .          .         .         .         .5821  GGACAAACATCAAATAATTTAGTATTTAGTTTATATAAAAATAATGTAAATATATTAGGA  58801941  G  Q  T  S  N  N  L  V  F  S  L  Y  K  N  N  V  N  I  L  G    1960
           .        .          .         .         .         .5881  TCAGTGCACAAAGTGTTGATTGTTGTGAAAATAGGAATAAATTTTCGCACTTATGTGATT  59401961  S  V  H  K  V  L  I  V  V  K  I  G  I  N  F  R  T  Y  V  I    1980
           .        .          .          .        .         .5941  CTTAAAATTGATCAACCGAAATGGAATAAATTTACAAAATTATCCAAGGCTATACAATTT  60001981  L  K  I  D  Q  P  K  W  N  K  F  T  K  L  S  K  A  I  Q  F    2000
           .        .          .          .        .         .6001  GCTAATGAGGTAAAATTTCCTGTATTAGTAAGACCATCGTATGTATTATCTGGTGCAGCT  60602001  A  N  E  V  K  F  P  V  L  V  R  P  S  Y  V  L  S  G  A  A    2020
           .        .          .          .        .         .6061  ATGAGAGTTGTAAATTGTTTTGAAGAATTAAAAAACTTTTTAATGAAGGCAGCTATTGTT  61202021  M  R  V  V  N  C  F  E  E  L  K  N  F  L  M  K  A  A  I  V    2040
           .        .          .          .        .         .6121  AGTAAAGATAATCCTGTTGTAATATCAAAATTTATTGAGAATGCTAAAGAAATAGAAATA  61802041  S  K  D  N  P  V  V  I  S  K  F  I  E  N  A  K  E  I  E  I    2060
           .        .          .          .        .         .6181  GATTGTGTTAGTAAAAATGGTAAAATAATTAATTATGCTATATCTGAACATGTTGAAAAT  62402061  D  C  V  S  K  N  G  K  I  I  N   Y  A  I  S  E  H  V  E  N   2080
                            表1(续)
               .         .         .         .         .         .6241      GCTGGTGTACATTCAGGTGATGCAACATTAATATTACCTGCACAAAATATATATGTTGAA        63002081      A  G  V  H  S  G  D  A  T  L  I  L  P  A  Q  N  I  Y  V  E          2100
               .         .         .         .         .         .6301      ACACATAGGAAAATAAAGAAAATATCCGAAAAGATTTCAAAATCATTAAATATATCTGGT        63602101      T  H  R  K  I  K  K  I  S  E  K  I  S  K  S  L  N  I  S  G          2120
               .         .         .         .         .         .6361      CCATTTAATATACAATTTATATGTCATCAAAATGAAATAAAAATTATTGAATGTAATTTA        64202121      P  F  N  I  Q  F  I  C  H  Q  N  E  I  K  I  I  E  C  N  L          2140
               .         .         .         .         .         .6421      AGAGCATCTAGAACTTTTCCATTTATATCAAAAGCTCTAAATCTAAACTTTATAGATTTA        64802141      R  A  S  R  T  F  P  F  I  S  K  A  L  N  L  N  F  I  D  L          2160
               .         .         .         .         .         .6481      GCTACAAGGATATTAATGGGTTATGACGTCAAACCAATTAATATATCATTAATTGATTTA        65402161      A  T  R  I  L  M  G  Y  D  V  K  P  I  N  T  S  L  I  D  L          2180
               .         .         .         .         .         .6541      GAATAIACAGCTGTAAAAGCACCGATTTTCTCATTTAATAGATTACATGGATCAGATTG         66002181      E  Y  T  A  V  K  A  P  I  F  S  F  N  R  L  H  G  S  D  C          2200
               .         .         .         .         .         .6601      ATACTAGGTGTAGAAATGAAATCTACAGGTGAAGTAGCATGTTTTGGTTTAAATAAATAT        66602201      I  L  G  V  E  M  K  S  T  G  E  V  A  C  F  G  L  N  K  Y          2220
               .         .         .         .         .         .6661      GAAGCTTTATTAAAATCATTAATAGCTACAGGTATGAAGTTACCCAAAAAATCAATACTT        67202221      E  A  L  L  K  S  L  I  A  T  G  M  K  L  P  K  K  S  I  L          2240
               .         .         .         .         .         .6721      ATAAGTATTAAAAATTTAAATAATAAATTAGCTTTTGAAGAACCGTTCCAATTATTATTT        67802241      I  S  I  K  N  L  N  N  K  L  A  F  E  E  P  F  Q  L  L  F          2260
               .         .         .         .         .         .6781      TTAATGGGATTTACAATATATGCGACTGAAGGTACGTATGATTTCTACTCTAAATTTTTA        68402261      L  M  G  F  T  I  Y  A  T  E  G  T  Y  D  F  Y  S  K  F  L          2280
               .         .         .         .         .         .6841      GAATCTTTTAATGTTAATAAAGGTTCTAAATTTCATCAAAGACTTATTAAAGTTCATAAT        69002281      E  S  F  N  V  N  K  G  S  K  F  H  Q  R  L  I  K  V  H  N          2300
               .         .         .         .         .         .6901      AAAAATGCAGAAAATATATCACCAAATACAACAGATTTAATTATGAATCATAAAGTTGAA        69602301      K  N  A  E  N  I  S  P  N  T  T  D  L  I  M  N  H  K  V  E          2320
               .         .         .         .         .         .6961      ATGGTTATTAATATAACTGATACATTAAAAACAAAGGTTAGTTCAAATGGTTATAAAATT        70202321      M  V  I  N  I  T  D  T  L  K  T  K  V  S  S  N  G  Y  K  I          2340
                           表1(续)
               .         .         .         .         .         .7021      AGAAGATTAGCATCAGATTTCCAGGTTCCTTTAATAACTAATATGAAACTTTGTTCTCTT         70802341      R  R  L  A  S  D  F  Q  V  P  L  I  T  N  M  K  L  G  S  L           2360
               .         .         .         .         .         .7081      TTTATTGACTCATTATATAGAAAATTCTCAAGACAAAAGGAAAGAAAATCATTCTATACC         71402361      F  I  D  S  L  Y  R  K  F  S  R  Q  K  E  R  K  S  F  Y  T           2380
               .         .         .7141      ATAAAGAGTTATGACGAATATATAAGTTTGGTATAA                                 71762381      I  K  S  Y  D  E  Y  I  S  L  V  *                                   2392
               .         .         .         .         .         .7177      GCAAGAAATTATTCAATAAATTCGATTTAACATTACTTATTTATGTATTTATTAACTTTC         7236
               .         .         .         .         .         .7237      ATTCCATAACAACATGAAAAGTATAAATATATAAATAGTAATATATAATATATAATATAT         7296
               .         .         .         .         .         .7297      ATATATATATATATATATATATTTATTTATTTAATTATATTTACGTTTAAATATTAATAA         7356
               .         .         .         .         .         .7357      ATGTTTTTATTAAATATGATCATTAATTTATATTGATTTATTTTTTTATAAATTTTTGTT         7416
               .         .         .         .         .         .7417      ATATATACAAATTTTATTTATTCACTCATATGTATAAACCAAAATGGTTTTTTCAATTTA         7476
               .         .         .         .         .         .7477      CAAATAATTTTATAATTTTAATAAATTTATTAATTATAAAAAAAATAAAAATATATAAAC         7536
               .         .         .         .         .         .7537      ATTAAAATGTATAAATTCTTTTAATTATATAATAATTTATAAATGTTATGATTTTTTTAA         7596
               .         .         .         .         .         .7597      AAAATTCAACGAAAAAAAAGAGGAACTGTATATACAAAAGGGACTATATATATGTATATA         7656
               .         .         .7657      TATATATATATATATATGTTTTTTTTTCCTTATTCTAGA  7695
GAT区由两个亚区组成:推断的结构区(1-750)和谷氨酰胺酶区(1447-2070)。这两个亚区被第一个插入序列(751-1446,有下划线的)分开。合成酶亚单位的两个ATP结合亚区CPSa(2071-3762)和CPSb(5572-7173)被第二个插入序列(3763-5571,有下划线的)分开。
由于在其他氨甲酰磷酸合成酶基因中未发现这些插入序列,因此它们代表治疗的主要目标,包括但不限于反义核苷酸、核酶和形成核苷酸的三联体,因为降低了与基因宿主同源染色体进行有害反应的可能性。
已知反义RNA分子适用于调节细胞内的基因表达。与部分CPSII互补的反义RNA分子可以从CPSII序列产生。这些反义分子可以用作检测是否细胞中存在CPSII基因的诊断探针,也可以用作调节CPSII基因表达的治疗剂。用CPSII序列制备的反义核苷酸包括与CPSII m RNA互补并能干扰其体内功能的核苷酸和含有恰好能在活细胞内转录以产生反义核苷酸的CPSII序列成分的基因。该基因可以包括细胞、病毒、病原体信使m RNA(聚合酶II)或结构RNA基因(聚合酶I和III)的启动子成分或合成启动子成分。在“基因调节:反义RNA和DNA的生物学”(R.P.Erickson和J.G.Izant,Raven Press 1992)中回顾了反义设计。还可参见US5208149,其中包括有关反义核苷酸设计的更多例子。这些参考文献的说明书均引入本文作为参考。
本文所用术语“核苷酸”包括但不限于所有天然产生的脱氧核糖核苷酸和核糖核苷酸以及任何核苷酸类似物的寡聚物。核苷酸类似物包括所有能与另一个核苷酸形成序列特异性复合物(例如双链核酸分子或异源双链核酸分子)的化合物(包括甲基膦酸类或硫代磷酸类),而且它可以具有有利的扩散或稳定性质。该核苷酸的定义包括通过磷酸二酯键、肽键或任何其他共价键连接的天然碱基或类似碱基。这些核苷酸可以通过在活细胞中活体内的任何结合来合成、体外酶促合成或化学合成。
适用于调节CPSII基因表达的核酶包括具有专一性和催化区的CPSII序列以促使CPSIIm RNA体外或体内分裂的核苷酸。该催化区包括锤头、发夹、δ-病毒成分、核糖体RNA基因内区及其衍生物。有关核酶设计的更多资料可见于下列文献:Haseloff,J.& Gerlach,W.L.(1988)Nature334,585;Kruger,K,Grabowski,P.J,Zaug,A.J,Sands,J,Gottschling,D.E.& Cech,T.R(1982)Cell 31,147;国际专利申请WO 88/04300,US4987071和US5254678。这些参考文献的说明书均引入本文作为参考。该催化成分可以增强通过促进降解或一些其他机理进行的CPSII靶mRNA的人工调节。
三螺旋寡核苷酸可以用于抑制从基因组转录。本文对CPSII基因提出的给定序列将能够设计寡核苷酸,它们将形成三联体,因而抑制CPSII基因的转录。有关适用于三联体形成的寡核苷酸产生的资料可见于Griffin等人的Science 245:967_971(1989),该参考文献的说明书引入本文作为参考。
三联体剂包括所有能够通过与DNA或染色质形成复合物与CPSII基因结合的核苷酸。该相互反应可以实现三链Hoogsteen结构的形成或其他机理,例如依赖于CPSII序列信息的链侵入。
因此,本发明第四方面在于能够分裂氨甲酰磷酸合成酶II mRNA的核酶,该核酶包括从本发明第一方面的核酸分子得到的mRNA部分互补的序列。
在本发明此方面优选的具体方案中,该核酶包括从本发明第一方面的核酸分子的第一或第二种插入序列得到的mRNA部分互补的序列。
本发明的第五方面在于能够阻碍本发明第一方面的核酸分子表达的反义寡核苷酸。
如上所述,本发明一方面涉及通过重组技术生产CPSII的方法。通过该方法产生的蛋白质和本发明的多肽适用于尝试体外药物结合研究,以开发其他的抗疟疗法。
为了更清楚地理解本发明的性质,将参照下列实施例和图对克隆恶性疟原虫CPSII基因的方法进行说明。实施例
筛选基因(其中的氨基酸序列先前未检测出)的常规方法是通过异源探测,即使用密切相关生物体目的酶的基因片段。这已经被7位工作者用恶性疟原虫证明是不成功的,主要是因为其基因组的高A-T含量。经过用酵母ura2基因片段分离恶性疟原虫CPSII基因的最初无效尝试之后(Souciet等人,1989),本发明人选择了用聚合酶链反应(PCR)(Saiki等人,1988)放大部分CPSII基因,以使用放大的产物作为筛选用探针。
本发明人使用从保存的CPS基因的氨基端GAT区和第一半合成酶区序列设计的寡核苷酸分离并克隆了PCR产物。核苷酸测序证实已经得到了部分CPSII基因。用限制性酶使全部寄生虫DNA分裂,并用CPSII特异性基因探针进行Southern分析。测定与基因探针杂交的DNA片段大小,然后用相应带的DNA构建“小文库”。用这种方法筛选pfCPSII基因的较小克隆群。
为了分离全长pfCPSII基因,使用已知序列的不同片段构建一系列小文库,以使用“基因巡察”获得该基因5’和3’末端的未知侧面区信息。所使用的策略总结于图1中。
在首先的Southern分析中,用Hind III和EcoRI消化全部恶性疟原虫DNA,并用pfCPS II 453bp PCR产物进行杂交。3.0kb HindIII和较小的EcoRI片段与该探针进行杂交。随后筛选Hind III pTZ18U小基因库导致含有3.0kb pfCPSII基因片段CPS2的重组体分离。将453bp PCR产物定位于该片段的中间。
用CPS2的5’和3’末端的两个区分离每端邻近的序列,以得到更多的基因序列。CPS2的5’端Hind III/EcoRI片段是分离进一步的1.5kb片段CPS1的工具,该CPS1由基因的全部5’区和一些非编码序列组成。
借助于CPS2 3’端的已知序列,得到550b p逆PCR(IPCR;Triglia等人,1988)产物。
该IPCR产物用于筛选3’区侧CPS2。通过小文库技术分离含有CPS3的3.3kb Hind III重组体和相关的3.3kbXbaI克隆(未示于图1中)。使用CPS3 3’端的200bpXbaI/Hind III片段进行1.3kb XbaI片段CPS4的克隆,该CPS4含有推测的终止密码子和一些3’非编码区。
这四种基因片段(CPS1、CPS2、CPS3和CPS4)结合(除去其重叠部分)得到总共8.8kb的序列,它由约7.0kb的编码序列和1.8kb的侧面序列组成。
该恶性疟原虫CPSII基因的完整核苷酸序列与其5’和3’侧面序列一起示于表1中。
对于本领域专业人员来说显而易见的是,由本发明人分离的该基因及其侧序展现了一系列治疗恶性疟原虫感染的新途径。本发明利用重组DNA技术能够产生一定量的恶性疟原虫氨甲酰磷酸合成酶II。该酶的特征使其能够用作化学治疗位点。
该基因的分离还使得能够产生反义分子、核酶或其他基因失活剂,它可用于防止寄生虫在感染个体中的增殖。
对于本领域专业人员显而易见的是,在不背离本发明广义描述的精神和范围条件下,对如具体实施方案所示的本发明可以进行各种改变和/或修改。因此,本发明的具体实施方案将被认为是对所有方面的说明,而非限制。
                  参考文献
Cox,F.E.G.(1991)Malaria vaccines:while we arewaiting.Parasitology Today  1:189-190
Gero,A.H.and O′Sullivan,W.J.(199))Purines andpyrimidines in malarial parasites.Blood Calls  16:467-498
Hammond,D.J.Burchell,J-R.and Pudney,M.(1985)Inhibition of pyrimidine biosynthesis de novo inPlasmodium falciparum by 2.(4.t-butylcyclohexyl)-3-hydroxy-1,4-naphthoquinine in vitro.Mol.Biochem.Parasitol  14:97-109
Hill,B.,Kilsby,J.Rogerson,G.W.,McIntosh,RT.and Ginger,C.D.(1981).The Enzymes of pyrimidinebiosynthesis in a range of paraaitic protozoa andhelminths.Mol.Biochem.Parasitol, 2:123-134,
Johnson,C.Malaria back to plague us.SydneyMorning Herald,November 13,1991.
Jones,M.E.(1980)Pyrimidine nucleotidebiosynthesis in animals:genes,enzymes and regulation ofUMP biosynthesis,Annu.Rev.Biochem. 49:253-279.
Krungkrai,J.Cerami,A.and Henderson,G.B.(1990)Pyrimidine biosynthesis in parasitic Protozoa:purification of a monofunctional dihydroorotase fromPlasmodium berghei and Critbidiia fasciculata.Biochemistry29:6270-6275.
Krungkrai,J.Krungkrai,S.R,and Phakanont,K.(1992) Antimalarial activity of orotate analogs thatinhibit dihydrootase and dihydroorotate dehydrogenase.Biochem.Pharmacol. 43:1295-1301.
Marshal,s.(1991)Malaria parasite gaining groundagainst science.Science  2:190.
Nyunoya,H.,Broglie,K.E.,Widgren,W.E.and LustyC.J.(1985)Characterization and darivation of the genecoding for mitochondrial carbamyl phosphate synthetase Iof rat.J.Siol.Chem  250:9346-9356.
Prapunwattana,P.,O′Sullivan,W.J.and Yuthavong,Y.(1988)Depression of Plaamodium falciparumdihydroorotate dehydroganaoe activity in in vitro cultureby tetracycline.Mol.Biochem. 27:119-124.
Queen,S.A.,Vander Jagt,D.L.and Reyas,P.(1990)In vitro snsceptibilities of Plaamodium falciparum tocampounds which inbibit nncleotide metabolism.Antimicrob.Agents Chemother. 34:1393-1398.
Reyes,P.,Rathod,P.K.,Sanchaz,D.J.Mrema,J.E-K.,Rieckmann,K.H.and Haidrich,H.G.(1982)Enzymesof Purine and pyrimidine metabolism from the human malariaParasite,Plasmodium falciparum.Mol.Biochem.Parasitol.5:275-290.
Rubino S.D.,Nyunoya,H.and Lusty,C.J.(1986)JBC261(24):11320-11327.
Saiki,R.K.,Gelfand,D.H.,Stoffel,S.,Scharf,S.J.,Higuchi,R.,Horn,G.T.,Mullis K.B.and Erlich H.A.(1988)Science  239:487-491.
Scott,H.V.,Gero,A.M.and O′Sullivan,W.J,(1986)In vitro inhibition of Plasmodium falcioarum byPyrazofurin,an inhibitor of pyrimidine biosynthesis denovo.Mol.Biochem.Parasitol. 18:3-15.
Sherman,I.W.(1979)Biochemistry of Plasmcdium(malarial parasites)Microbiol.Rev. 43:453-495.
Simmer,J.P,,Kelly,R.E.,Rinker,Jr.,A.G.,Scully,J.L.and Evans D.R.(1990)Mammalian carbamylphosphata synthetase(CPS).J.Biol.Chem  265:10395-10402.
Simmer,J.P.,Kelly,R.E.,Austin,G.R.,Jr.,Scully,J.L.and Evans,D.R.(1990)JBC285(18):10395-10402.
Souciet,J.L.,Nagy,M.,Le Gouar,M.,Lacroute,F.and Potier,S.(1989)Gene(Amst.) 79:59-70.
Triglia,T.,Peterson,M.G.and Kemp,D.J.(1988)PNAS  16:8186.
Werner,M-,Feller, A.and Pierard,A.(1985)Nucleotide sequenca of yeast gene CPAl encoding the smallsubunit of zrginine-Pathway carbamoyl-phosphatesynthetase.Eur.J.Biochem. 146:371-381,

Claims (6)

1、编码恶性疟原虫氨甲酰磷酸合成酶II的核酸分子,该核酸分子包括如表1中残基1-7176、或1-750、或751-1446、或1447-2070、或2071-3762、或3763-5571、或5572-7173、或1-3360、或2071-6666、或2071-7173所示序列或由于密码子简并而与上述序列有所不同的序列。
2、如权利要求1所述的核酸分子,其中该核酸分子包括如表1中-1225-7695所示序列或由于密码子简并而与上述序列有所不同的序列。
3、分离的多肽,该多肽包括如表1中1-2391、483-690、691-1254、1858-2391、1-1120、691-2222或691-2391所示的氨基酸序列。
4、一种根据权利要求1或2的核酸分子的mRNA序列设计的核酶。
5、如权利要求4所述的核酶,其根据表1中残基751-1446或3763-5571所示核酸序列的mRNA序列设计而成。
6、如权利要求1或2的核酸分子的反义寡核苷酸。
CN93121697A 1992-12-03 1993-12-03 编码氨甲酰磷酸合成酶ⅱ的核苷酸序列 Expired - Fee Related CN1041535C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
AUPL6206 1992-12-03
AUPL620692 1992-12-03
AUPL6380 1992-12-16
AUPL638092 1992-12-16

Publications (2)

Publication Number Publication Date
CN1090327A CN1090327A (zh) 1994-08-03
CN1041535C true CN1041535C (zh) 1999-01-06

Family

ID=25644386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN93121697A Expired - Fee Related CN1041535C (zh) 1992-12-03 1993-12-03 编码氨甲酰磷酸合成酶ⅱ的核苷酸序列

Country Status (17)

Country Link
US (1) US5849573A (zh)
EP (1) EP0675958A4 (zh)
JP (1) JPH08503607A (zh)
KR (1) KR950704495A (zh)
CN (1) CN1041535C (zh)
AP (1) AP429A (zh)
BR (1) BR9307584A (zh)
CA (1) CA2150572A1 (zh)
FI (1) FI952697A (zh)
HU (2) HUT71930A (zh)
IL (1) IL107845A0 (zh)
MX (1) MX9307662A (zh)
MY (1) MY109022A (zh)
NO (1) NO952175D0 (zh)
OA (1) OA10163A (zh)
PL (1) PL309261A1 (zh)
WO (1) WO1994012643A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6468765B1 (en) * 1995-04-21 2002-10-22 Human Genome Sciences, Inc. Selected Haemophilus influenzae Rd polynucleotides and polypeptides
AU3984497A (en) * 1996-08-16 1998-03-06 Innovir Laboratories, Inc. Phenotypic conversion of cells mediated by external guide sequences
US6610478B1 (en) 1996-08-16 2003-08-26 Yale University Phenotypic conversion of cells mediated by external guide sequences
CA2329146A1 (en) * 1998-06-01 1999-12-09 Incyte Pharmaceuticals, Inc. Carbamoyl phosphate synthase homolog
CN100510080C (zh) * 2001-04-04 2009-07-08 中国医学科学院基础医学研究所 恶性疟原虫新的抗原候选基因PfMAg
CN100510079C (zh) * 2001-04-04 2009-07-08 中国医学科学院基础医学研究所 恶性疟原虫蛋白基因
CN1316015C (zh) * 2001-08-03 2007-05-16 味之素株式会社 新突变型氨甲酰磷酸合成酶以及生产由氨甲酰磷酸衍生的化合物的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5585479A (en) * 1992-07-24 1996-12-17 The United States Of America As Represented By The Secretary Of The Navy Antisense oligonucleotides directed against human ELAM-I RNA

Also Published As

Publication number Publication date
FI952697A0 (fi) 1995-06-02
AP429A (en) 1995-11-09
MY109022A (en) 1996-11-30
FI952697A (fi) 1995-07-14
AP9400607A0 (en) 1994-01-31
HU9501583D0 (en) 1995-08-28
IL107845A0 (en) 1994-04-12
BR9307584A (pt) 1999-08-31
CN1090327A (zh) 1994-08-03
HUT71930A (en) 1996-02-28
MX9307662A (es) 1994-06-30
WO1994012643A1 (en) 1994-06-09
EP0675958A4 (en) 1997-10-22
US5849573A (en) 1998-12-15
PL309261A1 (en) 1995-10-02
KR950704495A (ko) 1995-11-20
EP0675958A1 (en) 1995-10-11
HU211526A9 (en) 1995-11-28
NO952175L (no) 1995-06-01
NO952175D0 (no) 1995-06-01
OA10163A (en) 1996-12-18
JPH08503607A (ja) 1996-04-23
CA2150572A1 (en) 1994-06-09

Similar Documents

Publication Publication Date Title
CN1065682A (zh) 转拼核酶
CN1871351A (zh) 一种新的真菌蛋白及其编码核酸
CN1854309A (zh) 核酸扩增方法
CN1344802A (zh) 使用突变dna聚合酶的高温逆转录
CN1630535A (zh) Stat-1之抑制
CN1622998A (zh) 丝状真菌来源的赖氨酰氧化酶
CN1041535C (zh) 编码氨甲酰磷酸合成酶ⅱ的核苷酸序列
CN1084564A (zh) 反义多核苷酸
CN1449444A (zh) 无细胞蛋白质合成用转录模型的设计、结构及使用其合成无细胞麦胚芽蛋白质的稀释批式法
CN1174098C (zh) Dna片段和含有该dna片段的重组载体以及应用其之后外源基因的表达方法
CN1854300A (zh) 含pon基因的重组质粒及其应用
CN1629194A (zh) 一种可用以抗癌治疗的超抗原融合蛋白质及其生产方法
CN1891822A (zh) 具有特定单核苷酸多态性的th基因及其检测方法和用途
CN1124142A (zh) 抑制异戊二烯基蛋白质转移酶表达的寡核苷酸
CN100351379C (zh) 拉达卡链轮丝菌的转谷氨酰胺酶基因及其编码的转谷氨酰胺酶
CN1171998C (zh) 中国对虾抗菌肽基因与克隆技术
CN1112127A (zh) 新的蛋白质p140多肽及编码该多肽的DNA
CN1671734A (zh) 用于治疗囊性纤维化的cftr修饰基因和表达的多肽以及检测和/或鉴定它们的方法和产品
CN1703513A (zh) 包括表达丙氨酸脱氢酶、丝氨酸脱水酶和/或谷氨酰胺合成酶的重组卡介苗菌株的结核病疫苗
CN1296378C (zh) 高免疫活性 CpG-S ODN 和拮抗 CpG-S ODN 作用的 CpG-N ODN 的基因序列及其应用
CN1478149A (zh) 生理活性物质的筛选方法
CN1184232C (zh) 人肿瘤坏死因子相关凋亡诱导配体突变蛋白、其制法及其药物组合物
CN1277634A (zh) 新型的组织特异钙蛋白酶,其制备方法和用途
CN1084565A (zh) 具有腈水合酶活性的新型蛋白和编码该蛋白的基因
CN1756841A (zh) 来自于曲霉菌的磷脂酶a2

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee