CN1292796A - Meth1和meth2多核苷酸及多肽 - Google Patents

Meth1和meth2多核苷酸及多肽 Download PDF

Info

Publication number
CN1292796A
CN1292796A CN998034959A CN99803495A CN1292796A CN 1292796 A CN1292796 A CN 1292796A CN 998034959 A CN998034959 A CN 998034959A CN 99803495 A CN99803495 A CN 99803495A CN 1292796 A CN1292796 A CN 1292796A
Authority
CN
China
Prior art keywords
seq
amino acids
polypeptide
coding
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN998034959A
Other languages
English (en)
Inventor
L·伊卢拉-阿里斯普
G·A·哈斯丁斯
S·M·鲁本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Human Genome Sciences Inc
Beth Israel Deaconess Medical Center Inc
Original Assignee
Human Genome Sciences Inc
Beth Israel Hospital Association
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Human Genome Sciences Inc, Beth Israel Hospital Association filed Critical Human Genome Sciences Inc
Publication of CN1292796A publication Critical patent/CN1292796A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • C07K14/515Angiogenesic factors; Angiogenin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2799/00Uses of viruses
    • C12N2799/02Uses of viruses as vector
    • C12N2799/021Uses of viruses as vector for the expression of a heterologous nucleic acid
    • C12N2799/026Uses of viruses as vector for the expression of a heterologous nucleic acid where the vector is derived from a baculovirus

Abstract

本发明涉及与血小板反应蛋白相关的新抗血管生成蛋白质。更具体地说,提供了编码人METH1和METH2的分离核酸分子。还提供了METH1和METH2多肽以及用于其生产的载体、宿主细胞和重组方法。此外还提供了用于癌症预后的诊断方法及用于处理需要增加量METH1或METH2之个体的治疗方法。

Description

METH1和METH2多核苷酸及多肽
                      发明背景
联邦资助的研究和开发项目
在本发明开发期间的部分工作利用了美国政府基金。美国政府对该发明拥有一定的权利。
发明领域
本发明涉及与血小板反应蛋白相关的新抗血管生成蛋白质。更具体地说,提供了编码人METH1和METH2(ME代表金属蛋白酶,TH代表血小板反应蛋白)的分离核酸分子。还提供了METH1和METH2多肽以及用于其生产的载体、宿主细胞和重组方法。此外还提供了用于癌症预后的诊断方法及用于处理需要增加量METH1或METH2之个体的治疗方法。
相关领域
从原有脉管系统形成新血管的血管生成在正常成体中是一个严密调控的过程。在生理环境中,通过其作用而刺激或抑制血管生长之生长调节蛋白的相互作用严格控制新毛细管的生长。通常来说,这些影响力之间的平衡倾向于抑制,因而血管生长被抑制。然而在某些病理状况下,局部的抑制控制不能阻止血管生成诱导物增高的活性。血管生成是癌症转移(Folkman,Nature Med.1:27-31(1995))及异常伤口愈合、炎症、类风湿性关节炎、牛皮藓和糖尿病性视网膜病中关键的一步,在病理学上是必需的(Folkman等人,科学235:442(1987)),由此希望能通过对血管生长进行药理学和/或遗传抑制以调控这些病态个体(Iruela-Arispe等人,Thromb.Haem.78:672-677(1997))。
血小板反应蛋白(TSP-1)是释放自被激活血小板并由生长细胞分泌的450KDa抗血管生成性粘附糖蛋白(由Adams综述于Int.J.Biochem.Cell.Biol.29:861-865(1997))。TSP-1是一同源三聚体,每一亚基由1152个氨基酸长的多肽组成,具有N-连接的糖基化和天冬酰胺残基β-羟基化的翻译后加工。
TSP-1蛋白质和mRNA水平由多种因素调节。IL-1α和TNFα对TSP-1蛋白质水平进行负调控。TSP-1 mRNA和蛋白质水平被包括PDGF、TGF-β和bFGF在内的多肽生长因子正调节(Bornstein,FasebJ.6:3290-3299(1992)),并且还通过p53肿瘤抑制基因产物的表达水平进行调节(Dameron等人,科学265:1582-1584(1994))。血小板反应蛋白家族中至少已有4种其它成员被鉴定:TSP-2、TSP-3、TSP-4和TSP-5(也称COMP)。在本领域中需要鉴定血管生成调节中涉及的其它分子。
发明概述
本发明提供了含编码METH1多肽之多核苷酸的分离核酸分子,该多肽具有如SEQ ID NO:2中所述的氨基酸序列或由保藏于细菌宿主中的cDNA克隆编码的氨基酸序列,所说的细菌宿主保藏于1998年1月15日,ATCC 保藏号为209581。
本发明提供了含编码METH2多肽之多核苷酸的分离核酸分子,该多肽 具有如SEQ ID NO:4中所述的氨基酸序列或由保藏于细菌宿主中的cDNA 克隆编码的氨基酸序列,所说的细菌宿主保藏于1998年1月15日,ATCC 保藏号为209582。
本发明还涉及含本发明分离核酸分子的重组载体及包括该重组载体 的宿主细胞,还有通过重组技术制备所说载体和宿主细胞的方法及将它 们用于METH1或METH2多肽或肽生产的方法。
本发明进一步提供了具由本文所述多核苷酸编码之氨基酸序列的分离METH1或METH2多肽。
本发明进一步提供了在癌症诊断或预后中有用的诊断方法。
本发明的另一方面涉及治疗体内需更高水平的METH1或METH2活性之个体的方法,包括对这样的个体施用含治疗有效剂量之本发明分离的METH1或METH2多肽或其激动剂的组合物。
附图简述
图1显示METH1的核苷酸(SEQ ID NO:1)和推测的氨基酸(SEQ ID NO:2)序列。该蛋白质具有约28个氨基酸长的预计前导序列(下划线所标)。
图2显示METH2的核苷酸(SEQ ID NO:3)和推测的氨基酸(SEQ ID NO:4)序列。该蛋白质具有约23个氨基酸长的预计前导序列(下划线所标)。
图3显示METH1(SEQ ID NO:2)和METH2(SEQ ID NO:4)与它们最近的同系物-牛金属蛋白酶(pNPI)(SEQ ID NO:5)的氨基酸序列比较。方框内为相同的氨基酸。通过序列和结构同源性预测的功能性结构域被标出,包括信号肽(单线)、哺乳动物枯草杆菌蛋白酶的潜在切割位点(双下划线)、金属蛋白酶结构域的锌结合位点(点线)和推定的去整联蛋白(disintegrin)环(箭头所示)。
图4显示METH1、METH2和pNPI的一级结构,包括前结构域(prodomain)、催化性的金属蛋白酶结构域、富含半胱氨酸的去整联蛋白结构域、类TSP结构域、间隔区及不同数量的类TSP结构域,METH1有三个,METH2有两个,而pNPI是四个。
图5显示METH1(SEQ ID NO:2)和METH2(SEQ ID NO:4)与TSP1(SEQ IDNO:6,7,8)和TSP2(SEQ ID NO:9,10,11)的类TSP结构域比较,半胱氨酸编号为1-6,色氨酸用星号标出。
图6显示来源于METH1和METH2类TSP结构域的肽及重组蛋白质阻断VEGF诱导的血管生成。在存在或缺乏肽或重组蛋白质的情况下,用含铺于基质凝胶上的VEGF的尼龙网对12-14天胎儿的CAM诱导血管生成。毛细管密度评估如实施例4所述。阳性和阴性对照分别只含VEGF和载体。(A)重组蛋白质存在时VEGF诱导的血管生成反应量。TSP1、纯化血小板TSP1、GST、纯化的GST、GST-TSP1、GST-METH1和GST-METH2如实施例4所述。(B)存在或缺乏肽:P-TSP1、P-METH1和P-METH2(分别来源于TSP、METH1和METH2的I类重复区的肽)时VEGF诱导的血管生成反应量;SC1和SC2是用作对照的混杂肽。(C)存在GST-METH1时VEGF诱导的血管生成的剂量性应答。(D)存在GST-METH2时VEGF诱导的血管生成的剂量性应答。血管生成指标以来自VEGF基质胶的血管反应为100%并减去背景水平(只有基质胶)表示。试验至少重复两次。每一处理进行三份试样。所示值代表平均值,杠显示标准偏差。*P<0.001.
图7显示METH1和METH2重组蛋白质对bFGF刺激的细胞增殖的作用。细胞在含bFGF和待测重组蛋白质(除图中所示外均为3ug/ml)的培养基中培养于24孔板上。对照只包括载体或GST重组蛋白质。(A)HDEC,人内皮细胞;(B)HMEC,人乳腺上皮细胞;(C)HDF,人皮肤成纤维细胞;(D)SMC,平滑肌细胞;(E)GST-METH1和GST-METH2对HDEC增殖的剂量性应答。试验至少重复两次。每一处理进行三份试样。所示值代表平均值,杠显示标准偏差。*P<0.01.
图8显示pHE4-5表达载体(SEQ ID NO:12)和亚克隆的METH1或METH2cDNA编码序列的图解。卡那霉素抗性基因、METH1或METH2编码序列、oriC序列及lacIq编码序列的位置被标出。
图9显示pHE启动子调节元件的核苷酸序列(SEQ ID NO:13)。两个lac操纵基因序列、SD序列(S/D)和末端HindIII和NdeI限制位点(斜线表示)被标出。
图10显示METH1氨基酸序列的分析。显示了α、β转角和卷曲区、亲水性和疏水性、两亲区、柔性区、抗原性指数和表面概率,均由默认设置值得到的。在“抗原性指数或Jameson-Wolf”图中,阳性峰表示METH1或METH2蛋白高抗原区的位置,即可获得本发明带表位的肽的区域。这些图表确定的结构域在本发明范围内。图10中概述的数据列表表示于表1中。
图11显示METH2氨基酸序列的分析。显示了α、β、转角和卷曲区、亲水性和疏水性、两亲区、柔性区、抗原性指数和表面概率,均由默认设置值得到。在“抗原性指数或Jameson-Wolf”图中,阳性峰表示METH1或METH2蛋白高抗原区的位置,即可获得本发明带表位的肽的区域。这些图表确定的结构域在本发明范围内。图1中概述的数据列表表示于表2中。
                             表1
 Res     Pos.  Garni..  Alpha     Chou-...     Alpha    Garni..    Beta     Chou-...     Beta    Garni...    Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro...   Eisen..   Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Met     1  A     A    .     .    .   .   .     0.41   *   .     .     -0.30   0.60
 Gly     2  .     A    .     .    .   .   C     0.91   *   .     .     0.50   0.81
 Asn     3  A     A    .     .    .   .   .     0.71   *   .     .     0.75   1.24
 Ala     4  A     A    .     .    .   .   .     0.89   *   .     .     1.09   1.26
 Glu     5  A     A    .     .    .   .   .     0.93   *   .     F     1.58   1.97
 Arg     6  .     A    B     .    .   .   .     1.23   *   .     F     1.92   1.21
 Ala     7  .     .    B     .    .   T   .     1.69   *   .     F     2.66   1.61
 Pro     8  .     .    .     .    T   T   .     1.39   *   .     F     3.40   1.82
 Gly     9  .     .    .     .    T   T   .     1.28   *   .     F     3.06   1.25
 Ser     10  .     .    .     .    T   T   .     0.93   *   .     F     2.42   1.07
 Arg     11  .     .    .     .    T   T   .     0.61   *   .     F     1.93   0.68
 Ser     12  .     .    .     .    T   T   .     0.34   *   .     F     1.74   1.07
 Phe     13  .     .    B     .    .   T   .     0.34   *   .     F     0.25   0.59
 Gly     14  .     .    B     .    .   T   .     0.38   *   .     F     0.25   0.47
 Pro     15  .     .    B     B    .   .   .     -0.13   *   .     F     -0.45   0.50
 Val     16  .     .    B     B    .   .   .     -1.06   *   .     F     -0.45   0.48
 Pro     17  .     .    B     B    .   .   .     -1.57   .   .     F     -0.45   0.40
 Thr     18  .     A    B     .    .   .   .     -1.68   .   .     F     -0.45   0.21
 Leu     19  .     A    B     .    .   .   .     -1.92   .   .     .     -0.60   0.24
 Leu     20  A     A    .     .    .   .   .     -2.30   .   .     .     -0.60   0.15
 Leu     21  A     A    .     .    .   .   .     -2.03   .   .     .     -0.60   0.11
 Res     Pos.    Garni..    Alpha     Chou-..     Alpha   Garni..   Beta     Chou-...     Beta   Garni...   Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro... Eisen.. Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
 Leu     22    A     A   .     .   .   .   .     -2.63 .   .     .     -0.60     0.13
 Ala     23    A     A   .     .   .   .   .     -3.13 .   .     .     -0.60     0.13
 Ala     24    A     A   .     .   .   .   .     -2.91 .   .     .     -0.60     0.13
 Ala     25    A     A   .     .   .   .   .     -2.96 .   .     .     -0.60     0.16
 Leu     26    A     A   .     B   .   .   .     -2 44 .   .     .     -0.60     0.12
 Leu     27    A     A   .     B   .   .   .     -1.63 .   .     .     -0.60     0.16
 Ala     28    A     A   .     B   .   .   .     -1.63 .   .     .     -0.30     0.26
 Val     29    A     A   .     B   .   .   .     -1.86 .   .     .     -0.30     0.32
 Ser     30    A     A   .     .   .   .   .     -1.61 *   *     .     -0.30     0.32
 Asp     31    A     A   .     .   .   .   .     -0.69 *   *     F     -0.15     0.31
 Ala     32    A     A   .     .   .   .   .     -0.09   *     F     0.75     0.83
 Leu     33    .     A   .     .   .   .   C     0.20 *   .     F     1.55     0.96
 Gly     34    .     A   .     .   .   .   C     1.06 *   *     F     1.85     0.77
 Arg     35    .     .   .     .   .   T   C     1.36 *   *     F     2.70     1.32
 Pro     36    .     .   .     .   .   T   C     1.36 *   *     F     3 00     2.76
 Ser     37    .     .   .     .   .   T   C     1.94 *   .     F     2.70     4.66
 Glu     38    A     .   .     .   .   T   .     2.76 *   .     F     2.20     4.12
 Glu     39    A     A   .     .   .   .   .     2.29 *   *     F     1.50     4.61
 Asp     40    A     A   .     .   .   .   .     1.32 *   *     F     1.20     2.84
 Glu     41    A     A   .     .   .   .   .     0.68 .   .     F     0.90     1.22
 Glu     42    A     A   .     .   .   .   .     0.77 .   .     F     0.75     0.52
 Leu     43    A     A   .     .   .   .   .     0.77 .   .     .     0.60     0.48
 Res   Pos.    Garni..    Alpha     Chou-...     Alpha   Garni..   Beta     Chou-...     Beta   Garni...   Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha    Eisen..    Beta  Karpl...  Flexi...     James...     Antig...   Emini   Surfa...
 Val   44    A     A   .     .   .   .   .     -0.04  .    .  .     0.60   0.48
 Val   45    A     A   .     .   .   .   .     -0.04  *    .  .     -0.30   0.23
 Pro   46    A     A   .     .   .   .   .     0.07  *    .  .     -0.30   0.48
 Glu   47    A     .   .     .   .   .   .     -0.52  *    .  F     1.10   1.27
 Leu   48    A     .   .     .   .   .   .     0.08  *    .  F     1.41   1.73
 Glu   49    A     .   .     .   .   .   .     0.59  *    .  F     1.72   1.73
 Arg   50    A     .   .     .   .   .   .     1.41  *    .  F     1.88   0.99
 Ala   51    A     .   .     .   .   T   .     1.28  *    .  F     2.24   1.64
 Pro   52    .     .   .     .   T   T   .     0.97  *    .  F     3.10   0.93
 Gly   53    .     .   .     .   T   T   .     1.47  *    *  F     2.49   0.69
 His   54    .     .   .     .   .   T   C     1.58  *    *  F     1.38   0.98
 Gly   55    .     .   .     .   .   .   C     0.66  *    *  F     1.62   1.25
 Thr   56    .     .   .     .   .   .   C     1.36  .    *  F     0.71   1.04
 Thr   57    .     A   B     .   .   .   .     0.76  .    *  F     0.60   1.49
 Arg   58    .     A   B     .   .   .   .     1.07  .    *  F     0.60   1.25
 Leu   59    .     A   B     .   .   .   .     0.51  .    *  .     0.45   1.17
 Arg   60    .     A   B     .   .   .   .     0.16  .    *  .     0.30   0.82
 Leu   61    .     A   B     .   .   .   .     0.47  .    *  .     -0.30   0.36
 His   62    .     A   B     .   .   .   .     0.78  .    *  .     -0.30   0.74
 Ala   63    A     A   .     .   .   .   .     0.67  .    *  .     0.30   0.65
 Phe   64    A     A   .     .   .   .   .     0.67  .    *  .     -0.15   1.37
 Asp   65    A     A   .     .   .   .   .     0.56  .    *  F     -0.15   0.83
 Res     Pos.    Garni..    Alpha   Chou-...   Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro...    Eisen..    Alpha    Eisen..    Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Gln     66    A   A   .   .   .   .   .     0.56    .    *     F     0.60   1.37
 Gln     67    A   A   .   .   .   .   .     0.59    .    *     F     0.60   1.30
 Leu     68    A   A   .   .   .   .   .     0.37    *    *     F     0.90   1.35
 Asp     69    A   A   .   .   .   .   .     1.18    *    *     .     0.30   0.64
 Leu     70    .   A   B   .   .   .   .     0.97    .    *     .     0.94   0.73
 Glu     71    .   A   B   .   .   .   .     0.97    .    *     .     1.43   1.37
 Leu     72    .   A   B   .   .   .   .     0.67    .    *     .     1.77   1.37
 Arg     73    .   .   .   .   .   T   C     1.18    *    *     F     2.86   2.22
 Pro     74    .   .   .   .   T   T   .     0.48    *    *     F     3.40   1.72
 Asp     75    .   .   .   .   T   T   .     0.48    .    *     F     2.76   1.80
 Ser     76    .   .   .   .   .   T   C     -0.11    .    *     F     2.07   0.76
 Ser     77    .   .   B   .   .   .   .     0.49    *    *     F     0.73   0.50
 Phe     78    .   .   B   .   .   .   .     0.03    *    *     .     0.24   0.46
 Leu     79    .   .   B   .   .   .   .     -0.46    .    .     .     -0.40   0.34
 Ala     80    .   .   B   .   .   T   .     -0.77    .    .     .     -0.20   0.22
 Pro     81    .   .   B   .   .   T   .     -1.28    .    .     .     -0.20   0.37
 Gly     82    .   .   .   .   T   T   .     -0.98    .    .     .     0.20   0.37
 Phe     83    .   .   B   .   .   T   .     -0.28    .    .     .     -0.20   0.63
 Thr     84    .   .   B   B   .   .   .     -0.32    .    .     .     -0.60   0 65
 Leu     85    .   .   B   B   .   .   .     -0.08    *    *     .     -0.60   0.49
 Gln     86    .   .   B   B   .   .   .     0.24    *    .     .     -0.29   0.56
 Asn     87    .   .   B   .   .   T   .     0.63    *    .     F     0.87   0.76
 Res   Pos.  Garni..  Alpha   Chou-...   Alpha   Garni..   Beta    Chou-...    Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Val   88  .   .   B    .   .     T   .     1.03  *   *     F     1.93   1.84
 Gly   89  .   .   .    .   .     T   C     1.00  *   .     F     2.74   1.42
 Arg   90  .   .   .    .   T     T   .     1.51  *   .     F     3.10   0.87
 Lys   91  .   .   .    .   .     T   C     1.51  *   .     F     2.74   1.58
 Ser   92  .   .   .    .   .     T   C     1.20  *   .     F     2.43   2.76
 Gly   93  .   .   .    .   .     T   C     1.84  .   .     F     2.38   2.04
 Ser   94  .   .   .    .   .     T   C     1.38  .   .     F     2.33   1.57
 Glu   95  .   .   .    .   .     .   C     1.06  .   .     F     1.63   0.97
 Thr   96  .   .   .    .   .     .   C     1.01  .   .     F     2.04   1.51
 Pro   97  .   .   .    .   .     .   C     1.00  .   .     F     2.60   1.96
 Leu   98  .   .   .    .   .     .   C     1.34  .   .     F     2.04   1.63
 Pro   99  A   .   .    .   .     .   .     0.83  .   .     F     1.58   1.89
 Glu   100  A   A   .    .   .     .   .     0.24  .   .     F     1.12   1.01
 Thr   101  A   A   .    .   .     .   .     0.52  .   .     F     0.86   1.23
 Asp   102  A   A   .    .   .     .   .     0.07  .   .     F     0.60   1.08
 Leu   103  A   A   .    .   .     .   .     0.18  .   .     .     0.30   0.34
 Ala   104  A   A   .    .   .     .   .     0.14  .   .     .     -0.60   0.20
 His   105  .   A   B    .   .     .   .     -0.16  *   .     .     -0.60   0.19
 Cys   106  .   A   B    .   .     .   .     -0.19  *   .     .     -0.60   0.31
 Phe   107  .   A   B    .   .     .   .     -0.50  *   .     .     -0.60   0.30
 Tyr   108  .   .   B    .   .     T   .     -0.54  .   .     .     -0.20   0.32
 Ser   109  .   .   .    .   T     T   .     0.04  .   *     F     0.35   0.44
 Res   Pos.  Garni..  Alpha   Chou-...   Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta   Karpl...   Flexi...     James...     Antig...     Emini     Surfa...
 Gly   110  .   .   .   .   T     T   .     -0.27  .   *   F     0.35     0.82
 Thr   111  .   .   .   .   T     T   .     0.40  .   *   F     0.59     0.52
 Val   112  .   .   B   B   .     .   .     0.89  .   *   F     0.93     0.65
 Asn   113  .   .   .   B   T     .   .     0.83  .   *   F     1.72     1.01
 Gly   114  .   .   .   B   .     .   C     0.83  .   *   F     1.61     0.94
 Asp   115  .   .   .   .   .     T   C     0.59  .   *   F     2.40     1.69
 Pro   116  .   .   .   .   .     T   C     0.31  .   *   F     2.16     1.06
 Ser   117  .   .   .   .   .     T   C     0.58  .   *   F     1.92     1.08
 Ser   118  A   .   .   .   .     T   .     -0.23  .   .   F     1.33     0.66
 Ala   119  A   A   .   .   .     .   .     -0.19  .   .   .     -0.06     0.35
 Ala   120  A   A   .   .   .     .   .     -1.00  .   .   .     -0.30     0.35
 Ala   121  A   A   .   .   .     .   .     -1.46  .   .   .     -0.60     0.22
 Leu   122  A   A   .   .   .     .   .     -1.16  .   .   .     -0.60     0.11
 Ser   123  A   A   .   .   .     .   .     -1.20  .   .   .     -0.30     0.20
 Leu   124  A   A   .   .   .     .   .     -1.47  *   *   .     -0.30     0.19
 Cys   125  .   A   B   .   .     .   .     -0.77  *   *   .     -0.30     0.17
 Glu   126  .   A   B   .   .     .   .     -0.52  *   *   .     0.30     0.25
 Gly   127  A   .   .   .   .     .   .     -0.30  *   *   F     0.65     0.30
 Val   128  A   .   .   .   .     .     -0.70  *   *   F     0.65     0.57
 Arg   129  .   .   B   .   .     .   .     -0.13  *   *   F     0.65     0.29
 Gly   130  .   .   B   B   .     .   .     -0.28  *   *   .     -0.60     0.45
 Ala   131  .   .   B   B   .     .   .     -1.09  *   *   .     -0.60     0 50
 Res     Pos.  Garni..  Alpha     Chou-...     Alpha    Garni..    Beta     Chou-...     Beta   Garni...   Turn   Chou-...   Turn   Garni..   Coil      Kyte-...      Hydro...  Eisen..  Alpha   Eisen..   Beta   Karpl...   Flexi...     James...     Antig...   Emini   Surfa...
 Phe     132  .     .    B     B   .   .   .     -1.09  *   *   .     -0.60   0.21
 Tyr     133  .     .    B     B   .   .   .     -0.23  *   *   .     -0.60   0.21
 Leu     134  .     A    B     B   .   .   .     -0.93  *   *   .     -0.60   0.36
 Leu     135  .     A    B     B   .   .   .     -0.83  .   *   .     -0.60   0.42
 Gly     136  A     A    .     B   .   .   .     -0.94  .   .   .     -0.60   0.42
 Glu     137  A     A    .     .   .   .   .     -1.13  .   .   .     -0.60   0.44
 Ala     138  A     A    .     B   .   .   .     -0.89  .   .   .     -0.60   0.38
 Tyr     139  .     .    B     B   .   .   .     -0.29  .   .   .     -0.60   0.66
 Phe     140  .     .    B     B   .   .   .     -0.29  .   .   .     -0.60   0.59
 Ile     141  .     .    B     B   .   .   .     -0.16  .   .   .     -0.60   0.48
 Gln     142  .     .    B     B   .   .   .     -0.74  .   .   .     -0.60   0.48
 Pro     143  .     .    B     B   .   .   .     -0.74  .   .   .     -0.60   0.55
 Leu     144  .     A    .     .   .   .   C     -0.80  *   .   .     -0.40   0.80
 Pro     145  .     A    .     .   .   .   C     -0.10  *   .   .     -0.10   0.62
 Ala     146  A     A    .     .   .   .   .     0.90  *   .   .     0.30   0.69
 Ala     147  A     A    .     .   .   .   .     0.09  *   .   .     0.75   1.64
 Ser     148  A     A    .     .   .   .   .     -0.29  *   .   F     0.75   0.88
 Glu     149  A     A    .     .   .   .   .     0.21  *   .   F     0.45   0.88
 Arg     150  A     A    .     .   .   .   .     -0.17  *   .   F     0.60   1.25
 Leu     151  A     A    .     .   .   .   .     -0.17  *   .   .     0.30   0.94
 Ala     152  A     A    .     .   .   .   .     0.21  *   .   .     0.30   0.55
 Thr     153  A     A    .     .   .   .   .     0.17  *   .   .     0.04   0.43
 Res     Pos.  Garni..  Alpha     Chou-...     Alpha    Garni..    Beta   Chou-...   Beta   Garni...   Turn     Chou-...     Turn     Garni..     Coil     Kyte-...     Hydro...    Eisen..    Alpha     Eisen..     Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Ala     154  A     A    .   .   .     .     .     0.17    .     .     .     0.08   0 52
 Ala     155  .     .    .   .     T     C     0.10    .     *     F     2.07   0.89
 Pro     156  .     .    .   .   .     T     C     0.70    .     .     F     2.86   1.24
 Gly     157  .     .    .   .   T     T     .     1.08    .     .     F     3.40   1.90
 Glu     158  .     .    .   .   .     T     C     0.80    .     .     F     2.86   2.90
 Lys     159  .     .    .   .   .     .     C     1.18    .     .     F     2.32   1.90
 Pro     160  .     .    .   .   .     .     C     0.96    .     *     F     1.98   2.97
 Pro     161  .     .    .   .   .     .     C     1.17    .     *     F     1.64   1.41
 Ala     162  A     A    .   .   .     .     .     0.81    .     *     F     0.60   1.22
 Pro     163  A     A    .   .   .     .     .     0.78    .     *     .     -0.60   0.68
 Leu     164  A     A    .   .   .     .     .     -0.08    .     *     .     -0.60   0.60
 Gln     165  A     A    .   .   .     .     .     -0.68    *     *     .     -0.60   0.49
 Phe     166  .     A    B   .   .     .     .     -0.36    *     *     .     -0.60   0.26
 His     167  .     A    B   .   .     .     .     0.34    *     *     .     -0.26   0.62
 Leu     168  .     A    B   .   .     .     .     0.56    *     *     .     0.38   0.70
 Leu     169  .     A    B   .   .     .     .     1.48    *     *     .     0.87   1.31
 Arg     170  .     .    .   .   T     T     .     1.48    *     *     F     3.06   1.88
 Arg     171  .     .    .   .   T     T     .     1.83    *     .     F     3.40   3.96
 Asn     172  .     .    .   .   T     T     .     1.87    *     .     F     3.06   4.75
 Arg     173  .     .    .   T     T     .     1.82    *     .     F     2.72   4.05
 Gln     174  .     .    .   .   T     .     .     2.29    .     .     F     2.43   1.53
 Gly     175  .     .    .   .   T     .     .     1.83    .     .     F     2.19   0.94
 Res    Pos.   Garni..   Alpha     Chou-...     Alpha   Garni..   Beta   Chou-...   Beta    Garni..    Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro...    Eisen..    Alpha  Eisen..  Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Asp    176   .     .   .   .    T   T   .     1.41    .  .     F     2.30   0.48
 Val    177   .     .   B   .    .   T     0.74    .  .     F     1.85   0.40
 Gly    178   .     .   .   .    T   T   .     0.29    .  .     F     2.50   0 22
 Gly    179   .     .   B   .    .   T   .     -0.57    .  *     F     1.85   0.13
 Thr    180   .     .   B   B    .   .   .     -1.08    .  .     F     0.30   0.13
 Cys    181   .     .   B   B    .   .   .     -1.08    .  .     .     -0.10   0.10
 Gly    182   .     .   B   B    .   .   .     -0.22    .  .     .     -0.05   0.16
 Val    183   .     .   B   B    .   .   .     0.12    .  .     .     0.30   0.19
 Val    184   .     .   B   B    .   .   .     0.26    *  *     .     0.90   0.60
 Asp    185   .     .   B   .    .   T   .     0.68    *  *     F     1.75   0.94
 Asp    186   .     .   B   .    .   T   .     1.13    *  *     F     2.20   2.49
 Glu    187   .     .   B   .    .   T   .     1.17    *  *     F     2.50   5.18
 Pro    188   .     .   .   .    .   T   C     1.68    *  *     F     3.00   4.48
 Arg    189   .     .   .   .    .   T   C     2 58    *  *     F     2.70   2.66
 Pro    190   .     .   .   .    .   T   C     1.99    *  *     F     2.40   3.07
 Thr    191   .     .   .   .    .   T   C     1.99    *  *     F     2.10   2.00
 Gly    192   .     .   .   .    .   T   C     1.68    *  *     F     1.80   1.77
 Lys    193   A     A   .   .    .   .   .     1.89    *  *     F     0.90   1.65
 Ala    194   A     A   .   .    .   .   .     1.78    *  *     F     0.90   1.98
 Glu    195   A     A   .   .    .   .   .     1.99    .  *     F     0.90   3.35
 Thr    196   A     A   .   .    .   .   .     2.30    .  *     F     0.90   2.90
 Glu    197   A     A   .   .    .   .   .     2.64    .  *     F     0.90   4.79
 Res     Pos.    Garni..    Alpha   Chou-...   Alpha   Garni..   Beta   Chou-...   Beta Garni... Turn   Chou-...   Turn   Garni..   Coil   Kyte-...   Hydro...    Eisen..    Alpha   Eisen..   Beta    Karpl...    Flexi...   James...   Antig...   Emini   Surfa...
 Asp     198    A   A   .   . .   .   .   2.26    .   *    F   0.90   4.79
 Glu     199    A   A   .   . .   .   .   2.53    .   .    F   0.90   3.29
 Asp     200    A   .   .   . .   T   .   2.53    .   .    F   1.30   2.74
 Glu     201    A   .   .   . .   T   .   2.50    .   .    F   1.30   2.84
 Gly     202    A   .   .   . .   T   .   2.50    .   .    F   1.30   1.62
 Thr     203    A   .   .   . .   T   .   2.50    .   .    F   1.30   1.68
 Glu     204    A   A   .   . .   .   .   2.50    *   .    F   0.90   1.62
 Gly     205    A   A   .   . .   .   .   2.16    *   .    F   1.20   2.84
 Glu     206    A   A   .   . .   .   .   1.94    *   .    F   1.50   1.95
 Asp     207    .   A   .   . T   .   .   2.29    *   .    F   2.20   1.74
 Glu     208    .   A   .   . .   .   C   2.31    *   .    F   2.30   3.04
 Gly     209    .   .   .   . .   T   C   2.01    *   .    F   3.00   1.85
 Pro     210    .   .   .   . T   T   .   2.14    .   .    F   2.60   1.48
 Gln     211    .   .   .   . T   T   .   2.14    .   .    F   2.30   1.32
 Trp     212    .   .   .   . .   T   C   2.14    .   .    F   1.44   2.32
 Ser     213    .   .   .   . .   .   C   1.93    .   .    F   1.78   2.50
 Pro     214    .   .   .   . T   T   .   1.69    .   .    F   2.12   2.23
 Gln     215    .   .   .   . .   T   C   1.09    .   .    F   1.56   2.15
 Asp     216    .   .   .   . .   T   C   1.09    .   *    F   2.40   1.32
 Pro     217    .   .   .   . .   T   C   1.03    .   .    F   2.16   1.48
 Ala     218    .   .   .   . T   .   .   0.48    .   .    F   1.77   0.85
 Leu     219    .   .   B   . .   .   .   0.34    *   .    F   0.53   0.38
 Res   Pos.    Garni..    Alpha   Chou-...   Alpha    Garni..    Beta   Chou-...   Beta   Garni...   Turn    Chou-...    Turn    Garni..    Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Gln   220    .   .    B   .   .    .    .     0.34  *   .     F     -0.01   0.24
 Gly   221    .   .    B   .   .    T    .     0.13  *   *     F     -0.05   0.41
 Val   222    .   .    B   .   .    T    .     0.03  *   .     F     -0.05   0.77
 Gly   223    .   .    B   .   .    T    .     0.28  *   .     F     0.25   0.64
 Gln   224    .   .    B   .   .    T    .     0.78  *   *     F     0.25   0.64
 Pro   225    .   .    B   .   .    .    .     0.43  .   .     F     0.20   1.25
 Thr   226    .   .    .   .   T    .    .     0.48  .   *     F     0.60   1.25
 Gly   227    .   .    .   .   .    T    C     0.44  *   *     F     0.45   0.97
 Thr   228    .   .    B   .   .    T    .     0.90  *   *     F     0.25   0.44
 Gly   229    .   .    B   .   .    T    .     0.94  .   *     F     0.85   0.60
 Ser   230    .   .    B   .   .    T    .     1.20  .   *     F     1.30   1.20
 Ile   231    .   A    B   .   .    .    .     1.62  .   *     F     0.90   1.67
 Arg   232    .   A    B   .   .    .    .     1.27  .   *     F     0.90   3.30
 Lys   233    .   A    B   .   .    .    .     0.72  .   .     F     0.90   2.13
 Lys   234    .   A    B   B   .    .    .     0.77  .   .     F     0.90   2.26
 Arg   235    .   A    B   B   .    .    .     0.77  .   .     F     0.90   1.55
 Phe   236    .   .    B   B   .    .    .     1.62  .   *     .     0.75   1.04
 Val   237    .   .    B   B   .    .    .     1.62  .   *     .     0.30   0.71
 Ser   238    .   .    B   .   .    T    .     1.33  *   *     .     0.70   0.71
 Ser   239    .   .    .   .   .    T    C     0.43  *   .     .     0.15   1.28
 His   240    .   .    .   .   .    T    C     0.32  *   *     .     0.45   1.28
 Arg   241    .   .    .   .   .    T    C     0.71  *   .     .     1.05   1.65
  Res     Pos.  Garni..  Alpha     Chou-...     Alpha    Garni..    Beta     Chou-...     Beta   Garni...   Turn     Chou-...     Turn    Garni..    Coil   Kyte-...   Hydro... Eisen.. Alpha   Eisen..   Beta    Karpl...    Flexi...     James...     Antig...     Emini     Surfa...
  Tyr     242  A     .    .     B   .     .    .   0.97 *   .    .     0.45     1.78
  Val     243  A     .    .     B   .     .    .   0.46 *   .    .     0.45     1.29
  Glu     244  .     .    B     B   .     .    .   -0.10 *   .    .     -0.30     0.54
  Thr     245  .     .    B     B   .     .    .   -0.66 *   .    .     -0.60     0.26
  Met     246  A     .    B     B   .     .    .   -0.77 *   .    .     -0.60     0.35
  Leu     247  A     .    .     B   .     .    .   -0.52 .   .    .     0.30     0.34
  Val     248  A     .    .     B   .     .    .   0.03 .   .    .     -0.30     0.41
  Ala     249  A     .    .     B   .     .    .   -0.57 .   .    .     -0.30     0.55
  Asp     250  A     .    .     .   .     T    .   -0.84 .   .    F     0.25     0.66
  Gln     251  A     .    .     .   .     T    .   -0.24 .   .    F     0.25     0.90
  Ser     252  A     .    .     .   .     T    .   -0.13 .   .    F     1.30     1.54
  Met     253  A     .    .     .   .     T    .   0.69 .   *    .     0.70     0.80
  Ala     254  A     .    .     .   .     .    .   0.93 .   *    .     -0.10     0.63
  Glu     255  A     .    .     .   .     .    .   0.63 .   *    .     -0.10     0.46
  Phe     256  A     .    .     .   .     .    .   0.29 .   *    .     -0.10     0.63
  His     257  A     .    .     .   .     T    .   -0.22 *   .    .     0.10     0.61
  Gly     258  A     .    .     .   .     T    .   0.42 *   .    F     0.25     0.29
  Ser     259  A     .    .     .   .     T    .   0.98 *   *    F     0.25     0.68
  Gly     260  A     .    .     .   .     T    .   0.73 *   *    F     0.85     0.68
  Leu     261  A     A    .     .   .     .    .   0.62 .   .    F     0.00     1.07
  Lys     262  A     A    .     .   .     .    .   -0.16 .   .    .     -0.60     0.66
  His     263  .     A    B     .   .     .    .   -0.12 *   .    .     -0.60     0.55
 Res     Pos.    Garni..    Alpha   Chou-...   Alpha    Garni..    Beta     Chou-...     Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro...   Eisen..   Alpha     Eisen..     Beta    Karpl...    Flexi...     James...     Antig...   Emini   Surfa...
 Tyr     264    .   A    B     .   .     .   .     -0.63   *     .    .     -0.60   0.96
 Leu     265    .   A    B     .   .     .   .     -0.99   *     .    .     -0.60   0.40
 Leu     266    .   A    B     .   .     .   .     -0.48   *     .    .     -0.60   0.25
 Thr     267    .   A    B     .   .     .   .     -1.38   *     .    .     -0.60   0.22
 Leu     268    .   A    B     .   .     .   .     -1.93   *     .    .     -0.60   0.19
 Phe     269    A   A    .     .   .     .   .     -2.28   *     *    .     -0.60   0.24
 Ser     270    A   A    .     .   .     .   .     -1.36   *     *    .     -0.60   0.17
 Val     271    A   A    .     .   .     .   .     -1.36   *     *    .     -0.60   0.39
 Ala     272    A   A    .     .   .     .   .     -1.29   *     *    .     -0.60   0.38
 Ala     273    A   A    .     .   .     .   .     -0.43   *     *    .     -0.60   0.44
 Arg     274    A   A    .     .   .     .   .     0.23   *     *    .     -0.15   1.18
 Leu     275    A   A    .     .   .     .   .     0.32   *     *    .     0.45   1.59
 Tyr     276    .   .    .     .   T     .   .     0.88   *     *    .     1.39   2.44
 Lys     277    .   .    B     .   .     .   .     0.58   *     *    F     1.48   1.67
 His     278    .   .    B     .   .     T   .     1.28   .     *    F     1.12   1.42
 Pro     279    .   .    B     .   .     T   .     1.17   .     *    F     2.36   1.77
 Ser     280    .   .    .     .   T     T   .     1.68   .     *    F     3.40   1.43
 Ile     281    .   .    B     .   .     T   .     1.07   .     *    F     2.36   1.41
 Arg     282    .   .    B     B   .     .   .     0.72   .     *    F     1.47   0.67
 Asn     283    .   .    B     B   .     .   .     -0.06   *     *    F     1.13   0.67
 Ser     284    .   .    B     B   .     .   .     -0.70   *     *    F     0.19   0.79
 Val     285    .   .    B     B   .     .   .     -1.26   *     *    .     -0.30   0.30
 Res     Pos.  Garni..  Alpha  Chou-...  Alpha    Garni..    Beta   Chou-...   Beta Garni... Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro... Eisen.. Alpha  Eisen..  Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Ser     286  .  .    B    B .   .   .     -1.22 .  *     .     -0.60   0.14
 Leu     287  .  .    B    B .   .   .     -1.29 .  *     .     -0.60   0.08
 Val     288  .  .    B    B .   .   .     -2.18 *  .     .     -0.60   0.21
 Val     289  .  .    B    B .   .   .     -2.69 .  *     .     -0.60   0.11
 Val     290  .  .    B    B .   .   .     -2.69 .  .     .     -0.60   0.11
 Lys     291  .  .    B    B .   .   .     -3.28 .  .     .     -0.60   0.11
 Ile     292  .  .    B    B .   .   .     -2.50 .  .     .     -0.60   0.10
 Leu     293  .  .    B    B .   .   .     -1.64 .  *     .     -0.60   0.19
 Val     294  .  .    B    B .   .   .     -0.79 .  .     .     -0.30   0.16
 Ile     295  .  .    B    B .   .   .     0.07 .  *     .     0.00   0.39
 His     296  A  .    .    B .   .   .     0.07 .  *     .     0.90   0.81
 Asp     297  A  .    .    B .   .   .     0.61 .  .     F     1.80   2.19
 Glu     298  A  .    .    . .   .   .     1.21 *  .     F     2.30   3.09
 Gln     299  .  .    .    . T   .   .     2.07 *  .     F     3.00   3.51
 Lys     300  .  .    .    . .   .   C     2.10 .  .     F     2.50   3.64
 Gly     301  .  .    .    . .   T   C     1.82 .  .     F     2.40   1.56
 Pro     302  .  .    .    . .   T   C     1.52 .  .     F     2.10   1.30
 Glu     303  .  .    B    . .   T   .     1.52 *  .     F     1.45   0.87
 Val     304  A  .    .    . .   T   .     0.93 *  .     F     1.00   1.42
 Thr     305  A  .    .    . .   T   .     0.30 .  *     F     0.85   0.93
 Ser     306  A  .    .    . .   T   .     -0.17 .  *     F     0.85   0.54
 Asn     307  A  .    .    . .   T   .     -0.27 .  *     F     -0.05   0.60
 Res     Pos.  Garni..  Alpha     Chou-...     Alpha    Garni..    Beta     Chou-...     Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha  Eisen..  Beta      Karpl...      Flexi..     James...     Antig...     Emini     Surfa...
 Ala     308  A     .    .     .   .     T   .     -1.08  *  *      .     -0.20     0.60
 Ala     309  A     .    .     .   .     .   .     -0.11  *  *      .     -0.40     0.37
 Leu     310  A     .    .     .   .     .   .     0.20  *  *      .     -0.10     0.45
 Thr     311  .     .    B     .   .     .   .     -0.20  *  *      .     -0.10     0.72
 Leu     312  .     .    B     .   .     .   .     -0.87  *  *      .     -0.40     0.61
 Arg     313  .     .    B     .   .     .   .     -0.28  *  *      .     -0.40     0.40
 Asn     314  .     .    .     .   T     .   .     0.02  *  *      .     0.30     0.44
 Phe     315  .     .    .     .   T     T   .     0.83  *  *      .     0.20     0.57
 Cys     316  .     .    .     .   T     T   .     1.19  *  *      .     0.20     0.50
 Asn     317  .     .    .     .   T     T   .     2.00  *  *      .     0.20     0.62
 Trp     318  .     .    .     .   T     T   .     1.86  *  .      .     0.35     1.25
 Gln     319  .     .    .     .   T     .   .     1.86  .  .      .     0.45     3.16
 Lys     320  .     .    .     .   T     .   .     2.34  *  .      F     0.60     3.16
 Gln     321  .     .    .     .   T     .   .     2.80  .  .      F     0.94     4.65
 His     322  .     .    .     .   .     .   C     2.50  *  .      F     1.68     4.15
 Asn     323  .     .    .     .   .     .   C     2.79  *  .      F     2.02     2.78
 Pro     324  .     .    .     .   .     T   C     2.90  .  .      F     2.56     2.68
 Pro     325  .     .    .     .   T     T   .     2.86  *  .      F     3.40     3.86
 Ser     326  .     .    .     .   .     T   C     2.27  .  .      F     2.86     4.01
 Aso     327  .     .    .     .   .     T   C     2.30  .  .      F     2.52     2.62
 Arg     328  A     A    .     .   .     .   .     2.27  .  .      F     1.58     2.94
 Asp     329  A     A    .     .   .     .   .     2.23  *  .      F     1.24     2.98
 Res     Pos.    Garni..    Alpha     Chou-...     Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn    Garni..    Coil     Kyte-...     Hydro...   Eisen..   Alpha     Eisen..     Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
 Ala     330    A     A   .   .   .   .    .     2.44   *     .     .     0.90     2.80
 Glu     331    A     A   .   .   .   .    .     2.43   *     .     .     0.75     2.38
 His     332    A     .   .   .   .   T    .     1.84   *     .     .     1.15     2.06
 Tyr     333    A     .   .   .   .   T    .     0.84   *     .     .     0.85     2.06
 Asp     334    A     .   .   .   .   T    .     0.03   .     .     .     0.70     0.83
 Thr     335    A     .   .   .   .   T    .     -0.08   .     .     .     -0.20     0.51
 Ala     336    A     A   .   .   .   .    .     -0.39   *     .     .     -0.60     0.28
 Ile     337    A     A   .   .   .   .    .     -0.24   *     .     .     -0.60     0.24
 Leu     338    .     A   B   .   .   .    .     0.00   .     .     .     -0.60     0.33
 Phe     339    .     A   B   .   .   .    .     0.00   .     *     .     -0.60     0.56
 Thr     340    .     A   B   .   .   .    .     -0.50   .     .     F     0.00     1.34
 Arg     341    .     A   B   .   .   .    .     -0.58   .     *     F     0.25     1.34
 Gln     342    .     A   .   .   T   .    .     -0.03   .     *     F     1.35     0.83
 Asp     343    .     A   .   .   T   .    .     0.48   .     *     F     1.60     0.57
 Leu     344    .     A   .   .   T   .    .     1.18   *     .     F     2.15     0.39
 Cys     345    .     .   .   .   T   T    .     1.18   .     *     F     2.50     0.39
 Gly     346    .     .   .   .   T   T    .     0.40   .     *     F     2.25     0.34
 Ser     347    .     .   .   .   T   T    .     0.40   .     .     F     1.10     0.22
 Gln     348    .     .   B   .   .   T    .     0.09   .     .     F     1.35     0.68
 Thr     349    .     .   B   .   .   .    .     0.09   .     .     F     0.90     0.99
 Cys     350    .     .   B   .   .   .    .     0.41   .     .     F     0.05     0.61
 Asp     351    .     .   B   .   .   T    .     0.16   *     .     F     0.25     0.35
 Res     Pos.  Garni..  Alpha       Chou-...       Alpha    Garni..    Beta      Chou-...      Beta   Garni...   Turn   Chou-...   Turn    Garni..    Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta   Karpl...   Flexi...     James...     Antig...   Emini   Surfa...
 Thr     352  .       .    B      .   .   T    .     -0.13  .   .   F     0.25   0.24
 Leu     353  .       .    B      .   .   T    .     -0.13  .   .   .     0.10   0.45
 Gly     354  .       .    B      .   .   T    .     -0.68  .   .   .     0.70   0.45
 Met     355  .       .    B      .   .   .    .     -0.36  .   .   .     -0.10   0.23
 Ala     356  .       .    B      .   .   .    .     -0.67  .   .   .     -0.10   0.28
 Asp     357  .       .    B      .   .   T    .     -1.21  .   .   .     0.10   0.41
 Val     358  .       .    B      .   .   T    .     -1.07  .   .   .     0.10   0.30
 Gly     359  .       .    B      .   .   T    .     -0.72  .   .   .     0.10   0.16
 Thr     360  .       .    B      .   .   T     -0.33  .   .   .     0.70   0.16
 Val     361  .       .    B      .   .   .    .     -0.04  .   *   .     0.24   0.34
 Cys     362  .       .    B      .   .   .    .     0.07  *   .   .     1.18   0.46
 Asp     363  .       .    B      .   .   T    .     0.62  *   .   F     1.87   0.62
 Pro     364  .       .    .      .   T   T    .     0.30  *   .   F     3.06   1.12
 Ser     365  .       .    .      .   T   T    .     0.31  *   .   F     3.40   1.12
 Arg     366  .       .    .      .   T   T    .     0.31  *   .   F     2.91   0.90
 Ser     367  .       .    .      B   T   .    .     0.09  *   .   F     1.87   0.43
 Cys     368  .       .    B      B   .   .    .     0.09  *   .   .     0.38   0.22
 Ser     369  .       .    B      B   .   .    .     0.30  *   .   .     0.64   0.20
 Val     370  .       .    B      B   .   .    .     0.60  *   .   .     0.30   0.25
 Ile     371  .       .    B      B   .   .    .     0.14  *   .   .     0.60   0.77
 Glu     372  .       .    B      B   .   .    .     -0.37  .   .   .     0.60   0.57
 Asp     373  A       .    .      .   .   T    .     0.30  .   .   F     1.15   0.63
 Res     Pos.  Garni..  Alpha   Chou-...   Alpha   Garni.   Beta   Chou-...   Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Asp     374  A   .   .   .   .     T   .     0.01  *   .     .     1.30   1.56
 Gly     375  A   .   .   .   .     T   .     0.28  .   .     .     1.00   0.91
 Leu     376  A   .   .   .   .     T   .     0.47  *   .     .     0.70   0.55
 Gln     377  A   A   .   .   .     .   .     0.16  .   .     .     -0.30   0.29
 Ala     378  A   A   .   .   .     .   .     -0.16  *   .     .     -0.60   0.42
 Ala     379  A   A   .   .   .     .   .     -0.74  *   .     .     -0.60   0.73
 Phe     380  A   A   .   .   .     .   .     -0.43  *   .     .     -0.60   0.43
 Thr     381  A   A   .   .   .     .   .     0.38  *   *     .     -0.60   0.57
 Thr     382  A   A   .   .   .     .   .     -0.43  *   .     .     -0.30   0.98
 Ala     383  A   A   .   .   .     .   .     -0.19  *   .     .     -0.60   0.94
 His     384  A   A   .   .   .     .   .     0.37  *   .     .     -0.30   0.64
 Glu     385  A   A   .   .   .     .   .     0.21  *   .     .     -0.30   0.61
 Leu     386  A   A   .   .   .     .   .     -0.18  *   .     .     -0.30   0.45
 Gly     387  A   .   .   B   .     .   .     0.13  *   .     .     -0.60   0.28
 His     388  A   .   .   B   .     .   .     0.12  *   .     .     -0.60   0.26
 Val     389  A   .   .   B   .     .   .     -0.06  *   .     .     -0.60   0.32
 Phe     390  A   .   .   B   .     .   .     -0.09  *   .     .     -0.60   0.49
 Asn     391  .   .   B   B   .     .   .     0.72  *   .     .     -0.60   0.49
 Met     392  .   .   B   .   .     T   .     1.07  *   .     .     0.25   1.11
 Pro     393  A   .   .   .   .     T   .     0.51  *   .     .     0.85   2.14
 His     394  .   .   .   .   T     T   .     1.41  *   .     F     1.70   1.34
 Asp     395  A   .   .   .   .     T   .     2.11  *   .     F     1.30   2.72
  Res     Pos.    Garni..    Alpha   Chou-...   Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro...    Eisen..    Alpha  Eisen..  Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
  Asp     396    A   A   .   .   .   .   .     1.44    *  .     F     0.90     3.04
  Ala     397    A   A   .   .   .   .   .     1.46    *  .     F     0.90     1.20
  Lys     398    A   A   .   .   .   .   .     1.37    *  *     F     0.75     0.73
  Gln     399    A   A   .   .   .   .   .     0.59    .  *     .     0.60     0.58
  Cys     400    .   A   B   .   .   .   .     0.59    .  *     .     -0.30     0.48
  Ala     401    .   A   B   .   .   .   .     0.24    .  *     .     0.30     0.38
  Ser     402    .   .   B   .   .   T   .     -0.02    .  *     .     0.10     0.22
  Leu     403    .   .   B   .   .   T   .     -0.07    .  .     .     0.04     0.30
  Asn     404    .   .   .   .   T   T   .     -0.07    .  .     .     0.68     0.48
  Gly     405    .   .   .   .   T   T   .     0.60    .  .     F     1.37     0.62
  Val     406    .   .   .   .   .   .   C     0.89    .  .     F     1.96     1.26
  Asn     407    .   .   .   .   .   T   C     1.16    .  .     F     2.40     1.05
  Gln     408    A   .   .   .   .   T   .     1.37    *  .     F     1.96     1.44
  Asp     409    A   .   .   .   .   T   .     0.77    *  .     F     1.72     1.92
  Ser     410    A   .   .   .   .   T   .     0.52    .  .     .     1.33     1.18
  His     411    A   A   .   .   .   .   .     1.08    .  *     .     -0.06     0.69
  Met     412    A   A   .   .   .   .   .     0.48    .  .     .     0.30     0.55
  Met     413    A   A   .   .   .   .   .     -0.33    .  .     .     -0.60     0.41
  Ala     414    A   A   .   .   .   .   .     -0.63    .  .     .     -0.60     0.25
  Ser     415    A   A   .   .   .   .   .     -0.33    *  .     .     -0.60     0.34
  Met     416    A   A   .   .   .   .   .     -1.11    *  *     .     -0.60     0.55
  Leu     417    A   .   .   .   .   T   .     -0.51    *  .     .     -0.20     0.45
  Res     Pos.    Garni..    Alpha     Chou-...     Alpha   Garni..   Beta     Chou-...     Beta       Garni...       Turn     Chou-...     Turn    Garni..    Coil     Kyte-...     Hydro...    Eisen..    Alpha   Eisen..   Beta    Karpl...    Flexi...     James...     Antig...   Emini   Surfa...
  Ser     418    A     .   .     .       .     T    .     0.06    *   .    .     0.38   0.56
  Asn     419    A     .   .     .       .     T    .     0.34    .   .    .     0.66   0.76
  Leu     420    .     .   .     .       .     T    C     0.64    .   .    .     1.29   1.24
  Asp     421    .     .   .     .       T     T    .     1.03    .   .    .     2.37   1.60
  His     422    .     .   .     .       T     T    .     1.56    .   .    F     2.80   1.54
  Ser     423    .     .   .     .       .     T    C     1.56    .   .    F     1.72   1.97
  Gln     424    .     .   .     .       .     T    C     1.34    .   .    F     1.44   1.58
  Pro     425    .     .   .     .       T     .    .     1.49    .   .    F     0.86   1.79
  Trp     426    .     .   .     .       T     .    .     1.19    .   .    F     0.43   0.72
  Ser     427    .     .   .     .       .     T    C     0.63    .   .    F     0.15   0.55
  Pro     428    .     .   .     .       T     T    .     0.69    .   .    F     0.35   0.36
  Cys     429    .     .   .     .       T     T    .     0.09    .   .    .     0.20   0.54
  Ser     430    .     .   B     .       .     T    .     -0.59    .   .    .     -0.20   0.40
  Ala     431    .     .   B     B       .     .    .     -0.61    .   .    .     -0.60   0.18
  Tyr     432    .     .   B     B       .     .    .     -0.61    .   .    .     -0.60   0.49
  Met     433    .     .   B     B       .     .    .     -1.10    .   .    .     -0.60   0.49
  Ile     434    .     .   B     B       .     .    .     -1.24    *   .    .     -0.60   0.42
  Thr     435    .     .   B     B       .     .    .     -0.94    *   .    .     -0.60   0.22
  Ser     436    .     .   B     B       .     .    .     -0.36    *   .    .     -0.60   0.37
  Phe     437    .     .   B     B       .     .    .     -0.46    *   .    .     -0.60   0.85
  Leu     438    .     .   B     .       .     T    .     0.11    *   .    F     0.56   0.58
  Asp     439    .     .   .     .       T     T    .     0.66    *   .    F     1.27   0.59
 Res     Pos.   Garni..   Alpha       Chou-...       Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn    Garni..    Coil     Kyte-...     Hydro...    Eisen..    Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
 Asn     440   .       .   .   .   .   T    C     0.97    .   .     F     1.38     0.68
 Gly     441   .       .   .   .   T   T    .     0.60    .   .     F     2.94     1.42
 His     442   .       .   .   .   T   T    .     0.49    .   .     F     3.10     0.46
 Gly     443   A       .   .   .   .   T    .     0.70    .   .     F     1.49     0.23
 Glu     444   A       .   .   .   .   T    .     0.70    .   .     .     1.03     0.23
 Cys     445   .       .   B   .   .   T    .     0.74    .   *     .     1.32     0.29
 Leu     446   .       A   B   .   .   .    .     0.88    .   .     .     1.25     0.58
 Met     447   .       A   B   .   .   .    .     0.91    *   .     .     1.28     0.52
 Asp     448   .       A   .   .   T   .    .     1.26    *   .     F     2.02     1.67
 Lys     449   .       A   .   .   .   .    C     1.04    *   .     F     2.16     3.26
 Pro     450   .       .   .   .   T   T    .     0.82    *   *     F     3.40     5.10
 Gln     451   .       .   .   .   T   T    .     1.63    *   *     F     3.06     2.14
 Asn     452   .       .   B   .   .   T    .     1.42    *   *     F     2.02     1.85
 Pro     453   .       .   B   .   .   T    .     1.21    *   *     F     0.63     0.99
 Ile     454   .       .   B   .   .   .    .     0.82    *   *     F     0.09     0.88
 Gln     455   .       .   B   .   .   .    .     1.03    *   *     F     -0.25     0.54
 Leu     456   .       .   B   .   .   T    .     0.22    *   *     F     0.25     0.59
 Pro     457   .       .   B   .   .   T    .     0.01    *   *     F     0.25     0.69
 Gly     458   .       .   B   .   .   T    .     -0.12    .   *     F     0.25     0.62
 Asp     459   .       .   B   .   .   T    .     0.46    .   *     F     0.25     0.74
 Leu     460   .       .   .   .   .   T    C     0.16    .   *     F     1.05     0.69
 Pro     461   .       .   B   .   .   T    .     0.72    .   *     F     0.85     0.93
 Res     Pos. Garni.. Alpha   Chou-...   Alpha    Garni..    Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn    Garni..    Coil   Kyte-...   Hydro...   Eisen..   Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Gly     462 .   .    B   .   .   T    .   0.93   .   .     F     0.25   0.88
 Thr     463 .   .    B   .   .   T    .   0.69   .   *     F     0.74   1.78
 Ser     464 .   .    B   .   .   .    .   0.69   *   .     F     1.48   1.16
 Tyr     465 .   .    .   .   T   .    .   1.61   *   .     F     2.22   1.88
 Asp     466 .   .    .   .   T   T    .   1.82   .   .     .     2.61   2.56
 Ala     467 .   .    .   .   T   T    .   1.50   *   .     F     3.40   3.31
 Asn     468 .   .    .   .   T   T    .   1.81   .   *     F     2.76   1.13
 Arg     469 .   .    B   .   .   T    .   1.41   .   *     F     2.32   1.17
 Gln     470 .   .    B   B   .   .    .   1.34   *   *     .     0.53   1.01
 Cys     471 .   .    B   B   .   .    .   0.64   *   *     .     0.04   0.90
 Gln     472 .   .    B   B   .   .    .   0.89   .   .     .     -0.60   0.40
 Phe     473 .   .    B   B   .   .    .   0.89   .   .     .     -0.26   0.23
 Thr     474 .   .    B   B   .   .    .   0.78   .   .     .     0.08   0.74
 Phe     475 .   .    .   B   T   .    .   0.48   .   .     .     1.72   0.71
 Gly     476 .   .    .   .   T   T    .   1.19   .   *     F     2.76   1.10
 Glu     477 .   .    .   .   T   T    .   1.16   .   *     F     3.40   1.52
 Asp     478 .   .    .   .   T   T    .   1.19   *   .     F     3.06   2.39
 Ser     479 .   .    .   .   T   T    .   1.29   *   .     F     2.72   1.30
 Lys     480 .   .    .   .   T   .    .   1.99   *   .     F     2.43   1.16
 His     481 .   .    .   .   T   .    .   1.74   *   .     F     2.34   1.16
 Cys     482 .   .    .   .   .   T    C   1.16   *   .     F     2.10   0.87
 Pro     483 A   .    .   .   .   T    .   0.86   .   .     F     2.15   0.44
 Res     Pos.  Garni..  Alpha    Chou-...    Alpha    Garni..    Beta     Chou-...     Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha    Eisen..    Beta Karpl... Flexi...     James...     Antig...   Emini   Surfa...
 Asp     484  .    .    .     .   T     T   .     0.84  *    . F     2.50   0.43
 Ala     485  A    .    .     .   .     T   .     0.13  *    . F     2.00   1.17
 Ala     486  A    .    .     .   .     .   .     -0.13  .    . F     1.40   0 41
 Ser     487  .    .    B     .   T     T   .     0.22  .    . F     1.75   0.33
 Thr     488  .    .    B     .   .     T   .     -0.38  *    . F     0.50   0.46
 Cys     489  .    .    B     .   .     T   .     -0.67  *    . F     -0.05   0.38
 Ser     490  .    .    B     .   .     T   .     -0.74  .    . F     -0.05   0.30
 Thr     491  .    .    B     B   .     .   .     -0.47  .    . .     -0.60   0.11
 Leu     492  .    .    B     B   .     .   .     -0.51  .    . .     -0.60   0.30
 Trp     493  .    .    B     B   .     .   .     -0.51  .    . .     -0.60   0.22
 Cys     494  .    .    B     B   .     .   .     -0.14  .    . .     -0.60   0.22
 Thr     495  .    .    B     B   T     .   .     -0.19  .    . F     -0.05   0.36
 Gly     496  .    .    .     B   T     .   .     -0.22  .    . F     -0.05   0.34
 Thr     497  .    .    .     .   T     T   .     -0.27  .    . F     0.65   0.62
 Ser     498  .    .    .     .   T     T   .     -0.79  .    . F     0.65   0.32
 Gly     499  .    .    .     .   T     T   .     -0.98  .    . F     0.35   0.27
 Gly     500  .    .    .     .   T     T   .     -1.33  .    . F     0.35   0.14
 Val     501  .    .    B     B   .     .   .     -0.99  .    . .     -0.60   0.05
 Leu     502  .    .    B     B   .     .   .     -0.99  .    . .     -0.60   0.10
 Val     503  .    .    B     B   .     .   .     -0.64  .    . .     -0.60   0.14
 Cys     504  .    .    B     .   .     T   .     -0.33  .    . .     -0.20   0.38
 Gln     505  .    .    B     .   .     T   .     -0.69  .    . .     0.10   0.62
   Res     Pos.   Garni..   Alpha    Chou-...    Alpha    Garni..    Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn    Garni..    Coil     Kyte-...     Hydro...   Eisen..   Alpha    Eisen..    Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
  Thr     506   .    .    B   .   .   T    .     -0.04   .    .     F     0.25     0.72
  Lys     507   .    .    B   .   .   T    .     0.48   .    .     F     0.40     2 09
  His     508   .    .    .   .   .   .    C     0.74   .    .     .     -0.05     1.27
  Phe     509   .    .    B   .   .   .    .     1.41   .    .     .     -0.40     0.89
  Pro     510   .    .    .   .   T   .    .     1.07   .    .     .     0.30     0.74
  Trp     511   .    .    .   .   T   T    .     1.07   .    .     .     0.20     0.54
  Ala     512   .    .    .   .   T   T    .     0.72   .    .     .     0.51     0.90
  Asp     513   .    .    .   .   T   T    .     0.09   .    .     F     1.27     0.78
  Gly     514   .    .    .   .   T   T    .     0.44   .    .     F     1.58     0.40
  Thr     515   .    .    .   .   T   T    .     0.66   .    .     F     2.49     0.39
  Ser     516   .    .    .   .   T   T    .     0.60   .    *     F     3.10     0.40
  Cys     517   .    .    .   .   T   T    .     1.23   .    *     F     2.49     0.40
  Gly     518   .    .    .   .   T   T    .     0.94   .    *     F     2.48     0.56
  Glu     519   .    .    .   .   T   .    .     0.62   .    *     F     1.67     0.44
  Gly     520   .    .    .   .   T   .    .     0.04   .    *     F     1.36     0.44
  Lys     521   .    .    .   .   T   .    .     0.34   .    *     F     0.45     0.31
  Trp     522   .    .    .   .   T   .    .     0.67   .    *     .     0.90     0.29
  Cys     523   .    .    B   .   .   T    .     1.06   .    *     .     -0.20     0.29
  Ile     524   .    .    B   .   .   T    .     0.39   .    *     .     0.70     0.29
  Asn     525   .    .    .   .   T   T    .     -0.12   .    *     .     0.20     0.15
  Gly     526   .    .    .   .   T   T    .     -0.17   *    *     F     0.65     0.20
  Lys     527   .    .    .   .   T   .    .     0.17   *    *     F     0.45     0.47
 Res     Pos.   Garni..   Alpha    Chou-...    Alpha     Garni..     Beta     Chou-...     Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro... Eisen.. Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
 Cys     528   .    .     .     .   T     T   .     0.52 .   *     .     1.40     0.58
 Val     529   .    .     B     .   .     T   .     1.41 *   *     .     1.04     0.85
 Asn     530   .    .     B     .   .     T   .     1.52 *   .     F     1.83     0.71
 Lys     531   .    .     B     .   .     T   .     1.91 *   .     F     2.32     2.58
 Thr     532   .    .     B     .   .     T   .     1.83 *   .     F     2.66     6.96
 Asp     533   .    .     .     .   T     T   .     1.80 *   .     F     3.40     5.89
 Arg     534   .    .     .     .   T     T   .     2.66 *   .     F     3.06     2.55
 Lys     535   .    .     B     .   .     T   .     2.34 *   .     F     2.32     2.95
 His     536   .    .     B     .   .     .   .     2.09 *   .     F     1.78     2.55
 Phe     537   .    .     B     .   .     .   .     1.70 *   .     F     1.44     2.01
 Asp     538   .    .     B     .   .     .   .     1.67 *   .     F     0.65     0.87
 Thr     539   .    .     B     .   .     .   .     1.21 *   .     F     -0.25     0.87
 Pro     540   .    .     .     .   .     .   C     0.87 *   *     F     -0.05     1.00
 Phe     541   .    .     .     .   T     .   .     0.61 .   *     F     0.45     0.80
 His     542   .    .     .     .   T     T   .     0.97 .   *     .     0.20     0.58
 Gly     543   .    .     .     .   T     T   .     0.37 .   *     .     0.20     0.37
 Ser     544   .    .     .     .   T     T   .     0.39 .   *     .     0.20     0.43
 Trp     545   .    .     .     .   T     T   .     0.26 .   *     .     0.20     0.33
 Gly     546   .    .     .     .   .     .   C     0.74 .   *     .     -0.20     0.33
 Met     547   .    .     .     .   T     .   .     0.49 .   .     .     0.00     0.38
 Trp     548   .    .     .     .   T     .   .     0.49 .   .     .     0.00     0.38
 Gly     549   .    .     .     .   .     T   C     0.79 .   .     .     0.00     0.38
 Res     Pos.    Garni..    Alpha    Chou-...    Alpha    Garni..    Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn    Garni..    Coil     Kyte-...     Hydro...   Eisen..   Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
 Pro     550    .    .    .   .   T   T    .     0.41   .   .     F     0.35     0.64
 Trp     551    .    .    .   .   T   T    .     0.46   *   .     F     0.66     0.33
 Gly     552    .    .    .   .   T   T    .     1.17   *   .     F     1.27     0.44
 Asp     553    .    .    .   .   T   .    .     1.14   *   .     F     1.98     0.56
 Cys     554    .    .    .   .   T   T    .     0.82   *   .     F     2.49     0.77
 Ser     555    .    .    .   .   T   T    .     0.69   *   .     F     3.10     0.42
 Arg     556    .    .    .   .   T   T    .     0.63   *   .     F     2.79     0.25
 Thr     557    .    .    .   .   T   T    .     0.63   *   .     F     2.18     0.46
 Cys     558    .    .    .   .   T   T    .     -0.22   *   .     F     1.87     0.34
 Gly     559    .    .    .   .   T   T    .     0.44   *   .     F     1.56     0.13
 Gly     560    .    .    .   .   T   T    .     0.50   *   .     F     0.65     0.15
 Gly     561    .    .    .   .   T   T    .     0.08   *   *     F     0.35     0.45
 Val     562    .    .    B   B   .   .    .     -0.21   *   *     .     -0.60     0.65
 Gln     563    .    .    B   B   .   .    .     0.57   *   *     .     -0.60     0.65
 Tyr     564    .    .    B   B   .   .    .     0.91   *   *     .     -0.15     1.29
 Thr     565    .    .    B   B   .   .    .     0.59   *   *     .     0.79     3.01
 Met     566    .    .    B   B   .   .    .     0.93   *   *     .     0.98     0.93
 Arg     567    .    .    B   B   .   .    .     1.79   *   *     .     1.62     0.99
 Glu     568    .    .    .   .   T   .    .     1.58   *   *     F     2.86     1.11
 Cys     569    .    .    .   .   T   T    .     0.97   *   .     F     3.40     1.73
 Asp     570    .    .    .   .   T   T    .     1.07   *   .     F     2.91     0.66
 Res     Pos.  Garni..  Alpha     Chou-...     Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn    Garni..    Coil     Kyte-...     Hydro...    Eisen..    Alpha    Eisen..    Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Asn     571  .     .   .   .   .   T    C     1.71    *    .     F     2.37   0.59
 Pro     572  .     .   .   .   .   T    C     1.60    *    .     F     2.52   2.18
 Val     573  .     .   .   .   .   .    C     1.26    *    .     F     2.32   2.10
 Pro     574  .     .   .   .   T   T    .     1.58    *    .     F     2.42   1.29
 Lys     575  .     .   .   .   T   T    .     1.62    *    .     F     2.61   0.83
 Asn     576  .     .   .   .   T   T    .     1.38    *    .     F     3.40   2.23
 Gly     577  .     .   .   .   T   T    .     0.92    *    .     F     3.06   2.26
 Gly     578  .     .   .   .   T   T    .     1.78    *    .     F     2.27   0.61
 Lys     579  .     .   B   .   .   T    .     1.64    .    .     F     1.53   0.65
 Tyr     580  .     .   B   .   .   T    .     1.64    .    .     F     1.19   0.65
 Cys     581  .     .   B   .   .   T    .     1.76    .    .     F     1.30   1.32
 Glu     582  .     .   B   .   .   .    .     1.24    .    *     F     1.10   1.29
 Gly     583  .     .   B   B   .   .    .     1.70    .    *     F     0.75   0.61
 Lys     584  .     .   B   B   .   .    .     1.41    .    *     F     0.90   2.24
 Arg     585  .     .   B   B   .   .    .     1.77    .    *     F     1.15   2.02
 Tyr     586  .     .   B   B   .   .    .     2.13    .    *     .     1.25   4.01
 Arg     587  .     .   B   B   .   .    .     1.47    *    *     .     1.50   2.68
 Tyr     588  .     .   B   .   .   T    .     1.81    *    *     .     2.00   0.73
 Arg     589  .     .   .   .   T   T    .     0.96    *    *     .     2.50   1.59
 Ser     590  .     .   .   .   T   T    .     0.84    *    *     .     2.10   0.67
 Cys     591  .     .   .   .   T   T    .     1.70    .    *     .     1.85   0.74
 Asn     592  .     A   .   .   T   .    .     0.92    .    *     .     1.50   0.63
 Res     Pos. Garni.. Alpha     Chou-...     Alpha    Garni..    Beta     Chou-...     Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro... Eisen.. Alpha   Eisen..   Beta    Karpl...    Flexi...     James...     Antig...   Emini   Surfa...
 Leu     593 .     A    B     .   .     .   .     0.96 .   .    .     0.89   0.25
 Glu     594 .     A    B     .   .     .   .     0.84 .   .    F     1.13   0.73
 Asp     595 .     A    .     .   T     .   .     1.17 .   .    F     2.17   0.76
 Cys     596 .     .    B     .   .     T   .     1.81 .   .    F     2.66   1.48
 Pro     597 .     .    .     .   T     T   .     1.47 *   *    F     3.40   1.37
 Asp     598 .     .    .     .   T     T   .     2.32 *   *    F     2.91   0.81
 Asn     599 .     .    .     .   T     T   .     2.01 *   .    F     3.02   3.03
 Asn     600 .     .    .     .   T     T   .     1.31 *   .    F     2.98   2.83
 Gly     601 .     .    .     .   T     T   .     2.09 *   .    F     2.94   1.47
 Lys     602 .     .    .     .   .     T   C     2.30 *   *    F     2.70   1.79
 Thr     603 .     .    .     .   .     T   C     2.30 *   .    F     3.00   1.92
 Phe     604 A     A    .     .   .     .   .     2.30 *   .    F     2.10   3.37
 Arg     605 A     A    .     .   .     .   .     1.63 *   .    F     1.80   2.91
 Glu     606 A     A    .     .   .     .   .     1.98 *   .    F     1.50   1.08
 Glu     607 A     A    .     .   .     .   .     1.34 *   .    F     1.20   2.17
 Gln     608 A     A    .     .   .     .   .     1.62 *   .    F     0.90   1.12
 Cys     609 A     A    .     .   .     .   .     2.32 *   *    .     0.60   0.88
 Glu     610 A     A    .     .   .     .   .     2.21 .   *    .     0.60   0.81
 Ala     611 A     A    .     .   .     .   .     1.51 .   *    .     0.60   0.81
 His     612 A     A    .     .   .     .   .     1.21 *   .    .     0.45   1.32
 Asn     613 A     A    .     .   .     .   .     1.26 *   *    .     0.45   1.02
 Glu     614 A     A    .     .   .     .   .     1.33 *   .    .     0.45   2.02
  Res     Pos. Garni.. Alpha Chou-... Alpha     Garni..     Beta   Chou-...   Beta   Garni...   Turn      Chou-...      Turn   Garni..   Coil     Kyte-...     Hydro...    Eisen..    Alpha    Eisen..    Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
  Phe     615 A A     .   .   .      .   .     1.03    *    *     F     0.60   1.50
  Ser     616 A A     .   .   .      .   .     0.92    .    .     F     0.90   1.25
  Lys     617 A A     .   .   .      .   .     0.61    .    .     F     0.45   0.62
  Ala     618 . A     .   .   T      .   .     0.31    .    .     F     0.25   0.71
  Ser     619 . A     .   .   T      .   .     -0.03    .    .     F     0.85   0.71
  Phe     620 . .     .   .   T      .   .     0.46    .    .     F     1.26   0.35
  Gly     621 . .     .   .   T      T   .     0.17    .    .     F     1.07   0.54
  Ser     622 . .     .   .   .      T   C     -0.73    .    *     F     1.08   0.41
  Gly     623 . .     .   .   .      T   C     -0.14    .    .     F     0.99   0.35
  Pro     624 . .     .   .   .      T   C     -0.13    .    .     F     2.10   0.61
  Ala     625 . A     .   .   .      .   C     -0.32    .    .     F     0.89   0.48
  Val     626 . A     B   .   .      .   .     -0.19    *    .     .     0.03   0.34
  Glu     627 . A     B   .   .      .   .     0.16    *    .     .     -0.18   0.34
  Trp     628 . A     B   .   .      .   .     0.26    *    .     .     -0.09   0.67
  Ile     629 . .     B   .   .      .   .     -0.12    *    .     .     -0.25   1.42
  Pro     630 . .     B   .   .      T   .     0.12    *    .     .     0.10   0.83
  Lys     631 . .     .   .   T      T   .     0.12    *    .     .     0.20   0.78
  Tyr     632 . .     .   .   T      T   .     -0.18    *    .     .     0.20   0.82
  Ala     633 . .     .   .   T      T   .     -0.10    *    .     .     0.84   0.71
  Gly     634 . .     .   .   T      .   .     0.83    *    .     .     0.98   0.55
  Val     635 . .     B   .   .      .   .     1.04    .    *     .     0.92   0.70
  Ser     636 . .     B   .   .      T   .     1.11    .    *     F     2.66   1.17
  Res     Pos. Garni.. Alpha  Chou-...  Alpha   Garni..   Beta  Chou-...  Beta   Garni...   Turn     Chou-...     Turn    Garni..    Coil     Kyte-...     Hydro...   Eisen..   Alpha   Eisen..   Beta   Karpl...   Flexi...     James...     Antig...     Emini     Surfa...
  Pro     637 .  .   .  .   T     T    .     0.69   .   *   F     3.40     2.31
  Lys     638 .  .   .  .   T     T    .     1.32   .   *   F     3.06     1.67
  Asp     639 .  .   .  .   T     T    .     0.86   .   *   F     2.72     2.49
  Arg     640 A  A   .  .   .     .    .     0.82   .   *   F     1.58     1.33
  Cys     641 A  A   .  .   .     .    .     0.46   *   *   F     1.09     0.46
  Lys     642 .  A   B  .   .     .    .     0.67   *   *   .     0.30     0.15
  Leu     643 .  A   B  .   .     .    .     0.03   .   *   .     0.30     0.13
  Ile     644 .  A   B  .   .     .    .     0.08   .   *   .     -0.60     0.25
  Cys     645 .  A   B  .   .     .    .     -0.38   .   *   .     0.30     0.25
  Gln     646 .  A   B  .   .     .    .     -0.60   *   *   .     -0.30     0.30
  Ala     647 .  A   B  .   .     .    .     -0.99   *   *   .     -0.30     0.30
  Lys     648 .  A   B  .   .     .    .     -0.42   *   *   F     -0.15     0.55
  Gly     649 .  .   .  .   T     T    .     -0.23   *   .   F     0.65     0.50
  Ile     650 .  .   .  .   T     T    .     -0.27   .   *   .     0.20     0.43
  Gly     651 .  .   B  .   .     T    .     -1.12   .   *   .     -0.20     0.18
  Tyr     652 .  .   B  .   .     T    .     -1.34   .   .   .     -0.20     0.14
  Phe     653 .  .   B  B   .     .    .     -1.39   .   .   .     -0.60     0.16
  Phe     654 .  .   B  B   .     .    .     -1.26   .   *   .     -0.60     0.29
  Val     655 .  .   B  B   .     .    .     -0.32   .   *   .     -0.60     0.28
  Leu     656 .  .   B  B   .     .    .     -0.83   .   *   .     -0.60     0.65
  Gln     657 .  .   B  .   .     T    .     -1.44   .   .   .     -0.20     0.56
  Pro     658 .  .   B  .   .     T    .     -0.74   *   .   F     -0.05     0.56
  Res     Pos. Garni.. Alpha Chou-... Alpha  Garni..  Beya  Chou-...  Beya   Garni...   Turn     Chou-...     Turn    Garni..    Coil    Kyte-...    Hydro... Eisen.. Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
  Lys     659 . .  .  .   T     T    .     -0.39 .   *     F     1.40   1.13
  Val     660 . .  B  .   .     T    .     0.16 .   .     F     0.85   0.65
  Val     661 . .  B  .   .     T    .     0.76 .   *     F     0.85   0.60
  Asp     662 . .  B  .   .     T    .     0.09 .   .     F     1.06   0.47
  Gly     663 . .  B  .   .     T    .     0.00 *   .     F     0.67   0.34
  Thr     664 . .  B  .   .     T    .     -0.26 *   .     F     1.48   0.61
  Pro     665 . .  B  .   .     .    .     0.60 .   .     F     1.49   0.56
  Cys     666 . .  .  .   T     .    .     1.16 .   .     F     2.10   0.95
  Ser     667 . .  .  .   .     T    C     0.84 .   .     F     1.89   0.88
  Pro     668 . .  .  .   T     T    .     0.89 .   .     F     1.88   0.82
  Asp     669 . .  .  .   T     T    .     0.34 .   .     F     1.82   2.06
  Ser     670 . .  .  .   T     T    .     -0.11 .   .     F     1.61   1.14
  Thr     671 . .  .  B   T     .    .     -0.30 .   *     F     0.85   0.39
  Ser     672 . .  B  B   .     .    .     0.00 .   *     F     -0.15   0.18
  Val     673 . .  B  B   .     .    .     -0.13 .   *     .     -0.60   0.23
  Cys     674 . .  B  B   .     .    .     -0.13 .   *     .     -0.60   0.16
  Val     675 . .  B  B   .     .    .     -0.50 .   *     .     -0.60   0.20
  Gln     676 . .  B  B   .     .    .     -1.04 .   *     F     -0.45   0.15
  Gly     677 . .  B  B   .     .    .     -0.70 .   *     F     -0.45   0.20
  Gln     678 . .  B  B   .     .    .     -0.43 .   *     F     -0.15   0.54
  Cys     679 . .  B  B   .     .    .     -0.11 .   .     .     0.30   0.32
  Val     680 . .  B  B   .     .    .     0.08 *   *     .     0.30   0.32
  Res     Pos. Garni.. Alpha Chou-... Alpha    Garni..    Beta     Chou-...     Beta   Garni...   Turn     Chou-...     Turn    Garni..    Coil     Kyte-...     Hydro...    Eisen..    Alpha   Eisen..   Beta   Karpl...   Flexi...     James...     Antig...     Emini     Surfa...
  Lys     681 . .    B     .   .     T    .     0.08    *   .   .     0.10     0.10
  Ala     682 . .    B     .   .     T    .     0.53    *   .   .     0.70     0.30
  Gly     683 . .    B     .   .     T    .     -0.36    *   .   .     1.00     0.80
  Cys     684 . .    B     .   .     T    .     -0.58    *   .   .     1.00     0.28
  Asp     685 A .    .     B   .     .    .     0.28    *   .   .     0.30     0.20
  Arg     686 A .    .     B   .     .    .     -0.07    *   .   .     0.60     0.33
  Ile     687 A .    .     B   .     .    .     0.57    *   .   .     0.60     0.82
  Ile     688 A .    .     B   .     .    .     0.96    *   .   F     0.75     0.99
  Asp     689 A .    .     .   .     T    .     1.67    *   *   F     1.30     1.01
  Ser     690 A .    .     .   .     T    .     0.97    *   *   F     1.30     2.88
  Lys     691 A .    .     .   .     T    .     0.86    *   .   F     1.61     3.55
  Lys     692 . .    .     .   T     T    .     1.79    *   *   F     2.32     3.55
  Lys     693 . .    .     .   T     .    .     2.01    *   *   F     2.43     5.30
  Phe     694 . .    .     .   T     .    .     1.67    *   *   F     2.74     1.42
  Asp     695 . .    .     .   T     T    .     1.11    *   .   F     3.10     0.70
  Lys     696 . .    B     .   .     T    .     0.40    *   .   F     2.39     0.26
  Cys     697 . .    B     .   .     T    .     0.01    *   .   .     1.63     0.16
  Gly     698 . .    B     .   .     T    .     -0.38    *   .   .     1.32     0.10
  Val     699 . .    B     .   .     .    .     0.32    *   .   .     0.21     0.05
  Cys     700 . .    .     .   T     .    .     -0.02    .   .   .     0.00     0.14
  Gly     701 . .    .     .   T     T    .     -0.37    .   .   F     0.65     0.14
  Gly     702 . .    .     .   T     T    .     -0.01    .   .   F     0.65     0.26
 Res     Pos. Garni.. Alpha Chou-... Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn     Chou-...     Turn    Garni..    Coil    Kyte-...    Hydro...  Eisen..  Alpha    Eisen..    Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
 Asn     703 . .   .   .   T     T    .    -0.33  .    .     F     0.65     0.69
 Gly     704 . .   .   .   T     T    .     0.57  .    .     F     0.65     0.37
 Ser     705 . .   .   .   T     T    .     1.28  .    .     F     1.25     0.76
 Thr     706 . .   B   .   .     T    .     0.73  .    .     F     1.41     0 94
 Cys     707 . .   B   .   .     T    .     0.78  .    *     F     1.37     0.67
 Lys     708 . .   B   .   .     T    .     0.43  .    *     F     1.63     0.67
 Lys     709 . .   B   .   .     .    .     0.48  *    *     F     1.69     0.46
 Ile     710 . .   B   .   .     T    .    -0.08  *    *     F     2.60     1.14
 Ser     711 . .   B   .   .     T    .    -0.08  *    *     F     1.89     0.42
 Gly     712 . .   B   .   .     T    .     0.29  *    *     F     1.03     0.31
 Ser     713 . .   B   .   .     T    .    -0.34  *    *     F     0.77     0 58
 Val     714 . .   B   B   .     .    .    -0.34  .    *     F     0.11     0.44
 Thr     715 . .   B   B   .     .    .     0.33  .    .     F     0.73     0.89
 Ser     716 . .   B   B   .     .    .     0.29  .    .     F     1.16     1.03
 Ala     717 . .   B   .   .     .    .     0.39  .    .     F     1.64     1.37
 Lys     718 . .   .   .   .     T    C     0.66  .    .     F     2.32     1.49
 Pro     719 . .   .   .   T     T    .     1.51  *    .     F     2.80     1.51
 Gly     720 . .   .   .   T     T    .     0.93  *    .     F     2.52     2.50
 Tyr     721 . .   B   .   .     T    .     0.34  *    .     .     1.54     0.88
 His     722 . .   B   B   .     .    .     0.62  *    .     .    -0.04     0.40
 Asp     723 . .   B   B   .     .    .    -0.31  *    .     .    -0.32     0.58
 Ile     724 . .   B   B   .     .    .    -0.31  *    .     .    -0.60     0.26
 Res  Pos.   Garni..   Alpha   Chou-...   Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn  Chou-...  Turn    Garni..    Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta   Karpl...   Flexi...     James...     Antig...   Emini   Surfa...
 Ile  725   .   .   B   B   .  .    .     -0.28  *   .   .     -0.60   0.29
 Thr  726   .   .   B   B   .  .    .     -0.38  *   .   .     -0.60   0.25
 Ile  727   .   .   B   .   .  T    .     -0.93  *   .   .     -0.20   0.36
 Pro  728   .   .   B   .   .  T    .     -1.24  *   .   F     -0.05   0.52
 Thr  729   .   .   .   .   .  T    C     -0.36  *   .   F     0.15   0.52
 Gly  730   .   .   .   .   .  T    C     -0.36  .   *   F     0.30   1.19
 Ala  731   .   .   .   B   .  .    C     -0.04  .   *   F     -0.25   0.54
 Thr  732   .   .   .   B   .  .    C     -0.01  .   *   F     0.65   0.65
 Asn  733   .   .   B   B   .  .    .     0.24  .   *   F     -0.15   0.48
 Ile  734   .   .   B   B   .  .    .     0.56  .   *   F     0.45   0.96
 Glu  735   .   .   B   B   .  .    .     1.01  .   *   F     0.60   1.15
 Val  736   .   .   B   B   .  .    .     1.60  .   *   F     0.90   1.40
 Lys  737   .   .   B   B   .  .    .     1.91  .   *   F     1.24   3.21
 Gln  738   .   .   B   .   .  .    .     2.02  .   *   F     1.78   3.21
 Arg  739   .   .   B   .   .  .    .     2.57  *   *   F     2.12   8.48
 Asn  740   .   .   B   .   .  T    .     2.27  *   *   F     2.66   4.20
 Gln  741   .   .   .   .   T  T    .     3.23  *   *   F     3.40   3.25
 Arg  742   .   .   .   .   T  T    .     3.19  *   .   F     3.06   3.25
 Gly  743   .   .   .   .   T  T    .     3.19  *   .   F     3.00   3.25
 Ser  744   .   .   .   .   T  .    .     2.73  *   .   F     2.74   3.02
 Arg  745   .   .   .   .   .  .    C     2.43  *   *   F     2.48   1.52
 Asn  746   .   .   .    .   T  T    .     1.73  *   .   F     2.82   2.06
 Res     Pos.  Garni..  Alpha  Chou-...  Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn     Chou-...     Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha    Eisen..    Beta   Karpl...   Flexi...     James...     Antig...     Emini     Surfa...
 Asn     747  .  .   .   .   T     T   .     0.81  *    .   F     2.80     1.33
 Gly     748  .  .   .   .   .     T   C     0.57  .    *   F     1.57     0.56
 Ser     749  .  .   B   .   .     T   .     -0.02  .    *   F     0.79     0.35
 Phe     750  .  A   B   .   .     .   .     -0.09  .    *   .     -0.04     0.15
 Leu     751  .  A   B   .   .     .   .     -0.68  .    .   .     -0.32     0.31
 Ala     752  .  A   B   .   .     .   .     -1.27  *    .   .     -0.60     0.23
 Ile     753  .  A   B   .   .     .   .     -0.92  .    .   .     -0.60     0.27
 Lys     754  A  A   .   .   .     .   .     -0.97  .    .   .     0.30     0.55
 Ala     755  A  A   .   .   .     .   .     -0.58  .    .   .     0.30     0.54
 Ala     756  A  A   .   .   .     .   .     -0.01  .    .   F     0.60     1.12
 Asp     757  A  .   .   .   .     T   .     -0.31  .    .   F     0.85     0.87
 Gly     758  .  .   B   .   .     T   .     -0.23  .    *   F     0.25     0.61
 Thr     759  .  .   B   .   .     T   .     -0.28  .    .   F     -0.05     0.50
 Tyr     760  .  .   B   .   .     T   .     -0.03  .    *   .     -0.20     0.48
 Ile     761  .  .   B   .   .     .   .     0.56  .    *   .     -0.40     0.48
 Leu     762  .  .   B   .   .     .   .     0.31  .    *   .     -0.40     0.55
 Asn     763  .  .   B   .   .     T   .     0.34  .    *   F     -0.50     0.55
 Gly     764  .  .   .   .   T     T   .     -0.16  .    *   F     0.50     1.14
 Asp     765  .  .   .   .   T     T   .     -0.21  .    *   F     0.50     1.14
 Tyr     766  .  .   .   .   .     T   C     0.37  .    *   F     0.45     0.95
 Thr     767  .  .   B   B   .     .   .     0.37  .    *   .     -0.15     1.38
 Leu     768  .  .   B   B   .     .   .     0.37  *    *   .     -0.60     0.68
 Res     Pos.  Garni..  Alpha  Chou-...  Alpha    Garni..    Beta     Chou-...     Beta    Garni...    Turn    Chou-...    Turn    Garni..    Coil     Kyte-...     Hydro...    Eisen..    Alpha   Eisen..   Beta   Karpl...   Flexi...     James...     Antig...     Emini     Surfa...
 Ser     769  .  .    B     B    .    .    .     0.71    *   .   F     -0.45     0.75
 Thr     770  .  .    B     B    .    .    .     0.71    *   *   F     -0.15     0.90
 Leu     771  A  .    .     B    .    .    .     0.07    *   .   F     0.60     1.83
 Glu     772  A  .    .     B    .    .    .     -0.22    *   .   F     0.45     0.96
 Gln     773  A  .    .     B    .    .    .     0.34    *   *   F     0.45     0.66
 Asp     774  A  .    .     B    .    .    .     0.69    .   *   F     0.00     1.25
 Ile     775  A  .    .     B    .    .    .     0.66    .   *   .     0.75     1.44
 Met     776  A  .    .     B    .    .    .     0.61    .   *   .     0.30     0.82
 Tyr     777  .  .    B     B    .    .    .     -0.24    .   *   .     -0.30     0.37
 Lys     778  .  .    B     B    .    .    .     -1.06    .   *   .     -0.60     0.39
 Gly     779  .  .    B     B    .    .    .     -0.94    .   *   .     -0.60     0.32
 Val     780  .  .    B     B    .    .    .     -0.30    .   *   .     -0.30     0.40
 Val     781  .  .    B     B    .    .    .     0.00    .   *   .     -0.30     0.32
 Leu     782  .  .    B     B    .    .    .     -0.10    .   *   .     -0.60     0.43
 Arg     783  .  .    B     B    .    .    .     -0.44    .   *   .     -0.60     0.57
 Tyr     784  .  .    B     .    .    T    .     -0.40    .   *   .     0.25     1.03
 Ser     785  .  .    .     .    T    T    .     -0.13    .   *   F     0.80     1.68
 Gly     786  .  .    .     .    .    T    C     0.13    .   *   F     1.05     0.86
 Ser     787  .  .    .     .    .    T    C     0.13    .   *   F     0.45     0.56
 Ser     788  .  A    .     .    .    .    C     0.02    *   *   F     0.05     0.34
 Ala     789  A  A    .     .    .    .    .     0.38    .   *   F     0.45     0.60
 Ala     790  A  A    .     .    .    .    .     -0.21    *   *   .     0.60     0.88
 Res     Pos. Garni.. Alpha   Chou-...   Alpha    Garni..    Beta   Chou-...   Beta   Garni...   Turn      Chou-...      Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha  Eisen..  Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Leu     791 A   A    .   .   .      .   .     0.24  *  *     .     0.30   0.46
 Glu     792 A   A    .   .   .      .   .     0.24  *  *     .     0.60   0.89
 Arg     793 .   A    B   B   .      .   .     -0.16  *  *     F     0.90   1.18
 Ile     794 A   A    .   B   .      .   .     0.13  *  *     F     0.60   1.24
 Arg     795 A   A    .   B   .      .   .     0.51  *  *     F     0.75   0.96
 Ser     796 .   A    .   .   T      .   .     0.51  .  *     F     1.13   0.76
 Phe     797 .   .    .   .   .      .   C     0.56  .  *     F     0.81   0.89
 Ser     798 .   .    .   .   .      T   C     0.44  .  *     F     1.89   0.91
 Pro     799 .   .    .   .   .      T   C     1.12  *  *     F     2.32   1.17
 Leu     800 .   .    .   .   T      T   .     0.20  *  *     F     2.80   2.10
 Lys     801 .   .    .   .   .      T   C     0.19  *  *     F     2.32   1.29
 Glu     802 .   .    .   .   .      .   C     0.00  .  *     F     1.84   1.20
 Pro     803 A   .    .   B   .      .   .     0.30  .  *     F     1.16   1.02
 Leu     804 A   .    .   B   .      .   .     -0.34  .  *     F     0.73   0.89
 Thr     805 .   .    B   B   .      .   .     -0.34  .  *     .     -0.30   0.38
 Ile     806 .   .    B   B   .      .   .     -0.70  .  *     .     -0.60   0.20
 Gln     807 .   .    B   B   .      .   .     -1.56  .  *     .     -0.60   0.35
 Val     808 .   .    B   B   .      .   .     -1.69  .  *     .     -0.60   0.18
 Leu     809 .   .    B   B   .      .   .     -0.88  .  *     .     -0.60   0.26
 Thr     810 .   .    B   B   .      .   .     -1.16  .  .     .     -0.60   0.24
 Val     811 .   .    B   B   .      .   .     -1.08  .  *     .     -0.60   0.33
 Gly     812 .   .    B   B   .      .   .     -0.97  *  *     .     -0.60   0.33
 Res     Pos.    Garni..    Alpha   Chou-...   Alpha    Garni..    Beta     Chou-...     Beta Garni... Turn  Chou-...  Turn   Garni..   Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Asn     813    A   .    .     . .  .   .     -0.32  *   *     .     0.12   0.44
 Ala     814    A   .    .     . .  .   .     0.53  *   *     .     0.34   0.92
 Leu     815    A   .    .     . .  .   .     -0.04  *   *     F     1.76   1.86
 Arg     816    .   .    B     . .  .   .     0.86  *   *     F     1.53   0.81
 Pro     817    .   .    B     . .  .   .     0.96  *   *     F     2.20   1.61
 Lys     818    .   .    B     B .  .   .     0.64  *   *     F     1.48   3.05
 Ile     819    .   .    B     B .  .   .     0.99  .   *     F     1.56   2.25
 Lys     820    .   .    B     B .  .   .     1.10  *   *     F     0.44   2.28
 Tyr     821    .   .    B     B .  .   .     0.13  *   *     .     -0.38   0.99
 Thr     822    .   .    B     B .  .   .     0.39  .   *     .     -0.45   1.04
 Tyr     823    A   .    .     B .  .   .     0.39  .   *     .     -0.45   1.04
 Phe     824    A   .    .     B .  .   .     1.32  .   *     .     -0.45   1.33
 Val     825    A   .    .     B .  .   .     1.32  .   .     .     0.45   1.85
 Lys     826    A   .    .     B .  .   .     1.57   .   .     F     0.90   2.36
 Lys     827    A   A    .     . .  .   .     1.58  *   .     F     0.90   4.71
 Lys     828    A   A    .     . .  .   .     1.12  *   .     F     0.90   8.51
 Lys     829    A   A    .     . .  .   .     1.82  *   .     F     0.90   3.68
 Glu     830    A   A    .     . .  .   .     2.09  *   .     F     0.90   2.96
 Ser     831    A   A    .     . .  .   .     1.16  *   .     F     0.90   1.50
 Phe     832    A   A    .     . .  .   .     0.90  .   .     .     0.30   0.52
 Asn     833    .   A    B     . .  .   .     0.54  *   .     .     -0.30   0.47
 Ala     834    .   .    B     . .  .   .     -0.20  *   *     .     -0.40   0.50
 Res     Pos.    Garni..    Alpha      Chou-...      Alpha    Garni..    Beta     Chou-...     Beta   Garni...   Turn     Chou-...     Turn    Garni..    Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta      Karpl...      Flexi...     James...     Antig...   Emini   Surfa...
 Ile     835    .      .    .      .   .     .    C     -0.50  *   .      .     -0.20   0.50
 Pro     836    .      .    .      .   .     T    C     -0.79  .   .      .     0.00   0.42
 Thr     837    .      .    .      .   T     T    .     -0.38  *   *      .     0.20   0.42
 Phe     838    A      .    .      .   .     T    .     -1.23  *   .      .     -0.20   0.63
 Ser     839    .      .    .      .   .     T    C     -1.53  *   .      .     0.00   0.30
 Ala     840    .      A    B      B   .     .    .     -0.64  .   .      .     -0.60   0.15
 Trp     841    .      A    B      B   .     .    .     -0.43  *   .      .     -0.60   0.29
 Val     842    A      A    .      B   .     .    .     -0.41  .   .      .     -0.30   0.38
 Ile     843    A      A    .      B   .     .    .     -0.06  *   .      .     -0.60   0.40
 Glu     844    A      A    .      B   .     .    .     0.24  *   .      .     -0.60   0.37
 Glu     845    A      A    .      .   .     .    .     0.17  *   .      .     0.30   0.87
 Trp     846    A      A    .      .   .     .    .     0.16  *   .      .     0.61   0.66
 Gly     847    A      A    .      .   .     .    .     1.06  *   .      F     1.37   0.51
 Glu     848    .      A    .      .   T     .    .     1.64  *   .      F     2.08   0.59
 Cys     849    .      A    .      .   T     .    .     0.98  *   .      F     2.09   0.76
 Ser     850    .      .    .      .   T     T    .     0.98  .   .      F     3.10   0.41
 Lys     851    .      .    .      .   T     T    .     0.46  .   .      F     2.79   0.41
 Ser     852    .      .    .      .   T     T    .     0.46  .   .      F     2.18   0.63
 Cys     853    .      .    .      .   T     T    .     0.17  *   *      .     2.02   0.47
 Glu     854    A      A    .      .   .     .    .     0.83  *   .      .     0.61   0.24
 Leu     855    A      A    .      .   .     .    .     1.24  .   .      .     -0.30   0.32
 Gly     856    .      A    .      .   .     .    .     1.31  .   *      .     0.85   1.16
 Res     Pos.  Garni..  Alpha     Chou-...     Alpha    Garni..    Beta     Chou-...     Beta  Garni...  Turn     Chou-...     Turn    Garni..    Coil     Kyte-...     Hydro...    Eisen..    Alpha    Eisen..    Beta     Karpl...     Flexi...     James...     Antig...     Emini     Surfa...
 Trp     857  A     A    .     .  .     .    .     0.80    *    *     .     0.75     1.31
 Gln     858  A     A    .     .  .     .    .     0.61    *    *     .     -0.15     1.31
 Arg     859  A     A    .     .  .     .    .     0.61    *    *     .     -0.30     0.98
 Arg     860  .     A    B     .  .     .    .     0.76    .    *     .     0.45     1.61
 Leu     861  .     A    B     .  .     .    .     1.21    *    .     .     0.60     0.50
 Val     862  .     A    B     .  .     .    .     1.50    *    .     .     0.60     0.50
 Glu     863  .     A    B     .  .     .    .     0.61    .    .     .     0.94     0.43
 Cys     864  .     A    B     .  .     .    .     0.50    .    .     .     0.98     0.36
 Arg     865  .     A    .     .  T     .    .     0.04    .    .     F     2.17     0.78
 Asp     866  .     .    .     .  T     T    .     0.86    .    .     F     2.91     0.45
 Ile     867  .     .    .     .  T     T    .     1.50    .    .     F     3.40     1.45
 Asn     868  .     .    .     .  T     T    .     0.91    .    .     F     3.06     1.14
 Gly     869  .     .    .     .  .     T    C     1.28    .    .     F     2.07     0.69
 Gln     870  .     .    .     .  .     T    C     1.17    .    *     F     1.28     1.32
 Pro     871  .     .    .     .  .     T    C     0.50    .    *     F     1.54     1.42
 Ala     872  .     .    .     .  .     T    C     0.80    .    *     F     1.05     0.77
 Ser     873  A     .    .     .  .     T    .     0.84    *    .     F     0.85     0.45
 Glu     874  A     A    .     .  .     .    .     1.19    *    .     F     0.75     0.58
 Cys     875  A     A    .     .  .     .    .     0.33    *    .     .     0.60     1.00
 Ala     876  A     A    .     .  .     .    .     0.59    *    .     .     0.60     0.55
 Lys     877  A     A    .     .  .     .    .     0.97    *    .     F     0.75     0.64
 Glu     878  A     A    .     .  .     .    .     0.68    *    .     F     0.90     1.84
  Res     Pos.     Garni..     Alpha     Chou-...     Alpha     Garni..     Beta      Chou-...      Beta    Garni...    Turn     Chou-...     Turn    Garni..    Coil     Kyte-...     Hydro...  Eisen..  Alpha    Eisen..    Beta   Karpl...   Flexi...     James...     Antig...   Emini   Surfa...
  Val     879     A     A     .      .    .     .    .     0.38  *    .   F     0.90   1.84
  Lys     880     A     A     .      .    .     .    .     0.73  *    .   F     0.90   1.23
  Pro     881     A     .     .      .    .     T    .     1.43  *    .   F     1.30   1.03
  Ala     882     .     .     .      .    T     T    .     1.18  *    .   F     2.01   2.71
  Ser     883     .     .     .      .    T     T    .     0.51  .    *   F     2.32   2.10
  Thr     884     .     .     .      .    T     T    .     0.78  .    *   F     2.18   0.73
  Arg     885     .     .     B      .    .     T    .     0.73  .    *   F     2.09   0.73
  Pro     886     .     .     .      .    T     T    .     0.91  .    *   F     3.10   0.91
  Cys     887     .     .     .      .    T     T    .     1.29  .    *   .     2.64   0.85
  Ala     888     .     .     .      .    T     T    .     0.92  .    *   .     2.43   0.67
  Asp     889     .     .     .      .    T     .    .     1.02  .    *   .     1.72   0.23
  His     890     .     .     .      .    .     T    C     0.91  .    *   .     1.51   0.67
  Pro     891     .     .     .      .    T     T    .     0.83  .    .   .     1.65   1.16
  Cys     892     .     .     .      .    T     T    .     1.50  .    *   .     1.00   0.73
  Pro     893     .     .     .      .    T     T    .     1.28  .    *   .     0.60   0.93
  Gln     894     .     A     .      .    T     .    .     0.93  .    .   .     0.10   0.49
  Trp     895     .     A     B      .    .     .    .     0.97  .    .   .     -0.40   0.91
  Gln     896     .     A     B      .    .     .    .     0.89  .    .   .     -0.05   1.02
  Leu     897     .     A     B      .    .     .    .     1.26  .    .   .     -0.60   0.62
  Gly     898     .     .     .      .    T     .    .     1.17  .    .   .     0.00   0.79
  Glu     899     .     .     .      .    T     .    .     0.50  .    .   F     0.45   0.61
  Trp     900     .     .     .      .    T     .    .     0.49  .    .   F     0.45   0.40
  Res     Pos.    Garni..    Alpha   Chou-...   Alpha   Garni..   Beta     Chou-...     Beta     Garni...     Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro...    Eisen..    Alpha    Eisen..    Beta     Karpl....     Flexi...     James...     Antig...   Emini   Surfa...
  Ser     901    .   .   .     .     T   T   .     0.53    .    .     F     0.65   0.54
  Ser     902    .   .   .     .     T   T   .     1.03    .    .     F     1.25   0.62
  Cys     903    .   .   .     .     T   T   .     0.71    .    *     F     0.65   0.85
  Ser     904    .   .   .     .     T   T   .     0.37    *    *     F     1.25   0.34
  Lys     905    .   .   .     .     T   .   .     0.70    *    *     F     1.05   0.25
  Thr     906    .   .   .     .     T   .   .     0.66    *    *     F     1.69   0.94
  Cys     907    .   .   .     .     T   .   .     0.71    *    .     F     2.03   0.69
  Gly     908    .   .   .     .     T   T   .     1.42    *    *     F     2.27   0.54
  Lys     909    .   .   .     .     T   T   .     1.77    *    *     F     2.61   0.75
  Gly     910    .   .   .     .     T   T   .     1.83    *    *     F     3.40   2.81
  Tyr     911    .   .   .     .     T   T   .     1.84    .    .     F     3.06   5.57
  Lys     912    .   A   B     .     .   .   .     1.70    *    .     F     1.92   3.73
  Lys     913    .   A   B     .     .   .   .     2.09    *    .     F     1.58   3.11
  Arg     914    .   A   B     .     .   .   .     1.38    *    .     F     1.24   3.97
  Ser     915    .   A   B     .     .   .   .     0.91    *    .     F     0.90   1.06
  Leu     916    .   A   B     .     .   .   .     0.86    *    .     F     0.75   0.44
  Lys     917    .   A   B     .     .   .   .     0.78    *    .     .     0.30   0.30
  Cys     918    .   A   B     .     .   .   .     0.73    *    .     .     -0.30   0.30
  Leu     919    .   A   B     .     .   .   .     0.28    *    .     .     0.30   0.62
  Ser     920    .   .   B     .     .   .   .     0.23    .    .     .     0.50   0.31
  His     921    .   .   B     .     .   T   .     0.19    *    .     F     0.85   0.56
  Asp     922    .   .   .     .     T   T   .     -0.67    *    .     F     0.65   0.51
 Res     Pos. Garni.. Alpha  Chou-...  Alpha   Garni..   Beta     Chou-...     Beta Garni... Turn     Chou-...     Turn    Garni..    Coil     Kyte-...     Hydro...  Eisen..  Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Gly     923 .  .   .     . T     T    .     -0.30  .   .     F     0.65   0.31
 Gly     924 .  .   .     . T     T    .     0.48  .   .     F     0.65   0.31
 Val     925 .  .   B     . .     .    .     0.78  .   .     .     -0.10   0.25
 Leu     926 .  .   B     . .     .    .     0.51  .   .     .     -0.10   0.44
 Ser     927 .  .   B     . .     .    .     -0.16  .   .     .     -0.10   0.59
 His     928 .  .   B     . .     T    .     0.19  .   .     .     0.10   0.43
 Glu     929 .  .   B     . .     T    .     0.32  .   .     F     0.85   0.87
 Ser     930 A  .   .     . .     T    .     0.37  *   .     F     1.30   1.00
 Cys     931 A  .   .     . .     T    .     1.22  *   .     F     0.85   0.61
 Asp     932 A  .   .     . .     T    .     1.57  *   .     F     1.15   0.70
 Pro     933 A  .   .     . .     T    .     1.39  *   .     F     1.30   1.05
 Leu     934 A  .   .     . .     T    .     1.43  *   .     F     1.30   3.02
 Lys     935 A  .   .     . .     T    .     1.70  *   .     F     1.30   3.62
 Lys     936 A  A   .     . .     .    .     1.67  *   .     F     0.90   3.18
 Pro     937 A  A   .     . .     .    .     0.78  *   .     F     0.90   3.34
 Lys     938 A  A   .     . .     .    .     0.99  *   *     F     0.90   1.17
 His     939 A  A   .     . .     .    .     1.10  *   *     .     0.60   0.98
 Phe     940 .  A   B     . .     .    .     0.39  *   *     .     -0.30   0.55
 Ile     941 .  A   B     . .     .    .     0.03  *   *     .     -0.30   0.15
 Asp     942 A  A   .     . .     .    .     -0.36  *   *     .     -0.60   0.16
 Phe     943 A  A   .     . .     .    .     -0.99  *   *     .     -0.60   0.18
 Cys     944 A  A   .     . .     .    .     -0.96  .   .     .     -0.60   0.26
 Res     Pos.    Garni..    Alpha     Chou-...     Alpha   Garni..   Beta   Chou-...   Beta   Garni...   Turn   Chou-...   Turn     Garni..     Coil     Kyte-...     Hydro...    Eisen..    Alpha   Eisen..   Beta     Karpl...     Flexi...     James...     Antig...   Emini   Surfa...
 Thr     945    A     A   .   .   .   .     .     -0.92    .   *     .     0.30   0.27
 Met     946    A     A   .   .   .   .     .     -0.33    .   *     .     -0.60   0.16
 Ala     947    A     A   .   .   .   .     .     -0.72    .   .     .     -0.30   0.41
 Glu     948    A     A   .   .   .   .     .     -0.41    .   .     .     0.30   0.36
 Cys     949    A     A   .   .   .   .     .     -0.13    .   .     .     0.30   0.47
 Ser     950    A     A   .   .   .   .     .     -0.21    .   .     .     0.30   0.60
                                                                                                             表2
  Res  Pos.    Garni..    Alpha     Chou-...     Alpha   Garni..   Beta   Chou-...   Beta     Garni..     Turn     Chou-...     Turn    Garni..    Coil     Kyte-...     Hydro...   Eisen...   Alpha   Eisen...   Beta   Karpl...   Flexi...     James...     Antig...     Emini     Surfa...
  Met  1     .     .     B   .     .     .     .     -0.37   .   .     .     -0.40     0.50
  Phe  2     .     .     B   .     .     .     .     -0.57   .   .     .     -0.40     0.61
  Pro  3     .     .     B   .     .     .     .     -0.77   .   .     .     -0.40     0.48
  Ala  4     .     .     .   .     .     .     C     -0.59   .   *     .     -0.20     0.49
  Pro  5     .     .     .   .     .     .     C     -0.09   .   *     .     -0.20     0.87
  Ala  6     .     .     .   .     .     .     C     0.22   *   *     .     0.85     1.11
  Ala  7     .     .     .   .     .     T     C     0.11   *   *     .     0.45     1.15
  Pro  8     A     .     .   .     .     T     .     0.11   *   .     .     -0.20     0.61
  Arg  9     .     .     .   .     T     T     .     0.00   *   .     .     0.20     0.94
  Trp  10     .     .     B   .     .     T     .     -0.60   *   .     .     -0.20     0.81
  Leu  11     .     A     B   .     .     .     .     -0.82   *   .     .     -0.60     0.43
  Pro  12     .     A     B   .     .     .     .     -1.04   *   .     .     -0.60     0.18
  Phe  13     .     A     B   .     .     .     .     -1.64   *   .     .     -0.60     0.14
  Leu  14     A     A     .   .     .     .     .     -2.57   *   .     .     -0.60     0.14
  Leu  15     A     A     .   .     .     .     .     -3.09   .   .     .     -0.60     0.08
  Leu  16     A     A     .   .     .     .     .     -3.09   .   .     .     -0.60     0.07
  Leu  17     A     A     .   .     .     .     .     -3.69   .   .     .     -0.60     0.07
  Leu  18     A     A     .   .     .     .     .     -3.80   .   .     .     -0.60     0.07
  Leu  19     A     A     .   .     .     .     .     -3.20   .   .     .     -0.60     0.07
  Leu  20     A     A     .   .     .     .     .     -3.20   .   .     .     -0.60     0.14
  Res    Pos.   Garni..   Alpha  Chou-...  Alpha Garni.. Beta  Chou-...  Beta   Garni..   Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro... Eisen... Alpha  Eisen...  Beta  Karpl...  Flexi...    James...    Antig...    Emini    Surfa...
  Leu    21     A     A     .     .     .     .     .     -2.98    *     .     .     -0.60     0.14
  Leu    22     .     A     B     .     .     .     .     -2.06    *     .     .     -0.60     0.17
  Pro    23     .     A     B     .     .     .     .     -1.59    *     .     .     -0.60     0.39
  Leu    24     A     A     .     .     .     .     .     -1.37    *     .     .     -0.60     0.47
  Ala    25     A     A     .     .     .     .     .     -0.77    *     .     .     -0.04     0.58
  Arg    26     .     A     B     .     .     .     .     -0.54    *     .     .     0.82     0.58
  Gly    27     .     A     B     .     .     .     .     0.38    .     .     F     0.63     0.71
  Ala    28     .     .     B     .     .     .     .     0.38    .     .     F     2.14     1.37
  Pro    29     .     .     .     .     .     .     C     0.60    .     .     F     2.60     1.08
  Ala    30     .     .     B     .     .     .     .     0.60    .     .     F     1.84     1.11
  Arg    31     .     .     B     .     .     .     .     0.14    .     *     F     1.58     1.11
  Pro    32     .     .     B     .     .     .     .     0.14    .     *     F     1.17     0.71
  Ala    33     .     .     B     .     .     T     .     0.73    .     *     F     1.11     0.69
  Ala    34     A     .     .     .     .     T     .     0.36    .     *     F     0.85     0.61
  Gly    35     .     .     .     .     .     T     C     0.64    .     *     F     0.45     0.40
  Gly    36     .     .     .     .     .     T     C     0.53    .     .     F     0.45     0.53
  Gln    37     A     .     .     .     .     .     .     -0.07    .     .     F     0.65     0.91
  Ala    38     .     .     B     .     .     .     .     -0.33    .     .     F     0.65     0.76
  Ser    39     .     .     B     B     B     .     .     -0.60    .     .     F     -0.15     0.57
  Glu    40     .     .     B     B     B     .     .     -0.47    .     .     F     -0.15     0.24
  Leu    41     .     .     B     B     B     .     .     -0.43    .     *     .     -0.30     0.37
  Val    42     .     .     B     B     B     .     .     -0.32    .     *     .     -0.30     0.40
  Res   Pos.     Garni..     Alpha    Chou-...    Alpha   Garni..   Beta    Chou-...    Beta    Garni..    Turn    Chou-...    Turn   Garni..   Coil   Kyte-...   Hydro...   Eisen...   Alpha   Eisen...   Beta     Karpl...     Flexi...     James...     Antig...    Emini    Surfa...
  Val   43     .     .     B     B     B     .     .     -0.54     .     *     .     0.30     0.46
  Pro   44     .     .     B     B     B     .     .     -0.46     .     *     F     -0.24     0.46
  Thr   45     .     .     B     B     B     .     .     -0.80     .     *     F     0.27     0.95
  Arg   46     .     .     B     B     B     .     .     -0.29     .     *     F     0.63     1.26
  Leu   47     .     .     .     .     .     T     C     -0.02     *     *     F     2.04     1.10
  Pro   48     .     .     .     .     .     T     C     0.49     *     *     F     2.10     0.77
  Gly   49     .     .     .     .     .     T     C     0.70     *     *     F     1.89     0.39
  Ser   50     .     .     .     .     .     T     C     0.20     *     *     F     1.68     0.81
  Ala   51     A     A     .     .     .     .     .     -0.50     *     *     F     0.87     0.43
  Gly   52     A     A     .     .     .     .     .     -0.50     .     .     F     0.66     0.44
  Glu   53     A     A     .     .     .     .     .     -0.32     .     *     .     -0.30     0.27
  Leu   54     A     A     .     .     .     .     .     -0.79     .     *     .     -0.30     0.37
  Ala   55     A     A     .     .     .     .     .     -0.79     .     *     .     -0.60     0.31
  Leu   56     A     A     .     .     .     .     .     -0.79     .     *     .     -0.60     0.24
  His   57     A     A     .     .     .     .     .     -1.14     .     *     .     -0.60     0.29
  Leu   58     A     A     .     .     .     .     .     -1.49     *     *     .     -0.60     0.25
  Ser   59     A     A     .     .     .     .     .     -0.63     *     *     .     -0.60     0.30
  Ala   60     A     A     .     .     .     .     .     -0.39     *     *     .     -0.30     0.44
  Phe   61     A     A     .     .     .     .     .     -0.28     *     *     .     -0.30     0.53
  Gly   62     .     .     .     .     T     T     .     -1.10     *     .     .     0.50     0.34
  Lys   63     A     .     .     .     .     T     .     -1.10     .     *     F     -0.05     0.25
  Gly   64     .     .     B     .     .     T     .     -0.69     .     *     .     -0.20     0.24
 Res  Pos. Garni.. Alpha    Chou-...    Alpha   Garni..   Beta     Chou-...     Beta   Garni..   Turn    Chou-...    Turn   Garni..   Coil   Kyte-...   Hydro...  Eisen...  Alpha  Eisen...  Beta    Karpl...    Flexi...     James...     Antig...   Emini   Surfa...
 Phe  65     .     .     B     .     .     T     .     -0.91     .     *     .     0.70     0.47
 Val  66     .     .     B     B     .     .     .     -0.80     *     *     .     -0.30     0.19
 Leu  67     .     .     B     B     .     .     .     -0.67     *     *     .     -0.30     0.20
 Arg  68     .     .     B     B     .     .     .     -0.71     .     *     .     0.00     0.35
 Leu  69     .     .     B     B     .     .     .     -0.37     *     *     .     1.20     0.80
 Ala  70     .     .     .     .     .     T     C     0.03     .     *     .     2.55     1.61
 Pro  71     .     .     .     .     .     T     C     0.19     *     *     F     3.00     1.10
 Asp  72     .     .     .     .     T     T     .     0.19     .     *     F     2.60     1.16
 Asp  73     A     .     .     .     .     T     .     -0.51     .     *     F     1.75     0.95
 Ser  74     A     A     .     .     .     .     .     0.09     .     .     .     0.90     0.62
 Phe  75     A     A     .     .     .     .     .     0.68     .     .     .     0.60     0.57
 Leu  76     A     A     .     .     .     .     .     0.19     .     *     .     0.30     0.59
 Ala  77     A     A     .     .     .     .     .     0.23     .     *     .     -0.60     0.38
 Pro  78     A     A     .     .     .     .     .     0.66     .     *     .     -0.30     0.89
 Glu  79     A     A     .     .     .     .     .     -0.36     *     *     F     -0.15     0.75
 Phe  80     A     A     .     .     .     .     .     0.46     *     .     F     0.90     1.29
 Lys  81     A     A     .     .     .     .     .     0.46     *     *     F     0.90     1.63
 Ile  82     A     A     .     .     .     .     .     0.70     *     .     F     0.75     0.78
 Glu  83     A     A     .     .     .     .     .     0.57     *     *     F     0.45     0.89
 Arg  84     A     A     .     .     .     .     .     0.27     *     *     F     0.75     0.44
 Leu  85     .     A     .     .     T     .     .     0.62     *     *     F     0.85     0.84
 Gly  86     .     A     .     .     T     .     .     0.69     *     *     F     1.15     0.48
 Res   Pos. Garni.. Alpha     Chou-...     Alpha   Garni..   Beta  Chou-...  Beta    Garni..    Turn  Chou-...  Turn  Garni...  Coil   Kyte-...   Hydro...  Eisen...  Alpha   Eisen...   Beta    Karpl...    Flexi...    James...    Antig...  Emini  Surfa...
 Gly   87     .      .     .     .     .     T     C     0.99     *      *     F     1.35     0.48
 Ser   88     .      .     .     .     .     T     C     0.68     *      *     F     1.05     0.59
 Gly   89     .      .     .     .     .     T     C     0.22     *      *     F     1.05     0.86
 Arg   90     .      .     B     .     .     T     .     0.69     .      *     F     1.19     0.86
 Ala   91     .      .     .     .     .     T     C     1.03     .      *     F     1.73     0.63
 Thr   92     .      .     B     .     .     T     .     1.49     .      *     F     2.32     1.11
 Gly   93     .      .     B     .     .     T     .     1.44     .      *     F     2.66     1.11
 Gly   94     .      .     .     .     T     T     .     0.98     *      *     F     3.40     1.09
 G1u   95     .      .     B     .     .     .     .     0.98     *      .     F     2.31     0.62
 Arg   96     .      .     B     .     .     .     .     1.22     *      .     F     2.12     1.23
 Gly   97     .      .     .     .     T     .     .     0.87     *      *     F     2.18     1.23
 Leu   98     .      .     B     .     .     T     .     0.51     *      .     F     1.49     0.38
 Arg   99     .      .     B     .     .     T     .     0.16     *      .     .     0.70     0.17
 Gly   100     .      .     B     .     .     T     .     -0.14     *      .     .     -0.20     0.15
 Cys   101     .      .     B     .     .     T     .     -0.60     *      .     .     -0.20     0.24
 Phe   102     .      .     B     .     .     .     .     -0.57     .      *     .     -0.10     0.12
 Phe   103     .      .     B     .     .     T     .     -0.61     .      *     .     -0.20     0.18
 Ser   104     .      .     B     .     .     T     .     -0.72     .      *     F     -0.05     0.24
 Gly   105     .      .     .     .     .     T     C     -0.72     .      *     F     0.15     0.45
 Thr   106     .      .     .     .     .     T     C     -0.06     *      *     F     0.45     0.52
 Val   107     .      .     .     B     .     .     C     0.43     .      *     F     1.25     0.67
 Asn   108     .      .     .     B     .     .     C     1.13     .      *     F     1.70     1.05
 Res   Pos.  Garni..  Alpha    Chou-...    Alpha   Garni..   Beta    Chou-...    Beta   Garni..   Turn    Chou-...    Turn    Garni..    Coil   Kyte-...   Hydro... Eisen... Alpha Eisen... Beta   Karpl...   Flexi...    James...    Antig...  Emini  Surfa...
 Gly   109     .     .     .     B     .     .     C     1.13   .    *     F     2.30     1.26
 Glu   110     .     .     .     .     .     T     C     0.67   .    *     F     3.00     2.27
 Pro   111     A     .     .     .     .     T     .     0.39   .    *     F     2.50     1.16
 Glu   112     A     .     .     .     .     T     .     0.66   .    *     F     2.20     1.19
 Ser   113     A     .     .     .     .     T     .     -0.20   .    .     F     1.75     0.69
 Leu   114     A     A     .     B     .     .     .     -0.16   .    .     .     0.00     0.33
 Ala   115     A     A     .     B     .     .     .     -0.97   .    .     .     -0.30     0.26
 Ala   116     A     A     .     B     .     .     .     -1.42   .    .     .     -0.60     0.16
 Val   117     A     A     .     B     .     .     .     -1.31   .    .     .     -0.60     0.10
 Ser   118     .     A     B     B     .     .     .     -1.36   *    .     .     -0.30     0.20
 Leu   119     .     .     B     B     .     .     .     -1.36   *    .     .     -0.30     0.20
 Cys   120     .     .     B     .     .     T     .     -1.07   *    .     .     0.10     0.22
 Arg   121     .     .     B     .     .     T     .     -0.82   *    .     .     0.10     0.22
 Gly   122     .     .     .     .     T     T     .     -0.27   *    .     F     0.65     0.26
 Leu   123     .     .     .     .     T     T     .     -0.67   *    .     F     1.25     0.65
 Ser   124     .     .     .     .     .     T     C     -0.67   *    .     F     0.45     0.29
 Gly   125     .     .     B     .     .     T     .     -0.81   .    *     F     -0.05     0.24
 Ser   126     .     .     B     .     .     T     .     -0.92   .    *     F     -0.05     0.24
 Phe   127     .     .     B     .     .     T     .     -0.92   .    *     .     0.10     0.30
 Leu   128     .     A     B     .     .     .     C     -0.11   .    *     .     -0.30     0.30
 Leu   129     .     A     .     .     .     .     .     0.19   .    *     F     0.65     0.39
 Asp   130     A     A     .     .     .     .     .     -0.17   .    .     F     0.45     0.77
  Res   Pos.    Garni..    Alpha    Chou-...    Alpha   Garni..   Beta   Chou-...   Beta    Garni..    Turn   Chou-...   Turn     Garni..     Coil    Kyte-...    Hydro...   Eisen...   Alpha   Eisen...   Beta    Karpl...    Flexi...    James...    Antig...   Emini   Surfa...
  Gly   131     A     A     .       .       .     .       .     -0.18    .    .     F     0.45     0.81
  Glu   132     A     A     .       .       .     .       .     -0.37    .    *     F     0.90     1.42
  Glu   133     A     A     .       .       .     .       .     0.44    .    *     F     0.75     0.60
  Phe   134     A     A     .       .       .     .       .     1.04    .    *     .     0.45     1.04
  Thr   135     .     A     B       .       .     .       .     1.04    .    *     .     0.30     0.93
  Ile   136     .     .     B       .       .     .       .     1.04    .    *     F     0.05     0.93
  Gln   137     .     .     B       .       .     .       .     0.46    .    *     F     -0.10     1.06
  Pro   138     .     .     .       .       .     .       C     0.11    .    *     F     0.25     0.75
  Gln   139     .     .     .       .       T     .       .     0.47    .    *     F     0.60     1.05
  Gly   140     .     .     .       .       .     T       C     0.48    .    .     F     0.45     0.60
  Ala   141     .     .     .       .       T     T       .     0.56    .    .     F     1.25     0.52
  Gly   142     .     .     .       .       .     T       C     -0.03    .    .     F     0.45     0.25
  Gly   143     .     .     .       .       .     T       C     0.18    .    .     F     0.65     0.25
  Ser   144     .     .     .       .       .     .       C     -0.03    .    .     F     0.65     0.43
  Leu   145     .     .     B       .       .     .       .     0.28    *    .     F     0.65     0.68
  Ala   146     .     .     B       .       .     .       .     0.98    *    .     F     0.85     0.93
  Gln   147     .     .     B       .       .     T       .     0.51    .    *     F     2.00     1.36
  Pro   148     .     .     B       .       .     T       .     0.86    *    .     .     1.05     1.36
  His   149     .     .     B       .       .     T       .     1.27    *    .     .     1.45     2.34
  Arg   150     .     .     B       .       .     T       .     1.79    *    .     .     1.55     2.64
  Leu   151     .     .     B       .       .     .       .     2.03    *    .     .     0.85     1.80
  Gln   152     .     .     B       .       .     .       .     1.82    *    .     .     0.65     1.31
 Res   Pos. Garni.. Alpha    Chou-..    Alpha Garni.. Beta    Chou-...    Beta  Garni..  Turn    Chou-...    Turn   Garni..   Coil     Kyte-...     Hydro... Eisen... Alpha Eisen... Beta   Karpl...   Flexi...    James...    Antig...   Emini   Surfa...
 Arg   153     .       .     .       .     T     .     .     1.44    *    .     .     1.05     1.03
 Trp   154     .       .     .       .     T     .     .     1.13    *    .     F     0.84     1.26
 Gly   155     .       .     .       .     .     T     C     0.43    *    .     F     0.93     0.72
 Pro   156     .       .     .       .     .     T     C     1.36    *    .     F     1.17     0.37
 Ala   157     .       .     .       .     T     T     .     1.14    *    .     F     1.61     0.69
 Gly   158     .       .     .       .     .     T     C     0.22    *    .     F     2.40     1.08
 Ala   159     .       .     .       .     .     .     C     0.30    *    *     F     1.81     0.58
 Arg   160     .       .     B       .     .     .     .     0.76    *    *     F     1.37     0.89
 Pro   161     .       .     B       .     .     .     .     0.62    *    *     F     1.58     1.75
 Leu   162     .       .     .       .     .     .     C     1.00    *    *     F     1.84     1.72
 Pro   163     .       .     .       .     .     .     C     1.34    *    *     F     1.90     1.35
 Arg   164     .       .     .       .     .     .     C     1.64    *    *     F     2.20     1.52
 Gly   165     .       .     .       .     .     T     C     1.53    *    *     F     2.40     1.93
 Pro   166     .       .     .       .     .     T     C     0.89    *    .     F     3.00     2.17
 Glu   167     .       .     .       .     .     T     C     1.70    *    .     F     2.55     0.82
 Trp   168     A       .     .       .     .     T     .     1.60    *    .     .     2.05     1.44
 Glu   169     A       .     .       .     .     .     .     1.14    *    .     .     1.85     1.34
 Val   170     A       .     .       .     .     .     .     1.49    .     F     1.85     0.77
 Glu   171     A       .     .       .     .     .     .     1.36    *     F     2.00     1.26
 Thr   172     A       .     .       .     .     .     .     1.36    *     F     2.15     0.72
 Gly   173     .       .     .       .     .     T     C     1.76    .     F     3.00     1.68
 Glu   174     A       .     .       .     .     T     .     1.76    .     F     2.50     1.90
  Res   Pos.  Garni..  Alpha  Chou-...  Alpha   Garni..   Beta  Chou-...  Beta   Garni..   Turn  Chou-...  Turn   Garni..   Coil    Kyte-...    Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi...  James...  Antig...  Emini  Surfa...
  Gly   175     A     .      .     .     .     T     .     2.61     .     F     2.20     2.28
  Gln   176     A     .      .     .     .     T     .     2.72     .     F     1.90     4.00
  Arg   177     A     A      .     .     .     .     .     2.69     *     F     1.54     4.52
  Gln   178     A     A      .     .     .     .     .     3.03     *     F     1.58     4.52
  Glu   179     .     A      .     .     T     .     .     3.00   *     *     F     2.32     4.36
  Arg   180     .     A      .     .     T     .     .     3.34   *     .     F     2.66     3.03
  Gly   181     .     .      .     .     T     T     .     3.34   .     *     F     3.40     3.03
  Asp   182     .     .      .     .     .     T     C     3.23   .     .     F     2.86     3.03
  His   183     .     .      .     .     .     T     C     2.93   .     *     F     2.52     2 58
  Gln   184     .     .      .     .     .     T     C     2.93   .     *     F     2.18     3.50
  Glu   185     .     A      .     .     .     .     C     2.82   .     *     F     1.44     3.63
  Asp   186     A     A      .     .     .     .     .     3.17   .     .     F     0.90     4.61
  Ser   187     A     A      .     .     .     .     .     2.87   .     .     F     0.90     4.61
  Glu   188     A     A      .     .     .     .     .     2.90   .     .     F     0.90     3.57
  Glu   189     A     A      .     .     .     .     .     2.90   .     .     F     0.90     3.70
  Glu   190     A     A      .     .     .     .     .     2.90   .     .     F     0.90     4.79
  Ser   191     A     A      .     .     .     .     .     2.90   .     .     F     0.90     4.79
  Gln   192     A     A      .     .     .     .     .     2.61   .     .     F     0.90     4.79
  Glu   193     A     A      .     .     .     .     .     2.61   .     .     F     0.90     2.79
  Glu   194     A     A      .     .     .     .     .     2.27   .     .     F     0.90     3.61
  Glu   195     A     A      .     .     .     .     .     1.68   .     .     F     0.90     2.06
  Ala   196     A     A      .     .     .     .     .     1.68   .     .     F     1.16     1.20
 Res   Pos.  Garni..  Alpha  Chou-...  Alpha   Garni..   Beta   Chou-...   Beta   Garni..   Turn    Chou-...    Turn  Garni..  Coil    Kyte-...    Hydro... Eisen... Alpha  Eisen...  Beta  Karpl...  Flexi...    James...    Antig...     Emini     Surfa...
 Glu   197     A     A     .     .     .     .     .     1.68    .    .     F     1.27     0.93
 Gly   198     A     A     .     .     .     .     .     1.47    .    .     F     1.53     0.93
 Ala   199     .     A     .     .     T     .     .     1.26    .    .     F     2.34     1.42
 Ser   200     .     .     .     .     .     .     C     1.04    .    .     F     2.60     1.27
 Glu   201     .     .     .     .     .     .     C     1.42    *    .     F     2.04     1.99
 Pro   202     .     .     .     .     .     .     C     0.61    *    .     F     1.78     3.04
 Pro   203     .     .     .     .     .     .     C     0.61    .    .     F     1.52     1.87
 Pro   204     .     .     .     .     .     T     C     0.61    .    .     F     1.46     1.07
 Pro   205     .     .     .     .     .     T     C     0.60    .    .     F     0.45     0.70
 Leu   206     .     .     .     .     .     T     C     0.30    *    *     F     0.45     0.65
 Gly   207     .     .     B     .     .     T     .     0.62    .    *     F     0.51     0.57
 Ala   208     .     .     B     .     .     .     .     0.52    .    *     F     1.17     0.72
 Thr   209     .     .     B     .     .     .     .     0.78    *    *     F     1.58     1.25
 Ser   210     .     .     B     .     .     T     .     1.10    *    .     F     2.34     2.53
 Arg   211     .     .     B     .     .     T     .     1.21    *    .     F     2.60     4.91
 Thr   212     .     .     B     .     .     T     .     0.70    *    .     F     2.34     2.95
 Lys   213     .     .     B     .     .     T     .     0.99    *    .     F     2.08     1.63
 Arg   214     .     .     B     B     .     .     .     1.30    *    .     F     1.42     1.12
 Phe   215     .     .     B     B     .     .     .     1.01    *    *     .     1.01     1.34
 Val   216     .     .     B     B     .     .     .     1.01   *    *     .     0.60     0.68
 Ser   217     A     .     .     B     .     .     .     0.62   *    *     .     0.60     0.68
 Glu   218     A     A     .     .     .     .     .     -0.28   *    *     .     -0.30     0.68
 Res  Pos. Garni.. Alpha    Chou-...    Alpha   Garni..   Beta     Chou-...     Beta  Garni..  Turn     Chou-...     Turn Garni.. Coil    Kyte-...    Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi...     James...     Antig...  Eminl  Surfa...
 Ala  219     A     A      .     B     .       .    .     -0.39    *     *      .     0.30     0.68
 Arg  220     A     A      .     B     .       .    .     0.00    *     *      .     0.60     0.87
 Phe  221     A     A      .     B     .       .    .     0.04    *     .      .     0.60     0.73
 Val  222     A     A      .     B     .       .    .     -0.47    *     *      .     -0.30     0.59
 Glu  223     A     A      .     B     .       .    .     -1.32    *     *      .     -0.30     0.25
 Thr  224     A     A      .     B     .       .    .     -1.32    *     *      .     -0.60     0.21
 Leu  225     A     A      .     B     .       .    .     -1.43    *     *      .     -0.60     0.29
 Leu  226     A     A      .     B     .       .    .     -1.32    .     .      .     0.30     0.28
 Val  227     A     A      .     B     .       .    .     -0.77    .     .      .     -0.60     0.20
 Ala  228     A     A      .     B     .       .    .     -1.37    .     .      .     -0.30     0.32
 Asp  229     A     A      .     B     .       .    .     -1.64    .     .      .     -0.30     0.38
 Ala  230     A     A      .     .     .       .    .     -1.42    .     .      .     -0.30     0.52
 Ser  231     A     A      .     .     .       .    .     -1.31    .     .      .     0.30     0.52
 Met  232     A     A      .     .     .       .    .     -0.70    .     .      .     -0.30     0.27
 Ala  233     A     A      .     .     .       .    .     -0.46    .     .      .     -0.60     0.42
 Ala  234     A     A      .     .     .       .    .     -1.04    .     .      .     -0.60     0.31
 Phe  235     A     A      .     .     .       .    .     -0.46    .     .      .     -0.60     0.32
 Tyr  236     A     A      .     .     .       .    .     -0.97    .     .      .     -0.60     0.52
 Gly  237     A     A      .     .     .       .    .     -0.37    .     .      .     -0.60     0.43
 Ala  238     A     A      .     .     .       .    .     0.22    .     .      .     -0.60     0.86
 Asp  239     A     A      .     .     .       .    .     0.78    *     *      .     -0.30     0.88
 Leu  240     A     A      .     .     .       .    .     0.59    *     .      .     0.45     1.21
 Res   Pos. Garni.. Alpha   Chou-...   Alpha   Garni..   Beta    Chou-...    Beta  Garni..  Turn     Chou-...     Turn    Garni..    Coil    Kyte-...    Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi...    James...    Antig...  Emini  Surfa...
 Gln   241     A     A     .     B     .        .       .     0.02    *     *     .     -0.30     0.84
 Asn   242     A     A     .     B     .        .       .     0.06    *     .     .     -0.30     0.41
 His   243     .     A     B     B     .        .       .     -0.17    *     *     .     -0.60     0.72
 Ile   244     .     A     B     B     .        .       .     -0.77    *     .     .     -0.60     0.35
 Leu   245     .     A     B     B     .        .       .     -0.26    *     .     .     -0.60     0.21
 Thr   246     .     A     B     B     .        .       .     -1.11    *     .     .     -0.60     0.21
 Leu   247     .     A     B     B     .        .       .     -1.70    *     .     .     -0.60     0.22
 Met   248     A     A     .     B     .        .       .     -2.26    *     *     .     -0.60     0.27
 Ser   249     A     A     .     B     .        .       .     -1.26    *     *     .     -0.60     0.19
 Val   250     A     A     .     B     .        .       .     -1.33    *     *     .     -0.30     0.45
 Ala   251     A     A     .     B     .        .       .     -1.27    *     *     .     -0.30     0.32
 Ala   252     A     A     .     B     .        .       .     -0.41    *     *     .     -0.60     0.37
 Arg   253     A     A     .     B     .        .       .     0.16    *     *     .     -0.15     1.01
 Ile   254     A     A     .     B     .        .       .     0.24    *     *     .     0.45     1.36
 Tyr   255     A     .     .     .     .        .       .     0.80    *     *     .     0.99     2.08
 Lys   256     .     .     B     .     .        .       .     0.50    *     *     .     1.33     1.42
 His   257     .     .     B     .     .        T       .     1.13    .     *     F     1.12     1.42
 Pro   258     .     .     .     .     .        T       C     1.02    .     *     F     2.56     1.81
 Ser   259     .     .     .     .     T        T       .     1.61    .     *     F     3.40     1.46
 Ile   260     .     .     .     .     T        T       .     0.97    .     *     F     2.76     1.44
 Lys   261     .     .     B     .     .        .       .     0.92    .     *     F     1.67     0.65
 Asn   262     .     .     .     .     T        .       .     0.14    *     *     F     1.73     0.78
 Res  Pos.  Garni..  Alpha   Chou-...   Alpha   Garni..   Beta   Chou-...   Beta   Garni..   Turn   Chou-...   Turn   Garni..   Coil    Kyte-...    Hydro...  Eisen...  Alpha  Eisen...  Beta  Karpl...  Flexi...     James...     Antig...   Emini   Surfa...
 Ser  263     .     .     B     B     .     .     .     -0.24    *    *     F      0.19     0.92
 Ile  264     .     .     B     B     .     .     .     -0.80    *    *     .      -0.30     0.45
 Asn  265     .     .     B     B     .     .     .     -0.77    *    *     .      -0.60     0.21
 Leu  266     .     .     B     B     .     .     .     -0.77    .    *     .      -0.60     0.12
 Met  267     A     .     .     B     .     .     .     -1.62    *    .     .      -0.60     0.33
 Val  268     .     .     B     B     .     .     .     -2.13    .    *     .      -0.60     0.15
 Val  269     .     .     B     B     .     .     .     -2.13    .    .     .      -0.60     0.15
 Lys  270     A     .     .     B     .     .     .     -2.99    .    .     .      -0.60     0.11
 Val  271     .     .     B     B     .     .     .     -2.18    .    .     .      -0.60     0.11
 Leu  272     .     .     B     B     .     .     .     -1.58    .    .     .      -0.30     0.25
 Ile  273     A     .     .     B     .     .     .     -0.72    .    .     .      0.30     0.21
 Val  274     A     .     .     B     .     .     .     0.18    .    *     .      0.30     0.49
 Glu  275     A     .     .     B     .     .     .     -0.16    .    .     .      0.75     1.19
 Asp  276     A     A     .     .     .     .     .     0.36    .    .     F      0.90     1.79
 Glu  277     A     A     .     .     .     .     .     0.96    *    .     F      0.90     2.39
 Lys  278     .     A     .     .     T     .     .     1.84    *    *     F      1.30     2.13
 Trp  279     .     A     .     .     .     .     C     1.84    .    *     F      1.10     2.21
 Gly  280     .     .     .     .     .     T     C     1.54    *    .     F      1.35     0.95
 Pro  281     .     .     .     .     .     T     C     1.54    *    *     F      1.36     0.64
 Glu  282     .     .     B     .     .     T     .     1.54    *    *     F      1.62     1.01
 Val  283     .     .     B     .     .     T     .     1.16    *    *     F      2.23     1.64
 Ser  284     .     .     .     .     .     T     C     1.10    .    *     F      2.74     1.05
 Res  Pos. Garni.. Alpha     Chou-...     Alpha  Garni..  Beta     Chou-..     Beta    Garni..    Turn     Chou-...     Turn   Garni..   Coil    Kyte-...    Hydro... Eisen... Alpha   Eisen...   Beta   Karpl...   Flexi...   James...   Antig...   Emini   Surfa...
 Asp  285   .       .     .      .     T     T     .     0.63    .    .     F     3.10     0.60
 Asn  286   .       .     .      .     T     T     .     0.53    .    *     F     2.49     0.67
 Gly  287   .       .     .      .     T     T     .     -0.28    *    *     F     2.18     0.72
 Gly  288   .       .     .      .     T     .     .     0.69    *    *     F     1.07     0.35
 Leu  289   .       .     B      .     .     .     .     0.99    *    *     F     0.36     0.43
 Thr  290   .       .     B      .     .     .     .     0.29    *    *     .     -0.10     0.70
 Leu  291   .       .     B      .     .     .     .     -0.38    *    *     .     -0.40     0.61
 Arg  292   .       .     B      .     .     .     .     -0.03    *    *     .     -0.40     0.40
 Asn  293   .       .     B      .     .     .     .     0.02    *    *     .     -0.10     0.44
 Phe  294   .       .     .      .     T     T     .     0.83    *    *     .     0.20     0.57
 Cys  295   .       .     .      .     T     T     .     1.26    *    *     .     0.20     0.50
 Asn  296   .       .     .      .     T     T     .     2.18    *    *     .     0.20     0.61
 Trp  297   .       .     .      .     T     T     .     1.37    *    *     .     0.65     1.38
 Gln  298   .       .     .      .     T     .     .     1.37    *    .     .     0.45     2.23
 Arg  299   .       .     .      .     T     .     .     2.07    *    .     .     1.05     2.23
 Arg  300   .       .     .      .     T     .     .     2.52    *    *     F     1.20     3.67
 Phe  301   .       .     .      .     T     .     .     2.22    *    *     F     1.84     3.28
 Asn  302   .       .     .      .     T     .     .     2.51    *    *     F     2.18     2.24
 Gln  303   .       .     .      .     .     T     C     2.62    *    .     F     2.52     1.91
 Pro  304   .       .     .      .     .     T     C     2.48    *    .     F     2.86     4.33
 Ser  305   .       .     .      .     T     T     .     2.16    *    *     F     3.40     3.66
 Asp  306   .       .     .      .     T     T     .     2.86    *    .     F     3.06     3.27
 Res  Pos.   Garni..   Alpha    Chou-...    Alpha   Garni..   Beta     Chou-...     Beta   Garni..   Turn   Chou-...   Turn    Garni..    Coil     Kyte-...     Hydro... Eisen... Alpha Eisen... Beta Karpl... Flexi...    James...    Antig...   Emini   Surfa...
 Arg  307     .      .     .     .     .     .     C     2.82   *    .     F     2.32     3.66
 His  308     .      .     .     .     .     .     C     2.58   *    .     F     1.98     3.72
 Pro  309     .      .     .     .     .     .     C     2.79   *    .     F     1.64     3.49
 Glu  310     .      .     .     .     T     .     .     2.78   *    .     F     1.50     2.97
 His  311     A      .     .     .     .     T     .     2.19   *    .     F     1.00     3.15
 Tyr  312     A      .     .     .     .     T     .     1.19   *    .     F     1.00     2.06
 Asp  313     A      .     .     .     .     T     .     0.41   .    .     F     0.85     0.83
 Thr  314     A      .     .     .     .     T     .     -0.19   .    .     .     -0.20     0.51
 Ala  315     A      .     .     B     .     .     .     -0.50   *    .     .     -0.60     0.27
 Ile  316     .      .     B     B     .     .     .     -0.36   *    .     .     -0.60     0.23
 Leu  317     .      .     B     B     .     .     .     -0.11   .    .     .     -0.60     0.31
 Leu  318     .      .     B     B     .     .     .     -0.11   .    *     .     -0.60     0.53
 Thr  319     .      .     B     B     .     .     .     -0.50   .    .     F     0.00     1.23
 Arg  320     .      .     B     B     .     .     .     -0.58   .    *     F     -0.08     1.29
 Gln  321     .      .     .     B     T     .     .     -0.03   .    *     F     0.69     0.84
 Asn  322     .      .     .     .     T     T     .     0.78   .    *     F     1.31     0.57
 Phe  323     .      .     .     .     T     T     .     1.59   .    .     .     1.98     0.51
 Cys  324     .      .     .     .     T     T     .     1.56   .    *     .     2.20     0.51
 Gly  325     .      .     .     .     T     T     .     0.63   .    *     F     1.53     0.31
 Gln  326     .      .     .     .     T     .     .     -0.03   .    .     F     1.11     0.30
 Glu  327     .      .     .     .     T     .     .     -0.03   .    .     F     0.89     0.30
 Gly  328     .      .     .     .     T     .     .     0.36   .    .     F     1.27     0.50
 Res  Pos.     Garni..     Alpha     Chou-...     Alpha   Garni..   Beta   Chou-...   Beta   Garni..   Turn   Chou-...   Turn   Garni..   Coil    Kyte-...    Hydro...  Eisen...  Alpha   Eisen...   Beta    Karpl...    Flexi...  James...  Antig...    Emini    Surfa...
 Leu  329      .       .     B       .     .     .      .     0.21     .    .     F     0.65     0.42
 Cys  330      .       .     B       .     .     .      .     0.21     .    .     .     0.50     0.20
 Asp  331      .       .     B       .     .     T      .     -0.64     .    .     .     0.10     0.20
 Thr  332      .       .     B       .     .     T      .     -1.23     *    .     .     -0.20     0.18
 Leu  333      .       .     B       .     .     T      .     -0.89     .    .     .     0.10     0.34
 Gly  334      .       .     B       .     .     T      .     -0.97     .    .     .     0.70     0.34
 Val  335      .       .     B       .     .     .      .     -0.64     .    .     .     -0.40     0.16
 Ala  336      .       .     B       .     .     .      .     -0.96     .    .     .     -0.10     0.20
 Asp  337      .       .     B       .     .     T      .     -1.53     .    .     .     0.10     0.29
 Ile  338      .       .     B       .     .     T      .     -1.39     .    .     .     -0.20     0.27
 Gly  339      .       .     B       .     .     T      .     -1.04     *    .     .     0.10     0.14
 Thr  340      .       .     B       .     .     T      .     -0.40     .    .     .     0.70     0.14
 Ile  341      .       .     B       .     .     .      .     0.19     .    .     .     0.24     0.32
 Cys  342      .       .     B       .     .     .      .     0.23     .    .     .     1.18     0.52
 Asp  343      .       .     B       .     .     T      .     0.82     *    .     F     1.87     0.72
 Pro  344      .       .     .       .     T     T      .     0.50     .    .     F     3.06     1.37
 Asn  345      .       .     .       .     T     T      .     0.51     .    .     F     3.40     1.37
 Lys  346      .       .     .       .     T     T      .     0.54     *    .     F     3.06     1.10
 Ser  347      .       .     .       B     T     .      .     0.32     .    .     F     1.87     0.53
 Cys  348      .       .     B       B     .     .      .     0.32     *    .     .     0.38     0.23
 Ser  349      .       .     B       B     .     .      .     0.53     *    .     .     0.64     0.20
 Val  350      .       .     B       B     .     .      .     0.53     *    .     .     0.30     0.25
 Res  Pos.   Garni..   Alpha    Chou-...    Alpha   Garni..   Beta     Chou-...     Beta    Garni..    Turn   Chou-...   Turn Garni.. Coil    Kyte-...    Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi...    James...    Antig...     Emini     Surfa...
 Ile  351     .     .     B     B     .     .   .     0.14    *     .     .     0.60      0.80
 Glu  352     A     .     .     B     .     .   .     -0.37    .     .     .     0.60      0.59
 Asp  353     A     A     .     .     .     .   .     0.30    .     .     F     0.75      0.66
 Glu  354     A     A     .     .     .     .   .     0.01    *     .     F     0.90      1.62
 Gly  355     A     A     .     .     .     .   .     0.28    *     .     F     0.75      0.95
 Leu  356     A     A     .     .     .     .   .     1.13    *     .     .     0.30      0.57
 Gln  357     A     A     .     .     .     .   .     0.82    *     .     .     -0.30      0.45
 Ala  358     A     A     .     .     .     .   .     0.01    *     .     .     -0.60      0.66
 Ala  359     A     A     .     .     .     .   .     -0.58    *     .     .     -0.60      0.66
 His  360     A     A     .     .     .     .   .     -0.27    *     .     .     -0.60      0.38
 Thr  361     A     A     .     .     .     .   .     0.54    *     .     .     -0.60      0.52
 Leu  362     A     A     .     .     .     .   .     -0.27    *     .     .     -0.30      0.88
 Ala  363     A     A     .     .     .     .   .     -0.02    *     .     .     -0.30      0.54
 His  364     A     A     .     .     .     .   .     0.53    *     .     .     -0.30      0.37
 Glu  365     A     A     .     .     .     .   .     -0.29    *     .     .     -0.30      0.61
 Leu  366     A     A     .     B     .     .   .     -0.79    *     .     .     -0.30      0.45
 Gly  367     A     A     .     B     .     .   .     -0.28    *     .     .     -0.60      0.27
 His  368     A     A     .     B     .     .   .     -0.29    *     .     .     -0.30      0.21
 Val  369     A     A     .     B     .     .   .     -0.47    *     .     .     -0.60      0.25
 Leu  370     .     A     B     B     .     .   .     -0.50    *     .     .     -0.26      0.39
 Ser  371     .     A     B     B     .     .   .     0.31    *     .     .     0.08      0.39
 Met  372     .     .     B     .     .     .   .     0.66    .     .     .     0.92      0.88
  Res   Pos.   Garni..   Alpha    Chou-...    Alpha   Garni..   Beta   Chou-...   Beta Garni.. Turn    Chou-...    Turn    Garni..    Coil    Kyte-...    Hydro... Eisen... Alpha    Eisen...    Beta Karpl... Flexi...    James...    Antig...  Emini  Surfa...
  Pro   373     .       .     .     .     T     .     .     0.39   *     .     .     2.41     1.78
  His   374     .       .     .     .     T     T     .     1.29   *     .     F     3.40     1.78
  Asp   375     .       .     .     .     T     T     .     1.89   .     .     F     3.06     3.61
  Asp   376     .       .     .     .     T     T     .     1.52   .     .     F     2.89     3.61
  Ser   377     .       .     .     .     T     T     .     1.81   *     *     F     2.72     1.42
  Lys   378     .       .     B     .     .     T     .     2.13   *     *     F     2.15     1.23
  Pro   379     .       .     .     .     T     T     .     1.36   *     *     F     2.38     1.44
  Cys   380     .       .     B     .     .     T     .     0.66   *     *     F     1.70     0.89
  Thr   381     .       .     B     .     .     T     .     0.31   *     *     F     1.53     0.38
  Arg   382     .       .     B     B     .     .     .     0.40   *     *     F     0.36     0.25
  Leu   383     .       .     B     B     .     .     .     -0.24   *     *     .     0.04     0.71
  Phe   384     .       .     B     B     .     .     .     -0.38   *     .     .     -0.43     0.49
  Gly   385     .       .     .     B     .     .     C     0.33   *     .     F     0.05     0.25
  Pro   386     .       .     .     .     .     T     C     0.61   *     *     F     0.45     0.59
  Met   387     .       .     .     .     T     T     .     0.47   *     *     F     0.65     0.93
  Gly   388     A       .     .     .     .     T     .     0.42   .     .     F     1.00     1.29
  Lys   389     A       .     .     .     .     T     .     0.52   .     .     .     0.10     0.62
  His   390     A       A     .     .     .     .     .     0.28   .     .     .     -0.30     0.62
  His   391     A       A     .     .     .     .     .     0.28   .     *     .     -0.30     0.63
  Val   392     .       A     B     .     .     .     .     0.07   .     .     .     -0.30     0.49
  Met   393     A       A     .     .     .     .     .     -0.29   .     *     .     -0.60     0.30
  Ala   394     A       A     .     .     .     .     .     -1.19   .     *     .     -0.60     0.19
 Res  Pos.  Garni..  Alpha     Chou-...     Alpha  Garni..  Beta     Chou-...     Beta    Garni..    Turn    Chou-...    Turn   Garnl...   Coil   Kyte-...   Hydro... Eisen... Alpha   Eisen...   Beta  Karpl...  Flexi...    James...    Antig...   Emini   Surfa...
 Pro  395     A     A     .       .       .       .     .     -1.19   .   *     .     -0.60     0.19
 Leu  396     A     A     .       .       .       .     .     -1.97   .   *     .     -0.60     0.26
 Phe  397     A     A     .       .       .       .     .     -1.11   *   *     .     -0.60     0.21
 Val  398     A     A     .       .       .       .     .     -0.51   *   .     .     -0.60     0.22
 His  399     .     A     B       .       .       .     .     -0.23   *   *     .     -0.60     0.46
 Leu  400     .     A     B       .       .       .     .     -0.83   *   *     .     -0.60     0.77
 Asn  401     .     A     .       .       T       .     .     -0.23   *   *     F     -0.05     0.85
 Gln  402     .     A     .       .       T       .     .     0.18   .   *     F     -0.05     0.97
 Thr  403     .     A     .       .       T       .     .     0.73   .   *     F     0.10     1.24
 Leu  404     .     A     .       .       .       .     C     0.56   .   *     F     -0.10     1.03
 Pro  405     .     .     .       .       T       .     .     0.70   .   .     .     0.00     0.92
 Trp  406     .     .     .       .       T       .     .     0.40   .   .     .     0.00     0.34
 Ser  407     .     .     .       .       .       T     C     -0.19   .   .     .     0.00     0.55
 Pro  408     .     .     .       .       T       T     .     -0.48   .   .     .     0.20     0.36
 Cys  409     .     .     .       .       T       T     .     0.09   .   .     .     0.20     0.34
 Ser  410     .     .     B       .       .       T     .     -0.51   .   .     .     -0.20     0.40
 Ala  411     .     A     B       .       .       .     .     -0.53   .   .     .     -0.60     0.21
 Met  412     .     A     B       .       .       .     .     -0.23   .   .     .     -0.60     0.57
 Tyr  413     .     A     B       .       .       .     .     -0.83   .   .     .     -0.60     0.74
 Leu  414     .     A     B       .       .       .     .     -0.98   *   .     .     -0.60     0.60
 Thr  415     .     A     B       .       .       .     .     -0.68   *   .     .     -0.60     0.50
 Glu  416     A     A     .       .       .       .     .     -0.43   *   .     .     -0.30     0.54
  Res  Pos.    Garni..    Alpha     Chou-...     Alpha   Garni..   Beta     Chou-...     Beta     Garni..     Turn    Chou-...    Turn     Garni..     Coil     Kyte-...     Hydro...   Eisen...   Alpha   Eisen...   Beta   Karpl...   Flexi...    James...    Antig...   Emini   Surfa...
 Leu  417     A     A     .       .     .     .     .     -0.18   *     .     F     0.76     0.64
 Leu  418     A     .     .       .     .     T     .     0.03   *     .     F     1.47     0.44
 Asp  419     .     .     .       .     T     T     .     0.50   *     .     F     2.18     0.35
 Gly  420     .     .     .       .     T     T     .     0.81   .     .     F     1.89     0.42
 Gly  421     .     .     .       .     T     T     .     0.14   .     .     F     3.10     0.84
 His  422     .     .     .       .     T     T     .     0.14   .     .     F     2.79     0.27
 Gly  423     .     .     .       .     T     T     .     0.14   .     .     F     1.58     0.23
 Asp  424     .     .     B       .     .     T     .     0.14   .     *     .     0.72     0.19
 Cys  425     .     .     B       .     .     T     .     -0.10   .     *     .     1.01     0.23
 Leu  426     .     .     B       .     .     .     .     0.03   .     *     .     0.50     0.24
 Leu  427     .     .     B       .     .     .     .     -0.28   .     *     .     0.50     0.22
 Asp  428     .     .     B       .     .     .     .     -0.52   *     *     .     -0.10     0.40
 Ala  429     .     .     B       .     .     T     .     -1.11   *     .     F     0.25     0.49
 Pro  430     A     .     .       .     .     T     .     -1.26   .     .     F     0.25     0.60
 Gly  431     .     .     .       .     T     T     .     -0.66   .     .     F     0.65     0.30
 Ala  432     .     .     B       .     .     T     .     -0.66   .     .     .     -0.20     0.46
 Ala  433     .     .     B       .     .     .     .     -0.87   .     .     .     -0.40     0.24
 Leu  434     .     .     B       .     .     .     .     -0.59   .     .     .     -0.40     0.38
 Pro  435     .     .     B       .     .     .     .     -0.72   .     .     .     -0.40     0.54
 Leu  436     .     .     B       .     .     T     .     -1.19   .     .     .     -0.20     0.53
 Pro  437     .     .     B       .     .     T     .     -0.81   .     .     F     0.00     0.53
 Thr  438     .     .     .       .     T     T     .     -0.57   .     *     F     0.45     0.53
  Res   Pos.   Garni..   Alpha     Chou-...     Alpha   Garni..   Beta   Chou-...   Beta   Garni..   Turn     Chou-...     Turn    Garni..    Coil    Kyte-...    Hydro... Eisen... Alpha   Eisen...   Beta    Karpl...    Flexi...    James...    Antig...   Emini   Surfa...
  Gly   439     .     .     .     .     .     T     C     0.36     .    *     F     0.30     0.64
  Leu   440     .     .     .     .     .     T     C     -0.03     .    *     F     1.25     0.81
  Pro   441     .     .     B     .     .     T     .     0.19     .    *     F     0.50     0.55
  Gly   442     .     .     B     .     .     T     .     -0.41     .    *     F     0.45     0.57
  Arg   443     .     .     B     .     .     T     .     -0.34     .    *     .     0.25     0.57
  Met   444     .     A     B     .     .     .     .     0.00     .    *     .     -0.50     0.57
  Ala   445     .     A     B     .     .     .     .     0.00     *    *     .     -0.10     1.00
  Leu   446     .     A     B     .     .     .     .     0.21     *    .     .     -0.60     0.42
  Tyr   447     .     A     B     .     .     .     .     0.56     *    *     .     -0.60     0.71
  Gln   448     .     A     B     .     .     .     .     0.44     *    *     .     -0.45     1.22
  Leu   449     A     A     .     .     .     .     .     0.38     *    *     .     -0.15     2.57
  Asp   450     A     A     .     .     .     .     .     1.08     *    *     F     -0.15     0.88
  Gln   451     .     A     B     .     .     .     .     1.89     *    *     F     0.75     0.99
  Gln   452     .     A     B     .     .     .     .     1.24     *    *     F     0.90     2.09
  Cys   453     .     A     B     .     .     .     .     0.54     *    *     F     0.75     0.88
  Arg   454     .     A     B     .     .     .     .     1.01     *    *     .     -0.30     0.44
  Gln   455     .     A     B     .     .     .     .     0.80     *    .     .     -0.30     0.25
  Ile   456     .     A     B     .     .     .     .     0.80     *    *     .     -0.30     0.72
  Phe   457     .     A     .     .     T     .     .     0.10     *    *     .     0.70     0.62
  Gly   458     .     .     .     .     .     T     C     0.88     *    *     .     0.00     0.31
  Pro   459     .     .     .     .     T     T     .     0.73     *    *     F     0.65     0.86
  Asp   460     .     .     .     .     T     T     .     0.07     *    *     F     1.40     1.35
 Res   Pos.    Garni..    Alpha   Chou-...   Alpha    Garni..    Beta  Chou-...  Beta   Garni..   Turn     Chou-...     Turn    Garni..    Coil    Kyte-...    Hydro...   Eisen...   Alpha   Eisen...   Beta    Karpl...    Flexi...    James...    Antig...   Emini   Surfa...
 Phe   461     .     .     .     .     T     T     .     0.74     *     *     .     1.35     0.73
 Arg   462     .     .     .      .     T     .     .     1.44     *     *     .     1.40     0.73
 His   463     .     .     .      .     T     .     .     1.48     *     *     .     1.65     0.71
 Cys   464     .     .     .      .     .     T     C     1.39     *     *     .     1.45     1.18
 Pro   465     .     .     .      .     T     T     .     0.80     *     .     F     2.50     0.80
 Asn   466     .     .     .      .     T     T     .     1.50     *     *     F     1.65     0.60
 Thr   467     .     .     .      .     T     T     .     1.39     *     *     F     1.55     1.93
 Ser   468     .     A     .      .     T     .     .     0.57     *     .     F     1.50     2.08
 Ala   469     .     A     .      .     T     .     .     0.57     .     .     F     1.10     0.96
 Gln   470     .     A     B      .     .     .     .     0.19     .     .     F     0.45     0.36
 Asp   471     .     A     B      .     .     .     .     0.19     *     *     F     0.45     0.27
 Val   472     .     A     B      .     .     .     .     -0.31     *     .     .     -0.30     0.46
 Cys   473     .     A     B      .     .     .     .     -0.30     *     .     .     -0.30     0.22
 Ala   474     .     A     B      .     .     .     .     -0.38     *     *     .     -0.60     0.14
 Gln   475     .     A     B      .     .     .     .     -0.41     .     *     .     -0.60     0.10
 Leu   476     .     A     B      .     .     .     .     -0.72     *     *     .     -0.60     0.25
 Trp   477     .     A     B      .     .     .     .     0.13     .     *     .     -0.60     0.36
 Cys   478     .     A     B      .     .     .     .     0.46     .     .     .     -0.26     0.35
 His   479     .     .     .      .     T     T     .     0.46     .     .     .     0.88     0.42
 Thr   480     .     .     .      .     T     T     .     0.46     .     *     .     1.52     0.40
 Asp   481     .     .     .      .     T     T     .     1.06     .     .     F     3.06     1.30
 Gly   482     .     .     .      .     T     T     .     0.53     .     .     F     3.40     1.48
 Res  Pos. Garni.. Alpha   Chou-...   Alpha   Garni..   Beta      Chou-...      Beta  Garni..  Turn   Chou-...   Turn   Garni..   Coil   Kyte-...   Hydro...   Eisen...   Alpha   Eisen...   Beta  Karpl...  Flexi...  James...  Antig...  Emini  Surfa...
 Ala  483     .       .      .       .     T     .     C     0.53    *     .     F     2.41     0.85
 Glu  484     A       .      .       .     .     .     .     0.53    *     .     F     1.67     0.27
 Pro  485     A       .      .       .     .     .     .     0.53    .     .     F     0.73     0.37
 Leu  486     A       .      .       .     .     .     .     0.58    *     .     .     0.24     0.53
 Cys  487     A       .      .       .     .     .     .     0.92    .     .     .     0.78     0.62
 His  488     .       .      B       .     .     .     .     1.17    .     .     F     0.61     0.64
 Thr  489     .       .      .       .     T     T     .     0.87    .     .     F     1.49     0.77
 Lys  490     .       .      .       .     T     T     .     0.27    .     .     F     2.52     1.92
 Asn  491     .       .      .       .     T     T     .     0.87    .     .     F     2.80     1.16
 Gly  492     .       .      .       .     T     T     .     1.24    .     .     F     2.52     1.25
 Ser  493     .       .      .       .     .     .     C     0.69    .     .     F     1.09     0.66
 Leu  494     .       .      .       .     .     .     C     1.00    .     .     .     0.36     0.41
 Pro  495     .       .      B       .     .     .     .     0.61    .     .     .     0.18     0.69
 Trp  496     .       .      .       .     T     T     .     0.30    .     .     .     0.50     0.51
 Ala  497     .       .      B       .     .     T     .     0.43    .     .     .     0.05     0.90
 Asp  498     .       .      .       .     T     T     .     0.07    .     .     F     1.15     0.90
 Gly  499     .       .      .       .     T     T     .     0.53    .     .     F     1.40     0.46
 Thr  500     .       .      .       .     .     T     C     0.53    .     .     F     2.05     0.45
 Pro  501     .       .      .       .     T     T     .     0.48    .     .     F     2.50     0.42
 Cys  502     .       .      .       .     T     T     .     1.03    .     *     F     1.65     0.42
 Gly  503     .       .      .       .     .     T     C     0.22    .     .     F     1.20     0.39
 Pro  504     .       .      .       .     T     .     .     -0.10    .     .     F     0.65     0.21
 Res  Pos.   Garni..   Alpha   Chou-...   Alpha   Garni..   Beta  Chou-...  Beta   Garni..   Turn  Chou-...  Turn    Garni..    Coil   Kyte-...   Hydro...  Eisen...  Alpha  Eisen...  Beta    Karpl...    Flexi...    James...    Antig...   Emini   Surfa...
 Gly  505     .     .     .     .     T     .     .     -0.09    .     .     .     0.25     0.21
 His  506     .     .     B     .     .     .     .     0.12    .     .     .     -0.40     0.28
 Leu  507     .     .     B     .     .     .     .     0.44    .     .     .     0.50     0.32
 Cys  508     .     .     B     .     .     T     .     0.49    .     *     .     0.91     0.32
 Ser  509     .     .     .     .     T     T     .     0.03    .     .     F     1.67     0.31
 Glu  510     .     .     .     .     T     T     .     -0.43    .     .     F     1.28     0.20
 Gly  511     .     .     .     .     T     T     .     -0.61    *     .     F     1.49     0 31
 Ser  512     .     .     .     .     T     .     .     0.20    *     .     F     2.10     0.36
 Cys  513     .     A     .     .     .     .     C     0.87    .     .     F     1.79     0.36
 Leu  514     .     A     .     .     .     .     C     1.17    .     .     F     1.58     0.63
 Pro  515     A     A     .     .     .     .     .     0.31    .     .     F     1.17     0.81
 Glu  516     A     A     .     .     .     .     .     0.66    *     .     F     1.11     1.13
 Glu  517     A     A     .     .     .     .     .     1.07    *     .     F     0.90     2.37
 Glu  518     A     A     .     .     .     .     .     1.52    .     .     F     0.90     3.00
 Val  519     A     A     .     .     .     .     .     2.38    .     .     F     0.90     2.68
 Glu  520     A     A     .     .     .     .     .     2.38    *     .     F     0.90     3.09
 Arg  521     A     .     .     .     .     T     .     1.52    *     .     F     1.30     2.76
 Pro  522     A     .     .     .     .     T     .     0.67    *     .     F     1.30     2.76
 Lys  523     A     .     .     .     .     T     .     0.67    *     *     F     1.30     1.18
 Pro  524     .     .     B     .     .     T     .     1.18    *     *     F     1.30     1.01
 Val  525     .     .     B     .     .     .     .     0.83    *     *     F     0.65     0.65
 Val  526     .     .     B     .     .     .     .     0.43    .     *     F     0.65     0.32
 Res  Pos. Garni.. Alpha   Chou-...   Alpha  Garni..  Beta   Chou-...   Beta Garni.. Turn    Chou-...    Turn  Garni..  Coil    Kyte-...    Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi...   James...   Antig...   Emini   Surfa...
 Asp  527    .     .     B     .     .     T     .     0.06    *     .     F     -0.05     0.22
 Gly  528    .     .     B     .     .     T     .     -0.20    *     .     F     -0.05     0.30
 Gly  529    .     .     .     .     T     T     .     -0.28    .     .     F     0.65     0.62
 Trp  530    .     .     .     .     .     T     C     0.23    .     .     .     0.00     0.39
 Ala  531    .     .     .     .     .     .     C     0.88    .     .     .     -0.20     0.39
 Pro  532    .     .     .     .     T     .     .     0.59    .     .     .     0.00     0.61
 Trp  533    .     .     .     .     T     .     .     0.59    .     .     .     0.00     0.61
 Gly  534    .     .     .     .     .     T     C     0.93    .     .     .     0.00     0.59
 Pro  535    .     .     .     .     T     T     .     0.56    .     .     F     0.35     0.66
 Trp  536    .     .     .     .     T     T     .     0.84    *     .     F     0.66     0.34
 Gly  537    .     .     .     .     .     T     C     1.17    *     .     F     1.07     0.46
 Glu  538    .     .     .     .     T     .     .     1.14    *     .     F     1.98     0.58
 Cys  539    .     .     .     .     T     T     .     0.82    *     .     F     2.49     0.80
 Ser  540    .     .     .     .     T     T     .     0.69    *     .     F     3.10     0.43
 Arg  541    .     .     .     .     T     T     .     0.63    *     .     F     2.79     0.25
 Thr  542    .     .     .     .     T     T     .     0.63    *     .     F     2.18     0.46
 Cys  543    .     .     .     .     T     T     .     -0.22    *     .     F     1.87     0.34
 Gly  544    .     .     .     .     T     T     .     0.44    *     .     F     1.56     0.13
 Gly  545    .     .     .     .     T     T     .     0.04    *     *     F     0.65     0.15
 Gly  546    .     .     .     .     T     T     .     -0.37    *     *     F     0.35     0.25
 Val  547    .     .     B     B     .     .     .     -0.09    *     *     .     -0.60     0.33
 Gln  548    .     .     B     B     .     .     .     0.69    *     *     .     -0.60     0.46
  Res   Pos. Garni.. Alpha    Chou-...    Alpha   Garni..   Beta    Chou-...    Beta  Garni..  Turn  Chou-...  Turn   Garni..   Coil Kyte-... Hydro... Eisen... Alpha  Eisen...  Beta    Karpl...    Flexi...   James...   Antig...   Emini   Surfa...
  Phe   549   .     .     B       B     .     .     .     1.03   *    *     .     -0.30     0.91
  Ser   550   .     .     B       B     .     .     .     0.71   *    *     .     0.79     2.13
  His   551   .     .     B       .     .     .     .     1.10   *    *     .     1.18     0.66
  Arg   552   .     .     .       .     T     .     .     1.96   *    *     .     2.37     1.52
  Glu   553   .     .     .       .     T     .     .     1.74   *    *     F     2.86     1.89
  Cys   554   .     .     .       .     T     T     .     2.44   *    .     F     3.40     2.15
  Lys   555   .     .     .       .     T     T     .     2.53   *    .     F     3.06     1.90
  Asp   556   .     .     .       .     .     T     C     2.57   *    .     F     2.52     1.70
  Pro   557   .     .     .       .     .     T     C     2.46   *    .     F     2.52     5.49
  Glu   558   .     .     .       .     .     .     C     2.11   .    .     F     2.32     4.41
  Pro   559   .     .     .       .     T     T     .     2.43   .    *     F     2.72     2.62
  Gln   560   .     .     .       .     T     T     .     2.50   .    *     F     2.76     1.67
  Asn   561   .     .     .       .     T     T     .     2.26   *    *     F     3.40     1.89
  Gly   562   .     .     .       .     T     T     .     1.80   *    *     F     2.76     1.92
  Gly   563   .     .     .       .     T     T     .     0.99   *    *     F     2.27     0.59
  Arg   564   .     .     B       .     .     T     .     0.86   *    .     F     0.93     0.30
  Tyr   565   .     .     B       .     .     T     .     0.97   .    .     .     0.44     0.30
  Cys   566   .     .     B       .     .     T     .     1.08   .    .     .     1.00     0.60
  Leu   567   .     .     B       .     .     .     .     0.83   .    *     .     1.40     0.60
  Gly   568   .     .     B       .     .     .     .     1.22   .    *     F     1.55     0.39
  Arg   569   .     .     B       .     .     .     .     0.87   .    *     F     2.30     1.45
  Arg   570   .     .     .       .     T     .     .     1.11   *    *     F     3.00     2.75
 Res  Pos. Garni.. Alpha   Chou-...   Alpha  Garni..  Beta   Chou-...   Beta   Garni..   Turn  Chou-...  Turn   Garni..   Coil    Kyte-...    Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi... James... Antig...  Emini  Surfa...
 Ala  571   .     .    .     .     T     .     .     1.48    *    *     F     2.70     4.82
 Lys  572   .     .    .     .     T     .     .     1.62    *    *     F     2.40     3.30
 Tyr  573   .     .    .     .     T     T     .     1.93    *    .     F     1.85     0.90
 Gln  574   .     .    .     .     T     T     .     1.51    .    .     F     1.10     1.22
 Ser  575   .     .    .     .     T     T     .     1.40    .    *     .     0.50     0.88
 Cys  576   .     .    .     .     T     T     .     1.99    .    .     .     0.50     0.97
 His  577   .     A    B     .     .     .     .     1.28    .    .     .     0.60     0.97
 Thr  578   .     A    .     .     T     .     .     1.31    .    .     F     0.85     0.39
 Glu  579   .     A    .     .     T     .     .     1.10    .    .     F     1.00     1.12
 Glu  580   .     A    .     .     T     .     .     1.40    .    *     F     1.64     1.27
 Cys  581   .     A    B     .     .     .     .     1.72    .    *     F     1.58     1.47
 Pro  582   .     .    .     .     .     T     C     1.80    .    *     F     2.37     0.84
 Pro  583   .     .    .     .     T     T     .     1.81    *    .     F     2.91     0.97
 Asp  584   .     .    .     .     T     T     .     1.11    *    .     F     3.40     2.43
 Gly  585   .     .    .     .     T     T     .     1.22    *    .     F     3.06     1.36
 Lys  586   .     A    .     .     T     .     .     1.89    *    .     F     2.32     1.72
 Ser  587   A     A    .     .     .     .     .     2.10    .    .     F     1.58     1.79
 Phe  588   A     A    .     .     .     .     .     2.31    .    .     F     1.24     3.13
 Arg  589   A     A    .     .     .     .     .     1.64    .    .     F     0.90     2.71
 Glu  590   A     A    .     .     .     .     .     1.99    .    .     F     0.60     1.08
 Gln  591   A     A    .     .     .     .     .     1.99    .    .     F     0.90     2.17
 Gln  592   A     A    .     .     .     .     .     2.04    .    *     F     0.90     2.21
 Res  Pos. Garni.. Alpha   Chou-...   Alpha Garni.. Beta Chou-... Beta Garni.. Turn   Chou-...   Turn   Garni..   Coil   Kyte-...   Hydro... Eisen... Alpha  Eisen...  Beta    Karpl...    Flexi...   James...   Antig...  Emini  Surfa...
 Cys  593     A     A     .     .     .     .     .     2.74   .    *     F     1.15     2.00
 Glu  594     .     A     .     .     T     .     .     2.04   .    .     F     1.50     1.86
 Lys  595     .     A     .     .     T     .     .     1.80   .    .     F     1.75     1.08
 Tyr  596     .     .     .     .     T     .     .     1.80   .    .     .     2.05     3.17
 Asn  597     .     .     .     .     T     T     .     1.56   .    .     .     2.50     2.94
 Ala  598     .     .     .     .     T     T     .     1.91   .    .     .     1.35     2.30
 Tyr  599     .     .     B     .     .     T     .     1.91   .    .     .     0.70     2.12
 Asn  600     .     .     B     .     .     T     .     1.27   .    *     .     0.75     2.20
 Tyr  601     .     .     B     .     .     .     .     1.51   .    .     .     0.25     2.16
 Thr  602     .     .     B     .     .     .     .     1.17   .    *     F     0.70     2.30
 Asp  603     .     .     B     .     .     T     .     1.76   .    *     F     1.75     1.42
 Met  604     .     .     B     .     .     T     .     1.19   .    *     F     2.00     1.45
 Asp  605     .     .     .     .     T     T     .     0.38   *    .     F     2.50     0.83
 Gly  606     .     .     B     .     .     T     .     0.62   *    *     F     1.85     0.41
 Asn  607     .     .     B     B     .     .     .     0.64   *    *     F     0.60     0.72
 Leu  608     A     .     .     B     .     .     .     -0.21   *    *     .     -0.10     0.45
 Leu  609     .     .     B     B     .     .     .     0.18   *    *     .     -0.35     0.34
 Gln  610     .     .     B     B     .     .     .     0.22   *    *     .     -0.60     0.33
 Trp  611     .     .     B     B     .     .     .     0.32   *    .     .     -0.60     0.79
 Val  612     .     .     B     B     .     .     .     -0.27   *    .     .     -0.45     1.50
 Pro  613     .     .     B     .     .     T     .     0.20   *    .     .     -0.20     0.88
 Res  Pos. Garni.. Alpha  Chou-...  Alpha   Garni..   Beta   Chou-...   Beta    Garni..    Turn  Chou-...  Turn  Garni..  Coil  Kyte-...  Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi...   James...   Antig...   Emini   Surfa...
 Lys  614     .     .     B      .     .     T     .     0.16   *    *     .     -0.20     0.82
 Tyr  615     .     .     B      .     .     T     .     -0.14   .    .     .     0.10     0.82
 Ala  616     .     .     .      .     T     T     .     -0.07   *    *     .     0.50     0.71
 Gly  617     .     .     .      .     T     .     .     0.90   *    .     .     0.64     0.55
 Val  618     .     .     B      .     .     .     .     1.11   .    *     .     0.58     0.69
 Ser  619     .     .     B      .     .     T     .     1.18   .    *     F     2.32     1.14
 Pro  620     .     .     B      .     .     T     .     0.76   .    *     F     2.66     2.26
 Arg  621     .     .     .      .     T     T     .     1.39   .    *     F     3.40     1.63
 Asp  622     .     .     .      .     T     T     .     0.92   .    *     F     3.06     2.43
 Arg  623     .     A     .      .     T     .     .     1.08   .    *     F     2.32     1.30
 Cys  624     .     A     B      .     .     .     .     0.71   *    *     F     1.43     0.57
 Lys  625     .     A     B      .     .     .     .     1.03   *    *     .     0.64     0.18
 Leu  626     .     A     B      .     .     .     .     0.33   *    *     .     0.30     0.18
 Phe  627     .     A     B      .     .     .     .     0.44   .    *     .     0.04     0.35
 Cys  628     .     A     B      .     .     .     .     -0.01   .    *     .     0.98     0.34
 Arg  629     .     A     B      .     .     .     .     0.77   *    *     .     1.32     0.41
 Ala  630     A     .     .      .     .     T     .     0.42   *    *     .     2.36     0.92
 Arg  631     .     .     .      .     T     T     .     1.23   .    *     F     3.40     2.31
 Gly  632     .     .     .      .     T     T     .     1.23   .    *     F     3.06     2.04
 Arg  633     .     .     .      .     T     T     .     1.94   .    *     F     2.72     1.75
 Ser  634     A     A     .      .     .     .     .     0.98   *    *     F     1.58     1.79
 Res  Pos. Garni.. Alpha  Chou-...  Alpha   Garni..   Beta   Chou-...   Beta  Garni..  Turn    Chou-...    Turn   Garni..   Coil   Kyte-...   Hydro... Eisen... Alpha   Eisen...   Beta   Karpl...   Flexi... James... Antig...  Emini  Surfa...
 Glu  635     A      A     .     .     .       .     .     0.87   *     *     F     1.24     1.34
 Phe  636     A      A     .     .     .       .     .     0.76   *     *     F     0.45     0.59
 Lys  637     A      A     .     .     .       .     .     0.51   *     *     .     0.30     0.77
 Val  638     A      A     .     .     .       .     .     0.44   *     *     .     0.30     0.45
 Phe  639     A      A     .     .     .       .     .     -0.11   .     .     .     0.45     1.03
 Glu  640     A      A     .     .     .       .     .     -1.00   *     .     .     0.30     0.38
 Ala  641     A      .     .     B     .       .     .     -0.30   *     .     .     -0.30     0.36
 Lys  642     A      .     .     B     .       .     .     -0.69   .     .     .     0.30     0.70
 Val  643     A      .     .     B     .       .     .     -0.14   .     .     .     0.60     0.40
 Ile  644     A      .     .     B     .       .     .     -0.26   .     *     F     0.45     0.57
 Asp  645     .      .     B     B     .       .     .     -0.92   .     .     F     0.45     0.23
 Gly  646     .      .     B     B     .       .     .     -0.68   *     .     F     -0.45     0.17
 Thr  647     .      .     B     B     .       .     .     -0.93   *     .     F     -0.15     0.24
 Leu  648     .      .     .     B     .       .     C     -0.08   .     .     F     0.05     0.22
 Cys  649     .      .     .     B     T       .     .     0.50   *     *     .     0.10     0.39
 Gly  650     .      .     .     .     .       T     C     -0.31   .     .     F     0.45     0.39
 Pro  651     .      .     .     .     T       T     .     -0.56   .     .     F     0.65     0.39
 Glu  652     A      .     .     .     .       T     .     -1.13   .     .     F     0.25     0.73
 Thr  653     A      .     .     .     .       T     .     -0.99   .     .     F     0.25     0.52
 Leu  654     A      .     .     B     .       .     .     -1.18   *     *     .     -0.30     0.18
 Ala  655     .      .     B     B     .       .     .     -0.72   *     *     .     -0.60     0.08
 Ile  656     .      .     B     B     .       .     .     -0.86   .     *     .     -0.60     0.10
  Res  Pos.   Garni..   Alpha Chou-... Alpha   Garni..   Beta     Chou-...     Beta   Garni..   Turn   Chou-...   Turn   Garni..   Coil     Kyte-...     Hydro...   Eisen...   Alpha   Eisen...   Beta   Karpl...   Flexi...   James...   Antig...   Emini   Surfa...
  Cys  657     .       .     B       B     .     .     .     -0.86     .     *     .     -0.60     0.13
  Val  658     A       .     .       B     .     .     .     -1.21     .     *     .     -0.30     0.21
  Arg  659     .       .     B       B     .     .     .     -1.26     .     *     .     -0.30     0.16
  Gly  660     .       .     .       B     T     T     .     -0.62     .     *     F     0.25     0.23
  Gln  661     .       .     B       B     .     .     .     -0.32     .     *     F     0.45     0.61
  Cys  662     .       .     B       B     .     .     .     0.00     .     *     .     0.30     0.32
  Val  663     .       .     B       B     .     .     .     0.19     .     *     .     0.30     0.32
  Lys  664     .       .     B       .     .     T     .     0.08     .     *     .     0.10     0.10
  Ala  665     .       .     B       .     .     T     .     0.39     *     .     .     0.70     0.30
  Gly  666     .       .     B       .     .     T     .     -0.47     *     .     .     0.70     0.56
  Cys  667     .       .     B       .     .     T     .     -0.66     *     *     .     0.70     0.21
  Asp  668     .       .     B       B     .     .     .     0.20     *     *     .     -0.30     0.15
  His  669     .       .     B       B     .     .     .     -0.14     *     .     .     0.30     0.26
  Val  670     .       .     B       B     .     .     .     0.23     *     .     .     0.30     0.64
  Val  671     .       .     B       B     .     .     .     0.69     *     .     .     0.64     0.59
  Asp  672     .       .     B       B     .     .     .     1.40     *     .     F     1.13     0.86
  Ser  673     .       .     B       .     .     T     .     0.59     *     .     F     2.32     2.31
  Pro  674     A       .     .       .     .     T     .     0.62     *     .     F     2.66     2.56
  Arg  675     .       .     .       .     T     T     .     1.52     *     .     F     3.40     2.56
  Lys  676     .       .     .       .     T     T     .     1.71     *     .     F     3.06     3.82
  Leu  677     .       .     .       .     T     .     .     1.37     *     .     F     2.52     1.33
  Asp  678     .       .     .       .     T     T     .     0.81     *     .     F     2.23     0.67
  Res   Pos.   Garni..   Alpha   Chou-...   Alpha   Garni..   Beta     Chou-...     Beta   Garni..   Turn   Chou-...   Turn   Garni..   Coil   Kyte-...   Hydro...   Eisen...   Alphn   Eisen...   Beta   Karpl...   Flexi...   James...   Antig...   Emini   Surfa...
  Lys   679      .       .     B       .      .     T     .     0.36     *     .     F     1.49     0.25
  Cys   680      .       .     B       .      .     T     .     -0.10     *     .     .     0.70     0.16
  Gly   681      .       .     B       .      .     T     .     -0.49     *     .     .     0.70     0.10
  Val   682      .       .     B       .      .     .     .     0.37     *     .     .     -0.10     0.05
  Cys   683      .       .     B       .      .     T     .     0.02     .     .     .     0.10     0.18
  Gly   684      .       .     .       .      T     T     .     -0.02     .     .     F     1.59     0.18
  Gly   685      .       .     .       .      T     T     .     0.34     .     .     F     1.93     0.38
  Lys   686      .       .     .       .      T     T     .     0.02     .     .     F     2.27     0.96
  Gly   687      .       .     .       .      T     .     .     0.99     .     .     F     2.41     0.52
  Asn   688      .       .     .       .      T     T     .     1.70     .     .     F     3.40     1.03
  Ser   689      .       .     B       .      .     T     .     1.19     .     .     F     2.66     1.03
  Cys   690      .       .     B       .      .     T     .     1.23     .     .     F     2.34     0.77
  Arg   691      .       .     B       .      .     T     .     0.84     .     .     F     2.17     0.64
  Lys   692      .       .     B       .      .     .     .     0.89     *     .     F     1.80     0.47
  Val   693      .       .     B       .      .     T     .     0.08     *     .     F     1.98     1.18
  Ser   694      .       .     B       .      .     T     .     0.07     *     .     F     1.70     0.50
  Gly   695      .       .     B       .      .     T     .     0.52     *     .     F     0.93     0.36
  Ser   696      .       .     B       .      .     T     .     0.10     *     .     F     0.46     0.75
  Leu   697      .       .     B       .      .     .     .     0.06     .     *     F     0.39     0.81
  Thr   698      .       .     B       .      .     .     .     0.67     .     .     F     0.37     1.31
  Pro   699      .       .     B       .      .     T     .     0.62     .     .     F     0.10     1.53
  Thr   700      .       .     .       .      T     T     .     0.72     .     .     F     0.50     1.84
 Res  Pos. Garni.. Alpha  Chou-...  Alpha  Garni..  Beta   Chou-...   Beta Garni.. Turn Chou-... Turn   Garni..   Coil   Kyte-...   Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi...   James...   Antig...   Emini   Surfa...
 Asn  701    .    .     B     .     .     T     .     1.02    .     .     F     0.10     2.00
 Tyr  702    .    .     .     .     T     T     .     1.83    *     .     .     0.35     2.08
 Gly  703    .    .     .     .     T     T     .     1.26    *     .     .     0.65     2.41
 Tyr  704    .    .     .     .     T     T     .     0.61    *     .     .     0.35     1.05
 Asn  705    .    .     B     .     .     T     .     0.61    *     .     .     -0.20     0.50
 Asp  706    .    .     B     .     .     T     .     -0.28    *     .     .     0.10     0.72
 Ile  707    .    .     B     B     .     .     .     -0.24    *     .     .     -0.60     0.32
 Val  708    .    .     B     B     .     .     .     -0.49    .     .     .     -0.30     0.31
 Thr  709    .    .     B     B     .     .     .     -0.59    *     .     .     -0.60     0.19
 Ile  710    .    .     B     B     .     .     .     -1.18    .     .     .     -0.60     0.27
 Pro  711    .    .     B     .     .     T     .     -1.49    *     .     .     -0.20     0.36
 Ala  712    .    .     B     .     .     T     .     -0.60    *     .     .     -0.20     0.36
 Gly  713    .    .     .     .     .     T     C     -0.63    .     *     .     0.00     0.83
 Ala  714    .    .     .     .     .     T     C     -0.32    .     *     F     0.15     0.38
 Thr  715    .    .     B     B     .     .     .     -0.29    .     *     F     0.45     0.62
 Asn  716    .    .     B     B     .     .     .     -0.03    .     *     F     -0.15     0.47
 Ile  717    .    .     B     B     .     .     .     0.56    .     *     F     0.45     0.92
 Asp  718    .    .     B     B     .     .     .     1.01    .     *     F     0.60     1.11
 Val  719    .    .     B     B     .     .     .     1.30    .     *     F     0.90     1.35
 Lys  720    .    .     B     B     .     .     .     1.58    .     *     F     0.90     2.58
 Gln  721    .    .     B     .     .     .     .     1.37    .     *     F     1.10     2.10
 Arg  722    .    .     B     .     .     .     .     1.91    .     *     F     1.10     4.38
 Res  Pos.   Garni..   Alpha   Chou-...   Alpha   Garni..   Beta   Chou-...   Beta  Garni..  Turn  Chou-...  Turn  Garni..  Coil   Kyte-...   Hydro... Eisen... Alpha   Eisen...   Beta   Karpl...   Flexi... James... Antig...   Emini   Surfa...
 Ser  723     .     .     .     .     .     .     C     1.06     *    *     F     1.30     2.17
 His  724     .     .     .     .     .     T     C     1.91     *    *     F     1.05     0.93
 Pro  725     .     .     .     .     .     T     C     1.87     .    *     F     1.33     0.82
 Gly  726     .     .     .     .     T     T     .     1.87     *    *     F     1.21     0.99
 Val  727     .     .     B     .     .     T     .     1.41     *    *     F     1.84     1.21
 Gln  728     .     .     B     .     .     .     .     1.71     .    *     F     1.77     0.77
 Asn  729     .     .     B     .     T     T     .     1.50     *    .     F     2.80     1.26
 Asp  730     .     .     .     .     T     T     .     0.90     *    .     F     1.92     2.66
 Gly  731     .     .     .     .     T     T     .     0.66     .    .     F     1.64     1.27
 Asn  732     .     .     B     .     .     T     .     0.70     .    *     F     0.81     0.80
 Tyr  733     .     A     B     .     .     .     .     0.74     .    .     .     -0.32     0.39
 Leu  734     .     A     B     .     .     .     .     0.43     *    .     .     -0.60     0.79
 Ala  735     .     A     B     .     .     .     .     -0.16     *    .     .     -0.60     0.71
 Leu  736     .     A     B     .     .     .     .     0.19     .    .     .     -0.40     0.46
 Lys  737     .     A     B     .     .     .     .     -0.16     .    .     F     0.85     0.93
 Thr  738     .     .     B     .     .     T     .     0.09     .    .     F     1.45     0.91
 Ala  739     A     .     .     .     .     T     .     0.66     .    .     F     2.10     1.91
 Asp  740     .     .     B     .     .     T     .     0.43     .    .     F     2.00     1.50
 Gly  741     .     .     B     .     .     T     .     0.43     .    *     F     1.05     0.86
 Gln  742     .     .     B     .     .     .     .     0.39     .    *     F     0.35     0.70
 Tyr  743     .     .     B     .     .     .     .     0.36     .    *     .     0.30     0.67
 Res  Pos. Garni.. Alpha    Chou-..    Alpha  Garni..  Beta   Chou-...   Beta  Garni..  Turn    Chou-...    Turn   Garni..   Coil     Kyte-...     Hydro... Eisen... Alpha Eisen... Beta Karpl... Flexi...   James...   Antig...   Emini   Surfa...
 Leu  744    .      .     B     .     .       .     .     0.94    .    *     .     -0.20     0.67
 Leu  745    .      .     B     .     .       .     .     0.13    .    *     .     -0.40     0.63
 Asn  746    .      .     B     .     .       T     .     -0.11    .    *     F     -0.05     0.33
 Gly  747    .      .     .     .     T       T     .     -1.00    .    *     F     0.35     0.40
 Asn  748    .      .     .     .     .       T     C     -1.06    .    *     .     0.00     0.34
 Leu  749    .      .     .     .     .       T     C     -0.83    .    *     .     0.00     0.29
 Ala  750    A      A     B     .     .       .     .     -0.91    .    *     .     -0.60     0.29
 Ile  751    .      A     B     .     .       .     .     -0.91    *    *     .     -0.60     0.13
 Ser  752    .      A     B     .     .       .     .     -0.57    *    *     .     -0.60     0.27
 Ala  753    A      A     .     .     .       .     .     -0.57    *    .     .     -0.30     0.46
 Ile  754    A      A     .     .     .       .     .     -0.64    *    .     .     0.45     1.09
 Glu  755    A      A     .     .     .       .     .     -0.87    *    .     F     0.45     0.57
 Gln  756    A      .     .     B     .       .     .     -0.83    .    *     F     0.45     0.47
 Asp  757    A      .     .     B     .       .     .     -0.49    .    *     F     -0.15     0.49
 Ile  758    A      .     .     B     .       .     .     -0.24    .    *     .     0.60     0.57
 Leu  759    A      .     .     B     .       .     .     0.33    .    *     .     0.30     0.33
 Val  760    A      .     .     B     .       .     .     -0.56    .    *     .     0.30     0.28
 Lys  761    A      .     .     B     .       .     .     -1.37    .    *     F     -0.45     0.28
 Gly  762    .      .     B     B     .       .     .     -1.32    .    *     F     -0.45     0.28
 Thr  763    .      .     B     B     .       .     .     -0.68    .    *     F     0.45     0.76
 Ile  764    .      .     B     B     .       .     .     -0.17    .    .     F     -0.15     0.59
 Leu  765    .      .     B     B     .       .     .     0.34    .    *     .     -0.60     0.80
 Res   Pos. Garni.. Alpha    Chou-...    Alpha   Garni..   Beta   Chou-...   Beta   Garni..   Turn   Chou-...   Turn   Garni..   Coil Kyte-... Hydro... Eisen... Alpha  Eisen...  Beta   Karpl...   Flexi...   James...   Antig...   Emini   Surfa...
 Lys   766     .       .     B     B     .     .     .     0.00     .    *     F     -0.45     0.55
 Tyr   767     .       .     B     .     .     T     .     -0.54     *    *     F     0.40     1.05
 Ser   768     .       .     .     .     .     T     C     -0.82     *    *     F     0.45     0.89
 Gly   769     .       .     .     .     .     T     C     -0.24     *    .     F     0.45     0.45
 Ser   770     .       .     .     .     .     T     C     -0.24     .    *     F     0.15     0.42
 Ile   771     .       A     B     .     .     .     .     -0.29     *    *     .     -0.60     0.26
 Ala   772     .       A     B     .     .     .     .     0.07     *    .     .     -0.30     0.45
 Thr   773     .       A     B     .     .     .     .     -0.44     *    *     .     0.30     0.66
 Leu   774     .       A     B     .     .     .     .     -0.10     *    .     .     -0.30     0.77
 Glu   775     A       A     .     .     .     .     .     -0.10     *    .     .     0.45     1.32
 Arg   776     .       A     B     .     .     .     .     0.09     .    .     F     0.60     1.23
 Leu   777     .       A     .     .     T     .     .     0.79     .    .     F     1.00     1.29
 Gln   778     .       A     .     .     T     .     .     0.89     .    .     F     1.30     1.46
 Ser   779     .       A     .     .     T     .     .     0.89     .    .     F     1.00     1.15
 Phe   780     .       .     B     .     .     .     .     0.68     *    .     F     0.41     1.15
 Arg   781     .       .     .     .     .     .     C     0.57     .    *     F     0.82     1.03
 Pro   782     .       .     .     .     .     .     C     1.17     *    .     F     1.63     1.33
 Leu   783     .       .     .     .     .     T     C     0.36     *    .     F     2.04     2.37
 Pro   784     .       .     .     .     .     T     C     0.34     *    *     F     2.10     1.00
 Glu   785     .       .     .     .     .     T     C     0.19     *    *     F     1.29     0.93
 Pro   786     .       .     B     .     .     T     .     0.08     *    *     F     0.88     0.84
 Leu   787     .       .     B     B     .     .     .     -0.52     .    *     F     0.27     0.94
 Res  Pos. Garni.. Alpha   Chou-...   Alpha    Garni..    Beta    Chou-...    Beta   Garni..   Turn   Chou-...   Turn  Garni..  Coil   Kyte-...   Hydro... Eisen... Alpha  Eisen...  Beta  Karpi...  Flexi... James... Antig...   Emini   Surfa...
 Thr  788    .     .     B     B     .     .     .     -0.52   .    *     .     -0.09     0.45
 Val  789    .     .     B     B     .     .     .     -0.62   .    .     .     -0.60     0.24
 Gln  790    .     .     B     B     .     .     .     -1.48   .    .     .     -0.60     0.42
 Leu  791    .     .     B     B     .     .     .     -1.48   .    .     .     -0.60     0.21
 Leu  792    .     .     B     B     .     .     .     -1.01   .    *     .     -0.60     0.45
 Thr  793    .     .     B     B     .     .     .     -0.70   .    *     .     -0.60     0.26
 Val  794    .     .     B     .     .     T     .     -0.70   *   .     F     0.25     0.54
 Pro  795    .     .     B     .     .     T     .     -1.40   *   .     F     0.25     0.48
 Gly  796    .     .     B     .     .     T     .     -0.80   *   .     F     -0.05     0.29
 Glu  797    .     .     B     .     .     T     .     -0.20   .   *     F     0.25     0.60
 Val  798    .     .     B     .     .     .     .     0.16   .   *     F     0.05     0.60
 Phe  799    .     .     B     .     .     .     .     0.16   .   *     F     1.00     1.22
 Pro  800    .     .     B     .     .     T     .     0.41   *   *     F     1.25     0.52
 Pro  801    .     .     .     .     T     T     .     0.51   *   *     F     2.00     1.41
 Lys  802    .     .     .     .     T     T     .     0.20   *   *     F     1.60     2.55
 Val  803    .     .     B     .     .     T     .     0.36   .   *     F     2.00     2.38
 Lys  804    .     .     B     B     .     .     .     0.36   .   *     F     0.80     1.33
 Tyr  805    .     .     B     B     .     .     .     -0.29   .   *     .     0.00     0.58
 Thr  806    .     .     B     B     .     .     .     -0.29   .   *     .     -0.20     0.58
 Phe  807    .     .     B     B     .     .     .     -0.33   .   *     .     -0.40     0.45
 Phe  808    .     .     B     B     .     .     .     0.52   *   *     .     -0.60     0.46
 Val  809    .     .     B     .     .     T     .     -0.38   *   *     .     -0.20     0.53
 Res  Pos. Garni.. Alpha   Chou-...   Alpha  Garni..  Beta   Chou-...   Beta  Garni..  Turn    Chou-...    Turn   Garni..   Coil   Kyte-...   Hydro... Eisen... Alpha  Eisen...  Beta  Karpl...  Flexi... James... Antig...  Emini  Surfa...
 Pro  810     .     .     B     .     .       T     .     -0.13     .     *      F     -0.05     0.45
 Asn  811     .     .     .     .     T       T     .     -0.52     .     *      F     1.25     0.88
 Asp  812     .     .     .     .     T       T     .     -0.12     .     *      F     1.40     1.02
 Val  813     A     .     .     .     .       .     .     -0.02     *     *      F     0.65     0.89
 Asp  814     A     .     .     .     .       .     .     0.83     *     *      F     0.50     0.54
 Phe  815     A     .     .     .     .       .     .     0.74     .     *      F     0.80     0.57
 Ser  816     A     .     .     .     .       .     .     0.44     .     *      F     0.65     1.02
 Met  817     A     .     .     .     .       .     .     0.49     .     *      F     1.40     0.82
 Gln  818     A     .     .     .     .       T     .     1.34     .     *      F     2.20     1.89
 Ser  819     .     .     .     .     .       T     C     1.46     .     *      F     3.00     2.44
 Ser  820     .     .     .     .     .       T     C     1.57     .     *      F     2.70     4.84
 Lys  821     A     .     .     .     .       T     .     1.56     .     *      F     2.20     2.82
 Glu  822     A     .     .     .     .       .     .     1.84     .     *      F     1.70     3.04
 Arg  823     A     .     .     B     .       .     .     1.84     *     *      F     1.20     3.27
 Ala  824     A     .     .     B     .       .     .     1.26     *     *      F     0.90     2.63
 Thr  825     .     .     B     B     .       .     .     0.67     *     *      F     0.60     1.06
 Thr  826     .     .     B     B     .       .     .     0.62     *     *      F     -0.15     0.38
 Asn  827     .     .     B     B     .       .     .     0.41     *     *      .     -0.60     0.65
 Ile  828     .     .     B     B     .       .     .     -0.51     *     *      .     -0.60     0.70
 Ile  829     .     .     B     B     .       .     .     -0.73     *     .      .     -0.60     0.40
 Gln  830     .     A     B     .     .       .     .     -0.46     *     .      .     -0.60     0.21
 Pro  831     .     A     B     .     .       .     .     -0.73     *     .      .     -0.60     0.40
 Res  Pos. Garni.. Alpha    Chou-...    Alpha  Garni..  Beta    Chou-...    Beta   Garni..   Turn     Chou-...     Turn   Garni..   Coil   Kyte-...   Hydro... Eisen... Alpha  Eisen...  Beta  Karpl...  Flexi...  James...  Antig...  Emini  Surfa...
 Leu  832   .     A    B     .     .     .     .     -0.73    *    *     .     -0.60     0.57
 Leu  833   .     A    B     .     .     .     .     -0.13    .    .     .     -0.60     0.57
 His  834   .     A    B     .     .     .     .     -0.10    .    *     .     -0.60     0.39
 Ala  835   .     A    B     B     .     .     .     -0.91    .    *     .     -0.60     0.35
 Gln  836   .     A    B     B     .     .     .     -1.04    .    .     .     -0.60     0.35
 Trp  837   .     A    B     B     .     .     .     -0.23    .    .     .     -0.60     0.26
 Val  838   .     A    B     B     .     .     .     0.29    .    *     .     -0.60     0.42
 Leu  839   .     .    B     .     .     T     .     0.02    *    .     .     -0.20     0.26
 Gly  840   .     .    .     .     T     T     .     0.61    *    .     .     0.45     0.33
 Asp  841   .     .    .     .     T     T     .     -0.06    .    .     F     1.15     0.76
 Trp  842   .     .    .     .     T     T     .     -0.07    .    .     F     2.00     0.50
 Ser  843   .     .    .     .     .     T     .     0.49    *    .     F     2.05     0.67
 Glu  844   .     .    .     .     T     T     .     0.99    .    .     F     2.50     0.54
 Cys  845   .     .    .     .     T     T     .     0.67    .    .     F     1.65     0.74
 Ser  846   .     .    .     .     T     T     .     0.32    .    .     F     2.00     0.30
 Ser  847   .     .    .     .     T     .     .     0.02    .    .     F     1.55     0.17
 Thr  848   .     .    .     .     T     .     .     -0.02    .    .     F     0.70     0.32
 Cys  849   .     .    .     .     T     .     .     -0.31    .    .     F     0.45     0.24
 Gly  850   .     .    .     .     T     T     .     0.36    *    .     .     0.20     0.18
 Ala  851   .     .    .     .     T     T     .     0.77    .    .     .     0.20     0.22
 Gly  852   .     .    .     .     T     T     .     1.18    .    .     .     0.50     0.81
 Trp  853   .     .    .     .     T     T     .     1.18    *    .     .     1.25     1.60
 Res    Pos. Garni.. Alpha   Chou-...   Alpha   Garni..   Beta    Chou-...    Beta   Garni..   Turn     Chou-...     Turn  Garni..  Coil    Kyte-...    Hydro... Eisen... Alpha Eisen... Beta   Karpl...   Flexi...    James...    Antig...  Emini  Surfa...
 Gln   854    .        .     B     B     .       .     .     0.99    *    .     F     0.60     2.29
 Arg   855    .        .     B     B     .       .     .     1.33    *    .     F     0.60     1.72
 Arg   856    .        .     B     B     .       .     .     1.26    .    *     F     0.90     2.83
 Thr   857    .        .     B     B     .       .     .     1.71    .    .     F     1.05     0.87
 Val   858    .        .     B     B     .       .     .     2.00    .    .     .     1.20     0.87
 Glu   859    .        .     B     B     .       .     .     1.79    .    .     .     1.50     0.75
 Cys   860    .        .     .     .     T       .     .     1.38    .    *     .     2.40     0.80
 Arg   861    .        .     .     .     T       .     .     0.92    .    .     F     3.00     1.44
 Asp   862    .        .     .     .     .       T     C     1.23    .    *     F     2.55     0.82
 Pro   863    .        .     .     .     T       T     .     1.50    .    *     F     2.60     2.66
 Ser   864    .        .     .     .     T       T     .     1.20    .    *     F     2.30     1.37
 Gly   865    .        .     .     .     T       T     .     1.28    .    .     F     1.70     1.10
 Gln   866    A        .     .     .     .       .     .     0.86    .    *     F     0.05     0.72
 Ala   867    .        .     B     .     .       .     .     0.19    .    *     F     0.05     0.78
 Ser   868    .        .     B     .     .       .     .     0.40    .    *     .     -0.10     0.42
 Ala   869    A        .     .     .     .       .     .     0.74    .    *     .     -0.10     0.39
 Thr   870    A        .     .     .     .       T     .     0.50    *    .     .     0.70     0.77
 Cys   871    A        .     .     .     .       T     .     -0.31    *    .     .     0.70     0.58
 Asn   872    A        .     .     .     .       T     .     0.32    *    .     .     0.10     0.48
 Lys   873    A        .     .     .     .       T     .     0.41    .    .     F     0.85     0.66
 Ala   874    A        .     .     .     .       .     .     1.00    *    .     F     0.80     1.90
 Leu   875    A        .     .     .     .       .     .     1.31    *    .     F     1.10     2.05
 Res  Pos. Garni.. Alpha   Chou-...   Alpha    Garni..    Beta Chou-... Beta Garni.. Turn   Chou-...   Turn  Garni..  Coil   Kyte-...   Hydro... Eisen... Alpha  Eisen...  Bets  Karpl...  Flexi...   James...   Antig...  Emini  Surfa...
 Lys  876     A     .      .     .     .     T     .     1.39     .     .     F     1.30     1.71
 Pro  877     A     .      .     .     .     T     .     1.43     .     .     F     1.30     1.71
 Glu  878     A     .      .     .     .     T     .     1.18     .     .     F     1.30     4.14
 Asp  879     A     .      .     .     .     T     .     1.10     .     .     F     1.30     3.20
 Ala  880     A     .      .     .     .     .     .     1.91     .     .     F     1.10     1.11
 Lys  881     A     .      .     .     .     T     .     1.57     .     .     F     1.30     1.11
 Pro  882     A     .      .     .     .     T     .     1.78     *     .     F     1.15     0.89
 Cys  883     A     .      .     .     .     T     .     0.97     *     .     F     1.30     1.53
 Glu  884     A     .      .     .     .     T     .     0.30     .     .     F     1.15     0.63
 Ser  885     A     A      .     .     .     .     .     0.68     *     .     F     -0.15     0.22
 Gln  886     .     A      B     .     .     .     .     -0.18     *     .     F     -0.15     0.63
 Leu  887     .     A      B     .     .     .     .     -0.36     .     .     .     -0.30     0.30
 Cys  888     .     A      B     .     .     .     .     -0.08     .     .     .     -0.60     0.29
 Pro  889     .     A      B     .     .     .     .     -0.47     .     .     .     -0.60     0.21
 Leu  890     .     .      B     .     .     .     .     -0.56     .     .     .     -0.40     0.33
发明详述
通过用编码TSP-1抗血管生成结构域的cDNA筛选cDNA文库,本发明发明者已鉴定了两种新的蛋白质METH1和METH2(作为血管内皮生长拮抗物也分别称VEGA-1和VEGA-2),它们包括TSP-1的抗血管生成结构域、金属蛋白酶结构域和类去整联蛋白结构域。本发明发明者已证实METH1和METH2均具抗血管生成活性。
因而,本发明提供了含编码具SEQ ID NO:2中所示氨基酸序列的METH1多肽之多核苷酸的分离核酸分子,它是通过对cDNA克隆测序进行测定的。本发明METH1蛋白与血小板反应蛋白-1和pNPI具序列同源性。SEQ IDNO:1中所示核苷酸序列是通过对cDNA克隆测序而获得,该克隆于1998年1月15日保藏于美国典型培养物保藏中心,10801 UniversityBoulevard,Manasssas,Virginia20110-2209,接收号为209581。ATCC保藏号209581中所含的cDNA克隆包括编码SEQ ID NO:2中1-950位氨基酸的METH1序列。
本发明还提供了含编码具SEQ ID NO:4中所示氨基酸序列的METH2多肽之多核苷酸的分离核酸分子,它是通过对cDNA克隆测序而部分测定的。本发明METH2蛋白与血小板反应蛋白-1和pNPI具序列同源性。SEQ IDNO:3中所示核苷酸序列是通过对cDNA克隆测序而部分获得的,该克隆于1998年1月15日保藏于美国典型培养物保藏中心,10801 UniversityBoulevard,Manasssas,Virginia20110-2209,接收号为209582。ATCC保藏号209582中所含的cDNA克隆包括编码SEQ ID NO:4中112-890位氨基酸的部分METH2序列。
核酸分子
此处通过DNA分子测序确定的一些核苷酸序列是用自动DNA测序仪测定的(如来自Applied Biosystem,Inc的Model 373),本文所测定DNA分子编码的多肽的所有氨基酸序列是通过翻译以上所测DNA序列而推测的。因此,正如本领域已知用此自动方法所测任何DNA序列一样,本文所测的任何核苷酸序列可能含有某些错误。自动化测定的核苷酸序列一般与所测DNA分子的真实核苷酸序列至少约90%相同,更通常地至少约95%-99.9%相同。真实的序列可用其它方法更准确地测定,包括本领域众所周知的人工DNA测序方法。又如本领域中已知的,与真实的序列相比,所测核苷酸序列中单个插入或缺失将造成该核苷酸序列翻译中发生移码,以至由所测核苷酸序列编码的预计氨基酸序列自所说的插入或缺失位点开始将完全不同于所测DNA分子真正编码的氨基酸序列。
利用本文提供的信息,如SEQ ID NO:1或SEQ ID NO:3中的核苷酸序列,可用标准克隆和筛选方法获得编码METH1或METH2多肽的本发明核酸分子,诸如那些用于以mRNA为原材料的克隆cDNA的方法。作为本发明的例证,SEQ ID NO:1中所述核酸分子发现于来自人心脏的cDNA文库,而SEQ ID NO:3中所述核酸分子发现于来自人肺的cDNA文库。所测的SEQID NO:1中METH1 cDNA核苷酸序列含编码约950个氨基酸残基长蛋白质的开放阅读框架,其中包括约28个氨基酸残基长的预计前导序列。本发明发明者已测定SEQ ID NO:3中METH2 cDNA核苷酸序列含编码约890个氨基酸残基长蛋白质的开放阅读框架,其中包括约23个氨基酸残基长的预计前导序列。
本发明还提供了成熟形式的本发明METH1和METH2蛋白质。按照信号假说,哺乳动物细胞所分泌的蛋白质具有信号或分泌前导序列,一旦正在生长的蛋白质链已开始穿越粗面内质网,这种序列即从成熟蛋白质上切割下来。大部分哺乳动物细胞和甚至昆虫细胞以相同的特异性切割分泌的蛋白质。然而,在某些情况下,分泌蛋白质的切割不完全相同,这将导致两个或多个成熟种类的蛋白质。此外,长期以来已知分泌蛋白质的切割特异性最终由完整蛋白质的一级结构所决定,也就是说,它是多肽氨基酸序列内所固有的。因此,本发明提供了编码成熟METH1多肽的核苷酸序列,该多肽具有由鉴定为ATCC保藏号209581的宿主所含cDNA克隆编码并如SEQ ID NO:2所示的氨基酸序列。本发明也提供了编码成熟METH2多肽的核苷酸序列,该多肽具有如SEQ ID NO:4所示的氨基酸序列。成熟METH1蛋白质具有由鉴定为ATCC保藏号209581的宿主所含cDNA克隆编码的氨基酸序列表示通过被保藏宿主内载体所含克隆之人DNA序列编码的完整开放阅读框架在哺乳动物细胞(如下述的COS细胞)的表达中产生的成熟形式的METH1蛋白质。如下所示,具有由ATCC保藏号209581中cDNA克隆编码的氨基酸序列的成熟METH1可以相同或不同于SEQ ID NO:2所示(约第29-950位氨基酸)的预计“成熟”METH1蛋白质,这取决于以计算机分析为基础的预计切割位点的精确度;而成熟METH2可以相同或不同于SEQ ID NO:4所示(约第24-890位氨基酸)的预计“成熟”METH2蛋白质,这也取决于以计算机分析为基础的预计切割位点的精确度。
用于预计蛋白质是否具有分泌前导序列以及该前导序列切割位点的方法是可获得的。例如,可利用McGeoch(病毒研究3:271-286(1985))和yon Heinje(核酸研究14:4683-4690(1986))的方法。这些方法中每一个预计已知哺乳动物分泌蛋白质切割点的精确度范围为75-80%。VonHeinje,同上。然而,对于所给蛋白质,两种方法并非总能得到相同的预计切割点。
在本文中,用计算机软件(“PSORT”)(K.Nakai和M.Kanehisa,Genomics14:897-911(1992))分析本发明完整METH1和METH2多肽的预计氨基酸序列,这是一个基于氨基酸序列预计蛋白质之细胞定位的专门系统。作为此计算机预计定位的部分,也使用McGeoch和von Heinje的方法。用PSORT软件进行的分析预测切割位点在SEQ ID NO:2中是氨基酸28-29之间,而在SEQ ID NO:4中是氨基酸23-24之间。其后,应用简单形式的von Heinje(-1、-3)规则通过目测进一步分析该完整的氨基酸序列。von Heinje,同上。因而,预计METH1蛋白质的前导序列由SEQ IDNO:2中约1-28位氨基酸残基组成,而预计成熟METH1蛋白质由约29-950位氨基酸残基组成;预计METH2蛋白质的前导序列由SEQ ID NO:4中约1-23位氨基酸残基组成,而预计成熟METH2蛋白质由约24-890位氨基酸残基组成。另一种预计成熟METH1蛋白质由SEQ ID NO:2中约30-950位残基组成。
作为常规技术人员应当理解,由于测序的可能性错误以及在不同已知蛋白质中前导序列切割位点的可变性,由所保藏cDNA编码的预计METH1多肽包括约950个氨基酸,但也可以是910-990个氨基酸范围内任何数目;预计该蛋白质的前导序列约为28个氨基酸,但也可以是约18-38个氨基酸范围内任何数目。此外,预计METH2多肽包括约890个氨基酸,但也可以是850-约930个氨基酸范围内任何数目;预计该蛋白质的前导序列约为23个氨基酸,但也可以是约13-33个氨基酸范围内任何数目。
正如所表明的,本发明的核酸分子可以是诸如mRNA之类的RNA形式,或是DNA形式,包括例如通过克隆或合成产生的cDNA和基因组DNA。DNA可以是双链或单链的。单链DNA或RNA可以是编码链,已知为有义链,或可以是非编码链,也称反义链。
“分离的”核酸分子意指已脱离自其天然环境的核酸分子、DNA或RNA。例如,为本发明的目的,载体中所含的重组DNA分子也视为分离的。分离DNA分子的另外例子包括保持在异源宿主细胞中的重组DNA分子或溶液中的纯化(部分地或基本上)DNA分子。分离的RNA分子包括本发明DNA分子在体内或体外的RNA转录物。按照本发明,分离的核酸分子还包括合成产生的这些分子。
本发明的分离核酸分子包括含有如SEQ ID NO:1所示开放阅读框架(ORF)的DNA分子;含成熟METH1蛋白质编码序列的DNA分子;以及含有基本不同于上述分子,但由于遗传密码的简并性依然编码METH1蛋白质的序列的DNA分子。还包括含有如SEQ ID NO:3所示开放阅读框架(ORF)的DNA分子;含成熟METH2蛋白质编码序列的DNA分子;以及含有基本不同于上述分子,但由于遗传密码的简并性依然编码METH2蛋白质的序列的DNA分子。当然,遗传密码在本领域中是众所周知的。因此,对本领域技术熟练人员来说产生所说的简并变体是常规工作。
另一方面,本发明提供了编码METH1或METH2多肽的分离核酸分子,所述多肽具有分别由以下两质粒中所含cDNA克隆编码的氨基酸序列:于1998年1月15日保藏的ATCC保藏号209581或于1998年1月15日保藏的ATCC保藏号209582。在另外的实施方案中,提供了编码成熟METH1或METH2多肽或缺少N-末端甲硫氨酸的全长METH1或METH2多肽的核酸分子。本发明还提供了具有如SEQ ID NO:1或SEQ ID NO:3所示核苷酸序列或上述保藏克隆中所含METH1或METH2 cDNA的核苷酸序列的分离核酸分子,或具有与上述序列之一互补的序列的核酸分子。这样的分离分子,尤其是DNA分子可用作探针,通过染色体原位杂交用于基因作图,以及通过例如RNA印迹分析用于检测在人组织中METH1或METH2基因的表达。
本发明还涉及本文所述分离核酸分子的片段。具有保藏cDNA的或者如SEQ ID NO:1或SEQ ID NO:3所示核苷酸序列的分离核酸分子的片段指至少约15nt,更优选至少约20nt,还更优选至少约30nt,更优选至少约40nt长的片段,如本文所述它们可用作诊断探针和引物。当然,按照本发明,相应于保藏cDNA或者如SEQ ID NO:1或SEQ ID NO:3所示核苷酸序列大部分甚至全部的较长片段,50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000nt长的片段也是有用的。例如,至少20nt长的片段意指该片段包括来自保藏cDNA或如SEQ ID NO:1或SEQ ID NO:3所示核苷酸序列的20个或更长的连续碱基。
本发明优选的核酸片段包括编码METH1或METH2蛋白质带表位部分的核酸分子。确定METH1或METH2蛋白质带表位部分的方法如下所详述。
其它本发明优选的核酸片段包括编码以下部分的核酸分子:METH1的金属蛋白酶结构域,SEQ ID NO:2中的第235-459位氨基酸;METH1的去整联蛋白结构域,SEQ ID NO:2中的第460-544位氨基酸;METH1的第一个类TSP结构域,SEQ ID NO:2中的第545-598位氨基酸;METH1的第二个类TSP结构域,SEQ ID NO:2中的第841-894位氨基酸;METH1的第三个类TSP结构域,SEQ ID NO:2中的第895-934位氨基酸;SEQ IDNO:2中的第536-613位氨基酸;SEQ ID NO:2中的第549-563位氨基酸;METH2的金属蛋白酶结构域,SEQ ID NO:4中的第214-439位氨基酸;METH2的去整联蛋白结构域,SEQ ID NO:4中的第440-529位氨基酸;METH2的第一个类TSP结构域,SEQ ID NO:4中的第530-583位氨基酸;METH2的第二个类TSP结构域,SEQ ID NO:4中的第837-890位氨基酸;SEQ ID NO:4中的第280-606位氨基酸;SEQ ID NO:4中的第529-548位氨基酸。
此外,本发明的发明者已鉴定出下述cDNA克隆与SEQ ID NO:1中所示序列部分相关:HOUCQ17RA(SEQ ID NO:14)、HPLBM11R(SEQ ID NO:15)、HGBI07R(SEQ ID NO:16)、HNTMA49R(SEQ ID NO:17)、HNALE27R(SEQ IDNO:18)和HIBDB45R(SEQ ID NO:19)。
如下与SEQ ID NO:1的部分相关的公共EST也已鉴定:
              D67076(SEQ ID NO:20),AB001735(SEQ IDNO:21),X14787(SEQ ID NO:22),U64857(SEQ ID NO:23),X04665(SEQ IDNO:24),M64866(SEQ ID NO:25),L07803(SEQ ID NO:26),U08006(SEQ IDNO:27),M16974(SEQ ID NO:28),L13855(SEQ ID NO:29),AL021529(SEQID NO:30),D86074(SEQ ID NO:31),L05390(SEQ ID NO:32),Z69361(SEQID NO:33),X99599(SEQ ID NO:34),AF018073(SEQ ID NO:35),L23760(SEQ ID NO:36),Z46970(SEQ ID NO:37),AC004449(SEQ ID NO:38),Z69589(SEQ ID NO:39),Z22279(SEQ ID NO:40),and X17524(SEQ IDNO:41).
本发明的发明者也已鉴定了如下与SEQ ID NO:3的部分相关的cDNA克隆:HCE4D69FP02(SEQ ID NO:42),HIBDB45F(SEQ ID NO:43),HKIXH64R(SEQ ID NO:44),HIBDB45R(SEQID NO:19),HCE3Z95R(SEQ ID NO:45),HTLEQ90R(SEQ ID NO:46),HMWEF45R(SEQ ID NO:47),HTOFC34RA(SEQ ID NO:48),HHFDI20R(SEQ ID NO:49),HMSHY47R(SEQ ID NO:50),HCESF90R(SEQ ID NO:51),HMCAO46R(SEQ ID NO:52),HTTAQ67R(SEQ ID NO:53),HFKCF19F(SEQ ID NO:54),HMCAS31R(SEQ ID NO:55),HMWGP26R(SEQ IDNO:56),HLHTP36R(SEQ ID NO:57),HE8AN11R(SEQ ID NO:58),HEONN73R(SEQ ID NO:59),HBNBG53R(SEQ ID NO:60),and HMSCH94R(SEQ ID NO:61).
如下与SEQ ID NO:3所示序列的部分相关的公共EST也已鉴定:D67076(SEQ ID NO:20),AB001735(SEQ ID NO:21),AB005287(SEQ ID NO:62),X87619(SEQ IDNO:63),X14787(SEQ ID NO:22),X04665(SEQ ID NO:24),M87276(SEQ IDNO:64),M62458(SEQ ID NO:65),AB002364(SEQ ID NO:66),AB005297(SEQ ID NO:67),X69161(SEQ ID NO:68),X16619(SEQ ID NO:69),I36448(SEQ ID NO:70),L12260(SEQ ID NO:71),I36352(SEQ ID NO:72),X15898(SEQ ID NO:73),I07789(SEQ ID NO:74),I08144(SEQ ID NO:75)U31814(SEQ ID NO:76),and AF001444(SEQ ID NO:77).
在特殊的实施方案中,本发明的多核苷酸小于300kb、200kb、100kb、50kb、15kb、10kb或7.5kb长。在另外的实施方案中,本发明的多核苷酸包括METH1或METH2编码序列的至少15个连续核苷酸,但不包括任何METH1或METH2内含子的全部或部分。在另一实施方案中,含METH1或METH2编码序列的核酸不包含基因组侧翼基因的编码序列(即基因组中METH1或METH2基因的5’或3’)。
另一方面,本发明提供了所含的多核苷酸在严谨的杂交条件下与上述本发明核酸分子内的多核苷酸一部分可杂交的分离核酸分子,所述本发明核酸分子例如是ATCC保藏号209581或ATCC保藏号209582中所含cDNA克隆。“严谨的杂交条件”指在含以下组分的溶液中于42℃温育过夜:50%甲酰胺、5xSSC(750mM NaCl,75mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5xDenhardt’s溶液、10%葡聚糖硫酸和20ug/ml变性的剪切鲑精DNA,随后在0.1xSSC中约65℃洗涤滤膜。
与多核苷酸一部分可杂交的多核苷酸指与参照多核苷酸至少约15个核苷酸(nt),更优选至少约20nt,还更优选至少约30nt,更优选至少约30、40、50、60或70nt可杂交的多核苷酸(DNA或RNA)。如上述及下文详述,它们可用作诊断探针和引物。
例如,“至少20nt长”的多核苷酸部分指来自参照多核苷酸之核苷酸序列(如保藏的cDNA或如SEQ ID NO:1或SEQ ID NO:3所示核苷酸序列)的20个或更多个连续核苷酸。当然,只与polyA序列(分别诸如SEQ IDNO:1和SEQ ID NO:3中所示METH1或METH2 cDNA的3’末端polyA)或一段T(或U)残基互补序列杂交的多核苷酸不包括在用于与本发明核酸一部分杂交的本发明多核苷酸内,因为这样的多核苷酸会与任何含poly(A)或其互补序列的核酸分子(如,几乎任何双链cDNA克隆)杂交。
在适度的高严谨条件下与METH1或METH2多核苷酸可杂交的核酸分子也是所预期的。主要通过控制甲酰胺浓度(较低百分率的甲酰胺导致较低的严谨度)、盐浓度或温度完成杂交严谨度和信号检测的改变。例如,适度的高严谨条件包括在含以下成分的溶液中37℃温育过夜:6XSSPE(20X SSPE=3M NaCl;0.2M NaH2PO4;0.02M EDTA,pH7.4)、0.5%SDS、30%甲酰胺、100ug/ml鲑精封闭DNA;随后在1X SSPE、0.1%SDS中50℃洗涤。此外,为了达到较低的严谨度,可在严谨杂交后在较高的盐浓度下(如5XSSC)进行洗涤。
应注意,以上条件的变化可通过包含和/或替代杂交实验中用于抑制背景的封闭剂而完成。典型的封闭剂包括Denhardt试剂、BLOTTO、肝素、变性鲑精DNA及可购得的配方。由于相容性的问题,具体封闭试剂的加入可能需要对上述严谨条件进行改良。
当然,只与polyA+序列(诸如序列表中所示cDNA的任何3’末端polyA+)或一段T(或U)残基互补序列杂交的多核苷酸不包括在“多核苷酸”的定义内,因为这样的多核苷酸会与任何含poly(A)或其互补序列的核酸分子(如,几乎任何双链cDNA克隆)杂交。
METH1或METH2多核苷酸可含任何多核糖核苷酸或多脱氧核糖核苷酸,它们可以是未修饰的RNA或DNA或者修饰的RNA或DNA。例如,METH1或METH2多核苷酸的组成可以是单链和双链DNA、单链和双链区混合的DNA、单链和双链RNA、单链和双链区混合的RNA、含DNA和RNA的杂合分子,它们可以是单链或更通常是双链,或单链和双链区混合物。此外,METH1或METH2多核苷酸可由含RNA或DNA或二者的三链区组成。METH1或METH2多核苷酸还可包含一个或多个修饰碱基或为了稳定性或其它原因而修饰的DNA或RNA骨架。“修饰”碱基包括,例如,三苯甲基化碱基和如次黄嘌呤核苷之类的稀有碱基。可对DNA和RNA进行多种修饰;因此,“多核苷酸”包含化学、酶促或代谢修饰的形式。
“SEQ ID NO:1”指METH1多核苷酸序列,而“SEQ ID NO:2”指METH1多肽序列。“SEQ ID NO:3”指METH2多核苷酸序列,而“SEQ ID NO:4”指METH2多肽序列。
正如所表明的,本发明编码METH1或METH2多肽的核酸分子可包括,但不局限于,自身编码成熟多肽氨基酸序列的分子;含有成熟多肽的编码序列和附加序列,诸如前导或分泌序列如前-、原-或前原-蛋白质序列的编码序列;成熟多肽的编码序列,有或无前述附加编码序列,另有附加的非编码序列,包括例如,但不局限于内含子和非编码的5’和3’序列,如在转录、mRNA加工包括剪接和多聚腺苷酸化信号中起作用(例如用于核糖体结合和mRNA稳定)的被转录而不翻译的序列;编码附加氨基酸的附加编码序列,如提供附加功能的序列。此外,编码多肽的序列可与标记序列融合,如所编码肽方便融合多肽纯化的序列。在本发明此方面的某些优选实施方案中,标记氨基酸序列是六组氨酸肽,如pQE载体(Qiagen,Inc.)中提供的标记等等,其中许多标记均可购得。例如,如在Gentz等人,美国国家科学院报86:821-824(1989)中所述,六组氨酸可方便融合蛋白质的纯化。“HA”标记是可用于纯化的另一肽,其相应于流感血凝素蛋白质表位,如Wilson等人,细胞37:767-778(1984)中所述。如下所述,其它这样的融合蛋白质包括在N-或C-末端与Fc融合的METH1或METH2。
本发明进一步涉及编码METH1或METH2蛋白质部分、同系物或衍生物的本发明核酸分子变体。变体可天然,如天然等位基因变体。“等位基因变体”指占据生物染色体上一给定位置的数种可变形式基因之一。Lewin,B.编辑,基因II,John Wiley &Sons,纽约(1985)。非天然变体可用本领域已知诱变技术产生。
这类变体包括通过一个或多个核苷酸取代、缺失或添加而产生的变体。变体可能在编码区、非编码区或二者内有改变。编码区内的改变可产生保守或非保守氨基酸的取代、缺失或添加。其中尤其优选的是沉默的取代、缺失或添加,不会改变METH1或METH2蛋白质或其部分的特征和活性。在这点上尤其优选的是保守取代。
本发明的其它实施方案包括含有多核苷酸的分离核酸分子,该多核苷酸的核苷酸序列与以下核苷酸序列至少95%相同,更优选至少96%、97%、98%或99%相同:编码具SEQ ID NO:2中氨基酸序列的多肽的核苷酸序列;编码具SEQ ID NO:2中氨基酸序列但缺少N-端甲硫氨酸的多肽的核苷酸序列;编码具SEQ ID NO:2中约第29-950位氨基酸序列的多肽的核苷酸序列;编码具SEQ ID NO:2中约第30-950位氨基酸序列的多肽的核苷酸序列;编码具ATCC保藏号209581中cDNA克隆编码之氨基酸序列的多肽的核苷酸序列;编码具ATCC保藏号209581中cDNA克隆编码之氨基酸序列的成熟METH1多肽的核苷酸序列;编码SEQ ID NO:2中第235-459位氨基酸的核苷酸序列(METH1的金属蛋白酶结构域);编码SEQ ID NO:2中第460-544位氨基酸的核苷酸序列(METH1的去整联蛋白结构域);编码SEQ ID NO:2中第545-598位氨基酸的核苷酸序列(METH1的第一类TSP结构域);编码SEQ ID NO:2中第841-894位氨基酸的核苷酸序列(METH1的第二类TSP结构域);编码SEQ ID NO:2中第895-934位氨基酸的核苷酸序列(METH1的第三类TSP结构域);编码SEQ ID NO:2中第536-613位氨基酸的核苷酸序列;编码SEQ ID NO:2中第549-563位氨基酸的核苷酸序列;编码具SEQ ID NO:4中氨基酸序列的多肽的核苷酸序列;编码具SEQ ID NO:4中氨基酸序列但缺少N-端甲硫氨酸的多肽的核苷酸序列;编码具SEQ ID NO:4中约第24-890位氨基酸序列的多肽的核苷酸序列;编码具SEQ ID NO:4中约第112-890位氨基酸序列的多肽的核苷酸序列;编码具ATCC保藏号209582中cDNA克隆编码之氨基酸序列的多肽的核苷酸序列;编码具ATCC保藏号209582中cDNA克隆编码之氨基酸序列的成熟METH2多肽的核苷酸序列;编码SEQ ID NO:4中第214-439位氨基酸的核苷酸序列(METH2的金属蛋白酶结构域);编码SEQ ID NO:4中第440-529位氨基酸的核苷酸序列(METH2的去整联蛋白结构域);编码SEQ ID NO:4中第530-583位氨基酸的核苷酸序列(METH2的第一类TSP结构域);编码SEQ ID NO:4中第837-890位氨基酸的核苷酸序列(METH2的第二类TSP结构域);编码SEQ ID NO:4中第280-606位氨基酸的核苷酸序列;编码SEQ ID NO:4中第529-548位氨基酸的核苷酸序列;或与任何上述核苷酸序列互补的核苷酸序列。
具有与编码METH1或METH2多肽的参照核苷酸序列至少例如95%相同的核苷酸序列的多核苷酸指该多核苷酸的核苷酸序列与参照序列大致相同,只是该多核苷酸序列与编码METH1或METH2多肽的参照核苷酸序列相比每100个核苷酸可包括最多5个点突变。换而言之,为了获得具有与参照核苷酸序列至少95%相同的核苷酸序列的多核苷酸,参照序列中最多5%的核苷酸可被缺失或用另外的核苷酸取代,或数目最多为参照序列总核苷酸数5%的核苷酸可插入参照序列中。参照序列的这些突变可发生于参照核苷酸序列的5’或3’末端位置或那些末端位置间的任何位置,它们或分别散布于参照序列的核苷酸中或以一个或多个连续组散布于参照序列中。
在实际情况中,例如,任何特殊核酸分子是否与SEQ ID NO:1或SEQ IDNO:3中所示核苷酸序列或者各保藏cDNA克隆的核苷酸序列至少95%、96%、97%、98%或99%相同可用已知的诸如Bestfit软件(WisconsinSequence Analysis Package,Version8 for Unix,Genetics ComputerGroup,University Research Park,575 Science Drive,Madison,WI53711)之类计算机软件常规地确定。Bestfit利用了Smith和Waterman,应用数学进展(Ad vances in Applied Mathematics)2:482-489(1981)中的局部同源性运算法则来寻找两序列间的最佳同源区段。当用Bestfit或任何其它序列对比软件确定一特殊序列是否与本发明参照序列具如95%相同时,参数当然设置成对参照核苷酸序列全长计算相同性百分比,且高达参照序列总核苷酸数5%的同源缺口允许存在。
确定待查序列(本发明序列)和指示序列间最佳总体匹配的优选方法,也称综合序列对比,可用基于原rutlag等,Comp.Appl.Biosci.6:237-245(1990)运算法则的FASTDB计算机软件确定。在序列对比中,待查和指示序列均为DNA序列。可通过将U转变为T来比较RNA序列。所说综合序列对比的结果以相同性百分比表示。在DNA序列的FASTDB对比中,用于计算相同性百分比的优选参数为:矩阵(Matrix)=Unitary,k-tuple=4,错配罚分(Mismatch Penalty)=1,连接罚分(JoiningPenalty)=30,随机化分组长度(Randomization Group Length)=0,截断分(Cutoff score)=1,缺口罚分(Gap Penalty)=5,缺口大小罚分(Gap Size Penalty)=0.05,窗口大小(Window Size)=500或指示核苷酸序列长度(选择较短者)。
若指示序列由于5’或3’缺失,不是由于内部缺失而比待查序列短,必对结果进行人工矫正。这是因为在计算相同性百分比时,FASTDB软件不考虑指示序列的5’和3’截短。对于相对待查序列而言5’或3’端截短的指示序列,通过计算位于指示序列5’和3’的不相配/匹配的待查序列碱基数作为待查序列总碱基的百分比,矫正相同性百分比。核苷酸是否相配/匹配由FASTDB序列对比的结果决定。然后从用指定参数通过以上FASTDB软件计算的相同性百分比中减去此百分率,以得到最终的相同性百分比值。此修正值即本发明中涉及的值。正如FASTDB序列对比所展示的,人工调整相同性百分比值时,只计算与待查序列不相配/匹配的、位于指示序列5’和3’碱基外的碱基。
例如,一90个碱基长的指示序列与100个碱基长的待查序列排列以确定相同性百分比。缺失发生于指示序列5’端,因此FASTDB序列对比显示5’端头10个碱基不相配/匹配。这10个未配对碱基代表了序列的10%(不匹配的5’和3’端碱基数/待查序列的总碱基数),因此从FASTDB软件计算的相同性百分比中减去10%。若余下90个碱基完全匹配,则最终的相同性百分比为90%。在另一例子中,90个碱基长的指示序列与100个碱基长的待查序列相比较。这次缺失在内部,以致在指示序列的5’和3’端无与待查序列不相配/匹配的碱基。这种情况下,对用FASTDB计算的相同性百分比不作人为的修正。再者,只对与待查序列不相配/匹配的指示序列的5’和3’碱基人为修正。为了本发明的目的,不进行其它的人工修正。
本申请涉及与SEQ ID NO:1或SEQ ID NO:3中所示核苷酸序列或所保藏cDNA的核苷酸序列至少95%、96%、97%、98%或99%相同的核酸分子,不管它们是否编码具METH1或METH2活性的多肽。这是因为即使一特殊核酸分子不编码具METH1或METH2活性的多肽,本领域技术熟练人员仍应知如何利用此核酸分子,例如,作为杂交探针或聚合酶链式反应(PCR)引物。不编码具METH1或METH2活性的多肽的本发明核酸分子的应用特别地包括(1)在cDNA文库中分离METH1或METH2基因或其等位基因变体;(2)与中期染色体丝进行原位杂交(如“FISH”)以得到METH1或METH2基因的准确染色体位置,如Verma等,人染色体:基础技术手册(HumanChromosomes:A Manual of Basic Techniques),Pergamon Press,纽约(1988)中所述;及(3)用于检测在特异组织中METH1或METH2 mRNA表达的RNA印迹分析。
然而,优选的是与SEQ ID NO:1或SEQ ID NO:3中所示核苷酸序列或所保藏cDNA的核苷酸序列至少95%、96%、97%、98%或99%相同,且确实编码具METH1或METH2蛋白活性的多肽的核酸分子。“具METH1活性的多肽”指在特殊生物实验中展现METH1活性的多肽。例如,可用尿囊绒膜试验(Iruela-Arispe等,血栓形成和淤血(Thrombosis andHaemostasis)78(1):672-677(1997))或角膜囊试验(Tolsma等,细胞生物学杂志(J.Cell.Biol.)122:497-511(1993))检测METH1蛋白质活性,这两种试验均可见于以下实施例4中。“具METH2活性的多肽”指在特殊生物实验中展现METH2活性的多肽。例如,可用尿囊绒膜试验(Iruela-Arispe等,血栓形成和止血78(1):672-677(1997))或角膜囊试验(Tolsma等,细胞生物学杂志122:497-511(1993))检测METH2蛋白质的活性,这两种试验均可见于以下实施例4中。
简单的说,在尿囊绒膜试验中,将潜在抗血管生成的目的化合物与bFGF之类的血管生长因子一起加入I类胶原蛋白团块(Vitrogen)中。样品混合并放至尼龙网上,使其聚合。聚合完全后,将网放于12日龄鸡胚的尿囊绒膜上并在37℃放置24小时。然后用FITC-葡聚糖之类的荧光剂注射胚,并将网固定和安放好以便在荧光显微镜下观察。
在角膜囊试验中,将含目的化合物和bFGF之类的血管生长因子的亲水球植入大鼠或小鼠的角膜边缘1-2mm中。一段时间,如5天后,检查反应情况。通过检测角膜边缘毛细管的迁移来评估血管生成的程度。
当然,由于遗传密码的简并性,本领域技术熟练人员将立即认识到,含有与SEQ ID NO:1或SEQ ID NO:3中所示核苷酸序列或所保藏cDNA的核苷酸序列至少95%、96%、97%、98%或99%相同的序列的许多核酸分子可编码“具METH1或METH2蛋白活性的”多肽。事实上,由于这些核苷酸序列的简并变体均编码相同的多肽,即使不进行以上比较实验,这对于本领域技术熟练人员也是显而易见的。在本领域中还将进一步认识到的是,对于非简并变体的核酸分子,其中相当一部分也将编码具METH1或METH2蛋白质活性的多肽。这是因为本领域技术熟练人员完全清楚不太可能或不可能严重影响蛋白质功能的氨基酸取代(如用第二种脂肪族氨基酸置换第一种脂肪族氨基酸)。
例如,关于怎样制备表型沉默的氨基酸取代的指导可见于Bowie,J.U.等,“蛋白质序列的信息解译:对氨基酸取代的容忍(Deciphering theMessage in Protein Sequences:Tolerance to Amino AcidSubstitutions)”,科学247:1306-1310(1990)中,其中作者指出蛋白质对氨基酸取代具有惊人的容忍性。
载体和宿主细胞
本发明还涉及含本发明分离DNA分子的载体、遗传工程改造的含重组载体的宿主细胞及利用重组技术生产METH1或METH2多肽或其片段。
多核苷酸可连接到含选择标记的载体内以在宿主中增殖。通常,通过磷酸钙沉淀之类的沉淀法或与带电荷脂类形成复合物而导入质粒载体。若载体为病毒,可用适当的包装细胞系将其在体外包装并随后转导入宿主细胞。
DNA插入片段应与适当的启动子有效连接,诸如噬菌体λPL启动子、大肠杆菌lac、trp和tac启动子、SV40早、晚期启动子、逆转录病毒LTR启动子,等等。本领域技术熟练人员应知道其他的合适启动子。表达构建体将进一步包括转录起始、终止位点和在转录区内用于翻译的核糖体结合位点。构建体所表达之成熟转录物的编码区将优选包括开始处的翻译起点和恰当定位于待翻译多肽末端的终止密码子(UAA、UGA或UAG)。
正如已表明的,表达载体将优选包括至少一个选择标记。所说的标记包括用于真核细胞培养的二氢叶酸还原酶或新霉素抗性和用于大肠杆菌及其它细菌培养的四环素或氨苄青霉素抗性基因。合适宿主的典型例子包括,但不局限于,细菌细胞,如大肠杆菌、链霉菌和鼠伤寒沙门氏杆菌细胞;真菌细胞,如酵母细胞;昆虫细胞,如果蝇S2和秋粘虫Sf9细胞;动物细胞,如CHO、COS和Bowes黑素瘤细胞;及植物细胞。上述宿主细胞的合适培养基和培养条件是本领域所已知的。
载体中优选用于细菌中的包括pQE70、pQE60和pQE-9,可购自Qiagen;pBS载体、Phagescript载体、Bluescript载体、pNH8A、pNH16a、pNH18A、pNH46A,可购自Stratagene;和ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5,可购自Pharmacia。优选的真核载体包括来自Stratagene的pWLNEO、pSV2CAT、pOG44、pXT1和pSG;及来自Pharmacia的pSVK3、pBPV、pMSG和pSVL。其它的合适载体对本领域技术熟练人员来说将是显然的。
除了表达载体在本发明实践中的应用外,本发明进一步包括含与编码目的蛋白之核苷酸序列有效连接的操纵基因和启动子元件的新表达载体。这种载体的一个例子是下文详述的pHE4-5。
如图8和9中所概述的,pHE4-5载体(SEQ ID NO:12)的组成包括:1)作为选择标记的新霉素磷酸转移酶基因,2)大肠杆菌的复制起点,3)T5噬菌体启动子序列,4)两个lac操纵基因序列,5)SD序列,6)乳糖操纵子阻抑蛋白基因(lacIq)。复制起点(oriC)来自pUC19(LTI,Gaithersburg,MD)。启动子序列和操纵基因序列通过合成制备。核苷酸序列的合成产生在本领域是众所周知的。CLONTECH 95/96 Catalog,第215-216页,CLONTECH,1020 East Meadow Circle,Palo Alto,CA94303。通过将核苷酸序列插入pHE4-5载体中NdeI和Asp718位点之间,编码METH1(SEQ ID NO:2)或METH2(SEQ ID NO:4)的核苷酸序列即与启动子和操纵基因有效连接。
如上所提及,pHE4-5载体含lacIq基因。LacIq是严密调控lac操纵基因的lacI基因的等位基因。Amann,E.等,基因69:301-315(1988);Stark,M.,基因51:255-267(1987)。LacIq基因编码可与lac操纵基因序列结合并封闭下游(即3’)序列的转录的阻遏蛋白。然而,存在乳糖或某些乳糖类似物,如异丙基B-D-硫代半乳糖苷(IPTG)时,lacIq基因产物与lac操纵基因解离。因此在含pHE4-5载体的未诱导宿主细胞中不产生大量METH1或METH2。可是,加入IPTG之类的物质诱导这些宿主细胞,可导致METH1或METH2编码序列的表达。
pHE4-5载体的启动子/操纵基因序列(SEQ ID NO:13)包括T5噬菌体启动子和两个lac操纵基因序列。一操纵基因位于转录起始位点的5’而另一个位于其3’。这些操纵基因与lacIq基因产物一起存在时,在缺少lac操纵子诱导剂如IPTG情况下,它们紧密抑制下游序列。通过加入lac操纵子诱导剂,如IPTG,可诱导位于lac操纵基因下游的有效连接序列的表达。lac诱导剂与lacIq蛋白质的结合导致其脱离lac操纵基因序列,以及有效连接序列的转录起始。基因表达的lac操纵子调节综述于Devlin,T.,生化与临床相互关系(TEXTBOOK OF BIOCHEMISTRY WITHCLINICAL CORRELATIONS),第4版(1997),第802-807页中。
pHE4系列载体包含pHE4-5载体中除METH1或METH2编码序列外的所有组分。pHE4载体的特征包括优化过的合成T5噬菌体启动子、lac操纵基因和SD序列。此外,这些序列还被最佳地间隔开,以便可严密调控插入基因的表达并在诱导时产生高水平的表达。
适用于本发明蛋白质产生的已知细菌启动子包括大肠杆菌lacI和lacZ启动子、T3和T7启动子、gpt启动子、λPR和PL启动子及trp启动子等。合适的真核启动子包括CMV即早期启动子、HSV胸苷激酶启动子、早、晚期SV40启动子、逆转录病毒LTR启动子如劳氏肉瘤病毒(RSV)启动子,和金属硫蛋白启动子如金属硫蛋白-1启动子。
pHE4-5载体还包含位于AUG起始密码子5’的SD序列。SD序列是通常位于AUG起始密码子上游(即5’)约10个核苷酸处的短序列。这些序列本质上是指导原核核糖体至AUG起始密码子处。
此外,本发明还涉及可用于本发明蛋白质生产的表达载体。本发明的这一方面通过pHE4-5载体(SEQ ID NO:12)举例说明。
可用磷酸钙转染、DEAE-葡聚糖介导转染、阳离子脂类介导的转染、电穿孔、转导、感染或其它方法将构建体引入宿主细胞。这样的方法可见于许多标准实验室手册中,如Davis等,分子生物学基本方法(BasicMethods In Molecular Biology)(1986)。
多肽可以融合蛋白之类的修饰形式表达,不仅可包含分泌信号肽,还可包含附加的异源功能区。例如,可将另外的氨基酸区域,尤其是带电荷氨基酸加到多肽的N-末端以提高在宿主细胞内,纯化或随后的处理和保存中的稳定性和持续性。此外,可将肽部分加到多肽上以便于纯化。这样的区域可在多肽最终制备前去除。添加肽部分至多肽上以便分泌或排泄、提高稳定性和方便纯化等等是本领域所熟知和常规的技术。优选的融合蛋白包含来自免疫球蛋白的可用于溶解蛋白质的异源区。例如,EP-A-O 464533(加拿大对应文件2045869)公开了含免疫球蛋白分子恒定区不同部分及另一种人蛋白质或其部分的融合蛋白。在许多情况中,融合蛋白内的Fc部分非常利于在治疗和诊断中使用,因而导致例如改善药物动力学特性(EP-A0232 262)。另一方面,为了某些用途,可能期望在融合蛋白以上述有利形式表达、检测和纯化后能删除Fc部分。当Fc部分被证实妨碍治疗和诊断使用,例如当融合蛋白用作免疫抗原时即是如此。例如,在药物发明中,为了达到鉴定hIL-5拮抗物的高流通量筛选试验的目的,已将hIL5-受体之类的人蛋白质与Fc部分融合。参阅,D.Bennett等,J.Mol.Recognition8:52-58(1995)和K.Johanson等,生物化学杂志270(16):9459-9471(1995)。
用众所周知的方法可从重组细胞培养物中回收和纯化METH1或METH2蛋白质,包括硫酸铵或酒精沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟磷灰石层析和外源凝集素层析。最优选高效液相层析(“HPLC”)用于纯化。本发明的多肽包括天然纯化产物、化学合成方法的产物,和用重组技术自真核或原核宿主生产的产物,包括例如细菌、酵母、高等植物、昆虫和哺乳动物细胞。本发明多肽可以是糖基化或非糖基化的,这取决于重组生产方法中所用宿主。此外,本发明多肽还可包括起始的修饰甲硫氨酸,在某些情况下是宿主介导加工的结果。
METH1和METH2多肽及片段
本发明进一步提供了具保藏cDNA编码之氨基酸序列或SEQ ID NO:2中氨基酸序列的分离METH1多肽,或含上述多肽一部分的肽或多肽。本发明进一步提供了具保藏cDNA编码之氨基酸序列或SEQ ID NO:4中氨基酸序列的分离METH2多肽,或含上述多肽一部分的肽或多肽。
METH1或METH2多肽可由通过肽键或被修饰肽键,即肽同配基(isosteres)相互连接的氨基酸组成,并可包含20种基因编码氨基酸之外的氨基酸。可通过诸如翻译后加工之类的天然加工或本领域众所周知的化学修饰技术修饰METH1或METH2多肽。在基础课本和更详尽的专论及许多研究文献中对这些修饰都有很好的描述。修饰可发生于METH1或METH2多肽中的任何位置,包括肽骨架、氨基酸侧链和氨基或羧基端。应当理解,在所给METH1或METH2多肽的数个位点处可存在相同或不同程度的同类修饰。此外,所给METH1或METH2多肽可包含多种类型的修饰。METH1或METH2多肽可以是分枝的,例如由于遍在蛋白化的结果,它们也可以是环状的,有或无分枝。环状、分枝和分枝环状的METH1或METH2多肽可在翻译后天然加工产生或可用合成方法制备。修饰包括乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价添加、血红素部分的共价添加、核苷酸或核苷酸衍生物的共价添加、脂类或脂类衍生物的共价添加、磷脂酰肌醇(phosphotidylinositol)的共价添加、交联、环化、二硫键形成、脱甲基化、共价交联的形成、半胱氨酸形成、焦谷氨酸形成、甲酰化、γ羧化、糖基化、GPI锚形成、羟基化、碘化、甲基化、肉豆蔻酰化、氧化、PEG化、蛋白水解加工、磷酸化、异戊二烯化、外消旋化、硒化(selenoylation)、硫酸化、如精氨酰化之类的转移RNA介导的氨基酸加入蛋白质中和遍在蛋白化。(参阅,例如,蛋白质的结构和分子特性(PROTEINS STRUCTURE AND MOLECULAR PROPERTIES),第二版,T.E.Creighton,W.H.Freeman和Company,纽约(1993);蛋白质的翻译后共价修饰(POSTTRANSLATIONAL COVALENT MODIFICATION OF PROTEINS),B.C.Johnson编辑,Academic Press,纽约,第1-12页(1983);Seifter等,酶学方法182:626-646(1990);Rattan等,Ann NY Acad Sci663:48-62(1992))。
在本领域中应当认识到,METH1或METH2多肽的一些氨基酸序列可变化而不显著影响蛋白质的结构和功能。如果这些序列中的差异也包括在内,应当记住在蛋白质中存在决定活性的关键区域。
本项发明者已表明,METH1和METH2可抑制体外和体内的血管形成。METH1和METH2均含金属蛋白酶结构域、去整联蛋白结构域和类TSP结构域。金属蛋白酶结构域可能具催化活性。去整联蛋白结构域可能通过与整联蛋白相互作用而在抑制血管形成中起作用,因为整联蛋白在增殖和转移信号的介导中是必需的。本项发明者已表明,来自METH1和METH2类TSP结构域的肽可抑制体外和体内的血管形成。
此外,本发明还包括显示实质性METH1多肽活性或含如下述蛋白质部分之类METH1蛋白区的METH1多肽变种;和显示实质性METH2多肽活性或含如下述蛋白质部分之类METH2蛋白区的METH2多肽变种。所说的突变体包括缺失、插入、倒置、重复和类型取代。如上所表明的,关于哪些氨基酸可能是表型沉默的指导可见如下文献:Bowie,J.U.等,“蛋白质序列的信息解译:对氨基酸取代的容忍”,科学247:1306-1310(1990)。
因此,SEQ ID NO:2或SEQ ID NO:4多肽或由保藏cDNA编码的多肽的片段、衍生物或类似物可以是(i)其中一个或多个氨基酸残基被保守或非保守氨基酸残基(优选保守氨基酸残基)取代,该取代氨基酸残基可由或不由遗传密码编码,或(ii)其中一个或多个氨基酸残基含取代基团,或(iii)其中成熟多肽与另一化合物如提高多肽半寿期的化合物(例如聚乙二醇)融合,或(iv)其中另外的氨基酸与成熟多肽融合,如IgGFc融合区域肽或者前导或者分泌序列或者用于成熟多肽纯化的序列或前蛋白序列。根据本文教导,这样的片段、衍生物和类似物在本领域技术熟练人员的范围内。
特别令人感兴趣的是用另一带电氨基酸和用中性或带相反电荷的氨基酸取代带电氨基酸。后者产生带更少正电荷的蛋白质,以改善METH1或METH2蛋白质的性质。十分期望的是防止聚集。蛋白质的聚集不仅导致活性的丧失,还可能在制备药用配方时产生问题,因为它们可能是免疫原性的。(Pinckard等,临床与实验免疫学(Clin.Exp.Immunol.)2:331-340(1967);Robbins等,糖尿病36:838-845(1987);Cleland等,治疗给药物载体系统评述(Crit.Rev.Therapeutic DrugCarrieer Systems)10:307-377(1993))。
如上所指出,优选较小特性的改变,如不显著影响蛋白质折叠或活性的保守氨基酸取代(见表3)。
表3  保守氨基酸取代
芳香族氨基酸     疏水氨基酸     极性氨基酸   碱性氨基酸     酸性氨基酸   小氨基酸   苯丙氨酸 色氨酸 酪氨酸 亮氨酸 异亮氨酸 缬氨酸 谷氨酰胺 天冬酰胺 精氨酸 赖氨酸 组氨酸 天冬氨酸 谷氨酸 丙氨酸 丝氨酸 苏氨酸 甲硫氨酸 甘氨酸
当然,本领域技术熟练人员进行氨基酸取代的数目由许多因素决定,包括上述因素。一般说来,任何所给METH1或METH2多肽的氨基酸取代数目应不超过50、40、30、20、10、5或3个。
用本领域已知方法可鉴定本发明METH1和METH2蛋白质中功能所必需的氨基酸,如定位诱变或丙氨酸扫描诱变(Cunningham和Wells,科学244:1081-1085(1989))。后一种方法在分子的每一残基处引入单个丙氨酸突变。然后检测所产生突变分子诸如在体外或体内抑制血管生成之类的生物学活性。还可用如结晶、核磁共振或光亲和标记之类的结构分析确定对抑制血管生成关键的位点(Smith等,分子生物学杂志(J.Mol.Biol.)224:899-904(1992)和de Vos等,科学255:306-312(1992))。
优选以分离形式提供本发明多肽。“分离多肽”指脱离其天然环境的多肽。因此,为了本发明的目的,重组宿主细胞中产生和/或包含的多肽被视作是分离的。“分离多肽”还指已自重组宿主细胞或天然来源部分或基本上纯化的多肽。例如,用Smith和Johnson,基因67:31-40(1988)中所述的一步方法可基本纯化重组产生的METH1或METH2多肽。
本发明多肽包括由含前导序列之保藏cDNA编码的METH1多肽;由不含前导序列之保藏cDNA编码的成熟METH1多肽(即,成熟蛋白质);含SEQ ID NO:2中约第1-950位氨基酸的多肽;含SEQ ID NO:2中约第2-950位氨基酸的多肽;含SEQ IDNO:2中约第29-950位氨基酸的多肽;含SEQID NO:2中约第30-950位氨基酸的多肽;含METH1金属蛋白酶结构域,SEQ ID NO:2中第235-459位氨基酸的多肽;含METH1去整联蛋白结构域,SEQ ID NO:2中第460-544位氨基酸的多肽;含METH1第一类TSP结构域,SEQ ID NO:2中第545-598位氨基酸的多肽;含METH1第二类TSP结构域,SEQ ID NO:2中第841-894位氨基酸的多肽;含METH1第三类TSP结构域,SEQ ID NO:2中第895-934位氨基酸的多肽;含SEQ ID NO:2中第536-613位氨基酸的多肽;含SEQ ID NO:2中约第549-563位氨基酸的多肽;由含前导序列之保藏cDNA编码的METH2多肽;由不含前导序列之保藏cDNA编码的成熟METH2多肽(即,成熟蛋白质);含SEQ IDNO:4中约第1-890位氨基酸的多肽;含SEQ ID NO:4中约第2-890位氨基酸的多肽;含SEQID NO:4中约第24-890位氨基酸的多肽;含SEQ ID NO:4中约第112-890位氨基酸的多肽;含METH2金属蛋白酶结构域,SEQ ID NO:4中第214-439位氨基酸的多肽;含METH2去整联蛋白结构域,SEQ ID NO:4中第440-529位氨基酸的多肽;含METH2第一类TSP结构域,SEQ IDNO:4中第530-583位氨基酸的多肽;含METH2第二类TSP结构域,SEQ ID NO:4中第837-890位氨基酸的多肽;含SEQ ID NO:4中第280-606位氨基酸的多肽;含SEQID NO:4中第529-548位氨基酸的多肽;以及与上述多肽至少95%相同,更优选至少96%、97%、98%或99%相同,并且包含这些多肽的至少30个氨基酸、更优选至少50个氨基酸的部分的多肽。
具有与METH1或METH2多肽的参照氨基酸序列有至少例如95%相同的氨基酸序列的多肽指该多肽的氨基酸序列除了与METH1或METH2多肽的参照氨基酸序列相比每100个氨基酸可包括最多5个氨基酸改变之外,其余与参照序列相同。换而言之,为了获得具有与参照氨基酸序列至少95%相同的氨基酸序列的多肽,参照序列中最多5%的氨基酸可被缺失或用另外的氨基酸取代,或数目最多为参照序列总氨基酸残基数5%的氨基酸可插入参照序列中。参照序列的这些改变可发生于参照氨基酸序列的氨基或羧基末端位置或那些末端位置间的任何位置,它们或者各自散布于参照序列的残基中,或者以一个或多个连续组的形式存在于参照序列中。
事实上,例如,任何特殊多肽分子是否与SEQ ID NO:2或SEQ ID NO:4中所示氨基酸序列或由保藏cDNA克隆所编码的氨基酸序列至少95%、96%、97%、98%或99%相同可用已知的诸如Bestfit软件(WisconsinSequence Analysis Package,Version8 for Unix,Genetics ComputerGroup,University Research Park,575 Science DriVe,Madison,WI53711)之类计算机软件常规地确定。当用Bestfit或任何其它序列对比软件确定一特殊序列是否按本发明与参照序列例如95%相同时,参数当然设置成针对参照氨基酸序列全长计算相同性百分比,且允许有高达参照序列总氨基酸残基数5%的同源性缺口。
确定待查序列(query sequence)(本发明序列)和指示序列(subjectsequence)间最佳完全匹配的优选方法,也称综合序列对比,可用基于Brutlag等,Comp.Appl.Biosci.6:237-245(1990)运算法则的FASTDB计算机软件确定。在序列对比中,待查序列和指示序列均为核苷酸序列或均为氨基酸序列。所说综合序列对比的结果表示为相同性百分比。在氨基酸序列的FASTDB对比中用于计算相同性百分比的优选参数为:矩阵=PAM 0,k-tuple=2,错配罚分=1,连接罚分=20,随机化分组长度=0,截断分=1,缺口罚分=5,缺口大小罚分=0.05,窗口大小=500或指示氨基酸序列长度(取较短者)。
若指示序列由于N-或C-端缺失,不是由于内部缺失而比待查序列短, 必须对结果进行人工矫正。这是因为在计算相同性百分比时,FASTDB软 件不考虑指示序列的N-和C-端截短。对于相对待查序列而言在N-和C- 端截短的指示序列,通过计算待查序列中位于指示序列N-和C-端的不相 配/匹配的残基数作为待查序列总残基的百分数,矫正相同性百分比。残 基是否相配/匹配由FASTDB序列对比的结果决定。然后从用指定参数通 过以上FASTDB软件计算的相同性百分比中减去此百分率,以得到最终的 相同性百分比值。此最终的相同性百分比值是用于本发明目的的。人工 调整相同性百分比值时,只计算与待查序列不相配/匹配的、在指示序列 N-和C-端外的残基。即,只考虑指示序列N-和C-最末端残基外的待查残 基位置。
例如,将90个氨基酸残基长的指示序列与100个残基长的待查序列 排列以确定相同性百分比。缺失发生于指示序列N-端,FASTDB序列对比 不显示N-端头10个碱基的相配/匹配。这10个未配对残基代表了序列的 10%(不匹配的N-和C-端残基数/待查序列的总残基数),因此从FASTDB 软件计算的相同性百分比中减去10%。若余下90个残基完全匹配,则最 终的相同性百分比为90%。在另一例子中,90个残基长的指示序列与100 个残基长的待查序列相比较。这次缺失在内部,以致在指示序列的N-和 C-端无与待查序列不相配/匹配的残基。这种情况下,用FASTDB计算的 相同性百分比不用人为的修正。再者,正如在FASTDB序列对比中所展示 的,只有与待查序列不相配/匹配的位于指示序列N-和C-末端的残基位 置需人为修正。为了本发明的目的不进行其它的人工修正。
通过本领域技术熟练人员众所周知的方法可以将本发明多肽用作 SDS-PAGE凝胶或分子筛凝胶过滤中的分子量标准。
另一方面,本发明提供含本发明多肽之带表位部分的肽或多肽。此多 肽的表位部分是本文所述多肽的免疫原性或抗原性表位。“免疫原性表 位”定义为当整个蛋白质作为免疫原时会引起抗体应答的蛋白质部分。 另一方面,抗体可结合的蛋白质分子区定义为“抗原性表位”。蛋白质免 疫原性表位数通常少于抗原性表位数。参阅,例如,Geysen等,美国国 家科学院院报81:3998-4002(1983)。
至于带抗原性表位的肽或多肽(即,含抗体可结合的蛋白质分子区) 的选择,在本领域中众所周知,模拟蛋白质序列一部分的相对短的合成 肽通常能引发与部分模拟蛋白质可反应的抗血清。参阅,例如,Sutcliffe, J.G.等,“与蛋白质中特定位点反应的抗体(Antibodies that react with predetermined sites on proteins)”,科学219:660-666(1983)。能引 起蛋白质反应性血清的肽经常用蛋白质的一级序列表示,它们可用一套 简单的化学规则鉴定,既不限制在完整蛋白质的免疫显性区(即,免疫 原性表位),也不限制在氨基或羧基末端。
因此,本发明之带抗原性表位的肽和多肽可用于产生与本发明多肽可 特异结合的抗体,包括单克隆抗体。参阅,例如,Wilson等,细胞 37:767-778(1984)的第777页。
本发明之带抗原性表位的肽和多肽优选包含本发明多肽氨基酸序列 中至少7个,更优选至少9个及更优选至少约15-30个氨基酸的序列。
本发明之带表位的肽和多肽可用任何常规方法产生。Houghten,R.A., “肽的大量快速固相合成通用方法:在单个氨基酸水平上的抗原-抗体相 互作用特异性”,美国国家科学院院报82:5131-5135(1985)。此“同时 多种肽合成(SMPS)”的方法进一步描述于Houghten等的美国专利号 4631211(1986)中。
本领域技术熟练人员应当理解,上述本发明的METH1或METH2多肽及 其带表位片段可与免疫球蛋白(IgG)的恒定结构域部分结合,产生嵌合 多肽。这些融合蛋白质可方便纯化并且体内半寿期延长。这点已在如由 人CD4多肽头两个结构域和哺乳动物免疫球蛋白重链或轻链恒定区的多 个结构域组成的嵌合蛋白质中得到证实(EPA394827;Traunecker等,自 然331:84-86(1988))。在结合和中和其他分子方面,由于IgG部分而 具二硫键连接之二聚体结构的融合蛋白比仅有单体METH1或METH2蛋白 质或蛋白质片段更有效(Fountoulakis等,生化杂志(J.Biochem.)270: 3958-3964(1995))。
METH1和METH2多核苷酸和多肽片段
在本发明中,“多核苷酸片段”指具保藏克隆中所含或者SEQ ID NO:1 或SEQ ID NO:3中所示的核苷酸序列的短多核苷酸。该短核苷酸片段优 选至少约15nt,更优选至少约20nt,还更优选至少约30nt,更优选至少 约40nt的长度。例如,“长度至少为20nt”的片段表示包括来自保藏克 隆中所含cDNA序列或者SEQ ID NO:1或SEQ ID NO:3中所示核苷酸序列 的20个或更多个连续碱基。这些核苷酸片段可如本文所述用作诊断探针 和引物。当然,更大的片段是优选的(例如,50、150、500、600、2000 个核苷酸)。
此外,METH1或METH2多核苷酸片段的代表性例子包括,例如,具SEQ ID NO:1或SEQ ID NO:3中核苷酸数约第1-50、51-100、101-150、151-200、 201-250、251-300、301-350、351-400、401-450、451-500、501-550、 551-600、651-700、701-750、751-800、800-850、851-900、901-950、 951-1000、1001-1050、1051-1100、1101-1150、1151-1200、1201-1250、 1251-1300、1301-1350、1351-1400、1401-1450、1451-1500、1501-1550、 1551-1600、1601-1650、1651-1700、1701-1750、1751-1800、1801-1850、 1851-1900、1901-1950、1951-2000或2001-最后,或者保藏克隆中所含 cDNA之序列的片段。在此上下文中“大约”包括了在任一端或两端更多 或更少几个核苷酸(5、4、3、2或1)的特别列举范围。优选这些片段 编码具生物活性的多肽。更优选这些多核苷酸可如文所述用作探针或引 物。
在本发明中,“多肽片段”指具保藏克隆中所含cDNA编码的或者SEQ ID NO:2或SEQ ID NO:4中所含的短氨基酸序列。蛋白质片段可以是“独 立的”或包含于较大多肽内形成其中一部分或一个区域,最优选作为单 个连续区存在于其中。本发明多肽片段的典型例子包括,例如,来自SEQ ID NO:2或SEQ ID NO:4编码区约第1-20、21-40、41-60、61-80、81-100、 102-120、121-140、141-160、161-180、181-200、201-220、221-240、 241-260、261-280或281-最后位氨基酸的片段。此外,多肽片段可为约 20、30、40、50、60、70、80、90、100、110、120、130、140或150 个氨基酸长。在此上下文中“大约”包括了特别列举范围,在其任一端 或两端值更多或更少几个氨基酸(5、4、3、2或1)的范围。
优选的多肽片段包括被分泌的METH1或METH2蛋白质及其成熟形式。 更优选的多肽片段包括从氨基或羧基末端或两端具连续缺失残基的被分 泌METH1或METH2蛋白质及其成熟形式。例如,可从分泌METH1或METH2 多肽或其成熟形式的氨基端缺失1-60个范围内的任何数目氨基酸。类似 地,可从分泌METH1或METH2蛋白质或其成熟形式的羧基端缺失1-30个 范围内的任何数目氨基酸。而且,优选上述氨基或羧基末端缺失的任何 组合。同样地,也优选编码这些METH1或METH2多肽片段的核苷酸片段。
尤其是,METH1多肽的N-端缺失体可用概括的公式m-950描述,其中 m是2-949的整数,其中m相应于SEQ ID NO:2中所定的氨基酸残基位 置。优选如SEQ ID NO:2所示之本发明METH1多肽的N-端缺失体包括含 如下氨基酸残基序列的多肽:
                  G-2 to S-950;N-3 to S-950;A-4 to S-950;E-5 to S-950; R-6 to S-950;A-7 to S-950;P-8 to S-950;G-9 to S-950;S-10 to S-950;R-11 to S-950;S-12 to S-950;F-13 to S-950;G-14 to S-950;P-15 to S-950;V-16 to S- 950;P-17 to S-950;T-18 to S-950;L-19 to S-950;L-20 to S-950;L-21 to S-950; L-22 to S-950;A-23 to S-950;A-24 to S-950;A-25 to S-950;L-26 to S-950;L- 27 to S-950;A-28 to S-950;V-29 to S-950;S-30 to S-950;D-31 to S-950;A-32 to S-950;L-33 to S-950;G-34 to S-950;R-35 to S-950;P-36 to S-950;S-37 to S-950;E-38 to S-950;E-39 to S-950;D-40 to S-950;E-41 to S-950;E-42 to S- 950;L-43 to S-950;V-44 to S-950;V-45 to S-950;P-46 to S-950;E-47 to S- 950;L-48 to S-950;E-49 to S-950;R-50 to S-950;A-51 to S-950;P-52 to S- 950;G-53 to S-950;H-54 to S-950;G-55 to S-950;T-56 to S-950;T-57 to S- 950;R-58 to S-950;L-59 to S-950;R-60 to S-950;L-61 to S-950;H-62 to S- 950;A-63 to S-950;F-64 to S-950;D-65 to S-950;Q-66 to S-950;Q-67 to S- 950;L-68 to S-950;D-69 to S-950;L-70 to S-950;E-71 to S-950;L-72 to S- 950;R-73 to S-950;P-74 to S-950;D-75 to S-950;S-76 to S-950;S-77 to S-950; F-78 to S-950;L-79 to S-950;A-80 to S-950;P-81 to S-950;G-82 to S-950;F- 83 to S-950;T-84 to S-950;L-85 to S-950;Q-86 to S-950;N-87 to S-950;V-88 to S-950;G-89 to S-950;R-90 to S-950;K-91 to S-950;S-92 to S-950;G-93 to S-950;S-94 to S-950;E-95 to S-950;T-96 to S-950;P-97 to S-950;L-98 to S- 950;P-99 to S-950;E-100 to S-950;T-101 to S-950;D-102 to S-950;L-103 to S-950;A-104 to S-950;H-105 to S-950;C-106 to S-950;F-107 to S-950;Y-108 to S-950;S-109 to S-950;G-110 to S-950;T-111 to S-950;V-112 to S-950;N- 113 to S-950;G-114 to S-950;D-115 to S-950;P-116 to S-950;S-117 to S-950; S-118 to S-950;A-119 to S-950;A-120 to S-950;A-121 to S-950;L-122 to S- 950;S-123 to S-950;L-124 to S-950;C-125 to S-950;E-126 to S-950;G-127 to S-950;V-128 to S-950;R-129 to S-950;G-130 to S-950;A-131 to S-950;F- 132 to S-950;Y-133 to S-950;L-134 to S-950;L-135 to S-950;G-136 to S-950; E-137 to S-950;A-138 to S-950;Y-139 to S-950;F-140 to S-950;I-141 to S- 950;Q-142 to S-950;P-143 to S-950;L-144 to S-950;P-145 to S-950;A-146 to S-950;A-147 to S-950;S-148 to S-950;E-149 to S-950;R-150 to S-950;L- 151 to S-950;A-152 to S-950;T-153 to S-950;A-154 to S-950;A-155 to S-950; P-156 to S-950;G-157 to S-950;E-158 to S-950;K-159 to S-950;P-160 to S- 950;P-161 to S-950;A-162 to S-950;P-163 to S-950;L-164 to S-950;Q-165 to S-950;F-166 to S-950;H-167 to S-950;L-168 to S-950;L-169 to S-950;R- 170 to S-950;R-171 to S-950;N-172 to S-950;R-173 to S-950;Q-174 to S-950; G-175 to S-950;D-176 to S-950;V-177 to S-950;G-178 to S-950;G-179 to S- 950;T-180 to S-950;C-181 to S-950;G-182 to S-950;V-183 to S-950;V-184 to S-950;D-185 to S-950;D-186 to S-950;E-187 to S-950;P-188 to S-950;R- 189 to S-950;P-190 to S-950;T-191 to S-950;G-192 to S-950;K-193 to S-950; A-194 to S-950;E-195 to S-950;T-196 to S-950;E-197 to S-950;D-198 to S- 950;E-199 to S-950;D-200 to S-950;E-201 to S-950;G-202 to S-950;T-203 to S-950;E-204 to S-950;G-205 to S-950;E-206 to S-950;D-207 to S-950;E- 208 to S-950;G-209 to S-950;P-210 to S-950;Q-211 to S-950;W-212 to S-950; S-213 to S-950;P-214 to S-950;Q-215 to S-950;D-216 to S-950;P-217 to S- 950;A-218 to S-950;L-219 to S-950;Q-220 to S-950;G-221 to S-950;V-222 to S-950;G-223 to S-950;Q-224 to S-950;P-225 to S-950;T-226 to S-950;G- 227 to S-950;T-228 to S-950;G-229 to S-950;S-230 to S-950;I-231 to S-950; R-232 to S-950;K-233 to S-950;K-234 to S-950;R-235 to S-950;F-236 to S- 950;V-237 to S-950;S-238 to S-950;S-239 to S-950;H-240 to S-950;R-241 to S-950;Y-242 to S-950;V-243 to S-950;E-244 to S-950;T-245 to S-950;M- 246 to S-950;L-247 to S-950;V-248 to S-950;A-249 to S-950;D-250 to S-950; Q-251 to S-950;S-252 to S-950;M-253 to S-950;A-254 to S-950;E-255 to S- 950;F-256 to S-950;H-257 to S-950;G-258 to S-950;S-259 to S-950;G-260 to S-950;L-261 to S-950;K-262 to S-950;H-263 to S-950;Y-264 to S-950;L- 265 to S-950;L-266 to S-950;T-267 to S-950;L-268 to S-950;F-269 to S-950; S-270 to S-950;V-271 to S-950;A-272 to S-950;A-273 to S-950;R-274 to S- 950;L-275 to S-950;Y-276 to S-950;K-277 to S-950;H-278 to S-950;P-279 to S-950;S-280 to S-950;I-281 to S-950;R-282 to S-950;N-283 to S-950;S- 284 to S-950;V-285 to S-950;S-286 to S-950;L-287 to S-950;V-288 to S-950; V-289 to S-950;V-290 to S-950;K-291 to S-950;I-292 to S-950;L-293 to S- 950;V-294 to S-950;I-295 to S-950;H-296 to S-950;D-297 to S-950;E-298 to S-950;Q-299 to S-950;K-300 to S-950;G-301 to S-950;P-302 to S-950;E- 303 to S-950;V-304 to S-950;T-305 to S-950;S-306 to S-950;N-307 to S-950; A-308 to S-950;A-309 to S-950;L-310 to S-950;T-311 to S-950;L-312 to S- 950;R-313 to S-950;N-314 to S-950;F-315 to S-950;C-316 to S-950;N-317 to S-950;W-318 to S-950;Q-319 to S-950;K-320 to S-950;Q-321 to S-950;H- 322 to S-950;N-323 to S-950;P-324 to S-950;P-325 to S-950;S-326 to S-950; D-327 to S-950;R-328 to S-950;D-329 to S-950;A-330 to S-950;E-331 to S- 950;H-332 to S-950;Y-333 to S-950;D-334 to S-950;T-335 to S-950;A-336 to S-950;I-337 to S-950;L-338 to S-950;F-339 to S-950;T-340 to S-950;R- 341 to S-950;Q-342 to S-950;D-343 to S-950;L-344 to S-950;C-345 to S-950; G-346 to S-950;S-347 to S-950;Q-348 to S-950;T-349 to S-950;C-350 to S- 950;D-351 to S-950;T-352 to S-950;L-353 to S-950;G-354 to S-950;M-355 to S-950;A-356 to S-950;D-357 to S-950;V-358 to S-950;G-359 to S-950;T- 360 to S-950;V-361 to S-950;C-362 to S-950;D-363 to S-950;P-364 to S-950; S-365 to S-950;R-366 to S-950;S-367 to S-950;C-368 to S-950;S-369 to S- 950;V-370 to S-950;I-371 to S-950;E-372 to S-950;D-373 to S-950;D-374 to S-950;G-375 to S-950;L-376 to S-950;Q-377 to S-950;A-378 to S-950;A- 379 to S-950;F-380 to S-950;T-381 to S-950;T-382 to S-950;A-383 to S-950; H-384 to S-950;E-385 to S-950;L-386 to S-950;G-387 to S-950;H-388 to S- 950;V-389 to S-950;F-390 to S-950;N-391 to S-950;M-392 to S-950;P-393 to S-950;H-394 to S-950;D-395 to S-950;D-396 to S-950;A-397 to S-950;K- 398 to S-950;Q-399 to S-950;C-400 to S-950;A-401 to S-950;S-402 to S-950; L-403 to S-950;N-404 to S-950;G-405 to S-950;V-406 to S-950;N-407 to S- 950;Q-408 to S-950;D-409 to S-950;S-410 to S-950;H-411 to S-950;M-412 to S-950;M-413 to S-950;A-414 to S-950;S-415 to S-950;M-416 to S-950;L- 417 to S-950;S-418 to S-950;N-419 to S-950;L-420 to S-950;D-421 to S-950; H-422 to S-950;S-423 to S-950;Q-424 to S-950;P-425 to S-950;W-426 to S- 950;S-427 to S-950;P-428 to S-950;C-429 to S-950;S-430 to S-950;A-431 to S-950;Y-432 to S-950;M-433 to S-950;I-434 to S-950;T-435 to S-950;S-436 to S-950;F-437 to S-950;L-438 to S-950;D-439 to S-950;N-440 to S-950;G- 441 to S-950;H-442 to S-950;G-443 to S-950;E-444 to S-950;C-445 to S-950; L-446 to S-950;M-447 to S-950;D-448 to S-950;K-449 to S-950;P-450 to S- 950;Q-451 to S-950;N-452 to S-950;P-453 to S-950;I-454 to S-950;Q-455 to S-950;L-456 to S-950;P-457 to S-950;G-458 to S-950;D-459 to S-950;L-460 to S-950;P-461 to S-950;G-462 to S-950;T-463 to S-950;S-464 to S-950;Y- 465 to S-950;D-466 to S-950;A-467 to S-950;N-468 to S-950;R-469 to S-950; Q-470 to S-950;C-471 to S-950;Q-472 to S-950;F-473 to S-950;T-474 to S- 950;F-475 to S-950;G-476 to S-950;E-477 to S-950;D-478 to S-950;S-479 to S-950;K-480 to S-950;H-481 to S-950;C-482 to S-950;P-483 to S-950;D- 484 to S-950;A-485 to S-950;A-486 to S-950;S-487 to S-950;T-488 to S-950; C-489 to S-950;S-490 to S-950;T-491 to S-950;L-492 to S-950;W-493 to S- 950;C-494 to S-950;T-495 to S-950;G-496 to S-950;T-497 to S-950;S-498 to S-950;G-499 to S-950;G-500 to S-950;V-501 to S-950;L-502 to S-950;V- 503 to S-950;C-504 to S-950;Q-505 to S-950;T-506 to S-950;K-507 to S-950; H-508 to S-950;F-509 to S-950;P-510 to S-950;W-511 to S-950;A-512 to S- 950;D-513 to S-950;G-514 to S-950;T-515 to S-950;S-516 to S-950;C-517 to S-950;G-518 to S-950;E-519 to S-950;G-520 to S-950;K-521 to S-950;W- 522 to S-950;C-523 to S-950;I-524 to S-950;N-525 to S-950;G-526 to S-950; K-527 to S-950;C-528 to S-950;V-529 to S-950;N-530 to S-950;K-531 to S- 950;T-532 to S-950;D-533 to S-950;R-534 to S-950;K-535 to S-950;H-536 to S-950;F-537 to S-950;D-538 to S-950;T-539 to S-950;P-540 to S-950;F- 541 to S-950;H-542 to S-950;G-543 to S-950;S-544 to S-950;W-545 to S-950; G-546 to S-950;M-547 to S-950;W-548 to S-950;G-549 to S-950;P-550 to S- 950;W-551 to S-950;G-552 to S-950;D-553 to S-950;C-554 to S-950;S-555 to S-950;R-556 to S-950;T-557 to S-950;C-558 to S-950;G-559 to S-950;G- 560 to S-950;G-561 to S-950;V-562 to S-950;Q-563 to S-950;Y-564 to S-950; T-565 to S-950;M-566 to S-950;R-567 to S-950;E-568 to S-950;C-569 to S- 950;D-570 to S-950;N-571 to S-950;P-572 to S-950;V-573 to S-950;P-574 to S-950;K-575 to S-950;N-576 to S-950;G-577 to S-950;G-578 to S-950;K- 579 to S-950;Y-580 to S-950;C-581 to S-950;E-582 to S-950;G-583 to S-950; K-584 to S-950;R-585 to S-950;V-586 to S-950;R-587 to S-950;Y-588 to S- 950;R-589 to S-950;S-590 to S-950;C-591 to S-950;N-592 to S-950;L-593 to S-950;E-594 to S-950;D-595 to S-950;C-596 to S-950;P-597 to S-950;D- 598 to S-950;N-599 to S-950;N-600 to S-950;G-601 to S-950;K-602 to S-950; T-603 to S-950;F-604 to S-950;R-605 to S-950;E-606 to S-950;E-607 to S- 950;Q-608 to S-950;C-609 to S-950;E-610 to S-950;A-611 to S-950;H-612 to S-950;N-613 to S-950;E-614 to S-950;F-615 to S-950;S-616 to S-950;K- 617 to S-950;A-618 to S-950;S-619 to S-950;F-620 to S-950;G-621 to S-950; S-622 to S-950;G-623 to S-950;P-624 to S-950;A-625 to S-950;V-626 to S- 950;E-627 to S-950;W-628 to S-950;I-629 to S-950;P-630 to S-950;K-631 to S-950;Y-632 to S-950;A-633 to S-950;G-634 to S-950;V-635 to S-950;S- 636 to S-950;P-637 to S-950;K-638 to S-950;D-639 to S-950;R-640 to S-950; C-641 to S-950;K-642 to S-950;L-643 to S-950;I-644 to S-950;C-645 to S- 950;Q-646 to S-950;A-647 to S-950;K-648 to S-950;G-649 to S-950;I-650 to S-950;G-651 to S-950;Y-652 to S-950;F-653 to S-950;F-654 to S-950;V- 655 to S-950;L-656 to S-950;Q-657 to S-950;P-658 to S-950;K-659 to S-950; V-660 to S-950;V-661 to S-950;D-662 to S-950;G-663 to S-950;T-664 to S- 950;P-665 to S-950;C-666 to S-950;S-667 to S-950;P-668 to S-950;D-669 to S-950;S-670 to S-950;T-671 to S-950;S-672 to S-950;V-673 to S-950;C-674 to S-950;V-675 to S-950;Q-676 to S-950;G-677 to S-950;Q-678 to S-950;C- 679 to S-950;V-680 to S-950;K-681 to S-950;A-682 to S-950;G-683 to S-950; C-684 to S-950;D-685 to S-950;R-686 to S-950;I-687 to S-950;I-688 to S- 950;D-689 to S-950;S-690 to S-950;K-691 to S-950;K-692 to S-950;K-693 to S-950;F-694 to S-950;D-695 to S-950;K-696 to S-950;C-697 to S-950;G- 698 to S-950;V-699 to S-950;C-700 to S-950;G-701 to S-950;G-702 to S-950; N-703 to S-950;G-704 to S-950;S-705 to S-950;T-706 to S-950;C-707 to S- 950;K-708 to S-950;K-709 to S-950;I-710 to S-950;S-711 to S-950;G-712 to S-950;S-713 to S-950;V-714 to S-950;T-715 to S-950;S-716 to S-950;A-717 to S-950;K-718 to S-950;P-719 to S-950;G-720 to S-950;Y-721 to S-950;H- 722 to S-950;D-723 to S-950;I-724 to S-950;I-725 to S-950;T-726 to S-950; I-727 to S-950;P-728 to S-950;T-729 to S-950;G-730 to S-950;A-731 to S- 950;T-732 to S-950;N-733 to S-950;I-734 to S-950;E-735 to S-950;V-736 to S-950;K-737 to S-950;Q-738 to S-950;R-739 to S-950;N-740 to S-950;Q-741 to S-950;R-742 to S-950;G-743 to S-950;S-744 to S-950;R-745 to S-950;N- 746 to S-950;N-747 to S-950;G-748 to S-950;S-749 to S-950;F-750 to S-950; L-751 to S-950;A-752 to S-950;I-753 to S-950;K-754 to S-950;A-755 to S- 950;A-756 to S-950;D-757 to S-950;G-758 to S-950;T-759 to S-950;Y-760 to S-950;I-761 to S-950;L-762 to S-950;N-763 to S-950;G-764 to S-950;D- 765 to S-950;Y-766 to S-950;T-767 to S-950;L-768 to S-950;S-769 to S-950; T-770 to S-950;L-771 to S-950;E-772 to S-950;Q-773 to S-950;D-774 to S- 950;I-775 to S-950;M-776 to S-950;Y-777 to S-950;K-778 to S-950;G-779 to S-950;V-780 to S-950;V-781 to S-950;L-782 to S-950;R-783 to S-950;Y- 784 to S-950;S-785 to S-950;G-786 to S-950;S-787 to S-950;S-788 to S-950; A-789 to S-950;A-790 to S-950;L-791 to S-950;E-792 to S-950;R-793 to S- 950;I-794 to S-950;R-795 to S-950;S-796 to S-950;F-797 to S-950;S-798 to S-950;P-799 to S-950;L-800 to S-950;K-801 to S-950;E-802 to S-950;P-803 to S-950;L-804 to S-950;T-805 to S-950;I-806 to S-950;Q-807 to S-950;V- 808 to S-950;L-809 to S-950;T-810 to S-950;V-811 to S-950;G-812 to S-950; N-813 to S-950;A-814 to S-950;L-815 to S-950;R-816 to S-950;P-817 to S- 950;K-818 to S-950;I-819 to S-950;K-820 to S-950;Y-821 to S-950;T-822 to S-950;Y-823 to S-950;F-824 to S-950;V-825 to S-950;K-826 to S-950;K-827 to S-950;K-828 to S-950;K-829 to S-950;E-830 to S-950;S-831 to S-950;F- 832 to S-950;N-833 to S-950;A-834 to S-950;I-835 to S-950;P-836 to S-950; T-837 to S-950;F-838 to S-950;S-839 to S-950;A-840 to S-950;W-841 to S- 950;V-842 to S-950;I-843 to S-950;E-844 to S-950;E-845 to S-950;W-846 to S-950;G-847 to S-950;E-848 to S-950;C-849 to S-950;S-850 to S-950;K- 851 to S-950;S-852 to S-950;C-853 to S-950;E-854 to S-950;L-855 to S-950; G-856 to S-950;W-857 to S-950;Q-858 to S-950;R-859 to S-950;R-860 to S- 950;L-861 to S-950;V-862 to S-950;E-863 to S-950;C-864 to S-950;R-865 to S-950;D-866 to S-950;I-867 to S-950;N-868 to S-950;G-869 to S-950;Q- 870 to S-950;P-871 to S-950;A-872 to S-950;S-873 to S-950;E-874 to S-950; C-875 to S-950;A-876 to S-950;K-877 to S-950;E-878 to S-950;V-879 to S- 950;K-880 to S-950;P-881 to S-950;A-882 to S-950;S-883 to S-950;T-884 to S-950;R-885 to S-950;P-886 to S-950;C-887 to S-950;A-888 to S-950;D- 889 to S-950;H-890 to S-950;P-891 to S-950;C-892 to S-950;P-893 to S-950; Q-894 to S-950;W-895 to S-950;Q-896 to S-950;L-897 to S-950;G-898 to S- 950;E-899 to S-950;W-900 to S-950;S-901 to S-950;S-902 to S-950;C-903 to S-950;S-904 to S-950;K-905 to S-950;T-906 to S-950;C-907 to S-950;G- 908 to S-950;K-909 to S-950;G-910 to S-950;Y-911 to S-950;K-912 to S-950; K-913 to S-950;R-914 to S-950;S-915 to S-950;L-916 to S-950;K-917 to S- 950;C-918 to S-950;L-919 to S-950;S-920 to S-950;H-921 to S-950;D-922
to S-950;G-923 to S-950;G-924 to S-950;V-925 to S-950;L-926 to S-950;S-
927 to S-950;H-928 to S-950;E-929 to S-950;S-930 to S-950;C-931 to S-950;
D-932 to S-950;P-933 to S-950;L-934 to S-950;K-935 to S-950;K-936 to S-
950;P-937 to S-950;K-938 to S-950;H-939 to S-950;F-940 to S-950;I-941 to
S-950;D-942 to S-950;F-943 to S-950;C-944 to S-950;T-945 to S-950;(SEQ
ID NO:2)
此外,METH1多肽的C-端缺失体可用概括的公式1-n描述,其中n是 2-950的整数,其中n相应于SEQ ID NO:2中所定的氨基酸残基位置。 优选如SEQ ID NO:2所示之本发明METH1多肽的C-端缺失体包括含如下 氨基酸残基序列的多肽:
           M-1 to C-949;M-1 to E-948;M-1 to A-947;M-1 to M-946;M-1 to
T-945;M-1 to C-944;M-1 to F-943;M-1 to D-942;M-1 to I-941;M-1 to F-940;
M-1 to H-939;M-1 to K-938;M-1 to P-937;M-1 to K-936;M-1 to K-935;M-1
to L-934;M-1 to P-933;M-1 to D-932;M-1 to C-931;M-1 to S-930;M-1 to E-
929;M-1 to H-928;M-1 to S-927;M-1 to L-926;M-1 to V-925;M-1 to G-924;
M-1 to G-923;M-1 to D-922;M-1 to H-921;M-1 to S-920;M-1 to L-919;M-1
to C-918;M-1 to K-917;M-1 to L-916;M-1 to S-915;M-1 to R-914;M-1 to K-
913;M-1 to K-912;M-1 to Y-911;M-1 to G-910;M-1 to K-909;M-1 to G-908;
M-1 to C-907;M-1 to T-906;M-1 to K-905;M-1 to S-904;M-1 to C-903;M-1
to S-902;M-1to S-901;M-1 to W-900;M-1 to E-899;M-1 to G-898;M-1 to L-
897;M-1 to Q-896;M-1 to W-895;M-1 to Q-894;M-1 to P-893;M-1 to C-892;
M-1 to P-891;M-1 to H-890;M-1 to D-889;M-1 to A-888;M-1 to C-887;M-1
to P-886;M-1 to R-885;M-1 to T-884;M-1 to S-883;M-1 to A-882;M-1 to P-
881;M-1 to K-880;M-1 to V-879;M-1 to E-878;M-1 to K-877;M-1 to A-876;
M-1 to C-875;M-1 to E-874;M-1 to S-873;M-1 to A-872;M-1 to P-871;M-1
to Q-870;M-1 to G-869;M-1 to N-868;M-1 to I-867;M-1 to D-866;M-1 to R-
865;M-1 to C-864;M-1 to E-863;M-1 to V-862;M-1 to L-861;M-1 to R-860;
M-1 to R-859;M-1 to Q-858;M-1 to W-857;M-1 to G-856;M-1 to L-855;M-1
to E-854;M-1 to C-853;M-1 to S-852;M-1 to K-851;M-1 to S″-850;M-1 to C- 849;M-1 to E-848;M-1 to G-847;M-1 to W-846;M-1 to E-845;M-1 to E-844; M-1 to I-843;M-1 to V-842;M-1 to W-841;M-1 to A-840;M-1 to S-839;M-1 to F-838;M-1 to T-837;M-1 to P-836;M-1 to I-835;M-1 to A-834;M-1 to N- 833;M-1 to F-832;M-1 to S-831;M-1 to E-830;M-1 to K-829;M-1 to K-828; M-1 to K-827;M-1 to K-826;M-1 to V-825;M-1 to F-824;M-1 to Y-823;M-1 to T-822;M-1 to Y-821;M-1 to K-820;M-1 to I-819;M-1 to K-818;M-1 to P- 817;M-1 to R-816;M-1 to L-815;M-1 to A-814;M-1 to N-813;M-1 to G-812; M-1 to V-811;M-1 to T-810;M-1 to L-809;M-1 to V-808;M-1 to Q-807;M-1 to I-806;M-1 to T-805;M-1 to L-804;M-1 to P-803;M-1 to E-802;M-1 to K- 801;M-1 to L-800;M-1 to P-799;M-1 to S-798;M-1 to F-797;M-1 to S-796; M-1 to R-795;M-1 to I-794;M-1 to R-793;M-1 to E-792;M-1 to L-791;M-1 to A-790;M-1 to A-789;M-1 to S-788;M-1 to S-787;M-1 to G-786;M-1 to S- 785;M-1 to Y-784;M-1 to R-783;M-1 to L-782;M-1 to V-781;M-1 to V-780; M-1 to G-779;M-1 to K-778;M-1 to Y-777;M-1 to M-776;M-1 to I-775;M-1 to D-774;M-1 to Q-773;M-1 to E-772;M-1 to L-771;M-1 to T-770;M-1 to S- 769;M-1 to L-768;M-1 to T-767;M-1 to Y-766;M-1 to D-765;M-1 to G-764; M-1 to N-763;M-1 to L-762;M-1 to I-761;M-1 to Y-760;M-1 to T-759;M-1 to G-758;M-1 to D-757;M-1 to A-756;M-1 to A-755;M-1 to K-754;M-1 to I-753;M-1 to A-752;M-1 to L-751;M-1 to F-750;M-1 to S-749;M-1 to G-748; M-1 to N-747;M-1 to N-746;M-1 to R-745;M-1 to S-744;M-1 to G-743;M-1 to R-742;M-1 to Q-741;M-1 to N-740;M-1 to R-739;M-1 to Q-738;M-1 to K-737;M-1 to V-736;M-1 to E-735;M-1 to I-734;M-1 to N-733;M-1 to T- 732;M-1 to A-731;M-1 to G-730;M-1 to T-729;M-1 to P-728;M-1 to I-727; M-1 to T-726;M-1 to I-725;M-1 to I-724;M-1 to D-723;M-1 to H-722;M-1 to Y-721;M-1 to G-720;M-1 to P-719;M-1 to K-718;M-1 to A-717;M-1 to S- 716;M-1 to T-715;M-1 to V-714;M-1 to S-713;M-1 to G-712;M-1 to S-711; M-1 to I-710;M-1 to K-709;M-1 to K-708;M-1 to C-707;M-1 to T-706;M-1 to S-705;M-1 to G-704;M-1 to N-703;M-1 to G-702;M-1 to G-701;M-1 to C- 700;M-1 to V-699;M-1 to G-698;M-1 to C-697;M-1 to K-696;M-1 to D-695; M-1 to F-694;M-1 to K-693;M-1 to K-692;M-1 to K-691;M-1 to S-690;M-1 to D-689;M-1 to I-688;M-1 to I-687;M-1 to R-686;M-1 to D-685;M-1 to C- 684;M-1 to G-683;M-1 to A-682;M-1 to K-681;M-1 to V-680;M-1 to C-679; M-1 to Q-678;M-1 to G-677;M-1 to Q-676;M-1 to V-675;M-1 to C-674;M-1 to V-673;M-1 to S-672;M-1 to T-671;M-1 to S-670;M-1 to D-669;M-1 to P- 668;M-1 to S-667;M-1 to C-666;M-1 to P-665;M-1 to T-664;M-1 to G-663; M-1 to D-662;M-1 to V-661;M-1 to V-660;M-1 to K-659;M-1 to P-658;M-1 to Q-657;M-1 to L-656;M-1 to V-655;M-1 to F-654;M-1 to F-653;M-1 to Y- 652;M-1 to G-651;M-1 to I-650;M-1 to G-649;M-1 to K-648;M-1 to A-647; M-1 to Q-646;M-1 to C-645;M-1 to I-644;M-1 to L-643;M-1 to K-642;M-1 to C-641;M-1 to R-640;M-1 to D-639;M-1 to K-638;M-1 to P-637;M-1 to S- 636;M-1 to V-635;M-1 to G-634;M-1 to A-633;M-1 to Y-632;M-1 to K-631; M-1 to P-630;M-1 to I-629;M-1 to W-628;M-1 to E-627;M-1 to V-626;M-1 to A-625;M-1 to P-624;M-1to G-623;M-1 to S-622;M-1 to G-621;M-1 to F- 620;M-1 to S-619;M-1 to A-618;M-1 to K-617;M-1 to S-616;M-1 to F-615; M-1 to E-614;M-1 to N-613;M-1 to H-612;M-1 to A-611;M-1 to E-610;M-1 to C-609;M-1 to Q-608;M-1 to E-607;M-1 to E-606;M-1 to R-605;M-1 to F- 604;M-1 to T-603;M-1 to K-602;M-1 to G-601;M-1 to N-600;M-1 to N-599; M-1 to D-598;M-1 to P-597;M-1 to C-596;M-1 to D-595;M-1 to E-594;M-1 to L-593;M-1 to N-592;M-1 to C-591;M-1 to S-590;M-1 to R-589;M-1 to Y- 588;M-1 to R-587;M-1 to V-586;M-1 to R-585;M-1 to K-584;M-1 to G-583; M-1 to E-582;M-1 to C-581;M-1 to Y-580;M-1 to K-579;M-1 to G-578;M-1 to G-577;M-1 to N-576;M-1 to K-575;M-1 to P-574;M-1 to V-573;M-1 to P- 572;M-1 to N-571;M-1 to D-570;M-1 to C-569;M-1 to E-568;M-1 to R-567; M-1 to M-566;M-1 to T-565;M-1 to Y-564;M-1 to Q-563;M-1 to V-562;M-1 to G-561;M-1 to G-560;M-1 to G-559;M-1 to C-558;M-1 to T-557;M-1 to R- 556;M-1 to S-555;M-1 to C-554;M-1 to D-553;M-1 to G-552;M-1 to W-551; M-1 to P-550;M-1 to G-549;M-1 to W-548;M-1 to M-547;M-1 to G-546;M-1 to W-545;M-1 to S-544;M-1 to G-543;M-1 to H-542;M-1 to F-541;M-1 to P-540;M-1 to T-539;M-1 to D-538;M-1 to F-537;M-1 to H-536;M-1 to K- 535;M-1 to R-534;M-1 to D-533;M-1 to T-532;M-1 to K-531;M-1 to N-530; M-1 to V-529;M-1 to C-528;M-1 to K-527;M-1 to G-526;M-1 to N-525;M-1 to I-524;M-1 to C-523;M-1 to W-522;M-1 to K-521;M-1 to G-520;M-1 to E- 519;M-1 to G-518;M-1 to C-517;M-1 to S-516;M-1 to T-515;M-1 to G-514; M-1 to D-513;M-1 to A-512;M-1 to W-511;M-1 to P-510;M-1 to F-509;M-1 to H-508;M-1 to K-507;M-1 to T-506;M-1 to Q-505;M-1 to C-504;M-1 to V- 503;M-1 to L-502;M-1 to V-501;M-1 to G-500;M-1 to G-499;M-1 to S-498; M-1 to T-497;M-1 to G-496;M-1 to T-495;M-1 to C-494;M-1 to W-493;M-1 to L-492;M-1 to T-491;M-1 to S-490;M-1 to C-489;M-1 to T-488;M-1 to S- 487;M-1 to A-486;M-1 to A-485;M-1 to D-484;M-1 to P-483;M-1 to C-482; M-1 to H-481;M-1 to K-480;M-1 to S-479;M-1 to D-478;M-1 to E-477;M-1 to G-476;M-1 to F-475;M-1 to T-474;M-1 to F-473;M-1 to Q-472;M-1 to C- 471;M-1 to Q-470;M-1 to R-469;M-1 to N-468;M-1 to A-467;M-1 to D-466; M-1 to Y-465;M-1 to S-464;M-1 to T-463;M-1 to G-462;M-1 to P-461;M-1 to L-460;M-1 to D-459;M-1 to G-458;M-1 to P-457;M-1 to L-456;M-1 to Q- 455;M-1 to I-454;M-1 to P-453;M-1 to N-452;M-1 to Q-451;M-1 to P-450; M-1 to K-449;M-1 to D-448;M-1 to M-447;M-1 to L-446;M-1 to C-445;M-1 to E-444;M-1 to G-443;M-1 to H-442;M-1 to G-441;M-1 to N-440;M-1 to D-439;M-1 to L-438;M-1 to F-437;M-1 to S-436;M-1 to T-435;M-1 to I-434; M-1 to M-433;M-1 to Y-432;M-1 to A-431;M-1 to S-430;M-1 to C-429;M-1 to P-428;M-1 to S-427;M-1 to W-426;M-1 to P-425;M-1 to Q-424;M-1 to S- 423;M-1 to H-422;M-1 to D-421;M-1 to L-420;M-1 to N-419;M-1 to S-418; M-1 to L-417;M-1 to M-416;M-1 to S-415;M-1 to A-414;M-1 to M-413;M-1 to M-412;M-1 to H-411;M-1 to S-410;M-1 to D-409;M-1 to Q-408;M-1 to N-407;M-1 to V-406;M-1 to G-405;M-1 to N-404;M-1 to L-403;M-1 to S- 402;M-1 to A-401;M-1 to C-400;M-1 to Q-399;M-1 to K-398;M-1 to A-397; M-1 to D-396;M-1 to D-395;M-1 to H-394;M-1 to P-393;M-1 to M-392;M-1 to N-391;M-1 to F-390;M-1 to V-389;M-1 to H-388;M-1 to G-387;M-1 to L-  386;M-1 to E-385;M-1 to H-384;M-1 to A-383;M-1 to T-382;M-1 to T-381; M-1 to F-380;M-1 to A-379;M-1 to A-378;M-1 to Q-377;M-1 to L-376;M-1 to G-375;M-1 to D-374;M-1 to D-373;M-1 to E-372;M-1 to I-371;M-1 to V- 370;M-1 to S-369;M-1 to C-368;M-1 to S-367;M-1 to R-366;M-1 to S-365; M-1 to P-364;M-1 to D-363;M-1 to C-362;M-1 to V-361;M-1 to T-360;M-1 to G-359;M-1 to V-358;M-1 to D-357;M-1 to A-356;M-1 to M-355;M-1 to G-354;M-1 to L-353;M-1 to T-352;M-1 to D-351;M-1 to C-350;M-1 to T- 349;M-1 to Q-348;M-1 to S-347;M-1 to G-346;M-1 to C-345;M-1 to L-344; M-1 to D-343;M-1 to Q-342;M-1 to R-341;M-1 to T-340;M-1 to F-339;M-1 to L-338;M-1 to I-337;M-1 to A-336;M-1 to T-335;M-1 to D-334;M-1 to Y- 333;M-1 to H-332;M-1 to E-331;M-1 to A-330;M-1 to D-329;M-1 to R-328; M-1 to D-327;M-1 to S-326;M-1 to P-325;M-1 to P-324;M-1 to N-323;M-1 to H-322;M-1 to Q-321;M-1 to K-320;M-1 to Q-319;M-1 to W-318;M-1 to N-317;M-1 to C-316;M-1 to F-315;M-1 to N-314;M-1 to R-313;M-1 to L- 312;M-1 to T-311;M-1 to L-310;M-1 to A-309;M-1 to A-308;M-1 to N-307; M-1 to S-306;M-1 to T-305;M-1 to V-304;M-1 to E-303;M-1 to P-302;M-1 to G-301;M-1 to K-300;M-1 to Q-299;M-1 to E-298;M-1 to D-297;M-1 to H-296;M-1 to I-295;M-1 to V-294;M-1 to L-293;M-1 to I-292;M-1 to K-291; M-1 to V-290;M-1 to V-289;M-1 to V-288;M-1 to L-287;M-1 to S-286;M-1 to V-285;M-1 to S-284;M-1 to N-283;M-1 to R-282;M-1 to I-281;M-1 to S- 280;M-1 to P-279;M-1 to H-278;M-1 to K-277;M-1 to Y-276;M-1 to L-275; M-1 to R-274;M-1 to A-273;M-1 to A-272;M-1 to V-271;M-1 to S-270;M-1 to F-269;M-1 to L-268;M-1 to T-267;M-1 to L-266;M-1 to L-265;M-1 to Y- 264;M-1 to H-263;M-1 to K-262;M-1 to L-261;M-1 to G-260;M-1 to S-259; M-1 to G-258;M-1 to H-257;M-1 to F-256;M-1 to E-255;M-1 to A-254;M-1 to M-253;M-1 to S-252;M-1 to Q-251;M-1 to D-250;M-1 to A-249;M-1 to V-248;M-1 to L-247;M-1 to M-246;M-1 to T-245;M-1 to E-244;M-1 to V- 243;M-1 to Y-242;M-1 to R-241;M-1 to H-240;M-1 to S-239;M-1 to S-238; M-1 to V-237;M-1 to F-236;M-1 to R-235;M-1 to K-234;M-1 to K-233;M-1 to R-232;M-1 to I-231;M-1 to S-230;M-1 to G-229;M-1 to T-228;M-1 to G- 227;M-1 to T-226;M-1 to P-225;M-1 to Q-224;M-1 to G-223;M-1 to V-222; M-1 to G-221;M-1 to Q-220;M-1 to L-219;M-1 to A-218;M-1 to P-217;M-1 to D-216;M-1 to Q-215;M-1 to P-214;M-1 to S-213;M-1 to W-212;M-1 to Q-211;M-1 to P-210;M-1 to G-209;M-1 to E-208;M-1 to D-207;M-1 to E- 206;M-1 to G-205;M-1 to E-204;M-1 to T-203;M-1 to G-202;M-1 to E-201; M-1 to D-200;M-1 to E-199;M-1 to D-198;M-1 to E-197;M-1 to T-196;M-1 to E-195;M-1 to A-194;M-1 to K-193;M-1 to G-192;M-1 to T-191;M-1 to P- 190;M-1 to R-189;M-1 to P-188;M-1 to E-187;M-1 to D-186;M-1 to D-185; M-1 to V-184;M-1 to V-183;M-1 to G-182;M-1 to C-181;M-1 to T-180;M-1 to G-179;M-1 to G-178;M-1 to V-177;M-1 to D-176;M-1 to G-175;M-1 to Q-174;M-1 to R-173;M-1 to N-172;M-1 to R-171;M-1 to R-170;M-1 to L- 169;M-1 to L-168;M-1 to H-167;M-1 to F-166;M-1 to Q-165;M-1 to L-164; M-1 to P-163;M-1 to A-162;M-1 to P-161;M-1 to P-160;M-1 to K-159;M-1 to E-158;M-1 to G-157;M-1 to P-156;M-1 to A-155;M-1 to A-154;M-1 to T- 153;M-1 to A-152;M-1 to L-151;M-1 to R-150;M-1 to E-149;M-1 to S-148; M-1 to A-147;M-1 to A-146;M-1 to P-145;M-1 to L-144;M-1 to P-143;M-1 to Q-142;M-1 to I-141;M-1 to F-140;M-1 to Y-139;M-1 to A-138;M-1 to E- 137;M-1 to G-136;M-1 to L-135;M-1 to L-134;M-1 to Y-133;M-1 to F-132; M-1 to A-131;M-1 to G-130;M-1 to R-129;M-1 to V-128;M-1 to G-127;M-1 to E-126;M-1 to C-125;M-1 to L-124;M-1 to S-123;M-1 to L-122;M-1 to A- 121;M-1 to A-120;M-1 to A-119;M-1 to S-118;M-1 to S-117;M-1 to P-116; M-1 to D-115;M-1 to G-114;M-1 to N-113;M-1 to V-112;M-1 to T-111;M-1 to G-110;M-1 to S-109;M-1 to Y-108;M-1 to F-107;M-1 to C-106;M-1 to H- 105;M-1 to A-104;M-1 to L-103;M-1 to D-102;M-1 to T-101;M-1 to E-100; M-1 to P-99;M-1 to L-98;M-1 to P-97;M-1 to T-96;M-1 to E-95;M-1 to S-94; M-1 to G-93;M-1 to S-92;M-1 to K-91;M-1 to R-90;M-1 to G-89;M-1 to V- 88;M-1 to N-87;M-1 to Q-86;M-1 to L-85;M-1 to T-84;M-1 to F-83;M-1 to G-82;M-1 to P-81;M-1 to A-80;M-1 to L-79;M-1 to F-78;M-1 to S-77;M-1 to S-76;M-1 to D-75;M-1 to P-74;M-1 to R-73;M-1 to L-72;M-1 to E-71;M- 1 to L-70;M-1 to D-69;M-1 to L-68;M-1 to Q-67;M-1 to Q-66;M-1 to D-65; M-1 to F-64;M-1 to A-63;M-1 to H-62;M-1 to L-61;M-1 to R-60;M-1 to L- 59;M-1 to R-58;M-1 to T-57;M-1 to T-56;M-1 to G-55;M-1 to H-54;M-1 to G-53;M-1 to P-52;M-1 to A-51;M-1 to R-50;M-1 to E-49;M-1 to L-48;M-1
to E-47;M-1 to P-46;M-1 to V-45;M-1 to V-44;M-1 to L-43;M-1 to E-42;M-
1 to E-41;M-1 to D-40;M-1 to E-39;M-1 to E-38;M-1 to S-37;M-1 to P-36;
M-1 to R-35;M-1 to G-34;M-1 to L-33;M-1 to A-32;M-1 to D-31;M-1 to S-
30;M-1 to V-29;M-1 to A-28;M-1 to L-27;M-1 to L-26;M-1 to A-25;M-1 to
A-24;M-1 to A-23;M-1 to L-22;M-1 to L-21;M-1 to L-20;M-1 to L-19;M-1
to T-18;M-1 to P-17;M-1 to V-16;M-1 to P-15;M-1 to G-14;M-1 to F-13;M-
1 to S-12;M-1 to R-11;M-1 to S-10;M-1 to G-9;M-1 to P-8;M-1 to A-7;
(SEQ ID NO:2)优选地,任何以上列举的N-或C-端缺失可组合而产生 N-和C-端缺失的METH1多肽。
另外,METH2多肽的N-端缺失体可用概括的公式m-890描述,其中m 是2-889的整数,其中m相应于SEQ ID NO:4中所定的氨基酸残基位置。 优选如SEQ ID NO:4所示之本发明METH2多肽的N-端缺失体包括含如下 氨基酸残基序列的多肽:
                      F-2 to L-890;P-3 to L-890;A-4 to L-890;P-5 to L-890;
A-6 to L-890;A-7 to L-890;P-8 to L-890;R-9 to L-890;W-10 to L-890;L-11
to L-890;P-12 to L-890;F-13 to L-890;L-14 to L-890;L-15 to L-890;L-16 to
L-890;L-17 to L-890;L-18 to L-890;L-19 to L-890;L-20 to L-890;L-21 to L-
890;L-22 to L-890;P-23 to L-890;L-24 to L-890;A-25 to L-890;R-26 to L-
890;G-27 to L-890;A-28 to L-890;P-29 to L-890;A-30 to L-890;R-31 to L-
890;P-32 to L-890;A-33 to L-890;A-34 to L-890;G-35 to L-890;G-36 to L-
890;Q-37 to L-890;A-38 to L-890;S-39 to L-890;E-40 to L-890;L-41 to L-
890;V-42 to L-890;V-43 to L-890;P-44 to L-890;T-45 to L-890;R-46 to L-
890;L-47 to L-890;P-48 to L-890;G-49 to L-890;S-50 to L-890;A-51 to L-
890;G-52 to L-890;E-53 to L-890;L-54 to L-890;A-55 to L-890;L-56 to L-
890;H-57 to L-890;L-58 to L-890;S-59 to L-890;A-60 to L-890;F-61 to L-
890;G-62 to L-890;K-63 to L-890;G-64 to L-890;F-65 to L-890;V-66 to L-
890;L-67 to L-890;R-68 to L-890;L-69 to L-890;A-70 to L-890;P-71 to L-
890;D-72 to L-890;D-73 to L-890;S-74 to L-890;F-75 to L-890;L-76 to L-
890;A-77 to L-890;P-78 to L-890;E-79 to L-890;F-80 to L-890;K-81 to L- 890;I-82 to L-890;E-83 to L-890;R-84 to L-890;L-85 to L-890;G-86 to L- 890;G-87 to L-890;S-88 to L-890;G-89 to L-890;R-90 to L-890;A-91 to L- 890;T-92 to L-890;G-93 to L-890;G-94 to L-890;E-95 to L-890;R-96 to L- 890;G-97 to L-890;L-98 to L-890;R-99 to L-890;G-100 to L-890;C-101 to L- 890;F-102 to L-890;F-103 to L-890;S-104 to L-890;G-105 to L-890;T-106 to L-890;V-107 to L-890;N-108 to L-890;G-109 to L-890;E-110 to L-890;P- 111 to L-890;E-112 to L-890;S-113 to L-890;L-114 to L-890;A-115 to L-890; A-116 to L-890;V-117 to L-890;S-118 to L-890;L-119 to L-890;C-120 to L- 890;R-121 to L-890;G-122 to L-890;L-123 to L-890;S-124 to L-890;G-125 to L-890;S-126 to L-890;F-127 to L-890;L-128 to L-890;L-129 to L-890;D- 130 to L-890;G-131 to L-890;E-132 to L-890;E-133 to L-890;F-134 to L-890; T-135 to L-890;I-136 to L-890;Q-137 to L-890;P-138 to L-890;Q-139 to L- 890;G-140 to L-890;A-141 to L-890;G-142 to L-890;G-143 to L-890;S-144 to L-890;L-145 to L-890;A-146 to L-890;Q-147 to L-890;P-148 to L-890;H- 149 to L-890;R-150 to L-890;L-151 to L-890;Q-152 to L-890;R-153 to L-890; W-154 to L-890;G-155 to L-890;P-156 to L-890;A-157 to L-890;G-158 to L- 890;A-159 to L-890;R-160 to L-890;P-161 to L-890;L-162 to L-890;P-163 to L-890;R-164 to L-890;G-165 to L-890;P-166 to L-890;E-167 to L-890;W- 168 to L-890;E-169 to L-890;V-170 to L-890;E-171 to L-890;T-172 to L-890; G-173 to L-890;E-174 to L-890;G-175 to L-890;Q-176 to L-890;R-177 to L- 890;Q-178 to L-890;E-179 to L-890;R-180 to L-890;G-181 to L-890;D-182 to L-890;H-183 to L-890;Q-184 to L-890;E-185 to L-890;D-186 to L-890;S- 187 to L-890;E-188 to L-890;E-189 to L-890;E-190 to L-890;S-191 to L-890; Q-192 to L-890;E-193 to L-890;E-194 to L-890;E-195 to L-890;A-196 to L- 890;E-197 to L-890;G-198 to L-890;A-199 to L-890;S-200 to L-890;E-201 to L-890;P-202 to L-890;P-203 to L-890;P-204 to L-890;P-205 to L-890;L- 206 to L-890;G-207 to L-890;A-208 to L-890;T-209 to L-890;S-210 to L-890; R-211 to L-890;T-212 to L-890;K-213 to L-890;R-214 to L-890;F-215 to L- 890;V-216 to L-890;S-217 to L-890;E-218 to L-890;A-219 to L-890;R-220 to L-890;F-221 to L-890;V-222 to L-890;E-223 to L-890;T-224 to L-890;L- 225 to L-890;L-226 to L-890;V-227 to L-890;A-228 to L-890;D-229 to L-890; A-230 to L-890;S-231 to L-890;M-232 to L-890;A-233 to L-890;A-234 to L- 890;F-235 to L-890;Y-236 to L-890;G-237 to L-890;A-238 to L-890;D-239 to L-890;L-240 to L-890;Q-241 to L-890;N-242 to L-890;H-243 to L-890;I- 244 to L-890;L-245 to L-890;T-246 to L-890;L-247 to L-890;M-248 to L-890; S-249 to L-890;V-250 to L-890;A-251 to L-890;A-252 to L-890;R-253 to L- 890;I-254 to L-890;Y-255 to L-890;K-256 to L-890;H-257 to L-890;P-258 to L-890;S-259 to L-890;I-260 to L-890;K-261 to L-890;N-262 to L-890;S- 263 to L-890;I-264 to L-890;N-265 to L-890;L-266 to L-890;M-267 to L-890; V-268 to L-890;V-269 to L-890;K-270 to L-890;V-271 to L-890;L-272 to L- 890;I-273 to L-890;V-274 to L-890;E-275 to L-890;D-276 to L-890;E-277 to L-890;K-278 to L-890;W-279 to L-890;G-280 to L-890;P-281 to L-890;E- 282 to L-890;V-283 to L-890;S-284 to L-890;D-285 to L-890;N-286 to L-890; G-287 to L-890;G-288 to L-890;L-289 to L-890;T-290 to L-890;L-291 to L- 890;R-292 to L-890;N-293 to L-890;F-294 to L-890;C-295 to L-890;N-296 to L-890;W-297 to L-890;Q-298 to L-890;R-299 to L-890;R-300 to L-890;F- 301 to L-890;N-302 to L-890;Q-303 to L-890;P-304 to L-890;S-305 to L-890; D-306 to L-890;R-307 to L-890;H-308 to L-890;P-309 to L-890;E-310 to L- 890;H-311 to L-890;Y-312 to L-890;D-313 to L-890;T-314 to L-890;A-315 to L-890;I-316 to L-890;L-317 to L-890;L-318 to L-890;T-319 to L-890;R- 320 to L-890;Q-321 to L-890;N-322 to L-890;F-323 to L-890;C-324 to L-890; G-325 to L-890;Q-326 to L-890;E-327 to L-890;G-328 to L-890;L-329 to L- 890;C-330 to L-890;D-331 to L-890;T-332 to L-890;L-333 to L-890;G-334 to L-890;V-335 to L-890;A-336 to L-890;D-337 to L-890;I-338 to L-890;G- 339 to L-890;T-340 to L-890;I-341 to L-890;C-342 to L-890;D-343 to L-890; P-344 to L-890;N-345 to L-890;K-346 to L-890;S-347 to L-890;C-348 to L- 890;S-349 to L-890;V-350 to L-890;I-351 to L-890;E-352 to L-890;D-353 to L-890;E-354 to L-890;G-355 to L-890;L-356 to L-890;Q-357 to L-890;A- 358 to L-890;A-359 to L-890;H-360 to L-890;T-361 to L-890;L-362 to L-890; A-363 to L-890;H-364 to L-890;E-365 to L-890;L-366 to L-890;G-367 to L- 890;H-368 to L-890;V-369 to L-890;L-370 to L-890;S-371 to L-890;M-372 to L-890;P-373 to L-890;H-374 to L-890;D-375 to L-890;D-376 to L-890;S- 377 to L-890;K-378 to L-890;P-379 to L-890;C-380 to L-890;T-381 to L-890; R-382 to L-890;L-383 to L-890;F-384 to L-890;G-385 to L-890;P-386 to L- 890;M-387 to L-890;G-388 to L-890;K-389 to L-890;H-390 to L-890;H-391 to L-890;V-392 to L-890;M-393 to L-890;A-394 to L-890;P-395 to L-890;L- 396 to L-890;F-397 to L-890;V-398 to L-890;H-399 to L-890;L-400 to L-890; N-401 to L-890;Q-402 to L-890;T-403 to L-890;L-404 to L-890;P-405 to L- 890;W-406 to L-890;S-407 to L-890;P-408 to L-890;C-409 to L-890;S-410 to L-890;A-411 to L-890;M-412 to L-890;Y-413 to L-890;L-414 to L-890;T- 415 to L-890;E-416 to L-890;L-417 to L-890;L-418 to L-890;D-419 to L-890; G-420 to L-890;G-421 to L-890;H-422 to L-890;G-423 to L-890;D-424 to L- 890;C-425 to L-890;L-426 to L-890;L-427 to L-890;D-428 to L-890;A-429 to L-890;P-430 to L-890;G-431 to L-890;A-432 to L-890;A-433 to L-890;L- 434 to L-890;P-435 to L-890;L-436 to L-890;P-437 to L-890;T-438 to L-890; G-439 to L-890;L-440 to L-890;P-441 to L-890;G-442 to L-890;R-443 to L- 890;M-444 to L-890;A-445 to L-890;L-446 to L-890;Y-447 to L-890;Q-448 to L-890;L-449 to L-890;D-450 to L-890;Q-451 to L-890;Q-452 to L-890;C- 453 to L-890;R-454 to L-890;Q-455 to L-890;I-456 to L-890;F-457 to L-890; G-458 to L-890;P-459 to L-890;D-460 to L-890;F-461 to L-890;R-462 to L- 890;H-463 to L-890;C-464 to L-890;P-465 to L-890;N-466 to L-890;T-467 to L-890;S-468 to L-890;A-469 to L-890;Q-470 to L-890;D-471 to L-890;V- 472 to L-890;C-473 to L-890;A-474 to L-890;Q-475 to L-890;L-476 to L-890; W-477 to L-890;C-478 to L-890;H-479 to L-890;T-480 to L-890;D-481 to L- 890;G-482 to L-890;A-483 to L-890;E-484 to L-890;P-485 to L-890;L-486 to L-890;C-487 to L-890;H-488 to L-890;T-489 to L-890;K-490 to L-890;N- 491 to L-890;G-492 to L-890;S-493 to L-890;L-494 to L-890;P-495 to L-890; W-496 to L-890;A-497 to L-890;D-498 to L-890;G-499 to L-890;T-500 to L- 890;P-501 to L-890;C-502 to L-890;G-503 to L-890;P-504 to L-890;G-505 to L-890;H-506 to L-890;L-507 to L-890;C-508 to L-890;S-509 to L-890;E- 510 to L-890;G-511 to L-890;S-512 to L-890;C-513 to L-890;L-514 to L-890; P-515 to L-890;E-516 to L-890;E-517 to L-890;E-518 to L-890;V-519 to L- 890;E-520 to L-890;R-521 to L-890;P-522 to L-890;K-523 to L-890;P-524 to L-890;V-525 to L-890;V-526 to L-890;D-527 to L-890;G-528 to L-890;G- 529 to L-890;W-530 to L-890;A-531 to L-890;P-532 to L-890;W-533 to L- 890;G-534 to L-890;P-535 to L-890;W-536 to L-890;G-537 to L-890;E-538 to L-890;C-539 to L-890;S-540 to L-890;R-541 to L-890;T-542 to L-890;C- 543 to L-890;G-544 to L-890;G-545 to L-89O;G-546 to L-890;V-547 to L- 890;Q-548 to L-890;F-549 to L-890;S-550 to L-890;H-551 to L-890;R-552 to L-890;E-553 to L-890;C-554 to L-890;K-555 to L-890;D-556 to L-890;P- 557 to L-890;E-558 to L-890;P-559 to L-890;Q-560 to L-890;N-561 to L-890; G-562 to L-890;G-563 to L-890;R-564 to L-890;Y-565 to L-890;C-566 to L- 890;L-567 to L-890;G-568 to L-890;R-569 to L-890;R-570 to L-890;A-571 to L-890;K-572 to L-890;Y-573 to L-890;Q-574 to L-890;S-575 to L-890;C- 576 to L-890;H-577 to L-890;T-578 to L-890;E-579 to L-890;E-580 to L-890; C-581 to L-890;P-582 to L-890;P-583 to L-890;D-584 to L-890;G-585 to L- 890;K-586 to L-890;S-587 to L-890;F-588 to L-890;R-589 to L-890;E-590 to L-890;Q-591 to L-890;Q-592 to L-890;C-593 to L-890;E-594 to L-890;K- 595 to L-890;Y-596 to L-890;N-597 to L-890;A-598 to L-890;Y-599 to L- 890;N-600 to L-890;Y-601 to L-890;T-602 to L-890;D-603 to L-890;M-604 to L-890;D-605 to L-890;G-606 to L-890;N-607 to L-890;L-608 to L-890;L- 609 to L-890;Q-610 to L-890;W-611 to L-890;V-612 to L-890;P-613 to L- 890;K-614 to L-890;Y-615 to L-890;A-616 to L-890;G-617 to L-890;V-618 to L-890;S-619 to L-890;P-620 to L-890;R-621 to L-890;D-622 to L-890;R- 623 to L-890;C-624 to L-890;K-625 to L-890;L-626 to L-890;F-627 to L-890; C-628 to L-890;R-629 to L-890;A-630 to L-890;R-631 to L-890;G-632 to L- 890;R-633 to L-890;S-634 to L-890;E-635 to L-890;F-636 to L-890;K-637 to L-890;V-638 to L-890;F-639 to L-890;E-640 to L-890;A-641 to L-890;K- 642 to L-890;V-643 to L-890;I-644 to L-890;D-645 to L-890;G-646 to L-890; T-647 to L-890;L-648 to L-890;C-649 to L-890;G-650 to L-890;P-651 to L- 890;E-652 to L-890;T-653 to L-890;L-654 to L-890;A-655 to L-890;I-656 to L-890;C-657 to L-890;V-658 to L-890;R-659 to L-890;G-660 to L-890;Q-661 to L-890;C-662 to L-890;V-663 to L-890;K-664 to L-890;A-665 to L-890;G- 666 to L-890;C-667 to L-890;D-668 to L-890;H-669 to L-890;V-670 to L- 890;V-671 to L-890;D-672 to L-890;S-673 to L-890;P-674 to L-890;R-675 to L-890;K-676 to L-890;L-677 to L-890;D-678 to L-890;K-679 to L-890;C- 680 to L-890;G-681 to L-890;V-682 to L-890;C-683 to L-890;G-684 to L- 890;G-685 to L-890;K-686 to L-890;G-687 to L-890;N-688 to L-890;S-689 to L-890;C-690 to L-890;R-691 to L-890;K-692 to L-890;V-693 to L-890;S- 694 to L-890;G-695 to L-890;S-696 to L-890;L-697 to L-890;T-698 to L-890; P-699 to L-890;T-700 to L-890;N-701 to L-890;Y-702 to L-890;G-703 to L- 890;Y-704 to L-890;N-705 to L-890;D-706 to L-890;I-707 to L-890;V-708 to L-890;T-709 to L-890;I-710 to L-890;P-711 to L-890;A-712 to L-890;G- 713 to L-890;A-714 to L-890;T-715 to L-890;N-716 to L-890;I-717 to L-890; D-718 to L-890;V-719 to L-890;K-720 to L-890;Q-721 to L-890;R-722 to L- 890;S-723 to L-890;H-724 to L-890;P-725 to L-890;G-726 to L-890;V-727 to L-890;Q-728 to L-890;N-729 to L-890;D-730 to L-890;G-731 to L-890;N- 732 to L-890;Y-733 to L-890;L-734 to L-890;A-735 to L-890;L-736 to L-890; K-737 to L-890;T-738 to L-890;A-739 to L-890;D-740 to L-890;G-741 to L- 890;Q-742 to L-890;Y-743 to L-890;L-744 to L-890;L-745 to L-890;N-746 to L-890;G-747 to L-890;N-748 to L-890;L-749 to L-890;A-750 to L-890;I- 751 to L-890;S-752 to L-890;A-753 to L-890;I-754 to L-890;E-755 to L-890; Q-756 to L-890;D-757 to L-890;I-758 to L-890;L-759 to L-890;V-760 to L- 890;K-761 to L-890;G-762 to L-890;T-763 to L-890;I-764 to L-890;L-765 to L-890;K-766 to L-890;Y-767 to L-890;S-768 to L-890;G-769 to L-890;S- 770 to L-890;I-771 to L-890;A-772 to L-890;T-773 to L-890;L-774 to L-890; E-775 to L-890;R-776 to L-890;L-777 to L-890;Q-778 to L-890;S-779 to L- 890;F-780 to L-890;R-781 to L-890;P-782 to L-890;L-783 to L-890;P-784 to L-890;E-785 to L-890;P-786 to L-890;L-787 to L-890;T-788 to L-890;V-789 to L-890;Q-790 to L-890;L-791 to L-890;L-792 to L-890;T-793 to L-890;V-
794 to L-890;P-795 to L-890;G-796 to L-890;E-797 to L-890;V-798 to L-890;
F-799 to L-890;P-800 to L-890;P-801 to L-890;K-802 to L-890;V-803 to L-
890;K-804 to L-890;Y-805 to L-890;T-806 to L-890;F-807 to L-890;F-808
to L-890;V-809 to L-890;P-810 to L-890;N-811 to L-890;D-812 to L-890;V-
813 to L-890;D-814 to L-890;F-815 to L-890;S-816 to L-890;M-817 to L-890;
Q-818 to L-890;S-819 to L-890;S-820 to L-890;K-821 to L-890;E-822 to L-
890;R-823 to L-890;A-824 to L-890;T-825 to L-890;T-826 to L-890;N-827
to L-890;I-828 to L-890;I-829 to L-890;Q-830 to L-890;P-831 to L-890;L-
832 to L-890;L-833 to L-890;H-834 to L-890;A-835 to L-890;Q-836 to L-890;
W-837 to L-890;V-838 to L-890;L-839 to L-890;G-840 to L-890;D-841 to L-
890;W-842 to L-890;S-843 to L-890;E-844 to L-890;C-845 to L-890;S-846
to L-890;S-847 to L-890;T-848 to L-890;C-849 to L-890;G-850 to L-890;A-
851 to L-890;G-852 to L-890;W-853 to L-890;Q-854 to L-890;R-855 to L-
890;R-856 to L-890;T-857 to L-890;V-858 to L-890;E-859 to L-890;C-860
to L-890;R-861 to L-890;D-862 to L-890;P-863 to L-890;S-864 to L-890;G-
865 to L-890;Q-866 to L-890;A-867 to L-890;S-868 to L-890;A-869 to L-890;
T-870 to L-890;C-871 to L-890;N-872 to L-890;K-873 to L-890;A-874 to L-
890;L-875 to L-890;K-876 to L-890;P-877 to L-890;E-878 to L-890;D-879
to L-890;A-880 to L-890;K-881 to L-890;P-882 to L-890;C-883 to L-890;E-
884 to L-890;S-885 to L-890;(SEQ ID NO:4.)
此外,METH2多肽的C-端缺失体可用概括的公式1-n描述,其中n是 2-890的整数,其中n相应于SEQ ID NO:4中所定的氨基酸残基位置。 优选如SEQ ID NO:4所示之本发明METH2多肽的C-端缺失体包括含如下 氨基酸残基序列的多肽:
    M-1 to P-889;M-1 to C-888;M-1 to L-887;M-1 to Q-886;M-1 to
S-885;M-1 to E-884;M-1 to C-883;M-1 to P-882;M-1 to K-881;M-1 to A-
880;M-1 to D-879;M-1 to E-878;M-1 to P-877;M-1 to K-876;M-1 to L-875;
M-1 to A-874;M-1 to K-873;M-1 to N-872;M-1 to C-871;M-1 to T-870;M-1
to A-869;M-1 to S-868;M-1 to A-867;M-1 to Q-866;M-1 to G-865;M-1 to S- 864;M-1 to P-863;M-1 to D-862;M-1 to R-861;M-1 to C-860;M-1 to E-859; M-1 to V-858;M-1 to T-857;M-1 to R-856;M-1 to R-855;M-1 to Q-854;M-1 to W-853;M-1 to G-852;M-1 to A-851;M-1 to G-850;M-1 to C-849;M-1 to T-848;M-1 to S-847;M-1 to S-846;M-1 to C-845;M-1 to E-844;M-1 to S-843; M-1 to W-842;M-1 to D-841;M-1 to G-840;M-1 to L-839;M-1 to V-838;M-1 to W-837;M-1 to Q-836;M-1 to A-835;M-1 to H-834;M-1 to L-833;M-1 to L-832;M-1 to P-831;M-1 to Q-830;M-1 to I-829;M-1 to I-828;M-1 to N-827; M-1 to T-826;M-1 to T-825;M-1 to A-824;M-1 to R-823;M-1 to E-822;M-1 to K-821;M-1 to S-820;M-1 to S-819;M-1 to Q-818;M-1 to M-817;M-1 to S- 816;M-1 to F-815;M-1 to D-814;M-1 to V-813;M-1 to D-812;M-1 to N-811; M-1 to P-810;M-1 to V-809;M-1 to F-808;M-1 to F-807;M-1 to T-806;M-1 to Y-805;M-1 to K-804;M-1 to V-803;M-1 to K-802;M-1 to P-801;M-1 to P- 800;M-1 to F-799;M-1 to V-798;M-1 to E-797;M-1 to G-796;M-1 to P-795; M-1 to V-794;M-1 to T-793;M-1 to L-792;M-1 to L-791;M-1 to Q-790;M-1 to V-789;M-1 to T-788;M-1 to L-787;M-1 to P-786;M-1 to E-785;M-1 to P- 784;M-1 to L-783;M-1 to P-782;M-1 to R-781;M-1 to F-780;M-1 to S-779; M-1 to Q-778;M-1 to L-777;M-1 to R-776;M-1 to E-775;M-1 to L-774;M-1 to T-773;M-1 to A-772;M-1 to I-771;M-1 to S-770;M-1 to G-769;M-1 to S- 768;M-1 to Y-767;M-1 to K-766;M-1 to L-765;M-1 to I-764;M-1 to T-763; M-1 to G-762;M-1 to K-761;M-1 to V-760;M-1 to L-759;M-1 to I-758;M-1 to D-757;M-1 to Q-756;M-1 to E-755;M-1 to I-754;M-1 to A-753;M-1 to S- 752;M-1 to I-751;M-1 to A-750;M-1 to L-749;M-1 to N-748;M-1 to G-747; M-1 to N-746;M-1 to L-745;M-1 to L-744;M-1 to Y-743;M-1 to Q-742;M-1 to G-741;M-1 to D-740;M-1 to A-739;M-1 to T-738;M-1 to K-737;M-1 to L-736;M-1 to A-735;M-1 to L-734;M-1 to Y-733;M-1 to N-732;M-1 to G- 731;M-1 to D-730;M-1 to N-729;M-1 to Q-728;M-1 to V-727;M-1 to G-726; M-1 to P-725;M-1 to H-724;M-1 to S-723;M-1 to R-722;M-1 to Q-721;M-1 to K-720;M-1 to V-719;M-1 to D-718;M-1 to I-717;M-1 to N-716;M-1 to T- 715;M-1 to A-714;M-1 to G-713;M-1 to A-712;M-1 to P-711;M-1 to I-710; M-1 to T-709;M-1 to V-708;M-1 to I-707;M-1 to D-706;M-1 to N-705;M-1 to Y-704;M-1 to G-703;M-1 to Y-702;M-1 to N-701;M-1 to T-700;M-1 to P-699;M-1 to T-698;M-1 to L-697;M-1 to S-696;M-1 to G-695;M-1 to S-694; M-1 to V-693;M-1 to K-692;M-1 to R-691;M-1 to C-690;M-1 to S-689;M-1 to N-688;M-1 to G-687;M-1 to K-686;M-1 to G-685;M-1 to G-684;M-1 to C-683;M-1 to V-682;M-1 to G-681;M-1 to C-680;M-1 to K-679;M-1 to D- 678;M-1 to L-677;M-1 to K-676;M-1 to R-675;M-1 to P-674;M-1 to S-673; M-1 to D-672;M-1 to V-671;M-1 to V-670;M-1 to H-669;M-1 to D-668;M-1 to C-667;M-1 to G-666;M-1 to A-665;M-1 to K-664;M-1 to V-663;M-1 to C-662;M-1 to Q-661;M-1 to G-660;M-1 to R-659;M-1 to V-658;M-1 to C- 657;M-1 to I-656;M-1 to A-655;M-1 to L-654;M-1 to T-653;M-1 to E-652; M-1 to P-651;M-1 to G-650;M-1 to C-649;M-1 to L-648;M-1 to T-647;M-1 to G-646;M-1 to D-645;M-1 to I-644;M-1 to V-643;M-1 to K-642;M-1 to A- 641;M-1 to E-640;M-1 to F-639;M-1 to V-638;M-1 to K-637;M-1 to F-636; M-1 to E-635;M-1 to S-634;M-1 to R-633;M-1 to G-632;M-1 to R-631;M-1 to A-630;M-1 to R-629;M-1 to C-628;M-1 to F-627;M-1 to L-626;M-1 to K- 625;M-1 to C-624;M-1 to R-623;M-1 to D-622;M-1 to R-621;M-1 to P-620; M-1 to S-619;M-1 to V-618;M-1 to G-617;M-1 to A-616;M-1 to Y-615;M-1 to K-614;M-1 to P-613;M-1 to V-612;M-1 to W-611;M-1 to Q-610;M-1 to L-609;M-1 to L-608;M-1 to N-607;M-1 to G-606;M-1 to D-605;M-1 to M- 604;M-1 to D-603;M-1 to T-602;M-1 to Y-601;M-1 to N-600;M-1 to Y-599; M-1 to A-598;M-1 to N-597;M-1 to Y-596;M-1 to K-595;M-1 to E-594;M-1 to C-593;M-1 to Q-592;M-1 to Q-591;M-1 to E-590;M-1 to R-589;M-1 to F- 588;M-1 to S-587;M-1 to K-586;M-1 to G-585;M-1 to D-584;M-1 to P-583; M-1 to P-582;M-1 to C-581;M-1 to E-580;M-1 to E-579;M-1 to T-578;M-1 to H-577;M-1 to C-576;M-1 to S-575;M-1 to Q-574;M-1 to Y-573;M-1 to K- 572;M-1 to A-571;M-1 to R-570;M-1 to R-569;M-1 to G-568;M-1 to L-567; M-1 to C-566;M-1 to Y-565;M-1 to R-564;M-1 to G-563;M-1 to G-562;M-1 to N-561;M-1 to Q-560;M-1 to P-559;M-1 to E-558;M-1 to P-557;M-1 to D- 556;M-1 to K-555;M-1 to C-554;M-1 to E-553;M-1 to R-552;M-1 to H-551; M-1 to S-550;M-1 to F-549;M-1 to Q-548;M-1 to V-547;M-1 to G-546;M-1 to G-545;M-1 to G-544;M-1 to C-543;M-1 to T-542;M-1 to R-541;M-1 to S- 540;M-1 to C-539;M-1 to E-538;M-1 to G-537;M-1 to W-536;M-1 to P-535; M-1 to G-534;M-1 to W-533;M-1 to P-532;M-1 to A-531;M-1 to W-530;M-1 to G-529;M-1 to G-528;M-1 to D-527;M-1 to V-526;M-1 to V-525;M-1 to P-524;M-1 to K-523;M-1 to P-522;M-1 to R-521;M-1 to E-520;M-1 to V- 519;M-1 to E-518;M-1 to E-517;M-1 to E-516;M-1 to P-515;M-1 to L-514; M-1 to C-513;M-1 to S-512;M-1 to G-511;M-1 to E-510;M-1 to S-509;M-1 to C-508;M-1 to L-507;M-1 to H-506;M-1 to G-505;M-1 to P-504;M-1 to G- 503;M-1 to C-502;M-1 to P-501;M-1 to T-500;M-1 to G-499;M-1 to D-498; M-1 to A-497;M-1 to W-496;M-1 to P-495;M-1 to L-494;M-1 to S-493;M-1 to G-492;M-1 to N-491;M-1 to K-490;M-1 to T-489;M-1 to H-488;M-1 to C-487;M-1 to L-486;M-1 to P-485;M-1 to E-484;M-1 to A-483;M-1 to G- 482;M-1 to D-481;M-1 to T-480;M-1 to H-479;M-1 to C-478;M-1 to W-477; M-1 to L-476;M-1 to Q-475;M-1 to A-474;M-1 to C-473;M-1 to V-472;M-1 to D-471;M-1 to Q-470;M-1 to A-469;M-1 to S-468;M-1 to T-467;M-1 to N- 466;M-1 to P-465;M-1 to C-464;M-1 to H-463;M-1 to R-462;M-1 to F-461; M-1 to D-460;M-1 to P-459;M-1 to G-458;M-1 to F-457;M-1 to I-456;M-1 to Q-455;M-1 to R-454;M-1 to C-453;M-1 to Q-452;M-1 to Q-45 1;M-1 to D-450;M-1 to L-449;M-1 to Q-448;M-1 to Y-447;M-1 to L-446;M-1 to A- 445;M-1 to M-444;M-1 to R-443;M-1 to G-442;M-1 to P-441;M-1 to L-440; M-1 to G-439;M-1 to T-438;M-1 to P-437;M-1 to L-436;M-1 to P-435;M-1 to L-434;M-1 to A-433;M-1 to A-432;M-1 to G-431;M-1 to P-430;M-1 to A- 429;M-1 to D-428;M-1 to L-427;M-1 to L-426;M-1 to C-425;M-1 to D-424; M-1 to G-423;M-1 to H-422;M-1 to G-421;M-1 to G-420;M-1 to D-419;M-1 to L-418;M-1 to L-417;M-1 to E-416;M-1 to T-415;M-1 to L-414;M-1 to Y- 413;M-1 to M-412;M-1 to A-411;M-1 to S-410;M-1 to C-409;M-1 to P-408; M-1 to S-407;M-1 to W-406;M-1 to P-405;M-1 to L-404;M-1 to T-403;M-1 to Q-402;M-1 to N-401;M-1 to L-400;M-1 to H-399;M-1 to V-398;M-1 to F-397;M-1 to L-396;M-1 to P-395;M-1 to A-394;M-1 to M-393;M-1 to V- 392;M-1 to H-391;M-1 to H-390;M-1 to K-389;M-1 to G-388;M-1 to M-387; M-1 to P-386;M-1 to G-385;M-1 to F-384;M-1 to L-383;M-1 to R-382;M-1 to T-381;M-1 to C-380;M-1 to P-379;M-1 to K-378;M-1 to S-377;M-1 to D- 376;M-1 to D-375;M-1 to H-374;M-1 to P-373;M-1 to M-372;M-1 to S-371; M-1 to L-370;M-1 to V-369;M-1 to H-368;M-1 to G-367;M-1 to L-366;M-1 to E-365;M-1 to H-364;M-1 to A-363;M-1 to L-362;M-1 to T-361;M-1 to H- 360;M-1 to A-359;M-1 to A-358;M-1 to Q-357;M-1 to L-356;M-1 to G-355; M-1 to E-354;M-1 to D-353;M-1 to E-352;M-1 to I-351;M-1 to V-350;M-1 to S-349;M-1 to C-348;M-1 to S-347;M-1 to K-346;M-1 to N-345;M-1 to P- 344;M-1 to D-343;M-1 to C-342;M-1 to I-341;M-1 to T-340;M-1 to G-339; M-1 to I-338;M-1 to D-337;M-1 to A-336;M-1 to V-335;M-1 to G-334;M-1 to L-333;M-1 to T-332;M-1 to D-331;M-1 to C-330;M-1 to L-329;M-1 to G- 328;M-1 to E-327;M-1 to Q-326;M-1 to G-325;M-1 to C-324;M-1 to F-323; M-1 to N-322;M-1 to Q-321;M-1 to R-320;M-1 to T-319;M-1 to L-318;M-1 to L-317;M-1 to I-316;M-1 to A-315;M-1 to T-314;M-1 to D-313;M-1 to Y- 312;M-1 to H-311;M-1 to E-310;M-1 to P-309;M-1 to H-308;M-1 to R-307; M-1 to D-306;M-1 to S-305;M-1 to P-304;M-1 to Q-303;M-1 to N-302;M-1 to F-301;M-1 to R-300;M-1 to R-299;M-1 to Q-298;M-1 to W-297;M-1 to N-296;M-1 to C-295;M-1 to F-294;M-1 to N-293;M-1 to R-292;M-1 to L- 291;M-1 to T-290;M-1 to L-289;M-1 to G-288;M-1 to G-287;M-1 to N-286; M-1 to D-285;M-1 to S-284;M-1 to V-283;M-1 to E-282;M-1 to P-281;M-1 to G-280;M-1 to W-279;M-1 to K-278;M-1 to E-277;M-1 to D-276;M-1 to E-275;M-1 to V-274;M-1 to I-273;M-1 to L-272;M-1 to V-271;M-1 to K- 270;M-1 to V-269;M-1 to V-268;M-1 to M-267;M-1 to L-266;M-1 to N-265; M-1 to I-264;M-1 to S-263;M-1 to N-262;M-1 to K-261;M-1 to I-260;M-1 to S-259;M-1 to P-258;M-1 to H-257;M-1 to K-256;M-1 to Y-255;M-1 to I- 254;M-1 to R-253;M-1 to A-252;M-1 to A-251;M-1 to V-250;M-1 to S-249; M-1 to M-248;M-1 to L-247;M-1 to T-246;M-1 to L-245;M-1 to I-244;M-1 to H-243;M-1 to N-242;M-1 to Q-241;M-1 to L-240;M-1 to D-239;M-1 to A-238;M-1 to G-237;M-1 to Y-236;M-1 to F-235;M-1 to A-234;M-1 to A- 233;M-1 to M-232;M-1 to S-231;M-1 to A-230;M-1 to D-229;M-1 to A-228; M-1 to V-227;M-1 to L-226;M-1 to L-225;M-1 to T-224;M-1 to E-223;M-1 to V-222;M-1 to F-221;M-1 to R-220;M-1 to A-219;M-1 to E-218;M-1 to S- 217;M-1 to V-216;M-1 to F-215;M-1 to R-214;M-1 to K-213;M-1 to T-212; M-1 to R-211;M-1 to S-210;M-1 to T-209;M-1 to A-208;M-1 to G-207;M-1 to L-206;M-1 to P-205;M-1 to P-204;M-1 to P-203;M-1 to P-202;M-1 to E- 201;M-1 to S-200;M-1 to A-199;M-1 to G-198;M-1 to E-197;M-1 to A-196; M-1 to E-195;M-1 to E-194;M-1 to E-193;M-1 to Q-192;M-1 to S-191;M-1 to E-190;M-1 to E-189;M-1 to E-188;M-1 to S-187;M-1 to D-186;M-1 to E- 185;M-1 to Q-184;M-1 to H-183;M-1 to D-182;M-1 to G-181;M-1 to R-180; M-1 to E-179;M-1 to Q-178;M-1 to R-177;M-1 to Q-176;M-1 to G-175;M-1 to E-174;M-1 to G-173;M-1 to T-172;M-1 to E-171;M-1 to V-170;M-1 to E- 169;M-1 to W-168;M-1 to E-167;M-1 to P-166;M-1 to G-165;M-1 to R-164; M-1 to P-163;M-1 to L-162;M-1 to P-161;M-1 to R-160;M-1 to A-159;M-1 to G-158;M-1 to A-157;M-1 to P-156;M-1 to G-155;M-1 to W-154;M-1 to R-153;M-1 to Q-152;M-1 to L-151;M-1 to R-150;M-1 to H-149;M-1 to P- 148;M-1 to Q-147;M-1 to A-146;M-1 to L-145;M-1 to S-144;M-1 to G-143; M-1 to G-142;M-1 to A-141;M-1 to G-140;M-1 to Q-139;M-1 to P-138;M-1 to Q-137;M-1 to I-136;M-1 to T-135;M-1 to F-134;M-1 to E-133;M-1 to E- 132;M-1 to G-131;M-1 to D-130;M-1 to L-129;M-1 to L-128;M-1 to F-127; M-1 to S-126;M-1 to G-125;M-1 to S-124;M-1 to L-123;M-1 to G-122;M-1 to R-121;M-1 to C-120;M-1 to L-119;M-1 to S-118;M-1 to V-117;M-1 to A- 116;M-1 to A-115;M-1 to L-114;M-1 to S-113;M-1 to E-112;M-1 to P-111; M-1 to E-110;M-1 to G-109;M-1 to N-108;M-1 to V-107;M-1 to T-106;M-1 to G-105;M-1 to S-104;M-1 to F-103;M-1 to F-102;M-1 to C-101;M-1 to G- 100;M-1 to R-99;M-1 to L-98;M-1 to G-97;M-1 to R-96;M-1 to E-95;M-1 to G-94;M-1 to G-93;M-1 to T-92;M-1 to A-91;M-1 to R-90;M-1 to G-89; M-1 to S-88;M-1 to G-87;M-1 to G-86;M-1 to L-85;M-1 to R-84;M-1 to E- 83;M-1 to I-82;M-1 to K-81;M-1 to F-80;M-1 to E-79;M-1 to P-78;M-1 to A-77;M-1 to L-76;M-1 to F-75;M-1 to S-74;M-1 to D-73;M-1 to D-72;M-1 to P-71;M-1 to A-70;M-1 to L-69;M-1 to R-68;M-1 to L-67;M-1 to V-66;M-
1 to F-65;M-1 to G-64;M-1 to K-63;M-1 to G-62;M-1 to F-61;M-1 to A-60;
M-1 to S-59;M-1 to L-58;M-1 to H-57;M-1 to L-56;M-1 to A-55;M-1 to L-
54;M-1 to E-53;M-1 to G-52;M-1 to A-51;M-1 to S-50;M-1 to G-49;M-1 to
P-48;M-1 to L-47;M-1 to R-46;M-1 to T-45;M-1 to P-44;M-1 to V-43;M-1
to V-42;M-1 to L-41;M-1 to E-40;M-1 to S-39;M-1 to A-38;M-1 to Q-37;M-
1 to G-36;M-1 to G-35;M-1 to A-34;M-1 to A-33;M-1 to P-32;M-1 to R-31;
M-1 to A-30;M-1 to P-29;M-1 to A-28;M-1 to G-27;M-1 to R-26;M-1 to A-
25;M-1 to L-24;M-1 to P-23;M-1 to L-22;M-1 to L-21;M-1 to L-20;M-1 to
L-19;M-1 to L-18;M-1 to L-17;M-1 to L-16;M-1 to L-15;M-1 to L-14;M-1
to F-13;M-1 to P-12;M-1 to L-11;M-1 to W-10;M-1 to R-9;M-1 to P-8;M-1
to A-7;(SEQ ID NO:4)优选地,任何以上列举的N-或C-端缺失可组合 而产生N-和C-端缺失的METH2多肽。
本发明还提供了在氨基和羧基端两端均具一个或多个氨基酸缺失的 多肽,它们通常可描述为具SEQ ID NO:2或SEQ ID NO:4的m-n残基, 其中n和m是如上所述的整数。
也优选以结构或功能结构域为特征的METH1或METH2多肽和多核苷酸 片段。本发明的优选实施方案包括含以下区域的片段:α-螺旋和α-螺 旋形成区(“α-区”)、β-折叠和β-折叠形成区(“β-区”)、转角和转 角形成区(“转角区”)、卷曲和卷曲形成区(“卷曲区”)、亲水区、疏水 区、α两亲区、β两亲区、柔性区、表面形成区、底物结合区和高抗原 性指数区。如图中所列出的,这样的优选区包括Garnier-Robsonα-区、 β-区、转角区和卷曲区、Chou-Fasmanα-区、β-区和转角区、 Kyte-Doolittle亲水区和疏水区、Eisenbergα和β两亲区、 Karplus-Schulz柔性区、Emini表面形成区和Jameson-Wolf高抗原性指 数区。本发明特别包括落在保守结构域内的SEQ ID NO:2多肽片段。(参 阅图10&11和表1&2)。此外,本发明也包括编码这些结构域的多核苷酸 片段。
其他优选片段是生物活性的METH1或METH2片段。生物活性片段是那 些展示与METH1或METH2多肽活性相似但不必完全相同的活性的片段。 这些片段的生物活性包括提高的期望活性或降低的不理想活性。
如EST序列之类的许多多核苷酸序列可公开地从序列数据库获得。其 中一些与SEQ ID NO:1或SEQ ID NO:3有关,并可能在本发明构思前已 可公开地获得。优选地,这种相关多核苷酸排除在本发明范围之外。将 每个相关序列一一列举是繁琐的。因此,优选从本发明中排除的是含通 式a-b所描述之核苷酸序列的一个或多个多核苷酸,其中a是SEQ ID NO:1 第1-936位的任何整数,b是第15-950位整数,其中a和b都相应于SEQ ID NO:1中所示的核苷酸残基位置,且b大于或等于+14。此外,优选从 本发明中排除的是含通式a-b所描述之核苷酸序列的一个或多个多核苷 酸,其中a是SEQ ID NO:3第1-876位的任何整数,b是第15-890位整 数,其中a和b都相应于SEQ ID NO:3中所示的核苷酸残基位置,且b 大于或等于+14。
表位和抗体
在本发明中,“表位”指在动物,尤其是人体内具抗原性或免疫原性 活性的METH1或METH2多肽片段。本发明的优选实施方案涉及含表位的 METH1或METH2多肽片段以及编码该片段的多核苷酸。抗体可结合的蛋白 质分子区称为“抗原性表位”。相对而言,“免疫原性表位”定义为可引 发抗体应答的蛋白质部分。(参阅,例如,Geysen等,美国国家科学院院 报81:3998-4002(1983))。
具表位功能的片段可用任何常规方法产生。(见,如,Houghten,R.A., 美国国家科学院院报82:5131-5135(1985),进一步描述于美国专利号 4631211中。)
在本发明中,抗原性表位优选包括至少7个,更优选至少9个,最优 选约15-30个氨基酸的序列。抗原性表位可用于产生与表位可特异结合 的抗体,包括单克隆抗体。(见,例如,Wilson等,细胞37:767-778(1984); Sutcliffe,J.G.等,科学219:660-666(1983))。
同样地,免疫原性表位可按本领域众所周知的方法用于诱发抗体。 (参阅,例如,Sutcliffe等,见上文;Wilson等,见上文;Chow,M.等, 美国国家科学院院报82:910-914;和Bittle,F.J.等,普通病毒学杂志 (J.Gen.Virol.)66:2347-2354(1985)。)优选的免疫原性表位包括分泌的 蛋白质。免疫原性表位可与载体蛋白质,如清蛋白一起用于动物系统(如 兔或小鼠),或者,如果它足够长(至少约25个氨基酸),则可以无需载 体。然而,含少至8-10个氨基酸的免疫原性表位已显示足以产生能至少 结合变性多肽中线性表位的抗体(如在蛋白质印迹中)。
利用DNAstar分析,发现SEQ ID NO:2在以下氨基酸处有抗原性:
      2-14,32-44,47-60,66-78,87-103,109-118,146-162,168-180,183-219,
223-243,275-284,296-306,314-334,341-354,357-376,392-399,401-410,418-
429,438-454,456-471,474-488,510-522,524-538,550-561,565-626,630-643,
659-671,679-721,734-749,784-804,813-820,825-832,845-854,860-894,899-
917,919-924 and 928-939因此,这些区域可用作表位以产生抗METH1 cDNA所编码蛋白质的抗体。
利用DNAstar分析,发现SEQ ID NO:4在以下氨基酸处有抗原性:
      26-38,45-52,69-76,80-99,105-113,129-136,138-217,254-263,273-
289,294-313,321-331,339-356,371-383,417-427,438-443,459-471,479-505,
507-526,535-546,550-607,615-640,648-653,660-667,669-681,683-704,717-
732,737-743,775-787,797-804,811-825,840-867 and 870-884,
因此,这些区域可用作表位以产生抗METH 2 cDNA所编码蛋白质的抗 体。
此处所用术语“抗体”(Ab)或“单克隆抗体”(Mab)表示包括完整分 子及能特异结合蛋白质的抗体片段(如,例如Fab和F(ab’)2片段)。Fab 和F(ab’)2片段缺少完整抗体的Fc片段,与完整抗体相比能更迅速地从 循环中清除,且可能有更少的非特异性组织结合。(Wahl等, J.Nucl.Med.24:316-325(1983).)因此,优选这些片段,以及FAB或其 他免疫球蛋白表达文库的产物。此外,本发明的抗体包括嵌合、单链和 人源化抗体。
融合蛋白
任何METH1或METH2多肽可用于产生融合蛋白。例如,与第二种蛋白 质融合了时,METH1或METH2多肽可用作抗原标记。产生的抗METH1或 METH2多肽的抗体可通过与METH1或METH2结合而用于间接检测第二种蛋 白质。而且,因为分泌蛋白质基于运输信号而定向于细胞位置,故METH1 或METH2多肽一旦与其它蛋白质融合就可用作靶向分子。
可与METH1或METH2多肽融合的结合域例子不仅包括异源信号序列, 还包括其他异源功能区。融合不必一定是直接的,也可通过连接序列产 生。
此外,融合蛋白质还可通过基因工程改造以改善METH1或METH2多肽 的特性。例如,可将附加氨基酸区,尤其是带电氨基酸加入METH1或METH2 多肽的N-末端,从而提高其在从宿主细胞中纯化或随后的处理和储藏中 的稳定性和持久性。此外,可将肽部分加入METH1或METH2多肽中以方 便纯化。在METH1或METH2多肽最后制成前可将这样的区域去除。添加 肽部分以方便多肽处理是本领域所熟悉和常规的技术。
此外,METH1或METH2多肽,包括片段和特异性表位可与免疫球蛋白 (IgG)的恒定区部分结合产生嵌合多肽。这些融合蛋白方便了纯化且显示 体内半寿期增长。已报道的一个例子描述了由人CD4多肽的头两个结构 域和哺乳动物免疫球蛋白重链或轻链恒定区多个结构域组成的嵌合蛋 白。(EP A394827;Traunecker等,自然331:84-89(1988)。)与单独的 单体分泌蛋白或蛋白质片段相比,具二硫键连接之二聚体结构(由于IgG) 的融合蛋白在结合和中和其他分子方面更有效。(Fountoulakis等,生化 杂志270:3958-3964(1995).)
类似的,EP-A-O 464 533(加拿大相应文本2045869)公开了含免疫 球蛋白分子恒定区多个部分及另一种人蛋白质或其片段的融合蛋白。在 许多情况下,融合蛋白中的Fc部分有益于治疗和诊断,并因此导致例如 改善的药物动力学特性。(EP-A 0232 262)或者,可能期望在融合蛋白 表达、检测和纯化后删除Fc部分。例如,若融合蛋白用作免疫反应抗原, Fc部分可能会妨碍治疗和诊断。例如,在药物的开发中,已将如hIL-5 之类的人蛋白质与Fc部分融合以达到进行高流通量试验鉴定hIL-5拮抗 物的目的。(参阅,D.Bennett等,分子识别杂志(J.Molecular Recognition)8:52-58(1995);K.Johanson等,生物化学杂志 270:9459-9471(1995)。)
此外,METH1或METH2多肽可与标记序列融合,诸如方便METH1或METH2 纯化的肽。在优选的实施方案中,标记氨基酸序列是六组氨酸肽,如pQE 载体(QIAGEN,Inc.,9259Eton Avenue,Chatswirth,CA,91311)中提供的 标记,其它许多标记可购买得到。例如,如Gentz等,美国国家科学院 院报86:821-824(1989)中所述,六组氨酸可便于融合蛋白的纯化。另一 可用于纯化的肽标签,“HA”标签相应于来自流感血凝素蛋白的表位。 (Wilson等,细胞37:767(1984)。)
如此说来,可用METH1或METH2多核苷酸或多肽加工得到任何以上融 合体。
METH1或METH2的生物学活性
METH1或METH2多核苷酸和多肽可用于试验中以检测其一种或多种生 物学活性。如果在特殊试验中METH1或METH2多核苷酸和多肽确实呈现 了活性,那么在与此生物学活性相关的疾病中可能涉及METH1或METH2。 因此,METH1或METH2可用于治疗此相关疾病。
免疫活性
METH1或METH2多肽或多核苷酸可通过激活或抑制免疫细胞的增殖、 分化或转移(趋化性)而用于治疗免疫系统的缺乏或疾病。免疫细胞通 过从多能干细胞产生骨髓(血小板、血红细胞、嗜中性粒细胞和巨噬细 胞)和淋巴(B和T淋巴细胞)细胞的称为血细胞生成的过程而发育。这 些免疫缺乏或疾病的病因可能是遗传的、体细胞的(如癌症或一些自身 免疫疾病)、获得性的(如通过化疗或毒素)或传染性的。此外,METH1 或METH2多核苷酸或多肽可用作特殊免疫系统疾病或疾病的标记或检测 物。
METH1或METH2多核苷酸或多肽可用于治疗或检测造血细胞的缺乏或 疾病。在治疗与某些(或许多)类型造血细胞的减少相关的疾病时,METH1 或METH2多肽或多核苷酸可用于增加包括多能干细胞在内的造血细胞的 分化和增殖。免疫缺陷综合症的例子包括,但不局限于:血液蛋白质疾 病(如丙球蛋白缺乏血症、异常γ球蛋白血症)、共济疾病毛细血管扩张 血症、常见的可变型免疫缺陷症、Digeorge综合症、HIV感染、HTLV-BLV 感染、白细胞附着缺陷综合症、淋巴球减少症、吞噬细胞杀菌功能紊乱、 严重联合免疫缺损(SCID)、Wiskott-Aldrich疾病、贫血、血小板减少 症或血红蛋白尿症。
此外,METH1或METH2多肽或多核苷酸还可用于调节止血(停止出血) 或溶栓活性(血凝块形成)。例如,通过提高止血或溶栓活性,METH1或 METH2多核苷酸或多肽可用于治疗血液凝结疾病(如纤维蛋白原缺乏血 症、因子缺乏症)、血小板疾病(如血小板减少症)或创伤、手术或其他 原因引起的伤口。或者,能降低止血或溶栓活性的METH1或METH2多核 苷酸或多肽可用于抑制凝血或溶解血块,这在治疗心脏病发作(梗塞)、 中风或瘢疤形成中是重要的。
METH1或METH2多核苷酸或多肽也可用于治疗或检测自身免疫疾病。 许多自身免疫疾病是由于自身免疫细胞不适当地将自身物质识别成外来 物而产生的。此不适当的识别引起免疫应答,导致宿主组织的破坏。因 此,服用能抑制免疫应答,尤其是T-细胞增殖、分化或趋化性的METH1 或METH2多肽或多核苷酸可能是预防自身免疫疾病的有效治疗方法。
用METH1或METH2可治疗或检测的自身免疫疾病例子包括,但不局限 于:艾迪生病、溶血性贫血、抗磷脂综合症、类风湿性关节炎、皮炎、 变应性脑脊髓炎、肾小球肾炎、肺出血肾炎综合症、Graves病、多发性 硬化症、重症肌无力、神经炎、眼炎、大疤性类天疱疮、天疱疮、多内 分泌腺病、紫癜、赖特病、僵人综合症、自身免疫性甲状腺炎、系统性 红斑狼疮、自身免疫性肺炎、Guillain-Barre综合症、胰岛素依赖性糖 尿病和自身免疫性眼炎。
类似地,诸如哮喘(尤其是过敏性哮喘)之类的过敏性反应和状态或 其他呼吸问题也可用METH1或METH2多肽或多核苷酸治疗。此外,METH1 或METH2可用于治疗过敏性反应、对抗原分子的超敏性或血型不合。
METH1或METH2多核苷酸或多肽也可用于治疗和/或防止器官排斥或 移植物抗宿主病(GVHD)。宿主细胞通过免疫应答破坏移植组织产生 器官排斥。类似地,在GVHD中也涉及免疫应答,但在此情况下是外来移 植的免疫细胞破坏宿主组织。服用能抑制免疫应答,尤其是T-细胞增殖、 分化或趋化性的METH1或METH2多肽或多核苷酸可能是预防器官排斥或 GVHD的有效治疗方法。
类似地,METH1或METH2多肽或多核苷酸也可用于缓解炎症。例如, METH1或METH2多肽或多核苷酸可抑制参与炎症反应的细胞的增殖和分 化。这些分子可用于治疗慢性或急性炎症,包括与感染(如,脓毒性休 克、脓毒病或全身炎性反应综合症(SIRS)、局部缺血一重灌注损伤、内 毒素致死性、关节炎、补体介导的超急性排斥、肾炎、细胞因子或趋化 因子诱发的肺损伤、感染性肠炎、局限性回肠炎或细胞因子过量产生引 起的炎症(如,TNF或IL-1)。
过度增殖疾病
METH1或METH2多肽或多核苷酸可用于治疗或检测包括瘤形成在内的 过度增殖疾病。METH1或METH2多肽或多核苷酸可通过直接或间接的相互 作用抑制疾病的增殖。或者,METH1或METH2多肽或多核苷酸可使其他能 抑制过度增殖疾病的细胞增殖。
例如,可通过提高免疫应答,尤其是提高过度增殖疾病的抗原性或通 过T-细胞增殖、分化或转移来治疗过度增殖疾病。通过增强现有免疫应 答或激发新的免疫应答可增加该免疫应答。或者,减少免疫应答可能也 是治疗过度增殖疾病的方法,如化疗物质。
可用METH1或METH2多核苷酸或多肽治疗或检测的过度增殖疾病例子 包括,但不局限于以下部位的瘤形成:腹部、骨、乳腺、消化系统、肝、 胰、腹膜、内分泌腺(肾上腺、甲状腺、垂体、睾丸、卵巢、胸腺、甲 状腺)、眼、头和颈、神经(中枢和外周神经、淋巴系统、骨盆、皮肤、 软组织、脾、胸和泌尿生殖系统。
类似地,其他的过度增殖疾病也可用METH1或METH2多核苷酸或多肽 治疗或检测。这些过度增殖疾病例子包括,但不局限于:高丙球蛋白血 症、淋巴组织增生疾病、异常蛋白血症、紫癜、结节病、赛塞综合症、 瓦尔登斯特伦巨球蛋白血症、戈谢病、组织细胞增多病和位于上述器官 系统中除瘤形成外的任何其他过度增殖疾病。
传染病
METH1或METH2多肽或多核苷酸可用于治疗或检测传染因子。例如, 通过提高免疫应答,尤其是提高B和/或T-细胞的增殖和分化,可治疗 传染病。可通过增强现有免疫应答或激发新的免疫应答来增加免疫应答。 或者,METH1或METH2多肽或多核苷酸也可直接抑制传染因子,无需引起 免疫反应。
病毒是能引起可被METH1或METH2多核苷酸或多肽治疗或检测之疾病 或症状的传染因子例子。病毒的例子包括,但不局限于以下DNA和RNA 病毒科:虫媒病毒、腺病毒科、砂粒病毒科、动脉病毒、双RNA病毒、 Bunyaviridae、杯状病毒科、环状病毒科、冠形病毒科、黄病毒科、嗜 肝DNA病毒科(肝炎)、疱疹病毒科(如巨细胞病毒、单纯疱疹病毒、带 状疱疹)、Mononegavirus(如副粘病毒科、麻疹病毒科、弹状病毒科)、 正粘病毒科(如流感病毒)、乳多空病毒科、细小病毒科、微小RNA病毒 科、痘病毒科(如天花病毒或痘苗病毒)、呼肠孤病毒科(如轮状病毒)、 逆转录病毒科(HTLV-I、HTLV-II或慢病毒属)和披膜病毒科(如风疹病 毒)。在这些科内的病毒可引起多种疾病或症状,包括但不局限于:关节 炎、细支气管炎、脑炎、眼部感染(如结膜炎、角膜炎)、慢性疲劳综合 症、肝炎(A、B、C、E、慢性活动性、丁型肝炎)、脑膜炎、机会性 感染(如AIDS)、肺炎、伯基特淋巴瘤、水痘、出血热、麻疹、流行性腮 腺炎、副流感、狂犬病、普通感冒、脊髓灰质炎、白血病、风疹、性传 播疾病、皮肤病(如卡波西病、疣)和病毒血症。METH1或METH2多肽或 多核苷酸可用于治疗或检测任何这些症状或疾病。
类似地,能引起可被METH1或METH2多核苷酸或多肽治疗或检测之疾 病或症状的细菌和真菌包括,但不局限于以下革兰氏阴性和革兰氏阳性 细菌及真菌:放线菌目(如棒杆菌、分枝杆菌、Norcardia)、曲霉、芽 孢杆菌科(如炭疽、梭菌)、拟杆菌科、芽酵母、博德特氏菌、疏螺旋体、 普鲁氏杆菌、念珠菌、弯曲杆菌、球孢子菌、隐球菌、Dermatocycoses、 肠杆菌科(克雷伯氏菌、沙门氏菌、沙雷氏菌、耶尔森氏菌)、丹毒丝菌、 螺杆属菌、军团菌、钩端螺旋体病、利斯特氏菌、枝原体目、奈瑟氏球 菌科(如不动杆菌、淋病、Menigococcal)、巴斯德氏菌科感染(如放 线菌、嗜血菌(Heamophilus)、巴斯德氏菌)、假单胞菌、立克次氏体科、 衣原体科、梅毒和葡萄球菌。这些细菌或真菌家族能引起以下疾病或症 状,包括但不局限于:菌血症、心内膜炎、眼感染(如结膜炎、结核病、 眼色素层炎)、齿龈炎、机会感染(如AIDS相关感染)、甲沟炎、与修复 术相关的感染、赖特氏病、呼吸道感染(如百日咳或脓胸)、脓毒症、莱 姆病、猫抓病、痢疾、副伤寒热、食物中毒、伤寒、肺炎、淋病、脑膜 炎、衣原体、梅毒、白喉、麻风病、类结核、结核病、狼疮、肉毒中毒、 坏疽、破伤风、脓胞病、风湿热、猩红热、性传播疾病、皮肤病(如蜂 窝织炎、dermatocycoses)、毒血症、尿道感染、伤口感染。METH1或METH2 多肽或多核苷酸可用于治疗或检测任何这些症状或疾病。
此外,能引起可被METH1或METH2多核苷酸或多肽治疗或检测之疾病 或症状的寄生物包括,但不局限于以下家族:变形虫、巴贝虫、球虫、 隐孢子虫双核阿米巴(Dientamoebiasis)、姌疫(Dourine)、外寄生虫、 贾第鞭毛虫、蠕虫、利什曼虫、泰勒尔梨浆虫、弓形体、锥虫和毛滴虫 (Trichomonas)。这些寄生虫能引起多种疾病或症状,包括但不局限于: 疥疮、恙螨病、眼感染、肠疾病(如痢疾、贾第鞭毛虫病)、肝病、肺病、 机会感染(如AIDS相关疾病)、症疾、妊娠并发症和弓形体病。METH1 或METH2多肽或多核苷酸可用于治疗或检测任何这些症状或疾病。
优选的,利用METH1或METH2多肽或多核苷酸进行的治疗可通过施用 有效量METH1或METH2多肽于病人,或从患者体内取出细胞,给细胞提 供METH1或METH2多核苷酸,并将该改造后的细胞重新引入患者体内(离 体疗法)而进行。此外,METH1或METH2多肽或多核苷酸可用作疫苗中的 抗原以产生抗传染病的免疫应答。
再生
METH1或METH2多核苷酸或多肽可用于分化、增殖和吸引细胞,导致 组织再生。(见,科学276:59-87(1997)。)组织的再生可用于修复、置换 或保护由于先天缺陷、损伤(创伤、烧伤、割伤或溃疡)、年龄、疾病(如 骨质疏松症、骨性关节炎、牙周疾病、肝衰竭)、外科手术,包括整容手 术、纤维变性症、重灌注损伤或系统性细胞因子损伤而受损的组织。
可用本发明再生的组织包括器官(如胰、肝、肠、肾、皮肤、内皮)、 肌肉(平滑肌、骨胳肌或心肌)、血管(包括血管内皮)、神经、造血和 骨胳(骨、软骨、腱和韧带)组织。优选地,再生发生时无或减少瘢疤 形成。再生也可包括血管形成。
此外,METH1或METH2多核苷酸或多肽可促进难于愈合的组织的再生。 例如,促进腱/韧带再生会加快损伤后的恢复时间。也可预防性地使用本 发明的METH1或METH2多核苷酸或多肽以避免损伤。可治疗的特异疾病 包括腱炎、腕管综合症和其他腱或韧带损伤。非愈合性创伤的组织再生 的其他例子包括强制性溃疡(pressure ulcer)、与血管不足相关的溃疡、 外科手术创伤和外伤。
类似地,通过利用METH1或METH2多核苷酸或多肽增殖和分化神经细 胞也可再生神经和脑组织。用此方法可治疗的疾病包括中枢和外周神经 系统疾病、神经病或机械性和创伤性疾病(如脊髓紊乱、头部创伤、脑 血管疾病和中风)。特别是,与外周神经损伤相关的疾病、外周神经病(如 由于化疗或其他医学治疗所产生)、局部神经病和中枢神经系统疾病(如 早老性痴呆、帕金森症、亨亭顿氏舞蹈症、肌萎缩性侧索硬化和 Shy-Drager综合症)均可用METH1或METH2多核苷酸或多肽治疗。
趋化性
METH1或METH2多核苷酸或多肽可能具趋化活性。趋化分子吸引或迁 移细胞(如单核细胞、成纤维细胞、嗜中性粒细胞、T-细胞、肥大细胞、 嗜酸性粒细胞、上皮细胞和/或内皮细胞)至身体的特殊位点,如发炎、 感染或过度增殖位点。然后迁移细胞去除和/或治愈特殊损伤或异常。
METH1或METH2多核苷酸或多肽可增加特殊细胞的趋化性。然后这些 趋化分子可通过增加定向于身体内特殊位置的细胞数而用于治疗炎症、 感染、过度增殖疾病或任何免疫系统疾病。例如,趋化分子可通过吸引 免疫细胞至受伤部位而用于治疗组织的创伤和其他损伤。作为趋化分子, METH1或METH2还能吸引可用于治疗创伤的成纤维细胞。
也考虑到METH1或METH2多核苷酸或多肽可抑制趋化活性。这些分子 也可用于治疗疾病。因此,METH1或METH2多核苷酸或多肽可用作趋化性 的抑制剂。
结合活性
METH1或METH2多肽可用于筛选可结合METH1或METH2的分子或者 METH1或METH2结合的分子。METH1或METH2与分子的结合可激活(激动 剂)、提高、抑制(拮抗物)或降低METH1或METH2或者所结合分子的活 性。所说分子的例子包括抗体、寡核苷酸、蛋白质(如受体)或小分子。
优选地,该分子与METH1或METH2的天然配基紧密相关,如配基片段、 天然底物、配基、结构或功能模拟物。(见,Coligan等,免疫学通用方 法(Current protocols in Immunology)1(2):第5章(1991)。)类似的, 该分子可能与METH1或METH2所结合的天然受体或至少能被METH1或 METH2结合的受体片段(如活性位点)紧密相关。任何一种情况中分子均 可用已知技术合理设计。
优选地,这些分子的筛选包括产生表达METH1或METH2(作为分泌蛋 白或在细胞膜上)的适当细胞。优选的细胞包括哺乳动物、酵母、果蝇 或大肠杆菌的细胞。然后将表达METH1或METH2的细胞(或含表达多肽 的细胞膜)与可能含此分子的检测化合物接触,以观察METH1或METH2 或此分子的结合、活性的刺激或抑制。
试验可只检测候选化合物与METH1或METH2的结合,其中结合用标记 或包括与标记竞争物竞争的试验来检测。另外,试验可检测候选化合物 是否通过与METH1或METH2结合产生信号。
或者,可用无细胞制品、粘附于固相支持物的多肽/分子、化学药品 或天然产物混合物进行试验。试验也可简单地包括以下步骤:混合候选 化合物与含METH1或METH2的溶液,检测METH1或METH2/分子的活性或 结合,并与标准品比较METH1或METH2/分子的活性或结合。
优选地,ELISA试验可用单克隆抗体或多克隆抗体检测样品(如生物 样品)中METH1或METH2水平或活性。抗体可通过直接或间接地与METH1 或METH2结合或与METH1或METH2竞争底物而检测METH1或METH2的水 平或活性。
所有以上试验均可用作诊断或预后标记。用这些试验发现的分子可用 于通过活化或抑制METH1或METH2分子而治疗疾病或在患者中产生特殊 的效果(如血管生长)。此外,这些试验能发现可抑制或增强适当处理细 胞或组织中METH1或METH2产生的物质。
因此,本发明包括鉴定与METH1或METH2可结合的化合物的方法,该 方法包括以下步骤:(a)温育候选结合化合物与METH1或METH2;和(b) 测定结合是否发生。另外,本发明包括鉴定激动剂/拮抗物的方法,该方 法含以下步骤:(a)温育候选化合物与METH1或METH2;(b)检测生物学 活性,和(c)测定METH1或METH2的生物学活性是否已改变。
其它活性
除了以上所述的造血细胞系外,METH1或METH2多肽或多核苷酸还可 增加或减少胚胎干细胞的分化或增殖。
METH1或METH2多肽或多核苷酸还可用于调节哺乳动物的特性,如身 高、体重、发色、眼的颜色、皮肤、脂肪组织的百分比、色素沉着、大 小和形状(如整容手术)。类似地,METH1或METH2多肽或多核苷酸可用 于调节哺乳动物的代谢,影响分解代谢、合成代谢、加工、利用和能量 的储存。
METH1或METH2多肽或多核苷酸可用于通过影响生物节律、抑郁(包 括抑郁性疾病)、暴力倾向、耐痛力、生殖能力(优选通过活化素或类抑 制素活性)、激素或内分泌水平、食欲、性欲、记忆力、应激力或其他认 知性而改变哺乳动物的精神状态或身体状况。
METH1或METH2多肽或多核苷酸还可用做食品添加剂或防腐剂,如用 于增加或减少储存能力、脂肪含量、脂类、蛋白质、碳水化合物、维生 素、矿物质、辅助因子或其他营养成分。
以上已对本发明进行了综述,参照举例说明的以下实施例将更易理解 本发明,但本发明并不局限于这些实施例。
癌症诊断和预后
现认为,与相应的标准哺乳动物(即未患癌症的同种哺乳动物)相比, 患癌哺乳动物体内的某些组织表达明显减少水平的METH1或METH2蛋白 质和编码METH1或METH2蛋白质的mRNA。进一步认为与来自未患癌症的 同种哺乳动物的血清相比,在来自患癌哺乳动物的某些体液(如血清、 血浆、尿和脊髓液)中可检测到减少水平的METH1或METH2蛋白质。因 此,本发明提供了一种肿瘤诊断中有用的诊断方法,包括检测哺乳动物 细胞或体液中编码METH1蛋白质的基因的表达水平,并比较此基因表达 水平与标准的METH1基因表达水平,基因表达水平降低到标准之下是某 些肿瘤的指示。本发明还提供了一种肿瘤诊断中有用的诊断方法,包括 检测哺乳动物细胞或体液中编码METH2蛋白质的基因的表达水平,并比 较此基因表达水平与标准的METH2基因表达水平,基因表达水平降低到 标准之下是某些肿瘤的指示。
在已可按常规方法进行的肿瘤诊断中,本发明可用做预后指示剂,呈 现减少METH1或METH2基因表达的病人,其临床结果比以较低水平表达 此基因的病人更坏。
“检测编码METH1或METH2蛋白质的基因表达水平”指直接(如测定 或估计绝对蛋白质水平或mRNA水平)或相对(如与第二种生物样品中的 METH1或METH2蛋白质的水平或mRNA水平相比较)地定性或定量检测或 估计在第一种生物样品中METH1或METH2蛋白质的水平或编码METH1或 METH2蛋白质的mRNA水平。
优选地,对第一种生物样品中的METH1或METH2蛋白质水平或mRNA 水平进行检测或估计并与标准METH1或METH2蛋白质水平或mRNA水平相 比较,作为标准的第二种生物样品获自未患癌症的个体。正如本领域中 应理解的,一旦标准的METH1或METH2蛋白质水平或mRNA水平已知,它 可重复使用作为比较的标准。
“生物样品”指获自含METH1或METH2蛋白质或mRNA之个体、细胞 系、组织培养物或其他来源的任何生物样品。生物样品包括含分泌型成 熟METH1或METH2蛋白质的哺乳动物体液(如血清、血浆、尿、滑液和 脊髓液),以及肾上腺、甲状腺、胃、脑、心、胎盘、肺、肝、肌肉、肾、 胰、睾丸和卵巢组织(对于METH1);及前列腺、小肠、结肠、脑和肺组 织(对于METH2)。
本发明可用于检测哺乳动物的癌症。本发明特别可用于哺乳动物以下 类型癌症的诊断中:乳腺癌、卵巢癌、前列腺癌、肝癌、肺癌、胰腺癌、 结肠癌和睾丸癌。优选的哺乳动物包括猴、猿、猫、狗、牛、猪、马、 兔和人。尤其优选人。
用Chomczynski和Sacchi,生化分析(Anal.Biochem.)162: 156-159(1987)中所述的一步硫氰酸胍-酚-氯仿法可从生物样品中分离 细胞的总RNA。然后用任何恰当的方法检测编码METH1或METH2蛋白质的 mRNA水平。这些方法包括RNA印迹分析(Harada等,细胞 63:303-312(1990))、S1核酸酶作图(Fujita等,细胞 49:357-367(1987))、聚合酶链式反应(PCR)、逆转录与聚合酶链式反应 联合(RT-PCR)(Makino等,技术(Technique)2:295-301(1990))和逆转 录与连接酶链式反应联合(RT-LCR)。
可用以抗体为基础的技术检验生物样品中的METH1或METH2蛋白质水 平。例如,可用传统的免疫组织学方法(Jalkanen,M.等,细胞生物学杂 志(J.Cell Biol.)101:976-985(1985);Jalkanen等,细胞生物学杂志 105:3087-3096(1987))研究组织中METH1或METH2蛋白质的表达。
其他以抗体为基础、可用于检测METH1或METH2蛋白质基因表达的方 法包括免疫测定,如酶联免疫吸附测定(ELISA)和放免测定(RIA)。
合适的标记是本领域已知的,包括酶标记(如葡萄糖氧化酶)、放射 性同位素(如碘(125I、121I)、碳(14C)、硫(35S)、氚(3H)、铟(112In) 和锝(99mTc))和荧光标记(如荧光素和若丹明)和生物素。
给药方式
现已认识到血管供应的增加在肿瘤发展和转移中起中心作用;因此, 可证实将血管生成抑制剂用做癌症病人的辅助治疗是有效的。一些目前 已知的血管生成抑制剂由于严重的副作用而不适合用于全身性治疗。本 发明的发明者已发现,METH1和METH2在体内和体外均为血管生成的强抑 制剂。与其他血管生成抑制剂相比,METH1和METH2的优点在于它们通常 与生理性血管生成的抑制相关;因此,它们无毒性和内皮特异性。此外, METH1和METH2具有限制性表达模式,可能在器官特异性方面有优势。
因此,本发明多肽可用于治疗癌症。本发明的METH1和METH2多肽还 可用于治疗患与血管生成相关之其他疾病的个体,包括异常伤口愈合、 炎症、类风湿性关节炎、牛皮藓、子宫内膜出血紊乱、糖尿病性视网膜 病、一些形式的黄斑变性、血管瘤和动脉-静脉畸形。
因而,本发明提供了抑制个体内血管生成的方法,包括将含有效剂量 的本发明分离METH1多肽的药物组合物施用于该个体,有效地提高其体 内的METH1活性水平。本发明还提供了抑制个体内血管生成的方法,包 括将含有效剂量的本发明分离METH2多肽的药物组合物施用于该个体, 有效地提高其体内的METH2活性水平。
可以此方式用于抑制血管生成的METH1多肽包括:由含前导序列之保 藏cDNA编码的METH1多肽;由不含前导序列之保藏cDNA编码的成熟 METH1多肽(即,成熟蛋白质);含SEQ ID NO:2中约第1-950位氨基酸 的多肽;含SEQ ID NO:2中约第2-950位氨基酸的多肽;含SEQ ID NO:2 中约第29-950位氨基酸的多肽;含SEQ ID NO:2中约第30-950位氨基 酸的多肽;含METH1金属蛋白酶结构域,SEQ ID NO:2中第235-459位氨 基酸的多肽;含METH1去整联蛋白结构域,SEQ ID NO:2中第460-544 位氨基酸的多肽;含METH1第一类TSP结构域,SEQ ID NO:2中第545-598 位氨基酸的多肽;含METH1第二类TSP结构域,SEQ ID NO:2中第841-894 位氨基酸的多肽;含METH1第三类TSP结构域,SEQ ID NO:2中第895-934 位氨基酸的多肽;含SEQ ID NO:2中第536-613位氨基酸的多肽;含SEQ ID NO:2中约第549-563位氨基酸的多肽。
可以此方式用于抑制血管生成的METH2多肽包括:由含前导序列之保 藏cDNA编码的METH2多肽;由不合前导序列之保藏cDNA编码的成熟 METH2多肽(即,成熟蛋白质);含SEQ ID NO:4中约第1-890位氨基酸 的多肽;含SEQ ID NO:4中约第2-890位氨基酸的多肽;含SEQ ID NO:4 中约第24-890位氨基酸的多肽;含SEQ ID NO:4中约第112-890位氨基 酸的多肽;含METH2金属蛋白酶结构域,SEQ ID NO:4中第214-439位氨 基酸的多肽;含METH2去整联蛋白结构域,SEQ ID NO:4中第440-529 位氨基酸的多肽;含METH2第一类TSP结构域,SEQ ID NO:4中第530-583 位氨基酸的多肽;含METH2第二类TSP结构域,SEQ ID NO:4中第837-890 位氨基酸的多肽;含SEQ ID NO:4中第280-606位氨基酸的多肽;含SEQ ID NO:4中约第529-548位氨基酸的多肽。
尽管如上所提及,治疗剂量应根据治疗情况而定,但通常建议的非胃 肠施用METH1或METH2多肽的每剂总药学有效量是约1ug/kg病人体重/ 天-10mg/kg病人体重/天。更优选剂量为至少0.01mg/kg/天,对于人来 说最优选约为0.01-1mg/kg/天。如果持续给药,一般METH1或METH2多 肽给药速率是约1ug/kg/小时-50ug/kg/小时,由注射1-4次/天或持续皮 下输注,如用微型泵进行。也可使用静脉袋溶液。
含本发明METH1或METH2的药物组合物可口服、直肠给药、非肠道给 药、脑池内给药、阴道内给药、腹膜内给药、局部给药(如用粉剂、药 膏、滴剂或经皮片剂)、经颊给药或作为口或鼻喷雾剂给药。“药学可接 受载体”指无毒的固体、半固体或液体填充物、稀释液、胶囊材料或任 何类型的辅助配方。本文所用术语“非肠道的”表示的给药方式包括静 脉内、肌肉内、腹膜内、胸骨内、皮下和关节内注射和输注。
染色体试验
本发明的核酸分子还可用于染色体鉴别。该序列特异地定向到单个人 染色体上的特殊位置并与其杂交。按本发明绘图DNA至染色体上是将那 些序列与疾病相关基因联系起来的重要的第一步。
在此方面的某些优选实施方案中,此处公开的cDNA用于克隆METH1 或METH2蛋白质基因的基因组DNA。这可通过各种众所周知的技术和一般 可购得的文库来完成。然后用此方面众所周知的技术将基因组DNA进行 原位染色体作图。
另外,在某些例子中可通过从cDNA制备PCR引物(优选15-25bp)而 将序列作图于染色体上。利用基因3’非翻译区的计算器分析以迅速选择 跨度不超过基因组DNA中一个以上外显子的引物,因而使扩增过程复杂 化。然后将这些引物用于含单个人染色体之体细胞杂合体的PCR筛选。
cDNA克隆与中期染色体的荧光原位杂交(“FISH”)可一步提供其准 确的染色体定位。此技术可利用来自cDNA的短至50或60bp的探针。此 技术综述于Verma等,人染色体:基础技术手册(Human Chromosomes:A Manual Of Basic Techniques),Pergamon Press,纽约。
一旦序列已做图于准确的染色体位置,就可将该序列在染色体上的物 理位置与遗传图谱数据相联系。例如,在V.McKusick,人类孟德尔遗传 (Mendelian Ingeritance In Man)(可在线获自Johns Hopkins University,Welch Medical Library)中即有所说的数据。然后已作图 于同一染色体区域之基因和疾病的联系通过连锁分析鉴定(物理图谱上 相邻基因的共遗传)。
下一步,必须测定在受影响和未受影响个体之间cDNA或基因组序列 的差异。若在某些或所有受影响个体中可观察到突变但在任何正常个体 中都观察不到,那么此突变很可能是该疾病的一个病因。
除了已总述的之外,参照举例说明的以下实施例将更易理解本发明, 但本发明并不局限于这些实施例。
                         实施例
实施例1:METH1和METH2的鉴定和克隆
为了寻找具类TSP结构域的新基因,在约90000个表达序列标签(EST) 组成的人cDNA大数据库中筛选与第二种TSP1I类重复区同源的序列。预 计数种EST编码具类TSP结构域的蛋白质。两个来自人心脏和肺文库的 cDNA克隆被进一步测序并选作功能分析。
按制造商说明书用cDNA末端的5’快速扩增(RACE)PCR技术获得METH1 的氨基末端(Marathon cDNA扩增试剂盒,Clontech)。通过5’RACE PCR 获得METH2的部分氨基端末端并随后证实和用基因组筛选完成。为进行 基因组筛选,最初用PCR鉴定BAC克隆(Genome Systems)。然后将含 150-200bp的阳性BAC克隆作为小片段亚克隆入pGEM载体并测序。
将推断的氨基酸序列与GenBank、EMBL和Swissprot数据库一起分析 和比较,显示这些基因属于一新的金属蛋白酶家族,在其NH2-末端与 reprolysin家族具同源性,而COOH-末端有数个类TSP基元。这些cDNA 称为METH1和METH2;ME指金属蛋白酶,而TH指血小板反应蛋白。METH1 的小鼠同系物被鉴定和称为ADAMTS1(Kuno,K等,生物化学杂志 272:556-562(1997))。人和小鼠序列的直接比较显示有高水平的保守 (83.4%的氨基酸相同)。迄今为止未鉴定到METH2的同系物。
有趣的是,一最近鉴定称为pNPI的蛋白质(前胶原IN-蛋白酶; (Colidge,A.等,美国国家科学院院报94:2374-2379(1997))显示出与 METH1和METH2有显著的序列和结构类似性(图3)。作为在此描述的新 蛋白质,pNPI在羧基末端还包括金属蛋白酶(reprolysin亚家族)和TSP 结构域。尽管pNPI的序列是牛源的,序列对比还是显示了相同的结构特 性。METH1和METH2之间的氨基酸相似性为51.7%,而METH1或METH2和 pNPI之间的同源性分别少于33.9%和36.3%。
序列分析显示METH1和METH2的ORF分别编码950和890个氨基酸的 蛋白质。在所有的三种蛋白质中,NH2末端均包括一推定的信号肽,其后 是位于氨基酸300左右的另一推断的跨膜结构域,这是由亲水性图推断 的。还不清楚这些蛋白质是否与膜结合。可是,根据初步的数据,更可 能是此第二跨膜结构域将组成疏水性口袋,而METH1、METH2和pNPI事 实上是分泌蛋白质。跨信号肽的NH2末端与锌蛋白酶超家族具同源性, 可再细分为前结构域、金属蛋白酶结构域和富半胱氨酸区域。
图3中位于前结构域和金属蛋白酶结构域间边界线处的METH1和 METH2内双下划线序列是诸如成对碱性氨基酸蛋白酶之类哺乳动物枯草 杆菌蛋白酶的可能切割位点(Barr,1991)。蛋白水解加工过程发生于SVMP 内,产生可溶性金属蛋白酶和去整联蛋白(Bjarnason,J.B.和Fox,J.W., 酶学方法248:345-368(1995)),这还在一些ADAM内检测到(综述于 Wolsberg,T.G.和White,J.M.,发育生物学180:389-401(1996))。在这 点上,最初的实验显示蛋白水解加工至少发生于METH1内。此外,METH1 和METH2均存在由于某些功能重要氨基酸的保守而被认为具催化活性的Zn2+结合位点(图3中的点线)(Rawlings,N.D.和Barrett,A.J.,酶学方 法248:183-228(1995)),表明这些蛋白质可能是活性蛋白酶。金属蛋白 酶结构域之后是一含两个公认去整联蛋白环的富半胱氨酸区域 (Wolsberg,T.G.和White,J.M.,发育生物学180:389-401(1996))(图3 中用箭头标出)。在金属蛋白酶超家族中的蛇毒金属蛋白酶(SVMP)和ADAM (含一去整联蛋白和一金属蛋白酶结构域的哺乳动物蛋白质)内找到了 去整联蛋白结构域,它们可能具有抑制整联蛋白与SVMP内其配基结合的 功能。相反,作为膜锚定蛋白一部分的类ADAM去整联蛋白结构域可促进 而非破坏细胞与细胞间的相互作用(Wolsberg,T.G.和White,J.M.,发育 生物学180:389-401(1996))。类TSP结构域位于METH1和METH2蛋白质 的COOH半侧。METH1包括由未知功能的间隔区分隔的两个保守TSP结构 域、具较小同源性的亚结构域及只5个半胱氨酸,位于第二个抗血管生 成区域之后。METH2包括由间隔区分隔的两个TSP结构域。METH1和METH2 的类TSP结构域与TSP1和TSP2的序列对比如图5所示。在所有TSP重 复区中,同源性变化在19.2%-52%氨基酸相似性范围内。1-6号半胱氨酸 和星号标记的色氨酸高度保守。
人基因组DNA的DNA印迹表明基因组中存在METH1和METH2。METH1 和METH2探针显示不同大小的条带,表明它们转录自不同基因。
I类重复片段的共有序列包括有6个完全保守半胱氨酸的16个残基。 通常它开始于序列基元WSXWS(SEQ ID NO:82)),已表明它可与肝素结合 (Guo,N.等,生物化学杂志267:19349-19355(1992))。此区域与肝素的 亲和性推测是TSP-1抗血管生成活性的一部分(Guo,N.等,肽研究杂志 (J.Peptide Res.)49(1997))。在TSP家族蛋白质的5个成员中,只有 TSP-1和TSP-2可抑制血管生成并含I类重复片段(Tolsma,S.S.等,细 胞生物学杂志122:497-511(1993);Kyriakides,T.R.等,细胞生物学杂 志140:419-430(1998))。这很可能是在500-900年前通过外显子改组而 将I类或备解素重复片段加入到了TSP-1和2的前体中(Adams,J.等, 血小板反应蛋白基因家族(The Thrombospondin Gene Family),第一 版,Molecular Biology Intelligence Unit(Springer,Ed.),R.G.Landes Company,德国(1995))。很可能此结构域的获得使TSP-1和TSP-2前体具 有如调节新血管形成之类的功能。最近,BAI-1(脑血管生成抑制剂-1), 由于其被p53调控的能力而分离自脑文库的一种蛋白质,也已显示含 TSP-1的I类重复,为此分子提供了抗血管生成的潜能(Nishimori,H. 等,致癌基因(Oncogene)15:2145-2150(1997))。不过,似乎附加序列或 前后序列也是重要的,因为其他含I类重复片段的蛋白质未显示有清楚 或更确定的抗血管生成特性,如:备解素、F-spondin和补体家族的其他 成员。
由于METH1和METH2中TSP重复片段的存在及其抗血管生成特性,这 些蛋白质最初被认为是TSP超家族成员。不过,它们与其他TSP无另外 的同源性,事实上,它们与TSP-1和TSP-2的相似性局限于I类重复区。 而且,该蛋白质还与ADAM家族成员具很高的序列和结构同源性。这些特 性使Kuno和同事将ADAMTS称为MWTH1的小鼠同系物(Kuno,K.等,生物 化学杂志272:556-562(1997))。pNPI的最新鉴定及其与此处所述蛋白质 的显著序列同源性提示所有这3种蛋白质属于一称为metallospondins 的亚家族。在这点上,尚不清楚pNPI是否具抗血管生成特性或者METH1 和/或METH2是否参与α1(I)前胶原氨基末端前肽的切割。
实施例2:DNA和RNA印迹分析
如前所述(Chomczynski,P.和Sacchi,N.,生化分析 162:156-159(1987)),用异硫氰酸胍抽提法从细胞中纯化总RNA。用 Boehringer Mannheim(BMB,Indianapolis,IN)试剂盒按制造商说明书提 取Poly(A)+RNA。其他Poly(A)+RNA印迹购自Clontech(Palo Alto,CA)。 在含以下成分的溶液中进行预杂交:50%甲酰胺、6X SSPE、1X Denhardt’s 溶液、0.1%SDS和100ug/ml热变性鲑精DNA,42℃12-18小时。利用标记 cDNA探针的杂交反应在相同溶液中于42℃进行12-18小时。TSP1和 METH1探针相应于全长人cDNA。METH2探针相应于人cDNA的KpnI-EcoRI 片段。甘油醛-3-磷酸脱氢酶(GPDH)的1.3Kb长PstI片段用于对上样 和转移效率进行标准化。膜曝光于Kodak BiomaxMS胶片(Kodak,New Haven,CT)上。
购自Promega(Madison,WI)、用于DNA杂交的人基因组DNA在65℃加 热10分钟并用EcoRI和PstI 37℃消化过夜。5ug消化DNA分离于1%琼 脂糖凝胶上,转移至nytran膜上并用紫外线交联。cDNA探针以及预杂 交和杂交条件与上述RNA印迹的相同。用高严谨性洗涤印迹膜(0.2XSSC、 0.2%SDS,50℃)。
在成人和胚胎组织中检查METH1和METH2的表达模式。对包括人组织  Poly(A)+RNA的RNA印迹分析在高严谨条件下进行。METH1和METH2的转 录物分别显示4.6和3.7Kb的单条带。在肾上腺、心脏、胎盘观察到丰 富的METH1 mRNA表达,骨胳肌、甲状腺和胃中表达水平稍低一些。在胚 胎组织分析中,肾显出METH1 mRNA表达量最高。不过,在所有被分析组 织中均有较弱的METH1 mRNA表达。METH2 mRNA的分布更窄,并较METH1 的弱。胚胎和成人均在肺中可见最高表达。有趣的是,METH1和METH2 的表达不重叠。结合起来说,结构相似性和它们的表达模式显示它们在 功能上有重复,但转录调节不同。为进行比较,还分析了同一印迹中TSP1 转录物的表达水平。在被分析的成人胎盘和所有胚胎组织中可见TSP1 mRNA的最高表达。与METH1和METH2相对照,我们在所有被检测的其他 组织中观察到恒定水平的TSP1转录物。
通过Poly(A)+RNA的RNA印迹分析还研究了细胞类型分布情况。在皮 肤成纤维细胞、血管平滑肌、子宫内膜基质细胞和两个癌细胞系Hela和 G631、腺癌和黑素瘤中可分别检测到低水平的METH1 mRNA。METH2 mRNA 只在SW480,一种结肠癌细胞系中检测到,在被分析的任何其他细胞系和 原株中均未见表达。
血管生成和抗血管生成因子组可能涉及调节特异器官中血管网形成, 很可能是真实的,但未经证实。至少总体水平上,明显不同且几乎不重 叠的METH1和METH2表达模式是令人迷惑的。TSP1和TSP2还共有相同的 结构、高水平的氨基酸相似性,而它们的表达模式却显著不同 (Iruela-Arispe,M.L.,Dev.Dyn.197:40-56(1993))。如前所提及,差异 很可能是基于它们启动子中的不同顺式作用元件和不同的调节机制。尽 管METH1和2的启动子尚未被鉴定,但很可能它们对每个基因的调节都 有独特的特征。不过,具已被证实的抗血管生成特性的一个基元抗血管 生成/I类重复区可能存在于具不同组织特异性的数种蛋白质中这一推测 颇引人注意。或者,同一家族之紧密相关成员间序列中的小差异可能具 有功能重复之外的重要性。以TSP1和TSP2为例,除了显著的功能相似 性和可能具有共同的抗血管生成特性外,TSP1和TSP2还具有自身独特 的、不太可能与其类似相关物共有的功能。这些基因的敲除结果明显证 实了这一点。TSP1无效动物首先出现肺疾病(Lawler,J.等,临床研究杂 志(J.Clin.Invest.)101:982-992(1998)),其次是血管畸形,但只在特 异病理状态下或有限器官中如此。相反,TSP2敲除小鼠呈现未预期的胶 原装配异常,伴随着对皮肤、腱和骨的不良影响(Kyriakides,T.R.等, 细胞生物学杂志140:419-430(1998))。此外,这些动物还呈现皮肤中毛 细管密度全面增加。不太能理解的是新描述的metallospondin家族成员 的类同处怎样在功能上体现出来。明显地,pNIP显示有切割I类前胶原 蛋白的活性,因而具有蛋白水解活性(Colidge,A.等,美国国家科学院 院报94:2374-2379(1997))。
第二个目的功能区与去整联蛋白结构域相应。此结构域已在显示可与 αIIbβ3结合并抑制其与血小板相互作用而阻止凝血的蛇毒金属蛋白酶 相关成员中有更完整的描述(Pfaff,M.等,Cell Adhes Commun.2:491-501(1994);Usami,Y.等,Biochem.Biophys.Res.Commun. 201:331-339(1994))。去整联蛋白基元由13-15个结构域组成,其中经 常包括一RGD或在天冬氨酸处有带负电残基。RGD或其等价物与整联蛋白 结合并充当拮抗物或信号配基(Wolsberg,T.G.和White,J.M.,发育生物 学180:389-401(1996))。METH2,而非METH1,具有位于去整联蛋白氨基 端侧的RGD序列。另外,两种分子均在去整联蛋白基元内有相对高度但 非完全的半胱氨酸保守。这似乎在此区域的四级结构及其与整联蛋白的 相互作用能力上有重要作用。此外,其中一些结构域已显示出可作为功 能性粘附分子,尤其是那些具跨膜区域的分子(Wolsberg,T.G.和 White,J.M.,发育生物学180:389-401(1996))。这对于METH1和METH2 是不可能的,因为这两种蛋白质似乎是分泌型的。
实施例3:重组蛋白质的表达和纯化
用于截短融合蛋白表达的重组构建体如下:(1)pRSET-METH1-I类: 用以下引物通过聚合酶链式反应扩增METH1的第1605-1839位核苷酸(距 离起始密码子):5’-GCATTTTGGATCCGCCTTTTCATG-3’(SEQ ID NO:78)和 5’-GTTGTGTGCTGCAGATTGTTCC-3’(SEQ ID NO:79)。将扩增片段亚克隆入 pRSET载体的BamHI和PstI位点;(2)pGEX-METH1-TSP,通过平头连接 将来自pRSET-METH1-TSP的BamHI-EcoRI片段连入pGEX-5X载体 (Pharmacia Biotech Inc.,Piscataway,NJ)的SmaI位点而产 生;(3)pGEX-1.0-METH2:将METH2 cDNA的第838-1818位核苷酸片段(从 起始密码子开始)连入pGEM-2TK的BamHI-EcoRI位点。用以下引物通过 PCR扩增METH2片段:5’-GAAAAATGGGGATCCGAGGTG-3’(SEQ ID NO:80)和 5’-GCAGGAGAATTCCGTCCATG-3’(SEQ ID NO:81)产生BamHI和EcoRI限制位 点;(4)pGEX-METH2-TSP:将分离自pGEX-1.0-METH2的0.5Kb XmaI-EcoRI 片段亚克隆入pGEM-2TK载体的XmaI和EcoRI位点。所有构建体均测序 证实其序列无误并有正确的开放阅读框架。
重组蛋白质命名为6H-METH1(质粒pRSET-METH1-TSP表达)、GST-METH1 (质粒pGEX-METH1-TSP表达)和GST-METH2(质粒pRSET-METH2-TSP表 达)。
将表达质粒转化入大肠杆菌菌株BL21:DE3(Stratagene Cloning Systems,La Jolla,CA)并按制造商推荐方法诱导融合蛋白。简单地说, 就是将被诱导菌体重悬于PBS中并在冰里超声处理1分钟。然后将悬浮 液在1%triton X-100中室温保温20分钟,4℃离心。再用Ni-NTA珠 (Qiagen,Chatsworth,CA)通过4℃保温20ml上清和1ml珠子(50%的浆液) 2小时而纯化组氨酸标记的融合蛋白。将悬浮液转入柱子并用10个柱床 体积含10mM咪唑的PBS洗涤,随后用含50mM咪唑的PBS洗涤,最后用 含100mM咪唑的PBS洗涤。用含500mM咪唑的PBS洗脱蛋白质。含重组 蛋白质的部分用无酚红DMEM透析。样品4℃离心30分钟,部分蛋白质不 溶而在离心中丢失。上清保存于-70℃并用作增殖试验、角膜囊试验和 尿囊绒膜(CAM)试验。
为了纯化GST融合蛋白质,离心清理提取物并上GST亲和柱 (Pharmacia)。先用含0.1mM还原型谷胱甘肽的PBS-1%triton X-100洗 涤柱子,然后用含0.5mM还原型谷胱甘肽的同一缓冲液洗涤。用含10mM 还原型谷胱甘肽的50mM Tris-HCl,pH7.5洗脱融合蛋白质。含此蛋白质 的部分用DMEM透析,-70℃保存并用作增殖、角膜囊和尿囊绒膜(CAM) 试验。
在12.5%或15%的聚丙烯酰胺凝胶上用考马斯兰染色分析重组蛋白质 的完整性和纯度。
含TSP头两个I类重复区的重组GST融合蛋白质在功能试验前也用 DMEM透析。如前所述从血小板中纯化完整TSP1(Roberts,D.D.等,组织 培养方法杂志(J.Tissue Cult.Methods)16:217-222(1994))。
在细菌中产生重组融合蛋白质,以检验METH1和METH2 TSP结构域可 充当血管生成调节剂的假说。构建体包括METH1或METH2的第一个TSP 结构域。此结构域是最保守的,与TSP1的第二个I类重复区具52%的氨 基酸相似性,(此结构域含推测的CD36结合位点)。所有重组蛋白质均在 非变性条件下分离以尽可能地保留其二级结构。6H-METH1和GST-METH1 含METH1第一个类TSP结构域,以及分别与之融合的组氨酸标记或GST。 由于纯化和结构优势,将METH1重组蛋白质制成带两个不同标记。由于 标记大小的不同造成其大小的差异,组氨酸是6KDa,GST是27KDa。 GST-METH2含METH2第一个TSP结构域,以及与之融合的GST。相应于TSP1 最后两个I类重复区并与GST融合的片段,以及纯化自血小板之完整TSP1 为阳性对照。另外,在所有实验中均用GST本身为阴性对照。
实施例4:METH1和METH2中的TSP结构域破坏体内血管生成
角膜囊试验
瑞士Webster雌性和雄性小鼠购自Charles River(Boston,MA)并在 8-10周大时用于团块的移植。如Kenyon和同事所述方法,基本不做改动 进行角膜囊试验(Kenyon,B.M.等,Invest.Ophthalmol.Vis.Sci.37: 1625-1632(1996))。简单地说,即将10ug重组bFGF加5mg sucralfate 的溶液与10ul海昌(200mg/ml于乙醇中;New Brunswick,NJ)和目的重组 蛋白质(2ug)混合。然后将悬浮液点到无菌尼龙网(孔径大小500um;Tetko Inc.,Briarcliff Manor,NY)上并干燥30分钟。拉出网的纤维形成500um3的团块,-20℃保存。在显微镜下选择同样大小的团块用于实验。
用三溴乙醇麻醉小鼠。在Nikon SMZ-U解剖显微镜下用手术刀切开角 膜。将单个团块植入囊中。团块植入5天后评估角膜的血管生成并拍照。
CAM试验
对胚胎发育12-14天的Leghorn鸡胚(SPAFAS,MA)进行尿囊绒膜试 验。混合Matrigel(750ug/ml)、VEGF(250ng/网)和待测蛋白质或肽,放 于尼龙网(孔径大小250um;Tetko Inc.)上并相继保温于37℃30分钟及 4℃2小时以诱导聚合。对各CAM还准备有阳性(matrigel和VEGF)和阴性 (只有VEGF)对照。将聚合的网置于CAM的第三个外区域上并保温24小时。 将400ul异硫氰酸荧光素葡聚糖(10mg/ml,SIGMA)注入小鸡血流中以使血 管显现。保温5-10分钟后,用3.7%的甲醛局部固定小鸡5分钟。然后将 网切片并固定在载片上。用计算机辅助图象软件(NIH Imagel.59)分析 荧光密度。
用于此实验的肽由Chiron(Raleigh,NC)合成。序列相应于氨基酸: P-TSP1,430-447;P-METH1,549-563;P-METH2,529-548。
血管生成或抗血管生成反应的评估很大程度上依赖于测定反应的试 验的灵敏度和特异性。为了评估这些片段在体内的抗血管生成活性,使 用两个流行且普遍接受的血管生成试验:角膜囊试验和尿囊绒膜试验。 角膜的可见性、易接近性和无血管性非常有利并便于观察新血管生成反 应及检验物质的局部应用。将已知量的血管生成因子以团块的形式植入 眼角膜内制成的囊中。为了检测血管生成抑制剂,将分子与同一团块中 的刺激物一起移植,与只有刺激物的反应比较。
在这些实验中,将bFGF用作血管形成刺激物。含重组蛋白质的团块 移植入小鼠角膜并将其抑制bFGF诱导的血管生成反应的能力与对照相 比。当含GST的bFGF团块被植入后,新的毛细管在5天内自角膜缘产生、 穿过角膜并进入团块。相反,添加GST-METH1或GST-METH2至bFGF团块 则完全阻止了血管生长。表4为所进行的41个试验的结果概述。纯化自 血小板的完整TSP1和GST-TSP1用做阳性对照。所有实验以同一浓度进 行,显示METH1和METH2在抑制血管生成中具有与TSP1相似的潜能。另 外,当使用浓度为标准浓度一半时,观察到弱的,但可见的反应,表明 为剂量依赖效应。
                    表4
 在角膜囊试验中METH1和METH2重组蛋白质的活性
      bFGF团块     形成血管的角膜/总角膜
载体     5/5
TSP1     0/5
GST     11/11
GST-TSP1-T1     1/4
GST-METH1-TSP     0/8
GST-METH2-TSP     0/8
在CAM试验中,通过检测含血管生成性生长因子之基质聚合体中生成 的血管数量分析血管生成反应。为了测定在CAM试验中重组METH1和 METH2蛋白质是否抑制VEGF诱导的新血管形成,将含VEGF和重组蛋白质 的matrigel聚合体移植入CAM。实验的定量分析,每次处理包括三种不 同聚合体的结果如图6A所示。含VEGF和5ug GST-METH1或GST-METH2 的matrigel聚合体引起血管生成超过80%的抑制。用来自TSP1I类重复 区的GST重组蛋白质也发现了相似的潜能。而且,METH1和METH2中TSP 结构域的抗血管生成作用是剂量依赖型的,当使用15ug/ml的蛋白质时, 血管生成完全被抑制(图6C和D)。单独的GST在相同浓度时对VEGF刺 激的血管生成无明显作用。
来自人TSP1第二或第三个I类重复区的合成肽可模拟完整TSP1的抗 血管生成作用(Tolsma,S.S.等,细胞生物学杂志122:497-511(1993))。 事实上,已显示19个残基长的多肽足以阻断大鼠角膜中的体内新血管形 成和抑制bFGF诱导的人工培养内皮细胞转移(Vogel,T.等,细胞生化杂 志(J.Cell.Biochem.)53:74-84(1993);Tolsma,S.S.等,细胞生物学杂 志122:497-511(1993))。为了检验METH1和METH2 TSP结构域是否有 相同特性,合成来自同一区域的肽并用CAM试验评估其抗血管生成活性。 结果显示于图6B。来自METH1和METH2 TSP结构域的肽都与TSP1相似地 阻断VEGF诱导的血管生成。相反,混杂肽无明显作用。 实施例5:增殖实验
分离人内皮细胞(HDEC)并培养于VitrogenTM包被平皿上补充有15% 胎牛血清、25ug/mlcAMP和1ug/ml皮质醇-21-乙酸的EBM(Clonetics,San Diego,CA)中,使用第3-6代细胞。通过在含0.2%BSA的无酚红EBM中将 汇合的单层细胞保温48小时使细胞静止。从新生包皮中酶解分离人皮肤 成纤维细胞。成纤维细胞和平滑肌细胞都维持于补充有10%胎牛血清的 DMEM中。人乳腺上皮细胞(HMEC)购自Clonetics并保持于推荐培养基 (乳腺上皮生长培养基,MEGM)中。
将第3-6代静止人内皮细胞在存在或缺乏重组蛋白质的情况下铺于含 补充有0.2%BSA、0.1%胎牛血清和1ng/ml bFGF之EBM的VitrogenTM包被 24孔板上,并在5%CO2中37℃保温48小时。对于血管平滑肌(VSM)和 成纤维细胞增殖实验,细胞在相同条件下保温,但用DMEM取代EBM。人 乳腺上皮细胞温育于其生长培养基中。在收获前最后4小时加入[3H]-胸 苷(1uCi/ul)脉冲。洗涤细胞并固定于10%TCA中。如前所述用闪烁计数 测定[3H]-胸苷掺入量(Iruela-Arispe,M.L.和Sage,E.H.,细胞生化杂 志(J.Cell.Biochem.)52:414(1993))。
通过Macintosh上用的In-Stat软件(Graph Pad Software)进行统 计分析。假定为正态分布,用单向ANOVA分析数据,然后用T-test Dunnett 检测做组间的比较。或用student-Newman-Kleus检测做组间多重比较。
为了认识METH1和METH2抑制新血管形成的机制,检测纯化重组蛋白 质对内皮细胞增殖的直接作用。将缺血清的内皮细胞植入含bFGF和FCS 的生长培养基中。重组蛋白质(3ug/ml)在铺板时同时加入。与只加GST 时无明显作用相对照,观察到40%(GST-METH1)、45%(6H-GST)或36% (GST-METH2)的抑制。来自TSP1 I类重复区的重组蛋白质具有相似的 抑制作用。(图7A)。而且,METH1或METH2介导的增殖抑制是剂量依赖 型的,如图7E所示。处理后1天即可观察到抑制,这种抑制作用无毒性 且可逆,因为重组蛋白质去除和随后只添加生长因子可导致内皮细胞增 殖的恢复。
用对多种非内皮细胞进行的附加增殖实验评估METH1和METH2的抗增 殖作用对内皮的细胞特异性。在成纤维细胞或平滑肌细胞培养物中未见 明显的增殖抑制。相反,可观察到对这两种细胞类型不显著但可再现的 刺激作用。此结果排除了在重组蛋白质制品中任何可能的非特异细胞生 长抑制剂的存在。不过,在乳腺上皮细胞中,METH1和METH2抑制细胞增 殖的程度与对内皮细胞的相同。有趣的是,TSP1也在体外和转基因模型 中抑制乳腺上皮细胞增殖。
METH1和METH2可充当去整联蛋白的可能性是与其抗血管生成特性相 符的。用抗体完全封闭αVβ3和β1整联蛋白已显示可在发育期间和肿 瘤中抑制新血管形成(Brooks,P.C.等,细胞85:683-693(1996); BrooksP.C.等,细胞92:391-400(1998);Senger,D.R.等,美国国家科学 院院报94:13612-13617(1997))。整联蛋白对增殖和迁移信号的介导都是 必需的(Schwartz,M.A.和Ingber,D.E.,细胞分子生物学 (Mol.Biol.Cell)5:389-393(1994)),因此干扰这些信号对血管生成过程 非常不利。用只含METH1和METH2 I类重复区的重组蛋白质进行血管生 成功能性试验。
关于METH1和METH2血管生成抑制活性的作用机制是未知的。到目前 为止我们有证据表明这些蛋白质是分泌型的且可与内皮细胞结合。进一 步的研究涉及受体鉴定和信号转导机制。从对TSP1的了解中得到的可能 假设是METH1和METH2都与CD36结合。最近发现此清除剂受体与TSP-1 发挥其抗血管生成作用的信号介导有关(Dawson,D.W.等,细胞生物学杂 志138:707-717(1997))。推测CSVTCG(SEQ ID NO:83)(Asch,A.S.等, 自然262:1436-1439(1993);Catimel,B.等,生化杂志 284:231-236(1992))和GCQXR(SEQ ID NO:84)序列为CD36的主要结合基 元(Dawson,D.W.等,细胞生物学杂志138:707-717(1997))。METH1和 METH2在这些区域都几乎完全保守。互补且也可能发生的是METH1和 METH2与bFGF的结合。推测与肝素和bFGF的结合为TSP1抗血管生成活 性的一部分(Guo,N,等,肽研究杂志49(1997))。似乎此特性通过 WSXWS(SEQ ID NO:82)基元介导,该基元在METH1和METH2中也保守。未 来的努力将集中于由这些新蛋白质介导的抗血管生成特性所涉及的信号 和它们作为胞外环境蛋白酶的潜能。 实施例6:从保藏样品中分离METH1或METH2 cDNA克隆
两种方法可用于自保藏样品中分离METH1或METH2。第一种,用本领 域技术熟练人员已知的技术将保藏克隆转化入合适宿主(如XL-1 Blue(Stratagene)),如载体供应者提供或在相关出版物或专利中的技 术。将转化子以约150个转化子(菌落)/平板的密度接种于1.5%琼脂板 上(含恰当的选择物,如氨苄青霉素)。然后通过本领域技术熟练人员众 所周知的技术用单菌落制备DNA。(如Sambrook等,分子克隆:实验室手 册,第二版,(1989),冷泉港实验室出版社。)
或者,合成两个来自SEQ ID NO:1或SEQ ID NO:3两末端(即,在克 隆的5’NT和3’NT之间的SEQ ID NO:1或SEQ ID NO:3区域内)的17-20 个核苷酸长引物,并以保藏cDNA质粒为模板用于扩增METH1或METH2 cDNA。在常规条件下进行聚合酶链式反应,例如,在含0.5ug上述cDNA 模板的25ul反应混合物中进行。一种方便的反应混合物是1.5-5mMMgCl2、0.01%(W/V)明胶、dATP、dCTP、dGTP、dTTP各20uM、引物各25pmol 和0.25个单位Taq聚合酶。用Perkin-Elmer Cetus自动热循环仪进行 35个PCR循环(94℃变性1分钟;55℃退火1分钟;72℃延伸1分钟)。 用琼脂糖凝胶电泳分析扩增产物并将具预期分子量的DNA带切出并纯化。 通过DNA产物的亚克隆和测序证实PCR产物是所选序列。
可有多种方法用于鉴定可能不存在于保藏克隆中的METH1或METH2基 因5’或3’非编码部分。这些方法包括但不局限于,滤膜检测、利用特异 探针的克隆富集和与本领域众所周知的5’和3’“RACE”流程相似或相同 的方案。例如,有类似于5’RACE的方法可用于产生预期全长转录物丢失 的5’端。(Fromont-Racine等,核酸研究21(7):1683-1684(1993)。)
简单地说,将特异RNA寡核苷酸与推测含全长基因RNA转录物的RNA 群的5’端连接。利用含特异于所连接的RNA寡核苷酸的引物和特异于 METH1或METH2目的基因之已知序列的引物的引物对,PCR扩增METH1或 METH2全长基因的5’部分。然后将此扩增产物测序并用于产生全长基因。
尽管可用poly-A+RNA,此上述方法以分离自预期来源的总RNA开始。 如果必需的话,可用磷酸酶处理RNA制品,以消除可能会干扰后来RNA 连接酶步骤的降解或受损RNA之5’磷酸基。随后应使磷酸酶失活并用烟 草酸焦磷酸酶处理RNA以去除信使RNA5’端的帽子结构。此反应在去帽RNA 的5’端留下一5’磷酸基,该RNA然后可用T4 RNA连接酶与RNA寡核苷酸 连接。
此被修饰RNA制品用做通过基因特异性寡核苷酸合成第一条链cDNA 的模板。第一链合成产物用做PCR扩增预期5’端的模板,所用的一引物 特异于连接的RNA寡核苷酸而另一引物特异于目的基因的已知序列。然 后将产生的产物测序并分析,以证实5’端序列属于METH1或METH2基因。 实施例7:METH1或METH2的细菌表达
用如实施例5中所列的相应于DNA序列5’和3’端的PCR寡核苷酸引 物,扩增编码本发明METH1或METH2多肽的METH1或METH2多核苷酸, 以合成插入片段。为了将扩增产物克隆入表达载体,用于扩增cDNA插入 片段的引物应优选在引物5’端包含限制位点,如BamHI和XbaI。例如, BamHI和XbaI相应于细菌表达载体pQE-9上的限制酶位点。 (Qiagen,Inc.,Chatsworth,CA)。此质粒载体编码抗生素抗性(Ampr)、细 菌复制起点(ori)、IPTG可调节的启动子/操纵基因(P/O)、核糖体结合 位点(RBS)、6-组氨酸标记(6-His)和限制酶克隆位点。用BamHI和XbaI 消化pQE-9载体,并将扩增片段连接入pQE-9载体,保持起始于细菌RBS 的阅读框架。然后连接混合物用于转化含多拷贝质粒pREP4的大肠杆菌 菌株M15/rep4(Qiagen,Inc.),该质粒表达lacI阻遏蛋白并还赋予卡那 霉素抗性(Karr)。通过它们在LB平板上生长的能力鉴定转化子并选择氨 苄青霉素/卡那霉素抗性菌落。分离质粒DNA并用限制酶分析证实。
含预期构建体的克隆在补充有Amp(100ug/ml)和Kan(25ug/ml)的LB 液体培养基中培养过夜(O/N)。以1∶100-1∶250的比率接种O/N培养 物于大培养基中。细胞生长至光密度600(O.D.600)为0.4-0.6之间。然后 加入终浓度1mM的IPTG(异丙基-B-D-硫代吡喃半乳糖苷)。IPTG诱导通 过使lacI阻遏蛋白失活、清理P/O而导致增加基因表达。
细胞再生长3-4小时,然后离心收获(6000Xg,20分钟)。细胞沉淀 通过4℃搅拌3-4小时而溶于6M盐酸胍离液剂中。离心去除细胞碎片, 含多肽的上清加入镍-氨三乙酸(“Ni-NTA”)亲和树脂柱(获自 QIAGEN,Inc.,见上文)。带6xHis标记的蛋白质与Ni-NTA树脂以高亲和 性结合,并可用简单的一步法纯化(详见:QIAexpressionist(1995) QIAGEN,Inc.,见上文)。
简单地说,将上清液上6M盐酸胍,pH8的柱子,此柱先用10倍体积 的6M盐酸胍,pH8洗涤,然后用10倍体积的6M盐酸胍,pH6洗涤,最 后多肽用6M盐酸胍,pH5洗脱。
然后将纯化的METH1或METH2蛋白质在磷酸缓冲盐溶液(PBS)或50mM 乙酸钠,pH6缓冲液加200mM NaCl中透析复性。或者,当固定于Ni-NTA 柱上时,METH1或METH2蛋白质可成功地再折叠。推荐条件如下:用在 500mM NaCl、20%甘油、20mM Tris/HCl pH7.4中的6M-1M尿素(其中含 蛋白酶抑制剂)线性梯度复性。复性进行时间应不少于1.5小时。复性 后加入250mM咪唑洗脱蛋白质。最后用PBS或50mM乙酸钠,pH6缓冲液 加200mM NaCl透析除去咪唑。纯化的METH1或METH2蛋白质在4℃保存 或冷冻于-80℃。
除了上述表达载体外,本发明还包括含与METH1或METH2多核苷酸有 效连接之噬菌体操纵基因和启动子元件的表达载体,称pHE4a。(ATCC接 收号209645,保藏于1998年2月25日。)此载体包含:1)作为选择标 记的新霉素磷酸转移酶基因,2)大肠杆菌复制起点,3)T5噬菌体启动 子序列,4)两个lac操纵基因序列,5)SD序列,和6)乳糖操纵子阻 遏蛋白基因(lacIq)。复制起点(oriC)来自 pUC19(LTI,Gaithersburg,MD)。启动子序列和操纵基因序列通过合成制 备。
通过用NdeI和XbaI、BamHI、XhoI或Asp718限制性酶切载体,凝胶 电泳酶切产物并分离较大的片段(填充片段应为约310bp),将DNA插入 pHEa。按实施例5所述PCR流程产生DNA插入片段,所用引物具NdeI(5’ 引物)和XbaI、BamHI、XhoI或Asp718(3’引物)的限制性切点。凝胶 纯化PCR插入片段并用一致的酶酶切。按标准方案连接插入片段和载体。
在以上流程中可方便地替换基因工程改造载体以在细菌系统中表达 蛋白质。
实施例8:从包涵体中纯化METH1或METH2多肽
当其以包涵体形式存在时,以下任选方法可用于纯化表达于大肠杆菌 中的METH1或METH2多肽。除非特别说明,所有以下步骤均在4-10℃进 行。
大肠杆菌发酵的生产阶段完成后,细胞培养物冷至4-10℃并在 15000rpm(Heraeus Sepatech)连续离心收获细胞。依据预期蛋白质产量/ 单位细胞团重量和所需的纯化蛋白质量,通过称重,将适当量的细胞团 悬浮于含100mM Tris,50mM EDTA,pH7.4的缓冲液中。用高剪切混合仪分 散细胞成为均一悬浮液。
将溶液以4000-6000psi两次通过显微流化仪(microfluidizer) (Microfuidics,Corp.或APV Gaulin,Inc)而溶解细胞。将匀浆液与终浓 度0.5M的NaCl溶液混合,然后在7000xg离心15分钟。产生的沉淀再 用0.5M NaCl,100mM Tris,50mM EDTA,pH7.4洗涤。
用1.5M盐酸胍(GuHCl)溶解洗涤过的包涵体2-4小时。7000xg离心 15分钟后,弃沉淀并将含多肽的上清4℃放置过夜以便进一步的GuHCl 提取。
高速离心(30000xg)去除不溶颗粒后,通过剧烈搅拌将GuHCl提取液 与20倍体积含50mM钠,pH4.5,150mM NaCl,2mM EDTA的缓冲液快速混 合从而使GuHCl溶解的蛋白质再折叠。重折叠的稀释蛋白质溶液无需混 合,在进一步纯化步骤前4℃放置12小时。
为了澄清再折叠的多肽溶液,使用一事先制备的切向过滤装置,其装 配有具适当表面积的0.16um滤膜器(如Filtron),并用40mM NaAC,pH6.0 平衡过。将过滤样品上阳离子交换树脂(如Poros HS-50,Perseptive Biosystems)。用40mM乙酸钠,pH6.0洗柱,再用同一缓冲液中的250mM、 500mM、1000mM和1500mM NaCl逐步洗脱。连续监测流出物在280nm的吸 光值。收集组分并用SDS-PAGE进一步分析。
然后将含METH1或METH2多肽的部分集中并与4倍体积水混合。稀释 样品先后上预先制备好的一套强阴离子交换树脂(Poros HQ-50,Perseptive Biosystems)和弱阴离子交换树脂(Poros CM-20,Perseptive Biosystems)。用40mM乙酸钠,pH6.0平衡柱子。两 柱子均用40mM乙酸钠,pH6.0,200mM NaCl洗涤。然后用10个柱床体积 的0.2M NaCl,50mM乙酸钠,pH6.0至1.0M NaCl,50mM乙酸钠,pH6.5 的线性梯度液洗脱CM-20柱。在持续监测流出物A280nm的条件下收集组分。 然后集中含该多肽的组分(例如通过16%SDS-PAGE确定)。
经以上重折叠和纯化步骤后,产生的METH1或METH2多肽纯度应高于 95%。当上样量为5ug纯化蛋白质时,在考马斯兰染色的16%SDS-PAGE凝 胶上应观察不到明显的杂带。也可检测纯化METH1或METH2蛋白质中是 否有内毒素/LPS污染,一般按LAL试验,LPS含量少于0.1ng/ml。 实施例9:在杆状病毒表达系统中METH1或METH2的克隆和表达
在此实施例中,质粒穿梭载体pA2用于将METH1或METH2多核苷酸插 入杆状病毒以表达METH1或METH2。此表达载体包含苜蓿银纹夜蛾核型多 角体病毒(AcMNPV)的强多角体蛋白启动子,其后是方便的限制位点, 如BamHI、XbaI和Asp718。猿猴病毒40(“SV40”)的多聚腺苷酸化位点 用于有效的多聚腺苷酸化。为了方便重组病毒的选择,质粒包含来自大 肠杆菌、以同一方向在弱果蝇启动子控制下的β-半乳糖苷酶基因,其后 是多角体蛋白基因的多聚腺苷酸化信号。插入基因两侧均为用于与野生 型病毒DNA进行细胞介导的同源重组的病毒序列,以产生表达克隆METH1 或METH2多核苷酸的活病毒。
正如本领域技术熟练人员应理解的,许多其他杆状病毒载体可替代上 述载体使用,如pAc373、pVL941和pAcIM1,只要该构建体能为转录、翻 译、分泌等等提供恰当的定位信号,包括所要求的信号肽和框架内AUG 即可。这样的载体参阅,如,Luckow等,病毒学(Virology)170: 31-39(1989)。
具体地说,用实施例5所述的PCR流程扩增保藏克隆中所含的METH1 或METH2 cDNA序列,其中包括AUG起始密码子和任何天然相关的前导序 列。如果用天然信号序列生产分泌蛋白质,则pA2载体不需第二个信号 肽。或者,可用标准方法将载体修饰成含杆状病毒前导序列(pA2 GP), 参阅,Summers等,“杆状病毒载体和昆虫细胞培养方法手册(A Manual of Methods for Baculovirus Vectors and Insect Cell Culture Procedures)”德克萨斯农业试验站简报号1555(1987)。
用可购买到的试剂盒(“Geneclean,”BIO 101 Inc.,La Jolla,Ca.)从 1%的琼脂糖凝胶上分离扩增片段。然后用适当的限制酶消化片段并再次 于1%的琼脂糖凝胶上纯化。
通过本领域已知的常规方法,用相应的限制酶消化质粒,且任选地, 可用小牛肠磷酸酶使其去磷酸化。然后用可购买到的试剂盒 (“Geneclean,”BIO 101 Inc.,La Jolla,Ca.)从1%的琼脂糖凝胶上分离 DNA。
用T4 DNA连接酶将片段和去磷酸化质粒连起来。连接混合物转化大 肠杆菌HB101或如XL-1 Blue(Stratagene Cloning Systems,La Jolla,CA) 之类的其它合适大肠杆菌宿主细胞并铺于培养皿上。通过消化来自单菌 落的DNA并凝胶电泳分析消化产物而鉴定含质粒的细菌。DNA测序证实所 克隆片段的序列。
用Felgner等,美国国家科学院院报84:7413-7417(1987)所述的脂转 染法将5ug含多核苷酸的质粒与1.0ug可购得的线性杆状病毒 DNA(“BaculoGolda baculovirus DNA”,Pharmingen,San Diego,CA)共转 染。在含50ul无血清Grace’s培养基(Life Technologies Inc., Gaithersburg,ND)的微量滴定板上无菌孔中混合1ug BaculoGolda病毒 DNA和5ug质粒。之后,加入10ul Lipofectin和90ul Grace’s培养基, 混合并室温保温15分钟。然后将转染混合物滴加到培养于35mm组织培 养皿中1ml无血清Grace’s培养基内的Sf9昆虫细胞(ATCC CRL 1711) 上。平板27℃保温5小时。随后从平板上除去转染溶液并加入补充有10% 胎牛血清的1ml Grace’s昆虫培养基。在27℃继续培养4天。
4天后收集上清并进行空斑测定,如Summers和Smith(同上文)所 述。用有“Blue Gal”(Life Technologies Inc.,Gaithersburg)的琼 脂糖凝胶可方便地鉴定和分离产生兰斑的表达gal克隆。(关于此类型 “空斑测定”的详细描述也可参阅Life Technologies Inc.,Gaithersburg提供的昆虫细胞培养和杆状病毒学用户指南,第9-10 页。)恰当保温后,用微量加液吸头(如Eppendorf)挑出兰斑。将含重 组病毒的琼脂重悬于含200ul Grace’s培养基的微量离心管中,用含重组 杆状病毒的悬浮液感染培养于35mm平板上的Sf9细胞。4天后收获培养 板上清并4℃保存。
为了证实多肽的表达,将Sf9细胞培养于补充有10%热失活FBS的 Grace’s培养基中。用含多核苷酸的重组体杆状病毒以感染复数(“MOI”) 约2感染细胞。若需放射性标记蛋白质,6小时后去除培养基,换入无甲 硫氨酸和半胱氨酸的SF900II培养基(购自Life Technologies Inc.,Rockville,MD)。42小时后,加入5uCi 35S-甲硫氨酸和5uCi 35S- 半胱氨酸(购自Amersham)。细胞再保温16小时后离心收获。用SDS-PAGE 及随后放射自显影(若放射性标记)分析上清中的蛋白质和胞内蛋白质。
纯化蛋白质氨基末端氨基酸序列的微量测序可用于确定所产生的 METH1或METH2蛋白质的氨基末端序列。 实施例10:哺乳动物细胞中METH1或METH2的表达
TMEH1或METH2多肽可表达于哺乳动物细胞中。典型的哺乳动物细胞 表达载体包含介导mRNA转录起始的启动子元件、蛋白质编码序列和转录 终止及转录物多聚腺苷酸化所需的信号。另外的元件包括增强子、Kozak 序列和两侧为RNA剪切供体和受体位点的间插序列。用SV40早晚期启动 子、来自如RSV、HTLVI、HIVI之类逆转录病毒的长末端重复(LTR)和 巨细胞病毒(CMV)的早期启动子可完成高效表达。不过,还可用细胞元 件(如人肌动蛋白启动子)。
本发明应用中合适的表达载体包括,例如,pSVL和 pMSG(Pharmacia,Uppsala,Sweden)、pRSVcat(ATCC 37152)、pSV2DHFR (ATCC 37146)、pBC12MI(ATCC 67109)、pCMVSport2.0和pCMVSport3.0 之类的载体。可用的哺乳动物宿主细胞包括:人Hela、293、H9和Jurkat 细胞,小鼠NIH3T3和C127细胞,Cos1,Cos7和CV1,鹌鹑QC1-3细胞, 小鼠L细胞和中国仓鼠卵巢(CHO)细胞。
或者,METH1或METH2多肽可于含整合入染色体之METH1或METH2多 核苷酸的稳定细胞系中表达。与诸如DHFR、gpt、新霉素、潮霉素之类的 选择标记共转染可鉴定和分离转染细胞。
还可扩增转染的METH1或METH2基因以表达大量编码蛋白质。DHFR(二 氢叶酸还原酶)标记可用于获得带数百或甚至数千拷贝目的基因的细胞 系(见,如,Alt,F.W.等,生物化学杂志253:1357-1370(1978);Hamlin,J.L. 和Ma,C.,生化和生物物理学报(Biochem.Et Biophys.Acta)1097:107-143(1990);Page,M.J.和Sydenham,M.A.,生物 技术(Biotechnology)9:64-68(1991)。)另一有用的选择标记是谷氨酰胺 转移酶(GS)(Murphy等,生化杂志227:277-279(1991);Bebbington 等,Bio/Technology10:169-175(1992))。利用这些标记,培养哺乳动物 细胞于选择性培养基上并选择具最高抗性的细胞。这些细胞系包含整合 入染色体的扩增基因。中国仓鼠卵巢细胞(CHO)和NSO细胞经常用于蛋 白质的生产。
质粒pSV2-DHFR(ATCC接收号37146)、表达载体pC4(ATCC接收号 209649)和pC6(ATCC接收号209647)的衍生物包含劳氏肉瘤病毒的强 启动子(LTR)(Cullen等,分子和细胞生物学,438-447(1985年3月)) 以及CMV-增强子片段(Boshart等,细胞41:521-530(1985))。多克隆位 点,如限制酶BamHI、XbaI和Asp718的切点,可方便METH1或METH2的 克隆。载体还包含3’内含子、大鼠前胰岛素原基因的多聚腺苷酸化和终 止信号及在SV40早期启动子控制下的小鼠DHFR基因。
如果用天然信号序列生产分泌蛋白质,则载体无需第二个信号肽。或 者,如果不用天然信号序列,则载体可被修饰成含异源信号肽以便从细 胞中分泌蛋白质。(见,如,WO96/34891。)
然后用恰当的限制酶消化扩增片段并用购买到的试剂盒 (“Geneclean,”BIO 101 Inc.,La Jolla,Ca.)于1%的琼脂糖凝胶上纯化。 用T4 DNA连接酶连接分离片段和去磷酸化载体。随后转化大肠杆菌HB101 或XL-1Blue细胞,并用如限制酶分析之类的方法鉴定质粒pC6或pC4中 含插入片段的细菌。
缺乏活性DHFR基因的中国仓鼠卵巢细胞用于转染。用脂转染法 (Felgner等,同上文)共转染5ug表达质粒pC6或pC4和0.5ug质粒 pSVneo。质粒pSV2-neo包含一显性选择标记,neo基因来自所编码酶具 抗包括抗G418在内的一组抗生素抗性的Tn5。细胞培养于含1mg/ml G418 的α-MEM中。2天后,用胰蛋白酶消化细胞并在含10、25或50ng/ml氨 甲喋呤和1mg/ml G418的α-MEM中于杂种瘤克隆平板(Greiner,Germany) 上培养。约10-14天后用胰蛋白酶水解单克隆并用不同浓度氨甲喋呤 (50nM、100nM、200nM、400nM、800nM)培养于6孔培养皿或10ml瓶中。 然后将生长于最高浓度氨甲喋呤中的克隆转移至含甚至更高浓度氨甲喋 呤(1uM、2uM、5uM、10mM、20mM)的6孔板上。重复相同步骤直至获得在 100-200uM浓度下生长的克隆。用例如SDS-PAGE和蛋白质印迹或反相 HPLC之类的方法分析METH1或METH2的表达。 实施例11:N-末端和/或C-末端缺失突变体的构建
以下常规方法可用于克隆N-末端或C-末端缺失的METH1或METH2缺 失突变体。通常,约15-25个核苷酸长的两寡核苷酸引物来自SEQ ID NO:1 或SEQ ID NO:3多核苷酸的预期5’和3’位置。以预期METH1或METH2多 核苷酸片段为基础确定引物的5’和3’位置。如果需要,可在5’和3’引物 中分别加入起始和终止密码子以表达此多核苷酸片段编码的METH1或 METH2多肽片段。优选的METH1或METH2多核苷酸片段是编码公开于说明 书中“多核苷酸和多肽片段”部分的N-末端和C-末端缺失突变体的那些 多核苷酸片段。
含限制位点以方便METH1或METH2多核苷酸片段克隆入预期载体的附 加核苷酸也可加入5’和3’引物序列中。用恰当的PCR寡核苷酸引物和本 文所述或本领域已知条件从基因组DNA或保藏cDNA克隆中扩增METH1或 METH2多核苷酸片段。尽管由于特异片段和全长多肽间化学和物理特性的 差异使得可能需要一些常规改动,由本发明METH1或METH2多核苷酸片 段编码的METH1或METH2多肽片段还是可以与全长多肽相同的一般方式 进行表达和纯化。
作为例子但本发明不局限于此,编码METH1多肽片段D-40至S-950 或METH2多肽片段L-20至L-890的多核苷酸扩增和克隆如下:产生5’ 引物,其包含限制酶切点,其后是与分别编码开始于D-40或L-20之多 肽片段N-末端部分的多核苷酸序列读框一致的起始密码子。产生互补3’ 引物,其包含限制酶切点,其后是与分别编码结束于S-950或L-890之 METH1或METH2多肽片段C-末端部分的多核苷酸序列读框一致的终止密 码子。
用识别引物中这些位点的限制酶消化扩增的多核苷酸片段和表达载 体。然后将消化的多核苷酸连在一起。将METH1或METH2多核苷酸片段 插入限制性消化的表达载体中,优选是将METH1或METH2多肽片段编码 区放置在启动子下游。用标准方法如本文实施例所述将连接混合物转化 入感受态大肠杆菌细胞。从抗性菌落中分离质粒DNA并用限制性酶切分 析、PCR和DNA测序证实克隆DNA。 实施例12:METH1或METH2的蛋白质融合
METH1或METH2多肽优选与其他蛋白质融合。这些融合蛋白质可用于 各种用途。例如,METH1或METH2多肽与His标记、HA标记、蛋白A、IgG 结构域和麦芽糖结合蛋白质融合可方便纯化。(见实施例7;也可参阅EP A 394827;Traunecker等,自然331:84-86(1988)。)同样地,与IgG-1、 IgG-3和白蛋白融合可延长它们在体内的半寿期。与METH1或METH2多肽 融合的核定位信号可使蛋白质定向于特异亚细胞位置,而共价杂二聚体 或同型二聚体可提高或降低融合蛋白质的活性。融合蛋白质还可产生具 一种以上功能的嵌合分子。最后,与非融合蛋白质相比,融合的蛋白质 可提高被融合的蛋白质的溶解度和稳定性。所有上述类型融合蛋白质均 可通过对以下概述多肽与IgG分子融合的流程或实施例7中所述的流程 稍作改动而制备。
简单地说,可用跨越下述序列5’和3’端的引物PCR扩增人IgG分子的 Fc部分。这些引物还应有方便的限制性酶切位点便于克隆入表达载体, 优选哺乳动物表达载体。
例如,若使用pC4(接收号209646),可将人Fc部分连接到BamHI克 隆位点。注意3’BamHI位点应被破坏。然后,用BamHI酶切含人Fc部分 的载体,将载体线性化,并将按实施例5中所述PCR方案分离的METH1 或METH2多核苷酸连入此BamHI位点。注意多核苷酸的克隆无终止密码 子,否则不能产生融合蛋白质。
如果用天然信号序列生产分泌蛋白质,pC4无需第二个信号肽。或者, 如果不用天然信号序列,载体可修饰成含异源信号序列。(见,如, WO96/34891)
人IgG Fc区: GGGATCCGGAGCCCAAATCTTCTGACAAAACTCACACATGCCCACC GTGCCCAGCACCTGAATTCGAGGGTGCACCGTCAGTCTTCCTCTTCC CCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACTCCTGAGGT CACATGCGTGGTGGTGGACGTAAGCCACGAAGACCCTGAGGTCAAG TTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAA AGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGT CCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAG TGCAAGGTCTCCAACAAAGCCCTCCCAACCCCCATCGAGAAAACCA TCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCT GCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACC TGCCTGGTCAAAGGCTTCTATCCAAGCGACATCGCCGTGGAGTGGG AGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGT GCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGG ACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGAT GCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTG TCTCCGGGTAAATGAGTGCGACGGCCGCGACTCTAGAGGAT(SEQ ID NO:85) 实施例13:抗体的生产
本发明的抗体可用多种方法制备。(见通用流程第二章)例如,将表 达METH1或METH2的细胞施用于动物以诱发含多克隆抗体的血清的产生。 在优选的方法中,METH1或METH2蛋白质制品被制备和纯化成基本上无天 然污染物。然后将这样的制品引入动物以产生更高比活性的多克隆抗血 清。
在最优选的方法中,本发明抗体是单克隆抗体(或其蛋白质结合片 段)。这样的单克隆抗体可用杂交瘤技术制备。(Kohler等,自然256: 495(1975);Kohler等,欧洲免疫学杂志(Eur.J.Immunol.)6:511(1976); Kohler等,欧洲免疫学杂志6:292(1976);Hammerling等,单克隆抗体 和T-细胞杂交瘤,Elsevier,N.Y.,第563-681页(1981)。)大体上,这样 的方法包括用METH1或METH2多肽,或更优选的用表达分泌METH1或 METH2多肽的细胞免疫动物(优选小鼠)。所说的细胞可培养于任何合适 的组织培养基中;不过,优选培养细胞于含10%胎牛血清(56℃灭活), 并补充有约10g/l非必需氨基酸、约1000U/ml青霉素和约100ug/ml链 霉素的Earle modifide Eagle’s培养基中。
提取所说小鼠的脾细胞并与合适的骨髓瘤细胞系融合。按照本发明可 用任何合适的骨髓瘤细胞系;不过,优选可获自ATCC的亲代骨髓瘤细胞 系(SP20)。融合后,产生的杂交瘤细胞选择性地保持于HAT培养基中, 然后如Wands等(肠胃病学80:225-232(1981))所述用有限稀释法克 隆。检验这样选择获得的杂交瘤细胞以鉴别所分泌抗体能结合METH1或 METH2多肽的克隆。
或者,可用抗独特型抗体经两步产生能结合METH1或METH2多肽的其 它抗体。这样的方法利用了抗体本身即为抗原的事实,因此可能得到能 结合第二抗体的抗体。按照此方法,蛋白质特异性抗体被用于免疫动物, 优选小鼠。用所说动物的脾细胞产生杂交瘤细胞,筛选该杂交瘤细胞以 鉴定能产生其结合METH1或METH2蛋白质特异性抗体的能力可被METH1 或METH2阻断的抗体的克隆。这样的抗体包含抗METH1或METH2蛋白质 特异性抗体的抗独特型抗体,可用于免疫动物以诱发其它METH1或METH2 蛋白质特异性抗体的形成。
应当理解Fab和F(ab’)2和本发明的其它抗体片段可按本文公开方法 利用。这样的片段一般用诸如木瓜蛋白酶(产生Fab片段)或胃蛋白酶 (产生F(ab’)2片段)之类的酶进行蛋白水解切割产生。或者,分泌型 METH1或METH2蛋白质结合片段可通过重组DNA技术的应用或合成化学法 产生。
为了抗体在人体内的利用,优选使用“人源化”嵌合单克隆抗体。这 样的抗体可用来自上述产单克隆抗体之杂交瘤细胞的基因构建体产生。 可用于产生嵌合抗体的方法是本领域已知的。(见,综述,Morrison,科 学229:1202(1985);Oi等,BioTechnique4:214(1986);Cabilly等,美 国专利号4816567;Taniguchi等,EP171496;Morrison等,EP173494; Neuberger等,WO8601533;Robinson等,WO8702671;Boulianne等,自 然312:643(1984);Neuberger等,自然314:268(1985)。)     实施例14:用于高流通量筛选试验的METH1或METH2蛋白质生产
以下流程可产生含待测METH1或METH2多肽的上清。此上清可随后用 于实施例16-23所述之筛选试验中。
首先,在PBS(w/o钙或镁17-516F Biowhittaker)中以1∶20的比例 稀释多聚-D-赖氨酸(644587Boehringer-Mannheim)母液(1mg/ml于PBS 中)至50ug/ml的使用液。每孔(24孔板)中加200ul该溶液并室温放 20分钟。保证每孔中分配有溶液(注意:可用12通道移液器,每通道上 各有吸头)。吸去多聚-D-赖氨酸溶液并用1ml PBS(磷酸缓冲盐水)漂洗。 PBS应保持在孔中直到细胞铺板前,且平板可先被多赖氨酸包被长达两 周。
在5ml DMEM(Dulbecco’s Modifide Eagle Medium)(含4.5G/L葡萄 糖和L-谷氨酰胺(12-604F Biowhittaker))/10%热失活FBS(14-503F Biowhittaker)/1xPenstrep(17-602E Biowhittaker)中以2×105细胞/孔 的密度将293T细胞(没有超过P+20的细胞)铺于板上。使细胞生长过 夜。
第二天,在无菌溶液瓶中混合:300ul Lipofectamine(18324-012 Gibco/BRL)和5ml Optimem I(31985070 Gibco/BRL)/96孔板。用小体积 多通道移液器,将用实施例10-12所述方法产生的含多核苷酸插入片段 的表达载体约2ug置于恰当标记的96孔圆底板中。用多通道移液器在每 孔中加入50ul Lipofectamine/Optimen I混合物。用移液器上下轻吹吸 以混合。室温放15-45分钟。约20分钟后,用多通道移液器在每孔中加 入150ul Optimem I。作为对照,无插入片段的载体DNA的平板应与各套 转染一起进行转染。
优选地,转染应通过标记协同法(tag-teaming)进行以下工作完成。 通过标记协同法,时间减半,细胞不用在PBS中放太长时间。首先,一 人从细胞的4个24孔板中吸出培养基,然后另一人用5-1ml PBS漂洗各 孔。第一人吸出漂洗PBS液,第二人用每隔一通道带吸头的12通道移液 器先在24孔板每行的奇数孔中加入200ul DNA/Lipofectamine/Optimen I复合物,然后加入偶数孔中。37℃保温6小时。
在细胞保温时,制备恰当的培养基,或是在含1xpenstrep的DMEM 中的1%BSA,或是HGS CHO-5培养基(116.6mg/L CaCl2(无水);不 0.00130mg/L CuSO4-5H2O;0.050mg/L Fe(NO3)3-9H2O;0.417mg/LFeSO4-7H2O;311.80mg KCl;28.64mg/L MgCl2;48.84mg/L MgSO4;6995.50 mg/L NaCl;2400.0mg/L NaHCO3;62.50mg/L NaH2PO4-H2O;71.02mg/LNa2HPO4;4320mg/L ZnSO4-7H2O;0.002mg/L花生四烯酸;1.022mg/L胆固 醇;0.070mg/L DL-α-生育酚乙酰酯;0.0520mg/L亚油酸;0.010mg/L 亚麻酸;0.010mg/L肉豆蔻酸;0.010mg/L油酸;0.010mg/L Palmitric Acid;0.010mg/L棕榈酸;100mg/L Pluronic F-68;0.010mg/L硬 脂酸;2.20mg/L吐温80;455lmg/L D-葡萄糖;130.85mg/ml L-丙氨酸; 147.50mg/ml L-精氨酸-HCl;7.50mg/ml L-天冬酰胺-H2O;6.65mg/ml L- 天冬氨酸;29.56mg/ml L-半胱氨酸-2HCl-H2O;31.29mg/ml L-半胱氨酸 -2HCl;7.35mg/ml L-谷氨酸;365.0mg/ml L-谷氨酰胺;18.75mg/ml 甘氨酸;52.48mg/ml L-组氨酸-HCl-H2O;106.97mg/ml L-异亮氨 酸;111.45mg/ml L-亮氨酸;163.75mg/ml L-赖氨酸-HCL;32.34mg/ml L- 甲硫氨酸;68.48mg/ml L-苯丙氨酸;40.0mg/ml L-脯氨酸;26.25mg/ml L-丝氨酸;101.05mg/ml L-苏氨酸;19.22mg/ml L-色氨酸;91.79mg/ml L-酪氨酸-2Na-2H2O;99.65mg/ml L-缬氨酸;0.0035mg/L生物素;3.24 mg/L D-泛酸钙;11.78mg/L胆碱盐酸盐;4.65mg/L叶酸;15.60mg/L I- 肌醇;3.02mg/L烟酰胺;3.00mg/L盐酸吡哆醛;0.031mg/L盐酸吡哆 素;0.319mg/L核黄素;3.17mg/L盐酸硫胺素;0.365mg/L胸苷;0.680 mg/L维生素B12;25mM HEPES缓冲液;2.39mg/L次黄嘌呤钠;0.105mg/L 硫辛酸;0.081mg/L二盐酸腐胺钠;55.0mg/L丙酮酸钠;0.0067mg/L亚 硒酸钠;20uM乙醇胺;0.122mg/L柠檬酸铁;41.70mg/L与亚油酸得合的 甲基-B-环糊精;33.33mg/L与油酸复合的甲基-B-环糊精;10mg/L与乙 酸视黄醛复合的甲基-B-环糊精。用2mm谷氨酰胺和1xpenstrep(BSA (81-068-3 Bayer)100gm溶于1L DMEM中成10%的BSA母液)调整重量摩 尔渗透压浓度为327mOsm.。过滤培养基并收集50ul以在15ml聚苯乙烯 圆锥管中进行内毒素检验。
在保温末期优选用标记协同法终止转染。一人吸去转染培养基,而另 一人往各孔中加入1.5ml恰当的培养液。37℃保温45或72小时,取决 于所用培养液:用1%BSA是45小时,用CHO-5是72小时。
第四天,用300ul多通道移液器将600ul等份试样加入一1ml深孔平 板上,剩下的上清加入2ml深孔平板上。然后将各孔上清用于实施例 16-23所述的检验中。
特别提出的是,在用上清进行的任何下述实验中得到活性时,此活性 或直接来自METH1或METH2多肽(如作为分泌蛋白质)或者是METH1或 METH2诱导其它蛋白质的表达,然后该蛋白质分泌到上清中所致。因此, 本发明进一步提供了鉴别上清中特征在于在特异检验中有活性的蛋白质 的方法。 实施例15:GAS报道基因构建体的构建
在细胞分化和增殖中涉及的一条信号转导途径称为Jaks-STAT途径。 在Jaks-STAT途径中活化蛋白质与位于许多基因启动子内的γ活化位点 “GAS”元件或干扰素敏感应答元件(“ISRE”)结合。蛋白质与这些元件 的结合改变了相关基因的表达。
GAS和ISRE元件由称为信号转导物和转录激活剂或“STAT”的一类转 录因子识别。STAT家族有6个成员。如Stat2(对IFN-α的应答广泛存 在)一样,Stat1和Stat3存在于许多细胞类型中。Stat4的存在更有限 制,尽管在用IL-2处理后的T辅助I类细胞中已有发现,但它在许多细 胞中是没有的。Stat5最初称为乳腺生长因子,但已发现在包括脊髓细胞 在内的其它细胞中其浓度更高。在组织培养细胞中它可被许多细胞因子 活化。
STAT被一套已知为Janus激酶(“Jaks”)家族的激酶通过酪氨酸磷酸 化活化,从细胞质转位至细胞核。Jaks代表了一个独特的可溶性酪氨酸 激酶家族,它包括Tyk2、Jak1、Jak2和Jak3。这些激酶呈现有显著的序 列类似性,且通常在静止细胞中无催化性活性。
Jaks可被概述如下表的多种受体激活。(改编自综述Schidler和 Darnell,生化年鉴(Ann.Rev.Biochem.)64:621-51(1995)。)能激活Jaks 的细胞因子受体家族分成两组:(a)1类包括IL-2、IL-3、IL-4、IL-6、 IL-7、IL-9、IL-11、IL-12、IL-15、Epo、PRL、GH、G-CSF、GM-CSF、 LIF、CNTF和血小板生成素的受体;和(b)2类包括IFN-a、IFN-g和IL-10。 1类受体共有保守的半胱氨酸基元(一套4个半胱氨酸和1个色氨酸)和 WSXWS基元(编码Trp-Ser-Xxx-Trp-Ser(SEQ ID NO:82)的近膜区)。
因此,通过配基与受体的结合,Jaks被活化,从而激活STAT,然后 STAT转位并与GAS元件结合。此完整过程包含在Jaks-STAT信号转导途 径中。
因此,GAS或ISRE元件的结合所反映的Jaks-STAT途径的激活可用 于指示细胞增殖和分化中涉及的蛋白质。例如,已知生长因子和细胞因 子可激活Jaks-STAT途径。(见下表)这样,通过利用与报道分子连接的 GAS元件,可鉴定Jaks-STAT途径的激活剂。
                   JAK STATS GAS(元件)或ISRE
配基 tyk2 Jak1 Jak2 Jak3
IFN家族
IFN-a/B IFN-g I1-10 + + + + ? - + ? - - - 1,2,3 1 1,3 ISRE GAS(IRF1>Lys6>IFP)
gp130家族
IL-6(多效) I1-11(多效) OnM(多效) LIF(多效) CNTF(多效) G-CSF(多效) IL-12(多效) + ? ? ? -/+ ? + + + + + + + - + ? + + + ? + ? ? ? ? ? ? + 1,3 1,3 1,3 1,3 1,3 1,3 1,3 GAS(IRF1>Lys6>IFP)
g-C家族
IL-2(淋巴细胞) IL-4(淋巴/骨髓) IL-7(淋巴细胞) IL-9(淋巴细胞) IL-13(淋巴细胞) IL-15 - - - - - ? + + + + + + - - - - ? ? + + + + ? + 1,3,5 6 5 5 6 5 GAS GAS(IRF1=IFP>>Ly6)(IgH) GAS GAS GAS GAS
gp140家族
IL-3(骨髓) IL-5(骨髓) GM-CSF(骨髓) - - - - - - + + + - - - 5 5 5 GAS(IRF1>IFP>>Ly6) GAS GAS
生长激素家族
GH PRL EPO ? ? ? - +/- - + + + - - - 5 1,3,5 5 GAS(B-CAS>IRF1=IFP>>Ly6)
受体酪氨酸激酶
EGF PDGF CSF-1 ? ? ? + + + + + + - - - 1,3 1,3 1,3 GAS(IRF1) GAS(非IRF1)
为了构建用于实施例16-17所述生物学检验、含启动子元件的合成 GAS,应用以PCR为基础的方法产生GAS-SV40启动子序列。5’引物包含在 IRF1启动子中发现的4个串联拷贝GAS结合位点,先前已证实这些位点 在一些细胞因子诱导下可与STAT结合(Rothman等,免疫力 1:457-468(1994)),尽管如此,其他的GAS或ISRE元件可代替它们使用。 5’引物还包含与SV40早期启动子序列互补的18bp序列,侧翼有XhoI位 点。5’引物序列是: 5′:GCGCCTCGAGATTTCCCCGAAATCTAGATTTCCCCGAAATGATTT CCCCGAAATGATTTCCCCGAAATATCTGCCATCTCAATTAG:3′(SEQ ID NO:86)
下游引物与SV40启动子互补且侧翼有HindIII位点: 5’:GCGGCAAGCTTTTTG CAAAGCCTAGGC:3’(SEQ ID NO:87)。
用获自Clontech的B-gal启动子质粒内的SV40启动子模板进行PCR 扩增。用XhoI/HindIII消化产生的PCR片段并亚克隆入 BLSK2-(Stratagene)。用正向和反向引物测序证实插入片段含以下序列: 5′: CTCGAGATTTCCCCGAAATCTAGATTTCCCCGAAATGATTTCCCC GAAATGATTTCCCCGAAATATCTGCCATCTCAATTAGTCAGCAACCA TAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGT TCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCA GAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAG GAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAA AAGCTT:3′(SEQ ID NO:88)
随后用与SV40启动子连接的GAS启动子元件经基因工程构建GAS: SEAP2报道构建体。在此,报道分子是分泌型碱性磷酸酶或“SEAP”。不 过,明显地,在此或任何其他实施例中可使用任何报道分子替代SEAP。 众所周知可替代SEAP使用的报道分子包括氯霉素乙酰转移酶(CAT)、荧 光素酶、碱性磷酸酶、B-半乳糖苷酶、绿色荧光蛋白(GFP)或可用抗体 检测的任何蛋白质。
用HindIII和XhoI将已经序列确认的合成GAS-SV40启动子元件亚 克隆入获自Clontech的pSEAP启动子载体,以扩增的GAS:SV40启动子 元件有效置换SV40启动子,从而产生GAS-SEAP载体。然而,此载体不 含新霉素抗性基因,因此不优选用于哺乳动物表达系统。
因而,为了产生表达GAS-SEAP报道基因的哺乳动物稳定细胞系,用 SaII和NotI从GAS-SEAP载体中取出GAS-SEAP盒,并用多克隆位点内的 这些限制位点将其插入含新霉素抗性基因的骨架载体,如 pGFP-1(Clontech),从而产生GAS-SEAP/Neo载体。一旦此载体被转染入 哺乳动物细胞,就可随后如实施例16-17所述用作GAS结合的报道分子。
通过使用以上方法并用不同的启动子序列替代GAS可制备其他的构建 体。例如,含NFK-B和EGR启动子序列的报道分子的构建如实施例18和 19所述。不过,用这些实施例中所述流程可取代许多其他启动子。如, 可单独或联合替代SRE、IL-2、NFAT或骨钙蛋白启动子(如 GAS/NF-KB/EGR、GAS/NF-KB、IL-2NFAT或NF-KB/GAS)。同样地,其他细 胞系可用于检测报道基因构建体活性,如HELA(上皮细胞)、HUVEC(内 皮细胞)、Reh(B-细胞)、Saos-2(成骨细胞)、HUVAC(主动脉)或心肌 细胞。 实施例16:T-细胞活性的高流通量筛选试验
利用以下流程,通过测定METH1或METH2上清是否增殖和/或分化T- 细胞而评估METH1或METH2的T-细胞活性。用实施例15产生的 GAS/SEAP/Neo构建体评估T细胞活性。这样,可提高SEAP活性的因子表 明其具有激活Jaks-STAT信号转导途径的能力。尽管Molt-3细胞(ATCC 接收号CRL-1552)和Molt-4细胞(ATCC接收号CRL-1582)也可使用, 用于本试验的T细胞是Jurkat T细胞(ATCC接收号TIB-152)。
Jurkat T细胞是成淋巴细胞CD4+Th1辅助细胞。为了产生稳定的细胞 系,用DMRIE-C(Life Technologies)将GAS-SEAP/Neo载体转染入约两百 万个Jurkat细胞中(转染步骤如下)。转染细胞接种密度约20000个细 胞/孔,选择抗1mg/ml genticin的转染子。扩展抗性菌落,并随后检测 其对逐步提高浓度的γ干扰素的应答。证实所选克隆的剂量应答。
特别是,以下方案将产生足够细胞以用于含200ul细胞的75个孔中。 因此,或者比例增大或成倍增加以产生足够细胞用于若干块96孔板。 Jurkat细胞维持于含1%Pen-Strep的RPMI+10%血清中。在T25摇瓶中合 并2.5ml OPTI-MEM(Life Technologies)和10ug质粒DNA。加入含50ul DMRIE-C的2.5ml OPTI-MEM并室温保温15-45分钟。
在保温期间,计算细胞浓度,离心所要求的细胞数(107/次转染), 并重悬于OPTI-MEM中至终浓度107个细胞/ml。然后将OPTI-MEM中 1ml1×107个细胞加入T25摇瓶中,37℃保温6小时。保温后,加10ml RPMI+15%血清。
Jurkat:GAS-SEAP稳定报道体系维持在RPMI+10%血清、1mg/ml Genticin和1%Pen-Strep中。用含METH1或METH2多肽或者如实施例14 所述方法产生的METH1或METH2诱导的多肽的上清处理这些细胞。
在用该上清处理的当天,这些细胞应漂洗并重悬于新鲜RPMI+10%血清 中至500000个细胞/ml的密度。所要求的确切细胞数将决定于被筛选的 上清量。对于1个96孔板,需要约一千万个细胞(对于10个平板,需 要一亿个细胞)。
为了分配细胞至96孔皿里,用12通道移液器转移细胞至三角贮器中。 用12通道移液器转移200ul细胞至每一孔中(因此为100000个细胞/孔)。
所有平板均已接种后,用12通道移液器直接将50ul上清从含上清的 96孔板转移至各孔中。此外,将不同量外源干扰素γ(0.1、1.0、10ng) 加入孔H9、H10和H11中用做检验的阳性对照。
将含有用上清处理过的Jurkat细胞的96孔皿放于培养箱中48小时 (注意:此时间可在48-72小时间变化)。然后用12通道移液器将各孔 的35ul样品转移至不透明96孔板。此不透明板应覆盖(用sellophene 覆盖层)并保存于-20℃直到按实施例20进行SEAP试验。将含剩余处理 细胞的平板放置于4℃,需要时用做对特异孔重复试验的材料来源。
用100个单位/ml干扰素γ做阳性对照,已知它可激活Jurkat T细胞。 在阳性对照孔中一般可观察到超过30倍的诱导。 实施例17:鉴定脊髓活性的高流通量筛选试验
利用以下流程通过测定METH1或METH2是否增殖和/或分化脊髓细胞 而评估METH1或METH2的脊髓活性。用实施例15产生的GAS/SEAP/Neo 构建体评估脊髓细胞活性。这样,可提高SEAP活性的因子表明其具有激 活Jaks-STAT信号转导途径的能力。尽管TF-1、HL60或KG1也可使用, 用于本试验的脊髓细胞是U937,一种前单核细胞系。
为了用实施例15产生的GAS/SEAP/Neo构建体瞬时转染U937细胞, 使用了DEAE-葡聚糖的方法(Kharbanda等,1994,细胞生长和分化 5:259-265)。首先,收获2×10e7U937细胞并用PBS漂洗。U937细胞通常 培养于含10%热灭活胎牛血清(FBS)、100单位/ml青霉素和100mg/ml 链霉素的RPMI 1640培养液中。
然后,悬浮细胞于含0.5mg/ml DEAE-葡聚糖、8ug GAS-SEAP2质粒 DNA、140mM NaCl、5mM KCl、375uM Na2HPO4·7H2O、1mM MgCl2和675uM CaCl2的1ml 20mM Tris-HCl(pH7.4)缓冲液中。37℃保温45分钟。
用含10%FBS的RPMI 1640培养液漂洗细胞,然后重悬于10ml完全培 养液中并37℃保温36小时。
通过培养细胞于400ug/ml G418中得到GAS-SEAP/U937稳定细胞。除 每1-2个月于含400ug/ml G418的培养液培养数代之外,一般使用无G418 培养基进行常规培养。
收获1×108个细胞(足以用于10个96孔板试验)用于检测并用PBS 漂洗。悬浮细胞于200ml上述生长培养液中,终浓度5×105个细胞/ml。 加200ul细胞/孔于96孔板中(或1×105个细胞/孔)。
加50ul用实施例14所述方法制备的上清。37℃保温48-72小时。用 100个单位/ml干扰素γ做阳性对照,已知它可激活U937细胞。在阳性 对照孔中一般可观察到超过30倍的诱导。按实施例20所述方法用SEAP 检验上清。
实施例18:鉴定神经  活性的高流通量筛选试验
当细胞分化和增殖时,一组基因通过许多不同的信号转导途径被激 活。这些基因之一,EGR1(早期生长应答基因1)在激活作用下在多种组 织和细胞类型中被诱导。EGR1的启动子负责这种诱导。通过连接于报道 分子的EGR1启动子,细胞的激活作用可用METH1或METH2评估。
尤其是,用以下方法评估PC12细胞系中的神经活性。已知PC12细 胞(大鼠嗜铬细胞瘤细胞)通过许多促有丝分裂素的激活作用增殖和/或 分化,如TPA(十四烷酰佛波醇乙酸酯)、NGF(神经生长因子)和EGF(表 皮生长因子)。在此处理过程中EGR1基因表达被激活。从而,通过用含 与SEAP报道基因连接之EGR启动子的构建体稳定转染PC12细胞,可评 估METH1或METH2对PC12细胞的激活作用。
EGR/SEAP报道基因构建体可用以下流程装配。EGR-1启动子序列(-633 至+1)(Sakamoto K等,癌基因6:867-871(1991))可用如下引物PCR 扩增自人基因组DNA:
5′GCGCTCGAGGGATGACAGCGATAGAACCCCGG-3′(SEQ ID NO:89)
5′GCGAAGCTTCGCGACTCCCCGGATCCGCCTC-3′(SEQ ID NO:90)
用实施例15产生的GAS:SEAP/Neo载体,将EGR1扩增产物插入此载 体中。用限制性酶XhoI/HindIII线性化GAS:SEAP/Neo载体,去除 GAS/SV40填充片段。用相同的酶限制性酶切EGR1扩增产物。连接载体和 EGR1启动子。
为了制备细胞培养的96孔板,将2ml包被溶液(I类胶原(Upstate Biotech Inc Cat#08-115)在30%乙醇中的1∶30稀释液(过滤灭菌)) 加入每个10cm平板或96孔板,50ml/孔,空气干燥2小时。
PC12细胞在预先包被的10cm组织培养皿上于含10%马血清(JRH BIOSCIENCES,Cat.#12449-78P)、5%热灭活胎牛血清(FBS)并补充有100 单位/ml青霉素和100ug/ml链霉素的RPMI-1640培养基(Bio Whittaker) 中常规培养。每3-4天按1∶4传代。从平板上刮下细胞并上下吹吸15 次以上将其重悬。
用实施例14所述Lipofectamine法将EGR/SEAP/Neo构建体转染入 PC12。培养细胞于300ug/ml G418中得到EGR-SEAP/PC12稳定细胞。用 无G418培养液进行常规培养,但每1-2个月,细胞应在300ug/ml G418 中再培养多代。
为检验神经活性,去除旧培养液,筛选约70-80%细胞汇合的10cm平 板。用PBS(磷酸缓冲盐水)洗细胞1次。在低血清培养液(含1%马血 清和0.5%FBS并补加抗生素的RPMI-1640)中饥饿培养细胞过夜。
第二天早上,弃培养液并用PBS洗细胞。从平板上刮下细胞,充分悬 浮细胞于2ml低血清培养液中。细胞计数并加入更低浓度血清的培养液 至最终细胞密度为5×105个细胞/ml。
将200ul细胞悬液加入96孔板的各孔中(相当于1×105个细胞/孔)。 加50ul实施例14产生的上清,37℃保温48-72小时。可用已知通过EGR 激活PC12细胞的生长因子作阳性对照,如50ng/ul神经生长因子(NGF)。 在阳性对照孔中一般可观察到超过50倍的SEAP诱导量。按实施例20所 述方法用SEAP检验上清。 实施例19:T-细胞活性的高流通量筛选试验
NF-KB(核因子KB)是可被多种物质,包括炎症细胞因子IL-1和TNF、 CD30和CD40、淋巴毒素α和淋巴毒素β,通过暴露于LPS或凝血酶,和 通过某些病毒基因产物的表达而被激活的转录因子。作为转录因子, NF-KB可调节免疫细胞激活、细胞程序死亡控制(NF-KB似乎可保护细胞 免于程序死亡)、B和T-细胞发育、抗病毒和抗微生物反应和多种应激反 应中涉及的基因表达。
在非刺激条件下,NF-KB与I-KB(抑制剂KB)保持于细胞质中。然而, 在受刺激时,I-KB被磷酸化并降解,引起NF-KB进入核,从而激活靶基 因的转录。可被NF-KB激活的靶基因包括IL-2、IL-6、GM-CSF、ICAM-1 和1类MHC。
由于其重要作用和与多种刺激反应的能力,利用NF-KB启动子元件的 报道基因构建体可用于筛选实施例14产生的上清。NF-KB的激活剂或抑 制剂可用于治疗疾病。例如,NF-KB的抑制剂可用于治疗与急性或慢性 NF-KB活化相关的疾病,如类风湿性关节炎。
为了构建含NF-KB启动子元件的载体,采用了以PCR为基础的方法。 上游引物包含4个NF-KB结合位点(GGGGACTTTCCC)(SEQ ID NO:91) 的串联拷贝,与SV40早期启动子序列5’端互补的18bp长序列,侧翼有 XhoI位点:
5′:GCGGCCTCGAGGGGACTTTCCCGGGGACTTTCCGGGGACTTTCCG
GGACTTTCCATCCTGCCATCTCAATTAG:3′(SEQ ID NO:92)
下游引物与SV40启动子的3’端互补且侧翼有HindIII位点:
5′:GCGGCAAGCTTTTTGCAAAGCCTAGGC:3′(SEQ ID NO:93)
用存在于获自Clontech之pB-gal:启动子质粒中的SV40启动子模板 进行PCR扩增。用XhoI和HindIII消化产生的PCR片段并亚克隆入 BLSK2-(Stratagene)。用T7和T3引物测序确认插入片段含以下序列: 5′:CTCGAGGGGACTTTCCCGGGGACTTTCCGGGGACTTTCCGGGACT TTCCATCTGCCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAA CTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCG CCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGC CTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGA GGCCTAGGCTTTTGCAAAAAGCTT:3′(SEQ ID NO:88)
然后用XhoI和HindIII,将该NF-KB/SV40片段置换pSEAP2启动子质 粒(Clontech)中的SV40最小启动子元件。不过,此载体不包含新霉素抗 性基因,因此不优选用于哺乳动物表达系统。
为了产生稳定的哺乳动物细胞系,用限制酶SalI和NotI从上述 NF-KB/SEAP载体中去除NF-KB/SV40/SEAP盒,并插入含新霉素抗性的载 体中。特别是,在用限制酶SalI和NotI消化pGFP-1后,将 NF-KB/SV40/SEAP盒插入pGFP-1(Clontech)中置换GFP基因。
一旦产生了NF-KB/SV40/SEAP/Neo载体,即按实施例16所述方法建 立和维持稳定的Jurkat T-细胞。同样地,用这些稳定的Jurkat T-细胞 检验上清的方法也描述于实施例16中。作为阳性对照,将外源TNFα (0.1、1、10ng)加入孔H9、H10和H11中,通常可观察到5-10倍的激 活作用。 实施例20:SEAP活性检测
作为实施例16-19中所述试验的报道分子,按以下通用步骤用Tropix Phospho-light Kit(Cat.BP-400)检测SEAP活性。Tropix Phospho-light Kit提供了以下所用的稀释、检测和反应缓冲液。
预先准备好2.5x稀释缓冲液并分配15ul 2.5x稀释缓冲液至含35ul 上清的Optiplate中。用塑料密封材料密封平板并65℃保温30分钟。隔 开Optiplate以避免不均匀加热。
冷却样品至室温15分钟。倾空分配器并准备好检测缓冲液。加入50ml 检测缓冲液并室温保温5分钟。倾空分配器并准备好反应缓冲液(见下 表)。加入50ul反应缓冲液并室温保温20分钟。因为化学发光信号的强 度是时间依赖性的,在光度计上用大约10分钟读5个平板,所以每次应 处理5个平板,并于10分钟后处理下一组平板。
在光度计上读相对光单位。以H12为空白,打印结果。化学发光度的 增加表明了报道分子的活性。
反应缓冲液配方:
平板号                      Rxn缓冲液稀释剂(ml)
平板号               Rxn缓冲液稀释剂(ml)          CSPD(ml)
  10                 60                           3
  11                 65                           3.25
  12                 70                           3.5
  13                 75                           3.75
  14                 80                           4
  15                 85                           4.25
  16                 90                           4.5
  17                 95                           4.75
  18                 100                          5
  19                 105                          5.25
  20                 110                          5.5
  21                 115                          5.75
  22                 120                          6
  23                 125                          6.25
  24                 130                          6.5
  25                 135                          6.75
  26                 140                          7
  27                 145                          7.25
  28                 150                          7.5
  29                 155                          7.75
     平板号               Rxn缓冲液稀释剂(ml)    CSPD(ml)
       30                   160                    8
       31                   165                    8.25
       32                   170                    8.5
       33                   175                    8.75
       34                   180                    9
       35                   185                    9.25
       36                   190                    9.5
       37                   195                    9.75
       38                   200                    10
       39                   205                    10.25
       40                   210                    10.5
       41                   215                    10.75
       42                   220                    11
       43                   225                    11.25
       44                   230                    11.5
       45                   235                    11.75
       46                   240                    12
       47                   245                    12.25
       48                   250                    12.5
       49                   255                    12.75
       50                   260                    13 实施例21:鉴定小分子浓度和膜渗透性改变的高流通量筛选试验
已知配基与受体的结合可改变如钙、钾、钠之类小分子的细胞内水平 和胞内pH,也可改变膜电位。可在实验中检测这些改变以鉴别可结合特 异细胞的受体的上清。尽管以下方案只描述了用于检测钙的试验,但此 方案可方便地修改后用于检测钾、钠、pH、膜电位或荧光素探针可检测 的任何其他小分子的变化。
以下试验用荧光成像平板读数器(“FLIPR”)检测结合小分子的荧光 分子(Molecular Probes)的改变。显然,任何检测小分子的荧光分子 可用于替代此处所用钙荧光分子,fluo-3。
对于粘附细胞,以10000-20000个细胞/孔的密度接种细胞于底部清 晰的Co-star黑色96-孔板。平板在二氧化碳培养箱中保温20小时。在 Biotek washer中用200ul HBSS(Hank’s平衡盐溶液)洗粘附细胞两次, 最后一次留下100ul缓冲液。
在10%Dluronic acid DMSO中制备1mg/ml fluo-3母液。为了使细胞 带上fluo-3,在各孔中加入50ul 12ug/ml fluo-3。平板在二氧化碳培 养箱中37℃保温60分钟。在Biotek washer中用HBSS洗平板4次,最 后一次留下100ul缓冲液。
对于非粘附细胞,将细胞从培养液中离心下来。在50ml圆锥管中用 HBSS以2-5×106个细胞/ml的密度重悬细胞。将在10%pluronic acid DMSO 中的1mg/ml fluo-3溶液4ul加入每ml细胞悬液中。然后将管放置于37 ℃水浴30-60分钟。用HBSS洗细胞两次,重悬为1×106个细胞/ml,分到 微量滴定板上,100ul/孔。在1000rpm离心平板5分钟。在Denley CellWash中用200ul洗平板1次,然后吸出部分至终体积为100ul。
对于不基于细胞的试验,各孔包含有荧光分子,如fluo-3。将上清加 入各孔中,检测荧光改变。
为了检测细胞内钙的荧光,FLIPR的参数设置如下:(1)系统增益为 300-800mW;(2)曝光时间为0.4秒;(3)相机F数为F/2;(4)激发光 为488nm;(5)发射光为530nm;和(6)加入样品为50ul。在530nm处 发射光值增加显示有由METH1或METH2分子或者被METH1或METH2诱导 的分子引起的细胞外信号事件,导致细胞内Ca++浓度的提高。 实施例22:鉴定酪氨酸激酶活性的高流通量筛选试验
蛋白质酪氨酸激酶(PTK)代表了一组不同的跨膜和胞质激酶。在受 体蛋白质酪氨酸激酶(RPTK)组内有有丝分裂和新陈代谢生长因子的受 体,包括PDGF、FGF、EGF、NGF、HGF和胰岛素受体亚家族。此外有一大 的RPTK家族,其相应配基是未知的。RPTK的配基主要包括分泌的小蛋白 质,但也包括膜结合蛋白和胞外基质蛋白。
RPTK被配基激活涉及配基介导的受体二聚化,导致受体亚单位的转磷 酸化作用和胞质酪氨酸激酶的活化。胞质酪氨酸激酶包括src家族的受 体相关酪氨酸激酶(如src、yes、lck、lyn、fyn)和非受体相关及胞质 蛋白质酪氨酸激酶,如Jak家族,其成员介导由受体细胞因子超家族(如 白介素、干扰素、GM-CSF和Leptin)激发的信号转导。
因为能刺激酪氨酸激酶活性的已知因子较多,鉴定METH1或METH2或 者METH1或METH2诱导的分子是否能激活酪氨酸激酶信号转导途径是令 人感兴趣的。因此设计如下方案以鉴定能激活酪氨酸激酶信号转导途径 的这些分子。
以约25000个细胞/孔的密度接种靶细胞(如初级角质细胞)于购自 Nalge Nunc(Naperville,IL)的96孔Loprodyne Silent Screen Plates。 用100%酒精洗平板两次消毒,30分钟/次,再用水洗并干燥过夜。一些 平板用购自Sigma Chemicals(St.Louis,MO)的细胞培养级I类胶原 (50mg/ml)、明胶(2%)或多溶素(50mg/ml)或者购自Becton Dickinson(Bedford,MA)的10%Matrigel,或小牛血清100ml包被2小时, 用PBS洗并存于4℃。这些平板上细胞生长的检测通过接种5000个细胞/ 孔于生长培养液中,48小时后按制造商Alamar Biosciences, Inc.(Sacramento,CA)所述用alamarBlue间接定量确定细胞数量进行。 来自Becton Dickinson(Bedford,MA)的编号#3071的Falcon平板盖用于 覆盖Loprodyne Silent Screen平板。Falcon Microtest III细胞培养 板也可用于一些增殖实验中。
为了制备提取物,将A431细胞接种于Loprodyne板的尼龙膜上 (20000/200ml/孔)并在完全培养基中培养过夜。在无血清的基本培养 液中保温24小时使细胞静止。用EGF(60ng/ml)或实施例14所产生的 上清50ul处理5-20分钟后,弃培养液,并在各孔中加入100ml获自 Boehringer Mannheim(Indiamapolis IN)的提取缓冲液(20mM HEPES pH7.5,0.15M NaCl,1%Triton X-100,0.1%SDS,2mM Na3VO4,2mM Na4P2O7和蛋白酶抑制剂混合物(#1836170)),平板在旋转摇床上4℃振荡5分 钟。然后将平板放于真空转移除尘歧管中,用室内真空使提取液滤过各 孔底部的0.45mm膜。在真空除尘歧管底部收集提取液于96孔收集/检验 平板中,立即置于水上。为了得到澄清的提取液,在去垢剂溶解5分钟 后,取各孔中物质并于4℃16000g离心15分钟。
检测滤过提取液的酪氨酸激酶活性水平。尽管已知许多检测酪氨酸激 酶活性的方法,但在此只描述了一种。
通常,通过测定其使特异底物(生物素化肽)中酪氨酸残基磷酸化的 活性来评估上清的酪氨酸激酶活性。可用于此目的的生物素化肽包括 PSK1(相应于细胞分裂激酶cdc2-p34的第6-20位氨基酸)和PSK2(相 应于胃泌素的第1-17位氨基酸)。两肽均为多种酪氨酸激酶的底物并可 购自Boehringer Mannheim。
通过依次加入以下组分进行酪氨酸激酶反应。首先,加入10ul 5uM 生物素化肽,然后是10ul ATP/Mg2+(5mM ATP/50mM MgCl2)、10ul 5x检测 缓冲液(40mM咪唑盐酸,pH7.3,40mM β-甘油磷酸盐,1mM EGTA,100mMMgCl2,5m MnCl2,0.5mg/mlBSA)、5ul钒酸钠(1mM)和5ul水。温和混合 这些组分并将反应混合物30℃预热2分钟。加入10ul对照酶或过滤上清 起始反应。
然后加入10ul 120mm EDTA终止酪氨酸激酶测定反应并置于冰上。
通过转移50ul反应混合物的等分试样至微量滴定板(MTP)孔中并37 ℃保温20分钟测定酪氨酸激酶活性。这使得包被链霉亲和素的96孔板 与生物素化肽相连。用300ul/孔的PBS洗MTP孔4次。然后在各孔中加 入偶联有辣根过氧化物酶的抗磷酸酪氨酸抗体(抗-P-Tyr-POD (0.5u/ml))75ul并37℃保温1小时。如上所述洗孔。
加入100ul过氧化物酶底物溶液(Boehringer Mannheim)并室温保 温至少5分钟(最多30分钟)。用ELISA读数器检测样品在405nm的吸 光值。用ELISA读数器定量测定结合过氧化物酶的活性水平,这反映了 酪氨酸激酶的活性水平。 实施例23:鉴定磷酸化作用活性的高流通量筛选试验
作为对实施例22中所述蛋白质酪氨酸激酶活性检测的潜在选择和/或 补充,也可使用检测主要胞内信号转导中间体活化(磷酸化)的试验。 例如,如下所述的特殊实验可检测Erk-1和Erk-2激酶的酪氨酸磷酸化 作用。不过,其它分子,如Raf、JNK、p38MAP、Map激酶激酶(MEK)、 MEK激酶、Src、肌肉特异性激酶(MuSK)、IRAK、Tec和Janus,以及任何 其他磷酸丝氨酸、磷酸酪氨酸或磷酸苏氨酸分子的磷酸化作用,可通过 在以下实验中用这些分子替代Erk-1或Erk-2而检测。
具体地说,通过用0.1ml蛋白G(1ug/ml)室温(RT)包被96-孔ELISA 平板的孔2小时制备检测平板。平板用PBS洗并以3%BSA/PBS室温封闭1 小时。然后用买来的两种抗Erk-1和Erk-2单克隆抗体(100ng/孔)处理 蛋白G平板(室温1小时)(Santa Cruz Biotechnology)。(为检测其它 分子,此步可通过用可检测任何上述分子的单克隆抗体替代而方便地作 些改动。)用PBS洗3-5次,平板4℃保存待用。
接种A431细胞(20000/孔)于96孔Loprodyne滤板中并在生长培养 液里培养过夜。在基本培养液(DMEM)中饥饿细胞48小时,然后用EGF (6ng/孔)或实施例14所获上清50ul处理5-20分钟。再溶解细胞并直 接过滤提取物到检测板中。
室温保温提取液1小时后,再次洗孔。用购得的MAP激酶制剂(10ng/ 孔)取代A431提取液以做阳性对照。然后用买来的可特异识别Erk-1和 Erk-2激酶磷酸化表位的多克隆(兔)抗体(1ug/ml)处理平板(室温1 小时)。此抗体用标准方法生物素化。然后通过在Wallac DELFIA装置用 铕链霉亲和素和铕荧光增强剂(时间分辨荧光)连续保温来定量测定所 结合的多克隆抗体。超过背景的增强荧光信号表明METH1或METH2或者 METH1或METH2诱导的分子的磷酸化作用。 实施例24:测定METH1或METH2基因中变化的方法
分离来自呈目的表型(如疾病)之整个家族或个别病人的RNA。用本 领域已知方法从这些RNA样品中生产cDNA。(见Sambrook)然后用此cDNA 为PCR模板,应用SEQ ID NO:1中目的区周围的引物。建议的PCR条件 由35个循环组成,每个循环为95℃30秒;52-58℃60-120秒;和70℃ 60-120秒,所用缓冲溶液如Sidransky等,科学252:706(1991)描述。
然后用SequiTherm聚合酶(Epicentre Technologies)测定PCR产 物序列,所用引物在5’端被T4多核苷酸激酶标记。还确定METH1或METH2 之所选外显子的内含子-外显子边界,分析基因组PCR产物以确认结果。 然后将含METH1或METH2中预测突变的PCR产物克隆和测序,以证实直 接测序的结果。
如Holton,T.A.和Graham,M.W.,核酸研究19:1156(1991)所述将 METH1或METH2的PCR产物克隆入T结尾的载体并用T7聚合酶(United States Biochemical)测序。通过未患病个体中不存在的METH1或METH2 的突变而鉴别受影响个体。
测定METH1或METH2基因中改变的方法也可观察到基因组的重排。分 离的基因组克隆用地高辛脱氧尿苷5’-三磷酸(Boehringer Mannheim) 进行缺口翻译,并如Johnson,Cg等,细胞生物学方法35:73-99(1991) 所述完成FISH。为与METH1或METH2基因组位置特异杂交,用大大过量 的人cot-1 DNA进行与标记探针的杂交。
用4,6-二氨基-2-苯基吲哚和碘化丙锭负染染色体,同时产生C-和 R-带。用三波段过滤装置(Chroma Technology,Brattleboro,VT)与冷却 的电荷耦合器件像机(Photometrics,Tucson,AZ)和可变激发波长滤器 获得用于精确绘图的序列对比图象(Johnson Cv.等, Genet.Anal.Tech.Appl.8:75(1991))。用Isee Graphical软件系统 (Inovision Corporation,Durham,NC.)进行图像收集、分析和染色体 部分长度检测。METH1或METH2基因组区域(被探针杂交)的染色体改变 鉴定为插入、缺失和转位。这些METH1或METH2的改变用做相关疾病的 诊断标记。 实施例25:检测生物样品中METH1或METH2异常水平的方法
可在生物样品内检测METH1或METH2多肽,如果检测到METH1或METH2 水平的提高或降低,则此多肽可用做特异表型的标记。检测方法很多, 因此应当理解本领域技术熟练人员可修改以下试验以适合其特殊需要。
例如,抗体夹层ELISA可用于检测样品中的METH1或METH2,优选生 物样品。用抗METH1或METH2的特异抗体包被微量滴定板的孔,终浓度 0.2-10ug/ml。抗体是单克隆或多克隆抗体,可用实施例13所述方法产 生。封闭各孔以使METH1或METH2与孔的非特异结合降低。
然后将包被孔与含METH1或METH2的样品室温保温2小时以上。优选 地,应用样品的系列稀释液证实结果。用去离子水或蒸馏水洗平板3次 以去除未结合METH1或METH2。
下一步,加入浓度为25-400ng的50ul特异抗体-碱性磷酸酶偶联物 并室温保温2小时。用去离子水或蒸馏水再洗平板3次以去除未结合的 偶联物。
加入75ul 4-methylumbelliferyl phosphate(MUP)或对硝基苯基磷酸 (NPP)底物溶液于各孔中并室温保温1小时。用微量滴定板读数器测定 反应。用对照样品的系列稀释液作标准曲线,METH1或METH2多肽浓度绘 于X-轴(对数刻度)而荧光值或吸光值绘于Y-轴(线性刻度)。用标准 曲线得到样品中METH1或METH2的浓度。 实施例26:多肽配制
METH1或METH2组合物将以利于药用的方式配制和给药,需考虑到个 体病人的临床状况(尤其是单独使用METH1或METH2多肽治疗的副作用)、 运送位点、给药方法、给药日程安排和医生已知的其它因素。因此用于 本文的目的的“有效量”由这些方面的考虑决定。
作为一般的建议,METH1或METH2的非肠道用的总药学有效量范围是 每剂约1ug-10mg/kg病人体重/天,当然,如上所提及,这将因治疗的个 体差异而不同。更优选的剂量是至少0.01mg/kg/天,对于人来说最优选 的是给予该激素约0.01-1mg/kg/天。若持续给药,METH1或METH2的一 般给药速率是约1-50ug/kg/小时,这或是注射1-4次/天,或是用例如微 型泵持续皮下输注。也可使用静脉内袋溶液。观察到变化所需的治疗时 间和治疗后发生反应的间隔依预期效果而变化。
含METH1或METH2的药物组合物可口服、直肠给药、非肠道给药、脑 池内给药、阴道内给药、腹膜内给药、局部给药(如通过粉剂、药膏、 凝胶、滴剂或经皮片剂)、经颊给药或者口或鼻喷雾剂。。“药学可接受载 体”指无毒的固体、半固体或液体填充物、稀释液、胶囊材料或任何类 型的配方辅助物。本文所用术语“非肠道的”表示的给药方式包括静脉 内、肌肉内、腹膜内、胸骨内、皮下和关节内注射和输注。
METH1或METH2还可通过缓释系统恰当地给药。合适的缓释组合物例 子包括成形颗粒形式的半透性聚合体基质,如薄膜或微胶囊。缓释基质 包括聚交酯(美国专利号3773919,EP58481)、L-谷氨酸和γ-乙基-L- 谷氨酸酯的共聚物(Sidman,U.等,生物聚合体22:547-556(1983))、 聚(2-羟乙基异丁烯酸酯)(R.Langer等,J.Biomed.Mater.Res. 15:167-277(1981)和R.Langer,Chem.Tech.12:98-105(1982))、乙烯醋 酸乙烯酯(R.Langer等)或聚-D-(-)-3-羟基丁酸(EP 133988)。缓释组 合物还包括脂质体包裹的METH1或METH2多肽。用已知的方法制备含 METH1或METH2的脂质体:DE 3218121;Epstein等,美国国家科学院院 报82:3688-3692(1985);Hwang等,美国国家科学院院报77:4030-4034 (1980)EP 52322;EP 36676;EP 88046;EP 143949:EP 142641;日本 专利申请83-118008;美国专利号4485045和4544545;和EP 102324。 通常脂质体是小的(约200-800埃)单层脂质形式,其中脂含量大于约 30摩尔百分比胆固醇,可调节选择比率以达到最好的分泌多肽疗效。
对于非肠道给药,在一个实施方案中,METH1或METH2的配制通常通 过将其以所需纯度在可注射形式(溶液、悬浮液或乳状液)剂量单位内 与药学可接受载体混合进行,所述载体即在应用剂量和浓度对接受者无 毒性且与配方的其他成分相容的载体。例如,配方优选不包括氧化剂和 已知对多肽有毒的其他化合物。
通常,通过将METH1或METH2均一和密切地与液态载体或精细分散的 固态载体或两者接触而制备制剂。然后,如果需要,可将产物成形为预 期的形状。优选载体是非肠道载体,更优选是与接受者血液等渗的溶液。 这样的载体例子包括水、盐水、Ringer’s溶液和葡萄糖溶液。诸如固定 化油和油酸乙酯之类非水载体也可用于此,脂质体也可使用。
载体可恰当地包含少量添加剂,如增强等渗性和化学稳定性的物质。 这样的材料在应用剂量和浓度对接受者无毒性,包括缓冲液,如磷酸、 柠檬酸、琥珀酸和其他有机酸或它们的盐;抗氧化剂,如抗坏血酸;低 分子量(少于约10个残基)多肽,如多聚精氨酸或三肽;蛋白质,如血 清白蛋白,明胶或免疫球蛋白;亲水聚合物,如聚乙烯吡咯烷酮;氨基 酸,如甘氨酸、谷氨酸、天冬氨酸或精氨酸;单糖、双糖和其他碳水化 合物,包括纤维素或其衍生物、葡萄糖、甘露糖(manose)或糊精;螯 合剂,如EDTA;糖醇,如甘露醇或山梨醇;抗衡离子,如钠;和/或非离 子表面活性剂,如聚山梨醇酯、poloxamers或PEG。
METH1或METH2一般以约0.1-100mg/ml、优选1-10mg/ml的浓度, pH约3-8配制于这类载体中。应当理解前述一些赋形剂、载体或稳定剂 的使用将导致多肽盐的形成。
治疗用TMEH1或METH2可是无菌的。通过无菌滤膜(0.2um膜)过滤 可方便地完成消毒。治疗用多肽组合物通常置于具无菌入口的容器内, 例如,带有可被皮下注射针头刺穿之塞子的静脉内溶液袋或小瓶。
METH1或METH2多肽通常以水溶液或用于重熔的冻干状态保存于单或 多剂容器内,例如密封的安锫瓶或小瓶中。作为冻干药品的例子,10ml 小瓶中填充了5ml无菌过滤的1%(w/v)METH1或METH2多肽水溶液,将 产生的混合物冻干。用注射专用抑菌水重溶冻干的METH1或METH2多肽 制备输注溶液。
本发明还提供了含一个或多个容器的药用包装或试剂盒,其中容器中 填充了一种或多种本发明药物组合物的成分。与这些容器一起附具的可 以有管理药品或生物制品生产、使用或销售的政府管理部门出具的公告, 该公告反映管理部门已批准其生产、使用或销售,以对人给药。此外, METH1或METH2可与其他治疗化合物联合使用。 实施例27:治疗降低水平METH1或METH2的方法
本发明涉及体内需降低METH1或METH2活性水平的个体的治疗方法, 包括对这样的个体施用含治疗有效量METH1或METH2拮抗物的组合物。 优选用于本发明的拮抗物是METH1或METH2特异性抗体。
而且,应当理解,由于个体内标准或者正常METH1或METH2表达水平 降低引起的状况可通过给予METH1或METH2而得到治疗,优选以分泌的 多肽形式给药。此外,本发明还提供了需增加METH1或METH2多肽水平 的个体的治疗方法,包括对这样的个体施用含一定量METH1或METH2的 药物组合物以提高在所说个体中METH1或METH2的活性水平。
例如,具降低水平METH1或METH2多肽的病人可连续6天接受日剂量 0.1-100ug/kg的多肽。优选为分泌形式的多肽。基于给药和配方的精确 用药方案详情如实施例26所提供。 实施例28:治疗增高水平METH1或METH2的方法
本发明还涉及体内需增高METH1或METH2活性水平的个体的治疗方 法,包括对这样的个体施用含治疗有效量METH1或METH2或其激动剂的 组合物。
反义技术可用于抑制METH1或METH2的生产。由于种种病因,如癌症, 此技术是降低METH1或METH2多肽(优选分泌形式)水平的方法的一例 子。
例如,对诊断为METH1或METH2水平异常增高的病人静脉内注射反义 多核苷酸21天,0.5、1.0、1.5、2.0或3.0mg/kg/天。若对此治疗能忍 受,7天检测期后重复此治疗。反义多核苷酸的配方如实施例26所提供。 实施例29:利用基因疗法的治疗方法-离体
基因治疗的一种方法是将能表达METH1或METH2多肽的成纤维细胞移 植到病人体内。将产生的组织置于组织培养液内并分成小片。将组织小 块置于组织培养瓶的湿表面上,约10片/瓶。将小瓶翻转、拧紧并室温 放置过夜。室温24小时后,再将瓶翻过来,保持组织块固定在瓶底并加 入新鲜培养液(如Ham’s F12培养液,含10%FBS、青霉素和链霉素)。然 后将瓶37℃保温约一周。
此时,加入新鲜培养液并随后每隔几天换液。再培养两周后,单层成 纤维细胞出现。用胰蛋白酶消化此单层并放入更大的瓶中。
用EcoRI和HindIII消化侧翼为莫洛尼鼠肉瘤病毒长末端重复片段的 pMV-7(Kirschmeier,P.T.等,DNA7:219-25(1988))并随后用小牛肠磷 酸酶处理。将线性载体在琼脂糖凝胶上分离并用玻璃珠纯化。
如实施例5所示,用分别相应于5’和3’末端序列的PCR引物扩增编码 METH1或METH2的cDNA。优选5’引物含EcoRI位点而3’引物含HindIII 位点。在存在T4 DNA连接酶的条件下将等量莫洛尼鼠肉瘤病毒线性骨架 和扩增的EcoRI和HindIII片段连接到一起。在适于两片段连接的条件 下保持混合物。然后用连接混合物转化大肠杆菌HB101,再将细菌铺于含 卡那霉素的琼脂板上以确认载体包含正确插入的METH1或METH2。
在含10%小牛血清(CS)、青霉素和链霉素的Dulbecco’s Modified Eagles Medium(DMEM)中将双嗜性pA317或GP+am12包装细胞培养于组织 培养物里直到汇合的密度。然后将含METH1或METH2基因的MSV载体加 入培养液中并使其转导包装细胞。这样包装细胞就可生产含METH1或 METH2基因的感染性病毒颗粒(此时包装细胞称为生产者细胞)。
将新鲜培养液加入转导的生产者细胞中,随后从汇合生产者细胞的 10cm板上收获培养基。含感染性病毒颗粒的已耗尽养分的培养基过滤通 过微孔滤器以去除分离的生产者细胞,然后用此培养液感染成纤维细胞。 从成纤维细胞的次汇合平板上去除培养液并迅速换入生产者细胞的培养 液。再去除此培养液并换入新鲜培养液。若病毒滴度高,则几乎所有成 纤维细胞将被感染,无需选择。若滴度很低,则必需利用有选择标记, 如neo或his的逆转录病毒载体。一旦成纤维细胞已有效感染,分析成 纤维以测定METH1或METH2蛋白是否产生。
然后将加工过的成纤维细胞或单独或在cytodex3微载体珠上已生长 至汇合后移植入宿主。 实施例30:利用基因疗法的治疗方法-在体内
本发明的另一方面是用体内基因疗法治疗疾病、疾病和其他状态。基 因疗法涉及将裸核酸(DNA、RNA和反义DNA或RNA)METH1或METH2序列 引入动物以增加或减少METH1或METH2多肽的表达。METH1或METH2多核 苷酸可与启动子或靶组织表达METH1或METH2多肽需要的任何其他元件 有效连接。这种基因治疗和运送技术和方法是本领域已知的,见,例如, WO90/11092,WO98/11779;美国专利号5693622、5705151、5580859;Tabata H.等(1997)心血管研究(Cardiovasc.Res.)35(3):470-479,Chao,J. 等(1997)药理学研究(Pharmacol.Res.)35(6):517-522,Wolff J.A.(1997) 神经肌肉疾病(Neuromuscul.Disord.)7(5):314-318,Schwartz,B.等 (1996)基因治疗(Gene Ther.)3(5):405-411,Tsurumi Y.等(1996) 循环(Circulation)94(12):3281-3290(在此收编作为参考)。
METH1或METH2多核苷酸构建体可用任何运送可注射物质至动物细胞 的方法运送,如注射入组织间隙(心脏、肌肉、皮肤、肺、肝、小肠等 等)。METH1或METH2多核苷酸构建体可在药学可接受液态或含水载体内 运送。
术语“裸露的”多核苷酸、DNA或RNA指无其他可辅助、促进或方便 进入细胞的运送载体,包括病毒序列、病毒颗粒制剂、脂质体、脂转染 剂或沉淀剂等的序列。不过,METH1或METH2多核苷酸还可以(如Felgner P.L.等(1995)纽约科学年鉴(Ann.NY Acad.Sci.)772:126-139和 Abdallah B.等(1995)细胞生物学(Biol.Cell)85(1):1-7里所教导) 以脂质体制剂形式运送,其中脂质体制剂可用本领域技术熟练人员众所 周知的方法制备。
用于基因疗法的METH1或METH2多核苷酸载体构建体优选不整合入宿 主基因组并不含可引起复制的序列的构建体。任何本领域技术熟练人员 已知的强启动子均可用于驱动DNA的表达。与其他的基因治疗技术不同 的是,将裸露核苷酸序列引入靶细胞的一个主要优势是细胞内多核苷酸 合成的瞬时特性。研究表明,非复制DNA序列可引入细胞而在长达6个 月的期间内产生预期多肽。
METH1或METH2多核苷酸构建体可运送到动物组织胞间隙,包括肌肉、 皮肤、脑、肺、肝、脾、骨髓、胸腺、心脏、淋巴、血液、骨、软骨、 胰腺、肾、胆囊、胃、小肠、睾丸、卵巢、子宫、直肠、神经系统、眼、 腺体和结缔组织的胞间隙。组织的胞间隙包含细胞间液、器官组织网状 纤维中的粘多糖基质、血管或腔室壁中的弹性纤维、纤维性组织的胶原 纤维或者包盖肌肉细胞的结缔组织或骨腔隙中的同样基质。被循环血浆 和淋巴管的淋巴液占据的空间也可如此。由于以下原因优选向肌肉组织 胞间隙运送。它们可通过注射入含这些细胞的组织而被方便地运送。尽 管在非分化或较少完全分化的细胞,如血液干细胞或皮肤成纤维细胞中 也能达到运送和表达,但它们优选运送和表达于已分化的永久不分裂细 胞。体内肌肉细胞尤其有利用价值,因为它们能吸收和表达多核苷酸。
对于裸露的METH1或METH2多核苷酸注射,DNA或RNA的有效剂量范 围是约0.05g-50mg/kg体重。优选剂量为约0.005-20mg/kg,更优选约 0.05-5mg/kg。当然,正如本领域普通技术人员应理解的,此剂量依注射 的组织位点而变化。核苷酸序列的恰当和有效剂量可由本领域普通技术 人员很容易测定,并可能决定于待治疗的疾病和给药途经。优选的给药 途经是非肠道注射入组织的胞间隙。不过,其他的非肠道途经也可采用, 如,吸入喷雾剂,对于向肺或支气管组织、咽喉或鼻黏膜的运送更是如 此。此外,裸露的METH1或METH2多核苷酸构建体可在血管成形术中通 过该项手术中使用的导管运送到动脉处。
体内肌肉中被注射METH1或METH2多核苷酸的剂量反应测定如下。按 标准重组DNA方法制备用于生产编码METH1或METH2多肽之mRNA的恰当 METH1或METH2模板DNA。环状或线性的模板DNA以裸露DNA形式或与脂 质体复合使用。然后用多种剂量的模板DNA注射小鼠四头肌。
用0.3ml 2.5%Avertin腹膜内注射麻醉5-6周大的雌性和雄性Balb/C 小鼠。在前腿处切一1.5cm切口,四头肌直接可见。将于0.1ml载体内 的METH1或METH2模板DNA用1cc注射器通过27号针头从离肌肉远端插 入位点约0.5cm处注射入膝盖约0.2cm深,注射1分钟以上。缝合线留 在注射位点处以便将来定位,皮肤用不锈钢钳闭合。
适当保温后(如7天),切开整个四头肌制备肌肉提取物。对各四头 肌的每第5个15um横切片进行组织化学染色,分析METH1或METH2蛋白 质的表达。有关METH1或METH2蛋白质的表达时间的试验也可用类似方 式进行,只是在不同时间收获不同小鼠的四头肌这一点上不同。注射后 肌肉内METH1或METH2 DNA的保持可在从被注射小鼠和对照小鼠中制备 总细胞DNA和HIRT上清后用DNA印迹分析进行测定。以上小鼠中的实验 结果可用于推断在人和其他动物中使用METH1或METH2裸露DNA的正确 剂量和其他治疗参数。
应当清楚除以上描述和实施例之外,本发明还可以其它方式实施。
根据上文教导,可以对本发明进行多种修饰和改变,因此,它们也在 附加的权利要求范围内。
此处引用的所有出版物的全部内容(包括专利、专利申请、期刊杂志、 实验室手册、书或其他文件)均收编作为参考。
                              序列表 <110>Iruela-Arispe,Luisa
 Hastings,Gregg A.
 Ruben,Steven M. <120>Meth1和Meth2多核苷酸及多肽 <130>1488.107CN02 <140> <141> <150>US 60/072,298 <151>1998-01-23 <150>US 60/098,539 <151>1998-08-28 <160>93 <170>PatentIn Ver.2.0 <210>1 <211>3261 <212>DNA <213>人 <220> <221>CDS <222>(1)..(2853) <220> <221>不确定 <222>(3095) <223>可能是任何核酸 <220> <221>不确定 <222>(3248) <223>可能是任何核酸 <220> <221>不确定 <222>(3255) <223>可能是任何核酸 <220> <221>不确定 <222>(3261) <223>可能是任何核酸 <400>1 atg ggg aac gcg gag cgg gct ccg ggg tct cgg agc ttt ggg ccc gta      48 Met Gly Asn Ala Glu Arg Ala Pro Gly Ser Arg Ser Phe Gly Pro Val   1               5                  10                  15 ccc acg ctg ctg ctg ctc gcc gcg gcg cta ctg gcc gtg tcg gac gca    96 Pro Thr Leu Leu Leu Leu Ala Ala Ala Leu Leu Ala Val Ser Asp Ala
         20                   25                 30 ctc ggg cgc ccc tcc gag gag gac gag gag cta gtg gtg ccg gag ctg    144 Leu Gly Arg Pro Ser Glu Glu Asp Glu Glu Leu Val Val Pro Glu Leu
     35                  40                  45 gag cgc gcc ccg gga cac ggg acc acg cgc ctc cgc ctg cac gcc ttt    192 Glu Arg Ala Pro Gly His Gly Thr Thr Arg Leu Arg Leu His Ala Phe
 50                  55                  60 gac cag cag ctg gat ctg gag ctg cgg ccc gac agc agc ttt ttg gcg    240 Asp Gln Gln Leu Asp Leu Glu Leu Arg Pro Asp Ser Ser Phe Leu Ala  65                  70                  75                  80 ccc ggc ttc acg ctc cag aac gtg ggg cgc aaa tcc ggg tcc gag acg    288 Pro Gly Phe Thr Leu Gln Asn Val Gly Arg Lys Ser Gly Ser Glu Thr
             85                  90                  95 ccg ctt ccg gaa acc gac ctg gcg cac tgc ttc tac tcc ggc acc gtg    336 Pro Leu Pro Glu Thr Asp Leu Ala His Cys Phe Tyr Ser Gly Thr Val
        100                 105                 1l0 aat ggc gat ccc agc tcg gct gcc gcc ctc agc ctc tgc gag ggc gtg    384 Asn Gly Asp Pro Ser Ser Ala Ala Ala Leu Ser Leu Cys Glu Gly Val
    115                 120                 125 cgc ggc gcc ttc tac ctg ctg ggg gag gcg tat ttc atc cag ccg ctg    432 Arg Gly Ala Phe Tyr Leu Leu Gly Glu Ala Tyr Phe Ile Gln Pro Leu
130                 135                 140 ccc gcc gcc agc gag cgc ctc gcc acc gcc gcc cca ggg gag aag ccg    480 Pro Ala Ala Ser Glu Arg Leu Ala Thr Ala Ala Pro Gly Glu Lys Pro 145                 150                 155                 160 ccg gca cca cta cag ttc cac ctc ctg cgg cgg aat cgg cag ggc gac    528 Pro Ala Pro Leu Gln Phe His Leu Leu Arg Arg Asn Arg Gln Gly Asp
            165                  170                175 gta ggc ggc acg tgc ggg gtc gtg gac gac gag ccc cgg ccg act ggg    576 Val Gly Gly Thr Cys Gly Val Val Asp Asp Glu Pro Arg Pro Thr Gly
        180                 185                 190 aaa gcg gag acc gaa gac gag gac gaa ggg act gag ggc gag gac gaa    624 Lys Ala Glu Thr Glu Asp Glu Asp Glu Gly Thr Glu Gly Glu Asp Glu
    195                 200                 205 ggg cct cag tgg tcg ccg cag gac ccg gca ctg caa ggc gta gga cag    672 Gly Pro Gln Trp Ser Pro Gln Asp Pro Ala Leu Gln Gly Val Gly Gln
210                 215                 220 ccc aca gga act gga agc ata aga aag aag cga ttt gtg tcc agt cac    720 Pro Thr Gly Thr Gly Ser Ile Arg Lys Lys Arg Phe Val Ser Ser His 225                 230                 235                 240 cgc tat gtg gaa acc atg ctt gtg gca gac cag tcg atg gca gaa ttc    768 Arg Tyr Val Glu Thr Met Leu Val Ala Asp Gln Ser Met Ala Glu Phe
            245                 250                 255 cac ggc agt ggt cta aag cat tac ctt ctc acg ttg ttt tcg gtg gca    816 His Gly Ser Gly Leu Lys His Tyr Leu Leu Thr Leu Phe Ser Val Ala
        260                 265                 270 gcc aga ttg tac aaa cac ccc agc att cgt aat tca gtt agc ctg gtg    864 Ala Arg Leu Tyr Lys His Pro Ser Ile Arg Asn Ser Val Ser Leu Val
    275                 280                 285 gtg gtg aag atc ttg gtc atc cac gat gaa cag aag ggg ccg gaa gtg    912 Val Val Lys Ile Leu Val Ile His Asp Glu Gln Lys Gly Pro Glu Val
290                 295                 300 acc tcc aat gct gcc ctc act ctg cgg aac ttt tgc aac tgg cag aag    960 Thr Ser Asn Ala Ala Leu Thr Leu Arg Asn Phe Cys Asn Trp Gln Lys 305                 310                 315                 320 cag cac aac cca ccc agt gac cgg gat gca gag cac tat gac aca gca    1008 Gln His Asn Pro Pro Ser Asp Arg Asp Ala Glu His Tyr Asp Thr Ala
            325                 330                 335 att ctt ttc acc aga cag gac ttg tgt ggg tcc cag aca tgt gat act    1056 Ile Leu Phe Thr Arg Gln Asp Leu Cys Gly Ser Gln Thr Cys Asp Thr
        340                 345                 350 ctt ggg atg gct gat gtt gga act gtg tgt gat ccg agc aga agc tgc    1104 Leu Gly Met Ala Asp Val Gly Thr Val Cys Asp Pro Ser Arg Ser Cys
    355                 360                 365 tcc gtc ata gaa gat gat ggt tta caa gct gcc ttc acc aca gcc cat    1152 Ser Val Ile Glu Asp Asp Gly Leu Gln Ala Ala Phe Thr Thr Ala His
370                 375                 380 gaa tta ggc cac gtg ttt aac atg cca cat gat gat gca aag cag tgt    1200 Glu Leu Gly His Val Phe Asn Met Pro His Asp Asp Ala Lys Gln Cys 385                 390                 395                 400 gcc agc ctt aat ggt gtg aac cag gat tcc cac atg atg gcg tca atg    1248 Ala Ser Leu Asn Gly Val Asn Gln Asp Ser His Met Met Ala Ser Met
            405                 410                 415 ctt tcc aac ctg gac cac agc cag cct tgg tct cct tgc agt gcc tac    1296 Leu Ser Asn Leu Asp His Ser Gln Pro Trp Ser Pro Cys Ser Ala Tyr
        420                 425                 430 atg att aca tca ttt ctg gat aat ggt cat ggg gaa tgt ttg atg gac    1344 Met Ile Thr Ser Phe Leu Asp Asn Gly His Gly Glu Cys Leu Met Asp
    435                 440                 445 aag cct cag aat ccc ata cag ctc cca ggc gat ctc cct ggc acc tcg    1392 Lys Pro Gln Asn Pro Ile Gln Leu Pro Gly Asp Leu Pro Gly Thr Ser
450                 455                 460 tac gat gcc aac cgg cag tgc cag ttt aca ttt ggg gag gac tcc aaa    1440 Tyr Asp Ala Asn Arg Gln Cys Gln Phe Thr Phe Gly Glu Asp Ser Lys 465                 470                 475                 480 cac tgc cct gat gca gcc agc aca tgt agc acc ttg tgg tgt acc ggc    1488 His Cys Pro Asp Ala Ala Ser Thr Cys Ser Thr Leu Trp Cys Thr Gly
            485                 490                 495 acc tct ggt ggg gtg ctg gtg tgt caa acc aaa cac ttc ccg tgg gcg    1536 Thr Ser Gly Gly Val Leu Val Cys Gln Thr Lys His Phe Pro Trp Ala
        500                 505                 510 gat ggc acc agc tgt gga gaa ggg aaa tgg tgt atc aac ggc aag tgt    1584 Asp Gly Thr Ser Cys Gly Glu Gly Lys Trp Cys Ile Asn Gly Lys Cys
    515                 520                 525 gtg aac aaa acc gac aga aag cat ttt gat acg cct ttt cat gga agc    1632 Val Asn Lys Thr Asp Arg Lys His Phe Asp Thr Pro Phe His Gly Ser    530                  535                 540 tgg gga atg tgg ggg cct tgg gga gac tgt tcg aga acg tgc ggt gga    1680 Trp Gly Met Trp Gly Pro Trp Gly Asp Cys Ser Arg Thr Cys Gly Gly 545                 550                 555                 560 gga gtc cag tac acg atg agg gaa tgt gac aac cca gtc cca aag aat    1728 Gly Val Gln Tyr Thr Met Arg Glu Cys Asp Asn Pro Val Pro Lys Asn
            565                 570                 575 gga ggg aag tac tgt gaa ggc aaa cga gtg cgc tac aga tcc tgt aac    1776 Gly Gly Lys Tyr Cys Glu Gly Lys Arg Val Arg Tyr Arg Ser Cys Asn
        580                 585                  590 ctt gag gac tgt cca gac aat aat gga aaa acc ttt aga gag gaa caa    1824 Leu Glu Asp Cys Pro Asp Asn Asn Gly Lys Thr Phe Arg Glu Glu Gln
    595                 600                 605 tgt gaa gca cac aac gag ttt tca aaa gct tcc ttt ggg agt ggg cct    1872 Cys Glu Ala His Asn Glu Phe Ser Lys Ala Ser Phe Gly Ser Gly Pro
610                 615                 620 gcg gtg gaa tgg att ccc aag tac gct ggc gtc tca cca aag gac agg    1920 Ala Val Glu Trp Ile Pro Lys Tyr Ala Gly Val Ser Pro Lys Asp Arg 625                 630                 635                 640 tgc aag ctc atc tgc caa gcc aaa ggc att ggc tac ttc ttc gtt ttg    1968 Cys Lys Leu Ile Cys Gln Ala Lys Gly Ile Gly Tyr Phe Phe Val Leu
            645                 650                 655 cag ccc aag gtt gta gat ggt act cca tgt agc cca gat tcc acc tct    2016 Gln Pro Lys Val Val Asp Gly Thr Pro Cys Ser Pro Asp Ser Thr Ser
        660                 665                 670 gtc tgt gtg caa gga cag tgt gta aaa gct ggt tgt gat cgc atc ata    2064 Val Cys Val Gln Gly Gln Cys Val Lys Ala Gly Cys Asp Arg Ile Ile
    675                 680                 685 gac tcc aaa aag aag ttt gat aaa tgt ggt gtt tgc ggg gga aat gga    2112 Asp Ser Lys Lys Lys Phe Asp Lys Cys Gly Val Cys Gly Gly Asn Gly
690                 695                 700 tct act tgt aaa aaa ata tca gga tca gtt act agt gca aaa cct gga    2160 Ser Thr Cys Lys Lys Ile Ser Gly Ser Val Thr Ser Ala Lys Pro Gly 705                 710                 715                 720 tat cat gat atc atc aca att cca act gga gcc acc aac atc gaa gtg    2208 Tyr His Asp Ile Ile Thr Ile Pro Thr Gly Ala Thr Asn Ile Glu Val
            725                 730                 735 aaa cag cgg aac cag agg gga tcc agg aac aat ggc agc ttt ctt gcc    2256 Lys Gln Arg Asn Gln Arg Gly Ser Arg Asn Asn Gly Ser Phe Leu Ala
        740                 745                 750 atc aaa gct gct gat ggc aca tat att ctt aat ggt gac tac act ttg    2304 Ile Lys Ala Ala Asp Gly Thr Tyr Ile Leu Asn Gly Asp Tyr Thr Leu
    755                 760                 765 tcc acc tta gag caa gac att atg tac aaa ggt gtt gtc ttg agg tac    2352 Ser Thr Leu Glu Gln Asp Ile Met Tyr Lys Gly Val Val Leu Arg Tyr
770                 775                 780 agc ggc tcc tct gcg gca ttg gaa aga att cgc agc ttt agc cct ctc    2400 Ser Gly Ser Ser Ala Ala Leu Glu Arg Ile Arg Ser Phe Ser Pro Leu 785                 790                 795                 800 aaa gag ccc ttg acc atc cag gtt ctt act gtg ggc aat gcc ctt cga    2448 Lys Glu Pro Leu Thr Ile Gln Val Leu Thr Val Gly Asn Ala Leu Arg
            805                 810                 815 cct aaa att aaa tac acc tac ttc gta aag aag aag aag gaa tct ttc    2496 Pro Lys Ile Lys Tyr Thr Tyr Phe Val Lys Lys Lys Lys Glu Ser Phe
        820                 825                 830 aat gct atc ccc act ttt tca gca tgg gtc att gaa gag tgg ggc gaa    2544 Asn Ala Ile Pro Thr Phe Ser Ala Trp Val Ile Glu Glu Trp Gly Glu
    835                 840                 845 tgt tct aag tca tgt gaa ttg ggt tgg cag aga aga ctg gta gaa tgc    2592 Cys Ser Lys Ser Cys Glu Leu Gly Trp Gln Arg Arg Leu Val Glu Cys
850                 855                 860     cga gac att aat gga cag cct gct tcc gag tgt gca aag gaa gtg aag    2640 Arg Asp Ile Asn Gly Gln Pro Ala Ser Glu Cys Ala Lys Glu Val Lys 865                 870                 875                 880 cca gcc agc acc aga cct tgt gca gac cat ccc tgc ccc cag tgg cag    2688 Pro Ala Ser Thr Arg Pro Cys Ala Asp His Pro Cys Pro Gln Trp Gln
            885                 890                 895 ctg ggg gag tgg tca tca tgt tct aag acc tgt ggg aag ggt tac aaa    2736 Leu Gly Glu Trp Ser Ser Cys Ser Lys Thr Cys Gly Lys Gly Tyr Lys
        900                 905                 910 aaa aga agc ttg aag tgt ctg tcc cat gat gga ggg gtg tta tct cat    2784 Lys Arg Ser Leu Lys Cys Leu Ser His Asp Gly Gly Val Leu Ser His
    915                 920                 925 gag agc tgt gat cct tta aag aaa cct aaa cat ttc ata gac ttt tgc    2832 Glu Ser Cys Asp Pro Leu Lys Lys Pro Lys His Phe Ile Asp Phe Cys
930                 935                 940 aca atg gca gaa tgc agt taa gtggtttaag tggtgttagc tttgaggcaa       2883 Thr Met Ala Glu Cys Ser 945                 950 ggcaaagtga ggaagggctg gtgcagggaa agcaagaagg ctggagggat ccagcgtatc  2943 ttgccagtaa ccagtgaggt gtatcagtaa ggtgggatta tgggggtaga tagaaaagga  3003 gttgaatcat cagagtaaac tgccagttgc aaatttgata ggatagttag tgaggattat  3063 taacctctga gcagtgatat agcataataa anccccgggc attattatta ttatttcttt  3123 tgttacatct attacaagtt tagaaaaaac aaagcaattg tcaaaaaaaa aaaaaaaaaa  3183 aaaaaaaaaa aaagggcggc cgctctagag gatccctcga ggggcccaag cttacgcgtg  3243 catgntgtca tnagtctn                                                3261 <210>2 <211>950 <212>PRT <213>人 <400>2 Met Gly Asn Ala Glu Arg Ala Pro Gly Ser Arg Ser Phe Gly Pro Val   1               5                  10                  15 Pro Thr Leu Leu Leu Leu Ala Ala Ala Leu Leu Ala Val Ser Asp Ala
         20                  25                  30 Leu Gly Arg Pro Ser Glu Glu Asp Glu Glu Leu Val Val Pro Glu Leu
     35                  40                  45 Glu Arg Ala Pro Gly His Gly Thr Thr Arg Leu Arg Leu His Ala Phe
 50                  55                  60 Asp Gln Gln Leu Asp Leu Glu Leu Arg Pro Asp Ser Ser Phe Leu Ala  65                  70                  75                  80 Pro Gly Phe Thr Leu Gln Asn Val Gly Arg Lys Ser Gly Ser Glu Thr
             85                  90                  95  Pro Leu Pro Glu Thr Asp Leu Ala His Cys Phe Tyr Ser Gly Thr Val
        100                 105                 110 Asn Gly Asp Pro Ser Ser Ala Ala Ala Leu Ser Leu Cys Glu Gly Val
    115                 120                 125 Arg Gly Ala Phe Tyr Leu Leu Gly Glu Ala Tyr Phe Ile Gln Pro Leu
130                 135                 140 Pro Ala Ala Ser Glu Arg Leu Ala Thr Ala Ala Pro Gly Glu Lys Pro 145                 150                 155                 160 Pro Ala Pro Leu Gln Phe His Leu Leu Arg Arg Asn Arg Gln Gly Asp
            165                 170                 175 Val Gly Gly Thr Cys Gly Val Val Asp Asp Glu Pro Arg Pro Thr Gly
        180                 185                 190 Lys Ala Glu Thr Glu Asp Glu Asp Glu Gly Thr Glu Gly Glu Asp Glu
    195                 200                 205 Gly Pro Gln Trp Ser Pro Gln Asp Pro Ala Leu Gln Gly Val Gly Gln
210                 215                 220 Pro Thr Gly Thr Gly Ser Ile Arg Lys Lys Arg Phe Val Ser Ser His 225                 230                 235                 240 Arg Tyr Val Glu Thr Met Leu Val Ala Asp Gln Ser Met Ala Glu Phe
            245                 250                 255 His Gly Ser Gly Leu Lys His Tyr Leu Leu Thr Leu Phe Ser Val Ala
        260                 265                 270 Ala Arg Leu Tyr Lys His Pro Ser Ile Arg Asn Ser Val Ser Leu Val
    275                 280                 285 Val Val Lys Ile Leu Val Ile His Asp Glu Gln Lys Gly Pro Glu Val
290                 295                 300 Thr Ser Asn Ala Ala Leu Thr Leu Arg Asn Phe Cys Asn Trp Gln Lys 305                 310                 315                 320 Gln His Asn Pro Pro Ser Asp Arg Asp Ala Glu His Tyr Asp Thr Ala
            325                 330                 335 Ile Leu Phe Thr Arg Gln Asp Leu Cys Gly Ser Gln Thr Cys Asp Thr
        340                 345                 350 Leu Gly Met Ala Asp Val Gly Thr Val Cys Asp Pro Ser Arg Ser Cys
    355                 360                 365 Ser Val Ile Glu Asp Asp Gly Leu Gln Ala Ala Phe Thr Thr Ala His
370                 375                 380 Glu Leu Gly His Val Phe Asn Met Pro His Asp Asp Ala Lys Gln Cys 385                 390                 395                 400 Ala Ser Leu Asn Gly Val Asn Gln Asp Ser His Met Met Ala Ser Met
            405                 410                 415 Leu Ser Asn Leu Asp His Ser Gln Pro Trp Ser Pro Cys Ser Ala Tyr
        420                 425                 430 Met Ile Thr Ser Phe Leu Asp Asn Gly His Gly Glu Cys Leu Met Asp
    435                 440                 445 Lys Pro Gln Asn Pro Ile Gln Leu Pro Gly Asp Leu Pro Gly Thr Ser
450                 455                 460 Tyr Asp Ala Asn Arg Gln Cys Gln Phe Thr Phe Gly Glu Asp Ser Lys 465                 470                 475                 480 His Cys Pro Asp Ala Ala Ser Thr Cys Ser Thr Leu Trp Cys Thr Gly
            485                 490                 495 Thr Ser Gly Gly Val Leu Val Cys Gln Thr Lys His Phe Pro Trp Ala
        500                 505                 510 Asp Gly Thr Ser Cys Gly Glu Gly Lys Trp Cys Ile Asn Gly Lys Cys
    515                 520                 525 Val Asn Lys Thr Asp Arg Lys His Phe Asp Thr Pro Phe His Gly Ser
530                 535                 540 Trp Gly Met Trp Gly Pro Trp Gly Asp Cys Ser Arg Thr Cys Gly Gly 545                 550                 555                 560 Gly Val Gln Tyr Thr Met Arg Glu Cys Asp Asn Pro Val Pro Lys Asn
            565                 570                 575 Gly Gly Lys Tyr Cys Glu Gly Lys Arg Val Arg Tyr Arg Ser Cys Asn
        580                 585                 590 Leu Glu Asp Cys Pro Asp Asn Asn Gly Lys Thr Phe Arg Glu Glu Gln
    595                 600                 605 Cys Glu Ala His Asn Glu Phe Ser Lys Ala Ser Phe Gly Ser Gly Pro
610                 615                 620 Ala Val Glu Trp Ile Pro Lys Tyr Ala Gly Val Ser Pro Lys Asp Arg 625                 630                 635                 640 Cys Lys Leu Ile Cys Gln Ala Lys Gly Ile Gly Tyr Phe Phe Val Leu
            645                 650                 655 Gln Pro Lys Val Val Asp Gly Thr Pro Cys Ser Pro Asp Ser Thr Ser
        660                 665                 670 Val Cys Val Gln Gly Gln Cys Val Lys Ala Gly Cys Asp Arg Ile Ile
    675                 680                 685 Asp Ser Lys Lys Lys Phe Asp Lys Cys Gly Val Cys Gly Gly Asn Gly
690                 695                 700 Ser Thr Cys Lys Lys Ile Ser Gly Ser Val Thr Ser Ala Lys Pro Gly 705                 710                 715                 720 Tyr His Asp Ile Ile Thr Ile Pro Thr Gly Ala Thr Asn Ile Glu Val
            725                 730                 735 Lys Gln Arg Asn Gln Arg Gly Ser Arg Asn Asn Gly Ser Phe Leu Ala
        740                 745                 750 Ile Lys Ala Ala Asp Gly Thr Tyr Ile Leu Asn Gly Asp Tyr Thr Leu
    755                 760                 765 Ser Thr Leu Glu Gln Asp Ile Met Tyr Lys Gly Val Val Leu Arg Tyr
770                 775                 780 Ser Gly Ser Ser Ala Ala Leu Glu Arg Ile Arg Ser Phe Ser Pro Leu 785                 790                 795                 800 Lys Glu Pro Leu Thr Ile Gln Val Leu Thr Val Gly Asn Ala Leu Arg
            805                 810                 815 Pro Lys Ile Lys Tyr Thr Tyr Phe Val Lys Lys Lys Lys Glu Ser Phe
        820                 825                 830 Asn Ala Ile Pro Thr Phe Ser Ala Trp Val Ile Glu Glu Trp Gly Glu
    835                 840                 845 Cys Ser Lys Ser Cys Glu Leu Gly Trp Gln Arg Arg Leu Val Glu Cys
850                 855                 860 Arg Asp Ile Asn Gly Gln Pro Ala Ser Glu Cys Ala Lys Glu Val Lys 865                 870                 875                 880 Pro Ala Ser Thr Arg Pro Cys Ala Asp His Pro Cys Pro Gln Trp Gln
            885                 890                 895 Leu Gly Glu Trp Ser Ser Cys Ser Lys Thr Cys Gly Lys Gly Tyr Lys
        900                 905                 910 Lys Arg Ser Leu Lys Cys Leu Ser His Asp Gly Gly Val Leu Ser His
    915                 920                 925 Glu Ser Cys Asp Pro Leu Lys Lys Pro Lys His Phe Ile Asp Phe Cys
930                 935                 940 Thr Met Ala Glu Cys Ser 945                 950 <210>3 <211>3008 <212>DNA <213>人 <220> <221>CDS <222>(1)..(2670) <220> <22l>不确定 <222>(2887) <223>可能是任何核酸 <220> <221>不确定 <222>(2957) <223>可能是任何核酸 <220> <221>不确定 <222>(2970) <223>可能是任何核酸 <220> <221>不确定 <222>(2981) <223>可能是任何核酸 <400>3 atg ttc ccc gcc ccc gcc gcc ccc cgg tgg ctt ccg ttc ctg ctg ctg    48 Met Phe Pro Ala Pro Ala Ala Pro Arg Trp Leu Pro Phe Leu Leu Leu   1               5                  10                  15 ctg ctg ctg ctg ctg ctg ccg ctg gcc cgc ggc gcc ccg gcc cgg ccc    96 Leu Leu Leu Leu Leu Leu Pro Leu Ala Arg Gly Ala Pro Ala Ara Pro
         20                  25                  30 gca gcc ggg ggg cag gcc tcg gag ctg gtg gtg ccc acg cgg ttg ccc    144 Ala Ala Gly Gly Gln Ala Ser Glu Leu Val Val Pro Thr Arg Leu Pro
     35                  40                  45 ggc agc gcg ggc gag ctc gcg ctc cac ctg tcc gcc ttc ggc aag ggc    192 Gly Ser Ala Gly Glu Leu Ala Leu His Leu Ser Ala Phe Gly Lys Gly
 50                  55                  60 ttc gtg ttg cgc ctg gcg ccc gac gac agc ttc ctg gcg ccc gag ttc    240 Phe Val Leu Arg Leu Ala Pro Asp Asp Ser Phe Leu Ala Pro Glu Phe  65                  70                  75                  80 aag atc gag cgc ctc ggg ggc tcc ggc cgg gcg acc ggg ggc gag cgg    288 Lys Ile Glu Arg Leu Gly Gly Ser Gly Arg Ala Thr Gly Gly Glu Arg
             85                  90                  95 ggg ctg cgc ggc tgt ttt ttt tcc ggc acc gtg aat ggg gag ccc gag    336 Gly Leu Arg Gly Cys Phe Phe Ser Gly Thr Val Asn Gly Glu Pro Glu
        100                 105                 110 tcg ctg gcg gcg gtc agc ctg tgc cgc ggg ctg agc ggc tcc ttc ctg    384 Ser Leu Ala Ala Val Ser Leu Cys Arg Gly Leu Ser Gly Ser Phe Leu
    115                 120                 125 ctg gac ggc gag gag ttc acc atc cag ccg cag ggc gcg ggg ggc tcc    432 Leu Asp Gly Glu Glu Phe Thr Ile Gln Pro Gln Gly Ala Gly Gly Ser
130                 135                 140 ctg gct cag ccg cac cgc ctg cag cgc tgg ggt ccc gcc gga gcc cgc    480 Leu Ala Gln Pro His Arg Leu Gln Arg Trp Gly Pro Ala Gly Ala Arg 145                 150                 155                 160 ccc ctc ccg cga gga ccc gag tgg gag gtg gag acg gga gag ggt cag    528 Pro Leu Pro Arg Gly Pro Glu Trp Glu Val Glu Thr Gly Glu Gly Gln
            165                 170                 175 agg cag gag aga gga gac cac cag gag gac agc gag gag gag agc caa    576 Arg Gln Glu Arg Gly Asp His Gln Glu Asp Ser Glu Glu Glu Ser Gln
        180                 185                 190 gaa gag gag gca gaa ggc gct agc gag ccg cca ccg ccc ctg ggg gcc    624 Glu Glu Glu Ala Glu Gly Ala Ser Glu Pro Pro Pro Pro Leu Gly Ala
    195                 200                 205 acg agt agg acc aag cgg ttt gtg tct gag gcg cgc ttc gtg gag acg    672 Thr Ser Arg Thr Lys Arg Phe Val Ser Glu Ala Arg Phe Val Glu Thr
210                 215                 220 ctg ctg gtg gcc gat gcg tcc atg gct gcc ttc tac ggg gcc gac ctg    720 Leu Leu Val Ala Asp Ala Ser Met Ala Ala Phe Tyr Gly Ala Asp Leu 225                 230                 235                 240 cag aac cac atc ctg acg tta atg tct gtg gca gcc cga atc tac aag    768 Gln Asn His Ile Leu Thr Leu Met Ser Val Ala Ala Arg Ile Tyr Lys
            245                 250                 255 cac ccc agc atc aag aat tcc atc aac ctg atg gtg gta aaa gtg ctg    816 His Pro Ser Ile Lys Asn Ser Ile Asn Leu Met Val Val Lys Val Leu
        260                 265                 270 atc gta gaa gat gaa aaa tgg ggc cca gag gtg tcc gac aat ggg ggg    864 Ile Val Glu Asp Glu Lys Trp Gly Pro Glu Val Ser Asp Asn Gly Gly
    275                 280                 285 ctt acg ctg cgt aac ttc tgc aac tgg cag cgg cgt ttc aac cag ccc    912 Leu Thr Leu Arg Asn Phe Cys Asn Trp Gln Arg Arg Phe Asn Gln Pro
290                 295                 300 agc gac cgc cac cca gag cac tac gac acg gcc atc ctg ctc acc aga    960 Ser Asp Arg His Pro Glu His Tyr Asp Thr Ala Ile Leu Leu Thr Arg 305                 310                 315                 320 cag aac ttc tgt ggg cag gag ggg ctg tgt gac acc ctg ggt gtg gca    1008 Gln Asn Phe Cys Gly Gln Glu Gly Leu Cys Asp Thr Leu Gly Val Ala
            325                 330                 335 gac atc ggg acc att tgt gac ccc aac aaa agc tgc tcc gtg atc gag    1056 Asp Ile Gly Thr Ile Cys Asp Pro Asn Lys Ser Cys Ser Val Ile Glu
        340                 345                 350 gat gag ggg ctc cag gcg gcc cac acc ctg gcc cat gaa cta ggg cac    1104 Asp Glu Gly Leu Gln Ala Ala His Thr Leu Ala His Glu Leu Gly His
    355                 360                 365 gtc ctc agc atg ccc cac gac gac tcc aag ccc tgc aca cgg ctc ttc    1152 Val Leu Ser Met Pro His Asp Asp Ser Lys Pro Cys Thr Arg Leu Phe
370                 375                 380 ggg ccc atg ggc aag cac cac gtg atg gca ccg ctg ttc gtc cac ctg    1200 Gly Pro Met Gly Lys His His Val Met Ala Pro Leu Phe Val His Leu 385                 390                 395                 400 aac cag acg ctg ccc tgg tcc ccc tgc agc gcc atg tat ctc aca gag    1248 Asn Gln Thr Leu Pro Trp Ser Pro Cys Ser Ala Met Tyr Leu Thr Glu
            405                 410                 415 ctt ctg gac ggc ggg cac gga gac tgt ctc ctg gat gcc cct ggt gcg    1296 Leu Leu Asp Gly Gly His Gly Asp Cys Leu Leu Asp Ala Pro Gly Ala
        420                 425                 430 gcc ctg ccc ctc ccc aca ggc ctc ccg ggc cgc atg gcc ctg tac cag    1344 Ala Leu Pro Leu Pro Thr Gly Leu Pro Gly Arg Met Ala Leu Tyr Gln
    435                 440                 445 ctg gac cag cag tgc agg cag atc ttt ggg ccg gat ttc cgc cac tgc    1392 Leu Asp Gln Gln Cys Arg Gln Ile Phe Gly Pro Asp Phe Arg His Cys
450                 455                 460 ccc aac acc tct gct cag gac gtc tgc gcc cag ctt tgg tgc cac act    1440 Pro Asn Thr Ser Ala Gln Asp Val Cys Ala Gln Leu Trp Cys His Thr 465                 470                 475                 480 gat ggg gct gag ccc ctg tgc cac acg aag aat ggc agc ctg ccc tgg    1488 Asp Gly Ala Glu Pro Leu Cys His Thr Lys Asn Gly Ser Leu Pro Trp
            485                 490                 495 gct gac ggc acg ccg tgc ggg cct ggg cac ctc tgc tca gaa ggc agc    1536 Ala Asp Gly Thr Pro Cys Gly Pro Gly His Leu Cys Ser Glu Gly Ser
        500                 505                 510 tgt cta cct gag gag gaa gtg gag agg ccc aag ccc gtg gta gat gga    1584 Cys Leu Pro Glu Glu Glu Val Glu Arg Pro Lys Pro Val Val Asp Gly
    515                 520                 525 ggc tgg gca ccg tgg gga ccc tgg gga gaa tgt tct cgg acc tgt gga    1632 Gly Trp Ala Pro Trp Gly Pro Trp Gly Glu Cys Ser Arg Thr Cys Gly
530                 535                 540 gga gga gta cag ttt tca cac cgt gag tgc aag gac ccc gag cct cag    1680 Gly Gly Val Gln Phe Ser His Arg Glu Cys Lys Asp Pro Glu Pro Gln 545                 550                 555                 560 aat gga gga aga tac tgc ctg ggt cgg aga gcc aag tac cag tca tgc    1728 Asn Gly Gly Arg Tyr Cys Leu Gly Arg Arg Ala Lys Tyr Gln Ser Cys
            565                 570                 575 cac acg gag gaa tgc ccc cct gac ggg aaa agc ttc agg gag cag cag    1776 His Thr Glu Glu Cys Pro Pro Asp Gly Lys Ser Phe Arg Glu Gln Gln
        580                 585                 590 tgt gag aag tat aat gcc tac aat tac act gac atg gac ggg aat ctc    1824 Cys Glu Lys Tyr Asn Ala Tyr Asn Tyr Thr Asp Met Asp Gly Asn Leu
    595                 600                 605 ctg cag tgg gtc ccc aag tat gct ggg gtg tcc ccc cgg gac cgc tgc    1872 Leu Gln Trp Val Pro Lys Tyr Ala Gly Val Ser Pro Arg Asp Arg Cys
610                 615                 620 aag ttg ttc tgc cga gcc cgg ggg agg agc gag ttc aaa gtg ttc gag    1920 Lys Leu Phe Cys Arg Ala Arg Gly Arg Ser Glu Phe Lys Val Phe Glu 625                 630                 635                 640 gcc aag gtg att gat ggc acc ctg tgt ggg cca gaa aca ctg gcc atc    1968 Ala Lys Val Ile Asp Gly Thr Leu Cys Gly Pro Glu Thr Leu Ala Ile
            645                 650                 655 tgt gtc cgt ggc cag tgt gtc aag gcc ggc tgt gac cat gtg gtg gac    2016 Cys Val Arg Gly Gln Cys Val Lys Ala Gly Cys Asp His Val Val Asp
        660                 665                 670 tcg cct cgg aag ctg gac aaa tgc ggg gtg tgt ggg ggc aaa ggc aac    2064 Ser Pro Arg Lys Leu Asp Lys Cys Gly Val Cys Gly Gly Lys Gly Asn
    675                 680                 685 tcc tgc agg aag gtc tcc ggg tcc ctc acc ccc acc aat tat ggc tac    2112 Ser Cys Arg Lys Val Ser Gly Ser Leu Thr Pro Thr Asn Tyr Gly Tyr
690                 695                 700 aat gac att gtc acc atc cca gct ggt gcc act aat att gac gtg aag    2160 Asn Asp Ile Val Thr Ile Pro Ala Gly Ala Thr Asn Ile Asp Val Lys 705                 710                 715                 720 cag cgg agc cac ccg ggt gtg cag aac gat ggg aac tac ctg gcg ctg    2208 Gln Arg Ser His Pro Gly Val Gln Asn Asp Gly Asn Tyr Leu Ala Leu
            725                 730                 735 aag acg gct gat ggg cag tac ctg ctc aac ggc aac ctg gcc atc tct    2256 Lys Thr Ala Asp Gly Gln Tyr Leu Leu Asn Gly Asn Leu Ala Ile Ser
        740                 745                 750 gcc ata gag cag gac atc ttg gtg aag ggg acc atc ctg aag tac agc    2304 Ala Ile Glu Gln Asp Ile Leu Val Lys Gly Thr Ile Leu Lys Tyr Ser
    755                 760                 765 ggc tcc atc gcc acc ctg gag cgc ctg cag agc ttc cgg ccc ttg cca    2352 Gly Ser Ile Ala Thr Leu Glu Arg Leu Gln Ser Phe Arg Pro Leu Pro
770                 775                 780 gag cct ctg aca gtg cag ctc ctg aca gtc cct ggc gag gtc ttc ccc    2400 Glu Pro Leu Thr Val Gln Leu Leu Thr Val Pro Gly Glu Val Phe Pro 785                 790                 795                 800 cca aaa gtc aaa tac acc ttc ttt gtt cct aat gac gtg gac ttt agc    2448 Pro Lys Val Lys Tyr Thr Phe Phe Val Pro Asn Asp Val Asp Phe Ser
            805                 810                 815 atg cag agc agc aaa gag aga gca acc acc aac atc atc cag ccg ctg    2496 Met Gln Ser Ser Lys Glu Arg Ala Thr Thr Asn Ile Ile Gln Pro Leu
        820                 825                 830 ctc cac gca cag tgg gtg ctg ggg gac tgg tct gag tgc tct agc acc    2544 Leu His Ala Gln Trp Val Leu Gly Asp Trp Ser Glu Cys Ser Ser Thr
    835                 840                 845 tgc ggg gcc ggc tgg cag agg cga act gta gag tgc agg gac ccc tcc    2592 Cys Gly Ala Gly Trp Gln Arg Arg Thr Val Glu Cys Arg Asp Pro Ser
850                 855                 860 ggc cag gcc tct gcc acc tgc aac aag gct ctg aaa ccc gag gat gcc    2640 Gly Gln Ala Ser Ala Thr Cys Asn Lys Ala Leu Lys Pro Glu Asp Ala 865                 870                 875                 880 aag ccc tgc gaa agc cag ctg tgc ccc ctg tgattcaggg gggcaggggc      2690 Lys Pro Cys Glu Ser Gln Leu Cys Pro Leu
            885                 890 cagtcttgtg ctcctggaca tgcggtactg aggtgcagac aaggtctcca ctgtggtgac  2750 tgggtccctt ggccatatca aggcagcacg gcccacccag gcctcccatt gccgcaaccc  2810 ctccagtact gcacaaattc ctaaggggga agagaaaagg tatggggcgg caaaacctat  2870 catcaactgt ccawtgnaat ggaacttgct cgggttcaat taaaggcata agttaaagta  2930 aattcattat gatcaacaga cctcacntca tctgttgcan gatacaacta ntaaaaaaaa  2990 aaaaaaaaaa aaaaaaaa                                                3008 <210>4 <211>890 <212>PRT <213>人 <400>4 Met Phe Pro Ala Pro Ala Ala Pro Arg Trp Leu Pro Phe Leu Leu Leu   1               5                  10                  15 Leu Leu Leu Leu Leu Leu Pro Leu Ala Arg Gly Ala Pro Ala Arg Pro
         20                  25                  30 Ala Ala Gly Gly Gln Ala Ser Glu Leu Val Val Pro Thr Arg Leu Pro
     35                  40                  45 Gly Ser Ala Gly Glu Leu Ala Leu His Leu Ser Ala Phe Gly Lys Gly
 50                  55                  60   Phe Val Leu Arg Leu Ala Pro Asp Asp Ser Phe Leu Ala Pro Glu Phe  65                  70                  75                  80 Lys Ile Glu Arg Leu Gly Gly Ser Gly Arg Ala Thr Gly Gly Glu Arg
             85                  90                  95 Gly Leu Arg Gly Cys Phe Phe Ser Gly Thr Val Asn Gly Glu Pro Glu
        100                 105                 110 Ser Leu Ala Ala Val Ser Leu Cys Arg Gly Leu Ser Gly Ser Phe Leu
    115                 120                 125 Leu Asp Gly Glu Glu Phe Thr Ile Gln Pro Gln Gly Ala Gly Gly Ser
130                 135                 140 Leu Ala Gln Pro His Arg Leu Gln Arg Trp Gly Pro Ala Gly Ala Arg 145                 150                 155                 160 Pro Leu Pro Arg Gly Pro Glu Trp Glu Val Glu Thr Gly Glu Gly Gln
            165                 170                 175 Arg Gln Glu Arg Gly Asp His Gln Glu Asp Ser Glu Glu Glu Ser Gln
        180                 185                 190 Glu Glu Glu Ala Glu Gly Ala Ser Glu Pro Pro Pro Pro Leu Gly Ala
    195                 200                 205 Thr Ser Arg Thr Lys Arg Phe Val Ser Glu Ala Arg Phe Val Glu Thr
210                 215                 220 Leu Leu Val Ala Asp Ala Ser Met Ala Ala Phe Tyr Gly Ala Asp Leu 225                 230                 235                 240 Gln Asn His Ile Leu Thr Leu Met Ser Val Ala Ala Arg Ile Tyr Lys
            245                 250                 255 His Pro Ser Ile Lys Asn Ser Ile Asn Leu Met Val Val Lys Val Leu
        260                 265                 270 Ile Val Glu Asp Glu Lys Trp Gly Pro Glu Val Ser Asp Asn Gly Gly
    275                 280                 285 Leu Thr Leu Arg Asn Phe Cys Asn Trp Gln Arg Arg Phe Asn Gln Pro
290                 295                 300 Ser Asp Arg His Pro Glu His Tyr Asp Thr Ala Ile Leu Leu Thr Arg 305                 310                 315                 320 Gln Asn Phe Cys Gly Gln Glu Gly Leu Cys Asp Thr Leu Gly Val Ala
            325                 330                 335 Asp Ile Gly Thr Ile Cys Asp Pro Asn Lys Ser Cys Ser Val Ile Glu
        340                 345                 350 Asp Glu Gly Leu Gln Ala Ala His Thr Leu Ala His Glu Leu Gly His
    355                 360                 365 Val Leu Ser Met Pro His Asp Asp Ser Lys Pro Cys Thr Arg Leu Phe
370                 375                 380 Gly Pro Met Gly Lys His His Val Met Ala Pro Leu Phe Val His Leu 385                 390                 395                 400 Asn Gln Thr Leu Pro Trp Ser Pro Cys Ser Ala Met Tyr Leu Thr Glu
            405                 410                 415 Leu Leu Asp Gly Gly His Gly Asp Cys Leu Leu Asp Ala Pro Gly Ala
        420                 425                 430 Ala Leu Pro Leu Pro Thr Gly Leu Pro Gly Arg Met Ala Leu Tyr Gln
    435                 440                 445 Leu Asp Gln Gln Cys Arg Gln Ile Phe Gly Pro Asp Phe Arg His Cys
450                 455                 460 Pro Asn Thr Ser Ala Gln Asp Val Cys Ala Gln Leu Trp Cys His Thr 465                 470                 475                 480 Asp Gly Ala Glu Pro Leu Cys His Thr Lys Asn Gly Ser Leu Pro Trp
            485                 490                 495 Ala Asp Gly Thr Pro Cys Gly Pro Gly His Leu Cys Ser Glu Gly Ser
        500                 505                 510 Cys Leu Pro Glu Glu Glu Val Glu Arg Pro Lys Pro Val Val Asp Gly
    515                 520                 525 Gly Trp Ala Pro Trp Gly Pro Trp Gly Glu Cys Ser Arg Thr Cys Gly
530                 535                 540 Gly Gly Val Gln Phe Ser His Arg Glu Cys Lys Asp Pro Glu Pro Gln 545                 550                 555                 560 Asn Gly Gly Arg Tyr Cys Leu Gly Arg Arg Ala Lys Tyr Gln Ser Cys
            565                 570                 575 His Thr Glu Glu Cys Pro Pro Asp Gly Lys Ser Phe Arg Glu Gln Gln
        580                 585                 590 Cys Glu Lys Tyr Asn Ala Tyr Asn Tyr Thr Asp Met Asp Gly Asn Leu
    595                 600                 605 Leu Gln Trp Val Pro Lys Tyr Ala Gly Val Ser Pro Arg Asp Arg Cys
610                 615                 620 Lys Leu Phe Cys Arg Ala Arg Gly Arg Ser Glu Phe Lys Val Phe Glu 625                 630                 635                 640 Ala Lys Val Ile Asp Gly Thr Leu Cys Gly Pro Glu Thr Leu Ala Ile
            645                 650                 655 Cys Val Arg Gly Gln Cys Val Lys Ala Gly Cys Asp His Val Val Asp
        660                 665                 670 Ser Pro Arg Lys Leu Asp Lys Cys Gly Val Cys Gly Gly Lys Gly Asn
    675                 680                 685 Ser Cys Arg Lys Val Ser Gly Ser Leu Thr Pro Thr Asn Tyr Gly Tyr
690                 695                 700 Asn Asp Ile Val Thr Ile Pro Ala Gly Ala Thr Asn Ile Asp Val Lys 705                 710                 715                 720 Gln Arg Ser His Pro Gly Val Gln Asn Asp Gly Asn Tyr Leu Ala Leu
            725                 730                 735 Lys Thr Ala Asp Gly Gln Tyr Leu Leu Asn Gly Asn Leu Ala Ile Ser
        740                 745                 750 Ala Ile Glu Gln Asp Ile Leu Val Lys Gly Thr Ile Leu Lys Tyr Ser
    755                 760                 765 Gly Ser Ile Ala Thr Leu Glu Arg Leu Gln Ser Phe Arg Pro Leu Pro
770                 775                 780 Glu Pro Leu Thr Val Gln Leu Leu Thr Val Pro Gly Glu Val Phe Pro 785                 790                 795                 800 Pro Lys Val Lys Tyr Thr Phe Phe Val Pro Asn Asp Val Asp Phe Ser
            805                 810                 815 Met Gln Ser Ser Lys Glu Arg Ala Thr Thr Asn Ile Ile Gln Pro Leu
        820                 825                 830 Leu His Ala Gln Trp Val Leu Gly Asp Trp Ser Glu Cys Ser Ser Thr
    835                 840                 845 Cys Gly Ala Gly Trp Gln Arg Arg Thr Val Glu Cys Arg Asp Pro Ser 850                     855                 860 Gly Gln Ala Ser Ala Thr Cys Asn Lys Ala Leu Lys Pro Glu Asp Ala 865                 870                 875                 880 Lys Pro Cys Glu Ser Gln Leu Cys Pro Leu
            885                 890 <210>5 <211>1203 <212>PRT <213>Bovine <400>5 Met Asp Pro Pro Ala Gly Ala Ala Gly Arg Leu Leu Cys Pro Ala Leu   1               5                  10                  15 Leu Leu Leu Leu Leu Leu Pro Leu Pro Ala Asp Ala Arg Leu Ala Ala
         20                  25                  30 Ala Ala Ala Asp Pro Pro Gly Gly Pro Gln Gly His Gly Ala Glu Arg
     35                  40                  45 Ile Leu Ala Val Pro Val Arg Thr Asp Ala Gln Gly Arg Leu Val Ser
 50                  55                  60 His Val Val Ser Ala Ala Thr Ala Pro Ala Gly Val Arg Thr Arg Arg  65                  70                  75                  80 Ala Ala Pro Ala Gln Ile Pro Gly Leu Ser Gly Gly Ser Glu Glu Asp
             85                  90                  95 Pro Gly Gly Arg Leu Phe Tyr Asn Val Thr Val Phe Gly Arg Asp Leu
        100                 105                 110 His Leu Arg Leu Arg Pro Asn Ala Arg Leu Val Ala Pro Gly Ala Thr
    115                 120                 125 Val Glu Trp Gln Gly Glu Ser Gly Ala Thr Arg Val Glu Pro Leu Leu
130                 135                 140 Gly Thr Cys Leu Tyr Val Gly Asp Val Ala Gly Leu Ala Glu Ser Ser 145                 150                 155                 160 Ser Val Ala Leu Ser Asn Cys Asp Gly Leu Ala Gly Leu Ile Arg Met
            165                 170                 175 Glu Glu Glu Glu Phe Phe Ile Glu Pro Leu Glu Lys Gly Leu Ala Ala
        180                 185                 190 Lys Glu Ala Glu Gln Gly Arg Val His Val Val Tyr His Arg Pro Thr
    195                 200                 205 Thr Ser Arg Pro Pro Pro Leu Gly Gln Ala Leu Asp Thr Gly Ile Ser
210                 215                 220 Ala Asp Ser Leu Asp Ser Leu Ser Arg Ala Leu Gly Val Leu Glu Glu 225                 230                 235                 240 Arg Val Asn Ser Ser Arg Arg Arg Met Arg Arg His Ala Ala Asp Asp
            245                 250                 255 Asp Tyr Asn Ile Glu Val Leu Leu Gly Val Asp Asp Ser Val Val Gln
        260                 265                 270 Phe His Gly Thr Glu His Val Gln Lys Tyr Leu Leu Thr Leu Met Asn
    275                 280                 285 Ile Val Asn Glu Ile Tyr His Asp Glu Ser Leu Gly Ala His Ile Asn
290                 295                 300 Val Val Leu Val Arg Ile Ile Leu Leu Ser Tyr Gly Lys Ser Met Ser 305                 310                 315                 320 Leu Ile Glu Ile Gly Asn Pro Ser Gln Ser Leu Glu Asn Val Cys Arg
            325                 330                 335 Trp Ala Tyr Leu Gln Gln Lys Pro Asp Thr Asp His Asp Glu Tyr His
        340                 345                 350 Asp His Ala Ile Phe Leu Thr Arg Gln Asp Phe Gly Pro Ser Gly Met
    355                 360                 365 Gln Gly Tyr Ala Pro Val Thr Gly Met Cys His Pro Val Arg Ser Cys
370                 375                 380 Thr Leu Asn His Glu Asp Gly Phe Ser Ser Ala Phe Val Val Ala His 385                 390                 395                 400 Glu Thr Gly His Val Leu Gly Met Glu His Asp Gly Gln Gly Asn Arg
            405                 410                 415 Cys Gly Asp Glu Val Arg Leu Gly Ser Ile Met Ala Pro Leu Val Gln
        420                 425                 430 Ala Ala Phe His Arg Phe His Trp Ser Arg Cys Ser Gln Gln Glu Leu
    435                 440                 445 Ser Arg Tyr Leu His Ser Tyr Asp Cys Leu Arg Asp Asp Pro Phe Thr
450                 455                 460 His Asp Trp Pro Ala Leu Pro Gln Leu Pro Gly Leu His Tyr Ser Met 465                 470                 475                 480 Asn Glu Gln Cys Arg Phe Asp Phe Gly Leu Gly Tyr Met Met Cys Thr
            485                 490                 495 Ala Phe Arg Thr Phe Asp Pro Cys Lys Gln Leu Trp Cys Ser His Pro
        500                 505                 510 Asp Asn Pro Tyr Phe Cys Lys Thr Lys Lys Gly Pro Pro Leu Asp Gly
    515                 520                 525 Thr Met Cys Ala Pro Gly Lys His Cys Phe Lys Gly His Cys Ile Trp
530                 535                 540 Leu Thr Pro Asp Ile Leu Lys Arg Asp Gly Asn Trp Gly Ala Trp Ser 545                 550                 555                 560 Pro Phe Gly Ser Cys Ser Arg Thr Cys Gly Thr Gly Val Lys Phe Arg
            565                 570                 575 Thr Arg Gln Cys Asp Asn Pro His Pro Ala Asn Gly Gly Arg Thr Cys
        580                 585                 590 Ser Gly Leu Ala Tyr Asp Phe Gln Leu Cys Asn Ser Gln Asp Cys Pro
    595                 600                 605 Asp Ala Leu Ala Asp Phe Arg Glu Glu Gln Cys Arg Gln Trp Asp Leu
610                 615                 620 Tyr Phe Glu His Gly Asp Ala Gln His His Trp Leu Pro His Glu His 625                 630                 635                 640 Arg Asp Ala Lys Glu Arg Cys His Leu Tyr Cys Glu Ser Lys Glu Thr
            645                 650                 655 Gly Glu Val Val Ser Met Lys Arg Met Val His Asp Gly Thr Arg Cys
        660                 665                 670 Ser Tyr Lys Asp Ala Phe Ser Leu Cys Val Arg Gly Asp Cys Arg Lys
    675                 680                 685 Val Gly Cys Asp Gly Val Ile Gly Ser Ser Lys Gln Glu Asp Lys Cys
690                 695                 700 Gly Val Cys Gly Gly Asp Asn Ser His Cys Lys Val Val Lys Gly Thr 705                 710                 715                 720 Phe Ser Arg Ser Pro Lys Lys Leu Gly Tyr Ile Lys Met Phe Glu Ile
            725                 730                 735 Pro Ala Gly Ala Arg His Leu Leu Ile Gln Glu Ala Asp Thr Thr Ser
        740                 745                 750 His His Leu Ala Val Lys Asn Leu Glu Thr Gly Lys Phe Ile Leu Asn
    755                 760                 765 Glu Glu Asn Asp Val Asp Pro Asn Ser Lys Thr Phe Ile Ala Met Gly
770                 775                 780 Val Glu Trp Glu Tyr Arg Asp Glu Asp Gly Arg Glu Thr Leu Gln Thr 785                 790                 795                 800 Met Gly Pro Leu His Gly Thr Ile Thr Val Leu Val Ile Pro Glu Gly
            805                 810                 815 Asp Ala Arg Ile Ser Leu Thr Tyr Lys Tyr Met Ile His Glu Asp Ser
        820                 825                 830 Leu Asn Val Asp Asp Asn Asn Val Leu Glu Asp Asp Ser Val Gly Tyr
    835                 840                 845 Glu Trp Ala Leu Lys Lys Trp Ser Pro Cys Ser Lys Pro Cys Gly Gly
850                 855                 860  Gly Ser Gln Phe Thr Lys Tyr Gly Cys Arg Arg Arg Leu Asp His Lys 865                 870                 875                 880 Met Val His Arg Gly Phe Cys Asp Ser Val Ser Lys Pro Lys Ala Ile
            885                 890                 895 Arg Arg Thr Cys Asn Pro Gln Glu Cys Ser Gln Pro Val Trp Val Thr
        900                 905                 910 Gly Glu Trp Glu Pro Cys Ser Arg Ser Cys Gly Arg Thr Gly Met Gln
    915                 920                 925 Val Arg Ser Val Arg Cys Val Gln Pro Leu His Asn Asn Thr Thr Arg
930                 935                 940 Ser Val His Thr Lys His Cys Asn Asp Ala Arg Pro Glu Gly Arg Arg 945                 950                 955                 960 Ala Cys Asn Arg Glu Leu Cys Pro Gly Arg Trp Arg Ala Gly Ser Trp
            965                 970                 975 Ser Gln Cys Ser Val Thr Cys Gly Asn Gly Thr Gln Glu Arg Pro Val
        980                 985                 990 Leu Cys Arg Thr Ala Asp Asp Ser Phe Gly Val Cys Arg Glu Glu Arg
    995                 1000                1005 Pro Glu Thr Ala Arg Ile Cys Arg Leu Gly Pro Cys Pro Arg Asn Thr
1010                1015                1020 Ser Asp Pro Ser Lys Lys Ser Tyr Val Val Gln Trp Leu Ser Arg Pro 1025                1030                1035                1040 Asp Pro Asn Ser Pro Val Gln Glu Thr Ser Ser Lys Gly Arg Cys Gln
            1045                1050                1055 Gly Asp Lys Ser Val Phe Cys Arg Met Glu Val Leu Ser Arg Tyr Cys
        1060                1065                1070 Ser Ile Pro Gly Tyr Asn Lys Leu Cys Cys Lys Ser Cys Asn Pro His
    1075                1080                1085 Asp Asn Leu Thr Asp Val Asp Asp Arg Ala Glu Pro Pro Ser Gly Lys
1090                1095                1100 His Asn Asp Ile Glu Glu Leu Met Pro Thr Leu Ser Val Pro Thr Leu 1105                1110                1115                1120  Val Met Glu Val Gln Pro Pro Pro Gly Ile Pro Leu Glu Val Pro Leu
            1125                1130                1135 Asn Thr Ser Ser Thr Asn Ala Thr Glu Asp His Pro Glu Thr Asn Ala
        1140                1145                1150 Val Asp Val Pro Tyr Lys Ile Pro Gly Leu Glu Asp Glu Val Gln Pro
    1155                1160                1165 Pro Asn Leu Ile Pro Arg Arg Pro Ser Pro Tyr Glu Lys Thr Arg Asn
1170                1175                1180 Gln Arg Ile Gln Glu Leu Ile Asp Glu Met Arg Lys Lys Glu Met Leu 1185               1190                1195                1200 Gly Lys Phe <210>6 <211>50 <212>PRT <213>人 <400>6 Asp Asp Gly Trp Ser Pro Trp Ser Glu Trp Thr Ser Cys Ser Thr Ser   1               5                  10                  15 Cys Gly Asn Gly Ile Gln Gln Arg Gly Arg Ser Cys Asp Ser Leu Asn
         20                  25                  30 Asn Arg Cys Glu Gly Ser Ser Val Gln Thr Arg Thr Cys His Ile Gln
     35                  40                  45 Glu Cys
50 <210>7 <211>57 <212>PRT <213>人 <400>7 Asp Gly Gly Trp Ser His Trp Ser Pro Trp Ser Ser Cys Ser Val Thr   1               5                  10                  15 Cys Gly Asp Gly Val Ile Thr Arg Ile Arg Leu Cys Asn Ser Pro Ser
         20                  25                  30 Pro Gln Met Asn Gly Lys Pro Cys Glu Gly Glu Ala Arg Glu Thr Lys
     35                  40                  45 Ala Cys Lys Lys Asp Ala Cys Pro Ile
 50                  55 <210>8 <211>57 <212>PRT <213>人 <400>8 Asn Gly Gly Trp Gly Pro Trp Ser Pro Trp Asp Ile Cys Ser Val Thr   1               5                  10                  15 Cys Gly Gly Gly Val Gln Lys Arg Ser Arg Leu Cys Asn Asn Pro Thr
         20                  25                  30 Pro Gln Phe Gly Gly Lys Asp Cys Val Gly Asp Val Thr Glu Asn Gln
     35                  40                  45 Ile Cys Asn Lys Gln Asp Cys Pro Ile
 50                  55 <210>9 <211>50 <212>PRT <213>人 <400>9 Glu Glu Gly Trp Ser Pro Trp Ala Glu Trp Thr Gln Cys Ser Val Thr   1               5                  10                  15 Cys Gly Ser Gly Thr Gln Gln Arg Gly Arg Ser Cys Asp Val Thr Ser
         20                  25                  30 Asn Thr Cys Leu Gly Pro Ser Ile Gln Thr Arg Ala Cys Ser Leu Ser
     35                  40                  45 Lys Cys
 50 <210>10 <211>57 <212>PRT <213>人 <400>10 Asp Gly Gly Trp Ser His Trp Ser Pro Trp Ser Ser Cys Ser Val Thr   1               5                  10                  15 Cys Gly Val Gly Asn Ile Thr Arg Ile Arg Leu Cys Asn Ser Pro Val
         20                  25                  30 Pro Gln Met Gly Gly Lys Asn Cys Lys Gly Ser Gly Arg Glu Thr Lys
     35                  40                  45 Ala Cys Gln Gly Ala Pro Cys Pro Ile
 50                  55 <210>11 <211>56 <212>PRT <213>人 <400>11 Asp Gly Arg Trp Ser Pro Trp Ser Pro Trp Ser Ala Cys Thr Val Thr   1               5                  10                  15 Cys Ala Gly Gly Ile Arg Glu Arg Thr Arg Val Cys Asn Ser Pro Glu
         20                  25                  30 Pro Gln Tyr Gly Gly Lys Ala Cys Val Gly Asp Val Gln Glu Arg Gln
     35                  40                  45 Met Cys Asn Lys Arg Ser Cys Pro
 50                  55 <210>12 <211>3974 <212>DNA <213>人 ggtacctaag tgagtagggc gtccgatcga cggacgcctt ttttttgaat tcgtaatcat 60 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 120 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 180 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 240 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 300 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 360 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc  420 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc  480 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac  540 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc  600 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata  660 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc  720 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca  780 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag  840 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta  900 gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg  960 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc  1020 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt  1080 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcgtcga  1140 caattcgcgc gcgaaggcga agcggcatgc atttacgttg acaccatcga atggtgcaaa  1200 acctttcgcg gtatggcatg atagcgcccg gaagagagtc aattcagggt ggtgaatgtg  1260 aaaccagtaa cgttatacga tgtcgcagag tatgccggtg tctcttatca gaccgtttcc  1320 cgcgtggtga accaggccag ccacgtttct gcgaaaacgc gggaaaaagt ggaagcggcg  1380 atggcggagc tgaattacat tcccaaccgc gtggcacaac aactggcggg caaacagtcg  1440 ttgctgattg gcgttgccac ctccagtctg gccctgcacg cgccgtcgca aattgtcgcg  1500 gcgattaaat ctcgcgccga tcaactgggt gccagcgtgg tggtgtcgat ggtagaacga  1560 agcggcgtcg aagcctgtaa agcggcggtg cacaatcttc tcgcgcaacg cgtcagtggg  1620 ctgatcatta actatccgct ggatgaccag gatgccattg ctgtggaagc tgcctgcact  1680 aatgttccgg cgttatttct tgatgtctct gaccagacac ccatcaacag tattattttc  1740 tcccatgaag acggtacgcg actgggcgtg gagcatctgg tcgcattggg tcaccagcaa  1800 atcgcgctgt tagcgggccc attaagttct gtctcggcgc gtctgcgtct ggctggctgg  1860 cataaatatc tcactcgcaa tcaaattcag ccgatagcgg aacgggaagg cgactggagt  1920 gccatgtccg gttttcaaca aaccatgcaa atgctgaatg agggcatcgt tcccactgcg  1980 atgctggttg ccaacgatca gatggcgctg ggcgcaatgc gcgccattac cgagtccggg  2040 ctgcgcgttg gtgcggatat ctcggtagtg ggatacgacg ataccgaaga cagctcatgt  2100 tatatcccgc cgttaaccac catcaaacag gattttcgcc tgctggggca aaccagcgtg  2160 gaccgcttgc tgcaactctc tcagggccag gcggtgaagg gcaatcagct gttgcccgtc  2220 tcactggtga aaagaaaaac caccctggcg cccaatacgc aaaccgcctc tccccgcgcg  2280 ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga  2340 gcgcaacgca attaatgtaa gttagcgcga attgtcgacc aaagcggcca tcgtgcctcc  2400 ccactcctgc agttcggggg catggatgcg cggatagccg ctgctggttt cctggatgcc  2460 gacggatttg cactgccggt agaactccgc gaggtcgtcc agcctcaggc agcagctgaa  2520 ccaactcgcg aggggatcga gcccggggtg ggcgaagaac tccagcatga gatccccgcg  2580 ctggaggatc atccagccgg cgtcccggaa aacgattccg aagcccaacc tttcatagaa  2640 ggcggcggtg gaatcgaaat ctcgtgatgg caggttgggc gtcgcttggt cggtcatttc  2700 gaaccccaga gtcccgctca gaagaactcg tcaagaaggc gatagaaggc gatgcgctgc  2760 gaatcgggag cggcgatacc gtaaagcacg aggaagcggt cagcccattc gccgccaagc  2820 tcttcagcaa tatcacgggt agccaacgct atgtcctgat agcggtccgc cacacccagc  2880 cggccacagt cgatgaatcc agaaaagcgg ccattttcca ccatgatatt cggcaagcag  2940 gcatcgccat gggtcacgac gagatcctcg ccgtcgggca tgcgcgcctt gagcctggcg  3000 aacagttcgg ctggcgcgag cccctgatgc tcttcgtcca gatcatcctg atcgacaaga  3060 ccggcttcca tccgagtacg tgctcgctcg atgcgatgtt tcgcttggtg gtcgaatggg  3120 caggtagccg gatcaagcgt atgcagccgc cgcattgcat cagccatgat ggatactttc  3180 tcggcaggag caaggtgaga tgacaggaga tcctgccccg gcacttcgcc caatagcagc  3240 cagtcccttc ccgcttcagt gacaacgtcg agcacagctg cgcaaggaac gcccgtcgtg  3300 gccagccacg atagccgcgc tgcctcgtcc tgcagttcat tcagggcacc ggacaggtcg  3360 gtcttgacaa aaagaaccgg gcgcccctgc gctgacagcc ggaacacggc ggcatcagag  3420 cagccgattg tctgttgtgc ccagtcatag ccgaatagcc tctccaccca agcggccgga  3480 gaacctgcgt gcaatccatc ttgttcaatc atgcgaaacg atcctcatcc tgtctcttga 3540 tcagatcttg atcccctgcg ccatcagatc cttggcggca agaaagccat ccagtttact 3600 ttgcagggct tcccaacctt accagagggc gccccagctg gcaattccgg ttcgcttgct 3660 gtccataaaa ccgcccagtc tagctatcgc catgtaagcc cactgcaagc tacctgcttt 3720 ctctttgcgc ttgcgttttc ccttgtccag atagcccagt agctgacatt catccggggt 3780 cagcaccgtt tctgcggact ggctttctac gtgttccgct tcctttagca gcccttgcgc 3840 cctgagtgct tgcggcagcg tgaagcttaa aaaactgcaa aaaatagttt gacttgtgag 3900 cggataacaa ttaagatgta cccaattgtg agcggataac aatttcacac attaaagagg 3960 agaaattaca tatg                                                   3974 <210>13 <211>112 <212>DNA <213>人 <400>13 aagcttaaaa aactgcaaaa aatagtttga cttgtgagcg gataacaatt aagatgtacc 60 caattgtgag cggataacaa tttcacacat taaagaggag aaattacata tg         112 <210>14 <211>542 <212>DNA <213>小鼠 <220> <221>不确定 <222>(3) <223>可能是任何核酸 <220> <221>不确定 <222>(21) <223>可能是任何核酸 <220> <221>不确定 <222>(22) <223>可能是任何核酸 <220> <221>不确定 <222>(361) <223>可能是任何核酸 <220> <221>不确定 <222>(369) <223>可能是任何核酸 <220> <221>不确定 <222>(407) <223>可能是任何核酸 <220> <221>不确定 <222>(427) <223>可能是任何核酸 <220> <221>不确定 <222>(479) <223>可能是任何核酸 <220> <221>不确定 <222>(482) <223>可能是任何核酸 <220> <221>不确定 <222>(535) <223>可能是任何核酸 <400>14 gtncgaattt cggcacgaga nnttagacgc cttttcatgg aagctgggga atgtgggggc  60 cttggggaga ctgttcgaga acgtgcggtg gaggagtcca gtacacgatg agggaatgtg 120 acaacccagt cccaaagaat ggagggaagt actgtgaagg caaacgagtg cgctacagat 180 cctgtaacct tgaggactgt ccagacaata atggaaaaac ctttagagag gaacaatgtg 240 aagcacacaa cgagttttca aaagcttcct ttgggagtgg gcctgcggtg gaatggattc 300 ccaagtacgc tggcgtctca ccaaaggaca ggtgcaagtt catgttgcca agccaaaggc 360 nttggctant tctttcgttt tgcagcccaa ggttgttagg tgggtantcc atgttaggcc 420 cagattncac ctttgtctgt gtgcaaggac agtgtgttaa aagttggttg tgatccgcnt 480 cntagattcc aaaaggagtt ttgttaatgt ggtgttttcn gggggaatgg tctantttta 540 aa                                                                542 <210>15 <211>320 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>15 cagagaacat tcgccccact cttcaatgac ccatgctgaa aaagtgggga tagcattgaa  60 agattccttc ttcttcttta cgaagtaggt gtatttaatt ttaggtcgaa gggcattgcc  120 cacagtaaga acctggatgg tcaagggctc tttgagaggg ctaaagctgc gaattctttc  180 caatgccgca gaggagccgc tgtacctcaa gacaacacct ttgtacataa tgtcttgctc  240 taaggtggac aaagtgtagt caccattaag aatatatgtg ccatcagcag ctttgatggc  300 aagaaagctg cccttgttcc                                              320 <210>16 <211>316 <212>DNA <213>Eimeria tenella <400>16 aatgccgaga cattaatgga cagcctgctt ccgagtgtgc aaaggaagtg aagccagcca  60 gcaccagacc ttgtgcagac catccctgcc cccagtggca gctgggggag tggtcatcat  120 gttctaagac ctgtgggaag ggttacaaaa aaagaagctt gaagtgtctg tcccatgatg  180 gaggggtgtt atctcatgag agctgtgatc ctttaaagaa acctaaacat ttcatagact  240 tttgcacaat ggcagaatgc agttaagtgg tttaagtggt gttagctttg agggcaaggc  300 aaagtgagga agggct                                                  316 <210>17 <211>383 <212>DNA <213>Caenorhabditis elegans <220> <221>不确定 <222>(160) <223>可能是任何核酸 <220> <221>不确定 <222>(326) <223>可能是任何核酸 <220> <221>不确定 <222>(358) <223>可能是任何核酸 <220> <221>不确定     <222>(366) <223>可能是任何核酸 <220> <221>不确定 <222>(377) <223>可能是任何核酸 <220> <221>不确定 <222>(379) <223>可能是任何核酸 <400>17 gtcgacccac gcgtccggat ggtactccat gtagcccaga ttccacctct gtctgtgtgc 60 aaggacagtg tgtaaaagct ggttgtgatc gcatcataga ctccaaaaag aagtttgata 120 aatgtggtgt ttgcggggga aatggatcta cttgtaaaan aatatcagga tcagttacta 180 gtgcaaaacc tgggatatca tgatatcatc acaattccaa ctgggagcca ccaacatcga 240 agtgaaacag cggaaccaga ggggatccag ggaacaatgg gcagctttct tgccatcaaa 300 gctgctggat ggcacatata ttcttnaatg gtgactacac tttgtccacc ttagaganag 360 acattntgtg acaaagngnt tgt                                         383 <210>18 <211>404 <212>DNA <213>Crotalus atrox <220> <221>不确定 <222>(21) <223>可能是任何核酸 <220> <221>不确定 <222>(301) <223>可能是任何核酸 <220> <221>不确定 <222>(335) <223>可能是任何核酸 <220> <221>不确定 <222>(373) <223>可能是任何核酸 <220> <221>不确定 <222>(378) <223>可能是任何核酸 <220> <221>不确定 <222>(382) <223>可能是任何核酸 <220> <221>不确定 <222>(383) <223>可能是任何核酸 <400>18 cccacgcgtc cgcccacggt nccgggactt gtgtgggtcc cagacatgtg atactcttgg 60 gatggctgat gttggaactg tgtgtgatcc gagcagaagc tgctccgtca tagaagatga 120 tggtttacaa gctgccttca ccacagccca tgaattaggc cacgtgttta acatgccaca 180 tgatggatgc aaagcagtgt gccagcctta aatggtgtga accagggatt cccacatgat 240 ggcgtcaatg ctttccaacc tgggaccaca gccagccttg ggtcctcctt gcagtggcct 300 nacatggatt gacatcattt ctgggatgaa tggtncatgg gggaatgttt tgattggaca 360 agccttcaga atnccctnac annttcccag gggttctccc tggg                  404 <210>19 <211>152 <212>DNA <213>人 <220> <221>不确定 <222>(105) <223>可能是任何核酸 <220> <221>不确定 <222>(122) <223>可能是任何核酸 <220> <221>不确定 <222>(135) <223>可能是任何核酸 <400>19 atcgtagaag atgaaaaatg gggcccagag gtgtccgaca atggggggct tacactgcgt 60 aacttctgca actggcagcg gcgtttcaac cagcccagcg accgncaccc agagcactac 120 gncacggcca tcctnctcac cagacagaac tt                               152 <210>20 <211>4180 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>20 gcagctccga gctaggtgct atcgcaaggc cagagcgcac agcccggcgg agagagcaga 60 tccttgctca gatcgagtca aatcgggcca aggcggagga cgaagagtcc aggctcctat 120 tctggacttg ttccccagct ccgggggcgc ttctaggtcc tgcagcagcc agcagtgcgg 180 agccaccaac tcggtgctgg aatgaaaaaa ttcccgcgcg ccagtgcaga atctttctaa 240 gtgacccgga gcttcgggtg ctagctctgc acgaactttc ccatcaaagt gatcgtgaat 300 tttaagcatc aggagcaggc cagcgaagct ctacgcgtct aaacgtctat ccagaccaag 360 agttctctgc ggtgcagggt gcggtgccat gcagccaaaa gtcccttttg gggtcacgca 420 agcagaagcc ctgctccgac atgggggacg tccagcgggc agcgagatct cggggctctc 480 tgtccgcaca catgctgttg ctgctcctcg cttccataac aatgctgcta tgtgcgcggg 540 gcgcacacgg gcgccccacg gaggaagatg aggagctggt cctgccctcg ctggagcgcg 600 ccccgggcca cgattccacc accacacgcc ttcgtctgga cgcctttggc cagcagctac 660 atctgaagtt gcagccggac agcggtttct tggcgcctgg cttcaccctg cagactgtgg 720 ggcgcagtcc cgggtccgag gcacaacatc tggaccccac cggggacctg gctcactgct 780 tctactctgg cacggtgaac ggtgatcccg gctctgccgc agccctcagc ctctgtgaag 840 gtgtgcgtgg tgccttctac ctacaaggag aggagttctt cattcagcca gcgcctggag 900 tggccaccga gcgcctggcc cctgccgtgc ccgaggagga gtcatccgca cggccgcagt 960 tccacatcct gaggcgaagg cggcggggca gtggcggcgc caagtgcggc gtcatggacg 1020 acgagaccct gccaaccagc gactcgcgac ccgagagcca gaacacccgg aaccagtggc 1080 ctgtgcggga ccccacgcct caggacgcgg gaaagccatc aggaccagga agcataagga 1140 agaagcgatt tgtgtccagc ccccgttatg tggaaaccat gctcgtagct gaccagtcca 1200 tggccgactt ccacggcagc ggtctaaagc attaccttct aaccctgttc tcggtggcag 1260 ccaggtttta caagcatccc agcattagga attcaattag cctggtggtg gtgaagatct 1320 tggtcatata cgaggagcag aagggaccag aagttacctc caatgcagct ctcacccttc 1380 ggaatttctg cagctggcag aaacaacaca acagccccag tgaccgggat ccagagcact 1440 atgacactgc aattctgttc accagacagg atttatgtgg ctcccacacg tgtgacactc 1500 tcggaatggc agatgttgga accgtatgtg accccagcag gagctgctca gtcatagaag 1560 atgatggttt gcaagccgcc ttcaccacag cccatgaatt gggccatgtg tttaacatgc 1620 cgcacgatga tgctaagcac tgtgccagct tgaatggtgt gagtggcgat tctcatctga 1680 tggcctcgat gctctccagc ttagaccata gccagccctg gtcaccttgc agtgcctaca 1740 tggtcacgtc cttcctagat aatggacacg gggaatgttt gatggacaag ccccagaatc 1800 caatcaagct cccttctgat cttcccggta ccttgtacga tgccaaccgc cagtgtcagt 1860 ttacattcgg agaggaatcc aagcactgcc ctgatgcagc cagcacatgt actaccctgt 1920 ggtgcactgg cacctccggt ggcttactgg tgtgccaaac aaaacacttc ccttgggcag 1980 atggcaccag ctgtggagaa gggaagtggt gtgtcagtgg caagtgcgtg aacaagacag 2040 acatgaagca ttttgctact cctgttcatg gaagctgggg accatgggga ccgtggggag 2100 actgctcaag aacctgtggt ggtggagttc aatacacaat gagagaatgt gacaacccag 2160 tcccaaagaa cggagggaag tactgtgaag gcaaacgagt ccgctacagg tcctgtaaca 2220 tcgaggactg tccagacaat aacggaaaaa cgttcagaga ggagcagtgc gaggcgcaca 2280 atgagttttc caaagcttcc tttgggaatg agcccactgt agagtggaca cccaagtacg 2340 ccggcgtctc gccaaaggac aggtgcaagc tcacctgtga agccaaaggc attggctact 2400 ttttcgtctt acagcccaag gttgtagatg gcactccctg tagtccagac tctacctctg 2460 tctgtgtgca agggcagtgt gtgaaagctg gctgtgatcg catcatagac tccaaaaaga 2520 agtttgataa gtgtggcgtt tgtggaggaa acggttccac atgcaagaag atgtcaggaa 2580 tagtcactag tacaagacct gggtatcatg acattgtcac aattcctgct ggagccacca 2640 acattgaagt gaaacatcgg aatcaaaggg ggtccagaaa caatggcagc tttctggcta 2700 ttagagccgc tgatggtacc tatattctga atggaaactt cactctgtcc acactagagc 2760 aagacctcac ctacaaaggt actgtcttaa ggtacagtgg ttcctcggct gcgctggaaa 2820 gaatccgcag ctttagtcca ctcaaagaac ccttaaccat ccaggttctt atggtaggcc 2880 atgctctccg acccaaaatt aaattcacct actttatgaa gaagaagaca gagtcattca 2940 acgccattcc cacattttct gagtgggtga ttgaagagtg gggggagtgc tccaagacat 3000 gcggctcagg ttggcagaga agagtagtgc agtgcagaga cattaacgga caccctgctt 3060 ccgaatgtgc aaaggaagtg aagccagcca gtaccagacc ttgtgcagac cttccttgcc 3120 cacactggca ggtgggggat tggtcaccat gttccaaaac ttgcgggaag ggttacaaga 3180 agagaacctt gaaatgtgtg tcccacgatg ggggcgtgtt atcaaatgag agctgtgatc 3240 ctttgaagaa gccaaagcat tacattgact tttgcacact gacacagtgc agttaagagg 3300 cgttagagga caaggtagcg tggggagggg ctgatacact gagtgcaaga gtactggagg 3360 gatccagtga gtcaaaccag taagcagtga ggtgtggcaa ggaggtgtgt gtaggggata 3420 catagcaaag gaggtagatc aggacactac cctgccagtt acattctgat aaggtagtta 3480 atgaggcaca gtagcatctg aaagaccata cagagcacta aggagcccca aagcactatt 3540 agtatctctt ttcttatatc tatcgcccaa ataattttca gagtctggca gaagccctgt 3600 tgcactgtac taactagata cttcttatca caaagattgg gaaaggcaaa gcagaaagat 3660 ggtaagactg ggtttcaaac aaggcttggt ttcaatcact ggaggcaagg aggaggggac 3720 aaacaagatc attattcgaa gtcgctggtt gctgtggttt tacggaaggt tgatgcatca 3780 ttcctatcaa cagtgaaaag ttcagcttgt tcaacgtgac agaaaggctc atctccgtga 3840 aagagctcct gatttcttct tacaccatct cagttcttaa ctatagttca tgttgaggta 3900 gaaacaattc atctatttat aaaatgtaca ttggaaaaaa aaagtgaagt ttatgaggta 3960 cacataaaaa ctgaaggaaa caatgagcaa catgcctcct gctttgcttc ctcctgaggt 4020 aaacctgcct ggggattgag gttgtttaag attatccatg gctcacaaga ggcagtaaaa 4080 taatacatgt tgtgccagag ttagaatggg gtatagagat cagggtccca tgagatgggg 4140 aacatggtga tcactcatct cacatgggag gctgctgcag                       4180 <210>21 <211>9248 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>21 gcagctccga gctaggtgct atcgcaaggc cagagcgcac agcccggcgg agagagcaga 60 tccttgctca gatcgagtca aatcggggcc aaggcggagg acgaagagtc caggctccta 120 ttctggactt gttccccagc tccgggggcg cttctaggtc ctgcagcagc caggagtgcg 180 gagccaccaa ctcggtgctg gaatgaaaaa attcccgcgc gccagtgcag aatctttcta 240 agtgacccgg agcttcgggt gctagctctg cacgaacttt cccatcaaag tgatcgtgaa 300 ttttaagcat caggagcagg ccagcgaagc tctacgcgtc taaacgtcta tccagaccaa 360 gagttctctg cggtgcaggg tgcggtgcca tgcagccaaa agtccctttg gggtcacgca 420 agcagaagcc ctgctccgac atgggggacg tccagcgggc agcgagatct cggggctctc 480 tgtccgcaca catgctgttg ctgctcctcg cttccataac aatgctgcta tgtgcgcggg 540 gcgcacacgg gcgccccacg gaggaagatg aggagctggt cctgccctcg ctggagcgcg 600 ccccgggcca cgattccacc accacacgcc ttcgtctgga cgcctttggc cagcagctac 660 atctgaagtt gcagccggac agcggtttct tggcgcctgg cttcaccctg cagactgtgg 720 ggcgcagtcc cgggtccgag gcacaacatc tggaccccac cggggacctg gctcactgct 780 tctactctgg cacggtgaac ggtgatcccg gctctgccgc agccctcagc ctctgtgaag 840 gtgtgcgtgg tgccttctac ctacaaggag aggagttctt cattcagcca gcgcctggag 900 tggccaccga gcgcctggcc cctgccgtgc ccgaggagga gtcatccgca cggccgcagt 960 tccacatcct gaggcgaagg cggcggggca gtggcggcgc caagtgcggc gtcatggacg 1020 acgagaccct gccaaccagc gactcgcgac ccgagagcca gaacacccgg aaccagtggc 1080 ctgtgcggga ccccacgcct caggacgcgg gaaagccatc aggtataaga gtgaccccca 1140 tctctcagtc tttacgaggc gtgacttggg gtcacactcc agatcgcctc taaatgcgaa 1200 tgactcagac ttgcagtgaa ttgaagttct gggtcgtgac cttcccgctc cccccccccc 1260 aaaaaaagtg tgaccatact ctgctagaac acttatttgc ccgaatagtt aataatttga 1320 gaaagagaga aagaatcgga ggtcctgtag ataagggcta agcgtttcct ccgcgaagcc 1380 aataacccga ctccttacac tggagaatct ctctccatcc ctttaatgcc tttagtgaat 1440 gtatgagttc actttaacta ggttgtagtt tcgcgctgag ttttgtaacg tcagtccgtg 1500 tgagcacgta gcgctcaaag gagggcggag tagaggagcc atggtgacct ggatgtgcgt 1560 tcaggagcct gggcaacggc agtggtgatc tcatttctgt ggccttccgt ctgtcccctt 1620 cccccatttg aaaagctgac cccgatggct ggtggctccg ttgggcccct ctgcagaacc 1680 tgcttgggag gtctttgctt ggttcgcccc gcctccacgc gcctcctacc tcggcctcgt 1740 tgctcgcact ccctctcccg gcagaggttg gactccccag cgctgtggaa tgttagcctg 1800 gactgatcct ccctgctaca cattcgcctg actctgccgt gttcagtctc taccagccag 1860 ttagttcttt ttaatcattc aaatttcttt ttgccctttt ctagatttct ccctcttttc 1920 cgacttgtcc ctaggagctg gtattcatat cctactttac gatttctctg accgctgagt 1980 ctcagcagcc cgaaaaaggc cattttccaa attggcaacc ctggtttgag aaaggaactt 2040 attccccccg gggcactggg agtgagagga ggcaggaaaa cactgctggg cagagtgggt 2100 ggtcctagtg cccggaactg gatcaagcag agaaccccct gggacccctt gaatgagaga 2160 gctgagcctt acagactgag actcctcaag ccccacccct tggctgagct ccccgccctg 2220 ccccatgcct tccacgtgga gctggatgat ctcattcggg atttcagccc tggcttcaat 2280 agtgaaaggg tgactcaggg cgtccgcctg cttctcttgc caagttttta ctacagctgg 2340 gtagaaatga tagccatact gcctcactca ggctgtggag tcttcaaaga ccacaaaaga 2400 aatctgcgga cacatatata gacagtttga tcactctgtt gcttgctttg ttttgttttg 2460 ttttgtctta tttaaagcaa aagaaaaaag acttaaaaat aactcacagt ttttagaaga 2520 tgcaaatatt tgttttattt ttgttccagg tgtatttcag ttttatttac tttgactagg 2580 ttgactttcc taatataccc cgagaaggtc actattagga gaaggactgc ccatgagcaa 2640 acttcctttt ctttttacag gaccaggaag cataaggaag aagcgatttg tgtccagccc 2700 ccgttatgtg gaaaccatgc tcgtggctga ccagtccatg gccgacttcc acggcagcgg 2760 tctaaagcat taccttctaa ccctgttctc ggtggcagcc aggttttaca agcatcccag 2820 cattaggaat tcaattagcc tggtggtggt gaagatcttg gtcatatatg aggagcagaa 2880 gggaccagaa gttacctcca atgcagctct cacccttcgg aatttctgca actggcagaa 2940 acaacacaac agccccagtg accgggatcc agagcactat gacactgcaa ttctgttcac 3000 cagacaggta agacaggagc ttatcaacca tttcatcaac tcaactcgga ggtcagcctt 3060 gtgttggatg ggatgagagg gtgggggtgt ggcggagagg aaacccagaa ggggatgaca 3120 tttgaaatgt aaacaaaata accaattaaa aaaaaaaggc atctcatctg tattgcctca 3180 tttcctttcg gttataggct agctcaatct gtcttgctta tttctatttt aaacttccac 3240 atctcaagtt ctacagttct attttaaaag cattacaggg aatcttgctt agagtcagtc 3300 cttcaagccc agcaataatg aatggacagg cttcaaagtg catgtgaaga cacgcccaac 3360 tgaagagcta agtatcactc tctcctactt aaaagggatt tcccttgcct ctttgtagga 3420 tttatgtggc tcccacacgt gtgacactct cgggatggca gatgttggaa ctgtatgtga 3480 ccccagcagg agctgctcag tcatagaaga tgatggtttg caagccgcct tcaccacagc 3540 ccacgaattg ggtaagtcgg cttcagagta caagttaagc ccaaatgcat ggatacaacc 3600 caataagtca atctgatgtg acgagagaga aaacatctca gactatgttg ctacctcagc 3660 caccagcaat tttagaaggg gtagggtata ttttccacga tttcaagtat ggtcttacta 3720 ggacaggaga aagtggtaca aacatttgaa cgttgacatt tttatacttg ccctgatcaa 3780 agtgagtatg agccccaata caggttgtct aataagagag ccattgagcc tcactcaata 3840 atacagctga atgtccttct tgtctgcttc ccaggccatg tgtttaacat gccgcacgat 3900 gatgctaagc actgtgccag cttgaatggt gtgactggcg attctcatct gatggcctcg 3960 atgctctcca gcttagacca tagccagccc tggtcacctt gcagtgccta catggtcacg 4020 tccttcctag ataatggaca cggtaagatg acagctcctc tttccagatg gtgttcaacc 4080 ttccttgtgt agggctctct ctggctaagt gagctccatg gctcttgctc atttcccctc 4140 cttcagagtt ttctctggca ggatcataag tagtagatct ttacctccat tgcatcctgc 4200 tcccaaagtc cattcattca taaacaataa cttctcgcca ttgtaaaatc agaagtcccc 4260 tattgaggat aacgtctcga taaaaatcta aagttcccta gcattgattt tcccaaaaat 4320 gcatgatttc accaaacatg tattaataat tgcctctttt ttcttttcct tttttttttt 4380 tattatttta ggggaatgtt tgatggacaa gccccagaat ccaatcaagc tcccttctga 4440 tcttcccggt accttgtacg atgccaaccg ccagtgtcag tttacattcg gagaggaatc 4500 caagcactgc cctgatgcag ccagcacatg tactaccctg tggtgcactg gcacctccgg 4560 tggcttactg gtgtgccaaa caaaacactt cccttgggca gatggcacca gctgtggaga 4620 agggaagtgg tgtgtcagtg gcaagtgcgt gaacaagaca gacatgaagc attttgctgt 4680 gagttttccc aatgaaacat atccgtttgc aactcagggt tgagaagggc aaagtgatgg 4740 tttagttcct ttcctagaca aactcctcta cctgtgtcct gtagtgggac tatgagatgg 4800 tagcgtattt tgagaattga ttgtctgttt tacatttttc tctgattccc taaaatgtct 4860 ttatagttct aacactgata tctgtatctc catttagact cctgttcatg gaagctgggg 4920 accatgggga ccgtggggag actgctcaag aacctgtggt ggtggagttc aatacacaat 4980 gagagaatgt gacaacccag tcccaaagaa cggagggaag tactgtgaag gcaaacgagt 5040 ccgctacagg tcctgtaaca tcgaggactg tccagacaat aacggtgagt catactggac 5100 ttcagctctc agaaaccggg caaaggcggc gtgccacaac atgtggttgg aagttggaaa 5160 ctgggaacat catcgccgtc gttctctttt caggaaaaac gttcagagag gagcagtgcg 5220 aggcgcacaa tgagttttcc aaagcttcct ttgggaatga gcccactgta gagtggacac 5280 ccaagtacgc cggcgtctcg ccaaaggaca ggtgcaagct cacctgtgaa gccaaaggca 5340 ttggctactt tttcgtctta cagcccaagg taggtgcttt tacacttgaa tctttgcaaa 5400 ggagcctcag ctgggcttgc tgccatgcca tacaaatgtt tgggctgtct ttacctattg 5460 atctgtgttc cgttttgaat ttggaatact tctaaatgca ggaacaactc cttgctttgg 5520 gatttgttgt tgccttctgt tgggaaggaa gcttaaatct agctagcact taaaagagtc 5580 ttgcatgtgt ttaatattgc ttctctatcc ccaaagaatg gccctttgaa aactcaagag 5640 ccctctctgt ataactaggt ttcacataca aaaattcatg gttagataaa ttatatatta 5700 acatggcacc caggagtttt agaaagtagt ccaaagtact tgttactggg tacctagcag 5760 ccgcacatac gagcacacta actaaggtaa gagtttgaga attaaaaatt catcgttgga 5820 acatgtactt tgaccaaaga gactcgccat ttcttttggt gttttgcaga aaggataaat 5880 cctgctttga agaagaaaat tgaatgaaat ttgcttaagc ttgtcatgta ttcttagcat 5940 tataagatag caaactatat ccaagttgtg gatgaagtat ttagcaagtg atttataaag 6000 taccttcaac tacagcatat tattctaggt actgaccatg gaacaataat cagtgtgaca 6060 gtgaaccctg cttccattga cctaggccag caaatatata aaatcaagac atttataagc 6120 cttacagata gctatatgaa ctgttgaaaa agccaaaatg aaagtgaaca tgtggcacgt 6180 gacaaggaga ctacttgtag cctgggagga gagcattccc agttgccatc acatcagatg 6240 tttaaccacc atggtgcatg ttgtctccac aggttgtaga tggcactccc tgtagtccag 6300 actctacctc tgtctgtgtg caagggcagt gtgtgaaagc tggctgtgat cgcatcatag 6360 actccaaaaa gaagtttgat aagtgtggcg tttgtggagg aaacggttcc acatgcaaga 6420 agatgtcagg aatagtcact agtacaaggt gagtttcaga acgctcactt ctgcagtaga 6480 cacgctgtgt tgctcagttg gtccctagca tctacaagac cttgggttca atccgcatgc 6540 atgtacctgt agtcccagtg tatgggagac agagacaagt gtgacaagac ggtcagatgt 6600 tcaggtcatc tttgctacat agtgactttc agttcacctt ggggaacatg aaaaacctga 6660 ctggaaacac aaacacacac aaaacaatta acccaggtac ttcatgtaat cccagtgttc 6720 agtaggctga cttgggagga tggttgctat aaggcctagg ttagcttggt ctacataatg 6780 agttccagta taacctggcc cacaagtgaa ccctaaagtt aattaatcga cacatgaaac 6840 aaaacacatg ctttggagac cctgtaattt tgatatacga ttttgtagga ctaaggaaaa 6900 gtcacattta aaagaattgc ctatttttaa agcaatgtga ttgattaact cattgaaaga 6960 catatacctg ttttctttgt ccacagacct gggtatcatg acattgtcac aattcctgct 7020 ggagccacca acattgaagt gaaacatcgg aatcaaaggg ggtccagaaa caatggcagc 7080 tttctggcta ttagagccgc tgatggtacc tatattctga atggaaactt cactctgtcc 7140 acactagagc aagacctcac ctacaaaggt actgtcttaa ggtacagtgg ttcctcggct 7200 gcgctggaga gaatccgcag ctttagtcca ctcaaagaac ccttaaccat ccaggttctt 7260 atggtaggcc atgctctccg acccaaaatt aaattcacct actttatgaa gaagaagaca 7320 gagtcattca acgccattcc cacattttct gagtgggtga ttgaagagtg gggggagtgc 7380 tccaagacat gcggctcagg ttggcagaga agagtagtgc agtgcagaga cattaatgga 7440 caccctgctt ccgaatgtgc aaaggaagtg aagccagcca gtaccagacc ttgtgcagac 7500 cttccttgcc cacactggca ggtgggggat tggtcaccat gttccaaaac ttgcgggaag 7560 ggttacaaga agagaacctt gaaatgtgtg tcccacgatg ggggcgtgtt atcaaatgag 7620 agctgtgatc ctttgaagaa gccaaagcat tacattgact tttgcacact gacacagtgc 7680 agttaagagg cgttagagga caaggtagcg tggggagggg ctgatacact gagtgctgga 7740 gggatccagt gagtcaaacc agtaagcagt gaggtgtggc aaggaggtgt gtgtagggga 7800 tacatagcaa aggaggtaga tcaggacact accctgccag ttacattctg ataaggtagt 7860 taatgaggca cagtagcatc tgaaagacca tacagagcac taaggagccc caaagcacta 7920 ttagtatctc ttttcttata tctatcgccc aaataatttt cagagtctgg cagaagccct 7980 gttgcactgt actgactaga tacttcttat cacaaagatt gggaaaggca aagcagaaag 8040 atggtaagac tgggtttcaa acaaggcttg gtttctatca ctggaggcaa ggaggagggg 8100 acaaacaaga tcattattcg aagtcgctgg ttgctgtggt tttacggaag gttgatgcat 8160 cattcctatc aacagtgaaa agttcagctt gttcaacgtg acagaaaggc tcatctccgt 8220 gaaagagctc ctgatttctt cttacaccat ctcagttctt aactataatt catgttgagg 8280 tagaaacaat tcatctattt ataaaatgta cattggaaaa aaaaaagtga agtttatgag 8340 gtacacataa aaactgaagg aaacaatgag caacatgcct cctgctttgc ttcctcctga 8400 ggtaaacctg cctggggatt gaggttgttt aagattatcc atggctcaca agaggcagta 8460 aaataataca tgttgtgcca gagttagaat ggggtataga gatcagggtc ccatgagatg 8520 gggaacatgg tgatcactca tctcacatgg gaggctgctg cagggtagca ggtccactcc 8580 tggcagctgg tccaacagtc gtatcctggt gaatgtctgt tcagctcttc tactgagaga 8640 gaatatgact gtttccatat gtatatgtat atagtaaaat atgttactat gaattgcatg 8700 tactttataa gtattggtgt gtctgttcct tctaagaagg actatagttt ataataaatg 8760 cctataataa catatttatt tttatacatt tatttctaat gataaaacct ttaagttata 8820 tcgcttttgt aaaagtgcat ataaaaatag agtatttata caatatatgt taactagaaa 8880 taataaaaga acacttttga atgtgtatgc ctattttctg gagtgggatt aacttctggg 8940 caagaaatct gatgagacac aaacattgga cttcaagaca gttttaaaat ttgggtaaat 9000 gaactgtatt tcctgtttat agacgtacta ataaaaaaga agttgatgat gtctttagtg 9060 gtaagattgt tactaatgtg gttggcaaat tgctgtaaag agccagatag taagcattta 9120 tggcattgta ggctatcttt cctgccacaa ccatgtgaca gtgagtgctt tgtaggactg 9180 agagcagcca taaatgacat gtaaatgata aactgtggct gtgctttaat aaaactttat 9240 ttacaaaa                                                          9248 <210>22 <211>5722 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>22 ggacgcacag gcattccccg cgcccctcca gccctcgccg ccctcgccac cgctcccggc 60 cgccgcgctc cggtacacac aggatccctg ctgggcacca acagctccac catggggctg 120 gcctggggac taggcgtcct gttcctgatg catgtgtgtg gcaccaaccg cattccagag 180 tctggcggag acaacagcgt gtttgacatc tttgaactca ccggggccgc ccgcaagggg 240 tctgggcgcc gactggtgaa gggccccgac ccttccagcc cagctttccg catcgaggat 300 gccaacctga tcccccctgt gcctgatgac aagttccaag acctggtgga tgctgtgcgg 360 gcagaaaagg gtttcctcct tctggcatcc ctgaggcaga tgaagaagac ccggggcacg 420 ctgctggccc tggagcggaa agaccactct ggccaggtct tcagcgtggt gtccaatggc 480 aaggcgggca ccctggacct cagcctgacc gtccaaggaa agcagcacgt ggtgtctgtg 540 gaagaagctc tcctggcaac cggccagtgg aagagcatca ccctgtttgt gcaggaagac 600 agggcccagc tgtacatcga ctgtgaaaag atggagaatg ctgagttgga cgtccccatc 660 caaagcgtct tcaccagaga cctggccagc atcgccagac tccgcatcgc aaaggggggc 720 gtcaatgaca atttccaggg ggtgctgcag aatgtgaggt ttgtctttgg aaccacacca 780 gaagacatcc tcaggaacaa aggctgctcc agctctacca gtgtcctcct cacccttgac 840 aacaacgtgg tgaatggttc cagccctgcc atccgcacta actacattgg ccacaagaca 900 aaggacttgc aagccatctg cggcatctcc tgtgatgagc tgtccagcat ggtcctggaa 960 ctcaggggcc tgcgcaccat tgtgaccacg ctgcaggaca gcatccgcaa agtgactgaa 1020 gagaacaaag agttggccaa tgagctgagg cggcctcccc tatgctatca caacggagtt 1080 cagtacagaa ataacgagga atggactgtt gatagctgca ctgagtgtca ctgtcagaac 1140 tcagttacca tctgcaaaaa ggtgtcctgc cccatcatgc cctgctccaa tgccacagtt 1200 cctgatggag aatgctgtcc tcgctgttgg cccagcgact ctgcggacga tggctggtct 1260 ccatggtccg agtggacctc ctgttctacg agctgtggca atggaattca gcagcgcggc 1320 cgctcctgcg atagcctcaa caaccgatgt gagggctcct cggtccagac acggacctgc 1380 cacattcagg agtgtgacaa aagatttaaa caggatggtg gctggagcca ctggtccccg 1440 tggtcatctt gttctgtgac atgtggtgat ggtgtgatca caaggatccg gctctgcaac 1500 tctcccagcc cccagatgaa tgggaaaccc tgtgaaggcg aagcgcggga gaccaaagcc 1560 tgcaagaaag acgcctgccc catcaatgga ggctggggtc cttggtcacc atgggacatc 1620 tgttctgtca cctgtggagg aggggtacag aaacgtagtc gtctctgcaa caaccccgca 1680 ccccagtttg gaggcaagga ctgcgttggt gatgtaacag aaaaccagat ctgcaacaag 1740 caggactgtc caattgatgg atgcctgtcc aatccctgct ttgccggcgt gaagtgtact 1800 agctaccctg atggcagctg gaaatgtggt gcttgtcccc ctggttacag tggaaatggc 1860 atccagtgca cagatgttga tgagtgcaaa gaagtgcctg atgcctgctt caaccacaat 1920 ggagagcacc ggtgtgagaa cacggacccc ggctacaact gcctgccctg ccccccacgc 1980 ttcaccggct cacagccctt cggccagggt gtcgaacatg ccacggccaa caaacaggtg 2040 tgcaagcccc gtaacccctg cacggatggg acccacgact gcaacaagaa cgccaagtgc 2100 aactacctgg gccactatag cgaccccatg taccgctgcg agtgcaagcc tggctacgct 2160 ggcaatggca tcatctgcgg ggaggacaca gacctggatg gctggcccaa tgagaacctg 2220 gtgtgcgtgg ccaatgcgac ttaccactgc aaaaaggata attgccccaa ccttcccaac 2280 tcagggcagg aagactatga caaggatgga attggtgatg cctgtgatga tgacgatgac 2340 aatgataaaa ttccagatga cagggacaac tgtccattcc attacaaccc agctcagtat 2400 gactatgaca gagatgatgt gggagaccgc tgtgacaact gtccctacaa ccacaaccca 2460 gatcaggcag acacagacaa caatggggaa ggagacgcct gtgctgcaga cattgatgga 2520 gacggtatcc tcaatgaacg ggacaactgc cagtacgtct acaatgtgga ccagagagac 2580 actgatatgg atggggttgg agatcagtgt gacaattgcc ccttggaaca caatccggat 2640 cagctggact ctgactcaga ccgcattgga gatacctgtg acaacaatca ggatattgat 2700 gaagatggcc accagaacaa tctggacaac tgtccctatg tgcccaatgc caaccaggct 2760 gaccatgaca aagatggcaa gggagatgcc tgtgaccacg atgatgacaa cgatggcatt 2820 cctgatgaca aggacaactg cagactcgtg cccaatcccg accagaagga ctctgacggc 2880 gatggtcgag gtgatgcctg caaagatgat tttgaccatg acagtgtgcc agacatcgat 2940 gacatctgtc ctgagaatgt tgacatcagt gagaccgatt tccgccgatt ccagatgatt 3000 cctctggacc ccaaagggac atcccaaaat gaccctaact gggttgtacg ccatcagggt 3060 aaagaactcg tccagactgt caactgtgat cctggactcg ctgtaggtta tgatgagttt 3120 aatgctgtgg acttcagtgg caccttcttc atcaacaccg aaagggacga tgactatgct 3180 ggatttgtct ttggctacca gtccagcagc cgcttttatg ttgtgatgtg gaagcaagtc 3240 acccagtcct actgggacac caaccccacg agggctcagg gatactcggg cctttctgtg 3300 aaagttgtaa actccaccac agggcctggc gagcacctgc ggaacgccct gtggcacaca 3360 ggaaacaccc ctggccaggt gcgcaccctg tggcatgacc ctcgtcacat aggctggaaa 3420 gatttcaccg cctacagatg gcgtctcagc cacaggccaa agacgggttt cattagagtg 3480 gtgatgtatg aagggaagaa aatcatggct gactcaggac ccatctatga taaaacctat 3540 gctggtggta gactagggtt gtttgtcttc tctcaagaaa tggtgttctt ctctgacctg 3600 aaatacgaat gtagagatcc ctaatcatca aattgttgat tgaaagactg atcataaacc 3660 aatgctggta ttgcaccttc tggaactatg ggcttgagaa aacccccagg atcacttctc 3720 cttggcttcc ttcttttctg tgcttgcatc agtgtggact cctagaacgt gcgacctgcc 3780 tcaagaaaat gcagttttca aaaacagact catcagcatt cagcctccaa tgaataagac 3840 atcttccaag catataaaca attgctttgg tttccttttg aaaaagcatc tacttgcttc 3900 agttgggaag gtgcccattc cactctgcct ttgtcacaga gcagggtgct attgtgaggc 3960 catctctgag cagtggactc aaaagcattt tcaggcatgt cagagaaggg aggactcact 4020 agaattagca aacaaaacca ccctgacatc ctccttcagg aacacgggga gcagaggcca 4080 aagcactaag gggagggcgc atacccgaga cgattgtatg aagaaaatat ggaggaactg 4140 ttacatgttc ggtactaagt cattttcagg ggattgaaag actattgctg gatttcatga 4200 tgctgactgg cgttagctga ttaacccatg taaataggca cttaaataga agcaggaaag 4260 ggagacaaag actggcttct ggacttcctc cctgatcccc acccttactc atcaccttgc 4320 agtggccaga attagggaat cagaatcaaa ccagtgtaag gcagtgctgg ctgccattgc 4380 ctggtcacat tgaaattggt ggcttcattc tagatgtagc ttgtgcagat gtagcaggaa 4440 aataggaaaa cctaccatct cagtgagcac cagctgcctc ccaaaggagg ggcagccgtg 4500 cttatatttt tatggttaca atggcacaaa attattatca acctaactaa aacattcctt 4560 ttctcttttt tccgtaatta ctaggtagtt ttctaattct ctcttttgga agtatgattt 4620 ttttaaagtc tttacgatgt aaaatattta ttttttactt attctggaag atctggctga 4680 aggattattc atggaacagg aagaagcgta aagactatcc atgtcatctt tgttgagagt 4740 cttcgtgact gtaagattgt aaatacagat tatttattaa ctctgttctg cctggaaatt 4800 taggcttcat acggaaagtg tttgagagca agtagttgac atttatcagc aaatctcttg 4860 caagaacagc acaaggaaaa tcagtctaat aagctgctct gccccttgtg ctcagagtgg 4920 atgttatggg attccttttt tctctgtttt atcttttcaa gtggaattag ttggttatcc 4980 atttgcaaat gttttaaatt gcaaagaaag ccatgaggtc ttcaatactg ttttacccca 5040 tcccttgtgc atatttccag ggagaaggaa agcatataca cttttttctt tcatttttcc 5100 aaaagagaaa aaaatgacaa aaggtgaaac ttacatacaa atattacctc atttgttgtg 5160 tgactgagta aagaattttt ggatcaagcg gaaagagttt aagtgtctaa caaacttaaa 5220 gctactgtag tacctaaaaa gtcagtgttg tacatagcat aaaaactctg cagagaagta 5280 ttcccaataa ggaaatagca ttgaaatgtt aaatacaatt tctgaaagtt atgttttttt 5340 tctatcatct ggtataccat tgctttattt ttataaatta ttttctcatt gccattggaa 5400 tagaatattc agattgtgta gatatgctat ttaaataatt tatcaggaaa tactgcctgt 5460 agagttagta tttctatttt tatataatgt ttgcacactg aattgaagaa ttgttggttt 5520 tttctttttt ttgttttttt tttttttttt tttttttttg cttttgacct cccattttta 5580 ctatttgcca ataccttttt ctaggaatgt gctttttttt gtacacattt ttatccattt 5640 tacattctaa agcagtgtaa gttgtatatt actgtttctt atgtacaagg aacaacaata 5700 aatcatatgg aaatttatat tt                                          5722 <210>23 <211>42521 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>23 gatcgttttc cagacatttt tgttctctgt tcatttcctt atcgtattca aaaagttatc 60 acaaatgacc ttctctatct gtctgcgtct cttttaactc tcaccgtttg ggacctttca 120 aatagttttt cgctatcaaa tctaaacatt agttgcgttg actcgacatt tgacccctca 180 ctatcatctc cagttctctt ttttgttaca ctttagcagt ggcagcagag agcaagtagg 240 tggagccaaa gtgtgcgcca ttcatcggga aaaattgtgt tcttcatcaa attttgggca 300 atttactcgg gatttgcgct aatttggaaa caaaaattca aattcctgcc aattgttttg 360 tttgcttttt ttcttttttt tttgctcctc ccatctctca tcaaattgct cttttttcga 420 ttctaacata tcagccatct tcagagtgtg tcactaaccc ccatttttat tcaaggttag 480 tgatatagta tcctaactac agacgtcaca ccatgaggtt gctgctcttc tcggcagccc 540 ttcttctgtg ctccgtccca acgtgggcct tctctctgtc atcattcttc ggaagcgatg 600 ttgcacaagt aagcaagctc tcctatacct agaatcttgt aaattgaaaa ctctaatttc 660 cagaagccat accttcatcc aaactcccca ccggagcgtg acccggcgag ttccagaatg 720 aagagacagg catatcaagt gtacgttgat ggagatgttt ccgttactgt tgacaagtct 780 ggacaaaagg aaaccggcaa ctggggacca tgggtgcccg agaacgagtg ctcacgttcg 840 tgtggtggag gagttcaact cgagaagaga cagtgcaggt tcgtggactt ttcatttttt 900 agggaatttc ctagacgttc taaaagctta ttttcaaaaa ttttggtttc ctgatcttca 960 tgcctttatg aacgtggtga aagatcaacc taggctagcc tgtgacatac attttttgaa 1020 gcagatccaa ctttatcaag agccatcgaa ttctcgtttt aaagtgtttt ttttttctga 1080 taactttttt ctaatagctt tacccatttt tatgtcaaga ctgaaagcaa tgaatcacaa 1140 gaggctatct acgtttgttt ttgaagctct gtaggaatca tcttaaaaaa ttaagtaaag 1200 taatggagat gaaattctaa ttttttaaaa tcataatcat tactttctgt attatcttca 1260 agttcaaact tttcaaacgg ttattctcaa gaaactcaca tagaatttta acaatttcct 1320 ctatctattt cttgcaagca acccaccgaa ctcaaatctt atccaaacta aacttttagt 1380 ggtgactgca ctggagcttc agtccgctac atctcgtgta acttgaacgc atgcgagtct 1440 ggtactgatt tccgtgctga gcaatgctcc aaattcaacg atgaggctct tgatggaaac 1500 taccacaagt ggactccata caagggaaag aacaagtaag ttaactttct tcaagatgtt 1560 tttctaattt tcgagttttc aggtgcgagc tcgtctgtaa gccagaatct ggaaacttct 1620 actacaagtg ggctgataag gttgttgatg gaaccaagtg cgactccaag agcaacgata 1680 tctgtgttga tggggaatgt cttccagttg gatgtgacgg aaagcttgga tcttgtaagt 1740 ttaaaattta attcaaaatc ttcatttcat gccgaatatt tcagctctca aattcgacaa 1800 gtgcggaaag tgcgatggag atggttctac ctgcaagact attgaaggac gtttcgatga 1860 gcgcaatctc tctccaggat accatgatat tatcaaactt ccagaaggag ccaccaacat 1920 taagattcag gaagccagaa agagcaccaa caacttggct ctgaagaacg gttccgatca 1980 cttttatttg aatggaaatg gattgatcca agttgagaag gaggttgaag tcggaggaac 2040 tatcttcgtt tacgatgacg ctgaaccaga aactctcagt gctcaaggac cactctccga 2100 ggagctcacc gttgctcttc tcttcagaaa gggaagccgt gatactgcta tcaagtacga 2160 gttctctatt ccacttgagg aggaagttga ctacatgtac aagtttgaca actggactcc 2220 gtgctctgta tcatgcggaa agggtgttca aacccgtaat ctctactgta ttgatggaaa 2280 gaacaaggga cgcgttgagg atgatctctg cgaggagaac aatgccacaa agccagagtt 2340 cgaaaagagc tgtgaaactg ttgactgtga agccgaatgg ttcactggag actgggaatc 2400 ttgctcatcc acctgcggag atcaaggaca gcaataccgt gtcgtctact gccatcaagt 2460 attcgctaac ggacgtcgtg ttaccgttga ggatggaaac tgcaccgttg agagaccacc 2520 agtaaagcag acttgcaatc ggtaagttga ttttataaat gcataaacaa ctctgtgaat 2580 ctatttgttt atgcgatgct atccatatat attaccagat ggtgttggtg cccaaaactt 2640 ataaacaatt attttctctt tgcagttttg cctgcccaga gtggcaagct ggtccgtggt 2700 cggcttgctc agagaagtgt ggagacgcct tccaatacag atcggtgacc tgccgcagtg 2760 agaaggaagg agaagaggga aaactcttgg ccgctgatgc ttgcccagct gatgagcaag 2820 agaagttcga cacagagaga acttgcaatt tgggaccatg cgagggactt acatttgtca 2880 ctggagaatg gaacttggtt agattttgca aaatatgggg acctggggaa aagcatacta 2940 aataagatca actttatgaa acaaataatt tttagtgcac ccgctgcaac gatactgagg 3000 agactcgtga agtcacctgc aaggactccc aaggaagagc ctatccactc gagaagtgtt 3060 tggttgataa ctccaccgag attccaactg atactaggtg agtcattcca gatatgacat 3120 tgaacttgga ttaatttttt tcttccagat catgcgccac ccaaccacca tgtgagtacg 3180 agtggaccgt cagtgagtgg agcaagtgta ccaccgaatg cggacacgga cacaagactc 3240 gtcgtgttat ctgtgccatc caccaaaacg gaggactcga ggttgttgat gaaggacact 3300 gtcaagctga gaagccagaa ggaaagacta actgcaccaa tgaggagaag tgtactggaa 3360 catggtacac atcttcatgg tccgagtgta ccgctgaatg tggtggtgga tcccaagatc 3420 gtgtcgctgt ttgcttgaac tacgataaga agccagttcc agaatggtgc gacgaagccg 3480 tcaagccatc tgagaaacaa gattgtaacg ttgatgactg cccaacttgc gttgactctg 3540 agttcggatg ctgcccagat aactctactt ttgctaccgg agaattcaac ttcggatgct 3600 ctaactgctc ggaaacagaa ttcggatgct gtgctgacaa tgttaccgtt gccactggac 3660 ctaactccaa gggatgcgaa gaattcgttg agtctccact taaccttgaa gctgatgttg 3720 ccaatgctga cgctgaagct tcaggagatg ctccagaact ctgcagcgtc acaaacgaga 3780 acggagaagc tgttgatgtt gagtgtgcca ccattgctcc aatcactgct cttcttggag 3840 atggggaact tatcggaaat gatactgatg cttccaatga gaccatacac tgctcgaaga 3900 ccgaattcgg atgctgtcca gattggtaca ccgccgcctc tggaaagggt aacgaaggat 3960 gcccatcgtt cactcttgga ggatgtaacg agactcaatt cggatgttgt cacgatgatg 4020 tcactcttgc tcgtggagcc aaccttgaag gatgcggaga gccatcttgc gctgcttccc 4080 tctatggatg ctgtaaagat cgtaagacaa ttgccttcgg accacactat tctggatgtg 4140 agcgatcatc cttcccatgt gagcttagcg acttcggatg ctgcccagat ggtgagactg 4200 ctgctcttgg aaagaatgga accggatgcg gagagaactg cttgaccacc aagttcggat 4260 gctgccctga tggaaagacc accgccaagg ggtcccacaa cgagggatgc ggatgcgagt 4320 tcgcccaata cggatgctgc ccagacggaa aatcagttgc caagggagcc ggattttacg 4380 gatgcccaga aagctgcgcc cagagccagt tcggatgctg cccagacgga aagactcgtg 4440 ctcgcggaga gaacaaggaa ggatgtccat gccagtacac ccgttacgga tgctgcccag 4500 atggggagac tactgctctt ggaccacgca atgatggatg tgataactgc cgctacgcca 4560 agcacggatg ttgcccagat ggagagacca aggctcttgg accagatgga gccggatgcc 4620 caccaactac cacgccacca ttcctcatgg gaggaactgt tgccccacat aaaatcgccg 4680 cctgtaatca gacacaagaa agtggaaccg tctgcggagc cggatacaag cttgtaagta 4740 attaacctca tgaaaaagaa ttggagcaac acatttcatg tataaatatt tcaatttcag 4800 gcatggcatt atgataccac tgagggacgt tgcaaccagt tctggtacgg aggatgcggt 4860 ggaaatgaca acaactttgc tagccaggat atgtgcgaga ctatctgcgt cgaaccacca 4920 ggcaagggaa gatgttacct gccacgtgtt gatggaccac tccggtgtga ccaacttcag 4980 ccaagatact attatgatca ttccaagaag cactgtgtgg ccttctggtg gagaggatgt 5040 ctcggaaatg ccaacaactt caactctttc gaagaatgct ccatgttctg taaggacgtt 5100 ggaccgtacg atgctccaac caccgctgct ccaccaccac caccacagca aaatgctcag 5160 caataccttc caactccaga agttcaacag attgagattc aatctgctga gcaacctcaa 5220 ccacaacagc cacaacaaca gcaacagcaa caacagcaac aaccacagca accacgtcaa 5280 tcaatggaag acatctgcag atcccgccaa gacgccggac catgcgagac ttactccgat 5340 caatggttct acaacgcttt cagccaagaa tgcgaaacct tcacttatgg aggatgtgga 5400 ggaaatctca atcgtttccg cagcaaggat gaatgcgagc agcgttgttt cttcgttcac 5460 ggagctcagc catccgctgc ccggcaggaa caagctcagc cagcagctca accagctcaa 5520 ccagctcagc caagtaacat cgtctctcca ccacaacagt cagctagtcc agttgtggtt 5580 ccatgtaagt tctttagaat gcatttattt cttactataa gtttctataa gttcgcatgt 5640 gaagcatccc catttcagcg aacagcaaac aacgcgatgc ttgccacctc aacgttgacc 5700 aaggacgttg taagggggct tttgactcct ggtactacga agttgccacc ggatcctgcg 5760 tcacattcaa gtacaccgga tgcggaggaa acgccaacag atttgctagc aaggatcagt 5820 gcgagtcact ctgtgtgaag ccagcttctg aagctgcttc agccggaatt ggtatgcttt 5880 gagttataga gaatgttcac tatttttgtt aaatgtttga gtaaatgaga aactggctca 5940 gtttgaaaat gtttgcacca tgtttcaaaa tagtttttga gttgaatagt tgaggccatg 6000 aaaatcttaa ttacactcca gaagtacatt ttaaaacatt tttgagaatt aggtcttcaa 6060 aaaaaggttt aatattgagg tttcaaatta gaaatattaa tatacgggga tttgggttta 6120 aaactgattt ttaaaatctt atttttgaag tttcgctttg atattcgtgc aaaaaaaaaa 6180 ccaacttttt cagacggtgc agctggaatc aactcagttt gtgacgaagc caaggacacc 6240 ggaccgtgca ccaactttgt cacgaaatgg tactacaaca aagccgacgg aacctgcaac 6300 cgattccatt acggtggatg ccaaggaacc aacaatcgat tcgacaacga gcaacagtgc 6360 aaggctgctt gtcaaaatca taaggatgct tgtcaacttc caaaggttca aggaccatgc 6420 tctggaaagc attcctatta ttactacaac actgccagtc atcaatgcga gacgttcact 6480 tatggtggct gcctcggaaa tactaacaga ttcgctacca ttgaggagtg tcaagcgaga 6540 tgcccgagta agttctaagt taatagtgat atatgctttg tttccccttt attctttgac 6600 aattttcaaa tactttttgc ataattacct tatttctatt cccttctgtt tcccattttc 6660 ctccacccgc tacaaattgt ttcccgtact ctctcctttc tcactttccc gtccgaaggg 6720 acacggcaat gctgcctaaa tgaactgcct aataatattt atgaattttc caattttcta 6780 aaaaaaaaca attctctcaa aaaattccct gccgttccgc cactgctttc ttcacccatt 6840 gttgcgctat tttttttaaa taaatgaata aagctgaaat agttaacagt ttctgaaatt 6900 gcatgtaagt ttgtagtgta tcagtgtgtt tgtcgtgaaa gttttttttt acctgcatga 6960 tttcctgaac tgcatgaaac tgttcttatt acgttttaga tttgctgaag tgtgctagaa 7020 gtgtgatttt gtttcagaag acgaccagac tacaacaaca tcacaaccag aagagctccc 7080 aagtttgcca cttgttcaag aagatcctca gccacgaccg gcattttcat tgaagtaagc 7140 acgtgtagtc caagtgccta cttctcgtat gaccaaaaaa tttaatataa ggtttccaag 7200 tattaaggaa tcagtagcat gtaaattgtg tggattgttc tcctgggttg atgggttttt 7260 ttctcactca caatcagata tggagtagct tatatgggaa tttatttgag aaatagaata 7320 tgtcataaca tccaaattta attattaaaa agttgtgaag tttctcatta tgtatataaa 7380 attcgccttt caaataagaa caaaaattaa ctgtatgaaa gagctgaatt caatttgaaa 7440 ttgagaaaat aactggttca aaaagaagaa aaacgttgga aaatctagac gtaaatctat 7500 ggattttctt ttcaggtcgg ggaaatttcg acgattttta tattttcaaa aatcattcac 7560 aaatatacac caaaaattat ttttaccata ataaaatacg gaatttcact ggattactgt 7620 agtattcatg taaggttact gtattgttac tctagggata ctacaagaat atttttgcaa 7680 agttgtaaga agtatagaga ttactgtaga ttgaaaatct agacaaaaat cattttccgt 7740 aataatctgt ggggatagaa tgttgaaggc acaaggctta taaagcacca tgggaaaaaa 7800 ttttaacagt gattttttta agcatatcct ctttcccagg aaatccactt ttcaaatata 7860 ttcccactaa actctttaag acaatccttc gcccatagtc gtcgccgtga tgctccattt 7920 gcacgttccg tatccgcccg tcaccatact cctgattccg aagaggaacg agttgactgt 7980 tatgctgttc cagatccagg atcttgcggg taataaatct cacctatcca ttacaaccat 8040 taccgtctta atgattcaga gactaccgtc ttgtttggca ctactctgcc acgagtaact 8100 catgccgtca attctactat ggtggatgtg ctgggaatac gaatcgcttc gagacccggg 8160 ataaatgtga aacatcgtgt gttgctaaga ttgaagaacg cgtggaaagt gtgtcagaag 8220 cttcaaaatc tctggaagag gttagactaa cggatccaag gatggattct cactttggat 8280 atcatgatcc agaagttgat caaatcgaag aagaagctga atatgtcatt gttgataccg 8340 gagctctacc tgaattatgc atgcttccag aacaaagagg gtcttgttat gataacattt 8400 tgagatggag gtaagtcaaa tcaagaatag aaaattcgaa aatccgaaaa actttataat 8460 tatactaaaa gcaaaatctt aaaatctttc agattcgact ctgaaaagtc tcaatgtgta 8520 accttcatgt attctggatg taatccaaat gcaaatcact tcactagtca ggttagtttc 8580 attattttgt gtcctttcgt ggaactggcc ccttggtttc taacttgatc ttctccttcc 8640 gaatacccaa tttgagcacc gctggctcac tttttcgacg gtgacgttcc tcaattctag 8700 cggcctctgt attttctgag cactcttgag caacagtttc ctcactggaa atgtttgttt 8760 ttcaagaggg agtgagagag agaaataaac gtacaatttt tgaagccgca catgatttgt 8820 tagaagtcga tgccgttctg cagtatcctt catgtttcgt agttgtttct gtagtaattt 8880 ttatggatta ggaactaaga aatcatcact cactgcggta gttgcatttt tgtgcatgca 8940 tcttcccata aaagcaacaa atgcaacaac tgatagagcc gccacacaaa ttgcaataat 9000 tcgaagtcga tttctaattc ctttctttac tttttgtcta tgctcagctg ctttttcgat 9060 gtgcttcttc ttgctggggt cgagctcgca atgaggaaat ggttcgatga gtggaccgtg 9120 ttttttgcat tgttcacaac ggcgtccagt gtatttgtct gggcagtcac acgaaagagt 9180 gcggtttttg aaatctgaaa attttaaatt taagaacagg atctatagca gttttgccca 9240 tcacagtcct atgtctatat taaaaaaaat tatcggacat taaaaaaaat gttttctcat 9300 tttttcagta tttctataaa aactgcattc gcatttaatc ataactttta atcgttaaaa 9360 acttagtctt taagtacctg gggatccgta aacacagaca atttcatcac aataatcgcc 9420 ttcaaatccc acatcacaga tgcatcttcc atttctcaaa aacccctcga cacatttact 9480 tgtatattgg cattcacttc caaaatatga gcccacacat tcacatcggt cccccttcca 9540 ttctcctttg tttccgcact gaaataattc aatagatttt ggaagtttag ggcctcaaaa 9600 atataccttt tccgctggcc gatagtcaca catttcacct ttccatccga cttcgcaaat 9660 gcacggctca ctgaatagaa ggctttccgg gtcgaagcgg aatccgaccg agagtccgtg 9720 aactgtaaat tgaaaatttg taattccaaa aaaaaaacag cttttgcaaa aatcgtccaa 9780 aagaatttta gagttagaca ttatttttct caaaaagttc aaagttgtat cagttttaaa 9840 ataaaatatt taataggatt gtagagcttg ttagaaaaaa taaaagctac ttgaaaaaag 9900 aaaggtatcc aaaaaggtat tgagatagtt tcaagcaact ctatttgtaa actgtcgagt 9960 ttttaagttc tacaaatctc ttataacatc gctacatcta ctatcaaact ttgaaaaaaa 10020 accataccac attcaaaatg ttcacattta tctccagtct gtcccttgat acaatgacaa 10080 atccctccag catagattcc tccattacga cattcggctc tcggatcatc cagagcaaca 10140 ttgtctagaa tacttctctt ttgaagaata cgatgcacgt cgctcaatat attttcatct 10200 agatctagtg agtcatctcg tgattgtgct tttgttgttg ataaaaatag gaagagtaaa 10260 gtggaaaatt gtaaacagta catagcgtta gatactgaca agtctactat caattgattt 10320 atttattgcg tcttgaaagg ggtatcaatg agagaaatag ggagatgggt aaaatgcatt 10380 tataagagaa tacaaaagat gacgtaattg attaatcaga gatcagttga aaatactttt 10440 aagtatcaat tattatctgt gaagacagtc acgtgactct gactcgaact caatttgcat 10500 gttgatagtt ccaatgttaa agaaagtctt tgggttttct ccagatgaaa caaatgattt 10560 tggaatatta aacgtgactc ttctctgaca aggtttgagt ccgtcatcac aatcgtgata 10620 gatattaagt tttggatcaa tagtcatcac ttcggaagtg tgtccggtaa gaaggaattg 10680 accaagagag tctgtagttc cttcggcaag aagatcgtca agatccggtc ctgaaaaaaa 10740 cttttatttt gaaaaatttc aatgagttgc ttcatgttag aatttggaat ttttaaagat 10800 gttagcaatt ggtatttaaa tgttcaagct aacgtaatta gagttattca aacaagcttt 10860 atataaaaac tttgtgtaag attcggtcta attagaacat caatttttaa cgcagctgat 10920 aaaaaacttt aatttcaagc ttcacataat tctacttacc ggtatcatca tcgtagagct 10980 tcaccttcgt gttagccagt ggtttgtctc cacacatcag aacaccctta actccagctg 11040 attgggtgaa tacagcttcg gagccaattg cacaaagtat gaaaagtgat gaaatgcacg 11100 cgagtcgtga cattattttt gtctgaaaat acaaacactg actgatctga ccttcatcgg 11160 agaaactctc ttatagcaca gttggttaga aaaagatacg gagaggagaa gtgggaaatc 11220 gaattgacca aacaaaagaa ctggttttca cttgaaatag aagacgatga aagatataca 11280 acagagaaga tcggaagtga ttcatctgga gaagaaaatt gagaggagca acttcttgta 11340 ttttccactt atttatatac ccaatagaat tcacctgatt ctttccgatt tgtgtacatt 11400 tcgctgacta acgtgtgctt cttcggtttt gtcatttctt attgttcatt gaaaataaac 11460 agaacaaagc aatcataagg tcgaaaatcc catttagaga tcaagaggtg tacctttaat 11520 tgtgcggcat ggcatagttt tatcttgctg aactctcacc aattgatgag tatgtcagta 11580 gaatggattc catccgatcg ttgctccacg gtgatctctt ccgccgcctt ttcatccacc 11640 atacccgttg tgtatggctg gcaactgtga acagcgcctc agtggaatgt ttagtttgat 11700 atacagttta aaataatttt ctaaactaaa gaaatcagtt tttgaaacca gtcttgtagg 11760 catgtcgggc gcaggcacgc taacgtgaaa aatagaattt cgagtggtta actattttat 11820 tttcaattaa aatacaatca actacacaat gaatgacccg gataaatgaa atacaaatac 11880 aagaatttaa aaaaaacatg gaaatttaaa cttttccatc atctcccttt gctggaatat 11940 tatatttcat tcgataagct tccaattcgg cttttctctg atcggatcgt acactgtgtc 12000 tctcatccat ctcttgttga gctgtcattc tcttctcatt ccatttctga gcttttgctt 12060 ttttgtggat tctgttgtat tctttgcact tgcagcagca ataacagaag caggcaatga 12120 gaattacagc aatgattcca gcgcagatgg caataacgat tgcggcggct gatgtgctca 12180 cccagcagac attgtatttg acatgcttga tattacagtc tggatagtac cagtcgaatg 12240 gcatacatct tttcgttttt ccaccacacc agaagcaatt ctgaaaaaat gtgtttttga 12300 aattttcaat atgtttgctt ataaaattga atttaatttt tcaaacagtg tttcagaaac 12360 tcaacttctg aaattaggaa agtattctca attgagagct gtttttgtat taaaagtttc 12420 agtttagaac tacaggtgtg aaaaaatctg agcaagtgaa caccaacgta ttgcatcaca 12480 gtttacgcgt caatttattc gagtgttcat tgtagagaaa gttaggtcac cttccagaaa 12540 attaagaaac ttgtttcaga catttttgct cttttagagg aatttttttt tagaggaaac 12600 acgcaagttt ctttgaaaac aaaaacaaaa tatatttttt atccacttac cgagcccttg 12660 ccaacacatg tttcacaagt gttcaaatcg ttcgatccaa ttctacagta ttcttgtttc 12720 tctgaccatg tcatgttatc cgcacatact gatactagaa caattgagaa aaagagtagt 12780 aatcggtgaa tcatcgttct gaaaaatcaa taaatagtaa caacttgagc aagtctcgta 12840 actgagcgac aaaaccaaag tagtaatgaa atagaaagat agaaaggtaa actcaaaggg 12900 ctcgcgtgtg tttgtctatc gagtgccaat gagttttagg agtagcgaca gaaataagtt 12960 ggcagaagaa gaacatacga actatgtcgg gctacaagat tcttgtgttt actttttgaa 13020 aaagaaaatg catttgagaa aatgcaaatg ttcggcagaa atcgaatgga gtttagagca 13080 gaatggtaaa aataaaggtg gatcagcaaa aatagttgaa caaatatttt gtagatttca 13140 tgaaagataa caaaaaaaaa taaatacaga aaacaatata tgacgtattt ttcaatcatt 13200 gtttttgtat agtgcaaatt cagtagttgt acctgttata agtacagcga agttatacat 13260 tttagagtgg gtcttgtcac gatccatatt ttttgaacgc aatatttgaa atccaaaaaa 13320 aaataaagaa actaggcgcc aagaagctat agtagctata cgcataaatt gtgaatacct 13380 tgaattacat taaattccaa caaaatagga aaatcatata aaaacgaagt tagttgtcaa 13440 ttcaaaaacg tttttaaaat tgttcataag cgccgagctg tccccctcag ttttcgttta 13500 ttcagctttt ctctctctct ctattctcta tcgtcaccta tatttcatag tccccttatc 13560 caaaagtgga agtgaatgag gatggaaata tgataccgca tgcttcaaaa aaatttgctt 13620 atgagaaacc aacatttgaa aatttccagg aaacttgtga acgagcctgt ggtaaatgga 13680 gaaatgtggc agtgtgcgag ttgccggccg aacacggaga ttgccaactt gcgattccca 13740 ggtatgtact gttgacacat tttacaaatg ggatgggaag tggtcggtga tcaggtggaa 13800 atgttgatgg caaggtttta aatagatgta gtaactgaaa acaaaatgac agatgtacat 13860 acataaatta ggattaaaac aaaaatacta tgcggagtca ggtgactaat ttttctggaa 13920 attccagaat ttgaaaatgt ttttctctgt ttgaaagtag aacgggacct tttacaaaat 13980 aggctgaggt aggtaggctg tagaaagtgc ctttggtgtc tttgtaattt ttgttttcaa 14040 aaaatcactt gtaagcacat gaaaatcaca tgaataatga tgtaaaattt agaaaattag 14100 tataaagaag atttacattt taataataat aattccagat ggtaccatga cccaaaaaca 14160 tcccaatgtc aaatgatgat gtggactgga tgcggaggaa atggaaacgc gttctcttca 14220 aaagcagact gtgaatctct ttgccgagtt gagacattat ggtccaacaa cactgacttc 14280 tgtacattgg aacgatcggc cggtccatgt acagattcta tttcaatgtg gtatttcgat 14340 tcaactcatc tcgattgtaa gccattcact tatggaggtt gccgtggaaa tcagaatcga 14400 ttcgttagca aagagcaatg tcagcagagc tgccgtcctg gagacacaaa atctgaggat 14460 atctgcacac tccgcccaga gccgggaccg tgtcggctgg gactcgagaa atacttttac 14520 gacccggtga tccaatcctg tcatatgttc cattatggag gttgtgaggg aaatgcaaac 14580 cggttcgatt cagagttgga ctgcttccga cgatgctcga gtgtcaaggt tgaagcaagt 14640 gaaagcgaga gagtgggaca gctgacgtct gcatccacgc cagttattta tattgttaac 14700 aaaacagcga tttttgttgg aaatactgta agttattaat tttaattcga agatttctta 14760 atatttaaac tggtcccatg agagtttggt tcattttccg acaatagact gcaaaattga 14820 taacttttca tgaacacttt agccgatttt agctagtttt gtttattaaa atttggtaat 14880 tcaaaataaa aaccttacgc cactccactt ttgaatactt gtcaaataca ttttttcagt 14940 tccgaatccg atgcaacagt tacggagtgc ttccaataac atggtacaag aacggaggtc 15000 tcctccagtt cggctcgcga atcactgaag agaatgatga cactttggaa attgtggatg 15060 ctttaactgc tgacgccggt gtctacactt gcattgccgg ccaggatagt acaatgagcg 15120 agggagtcga ggttgtgatc aagagacttc ctggtcacag aactacatct cgtccaatgc 15180 tgacaccatc caagaacttc tccttgggaa ccccaccgac accatctcca tctacagttt 15240 ctacaacacc cttccgaatc tatacgcctg gatctgctcc atctgatgct cgtgtaagcc 15300 gcccgacaag caattcctgt atggatgtgg gtaacgcgag cacgtgcgat ttgatcgtga 15360 agaacggttt gtgcgggaag aagcgatatg gaacattctg ctgtcacact tgcacccggg 15420 ttcataattt taaattttaa gtttggattt tttgatttca aattttcatt aatcttttaa 15480 tgttttctcc ttcataatat ctccattgcg agatctcttt ttcccttctc ttcctatact 15540 ttcccctcag acaattggct aattactcgt tcgttccagt aaataaatat gaatttattt 15600 cttcttccta tactttggta tacataatca tggcatgaaa tacaagacaa aaaaaacaag 15660 aaaaaacaat ccacttgaaa tccattcagg tgtgaactaa catcttactc tattaacttc 15720 gtgccattac ttccacttat tttgcctatt cactaatgaa gtctctgaga attattttct 15780 gtctaactct gctgattgca agcttcccag ctcagcggag ccgccgaaaa cagaaatttg 15840 tacgccttcc tagtgggttc acgtttcctg cggatgcggc gagtaatttt caaagagatg 15900 cgtatattcc agcgacggta aattttcgct ttttgttaaa tgaatttcag gcttcaaatt 15960 attttctagg acaaaaattt aaagtaggct tgcgcatact catttccctg ccttacctgc 16020 caacaggcta gcttttggag agaaatcaaa agtttggtgt ctgtaaatct aagctttccg 16080 aagcgtccga aagtttttgg gaatccgcta tacactttaa gattgataaa tatttgaatc 16140 aggtttattt tgcactatta aggcgtgtag gcactaggcc ggcaaagctc gcctacgggg 16200 agccttacaa tcaagtatta ttcatgaagg tcttgatttg gttacagaat tccatctaaa 16260 attacttata caaaaacatg aaaaatttca gtttgccccg ccatctgaga agattcttca 16320 agctccacca cgctatttaa ctggagaaca caatccagct tatggtaggc ccaatttttt 16380 atctgatttt ctaaatttaa cttcaagctc acaataccga tgtgcaagga atgaactacg 16440 ctgagtacaa gcaagcgatg gccccacaac cacatccagt cgatgcttat tctccaccac 16500 ctcctgcacc aatggtccca ccggttactg tagttgaacc acctgcaatg ccgtatgaaa 16560 tgactacgat tgcatctgtt ggaccactta ctactcccgc atcagtcggc ttgaagaagg 16620 gaaagtttgt gattttagtt aattgatctt tcaagtaatt ggatacaatt tccagcatcg 16680 gaggaattgc tcaaaacttg aacgacaggt acaccagctt aacaccagaa gctcaacgtg 16740 ctcagaaagg tcatacctat acggctctgg gcggtggaca attctatcaa agtttacttg 16800 gaggggtaag atgcaaggtt agaacttaca aactcaattc attttacaga aaggaggccc 16860 cggaggattc tccccactct cgttctttct aaacggcggt ctaggaggta ctggtggtgg 16920 tggtaacaat ggattcttcg ttccggtgcc tgtagtcatt ccgcctccac cgccaccgcc 16980 accaggacca aactgtttca cgaacccgtc gggattcctt tgctgtaacg tgacacttga 17040 gaaaactatg gaagacgcgt acctggccgc aaaagcagat ggtgcatcac tgtgcaatgt 17100 acagaaaatg gcaactgcag tgcaagcggt ggggtttatg gatttcattt tataatgtaa 17160 tgtgctcttc cctagaattg aataagctta caacttgaat tacgacttga attacaactt 17220 gaataagctt aaaatatcca ccaaatttca gcaagccgaa aaaaaattcg gaacaacttt 17280 cgaatcagtc gctgctcatt cggacttcgt cgcaaaaatt aattttgccg gtgacctgaa 17340 ctgtaaaata gaaatcgatg ggaaattcat actagcgtac gcaactccaa tcgccgagca 17400 agaggtgaac attgtcgatg ctagctcatt cttctcggga gctgctgata aggatttgga 17460 tggtgtcaat ggtaccaagc ccacctacat tgtctacggt cccattaaat aatggagggt 17520 ctagctttaa agatttctgt atattaaagc tgaaatgtga attaattgtt tatttgccaa 17580 tcacaataaa gttggaaata tcatttgaat agttcgaaag ttttcaatcg gaatgggaga 17640 aaattcgaaa atttaggtgg aggtgaaaag ttgatgaagt aacacaatta actgtgctcg 17700 aatcctgaat agaaggagaa aagagcctat aaacagattt tcaatttaca catattacac 17760 aacaattcag gaagaagaca gtagttgcaa aagaaaatac gtagaaaaaa gagtgaagga 17820 ctggcgggat gtcagtttgg atgtacaaat agaactcctg aagcataaga aacagaagaa 17880 tcgaccgatg atcgaacctg aaatggattt attgttgatt gaaaaatatt aagcaattct 17940 gaatctctac cttgtttgat tgtgtgtaat gcaagaatct aaactcgtga gtgtgattgt 18000 tactgatccg gaaatgttcg gctgcttgca gcattatcaa tatcggatta cgcccacaaa 18060 tcgtgttctg ggtctttttg aggtagtcat taaaagctgc cggattaagc gtctcaattg 18120 cgctcattcc ctgcttatcc atattggtta tctgctcata aatcggaata gaactatgac 18180 gatcgtacgg agaaaagctg aagcgttctc cccaatggca aaagtccgaa gagatcacaa 18240 acaagtttct tggatcctcc atgtaatgag caaaaatatt tccatacgtt tgctgcctag 18300 atcctggtaa agatccaaca agtaccggaa caatggtgta acgttttgaa cccataacct 18360 ttgcaataaa tgggagttgc atttcaatac tatgctctga ttcttcatct cggcgatcca 18420 tcaaatcgaa atgacgagtg gcacgaagct cctcgttaac tgcaaagggc aatgttgtaa 18480 aagatgtact aagagtgcaa tagattactt ttgtgatcaa cgatcaagtc gccgagtgga 18540 gttctgtact tgctgcatgt ggttatagca catccattta gagcaacaac gtgagatggg 18600 ccaagaatga agactctttc actgaaagtt attgagtaag ccctgttgcc aagtacaaat 18660 ttcaacaact cacactgctg atgaaacaac ttgtttgaaa gcatatgcag ctgtttctcc 18720 acaatacgaa tatcccgcat gtctgaaagt tatcagaaaa taaatattaa atgcatttag 18780 agtattacgg tgaaatcaac gctcgagccg ttccaatccg tggaccggcg ttgtcaagcc 18840 attttgtgag ttgccgatca agatctcgct ggttggcgtt gtaccatgat ccggcatgtg 18900 aggcagatct cgtgtgctcg ccgaatccgt ttagtgacat tttaaattca gatggtctga 18960 atattaaagt tttgataaat tgttgtatac gacttgatta atatgtttag tagggttttc 19020 aactactgtg tgtttcccaa atagtcaaca ttgaaaaatg gaaaagtttg aatttaaata 19080 ttcaaataat tttaattaat taatattaaa attcacaata cagtgtaaca tcacacttaa 19140 ttcaagatgt tctaaaaata tgagccatcg ggctagctct acttcacgaa ttcgaatcaa 19200 gtccggggaa ctggctcgaa agaaaataaa tttttaattt ggtttatgtc cgaaatagaa 19260 atgggaatct ggtttttcat tctgaataat ttccgagaaa cacttacaaa ataaaattca 19320 gatatcttgc aaaaggaagg ccaaatgtcc tgagaaatag agcacgagag ttttgaaata 19380 cctgcaacaa caggatttgc ttctattttg ttttttgaac tgaattttaa actattatct 19440 attctgaaaa cattttttgt ccaaaaaaaa tcaagaacaa tttagagcaa aatgtggcaa 19500 tccgaaaatg ttgatgcaac aaaaaagtgt tttttttttc attgaatttc agttttgaaa 19560 actgatttct ttccaaaaaa aaaacgaagg aaaattttga gaaaaaagtg aaaatccaaa 19620 aatgctgatt ttggtttttt tttcaaaaaa aaagcatttt gcaaagtgtg tgcttttttt 19680 cgaaagtttc agaaccttga gacaaaaaac caaaattgtg ttcccgagtg aagcccgcca 19740 cgtggacatg gtcagacgaa tcttgttcgt gttcgcagcc aattttcatt tttgctgaac 19800 gcataattgt tcaaagaaga ttcggtctaa aaagacgaaa ttgaaataga ttgtggaatc 19860 ctttgaaatt ttcttttgac aaaaggtcac cgttattcaa aaattgagat ggtctcgtga 19920 ctaaaattaa acaatcaaga taatcatgat tgtgggcctg ttttaaaata cacttttcaa 19980 aaacgaaatg taggctccaa tccaaactgc gcatcaagac caagaatata aaatttttaa 20040 actcgggaga cgtagagaaa ctttgaatat taaacatcgc cgtcaagttt ccgtcagagc 20100 gcgcctgaaa ttttttagag gcttctttca aaaagctacc catacaaata atcataagaa 20160 aaacgtttta aaactttgca ttccacccaa aaatgtctga aattacccgt aaaaagaatg 20220 tgtgaaggga gtgatttgag ggttctgtca aacagtttga ctgtttcgcg ttcgacgtgt 20280 ctcgacgtgg atggtattga agaggaccgc gctgatcttg tgctggtcgt cgtcgtcttg 20340 tcggaccgcc gcgagtagtc ttcagtctac caattacctg aaaatttgac actttttgtg 20400 atgtgaaact ggctgcctga agcaatgcca tataataatc ataataataa taatgaagag 20460 ggatgaggat gcatgccaaa agaatgaaag gaaagacgct cttctacaac accagccgat 20520 agtatttaga agaaaaagaa gactaaaaag agagtattgg gtgatgggag aaagaacaca 20580 ataggggagg cagtgaaata gaacgagaac aatggaatcg gcagacattt gacactagag 20640 gggccactgt ttcagtcttt ttcgcacttg aatattggaa gagggccaag aaggggagtt 20700 ccaagaatgg aaaaagtggt aggtttgtag aaaatctgcc tttttttttt taaaatttcg 20760 tgttcactac tttatttcgt gttcactcgt ttatgtcttc cattataggc aggcaaagtt 20820 tcatgcctac atacctgcct catgcctatt tgactttcaa tataaaactt gatttttggc 20880 attcttcatt ttataacaat tgtaactaat aataagcttt gcaaagtttt ctgaaagaaa 20940 ttgtctaaat tttcctggta cactgaacat ttttcggtat aaaatctatg cgtatcaagc 21000 ctatttctaa gagccgtaag tattttcagc tgaaaatgta aaccacggag tcaatattta 21060 cttcgtatca tccatcttcc attccgtctt gtttacacct acggcaggta tttagacacg 21120 aatgattgtt tttctcgttg cctaatactt tttcccccga aatattccca tattccagtt 21180 ctgaacaatg cacttttcag cggtcatcgg gtccatccag ccctcattca gccctttcat 21240 ttatcttcgt ttctactttt agacgaaaat gcaaaaaaaa gagaaaaaga cactctcttt 21300 tgacgctcac attcgctcac attgctgtgg tagaaaaaca ctcactcggt ggctgctggg 21360 aagggaaaac gagaaaatgt ttggtcacgc aatacgccta tatctttgat ttgactttga 21420 atctttatac atttttcacg gggttcaaaa acaattatga agaaaattgt ttgattaaat 21480 tagaatgtag attctttata ttttcaatca aaaattaatt ttggaaaaat aactatccaa 21540 aaaacgaaaa aagtaataaa tgagtacttg aaagtgaaat ggggcaatta aacaagataa 21600 aaaagactaa aacgtgagac atctcacaac gggtcacggg caagaagtac acgagaaatc 21660 gaacgtgagt ggggaggcag agacactcag ctgactgcct ggcctgacgc tcgctcacaa 21720 aacgctctca ctctcttcct cgctttgccc gctctccgcc ccgggtcgtc agttcggtcg 21780 atccatgttt gttcattttt ataggtgaaa atttatgtaa gggaacggaa aatgtaaagt 21840 gatcgtggga aaatagaaaa acaattacat tgtaactttt ctggaccaag ttgtacccag 21900 atgcaatatg tatatttttc tcagaaaata ctgtgttggg tttcgacagg atcgatttat 21960 caaaagcaaa cgagtgtgcg tctcaacgag cactaaagtt cccaactaga gcatccttgt 22020 tgtggtagaa ctacatagaa atttttaatt ttgatttcaa tagcttttct cttgttttct 22080 caaaatttat tgaaaaactt atttactata aaacgaccaa cgacggatct ggaaactaca 22140 gtactcctta atgcaaaagg caacgaaaaa tcagccagtg acttattttt tgttctggat 22200 aaaaatcggg aatatttgca ttttgaattc gcactgtatc gataaacaaa acaccgaaga 22260 tcacgccaaa atgactattg taactaacag gtacgagaaa gggacgcttg ttctacaaaa 22320 ataattcaac aaattttccc caaaaaaatg tgaagtccgc aattctcgta gttttacgta 22380 aatcaaaccg agcatgacac tctgacacca cgtgcgcctg aagatgtgcc tgcctaccat 22440 ggatgcttta catttgctag ttccatgaca ccccatcctt tcagcttcca agatgaagga 22500 gttcggagaa aattcgaaaa aatattgaga aaaataaccc aaaacattct gaaacattgc 22560 ggaaaaaagt tagaaattat gtcgaatata tctgaaccaa tcaacaattt caaataaaat 22620 acaaaaaaaa attggaagac cttaaatagt ctccgcccat attttggctt caaatgaccg 22680 tacttcggaa tatggccgat ggccgtggca agacctccaa tcgtagtttt gagcggtcag 22740 taagtgaaga ttaaaatagg aacagtaccg taagatcagc ccaggtgcgg atgtgggata 22800 gaggaactga aaataatcga agaagcatga taactaagcc acgtggccac gttcgttttt 22860 gcgatgttaa tagatcgcca cttcgtccat tgtcgttttg tttgtactaa gtctccttag 22920 caattctctc gaaggcgggc cattgctatt agtaaaataa gctaccaatt ttacctttca 22980 atacattcat tcactgatgg ttttcctatc aggtgatcat ttttttgttc ttctcaatta 23040 cactatctaa aaatgatgaa gtttttgctt cgcggctatt tggttgaagt gatgatatat 23100 ccattgattg tcgtctccac ttgtgctctt tttacgtctt acaacttctt tttaagtgtt 23160 ttgcgtattc actgtttcat ttattttttg cagaaaatga gcctgttcag caaatttttc 23220 ggaggcatga tgcaagaagc tccgattact ccacaagaat ctattcaaaa acttcgggaa 23280 acagaagata ttcttgagaa gaaacaagaa ttcttggaga aaaaaattga cgacgtaagt 23340 tggaagatca gttttggtcg aattaatcac attaaaaagt gctgaaatcg aaatttttaa 23400 actctcgagt ctcaagtgac tgtgacgtaa ttaaaacatt gctcagcatt tacattgttt 23460 actgacgtct tttcgaagtt tagtcgagca aatccaaaaa agagcaataa aaatttctgc 23520 tacgatacgt ttgggaaatt ggaatcatag ttttttaaac tccatttttc aaaaaataca 23580 ttattagaaa atcagtaagt ttcggaaatt atttgagaaa cgtttcagga aagcaaaatg 23640 ccgtgaagta tggaacaaaa aacaagcgga tggctctcca gtgtttgagt aggaagaaag 23700 ctttcgagaa gcagttgatc catattgacg gagttttggc tactctcgaa catcaggttg 23760 gtatataaaa atattagaga aataaattga ataacacggt ttttcttcca gagagaaacc 23820 ctcgaaaatg cttcaacgaa tgctgaagtt ctcacggtta tgaaacttgc tagcgatgcg 23880 ttgaaagcgg ttcataataa catggatagc gaccaagttc gtgatatgat ggataacata 23940 gatgaacaac gagaagtggc gaaggaaatc gcggatgcta tttcaaaccc tggctttaac 24000 aacgcaattg acgaggccga tttgctgcgc gagttggtgg atcttgaaca ggttcgtcta 24060 taccaccaac atcgtgtaat tattagaaaa tataccagga agcacttgac aaagatttgc 24120 ttgatgcgag agctccccca gtcacgcttc cggatactcc caatattgca cttccagcct 24180 ccagaccgag agctaaagaa gctgacaagg atctagaaga cctcgaaagt tgggcaaact 24240 aacttctcta agtcactttc atatttaatt ttcggctatt tttgtttcat ttgcatcccc 24300 ttcatcaatc ctaccattct ccggagattc tcctaaatca actttctaat tacgacaaat 24360 tcaaatagtt gaatgatttc tgtttagcca tttcattcga aacaaatttc cccaaggcta 24420 cgatcaacac tcatcaaaat tgtaacatat tatcgagctt tttggaaatt tgtcatttta 24480 tacatcttgg tccctttctc caaaatcttc caagcatgca ttaaagttcc aacttttatt 24540 aaaaattcat tctggcaaac atgttatttg taccggttga aaacgaaaac caagcgagaa 24600 atagttacat ctcagatctc cctaacgatg gctcaacccc tttgacgctc atttactaat 24660 gtttatactt ttgctcattt actaatgaat ggctcattta ctaacttgct gagatttttt 24720 aatttactac tgctaattgt aagatatata tcatttatca tttactatat ataaagcgct 24780 tattccgttt gtccatagtt tgtagtctat gtagtctttg tagtctgtga cgttttggct 24840 tctggaagga tagtgagttg ggcttagtgt agggatatag ggggtactgt agtggtacaa 24900 tagtggtacg gtaggagtac tgtatgatta cggtagtttc agaaaaatta gttttcagct 24960 ccagaagtcg ggggccgcgc cggaggtgcg gtccacggct ggttttacat aaggtagttc 25020 caaaaaatgt cctacttcca attactcata actcagttag cgcgctatag ctatagcgtt 25080 tgagtttaaa aaaattgtgg ccaactgaaa tgctgtttgt cagagatgcg agctctaaaa 25140 gatgatcgaa atattctatt tctgcggatc tagaatattt cgatcatctt ttggagctga 25200 catctccgca atcgctaaag ataactaaaa ggtaccaatt aacaaaatgt gttttacaat 25260 attgccaaca acattttagg tttctttcgc tgattgtttc cttttggttt tggtgatggt 25320 cccggagtgg tttttttcgc tggttctact attttttgga tcggcaggct ctgaacaatt 25380 ggttgtacaa tcttcttcaa cttcatcaaa ttatccagag ttatgttgtc gcttctgctg 25440 tccaacatat tcatgcattt gacggaactc ttcaactttc tgcattgtca ctggattctt 25500 ctttttcgat tttattttat gaaaacttta ctatcataaa caatagtatt tatcatgtta 25560 caaatcagtt tggaatgatc tccttcattc aaaattctta atgatcagtc gattcactct 25620 tagagccacg aaaaatgtgg gacaattgtt tgagaagtga aaaatagtta ttaatgttgc 25680 aattagttgt acatataagt aatacatgaa aatacatctt aaaaatacag ttactactag 25740 gtattattgc ttaaaattgt gttccaatct gccagtacta tgagcgtaat tcgttgatcc 25800 aatcttcgaa tagccgtgag cacaggcttc gccggcactg cacacaaact tcacgattgc 25860 acgatttgca gaggtagagg acgaacgact ttcctgtaat tggcgaaata ttgttttaag 25920  ataaagttag taggaacgat cgtactgttt ttagaacgag actgtctagc tggtggccgc 25980 atcgagcatt gatggcatcc aagaccttga acttcttcgc tgaatgatat acgatgcttg 26040 aatatggatc cactgaaaat tgaggttata gtagattatt gggagctatt atgatttcac 26100                                         ccatgaagaa ctgcgtcagt aactcgtttc agattctcgc tatccttttc accgcttttt 26160 cgttgtaatt ctatgagaaa acggtagaat ttggtgacat ttgtcgagtt aaacaattcc 26220 acgaggcaga caaacatctg aaatttgcgt tttttccaca aatgcataaa ctttcaataa 26280 aacaaaccgc ttctagggca acatcagcta aactgtgatc atgctcgtat tcggcgttta 26340 gcgagaagca taaatggtag aataaatgaa agatatcggt aggttcgcgg gaatccggat 26400 tgtagtcttt gagataatca acgcaatttt gtttcagatt cgtcatcagg tatttgtcgc 26460 atagcctgag aactgtgcac acgttttgtt ctgaaaataa atttggcatt cattgaaact 26520 acatcgatca tgaactacca tcaataacat ccggatataa accaagagaa ttgggagaaa 26580 tgacagtgat caacttgaga atatcttccg gtgactcatc aaggatattc agctgcttta 26640 tggcgccttc aaggaaaaac ttgttctcca tcaagatgcg gaaataatcc gaatttcttg 26700 caaagattgc tggatccaca aagtactttt gattaccaac aataataggc cagtttcgaa 26760 gcttgcttgt cgactcaaaa tcgacctgaa agaaaaatcg aaaaattcca atttaaaaaa 26820 cgtttgttta cgtaatcgga tccttctagg aaggtttcat gacttgttgt cggctgcatt 26880 agaatgacgt ttacggggaa atcattattt attccgaaac gtgcttgggc ttgttctgtt 26940 tgctgaaatt ttgaaaggtt ctccgaatat taagcgaaaa aaacttacat taataatata 27000 aggtctcata gcgccgagta gctaaacaat taatatttga ttacaagttt ggaaagatct 27060 ttctgagctc gatcaggaag aaaaacttct tgaaacttta gaagatgaaa tgtgtgctac 27120 cgtataaact ttaaaggtgc atgaataaat ttctcctttt ggtcctgcga cgattaaact 27180 ttttaatcaa ttctctgggc tagtttttat tcaataacta gaaatgttgt ttatttttgt 27240 tccctactta aatcatatgt tattttcttt ttcctttgtg tcttacaggc ttttttagct 27300 gaagaaatag caattttccg ataaaatttg ttgctctatg ttaaaggcgc atgcatttat 27360 ttgagagacg ggtctcgcaa cgtgctcact cctcggcccg atttgttctt cgtttgcgcg 27420 gttttcaggc ctttaaaaga tagttccgtc gtttttttct caatttctgc tgaaataagg 27480 tttaattaaa tttattttca aaatcttggt aaacatttaa actcatatat tcagaatttt 27540 cattcctctt tcacccagaa aaccgaattt caatattaag attaagaaca catctagaac 27600 atgcaaaaaa cacaattgct atctctctac tttcatttta aggctgattt tttgaagaaa 27660 aatcatgaaa tacgtccatt attgttgtat cccttgtttg catccaaagt tgactcgatt 27720 gatctcttaa atgtggtatt ccgttcgaaa ttcgattgat ttttagaagt taacacattc 27780 ggaatgatga taattcgtat caaaccaaaa ttgtcttctt ttcgcctttt ttgtgcagtg 27840 tcagcattaa acaaaacgag aatattgaaa gttacgtggc gtttgcatct ctcaccacga 27900 tgacatcacg aaatgcagac gacaaagacc ggtgaaaaat agtgcgctga atggtgaaaa 27960 cttgcgaaga taacgtgtta cgggttgaga gagaaaacat tccgcgagac aatgcttttg 28020 gtgagaggcg cagatggttc agagaacact agagaaaacc gcgcctctgt ccgctcacag 28080 ccagccccat caagcctctt cgggcatcga cgcatagaca cacatcattt tgccccaatt 28140 tcctttcatt ccgtcaagta tttcgcaact aatcgttatt gctcattaca atacacattt 28200 tacagaagtt cctcttcttc tacttggtcc gaccgcatca gataactggg agatccagtt 28260 gtgcatgttc ttgtgcccac acaaactcgc gcccatttac aattttatga tcgacaaccc 28320 tcaagaaggt aagcatttaa acgtgttggc cgtgcgtctc aaaaaattgt taaaaaacct 28380 ggcgacacgc gtttttccac aatttcattc cctagggcat tttgtatttg aagtaattct 28440 attacgcgta cgcaatcgga cgaatcctgc aggtttgttg gtagtcaatt ttatcaagtc 28500 gactgcctct tatgctttct gaaaaaagag aatgacagtt ttcgctaagt agtactaaag 28560 cgatctttta tctttggcaa aaccttgata taagcattat cacagcatat catgcagatt 28620 gatttagagt taagcatgaa atgtgcaagg ctaaaataaa ttacaaaata agtccatagt 28680 ccattttagt aacagtatac atcagctgat agaatcacat gcgtaatgac aggtctaaaa 28740 cattatcaaa caaaagacat tacaaaaaca agaaaaatac aatataatag aacgactatt 28800 tgaaatgagc gtagttaaat tcggaacttc aatagattat catacgcgct tttaaaaaaa 28860 tgtgtgttcc cttttctccg cgtttgcccg ctacaaaccg gtgagtcgga aggcataatc 28920 gggttgaaaa aaaagtatca aacactgatg gtgtcttttt tagggaggtt gtccagaaag 28980 agaaagaaac tgaagatttg cgaatcgata gcgtcgtcat ctctcgacgc cagtgaagtc 29040  aagatcggtt acaatagtgt atgcgattcc caaaatccac atatcaaccg gactcgtgat 29100 atttatcatt tgtaagtact aacaagagat gtgaacgtat ttacactcaa cattagcaaa 29160 ttccagaaga agatctaaac aaaaactatc gaaatggctc tcaacgtgaa ccgcgctgtc 29220 gctgatccat tctaccgcta caagatgccc aagctgtcag caaaagtcga aggcaaagga 29280 aacggaatca aaacggtcat ttccaacatg tctgagatcg cgaaagctct cgagcgtccg 29340 ccgatgtgta tgtttatcgc cagttggctc gccattggac acaaaaataa ccattgtttt 29400 tcagacccca cgaagtactt tggctgtgag ctcggggctc aaacgaactt cgatgccaag 29460 aacgagcgtt acattgtcaa cggcgagcat gatgccaaca agctccagga tattttagat 29520 ggtttcatta aaaagtttgt gctttgcaaa tcatgtgaaa acccggaaac tcagttggta 29580 cgagatcatt gaattaataa tctgtctaat tttattattt cagtttgtcc gtaaaaataa 29640 catcaagagc aagtgcaagg catgtggatg ttcgttcgac attgatctca aacataagct 29700 gtctacattc atcatgaaga atcctccaaa gattgatgtc gatttttgta agtatcgttt 29760 actaacattt ttcgattgaa cttatgcaaa attctgccaa aaattctatt tgcattttaa 29820 atcctttcaa ttcgattttc cgtgtgcttc cagtgcatac aaacatgcta atttttggtt 29880 tccagccaaa gccgaacaaa agaatggaaa gaagacatcg ggtgctgacg ccgccgccgc 29940 cgtggctgcc gacataatcc acaacagcga caaaggcagt tcgaatgatg acgacgacga 30000 cgattgggaa cctgaaccag tcgagccgaa tggcatgctg tcggcgggaa tgggcaagct 30060 cgtgctggac aaggatcttg agaagagcga agaacagcgt ctcgacatgc ttcacacatt 30120 cttcttgaaa gccaaggaag aaggtaagaa ttctgagcat tgataaaaag tattctcgtt 30180 atttcagata gaatttctga tgccaaggga caaactgctc tacgtgacga agctgagaga 30240 cttgagctga agcaaaaagc atctctcctt ctcgcgaacg tttttcttga tgagaaagta 30300 atcactgaca aacaaatcag caaacaccgc aatcttctgc ttcgcttcac gttgaatgac 30360 aagaaagctc aaagatacct gttgggagga gttgagcaag taattcacaa acatgaagcg 30420 gaacttctgt ctaaatcagc tcacatcatt aagtcattgt atgatgaaga tgtctgcgaa 30480 gaggattcgc ttatttcatg gggagagaag gttagtacca aatggagctt tgtttcgaat 30540 taaagtttat atttacagcc gtcgagtaag tatgtctcca aatcttttgc caagaagatt 30600 attgagaact ctcaaccagt gctcaactgg ctgaaagaag cggaagaaga aaccgaagaa 30660 gagtccgacg atgagattgc ggtaagaaat atcagatttg tttttttttt ttcaatggtt 30720 ggttttcagt tcggaggaga cgtcaaggag agtgaattcc ttcgtcaaca gaaggagaag 30780 gctgctagag aagctcagca aaaatcagcc aaggctacaa acggcaatgc tgctgctgca 30840 tccggagcaa atgatgaaga ggacttggat attgatgaca tttaattgta cagatgcttt 30900 tttaaaattt acctgggcta cttatgtttt ttgtgtattt cttcccatat tcgaaccaat 30960 tcaactaatt tcgaagaagc ctcagttttt ttttgctttc tccccctttc aatagtaagc 31020 atcatttcat ttctgtcttc tgtcttttct gttcctacgc tgttttccct tcaccaaatc 31080 caattcattt attcgtaaag tcattactat ttgttgttaa tcgtaaacat ttgggaatat 31140 tcttgttcaa ttcagtctta tattacaaaa acacaatgtt caaaaaaaaa gaatcacttc 31200 agatgggaac ccgtcgaatt cggcggtccg atggagaata cacattgttt tttcggaaag 31260 ttagcccatt ttcaaatcat cacccagctg atttcatttg cgacgaagcg ataaattgta 31320 aagagccgaa aaccttttgc tgctcggaac agtactatat gtacaataag gcttcactat 31380 tgatggattc aaaactgatg gcagcgattc tagaagcaac ttgtccgaaa acaatgaaga 31440 caatgtgttc taaatggtcg ttgaaaggat ggaaggattc ggtgtaagtt ttaaatcagt 31500 ttgataataa aatatgtttt tcttttacag atgggatgag aacaaagaag aagtgatgag 31560 aataggatgc ttggcaaaat tccgtgcttc tcgccatctt cgttatgctc tttttctcac 31620 aactggtagc aaactagtcg aatgtagtcc gttcgataaa atatggggaa tcggttagtt 31680 tccaacggat cgtcttattc ttccatcgcc catcacaatg caatcagaat cttcaaactg 31740 gaaatgtttt gaaatcattg aaatcatctt tgagctgata tggtgacgga agaaaaggac 31800 gtctgaaaat ggctgaatta ttataggaaa agatatgcaa gccgcacaat gggctccatt 31860 gagctctggc aagaatctgc tgggaaagat tttggatgga atccgagagg aattgtggga 31920 tgattcaaat tacaagttag ctctggaatc agaaaattat tattatataa aattactatt 31980 tcagagatga acgagaagaa gtggagaaac gaatggaaac tgaaagagat tatctattca 32040 ctgctataga gcacatggac ttgatgtaca aagaaagagc aacaaaaaga gtattgtaag 32100 aatcagaaaa tctgcgtaat tgtcgacaga aataacgtat tccagattgt tcgaggaaga 32160 attgttaact gatgatagat cctacatcac accagatatt cagaggctcc ttcccgactg 32220 ggcttggccg ccgatcctcg tgaaaaacga gcctattcaa ccatcgctgc ctgtaataat 32280 cgatttccct aggtacttgc cttgatcttt aatttatcag aattaacttt caaattccag 32340 atcatctcca cttcgagcag ctgaaatatc acgtaggaag agcacatctc attcgacaag 32400 cttgagtaaa aggcggtacc tcaggagcag atcgagaagt ctgtccaaaa gcccggctcg 32460 aagacgctcc agacatcttt cccgaagtgg atcccgtaca ccagctcaac ggcattccag 32520 aagatccgaa agtacatctc gaagacgttc cggacggcac tctagaagtc gatctagaag 32580 cccaccacga aaacgtccgg tacgccgatc aagaagcaga tccaggagca ggacaccaaa 32640 ccgaaattgg acaagagcac ggagcagaac aagaagtcag gctaaaagta gcagcacttt 32700 aacctggcca ctgagcccat cgagaagcag aagtaacagt aatgaaagga atttgaaaga 32760 gaagaaagac cggaaaaaga aaaaatctga gaagaaacgg aagcatcatt ctaaatccag 32820 aaaacaccgt tctaaaagat ccgaatccag agaagaacgt cacagaagac ggaaggagaa 32880 gaaaagagag aaaaagaaga aacgacgtcg gagaagttcc actacttcag attaaacttt 32940 atttttgaaa actagtcata actttaaaag tcataacttt tttaaaagtc ataacactgg 33000 tttaatatca aatgtctttt caaatattct ctatttattt attcttcgta attaaactga 33060 gattaagtac tgggtatatc attaataaaa ttacgatact ttgccgaata aatcagttat 33120 aattacaatc tgtctgctgg tgaaaattgt acatgctatt ttcttgttcc tcattctttt 33180 ttcattctct gtaaggtttt gttcgttttt tggaaaattc tgagagtagc cggaaaaaaa 33240 aaaaaaaaaa actaaatacc tacagtaatg ccagaggcat atgctcaata attatcaaaa 33300 attagttttc cgcggcgaga cccatcccca caaaagtatg actcccttga aagtcgtaaa 33360 tgacaatttc ttgaaacaag aacatttgta tattaacgaa acacaaaatt ccgagaatgc 33420 gtattgagca gcatatttgc cgagccaaat atctcgtagc gaaaactaca ttaattctta 33480 aaaacactac tgtagcgctt gtgtcgattt acgggctctt tgaattatca ttgatttatc 33540 gatagaatat ttaaaaaata aattcatttc gaaattagag cccataaatc gacacaaaca 33600 ctacagtagc catttaaaga attactgtag ttttcgctat gagatatttt gcgcatcaaa 33660 tatgttgcgc aatacgcatt ctcagaattg tgtcttccgt aataatagac agtggcttcg 33720 ctaaaaacta agaacaaagt aaattaaagt ttttttctgt tcacttcaaa ttttacacga 33780 tcttgaagca aagttcaaaa gagcatgaat caattggaaa gtgttcaatg caccctacag 33840 atatgatttc ggggcagtgt aaactacagg gcacagacat aaaaatttaa attgttgaag 33900 actaaaatat aaacatatga attcaagggt cataataaat gtattttttt aaataatatt 33960 tattaaatgt atgcatacaa ttaaatacaa cataattatc aaatacaaat attataattg 34020 caacctgtcg gacaacaact ttgctgaggt gtcgtgtgac agtcagaatc cttgtcacac 34080 cagctgaccg gctcagagac gatacatcgg aagttgagat gagtgactgg tggacattgc 34140 cgacgcgttg gagcacaaca ctcacgatat cgagtcatgt cgatgcagcg ctgaaactca 34200 ggaaactatg tggaatttag gtggatcacc caaccagctg cccttcaccg cactgataat 34260 ttggagtgca gtacatgtaa tgggcagagc attgctgcat ttgcatcaca atcaatgaat 34320 ttgcaaaggg cctggagatt ggcttggctg aaagagttga tattatttct attgatataa 34380 taccctaaat ttacgaaaat tatgctaaat taggatttta gttataatcc tcgtcacatc 34440 tgatctctga aaacttaaaa atatcctttt tggtagtgtg gcaccaaatt cgtgctgtaa 34500 cagagaccaa aaacactact ttttcgacat ttcctctcct tgcagcgaaa aataaaattt 34560 tttgaaaatc tgtgttttct catacccgga aaaaaccaac aaaaacggcc ttgttccaaa 34620 ggcggtgagt atttctattt tatgaaagtg gccgagattt ctctttttct acgccaagta 34680 gttaattctt cgcggcaaga cccatcaatt ttctaacctc taatctcttt ttcaacatga 34740 atatccacgt catcatagaa tttgcactcg ggcttataga tttggagcct ttgaaagtat 34800 atgcaccagt ctatatgggt gttgggaaac gaataggcag tagttttttg gaccaattgt 34860 agaatagaca gtagtaatag ggaagaatat aagaatttca taattcagat ttcaataaaa 34920 aataaattta attgagaaaa aaaacggttg atattctttt gtttaagcag acaagtatgc 34980 ggaagtgaat cttgagcacc tcgtaaatca cgggaggcgt acttgtacag aagagagata 35040 agggattaag aggcgcaagc tttgccactt tgaagttaaa aaataaagaa agagacatgc 35100 aaattggtgg acaaatagcg gaaggttagc gggaggtggg aggggggaca ggtgcatgta 35160 acacaatgga ttttacaata ggaatattga aaatacgcat atgggaaatc ggaacagata 35220 tgaaggtgtc aatatttgag gtcaactgtc tggtttttcc ccgatttttg aattttttga 35280 aaaaaagtgc ataattcaca gattgaaatt ggaaattggt cgagaaaaga ataaggagtg 35340 ttatgaattg atggtggcaa caaaacacaa attctacatt tgtaccaaaa tgcccactaa 35400 aatgggcata ttcgcacaca ttccacacaa attgcataca tattccacaa tggggaatat 35460 tttgaatatt tagattaata aagatgaaat aattgagttt tatttgtaat taaaatattt 35520 ttctgtttat cattaattga aaatgttgaa ttacttttta atagacgaat catcaaagaa 35580 cttgatccct gcattatcag gcaatcctac ataacctttc aacgttgtcg ttttaccaat 35640 tgcaacattt ctcgctactg gaacacgcat actggaatac gatgacgatt ccaattggaa 35700 gaatatattg gtgcccggtt ggaagttaac aattgaattg ttgttaagcg ataaaggata 35760 cacattgata acatccaaaa gttcagttat gtatatccat ccgtataaat cttgcgatct 35820 tccattcacc aaaagctggt cgccatcttg tataggaatg aatggagtta aggatcccgt 35880 aacagtacga gttgtgagcg tagttccact gaaaattact aaatatttag ttcaaaggtt 35940 ttctgttact actttttggt tgcaacaact ctgagaaatt ttagttttca ccaaaatttt 36000 tcgattttgt acagaattgc acaatatatt ttggaatagc aagaaattgt tcagtgaatg 36060 tcaaatctga caaaaaaaaa tttttttaaa aggtgcctat caatttttaa aaatgttcta 36120 atattttgtt ggaaagtttc aataatttca ctacatttac tatttctttt ttaggcctat 36180 tttgggtatt caaaatatta accacacgac cttcaataca ggaaaactgt caaatttttt 36240 ttaaattatg aacaattaac tcactttaca ttttgtcctc cattccttgt agttaatata 36300 agacttccca acgcttcttg agaactattc gaaataatat aaatcttcga atttcttcct 36360 actatatatc ctagtgtgtt gctcgttgca acgtctagag tatccaatat aaacccacta 36420 gaagctgata taaagaaaaa taatagaaat atatttttca ttttttccaa atgactaaat 36480 gaccaacttc aagacatttt atatgcttaa aatcacgtca cagaactata atcatgttga 36540 tttttgatag aaaatgataa gaaatgcgac caaaatgtgt attttctccg tttgtcctct 36600 gaatgagtca aattcacgta aaacttggca tttgtcacag tgtgtcagac acaaggcaca 36660 tatgtattta ccggactttt caagacttta ttattattga gatcaaacca gattacagaa 36720 gacgggagaa aggtaccaac aaatatcaga atattgcaaa aaaaaattaa aaatttcaaa 36780 acgcaaactt caaactagga gagctaattc aaactttgaa atcatgttcc ataaccggta 36840 gcatttgttc ggtgacttgt ttgacagccc attgaaggaa gagaagtact cccgacaggc 36900 tgaaacatat gaaatagtcc aggccttcca ttagagaatg tgatgtttga aggaagaaca 36960 atgggacgta gagtactccg aatagagcag taagtccatt gatgagctga aacagtaaat 37020 aatcgaaaag ttagtaaata tgttcaagga atggaagtaa accggaatta tccgagtatg 37080 ggcgttttat agttttttct ctttttttga cttcgttttt catcctatta aaatatcatc 37140 ggttttttcg agttccagaa aaaatattta aaaaatcatc cgaaatccga acacaaaatc 37200 cgaaggctac tccaaggtaa gttaacccta ctcggcaaat ctctcgtcct ggagcgcgga 37260 cggggcgcga ctagatcacg ggttcgcgct ccagtcaccc tttttttcgc gcttcttacg 37320 cgccacgtcc gcgcttcagg aggagcgatt tgcggagtac cttttatgca ttcagactgg 37380 tacttaaaaa ttaatcgatt tttttaaaaa gtgtcataaa ctttttctac gtctttttct 37440 gacacaatgt tgaaccgtac tagattgttg taaacacggt cttcaaattt gattttcgcg 37500 aaaaaatttg aataattttt ttctaacttt tttcttttta aaatcttacc acacttagca 37560 aataaccatg aagcacaact tcataagtgg atcctatttt tcgtttgaag aggcaaaata 37620 ctgaaaacaa aagagctgat atggagcaag acacgtggat ccagaagagt atacgcacaa 37680 tcacactatc cccttcgatt ttgacgcggt acagaattct ggaatttttt tttgaacttt 37740 aatggattgc gattcaaaag aaaacgtagc ttaatctcca gttaaagctg attttcattg 37800 caaaatgtat ttagaaaaaa ctcacgctaa taaggcggag agtattgtct gtagaaccgc 37860 catgattact gtagatgcat agagtgagaa tgagcacata taagcgctcg gctgtttttg 37920 aacgacaatc gaattggccg ccatcatctc attcttcgac ctcccgtttt atttctgaaa 37980 atatatgaca ctttttaaat gaattgacag aaatctgatg ctaactacat tttaacttgt 38040 aggagtggtt caaatgattc ataaagggaa tacaatttct gaatgatcaa agaagaaaga 38100 aaaaaaatat tggtgaatgt ataatttttt aggggtaaag taaataaata aacacaaggc 38160 cgaagattag caagagtttg gggataaccc ccgtgaagaa aaatatgaaa aaaaatggtt 38220 tgaaagaatt aaaaaaatcc tttcaaattt gagattcaaa ttttgttcat ctgttctgtt 38280 cgaacattga gcagaagaag cttttaccaa taaatccaaa atttgttaag agaatatagt 38340 ttaaggatat cacccagttc aaaatagtag ttcaaaaact cgagtcttaa ttttttcagt 38400 attcgaattt ttacagtaca ttgatcgttt cgttatttga tcgctttttg ataaaacaaa 38460 aaatagataa tgaagctgcc aagtttaaaa aaatcggggc taaggctaat ggagcataca 38520 cggtatatca ctacctggat attagtttta gacttcatca gatatttagt cagaaaagta 38580 cgtcaagaag tcggatacga aatgtataaa tttcttaaaa cttaaaactt cgagatatcc 38640 agactgtggc tctcaagctt cagtgcttgg agaaatagtt taatagtcag aatatgtttt 38700 aaatttctta atttttctga agaagtcgta aaagtataaa tgttgctaga tcaaacactc 38760 tagaaaacct tcaccacttg agaatactcc agtctcaaat tttccctcga cgcggaagtg 38820 tagaagggcg cgagattcag aagtaggtga aaattagacg gaaaactctc tcaaaattga 38880 aatcaatgaa taggacaact gagacaatgt gcaggtgtat gtgtatgcac atggcaccca 38940 cgtacacgca tacatcttat gttagagaag tacgtgtgct ccgctcatca tgtcttctcc 39000 ttctcctaca tctacatttt ttgctccgtg agccacgccg ggaaaaacga cgacgacgac 39060 ggcgacgggg gacgactact cgactctaat tggccctaaa cgcaagtaaa tttttaggca 39120 atgtatgttt gcgagagttg agagccccac cgccacgagg agaagtgggg gaagattccg 39180 aagagattcc ccctcctcct tctgatcacc tcgtctttcc ttttttgttc catttccgtg 39240 aaaaagctgt ggaagggagg agaagaactt accggctaaa tggaaaaaaa ggaactctaa 39300 cttattctga ctctacggaa ataggaagcc tacttgtcaa ttagaccgcc ctcgcacaga 39360 tttctttttt tttgtagata caaatataaa aactaactgc gtgtgatgca gcagatatct 39420 tgaattggaa agtgtcagtg ctcagaggga atagccaatc attgacagaa atttgactac 39480 ttcagaagga atcaactaga acatttgacg cctgaaacct aacaagaaaa atctataatt 39540 tggagatccc tagattgatg ccaactttat taaaaactaa gtatacttat atatatacga 39600 tttttttaaa aataaacctg attgtctgaa tttctacaag attgcgacca aattttccgt 39660 atttccaaaa tctaatatta ggggtttcta ctaaaattca acgagaactc ttaacattat 39720 ggttatttta acacatggtt caccgccggc tcaaacttca ttcttagtcc tctgattttt 39780 ggtaaatcga cgcctacgtc tcaacaatta gtttgtgcag aaaataagta aaaagagttg 39840 tgctccatct tgcacacata cacatcgcct gtaatgaaga ggttcggagt cagatgacta 39900 ggcgtagaaa tgtgcgaaat tcacggataa cagagatttt tgatgtttca tcagacttac 39960 acgttttgga agtatgaatt gggtctagac aacggagtgg cagatgttcg gaaaattttg 40020 cagaaaagag aacctaagag cgttgatggt ttggtgacta acgaacttaa aagaaaattg 40080 gtcattgaaa attttaaaat tttaaatttt gcttgcagtt catctttctc tattaacaaa 40140 aattattttg tagcttttct caatttcagg caattaaaac atttcaattt attcttctat 40200 tatggaagtt tatctctaat tgaaactctc caattttgat caaagaacaa acgttctcgt 40260 tgtttgaaaa aaaaaacagt tcttttttga aactcgcgcg caaattatta accaatcatc 40320 ctcgtttgcg cgcaaaattg tagaaaaaat catttaaatt tatcaaaaat agtttaccat 40380 tctgatgagt ttttcatata caaaaatgcc ctggcaattg ttgttttctc tgaaatagca 40440 cataataatt gaactctacc cacataaagt tcgttctgaa aaacacctta caattattgt 40500 gattgagagc caccccaaga gggattagaa aaacggatgt aatctgtata ccttcgagat 40560 tcgtttattt ccttgtataa ccaatagcag gaaaattaca gctttttcta agtaagcggt 40620 gaaactagag agattctata gaatatgggc gttaataatt gtatgttaaa gttttagaat 40680 aacacaagtc cagagtaagg gcaagaaaag taatgagcaa cggaaaccag catgcaagac 40740 acccgaattc cggttctctt ctgaaactaa aagttgcgtg tactaaacct taaaccagca 40800 gctggctagt ctcaagaaat aatagaaaaa aggaaggaat gaagatatgg gaataataca 40860 aattgaaaat gttgtgtgag ctccgaataa ttttcaatat caaaaattta tgaattgtgt 40920 ggacggctgt gtgtgcgtgt gcgtatgcgt cggcaagaaa aagaagcgac cgaataagaa 40980 aatggttgat tcagtgaaca aaaaaagaga gaaagatatc caaacaaaat tattcaaaac 41040 tattatcaat cggtaggtat tgctctagag cacacctttc tggacactca gcagacatgc 41100 gtagagaggg attatgtggt acatatagtg gatggaggaa cagatattta taaatactta 41160 tggaaaagag gatgaagata ggatgaggta gatgaattga gaagatttta aaatgataat 41220 ggatattgaa tttgaataag gagattctaa attatccgaa gaacacaaac tatatcaaga 41280 ctacaaaata atctagacga gtcccagttt tgcaaggtaa ggattaatct taaaaggatc 41340 ttttaaatat ttatttcaat gctcctataa attttaaaaa gtaggtgcat tctaatatgt 41400 acagtgatta ggagatatgt gacgttacgt gaggtctcga taaagtacgg tattcgagct 41460 aaatttcaaa cattgtcaag gtagattcgg tacacagcca ccataaatgt tccactaaaa 41520 atgtgttgtc cttctccttt ggaacacaaa tctagctgct gaactttttc acttcactac 41580 atgtcaatgg gattgatatg catctaggac atttttttgg ttatcaatag tccgcatagc 41640 ttgcgtaacc aatacaaccg attgtccaaa aaaatttgaa cactacaaaa cgtatttatt 41700 attcggatac ccgttgcatt tcaatacaca agttgatact tgctgcccct cggggctctc 41760 agacactcat tgactgaaaa cagacgattg ctcgtcgtcg tagtctgaag gctcggagag 41820 ctgaggaaga tatgaggaca taatgaattg atgtgtgaga atgagaaaat gaaaaaggaa 41880 aaatgagaaa aaaaagatga tgaagaatgt acaaatgaat aatcaagtag caatgacgag 41940 aaaagaacca ggtccttttg gcaggcaatt ttcgaaattt tcagatcaaa tttgtcgcca 42000 ttgcttctgg attaataatg gatgacgctt tgacaatggt gctcaataca agtgcaaaca 42060 gattggtttg ggatggcgta tagaaataga gccggtgaga cgatgtgatg aagttctgag 42120 agacgagatg tgatcgaggc gtttgtagtc gaggcaaacc gaggccgcat atggggttcc 42180 gataggcaat cggagaccag tgtccatctg aaagagataa aagttattcg agttgtgaat 42240 gttgcaagga aaattaaagg tacagtagag acaatcgaga cttttttcgg gaggacgcca 42300 tctaaaaact gtggaagcac gtggctttgg tagcttgatg tcacagaagt tgattccata 42360 agaattacat tagaaagctt gcgacgctaa atggataaat ctggtaacgg cttcctaata 42420 gcaagttaag ttttttcaca ataaattttt cagaattgaa tagatgcatt ttataactta 42480 cacatcgagt gggcacgttg gtggacaaga caagccccga t                     42521 <210>24 <211>4434 <212>DNA <213>未知 <220> <223>未知生物描述:未知 gccgccctcg ccaccgctcc cggccgccgc gctccggtac acacaggatc cctgctgggc 60 accaacagct ccaccatggg gctggcctgg ggactaggcg tcctgttcct gatgcatgtg 120 tgtggcacca accgcattcc agagtctggc ggagacaaca gcgtgtttga catctttgaa 180 ctcaccgggg ccgcccgcaa ggggtctggg cgccgactgg tgaagggccc cgacccttcc 240 agcccagctt tccgcatcga ggatgccaac ctgatccccc ctgtgcctga tgacaagttc 300 caagacctgg tggatgctgt gcggacagaa aagggtttcc tccttctggc atccctgagg 360 cagatgaaga agacccgggg cacgctgctg gccctggagc ggaaagacca ctctggccag 420 gtcttcagcg tggtgtccaa tggcaaggcg ggcaccctgg acctcagcct gaccgtccaa 480 ggaaagcagc acgtggtgtc tgtggaagaa gctctcctgg caaccggcca gtggaagagc 540 atcaccctgt ttgtgcagga agacagggcc cagctgtaca tcgactgtga aaagatggag 600 aatgctgagt tggacgtccc catccaaagc gtcttcacca gagacctggc cagcatcgcc 660 agactccgca tcgcaaaggg gggcgtcaat gacaatttcc agggggtgct gcagaatgtg 720 aggtttgtct ttggaaccac accagaagac atcctcagga acaaaggctg ctccagctct 780 accagtgtcc tcctcaccct tgacaacaac gtggtgaatg gttccagccc tgccatccgc 840 actaactaca ttggccacaa gacaaaggac ttgcaagcca tctgcggcat ctcctgtgat 900 gagctgtcca gcatggtcct ggaactcagg ggcctgcgca ccattgtgac cacgctgcag 960 gacagcatcc gcaaagtgac tgaagagaac aaagagttgg ccaatgagct gaggcggcct 1020 cccctatgct atcacaacgg agttcagtac agaaataacg aggaatggac tgttgatagc 1080 tgcactgagt gtcactgtca gaactcagtt accatctgca aaaaggtgtc ctgccccatc 1140 atgccctgct ccaatgccac agttcctgat ggagaatgct gtcctcgctg ttggcccagc 1200 gactctgcgg acgatggctg gtctccatgg tccgagtgga cctcctgttc tacgagctgt 1260 ggcaatggaa ttcagcagcg cggccgctcc tgcgatagcc tcaacaaccg atgtgagggc 1320 tcctcggtcc agacacggac ctgccacatt caggagtgtg acaagagatt taaacaggat 1380 ggtggctgga gccactggtc cccgtggtca tcttgttctg tgacatgtgg tgatggtgtg 1440 atcacaagga tccggctctg caactctccc agcccccaga tgaacgggaa accctgtgaa 1500 ggcgaagcgc gggagaccaa agcctgcaag aaagacgcct gccccatcaa tggaggctgg 1560 ggtccttggt caccatggga catctgttct gtcacctgtg gaggaggggt acagaaacgt 1620 agtcgtctct gcaacaaccc cacaccccag tttggaggca aggactgcgt tggtgatgta 1680 acagaaaacc agatctgcaa caagcaggac tgtccaattg atggatgcct gtccaatccc 1740 tgctttgccg gcgtgaagtg tactagctac cctgatggca gctggaaatg tggtgcttgt 1800 ccccctggtt acagtggaaa tggcatccag tgcacagatg ttgatgagtg caaagaagtg 1860 cctgatgcct gcttcaacca caatggagag caccggtgtg agaacacgga ccccggctac 1920 aactgcctgc cctgcccccc acgcttcacc ggctcacagc ccttcggcca gggtgtcgaa 1980 catgccacgg ccaacaaaca ggtgtgcaag ccccgtaacc cctgcacgga tgggacccac 2040 gactgcaaca agaacgccaa gtgcaactac ctgggccact atagcgaccc catgtaccgc 2100 tgcgagtgca agcctggcta cgctggcaat ggcatcatct gcggggagga cacagacctg 2160 gatggctggc ccaatgagaa cctggtgtgc gtggccaatg cgacttacca ctgcaaaaag 2220 gataattgcc ccaaccttcc caactcaggg caggaagact atgacaagga tggaattggt 2280 gatgcctgtg atgatgacga tgacaatgat aaaattccag atgacaggga caactgtcca 2340 ttccattaca acccagctca gtatgactat gacagagatg atgtgggaga ccgctgtgac 2400 aactgtccct acaaccacaa cccagatcag gcagacacag acaacaatgg ggaaggagac 2460 gcctgtgctg cagacattga tggagacggt atcctcaatg aacgggacaa ctgccagtac 2520 gtctacaatg tggaccagag agacactgat atggatgggg ttggagatca gtgtgacaat 2580 tgccccttgg aacacaatcc ggatcagctg gactctgact cagaccgcat tggagatacc 2640 tgtgacaaca atcaggatat tgatgaagat ggccaccaga acaatctgga caactgtccc 2700 tatgtgccca atgccaacca ggctgaccat gacaaagatg gcaagggaga tgcctgtgac 2760 cacgatgatg acaacgatgg cattcctgat gacaaggaca actgcagact cgtgcccaat 2820 cccgaccaga aggactctga cggcgatggt cgaggtgatg cctgcaaaga tgattttgac 2880 catgacagtg tgccagacat cgatgacatc tgtcctgaga atgttgacat cagtgagacc 2940 gatttccgcc gattccagat gattcctctg gaccccaaag ggacatccca aaatgaccct 3000 aactgggttg tacgccatca gggtaaagaa ctcgtccaga ctgtcaactg tgatcctgga 3060 ctcgctgtag gttatgatga gtttaatgct gtggacttca gtggcacctt cttcatcaac 3120 accgaaaggg acgatgacta tgctggattt gtctttggct accagtccag cagccgcttt 3180 tatgttgtga tgtggaagca agtcacccag tcctactggg acaccaaccc cacgagggct 3240 cagggatact cgggcctttc tgtgaaagtt gtaaactcca ccacagggcc tggcgagcac 3300 ctgcggaacg ccctgtggca cacaggaaac acccctggcc aggtgcgcac cctgtggcat 3360 gaccctcgtc acataggctg gaaagatttc accgcctaca gatggcgtct cagccacagg 3420 ccaaagacgg gtttcattag agtggtgatg tatgaaggga agaaaatcat ggctgactca 3480 ggacccatct atgataaaac ctatgctggt ggtagactag ggttgtttgt cttctctcaa 3540 gaaatggtgt tcttctctga cctgaaatac gaatgtagag atccctaatc atcaaattgt 3600 tgattgaaag actgatcata aaccaatgct ggtattgcac cttctggaac tatgggcttg 3660 agaaaacccc caggatcact tctccttggc ttccttcttt tctgtgcttg catcagtgtg 3720 gactcctaga acgtgcgacc tgcctcaaga aaatgcagtt ttcaaaaaca gactcagcat 3780 tcagcctcca atgaataaga catcttccaa gcatataaac aattgctttg gtttcctttt 3840 gaaaaagcat ctacttgctt cagttgggaa ggtgcccatt ccactctgcc tttgtcacag 3900 agcagggtgc tattgtgagg ccatctctga gcagtggact caaaagcatt ttcaggcatg 3960 tcagagaagg gaggactcac tagaattagc aaacaaaacc accctgacat cctccttcag 4020 gaacacgggg agcagaggcc aaagcactaa ggggagggcg catacccgag acgattgtat 4080 gaagaaaata tggaggaact gttacatgtt cggtactaag tcattttcag gggattgaaa 4140 gactattgct ggatttcatg atgctgactg gcgttagctg attaacccat gtaaataggc 4200 acttaaatag aagcaggaaa gggagacaaa gactggcttc tggacttcct ccctgatccc 4260 cacccttact catcacctgc agtggccaga attagggaat cagaatcgaa accagtgtaa 4320 ggcagtgctg gctgccattg cctggtcaca ttgaaattgg tggcttcatt ctagatgtag 4380 cttgtgcaga tgtagcagga aaataggaaa acctaccatc tcagtgagca ccag       4434 <210>25 <211>2837 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>25 agagagccag tccgatgtct gcagcctccc tggccaggcc tctcctctcc tgccgcagct 60 agtccccctc aggacagaca gagtactggc gtcggtcacc attcacttgc aaacacacca 120 ggtcacgtga agaaacttcc tggtgacact caggctgtag ctgtgcactc ttcaaccacg 180 aggttggttt tctcctaagt gtcacaggtg gagacaagat gctctgggca ctggccctgc 240 tggctctggg catagggcca agagcttctg ctggtgacca cgtcaaggac acttcatttg 300 accttttcag catcagcaac attaaccgga agaccatcgg tgccaagcag ttccgagggc 360 ctgaccccgg ggtgcccgcc taccgttttg tacggtttga ctacatcccc ccagtgaaca 420 cagatgatct caacaggatt gtcaagcttg caaggagaaa ggagggcttc ttcctcacag 480 cccaactgaa gcaggaccgc aagtctcggg gaacgctcct ggtgttggaa ggccccggca 540 cctcccagag gcagtttgag attgtgtcca atggcccagg ggacactttg gacctcaact 600 actgggtaga aggcaatcag cataccaact tcctggagga tgtgggcctg gctgactccc 660 agtggaagaa tgtgactgtg caggtggcca gtgacaccta tagcctgtat gtgggctgcg 720 atcttatcga cagtgtcacc ctggaagaac cattctatga gcagctagaa gtagacagga 780 gcaggatgta cgtggccaaa ggtgcatctc gagagagtca cttcaggggc ttgctgcaga 840 atgtccatct cgtgtttgca gattctgtgg aagatatctt aagcaagaaa agctgtcaac 900 acagccaggg agctgaagtc aacaccatca gtgaacatac agagactctc catctgagcc 960 ctcacatcac cacagatctc gtggtccagg gtgtggagaa ggcacaggag gtgtgtacgc 1020 actcctgcga ggagttgagc aacatgatga atgagctctc tggactgcac gtcatggtga 1080 accagctgag caagaacctg gagagagtgt ctagtgataa ccagttcctt ttggagctca 1140 ttgggggccc tctgaagaca agaaacatgt cagcctgtgt gcaggagggc cgaatctttg 1200 cagaaaatga aacctgggtt gtggatagtt gtaccacatg cacctgcaag aaatttaaaa 1260 cagtctgcca tcagatcacc tgctcacctg caacttgtgc caacccatct tttgtggaag 1320 gcgagtgctg tccatcctgt tcacactctg cagacagtga tgagggctgg tctccgtggg 1380 cagagtggac cgagtgttct gtcacctgtg gctctgggac ccagcagaga ggccggtctt 1440 gtgatgtcac cagcaacacc tgcctgggcc cctccattca gacaaggaca tgcagcctgg 1500 gcaaatgtga tacgagaatc cgtcagaatg gaggctggag tcactggtca ccctggtctt 1560 catgctccgt gacttgtgga gttggcaatg tcacccgcat acgtctctgc aactcaccag 1620 tgccccagat gggtggcaag aactgcaagg gcagcggccg ggaaaccaaa ccctgtcagc 1680 gtgatccgtg cccaattgat ggccgctgga gcccctggtc cccttggtca gcctgcacag 1740 ttacctgtgc tggagggatc cgtgagcgct cacgtgtttg caacagccct gagccccagt 1800 atggagggaa ggactgtgtc ggggatgtga cagaacacca aatgtgcaac aagagaagct 1860 gccctattga tgggtgctta tccaacccgt gttttcctgg agccaagtgc aacagcttcc 1920 ctgatgggtc ctggtcctgt ggctcctgcc cagtgggctt tctgggcaat ggtacccact 1980 gtgaggacct ggatgagtgt gctgtggtca cagatatttg cttctcaact aacaaagctc 2040 cccgctgtgt caacaccaac ccgggcttcc actgcctgcc ttgtccacca cgctacaagg 2100 ggaaccaacc cttcggtgtt ggcctggagg atgctaggac agaaaaacaa gtgtgtgagc 2160 cagagaatcc atgtaaggac aagactcaca gctgccacaa gaatgcagag tgcatctacc 2220 tgggccactt tagtgacccc atgtacaagt gtgagtgcca gattggctac gcaggtgatg 2280 ggctcatctg cggggaggac tcagacctgg atggctggcc caacaacaac ctggtgtgtg 2340 ctactaatgc cacctaccac tgcatcaagg acaactgccc caaactgcca aattccgggc 2400 aggaggattt tgataaggat ggaatcggag atgcttgtga cgaggacgat gacaatgacg 2460 gtgtgagcga tgagaaggac aattgccagc ttctcttcaa tccccgtcaa ttagactatg 2520 acaaggatga ggttggagac cgctgtgaca actgccccta tgtgcacaac ccagcacaga 2580 tcgacacaga caacaatggc gagggggatg cctgctctgt ggacattgac ggagacgatg 2640 ttttcaatga gcgagacaat tgtccatatg tctacaacac tgaccagaga gatacggatg 2700 gtgatggcgt gggtgaccac tgtgacaatt gtcctctgat gcacaaccca gatcagatcg 2760 atcaggacaa tgatctcgtt ggagaccagt gtgacaacaa tgaggacata gatgatgacg 2820 gccaccagaa caaccaa                                                2837 <210>26 <211>4108 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>26 agagagccag tccgatgtct gcagcctccc tggccaggcc tctcctctcc tgccgcagct 60 agtccccctc aggacagaca gagtactggc gtcggtcacc attcacttgc aaacacacca 120 ggtcacgtga agaaacttcc tggtgacact caggctgtag ctgtgcactc ttcaaccacg 180 aggttggttt tctcctaagt gtcacaggtg gagacaagat gctctgggca ctggccctgc 240 tggctctggg catagggcca agagcttctg ctggtgacca cgtcaaggac acttcatttg 300 accttttcag catcagcaac attaaccgga agaccatcgg tgccaagcag ttccgagggc 360 ctgaccccgg ggtgcccgcc taccgttttg tacggtttga ctacatcccc ccagtgaaca 420 cagatgatct caacaggatt gtcaagcttg caaggagaaa ggagggcttc ttcctcacag 480 cccaactgaa gcaggaccgc aagtctcggg gaacgctcct ggtgttggaa ggccccggca 540 cctcccagag gcagtttgag attgtgtcca atggcccagg ggacactttg gacctcaact 600 actgggtaga aggcaatcag cataccaact tcctggagga tgtgggcctg gctgactccc 660 agtggaagaa tgtgactgtg caggtggcca gtgacaccta tagcctgtat gtgggctgcg 720 atcttatcga cagtgtcacc ctggaagaac cattctatga gcagctagaa gtagacagga 780 gcaggatgta cgtggccaaa ggtgcatctc gagagagtca cttcaggggc ttgctgcaga 840 atgtccatct cgtgtttgca gattctgtgg aagatatctt aagcaagaaa agctgtcaac 900 acagccaggg agctgaagtc aacaccatca gtgaacatac agagactctc catctgagcc 960 ctcacatcac cacagatctc gtggtccagg gtgtggagaa ggcacaggag gtgtgtacgc 1020 actcctgcga ggagttgagc aacatgatga atgagctctc tggactgcac gtcatggtga 1080 accagctgag caagaacctg gagagagtgt ctagtgataa ccagttcctt ttggagctca 1140 ttgggggccc tctgaagaca agaaacatgt cagcctgtgt gcaggagggc cgaatctttg 1200 cagaaaatga aacctgggtt gtggatagtt gtaccacatg cacctgcaag aaatttaaaa 1260 cagtctgcca tcagatcacc tgctcacctg caacttgtgc caacccatct tttgtggaag 1320 gcgagtgctg tccatcctgt tcacactctg cagacagtga tgagggctgg tctccgtggg 1380 cagagtggac cgagtgttct gtcacctgtg gctctgggac ccagcagaga ggccggtctt 1440 gtgatgtcac cagcaacacc tgcctgggcc cctccattca gacaaggaca tgcagcctgg 1500 gcaaatgtga tacgagaatc cgtcagaatg gaggctggag tcactggtca ccctggtctt 1560 catgctccgt gacttgtgga gttggcaatg tcacccgcat acgtctctgc aactcaccag 1620 tgccccagat gggtggcaag aactgcaagg gcagcggccg ggaaaccaaa ccctgtcagc 1680 gtgatccgtg cccaattgat ggccgctgga gcccctggtc cccttggtca gcctgcacag 1740 ttacctgtgc tggagggatc cgtgagcgct cacgtgtttg caacagccct gagccccagt 1800 atggagggaa ggactgtgtc ggggatgtga cagaacacca aatgtgcaac aagagaagct 1860 gccctattga tgggtgctta tccaacccgt gttttcctgg agccaagtgc aacagcttcc 1920 ctgatgggtc ctggtcctgt ggctcctgcc cagtgggctt tctgggcaat ggtacccact 1980 gtgaggacct ggatgagtgt gctgtggtca cagatatttg cttctcaact aacaaagctc 2040 cccgctgtgt caacaccaac ccgggcttcc actgcctgcc ttgtccacca cgctacaagg 2100 ggaaccaacc cttcggtgtt ggcctggagg atgctaggac agaaaaacaa gtgtgtgagc 2160 cagagaatcc atgtaaggac aagactcaca gctgccacaa gaatgcagag tgcatctacc 2220 tgggccactt tagtgacccc atgtacaagt gtgagtgcca gattggctac gcaggtgatg 2280 ggctcatctg cggggaggac tcagacctgg atggctggcc caacaacaac ctggtgtgtg 2340 ctactaatgc cacctaccac tgcatcaagg acaactgccc caaactgcca aattccgggc 2400 aggaggattt tgataaggat ggaatcggag atgcttgtga cgaggacgat gacaatgacg 2460 gtgtgagcga tgagaaggac aattgccagc ttctcttcaa tccccgtcaa ttagactatg 2520 acaaggatga ggttggagac cgctgtgaca actgccccta tgtgcacaac ccagcacaga 2580 tcgacacaga caacaatggc gagggggatg cctgctctgt ggacattgac ggagacgatg 2640 ttttcaatga gcgagacaat tgtccatatg tctacaacac tgaccagaga gatacggatg 2700 gtgatggcgt gggtgaccac tgtgacaatt gtcctctgat gcacaaccca gatcagatcg 2760 atcaggacaa tgatctcgtt ggagaccagt gtgacaacaa tgaggacata gatgatgacg 2820 gccaccagaa caaccaagac aactgcccat acatctccaa ctccaaccag gctgaccatg 2880 acaacgacgg caagggcgat gcctgcgact ctgatgatga caatgatggt gttccagatg 2940 acagggacaa ctgtcggctt gtgttcaacc cagaccagga agactcggac ggtgacggcc 3000 gaggtgacat ttgtaaagat gactttgaca atgataatgt cccagatatt gatgatgtgt 3060 gccctgagaa caatgccatc actgagacag acttcagaaa cttccagatg gtccctctgg 3120 atcccaaggg gaccacacaa attgatccca actgggtaat tcgtcaccaa ggcaaagagc 3180 tggtgcagac agcaaactca gaccctggca tcgctgtagg tttcgacgag tttgggtctg 3240 tggacttcag tggcactttc tatgtcaaca ctgaccggga tgatgactac gctggctttg 3300 tctttggcta tcagtcaagc agccgcttct atgtggtgat gtggaagcag gtgacccaga 3360 cctactggga agacaagccc agtcgggctt acggctactc tggtgtgtca ctcaaagtgg 3420 taaactccac gactggtact ggcgagcacc tgaggaatgc cctgtggcac acgggaaaca 3480 cagaaggcca ggtccggact ctatggcatg accccaaaaa cattggctgg aaagactaca 3540 ctgcctacag gtggcacctg attcacaggc ctaagacagg ctacatgaga gtcttagtgc 3600 atgaaggaaa gcaagtcatg gctgactcag gaccaattta tgaccaaacc tacgctggtg 3660 gacggctggg cctgtttgtc ttctcccaag agatggtcta tttctcggac ctcaagtatg 3720 agtgcagaga tgcctagaga gcagggctcc agctccagca atgtgctgca aacacccctt 3780 cttagacaca tcagtccatc ttggcacttg tggcttttct gtcatttggc atttcctgtt 3840 tcttgacctt aactgagtgg atctacacct ccttcatcag caccaagtcc aagtgtcttc 3900 aaaggagaaa catcaattgc actccaagag cttccagcct gctgctggaa aacatttgga 3960 tgagatatga ggctcaccgt ggagcgaaga ccgagcattc cgctgtgttg ccttttcttg 4020 tttgtttaaa aagaatgacg tttacatgta aatgtaatta cttgcagtat ttatgtgtat 4080 atggagtcga agggagcttt agagcaca                                    4108 <210>27 <211>820 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>27 tcgaccagag gaggggaggc cagttcctct cccaagggtg ccacacaccc ctccctgttc 60 atcaccagac aggcccttcc ttcttagcca tatgctaacc ttctcctccc tgggaaattt 120 cctctgcagg agccaaagca gatgggagct ggagttgctg gagctcctgg tctgtatgca 180 gagcaggcat ccaggaaagg agaagagagt gtgacaatcc agcacctcag aatggagggg 240 cctcgtgttc agggcggaaa gtacagacgc aggcttgctg agggcctctg gacacaggct 300 ggaccagatg ctgtggatgt cgacccctgc actgactatt ggataaagac ttctttcaac 360 taagagaaga tgcaaatcag cacacttttt tctttgttct gccagcttcc aggcctaaga 420 ctaggttttg ctgtctacag ccaactattc tattagttac aaaactcaat cattttattc 480 agcaactgga tgttgactgt taactagaag ctctgtccta cttacagcac tttggatcat 540 caaaaaaata aagtaaaata gaaaactgag aaaactcaat ccatgaccag ggagaactta 600 caggatgtta gagacaaaac aagcagacac ctgaaacaat caacgcccaa taaaacaaag 660 taggatgaaa attctcttag ttctttgata acaatttgtt cactcataga aacattatta 720 attggtaggg taagcagaca ctctgaaaca atgagaaaaa tactaaaaat tgacttgagt 780 tatttcaaat tgcctcattg acctgttata tcataactct                       820 <210>28 <211>2397 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>28 tttttttttt catcctactt tgttttattg ggcgttgatt gttacaggtc ccagcctgta 60 gacatctttt actccaattt cctgaataga tagctttatt ccttcaaggt aatatagtgc 120 ggtggcttct ggctgagatg tttgctgttg ttttcttcat cttgtctttg atgacttgtc 180 agcctggggt aactgcacag gagaaggtga accagagagt aagacgggca gctacacccg 240 cagcagttac ctgccagctg agcaactggt cagagtggac agattgcttt ccgtgccagg 300 acaaaaagta ccgacaccgg agcctcttgc agccaaacaa gtttggggga accatctgca 360 gtggtgacat ctgggatcaa gccagctgct ccagttctac aacttgtgta aggcaagcac 420 agtgtggaca ggatttccag tgtaaggaga caggtcgctg cctgaaacgc caccttgtgt 480 gtaatggaga ccaggactgc cttgatggct ctgatgagga cgactgtgaa gatgtcaggg 540 ccattgacga agactgcagc cagtatgaac caattccagg atcacagaag gcagccttgg 600 ggtacaatat cctgacccag gaagatgctc agagtgtgta cgatgccagt tattatgggg 660 gccagtgtga gacggtatac aatggggaat ggagggagct tcgatatgac tccacctgtg 720 aacgtctcta ctatggagat gatgagaaat actttcggaa accctacaac tttctgaagt 780 accactttga agccctggca gatactggaa tctcctcaga gttttatgat aatgcaaatg 840 accttctttc caaagttaaa aaagacaagt ctgactcatt tggagtgacc atcggcatag 900 gcccagccgg cagcccttta ttggtgggtg taggtgtatc ccactcacaa gacacttcat 960 tcttgaacga attaaacaag tataatgaga agaaattcat tttcacaaga atcttcacaa 1020 aggtgcagac tgcacatttt aagatgagga aggatgacat tatgctggat gaaggaatgc 1080 tgcagtcatt aatggagctt ccagatcagt acaattatgg catgtatgcc aagttcatca 1140 atgactatgg cacccattac atcacatctg gatccatggg tggcatttat gaatatatcc 1200 tggtgattga caaagcaaaa atggaatccc ttggtattac cagcagagat atcacgacat 1260 gttttggagg ctccttgggc attcaatatg aagacaaaat aaatgttggt ggaggtttat 1320 caggagacca ttgtaaaaaa tttggaggtg gcaaaactga aagggccagg aaggccatgg 1380 ctgtggaaga cattatttct cgggtgcgag gtggcagttc tggctggagc ggtggcttgg 1440 cacagaacag gagcaccatt acataccgtt cctgggggag gtcattaaag tataatcctg 1500 ttgttatcga ttttgagatg cagcctatcc acgaggtgct gcggcacaca agcctggggc 1560 ctctggaggc caagcgccag aacctgcgcc gcgccttgga ccagtatctg atggaattca 1620 atgcctgccg atgtgggcct tgcttcaaca atggggtgcc catcctcgag ggcaccagct 1680 gcaggtgcca gtgccgcctg ggtagcttgg gtgctgcctg tgagcaaaca cagacagaag 1740 gagccaaagc agatgggagc tggagttgct ggagctcctg gtctgtatgc agagcaggca 1800 tccaggaaag gagaagagag tgtgacaatc cagcacctca gaatggaggg gcctcgtgtc 1860 cagggcggaa agtacagacg caggcttgct gagggcctct ggacacaggc tggaccagat 1920 gctgtggatg tcgacccctg cactgactat tggataaaga cttctttcaa ctaagagaag 1980 atgcaaatca gcacactttt ttctttgttc tgccagcttc caggcctaag actaggtttt 2040 gctgtctaca gccaactatt ctattagtta caaaactcaa tcattttatt cagcaactgg 2100 atgttgactg ttaactagaa gctctgtcct acttacagca ctttggatca tcaaaaaaat 2160 aaagtaaaat agaaaactga gaaaactcaa tccatgacca gggagaactt acaggatgtt 2220 agagacaaaa caagcagaca cctgaaacaa tcaacgccca ataaaacaaa gtaggatgaa 2280 aattctctta gttctttgat aacaatttgt tcactcatag aaacattatt aattggtagg 2340 gtaagcagac actctgaaac aatgagaaaa atactaaaaa ttgacttgag ttatttc    2397 <210>29 <211>4100 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>29 ggatcccccc gctccgctac catcttcatc gacctcaccc aggacgacga ctgagctccc 60 tcttcctcgc cgcggactgg ggcgaccctg ttgctgctgc ggccgccgcc gctcctgccc 120 ccacttcggc tcccgctcct gctcctgctc ccggccccac tcctgttcct gttcctgttc 180 ctgttcctgt tcccggtcct gctccggctc ccggccccgc acccacctcc gctcctgctg 240 cgggtctcca ggcccagaca aaataaaaaa agatatattt tttcagtccg tctctcccgc 300 ccggtgtctt ctatggctga gggagtctgg ctctcggggc tctcgggtcg gctgggcggc 360 tcggctggtt ggctggctgg cgagatggac cgctccggcg cgcagcgtcc gcggctgctg 420 tgatgggtgg gcggagcgcg gaccggggat tatatacacg atgtgcatcc ataattgatg 480 ttgtttgaga aaaacaaagt cataaagtgg cactcagaca gcactttggc ctggcgcccg 540 gccaccatct gagtgcccaa ccgggcccgg cggttacatc acccccacat ggaccatcac 600 ggcccattag caccaattgg ccagagtgtc gggagccacc gctaattgca gtaacgcgcg 660 gctgccagac tgcaatttac cgcgcgatac tgcagtttac tgcagccgcg gtaaactgca 720 gtacgcggcg gccgcaggaa atctactgta gtatttggcg gcggcgcgcg gtactgcaac 780 tgtagtaaac tgtagctgca gtagagttac tgcagcgcca tcgggccggt gtggccgcca 840 gggtaactgc acccgcagta aatttactgc agccggactt tgtgcgctgt ggagaccgcg 900 ccgaactggg acccccccga ctcccccccg actccccccc gactcccccc cgactccccc 960 ccgactcccc cccgactccc ccccgactcc cccccgactc ccccgggacg cgtccgcgcc 1020 tcgatgcgcc ccatcgcgcc ccgttccgct tcgccacgct ccagttgccc cgcccccggc 1080 acgtggcacg tatttccccc ccgtaaatca agagggatta tgcggatgtc tagtttatgt 1140 ctcaatttcc tctttccgga gataaaagcc gggacccccg cgccgaaaaa ggatacacca 1200 gccgcgatgt cgccgctcgt ggcggtgctg gtgttttttt cggcggcgct gggggttcct 1260 ggccccggcg tcgcgggaaa cccccgtggg ctcgatgcca tcttcgaggc cccggtcacg 1320 cccgcgcccc ccactcgcca tcctcggcgc gaggagctgg agtgggacga tgaggatcac 1380 ccgctgctgg acctcgagcc gcccgtggga tcacgctgcc atccctacat cgcgtactcg 1440 ctgccgccgg acatgaacgc cgtcacgagc gtggtcgtga agccctactg ctcgccgccg 1500 gaggtcatcc tgtgggcgtc tggcaccgcc tacctggtca acccctttgt cgccatccag 1560 gccctggccg tcggagagcc cttaaatgag gcggccctca aggagctcgg agaggtggcc 1620 gtgcacaagg actccctgcc gccgctgcgc tataatggag ggccccccgc cgagtaagag 1680 accctgcggc ctgccgcccg gggtgcgcct cgtcgtgcct gccgccgccg ccgcttctgc 1740 ctctaacgcc gccaccgccg ctgcagcagc agcccccgcc ggggccgggg ccggggcctc 1800 gaagccggcc cgaccccccg ccgccgcccg gcccgcgaag ggcacgcccg cggcgtcggc 1860 ggcaacaaca gccacggggg ccgacgcctc cgccccggcc cccgaccccg gggcgcccac 1920 gtgggacgcc ttcgccgccg agttcgacgt ggccccctcg tggcgcgcgc tgctggagcc 1980 cgagatcgcc aagccgtacg cgcgcctgct gctggccgag taccgcggcc gctgcctgac 2040 cgaggaggtg ctgcccgcgc gcgaggacgt gttcgcctgg acgcgcctca cggcgcccga 2100 ggacgtcaag gtggtcatca tcggccagga cccgtaccac gggccgggcc aggcccacgg 2160 gctggccttc agcgtccggc gcggggtgcc gatccccccg agcctggcca acatcttcgc 2220 ggcggtccgg gcgacgtacc cgacgctgcc cgcgcccgcc cacggctgcc tggaggcctg 2280 ggcgcgccgc ggggtgctgc tgctgaacac gacgctgacc gtgcggcgcg gggtccccgg 2340 ctcccacgcc ccgctcggct gggcgcggct cgtgcgcgcc gtcgtccagc ggctctgcga 2400 gacccgcccc aagctggtgt tcatgctctg gggcgcccac gctcaaaagg cctgcgcgcc 2460 ggacccgcgc cgccacaagg tgctcacctt cagccatccg tcgccgctgg cccgcacgcc 2520 cttcaggacc tgcccgcact ttggagaggc gaacgcgtac ctcgtccaga cgggccgggc 2580 ccccgtcgac tggagcgtgg actgagtcgg gcgtgcgcgc acaccgccgg cggaggacga 2640 ggagggggga ggggggtggg atggacggag gagagcggat gatggagccc gcgctcgccg 2700 gcgccccggc cagcgcgctg ccggtcctgg cggtgctgcg cgagtgggga tgggccgtgg 2760 aggaggtcga gccctccggg ccgtgcccgg aggacgcgga cgcgccccgg gagagcgcac 2820 cccctccccg ggagggggtg cgcgggagcg aagacggaga ggggggcgtg gaagacggcg 2880 aggaggggaa ggcgacggag aaggaggaga cggaagacga ggaagacggg ggggacgaag 2940 ggacgacgac ggcggcggcg ggcccgcgcc gggcgcagca cgtggagttt gacacgctgt 3000 ttatggtcgc gtccgtggac gagctcgggc gccggcggct gacggacacg atccgccggg 3060 acctggccgc ggccctggcc ggcctccccg tcgcctgcac caagacgtcc gcgtttgcgc 3120 gcggcgcgcg cggcccgcgc ggcgcccccg ggcgcggcca taaaagcctg cagatgttta 3180 tcctgtgccg cagagcccac gcggcgcgcg tacgcgatca gctccggtcc gcggtgcgcg 3240 cccgacgccc acgcgagccc cgcgcgcgcc cgacgagcgg acgggcgcgg ccggccgcgc 3300 cggtgttcat ccacgagttc atcacccccg agccggtgcg gctgcaccgg gacaacgtgt 3360 ttgcggcgcc atgagcacct tcggacgcgc gtccgtggcc acggtcgatg actaccaccg 3420 gttcctgcag gccaacgaga cggccgcccg gcgcctggcc gcggcctccc gccgcgtctc 3480 caccggcggg ggcgagacgc gggccccgcg gtcctcgcgc ggcccccacg acgatgaggc 3540 gcccctgcgc gccggcggcc tgggcaccgc ccgcgggcgc tcgcgccagc gcggcgcgac 3600 cgagccggac cccgtctacg ccaccgtcgt ccagcctacc caccaccacc accagcagca 3660 ccaccaccgc tctcagcatc cgcagcagca gcaacaacag cagcgggccc cacgccgccg 3720 cggcagcgtg cacgcctcgg cgacggccgc ggacggaccc gagtcgtgcg cggccgcacc 3780 cccgcgccgc cgcggcagcg tgcacgcctc ggcgacggcc gccccggcgg tccagctgcc 3840 ccggccccgg caacggagca tcaacgcctc gacgacggcc gccccgacgc cccagctgcc 3900 gagaccccgc cagcgcagcg tcaacgcctc ggcccgcgcc gccgtcccct cgacggccac 3960 cctcccgcgc ccccggaccc cgtcccgggg ccggcgcgcg ccccccgcct catgctgtta 4020 tcgcgatcaa taaagggcga gcgcccacgg accagacaaa agacacaacc ggttcggtct 4080 ctctgtccgc gcacgcgcgg                                             4100 <210>30 <211>38734 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>30 gatcctcgtg accgggtaca ccgacgcctc ctggacgccg ctgttcgcca tcgcgggcgg 60 ggtcgtcacc gacatcgggt cgatgctctc gcacagttcc atcgtggccc gcgagttcca 120 cgtcccgtcg gtggtgaaca ccaaggacgc cacccagcgc atcaacaccg gcgacctgat 180 cgtggtggac ggcgacgcgg gcacggtcga ggtcgtcgag agcgcggaca ccgacccgca 240 gggcccggcc ggggccgccg ggaccccggc cggagccacc accgactgaa gccggccacc 300 gccgcaacac cggaccacga ccgcccccgc gaggggcgga ccacacccca gacgggagac 360 gacccgatga tccccaacca gtggtatccc atcgtcgagg cgcaggaggt gggcaacgac 420 aaaccgctcg gtgtgcgccg catgggccag gacctcgtgc tctggcgcga catcgacggc 480 aacctcgtct gccagggcgc ccgctgcccg cacaagggcg ccaacctcgg cgacggccgc 540 atgaagggca acaccatcga atgcccgtac cacggcttcc gctacggagc cgacggtgcc 600 tgccgggtga tcccggcgat gggctccgag gcccgcatcc ccggctcgct gcgggtaccc 660 acctacccgg tccgggagca gttcggcctg gtgtggatgt ggtggggcga cgagcgcccg 720 acggccgacc tgccgccggt ggcggccccg gccgaggtga cggacaaccg gaagctgtac 780 gccaccaagc gctggacccg cccggtgcac tacacccgtt acatcgagag cctgctcgag 840 ttctaccacg tgacctacgt gcaccgggac cactggttca actacatcga ctacctgctc 900 ctgtacggca ccccgagcaa gttcggcctc gacggccgcg agcggtacct ggccgccacc 960 cggatcacca accaccgggt ggagacggag gcggaggggc agaccatccg ctactccttc 1020 gaccactgcc aggaggacga ccccaccaac accacccact acgtcatcac gttcaccttc 1080 ccgtgcatgg tgcacgtgca gaccgagcag ttcgagacca cctcctggct ggtgcccatc 1140 gacgaccaga acaccgagca catcctgcgc tggtacgagt acgaacaggt caagcccgtc 1200 ctgaggttcg aaccgctgcg ccgtctgctg ccctgggcgt ccctctacat ggagaagtgg 1260 gtgcaggacc cccaggacgt ccgcatcatg gaacaccagg aacccaagat cagcgccggc 1320 ggcgtgaaca agttcatccc cgtcgacgag atgaacgcca agtacatctc gatgcgcgcc 1380 aagctgatcg cggacgcctc ggccgcgccc tcgtcaccgg cgcgggcggc ggagcccgag 1440 ccggaagcgg cggggcgggg cggatcagcg gcccgtgcca cgggcaacgg caggggagcg 1500 gccggcggac gacgcggcac caagcccaag gaggacgccg ccgcgcgccc gtagacccga 1560 agacggggga cggacaagag agagcgagag tgagagatgt acggcggata cgacgcgtcg 1620 accggcccca aggccctggt gacggccttc aacaccgtcg ccgtggccgg cgccgtgtgg 1680 ttcctgttcg gcggcgcgga caccgtggcc gactggttcg gcaccgactt cgacgaggcg 1740 gtgaccctgc gccgggtcct gctggcgacc ctgtcggtgc tctacctgct gcgcttcatc 1800 gccacgaact tcgtgatgct ccagcgcaag atggagtggt cggagtcggc caccatcggg 1860 atctgggtcc tggtgatcca cggcacgatg gcgtacttcg gcggcaccaa cgacgccggc 1920 gtgagcgcgt tcacctggct gggcgtcgtg ctgtacctcc tcgggtccta cctgaacacg 1980 gggtcggagt accagcgcaa actctggaag aagcgcccgg agaacaaggg caagctctac 2040 accgaaggcc tgttcaagca ctcgatgcac atcaactact tcggtgacgc cgtgctcttc 2100 tccgggttcg cgctggtcac gggcaccccg tgggccttcg ccatccccct gatcatggtc 2160 tgcatgttcg tcttcctgaa catccccatg ctcgacaagt acctcgccga gcgatacggc 2220 gaggccttcg acgagtacgc gtcccggacg gcgaagttcg tcccctacgt gtactgaccc 2280 cgcccgtcac gcgcgtacgg cggcctcccc gggcgagggg ggccgccgta ccgggtggca 2340 accacagatc ccacagatcc ccacagatcc ccacagagcc cctccacaga ccccctccag 2400 agatccacag atcccctcca cagatccgag acgaggcacg tatgaccgga gacattccct 2460 tcggagaggc cgaggcgtcc ctgaccgccg aggtgctgcg cgaggtcctg gccggcggcg 2520 ccgaggcgtt cgcccggctg acctccgacg agggcgccgt cgacgacttc ggcttcgacc 2580 cggagctgac cgacgactac ctgctccccg ccctgcgcct gctgtacgag aagtacttcc 2640 gggtcgacct ggagggactg gagaacgtgc cggccgaggg gggcgcactc ctggtcgcca 2700 accactccgg caccctgccg ctcgacgccc tgatgctcca ggtggcgctg cacgaccatc 2760 acagcacgca ccgcaggctc cggctgctcg ccgccgacct tgccttcgac ctccccgtcg 2820 tccgtgacct cgcccgcaag gccggccacg tacgcgcctg ccccgagaac gcgctgcggt 2880 tgctcggctc cggcgaactg gtcggcgtga tgccggaggg ctacaagggg ctcggcaagc 2940 ccttcgagga gcgctaccgg ctgcagcgct tcggccgggg aggcttcgcg gcggtggcac 3000 tgcggtcgcg gcgccccatg gtgccgtgct cgatcgtcgg cgccgaggag atctacccga 3060 tgatcggctc ggcccccacc ctggcccgga tgctgaagct gccgtacttc ccgatcaccc 3120 cgaccttccc gctgctgggc gcgctgggcc tgatcccgat gccgaccaag tggaccatcc 3180 gcttcggtgc cccgatccac acggacggct tccccgagga cgccgcggag gacccgctgg 3240 tggtcgagaa gctcgccggc gaggtgaagg acaccatcca gcacacgctc aacgagatgc 3300 tggagggccg cggctccccg ttcgtctgag ggccgcggct cccggttcgc ccgagggcgg 3360 cggctcccgg ttcgcccgag gaccgtccct ctcgtccggg gccccgcctc agccccccgc 3420 cgacgatccc cggcggcaga tgctgcgaac gctggcgaag gccagaacgg cgaggccgac 3480 gagcgtgacg ccgccgccga ccagctccgc ggacagatgc atgggatctc cctcaggggg 3540 acgacggacg gtgatggtca tatagccatg cgaaccccgc cgtccgcccg atccgcagcc 3600 gcaccgcccc gcgaattcac ccgtagagca gaccggtgcg gccgaggagg ggtggcgatt 3660 gggtggtcgc gcgttcgaac gcttacgatc ctctgttgtg tccaaactga ccgacgtgcc 3720 caagcggatc ctcatcgggc gcgcactgcg cagcgaccgg ctgggtgaaa cgctcctgcc 3780 gaagcgcatc gcgcttcccg tgttcgcgtc cgacccgctg tcctccgtgg cgtacgcgcc 3840 cggcgaggtg ctgctcgtcc tgtccatcgc gggcgtgtcg gcctaccact tcagcccgtg 3900 gatcgcggtc gcggtcgtgg tcctgatgtt caccgtggtc gcctcctacc ggcagaacgt 3960 gcacgcctac ccgagcggcg gcggcgacta cgaggtggcc accaccaacc tcgggcccaa 4020 ggccggtctg accgtcgcca gcgccctgct ggtcgactac gtcctgaccg tcgcggtctc 4080 catctcctcc ggcatcgaga acctgggctc cgcgatcccc ttcgtcgtcg agcacaaggt 4140 cctgtgcgcg gtcgccgtga tcctgctgct cacgctgatg aacctgcgcg gggtcaggga 4200 gtcgggcacc ctgttcgcga ttccgacgta cgtcttcgtc gcgggcgtct tcatcatgat 4260 cgtgtggggg gcgttccgcg gactggtcct ggacgacacc atgcgtgccc cgaccgcgga 4320 ctacgagatc aagccggagc acggcggcct ggccggcttc gcgctgatct tcctcctcct 4380 gcgcgccttc tcctccggct gtgccgcgct caccggtgtc gaggcgatct ccaacggcgt 4440 cccggccttc cgcaagccca agtccaagaa cgcggggaac accctcgcga tgatgggtct 4500 gctggccgtc accatgttct gcggcatcat cgcgctggcc gccgcgaccg acgtgcggat 4560 gtcggagaac ccggccaccg acctcttcca caacggcgtc gcggtcggcg cggactacgt 4620 ccagcacccg gtgatctcgc aggtcgccga ggcggtcttc ggcgagggca gcttcctgtt 4680 catcgtgctg gccgcagcca ccgcgctggt cctcttcctc gccgccaaca ccgcgtacaa 4740 cggcttcccg ctgctcggct cgatcctcgc ccaggaccgc tacctgccgc gccagctgca 4800 cacccgcggc gaccgcctgg ccttctccaa cggcatcgtg ctcctcgccg gagccgccat 4860 gctcctggtc gtcgtctacg gcgccgactc gacccggctg atccagctct acatcgtcgg 4920 cgtcttcgtg tccttcacgc tcagccagat cggcatggtc cgccactgga accgcaacct 4980 ggccggcgag cgggaccagt ccaagcgacg ccacatgatg cgctcccgcg cgatcaacgc 5040 cttcggcgcc ttcttcaccg gcctcgtcct ggtggtggtc ctggcgacca agttcacgca 5100 cggcgcctgg gtcgcgctgc tcggcatgtg catcttcttc gcgaccatga cggcgatccg 5160 caagcactac gaccgggtcg ccgaggagat cgcggccccg gaggaccccg aggaggcaca 5220 gagcgacgac atggtgcgcc cctcacgcgt tcactcggtg gtcctgatct ccaagatcca 5280 ccgccccacg ctccgcgccc tcgcctacgc caagctgatg cgctccgaca gcctggaggc 5340 gctcagcgtc aacgtcgacc cggccgagac gaaggcgctg cgcgaggagt gggagcgccg 5400 cggcatcgcc gtaccgctga aggtcctgga ctcgccgtac cgcgagatca cccggccggt 5460 catcgagtac gtcaagagcc tgcgcaagga gtccccgcgc gacgcggtct cggtgatcat 5520 ccccgagtac gtggtcggcc actggtacga gcacctgctg cacaaccaga gcgccctgcg 5580 cctcaagggc cggctgctgt tcacgccggg cgtcatggtc acgtcggtcc cgtaccagct 5640 ggagtcctcc gaggccgcca ggcgccgggc gcgcaagcgc caggactgga gcgcgccggg 5700 tgcggtgcgg cgcggaccgg cccaccacca ccaggaccgt gaccgtacga aggactcctc 5760 ctcgtccacg tagactggac ggctgttgtc cctgtcatcc ccccgttctc tggagtcacc 5820 ccgccatgca ggcagaaccg aagaagtcgc aggcggaaca gcgagcggtc gcggagccgg 5880 tctcggagcc ggtctcgctg gtgggcgagg agtacgaggt cgaggtcggc cccgtcgccc 5940 acggcggcca ctgcatcgcc cgcacgtccg agggccaggt gctgttcgtc cggcacacgc 6000 tgcccggcga gcgggtcgtg gcccgggtga cggagggcga ggagggtgcc cgcttcctgc 6060 gggcggacgc ggtcgagatc ctggacccct ccaaggaccg catcgaagcc ccctgcccct 6120 tcgccggccc cggccgctgc ggcggctgcg actggcagca cgccaagccg ggcgcccagc 6180 gacgcctgaa gggcgaggtg gtcgccgagc agttgcagcg cctggcgggt ctcaccccgg 6240 aggaggccgg ctgggacggc acggtgatgc cggccgaggg cgacaagctg ccggccggcc 6300 aggtcccgtc gtggcgcacg cgcgtgcagt tcgcggtgga cgccgacggt cgcgccggtc 6360 tgcgccgcca ccgctcccac gagatcgagc cgatcgacca ctgcatgatc gcggcggagg 6420 gcgtcagcga actgggcatc gagcgccgtg actggcccgg catggcgacg gtcgaggcga 6480 tcgcggcgac gggctcccag gaccgccagg tcatcctgac cccgcgcccc ggcgcccgcc 6540 tccccatcgt cgaactggac cgcccggtct cggtcatgcg cgtcggggag aaggacggcg 6600 gcgtccaccg cgtccacggc cgccccttcg tccgcgagcg cgccgacgac cgcacctacc 6660 gcgtcggctc cggcggcttc tggcaggtcc acccgaaggc cgccgacacc ctggtcaccg 6720 cggtcatgca gggcctgctg ccccgcaagg gcgacatggc cctggacctc tactgcggcg 6780 tcggcctctt cgccggcgcc ctggccgacc gcgtcgggga ccagggagcg gtcctcggca 6840 tcgagtccgg caagcgcgcc gtcgaggacg cccgccacaa cctcgccgcc ttcgaccgcg 6900 tccgcatcga gcagggcaag gtcgagtccg tcctgccccg caccggcatc gacgaggtcg 6960 acctcatcgt cctcgacccg ccccgcgccg gcgccggccg caagacggtc cagcacctct 7020 cgaccctggg cgcccgcagg atcgcctacg tggcctgcga cccggccgcg ctggcccggg 7080 acctggggta cttccaggac ggggggtacc gggtgcggac gctgcgggtg ttcgatctgt 7140 tcccgatgac tgcgcacgtt gagtgcgtgg cgattttgga gcccgccgca aaggggctct 7200 gacctgcatt tttcttggct ggatcaggag cggcctgttg cgctcgacct gttctccaaa 7260 gcgcacgacg tagagcttgc ggaccgctcg tgaaagccgc ctgacctggc gttgcacgag 7320 cggtgccgcg atgtcggcgt ggtcggccct tctcctggcg cgaagggaaa ccgaaggtct 7380 tgacgctcgg gtgacgctat ttctgaaggg tcgtcaccga ctggggaggc agggccctgc 7440 ctctcgcgcc cgatgaagca ggttctctct gctccaggta atcgtcgagg gtgccctgac 7500 ggatcaggta gacggtcagg gaccgcaggg tgcagggcgt cgacgcccag gtcgaggatc 7560 atcagggcgc tgtcattggt gatggcgaag gcgccgatca caccgtcgac ggaacaggtt 7620 gcgttcagga gtctgtgcgg gcgccgcacc ggcacggtct ggaagctcgg ctccgaccgc 7680 agctcgccac cagtccgaga ggagccgata ctgtccggtg ccgggtgacc cttcgtgcaa 7740 gcgttgctgc ccccgctcgg cagaccgggg cagcaacgct tgcacgatcg gccggtactc 7800 aacgggatcg tgtggagttt cggaccggaa cggcttggca ggacgtgccc gagcggtacg 7860 gctcctgggc cacattgcac acccgcttcc gtcgatgggt gaaaggcggc acctttcagt 7920 gaaagggggt tccgcccccc cccgggacct tgcgcccacc gtcgccgacc ggctgatgaa 7980 ccggctccgc gctcccgcca ccaacctgac ccgacgtgag accgaagtcc tctcaccggt 8040 cgccgacgga ctgtccgacc aggccatcgg cgcacgcctc cacttgaccg aaggcaccgt 8100 cgatatcacc tggcctgcat ctatgccaac ctcggaaccg actcgcgcac cgccgctgtg 8160 gccactgtca ccgccatcga cgacctcggg ctcatccgcc gctgaacagt atgtggtggg 8220 cggtgtttcc gttctccacg acttcagcgg cgtccggagt tgtggtgctg gctgggcttg 8280 gtgcccgctc ctctgaaccc atgtgaacgc ccacggccag ttcgagccgg acacgccccc 8340 cggacctggc ctccgccgcg gccagaatgc ccggcccctg cacctggtct gcctacctgt 8400 acaggcgagg gcggtccctc ggagccactg cctgtaactc cgaggggccg cccttggccg 8460 actcggcggt caccgcggac gcggtgcggt caggaggcac cgtctgcgtc atcaggcgcg 8520 gctcggccga gcgagttatt ccggcacccg tgggaccaga aatgtcagcc ctgcgtgacc 8580 gcttcgaaga ccgtgacgcg gttgtcgtcg gagagcgagt gggtggggtc ggcgtgcgcg 8640 gcgcggaatg cctccgacga ggtgtaggcg gtgaatgcgg cgtcgtcctc gaagttgagg 8700 acggccaggt agccgtgtgc gcccttgcgg ggacgcagca gccgtgcgtt gcgcagcccc 8760 ggcacgttgg aaagggtggc gcgcatgctg gcggtgcagt tgttctcgaa cgcgccctgg 8820 gcgggcgcgg cgacggtgaa ctcggtgacg gcggtgctca tttctgtctt ctctcggttg 8880 ttggtgtgat gtcggtggct gtcccgcccg gccggggccc gcacggcgat ggcgatgatg 8940 tgcaccgcgt gtccgatcga gttccgttgc ggggtgcggt tacagggctg gagttgggct 9000 cgggtccgcg gtcggctgag ggagcctgcc tgtgcggcgg gcccagattt cgaacgcgat 9060 agtcatgaac gggggtacgg cggccagcag ggcgaagatc gttgtccggc ccagccgcca 9120 cttcagccgg atcgcgacca ggacggtcag ggacacgtag acgatgaagg cggcgccgtg 9180 gagggtgccg aagatccgta cgccgagttc ggtggtttcg gggatgtact tgaggtacat 9240 cccggccagc agacctgccc acgtgcacgc ttcgatgatc gcgatccagg tgaacgcgcg 9300 cagcagacgg ctggtgccgg tttcggcagc ccgtgcggcc ggcgcgtcgg cggaaggcgg 9360 ttcggaggtg ggcgtggagg gtgtctgcgg ggtgcctggg cgtgcgggcc acagggcgcg 9420 gttgccgagc aggcggacga tggcggggac caggagcggg cggatgagga aggtgtccag 9480 caggatgccg caggccatgg cgaagccgaa ctggaacagt tcgcggatcg gctgggtcat 9540 caggacggcg aaggtcgccg cgaggatgag gcccgcggag gagatgacgc cgccggtgcg 9600 tgtcagtgcg gcggtgatcg ccttcgctgg gggctgggtg cgcagttcct gcttgaaccg 9660 gctcatgatg aagatgttgt agtcgacgcc gagcgcgacg aggaagacga agatgtacgc 9720 ggtgacgcgg ttgccgatgc cgtcgtcacc gaggacggtc acggtgaaga aggtggtggc 9780 gcccagggtg gccaggaacg acaggagcag ggtcgcgacc aggtagagcg gggcaaggag 9840 cgagcggagc agcaggacga ggaccacggt gacgatggct aggaccagca gcacgatgag 9900 ggtcgtgtcg cggtcgaggg cggagcggat gtcggcgttc tgcgcggtct cgccgccgat 9960 gagcaccgtg gcgtcctgga cgccggcggc ctgggctgcg gattgtgtgg cctgcttgag 10020 gggaccgatc gcgtcgagtg ccttggagct gtaggggtcg aggtcgagga tgacgtcgta 10080 gaagacggtc ttgccgtcct tgcccatgcg ggggtctgcg acacggctga cgtgatcggc 10140 gtcggtgagc gcggtggcga tgtcggcggg tgcggggctg gagcgcaggt tgtcctggga 10200 atggacgacg acggtactgg gggcgatctc gccgggcccg aattcctccc gaatgaggtg 10260 ctgtccgtgc tccgactcgg tggcggcgcg gaagccgctg agggtgttga agctctcctg 10320 gtagccgagc agtcccgcgc tcagtaccac caggagtgcg atcacggccg aggccacctt 10380 gacgggggcc cgtgcgacca gggcggcgat gcggtgccag atgcctgcgc cgcgactgcg 10440 ttcggcggcc ttgtccacgc ccccgggcca gaagacgctc ctgcccagca ggaggaccag 10500 ggcggggatg aaggtgaacg ccaccagcgc catgacggcc acgcccagag cgaggtacgg 10560 tccgaagccg tgaagtgccg gggagacggc cacgagcagg gcaaacatgg cgagcacgat 10620 ggtcgaggcg ctggcgagga cggactcggc ggtgcggcgc acggcggcct gcatcgcgcg 10680 ggcgcggtct ggctcgtcga gcagggtctc gcggtagcgg gcggtgatga tcagcgcgta 10740 gtccgtgccc accccgaaca gcagcacggt catgatcgag gcggtctggg agctgaccgt 10800 gatgactccg gcgtccgcga gaatcgcgcc gagagtctcc gccacgcgca tagccacgcc 10860 cacggcaaga agcggcacga gcgccatcag gggcgagcgg tagatcgcca gcaggatgat 10920 caggacgagc acgacggtgg ccagcagcag gactttgtca ccgccgctga agaccttcac 10980 ggtgtcggtg gcgatcccgg cggggccggt caccgcgacg tcggcgggcc cggcccggtc 11040 ggacgcgagg gcacgcacct cgtcgaccgc attctggaag gactcgtccg aggggctgcc 11100 ctccatgggc acgatgacca gctgagcacc gcggtcctgc gagaccaact cggccgcagc 11160 gtcgggagcg gtcaccgtgg agaccacgct cacgacatgg tcgggtcggc tggttccgga 11220 aagggccgag gtgatggcgg cgaccgattg cgtggcgctc ttcgcggcgt cggtgccctt 11280 gccgcggacc acgatgatcg ccggcgtcgc gtcctggccc ggaagctggg cgcggacgag 11340 atcacgggcc ttcatggagt ccgaggcggc gggcggcagg ttggcggagg cgttgtcctc 11400 gacggattcc agggccgggg cgaccccggc gaggaggccc gcgatcagga cccagaaggc 11460 caccaccacg gcggcgcgct tcttcgatcc caggagacat cgcagcagag cgggggagtt 11520 catcggttgc atcgggcagc cttcggcagg aagtacggac agaacttagc gacagggtgt 11580 ctctaagttg cgtcaagcta acacgccccc tcggcctctc gggcgtgggg gtaggttggc 11640 gggagacggc acagcgtccg aggtgaagcg gagaaaatgc ccaagattga agccggcagc 11700 gtccgggagc accgggcgca gcggctcgcg cagctgattg acgcggccga ggagctcctg 11760 gaagagggcg gtgccgaagc cctcacagcc ggagcggttg ccgcgcgagc cgggatcgcc 11820 cgcaacagca tctaccgcta cttcaactcc atcgacgacc tgctcgaact cgtcgtcacc 11880 cgcgaattcc ccgcctggat cgacgcagtg gagcaggcca tcgcggccga gaccacaccc 11940 gccgcccagg ctgccgccta cgtcagggcc aacctcgaac aggcagctcg cggcacccac 12000 ggctggcggg ccgcgctcac gcgcgactcg ctctccccgt cggcgcggga gcgggtgagg 12060 aatctgcaca tctcgctaca cgaggcgctc gcccgggtcg tgcgcgaact ggggcagcca 12120 cagcccgagc tgaccgtggc ggtggtccaa gcagtcgtcg atgcgtgcat ccgcagaatc 12180 gaccaaggcg acgatctgac aaccgtgtcc gacttcgcgg ccggagcgac gcgtcgactg 12240 ctcgcggatg acgacttgcc acatcacccg tgacgcaccc cgtccaggcg gctcgcaggc 12300 ccgtcgacag cgaagccccg gcagaacgag ccggatcttg agccgcaccg gagcgtgacg 12360 cagaccgctg gtggctcatg cctcgtctca tccgatcttg ccaccgggcg gccgaccggt 12420 cagtgcccga cgcccatcga ttacgacgtc cacgacccga accagcgcgt tcagtgcgtt 12480 gacgttcgtg gtgcgctcat tggtcacccg gcctctgggg gtcaccagcg cttttagggc 12540 acgagactcg acggtggcgc gtgataccag gcaggcatca tgaccttatg gcgatgacac 12600 tccggcttcc cgacgacctg gacacgaagc ttacggagcg ggctcgtggg gagggttgca 12660 gcaagcagga acttgccatc ggggccattc gtgatgcccg ggaccgggcc gagctgaagg 12720 tcgatgacgt tctggccggt ctgatggaca gcgatgcgga gattctggac tacctgaagt 12780 gagcggcgtg cgctacctcc agatcgacga gatcctggcc atcgtgcgca cggtcaacgg 12840 tgccgagcac agcgtgcgtg acatgggcct ccttgtgtcg gcgatcgaac ggccccggac 12900 gaacgtcttc ggagccgagc tgtatcccac cctgcacgag aagccgcggc actactgcac 12960 tccgtcgccc gcaatcacgc gctgatcgac ggcaacaagc gcaccgcctg gttcgccatg 13020 cgcgtcttcc tgcggttcaa cggcgccagc gccagtaccg tcccgcccca cgggcgccgg 13080 cccgacggac ccgaggcccg tcacgcgctg ctcaccagca gccctctcct cagcagcgca 13140 ctgggaccgg cgctgctgat cgccctgtcc gccctggggg ttctcgccct ggacacggcg 13200 ttgtgggtct cggtggtcag tgaggtggcg gcgccggccc ggtggggctt cgtgggcggg 13260 ctgcgtgtcg gcgccgggcg tctgggagcc ctgatcgccg gcgtactcaa cgccgtgatc 13320 ggtcttggcg tggtcgctgt caaactcatc gccgggcact gagagggcct gtggtggtgt 13380 tcgcggagcg catacggtgg cagaccggtc ggaatcctcg gcgccgcggc cggagcggtc 13440 ccggcacccc ggcgaacagc cgcacgtccc cgtccggtcg ggtcaggtcc gagccgtcag 13500 atccaggtca gtcgccacag gcgcagaagc ccggtgccgt ccaccgcgta ctggccgccg 13560 cccacgtcct ccccggacac cacgaagtcc ttggcctgcc acagcgggac gacgggcacg 13620 tcgcgggcga cgatccgctg aagggcttcg aggtcggctt cggcgtcgct ccggtcggcg 13680 aagcgctgac tgctcgtgat cagccggtcg gcggccttgc tgccgtaccc cgtcgccatg 13740 gtgccgtccg tgccgacgag aggaccgccg aaggtgtcgg gatcggggta gtcggcgacc 13800 cagccgacgg cgtaggcgtc gagctctccc tcggcccagc tcttctggaa ttcgtcccat 13860 tcatatcctc tgagggtcac cttgaacagc ccgtcggcct ctagttgctt tttcacctcc 13920 gcagcctcct cgtgggctga tccgcgtccc gccgcgtaac cgtaggtgaa agacagcggg 13980 atttcctcac cggcctcgac gaggaggcgg cgtgcctttt cggcgtcctt gtgagggtag 14040 ttgtcgaaga aggaggtggt gtggcccgtg atgctcgtcg ggatgaggga gtagagcggg 14100 tccacggttc cgtcgtagac gtcgtaggaa atccggtccc tgtctatcag ccaggccgcc 14160 gcctgccgtg cgcgtctgtc gtgaaacggc ttgccgcggc ggttgttgag gtacaggttt 14220 cgagtctccg cgctctgcgc ctccgtcacg cgaagccccg gatcgctcgg gttcagatcg 14280 gcgagcattt cggggggaag ctgtctgagg gcgacatcga tgcggtggga tatccaggcc 14340 cgggcgagtg agtcgggggt gtcgtagaag tggagttcga tcggccggcc ggtgttctcg 14400 gcggcgccct tgtaccgagg gttgggcgag agggagatct tctcgccctt cgcgtaggag 14460 acgacgccgt acggtccggt cccgtcgatc cggccgtccg agcgcaggga gtccgccggg 14520 tacgtggtcg agtcgacgat cgagcccgcc ccggtcgtca gcttgaaggg gaacgtggcg 14580 tccggtgcgg tcagtcggaa agtgacggtc cggtcgcggg cgtccatcga ctcgatggtg 14640 tccaggaggg acgacggccc cacgtcggaa tctatcttct tgacccgttc gaacgagaac 14700 cggacgtcct tggctgtcat tctgcgtccg ctggagaagg tgatgtcatc ccgcagccgg 14760 catcgatagg tgcgtaggcc ggaatcggtg aaggagcagc tttcggctgc gtcgggaacg 14820 ggctccgcca ctccgggctc cagggtcagc agtgtctgga agacattgct gtacagagtg 14880 gtcgagccgg agtcgtagcc gccggccggg tcgagtgacg tcggcggttc cgtcgtcccg 14940 accttgatgg tggtgccctc ctggtcgtcc gtcgggtaaa gcagcagacc ggctgccagt 15000 gccgtggcga tcaccgtggg tgtgatgacg gacgcacgga tgtgcgcacg aataggtctc 15060 atgaggctcg tcctcgcaag atcgagacga acaggaattt tcgtacccct gggtggagag 15120 tgcgtcggcc aagtatgcgc aggcgtcgct tccttcggag cccgacggca cttccggaac 15180 gaagtcttat gactgacacg gtggaactgc tatgccccgt tcggcgagag ggccgccagg 15240 ggtcggcacc ccctctcagc agccgttccg cctcgtctcc ggtggtcctg cggacccgct 15300 tgcgcgggtc ccgcccacgg tctcactcct cgatgccatt ccctgtgcaa tgtcacctgt 15360 gccatgttcc gtgttgcagg gcgtggccat gccaagtcgg gaggtcgttc gtcttccgtc 15420 aggtggcagt gcggtactcc gtttcccacg tcctctcccc cttcagtcgg ccgtgctccg 15480 cacggccgga tccctcatgg gaggcgctgt gagaaagtca ctggtacggc gaggtctggg 15540 ggcggcgctg ccgctggccc tgaccgtcgc catgagcgtg ggcctgctgt cgcagccggc 15600 cggcgcagcc gggaacaccg ggtccgtcgt gcacgtcgcg gcggacgacc cggagcacgc 15660 gggacccccg cccgtcgcgc agtcccccac cgccgagacg gagcacgtcg cgcagggacg 15720 cacgagggcg tccgagcttc cgcccgtggc cgcgagtaag gacgcgctca aggaggtgta 15780 cggcaagacc gcgaaggcgc cggtccgtcc ctcgaagtcg acggacaagg cggtcgccgg 15840 caagaccggc aactcccgtg cgcgtgccgc cgcgtgcaac gtctccgact tcaccagccg 15900 gagcggcggc gcgctggtcc agcagatcaa ggcgtccacg accgactgcg tcaacaccct 15960 gttcaacctg accgggaacg acgcctacta cgccttccgt gagtcgcaga tgacctcggt 16020 cgcctacgcc ctgcgcgacg gctcgacgtc ctacccgggc aacgcctcca ccggtatgcc 16080 gcagctcgtg ctctacctgc gcgccggcta ctacgtgcac tactacaacg ccggcacggt 16140 gggcacctac ggcagcagcc tgcagaccgc gatacgcgcc gggatcgacg ccttcttcgc 16200 cagcccgcac tcccgcgacg tcaacgacgc caacggcgag acgctcgccg aggccgtcac 16260 gctcatcgac agcgccgagg agaacgcccg ctacatccac gtcgtcaagc gactgctggc 16320 ggactacgac tccacctgga actcgtcgtg gtggatgctc aacgcggtca acaacgtgta 16380 cacggtgacc ttccgcggtc accaggtgcc cgcgttcgtg agtgccgtgc agtctgaccc 16440 cggcctgatc gacgcgctct acaacttcgc gagcggccac ctcgcgctgc tgggaacgga 16500 ccagtcctac ctcacgtcga acgcgggacg tgaactcggc cggttcctgc agcattccgc 16560 actgcgctcc aaggtcagcc ctctggccgg cggcctgctc aactccagct ccatcaaggg 16620 ccggacggcc ccgctgtggg tcggtgtcgc cgagatgacc gactactacg acaaggccaa 16680 ctgctcctac tacggcacct gcgacctcca ggcacaactg gcccgctccg tcctgacggt 16740 gacctaccca tgcagctcca gcatcaccat caaggcgcag cagatgacct cgggcgagct 16800 gtcctccagc tgcagcagcc tgcgcaacca ggacgcctac ttccacaacg tggtccgtga 16860 caacggcccc gtcgcgaacg acaacaacag caccatcgag gtcgtggtct tcgactccag 16920 caccgactac cagacctacg ccggcgcgat gtacgggatc gacaccaaca acggcggcat 16980 gtacctggag gggaatccgt cggcggccgg caaccagccg cgcttcatcg cctacgaggc 17040 cgagtggctg cgtccggact tccagatctg gaacctcaac cacgagtaca cccactacct 17100 cgacggccgc ttcgacatgt acggcgactt caacgccaac atcaccaccc cgaccatctg 17160 gtgggtcgaa ggcttcgccg agtacgtctc ctactcctac cgcggcgtcc cctacaccga 17220 ggccacgacc gaggcggggc gtcgcacgta cgcgctgagc accctgttcg acaccacgta 17280 cagccacgac accacgcgca tctaccgctg gggctacctc gccgtgcggt acatgctcga 17340 aaaccaccgc gccgacatgg acaccgtcct cagccactac cgcgcgggaa actggaacgc 17400 cgcccgcagc tacctgaccg gcaccatcgg cacccgctac gacaacgact ggtacacctg 17460 gctggcggcc tgcgcggccg gcaactgcgg tggcgggggc accaacccgc ccgggaacca 17520 ggcgcccacc gccgcgttca ccaccgccgt ccagggcctg aacgtcacct tcaccgacca 17580 gtccaccgac gccgacggca ccatcgcctc ccgctcctgg agcttcggcg acggcaccac 17640 ctccacggcc accaaccccg tcaagacgta cgggtcggcc gggtcctaca cggtcaagct 17700 gaccgtcacc gacgacaagg gagccaccgc caccgccacg aggacggtca ccgtcggcag 17760 cggcggaggc ggcggcaccg aatgcaacgg gaccgacacc cgggaactgg gccagaactg 17820 ccaacgcggc aaccagtccg ccaccaccgg caactacgcc tacctgtacc tctacgtccc 17880 ggccggcacc acccagctga agatcaccac ctccggcggg acgggcgacg cggacctgta 17940 ctacagcacc agcggctggc ccggcaccac gagctacacg cagcgggcca cgggagccgg 18000 caacaaccac accctgacca tcaccaaccc gccggccggc gccaactaca tcagcctgca 18060 cgccgtcagc agcttcagcg gcgtcaccgt gagttccgcc tactgaccca cggctccgca 18120 ccaaggcacg accctcacga cggcccgggg cggctctccc cgccccgggc ggcgtccggg 18180 gcggcggcag gggggagacc tccgtcgccc cggaccgaga acacatcgcc cgcccgcaca 18240 cgggcatccc tacctcccag gaggcagagc gtgaagtcat tacccgcacg caggcgacgc 18300 cgcgccatgt ggtccctcat catgtccgtc ggtctcacct gcgcactcgc cacacccgcc 18360 gtcggcagcg gtgaccaggg cacgtcacgg ctcagcgcct cgcaacaggc cgcggccggc 18420 caactcgcag cggaccagca catctccacc caggaggcac agcggcgcgt actgcggcag 18480 gagcggctca ccggcgtcgc aacagcgctg cgtgagcgcc tgggttcccg cttcgcagga 18540 gcctggatcg accagaagca cggcggcagg ctgaccgtcg ccgtcacccg gtcgacggcc 18600 acggccctcg tcgaggcccg gtccgctcag gctcaggcac ccgacacgac caccgtcgtc 18660 gtcgaccgca gcctgcggca actcgaccgc atgtccgcag gactggccca ccgtatcgcc 18720 gcagcgaaca agggcgccgc ccacggcctg cagtccgcgg tggtggtgca ggacaacaag 18780 gttcgtctgg acctgccacg gggcaagacc ctcacccccg cccagcacgc agtcgtggag 18840 tgggcgaagc ggaccctcgg cgatggcctc gaggtcagca cctacgcgca tgcctccgaa 18900 cccttctact gcggcggcca gtactcgtgc gaccccccgc tgcgctcggg cctggccatc 18960 tacggcacga acgtccgctg ctccagcgcc ttcatggcgt acagcggcag cagctactac 19020 atgatgaccg ccggccactg tgcggaggac agctcgtact gggaggtccc cacctacagc 19080 tacggctacc agggggtcgg tcacgtcgcc gactacacct tcggctacta cggcgactcc 19140 gcgatcgtca gggtcgacga ccccggcttc tggcagccgc gcggctgggt ctacccctcg 19200 acccgcatca ccaactggga ctacgactac gtcggccagt acgtgtgcaa gcagggctcc 19260 acgaccggct acacctgcgg gcagatcacc gagaccaacg caacggtgtc ctacccaggc 19320 cgcaccctga ccggcatgac ctggtccacc gcatgcgacg ctcccggtga cagcggcagc 19380 ggcgtctacg acggctcaac ggcccacggc atcctcagcg gggggccgaa cagcggatgc 19440 ggcatgatcc acgaaccgat cagccgagca ctggcggacc gcggggtcac gctgctggcc 19500 ggctaagcag cccgggcgga ccgtgagtac gccgccccgg tcacatcacg aggacgtcga 19560 ccgccgcacg cgcggtcggc gtctttcccc gtgctccgct ccgtccgcca cccagcggac 19620 tgggggcggg ggcgtggcac gtcgtgcacg ccgcagcgcg gtggaacccg tcggccgatt 19680 agaccgtacc ggggagcgcc tttccggctc cgttcgtggg acgggcgggt gcgtatgcgc 19740 gcgtcaccca tttctggaag tgcggagcct gcgacagcag ttgccagtgg gcgcgtacgg 19800 catgatggtg caccacctcg acggccgacg cctcgaccga atcccgccgc cagacgagca 19860 gatgccgctg ccacagcgga tcccccgcga ggggtttaac cagtactccg cccaccgggc 19920 gcatggtggg ctggacggcg gccaccccca gacccttggc gatcatcgac tgcagttggt 19980 cgagcatgtg gaactcgtgg gtgacggcgg gcctgaatcc cgcggcccca caagcgtcgt 20040 agaaggcgcc gggccagccc accccgtcgt ccgcggagac gaaccacgcg tcctccgaca 20100 ggtcggccaa ggacacctcc agccggtgcg ccagtgggtg atcggcaggg gtggccacga 20160 acaccgggac ggttctgata gctcggtggt ccagcttcgg agagtgtcga agaggcagcc 20220 ctgggtagtc gcaacccagg gcgacgtcga gctcgccggc ctctaggaga tcgatgagtt 20280 ctccggtcgc gtacacactg ctgaccgaga cggtcagatc ggggcaggct tcacggagga 20340 cgtcgagcaa ggtgggtacc accggtgtgt tgatggcccc gaggcgaagc cgacgtgtcg 20400 ccccggacga gcggggaggc cgcagccgtg cgagattgtc ggagagcgcc aggatctccc 20460 gggcccggcc gacgacctgg gcgccgtagg cggtgagctc cacgcccgcg ctgctgcgca 20520 ggaagacccc ctcgccgagc agtccctcga tgcggcgcag ttgggtactc atcgccggct 20580 gggtgtatcc gagcgccgca gcagcccggc cgacgccccc cgcgtcggct atcgcacaca 20640 gcacgcgcaa gtggcgcagc tcaagttcca cgggggcacc tcgctccggg cgaacagagt 20700 tccattatgc gccaggagga aggcggtggg gaatccggga cggcctgacg ccttcggtcg 20760 accagtagcc cgagggttat ggatgagccg gagcctctgg tatggcctgg ccggttgttc 20820 ccgggtgacc gccgtggaaa tctcggacct gcgtgttggt ccgcagaggc gactgcggaa 20880 gcctgaagcg caccgccatc gaggagcgac atcatgcctc acacctgcat cagcttcacc 20940 gtcgaagcga ccggggccgc ggttcaccgc gcccgccacc gcgtctccac cgcgctgagc 21000 tggtggggag ggccggtcga ggaagagctc cgcttcagcg cggaactcgt gacctccgag 21060 ctcctcacca acgggctgcg gcacgcgggc gggcccatga ccgtcgagtt gacgctggtg 21120 cacgacatgg tcgtcgtcgc ggtcctcgat gacagccggg agctgccgcg gcctcggcag 21180 acggaggcgg acgacgagtg cgggcgggga ctcgccctga tcgaggacct cagtctgata 21240 cggggagtcg agaccacttc ccgcgggaag cgctgctggg cggttctgcc gctgcggacg 21300 ccacaggagc gggctatcga gtcggctccg gctgaggagg cggaccacgg cttcgaggca 21360 gaccgggaac gctggtcact ggctccccaa ggaagcggac tactggcgag tctgtttccg 21420 gcgatgtgag ttcgtcctcc tcgggcggcc cagtagccga cccagggcag gcgggcgtgc 21480 ctgagggcgt gatgacgctc gtctgacgct ctggccgctt tcaagctgca cagcgagccg 21540 agaaacagcc tttgacctgg ccttttctgc ggctgcctca ggccgacatc tttccgatga 21600 cgcaccacgt ggagtacgtg gcgattctgg agcctgctgg caaggggttc tgacctgcgc 21660 ttttgttctc ctgcggcggg cgcggcaagc tcgtgcgggg cagttgggtt tcccgaaggc 21720 cggtgctcgt gtgtccggcc ggcgggtggg ctgccttcgt ttcagtgggt gcgagagggc 21780 actcggacgc ctgagccgag atgcggttcg ttcggcacca tggggtccgc aggatgaccc 21840 ggtcagcgac cgctggcacc tgtggaagaa cctttgcgac aaggccctgg ccgaggttcg 21900 ctcccacagc gcctgctgga ccacagcgaa cacaccccgc ccggtcggcg tccatgagca 21960 gaccacccgc gaacgttggc atcagctcca cgacctcctc ggcaagggtg tcggcttgct 22020 cgaatgcgcc cgccgcctga acctgtccct caacaccgtc aagcgctacc cgcgcacccg 22080 cgatcctgaa gccctgcgcc ccgtgaagca gctgtttcgc gaggtccagg agcagggctg 22140 caccggcagc ttcaccctgc tctaccgcag cacccagggc cgggcagaag gcgaccggcc 22200 cgtcggaggg tcgcggcttg acgctcaccg tatccatcac tggaacggcg acgtctgatc 22260 ccgtctgccc ggggcttggg tcccggctgc ggcccgtagg cccggctcac cccagcaccc 22320 atcactgttc gagagtgatt acctctccgc cggacacatg gaaatctgca tcggctggag 22380 tagacattgg gcagcagtgt ggttatgttt ctcctgtaac ccagaaggac cgcagggccc 22440 ggcagagacg aactgccggg cagcagtacc cgcagttgca ggacggtgcg gtggtggagt 22500 gtcgaagcca ggatggtgca ggacggcgac gggactgacg accggaccgg gcggcccgca 22560 gtggtcaggg gccgccaccg cagtgcagta cccagcagcg aagtcagtga gcggtacctc 22620 ggtgaaggcg tcggctgcgg acgcgcgcgc cgggaggttc ggcagtggtg gttccaagcc 22680 agagcagacg caggacgggc aacggggccg actgtcggac agtggcgctg tcacaggtca 22740 ctgagaggtt cgtgtcacca gcagtagagc agtaccagag gaaagaacgg aggaaccaag 22800 cgccatcagg atcgcccggg cgcagttttg ggcccgggta ccgcaggaca tcgatagtga 22860 ggtggtctcc ggtcaagaaa ccgcgatccc cgcgcccccg gcagcaggca ggtcgggtcc 22920 gcggacacag aaggccggtg cagtatcagg gccggcagat ggtgtaggag ttccttcggg 22980 gccctggtgc cgcatggcac cagggcccct ccatgcgttc cgcagagagg tgcagatgac 23040 agcagacgat tcgtacggcc gtctcgacga cgacgattac cccgcctaca ccatggggcg 23100 ggcggccgag atgctcggta cgacccccgc tttcctgcgg gccgtcggag aagcccggct 23160 gatcacgccg ctccgctcgg agggcggcca ccgccgctac tcccgctacc agttgcgcat 23220 cgcggcccgc gcccgcgaac tcgtcgacca gggcactccc gtcgaggcgg cctgccgcat 23280 cgtcatcctg gaagaccagc tccaagaagc gcggcgtatc aacgaggaac tgcagaggcg 23340 cccggccggc ctggtggaca aggccgaggg ctgaggccgc atctgccggc cggtcctgtg 23400 agggctcgcc tgccaagacg ggaagccctt gccgcaacga gaagaggcaa ctgtccgcac 23460 cgatgtgctg ggcccggtcc tggctaggac tcccgtcttc ttgccggagc gatgcggctg 23520 tggacgcgga accggacggc agtgtcgtcg ggcgcggagc gcggggcgca cgtcgatggc 23580 gacaggaccg gcgaaggtgt attcgtgttc ggcggtgtga cggcgcacct ggccggcgag 23640 ggcggcggcg caggtgtcac agggacatcg gttccgactt ccaccacccg tccgggttcc 23700 accagcgtgt catccacctg atccaggctg ccgcggtagg tgctcgacgt cgggggtgta 23760 cgggggcagt tgtaccgttc cgccgcgagg agtgacccga ttgaccaccg gcctgtggcg 23820 ctcaggaacg ggctggactg tcgcagtccg ggccaactca agcccgacca tgaggccgac 23880 cacggcgccg cgcgaccccg accacagcta cacgcgtggc atgaccaagg cggcacatgc 23940 ttcgaacgag ccatctcatg tgtgccggta tgaacgtgat cgacgtcccc ggcactctgg 24000 tgcggacgca agccgtctgg ggcgccaccc acgactggct cgccgccccg cccccgcggc 24060 gccaccgtcc gtcccgccct gcgtcgtcgc ccgtgtggcg tcatgacggc gacagacttc 24120 ctcgcgtatg ggccgaccat acggccaacg ccagaggtaa agcgctgtcc atggtgagtt 24180 ccctgaacag aagggctggc gggacctcct ttccaagacc gtgctgcagg agtccgtcag 24240 agcgcaggta atcccgtgct gtccgcgacc cagggctgtc ctccgtctgg ccgagggtcc 24300 tcgtcttctg ggcgacatcc ctttagcgtg ggcggtagcc gccgaaggga ggcgccatgt 24360 cggacgaatt gacgggcccg ttgggaacgg caatgcggga ggtcacgttt ccggaccggt 24420 ctcgcgggat catcttggtg cgggctggaa caccgcaggc cgaggccgag gcaatggccg 24480 cccgtatgtg ggccgagatg ccggaaggct gacgtgcccg aacgcagaca acccgtaccg 24540 tcctcacacg cattcccctg agccgtcggc catggaacgg aaccagccgt acgaaccccg 24600 gaggcgccgt tgcggtctct gcggcgaggc cggggccacg cagggcgaag aggccgcgcc 24660 gcgttctgcc gcctggcgcg gctgccggct gttcacgaga acaccgaggg aggagtcgcc 24720 cgcctcttgc ccggcgcgtt gccgggtgga gagcaggtgg tgaaggactg gctcgctgaa 24780 ggcggccgag gcgacctcgt cggccggcct gaacggcttt cactgtccca gcggcggcag 24840 gccgccgaca caggcatgct ttgccatctc cctcgctgtc tactgacccc agcagcagga 24900 tccagtacgg cgtcgcggcg ctgccgcctc actcgcgcat cgatcgggga atgcggcatg 24960 tggtgagggc ccggccggcg tgccggtcgg gccctcacac tgttttggtg tcggcgcgtt 25020 tgtcgtgtcg gtcagacgga caggtggggg gcgccgagca tggcggaagc ccgctgcaac 25080 ggactgtcgc tgcgcgcggg ggcggcctcg ggaagggtgc ggcaggtgaa gcccagctgg 25140 gccatggccc ttaggatttc gccggtgctg aagtcgcggc ggtcctggcg ggtgatgacc 25200 tggccgacct gcttggcggg gtagtggcgt cgtccgatga tcacggactc gccggtgacc 25260 ggttcgggtt tgacgccctt catcgattcc agcacgccgc tcttggtcag gtcgaacggg 25320 aagcgggcaa tgacacagcg catgatgcct cacaggcagg agagttacgg ggccggccgc 25380 cgtctggcgg ttcagcggga gagagcgagg acgcccaggg cgctgccgtg ttcgtcgacc 25440 acgggcacca gcccgagccg tccgaagggc accgcgtcct cggcttcctc cctcgtggcc 25500 gacggtgaga cgaagggctc gctgtcgtcg gtgatgtcac cgaggcggag ccggtcggtg 25560 tatcgggagc tgtcccggac ggcggtgagc cgggcctggg tgaccaggcc gacgcaccgg 25620 gcatcctcgt cgcagacgac cagatgctcg gcacgggcgg cggccatcac ggacagcgcc 25680 acctcgacgg tcatgtcgta ccagacctgt ggcccggcgg cgtccatgac gtcggccacc 25740 gtgccgcgca atgggagagc gcctacggag cgatcctgca actgtcctgg cgtcaagggg 25800 tgcctcctgc gcagacgggc ggggttcctg atcaggacgg tcctaggcgg ccgcgccagc 25860 cgtggacttg agtgcggggg tacgccgcgt cgccgaggcg gggcggcgtc ggccgcgtga 25920 ggtggcgccg cgcttcttgg ggcgttcagt cgccggggcg gtgatgacga ccgggatgcc 25980 ggtcggggcc tgggctccgg tgatccggct gagggcctcg tcgcccgggc tgacctgggt 26040 ggtctgcggc cggatcccgg cttccgacat gagacggacc atgccgcggc gctggttcgg 26100 ggtgacgagc gtgacgacgc tgccggactc gccggcgcgg gccgtgcggc cgccccggtg 26160 gaggtagtcc ttgtggtcgg tcggcgggtc gacgttgacg acgaggtcga ggttgtcgac 26220 gtggattccg cgtgccgcga cgttggtcgc caccagcacg gtgacgtgcc cggtcttgaa 26280 ctgcgccaga gtgcgggtgc gctgcggctg ggacttgccg ccgtgcaggg cggcggcccg 26340 taccccgctg ttgagcaggt cccgggtcag tctgtcgacg gcgtgcttgg tgtcgaggaa 26400 catgatcacg cggccgtcgc gtgcggcgat ctcggtggtg gccgcgtgct tgtcggcgcc 26460 gtggacatgg agtacgtggt gctccatcgt ggtgacggcg ccggccgagg ggtcgacgga 26520 gtgcacgacg gggtcgctga ggtagcggcg tacgagcagg tcgacgttgc ggtcgagggt 26580 ggcggagaac agcatgcgct ggccttcggg acgcacctgg tcgagcagtg cggtgacctg 26640 cggcatgaag cccatatcgg ccatctggtc ggcctcgtcg aggacggtga cggagacctg 26700 gttcaaccgg cagtcgccgc ggtcgatgag gtccttgaga cgtcccggag tggcgacgac 26760 gacctcggcg ccaccacgca gcgccgacgc ctgcctgccg atcgacatcc cgcccaccac 26820 cgtggccagc cgcagcttca cagagcgggc gtacggggtg agcgcgtcgg tgacctgctg 26880 cgccagctca cgtgtcggta cgaggaccag ccccagcggc tgccgaggct cggcccgccg 26940 gccggccgta cgggccagca gagccaggcc gaaggcgagg gtctttccgg aaccggtgcg 27000 cccgcggccc atgatgtcgc ggccggcgag ggagttcggc agggtcgcgg cctggatcgg 27060 gaacggcacg gtcacccctt gttggccgag cgcggccagc agttccccgg gcatgtcgag 27120 atcggcgaag ccctccgcag cgggaagcgc gggggtgatc gtccggggga gggcgaactc 27180 cccctgaacg gcgccgggcc ggcggccgta accgccggag cggctgggtc cggccggccg 27240 gcgcggcgcc ggcgaaccga agcggctgcc gccctttccg gagtcggcac cgccatgacg 27300 ggtgcgagcg aagcggtcgt tcgtgcgtgt gcggttcata cggaaccttc ctcgatgcgg 27360 cacatatcaa ggaatttccg aagcaatgag cagcacggag aatcgcaaga atggaccggt 27420 gggccttgcc agcggatctg gccgacagaa aatctgtgcg gcacgtgcgc tggaatgatt 27480 gggggtgctg tgggctcgat attcgaagcg tccactgcac tgtagctatg aaggatgcgg 27540 ctgcaccttc gaaggacgat ccgtgtgcgg taaacacacg ctgtccggag cgtcgtccgc 27600 aggtgaaatc actgcgggaa acgcatgtag ctggggcccg caccccgaag gatgcgggcc 27660 ccagctacaa gtacgtgaca gtcggcgtca ggcgggaacg atgttctcgg ccgtcgggcc 27720 cttctggccc tgcgcgatgt cgaagttcac cttctggcct tcgagcagct cgcggaagcc 27780 ctgggcggcg atgttcgagt agtgggcgaa cacatcagcg ccgccaccgt cctgctcgat 27840 gaagccgaag cccttttccg cgttgaacca cttcacggta ccagcagcca tgtcatttct 27900 ccttcggggc agtcgtacgg gatccgcacc gcgcggacct cgtgtcgccg caatgatcac 27960 cccgcccgga aaaagaccgg agatgtaaaa gtgcttccag gggtactgag cccgaccgga 28020 gcacttgaaa tttcgggaac cacaactgca actgacatcg acagtagcac gccacagcag 28080 ccactgtgcg gtgaagaacg ccaccttgct tattgcggca gagaatctat ccgcatgctc 28140 cgatgaaaac tcaaaccgcg cgcacagata ttgaccttcg cgcgacgcca tatatcgcat 28200 gccgcgctcg cgtgatccgg tcccccacca cgctctccgc tactgcacgg gtcgcaccgc 28260 cgcgggggca gacaggtccg gccatgacgc cggccatgct cggggcgtag cggacgcctg 28320 ccggtcgggt gtacgtctcg cgcgcggcga gcactgcggg ggaggggccg gttgccagac 28380 gtcttgcctg gcaaccggct gtcggctcgg gctggttggt cagccgtggc aggtgatgtg 28440 gttctgcgcg cccgcttccg tgaacgcgcc gcagccccgg ctgccttcta ccaggccgac 28500 cctcaggagg cgtgacccgg ggaagccgag gatcagcggt agtcgtcagg ggaggcttcc 28560 ttgccgccgt aggtgacgtc ctcgaagtat gcccaggcat ccggccggct gccgtccacg 28620 tccgtcaccc cgtatgccct ggccagttcc ccgctggagg tggacttgcc gttccaccgc 28680 ttcgcgcggt ctgggtcggc ggccagcgcc gcgaccgtac gggccaggta gtgcggggac 28740 tccgcgatcg cgaacgtcgg ctcttgggcg atcgcgtcac gccagttctc ctcactcaca 28800 ccgaagtggg agagcatctg ctccgaacgc aggaagcccg gggacaccgc gaccgccgtg 28860 ccctcgtact ccgccagctc ctgagccagc ccgaacgcga ggcggatcgg ggcgttcttc 28920 gccaggtcgt agtagatgtt ctcgcggtag cggcggttgg agtgcgcggt accgtcggtg 28980 acttccacat gcagcggcgc gtcggagcgg atcagcagcg gaagcagcag cgccgccgtg 29040 atcacgtgcg agcgcgcgcc cagctccagg atccgcaggc cgtcggcgag cggtgtctcc 29100 cagctcttct tcccgaacac cgaggtggcc agaaggtgct cgccgcccca caggtcgttg 29160 acgagaatgt cgagccgctc gtactcccgg tcgatccgct cgacgagggc gcggacctgg 29220 gcttcgtcga gatggtcggt gggaactgcg attccggtgc cgcccgctgc ggtgacgagt 29280 tcggcggtct cctcgatggt ctcggtcgtc cggccgacct cgctggcccg ggcccgggtg 29340 gttcggccgg tcacatacac ggtagcgccg gcccgcccca gttccacagc ctgagctcgt 29400 cccgccccgc gggtagcgcc cgccacgagg gcgatccgtc ctgccagcgg acccttcgga 29460 ccggcctgct cggtgttctc agtggtctgc ctggtgatgt cctcgttgct catgtcatcc 29520 atcgttcacg ctaaaaccga cagaacacgt caccttttat gtggggggta ccgcgcatca 29580 tcccggccat agcgccaact acgtcctcgc actgagcgtt ttcagcgtgg gccaccgatc 29640 gggtgacgcc ggtcaggtcg gggtaggggc cgcaacgcac aaggctcgcg tgcacgacat 29700 ggccaccgcg cgcatgatct cccagcggga gcccagccgt ccccggcagc cccagccgct 29760 gagaccagct cacccgggac acccggtccg acaccgcaca cgatcaagta gtcgacctcc 29820 agacgcgttc agcagcccac atcccaggag ccgtctaccg tcccaggaac ccctgctccg 29880 ggaccatcgg gctcggcacc gggagtgcac agttgatcag taactggcaa cgagctcgtg 29940 cacggtaagc ggtgaggtgt cgaggtccag atgggcggcg gcggtggtgc ccccagcggt 30000 cggccgaccg gcatgccgag cgggcagccc accggtgtgc cgagcggcgg acccggcggc 30060 ggcacgggca tgggcggcac ccccaccccg cagcacctga agtcggtcag gaccggccgc 30120 gtgacgggct tcgggtcaga cctgtgcggg gaacagcagg cagtcgtccg ggcggatgat 30180 caggttgatc tcgccgtccg tgtgccggac ggggctctcg gcatggacgc gcacgtcgcc 30240 gatgctgagc tcgtactcga atcgcgctcc ggtgtacgag cactgctcga tcctcgcccg 30300 gagcacgttg acggcaccgt cgtgcggggc gtcggcgcgg tcggtgagcg tgatgcgttc 30360 cgagcgcagg cccacggtgg cggacgaccc cgcggagcag gcgccggcca ccctcaagcg 30420 ctgaccggtc tcacccagtt cgacctgtac ggctccgccc tcggtggcgc cgacgcgccc 30480 ctccaggagg ttgcagcggc cgatgaagcc ggcgacctcg ggagtggcgg gagtctcgta 30540 gatctcggtc ggtgtgccca cctgctggag gtgtccgtgc atgaacacgg cgatgcggtc 30600 ggacagggac atggcctcga cctggtcgtg ggtgacgtac acggtggtga tgccgacctc 30660 ccgctggagg tccttgagcc agacgcgggc ctggtcgcgc atcttcgcgt ccaggttgga 30720 gagcggttcg tccaggagca gcacgccggg ggagtagacg atgcctcggg cgagggcgac 30780 gcgctgctgc tgtccgccgg agagctggtg ggggtagcgg tcgcgcaggt gagccatgtc 30840 gaccttggtg aggacgtcgt cgatgaggcg ccgttgctcg cccttggtga ccttgcggag 30900 cttcagcggc agtgcgaggt tgtcggcgac ggtcatgtgt ggccagagcg cgtacgactg 30960 gaagaccagg ccgagattgc ggccttcggg gggcaccgtg ctgcgccggg tgccgtcgaa 31020 gaagacctgg tcgccgacac ggatggtgcc cgagtcgggg gtctccagac ccgcgacgca 31080 cgacaaggtg gtggacttgc cgcagcccga cgggccgagc agagtgaaga actccccgtc 31140 cgcgacggtg aagttgacgt cctccaggac cgcggtcccg tggaaggact tcttgatgtt 31200 ctcgacgacc agctcaggca tgcttcttcc ccttcaggag gagaccggcg aggccggcga 31260 cgacggcggt gacggcgatc tggagggtgg cgagggcggc cacggagccg gtctcaccct 31320 gggtccacag atcgatggcg gtggtgccga tgacctgtga ctcggctccg gcgaggaaca 31380 tggcgggggc gtactcgcgg atcatctggg tccagatgag caggaacgag gcgagcatcg 31440 cgggcacgag gagacggagc atgatccggg acaccgtgcg ccaccagtcg gcgccggcga 31500 cgcgtgcggc gttgtcgagt tcggctccga gctgcatggt cgccggggag atcgcgccgt 31560 acgccgacgg gagtgcccgg atgccgaagg cgatgatcag cgcgaagagc gtgccgcgca 31620 ccgcgtcgcc gccgggtatc caggtgaagg cccagaacag gccgatgccg acgatcaggc 31680 ccgggaccgc gtgcggtgac tgcgctgtcg tctccaggag acgggcgaag cggaagtcgg 31740 agcggcgtgc cacgaggacg accaccgtgc cgaacagggt cacggccacc gcccccacga 31800 aggccacggt gatgctgttg acgatcgact cggtgtaggg ggcgtagtcg aagatcagac 31860 ggaagttgtc cagggtgagc aggtcgaacg ggttcaccag cggagtgagc agcgaggtga 31920 acgcgcgcag gatgagcgcg agcatcggca gcagtgcgcc gaagacgacg tacagaccga 31980 cgaaggcgaa gcccagccac ttccaggcac cgatgtcgag caggtcggag cgggtcgcct 32040 tgccgcgcac cgacacgaac cgctgggcgt gccccagcag ccgcgtctgg aacacgacca 32100 gggcgatggt ggtgagcagc atgaaggtgg acgccgcgcc cagcaggccg tagtccggat 32160 tgatcgagtc gatgccctgc tcgtagagga agttggagaa gagggtgatg ccggcgggct 32220 cgcccaggat gagcgggatg gacagggtct cgatcgccgt gccgaagatc agcagacccg 32280 cgtagagcat cggcgggcgc agcatcggca ccacgaccga gcgcaggacg cgcagaggcc 32340 ccgcgccgac gctgcgggcc gcgttctcca gagaggtgtc ggaggcggcc agcgcgttgg 32400 cgcagaacag gtaggcgatg gggacctggg cgacggcctc gacgaacgcc ataccgggca 32460 gtgagtacag gttccagggc acccagccga agccctcgcg caccgcgccg gtcaggaagc 32520 cggccgggcc gtagacgacg atccacccga aggccaggac gagcggggag atgtagatgg 32580 gccagcgcag cacctgcccg aacaggcggg cggcggggaa gcgggtgcgc tccagcagaa 32640 tcgccatcgg caccgcgatg gcgagcgcga acacggtcgt caggacggcg aagaggaggg 32700 tgtcgaggac gatcgaaccg aagcccgccg acgtgaacag gtgggtgtag ttcgagaggg 32760 tgaaggcgcc gccggccgcg tacaggggct ggttgcggac cgactggtag aggatcggta 32820 cgacgggggc gaggacgagc acggcggtga cgaggaacgt cagccagtgg atggtgacct 32880 cacgtccggc gccgaacagg cgccggtact ggggcgtgcc cagctcgccc gcgcgcggga 32940 tgcgggacgg cgcgggtggc gccgggggtg tctggatggc catgacgact ccgtacgaac 33000 ggggtgggga caggggcgtt gggcgggcgg gggcggctca gccggccgcc ttctcccagc 33060 gcgcgacgta cgcctcccgc acgcgctccg gcacccgcac gggccggtac agatggacgc 33120 ggtccgcgcc gagcctgcgc cgcatgtcct gcagactgtc catggcgtcc tggcgcacgt 33180 ccggccggta cggcaccagg ccgccctcgg cgaccgccgc ctgcccttcg gcggagagca 33240 ggaagtccag gaagagacgg gccgcgttcg ggtgcggggc ggtcttcacg acggacagcg 33300 cgcgcggcat gacgacggtg ccctccgcgt agtagctcca ccccagcagt cccccgctgt 33360 gctcggcggc gggtatcgcg acgccatcac gtacggcagg atcccgccgt gccgcaggta 33420 ggccagttcc tggcgcgagt ggaggcgcag cctgagacgg accgtggcgc ggggtgcgtc 33480 gggccggacg agggacaggg cgacggggtt cgtgccgacg cacaggtcgg cgaggccgtc 33540 gaaggtgaat tcctcctctc cggtgaaggc gtgggccgat gcggtgtcgc cctcctcgaa 33600 ctccaggggc agtacaccca tgccgatcag gttgttgcgg tggatgcgct cgaaggactc 33660 ggctatcacc gcccgcactc ccagcagcgc ctgtgccttg gcggcccagt cgcggctgga 33720 gccggcgccg tagttgcggc ccgcgaccac gacgagatcg tggcccgcgg cgcggtaggt 33780 cgccgcggct tcgtggacgg gccccatccg cagttgcgtg ccccgatggc cgccctgcgc 33840 atggacgatg cggccgggtc ccttcgaggg cctggccgcc gggtcgttcc tgacccgagg 33900 cgccgatcag gacgacgccg tgcaacggac gcgaggacag cgtcagcttc gtccgcggca 33960 acagcgacga ccccggtgac ttccgatgac gcgcacgccc ccgccgcccg aacccgagct 34020 gaccgtcgac cgcgccgcct gctctgggtc accctcccgc tccgcctgcg agatcagatc 34080 gccgacgcgc cgccgggcac cgtcgtccac gtcgtcgcca ccgacccccg cggcaccgct 34140 cgacctgccc acctggtgcc acatgacagg tcacacctgt ctcggcacgc ccccggcgaa 34200 cggccggtgt acgccccgaa gctcaccgcc gacgcgcgcg ccacccgccc ggacgcaccc 34260 tggcacccgc tccggcggcg gcaggagcag ccccggaacc ggtgacgcat ctcgtcggcc 34320 ggccgtttcg agtggaccgc ggacgcggaa cgtcacggcg tccggaaacc ccggaaggtg 34380 accggcctgc gtgtcttgaa gccgagccgt tcgtacaagg cgatcgcgcc ggtgttcgcc 34440 tcggccacgt gcaggaaggg acgatcaccg cgcgccgaga tgcgctcggt gagagcgcgg 34500 acgaggcggg cggcataacc ctgcccgcgc gcctcgggag cggcgcagac ggcgctgatc 34560 tcggtccagc ccggaggacg caggcgttcc ccggccatcg ccaccagggt gccgtcgacc 34620 cggacaccca ggtaggtgcc gagttcatgg gtacggggcc agaacggccc cggctcggtc 34680 cgcgcggcga gatccagcat ctcaggcacg ctgtccgcgc ccagctcgac cacgtcggtg 34740 tcggacgcgg agcgagttcg gccggggcgg ccgtcgccgg gccaggtcat ctgacggccc 34800 tcaagactga aaaccggctc ccaacccggc ggcggaacgg ccggggagct gaacatgtcg 34860 gcgaaggcgc cgggaccgag taggccggcc aggtcggccc agtcctccgc gtccgggtcg 34920 acggacacgg aggagaaggt cgccacgtcg gtgagatagg tggctgctcg accgaaccgt 34980 cgggcgagat gagcgtgccg accactgagc gactgaccta ccgggtcgtc gagtgcgggg 35040 tcgtcgtcgt tcatcatcgt gccgtttcct tcctggtgag cgcggtggtc gaagggtggc 35100 cgcggtaggc gaaaagtcgg cggcggggcc cgtggcccga tagtcgtagc ccttgtcacc 35160 gtgcagtttg ccgggtcgcc tgaggacttc cggctggagg ccaatgccaa agcgctctcg 35220 tgccggcgga ggcacgcctt ctgacgtgcc tccaccggca ccactcagtt caggcagatt 35280 gagcttgagc gatgcagcgc cgccggaagt cgagcgcctc aatgcatcga gcggcgactt 35340 cctcgttctg ggtgagagca gtcctgcctt gtcgagtgat gcggcgttcg gaccgtcacc 35400 ccggcgaagg ccaggacctg tcccacggag tggctcatcc acctccccct cctcggccca 35460 cagcttcagg cccgacgtag ggggaggggc gactcggaac ccggcgtccc gctcgcgaag 35520 gtcggtcaga cctgttcgaa gtggaacgcc ttgatgaagc agtcccgggg ttgggcgacg 35580 gcgaagagga tgcactccac gagggactgc gcggtgaggg cgtcctcggc ttcgcgtgaa 35640 gtggtcgccc actcctcgga gagcgggtcg gcgttgtcga agtcgggcgg gtagagcgag 35700 atcacccgga ctccttgggc gcgcaggcgc ttggagagga tttcggtgaa ccctgcctgg 35760 gcgctcttgg ccgcgtagaa ggcgtcgtgt gcgtccgagc ggtggtggcc cggtgttccg 35820 caggcggaga ccatcgtcac gacgtcgggt gtgtccgagt tgagcaggag ggggaggaaa 35880 ctcctcgtgg tcaggaccgt gccggtggct ccggaggcga tggtgtccac gacgtcggcg 35940 tcggttgccg acagcaggtc cggcccggtg aggtagcggg agccgttgtt gacgagtacg 36000 tcgacgcggt cggtgtgttc cgcgacgccg gaggcgaagt cgcggatcga ggcaggatcc 36060 gtcaggtcgc aggcgaaggc gtgcacccgc tggtgtccgc ggtcgcggat ctcgtcgcgg 36120 acccgttggg cggcggcgag ccggcgtgcc gagaggaaga cctccgcgcc gaggtccgcg 36180 aggcggatgg ccagggttcg tccgaagtcc cggccggcgg ccgtgatgac gacgcggtgg 36240 ttgtcccatc tcatggtgtc gttccccagt cgccgtttcg tggatcgggt ggtgccgtgc 36300 accgcgtctc tacgctatcg gtcatggtcg ctcacgaacg gtcgttcacg gtcaatgatg 36360 atgttgaggt gcccaacccc ggtgcggacg aggtctggac cgtcggcgcg gtcatcctca 36420 atcgggaagg tcgtgccttt gcccagaagc ggagccggga ccgtcgcctg ttccccgggg 36480 cctgggacat cgtgggcggt catgtcgagg agggcgagac gcttctggag gccctcgcgc 36540 gtgaagtcga ggaggagacc ggctggcgcc tgacccgtgt gcggcggttc ctcggcacca 36600 cgacctggac gggggacgac ggcggcggcc tgcgtcacga ggccgactac ctggtcgagg 36660 tggacggcga cctggaccac ccgaggctgg aatggtccaa gcactccgcc tacgactggt 36720 tcggccccgg cgatctcacc cgcctcaagg agaaccgcgg accaggggag tacctgatcc 36780 acgacctcat agccggtgcc gttgccgact cgcctttcga cttgctccgg gcggacgccc 36840 tcaccagccc ggaccggctg cgcgagctct acccgcagcc gaacccgaac tcgctgcgca 36900 aggagaccga ccgcctgacc gaggagaccc gggcgctgat cggctgttcg tcactggtgt 36960 tcatcggcag cgcggaccgc gagggccggg cggacgtgac gccacgtggc ggcccggccg 37020 ggttcgtctc ggtgctggac gagcagaccc tggtgatccc cgacgcgacc ggcaacaaac 37080 ggctcgacac cctgcacaac gtgctggaga ccggacgcct ggggctgctc ttcctcgtcc 37140 ccggccgccc gaccacgctg cggatcaacg gacgcgcctg tgtttcggcc cgcccggagc 37200 tgctcgcccg cctcactccc gtcggaaagc cgccggtcac cgcgctggtg gtgcaggtcg 37260 agcaggtgta tccgcactgc ccgaagtcac tgatgcgcgc cgacgcctgg cgacccgagc 37320 agtggatgcc cgccgacgcc cagccgagca gcgccgaggt gacccttgcg cagctgaacc 37380 tgcccggcct gaccctggac cggatcgagg atgccgaacg ggagtcgctg cgcctgcggt 37440 acgaatgacg acgagtcgat gagcgccgat gagccgatga gacccgacgg gatccgacgg 37500 gtcggcgtcc gcggcgagca gaccggtcgc gaaggtcacc gcccgcacgg cggcgaccct 37560 cgcgacggtc agtactgtcc ggtcaggtgc gggtccagcg ttggttgctg ccgttggagc 37620 aggtgtacag ctggatcagg gtgccgttgg ccgtgccgtt cccgacggcg tcgaggcaga 37680 ggccggactg gacgccgacg acggacccgt cggagttgag gcgccacttc tggttgtcgc 37740 cgccccagca gctgtagatc tggaccttgg agccgttgcc ggtgcctgcg gcgtccaggc 37800 acttgtcgcc gtagaccctg agctcgcccg cgtcagtggc ggcccactgc tggttggtgc 37860 cgctgtggca gtcccacagc tggagctggg tgccgtcgga ggtgctggcg tcgggcacgt 37920 cgaggcagcg gcccgaaccg acgcccttga tctgtccccc gtccgcgggg ggctccgagg 37980 agtcgccgcc gttgagtgcg tcgaggacgg cggtgtacgc ggccttcttg ctgccgtcgt 38040 tgttgaacag caacggcgtc tgctccgacc gccaggagtc gctgtcgcgc acaccccaga 38100 cggtgatgcc gaggcagcgc gagacggcca ggcagtcgtt ggtcacgttg gcgtaggtcg 38160 aggccggggc gccctggatg tccagctcgg tgatggccac gtcgacgccg agggcggcga 38220 agttctgcag tgtggtgcgg aagttgctgt tgtaggggct gccgctgttg aagtgcgact 38280 ggaagccgac gcagtcgatc ggcacgccgc gctgcttgaa gtcccgcacc atgttgtaca 38340 tggcctgggt cttggcccag gtccagttct cgacgttgta gtcgttgtag cagagcttgg 38400 cggacgggtc ggcggcgcgc gcggtgcgga aggcgacctc gatccagtcg ttgccgctgc 38460 gttgcaggtt ggagtcccgc cgcgctcccg aactgccgtc ggcgaaggcc tcgttcacga 38520 cgtcccactg gacgatcttg cccttgtagt gggccatcac gccgttgatg tggtcgatca 38580 tcgcctggcg cagcgcgctg ccgctgaggc tctgcatcca gccgggctgc tgggagtgcc 38640 aggccagggt gtggccgcgc acctgcttgc cgttctgcac cgcccagttg tagacgcggt 38700 cggcggagct gaagttgaac tggccccgct gcgg                             38734 <210>31 <211>3331 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>31 tcggatctcc ccacacaaca tagatagagg atatccgcct gggttcacaa tgaagttact 60 ggtggttctc accaccctcg tgggctttag ctcagcacta agtttcggtt gtaattacag 120 accagtatta ggcttcaatt cacagtatat gctgggagga ctaagacttt tctgtatgcc 180 tgccatggtt tatgatccat gggcatgtgg ttgcgtttcg gcatggagca gtgcaggtct 240 ttacggtgtc ggagggggcg gaggcgcctg gggagctggc ggtgctggag gagccgacgg 300 cggacgcggc ggcggcggtg gagattggga atatgactat gatgacgaca gcgatgacga 360 tgatgaatgg gactgggatg atgacggtgg aatgggagct ggcgccggag gtggtgctgg 420 tggtggtgcc ggaggtggtg ctggtgctgg tgctggagca ggcgcaggag caggagcagg 480 tgctggactc ggacttggat tgggcggagg tctcggaggt ggacttggcg gacttggagg 540 tcttggcgga cttggcggtg gagacgattt atttgattta gatttcgatg atcttggtgc 600 agctcttgcc ctcggtggag ctggtggagc tggaggtgct gctgctgctg ctgcagctgc 660 cgctgctgcc gccgggggtg gagttggtgg agctgctgcc gcagccgcag ccgctgctgc 720 cgctgcagga ggaggcgcag gtagacttgg aggagctgct gctgcagccg cagccgctgc 780 tgccgctgca ggaggcgcag gtggacttgg aggactcggt ggcggacttg gaggactcgg 840 tggcggactt ggaggcctcg gaggtcttgg tggcctcgga ggatatggag gatctgctgc 900 tgccgctgct gctgctgccg ccgctgctgc cggaggtgga ggactcggtg gtgttggttt 960 ctacggtgga cgaggaggta gacgcggtcg aggaagagga ggccgcagac gtgctgctgc 1020 tgccgctgct gcagctgccg ccgcagccgc tggtggtggc ggaggaggtg gaggtggtgg 1080 aggaggaggc ggaggcgctg gtgctgccgc tgccgctgca gccgctgctg catctgcttc 1140 agcttctaga caaatgagtg gtataaggga cgcattagga gacattaaag accttctcag 1200 gagtaatgga gcctctgcaa aagcctctgc taaagcatca gcagtagcaa gcacaaaatc 1260 tcaaattgac gatttgaagg atgtcttaaa ggatcttgca ggtctattga aaagctcagc 1320 atctgcttca gcatctgcat ctgcatcagc ttcagctgga ggtggaggcg gtggtggtaa 1380 cggaggtggt aacggaggag gaggcggcgg tggagctgga gctctagctg ctgctctcgc 1440 tgctgcagga gccggaggtg gacttggagg tggaggcgga ggcggagctt tagccgctgc 1500 actagctgct gctggtgcag gtggaggagg ttttggtgga cttggaggac taggcggtct 1560 tggtggggga tctgccgcag ctgctgcagc cgctgccgct gctgcatcag gtggtggagg 1620 aagagcactt agaagggctt tgagaagaca aatgcgtgga ggtggatccg ctgctgccgc 1680 tgctgctgct gctgcagctg ctgctggagg tggatgggga ggtggaatgg gtggaggatt 1740 cggagtaggt ctcggtggag gattcggagg aggatttggt ggtggatcat cagcagcagc 1800 tgctgccgct gctgcagccg ccgctggatt tggtggaggt ggacgaagag gtagaggtag 1860 aggacgtgga ggcgatggcg acggtaacgg agctagtgct gtagctgcag ccgccgccgc 1920 tgctgctgct gctggaggat ctgctgctga tgttgccgct gccgctgctg cagccgcagc 1980 tatgtacggt gacggtgctg atggacctga tttcgataat ggattcggtg gtggaaacgg 2040 aaatggaggt ggcggatctg gtggtggcgg atccggcgga ggtggatccg gtggcggatc 2100 tggaggtggc ggtggatctg gtggatcagg cggtggcggc ggatctggtg gttcaggcgg 2160 tggcggatca ggcggcggtg gaaacaatgg atggggaaat aacggcaaca ataaatatga 2220 cgatgatgac tgtgatgaat atggtaaccc tattagaagg gggtaaatta tttgacatta 2280 tccgccattt gactcatttt tcttagttct ctatgtttta tacttcacct tagattgttt 2340 tagtttgatt gaataaatta tgttttcgat ataaattttt tttaaattaa attaaacttt 2400 attagttgac ctgtaaactt tttcatggag ttataatcta aggaacaaaa aacatacata 2460 atatgttcag tattgtggta aagcacctgt accgcaaaca caatcacctc tatacatgta 2520 tacaaaatca gtaatgctga caaaatcttc tacactctca cctacacact cgcacacagt 2580 cctcttacat acacagcact ataatatcct gaacatgaag tttgtgttga taaaaagttc 2640 agaaaaatct cccctacatc acctgatctt tcactgaaaa tttacgacaa gtattgaaaa 2700 tagcagaaag aaaacgggaa attgagaagt tttctataaa aaacaatcgg aacaatgact 2760 ggaatgacaa ggatgaaaat aatgataact tacattaatt aaggccccaa taatctctct 2820 attttcaaac ttttttttca aatgttctct ctaactcact tgcatctatg tggaaattca 2880 catactatac taaattacca caagtatcaa ggtttcacaa cctctcatgc cttcatggca 2940 gaccatgctg ggtatttgtc taacaatgcc tcataaatac ataaaactaa ctaacaaaat 3000 aggtcagtct gtaacaaatt attaatgcac cattattgca ttttctaaaa caaagcatac 3060 actggatatt ggcagacaaa atgttgttat tggatacctt tccattctat ctagacactt 3120 gctttccaca agtcatcata aataaatccc ccctatccca aatgtcaatg gaatgcccca  3180 acccttcccc cataatttta aaacctagaa taaattaaaa catctatagt tcgtcatgat  3240 catctttctt atcatcctct tcttcttcct cctcctcctt cttcttcttc ctcctcctca  3300 ggttcttggc tgcctgctcc ttccttgcca a                                 3331 <210>32 <211>5224 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>32 ggatcccctg ctcgacgccg gcggcccggt acacctccat cgtgcggacg ttgttcccgc 60 gcccgcgagg gtggacggag gtgccggcgt gacgctccac cagcatgtgc cgcaccccga 120 gccggcccag gaacacggac gtcgacaggc ccacgagcga tccgccgacg acgaggaccg 180 gaaccctgtg gaccgtgtcc ccggcccgat cggctcttgc gttcatcttt ctcctccagc 240 gcgtgatgtc cgcccactcg gccggtttcg gccggggtca tgcatgcccc gcgaggctgg 300 agcgcggtgc gccggggacc acacttcacc cgcttaaccc gctgcgttcg cgcaggggca 360 cggcacgccc gacgatcgtg ctcacgggcc gacgcaccgt catgtgacgc gtcggccgcc 420 ttaccgttcc tccaggaaga ggtgcgcctc aatgacggtc tctgccgctg tgtccacggt 480 cccggaccgt gtccccctca ccgtgttcga cggttcccgg gtgcgggtcg tgctgatgct 540 ggacatccgc gacgggacgc aagcggaggt cctggacgcc tacgagcgga tgtccgaccg 600 ggtcgccgcc gtgccggggc acatcagcga ccagctgtgc cagtcgctgg agaaccccac 660 ccagtggctc atcaccagcg agtgggagag cgcaccggag ttcctcgcct gggccaacag 720 cgaggaacac ctggagatgg tccgtcccct ggagccctac gtccgcggca cccactcgat 780 gcgctactcg gtgctgcgcg agacggccga ggagcgggcc ggggcgggtg cggcggcccg 840 gggcgcgctg cagccccggc cgcgcatcgg cgacaacgtg gtccggcacg ccgtcaccta 900 caccgtcaag cccgacagcg tcaccgaggt cgtgaagatc ctctccgcct acacctcgcc 960 cgaggtgcgc gtggacgaca ccacgcggct cgtgcgcacc tccctcttcc tgtacggcaa 1020 ccgggtcgtc cgggcgatcg aggtgcgggg cgacctgcag gccgccctgc gccacgtggc 1080 ccggcagccg gaggtgcgcg ccgtcgagga agccctcacc ccgcacatcg aacaggaccg 1140 ggacctcacc gacccgcggt ccgcccggct gttcttcacc cgggccgcgc tgccggccgt 1200 ccaccacgtg gtgtccgggc gcgggacggg cggcgacacg cagcggtgcg cgctgtacta 1260 cccggcccac cccggcgccg gaccggcgct cgcccggctg ctggcgcggc agggcgaggc 1320 caccgtgggc gacccgggca gtccggtcgt cgcctgcacc gtcttccacc gcgacgacct 1380 cgtcgtacgg ctcgtcgaca cggcgggcgc accggagcgc gcgcccgggg ccgtcctggc 1440 cctgcacgag ccggacgccc tcgccgaggc cgggcggctg ctggacgccg ccgcgctcgg 1500 cgccgacggc cccccggacg accgggcgct gccgacgttc ctcgcgcacg cccggatgcg 1560 gcctctgaca gaccgtcagt cgccggcctc ctgacccccc gctcgcccga cctcagggag 1620 tgaccgacat gacagaacag caggcacgca tcgtcgcctt cgacgacgtc ccgcccaacc 1680 ggcggcgcgg cggcgacgtc cgggccctgc tcacgcccac gaccgcgggg gcgaccagcg 1740 gcttcatggg cgtggccgtc gtacggcccg gagaacgcat ctccgagcac taccacccgt 1800 actccgagga gttcgtgtac gtcaccgccg gcgccttcga ggtggacctg gacgacgtgc 1860 cgcatcccct gcgcaccggg cagggcctgc tcatccccaa ggacgtgcgc caccgcttcc 1920 gcaacaccgg cgacgtcgag gcgcgcctcg tcttccacct gggtccgctg gccccccggc 1980 cggacctcgg gcacgtcgac accgaggaga ccgacgagac cgcgccggcc ggggtggtgt 2040 catgagccgc cgggtcgtcg tcaccggcat aggcgtcgtc gccccgggcg gcatcggcgc 2100 ggcccggttc tgggacctgc tggccggcgg gcgtacggcg acgcgccgga tctccctgtt 2160 cgacccggcg cgcctgcgct cgcagatcgc cgccgagtgc gacttcgacc cgtccgcgca 2220 cggcctggac gacgagacgg tccggcggtg cgaccggtac gtgcagttcg cgctggtcgc 2280 caccgccgag gcggtccgcg acgcgggcct ggacaccacg cgcgaggacc cctggcgcat 2340 gggggccgtc ctcggcacgg cggtcggcgg caccacccgc ctggagcacg actacgtcct 2400 ggtcagcgag ggcggctcgc gctgggacgt ggaccaccgg cgggccgagc cgcacctgca 2460 ccgcgccttc gcccccagca cgctcgcctc caccgtcgcc gagaccttcg gcgcgcaggg 2520 cccggtgcag accgtctcca ccggctgcac gtccgggctg gacgcggtgg ggtacgccta 2580 ccacgccatc gccgagggcc gtgccgacgt gtgcctggcg ggcgcctcgg actcgccgat 2640 atcgccgatc accatggcgt gcttcgacgc catcaaggcg acctcgccca gcaacgacga 2700 cccggagcac gcctcccgcc ccttcgacgc ccgccgcaac gggttcgcga tgggcgaggg 2760 cggcgcggtg ctcgtgctgg aggagctgga gcacgcccgg gcccgcggcg cggacgtcta 2820 ctgcgagctc gccggctacg ccaccttcgg caacgcccac cacatgaccg ggctcacccg 2880 ggagggcctg gagatggcgc gggccatcga caccgcgctg gacatggccc gcctggacgg 2940 cacggacatc gactacgtca acgcgcacgg ctccggcacc cagcagaacg accggcacga 3000 gaccgcggcg gtcaagcggt cgctgggcga gcacgcgtac cggaccccga tgagctcgat 3060 caagtcgatg gtgggccact cgctcggcgc gatcggctcg atcgaggtcg tcgcctgcgt 3120 cctcgccctg gcgcaccagg tggtgccgcc cacggccaac tacgagacac cggaccccga 3180 gtgcgacctg gactacgtgc cgcgcgaggc acgcgagcgg gagctgcgca gcgtgctgtc 3240 ggtgggcagc ggcttcggcg gcttccagtc cgcggtcgtg ctgaccggac cggagaggag 3300 gctgagatga gcgcaccccg gcgagccgtc gtcaccggac tcggagtggt ggcaccccac 3360 ggcatcggtg ccgagacgtt ctggaagacg gccgtggacg gcaccagcag cctggcccgg 3420 atcgaccggg agggctgcgg ccacctgccc ctgaagatcg ccggccaggt ccccgacttc 3480 gacccggccg ccctgatcga ggacacctac ctcgtccaga ccgaccgctt cacccacttc 3540 gcgatggcgg ccacccagct cgccctcgac gacgcccggc tctcccgcgc cgacatcgac 3600 tcgccgtact cggtgggcgt ggtgacggcc gcgggctccg gcggcggcga gttcggccag 3660 cgcgagctgc agaaactgtg gggccagggc tcgaagtacg tcggccccta ccagtcgatc 3720 gcctggttct acgcggcgag caccggccag atctccatcc gcggcggctt caagggcccc 3780 tgcggcgtgg tggccgccga cgaggccggc ggcctggacg ccctcgcgca cgccgcgctg 3840 gcggtacggc gcggcaccgc caccgtcgtc gccggcgcga ccgaggcccc gctggccccg 3900 tactcgatgg tctgccagct gggttacccg gagctcagcc gcagcgccga cccgggccgg 3960 gcctaccgtc ccttcacctc cgccgcctgc gggttcgtgc ccgccgaggg cggggcgatg 4020 ttcgtcctgg aggaggaggg cgcggcacgc gagcgcggcg ccgacgcgcg ggcgacggtg 4080 gccggccacg cggccacgtt caccggcgcc tcccgctggg aggagtccag ggccggcctg 4140 gcgcacgcga tcggcacggc gctggcgcgg gccggccgcc gtccgcagga cgtggacgtc 4200 gtgttcgccg acgccctcgg cgtgccggag gccgaccggg ccgaggccct ggccctggcc 4260 gacgcgctcg gcccgcacgc gcggcgggtc cccgtcaccg ccccgaaggc gggcatcggc 4320 cgggcgttct gcgcggccgc ggtgctcgac gtggcgaccg cgctgctcgc catggagcac 4380 gagctgatcc cgcccacccc ccatgtgctc gacgtctgcc acgacctgga cctggtggtc 4440 ggccgggcgc gtcccgcccg gccgcgcacc gcgctggtgc tcagccgcgg actcatgggc 4500 aacaactcgg cgctcgtcct gcgcaggggc gccgcgccgt tccccgagta agtaccccga 4560 acaggtgtct cacgtcccct tcgggcgcgg gcacccgagt caaggagctc aaccacatga 4620 ccgacatgac cgaacgcgtg ggcacccagg tgaccttcga ggaactgtcc gccctgatga 4680 agcgcaccgc gggcgtgcac gtggaaccgc ctgacctgcg ggcgcgggcc gaggagggct 4740 tcgacggctt cggcctggac tccctgggcc tgctgggcat cgtggccgag ctggagaaga 4800 agcacggcgt gggactgccg gagcaggtgg agcgctgcaa gacgcccgcg gagttcctcg 4860 cgcaggtgaa cgccaccctc aggacggcgg tgtgacatgg ccgggcacac cgagaacgag 4920 atcgtcatcg ccgcgccgct ggacctggtc tgggacatga ccaacgacgt cgagaactgg 4980 ccgcggctgt tcagcgagta cgcctccgcc gagatcctgg agcgcgaggg cgaccgcgtc 5040 cgcttccggc tcaccatgca cccggacgac gagggccggg tgtggagctg ggtctccgaa 5100 cgcgtcgccg accgcgcctc cctgacggtc cgcgcccacc gcgtggagac cggccccttc 5160 cagttcatgg acatccagtg ggtgtacgag cagacgcccg agggcgtgct gatgcgctgg 5220 atcc                                                              5224 <210>33 <211>30601 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>33 gatcttagac cttattcact tgatacgtgt aatagttatt acgatagtat gtttttggcc 60 gattcctccg cgtcttcttt cgacgacgtg gaggtggagg caaaagcgaa gtagttgtgg 120 aagaataaga attatgatta tcatgattat tattcaaatt aactctattg ttacgtaccg 180 cgctccatgc agacgtttgc caggagacga cgggtggaag gataggaagc gaagaagcgg 240 aagcggaaga cgtcgtattt gaattcgaag atgataatga tgtcattgat gctgatgatg 300 ttttgttgtg ataatgagat cggcatggag gcatttcaca atctctttgt tcgcgaggct 360 taatctctga gcactcgata tcgtcttgtt tacgaccgga aagcacgtct tcacaccaga 420 ttttgcggcg ttgaactccc ccgccacacg atacagaaca ctggaattat tattagaagc 480 ttcaatgatg ttctaagaac ttacgtgagt ccatggagat atctgccaag aattatttgt 540 gagtggtgga catagttctt cattgcattt atcaaacatc tttggttttc tggtttcatc 600 gcaagaagac gaagtgcaag atacactgcg acgacgccat cccccaccac aagaagcaga 660 gcactgaaca atcgtacatt agtaaattct aaatctgaaa attatatatc ccacttttga 720 ccaatctcca ataatccagg atccaatatg ttcttctccc tttggacagg gttcaagtcg 780 gcaatttctt gcacttgttg gtctcttttg cacatcacaa tcaacatctt tcaaaatcgt 840 ccgaccaccg tcttccgcac tgacgcatgt aacatttcta ctttgttgaa catgagttcc 900 acaagtagct ggacactctt cccattccgc cattttccag tatgaacaat cacgaaggcg 960 acaatttctt gttgatactt ccttatccaa atgattgcaa tactcatcag gaagatcacg 1020 aacatgatct cggcacttga gaagacgacg ttgagtacca ttaccacaag ttgctgaaca 1080 ggctgtccat ggtccggttg cccatcggat tggtggtacg tcggcttgaa gtttttgaag 1140 tactctgggc ccatcacaag tatctttttc acaagtcttt tttaggcgtg gacgagtatt 1200 ctgaaatgat attttcgttc aagattaaaa gcaaactgaa acgtactcga tcacaaaaat 1260 attcatcaac aatagttcct tcagatccac gagtacacga aacacttcta gtctgaattc 1320 ctgatccaca agtgactgag caaggggacc aatgacttgg tttccaagat gtacatggca 1380 gaagatggca agtttgacta gtttctggca ttttggtatc tccacaaaaa gaagcatcaa 1440 cagattgttc gcggtatatg cattcggttg tacgttcccg atgaccgatt ccacaagata 1500 cagaacactg aaacgtattt atggtattga caacagcaat tctggagtat ttgaataaac 1560 ttacagcact ccaatcagta tttctccaaa atgggcaagt gcctaaatta catgtctgat 1620 gagaagcagg ccgatcagat gcagtaccac aaagtgacat atcgacttca gttccatttc 1680 cagaaacaca tgaaactctt cttgacgacc atccatcctc acaagaaaca ctacactgag 1740 accattctcc aagtttatat tttggacatg attctctatg acatggtttt gtaattatct 1800 tttccatttt aaggcaacga tgttccggta gtactgatct atgacgatcg gtacaattag 1860 cgtctcgata ctgtacacca tctccacact tagctgagca gtcagaccag actccgaact 1920 gccaccaagt acaagcatgt tcattacaat gttcttgtgt ctgtgctgga ccacatctgg 1980 atgtatgtgt ttcccgatcg gctgcatcca aacattgagc atgacgcatt ttgactccac 2040 catcacaact tcgagagcac tctgaccaat gcccataaac ccatcttgga catggaattc 2100 tgttacattc ccgttctgtc gcctctttct gttctctgcc gcacaatgac tcatcaactc 2160 gacgattcga atcatcaacg caatatgact tccgatgcat ttttccattc gatccgcaag 2220 tttcagaaca tgaagtccat tctccatagt tccattttct tccagagcag tcaatgtaac 2280 aactggcaat atcggatggt tttgaattac gatcacatag atgttcggat gctggagttt 2340 gacgatcacc ctccattttt acgcaagaaa ctcgttgacg tttctgtcca gatccacatt 2400 tggcactaca actagacaca tcttcagtga tccatctgta aatataaaaa tttattatag 2460 aaatctaatg aaaatatgta gtttaccttg tagaacaatc tatattgcac attcgtgttg 2520 cttgttttgg tttgagaaca ttttgacaat ttctatcatg actttgacga tgagtcgaca 2580 tgtccagaca cattaatttt tgcgattgct gtccacgaca ggctctatca cattctgtcc 2640 aagtatccgt aactctccac aaatacaatg cactggatat tggccgaatt acagcatttg 2700 gaacagccgc agtcatgtac tcatatgaga tgtcgggtgg atgactacca acagaaagaa 2760 catgaacata aatgtcactt ctaatcggac cagttccatt tatccgttca ataattgcat 2820 cagaaccaga atattcgaga acagtgtctt ggaatgcaat ttgttggcga gccagtgata 2880 cttggaaatg accgttaagt aggaattcac cattggcggc acggagagct gaaggttaaa 2940 ataaagattt tcatgggtat tgataacaca agggtgagtg atgaaaaaag taaatgttcc 3000 aaaaacactt tgtatagaaa ctcacaaaga taattgtcat cttctttcat attattatat 3060 cctttctgcc ggatatcaat atttgcagaa ccagctggaa tcttcattac ttcgttataa 3120 ccaaaggttc cttgctcatt aaatgttcct ttgacaacct tacaggaaga atcatcccca 3180 ccgcaaacac cacatttgtc tcttcggaga gttgaatgaa gttgatgatc acagcctgaa 3240 aatccactta ttttcaattt tcttttgaaa tcagatcaat gttacctgct ggcatacaag 3300 ctccagctac acaaatatcg tctccatttc tatcacatgg tgttccatca acaactttat 3360 ctcgaagcag atagaacgct gcagatccac tgagccgaca atacagcttg caacgttcat 3420 ttggtgcaac attcgcatat tttggaaccc agtgagtatt cgttgaagcg acaccttgga 3480 ttccaatatc tttattgttg aattcagaac attgaacttc acggtatggt tgagtatccc 3540 atgggcattc ttgtgtatta catgaccgat aacgttctcg ttgaccaaca cagtactttc 3600 caccatttcg aggtctaaag taatatggga aaatgtcatt ttaatattga taggaaagct 3660 tagccagtgt ggcctaaaag ctggaagttt ttttaaagat gcgttttcta tcaatttaag 3720 ataaccggct acttcaggtg attctataaa ttttataaag cttggaagct aggtaaatct 3780 gaaaagcctt aaactatctc gaagcggccc gaaagcccag aaaagcagag acggacaaac 3840 atttaagagt gatcagaagc actccatacc ttgatgttac atttgatttt agtgtttcca 3900 cctcgttttc acttctgaac tcgccgattg aaaatatttt gattgaatat attatttgct 3960 ttcagactat ttgatatcat ttcgtttggc agtttaactc actttgggct gtcacaatct 4020 cttaatcctt tttgaacacc accaccacaa gtacgactgc attctcccca tgatcgccag 4080 tcaccccatt gtccgtcaat tttggtaagg gattcggggg ctagacgaac acaggctcca 4140 tgatgacaga actaaatatc caagttttta tgagtttctt ttgtgattaa tttctgagat 4200 actcaccatg cttcttgatt cgtcacaagg agttccgtcg gcccatggca tatgctgagt 4260 tcgacagccc atctggcttc cgtagaatgt tgcacaccaa agacggcggc atgtcggctg 4320 taaaatatca atgtttcatc ttaaagaata tatttaggca aactaaccat ataagggcac 4380 aactcagaag ctggtccaaa tacaaacttg cactgttgat gagcatcgta tttctttcct 4440 ggttcatcac gtacaaagac atcctcgtag taacgacgtt cgaccggctg atcgaataga 4500 cattgagttt gacctcgatt atttctgaca aattgacaat taaatagaat caaaatttta 4560 atagctatct tactcgagga atcgttcgag cattccagct gaacatggcg accaactcca 4620 tggatgagtg ttatattcca acgttggtgc cattatgtgg aagttgttct gaaactgcgt 4680 tttatcaaat ttagtgcttt ggaacttgca aaccttatta accggcatgt aggtagagca 4740 ttttcgttcg tcatcatgag gaatcgaaaa cacatgaccc aattcatgag caattgtgaa 4800 tgcagcactc aatccattgt cttctatgat tgcacaactt ttttgcatat cacacattgt 4860 tccaagttca gcaagtccaa gtgtatcgca ttttccttgt gatcgacaaa tatctttacg 4920 cgtcaaaagg attgcaacgt catgatgttg gacactcgaa tcatctggat cattgtaata 4980 ctgctgccat ctacagaaat cttgaagtgt ttgttgagcg ttctgagtga ttcgtggtcc 5040 agcgttttcc gttttcaaaa cgatcaactt gacaacaacg acattgatag atgcacgaag 5100 ggattggtga cgatagatgg aggcaactgt ggagaagaga gtgagaacgt agtcttcaag 5160 agatcttccg tgatattcgt acatttttgt atccgccacc acaaggactt caacatagtg 5220 atcccaagag ttggcagctc ttcgggatct tgctttgcgt tctataatta aatccttttg 5280 tttcataaaa ttatttaaac atttttttac tgtatccttc ctattaatct tgcaccccag 5340 agctccactt tgacctatct ttgttgtcat tgactctatc aaaaactgtt caactatgaa 5400 aatggggatg caagactaat aaaaggtatt ggtaactggt tccagtagag ctttttttac 5460 tatctgtttc attgattcaa ttttcagatg tttatataac catcttaacc gttcaaatct 5520 cataacatag aacagcctgg cagcccgtga aaaggtgctg aaatcccagt aatttcaatg 5580 gcattcgacc acacacaagt gatccattat cctttgctct tttacttcgt taactaccat 5640 tagctatagg ggacccacga gcaaaattct atagtttctg tgtgtgttag ggtgttttaa 5700 tgggctatta cacaacaccc gatgggatca gcagaatctg agatcttttg ggaaccggaa 5760 aaaaatattg tgataacttc tcttttttct acatttttta cagaactagc aggtaaactt 5820 tcagattgaa atctcgaaaa atgcatccgc ctactcaaaa agtcgttttt aaaatgattg 5880 tttctttgtg tttgtcctct ttttcccgga cgtacgcaac acaaaaccgc ttgcgcgagg 5940 atgtacacaa aacgtacgtt ctgcgcaatc ttttccctgc agctctctct ctctcacttt 6000 ttctactcca taaatcagtt ctctgtctgt ctcccaccac ctaaatcatc atcagcatca 6060 tcacagtccc cccaccaagt tcttgtgtct tctctgacct ttacacgtcg actagggaaa 6120 agctctcaag cagacactcg agcgccagtt gaaaaaaata gtgtgtccaa atgagcagtt 6180 tcgaatttga accgtttgtt cttgttctga cataaaccca aaaaaacgaa ctaggcggca 6240 aaagagatct ggataatcta aagaatctag acaaatttca gaagttctta ccaataacat 6300 cttcccactg atcttgccac gtggcaaccg tcgtctccgt ctcgttgaca ctggtcgagt 6360 taagatggtc aaacgatttg aagtgcattg gatcgaactt tcggacgaga tgttgcctat 6420 ggcgacttgc tccgtcgtgc tctagatgtt taaagtgtca gagaaagtga ttacaaagtt 6480 tctacctgtt ccgtttccac taataattgg ctcaaccgta tggattccgc tgggtagtgc 6540 aagcattccg tactgaaaaa ggcttttatt caccaaaatt cgaacttata caaaccaatc 6600 cgtcttccga gtcgcataaa ttgacgatgc tgtgctgatg tacaccttta acgtgtgcac 6660 ggtagataca atcgggatct gttcgagaca ttccacctct aacctcctcc tccgagtcca 6720 aatataagac catcggcgcg aaatttgaat tggaaaagtg gggaacactt ctggaattga 6780 aaattaatac gactgttata ataaaattga aatctcatac ttgttatgtg agtccggtat 6840 ttgattccat ctgtgcaaat gaacgatgta gacggcatca tctgatcgta atcgtaagtg 6900 acaagcatgt ccacagtctc tggcaactcc ttggagtcga cgtcgccgat ctgttgacgt 6960 gacatcacgt tttccacgac gtccataaga atctcttcgg acgatgtgat ggctgtcgat 7020 gacgtgtata ccggcgtctt gacgccatcg actgtgatgc actggcacac ctgaaactta 7080 gaacattatt tcacttcaaa actttttgga ttgttacctg agtacttggc cctggagaac 7140 agcacatctg atgagaattc tgagatcgtg ccactccctg ctgaaaggaa catttggtta 7200 aaaacaaaag ctgataaatt aaaataatta gataaaaacg aacattgcaa cgcataaacg 7260 aggcagacga cgaggagtat gagagcggcg acgacgggct gcagcagatg gaatgagccg 7320 ccgatggagc gcataccaac agctccgtga tgatgattat gattgtgtgg agagcagcaa 7380 agaaaaaaga gatggaaaga agcagaagct ccgataaagt tcgtccgtct cttctgaaac 7440 cttccaaaaa ctacctgctc gaggtgaagg gaagtcgtct gattgaactg ctactgcttc 7500 tgatcttttg ataatctccc gagtttgtgt tttcgtttag tcgaattaaa attgtagatt 7560 gtggaatgag cacttgcaat agggaacaga gcatcacaga ctgaaaaatt aaaaattatc 7620 tagaatgcaa gcaattttta aatttgtttt aaaatcactt attctgacgc catcttcttt 7680 tccgatttgc gcagaataaa taaaaacttg actgtaatat tgggaaaatt tcgaaaaaaa 7740 acaccgttaa gtctgagccc acctttcgcc tttttttgtt gacgaaaaaa accaaacaag 7800 ctttaaattc ataaaattcc caattttaaa aacatctaaa gtcaattcct cccaataatg 7860 catttgtata tgaacaaaag tctgttgacc ataagtcgtt atattactac aagcaattgg 7920 tcatcaacaa acctcataaa aatcagtttt gaacgggagc aatttatata aactctgtgt 7980 gctcttttgc tctttttctt atttcttagt tgtcttctag ttccgccacc actttcgctg 8040 ctcttgacga aatctgtaaa ttgttcgtca tttttgattt ataagatttg tttggctctc 8100 ggtaggagct ctcaagctgc taatagtcct atagtaaagt actaaaaaca caaagaagca 8160 gatgaaggtg tcataaaaca ctgataagaa tcatcatgat taggttggtg cagagaaaag 8220 aagaagaaga aaaaggagat ttagagaaga gaaacaagaa taaaaatgca aaaataaaaa 8280 aaatagtaat aacaatgaac gcagagtctt ccatgttgga gaaggaacag gacccatgtt 8340 gatgtgtatc tgaggggatc caatgtgtag tgatggtagt aaacacttga gagggaactt 8400 ccacccccga ctagatgatt ggaagcaatt gatgatagat gtagagccaa agaattggga 8460 cctactaatg atctagtcaa gattcttctg ataagagaaa aagacaagga agaacatgaa 8520 aatgactggt gattgaaaaa taaaacggtt tatgaagtcg gggtgtacta aagatgcaag 8580 gtctcttgtg acgtattttt tcttccaggc acgttcgcgt tattcacgat tttatgcaaa 8640 caaggtaagg agtgttttga attttgaata taaaaattta aaagaaatta aagttagaca 8700 tttgaaaaat tagacaccct catgggaaaa attatagggc gaggagaggc ggtgagaggc 8760 gccctaattt ctgctcggtc gggtagaatg tctaatctaa atcctacctc atgtttggct 8820 ccttcttaaa tcaaaagctt aaggtcatct ctgaaacgtg cagttgacaa gttcaatggt 8880 aagaacaggg agcaagcatt tacaacaaaa aagtaaacaa aaattgcatt tgtcgcagtt 8940 caaaatggaa caactcactc ccactcgaga acgttttgaa ggggagagga agaagaggaa 9000 aatcatcaca caggcacatg gaacttctgg gacacaaaac aatacaaact gggtgccgtg 9060 aatctcagta cacacacaca aaaatcaaaa aagacggaaa ttaggagcag atgtggtaaa 9120 gggtggttca atgctgatgg gagagagagg gagaaacttc aaaaaaagaa gtttagattt 9180 atgttggcta tttcaatcct aaatttatct aaacaattct aaaaatgctg gttttggaag 9240 gttatctggt aatggtgaag ttttataaac aaaacaagac aaacaattct tgagatctta 9300 aaaatcttag cgactacaac aatatttagg tattttttaa tggaaaaaag tattgattgt 9360 tgacttggga aattgaacag caattttttg tacttttaaa tcagttatat tttaactttt 9420 tagagcacat ttcgtagaca aaagggaaaa cgattggtcc aacatgtgaa gatgatgatg 9480 tcaacaagtt ttggatcgga gccaaaaaag aaacaaaaca ttcataccat gatgggaaac 9540 aagaggtgca gcaacaactt ttatcaatat tttgtttatg ttttgattat ttttctggca 9600 cccagccagt aattcttttc cgtagagttg acctagaaaa tgttggaggc ggagtcttag 9660 gatcaagaga cgcagactat caaagtaaaa tgagtaaaag gaagtgatat aaacttagga 9720 aacggaggaa aaaaggacga tgataagaga ttgaagactt ggaagagtgt gctctttgcg 9780 ggagagcata ttcttttgag aaaaatggga cctaggggca actgacgcaa ttgaaacatg 9840 gtcgagcggt cggcgggaag acaaaaagtg aagaaggatg ggcaagaaga agcaagagaa 9900 atggcaccca ccgtggaaca tgatcatgat gattgagagt gaaaattgga aatctcgaac 9960 ttttttgcaa cggcgcgttt tggaaaacta acaaagttga ccaaaaaatt attttacatg 10020 tataccggga tgtctaagaa ttgtaaaatt gagtgatcct ttctgtgaca taatttaaag 10080 caatttattt tggttatttc taagcgcctt tttatactag catgttatat tgttaatttt 10140 attatctaaa ctgccgttct tcctatattt attattgcac cccctttgtt cattctgaca 10200 gactatacct cgattaatca taaaaatgtc acaaaagaat aaaaacaact aaaattaaga 10260 aaatacaaga aatttatcaa ttgccaaaaa ttcggccaat cggaaaaatg cttggttgcc 10320 aatttgtcaa aaatttagtc aattggaatt tgtcgatttt ccgaaatgat atgaaagttt 10380 gaatgatgca gctaattttg cagtttaagt ttacattttc aagtttactg taatttttcc 10440 aaaatatgaa gaagagtttt acgaaattaa aagataataa aaaagcaatg caaacatagc 10500 tatgaaatct gatcccgact aagtttgatg gacataggat taataatatt agtctaactt 10560 tctatagaac actaaataaa tacattcact ctcgaaactc tcccttttct gccatcaact 10620 accgtactca cttttgactc aatgacccgc aactgtcaag atgagttagt ttcaagattc 10680 tctgaaacag caataatcta acaagagaaa ctgaaaaaat agagtaaaac taataataat 10740 accacataaa ttgacatgca tgatagatga ttttccggtt ttcaacaaga aaaacaacaa 10800 tttccgagaa atcctcatag tttttggtaa gaaaaaataa attgatagtg atacggtatg 10860 actattactt ctaaagactt acctgattag aaacgtgtag taattgaaga agaaaagttg 10920 aatttgagaa gttgaatcga gtttacgatg tctgaaaaaa acatagatat tatggtaaga 10980 tcaagcatag aaaaaatgga aaaatacaag aaaatagaga ctagagattg cataggtttt 11040 gcggtggcga aaccgcacac atttttgtct gtgttatctc taattttacg ctctcggtgt 11100 tctctattta ctgtccagaa gaatgaagaa tatgggggaa aagtgcgcgg gaaaattgag 11160 agaccgagtg atgagagccg cagttttgca aaactttttc gggcaataat ccgccggcga 11220 gtactacgag aagcacacac acatacgaaa actgttgagt taaaacctaa aaaattgttt 11280 cgacatattt aattttcgaa ctaaagttta gagggtctgt gcgtgcattt ttgaattttc 11340 caaacaactt tcagttttgc ggaagaaaat tacagcgatt ttttcgaata tttctgaaaa 11400 caacactatt gcgtatcaaa aatttttcga tttgccaaaa ttcagactaa gttttggtgg 11460 ttttggtttg caaacattta aaagaactca aaaaacattt ttagatgttc gaaaccgtac 11520 aattgtagga tacaaatagc tacagaacaa ttagaatata aaatagagtt gtcaaacatg 11580 tttaactaat acaaaaacac agaaactttg aaactcgaaa tttttatatc aaaattgaaa 11640 aagcttgtaa aatttaaata tggatacagt acaaacaata taatcataga tcaaatagtt 11700 catttattta tatatcttgg caaatcaaat cgtatccctt acccactcat attcgatgag 11760 tctacaatta aatcagttgt tttttcatcc tcccggacta ttagtttaac ttccacttga 11820 acaagggcaa agagtacatt aggaagagtt tatgatgaca ggaaaaaagc tatgtaaaat 11880 gacctctttg gattgaaaaa gcgaacgaat tgaggtttag gacccccgga aaatgaagaa 11940 ttcgtggcct cgagaatagc aaattggcgg aattaattat ccgtaagagt gtgaattgga 12000 aacaaccggg acgaatggat tactgaatca aaaatgaaag aaagaagaga tgaaaatacg 12060 tgtgaatcgg atgaaatgtg atgattttag aataacctaa atgcaacaaa acgacgtaaa 12120 gacgcggaag aacaggaatg atcaaggggt acatcttata ggggaaaaat gcactttttg 12180 tgctccaaat gtgagagata atcaggtagg aagagacgta gaataggaac aggaaacggt 12240 aacgatagtg cgcaggtgct tgatttctgt gcttttgcat gtgttccgat ggaatttttg 12300 gaacttttca aggggtttcg gaaagggttc gagatttcgc atgtgagctt tggaagaatt 12360 ttggaagaac tttcaggata acatcgctca agcttgtttg ttagatttca gacttcaaag 12420 tatataccga ttattgaaac attttaatcg tttcttacta ttagtaaagt ttaatcacag 12480 tttgaaaaaa aaatcacaat tttttcaatt atttagacca aactaattat ggtacagaaa 12540 ataacttgca acccgggtat ttcattctaa tttttttcat ttggaaccac tagtttttga 12600 aatagaaact cgttaggatt cttcacatat tatcataact atcagtattt tgttgcacat 12660 cagatctaag ttcagtctaa ttagaatcgc aaatttgacc atcacacttt aaaacaaatt 12720 tacttaggca cagggcatcc ttctaacttt tttgtccccg acaaaatgat gacaaaaatg 12780 acgtgaggaa tcaaggagaa aaaggaaaag aacaggaagc gaaaagtagg agaagctctt 12840 gatttctgtg ctcattcctt gttcggatga gctcactgtt tgcaacattg gcgttggtgc 12900 gcgggaatcg ccattgccga actttttcaa gagacagaga gagagagaaa gagaaggaaa 12960 acgttccgat ttttaaaatg gaaaaaaatg aaagaggaag atgatgaaaa aatgaactct 13020 gcgtgacatt tgttaatatg gaaaaagcat gattacttca aaattgtaca ctaatcccca 13080 cagcacacat tttgaagact tttttacaaa aacaatggtt taagcaagct ttaaaaaatt 13140 gatagtatcc ttaatgctta atcatatcca agtttagttt taagttttga tttcaaaaat 13200 ttctacatca aaaaatcata cttagtgatt atatgcaaaa caatttttaa attcaaggac 13260 atatttttga tttttggaag gatgataact tttttgtgat tccgaaaaag attaaagtag 13320 gtttaaaacc tctgaccttc tacagaaaaa acattacctc tatgaatttt ttttcatctc 13380 gttcagaact tgtctcgggt caagccatga agacatgaga tagggtgtaa aacgttccga 13440 agagaggttt atgactatta ttgtagttga agagaaaaat gatatctcaa tggatttcat 13500 acagatggtc ggatttcatt cataaaatat cataagaaaa ggtacgttta tgactgtcta 13560 ggtcaactgg ttttaggttt cttggaattg tttcaaacat ttttaggaaa tattttcttg 13620 caaatatcta ctaaattgaa gtttgttatt gtttttgaca tattgtagat tttagagaag 13680 aatcactcag agcaaaaatg ttgggaaaac gtgagaaaaa tccaagagac aaaagaatgg 13740 tcttactatt agtagatcaa aaaaccagac caattattca tattcctact attcaatata 13800 tattcaaaaa tgagcaaacc aagaaattgc acctaattta tcatcccaca tatattccga 13860 cgaaacattc gctctacctt ctttttttct gtctaggaat tataaagggc cataattata 13920 atttcagtca aggttttgga aaattgttcg actaaccatt atgaaagtta aaaaccaatc 13980 agtcaaaaca cacaatagga atataaaatt cgtagaagaa aagctttttt tttggtcgaa 14040 agcaaaatca aattctggaa ctgcgacttt tttagtgcaa ttatccattc aacgcaagtt 14100 gtctttcaaa atttaaattc cagaagagtt ataacaaaac agacaggtgt acaagtaaaa 14160 gaaaaataca agttttatcg taaaaactga tacgaatcta gatacacctg ttaaaaaagg 14220 ctttctcgaa acccagatgc cgtacgaagt aagcagcagc caactaaaca ttttgagtaa 14280 acatatggca agtgttttgg cgcaaattgt aaagattttc cgtgtgggta actagaattt 14340 gaaactgtaa gtatgacgac ttaaccacac aaaatcaaat ttcaaaagat cttaaaatgt 14400 tcgaactttc aaaactttta agctctctcg catctaccgt agtcttctaa taacaacagt 14460 cgtaagagaa agctcaaaat ttttcaaact ttttctgaat gacagaatca gttgtataca 14520 aaaaaaaccc ccaaaatgcg agccccatga acctgacaac cagacaagtc gaaattgtaa 14580 aatcgtatag atcttggttc acgacatgaa gagcaccgcg ggggcacacg agagcaacta 14640 ctgcaagcgc tcctgaagag aagaaacatc ttttttccag gaccactggc cagtagtgct 14700 cccccagatc actttctttt ttcttgcttc atctgatttg tgtctgcgtc gtctgatctc 14760 tttagaacct atccttcttc ttcttctttt tgatacttcg acatcagaac aacatcgaca 14820 tgtatcatct tttctctttt ttttttgtta tctattcatt cattcacttt tcatttagtt 14880 tgattaatag gtgacatgaa ctcttgtcac ttttcaattt caacttctta aatcttaaac 14940 tcacagtgat tccagatatg agcaactcca atgaggtgtt gagtagaaac ctaaatataa 15000 cattttggat gttttgataa tgttggaaca aataaattga aacaaacaag acttgaaata 15060 gagacaacgt gcagaataat gtctaccagc tggtttcagt ggcatattgt accacgaacg 15120 tccgacagaa cgaataacat aaagatcaag aaaaactgtt tgggagcaga caaacaatca 15180 gaacacagtt ttgttgaggg gaccaaatca taattaatga ctaaatttta acgaagaaag 15240 tgctcgaaaa gaacagaatt tagaagttga tgaacaatat ttttactttt agattaacaa 15300 ttatgcttta caaatgacat ccaatctaaa gcatctggta atctgaaatt tgtcaaaaca 15360 gctttcaaga ctagtttcaa atttgtcgat tcaatggatc aagtgtgtaa ttgatccaat 15420 aaaaaagagt ataaagtgag aaggaagaaa gtgtgaaaaa agaagaacgt gaaacgtgca 15480 gaagatacga aatgagtttg aagactgcac ttttcgagcc tcgatggtca gtcacttggt 15540 cagttgcgaa aaagctgtga aaatgataca ttgtgtcggc tctcgtagag aagaaagcca 15600 catggtcagg atgactccaa ctgggatatt cagttgtaaa gaacacaatt gatatttttg 15660 catctttttt aactagtttt tacaatatga gaaattgttc tgtgcgaaaa atatgacttc 15720 ttccttgttg ccgaagtgta tttccctgga aattccagta aatacctaat gtaaaaaatc 15780 tcagcagaat gtgttcttac attttgttgt aataataatg tattaaaatt gcattaatta 15840 aaaatttctt caaaatgttc ctacgtcttc tatgcacatt atttaggtca cagtttcatg 15900 gagcacaaaa cacctgccga cgcctctaaa atagttataa ctgcgcatga aatcaggtag 15960 aaaaaactac aaaataacca atacaaattg agtagggcga tggagaggtg ggcggttgga 16020 gaggcgggca acaagcgtcc tcatgacgcc ttgttcattt agaatgtgtt tgctttgaat 16080 tacatacaag tttctaaaat ttaacttaca aaatttaaaa aaagtcacaa caataataaa 16140 agttgtggca atgaaatgtt ttaaaaatct aaatattgag ttttaaataa atgatttttg 16200 aaaattcaca aagaaatgtt acaatctgtg aatgaagacg aacaatgaaa aagtgaggaa 16260 cggacgcgga tattacacat tcagtcacac aataaacgtt cggacactac cacacatttc 16320 tctcatcatt tttttccaaa gtttattcta aagttcaata ttttagtttg attattttgg 16380 acactattct taaaattaat gtataatagt ttagaaaata ttttgaaaca tgaaactttt 16440 ttgttgataa aatagtgcca aacatcctta tgttacgcag ttatccaacc acatttttct 16500 catttttcca ccaaaaaaca ctgaaatggt ccataaaacc tattcaaatg gatatgagaa 16560 tattactttt ttgacatgaa attttcaatg atgtaatgta aaacaaagaa aaatattgcg 16620 ggaaaaattg aacggcgtat tgcaaaaatc ggtgtgcgga ggaggagaag gaaaaggaag 16680 agcaggagaa gcggaccgaa gaattcagaa gcttttaaaa taagaacggc gactttcaga 16740 caaacaatgg actgttgtat aaaaataaag cggaggcggt agagagtcaa agctttcaga 16800 aatgtattag aataggtttc actacctgtt gttgaactca aaaaggtgtg aaaaagtgaa 16860 agtttgtctg aagtttatga cgggaagtgt ccatcaaata actttcaaaa tttgacttat 16920 cagtgagaaa aacacgtcat tttggaacgt taaaatgggt ggcaccgcaa aatgttcaca 16980 atgtgaagtg aattacgtaa taaaatcagt tttattaagc ttattaaact aacccttccg 17040 gactatttgt ggaatgaaac aattgggggg gttttttttt ccaattttcg attttttttt 17100 gaatttataa ttaccggaac aaaaatatct ttaaattatt aagatttgag tgatgtttga 17160 aattttgaac ctgcaaaaca taagcacaaa ataatggagt ttttgtttta aaatatcaat 17220 aggtgttttt tcacagaact ttaaacaaca aatactcata atttgaatga aaacagtaga 17280 tcccacaata ttttgaaaac ttatctatat atatatatat atatatataa ttacgaaaaa 17340 aaaacaaaaa gaaaaaaaca aataatttgt cagttgataa tttttagata tgagttgcca 17400 aaattgggca atatggtgaa gaaatacggt agttcgtcgc actgtcagac taattttcaa 17460 gtgttcctag tggaatgaaa ctaacagaag ctatacggta tataatatta ggaacacaat 17520 taaaacgaac agcggaagaa aagatctagt ggtcacttcc gatttctcag ctgacttttg 17580 aatgggcacc tatcatcatc tcacttgttt atttgaacag tctcgacttt ttccaattgt 17640 tggcttctag ttcaagaaac gaaaaaaaga gcaataacgg aacagaaaat tcagaaagtg 17700 gaagagaaat atgagaaaat gatgatgata ataataataa gttagaagag ggttatcgat 17760 gaggaacgga aacgttatct ctgatcgcca tctcattatt attatgagac acaaagatgt 17820 aagttatggt atctttgaaa gaaaagaaaa caggaaatta tacagaacac acacaatttc 17880 ggagatttca ttcgaagaac ctaacccaat ttgaactcac tcccacttcc tcttgtctat 17940 aaaacagtca atcacaggaa caggtgtctg tcttttcaaa atgtatacgt tttccgaata 18000 atgacacaca atatcacaga caaaatgatc aatgaggttg cagaaaagaa tgcaaaaaaa 18060 tatagaaaga gagggtgaac aggagataga gaatcaaaat ttgcatagat aaatatgcaa 18120 tagaaaataa caatttttga acaacaaaga aataatttag tggcatataa tatagcgatg 18180 gaacttgcaa atttttagaa ttatcatata aaaataacaa tgtttctata ttttatgccc 18240 tataagtctt gcagtatttc ttaaatttaa cagttcattt cttggtaatc tttattttta 18300 tcaagaagtg ttcaggaaat tttaggacat caaattttta tttattttct aaatctactt 18360 ttatcaaaat tttagaggtc tagtacacat ctacccaaaa agaagacttt ggagctctca 18420 aaaaccacct agtgtatggt aaagtacatg agaagtgacg tgtctttggg cagctggcca 18480 tctttgtcga tatgcgggtg atggtgtttc tgtgagcagt aacaggaaat tctggacacc 18540 tgctagggtg tcaaaccaaa tttatttcaa cccattcttg cttcaaaaaa cccccaacta 18600 aattattcaa attctcgtaa tttaatgaat cactcagtaa ctgtaacgtt ttttttttca 18660 gagacaatga tcgaaagtta acaaaaaaaa ctgaggatta aacgttattt ggtatctaca 18720 gctgacattg gaacatatca aaaagtggta agtgaaagtg aaacgaaaag tgcaacattt 18780 gaaattgaga gtagaaaaga tcattgaagc agaaatatgg aagtgaattg aaagccgtgg 18840 cgccaaaacg acggtcaggc gccattgaga aaattaatga gagttcggaa ggttgaaaca 18900 acacaaagac aacgtgaaaa attagtttgg agaagataaa aaatgtctgg agatggacga 18960 tttcttagtt agctgagaat agtttacatt gattttcggg aaaacgcaga atgttagaaa 19020 aatggaaaca tgtctagact tcagataaat ttgtagaatt tatatttgta gcaaaagcac 19080 actaacaaag gttacaaagc tattaggaaa aatacggaat gtatttttga aaatttttga 19140 tttctctaaa ataataacac cattaatttg ctatatttgc tatatatgct atatagtatg 19200 ttcgcattac tgagcacaaa acttggaaaa agtttaaaaa aaaaggaaac ttgttttctg 19260 gagaaatcat taaaaacagt acaatttcag acagaaataa atctttcagt gaaagctttt 19320 ttttgagtaa gactaagtat gcactcacaa cttttctgag tgttccaaaa atgtttaaag 19380 aaaatactag taaaaatgag catttcgaaa agcaatatat catacaacta cacaaacatt 19440 tcaattaaag gaatcaattt tataatagtt ctaggcaatc ccacttttag attcaatttt 19500 ctagcacagg gagcattgga agatataaaa acataaagat aaaggtgata aaagatccat 19560 taaacacatc atatctatca aaccatcact tccatcaaat ccacagattt atcacaaatc 19620 agtgtgtgac aaatataccg taatattaag ttcaaatggt ggaaaagacg cagacaaagc 19680 ttttgcataa atactaaata attgaaagaa acgcagagaa tgtaagagaa aaatatacaa 19740 tatgtgtatt atcaaccatc aacagttttt gattaaaacc atggagaagc gatatacagg 19800 agcaaattag gagacgcaga ttgagaaaaa atgagaaaat aatgaaagta cggaagggtt 19860 attgtacaat aagacaggta gcatctctca aagaacctat tgtcaagcag tttaaacatt 19920 caacaacgtt catttatttt ttagccttca ttatgatatc tcattggttc tataattgga 19980 ttttttaaat tcagatttct cattcatgta caagtaaagt tgttaattgg ttattatgcc 20040 caaagtttaa ttatttgagc gcagaaaatt tgaatggaaa tttcagaaaa ctgattcatg 20100 ctaacttcaa aaaatcctga ataaatacca attcttttcc aagtatgatt ctcgagcctg 20160 tttacgtgcc tgcctacggt ctattttcta atttttttaa tgataaaatt ttagagtaga 20220 tcttcaaaaa tcttccttaa aaaatctcca aaaaaatcaa gttcaggaaa actaaagtac 20280 tccaataaaa tactcttatg caaaaacccc ccattcattt tgcagaaaaa gacaaacaag 20340 aattaaagat aaaaagttat gatagacagg aagctgattt attagatcaa tgaatcgact 20400 tttagttttt cttgaactct aatttgaaat agtattcgaa tgagaaaatt gaaaatatac 20460 aaagatcaaa agttataatt gaaaatcaac aaattgatag tgtttgtata ggattaaatt 20520 aaaatgtgcg gtacatgaga cagtagtagt agtagccata gtacgtattg gtggctccac 20580 tcggctactg ataatttcct tttttactga taatttgatg tcatttcgta attttatttg 20640 tgtttccaaa aattgtgggc gtggtttatg aattggtcaa gacatgaatt aaaggaattg 20700 taaagtaaag aagaaaatga cagaggagaa attattttcg tttgctttgg aaattgcaaa 20760 ataaattaga ttattaaaga taatagttac ggtttaaaat aaataggtga taaaaaaata 20820 tccaaaagtt caagtcctaa gaatcttgct attttgcaaa aaaaaagcat gagcttttgg 20880 cctaaaaatg gcggacagct gtcgggacac tatccaagaa ttcgtgataa acgggtgaag 20940 caccgtctct tatcatcatg ccatttttcg aattttaaac tcagactttg ataaagaaaa 21000 ttaaaaagag agagtgtgag aaataagagt acacatggaa aatgcaagat ttgaatttgt 21060 ttccaatttt taaaatgtat ttaaaagagt taccgttcca tttttgatta gctttataag 21120 tggaaaaatc gtttttggat tattttttga ggaatatttt tgaatgcgct ttcaattttc 21180 ctataaaaaa ctttgtgttc acttttttat cccgttttta tttttatttt tacaactttc 21240 aaatttttat gaatgtttta ttgtaaaatc ataaaaaggt gcgaaacatc taaattgcct 21300 ggattgcatt taaaagtgca ttagcagaaa tgtattccta tggaatgttt tttgtgcaac 21360 gagatccaga agctcgaaaa acatccaaat ttcttccaag aaagttgatg ttccaaaaat 21420 aaaaaagatt ttagcccaat caactaaaaa aaaactctcg tttttttcat atttcacatt 21480 ttctggtcac tttgaaggaa acactaatcc caaactgaga accgaacatg gattaaacca 21540 tcccatttac tatttcttgt tgtcttcaaa aagtcttaga attgtgcaaa aaatagaatg 21600 tttcgaaata ttgcggtttt cgttaaaacc ttttttgagt agattgaggg tccattagaa 21660 ttcccaagag aacttgatga ccttcatcat caaaattagt ggtcattgaa tgtttgatca 21720 gacaaaaatg gaaatgactg aatcggaaag agcaagaaaa tcgaaaaaaa aagtatttgg 21780 aaattctgga aaacttttta aaatttaaga agggcaacga taagaaacag gaaattaggg 21840 attttttagt gatggagaag tacgtgataa ggttaaggtg gaacactagt gcacacgttt 21900 tgaatacact acgtgttttt atttatggta gaatatagca cttaaagaac gtttttaata 21960 caaactgaaa taaaaatacg gaaatgtaat tttttttttt gaaagaatcc gcctgaaact 22020 gaattttcac atcaaacggt agtgattctc tttatgcgtt gggtgatatg tatttacgct 22080 gtcttaaagt tttcgactat aatttaagta atatgtttgt caaaaatcat catggtgctg 22140 tgtcctatgt agccttttct acacttgaaa aatgataatt tttatttgaa aatggtattt 22200 aaattcaagt agaaagttat ttagtcttgt gtgccaagca ataaacacat agtctattag 22260 gcaataaaaa gtcagctact gtttgattta aaaacttaga ctactggtgt gcctgtgcaa 22320 gttactcccg tagtacggat acagagtgaa aactagtgat tgtactttag atcggctgat 22380 agtgaattta cagagaaata attataaaac ttaaaatttt tagcagctca gtcttcaggc 22440 tgcacagcca tattgttaca cttggagtta caaattctgc aaaccatcta ggattgaatg 22500 caaaaactct gaaagtcaca tcaagaaatt ccaacaaaaa acacattaga tgccaactca 22560 ttgaattgca ttgattccca agagaaatag tagtaaaagt gacccctatc cattcctccg 22620 ttacatacaa atatacacac aaaaaagagt gtagacctct tccttctaac ccaaccaaca 22680 cacaacaata tcgttccctt ttatctctaa ttctctgcgt ctccataagc tttgagagct 22740 cttcggagca tcttgtgctt gctccttgta cggcggtaca gtttcctccc tctgctccct 22800 tatgtgtgtt taggtgttgt ttgaacaaat aagtttttgg ccatccacct ccttctcaaa 22860 acctttttct tatgcttctt cttgttttgt gcacattttg gctcttgctt gtctgctcga 22920 gccatagaca aggcggcgac atttttgaaa aaattatatt agtactgtta tatagtactt 22980 aatacaacga tcacaacaac aacacaacga aatgaaaaca tgagatcaaa agacaaattg 23040 ttaggaggag ttggagtttc tacaatcatg aaatgtttat ctagttatta taaaactgaa 23100 attgctcata aaattgtgat accatgaaga ccgaaaaact ctatgcaact gcatactgca 23160 catacttaca acctttattc tgacttgaat ttcagttttt ggtgtttgca gttattctat 23220 tttgtttaaa agaaaattca attaggaaat aagcaataaa ttttggcatg tatttcgata 23280 gaaggcacgt gtaaatgcca cccggaaatt agaaaaaata agatttctca aactgaaaat 23340 gattgtgaat tgaaaattta agagaatcat tgcaaaagta cacaaatgaa tcatttttca 23400 gattgaacag gaaagtgcag aaatatcaga ttaccgtccc aacagaaacc ggaaataaca 23460 cttttcaggt aaagaattat acagaaatcg taataaattt aaaacaaaag agagttatga 23520 cacattgcag aacggtctct gtggaaaata ggaggaggtg ctgcaaaaac tccttagaca 23580 tggtcatact tacaaaaaaa acagagttta actaaaaatt aaattaagtg agaaaatgaa 23640 gaaaatggag gtctttcgcg gattcatttt acttcttctt ttttccactt ttcgttgcaa 23700 gctttggttt aaaagtttcg caaacaaata aacaatgaac attgtgttga gaagacaagc 23760 caagtgaaag gaaaccattg agagcaaaaa caacaatcaa ttgaaataaa gagtaaagtt 23820 tattgaatat actgatatgt gaatactgga aaaataatta gtctctataa ttggtaccgc 23880 ctggaagatt catttctgat tcccttgtgt ctttgaccaa aactttattt ttttcagttc 23940 aaaattacaa aaaataaata ctcatcttca tcgattcagt ggtgttttaa actcctacgt 24000 ttttctttta caataaaggt aatgtaaacg ttccgagcgt gtagttttct ctgaaaattt 24060 tttaaaaata acaactttat ggtatttttc ttaaagtctt aaactgaaac cgaaacattt 24120 ttgataggaa aactatttta acattttggg aactcggcaa aagctctgca ggcttgccga 24180 acaactctca tttgaaagta ataaatatga aaataaatta tcgaagtttt tttttttgat 24240 attttatgaa tacggctctt ggtagttttt gacgagaaaa ttacatgttg cataaatttc 24300 aagagttata actcatggag accctaattt ctggtttcac tagaaaatca aaaaatcaag 24360 cgtttgagca gaagactgta ggaagagcac acgtcataaa aattagggga tcaacgatcc 24420 gaaacgggga attgaaatac gatatgcgat gagttttggt tcgaaccggc tttgtcccaa 24480 aaaacaacag aacgatggtc tcaggctcac ttgactcatc tcggtgggaa caatttttat 24540 ttgtttttat tccgtacgca cagaaacttt ttttgaggta tttttgatcg tgggtgggtg 24600 gaatggtagc acccaatttc aaatagtgtt tgatttgaag agacaatgaa agaaacaagt 24660 gggagataat ggaaatgacg tgatgaaatg gaacggagga aaactggtat aaatatcgtt 24720 gactatcaaa actacaataa tactaatgga gaaaagttca ggattcttga agattttaca 24780 ttatgatagt tgggatttac tggtttcaag ttcaaatgtc aaacatctgg aagaaaaacg 24840 tataagatta catcaaaata aaactaaaat ttgaaggata aagtaaaaca gcataatata 24900 gtgttttaca tctcatgtag gaaacgaaca aaatctttga acacctagat aacttcaaac 24960 ggaagttggg tgaagaaaag aataggggcc agaatagaag gtcattttga caaagtgaac 25020 agacaaagac attcctaact cggaggtatt ccaaaaactg ttccaatatt gaagaatgac 25080 actatttgat tttatatcat aacattatta atcacatggc ttttttctta ggaaatttat 25140 atcgcaaaat aaaaagtggc cttgatgagt cattcattca aaacatgcct aaaaaccttc 25200 ataattaatt ataaaaatgc tgatacttga ggacccgttt ttttatattt ataaacagtt 25260 gttttcttta ttccgttctc actttgagtt tttttctgaa aatactaaaa aaattaacaa 25320 agttcggcgt tttttgtcga taattccatc tgattatttt cggttttttt acctaattat 25380 caaatatttt agccagagtg aaatttatta tcttattaat atgtttttca atttgttttg 25440 gtattattct gttgaaggaa catgttgcat tttaaatctg ttgttaatac agcggccaca 25500 tgtttagaac tttataacct cgtttaaaca taaattgtat gccatattta ttgcaagtac 25560 tacatgagtt tgaaacagta tcagatacta tattttaaac aaaaatacac attttccccg 25620 ctatgagaga ttctgataca ttggtttcca atttttttaa aaacttgaaa ttcctcaagt 25680 ctcccactga attacagatt tctgttctag atacctccaa agacacctag attcgacttc 25740 ggcatcttcc tcatttttat cttcagtttc atcttttgtc taattttccg tacatttctt 25800 tgcatcctta ccatctctcc ctctctcact cactcttctt gttcactaaa tctcaattca 25860 aaatgttttc tgccacgtca tcatcatcat caatgccacc ttctcagagc ccattcgaaa 25920 aattaccacg gcatcaaaat attcgatatc acgaaaaatg cttctcaatt ccacttcata 25980 cacttaacta ttttctatgc gttattattt tttatttctt tgttttcact atattttatc 26040 acgaacgtta tggtggaaaa cctgaaaatg ttcaagttac atcagcaatt tatgattcaa 26100 attcaaacga actgtcatta atctttctat ttgattcttc aattcgtcga cgggaaatat 26160 tccttggatt tggtccaaat gactcaaaaa catcaagaaa tgaaactcaa attgagctta 26220 aaccaccacc cggatttgtt gataactcac aaatttcagt aagtttagga ttttttttca 26280 aaaaaacttg atatgaagtg ttgaaaaatt gataattggg ccgggcttac atcagagtat 26340 ctagttatct tgtatttcaa atattaatat tcaaacattg tagagattcg aaatgcgaca 26400 gtacttcagt aattaccacc cacattttga ctgtcaaaaa agttcccaaa aattgtcgaa 26460 aacttttatt aggatgtttt ctcattttgg cacgattgga gtgttttttt aacaaatccc 26520 ttttatgcat caaattaata tctaattttt aaatcaataa tttggattaa ttcaacttgt 26580 tttataagat tttctcgcta ttaaattagc aaaaaaaaac tatcttcaaa caattagcgt 26640 gctttaaaac tactaggcct ttgttggcaa cgtcttttca cattttggca caaaactata 26700 aactatgctc agaatttggt aatgtttgaa aatgttttgg gcaagcatat agttattcca 26760 attctaaagt aagattagtc atctattttc cattccattt ttccattttt cacctatttt 26820 ttccattatt taacaaccaa gactgagcaa acattttcct gttttaattt tcatatatga 26880 aaagacataa gcaaaagctg gatcaaagct tgggcaaatc ctattcaaag tattttccaa 26940 cgtttccatt ccctcgtttg taaagtacaa ttggtaatct taaggcttaa ttaattattg 27000 tgggagattc ataatgtgaa aactaaatgt taagatttgg tcatcaattg aaaaggaaaa 27060 accccagtct ttaactgtga atgcagaaca tccaaagtca ttgcttttac gagatcacac 27120 aggacatcca tatttagaag taagttcaaa tcagaaatcc ccaatccatt ttttcttgta 27180 gttaccactt caagaaccat actccgattt tcgcgacatt gttagttgtt tcagtccaat 27240 ttatggagat tttgagatgg ttttaacagg tttaacaaat taatttggtt tcttttttaa 27300 aacatttaat ttttatagct ttaacatcat ccatatcaat gggatcattt gttagtatac 27360 catatgaaga gcttactgga gagctttaca agtttctacg tgtatttgaa aaaacgggac 27420 atgtcaggtt aactgcattt ccaatgatac gtcatcagcc tcgcttcgat tcggaaaatg 27480 aaaattatca tttgaaaatg atcaaactta aaacagattt aacgcatttg cattgttggc 27540 taatgcataa aaaccgggcc aaattcatga tcttccaaaa ctctgctgaa attgttttac 27600 cgatttcctc gacgctggaa aatcccaatt acgcctctga atttacacga atatttgaaa 27660 caccacgagt tgaaggatat gatattttag aatataatgt caaaatttca acggataaac 27720 gcttaggcga cttttcggat ttctccatca ggcagacaat tgaagcagca aaagcagaag 27780 aattaaccgg aaattctaaa acattaatca tgagaatggt atcacttttt ttcaaaataa 27840 tttactgttt ctattttggc atttatttca gcattctcca actccacaga atctcttaaa 27900 acgcggtaaa atgtatccat ttttcaaaaa tttcccatct ccaccacaag ttattccaaa 27960 gaaaacattg gacaaattgg atacaataac agaaataatt gaagaatctg atgcattctg 28020 gacacttatc aaagaatgtt cagaaaattc gaaatcttgg aaatgctcgt caagaaaatg 28080 tgtaagacca tcagttagac atcgatctct tcatggatgg tattcatatg atattcattt 28140 ttctaaattt ttgaatgttg aaagtttttt ttgttcagat tttcaataaa cttttaagaa 28200 aagaataatt ttaaattcta taattcctga atttccaact atgtttatca tttcccaaag 28260 tacattcgaa aaagctcaat aagcaaaacg accacgaaat aacagtatta aaaaaaaaga 28320 tgttgtcatt tgaagttctg gagtgcgatg aaaagtctct cacctcggac tttctgtaat 28380 ttatttagca tacaacatga atttgaccaa ctcgaaataa ggttaagact gaaaattttt 28440 cacaaaaatt ggaacacttg cgaagcgaat tcaagacttt tcgaagttat taaacaagct 28500 ttcaaattct cagtaaaact gaacgttttt tttatgctct ccaaatcatt ttaatatggc 28560 tgctcgcgtc gctgaagtat tttctagagt atgtttaata aaactaatat gtaaatgaaa 28620 aaccaaaaac tcagataaag agcataactt ttataacgca ttttcagaac tcttcaagct 28680 ttttcagatc acttctatca gcagtattct tcttttttcc aaagacacca agaactgaaa 28740 aggttgaagg agcatcaccg gaaatagagg atgactgctt attgttcttc tttttctgaa 28800 taaaatcaaa ttaaacaccg aaaatatgaa acatattcac taacctgaac agctttcagg 28860 tttgatttat tctgattttc cgccgctgat ctgctctgac ttttgaaacc gggacttgga 28920 gagttaccat tgcgtatgcg agttcgaact ggacgccgat tcttctttct gaataaacga 28980 attatacaaa tttgtatttg aaaacggaca acatacactc cttcttccgc cgaattgctc 29040 atcgattttc tcatttcttg tgttttttcc tggcgttcag gttcaaaagg tggagcaact 29100 ggtttggaca tatacggaag aatgttcgag acttgaatct tttttggttg ctcaatattc 29160 tccattggaa tatgatcggg aagttcaaag tagctgttgg atcctggagc ttgatcaaat 29220 ccttcgagag ttaaaagttc acgaactgct tcactcattg tgaccctttc ctcttcggca 29280 ccagcacaga ttctatactg aaattgcttg ttgtgttgtt ttactcaaaa gaatagtgaa 29340 caaaattttc tcaccgtaat gaatctgaca atggctggtg ggacgttagc ttcaaatggc 29400 attcggtatc cgttctgaac acgtggtaaa acctcagcaa ctttcattcc cggataaggt 29460 tcgattccat catggtacac ttcccaacac atgactccat aagcgaaaac atcagtcttt 29520 ggagtataga acccagttct tggaacttct ggagccaacc atctaatagg aactctgaaa 29580 aatttgaaaa ggttggaatt tttgacgttc tctaactttt tgtgaggatt catccgatag 29640 ctatagcctt ctcgtgacag tccaaagtcg gatatcttta cttgtccatt cccgtagaga 29700 caatttctgg acgcaatatc gcgatgaatt atttgaagtg aatgaagata ttcaagacca 29760 agaccagctt gaagaaccat cgtatgtttc ttggaaattg gcaatgaacc aatgttcttc 29820 tttagatatg aatccaaagc tccattgtca gcctaaaata atttacataa gacatttttt 29880 cttagtaaaa taaaattaat cagttaatta attaacatac caactccatt atgaccatca 29940 aaggttcctg tcctgcagcc acaccataaa aagtgacgac attcggatgt ttgaactttc 30000 tcatcaatct ggcttcgtgc atgatttctt tgatctgctc ttttgtcaaa gattccaact 30060 ttgccagctt gattgcagct tttttgacgg tatttcctat gcgaatttct cccaattgaa 30120 cctctccaaa tgctccttct cctaatttct tgattaatgt cacgtcagaa tgttgctttt 30180 cccacggttc acgaccaatt ggacggatga ttacagtttc tgggccctaa aagcaaacaa 30240 atgaaaataa gtttactcac ttaatttgta agatcacccc agcaacaggt tctttagaac 30300 gatgatagta attgagaaga tctgcgatac tagaaaacca ttttttatca actgcaaact 30360 tgttattgtg ctctcgaatt acataatgac gaatctgaaa taatattctt aaaaattatg 30420 agcaatcgtt ttacgtacgt cctcaattac tccaacatag acagagagaa caaatttcct 30480 tggctctccc acttttggat cagtaaatcg aactagaaaa tcgcctcgtt gagtgagcaa 30540 ctgtttcata tcctcacgtg gcaataagcc atggtaccag ggttcttttg caagtacttg 30600 c                                                                 30601 <210>34 <211>8009 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>34 ggatccttgg ccacgccatg ggcgatgaaa ttgaccgcgt cgtaacgggt catgtcctgc 60 tcctgcagga agaaggccgc gttcgattcc cgttccgcaa agatcgcgac aaggacattc 120 gcccccgtca cctcggtccg gcccgagctt tgcacatgga tcgcggcgcg ctggatcacc 180 cgctggaagg cggcggtcgg cacggcttcc gagccttcga cttcggtgat cagcgtcgag 240 agatcatcgt cgatgaactc ggtcagggtg gtgcgcaact cgccaagatc gacgccgcag 300 gcgcgcatca cgcggctggc gtcgggctcg tcgatcagcg cgacgagaag atgttcgagc 360 gtcgccagtt catgtttgcg cgtgttggcc agcgccagtg cggcgtgaat tgcttgctcg 420 agcgtggtcg aaaacgaagg catgcggcgc tcctttcctc gggtctcccg atactggcct 480 catgtgatta agtttcggtg gatttcgccg cgcttcaagg cccggacgcg tgttttttcc 540 acctctcgcc gctctgttgc aaaactgacc agcgcggcgg gctttcgcgc gatccgcagg 600 cagcgcgcga aagtgctttc agaaccggtc cttgcgcgcc cgcgccgcgg tgaagacggc 660 gagcggcgcg gcatccccgg gcaggccgag cgcggcgcgc aacgcagcgt catcggcgcg 720 caaaaaggga ttcgttgccc gttcctcgcc caaagtcacc ggcaaactgg gttccccggc 780 cagccgcaag gccgtcaccc ggtccatccg gtcgtgcagc cgaccgttcc ccggttccag 840 gctgagcgcg aaccggccgt tcgcggcggt gtattcatgc cccgaacaga cccgggtttc 900 gggcggcagc gcggccagac gggtcagcgt gtcgaacatc tgcgcggggg tcccctcgaa 960 gagacgcccg cagccccagc tcatcaggct gtcgccggaa aagagcagcc ccgccccggg 1020 cagataccag gcgatatggc cgagcgtatg gccgtcggcc gcgatcacct gcgcggcctc 1080 catccccaga tgcagcacgt cgcccggggc caccggatga tcgagcggcg gcagccggtg 1140 ggcatcggcc gcggcccccg ccaccttggc cccggtcgcc tgcgccagcg cctcgacccc 1200 cgcgatgtga tcggcgtggt gatgggtgat caggatgtgg tgcagctgcc agcgccggtc 1260 ggtcagcacc ttcagcaccg gggccgcctc ggggacatcg accaccacca cggtatcggt 1320 ggcggtgtcg tgccagagcc aggcgtaatt gtcggtcagg caggggatcg gggtcagttc 1380 gagggtcatg gccttttgcg catctttcgc tatcctgacc cagcttcgcc caaggaaggc 1440 caacctgcaa tgcatctcga cgtgctcgac ctgcgtgatt tctactaccg cacccaattg 1500 gggcgcacgg cgcaaaaggc gatccgcgac aaggtggtcg aactctggcc ggacacccag 1560 tccggcatgg ccgggctgac ggtggcgggc tacggcttcg cggtgccgct gttgcgcccc 1620 tatctgggcc gggcgcggcg ggtgatcggg ctgatgcccg cgcagcaggg cgtgatgccc 1680 tggcccgccg gagagcccaa tgtctcggtg ctctgtgccg aaaccagctg gccgctggag 1740 accgggatga tcgaccggct ggtggtgctg cacgggcttg aagtctccga cgaccccgat 1800 gcgctgatgg aggaatgctg gcgcacgctg ggccccggcg ggcgggcgct gttcatcgtg 1860 ccgaaccggg tcgggctttg ggcgccgcgc gaaaccacgc ccttcggctt tggccgcccc 1920 tatacgatgg gccagctcga ggcgcaggca cgacgggtgg ggtttgcccc cgaacgtcag 1980 gcggcggcgc tgtacattcc gccctcgcag cggcggttct ggctgcgctc ctccgagatg 2040 tgggaacggc tgggcacaag ggcggcgggc tatctggcgg cgggggtggt gatgcttgag 2100 gtgatcaagc aggtgcattc ggtgcgccgc tcggggcttg gcgcggcggt gcgcaagccg 2160 ctctcgatcc ttgaaggggc gcccaagccg gtggtcgggc ggatgtgagc cgcccgcggc 2220 cgcaagaatc gcccggccgg aaaagcccgt ttccgcggca cttcgccctg cggcggggaa 2280 acgcagcggg gcgggcttcg accctttgcg ctaacactcc gtgccggtgc agaaaatgtg 2340 ccagcctgat gcggattcct gccgccaaga tggttgcgag ggtcttgatg ctctgctaga 2400 cgcaaccccg aatgcggcgt gcgagatcat tttgggcgcc gaggggggcc tctgaatcgg 2460 tgacggaacg attggttccg gtgtccgcgt gcggaggcaa aagcatcgga agggtggacg 2520 tgtccgaacc agcttcgatt tccgcagcca ttgccgggcg ttatgccacg gccatcttcg 2580 acctcgcgca ggaggccaag ggcatcgacg cgctctcggc cgacgtggac gcgctgacgg 2640 ccgccttggc cggttcggcc gagctgcgtg acctgatttc ctcgccggtc tacacccgcg 2700 aggagcaggg ggacgcgatc gccgcggtgg ctgcgaagat gggcctgtcg gcgccgcttg 2760 ccaacggtct gaaactgatg gcgacgaagc gccgtctgtt cgcgctgccg cagctgctca 2820 agggcctggc cgccgcgatc gccgaagcca agggcgagat gaccgcggat gtcacctcgg 2880 ccaccgcgct gagcgcggcg caggccgaga agctggcggc gacgctggcg aaacagacgg 2940 gcaagaccgt caaactgaac gtcgccgtcg atgaaagcct catcggtggc atgatcgtca 3000 agctgggttc gcgcatgatc gacaccacgg tcaaagccaa actcgcttcc cttcagaacg 3060 ccatgaaaga ggtcggataa atgggcatcc aagcagctga gatttctgcg atcctcaagg 3120 agcagatcaa gaacttcggg caggatgccc aggtcgccga agtgggccgc gtgctctcgg 3180 tcggtgacgg gatcgcgcgc gtgcacgggc tcgacaacgt ccaggcgggc gagatggtcg 3240 aattccccgg cggcatccgc gggatggcgc tgaaccttga agtcgacaac gtcgggatcg 3300 tgatcttcgg gtcggaccgc gacatcaagg aaggcgacac cgtcaagcgc accaacgcca 3360 tcgtggacgt tccggcgggc gaaggcctgc tgggccgcgt cgtggacggc cttggcaacc 3420 cgatcgacgg caagggcccg atcgtggcga aagagcgtcg catcgccgac gtcaaagccc 3480 cgggcatcat tccgcggaaa tcggtgcatg agccgatggc gaccggcctc aagtcggtcg 3540 acgcgatgat cccgatcggc cgcggccagc gcgagctgat catcggcgac cgtcagaccg 3600 gcaagaccgc gatcgcgctc gacaccattc tgaaccagaa gtcgtacaac gacgccaacc 3660 cgggcaacaa gctgcactgc ttctatgtcg ccatcgggca gaagcgctcg accgtggcgc 3720 agctggtgaa gaagctcgaa gaagccggcg cgatggaata caccaccgtc gtcgccgcga 3780 ccgcttcgga cccggcgccg atgcagttcc ttgcccccta ttcggcgacc gcgatggcgg 3840 aatacttccg cgacaacggc atgcacgcgc tgatcatcta tgatgacctc tcgaagcaag 3900 ccgtggccta tcgtcagatg tcgctgctgc tgcgccgtcc gccggggcgt gaagcctatc 3960 cgggcgacgt gttctatctg cactcgcgcc tgctggaacg ttcggcgaaa ctgaacgagg 4020 atttcggttc gggctcgctg accgcgctgc cggtcatcga aacccagggc ggcgacgtgt 4080 cggccttcat cccgaccaac gtgatctcga tcaccgacgg tcagatcttc ctggaaaccg 4140 aactgttcta ccagggcatc cgcccggccg tgaacaccgg tctctcggtg tcgcgcgtcg 4200 gttcgtcggc ccagaccaac tcgatgaagt cggttgccgg tccggtgaaa ctggagcttg 4260 cgcagtatcg cgaaatggcc gcctttgcgc agttcggttc cgaccttgac gccgcgacgc 4320 aaaagctgct gaaccgcggt gcccgtctga ccgagctgat gaaacagccg caatattcgc 4380 cgctgaccaa cgccgaaatc gtggcggtga tctttgcggg caccaacggc ttcctcgatg 4440 ccgttccggt gaaggaagtc ggccggttcg agaaaggcct gctggcctat ctgcgctcga 4500 cccgcaagga cgtgcttgag tggctcacca aggaagaccc caagatcaag ggcgacgccg 4560 agaagaagct caaagacgcg atcgccgagt tcgccaagac cttcgcttga cggcctgaaa 4620 ggacagggag atgcccagcc ttaaggacct caagaaccgg atcgtgagtg tcaagaacac 4680 tcgcaagatc acgaaagcga tgcagatggt cgcggcggcg aacattcgcc gcgcccagga 4740 aagcgccgaa gctgcccggc cctatgccga gcggatgaac gccgtgatgt cgagccttgc 4800 cggtgcggtg ggctcgaccg acggtgcgcc gcgcctactt gcgggcacgg gctccgacaa 4860 ggtccatctc ctcgtcatca tgacgggcga gcgcgggctt tgcggcggct tcaacgccaa 4920 tatcgcgaaa ctcgcgaagg cgaaggcgat ggaactgctg gcccagggca agacggtgaa 4980 gatcctcacc gtcggcaaga aaggtcgcga cgcgctgcgt cgtgatctgg gccagtatta 5040 catcgatcac atcgacctga gcgacgtgaa gaaactgagc tacccggtgg cgcagaagat 5100 ttcgcaaaac atcatcgacc gcttcgaggc gggcgaatac gatgtggcga cgatcttctt 5160 ctcggtcttc cagagcgtga tcagccaggt gccgaccgcc aagcaggtga tcccggcgca 5220 gttcgaaacc gatgcggcct cggcctcggc ggtttacgac tacgaaccgg gcgatcagga 5280 aatcctgacc gcgctgctgc cgcgtgcggt ggccacggcg atctttgccg cgctgctgga 5340 aaacaacgcg tccttcaacg gggcgcagat gtcggccatg gacaacgcca cccgcaacgc 5400 gggtgacatg atcgatcgct tgaccatcga gtataaccgc tcgcgtcagg ccgccatcac 5460 caaagagctc atcgaaatca tctcgggcgc cgaggcgctc tgacggaacc ggagatagaa 5520 gagaatggca agcaaaggca aagtgaccca ggtcatcggc gccgtcgtcg acgtgcagtt 5580 cgaagacggc ctcccggcga ttctgaacgc ccttgaaacc accaacaacg gcaagcgcct 5640 cgttctcgaa gtggcgcagc acctgggcga gaacaccgtc cgcaccatcg cgatggacgc 5700 gaccgagggt ctcgtgcgcg gcgcggccgt gtccgacacc ggcggcccga tcaccgttcc 5760 ggtgggcaac gccaccctgg gccgcatcct gaacgtcatc ggcgagccgg tggacgaacg 5820 cggtgacgtg tcgaaagccg aagcccgggc gatccaccag cccgcgcccg atttcgcggc 5880 gcagtcgacg gaaagccaga tcctcgtcac cggcatcaag gtgatcgacc tgctcgcccc 5940 ctattccaag ggcggcaaga tcggtctctt cggcggcgcc ggtgtgggca agaccgttct 6000 gatcatggaa ctgatcaaca acatcgcgaa agtgcactcg ggcttctcgg tgttcgcggg 6060 cgttggcgaa cggacccgtg agggcaacga cctttaccac gagatgatcg aatcgggcgt 6120 tatcaacctc gagaagctcg aagaatcgaa agtggcgctg gtctacggcc agatgaacga 6180 acccccgggg gcccgtgccc gcgtggcgct gaccggcctg accctggcgg aacagttccg 6240 cgaccagtcg ggcaccgacg tgctgttctt cgtcgacaac atcttccgct tcacccaggc 6300 cggttcggaa gtgtcggcgc tccttggccg tatcccctcg gccgtgggct accagccgac 6360 gctggccacc gacatgggcg cgctgcaaga acgcatcacc tcgaccaaag ccggttcgat 6420 cacctcggtt caggccatct acgttccggc cgacgacctt accgacccgg ccccggccac 6480 gtcctttgcc cacctcgacg ccacgaccgt tctgtcgcgt gcgatctcgg aactcgggat 6540 ctacccggcc gtcgacccgc tcgactccac ctcgcggatc cttgacccgc aagtcgtcgg 6600 cgaagagcac tatcaggtcg cccgtgacgt ccaagggatg ctgcaacgct acaagtcgct 6660 gcaggacatc atcgccatcc tcggcatgga cgaactgtcg gaagaagaca agctgacggt 6720 ggcccgcgcc cggaagatcc agcgcttcct gtcgcagccc ttcgacgtgg cgaaagtctt 6780 caccggctcg gacggcgtgc aggttccgct cgaagacacc atcaagtcgt tcaaggcggt 6840 ggttgcgggc gaatacgacc acctgccgga agcggccttc tacatggtcg gcggcatcga 6900 tgacgtgatc gcgaaagccc agcgcctcgc cgctgcggcg taagggggaa ccatggccga 6960 taccatgcag ttcgatctcg tgtcgccgga acggcggctt gcctccgttg ccgcgagcga 7020 ggtccgtctt cccggcgtgg aaggcgatct gacggcgatg ccgggccatg cgcccgtcat 7080 cctctcgctg cgtcccggca tcctgaccgt ggtcagcgcc gcgggcacgg ccgaatacgc 7140 cgtgaccggc ggcttcgccg aggtttcggg cgagaaggtg accgttctgg ccgagcgcgg 7200 tctgacccgg gcggaactga ccgccgcggt tcatgccgag atgctggccg aggccaagaa 7260 agtcgcggac gccgcgcatc cgtcggtggc cgatgccgcc gcgaagatgc tggccgacat 7320 ggaagcgctt ggctcgcaca tcaatctctg acgggacatc ccgccggata tctcgggccc 7380 cggtcatcgc gccggggccc ttgctttttg cttttgtctt gccgcgccgc atattagcgt 7440 gaaggtgcag gcagccggag tgagcgacag gaacggatga agaagttttc ctcgacccgg 7500 atcggcgtgg cccagggatc gctggtgctg ttttcggatt atctggacgg cggcgtgatg 7560 tggacgggcg agggcccgcg cgaattgcgc aggctggtgg tgttcgacga agccttccgc 7620 gagatcccgg cggtgcaggt gtcgctgtcg atgtgggaca tcgaccagaa gcacaatccg 7680 cgcatggaca tttccgccga catggtgacg gccgagggct tcgtgatcgt ctttcgcacc 7740 tggggcgaca cccgcgtcgc ccgcgtccgc gcggactggc tggcgatcgg cggctgcgcc 7800 aatgacgacg actgggacgt ggcctgatcc cgcccggctt gactttccgc ccccccgcgc 7860 cgatggtgcg cgcgactttc ccatccaacg aggcccgccc gtgcaacaag atgccccccg 7920 ctggcagctc gtggtgatcc tgtgggggac gaaatatccg gtcgccgaac tcaacgccct 7980 gatcgagacc gtgtggcccg ggcctcgag                                   8009 <210>35 <211>9810 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>35 gatatcgggc ttgtcatttt cgattgcgac ggggttctgg ttgattcgga agttctggcc 60 gtggccgtcc tcatcgcaga actggaccgg gcgggcgtgc gggtcgacga ggccttcgtg 120 catcggcatt ttctgggccg gagcttcccg gctgttcagg aggtcgtgca gcgccagttc 180 ggcgtgaccc tgcccgagac cttccaggtc gaggaacgtg cccggctgct gtcagccttc 240 gagaccggcc tgcgggccat gctcggggcc gcggagaccg tccgcgcgct gtcggtgccc 300 tactgcctcg ccacgtcgag cacgccggcc cggctcacgc gctcgctgga gatcacgggc 360 cttgcggccc tcttcgaggg acgctgcttc accgcgagcc aggtggcgcg cggcaagccc 420 gcgcccgatc tgttcctgct cgccgcggcc gagatgggcg tcgcgcccga acgctgcctc 480 gtgatcgagg ataccgagcc cggcgtgcgc gcaggcctcg cggccgggat gcaggtctgg 540 cgcttcaccg gcggtagcca tttcgcgaac cgatcccccg aggatgcgcc cgatgccctg 600 ccgcaccggc ggttcgacag cttcgaccgt ttctacgaga ccctgcccgg cctgcgccgg 660 gccaagtgcg agaccctgac atgatcgacc ggcccgagag cgagccgacg cccctcgacg 720 atgccgcgcg cgcgggctgg ctctattatg tcgcaggcct gactcaggat cagatcgcgc 780 gggagctcgg cacctcgcgt cagcgggcgc agcggctggt gagccgggcc atctccgaac 840 ggctgatcca cgtccggctc gagcaccggg tctcgggctg cctgcatctg gaagccgcgc 900 tcctccggcg cttcgggttg aagctggccc gcgtggcgcc gagtctcggg tccgaggtgg 960 atcccctgcc ctccatcgcc cccaccgccg ccgccgaggt ggagcgggtg ctgcgctcgg 1020 agcggccgat ggtggtggcc ttcggcaccg gccggtcgct gcgcgccacc gtcgaggaga 1080 tgacctcgat ggtctgcgaa cagcacaaga tcgtgtcgct caacggaaat atttctgcgg 1140 atggctcggc ctcctactac gatgtgatct tccgcatcgc cgaccgtgtg cgtgcgccgc 1200 actatccgat gccgatgccg gtcatcgcgc aggatgcggc ggagcgggag ctgtttcatg 1260 cgctaaagcc cgtgcagtcg gtgctgcggc ttgcgcgcaa tgccgatgtg accttcgtcg 1320 ggctgggaca gatgggcgag gacgcgccgc tcctgaagga cgggttcatc acgcccgagg 1380 agctgaccga gatgcaggat ctgggcgccg tcggagaggt ggcgggatgg gtcttcgact 1440 cggagggtcg ctacctcgaa accagcatca atcagcgggt tgcgggcgtc cgtgtcgaac 1500 tttccgagga tcggacggtg gtcgccatcg ccggtggcag gcgcaagctc gcggcgctgc 1560 acgcaggctt aaggggccgt cttttcaacg gcctgatcac cgacgagttc acggcgcagg 1620 cacttctgtc ctgaagccgc cgaaaggcgc ggcaaaaagt atttgacagg ctggcacccc 1680 tcggtgagta attattcgcc gcacgaaata atgctcaccg tgcaggccag ggaggatact 1740 gatgaccgca agatttcgcg ccctgatggg cgcgtgcgcc gtggctgcgc tctcgtccgc 1800 cgccggcgcc gaaaccatca ccgtggcgac tgtcaacaac ggcgacatga tccgcatgca 1860 ggggctcatg tccgagttca acgcgcagca ccccgacatc accgtcgagt gggtgacgct 1920 cgaggaaaac gtgctgcgcc agaaggtcac gaccgacatc gccaccaagg gcgggcagtt 1980 cgacgtgctg accatcggca cctacgaggt tccgatctgg ggcaagcagg gctggctcgt 2040 gagcctgaac gacctgccgc cggagtatga tgccgacgac atcctgcccg cgatccgcaa 2100 cggcctgacc gtcgacggcg agctctatgc cgcgcccttc tacggcgaga gctcgatgat 2160 catgtatcgc aaggacctga tggagaaggc ggggctgacc atgcccgacg cccccacctg 2220 ggacttcgtg aaggaagcgg cgcagaagat gaccgacaag gatgccgagg tctacggcat 2280 ctgcctgcgc ggcaaggccg gctggggcga gaacatggcc ttcctcagcg ccatggccaa 2340 cagctacggc gcgcgctggt tcgacgagaa ctggcagccg cagttcgacg gcgaggcctg 2400 gaaggccacg ctgaccgact atctcgacat gatgacgaac tacggcccgc ccggcgcctc 2460 gaaaaacggc ttcaacgaga acctcgcgct gttccagcag ggcaagtgcg gcatgtggat 2520 cgacgcgacg gtggccgcct ccttcgtgac caaccccgag gaatccacgg tggccgacaa 2580 ggtgggcttc gcgctcgccc ccgataccgg caagggcaag cgggccaact ggctcggggc 2640 ctggaacctc gcgatcccgg cgggctcgca gaaggtcgat gccgccaagc agttcatcgc 2700 ctgggcgacc tcgaaggact atgccgagct ggtggcctcg aaggaaggct gggccaacgt 2760 gcctccgggg acgcggacgt cgctctacga gaacccggaa tatcagaagg tgccgttcgc 2820 gaagatgacg ctcgacagca tcaacgcggc tgacccgacc cacccggcgg tcgatccggt 2880 gccttacgtc ggtgtgcagt tcgtggcaat ccccgagttc cagggcatcg gcaccgccgt 2940 gggccagcag ttctcggcag ccctcgcggg ctcgatgtcg gccgagcagg cgcttcaggc 3000 ggcccagcag ttcacgacgc gcgaaatgac ccgcgcgggc tacatcaagt gagcccttcc 3060 gcgggccggc cctgagcggc cggcccgcac cgcttgccgc ttccggccgt atccgccgga 3120 ggcctttccg ccccatcagc cccgaggcct ccatggcgac ccagcattca aagactgcgg 3180 cgcgtctgat gatttccccg gccgtgatcc tcctgttcct gtggatgatc gtgccgctgt 3240 cgatgacgct ctacttcagc ttcctgcgct acaacctcct catgccgggg atggagagct 3300 tcaccggctg ggacaattac tattacttcc tgaccgatcc ggccttctcc gcggccctga 3360 ccaacacgat cctcctcgtg gtcggcgtcc ttctcatcac cgtggtgggc ggggtcctgc 3420 tcgcgctcct gctcgaccag cccttctggg ggcagggcat cgtgcgcgtg ctggtgatcg 3480 ctcccttctt cgtcatgccc accgtctcgg cgctggtctg gaagaacatg ttcatgaacc 3540 ccgtgaacgg gatgttcgcc catatcgccc gcgggctcgg ccttccgccg ttcgacttcc 3600 tgtcgcaggc gccgctggcc tcgatcatcg gcatcgtggc ctggcagtgg ctgcccttcg 3660 ccacgctgat ccttctgacg gcgctccagt cgctcgaccg cgagcagatg gaggcggccg 3720 agatggacgg cgcctcggcg ctcgaccggt tcatccacat caccgtgccg cacctgacgc 3780 gtgccatcac cgtggtggtg ctgatccaga ccatcttcct tctgggcgtc ttcgccgaga 3840 tcctcgtcac gacgaacggt ggacccggca ccgcctcgac caacatcacc tacctcgtct 3900 atgcgcagtc gctcctgaat tacgacgtgg ggggcgggtc ggccggcggc atcgtcgccg 3960 tggtgctcgc caatatcgtg gcgatcttcc tgatgcgcat gatcggcaag aatctggacg 4020 cctgacatgt cacgccgcac ctcaacccgc cgcacgctga tcgtcacgct cgccgcctgg 4080 acgatagcct tcctcatctt cttcccgatc ctctggacgg tgctgatgag cttcaaatcg 4140 gaaggagacg ccatcaaggc gcccttcgcc atgctcttct cggactggac cctgcaatcc 4200 tacgccgatg tgcaggaacg gtcgaactac gcccgccact tcatgaattc ggtggtgatc 4260 tcgctgggct cgaccctcgt ggcgctcgcc atcgcgatcc ccgccgcctg ggccatggcc 4320 ttcgtgccgg gccggcggac gaaggacgtg ctgatgtgga tgctgtcgac caagatgatg 4380 ccggcggtgg gcgtgctcat cccgctctat ctgatcttcc gcgacacggg ccttctcgac 4440 acgcggatcg gcctcgtgat cgtgctcacg ctcatcaacc tgccgatcgt ggtctggatg 4500 ctctacacct acttcaagga gatcccgggc gagatcctcg aggcggcgcg gatggacggg 4560 gcgacgctcg gctccgagat cctctatatc ctcacgccga tggccgtgcc gggcatcgcc 4620 tcgacgctgc ttctgaacgt gatcctcgcc tggaacgagg ccttctggac gctgcagctg 4680 accacctcgc gggcggcccc gctcacgcag ttcatcgcga gctattccag ccccgagggc 4740 ctcttctacg ccaaactgtc ggcggcctcg accatggcca tcgcgccgat cctgatcctt 4800 ggctggttca gccagaaaca actcgtccgc ggcctgacct tcggcgcggt gaagtgagga 4860 ccacatgggc aagataaccc tgcgcaacgt ccagaagcgg ttcggtgagg cggtcgtcat 4920 cccctcgctc gacctcgaca tcgaggatgg cgagttcgtc gtcttcgtcg gcccctcggg 4980 ctgcggcaaa tccacgctcc tgcgcctgat cgcgggcctc gaggatgtgt cggacggcca 5040 gatcatgatc gacgggcgcg acgccaccga gatgccgccc gcgaagcgcg gcctcgccat 5100 ggtgtttcag agctacgcgc tctatccgca catgacggtg aagaagaaca tcgccttccc 5160 gctgcggatg gcgaagatgg agccacagga gatcgagcgg cgcgtgtcga acgcggccaa 5220 gatcctgaac ctcaccaact atctcgaccg ccgccccggc cagctctcgg gcgggcaacg 5280 gcagcgggtg gccatcgggc gcgccatcgt gcgcgagccg gcggccttcc tgttcgacga 5340 gccgctctcg aacctcgatg cggcgctgcg ggtcaacatg cggctcgaga tcaccgagct 5400 gcaccagtcg ctcgagacca cgatgatcta tgtcacccac gatcaggtcg aggccatgac 5460 catggccgac aagatcgtgg tgctgaacgc gggccggatc gagcaggtgg gctcgcccct 5520 caccctctac cgcaatccgg cgaacctctt cgtggcgggc ttcatcggca gcccgaagat 5580 gaacctgatc gaggggcccg aggccgccaa gcacggcgcc accaccatcg ggatccgccc 5640 cgaacatatc gacctgtcgc gcgaggcggg ggcgtgggag ggcgaggtcg gcgtctcgga 5700 acatctcggc tcggacacgt tcctgcatgt gcatgtcgcg gggatgccca ccctcaccgt 5760 gcggacgggc ggagagttcg gcgtccatca cggcgaccgg gtctggctca cgccgcaggc 5820 cgacaagatc caccgcttcg gcgccgacgg aaaggcgctc tgacatgcgg ctcgacggca 5880 agaccgccct catcaccggc tcggcgcgcg gcataggccg cgccttcgcc gaggcctatg 5940 tgcgtgaagg cgcgcgcgtg gccatcgccg acatcaacct cgaggcagcc cgcgccaccg 6000 cggccgagat cggccccgcg gcctgcgcca tcgccctcga cgtgaccgat caggccagca 6060 tcgaccgctg cgtggccgag cttctcgacc gctggggcag catcgacatc ctcgtgaaca 6120 atgcggccct cttcgatctg gcgcccatcg tcgagatcac ccgcgagagc tacgaccggc 6180 tgttcgcgat caacgtctcg ggcacgctct tcatgatgca ggcggtggca cgggcgatga 6240 tcgcgggcgg ccggggcggc aagatcatca acatggcaag ccaggccggc cgccgcggcg 6300 aggcgctggt gggcgtctat tgcgcgacca aggccgccgt catctcgctc acccagagcg 6360 cggggctgaa cctcatccgc cacgggatca acgtcaatgc catcgccccg ggcgtggtgg 6420 acggcgagca ctgggacggg gtggatgcga agttcgccga ctacgagaac ctgccccgcg 6480 gcgagaagaa gcgtcaggtc ggcgcggcgg tgcccttcgg ccgcatgggc cgcgccgagg 6540 acctgaccgg catggcgatc ttcctcgcca cgcccgaggc cgactacatc gtggcccaga 6600 cctacaacgt ggacggcggc aactggatga gctgaggccc aaggcccggc cctccccccg 6660 tcgaacgcgc cccctatccg aggtaatccc atgacccgct ccgtcacccg tccctcctat 6720 gaccgcaagg cgctcactcc cggcatcgtc catatcggcg tcggcaactt ccaccgggcg 6780 catcaggcgg tctatctcga cgatctcttc gcgctgggcg agggccacga ctgggccatc 6840 ctcggcgcgg gcgtccgccc gaccgatgcg cggatgcgcg aggctctggc cgcgcaggac 6900 aatctctcga cggtgatcga gctcgatccg gcgggccacc gggcccggca ggtgggggcg 6960 atggtgggct tcctgccggt cgaggccgac aatgcggccc tgatcgaggc catgtcggat 7020 ccgcgcatcc gcatcgtctc gctgaccgtg accgagggcg gctattatgt cgatgcctcg 7080 ggcgccttcg atccgacgca tcccgatatc gtggccgatg cggcccatcc tgcgcggccc 7140 gcgaccgcct tcggcgcgat cctcgccgcc ctccgcgccc gccgcgacgc gggggttaca 7200 cccttcaccg tgatgtcctg cgacaacctc cccggcaacg gccatgtcac ccgcaacgcc 7260 gtggtgggcc tggccgagct ctacgacgcc gagcttgcgg gctgggtgaa ggcgcaggtg 7320 gccttcccga acggcatggt cgaccgcatc acccccgcca ccggcccgca cgagcgcgaa 7380 ctggcgcagg gcttcggcct cgccgatccg gtgcccgtca cctgcgagcc gttccggcag 7440 tgggtgatcg aggatcattt ccccgccgga cgccccgcgc tcgagaaggt gggcgtgacc 7500 ttcaccccgc atgtccatgc ctacgaggcg atgaagatcc gcatcctgaa cgggggccat 7560 gcggtgatcg cctatccgtc ggcgctcatg gacatccagc tcgtgcacgc ggccatggcc 7620 catccgctga tcgcggcctt cctgcacaag gtcgaggtcg aggagatcct gccccatgtc 7680 ccgcccgtgc ccgacaccag catccccgac tatcttaccc tgatcgagag ccgcttctcg 7740 aaccccgaga tcgccgacac gacgcgcagg ctctgcctcg acggttcgaa ccggcagccg 7800 aagttcatcg tgccgtcgct gcgcgacaat ctggcggcgg gcacggtgcc gaaggggctg 7860 gtgctgctct cggcgctctg gtgccgctac tgcttcggca cgacggactc gggcgttgtg 7920 gtcgagccga acgatccgaa ctggacggcg ctgcaggacc gggcgcggcg ggcgaaggag 7980 acgccggccg agtggctggc gatgaccgaa gtctacggcg atctggcgca gaacgatctt 8040 ctggcggccg agttcgcggc agccctcgag gcggtctggc gcgacggggc cgaggcggtg 8100 ctgcggcgct tcctcgcggc ctgatccgca gggcccagcc gctcggagca ccgaagcgga 8160 gcccctgccc cttgcggcgc accgtgaggc gaaacgaccg ggccaccccg gggccaccgc 8220 ctcggtaaca ccatggtatc gcgcaagaat gccggcgcct ctgccgaacg ggcccggctg 8280 ccgggcgagg cgccggactt gtcaaggcgg cggccctcgg gtagagaggg cgggcgtggc 8340 cccgttagca cagtggtagt gcagcgctct tgtaaagcga aggtcgttcg ttcaaatcgg 8400 acacggggca cgcgatcctc cctccgcatc ggcgctcgcc cccggtctgg actgcctctt 8460 cggaaggcac ctgcccgctt gtgcgccgcg ccctttcctc gcttcccaag cgtctgtcac 8520 ggcttgcgga aagccgtgcg cctcggttct ggacagccgc cccttgcggt gtaatctgcc 8580 ctcagcgcgc agccggcgga cagaagccgg cccgccacgt ccacaaggga ggaatgccat 8640 ggatcgtcgt tcattcatca ccaaggccgc cgtgggaggg gccgccgcga gcgccctcgc 8700 cgcgccggcg cttgcccagt ccgcgcccaa ggtcacctgg aggctcgcct cctccttccc 8760 gaaatcgctc gacacgatct tcggcggcgc cgaagtgctg tcgaagatgc tctccgaggc 8820 caccgacggc aacttccaga tccaggtctt ctcggcgggc gagctggtgc cgggcctgca 8880 ggccgccgac gccgtgaccg agggcaccgt cgaatgctgc cacacggtcg gctactatta 8940 ctggggcaag gatcccacat tcgcgctggc cgcggccgtg cccttctcgc tgtcggcgcg 9000 cggcatcaac gcctggcact accatggcgg cgggatcgac ctctacaacg atttcctcgc 9060 gcagcacaac atcgtggcct tcccgggcgg caacaccggc gtgcagatgg gcggctggtt 9120 ccggcgcgag atcaacaccg tggccgacat gcagggcctg aagatgcggg tcggcggctt 9180 tgcggggaag gtgatggagc gtctgggcgt cgtgccgcag cagatcgcgg gcggcgacat 9240 ctatccggcg ctggagaagg ggacgatcga cgcgaccgaa tgggtcggcc cctatgacga 9300 cgagaagctc ggcttcttca aggtggcgcc ctactactac tatcccggct ggtgggaagg 9360 cggcccgacc gtccatttca tgttcaacaa gagcgcctac gaggggctga ccccggccta 9420 tcagtcgctg ctgcgcaccg cctgccacgc ggccgatgcg aacatgctcc agctctacga 9480 ctggaagaac ccgacggcga tcaagtcgct ggtggcgcag ggaacccagc tcaggccctt 9540 cagccccgag atcctgcagg cctgtttcga ggccgcgaac gaggtctatg ccgagatgga 9600 agcctcgaac cccgccttca agaagatctg ggactcgatc aaggccttcc gctccgagca 9660 ctacacctgg gcgcagatcg ccgaatacaa ctacgacacc ttcatgatgg tgcagcagaa 9720 cgccggcaag ctctgagccc gagcgccgcg cgaaagagga ccccggagcc gcgttccggg 9780 gtcttttcat gggcgacagg ggccggcgcg                                  9810 <210>36 <211>1886 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>36 tgagtgtcta ttttttttcg ggttttttta agtgtgaatc acatggttag gagcagttgt 60 cttcaatgtg accaaccatc ccaaggctct aattcaacgt ttgggtgtgg gggcccgctg 120 gcagctgtgt gtgccactgg gctgttggtg ttggtgcttt actccccctc atcgcaaacg 180 gctaattggt cggcacaggg tatttccaca aaggcgctgt atccggcagt gcctgtgcct 240 tccactctgc tgcctggaag cgcgcctgcc aaacaccagc tgcatgtttg gagggcacat 300 gcgatgtcgg aggccacaac aaacaattca ttcaaacagt cattatttgg gtacaatgcc 360 atctcctcca tttggcttca actggctggt gtggccgcca ctttctttgc atttggagct 420 ttgatggcag ctgtaacgca acgcaaggag atcgccgtct tctccgcctc gggtcaggct 480 gctgagccgg agggggcgga gcccctgaag cggccttttc cgtctcctgc tgccaaacct 540 aagccgctct tctccacccc ggcaaattcc ttcagcaaca tcttccaggc gcctccatcg 600 ctgcgcacgg actccaccta tggccgaggc ccgcgctcga ccagcttcac cgacatcagc 660 aactggccct ccaacaacgc actccgcaac ccccagtcgg tgattgacat cgggggagga 720 gtcgacttcc tgggggacag aagccctgga aacccgttca cgcggctgcg ggggtccccg 780 agctccaccc tcagcaacct cggcatgggc ctaggcctgg ggctgggcaa gggcaagggc 840 ttcggcaagg gcttcggcaa aggccggggg ttccccgtgg aggaggaggt ggaggaggag 900 caggaggtgc tgtcgtgggc cgaccgccgg cgggcgctgg cggaccccga cgccccgccg 960 atgaacgagg acatcaagta cccgcagctg cggctggtgc gggccgtgcc gggcggccgg 1020 gacgagaagc tcggtgtgat gtcgaggcag gaggcgctgg agctggcgga ggcggaagac 1080 atcgacctcg tcctcgtcag catcgacacc gaccccccgg tggccaagct agtcaattac 1140 tcgaagttga agtacgagtc cgagaagaag aagaaggaca gccacaagaa ggggaaggtg 1200 aaggaggtga aggagctgaa ggtgtcccat aagatcggcc agcacgacta cgacgtccgc 1260 gtgaagcagg cccgaaagtt cctggagggc ggccaccgca tcaaggtgtc gatggagttc 1320 aaggggcgcg agaaccagtt cgtggagatc ggccgcgcgg tgatgaagcg cttccagaac 1380 gacctggcgg acatgggcaa ggcggacgcc gtgcccaaga agctcggcac ccggctgatc 1440 ctgaacctgg ccccggccgg ggaggcgctg aaggtgattg cggagcggag ggcagagcgc 1500 gacaggaaag ccgcggctga ggaggagggg gagggcgacg acctcgactt cgtggacgag 1560 aacgaggacg aggatgtgga gggggagggc gaggaggaag aggccgagga gctggaggag 1620 gagacagcgg aggggacgga ggtgccaacc cgcagctgat cgccgatccg cgggggacag 1680 ccacctcccc cccggcctcc ctgccggggg ccggcaccat ccgtcgttgc ggtgcggcgc 1740 tgccatcaac ggccgtcctt gagcttaatg ctcccgccct ccgttggccc gcggcggtcg 1800 ccaggttgct ggcctggctg cccgcagctc ctcccctccc cgactgacac agtgtggatg 1860 accgtgatgt gcgccttttc gccttc                                      1886 <210>37 <211>3015 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>37 ccgctcatct ccaggcctcc ctgagtgcgt acccgagagc ggcaagtaga gaaaggaaca 60 cagatacagc accatggcct ctaggctcgt ccgtgtgctg gcggccgcca tgctggttgc 120 agcggccgtg tcggtcgacg cgcgcttcgt ggtgcgcatg gtgcaggtgg tacaccgcca 180 cggtgcgcgc agcgcactca tcgacgacaa cacgacggag atttgtggca ccctgtaccc 240 gtgcggtgag ctgaccggcg agggtgtcga gatggtccgt gctatcggcg agtttgcccg 300 cagccgctac aacaacctct cattggtgga gagccctctc ttcccgtcga cgcggtacaa 360 ctcctctgtc gtgcacacac gctccaccca cacccagcgc accatccaga gcgcgaccgc 420 ctttctgcgc ggcctcttcc aggacgacta cttctacccg gtggtgtact cgaccaacag 480 aacgaccgaa acgctgctca gcactgacgc ggtgccgtcc gtggtgggcc gtagctggct 540 cgacaacccg gcgctgcacg ccgccctcaa cccggtgatc gatgagcacc tcagctggga 600 cgccatccag agcgctgcca aggacgcatg ggtcgagggc ctgtgcgcgg actacaacgc 660 ccgcaccaac tgcgtcctcg acatgtacga cgtggccgcc gccttcgagg ccgccgggcg 720 tcttgacaat gccaccaatc tcaaggcggt gtatcccggc cttcaggagg tgaacgccgc 780 ctggttcaag tatgtcttca gctggaacca cacgagcaag ctcgatctca cgcagggctc 840 cgcctcgcag aaccttgcgc agacggtgct ggccaacatc aacgcccacc gcctctctcc 900 gtcgtacaac atgttccagt acagcgctca cgacacaacg gtgactccct tggctgtcac 960 gttcggtgac cagggcgaga cgacgatgcg tccgcccttc gcggttacca tcttcgtgga 1020 gctgctccag gacaccgcag atgccagtgg ctggtacgtg cgcctcatcc gcggcaaccc 1080 tgtgaaggca gccgacggca cctatgtctt ccaggagtct ggtatcaagg catactgcat 1140 cgatgaagcc gggaacaagt acctcgcaca caccggcatc tgcccgctga atagcttccg 1200 ccgcatggtc gactactcgc gccccgccgt ggctgacggt cactgcgcca tgacacagac 1260 tcagtacagc aacatggatt gcccgcgcac tatcgcggac aacaagccgg tgccgtcgcg 1320 ctgctggctc taccgccacg tttgccctag caaggcatgc ccggacagct acattctctc 1380 cgcggtcgac caccagtgct accccgggcc cgacgttacg aaccccacca gcagcagcag 1440 cagcgagggt accaccacca gcagcagcga gggtaccgcc accagcagca gcgacgttac 1500 caccaccagc agcagcgagg gtaccgccac cagcagcagc gacgctacca ccagcagcag 1560 cgagggtacc gccaccagca gcagcgacgc taccaccagc agcagcagcg acgctaccac 1620 caccagcagc agcgagggta ccaccagcag cagcagcgac gctaccacca gcagcagcga 1680 cgctaccacc accagtagca gcgagggtac cgccaccagc agcagcgacg ctaccaccac 1740 cagcagcgag ggtaccgcca ccagcagcag cgacgttacc accaccagca gcgagggtac 1800 cgccaccagc agcagcgacg ctaccaccac cagcagcagc gagggtacca ccagcagcag 1860 cagcgacgct accaccagca gcagcgaggg taccgccacc accagcagcg acgctaccac 1920 cagcagcagc agcgagggta ccaccagcag cagcagcgac gctaccacca gcagcagcga 1980 cgttaccacc accagcagca gcagcgaggg taccgccacc agcagcagcg acgctaccac 2040 cagcagcagc gagggtaccg ccaccaccag cagcgacgct accaccagca gcagcagcga 2100 gggtaccacc agcagcagca gcgacgctac caccagcagc agcgagggta ccgccaccac 2160 cagcagcgac gctaccacca gcagcagcag cgagggtacc accagcagca gaagtgacgc 2220 taccaccagc agcagcgagg gtaccgccac caccagcagc gacgctacca ccagcagcag 2280 cagcgagggt accaccagca gcagcagcga cgctaccacc agcagcagcg agggtaccgc 2340 caccaccagc agcgacgcta ccaccagcag cagcagcgag ggtaccacca gcagcagcag 2400 cgacgctacc accaccagca gcgacgttac caccaccagc agcagcagcg agggtaccgc 2460 caccagcagc agcgacgcta ccaccaccag cagcgacgtt accaccacca gcagcagcag 2520 cgagggtacc accaccagca gcagcagcag cagcagcaaa agcacaagtt catcggatgt 2580 cccttccttc aaaaagcccg cgaactggag cccgcgcgtt ctctcgccgg aaaggggccg 2640 ccacattgcc ggggacatca tccgccgcgt gacgaacggt gttacgatcg gtgcgggtgt 2700 ccgaaagcac gatgagtaca gccggcaccg ccaacagtag cacaacggca tgtaactctt 2760 ttgtgcatgt ttgaatggag aggaggcttc tgtacagcgt acattgtttc gagaaggtat 2820 cacaaccgct cgtttcaccc ccgtcatctt ttcattttga tctccgtcgt ctcatactgc 2880 ctttgtgggc tctctctggg tgtgggcgct tgtgcgtgtg tcgctgtaaa gtcgttgacg 2940 ccatcgctct tacctgtggg ctattttttt aattatggtt tattattact tccctctctg 3000 cgcgtccctc tgcag                                                  3015 <210>38 <211>38186 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>38 gatccttcct gcctcttccg gcgtctgggg ctccaggcgc ccttggcttg cagattgatc 60 tccctgatct ctgcctccat ctgctcacag ccttctcccc tgtgtgtctc tgtctcttct 120 tgtaaattca tccgtcgttg gatcagggcc cacccggttc ctcgtggcct cgccttaact 180 gggccatgtc tgcagagacc ctatttccac ataaggtcct attcacagga accgggggtc 240 aggatgtcag cctgtctttc tgggagatgt agttcaaccc acaacacaca tcaaacagtt 300 attgagcgcc gactgcgtgc cctgccgtgt gcttgaaggt cccaccctca ggaagcgggg 360 cctagggatg gcggccgtga tcacgcaggc agcagagagc agctctggga agcggggagg 420 gacgaggacg gggaggcgac atcagcaagg ccgtgtgtga gccaggcagg gtgtccccgg 480 tgtagcacct ggctcgggca gaggccccga ggaggggctg gaggagctgg gcgaggaggc 540 gggcaggacg ggcctgacac tagggacctc gggccccggg aatgcctctg ggggggcgtg 600 tacacccgtt gctcccagga ggcacacact gcggttcgct tcgccaagaa tgtttaattg 660 catttgatga ctacggtttc cattcattca tttgtagaga tataacactc agaccacaaa 720 atgcataaaa tgcggtggct tttagtatta acagagtgct gcacccgata ccacagcctc 780 actccagaac attctcatgg gcccaaaagg agacctgggg tgttagtcac cagctcactc 840 cccgtcccca gcccctggca acccacgcta cttagtcatt atttaggtgt ttaggagttg 900 caaagtcaaa tctttaaacc cacatatggc caggcgtggt ggctcacgcc tgtaatccca 960 gcactttcag aggccgagac gggcagatca cctgaggtca ggagttcgag accagcctgg 1020 ccaacatggt gaagccccgt ctccactaaa aatacaaaat tagccgggcg tggtggtggg 1080 cgcctgtaat cccagctact ctggaggctg agacaggaga atcgcttgaa cccaggaggc 1140 ggcggttgca gtgagccgag attgtgccac tgcactccag cctggacaac agagcgagac 1200 tccgtctcaa aaaaaaaaaa agtaccaaaa agtgccccag gtcataaggg cacagctcga 1260 tagctggtcc ctaaagggaa cgtggtgtaa ccaccacaca gaacgaagct ggaacgttcc 1320 tgccgtcctt agaagctgcc tttgctaagg ggaattgccc tgacttccca caccattgat 1380 tcatctccag acccttggtt ttcatgttga tttttcaaaa atcacctgat agtctgaccg 1440 aatgtagctt tccactggtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgagagagag 1500 atggagtctc gctctgtcac ccgggctcca gtgcagttgt gtgatcttgg ttcactgtaa 1560 cctcctcctc ccgggttcaa gagactcgtg cctcagcctc ccgagtagct gggattacag 1620 gcacccgcca ccacacccag ctaatttttt gtatttttag tagagatggg gtttcaccat 1680 gttggccagg ctggtctcga actcctgaca tcaggcgatc cacccacctt ggcctcccag 1740 agtgctggga ttacaggtgt gagccaccac gcccggcctt atttttcccc cattttcttt 1800 tttttttttt ttgagtcagg gtcttgttct gcgctcaggc tggagggcag tggtgtgggg 1860 atcacggctc actgcagcct cgacttcctg caccaccacg cctggctgtt tttttttttt 1920 ccggtagaga cgggggtctt accgtgttgc ccaggctggt ctagaactcc tgggctcaag 1980 cgatcctccc gcctcggcct ccgcaaatgc tgagatcaca cgcgtgagcc cccgcacccg 2040 gcctcctttc caccgctctt gtctacagcc gcccctcctg gtccgattgt attggcagat 2100 gtcgccaata cggtgtcaaa cggcgaaggg gcactgagcg ttttttcttt ctcccgtcct 2160 tggcggcagc agctcggttc cggctacggg gctgagcccg tctctcagac gaggaaactg 2220 gggtccgaga ggtgagccgg tcccagaggc agggcgaggg ggaagcggga gtggggtccg 2280 cagcggaccc agccctgcct cccccctgca ggagatcgtc aacttcaact gccggaagct 2340 ggtggcctcc atgccgctgt tcgccaacgc cgaccccaac ttcgtcacgg ccatgctgac 2400 caagctcaag ttcgaggtct tccagccggg tgactacatc atccgcgaag gcaccatcgg 2460 gaagaagatg tacttcatcc agcacggcgt ggtcagcgtg ctcactaagg gcaacaagga 2520 gatgaagctg tccgatggct cctacttcgg gggtgagctt gaggggggcg cgcctggagg 2580 gggagggggc acgcgacccc cgcggtgtgc agagccaggg ggccggggcc ggggccgggg 2640 ccggggatgg ggatggggat ggggatgggg ccggggatgg ggatggggat ggggatgggg 2700 ccggggatgg ggatggggat ggggccgggg atggggatgg ggccggggat ggggccgggg 2760 atggggccgg ggatggggcc ggggccggca ccagggagag cctgggtggg aagcgcccac 2820 gctggccaag gtgcagaggc cgggccgtgt gcctgggcgg ggagggccgc ggcgcccgcc 2880 tcgtccagca acccccccct gcgcgccacg tgcagagatc tgcctgctca cccggggccg 2940 ccgcacggcg agcgtgcggg ctgacaccta ctgccgcctc tattcgctga gcgtggacaa 3000 cttcaacgag gtgctggagg agtaccccat gatgcggcgc gccttcgaga cggtggccat 3060 cgaccgcctg gaccgcatcg gtgagcgggc cgggggcgtg gccggggcgg gtgccctggc 3120 gggggagggg cgtggccaag gcatcaggag agtggcttgg acagtggcag ggggaagggc 3180 gtggctgtgg catcaggggc acggttgggg cagagacgtg gccaaggcat caggagtgtg 3240 gccatggcag caggggcgtg gctggggcag gggcagcggc tggccgctcc taggacccct 3300 ttgggtctag aggctgattt tctgacctat tgtcctactt cagccagagg cagcctgttt 3360 cccaagggag ggaatgcaca gggtgtttgc ggttgtgccg aatgctcggt gagcacctgc 3420 tgtgtgctgg gggtgcaggg gacagacccg ggggcccact cagactccca gggaggctta 3480 tggactggtg atgaaatcac acacgactgg gctgtgtgcc agcagggcag gtggggccgg 3540 tgggcttccc tgagttggga atgcagagtg gagaccaggg taagggatgc catgtggaaa 3600 cggggaggaa gatgtgttcg tggagtggac acagcacatc ccaaggccct gaggtggaaa 3660 agaggcctag agtccagaga gccagggagg cctggaggag gttggggaag aaggggaggc 3720 cagacacaca gggcccagtg ggcggcaggg agagtttaga ctaaatcagg agcatcaggg 3780 agccatggag ggttctaggt gggcggagga cctggtcaga ttgtatccgc caaggcgggc 3840 cgtgtccagg agggagacgg tgacctggcc tctcaggggg gcagtctctg gggcagggag 3900 cggcagagcc ctgatgactg gatgtaggcg ccagagagat ggcggctcat gctgctgttc 3960 gtgggaatgg gaatgaagac catggctgaa acgcaggaca ggtgcgacgg agtggtgtca 4020 gggagctccc tggtgtacag taggaagctc tccacaactt gctctataca gtgagtatgc 4080 aacccgttcc tgagtatcag gtgcttaggt tataacttct gtatacagca ggtgctcagc 4140 acaggctgtg tacaggcagg tgttttcggt atgcctgtgg cacactggag gcagtcatta 4200 cataatcagc gtatacaggt ggtacacatg catacttggt gcacagtgat acctgctcca 4260 tgtacacagc aggcattaaa tacctgttta ctgccaggcg cggtggctca cgcctgtagt 4320 cccagcactt tcggaggcca aggtgggtgg atcacgaggt caggagattg agaccatcct 4380 ggctaacatg gtgaaacccc gtctctacta aaaaaaaaat acaaaaaatt agccgggtgt 4440 ggtggcgggc gcctgtagtc ccagctactc gggaggatga ggcaggagaa tggtgtgaac 4500 ccgggaggtg gaccttgcag tgggccgaga tcgcgccact gcactccagc ccgggcgaca 4560 gagcaagact ccgtctcaga aacaaagcaa aacaaaagcc ctgctttctg tatgcaggtg 4620 cttcatgcat gctggctgtg catagcaggt gctcagcctg tatatggcag gtactcaata 4680 tccatactat aggccagaga tgctacatat gtgcttattg tatacagtag gtggtaaatg 4740 catgcttgct ctacacggca agcactgtgt gcgcacccgc ggtgcagagt aggtgctcgg 4800 tgcccgctgt acgcagcagg cgctccctgt gcacacgcta acgccccctc tcccgcaggc 4860 aagaagaatt ccatcctcct gcacaaggtg cagcatgacc tcaactcggg cgtattcaac 4920 aaccaggaga acgccatcat ccaggagatc gtcaagtacg accgcgagat ggtgcagcag 4980 gccgagctgg gtcagcgcgt gggcctcttc ccgccgccgc cgccgccgcc gcaggtcacc 5040 tcggccatcg ccacgctgca gcaggcggcg gccatgagct tctgcccgca ggtggcgcgg 5100 ccgctcgtgg ggccgctggc gctcggctcg ccgcgcctcg tgcgccgccc gcccccgggg 5160 cccgcacctg ccgccgcctc acccgggccc ccgccccccg ccagcccccc gggcgcgccc 5220 gccagccccc gggcaccgcg gacctcgccc tacggcggcc tgcccgccgc cccccttgct 5280 gggcccgccc tgcccgcgcg ccgcctgagc cgcgcgtcgc gcccactgtc cgcctcgcag 5340 ccctcgctgc ctcacggcgc ccccggcccc gcggcctcca cacgcccggc cagcagctcc 5400 acaccgcgct tggggcccac gcccgctgcc cgggccgccg cgcccagccc ggaccgcagg 5460 gactcggcct cacccggcgc cgccggcggc ctggaccccc aggactccgc gcgctcgcgc 5520 ctctcgtcca acttgtgacc ctcgccgacc gccccgcggg cccaggcggg ccgggggcgg 5580 ggccgtcatc cagaccaaag ccatgccatt gcgctgcccc ggccgccagt ccgcccagaa 5640 gccatagacg agacgtaggt agccgtagtt ggacggacgg gcagggccgg cggggcagcc 5700 ccctccgcgc ccccggccgt cccccctcat cgccccgcgc ccacccccat cgcccctgcc 5760 cccggcggcg gcctcgcgtg cgagggggct cccttcacct cggtgcctca gttcccccag 5820 ctgtaagaca gggacggggc ggcccagtgg ctgagaggag ccggctgtgg agccccgccc 5880 gccccccacc ctctaggtgg cccccgtccg aggaggatcg ttttctaagt gcaatacttg 5940 gcccgccggc ttcccgctgc ccccatcgcg ctcacgcaat aaccggcccg gcccccgtcc 6000 gcgcgcgtcc cccggtgacc tcggggagca gcaccccgcc tccctccagc actggcaccg 6060 agaggcaggc ctggctgcgc agggcgcggg ggggaggctg gggtcccgcc gccgtgatga 6120 atgtactgac gagccgaggc agcagtgccc ccaccgtggc cccccacgcc ccattaaccc 6180 ccacaccccc attccgcgca ataaacgaca gcattggcgc caagcctggc cgcgtgtgat 6240 tgcccgagac ccgcagggcg tgcacccttc ctgaagacag tggctcctgg gggtggcaaa 6300 agagctttat ttacacactg acaaggctca cggggtgtca gctgaagaag taggtggaac 6360 gcttcacctg ctccaggtcg aaggcccctg cggaggaagc agagcggacg gcgtgggtgg 6420 cgggaaagcc ccgccctggc ccgcagttcg agccaccctt gcgaggctgc ccacccgcct 6480 acctggcttg ggcaccgcct gcagtgtctc cttcagctgg ctggcctcca agatcttctg 6540 gggcctgggg ttggaagcag ggtggggtga ggctgaggcc aggttttggg gtgggggggg 6600 aatccaggta gttggggtca gggagcgcct tactcagagc agaaccgctt gaccaggaat 6660 ctggacaggt cctgcaggat gggctcgctg tgcaagcgga caaactgctc ccggcacacc 6720 tgggcaggag tcagaggatc cccaggggtg atcaggcagg ctctgggcac cacccctacc 6780 caacgcccca gtgtgggggc cccacccatg ggtggactga ggctcagact acgggggcac 6840 ctggttcatg acggagacat cagctgcgtg agtccagtaa cagtcgtgca cagagacgaa 6900 ggtcaggccc ttcctgtggc agagcggagg actcctgaag ggaggggagc tcacagggcc 6960 acccagtgac cagcatcctg gccctgcgct cagccccctc cacttgaggt ccagggaagc 7020 ccaccctcct gcaggcctcg ccccacccct cgccccgccc ctccccaaac atcctgggtt 7080 aggtatcagt acagggggag gaaatgttcc cagaagcctc ctcgccccac ccctgccgcc 7140 ccccacgctg ctgtgggagc ctcagctccg agggcggcta cgaggtcccc tcctgccagg 7200 gccaccaccc cgcatcctga gcattcccag ctcccgtggc cggtagattc tgctggaacg 7260 acctccacgt gctccagatc taaccacaca tcgcggtgcc aagaaatgcc cagcaggaag 7320 gggcagcgcc catgctcggc tctccctgtc gggccacagg aggggagctg ccaggaccac 7380 ctacattcgg ggcacacagc ctcagggcct ctacacaggc cccacagaca cagcagatcc 7440 actctgccca gtccctgccc ccagctagac ccagccttgc cagctgtgcc ctgctagcca 7500 gaagacgccc ctgggaggcg agcggcaccc acgccgtccg gagacgccca cctgtagcag 7560 tgcagggcgg tgagcatcat gtgggaggag tccagcgagt ggatgaagtt gggcgggaag 7620 ccgttcttct gcttacgtgt gttgggcttt ctgaggacgg aacaggtgcc ggtgggggcg 7680 gcccagggac acccctaact ggccgctgtc tccaccgtgg ctgctctcca gacccccggc 7740 caggccccag cccgggcccc ccactcaccg gctgatgtct ccgttgtggg tgtaggtgat 7800 gctctgaatt ccacctccta tttgctaaaa aggggaaggg gccggtgagt cccacccgag 7860 gcccagcacg gtggtggtac attgaggtgg tggtacactg gggtagtggc acgctaggat 7920 ggtggcacac tggcgcggga tggggtggca cactggggcg gtggtacact ggggtggtgg 7980 tacgctgggg cactggtaca ctgggacgct gttacactgg gatggtggca cactggggag 8040 ggatggggtg gtacactgac cttgaccttg gagtccaggc gatagggctg gatgacgggg 8100 acgcccaggg gtgtgaccca ctccaccaca gagcccatgt gggagatgag gcgggcactc 8160 tcggtcagcc agtgctgtgg gacacaggcc gtctcagggc agggggctca ggccggggat 8220 cccgtccact tgcttaggga gtcctggccg agcggggaca ggacaggacg tacctggatg 8280 gcccgggtcc ccgagaacat ctcctgtaga ctcttgaaga cctggcgtac gagatagtga 8340 gaggcctccc acacgaactc ctgcagaggg cgggcagcag gtgcaggtcc tcaggggctg 8400 gcccgttcac gccctactcc cccctatttc agagccactg aggcccaagg cctagggcct 8460 agcagggggg caggggaatg gggcctggcg cccacgcagt cagcaagaaa cgcccaagcc 8520 ctaacaggca gccagtggtc tgggggagca gccagggctc ctgctgggag gctgggtcgg 8580 gggcacaccc gtctgagttt taaatggcag tgaaaccaac gtgttcgcag cgcgacatgc 8640 ctggcgcacc tggggaaagt cgctcagctc ccggaggcgc ttctcaatct gcaggcgccc 8700 gccatagcgc gtgaccccgt acaccaccgt catcaccgtc tgcttcacca ccttgcgggt 8760 gatgaaacct tccagcacct gtgccacccg catgccccgc tgggcgtcct gcctacggaa 8820 cacctccacc tgcacggcgg gtgggccggg ggcgcgggtc agccccgcta gcagcccagg 8880 ggccaccaag cacccatgaa gcccccgccc cagccccacc acatcctcag gacaggccaa 8940 ggtgagggca cctggggccg agactcaggg ctcacattgc ccccacgccg agatgccccc 9000 gggcagcagg gcacacccta cctgcgcggc cacgccgctg tacacgccct gcggcacatc 9060 cgagggctcc aggttgacgg aggcggcgcc cacgctgtcg cggcccagag cagcataatg 9120 ctgcaggccg ttgcaagagc cgtcctgagg aaggggcggc aaacgggaga tggaagctag 9180 agaggcagag acgtgtggga ccccaaacca ccccccaggt cgagccgttc ctagggccgt 9240 gcacccccca gccaagtgca ccggagcccc cgcacgctcc cgggagagac caggagccat 9300 ggctcccgca cactctagga ccacctccag agaataccac gagcgaaggt gaaatctcac 9360 accctcaagt cgagccccag gcccagtgca cactgcacgg cctcgggggc cagacccagc 9420 tggctcacct gatggacggg gaggtgggag acataggcgg cagggtcgga ggcgcgcaca 9480 gcgttcgcca cctccataca gcaggccagc gtctgccagg gttcctccgc gcccatccac 9540 cactttcggc cctgcgggga cagcggatgg ggggcagtga ggcccgggcc cgatccctga 9600 gcccgctggg aggctgtgtt gcggggaggt gggaaatggg gaggagacgc acacccgtga 9660 tagtgaacac gggacgcatg tgggcgagag acggggcggt ggctggatga gttctccata 9720 gccacggatg gaggatggga gctgcgggtg gaccgggctg aaacaagcgt gtccggagct 9780 gccgggggag gagggtggac agaggacctg ggggcgccgg gggaggaagc agctcggcgg 9840 atgcagggga ggggggaacg tggggaacgc gggggccctg gggcagggga gaagggagaa 9900 gcaggacggg cagggggcgc gggggaggag agcgggcggg ggacgtgggg gcgccagggg 9960 agggggaggg gaggaggaag acgggcaggg ggcgccaggg gagggggagg ggaggaggaa 10020 gacgggcagg gggcgcgggg gcgccggggg agggcgcggg ggcgccgggg gagggcgcgg 10080 gggtgccggg agggcgggga atgcgggggc cccgccccta ccgtcaaggg ttggtccgcg 10140 gagtccagga tgtcatccat cacctcctcc gcaaaggcca ggcgcttccg cagcggctcc 10200 cgcttcttca accccgtgag attgaccagg tggatcttga gccaatccag gccgtgcggg 10260 ccgagcgggc ggccctgggc gaactccagc agggcccgcg ccacgtcgct gcccaggtgg 10320 ttgaagtgcg gcgggcaggg gtaggtgcgg ccgcggaagt ccatgttgtg cggcagccag 10380 aagacgcggt cccgcaggtg ctgcgccagc gagaggcggt acagcgcctc cgcccgcagg 10440 ctgtgcatct cccgggccac cttctggcag tgcgccagct cacggcgcag ctcggccttg 10500 cgggcgggcg cggcgctgtg cggcaggtgg gcctcgggcg gctggggcgc ctcggagggc 10560 ggggccggca cgcctagctg ggggcagccc ttggcctgga agagctgcag caccaggtcc 10620 agcacgcgcc cgttgacgcg ccaggcgcag ttgcccagtt gggtgagggc gtccagtgcg 10680 ccatgcagcg cggtgggcgg gcaggtttcc agcagctcct ggtgctgcgt ggcgccttcc 10740 accgtgcgca tcagcttggt ggggctgagc aggaaagcac cagagtgcgg cgatgtccag 10800 ggcagcgggg ggcaaagcat gggtacatcc accgcctcga aggtcagcgt gggctccgcg 10860 gccttctcca gcagctgcac gtaggccggg tgcggcttca ggatgccgat ctggggtgcg 10920 acaggcagac gggtcagggc cccggtgctg gggctttcct gttcccaccc cttaaacttg 10980 ggtgagaggg gccggctccc cggccaacaa gaaaccagtg tggcctccca cgaacagaag 11040 ccacctccag aaacggccgg acacctgcat ggacacccat ggtgtgtccc gagtcctggg 11100 aggtactgac ggctgcgctg agatcaaggc tccgcccaaa ggcgccaacc ccatggggtc 11160 cctggtcctc ccagcgggat gccccccagc tcaggagggc actgcctggc acctgctgga 11220 cgttgcggaa ggaatacacg tggtagagca cggggacaag ccgagaggaa cgatgcggct 11280 tgtccaggct gcatggcatc tgcgtagcct gcaccagcat ctccgccagc agcttgccca 11340 gctccatctg cactggcagg ggccagggct gctcccgcag ggcctcgggc gcccccagct 11400 cctcccagta ctgccgcggc aggcagggct cgggcacctg taggacaggg cggtcagggc 11460 gctgggcacc ggggcccctg agctagatgc cccaccgccc gtgcctgacg cccggtgggg 11520 catctgtcag cccaagcata cagatgaaca gactgaagct tgggtgcaaa cccggctgct 11580 ccagggaggg agagcgccca cccaccactg gccccagcca ggaggagagg gggtgcgagc 11640 ctcacctcgg cgtcggaggc cagcaagcag aggtacttcc tgtagtggtt ctgcagcgcc 11700 tgcacctggc cactgacccg ctgcctctgc accacgtgcc ggctgaaagt gcgcgcactc 11760 agctcccggg ccagggtggt gaaggactca ccttgggcgg gcagcgcctg caggacctgc 11820 ggaaggcagc cgtgagtgcc tgcccgcccc gcccggggac ccggccgcgc ggaggaagac 11880 gcacctgcag gagcatccgc accacctcgc gctcgtccag caggcacagg aaggggtaaa 11940 gtgagaaccg gccctcgtac acctcgcgct ctaggcggtt cttggtctcc cgcagcgccc 12000 ggcacagtgc tttctcccat tggtcccgca gggtcttcag ggtcttccgc tgcgggggat 12060 gaacgggccc ggtgagcccc gtggcagctg gtgggaccca ggctcacagg acgggggtca 12120 ccgcagctcc ctgcagagac ctcatggccc tcaaggtccc tgctgtgtgt tccgggtagc 12180 tcctcacccc ggcctgccct ctgccggctt cagcgtgcct gacgcagcca agagcaaaag 12240 cccagctgca gtgtgcgcag aagcacaggc caagacccaa cctcgggacc ccacaagttt 12300 tccctgagcg gcagccaggc tgagttccta ggccctgcat gaccagacca gggcatgagc 12360 aattcaaccg catacacgga gctcagcccc tgcggcggac acgcgacccc ggctcagccc 12420 ctgcggcgga cacgggaccc cggctcagcc cgtgcggtgg acacgcgacc ccggctcagc 12480 ccctgcggcg gacacgggac cccggctcag cccctaccgc gtgcttgacc tccttgcttg 12540 gcaacgtggg cttctccacg gacaccacgc acaccctgct ggccagctcc atgtggagct 12600 gcttctcaaa gaggcactgc agggtcttca agggcaggtg cagcttcggg taggacacac 12660 gcccatcctg cagggatggg ggtagtgagg ttgggggctt gccagagggc gacctgccct 12720 cccaggaccc cgagacagca tgggtgcacg cgtttctgcg tctcctgcaa gttgctggtg 12780 gctatcgctg acgcggggaa aggcgggctg cgggtaaagt cagtgccagc agtgcaaacc 12840 aaaggccttg accctcctgg cctcgacccc tctagaaggg acactgggca ccgtgcaggg 12900 ggtggcaggg gcggtgatgc tgggagctgg cagagcctgg ggagaccgtt cactgcaccc 12960 ccagatgttg gctgttttct cctcaaactc agaactgtat gaatgtgacc catccagaaa 13020 tagatgaatt aaaaataaca actaaagcct agcgctttga gaatcaaaga cgcacgtcca 13080 cataaaagct tgtacacaaa cgttcacagc tgcatgactc gcagtcgata agtagaaaca 13140 gcccaacgtc ccataaacgg acgaacagac gggcacggcg cggccatcca cgcaccggag 13200 catgactcag ccctgaccca ggtcgcctcc cggaggcacc atgaggacgt cacgctcagt 13260 gggagatgcc aaacacaaaa ggtctcgcag tgtgtggtcc catttctatg gaatgtccag 13320 agcagactca tccacagatg gggaggggat ggggagtgac ggggatgggg acgaggcttc 13380 cttttagggt gatggaacat tctagaatta gacaaccgtg actacactaa aatcgctgaa 13440 ttacaccttt aagagggttt tatggcaggt gaattacacc tcagtaacag acgagcccac 13500 tgcgtgcacc tggcagcccc actcaaacgc actgctctcc tgtcacccca ccctctctct 13560 gcggcccccg accacctcgt ccccctgagc ccacaccctc agggccaaga ccctcccagc 13620 tctgggtcct cccatcttct cagaggagga agggaggaat tcagggccca gcccaggtga 13680 gccctgggca ccggggaggc ccattggtct gagctgaggc tccaggaacc cccaaagggc 13740 agctataagg actgaagtct gccggggccc acgtgggctc accttggcat acacgtccct 13800 gagcagcttg gaggtgttga ccgggggcgg cagctgcggc gggaggctga aggtgggctt 13860 caccttgtgc acggccttca gaacagtggc ccgatcctcc tcagacagca gaacggcggt 13920 gaagagtgcc tgcagcttca gcccctcctg gctcatctgt tccagacacc tgtggtgcag 13980 gcggcctgct cgagggacgg gccagcccca cgctgggctt ccacagaccc caggggaacc 14040 tcgtgaccac ctcctgctag cctgcaggtc tcggtgtggc tgtcaggccc tctgggggtc 14100 cccagccccc agcccaggca ccgtcccaga tcttaaaacc ctgggaggga catggtgggg 14160 ggtgggggcc ctcccgacac cacctacctt tcgatggtcc cggcgtcctg gtcctgcctc 14220 cccatgcact ggagggcagc cgcataggac agcaggtccg gagtcaagcc ggcatccttc 14280 accatgaata acacatatac cagctccttg aaggcaccct gggagaccaa gccagggtga 14340 gggtctgggg ggatggccca acctccacat cctccctgct ccctggagac cccttctctg 14400 tagccaccag ctcagcaggg gacagggtca ccaggcagga gtggccagct gggcagaccg 14460 atgcatcccc ctgaggttct gacacacaag ctccacctgc agaggcagcc gcatggcccg 14520 ccaggtggga ctgtgggagg ttcacgttcc tctgggaggc agcttgttaa acctccagat 14580 ttgtcaattg tgtggatctt ttcaaaggac tgacttggct tgactgttct ctgctgtttc 14640 tgccttccat ttcatcgatt tgttttaatc tttgtaactt cctctcatct acttgcttta 14700 ggtttagtga cagcttcttc ttctagtttc ctaaggtgaa aggtgacgta tttggtctga 14760 gatgtttcac tttttttccc cccaagatgg agtcttgctc tgttgcccag gctggagtgc 14820 agtggcacaa tctcagctgg gccgggttct ctgcctccca ggttccagca cttctcctgc 14880 ctcagcctcc tgagtagctg ggattacagg cacacgccac cacaccagct aattttttgt 14940 attcttagca gatacggggt ttcaccatgc tggccaggct ggtctcgaac tcctgacatc 15000 gtgatccgcc agcctcagcc tcccaaagtg ctgggatgac aggtgtgcac caccgcgccc 15060 ggccatcacc tttccgaata taggcatttt gtgactataa attaccctgc gagcactgtg 15120 tcagctgcat cccaggactt ctgacaggtg gtgttttcat tttcattatc tccaagtgtt 15180 ttcgaacttc atagtttact tcttctttgg aaattttatt taattatttt tttagataga 15240 gtctcgctct gtcgcccagg ctggagtgca gtggcgcaat ctcagctcac tgtcaacctc 15300 cgcctcccgg gttcaaccga ttctcctgcc tcagcctcct gagtagctgg gactacaggc 15360 acatgccacc acacccagct aattattttg tatttttagt agagatgggg tttcgccctg 15420 ttggccaggc tggtctccaa ctcctgacct caggggatcc acccgcctcg gcctcccaaa 15480 gtgctgggat tacaggtgtg agccaccacg cccagccatg tatagcttaa atatcccctg 15540 caattttttt ttttttcatt taatttttgg ccaggcacag tggctcatgc ctgtaacccc 15600 agcactttgg gaggccaaga caggaggatc acaaggtcag gagtttaaga ccagcctggc 15660 caacatagtg aaaccccatc tccactaaaa atacaaaaaa aaaaaaaaaa aattagctgg 15720 gcgtggtggc tcatgcctgt gctccctcca ctaaaaatac aaaaaaaaaa aaaaattagc 15780 tgggcgtggt ggcacatgcc tgtaatctca gctactggga gcctggggca ggagaatcac 15840 ttgaacgcag aaagcggaaa ttgcggtaag ccgggatctc accactgcac tccagcctgg 15900 gagacagaaa ctttgctgtc gacagacttg gagactctgt cttaaaatat acacacacac 15960 acatatatat atatatataa aataacatat atatataatt tttttcttgt attcattttt 16020 cctgacatcc ctgttctgag caatttctcc tttgacccag tggctgctta agagtggcct 16080 gtaactgtaa cagactattc caaagggaaa aaaattccct tacatcctcc caccccatag 16140 tcctgcagct gaagacatgc tgtgacatga ggtggccaca caccagagac cagagacatg 16200 agttttgggg catttttttt tttttttttt tttgagacgg agtctcgctc tgtcgcccag 16260 gctggagtgc agtggctcga tctcggctca ctgcaagctc tgcctcccag gttcactcca 16320 tcctcctgcc tcagcctccc aagtagctgg gactgcaggc gcccgccacc acacccggct 16380 aattttttgt atatttttag tagagacggg gtttcactgt gttagccagg atggtctcat 16440 ctcctgacct cgtgatccgc ccgcctcagc ctcccaaagt gctgggatta caggcgtgag 16500 ccactgtgcc cggccggttt tggggcagtt tctaaacaac ctctgtatgg tagacctcac 16560 tggccacaca tagtccttaa attgaaatat tcagttcttc cctttcacca gcttcaagtg 16620 ttcagtagca cacacagctg ttggcagatg cggaaaattc ccaacatcat agaaagttct 16680 actggatggt gctggttaga atacgtggcc gggcgcggtc gctcacgcct gtaatcccag 16740 cacttaggga ggctgaggcg ggcggattac ctgaggtcag gagtttgaga ccagcccggc 16800 caacatggca aaagcccgtc tctactaaaa atacaaaaat tggccgggcg tggtggtgag 16860 tccctgtaat cccagccact caggaggctg cggcagggag aattattgaa cccaggaggc 16920 ggaggctgta gtgagccgag atcatggcac tgcaccctag cctgggcaac agacagagag 16980 tctatctcaa aaaaaaaaaa aaaaaaaaga tagaagcaat gccttagcct ggctaacatg 17040 ctgaaacccc acctctacta aaaataaaaa ttaaaacaat tatccggggg tggtggcaca 17100 cgcctgtaat cccagctgct cgggaggctg agctcgcagt ccagcgacat ccaggactgc 17160 tggccacccc ggaacgctgg gagaggcagg aggggcccct gctagagcct ctggagagac 17220 ttcgggtctg cagacatctt gattccagac ttctgggctc gtgctaagag tgcgtttctg 17280 ctgtgcaagc cgccaggttt gggacacttt cgtaggggcc gatcccaaaa gcgccctgtt 17340 acagtgtggg ctctctgccc agggaatcca gggggcttgt gaccttggag gggaaaatac 17400 acgaccctca tcctcagtcc tcccggagtc tggcgccccc tgcagcaagg aggaaccagg 17460 cagcacgccg cctccacctc gcggtaagag cactgcggac ttcaccgcaa gactggcccc 17520 acctgatcct gaatttcgct gtttgatgcg ttaataaaga agcacatcaa gttctctacc 17580 acgaattggt cttaatattg cgatatctgt attttaatat aatagtatcc catgtttacc 17640 caaatattaa gagaagcttt tactgttgtt tctcaaatta gggctgaagg atcatggggg 17700 gggagaaagc tgggaacgtt tgctgctttg aaagggtgtg taaacaacac cctccaaaac 17760 aaccaagagt tccgaggaga aactttggcc ggatacggtg gctcacgcct gtaatctcag 17820 ctcctcggga ggctcagggg ggcagatcac gaggtcagga gtttgagacc agcttggcca 17880 acacggtgaa acccccgtct ctactcaaaa tacaaaaatt aatcgggggt ggtggcgggc 17940 acctgtaact ccagctactt aggaggctga ggcaggataa tcacttgaac ctgggaggtg 18000 gaggtggcca tgagccgaga tcgcaccacc gcactccaac ctagtaacag ggagagtatg 18060 tcccagaaaa caaataaata aacaaacaaa aagaaaacgg caagggaaat tggaaaatac 18120 tccagatgaa ccacaacgaa gatgggtggg atacatctaa agctgtgctc agagggaatg 18180 cggcgccagt gaacacccac atttcacaca gaaggatctc agcacagcag cccgaccttc 18240 cacctcagga aaccagaaaa aggagcaaag tcaaccccaa caccaaagcc tcatcctgac 18300 gagggctctg caggctgccc cccgacgagg ccaaaagcac ccctgcccag acagattcac 18360 gagccccgag aaagaacgga aggaaatgct caaggcatta gcagaatttc tccctacttt 18420 tttggtcatt ttcaaaattt gagagtcaca cgtgatttgt atttgaaaag cctaaaagaa 18480 ttattaaaat aaaaaacaaa ggacttgaac ctgggggcta agagagaaaa gtccagtcta 18540 aatgagggca agttcctgtc tccaacgacc agggcaggtg gcccggctcc cggctgcact 18600 cacctgccgc gcccagccaa gcatcacggc gttgtacatg tccagcgtga gcagcttccg 18660 cttctgccgc tggccgtggt ggacgaccag caggtggtgg gcgaggggca gctggtcagt 18720 gagcaggcag cacttgaaga aggccaggag cctctgctgc tgacctgaga gctgggcctg 18780 cgagtgctgc cccgacgggg cctgctccac atcgaggctc agcttcccag gggcctcctg 18840 cagcagccgg gccagctgct cctcccaggg gctctcgggg gcctggcgcg tgcagtcctc 18900 caggcacccg gccatctgct tgctcaggag ccggggctcc acctgcaggc gcctggtcag 18960 cgccttgaac tccccgctct ggaatggcat ctgcagcttc gccttcaacc gctgcatacg 19020 catctgccgg gtccgcttat ccttctccag tatctttgcc cagcggccac agggcaccgg 19080 ggtggcatcc ttggccccca tctggacctt cctgggtggc tggaggctac catctccact 19140 gccacattct gggagccgcg ccacatccac cctgttcacc accacctccg acacgctctc 19200 agcctgcagc tgccgcaccc gcgcctggag cactgtgagg ggcagaaggc gaggacatga 19260 gagggacccc ctccccattc gagcacccgt ctctctggac cctgagccag gccaggaggt 19320 gcaggtggct gagctcgctg ggacccaagg cgtgaattcc tcatacttgc caacaacgtt 19380 gtaaggtctg cccgctgctt tccagacaca cgcaccccac cacctccgca cctccccacc 19440 cgagcctcac agaactcagc agccctaaca agctgccacc gaaacctgca gcaccacgtc 19500 tccccggtca ctggccgctc agaccctcca ggtgcacagg cccagaaccc ggggtctgtg 19560 acaactccct ccgtccacct ctcagtacct cctctgggct tgcctccaga atctatccag 19620 gtggcccccg cctcccctgc ccctctcact gtctagctca gggcctctgc acagactccc 19680 aggaccctga accgcccact ccctggctca accatggcct gcaagttcgc accccgcctc 19740 agcaagaccc ccccagctgg tggagctgcc acacacacac tcctaggctc ccagtgtcta 19800 caccggtgga cgctgagcca ctagctcgca gggaaaacgc ggctcctgct cgtgccgcct 19860 caggttgcat ttttgccaac caatcaatgc ctaagtgttc tgtatctctt taaagaagcc 19920 ttgttggaaa tctattgctg gccgggcatg gcggctcacg tcggtcatcc cagcactttg 19980 ggaggccgag gcaggaagat cacctaaggt caggagttcg agaccagcct ggccaacatg 20040 gtgaaacccc gtctctatta gaaatccaaa aaattagctg ggcgtggtgg catgtgtcta 20100 tagtaccagc tacttgggag gctgaggcag gagaattgct tgagcctggg aggcagaggt 20160 tgcagtgact caagatagcg ccattgaact ccagcctggg caacagaaca ataatccatc 20220 taaaaaaaaa agactgttga aataagccgg gtacagggcc gcgcacctgt ggtcccagct 20280 actccggtgg ctgaggtgaa agaatcacct aagcctagga gttcctggct gctgtgagcc 20340 gtgatcaggc caccgtgctg cagcctgaga gacagagcag gaccctgtct caaaaaaaaa 20400 aagggggggg gggacccagg tgtccagatg tggtggctca cgcctgtaat cccagcactt 20460 taggaggccg aggcaggcgg atcacgaggt caggagatca agaccatcct ggctaacacg 20520 gtgaaacccc gtccctacta aaaatacgaa aaattaaccg ggcgtggtgg tgcgcgcctg 20580 tagttccagc tactcgggag gttgaggcag gagaattgct tgaactcggg aggcggaggc 20640 tgcagtgagc caagatcgca ccattgcact ccagcctagc aacagattga gaatccgtct 20700 caagaaaaaa aaaattgctg aaataaaaag acaagcgtga tgtccgcctt cagagtgctc 20760 caaaactcag gagatacttt taggattaac agttgagagc tttgttttgt tttgttttgt 20820 ttttgagatg gaatttccct cgttgcccag gctagagtgc aatggcatga tctcggctca 20880 ccgcaacctc caccttccgg gttcaagcga ttctcctgtc tcagtctccc cgggttcaag 20940 cgattttcct gcctcagcct cctgagtagc tggcactgca ggcgttcacc accatgccca 21000 gctaattttt gtatttttag tagagacagt gtttcaccat gttggccagg ctggtcttga 21060 actcatgacc tcttgatccg cccgcctcgg cctcccaaag tgctgggatt acaggcgtga 21120 gccaccgcac caggcctcgg acccttgacc tcttgatccg cccaccttgg ccacccaaaa 21180 gtgctgggag tacaggcgtg agccaccgca ccaggcctcg aacccccgac ctcttgatcc 21240 gcccacctcg gccacccaaa agtgctggga ttacaggcgt gagccaccgc acctggccag 21300 gttttttccc tttataaagg ttctcccgcc tctcccttcc cggctgccta atggacgcag 21360 acaggatgtg ggacagaagc accggcggga agcaagcaca gggaagctcc cacctccctc 21420 ccacaccacc agccaggcca ggacgagggc ctgccaccgc tggagcctgg gctgtccctc 21480 ccaagtttcg cagtcatcca gtctccatta ggcgcctacc ccccagagcc aagccaggac 21540 agctgagtca gttcagggtt cacatcctgg ctctgcacat gtggccttgg cggcggggcc 21600 gggggggggg tctctccaga cataatcttg ggcctcacct atgtccctgg aaagtgggag 21660 cacctggtgg ggttctgggg agggggaatt acgagagctc caggaaggag cctgctcagc 21720 aaggacaggg cccatgagcg gtgcaagaga tgtttcagca acgccgtctg ggcgtgtcct 21780 gggacccgag aggtggagac cgccctcagc ctgtctcaga atctgagcct ttgccttttc 21840 tcccggcagc agggagcgga ctctcctctc ccgggccgcc gtgggggtcg cgctcaccct 21900 ccagcagctc cacgtggccc cagtccttcc tgcggtcttg gtcttgctcc tgggggctgg 21960 cggacgagct cctcctgggg ccgcagacgc caccggcggt ccctgcggga aagacgagag 22020 cggctgagcg gggccgggcg tgtgggcggg ggcctccata aaggcagaag ccgaagggtc 22080 gaagggcaaa ggagccctaa acgcagcgga aactctcgga gcacgggctt aagttggaaa 22140 gaaactaaga cagcgaaggt ggaagggccc cgccgcggcg aacacgggcg cggaaccgcc 22200 gagagagggt tcctcgcact cgaggtgcag caggtcaaag gttaagagcc ctaaacacca 22260 cacctggggt caggaggctg cataagaaac cacgagtcaa aggtcagact gcacggagga 22320 gcctcagtcg aaaagcgggc aagggcgagt ggaaagcggg gccgggtcgg tgggctgcgc 22380 acgcccaggt gcaaagaggc aaaggtcaaa gcgccaaagg ccccggccgc gcggggagga 22440 gcccacgccg tggcccccgg gctgcctggc cgtctccctt tgtgttacct tctttgccgg 22500 ggagtcccgg gcggccgcaa ggccgtaggg ctcgtttgag ccccgccgct ccgcggcccc 22560 agcaaagtgc cgacattacg cacgccgctc caggccaccc caccggcccg cgcctgcgca 22620 tgcgcccgcg ccgcctgccg ggagttgtgg tttcatggtc gacggaggct gcgaagggaa 22680 accccagccg gaagtagact cccaggatgc agcggaggcg cgaaggcatg cgccggtgga 22740 cgctctgatt ggttcctcct gctgttttta aagggagggg gcgggacaga gctgttgccg 22800 tggcaactgg gaggcactct caggctgttt tcccgaggac ctcaaatccg gacttttttt 22860 ctgtttttct ttcttttttg gttttgtttt ggacgcgttg tggcccaggc tggagtgcag 22920 tggcgtgatc atagctcagt gcagcttcga actgctgggg taaagagatc ctcgcccctc 22980 ggcttcccaa agcgctggga ttgcagacgc cgccaccgtg cccggctttt tttttttttt 23040 tttcaaggca tactcatcta ataacgagga cagcatctgc aatttagaga ttcctgtccg 23100 caaccttcat tgctccaacg acaacttttg ggtaagagtc attaggatgc cgtctatcat 23160 ggaggaagct gaggctcaga gagggccacc aagttgctgg aagacacagc acgtgcgacc 23220 tcagggaggc tgcaaggaga gaaagcccca gtccgcgaga ctcccagcct ccagcttcag 23280 tttaccctcc aatccccaag ccctcagggg caggagccga atggagcggc aggcttggat 23340 tcacctgcta agtggggtga ggtcaaggga atgaaataaa cctcggagcc tagagcctgc 23400 cctggtctcc gcgtgatcct gcctaggagg agcagggcgg gagctttaga atggaacctg 23460 gaaggtgtgc ccacctgtgt cgttcagccg gggcagcagg ccagaggcgg gagcgcctgc 23520 tgtggggcag taggcttggg aagggtgaga ataggaatat ctgggggtaa ctgtgttcca 23580 ggctaatatc ccagttgcaa aggggagctg gtttggtggc tcaggcctgt catcccagca 23640 ctttgggagg ctgaggcggg cggatcacct aaggtcagag ttcgagacca gcttggcaaa 23700 tacgcaagca tgcctggcaa catggcaaaa ccccgtctct agtaaaaata caaaaattat 23760 ccgggggtgg tggcgggcac ctgtaatccc agctactcgg gaggctgagg caggagaatc 23820 gcttgaaccc gggaggcgga ggttgcagtg agccaagatc tcgccactgc actccagcct 23880 gggtgacaga gcgagaacct gtctcaaaaa aaaaaaagtg caaagggagg tcagttcagt 23940 gcctcaggcc tgtaatccca gcactttggg aggctgcggc gggaggatcg cttgagccca 24000 ggagttccag acaagccttg ggcaaccgag atactgagac ccagtctcca ccaaaggaaa 24060 aaaagaaatt agccaggcat ggtggtgcac acctgtggtc ccagatactc gggaggctga 24120 ggcaggagga ctgcttgagc ccaggaggtt tagactgcag tgagctgaga tggcgccact 24180 gtactccagc ctgggttgac agaacaggac cctgtctcaa aacaaaacaa gtgcaaaggc 24240 cctgaggcag gaacaagcgt ggacagagga gcaatttgag cagagtgggg ctggggagag 24300 ggagcaaaga tgtagctggg gctcagttag ggggcctgac cacacggggg ctcgggggcc 24360 tcagctcaag ctatcctcca tccccaaacc ctggcacttc agtttcccca tcagcccaga 24420 acgaggactc gacctcactc tggaagggcc tggcagcctc cttacagcac attccagacg 24480 ctgctgccga cgcctgcgtg agcgcactga tgccaccggc tgggaatgct ttcgacagac 24540 ggcagcaccc tccctcacct gcctcagtcc acctcagggt gccccagcgg gctgtgacct 24600 cagacctcac ccactactgg ggtcacctgc ctggccctga atcagccagg cctggtgtgc 24660 caagacctac agacaccccc tgcacccctg caggctggca gagccagaaa cttgggtgga 24720 aaccgacttc tgaactattt caccattcct tatgcgttag tcttttcttt tatttgatga 24780 gatcccagca ctttgggagg ccgaggcggg cggatcacgt gaggtcagga gtttgagacc 24840 agcctggcca acatggtgaa accccgtctc tactaaaaat acgaaaatta gccgggcatg 24900 gtggcctgtg cctgtaatcc cagctactca ggaggccaag ggaggaaaat cacttgaacc 24960 tgagaggtgg aggttacagt gagccaagat cgcaccactg cactccagcc ttgggcaatg 25020 tagccaaacc ccatcactac aaataataca aaaaaatttt gttggctgtg atggtgcctg 25080 cctgtggccc catctacttg ggaggctgag gtgggaagat gtagaattgc ttgagccagg 25140 aggcagaggc tgcagtgagc tgtgattgag ccactgcact ccagcctggg cgacagagcg 25200 agaccctgtc tcaaaaaaaa aagaacataa tctgggtttt ggaataagac agcagtttct 25260 gaaacagctc attgcccaaa ttccagcctc gcaactctgt agccgccacc accccccagc 25320 cccaccattt attttaacta catctgtctc caccactcct gtattaagta aatgcaatat 25380 tggctggtca tggtggctca tgcctgtaat tccagcactt tgggaggctg aggcaggcag 25440 atcccctgag gtcaggagtt cgagactggc ctggccaacg tggtgaaacc ctgtctccac 25500 taaaaattca aaaattagcc ggacgtggta gtgggtggtg cctgtaatcc cagctacttg 25560 ggaggctgag gtaagagaaa tgcttgaatc caagagactg aggttgcagt gagctgagat 25620 ctcgccgctg cactccagcc tgaacgacag agcgagactc cgtctcaaaa ataaattaat 25680 aaatacaaca ttaattattt ttcttgctta agttttacga agagacttaa tatcaccatc 25740 aaaagtggga aaccatatat ctggccgggc gtggtggctc ccgcctgtca tcccagcact 25800 acgggaggcc gaggcgggcg gatcccctga ggccgggagc tggagaccag cctggctaac 25860 atggtgaaac cctcatctcc aataaaaata acaaaaatta gccgggcatg gtgggtgcct 25920 gtaatcccag ctattcagga ggctgaggca gaagaatcac ttgaacccgg gaggcggagg 25980 ttgcagggag ccgagatcac accactgccc tccggcctgg gcgacagagc gagactctgt 26040 ctaaaaacaa aacaaaacaa aacccaacca agcaaacccc acagagtcga gaatcgctag 26100 atggaagggg atggcccagg tccctggagc ccctgtgaca aattaccaca aactcggtgc 26160 cttaaagcaa cgttcatttt cttacatttc tggaaatgaa aagtccaaaa tcaggactgc 26220 ggggctgaag tcaaggtgtg tggaggcctc gctccctcca gaggccctgg ggctccttcc 26280 tgcctctccc agcttttgaa ggctccaggt gtgcttggcc tgcggccaca tcactcccgt 26340 ctcggtctct gtggtcgcac tgcagcctcc tcgtctgcct gtgtgaaatc tcctcctgtc 26400 tccgtattgt gaccgcgttt aggatgcccc aggacaatct tctccatatc gttcagatct 26460 tcatggtgtc aatatattga gactcttttt ccaaataagg caaatgtcac attctaggga 26520 tcagggtggg gacttacctt tgggccaacc acagaggcta caaagaggaa gacaccactc 26580 aatacaaagc gtgcgccagc ccagccctga tcggtgtttg ttgttgttgt ttttgtttga 26640 gacagagtct cgctctgtcg cccaggctgg agggcagtgg catgatctca gctcattgca 26700 acctccgcct cctgggttgt atagattctc ctgcctcagc ctcctgagta gctgggatta 26760 caggcgtgaa aaggagcaag gctctgcccc agccacagcg cggatgcacc ttgaggatgt 26820 catgctcagt gaaagacgcc agacacagaa ggacacacag tgtgtgatcc cctttatatg 26880 aaatgtccac aacaggccca tccacagagg caggaagggg atgtgtgggt gccgggggct 26940 ggcagagggg atgagtgaca gctgatgggg cttcttcttg cggtgatgga atcttctgga 27000 actagacagt cgtggtggtt gcacaactct acgaggtact aaaatcactg aactggctgg 27060 gtgcagtggc tcatgcctgt aatcccagca ctttgggagg cagaagcagg tagatcacga 27120 ggtcaggagt ttgagaccag cctggccaac atggtaaaac tctgtctcta ctaaaaatac 27180 aaaaattagc tgggtgtggt ggcaggtgcc tgtaatccca gctactcagg aggctgaggc 27240 aggagaatcg cttgaaccag ggaggcagag tttgcagtga gccgagatcg caccactgca 27300 ctccagtctg ggtgacagag ccagactccg tctcaaagaa ataataataa aataaaatca 27360 ctgaactgta cagtgtaagt gggtgaattg tgtggtatat gagtgatgtt tccgaggtgt 27420 cattaaagaa actcagacgc ctggggtggg gccagtctca ccgctgtggg tcccatcccc 27480 atcatttctc acaaggccct cagatcaccc ttccgcggtg gggggcggac actctaagaa 27540 gggaagacct gggctcctgc tggcgagaag gcggtggaca tttcttcagt gtctggtgcc 27600 gcgccctctg cccagcgtgc tccgtggagg gtctcattgt cttcctccag acgtctcttt 27660 actggcccat tttacagagg cggaaccgaa gcttggggtg ttggccacag ggctctagtg 27720 tgggaagcca ggccaggctg gacctcagcc atggggaccc ctgtccctga gactgtggca 27780 cctgccacac cctctgtgtg acccgcctaa gccaggaaga gagggtcagg agatgcctga 27840 gccaccaaga aggcatccca gcgtccagcc agaccggtta tccctccaga gggctccccg 27900 gcaggacagg ctggtcgcca tgtcttcagc ctggtgctat ttaaaggtgg gtgccacctg 27960 gggctgtggc cgcagggcca ggactgggct gctgggagct gtgtccccac agcggaggtc 28020 gccgcccctc tcaggcctcg gtttccccag ttgtcaatgc ctccacttgg ctgtgagtct 28080 gtgagggtca ctgtgctcac cttttggggc ccagcgcatg gggcaggcag aggaagggtg 28140 ggggccagcc gccttgctgg gtggttcccc gtggggcctg gggtatggct ctaagggagg 28200 agcaagtgtg ggtgcgaatg gggccgcccc attcctgccg cctccgacgt gccccgccag 28260 ccggccaccg acaggtctac gtggctatcc tccctcctgc ccacctacct gcccaaacac 28320 acgtccccag tcgtcacctg cccacccacc cgcgcattcc cacacccttg tgggcctggc 28380 tttcgggaaa ctacaatttg cggggagaga agtcccacga gggcatgccc cggagcctgg 28440 ctggtcccac ggctgacgca cgcggcagga cctcccgtgt ccatctctgt ccccaagcat 28500 ctccgcctct gcccctctct gtctctgtgt ctctctcgtc tctcccggtc atcttccttg 28560 tgtctcttga ctgccgccgt ctttctgtct ctgtctccct ccgggtctct gtctccctcc 28620 aggtctctgc ggcccgcgtc tcacactccc gcccccgcaa cccgaggtcc tagcccgccc 28680 ggggactcgg ctgactcacg gacacgcccc gcgagacaaa caacaaacgc gcggaggccg 28740 agcgcggagt cccgcacggc cgcgcccctg tgcacctggc ccccgccccc gagacgtccc 28800 attggccggc gccctagcct ggtcccgccc aagtggaccc cgcccccgcc ccgaggcacc 28860 ccattggccg gcgtccccgc cccagcgaac ccggccccgc ccccgaggcg ccccattggc 28920 cccgccgcgc gaaggcagag ccgcggacgc ccgggagcga cgagcgcgca gcgaaccggg 28980 tgccgggtca tgcgccgccg cctgtggctg ggcctggcct ggctgctgct ggcgcgggcg 29040 ccggacgccg cgggaacccc gagcgcgtcg cggggaccgc gcagctaccc gcacctggag 29100 ggcgacgtgc gctggcggcg cctcttctcc tccactcact tcttcctgcg cgtggatccc 29160 ggcggccgcg tgcagggcac ccgctggcgc cacggccagg acagtgagtg cggggcggcg 29220 ggggcctggg gtggggaggc ggcgggtgac ggcaacgcgg ccgccgtctt cacggtgacc 29280 tgcgcccgcg ggggagtccc ggaggctcct ctgtgcagcc tcggcctcag tttccgtggt 29340 ctgtgagatg ggtgcagcct gcctggtggg agggttgcac tgttaaagcg aaggctgcag 29400 cggcggaccc ggctcagggg cagagaagcg tccgtgtggt acaaccctgt gggtggggcc 29460 acccatctgc aggtgggaaa ctgaggctcc agaggggctg gggcaggccc agctgcatgg 29520 cggaagcggc ggggggctga cctccggact cctgacatca cagaatccag tcagggctgc 29580 ctgagtcggg gccccctctg cttcttccca gacaccccat ctggcaggtg aggacaagga 29640 ggcacacaga agggatggga cctgcccagg gtcacactga caggggtggc ggagctgggt 29700 ccccacaggg cccaggacgt cacggagcgg gcgtctctgt ccccagggtc tgccgagcac 29760 actgaggtag gccctcagtg tttgtggaat gtcaggagca agaggagagg ctgggcacag 29820 caggggatgt gggtacctgg aggccagggg agtcggtgtc cccgccgggc ggggggcact 29880 gggaaggggg cccgggcccg ctggctgccg cctgaatcac caccatcagg gcaggtaatc 29940 accccctgtc cttcccaccg ctttcatctg ggcgccaagg ccctcattag gccgcacgtg 30000 acgagggcgg acaggggact ggctgggccg gtccatccat ggcgggcatg gccaggcggg 30060 gtggcctcgg gccggggcag aggcctggct ccgctgcctg acctggaaca gtctctgcct 30120 ctctccaagc ctcggtttcc ccagctggac ggtgatgggg gtgagggcta gctgagggct 30180 ctcctgccct tcgtgcattc gctggtcact aatcgggcac cttgtgggtg ctgtgctccg 30240 catgggggac ccagtggtga cagagacgcc caccctcctg gggctcccag agcagaggcg 30300 cgcagcagtt agacacgtga acaagggcgc aggtgggtgc acagaacagt gaacggttgg 30360 ccgggtgcag tggctcacgt cggtaatccc agcactttgg gaggccgagg cgggcagatc 30420 acgaggtcag gagatcgaga ccatcccggc taacacggtg aaaccccgtc tctaccaaaa 30480 atacaaaaat tagccgggtg tggtggcggg cgcctgtagt cccagctact cgggaggctg 30540 aggcaggaga atgacgtgaa gccgggaggt ggagcttgca gtgagctgag atcgcgccac 30600 tgccctccac cctgggcgac agagcgagac tccgtctcaa aaaaaaaaaa aaaaaaagaa 30660 cagtgaatga cgtgaacaag ggtgcaggtg ggtgcgcaga acagtgaacg gcggtgttgg 30720 gaggcacctt gccaggggag gggaggtgca gggcgaggaa ggggccaggg gagatcgtga 30780 cacagacgcc ccagaacaac cacctcaaag acgttcctgt gtgtcctgga aggtcgggct 30840 gggaggctgc cccgaggagc tttcactttg acagggagct ggccgggcac gcagggaact 30900 gtacacccag ctgacaaagc ggcagacacc caggccgggg tgagcgagtg tgggtgagga 30960 gtggcggctg gccccagggt ccttgctgga caagacactt cagctcaggg tggggcaggg 31020 ctcacccagg gctacccaca gacgatggcg tccaaatctg gctctgccac tcccaggcct 31080 caactggccc ctctgcaacg tgggctgctg agcgggcttg gtaggacagc tggcatacag 31140 tcggcgctca agcatgtctg tggtgtccca taaaccaccg gtgtcccact ctaggccact 31200 gccagcccgg cctccagtcc agagtcccag tccggagtcc cagtgactgt gcgtgggccg 31260 ggcagctgag ctgtgagggc cgggctgggg gctccatatg gggtggtgtg agctgtgagg 31320 gccgggctgg gggctccata tggggtggtg tgagctgtga gggccgggct gggggctcca 31380 tatggggtgg tgtgagctgt gagggccggg ctgggggctc catatggggt ggtgtgagct 31440 gtgagggccg ggctgggggg tccctggggt ggtgtgagct gtgagggccg ggctgggggg 31500 tctctggggt ggtgtgagct gtgagggccg ggctgggggc tccatatggg gtggtgtgag 31560 ctgtgagggc cgggctgggg gctccatatg gggtggtgtg agctgtgagg gccgggctgg 31620 ggggtccctg gggtggtgtg agctgtgagg gccgggctgg gggctccctg gggtggtgtg 31680 agctctgagg gccgggctgg ggggtctctg gggtggtgtg agctgtgagg gccgggctgg 31740 gggctccata tggggtggtg tgagctctga gggccgggct gggggctccc tggggtgctg 31800 ctggtcgctg gctcattgac agttatcagt ggtctgggtg ggccctgccc cttctgactc 31860 ccacatccca ggaacccttt cccaaccttc ctcgtggtgt tgctgccccc ctgacgtccg 31920 tccctctggg tgtgtgggag cccccccgcc atacacacac acagatgctg ctcttgggct 31980 gagctgcagg gacagcgctg acctggccct cccacggggt cctcatcgat ctctgcactc 32040 ccccagctcg tgggggccgt cctgcttccc gttccctctg cctgctcctt gctcctccct 32100 cacatgctgg ggggggctcc tggtgtcagt cacggctctg ggggatcctg agtgtccgtc 32160 gtggtcggga ggggactcgt ggtcccgggg gtctcctggt atctgtcgtg gtcctgaggg 32220 ccctgcacga agcacagcgg acagcagcgg tgctgggggt gagccagcaa ggccctcccc 32280 gacccccgcc tcccccaggc atcctggaga tccgctctgt acacgtgggc gtcgtggtca 32340 tcaaagcagt gtcctcaggc ttctacgtgg ccatgaaccg ccggggccgc ctctacgggt 32400 cggtgagtgc cgggcagggc tgggcggcgc gggcagggtg gggagggtgg gccggcctca 32460 cccccgcccg cagcgactct acaccgtgga ctgcaggttc cgggagcgca tcgaagagaa 32520 cggccacaac acctacgcct cacagcgctg gcgccgccgc ggccagccca tgttcctggc 32580 gccggacagg aggggggggc cccggccagg cggccggacg cggcggtacc acctgtccgc 32640 ccacttcctg cccgtcctgg tctcctgagg ccctgagagg ccggcggctc cccaaggtgc 32700 ctgggctggt ggcgaggggc ccggccacgc ttgttcttcc ccctgcgggc tctgtaagcg 32760 ctgagtgccc accgtgtgcg ggcgctgtgg acacagccca ggagccctcc aggggggtcc 32820 cagcctgagg gggtggtggc caccaagcag gttcaatcct gagttgggga cctcgaggac 32880 ccaacagggc gcctctcggg ctgaaggacg cagacgtcga aaggtcgagg gggacgtccc 32940 aggcagggcc cggcagaggc aggggctcgg ggtggggagc acgttgggag tgggggcagg 33000 agcggagggg aggggagggg gccggggaga cggtgacaga cgccgcagaa caccagcctc 33060 gaagccggtc ccgtcccggg aatctgcaaa tacaacgcct tgcgaggaca aaggcacctg 33120 caggtgggac ggagatggag gagcatccag ggtggggggt ccagggcccc agtgtcctca 33180 cagggtcctc acgacaggag gcgggacagt gagagccaga gagagatggg gatgggccgc 33240 gctgtggccg tgaaggggag gaagggccct aagctgaggg acgtgggtgc ctccagatgc 33300 tggggaaggc gggaacggtt ccgcactgga gcccccggga gggaccggcc tgctcctgcc 33360 ttgatatgag cccagtggga cccagtttgg actctggcct ccagaaccgc cagaaaataa 33420 acgtagtaag ccatcaactt tgtggtcttt tgttacagca gacgtcggaa atatgcacac 33480 ggtgtctgaa actgttctca tgacaaaata agcctcagat cccccgggga agggcggagg 33540 ccaacgcctc ggtgttcctc cgatcccccg ggaagggcgg aggccgacgc ctcggtgttc 33600 ctcggatccc ccgggaaggg cagaggccga cgcctcggtg ctcctcagat cccccgggaa 33660 gggcagaggc tgagggcagg agccgtgctg ggtgcagggc aggcctgggg gcttcatgcc 33720 gctgtcctgc gggacgcaga gagggctggc cgtcggtgtg ggggcgcccc cacctgtgcc 33780 cagcgccctc ctgacatcct gactccgctg ggacttctgc ctacagccct gggagtcaaa 33840 ctccagcctc tcagagaaaa ggtcagagcc aagagcccca cagcctggag ccaggcagtg 33900 acaccctggg cctgtctccc cttctgtgtg tggggcgaca gcagcatcgc cctggtgaag 33960 tccccgggga cggccagggc tccatcccca gccgccgcct tccacataaa tacaggaaga 34020 ctgggccgag gcacttgctg ggaggtgctg agcagcctga cacggaaaac ccttctggga 34080 agggagggtc gtgcccggcc cgagagcttc tgctcaccct gcagacagaa gcgagcccca 34140 ccccagggga caccaggcgg cctctgggga catctttggc tggcatggag tgggtggagg 34200 acagggctgc acccaggatg tccccaggtt ggcagtgtga ggggagatcg gcccacgttg 34260 gccagtcgga gggcgtcgcc acttgagttg tcactgggag ctgcacaggt caccacagct 34320 gaaataaaac ttgctggcac cccacgcagg aacgtaacat gtgcctcgaa gaaacgggtc 34380 agcaggccgg gcgcgggggc tcacgcctgt catcccagca ctttgggagg ccgaggcggg 34440 tggatcacga ggtcaggaga tcaaggccat cttggtcaac atggtgaaac cccgtgtcta 34500 ctaaaaatac aaaaaattag ccgggcgtgg tggcgggcgc ctgtaattcc agctacttga 34560 gaggctgagg cggggaatcg cttgaatccg ggaggcggag gttgcagtga gctgagatcg 34620 cgccactgca ctccagcctg ggcgacagag cgagactccg tctcaaaaaa aaaaaaaaaa 34680 aagaaacagg tcagcagttg tttctttgtt tctaaaacag agcgtggaat gggcgtacag 34740 ctccgcacat cccagggcag tgaaatcccg gttcacacag agccctcagc agcttattcg 34800 caagcccaaa cctggggacc cccgttgtcc tcaggcagtg aggtgggggc cccccaacag 34860 agaggagcgg cctgggggca cagaaccagc ggctccccag gaaatcgcca gcagtgaaaa 34920 taagacaacc ccaaactgtt gcaaactgtg cttccgctta cgaagcactc ctgagcggca 34980 gggcggatgg ggagagggcg gctgcaggcg cgaggggccc ggggacgcag gggtgcgggc 35040 cttaccaggg ccctgtcctg tcgtgcagca ggctcctggg gcagggaaga caccaggggc 35100 ggccacttct tactgctgtc tgacctcgag caatgcggcc tcacagcccc caccagggtg 35160 ccggtgtcct ctgggcccag cgcccccgag gctcatgcct gggtggggcg aaccaatcgg 35220 tcctgctcct ctggccactc cacgcgaggg aagtcccagc ctcacaggca ggcgcacacc 35280 ccggcagcat ctctgacaaa ggccctccag ttccgagtct ccaggtcccg ccgctgcaag 35340 cctcacctgc ccagccctcc tctccagctc caactccaac tcccaagaac caccacggac 35400 acacagaacc cgagccttgt ctccctcaac gcctcctgac tcaaaactcc atcttccaac 35460 aggaaaacgg ctcggccggg ggactgtgac ccggagcagg cggcccagcc tgtcgcgcag 35520 actcggggcc taaaacactt gttctctcag tccggagatc aaggacgatc cgaggtaacc 35580 tccctacctc ggtgtcctcc atgcaacctc gtcttagggc accgggtacg ttacctcgtg 35640 aggagccgag tccgcgggtc ctggggttga gatgtggacg ccctcagggc tggcactctg 35700 ccctggcggc cacagtcatg gaagtcccaa cgcttctctc ggctccgcaa ccccagaggg 35760 cggccacgag gagggcccgc cacgcacgac cccagagggc ggccaccagg agggcccgcc 35820 acgcgcgacc ccagagggcg gccaccagga gggcccgcca cggcgttgcg gcagcagccc 35880 agaaggtgcc ctgcgcacgg tccggacagg tgggatccga gttacctggc caagggggct 35940 gacgcagaca cgtcgcggga cacagtgaag agtgtggtgc agagcggagg gcgggagtct 36000 ttggagaaca ggtaggggcg tggggcacgc gcctcccacg cgcaggagcc gtctaccgtg 36060 gagggacacg ggtggtcctg ctggaggctc ctctccgtta gctgtctcca tcgtctgatt 36120 cttggatccc aggatggtgg gatcatcagc aactgagatg aacccactgc cccggccccc 36180 tgagcccgca ggtccccacg ccttgccagc tgtgcccgag ctggctgcac cccgggccag 36240 gcatccagca accttgagca gtggggtccg gcttttcaga aggggccagg aacccgcgtg 36300 gctgaggtgt gaccgaagcg tggggcagag gcgctgggcc ctggcgcttt aacgctggtg 36360 tttctggttt taaatttcac gacccagtga cactgccacc ctgctacctc gccagcagcc 36420 ctcctgggct taacttcggg agagcagttt tgctagccgg ccctgggtgc caagccctgc 36480 aggaggcgca gacccctgga gacaggaccg gactctgcag agcccgacca gcctcccagc 36540 ttggcctttt cctgacgcac gggcgcagaa ggaaagccac agcaccggct tctctttgta 36600 agtagtgtat tttaaatagc tttcaagata cacatatttt ttcctttaaa aaagtctgtt 36660 ggagcagttt tgttcttgaa ttttgctggt catcctcatg gtcccgagcc cccctactcc 36720 gggtcgtgga ggcggccgag ggggaggctg ggggcccacg tggcccgtcc tggcggcacc 36780 tgcagcactg ggggagccgc tgaaccccgt gcttcagcgc tgggggagcc gctgggcccc 36840 gtcttccgcc acaaaccatg catggccgcc acgtgagctc aaacgtccgt ttatttcaaa 36900 gcagtaataa tttaaaatta taaaaatctt tccaccgctg aacgtttaga gggtgaggtt 36960 agacagagga cggggaggct ggggacgccc cagaggggac catgtggccc acgccttccc 37020 aagccagggg gccggtgggc cgggcccggg tcctgccctg gaacaggcgg gacctgcagc 37080 gctgaccagc caagcgtggc gccgccgggg cacccagtct gtgggtgccg tgtggcgctg 37140 gctgagggtg ggtgggaaag gccccgtgct ttcccgacgg ccgacgtggg ctcacgagtt 37200 gcttgtggcg ttctcgttgc tgggcgagct ggaggaggac gatgacgacg aggaggagaa 37260 gctcacccca gtgaggccag gggggttcgt ggccgtgttc tgtcccgtga ggctttttcg 37320 gcagacgggg cagctgtcgt gctttgtggg gacagaggca gggacgggag aaggggcagg 37380 ttagaggcgg gagggccgcg gtcggggtgg gggggcgggt gggcggggca ctcacctgct 37440 ccagccaggg cacgatgcag ccgtcgtgga acaggtggtt gcagggcagc tgccgcacac 37500 gctcacccag cgcgtagtcg tccttgcaca cagggcactc gagcccggag cctgcgggag 37560 tgtgcagctg cggtcacagc gggcgtgggg ggcctgccga gccttcaagg gcaggctact 37620 ccacagcctc agccggaggc cgcccctgag cccagcgagg ggagaaaagc cgtgtgtgtg 37680 tcccccgggc tgccagaggg gacctggaca gaaccctctc ctcccagccc accttcaggg 37740 aaatgctcga ggccgggtgc ggtggctcac gcctgtcatc ccagcacttt gggaggccga 37800 ggcaggagga tcacctgagg tcaggagttc gagacctgcc tgaccaacat ggtgaaaccc 37860 tgtctctact gaaaatacaa gtatgagcca ggcgtggcgg cgggtgcctg taattcccac 37920 tactcgggag gctgagctct catacctacg tgctcctcag tgacggggac ggtggggagg 37980 gcctggattt tctctttatc tgccggtggg gggcctgtgt tttcaaactg attgaggagc 38040 tgaaagacaa gaggcgagag tgccgggagc tcctcggggg cccggcccgg ggctctgaaa 38100 cgcgaggctg caggacctgc aaaagcaccg aggccgcgtt tgtcctgggc cctgggcccc 38160 ttggagcccg cccggggtcg gagatc                                      38186 <210>39 <211>720 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>39 cgccggcgct tgacctgact ttcatgaatc gaaaaggaaa tcctctatga acgcactgca 60 tcgcatcggc gccggaacgc tactggccgt gttgctcgct tttggcctga ccggctgcgg 120 ggagaaggag gaggttcagc agtcgctcga gccggtggct tttcacgact ctgacgagtg 180 tcacgtgtgc ggcatgatca tcactgactt ccccggcccc aagggccagg cggtcgaaaa 240 gcggggagtg aagaaatttt gttccaccgc cgaaatgctt ggttggtggc tgcagccgga 300 aaaccgtctg ctcgatgcca agctctacgt ccacgacatg gggcgcagcg tttgggaaaa 360 gccggatgac ggtcatctga tcgacgcaac cagcgcctac tatgtggtcg gtacgtcact 420 caaaggcgcc atgggcgcgt cgcttgcaag ctttgccgag gagcaggacg ccaaggcgct 480 tgccggcatg cacggcggtc gtgtgctgcg cttcgaggaa atcgatcagg cgctgctgca 540 ggaggctgca agcatgcagc acggcggcat gcacgaccat gcgccaaacg gtgcacataa 600 cgcacacgca ggccactgag cagcagtggt ctgaacagca cacacaagaa atcgaggtaa 660 gcacaatgat gggtatcagc gtctggcaac tcctgatcat tcttctgatc gtcgtcatgc 720 <210>40 <211>127 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(9) <223>可能是任何核酸 <220> <221>不确定 <222>(101) <223>可能是任何核酸 <220> <221>不确定 <222>(119) <223>可能是任何核酸 <400>40 gcggccgcnc ggcgctggct gctgtgcgga ggccacggcg ggccgcgagc cgcctcgtcc 60 tcgccctcct gccctgggtg cggccccccg ggtcccggcg ncccactcgc cccggcgtnc 120 ccgcgct                                                           127 <210>41 <211>6858 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>41 actcgccaag tgatcgaccg gcccctgagg gccgcgacgc agagggcgcc ccgtgcactg 60 gcacaggcgg ccttgtgcgt tagactctga tattcgtgcg ccctctcgtt ggcaggacca 120 tccatcctgt gtgccggggg ccgcgcacac cgatcccgga tccgcctcgg ccctgccctg 180 cgcgcccctc cgttctcgac ctccccgacg ctgtctgaac acgcgtcgcc gggggacgac 240 ggcgggcggc ccgcctcggg ggaggggtaa gcgtcccggg atgcccgttc aaccgttccg 300 caaggctcgc ccatcgtggg ggagaaccgg cgcgacgcta ggagagacaa gtgatccagc 360 aggagtcgcg gctcaaggtc gccgacaaca ccggtgcgaa ggaaatcctg accatccgtg 420 tgctcggcgg ttccggacgc cgctacgcag gcatcggcga caccatcgtc gccaccgtga 480 aggacgccat ccccggcggc aacgtcaaga aggcgcacgt cgtcaaggcc gtggtggtcc 540 gcacccgcaa gcagtcccgc cgtcccgacg gctcgtacat caagttcgac gagaacgcgg 600 cggtcatcct gaagaccgac ggcgagcccc gtggcacgcg catcttcggc cccgtgggtc 660 gcgagctgcg tgacaagaag ttcatgaaga tcgtgtcgct cgccccggag gtgatctgac 720 ctcatggcca agatcaagaa ggacgacctc gtgcaggtca tcagtggcaa ggacaagggc 780 aagcagggca aggtcctgcg cgtgttcccg acggatgagc gcgtgctcgt cgagggcgtg 840 aaccgcgtga ccaagcacct gcgcgccggc caggacaaca acggttccac cgagggcggc 900 ctgcaggtcg tcgaggcccc gatccacatc tcgaacgtgg ccgtggtgga cccggagacc 960 aagaagccga cccgtgtggg ctaccgcttc gagaccgtcg agaaggacgg cgtgacgaag 1020 accgtgaagg tccgcttcgc caaggcctcg gggaaggagc tgtgatgacc gaggtgcagc 1080 agaccgagaa ggtcaccccg cgtctgaaga ccaagtaccg cgaggagatc cgcggacgcc 1140 tgcaggagca gttccagtac gggaacgtca tgcaggtgcc gggcctcgtg aaggtcgtcg 1200 tcaacatggg cgtcggcgag gccgccaagg actccaagat catcgacgac gccgtcaccg 1260 acctcaccgc catcaccggc cagaagccga tgatcaccaa ggcccgcaag tccatcgcgc 1320 agttcaagct gcgtgagggc atgcccatcg gcacgcacgc caccctccgt ggcgatcgca 1380 tgtgggagtt cctggaccgc ctggtcacgc tgccgctgcc gcgcatccgt gacttccgcg 1440 gcctgtccga ccgccagttc gacggcaacg gcaactacac cttcggcctg tccgagcaga 1500 ccgtgttcca cgagatcgat caggacaaga tcgaccgcgt gcgcggcatg gacatcaccg 1560 tggtgacgac cgccaagaac gacgacgagg gccgcgcgct gctcaaggcg ctgggcttcc 1620 cgttcaagac cgaccagtaa gacctccacg ccacaggtcc tccaccggtg aaccggtggc 1680 ggaaaccacg gcgagaaagg gcgtgaagca catgaccatg accgatcccg tcgcagacat 1740 gctgacccgt ctgcgcaacg caaactcggc ctaccacgac accgtgtcca tgccgtcctc 1800 gaagctgaag actcgcgtcg ccgagatcct caaggccgag ggctacatcc aggactggcg 1860 cgaggaggag gccgaggtcg gcaagaagct gaccatcgac ctgaagttcg gcccgcagcg 1920 tgagcgtgcg atcgccggcc tgcgccgcat ctccaagccg ggcctgcgcg tgtacgcgaa 1980 gtccacgaac ctgccccacg tgctgggcgg cctcggcatc gccatcctgt ccacctcctc 2040 tggtctcctc acgaaccagc aggccgccaa gaaggctggc gtgggcggag aagtcctcgc 2100 ctacgtctgg tgacgggcaa gacggaagaa aggctgaact gacatgtctc gaatcggacg 2160 tctcccgatc accatccccg ccggcgtcga tgtgaccatc gacggcgacc gcgtctccgt 2220 gaagggcccc aagggcccca agggtcagct cgagcactcg ctgcccacgc ccatcacggc 2280 caccctcgag gaggggcagg tcaccgtggc ccgccccgac gacgagcgtg agtcccgctc 2340 cctgcacggt ctgacccgta ccctcatcag caacatggtc gagggcgtga ccaacggctt 2400 ctccaagcag ctcgaggtcg tcggcaccgg ctaccgcgtg caggccaagg gccaggacct 2460 cgagttcgac ctgggctact cccaccccgt cccggtgaag gtgtcccagg gcatcacctt 2520 cacggtggag ggtaacaggg tcaccgtcgc cggtatcgac aagcagcagc aggtcggcga 2580 gaccgccgcc aacatccgca agctgcgccg ccccgacccg tacaagggca agggcgtcta 2640 cgcgggcgag cagatccgcc gcaaggccgg aaagaagtga tgtctactct gaaggtgaag 2700 ggcaagggca agttcaacgc ccgcacccgc cgccacctcc gggtgcgcaa gcggatctcc 2760 ggcaccacgt ccgtcccccg cctcgtcgtc aaccgctctg cacggcacat gttcgtgcag 2820 gtcgtggacg acacgcagag ccgcacgatc gcgtacgcct ccaccatgga ggccgacgtg 2880 cgtgcgctcg agggtgacaa gacggccaag gccaagcgcg tgggcgagct cgtcgccgag 2940 cgtgccaagg cggccggcat cgaggccgcg gtcttcgacc gggcgggcaa caagtaccac 3000 gggcgcgtcg cggccgtggc cgacggtgcg cgagagggtg ggctgcagct gtgaccgaga 3060 acatcaacca gaaggacact caggtgaccg agagcaccga gaccaccgcc tccgagaccg 3120 ggtcgggctc gcgagccaga ccaccgagcg cgccaccggt ggccgcggcg gtcgcgacgg 3180 cggccgcggt ggccggacgg cgatcgtcgt ggcggccgtc ggacgaccga accgtcgtgg 3240 cgcccaggac gacgaggaag gaccagttcc tcgagcgcgt cgtgggcatc aaccgcgtct 3300 ccaaggtcgg ccgccgcttc tccttcaccg ccctcgtggt ggtgggtgac ggcgacggca 3360 ccgtcggcgt cggctacggc aaggcgaagg aggtccccgc tgcgatccag aaggccgtgg 3420 aggaggccaa gaagtccttc ttccgcgtcc cccgcgtcgg ctccaccatc ccgcacctgg 3480 tgcagggtga ggacgccgcc ggcgtcgtgc tgctccgccc ggcctccccg ggtaccgcgg 3540 tgatcgccgg cggtccggtg cgcgccgtgc tcgagtgcgc cggcatccac gacgtgctct 3600 ccaagtccat gggctccgtg aacgcgatca acatcgtgcg cggcacggtg gagggcctca 3660 agaagctgaa gagcccccag gccgtcgccg cccgccgcgg caaggccctg gacgagatcg 3720 ccccccatgc gatgctgcgc accatggaga acgatcgcgc ccagaagagc gcgaaggcag 3780 gtgcgtgacg cgtgtttgag tccactcgca agaacatcca gccctcggac gccaccctgg 3840 tcatcaccca gacccgcggc gtcacgggct ccaagcagaa ccatcgggac accctgcgct 3900 cgctgggcct gaagcggatc ggccaccagg tcacccgcaa ggccgacgcg gtgacggtcg 3960 gcatggtcaa caccgtgccg cacctggtgt ccgtggaggaggtcaacaat ggctgacaac 4020 gacgccatca aggtccacga cctgcgtccg gcccccggtg ccaagaccgc caagacccgc 4080 gtgggtcgcg gtgaggcgtc gaagggcaag accgccggtc gcggcaccaa gggcaccaag 4140 gcccgttacc aggtccgtgc gggcttcgag ggcggtcagc tgcccctgca gatgcgtctg 4200 ccgaagctcc gcggcttcaa gaacccgttc cgcacggagt accaggtcgt gaacctggac 4260 aagctctccg cgcacttccc cgagggcggt gaggtcaccg tggacgcgct cgtctccaag 4320 ggcctcgtcc gtcgtggcca gcccgtgaag gtgctgggca cgggggagat caccgcggcc 4380 gtgcaggtga aggcgaacgc cttctctgcg tccgccgtgg agaagatcca ggccgccggc 4440 gggtccaccg agaccctctg acacgccgac ccatcgaccg agggccctgg ccggagcagc 4500 cgctcgggcc aggccctggt ccgtccgtgt agactcgcac agccgccccg gtgtggccgc 4560 cgtctcgtgc ccccgccccg cggaacggcg cacgccccac aggaccagcc gcaggaggac 4620 tcgtgctcaa ggccatcgcc cggatcgtcc ggacgcctga cctgttgcgg aagatcgcct 4680 tcacgctcgg gctcatcgcc gtctatcgga tgggcgactt cgtgccggcc accggcgtgg 4740 actacccggc ggtgcagcag tgcctggcag cgggcaacgc ccagggcggc ctgtactcct 4800 tcgtgaacat gttctcgggc ggggcgctcc tgcaggtgtc tgtcttcgcg ctgggcatca 4860 tgccgtacat cacggcgtcg atcatcgtgc agctgctgcg cgtggtgatc ccgcgcttcg 4920 agcagctcca ccaggagcgc cgcaggggcc aggcgacgct gacgcagtac acccgctacc 4980 tgaccctcgc cctcgccctg ctgcaggcga ccacgatggc ctcgctggcc cgcaccgggg 5040 ccctgctcgg atgcagcctg ccgctgctgc gcgacggctc catcctcacg gtgctgctcg 5100 tggtcatcgc cctgaccacc ggctgtctca tcgtcatgtg gttcggggag cggatcaccg 5160 agaacggcgt gggcaacggc atgtccctgc tcatcttcac ctccatcgcg gcaggcttcc 5220 cggccggtct cggccaggtg gtccagacgc agggctggcg cgtgttcgcg atcgtcatgg 5280 ggatcggcct gctcaccatg ctggccatcg tcttcgtgga ggagtcgcag cgccggatcc 5340 cggtccagta cgccaagcgg cagatcggct cacggaccgt gggcgggccg agcacctaca 5400 tcccggtcaa ggtgaacatg gccaacgtca tcccggtcat cttcgccccc tccgtgctga 5460 tgctcccggg catcctcatc cagttcaaca cgccgcagga cggcagtgcg ccggccccgt 5520 ggatcacgtg gctgagccgg tacttcggct ccggtgacca cccggtgtac atggccctgt 5580 acttcctgct catcatcggc ttcacgtact tctacgtgtc catcacgttc aacccggtgg 5640 agatctcgga caacatgaag cgctacggcg gcttcatccc ggcgtccgcg ccggccggcc 5700 ccaccgagcg ttacctgcag tacgtcatca gccgcatcac gttcgtggtg ggggccctct 5760 acctcggtat cgtggccatg atcccgctga tcgccttcgc ggtgatcggc accagccaga 5820 acttcccgct cggcggcacg tccatcctca tcatggtggg cgtcggcctc cagaccgtga 5880 agcaggtcag cgcacagatg gagcagcgcc actacgaggg cctgctgcgc tgagccccga 5940 cccgatcccg caacgccgtc cgtatcgaca gtgaggaaca cacgatgacc cgcatgctgc 6000 tcatgggccc tcccggttcc ggcaagggca cccaggccac ccggatcgcc gacaagctgg 6060 ggatcgtccc gatctccacc ggtgacatct tccgccacaa cgtgaagtcg atgacgccgc 6120 tcggcgtcga ggccaagagg tacatcgaca acggcgactt cgtccccgat gaggtcacga 6180 accgcatggt cgccgaccgc atcgcccagg ccgacgcgga gcacggcttc ctgctggacg 6240 gctacccgcg cacgaagggc caggtcgagg cgctggacgc catgctcgcc gaggccggcc 6300 agtcgctgtc cgccgtcgtc gagctggagg tgcccgacga ggagctcgtg gagcgcctgc 6360 tcaagcgtgc cgagatcgag ggccgcgcgg acgacaccca ggaggtcatc gagcaccgcc 6420 tggacctgta ccaccgcgag accgagtccg tcatccagga gtacgtggag cgcggcatcg 6480 tcgcccgcgt ggacggcacc ggccagatcg acgacgtcac cgagcgcctg ctgcaggccg 6540 tgtactccgt gcgctccgcc acgggctccc tgcccgtgat ccagccgggc gcggagtcct 6600 gaccccgtga tcggccgccg ctcgctcgag ctcaagaccg ccccccagct gctggccatg 6660 cagcgcgcgg gggtggtcct gtccgaggca ctggacgccg cgctggccgg cgcgccgggc 6720 ttcaccaccg cggagctgga cgccgtgttc gcggtggtgc tggccgaacg cggtgcgacc 6780 tccaacttcc tgggctacta cgacttcccg gcctcgatct gcacctcggt caacgaggag 6840 gtcgtgcacg gcatcccc                                               6858 <210>42 <211>578 <212>DNA <213>人 <220> <221>不确定 <222>(5) <223>可能是任何核酸 <220> <221>不确定 <222>(23) <223>可能是任何核酸 <220> <221>不确定 <222>(31) <223>可能是任何核酸 <220> <221>不确定 <222>(48) <223>可能是任何核酸 <220> <221>不确定 <222>(211) <223>可能是任何核酸 <220> <221>不确定 <222>(292) <223>可能是任何核酸 <220> <221>不确定 <222>(308) <223>可能是任何核酸 <220> <221>不确定 <222>(350) <223>可能是任何核酸 <220> <221>不确定 <222>(384) <223>可能是任何核酸 <220> <221>不确定 <222>(477) <223>可能是任何核酸 <220> <221>不确定 <222>(507) <223>可能是任何核酸 <220> <221>不确定 <222>(529) <223>可能是任何核酸 <220> <221>不确定 <222>(54g) <223>可能是任何核酸 <220> <221>不确定 <222>(551) <223>可能是任何核酸 <220> <221>不确定 <222>(558) <223>可能是任何核酸 <400>42 ttctngtcta tggcagagat ggncaggttg ncgttgagca ggtactgncc atcagccgtc 60 ttcagcgcca ggtagttccc atcgttctgc acacccgggt ggctccgctg cttcacgtca 120 atattagtgg caccagctgg gatggtgaca atgtcattgt agccataatt ggtgggggtg 180 agggacccgg agaccttcct gcaggagttg nctttgcccc cacacacccc gcatttgtcc 240 agcttccgag gcgagtccac cacatggtca cagccggcct tgacacactg gncacggaca 300 cagatggnca gtgtttctgg cccacacagg gtgccatcaa tcaccttggn ctcgaacact 360 ttggaactcg ctcctccccc gggntcggga ggaacaactt gcaggggtcc cgggggggac 420 aacccagcat tcttggggga cccactgcag gaggattccc cgtccatgtc aagtgtnatt 480 ggtgggcatt attcttctca caattgntgc tccctgaagg ttttcccgnc aaggggggat 540 tcccccccng ntggaatnat tggtacttgg gtctccga                         578 <210>43 <211>305 <212>DNA <213>人 <220> <221>不确定 <222>(128) <223>可能是任何核酸 <220> <221>不确定 <222>(146) <223>可能是任何核酸 <400>43 catttaagtt tgctagtcct ttgcaaacag actgacgctg agtgtcctgt ctgagtcaat 60 aagtgcactt ttacctttta acctatgccc tctacttgaa cccgagcaag gtccagtcca 120 ctggacangt tgatgatagg gtctgncgcc ccataccctc tcctcttccc ccttaggaat 180 ttgtgcagta ctggaggggt tgcggcaatg ggaggcctgg gtgggccgtg ctgccttgat 240 atggccaagg gacccagtca ccacagtgga gacccttgtc tgcacctcag taccgcatgt 300 ccagg                                                             305 <210>44 <211>333 <212>DNA <213>人 <220> <221>不确定 <222>(82) <223>可能是任何核酸 <220> <221>不确定 <222>(255) <223>可能是任何核酸 <220> <221>不确定 <222>(275) <223>可能是任何核酸 <220> <221>不确定 <222>(299) <223>可能是任何核酸 <220> <221>不确定 <222>(313) <223>可能是任何核酸 <220> <221>不确定 <222>(324) <223>可能是任何核酸 <400>44 ggcacaggtg actttagcat gcagagcagc aaagagagag caaccaccaa catcatccag 60 ccgctgctcc acgcacagtg gntgctgggg gactggtctg agtgctctag cactgcgggg 120 ccggctggca gaggcgaact gtagagtgca gggacccctc cggtgcaggc ctctgccacc 180 tgcaacaagg ctctggaaac ccgaggatgc caagccctgg cagaaccagc tgtgccccct 240 gtgatttcag ggggncaggg gccattttgt gctcngggac atgcggtaat ggaggttgnc 300 agacaaggtc ttncattgtg gtgnatgggt tcc                              333 <210>45 <211>102 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>45 <220> <221>不确定 <222>(64) <223>可能是任何核酸 <220> <221>不确定 <222>(69) <223>可能是任何核酸 <220> <221>不确定 <222>(71) <223>可能是任何核酸 <220> <221>不确定 <222>(72) <223>可能是任何核酸 <400>45 gcagcagcag cgcagcgcag agagagcagc agcagcagca gcagcagcag cagagcagat  60 cntnctggna nnaaaaaatc gcggcagcag ctgctctagc ag                     102 <210>46 <211>123 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(9) <223>可能是任何核酸 <220> <221>不确定 <222>(51) <223>可能是任何核酸 <220> <221>不确定 <222>(52) <223>可能是任何核酸 <220> <221>不确定 <222>(57) <223>可能是任何核酸 <220> <221>不确定 <222>(67) <223>可能是任何核酸 <220> <221>不确定 <222>(123) <223>可能是任何核酸 <400>46 caggcaagnc ggcacgtagg agcagcagca gcagcagcag cagcagtaac nnagtcnacg  60 agggggngcc cgggacccaa ggcgcccgaa cagagaggcg gagcacaatc cactggtcgg 120 cgn                                                               123 <210>47 <211>109 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(87) <223>可能是任何核酸 <220> <221>不确定 <222>(95) <223>可能是任何核酸 <220> <221>不确定 <222>(102) <223>可能是任何核酸 <220> <221>不确定 <222>(106) <223>可能是任何核酸 <220> <221>不确定 <222>(107) <223>可能是任何核酸 <400>47 ggcacgcagg agcagcagca gcagcagcag cagcagcagc agagagagag cagcagagag  60 agagagcagc agagcagagc agagcanagt agagnagagc anagcnnac              109 <210>48 <211>293 <212>DNA <213>人 <220> <221>不确定 <222>(86) <223>可能是任何核酸 <220> <221>不确定 <222>(166) <223>可能是任何核酸 <220> <221>不确定 <222>(185) <223>可能是任何核酸 <220> <221>不确定 <222>(209) <223>可能是任何核酸 <220> <221>不确定 <222>(214) <223>可能是任何核酸 <220> <221>不确定 <222>(219) <223>可能是任何核酸 <220> <221>不确定 <222>(234) <223>可能是任何核酸 <220> <221>不确定 <222>(290) <223>可能是任何核酸 <400>48 ggcacgaggg ggaaactgct ccgcgcgcgc cggggaggag gaaccgcccg gtcctttagg 60 gtccgggccc ggccgggcat ggattnaatg cctgagcccg ggtcccgctg tcttctgctt 120 cttcccttgc tgctgctgct gctgctgctg ctgccggccc cggagntggg cccgagccag 180 gccgnagctg aggagaacga cttgggttng cctncccana aaatgggaag gganttgggg 240 ttaatcgaag tcattgggac cattttaaaa ggggcttcct ggattatagn ctt    293 <210>49 <211>506 <212>DNA <213>人 <220> <221>不确定 <222>(283) <223>可能是任何核酸 <220> <221>不确定 <222>(342) <223>可能是任何核酸 <220> <221>不确定 <222>(356) <223>可能是任何核酸 <220> <221>不确定 <222>(362) <223>可能是任何核酸 <220> <221>不确定 <222>(364) <223>可能是任何核酸 <220> <221>不确定 <222>(368) <223>可能是任何核酸 <220> <221>不确定 <222>(429) <223>可能是任何核酸 <220> <221>不确定 <222>(454) <223>可能是任何核酸 <220> <221>不确定 <222>(461) <223>可能是任何核酸 <400>49 aattcggcac gagcacccgg ccactgcagt cttctgccct gctggacagc agcagcagca 60 gcagcagcag cagcagcagc agcagcaaca gtaacagcag cagttcgtcc ggacccaacc 120 cttctacctc ctttgagccc atcaaggcag accccacagg tgttttggaa ctccccaaag 180 agctgtcaga aatctttgat cccacacgag agtgcatgag ctcggagctg ctggaggagt 240 tgatgtcctc agaagtgttt gcccctctgc tttcgtcttt ctncaccccc gggagaccac 300 gattatatct acaacctgga cgagagtgaa ggtgtttgtg anctcttttg atgtgnctgt 360 tntnaacntt tgactgacag ggacatgcct tttttggttg ggacccagat tttttgactt 420 gggggtttnc ttgggacttt tcaaccgacc ctanagagtt nagagcaaan aggttggttt 480 ttcggcttcc ttaacgaaag ttttgg                                      506 <210>50 <211>419 <212>DNA <213>人 <220> <221>不确定 <222>(137) <223>可能是任何核酸 <220> <221>不确定 <222>(221) <223>可能是任何核酸 <220> <221>不确定 <222>(259) <223>可能是任何核酸 <220> <221>不确定 <222>(327) <223>可能是任何核酸 <220> <221>不确定 <222>(385) <223>可能是任何核酸 <220> <221>不确定 <222>(389) <223>可能是任何核酸 <220> <221>不确定 <222>(416) <223>可能是任何核酸 <220> <221>不确定 <222>(418) <223>可能是任何核酸 <400>50 tttaagcacc aaaacttgtg ttttaatgat gttggatgga aatctttcct aaatgtgtca 60 tgcatgctct tgtctccctt aatggagaga gtgtgacact gcttagcact tggatggctt 120 ggggtggtgg ttatgancag cagtctgtca cagctcagcg aggtgaagcc tgtgggcgtt 180 ttgctctgtg ctgaatggct cagtggccct acaaagcgga ntcagctctt ggtggctttc 240 tgttgtggtg ggctgctgnt gctgctgctg ctgctgctgc tgctgccctt gcctctaaaa 300 gaactcactt cctcttcctc ctgctgncac ctgtcttttg gcttgtggga ttggagtcat 360 ggggcccaga tggagccttg ctccntgant tatgataggc ccctcggcct cttttntnc  419 <210>51 <211>495 <212>DNA <213>酿酒酵母 <220> <221>不确定 <222>(177) <223>可能是任何核酸 <220> <221>不确定 <222>(322) <223>可能是任何核酸 <220> <221>不确定 <222>(328) <223>可能是任何核酸 <220> <221>不确定 <222>(342) <223>可能是任何核酸 <220> <221>不确定 <222>(368) <223>可能是任何核酸 <220> <221>不确定 <222>(371) <223>可能是任何核酸 <220> <221>不确定 <222>(375) <223>可能是任何核酸 <220> <221>不确定 <222>(380) <223>可能是任何核酸 <220> <221>不确定 <222>(386) <223>可能是任何核酸 <220> <221>不确定 <222>(396) <223>可能是任何核酸 <220> <221>不确定 <222>(404) <223>可能是任何核酸 <220> <221>不确定 <222>(423) <223>可能是任何核酸 <220> <221>不确定 <222>(426) <223>可能是任何核酸 <220> <221>不确定 <222>(436) <223>可能是任何核酸 <220> <221>不确定 <222>(443) <223>可能是任何核酸 <220> <221>不确定 <222>(456) <223>可能是任何核酸 <220> <221>不确定 <222>(460) <223>可能是任何核酸 <220> <221>不确定 <222>(467) <223>可能是任何核酸 <220> <221>不确定 <222>(468) <223>可能是任何核酸 <220> <221>不确定 <222>(471) <223>可能是任何核酸 <220> <221>不确定 <222>(474) <223>可能是任何核酸 <400>51 aattcggcac gagcaaagtt ctgcgctcca ttgtgggcat caaacgacac gtcaaagccc 60 tccatctggg ggacacagtg gactctgatc agttcaagcg ggaggaggat ttctactaca 120 cagaggtgca gctgaaggag gaatctgctg ctgctgctgc tgctgctgcc gcagacnccc 180 agtccctggg actcccacct ccgagccagc tcccaccccc agcatgactg gcctgcctct 240 gtctgctctt ccaccacctc ttgcacaaag cccagtcctc cggcccagaa catcctgggc 300 ccggagttcc ttccttgcct tnaggggntt ttcagcaagt tnagttcctt gggtcctttt 360 tgggaaantt naggnagttn aaggantacc aggttnttgc catnctttcc agatccaagt 420 ttnacnaaaa attttnaaca gtntaaattg ggtttnttgn ccctttnngg nggntgtttt 480 ttttttcggg tccgg                                                  495 <210>52 <211>81 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(65) <223>可能是任何核酸 <220> <221>不确定 <222>(67) <223>可能是任何核酸 <220> <221>不确定 <222>(71) <223>可能是任何核酸 <220> <221>不确定 <222>(75) <223>可能是任何核酸 <400>52 ggcacgcagg  agcagagcag  cagcagcaga  gagagcagca  gcagcagcag  cagcagcaga  60 gagananata natanatata t                                                 81 <210>53 <211>305 <212>DNA <213>人 <220> <221>不确定 <222>(11) <223>可能是任何核酸 <220> <221>不确定 <222>(62) <223>可能是任何核酸 <220> <221>不确定 <222>(81) <223>可能是任何核酸 <220> <221>不确定 <222>(256) <223>可能是任何核酸 <220> <221>不确定 <222>(289) <223>可能是任何核酸 <400>53 aggcacttga nttgaaaatg gaaaacccta ctgctggtgg tgctgcggtg atgaggccta 60 tnatgcagcc ccagggtttt nttaatgctc aaatggtcgc ccaacgcagc agagagctgc 120 taagtcatca cttccgacaa cagagggtgg ctataatgat gcagcagcag cagcagcagc 180 aacagcagca gcagcagcag cagcagcagc aacagcaaca gcaacagcaa cagcagcaac 240 agcagcaaac ccaggncttc agcccacctc ctaatgtgac tgcttcccnc agcatggatg 300 ggctt                                                             305 <210>54 <211>307 <212>DNA <213>丙型肝炎病毒 <220> <221>不确定 <222>(212) <223>可能是任何核酸 <400>54 tggggtgtga agctccggtg ctggtgcggc gggggactgc ggggccagcc tcagtttaaa 60 ccccctcagc agtctttctg tcgttgccct ccacactgcg agactctgga gggcgatctg 120 gaggtctgga agataaccga ttcctgggag atttgggggt agtctccaat ctgtccctgg 180 ctcatcttgt gacccgaagc cggcggcctt gncaggagta ttctagaatg agtgcacata 240 aaaatacctt caaacggtag cagcagcagc agcagcagca gcagcaagca gcagcagcag 300 cagcagc                                                           307 <210>55 <211>88 <212>DNA <213>未知 <220> <221>不确定 <222>(6) <223>可能是任何核酸 <220> <221>不确定 <222>(7) <223>可能是任何核酸 <220> <221>不确定 <222>(78) <223>可能是任何核酸 <220> <221>不确定 <222>(83) <223>可能是任何核酸 <220> <221>不确定 <222>(87) <223>可能是任何核酸 <220> <223>未知生物描述:未知 <400>55 ggacanngac tactctctct ctctctctct ctctctctgc tgctgctgct gtgctgctgc 60 tgctgctgct gctgccgntg tgngcana                                    88 <210>56 <211>346 <212>DNA <213>未知 <220> <221>不确定 <222>(278) <223>可能是任何核酸 <220> <221>不确定 <222>(288) <223>可能是任何核酸 <220> <221>不确定 <222>(299) <223>可能是任何核酸 <220> <221>不确定 <222>(313) <223>可能是任何核酸 <220> <221>不确定 <222>(342) <223>可能是任何核酸 <220> <223>未知生物描述:未知 <400>56 ggcacagccc aactggtgat gctgctgctg ctgctgctgc tgccgccgcc gcctctattg 60 ctgatactct agtggggctg gaagggtggt tcctattcgc accatcgcca accagagaca 120 gagggaaaaa aaaaaccggc agccactgct gaatgttggg ttcggaggct gcatccgact 180 cggtcacaag gaaaatggat tcagtttgca tctctccctc ctttaaacag cttctccggg 240 tctcagcatg ggcttccagg gcagcgattg aggagacntt accaaggngc accacacant 300 agatgctgag acntcgtgac tccaggataa gaaacattaa cngggg                346 <210>57 <211>496 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(11) <223>可能是任何核酸 <220> <221>不确定 <222>(78) <223>可能是任何核酸 <220> <221>不确定 <222>(195) <223>可能是任何核酸 <220> <221>不确定 <222>(197) <223>可能是任何核酸 <220> <221>不确定 <222>(286) <223>可能是任何核酸 <220> <221>不确定 <222>(291) <223>可能是任何核酸 <220> <221>不确定 <222>(293) <223>可能是任何核酸 <220> <221>不确定 <222>(315) <223>可能是任何核酸 <220> <221>不确定 <222>(328) <223>可能是任何核酸 <220> <221>不确定 <222>(329) <223>可能是任何核酸 <220> <221>不确定 <222>(344) <223>可能是任何核酸 <220> <221>不确定 <222>(346) <223>可能是任何核酸 <220> <221>不确定 <222>(352) <223>可能是任何核酸 <220> <221>不确定 <222>(354) <223>可能是任何核酸 <220> <221>不确定 <222>(358) <223>可能是任何核酸 <220> <221>不确定 <222>(366) <223>可能是任何核酸 <220> <221>不确定 <222>(399) <223>可能是任何核酸 <220> <221>不确定 <222>(406) <223>可能是任何核酸 <220> <221>不确定 <222>(410) <223>可能是任何核酸 <220> <221>不确定 <222>(418) <223>可能是任何核酸 <220> <221>不确定 <222>(420) <223>可能是任何核酸 <220> <221>不确定 <222>(435) <223>可能是任何核酸 <220> <221>不确定 <222>(443) <223>可能是任何核酸 <220> <221>不确定 <222>(453) <223>可能是任何核酸 <220> <221>不确定 <222>(454) <223>可能是任何核酸 <220> <221>不确定 <222>(459) <223>可能是任何核酸 <220> <221>不确定 <222>(471) <223>可能是任何核酸 <220> <221>不确定 <222>(473) <223>可能是任何核酸 <220> <221>不确定 <222>(474) <223>可能是任何核酸 <220> <221>不确定 <222>(481) <223>可能是任何核酸 <400>57 gaattcggca naggtgcaca gatgtggtgg atggggaggg ccgcacggga cagaagttct 60 ccctgtgtat tctgacgnct gagaaaggag catttcatcc gggcggagac caaggagatc 120 gtcaatgggt ggctggagat gctcatggtc tatccccgga ccaacaagca gaatcagaag 180 aagaaacgga aagtngnagc cccccacacc acaggagcct gggactgcca agttgggctg 240 ttaccagcag cagcagcagc agcagcagca gcagcagcat ccccantgct ntnggaaagt 300 tcccaccacc aagtnccaca atttgggnna aaaccaaggt tgtngnagac gngntttngg 360 gatttnggca ttgtgggttg cttgcatgga aggacattng gttgtnggtn ccttggangn 420 tacaattacc atttncggtt gtnaaggtta aanntccgnc attcagaagg ntnnaaggtg 480 ntttgaagtc catttg                                                 496 <210>58 <211>268 <212>DNA <213>果蝇 <220> <221>不确定 <222>(16) <223>可能是任何核酸 <220> <221>不确定 <222>(51) <223>可能是任何核酸 <220> <221>不确定 <222>(60) <223>可能是任何核酸 <220> <221>不确定 <222>(202) <223>可能是任何核酸 <400>58 aacacttatc cttganagct ctgtttggga agcaggacaa agctacatgt naggaaactn 60 tggagcctcc gcagactctc caccagcagc agcagcagca gcagcagcag caagagaagc 120 ttccaattag gcagggggtt gtacgctccc tgtcctatga ggaacccaga agacactcac 180 cccccattga gaagcagctc tntccagcca ttcagaaact catggtcagg agcgcagacc 240 tccacccatt gtcagagctg cctgaaaa                                    268 <210>59 <211>471 <212>DNA <213>人 <220> <221>不确定 <222>(249) <223>可能是任何核酸 <220> <221>不确定 <222>(386) <223>可能是任何核酸 <220> <221>不确定 <222>(449) <223>可能是任何核酸 <400>59 tcgacccacg cgtccgctga ggaacagacg ttccctggcg gccctggcgc cttcaaaccc 60 agacatgctg ctgctgctgc tgctgctgcc cctgctctgg gggacaaagg ggatggaggg 120 agacagacaa tatggggatg gttacttgct gcaagtgcag gagctggtga cggtgcagga 180 gggcctgtgt gtccatgtgc cctgctcctt ctcctacccc caggatggct ggactgactc 240 tgacccagnt catggctact ggttccgggc aggagacaga ccataccaag acgctccagt 300 ggccacaaac aacccagaca gagaagtgca ggcagagacc cagggccgat tccaactcct 360 tggggacatt tggagcaacg actgcnccct gagcatcaga gacgccagga agagggataa 420 ggggtcatat ttctttcggc tagagagang aagcatgaaa tggagttaca a          471 <210>60 <211>379 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(2) <223>可能是任何核酸 <220> <221>不确定 <222>(14) <223>可能是任何核酸 <220> <221>不确定 <222>(31) <223>可能是任何核酸 <220> <221>不确定 <222>(135) <223>可能是任何核酸 <220> <221>不确定 <222>(315) <223>可能是任何核酸 <220> <221>不确定 <222>(332) <223>可能是任何核酸 <220> <221>不确定 <222>(349) <223>可能是任何核酸 <220> <221>不确定 <222>(357) <223>可能是任何核酸 <220> <221>不确定 <222>(374) <223>可能是任何核酸 <400>60 anttcggcan aggnaaggga gagggtgacc ngcatcccaa ctagatttca gtggagtgaa 60 gttcaggagg catggagctg acaaccatga ggcctcggca gccaccgcca ccaccgccgc 120 cgccaccacc gtagncagca gcagcagcag cagcagcagc aagagttaac tctgacttag 180 ggaatagaga cagccagaga gaaatgtgat caatgaagga gacatctgga gtgtgcgtgc 240 ttcttcagag gggacgggtg atgggcagat ttggaaaaag caccgcagat tgggaacctt 300 atcttttctt tttcntaaaa ttgttgttat gnaaatttgg gtttttccng taacttntta 360 aaaacttaaa agtnggttt                                              379 <210>61 <211>255 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(121) <223>可能是任何核酸 <220> <221>不确定 <222>(183) <223>可能是任何核酸 <220> <221>不确定 <222>(254) <223>可能是任何核酸 <220> <221>不确定 <222>(255) <223>可能是任何核酸 <400>61 aattccgaca atggaaagca ctcttagcct tgcagtggtc tacattttta aggaaccaat 60 atttcagcat tctttattac ccggcacgct gtgtcctttg tcagagttca agtttatggt 120 nactgccagg gtcagacagt ccatttgctg ctgctgctgc tgctgctgct ttctcgaact 180 ggnatggcat tagggaagct gctgtctgag tgttagggaa tgtcttggct aagtaaagcc 240 aatgttcttt cctnn                                                  255 <210>62 <211>5289 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>62 cgagctctcc cagccgcagc ctccgaatcc acggcctcca ccccgcgcct ctccagcgct 60 ctatcccgtc gctgcgccct tgtcgccggc cccggccgct gcatccgcgt ccgcacaggc 120 tccttgctgg gcacaaatag ctccaccatg gggctggcct ggggactcgg tgtcctgctc 180 ctgttgcatg cctgcggctc caaccgcatt ccagagtctg ggggagacaa cagtgtgttt 240 gacatctttg aactcaccgg agctgcccgc aagcggtctg ggcgccgact ggtgaagggc 300 cctgaccctt ctagcccagc tttccgcatc gaggatgcca acctgatccc ccctgtgcct 360 gacaagaagt tccaagacct agtggatgct gtgcgggcgg agaaaggttt cctcctcctg 420 gcctccctga ggcaaatgaa gaagacccgg ggtaccctgc tggctgtgga gcggaaagac 480 cactctggcc aggtcttcag cgtgatctcc aatggcaagg cgggcaccct ggacctgagc 540 ctgaccgtgc aggggaagca gcatgtggtg tcggtggaag aagcactcct ggcgactggc 600 cagtggaaga gcatcaccct gtttgtgcag gaggacaggg cccagctgta catcgactgt 660 gagaagatgg agaatgcgga gctggatgtc cccatccaga gcatcttcac cagggacctg 720 gccagcatcg ccaggctccg cattgccaaa ggaggtgtca acgacaattt ccagggggtg 780 ctgcagaatg taaggtttgt ctttggaacc acaccagaag acatcctcag gaacaaaggc 840 tgctccagct ctaccagtgt ctttgtcacc cttgacaaca acgtggtgaa tgggtccagc 900 cctgccatcc gcaccgacta cattggccac aagacaaagg acctgcaagc catctgtggc 960 atctcatgtg acgagctgtc cagcatggtc ctggagctca ggggtctacg caccatcgtg 1020 accacgctgc aggacagtat ccgcaaagtg accgaagaga acaaagagct ggccaacgag 1080 ctgaggaggc ccccactctg ctaccacaac ggagtgcagt acaggactgg cgacgagtgg 1140 acggtggaca gctgcactga gtgtcgctgc cagaactcag ttaccatctg caaaaaagtg 1200 tcctgtccca tcatgccctg ctccaatgcc acagttccgg atggagaatg ctgcccacgg 1260 tgctggccca gcgactctgc agacgatggc tggtccccgt ggtctgagtg gacctcttgc 1320 tctgtgacct gtggcaatgg aatccagcag cgtggccgct cctgcgacag cctcaacaac 1380 agatgcgagg gctcctctgt gcagacgcgg acctgccaca tccaggagtg tgacaagaga 1440 tttaaacagg atggcggctg gagccactgg tccccatggt catcttgctc cgtaacatgt 1500 ggagacggtg tgatcacaag gatccggctc tgcaactccc ccagccccca gatgaatggg 1560 aagccatgtg agggcaaagc ccgggagacc aaagcctgcc agaaagactc ctgccccatc 1620 aatggaggct ggggaccttg gtcaccatgg gacatctgtt ctgtcacctg tggaggaggg 1680 gtacagaaac gtagccggct ctgcaacaac cccaaacccc agtttggagg caaggactgc 1740 gttggtgatg tgacagaaaa ccagatctgc aacaagcagg actgtcccat tgacggatgc 1800 ctgtccaatc cctgctttgc tggtgtccag tgtaccagct accctgatgg cagctggaag 1860 tgtggtgcct gtcccccagg ctatagtgga gatggagtcg agtgcaaaga cgttgatgag 1920 tgcaaagaag tccctgatgc ctgcttcaac cacaatggag agcacaggtg tgagaacaca 1980 gaccccggct acaactgcct gccctgccca ccgcgcttca ctggctcgca gccctttggc 2040 cggggcgtgg aacatgccac cgccaacaag caggtatgca agccccgaaa cccctgcaca 2100 gacgggacac acgactgcaa caagaacgcc aagtgcaact acctgggcca ctacagcgac 2160 cccatgtacc gctgcgagtg caagcctggc tacgccggca acggcatcat ctgcggggag 2220 gacacagacc tggacggctg gcccaatgag gacctgctgt gcgtggccaa cgcaacttac 2280 cactgcagaa aggataattg ccccaacctt cccaactcag ggcaggaaga ctatgacaag 2340 gatggaatcg gcgatgcctg cgatgatgac gatgacaatg ataagattcc agatgacagg 2400 gacaactgtc cattccatta caacccagcc cagtacgact atgacagaga tgacgtggga 2460 gaccgctgtg acaactgccc ctacaaccac aacccagacc aggctgacac agataacaat 2520 ggggaaggag acgcctgtgc agctgacatt gatggggaca gtatcctcaa tgaacgggac 2580 aactgccagt atgtctacaa tgtggaccag aaagacactg acatggacgg ggttggtgat 2640 cagtgtgaca actgccccct ggaacacaat ccagaccagc tcgactctga ctcggaccgc 2700 attggagaca cctgtgacaa caatcaggat attgatgaag acggccacca gaacaatctg 2760 gacaactgtc cctacgtgcc caacgccaac caggctgacc atgacaagga tggcaaaggc 2820 gatgcctgtg accatgatga cgacaatgat ggcattcctg atgaccggga caactgcagg 2880 ctggtgccca atcctgacca gaaggactct gatggtgatg gtcgaggtga tgcttgcaaa 2940 gatgattttg accaggacaa ggtgccagac attgatgaca tctgtcccga aaatgttgat 3000 atcagtgaga ctgatttccg ccgattccag atgattcctc tagatcccaa agggacatcc 3060 cagaatgacc ctaactgggt tgtacgccat cagggtaaag aactcgtcca gactgtcaac 3120 tgtgaccctg gacttgctgt aggttatgac gaatttaacg ccgtggactt cagtggcacc 3180 ttcttcatca acaccgagag ggatgacgac tatgccggct ttgtgtttgg ctaccagtcc 3240 agcagccgct tctatgttgt gatgtggaag caagtcactc agtcctactg ggacaccaac 3300 cccacgaggg ctcaggggta ctctggactt tccgtgaagg ttgtaaactc caccacgggg 3360 cctggcgagc acctgcggaa tgccctgtgg cacacaggaa acacctctgg ccaggtgcgc 3420 acactgtggc atgaccctcg tcacattggc tggaaagatt tcactgccta cagatggcat 3480 ctgagccaca ggccaaagac aggtttcatc agagtggtaa tgtatgaagg gaagaaaatc 3540 atggctgact caggacccat ctatgacaaa acctatgctg gtgggaggct aggcttgttc 3600 gtcttctctc aagaaatggt gttcttctcc gacctgaaat atgaatgcag agactcctaa 3660 tcatcaaact gttgatcaaa agactgatca taaaccaatg ctggtattgc accttctgga 3720 accatgggct tagaaaaccc ccaggatcgc gcctcgctgc ctgcctttgc tctctgcttg 3780 catgagtgtg gactcctaga acatgtgact tgcctcaaga aaatgcaatt ttccaaatca 3840 gaccctgcat tcagcctctg actgagaaga atcttccaag gagacaaaca atgactttgg 3900 ttggcttttg caaaagcaaa agcatccaca tgctttggtt ggaaggtgcc tgtcccactc 3960 tgcttttgtc agagcagaat gcgactgtga ggccagctct gagcagtgga ctccaaaatg 4020 ttttcaggca tgtgagagaa gggaggactc actagaattg acaaacaaaa ccagccctga 4080 cctactccct ctggaatggg ggcgggtggg ggggccaaag cccaaagggg aggatgcata 4140 cccaagagat gattgtatga agaaaatatg gaggaactgt tacatttttg gtactaaatc 4200 attttcaggg gattgaaaga ctattgctgg atttcatgat gctgaccggt gttagctgat 4260 taacccacat aaataggcac ttaaatagga gcagggaagg aaggaaaaga ctggcttctg 4320 gacttcctcc cagatttcca ccccttaaca catcacctgt agtgaccaga acagggagtc 4380 ggagttaaac cgacacaagg cagggccagc tgctgcagct tggttctatt gaaattgtca 4440 gttgtattcc agatgtagct tctgcagatg tagcagcaaa ataagaatac ccaccatctc 4500 agcgagcacc aggctgtctc ccaagggacg gcagccatgc ttgtattttt atggttagaa 4560 aggcacaaaa ttatcaacta agacattcct tctttctctt tttttcctga acatcatgga 4620 gttttccagt tgtctctttt ggactgtagt ttttagtgtt ttaaacaaac actttacaat 4680 gtaaactatt tattttttac ttattctggg ggatctgtct gaaagactat tcatggaaca 4740 ggaagaagcg taaggactat ccatatcatc tttgctacaa gtcattatga ctgtaagatt 4800 gtaaatacag attatttatt aactctgttc tacctggaat ctagtttcat atggaaagtg 4860 tttgagagca ggtagttgag atcgatcagc aaatctttca caggaatggc acaaggaaac 4920 cagcatagca agctgctctt caccttgtgc ttagactgga tgatttggaa ttcttttttc 4980 cttttttttc ccaagtggaa ttacttggtt gtccatttgc aagtgttttt agtttgcaaa 5040 gaaagccaag aggccattaa tactgtctta tcccatccct tgtgcctatt tccagggaga 5100 tgaaaagcat ctacatttat tatttttgcc tttttccaaa agaaaaaaat gacaaaggtg 5160 aaacttgtat acaaatatta cctcatttgt tgtgtgactg agtaaagaat tttgggatca 5220 aacagaaaga gtttaagtgt ctaacaaact taaagctact gtagtaccta aaaaaaaaaa 5280 aaaaaaaaa                                                         5289 <210>63 <211>2053 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>63 gaattccggc ggccgctgag agcccaccct ggcgagctct cccagccgca gcctccgaat 60 ccacggcctc caccccgcgc ctctccagcg ctctatcccg tcgctgcgcc cttgtcgccg 120 gccccggcgc tgcatccgcg tccgcacagg ctccttgact gggcacaaat agctccacca 180 tggggctggc ctggggactc ggtgtcctgc tcctgttgca tgcctgcggc tccaaccgca 240 ttccagagtc tgggggagac aacagtgtgt ttgacatctt tgaactcacc ggagctgccc 300 gcaacggtac tgggcgccga ctggtgaagg gccctgaccc ttctagccca gctttccgca 360 tcgaggatgc caacctgatc ccccctgtgc ctgacaagaa gttccaagac ctagtggatg 420 ctgtgcgggc ggagaaaggt ttcctcctcc tggcctccct gaggcaaatg aagaagaccc 480 ggggtaccct gctggctgtg gagcggaaag accactctgg ccaggtcttc agcgtgatct 540 ccaatggcaa ggcgggcacc ctggacctga gcctgaccgt gcaggggaag cagcatgtgg 600 tgtcggtgga agaagcactc ctggcgactg gccagtggaa gagcatcacc ctgtttgtgc 660 aggaggacag ggcccagctg tacatcgact gtgagaagat ggagaatgcg gagctggatg 720 tccccatcca gagcatcttc accagggacc tggccagcat cgccaggctc cgcattgcca 780 aaggaggtgt caacgacaat ttccaggggg tcctgcagaa tgtaaggttt gtctttggaa 840 ccacaccaga agacatcctc aggaacaaag gctgctccag ctctaccagt gtctttgtca 900 cccttgacaa caacgtggtg aatgggtcca gccctgccat ccgcaccgac tacattggcc 960 acaagacaaa ggacctgcaa gccatctgtg gcatctcatg tgacgagctg tccagcatgg 1020 tcctggagct caggggtcta cgcaccatcg tgaccacgct gcaggacagt atccgcaaag 1080 tgaccgaaga gaacaaagag ctggccaacg agctgaggag gcccccactc tgctaccaca 1140 acggagtgca gtacaggact ggcgacgagt ggacggtgga cagctgcact gagtgtcgct 1200 gccagaactc agttaccatc tgcaaaaaag tgtcctgtcc catcatgccc tgctccaatg 1260 ccacagttcc ggatggagaa tgctgcccac ggtgctggcc cagcgactct gcagacgacg 1320 gctggtcccc gtggtctgag tggacctctt gctctgtgac ctgtggcaat ggaatccagc 1380 agctggccgc tcctgcgaca gcctcaacaa cagatgcgag ggctcctctg tgcagacgcg 1440 gacctgccac atccaggagt gtgacaagag atttaaacag gatggcggct ggagccactg 1500 gtccccatgg tcatcttgct ccgtaacatg tggagacggt gtgatcacaa ggatccggct 1560 ctgcaactcc cccagccccc agatgaatgg gaagccatgt gagggcaaag cccgggagac 1620 caaagcctgc cagaaagact cctgccccat caatggaggc tggggacctt ggtcaccatg 1680 ggacatctgt tctgtcacct gtggaggagg ggtacagaaa cgtagccggc tctgcaacaa 1740 ccccacaccc cagtttggag gcaaggactg cattggtgat gtgacagaaa accagatctg 1800 caacaagcag gactgtccca ttgacggatg cctgtccaat ccctgctttg ctggtgtcca 1860 gtgtaccagc taccctgatg gcagctggaa gtgtggtgcc tgtcccccag gctatagtgg 1920 agatggagtc gagtgcaaag acgttgatga gtgcaaagaa gtccctgatg cctgcttcaa 1980 ccacaatgga gagcacaggt gtgagaacac agaccccggc tacaactgcc tgccctgccc 2040 accgcccgga att                                                    2053 <210>64 <211>4339 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>64 agccactgcc tggagtcagc cagcctcatc ggacttctgc aggcaatcgc gaagctgcta 60 tccagttctg ccacggtctc tcccggcgca ccggcagtct cagcgtcttc accggactca 120 gcgtccttgt ccttcacttc acctttgcca cctctccggg ttactgagcc ccggtgcaca 180 caggctccgt gttgggcaca aaggctccac catggagctc ctgcggggac taggtgtcct 240 gttcctgttg catatgtgtg gaagcaaccg cattccagag tctgggggag ataacggtgt 300 gtttgacatc tttgaactca ttggaggtgc acgaaggggc cccggtcgcc gactggtgaa 360 gggccaagat ctatccagcc ccgccttccg cattgagaat gccaacctga tccccgctgt 420 gccggatgac aagttccaag acctactgga cgctgtgtgg gccgacaaag gcttcatctt 480 cttggcttcc ttgaggcaga tgaagaagac ccggggcaca ctcctggctg tggaacggaa 540 agacaacact ggccagatct tcagtgtggt ctccaacggc aaagctggca ccctggacct 600 gagcccgagc ctgccaggga agcaacaagt ggtgtcagtg gaggaagctc tcctggccac 660 tggccagtgg aagagcatca cgctgtttgt tcaagaggac cgggctcaac tctacataga 720 ctgtgataag atggagagcg cggagctgga tgtacccatc cagagcatct tcaccaggga 780 tctggccagc gttgccaggc tccgagttgc aaagggagat gtcaatgaca attttcaggg 840 ggtgctgcag aatgtgaggt ttgtctttgg aaccacccca gaagacattc tcaggaacaa 900 aggctgctcc agctctacca acgtccttct tacccttgac aacaacgtgg tgaacggttc 960 cagccctgct atccgcacca actacatcgg ccacaaaaca aaggacctcc aagctatctg 1020 tggcctctcc tgtgatgaac tatccagcat ggtcctggaa ctgaagggcc tgcgcaccat 1080 cgtgaccact ctgcaggaca gcatccgaaa agtgacggaa gagaacagag agctggtcag 1140 tgagctgaag cggcctcccc tctgctttca caatggagtc cagtacaaga acaacgagga 1200 gtggactgta gacagttgca cagagtgtca ctgccagaac tcggttacca tctgcaaaaa 1260 ggtgtcctgt cccatcatgc cctgctccaa cgccacagtt cctgatggtg aatgctgccc 1320 acggtgctgg cccagcgact ctgctgacga tggctggtct ccctggtctg agtggacctc 1380 ctgctctgcc acatgtggca atggaattca gcaacgtggt cgttcctgtg acagcctcaa 1440 caacagatgc gagggctctt cggtacagac gaggacctgc cacattcagg agtgtgacaa 1500 aagatttaaa caggatggtg gctggagtca ctggtctcca tggtcgtcct gttctgtgac 1560 ctgtggtgac ggtgtgatca caaggatccg tctctgcaac tcccccagcc cccagatgaa 1620 cgggaagccc tgtgaaggtg aagcccggga gaccaaagcc tgcaagaaag acgcctgccc 1680 aattaatgga ggctggggtc cctggtcacc atgggacatc tgctctgtca cctgtggagg 1740 aggagtgcag agacgcagcc gactctgtaa caaccccaca ccccagtttg gaggcaaaga 1800 ctgtgttggc gatgtgacag aaaatcaagt ttgcaacaag caggactgcc caattgatgg 1860 atgcctgtcc aatccctgct ttgctggtgc caagtgtact agctaccctg atggtagctg 1920 gaaatgtggt gcgtgtcctc ctggctacag tggaaatggc atccagtgca aagacgtcga 1980 tgagtgcaaa gaagtgcctg atgcttgctt caatcacaac ggagaacatc ggtgcaagaa 2040 cacagatcct ggctacaact gcctgccctg cccaccacga ttcactggct cacagccctt 2100 cggccgaggt gtcgaacatg ccatggccaa caaacaggtg tgcaaaccgc gaaacccctg 2160 cacggacggg acgcatgact gcaacaagaa cgctaagtgc aactacctgg gtcactacag 2220 cgaccccatg taccgctgtg agtgcaagcc cggctatgca ggcaatggca tcatctgcgg 2280 agaggacaca gacctggacg gctggcctaa tgaaaacctg gtgtgtgtgg ccaacgcaac 2340 ctaccactgc aaaaaggaca actgccccaa ccttcccaac tcggggcagg aagactatga 2400 caaggacggg attggcgatg cctgcgatga tgacgatgac aacgacaaga tccctgatga 2460 cagggacaac tgtccattcc attacaaccc agcccagtat gactatgaca gagatgatgt 2520 gggagaccgc tgtgacaact gcccctacaa ccacaaccct gaccaagcag acacagacaa 2580 aaacggggag ggcgatgcct gtgctgtgga catcgatgga gatggaatcc tcaatgaacg 2640 agacaactgc cagtacgttt acaacgtgga ccagagggac acggacatgg atggggttgg 2700 agatcagtgt gacaactgcc ccctggaaca caatccagac cagctggact ctgactcaga 2760 cctcataggg gacacttgtg acaacaatca ggacatcgat gaggatggcc atcagaacaa 2820 cctggacaac tgtccctatg tgcctaacgc caaccaggcc gaccatgata aagatggcaa 2880 aggagatgcc tgtgaccatg acgatgacaa tgacggcatc cctgatgaca gagacaactg 2940 caggctggtg cccaatcctg accagaagga ctctgatggt gatggccgag gtgacgcctg 3000 caaagacgac tttgaccatg acaatgtgcc agatattgat gacatctgtc ctgagaattt 3060 tgacatcagt gaaaccgatt tccgacgatt ccagatgatt cctctagatc ccaaaggaac 3120 ctcccaaaat gaccctaact gggttgtccg ccatcagggc aaagaactcg tccagactgt 3180 aaactgtgac cctggacttg ctgtaggtta tgatgagttt aatgctgtgg acttcagcgg 3240 taccttcttc atcaacaccg agagagatga tgactacgct ggcttggtat tcggctacca 3300 gtccagcagc cgcttctacg ttgtgatgtg gaaacaagtc acccagtcct actgggacac 3360 caaccccaca agggctcagg gatactcagg cctgtctgta aaggttgtga actccaccac 3420 cggccctggc gagcacctgc ggaatgcact gtggcacaca ggaaacaccc ctggccaggt 3480 gcgcaccctg tggcatgacc ctcgccacat cggctggaaa gatttcactg cgtacagatg 3540 gcgtctcagc cacaggccaa agaccggtta tatcagagtg gtgatgtatg aaggaaagaa 3600 aatcatggct gactcgggac ccatctatga caaaacctac gccggcggta gactaggcct 3660 gttcgtcttc tctcaggaaa tggtgttctt ctcagacatg aaatacgagt gtcgagattc 3720 ctaatcatca gctgccaatc ataaccagcg ctggcaatgc accttctaaa aacaagggct 3780 agagaaaccc cccacccctg ccgggatcgc ctttcctcgc cttccttgcc tctcttcttg 3840 catagtgtgg acttgtaaag cctgagacct gcctcaagaa aatgcagttt tcgaacccag 3900 agtcagcact cggcctttaa cgaatgagaa tgcatcttcc aagaccatga agagttcctt 3960 gggtttgctt ttgggaaagc caaagcgcct atttacttcc cactaggaag gtgcccgctc 4020 cactctgcct tactcacaga gccagaactt cttcgaggcc acctctgagc agcacacaca 4080 gaagcatttt caggcatgtc aaagaaagga aaaatgactc actagaactc accgccaaac 4140 aacctctgac ataggtcctg agatgtgggg aggcaggagc caaagctcta gggagggcat 4200 gtacccaaga gatgactgta tgaagaaaat gtggaggagc tgttcggtac taaatcattt 4260 tcaggggaca gacagacttg ctgcatttcc gcatgctgct ggtgagagct gattgaccca 4320 atcttccaca caggcactt                                              4339 <210>65 <211>186 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>65 gcacagttaa tggaggctgg ggtccctggt caccatggga catctgctct gtcacctgtg 60 gaggaggagt gcagagacgc agccgactct gtaacaaccc cacaccccag tttggaggca 120 aagactgtgt tggcgatgtg acagaaaatc aagtttgcaa caagcaggac tgcccaattg 180 gtaagc                                                            186 <210>66 <211>5774 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>66 gtcactttgg ttgatagcag ccgctctggt agaggttagg acttcagctg atggacaagc 60 tggtaatgaa gaaatggtgc aaatagattt accaataaag agatatagag agtatgagct 120 ggtgactcca gtcagcacaa atctagaagg acgctatctc tcccatactc tttctgcgag 180 tcacaaaaag aggtcagcga gggacgtgtc ttccaaccct gagcagttgt tctttaacat 240 cacggcattt ggaaaagatt ttcatctgcg actaaagccc aacactcaac tagtagctcc 300 tggggctgtt gtggagtggc atgagacatc tctggtgcct gggaatataa ccgatcccat 360 taacaaccat caaccaggaa gtgctacgta tagaatccgg aaaacagagc ctttgcagac 420 taactgtgct tatgttggtg acatcgtgga cattccagga acctctgttg ccatcagcaa 480 ctgtgatggt ctggctggaa tgataaaaag tgataatgaa gagtatttca ttgaaccctt 540 ggaaagaggt aaacagatgg aggaagaaaa aggaaggatt catgttgtct acaagagatc 600 agctgtagaa caggctccca tagacatgtc caaagacttc cactacagag agtcggacct 660 ggaaggcctt gatgatctag gtactgttta tggcaacatc caccagcagc tgaatgaaac 720 aatgagacgc cgcagacacg cgggagaaaa cgattacaat atcgaggtac tgctgggagt 780 ggatgactct gtggtccgtt tccatggcaa agagcacgtc caaaactacc tcctgaccct 840 aatgaacatt gtgaatgaaa tttaccatga tgagtccctc ggagtgcata taaatgtggt 900 cctggtgcgc atgataatgc tgggatatgc aaagtccatc agcctcatag aaaggggaaa 960 cccatccaga agcttggaga atgtgtgtcg ctgggcgtcc caacagcaaa gatctgatct 1020 caaccactct gaacaccatg accatgcaat ttttttaacc aggcaagact ttggacctgc 1080 tggaatgcaa ggatatgctc cagtcaccgg catgtgtcat ccagtgagaa gttgtaccct 1140 gaatcatgag gatggttttt catctgcttt tgtagtagcc catgaaacgg gccatgtgtt 1200 gggaatggag catgatggac aaggcaacag gtgtggtgat gagactgcta tgggaagtgt 1260 catggctccc ttggtacaag cagcattcca tcgttaccac tggtcccgat gcagtggtca 1320 agaactgaaa agatatatcc attcctatga ctgtctcctt gatgaccctt ttgatcatga 1380 ttggcctaaa ctcccagaac ttcctggaat caattattct atggatgagc aatgtcgttt 1440 tgattttggt gttggctata aaatgtgcac cgcgttccga acctttgacc catgtaaaca 1500 gctgtggtgt agccatcctg ataatcccta cttttgtaag actaaaaagg gacctccact 1560 tgatgggact gaatgtgctg ctggaaaatg gtgctataag ggtcattgca tgtggaagaa 1620 tgctaatcag caaaaacaag atggcaattg ggggtcatgg actaaatttg gctcctgttc 1680 tcggacatgt ggaactggtg ttcgtttcag aacacgccag tgcaataatc ccatgcccat 1740 caatggtggt caggattgtc ctggtgttaa ttttgagtac cagctttgta acacagaaga 1800 atgccaaaaa cactttgagg acttcagagc acagcagtgt cagcagcgaa actcccactt 1860 tgaataccag aataccaaac accactggtt gccatatgaa catcctgacc ccaagaaaag 1920 atgccacctt tactgtcagt ccaaggagac tggagatgtt gcttacatga aacaactggt 1980 gcatgatgga acgcactgtt cttacaaaga tccatatagc atatgtgtgc gaggagagtg 2040 tgtgaaagtg ggctgtgata aagaaattgg ttctaataag gttgaggata agtgtggtgt 2100 ctgtggagga gataattccc actgccgaac cgtgaagggg acatttacca gaactcccag 2160 gaagcttggg taccttaaga tgtttgatat accccctggg gctagacatg tgttaatcca 2220 agaagacgag gcttctcctc atattcttgc tattaagaac caggctacag gccattatat 2280 tttaaatggc aaaggggagg aagccaagtc gcggaccttc atagatcttg gtgtggagtg 2340 ggattataac attgaagatg acattgaaag tcttcacacc gatggacctt tacatgatcc 2400 tgttattgtt ttgattatac ctcaagaaaa tgatacccgc tctagcctga catataagta 2460 catcatccat gaagactctg tacctacaat caacagcaac aatgtcatcc aggaagaatt 2520 agatactttt gagtgggctt tgaagagctg gtctcaggtt tccaaacccc gtggtggagg 2580 tttccagtac actaaatatg gatgccgtag gaaaagtgat aataaaatgg tccatcgcag 2640 cttctgtgag gccaacaaaa agccgaaacc tattagacga atgtgcaata ttcaagagtg 2700 tacacatcca ctctgggtag cagaagaatg ggaacactgc accaaaacct gtggaagttc 2760 tggctatcag cttcgcactg tacgctgcct tcagccactc cttgatggca ccaaccgctc 2820 tgtgcacagc aaatactgca tgggtgaccg tcccgagagc cgccggccct gtaacagagt 2880 gccctgccct gcacagtgga aaacaggacc ctggagtgag tgttcagtga cctgcggtga 2940 aggaacggag gtgaggcagg tcctctgcag ggctggggac cactgtgatg gtgaaaagcc 3000 tgagtcggtc agagcctgtc aactgcctcc ttgtaatgat gaaccatgtt tgggagacaa 3060 gtccatattc tgtcaaatgg aagtgttggc acgatactgc tccataccag gttataacaa 3120 gttatgttgt gagtcctgca gcaagcgcag tagcaccctg ccaccaccat accttctaga 3180 agctgctgaa actcatgatg atgtcatctc taaccctagt gacctcccta gatctctagt 3240 gatgcctaca tctttggttc cttatcattc agagacccct gcaaagaaga tgtctttgag 3300 tagcatctct tcagtgggag gtccaaatgc atatgctgct ttcaggccaa acagtaaacc 3360 tgatggtgct aatttacgcc agaggagtgc tcagcaagca ggaagtaaga ctgtgagact 3420 ggtcaccgta ccatcctccc cacccaccaa gagggtccac ctcagttcag cttcacaaat 3480 ggctgctgct tccttctttg cagccagtga ttcaataggt gcttcttctc aggcaagaac 3540 ctcaaagaaa gatggaaaga tcattgacaa cagacgtccg acaagatcat ccaccttaga 3600 aagatgagaa agtgaaccaa aaaggctaga aaccagagga aaacctggac aacctctctc 3660 ttcccatggt gcatatgctt gtttaaagtg gaaatctcta tagatcgtca gctcatttta 3720 tctgtaattg gaagaacaga aagtgctggc tcactttcta gttgctttca tcctcctttt 3780 gttctgcatt gactcattta ccagaattca ttggaagaaa tcaccaaaga ttattacaaa 3840 agaaaaatat gttgctaaga ttgtgttggt cgctctctga agcagaaaag ggactggaac 3900 caattgtgca tatcagctga ctttttgttt gttttagaaa agttacagta aaaattaaaa 3960 agagatacca atggtttaca ctttaacaag aaattttgga tatggaacaa agaattctta 4020 gacttgtatt cctatttatc tatattagaa atattgtatg agcaaatttg cagctgttgt 4080 gtaaatactg tatattgcaa aaatcagtat tattttaaga gatgtgttct caaatgattg 4140 tttactatat tacatttctg gatgttctag gtgcctgtcg ttgagtattg ccttgtttga 4200 cattctatag gttaattttc aaagcagagt attacaaaag agaagttaga attacagcta 4260 ctgacaatat aaagggtttt gttgaatcaa caatgtgata cgtaaattat agaaaaagaa 4320 aagaaacaca aaagctatag atatacagat atcagcttac ctattgcctt ctatacttat 4380 aatttaaagg attggtgtct tagtacactt gtggtcacag ggatcaacga atagtaaata 4440 atgaactcgt gcaagacaaa actgaaaccc tctttccagg acctcagtag gcaccgttga 4500 ggtgtccttt gtttttgtgt gtgtgtgttc ttttttaatt ttcgcattgt tgacagatac 4560 aaacagctat actcaatgta ctgtaataat cgcaaaggaa aaagttttgg gataacttat 4620 ttgtatgttg gtagctgaga aaaatatcat cagtctagaa ttgatatttg agtatagtag 4680 agctttgggg ctttgaaggc aggttcaaga aagcatatgt cgatggttga gatatttatt 4740 ttccatatgg ttcatgttca aatgttcaca accacaatgc atctgactgc aataatgtgc 4800 taataattta tgtcagtagt caccttgctc acagcaaagc cagaaatgct ctctccaggg 4860 agtagatgta aagtacttgt acatagaatt cagaactgaa gatatttatt aaaagttgat 4920 ttttttttct tgatagtatt tttatgtact aaatatttac actaatatca attacatatt 4980 ttggtaaact agagagacat aattagagat gcatgctttg ttctgtgcat agagaccttt 5040 aagcaaacta ctacagccaa ctcaaaagct aaaactgaac aaatttgatg ttatgcaaac 5100 atcttgcatt tttagtagtt gatattaagt tgatgacttg tttcccttca aggaaacatt 5160 aaattgtatg gactcagcta gctgttcaat gaaattgtga attagaaaca tttttaaaag 5220 tttttgaaag agataagtgc atcatgaatt acatgtacat gagaggagat agtgatatca 5280 gcataatgat tttgaggtca gtacctgagc tgtctaaaaa tatattatac aaactaaaat 5340 gtagatgaat taacctctca aagcacagaa tgtgcaagaa cttttgcatt ttaatcgttg 5400 taaactaaca gcttaaacta ttgactctat acctctaaag aattgctgct actttgtgca 5460 agaactttga aggtcaaatt aggcaaattc cagatagtaa aacaatccct aagccttaag 5520 tctttttttt ttcctaaaaa ttcccataga ataaaattct ctctagttta cttgtgtgtg 5580 catacatctc atccacaggg gaagataaag atggtcacac aaacagtttc cataaagatg 5640 tacatattca ttatacttct gacctttggg ctttcttttc tactaagcta aaaattcctt 5700 tttatcaaag tgtacactac tgatgctgtt tgttgtactg agagcacgta ccaataaaaa 5760 tgttaacaaa atat                                                   5774 <210>67 <211>5535 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>67 ggactttaga agccgttgct gccctctctg tcacctgaag cggggccctc tcccatccca 60 cccttgcccc gcctccctgc ccccaccggg ccggccctgc ccgccgccgg accctggcat 120 gtcaagacct ggtccgcgcc tgcctgccca gcccgcggaa ccccggcggc cccgcgagct 180 aggatgaggg gccaggccgc cgccccgggc cccgtctgga tcctcgcccc gctgctactg 240 ctgctgctgc tgctgggacg ccgcgcgcgg gcggccgccg gagcagacgc ggggcccggg 300 cccgagccgt gcgccacgct ggtgcaggga aagttcttcg gctacttctc cgcggccgcc 360 gtgttcccgg ccaacgcctc gcgctgctcc tggacgctac gcaacccgga cccgcggcgc 420 tacactctct acatgaaggt ggccaaggcg cccgtgccct gcagcggccc cggccgcgtg 480 cgcacctacc agttcgactc cttcctcgag tccacgcgca cctacctggg cgtggagagc 540 ttcgacgagg tgctgcggct ctgcgacccc tccgcacccc tggccttcct gcaggccagc 600 aagcagttcc tgcagatgcg gcgccagcag ccgccccagc acgacgggct ccggccccgg 660 gccgggccgc cgggccccac cgacgacttc tccgtggagt acctggtggt ggggaaccgc 720 aaccccagcc gtgccgcctg ccagatgctg tgccgctggc tggacgcgtg tctggccggt 780 agtcgcagct cgcacccctg cgggatcatg cagaccccct gcgcctgcct gggcggcgag 840 gcgggcggcc ctgccgcggg acccctggcc ccccgcgggg atgtctgctt gagagatgcg 900 gtggctggtg gccctgaaaa ctgcctcacc agcctgaccc aggaccgggg cgggcacggc 960 gccacaggcg gctggaagct gtggtccctg tggggcgaat gcacgcggga ctgcggggga 1020 ggcctccaga cgcggacgcg cacctgcctg cccgcgccgg gcgtggaggg cggcggctgc 1080 gagggggtgc tggaggaggg tcgccagtgc aaccgcgagg cctgcggccc cgctgggcgc 1140 accagctccc ggagccagtc cctgcggtcc acagatgccc ggcggcgcga ggagctgggg 1200 gacgagctgc agcagtttgg gttcccagcc ccccagaccg gtgacccagc agccgaggag 1260 tggtccccgt ggagcgtgtg ctccagcacc tgcggcgagg gctggcagac ccgcacgcgc 1320 ttctgcgtgt cctcctccta cagcacgcag tgcagcggac ccctgcgcga gcagcggctg 1380 tgcaacaact ctgccgtgtg cccagtgcat ggtgcctggg atgagtggtc gccctggagc 1440 ctctgctcca gcacctgtgg ccgtggcttt cgggatcgca cgcgcacctg caggcccccc 1500 cagtttgggg gcaacccctg tgagggccct gagaagcaaa ccaagttctg caacattgcc 1560 ctgtgccctg gccgggcagt ggatggaaac tggaatgagt ggtcgagctg gagcgcctgc 1620 tccgccagct gctcccaggg ccgacagcag cgcacgcgtg aatgcaacgg gccttcctac 1680 gggggtgcgg agtgccaggg ccactgggtg gagacccgag actgcttcct gcagcagtgc 1740 ccagtggatg gcaagtggca ggcctgggcg tcatggggca gttgcagcgt cacgtgtggg 1800 gctggcagcc agcgacggga gcgtgtctgc tctgggccct tcttcggggg agcagcctgc 1860 cagggccccc aggatgagta ccggcagtgc ggcacccagc ggtgtcccga gccccatgag 1920 atctgtgatg aggacaactt tggtgctgtg atctggaagg agaccccagc gggagaggtg 1980 gctgctgtcc ggtgtccccg caacgccaca ggactcatcc tgcgacggtg tgagctggac 2040 gaggaaggca tcgcctactg ggagcccccc acctacatcc gctgtgtttc cattgactac 2100 agaaacatcc agatgatgac ccgggagcac ctggccaagg ctcagcgagg gctgcctggg 2160 gagggggtct cggaggtcat ccagacactg gtggagatct ctcaggacgg gaccagctac 2220 agtggggacc tgctgtccac catcgatgtc ctgaggaaca tgacagagat tttccggaga 2280 gcgtactaca gccccacccc tggggacgta cagaactttg tccagatcct tagcaacctg 2340 ttggcagagg agaatcggga caagtgggag gaggcccagc tggcgggccc caacgccaag 2400 gagctgttcc ggctggtgga ggactttgtg gacgtcatcg gcttccgcat gaaggacctg 2460 agggatgcat accaggtgac agacaacctg gttctcagca tccataagct cccagccagc 2520 ggagccactg acatcagctt ccccatgaag ggctggcggg ccacgggtga ctgggccaag 2580 gtgccagagg acagggtcac tgtgtccaag agtgtcttct ccacggggct gacagaggcc 2640 gatgaagcat ccgtgtttgt ggtgggcacc gtgctctaca ggaacctggg cagcttcctg 2700 gccctgcaga ggaacacgac cgtcctgaat tctaaggtga tctccgtgac tgtgaaaccc 2760 ccgcctcgct ccctgcgcac acccttggag atcgagtttg cccacatgta taatggcacc 2820 accaaccaga cctgtatcct gtgggatgag acggatgtac cctcctcctc cgcccccccg 2880 cagctcgggc cctggtcgtg gcgcggctgc cgcacggtgc ccctcgacgc cctccggacg 2940 cgctgcctct gtgaccggct ctccaccttc gccatcttag cccagctcag cgccgacgcg 3000 aacatggaga aggcgactct gccgtcggtg acgctcatcg tgggctgtgg cgtgtcctct 3060 ctcaccctgc tcatgctggt catcatctac gtgtccgtgt ggaggtacat tcgctcagag 3120 cgttctgtca tcctcatcaa cttctgcctg tccatcatct cctccaatgc cctcatcctc 3180 atcgggcaga cccagacccg caacaaggtg atgtgcacgc tggtggccgc cttcctgcac 3240 ttcttcttcc tgtcctcctt ctgctgggtg ctcaccgagg cctggcagtc ctacatggcc 3300 gtgacgggcc acctccggaa ccgcctcatc cgcaagcgct tcctctgcct gggctggggg 3360 ctccctgcac tggttgtggc catttctgtg ggattcacca aggccaaagg gtacagcacc 3420 atgaactact gctggctctc cctggagggg ggactgctct atgccttcgt gggacctgcc 3480 gctgccgttg tgctggtgaa catggtcatt gggatcctgg tgttcaacaa gctcgtgtcc 3540 aaagacggca tcacggacaa gaagctgaag gagcgggcag gggcctccct gtggagctcc 3600 tgcgtggtgc tgccgctgct ggcgctgacc tggatgtcgg ctgtgctcgc cgtcaccgac 3660 cgccgctccg ccctcttcca gatcctcttc gctgtcttcg actcgctgga gggcttcgtc 3720 atcgtcatgg tgcactgtat cctccgtaga gaggtccagg acgctgtgaa atgccgtgtg 3780 gttgaccggc aggaggaggg caacggggac tcagggggct ccttccagaa cggccacgcc 3840 cagctcatga ccgacttcga gaaggacgtg gatctggcct gtagatcagt gctgaacaag 3900 gacatcgcgg cctgccgcac tgccaccatc acgggcacac tgaagcggcc gtctctgccc 3960 gaggaggaga agctgaagct ggcccatgcc aaggggccgc ccaccaattt caacagcctg 4020 ccggccaacg tgtccaagct gcacctgcac ggctcacccc gctatcccgg cgggcccctg 4080 cccgacttcc ccaaccactc actgaccctc aagagggaca aggcgcccaa gtcctccttc 4140 gtcggtgacg gggacatctt caagaagctg gactcggagc tgagccgggc ccaggagaag 4200 gctctggaca cgagctacgt gatcctgccc acggccacgg ccacgctgcg gcccaagccc 4260 aaggaggagc ccaagtacag catccacatt gaccagatgc cgcagacccg cctcatccac 4320 ctcagcacgg cccccgaggc cagcctcccc gcccgcagcc cgccctcccg ccagcccccc 4380 agcggcgggc cccccgaggc accccctgcc cagcccccac cgcctccgcc cccaccgcca 4440 ccacctcccc agcagcccct gcccccaccg cccaatctgg agccggcacc ccccagcctg 4500 ggggatcccg gggagcctgc cgcccatccg ggacccagca cggggcccag caccaagaac 4560 gagaatgtcg ccaccttgtc tgtgagctcc ctggagcggc ggaagtcgcg gtatgcagaa 4620 ctggactttg agaagatcat gcacacccgg aagcggcacc aagacatgtt ccaggacctg 4680 aaccggaagc tgcagcacgc agcggagaag gacaaggagg tgctggggcc ggacagcaag 4740 ccggaaaagc agcagacgcc caacaagagg ccctgggaga gcctccggaa agcccacggg 4800 acgcccacgt gggtgaagaa ggagctggag ccgctgcagc cgtcgccgct ggagcttcgc 4860 agcgtggagt gggagaggtc gggcgccacg atcccgctgg tgggccagga catcatcgac 4920 ctccagaccg aggtctgagc gggtgggcgg cggccacgca ctgggccacg gaggagggat 4980 gctgctccgc ccgctcctgc cgcagacggg cacagacacg ctcgcgggca gcgggccagg 5040 cccgcacccc ggcctcaggg cgctcagacg gcggccaggc acagggcccg cagtgctggg 5100 accagagcca gatgcaggac aggaggcggc ccggccagcg ggcacagggc accagaggcc 5160 gaaggtgcct cagactccgc cctcctcggg ccgaggccca gcgggcagat gggcggacgg 5220 ctgtggaccg tggacaggcc cagcgcggcc agcgtcccag ggtacccgcc tgagctcctg 5280 ctgcggagga gctgcctgct tggcccggcc ggcctggcac cgttttttaa acacccccat 5340 ccctcgggaa gcagccagct ccccacacct tccagggccc taggcccctc ctagacccag 5400 gtggagggca cagccctccg accctcatgg cccccagggg caggactgag tcccctccag 5460 gaagaagcag gggggaatct attttttctc tccttttctt ttcttcaata aaaagaatta 5520 aaaacccaaa aaaaa                                                  5535 <210>68 <211>398 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>68 cggggcaacc cgctggagtg gacgggccag gtgacggtgc gcaagaagcg caagccctac 60 tccaagttcc agacgctcga gctcgagaag gagttcctct tcaacgcgta cgtcagcaag 120 cagaagcgct gggagctggc gcgcaacctc aacctcaccg agcgccaggt caagatctgg 180 ttccagaacc ggcgcatgaa gaacaagaag aacagccagc gccaggcggc cagcagcagc 240 agcagcaaca gcagcagcag cagcagcagc aacagcagca agcggccgcc ggcggggcgt 300 cggccgccgc caacggccac cagggccacc aagcgcacca ccacgcgccc cccaacggcg 360 ccgtcgcagc cctcaagcac caccagtgac ccgtagcg                         398 <210>69 <211>8670 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>69 cccgggtgcg gtgtcgtgtg tggggctggg cgccatgttc ctggacatgc tgagggccaa 60 gcgcgacacg gcgcccgacc gccgccagct ggacgaccgg atgatggggg cggacccggg 120 ggacatagcg gccaaggtga gggcagggtt ttgcgtgcgt gcttgattgt gcgtgtgcgt 180 gcgtgcgtgc gtgcgtgcgg tgttgcgtgt gtatttgaac tgtgttttgt gtatgtactt 240 aggggtaaga gtgcatacac atgcatgcga ccggtggcct tacaaatcaa caacacgtac 300 gcctgcatgt atccaggtgg cagcgtggcg acgagcacgt ggcttcgagg gcccaggcac 360 ggcgggcccc agcggcagcg ccgccagtgg cagcggcgcc agcggctcgg caccgcaggc 420 gcgctcgccc cgacctcagc caccgcggcc gcgctcacct tcacgcgggt gaaccccggc 480 gaggagccgc ccgtgtacgc gtgcgagcaa acaggtgcgt aagcgacgtg tgggcagcgc 540 gaagaggcgt gggggcgaga gagcaaaggg actagggaaa cgcacagcca aatacggtat 600 gcgggcaacg aggcgatggc cctggaaatc gcagggccct tttgaaatcg tgtaaggcgc 660 aattgctggg cgactaccgt agtctactga tgcattgcac tacttgtatt actgtatcct 720 actgcagtag tgccgttgcc agccgcgctg ctgccctttg gctcccttcc caatccaaat 780 ggcccatgcc tcgcgcactc cgagcaccca gagcacccag aagccgttgc gtgcgctccg 840 ccgccgccct ctcccccgcc ttcacttctt aattaatcgt gaatgtaatc cccccccccc 900 ccgcttcctc aggctgggtg cacgtgtgcg cgacgcctgc acggagggtg tggtggatgc 960 ccgcagcgaa ctgctggtgt gcccggtgag tcgacgagga ggaggtgcaa gggggatacc 1020 agcgcgtgtt tctcagggcc tgtgtgggac accgaaacgt ggtaaaagag acccgcccgc 1080 gaactgtgta tgtggagtag cgtggcgtgt gcggccggac cgacaaggca gcttgtggac 1140 tgccccacgt tgcagagtca gctgacaacg acacgtgcgc cttcctgtca ttgcccgtgc 1200 gcacgcacgt cctccgcact cccaacaaat tgacagcgac acgtgcgcct tcctataagc 1260 ctatgcccgc acacgctccc gcgccctcag gtgtcgggcc agaccacaga ccggttggtc 1320 cacgagtgcg aggaggatga ggcgggcggc tgcggcggcg ccggcggggc gccgcggcga 1380 ggaggacggc ctgggactgg gcatcacagg tgggtggcag gctggcaggg actcacgcat 1440 gggccttgta cgtgactgcg gttctgcatg gctagtggct cacgcgctgc gcacgttcac 1500 gtacggcttg tgggcatgca gtgccttgac gtgaggctgc gctgccttgc tgctgccgcc 1560 ttgccccgct ccctgcacac actgcagccg gcttcgggcg ctacttcacc gcgggctacg 1620 agtgcgagaa cgcgcagcag ctcaacaggc tgctggggta caaggcgctg tgagagcgcg 1680 ccgcaggggg agtgtgttca tattgtggtt gtttgggccg tgggcgcggg ctgcatgtgc 1740 gtattgcacg cgtacagcat tggtgactgg tcaggtgtaa gcggccggca gtgcgccgcg 1800 aggcgctgca gcgagttgtg gggcatgcgt catgcgcaga cggcccctgg acgacaaggc 1860 gttgagttgg cgtttggagg tgtgggacga cgtggggttt gtgccgtcaa agcacagaac 1920 agaaggcgtg accgttttac gagctcgtat gatgtagcat ggattgaata atgacatgtg 1980 atttttgtta caagcgacga atgcgtgggg ttttggatgg caggggtttc agtcgcccga 2040 ttgcgcatgc acacgtgacc aaatttatgc tcaacgacgt gaccattgct ttatacatac 2100 ttgtgtatcg gttggcactt ataacaattg gctcgtcaaa ttgacgcgag gctgcacttc 2160 gatcctgaaa gccccagttc aacaagtcgg atagccaaat ggccccgctc gctctccagc 2220 atcaaggggc ctctaagtgc ctcgcggcaa cccagcgcaa gtgtgctcgc gttgcggtga 2280 gctggactcg tgcacttgtc gacgccgtcg gcaccgcaat cgaaagacgc gtgcgtcgag 2340 caattgtgga agccgctgac gaattgtccg catgtgacat tgcaggctcg cgtccccgct 2400 cgtctcagcg tcatggccca ggtgcggacg ttgggactgc acttgcacga atgtgatggg 2460 gccgcaccga gtctgcgcgg acgtctcgct gacgtttcgc gttgaatgca tctcgcaata 2520 ggcagctgct gcgcctgctg acaacactaa gaagctgtgg ggcggtcgct tcacgggcaa 2580 gacggacccg ctcatggaga agttcaacga gtcgctgccc tttgacaagc gcctgtgggc 2640 tgaggacatc aaggtgcggc acagggaggg gggcgagtgg tggggtgggg ctggggggga 2700 cgcgggtttg gtggccaggg cagggaggga agacgtgcgg ggctaggcaa gaggctgcga 2760 gggcccaggg taacaccaga ccgtgccgtg tcgcgtgccc ggcttgctgc ccaccttgcc 2820 cggccatccc caccgccctc cccaccagca atgacacgta cacattcaca cactccccca 2880 cacccacata cccacacacc cacgcattcc ccaacagggc agccaggcgt acgccaaggc 2940 tcttgccaag gccggcattc tggcacatga cgaggccgtg accattgtgg aggggctggc 3000 caaggtgcgc acacccggca gcagggcggg tgggtgggtg ggtggggtgg gggggcagag 3060 agaggcgcgg gctgagaggg ggctgagagg ggggtcagcg aggcgcaggc tcagggggag 3120 gcgtctgagg ggggctgaga tggtggtggg ggagctgcgg gtgctggggc tgctgcggtg 3180 gcgggcgggc gggcgggcgg gcgacgtgta cgtgagtagc cgctgaccgg gcgctgggcc 3240 tttgcgcacg ccacagccca catgacaccg ccgcaaggcc cgccgcgccc cacccacgtt 3300 cacacactcc ccacacccac gcgtgcgcgc gcctccttcc cctcaataca cgcgcctcct 3360 tcccctggcc cccgcctgct ccccccatcc ggccgccccg cctgcaggtg gctgaggagt 3420 ggaaggcggg tgcctttgtg atcaaggcgg gtgacgagga catccacacg gccaacgagc 3480 ggcgcctcac ggagctggtg ggggcggtgg gcggcaagct gcacaccggc cgctcgcgca 3540 acgaccaggt gagggtgggt gggtgggggt ggggtgggtg ggtgggtggg tgggtgggtg 3600 ggtgggtggg tgggtgggtg ggtgggtggg ggtttgagat accggtacca ggccaaacta 3660 aaccgaaccc aagggggtgg cgtaggggcg tgggaggggg ggagtgcgga agccgggagg 3720 caggagtaag ggcgggagga gggggccgga ggagaagcag ggacgaagtc gatgacaggc 3780 gcagtcggtg gcggcggtgg cgggtgtgcc gttgtgcagt ggctgtggag gccatgtgca 3840 gggcggcggc ggggccgggc cgggggtggg agacttgtcc agaccccgtg gccctcttcc 3900 agccccgtcc gccactgccg ccaccaccac cgccgccgcc gtagccacca cccctcacgt 3960 cgaggcactt cacagatgcg aagcaaccac accgttctcc acatgaacag ctaccctccc 4020 aaacccaact ttcccttccc gccttaccta accatgaccc gctacccccc ccccctttat 4080 ttcttaacta accatgaatg cccccccccg gctgtacctg gctacgactt cacttcgtaa 4140 acttaatgtg tgtaaccccc cttacacaca cacacacacc cctccccgcc cctccaaagg 4200 ttgccaccga ctaccggctg tggctggtgg gtcaggtgga ggtgatgcgg tccgaggtgg 4260 gcgagctgat gcgcgtggcg gcggaccgct ccgaggcaga ggtggaggtg ctcatgccgg 4320 gtgagggggc agggaggggg ggagggggag ggggaggtgc tcatgccggt gagggtaggg 4380 aggggagggg cagaggaggg agggggagga gggggcggct gagtgcggga gaggcaggga 4440 tgagggcgat agaaagttgc gtattgtcgg taaactcaaa ggactagacg aagagaacaa 4500 acctaaacaa gggagctgga gcgaggccaa atctgaacgt gacatcgccc gcctcctccc 4560 gctgcctgct cccccacctc ctcccccatc tcgccccccc ccccacacac acacaggctt 4620 cacgcacctt cagaatgcca tgactgtgcg ctggagccac tggctgatga gccacgccgc 4680 ggcctggcag cgcgacgaca tgcggctgcg ggacctgctg ccgcgggtgg ccacactgcc 4740 gctgggctcg ggtgggtgag ggaggggagg ggaggggagg gggggagggg gagggagagg 4800 aggggagaag ggggggggag acgaggaggg tggaagggtg ggggcggggc ggtggaggct 4860 agagggtggg gctgggtggg tggacggagt gcactggtag aggagggata gggtacattg 4920 agacgggagg agggatgcag gggcgaaggt ggggaggagg ggaggggagg aggcgtggag 4980 ctggagtggg ccgacgagtg tgcggacggg gcaggcggca acggggatta aacggcgggg 5040 ggccggggcg tgtgcacgac aggggcttgc gcgtctgcga ttgtgggggc acacagggac 5100 aggagcacga cgtgggacac gcatagatac gccgcattga caacacacac acacacacac 5160 acacacacac acacacacac acacacacaa acacaaacac acacaaacac aaacacacac 5220 acgccccccc ccctacacac acgccccctc cccaggcgcc ctggccggca acccctttct 5280 ggtggaccgc cagttcatcg ccaaggagtt gggtttcggc ggcggcgtgt gccccaactc 5340 catggacgcg gtgaggggag gaggaggggg aggagggcgg gggggggcag gaggggggag 5400 gaggaggggg ggagggggtt aactttgaag cgtaaggaaa cagtcgggag gaggggggga 5460 aggagggggc ctggaggagg gggggaggag gagggtggct ggagggggct gggggaggag 5520 gagggggagg attgggaggg ggctggggga gggtgcccgc agctggggga ggtggggagg 5580 gagggggttg ctgctggtgt aaagggcctg taggcactga gagcactgtg gggagccggg 5640 gtactgcctg gggccccgcg ctgcagaggt gtcgcgcagt gtggcggcgc atcccccgca 5700 tccccacacg cgggccgctg ccgctgcccg ccacaccctt gccactttgt gtgctttcct 5760 aggatataca cacacacaca cacacacaca cacacacaca cacacacaaa cacaaacaca 5820 cacgggcgcg ggctttcgtt tcgtttttta acacaaacac acactccccc tgtgctcctc 5880 aacacactcc atctttctca cacaaacaca cacgcacaca cacatgcgca ggtgtctgac 5940 cgcgactttg tgatcgagac ggtgtttgcg gccagcctgc tgtgcgtgca cctgtcgcgc 6000 tgggcggagg acctcatcat ctacagctcc ggccccttcg gctacgtgca gtgcagcgac 6060 gcctacgcca ccggctcctc gctcatgccg cagaagaaga accccgacgc cctggagctc 6120 atcaggtgcg ggagggatgg ggtgggggtg ggggggttac attcatggtt agttaagaag 6180 tgaaggcgta gggggtggat ggggtgggtt acattcatga acatttaaga agtgaaggcg 6240 tagccaggaa cagtagtaga gcagacgcgt tgtagtgtgt gggtttgggt gggagggatg 6300 gttgggtaaa gcggtacagg atgtactgag gactgcagac cgaaggagcg ggggaggggg 6360 agcaggcagg cggggcgagg ggcgtggggg cgggggttac tggcaccgtg ccgggtaagc 6420 aacacgtgac acggagatgc accacacaaa gagggacgtg gggagtggca ggcgggggcc 6480 agggctgaga ggcgcgtgtg gaggggtgcg gggttgggcg gggggctgtt tcatgatacc 6540 gctgcctcca cctcctccac cgcctcctgc cacctccacc tcccccactg cccctccccg 6600 cctcctcctg ctgcaggggc aagggcggtc gtgtgcaggg caacctgatg ggcgtcatgg 6660 cggtgctcaa gggcacgccc accacataca acaaggactt ccaggcgaga gagcgagagc 6720 gagggaggga gggagagcga gggagaggga gggagaggga gggagaggga gacagaggga 6780 cagggacagg gacagggaca gggacaggga cagggacagg ggcaggggca ggggcagggg 6840 caggggcagg ggcaggggag gccccccggg ggcggcgggc ccggggcatg aggtcagaca 6900 taggggcgct gcactgaggc cgcgaggcgg gcgggaggca gggggcgggg ggcggggggc 6960 gggagcggac atgcgccgca aacacagacg ggttgagaaa gcacaacgac tggaacgcag 7020 tgggcttact gacaattcat cattgtgcgc atatgtgtgt atgtgtatgt gtgtgtttgt 7080 ttgtgcagga gtgttgggag ctgctgtttg acacggtgga cacggtgcac gacgtggtgc 7140 gcatcgccac cggcgtgctg tccaccctgc ggatcaagcc cgaccgcatg aaggccggtg 7200 agcgtagccg agcagggctg gagcagcagc cgggcagcag tagcagcagg gcaggggagc 7260 agcgggagcg ggagcagcag gaggggtggt tgggaagcgg tgggggtagg gtgggagcgg 7320 aggaagggaa ggaggagcag gagcaggagg aagaggagga ggaagggcgg tggggggtgg 7380 ggggtcgtgt ccttggccgc atgggcggag gcggggaggc ggggaggagg cggggaagca 7440 gagcctgcac ccacgctccg cgggtcccta ccgtcttgcg cctaaccccg tgcgcctagc 7500 ctcttgcgcc caccccctta gtgcatcctg tacccctctt tccaaacatc cttgcaactc 7560 cctgacctcc tcgccaaacc tcccccgccc ccaggcctgt ccgccgacat gctcgccacg 7620 gacttggccg agtacctggt gcgcaagggc gtgccgttcc gggagacaca ccaccacagg 7680 tgcggccggg cgggagggcg tgagggcgtg ggtggggcat gcccggggtt gtgagagcta 7740 tcgaacgttg tgccgcgcct gtttcacaat gtcgggccac agggtatgca gtttcctctc 7800 catatgtata acaaactgac caccaatcat gcacgctcac acgctctccc acacacacgc 7860 gcaccacgcc accacagcgg cgccgccgtg aagatggccg aggaccgcgg ctgcacgctg 7920 ttcgacctca ccgtggacga cctcaagacc atccacccgc tcttcaccga cgacgtggcg 7980 gcggtgagcg gcggcgcgga gcagcagcag cagcagcagc agcagcagca gcagcagcag 8040 tagcctgggg gggagcgtgt gggaggaacg gcgggggagg ggaggcgggg ggtgtcgttt 8100 gcagccgagc gcacgtggtg ctttgcccca ttccatgcca gcagggtgac acacctgacc 8160 atgctggtgt gctgctaggt ggttcacacc tacgtgtgaa tttgtgctgg cgtgcgcaca 8220 ccttactgtg gccatgtgaa cggcatcctc atgtcctcgt gattgcgccc ggcacattgc 8280 ccacaacccc gcaccaccca gctcctcaat ccagtgcaag gaaaggaaat gcacgcccgc 8340 cgcaccaaca acacgacgca tgtgtttgcc acgtgcgcgc acacacgcgc aggtgtggga 8400 cttcaaccgc agcgccgaga tgcgcgacac ggagggcggc accagcaagc gctcggtgct 8460 ggagcaggtg cagaagatgc gcacctacct ggcggcggag ggacagcact gagcgggtcg 8520 ggggaggggg ggcgggtgtg tatgtgtgtg tgtgtgcgtg tgtaagtctc ggtggagggg 8580 tggtcctcta tatggcggcg gggccacagg gggacgggtg tgacagagtt acggccggag 8640 ccagcggagt cccgggatgg attaaggatc                                  8670 <210>70 <211>745 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>70 atgagatggc gacgcgcccc gcgccgctcc gggcgtcccg gcccccgggc ccagcgcccc 60 ggctccgccg cccgctcgtc gccgccgctg ccgctgctgc cactactgct gctgctgggg 120 accgcggccc tggcgccggg ggcggcggcc ggcaacgagg cggctcccgc gggggcctcg 180 gtgtgctact cgtccccgcc cagcgtggga tcggtgcagg agctagctca gcgcgccgcg 240 gtggtgatcg agggaaaggt gcacccgcag cggcggcagc agggggcact cgacaggaag 300 gcggcggcgg cggcgggcga ggcaggggcg tggggcggcg atcgcgagcc gccagccgcg 360 ggcccacggg cgctggggcc gcccgccgag gagccgctgc tcgccgccaa cgggaccgtg 420 ccctcttggc ccaccgcccc ggtgcccagc gccggcgagc ccggggagga ggcgccctat 480 ctggtgaagg tgcaccaggt gtgggcggtg aaagccgggg gcttgaagaa ggactcgctg 540 ctcaccgtgc gcctggggac ctggggccac cccgccttcc cctcctgcgg gaggctcaag 600 gaggacagca ggtacatctt cttcatggag cccgacgcca acagcaccag ccgcgcgccg 660 gccgccttcc gagcctcttt cccccctctg gagacgggcc ggaacctcaa gaaggaggtc 720 agccgggtgc tgtgcaagcg gtgcg                                       745 <210>71 <211>1986 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>71 gaattccttt tttttttttt ttttttcttt ttttttttgc ccttatacct cttcgccttt 60 ctgtggttcc atccacttct tccccctcct cctcccataa acaactctcc tacccctgca 120 cccccaataa ataaataaaa ggaggagggc aaggggggag gaggaggagt ggtgctgcga 180 ggggaaggaa aagggaggca gcgcgagaag agccgggcag agtccgaacc gacagccaga 240 agcccgcacg cacctcgcac catgagatgg cgacgcgccc cgcgccgctc cgggcgtccc 300 ggcccccggg cccagcgccc cggctccgcc gcccgctcgt cgccgccgct gccgctgctg 360 ccactactgc tgctgctggg gaccgcggcc ctggcgccgg gggcggcggc cggcaacgag 420 gcggctcccg cgggggcctc ggtgtgctac tcgtccccgc ccagcgtggg atcggtgcag 480 gagctagctc agcgcgccgc ggtggtgatc gagggaaagg tgcacccgca gcggcggcag 540 cagggggcac tcgacaggaa ggcggcggcg gcggcgggcg aggcaggggc gtggggcggc 600 gatcgcgagc cgccagccgc gggcccacgg gcgctggggc cgcccgccga ggagccgctg 660 ctcgccgcca acgggaccgt gccctcttgg cccaccgccc cggtgcccag cgccggcgag 720 cccggggagg aggcgcccta tctggtgaag gtgcaccagg tgtgggcggt gaaagccggg 780 ggcttgaaga aggactcgct gctcaccgtg cgcctgggga cctggggcca ccccgccttc 840 ccctcctgcg ggaggctcaa ggaggacagc aggtacatct tcttcatgga gcccgacgcc 900 aacagcacca gccgcgcgcc ggccgccttc cgagcctctt tcccccctct ggagacgggc 960 cggaacctca agaaggaggt cagccgggtg ctgtgcaagc ggtgcgcctt gcctccccaa 1020 ttgaaagaga tgaaaagcca ggaatcggct gcaggttcca aactagtcct tcggtgtgaa 1080 accagttctg aatactcctc tctcagattc aagtggttca agaatgggaa tgaattgaat 1140 cgaaaaaaca aaccacaaaa tatcaagata caaaaaaagc cagggaagtc agaacttcgc 1200 attaacaaag catcactggc tgattctgga gagtatatgt gcaaagtgat cagcaaatta 1260 ggaaatgaca gtgcctctgc caatatcacc atcgtggaat caaacgctac atctacatcc 1320 accactggga caagccatct tgtaaaatgt gcggagaagg agaaaacttt ctgtgtgaat 1380 ggaggggagt gcttcatggt gaaagacctt tcaaacccct cgagatactt gtgcaagtgc 1440 ccaaatgagt ttactggtga tcgctgccaa aactacgtaa tggccagctt ctacagtacg 1500 tccactccct ttctgtctct gcctgaatag gagcatgctc agttggtgct gctttcttgt 1560 tgccgcatct cccctcagat tccacctaga gctagatgtg tcttaccaga tctaatattg 1620 actgcctctg cctgtcgcat gagaacatta acaaaagcaa ttgtattact tcctctgttc 1680 gcgactagtt ggctctgaga tactaatagg tgtgtgaggc tccggatgtt tctggaattg 1740 atattgaatg atgtgataca aattgatagt caatatcaag cagtgaaata tgataataaa 1800 ggcatttcaa agtctcactt ttattgataa aataaaaatc attctactga acagtccatc 1860 ttctttatac aatgaccaca tcctgaaaag ggtgttgcta agctgtaacc gatatgcact 1920 tgaaatgatg gtaagttaat tttgattcag aatgtgttat ttgtcacaaa taaacataat 1980 aaaagg                                                            1986 <210>72 <211>2003 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(31) <223>可能是任何核酸 <220> <221>不确定 <222>(32) <223>可能是任何核酸 <400>72 ggaattcctt tttttttttt tttttttctt nntttttttt tgcccttata cctcttcgcc 60 tttctgtggt tccatccact tcttccccct cctcctccca taaacaactc tcctacccct 120 gcacccccaa taaataaata aaaggaggag ggcaaggggg gaggaggagg agtggtgctg 180 cgaggggaag gaaaagggag gcagcgcgag aagagccggg cagagtccga accgacagcc 240 agaagcccgc acgcacctcg caccatgaga tggcgacgcg ccccgcgccg ctccgggcgt 300 cccggccccc gggcccagcg ccccggctcc gccgcccgct cgtcgccgcc gctgccgctg 360 ctgccactac tgctgctgct ggggaccgcg gccctggcgc cgggggcggc ggccggcaac 420 gaggcggctc ccgcgggggc ctcggtgtgc tactcgtccc cgcccagcgt gggatcggtg 480 caggagctag ctcagcgcgc cgcggtggtg atcgagggaa aggtgcaccc gcagcggcgg 540 cagcaggggg cactcgacag gaaggcggcg gcggcggcgg gcgaggcagg ggcgtggggc 600 ggcgatcgcg agccgccagc cgcgggccca cgggcgctgg ggccgcccgc cgaggagccg 660 ctgctcgccg ccaacgggac cgtgccctct tggcccaccg ccccggtgcc cagcgccggc 720 gagcccgggg aggaggcgcc ctatctggtg aaggtgcacc aggtgtgggc ggtgaaagcc 780 gggggcttga agaaggactc gctgctcacc gtgcgcctgg ggacctgggg ccaccccgcc 840 ttcccctcct gcgggaggct caaggaggac agcaggtaca tcttcttcat ggagcccgac 900 gccaacagca ccagccgcgc gccggccgcc ttccgagcct ctttcccccc tctggagacg 960 ggccggaacc tcaagaagga ggtcagccgg gtgctgtgca agcggtgcgc cttgcctccc 1020 caattgaaag agatgaaaag ccaggaatcg gctgcaggtt ccaaactagt ccttcggtgt 1080 gaaaccagtt ctgaatactc ctctctcaga ttcaagtggt tcaagaatgg gaatgaattg 1140 aatcgaaaaa acaaaccaca aaatatcaag atacaaaaaa agccagggaa gtcagaactt 1200 cgcattaaca aagcatcact ggctgattct ggagagtata tgtgcaaagt gatcagcaaa 1260 ttaggaaatg acagtgcctc tgccaatatc accatcgtgg aatcaaacgc tacatctaca 1320 tccaccactg ggacaagcca tcttgtaaaa tgtgcggaga aggagaaaac tttctgtgtg 1380 aatggagggg agtgcttcat ggtgaaagac ctttcaaacc cctcgagata cttgtgcaag 1440 tgcccaaatg agtttactgg tgatcgctgc caaaactacg taatggccag cttctacagt 1500 acgtccactc cctttctgtc tctgcctgaa taggagcatg ctcagttggt gctgctttct 1560 tgttgctgca tctcccctca gattccacct agagctagat gtgtcttacc agatctaata 1620 ttgactgcct ctgcctgtcg catgagaaca ttaacaaaag caattgtatt acttcctctg 1680 ttcgcgacta gttggctctg agatactaat aggtgtgtga ggctccggat gtttctggaa 1740 ttgatattga atgatgtgat acaaattgat agtcaatatc aagcagtgaa atatgataat 1800 aaaggcattt caaagtctca cttttattga taaaataaaa atcattctac tgaacagtcc 1860 atcttcttta tacaatgacc acatcctgaa aagggtgttg ctaagctgta accgatatgc 1920 acttgaaatg atggtaagtt aattttgatt cagaatgtgt tatttgtcac aaataaacat 1980 aataaaagga aaaaaaaaaa aaa                                         2003 <210>73 <211>957 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(809) <223>可能是任何核酸 <220> <221>不确定 <222>(810) <223>可能是任何核酸 <220> <221>不确定 <222>(811) <223>可能是任何核酸 <400>73 tctcgcccca actttttccc ccgcgctccg cagcagcagc agcagcagca gcagcagcag 60 caaaatggca gacctcttca gcggactcgt gggcggcgtc gtcggcgctg ttgctgcagc 120 agatttgcct gcggagggcg agagggcccc ccgccccgcc cccggcactg cctggacttg 180 ctgctgcagc aaactgcaag aaggggcccg cgagctggag ggttttgtgc agcagctgag 240 ttttgttgca gggaagctgg cctgctgcct gcgggtgggg gcggagcagc tggcgcgctg 300 cgctgcggag gggcggctgc ccagcagcag cagcagcagc agctgctgcg cgctgctgca 360 gctcgagaag caggacctcg agcagagcct cgaggccggc aagcagggcg cggagtgcct 420 cttgaggagc agcaaactgg ccctcgaggc cctcctcgag ggggcccgcg ttgcagcaac 480 gcggggtttg ctgctggtcg agagcagcaa agacacggtg ctgcgcagca ttccccacac 540 ccaggagaag ctggcccagg cctacagttc tttcctgcgg ggctaccagg gggcagcagc 600 ggggaggtct ctgggctacg gggcccctgc tgctgcttac ggccagcagc agcagcccag 660 cagctacggg gcgccccccg cctccagcca gcagccctcc ggcttcttct ggtagccctg 720 cagcagcagc agcagcagca gcagcagcag cagcgcgggc ggcagccgcg gcggggccgg 780 ggcgccgctg cagcaacagc agcagccgnn ncggctagcg ccgcggagca ctcgcaggga 840 actccacagg cagcgggaga gcagcaggga cgagaagcag gtcatgtagc gcaggcagca 900 gcgccagctg cagcagcagc agcagcagca gcagcagcag cagcagctcc tgcaccg    957 <210>74 <211>957 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(809) <223>可能是任何核酸 <220> <221>不确定 <222>(810) <223>可能是任何核酸 <220> <221>不确定 <222>(811) <223>可能是任何核酸 <400>74 tctcgcccca actttttccc ccgcgctccg cagcagcagc agcagcagca gcagcagcag 60 caaaatggca gacctcttca gcggactcgt gggcggcgtc gtcggcgctg ttgctgcagc 120 agatttgcct gcggagggcg agagggcccc ccgccccgcc cccggcactg cctggacttg 180 ctgctgcagc aaactgcaag aaggggcccg cgagctggag ggttttgtgc agcagctgag 240 ttttgttgca gggaagctgg cctgctgcct gcgggtgggg gcggagcagc tggcgcgctg 300 cgctgcggag gggcggctgc ccagcagcag cagcagcagc agctgctgcg cgctgctgca 360 gctcgagaag caggacctcg agcagagcct cgaggccggc aagcagggcg cggagtgcct 420 cttgaggagc agcaaactgg ccctcgaggc cctcctcgag ggggcccgcg ttgcagcaac 480 gcggggtttg ctgctggtcg agagcagcaa agacacggtg ctgcgcagca ttccccacac 540 ccaggagaag ctggcccagg cctacagttc tttcctccgg ggctaccagg gggcagcagc 600 ggggaggtct ctgggctacg gggcccctgc tgctgcttac ggccagcagc agcagcccag 660 cagctacggg gcgccccccg cctccagcca gcagccctcc ggcttcttct ggtagccctg 720 cagcagcagc agcagcagca gcagcagcag cagcgcgggc ggcagccgcg gcggggccgg 780 ggcgccgctg cagcaacagc agcagccgnn ncggctagcg ccgcggagca ctcgcaggga 840 actccacagg cagcgggaga gcagcaggga cgagaagcag gtcatgtagc gcaggcagca 900 gcgccagctg cagcagcagc agcagcagca gcagcagcag cagcagctcc tgcaccg    957 <210>75 <211>1089 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <220> <221>不确定 <222>(376) <223>可能是任何核酸 <220> <221>不确定 <222>(377) <223>可能是任何核酸 <220> <221>不确定 <222>(847) <223>可能是任何核酸 <220> <221>不确定 <222>(848) <223>可能是任何核酸 <220> <221>不确定 <222>(849) <223>可能是任何核酸 <220> <221>不确定 <222>(850) <223>可能是任何核酸 <400>75 gaattccctc caactcttcg cgactctctc tctctcgccc caactttttc ccccgcgccc 60 cgcagcagca gcagcagcag cagcagcaaa atggcagacc tcttcagcgg actcgtgggc 120 ggcgtcgtcg gcgctgttgc tgcagcagat ttgcctgcgg agggcgagag ggccccccgc 180 cccgcccccg gcactgcctg gacttgctgc tgcagcaaac tgcaagaagg ggcccgcgag 240 ctggagggtt ttctgcagca gctgagtttt gttgcaggga agctggcctg ctgcctgcgg 300 gtgggggcgg agcagctggc gcgctgcgct gcggaggggc ggctgcccag cagcagcagc 360 agcagcagct gctgcnngct gctgcagctc gagaagcagg acctcgagca gagcctcgag 420 gccggcaagc agggcgcgga gtgcctcttg aggagcagca aactggccct cgaggccctc 480 ctcgaggggg cccgcgttgc agcaacgcgg ggtttgctgc tggtcgagag cagcaaagac 540 acggtgctgc gcagcattcc ccacacccag gagaagctgg ctcaggccta cagttctttc 600 ctgcggggct accagggggc agcagcgggg aggtctctgg gctacggggc ccctgctgct 660 gcttacggcc agcagcagca gcccagcagc tacggggcgc cccccgcctc cagccagcag 720 ccctccggct tcttctggta gccctgcagc agcagcagca gcagcagcag cagcagcagc 780 ggcggcggca gccgcggcgg ggccggggcg ccgctgcagc aacagcagca gccgcggcgg 840 ctagcgnnnn gagcactcgc agggaactcc acaggcagcg ggagagcagc agggacgaga 900 agcaggtcta tgtagcgcag gcagcagcgc cagctgcagc agcagcagca gcagcagcag 960 cagcagcagc agctcctgca ccgcagcgtt gtgtcattta ttacgttggc agctctgagg 1020 cctcggcgca gccaacgcgc ctcaggtatc tttcagactc ttttctctaa ggtcttccag 1080 acggaattc                                                         1089 <210>76 <211>1985 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>76 ccccgagctt tcggcacctc tgccgggtgg taccgagcct tcccggcgcc ccctcctctc 60 ctcccaccgg cctgcccttc cccgcgggac tatcgccccc acgtttccct cagccctttt 120 ctcccccggc cgagccgcgg cggcagcagc agcagcagca gcagcaggag gaggagcccg 180 gtggcggcgg tggccgggga gcccatggcg tacagtcaag gaggcggcaa aaaaaaagtc 240 tgctactact acgacggtga tattggaaat tattattatg gacagggtca tcccatgaag 300 cctcatagaa tccgcatgac ccataacttg ctgttaaatt atggcttata cagaaaaatg 360 gaaatatata ggccccataa agccactgcc gaagaaatga caaaatatca cagtgatgag 420 tatatcaaat ttctacggtc aataagacca gataacatgt ctgagtatag taagcagatg 480 catatattta atgttggaga agattgtcca gcgtttgatg gactctttga gttttgtcag 540 ctctcaactg gcggttcagt tgctggagct gtgaagttaa accgacaaca gactgatatg 600 gctgttaatt gggctggagg attacatcat gctaagaaat acgaagcatc aggattctgt 660 tacgttaatg atattgtgct tgccatcctt gaattactaa agtatcatca gagagtctta 720 tatattgata tagatattca tcatggtgat ggtgttgaag aagcttttta tacaacagat 780 cgtgtaatga cggtatcatt ccataaatat ggggaatact ttcctggcac aggagacttg 840 agggatattg gtgctggaaa aggcaaatac tatgctgtca attttccaat gtgtgatggt 900 atagatgatg agtcatatgg gcagatattt aagcctatta tctcaaaggt gatggagatg 960 tatcaaccta gtgctgtggt attacagtgt ggtgcagact cattatctgg tgatagactg 1020 ggttgtttca atctaacagt caaaggtcat gctaaatgtg tagaagttgt aaaaactttt 1080 aacttaccat tactgatgct tggaggaggt ggctacacaa tccgtaatgt tgctcgatgt 1140 tggacatatg agactgcagt tgcccttgat tgtgagattc ccaatgagtt gccatataat 1200 gattactttg agtattttgg accagacttc aaactgcata ttagtccttc aaacatgaca 1260 aaccagaaca ctccagaata tatggaaaag ataaaacagc gtttgtttga aaatttgcgc 1320 atgttacctc atgcacctgg tgtccagatg caagctattc cagaagatgc tgttcatgaa 1380 gacagtggag atgaagatgg agaagatcca gacaagagaa tttctattcg agcatcagac 1440 aagcggatag cttgtgatga agaattctca gattctgagg atgaaggaga aggaggtcga 1500 agaaatgtgg ctgatcataa gaaaggagca aagaaagcta gaattgaaga agataagaaa 1560 gaaacagagg acaaaaaaac agacgttaag gaagaagata aatccaagga caacagtggt 1620 gaaaaaacag ataccaaagg aaccaaatca gaacagctca gcaacccctg aatttgacag 1680 tctcaccaat ttcagaaaat cattaaaaag aaaatattga aaggaaaatg ttttcttttt 1740 gaagacttct ggcttcattt tatactactt tggcatggac tgtatttatt ttcaaatggg 1800 actttttcgt ttttgttttt ctgggcaagt tttattgtga gattttctaa ttatgaagca 1860 aaatttcttt tctccaccat gctttatgtg atagtattta aaattgatgt gagttattat 1920 gtcaaaaaaa ctgatctatt aaagaagtaa ttggcctttc tgagctgaaa aaaaaaaaaa 1980 aaaag                                                             1985 <210>77 <211>476 <212>DNA <213>未知 <220> <223>未知生物描述:未知 <400>77 ccaccctcct ccccctcccc cggccacttc gctaacttgg tggctgttgt gatgcgtatt 60 cctgtagatc cgagcaccag ccggcgcttc agccccccct ccagcagcct gcagcccggc 120 aaaatgagcg acgtgagccc ggtggtggct gcgcaacagc agcagcaaca gcagcagcag 180 caacagcagc agcagcagca gcaacagcag cagcagcagc aggaggcggc ggcggcggct 240 gcggcggcag cggcggctgc ggcggcggca gctgcagtgc cccggttgcg gccgccccac 300 gacaaccgca ccatggtgga gatcatcgcc gaccacccgg ccgaactcgt ccgcaccgac 360 agccccaact tcctgtgctc ggtgctgccc tcgcactggc gctgcaacaa gaccctgccc 420 gtggccttca aggtaagagg ctaccccgcc ccccgccccc ggccgggagc ggcgga     476 <210>78 <211>24 <212>DNA <213>人工序列 <220> <223> 人工序列描述:DNA引物 <400>78 gcattttgga tccgcctttt catg                                        24 <210>79 <211>22 <212>DNA <213>人工序列 <220> <223>人工序列描述:DNA引物 <400>79 gttgtgtgct gcagattgtt cc                                   22 <210>80 <211>21 <212>DNA <213>人工序列 <220> <223>人工序列描述:DNA引物 <400>80 gaaaaatggg gatccgaggt g                                    21 <210>81 <211>20 <212>DNA <213>人工序列 <220> <223>人工序列描述:DNA引物 <400>81 gcaggagaat tccgtccatg                                      20 <210>82 <211>5 <212>PRT <213>人 <220> <221>不确定 <222>(3) <223>可以是任何氨基酸 <400>82 Trp Ser Xaa Trp Ser   1               5 <210>83 <211>6 <212>PRT <213>人 <400>83 Cys Ser Val Thr Cys Gly   1               5 <210>84 <211>5 <212>PRT <213>人 <220> <221>不确定 <222>(4) <223>可以是任何氨基酸 <400>84 Gly Cys Gln Xaa Arg   1               5 <210>85 <211>733 <212>DNA <213>人 <400>85 gggatccgga gcccaaatct tctgacaaaa ctcacacatg cccaccgtgc ccagcacctg 60 aattcgaggg tgcaccgtca gtcttcctct tccccccaaa acccaaggac accctcatga 120 tctcccggac tcctgaggtc acatgcgtgg tggtggacgt aagccacgaa gaccctgagg 180 tcaagttcaa ctggtacgtg gacggcgtgg aggtgcataa tgccaagaca aagccgcggg 240 aggagcagta caacagcacg taccgtgtgg tcagcgtcct caccgtcctg caccaggact 300 ggctgaatgg caaggagtac aagtgcaagg tctccaacaa agccctccca acccccatcg 360 agaaaaccat ctccaaagcc aaagggcagc cccgagaacc acaggtgtac accctgcccc 420 caccccggga tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct 480 atccaagcga catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga 540 ccacgcctcc cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg 600 acaagagcag gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc 660 acaaccacta cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgc 720 gactctagag gat                                                    733 <210>86 <211>86 <212>DNA <213>人工序列 <220> <223>人工序列描述:DNA引物 <400>86 gcgcctcgag atttccccga aatctagatt tccccgaaat gatttccccg aaatgatttc 60 cccgaaatat ctgccatctc aattag                                      86 <210>87 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列描述:DNA引物 <400>87 gcggcaagct ttttgcaaag cctaggc                                     27 <210>88 <211>271 <212>DNA <213>人工序列 <220> <223>人工序列描述:PCR片段 <400>88 ctcgagattt ccccgaaatc tagatttccc cgaaatgatt tccccgaaat gatttccccg 60 aaatatctgc catctcaatt agtcagcaac catagtcccg cccctaactc cgcccatccc 120 gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa ttttttttat 180 ttatgcagag gccgaggccg cctcggcctc tgagctattc cagaagtagt gaggaggctt 240 ttttggaggc ctaggctttt gcaaaaagct t                                271 <210>89 <211>32 <212>DNA <213>人 <400>89 gcgctcgagg  gatgacagcg atagaacccc gg                               32 <210>90 <211>31 <212>DNA <213>人 <400>90 gcgaagcttc  gcgactcccc ggatccgcct c                                31 <210>91 <211>12 <212>DNA <213>人 <400>91 ggggactttc cc                                                      12 <210>92 <211>73 <212>DNA <213>人 <400>92 gcggcctcga ggggactttc ccggggactt tccggggact ttccgggact ttccatcctg  60 ccatctcaat tag                                                     73 <210>93 <211>27 <212>DNA <213>人工序列 <220> <223> 人工序列描述:PCR片段 <400>93 gcggcaagct ttttgcaaag cctaggc                                      27

Claims (19)

1.含选自由下述组成之组的多核苷酸的分离核酸分子:
(a)编码含SEQ ID NO:2中第1-950位氨基酸之多肽的多核苷酸;
(b)编码含SEQ ID NO:2中第2-950位氨基酸之多肽的多核苷酸;
(c)编码含SEQ ID NO:2中第29-950位氨基酸之多肽的多核苷酸;
(d)编码含SEQ ID NO:2中第30-950位氨基酸之多肽的多核苷酸;
(e)含编码METH1多肽之核苷酸序列的多核苷酸,该多肽具有由 ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列;
(f)含编码成熟METH1多肽之核苷酸序列的多核苷酸,该多肽具有 由ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列;
(g)编码含SEQ ID NO:4中第1-890位氨基酸之多肽的多核苷酸;
(h)编码含SEQ ID NO:4中第2-890位氨基酸之多肽的多核苷酸;
(i)编码含SEQ ID NO:4中第24-890位氨基酸之多肽的多核苷酸;
(j)编码含SEQ ID NO:4中第112-890位氨基酸之多肽的多核苷酸;
(k)含编码METH2多肽之核苷酸序列的多核苷酸,该多肽具有由 ATCC保藏号209582中所含cDNA克隆编码的氨基酸序列;
(l)含编码成熟METH2多肽之核苷酸序列的多核苷酸,该多肽具有 由ATCC保藏号209582中所含cDNA克隆编码的氨基酸序列;
(m)通过改变(a)、(b)、(c)、(d)、(e)、(f)、(g)、(h)、(i)、(j)、 (k)或(l)的多核苷酸而产生的多核苷酸变体,其中:
  (i)所说的改变包括核苷酸插入、缺失或取代,或它们的任何组 合,并且
  (ii)改变的数目不超过未改变多核苷酸中总核苷酸数的5%;
(n)编码SEQ ID NO:2中第235-459位氨基酸的多核苷酸;
(o)编码SEQ ID NO:2中第460-544位氨基酸的多核苷酸;
(p)编码SEQ ID NO:2中第545-598位氨基酸的多核苷酸;
(q)编码SEQ ID NO:2中第841-894位氨基酸的多核苷酸;
(r)编码SEQ ID NO:2中第895-934位氨基酸的多核苷酸;
(s)编码SEQ ID NO:2中第536-613位氨基酸的多核苷酸;
(t)编码SEQ ID NO:2中第549-563位氨基酸的多核苷酸;
(u)编码SEQ ID NO:4中第214-439位氨基酸的多核苷酸;
(v)编码SEQ ID NO:4中第440-529位氨基酸的多核苷酸;
(w)编码SEQ ID NO:4中第530-583位氨基酸的多核苷酸;
(x)编码SEQ ID NO:4中第837-890位氨基酸的多核苷酸;
(y)编码SEQ ID NO:4中第280-606位氨基酸的多核苷酸;
(z)编码SEQ ID NO:4中第529-548位氨基酸的多核苷酸;
(aa)  与(a)、(b)、(c)、(d)、(e)、(f)、(g)、(h)、(i)、(j)、 (k)、(l)、(m)、(n)、(o)、(p)、(q)、(r)、(s)、(t)、(u)、(v)、(w)、 (x)、(y)或(z)中任何核苷酸序列互补的核苷酸序列。
2.包含编码SEQ ID NO:2中METH1多肽或SEQ ID NO:4中METH2多 肽带表位部分的氨基酸序列的多核苷酸的分离核酸分子。
3.含有选自由下述组成之组的多核苷酸的分离核酸分子:
(a)SEQ ID NO:1编码区的50个连续核苷酸,条件是所说的核苷酸 序列不是SEQ ID No:14-41任何之一或其任何亚片段;和
(b)与(a)中核苷酸序列互补的核苷酸序列。
4.含有选自由下述组成之组的多核苷酸的分离核酸分子:
  (a)SEQ ID NO:3编码区的50个连续核苷酸,条件是所说的核苷酸序 列不是SEQ ID No:19-22、24、42-77或其任何亚片段;和
  (b)与(a)中核苷酸序列互补的核苷酸序列。
5.制备重组载体的方法,包括将权利要求1的分离核酸分子插入载 体,与启动子有效连接。
6.由权利要求5的方法生产的重组载体。
7.制备重组宿主细胞的方法,包括将权利要求6的重组载体引入宿 主细胞。
8.用权利要求7的方法生产的重组宿主细胞。
9.生产METH1或METH2多肽的重组方法,包括在使所说多肽表达的 条件下培养权利要求8的重组宿主细胞和回收该多肽。
10.含有选自由下述组成之组的氨基酸序列的分离多肽:
(a)SEQ ID NO:2中第1-950位氨基酸;
(b)SEQ ID NO:2中第2-950位氨基酸;
(c)SEQ ID NO:2中第29-950位氨基酸;
(d)SEQ ID NO:2中第30-950位氨基酸;
(e)具有由ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列 的METH1多肽的氨基酸序列;
(f)具有由ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列 的成熟METH1多肽的氨基酸序列;
(g)SEQ ID NO:4中第1-890位氨基酸;
(h)SEQ ID NO:4中第2-890位氨基酸;
(i)SEQ ID NO:4中第24-890位氨基酸;
(j)SEQ ID NO:4中第112-890位氨基酸;
(k)具有由ATCC保藏号209582中所含METH2 cDNA克隆编码的氨基 酸序列的METH2多肽的氨基酸序列;
(l)具有由ATCC保藏号209582中所含METH2 cDNA克隆编码的氨基 酸序列的成熟METH2多肽的氨基酸序列;
(m)通过改变(a)、(b)、(c)、(d)、(e)、(f)、(g)、(h)、(i)、(j)、 (k)或(l)的多肽而产生的多肽变体的氨基酸序列,其中:
  (i)所说的改变包括氨基酸插入、缺失或取代,或它们的任何组 合,并且
  (ii)改变的数目不超过未改变氨基酸序列中总氨基酸数的5%;
(m)SEQ ID NO:2中第235-459位氨基酸;
(n)SEQ ID NO:2中第460-544位氨基酸;
(o)SEQ ID NO:2中第545-598位氨基酸;
(p)SEQ ID NO:2中第841-894位氨基酸;
(q)SEQ ID NO:2中第895-934位氨基酸;
(r)SEQ ID NO:2中第536-613位氨基酸;
(s)SEQ ID NO:2中第549-563位氨基酸;
(t)SEQ ID NO:4中第214-439位氨基酸;
(u)SEQ ID NO:4中第440-529位氨基酸;
(v)SEQ ID NO:4中第530-583位氨基酸;
(w)SEQ ID NO:4中第837-890位氨基酸;
(x)SEQ ID NO:4中第280-606位氨基酸;
(y)SEQ ID NO:4中第529-548位氨基酸;
(z)(a)、(b)、(c)、(d)、(e)、(f)、(g)、(h)、(i)、(j)、(k)、 (l)、(m)、(n)、(o)、(p)、(q)、(r)、(s)、(t)、(u)、(v)、(w)、(x) 或(y)中任何多肽的带表位部分的氨基酸序列。
11.权利要求10的分离多肽,其产生于重组宿主细胞中。
12.权利要求11的分离多肽,其中所说重组宿主细胞是哺乳动物细 胞。
13.含编码METH1或METH2多肽之多核苷酸的分离核酸分子,其中除 有1-50个保守氨基酸取代外,所说多肽含有选自由下述组成之组的序列:
(a)SEQ ID NO:2中约第1-950位氨基酸;
(b)SEQ ID NO:2中约第2-950位氨基酸;
(c)SEQ ID NO:2中约第29-950位氨基酸;
(d)SEQ ID NO:2中约第30-950位氨基酸;
(e)具有由ATCC保藏号209581中所含cDNA克隆编码的METH1多肽 的氨基酸序列;
(f)具有由ATCC保藏号209581中所含cDNA克隆编码的成熟METH1 多肽的氨基酸序列;
(g)SEQ ID NO:4中约第1-890位氨基酸;
(h)SEQ ID NO:4中约第2-890位氨基酸;
(i)SEQ ID NO:4中约第24-890位氨基酸;
(j)SEQ ID NO:4中约第112-890位氨基酸;
(k)具有由ATCC保藏号209582中所含cDNA克隆编码的METH2多肽 的氨基酸序列;
(l)具有由ATCC保藏号209582中所含cDNA克隆编码的成熟METH2 多肽的氨基酸序列。
14.一种分离多肽,其中除有1-50个保守氨基酸取代外,所说多肽 具有选自由下述组成之组的序列:
(a)SEQ ID NO:2中约第1-950位氨基酸;
(b)SEQ ID NO:2中约第2-950位氨基酸;
(c)SEQ ID NO:2中约第29-950位氨基酸;
(d)SEQ ID NO:2中约第30-950位氨基酸;
(e)具有由ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列 的METH1多肽的氨基酸序列;
(f)具有由ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列 的成熟METH1多肽的氨基酸序列;
(g)SEQ ID NO:4中约第1-890位氨基酸;
(h)SEQ ID NO:4中约第2-890位氨基酸;
(i)SEQ ID NO:4中约第24-890位氨基酸;
(j)SEQ ID NO:4中约第112-890位氨基酸;
(k)具有由ATCC保藏号209582中所含cDNA克隆编码的氨基酸序列 的METH2多肽的氨基酸序列;
(l)具有由ATCC保藏号209582中所含cDNA克隆编码的氨基酸序列 的成熟METH2多肽的氨基酸序列;
(m)(a)、(b)、(c)、(d)、(e)、(f)、(g)、(h)、(i)、(j)、(k) 或(l)中任何多肽的带表位部分的氨基酸序列。
15.含有与选自由下述组成之组的多核苷酸至少95%相同的多核苷 酸的分离核酸分子:
(a)编码含SEQ ID NO:2中第1-950位氨基酸之多肽的多核苷酸;
(b)编码含SEQ ID NO:2中第2-950位氨基酸之多肽的多核苷酸;
(c)编码含SEQ ID NO:2中第29-950位氨基酸之多肽的多核苷酸;
(d)编码含SEQ ID NO:2中第30-950位氨基酸之多肽的多核苷酸;
(e)含编码METH1多肽之核苷酸序列的多核苷酸,该多肽具有由 ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列;
(f)含编码成熟METH1多肽之核苷酸序列的多核苷酸,该多肽具有 由ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列;
(g)编码含SEQ ID NO:4中第1-890位氨基酸之多肽的多核苷酸;
(h)编码含SEQ ID NO:4中第2-890位氨基酸之多肽的多核苷酸;
(i)编码含SEQ ID NO:4中第24-890位氨基酸之多肽的多核苷酸;
(j)编码含SEQ ID NO:4中第112-890位氨基酸之多肽的多核苷酸;
(k)含编码METH2多肽之核苷酸序列的多核苷酸,该多肽具有由 ATCC保藏号209582中所含cDNA克隆编码的氨基酸序列;
(l)含编码成熟METH2多肽之核苷酸序列的多核苷酸,该多肽具有 由ATCC保藏号209582中所含cDNA克隆编码的氨基酸序列;和
(m)与(a)、(b)、(c)、(d)、(e)、(f)、(g)、(h)、(i)、(j)、(k) 或(l)中任何核苷酸序列互补的核苷酸序列,其中
所说的相同性百分比是用FASTDB计算机软件计算的,参数如下: 矩阵=Unitary,k-tuple=4,错配罚分=1,连接罚分=30,随机化分组长度 =0,截断分=1,缺口罚分=5,缺口大小罚分=0.05,窗口大小=500或指示核 苷酸序列长度,取其中较短者。
16.含有与具有选自由下述组成之组的氨基酸序列的多肽至少95%相 同的多肽的分离多肽:
(a)SEQ ID NO:2中约第1-950位氨基酸;
(b)SEQ ID NO:2中约第2-950位氨基酸;
(c)SEQ ID NO:2中约第29-950位氨基酸;
(d)SEQ ID NO:2中约第30-950位氨基酸;
(e)具有由ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列 的METH1多肽的氨基酸序列;
(f)具有由ATCC保藏号209581中所含cDNA克隆编码的氨基酸序列 的成熟METH1多肽的氨基酸序列;
(g)SEQ ID NO:4中约第1-890位氨基酸;
(h)SEQ ID NO:4中约第2-890位氨基酸;
(i)SEQ ID NO:4中约第24-890位氨基酸;
(j)SEQ ID NO:4中约第112-890位氨基酸;
(k)具有由ATCC保藏号209582中所含cDNA克隆编码的氨基酸序列 的METH2多肽的氨基酸序列;
(l)具有由ATCC保藏号209582中所含cDNA克隆编码的氨基酸序列 的成熟METH2多肽的氨基酸序列;
其中
所说的相同性百分比是用FASTDB计算机软件计算的,参数如下:矩 阵=PAM O,k-tuple=2,错配罚分=1,连接罚分=20,随机化分组长度=0, 截断分=1,缺口罚分=5,缺口大小罚分=0.05,窗口大小=500或指示氨基 酸序列长度,取其中较短者。
17.抑制个体中血管生成的方法,包括对该个体给予有效量的权利要 求10的多肽。
18.含SEQ ID NO:2中m-n氨基酸序列的多肽,其中m是1-950的整 数,而n是10-950的整数。
19.含SEQ ID NO:4中m-n氨基酸序列的多肽,其中m是1-890的整 数,而n是10-890的整数。
CN998034959A 1998-01-23 1999-01-22 Meth1和meth2多核苷酸及多肽 Pending CN1292796A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US7229898P 1998-01-23 1998-01-23
US60/072,298 1998-01-23
US9853998P 1998-08-28 1998-08-28
US60/098,539 1998-08-28

Publications (1)

Publication Number Publication Date
CN1292796A true CN1292796A (zh) 2001-04-25

Family

ID=26753215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN998034959A Pending CN1292796A (zh) 1998-01-23 1999-01-22 Meth1和meth2多核苷酸及多肽

Country Status (9)

Country Link
EP (1) EP1049708A4 (zh)
JP (1) JP2002501077A (zh)
KR (1) KR20010086224A (zh)
CN (1) CN1292796A (zh)
AU (1) AU766787B2 (zh)
CA (1) CA2319109A1 (zh)
MX (1) MXPA00007165A (zh)
NZ (1) NZ505855A (zh)
WO (1) WO1999037660A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999007850A1 (en) 1997-08-06 1999-02-18 Millennium Biotherapeutics, Inc. Tango-71, tango-73, tango-74, tango-76, and tango-83 nucleic acid molecules and polypeptides
DE19806581A1 (de) * 1998-02-17 1999-10-21 Forschungszentrum Juelich Gmbh Sequenzen eines Ih-Ionenkanals und deren Verwendung
US6649377B1 (en) * 1999-05-10 2003-11-18 Syntex (U.S.A.) Llc Human aggrecanase and nucleic acid compositions encoding the same
AU4851900A (en) * 1999-06-09 2000-12-28 Genentech Inc. Compositions and methods for the treatment of tumor
US6395889B1 (en) * 1999-09-09 2002-05-28 Millennium Pharmaceuticals, Inc. Nucleic acid molecules encoding human protease homologs
EP1892250A3 (en) * 2000-01-31 2008-09-17 Munin Corporation CYR61 compositions and methods
AU2001247897A1 (en) * 2000-03-31 2001-10-15 Bayer Corporation Protein having activity as an angiogenesis modulator
JP2002330761A (ja) * 2000-04-26 2002-11-19 Pfizer Prod Inc Adamtsポリペプチド、それをコードする核酸、及びその使用
AU2001273127A1 (en) * 2000-06-29 2002-01-14 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
IL158293A0 (en) 2001-04-10 2004-05-12 Agensys Inc Nucleic acid and corresponding protein entitled 158p3d2 and pharmaceutical compositions containing the same
WO2003050268A2 (en) 2001-12-12 2003-06-19 Aventis Pasteur Limited Enhancement of the immune response using cd36-binding domain
US7700108B2 (en) 2002-09-27 2010-04-20 Dainippon Sumitomo Pharma Co., Ltd. Tumor antigen protein and use thereof
CN102257138B (zh) 2008-10-20 2013-06-19 大日本住友制药株式会社 肿瘤抗原肽及其用途

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6565858B2 (en) * 1997-06-03 2003-05-20 Kureha Chemical Industry Co., Ltd. Human ADAMTS-1 protein and pharmaceutical composition
WO1999007850A1 (en) * 1997-08-06 1999-02-18 Millennium Biotherapeutics, Inc. Tango-71, tango-73, tango-74, tango-76, and tango-83 nucleic acid molecules and polypeptides

Also Published As

Publication number Publication date
WO1999037660A1 (en) 1999-07-29
MXPA00007165A (es) 2002-06-21
AU2464199A (en) 1999-08-09
KR20010086224A (ko) 2001-09-10
AU766787B2 (en) 2003-10-23
EP1049708A1 (en) 2000-11-08
EP1049708A4 (en) 2002-09-04
JP2002501077A (ja) 2002-01-15
WO1999037660A9 (en) 1999-10-14
CA2319109A1 (en) 1999-07-29
NZ505855A (en) 2005-01-28

Similar Documents

Publication Publication Date Title
CN1214050A (zh) 人肿瘤坏死因子δ和ε
CN1299407A (zh) 血管内皮生长因子2
CN1292796A (zh) Meth1和meth2多核苷酸及多肽
CN1147505C (zh) G蛋白受体htnad29
JP2003500041A (ja) Meth1およびmeth2ポリヌクレオチドおよびポリペプチド
WO2003020005A2 (en) Lp mammalian proteins; related reagents
CA2298852A1 (en) 83 human secreted proteins
CN1157410C (zh) 人g蛋白偶联受体(hetgq23)
WO1999040184A1 (en) Dendritic enriched secreted lymphocyte activation molecule
CN1304410C (zh) 肿瘤坏死因子-γ
CN1099423C (zh) 人神经肽受体
CN1414021A (zh) 成纤维细胞生长因子13的抗体、拮抗剂及激动剂
CN1174572A (zh) 金属蛋白酶-4的人组织抑制剂
CN1703422A (zh) Meth1和meth2多核苷酸及多肽
CN1271007A (zh) 一种新的人几丁质酶蛋白及其编码序列
CN1185159A (zh) 人血管内皮生长因子3
CN1414100A (zh) 成纤维细胞生长因子13
AU2004200046A1 (en) Meth1 and Meth2 Polynucleotides and Polypeptides
CN1495258A (zh) 金属蛋白酶-4的人组织抑制剂
CN1185175A (zh) 成纤维细胞生长因子13
CN1269365A (zh) 一种新的人细胞凋亡相关蛋白及其编码序列
CN1270222A (zh) 一种新的人辅酶ⅰ亚基异构体蛋白及其编码序列
CN1269416A (zh) 一种新的人爱滋病毒周转蛋白异构体蛋白及其编码序列
CN1271009A (zh) 一种新的人二酰甘油焦磷酸盐磷酸酶蛋白及其编码序列
CN1267729A (zh) 一种新的人巨糖蛋白相关蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication