CN101297045A

CN101297045A - 肿瘤和组织的鉴定

Info

Publication number: CN101297045A
Application number: CNA200680026655XA
Authority: CN
Inventors: M·G·厄兰德; 马小骏
Original assignee: Aviaradx Inc
Current assignee: Biotheranostics Inc
Priority date: 2005-06-03
Filing date: 2006-06-02
Publication date: 2008-10-29
Also published as: EP2365092A1; WO2006132971A2; JP2008545431A; CA2610752A1; AU2006255282A1; EP1899484A2; WO2006132971A3; ES2550652T3; US20070020655A1; US20170286596A1; US11430544B2; KR20080104113A; US20230023867A1; DK1899484T3; WO2006132971A9; EP1899484B1

Abstract

本发明提供了利用检测基因表达对获自临床对象的样品，例如福尔马林固定的石蜡包埋(FFPE)样品进行肿瘤分类或鉴定的方法。

Description

肿瘤和组织的鉴定

相关申请

本申请要求2005年6月3日提交的美国临时专利申请60/687,174的优先权，将其全文纳入本文作参考。

发明领域

本发明涉及利用基因表达对人肿瘤进行分类。可利用约5-49种与特定组织产生的肿瘤相关以及与特定肿瘤类型相关的表达序列的基因表达概况或模式进行此分类。本发明也提供约5-49种其表达与各种癌症的组织来源和肿瘤类型相关的特定基因序列的应用。可用所述基因表达概况，无论是核酸表达、蛋白质表达或其它表达形式均可用于测定含细胞的样品是否含有某组织类型或组织来源的肿瘤细胞，从而可更精确地鉴定获得该样品是对象的癌症及其治疗(效果)和预后。

发明概述

本发明涉及利用检测基因表达对获自临床对象的含细胞样品，例如福尔马林固定的石蜡包埋(FFPE)样品以及未经或经过很少处理(如只是储存于降低的非冷冻温度下)的新鲜样品和冻存样品中的肿瘤进行分类或鉴定。因此，本发明能使必须进行临床FFPE样品检验的医院和其它实验室在其面临的现实条件下进行肿瘤分类。所述样品可以是原发肿瘤样品或另一肿瘤转移所产生的肿瘤。或者，样品可以是细胞学样品，例如但不限于血液样品中的细胞。在肿瘤样品的一些情况中，所述肿瘤尚未经传统病理学技术分类，而是经初步分类(但需要验证)，或者已归类为“未知原发癌症”(CUP)或“未知来源的肿瘤”(TUO)或“未知的原发肿瘤”。鉴于用标准技术进行分类估计存在5-10％的错误，因而特别需要验证。因此，本发明可视作提供了癌症鉴定的方法或CID。

在本发明的第一方面，利用约5-49种表达序列的基因表达概况或模式进行此分类。可利用基因表达概况，无论是核酸表达、蛋白质表达或基因表达的其它标记均可用于测定含细胞的样品是否含有某组织类型或组织来源的肿瘤细胞，从而可更精确地鉴定获得该样品的对象的癌症及其治疗(效果)和预后。

在一些实施方案中，本发明用于对临床上至少34种或至少39种肿瘤进行显著精确地分类。本发明部分依据惊人且出乎意料地发现人基因组中约5-49种表达序列能以有意义方式对至少34种或至少39种肿瘤及其那些肿瘤亚组进行分类。换言之，本发明部分依据发现无需利用督导学习(supervised learning)即可鉴定其表达的与不同肿瘤类型相关的基因序列。因此，本发明部分基于认识到利用任意约5-49种表达序列，甚至这些表达序列的随机组合能将细胞分类为某组织或组织来源的肿瘤细胞，所以可用于分类。而且，对不同肿瘤类型进行分类需要的表达序列相对较少。根据序列的表达水平，表达序列与可分类的肿瘤类型数量之比约为1∶2-5∶2，或者更高，如本文所述。

在另一方面，本发明通过测定约5-49种转录序列的表达水平，然后将含细胞的样品分类为含有多种(两种以上)肿瘤类型的肿瘤细胞而将含细胞的样品分类为含某组织类型或来源的肿瘤细胞。为分类34种到39种肿瘤及其亚组，可利用少至任意约5种表达序列以有意义方式分类。本发明发现，所述表达序列无需是那些表达水平与任何一种肿瘤明显或高度相关(直接相关或通过与另一序列相关而间接相关)的序列。因此，在另一实施方案中，本发明利用其表达水平不与具体肿瘤样品的实际类型强烈相关的基因，例如所述约5-49种转录序列之一的表达水平。所有选择的基因可以是如此非相关的，或者只是这些基因的一部分，通常至少是90％、85％、75％、50％或25％可以是不相关的，以及属于上述任意两个百分点作为端点的某范围内的各部分可以不相关。

可通过测定基因序列的表达水平来实施本发明，所述序列无需根据其表达水平与待分类肿瘤类型的相关性而选择。因此，作为非限制性例子，这些基因序列无需根据其与肿瘤类型的相关性值或基于该相关性值的排序而选择。此外，可利用不一定与一种或多种用于分类的其它基因表达水平相关的基因表达水平来实施本发明。因此，在其它实施方案中，某表达序列的表达水平在分类中的功能与用于分类的至少一种其它基因表达水平能力相比不是多余的(即，独立于)。

可用本发明鉴定各种病例患者的癌症来源：包括但不限于：鉴定临床上癌症的来源。在一些实施方案中，通过对已知含有癌细胞，但其来源未知的含细胞样品进行分类作鉴定。在其它实施方案中，通过将含细胞样品分类为含有一种或多种癌细胞，然后鉴定各种癌细胞来源进行这种鉴定。在还有的实施方案中，用以前有癌症病史的对象样品来实施本发明，通过将细胞分类为以前来源的或新来源的癌症进行所述鉴定。其它实施方案包括在同一器官或组织中发现多种癌症时，用本发明测定各癌症的来源以及这些癌症是否是同一来源。

本发明也部分依据发现可用特定基因序列的表达水平对肿瘤类型进行分类比用基因序列随机组的表达水平更精确。在一个实施方案中，本发明利用人基因组中的第一组74种表达序列中约5-49种表达序列的表达水平可对至少39种肿瘤进行显著精确地分类。因此，本发明根据与所述至少39种肿瘤相关的约5-49种表达序列提供了基因表达模式(或概况或“签名”)的鉴定及其应用。本发明也利用这74种表达序列中约5-49种表达序列对所述39种肿瘤的亚组进行分类。表达序列与可根据序列表达水平进行分类的肿瘤类型数量(2-39)之比约为1∶2-5∶2，其精确度高于采用随机表达序列组时。根据肿瘤类型的数目，可实现75％-95％的精确度。

在另一实施方案中，本发明利用人基因组的第二组90种表达序列中约5-49种表达序列的表达水平可对至少39种肿瘤或其亚组进行显著精确地分类。第二组中的38种序列存在于第一组的74种序列中。第二组中的约5-49种序列可以和第一组的74种序列所述的相同方式使用。取决于肿瘤类型的数目，可实现约75％到约95％的精确度。

本发明也部分依据发现利用约5-49种表达序列对53种肿瘤(包括但不限于本文所述的34和39种类型)进行分类受限于某些肿瘤类型的可获得样品数。如下所述，精确度与各肿瘤类型的可获得样品数有关，故而通过增加各肿瘤类型(样品)的数目不难实现对其它肿瘤类型的分类。因此，虽然以在34或39种肿瘤以及所述34或39种肿瘤的亚组分类中的应用为例说明了本发明，但也可用约5-49种表达序列对含有其它肿瘤类型样品的所有肿瘤类型进行分类。因此，本发明也可用于对本文所述34或39种类型以外的肿瘤进行分类。

本发明依据一组源自不同组织或不同肿瘤类型的已知肿瘤细胞中所述基因序列的表达水平。无论采取核酸表达、蛋白质表达或其它表达形式，可将这些基因表达的概况(不同的已知肿瘤细胞/类型中所述基因序列的表达概况)与未知肿瘤样品中相同序列的表达水平作比较从而将样品鉴定为具体类型和/或具体来源或肿瘤细胞类型。本发明的优点在于(例如在临床上)可更精确地鉴定癌症进而治疗该癌症以及对获得该样品的对象作预后判断(包括存活率和/或治疗后癌症复发的可能性)。

本发明还部分依据发现利用本文所述约5-49种表达序列能将两种以上肿瘤进行所需分类同时有效地将一种或多种肿瘤剔除在考虑范围外。这反映了无需选择其表达水平与该分类系统范围内所有肿瘤类型高度相关的基因。换言之，可利用其表达水平不与待分类肿瘤组中单种或多种肿瘤高度相关的多种基因来实施本发明。这与依据选择和利用高度相关基因的其它方法相反，与基于正相关将某肿瘤“归类”相反，此方法可能不会“排除”其它肿瘤类型。

将某肿瘤样品分类为本文所述可能的肿瘤类型之一而排除其它肿瘤类型当然要根据下述可信度水平进行。当可信度水平低，或者优选可信度水平提高时，可就具体组织来源或细胞类型水平对样品的肿瘤作出简单分类。或者当不易将某肿瘤样品归类为单一肿瘤类型时，本发明可将该样品分类为本文所述少数可能的肿瘤类型之一。本方法的优点在于能减少获得该样品的患者选择和给予治疗时要考虑的组织、细胞和肿瘤可能类型的数量。

因此，本发明提供了一种鉴定患病对象的一种或多种癌症组织来源和/或肿瘤类型的非主观方法。以前曾用主观解释来确定组织来源和/或肿瘤类型以及根据这种确定来判断癌症预后和/或进行治疗，本发明提供了可单独或与主观标准联用的客观基因表达模式对癌症类型作更精确的鉴定。本发明特别可用于继发性或转移性肿瘤的样品，但也可用于任何含细胞样品(包括原发性肿瘤样品)，对其组织来源和/或肿瘤类型也优选通过客观标准确定。当然，可联合客观与非客观(或主观/部分主观)标准作出最终确定。

本发明可用作患者的临床或医学护理的一部分。因此，除了用本文所述基因的表达概况来检验患癌症对象的含细胞样品以确定癌症的组织来源和/或肿瘤类型外，也可用该表达概况作为确定对象癌症预后方法的一部分。可用肿瘤/癌症的分类和/或预后来选择或决定或改变所述对象的治疗方案。因此，本发明分类方法可涉及针对全部或部分根据该分类作出诊断的疾病治疗。根据该诊断，可采用给予合适的抗肿瘤药物或疗法，或者维持或改变抗肿瘤药物或疗法来治疗癌症。

其它临床方法包括根据本文所述分类为患者提供医学护理的方法。在一些实施方案中，这些方法涉及根据所述基因序列的表达水平提供诊断服务(包括或不包括对样品中细胞分类水平的解释)。在一些实施方案中，先确定(是否)需要服务再提供本发明诊断服务的方法。在其它实施方案中，所述方法包括监测服务的执行情况以及为服务行为要求或接收支付(费用)的行为。

本发明一个或多个实施方案的细节见附图与以下描述。本发明的其它特征、目的和优点将通过附图和详述以及权利要求得以明了。

定义

本文所用的“基因”是编码分离产物(无论本质上是RNA还是蛋白质)的多核苷酸。应知道一种以上多核苷酸能编码一种分离产物。根据染色体位置和在正常有丝分裂期间重组的能力，该术语包括编码同一产物的某基因的等位基因和多态性基因，或其功能上相关(包括功能的得到、丧失或调节)的类似物。

本文所用的“序列”或“基因序列”是由不连续的核苷酸碱基序列组成的核酸分子或多核苷酸。该术语包括编码分离产物(无论本质上是RNA还是蛋白质)的碱基序列(即“编码区”)。应知道一种以上多核苷酸能编码一种分离产物。也应知道人基因序列可能存在等位基因和多态性基因，但可用其实施本发明来鉴定所述基因序列或其等位基因或多态性基因的表达水平。鉴定等位基因或多态性基因部分取决于染色体位置和有丝分裂期间重组的能力。

术语“相关”或“相关性”或其等价术语指一种或多种基因的表达与另一事件，例如但不限于生理表型或特征，如肿瘤类型相关联。

“多核苷酸”是任何长度的多聚形式核苷酸，无论是核糖核苷酸或脱氧核糖核苷酸。此术语只表示该分子的一级结构。因此，此术语包括双链和单链DNA和RNA。也包括已知类型的修饰，包括本领域已知的标记，甲基化，“加帽”，用类似物取代一个或多个天然产生的核苷酸，核苷酸间修饰，如不带电荷的连接键(，例如硫代磷酸酯、二硫代磷酸酯等)以及多核苷酸的未修饰形式。

广义使用的术语“扩增”表示产生可利用DNA或RNA聚合酶酶法制备的扩增产物。本文所用的“扩增”一般指产生所需序列(特别是样品中的序列)多份拷贝的过程。“多份拷贝”指至少两份拷贝。“拷贝”不一定表示与模板序列完美互补或相同的序列。本领域一般知道扩增mRNA的方法，包括逆转录PCR(RT-PCR)、定量PCR(或Q-PCR)或实时PCR。或者，可采用本领域已知的方法将RNA直接标记(labeled)为相应的cDNA。

“相应”表示某核酸分子与另一核酸分子具有基本数量的序列相同性。基本数量表示至少95％、通常至少98％、更常见至少99％，序列相同性采用Altschul等，(1990)，J.Mol.Biol.，215：403-410所述的BLAST算法测定(采用公布的默认设置，即参数w＝4，t＝17)。

“微阵列”是各具有确定面积的各不连续区域在固体支持物(例如但不限于：玻璃、塑料或合成膜)的表面上形成的线性或两维或三维(和固相)阵列。一块固相支持物表面上待检测的固定多核苷酸总数决定了微阵列上分离区域的密度，例如至少约50/cm²、至少约100/cm²、或至少约500/cm²、最多约1,000/cm²以上。这些阵列总共可含有少于约500、约1000、约1500、约2000、约2500或约3000个固定的多核苷酸。本文所用的DNA微阵列是用于和样品中扩增或克隆的多核苷酸杂交，置于芯片或其它表面上的寡核苷酸或多核苷酸阵列。由于阵列中具体各组探针的位置已知，可根据样品多核苷酸与微阵列中具体位置的结合来测定它们的身份(identity)。作为微阵列的替代方法，可利用任何大小的阵列来实施本发明，包括在固体支持物的二维或三维配置中安排一个或多个位置来检测某种基因序列的表达。在一些实施方案中，可通过光版印刷技术(例如在表面上从3’末端合成核酸探针)或先合成核酸再沉积到固体表面来制备本发明所用的微阵列。

由于本发明依赖对基因表达的鉴定，本发明的一些实施方案通过使样品细胞的mRNA或其扩增或克隆序列与某特定基因序列的独特多核苷酸杂交来测定其表达。此类多核苷酸含有未在其它基因序列中发现的某基因序列的至少约16、至少约18、至少约20、至少约22、至少约24、至少约26、至少约28、至少约30或至少约32个连续碱基对。以上句子中使用的术语“约”指从所述数值加减1。其它实施方案是未在其它基因序列中发现的某序列的至少或约50、至少或约100、至少约或150、至少或约200、至少或约250、至少或约300、至少或约350、至少或约400、至少或约450或至少或约500个连续碱基。以上句子中使用的术语“约”指从所述数值加减10％。较长的多核苷酸当然可能含有不影响核酸与样品杂交的少许错配(例如，存在突变所致)。这种多核苷酸也可称为能与本文所述基因的序列或其独特部分杂交的多核苷酸探针。可标记这种多核苷酸从而有助于检测它们。这些序列可以是所述基因编码的mRNA序列，这种mRNA的相应cDNA和/或其扩增序列。在本发明的一些实施方案中，所述多核苷酸探针固定在阵列、其它固体支持装置上，或固定在定位探针的各个点中。

在本发明的其它实施方案中，可通过以下方法扩增与检测某基因的所有或部分序列，所述方法例如有聚合酶链式反应(PCR)及其变化形式，例如但不限于：定量PCR(Q-PCR)、逆转录PCR(RT-PCR)和实时PCR(包括检测样品中各序列的mRNA拷贝初始含量的方法)，任选实时RT-PCR或实时Q-PCR。这些方法可利用一种或两种与某基因序列的各部分互补的引物，这些引物用于引发核酸合成。新合成的核酸任选作标记，可直接检测或通过与本发明多核苷酸杂交来检测。可使新合成的核酸在杂交条件下与本发明多核苷酸(含有各序列)接触。其它检测表达核酸的方法包括RNA酶保护试验，包括液相杂交和细胞原位杂交。

或者，在本发明的其它实施方案中，可用感兴趣细胞样品或对象体液中各基因产物(蛋白质)或其蛋白水解片段的一个或多个表位具有特异性的一种或多种抗体来分析所述细胞样品中表达的蛋白质进而测定基因表达。细胞样品可以是从对象血液富集的乳腺癌上皮细胞之一，例如可用抗细胞表面标记的标记抗体然后通过荧光激活细胞分选(FACS)。可标记这些抗体使其在与基因产物结合后能检测它们。适用于实施本发明的检测方法包括但不限于：含细胞的样品或组织的免疫组织化学、酶联免疫吸附测定(ELISA)，包括含细胞的组织或血液样品的抗体夹心试验、质谱和免疫-PCR。

术语“标记”或“标记的”指能产生表示标记分子存在的可检测信号的组合物。合适的标记物包括放射性同位素、核苷酸生色团、酶、底物、荧光分子、生物发光部分、磁性颗粒、生物发光部分等。因此，标记物是可通过光谱、光化学、生物化学、免疫化学、电学、光学或化学方法检测的任何组合物。

术语“支持物”指常规支持物，例如珠、颗粒、浸渍片、纤维、滤膜、膜、和硅烷或硅酸盐支持物，例如载玻片。

“表达”和“基因表达”包括核酸物质的转录和/或翻译。

本文所用的术语“包含”及其同源词以它们的含意使用；即，与术语“包括”及其相应的同源词等价。

“允许”某事件发生的条件或“适合于”某事件发生的条件，例如杂交、链延伸等，或者“合适”的条件是不会阻止这种事件发生的条件。因此，这些条件可允许、增强、有助于和/或有益于该事件。本领域已知的与本文所述的这些条件取决于，例如核苷酸序列的性质，温度和缓冲液条件。这些条件也取决于所需要的事件，例如杂交、切割、链延伸或转录。

本文所用的序列“突变”指与参比序列相比，感兴趣的本文所述基因的序列中任何的序列改变。序列突变包括因诸如取代、缺失或插入机制所造成的序列中单个核苷酸改变或多个核苷酸改变。单核苷酸多态性(SNP)也是本文所用的一种序列突变。因为本发明依据基因表达的相对水平，所以也可检验本文所述基因的非编码区中的突变来实施本发明。

“检测”包括任何检测方式，包括直接或间接测定基因表达的水平及其变化。

除非另有定义，本文所用的所有技术和科学术语具有与本发明所属领域的普通技术人员共同理解的相同意义。

附图简要说明

图1显示可用一组100种表达基因序列的若干亚组表达水平对39种肿瘤及其亚组进行分类的能力图。该100种序列中的5、10、15、20、25、30、35、40、45和49种的随机组合的表达水平(各取样10次)与肿瘤类型的数据联用，然后用于预测2-39种类型的各组随机测试肿瘤样品(各取样10次)。以非限制性例子的形式显示肿瘤类型数目(x轴)与用5-49种基因所得结果的预测性精确度(y轴)绘制的图。采用5种基因获得的数据产生的曲线最接近x轴，而采用49种基因获得的数据产生的曲线距离x轴最远。精确度一般随着基因序列数目增加而升高，30-49种基因序列(距离x轴最远的三条曲线)提供的精确度水平大约相同。

图2显示了图1所用数据的另一种表现形式。显示所用基因序列的数目(5-49，x轴)与肿瘤类型不同代表性数目的预测精确度(y轴)绘制的图。绘制的线条从上到下分别是对2、10、20、30和39种肿瘤类型的结果。

图3进一步分析了采用采用一组100种随机选择的表达基因序列的亚组的表达水平来分类39种肿瘤类型的能力。采用图1和2所用数据绘制预测精确度为55-70％时肿瘤类型数量与所用基因序列的数量的图，显示为非限制性例子。通常，基因序列的数量越多，精确度越高。

图4显示可用第一组74种表达基因序列的一部分的表达水平对39种肿瘤及其亚组进行分类的能力图。所有74种序列中5、10、15、20、25、30、35、40、45和49种的随机组合(各取样10次)的表达水平与肿瘤类型的数据联用，然后用于预测2-39种类型的各组随机测试肿瘤样品(各取样10次)。肿瘤类型数量与用5-49种基因所得结果的预测精确度绘制的图以非限制性例子显示。绘制的线条从上到下分别是49、40、30、20、10和5种基因序列的结果。。

图5显示了图4所用数据的另一种表现形式。显示所用基因序列的数目(5-49)与肿瘤类型不同代表性数目的预测精确度绘制的图。绘制的线条从上到下分别是2、10、20、30和39种肿瘤类型的结果。

图6类似于图3，但采用了图4和5所用的数据。

图7显示可用一组90种表达基因序列的各亚组的表达水平对39种肿瘤及其亚组进行分类的能力图。90种序列中5、10、15、20、25、30、35、40、45和49种的随机组合(各取样10次)的表达水平与肿瘤类型的数据联用，然后用于预测2-39种类型的各组随机测试肿瘤样品(各取样10次)。肿瘤类型数目与用5-49种基因所得结果的预测精确度绘制的图以非限制性例子显示。绘制的线条从上到下分别是49、40、30、20、10和5种基因序列的结果。

图8显示了图7所用数据的另一种表现形式。显示所用基因序列的数目(5-49)与肿瘤类型不同代表性数目的预测精确度绘制的图。绘制的线条从上到下分别是2、10、20、30和39种肿瘤类型的结果。

图9类似于图3和6，但采用了图7和8所用的数据。

图10A-10D显示了对本文所述肿瘤类型以及其它已知肿瘤类型进行分类的“树结构”。它是主要根据《癌症，肿瘤学的原理与实践》(Cancer，Principles and Practice ofOncology)，(DeVito，Hellman和Rosenberg)，第六版构建。因此，以“未知来源的肿瘤”(或“tuo”)开始，第一种可能性是它是生殖细胞或非生殖细胞来源。如果是前者，肿瘤可能是卵巢或睾丸来源。在睾丸来源中，肿瘤可能是精原细胞瘤来源或“其它”来源。

如果肿瘤是非生殖细胞来源，可以是上皮细胞或非上皮细胞来源。如果是前者，则可以是鳞状或非鳞状来源。鳞状来源肿瘤是宫颈、食管、喉、肺或皮肤来源。非鳞状来源肿瘤是膀胱、乳腺、类癌-肠、胆管癌、消化道、肾脏、肝脏、肺、前列腺、生殖系统、皮肤基底细胞或甲状腺-滤泡-乳头来源。在消化道来源类型中，肿瘤是小肠和大肠、胃-腺癌、胆管、食管、胆囊和胰腺来源。食道来源肿瘤可以是巴雷特食管或腺癌类型。生殖系统来源肿瘤可以是宫颈腺癌类型、子宫内膜肿瘤或卵巢来源。卵巢来源肿瘤是透明(细胞)、浆液(细胞)、黏液(细胞)和子宫内膜类型。

如果肿瘤是非上皮来源，则是肾上腺、脑、GIST(胃肠基质肿瘤)、淋巴瘤、脑膜瘤、间皮瘤、肉瘤、皮肤黑色素瘤或甲状腺-髓质来源。就淋巴瘤而言，有B细胞、何杰金或T细胞类型。就肉瘤而言，有平滑肌肉瘤(leimyosarcoma)、骨肉瘤、软组织肉瘤、软组织MFH(恶性纤维组织细胞瘤)、软组织滑膜肉瘤、软组织尤因肉瘤、软组织纤维肉瘤和软组织横纹肌肉瘤类型。

本发明实施方式详述

本发明提供利用基因表达信息以比常规病理学技术可能更客观的方式对肿瘤进行分类的方法。因此，在第一方面，本发明提供将含细胞的样品分类为包含某类型组织(或来自某类型组织)或某组织来源的肿瘤细胞。该方法包括测定或检测得自对象的含细胞样品中细胞的约5-49种转录序列的表达水平，根据所述序列的表达水平将该样品从多种肿瘤类型中分类为含有某类型组织的肿瘤细胞。本文所用的“多种”指两种以上。

可根据所述约5-49种转录序列在样品细胞中的表达水平与它们在已知肿瘤样品和/或已知的非肿瘤样品中的表达水平作比较进行分类。或者，与(或根据)在已知肿瘤样品和/或已知的非肿瘤样品中进行的同一比较相比，可根据在同一样品中所述约5-49种转录序列的表达水平与参比序列的表达水平相比较进行分类。因此，作为一非限制性例子，可测定一组已知肿瘤样品中所述基因序列的表达水平以提供数据库，将其与对象的含细胞样品所检测或测定到的表达水平作比较。也可将样品中基因序列的表达水平与所述序列在正常或非癌性细胞(优选得自同一样品或对象)中的表达水平作比较。如下文和采用Q-PCR或实时Q-PCR的本发明实施方案中所述，可将所述表达水平与同一样品中参比基因的表达水平作比较，或者可利用表达水平的比例。

在实践中，该方法利用的转录序列与分类的肿瘤类型数量之比约为1∶2-5∶2或更高。换言之，所需的表达水平数量与可根据该水平进行分类的肿瘤类型数量之比约为1∶2至1∶1至3∶2至2∶1至5∶2或更高。能够采用少至约20种表达水平对39肿瘤类型进行分类反映了这种比值(参见图6)。因此，根据图1-9所示数据，可用评估基因与分类肿瘤之比之内的约5-49种基因序列实施本发明。

可随机选用约5-49种基因序列，或根据各种标准选择。作为一非限制性例子，可根据无督导学习(unsupervised learning)选择所述基因序列，包括簇集技术。作为另一非限制性例子，选择可以是降低或除去它们分类肿瘤类型能力的冗余度。例如，可根据其表达与用于分类的一种或多种其它基因序列的表达之间缺乏相关性来选择基因序列。这可通过评估多个样品的表达数据组中各基因的表达水平与该数据组中其它各基因序列的表达水平的相关性，产生相关系数的相关矩阵来实现。这些相关性的测定可直接比较各对基因序列之间的表达，或者不直接比较各对基因序列的表达值而间接进行。

可采用各种相关性(分析)方法使数据组内各基因序列的表达数据相关联。非限制性例子包括参数和非参数方法，以及基于相互信息交流的方法与非线性方法。参数方法的非限制性例子包括Pearson相关性(或Pearson r，也称为线性或产物-时刻相关性(product-moment))和余弦相关性。非参数方法的非限制性例子包括Spearman R(或等级排序)相关性、Kendall Tau相关性和γ统计学方法。可采用各相关性方法来测定数据组中各基因序列表达的相关性水平。所有序列与所有其它序列的相关性最易于视作矩阵。采用Pearson相关性方法作为非限制性例子，该方法的相关系数r用于表示相关性水平。当采用其它相关性方法时，可采用类似于r的相关系数，以及认为对应于r是0.25或约0.25到r是0.5或约0.5的相关性是等价水平。

可视需要选择相关系数从而将相关的基因序列数目减少至不同数值。在采用r的本发明实施方案中，所选择的系数值可以是约0.25以上、约0.3以上、约0.35以上、约0.4以上、约0.45以上或约0.5以上。系数值的选择表示当该数据组中基因序列之间的表达在该值以上相关，它们可能不包括在本发明的亚组内。因此，在一些实施方案中，所述方法包括排除或除去(不用于分类的)与肿瘤类型数据组中另一基因序列的表达相关的在所需相关系数之上的一种或多种基因序列。然而，应指出也存在基因序列与任何其它序列不相关的情况，在此情况中无需将它们从分类应用中除去。

因此，可利用与所用基因序列(组)中另一序列的表达水平在大于约10％、大于约20％、大于约30％、大于约40％、大于50％、大于约60％、大于约70％、大于约80％或大于约90％水平不相关的基因序列的表达水平来实施本发明。表达水平间的相关性值小于约0.9、约0.8、约0.7、约0.6、约0.5、约0.4、约0.3或约0.2。能排除某些基因序列的表达水平而进行分类是因为该亚组中基因序列的表达与从该亚组中排除的基因序列的表达相关。由于信息是依据仍留在该亚组中的序列提供而不是被排除基因序列所表达，所以没有损失信息。因此，该亚组中基因序列的表达提供了与细胞的性能和/或特征(或表型)相关的信息内容。这可应用于对未作为原始基因表达数据组一部分而包括的其它肿瘤类型进行分类并与之具有相关性，由于根据该亚组中序列的表达与其它类型的序列表达之间的信息冗余度，可用本发明的该亚组序列对肿瘤进行分类。因此，本发明可用于将细胞分类为用于产生原始基因表达数据组的多种已知肿瘤以外的肿瘤类型。

也可根据其表达与某具体肿瘤类型的相关性降低来选择基因序列。这也反映在本发明依据以下观察的发现：与一种或多种肿瘤相关程度最高的表达水平在不同肿瘤类型分类中不一定最有价值。可利用随机选择的基因序列来分类以及采用其表达不与一种或多种肿瘤类型最显著相关的本文所述特定序列反映了这点。因此，实施本发明不必根据最显著的P值或根据基因表达与一种或多种肿瘤类型相关性的排序来选择基因序列。故而，无需利用根据诸如Kruskal-Wallis H-检验的方法得到的排序来实施本发明。

用于实施本发明的基因序列可包括观察到其表达与特定肿瘤类型相关联的那些基因序列，例如观察到雌激素受体的表达与一些乳腺和卵巢癌相关联。然而，在本发明的一些实施方案中，利用至少一种以前未鉴定为与分类任何肿瘤类型相关的基因序列的表达水平来实施本发明。因此，可不用以前用于将含细胞样品分类为2种以上(最多39种以上)肿瘤类型的表达有关或相关的所有基因序列来实施本发明。

虽然主要根据人对象描述本发明，但也可用于其它对象的样品。总之均需能评估多种已知肿瘤样品中基因序列的表达水平，从而可将未知或测试样品中(该序列)的表达水平与之作比较。因此，本发明可应用于含多种表达序列的任何生物的样品和多种已知肿瘤的样品。一个非限制性例子是根据小鼠基因组中可用于检测所表达的小鼠序列、和可利用的已知小鼠肿瘤样品或得到已知样品的能力而将本发明应用于小鼠样品。因此，考虑了本发明可用于其它样品，包括作为非限制性例子的哺乳动物、灵长类动物和用于临床检验的动物(例如大鼠、小鼠、家兔、狗、猫和黑猩猩)的那些样品。

虽然利用含细胞的样品不难实施本发明，但用于检测基因表达水平的任何含核酸样品也可用于实施本发明。不是限制本发明，本发明的样品可以是怀疑或已知含有肿瘤细胞的样品。或者，本发明的样品可以是分离自怀疑患有或处于患癌症风险对象的组织或体液的“肿瘤样品”或“含有肿瘤的样品”。本发明所用样品的非限制性例子包括临床样品，例如但不限于：固定的样品、新鲜样品或冷冻样品。样品可以是含有至少一些关于样品中细胞原位成分的信息的吸出物、细胞学样品(包括血液或其它体液)或组织样本，只要可利用相应的细胞或核酸来测定基因表达水平。本发明部分根据发现冷冻组织切片得到的结果可有效地应用于固定的组织和细胞样品以及拓展至新鲜样品。

固定样品的非限制性例子包括用福尔马林或甲醛(包括FFPE样品)、Boudin、戊二醛(glutaldehyde)、丙酮、酒精或任何其它固定剂，如用于固定免疫组织化学(HIC)的细胞或组织样品的那些固定剂来固定的样品。其它例子包括沉淀细胞相关核酸与蛋白质的固定剂。鉴于处理冷冻组织样本可能复杂，例如需要维持其冷冻状态，可用非冷冻样品，例如固定的样品、新鲜样品(包括血液或其它体液或组织的细胞)与最低限度处理的样品来实施本发明。在本发明的一些应用中，不采用标准病理学技术，例如但不限于免疫组织化学试验对样品进行分类。

在本发明的一些实施方案中，将样品分类为含有选自以下53种类型及其亚组的肿瘤细胞：乳腺癌、宫颈腺癌、食道腺癌、胆囊腺癌、肺腺癌、胰腺癌、小肠-大肠腺癌、胃腺癌、星形细胞瘤、皮肤基底细胞癌、肝脏胆管癌、卵巢透明细胞腺癌(ClearCell Adenocarcinoma of Ovary)、弥散性大B细胞淋巴瘤、胚胎睾丸癌、子宫内膜子宫癌、尤因肉瘤、滤泡性甲状腺癌、胃肠基质肿瘤、卵巢生殖细胞瘤、睾丸生殖细胞瘤、多形性成胶质细胞瘤、肝细胞肝癌、何杰金淋巴瘤、大细胞肺癌、平滑肌肉瘤、脂肉瘤、乳腺小叶癌、恶性纤维组织细胞瘤、甲状腺髓样癌、黑色素瘤、脑膜瘤、肺间皮瘤、卵巢黏液腺癌、肌纤维肉瘤(Myofibrosarcoma)、大肠神经内分泌肿瘤(Neuroendocrine Tumor of Bowel)、少突神经胶质细胞瘤、骨肉瘤、甲状腺乳头状癌、嗜铬细胞瘤、肾细胞肾癌、横纹肌肉瘤、睾丸精原细胞瘤、卵巢浆液腺癌、小细胞肺癌、宫颈鳞状细胞癌、食道鳞状细胞癌、喉鳞状细胞癌、肺鳞状细胞癌、皮肤鳞状细胞癌、滑膜肉瘤、T细胞淋巴瘤和膀胱移行细胞癌。

在本发明的其它实施方案中，将样品分类为含有选自以下34种类型及其亚组的肿瘤细胞：肾上腺(癌)、脑(癌)、乳腺(癌)、小肠类癌(carcinoid-intestine)、子宫颈(鳞状细胞癌)、胆管癌、子宫内膜(癌)、生殖细胞(癌)、GIST(胃肠基质肿瘤)、肾(癌)、平滑肌肉瘤、肝(癌)、肺(大细胞腺癌)、肺(小细胞癌)、肺(鳞状细胞癌)、淋巴瘤(B细胞)、淋巴瘤(何杰金)、脑膜瘤、间皮瘤、骨肉瘤、卵巢(透明细胞)、卵巢(浆液细胞)、胰腺、前列腺、皮肤(基底细胞)、皮肤(黑色素瘤)、小肠与大肠、软组织(脂肉瘤)、软组织(MFH或恶性纤维组织细胞瘤)、软组织(肉瘤-滑膜)、睾丸(精原细胞瘤)、甲状腺(滤泡性-乳头状)、甲状腺(髓样癌)和膀胱(癌)。

在本发明的其它实施方案中，样品分类为含有选自以下39种类型及其亚组的肿瘤细胞：肾上腺(癌)、脑(癌)、乳腺(癌)、小肠类癌、宫颈癌、宫颈鳞状细胞(癌)、子宫内膜(癌)、胆囊(癌)、卵巢生殖细胞(癌)、GIST、肾(癌)、平滑肌肉瘤、肝(癌)、大细胞肺癌、小细胞肺(癌)、肺鳞状细胞(癌)、B细胞淋巴瘤、何杰金淋巴瘤、T细胞淋巴瘤、脑膜瘤、间皮瘤、骨肉瘤、卵巢-透明细胞、卵巢-浆液细胞、胰腺、前列腺、皮肤-基底细胞、皮肤黑色素瘤、鳞状细胞皮肤(癌)、小肠和大肠(癌)、软组织-脂肉瘤、软组织-MFH、肉瘤-滑膜软组织(癌)、胃腺癌、其它睾丸(癌)(或非精原细胞瘤)、睾丸精原细胞瘤、甲状腺滤泡性-乳头状(癌)、甲状腺髓样(癌)和膀胱(癌)。

本发明的方法也可应用于将含细胞的样品分类为含有上述各组任一亚组肿瘤的肿瘤细胞。该亚组一般不大，包括上述肿瘤类型的2、3、4、5、6、7、8、9或10种。或者，该亚组的大小可以是该组全部大小的任何整数。因此，本发明的实施方案包括在11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51或52种上述类型中分类。在一些实施方案中，所述亚组包括同一组织或器官类型的肿瘤。或者，该亚组可包括不同组织或器官的肿瘤类型。在一些实施方案中，该亚组包括选自以下的一种或多种肿瘤类型：肾上腺(癌)、脑(癌)、小肠类癌、宫颈腺癌、宫颈鳞状细胞癌、胆囊癌、卵巢生殖细胞(癌)、GIST、平滑肌肉瘤、肝(癌)、脑膜瘤、骨肉瘤、皮肤基底细胞癌、皮肤鳞状细胞癌、软组织-脂肉瘤、软组织-MFH、肉瘤-滑膜软组织癌、其它睾丸(癌)、睾丸-精原细胞瘤、甲状腺滤泡性-乳头状(癌)和甲状腺-髓样(癌)。

图1-9所示结果证明上述肿瘤类型各亚组的分类，可利用少至约5种以上的基因序列表达水平对上述一组39种(类型)中的两种肿瘤类型的随机样品进行分类。可采用少至约20-49种基因序列的表达水平对所有39种肿瘤类型进行不同精确程度的分类。可利用在人“转录组(transcriptome)”(基因组的转录部分)中发现的约10种以上、约15种以上、约20种以上、约25种以上、约30种以上、约35种以上、约40种以上、或约45种以上至49种转录序列的表达水平来实施本发明。也可利用约10-20种以上、约20-30种以上、约30-40种以上、约40-50种以上或49种转录序列的表达水平来实施本发明。在本发明的一些实施方案中，可随机选出被转录的基因或包括本文所述全部或一些具体基因序列。如本文所述，利用本发明可以进行约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％或约95％以上的精确度分类。

在其它实施方案中，可与上述测定用于分类的表达水平一起测定其它基因序列的基因表达水平。一个这样的非限制性例子是利用微阵列平台测定基因表达，其中也检测了其它基因序列的表达。当不采用其它基因表达水平来分类时，可认为它们是“过度”转录序列的结果，对实施本发明不重要。或者，当采用那些其它基因表达水平来分类时，它们属于本发明范围内，当说到所用序列的特定数目时不一定排除利用其它序列的表达水平。在一些实施方案中，本发明包括利用一种或多种“过度”基因序列的表达水平，例如提供的信息多于本发明方法所用的一种或多种其它基因序列的那些基因序列。

因为将样品分类为含有上述肿瘤类型之一的细胞在本质上也对样品来源的组织或器官作了分类，本发明方法可应用于分类患者肿瘤样品的具体组织或器官来源。本发明的此应用特别可用于判断肿瘤样品是否是另一肿瘤转移所致。在本发明的一些实施方案中，肿瘤样品分类为以下24种之一：肾上腺、膀胱、骨、脑、乳腺、子宫颈、子宫内膜、食道、胆囊、肾脏、喉、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、皮肤、软组织、小肠/大肠、胃、睾丸、甲状腺和子宫。

尽管本发明也根据与39种肿瘤类型中所述序列表达水平的比较来分类上述肿瘤类型之一，但此分类可能要求更高水平的可信度。如果偏向提高该分类的可信度，可调整该分类将肿瘤样品鉴定为图10所示的具体来源或细胞类型。因此，可信度的提高是以降低鉴定肿瘤类型的来源或细胞类型的特异性为代价。

将含细胞的样品分类为上述39种肿瘤之一的肿瘤细胞实质上也对该样品来源的组织或器官部位作了分类。例如，将某样品鉴定为子宫颈-鳞状细胞需要将肿瘤归类于图10所示的子宫颈来源的鳞状细胞类型(进而分类为上皮而不是非上皮来源)。这也表示该肿瘤无需是生殖细胞来源。因此，可用本发明方法将肿瘤样品分类为对象或患者的某特定组织或器官部位。本发明的此应用在样品是另一肿瘤转移所致肿瘤的情况中特别有用。

通过采用合适的分类算法来实施本发明将含细胞的样品分类为上述类型之一的肿瘤细胞，所述算法采用督导学习来接收(以下信息)将样品分类为上述肿瘤类型之一的细胞：1)作为训练组的基因序列在多种已知肿瘤类型中的表达水平和2)同一基因在样品的一种或多种细胞中的表达水平。对于此点的进一步讨论见本文的实施例部分。表达水平可以任何形式的信号提供，包括本文所述的核酸表达或蛋白质表达。

技术人员知道分类的范围受到肿瘤类型的数目以及各肿瘤类型样品的数目影响。但鉴于本文提供了所有人肿瘤的充足样品，本发明不难应用于那些肿瘤类型以及其它类型的分类。

可用于实施本发明的分类算法的非限制性例子包括督导学习算法、机械学习算法(machine learning algorithm)、线性区别分析(linear discriminant analysis)、属性选择算法(attribute selection algorithm)和人工神经网络(ANN)。在本发明的优选实施方案中，采用距离分类算法(distance-based classification algorithm)，例如k-最近邻(nearestneighbor)(KNN)算法或支持向量机制(support vector machine)(SVM)。

本发明的一些实施方案中采用了KNN，作为非限制性代表性例子进一步得到讨论。可采用KNN来分析包括本文所述所有39种肿瘤的已知肿瘤样品的“训练组”中基因的表达数据。然后可将该训练数据组与含细胞样品中同一基因的表达数据作比较。再通过KNN将样品中基因的表达水平与该训练数据组作比较而鉴定具有最相似表达模式的那些肿瘤样品。作为非限制性例子，可鉴定五种“最相近”肿瘤类型来分类未知肿瘤样品。当然可利用其它数目的“最相近”(肿瘤类型)。非限制性例子包括5种以下、约7种、约9种或约11种以上“最相近”(肿瘤类型)。

作为一种假定的例子，如果某未知样品的五种“最相近”(肿瘤)是四种B细胞淋巴瘤和一种T细胞淋巴瘤，那么可以高精确度确定将该样品归类为B细胞淋巴瘤。如实施例中所述，应用此分类方法的精确度为84％，例如90％。

将这种分类能力与该分类方案的固有性质相结合可以提高某些条件下肿瘤分类的可信度。例如，如果某样品的五种“最相近”(肿瘤)是三种卵巢透明细胞瘤和两种卵巢浆液肿瘤，则可简单地将该肿瘤归类为卵巢来源并据此治疗对象或患者(从其获得样品的)而提高可信度。参见图8。这是为提高可信度而降低特异性的例子。这提供了判断该未知样品是粘液瘤或子宫内膜肿瘤可能性的额外益处。当然，专业医师可自由地将肿瘤视作此两种最大可能肿瘤的一种或两种，并根据该测定结果进行治疗。

因为某些肿瘤类型的肿瘤细胞(例如，生殖细胞)的发育谱系复杂且涉及多种细胞类型，图8看上去可能过于简单了。然而，它可用作与已知组织病理学相关联的良好基础并用作分析和联系肿瘤相关基因表达标记的“引导树(guide tree)”。

在“最相近”(肿瘤)模糊不清时，该分类方案的固有性质也提供了提高肿瘤分类可信度的方法。例如，如果五种“最相近”(肿瘤)是一种膀胱、一种乳腺、一种肾脏、一种肝脏和一种前列腺，可以简单地归类为非鳞状细胞肿瘤(类型)。可以显著可信度作出这种测定，据此治疗获得样品的对象或患者。不想受理论的束缚并且只是为增进对本发明的理解而提供的后两个例子反映了相似的细胞类型和/或组织来源的细胞具有相似的基因表达。

本发明的实施方案包括用本文所述方法和材料来鉴定患者癌症的来源。因此，假定某样品含肿瘤细胞，可采用本发明鉴定该肿瘤细胞的组织来源。一个非限制性例子是其发炎淋巴结含有癌细胞的对象。这些细胞可来自该淋巴结引流的组织或器官，或者可以是另一组织来源。可用本发明将这些细胞分类为具体的肿瘤或组织类型(或来源)从而鉴定癌细胞的来源。在另一非限制性例子中，首先用本发明(方法)检验样品(例如淋巴结)含有的细胞从而将至少一种细胞分类为某组织类型或来源的肿瘤细胞。然后利用此(结果)鉴定该样品中癌细胞的来源。二者均是本发明优于采用其它癌症诊断检验的省时、省力、省成本的例子。

在其它实施方案中，利用以前有癌症史的对象的样品实施本发明。作为非限制性例子，可能发现此对象的含细胞样品(来自淋巴结或其它组织)含有癌细胞从而可用本发明来测定癌细胞是否来自先前癌症的同一组织或不同组织。本发明的此应用也可用于鉴定新的原发性肿瘤，例如在曾患乳腺癌的对象的肝脏中发现的新癌细胞。本发明可用于鉴定以前乳腺癌转移所致(或来自另一种肿瘤，无论以前是否鉴定过)或新产生的原发性肝癌的新癌细胞。本发明也可应用于发现有多种癌症的组织或器官的样品来测定各种癌症的来源以及这些癌症是否为同一来源。

虽然可用随机分组的表达基因序列的表达水平来实施本发明，但本发明也提供了用于实施本发明的示范性基因序列。本发明提供了第一组74种基因序列，其中约5-49种可用于实施本发明。这5-49种基因序列可与其它序列表达水平的测定联用，只要该组74种基因序列的表达水平可用于分类。本发明这种实施方案的非限制性例子是联合测定这74种基因序列中约5-49种的表达，与多种其它序列的表达水平，例如利用实施本发明所用的微阵列平台。当不用那些其它序列的表达水平来分类时，可认为它们是“过度”转录序列所致，对实施本发明不重要。或者，当用那些其它序列的表达水平来时，它们属于本发明范围内，在此情况中利用上述序列无需排除利用其它序列的表达水平。

实施本发明所用的一组74种基因序列的相应mRNA序列和其它鉴定信息见附件(序列表)。下文提供了包括登录号和其它信息在内的鉴定信息的清单。

>Hs.73995_mRNA_1 gi|190403|gb|M60502.1|HUMPROFILE人原聚角蛋白微丝蛋白(profilaggrin)mRNA，3′末端聚腺苷酸＝1

>Hs.75236_mRNA_4 gi|14280328|gb|AY033998.1|智人(Homo sapiens)聚腺苷酸＝3

>Hs.299867_mRNA_1 gi|4758533|ref|NM_004496.1|智人肝细胞核因子3，α(HNF3A)，mRNA聚腺苷酸＝3

>Hs.285401_contig1

AI147926|AI880620|AA768316|AA761543|AA279147|AI216016|AI738663|N79248|AI684489|AA960845|AI718599|AI379138|N29366|BF002507|AW044269|R34339|R66326|H04648|R67467|AI523112|BF941500聚腺苷酸＝2聚腺苷酸＝3

>Hs.182507_mRNA_1 gi|15431324|ref|NM_002283.2|智人角蛋白，毛发，碱性，5(KRTHB5)，mRNA聚腺苷酸＝3

>Hs.292653_contig1

AI200660|AW014007|AI341199|AI692279|AI393765|AI378686|AI695373|AW292108|T10352|R44346|AW470408|AI380925|BF938983|AW003704|H08077|F03856|H08075|F08895|AW468398|AI865976|H22568|AI858374|AI216499聚腺苷酸＝2聚腺苷酸＝3

>Hs.97616_mRNA_3 gi|12654852|gb|BC001270.1|BC001270智人克隆MGC：5069IMAGE：3458016聚腺苷酸＝3

>Hs.123078_mRNA_3 gi|14328043|gb|BC009237.1|BC009237智人克隆MGC：2216 IMAGE：2989823聚腺苷酸＝3

>Hs.285508_contig1 AW194680|BF939744|BF516467聚腺苷酸＝1聚腺苷酸＝1

>Hs.183274_contig1

BF437393|BF064008|BF509951|AW134603|AI277015|AI803254|AA887915|BF054958|AI004413|AI393911|AI278517|AW612644|AI492162|AI309226|AI863671|AA448864|AI640165|AA479926|AA461188|AA780161|BF591180|AI918020|AI758226|AI291375|BF001845|BF003064|AI337393|AI522206|BE856784|BF001760|AI280300 FLAG＝1聚腺苷酸＝2 WARN聚腺苷酸＝3

>Hs.334841_mRNA_3 gi|14290606|gb|BC009084.1|BC009084智人克隆MGC：9270 IMAGE：3853674聚腺苷酸＝3

>Hs.3321_contig1

AI804745|AI492375|AA594799|BE672611|AA814147|AA722404|AW170088|D11718|BG153444|AI680648|AA063561|BE219054|AI590287|R55185|AI479167|AI796872|AI018324|AI701122|BE218203|AA905336|AI681917|BI084742|AI480008|AI217994|AI401468聚腺苷酸＝2 聚腺苷酸＝3

>Hs.306216_singlet1 AW083022聚腺苷酸＝1聚腺苷酸＝2

>Hs.99235_contig1 AA456140|AI167259|AA450056聚腺苷酸＝2聚腺苷酸＝3

>Hs.169172_mRNA_2 gi|2274961|emb|AJ000388.1|HSCANPX(需)钙蛋白酶样蛋白酶的智人mRNA，CANPX聚腺苷酸＝3

>Hs.351486_mRNA_1 gi|16549178|dbj|AK054605.1|AK054605智人cDNAFLJ30043 fis，克隆3NB692001548聚腺苷酸＝0

>Hs.153504_contig2

BE962007|AW016349|AW016358|AW139144|AA932969|AI025620|AI688744|AI865632|AA854291|AA932970|AU156702|AI634439|AA152496|AI539557|AI123490|AI613215|AI318363|AW105672|AA843483|AI366889|AW181938|AI813801|AI433695|AA934772|N72230|AI760632|BE858965|AW058302|AI760087|AI682077|AA886672|AI350384|AW243848|AW300574|BE466359|AI859529|AI921588|BF062899|BE855597|BE617708聚腺苷酸＝2聚腺苷酸＝3

>Hs.199354_singlet1 AI669760聚腺苷酸＝1聚腺苷酸＝2

>Hs.162020_contig1 AW291189|AA505872聚腺苷酸＝2聚腺苷酸＝3

>Hs.30743_mRNA_3 gi|18201906|ref|NM_006115.2|黑色素瘤中的智人优选表达抗原(PRAME)，mRNA聚腺苷酸＝3

>Hs.271580_contig1

AI632869|AW338882|AW338875|AW613773|AI982899|AW193151|BE206353|BE208200|AI811548|AW264021聚腺苷酸＝2聚腺苷酸＝3

>Hs.69360_mRNA_2 gi|14250609|gb|BC008764.1|BC008764智人克隆MGC：1266IMAGE：3347571聚腺苷酸＝3

>Hs.30827_contig1 H07885|N39347|W85913|AA583408|W86449聚腺苷酸＝2聚腺苷酸＝3

>Hs.211593_contig2

BF592799|AI570478|AA234440|R40214|BE501078|AW593784|AI184050|AI284161|W72149|AW780437|AI247981|AW241273|H60824聚腺苷酸＝2聚腺苷酸＝3

>Hs.155097_mRNA_1 gi|15080385|gb|BC011949.1|BC011949智人克隆MGC：9006 IMAGE：3863603聚腺苷酸＝3

>Hs.5163_mRNA_1gi|15990433|gb|BC015582.1|BC015582智人克隆MGC：23280IMAGE：4637504聚腺苷酸＝3

>Hs.55150_mRNA_1 gi|17068414|gb|BC017586.1|BC017586智人克隆MGC：26610 IMAGE：4837506聚腺苷酸＝3

>Hs.170177_contig3

AI620495|AW291989|AA780896|AA976262|AI298326|BF111862|AW591523|AI922518|AI480280|BF589437|AA600354|AI886238|AA035599|H90049|BF112011|N52601|AI570965|AI565367|AW768847|H90073|BE504361|N45292|AI632075|AA679729|AW168052|AI978827|AI968410|AI669255|N45300|AI651256|AI698970|AI521256|AW078614|AI802070|AI885947|AI342534|AI653624|AW243936|T16586|R15989|AI289789|AI871636|AI718785|AW148847聚腺苷酸＝2聚腺苷酸＝3

>Hs.184601_mRNA_5 gi|4426639|gb|AF104032.1|AF104032智人聚腺苷酸＝2

>Hs.351972_singlet1 AA865917聚腺苷酸＝2聚腺苷酸＝3

>Hs.5366_mRNA_2 gi|15277845|gb|BC012926.1|BC012926智人克隆MGC：16817IMAGE：3853503聚腺苷酸＝3

>Hs.18140_contig1

AI685931|AA410954|T97707|AA706873|AI911572|AW614616|AA548520|AW027764|BF511251|AI914294|AW151688聚腺苷酸＝1聚腺苷酸＝1

>Hs.133196_contig2

BF224381|BE467992|AW137689|AI695045|AW207361|BF445141|AA405473聚腺苷酸＝2 WARN 聚腺苷酸＝3

>Hs.63325_mRNA_5gi|15451939|ref|NM_019894.1|智人跨膜蛋白酶，丝氨酸4(TMPRSS4)，mRNA 聚腺苷酸＝3

>Hs.250692_mRNA_2 gi|184223|gb|M95585.1|HUMHLF肝脏白血病因子(HLF)mRNA，完整cds聚腺苷酸＝3

>Hs.250726_singlet4 AW298545聚腺苷酸＝2聚腺苷酸＝3

>Hs.79217_mRNA_2 gi|16306657|gb|BC001504.1|BC001504智人克隆MGC：2273IMAGE：3505512聚腺苷酸＝3

>Hs.47986_mRNA_1 gi|13279253|gb|BC004331.1|BC004331智人克隆MGC：10940 IMAGE：3630835聚腺苷酸＝3

>Hs.94367_mRNA_1 gi|10440200|dbj|AK027147.1|AK027147智人cDNA：FLJ23494 fis，克隆LNG01885聚腺苷酸＝3

>Hs.4921b_contig1

BI493248|N66529|AA452255|BI492877|AW196683|AI963900|BF478125|AI421654|BE466675聚腺苷酸＝1聚腺苷酸＝1

>Hs.281587_contig2

R61469|R15891|AA007214|R61471|AI014624|N69765|AW592075|H09780|AA709038|AI335898|AI559229|F09750|R49594|H11055|T72573|AA935558|AA988654|AA826438|AI002431|AI299721聚腺苷酸＝1聚腺苷酸＝2

>Hs.79378_mRNA_1 gi|16306528|ref|NM_003914.2|智人细胞周期蛋白A1(CCNA1)，mRNA聚腺苷酸＝3

>Hs.156469_contig2

AI341378|AI670817|AI701687|AI335022|AW235883|AI948598|AA446356聚腺苷酸＝2聚腺苷酸＝3

>Hs.6631_mRNA_1gi|7020430|dbj|AK000380.1|AK000380智人cDNA FLJ20373fis，克隆HEP19740聚腺苷酸＝3

>Hs.155977_contig1 AI309080|AI313045聚腺苷酸＝1 WARN 聚腺苷酸＝1

>Hs.95197_mRNA_4 gi|5817138|emb|AL110274.1|HSM800829智人mRNA；cDNADKFZp564I0272(来自克隆DKFZp564I0272)聚腺苷酸＝3

>Hs.48956_contig1 N64339|AI569513|AI694073聚腺苷酸＝1聚腺苷酸＝1

>Hs.118825_mRNA_10 gi|1495484|emb|X96757.1|HSSAPKK3 MAP激酶激酶的智人mRNA聚腺苷酸＝3

>Hs.135118_contig3

AI683181|AI082848|AW770198|AI333188|AI873435|AW169942|AI806302|AW340718|BF196955|AA909720聚腺苷酸＝1聚腺苷酸＝2

>Hs.171857_mRNA_1 gi|13161080|gb|AF332224.1|AF332224智人睾丸蛋白mRNA，部分cds聚腺苷酸＝3

>Hs.18910_mRNA_3gi|12804464|gb|BC001639.1|BC001639智人克隆MGC：1944IMAGE：2959372聚腺苷酸＝3

>Hs.194774_mRNA_1gi|16306633|gb|BC001492.1|BC001492智人克隆MGC：1774 IMAGE：3510004聚腺苷酸＝3

>Hs.127428_mRNA_2gi|16306818|gb|BC006537.1|BC006537智人克隆MGC：1934 IMAGE：2987903聚腺苷酸＝3

>Hs.126852_contig1

AI802118|BF197404|BF224434|AA931964|AW236083|AI253119|AW614335|AI671372|AI793240|AW006851|AI953604|AI640505|AI633982|AW195809|AI493069|AW058576|AW293622聚腺苷酸＝2聚腺苷酸＝3

>Hs.28149_mRNA_1 gi|14714936|gb|BC010626.1|BC010626智人克隆MGC：17687 IMAGE：3865868聚腺苷酸＝3

>Hs.35453_mRNA_3 gi|7018494|emb|AL157475.1|HSM802461智人mRNA；cDNADKFZp761G151(来自克隆DKFZp761G151)；部分cds聚腺苷酸＝3

>Hs.180570_contig1

R08175|AA707224|AA699986|R11209|W89099|T98002|AA494546聚腺苷酸＝2聚腺苷酸＝3

>Hs.196270_mRNA_1 gi|11545416|gb|AF283645.1|AF283645智人染色体8遗传图8q21聚腺苷酸＝3

>Hs.9030_mRNA_3gi|12652600|gb|BC000045.1|BC000045智人克隆MGC：2032IMAGE：3504527聚腺苷酸＝3

>Hs.1282_mRNA_3 gi|4559405|ref|NM_000065.1|智人互补组件6(C6)，mRNA聚腺苷酸＝1

>Hs.268562_mRNA_2 gi|15341874|gb|BC013117.1|BC013117智人克隆MGC：8711 IMAGE：3882749聚腺苷酸＝3

>Hs.151301_mRNA_3 gi|16041747|gb|BC015754.1|BC015754智人克隆MGC：23085 IMAGE：4862492聚腺苷酸＝3

>Hs.111_contig1 AA946776|AW242338|H24274|AI078616聚腺苷酸＝1聚腺苷酸＝2

>Hs.150753_contig1 AI123582|AI288234聚腺苷酸＝0聚腺苷酸＝0

>Hs.82109_mRNA_1 gi|14250611|gb|BC008765.1|BC008765智人克隆MGC：1622IMAGE：3347793聚腺苷酸＝3

>Hs.44276_mRNA_2 gi|12654896gb|BC001293.1|BC001293智人克隆MGC：5259IMAGE：3458115聚腺苷酸＝3

>Hs.2142_mRNA_4 gi|13325274gb|BC004453.1|BC004453智人克隆MGC：4303IMAGE：2819400聚腺苷酸＝3

>Hs.180908_contig1 AA846824|AW611680|AA846182|AA846342|AA846360聚腺苷酸＝2聚腺苷酸＝3

>Hs.89436_mRNA_1 gi|16507959|ref|NM_004063.2|智人钙黏着蛋白17，LI钙黏着蛋白(肝-肠)(CDH17)，mRNA聚腺苷酸＝1

>Hs.151544_mRNA_8 gi|3153107|emb|AL023657.1|HSDSHP智人SH2D1A cDNA，以前称为DSHP聚腺苷酸＝3

>Hs.1657_contig4

AW473119|AA164586|AI540656|AI758480|AI810941|AI978964|AI675862|AI784397|AW591562|AW514102|AI888116|AI983175|AI634735|AI669577|AI202659|AI910598|AI961352|AI565481|AI886254|AI538838|AA291749|AW571455|AI370308|AI274727|AW473925|AW514787|AI273871|AW470552|AI524356|AI888281|AW089672|AI952766|AW440601|AI654044|AW438839|AI972926聚腺苷酸＝2聚腺苷酸＝3

>Hs.35984_mRNA_1 gi|6049161|gb|AF133587.1|AF133587智人染色体22遗传图22q11.2聚腺苷酸＝3

>Hs.334534_mRNA_2 gi|17389403|gb|BC017742.1|BC017742智人，克隆IMAGE：4391536，mRNA聚腺苷酸＝3

>Hs.60162_mRNA_1 gi|10437644|dbj|AK025181.1|AK025181智人cDNA：FLJ21528 fis，克隆COL05977聚腺苷酸＝3

技术人员应理解可通过检测任何一种以上鉴定的序列或附件(序列表)中提供序列来检测这些序列的任何合适部分或片段的表达。所述部分宜足够大从而与含细胞样品中表达的其它序列相比可含有独特的序列。此外，技术人员应知道所述序列代表了双链分子的一条链，可检测两条链之一表明所述序列已表达。这是因为所述序列在细胞中表达为RNA分子，而为便于操作和检测宜将该RNA分子转化为cDNA分子。得到的cDNA分子可具有所表达的RNA的序列及其互补链的序列。因此，可检测RNA序列链或互补链。当然，也可能不用转化为cDNA而检测表达的RNA。

在本发明的一些实施方案中，可通过检测含细胞样品中所表达的序列与以下寡核苷酸的杂交来检测所述基因序列的表达水平，以下寡核苷酸对应于所提供的登录号所示的上述序列。

>AF133587

CCCGGATCGCCATCAGTGTCATCGAGTTCAAACCCTGAGCCCTTCATTCACCTCTGTGAG

>BC017742

TGCCCTTGCTCTGTGTCATCTCAGTCATTTGACTTAGAAAGTGCCCTTCAAAAGGACCCT

>BF437393

GGAGGGAGGGCTAATTATATATTTTGTTGTTCCTCTATACTTTGTTCTGTTGTCTGCGCC

>AI620495

CAGTTTGGATTGTATAATAACGCCAAGCCCAGTTGTAGTCGTTTGAGTGCAGTAATGAAA

>AK000380

AAATCAGAGTAACCCTTTCTGTATTGAGTGCAGTGTTTTTTACTCTTTTCTCATGCACAT

>BC009237

TGCCTGGCACAAAGAAGGAAGAATATAAATGATAGTTCGACTCGTCTGTGGAAGAACTTA

>BC008765

AGTCTTTTGCTTTTGGCAAAACTCTACTTAATCCAATGGGTTTTTCCCTGTACAGTAGAT

>BC001504

GGTTACTGTGGGTGGAATAGTGGAGGCCTTCAACTGATTAGACAAGGCCCGCCCACATCT

>NM_019894

TAAAATGCACTGCCCTACTGTTGGTATGACTACCGTTACCTACTGTTGTCATTGTTATTA

>BF224381

TTCTCTTTTGGGGGCAAACACTATGTCCTTTTCTTTTTCTAGATACAGTTAATTCCTGGA

>AL157475

AAGACCCACACCCTGTAGCAATACCAAGTGCTATTACATAATCAATGGACGATTTATACT

>AY033998

AGTGTTGCAAGTTTCCTTTAAAACCAACAAAGCCCACAAGTCCTGAATTTCCCATTCTTA

>H07885

GTCACTGTCATAGCAGCTGTGATTTCACAAGGAAGGGTGCTGCAGGGGGACCTGGTTGAT

>NM_004496

TTTCATCCAGTGTTATGCACTTTCCACAGTTGGTGTTAGTATAGCCAGAGGGTTTCATTA

>AA846824

GGGAAGTAGGGATTATTCGTTTAAATTCAATCGCGAGCACCAAGTCGGACTGGCCGGGGA

>BC017586

GGGACCAGGCCCTGGGACAGCCATGTGGCTCCAAATGACTAAATGTCAGCTCAAAAACCA

>AA456140

TCCGTTTATGGAGGCAATTCCATATCCTTTCTTGAACGCACATTCAGCTTACCCCAGAGA

>NM_002283

AGAGTTAAGCCACTTCCTGGGTCTCCTTCTTATGACTGTCTATGGGTGCATTGCCTTCTG

>AL023657

GTGGCCTGAGTAATGCATTATGGGTGGTTTACCATTTCTTGAGGTAAAAGCATCACATGA

>BC001639

ACACATGCATGTGTCTGTGTATGTGTGAATGTGAGAGAGACACAGCCCTCCTTTCAGAAG

>BC015754

TCTGTAACTGCACAACCCTGGGGTTTGCTGCAGAGCTATTTCTTTCCATGTAAAGTAGTG

>AF332224

AAACACTCTTTCCGACTCCAGAGGAGAAGCTGGCAGCTCTCTGTAAGAAATATGCTGATC

>BC001270

GCTTCCTCTATCGCCCAATGCAAAATCGATGAAATGGGGAGTTCTCTGGGCCAGGCCACA

>AI147926

GTAGAATCCTCTGTTCATAATGAACAAGATGAACCAATGTGGATTAGAAAGAAGTCCGAG

>AW298545

CTGTTTTAAAACTGAATGGCACGAAATTGTTTTCCTCAACTCGGAGATTCCTGTATGGAG

>AI802118

AATAAATAGTAGCTCTGCTGATGATGACGTTGATAACCAAACTGTTCTGTGGTCTTAAGT

>AI683181

CAAACAGCCCGGTCTTGATGCAGGAGAGTCTGGAAAAGGAAGAAAATGGTTTCAGTTTCA

>M95585

AACATGGACCATCCAAATTTATGGCCGTATCAAATGGTAGCTGAAAAAACTATATTTGAG

>AK027147

TTGTAATCATGCCAATTCCAGATCAATAACTGCATGTCTGTTCTTTGGTAGAAATAGCTT

>AW291189

AAAGATTATTAACCCAAATCACCTTTCTTGCTTACTCCAGATGCCTCAGCCTCTGATATA

>AI632869

GACTTCCTTTAGGATCTCAGGCTTCTGCAGTTCTCATGACTCCTACTTTTCATCCTAGTC

>BC006537

CTGTATATTTTGCAATAGTTACCTCAAGGCCTACTGACCAAATTGTTGTGTTGAGATGAT

>R61469

TGTTCAAACAGACTTTAACCTCTGCATCATACTTAACCCTGCGACATGCGTACAGTATGC

>BC009084

TGAGTCATATACATTTACTGACCACTGTTGCTTGTTGCTCACTGTGCTGCTTTTCCATGA

>N64339

CTGAAATGTGGATGTGATTGCCTCAATAAAGCTCGTCCCCATTGCTTAAGCCTTCAAAAA

>AI200660

ATCAAGAAAACCTAATCTTCTGACTCCCAGGCCAGGATGTTTTATTTCTCACATCATGTC

>AK054605

TTCATTTCCAAACATCATCTTTAAGACTCCAAGGATTTTTCCAGGCACAGTGGCTCATAC

>NM_006115

AGTTAGAAATAGAATCTGAATTTCTAAAGGGAGATTCTGGCTTGGGAAGTACATGTAGGA

>X96757

CAATTTTCTTTTTACTCCCCCTCTTAAGGGGGCCTTGGAATCTATAGTATAGAATGAACT

>AI804745

GGGTGGAGTTTCAGTGAGAATAAACGTGTCTGCCTTTGTGTGTGTGTATATATACAGAGA

>AJ000388

CTCGCTCATTTTTTACCATGTTTTCCAGTCTGTTTAACTTCTGCAGTGCCTTCACTACAC

>BC008764

CTTTGGGCCGAGCACTGAATGTCTTGTACTTTAAAAAAATGTTTCTGAGACCTCTTTCTA

>AI309080

CTGGACCCTTGGAGCAGTGTTGTGTGAACTTGCCTAGAACTCTGCCTTCTCCGTTGTCAA

>AA865917

CCACCTCCTTCGACCTCCACTGCGCCCCACCTCCCTGCCTGTGTGTGTTATTTCAAAGGA

>AA946776

TCTGGCTGGTGGCCTGCGCGAGGGTGCAGTCTTACTTAAAAGACTTTCAGTTAATTCTCA

>AF104032

AGATGCTGTCGGCACCATGTTTATTTATTTCCAGTGGTCATGCTCAGCCTTGCTGCTCTG

>AW194680

TCCTTCCTCTTCGGTGAATGCAGGTTATTTAAACTTTGGGAAATGTACTTTTAGTCTGTC

>BC001293

GTCCTGTCCCTGTCTGGGAGTTGTGTTATTTAAAGATATTCTGTATGTTGTATCTTTTGC

>BE962007

ATTATATTTCAGGTGTCCTGAACAGGTCACTAGACTCTACATTGGGCAGCCTTTAAATAT

>BI493248

AGGAATGGTACTACCGTTCCAGATTTTCTGTAATTGCTTCTGCAAAGTAATAGGCTTCTT

>AF283645

CTGTACCCAAAGGATGCCAGAATACTAGTATTTTTATTTATCGTAAACATCCACGAGTGC

>AI669760

ATTGCCCCCCTAACCAATCATGCAAACTTTTCCCCCCCTGGGGTAATTCACCAGTTAAAA

>BC001492

CCCACAGTATTTAATGCCCTGTCAGTCCCTTCTAGTCTGACTCAATGGTAACTTGCTGTA

>BC004453

AAAACCAACTCTCTACTACACAGGCCTGATAACTCTGTACGAGGCTTCTCTAACCCCTAG

>BC010626

CTCAGACTGGGCTCCACACTCTTGGGCTTCAGTCTGCCCATCTGCTGAATGGAGACAGCA

>BC013117

CCTAATGGGGATTCCTCTGGTTGTTCACTGCCAAAACTGTGGCATTTTCATTACAGGAGA

>BC011949

CACTCACAATTGTTGACTAAAATGCTGCCTTTAAAACATAGGAAAGTAGAATGGTTGAGT

>AW083022

CTTTGAAGGGCTGCTGCACATTGTTGAATCCATCGACCTTTAGCTGCAATGGGATCTCTA

>R08175

TGCCTCATCGATATTATAGGGGTCCATCACAACCCAACTGTGTGGCCGGATCCTGAGTCT

>NM_000065

AAAACAGACAAAAGCCTTTGCCTTCATGAAGCATACATTCATTCAGGGGTAGACACACAA

>AK025181

TAACAAACAAAGGCAGTAGCTCATCACTTGGGTAGCAGGTACCCATTTTAGGACCCTACA

>NM_003914

ATATCAGAAGTGCCAATAATCGTCATAGGCTTCTGCACGTTGGATCAACTAATGTTGTTT

>AI123582

ATCATAGCCCAACCATGTGAGAAGAAGGAGAAGGCCCCCCTTTCTTCATTAATCTGAAAA

>BC004331

GCAGACCATTCTATCATACCTGGCAGGGCTTCTGTTTTATTTTGTAGGCTGGATGCTACC

>AI341378

ACTACAAGCCTCTTGTTTTTCACCAAAACCCTACATCTCAGGCTTACTAATTTTTGTGAT

>NM_004063

GCCATGCATACATGCTGCGCATGTTTTCTTCATTCGTATGTTAGTAAAGTTTTGGTTATT

>BC012926

CACCTATTTATTTTACCTCTTTCCCAAACCTGGAGCATTTATGCCTAGGCTTGTCAAGAA

>AL110274

GTGGACATAGCCACTAACCAACTAGTTACCTTTGGACTGCAACAAAAAATGTGAAAATGA

>AW473119

ACTTGTAAACCTCTTTTGCACTTTGAAAAAGAATCCAGCGGGATGCTCGAGCACCTGTAA

>AI685931

AATTCTCTATAAACGGTTCACCAGCAAACCACCAATACATTCCATTGTTTGCCTAGAGAG

>BF592799

AATGGCCCATGCATGCTGTTTGCAGCAGTCAATTGAGTTGAATTAGAATTCCAACCATAC

>BC000045

GAGCTCAGTACTTGCCCTGTGAAAATCCCAGAAGCCCCCGCTGTCAATGTTCCCCATCCA

>BC015582

ATGAAGCGGAATTAGGCTCCCGAGCTAAGGGACTCGCCTAGGGTCTCACAGTGAGTAGGA

>M60502

AGTGGCTATATCAACATCAGGGCTAGCACATCTTTCTCTATTATCCTTCTATTGGAATTC

本发明也提供第二组90种基因序列，其中约5-49种可用于实施本发明。这约5-49种基因序列可与其它序列表达水平的测定联用，只要该组90种(序列)中的基因序列表达水平可用于分类。本发明这种实施方案的一个非限制性例子是联合测定这90种基因序列中约5-49种的表达与多种其它序列的表达水平，例如利用实施本发明所用的微阵列平台来测定。当不用那些其它基因的表达水平来分类时，可认为它们是“过度”转录序列所致，对实施本发明不重要。或者，当利用那些其它基因的表达水平来分类时，它们属于本发明范围内，在此情况中利用上述序列无需排除利用其它序列的表达水平。

90种(基因序列)组中的38种包括在上述第一组74种(序列)中。两组之间相同成员的登录号是：AA456140、AA846824、AA946776、AF332224、AI620495、AI632869、AI802118、AI804745、AJ000388、AK025181、AK027147、AL157475、AW194680、AW291189、AW298545、AW473119、BC000045、BC001293、BC001504、BC004453、BC006537、BC008765、BC009084、BC011949、BC012926、BC013117、BC015754、BE962007、BF224381、BF437393、BI493248、M60502、NM_000065、NM_003914、NM_004063、NM_004496、NM_006115和R61469。这90种(基因序列)组中不存在于74种基因序列组中的成员的相应mRNA序列和其它鉴定信息见附件(序列表)。下文通过登录号以及相应的寡核苷酸序列提供了可用于实施本发明的这52种独特成员的鉴定信息清单。

>R15881

ACTTCTGGTGATGATAAAAATGGTTTTATCACCCAGATGTGAAAGAAGCTGCCTGTTTAC

>AI041545

GTGGTTCTGTAAAAACGCAGAGGAAAAGAGCCAGAAGGTTTCTGTTTAATGCATCTTGCC

>NM_024423

TTTATAAGGAAGCAGCTGTCTAAAATGCAGTGGGGTTTGTTTTGCAATGTTTTAAACAGA

>AB038160

CTTATGAAGCTGGCCGGGCCACTCACGTTCAATGGTACATCTGGGTCTCTATGTGGTTCT

>AK026790

GTGAGCCAGCATTTCCCATAGCTAACCCTATTCTCTTAGTCTTTCAAAATGTAGAATGGG

>BC012727

CTTTACACCTGATAAAATATTTTGCGAAGAGAGGTGTTCTTTTTCCTTACTGGTGCTGAA

>BC016451

GCATACATCTCATCCACAGGGGAAGATAAAGATGGTCACACAAACAGTTTCCATAAAGAT

>H09748

TGAGTTCAGCATGTGTCTGTCCATTTCATTTGTACGCTTGTTCAAAACCAAGTTTGTTCT

>NM_006142

AAGACCGAGACTGAGGGAAAGCATGTCTGCTGGGTGTGACCATGTTTCCTCTCAATAAAG

>AF191770

GGCATCTGGCCCCTGGTAGCCAGCTCTCCAGAATTACTTGTAGGTAATTCCTCTCTTCAT

>NM_006378

TGGATGTTTGTGCGCGTGTGTGGACAGTCTTATCTTCCAGCATGATAGGATTTGACCATT

>BC006819

TCCTGGCAGAGCCATGGTCCCAGGCTTCCCAAAAGTGTTTGTGGCAATTATTCCCCTAGG

>X79676

TTTGATGATAGCAGACATTGTTACAAGGACATGGTGAGTCTATTTTTAATGCACCAATCT

>BC006811

TTCTTCCAGTTGCACTATTCTGAGGGAAAATCTGACACCTAAGAAATTTACTGTGAAAAA

>NM_000198

GAACAATTGTGGTCTCTCTTAACTTGAGGTTCTCTTTTGACTAATAGAGCTCCATTTCCC

>AF301598

GTTAAGTGTGGCCAAGCGCACGGCGGCAAGTTTTCAAGCACTGAGTTTCTATTCCAAGAT

>NM_002847

CGGCCTACTGAGCGGACAGAATGATGCCAAAATATTGCTTATGTCTCTACATGGTATTGT

>NM_004062

CAGGGTGTTTGCCCAATAATAAAGCCCCAGAGAACTGGGCTGGGCCCTATGGGATTGGTA

>AW118445

TGTACAGTTTGGTTGTTGCTGTAAATATGGTAGCGTTTTGTTGTTGTTGTTTTTTCATGC

>BC002551

TACCAAACTGGGACTCACAGCTTTATTGGGCTTTCTTTGTGTCTTGTGTGTTTCTTTTAT

>AA765597

CATTGAGGTTTGGATGGTGGCAGGTAAAACAGAAAGGCAAGATGTCATCTGACATTAGGC

>AL137761

AGTTCAGCACTGTGGTTATCATTGGTGATGCCAGAAAACATTAGTAGACTTAGACAATTG

>X78202

TAAAATTTCTTGATTGTGACTATGTGGTCATATGCCCGTGTTTGTCACTTACAAAAATGT

>AK025615

AGCCATCTGGTGTGAAGAACTCTATATTTGTATGTTGAGAGGGCATGGAATAATTGTATT

>BC001665

CTTATTGTCACTGGTTAAGAACTTGGCGAGATTGAAGGGCTTTTGTTATTGTTGTTGGAT

>AI985118

CTTTCTAGTGAGCTAACCGTAACAGAGAGCCTACAGGATACACGTGAGATAATGTCACGT

>AL039118

TTGTCTTAAAATTTCTTGATTGTGATACTGTGGTCATATGCCCGTGTTTGTCACTTACAA

>AA782845

CCTGGGGGAAAGGGGCATTCATGACCTGAACTTTTTAGCAAATTATTATTCTCAGTTTCC

>BC016340

TTCATTAACAGTACTAAGTGGAAGGGATCTGCAGATTCCAAATTGGAATAAGCTCTATCA

>AA745593

CCAATGCAGAAGAGTATTAAGAAAGATGCTCAAGTCCCATGGCACAGAGCAAGGCGGGCA

>NM_004967

CAAGGCTACGATGGCTATGATGGTCAGAATTACTACCACCACCAGTGAAGCTCCAGCCTG

>BF510316

AGCTCACAGCTGGACAGGTGTTGTATATAGAGTGGAATCTCTTGGATGCAGCTTCAAGAA

>AA993639

TCCAAAGTAGAAAGGGTTCTTTTAGAAAACTTGAAGAATGTGCCTCCTCTTAGCATCTGT

>AV656862

GATGCATTTTTCAGTCCCTTTTCAGAGCAAATGCTTTTGCAATGGTAGTAATGTTTAGTT

>X69699

CCTGTGGGGCTTCTCTCCTTGATGCTTCTTTCTTTTTTTAAAGACAACCTGCCATTACCA

>BC013282

TTGCACTAAGTCATGCTGTTTCCTCAAAGAAGCTTTGTTTTTTGTTAACGTATTACTCAG

>AI457360

CTGGATCCCAGGCCCTGGCACCCCTCAGGAAATACAAGAAAAAGAATATTCACATCTGTT

>AW445220

TTAGAGGGGCCACCTATCAACTCATCAGTGTTCAAAGAATATGCTGGGAGCATGGGTGAG

>AF038191

GGCCCATTTATGTCCCTCATGTCTCTAGATTTTCTCGTCACCCAGCCTCAAAAATATATG

>X05615

TCCCCAAAAACCTCACCCGAGGCTGCCCACTATGGTCATCTTTTTCTCTAAAATAGTTAC

>BC005364

GAAATTCCTCACACCTTGCACCTTCCCTACTTTTCTGAATTGCTATGACTACTCCTTGTT

>AK025701

TGTCTGTCCACCACGAGATGGGAGGAGGAGAAAAAGCGGTACGATGCCTTCCTGACCTCA

>BF446419

GTCTTATCTCTCAGGGGGGGTTTAAGTGCCGTTTGCAATAATGTCGTCTTATTTATTTAG

>AK025470

CCGAGTAGTATGGGTCTCTGTGTGAGAAACCAGGAGATATTTTCATCTTGTTCGGAAATA

>BE552004

TTGTGCAAAAGTCCCACAACCTTTCTGGATTGATAGTTTGTGGTGAAATAAACAATTTTA

>H05388

TCCAGTATTCTGCAGGGCCAGTCAGTTGTACAGAAGTTGGAATATTCTGTTCCAGAATTA

>NM_033229

GTCTCGAACAGCGGTTGTTTTTACTTTATTTATCTTAGGCCCTCAGCTCCCTGACGTCCT

>BC010437

AGTGAATCTTTTCCTCTTGGTAGCATCAACACTGGGGATAAATCAGAACCATTCTGTGGA

>AI952953

TGAGAGCCCAGAACAAGAAGGAGCAGAAGGGCACTTTGACCTTCATTATTATGAAAATCA

>R45389

GGAAGAACTGATGCTTGCTGCTAACTAAAGTTTTGGATGTATCGATTTAGAGAACCAATT

>NM_001337

GAATGAGAGAATAAGTCATGTTCCTTCAAGATCATGTACCCCAATTTACTTGCCATTACT

>AI499593

TACGGAAAGGAAACAGGTTATACTCTTAGATTTAAAAAGTGAAAGAAACTGCAGGCGCCT

在本发明的一些实施方案中，可通过检测含细胞样品中所表达的序列与以上寡核苷酸的杂交来检测基因序列的表达水平，所述寡核苷酸对应于附件(序列表)所提供的登录号所示的序列。

在其它实施方案中，本发明提供74种(基因序列)组或90种(基因序列)组中任何数目基因序列在本发明方法中的应用。因此，在任何情况中本发明采用上述一组或两组中的49种基因序列的1种到全部。因此，可采用74种(基因序列)组或90种(基因序列)组中的约5-49种序列的1、2、3、4或5种以上。类似地，采用10-49种序列时，可采用来自这两组之一的6、7、8、9或10种序列。

本文所用的“肿瘤样品”或“含有肿瘤的样品”或“含有肿瘤细胞的样品”或其变化形式指分离自怀疑患有或处于患癌症风险的个体的含细胞组织或液体样品。这些样品可含有用已知方法或技术人员认为合适的其它方法分离的肿瘤细胞。这些方法包括但不限于：显微解剖、激光捕获显微解剖(LCM)或激光显微解剖(LMD)然后用于本发明。或者，可以利用组织“切片”中未经切割的细胞。这种样品的非限制性例子包括原代分离物(与培养的细胞相反)，可用非侵入性或最低限度侵入性方法收集这些样品，所述方法包括但不限于：导管灌洗、细针吸取、针刺活检、美国专利6,328,709所述的装置和方法或本领域已知的任何其它合适方法。或者，可通过非侵入性方法，包括但不限于外科手术活检来收集样品。

可通过本领域已知的各种方法或技术人员认为合适的方法来检测与测量转录序列。基本上可采用任何试验方法，只要该试验能定量或定性反映所要检测的转录序列的表达。

认识到所述基因序列(无论随机选择的还是专门化的)表达水平的相关性而不是用测定实际表达水平的试验形式即能对肿瘤样品进行分类。本发明的试验可利用本文所述各个基因序列的任何经鉴定的特征，只要该试验能定量或定性反映“转录组”(基因组中各基因的转录组分)或“蛋白质组”(基因组中各基因表达的翻译组分)中该基因的表达。其它试验包括检测蛋白质组相关成员的多肽片段的那些试验。后者的非限制性例子包括检测生物液体，例如血液或血清中的蛋白酶解片段。要鉴定的特征包括但不限于编码(DNA)或表达(RNA)的独特核酸序列，所述的某基因序列编码蛋白质的特异性基因或表位，或该蛋白质的活性。

其它方法包括检测可表明表达水平增加的核酸扩增，可表明表达水平降低的核酸灭活、缺失或甲基化。换言之，可通过检验作为各个基因序列表达基础的DNA模板、用作表达该序列的中间体的RNA或该序列所表达的蛋白质产物的一个或多个方面，以及这种产物的蛋白酶解片段来实施本发明。同样，可通过检测这种DNA、RNA和蛋白质分子的存在、含量、稳定性或降解(包括速率)来实施本发明。

在一些实施方案中，可通过诸如聚合酶链式反应(PCR)及其变化形式，例如但不限于定量PCR(Q-PCR)、逆转录PCR(RT-PCR)和实时PCR(包括检测样品中各序列的mRNA拷贝的初始量的方法)，任选实时RT-PCR或实时Q-PCR来扩增和检测某基因的全部或部分序列。这种方法可利用与某基因序列各部分互补的一种或两种引物，利用这种引物来引发核酸合成。任选标记新合成的核酸，可直接或通过与本发明多核苷酸杂交来检测。可使新合成的核酸在杂交条件下与本发明(含有基因序列)的多核苷酸接触。检测所述核酸表达的其它方法包括RNA酶保护试验，包括液相杂交和细胞原位杂交。

或者，可如2003年9月19日提交的美国专利申请60/504,087、2003年12月2日提交的10/727,100和2004年2月6日提交的10/773,761(所有三份申请如同全文列出一样纳入本文作为参考)所述检测FFPE样品中基因序列的表达。简言之，作为非限制性例子可采用杂交介导的检测(例如但不限于微阵列、珠或颗粒技术)或定量PCR介导的检测(例如但不限于实时PCR和逆转录PCR)来检测某基因序列全部或一部分的表达的或转录物。作为非限制性例子可采用免疫组织化学技术或其它抗体介导的检测(例如但不限于利用与其它相比能特异性结合该多肽至少一部分的标记抗体)来检测某表达多肽的全部或一部分的表达。也可用分析基因表达的其它方法，包括在一次试验中检测样品中全部或接近全部的基因表达(例如，作为基因表达概况分析的一部分，如在微阵列上进行分析)。线性RNA扩增的非限制性例子描述于美国专利申请10/062,857(2001年10月25日提交)，以及美国临时专利申请60/298,847(2001年6月15日提交)和60/257,801(2000年12约22日提交)，所有这些申请如同全文列出一样全文纳入本文作为参考。

利用核酸试验来测定表达的实施方案包括根据本领域已知的技术将一种或多种基因序列固定在固体支持物上，包括但不限于固定在诸如阵列或珠固体基材。或者，也可采用本领域已知的溶液表达试验。固定的基因序列可采取独特的或者所述基因的特异性多核苷酸形式从而使这些多核苷酸能与所述基因的DNA或RNA杂交。这些多核苷酸可以是全长基因或任选干扰最少(例如因错配或插入非互补碱基对)从而不影响与这些基因的相应DNA或RNA杂交的这些基因的短序列(由于删除了该序列的5’或3’末端，最长的也比本领域已知的全长序列短一个核苷酸)。在一些实施方案中，所用的多核苷酸是所述基因的3’末端，例如从某基因或所表达序列的聚腺苷酸化信号或聚腺苷酸化位点计算长约350、约300、约250、约200、约150、约100或约50个核苷酸。与所述基因的序列相比，也可利用含有突变的多核苷酸，只要这些突变虽存在但仍能杂交而产生可检测信号。因此，在所述序列和对象样品的细胞所表达的那些序列之间虽存在少量错配但不影响本发明的实施。在某种动物个体之间的序列多态性的情况中可观察到存在这种错配的非限制性例子，例如智人中的个别人患者。

本领域技术人员应知道，一些基因序列包含不会造成所述序列的独特性的3’poly A(或互补链上的poly T)延伸段。因此，可利用缺乏3’poly A(或3’poly T)延伸段的基因序列实施本发明。所述序列的独特性指只见于核酸中的这些序列的各部分或全部，包括见于其3’非翻译部分的独特序列。实施本发明的一些独特序列是形成所述基因的共有序列的那些序列，这些独特序列可用于检测不同个体中的表达而不是存在于一些个体中的多态性特异性序列。或者，可利用某个体或某亚群的独特序列。这些独特序列可以是本文所述的本发明多核苷酸的长度。

在本发明的其它实施方案中，可利用含有存在于所述基因序列3’非翻译区和/或非编码区的序列的多核苷酸来检测本发明含细胞样品中的表达水平。这种多核苷酸可任选含有见于所述基因序列编码区3’部分的序列。含有编码和3’非编码区序列相组合的多核苷酸优选具有连续排列和没有间插异源序列的序列。

或者，可利用含所述基因序列5’非翻译区和/或非编码区的序列的多核苷酸来实施本发明从而可检测本发明细胞和样品中的表达水平。这种多核苷酸可任选含有所述编码区5’部分的序列。含有编码区和5’非编码区序列相组合的多核苷酸可具有连续排列和没有间插异源序列的序列。也可利用所述基因序列编码区的序列实施本发明。

一些实施方案的多核苷酸含有由至少约16、至少约18、至少约20、至少约22、至少约24、至少约26、至少约28、至少约30、至少约32、至少约34、至少约36、至少约38、至少约40、至少约42、至少约44或至少约46个连续核苷酸组成的3’或5’非翻译区和/或非编码区序列。上句所用的术语“约”指所述数值加减1。其它实施方案利用含有至少或约50、至少或约100、至少约或150、至少或约200、至少或约250、至少或约300、至少或约350或至少或约400个连续核苷酸的序列的多核苷酸。上句所用的术语“约”指所述数值加减10％。

本发明多核苷酸中的基因编码区3’或5’端的序列与上述那些序列长度相同，除了它们受限于该编码区的天然长度。编码区的3’端可包括多达该编码区3’一半的序列。反之，编码区的5’端可包括多达该编码区5’一半的序列。当然，可采用上述序列或含有其各部分的编码区和多核苷酸的全长。

在本发明的另一实施方案中，可利用所述基因序列5’和/或3’端含有核苷酸缺失的多核苷酸。宜是5’和/或3’端缺失1-5、5-10、10-15、15-20、20-25、25-30、30-35、35-40、40-45、45-50、50-60，60-70、70-80、80-90、90-100、100-125、125-150、150-175或175-200个核苷酸，虽然缺失的程度受限于该序列的天然长度和能否利用这些多核苷酸检测表达水平的需要。

所述基因序列3’端衍生的本发明其它多核苷酸包含用于定量PCR的引物与任选探针的那些(序列)。引物和探针优选是能扩增以下区域的那些：即从某基因或所表达序列的聚腺苷酸化信号或聚腺苷酸化位点算起长度少于约750、少于约700、少于约650、少于约6000、少于约550、少于约500、少于约450、少于约400、少于约350、少于约300、少于约250、少于约200、少于约150、少于约100或少于约50个核苷酸的区域。本发明的PCR扩增子可以是任何大小，包括至少或约50、至少或约100、至少约或150、至少或约200、至少或约250、至少或约300、至少或约350或至少或约400个连续核苷酸，所有均包含与所用PCR引物互补的部分。

用于实施本发明的其它多核苷酸包括与所述基因序列具有足够同源性可采用杂交技术来检测它们表达的那些(序列)。这种多核苷酸优选与待用基因序列具有约或95％、约或96％、约或97％、约或98％或约或99％的相同性。如上所述，采用BLAST算法测定相同性。用于实施本发明的其它多核苷酸也可根据能否在严谨性条件下与本发明多核苷酸杂交的能力来描述，所述严谨性条件是用约30％v/v-约50％甲酰胺和约0.01M-约0.15M盐进行杂交，用约0.01M-约0.15M盐和约55-约65℃洗涤，或与其等价的条件。

在本发明的其它实施方案中，提供含有人基因序列的一条或两条链的单链核酸分子群作为探针，使该(分子)群的至少一部分与定量扩增的本发明细胞或样品的RNA核酸分子的一条或两条链杂交。该(分子)群可以只是人基因序列的反义链，从而使细胞中的或从细胞中扩增的分子的有义链可与所述(分子)群的一部分杂交。与含有互补基因序列的表达(或扩增)的核酸分子的含量相比，该(分子)群优选包含充分过量的人基因序列的一条或两条链。

本发明还提供通过检测获自人对象的含核酸或细胞样品中约5-49种转录序列表达水平对人肿瘤样品进行分类，与将该样品分类为含有人的某肿瘤类型的肿瘤细胞而排除其它一种或多种人肿瘤的方法。在一些实施方案中，可采用该方法将某样品分类为上述53种肿瘤或肿瘤细胞之一从而排除其它52种的一种或多种。在其它实施方案中，可采用该方法将某样品分类为上述34种肿瘤或肿瘤细胞之一从而排除其它33种肿瘤的一种或多种。在其它实施方案中，可采用该方法将某样品分类为上述39种肿瘤或肿瘤细胞之一从而排除其它38种肿瘤的一种或多种。

本发明也提供通过检测获自人对象含核酸的肿瘤样品中50种以上转录序列表达水平将肿瘤样品分类为本文所述可能的肿瘤类型某亚组，与将该样品分类为人多肿瘤类型之一而排除其它一种或多种人肿瘤的方法。在本发明的一些实施方案中，其它肿瘤类型数目是1-约3种、更优选1-约5种、1-约7种、1-约9种或约10种。在其它实施方案中，肿瘤类型数目是同一组织或器官来源的所有类型，例如上述那些类型。本发明的此方面与以上图10所讨论的和为提高可信度用特异性作为交换有关，并优选应用于将样品分类为可能的肿瘤类型某一亚组而提高将样品分类为单一类型肿瘤的精确度或性能水平的情况中。

在其它实施方案中，可通过分析一种细胞或均质细胞群的基因表达来实施本发明，所述细胞群除去了简单活检中存在的污染细胞，或者从中分离或纯化。这些实施方案的一个优点是可除去污染性非肿瘤细胞(例如浸润淋巴细胞或其它免疫系统细胞)从而不会影响对本文所鉴定的基因或随后基因表达水平的分析。这种污染细胞存在于用于产生基因表达概况的活性组织中。

在采用Q-PCR或逆转录Q-PCR作为试验平台的本发明其它实施方案中，可将本发明基因序列的表达水平与同一样品中的参比基因的表达水平作比较或者利用此表达水平的比例。这为多种已知肿瘤与测试的含细胞样品的数据比较提供了表达数据“标准化”的方法。尽管可利用多种参比基因，但也可利用39种肿瘤组这经鉴定的8种特定基因序列来实施本发明。此外，可采用多重形式的全部或一部分进行Q-PCR。

此8种参比序列的相应mRNA序列和其它鉴定信息见附件(序列表)。下文提供了包括登录号和其它信息在内的鉴定信息的清单。

>Hs.77031_mRNA_1 gi|16741772|gb|BC016680.1|BC016680智人克隆MGC：21349IMAGE：4338754聚腺苷酸＝3

>Hs.77541_mRNA_1 gi|12804364|gb|BC003043.1|BC003043智人克隆MGC：4370 IMAGE：2822973聚腺苷酸＝3

>Hs.7001_mRNA_1 gi|6808256|emb|AL137727.1|HSM802274智人mRNA；cDNA DKFZp434M0519(来自克隆DKFZp434M0519)；部分cds聚腺苷酸＝3

>Hs.302144_mRNA_1 gi|11493400|gb|AF130047.1|AF130047智人克隆FLB3020聚腺苷酸＝0

>Hs.26510_mRNA_2 gi|11345385|gb|AF308803.1|AF308803智人染色体15遗传图15q26聚腺苷酸＝3

>Hs.324709_mRNA_2 gi|12655026|gb|BC001361.1|BC001361智人克隆MGC：2474IMAGE：3050694聚腺苷酸＝2

>Hs.65756_mRNA_3 gi|3641494|gb|AF035154.1|AF035154智人染色体16遗传图16p13.3聚腺苷酸＝3

>Hs.165743_mRNA_2 gi|13543889|gb|BC006091.1|BC006091智人克隆MGC：12673IMAGE：3677524聚腺苷酸＝3

可通过与上述其它基因序列相同或不同的方法来检测任何上述参比序列之一的表达。在本发明的一些实施方案中，可通过检测含细胞样品中表达的序列与以下寡核苷酸的杂交来检测所述基因序列的表达水平，以下寡核苷酸对应于所提供的登录号所示的上述序列。

>BC006091

TCATCTTCACCAAACCAGTCCGAGGGGTCGAAGCCAGACACGAGAGGAAGAGGGTCCTGG

>BC003043

CTCTGCTCCTGCTCCTGCCTGCATGTTCTCTCTGTTGTTGGAGCCTGGAGCCTTGCTCTC

>AF130047

TGCTCCCGGCTGTCCTCCTCTCCTCTTCCCTAGTGAGTGGTTAATGAGTGTTAATGCCTA

>AF035154

CCCCATCTCTAAAACCAGTAAATCAGCCAGCGAATACCCGGAAGCAAGATGCACAGGCGG

>BC001361

CCAGAAACAAGGAAGAGGAAAGACAAAGGGAAGGGACGGGAGCCCTGGAGAAGCCCGACC

>AF308803

AAGTACAACCCATGCTGCTAAGATGCGAGCAGGAAGAGGCATCCTTTGCTAAATCCTGTT

>BC016680

ACCTCACCCCTGCCCGGCCCAAGCTCTACTTGTGTACAGTGTATATTGTATAATAGACAA

>AL137727

TTCCCTTAATTCCTCCTCCCGACCTTTTTTACCCCCCCAGTTGCAGTATTTAACTGGGCT

在其它方面，本发明提供的方法也可全部或部分自动进行。这包括本发明的软件实施方案。非限制性例子包括一个或多个计算机可读存储装置上的处理器可执行指令，其中所述指令可根据本文所述的基因表达水平指导对肿瘤样品的分类。(本发明)考虑了一个或多个计算机可读存储装置上的处理器可执行指令，其中所述指令通过计算机输出装置提供和/或操纵分类方法的过程或结果。

本发明包括软件和硬件实施方案，其中将多种已知肿瘤类型的一组基因序列的基因表达数据具体化为一数据集。在一些实施方案中，可利用该基因表达数据集来实施本发明方法。本发明也提供用于执行本文所述方法的计算机相关工具和系统。一些实施方案提供了对含细胞样品进行分类的设备。这种设备可包括配置为接收查询存储的查询输入，而查询存储配置为能存储从查询输入接收到的本文所述基因表达的数据集；与访问并在本文所述分类算法中使用存储数据的模块。该设备还可包括(作为)分类算法结果的串存储，任选具有访问并在本文所述输出算法中使用该串存储数据的模块。

结合上述方法、工艺或算法的各步骤与本文所述实施方案直接体现在硬件、处理器所执行的软件模块或二者的结合。可以所示顺序，或以另一顺序进行某方法或工艺的各步骤或行为(act)。因此，可省去一个或多个工艺或方法步骤，或者可在这些方法和工艺中加入一个或多个工艺或方法步骤。可在这些方法和工艺的开始、结束或中间阶段加入额外的步骤、块(block)或行为(action)。

本发明的其它方面提供了本发明与临床活动相关的应用。在一些实施方案中，进行本文所述的测定或检测基因表达作为向患者提供医疗护理的一部分，包括提供用于支持医疗护理的诊断服务。因此，本发明包括患者的医疗护理方法，该方法包括如本文所述测定或检测获自患者的含细胞样品中所述基因序列的表达水平。该方法还包括以本文所述方式根据测定/检测(结果)将样品分类为含某肿瘤类型或组织来源的肿瘤细胞。所述测定和/或分类(结果)可如本文所述用于本发明的任何方面或实施方案中。

可先进行各种相关行为再测定或检测表达水平。在一些实施方案中，先测定或诊断需要所述检测的人对象，再进行这种检测。可先由经批准能从事这种检测要求为该检测偿付或支付费用的医生、护士或其他卫生保健人员或专职人员，或在他们指导下工作的人员，或健康保险或保健组织(health insurance or maintenanceorganization)的人员确定是否需要检测后再检测。

也可先做好实际检测所需的准备后再检测。非限制性例子包括实际获得人对象的含细胞样品；或接受含细胞样品；或者制作含细胞样品的切片；或者分离含细胞样品中的细胞；或者分离含细胞样品中的细胞RNA；或者逆转录含细胞样品中细胞的RNA。样品可以是可用于实施本发明的本文所述的任何样品。

在其它实施方案中，本发明提供对患者实施医疗护理或本发明其它方法的预订或接收订单的方法。医生、护士或其他卫生保健人员，或在他们的指导下工作的人员可作出预订，而能执行这些方法的任何人可直接或间接接收(订单)。可通过任何联系方式预订，包括手写、口述、电子、数字、模拟、电话、亲自、传真、邮件或通过美国国内管辖区域的其它方式。

本发明还提供处理检验(例如上述患者的医疗护理方法或本发明的其它方法)的偿付或支付的方法。处理偿付或支付的方法包括在实施本发明的表达水平检测、测定或测试后以书面或数据库形式表明：1)报酬已收到，或2)将由另一付款人付费，或3)仍未付费。所述数据库可以是任何形式，本发明范围包括电子形式，例如计算机可执行数据库。表明可采取书面或数据库中密码的形式(如CPT密码)。“另一付款人”可以是除以前作出要求偿付或支付的人以外的任何个人或团体。

或者，该方法可包括为在技术上或实际上实施了上述患者医疗护理方法，解释所述方法的结果或本发明任何其它方法而接受偿付或支付(的费用)。当然本发明也包括让另一人或团体接收偿付或支付(的费用)的指令的实施方案。这种指令可以用任何联系方式，包括上述方式。接收者可以是任何实体，包括作为非限制性例子的保险公司、保健组织、政府卫生部门或患者。付费可以是全部或部分付费。在患者的情况中，付费可以是称为共同付费(co-pay)的一部分付费形式。

在另一实施方案中，该方法可包括因实施了上述患者的医疗护理方法或本发明其它方法而向保险公司、保健组织、政府卫生部门或患者发出或已发出偿付或支付要求。这种要求可以用任何联系方式，包括上述方式。

在其它实施方案中，该方法可包括接收为实施了上述患者的医疗护理方法或本发明其它方法而批准的费用，或拒绝付费的指示。这种指示来自被要求偿付或支付的任何个人或团体。非限制性例子包括保险公司、保健组织或政府卫生部门，例如作为非限制性例子的Medicare或Medicaid部门。这种指示可以用任何联系方式，包括上述方式。

另一实施方案是该方法包括因实施了上述患者的医疗护理方法或本发明其它方法而发出偿付或支付要求。这种要求可以用任何联系方式，包括上述方式。可向保险公司、保健组织或联邦卫生部门或实施了该方法的患者作出此要求。

其它方法包括因实施了上述患者的医疗护理方法或本发明其它方法而以数据库形式或在数据库中显示需要偿付或支付(费用)。或者，该方法可简单显示已执行了该方法。数据库可以是任何形式，本发明范围包括电子形式，例如计算机可执行数据库。所述显示可采取书面或数据库密码的形式(如CPT密码)。

在上述患者的医疗护理方法或本发明其它方法中，该方法可包括任选向医疗护理机构、卫生保健人员或专职人员、医生、护士或为其工作的人员报道该方法获得的结果。报道可直接或间接(给予)患者。报道可以用任何联系方式，包括上述方式。

本发明还提供测定或检测本文所述含细胞样品中基因表达水平的试剂盒。试剂盒一般装有一种或多种试剂来检测用于实施本发明的本文所述的基因表达。非限制性例子包括用于检测表达水平的多核苷酸探针或引物，用于本发明方法的一种或多种酶，用于实施本发明的一根或多根试管。在一些实施方案中，该试剂盒装有用于检测本文所述基因表达的阵列或能组装到阵列中的固体介质。在其它实施方案中，该试剂盒装有的一种或多种抗体与多肽上存在的表位发生免疫相互作用而表明基因序列的表达。在一些实施方案中，所述抗体可以是抗体片段。

本发明的试剂盒也可装有显示或描述该试剂盒或本发明引物或探针在本文提供的本发明方法中的应用的说明书。试剂盒也可装有其它组分以帮助实施试剂盒所设计的具体应用。因此，例如试剂盒可额外装有检测标记物(例如，酶标记物的酶底物，检测荧光标记物的过滤装置，合适的第二标记物，例如绵羊抗-小鼠-HRP等)的装置。试剂盒还可装有用于本发明方法的缓冲液和其它识别试剂。

现已总体描述了本发明，参考以下实施例更易于理解本发明，除非另有指定，提供这些实施例是为了说明而不是要限制本发明的范围。

实施例

实施例1：随机基因组的信息容量

测试了用于分类39种肿瘤的100种随机选择的表达基因序列的亚组分类39种肿瘤的诸亚组的能力。将100种表达序列的5、10、15、20、25、30、35、40、45和49种的随机组合(各组合取样10次)的表达水平与肿瘤类型的数据联用，然后用于预测2-所有39种类型肿瘤样品的诸随机测试组(各取样10次)。图1显示了各基因组的分类能力与所分类肿瘤类型的数目相关。如预期的一样，肿瘤类型分类的精确度越高，需要的基因序列数目越多。图2显示对数目不同的肿瘤类型的分类能力与所用基因序列的数目相关。

所述100种基因序列的GenBank登录号是：AF269223、BC006286、AK025501、AJ002367、AI469140、AW013883、NM_001238、AI476350、BC006546、AI041212、BF724944、AI376951、R56211、BC006393、X13274、BC001133、N62397、BC000885、AK001588、AK057901、AF146760、AI951287、AK025604、BC007581、BC015025、R43102、AW449550、AI922539、AI684144、AI277662、BC015999、AW444656、BC011612、BC015401、BF447279、BC009956、AL050163、BC001248、BE672684、AL137353、BC001340、U45975、BE856598、BC009060、AL137728、AA713797、AL583913、AK054617、AI028262、AI753041、BG939593、AL080179、AA814915、AF131798、AI961568、BC009849、AK021603、BC012561、AI570494、BC006973、AW294857、BC004952、AK026535、AI923614、AW082090、AI005513、AF339768、AK023167、AF169693、AF076249、BC007662、BC015520、AI814187、AI565381、AW271626、AK024120、AF139065、BC014075、AI887245、AF257081、AI767898、AF070634、AF155132、X69804、U65579、NM_004933、AI655104、AW131780、AI650407、AF131774、AA814057、AJ311123、BC009702、AF264036、AL161961、AJ010857、AF106912、AK023542、AF073518和D83032。以1-100号给它们编索引，以下是本发明所用的代表性随机组：

就2种基因而言，基因33和63、基因17和72、基因64和21、基因48和25、基因88和54、基因80和32、基因24和99、基因14和31、基因80和23和基因18和34用作10个随机组。

就5种基因而言，第1组采用了基因27、97、56、88和50。第2组采用了基因24、26、35、48和83。第3组采用了基因46、62、75、91和2。第4组采用了基因19、61、34、87和13。第5组采用了基因56、32、66、20和55。第6组采用了基因90、21、6、78和66。第7组采用了基因73、47、3、82和86。第8组采用了基因74、39、13、7和67。第9组采用了基因34、1、24、85和62。第10组采用了基因23、89、15、54和98。

就10种基因而言，第1组采用了基因11、58、90、40、20、44、10、78、72和74。第2组采用了基因79、71、42、48、93、56、55、14、92和52。第3组采用了基因62、53、52、19、98、26、76、65、33和40。第4组采用了基因94、8、16、99、58、19、97、92、76和86。第5组采用了基因18、97、16、94、84、52、11、24、89和92。第6组采用了基因12、42、45、51、2、75、63、28、13和58。第7组采用了基因67、98、55、32、82、42、2、45、37和23。第8组采用了基因40、43、69、68、13、97、35、3、44和42。第9组采用了基因69、47、96、80、100、50、42、26、65和17。第10组采用了基因83、84、69、67、19、85、35、11、70和64。

就15种基因而言，第1组采用了基因98、81、43、63、18、56、19、97、47、13、48、99、75、45和83。第2组采用了基因5、72、31、59、81、40、92、3、23、50、57、74、62、21和93。第3组采用了基因11、69、91、100、38、1、73、64、90、26、62、2、37、23和18。第4组采用了基因76、9、53、4、11、41、77、44、87、51、54、49、43、56和67。第5组采用了基因55、34、13、89、52、74、96、80、48、22、31、39、43、91和54。第6组采用了基因59、88、15、90、4、73、93、7、10、18、98、83、43、3和5。第7组采用了基因68、91、77、33、88、94、95、41、46、27、36、51、97、7和2。第8组采用了基因7、10、78、40、70、84、55、1、98、22、99、91、8、17和89。第9组采用了基因65、10、38、8、77、98、37、43、93、99、86、16、82、27和9。第10组采用了基因97、27、78、38、24、19、55、47、77、13、45、25、43、70和68。

就20种基因而言，第1组采用了基因41、94、38、76、35、65、92、26、49、7、85、54、77、66、98、15、86、69、70和67。第2组采用了基因43、87、1、81、7、14、94、28、25、55、100、41、18、47、96、89、26、53、29和32。第3组采用了基因48、80、90、99、50、98、36、91、6、41、61、96、74、66、9、5、16、18、20和1。第4组采用了基因49、58、73、24、94、22、41、52、18、19、63、91、74、37、59、95、53、87、72和13。第5组采用了基因67、74、2、98、46、69、5、42、22、66、60、20、100、80、24、76、63、9、39和15。第6组采用了基因10、74、50、92、69、68、52、56、63、71、11、17、29、64、88、59、25、94、35和57。第7组采用了基因97、72、16、19、14、42、70、31、29、13、22、37、95、69、87、39、18、81、58和100。第8组采用了基因5、3、18、91、77、19、82、31、92、22、93、45、76、84、46、100、53、99、89和42。第9组采用了基因62、3、85、37、34、93、52、40、74、25、86、57、33、60、20、77、78、17、28和13。第10组采用了基因22、26、23、39、35、10、43、32、65、38、54、45、8、17、90、20、83、60、6和58。

就25种基因而言，第1组采用了基因21、28、50、27、8、48、74、80、38、96、71、15、89、84、32、26、55、36、29、68、13、7、18、63和72。第2组采用了基因61、38、59、92、3、80、33、68、79、70、44、26、95、63、85、27、60、43、75、96、42、99、58、48和91。第3组采用了基因75、83、78、5、99、56、26、36、57、23、37、28、88、16、63、2、72、59、9、80、52、91、62、3和27。第4组采用了基因48、75、84、83、88、29、13、9、98、6、31、63、45、5、51、52、39、22、100、91、74、12、94、21和8。第5组采用了基因79、84、47、43、26、37、46、19、85、91、2、10、81、89、38、71、17、57、7、93、31、87、29、78和73。第6组采用了基因62、93、83、42、97、96、78、98、47、22、67、48、89、95、24、81、16、45、8、90、66、64、2、3和58。第7组采用了基因100、34、58、28、104、35、88、76、6、30、83、81、67、36、39、87、66、45、20、15、86、56、55和95。第8组采用了基因17、43、50、63、47、58、95、32、79、60、16、91、86、22、97、21、9、55、72、78、77、45、100、14和30。第9组采用了基因24、67、60、94、59、14、70、84、8、89、63、23、39、11、81、42、33、3、12、93、54、35、78、73和90。第10组采用了基因11、2、19、62、13、51、30、80、81、82、52、34、67、57、25、95、93、39、26、48、44、89、61、17和18。

就30种基因而言，第1组采用了基因30、97、54、21、34、9、56、71、62、14、24、23、89、61、76、41、29、67、94、22、88、4、40、33、38、78、82、66、84和100。第2组采用了基因89、41、56、43、98、44、35、26、19、86、15、67、8、69、3、76、48、17、55、31、25、91、72、36、18、82、37、50、9和75。第3组采用了基因28、39、78、15、65、93、66、29、88、35、49、69、50、9、53、80、81、95、76、44、48、64、83、11、70、33、73、96、56和92。第4组采用了基因4、2、19、6、11、84、94、44、60、37、29、97、53、83、98、45、65、9、85、35、20、89、10、17、23、74、70、41、18和76。第5组采用了基因27、4、43、1、10、95、88、74、77、47、63、81、31、9、41、100、87、57、8、79、24、6、26、20、55、61、34、42、25和39。第6组采用了基因47、67、98、56、37、44、5、70、48、12、20、86、83、89、27、59、19、54、69、97、43、71、58、82、8、50、51、10、25和72。第7组采用了基因100、99、37、58、44、60、39、3、59、96、50、68、94、69、83、90、17、4、5、67、88、56、29、79、23、1、38、25、49和74。第8组采用了基因26、23、58、47、6、68、41、31、16、64、19、75、36、32、87、2、12、97、73、21、53、78、15、94、1、20、79、81、70和7。第9组采用了基因61、48、78、75、12、36、37、66、91、2、92、32、8、26、6、82、14、68、4、88、39、89、43、41、40、87、69、74、42和9。第10组采用了基因58、99、60、39、50、25、22、57、48、85、24、10、97、68、36、38、93、62、52、56、34、18、32、64、95、81、74、88、61和96。

就35种基因而言，第1组采用了基因52、68、22、92、43、75、20、62、15、76、99、61、64、36、12、66、24、21、31、88、25、6、93、91、55、74、69、90、23、4、80、72、97、58和1。第2组采用了基因48、21、68、16、96、10、1、69、36、20、3、14、59、53、12、84、90、17、9、65、4、32、75、81、88、37、38、5、94、60、64、45、7、43和55。第3组采用了基因33、95、59、86、83、76、36、55、90、22、62、98、34、46、4、87、5、66、38、78、97、100、71、25、30、2、21、99、12、54、9、14、81、32和52。第4组采用了基因27、64、40、59、63、100、50、19、1、10、96、2、34、28、67、26、87、41、15、57、33、11、94、66、82、6、52、55、84、47、97、83、80、62和5。第5组采用了基因99、86、92、72、83、48、79、46、91、2、90、9、23、44、85、31、38、81、76、54、71、14、3、13、62、11、39、4、95、36、20、30、75、63和51。第6组采用了基因41、89、81、29、86、95、34、42、50、9、45、21、64、84、74、91、69、98、57、79、39、87、93、63、26、82、2、59、30、71、83、38、77、24和73。第7组采用了基因87、60、59、98、43、38、28、64、29、92、22、27、40、33、69、71、73、79、15、70、32、90、76、93、6、50、55、9、49、54、36、5、48、19和10。第8组采用了基因100、70、98、79、91、23、37、29、73、65、78、31、3、11、30、51、16、40、95、94、62、38、67、39、82、72、22、5、87、57、6、75、35、99和46。第9组采用了基因46、61、59、86、29、74、56、89、52、26、54、20、84、97、33、71、14、36、38、49、28、60、19、90、11、42、87、92、82、21、94、3、22、2和39。第10组采用了基因31、76、77、27、72、38、42、36、53、82、61、39、98、81、34、80、22、100、8、32、17、21、28、56、59、29、55、5、62、40、90、87、24、68和37。

就40种基因而言，第1组采用了基因64、50、46、22、51、6、47、12、2、30、45、7、63、55、91、90、80、49、71、8、79、82、77、76、97、5、95、11、32、70、20、62、38、26、41、58、44、87、35和23。第2组采用了基因44、26、16、12、30、45、71、90、37、68、32、70、58、43、51、6、62、92、87、20、56、5、47、48、86、29、98、22、59、76、8、79、64、14、50、3、54、83、96和80。第3组采用了基因20、34、57、70、39、15、25、33、78、51、87、46、67、80、28、52、66、72、22、88、97、3、90、6、82、42、41、94、85、61、54、84、14、9、81、19、7、91、23和40。第4组采用了基因61、46、64、71、35、58、100、23、95、17、87、68、54、8、50、4、27、49、47、52、53、28、24、34、45、2、89、48、3、65、42、9、92、36、6、84、51、60、77和94。第5组采用了基因28、97、21、43、22、89、94、87、99、5、4、20、13、61、37、42、72、62、7、12、31、23、60、98、48、38、53、56、29、69、26、82、24、74、86、10、67、2、47和46。第6组采用了基因12、74、96、77、78、72、53、87、47、29、40、98、52、22、69、3、58、97、60、48、55、80、57、39、50、89、71、9、63、51、21、23、73、32、20、19、25、5、38和46。第7组采用了基因88、79、54、44、37、36、32、91、47、50、60、92、82、80、46、19、98、20、76、29、9、95、2、77、97、74、90、73、100、1、34、85、24、71、57、99、68、13、43和53。第8组采用了基因23、39、7、64、20、27、69、43、38、89、50、3、16、79、83、72、65、66、32、30、100、82、28、22、54、84、53、75、59、37、34、49、12、86、71、97、26、88、70和57。第9组采用了基因74、96、80、39、40、82、38、56、35、93、55、73、44、17、81、27、2、83、65、89、76、8、18、45、58、77、14、49、21、6、4、92、33、13、12、88、98、24、84和36。第10组采用了基因35、77、48、62、26、12、41、68、81、5、37、70、28、72、50、83、64、99、74、57、84、76、52、14、87、97、3、31、73、58、44、24、15、66、45、91、4、32、46和49。

就45种基因而言，第1组采用了基因52、97、84、72、96、34、18、38、88、80、91、49、71、64、93、26、62、40、68、29、67、39、60、9、13、74、95、99、27、47、25、45、31、8、69、17、75、53、51、12、23、1、6、30和50。第2组采用了基因97、80、55、32、94、84、28、3、6、48、17、41、65、37、79、34、61、83、35、49、27、38、43、2、24、77、25、71、58、14、8、30、46、98、82、75、22、72、26、74、93、66、73、1和53。第3组采用了基因64、45、38、92、23、74、66、60、100、3、82、20、54、11、19、16、80、86、14、75、62、10、52、47、13、31、35、53、41、9、79、39、17、22、99、58、46、83、43、40、44、90、95、12和81。第4组采用了基因20、66、9、24、16、76、99、42、86、58、15、93、48、28、26、50、68、12、2、37、82、36、27、57、45、41、32、1、52、54、30、39、7、100、59、23、94、75、8、60、55、34、38、29和87。第5组采用了基因66、88、73、53、51、69、36、87、78、40、58、76、31、65、56、42、100、68、5、18、17、91、45、22、74、82、1、44、67、43、10、63、79、92、6、72、80、75、9、30、19、61、99、3和38。第6组采用了基因75、66、84、59、9、70、100、27、79、41、73、67、23、39、28、68、21、69、38、72、86、82、36、46、77、34、47、54、13、16、7、88、22、26、4、89、55、24、61、12、35、50、95、92和80。第7组采用了基因59、86、10、29、53、88、43、64、11、13、19、17、36、65、73、94、20、51、80、24、66、83、44、47、21、6、52、82、69、54、100、28、18、34、35、30、74、91、49、46、60、5、38、71和2。第8组采用了基因77、32、55、44、6、98、94、19、10、71、72、85、67、75、78、88、90、58、89、27、69、42、31、47、1、37、52、7、57、45、11、83、49、46、34、64、14、24、87、9、56、8、20、36和15。第9组采用了基因4、27、83、61、46、15、35、26、51、54、23、38、100、7、42、58、44、8、22、37、20、89、56、91、70、29、11、19、87、99、21、65、72、75、49、40、45、30、43、48、63、3、18、74和1。第10组采用了基因68、19、90、52、55、23、17、53、3、2、74、82、26、88、48、6、8、43、15、73、57、67、85、91、13、44、81、1、75、33、51、21、4、41、77、86、40、18、31、78、92、10、64、99和69。

利用39种(肿瘤类型)组作肿瘤类型随机选择对39种肿瘤诸亚组进行分类。利用本文所述诸基因序列组的表达水平对这些肿瘤类型作随机组合进行分类。如这些实施例所述这些肿瘤类型的不同随机组与100、74和90种基因序列的各组联用。以下是所用的2到20种肿瘤的随机组的代表性和非限制性例子，其中从1-39给90种肿瘤类型组编索引。

就2种肿瘤类型而言，第1组采用了类型26和16。第2组采用了类型8和5。第3组采用了类型39和8。第4组采用了类型27和23。第5组采用了类型8和19。第6组采用了12和21。第7组采用了类型30和15。第8组采用了类型30和5。第9组采用了类型18和22。第10组采用了类型27和26。

就4种肿瘤类型而言，第1组采用了类型20、35、15和7。第2组采用了类型36、1、28和19。第3组采用了类型13、4、12和21。第4组采用了类型12、33、14和28。第5组采用了类型6、28、5和37。第6组采用了类型5、25、36和15。第7组采用了类型12、26、21和19。第8组采用了类型19、3、20和17。第9组采用了类型18、10、8和9。第10组采用了类型28、20、2和22.

就6种肿瘤类型而言，第1组采用了类型27、3、10、39、11和20。第2组采用了类型33、10、20、32、13和19。第3组采用了类型31、27、18、39、8和16。第4组采用了类型25、28、10、12、7和39。第5组采用了类型14、13、28、24、30和36。第6组采用了类型9、24、8、17、36和26。第7组采用了类型20、1、34、26、6和19。第8组采用了类型12、13、3、17、34和22。第9组采用了类型7、1、17、13、20和34。第10组采用了类型5、11、25、29、28和35。

就8种肿瘤类型而言，第1组采用了类型34、33、28、3、23、25、9和29。第2组采用了类型27、8、38、28、20、14、12和9。第3组采用了类型29、21、19、1、13、26、11和31。第4组采用了类型25、17、7、20、34、8、28和10。第5组采用了类型36、28、35、26、2、8、29和7。第6组采用了类型10、23、2、27、33、21、25和35。第7组采用了类型10、18、38、2、6、7、19和32。第8组采用了类型11、37、6、28、3、9、2和16。第9组采用了类型22、2、、10、8、17、19和33。第10组采用了类型35、39、8、10、37、4、36和6。

就10种肿瘤类型而言，第1组采用了类型25、10、26、2、32、31、39、23、22和18。第2组采用了类型12、35、6、16、20、3、39、36、11和2。第3组采用了类型34、1、15、29、5、39、2、12、25和18。第4组采用了类型10、8、14、18、31、19、23、20、32和33。第5组采用了types10、18、37、15、4、35、33、24、39和20。第6组采用了类型22、16、4、3、18、21、1、25、37和13。第7组采用了类型14、6、28、18、11、13、2、32、33和19。第8组采用了类型39、2、38、4、34、8、25、6、32和35。第9组采用了类型3、10、11、16、6、15、18、14、12和26。第10组采用了类型24、25、21、9、36、29、20、39、10和37。

就12种肿瘤类型而言，第1组采用了类型26、20、4、12、2、31、38、18、16、39、3和33。第2组采用了类型25、16、4、9、29、27、14、24、21、7、23和2。第3组采用了类型31、18、23、13、25、1、29、21、35、10、32和39。第4组采用了类型8、34、23、9、35、14、25、21、2、33、18和28。第5组采用了类型6、11、21、8、5、7、19、32、3、13、36和9。第6组采用了类型12、33、14、26、27、15、、2、21、36、35、9和39。第7组采用了类型26、29、32、17、31、19、6、5、20、34、2和24。第8组采用了类型17、12、8、22、28、9、27、29、14、35、4和32。第9组采用了类型29、9、36、23、33、18、21、35、3、6、2和1。第10组采用了类型1、3、35、29、22、27、8、23、2、36、14和19。

就14种肿瘤类型而言，第1组采用了类型9、26、38、25、31、3、15、14、17、33、12、35、39和16。第2组采用了类型1、26、16、25、20、12、14、37、38、24、23、33、27和35。第3组采用了类型11、21、35、38、32、34、27、39、16、15、4、5、13和18。第4组采用了类型27、5、13、28、18、17、15、20、29、37、21、36、25和14。第5组采用了类型5、12、17、9、25、21、33、37、8、15、24、3、34和28。第6组采用了类型11、19、34、26、9、6、32、14、27、29、30、16、24和17。第7组采用了类型31、26、11、18、19、20、9、8、5、36、12、6、27和38。第8组采用了类型20、17、11、5、15、9、2、39、34、24、27、26、35和10。第9组采用了类型1、14、39、30、17、6、10、35、31、33、15、29、32和7。第10组采用了类型1、19、24、28、34、12、13、18、32、11、14、21、22和25。

就16种肿瘤类型而言，第1组采用了类型27、15、8、12、6、20、26、19、25、2、37、38、7、39、4和33。第2组采用了类型17、18、28、5、6、31、25、13、8、20、37、36、35、9、23和27。第3组采用了类型23、37、34、14、16、27、32、33、21、38、4、30、24、22、17和25。第4组采用了类型7、37、38、21、34、31、32、25、10、36、19、11、6、26、18和35。第5组采用了类型9、32、12、24、20、13、38、21、39、23、36、18、37、22、5和3。第6组采用了类型14、21、5、17、6、20、18、35、22、10、3、23、13、2、34和26。第7组采用了类型1、8、19、6、9、39、28、18、13、31、14、16、37、12、3和25。第8组采用了类型32、36、28、38、9、33、2、5、4、11、19、18、13、8、12和3。第9组采用了类型9、14、10、5、28、32、23、6、39、3、17、8、19、1、31和12。第10组采用了类型4、34、11、6、38、19、7、20、23、3、25、37、26、1、15和12。

就18种肿瘤类型而言，第1组采用了类型15、24、39、35、7、30、16、13、20、3、26、4、12、10、34、25、21和28。第2组采用了类型21、23、29、11、10、19、13、28、4、20、17、24、30、12、39、34、31和9。第3组采用了类型7、17、27、6、30、8、22、2、32、26、21、14、4、38、1、35、16和28。第4组采用了类型17、13、20、33、10、3、16、22、1、38、2、9、28、5、6、19、12和11。第5组采用了类型4、35、21、25、18、17、8、14、31、30、9、1、2、23、36、29、32和37。第6组采用了类型17、34、2、18、19、15、16、13、4、24、5、35、6、22、28、37、38和1。第7组采用了类型34、26、12、25、27、3、17、7、2、32、9、36、21、19、22、8、20和29。第8组采用了类型12、34、38、25、17、22、14、39、10、7、31、2、3、11、29、30、16和24。第9组采用了类型13、26、27、14、5、10、8、7、16、30、37、4、6、35、28、1、36和20。第10组采用了类型15、2、17、23、26、28、36、38、12、6、19、37、20、14、9、39、11和21。

就20种肿瘤类型而言，第1组采用了类型25、13、21、15、37、20、12、28、9、10、26、22、14、24、16、7、39、34、33和4。第2组采用了类型20、17、10、27、19、28、5、1、23、21、38、7、13、22、32、31、9、4、3和24。第3组采用了类型17、13、7、20、11、38、34、3、15、12、5、39、9、10、4、35、27、6、21和33。第4组采用了类型6、13、17、26、1、7、33、5、10、32、3、23、35、4、14、28、12、38、8和27。第5组采用了类型10、23、9、38、5、29、12、27、25、6、7、26、37、31、24、36、19、15、16和11。第6组采用了类型30、24、21、11、23、25、8、9、7、31、27、5、14、29、1、19、16、12、22和17。第7组采用了类型26、13、23、19、22、11、25、21、33、20、6、17、2、10、31、34、27、37、7和9。第8组采用了类型30、1、38、7、31、37、11、25、6、19、28、33、17、29、10、27、16、3、14和15。第9组采用了类型15、19、26、24、5、33、11、2、13、18、31、22、32、20、23、6、10、25、36和3。第10组采用了类型24、25、21、29、14、18、31、2、20、39、23、9、38、12、6、32、22、26、33和7。

实施例4：所述的基因组

利用共有38个成员的第一组74种基因和第二组90种基因来实施本发明。

以类似于实施例3所述的方式评估了74种表达基因序列组的约5-49种成员的随机亚组。再一次将该74种表达序列中5、10、15、20、25、30、35、40、45和49种的随机组合(各组合取样10次)的表达水平与肿瘤类型的数据联用，然后用于预测2到所有39种肿瘤样品(各取样10次)的随机测试组。图4-6显示所得到的数据。

从1-74给该74种基因序列的成员编索引，下文是本发明所用的各代表性随机组：

就2种基因而言，第1组采用了基因64和6。第2组采用了基因64和13。第3组采用了基因67和51。第4组采用了基因51和29。第5组采用了基因46和12。第6组采用了基因68和65。第7组采用了基因6和28。第8组采用了基因9和55。第9组采用了基因55和71。第10组采用了基因63和39。

就5种基因而言，第1组采用了基因8、64、50、54和4。第2组采用了基因39、17、45、34和15。第3组采用了基因10、4、61、21和55。第4组采用了基因59、37、21、23和64。第5组采用了基因69、8、25、59和63。第6组采用了基因45、71、19、59和38。第7组采用了基因21、43、14、48和30。第8组采用了基因73、35、36、10和9。第9组采用了基因62、28、11、70和64。第10组采用了基因8、16、70、18和59。

就10种基因而言，第1组采用了基因49、72、38、68、52、21、1、10、2和40。第2组采用了基因54、70、28、64、68、41、44、20、7和2。第3组采用了基因71、49、51、11、18、53、8、42、36和58。第4组采用了基因72、15、35、3、23、8、2、48、22和65。第5组采用了基因44、19、6、22、38、5、37、9、30和14。第6组采用了基因15、27、3、10、31、19、44、39、48和46。第7组采用了基因70、30、9、33、63、71、32、34、20和7。第8组采用了基因45、29、54、58、15、21、68、5、42和62。第9组采用了基因74、17、66、46、10、8、63、5、24和2。第10组采用了基因33、2、34、19、60、71、42、51、70和66。

就15种基因而言，第1组采用了基因13、22、26、67、64、40、68、71、4、28、24、33、46、69和41。第2组采用了基因10、1、14、70、71、64、46、67、45、48、65、74、34、49和37。第3组采用了基因58、30、44、40、51、36、33、60、39、21、54、64、25、13和35。第4组采用了基因63、70、60、32、31、16、49、65、38、5、72、47、40、2和46。第5组采用了基因43、6、40、13、39、72、68、41、27、73、36、25、33、34和1。第6组采用了基因68、67、71、59、73、62、31、43、7、44、21、48、54、58和6。第7组采用了基因16、50、61、62、27、2、21、1、41、28、68、35、17、47和46。第8组采用了基因27、18、44、66、2、20、53、64、46、70、57、7、51、10和45。第9组采用了基因65、8、43、23、50、46、21、41、44、3、31、17、7、66和70。第10组采用了基因16、14、61、51、39、33、43、31、53、65、74、42、29、9和11。

就20种基因而言，第1组采用了基因14、60、6、71、74、16、62、39、56、44、32、72、18、42、66、49、1、9、69和21。第2组采用了基因23、1、7、27、26、71、12、4、22、69、62、44、6、25、57、28、33、9、21和51。第3组采用了基因46、48、29、54、55、69、73、47、6、27、24、21、15、43、45、7、62、25、22和74。第4组采用了基因12、65、24、73、45、57、49、63、61、1、58、10、2、18、8、51、67、69、59和13。第5组采用了基因33、43、9、52、54、38、8、16、48、1、39、60、17、6、15、66、68、63、37和42。第6组采用了基因43、19、44、28、56、34、66、42、73、40、65、38、54、20、51、37、30、35、53和61。第7组采用了基因61、6、20、4、34、53、70、38、35、46、36、16、1、23、68、12、59、71、65和14。第8组采用了基因25、68、69、3、33、49、19、56、54、4、32、6、45、16、67、52、65、14、12和40。第9组采用了基因47、7、36、32、61、74、14、45、26、51、69、12、41、42、64、25、27、57、23和58。第10组采用了基因27、13、3、17、51、7、37、43、20、12、52、21、25、2、5、32、62、47、4和26。

就25种基因而言，第1组采用了基因57、61、31、38、3、7、72、43、32、23、28、71、48、17、2、49、10、30、66、12、69、41、20、63和68。第2组采用了基因18、54、47、57、24、42、66、46、16、58、37、60、62、9、2、27、36、52、13、32、45、6、43、21和56。第3组采用了基因47、48、52、16、56、54、42、37、17、41、35、21、6、9、63、10、49、68、23、25、70、3、58、2和31。第4组采用了基因50、10、25、16、68、15、29、73、27、63、3、17、28、66、19、13、4、9、36、48、23、57、59、26和14。第5组采用了基因40、39、43、49、66、15、14、29、36、21、19、44、72、58、69、12、11、9、37、46、32、51、3、24和6。第6组采用了基因42、49、44、32、46、35、70、40、3、21、11、67、25、56、37、43、60、55、16、27、30、53、63、23和33。第7组采用了基因70、27、68、17、64、65、18、69、10、67、42、23、48、14、31、11、55、25、52、34、13、45、12、29和47。第8组采用了基因48、10、17、27、25、55、12、62、30、65、15、49、70、14、54、24、33、26、50、60、6、40、67、11和2。第9组采用了基因41、47、24、59、7、44、2、67、12、19、13、17、35、56、28、14、61、15、60、58、1、64、31、45和23。第10组采用了基因42、72、41、38、57、27、4、13、9、43、34、28、8、62、64、46、12、70、21、66、16、7、48、3和54。

就30种基因而言，第1组采用了基因16、47、67、9、22、10、64、72、46、6、60、74、3、68、57、63、14、54、58、30、28、18、70、73、52、39、34、61、12、21。第2组采用了基因18、1、44、24、68、26、62、10、47、67、37、55、32、35、34、14、49、30、17、16、51、45、74、31、9、57、66、39、53和8。第3组采用了基因58、45、55、39、22、32、9、49、31、13、51、56、28、12、3、59、74、35、42、67、69、47、66、18、52、57、43、5、26和4。第4组采用了基因45、1、74、12、18、23、59、27、38、40、72、56、50、20、52、32、5、16、9、21、60、64、49、70、30、61、6、10、31和24。第5组采用了基因60、53、7、32、73、25、69、48、17、45、16、3、14、9、37、41、72、43、68、39、20、51、59、23、6、15、74、19、31和66。第6组采用了基因47、54、9、38、60、33、40、12、57、45、26、56、11、27、67、25、69、59、68、7、61、72、23、21、28、48、29、65、37和15。第7组采用了基因21、42、30、57、65、59、53、74、45、66、68、41、19、24、8、10、61、43、38、67、37、47、40、22、63、35、70、72、5和6。第8组采用了基因58、11、28、36、24、34、53、9、44、23、51、70、22、17、15、59、5、60、1、64、21、50、35、52、31、43、38、39、32和62。第9组采用了基因43、30、63、7、60、40、39、1、48、17、69、57、6、62、19、38、36、13、66、64、25、31、65、47、27、16、53、68、37和41。第10组采用了基因22、17、4、2、37、16、49、7、63、64、14、15、74、43、25、54、46、50、53、67、39、62、59、10、55、72、65、52、58和19。

就35种基因而言，第1组采用了基因4、43、55、49、13、26、32、21、18、50、14、20、65、7、24、52、58、8、30、37、54、71、2、31、44、61、66、67、28、39、10、70、17、19和45。第2组采用了基因14、13、67、21、48、28、69、47、50、3、68、63、22、41、60、61、5、44、56、65、7、66、15、6、45、2、36、5、30、72、34、46、24、29和12。第3组采用了基因67、25、58、11、17、16、3、69、21、1、59、26、72、41、47、2、34、24、10、19、33、5、50、9、71、20、62、8、68、61、23、37、35、60和32。第4组采用了基因5、30、14、1、59、27、28、51、55、61、18、37、17、73、6、44、67、12、35、11、53、72、70、25、21、7、34、13、74、43、52、39、54、2和19。第5组采用了基因56、64、58、35、1、23、43、4、73、28、54、6、51、68、49、37、16、71、3、21、48、69、70、10、26、22、50、44、2、60、38、40、66、63和65。第6组采用了基因72、49、51、44、19、28、1、11、3、40、33、41、70、29、48、62、50、4、47、60、68、10、61、32、20、13、22、59、65、64、67、21、35、39和24。第7组采用了基因14、35、31、20、8、59、50、15、52、62、19、30、71、68、72、47、38、74、36、49、73、22、41、25、69、16、32、24、51、43、65、3、6、53和29。第8组采用了基因22、44、23、9、26、56、72、59、35、61、51、69、64、30、53、27、11、55、39、67、48、28、14、10、8、12、40、24、57、34、50、32、42、41和38。第9组采用了基因15、7、27、6、67、9、26、57、30、37、58、23、42、11、36、52、32、29、62、21、41、61、64、18、40、35、66、1、2、56、16、3、55、10和51。第10组采用了基因9、14、71、25、44、37、49、46、66、53、7、33、22、12、73、50、27、24、13、5、41、51、61、16、28、56、23、20、10、8、70、48、42、52和34。

就40种基因而言，第1组采用了基因26、36、43、30、62、19、20、51、41、71、1、63、10、56、65、17、15、50、5、35、4、54、12、70、48、31、47、37、34、8、3、69、40、44、46、59、61、74、23、27。第2组采用了基因1、4、38、24、37、69、21、52、13、2、63、51、30、16、27、58、74、20、32、53、59、31、50、10、42、8、54、36、5、47、70、41、12、46、28、19、35、9、61和48。第3组采用了基因35、48、40、47、20、67、57、72、15、17、46、37、9、2、60、30、65、49、29、64、16、21、7、74、61、11、58、71、62、23、24、55、3、53、52、27、18、50、25和66。第4组采用了基因35、10、59、19、27、40、30、4、9、52、2、29、26、41、55、17、13、53、71、63、58、44、45、62、70、16、64、48、43、8、38、72、49、37、18、36、74、42、46和54。第5组采用了基因16、61、1、10、20、51、22、6、43、65、66、24、30、9、14、40、32、74、18、71、15、28、52、31、56、55、23、4、58、36、60、54、25、63、27、64、50、29、44和45。第6组采用了基因15、30、3、50、61、47、13、48、45、17、46、10、28、37、8、54、9、5、63、18、39、49、34、68、14、23、43、11、1、51、56、67、20、57、6、19、25、31、21和12。第7组采用了基因45、73、53、29、35、56、70、51、30、59、49、22、6、43、28、31、40、4、66、25、37、19、12、65、26、74、46、50、23、62、17、69、36、41、34、27、67、7、24和13。第8组采用了基因62、30、38、41、18、13、49、71、68、47、50、70、66、5、23、33、27、56、6、7、34、28、26、58、53、46、16、52、72、42、10、54、67、64、12、8、19、57、73和17。第9组采用了基因11、32、48、54、42、67、13、53、21、44、57、22、40、12、5、29、69、37、17、39、45、73、60、26、14、72、4、59、24、46、18、51、36、61、35、9、19、16、38和28。第10组采用了基因58、1、55、59、11、63、3、26、49、69、34、47、65、46、14、39、5、67、16、66、64、38、44、32、15、22、19、71、23、52、45、53、48、8、60、73、9、30、25和37。

就45种基因而言，第1组采用了基因26、21、17、34、19、27、6、61、24、42、3、60、70、43、54、13、9、20、28、58、12、23、33、4、63、56、67、1、11、68、41、59、45、5、48、32、10、44、16、65、51、62、22、38和74。第2组采用了基因21、41、67、5、51、53、28、25、31、60、52、17、50、11、29、45、2、32、71、13、68、22、74、33、48、56、62、42、26、14、61、23、9、46、66、10、64、59、54、69、27、47、44、34和40。第3组采用了基因68、48、43、74、17、4、49、34、38、60、12、42、18、5、51、32、1、57、9、11、30、13、37、15、29、33、44、20、55、70、45、41、24、56、35、52、59、7、25、2、31、64、71、22和39。第4组采用了基因44、61、51、69、65、72、29、57、40、62、66、63、67、55、74、14、56、11、16、58、1、15、3、48、42、7、8、30、18、19、23、60、4、10、21、43、12、37、32、25、22、50、34、59和2。第5组采用了基因67、54、33、41、5、61、3、10、2、71、73、53、25、42、44、23、9、38、45、62、32、46、40、8、66、49、16、24、68、69、21、52、20、6、48、11、57、39、22、31、63、36、34、35和17。第6组采用了基因43、45、19、17、4、58、37、7、42、52、2、62、25、66、24、15、22、74、68、67、8、1、33、70、31、50、64、14、61、51、6、38、35、39、72、5、27、36、11、18、12、48、46、54和71。第7组采用了基因41、45、58、11、66、26、53、13、60、4、65、18、67、73、28、55、56、57、29、68、23、19、42、17、22、62、61、10、43、64、38、71、7、40、16、34、74、12、37、8、63、44、49、47和3。第8组采用了基因47、40、59、14、50、71、1、57、19、28、6、34、68、4、30、20、31、33、38、39、17、41、24、65、70、61、3、35、45、11、9、8、73、42、26、23、46、72、25、64、16、53、62、18和7。第9组采用了基因61、5、69、22、7、17、26、13、2、30、55、33、47、14、59、32、9、44、23、45、42、25、15、57、48、50、1、68、18、72、46、73、67、36、63、60、28、21、20、8、29、35、37、38和71。第10组采用了基因22、31、58、50、64、11、17、67、41、2、21、4、61、70、54、3、71、25、40、43、69、38、9、73、45、16、34、10、7、52、35、19、66、24、5、60、18、14、59、32、68、15、56、63和65。

利用90种表达基因序列组中约5-49种成员的随机亚组进行了类似的实验。再一次将该90种表达序列中5、10、15、20、25、30、35、40、45和49种的随机组合(各组合取样10次)的表达水平与肿瘤类型的数据联用，然后用于预测2到所有39种肿瘤样品(各取样10次)的随机测试组。图7-9显示所得到的数据。

从1-90给该90种基因序列的成员编索引，下文是本发明所用的代表性随机组：

就2种基因而言，第1组采用了基因30和72。第2组采用了基因65和88。第3组采用了基因76和88。第4组采用了基因5和86。第5组采用了基因30和32。第6组采用了基因6和59。第7组采用了基因57和2。第8组采用了基因49和28。第9组采用了基因37和35。第10组采用了基因34和18。

就5种基因而言，第1组采用了基因1、83、59、36、66和88。第2组采用了基因58、13、59、22和64。第3组采用了基因46、72、51、88和14。第4组采用了基因23、74、22、27和20。第5组采用了基因58、54、78、87和50。第6组采用了基因59、6、56、78和9。第7组采用了基因30、78、69、83和21。第8组采用了基因5、39、54、56和55。第9组采用了基因9、70、54、67和43。第10组采用了基因80、81、63、90和53。

就10种基因而言，第1组采用了基因70、17、45、5、2、37、6、76、39和14。第2组采用了基因54、16、80、26、15、45、50、8、73和48。第3组采用了基因66、87、31、74、37、45、19、1、70和7。第4组采用了基因85、17、78、61、23、59、27、18、58和24。第5组采用了基因44、89、36、76、49、3、21、24、38和69。第6组采用了基因32、72、55、2、86、81、53、45、17和74。第7组采用了基因27、55、62、33、32、84、21、45、23和7。第8组采用了基因62、45、68、31、69、39、33、63、19和22。第9组采用了基因71、39、11、56、88、80、37、77、62和35。第10组采用了基因38、83、41、47、66、87、10、4、88和22。

就15种基因而言，第1组采用了基因61、17、64、14、1、41、72、47、69、48、49、70、12、20和35。第2组采用了基因26、49、69、31、84、42、24、56、82、12、29、2、21、15和71。第3组采用了基因54、62、8、32、58、65、39、44、35、22、34、77、43、83和75。第4组采用了基因62、50、57、80、28、83、32、56、14、2、3、48、67、79和72。第5组采用了基因55、58、77、68、90、76、17、72、85、34、43、33、62、6和64。第6组采用了基因41、63、90、9、25、35、2、14、65、87、11、36、10、79和17。第7组采用了基因69、89、77、33、71、4、6、46、72、13、68、81、31、50和32。第8组采用了基因29、69、34、47、32、52、63、73、23、25、33、10、37、17和55。第9组采用了基因24、13、45、17、51、48、20、30、29、40、53、19、88、76和28。第10组采用了基因86、33、19、4、84、25、78、29、88、10、7、67、85、45和8。

就20种基因而言，第1组采用了基因57、78、43、50、14、71、56、25、80、31、88、4、49、13、3、38、32、8、52和75。第2组采用了基因84、46、23、85、55、82、56、83、48、89、8、60、21、40、20、17、87、24、34和39。第3组采用了基因72、88、53、46、82、9、34、21、76、24、14、35、90、31、58、30、15、41、7和28。第4组采用了基因22、62、21、3、45、50、58、72、69、82、49、42、47、9、15、59、17、24、40和52。第5组采用了基因71、18、74、53、43、75、76、54、63、64、10、5、90、51、31、58、28、35、70和23。第6组采用了基因7、30、77、25、17、16、35、68、56、37、78、87、45、8、42、82、72、23、58和54。第7组采用了基因3、58、67、5、87、62、56、88、73、50、22、52、10、60、57、42、46、26、7和82。第8组采用了基因63、19、22、13、82、12、44、52、8、90、35、81、79、15、83、76、51、27、45和56。第9组采用了基因65、34、76、81、58、86、83、46、40、55、48、42、57、70、21、72、71、17、22和24。第10组采用了基因34、74、2、53、76、73、19、72、88、87、44、70、40、39、22、45、83、77、30和46。

就25种基因而言，第1组采用了基因13、77、22、85、58、8、23、2、40、81、50、31、14、41、21、52、6、74、11、17、83、7、9、19、18。第2组采用了基因3、12、8、87、34、75、31、88、77、39、40、60、54、9、37、5、51、53、32、35、66、4、26、59和29。第3组采用了基因29、41、44、56、88、72、90、6、19、63、42、24、49、70、39、17、82、13、9、4、51、40、22、71和25。第4组采用了基因70、82、55、43、40、32、16、13、22、41、7、85、46、42、73、76、14、60、50、72、5、81、67、57和83。第5组采用了基因88、83、53、26、29、4、38、71、11、66、14、89、39、34、84、41、7、64、87、3、67、43、50、79和6。第6组采用了基因88、16、83、4、7、39、56、82、10、20、87、79、3、35、76、49、43、11、74、13、48、22、64、34和89。第7组采用了基因6、64、39、50、44、46、61、28、79、43、35、85、48、9、59、47、57、5、24、33、80、11、42、20和26。第8组采用了基因59、24、46、33、50、71、53、21、86、10、75、23、74、60、43、22、16、62、85、79、81、34、73、2和1。第9组采用了基因68、11、64、54、37、28、44、73、83、89、2、41、59、75、21、23、88、71、34、29、1、47、84、60和72。第10组采用了基因5、12、60、84、32、58、70、2、38、42、24、13、85、10、49、90、55、81、39、27、65、56、31、34和57。

就30种基因而言，第1组采用了基因24、88、10、69、64、8、19、54、80、70、11、9、29、56、36、79、30、65、2、58、23、74、41、16、77、4、78、14、85和32。第2组采用了基因73、27、19、52、87、51、63、4、76、64、90、81、42、47、9、62、40、65、83、30、39、59、10、11、54、44、43、6、86和41。第3组采用了基因28、47、41、8、24、54、26、49、61、17、46、64、20、16、1、33、82、79、85、5、86、69、31、65、83、7、67、35、48和57。第4组采用了基因13、21、83、35、47、57、8、66、75、17、38、70、39、23、9、1、2、28、68、81、36、80、52、22、44、37、85、15、72和86。第5组采用了基因81、20、36、89、13、14、46、58、59、62、28、7、1、25、35、83、26、50、51、15、16、56、71、5、47、6、78、80、85和84。第6组采用了基因68、74、73、89、38、72、33、35、15、79、3、37、23、67、10、62、64、77、44、60、75、7、51、12、46、76、81、26、42和6。第7组采用了基因34、55、62、40、78、35、76、30、21、77、46、71、66、69、63、81、51、38、84、53、82、89、29、14、36、45、60、7、52和27。第8组采用了基因56、12、35、79、57、4、16、9、24、58、40、72、80、67、23、76、88、69、52、78、32、47、14、46、64、83、17、59、81和20。第9组采用了基因73、27、12、58、54、62、48、43、16、41、49、84、9、75、13、50、19、3、76、78、56、68、71、25、24、60、18、35、45和51。第10组采用了基因82、21、24、85、51、18、72、28、89、22、34、4、53、75、83、23、50、5、42、13、88、63、40、64、38、35、39、44、59和70。

就35种基因而言，第1组采用了基因2、69、70、89、9、11、5、17、63、18、12、59、58、85、26、71、61、10、3、1、22、79、84、30、48、82、38、44、56、42、88、6、60、14和28。第2组采用了基因84、81、88、46、12、50、38、78、62、48、19、43、26、66、4、20、40、58、9、52、87、47、6、55、21、75、31、77、57、53、45、34、30、32和39。第3组采用了基因6、3、22、89、8、78、87、71、42、63、18、40、68、77、64、88、5、58、43、72、80、10、21、56、11、59、61、2、19、76、30、20、14、69和35。第4组采用了基因55、42、89、41、56、33、24、28、15、61、63、18、90、60、35、76、70、52、8、1、64、23、13、39、71、31、3、81、10、34、66、44、16、7和78。第5组采用了基因59、58、12、50、47、42、28、22、76、54、1、18、7、53、68、73、20、67、14、72、23、13、39、10、70、55、45、17、31、51、80、3、24、30和46。第6组采用了基因53、66、26、3、73、47、61、63、51、41、29、5、19、10、57、22、64、11、34、89、43、24、31、60、27、76、17、86、70、81、50、46、36、14和45。第7组采用了基因18、88、90、13、73、81、64、56、84、2、4、22、3、25、35、54、89、86、27、41、6、34、38、14、74、36、59、8、40、55、42、83、39、44和60。第8组采用了基因46、32、22、15、67、89、14、5、70、39、49、9、84、71、12、78、27、86、26、57、20、43、58、87、42、8、31、1、54、62、69、40、29、52和64。第9组采用了基因3、39、55、25、90、10、9、77、62、78、18、12、58、51、22、67、7、61、59、35、52、4、65、38、32、71、87、88、63、50、73、70、44、45和84。第10组采用了基因65、54、51、38、40、5、43、71、34、30、22、6、36、64、63、13、70、85、21、88、77、86、79、66、25、18、26、19、76、56、23、60、75、2和49。

就40种基因而言，第1组采用了基因81、80、68、77、17、71、34、33、48、88、90、32、23、2、38、59、75、82、50、56、12、36、6、87、72、37、26、15、35、66、13、76、55、3、78、18、52、47、73和20。第2组采用了基因11、65、27、44、88、49、55、57、1、72、9、28、56、67、13、58、42、36、8、31、40、14、26、35、62、22、19、84、78、21、2、41、74、71、52、30、25、76、85和63。第3组采用了基因50、22、10、54、9、51、15、34、29、35、76、89、33、6、88、56、36、70、87、40、83、62、1、42、25、78、30、26、44、60、69、47、49、31、18、59、37、52、61和17。第4组采用了基因27、33、7、89、36、59、48、42、66、39、90、52、2、14、30、80、9、56、21、87、65、67、41、73、82、20、4、46、5、84、88、15、44、58、78、85、3、64、6和8。第5组采用了基因43、24、86、29、46、90、40、1、71、57、12、84、69、19、42、62、28、35、5、63、52、17、39、4、67、81、50、47、61、54、87、70、77、6、10、38、37、79、31和36。第6组采用了基因28、5、78、85、16、20、36、52、43、29、67、83、12、79、84、8、81、46、11、3、54、86、10、60、71、51、39、53、59、69、44、61、7、56、27、50、66、70、1和25。第7组采用了基因39、47、48、24、25、3、41、16、65、73、63、14、70、57、12、64、90、23、27、38、66、71、54、21、83、28、72、53、11、30、80、15、6、88、89、85、81、61、78和34。第8组采用了基因61、8、57、16、24、64、48、36、58、28、27、40、70、77、25、76、52、35、62、4、60、7、54、37、11、20、72、34、56、78、10、86、51、29、84、47、30、21、59和67。第9组采用了基因67、3、83、33、35、26、25、79、68、19、18、84、14、58、66、57、1、2、27、64、23、24、76、81、17、37、38、30、45、75、49、39、5、53、43、15、51、40、69和12。第10组采用了基因39、77、29、70、85、45、54、79、31、43、15、11、47、83、76、21、67、14、4、19、49、42、18、13、12、7、88、8、3、35、81、55、71、60、72、57、46、40、56和32。

就45种基因而言，第1组采用了基因7、63、45、87、19、55、36、42、9、4、79、68、46、35、40、80、59、58、38、17、50、30、13、39、33、84、34、64、2、57、24、88、65、16、53、18、28、8、60、15、43、73、77、20和78。第2组采用了基因70、19、81、68、38、35、48、9、53、11、73、42、54、28、32、40、60、88、25、7、67、17、36、51、44、46、10、89、14、80、39、41、27、8、75、47、61、57、59、76、86、65、63、74和77。第3组采用了基因55、24、63、17、32、81、2、67、51、85、27、46、60、90、25、35、58、11、47、33、73、3、74、52、15、86、6、78、36、66、57、13、49、28、75、70、4、77、43、26、61、64、20、1和23。第4组采用了基因49、72、13、51、55、11、29、5、43、44、40、6、38、67、47、35、36、28、81、24、80、32、16、88、63、87、86、79、21、1、30、10、62、58、23、12、78、26、69、56、85、42、17、84和39。第5组采用了基因53、33、18、65、22、83、50、88、76、40、82、68、85、5、63、45、78、16、42、54、27、66、70、74、7、51、89、64、49、37、84、86、34、39、80、31、61、87、69、4、81、30、14、41和29。第6组采用了基因7、60、38、14、73、9、79、81、22、10、85、51、40、87、3、26、57、56、12、72、39、59、63、28、64、71、69、21、67、48、50、66、46、88、11、13、24、8、58、75、2、41、5、44和55。第7组采用了基因15、65、31、19、11、38、2、9、64、66、22、35、49、3、77、43、32、56、39、54、80、21、6、40、27、86、10、16、70、30、85、23、26、4、55、73、42、13、41、68、29、57、28、72和58。第8组采用了基因83、27、9、62、84、78、13、5、74、55、12、34、58、3、67、57、24、45、42、47、75、25、29、44、46、61、56、70、86、37、14、49、60、89、28、72、59、38、2、81、50、7、6、21和82。第9组采用了基因7、10、35、14、79、66、33、52、16、55、68、59、57、19、11、47、22、38、61、30、71、50、63、88、53、80、6、54、77、21、37、84、9、65、12、49、40、73、76、2、28、29、3、72和18。第10组采用了基因12、19、9、80、84、15、7、2、39、21、48、40、51、69、74、83、5、66、27、26、89、60、4、86、41、44、35、10、76、53、63、16、37、79、11、42、68、3、59、82、77、73、85、67和14。

就49种基因而言，第1组采用了基因84、47、56、1、18、21、57、54、27、89、44、85、64、10、77、34、65、66、80、70、46、23、53、61、24、81、43、35、30、74、83、51、20、17、72、4、49、68、60、28、67、19、42、55、73、36、7、39和33。第2组采用了基因47、29、58、36、21、53、40、7、83、77、24、89、71、64、60、4、37、86、27、57、62、63、72、1、88、78、68、17、51、16、82、42、81、18、32、49、55、10、11、66、35、23、70、20、61、25、48、43和54。第3组采用了基因54、2、62、67、44、25、8、53、86、33、75、32、45、76、43、65、59、58、42、64、47、78、3、57、71、88、14、23、51、83、1、41、7、56、40、20、39、72、70、19、5、35、50、82、37、48、15、31和16。第4组采用了基因35、65、48、43、69、62、64、74、82、39、37、1、88、45、66、12、79、55、38、84、17、30、25、26、89、56、28、57、59、34、85、14、47、44、41、19、60、20、73、2、63、75、49、80、58、77、27、54和29。第5组采用了基因64、51、36、12、84、24、65、47、88、26、10、19、73、90、35、53、18、55、80、70、79、82、87、77、15、85、83、7、72、1、6、57、38、45、74、33、62、86、31、69、27、14、4、29、54、44、63、78和42。第6组采用了基因24、39、85、42、88、32、65、23、6、75、53、77、64、90、13、82、47、31、48、8、78、67、63、44、26、40、14、34、18、59、2、17、20、56、83、68、86、9、38、73、89、55、29、69、72、16、28、51和81。第7组采用了基因32、70、57、67、1、73、52、38、65、83、5、40、49、31、66、85、6、82、12、48、89、3、19、41、62、16、46、61、24、18、55、30、33、56、68、20、81、10、86、9、15、63、78、22、75、14、13、43和77。第8组采用了基因17、30、47、85、7、3、6、35、76、77、25、86、36、75、44、29、69、60、63、64、82、51、19、68、41、28、73、18、10、26、42、78、67、12、80、33、13、57、38、87、49、59、74、50、90、46、8、81和4。第9组采用了基因20、76、42、36、66、21、8、28、22、15、56、5、2、86、17、62、23、1、80、73、52、83、32、65、44、82、35、60、47、90、74、9、84、50、4、77、55、57、19、71、25、48、81、53、34、38、3、37和16。第10组采用了基因84、87、3、41、36、71、33、57、85、26、53、22、82、31、2、45、24、18、37、35、77、20、63、25、6、17、58、7、9、49、28、76、79、67、13、80、66、5、43、4、74、75、21、86、23、39、42、27和54。

实施例5：PCR检测

如上所述，可通过PCR测定或检测基因表达，例如采用定量PCR。检测人基因组中约5-49种表达序列的表达可用于本发明的这种实施方案。此外，也可利用所述74种(基因序列)组、90种(基因序列)组或该两组的组合(已知该两组之间共有38种基因序列，总基因序列是126种)中的约5-49种基因序列的表达水平。如上所述，本发明考虑如上所述采用定量PCR来检测87种基因序列中约5-49种序列的表达水平，这些序列均存在于74种(基因序列)组或90种(基因序列)组中。在这87种基因序列中，60种存在于74种(基因序列)组中，63种存在于90种(基因序列)组中。该87种基因序列的标识符/登录号是：AA456140、AA745593、AA765597、AA782845、AA865917、AA946776、AA993639、AB038160、AF104032、AF133587、AF301598、AF332224、AI041545、AI147926、AI309080、AI341378、AI457360、AI620495、AI632869、AI683181、AI685931、AI802118、AI804745、AI952953、AI985118、AJ000388、AK025181、AK027147、AK054605、AL023657、AL039118、AL110274、AL157475、AW118445、AW194680、AW291189、AW298545、AW445220、AW473119、AY033998、BC000045、BC001293、BC001504、BC001639、BC002551、BC004331、BC004453、BC005364、BC006537、BC006811、BC006819、BC008764、BC008765、BC009084、BC009237、BC010626、BC011949、BC012926、BC013117、BC015754、BC017586、BE552004、BE962007、BF224381、BF437393、BF446419、BF592799、BI493248、H05388、H07885、H09748、M95585、N64339、NM_000065、NM_001337、NM_003914、NM_004062、NM_004063、NM_004496、NM_006115、NM_019894、NM_033229、R15881、R45389、R61469、X69699和X96757。

利用这些序列中约5-49种来实施本发明可包括利用本文所述所检测到的参比序列表达水平。在一些实施方案中，参比基因序列是本文所述8种序列的一种或多种。本发明考虑将鉴定为AF308803、AL137727、BC003043、BC006091和BC016680的一种或多种参比序列用于本发明的PCR或QPCR的实施方案中。当然也可联合使用所有这5种参比序列。

无论曾是否专门引入，本文所引用的所有参考文献，包括专利、专利申请和出版物均全文纳入本文作为参考。

现已充分描述了本发明，本领域技术人员应该知道在同等的参数、浓度和条件的广泛范围内即可进行同样检测而不脱离本发明的构思和范围并且无需过多实验。

尽管结合具体实施方案描述了本发明，但应该知道可对它作出进一步修改。总之，本申请要涵盖根据本发明主旨作出的任何改变、应用或适用性，包括在本发明所属领域的已知或惯常实践范围内以及可应用上述基本特征的这种改变。

mRNA序列的附件(序列表)

>Hs.73995_mRNA_1 gi|190403|gb|M60502.1|HUMPROFILE人原聚角蛋白微丝蛋白mRNA，3′末端聚腺苷酸＝1

GGCCACTCTGCAGACAGCTCCAGACAATCAGGCACTCGTCACACAGAGTCTTCCTCTCGT

GGACAGGCTGCGTCATCCCATGAACAGGCAAGATCAAGTGCAGGAGAAAGACATGGATCC

CACCACCAGCAGTCAGCAGACAGCTCCAGACACGCAGGCATTGGGCACGGACAAGCTTCA

TCTGCAGTCAGAGACAGTGGACACCGAGGGTACAGAGGTAGTCAGGCCACTGACAGTGAG

GGACATTCAGAAGACTCAGACACACAGTCAGTGTCAGCACAGGGACAAGCTGGGCCCCAT

CAGCAGAGCCACCAAGAGTCCGCACGTGGCCAGTCAGGGGAAAGCTCTGGACGTTCAGGG

TCTTTCCTCTACCAGGTGAGCACTCATGAACAGTCTGAGTCCACCCATGGACAGTCTGTG

CCCAGCACTGGAGGAAGACAAGGATCCCACCATGATCAGGCACAAGACAGCTCCAGGCAC

TCAGCATCCCAAGAGGGTCAGGACACCATTCGTGGACACCCGGGGCCAAGCAGAGGAGGA

AGACAGGGGTCCCACCACGAGCAATCGGTAGATAGGTCTGGACACTCAGGGTCCCATCAC

AGCCACACCACATCCCAGGGAAGGTCTGATGCCTCCCGTGGGCAGTCAGGATCCAGAAGT

GCAAGCAGACAAACACATGACCAGGAACAATCAGGAGACGGCTCTAGGCACTCAGGGTCG

CGTCATCAGGAAGCTTCCTCTTGGGCCGACAGCTCTAGACACTCACAGGCAGTCCAGGGA

CAATCAGAGGGGTCCAGGACAAGCAGGCGCCAGGGATCCAGTGTTAGCCAGGACAGTGAC

AGTCAGGGACACTCAGAAGACTCTGAGAGGCGGTCTGGGTCTGCTTCCAGAAACCATCGT

GGATCTGCTCAGGAGCAGTCAAGAGATGGCTCCAGACACCCCAGGTCCCATCACGAAGAC

AGAGCCGGTCACGGGGACTCTGCAGAGAGCTCCAGACAATCAGGCACTCATCATGCAGAG

AATTCCTCTGGTGGACAGGCTGCATCATCCCATGAACAGGCAAGATCAAGTGCAGGAGAG

AGACATGGATCCCACTACCAGCAGTCAGCAGACAGCTCCAGACACTCAGGCATTGGGCAC

GGACAAGCTTCATCTGCAGTCAGAGACAGTGGACACCGAGGGTCCAGTGGTAGTCAGGCC

AGTGACAATGAGGGACATTCAGAAGACTCAGACACACAGTCAGTGTCAGCCCACCGACAG

GCTGGGCGCCATCACGAGAGCCACCAAGAGTCCACACGTGGCCGGTCACGAGGAAGGTCT

GGACGTTCAGGGTCTTTCCTCTACCAGGTGAGCACTCATGAACAGTCTGAGTCTGCCCAT

GGACGGGCTGGGCCCAGTACTGGAGGAAGACAAGGATCCCGCCACGAGCAGGCACGAGAC

AGCTCCAGGCACTCAGCGTCCCAAGAGGGTCAGGACACCATTCGTGGACACCCGGGGTCA

AGGAGAGGAGGAAGACAGGGATCCTACCACGAGCAATCGGTAGATAGGTCTGGACACTCA

GGGTCCCATCACAGCCACACCACATCCCAGGGAAGGTCTGATGCCTCCCATGGGCAGTCA

GGATCCAGAAGTGCAAGCAGAGAAACACGTAATGAGGAACAGTCAGGAGACGGCTCCAGG

CACTCAGGGTCGCGTCACCATGAAGCTTCCACTCAGGCTGACAGCTCTAGACACTCACAG

TCCGGCCAGGGTGAATCAGCGGGGTCCAGGAGAAGCAGGCGCCAGGGATCCAGTGTTAGC

CAGGACAGTGACAGTGAGGCATACCCAGAGGACTCTGAGAGGCGATCTGAGTCTGCTTCC

AGAAACCATCATGGATCTTCTCGGGAGCAGTCAAGAGATGGCTCCAGACACCCCGGATCC

TCTCACCGCGATACAGCCAGTCATGTACAGTCTTCACCTGTACAGTCAGACTCTAGTACC

GCTAAGGAACATGGTCACTTTAGTAGTCTTTCACAAGATTCTGCGTATCACTCAGGAATA

CAGTCACGTGGCAGTCCTCACAGTTCTAGTTCTTATCATTATCAATCTGAGGGCACTGAA

AGGCAAAAAGGTCAATCAGGTTTAGTTTGGAGACATGGCAGCTATGGTAGTGCAGATTAT

GATTATGGTGAATCCGGGTTTAGACACTCTCAGCACGGAAGTGTTAGTTACAATTCCAAT

CCTGTTCTTTTCAAGGAAAGATCTGATATCTGTAAAGCAAGTGCGTTTGGTAAAGATCAT

CCAAGGTATTATGCAACGTATATTAATAAGGACCCAGGTTTATGTGGCCATTCTAGTGAT

ATATCGAAACAACTGGGATTTAGTCAGTCACAGAGATACTATTACTATGAGTAAGAAATT

AATGGCAAAGGAATTAATCCAAGAATAGAAGAATGAAGCAAGTTCACTTTCAATCAAGAA

ACTTCATAATACTTTCAGGGAAGTTATCTTTTCCTGTCAATCTGTTTAAAATATGCTATA

GTATTTCATTAGTTTGGTGGTAACTTATTTTTATTGTGTAATGATCTTTAAACGCTATAT

TTCAGAAATATTAAATGGAAGAAATCAATATCATGGAGAGCTAACTTTAGAAAACTAGCT

GGAGTATTTTAGGAGATTCTGGGTCAAGTAATGTTTTATGTTTTTGAAAGTTTAAGTTTT

AGACACTCCCCAAATTTCTAAATTAATCTTTTTCAGAAATATCGAAGGAGCCAAAAATAT

AAAACAGTTCTGATATCCAAAGTGGCTATATCAACATCAGGGCTAGCACATCTTTCTCTA

TTATCCTTCTATTGGAATTCTAGTATTCTGTATTCAAAAAATCATCTTGGACATAATTAA

TATTTTAGTAAGCTGCATCTAAATTAAAAATAAACTATTCATCATATAAT

>Hs.75236_mRNA_4 gi|14280328|gb|AY033998.1|智人聚腺苷酸＝3

TAGAATCGGGGGTTTCAGCTCACTGCTCCTTTTCTTTTTTTTCTTTCTCTCCCCCGCCCA

CCCCCCCAAAAATAATTGATTTGCTTTACAATCATCCACACTGTGTTTTGTGGATCTTTA

ATTATATATAACAATAGTAGTCATTTTAAATATATATTCTGAAATCTTTGCAAATTTTAA

CAGAAGAGTCGAAGCTCTGCGAGACCCAATATTTGCCAATAAGAATGGTTATGATAATTA

GCACCATGGAGCCTCAGGTGTCAAATGGTCCGACATCCAATACAAGCAATGGACCCTCCA

GCAACAACAGAAACTGTCCTTCTCCCATGCAAACAGGGGCAACCACAGATGACAGCAAAA

CCAACCTCATCGTCAACTATTTACCCCAGAATATGACCCAAGAAGAATTCAGGAGTCTCT

TCGGGAGCATTGGTGAAATAGAATCCTGCAAACTTGTGAGAGACAAAATTACAGGACAGA

GTTTAGGGTATGGATTTGTTAACTATATTGATCCAAAGGATGCAGAGAAAGCCATCAACA

CTTTAAATGGACTCAGACTCCAGACCAAAACCATAAAGGTCTCATATGCCCGTCCGAGCT

CTGCCTCAATCAGGGATGCTAACCTCTATGTTAGCGGCCTTCCCAAAACCATGACCCAGA

AGGAACTGGAGCAACTTTTCTCGCAATACGGCCGTATCATCACCTCACGAATCCTGGTTG

ATCAAGTCACAGGAGTGTCCAGAGGGGTGGGATTCATCCGCTTTGATAAGAGGATTGAGG

CAGAAGAAGCCATCAAAGGGCTGAATGGCCAGAAGCCCAGCGGTGCTACGGAACCGATTA

CTGTGAAGTTTGCCAACAACCCCAGCCAGAAGTCCAGCCAGGCCCTGCTCTCCCAGCTCT

ACCAGTCCCCTAACCGGCGCTACCCAGGTCCACTTCACCACCAGGCTCAGAGGTTCAGGC

TGGACAATTTGCTTAATATGGCCTATGGCGTAAAGAGACTGATGTCTGGACCAGTCCCCC

CTTCTGCTTGTTCCCCCAGGTTCTCCCCAATTACCATTGATGGAATGACAAGCCTTGTGG

GAATGAACATCCCTGGTCACACAGGAACTGGGTGGTGCATCTTTGTCTACAACCTGTCCC

CCGATTCCGATGAGAGTGTCCTCTGGCAGCTCTTTGGCCCCTTTGGAGCAGTGAACAACG

TAAAGGTGATTCGTGACTTCAACACCAACAAGTGCAAGGGATTCGGCTTTGTCACCATGA

CCAACTATGATGAGGCGGCCATGGCCATCGCCAGCCTCAACGGGTACCGCCTGGGAGACA

GAGTGTTGCAAGTTTCCTTTAAAACCAACAAAGCCCACAAGTCCTGAATTTCCCATTCTT

ACTTACTAAAATATATATAGAAATATATACGAACAAAACACACGCGCGCACACACACACA

TACACGAAAGAGAGAGAAACAAACTTTTCAAGGCTTATATTCAACCATGGACTTTATAAG

CCAGTGTTGCCTAAGTATTAAAACATTGGATTATCCTGAGGTGTACCAGGAAAGGATTTT

ATAATGCTTAGAAAAAAAAAAAAAAAAAAAA

>Hs.299867_mRNA_1 gi|4758533|ref|NM_004496.1|智人肝细胞核因子3，α(HNF3A)，mRNA 聚腺苷酸＝3

TCCAGGAATCGATAGTGCATTCGTGCGCGCGGCCGCCCGTCGCTTCGCACAGGGCTGGAT

GGTTGTATTGGGCAGGGTGGCTCCAGGATGTTAGGAACTGTGAAGATGGAAGGGCATGAA

ACCAGCGACTGGAACAGCTACTACGCAGACACGCAGGAGGCCTACTCCTCGGTCCCGGTC

AGCAACATGAACTCAGGCCTGGGCTCCATGAACTCCATGAACACCTACATGACCATGAAC

ACCATGACTACGAGCGGCAACATGACCCCGGCGTCCTTCAACATGTCCTATGCCAACCCG

GCCTTAGGGGCCGGCCTGAGTCCCGGCGCAGTAGCCGGCATGCCGGGGGGCTCGGCGGGC

GCCATGAACAGCATGACTGCGGCCGGCGTGACGGCCATGGGTACGGCGCTGAGCCCGAGC

GGCATGGGCGCCATGGGTGCGCAGCAGGCGGCCTCCATGATGAATGGCCTGGGCCCCTAC

GCGGCCGCCATGAACCCGTGCATGAGCCCCATGGCGTACGCGCCGTCCAACCTGGGCCGC

AGCCGCGCGGGCGGCGGCGGCGACGCCAAGACGTTCAAGCGCAGTTACCCGCACGCCAAG

CCGCCCTACTCGTACATCTCGCTCATCACCATGGCCATCCAGCGGGCGCCCAGCAAGATG

CTCACGCTGAGCGAGATCTACCAGTGGATCATGGACCTCTTCCCCTATTACCGGCAGAAC

CAGCAGCGCTGGCAGAACTCCATCCGCCACTCGCTGTCCTTCAATGACTGCTTCGTCAAG

GTGGCACGCTCCCCGGACAAGCCGGGCAAGGGCTCCTACTGGACGCTGCACCCGGACTCC

GGCAACATGTTCGAGAACGGCTGCTACTTGCGCCGCCAGAAGCGCTTCAAGTGCGAGAAG

CAGCCGGGGGCCGGCGGCGGGGGCGGGAGCGGAAGCGGGGGCAGCGGCGCCAAGGGCGGC

CCTGAGAGCCGCAAGGACCCCTCTGGCGCCTCTAACCCCAGCGCCGACTCGCCCCTCCAT

CGGGGTGTGCACGGGAAGACCGGCCAGCTAGAGGGCGCGCCGGCCCCGGGCCCGGCCGCC

AGCCCCCAGACTCTGGACCACAGTGGGGCGACGGCGACAGGGGGCGCCTCGGAGTTGAAG

ACTCCAGCCTCCTCAACTGCGCCCCCCATAAGCTCCGGGCCCGGGGCGCTGGCCTCTGTG

CCCGCCTCTCACCCGGCACACGGCTTGGCACCCCACGAGTCCCAGCTGCACCTGAAAGGG

GACCCCCACTACTCCTTCAACCACCCGTTCTCCATCAACAACCTCATGTCCTCCTCGGAG

CAGCAGCATAAGCTGGACTTCAAGGCATACGAACAGGCACTGCAATACTCGCCTTACGGC

TCTACGTTGCCCGCCAGCCTGCCTCTAGGCAGCGCCTCGGTGACCACCAGGAGCCCCATC

GAGCCCTCAGCCCTGGAGCCGGCGTACTACCAAGGTGTGTATTCCAGACCCGTCCTAAAC

ACTTCCTAGCTCCCGGGACTGGGGGGTTTGTCTGGCATAGCCATGCTGGTAGCAAGAGAG

AAAAAATCAACAGCAAACAAAACCACACAAACCAAACCGTCAACAGCATAATAAAATCCA

ACAACTATTTTTATTTCATTTTTCATGCACAACCTTGCCCCCAGTGCAAAAGACTGTTAC

TTTATTATTGTATTCAAAATTCATTGTGTATATTACTACAAAGACGGCCCCAAACCAATT

TTTTTCCTGCGAAGTTTAATGATCCACAAGTGTATATATGAAATTCTCCTCCTTCCTTGC

CCCCCTCTCTTTCTTCCCTCTTGGCCCTCCAGACATTCTAGTTTGTGGAGGGTTATTTAA

AAAACAAAAAGGAAGATGGTCAAGTTTGTAAAATATTTGTTTGTGCTTTTCCCCCCTCCT

TACCTGACCCCCTACGAGTTTACAGGCTTGTGGCAATACTCTTAACCATAAGAATTGAAA

TGGTGAAGAAACAAGTATACACTAGAGGCTCTTAAAAGTATTGAAAAGACAATACTGCTG

TTATATAGCAAGACATAAACAGATTATAAACATCAGAGCCATTTGCTTCTCAGTTTACAT

TTCTGATACATGCAGATAGCAGATGTCTTTAAATGAAATACATGTATATTGTGTATGGAC

TTAATTATGCACATGCTCAGATGTGTAGACATCCTCCGTATATTTACATAACATATAGAG

GTAATAGATAGGTGATATACGTGATACGTTCTCAAGAGTTGCTTGACCGAAAGTTACAAG

GACCCCAACCCCTTTGCTCTCTACCCACAGATGGCCCTGGGAACAATCCTCAGGAATTGC

CCTCAAGAACTCGCTTCTTTGCTTTGAGAGTGCCATGGTCATGTCATTCTGAGGTACATA

ACACATAAATTAGTTTCTATGAGTGTATACCATTTAAAGATTTTTTCAGTAAAGGGAATA

TTACATGTTGGGAGGAGGAGATAAGTTATAGGGAGCTGGATTTCAAACGGTGGTCCAAGA

TTCAAAAATCCTATTGATAGTGGCCATTTTAATCATTGCCATCGTGTGCTTGTTTCATCC

AGTGTTATGCACTTTCCACAGTTGGTGTTAGTATAGCCAGAGGGTTTCATTATTATTTCT

CTTTGCTTTCTCAATGTTAATTTATTGCATGGTTTATTCTTTTTCTTTACAGCTGAAATT

GCTTTAAATGATGGTTAAAATTACAAATTAAATTGGGAATTTTTATCAATGTGATTGTAA

TTAAAAATATTTTGATTTAAATAACAAAAATAATACCAGATTTTAAGCCGCGGAAAATGT

TCTTGATCATTTGCAGTTAAGGACTTTAAATAAATCAAATGTTAACAAAAAA

>Hs.285401_contig1

TGTTTTTCTAGTTCATTTTGTGTTTCCAACTTTTCATGTAAAATTTTAATTATTTTTGAA

TGTGTGGATGTGAGACTGAGGTGCCTTTTGGTACTGAAATTCTTTTTCCATGTACCTGAA

GTGTTACTTTTGTGATATAGGAAATCCTTGTATATATACTTTATTGGTCCCTAGGCTTCC

TATTTTGTTACCTTGCTTTCTCTATGGCATCCACCATTTTGATTGTTCTACTTTTATGAT

ATGTTTTCATAAGTGGTTAAGCAAGTATTCTCGTTACTTTTGCTCTTAAATCCCTATTCA

TTACAGCAATGTTGGTGGTCAAAGAAAATGATAAACAACTTGAATGTTCAATGGTCCTGA

AATACATAACAACATTTTAGTACATTGTAAAGTAGAATCCTCTGTTCATAATGAACAAGA

TGAACCAATGTGGATTAGAAAGAAGTCCGAGATATTAATTCCAAAATATCCAGACATTGT

TAAAGGGAAAAAATTGCAATAAAATATTTGTAACATAAAAAAAAAAAAAAAAAAAAAAAA

AGCTCTCCCCACCAATAAAAGGACCAGGGAGGATCAGAGAGAGCAGAAGGATCCTGAGCC

TCGCACTCTGCCGCCCGCACCACCTTCCGCTGCCTCTCAGACTCTGCTCAGCCTCACACG

ATGTCGTGCCGCTCCTACAGGATCAGCTCAGGATGCGGGGTCACCAGGAACTTCAGCTCC

TGCTCAGCTGTGGCCCCCAAAACTGGCAACCGCTGCTGCATCAGCGCCGCCCCCTACCGA

GGGGTGTCCTGCTACCGAGGGCTGACGGGCTTCGGCAGCCGCAGCCTCTGCAACCTGGGC

TCCTGCGGGCCCCGGATAGCTGTAGGTGGCTTCCGAGCCGGCTCCTGCGGACGCAGCTTC

GGCTACCGCTCCGGGGGCGTGTGCGGACCCAGCCCCCCATGCATCACTACCGTGTCGGTC

AACGAGAGCCTCCTCACGCCCCTCAACCTGGAGATCGACCCCAACGCACAGTGCGTGAAG

CAGGAGGAGAAGGAGCAGATCAAGTCCCTCAACAGCAGGTTCGCGGCCTTCATCGACAAG

GTGCGCTTCCTGGAGCAGCAGAACAAGCTGCTGGAGACCAAGTGGCAGTTCTACCAGAAC

CAGCGCTGCTGCGAGAGCAACCTGGAGCCACTGTTCAGTGGCTACATCGAGACTCTGCGG

CGGGAGGCCGAGTGCGTGGAGGCCGACAGCGGGAGGCTGGCCTCAGAGCTCAACCATGTG

CAGGAGGTGCTGGAGGGCTACAAGAAGAAGTATGAAGAGGAGGTGGCCCTGAGAGCCACA

GCAGAGAATGAGTTTGTCGTTCTAAAGAAGGACGTGGACTGTGCCTACCTGCGGAAATCA

GACCTGGAGGCCAATGTGGAGGCCCTGGTGGAGGAGTCTAGCTTCCTGAGGCGCCTCTAT

GAAGAGGAGATCCGCGTTCTCCAAGCCCACATCTCAGACACCTCGGTCATAGTCAAGATG

GACAACAGCCGAGACCTGAACATGGACTGCATCATCGCTGAGATCAAGGCTCAGTATGAC

GATGTTGCCAGCCGCAGCCGGGCCGAGGCTGAGTCCTGGTACCGTAGCAAGTGTGAGGAG

ATGAAGGCCACGGTGATCAGGCATGGGGAGACCCTGCGCCGCACCAAGGAGGAGATCAAC

GAGCTGAACCGCATGATCCAGAGGCTGACGGCCGAGATTGAGAATGCCAAGTGCCAGCGT

GCCAAGCTGGAGGCTGCTGTGGCTGAGGCAGAGCAGCAGGGTGAGGCGGCCCTCAGCGAT

GCCCGCTGCAAGCTGGCTGAGCTGGAGGGCGCCCTGCAGAAGGCCAAGCAGGACATGGCC

TGCCTGCTCAAGGAGTACCAGGAGGTGATGAACTCCAAGCTGGGCCTGGACATCGAGATC

GCCACCTACAGGCGCCTGCTGGAGGGCGAGGAACACAGGCTGTGTGAAGGTGTGGGCTCT

GTGAATGTCTGTGTCAGCAGCTCCCGTGGTGGAGTCTCCTGTGGGGGCCTCTCCTACAGC

ACCACCCCAGGGCGCCAGATCACTTCTGGCCCCTCAGCCATAGGCGGCAGCATCACGGTG

GTGGCCCCTGACTCCTGTGCCCCCTGCCAGCCTCGTTCCTCCAGCTTCAGCTGCGGGAGT

AGCCGGTCGGTCCGCTTTGCCTAGTAGAGTCATGGAGCCAGGGCTTCCTGCCAAGCACCT

GCCTGCCTGCATCACTGCACTGAATGGCATGTGAATGGAAAATGTGTGCTTGCTTCCAGA

ATCTTCTGGATGTTCCTACAGAGGGAAAGACCTACAGAGGGAAAGACCCTCGGGCCGCTC

CCCTGCGCCTTTTCATGCTAGGGAGATGCATCCTAGTTGTCCTCCTGGCAGCTGTTTTCA

GAGGCATTCCCAGCCCTTCACTTAACTCCTACTTAGCTCCAAAATACCTGTATCCAATTT

GTATTATTCCCCCAGCTCTCAGGGACAAGACCAGTCCCCCAGCGTGGTGGTCAGCACGGA

AGCTCCACCTTCTGGGTGGAGGCGCCATCCTAACCATCCAGCCAGGCCACCCACAACCCG

AGAATCAGGGAGAAAGTCCCTCCCCAGCAGCCCCCTCCTCCTGGCTGGGAAGAATGGTCC

CCCAGCAAGCACTTGCCTGTTCATTCCCGTTCATGTTTTGCTTCTCTCTCAGACTGCCTT

CCTGCTTCTGGGCTAACCTGTTCCAGCCAGGCTCCTCATGTGACCTCGCAGTTGAGAAGC

CCATTATCGTGGGGCATCCTTTTGCCTACAGCCCCTGGTTAGGGCACTTTGGACAGGTCT

TGCTATTCAGTGAACCTTTGTACATTTCAAAGAAGACTCCATGGCTGCTCCAGATGCCCC

CTTGCTGGGTGCAGGTGGGGACTGTCCAATGCAGAGCTGGCGGGACAGAGAGTTAAGCCA

CTTCCTGGGTCTCCTTCTTATGACTGTCTATGGGTGCATTGCCTTCTGGGTTGTCTCGAT

CTGTGTTTCAATAAATGCCGCTGCAATGCAAAAAAAAAAAAAAAAAAA

>Hs.292653_contig1

CAATCAGTGAAAATTCTATATTCCTTTGGCATTTTTGTGACATATTCAATTCAGTTNTAT

GTTCCAGCAGAGATCATTATCCCTGGGATCACATCCAAATTTCATACTAAATGGAAGCAA

ATCTGTGAATTTGGGATAAGATCCTTCTTGGTTAGTATTACTTGCGCCGGAGCAATGTCT

TATTCCTCGTTTAGACATTGTGATTTCCTTCGTTGGAGCTGTGAGCAGCAGCACATTGGC

CCTAATCCTGCCACCTTTGGTTGAAATTCTTACATTTTCGAAGGAACATTATAATATATG

GATGGTCCTGAAAAATATTTCTATAGCATTCACTGGAGTTGTTGGCTTCTTATTAGGTAC

ATATATAACTGTTGAAGAAATTATTTATCCTACTCCCAAAGTTGTAGCTGGCACTCCACA

GAGTCCTTTTCTAAATTTGAATTCAACATGCTTAACATCTGGTTTGAAATAGTAAAAGCA

GAATCATGAGTCTTCTATTTTTGTCCCATTTCTGAAAATTATCAAGATAACTAGTAAAAT

ACATTGCTATATACATAAAAATGGTAACAAACTCTGTTTTCTTTGGCACGATATTAATAT

TTTGGAAGTAATCATAACTCTTTACCAGTAGTGGTAAACCTATGAAAAATCCTTGCTTTT

AAGTGTTAGCAATAGTTCAAAAAATTAAGTTCTGAAAATTGAAAAAATTAAAATGTAAAA

AAATTAAAGAATAAAAATACTTCTATTATTCTTTTATCTCAGTAAGAAATACCTTAACCA

AGATATCTCTCTTTTATGCTACTCTTTTGCCACTCACTTGAGAACAGAATAGGATTTCAA

CAATAAGAGAATAAAATAAGAACATGTATAACAAAAAGCTCTCTCCAGATCATCCCTGTG

AATGCCAAAGTAAACTTTATGTACAGTGTAAAAAAAAAAAAATCTCAGTTATGTTTTTAT

TAGCCAAATTCTAATGATTGGCTCCTGGAAGTATAGAAAACTCCCATTAACATAATATAA

GCATCAGAAAATTGCAAACACTAGAATTAATTTTACACTCTAATGGTAGTTGATCTTCAT

AGTCAAGAGGCACTGTTCAAGATCATGACTTAGTGTTTCAATGAAATTTGAAAAGGGACT

TTAAAACTTATCCAGTGCAACTCCCTTGTTTTTCGTCAGAGGAAAAGGAGGCCTAGAAAG

GTTAAGTAACTTGGTCGAGACCACTCAGCCTTGAGATCAAGAAAACCTAATCTTCTGACT

CCCAGGCCAGGATGTTTTATTTCTCACATCATGTCCAAGAAAAAGAATAAATTATGTTCA

GCTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>Hs.97616_mRNA_3 gi|12654852|gb|BC001270.1|BC001270智人克隆MGC：5069 IMAGE：3458016聚腺苷酸＝3

CGGAGGCGGCGCCGACGGGGACTGCTGAGGCGCGCAGAGGGTCGGCGGCGCCCGGGAGCC

TGTCGCTGGCGCGGTCCGGGCGGGAGGCTCGGCGGCGGGCGGCAGCATGTCGGTGGCGGG

GCTGAAGAAGCAGTTCTACAAGGCGAGCCAGCTGGTCAGTGAGAAGGTCGGAGGGGCCGA

GGGGACCAAGCTGGATGATGACTTCAAAGAGATGGAGAAGAAGGTGGATGTCACCAGCAA

GGCGGTGACAGAAGTGCTGGCCAGGACCATCGAGTACCTGCAGCCCAACCCAGCCTCGCG

GGCTAAGCTGACCATGCTCAACACGGTGTCCAAGATCCGGGGCCAGGTGAAGAACCCCGG

CTACCCGCAGTCGGAGGGGCTTCTGGGCGAGTGCATGATCCGCCACGGGAAGGAGCTGGG

CGGCGAGTCCAACTTTGGTGACGCATTGCTGGATGCCGGCGAGTCCATGAAGCGCCTGGC

AGAGGTGAAGGACTCCCTGGACATCGAGGTCAAGCAGAACTTCATTGACCCCCTCCAGAA

CCTGTGCGAGAAAGACCTGAAGGAGATCCAGCACCACCTGAAGAAACTGGAGGGCCGCCG

CCTGGACTTTGACTACAAGAAGAAGCGGCAGGGCAAGATCCCCGATGAGGAGCTACGCCA

GGCGCTGGAGAAGTTCGAGGAGTCCAAGGAGGTGGCAGAAACCAGCATGCACAACCTCCT

GGAGACTGACATCGAGCAGGTGAGTCAGCTCTCGGCCCTGGTGGATGCACAGCTGGACTA

CCACCGGCAGGCCGTGCAGATCCTGGACGAGCTGGCGGAGAAGCTCAAGCGCAGGATGCG

GGAAGCTTCCTCACGCCCTAAGCGGGAGTATAAGCCGAAGCCCCGGGAGCCCTTTGACCT

TGGAGAGCCTGAGCAGTCCAACGGGGGCTTCCCCTGCACCACAGCCCCCAAGATCGCAGC

TTCATCGTCTTTCCGATCTTCCGACAAGCCCATCCGGACCCCTAGCCGGAGCATGCCGCC

CCTGGACCAGCCGAGCTGCAAGGCGCTGTACGACTTCGAGCCCGAGAACGACGGGGAGCT

GGGCTTCCATGAGGGCGACGTCATCACGCTGACCAACCAGATCGATGAGAACTGGTACGA

GGGCATGCTGGACGGCCAGTCGGGCTTCTTCCCGCTCAGCTACGTGGAGGTGCTTGTGCC

CCTGCCGCAGTGACTCACCCGTGTCCCCGCCCCGCCCCTCCGTCCACACTGGCCGGCACC

CCCTGCTGGGTCTCCTGCATTCCACGGAGCCCCTGCTGCCAGGGCGGTGTCTGAGCCTGC

CGGCGCCACCTGGGCCCCGGCCCTTGAGGTACTCCCTGAGCAGGACCCCACACTTGGGTG

GGGGGGCTTATCTGGGTGGGTGGGGATGCCTGTTTACACTAGCGCTGACTCCCAACGGTG

ACGGCTCCCTTCCCCACTCCATGGCGCCAGCCTCCTCCCCCGCTCCCCAACTTCTCGCCC

AGCTGGCCGAGGCGGGGCAACACTAAGGTGCTCTTAGAAACACTAATGTTCCTCTGGGGC

AGCCCCCACCTCCGTCCTGACCCGACGGGGGCCCGGCCCACTGCCTACCCTCGAGTCCCG

CAGCCTTAACAGGATGGGATCGAGGGTCCCCATGGGGTGGCTCAGAGATAGGACCCTGGT

TTTAAATCCCTCCCAGCCTGGTGCTGGTGATGGGCCCTGGCCCTACTCCAGGGCCAATGC

ACCCCCGCCTCACACACGCACTCCTTCTCCTCAAGGCCAGGGCAGAGGGCCTCACCGCCT

CCCGGGCCTGCTGTCAGCTTGCAGCCCGGGGACAGAGGCCAGCTGGGATCTGCCTGAGGA

CAGAGAACATGGTCTCCTGCAGGGCCCTGCCTCCCAAGCCCCGCCCTCAGAAAGCCAAGT

ACCTTTTCAGCTTTTTAACTGCCCCCATCCCAACCCAGGGAGGCCTGTGTCACTCTGGCA

CAAGCTGCCACCACCAGCCACCCACACCCACCCCAGCACACCTCACACGGGACCACAGCC

GCGCTGCCGAGGGCCAAGCACAAAGGTTCCAGTGAGCGCATGTCCCAGCCCCTGGTGGCC

AGGCTCCCCTTGCTGAGCCGCTGCCACTTCACCCTGTGGGAAGTGGCCCCAGCCATCTCC

TCTAGACCAAGGCAGGCAGCCCCGACATCTGCTTCCTCTATCGCCCAATGCAAAATCGAT

GAAATGGGGAGTTCTCTGGGCCAGGCCACATTCACATTCCCCTCCCCCTGTGGTCCAGTG

AAGCCTCCGGACCCCAGGCTCTGCTCTGCCCTGCCCTGCACCCCCCTCGTCAGAAGTACA

TGAGGGGCGCAGAGATGAGCACACAGCTTTGGGCACGGTCCAGGGCAAACTGAAATGTAC

GCCTGAATTTTGTAAACAGAAGTATTAAATGTCTCTTTCTACAAAAAAAAAAAAAAAAAA

>Hs.123078_mRNA_3 gi|14328043|gb|BC009237.1|BC009237智人克隆MGC：2216IMAGE：2989823聚腺苷酸＝3

GGCACGAGGGAGGTGCAGAGCTGAGAATGAGGCGATTTCGGAGGATGGAGAAATAGCCCC

GAGTCCCGTGGAAAATGAGGCCGGCGGACTTGCTGCAGCTGGTGCTGCTGCTCGACCTGC

CCAGGGACCTGGGCGGAATGGGGTGTTCGTCTCCACCCTGCGAGTGCCATCAGGAGGAGG

ACTTCAGAGTCACCTGCAAGGATATTCAACGCATCCCCAGCTTACCGCCCAGTACGCAGA

CTCTGAAGCTTATTGAGACTCACCTGAGAACTATTCCAAGTCATGCATTTTCTAATCTGC

CCAATATTTCCAGAATCTACGTATCTATAGATGTGACTCTGCAGCAGCTGGAATCACACT

CCTTCTACAATTTGAGTAAAGTGACTCACATAGAAATTCGGAATACCAGGAACTTAACTT

ACATAGACCCTGATGCCCTCAAAGAGCTCCCCCTCCTAAAGTTCCTTGGCATTTTCAACA

CTGGACTTAAAATGTTCCCTGACCTGACCAAAGTTTATTCCACTGATATATTCTTTATAC

TTGAAATTACAGACAACCCTTACATGACGTCAATCCCTGTGAATGCTTTTCAGGGACTAT

GCAATGAAACCTTGACACTGAAGCTGTACAACAATGGCTTTACTTCAGTCCAAGGATATG

CTTTCAATGGGACAAAGCTGGATGCTGTTTACCTAAACAAGAATAAATACCTGACAGTTA

TTGACAAAGATGCATTTGGAGGAGTATACAGTGGACCAAGCTTGCTGCTGCCTCTTGGAA

GAAAGTCCTTGTCCTTTGAGACTCAGAAGGCCCCAAGCTCCAGTATGCCATCATGATGCC

TGCTAAGGCAGCCACCTTGGTGTACATGCTCACAGAGGCTCTGTTCATGGAGCAGCTGCT

GTTTGAAAAATTTTGAAATGCAAGATCCACAACTAGATGGAAGGCACTCTAGTCTTTGCA

GAAAAAAATGTACCTGAATGTACATTGCACAATGCCTGGCACAAAGAAGGAAGAATATAA

ATGATAGTTCGACTCGTCTGTGGAAGAACTTACAATCATGGGGAAAGATGGAATAAAAAC

ATTTTTTAAACAGCAAAAAAAAAAAAAAAAAA

>Hs.285508_contig1 AW194680|BF939744|BF516467聚腺苷酸＝1聚腺苷酸＝1

CCCCAGCCCCACTCACCCACCCTCCTTCCCACCAGCCTGCTCTCCGCAGGCCCACTGTCT

TTGGGTTTAATGACGTCTCTTCTCTGTGGAACTTCACGATTCCTTCCCACGGTCAACTCG

GGACCTCCCAGCGACCACTGCAGCCTGCGGACGAGGCCGGGACTTGGCCGAGCGGATCCT

AATAAGGGGAAAATGGTAAATGCAAACGTCCCGTTACAATTTTACCGCCAGTGTGCTGTC

GTTCCCCCTCCCCCTCTCCGAGTCCTCGTGGGGACACGGCGGGGTCTGTAGGAAGTTGGG

CCGGGTTGGGGGTTGCTAGAAGGCGCTGGTGTTTTGCTCTGAGTTTTAAGAGATCCCTTC

CTTCCTCTTCGGTGAATGCAGGTTATTTAAACTTTGGGAAATGTACTTTTAGTCTGTCAT

ATCAAGGCATGAGTCACTGTCTTTTTTTGTGTGAATAAATGGTTTCTAGTACAATGGA

>Hs.183274_contig1

BF437393|BF064008|BF509951|AW134603|AI277015|AI803254|AA887915|BF054958|AI004413|AI393911|AI278517|AW612644|AI492162|AI309226|AI863671|AA448864|AI640165|AA479926|AA461188|AA780161|BF591180|AI918020|AI758226|AI291375|BF001845|BF003064|AI337393|AI522206|BE856784|BF001760|AI280300 FLAG＝1聚腺苷酸＝2 WARN 聚腺苷酸＝3

GCGGCCGCCCGCACGTCCGCGGGTCCCGGCCGCGCCGCCGCCGCGCGCCCCTGCCCGAGA

GAGCTCTGGCCCCGCTAGCGGGGCCAGGAGCCGGGCCTCCCACCGCAGCGTCCCCCGCCG

CGCCAGTCCCCGCTAGTGGTAGTATCTCGTAATAGCTTCTGTGTGTGAGCTACCGTGGAT

CTCCTTCCCTTCTCTTGGGGGCCGGGGGGAAAGAAAAGGATTTAAGCAAAGGCTCCCTCG

CCCTGTGAGGGCGAGCGGCAAAGGCCCGGCTGAGCCCCCCATGCCCCTCCCCTCCCCGTG

TAAAAAGCCTCCTTGTGCAATTGTCTTTTTTTTCCTTTGAACGTGCTTCTTTGTAATGAC

CAAGGTACCGATTTCTGCTAAGTTCTCCCAACAACATGAAACTGCCTATTCACGCCGTAA

TTCTTTCTGTCTCCCTTCTCTCTCTCTCTCTCGCTCGCTCGCTCTCGCTCTCGCTCTCTC

TCGCTGCGTCCTCATTTCCCCTCCCAATCCTCTCTCCCCTCTGCAACCCCCCAGCTCGCT

GGCTTTCTCTCTGGCTTCTCTCTTTTCCTCCTCCACCCACCCCCTTTGGTTTGACAATTT

TGTCTTAAGTGTTTCTCAAAAGAGGTTACTTTAGTTAGCATGCGCGCTGTGGGCAATTGT

TACAAGTGTTCTTAGGTTTACTGTGAAGAGAATGTATTCTGTATCCGTGAATTGCTTTAT

GGGGGGGAGGGAGGGCTAATTATATATTTTGTTGTTCCTCTATACTTTGTTCTGTTGTCT

GCGCCTGAAAAGGGCGGAAGAGTTACAATAAAGTTTACAAGCGAGAACCCGAAAAAAAAA

AAAAA

>Hs.334841_mRNA_3 gi|14290606|gb|BC009084.1|BC009084智人克隆MGC：9270IMAGE：3853674聚腺苷酸＝3

CACCAGCACAGCAAACCCGCCGGGATCAAAGTGTACCAGTCGGCAGCATGGCTACGAAAT

GTGGGAATTGTGGACCCGGCTACTCCACCCCTCTGGAGGCCATGAAAGGACCCAGGGAAG

AGATCGTCTACCTGCCCTGCATTTACCGAAACACAGGCACTGAGGCCCCAGATTATCTGG

CCACTGTGGATGTTGACCCCAAGTCTCCCCAGTATTGCCAGGTCATCCACCGGCTGCCCA

TGCCCAACCTGAAGGACGAGCTGCATCACTCAGGATGGAACACCTGCAGCAGCTGCTTCG

GTGATAGCACCAAGTCGCGCACCAAGCTGGTGCTGCCCAGTCTCATCTCCTCTCGCATCT

ATGTGGTGGACGTGGGCTCTGAGCCCCGGGCCCCAAAGCTGCACAAGGTCATTGAGCCCA

AGGACATCCATGCCAAGTGCGAACTGGCCTTTCTCCACACCAGCCACTGCCTGGCCAGCG

GGGAAGTGATGATCAGCTCCCTGGGAGACGTCAAGGGCAATGGCAAAGGGGGTTTTGTGC

TGCTGGATGGGGAGACGTTCGAGGTGAAGGGGACATGGGAGAGACCTGGGGGTGCTGCAC

CGTTGGGCTATGACTTCTGGTACCAGCCTCGACACAATGTCATGATCAGCACTGAGTGGG

CAGCTCCCAATGTCTTACGAGATGGCTTCAACCCCGCTGATGTGGAGGCTGGACTGTACG

GGAGCCACTTATATGTATGGGACTGGCAGCGCCATGAGATTGTGCAGACCCTGTCTCTAA

AAGATGGGCTTATTCCCTTGGAGATCCGCTTCCTGCACAACCCAGACGCTGCCCAAGGCT

TTGTGGGCTGCGCACTCAGCTCCACCATCCAGCGCTTCTACAAGAACGAGGGAGGTACAT

GGTCAGTGGAGAAGGTGATCCAGGTGCCCCCCAAGAAAGTGAAGGGCTGGCTGCTGCCCG

AAATGCCAGGCCTGATCACCGACATCCTGCTCTCCCTGGACGACCGCTTCCTCTACTTCA

GCAACTGGCTGCATGGGGACCTGAGGCAGTATGACATCTCTGACCCACAGAGACCCCGCC

TCACAGGACAGCTCTTCCTCGGAGGCAGCATTGTTAAGGGAGGCCCTGTGCAAGTGCTGG

AGGACGAGGAACTAAAGTCCCAGCCAGAGCCCCTAGTGGTCAAGGGAAAACGGGTGGCTG

GAGGCCCTCAGATGATCCAGCTCAGCCTGGATGGGAAGCGCCTCTACATCACCACGTCGC

TGTACAGTGCCTGGGACAAGCAGTTTTACCCTGATCTCATCAGGGAAGGCTCTGTGATGC

TGCAGGTTGATGTAGACACAGTAAAAGGAGGGCTGAAGTTGAACCCCAACTTCCTGGTGG

ACTTCGGGAAGGAGCCCCTTGGCCCAGCCCTTGCCCATGAGCTCCGCTACCCTGGGGGCG

ATTGTAGCTCTGACATCTGGATTTGAACTCCACCCTCATCACCCACACTCCCTATTTTGG

GCCCTCACTTCCTTGGGGACCTGGCTTCATTCTGCTCTCTCTTGGCACCCGACCCTTGGC

AGCATGTACCACACAGCCAAGCTGAGACTGTGGCAATGTGTTGAGTCATATACATTTACT

GACCACTGTTGCTTGTTGCTCACTGTGCTGCTTTTCCATGAGCTCTTGGAGGCACCAAGA

AATAAACTCGTAACCCTGTCCTTCAAAAAAAAAAAAAAAAA

>Hs.3321_contig1

AI804745|AI492375|AA594799|BE672611|AA814147|AA722404|AW170088|D11718|BG153444|AI680648|AA063561|BE219054|AI590287|R55185|AI479167|AI796872|AI018324|AI701122|BE218203|AA905336|AI681917|BI084742|AI480008|AI217994|AI401468聚腺苷酸＝2聚腺苷酸＝3

CCGGAGATAACTTGAGGGCTATAGAGGACCGGCTAATACTGGTCCTGAATTTGGCTTCAG

GCCTCACCAACCAAGTGGCCGTGGCCTTGCCGTCTTGCCCGTCGGCCCCCGGTGAGGCCT

GGACCCCTGGGGTCCCGGCACCAGGCCCCGGCTTCCGACCCTGGCAGAAGCCCAAGATCT

GGTCCCTCGCGGAGACTGCCACAAGCCCCGGACACCCGCGCCGGCTCGCCTCCCGGCGCG

GGGGGGTCTCCACCGGGGGGCAACGGTCGCGCCTTTCCGCCCTGCAGCTCTCTCCGGGCC

GCCGCCGCCGCCGCCGCTCACAGACTGGTCTCAGCGCCGCTGGGCAAGTTCCCGGCTTGG

ACCAACCGGCCGTTTCCAGGCCCACCGCCCGGCCCCCGCCCGCACCCGCTCTCCCTGCTG

GGCTCTGCCCCTCCGCACCTGCTGGGACTTCCCGGAGCCGCGGGCCACCCGGCTGCCGCC

GCCGCCTTCGCTCGGCCAGCGGAGCCCGAAGGCGGAACAGATCGCTGTAGTGCCTTGGAA

GTGGAGAAAAAGTTACTCAAGACAGCTTTCCATCCCGTGCCCAGGCGGCCCCAGAACCAT

CTGGACGCCGCCCTGGTCTTATCGGCTCTCTCCTCATCCTAGTTCTTTAAAAAAAAACAA

AAAAACAAAAAAAACTTTTTTTAATCGTTGTAATAATTGTATAAAAAAAATCGCTCTGTA

TAGTTACAACTTGTAAGCATGTCCGTGTATAAATACCTAAAAGCAAAACTAAACAAAGAA

AGTAAGAAAAAGAAATAAAACCAGTCCTCCTCAGCCCTCCCCAAGTCGCTTCTGTGGCAC

CCCGCATTCGCTGTGAGGTTTGTTTGTCCGGTTGATTTTGGGGGGTGGAGTTTCAGTGAG

AATAAACGTGTCTGCCTTTGTGTGTGTGTATATATACAGAGAAATGTACATATGTGTGAA

CCAAATTGTACGAGAAAGTATCTATTTTTGGCTAAATAAATGAGCTGCTGCCACTTTGAC

TATAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>Hs.306216_singlet1 AW083022聚腺苷酸＝1聚腺苷酸＝2

TATGAGCACCTTCACATGGATCCACTTGAGGAAAGAAGGTGGACCGAATTTGTAAACGGT

GTGCAGCAATATATATCAATTCGTTCTGAGATAATCGCCACTTACGCTCTCTGTGGTTTT

GCCAATATCGGGTCCCTAGGAATCGTGATCGGCGGACTCACATCCATGGCTCCTTCCAGA

AAGCGTGATATCGCCTCGGGGGCAGTGAGAGCTCTGATTGCGGGGACCGTGGCCTGCTTC

ATGACAGCCTGCATCGCAGGCATACTCTCCAGCACTCCTGTGGACATCAACTGCCATCAC

GTTTTAGAGAATGCCTTCAACTCCACTTTCCCTGGAACCCCAACCAAGGGTGATAGCTTG

TTGCCAAAGTCTGTTGAGCAGCCCTGTTGCCCAGGGTCCTGGTGAAGTCATCCCAGGAGG

AAACCCCAGTCTGTATTCTTTGAAGGGCTGCTGCACATTGTTGAATCCATCGACCTTTAG

CTGCAATGGGATCTCTAATACATTTTGAGGTCAGCCACTTCTCCAGTGGAACTCTGAAGT

ACAGATGCTGAATTTTCTGCTTTGGAAAGAAAAAAAA

>Hs.99235_contig1 AA456140|AI167259|AA450056聚腺苷酸＝2聚腺苷酸＝3

ACTCGGCATGTGATGAACACCCATAGTTAAGAAACCATGGAGCAAGAAAGCTTGTGGAAA

GTCTCTCTCCTTCCTCATAAGACATGCACACTAATACACATACACACCAAAAAATTACAC

ATTTTAAAACTGCTAAGCTTGGATTTAACTGAATCATATATCTTTTATCATGTTATCCTA

AAAGTGAGAAGACATAACCAAGACATGGAAATAAATGTGAAAGCTGGAGCCGAAGAGTCA

AAGAGCTAAAAAATTAAGTCTAGAACATTCTATGAGGATAGTATAAATAAAAAGAAATAC

AGTCTAGACATGCTGCAAGGAAAGAAGATTCTAAAGTCCGTTTATGGAGGCAATTCCATA

TCCTTTCTTGAACGCACATTCAGCTTACCCCAGAGAGCAAGTGAGGCAATCTGGCAAAAG

ATTAATAAAGATGTAAACCCCTGGAAAAAAAAAAAA

>Hs.169172_mRNA_2 gi|2274961|emb|AJ000388.1|HSCANPX(需)钙蛋白酶样蛋白酶的智人mRNACANPX聚腺苷酸＝3

GAATTCGGCACGAGATAGTTTTCAGGTTAAGAAAGCCAGAATCTTTGTTCAGCCACACTG

ACTGAACAGACTTTTAGTGGGGTTACCTGGCTAACAGCAGCAGCGGCAACGGCAGCAGCA

GCAGCAGCAGCAGCAGCAGCAGCAGCAGGGCTCCTGGGATAACTCAGGCATAGTTCAACA

CTATGGGTCCTCCTCTGAAGCTCTTCAAAAACCAGAAATACCAGGAACTGAAGCAGGAAT

GCATCAAAGACAGCAGACTTTTCTGTGATCCAACATTTCTGCCTGAGAATGATTCTCTTT

TCTACTTCCGACTGCTTCCTGGAAAGGTGGTGTGGAAACGTCCCCAGGACATCTGTGATG

ACCCCCATCTGATTGTGGGCAACATTAGCAACCACCAGCTGACCCAAGGGAGACTGGGGC

ACAAGCCAATGGTTTCTGCATTTTCCTGTTTGGCTGTTCAGGAGTCTCATTGGACAAAGA

CAATTCCCAACCATAAGGAACAGGAATGGGACCCTCAAAAAACAGAAAAATACGCTGGGA

TATTTCACTTTCGTTTCTGGCATTTTGGAGAATGGACTGAAGTGGTGATTGATGACTTGT

TGCCCACCATTAACGGAGATCTGGTCTTCTCTTTCTCCACTTCCATGAATGAGTTTTGGA

ATGCTCTGCTGGAAAAAGCTTATGCAAAGCTGCTAGGCTGTTATGAGGCCCTGGATGGTT

TGACCATCACTGATATTATTGTGGACTTCACGGGCACATTGGCTGAAACTGTTGACATGC

AGAAAGGAAGATACACTGAGCTTGTTGAGGAGAAGTACAAGCTATTCGGAGAACTGTACA

AAACATTTACCAAAGGTGGTCTGATCTGCTGTTCCATTGAGTCTCCCAATCAGGAGGAGC

AAGAAGTTGAAACTGATTGGGGTCTGCTGAAGGGCCATACCTATACCATGACTGATATTC

GCAAAATTCGTCTTGGAGAGAGACTTGTGGAAGTCTTCAGTGCTGAGAAGGTGTATATGG

TTCGCCTGAGAAACCCCTTGGGAAGACAGGAATGGAGTGGCCCCTGGAGTGAAATTTCTG

AAGAGTGGCAGCAACTGACTGCATCAGATCGCAAGAACCTGGGGCTTGTTATGTCTGATG

ATGGAGAGTTTTGGATGAGCTTGGAGGACTTTTGCCGCAACTTTCACAAACTGAATGTCT

GCCGCAATGTGAACAACCCTATTTTTGGCCGAAAGGAGCTGGAATCGGTGTTGGGATGCT

GGACTGTGGATGATGATCCCCTGATGAACCGCTCAGGAGGCTGCTATAACAACCGTGATA

CCTTCCTGCAGAATCCCCAGTACATCTTCACTGTGCCTGAGGATGGGCACAAGGTCATTA

TGTCACTGCAGCAGAAGGACCTGCGCACTTACCGCCGAATGGGAAGACCTGACAATTACA

TCATTGGCTTTGAGCTCTTCAAGGTGGAGATGAACCGCAAATTCCGCCTCCACCACCTCT

ACATCCAGGAGCGTGCTGGGACTTCCACCTATATTGACACCCGCACAGTGTTTCTGAGCA

AGTACCTGAAGAAGGGCAACTATGTGCTTGTCCCAACCATGTTCCAGCATGGTCGCACCA

GCGAGTTTCTCCTGAGAATCTTCTCTGAAGTGCCTGTCCAGCTCAGGGAACTGACTCTGG

ACATGCCCAAAATGTCCTGCTGGAACCTGGCTCGTGGCTACCCGAAAGTAGTTACTCAGA

TCACTGTTCACAGTGCTGAGGACCTGGAGAAGAAGTATGCCAATGAAACTGTAAACCCAT

ATTTGGTCATCAAATGTGGAAAGGAGGAAGTCCGTTCTCCTGTCCAGAAGAATACAGTTC

ATGCCATTTTTGACACCCAGGCCATTTTCTACAGAAGGACCACTGACATTCCTATTATAG

TACAGGTCTGGAACAGCCGAAAATTCTGTGATCAGTTCTTGGGGCAGGTTACTCTGGATG

CTGACCCCAGCGACTGCCGTGATCTGAAGTCTCTGTACCTGCGTAAGAAGGGTGGTCCAA

CTGCCAAAGTCAAGCAAGGCCACATCAGCTTCAAGGTTATTTCCAGCGATGATCTCACTG

AGCTCTAAATCTGCAATCCCAGAGAATCCTGACAAAGCGTGCCACCCTTTTATTTTCCGT

CAGGTGCCAGGTCTTAGTTAAGATTCACAATCTTTAGAAAGAATGAGATTCACAATAATT

AACTCTTCCTCTCTTCTGATAAATTCCCCATACCTCCCAATCCAAGTAGCATCTGTAGCT

ACATAACCTATATACCTCCAGCAGCTGGACATGGGGAGCGACAGTCCTATCTAGACATCA

TACACATTTGCCAAGAAAGGATCTCTGGGGCTTCCGGGGGTGAGATTCAAGCAGGACAAT

AACAAGAGGCTGGACACCCTACAGATGTCTTTGATGTTTTCAGTTGTTTGATATATCTCC

CCTGTAGGGCATGTTGAGGAAGGAGGAGGGCTGATCAAGGCCAAGCTGGTCTAGCCTGAC

ATCCTAGCTCCTGACTGAACACTATAGACTTCCCAGCAGCATTTTCACCCAGCAGCCAGA

GCCGGCTTTAAGTCCCCAACCCTTACAGACACCACTGCCACCACCACCAACCACGACCAC

CACCACCACCACCACTCACCACCATCATCACCTCCGGAAAGTGTAGTCCTGCCCTAACCC

TAACCCCAAGTCACCCCCCACAGTAAATTTTACCTTCATGTTGAGAAAGCTTCCTGGTGC

TTAATCAAGAGCTGGAGTTCAATGAGTCCTAGACAGTGAGAGGGGCCTGAGCTTCAGCTC

AATGGAAGCCTGCTGTGTGCTCACAAGACGGAAAAGTGGAAGAAGCTGCAGTGGGAGACA

AAGCCTCGGTCCCCCACCCATCCACACACACCTACACTCACACACGCGCACATGGGCGCG

CAACGGAACTACCATTTCAGGCAGTCAGTGGGCAAGAGGAAAGATAAGTAAGTACCATAC

ACACCTTAAAAGATGAGGAGAATTCATCCAGACATATTACAGCCAGTTTGGGGCCCCTGA

CTTGCAATGTGAAACCTCTTCGCTTGCTGCTAGGTTTACAAACAAGCCCATTGTTCCTGT

GCCTCCTAATATTCATTTGTTACTGAAGGACCCCATCTGGGGACTTGAGACTTTGGTCCC

AGCCCAGACGCCTCAGACTGGTCTCAAAGTCAAGCAAGGCTTCACATCAGCTGCAAGTGT

TAGTTTGCCAGCGCATGATCTCACTGAGCTTCTACAGAATCTGCAATCCCAGAGTCAATC

ATGACGAAATGTACGTCCCACCATCTTAACCTATCAACTTTCTGCCCCTCCTTCAAGGCC

CAGTATAAATGCCACCTCCTCCATGAAGCCTTCCCTAATTCCACCCCAAACCCCCACCTT

CAACAATATTTCAACGCTTCTGCAATGATGAAAAAGAAACATAGTTGTAGTACTTAGCCT

ACCTAGACCAGCAAGCATTCATTTTTAGCTCGCTCATTTTTTACCATGTTTTCCAGTCTG

TTTAACTTCTGCAGTGCCTTCACTACACTGCCTTACATAAACCAAATCACAATAAAGTTC

ATATTCAGTACAATTAAAAAAAAAAAAA

>Hs.351486_mRNA_1 gi|16549178|dbj|AK054605.1|AK054605智人cDNA FLJ30043 fis，克隆3NB692001548聚腺苷酸＝0

TATGCAAGTGTTTAACAGATGCTTCACTATTAAAATATTTTCCCCCCAAGTCTCAAATAT

TGAAGAATCTCTAACCAGGGACACCAGTCCCTACGAAGACCTTGGGCGATTTTGAAGTGC

GGGCACCTCGATTCCCCGAATCTGTAGTGTGGCTGGTATCGGTGTTCCCCTGGTTTAACT

AGCCTGTTTGAAGGCACAGATCATTCATGGGGAAGTATAACCGAATCCAGTCCTCTCCAC

CGCCTGGGGATCTTCACTTTCGCAGTCTACGACTGCCTGTGACTCCAGAAAGACAAACTG

CAGATTGGCCAAGATGGGGAAATTGAGGCAGAGAAGCCAAGACATGTGCTAAAGGTCATG

CAGGCTATGAATGGAGCTGGAATGTGAACGCAGGCCATATGACCCCAGAGCCCATGTTCT

TGAACCCTTAGAAAGACAGCAGCAACACACCTGGTGCAGCAGCTGCTTAGTTGGAGTGGC

TGACAAGGAGAGAATGATTTCCAGGAAGAGCGGAACACATATGGAAGGCCTTAGCTTATC

TTTAGCGCCTCATACACCCGTTCTGGACTTCAGAAAGGCCAGTGAGTGGGATTAGGCCTC

AGAGATAGGATGTCAGTCCCAGTGAGGGATGGCCTAGAGCATTCTTTAATTCTTTCCTTT

GGGTCACACATAAGAAACAATTTTCCAGCACTGATGAGTGTTATTAACAATGAGATGGGA

TAGAATTTAGTTTTCCCTATGGCTGTGCTTCAAAAATAGAAAAGCTGTCTTTTCTCTGGA

ATGATTGAATGAAGCTCTGGGGAGGAAAAGGTGGATTGGCAGATCTCTTAAAGGAAGCTT

CTCCTTCTAGGCACTATTCTAAGGCTTAATATTTTAACTCCCTATATTAACCTAGTTCAA

CTAAACAGTGATCTGAGTAATTTTATTTTTATTAAAGCTCAGATCAAAATGCCATTAACA

TTGATTGAGAAAATCAAAGGAATCTTTGATGTGAGTGGTTAAATTGCTGAATTATTTCAG

TCCCATACCCTCACAGCATGAGTACCTGATCTGATAGACTTCTTTGGAATTCCTTTTTTG

TTTGAGACAGAGTCTTGCTCTGTCGCCCAGGCTGGAGTGCAGCGGTGTGATCTCAACCAT

TGCAACCTCCACCTCCCAGGTTCAGGTGATTCTCATGCCTCAGCCTCCTGAGTAGCTGGG

ATTACAGATGTGCACCACCATGCCCGGCTAATTATTTTGTATCTTTAGTAGAGATGAAGT

TTTGCCATGTGGGCCAGGCTGTTCTCAAACTACTGGCCTCAAGTGATCTGCCCGCCTCGG

CCTCCCAGACTGCTGGGATTACAGGCGTGAGGCACCGTGCCTGGCTGGGATTCCATAATA

AATCCCTCTGTGTCTATTTCTTTTTTCAAATATAATTTTCTTCATTTCCAAACATCATCT

TTAAGACTCCAAGGATTTTTCCAGGCACAGTGGCTCATACCTGTAATCCCATTGCTTGGA

GAGGCCAAGGTGGAAGTTCATTTGAGGCCAGGAGTTCGAGACCAGGTGGGCAACATAGTG

AAACCTTGTCTCTACAACAT

>Hs.153504_contig2

TGTTTATATAACTGTGTTCGTTTTTGTTGTTCCGTCCCGTCGTCCTTGTAGACTCTCATC

CTCGTGTGTTTTGGACCCTCCAGGGGTGACATCGGGTCTTGTGTTCAGCTCTCCTGGACT

GTTATTCCTTGTCCGCGTGTTCGTGTTAGACATTGTCCACGATCTGTATCATGCCTATGT

CTCACTTTGGTCTCTTATTTCAGCGTGAACACTATAGTTCCAAGTTTGTTCGGATAATTC

TGATTCTTGTCACCAGCGTGAGATTTCAACAGAACTTGTTTGGAACAAATACTCACTTAA

AACTTCAGCAGAAGAAAAATTACTTAGTCCTTAGGCCAACCAATTTAACTGCAGTGTCAT

GTTTCACAGGCCTTCCTACATTTAGAAATCGTCACACAGCTGTGATAAGAGTAGATTATT

TTACTATGAAATAATTCTGAATAGATGAAAGCATAAAATGTGAGAAACTGAATGTATTAT

TCAGGAAGAATACTGAGTGCCTTCATTTAACTAAAGTTGAATGTAAAAGTCAATTTGCAC

TTCTTTATAATCCTCTGGTTTAGAATTATAAATTGTTAAAACCTTGATAATTGTCATTTA

ATTATATTTCAGGTGTCCTGAACAGGTCACTAGACTCTACATTGGGCAGCCTTTAAATAT

GATTCTTTGTAATGCTAAATAGCCTTTTTTTCTCTTTTTACTGCAACTTAATATTTCTAT

TTAGAACACAGAAAATGAAAATATTTAGAATAAGTTGTACATTTGATGACAAATAAATCA

CTATTAAAATAAAAAAAAAAAAAAAAAAA

>Hs.199354_singlet1 AI669760聚腺苷酸＝1聚腺苷酸＝2

AGGAACCCCTGTGGGAAAGGTTTAAACCTAAAACAGTGCCCCCTTTGGCTCCTCCTCCCT

TGGCGGAATGGGTTCCTGGACCATGTGCATTTCANTGGGCCATGGGATTTACATTTCCTT

GCATCCCCAGGTGGTTTGATCCCTGCCAGGGCCCCTTCCTTCCTGCTCATGGTTTTCAGG

GGGCCTGATCATGGAAAGTAAGGGGGTTGGGCCTTCCCTTTTGGGGGTGAACCCTGACTC

CATCCCCCTATTGCCCCCCTAACCAATCATGCAAACTTTTCCCCCCCTGGGGTAATTCAC

CAGTTAAAAAAAGCTTTTTTTAAATGTTTTGTTTTGGGGGGGGGGCAGGGCCCCCTTTTT

GTTTTTTTAAGGAGTTGGTTTTGGTTTTTGGCTGATGTTTTGTTTTTTAACATGCCCCCA

GTTTGTAAGGCCAAAGGTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAA

>Hs.162020_contig1 AW291189|AA505872聚腺苷酸＝2聚腺苷酸＝3

TAAGCTTTAAAGGCTCTGTGTTAGGGCATAGTCTAGAAACATGGGGCCCAAGGGCACCGG

GAAAACTTACAAAGGGAAGAGATGGAACTGGGAGGGTTCAAGCTACCAGTTCCATCTCTC

CATGTTTTAGAGAATTGGGGCACTAAGTCAGCCAGGTAAGGTCAGGTCAGAGGAGGGCCC

GGATGAAGCATGAGATGCAGAGGGACAGTGCGTGAATGGAGACCTTGGGTAGCACCAACG

TGTAGCGGCAGAGGTGGGGTGGATGTGGCTGATGTCAGGGAGAGAATGGGGAGCATGCAC

AGGGCTCAGTCTTATACATACATTGAAAATCCTTTAGCCTTTCAAAGATTATTAACCCAA

ATCACCTTTCTTGCTTACTCCAGATGCCTCAGCCTCTGATATAATTGCTAAGTATCTGCC

GTGTTAAAAATAAACATTTGAGAATCAAAAAAAAAAAAAAAAA

GCTTCAGGGTACAGCTCCCCCGCAGCCAGAAGCCGGGCCTGCAGCGCCTCAGCACCGCTC

CGGGACACCCCACCCGCTTCCCAGGCGTGACCTGTCAACAGCAACTTCGCGGTGTGGTGA

ACTCTCTGAGGAAAAACCATTTTGATTATTACTCTCAGACGTGCGTGGCAACAAGTGACT

GAGACCTAGAAATCCAAGCGTTGGAGGTCCTGAGGCCAGCCTAAGTCGCTTCAAAATGGA

ACGAAGGCGTTTGTGGGGTTCCATTCAGAGCCGATACATCAGCATGAGTGTGTGGACAAG

CCCACGGAGACTTGTGGAGCTGGCAGGGCAGAGCCTGCTGAAGGATGAGGCCCTGGCCAT

TGCCGCCCTGGAGTTGCTGCCCAGGGAGCTCTTCCCGCCACTCTTCATGGCAGCCTTTGA

CGGGAGACACAGCCAGACCCTGAAGGCAATGGTGCAGGCCTGGCCCTTCACCTGCCTCCC

TCTGGGAGTGCTGATGAAGGGACAACATCTTCACCTGGAGACCTTCAAAGCTGTGCTTGA

TGGACTTGATGTGCTCCTTGCCCAGGAGGTTCGCCCCAGGAGGTGGAAACTTCAAGTGCT

GGATTTACGGAAGAACTCTCATCAGGACTTCTGGACTGTATGGTCTGGAAACAGGGCCAG

TCTGTACTCATTTCCAGAGCCAGAAGCAGCTCAGCCCATGACAAAGAAGCGAAAAGTAGA

TGGTTTGAGCACAGAGGCAGAGCAGCCCTTCATTCCAGTAGAGGTGCTCGTAGACCTGTT

CCTCAAGGAAGGTGCCTGTGATGAATTGTTCTCCTACCTCATTGAGAAAGTGAAGCGAAA

GAAAAATGTACTACGCCTGTGCTGTAAGAAGCTGAAGATTTTTGCAATGCCCATGCAGGA

TATCAAGATGATCCTGAAAATGGTGCAGCTGGACTCTATTGAAGATTTGGAAGTGACTTG

TACCTGGAAGCTACCCACCTTGGCGAAATTTTCTCCTTACCTGGGCCAGATGATTAATCT

GCGTAGACTCCTCCTCTCCCACATCCATGCATCTTCCTACATTTCCCCGGAGAAGGAAGA

GCAGTATATCGCCCAGTTCACCTCTCAGTTCCTCAGTCTGCAGTGCCTGCAGGCTCTCTA

TGTGGACTCTTTATTTTTCCTTAGAGGCCGCCTGGATCAGTTGCTCAGGCACGTGATGAA

CCCCTTGGAAACCCTCTCAATAACTAACTGCCGGCTTTCGGAAGGGGATGTGATGCATCT

GTCCCAGAGTCCCAGCGTCAGTCAGCTAAGTGTCCTGAGTCTAAGTGGGGTCATGCTGAC

CGATGTAAGTCCCGAGCCCCTCCAAGCTCTGCTGGAGAGAGCCTCTGCCACCCTCCAGGA

CCTGGTCTTTGATGAGTGTGGGATCACGGATGATCAGCTCCTTGCCCTCCTGCCTTCCCT

GAGCCACTGCTCCCAGCTTACAACCTTAAGCTTCTACGGGAATTCCATCTCCATATCTGC

CTTGCAGAGTCTCCTGCAGCACCTCATCGGGCTGAGCAATCTGACCCACGTGCTGTATCC

TGTCCCCCTGGAGAGTTATGAGGACATCCATGGTACCCTCCACCTGGAGAGGCTTGCCTA

TCTGCATGCCAGGCTCAGGGAGTTGCTGTGTGAGTTGGGGCGGCCCAGCATGGTCTGGCT

TAGTGCCAACCCCTGTCCTCACTGTGGGGACAGAACCTTCTATGACCCGGAGCCCATCCT

GTGCCCCTGTTTCATGCCTAACTAGCTGGGTGCACATATCAAATGCTTCATTCTGCATAC

TTGGACACTAAAGCCAGGATGTGCATGCATCTTGAAGCAACAAAGCAGCCACAGTTTCAG

ACAAATGTTCAGTGTGAGTGAGGAAAACATGTTCAGTGAGGAAAAAACATTCAGACAAAT

GTTCAGTGAGGAAAAAAAGGGGAAGTTGGGGATAGGCAGATGTTGACTTGAGGAGTTAAT

GTGATCTTTGGGGAGATACATCTTATAGAGTTAGAAATAGAATCTGAATTTCTAAAGGGA

GATTCTGGCTTGGGAAGTACATGTAGGAGTTAATCCCTGTGTAGACTGTTGTAAAGAAAC

TGTTGAAAATAAAGAGAAGCAATGTGAAGCAAAAAAAAAAAAAAAAAA

>Hs.271580_contig1

AACACAGCCCTACCAANCAATGATGACCAGTGGAAAACAATGAAGTCACCAAACCCTGGA

CAGGGCTCATGCTCCAGGACAANTTGCTGTGGCGTAAATGGTCCATCAGACTGGCAAAAA

TACACATCTGCCTTCCGGACTGAGAATAATGATGCTGACTATCCCTGGCCTCGTCAATGC

TGTGTTATGAACAATCTTAAAGAACCTCTCAACCTGGAGGCTTGTAAACTAGGCGTGCCT

GGTTTTTATCACAATCAGGGCTGCTATGAACTGATCTCTGGTCCAATGAACCGACACGCC

TGGGGGGTTGCCTGGTTTGGATTTGCCATTCTCTGCTGGACTTTTTGGGTTCTCCTGGGT

ACCATGTTCTACTGGAGCAGAATTGAATATTAAGCATAAAGTGTTGCCACCATACCTCCT

TCCCCGAGTGACTCTGGATTTGGTGCTGGAACCAGCTCTCTCCTAATATTCCACGTTTGT

GCCCCACACTAACGTGTGTGTCTTACATTGCCAAGTCAGATGGTACGGACTTCCTTTAGG

ATCTCAGGCTTCTGCAGTTCTCATGACTCCTACTTTTCATCCTAGTCTAGCATTCTGCAA

CATTTATATAGACTGTTGAAAGGAGAATTTGAAAAATGCATAATAACTACTTCCATCCCT

GCTTATTTTTAATTTGGGAAAATAAATACATTCGAAGGAAAAAAAAA

>Hs.69360_mRNA_2 gi|14250609|gb|BC008764.1|BC008764智人克隆MGC：1266 IMAGE：3347571聚腺苷酸＝3

GGCACGAGGGCGAAATTGAGGTTTCTTGGTATTGCGCGTTTCTCTTCCTTGCTGACTCTC

CGAATGGCCATGGACTCGTCGCTTCAGGCCCGCCTGTTTCCCGGTCTCGCTATCAAGATC

CAACGCAGTAATGGTTTAATTCACAGTGCCAATGTAAGGACTGTGAACTTGGAGAAATCC

TGTGTTTCAGTGGAATGGGCAGAAGGAGGTGCCACAAAGGGCAAAGAGATTGATTTTGAT

GATGTGGCTGCAATAAACCCAGAACTCTTACAGCTTCTTCCCTTACATCCGAAGGACAAT

CTGCCCTTGCAGGAAAATGTAACAATCCAGAAACAAAAACGGAGATCCGTCAACTCCAAA

ATTCCTGCTCCAAAAGAAAGTCTTCGAAGCCGCTCCACTCGCATGTCCACTGTCTCAGAG

CTTCGCATCACGGCTCAGGAGAATGACATGGAGGTGGAGCTGCCTGCAGCTGCAAACTCC

CGCAAGCAGTTTTCAGTTCCTCCTGCCCCCACTAGGCCTTCCTGCCCTGCAGTGGCTGAA

ATACCATTGAGGATGGTCAGCGAGGAGATGGAAGAGCAAGTCCATTCCATCCGAGGCAGC

TCTTCTGCAAACCCTGTGAACTCAGTTCGGAGGAAATCATGTCTTGTGAAGGAAGTGGAA

AAAATGAAGAACAAGCGAGAAGAGAAGAAGGCCCAGAACTCTGAAATGAGAATGAAGAGA

GCTCAGGAGTATGACAGTAGTTTTCCAAACTGGGAATTTGCCCGAATGATTAAAGAATTT

CGGGCTACTTTGGAATGTCATCCACTTACTATGACTGATCCTATCGAAGAGCACAGAATA

TGTGTCTGTGTTAGGAAACGCCCACTGAATAAGCAAGAATTGGCCAAGAAAGAAATTGAT

GTGATTTCCATTCCTAGCAAGTGTCTCCTCTTGGTACATGAACCCAAGTTGAAAGTGGAC

TTAACAAAGTATCTGGAGAACCAAGCATTCTGCTTTGACTTTGCATTTGATGAAACAGCT

TCGAATGAAGTTGTCTACAGGTTCACAGCAAGGCCACTGGTACAGACAATCTTTGAAGGT

GGAAAAGCAACTTGTTTTGCATATGGCCAGACAGGAAGTGGCAAGACACATACTATGGGC

GGAGACCTCTCTGGGAAAGCCCAGAATGCATCCAAAGGGATCTATGCCATGGCCTCCCGG

GACGTCTTCCTCCTGAAGAATCAACCCTGCTACCGGAAGTTGGGCCTGGAAGTCTATGTG

ACATTCTTCGAGATCTACAATGGGAAGCTGTTTGACCTGCTCAACAAGAAGGCCAAGCTG

CGCGTGCTGGAGGACGGCAAGCAACAGGTGCAAGTGGTGGGGCTGCAGGAGCATCTGGTT

AACTCTGCTGATGATGTCATCAAGATGATCGACATGGGCAGCGCCTGCAGAACCTCTGGG

CAGACATTTGCCAACTCCAATTCCTCCCGCTCCCACGCGTGCTTCCAAATTATTCTTCGA

GCTAAAGGGAGAATGCATGGCAAGTTCTCTTTGGTAGATCTGGCAGGGAATGAGCGAGGC

GCGGACACTTCCAGTGCTGACCGGCAGACCCGCATGGAGGGCGCAGAAATCAACAAGAGT

CTCTTAGCCCTGAAGGAGTGCATCAGGGCCCTGGGACAGAACAAGGCTCACACCCCGTTC

CGTGAGAGCAAGCTGACACAGGTGCTGAGGGACTCCTTCATTGGGGAGAACTCTAGGACT

TGCATGATTGCCACGATCTCACCAGGCATAAGCTCCTGTGAATATACTTTAAACACCCTG

AGATATGCAGACAGGGTCAAGGAGCTGAGCCCCCACAGTGGGCCCAGTGGAGAGCAGTTG

ATTCAAATGGAAACAGAAGAGATGGAAGCCTGCTCTAACGGGGCGCTGATTCCAGGCAAT

TTATCCAAGGAAGAGGAGGAACTGTCTTCCCAGATGTCCAGCTTTAACGAAGCCATGACT

CAGATCAGGGAGCTGGAGGAGAAGGCTATGGAAGAGCTCAAGGAGATCATACAGCAAGGA

CCAGACTGGCTTGAGCTCTCTGAGATGACCGAGCAGCCAGACTATGACCTGGAGACCTTT

GTGAACAAAGCGGAATCTGCTCTGGCCCAGCAAGCCAAGCATTTCTCAGCCCTGCCAGAT

GTCATCAAGGCCTTGCGCCTGGCCATGCAGCTGGAAGAGCAGGCTAGCAGACAAATAAGC

AGCAAGAAACGGCCCCAGTGACGACTGCAAATAAAAATCTGTTTGGTTTGACACCCAGCC

TCTTCCCTGGCCCTCCCCAGAGAACTTTGGGTACCTGGTGGGTCTAGGCAGGGTCTGAGC

TGGGACAGGTTCTGGTAAATGCCAAGTATGGGGGCATCTGGGCCCAGGGCAGCTGGGGAG

GGGGTCAGAGTGACATGGGACACTCCTTTTCTGTTCCTCAGTTGTCGCCCTCACGAGAGG

AAGGAGCTCTTAGTTACCCTTTTGTGTTGCCCTTCTTTCCATCAAGGGGAATGTTCTCAG

CATAGAGCTTTCTCCGCAGCATCCTGCCTGCGTGGACTGGCTGCTAATGGAGAGCTCCCT

GGGGTTGTCCTGGCTCTGGGGAGAGAGACGGAGCCTTTAGTACAGCTATCTGCTGGCTCT

AAACCTTCTACGCCTTTGGGCCGAGCACTGAATGTCTTGTACTTTAAAAAAATGTTTCTG

AGACCTCTTTCTACTTTACTGTCTCCCTAGAGATCCTAGAGGATCCCTACTGTTTTCTGT

TTTATGTGTTTATACATTGTATGTAACAATAAAGAGAAAAAATAAAAAAAAAAAAAAAAA

AAAAAAAAAAAA

ATCGGACTTCGGTNAACTNTGGCAAGGATTGGACAGNCTAGGTAGGCTAAATGTGTGCTC

TGTCCCTGTTTGCTTCAACAGAGGAGCAAGCCTCAGCTGAGAAGGAGGGCACNTGGAACA

CCTAGCTCCTCCCGTGATTCCCCAAACCCATAACATTCTTCCATAGGGCTGGAACCAGTG

CCCCGTCCTGACAGGGATGAAAAGTGAACCCCTCAGGTCAGGAGAGGCCAGAGTTGAGGT

TCTGCCACTTCCTGTCCCTGGGGAGCCACTCAAGTTACCAGGGCTACCGGCTGAAATAAA

TCTTTTCCGGGTAGGGTCAAGGGCAGTGTGTTCCAAGGCAACTGATGTAGGCCAGTTGCG

TGACTCCAGGTTTGTCCTGGTACTCAGTGGGTCCAATCACCTGGCATTGATCACCTGGCA

TTGATCAGCACCCACCCCACCCCTGAGGCTTGCCCAGCCCCCAGGCCCTCAGATCCCTGC

TCTTCCTGCCTTTCCTGCCCATGTGTCACCCAGCACCCAAGGTTCAGTGACACAGGGTGG

TTTGGAGCTGGTCACTGTCATAGCAGCTGTGATTTCACAAGGAAGGGTGCTGCAGGGGGA

CCTGGTTGATGGGGAGTGGGAAGGGGAAGGAATAAAGAGATCTTCCTCAGGTAAAAAAAA

AAAAAAAAAA

>Hs.211593_contig2

ACCTCGTTTGCTCCCAGTTACTTCTTATCTGGAGCAGTAATGTAGTCCACTTCACTCATG

CCTACCCCGCGTGTCTCGTCTCCTGACATGTCTCACAGACGCTCCTGAAGTTAGGTCATT

ACCTAACCCATAGTTATTTACCTTGAAAGATGGGTCTCCGCACTTGGAAAGGTTTCAAGA

CTTGATACTGCAATAAATTATGGCTCTTCACCTGGGCGCCAACTGCTGATCAACGAAATG

CTTGTTGAATCAGGGGCAAACGGAGTACAGACGTCTCAAGACTGAAACGGCCCCATTGCC

TGGTCTAGTAGCGGATCTCACTCAGCCGCAGACAAGTAATCACTAACCCGTTTTATTCTA

TTCCTATCTGTGGATGTGTAAATGGCTGGGGGGCCAGCCCTGGATAGGTTTTTATGGGAA

TTCTTTACAATAAACATAGCTTGTAACTTGAGATCTACAAATCCATTCATCCTGATTGGG

CATGAAATCCATGGTCAAGAGGACAAGTGGAAAGTGAGAGGGAAGGTTTGCTAGACACCT

TCGCTTGTTATCTTGTCAAGATAGAAAAGATAGTATCATTTCACCCTTGCCAGTAAAAAC

CTTTCCATCCACCCATTCTCAGCAGACTCCAGTATTGGCACAGTCACTCACTGCCATTCT

CACACTATAACAAGAAAAGAAATGAAGTGCATAAGTCTCCTGGGAAAAGAACCTTAACCC

CTTCTCGTGCCATGACTGGTGATTTCATGACTCATAAGCCCCTCCGTAGGCATCATTCAA

GATCAATGGCCCATGCATGCTGTTTGCAGCAGTCAATTGAGTTGAATTAGAATTCCAACC

ATACATTTTAAAGGTATTTGTGCTGTGTGTATATTTTGATAAAATGTTGTGACTTCATGG

CAAACAGGTGGATGTGTAAAAATGGAATAAAAAAAAAAAAAGAGTCAAAAAAAAAAAAAA

AATT

>Hs.155097_mRNA_1 gi|15080385|gb|BC011949.1|BC011949智人克隆MGC：9006IMAGE：3863603聚腺苷酸＝3

GGCGCCCAAGCCGCCGCCGCCAGATCGGTGCCGATTCCTGCCCTGCCCCGACCGCCAGCG

CGACCATGTCCCATCACTGGGGGTACGGCAAACACAACGGACCTGAGCACTGGCATAAGG

ACTTCCCCATTGCCAAGGGAGAGCGCCAGTCCCCTGTTGACATCGACACTCATACAGCCA

AGTATGACCCTTCCCTGAAGCCCCTGTCTGTTTCCTATGATCAAGCAACTTCCCTGAGGA

TCCTCAACAATGGTCATGCTTTCAACGTGGAGTTTGATGACTCTCAGGACAAAGCAGTGC

TCAAGGGAGGACCCCTGGATGGCACTTACAGATTGATTCAGTTTCACTTTCACTGGGGTT

CACTTGATGGACAAGGTTCAGAGCATACTGTGGATAAAAAGAAATATGCTGCAGAACTTC

ACTTGGTTCACTGGAACACCAAATATGGGGATTTTGGGAAAGCTGTGCAGCAACCTGATG

GACTGGCCGTTCTAGGTATTTTTTTGAAGGTTGGCAGCGCTAAACCGGGCCTTCAGAAAG

TTGTTGATGTGCTGGATTCCATTAAAACAAAGGGCAAGAGTGCTGACTTCACAAACTTTG

CAGCTCGTGGCCTCCTTCCTGAATCCCTGGATTACTGGACCTACCCAGGCTCACTGACCA

CCCCTCCTCTTCTGGAATGTGTGACCTGGATTGTGCTCAAGGAACCCATCAGCGTCAGCA

GCGAGCAGGTGTTGAAATTCCGTAAACTTAACTTCAATGGGGAGGGTGAACCCGAAGAAC

TGATGGTGGACAACTGGCGCCCAGCTCAGCCACTGAAGAACAGGCAAATCAAAGCTTCCT

TCAAATAAGATGGTCCCATAGTCTGTATCCAAATAATGAATCTTCGGGTGTTTCCCTTTA

GCTAAGCACAGATCTACCTTGGTGATTTGGACCCTGGTTGCTTTGTGTCTAGTTTTCTAG

ACCCTTCATCTCTTACTTGATAGACTTACTAATAAAATGTGAAGACTAGACCAATTGTCA

TGCTTGACACAACTGCTGTGGCTGGTTGGTGCTTTGTTTATGGTAGTAGTTTTTCTGTAA

CACAGAATATAGGATAAGAAATAAGAATAAAGTACCTTGACTTTGTTCACAGCATGTAGG

GTGATGAGCACTCACAATTGTTGACTAAAATGCTGCCTTTAAAACATAGGAAAGTAGAAT

GGTTGAGTGCAAATCCATAGCACAAGATAAATTGAGCTAGTTAAGGCAAATCAGGTAAAA

TAGTCATGATTCTATGTAATGTAAACCAGAAAAAATAAATGTTCATGATTTCAAGATGTT

ATATTAAAGAAAAACTTTAAAAATTATTATATATTTATAGCAAAGTTATCTTAAATATGA

ATTCTGTTGTAATTTAATGACTTTTGAATTACAGAGATATAAATGAAGTATTATCTGTAA

AAATTGTTATAATTAGAGTTGTGATACAGAGTATATTTCCATTCAGACAATATATCATAA

CTTAATAAATATTGTATTTTAGATATATTCTCTAATAAAATTCAGAATTCTAAAAAAAAA

AAAAAAAA

>Hs.5163_mRNA_1 gi|15990433|gb|BC015582.1|BC015582智人克隆MGC：23280 IMAGE：4637504聚腺苷酸＝3

GGCACGAGGCATGGAGGCGCTGCTGCTGGGCGCGGGGTTGCTGCTGGGCGCTTACGTGCT

TGTCTACTACAACCTGGTGAAGGCCCCGCCGTGCGGCGGCATGGGCAACCTGCGGGGCCG

CACGGCCGTGGTCACGGGTGAGTGCGGAGGCGGGTGAGTGCGAGCTGGCGGGGCGCGCGG

AGAGGAGGCCGGGCCGGCGGTAGCAGCGGCCCGCCGGGCTCAGCTCAGCTCGGCTCCCGC

CCGCGGTCCGCAGGCGCCAACAGCGGCATCGGAAAGATGACGGCGCTGGAGCTGGCGCGC

CGGGGAGCGCGCGTGGTGCTGGCCTGCCGCAGCCAGGAGCGCGGGGAGGCGGCTGCCTTC

GACCTCCGCCAGGAGAGTGGGAACAATGAGGTCATCTTCATGGCCTTGGACTTGGCCAGT

CTGGCCTCGGTGCGGGCCTTTGCCACTGCCTTTCTGAGCTCTGAGCCACGGTTGGACATC

CTCATCCACAATGCCGGTATCAGTTCCTGTGGCCGGACCCGTGAGGCGTTTAACCTGCTG

CTTCGGGTGAACCATATCGGTCCCTTTCTGCTGACACATCTGCTGCTGCCTTGCCTGAAG

GCATGTGCCCCTAGCCGCGTGGTGGTGGTAGCCTCAGCTGCCCACTGTCGGGGACGTCTT

GACTTCAAACGCCTGGACCGCCCAGTGGTGGGCTGGCGGCAGGAGCTGCGGGCATATGCT

GACACTAAGCTGGCTAATGTACTGTTTGCCCGGGAGCTCGCCAACCAGCTTGAGGCCACT

GGCGTCACCTGCTATGCAGCCCACCCAGGGCCTGTGAACTCGGAGCTGTTCCTGCGCCAT

GTTCCTGGATGGCTGCGCCCACTTTTGCGCCCATTGGCTTGGCTGGTGCTCCGGGCACCA

AGAGGGGGTGCCCAGACACCCCTGTATTGTGCTCTACAAGAGGGCATCGAGCCCCTCAGT

GGGAGATATTTTGCCAACTGCCATGTGGAAGAGGTGCCTCCAGCTGCCCGAGACGACCGG

GCAGCCCATCGGCTATGGGAGGCCAGCAAGAGGCTGGCAGGGCTTGGGCCTGGGGAGGAT

GCTGAACCCGATGAAGACCCCCAGTCTGAGGACTCAGAGGCCCCATCTTCTCTAAGCACC

CCCCACCCTGAGGAGCCCACAGTTTCTCAACCTTACCCCAGCCCTCAGAGCTCACCAGAT

TTGTCTAAGATGACGCACCGAATTCAGGCTAAAGTTGAGCCTGAGATCCAGCTCTCCTAA

CCCTCAGGCCAGGATGCTTGCCATGGCACTTCATGGTCCTTGAAAACCTCGGATGTGTGC

GAGGCCATGCCCTGGACACTGACGGGTTTGTGATCTTGACCTCCGTGGTTACTTTCTGGG

GCCCCAAGCTGTGCCCTGGACATCTCTTTTCCTGGTTGAAGGAATAATGGGTGATTATTT

CTTCCTGAGAGTGACAGTAACCCCAGATGGAGAGATAGGGGTATGCTAGACACTGTGCTT

CTCGGAAATTTGGATGTAGTATTTTCAGGCCCCACCCTTATTGATTCTGATCAGCTCTGG

AGCAGAGGCAGGGAGTTTGCAATGTGATGCACTGCCAACATTGAGAATTAGTGAACTGAT

CCCTTTGCAACCGTCTAGCTAGGTAGTTAAATTACCCCCATGTTAATGAAGCGGAATTAG

GCTCCCGAGCTAAGGGACTCGCCTAGGGTCTCACAGTGAGTAGGAGGAGGGCCTGGGATC

TGAACCCAAGGGTCTGAGGCCAGGGCCGACTGCCGTAAGATGGGTGCTGAGAAGTGAGTC

AGGGCAGGGCAGCTGGTATCGAGGTGCCCCATGGGAGTAAGGGGACGCCTTCCGGGCGGA

TGCAGGGCTGGGGTCATCTGTATCTGAAGCCCCTCGGAATAAAGCGCGTTGACCGCCAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>Hs.55150_mRNA_1 gi|17068414|gb|BC017586.1|BC017586智人克隆MGC：26610IMAGE：4837506聚腺苷酸＝3

AGCGGTGGAGAAAAGGCAGAACCAGAGTAGAGATTGACAGTGAGCTGAGCCAATCAGGCT

GTGAATCTGCAGCAGTGATCCCAGGTCCTCCAATTAATACTAAGAGAGTGGACCAGGGCC

CCTGAGGAAGACAGATGGCAGGGACAGCGCGCCATGACCGAGAGATGGCGATCCAGGCCA

AGAAAAAGCTCACCACGGCCACCAACCCCATTGAAAGACTCCGACTGCAGTGCCTGGCCA

GGGGCTCTGCTGGGATCAAAGGACTTGGCAGAGTGTTTAGAATTATGGATGACGATAATA

ATCGAACCCTTGATTTTAAAGAATTTATGAAAGGGTTAAATGATTATGCTGTGGTCATGG

AAAAAGAAGAGGTGGAAGAACTTTTCCGGAGGTTTGATAAAGATGGAAATGGAACAATAG

ACTTCAATGAATTTCTTCTCACATTAAGACCTCCAATGTCCAGAGCCAGAAAAGAGGTAA

TCATGCAAGCTTTTAGAAAGTTAGACAAGACTGGAGATGGTGTTATAACAATCGAAGACC

TTCGTGAAGTATATAATGCAAAACACCACCCAAAGTACCAGAATGGGGAATGGAGTGAGG

AACAAGTATTTAGGAAATTTCTGGATAACTTTGATTCACCCTATGACAAAGATGGATTGG

TGACCCCTGAGGAGTTCATGAACTACTATGCAGGTGTGAGCGCATCCATTGACACTGATG

TGTACTTCATCATCATGATGAGAACCGCCTGGAAGCTTTAAGCACATGACCTGGGGACCA

GGCCCTGGGACAGCCATGTGGCTCCAAATGACTAAATGTCAGCTCAAAAACCAGAATCGT

ATTTGATTTCACACTCATCCTAATGTTTTTTTCTGTGTCAAAATATTGCATTTTCTGGGG

CCAAAAAACAGGCAGAAATAAAAGACATTGAGTAGTCAAAAAAAAAAAAAAAA

>Hs.170177_contig3

TAGAGCATTAAAATAACTATCAGGCAGAAGAATCTTTCTTCTCGCCTAGGATTTCAGCCA

TGCGCGCGCTCTCTCTCTTTCTCTCTCTTTTCCTCTCTCTCCCTCTTTCTAGCCTGGGGC

TTGAATTTGCATGTCTAATTCATTTACTCACCATATTTGAATTGGCCTGAACAGATGTAA

ATCGGGAAGGATGGGAAAAACTGCAGTCATCAACAATGATTAATCAGCTGTTGCAGGCAG

TGTCTTAAGGAGACTGGTAGGAGGAGGCATGGAAACCAAAAGGCCGTGTGTTTAGAAGCC

TAATTGTCACATCAAGCATCATTGTCCCCATGCAACAACCACCACCTTATACATCACTTC

CTGTTTTAAGCAGCTCTAAAACATAGACTGAAGATTTATTTTTAATATGTTGACTTTATT

TCTGAGCAAAGCATCGGTCATGTGTGTATTTTTTCATAGTCCCACCTTGGAGCATTTATG

TAGACATTGTAAATAAATTTTGTGCAAAAAGGACTGGAAAAATGAACTGTATTATTGCAA

TTTTTTTTTGTAAAAGTAGCAGTTTGGTATGAGTTGGCATGCATACAAGATTTACTAAGT

GGGATAAGCTAATTATACTTTTTGTTGTGGATAAACAAATGCTTGTTGATAGCCTTTTTC

TATCAAGAAACCAAGGAGCTAATTATTAATAACAATCATTGCACACTGAGTCTTAGCGTT

TCTGATGGAAACAGTTTGGATTGTATAATAACGCCAAGCCCAGTTGTAGTCGTTTGAGTG

CAGTAATGAAATCTGAATCTAAAATAAAAACAAGATTATTTTTGTCAAAAAAAAAAAAAA

AAAAAAAAAA

>Hs.184601_mRNA_5 gi|4426639|gb|AF104032.1|AF104032智人聚腺苷酸＝2

GCGGCGCGCACACTGCTCGCTGGGCCGCGGCTCCCGGGTGTCCCAGGCCCGGCCGGTGCG

CAGAGCATGGCGGGTGCGGGCCCGAAGCGGCGCGCGCTAGCGGCGCCGGCGGCCGAGGAG

AAGGAAGAGGCGCGGGAGAAGATGCTGGCCGCCAAGAGCGCGGACGGCTCGGCGCCGGCA

GGCGAGGGCGAGGGCGTGACCCTGCAGCGGAACATCACGCTGCTCAACGGCGTGGCCATC

ATCGTGGGGACCATTATCGGCTCGGGCATCTTCGTGACGCCCACGGGCGTGCTCAAGGAG

GCAGGCTCGCCGGGGCTGGCGCTGGTGGTGTGGGCCGCGTGCGGCGTCTTCTCCATCGTG

GGCGCGCTCTGCTACGCGGAGCTCGGCACCACCATCTCCAAATCGGGCGGCGACTACGCC

TACATGCTGGAGGTCTACGGCTCGCTGCCCGCCTTCCTCAAGCTCTGGATCGAGCTGCTC

ATCATCCGGCCTTCATCGCAGTACATCGTGGCCCTGGTCTTCGCCACCTACCTGCTCAAG

CCGCTCTTCCCCACCTGCCCGGTGCCCGAGGAGGCAGCCAAGCTCGTGGCCTGCCTCTGC

GTGCTGCTGCTCACGGCCGTGAACTGCTACAGCGTGAAGGCCGCCACCCGGGTCCAGGAT

GCCTTTGCCGCCGCCAAGCTCCTGGCCCTGGCCCTGATCATCCTGCTGGGCTTCGTCCAG

ATCGGGAAGGGTGATGTGTCCAATCTAGATCCCAACTTCTCATTTGAAGGCACCAAACTG

GATGTGGGGAACATTGTGCTGGCATTATACAGCGGCCTCTTTGCCTATGGAGGATGGAAT

TACTTGAATTTCGTCACAGAGGAAATGATCAACCCCTACAGAAACCTGCCCCTGGCCATC

ATCATCTCCCTGCCCATCGTGACGCTGGTGTACGTGCTGACCAACCTGGCCTACTTCACC

ACCCTGTCCACCGAGCAGATGCTGTCGTCCGAGGCCGTGGCCGTGGACTTCGGGAACTAT

CACCTGGGCGTCATGTCCTGGATCATCCCCGTCTTCGTGGGCCTGTCCTGCTTCGGCTCC

GTCAATGGGTCCCTGTTCACATCCTCCAGGCTCTTCTTCGTGGGGTCCCGGGAAGGCCAC

CTGCCCTCCATCCTCTCCATGATCCACCCACAGCTCCTCACCCCCGTGCCGTCCCTCGTG

TTCACGTGTGTGATGACGCTGCTCTACGCCTTCTCCAAGGACATCTTCTCCGTCATCAAC

TTCTTCAGCTTCTTCAACTGGCTCTGCGTGGCCCTGGCCATCATCGGCATGATCTGGCTG

CGCCACAGAAAGCCTGAGCTTGAGCGGCCCATCAAGGTGAACCTGGCCCTGCCTGTGTTC

TTCATCCTGGCCTGCCTCTTCCTGATCGCCGTCTCCTTCTGGAAGACACCCGTGGAGTGT

GGCATCGGCTTCACCATCATCCTCAGCGGGCTGCCCGTCTACTTCTTCGGGGTCTGGTGG

AAAAACAAGCCCAAGTGGCTCCTCCAGGGCATCTTCTCCACGACCGTCCTGTGTCAGAAG

CTCATGCAGGTGGTCCCCCAGGAGACATAGCCAGGAGGCCGAGTGGCTGCCGGAGGAGCA

TGCGCAGAGGCCAGTTAAAGTAGATCACCTCCTCGAACCCACTCCGGTTCCCCGCAACCC

ACAGCTCAGCTGCCCATCCCAGTCCCTCGCCGTCCCTCCCAGGTCGGGCAGTGGAGGCTG

CTGTGAAAACTCTGGTACGAATCTCATCCCTCAACTGAGGGCCAGGGACCCAGGTGTGCC

TGTGCTCCTGCCCAGGAGCAGCTTTTGGTCTCCTTGGGCCCTTTTTCCCTTCCCTCCTTT

GTTTACTTATATATATATTTTTTTTAAACTTAAATTTTGGGTCAACTTGACACCACTAAG

ATGATTTTTTAAGGAGCTGGGGGAAGGCAGGAGCCTTCCTTTCTCCTGCCCCAAGGGCCC

AGACCCTGGGCAAACAGAGCTACTGAGACTTGGAACCTCATTGCTACGACAGACTTGCAC

TGAAGCCGGACAGCTGCCCAGACACATGGGCTTGTGACATTCGTGAAAACCAACCCTGTG

GGCTTATGTCTCTGCCTTAGGGTTTGCAGAGTGGAAACTCAGCCGTAGGGTGGCACTGGG

AGGGGGTGGGGGATCTGGGCAAGGTGGGTGATTCCTCTCAGGAGGTGCTTGAGGCCCCGA

TGGACTCCTGACCATAATCCTAGCCCTGAGACACCATCCTGAGCCAGGGAACAGCCCCAG

GGTTGGGGGGTGCCGGCATCTCCCCTAGCTCACCAGGCCTGGCCTCTGGGCAGTGTGGCC

TCTTGGCTATTTCTGTGTCCAGTTTTGGAGGCTGAGTTCTGGTTCATGCAGACAAAGCCC

TGTCCTTCAGTCTTCTAGAAACAGAGACAAGAAAGGCAGACACACCGCGGCCAGGCACCC

ATGTGGGCGCCCACCCTGGGCTCCACACAGCAGTGTCCCCTGCCCCAGAGGTCGCAGCTA

CCCTCAGCCTCCAATGCATTGGCCTCTGTACCGCCCGGCAGCCCCTTCTGGCCGGTGCTG

GGTTCCCACTCCCGGCCTAGGCACCTCCCCGCTCTCCCTGTCACGCTCATGTCCTGTCCT

GGTCCTGATGCCCGTTGTCTAGGAGACAGAGCCAAGCACTGCTCACGTCTCTGCCGCCTG

CGTTTGGAGGCCCCTGGGCTCTCACCCAGTCCCCACCCGCCTGCAGAGAGGGAACTAGGG

CACCCCTTGTTTCTGTTGTTCCCGTGAATTTTTTTCGCTATGGGAGGCAGCCGAGGCCTG

GCCAATGCGGCCCACTTTCCTGAGCTGTCGCTGCCTCCATGGCAGCAGCCAAGGACCCCC

AGAACAAGAAGACCCCCCCGCAGGATCCCTCCTGAGCTCGGGGGGCTCTGCCTTCTCAGG

CCCCGGGCTTCCCTTCTCCCCAGCCAGAGGTGGAGCCAAGTGGTCCAGCGTCACTCCAGT

GCTCAGCTGTGGCTGGAGGAGCTGGCCTGTGGCACAGCCCTGAGTGTCCCAAGCCGGGAG

CCAACGAAGCCGGACACGGCTTCACTGACCAGCGGCTGCTCAAGCCGCAAGCTCTCAGCA

AGTGCCCAGCGGAGCCTGCCGCCCCCACCTGGGCACCGGGACCCCCTCACCATCCAGTGG

GCCCGGAGAAACCTGATGAACAGTTTGGGGACTCAGGACCAGATGTCCGTCTCTCTTGCT

TGAGGAATGAAGACCTTTATTCACCCCTGCCCCGTTGCTTCCCGCTGCACATGGACAGAC

TTCACAGCGTCTGCTCATAGGACCTGCATCCTTCCTGGGGACGAATTCCACTCGTCCAAG

GGACAGCCCACGGTCTGGAGGCCGAGGACCACCAGCAGGCAGGTGGACTGACTGTGTTGG

GCAAGACCTCTTCCCTCTGGGCCTGTTCTCTTGGCTGCAAATAAGGACAGCAGCTGGTGC

CCCACCTGCCTGGTGCATTGCTGTGTGAATCCAGGAGGCAGTGGACATCGTAGGCAGCCA

CGGCCCCGGGTCCAGGAGAAGTGCTCCCTGGAGGCACGCACCACTGCTTCCCACTGGGGC

CGGCGGGGCCCACGCACGACGTCAGCCTCTTACCTTCCCGCCTCGGCTAGGGGTCCTCGG

GATGCCGTTCTGTTCCAACCTCCTGCTCTGGGACGTGGACATGCCTCAAGGATACAGGGA

GCCGGCGGCCTCTCGACGGCACGCACTTGCCTGTTGGCTGCTGCGGCTGTGGGCGAGCAT

GGGGGCTGCCAGCGTCTGTTGTGGAAAGTAGCTGCTAGTGAAATGGCTGGGGCCGCTGGG

GTCCGTCTTCACACTGCGCAGGTCTCTTCTGGGCGTCTGAGCTGGGGTGGGAGCTCCTCC

GCAGAAGGTTGGTGGGGGGTCCAGTCTGTGATCCTTGGTGCTGTGTGCCCCACTCCAGCC

TGGGGACCCCACTTCAGAAGGTAGGGGCCGTGTCCCGCGGTGCTGACTGAGGCCTGCTTC

CCCCTCCCCCTCCTGCTGTGCTGGAATTCCACAGGGACCAGGGCCACCGCAGGGGACTGT

CTCAGAAGACTTGATTTTTCCGTCCCTTTTTCTCCACACTCCACTGACAAACGTCCCCAG

CGGTTTCCACTTGTGGGCTTCAGGTGTTTTCAAGCACAACCCACCACAACAAGCAAGTGC

ATTTTCAGTCGTTGTGCTTTTTTGTTTTGTGCTAACGTCTTACTAATTTAAAGATGCTGT

CGGCACCATGTTTATTTATTTCCAGTGGTCATGCTCAGCCTTGCTGCTCTGCGTGGCGCA

GGTGCCATGCCTGCTCCCTGTCTGTGTCCCAGCCACGCAGGGCCATCCACTGTGACGTCG

GCCGACCAGGCTGGACACCCTCTGCCGAGTAATGACGTGTGTGGCTGGGACCTTCTTTAT

TCTGTGTTAATGGCTAACCTGTTACACTGGGCTGGGTTGGGTAGGGTGTTCTGGCTTTTT

TGTGGGGTTTTTATTTTTAAAGAAACACTCAATCATCCTAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>Hs.351972_singlet1 AA865917聚腺苷酸＝2聚腺苷酸＝3

GGGACTTGGAAAGGGGAACTGGGATTTGGGGAGGGGCTGGAGGACTTCCGCACGCTTCCA

CCTCCTTCGACCTCCACTGCGCCCCACCTCCCTGCCTGTGTGTGTTATTTCAAAGGAAAA

GAACAAAAGGAATAAATTTTCTAAGCTCTTTAAAAAAAAAAAAAAAAAAAAAAAAA

>Hs.5366_mRNA_2 gi|15277845|gb|BC012926.1|BC012926智人克隆MGC：16817 IMAGE：3853503聚腺苷酸＝3

GCAGGCTCTGCCTGTGGCCACTAGCAGAGAAGCTGCTGTCCTTCCACCACCAGCACCGGA

CCACCTGCTCCAAGACCAGCCTCCTGGGGGGACCAGGCACCCGGCCTTCACTGGCACCCA

GGGAGCCGTCCTCAGCAGCGTCAACATGTCAAGGCCCAGCAGCAGAGCCATTTACTTGCA

CCGGAAGGAGTACTCCCAGAACCTCACCTCAGAGCCCACCCTCCTGCAGCACAGGGTGGA

GCACTTGATGACATGCAAGCAGGGGAGTCAGAGAGTCCAGGGGCCCGAGGATGCCTTGCA

GAAGCTGTTCGAGATGGATGCACAGGGCCGGGTGTGGAGCCAAGACTTGATCCTGCAGGT

CAGGGACGGCTGGCTGCAGCTGCTGGACATTGAGACCAAGGAGGAGCTGGACTCTTACCG

CCTAGACAGCATCCAGGCCATGAATGTGGCGCTCAACACATGTTCCTACAACTCCATCCT

GTCCATCACCGTGCAGGAGCCGGGCCTGCCAGGCACTAGCACTCTGCTCTTCCAGTGCCA

GGAAGTGGGGGCAGAGCGACTGAAGACCAGCCTGCAGAAGGCTCTGGAGGAAGAGCTGGA

GCAAAGCAGACCTCGACTTGGAGGCCTTCAGCCAGGCCAGGACAGATGGAGGGGGCCTGC

TATGGAAAGGCCGCTCCCTATGGAGCAGGCACGCTATCTGGAGCCGGGGATCCCTCCAGA

ACAGCCCCACCAGAGGACCCTAGAGCACAGCCTCCCACCATCCCCAAGGCCCCTGCCACG

CCACACCAGTGCCCGAGAACCAAGTGCCTTTACTCTGCCTCCTCCAAGGCGGTCCTCTTC

CCCCGAGGACCCAGAGAGGGACGAGGAAGTGCTGAACCATGTCCTAAGGGACATTGAGCT

GTTCATGGGAAAGCTGGAGAAGGCCCAGGCAAAGACCAGCAGGAAGAAGAAATTTGGGAA

AAAAAACAAGGACCAGGGAGGTCTCACCCAGGCACAGTACATTGACTGCTTCCAGAAGAT

CAAGTACAGCTTCAACCTCCTGGGAAGGCTGGCCACCTGGCTGAAGGAGACAAGTGCCCC

TGAGCTCGTACACATCCTCTTCAAGTCCCTGAACTTCATCCTGGCCAGGTGCCCTGAGGC

TGGCCTAGCAGCCCAAGTGATCTCACCCCTCCTCACCCCTAAAGCTATCAACCTGCTACA

GTCCTGTCTAAGCCCACCTGAGAGTAACCTTTGGATGGGGTTGGGCCCAGCCTGGACCAC

TAGCCGGGCCGACTGGACAGGCGATGAGCCCCTGCCCTACCAACCCACATTCTCGGATGA

CTGGCAACTTCCAGAGCCCTCCAGCCAAGCACCCTTAGGATACCAGGACCCTGTTTCCCT

TCGGCGGGGAAGTCATAGGTTAGGGAGCACCTCACACTTTCCTCAGGAGAAGACACACAA

CCATGACCCTCAGCCTGGGGACCCCAACTCCAGGCCCTCCAGCCCCAAACCTGCCCAGCC

AGCCCTGAAAATGCAAGTCTTGTACGAGTTTGAAGCTAGGAACCCACGGGAACTGACTGT

GGTCCAGGGAGAGAAGCTGGAGGTTCTGGACCACAGCAAGCGGTGGTGGCTGGTGAAGAA

TGAGGCGGGACGGAGCGGCTACATTCCAAGCAACATCCTGGAGCCCCTACAGCCGGGGAC

CCCTGGGACCCAGGGCCAGTCACCCTCTCGGGTTCCAATGCTTCGACTTAGCTCGAGGCC

TGAAGAGGTCACAGACTGGCTGCAGGCAGAGAACTTCTCCACTGCCACGGTGAGGACACT

TGGGTCCCTGACGGGGAGCCAGCTACTTCGCATAAGACCTGGGGAGCTACAGATGCTATG

TCCACAGGAGGCCCCACGAATCCTGTCCCGGCTGGAGGCTGTCAGAAGGATGCTGGGGAT

AAGCCCTTAGGCACCAGCTTAGACACCTCCAAGAACCAGGCCCCGCTGATGCAAGATGGC

AGATCTGATACCCATTAGAGCCCCGAGAATTCCTCTTCTGGATCCCAGTTTGCAGCAAAC

CCCACACCCCAGCTCACACAGCAAAAACAATGGACAGGCCCAGAGGGTGAAGCAAACAGT

GTCCCTTCTGGCTGTGTTGGAGCCTCCCCAGTAACCACCTATTTATTTTACCTCTTTCCC

AAACCTGGAGCATTTATGCCTAGGCTTGTCAAGAATCTGTTCAGTCCCTCTCCTTCTCAA

TAAAAGCATCTTCAAGCTTGAAAAAAAAAAAAAAA

>Hs.18140_contig1

CCTTCCATTGAATTCCACCAGACACATTCAGGTTANCTTCGTAATGTCTTCATATGAGTA

TCAATCAACACCTTCCCCAACTCAATTGTACTAGGTTGTAGAGCACAAGGATGGTCTCGT

GCTGCTCTGTGGCACCTGTGCCTACACTGCTCTGAGCTTTGAGGAGGCTGCTCTCTTTGC

TGACCCCATGATCTTTTCTGCCCTTCTGTTAAGGGCATTGGCCACAGCAACGGGGCAAAT

GCCCCAAGCTGGCTGTAAGTGACCCATCCCTTTGGCTCCCATGATTAGACCAAGGAGAGG

CATGGGGTCCAGCTGAGCCATTCAGAACCATTCCTTAGCATTTTCCACTCAAAGGTTAGA

GATGAGATTTTCTCTTCCCAAGGCTACCTCTGGCCATGGTTCCAGCTTCATGGGGGCAAT

GGGATTAGGAAAATGAGGTCAACCTGCAAAGGAAAGCAGATGCAAGAGATGGAGACAGAA

TGGGGGTGTCCTGGGGATCTTGGAGCCTGAATTCATTGGCACAAAAGGCAGCAGCATCCT

CACTGTATCTGCAGTCCATTTGGACTCAATAAAAACTTTGAAAGTCACATGTGTTATGGA

ATTCCTTCTCAGTGACACATTCATCTGTGCTCAGTTGTCCCAGCAAGGGTCAGCCCCTCA

TACCCCTGCAGCATCCGCTGCTATGAAGCAGAGCTGTAAACGCCCTCCCTGTGTATAGGA

AAAGCTACATGGAGCAAATCCTCCTGCCTGAAGAAGTGCATCTCAGCATCACTTCAGCTG

TCGGGGCATTTGTGGGGAGAACCAGACCACCTCTGCGGAAGGCAGCAGACCCTCTTCCAG

CCATGGATGGAGTTGAATTCTCTATAAACGGTTCACCAGCAAACCACCAATACATTCCAT

TGTTTGCCTAGAGAGAAATTTAAAAATAAATAAATGTTCACTTAT

>Hs.133196_contig2

TGCGGCCGCGGCATGAAAGGCGGCGAGGAGAGGCAGCACTGCTGCTCTTGACTTCTGAGC

AGGGCTTAGAGAGCCTGCCCCGGCTTAAGCCGAGCTGCTGGTGCTGACCCTGAGCGCCGA

GTCCGCGAGCTCTGAGTCCGGAGCCTCCCAGCCGTGGAGCCGTGGGATGAGGGGGGCGTT

GGGGGACAGGGCAAAGTCGATCTTGGTTGTACAGCCGCCCGATCCTAGCGCGGAGCTGCG

AGCCTGACCGGCCGCGTCTGGCATGGTCAGAGAAAGAATTTTCTTTTCCCAACTCCGGCT

TTTGGTTTTGTGTGTCCACCTTGCGCAACTCCGGAGCCAGCCGACCCCACATGGATTCTC

AACAGGTGGCCGGCACATCTTCTGAGCCTCGCTCTCTCATCTGAAAGTGGAGTGTAAGTC

CAAGAAGATTCATTTAGACAAAGAAGGTGGAAAAAAAGGACTTTCTGGGCCAGCAAGTCG

GATGACCACCCTCCAAGGGGCAGAGGAGGGCCCATTTTGTGAAGAAGAAATCAACTACCC

GGAAAACGCCACAGGAGGACATGTTTCTGCAGATGTAGTTGCCCTAGAAACAGAAGAGTA

TGGGGGTGTGAATGTCTTCTCTTTTGGGGGCAAACACTATGTCCTTTTCTTTTTCTAGAT

ACAGTTAATTCCTGGAAATTTTAGCGAGTTTGTTCTTGTGGATATTTTGAACAATAAAGA

GTGAAAATCAAAAAAA

>Hs.63325_mRNA_5 gi|15451939|ref|NM_019894.1|智人跨膜蛋白酶，丝氨酸4 TMPRSS4)，mRNA聚腺苷酸＝3

CCCAATCACTCCTGGAATACACAGAGAGAGGCAGCAGCTTGCTCAGCGGACAAGGATGCT

GGGCGTGAGGGACCAAGGCCTGCCCTGCACTCGGGCCTCCTCCAGCCAGTGCTGACCAGG

GACTTCTGACCTGCTGGCCAGCCAGGACCTGTGTGGGGAGGCCCTCCTGCTGCCTTGGGG

TGACAATCTCAGCTCCAGGCTACAGGGAGACCGGGAGGATCACAGAGCCAGCATGTTACA

GGATCCTGACAGTGATCAACCTCTGAACAGCCTCGATGTCAAACCCCTGCGCAAACCCCG

TATCCCCATGGAGACCTTCAGAAAGGTGGGGATCCCCATCATCATAGCACTACTGAGCCT

GGCGAGTATCATCATTGTGGTTGTCCTCATCAAGGTGATTCTGGATAAATACTACTTCCT

CTGCGGGCAGCCTCTCCACTTCATCCCGAGGAAGCAGCTGTGTGACGGAGAGCTGGACTG

TCCCTTGGGGGAGGACGAGGAGCACTGTGTCAAGAGCTTCCCCGAAGGGCCTGCAGTGGC

AGTCCGCCTCTCCAAGGACCGATCCACACTGCAGGTGCTGGACTCGGCCACAGGGAACTG

GTTCTCTGCCTGTTTCGACAACTTCACAGAAGCTCTCGCTGAGACAGCCTGTAGGCAGAT

GGGCTACAGCAGCAAACCCACTTTCAGAGCTGTGGAGATTGGCCCAGACCAGGATCTGGA

TGTTGTTGAAATCACAGAAAACAGCCAGGAGCTTCGCATGCGGAACTCAAGTGGGCCCTG

TCTCTCAGGCTCCCTGGTCTCCCTGCACTGTCTTGCCTGTGGGAAGAGCCTGAAGACCCC

CCGTGTGGTGGGTGGGGAGGAGGCCTCTGTGGATTCTTGGCCTTGGCAGGTCAGCATCCA

GTACGACAAACAGCACGTCTGTGGAGGGAGCATCCTGGACCCCCACTGGGTCCTCACGGC

AGCCCACTGCTTCAGGAAACATACCGATGTGTTCAACTGGAAGGTGCGGGCAGGCTCAGA

CAAACTGGGCAGCTTCCCATCCCTGGCTGTGGCCAAGATCATCATCATTGAATTCAACCC

CATGTACCCCAAAGACAATGACATCGCCCTCATGAAGCTGCAGTTCCCACTCACTTTCTC

AGGCACAGTCAGGCCCATCTGTCTGCCCTTCTTTGATGAGGAGCTCACTCCAGCCACCCC

ACTCTGGATCATTGGATGGGGCTTTACGAAGCAGAATGGAGGGAAGATGTCTGACATACT

GCTGCAGGCGTCAGTCCAGGTCATTGACAGCACACGGTGCAATGCAGACGATGCGTACCA

GGGGGAAGTCACCGAGAAGATGATGTGTGCAGGCATCCCGGAAGGGGGTGTGGACACCTG

CCAGGGTGACAGTGGTGGGCCCCTGATGTACCAATCTGACCAGTGGCATGTGGTGGGCAT

CGTTAGCTGGGGCTATGGCTGCGGGGGCCCGAGCACCCCAGGAGTATACACCAAGGTCTC

AGCCTATCTCAACTGGATCTACAATGTCTGGAAGGCTGAGCTGTAATGCTGCTGCCCCTT

TGCAGTGCTGGGAGCCGCTTCCTTCCTGCCCTGCCCACCTGGGGATCCCCCAAAGTCAGA

CACAGAGCAAGAGTCCCCTTGGGTACACCCCTCTGCCCACAGCCTCAGCATTTCTTGGAG

CAGCAAAGGGCCTCAATTCCTGTAAGAGACCCTCGCAGCCCAGAGGCGCCCAGAGGAAGT

CAGCAGCCCTAGCTCGGCCACACTTGGTGCTCCCAGCATCCCAGGGAGAGACACAGCCCA

CTGAACAAGGTCTCAGGGGTATTGCTAAGCCAAGAAGGAACTTTCCCACACTACTGAATG

GAAGCAGGCTGTCTTGTAAAAGCCCAGATCACTGTGGGCTGGAGAGGAGAAGGAAAGGGT

CTGCGCCAGCCCTGTCCGTCTTCACCCATCCCCAAGCCTACTAGAGCAAGAAACCAGTTG

TAATATAAAATGCACTGCCCTACTGTTGGTATGACTACCGTTACCTACTGTTGTCATTGT

TATTACAGCTATGGCCACTATTATTAAAGAGCTGTGTAACATCAAAAAAAAAAAAAAAAA

AAAA

>Hs.250692_mRNA_2 gi|184223|gb|M95585.1|HUMHLF人肝脏白血病因子(HLF)mRNA，完整cds聚腺苷酸＝3

TTTTTCAATTTTGAACATTTTGCAAAACGAGGGGTTCGAGGCAGGTGAGAGCATCCTGCA

CGTCGCCGGGGAGCCCGCGGGCACTTGGCGCGCTCTCCTGGGACCGTCTGCACTGGAAAC

CCGAAAGTTTTTTTTTAATATATATTTTTATGCAGATGTATTTATAAAGATATAAGTAAT

TTTTTTCTTCCCTTTTCTCCACCGCCTTGAGAGCGAGTACTTTTGGCAAAGGACGGAGGA

AAAGCTCAGCAACATTTTAGGGGGCGGTTGTTTCTTTCTTTCTTATTTCTTTTTTAAGGG

GAAAAAATTTGAGTGCATCGCGATGGAGAAAATGTCCCGACCGCTCCCCCTGAATCCCAC

CTTTATCCCGCCTCCCTACGGCGTGCTCAGGTCCCTGCTGGAGAACCCGCTGAAGCTCCC

CCTTCACCACGAAGACGCATTTAGTAAAGATAAAGACAAAGAAAAGAAGCTGGATGATGA

GAGTAACAGCCCGACGGTCCCCCAGTCGGCATTCCTGGGGCCTACCTTATGGGACAAAAC

CCTTCCCTATGACGGAGATACTTTCCAGTTGGAATACATGGACCTGGAGGAGTTTTTGTC

AGAAAATGGCATTCCCCCCAGCCCATCTCAGCATGACCACAGCCCTCACCCTCCTGGGCT

GCAGCCAGCTTCCTCGGCTGCCCCCTCGGTCATGGACCTCAGCAGCCGGGCCTCTGCACC

CCTTCACCCTGGCATCCCATCTCCGAACTGTATGCAGAGCCCCATCAGACCAGGTCAGCT

GTTGCCAGCAAACCGCAATACACCAAGTCCCATTGATCCTGACACCATCCAGGTCCCAGT

GGGTTATGAGCCAGACCCAGCAGATCTTGCCCTTTCCAGCATCCCTGGCCAGGAAATGTT

TGACCCTCGCAAACGCAAGTTCTCTGAGGAAGAACTGAAGCCACAGCCCATGATCAAGAA

AGCTCGCAAAGTCTTCATCCCTGATGACCTGAAGGATGACAAGTACTGGGCAAGGCGCAG

AAAGAACAACATGGCAGCCAAGCGCTCCCGCGACGCCCGGAGGCTGAAAGAGAACCAGAT

CGCCATCCGGGCCTCGTTCCTGGAGAAGGAGAACTCGGCCCTCCGCCAGGAGGTGGCTGA

CTTGAGGAAGGAGCTGGGCAAATGCAAGAACATACTTGCCAAGTATGAGGCCAGGCACGG

GCCCCTGTAGGATGGCATTTTTGCAGGCTGGCTTTGGAATAGATGGACAGTTTGTTTCCT

GTCTGATAGCACCACACGCAAACCAACCTTTCTGACATCAGCACTTTACCAGAGGCATAA

ACACAACTGACTCCCATTTTGGTGTGCATCTGTGTGTGTGTGCGTGTATATGTGCTTGTG

CTCATGTGTGTGGTCAGCGGTATGTGCGTGTGCGTGTTCCTTTGCTCTTGCCATTTTAAG

GTAGCCCTCTCATCGTCTTTTAGTTCCAACAAAGAAAGGTGCCATGTCTTTACTAGACTG

AGGAGCCCTCTCGCGGGTCTCCCATCCCCTCCCTCCTTCACTCCTGCCTCCTCAGCTTTG

CTTCATGTTCGAGCTTACCTACTCTTCCAGGACTCTCTGCTTGGATTCACTAAAAAGGGC

CCTGGTAAAATAGTGGATCTCAGTTTTTAAGAGTACAAGCTCTTGTTTCTGTTTAGTCCG

TAAGTTACCATGCTAATGAGGTGCACACAATAACTTAGCACTACTCCGCAGCTCTAGTCC

TTTATAAGTTGCTTTCCTCTTACTTTCAGTTTTGGTGATAATCGTCTTCAAATTAAAGTG

CTGTTTAGATTTATTAGATCCCATATTTACTTACTGCTATCTACTAAGTTTCCTTTTAAT

TCTACCAACCCCAGATAAGTAAGAGTACTATTAATAGAACACAGAGTGTGTTTTTGCACT

GTCTGTACCTAAAGCAATAATCCTATTGTACGCTAGAGCATGCTGCCTGAGTATTACTAG

TGGACGTAGGATATTTTCCCTACCTAAGAATTTCACTGTCTTTTAAAAAACAAAAAGTAA

AGTAATGCATTTGAGCATGGCCAGACTATTCCCTAGGACAAGGAAGCAGAGGGAAATGGG

AGGTCTAAGGATGAGGGGTTAATTTATCAGTACATGAGCCAAAAACTGCGTCTTGGATTA

GCCTTTGACATTGATGTGTTCGGTTTTGTTGTTCCCCTTCCCTCACACCCTGCCTCGCCC

CCACTTTTCTAGTTAACTTTTTCCATATCCCTCTTGACATTCAAAACAGTTACTTAAGAT

TCAGTTTTCCCACTTTTTGGTAATATATATATTTTTGTGAATTATACTTTGTTGTTTTTA

AAAAGAAAATCAGTTGATTAAGTTAATAAGTTGATGTTTTCTAAGGCCCTTTTTCCTAGT

GGTGTCATTTTTGAATGCCTCATAAATTAATGATTCTGAAGCTTATGTTTCTTATTCTCT

GTTTGCTTTTGAACGTATGTGCTCTTATAAAGTGGACTTCTGAAAAATGAATGTAAAAGA

CACTGGTGTATCTCAGAAGGGGATGGTGTTGTCACAAACTGTGGTTAATCCAATCAATTT

AAATGTTTACTATAGACCAAAAGGAGAGATTATTAAATCGTTTAATGTTTATACAGAGTA

ATTATAGGAAGTTCTTTTTTGTACAGTATTTTTCAGATATAAATACTGACAATGTATTTT

GGAAGACATATATTATATATAGAAAAGAGGAGAGGAAAACTATTCCATGTTTTAAAATTA

TATAGCAAAGATATATATTCACCAATGTTGTACAGAGAAGAAGTGCTTGGGGGTTTTTGA

AGTCTTTAATATTTTAAGCCCTATCACTGACACATCAGCATGTTTTCTGCTTTAAATTAA

AATTTTATGACAGTATCGAGGCTTGTGATGACGAATCCTGCTCTAAAATACACAAGGAGC

TTTCTTGTTTCTTATTAGGCCTCAGAAAGAAGTCAGTTAACGTCACCCAAAAGCACAAAA

TGGATTTTAGTCAAATATTTATTGGATGATACAGTGTTTTTTAGGAAAAGCATCTGCCAC

AAAAATGTTCACTTCGAAATTCTGAGTTCCTGGAATGGCACGTTGCTGCCAGTGCCCCAG

ACAGTTCTTTTCTACCCTGCGGGCCCGCACGTTTTATGAGGTTGATATCGGTGCTATGTG

TTTGGTTTATAATTTGATAGATGTTTGACTTTAAAGATGATTGTTCTTTTGTTTCATTAA

GTTGTAAAATGTCAAGAAATTCTGCTGTTACGACAAAGAAACATTTTACGCTAGATTAAA

ATATCCTTTCATCAATGGGATTTTCTAGTTTCCTGCCTTCAGAGTATCTAATCCTTTAAT

GATCTGGTGGTCTCCTCGTCAATCCATCAGCAATGCTTCTCTCATAGTGTCATAGACTTG

GGAAACCCAACCAGTAGGATATTTCTACAAGGTGTTCATTTTGTCACAAGCTGTAGATAA

CAGCAAGAGATGGGGGTGTATTGGAATTGCAATACATTGTTCAGGTGAATAATAAAATCA

AAAACTTTTGCAATCTTAAGCAGAGATAAATAAAAGATAGCAATATGAGACACAGGTGGA

CGTAGAGTTGGCCTTTTTACAGGCAAAGAGGCGAATTGTAGAATTGTTAGATGGCAATAG

TCATTAAAAACATAGAAAAATGATGTCTTTAAGTGGAGAATTGTGGAAGGATTGTAACAT

GGACCATCCAAATTTATGGCCGTATCAAATGGTAGCTGAAAAAACTATATTTGAGCACTG

GTCTCTCTTGGAATTAGATGTTTATATCAAATGAGCATCTCAAATGTTTTCTGCAGAAAA

AAATAAAAAGATTCTAATAAAAAAA

>Hs.250726_singlet4 AW298545聚腺苷酸＝2聚腺苷酸＝3

TTCCTTCCCTCCCTCCNTTCCTCAGGAGCCGCCAGTCCCCAAGTTGGCTGTGGTTGGGCA

CCTGGTTTGGGTCCTGCAGAGCTGGGCTCAGGCCCTGGGCTCTGAACCTGTGAACCCTTG

CTGTGTTACGAAACTTTCCTTCCTCTGAGGGCCTTGAACCCTCTCCTTTTCTTCTTTTGG

GGGTGGGGGTTAACTTTATTTTCTCTTCCCTGTATCTGCCTCTCCCTTCCCTCAATTTCC

TGTTTTAAAACTGAATGGCACGAAATTGTTTTCCTCAACTCGGAGATTCCTGTATGGAGA

GAATCAATTTCTATATTTGCAATAAATTTCTTATTTAAAGCTAAAAAAAAAAAAAAAAA

>Hs.79217_mRNA_2 gi|16306657|gb|BC001504.1|BC001504智人克隆MGC：2273 IMAGE：3505512聚腺苷酸＝3

GGCACGAGGGCCATCTGTGGGGGCTTTGGGCCAGGGGTCTCCGGACAGCATGAGCGTGGG

CTTCATCGGCGCTGGCCAGCTGGCTTTTGCCCTGGCCAAGGGCTTCACAGCAGCAGGCGT

CTTGGCTGCCCACAAGATAATGGCTAGCTCCCCAGACATGGACCTGGCCACAGTTTCTGC

TCTCAGGAAGATGGGGGTGAAGTTGACACCCCACAACAAGGAGACGGTGCAGCACAGTGA

TGTGCTCTTCCTGGCTGTGAAGCCACACATCATCCCCTTCATCCTGGATGAAATAGGCGC

CGACATTGAGGACAGACACATTGTGGTGTCCTGCGCGGCCGGCGTCACCATCAGCTCCAT

TGAGAAGAAGCTGTCAGCGTTTCGGCCAGCCCCCAGGGTCATCCGCTGCATGACCAACAC

TCCAGTCGTGGTGCGGGAGGGGGCCACCGTGTATGCCACAGGCACGCACGCCCAGGTGGA

GGACGGGAGGCTCATGGAGCAGCTGCTGAGCAGCGTGGGCTTCTGCACGGAGGTGGAAGA

GGACCTGATTGATGCCGTCACGGGGCTCAGTGGCAGCGGCCCCGCCTACGCATTCACAGC

CCTGGATGCCCTGGCTGATGGGGGCGTGAAGATGGGACTTCCAAGGCGCCTGGCAGTCCG

CCTCGGGGCCCAGGCCCTCCTGGGGGCTGCCAAGATGCTGCTGCACTCAGAACAGCACCC

AGGCCAGCTCAAGGACAACGTCAGCTCTCCTGGTGGGGCCACCATCCATGCCTTGCATGT

GCTGGAGAGTGGGGGCTTCCGCTCCCTGCTCATCAACGCTGTGGAGGCCTCCTGCATCCG

CACACGGGAGCTGCAGTCCATGGCTGACCAGGAGCAGGTGTCACCAGCCGCCATCAAGAA

GACCATCCTGGACAAGGTGAAGCTGGACTCCCCTGCAGGGACCGCTCTGTCGCCTTCTGG

CCACACCAAGCTGCTCCCCCGCAGCCTGGCCCCAGCGGGCAAGGATTGACACGTCCTGCC

TGACCACCATCCTGCCACCACCTTCTCTTCTCTTGTCACTAGGGGGACTAGGGGGTCCCC

AAAGTGGCCCACTTTCTGTGGCTCTGATCAGCGCAGGGGCCAGCCAGGGACATAGCCAGG

GAGGGGCCACATCACTTCCCACTGGAAATCTCTGTGGTCTGCAAGTGCTTCCCAGCCCAG

AACAGGGGTGGATTCCCCAACCTCAACCTCCTTTCTTCTCTGCTCCCAAACCATGTCAGG

ACCACCTTCCTCTAGAGCTCGGGAGCCCGGAGGGTCTTCACCCACTCCTACTCCAGTATC

AGCTGGCACGGGCTCCTTCCTGAGAGCAAAGGTCAAGGACCCCCTCTGTGAAGGCTCAGC

AGAGGTGGGATCCCACGCCCCCTCCCGGCCCCTCCCTGCCCTCCATTCAGGGAGAAACCT

CTCCTTCCCGTGTGAGAAGGGCCAGAGGGTCCAGGCATCCCAAGTCCAGCGTGAAGGGCC

ACAGCCCCTCTTGGCTGCCAAGCACGCAGATCCCATGGACATTTGGGGAAAGGGCTCCTT

GGGCTGCTGGTGAACTTCTGTGGCCACCACCTCCTGCTCCTGACCTCCCTGGGAGGGTGC

TATCAGTTCTGTCCTGGCCCTTTCAGTTTTATAAGTTGGTTTCCAGCCCCCAGTGTCCTG

ACTTCTGTCTGCCACATGAGGAGGGAGGCCCTGCCTGTGTGGGAGGGTGGTTACTGTGGG

TGGAATAGTGGAGGCCTTCAACTGATTAGACAAGGCCCGCCCACATCTTGGAGGGCATCT

GCCTTACTGATTAAAATGTCAATGTAATCTAAAAAAAAAAAAAAAAAA

>Hs.47986_mRNA_1 gi|13279253|gb|BC004331.1|BC004331智人克隆MGC：10940IMAGE：3630835聚腺苷酸＝3

GATAAATGCGGAGGGACGGTCCAGCTTTAGCTCTCTGCTCGCCGCCGCCGCTGTCGCCGC

CACCTCCTCTGATCTACGAAAGTCATGTTACCCAACACCGGGAGGCTGGCAGGATGTACA

GTTTTTATCACAGGTGCAAGCCGTGGCATTGGCAAAGCTATTGCATTGAAAGCAGCAAAG

GATGGAGCAAATATTGTTATTGCTGCAAAGACCGCCCAGCCACATCCAAAACTTCTAGGC

ACAATCTATACTGCTGCTGAAGAAATTGAAGCAGTTGGAGGAAAGGCCTTGCCATGTATT

GTTGATGTGAGAGATGAACAGCAGATCAGTGCTGCAGTGGAGAAAGCCATCAAGAAATTT

GGAGCTTATACCATTGCTAAGTATGGTATGTCTATGTATGTGCTTGGAATGGCAGAAGAA

TTTAAAGGTGAAATTGCAGTCAATGCATTATGGCCTAAAACAGCCATACACACTGCTGCT

ATGGATATGCTGGGAGGACCTGGTATCGAAAGCCAGTGTAGAAAAGTTGATATCATTGCA

GATGCAGCATATTCCATTTTCCAAAAGCCAAAAAGTTTTACTGGCAACTTTGTCATTGAT

GAAAATATCTTAAAAGAAGAAGGAATAGAAAATTTTGACGTTTATGCAATTAAACCAGGT

CATCCTTTGCAACCAGATTTCTTCTTAGATGAATACCCAGAAGCAGTTAGCAAGAAAGTG

GAATCAACTGGTGCTGTTCCAGAATTCAAAGAAGAGAAACTGCAGCTGCAACCAAAACCA

CGTTCTGGAGCTGTGGAAGAAACATTTAGAATTGTTAAGGACTCTCTCAGTGATGATGTT

GTTAAAGCCACTCAAGCAATCTATCTGTTTGAACTCTCCGGTGAAGATGGTGGCACGTGG

TTTCTTGATCTGAAAAGCAAGGGTGGGAATGTCGGATATGGAGAGCCTTCTGATCAGGCA

GATGTGGTGATGAGTATGACTACTGATGACTTTGTAAAAATGTTTTCAGGGAAACTAAAA

CCAACAATGGCATTCATGTCAGGGAAATTGAAGATTAAAGGTAACATGGCCCTAGCAATC

AAATTGGAGAAGCTAATGAATCAGATGAATGCCAGACTGTGAAGGAAAATATAAAAAAAA

AGTCGACTGCTATGCTCAAAAAGTAAAAAAAGCTCAACAGTTAAAATCTAATGTTTGTTT

TCTTTCCTGTTATATTATAAGGATATGCACGTTTGTTCTGGAAAAGATAGAATTTGTCTC

TAAAAGACTTGAAATTGTAATTAAAATGGCAAGCTAATCAAACATAAGCTTCATTAAGTG

GGATTCTAAGACAGTCTGTGTTTTTATATTTCAAGGGTTTAACCCTTTGAGCCTTACATC

TCATTCACTGTCTTTCTCCAAGAAAAGTATTTTGGGCGGACAGTCAGATCAAGCAGTAAA

ATTAGCTCTTTCAAATCTTCTTGTCATGTAAAATGAAGCTAGTCTGTTTTAAAATTTTTA

GTTTTGGATTGTATACTAATGAAAATCTTAATGATGTTTTTGATTTTTATATACTTATTT

TAAAGAAAATCTTATATAGTACATTTTACAAAAATTATAAAAAATGAATTAGTACTGGCG

AGGACTAAATGAAACAATAATTTTTCATTTTGATAACTAGCTTTCCAGGTGGACTTAGCC

ATAGGAAAATATTACTAATGTAATTTAACAAATTGCTGCATGTATTCCATTTAAAAATAT

GTTTAAATTGTCCTAAAACAAAATAATTTTCTCCCTAGGAGTATGCATTTGGCTACAGTG

TTTTGAAACAGAAACCTTAGAATAGGTCATTGGTATGGGCTGAACTGTGTATCCCCCAAT

TCATTTGTTGAGGTCCTAACTCCCATTTCTTTTGAATGTGACTGTTCGGAGATGAGGCCT

TTAAAGAGGTGACTTAAGTTCAAAGGAGGCTGTTAGTCTAATCCAACATGGTGTCCTTTG

GACATAAGAGATACCAGCAATGTGTGCACAGAACAAAGACCAGGAGAGGACACAGTGAGA

AGGCAGTTATCTGCAAGCAAAGAGAGAGGCTTCAGAAGAAACAAAATCACCAGCACCTTG

ATCTTTGACTTCTAATCTCCAGAATAGTGAGAAATAAATTTCTGTTGTTAAGCCGTCCAC

TGTGGGAGGCCGACGCAGGAGGATTGCTTGAGGCCAGGAGTTCAAGGCCAGCCTGGACAA

CATAGTAAGACCCTATCTCTACCCCCCTAATAAATTAATTTAAAAAGCCCCCCAATCTGT

GGTATTTTATTATGGCAGCCCTAGCAAGCTAATACAGTGGTTTGAGAGGCTGGGAGGGTT

GAGGGGAAGATAAACTTTTAAAAAGCTCTTATCTTTCATTTCAATCAGTTAAAAATACTT

GCTCAGTGTAACAATTTTGCTTCTCAGCTTCCACTCTAATATTGTTGTGCCATTAAGCAA

TTTAGCTAATCCTGACATTTCTTAGATTCATAATGTTAGGAGCATTTAATCTGTATTTTA

CAAGTTAGGAAGCAGAGGATCAGAGATGGGAAAGGACTAGCCCAAGGCCAACATTAACAA

GCCCTCTAACAAAAACTTTACAATACATTTATGTTGAATGGAACTCCAAGATCTCACCTC

TCCATCCAGGAATGGAGTCCATGTAATCAAAGTGAACTTAAAAATAGGACAGTTTCAACA

AGTCAGGAGATTCACAGCAACTGATCAAAGGGAGTCCAGTCAACGTGAGCAAGCGTGATT

ATGATGAGGAAGCCCCCTCTGCTTTAATCCACACAAGGAACGTAACCTGAAGTAACCTGA

TGTTAACCAATCTGCTGTGTCTACTATGCTGTTTCCTTGTTCCTGCTAGTGCTGCTTTAC

AAATGCAGACCATTCTATCATACCTGGCAGGGCTTCTGTTTTATTTTGTAGGCTGGATGC

TACCCAGTTCATGAATCGCTAATAAAAGCCAATTAGATCTTTAAAAAAAAAAAAAAAAAA

AAA

TATTAAAAGTACCCCATGGATGGACCTCCAAATGAGTTTAGGGTAATTGCGCTTAAAATA

TTAGGACCAAAGTACATTTATTTTATAGATGGAGGAGGGGAGGAGACGAGTGGGGACCAG

CTTGACATCCAGTCTTCACCTGGACATATGGAAAGAACAAATGTGCGATCTGCTCGTTCC

CTCTGAAGGTCTCTGTTACGTATTTCCTCCTCTCCTCCAGAGCATAATAACCAATGACTG

CTCTCAGAAAGGTACTGTGACCACCACTTGCTTGGCTCTCCAACTTCCTCCCCCATTTCC

CTCTTGACTCCTGTTTGCCATAACACCTTCTGTCCCCTAGCCTTGCCTCAGGTCCCCGAC

GAATCCTGCCCTTAATCTGTGGGGGTGGTAGGTGGCACTGGTTTGAAGAGCTTACTGGAT

CTCCCTCAGTGAGTCAGCCTGGAGTTGTGTTTGAAAACCACAGGCCCTGACTGTGGCTGT

AAGACCTCCCAGACACCACCTGCTGCTGCCTATCATCATCTTCAGGTGCTGGGCTCCCCT

GTGGGCCTCGTCTGCCCGCCCTCTGCTGCAGCTGTCCCATGGGCGCCCGCCCTCTCTGAC

ACCACAAGAGAGCCCATCTAGATTCCAGGAAAAAACTCATCTTTATTTGCCTTCTTCCCA

CTGAAGGTAAAAGCAACATTAATAACCACAACAAATACTTAGTGAGTGCTTACTATTATT

CATTTAATTGTAGGCCCTTCCATCCCTGGCCATGATGAGAGACATGCCATAGCTTACTCC

TAAAGAGACCTGAGGACACACGTGCACAAACATATTGGGCATATCATCAATGGCATCAAA

ACTGATTTTCCCTGTCTACCCAGAACAGGCCTGAGGGAGAGGGAAAAGCGGATACCCACC

TGTGTCGCTGTTTGCGTGCCAAGTCCAGGAACAGTCCATACAGCCCTGCTGCATCCCACG

ACGCTGTCACAAAGCAGGAGTTCATCCGAGGCCAAGGTATGGAGAAACTGAGGCCCAGAA

ATTGATGTCCAGAATGCTTTGCTCTTAGCCACTGTACTATTATGGCATATTTTATCTTTA

TGTATTGCATCATTTCATGGATTCAAGTTTATCAATGTCCTTTGACAAGTTTAAAAATCT

GTCTGCTAAAATCTATCAAATACATTAAGGAAAAGTCCCACTTGGCACATCTCCCACACC

AGATGTTAATTATTCATACTGCATGACTGAGGATTTTGGAGGCAGAGAGAGATTCATCTG

CAATATTTGGAACACCAATGGAGGTCTATGTCAACACAGAATTTATACAGCAGCTGGTGC

TAGTCAGAGCTAATGACAGAATTTCAGTTTAATAAAAAGACCCCCAACTGAGCACACCAT

CTTGAAAAAAGTATACTTATCAAACAGCTTTCAATCAGTTCAAGAGAGACACCTTAATTG

GGGAGAGGAAGAATTGCAGAGTAGTTTGTAATCATGCCAATTCCAGATCAATAACTGCAT

GTCTGTTCTTTGGTAGAAATAGCTTTTGCTTTATATTAAGTAATCACATATATATTCTCT

CTATTTGGATAAGGAAACCTTCGCTTTATTTGACAATGTATAATGATATACTCTTCTAAT

TCACCTCTGTGTCTTCACAATAAACATGAGTAAAATTTAGACAAGTGATGGTAAAGGTCA

ATATAATTATTTATTTTTAAAATAAATTTTGTATCTAACAGGAAAGCAGTTCTTATGAAA

TTTTTATATTTTCAAAAATTGTTTTGTTCAAATAAAATTTTATGAGTAAAGTTAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAA

>Hs.49215_contig1

GGGTACCTGGTGGGGCCAATCACCGAGCCATGAACATCAGTAACGTACTCTAAAGACCAA

GGCTACGATGGCTATGATGGTCAGAATTACTACCACCACCAGTGAAGCTCCAGCCTGGGA

TGAATTCATCCATTCTGGCTTTGCATCCGGCTACCATTTTCGAAGTTCAACTCAGGAAGG

TGCAATATAACAAATGTGCATATTATAATGAGGAATGGTACTACCGTTCCAGATTTTCTG

TAATTGCTTCTGCAAAGTAATAGGCTTCTTGTCCCTTTTTTTTCTGGCATGTTATGGAAT

GATCATTGTAAATCAGGACCATTTATCAAGCAGTACACCAACTCATAAGATCAAATTTCA

TTGAATGGTTTGAGGTTGTAGCTCTATAAATAGTAGTTTTTAACATGCCTGTAGTATTGC

TAACTGCAAAAACATACTCTTTGTACAAGAAGTGCTTCTAAGAATTTCATTGACATTAAT

GACACTGTATACAATAAATGTGTAGTTTCTTAATCGCACTACCTATGCAACACTGTGTAT

TAGGTTTATCATCCTCATGTATTTTTATGTGACCTGTATGTATATTCTAATCTACGAGTT

TTATCACAAATAAAAATGCAATCCTTCAAA

>Hs.281587_contig2

AAGGTGGGCTTTCATTGTGATTTTTGTTCTGTTGCAGTAATATAGGAGCACATTTTGGCC

ATTGTAATTACAGGGAACAAAGGGATTGCGGACACATATCTGGACTTCTTTTCCTCCCTT

ATTGTTGTGGAAGAGACACTAGAAATGCTCAAACACCTGCAATATACAGAATATACACAA

TTTTATTCCAGTATTTCCCTAACATATGGTTTAAAATTATTCCAGGTATACAGTGTATGC

AATTCTGCATTATCACAGAGGAACAACTTCTTTTTTAAAAAATAAATAGGTCAGCCATTT

TTATTAACGTGCAAAAACTTTATCACTCTAACATGCTCTAGGTAGTTGAGGAAAAGAGGT

CTGATCACTGTTTGTATTTTATTTTCTTTGTGGGAACATTTCACCTGCTGAGTGTACATG

AATTTGCTTTCTATAAAAGGCTTTTATGAGTTTACAGTAGAATCAGTGGAAGGAAGAGTT

AATAAGGGCTGTTTTTAAAAAAACAAACAAACAAACAAAACAAATAATTAAAAAAAAATT

TTACATTCCTTCCTATTCTCTAACTACACTTGGGAAGTGCACTTCAGATAAGTTTGCAGT

GTGACTGAGAGATGAAGGAAATCCATAGAAAAGGTCCTCTTAGTGAACAAAATTTAGTTA

TTAACTTTATAGCTATGAAATTTCCCCGGGCATTTGTTTTTGTTCAAACAGACTTTAACC

TCTGCATCATACTTAACCCTGCGACATGCGTACAGTATGCATATTTTGTTTTGAAAAAAA

ATGTTTCGTTCCAGTCTGTTAAGAATATTCAAAAATAATAAAGGTATTGCTTAATAAAAT

TGCTAGAATTGTTTAGCAGTACATGCACAATATTTTACTAGATTCTTTGTTTTAATAGTG

TTTTGTTGAGACTGAAAATCTTAAAATGGTCTGCGCAAATACAAAAAAAAAGAAAACACC

AAAAAAAAAA

GGTGTTGTTCCGGACACATAGAAAGATAACGACGGGAAGAGCGGGGCCCGCTTTGGGGTC

CAGGCAGGTTTTGGGGCCTCCTGTCTGGTGGGAGGAGGCCGCAGCGCAGCACCCTGCTCG

TCACTTGGGATGGAGACCGGCTTTCCCGCAATCATGTACCCTGGATCTTTTATTGGGGGC

TGGGGAGAAGAGTATCTCAGCTGGGAAGGACCGGGGCTCCCAGATTTCGTCTTCCAGCAG

CAGCCCGTGGAGTCTGAAGCAATGCACTGCAGCAACCCCAAGAGTGGAGTTGTGCTGGCT

ACAGTGGCCCGAGGTCCCGATGCTTGTCAGATACTCACCAGAGCCCCGCTGGGCCAGGAT

CCCCCGCAGAGGACAGTGCTAGGGCTGCTAACTGCAAATGGGCAGTACAGGAGGACCTGT

GGCCAGGGGATCACAAGAATCAGGTGTTATTCTGGATCAGAAAATGCCTTCCCTCCAGCT

GGAAAGAAAGCACTCCCTGACTGTGGGGTCCAAGAGCCCCCCAAGCAAGGGTTTGACATC

TACATGGATGAACTAGAGCAGGGGGACAGAGACAGCTGCTCGGTCAGAGAGGGGATGGCA

TTTGAGGATGTGTATGAAGTAGACACCGGCACACTCAAGTCAGACCTGCACTTCCTGCTG

GATTTCAACACAGTTTCCCCTATGCTGGTAGATTCATCTCTCCTCTCCCAGTCTGAAGAT

ATATCCAGTCTTGGCACAGATGTGATAAATGTGACTGAATATGCTGAAGAAATTTATCAG

TACCTTAGGGAAGCTGAAATAAGGCACAGACCCAAAGCACACTACATGAAGAAGCAGCCA

GACATCACGGAAGGCATGCGCACGATTCTGGTGGACTGGCTGGTGGAGGTTGGGGAAGAA

TATAAACTTCGAGCAGAGACCCTGTATCTGGCTGTCAACTTCCTGGACAGGTTCCTTTCA

TGTATGTCTGTTCTGAGAGGGAAACTGCAGCTCGTAGGAACAGCAGCTATGCTTTTGGCT

TCGAAATATGAAGAGATATATCCTCCTGAAGTAGACGAGTTTGTCTATATCACCGATGAT

ACATACACAAAACGACAACTGTTAAAAATGGAACACTTGCTTCTGAAAGTTCTAGCTTTT

GATCTGACAGTACCAACCACCAACCAGTTTCTCCTTCAGTACTTGAGGCGACAAGGAGTG

TGCGTCAGGACTGAGAACCTGGCTAAGTACGTAGCAGAGCTGAGTCTACTTGAAGCAGAT

CCATTCTTGAAATATCTTCCTTCACTGATAGCTGCAGCAGCTTTTTGCCTGGCAAACTAT

ACTGTGAACAAGCACTTTTGGCCAGAAACCCTTGCTGCATTTACAGGGTATTCATTAAGT

GAAATTGTGCCTTGCCTGAGTGAGCTTCATAAAGCGTACCTTGATATACCCCATCGACCT

CAGCAAGCAATTAGGGAGAAGTACAAGGCTTCAAAGTACCTGTGTGTGTCCCTCATGGAG

CCACCTGCAGTTCTTCTTCTACAATAAGTTTCTGAATGGAAGCACTTCCAGAACTTCACC

TCCATATCAGAAGTGCCAATAATCGTCATAGGCTTCTGCACGTTGGATCAACTAATGTTG

TTTACAATATAGATGACATTTTAAAAATGTAAATGAATTTAGTTTCCCTTAGACTTTAGT

AGTTTGTAATATAGTCCAACATTTTTTAAACAATAAACTGCTTGTCTTATGACAAAAAAA

AAA

>Hs.156469_contig2

TCCAAGCCATTAAGGACTGTGGAACTTGCTATGATCATGGACGTGCTGTATGGTGGCGTT

TGTTATGCAGGAATTGATACAGATCCTGAGCTAAAATACCCAAAAGGTGCTGGGCGAGTT

GCTTTCTCCAATCAGCAGAGCTATATTGCTGCCATTAGTGCTCGGTTTGTTCAGCTTCAG

CATGGTGATATTGATAAACGTGTGGAGGTAAAGCCATATGTGCTAGATGACCAGATGTGT

GATGAATGCCAGGGCGCACGCTGTGGTGGAAAATTTGCTCCCTTTTTTTGTGCCAATGTC

ACTTGCCTGCAGTATTACTGTGAGTTTTGTTGGGCAAATATCCACTCTCGTGCTGGACGT

GAGTTCCATAAGCCATTGGTAAAGGAAGGTGCTGATCGCCCACGTCAGATCCACTTCCGC

TGGAACTAAGAATAGCAAACTGGCCTCTGTTTAACAAGGAAAGAAAGGGTGCATGTGGCT

TACTGTGTCTGAAGATACTGACATGCAGAAGAAATAAGTGCATTCTTCTGCTTTTCACCC

CAGCTATCAATACATGCATCTTTATCAGCAGCCAAAACACTACAAGCCTCTTGTTTTTCA

CCAAAACCCTACATCTCAGGCTTACTAATTTTTGTGATATTTTCATGTTCAAATAAAATG

TTTTTTTGTATTTTCAAAAAAAAAAAAAAAAAAAAAA

>Hs.6631_mRNA_1 gi|7020430|dbj|AK000380.1|AK000380智人cDNA FLJ20373 fis，克隆HEP19740聚腺苷酸＝3

CTCGATGTAGAGGGGTTGGTAGCAGACAGGTGGTTACATTAGAATAGTCACACAAACTGT

TCAGTGTTGCAGGAACCTTTTCTTGGGGGTGGGGGAGTTTCCCTTTTCTAAAAATGCAAT

GCACTAAAACTATTTTAAGAATGTAGTTAATTCTGCTTATTCATAAAGTGGGCATCTTCT

GTGTTTTAGGTGTAATATCGAAGTCCTGGCTTTTCTCGTTTTCTCACTTGCTCTCTTGTT

CTCTGTTTTTTTAAACCAATTTTACTTTATGAATATATTCATGACATTTGTAATAAATGT

CTTGAGAAAGAATTTGTTTCATGGCTTCATGGTCATCACTCAAGCTCCCGTAAGGATATT

ACCGTCTCAGGAAAGGATCAGGACTCCATGTCACAGTCCTGCCATCTTACTTTCCTCTTG

TCGAGTTCTGAGTGGAAATAACTGCATTATGGCTGCTTTAACCTCAGTCATCAAAAGAAA

CTTGCTGTTTTTTAGGCTTGATCTTTTTCCTTTGTGGTTAATTTTCCTGTATATTGTGAA

AATGGGGGATTTTCCCTCTGCTCCCACCCACCTAAACACAGCAGCCATTTGTACCTGTTT

GCTTCCCATCCCACTTGGCACCCACTCTGACCTCTTGTCAGTTTCCTGTTCCTGGTTCCA

TCTTTTTGAAAAAGGCCCTCCTTTGAGCTACAAACATCTGGTAAGACAAGTACATCCACT

CATGAATGCAGACACAGCAGCTGGTGGTTTTGTGTATACCTGTAAAGACAAGCTGAGAGG

CTTACTTTTTGGGGAAGTAAAAGAAGATGGAAATGGATGTTTCATTTGTATGAGTTTGGA

GCAGTGCTGAAGGCCAAAGCCGCCTACTGGTTTGTAGTTAACCTAGAGAAGGTTGAAAAA

TTAATCCTACCTTTAAAGGGATTTGAGGTAGGCTGGATTCCATCGCCACAGGACTTTAGT

TAGAATTAAATTCCTGCTTGTAATTTATATCCATGTTTAGGCTTTTCATAAGATGAAACA

TGCCACAGTGAACACACTCGTGTACATATCAAGAGAAGAAGGAAAGGCACAGGTGGAGAA

CAGTAAAAGGTGGGCAGATGTCTTTGAAGAAATGCTCAATGTCTGATGCTAAGTGGGAGA

AGGCAGAGAACAAAGGATGTGGCATAATGGTCTTAACATTATCCAAAGACTTGAAGCTCC

ATGTCTGTAAGTCAAATGTTACACAAAAAAAAATGCAAATGGTGTTTCATTGGAATTACC

AAGTGCTTAGAACTTGCTGGCTTTCCCATAGGTGGTAAAGGGGTCTGAGCTCACACCGAG

TTGTGCTTGGCTTGCTTGTGCAGCTCCAGGCACCCGGTGGGCACTCTGGTGGTGTTTGTG

GTGAACTGAATTGAATCCATTGTTGGGCTTAAGTTACTGAAATTGGAACACCCTTTGTCC

TTCTCGGCGGGGGCTTCCTGGTCTGTGCTTTACTTGGCTTTTTTCCTTCCCGTCTTAGCC

TCACCCCCTTGTCAACCAGATTGAGTTGCTATAGCTTGATGCAGGGACCCAGTGAAGTTT

CTCCGTTAAAGATTGGGAGTCGTCGAAATGTTTAGATTCTTTTAGGAAAGGAATTATTTT

CCCCCCTTTTACAGGGTAGTAACTTCTCCACAGAAGTGCCAATATGGCAAAATTACACAA

GAAAACAGTATTGCAATGACACCATTACATAAGGAACATTGAACTGTTAGAGGAGTGCTC

TTCCAAACAAAACAAAAATGTCTCTAGGTTTAGTCAGAGCTTTCACAAGTAATAACCTTT

CTGTATTAAAATCAGAGTAACCCTTTCTGTATTGAGTGCAGTGTTTTTTACTCTTTTCTC

ATGCACATGTTACGTTGGAGAAAATGTTTACAAAAATGGTTTTGTTACACTAATGCGCAC

CACATATTTATGGTATATTTTAAGTGACTTTTTATGGGTTATTTAGGTTTTCGTCTTAGT

TGTAGCACACTTACCCTAATTTTGCCAATTATTAATTTGCTAAATAGTAATACAAATGAC

AACTGCATTAAATTTACTAATTATAAAAGCTGCAAGCAGACTGGTGGCAAGTACACAGCC

CTTTTTTTTGCAGTGCTAACTTGTCTACTGTGTATTATGAAAATTACTGTTGTCCCCCCA

CCCTTTTTTCCTTAAATAAAGTAAAAATGACACCCTAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAA

>Hs.155977_contig1 AI309080|AI313045聚腺苷酸＝1 WARN聚腺苷酸＝1

TATACGGCTGCTAGAAGACGACAGAAGGTGGCTTGGGGGTGGATATCTTTGGGTTGCTGG

AAAAGGTGTGGGAAGGTTCAGGATGGTGGGAGGGACTGAGGTCCCTGAGGTGAAGAGGCC

CTTGGTCCTGACGGGTTTGACCCGTGCCTGGACCCTTGGAGCAGTGTTGTGTGAACTTGC

CTAGAACTCTGCCTTCTCCGTTGTCAATAAAGCCTCCCCCTCATGACCTAAAAAAAAAAA

AAAAAAAAAAAAAAAAAGTCGTATCGA

>Hs.95197_mRNA_4 gi|5817138|emb|AL110274.1|HSM800829智人mRNA；cDNA DKFZp564I0272(来自克隆DKFZp564I0272)聚腺苷酸＝3

GAGCAGGAAAATATATACCCTAAACAGAAACTCTTACTTGTTTTATGAGCAAGTCTGAGT

GAGTCCTAAAATGGCTGGCGAAGAGCTACCAATACTGACTGACAGGTCACCTTAAAGCCT

CTAGGTGTGCCAAGTTTGATTTATCTTAGGGACTAGAACCTAGTCTTCTAAATGTGATTT

TGCCTTGCTGTTTCGTCCTGATGTGAAGGTAACCACACAGAGAGATTGGGCTGCATCAGT

AATGATATGCATACCTTTCGTGCATCAGTGAGCTTCTTCCCTGTTAACTGTATGACCACA

AAATTTAGCTGGAGTAAATAAATATGCGACAGAAATCCTGGAACAAGATGGTGAAATTGC

TTAAGAATCGAGACTTCAGGGCTCAATGACCTCTGAGCATGTTTCCCAAAGTGTGACCCA

CATGACCATCTGTCTCTCAGTCTCCTGGTCCCTCCGTAGAGCTTCTGAAACTGAATCTTT

GTGGGGTGGGGGTAGCGTTCAAGAATCAAAAGTTGAACCAAGCTCTTTGGGTGATACTTA

TGTATACTGAGGTTCAGGAACTGCTGGAGAGATGACTGGGCACCAAGAGGATGACAGTGA

CTCAGCTGGCATCCCTTAGCTGGTTCATGGCAGAGCTGAGTGGGCACTCCTGTCTCTGAC

CCCAGCTTCAGTGCTCTTTATCTCCTCCATGCCTCCTCAGTCGTGCTGCTCTAAGACTGC

TTACTGGCTTTCCTTCATGTCCTGGGCACAGAGCAGTTCTTTTGGTAGCAGATTTGAGTC

CACTTCCCCCGTGCACAGATCACTGCTCAGGACCCAGAGAGGAGCAGCTCTGCTCCAGCA

GGGTTTTCCATTGCATCACACACCCAAACGGTAGGATCCAACAGTCACACTTGAAAGCAA

CCATAATTGTGAGGTTTCTGATGCTGTAGACTTCCTTACATTTCTCACAACCTAGTTAGA

GAGTCACATGGGGGTGAAGTGTGGCTCGCGACCTGCCCCAACAAGTGCGTGCAGAAGCCA

GGAAACAAAGGAGTAAATTCACTTCAAATGGGATGCACATGGTGTCCGTGATGAAGAGAC

ACATTCAGAATTGCCCAAGGACAGGAAAATGACCAGAGAGAGCCAGAGCTGAGCTGGTAA

TAAAGAGACTCCGAGACTGAGTGGAGTTAATGAGGGAAGCATGCAACGAGTGGGGCAATT

TCAGTTGGTTTCTCTCATTGCTTTAAGCGAAATGAACTATACGGACAGGAGAACAGCCTG

CTTGCCCCAGTCTCTCCTTGGCCGCCCTCTGTTGTCCCTGTCAACTCAGGTGCCCACGGT

GCTCAGAGGAGGTGCTGGCAAAGCCCCTGGAGCCTTATGTAGGCCATGGGGGCTCCTAAA

AGGAACCTGAATGAATCATTTACAGCAGGTCTCTCTTGTAAAGCCCAGCCACAGTAACTC

GTACACTGACTGTTTCAAAAGACAGCCTTTCTTAATCATTTAATTGTTTCATATTCAAAT

ATATCTCCTAATTGTTTTTATTTTTTCCTGATCTAGAAGATATGACAACAGGGTAGAACT

TGGGAAGAGGGAATAGGAAGCTCGCCCTTCCTCCTTCCCTCCTCCCCTCTCTACTTTCCT

TCCTTCCTTGGTCATCAGGTACCTTCTTTGTGCCTGCTGTTGTAGGCTACACCCTATGTT

TGGTGGAAGGCAAAAAGAAAAATCAGTAGGATACAACTCAGTAGGGAAGACAGAGATATT

CAAGCCCCTTGTCCTCCCAGTGTGATAAGTGTGGTGGTTGAGGTGTGAACAAGGGGCTCT

GTGAACAGAGAGGACGAAAGAGGAGCTCCTCCTGAGGCTGTTGGGAAAAGCATCACTGAA

GAGTGACTTTCAGAAGAAGAGAAGAAAAAGAGGAGAACATGCGTGATTTTATAATGAAAT

AGATTAGATAAGGGGAAAAAAGGCATTTAAACAAGGCAAAAAGAACAGGAGAATAGAGAA

GAGATGTGGAGGAGAAGGAGCACTGTAGTAAACACGCAGAAGGACAGGAACACTTAGACA

TGCAACCCACTCCCACCCTCCGTCTTGGGGGAGGAAAGCACACTACTGTCCCAAAGAACT

AATACTGAACCAGTGCTGCCTTGTGGAGAGAGGCATGGCCAAGGCGTTCAGAGACCTGGG

CCTGGTCCCACCGCTGCCCACAGCACTCAGCCTCTGAGCACAGCCTGGGGTCATCTGTGT

GCCCTCTGGCCAAGGCTGATGGTAGTTCTCTGAGTAATTGAGAGTCATTGCCTGTCTGTG

CAGTATTGTGAAAACAAGTCACCTTTTAACTTTAAAACTACTTTAAAAAACTTTAAAGTT

TTAAAAAAACTTCTTTAAAAACTACTCATGAGATGACAGTTTCTCTGACCCTCAGAGGAA

GGCTGGGCTGCGCATACGTGAGGAATTTTTACATGAACATCCCAGGACTTGCTGTTCGCA

GGTGATAAACTGCACCTCCCCAGGACTCCCGCTGCACTCACATGCAGCTCCCTGGACTTC

TGGTATCTGACCCGGCCCATTTCTGTGTTTCAGGGGAGAATTTGGCTTGCGGGAGTACTC

AGAAGTTAAGACGGTGACAGTAAAGATCCCCCAGAAGAACTCCTAAGAAGGCCAAGAAGG

AGGATGAAGCCCAGCCTGCACGTCTGTCCCTCTCTGCTTTCTCTGTAGGGCCCAGCTCTC

AGGAATACAAAGTTGAGCCACGGTCCTTACTTAAAGATTGAAAAGATAACATGTAGGCCA

GGCAGGTCACTGCACAACTAAAGCAAACCAGCTGGGTACAGTTTCTTGGCACTCTGTAAG

GGGCCACCTTAATCATACCAAATATTGGGGAAAGTGGGATAAAGGGAGGAGGAGGAGCTA

GCAGACACATCCAGTATCTCCTTCTGGAGCACAGGATGAAATAAGGGAGCTGTATTATTT

CATGTCTTTGTCACAAAGAACTTTCCTCTCAAGGAAAGGTGACCTTTCTCCTGTCTTCAT

TTTCCTCCTTCCAGGCCCTCCTCGCTCACCCACCCCTCCCTCTCTTCCAAGGAGATGTCA

GCTGAGCTCATTCTGGGGCAGATGTTTGGGCCGGGAACAATTTTTCAAGGTTGTAAAGCC

AAATTATCATTTCATGTTATCCATTTCTTCAAAGCAAAACATGAAATGGTTTTAGCTAGA

GTCAGACCAGAATGAAAATGCCAGGAGCTGGTACACTACAGATGTAGTAAGAACCTGGGA

TATTCCTGACCCAATCTGGTTTTCTTTTACCCATAAATAACATGAATGAAAAAAGATTGG

GACAATAGAGACTGGAAGTCATCATGTGCAGTTCACCGCTTCTGAGCTTGCTGCAGTTTT

GGGGTGTGTGTGTATTAGATTCCTTCTCAGTTATTCTGGAATAAGGCAAGGAGTGGGTTG

TTTTTCATAGCTAGATAAGATCTTTTCCAAAGTTTTTCTTAGAACCAACCAAAAAACAAT

CCGAGTAGGCCCGAGAATTTGATAATGCTGGATGCCTTGCAGACATCATTCAGTTTCTAA

TATTGGGCAACAATTATTATTAAATGAATTATTTCTGTAGTTGGAATCTGTACCTTCTGA

ACCTCTACACCAATAACTGCTGCAGGTGTGATTTTGGTCTGTCACACTGTACATCTATCA

TAATGTGCCCTGTATCTATTGGCAGTGACCTTGGAAAATCTGGCCAAGCCTAGGGGTTTC

CTTTTCCATTTGCCAAGTTCCATTGTGCCAGGACTGCCGTGCTCCACTGAGCTCCTCTGT

CACACCCCATTCTTGCCCCTCACTGGGCAGGCCATGGCCTACAGCTTGCAGGGAGTAAAG

CAGGCCCGCCTCCCTTTCTTCCCATCCACATACTCCTCTTCTGCTTTCCAGTGACTCCAC

CAGTTTGATGTGGGAAGTGTTAGCTTCCTTTCCTTCTTCCATCCCTTCTTCCATCTTTCC

AGCTGTCAAATCCAATCCAGTCTCTAACCTAAATGCAGATCATTTATTTAAAAGTACCAA

ACATAACCCAGAGTATGTGGAATATGGGCAACATATATATAGCCTTCTGTATTTAACGAT

CTTCTGCTTCTTAACCGTACCAGTTTTCTATTTATAACTCTTATCTATCCATGATGTTTT

AAAGTCTCCACTTGCTGTTATTTACAAACGACAGTGCATTCAGCAGCCCAGTGCCGTGAG

CCCTGACAGATGCCGTATTTCTGAGTGCTTCCATGTGAATGCTGCCCTCCTGTAGCATGT

GTCCAAGTGGACATAGCCACTAACCAACTAGTTACCTTTGGACTGCAACAAAAAATGTGA

AAATGAAGATTTATTTCTTTTAATTTACTTAAAAAGAAACCTCTGTGCTAGCAATAAAGC

ATTTATATTGTGCAAAAAAAAAAAAAAAAAAAAAC

>Hs.48956_contig1 N64339|AI569513|AI694073聚腺苷酸＝1聚腺苷酸＝1

TGAAAATTTATATAACTGTTGTTGATAAGGAACATTATCCAGGAATTGATACGTTTATTA

GGAAAAGATATTTTTATAGGCTTGGATGTTTTTAGTTCTGACTTTGAATTTATATAAAGT

ATTTTTATAATGACTGGTCTTCCTTACCTGGAAAAACATGCGATGTTAGTTTTAGAATTA

CACCACAAGTATCTAAATTTGGAACTTACAAAGGGTCTATCTTGTAAATATTGTTTTGCA

TTGTCTGTTGGCAAATTTGTGAACTGTCATGATACGCTTAAGGTGGAAAGTGTTCATTGC

ACAATATATTTTTACTGCTTTCTGAATGTAGACGGAACAGTGTGGAAGCAGAAGGCTTTT

TTAACTCATCCGTTTGCCAATCATTGCAAACAACTGAAATGTGGATGTGATTGCCTCAAT

AAAGCTCGTCCCCATTGCTTAAGCCTTCAAAAA

>Hs.118825_mRNA_10 gi|1495484|emb|X96757.1|HSSAPKK3 MAP激酶激酶的智人mRNA 聚腺苷酸＝3

CTTTTAGCTGCCAGCCCTGGCCCATCATGTAGCTGCAGCACAGCCTTCCCTAACGTTGCA

ACTGGGGGAAAAATCACTTTCCAGTCTGTTTTGCAAGGTGTGCATTTCCATCTTGATTCC

CTGAAAGTCCATCTGCTGCATCGGTCAAGAGAAACTCCACTTGCATGAAGATTGCACGCC

TGCAGCTTGCATCTTTGTTGCAAAACTAGCTACAGAAGAGAAGCAAGGCAAAGTCTTTTG

TGCTCCCCTCCCCCATCAAAGGAAAGGGGAAAATGTCTCAGTCGAAAGGCAAGAAGCGAA

ACCCTGGCCTTAAAATTCCAAAAGAAGCATTTGAACAACCTCAGACCAGTTCCACACCAC

CTAGAGATTTAGACTCCAAGGCTTGCATTTCTATTGGAAATCAGAACTTTGAGGTGAAGG

CAGATGACCTGGAGCCTATAATGGAACTGGGACGAGGTGCGTACGGGGTGGTGGAGAAGA

TGCGGCACGTGCCCAGCGGGCAGATCATGGCAGTGAAGCGGATCCGAGCCACAGTAAATA

GCCAGGAACAGAAACGGCTACTGATGGATTTGGATATTTCCATGAGGACGGTGGACTGTC

CATTCACTGTCACCTTTTATGGCGCACTGTTTCGGGAGGGTGATGTGTGGATCTGCATGG

AGCTCATGGATACATCACTAGATAAATTCTACAAACAAGTTATTGATAAAGGCCAGACAA

TTCCAGAGGACATCTTAGGGAAAATAGCAGTTTCTATTGTAAAAGCATTAGAACATTTAC

ATAGTAAGCTGTCTGTCATTCACAGAGACGTCAAGCCTTCTAATGTACTCATCAATGCTC

TCGGTCAAGTGAAGATGTGCGATTTTGGAATCAGTGGCTACTTGGTGGACTCTGTTGCTA

AAACAATTGATGCAGGTTGCAAACCATACATGGCCCCTGAAAGAATAAACCCAGAGCTCA

ACCAGAAGGGATACAGTGTGAAGTCTGACATTTGGAGTCTGGGCATCACGATGATTGAGT

TGGCCATCCTTCGATTTCCCTATGATTCATGGGGAACTCCATTTCAGCAGCTCAAACAGG

TGGTAGAGGAGCCATCGCCACAACTCCCAGCAGACAAGTTCTCTGCAGAGTTTGTTGACT

TTACCTCACAGTGCTTAAAGAAGAATTCCAAAGAACGGCCTACATACCCAGAGCTAATGC

AACATCCATTTTTCACCCTACATGAATCCAAAGGAACAGATGTGGCATCTTTTGTAAAAC

TGATTCTTGGAGACTAAAAAGCAGTGGACTTAATCGGTTGACCCTACTGTGGATTGGTGG

GTTTCGGGGTGAAGCAAGTTCACTACAGCATCAATAGAAAGTCATCTTTGAGATAATTTA

ACCCTGCCTCTCAGAGGGTTTTCTCTCCCAATTTTCTTTTTACTCCCCCTCTTAAGGGGG

CCTTGGAATCTATAGTATAGAATGAACTGTCTAGATGGATGAATTATGATAAAGGCTTAG

GACTTCAAAAGGTGATTAAATATTTAATGATGTGTCATATGAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAA

>Hs.135118_contig3

CAGTCCCACCATGTATTTTGCTTTGTTTCTAAAAAGCTTTTTAAAAACTGTTATTTAATA

CCAAAGGGAGGAATCGTATGGGTTCTTCTGCCCACCGTTGTGACTAAGAATGCACAGGGA

CTTGGTTCTCGTTGCACCTTTTTTTAGTAACATGTTTCATGGGGACCCACTGTACAGCCC

TTCATTCTGCTGTGTCAGTTTGGCCTGGCCTGACACTGGCTGCCCCAGCGGGGACCACGG

AAGCAGAGTGAGAGCCTTCGCTGAGTCAATGCTACCTTCAGCCCCAGACGCATCCCATTT

CCATGTCTTCCATGCTCACTGCTCATGCACTTTTTACACGGTTTCTTCCAAACAGCCCGG

TCTTGATGCAGGAGAGTCTGGAAAAGGAAGAAAATGGTTTCAGTTTCAAAATTCAAAGGA

AAAAGTTGAGGACTTATTTTGTCCTGTCAAGATTGCAAGAACATGTAAAATGTACGGAGC

TTCATAATACGTTATATTGTTCCGAAGCAGCTCGTTGAGAAACATTTGTTTTCAATAACA

TTTTAGCTTAAAAAAAAA

>Hs.171857_mRNA_1gi|13161080|gb|AF332224.1|AF332224智人睾丸蛋白mRNA，部分cds聚腺苷酸＝3

TCACCTCGTGGCGTAGGGGAGAGGTAACACCGAGAAGAGGCAGCGGCGGTGGCNCAGAGA

CGATTGGTGCCAAACAGGGCAGAACGCAACTCAGCTCTGGGTTTGTGAATAGCACAATGG

AAGAAGCTGGACTTTGTGGGTTAAGAGAGAAAGCAGATATGTTGTGTAACTCTGAATCAC

ATGATATTCTTCAACATCAAGACTCAAATTGCAGTGCCACAAGTAATAAACATTTATTGG

AAGATGAAGAAGGCCGTGACTTTATAACAAAGAACAGGAGTTGGGTGAGCCCAGTGCACT

GCACACAAGAGTCAAGAAGGGAGCTTCCTGAGCAAGAAGTAGCCCCTCCGTCTGGTCAGC

AAGCTTTACAATTGCAACAGGAACAAAGAAAAAGTCTTAGGAAAAGAAGTTTTATTATTG

ATGCAAGCCCTAAACACTCTTTCCGACTCCAGAGGAGAAGCTGGCAGCTCTCTGTAAGAA

ATATGCTGATCTTGGAAATTCACCTCTTCTATAGAAGAGTTTGTTTTGAACTATACGATT

TGAAACAAAATTCTTTTTTTGGAGACTATGGAAACATTCTCAACAGGGAAACCCTACTAG

ACTTTGTAAAGCAAATAATGGAAAAGATACAGAACTTTTTGAAGAATCATGGGAAATTTT

TATAATTAAATAAATGCTAAAATTCTGTTTTGTGAAACATTTATGGGAATTATCACTGAC

AGTTTTTGTACACTTTCAAATAGTGTTAAAGCAGCAACTCCATGTTGTAAATGCACAAAA

CAAATATTTAGTTAATAATCAACTCCAAGAATAAAGCTGTAACAATAATAGTTAAAAAAA

A

>Hs.18910_mRNA_3 gi|12804464|gb|BC001639.1|BC001639智人克隆MGC：1944 IMAGE：2959372聚腺苷酸＝3

GGCACGAGGGTCAGCAGCCGCCAGACTTCCTGCCGAAGTCCGAGCCCCCTCCCGGGGCTG

GAGGGGGGCAAGCGGGTTCCGAGGTGCAAAGCCTGGTGCCCCGAGCCCTGCGGAGCTCGG

GGCCAGCATGGCCCCCACGCTGCAACAGGCGTACCGGAGGCGCTGGTGGATGGCCTGCAC

GGCTGTGCTGGAGAACCTCTTCTTCTCTGCTGTACTCCTGGGCTGGGGCTCCCTGTTGAT

CATTCTGAAGAACGAGGGCTTCTATTCCAGCACGTGCCCAGCTGAGAGCAGCACCAACAC

CACCCAGGATGAGCAGCGCAGGTGGCCAGGCTGTGACCAGCAGGACGAGATGCTCAACCT

GGGCTTCACCATTGGTTCCTTCGTGCTCAGCGCCACCACCCTGCCACTGGGGATCCTCAT

GGACCGCTTTGGCCCCCGACCCGTGCGGCTGGTTGGCAGTGCCTGCTTCACTGCGTCCTG

CACCCTCATGGCCCTGGCCTCCCGGGACGTGGAAGCTCTGTCTCCGTTGATATTCCTGGC

GCTGTCCCTGAATGGCTTTGGTGGCATCTGCCTAACGTTCACTTCACTCACGCTGCCCAA

CATGTTTGGGAACCTGCGCTCCACGTTAATGGCCCTCATGATTGGCTCTTACGCCTCTTC

TGCCATTACGTTCCCAGGAATCAAGCTGATCTACGATGCCGGTGTGGCCTTCGTGGTCAT

CATGTTCACCTGGTCTGGCCTGGCCTGCCTTATCTTTCTGAACTGCACCCTCAACTGGCC

CATCGAAGCCTTTCCTGCCCCTGAGGAAGTCAATTACACGAAGAAGATCAAGCTGAGTGG

GCTGGCCCTGGACCACAAGGTGACAGGTGACCTCTTCTACACCCATGTGACCACCATGGG

CCAGAGGCTCAGCCAGAAGGCCCCCAGCCTGGAGGACGGTTCGGATGCCTTCATGTCACC

CCAGGATGTTCGGGGCACCTCAGAAAACCTTCCTGAGAGGTCTGTCCCCTTACGCAAGAG

CCTCTGCTCCCCCACTTTCCTGTGGAGCCTCCTCACCATGGGCATGACCCAGCTGCGGAT

CATCTTCTACATGGCTGCTGTGAACAAGATGCTGGAGTACCTTGTGACTGGTGGCCAGGA

GCATGAGACAAATGAACAGCAACAAAAGGTGGCAGAGACAGTTGGGTTCTACTCCTCCGT

CTTCGGGGCCATGCAGCTGTTGTGCCTTCTCACCTGCCCCCTCATTGGCTACATCATGGA

CTGGCGGATCAAGGACTGCGTGGACGCCCCAACTCAGGGCACTGTCCTCGGAGATGCCAG

GGACGGGGTTGCTACCAAATCCATCAGACCACGCTACTGCAAGATCCAAAAGCTCACCAA

TGCCATCAGTGCCTTCACCCTGACCAACCTGCTGCTTGTGGGTTTTGGCATCACCTGTCT

CATCAACAACTTACACCTCCAGTTTGTGACCTTTGTCCTGCACACCATTGTTCGAGGTTT

CTTCCACTCAGCCTGTGGGAGTCTCTATGCTGCAGTGTTCCCATCCAACCACTTTGGGAC

GCTGACAGGCCTGCAGTCCCTCATCAGTGCTGTGTTCGCCTTGCTTCAGCAGCCACTTTT

CATGGCGATGGTGGGACCCCTGAAAGGAGAGCCCTTCTGGGTGAATCTGGGCCTCCTGCT

ATTCTCACTCCTGGGATTCCTGTTGCCTTCCTACCTCTTCTATTACCGTGCCCGGCTCCA

GCAGGAGTACGCCGCCAATGGGATGGGCCCACTGAAGGTGCTTAGCGGCTCTGAGGTGAC

CGCATAGACTTCTCAGACCAAGGGACCTGGATGACAGGCAATCAAGGCCTGAGCAACCAA

AAGGAGTGCCCCATATGGCTTTTCTACCTGTAACATGCACATAGAGCCATGGCCGTAGAT

TTATAAATACCAAGAGAAGTTCTATTTTTGTAAAGACTGCAAAAAGGAGGAAAAAAAACC

TTCAAAAACGCCCCCTAAGTCAACGCTCCATTGACTGAAGACAGTCCCTATCCTAGAGGG

GTTGAGCTTTCTTCCTCCTTGGGTTGGAGGAGACCAGGGTGCCTCTTATCTCCTTCTAGC

GGTCTGCCTCCTGGTACCTCTTGGGGGGATCGGCAAACAGGCTACCCCTGAGGTCCCATG

TGCCATGAGTGTGCACACATGCATGTGTCTGTGTATGTGTGAATGTGAGAGAGACACAGC

CCTCCTTTCAGAAGGAAAGGGGCCTGAGGTGCCAGCTGTGTCCTGGGTTAGGGGTTGGGG

GTCGGCCCCTTCCAGGGCCAGGAGGGCAGGTTCCCTCTCTGGTGCTGCTGCTTGCAAGTC

TTAGAGGAAATAAAAAGGGAAGTGAGAAAAAAAAAAAAAAAAAA

>Hs.194774_mRNA_1 gi|16306633|gb|BC001492.1|BC001492智人克隆MGC：1774IMAGE：3510004聚腺苷酸＝3

GGCACGAGGGAGGCGGCGGCTCCAGCCGGCGCGGCGCGAGGCTCGGCGGTGGGATCCGGC

GGGCGGTGCTAGCTCCGCGCTCCCTGCCTCGCTCGCTGCCGGGGGCGGTCGGAAGGCGCG

GCGCGAAGCCCGGGTGGCCCGAGGGCGCGATGGCTGCTCCTGTCCCGTGGGCCTGCTGTG

CTGTGCTTGCCGCCGCCGCCGCAGTTGTCTACGCCCAGAGACACAGTCCACAGGAGGCAC

CCCATGTGCAGTACGAGCGCCTGGGCTCTGACGTGACACTGCCATGTGGGACAGCAAACT

GGGATGCTGCGGTGACGTGGCGGGTAAATGGGACAGACCTGGCCCCTGACCTGCTCAACG

GCTCTCAGCTGGTGCTCCATGGCCTGGAACTGGGCCACAGTGGCCTCTACGCCTGCTTCC

ACCGTGACTCCTGGCACCTGCGCCACCAAGTCCTGCTGCATGTGGGCTTGCCGCCGCGGG

AGCCTGTGCTCAGCTGCCGCTCCAACACTTACCCCAAGGGCTTCTACTGCAGCTGGCATC

TGCCCACCCCCACCTACATTCCCAACACCTTCAATGTGACTGTGCTGCATGGCTCCAAAA

TTATGGTCTGTGAGAAGGACCCAGCCCTCAAGAACCGCTGCCACATTCGCTACATGCACC

TGTTCTCCACCATCAAGTACAAGGTCTCCATAAGTGTCAGCAATGCCCTGGGCCACAATG

CCACAGCTATCACCTTTGACGAGTTCACCATTGTGAAGCCTGATCCTCCAGAAAATGTGG

TAGCCCGGCCAGTGCCCAGCAACCCTCGCCGGCTGGAGGTGACGTGGCAGACCCCCTCGA

CCTGGCCTGACCCTGAGTCTTTTCCTCTCAAGTTCTTTCTGCGCTACCGACCCCTCATCC

TGGACCAGTGGCAGCATGTGGAGCTGTCCGACGGCACAGCACACACCATCACAGATGCCT

ACGCCGGGAAGGAGTACATTATCCAGGTGGCAGCCAAGGACAATGAGATTGGGACATGGA

GTGACTGGAGCGTAGCCGCCCACGCTACGCCCTGGACTGAGGAACCGCGACACCTCACCA

CGGAGGCCCAGGCTGCGGAGACCACGACCAGCACCACCAGCTCCCTGGCACCCCCACCTA

CCACGAAGATCTGTGACCCTGGGGAGCTGGGCAGCGGCGGGGGACCCTCGGCACCCTTCT

TGGTCAGCGTCCCCATCACTCTGGCCCTGGCTGCCGCTGCCGCCACTGCCAGCAGTCTCT

TGATCTGAGCCCGGCACCCCATGAGGACATGCAGAGCACCTGCAGAGGAGCAGGAGGCCG

GAGCTGAGCCTGCAGACCCCGGTTTCTATTTTGCACACGGGCAGGAGGACCTTTTGCATT

CTCTTCAGACACAATTTGTGGAGACCCCGGCGGGCCCGGGCCTGCCGCCCCCCAGCCCTG

CCGCACCAAGCTGGCCCTCCTTCCTCCCTCAGGGGAGGTGGGCCATGCAGCTAACCCACC

CACCAAAGACCCCCTCACCCTGGCCCCTTGGGCTGGACCCTCCAATGCCAGCGACTCCCA

GGAGCCCTTGGGGGACGTGAGGGGAGCCTCTCACATCCGATTTCTCCTCCTGCCCCAGCC

TCCTGTCTATCCCAGGGTCTCTGTTGCCACCATCAGATTATAAGCTCCTGATGCTGGGGG

GGCCCAGCCATCCCCCTCCCCCCAGCACCCACAATTTTCAGTCCCCTCCCCTCTGCCCTG

TTTTGTATACCCCTCCCCTGACCCTGCTCCTATCCCACAGTATTTAATGCCCTGTCAGTC

CCTTCTAGTCTGACTCAATGGTAACTTGCTGTATTTGAATTTTTTATAGATGTATATACA

GGGTGGGGGGAGTGGGCGGTTCTCATTAAACGTCACCATTTCATGAAAAAAAAAAAAAAA

AAA

>Hs.127428_mRNA_2 gi|16306818|gb|BC006537.1|BC006537智人克隆MGC：1934IMAGE：2987903聚腺苷酸＝3

GGCACGAGGAGTTTCATAATTTCCGTGGGTCGGGCCGGGCGGGCCAGGCGCTGGGCACGG

TGATGGCCACCACTGGGGCCCTGGGCAACTACTACGTGGACTCGTTCCTGCTGGGCGCCG

ACGCCGCGGATGAGCTGAGCGTTGGCCGCTATGCGCCGGGGACCCTGGGCCAGCCTCCCC

GGCAGGCGGCGACGCTGGCCGAGCACCCCGACTTCAGCCCGTGCAGCTTCCAGTCCAAGG

CGACGGTGTTTGGCGCCTCGTGGAACCCAGTGCACGCGGCGGGCGCCAACGCTGTACCCG

CTGCGGTGTACCACCACCATCACCACCACCCCTACGTGCACCCCCAGGCGCCCGTGGCGG

CGGCGGCGCCGGACGGCAGGTACATGCGCTCCTGGCTGGAGCCCACGCCCGGTGCGCTCT

CCTTCGCGGGCTTGCCCTCCAGCCGGCCTTATGGCATTAAACCTGAACCGCTGTCGGCCA

GAAGGGGTGACTGTCCCACGCTTGACACTCACACTTTGTCCCTGACTGACTATGCTTGTG

GTTCTCCTCCAGTTGATAGAGAAAAACAACCCAGCGAAGGCGCCTTCTCTGAAAACAATG

CTGAGAATGAGAGCGGCGGAGACAAGCCCCCCATCGATCCCAATAACCCAGCAGCCAACT

GGCTTCATGCGCGCTCCACTCGGAAAAAGCGGTGCCCCTATACAAAACACCAGACCCTGG

AACTGGAGAAAGAGTTTCTGTTCAACATGTACCTCACCAGGGACCGCAGGTACGAGGTGG

CTCGACTGCTCAACCTCACCGAGAGGCAGGTCAAGATCTGGTTCCAGAACCGCAGGATGA

AAATGAAGAAAATCAACAAAGACCGAGCAAAAGACGAGTGATGCCATTTGGGCTTATTTA

GAAAAAAGGGTAAGCTAGAGAGAAAAAGAAAGAACTGTCCGTCCCCCTTCCGCCTTCTCC

CTTTTCTCACCCCCACCCTAGCCTCCACCATCCCCGCACAAAGCGGCTCTAAACCTCAGG

CCACATCTTTTCCAAGGCAAACCCTGTTCAGGCTGGCTCGTAGGCCTGCCGCTTTGATGG

AGGAGGTATTGTAAGCTTTCCATTTTCTATAAGAAAAAGGAAAAGTTGAGGGGGGGGCAT

TAGTGCTGATAGCTGTGTGTGTTAGCTTGTATATATATTTTTAAAAATCTACCTGTTCCT

GACTTAAAACAAAAGGAAAGAAACTACCTTTTTATAATGCACAACTGTTGATGGTAGGCT

GTATAGTTTTTAGTCTGTGTAGTTAATTTAATTTGCAGTTTGTGCGGCAGATTGCTCTGC

CAAGATACTTGAACACTGTGTTTTATTGTGGTAATTATGTTTTGTGATTCAAACTTCTGT

GTACTGGGTGATGCACCCATTGTGATTGTGGAAGATAGAATTCAATTTGAACTCAGGTTG

TTTATGAGGGGAAAAAAACAGTTGCATAGAGTATAGCTCTGTAGTGGAATATGTCTTCTG

TATAACTAGGCTGTTAACCTATGATTGTAAAGTAGCTGTAAGAATTTCCCAGTGAAATAA

AAAAAAATTTTAAGTGTTCTCGGGGATGCATAGATTCATCATTTTCTCCACCTTAAAAAT

GCGGGCATTTAAGTCTGTCCATTATCTATATAGTCCTGTCTTGTCTATTGTATATATAAT

CTATATGATTAAAGAAAATATGCATAATCAGACAAGCTTGAATATTGTTTTTGCACCAGA

CGAACAGTGAGGAAATTCGGAGCTATACATATGTGCAGAAGGTTACTACCTAGGGTTTAT

GCTTAATTTTAATCGGAGGAAATGAATGCTGATTGTAACGGAGTTAATTTTATTGATAAT

AAATTATACACTATGAAACCGCCATTGGGCTACTGTAGATTTGTATCCTTGATGAATCTG

GGGTTTCCATCAGACTGAACTTACACTGTATATTTTGCAATAGTTACCTCAAGGCCTACT

GACCAAATTGTTGTGTTGAGATGATATTTAACTTTTTGCCAAATAAAATATATTGATTCT

TTTCTAAAAAAAAAAAAAAAAAAAA

>Hs126852_contig1

AAACCAGTGTATCCAGTCATGGAAAAGAAGGAGGAAGATGGCACCCTGGAGCGGGGGCAC

TGGAACAACAAGATGGAGTTTGTGCTGTCAGTGGCTGGGGAGATCATTGGCTTAGGCAAC

GTCTGGAGGTTTCCCTATCTCTGCTACAAAAATGGGGGAGGTGAGATGAGAGCCCTTGTG

CCACCCCACCCACTCCTGGAAGGAGGATACTTCCATCTCCTGCACTTACGGCCCCTCTGG

GGAGTCCCATAGATGTATAGAATTCTGGAGGTAGGAGGACGCTTGGAGGTCATTAAGGAC

ACTCTGTAAGAGACTAAGACCTAGAAAGGTTACGTGACTATCCCAGGGCTCTTTCTATTA

TAACGTGGCATCGTAGAAATATGAGCACAAGCTGGAACCAGGTGGATGAGAGTTTGGATT

CTGGCTCTGCTACTTAACACTCTGTGTGATCTTGGACAAGTTACTTAAGCTCTCAGAGCA

TCAATTGCCGCTCCTGCAAATTGAGATAATAATGCCTGCCTTTCAAGGTCATTGTAAGGA

TTAGAGACAATGTGTGTAAAGCACTTAATAAATAGTAGCTCTGCTGATGATGACGTTGAT

AACCAAACTGTTCTGTGGTCTTAAGTAATAAATAGTAGCTCTGCTGATGATGACGTTGAT

AACCAAACTGTTCTGTGGTCTTAAGTAATAAGTAGTAGCTCTGTTGATGATGACGTTGAT

AACCAAACTGTTCTGTGGTCTTAAGTAATAAGTAGTAGCTCTGCTGATGATGACGTTGAT

AACCAAACTGTTCTGTGGTCTTAAGTAATAAATAGTAGCTCTGCTGATGATGATGTTGAT

AACCAAACTGTTCTGTGGTCTTAAGTAATAAATAGTAGCTCTGCTGATGATGACGTTGAT

AAAAAAAAAAAAAAAAAAAAAAAAA

>Hs.28149_mRNA_1 gi|14714936|gb|BC010626.1|BC010626智人克隆MGC：17687IMAGE：3865868聚腺苷酸＝3

GGAAGACATCAGGATGTACCATCTGCCCTTCTGTCGGACCCCAGGGTACGTCCCATGAGC

GCGGCCGAGCTGCGTCGAGGGCAGCAGAGCGTGCTGCACTGCTCAGGGACCCGGACTCTG

CAGTTTCTCCTGCACTGTTTTCACCTTTGGCCAGACGGGCTCTGGGAAGACCTACACCCT

GACTGGACCCCCTCCCCAGGGGGAGGGGGTGCCTGTACCCCCCAGCCTGGCTGGCATCAT

GCAGAGGACCTTCGCCTGGCTGTTGGACCGCGTGCAGCACCTGGGTGCCCCTGTCACCCT

TCGCGCCTCTTATCTGGAGATCTACAATGAGCAGGTTCGGGACTTGCTGAGCCTGGGGTC

TCCCCGGCCCCTCCCTGTTCGCTGGAACAAGACTCGGGGCTTCTATGTGGAGCAGCTGCG

GGTGGTGGAATTTGGGAGTCTGGAGGCCCTGATGGAACTTTTGCAAACGGGTCTCAGCCG

TCGAAGGAACTCAGCCCACACCCTGAACCAGGCCTCCAGCCGAAGCCATGCCCTGCTCAC

CCTTTACATCAGCCGTCAAACTGCCCAGCAGATGCCTTCTGTGGACCCTGGGGAGCCCCC

TGTTGGTGGGAAGCTGTGCTTTGTGGACCTGGCAGGCAGTGAGAAGGTAGCAGCCACGGG

ATCCCGTGGGGAGCTGATGCTTGAGGCTAACAGCATCAACCGAAGCCTGCTGGCCCTGGG

TCACTGCATCTCCCTGCTGCTGGACCCACAGCGGAAGCAGAGCCACATCCCTTTCCGGGA

CAGCAAGCTCACCAAGTTGCTGGCAGACTCACTGGGAGGGCGCGGGGTCACCCTCATGGT

GGCCTGCGTGTCCCCCTCAGCCCAGTGCCTTCCTGAGACTCTCAGCACCCTGCGATATGC

AAGCCGAGCTCAGCGGGTCACCACCCGACCACAGGCCCCCAAGTCTCCTGTGGCAAAGCA

GCCCCAGCGTTTGGAGACAGAGATGCTGCAGCTCCAGGAGGAGAACCGTCGCCTGCAGTT

CCAGCTGGACCAAATGGACTGCAAGGCCTCAGGGCTCAGTGGAGCCCGGGTGGCCTGGGC

CCAGCGGAACCTGTACGGGATGCTACAGGAGTTCATGCTAGAGAATGAGAGGCTCAGGAA

AGAAAAGAGCCAGCTGCAGAATAGCCGAGACCTGGCCCAGAATGAGCAGCGCATCCTGGC

CCAGCAGGTCCATGCACTAGAGAGGCGTCTCCTCTCTGCCTGCTACCATCACCAGCAGGG

TCCTGGCCTGACCCCACCGTGTCCCTGCTTGATGGCCCCAGCTCCCCCTTGCCATGCACT

GCCACCCCTCTACTCCTGCCCCTGCTGCCACATCTGCCCACTGTGTCGAGTGCCCCTGGC

CCACTGGGCCTGCCTGCCAGGGGAGCACCACCTGCCCCAGGTGTTGGACCCTGAGGCCTC

AGGTGGCAGGCCCCCATCTGCCCGGCCCCCACCCTGGGCACCCCCATGCAGCCCTGGCTC

TGCCAAGTGCCCAAGAGAGAGGAGTCACAGTGACTGGACTCAGACCCGAGTCCTGGCAGA

GATGTTGACGGAGGAGGAGGTGGTACCTTCTGCACCTCCCCTGCCTGTGAGGCCCCCGAA

GACATCACCAGGGCTCAGAGGTGGGGCCGGGGTTCCAAACCTGGCCCAGAGACTGGAGGC

CCTCAGAGACCAGATTGGCAGCTCCCTGCGACGTGGCCGCAGCCAGCCACCCTGCAGTGA

GGGCGCACGGAGCCCAGGCCAAGTCCTCCCTCCCCATTGAAGGCCAAGTGGGAACCCAGG

AGACTGCTGTGTGACCTCAGACTGGGCTCCACACTCTTGGGCTTCAGTCTGCCCATCTGC

TGAATGGAGACAGCAGCTGCTACTCCACCTGCAGCTGGGCTAGGGGCGGGGACTGGGGGT

GCTATTTAGGGGAACAAGGGGATTCAGGAGAAACCAGGCAGCAGGGGATGAAATACATGA

ATAAAGAGAGGCATCAGCTCCAAAAAAAAAAAAAAAAAAAAAAA

>Hs.35453_mRNA_3 gi|7018494|emb AL157475.1|HSM802461智人mRNA；cDNA DKFZp761G151(来自克隆DKFZp761G151)；部分cds聚腺苷酸＝3

CTCCCCCTGAGAGAGGCTGGGCAGCACCCCCCTTCTGCCAGGAGTGCCAGCCAAGGTGCC

AGACCCCTGTCCAGTGGCAAGCTGGAAGGCTTTCAGAGCATCGATGAAGCTATAGCCTGG

CTCAGGAAGGAACTGACGGAGATGCGGCTGCAGGACCAGCAACTGGCCAGACAGCTCATG

CGCCTGCGTGGCGACATCAACAAGCTGAAAATCGAACACACCTGCCGCCTCCACAGGAGG

ATGCTCAACGATGCCACCTACGAGCTGGAGGAGCGGGATGAGCTGGCCGACCTCTTCTGT

GACTCCCCTCTTGCCTCCTCCTTCAGCCTCTCCACACCACTCAAGCTTATTGGCGTGACC

AAGATGAACATCAACTCTCGGAGGTTCTCTCTCTGCTGAGGAGCCCTCAGACTGGGCGGA

GGGGCTGGAGCGGAGGGCTTGGGCTGGAGGGGTGTCAGAGGAAGCTGAGGCCAAGTTACT

CCAGTGGGTCTCCCGGAGGCAGGGGTCCCTGGGACTGGCGACTCAAGGGCCCCAGGACCT

ATTCAGTGGTGCTCTCCCACCCAGGGGCCCTGGGTGTGGATGCCAGTGTCTCTGTGACTG

GCTCTTGCTTACTACCCAAAGAGCTCTGCAGAAGGGCCGCTCCAACCAAGATGTTAAAGG

AGACCTGGGTTCCCACCATAATCCATCCCTCCACGGTCACGTTCCTGTTTCCTGGAATCA

CTGGTGCTATGAACTGGGATTCCCAAAGGGAGGCCCCCCAACAAAGCTGTCATTTTTGCA

GAAGGCTGTCCCGCAAGGGCCTTGGGGGAAATTAGGCATGTCAGATGTGCCTGTCTCACG

TGCTGTTGCTGTCCTCTAAGTATTGTCTCAAATTCACCCTAAGTACATGACTCAGCAACA

TTGACAGGGAGCTACTAGGAAGGGAAAATCGAAAGGCATGACAAATGGGCACTTGGGGAC

GCAGCCCCAGTGGCTGGCAGCCAGTGTCTCTGGTGAGCCTGACACTACAAGGCTGTGTAA

ATTGTAAATTCTGGCGTGTGCTGGGACATGTGATGGGGGCACTAGCGTAGCTTGGGTGCA

ACAAGCACAGATGTCCCCATTGTCTCCCCTGGCCACATGCATCTCCAAAGAGCCTCTTCA

CTGCCACCCACACCCCAGGGTGACAGCCTGGGAGACCACTGGTGACTGAACCAGGCAGGT

CCTGAAAGCATTTTCCATAACTGAATTCTCCTGCAGGGGCGTGACCGGGGCCTCCTGGTG

GATTCTGGTGGTGTCACCTTACTGCCCTCTCTGGAAAGACAATCTAGGGAGCCCAGAGGC

CCATCCTGAGCCTCCTCTGAGATTTTGTGCCTGACCTAAACAACTAGTTTTAATAAGACT

GTTACTGATGTGTTGTTCACTTGTTAGTAACTGATTTTTGTCCAAATGCGGAAGCCACTT

GTGTAGGTCAACTACAGTGCGTAGGATTTGATTTTAAGAGTTTCTCCCTCCCAACAGGCT

TGAGGATCAGCAAGTTAAGACCCCAGCAGGTTAGGGAGGTCAGTCTGGGGTCATACGGCA

TGGCAGGGGTCCCTCGGCCAGACCCGTAGAATCCTGAGATAAGGAGTGTTTCTGACCTTT

GGTGTCATCTAGTCGAGTCCTCTCATTAGTAAAGGAGCAAAGTGAAACCTGGGGGAGGAG

AAGGACTTCCCTCAGGTTGCACAGCTGTTTAGGCTATAGAATATTGATGTGTGAAACCAT

TATTGATAATGCCTAGTAGATCACATGTCAATGAACTTGAACCCCAAAGATGGTCGTGAT

GCTTTGCCAAACCCGCACACTGCCAACCCCTCTACTCTCCACCTCAGCCCCCACCCACAT

CTCCCAGAGTATTGCAATTCAGAACATTTGGGTCAAGGTGGAGCAAGGCACTGACAGTGG

CCCCACAGGGCATGTGTCACTAATCACTGTCCCATGGTCTACGCACGGCATCTGGCTGCT

CTGTCTACTGTGACTTCTTCCTGTGTAATCTCAGTGGGGCCCGTGTCCACCCACACATCG

TGACCCACATAGGGGAGAGGTTGCTTTTCTTTTGTGGGCTGAGAGTAGGACAATGCAAAT

GAATGATCTCTAGTAGACAGAAAAGAACTTGGTCTCTTTTTTAAAATTTCAAAGAGCCAG

AAGTTCTATGCCTCCTTCAAAGTAGGCAGAACAACGCAGCCAAGATCTACTGTCTGCCAT

GCTCTGTGCAATGAAGTCTGCAGGCCTGAGGACCATGTACTGCTGTCCTTCCTCAGAGCT

CTGCACAAACACTGCCAAGTCCTGAAGACGCATTCCTTTCCTGCCAACCTCTTTCCAGAT

AAGCCCTTGAGGTCTCGGGCTGACCTACACACACACACACACACACACACACACACACAC

ACACCCCCACACACACACACACACGACAGAGAACATGCCATAAACATCCTTGAACCCATG

CAGGAAAGCCCATCCCATATTCTGAAAAAATGCCAAATTAGGTTTTTCTTTCTTTTTGGA

AATCAGTCATTACAGTAACCGAAACCATTGGGTTCAGCGAAAATGGAAAGATTTAGCTGA

ATGTAGTCAGTCCAATTAAGTTGGATGCAACTGAGTGATTTAGTTGCTTGGGTAACCCAG

TGCTTGCTTGCTTTCTTCATTCTCTGGGTGGAAACTAAGATCAAGACACATGTTTGGGGA

TAAGTTAAATGTCTGAGCTATTTTGCTCGGTTTATCCTAAGAGAACTTTATTATGGGATG

AGGAGGTGACCCAAGATGAGAAGTGGAGGGGGACAGCGATGTTTTCTAAACATCGTCCAG

TGTTGACTGGCTTCCTTACTTTGCACAGTGAACACAACTAACCACATTAATTCAGCTTTG

TGAAGTCCCTGCTCTCTGTGGGTTCTATGAGTCAGCAGCAACATTGGCCTAACCTCCGTC

CCAGCCTCCTGGCTCACCACATGTGTACAGTGCTGTTTGCAGTTGTACTCATTATCCATC

CATCTCTCTGCCATCCCCAAGCATCGCTGGGTGTAAAACGCAAACTCTCCACCGACACTG

CCATGCGTGGTCATGTCTTGATGCCTTCAGGGGCTCAGTAGCTATCAAAGAGGCCTGGAG

GGCCTGGGCAGGCTTGACGATGCCTGACCGAGTTCAAGACCCACACCCTGTAGCAATACC

AAGTGCTATTACATAATCAATGGACGATTTATACTTTTATTTTTTATGATTATTTGTTTC

TATATTGCTGTTAGAAAAAGTGAAATAAAAATACTTCAAAAGAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAGAAAAAAAAAAAAAAAAAAA

>Hs.180570_contig1 R08175|AA707224|AA699986|R11209|W89099|T98002|AA494546聚腺苷酸＝2聚腺苷酸＝3

TGAAGGACCGCGATCCTAAAGAGATTGAATGGGACGACCTGGCCCAGCTGCCCTTCCTGA

CCATGTGCGTGAAGGAGAGCCTGAGGTTACATCCCCCAGCTCCCTTCATCTCCCGATGCT

GCACCCAGGACATTGTTCTCCCAGATGGCCGAGTCATCCCCAAGGGCATTACCTGCCTCA

TCGATATTATAGGGGTCCATCACAACCCAACTGTGTGGCCGGATCCTGAGTCTACGACCC

CTTCCGCTTTGACCCAGAGAACAGCAAGGGGAGGTCACCTCTGGCTTTTAATTCCCTTCT

CCGCAGGGCCCAGGAACTGCATCGGGCCAGCGTTTCCCATGGCGGAGATGAAAGTGGTTC

CTGGCGTTGATGCTGCTGCACTTCCGGTTCCTGCCAGACCACACTGAGCCCCGCAGGAAG

CTGGAACTGATCATTGCGGCCGAGGGCGGGCTTTGGCTGCGGGTGGAGCCCCTGAATGTA

GGCTTGCAGTGACTTTCTGACCCATCCACCTGTTTTTTTGCAGATTGTCATGAATAAAAC

GGTGCTGTCACCTCAAAAAAAAAAAANNNAAAA

GAGTCCTCTCGTTGGTCCCGGAGGTGGGGTTGCGCTCACAAGGGGCGACCGTCGCCACGG

TGGCGGCCACTGCATCGCGTCCCACCTCCGCGGCCCTGGGCGCCGTGGTGTCGACGGGCC

CCGAGCCTATGACGGGCCAGGGCCAGTCGGCGTCCGGGTCGTCGGCGTGGAGCACGGTAT

TCCGCCACGTCCGGTATGAGAACCTGATAGCGGGCGTGAGCGGCGGCGTCTTATCCAACC

TTGCGCTGCATCCGCTCGACCTCGTGAAGATCCGCTTCGCCGTGAGTGATGGATTGGAAC

TGAGACCGAAATATAATGGAATTTTACATTGCTTGACTACCATTTGGAAACTTGATGGAC

TACGGGGACTTTATCAAGGAGTAACCCCAAATATATGGGGTGCAGGTTTATCCTGGGGAC

TCTACTTTTTCTTTTACAATGCCATCAAGTCATATAAAACAGAAGGAAGAGCTGAACATT

TAGAGGCAACAGAATACCTTGTCTCAGCTGCTGAAGCTGGAGCCATGACCCTCTGCATTA

CAAACCCATTATGGGTAACAAAAACTCGCCTTATGTTACAGTATGATGCTGTTGTTAACT

CCCCACACCGACAATATAAAGGAATGTTTGATACACTTGTGAAAATATATAAGTATGAAG

GTGTGCGTGGATTATATAAGGGATTTGTTCCTGGGCTGTTTGGAACATCGCATGGTGCCC

TTCAGTTTATGGCATATGAATTGCTGAAGTTGAAGTACAACCAGCATATCAATAGATTAC

CAGAAGCCCAGTTGAGCACAGTAGAATATATATCTGTTGCAGCACTATCCAAAATATTTG

CTGTCGCAGCAACATACCCATATCAAGTCGTAAGAGCTCGTCTTCAGGATCAACACATGT

TTTACAGTGGTGTAATAGATGTAATCACAAAGACATGGAGGAAAGAAGGCGTCGGTGGAT

TTTACAAGGGAATTGCTCCTAATTTGATTAGAGTGACTCCAGCCTGCTGTATTACCTTTG

TGGTATATGAAAACGTCTCACATTTTTTACTTGACCTTAGAGAAAAGAGAAAGTAAGCTC

AAAGAGGACAATTCCAGTATATCTGCCCAAGGCAGCAACAAGCTCTTTTGTGTTTAAGGC

ATAAAAGAAGAATTCTGCATAGAAACATGGCTCATATTCGAAATTGCTCTATAGTCATTA

GAAGCCAGAGAACTGCTAAGTCTCCTGCAATGTTTTTCTTGCTTTTTGCCTTCCCCATAT

ATATGGAACTTGGCTACCTCTGCCTGAAATGGCTGCCATCAACACAATGTTAAAACTGAC

ACGAAGGATAGAGTTTCACAGATTTCTACGTTTTATTGGTGGAAGCTGATTTGCAACATT

TGCTAAATGGATTAGATGAATGTACTTCTTTTTGTGAGCTTACTTGCCTGGATTGCTTTA

AAATTAACCTTTGTGCAATACCAAGAAAATAGCTCTTTAAAAGAATGTCTTTGTATGTCT

CAAGGTAAATTAAGGATTTACTGAATAAGGTGTTGACCAAATCCAGACCATTTTATTTTA

TTTTTTTATTTATTTATTTTTTGAGATGGAGTCTTGCTTTGTCGCCCAGGCTGGAGTGCA

GTGGCGTGATCTCAGCTCACTGCAACCTCCACCTCCCGGGTTCACGCCATTCTCCTGCCT

CAGCCTCCTGAGTAGCTGGGACTACAGGCACCTGCCACCACGCCTGGCTAACTTTTTTTT

ATATTTTGAGTAGAAATGGGGTTTCACCATGTTAGCCAGGATGGTCTCAATCTCCTGACC

TTGTGATCCGCCTGCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACTGCGC

CTGGCCAGACCATTTTAGAATTGGGAAATTTTAGTGAGAAAAAATGCACTGTAAATATGC

TTTAGTTTTAATTCAGTTGGGATGCACTACCTAGCGAAAATTGAGAAACTATATACTTCT

CAGAGAAATATCTGACATCTATTGTCATTCCATTGCTATTTTTTTTCCCCAGAGACTTCC

ATAATTTAAAATAAAATCCTAGATCCAGTTCTTGTTTTTTGGCATAAATACTTAATCTAT

TTTAAATTTATAAAATCTGAGCTTCTAGGATCCAGCTGTGTCAACCTTTATTTAGCATAT

ATAACTATAAATCACTTATTACAGATGCTAAATAGATCACCTTTTACAGATGCTGAAATG

TTTGGGATATGTTTGTTGACAAGGTAAATGGAAATGAGAAACTTTATACTTCAGTTTTCA

GATATATGGATCTAGATCCCAAATAAATGATTAATCTTCATTGGTTTCTCAAATTCAGGT

TGAAATACAAATTAATAGCCTTTATTGATTTTACTTTTATGAGTCATTGTAGACATCTAT

AAATATAAAAGGGCCTGTACCCAAAGGATGCCAGAATACTAGTATTTTTATTTATCGTAA

ACATCCACGAGTGCTGTTGCACTACCATCTATTTGTTGTAAATAAAAGTGTTGTTTTCAA

AAAAAAAAAAAAAA

>Hs.9030_mRNA_3 gi|12652600|gb|BC000045.1|BC000045智人克隆MGC：2032 IMAGE：3504527聚腺苷酸＝3

CTAGAGGGGCGGAAAGTAACAAGGAGGTGGGGGTACAAATCCTCAGCTCCTGCTTCCGCA

AGCACTAACCTGCTCTGAAGTGAGCCAGGCAGCTCTGGCCATCTTTTCCCAGCCACAGAA

TCAGGTGATGGTCCAGAATTAAGAGCTGTCACCTGTGTCATTCACTCACAATGGAAGAAA

TGAAGAAGACTGCCATCCGGCTGCCCAAAGGCAAACAGAAGCCTATAAAGACGGAATGGA

ATTCCCGGTGTGTCCTTTTCACCTACTTCCAAGGGGACATCAGCAGCGTAGTGGATGAAC

ACTTCTCCAGAGCTCTGAGCAATATCAAGAGCCCCCAGGAATTGACCCCCTCGAGTCAGA

GTGAAGGTGTGATGCTGAAAAACGATGATAGCATGTCTCCAAATCAGTGGCGTTACTCGT

CTCCATGGACAAAGCCACAACCAGAAGTACCTGTCACAAACCGTGCCGCCAACTGCAACT

TGCATGTGCCTGGTCCCATGGCTGTGAATCAGTTCTCACCGTCCCTGGCTAGGAGGGCCT

CTGTTCGGCCTGGGGAGCTGTGGCATTTCTCCTCCCTGGCGGGCACCAGCTCCTTAGAGC

CTGGCTACTCTCATCCCTTCCCCGCTCGGCACCTGGTTCCAGAGCCCCAGCCTGATGGGA

AACGTGAGCCTCTCCTAAGTCTCCTCCAGCAAGACAGATGCCTAGCCCGTCCTCAGGAAT

CTGCCGCCAGGGAGAATGGCAACCCTGGCCAGATAGCTGGAAGCACAGGGTTGCTCTTCA

ACCTGCCTCCCGGCTCAGTTCACTATAAGAAACTATATGTATCTCGTGGATCTGCCAGTA

CCAGCCTTCCAAATGAAACTCTTTCAGAGTTAGAGACACCTGGGAAATACTCACTTACAC

CACCAAACCACTGGGGCCACCCACATCGATACCTGCAGCATCTTTAGTCAAGTTGGAGGA

GAAAGACAACACTTGGTCTAAGACACGGCAGCAAGACATCCCTGCATATTGTTCCAGATA

AAAATGAAAGCTGCTCACACCCACTTGCCTCCCCAATCTGTTAAACAGCTTCGTGTCTAG

TATGAGCTCAGTACTTGCCCTGTGAAAATCCCAGAAGCCCCCGCTGTCAATGTTCCCCAT

CCACACCCTGCTTGCTCCTGTGTAACAGCTCAGATGATGAATAATAATAAAACTGTACTT

TTTTGGATGGTGAAAAAAAAAAAAAAAAAAAA

TTGCCTTGTGTTAGCTAGCAATAAGAAAAGAAGCTTTGTTTGGATTAACATATATACCCT

CTTCATTCTGCATACCTATTTTTTCCCCAATAATTTGCAGCTTAGGTCCGAGGACACCAC

AAACTCTGCTTAAAGGGCCTGGAGGCTCTCAAGGCATGGCCAGACGCTCTGTCTTGTACT

TCATCCTGCTGAATGCTCTGATCAACAAGGGCCAAGCCTGCTTCTGTGATCACTATGCAT

GGACTCAGTGGACCAGCTGCTCAAAAACTTGCAATTCTGGAACCCAGAGCAGACACAGAC

AAATAGTAGTAGATAAGTACTACCAGGAAAACTTTTGTGAACAGATTTGCAGCAAGCAGG

AGACTAGAGAATGTAACTGGCAAAGATGCCCCATCAACTGCCTCCTGGGAGATTTTGGAC

CATGGTCAGACTGTGACCCTTGTATTGAAAAACAGTCTAAAGTTAGATCTGTCTTGCGTC

CCAGTCAGTTTGGGGGACAGCCATGCACTGAGCCTCTGGTAGCCTTTCAACCATGCATTC

CATCTAAGCTCTGCAAAATTGAAGAGGCTGACTGCAAGAATAAATTTCGCTGTGACAGTG

GCCGCTGCATTGCCAGAAAGTTAGAATGCAATGGAGAAAATGACTGTGGAGACAATTCAG

ATGAAAGGGACTGTGGGAGGACAAAGGCAGTATGCACACGGAAGTATAATCCCATCCCTA

GTGTACAGTTGATGGGCAATGGGTTTCATTTTCTGGCAGGAGAGCCCAGAGGAGAAGTCC

TTGATAACTCTTTCACTGGAGGAATATGTAAAACTGTCAAAAGCAGTAGGACAAGTAATC

CATACCGTGTTCCGGCCAATCTGGAAAATGTCGGCTTTGAGGTACAAACTGCAGAAGATG

ACTTGAAAACAGATTTCTACAAGGATTTAACTTCTCTTGGACACAATGAAAATCAACAAG

GCTCATTCTCAAGTCAGGGGGGGAGCTCTTTCAGTGTACCAATTTTTTATTCCTCAAAGA

GAAGTGAAAATATCAACCATAATTCTGCCTTCAAACAAGCCATTCAAGCCTCTCACAAAA

AGGATTCTAGTTTTATTAGGATCCATAAAGTGATGAAAGTCTTAAACTTCACAACGAAAG

CTAAAGATCTGCACCTTTCTGATGTCTTTTTGAAAGCACTTAACCATCTGCCTCTAGAAT

ACAACTCTGCTTTGTACAGCCGAATATTCGATGACTTTGGGACTCATTACTTCACCTCTG

GCTCCCTGGGAGGCGTGTATGACCTTCTCTATCAGTTTAGCAGTGAGGAACTAAAGAACT

CAGGTTTAACCGAGGAAGAAGCCAAACACTGTGTCAGGATTGAAACAAAGAAACGCGTTT

TATTTGCTAAGAAAACAAAAGTGGAACATAGGTGCACCACCAACAAGCTGTCAGAGAAAC

ATGAAGGTTCATTTATACAGGGAGCAGAGAAATCCATATCCCTGATTCGAGGTGGAAGGA

GTGAATATGGAGCAGCTTTGGCATGGGAGAAAGGGAGCTCTGGTCTGGAGGAGAAGACAT

TTTCTGAGTGGTTAGAATCAGTGAAGGAAAATCCTGCTGTGATTGACTTTGAGCTTGCCC

CCATCGTGGACTTGGTAAGAAACATCCCCTGTGCAGTGACAAAACGGAACAACCTCAGGA

AAGCTTTGCAAGAGTATGCAGCCAAGTTCGATCCTTGCCAGTGTGCTCCATGCCCTAATA

ATGGCCGACCCACCCTCTCAGGGACTGAATGTCTGTGTGTGTGTCAGAGTGGCACCTATG

GTGAGAACTGTGAGAAACAGTCTCCAGATTATAAATCCAATGCAGTAGACGGACAGTGGG

GTTGTTGGTCTTCCTGGAGTACCTGTGATGCTACTTATAAGAGATCGAGAACCCGAGAAT

GCAATAATCCTGCCCCCCAACGAGGAGGGAAACGCTGTGAGGGGGAGAAGCGACAAGAGG

AAGACTGCACATTTTCAATCATGGAAAACAATGGACAACCATGTATCAATGATGATGAAG

AAATGAAAGAGGTCGATCTTCCTGAGATAGAAGCAGATTCCGGGTGTCCTCAGCCAGTTC

CTCCAGAAAATGGATTTATCCGGAATGAAAAGCAACTATACTTGGTTGGAGAAGATGTTG

AAATTTCATGCCTTACTGGCTTTGAAACTGTTGGATACCAGTACTTCAGATGCTTACCAG

ACGGGACCTGGAGACAAGGGGATGTGGAATGCCAACGGACGGAGTGCATCAAGCCAGTTG

TGCAGGAAGTCCTGACAATTACACCATTTCAGAGATTGTATAGAATTGGTGAATCCATTG

AGCTAACTTGCCCCAAAGGCTTTGTTGTTGCTGGGCCATCAAGGTACACATGCCAGGGGA

ATTCCTGGACACCACCCATTTCAAACTCTCTCACCTGTGAAAAAGATACTCTAACAAAAT

TAAAAGGCCATTGTCAGCTGGGACAGAAACAATCAGGATCTGAATGCATTTGTATGTCTC

CAGAAGAAGACTGTAGCCATCATTCAGAAGATCTCTGTGTGTTTGACACAGACTCCAACG

ATTACTTTACTTCACCCGCTTGTAAGTTTTTGGCTGAGAAATGTTTAAATAATCAGCAAC

TCCATTTTCTACATATTGGTTCCTGCCAAGACGGCCGCCAGTTAGAATGGGGTCTTGAAA

GGACAAGACTTTCATCCAACAGCACAAAGAAAGAATCCTGTGGCTATGACACCTGCTATG

ACTGGGAAAAATGTTCAGCCTCCACTTCCAAATGTGTCTGCCTATTGCCCCCACAGTGCT

TCAAGGGTGGAAACCAACTCTACTGTGTCAAAATGGGATCATCAACAAGTGAGAAAACAT

TGAACATCTGTGAAGTGGGAACTATAAGATGTGCAAACAGGAAGATGGAAATACTGCATC

CTGGAAAGTGTTTGGCCTAGCACAATTACTGCTAGGCCCAGCACAATGAACAGATTTACC

ATCCCGAAGAACCAACTCCTACAAATGAGAATTCTTGCACAAACAGCAGACTGGCATGCT

CAAAGTTACTGACAAAAATTATTTTCTGTTAGTTTGAGATCATTATTCTCCCCTGACTCT

CCTGTTTGGGCATGTCTTATTCAGTTCCAGCTCATGACGCCCTGTAGCATACCCCTAGGT

ACCAACTTCCACAGCAGTCTCGTAAATTCTCCTGTTCACATTGTACAAAAATAATGTGAC

TTCTGAGGCCCTTATGTAGCCTGTGACATTAAGCATTCTCACAATTAGAAATAAGAATAA

AACCCATAATTTTCTTCAATGAGTTAATAAACAGAAATCTCCAGAACCTCTGAAACACAT

TCTTGAAGCCCAGCTTTCATATCTTCATTCAACAAATAATTTCTGAGTGTGTATACAGGA

TGTCAAGTACTGACCAAAGTCCTGAGAACTCGGCAGATAATAAAACAGACAAAAGCCTTT

GCCTTCATGAAGCATACATTCATTCAGGGGTAGACACACAAAAAATGAAATAAACAGGTA

AAATATGTAGC

>Hs.268562_mRNA_2 gi|15341874|gb|BC013117.1|BC013117智人克隆MGC：8711IMAGE：3882749聚腺苷酸＝3

CTCTCCTCGCCCGCTGGGTGCTGAAGTTGGGCGGATGGCAGCAAACCGGCTCCGCTAGAG

GACCGAGCCGCCCAGCCCCGCTCCCCCGGACCCATCGGCGCGCTGCCCACACCTCCAGGC

GACCGGCCAACTGGGTCCTGAAGTAGCTGAAATGCGAAAAAGGCAGCAGTCCCAAAATGA

AGGAACACCTGCCGTGTCTCAAGCTCCTGGAAACCAGAGGCCCAACAACACCTGTTGCTT

TTGTTGGTGCTGTTGTTGCAGCTGCTCCTGCCTCACTGTGAGGAATGAAGAAAGAGGGGA

AAATGCGGGAAGACCCACACACACTACAAAAATGGAGAGTATCCAGGTCCTAGAGGAATG

CCAAAACCCCACTGCAGAGGAAGTCTTGTCCTGGTCTCAAAATTTTGACAAGATGATGAA

GGCCCCAGCAGGAAGAAACCTTTTCAGAGAGTTCCTCCGAACAGAATACAGTGAAGAGAA

CCTACTTTTCTGGCTTGCTTGTGAAGACTTAAAGAAGGAGCAGAACAAAAAAGTAATTGA

AGAAAAGGCTAGGATGATATATGAAGATTACATTTCTATACTATCACCAAAAGAGGTCAG

TCTTGATTCTCGAGTTAGAGAGGTGATCAATAGAAATCTGTTGGATCCCAATCCTCACAT

GTATGAAGATGCCCAACTTCAGATATATACTTTAATGCACAGAGATTCTTTTCCAAGGTT

TTTGAACTCTCAAATTTATAAGTCATTTGTTGAAAGTACTGCTGGCTCTTCTTCTGAATC

TTAATGTTCATTTAAAAACAATCATTTTGGAGGGCTGAGATGGGAAATAAAAGTAGTTAA

ATAACATCAGAAACTGAGTTCCTGGAGAACTACAGTTTAGCATTCCTCAGGCTACTGTGA

AAACACAACCGTTATGGTCTTTGTCTCCATTTTTATCAAGGTTTTCCATGGTTAAGTTTG

GAGAAAATACCACACAAAACAATGAATTGCCAAATTGTTTGTTTTATTCAAGACTCATTC

TACTTGCAAGCAAAGTGTATTTGTAGTCCTATGAACAGTCTCCTCGTGTATCTCCAGAGA

CTGCATGTGCAAAGTAAAATGCTTCATTTGCCACATAGTTGTTGTAATATTTAATCCAGT

AGCATAACTTATATCTGTATTTAAGGACTTTTGTGCAATATGGTCTTAAGAAATAATTGC

CAAAAAAATCGGCCATGGTTCTGCATTTTTAACATAATCTAAGACAGAAAAAAAGCAATT

TTTACTATGTAACAATGGTATTCAACATTCTATATACTGTGTTTAGTACACTAATTTTGA

AGCCAATATTTCTGTACATGAAAAAGAGCTATTTATCTCTGTTTGTTGGAAAATCCTAAT

GGGGATTCCTCTGGTTGTTCACTGCCAAAACTGTGGCATTTTCATTACAGGAGAGTTTAC

TATGCTAAAAGCAAAAAACAAAAAAAAAAAAAAAGGGAAGAAGGAAAAAAGCAAAAAACA

ATTTGAAGATATCCTATCTCAATGACAAATCAAAAGAGTGATATTGCTTTTAACTGTAAT

AGAAGAAAATGAATTTATGTATATATCAGATGTCCAATACTGTAATTAATTTATTAAAGA

CTGGCTCTCCAGTTTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>Hs.151301_mRNA_3 gi|16041747|gb|BC015754.1|BC015754智人克隆MGC：23085IMAGE：4862492聚腺苷酸＝3

AAAAGAACCAGGATTGCATTTGAAGTTAAGCTGCAAAAAACCAGTCGATCAACAGATTTT

CGAGTCCCACAGTCAATATGCACCATGTTTAATGTTATGGTTGATGCCAAAGCTCAATCA

ACAAAACTTTGCAGCATGGAAATGGGCCAAGAGTTTGCTAAAATGTGGCATCAATACCAT

TCAAAAATAGACGAACTAATTGAAGAAACTGTTAAAGAAATGATAACACTCTTGGTTGCA

AAGTTCGTTACTATCTTGGAAGGAGTGCTGGCAAAATTATCCAGATATGACGAAGGGACT

TTGTTTTCTTCTTTTCTGTCATTTACCGTGAAGGCAGCTTCCAAATATGTGGATGTACCT

AAACCCGGGATGGACGTGGCCGACGCCTACGTGACTTTCGTCCGCCATTCTCAGGATGTC

CTGCGTGATAAGGTCAATGAGGAGATGTACATAGAAAGGTTATTTGATCAATGGTACAAC

AGCTCCATGAACGTGATCTGCACCTGGTTGACGGACCGGATGGACTTACAGCTTCATATT

TATCAGTTGAAAACACTAATTAGGATGGTAAAGAAAACCTACAGAGATTTCCGATTGCAA

GGGGTCCTGGACTCCACCTTAAACAGCAAGACCTATGAAACGATCCGGAACCGTCTCACT

GTGGAGGAAGCCACAGCATCAGTGAGTGAAGGTGGGGGACTGCAGGGCATCAGCATGAAG

GACAGCGATGAGGAAGACGAAGAAGACGATTAGACCATTTGGTCCTAGAGTCTGCTGGGA

CAGAGTCCTGTAATCAGTGCATGTCCTTAGTCTGTTAGTTAAACCCATTAGGAATTTTCT

GTCAACTACCATGCCCATGAGATGTTTATCAATACAACTGCCATTTTAGCTATGTGGTAC

CAAGATTAGCAAATGACCTTCATATCCACTGATTTCCTGATGTCCATGTCTATATGTTTA

CAAGCAATATGGAGCACCATTCTTTAAATACTGTTCATGGAGAATACATAGTCTAACCAC

TAGGCGTGTCCCTGTTATCAGCAAAGATCAATGATGCTTCATTCATGTACTATGTATGCA

TTGGTGGTAAATGGATGTGAGGGCAAGTACATCAAGTACATTCACTCTGTTTCACGTATG

TGGATGCCAGTTAATTAAATGAGTACGTAAATAAATTAATTAAAACACATAGATCTGCTT

TGTGTTTTTATTTTTATTTTTTGAAAAACAAAAGGCAAGTCTCCAACAATTAACTTTTGA

TGCTTTCTGTTCCCCTAAAACCAAAAAATGAACCCCTTGTGTCGTTGTTAACCCATCCTT

TCATTTACTCATATAATTAGCCAAAAAAAAAAGGATGGCTACATACCAATGGATTGATTC

TCTTAATTGCCACGGCAAGGGGGCGATCCTATCATGACTTAACATCAAGCGCGCAGTTCA

AAACTACTGTCTTCTGTCAAAGTTTTCTCCTCTTAAATGTTATTTTGCTTTTACGTCTCA

ACTGTGTATGTAAAAAAAACGAATATTTAAATTACAACCCTAGACTAAAAATGTGTTTAT

AATAAGATGTGGATATTTCCTTCAGTAGATTGTAACCATAATTTAAATTATTTTGTTCCA

CACTGTTTTTTATATCTGTCATGTACATTGCATTTTGATCTGTAACTGCACAACCCTGGG

GTTTGCTGCAGAGCTATTTCTTTCCATGTAAAGTAGTGGATCCATCTTGCTTTTGCCTTA

TATAAAGCCTACAGTTATGGAAGTGTGGAAAACTGTGGCTTCTCAATAAATATTCAGATG

TCCTAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAA

ACCTGAACTGTCTAAGATATTCTAAGCAAAGTTGACAAAGACAATTCTCCACTTGAGCCC

TTAAAAATGTAACCACTATAAAGGTTTCACGCGGTGGTTCTTATTGATTCGCTGTGTCAT

CACATCAGCTCCACTGTTGCCAAACTTTGTCGCATGCATAATGTATGATGGAGGCTTGGA

TGGGAATATGCTGATTTTGTTCTGCACTTAAAGGCTTCTCCTCCTGGAGGGCTGCCTAGG

GCCACTTGCTTGATTTATCATGAGAGAAGAGGAGAGAGAGAGAGACTGAGCGCTAGGAGT

GTGTGTATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATGTGTGTAGCGGGAGATGTGG

GCGGAGCGAGAGCAAAAGGACTGCGGCCTGATGCATGCTGGAAAAAGACACGCTTTTCAT

TTCTGATCAGTTGTACTTCATCCTATATCAGCACAGCTGCCATACTTCGACTTATCAGGA

TTCTGGCTGGTGGCCTGCGCGAGGGTGCAGTCTTACTTAAAAGACTTTCAGTTAATTCTC

ACTGGTATCATCGCAGTGAACTTAAAGCAAAGACCTCTTAGTAAAAAATAAAAAAAATAA

A

>Hs.150753_contig1 AI123582|AI288234聚腺苷酸＝0聚腺苷酸＝0

GCTTCTCTTTAAAATTGACCCAAGGCATGAGCCACTGCGCCTGGCCAGCAAATGCTTTTT

GTGCAGAATACACTTCTTTCAGGCATTGTCAGGTGCTGTTTTGTTTAAGCTCTAACTCAC

CCCTGGAATACAGGGGAATGATGACAACCAGCCCAGCCAGGCCTGACTCATCATGGTCAC

ATCCAGCCCCCACCCCCGGCCAACTAACCACTGCAGGCTCCTCTTCCAGACTCACCAGGG

GGCCTCGAGGCCCCGGCATCTCCCTTGGCCCTGGGTGTGGGTTTTACAAGACTGTGTCTT

TCATGACATCATAGCCCAACCATGTGAGAAGAAGGAGAAGGCCCCCCTTTCTTCATTAAT

CTGAAAA

>Hs.82109_mRNA_1 gi|14250611|gb|BC008765.1|BC008765智人克隆MGC：1622 IMAGE：3347793聚腺苷酸＝3

GGCACGAGGAAGGGCCTGTGGGTTTATTATAAGGCGGAGCTCGGCGGGAGAGGTGCGGGC

CGAATCCGAGCCGAGCGGAGAGGAATCCGGCAGTAGAGAGCGGACTCCAGCCGGCGGACC

CTGCAGCCCTCGCCTGGGACAGCGGCGCGCTGGGCAGGCGCCCAAGAGAGCATCGAGCAG

CGGAACCCGCGAAGCCGGCCCGCAGCCGCGACCCGCGCAGCCTGCCGCTCTCCCGCCGCC

GGTCCGGGCAGCATGAGGCGCGCGGCGCTCTGGCTCTGGCTGTGCGCGCTGGCGCTGAGC

CTGCAGCCGGCCCTGCCGCAAATTGTGGCTACTAATTTGCCCCCTGAAGATCAAGATGGC

TCTGGGGATGACTCTGACAACTTCTCCGGCTCAGGTGCAGGTGCTTTGCAAGATATCACC

TTGTCACAGCAGACCCCCTCCACTTGGAAGGACACGCAGCTCCTGACGGCTATTCCCACG

TCTCCAGAACCCACCGGCCTGGAGGCTACAGCTGCCTCCACCTCCACCCTGCCGGCTGGA

GAGGGGCCCAAGGAGGGAGAGGCTGTAGTCCTGCCAGAAGTGGAGCCTGGCCTCACCGCC

CGGGAGCAGGAGGCCACCCCCCGACCCAGGGAGACCACACAGCTCCCGACCACTCATCAG

GCCTCAACGACCACAGCCACCACGGCCCAGGAGCCCGCCACCTCCCACCCCCACAGGGAC

ATGCAGCCTGGCCACCATGAGACCTCAACCCCTGCAGGACCCAGCCAAGCTGACCTTCAC

ACTCCCCACACAGAGGATGGAGGTCCTTCTGCCACCGAGAGGGCTGCTGAGGATGGAGCC

TCCAGTCAGCTCCCAGCAGCAGAGGGCTCTGGGGAGCAGGACTTCACCTTTGAAACCTCG

GGGGAGAATACGGCTGTAGTGGCCGTGGAGCCTGACCGCCGGAACCAGTCCCCAGTGGAT

CAGGGGGCCACGGGGGCCTCACAGGGCCTCCTGGACAGGAAAGAGGTGCTGGGAGGGGTC

ATTGCCGTAGGCCTCGTGGGGCTCATCTTTGCTGTGTGCCTGGTGGGTTTCATGCTGTAC

CGCATGAAGAAGAAGGACGAAGGCAGCTACTCCTTGGAGGAGCCGAAACAAGCCAACGGC

GGGGCCTACCAGAAGCCCACCAAACAGGAGGAATTCTATGCCTGACGCGGGAGCCATGCG

CCCCCTCCGCCCTGCCACTCACTAGGCCCCCACTTGCCTCTTCCTTGAAGAACTGCAGGC

CCTGGCCTCCCCTGCCACCAGGCCACCTCCCCAGCATTCCAGCCCCTCTGGTCGCTCCTG

CCCACGGAGTCGTGGGGTGTGCTGGGAGCTCCACTCTGCTTCTCTGACTTCTGCCTGGAG

ACTTAGGGCACCAGGGGTTTCTCGCATAGGACCTTTCCACCACAGCCAGCACCTGGCATC

GCACCATTCTGACTCGGTTTCTCCAAACTGAAGCAGCCTCTCCCCAGGTCCAGCTCTGGA

GGGGAGGGGGATCCGACTGCTTTGGACCTAAATGGCCTCATGTGGCTGGAAGATCCTGCG

GGTGGGGCTTGGGGCTCACACACCTGTAGCACTTACTGGTAGGACCAAGCATCTTGGGGG

GGTGGCCGCTGAGTGGCAGGGGACAGGAGTCCACTTTGTTTCGTGGGGAGGTCTAATCTA

GATATCGACTTGTTTTTGCACATGTTTCCTCTAGTTCTTTGTTCATAGCCCAGTAGACCT

TGTTACTTCTGAGGTAAGTTAAGTAAGTTGATTCGGTATCCCCCCATCTTGCTTCCCTAA

TCTATGGTCGGGAGACAGCATCAGGGTTAAGAAGACTTTTTTTTTTTTTTTTTTTAAACT

AGGAGAACCAAATCTGGAAGCCAAAATGTAGGCTTAGTTTGTGTGTTGTCTCTTGAGTTT

GTCGCTCATGTGTGCAACAGGGTATGGACTATCTGTCTGGTGGCCCCGTTTCTGGTGGTC

TGTTGGCAGGCTGGCCAGTCCAGGCTGCCGTGGGGCCGCCGCCTCTTTCAAGCAGTCGTG

CCTGTGTCCATGCGCTCAGGGCCATGCTGAGGCCTGGGCCGCTGCCACGTTGGAGAAGCC

CGTGTGAGAAGTGAATGCTGGGACTCAGCCTTCAGACAGAGAGGACTGTAGGGAGGGCGG

CAGGGGCCTGGAGATCCTCCTGCAGACCACGCCCGTCCTGCCTGTGGCGCCGTCTCCAGG

GGCTGCTTCCTCCTGGAAATTGACGAGGGGTGTCTTGGGCAGAGCTGGCTCTGAGCGCCT

CCATCCAAGGCCAGGTTCTCCGTTAGCTCCTGTGGCCCCACCCTGGGCCCTGGGCTGGAA

TCAGGAATATTTTCCAAAGAGTGATAGTCTTTTGCTTTTGGCAAAACTCTACTTAATCCA

ATGGGTTTTTCCCTGTACAGTAGATTTTCCAAATGTAATAAACTTTAATATAAAGTAAAA

AAAAAAAAAAAAAAAAAAAAAAAA

>Hs.44276_mRNA_2 gi|12654896|gb|BC001293.1|BC001293智人克隆MGC：5259 IMAGE：3458115聚腺苷酸＝3

CGGATGGGGAAAAAAAAAGATGTCAGCTCCTCCGCTGTAGTATTGCTCCTTAAAAACCCC

TCTCTCTGAAAATGACATGCCCTCGCAATGTAACTCCGAACTCGTACGCGGAGCCCTTGG

CTGCGCCCGGCGGAGGAGAGCGCTATAGCCGGAGCGCAGGCATGTATATGCAGTCTGGGA

GTGACTTCAATTGCGGGGTGATGAGGGGCTGCGGGCTCGCGCCCTCGCTCTCCAAGAGGG

ACGAGGGCAGCAGCCCCAGCCTCGCCCTCAACACCTATCCGTCCTACCTCTCGCAGCTGG

ACTCCTGGGGCGACCCCAAAGCCGCCTATCGCCTGGAACAACCTGTTGGCAGGCCGCTGT

CCTCCTGCTCCTACCCACCTAGTGTCAAGGAGGAGAATGTCTGCTGCATGTACAGCGCAG

AGAAGCGGGCGAAAAGTGGCCCCGAGGCAGCTCTCTACTCCCACCCCTTGCCGGAGTCCT

GCCTTGGGGAGCACGAGGTACCCGTGCCCAGCTACTACCGCGCCAGCCCGAGCTACTCCG

CGCTGGACAAGACGCCCCACTGTTCTGGGGCCAACGACTTCGAAGCCCCTTTCGAGCAGC

GGGCCAGTCTCAACCCGCGCGCCGAACATCTGGAATCGCCTCAGCTGGGGGGCAAAGTGA

GTTTCCCTGAGACCCCCAAGTCCGACAGCCAGACCCCCAGCCCCAATGAAATCAAGACGG

AGCAGAGCCTGGCGGGCCCTAAAGGGAGCCCCTCGGAGAGCGAAAAGGAGAGGGCCAAAG

CTGCCGACTCCAGCCCAGACACCTCGGATAACGAAGCGAAAGAGGAGATAAAGGCAGAAA

ACACCACAGGAAATTGGCTGACAGCAAAGAGCGGAAGGAAGAAGAGGTGCCCCTATACTA

AACACCAGACGCTGGAATTGGAGAAAGAATTTCTGTTCAATATGTATTTGACGCGAGAGC

GCCGCCTGGAGATTAGCAAGACCATTAACCTTACAGACAGACAAGTCAAAATCTGGTTTC

AAAATCGCAGAATGAAACTCAAGAAAATGAACCGAGAGAATCGGATCCGGGAACTGACCT

CCAATTTTAATTTCACCTGAGAGCGCGGCCTCTCCTCCTCCCTTCCCGCTCCTTCCTCTC

CCCGCCCCTCCTCCCTTTGTGCCTGGTGATATATTTTTTTTTCCTCCCTGAGTATAAATG

CAATGCGACTGCAAAAAAGGCAAAGACCTCAGACTCTCCTTCCAAGGGACCTGTGGTTCG

TGCTGCGAAGATGCTTCCACTTAAAGCATGAGAAATGGGGTGCCGGGATGTGGGGTGTGG

TGTGTGCCCTCATAGATGGGGGTGGGAGTGTGGCTGGTGTGTGTGTCAAACCCTCACTCA

CCCACGCACTCACACACAGCATTCTGTTCTCCATGCAAAGTTAAGATCGAATCCATCCGC

TTGTAGGGGAAAAAAAGGAAAAAAATTAACCAGAGAGGGTCTGTAATCTCGCAGAGCACA

GGCAGAATCGTTCCTTCCTTGCTGCATTTCCTCCTTAGACTAATAGACGTTTTGGAAAGT

TCGGCTAGTGTTCGTGTGTTTGTCGTAGCACCCAGAGCCTCCACCAAACCCTCTCCATGT

CTTTACCTCCCAGTCGCTCTAAGAATCTGCTTGAAGTCTCGTATTTGTACTGCTTTCTGC

TTTTCTCCCACCCCTCCTAGCACCCCCACATCCCCCATCTAGTAACATCTCAGAAATTTC

ATCCAGAGGAACAAAAAAATTAAAAATAGAACATAGCAAAGCAAAGACAGAATGCCCCCC

CCCAAATATTGTCCTGTCCCTGTCTGGGAGTTGTGTTATTTAAAGATATTCTGTATGTTG

TATCTTTTGCATGTAGCTTCCTTAATGGAGAAAAAAAAATCCTAATAAATTTCCAGAATC

ATAATCCTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAA

>Hs.2142_mRNA_4 gi|13325274|gb|BC004453.1|BC004453智人克隆MGC：4303 IMAGE：2819400聚腺苷酸＝3

GCAGTGGCCACGAGAGGCAGGCTGGCTGGGACATGAGGTTGGCAGAGGGCAGGCAAGCTG

GCCCTTGGTGGGCCTCGTCCTGAGCACTCGGAGGCACTCCTATGCTTGGAAAGCTCGCTA

TGCTGCTGTGGGTCCAGCAGGCGCTGCTCGCCTTGCTCCTCCCCACACTCCTGGCACAGG

GAGAAGCCAGGAGGAGCCGAAACACCACCAGGCCCGCTCTGCTGAGGCTGTCGGATTACC

TTTTGACCAACTACAGGAAGGGTGTGCGCCCCGTGAGGGACTGGAGGAAGCCAACCACCG

TATCCATTGACGTCATTGTCTATGCCATCCTCAACGTGGATGAGAAGAATCAGGTGCTGA

CCACCTACATCTGGTACCGGCAGTACTGGACTGATGAGTTTCTCCAGTGGAACCCTGAGG

ACTTTGACAACATCACCAAGTTGTCCATCCCCACGGACAGCATCTGGGTCCCGGACATTC

TCATCAATGAGTTCGTGGATGTGGGGAAGTCTCCAAATATCCCGTACGTGTATATTCGGC

ATCAAGGCGAAGTTCAGAACTACAAGCCCCTTCAGGTGGTGACTGCCTGTAGCCTCGACA

TCTACAACTTCCCCTTCGATGTCCAGAACTGCTCGCTGACCTTCACCAGTTGGCTGCACA

CCATCCAGGACATCAACATCTCTTTGTGGCGCTTGCCAGAAAAGGTGAAATCCGACAGGA

GTGTCTTCATGAACCAGGGAGAGTGGGAGTTGCTGGGGGTGCTGCCCTACTTTCGGGAGT

TCAGCATGGAAAGCAGTAACTACTATGCAGAAATGAAGTTCTATGTGGTCATCCGCCGGC

GGCCCCTCTTCTATGTGGTCAGCCTGCTACTGCCCAGCATCTTCCTCATGGTCATGGACA

TCGTGGGCTTCTACCTGCCCCCCAACAGTGGCGAGAGGGTCTCTTTCAAGATTACACTCC

TCCTGGGCTACTCGGTCTTCCTGATCATCGTTTCTGACACGCTGCCGGCCACTGCCATCG

GCACTCCTCTCATTGGTGTCTACTTTGTGGTGTGCATGGCTCTGCTGGTGATAAGTTTGG

CCGAGACCATCTTCATTGTGCGGCTGGTGCACAAGCAAGACCTGCAGCAGCCCGTGCCTG

CTTGGCTGCGTCACCTGGTTCTGGAGAGAATCGCCTGGCTACTTTGCCTGAGGGAGCAGT

CAACTTCCCAGAGGCCCCCAGCCACCTCCCAAGCCACCAAGACTGATGACTGCTCAGCCA

TGGGAAACCACTGCAGCCACATGGGAGGACCCCAGGACTTCGAGAAGAGCCCGAGGGACA

GATGTAGCCCTCCCCCACCACCTCGGGAGGCCTCGCTGGCGGTGTGTGGGCTGCTGCAGG

AGCTGTCCTCCATCCGGCAATTCCTGGAAAAGCGGGATGAGATCCGAGAGGTGGCCCGAG

ACTGGCTGCGCGTGGGCTCCGTGCTGGACAAGCTGCTATTCCACATTTACCTGCTGGCGG

TGCTGGCCTACAGCATCACCCTGGTTATGCTCTGGTCCATCTGGCAGTACGCTTGAGTGG

GTACAGCCCAGTGGAGGAGGGGGTACAGTCCTGGTTAGGTGGGGACAGAGGATTTCTGCT

TAGGCCCCTCAGGACCCAGGGAATGCCAGGGACATTTTCAAGACACAGACAAAGTCCCGT

GCCCTGTTTCCAATGCCAATTCATCTCAGCAATCACAAGCCAAGGTCTGAACCCTTCCAC

CAAAAACTGGGTGTTCAAGGCCCTTACACCCTTGTCCCACCCCCAGCAGCTCACCATGGC

TTTAAAACATGCTCTCTTAGATCAGGAGAAACTCGGGCACTCCCTAAGTCCACTCTAGTT

GTGGACTTTTCCCCATTGACCCTCACCTGAATAAGGGACTTTGGAATTCTGCTTCTCTTT

CACAACTTTGCTTTTAGGTTGAAGGCAAAACCAACTCTCTACTACACAGGCCTGATAACT

CTGTACGAGGCTTCTCTAACCCCTAGTGTCTTTTTTTTCTTCACCTCACTTGTGGCAGCT

TCCCTGAACACTCATCCCCCATCAGATGATGGGAGTGGGAAGAATAAAATGCAGTGAAAC

CCTAAAAAAAAAAAAAAAAAAAAAA

TCTTCGCTCCTCTACCCCATAAAATTCCCTACAAATGCAAAAATTCGAGATAGAAGAAGC

CGTCCCTGAAATTGCTGTCTAACATTCACCGGAAACCTCTCCATAAACAAGGAGAAACGA

ATGCACACGCATTTTTGCTAAGAAGCCCGGGATTAAGATTTAAGGATACAAGCTGAAAGA

AAAAATGAAAAATGCTTCTCCGCGCGTCAATCGAGGGGTGGATGCGCCACGCAGCTGAGC

CCAGCTCACAGCCACGCGTAAGACCAAAAGCTGCCATGGGTTCTGCGCGCGGAGACCTCA

GAGCCGAAGAGAGAAGTCCCCGCGTCAGAAACGCTGCGGATGCCAGGTCTTGAAAATGCT

GACTTCTGAGGCTAAGAATTATTTCAAAGACAAAAAGAAAAGACTGGTGAGGAGGCCTTC

CGGTGCAAGGGCGCCTATCCGCTAATTTTGGATGGGGAAGTAGGGATTATTCGTTTAAAT

TCAATCGCGAGCACCAAGTCGGACTGGCCGGGGATGGAGAAGGGCAACCCCCACCTTTAG

AAAAATAAAAGATCTCGAAGGCCAAAAAAAAAAA

AGGGAGTGTTCCCGGGGGAGATACTCCAGTCGTAGCAAGAGTCTCGACCACTGAATGGAA

GAAAAGGACTTTTAACCACCATTTTGTGACTTACAGAAAGGAATTTGAATAAAGAAAACT

ATGATACTTCAGGCCCATCTTCACTCCCTGTGTCTTCTTATGCTTTATTTGGCAACTGGA

TATGGCCAAGAGGGGAAGTTTAGTGGACCCCTGAAACCCATGACATTTTCTATTTATGAA

GGCCAAGAACCGAGTCAAATTATATTCCAGTTTAAGGCCAATCCTCCTGCTGTGACTTTT

GAACTAACTGGGGAGACAGACAACATATTTGTGATAGAACGGGAGGGACTTCTGTATTAC

AACAGAGCCTTGGACAGGGAAACAAGATCTACTCACAATCTCCAGGTTGCAGCCCTGGAC

GCTAATGGAATTATAGTGGAGGGTCCAGTCCCTATCACCATAGAAGTGAAGGACATCAAC

GACAATCGACCCACGTTTCTCCAGTCAAAGTACGAAGGCTCAGTAAGGCAGAACTCTCGC

CCAGGAAAGCCCTTCTTGTATGTCAATGCCACAGACCTGGATGATCCGGCCACTCCCAAT

GGCCAGCTTTATTACCAGATTGTCATCCAGCTTCCCATGATCAACAATGTCATGTACTTT

CAGATCAACAACAAAACGGGAGCCATCTCTCTTACCCGAGAGGGATCTCAGGAATTGAAT

CCTGCTAAGAATCCTTCCTATAATCTGGTGATCTCAGTGAAGGACATGGGAGGCCAGAGT

GAGAATTCCTTCAGTGATACCACATCTGTGGATATCATAGTGACAGAGAATATTTGGAAA

GCACCAAAACCTGTGGAGATGGTGGAAAACTCAACTGATCCTCACCCCATCAAAATCACT

CAGGTGCGGTGGAATGATCCCGGTGCACAATATTCCTTAGTTGACAAAGAGAAGCTGCCA

AGATTCCCATTTTCAATTGACCAGGAAGGAGATATTTACGTGACTCAGCCCTTGGACCGA

GAAGAAAAGGATGCATATGTTTTTTATGCAGTTGCAAAGGATGAGTACGGAAAACCACTT

TCATATCCGCTGGAAATTCATGTAAAAGTTAAAGATATTAATGATAATCCACCTACATGT

CCGTCACCAGTAACCGTATTTGAGGTCCAGGAGAATGAACGACTGGGTAACAGTATCGGG

ACCCTTACTGCACATGACAGGGATGAAGAAAATACTGCCAACAGTTTTCTAAACTACAGG

ATTGTGGAGCAAACTCCCAAACTTCCCATGGATGGACTCTTCCTAATCCAAACCTATGCT

GGAATGTTACAGTTAGCTAAACAGTCCTTGAAGAAGCAAGATACTCCTCAGTACAACTTA

ACGATAGAGGTGTCTGACAAAGATTTCAAGACCCTTTGTTTTGTGCAAATCAACGTTATT

GATATCAATGATCAGATCCCCATCTTTGAAAAATCAGATTATGGAAACCTGACTCTTGCT

GAAGACACAAACATTGGGTCCACCATCTTAACCATCCAGGCCACTGATGCTGATGAGCCA

TTTACTGGGAGTTCTAAAATTCTGTATCATATCATAAAGGGAGACAGTGAGGGACGCCTG

GGGGTTGACACAGATCCCCATACCAACACCGGATATGTCATAATTAAAAAGCCTCTTGAT

TTTGAAACAGCAGCTGTTTCCAACATTGTGTTCAAAGCAGAAAATCCTGAGCCTCTAGTG

TTTGGTGTGAAGTACAATGCAAGTTCTTTTGCCAAGTTCACGCTTATTGTGACAGATGTG

AATGAAGCACCTCAATTTTCCCAACACGTATTCCAAGCGAAAGTCAGTGAGGATGTAGCT

ATAGGCACTAAAGTGGGCAATGTGACTGCCAAGGATCCAGAAGGTCTGGACATAAGCTAT

TCACTGAGGGGAGACACAAGAGGTTGGCTTAAAATTGACCACGTGACTGGTGAGATCTTT

AGTGTGGCTCCATTGGACAGAGAAGCCGGAAGTCCATATCGGGTACAAGTGGTGGCCACA

GAAGTAGGGGGGTCTTCCTTGAGCTCTGTGTCAGAGTTCCACCTGATCCTTATGGATGTG

AATGACAACCCTCCCAGGCTAGCCAAGGACTACACGGGCTTGTTCTTCTGCCATCCCCTC

AGTGCACCTGGAAGTCTCATTTTCGAGGCTACTGATGATGATCAGCACTTATTTCGGGGT

CCCCATTTTACATTTTCCCTCGGCAGTGGAAGCTTACAAAACGACTGGGAAGTTTCCAAA

ATCAATGGTACTCATGCCCGACTGTCTACCAGGCACACAGAGTTTGAGGAGAGGGAGTAT

GTCGTCTTGATCCGCATCAATGATGGGGGTCGGCCACCCTTGGAAGGCATTGTTTCTTTA

CCAGTTACATTCTGCAGTTGTGTGGAAGGAAGTTGTTTCCGGCCAGCAGGTCACCAGACT

GGGATACCCACTGTGGGCATGGCAGTTGGTATACTGCTGACCACCCTTCTGGTGATTGGT

ATAATTTTAGCAGTTGTGTTTATCCGCATAAAGAAGGATAAAGGCAAAGATAATGTTGAA

AGTGCTCAAGCATCTGAAGTCAAACCTCTGAGAAGCTGAATTTGAAAAGGAATGTTTGAA

TTTATATAGCAAGTGCTATTTCAGCAACAACCATCTCATCCTATTACTTTTCATCTAACG

TGCATTATAATTTTTTAAACAGATATTCCCTCTTGTCCTTTAATATTTGCTAAATATTTC

TTTTTTGAGGTGGAGTCTTGCTCTGTCGCCCAGGCTGGAGTACAGTGGTGTGATCCCAGC

TCACTGCAACCTCCGCCTCCTGGGTTCACATGATTCTCCTGCCTCAGCTTCCTAAGTAGC

TGGGTTTACAGGCACCCACCACCATGCCCAGCTAATTTTTGTATTTTTAATAGAGACGGG

GTTTCGCCATTTGGCCAGGCTGGTCTTGAACTCCTGACGTCAAGTGATCTGCCTGCCTTG

GTCTCCCAATACAGGCATGAACCACTGCACCCACCTACTTAGATATTTCATGTGCTATAG

ACATTAGAGAGATTTTTCATTTTTCCATGACATTTTTCCTCTCTGCAAATGGCTTAGCTA

CTTGTGTTTTTCCCTTTTGGGGCAAGACAGACTCATTAAATATTCTGTACATTTTTTCTT

TATCAAGGAGATATATCAGTGTTGTCTCATAGAACTGCCTGGATTCCATTTATGTTTTTT

CTGATTCCATCCTGTGTCCCCTTCATCCTTGACTCCTTTGGTATTTCACTGAATTTCAAA

CATTTGTCAGAGAAGAAAAACGTGAGGACTCAGGAAAAATAAATAAATAAAAGAACAGCC

TTTTCCCTTAGTATTAACAGAAATGTTTCTGTGTCATTAACCATCTTTAATCAATGTGAC

ATGTTGCTCTTTGGCTGAAATTCTTCAACTTGGAAATGACACAGACCCACAGAAGGTGTT

CAAACACAACCTACTCTGCAAACCTTGGTAAAGGAACCAGTCAGCTGGCCAGATTTCCTC

ACTACCTGCCATGCATACATGCTGCGCATGTTTTCTTCATTCGTATGTTAGTAAAGTTTT

GGTTATTATATATTTAACATGTGGAAGAAAACAAGACATGAAAAGAGTGGTGACAAATCA

AGAATAAACACTGGTTGTAGTCAGTTTTGTTTGTTAA

AAATCCTTCTTCCAATGTTCCTCCCCTCTCTGTATGAACCCTGTGTTGGGGGGCAGAAGA

TGGAAGCCCTTGGCAAGCTCGATCGAACCAAGCTACTAAATTGCTGAGCTCGTTTTAACT

GAAGTGTGAGAAGGAGGTTTAAGGCAAGTAGACAACATCCTGTTGTTGGGGTGCTTCTCT

CTTTTTTGCACATCTGGCTGAACTGGGAGTCAGGTGGTTGACTTGTGCCTGGCTGCAGTA

GCAGCGGCATCTCCCTTGCACAGTTCTCCTCCTCGGCCTGCCCAAGAGTCCACCAGGCCA

TGGACGCAGTGGCTGTGTATCATGGCAAAATCAGCAGGGAAACCGGCGAGAAGCTCCTGC

TTGCCACTGGGCTGGATGGCAGCTATTTGCTGAGGGACAGCGAGAGCGTGCCAGGCGTGT

ACTGCCTATGTGTGCTGTATCACGGTTACATTTATACATACCGAGTGTCCCAGACAGAAA

CAGGTTCTTGGAGTGCTGAGACAGCACCTGGGGTACATAAAAGATATTTCCGGAAAATAA

AAAATCTCATTTCAGCATTTCAGAAGCCAGATCAAGGCATTGTAATACCTCTGCAGTATC

CAGTTGAGAAGAAGTCCTCAGCTAGAAGTACACAAGGTACTACAGGGATAAGAGAAGATC

CTGATGTCTGCCTGAAAGCCCCATGAAGAAAAATAAAACACCTTGTACTTTATTTTCTAT

AATTTAAATATATGCTAAGTCTTATATATTGTAGATAATACAGTTCGGTGAGCTACAAAT

GCATTTCTAAAGCCATTGTAGTCCTGTAATGGAAGCATCTAGCATGTCGTCAAAGCTGAA

ATGGACTTTTGTACATAGTGAGGAGCTTTGAAACGAGGATTGGGAAAAAGTAATTCCGTA

GGTTATTTTCAGTTATTATATTTACAAATGGGAAACAAAAGGATAATGAATACTTTATAA

AGGATTAATGTCAATTCTTGCCAAATATAAATAAAAATAATCCTCAGTTTTTGTGAAAAG

CTCCATTTTTAGTGAAATATTATTTTATAGCTACTAATTTTAAAATGTCTTGCTTGATTG

TATGGTGGGAAGTTGGCTGGTGTCCCTTGTCTTTGCCAAGTTCTCCACTAGCTATGGTGT

CATAGGCTCTTTTGGGATTTTTGAAGCTGTATACTGTGTGCTAAAACAAGCACTAAACAA

AGAGTGAAGGATTTATGTTTAATTCTGAAAGCAACCTTCTTGCCTAGTGTTCTGATATTG

GACAGTAAAATCCACAGACCAACCTGGAGTTGAAAATCTTATAATTTAAAATATGCTCTA

AACATGTTTATCGTATTTGATGCTACAGGATTTGAAATTGTATTACAAATCCAATGAAAT

GAGTTTTTCTTTTCATTTACCTCTGCCCCAGTTGTTTCTACTACATGGAAGACCTCATTT

TGAAGGGAAATTTCAGCAGCTGCAGCTCATGAGTAACTGATTTGTAACAAGCCTCCTTTT

AAAGTAACCCTACAAAACCACTGGAAAGTTTATGGTTGTATTATTTTTTAAAAAAATTCC

AAGTGATTGAAACCTACACGAGATACAGAATTTTATGCGGCATTTTCTTCTCACATTTAT

ATTTTTGTGATTTTGTGATTGATTATATGTCACTTTGCTACAGGGCTCACAGAATTCATT

CACTCAACAAACATAATAGGGCGCTGAGGGCATAGAAGTAAAAACACCTGGTCCCTGCTC

TCAGTTCACTGTCTTGTTGGACGAGAAAAGAAACAATAACGATAAAAGACAGTGAAAGAA

AATAACGATAAAAGACAGTGAAAGAAAATAACAATAAAAGACAAGGAAAAAATAACAATG

AAAGTTGATAAGTACATGATAAGCGAGGTTCCCCGTGTGTAGGTAGATCTGGTCTTTAGA

GGCAGATAGATAGGTCAGTGCAAATACTCTGGTCCATGGGCCATATGAAAAGGCTAAGCT

TCACTGTAAAATAATAACTGGGAATTCTGGATTGTGTATGGGTGTTGGTGAACTTGGTTT

TAATTAGTGAACTGCTGAGAGACAGAGCTATTCTCCATGTACTGGCAAGACCTGATTTCT

GAGCATTTAATATGGATGCCGTGGGAGTACAAAAGTGGAGTGTGGCCTGAGTAATGCATT

ATGGGTGGTTTACCATTTCTTGAGGTAAAAGCATCACATGAACTTGTAAAGGAATTTAAA

AATCCTACTTTCATAATAAGTTGCATAGGTTTAATAATTTTTAATTATATGGCTTGAGTT

TAAATTGTAATAGGCGTAACTAATTTTAACTCTATAATGTGTTCATTCTGGAATAATCCT

AAACATATGAATTATGTTTGCATGTTCACTTCCAAGAGCCTTTTTTTGAAAAAAAGCTTT

TTTTGAATCATCAAGTCTTTCACATTTAAATAAAGTGTTTGAAAGCTTTATTTAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAGAAAAAAA

>Hs.1657_contig4

AATTGTTTTCTAAGTAATTGCTGCCTCTATTATGGCACTTCATTTTTGCACTGTCTTTTG

AGATTCAAGAAAAATTTCTATTCTTTTTTTTGCATCCAATTGTGCCTGAACTTTTAAAAT

ATGTAAATGCTGCCATGTTCCAAACCCATCGTCAGTGTGTGTGTTTAGAGCTGTGCACCC

TAGAAACAACATATTGTCCCATGAGCAGGTGCCTGAGACACAGACCCCTTTGCATTCACA

GAGAGGTCATTGGTTATAGAGACTTGAATTAATAAGTGACATTATGCCAGTTTCTGTTCT

CTCACAGGTGATAAACAATGCTTTTTGTGCACTACATACTCTTCAGTGTAGAGCTCTTGT

TTTATGGGAAAAGGCTCAAATGCCAAATTGTGTTTGATGGATTAATATGCCCTTTTGCCG

ATGCATACTATTACTGATGTGACTCGGTTTTGTCGCAGCTTTGCTTTGTTTAATGAAACA

CACTTGTAAACCTCTTTTGCACTTTGAAAAAGAATCCAGCGGGATGCTCGAGCACCTGTA

AACAATTTTCTCAACCTATTTGATGTTCAAATAAAGAATTAAACTAAAAAAAAAAAAAAA

A

GGCGCCGCGGACGCTGCTGGAGTCGCCTGGCAACGATGTCGCCTGGCAACTGAATAGGTT

GGCCAGTGGCGCGGGCTACTGGAAGCAGAAAGGGCTGCGGAGGCAGTGAGTGGTTTCTGC

AGAGCTTCATTTGGAAAGGCCTCTGTAGTTGGGGAAAGATGGCCCATTCCCAGAACTCCT

TGGAGCTTCCCATTAACATCAATGCCACCCAGATTACCACTGCCTATGGCCATCGGGCCC

TGCCCAAGCTGAAGGAGGAGCTGCAGTCAGAGGACCTCCAGACGAGGCAGAAAGCCCTCA

TGGCCCTGTGTGACCTCATGCATGACCCCGAGTGTATCTACAAGGCCATGAACATAGGCT

GTATGGAGAACCTGAAAGCTTTGCTGAAGGATAGCAACAGTATGGTGCGCATAAAGACCA

CCGAGGTGCTCCACATCACGGCAAGCCATAGCGTGGGCAGATACGCCTTTCTAGAGCACG

ACATCGTCCTTGCCCTGTCCTTCCTGCTGAATGACCCCAGCCCAGTCTGCCGGGGGAACC

TGTACAAGGCATACATGCAGCTGGTCCAGGTGCCTAGAGGGGCCCAAGAGATCATCAGCA

AAGGTCTGATTTCCTCACTGGTATGGAAGCTGCAGGTGGAGGTGGAGGAGGAGGAGTTCC

AGGAGTTCATCCTGGACACACTGGTCCTCTGCCTGCAGGAGGATGCCACCGAGGCCCTGG

GCAGCAATGTGGTGCTTGTCCTGAAGCAGAAGCTCCTCAGCGCCAACCAGAACATCCGCA

GCAAGGCCGCCCGTGCGCTCCTTAATGTCAGCATATCTCGAGAGGGCAAGAAACAGGTGT

GTCATTTTGACGTCATCCCCATCCTGGTCCATCTGCTGAAAGACCCAGTGGAGCATGTGA

AGTCTAACGCTGCCGGTGCCCTGATGTTCGCCACAGTGATCACTGAAGGGAAGTATGCGG

CCCTGGAGGCACAAGCCATCGGCCTGCTCCTGGAGCTGCTGCACTCCCCCATGACCATAG

CGCGCCTGAATGCCACCAAGGCCCTTACCATGCTGGCAGAGGCCCCCGAGGGCCGCAAGG

CCCTGCAGACGCACGTGCCCACTTTCCGTGCCATGGAGGTGGAGACTTACGAAAAGCCTC

AAGTGGCCGAAGCCTTACAGCGGGCAGCCCGGATCGCCATCAGTGTCATCGAGTTCAAAC

CCTGAGCCCTTCATTCACCTCTGTGAGTGAATAAATGTGCTAAGTCTCTTTAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAA

AGAGCAGTAAGCTTGTGATAAAGGCCAATTCCAGGTAGCTCTTGAAGGTGATAGCCATCT

ACTTTCCAGTGGCTGCCAACCACAGGGAGTGCCAGTTAACACTGGAAGGATTAAGGCAAG

GTCCCTTCTCTTGAGACTCCCCTCTGAGATCTGAAAAATGAAGTGGCTTAGGAACATCAG

CAGTGAAGAACTGCCAAGAGTTGGTGAAGGTTGTCTCTTCCGAGGGCCTTCTGAAGACAG

GGCTCTTGAACAGACAAGTGGAAGGGCTGTACCAGGGATAAAGGAAAGAAGTGCCTGTCC

AGCAGGGAGCTTGAATTTAAGTTCCATGTATGAAGTCATTGGCTCTATCTGCATTTTTCT

GTCATTCTCTTCATTTGTTTTAAGGTGGAAAATTTTCTTACAGTTGATGCAAAGTATCAA

CTACTTTACCCTACCTTCTCCCCTTTTAGATGGGTTCTTCCTGAGTTTTGGAGTCTTGTA

TGATTATCAGTATTCCCCTGTCAAAATCAAATCTATTCAGGTTTCTTCACTGTTGAGAAC

ACCTAAATGTTTTTATTTTTGAGAAGTGGGGACAGAGTCTCACTATGTCACCCAGGCTGG

AGTGCAATGGCATGATCTCAGCTCACTGCAACCTTCGCCTCCTGGGTTCAAGCGATTCTC

CTGCCTCCGCCTCCTGAGTAGCTGGGATTATAGGCACGCACCACCACGCCCAGCTAATTT

TTTGTATTTTTAGTAGAGACAGAGTTTCACCATGTTGGCCAGGCTGGTCTTGAACTCCTG

ACCTTGTGATCCACCCACCTCGGCCTCCCAGAGTGCTGGGATTACAGGCATGAGCCACCA

CGCTTGGCTAAGAACACCTAAATTTTTATGTTTCTTGGCTCAAAAACCAGTTCCATTTCT

AATGTTGTCCTCACAAGAAGGCTAATTGGTGGTGAGACAGCAGGGGAGGAGGAAGAGCTG

TGGTTTGTAACTTGTTCAACTCAGGCAATAAGCGATTTTAGCTTTATTTAAAGTCTTCTG

TCCAGCTTTAAGCACTTTGTAAGACATGGCTGAAAGTAGCTTTTCTATCAGAATTGCAGA

TAGTCATGTTGGGCTAACAGTCAATTGGATATATTCCTTTACCTCACATGACCCCAGCAA

CTGTGGTGGTATCTAGAGGTGAAACAGGCAAGTGAAATGGACACCTCTGCTGTGAATGTT

TTAGAGAAGGAAATTCAAAAAATGTTGTAACTGAAAGCACTGTTGAATATGGGTATCGGC

TTTCTTTTTCACTTTGACTCTTAACATTATCAGTCAACTTCCACATTAATGAAAGTTGAC

CATAGTTATTTCCAAATAAAAAGAAACCAACTCTTACCAGGTCTTGGACTGTGATGTCAT

ATTATTCAGTTTTATGCTTGTTCCTGAGCAGAACTCATAAGAGTGACATAGTCAGCTGCT

GACGGCACCTCAGCCACGCCACTCTTACTCAGTTCAGTGGGTGTGCTTGCGTGGTAGGAT

GTGGTGCAGCCCTCTCTACGCTCTTCTATTTTTGGTATATTTCCTATCTAACCTTCAAAT

AGCTTCCAATTCTTTTTTTCTTGGACTGGCTTCATTCTGAATTTGTGCTAAAATAATCTT

TCATAAAGAGACCTCAGTTTATAGCGTAACAGACTACACAATGCACTGATGTTTTCATAA

TGTTTAAGGGACCCACTGCAAGAAGCTTGCTGCCTCCTTTTAATTGTATTCATTTAGATT

TTGATTTTCCATGTTAAGAAGGTGAGGTCCATGTTGGTGCCCTTCAGAGTAGAGAACCAT

GTAAACATTAGGAATGAACAGAGGCCTTAGGAATGAATAGAGAGTTTGCCTTATACAATT

TCCTGTTACAAAGCTCTCCCTCTCATGCAAAGTAGGGAACACCTTTTGAGCATCTTTGAA

TTTGACAAATGGTGCTGTTGCAAACACTTTTTTTTTGAGATGAAGTCTCGCGGTTGTCAC

CCGGGCTGGAGTGCAGTGGCGTGATCTCGGCTCACTGCAACTTCCACCTCCTGGGTTCCA

GCAGTTCTCCTGCCTCAGCCTCCCAAGTAGCTGAGATTACAGGCGCCTGCCACCCCACCT

GGCTGATTTTTGTAATTTTAGTAGAGACGGGGTTTCACCATGTTGGCCAGGCTGATTAAC

TCCTGACCTCAGGTGATCCACCTTTCTCGGCCTCCCAAAGTGCTGGGATTACGGGTGTGA

GCCACCGTGCCCGGCCTGCAAACACATTTTAATTGACAACACTAGGGCTGTTGTACAAAA

TAGTAATGATAGCCATGGAAGTTTTACCTTATTCTGTGAGAAGTGTTCTTAAACTTATTA

AGTGTCTAAACTAAGGTTTAGTGCTTTTTTAAAGGAAAGTTGTCCCAGGATTCATCCTAA

AGAAAGCAAAAGTTAATTCAACTGATCCACCAATGGAATTAGATGGGTAGAGTTGGGTTC

TTGAGTTTTACCACCACTTAGTTCCCACTGAATTTTGTAACTTCCTGTGTTTGCATCCTC

TGTTCCTATTCTGCCCTTGCTCTGTGTCATCTCAGTCATTTGACTTAGAAAGTGCCCTTC

AAAAGGACCCTGTTCACTGCTGCACTTTTCAATGAATTAAAATTTATTTCTGTTCTAAAA

AAAAAAAAAAA

TGATCAACAACTGTCAGCTCCCAGTCAGAGAGAAAGGGCCTCTTCAGTCTGTCTCAGGAG

ACTGGGAGAAACAGCATAAAGGACCCCACAAGGAAGGGAGAGGTACCCTGGGTCAGGCGC

TTGTGGAGAGAGGGCTTCGCATGTAAAGTGACGTCAGGGAAAATAGAACAGAAAAAAAGC

CAGGGCCAGCCCAGAGGCACCTGAGAAGAATCAGACCCACAGCTCAGCCCAGCCCTGGCA

CAGAGAAGAGACAGGCCTGGCAGCACCCAGGGACCCCCTTTCCTCAGCCTCCACCTGCAG

GACAGCAGGAGCACTGATGCGCTGAAGGTACGTTCTGGAGTCTGGAAGCAGCAGAACTGA

AGGAAGTAAACACGGGTGTCTGGGAAGACCCCTCAAGCTGCAGTAAAGCCCAGGACTGAA

TTGGCCACCTGAGGCCAAGGGTGGCACTCCAACCTCCTCCTAAAGGCTGGCTAGAGCCAC

AGGAAAGGGCCAGAAGCCAGAGAAAGGGCAAAGGTGGACCCCTGCCTCCAAACCTCCTCT

GGAGACTGACCTCCTCTTTCCTGTGCCTTATTGTTTCTCCCTCTTCTCTTTGTTCGCCAC

TGGGCGGTGACCTCAGGGATCCTGGCCTAACCTGGTGATTGTGCAGGCAACTGTGTCCGA

GAAGACCCTTCTCTGGAAGATTGAACCCCAATTCAGCCATGGTGACTCCTTTGATGTCAA

ACTGGTAAGGGCTGAGCCGTGGGCACAGGATACCACTCCTTCCAGCTCTTCTGCTGTGAC

CTGCCCATGGAAGTCCCTGTGGACACGAAATCCTGTTTGGATCATCTAACTGGAGGCTCT

CTGTTCTTCACCTCCACGCGCCCTCTTGACCCCAGGAGGTTCAGGGGAGGAAGTACGCCA

CTCTCCACTGGCACCCTCCTTGGCCTACACAGAGTCACCCCTGAGCCCCTCAATGTGTGC

TGAGGTGGGCCCTGCTCTCTGCAGGGGTATGGAGAGAAATAGCTTGGGGTGCTGTGAGGC

CCCGAAGAAGCTGGGCCTGTCCTTCTCCATCGAGGCGATCCTAAAGAGGCCTGCCAGGAG

GAGTGATATGGACAGACCAGAAGGGCCAGGTGAAGAGGGCCCCGGAGAAGCTGCGGCCTC

AGGCTCTGGGCTAGAAAAGCCTCCAAAGGACCAGCCCCAGGAAGGAAGGAAGAGCAAGCG

GAGGGTTCGTACCACCTTCACCACTGAGCAGCTGCATGAGCTGGAGAAGATCTTCCACTT

TACCCACTACCCAGACGTTCACATCCGCAGCCAGCTGGCAGCCAGGATCAACCTCCCAGA

AGCTCGGGTGCAGATCTGGTTCCAGAATCAGCGAGCCAAGTGGCGGAAGCAGGAGAAGAT

TGGCAACCTGGGGGCTCCACAGCAGCTGAGTGAAGCCAGTGTGGTCCTGCCCACAAATCT

GGATGTGGCTGGGCCCACGTGGACATCCACTGCTCTGCGCAGGCTGGCTCCTCCCACGAG

CTGTTGTCCATCGGCTCAAGATCAGCTGGCCTCTGCCTGGTTCCCTGCCTGGATCACCCT

CCTCCCAGCGCACCCATGGGAAACACAGCCTGTCCCAGGTCTTCCCATCCATCAAACTTG

CATCCCTGTGCTATGCATCCTTCCACCTCCACACCCCAAATGGGGCAGCATCTGTGCTAC

TTCAACATAGAGATTGGACATGCTCTCCCCAAATGAGCCACTTTCCTCTCCAGGTGAAGG

CAGGTAGCAGATGTGCCCTGGGCCTCTGGGGAAATCGATCTCACAATCCAAAAATGGCCC

ACAGCCCAGGAAGCTACCCTGAACATGCCAGTTGGAAGGCTGCACCAGACTCAAAAGCAA

ACTAAACAATAAAGGACAGCTCTCTTCTCTCCTGGCTAAAGCTGCTCTCCTGGTTCAGAA

GACAGGCTGGATGAGATCTCAGGCCGAGCTCTGAAATAGGGAGGTAATCCTCCAGCACCT

GTGTTTCCTCTAACTTGCTGTGTGACCTCCAGCCGGTCACTCACCCTCTCTGGACCTCAT

CTGTAAGAGGAGCCAGCTGGATAAGATGATTTCTGAAGACGCTTCCATGGTGGGCACTGA

GGCACAGAGGAGGCCAAGGAGAGGTTGTTTGTTCATGCATGCATTCATCCGTGACACATG

AGTACCTACTGAGGACTCCATAAACAGAACGGGATACAGAGATAAACAATTTGGGTTCTG

TCCACGTTTGTCAAAAGGTGGTGCTGGCCCACCTCTGAAAGCAGAACACTTGCTCAACAA

CCTTGCTGTTGGCCCAAGTCTAACACATTCTTTATGACTGTGAGCATCTCAGAGTGAGAG

AAAAATGTAGAAAGTTTTTTAAATTCTAAACAGGATTTAGTGTCTTTAGTTATCTTGCTG

GATGGGAAAGGGATGTTGTCATTTCTGGCACAAATGAAAAGTAGGACGGAAAGCTCCTTT

CATTCAGTTTATCTTTCCAGGATATATGAAAAGGGACCAGCTGGAAGACTAGCCTCACTC

TGTCCTCGAAAGCCTGAGCTTTCATTCAACTCCCTATTTCCATGCAAAGACGCTGGGCAA

ACCACATGTTCTGTCTGAGCCTCAGTTTTCCTATCCATAAAATGAAGGTAGCCAGGCCTG

CCTCAAAGAGCATTCAGGAGGCTCTGAGAGGACATGAGAGTATTTTGCAAAGTGAGGGCA

AGGCCCAGTGTGGAGTGATATTGTTATTCCAAGATTCCACTGCAAAAGTGGCTGCTTTGG

ATGCCAGCCCAGGATGAGTAGTTCCTGTTCTCAGGGAGGTCATCCGCTGAGCATCCCTTC

TGCACAGATGTCTCTGATTCTTGTCCTTGCAGGTGGAGGACAGGGCCTGCTCCCCTAAGC

TGGGAAGCCTGGAATGACCTCTTGCACAAGCCTAAATTCCAGGAATCTTCCCCAAATCCC

AGATCCTCTGCAATCTACCTGCACCCCTGACCCACCCAGGAGTTGGACCGGGAGTTGGGA

AGCCTAGGTCTTAGTCCTACACTCCTTCTAATTTGCTGTGTAACCTTACCATTAATCTCT

CTGGGTCTCAGTTTTCTCATCTGTATTGGAGGTAGCAGTGCTAGCTCTGCCTTCAGGCAT

GCAATATGCCAGAACTACAGACAACAGCCCACAGGATGCAAAAGTGCTTTGCCATCTTAA

AAATGCCAGATCACTCAGAGCCTATGAATGTGGATATCAACACCAGGTCTCTAGCACCGC

TGGATGAAAGGAGAAGGCTAGAGGCTGAGGGAGGAAAGAGCAGTTAACAAACAAAGGCAG

TAGCTCATCACTTGGGTAGCAGGTACCCATTTTAGGACCCTACACTCAAATGTGCAAAAT

AAAATTTCTATCATTTTGCTATAAAAAAAAAAAAAAAAAAAAA

>NM_004967

GAGTGAGTGAGAGGGCAGAGGAAATACTCAATCTGTGCCACTCACTGCCTTGAGCCTGCT

TCCTCACTCCAGGACTGCCAGAGGCTCACTCCCTTGAGCCTGCTTCCTCACTCCAGGACT

GCCAGAGGAAGCAATCACCAAAATGAAGACTGCTTTAATTTTGCTCAGCATTTTGGGAAT

GGCCTGTGCTTTCTCAATGAAAAATTTGCATCGAAGAGTCAAAATAGAGGATTCTGAAGA

AAATGGGGTCTTTAAGTACAGGCCACGATATTATCTTTACAAGCATGCCTACTTTTATCC

TCATTTAAAACGATTTCCAGTTCAGGGCAGTAGTGACTCATCCGAAGAAAATGGAGATGA

CAGTTCAGAAGAGGAGGAGGAAGAAGAGGAGACTTCAAATGAAGGAGAAAACAATGAAGA

ATCGAATGAAGATGAAGACTCTGAGGCTGAGAATACCACACTTTCTGCTACAACACTGGG

CTATGGAGAGGACGCCACGCCTGGCACAGGGTATACAGGGTTAGCTGCAATCCAGCTTCC

CAAGAAGGCTGGGGATATAACAAACAAAGCTACAAAAGAGAAGGAAAGTGATGAAGAAGA

AGAGGAGGAAGAGGAAGGAAATGAAAACGAAGAAAGCGAAGCAGAAGTGGATGAAAACGA

ACAAGGCATAAACGGCACCAGTACCAACAGCACAGAGGCAGAAAACGGCAACGGCAGCAG

CGGAGGAGACAATGGAGAAGAAGGGGAAGAAGAAAGTGTCACTGGAGCCAATGCAGAAGG

CACCACAGAGACCGGAGGGCAGGGCAAGGGCACCTCGAAGACAACAACCTCTCCAAATGG

TGGGTTTGAACCTACAACCCCACCACAAGTCTATAGAACCACTTCCCCACCTTTTGGGAA

AACCACCACCGTTGAATACGAGGGGGAGTACGAATACACGGGCGTCAATGAATACGACAA

TGGATATGAAATCTATGAAAGTGAGAACGGGGAACCTCGTGGGGACAATTACCGAGCCTA

TGAAGATGAGTACAGCTACTTTAAAGGACAAGGCTACGATGGCTATGATGGTCAGAATTA

CTACCACCACCAGTGAAGCTCCAGCCTG

>NM_002847

GCCTCCCGCCGCCTCCCGCGCGGCCATGGACTGAGCGCCGCCGGCCAGGCCGCGGGGATG

GGGCCGCCGCTCCCGCTGCTGCTGCTGCTACTGCTGCTGCTGCCGCCACGCGTCCTGCCT

GCCGCCCCTTCGTCCGTCCCCCGCGGCCGGCAGCTCCCGGGGCGTCTGGGCTGCCTGCTC

GAGGAGGGCCTCTGCGGAGCGTCCGAGGCCTGTGTGAACGATGGAGTGTTTGGAAGGTGC

CAGAAGGTTCCGGCAATGGACTTTTACCGCTACGAGGTGTCGCCCGTGGCCCTGCAGCGC

CTGCGCGTGGCGTTGCAGAAGCTTTCCGGCACAGGTTTCACGTGGCAGGATGACTATACT

CAGTATGTGATGGACCAGGAACTTGCAGACCTCCCGAAAACCTACCTGAGGCGTCCTGAA

GCATCCAGCCCAGCCAGGCCCTCAAAACACAGCGTTGGCAGCGAGAGGAGGTACAGTCGG

GAGGGCGGTGCTGCCCTGGCCAACGCCCTCCGACGCCACCTGCCCTTCCTGGAGGCCCTG

TCCCAGGCCCCAGCCTCAGACGTGCTCGCCAGGACCCATACGGCGCAGGACAGACCCCCC

GCTGAGGGTGATGACCGCTTCTCCGAGAGCATCCTGACCTATGTGGCCCACACGTCTGCG

CTGACCTACCCTCCCGGGCCCCGGACCCAGCTCCGCGAGGACCTCCTGCCGCGGACCCTC

GGCCAGCTCCAGCCAGATGAGCTCAGCCCTAAGGTGGACAGTGGTGTGGACAGACACCAT

CTGATGGCGGCCCTCAGTGCCTATGCTGCCCAGAGGCCCCCAGCTCCCCCCGGGGAGGGC

AGCCTGGAGCCACAGTACCTTCTGCGTGCACCCTCAAGAATGCCCAGGCCTTTGCTGGCA

CCAGCCGCCCCCCAGAAGTGGCCTTCACCTCTGGGAGATTCCGAAGACCCCTCCAGCACA

GGCGATGGAGCACGGATTCATACCCTCCTGAAGGACCTGCAGAGGCAGCCGGCTGAGGTG

AGGGGCCTGAGTGGCCTGGAGCTGGACGGCATGGCTGAGCTGATGGCTGGCCTGATGCAA

GGCGTGGACCATGGAGTAGCTCGAGGCAGCCCTGGGAGAGCGGCCCTGGGAGAGTCTGGA

GAACAGGCGGATGGCCCCAAGGCCACCCTCCGTGGAGACAGCTTTCCAGATGACGGAGTG

CAGGACGACGATGATAGACTTTACCAAGAGGTCCATCGTCTGAGTGCCACACTCGGGGGC

CTCCTGCAGGACCACGGGTCTCGACTCTTACCTGGAGCCCTCCCCTTTGCAAGGCCCCTC

GACATGGAGAGGAAGAAGTCCGAGCACCCTGAGTCTTCCCTGTCTTCAGAAGAGGAGACT

GCCGGAGTGGAGAACGTCAAGAGCCAGACGTATTCCAAAGATCTGCTGGGGCAGCAGCCG

CATTCGGAGCCCGGGGCCGCTGCGTTTGGGGAGCTCCAAAACCAGATGCCTGGGCCCTCG

AAGGAGGAGCAGAGCCTTCCAGCGGGTGCTCAGGAGGCCCTCAGCGACGGCCTGCAATTG

GAGGTCCAGCCTTCCGAGGAAGAGGCGCGGGGCTACATCGTGACAGACAGAGACCCCCTG

CGCCCCGAGGAAGGAAGGCGGCTGGTGGAGGACGTCGCCCGCCTCCTGCAGGTGCCCAGC

AGTGCGTTCGCTGACGTGGAGGTTCTCGGACCAGCAGTGACCTTCAAAGTGAGCGCCAAT

GTCCAAAACGTGACCACTGAGGATGTGGAGAAGGCCACAGTTGACAACAAAGACAAACTG

GAGGAAACCTCTGGACTGAAAATTCTTCAAACCGGAGTCGGGTCGAAAAGCAAACTCAAG

TTCCTGCCTCCTCAGGCGGAGCAAGAAGACTCCACCAAGTTCATCGCGCTCACCCTGGTC

TCCCTCGCCTGCATCCTGGGCGTCCTCCTGGCCTCTGGCCTCATCTACTGCCTCCGCCAT

AGCTCTCAGCACAGGCTGAAGGAGAAGCTCTCGGGACTAGGGGGCGACCCAGGTGCAGAT

GCCACTGCCGCCTACCAGGAGCTGTGCCGCCAGCGTATGGCCACGCGGCCACCAGACCGA

CCTGAGGGCCCGCACACGTCACGCATCAGCAGCGTCTCATCCCAGTTCAGCGACGGGCCG

ATCCCCAGCCCCTCCGCACGCAGCAGCGCCTCATCCTGGTCCGAGGAGCCTGTGCAGTCC

AACATGGACATCTCCACCGGCCACATGATCCTGTCCTACATGGAGGACCACCTGAAGAAC

AAGAACCGGCTGGAGAAGGAGTGGGAAGCGCTGTGCGCCTACCAGGCGGAGCCCAACAGC

TCGTTCGTGGCCCAGAGGGAGGAGAACGTGCCCAAGAACCGCTCCCTGGCTGTGCTGACC

TATGACCACTCCCGGGTCCTGCTGAAGGCGGAGAACAGCCACAGCCACTCAGACTACATC

AACGCTAGCCCCATCATGGATCACGACCCGAGGAACCCCGCGTACATCGCCACCCAGGGA

CCGCTGCCCGCCACCGTGGCTGACTTTTGGCAGATGGTGTGGGAGAGCGGCTGCGTGGTG

ATCGTCATGCTGACACCCCTCGCGGAGAACGGCGTCCGGCAGTGCTACCACTACTGGCCG

GATGAAGGCTCCAATCTCTACCACATCTATGAGGTGAACCTGGTCTCCGAGCACATCTGG

TGTGAGGACTTCCTGGTGAGGAGCTTCTATCTGAAGAACCTGCAGACCAACGAGACGCGC

ACCGTGACGCAGTTCCACTTCCTGAGTTGGTATGACCGAGGAGTCCCTTCCTCCTCAAGG

TCCCTCCTGGACTTCCGCAGAAAAGTAAACAAGTGCTACAGGGGCCGTTCTTGTCCAATA

ATTGTTCATTGCAGTGACGGTGCAGGCCGGAGCGGCACCTACGTCCTGATCGACATGGTT

CTCAACAAGATGGCCAAAGGTGCTAAAGAGATTGATATCGCAGCGACCCTGGAGCACTTG

AGGGACCAGAGACCCGGCATGGTCCAGACGAAGGAGCAGTTTGAGTTCGCGCTGACAGCC

GTGGCTGAGGAGGTGAACGCCATCCTCAAGGCCCTTCCCCAGTGAGCGGCAGCCTCAGGG

GCCTCAGGGGAGCCCCCACCCCACGGATGTTGTCAGGAATCATGATCTGACTTTAATTGT

GTGTCTTCTATTATAACTGCATAGTAATAGGGCCCTTAGCTCTCCCGTAGTCAGCGCAGT

TTAGCAGTTAAAAGTGTATTTTTGTTTAATCAAACAATAATAAAGAGAGATTTGTGGAAA

AATCCAGTTACGGGTGGAGGGGAATCGGTTCATCAATTTTCACTTGCTTAAAAAAAATAC

TTTTTCTTAAAGCACCCGTTCACCTTCTTGGTTGAAGTTGTGTTAACAATGCAGTAGCCA

GCACGTTCGAGGCGGTTTCCAGGAAGAGTGTGCTTGTCATCTGCCACTTTCGGGAGGGTG

GATCCACTGTGCAGGAGTGGCCGGGGAAGCTGGCAGCACTCAGTGAGGCCGCCCGGCACA

CAAGGCACGTTTGGCATTTCTCTTTGAGAGAGTTTATCATTGGGAGAAGCCGCGGGGACA

GAACTGAACGTCCTGCAGCTTCGGGGCAAGTGAGACAATCACAGCTCCTCGCTGCGTCTC

CATCAACACTGCGCCGGGTACCATGGACGGCCCCGTCAGCCACACCTGTCAGCCCAAGCA

GAGTGATTCAGGGGCTCCCCGGGGGCAGACACCTGTGCACCCCATGAGTAGTGCCCACTT

GAGGCTGGCACTCCCCTGACCTCACCTTTGCAAAGTTACAGATGCACCCCAACATTGAGA

TGTGTTTTTAATGTTAAAATATTGATTTCTACGTTATGAAAACAGATGCCCCCGTGAATG

CTTACCTGTGAGATAACCACAACCAGGAAGAACAAATCTGGGCATTGAGCAAGCTATGAG

GGTCCCCGGGAGCACACGAACCCTGCCAGGCCCCCGCTGGCTCCTCCAGGCACGTCCCGG

ACCTGTGGGGCCCCAGAGAGGGGACATTTCCCTCCTGGGAGAGAAGGAGATCAGGGCAAC

TCGGAGAGGGCTGCGAGCATTTCCCTCCCGGGAGAGGAGATCAGGGCGACCTGCACGCAC

TGCGTAGAGCCTGGAAGGGAAGTGAGAAACCAGCCGACCGGCCCTGCCCCTCTTCCCGGG

ATCACTTAATGAACCACGTGTTTTGACATCATGTAAACCTAAGCACGTAGAGATGATTCG

GATTTGACAAAATAACATTTGAGTATCCGATTCGCCATCACCCCCTACCCCAGAAATAGG

ACAATTCACTTCATTGACCAGGATGATCACATGGAAGGCGGCGCAGAGGCAGCTGTGTGG

GCTGCAGATTTCCTGTGTGGGGTTCAGCGTAGAAAACGCACCTCCATCCCGCCCTTCCCA

CAGCATTCCTCCATCTTAGATAGATGGTACTCTCCAAAGGCCCTACCAGAGGGAACACGG

CCTACTGAGCGGACAGAATGATGCCAAAATATTGCTTATGTCTCTACATGGTATTGTAAT

GAATATCTGCTTTAATATAGCTATCATTTCTTTTCCAAAATTACTTCTCTCTATCTGGAA

TTTAATTAATCGAAATGAATTTATCTGAATATAGGAAGCATATGCCTACTTGTAATTTCT

AACTCCTTATGTTTGAAGAGAAACCTCCGGTGTGAGATATACAAATATATTTAATTGTGT

CATATTAAACTTCTGATTCAAAAAAAA

>BC002551

GGCACGAGGCCACGAGCTGTTGTGCATCCAGAGGTGGAATTGGGGCCCGGCATTCCCTCC

TCGTCCCGGGCTGGCCCTTGCCCCCACCCTGCAACTCCTGGTTGAGATGGGCTCAGCCAA

GAGCGTCCCAGTCACACCAGCGCGGCCTCCGCCGCACAACAAGCATCTGGCTCGAGTGGC

GGACCCCCGTTCACCTAGTGCTGGCATCCTGCGCACTCCCATCCAGGTGGAGAGCTCTCC

ACAGCCAGGCCTACCAGCAGGGGAGCAACTGGAGGGTCTTAAACATGCCCAGGACTCAGA

TCCCCGCTCTCCTACTCTTGGTATTGCACGGACACCTATGAAGACCAGCAGTGGAGACCC

CCCAAGCCCACTGGTGAAACAGCTGAGTGAAGTATTTGAAACTGAAGACTCTAAATCAAA

TCTTCCCCCAGAGCCTGTTCTGCCCCCAGAGGCACCTTTATCTTCTGAATTGGACTTGCC

TCTGGGTACCCAGTTATCTGTTGAGGAACAGATGCCACCTTGGAACCAGACTGAGTTCCC

CTCCAAACAGGTGTTTTCCAAGGAGGAAGCAAGACAGCCCACAGAAACCCCTGTGGCCAG

CCAGAGCTCCGACAAGCCCTCAAGGGACCCTGAGACTCCCAGATCTTCAGGTTCTATGCG

CAATAGATGGAAACCAAACAGCAGCAAGGTACTAGGGAGATCCCCCCTCACCATCCTGCA

GGATGACAACTCCCCTGGCACCCTGACACTACGACAGGGTAAGCGGCCTTCACCCCTAAG

TGAAAATGTTAGTGAACTAAAGGAAGGAGCCATTCTTGGAACTGGACGACTTCTGAAAAC

TGGAGGACGAGCATGGGAGCAAGGCCAGGACCATGACAAGGAAAATCAGCACTTTCCCTT

GGTGGAGAGCTAGGCCCTGCATGGCCCCAGCAATGCAGTCACCCAGGGCCTGGTGATATC

TGTGTCCTCTCACCCCTTCTTTCCCAGGGATACTGAGGAATGGCTTGTTTTCTTAGACTC

CTCCTCAGCTACCAAACTGGGACTCACAGCTTTATTGGGCTTTCTTTGTGTCTTGTGTGT

TTCTTTTATATTAAAGGAAGTAATTTTAAATGTTACTTTAAAAAGGTAAAAAAAAAAAAA

AAAAAAAA

>AL039118

GCATTCGTAGTAAAGGTGCCCAAGAAATTATTTTGGCCATTTATTGTTTTGTCCTTTTCT

TTAAAGAACTGTTTTTTTTTCTTTTGTTTACTTTTAGACCAAAGATTGGGTTCTAGAAAA

TGCACTTGGTATACTAAGTATTAAAACAAACAAAAAGGAAAGTTGTTTCAGTTGGCAACA

CTGCCCATTCAATTGAATCAGAAGGGGACAAAATTAACGATTGCCTTCAGTTTGTGTTGT

GTATATTTTGATGTATGTGGTCACTAACAGGTCACTTTTATTTTTTCTAAATGTAGTGAA

ATGTTAATACCTATTGTACTTATAGGTAAACCTTGCAAATATGTAACCTGTGTTGCGCAA

ATGCCGCATAAATTTGAGTGATTGTTAATGTTGTCTTAAAATTTCTTGATTGTGATACTG

TGGTCATATGCCCGTGTTTGTCACTTACAAAAATGTTTACTATGAACACACAGAAATAAA

AAATAGGCTAAATTCATATAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>NM_000198

GAGGCAGTAAGGACTTGGACTCCTCTGTCCAGCTTTTAACAATCTAAGTTACGGTTACCC

TCTTCTGGGTCACGCTAGAATCAGATCTGCTCTCCAGCATCTTCTGTTTCCTGGCAAGTG

TTTCCTGCTACTTTGGATTGGCCACGATGGGCTGGAGCTGCCTTGTGACAGGAGCAGGAG

GGCTTCTGGGTCAGAGGATCGTCCGCCTGTTGGTGGAAGAGAAGGAACTGAAGGAGATCA

GGGCCTTGGACAAGGCCTTCAGACCAGAATTGAGAGAGGAATTTTCTAAGCTCCAGAACA

GGACCAAGCTGACTGTACTTGAAGGAGACATTCTGGATGAGCCATTCCTGAAAAGAGCCT

GCCAGGACGTCTCGGTCGTCATCCACACCGCCTGTATCATTGATGTCTTTGGTGTCACTC

ACAGAGAGTCCATCATGAATGTCAATGTGAAAGGTACCCAGCTACTGTTGGAGGCCTGTG

TCCAAGCCAGTGTGCCAGTCTTCATCTACACCAGTAGCATAGAGGTAGCCGGGCCCAACT

CCTACAAGGAAATCATCCAGAACGGCCACGAAGAAGAGCCTCTGGAAAACACATGGCCCA

CTCCATACCCGTACAGCAAAAAGCTTGCTGAGAAGGCTGTGCTGGCGGCTAATGGGTGGA

ATCTAAAAAATGGTGATACCTTGTACACTTGTGCGTTAAGACCCACATATATCTATGGGG

AAGGAGGCCCATTCCTTTCTGCCAGTATAAATGAGGCCCTGAACAACAATGGGATCCTGT

CAAGTGTTGGAAAGTTCTCTACAGTCAACCCAGTCTATGTTGGCAACGTGGCCTGGGCCC

ACATTCTGGCCTTGAGGGCTCTGCGGGACCCCAAGAAGGCCCCAAGTGTCCGAGGTCAAT

TCTATTACATCTCAGATGACACGCCTCACCAAAGCTATGATAACCTTAATTACATCCTGA

GCAAAGAGTTTGGCCTCCGCCTTGATTCCAGATGGAGCCTTCCTTTAACCCTGATGTACT

GGATTGGCTTCCTGCTGGAAGTAGTGAGCTTCCTACTCAGCCCAATTTACTCCTATCAAC

CCCCCTTCAACCGCCACACAGTCACATTATCAAATAGTGTGTTCACCTTCTCTTACAAGA

AGGCTCAGCGAGATCTGGCGTATAAGCCACTCTACAGCTGGGAGGAAGCCAAGCAGAAAA

CCGTGGAGTGGGTTGGTTCCCTTGTGGACCGGCACAAGGAGACCCTGAAGTCCAAGACTC

AGTGATTTAAGGATGACAGAGATGTGCATGTGGGTATTGTTAGGAAATGTCATCAAACTC

CACCCACCTGGCTTCATACAGAAGGCAACAGGGGCACAAGCCCAGGTCCTGCTGCCTCTC

TTTCACACAATGCCCAACTTACTGTCTTCTTCATGTCATCAAAATCTGCACAGTCACTGG

CCCAACCAGAACTTTCTGTCCTAATCATACACCAGAAGACAAACAATATGATTTGCTGTT

ACCAAATCTCAGTGGCTGATTCTGAACAATTGTGGTCTCTCTTAACTTGAGGTTCTCTTT

TGACTAATAGAGCTCCATTTCCCCTCTTAAATGAGAAAGCATTTCTTTTCTCTTTAATCT

CCTATTCCTTCACACAGTTCAACATAAAGAGCAATAAATGTTTTAATGCTTAA

>H05388

AAATTTTGACCCCATATAAAGAAATGTGTTATGTATGTTGTGCCTCCTTAGAGACATAAA

TTTAGTGTCAAAACATGGGAGATGGCTTACTCAGAAGCATACTCCACTTAACATACCATG

GCCTGAGCTAAGTACCATGTCCTGTTTGTGTCTTATTTTTAAATATTTTCTTTGTCCACA

TGGGCCGTTGACCTTAGAGTTAAGGCGGTTGCTTTTTTGAAGAAATCACCAAAGTTTCTG

GGAAACTATGTTCAAGGTTGAAATGGAGAGTAGATTTAATTTTATTTGTCTTGTAGGGAA

GAAATCTTCCTTTGAACCGCTTTTCTTGCTTTTTCCCTTTTTCCCAAACTAGGTTACAGG

TTCTTATCTGCAAGGTTCAAGTTGCTTAGACATTGTTTTCCAGTATTCTGCAGGGCCAGT

CAGTTGTACAGAAGTTGGAATATTCTGTTCCAGAATTAAAGAAGTTTTTAGATTATGAAA

TATTATGATAATAAAGCTATATTTCTGAAAAAAAAAAA

>NM_004062

GAAGGAGCTCTCTTCTTGCTTGGCAGCTGGACCAAGGGAGCCAGTCTTGGGCGCTGGAGG

GCCTGTCCTGACCATGGTCCCTGCCTGGCTGTGGCTGCTTTGTGTCTCCGTCCCCCAGGC

TCTCCCCAAGGCCCAGCCTGCAGAGCTGTCTGTGGAAGTTCCAGAAAACTATGGTGGAAA

TTTCCCTTTATACCTGACCAAGTTGCCGCTGCCCCGTGAGGGGGCTGAAGGCCAGATCGT

GCTGTCAGGGGACTCAGGCAAGGCAACTGAGGGCCCATTTGCTATGGATCCAGATTCTGG

CTTCCTGCTGGTGACCAGGGCCCTGGACCGAGAGGAGCAGGCAGAGTACCAGCTACAGGT

CACCCTGGAGATGCAGGATGGACATGTCTTGTGGGGTCCACAGCCTGTGCTTGTGCACGT

GAAGGATGAGAATGACCAGGTGCCCCATTTCTCTCAAGCCATCTACAGAGCTCGGCTGAG

CCGGGGTACCAGGCCTGGCATCCCCTTCCTCTTCCTTGAGGCTTCAGACCGGGATGAGCC

AGGCACAGCCAACTCGGATCTTCGATTCCACATCCTGAGCCAGGCTCCAGCCCAGCCTTC

CCCAGACATGTTCCAGCTGGAGCCTCGGCTGGGGGCTCTGGCCCTCAGCCCCAAGGGGAG

CACCAGCCTTGACCACGCCCTGGAGAGGACCTACCAGCTGTTGGTACAGGTCAAGGACAT

GGGTGACCAGGCCTCAGGCCACCAGGCCACTGCCACCGTGGAAGTCTCCATCATAGAGAG

CACCTGGGTGTCCCTAGAGCCTATCCACCTGGCAGAGAATCTCAAAGTCCTATACCCGCA

CCACATGGCCCAGGTACACTGGAGTGGGGGTGATGTGCACTATCACCTGGAGAGCCATCC

CCCGGGACCCTTTGAAGTGAATGCAGAGGGAAACCTCTACGTGACCAGAGAGCTGGACAG

AGAAGCCCAGGCTGAGTACCTGCTCCAGGTGCGGGCTCAGAATTCCCATGGCGAGGACTA

TGCGGCCCCTCTGGAGCTGCACGTGCTGGTGATGGATGAGAATGACAACGTGCCTATCTG

CCCTCCCCGTGACCCCACAGTCAGCATCCCTGAGCTCAGTCCACCAGGTACTGAAGTGAC

TAGACTGTCAGCAGAGGATGCAGATGCCCCCGGCTCCCCCAATTCCCACGTTGTGTATCA

GCTCCTGAGCCCTGAGCCTGAGGATGGGGTAGAGGGGAGAGCCTTCCAGGTGGACCCCAC

TTCAGGCAGTGTGACGCTGGGGGTGCTCCCACTCCGAGCAGGCCAGAACATCCTGCTTCT

GGTGCTGGCCATGGACCTGGCAGGCGCAGAGGGTGGCTTCAGCAGCACGTGTGAAGTCGA

AGTCGCAGTCACAGATATCAATGATCACGCCCCTGAGTTCATCACTTCCCAGATTGGGCC

TATAAGCCTCCCTGAGGATGTGGAGCCCGGGACTCTGGTGGCCATGCTAACAGCCATTGA

TGCTGACCTCGAGCCCGCCTTCCGCCTCATGGATTTTGCCATTGAGAGGGGAGACACAGA

AGGGACTTTTGGCCTGGATTGGGAGCCAGACTCTGGGCATGTTAGACTCAGACTCTGCAA

GAACCTCAGTTATGAGGCAGCTCCAAGTCATGAGGTGGTGGTGGTGGTGCAGAGTGTGGC

GAAGCTGGTGGGGCCAGGCCCAGGCCCTGGAGCCACCGCCACGGTGACTGTGCTAGTGGA

GAGAGTGATGCCACCCCCCAAGTTGGACCAGGAGAGCTACGAGGCCAGTGTCCCCATCAG

TGCCCCAGCCGGCTCTTTCCTGCTGACCATCCAGCCCTCCGACCCCATCAGCCGAACCCT

CAGGTTCTCCCTAGTCAATGACTCAGAGGGCTGGCTCTGCATTGAGAAATTCTCCGGGGA

GGTGCACACCGCCCAGTCCCTGCAGGGCGCCCAGCCTGGGGACACCTACACGGTGCTTGT

GGAGGCCCAGGATACAGATGAGCCGAGACTGAGCGCTTCTGCACCCCTGGTGATCCACTT

CCTAAAGGCCCCTCCTGCCCCAGCCCTGACTCTTGCCCCTGTGCCCTCCCAATACCTCTG

CACACCCCGCCAAGACCATGGCTTGATCGTGAGTGGACCCAGCAAGGACCCCGATCTGGC

CAGTGGGCACGGTCCCTACAGCTTCACCCTTGGTCCCAACCCCACGGTGCAACGGGATTG

GCGCCTCCAGACTCTCAATGGTTCCCATGCCTACCTCACCTTGGCCCTGCATTGGGTGGA

GCCACGTGAACACATAATCCCCGTGGTGGTCAGCCACAATGCCCAGATGTGGCAGCTCCT

GGTTCGAGTGATCGTGTGTCGCTGCAACGTGGAGGGGCAGTGCATGCGCAAGGTGGGCCG

CATGAAGGGCATGCCCACGAAGCTGTCGGCAGTGGGCATCCTTGTAGGCACCCTGGTAGC

AATAGGAATCTTCCTCATCCTCATTTTCACCCACTGGACCATGTCAAGGAAGAAGGACCC

GGATCAACCAGCAGACAGCGTGCCCCTGAAGGCGACTGTCTGAATGGCCCAGGCAGCTCT

AGCTGGGAGCTTGGCCTCTGGCTCCATCTGAGTCCCCTGGGAGAGAGCCCAGCACCCAAG

ATCCAGCAGGGGACAGGACAGAGTAGAAGCCCCTCCATCTGCCCTGGGGTGGAGGCACCA

TCACCATCACCAGGCATGTCTGCAGAGCCTGGACACCAACTTTATGGACTGCCCATGGGA

GTGCTCCAAATGTCAGGGTGTTTGCCCAATAATAAAGCCCCAGAGAACTGGGCTGGGCCC

TATGGGATTGGTA

>AA782845

TCTTTACCTATGTGAAGCGAGGTGACGTGATACGTCACTGGCGCCGTCTTATAATTTAGA

TGTAAAAATCTTTAGAAACAAATAAAACTCTCTATATATGTGTATGTCTGTGTACAAAAA

AATGACAGAGCTGATGGCCAGTGTATACAGAGCGTGGCCCGCGGTGTACAATACCCATAT

AAGGTACATTGTGCAGGAGGGGAATTGCTGGCTGCTTTTACTTCCTGACCAAGACTGAAA

AATTATTTACTGAAATCTGTAAACCTTTTTATGAAACTTTTAAGCACCAGGCTGTTTACT

TACACAATTTAGGTCTGCCAGAAAATTCTATCTGTGATAGATCTGTAAAGAGGGTCAGGG

GTTAGAGTTTACTATTTTTGAAGTTTACATTGTTACATATGAAATGGAAACATTATTTTG

AAACGTTGTCATAACCCAATGGTGCATTCTGTAACCATGGAGTCTTCTGTTTCCTGGGGG

AAAGGGGCATTCATGACCTGAACTTTTTAGCAAATTATTATTCTCAGTTTCCATTACCTG

TTTGGCCAAACAGATTAATAAAATATTTGAAAAAGAAGCAATAAAAAAAAAA

>AI457360

CTGAGAAAGTCCGGTCCCTATAAGGGGACATCAGTGCGAGACCTGCTCCGTGCTGTGAGN

ACAAGAGGCACCATACAAGNAAGCTCCCAGTTGAGGTGCGACAGGCACTCGCCNAAGTCC

NTGATGGCTTCGTCCAGTACTCACAAAACGGCTCCCCCCGGCTGGTCCTTCACACGCACC

GAGCCATGAGGAGCTGGCGCCTCTGAGAGCCTCTTCCTGCCCTACTACCCGCCAGACTCA

GAGGCCAGGAGGCCATGCCCTGGGGCCACAGGGAGGTGAGGTGGGCTGGATGCCACACAG

ATGGTCTCCGTGCTGGCTCACTGAAGAGCTGAGCCTGTGGCTGGCCTCAGAATCAGGCTG

GGTGCAGTGGCTCACACCTGTAATCCCAGCATTTTGGGAGGCTGAGTGAGAGGATCACTT

GAGCTCAGGAGTTCGAGACCAGCCTGGCCAACATGGCAACACCCCATTTCTACAAAAAAT

TTGTAAAATTAGCCAGGCATGGTGGCGCACGCCTGTAGTCCCAGCTGCTTGGGAGGCTGA

GGTGGGAGAATCACTTGAGCCCAGGAGTTCGAGGCTGCAGTGAGCCAGGATCATGCCACT

GCACTCCAGCCTGGTCCACAGAGAGACACTGTCACCCCCTTTCCCCCACAAGACTGGCAG

AGGCTGGGCAGCCTGGGGCTGATGAAGCAGAGATGTTCGCTGGATCCCAGGCCCTGGCAC

CCCTCAGGAAATACAAGAAAAAGAATATTCACATCTGTTTAATGTGCATAAAGCCAAGGA

AAGGACAGTTCCGAATTCAAAAAAAAAAAAAAAAAAAA

>BF446419

TTTTTTTTTTTTTTTTTAAATATTTAACTTATTTATTTAACAAAGTAGAAGGGAATCCAT

TGCTAGCTTTTCTGTGTTGGTGTCTAATATTTGGGTAGGGTGGGGGATCCCCAACAATCA

GGTCCCCTGAGATAGCTGGTCATTGGGCTGATCATTGCCAGAATCTTCTTCTCCTGGGGT

CTGGCCCCCCAAAATGCCTAACCCAGGACCTTGGGAATTCTACTCATCCCAAATGATAAT

TCCAAATGCTGTTACCCAAGGTTAGGGTGTTGAAGGAAGGTAGAGGGTGGGGCTTCAGGT

CTCAACGGCTTCCCTAACCACCCCTCTTCTCTTGGCCCAGCCTGGTTCCCCCCACTTCCA

CTCCCCTCTACTCTCTCTAGGACTGGGCTGATGAAGGCACTGCCCAAAATTTCCCCTACC

CCCAACTTTCCCCTACCCCCAACTTTCCCCACCAGCTCCACAACCCTGTTTGGAGCTACT

GCAGGACCAGAAGCACAAAGTGCGGTTTCCCAAGCCTTTGTCCATCTCAGCCCCCAGAGT

ATATCTGTGCTTGGGGAATCTCACACAGAAACTCAGGAGCACCCCCTGCCTGAGCTAAGG

GAGGTCTTATCTCTCAGGGGGGGTTTAAGTGCCGTTTGCAATAATGTCGTCTTATTTATT

TAGCGGGGTGAATATTTTATACTGTAAGTGAGCAATCAGAGTATAATGTTTATGGTGACA

AAATTAAAGGCTTTCTTATATGTTTAAAAAAAA

>BC006819

GCCTTATAAAGCACCAAGAGGCTGCCAGTGGGACATTTTCTCGGCCCTGCCAGCCCCCAG

GAGGAAGGTGGGTCTGAATCTAGCACCATGACGGAACTAGAGACAGCCATGGGCATGATC

ATAGACGTCTTTTCCCGATATTCGGGCAGCGAGGGCAGCACGCAGACCCTGACCAAGGGG

GAGCTCAAGGTGCTGATGGAGAAGGAGCTACCAGGCTTCCTGCAGAGTGGAAAAGACAAG

GATGCCGTGGATAAATTGCTCAAGGACCTGGACGCCAATGGAGATGCCCAGGTGGACTTC

AGTGAGTTCATCGTGTTCGTGGCTGCAATCACGTCTGCCTGTCACAAGTACTTTGAGAAG

GCAGGACTCAAATGATGCCCTGGAGATGTCACAGATTCCTGGCAGAGCCATGGTCCCAGG

CTTCCCAAAAGTGTTTGTGGCAATTATTCCCCTAGGCTGAGCCTGCTCATGTACCTCTGA

TTAATAAATGCTTATGAAATGAAAAAAAAAAAAAAA

>AA765597

CCAGCAAAGTCTCTTTTGACCACACGCTTTATCCGAGATGCTTAGAAGTATATTTGGCTG

TTTTATTTGCATCTTTGATTAAGATGTCTATCATTGTAAAAAGGTATTCAAAACAAAAGT

GTACTCTTTTATTATTATGAATCACATTGTACTGAGCTGTGAAGTCAGTGTTTTAAAAAT

GTAGAGTTTATTCATGGAGCATGCCATTGAGGTTTGGATGGTGGCAGGTAAAACAGAAAG

GCAAGATGTCATCTGACATTAGGCTACTTATAAATAAATGTTTATCTAGCTTTTATTTCA

TGCCCTAATGAATAAAACATGCTTCGAAAAAGAAAGTAAAAAAAAAAAACAAAA

>X78202

GGCGAGAGAGACGCTCCCGCTCGCCGCCAGCTCTGATTGGCCCAGCGGTAGGAAAGGTTA

AACCAAAAATTTTTTTACAGCCCTAGTGTGCGCCTGTAGCTCGGAAAATTAATTGTGGCT

ATAGCCGCCTCGATCGCTGTCTCCCCAGCCTCGCCGCGGACGCTCCGGGACGCGCCCGCC

CGCCGCCCGGTTCTCCCCCCCTTTGGGCTGGTGCTGCTGCTGCTGTGACTGCTGCTGCGA

AAGGAGGAGGAGGAGGAGGAAGCAGCGGGGGGGGGAGCGGTGGGTGTGGGGGAAACCAAG

AGTACAGTGGACGAGGACTCACCCCGGCGTGGTGTTCTTTTTTCTTCTTCTTTTTCTTTC

CTTTTTTTTTTTTTTTTCTAATTCCTGAGGGGTGGTTGCTGCTTTTGCTACATGACTTGC

CAGCGCCCGAGCCTGCGGTCCAACTGCGCTGCTGCCGGAGCGCTCAGTGCCGCCGCTGCC

GCCCGTGCCCCCCGCGCCCCGTTCGGCACCCACCGGTCGCCGCCCCGCCCGCGCGCCGCT

GTCCCGCTCCCGCGCCGCCGCCGCCGTTTCCCCCCGACGACTGGGTGATGCTGGACATGG

GAGATAGGAAAGAGGTGAAAATGATCCCCAAGTCCTCGTTCAGCATCAACAGCCTGGTGC

CCGAGGGCCTCCAGAACGACAACCACCACGCGAGCCACGGCCACCACAACAGCCACCACC

CCCAGCACCACCACCACCACCACCACCATCACCACCACCCGCCGCCGCCCGCCCCGCAAC

CGCCGCCGCCGCCGCAGCAGCAGCAGCCGCCGCCGCCGCCGAGACGCGGGGCCCGGCGCC

GACGACGACGAGGCCCCAGCAGTTGTTGTTCCGCCGCGCACGCACACGGCGCGCCTGAGG

GCCAACGGCAGCTGGCGCAAGGCGACCGGCGCGGCCGGGGGATCTGCCCCGTCGGGCCGG

ACGAGAAGGAGAAGGCCCGCGCCGGGGGGGAGGAGAAGAAGGGGGCGGGCGAGGGCGGCA

AGGACGGGGAGGGGGGCAAGGAGGGCGAGAAGAAGAACGGCAAGTACGAGAAGCCGCCGT

TCAGCTACAACGCGCTCATCATGATGGCCATGCGGCAGAGCCCCGAGAAGCGGCTCACGC

TCAACGGCATCTACGAGTTCATCATGAAGAACTTCCCTTACTACCGCGAGAACAAGCAGG

GCTGGCAGAACTCCATCCGCCACAATCTGTCCCTCAACAAGTGCTTCGTGAAGGTGCCGC

GCCACTACGACGACCCGGGCAAGGGCAACTACTGGATGCTGGACCCGTCGAGCGACGACG

TGTTCATCGGCGGCACCACGGGCAAGCTGCGGCGCTCCACCACCTCGCCGGCCAAGCCGG

CCTTCAAGCGCGGTGCCGCGCTCACCTCCACCGGCCTCACCTTCATGGACGCGCCGGCTC

CCTCTACTGGCCCATGTCGCCCTTCCTGTCCCTGCACCACCCCCGCCAGCAGCACTTTGA

GTTACAACGGGACCACGTCGGCCTACCCCAGCCACCCCATGCCCTACAGCTCCGTGTTGA

CTCAAAACTCGCTGGGCAACAACCACTCCTCCTCCACCGCCAACGGGCTGAGCGTGGACC

GGCTGGTCAACGGGGGAATCCCGTACGCCACGCACCACCTCACGGCCGCCGCGCTAACCG

CCTCGGTGCCCTGCGGCCTGCTGGTGCCCTGCTCTGGGACCTACTCCCTCAACCCCTGCT

CCGTCAACCTGCTCGCGGGCCAGACCAGTTACTTTTTCCCCCACGTCCCGCACCCGTCAA

TGACTTCGCAGAGCAGCACGTCCATGAGCGCCAGGGCCGCGTCCTCCTCCACGTCGCCGG

CAGGCCCCCCTCGACCCCTGCCCTGTGAGTCTTTAAGACCCTCTTTGCCAAGTTTTACGA

CGGGACTGTCTGGGGGACTGTCTGATTATTTCACACATCAAAATCAGGGGTCTTCTTCCA

ACCCTTTAATACATTAACATCCCTGGGACCAGACTGTAAGTGAACGTTTTACACACATTT

GCATTGTAAATGATAATTAAAAAAATAAGTCCAGGTATTTTTTATTAAGCCCCCCCCTCC

CATTTCTGTACGTTTGTTCAGTCTCTAGGGTTGTTTATTATTCTAACAAGGTGTGGAGTG

TCAGCGAGGTGCAATGTGGGGAGAATACATTGTAGAATATAAGGTTTGGAAGTCAAATTA

TAGTAGAATGTGTATCTAAATAGTGACTGCTTTGCCATTTCATTCAAACCTGACAAGTCT

ATCTCTAAGAGCCGCCAGATTTCCATGTGTGCAGTATTATAAGTTATCATGGAACTATAT

GGTGGACGCAGACCTTGAGAACAACCTAAATTATGGGGAGAATTTTAAAATGTTAAACTG

TAATTTGTATTTAAAAAGCATTCGTAGTAAAGGTGCCCAAGAAATTATTTTGGCCATTTA

TTGTTTTCTCCTTTTCTTTAAAGAACTGTTTTTTTTTCTTTTGTTTACTTTTAGACCAAA

GATTGGGCGGTTCTAGAAAATGCGCCTTGGTATACTAAGTATTAAAACAAACAAAAAGGA

AAGTTGTTTCAGTTAACGCTGCCCATTCAATTGAATCAGAAGGGGACAAAATTAACGATT

GCCTTCAGTTTGTGTTGTGTATATTTTGATGTATGTGGTCACTAACAGGTCACTTTTATT

TTTTCTAAATGTAGTGAAATGTTAATACCTATTGTACTTATAGGTAAACCTTGCAAATAT

GTAACCTGTGTTGCGCAAATGCCGCATAAATTTGAGTGATTGTTAATGTTGTCTTAAAAT

TTCTTGATTGTGACTATGTGGTCATATGCCCGTGTTTGTCACTTACAAAAATGTTTACTA

TGAACACACATAAATAAAAAATAG

>AK026790

AAAATGCTTACTCTTGTGGGCTACTTGTTGTGTGGAAAAAGGAAAACGGATTCATTTTCC

CATCGGCGACTTTATGACGACAGAAATGAACCAGTTCTGCGATTAGACAATGCACCGGAA

CCTTATGATGTGAGTTTTGGGAATTCTAGCTACTACAATCCAACTTTGAATGATTCAGCC

ATGCCAGAAAGTGAAGAAAATGCACGTGATGGCATTCCTATGGATGACATACCTCCACTT

CGTACTTCTGTATAGAACTAACAGCAAAAAGGCGTTAAACAGCAAGTGTCATCTACATCC

TAGCCTTTTGACAAATTCATCTTTCAAAAGGTTACACAAAATTACTGTCACGTTGGATTT

TGTCAAGGAGAATCATAAAAGCAGGAGACCAGTAGCAGAAATGTAGACAGGATGTATCAT

CCAAAGGTTTTCTTTCTTACAATTTTTGGCCATCCTGAGGCATTTACTAAGTAGCCTTAA

TTTGTATTTTAGTAGTATTTTCTTAGTAGAAAATATTTGTGGAATCAGATAAAACTAAAA

GATTTCACCATTACAGCCCTGCCTCATAACTAAATAATAAAAATTATTCCACCAAAAAAT

TCTAAAACAATGAAGATGACTCTTTACTGCTCTGCCTGAAGCCCTAGTACCATAATTCAA

GATTGCATTTTCTTAAATGAAAATTGAAAGGGTGCTTTTTAAAGAAAATTTGACTTAAAG

CTAAAAAGAGGACATAGCCCAGAGTTTCTGTTATTGGGAAATTGAGGCAATAGAAATGAC

AGACCTGTATTCTAGTACGTTATAATTTTCTAGATCAGCACACACATGATCAGCCCACTG

AGTTATGAAGCTGACAATGACTGCATTCAACGGGGCCATGGCAGGAAAGCTGACCCTACC

CAGGAAAGTAATAGCTTCTTTAAAAGTCTTCAAAGGTTTTGGGAATTTTAACTTGTCTTA

ATATATCTTAGGCTTCAATTATTTGGGTGCCTTAAAAACTCAATGAGAATCATGGTAAAA

AAAAAAAGTTAACCAAAGAATATACCTGTACATAATTTGTACAGTTTTAAGTTGTTAGAT

AGGAACTGGATTTCTTATGTATTAGACATTATTGCTCAATCATAATGGAATAGATTCTGC

ATCCCTAAATGTATGAACCATAAGGTTAAAAAAGATGAATGGAAATATCAAACAACTTTT

CACTGAGCATCAGTTTCATAATCAATAATATAAGAAGATTAATTTGGATTCTAGTATGTT

TCAGTTTGTTTTTAATTACCACCTTCCTTTGGTAGAAAAAATATGTTCCTTGATGTAGGA

AAGTCTAGGTTTTAGAGATTAGAGGATGAGATCAAGAGTTAAATTCCTAAAGAAGCACTG

AATATATGAAGAGAGCAAACAAATCAAGTACCAACCTAGAGGCTTTATTTTTGAATTGAT

TCATGGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTAACACAGAAACAGCT

TTCAGAAAATAAGGGATAGAAAGTAATGAAGAAAGTACTTACCCCATATTGCCATAAAAA

TAGCAAAGAAGACTGTCCCTCCATTATCGAACAAATATGTCACCTGAGTAGAAAACAAAC

AGAAATATTAGTCATGCAAATTGATTATAATAAGCCAGTGAATACTGTTTGCACTCAGGT

ACTATGATTTTTTCTCAAATAGAATCATATTATTTTATAGTACAGAAATATTATATATGA

ATTCCTTTCATGGGTCTTGCAACAATTTCACATGATTTTTCTCATGGGGAGAGGTGAAGA

AACAACATTAGCCCTCTTCTCTCCTCTCTTGATTCCCTTTATACCCCACCATCATTTCTG

ATTATAAATAATTCTACCATTCTATGGAAGTATTTGTGGGTCACAGATTGTCAAACTACT

TAATGAAAGTTGTATGAAATTAGTTTTTCAGGTGAGGCATTCCTAGTTGCAATTCCTGTT

AGCAAAACTTCTAGGAGTGGGGAAGTTGGAAAATGCAGGATTCTTCCAGTGAGCCAGCAT

TTCCCATAGCTAACCCTATTCTCTTAGTCTTTCAAAATGTAGAATGGGTCCAATAATGGC

TATAAGATGTAATAAATCCCATCTTAATTTGTTTTAAAAGTTTCATAAATCACTGAACAC

TTATGAAACAAAGTGTTTTTTAATCAGATATCAACTGAAACTTCATAAAGGATGCATAGT

TTTATAATGTTATTGAATCAAATTTTAAGGCTTGTATTGTTTGATTTTAATAAAGTATAA

TCTCCTTTTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>BC012727

GGCACGAGGCTGCCTGCCCCCCGGGTGGGGCTGCGGCTCTGGCCTCCCAGGCCCATCCTC

AACAGCTACCCCAGCCAACACCAAGGCCACAAGGGGACCCCGGCCTAGGAGGCAGGAAGC

CAAGGTACAGAGAGCAGCCTGGCCCTCACCAGTGCGCAAGCTGGGGCAGCAAGGCTGACA

GTTGCTGCATGCCCAGGGCAGGGTGTGGTACTGGCACCCAAGTTCAGCATGGCAGAGCTG

GCCAACAGCTTGTCCCCGATCTGCCTCCAGCCCCAAGATGCCTACAGCCCCCAGGCCCCT

TCGGCAGCACTGCCTCTGCCCACCTGCCTTTAAGAGACTCCAGGGCTGCTCCTGTCATGC

AGCGAAGGTTTTGTCTGTTTCAAAGTTCGAGACTCAACTTGAGGGACTGTTTTTGACAAT

CCCCGCTGACCTCCGCTCCTCGTGGCGCCCTGGCCCTACACCCAGCCTGGCCCAGGGCCG

GCTTTGCCTGGTGAGGCTGGAGGGAGCACCAGGACCTGCTGTCTGCTGTCAGCCCCTCCT

GGTGCTGGTGCCCTGATGCTGTGCCTTGTCACCCATTGAGCTGCAAGAGGGACCAAGAGG

GGGCCACGCAGCCAGCCAGATGCCTGGCCCTGTGCTGGGGCAGACAACGCTGCAGAGCCC

AGGGAGCCTGGCGCTAGGACGTGCGTCCTTGTGACACTGGCCTGTCTGAACTCACCTGGC

CTGGGAAGCACCGTCTGCCCGGGCCCAAGCCCTGCCCCTCCAGAGTCCAGAGCCAGGAAG

GGGCTGCTGAGGGCGAGCATCCTGCTGGGCTCTCTGCCCGGCCCACCCCTCCAAGGGGCT

GGCCTGTGAGCCTTGACTGGGATTCATGATGTGGAGGCCCCCAACTTCCAGAAGCAGCTG

GTACTCTGCTCACACAAGCGACTGGGCCGGCCGGCCCTGGACCCCTAGACCCCGAGCCGC

CTGCCGACTGCCTGCACAGGGAGAGCAGTTGAGGCCCGGGCAGGGCCCCCACACCAGACC

CCAACATAGCTTCCCCACCCAGGCACCCCCTCCCGGGGCAGCAGGCGTGGGAGTCAGGGC

TGCATGCTCCTCCCCTCCCACCTCACAGGCGGCCTTAGGCAAGTCATTTTCTGTCATCAC

AAGGTCGCCTCTGCCTAGTCAGGTCCTGGCGTCCAGAGTAAGGATGTGCGGCCCCCAGGC

CCCCGCACACCTCCCTCAGCACCAAGACCGGGACCCCCCCACCCACGTGTCTCATTGTGG

CTGCCTATGGACTCCCGGGCCTTGTGTGCAGGCCAGGCCCTTCCACTGATTTTTTAAAGT

GAACCATTGCTGGATCTCAGATTCTGTGGCATCTAAGGCCTAGCAGGGGTGGGCACACGG

GTCACCCGAGGCCCATACCAAGACTCTGTTCCTGCCCTAGGCCCAGTCTCAAAGGAAGCC

ACAAGGCGCGGGGGCCACTGAGGAAGGAAATGTTCATTTTCATTTGTCCAAAACCACCTT

AAGTTTTAAGTATATTAATCTTGATGCTTTTTAACTATTGCTTTTTAACTTGCTGAGATT

TAGAAATACTGTTATAAAAACTTTTTTAATTTCTGTATTTTTTTTCTGTATTGTATCTTC

ATGGGACATTAGGGGTTTTCTATGGTAAGCACACCTATGGTTTTGGTAAAAACATTATCA

AATATATATCCAGACGGTTCTTCCCTAGAAGAAAAACAAGTCTTTACACCTGATAAAATA

TTTTGCGAAGAGAGGTGTTCTTTTTCCTTACTGGTGCTGAAAGGAAGGATGGATAACGAG

GAGAAAATAAAACTGTGAGGCTCAAAAAAAAAAAAAAAAAA

>R45389

CCTGCCCTTCTCTATATGTACCATCTCCAAAAACCATGTACATCTCCAAAAACTGGAGTA

GAAAGTTAGATTGCTCAACTACAACTCCTCTAGAACTCTATAGCTCTGACATACAGATTC

ACACTCTCCTCTATTTGCTAAGTATGTAAAGAATGTTTTCTTTTAAAATGTTCTCTTTTG

AGAACAACTGCTTATTTGTTATAAAAGCATTTGGTTAAAATGATGTCATCATAAAGAACA

GTGGCTTTGTTTCAATACATATTTTTGAGATGATTATCTAGAAGCCAGATTAATAAAATC

AGCTTGTGACCTTGCTAAGCATATAAACTGGAAATTCAGATACATTCAAAATTATGGGTT

CATTTAAAAGTGTTCTACCTTTTGGGTATGAGACTAATATCACTAATTCCTCAATAGTTA

TCATGGCTCTATCTTAATTAATTAGAAAATATGTGTGTTTAATTCTTTGAGAATTAAAAT

AGAGAATATTAACAGAGGGTTAAAAACTGCTTCAACTCCAATAAGATAAAGGAAGCTCAA

AATCTATGAGCTGAGTGTTCAATTAGCTTTGCCTACTGAGTTCAATTTTATGTCAATACA

ACAGTGGATCAGACAGTACGACTTTGAACTGGTGAATGTAAACAATTGTTTTTCACCTAA

GCTGCTTTGGAAGAACTGATGCTTGCTGCTAACTAAAGTTTTGGATGTATCGATTTAGAG

AACCAATTAATACCTGCAAAATAAAGCATACTGTGGTACTTCTGTTTGATCTAGTATGTG

TGATTTTAGATTGATGGATTAAAAATTAATAAAGATCATACATTCCATACCAAAAAAAAA

AAAAAAAA

>BC006811

CCAGAAGCCTGCATTTCTGCATTCTGCTTAATTCCCTTTCCTTAGATTTGAAAGAAGCCA

ACACTAAACCACAAATATACAACAAGGCCATTTTCTCAAACGAGAGTCAGCCTTTAACGA

AATGACCATGGTTGACACAGAGATGCCATTCTGGCCCACCAACTTTGGGATCAGCTCCGT

GGATCTCTCCGTAATGGAAGACCACTCCCACTCCTTTGATATCAAGCCCTTCACTACTGT

TGACTTCTCCAGCATTTCTACTCCACATTACGAAGACATTCCATTCACAAGAACAGATCC

AGTGGTTGCAGATTACAAGTATGACCTGAAACTTCAAGAGTACCAAAGTGCAATCAAAGT

GGAGCCTGCATCTCCACCTTATTATTCTGAGAAGACTCAGCTCTACAATAAGCCTCATGA

AGAGCCTTCCAACTCCCTCATGGCAATTGAATGTCGTGTCTGTGGAGATAAAGCTTCTGG

ATTTCACTATGGAGTTCATGCTTGTGAAGGATGCAAGGGTTTCTTCCGGAGAACAATCAG

ATTGAAGCTTATCTATGACAGATGTGATCTTAACTGTCGGATCCACAAAAAAAGTAGAAA

TAAATGTCAGTACTGTCGGTTTCAGAAATGCCTTGCAGTGGGGATGTCTCATAATGCCAT

CAGGTTTGGGCGGATGCCACAGGCCGAGAAGGAGAAGCTGTTGGCGGAGATCTCCAGTGA

TATCGACCAGCTGAATCCAGAGTCCGCTGACCTCCGGGCCCTGGCAAAACATTTGTATGA

CTCATACATAAAGTCCTTCCCGCTGACCAAAGCAAAGGCGAGGGCGATCTTGACAGGAAA

GACAACAGACAAATCACCATTCGTTATCTATGACATGAATTCCTTAATGATGGGAGAAGA

TAAAATCAAGTTCAAACACATCACCCCCCTGCAGGAGCAGAGCAAAGAGGTGGCCATCCG

CATCTTTCAGGGCTGCCAGTTTCGCTCCGTGGAGGCTGTGCAGGAGATCACAGAGTATGC

CAAAAGCATTCCTGGTTTTGTAAATCTTGACTTGAACGACCAAGTAACTCTCCTCAAATA

TGGAGTCCACGAGATCATTTACACAATGCTGGCCTCCTTGATGAATAAAGATGGGGTTCT

CATATCCGAGGGCCAAGGCTTCATGACAAGGGAGTTTCTAAAGAGCCTGCGAAAGCCTTT

TGGTGACTTTATGGAGCCCAAGTTTGAGTTTGCTGTGAAGTTCAATGCACTGGAATTAGA

TGACAGCGACTTGGCAATATTTATTGCTGTCATTATTCTCAGTGGAGACCGCCCAGGTTT

GCTGAATGTGAAGCCCATTGAAGACATTCAAGACAACCTGCTACAAGCCCTGGAGCTCCA

GCTGAAGCTGAACCACCCTGAGTCCTCACAGCTGTTTGCCAAGCTGCTCCAGAAAATGAC

AGACCTCAGACAGATTGTCACGGAACACGTGCAGCTACTGCAGGTGATCAAGAAGACGGA

GACAGACATGAGTCTTCACCCGCTCCTGCAGGAGATCTACAAGGACTTGTACTAGCAGAG

AGTCCTGAGCCACTGCCAACATTTCCCTTCTTCCAGTTGCACTATTCTGAGGGAAAATCT

GACACCTAAGAAATTTACTGTGAAAAAGCATTTTAAAAAGAAAAGGTTTTAGAATATGAT

CTATTTTATGCATATTGTTTATAAAGACACATTTACAATTTACTTTTAATATTAAAAATT

ACCATATTATGAAAAAAAAAAAAAAAA

>X05615

GCAGTGGTTTCTCCTCCTTCCTCCCAGGAAGGGCCAGGAAAATGGCCCTGGTCCTGGAGA

TCTTCACCCTGCTGGCCTCCATCTGCTGGGTGTCGGCCAATATCTTCGAGTACCAGGTTG

ATGCCCAGCCCCTTCGTCCCTGTGAGCTGCAGAGGGAAACGGCCTTTCTGAAGCAAGCAG

ACTACGTGCCCCAGTGTGCAGAGGATGGCAGCTTCCAGACTGTCCAGTGCCAGAACGACG

GCCGCTCCTGCTGGTGTGTGGGTGCCAACGGCAGTGAAGTGCTGGGCAGCAGGCAGCCAG

GACGGCCTGTGGCTTGTCTGTCATTTTGTCAGCTACAGAAACAGCAGATCTTACTGAGTG

GCTACATTAACAGCACAGACACCTCCTACCTCCCTCAGTGTCAGGATTCAGGGGACTACG

CGCCTGTTCAGTGTGATGTGCAGCATGTCCAGTGCTGGTGTGTGGACGCAGAGGGGATGG

AGGTGTATGGGACCCGCCAGCTGGGGAGGCCAAAGCGATGTCCAAGGAGCTGTGAAATAA

GAAATCGTCGTCTTCTCCACGGGGTGGGAGATAAGTCACCACCCCAGTGTTCTGCGGAGG

GAGAGTTTATGCCTGTCCAGTGCAAATTTGTCAACACCACAGACATGATGATTTTTGATC

TGGTCCACAGCTACAACAGGTTTCCAGATGCATTTGTGACCTTCAGTTCCTTCCAGAGGA

GGTTCCCTGAGGTATCTGGGTATTGCCACTGTGCTGACAGCCAAGGGCGGGAACTGGCTG

AGACAGGTTTGGAGTTGTTACTGGATGAAATTTATGACACCATTTTTGCTGGCCTGGACC

TTCCTTCCACCTTCACTGAAACCACCCTGTACCGGATACTGCAGAGACGGTTCCTCGCAG

TTCAATCAGTCATCTCTGGCAGATTCCGATGCCCCACAAAATGTGAAGTGGAGCGGTTTA

CAGCAACCAGCTTTGGTCACCCCTATGTTCCAAGCTGCCGCCGAAATGGCGACTATCAGG

CGGTGCAGTGCCAGACGGAAGGGCCCTGCTGGTGTGTGGACGCCCAGGGGAAGGAAATGC

ATGGAACCCGGCAGCAAGGGGAGCCGCCATCTTGTGCTGAAGGCCAATCTTGTGCCTCCG

AAAGGCAGCAGGCCTTGTCCAGACTCTACTTTGGGACCTCAGGCTACTTCAGCCAGCACG

ACCTGTTCTCTTCCCCAGAGAAAAGATGGGCCTCTCCAAGAGTAGCCAGATTTGCCACAT

CCTGCCCACCCACGATCAAGGAGCTCTTTGTGGACTCTGGGCTTCTCCGCCCAATGGTGG

AGGGACAGAGCCAACAGTTTTCTGTCTCAGAAAATCTTCTCAAAGAAGCCATCCGAGCAA

TTTTTCCCTCCCGAGGGCTGGCTCGTCTTGCCCTTCAGTTTACCACCAACCCAAAGAGAC

TCCAGCAAAACCTTTTTGGAGGGAAATTTTTGGTGAATGTTGGCCAGTTTAACTTGTCTG

GAGCCCTTGGCACAAGAGGCACATTTAACTTCAGTCAATTTTTCCAGCAACTTGGTCTTG

CAAGCTTCTTGAATGGAGGGAGACAAGAAGATTTGGCCAAGCCACTCTCTGTGGGATTAG

ATTCAAATTCTTCCACAGGAACCCCTGAAGCTGCTAAGAAGGATGGTACTATGAATAAGC

CAACTGTGGGCAGCTTTGGCTTTGAAATTAACCTACAAGAGAACCAAAATGCCCTCAAAT

TCCTTGCTTCTCTCCTGGAGCTTCCAGAATTCCTTCTCTTCTTGCAACATGCTATCTCTG

TGCCAGAAGATGTGGCAAGAGATTTAGGTGATGTGATGGAAACGGTACTCGACTCCCAGA

CCTGTGAGCAGACACCTGAAAGGCTATTTGTCCCATCATGCACGACAGAAGGAAGCTATG

AGGATGTCCAATGCTTTTCCGGAGAGTGCTGGTGTGTGAATTCCTGGGGCAAAGAGCTTC

CAGGCTCAAGAGTCAGAGATGGACAGCCAAGGTGCCCCACAGACTGTGAAAAGCAAAGGG

CTCGCATGCAAAGCCTCATGGGCAGCCAGCCTGCTGGCTCCACCTTGTTTGTCCCTGCTT

GTACTAGTGAGGGACATTTCCTGCCTGTCCAGTGCTTCAACTCAGAGTGCTACTGTGTTG

ATGCTGAGGGTCAGGCCATTCCTGGAACTCGAAGTGCAATAGGGAAGCCCAAGAAATGCC

CCACGCCCTGTCAATTACAGTCTGAGCAAGCTTTCCTCAGGACGGTGCAGGCCCTGCTCT

CTAACTCCAGCATGCTACCCACCCTTTCCGACACCTACATCCCACAGTGCAGCACCGATG

GGCAGTGGAGACAAGTGCAATGCAATGGGCCTCCTGAGCAGGTCTTCGAGTTGTACCAAC

GATGGGAGGCTCAGAACAAGGGCCAGGATCTGACGCCTGCCAAGCTGCTAGTGAAGATCA

TGAGCTACAGAGAAGCAGCTTCCGGAAACTTCAGTCTCTTTATTCAAAGTCTGTATGAGG

CTGGCCAGCAAGATGTCTTCCCGGTGCTGTCACAATACCCTTCTCTGCAAGATGTCCCAC

TAGCAGCACTGGAAGGGAAACGGCCCCAGCCCAGGGAGAATATCCTCCTGGAGCCCTACC

TCTTCTGGCAGATCTTAAATGGCCAACTCAGCCAATACCCGGGGTCCTACTCAGACTTCA

GCACTCCTTTGGCACATTTTGATCTTCGGAACTGCTGGTGTGTGGATGAGGCTGGCCAAG

AACTGGAAGGAATGCGGTCTGAGCCAAGCAAGCTCCCAACGTGTCCTGGCTCCTGTGAGG

AAGCAAAGCTCCGTGTACTGCAGTTCATTAGGGAAACGGAAGAGATTGTTTCAGCTTCCA

ACAGTTCTCGGTTCCCTCTGGGGGAGAGTTTCCTGGTGGCCAAGGGAATCCGGCTGAGGA

ATGAGGACCTCGGCCTTCCTCCGCTCTTCCCGCCCCGGGAGGCTTTCGCGGAGTTTCTGC

GTGGGAGTGATTACGCCATTCGCCTGGCGGCTCAGTCTACCTTAAGCTTCTATCAGAGAC

GCCGCTTTTCCCCGGACGACTCGGCTGGAGCATCCGCCCTTCTGCGGTCGGGCCCCTACA

TGCCACAGTGTGATGCGTTTGGAAGTTGGGAGCCTGTGCAGTGCCACGCTGGGACTGGGC

ACTGCTGGTGTGTAGATGAGAAAGGAGGGTTCATCCCTGGCTCACTGACTGCCCGCTCTC

TGCAGATTCCACAGTGCCCGACAACCTGCGAGAAATCTCGAACCAGTGGGCTGCTTTCCA

GTTGGAAACAGGCTAGATCCCAAGAAAACCCATCTCCAAAAGACCTGTTCGTCCCAGCCT

GCCTAGAAACAGGAGAATATGCCAGGCTGCAGGCATCGGGGGCTGGCACCTGGTGTGTGG

ACCCTGCATCAGGAGAAGAGTTGCGGCCTGGCTCGAGCAGCAGTGCCCAGTGCCCAAGCC

TCTGCAATGTGCTCAAGAGTGGAGTCCTCTCTAGGAGAGTCAGCCCAGGCTATGTCCCAG

CCTGCAGGGCAGAGGATGGGGGCTTTTCCCCAGTGCAATGTGACCAGGCCCAGGGCAGCT

GCTGGTGTGTCATGGACAGCGGAGAAGAGGTGCCTGGGACGCGCGTGACCGGGGGCCAGC

CCGCCTGTGAGAGCCCGCGGTGTCCGCTGCCATTCAACGCGTCGGAGGTGGTTGGTGGAA

CAATCCTGTGTGAGACAATCTCGGGCCCCACAGGCTCTGCCATGCAGCAGTGCCAATTGC

TGTGCCGCCAAGGCTCCTGGAGCGTGTTTCCACCAGGGCCATTGATATGTAGCCTGGAGA

GCGGACGCTGGGAGTCACAGCTGCCTCAGCCCCGGGCCTGCCAACGGCCCCAGCTGTGGC

AGACCATCCAGACCCAAGGGCACTTTCAGCTCCAGCTCCCGCCGGGCAAGATGTGCAGTG

CTGACTACGCGGGTTTGCTGCAGACTTTCCAGGTTTTCATATTGGATGAGCTGACAGCCC

GCGGCTTCTGCCAGATCCAGGTGAAGACTTTTGGCACCCTGGTTTCCATTCCTGTCTGCA

ACAACTCCTCTGTGCAGGTGGGTTGTCTGACCAGGGAGCGTTTAGGAGTGAATGTTACAT

GGAAATCACGGCTTGAGGACATCCCAGTGGCTTCTCTTCCTGACTTACATGACATTGAGA

GAGCCTTGGTGGGCAAGGATCTCCTTGGGCGCTTCACAGATCTGATCCAGAGTGGCTCAT

TCCAGCTTCATCTGGACTCCAAGACGTTCCCAGCGGAAACCATCCGCTTCCTCCAAGGGG

ACCACTTTGGCACCTCTCCTAGGACACGGTTTGGGTGCTCGGAAGGATTCTACCAAGTCT

TGACAAGTGAGGCCAGTCAGGACGGACTGGGATGCGTTAAGTGCCATGAAGGAAGCTATT

CCCAAGATGAGGAATGCATTCCTTGTCCTGTTGGATTCTACCAAGAACAGGCAGGGAGCT

TGGCCTGTGTCCCATGTCCTGTGGGCAGAACGACCATTTCTGCCGGAGCTTTCAGCCAGA

CTCACTGTGTCACTGACTGTCAGAGGAACGAAGCAGGCCTGCAATGTGACCAGAATGGCC

AGTATCGAGCCAGCCAGAAGGACAGGGGCAGTGGGAAGGCCTTCTGTGTGGACGGCGAGG

GGCGGAGGCTGCCATGGTGGGAAACAGAGGCCCCTCTTGAGGACTCACAGTGTTTGATGA

TGCAGAAGTTTGAGAAGGTTCCAGAATCAAAGGTGATCTTCGACGCCAATGCTCCTGTGG

CTGTCAGATCCAAAGTTCCTGATTCTGAGTTCCCCGTGATGCAGTGCTTGACAGATTGCA

CAGAGGACGAGGCCTGCAGCTTCTTCACCGTGTCCACGACGGAGCCAGAGATTTCCTGTG

ATTTCTATGCTTGGACAAGTGACAATGTTGCCTGCATGACTTCTGACCAGAAACGAGATG

CACTGGGGAACTCAAAGGCCACCAGCTTTGGAAGTCTTCGCTGCCAGGTGAAAGTGAGGA

GCCATGGTCAAGATTCTCCAGCTGTGTATTTGAAAAAGGGCCAAGGATCCACCACAACAC

TTCAGAAACGCTTTGAACCCACTGGTTTCCAAAACATGCTTTCTGGATTGTACAACCCCA

TTGTGTTCTCAGCCTCAGGAGCCAATCTAACCGATGCTCACCTCTTCTGTCTTCTTGCAT

GCGACCGTGATCTGTGTTGCGATGGCTTCGTCCTCACACAGGTTCAAGGAGGTGCCATCA

TCTGTGGGTTGCTGAGCTCACCCAGTGTCCTGCTTTGTAATGTCAAAGACTGGATGGATC

CCTCTGAAGCCTGGGCTAATGCTACATGTCCTGGTGTGACATATGACCAGGAGAGCCACC

AGGTGATATTGCGTCTTGGAGACCAGGAGTTCATCAAGAGTCTGACACCCTTAGAAGGAA

CTCAAGACACCTTTACCAATTTTCAGCAGGTTTATCTCTGGAAAGATTCTGACATGGGGT

CTCGGCCTGAGTCTATGGGATGTAGAAAAAACACAGTGCCAAGGCCAGCATCTCCAACAG

AAGCAGGTTTGACAACAGAACTTTTCTCCCCTGTGGACCTCAACCAGGTCATTGTCAATG

GAAATCAATCACTATCCAGCCAGAAGCACTGGCTTTTCAAGCACCTGTTTTCAGCCCAGC

AGGCAAACCTATGGTGCCTTTCTCGTTGTGTGCAGGAGCACTCTTTCTGTCAGCTCGCAG

AGATAACAGAGAGTGCATCCTTGTACTTCACCTGCACCCTCTACCCAGAGGCACAGGTGT

GTGATGACATCATGGAGTCCAATACCCAGGGCTGCAGACTGATCCTGCCTCAGATGCCAA

AGGCCCTGTTCCGGAAGAAAGTTATACTGGAAGATAAAGTGAAGAACTTTTACACTCGCC

TGCCGTTCCAAAAACTGATGGGGATATCCATTAGAAATAAAGTGCCCATGTCTGAAAAAT

CTATTTCTAATGGGTTCTTTGAATGTGAACGACGGTGCGATGCGGACCCATGCTGCACTG

GCTTTGGATTTCTAAATGTTTCCCAGTTAAAAGGAGGAGAGGTGACATGTCTCACTCTGA

ACAGCTTGGGAATTCAGATGTGCAGTGAGGAGAATGGAGGAGCCTGGCGCATTTTGGACT

GTGGCTCTCCTGACATTGAAGTCCACACCTATCCCTTCGGATGGTACCAGAAGCCCATTG

CTCAAAATAATGCTCCCAGTTTTTGCCCTTTGGTTGTTCTGCCTTCCCTCACAGAGAAAG

TGTCTCTGGAATCGTGGCAGTCCCTGGCCCTCTCTTCAGTGGTTGTTGATCCATCCATTA

GGCACTTTGATGTTGCCCATGTCAGCACTGCTGCCACCAGCAATTTCTCTGCTGTCCGAG

ACCTCTGTTTGTCGGAATGTTCCCAACATGAGGCCTGTCTCATCACCACTCTGCAAACCC

AACTCGGGGCTGTGAGATGTATGTTCTATGCTGATACTCAAAGCTGCACACATAGTCTGC

AGGGTCGGAACTGCCGACTTCTGCTTCGTGAAGAGGCCACCCACATCTACCGGAAGCCAG

GAATCTCTCTGCTCAGCTATGAGGCATCTGTACCTTCTGTGCCCATTTCCACCCATGGCC

GGCTGCTGGGCAGGTCCCAGGCCATCCAGGTGGGTACCTCATGGAAGCAAGTGGACCAGT

TCCTTGGAGTTCCATATGCTGCCCCGCCCCTGGCAGAGAGGCACTTCCAGGCACCAGAGC

CCTTGAACTGGACAGGCTCCTGGGATGCCAGCAAGCCAAGGGCCAGCTGCTGGCAGCCAG

GCACCAGAACATCCACGTCTCCTGGAGTCAGTGAAGATTGTTTGTATCTCAATGTGTTCA

TCCCTCAGAATGTGGCCCCTAACGCGTCTGTGCTGGTGTTCTTCCACAACACCATGGACA

GGGAGGAGAGTGAAGGATGGCCGGCTATCGACGGCTCCTTCTTGGCTGCTGTTGGCAACC

TCATCGTGGTCACTGCCAGCTACCGAGTGGGTGTCTTCGGCTTCCTGAGTTCTGGATCCG

GAGAGGTGAGTGGCAACTGGGGGCTGCTGGACCAGGTGGCGGCTCTGACCTGGGTGCAGA

CCCACATCCGAGGATTTGGCGGGGACCCTCGGCGCGTGTCCCTGGCAGCAGACCGTGGCG

GGGCTGATGTGGCCAGCATCCACCTTCTCACGGCCAGGGCCACCAACTCCCAACTTTTCC

GGAGAGCTGTGCTGATGGGAGGCTCCGCACTCTCCCCGGCCGCCGTCATCAGCCATGAGA

GGGCTCAGCAGCAGGCAATTGCTTTGGCAAAGGAGGTCAGTTGCCCCATGTCATCCAGCC

AAGAAGTGGTGTCCTGCCTCCGCCAGAAGCCTGCCAATGTCCTCAATGATGCCCAGACCA

AGCTCCTGGCCGTGAGTGGCCCTTTCCACTACTGGGGTCCTGTGATCGATGGCCACTTCC

TCCGTGAGCCTCCAGCCAGAGCACTGAAGAGGTCTTTATGGGTAGAGGTCGATCTGCTCA

TTGGGAGTTCTCAGGACGACGGGCTCATCAACAGAGCAAAGGCTGTGAAGCAATTTGAGG

AAAGTCGAGGCCGGACCAGTAGCAAAACAGCCTTTTACCAGGCACTGCAGAATTCTCTGG

GTGGCGAGGACTCAGATGCCCGCGTCGAGGCTGCTGCTACATGGTATTACTCTCTGGAGC

ACTCCACGGATGACTATGCCTCCTTCTCCCGGGCTCTGGAGAATGCCACCCGGGACTACT

TTATCATCTGCCCTATAATCGACATGGCCAGTGCCTGGGCAAAGAGGGCCCGAGGAAACG

TCTTCATGTACCATGCTCCTGAAAACTACGGCCATGGCAGCCTGGAGCTGCTGGCGGATG

TTCAGTTTGCCTTGGGGCTTCCCTTCTACCCAGCCTACGAGGGGCAGTTTTCTCTGGAGG

AGAAGAGCCTGTCGCTGAAAATCATGCAGTACTTTTCCCACTTCATCAGATCAGGAAATC

CCAACTACCCTTATGAGTTCTCACGGAAAGTACCCACATTTGCAACCCCCTGGCCTGACT

TTGTACCCCGTGCTGGTGGAGAGAACTACAAGGAGTTCAGTGAGCTGCTCCCCAATCGAC

AGGGCCTGAAGAAAGCCGACTGCTCCTTCTGGTCCAAGTACATCTCGTCTCTGAAGACAT

CTGCAGATGGAGCCAAGGGCGGGCAGTCAGCAGAGAGTGAAGAGGAGGAGTTGACGGCTG

GATCTGGGCTAAGAGAAGATCTCCTAAGCCTCCAGGAACCAGGCTCTAAGACCTACAGCA

AGTGACCAGCCCTTGAGCTCCCCAAAAACCTCACCCGAGGCTGCCCACTATGGTCATCTT

TTTCTCTAAAATAGTTACTTACCTTCAATAAAGTATCTACATGCGGTG

>X79676

AGATCTCTCCAGATCACACTGTCACGTGTACCTAGCACATCTCGAGAACTCCTTTGGGCC

GTCTGGGGCCCGGGAAGGAAGCCTGAGTTCTCAAGATTCCAGGACTGAGAGTGCCAGCTT

GTCTCAAAGCCAGGTCAATGGTTTCTTTGCCAGCCATTTAGGTGACCAAACCTGGCAGGA

ATCACAGCATGGCAGCCCTTCCCCATCTGTAATATCCAAAGCCACCGAGAAAGAGACTTT

CACTGATAGTAACCAAAGCAAAACTAAAAAGCCAGGCATTTCTGATGTAACTGATTACTC

AGACCGTGGAGATTCAGACATGGATGAAGCCACTTACTCCAGCAGTCAGGATCATCAAAC

ACCAAAACAGGAATCTTCCTCTTCAGTGAATACATCCAACAAGATGAATTTTAAAACTTT

TCCTTCATCACCTCCTAGGTCTGGAGATATCTTTGAGGTTGAACTGGCTAAAAATGATAA

CAGCTTGGGGATAAGTGTCACGGGAGGTGTGAATACGAGTGTCAGACATGGTGGCATTTA

TGTGAAAGCTGTTATTCCCCAGGGAGCAGCAGAGTCTGATGGTAGAATTCACAAAGGTGA

TCGCGTCCTAGCTGTCAATGGAGTTAGTCTAGAAGGAGCCACCCATAAGCAAGCTGTGGA

AACACTGAGAAATACAGGACAGGTGGTTCATCTGTTATTAGAAAAGGGACAATCTCCAAC

ATCTAAAGAACATGTCCCGGTAACCCCACAGTGTACCCTTTCAGATCAGAATGCCCAAGG

TCAAGGCCCAGAAAAAGTGAAGAAAACAACTCAGGTCAAAGACTACAGCTTTGTCACTGA

AGAAAATACATTTGAGGTAAAATTATTTAAAAATAGCTCAGGTCTAGGATTCAGTTTTTC

TCGAGAAGATAATCTTATACCGGAGCAAATTAATGCCAGCATAGTAAGGGTTAAAAAGCT

CTTTCCTGGACAGCCAGCAGCAGAAAGTGGAAAAATTGATGTAGGAGATGTTATCTTGAA

AGTGAATGGAGCCTCTTTGAAAGGACTATCTCAGCAGGAAGTCATATCTGCTCTCAGGGG

AACTGCTCCAGAAGTATTCTTGCTTCTCTGCAGACCTCCACCTGGTGTGCTACCGGAAAT

TGATACTGCGCTTTTGACCCCACTTCAGTCTCCAGCACAAGTACTTCCAAACAGCAGTAA

AGACTCTTCTCAGCCATCATGTGTGGAGCAAAGCACCAGCTCAGATGAAAATGAAATGTC

AGACAAAAGCAAAAAACAGTGCAAGTCCCCATCCAGAAAAGACAGTTACAGTGACAGCAG

TGGGAGTGGAGAAGATGACTTAGTGACAGCTCCAGCAAACATATCAAATTCGACCTGGAG

TTCAGCTTTGCATCAGACTCTAAGCAACATGGTATCACAGGCACAGAGTCATCATGAAGC

ACCAAGAGTCAAGAAGATACCATTTGTACCATGTTTTACTATCCTCAGGAAAAGGCCCAA

TAAACCAGAGTTTGAGGACAGTAATCCTTCCCCTCTACCACCGGATATGGCTCCTGGGCA

GAGTTATCAACCCCAATCAGAATCTGCTTCCTCTAGTTCGATGGATAAGTATCATATACA

TCACATTTCTGAACCAACTAGACAAGAAAACTGGACACCTTTGAAAAATGACTTGGAAAA

TCACCTTGAAGACTTTGAACTGGAAGTAGAACTCCTCATTACCCTAATTAAATCAGAAAA

AGGAAGCCTGGGTTTTACAGTAACCAAAGGCAATCAGAGAATTGGTTGTTATGTTCATGA

TGTCATACAGGATCCAGCCAAAAGTGATGGAAGGCTAAAACCTGGGGACCGGCTCATAAA

GGTTAATGATACAGATGTTACTAATATGACTCATACAGATGCAGTTAATCTGCTCCGGGG

ATCCAAAACAGTCAGATTAGTTATTGGACGAGTTCTAGAATTACCCAGAATACCAATGTT

GCCTCATTTGCTACCGGACATAACACTAACGTGCAACAAAGAGGAGTTGGGTTTTTCCTT

ATGTGGAGGTCATGACAGCCTTTATCAAGTGGTATATATTAGTGATATTAATCCAAGGTC

CGTCGCAGCCATTGAGGGTAATCTCCAGCTATTAGATGTCATCCATTATGTGAACGGAGT

CAGCACACAAGGAATGACCTTGGAGGAAGTTAACAGAGCATTAGACATGTCACTTCCTTC

ATTGGTATTGAAAGCAACAAGAAATGATCTTCCAGTGGTCCCCAGCTCAAAGAGGTCTGC

TGTTTCAGCTCCAAAGTCAACCAAAGGCAATGGTTCCTACAGTGTGGGGTCTTGCAGCCA

GCCTGCCCTCACTCCTAATGATTCATTCTCCACGGTTGCTGGGGAAGAAATAAATGAAAT

ATCGTACCCCAAAGGAAAATGTTCTACTTATCAGATAAAGGGATCACCAAACTTGACTCT

GCCCAAAGAATCTTATATACAAGAAGATGACATTTATGATGATTCCCAAGAAGCTGAAGT

TATCCAGTCTCTGCTGGATGTTGTGGATGAGGAGTCCCAGAATCTTTTAAACGAAAATAA

TGCAGCAGGATACTCCTGTGGTCCAGGTACATTAAAGATGAATGGGAAGTTATCAGAAGA

GAGAACAGAAGATACAGACTGCGATGGTTCACCTTTACCTGAGTATTTTACTGAGGCCAC

CAAAATGAATGGCTGTGAAGAATATTGTGAAGAAAAAGTAAAAAGTGAAAGCTTAATTCA

GAAGCCACAAGAAAAGAAGACTGATGATGATGAAATAACATGGGGAAATGATGAGTTGCC

AATAGAGAGAACAAACCATGAAGATTCTGATAAAGATCATTCCTTTCTGACAAACGATGA

GCTCGCTGTACTCCCTGTCGTCAAAGTGCTTCCCTCTGGTAAATACACGGGCGCCAACTT

AAAATCAGTCATTCGAGTCCTGCGGGTTGCTAGATCAGGAATTCCTTCTAAGGAGCTGGA

GAATCTTCAAGAATTAAAACCTTTGGATCAGTGTCTAATTGGGCAAACTAAGGAAAACAG

AAGGAAGAACAGATATAAAAATATACTTCCCTATGATGCTACAAGAGTGCCTCTTGGAGA

TGAAGGTGGCTATATCAATGCCAGCTTCATTAAGATACCAGTTGGGAAAGAAGAGTTCGT

TTACATTGCCTGCCAAGGACCACTGCCTACAACTGTTGGAGACTTCTGGCAGATGATTTG

GGAGCAAAAATCCACAGTGATAGCCATGATGACTCAAGAAGTAGAAGGAGAAAAAATCAA

ATGCCAGCGCTATTGGCCCAACATCCTAGGCAAAACAACAATGGTCAGCAACAGACTTCG

ACTGGCTCTTGTGAGAATGCAGCAGCTGAAGGGCTTTGTGGTGAGGGCAATGACCCTTGA

AGATATTCAGACCAGAGAGGTGCGCCATATTTCTCATCTGAATTTCACTGCCTGGCCAGA

CCATGATACACCTTCTCAACCAGATGATCTGCTTACTTTTATCTCCTACATGAGACACAT

CCACAGATCAGGCCCAATCATTACGCACTGCAGTGCTGGCATTGGACGTTCAGGGACCCT

GATTTGCATAGATGTGGTTCTGGGATTAATCAGTCAGGATCTTGATTTTGACATCTCTGA

TTTGGTGCGCTGCATGAGACTACAAAGACACGGAATGGTTCAGACAGAGGATCAATATAT

TTTCTGCTATCAAGTCATCCTTTATGTCCTGACACGTCTTCAAGCAGAAGAAGAGCAAAA

ACAGCAGCCTCAGCTTCTGAAGTGACATGAAAAGAGCCTCTGGATGCATTTCCATTTCTC

TCCTTAACCTCCAGCAGACTCCTGCTCTCTATCCAAAATAAAGATCACAGAGCAGCAAGT

TCATACAACATGCATGTTCTCCTCTATCTTAGAGGGGTATTCTTCTTGAAAATAAAAAAT

ATTGAAATGCTGTATTTTTACAGCTACTTTAACCTATGATAATTATTTACAAAATTTTAA

CACTAACCAAACAATGCAGATCTTAGGGATGATTAAAGGCAGCATTTGATGATAGCAGAC

ATTGTTACAAGGACATGGTGAGTCTATTTTTAATGCACCAATCTTGTTTATAGCAAAAAT

GTTTTCCAATATTTTAATAAAGTAGTTATTTATAGGCATACTTGAAACCAGTATTTAAGC

TTTAAATGACAGTAATATTGGCATAGAAAAAAGTAGCAAATGTTTACTGTATCAATTTCT

AATGTTTACTATATAGAATTTCCTGTAATATATTTATATACTTTTTCATGAAAATGGAGT

TATCAGTTATCTGTTTGTTACTGCATCATCTGTTTGTAATCATTATCTCACTTTGTAAAT

AAAAACACACCTTAAAACATGAACAAGCCAAAAAAAAAAAAAAA

>NM_006142

CCAGGCAGCAGTTAGCCCGCCGCCCGCCTGTGTGTCCCCAGAGCCATGGAGAGAGCCAGT

CTGATCCAGAAGGCCAAGCTGGCAGAGCAGGCCGAACGCTATGAGGACATGGCAGCCTTC

CCAGGCAGCAGTTAGCCCGCCGCCCGCCTGTGTGTCCCCAGAGCCATGGAGAGAGCCAGT

CTGATCCAGAAGGCCAAGCTGGCAGAGCAGGCCGAACGCTATGAGGACATGGCAGCCTTC

ATGAAAGGCGCCGTGGAGAAGGGCGAGGAGCTCTCCTGCGAAGAGCGAAACCTGCTCTCA

GTAGCCTATAAGAACGTGGTGGGCGGCCAGAGGGCTGCCTGGAGGGTGCTGTCCAGTATT

GAGCAGAAAAGCAACGAGGAGGGCTCGGAGGAGAAGGGGCCCGAGGTGCGTGAGTACCGG

GAGAAGGTGGAGACTGAGCTCCAGGGCGTGTGCGACACCGTGCTGGGCCTGCTGGACAGC

CACCTCATCAAGGAGGCCGGGGACGCCGAGAGCCGGGTCTTCTACCTGAAGATGAAGGGT

GACTACTACCGCTACCTGGCCGAGGTGGCCACCGGTGACGACAAGAAGCGCATCATTGAC

TCAGCCCGGTCAGCCTACCAGGAGGCCATGGACATCAGCAAGAAGGAGATGCCGCCCACC

AACCCCATCCGCCTGGGCCTGGCCCTGAACTTTTCCGTCTTCCACTACGAGATCGCCAAC

AGCCCCGAGGAGGCCATCTCTCTGGCCAAGACCACTTTCGACGAGGCCATGGCTGATCTG

CACACCCTCAGCGAGGACTCCTACAAAGACAGCACCCTCATCATGCAGCTGCTGCGAGAC

AACCTGACACTGTGGACGGCCGACAACGCCGGGGAAGAGGGGGGCGAGGCTCCCCAGGAG

CCCCAGAGCTGAGTGTTGCCCGCCACCGCCCCGCCCTGCCCCCTCCAGTCCCCGCCCTGC

CGAGAGGACTAGTATGGGGTGGGAGGCCCCACCCTTCTCCCCTAGGCGCTGTTCTTGCTC

CAAAGGGCTCCGTGGAGAGGGACTGGCAGAGCTGAGGCCACCTGGGGCTGGGGATCCCAC

TCTTCTTGCAGCTGTTGAGCGCACCTAACCACTGGTCATGCCCCCACCCCTGCTCTCCGC

ACCCGCTTCCTCCCGACCCCAGGACCAGGCTACTTCTCCCCTCCTCTTGCCTCCCTCCTG

CCCCTGCTGCCTCTTGATTCGTAGGAATTGAGGAGTGTCTCCGCCTTGTGGCTGAGAACT

GGACAGTGGCAGGGGCTGGAGATGGGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGCGCG

CGCGCCAGTGCAAGACCGAGACTGAGGGAAAGCATGTCTGCTGGGTGTGACCATGTTTCC

TCTCAATAAAGTTCCCCTGTGACACTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAA

>AW445220

CGGCCGCGAGGCCCTGAGATGAGGCTCCAAAGACCCCGACAGGCCCCGGCGGGTGGGAGG

CGCGCGCCCCGGGGCGGGCGGGGCTCCCCCTACCGGCCAGACCCGGGGAGAGGCGCGCGG

AGGCTGCGAAGGTTCCAGAAGGGCGGGGAGGGGGCGCCGCGCGCTGACCCTCCCTGGGCA

CCGCTGGGGACGATGGCGCTGCTCGCCTTGCTGCTGGTCGTGGCCCTACCGCGGGTGTGG

ACAGACGCCAACCTGACTGCGAGACAACGAGATCCAGAGGACTCCCAGCGAACGGACGAG

GGTGACAATAGAGTGTGGTGTCATGTTTGTGAGAGAGAAAACACTTTCGAGTGCCAGAAC

CCAAGGAGGTGCAAATGGACAGAGCCATACTGCGTTATAGCGGCCGTGAAAATATTTCCA

CGTTTTTTCATGGTTGCGAAGCAGTGCTCCGCTGGTTGTGCAGCGATGGAGAGACCCAAG

CCAGAGGAGAAGCGGTTTCTCCTGGAAGAGCCCATGCCCTTCTTTTACCTCAAGTGTTGT

AAAATTCGCTACTGCAATTTAGAGGGGCCACCTATCAACTCATCAGTGTTCAAAGAATAT

GCTGGGAGCATGGGTGAGAGCTGTGGTGGGCTGTGGCTGGCCATCCTCCTGCTGCTGGCC

TCCATTGCAGCCGGCCTCAGCCTGTCTTGAGCCACGGGACTGCCACAGACTGAGCCTTCC

GGAGCATGGACTCGCTCCAGACCGTTGTCACCTGTTGCATTAAACTTGTTTTCTGTTGAT

TAAAAAAAAAAAAAAAAA

>AK025701

TTCAGCCGGAACGTTACTCCGTGTCCACCCGGATCGTGTGTGTGATCGAGGCTGCGGAGA

CGCCTTTCACGGGGGGTGTCGAGGTGGACGTCTTCGGGAAACTGGGCCGTTCGCCTCCCA

ATGTCCAGTTCACCTTCCAACAGCCCAAGCCTCTCAGTGTGGAGCCGCAGCAGGGACCGC

AGGCGGGCGGCACCACACTGACCATCCACGGCACCCACCTGGACACGGGCTCCCAGGAGG

ACGTGCGGGTGACCCTCAACGGCGTCCCGTGTAAAGTGACGAAGTTTGGGGCGCAGCTCC

AGTGTGTCACTGGCCCCCAGGCGACACGGGGCCAGATGCTTCTGGAGGTCTCCTACGGGG

GGTCCCCCGTGCCCAACCCCGGCATCTTCTTCACCTACCGCGAAAACCCCGTACTGCGAG

CCTTCGAGCCGCTACGAAGCTTTGCCAGTGGTGGCCGCAGCATCAACGTCACGGGTCAGG

GCTTCAGCCTGATCCAGAGGTTTGCCATGGTGGTCATCGCGGAGCCCCTGCAGTCCTGGC

AGCCGCCGCGGGAGGCTGAATCCCTGCAGCCCATGACGGTGGTGGGTACAGACTACGTGT

TCCACAATGACACCAAGGTCGTCTTCCTGTCCCCGGCTGTGCCTGAGGAGCCAGAGGTCT

ACAACCTCACGGTGCTGATCGAGATGGACGGGCACCGTGCCCTGCTCAGAACAGAGGCCG

GGGCCTTCGAGTACGTGCCTGACCCCACCCTTGAGAACTTCACAGGTGGCGTCAAGAAGC

AGGTCAACAAGCTCATCCACGCCCGGGGCACCAATCTGAACAAGGCGATGACGCTGCAGG

AGGCCGAGGCCTTCGTGGGTGCCGAGCGCTGCACCATGAAGACGCTGACGGAGACCGACC

TGTACTGTGAGCCCCCGGAGGTGCAGCCCCCGCCCAAGCGGCGGCAGAAACGAGACACCA

CACACAACCTGCCCGAGTTCATTGTGAAGTTCGGCTCTCGCGAGTGGGTGCTGGGCCGCG

TGGAGTACGACACACGGGTGAGCGACGTGCCGCTCAGCCTCATCTTGCCGCTGGTCATCG

TGCCCATGGTGGTCGTCATCGCGGTGTCTGTCTACTGCTACTGGAGGAAGAGCCAGCAGG

CCGAACGAGAGTATGAGAAGATCAAGTCCCAGCTGGAGGGCCTGGAGGAGAGCGTGCGGG

ACCGCTGCAAGAAGGAATTCACAGACCTGATGATCGAGATGGAGGACCAGACCAACGACG

TGCACGAGGCCGGCATCCCCGTGCTGGACTACAAGACCTACACCGACCGCGTCTTCTTCC

TGCCCTCCAAGGACGGCGACAAGGACGTGATGATCACCGGCAAGCTGGACATCCCCGAGC

CGCGGCGGCCGGTGGTGGAGCAGGCCCTCTACCAGTTCTCCAACCTGCTGAACAGCAAGT

CTTTCCTCATCAATTTCATCCACACCCTGGAGAACCAGCGGGAGTTCTCGGCCCGCGCCA

AGGTCTACTTCGCGTCCCTGCTGACGGTGGCGCTGCACGGGAAACTGGAGTACTACACGG

ACATCATGCACACGCTCTTCCTGGAGCTCCTGGAGCAGTACGTGGTGGCCAAGAACCCCA

AGCTGATGCTGCGCAGGTCTGAGACTGTGGTGGAGAGGATGCTGTCCAACTGGATGTCCA

TCTGCCTGTACCAGTACCTCAAGGACAGTGCCGGGGAGCCCCTGTACAAGCTCTTCAAGG

CCATCAAACATCAGGTGGAAAAGGGCCCGGTGGATGCGGTACAGAAGAAGGCCAAGTACA

CTCTCAACGACACGGGGCTGCTGGGGGATGATGTGGAGTACGCACCCCTGACGGTGAGCG

TGATCGTGCAGGACGAGGGAGTGGACGCCATCCCGGTGAAGGTCCTCAACTGTGACACCA

TCTCCCAGGTCAAGGAGAAGATCATTGACCAGGTGTACCGTGGGCAGCCCTGCTCCTGCT

GGCCCAGGCCAGACAGCGTGGTCCTGGAGTGGCGTCCGGGCTCCACAGCGCAGATCCTGT

CGGACCTGGACCTGACGTCACAGCGGGAGGGCCGGTGGAAGCGCGTCAACACCCTTATGC

ACTACAATGTCCGGGATGGAGCCACCCTCATCCTGTCCAAGGTGGGGGTCTCCCAGCAGC

CGGAGGACAGCCAGCAGGACCTGCCTGGGGAGCGCCATGCCCTCCTGGAGGAGGAGAACC

GGGTGTGGCACCTGGTGCGGCCGACCGACGAGGTGGACGAGGGCAAGTCCAAGAGAGGCA

GCGTGAAAGAGAAGGAGCGGACGAAGGCCATCACCGAGATCTACCTGACGCGGCTGCTCT

CAGTCAAGGGCACACTGCAGCAGTTTGTGGACAACTTCTTCCAGAGCGTGCTGGCGCCTG

GGCACGCGGTGCCACCTGCAGTCAAGTACTTCTTCGACTTCCTGGACGAGCAGGCAGAGA

AGCACAACATCCAGGATGAAGACACCATCCACATCTGGAAGACGAACAGTTTACCGCTCC

GGTTCTGGGTGAACATCCTCAAGAACCCCCACTTCATCTTTGACGTGCATGTCCACGAGG

TGGTGGACGCCTCGCTGTCAGTCATCGCGCAGACCTTCATGGATGCCTGCACGCGCACGG

AGCATAAGCTGAGCCGCGATTCTCCCAGCAACAAGCTGCTGTACGCCAAGGAGATCTCCA

CCTACAAGAAGATGGTGGAGGATTACTACAAGGGGATCCGGCAGATGGTGCAGGTCAGCG

ACCAGGACATGAACACACACCTGGCAGAGATTTCCCGGGCGCACACGGACTCCTTGAACA

CCCTCGTGGCACTCCACCAGCTCTACCAATACACGCAGAAGTACTATGACGAGATCATCA

ATGCCTTGGAGGAGGATCCTGCCGCCCAGAAGACGCAGCTGGCCTTCCGCCTGCAGCAGA

TTGCCGCTGCACTGGAGAACAAGGTCACTGACCTCTGACCTACAATCTCCAGTGCTGCCT

TGGGACATAGGTACCTGAGGTACCTGAGAGCCCCTCAGGGGAGGAGGCCGAGTGGCTGTG

GCTGAGGCCCCCACCCTCCCCTGGAACGCGCCCCAAGCCGGAGTGGGTGCAGCCGGAACC

CGCCCAGCGTCTAGACTGTAGCATCTTCCTCTGAGCAATACCGCCGGGCACCGCACCAGC

ACCAGCCCCAGCCCCAGCTCCCTCCGGCCGCAGAACCAGCATCGGGTGTTCACTGTCGAG

TCTCGAGTGATTTGAAAATGTGCCTTACGCTGCCACGCTGGGGGCAGCTGGCCTCCGCCT

CCGCCCACGCACCAGCAGCCGCCTCCATGCCCTAGGTTGGGCCCCTGGGGGATCTGAGGG

CCTGTGGCCCCCAGGGCAAGTTCCCAGATCCTATGTCTGTCTGTCCACCACGAGATGGGA

GGAGGAGAAAAAGCGGTACGATGCCTTCCTGACCTCACCGGCCTCCCCAAGGGTGCCGGC

ACTCTGGGTGGACTCACGGCTGCTGGGCCCCACGTCAAAGGTCAAGTGAGACGTAGGTCA

AGTCCTACGTCGGGGCCCAGACATCCTGGGGTCCTGGTCTGTCAGACAGGCTGCCCTAGA

GCCCCACCCAGTCCGGGGGGACTGGGAGCAGTTCCAAGACCACCCCACCCCTTTTTGTAA

ATCTTGTTCATTGTAAATCAAATACAGCGTCTTTTTCACTCCGAAAAAAAAAAAAAAAAA

AAAAAA

>NM_033229

GATGTGGGCACGCCTCAGAGCCAGAAGTTTATGGCTCCCACCTGCTCAATCTGACAGGAA

GCTTCTGCTCCCCAGTTCTCCCCAGCCACTGTGGTCTACAGATTCCAGGAAACCCATCCC

CCTGTGACCTCAGGGTGTGCTCTGTTCTCCACCCTAGGGACCAGAAGGAGCCAGGAGTAA

AGAACTGGCTTACTTGGCCGCCACTGGGAAATTCTGGGTAATTCGAGACGCCCTGGAATT

TGGACCCACTCCGCTGATAGGTGGTGGGCAGGGTTCTAGGGAACACAAGAGGCGGAGCCA

GGTGGCTTCCCTGTGCTGGCATTCTTGGCTCTCTCTCTCTCTCTTTCTCTCTCTCTGTCT

CTCTCTCTCTCTCTGTCTCTCAGCCTTGAAGCCGTTTCCCTCTGCGATTCATGTAAGTGT

GACTCGATTTCAGGGAAAGGGAACTCGCGTGGGCTGAGGAGACCGGAGTGGACGGGCTGG

GGAAGGCACCGTGATGCCCGCAACCCCGTCCCTGAAGGTGGTCCATGAGCTGCCTGCCTG

TACCCTCTGTGCGGGGCCGCTGGAGGATGCGGTGACCGTTCCCTGTGGACACACCTTCTG

CCGGCTCTGCCTCCCCGCGCTCTCCCAGATGGGGGCCCAATCCTCGGGCAAGATCCTGCT

CTGCCCGCTCTGCCAAGAGGAGGAGCAGGCAGAGACTCCCATGGCCCCTGTGCCCCTGGG

CCCGCTGGGAGAAACTTACTGCGAGGAGCACGGCGAGAAGATCTACTTCTTCTGCGAGAA

CGATGCCGAGTTCCTCTGTGTGTTCTGCAGGGAGGGTCCCACGCACCAGGCGCACACCGT

GGGGTTCCTGGACGAGGCCATTCAGCCCTACCGGGATCGTCTCAGGAGTCGACTGGAAGC

TCTGAGCACGGAGAGAGATGAGATTGAGGATGTAAAGTGTCAAGAAGACCAGAAGCTTCA

AGTGCTGCTGACTCAGATCGAAAGCAAGAAGCATCAGGTGGAAACAGCTTTTGAGAGGCT

GCAGCAGGAGCTGGAGCAGCAGCGATGTCTCCTGCTGGCCAGGCTGAGGGAGCTGGAGCA

GCAGATTTGGAAGGAGAGGGATGAATATATCACAAAGGTCTCTGAGGAAGTCACCCGGCT

TGGAGCCCAGGTCAAGGAGCTGGAGGAGAAGTGTCAGCAGCCAGCAAGTGAGCTTCTACA

AGATGTCAGAGTCAACCAGAGCAGGTGTGAGATGAAGACTTTTGTGAGTCCTGAGGCCAT

TTCTCCTGACCTTGTCAAGAAGATCCGTGATTTCCACAGGAAAATACTCACCCTCCCAGA

GATGATGAGGATGTTCTCAGAAAACTTGGCGCATCATCTGGAAATAGATTCAGGGGTCAT

CACTCTGGACCCTCAGACCGCCAGCCGGAGCCTGGTTCTCTCGGAAGACAGGAAGTCAGT

GAGGTACACCCGGCAGAAGAAGAGCCTGCCAGACAGCCCCCTGCGCTTCGACGGCCTCCC

GGCGGTTCTGGGCTTCCCGGGCTTCTCCTCCGGGCGCCACCGCTGGCAGGTTGACCTGCA

GCTGGGCGACGGCGGCGGCTGCACGGTGGGGGTGGCCGGGGAGGGGGTGAGGAGGAAGGG

AGAGATGGGACTCAGCGCCGAGGACGGCGTCTGGGCCGTGATCATCTCGCACCAGCAGTG

CTGGGCCAGCACCTCCCCGGGCACCGACCTGCCGCTGAGCGAGATCCCGCGCGGCGTGAG

AGTCGCCCTGGACTACGAGGCGGGGCAGGTGACCCTCCACAACGCCCAGACCCAGGAGCC

CATCTTCACCTTCACTGCCTCTTTCTCCGGCAAAGTCTTCCCTTTCTTTGCCGTCTGGAA

AAAAGGTTCCTGCCTTACGCTGAAAGGCTGAAGTGGGGCGCGCGAAGGGCGGCGAAGCGG

AGACGGCGGCTCTCCGGGATCCAGCTCCGCCCCTGGCCAGTGTGCGGCCCGGGGGCTCCC

TGTGCCCGCGTGAGGCGAGAGAACAGGGGACTTGAGTCTCGAACAGCGGTTGTTTTTACT

TTATTTATCTTAGGCCCTCAGCTCCCTGACGTCCTGAGCCTCCCTGTGACGCTCTGGCCT

TCTCTGCACCTCAGAGTGCAGAACCACAGACGGCTTCGGCTGTGCCTAGGGCAACAGCCA

ACCTAGGAGCCAGCGGGCTTTCGGGGAAAAAAAAGAAAAAGACATCTAAAATAAAATGTT

TAAACTGTTTCAAAATAAAAAAAAAAAAAAAAAAA

>AV656862

TTTATACATTCTAAATCTCCCCAGTTTCTTTGGGGCTGGAAGATGCAACTTCCATTTAAT

AGAAACTTTGAAATCTTGGGGTAAGGGAGCAGTGGGGGGACTAGGGAGAAGGATAAGAAA

TAGAATTATTGAAAAGCCCCCACCAGGGACCTTCCTGGCCAGAATATGCAGAGTAATTCC

TGCTGGCTTCACCTTTGAAAGTCCCTCGAAACTATGCAGATGAAACTGAGTCTGTTTTTG

ATATTGTCAGATGTATTCTACCTTGGAAGTCCCAACACCTAAACTGGAATTCTTGTATTT

ACATCTCCTCCACTGTCCCCCACACCACCCCTCAATTCCTGCTGCCCCTGCTAATGTTAA

GCATTTTTCTCTTGTTATCATCAGGTTCACATTAAAAACAGATACTTACAAACTGACTTG

AAGCACAGATACTTTTACGAATGTGATAAAATATTTTCTTAAGAAAAGGAAAGAGGATGT

GGGTCAAATAAAACACCGCATGGATGTTGATTGGTGAATACTGGTGTAAGAAAAGGGAGC

TCAGGAATTTTTATTACTGTATTTGTAAATGAGTTTGAAGGAATTTGTAAATGCCACTGG

TACATTTTTAAGGTGACACATTTGCTCCTTATAAAGTTATTAAAAATTACAGGGTAAGCT

TAAATGACGTTTGCCAGTAGTTTTACTTTATATAATCAATATTGATATTGTTGCTGAACT

ATGTAACTTTATGATGCATTTTTCAGTCCCTTTTCAGAGCAAATGCTTTTGCAATGGTAG

TAATGTTTAGTTTAAATTGACTTAATAAATTATTACCTGAGCAAAAAAAAAAAAAAAAAA

AAAAAAAAAATAAAAAAAAAAAAAAAAAAAAAAAAAAAAATAATAAAAAAAAAAAAAACA

AACAAATCAATAAAACTTAAACAAAAAAAAAATAAAAAAAAA

>AI499593

GCAGAGATCGCCACATCGTCGGACAAGGTCAAGGACGGGGGCGGCGGGAACGAGGGCTCT

CCATGCCCACCGTGTCCCGGGCCCATAGCCGGGCAAGCCCTAGGAGGCAGCCGGGCGTCG

CCGGCCCCGGCGCCGTCACGCTCGCCCTCGGCGCAGTGTCCTTTTCCAGGCGGGACGGTG

CTGTCCCGGCCTCTCTACTACACCGCGCCCTTCTATCCCGGCTACACGAACTATGGCTCC

TTCGGACACCTTCATGGCCACCCGGGGCCGGGGCCGGGCCCCACACCCGGTCCGGGGTCT

CATTTCAATGGATTAAACCAGACCGTGTTGAACCGAGCGGACGCTTTGGCTAAAGACCCG

AAAATGTTGCGGAGCCAGTCTCAGCTAGACCTGTGCAAAGACTCTCCCTATGAATTGAAG

AAAGGTATGTCCGACATTTAACGCGGGCTGCGTCGGTCCCGGACTTTTCTAATTTATTAA

AAACATGGCCTTGGCAGTTATTTTTCCATCACCGAGAGAGAGAGACAGAGAGAGAAAATA

AACTACCCCTCCTATTCAGAAGTTTATAGTTTATGGAGATGGATGACATAAAAATGTAAA

CATCTCCACACACACAAAAAAATGTCTTAACCAACCGAAAAGAAAAATTAAAAAAGGATT

TGTATTAAATCTTATTCTGTATATTTAATGTAGCATTTTTGTATTTAAATTGATAATTCA

ATATCTTTGAAGTAAATTATGAAATCAAGACACCTGTACAGGCATTTAATGTTTTTTTGT

AATATAAATATATACATTTGTGTTTCCCCCAAAACTGTTTCATAGTTAAAAAATACAAGT

TTAATTTAATTTTTTACACCTATTGATTCTGCTGGGTATGAGCTAAAGTATTACGGAAAG

GAAACAGGTTATACTCTTAGATTTAAAAAGTGAAAGAAACTGCAGGCGCCTTTGTAAAAT

GCAAAATATTTAATTAAAAGAGATTTTAACATAATGAGAGCCACTCATTACTTTTTAGAA

GCCTCAATAAACTGTCCATTGCCTTGGTCAAAAAAAAAAAAAAAAAAAAA

>AI952953

ATATCCAAGAAATTTGGACACCTATACCTACAGAATAATGAAATAGAAAAGATGAATCTN

ACAGTGATGTGTCCTTCTATTGACCCACTACATTACCACCATTTAACATACATTCGTGTG

GACCAAAATAAACTAAAAGAACCAATAAGCTCATACATCTTCTTCTGCTTCCCTCATATA

CACACTATTTATTATGGTGAACAACGAAGCACTAATGGTCAAACAATACAACTAAAGACC

CAAGTTTTCAGGAGATTTCCAGATGATGATGATGAAAGTGAAGATCACGATGATCCTGAC

AATGCTCATGAGAGCCCAGAACAAGAAGGAGCAGAAGGGCACTTTGACCTTCATTATTAT

GAAAATCAAGAATAGCAAGAAACTATATAGGTATACACTTACGACTTCACAAAACCTATA

CTTAATATAGTAAATCTAAGTAAACATGTATTACTCAAAGTAATATATTTAGAATTATGT

ATTAGTATAAGATCAGAATTGAATTTAAGTTGTTGGTGACATCTGCATCATTTCATAGGA

TTAGAACTTACTCAAAATAATGTAAATCTTTAAAAATATAAATTAGAATGACAAGTGGGA

ATCATAAATTAAACGTTAATGGTTTCTTATGCTCTTTTTAAATATAGAAATATCATGTTA

AAAAAAAA

>AK025470

ATGATTGCAACAGTGGATTTAAAAGTCAATGAATATGAGAAAAACCAAAAATGGCTTGAG

ATCCTAAATAAGATTGAAAACAAAACATACACGAAGCTCAAAAATGGACATGTGTTTAGG

AAGCAGGCACTGATGAGTGAAGAAAGGACTCTGTTATATGATGGCCTTGTTTACTGGAAA

ACTGCTACAGGTCGTTTCAAAGATATCCTAGCTCTACTTCTAACTGATGTGCTGCTCTTT

TTACAAGAAAAAGACCAGAAATACATCTTTGCAGCCGTTGATCAGAAGCCATCAGTTATT

TCCCTTCAAAAGCTTATTGCTAGAGAAGTTGCTAATGAGGAGAGAGGAATGTTTCTGATC

AGTGCTTCATCTGCTGGTCCTGAGATGTATGAAATTCACACCAATTCCAAGGAGGAACGC

AATAACTGGATGAGACGGATCCAGCAGGCTGTAGAAAGTTGTCCTGAAGAAAAAGGGGGA

AGGACAAGTGAATCTGATGAAGACAAGAGGAAAGCTGAAGCCAGAGTGGCCAAAATTCAG

CAATGTCAAGAAATACTCACTAACCAAGACCAACAAATTTGTGCGTATTTGGAGGAGAAG

CTGCATATCTATGCTGAACTTGGAGAACTGAGCGGATTTGAGGACGTCCATCTAGAGCCC

CACCTCCTTATTAAACCTGACCCAGGCGAGCCTCCCCAGGCAGCCTCATTACTGGCAGCA

GCACTGAAAGAAGCATTAGTCACAGGAGGGAGAGAAGGAAGAGGCTGTTCGGATGTGGAT

CCCGGGATCCAGGGTGTGGTAACCGACTTGGCCGTCTCTGATGCAGGGGAGAAGGTGGAA

TGTAGAAATTTTCCAGGTTCTTCACAATCAGAGATTATACAAGCCATACAGAATTTAACC

CGTCTCTTATACAGCCTTCAGGCCGCCTTGACCATTCAGGACAGCCACATTGAGATCCAC

AGGCTGGTTCTCCAGCAGCAGGAGGGCCTGTCTCTCGGCCACTCTATCCTCCGAGGCGGC

CCCTTGCAGGACCAGAAGTCTCGCGACGCGGACAGGCAGCATGAGGAGCTGGCCAATGTG

CACCAGCTTCAGCACCAGCTCCAGCAGGGGCAGCGGCGCTGGCTGCGCAGGTGTGAGCAG

CAGCAGCGGGCGCAGGCGACCAGGGAGAGCTGGCTGCAGGAGCGGGAGCGGGAGTGCCAG

TCGCAGGAGGAGCTGCTGCTGCGGAGCCGGGGCGAGCTGGACCTCCAGCTCCAGGAGTAC

CAGCACAGCCTGGAGCGGCTGAGGGAGGGCCAGCGCCTGGTGGAGAGGGAGCAGGCGAGG

ATGCGGGCCCAGCAGAGCCTGCTGGGCCACTGGAAGCACGGCCGGCAGAGGAGCCTGTCC

GCGGTGCTCCTTCCGGGTGGCCCCGAGGTAATGGAACTTAATCGATCTGAGAGTTTATGT

CATGAAAACTCATTCTTCATCAATGAAGCTTTAGTACAAATGTCATTTAACACTTTCAAC

AAACTGAATCCATCAGTTATCCATCAGGATGCCACTTACCCTACAACTCAATCTCATTCT

GACTTGGTGAGGACTAGTGAACATCAAGTAGACCTCAAGGTGGACCCTTCTCAGCCTTCG

AATGTCAGTCACAAACTGTGGACAGCCGCTGGTTCCGGCCATCAGATACTTCCTTTCCAT

GAAAGCAGCAAGGATTCTTGTAAAAATGGCTCCAGTATGACAAAGTGCAGTTGTACGTTG

ACATCTCCCCCGGGACTGTGGACTGGAACCACATCTACTTTGAAGGATTTGGACACCTCC

CACACTGAGTCCCCAACCCCCCATGACTCAAATTCACACCGCCCTCAACTGCAGGCGTTT

ATAACAGAAGCAAAGCTAAATCTACCGACAAGGACAATGACCAGACAAGATGGGGAAACT

GGAGATGGAGCCAAAGAAAATATTGTTTACCTCTAATTGTGTTGTCATTTTTCCAAACAA

AACAAAACACTGGCACTTTTGGGAGAAACTTTTTGTCTCCATTCCTTATGTATGTGTGAT

TGTCTGTGTCCAAATTGCTTTAAGAATAATATTTAATATTTCCTGGAAGCTCATTTTTTT

GGCATGAGTCTAATTAAATTATTGAAAGCCACCCTGTTTGTATAATCTTTAACTTATCAA

ATCTAATTTCAGATTTCTGGAGGAGAAACTAACTTGAATAAGCAGGACTATTTTAAAAGT

TGTTTTGACGCTAGAGTAAAATTCCATGTCACATTTTCTACCCAATCATCTGGATTTCAA

GATTCCTTTTAAGATCTCAATGAAGCAATTTGGATTTAAAGAGTGGTATTCACAAGGGGT

GAACTTTCACAGTCAGGGCAGTTGCCTCAGTGCCCACATAGGCAGAGGAGGATGTGGGAA

AGGGCTTTTCTCAGCTAGTTTTTGTGTGCTCATTTCTTCTGGGAGCATTAAAAGTGGTGA

TCTGTTACAGTCACTATTCAACTGGGCACGTGTTGTGATTGGTCAGTCACTGAGCCAGGG

ATACAGTCCGGACTTGCTTAGTACCTAAGCCTAATGCTGGTGGGGTTTCAAGACATGGTT

CAGCATCATCTTTTAACAAGGCCCAGAGGCCCAGAGCCCGCATCAAGTCATTTTGATGTA

AATAGTGAACTTTGTTAGAGCCCTCACTTCTATCAATCAGCTGTCCTGTCCCTGCCAGCA

CCTGGAGCACCAACTACCACTCCCTGGAAAGAACCCTTCCCTGCAGTTTTTTAAGGACAA

AACTGCCCACTCCTCATTAAGTTTGCTGCCTGGATACACTTTTCCACAAAGGAAAACTGG

CATATCCTGCCTTCCGAGTAGTATGGGTCTCTGTGTGAGAAACCAGGAGATATTTTCATC

TTGTTCGGAAATACTTGTATGTATTTTGGTGTCAATAAATATCTTGTACCTCATTAAAAA

AAAAAAAAAAAAA

>NM_006378

CTGAGCCGCATCTGCAATAGCACACTTGCCCGGCCACCTGCTGCCGTGAGCCTTTGCTGC

TGAAGCCCCTGGGGTCGCCTCTACCTGATGAGGATGTGCACCCCCATTAGGGGGCTGCTC

ATGGCCCTTGCAGTGATGTTTGGGACAGCGATGGCATTTGCACCCATACCCCGGATCACC

TGGGAGCACAGAGAGGTGCACCTGGTGCAGTTTCATGAGCCAGACATCTACAACTACTCA

GCCTTGCTGCTGAGCGAGGACAAGGACACCTTGTACATAGGTGCCCGGGAGGCGGTCTTC

GCTGTGAACGCACTCAACATCTCCGAGAAGCAGCATGAGGTGTATTGGAAGGTCTCAGAA

GACAAAAAAGCAAAATGTGCAGAAAAGGGGAAATCAAAACAGACAGAGTGCCTCAACTAC

ATCCGGGTGCTGCAGCCACTCAGCGCCACTTCCCTTTACGTGTGTGGGACCAACGCATTC

CAGCCGGCCTGTGACCACCTGAACTTAACATCCTTTAAGTTTCTGGGGAAAAATGAAGAT

GGCAAAGGAAGATGTCCCTTTGACCCAGCACACAGCTACACATCCGTCATGGTTGATGGA

GAACTTTATTCGGGGACGTCGTATAATTTTTTGGGAAGTGAACCCATCATCTCCCGAAAT

TCTTCCCACAGTCCTCTGAGGACAGAATATGCAATCCCTTGGCTGAACGAGCCTAGTTTC

GTGTTTGCTGACGTGATCCGAAAAAGCCCAGACAGCCCCGACGGCGAGGATGACAGGGTC

TACTTCTTCTTCACGGAGGTGTCTGTGGAGTATGAGTTTGTGTTCAGGGTGCTGATCCCA

CGGATAGCAAGAGTGTGCAAGGGGGACCAGGGCGGCCTGAGGACCTTGCAGAAGAAATGG

ACCTCCTTCCTGAAAGCCCGACTCATCTGCTCCCGGCCAGACAGCGGCTTGGTCTTCAAT

GTGCTGCGGGATGTCTTCGTGCTCAGGTCCCCGGGCCTGAAGGTGCCTGTGTTCTATGCA

CTCTTCACCCCACAGCTGAACAACGTGGGGCTGTCGGCAGTGTGCGCCTACAACCTGTCC

ACAGCCGAGGAGGTCTTCTCCCACGGGAAGTACATGCAGAGCACCACAGTGGAGCAGTCC

CACACCAAGTGGGTGCGCTATAATGGCCCGGTACCCAAGCCGCGGCCTGGAGCGTGCATC

GACAGCGAGGCACGGGCCGCCAACTACACCAGCTCCTTGAATTTGCCAGACAAGACGCTG

CAGTTCGTTAAAGACCACCCTTTGATGGATGACTCGGTAACCCCAATAGACAACAGGCCC

AGGTTAATCAAGAAAGATGTGAACTACACCCAGATCGTGGTGGACCGGACCCAGGCCCTG

GATGGGACTGTCTATGATGTCATGTTTGTCAGCACAGACCGGGGAGCTCTGCACAAAGCC

ATCAGCCTCGAGCACGCTGTTCACATCATCGAGGAGACCCAGCTCTTCCAGGACTTTGAG

CCAGTCCAGACCCTGCTGCTGTCTTCAAAGAAGGGCAACAGGTTTGTCTATGCTGGCTCT

AACTCGGGCGTGGTCCAGGCCCCGCTGGCCTTCTGTGGGAAGCACGGCACCTGCGAGGAC

TGTGTGCTGGCGCGGGACCCCTACTGCGCCTGGAGCCCGCCCACAGCGACCTGCGTGGCT

CTGCACCAGACCGAGAGCCCCAGCAGGGGTTTGATTCAGGAGATGAGCGGCGATGCTTCT

GTGTGCCCGGATAAAAGTAAAGGAAGTTACCGGCAGCATTTTTTCAAGCACGGTGGCACA

GCGGAACTGAAATGCTCCCAAAAATCCAACCTGGCCCGGGTCTTTTGGAAGTTCCAGAAT

GGCGTGTTGAAGGCCGAGAGCCCCAAGTACGGTCTTATGGGCAGAAAAAACTTGCTCATC

TTCAACTTGTCAGAAGGAGACAGTGGGGTGTACCAGTGCCTGTCAGAGGAGAGGGTTAAG

AACAAAACGGTCTTCCAAGTGGTCGCCAAGCACGTCCTGGAAGTGAAGGTGGTTCCAAAG

CCCGTAGTGGCCCCCACCTTGTCAGTTGTTCAGACAGAAGGTAGTAGGATTGCCACCAAA

GTGTTGGTGGCATCCACCCAAGGGTCTTCTCCCCCAACCCCAGCCGTGCAGGCCACCTCC

TCCGGGGCCATCACCCTTCCTCCCAAGCCTGCGCCCACCGGCACATCCTGCGAACCAAAG

ATCGTCATCAACACGGTCCCCCAGCTCCACTCGGAGAAAACCATGTATCTTAAGTCCAGC

GACAACCGCCTCCTCATGTCCCTCTTCCTCTTCTTCTTTGTTCTCTTCCTCTGCCTCTTT

TTCTACAACTGCTATAAGGGATACCTGCCCAGACAGTGCTTGAAATTCCGCTCGGCCCTA

CTAATTGGGAAGAAGAAGCCCAAGTCAGATTTCTGTGACCGTGAGCAGAGCCTGAAGGAG

ACGTTAGTAGAGCCAGGGAGCTTCTCCCAGCAGAATGGGGAGCACCCCAAGCCAGCCCTG

GACACCGGCTATGAGACCGAGCAAGACACCATCACCAGCAAAGTCCCCACGGATAGGGAG

GACTCACAGAGGATCGACGACCTTTCTGCCAGGGACAAGCCCTTTGACGTCAAGTGTGAG

CTGAAGTTCGCTGACTCAGACGCAGATGGAGACTGAGGCCGGCTGTGCATCCCCGCTGGT

GCCTCGGCTGCGACGTGTCCAGGCGTGGAGAGTTTTGTGTTTCTCCTGTTCAGTATCCGA

GTCTCGTGCAGTGCTGCGTAGGTTAGCCCGCATCGTGCAGACAACCTCAGTCCTCTTGTC

TATTTTCTCTTGGGTTGAGCCTGTGACTTGGTTTCTCTTTGTCCTTTTGGAAAAATGACA

AGCATTGCATCCCAGTCTTGTGTTCCGAAGTCAGTCGGAGTACTTGAAGAAGGCCCACGG

GCGGCACGGAGTTCCTGAGCCCTTTCTGTAGTGGGGGAAAGGTGGCTGGACCTCTGTTGG

CTGAGAAGAGCATCCCTTCAGCTTCCCCTCCCCGTAGCAGCCACTAAAAGATTATTTAAT

TCCAGATTGGAAATGACATTTTAGTTTATCAGATTGGTAACTTATCGCCTGTTGTCCAGA

TTGGCACGAACCTTTTCTTCCACTTAATTATTTTTTTAGGATTTTGCTTTGATTGTGTTT

ATGTCATGGGTCATTTTTTTTTAGTTACAGAAGCAGTTGTGTTAATATTTAGAAGAAGAT

GTATATCTTCCAGATTTTGTTATATATTTGGCATAAAATACGGCTTACGTTGCTTAAGAT

TCTCAGGGATAAACTTCCTTTTGCTAAATGCATTCTTTCTGCTTTTAGAAATGTAGACAT

AAACACTCCCCGGAGCCCACTCACCTTTTTTCTTTTTCTTTTTTTTTTTTTAACTTTATT

CCTTGAGGGAAGCATTGTTTTTGGAGAGATTTTCTTTCTGTACTTCGTTTTACTTTTCTT

TTTTTTTAACTTTTACTCTCTCGAAGAAGAGGACCTTCCCACATCCACGAGGTGGGTTTT

GAGCAAGGGAAGGTAGCCTGGATGAGCTGAGTGGAGCCAGGCTGGCCCAGAGCTGAGATG

GGAGTGCGGTACAATCTGGAGCCCACAGCTGTCGGTCAGAACCTCCTGTGAGACAGATGG

AACCTTCACAAGGGCGCCTTTGGTTCTCTGAACATCTCCTTTCTCTTCTTGCTTCAATTG

CTTACCCACTGCCTGCCCAGACTTTCTATCCAGCCTCACTGAGCTGCCCACTACTGGAAG

GGAACTGGGCCTCGGTGGCCGGGGCCGCGAGCTGTGACCACAGCACCCTCAAGCATACGG

CGCTGTTCCTGCCACTGTCCTGAAGATGTGAATGGGTGGTACGATTTCAACACTGGTTAA

TTTCACACTCCATCTCCCCGCTTTGTAAATACCCATCGGGAAGAGACTTTTTTTCCATGG

TGAAGAGCAATAAACTCTGGATGTTTGTGCGCGTGTGTGGACAGTCTTATCTTCCAGCAT

GATAGGATTTGACCATTTTGGTGTAAACATTTGTGTTTTATAAGATTTACCTTGTTTTTA

TTTTTCTACTTTGAATTGTATACATTTGGAAAGTACCCAAATAAATGAGAAGCTTCTATC

CTTAAAAAAAAAAAAAA

>AA993639

CCCNTCCCCAGAGGCAGGAAAANCAGTNTGCCGAAAGGATAGACTGNGGTGCNGTCTTTC

CCCAAGTTNTGAACTAGTTTTAAGGTAGCTTAGGATGAAAAATGGAGAATGATTGGGGGT

TCCAAACCACTTTCTTCTCCCTTGGCTTATATCTCTTCACCATTTGGTGGTCAACTGTGG

GCCTACCCTGGACCTCATCTACTCAGCGAGAATTGGACATGAAGCTAGAGGCAGCTGCCT

TGGAAGGGAAGTCAGGCTCACTTGGACAGCCCAGGCCATGGCAGGAAGAATCCCTTCCTC

TTGGGGTCCTTGATGGGCATGTGTGATGGGGAAGGAGCAGTCTCCCAGCCCTGGGTCTGC

TCCCCACATCTCTCCTAATTCCACTTCACCTTTTGCCACCCCCTCCCCACCAGAGGCCTA

GCCCTTTTGTCACCGAAGGCCCCCAGAGTGTTTCTGTGTGAAACCCTCTCATTTACACTG

TGGCATCAAAATCCACAAAAGATGGATTAATTGCACTCTGGTTAATAGCAGCAGCACAAT

GATTAAAATCTATATTCCTATCTTCTCTAGCACCCTGGTGTGGGGATGGGGCGGAAGGGT

GTCTTGAGGGGCAGGGAGGACCCCATAAAACAATCCCTCCTGCATTCTCAGGCTAAATAG

GGCCCCCAGTGACTACCTGTTCTTGGCTGTCCCCTCTGAAGAGCTCTGCCTTCTCACAGC

CACCACCAGTTGCCCCACTCCCAGGAAAACAGCACATGTTCTTCTTCTCCTGCCTTGAGA

CTGCGTGTTAGTCTTCCATTCATAACTCATCAGCAGCTCAGTCCTTCTTATGTCTAGTCT

CAGTTCATTCAGCCAAAGCTCATTTTTGTCCTATCCAAAGTAGAAAGGGTTCTTTTAGAA

AACTTGAAGAATGTGCCTCCTCTTAGCATCTGTTTCTGACTCCCAGTTATTTTTAAAATA

AATGATGAATAAAATGCCTGCCCTGAAGGGTTCTGGAGGAGTCAGGTATCAAAAAAAAAA

AAA

>BE552004

TTTTTAAGATGATCTTGCTCCGTCACCCAGGCTGGAGTGCAGTGGCGTAATCATGGCTTC

CTGCAGCCTCAAACTCCTGGGCTCAATGAGTTCCTTGAGATCTTCCATCCTCAGCTTCCC

AAGTAGCTAGTAGTAGTAGTGGCTTGCACCAACGCTCCTGCCCTAATTTTCAATATTTTT

TTTGTAGAGATAGGATCTCACTGTGTTACCCAAGCTAGACTTGAACTCCTGGCCTCAAGC

GATCCTTCCGCCTTGGCCTCCCAAAGTGTTGGGATTACAGGCATTAGCTACCACACCTGG

CCAAGGCCCAGGTTTCGACAGAAAGGGAGAGAAAACCTGCCAGAGATGCCATTTCGGAGC

CACTCTGCTTGGCAGGGACCTGTGTTCCCCTCATGCAGGTTCATCCTTAGAGGGCTGCGG

TCTTATCTGGTTGTGCAAAAGTCCCACAACCTTTCTGGATTGATAGTTTGTGGTGAAATA

AACAATTTTAGTTTGTTTGGAGAATCTTTTGTATACAAAATACAAATAAAACCTAAATCA

AAGAAACAGA

>BC010437

GAGGGGCCGGAGGCGTCCCCGCTCCCGCTCGCTACTAGCCCGCGGGCCAGCGCCGCGTCC

CGAGCCCCGGCGGGAGCCATGGCTCTAAAAGGACAAGAAGATTATATTTATCTTTTCAAG

GATTCAACACATCCAGTGGATTTTCTGGATGCATTCAGAACATTTTACTTGGATGGATTA

TTTACTGATATTACTCTTCAGTGTCCTTCAGGCATAATTTTCCATTGTCACCGAGCCGTT

TTAGCTGCTTGCAGCAATTATTTTAAGGCAATGTTCACAGCTGACATGAAAGAAAAATTT

AAAAATAAAATAAAACTCTCTGGCATCCACCATGATATTCTGGAAGGCCTTGTAAATTAT

GCATACACTTCCCAAATTGAAATAACTAAAAGAAATGTTCAAAGCCTGCTTGAGGCAGCG

GATCTGCTACAGTTCCTTTCAGTAAAGAAGGCTTGTGAGCGGTTTTTGGTAAGGCACTTG

GATATTGATAATTGTATTGGAATGCACTCCTTTGCAGAATTTCATGTGTGTCCAGAACTA

GAGAAGGAATCTCGAAGAATTCTATGTTCAAAGTTTAAGGAAGTGTGGCAACAAGAAGAA

TTTCTGGAAATCAGCCTTGAAAAGTTTCTCTTTATCTTGTCCAGAAAGAATCTCAGTGTT

TGGAAAGAAGAAGCTATCATAGAGCCAGTTATTAAGTGGACTGCTCATGATGTAGAAAAT

CGAATTGAATGCCTCTATAATCTACTGAGCTATATCAACATTGATATAGATCCAGTGTAC

TTAAAAACAGCCTTAGGCCTTCAAAGAAGCTGCCTGCTCACCGAAAATAAGATCCGCTCC

CTAATATACAATGCCTTGAATCCCATGCATAAAGAGATTTCCCAGAGGTCCACAGCCACA

ATGTATATAATTGGAGGCTATTACTGGCATCCTTTATCAGAGGTTCACATATGGGATCCT

TTGACAAATGTTTGGATTCAGGGAGCAGAAATACCAGATTATACCAGGGAGAGCTATGGT

GTTACATGTTTAGGACCCAACATTTATGTAACTGGGGGCTACAGGACGGATAACATAGAA

GCTCTTGACACAGTGTGGATCTATAACAGTGAAAGTGATGAATGGACAGAAGGTTTGCCA

ATGCTCAATGCCAGGTATTACCACTGTGCAGTCACCTTGGGTGGCTGTGTCTATGCTTTA

GGTGGTTACAGAAAAGGGGCTCCAGCAGAAGAGGCTGAGTTCTATGATCCTTTAAAAGAG

AAATGGATTCCTATTGCAAACATGATTAAAGGTGTGGGAAATGCTACTGCCTGTGTCTTA

CATGATGTTATCTACGTCATTGGTGGCCACTGTGGCTACAGAGGAAGCTGCACCTATGAC

AAAGTTCAGAGCTACAATTCCGATATCAACGAATGGAGCCTCATCACCTCCAGTCCACAT

CCAGAATATGGATTGTGCTCAGTTCCGTTTGAAAATAAGCTCTATCTAGTCGGTGGACAA

ACTACAATCACAGAATGCTATGACCCTGAACAAAATGAATGGAGAGAGATAGCTCCCATG

ATGGAAAGGAGGATGGAGTGCGGTGCCGTCATCATGAATGGATGTATTTATGTCACTGGA

GGATACTCCTACTCAAAGGGAACGTATCTTCAGAGCATTGAGAAATATGATCCAGATCTT

AATAAGTGGGAAATAGTGGGTAATCTTCCCAGTGCCATGCGGTCTCATGGGTGTGTTTGT

GTGTATAATGTCTAATTGAATCTGCAGAAATGACCAAGCAATCACTTTTTTGGAGTATAG

TTTTATAAAAAAAGAATGCAGGGTTTGAAGTTCCTTACCTGATAATTGTGTCTGGCACAT

GATAGGGGATCAGTAAATTGTAATTCCTAACCCTACTGTACTCCCAAACATGGTGATTCA

TGGTCAAGAAAAATCTTATATATATATATACACACACATATATATGTGTTCATATATATG

TATACATATATGTGTATATATACGCATGTATGTATACATATATGTGTATATATACGCATG

TATGTATGCATATGTGTGTATATATACGTATGTATGTATACATATGTGTATATATACGTA

TGTATGTATACATATATGTGTATATATGCGTATGTATGTATACATATATGTGTATATATA

CGTATGTATGTATACATATATGTGTATATATACGTATGTATGTATACATATATGTGTATA

TATACGTATGTATGTATACATATATGTGTGTATATACGTGTGTATGTATACATATATGTG

TATATATACGTGTGTATGTATACATATATGTGTATATATGCGTGTGTATGTATACATATA

TGTGTATATATACGTGTGTATGTATACATATATGTGTATATATACGTGTGTATGTATACA

TATATGTGTATATATGCGTGTGTATATATATACACATATATACGTATATATGTATATATA

TATACACAGTTGAATCAGTGGGATTAATACCTATAATCTCTGGTTTTCAAAGGTAATATG

GAATATTTGACACTTGGTAAAAGGTGAACTACCTTTGTAGTGAATCTTTTCCTCTTGGTA

GCATCAACACTGGGGATAAATCAGAACCATTCTGTGGAATGAAATGTTTCTCAAGAGCCT

ATAATATAGTAGATAGTGCATATTAAGATGTCTGGCTGGGCATGGTGGCTCATGCCTGTA

ATCCCAGCACTTTGGGAGGCTGAGGCGGGAGGATCACTTGAGCCTAGAAGTTGGAGACTA

ACCTGGCGAGACCCTGTCTCAAAAAAAAAAAAAAAAAA

>R15881

ACCCTTTTGTGACCAGCTGCATACCCCAAAACCTTTTGGAATCTGGGCTAACTGGCTGTG

CCTACATCAACAGCACCCGTGAACCCCCGTGTGCTATGCTCTGTGCAACAAAACATTCAG

AACCCACTTTCAAGATGCTGCTGCTGTGCCAGTGTGACAAAAAAAAGAGGCGCAAGCAGC

AGTACCAGCAGAGACAGTCGGTCATTTTTCACAAGCGCGCACCCGAGCAGGCCTTGTAGA

ATGAGGTTGTATCAATAGCAGTGACAAAACGCACACATCAACCCACAGACCTTAGGAGGA

GGAAGGCGAGGGCGGGGTGACTTCTGGTGATGATAAAAATGGTTTTATCACCCAGATGTG

AAAGAAGCTGCCTGTTTACTGATCCATTGAATAAACCCATTTTAATAGAAAAAGTCAATA

CCAATTCAGCAAAAAAAAA

>AF191770

TATCTATGTAACAAATCGCAGCACAGGAGTCCCCTGGGCTCCCTCAGGCTCTGGTATGAC

ATATTTGAGCCATATAAATTCAGCTTCTCCTCTGGCATCTGTTAGCCGACTCACTTGCAA

CTCCACCTCAGCAGTGGTCTCTCAGTCCTCTCAAAGCAAGGAAAGAGTACTGTGTGCTGA

GAGACCATGGCAAAGAATCCTCCAGAGAATTGTGAAGACTGTCACATTCTAAATGCAGAA

GCTTTTAAATCCAAGAAAATATGTAAATCACTTAAGATTTGTGGACTGGTGTTTGGTATC

CTGACCCTAACTCTAATTGTCCTGTTTTGGGGGAGCAAGCACTTCTGGCCGGAGGTACCC

AAAAAAGCCTATGACATGGAGCACACTTTCTACAGCAGTGGAGAGAAGAAGAAGATTTAC

ATGGAAATTGATCCTGTGACCAGAACTGAAATATTCAGAAGCGGAAATGGCACTGATGAA

ACATTGGAAGTACACGACTTTAAAAACGGATACACTGGCATCTACTTCGTGGGTCTTCAA

AAATGTTTTATCAAAACTCAGATTAAAGTGATTCCTGAATTTTCTGAACCAGAAGAGGAA

ATAGATGAGAATGAAGAAATTACCACAACTTTCTTTGAACAGTCAGTGATTTGGGTCCCA

GCAGAAAAGCCTATTGAAAACCGAGATTTTCTTAAAAATTCCAAAATTCTGGAGATTTGT

GATAACGTGACCATGTATTGGATCAATCCCACTCTAATATCAGTTTCTGAGTTACAAGAC

TTTGAGGAGGAGGGAGAAGATCTTCACTTTCCTGCCAACGAAAAAAAAGGGATTGAACAA

AATGAACAGTGGGTGGTCCCTCAAGTGAAAGTAGAGAAGACCCGTCACGCCAGACAAGCA

AGTGAGGAAGAACTTCCAATAAATGACTATACTGAAAATGGAATAGAATTTGATCCCATG

CTGGATGAGAGAGGTTATTGTTGTATTTACTGCCGTCGAGGCAACCGCTATTGCCGCCGC

GTCTGTGAACCTTTACTAGGCTACTACCCATATCCATACTGCTACCAAGGAGGACGAGTC

ATCTGTCGTGTCATCATGCCTTGTAACTGGTGGGTGGCCCGCATGCTGGGGAGGGTCTAA

TAGGAGGTTTGAGCTCAAATGCTTAAACTGCTGGCAACATATAATAAATGCATGCTATTC

AATGAATTTCTGCCTATGAGGCATCTGGCCCCTGGTAGCCAGCTCTCCAGAATTACTTGT

AGGTAATTCCTCTCTTCATGTTCTAATAAACTTCTACATTATCAAAAAA

>BC005364

GCGGATCGCTGCTCCCTCTCGCCATGGCGCAGGTGCTGATCGTGGGCGCCGGGATGACAG

GAAGCTTGTGCGCTGCGCTGCTGAGGAGGCAGACGTCCGGTCCCTTGTACCTTGCTGTGT

GGGACAAGGCTGACGACTCAGGGGGAAGAATGACTACAGCCTGCAGTCCTCATAATCCTC

AGTGCACAGCTGACTTGGGTGCTCAGTACATCACCTGCACTCCTCATTATGCCAAAAAAC

ACCAACGTTTTTATGATGAACTGTTAGCCTATGGCGTTTTGAGGCCTCTAAGCTCGCCTA

TTGAAGGAATGGTGATGAAAGAAGGAGACTGTAACTTTGTGGCACCTCAAGGAATTTCTT

CAATTATTAAGCATTACTTGAAAGAATCAGGTGCAGAAGTCTACTTCAGACATCGTGTGA

CACAGATCAACCTAAGAGATGACAAATGGGAAGTATCCAAACAAACAGGCTCCCCTGAGC

AGTTTGATCTTATTGTTCTCACAATGCCAGTTCCTGAGATTCTGCAGCTTCAAGGTGACA

TCACCACCTTAATTAGTGAATGCCAAAGGCAGCAACTGGAGGCTGTGAGCTACTCCTCTC

GATATGCTCTGGGCCTCTTTTATGAAGCTGGTACGAAGATTGATGTCCCTTGGGCTGGGC

AGTACATCACCAGTAATCCCTGCATACGCTTCGTCTCCATTGATAATAAGAAGCGCAATA

TAGAGTCATCAGAAATTGGGCCTTCCCTCGTGATTCACACCACTGTCCCATTTGGAGTTA

CATACTTGGAACACAGCATTGAGGATGTGCAAGAGTTAGTCTTCCAGCAGCTGGAAAACA

TTTTGCCGGGTTTGCCTCAGCCAATTGCTACCAAATGCCAAAAATGGAGACATTCACAGG

TTACAAATGCTGCTGCCAACTGTCCTGGCCAAATGACTCTGCATCACAAACCTTTCCTTG

CATGTGGAGGGGATGGATTTACTCAGTCCAACTTTGATGGCTGCATCACTTCTGCCCTAT

GTGTTCTGGAAGCTTTAAAGAATTATATTTAGTGCCTATATCCTTATTCTCTATATGTGT

ATTGGGTTTTTATTTTCACAATTTTCTGTTATTGATTATTTTGTTTTCTATTTTGCTAAG

AAAAATTACTGGAAAATTGTTCTTCACTTATTATCATTTTTCATGTGGAGTATAAAATCA

ATTTTGTAATTTTGATAGTTACAACCCATGCTAGAATGGAAATTCCTCACACCTTGCACC

TTCCCTACTTTTCTGAATTGCTATGACTACTCCTTGTTGGAGGAAAAGTGGTACTTAAAA

AATAACAAACGACTCTCTCAAAAAAATTACATTAAATCACAATAACAGTTTGTATGCCAA

AAACTTGATTATCCTTATGAAAATTTCAATTCTGAATAAAGAATAATCACATTATCAAAG

CCCCATCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>NM_001337

ACTCGTCTCTGGTAAAGTCTGAGCAGGACAGGGTGGCTGACTGGCAGATCCAGAGGTTCC

CTTGGCAGTCCACGCCAGGCCTTCACCATGGATCAGTTCCCTGAATCAGTGACAGAAAAC

TTTGAGTACGATGATTTGGCTGAGGCCTGTTATATTGGGGACATCGTGGTCTTTGGGACT

GTGTTCCTGTCCATATTCTACTCCGTCATCTTTGCCATTGGCCTGGTGGGAAATTTGTTG

GTAGTGTTTGCCCTCACCAACAGCAAGAAGCCCAAGAGTGTCACCGACATTTACCTCCTG

AACCTGGCCTTGTCTGATCTGCTGTTTGTAGCCACTTTGCCCTTCTGGACTCACTATTTG

ATAAATGAAAAGGGCCTCCACAATGCCATGTGCAAATTCACTACCGCCTTCTTCTTCATC

GGCTTTTTTGGAAGCATATTCTTCATCACCGTCATCAGCATTGATAGGTACCTGGCCATC

GTCCTGGCCGCCAACTCCATGAACAACCGGACCGTGCAGCATGGCGTCACCATCAGCCTA

GGCGTCTGGGCAGCAGCCATTTTGGTGGCAGCACCCCAGTTCATGTTCACAAAGCAGAAA

GAAAATGAATGCCTTGGTGACTACCCCGAGGTCCTCCAGGAAATCTGGCCCGTGCTCCGC

AATGTGGAAACAAATTTTCTTGGCTTCCTACTCCCCCTGCTCATTATGAGTTATTGCTAC

TTCAGAATCATCCAGACGCTGTTTTCCTGCAAGAACCACAAGAAAGCCAAAGCCATTAAA

CTGATCCTTCTGGTGGTCATCGTGTTTTTCCTCTTCTGGACACCCTACAACGTTATGATT

TTCCTGGAGACGCTTAAGCTCTATGACTTCTTTCCCAGTTGTGACATGAGGAAGGATCTG

AGGCTGGCCCTCAGTGTGACTGAGACGGTTGCATTTAGCCATTGTTGCCTGAATCCTCTC

ATCTATGCATTTGCTGGGGAGAAGTTCAGAAGATACCTTTACCACCTGTATGGGAAATGC

CTGGCTGTCCTGTGTGGGCGCTCAGTCCACGTTGATTTCTCCTCATCTGAATCACAAAGG

AGCAGGCATGGAAGTGTTCTGAGCAGCAATTTTACTTACCACACGAGTGATGGAGATGCA

TTGCTCCTTCTCTGAAGGGAATCCCAAAGCCTTGTGTCTACAGAGAACCTGGAGTTCCTG

AACCTGATGCTGACTAGTGAGGAAAGATTTTTGTTGTTATTTCTTACAGGCACAAAATGA

TGGACCCAATGCACACAAAACAACCCTAGAGTGTTGTTGAGAATTGTGCTCAAAATTTGA

AGAATGAACAAATTGAACTCTTTGAATGACAAAGAGTAGACATTTCTCTTACTGCAAATG

TCATCAGAACTTTTTGGTTTGCAGATGACAAAAATTCAACTCAGACTAGTTTAGTTAAAT

GAGGGTGGTGAATATTGTTCATATTGTGGCACAAGCAAAAGGGTGTCTGAGCCCTCAAAG

TGAGGGGAAACCAGGGCCTGAGCCAAGCTAGAATTCCCTCTCTCTGACTCTCAAATCTTT

TAGTCATTATAGATCCCCCAGACTTTACATGACACAGCTTTATCACCAGAGAGGGACTGA

CACCCATGTTTCTCTGGCCCCAAGGGAAAATTCCCAGGGAAGTGCTCTGATAGGCCAAGT

TTGTATCAGGTGCCCATCCCTGGAAGGTGCTGTTATCCATGGGGAAGGGATATATAAGAT

GGAAGCTTCCAGTCCAATCTCATGGAGAAGCAGAAATACATATTTCCAAGAAGTTGGATG

GGTGGGTACTATTCTGATTACACAAAACAAATGCCACACATCACCCTTACCATGTGCCTG

ATCCAGCCTCTCCCCTGATTACACCAGCCTCGTCTTCATTAAGCCCTCTTCCATCATGTC

CCCAAACCTGCAAGGGCTCCCCACTGCCTACTGCATCGAGTCAAAACTCAAATGCTTGGC

TTCTCATACGTCCACCATGGGGTCCTACCAATAGATTCCCCATTGCCTCCTCCTTCCCAA

AGGACTCCACCCATCCTATCAGCCTGTCTCTTCCATATGACCTCATGCATCTCCACCTGC

TCCCAGGCCAGTAAGGGAAATAGAAAAACCCTGCCCCCAAATAAGAAGGGATGGATTCCA

ACCCCAACTCCAGTAGCTTGGGACAAATCAAGCTTCAGTTTCCTGGTCTGTAGAAGAGGG

ATAAGGTACCTTTCACATAGAGATCATCCTTTCCAGCATGAGGAACTAGCCACCAACTCT

TGCAGGTCTCAACCCTTTTGTCTGCCTCTTAGACTTCTGCTTTCCACACCTGCACTGCTG

TGCTGTGCCCAAGTTGTGGTGCTGACAAAGCTTGGAAGAGCCTGCAGGTGCCTTGGCCGC

GTGCATAGCCCAGACACAGAAGAGGCTGGTTCTTACGATGGCACCCAGTGAGCACTCCCA

AGTCTACAGAGTGATAGCCTTCCGTAACCCAACTCTCCTGGACTGCCTTGAATATCCCCT

CCCAGTCACCTTGTGCAAGCCCCTGCCCATCTGGGAAAATACCCCATCATTCATGCTACT

GCCAACCTGGGGAGCCAGGGCTATGGGAGCAGCTTTTTTTTCCCCCCTAGAAACGTTTGG

AACAATGTAAAACTTTAAAGCTCGAAAACAATTGTAATAATGCTAAAGAAAAAGTCATCC

AATCTAACCACATCAATATTGTCATTCCTGTATTCACCCGTCCAGACCTTGTTCACACTC

TCACATGTTTAGAGTTGCAATCGTAATGTACAGATGGTTTTATAATCTGATTTGTTTTCC

TCTTAACGTTAGACCACAAATAGTGCTCGCTTTCTATGTAGTTTGGTAATTATCATTTTA

GAAGACTCTACCAGACTGTGTATTCATTGAAGTCAGATGTGGTAACTGTTAAATTGCTGT

GTATCTGATAGCTCTTTGGCAGTCTATATGTTTGTATAATGAATGAGAGAATAAGTCATG

TTCCTTCAAGATCATGTACCCCAATTTACTTGCCATTACTCAATTGATAAACATTTAACT

TGTTTCCAATGTTTAGCAAATACATATTTTATAGAACTTC

>AI041545

TGAACATATTCAGGCTGATTGGGGACGTGTCCCACCTGGCGGCCATCGTCATCTTGATGG

TAGAGATCTGGAAGACGCGCTCCTGCGCCGGTATTTCTGGGAAAAGCCAGCTTCTGTCTG

CACTGGTCTTCACAACTCGTGACCTGGATCTTTTCACTTCATTTATTTCAGTGTATCACA

CATCTATCAAGGTTATCTACGTTGCCTGCTCGTATGCCACAGTGTACCTGATCTACCTTA

AATTTAAGGCAACATCGGATGGAAATCATGATACCTTCCGAGTGGAGTTTCTGGTGGTCC

CTGTGGGAGGCCTCCTCATTTTTAGTTAATCACGATTTCTCTCCTCTTGAGTACTCAAGG

GAAAGAAGCTCAGTTTGCCAGCATAAGTGCCAAAGACCATCGCCAGCATCTGTCCTTCAG

GGTGTTCGGACAGAATTCTTACCACAGCAAAGGCATAAGATGCTTGATACGGAAAATCAA

GAACTTAACTTTTTTGTTGCAGATAGTCATCAGTGGTTCTGTAAAAACGCAGAGGAAAAG

AGCCAGAAGGTTTCTGTTTAATGCATCTTGCCTTATCTTTTTTTATTACTGTGCACAAAG

ATTTTTTTACACAAACATCCTTAATGCTGTTTTAATAAATTCAGTGTGTAGCTTCAAAAA

AA

>NM_024423

GGCAGGTCTCGCTCTCGGCACCCTCCCGGCGCCCGCGTTCTCCTGGCCCTGCCCGGCATC

CCGATGGCCGCCGCTGGGCCCCGGCGCTCCGTGCGCGGAGCCGTCTGCCTGCATCTGCTG

CTGACCCTCGTGATCTTCAGTCGTGATGGTGAAGCCTGCAAAAAGGTGATACTTAATGTA

CCTTCTAAACTAGAGGCAGACAAAATAATTGGCAGAGTTAATTTGGAAGAGTGCTTCAGG

TCTGCAGACCTCATCCGGTCAAGTGATCCTGATTTCAGAGTTCTAAATGATGGGTCAGTG

TACACAGCCAGGGCTGTTGCGCTGTCTGATAAGAAAAGATCATTTACCATATGGCTTTCT

GACAAAAGGAAACAGACACAGAAAGAGGTTACTGTGCTGCTAGAACATCAGAAGAAGGTA

TCGAAGACAAGACACACTAGAGAAACTGTTCTCAGGCGTGCCAAGAGGAGATGGGCACCT

ATTCCTTGCTCTATGCAAGAGAATTCCTTGGGCCCTTTCCCATTGTTTCTTCAACAAGTT

GAATCTGATGCAGCACAGAACTATACTGTCTTCTACTCAATAAGTGGACGTGGAGTTGAT

AAAGAACCTTTAAATTTGTTTTATATAGAAAGAGACACTGGAAATCTATTTTGCACTCGG

CCTGTGGATCGTGAAGAATATGATGTTTTTGATTTGATTGCTTATGCGTCAACTGCAGAT

GGATATTCAGCAGATCTGCCCCTCCCACTACCCATCAGGGTAGAGGATGAAAATGACAAC

CACCCTGTTTTCACAGAAGCAATTTATAATTTTGAAGTTTTGGAAAGTAGTAGACCTGGT

ACTACAGTGGGGGTGGTTTGTGCCACAGACAGAGATGAACCGGACACAATGCATACGCGC

CTGAAATACAGCATTTTGCAGCAGACACCAAGGTCACCTGGGCTCTTTTCTGTGCATCCC

AGCACAGGCGTAATCACCACAGTCTCTCATTATTTGGACAGAGAGGTTGTAGACAAGTAC

TCATTGATAATGAAAGTACAAGACATGGATGGCCAGTTTTTTGGATTGATAGGCACATCA

ACTTGTATCATAACAGTAACAGATTCAAATGATAATGCACCCACTTTCAGACAAAATGCT

TATGAAGCATTTGTAGAGGAAAATGCATTCAATGTGGAAATCTTACGAATACCTATAGAA

GATAAGGATTTAATTAACACTGCCAATTGGAGAGTCAATTTTACCATTTTAAAGGGAAAT

GAAAATGGACATTTCAAAATCAGCACAGACAAAGAAACTAATGAAGGTGTTCTTTCTGTT

GTAAAGCCACTGAATTATGAAGAAAACCGTCAAGTGAACCTGGAAATTGGAGTAAACAAT

GAAGCGCCATTTGCTAGAGATATTCCCAGAGTGACAGCCTTGAACAGAGCCTTGGTTACA

GTTCATGTGAGGGATCTGGATGAGGGGCCTGAATGCACTCCTGCAGCCCAATATGTGCGG

ATTAAAGAAAACTTAGCAGTGGGGTCAAAGATCAACGGCTATAAGGCATATGACCCCGAA

AATAGAAATGGCAATGGTTTAAGGTACAAAAAATTGCATGATCCTAAAGGTTGGATCACC

ATTGATGAAATTTCAGGGTCAATCATAACTTCCAAAATCCTGGATAGGGAGGTTGAAACT

CCCAAAAATGAGTTGTATAATATTACAGTCCTGGCAATAGACAAAGATGATAGATCATGT

ACTGGAACACTTGCTGTGAACATTGAAGATGTAAATGATAATCCACCAGAAATACTTCAA

GAATATGTAGTCATTTGCAAACCAAAAATGGGGTATACCGACATTTTAGCTGTTGATCCT

GATGAACCTGTCCATGGAGCTCCATTTTATTTCAGTTTGCCCAATACTTCTCCAGAAATC

AGTAGACTGTGGAGCCTCACCAAAGTTAATGATACAGCTGCCCGTCTTTCATATCAGAAA

AATGCTGGATTTCAAGAATATACCATTCCTATTACTGTAAAAGACAGGGCCGGCCAAGCT

GCAACAAAATTATTGAGAGTTAATCTGTGTGAATGTACTCATCCAACTCAGTGTCGTGCG

ACTTCAAGGAGTACAGGAGTAATACTTGGAAAATGGGCAATCCTTGCAATATTACTGGGT

ATAGCACTGCTCTTTTCTGTATTGCTAACTTTAGTATGTGGAGTTTTTGGTGCAACTAAA

GGGAAACGTTTTCCTGAAGATTTAGCACAGCAAAACTTAATTATATCAAACACAGAAGCA

CCTGGAGACGATAGAGTGTGCTCTGCCAATGGATTTATGACCCAAACTACCAACAACTCT

AGCCAAGGTTTTTGTGGTACTATGGGATCAGGAATGAAAAATGGAGGGCAGGAAACCATT

GAAATGATGAAAGGAGGAAACCAGACCTTGGAATCCTGCCGGGGGGCTGGGCATCATCAT

ACCCTGGACTCCTGCAGGGGAGGACACACGGAGGTGGACAACTGCAGATACACTTACTCG

GAGTGGCACAGTTTTACTCAACCCCGTCTCGGTGAAGAATCCATTAGAGGACACACTGGT

TAAAAATTAAACATAAAAGAAATTGCATCGATGTAATCAGAATGAAGACCGCATGCCATC

CCAAGATTATGTCCTCACTTATAACTATGAGGGAAGAGGATCTCCAGCTGGTTCTGTGGG

CTGCTGCAGTGAAAAGCAGGAAGAAGATGGCCTTGACTTTTTAAATAATTTGGAACCCAA

ATTTATTACATTAGCAGAAGCATGCACAAAGAGATAATGTCACAGTGCTACAATTAGGTC

TTTGTCAGACATTCTGGAGGTTTCCAAAAATAATATTGTAAAGTTCAATTTCAACATGTA

TGTATATGATGATTTTTTTCTCAATTTTGAATTATGCTACTCACCAATTTATATTTTTAA

AGCCAGTTGTTGCTTATCTTTTCCAAAAAGTGAAAAATGTTAAAACAGACAACTGGTAAA

TCTCAAACTCCAGCACTGGAATTAAGGTCTCTAAAGCATCTGCTCTTTTTTTTTTTTACG

GATATTTTAGTAATAAATATGCTGGATAAATATTAGTCCAACAATAGCTAAGTTATGCTA

ATATCACATTATTATGTATTCACTTTAAGTGATAGTTTAAAAAATAAACAAGAAATATTG

AGTATCACTATGTGAAGAAAGTTTTGGAAAAGAAACAATGAAGACTGAATTAAATTAAAA

ATGTTGCAGCTCATAAAGAATTGGGACTCACCCCTACTGCACTACCAAATTCATTTGACT

TTGGAGGCAAAATGTGTTGAAGTGCCCTATGAAGTAGCAATTTTCTATAGGAATATAGTT

GGAAATAAATGTGTGTGTGTATATTATTATTAATCAATGCAATATTTAAAATGAAATGAG

AACAAAGAGGAAAATGGTAAAAACTTGAAATGAGGCTGGGGTATAGTTTGTCCTACAATA

GAAAAAAGAGAGAGCTTCCTAGGCCTGGGCTCTTAAATGCTGCATTATAACTGAGTCTAT

GAGGAAATAGTTCCTGTCCAATTTGTGTAATTTGTTTAAAATTGTAAATAAATTAAACTT

TTCTGGTTTCTGTGGGAAGGAAATAGGGAATCCAATGGAACAGTAGCTTTGCTTTGCAGT

CTGTTTCAAGATTTCTGCATCCACAAGTTAGTAGCAAACTGGGGAATACTCGCTGCAGCT

GGGGTTCCCTGCTTTTTGGTAGCAAGGGTCCAGAGATGAGGTGTTTTTTTCGGGGAGCTA

ATAACAAAAACATTTTAAAACTTACCTTTACTGAAGTTAAATCCTCTATTGCTGTTTCTA

TTCTCTCTTATAGTGACCAACATCTTTTTAATTTAGATCCAAATAACCATGTCCTCCTAG

AGTTTAGAGGCTAGAGGGAGCTGAGGGGAGGATCTTACTGAAAGCACCCTGGGGAGATTG

ATTGTCCTTAAACCTAAGCCCCACAAACTTGACACCTGATCAGGTCTGGGAGCTACAAAA

TTTCATTTTTCTCCTCACTGCCCTTCTTCTGAGTGGCATTGGCCTGAATCAAGGAAAGCC

AGGCCTTGTGGGCCCCCTTCTTTCGGCTTTCTGCTAAAGCAACACCTCCAGCAGAGATTC

CCTTAAGTGACTCCAGGTTTTCCACCATCCTTCAGCGTGAATTAATTTTTAATCAGTTTG

CTTTCTCCAGAGAAATTTTAAAATAATAGAAGAAATAGAAATTTTGAATGTATAAAAGAA

AAAGATCAAGTTGTCATTTTAGAACAGAGGGAACTTTGGGAGAAAGCAGCCCAAGTAGGT

TATTTGTACAGTCAGAGGGCAACAGGAAGATGCAGGCCTTCAAGGGCAAGGAGAGGCCAC

AAGGAATATGGGTGGGAGTAAAAGCAACATCGTCTGCTTCATACTTTTTCCTAGGCTTGG

CACTGCCTTTTCCTTTCTCAGGCCAATGGCAACTGCCATTTGAGTCCGGTGAGGGATCAG

CCAACCTCTTCTCTATGGCTCACCTTATTTGGAGTGAGAAATCAAGGAGACAGAGCTGAC

TGCATGATGAGTCTGAAGGCATTTGCAGGATGAGCCTGAACTGGTTGTGCAGAACAAACA

AGGCATTCATGGGAATTGTTGTATTCCTTCTGCAGCCCTCCTTCTGGGCACTAAGAAGGT

CTATGAATTAAATGCCTATCTAAAATTCTGATTTATTCCTACATTTTCTGTTTTCTAATT

TGACCCTAAAATCTATGTGTTTTAGACTTAGACTTTTTATTGCCCCCCCCCCCTTTTTTT

TTGAGACGGAGTCTCGCTCTGACGCACAGGCTGGAGTGCAGTGGCTCCGATCTCTGCTCA

CTGAAAGCTCCGCCTCCCGGGTTCATGCCATTCTCCTGCCTCAGCCTCCTGAGTAGCTGG

GACTACAGGCGCCCACCACCACGCCCGGCTAATTTTTTGTATTTTTAATAGAGACGGGGT

TTCACTGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCCGCCTGCCTCGGCC

TCCCAAAGTGCTGGGATTACAGGCATGACCCACCGCTCCCGGCCTTGTTTTCCGTTTAAA

GTCGTCTTCTTTTAATGTAATCATTTTGAACATGTGTGAAAGTTGATCATACGAATTGGA

TCAATCTTGAAATACTCAACCAAAAGACAGTCGAGAAGCCAGGGGGAGAAAGAACTCAGG

GCACAAAATATTGGTCTGAGAATGGAATTCTCTGTAAGCCTAGTTGCTGAAATTTCCTGC

TGTAACCAGAAGCCAGTTTTATCTAACGGCTACTGAAACACCCACTGTGTTTTGCTCACT

CCCACTCACCGATCAAAACCTGCTACCTCCCCAAGACTTTACTAGTGCCGATAAACTTTC

TCAAAGAGCAACCAGTATCACTTCCCTGTTTATAAAACCTCTAACCATCTCTTTGTTCTT

TGAACATGCTGAAAACCACCTGGTCTGCATGTATGCCCGAATTTGTAATTCTTTTCTCTC

AAATGAAAATTTAATTTTAGGGATTCATTTCTATATTTTCACATATGTAGTATTATTATT

TCCTTATATGTGTAAGGTGAAATTTATGGTATTTGAGTGTGCAAGAAAATATATTTTTAA

AGCTTTCATTTTTCCCCCAGTGAATGATTTAGAATTTTTTATGTAAATATACAGAATGTT

TTTTCTTACTTTTATAAGGAAGCAGCTGTCTAAAATGCAGTGGGGTTTGTTTTGCAATGT

TTTAAACAGAGTTTTAGTATTGCTATTAAAAGAAGTTACTTTGCTTTTAAAGAAACTTGG

CTGCTTAAAATAAGCAAAAATTGGATGCATAAAGTAATATTTACAGATGTGGGGAGATGT

AATAAAACAATATTAACTTGGAAAAAAAAAAAAAAAAAAA

>AA745593

GACTCAGNCTTCAGCCGCTCTCCTCCCCCTGGGCAAACAGGACTCATCTGATGATGTGAG

AAGAGTTCAGAGGAGGGAGAAAAATCGTATTGCCGCCCAGAAGAGCCGACAGAGGCAGAC

ACAGAAGGCCGACACCCTGCACCTGGAGAGCGAAGACCTGGAGAAACAGAACGCGGCTCT

ACGCAAGGAGATCAAGCAGCTCACAGAGGAACTGAAGTACTTCACGTCGGTGCTGAACAG

CCACGAGCCCCTGTGCTCGGTGCTGGCCGCCAGCACGCCCTCGCCCCCCGAGGTGGTGTA

CAGCGCCCACGCATTCCACCAACCTCATGTCAGCTCCCCGCGCTTCCAGCCCTGAGCTTC

CGATGCGGGGAGAGCAGAGCCTCGGGAGGGGCACACAGACTGTGGCAGAGCTGCGCCCAT

CCCGCAGAGGCCCCTGTCCACCTGGAGACCCGGAGACAGAGGCCTGGACAAGGAGTGAAC

ACGGGAACTGTCACGACTGGAAGGGCGTGAGGCCTCCCAGCAGTGCCGCAGCGTTTCGAG

GGGCGTGTGCTGGACCCCACCACTGTGGGTTGCAGGCCCAATGCAGAAGAGTATTAAGAA

AGATGCTCAAGTCCCATGGCACAGAGCAAGGCGGGCAGGGAACGGTTATTTTTCTAAATA

AATGCTTTAAAAGAAAAAAAAAAAAAAAAAAAAAAA

>AI985118

ATGCAAGGNNTAGGCAAAGATTGTTGACCCNGGAGATAGAGGTNNCAATGAGCCAGATCA

TTCCATTGCATTCCAGCTTGGGCGACAGAATGAGACTCTGTCTCAAAATTAAAAANCAAA

AAACCAAAANCAAATAGATGAAAAAGTAGACTGGAGACAAATAAAAGTGAGTTTCTAAAG

GAAATTCACAGTAATGCTGCATTAAACACTAAGCTCACTTAGGTCACTTTCTAGTGAGCT

AACCGTAACAGAGAGCCTACAGGATACACGTGAGATAATGTCACGTGTAGAAGATCGTTG

TGAATTAAAGTTCAAAATTAAGACTTCTTAGATTATGATGTAGATTTTAGAGCTCCTTAA

AACATAAAGCGAATCTTATAAATGTTCAATTCTAAAGTTATTCCACTTGGAAAAATTAGC

TTTTGGGACAATTTTTAAGAACTTTTGTGTAAAATGCAGCTCCATGTTTAGCATAATCTA

AAAATAATTTCAAGCAATCCAGAATCTTCCAAGAATGTTATTAAAGCTTTAAAACAAAGC

AAAACAAAAAGACCCTTTTGTGCCTTATATGGGAAGACTAAAAAAA

>AB038160

ACCGGGCACCGGACGGCTCGGGTACTTTCGTTCTTAATTAGGTCATGCCCGTGTGAGCCA

GGAAAGGGCTGTGTTTATGGGAAGCCAGTAACACTGTGGCCTACTATCTCTTCCGTGGTG

CCATCTACATTTTTGGGACTCGGGAATTATGAGGTAGAGGTGGAGGCGGAGCCGGATGTC

AGAGGTCCTGAAATAGTCACCATGGGGGAAAATGATCCGCCTGCTGTTGAAGCCCCCTTC

TCATTCCGATCGCTTTTTGGCCTTGATGATTTGAAAATAAGTCCTGTTGCACCAGATGCA

GATGCTGTTGCTGCACAGATCCTGTCACTGCTGCCATTGAAGTTTTTTCCAATCATCGTC

ATTGGGATCATTGCATTGATATTAGCACTGGCCATTGGTCTGGGCATCCACTTCGACTGC

TCAGGGAAGTACAGATGTCGCTCATCCTTTAAGTGTATCGAGCTGATAGCTCGATGTGAC

GGAGTCTCGGATTGCAAAGACGGGGAGGACGAGTACCGCTGTGTCCGGGTGGGTGGTCAG

AATGCCGTGCTCCAGGTGTTCACAGCTGCTTCGTGGAAGACCATGTGCTCCGATGACTGG

AAGGGTCACTACGCAAATGTTGCCTGTGCCCAACTGGGTTTCCCAAGCTATGTGAGTTCA

GATAACCTCAGAGTGAGCTCGCTGGAGGGGCAGTTCCGGGAGGAGTTTGTGTCCATCGAT

CACCTCTTGCCAGATGACAAGGTGACTGCATTACACCACTCAGTATATGTGAGGGAGGGA

TGTGCCTCTGGCCACGTGGTTACCTTGCAGTGCACAGCCTGTGGTCATAGAAGGGGCTAC

AGCTCACGCATCGTGGGTGGAAACATGTCCTTGCTCTCGCAGTGGCCCTGGCAGGCCAGC

CTTCAGTTCCAGGGCTACCACCTGTGCGGGGGCTCTGTCATCACGCCCCTGTGGATCATC

ACTGCTGCACACTGTGTTTATGACTTGTACCTCCCCAAGTCATGGACCATCCAGGTGGGT

CTAGTTTCCCTGTTGGACAATCCAGCCCCATCCCACTTGGTGGAGAAGATTGTCTACCAC

AGCAAGTACAAGCCAAAGAGGCTGGGCAATGACATCGCCCTTATGAAGCTGGCCGGGCCA

CTCACGTTCAATGGTACATCTGGGTCTCTATGTGGTTCTGCAGCTCTTCCTTTGTTTCAA

GAGGATTTGCAATTGCTCATTGAAGCATTCTTATGATGGCTGCTTTATAATCCTTGTCAG

ATATTAATAATTCCAACTCCTGATTCATGTTGGTGTTGGCATCAGTTGATTATCTTTTCT

CATTAAAATTGTGATGCTCCTAAAAAAAAAAAAAAAAAA

>X69699

TTCAGAAGGAGGAGAGACACCGGGCCCAGGGCACCCTCGCGGGCGGGCGGACCCAAGCAG

TGAGGGCCTGCAGCCGGCCGGCCAGGGCAGCGGCAGGCGCGGCCCGGACCTACGGGAGGA

AGCCCCGAGCCCTCGGCGGGCTGCGAGCGACTCCCCGGCGATGCCTCACAACTCCATCAG

ATCTGGCCATGGAGGGCTGAACCAGCTGGGAGGGGCCTTTGTGAATGGCAGACCTCTGCC

GGAAGTGGTCCGCCAGCGCATCGTAGACCTGGCCCACCAGGGTGTAAGGCCCTGCGACAT

CTCTCGCCAGCTCCGCGTCAGCCATGGCTGCGTCAGCAAGATCCTTGGCAGGTACTACGA

GACTGGCAGCATCCGGCCTGGAGTGATAGGGGGCTCCAAGCCCAAGGTGGCCACCCCCAA

GGTGGTGGAGAAGATTGGGGACTACAAACGCCAGAACCCTACCATGTTTGCCTGGGAGAT

CCGAGACCGGCTCCTGGCTGAGGGCGTCTGTGACAATGACACTGTGCCCAGTGTCAGCTC

CATTAATAGAATCATCCGGACCAAAGTGCAGCAACCATTCAACCTCCCTATGGACAGCTG

CGTGGCCACCAAGTCCCTGAGTCCCGGACACACGCTGATCCCCAGCTCAGCTGTAACTCC

CCCGGAGTCACCCCAGTCGGATTCCCTGGGCTCCACCTACTCCATCAATGGGCTCCTGGG

CATCGCTCAGCCTGGCAGCGACAAGAGGAAAATGGATGACAGTGATCAGGATAGCTGCCG

ACTAAGCATTGACTCACAGAGCAGCAGCAGCGGACCCCGAAAGCACCTTCGCACGGATGC

CTTCAGCCAGCACCACCTCGAGCCGCTCGAGTGCCCATTTGAGCGGCAGCACTACCCAGA

GGCCTATGCCTCCCCCAGCCACACCAAAGGCGAGCAGGGCCTCTACCCGCTGCCCTTGCT

CAACAGCACCCTGGACGACGGGAAGGCCACCCTGACCCCTTCCAACACGCCACTGGGGCG

CAACCTCTCGACTCACCAGACCTACCCCGTGGTGGCAGATCCTCACTCACCCTTGGCCAT

AAAGCAGGAAACCCCCGAGGTGTCCAGTTCTAGCTCCACCCCTTGCTCTTTATCTAGCTC

CGCCCTTTTGGATCTGCAGCAAGTCGGCTCCGGGGTCCCGCCCTTCAATGCCTTTCCCCA

TGCTGCCTCCGTGTACGGGCAGTTCACGGGCCAGGCCCTCCTCTCAGGGCGAGAGATGGT

GGGGCCCACGCTGCCCGGATACCCACCCCACATCCCCACCAGCGGACAGGGCAGCTATGC

CTCCTCTGCCATCGCAGGCATGGTGGCAGGAAGTGAATACTCTGGCAATGCCTATGGCCA

CACCCCCTACTCCTCCTACAGCGAGGCCTGGGGCTTCCCCAACTCCAGCTTGCTGAGTTC

CCCATATTATTACAGTTCCACATCAAGGCCGAGTGCACCGCCCACCACTGCCACGGCCTT

TGACCATCTGTAGTTGCCATGGGGACAGTGGGAGCGACTGAGCAACAGGAGGACTCAGCC

TGGGACAGGCCCCAGAGAGTCACACAAAGGAATCTTTATTATTACATGAAAAATAACCAC

AAGTCCAGCATTGCGGCACACTCCCTGTGTGGTTAATTTAATGAACCATGAAAGACAGGA

TGACCTTGGACAAGGCCAAACTGTCCTCCAAGACTCCTTAATGAGGGGCAGGAGTCCCAG

GGAAAGAGAACCATGCCATGCTGAAAAAGACAAAATTGAAGAAGAAATGTAGCCCCAGCC

GGTACCCTCCAAAGGAGAGAAGAAGCAATAGCCGAGGAACTTGGGGGGATGGCGAATGGT

TCCTGCCCGGGCCCAAGGGTGCACAGGGCACCTCCATGGCTCCATTATTAACACAACTCT

AGCAATTATGGACCATAAGCACTTCCCTCCAGCCCACAAGTCACAGCCTGGTGCCGAGGC

TCTGCTCACCAGCCACCCAGGGAGTCACCTCCCTCAGCCTCCCGCCTGCCCCACACGGAG

GCTCTGGCTGTCCTCTTTCCTCCACTCCATTTGCTTGGCTCTTTCTACACCTCCCTCTTG

GATGGGCTGAGGGCTGGAGCGAGTCCCTCAGAAATTCCACCAGGCTGTCAGCTGACCTCT

TTTTCCTGCTGCTGTGAAGGTATAGCACCACCCAGGTCCTCCTGCAGTGCGGCATCCCCT

TGGCAGCTGCCGTCAGCCAGGCCAGCCCCAGGGAGCTTAAAACAGACATTCCACAGGGCC

TGGGCCCCTGGGAGGTGAGGTGTGGTGTGCGGCTTCACCCAGGGCAGAACAAGGCAGAAT

CGCAGGAAACCCGCTTCCCCTTCCTGACAGCTCCTGCCAAGCCAAATGTGCTTCCTGCAG

CTCACGCCCACCAGCTACTGAAGGGACCCAAGGCACCCCCTGAAGCCAGCGATAGAGGGT

CCCTCTCTGCTCCCCAGCAGCTCCTGCCCCCAAGGCCTGACTGTATATACTGTAAATGAA

ACTTTGTTTGGGTCAAGCTTCCTTCTTTCTAACCCCCAGACTTTGGCCTCTGAGTGAAAT

GTCTCTCTTTGCCCTGTGGGGCTTCTCTCCTTGATGCTTCTTTCTTTTTTTAAAGACAAC

CTGCCATTACCACATGACTCAATAAACCATTGCTCTTCAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAA

>AK025615

TGCTTCATAAAATTTACCTAAGCAAGTGGTCTTGCTTGCCTCAAATCCAAGCAGTCTTGA

ACACTTGGAGGCAATTAATGAGTATATCTTAGTCAAAAGAATTGTTGGAGCTTTTTATTA

AAGCTGCAGTTTCAGTTCTGCTTTTGGGGAATTGTGCTATGAAAGCAGCTGCCAAAATAA

GCTCATTTATTTTCTTCAATCCCACTCAGTGCTCAGTCACTATATTCTGTTTCCTTTTTT

TTTTTCAAGTTGCATATTTGGTTTCCCCTTATGATTGGGAAAGATGAATTTTCAGCAGAA

AACAGTGTTTGTTCACTTTCAAAGAGTGATAGTTTCTAAAACATTTAGAGCAATAAATAT

TCATCAGAGGTACCAAGTAAGCCAGCAGAAGAGTTAAGGGTTAGAGAAATCCCTTATTTC

ATGTCTTGACTCTAAAATGATCAAAGTACTTTTCCTTGTAATGTGGATTTCTTCTTATGC

GGATATGCAAAAACTTCAGTTATACGTAGTAATGCTAGCAGGTAATTTTAGTGGACATTT

TATAACAACTGTCACTTTGTTTTGCCACATGTAGAGTTTGTTCAGCTATTTTCCAGATAT

CTCCCCACAAAAGGAGGCAAAGGGTACCAGCTTTTCAATGAGCATTACCTATTACTTGGC

AAAGATGATGAAGACTCTATTAATAGTTCATTTGATAAATGTTGACATAACCAACAATAG

AGATTAGGAAGTTAGTTTTAAGAAATCAATAGCATATAGACATTACCCTCATGGAGTTTG

TATTCTACTACTTGAACTGATTGTAGCTATAAAAGCATAGTTAGATAGCTGAATAGTTAG

ATCATAAGCAAAGAAGGCCAGAACACATCTCTTATCAAGAAATCAATGAATAGTTTATCT

CATTTTTAAAGCAACTTTATCCTTCTTTAATTCCTTCCTTTCTTCTAGTGCAAAACTACT

TAATAAGGTTGGTGTTTAGGTTAGTGTTCACACCATTCCTCATCTGGTGTGAATTACCTT

CTCTTTCTTTACTATTTACTACCAACCTAGTACATGTGTTGACTGAATTCTTTTCAAACA

ATGTTGAGTTATCATGGTGCACCTAATAAATTAACACCACAGATTACAGCATCCTTGCTG

ATTTTCTCAGCAAAGCCAGATTAGATGGAAATAAACAAAGAAAATGATCCTAGAGTGAAT

TTTTCTAGAAAATATCTATTATGAACCATGCTGTTTAAAGTATTAGCTTGAAGGTGATGG

ATCCAGCTATTCAGAAAATAACTTTCATATAACCATGATTTTGCACAGTATGAGGTCTTA

AATGTGTGGAAAGAGATAAATTTTTTATCATTACCACAAACCCCTTTTAAAGATTCAAAG

GTGGAAGAAAGTGATTTATTTTTTCTCTTCAGCATACATATATAAAAGACTTGTCAGATG

TTTAATTTGGGGAGGTTGATAATGAAACATATCAACAGAGTATAGTAGTTATAGTAGTGT

TTGTGGGTAAATAATTTCCTGGGGTCAGACATATATAAACATATTTGCTTCAAAATGATA

AAGGCATGAAATCAGTCTTAAAAATTGAAATGGGGGTGATGGGGGAGAAAAAGAAGAACA

AATTTGAAGTGCCCTTTCAAATCTGCTGGATACAAGTATTGAAGTTTTAAGTCATCTTAT

TCTGTCTGAAAGTGTATTTTTCATTCTACAATAGACCCAATCAACAAGACGTATAACTTG

AGTTGCATGATGTTCAGTTTATGTAATCTACTGTTGGGATGGTAAGAATTGATGTAGGCT

GTGGTGTAAGAATGAATTAAAATATAGTTTCACTGGCTTTTCTCTACATATCCACTATCA

CAATGGCTAGGTTTCCTGTTGCTCACTGTTGGATTCTGGAGAAAAATTTAATGAAAGATG

ATATCAGAGGAAGAATAAGTGGAGGTAGAGAAGAAAGGAGTGATAGAGGAGGGGAAAAAA

ACAAAACATATTTTTGTGTTATCCAAAGGAGCTTTTTCCTTATTCTGTCAAGCATTGAGA

TCTTCTTCAGCTTTCAATGTAGTTGCTAAATACAAATAATGCTACTAGGTAGTGACTAAA

TATAGCAAACACTTCATCAGATATTAGAATTAGGTCACACTATTGAGGTTATAATCTGAA

GGTTGTGTTACATAGAAACCACTTTAGATTATTATCAACTTGGGCTAGGCTTTATTTTAT

AATAGCATAGTAAGTAATATCTATTGTGTCATTTCTTCAACCATTTTATTCTAAGATCCA

TGAAGCTTCTTGAGGCCAAATAAAATAATAAGTTTAGACAAGAAGTAGATTGTGACTTTT

TTTCCCTTAGAGATACTATTTACTATCTCCTATCCTGATAGGTGGAAGGTTTACTGAATT

GGAAATTGGTTGACTATTAGTTTTTAACTAAAATGTGCAATAACACATTGCAGTTTCCTC

AAACTAGTTTCCTATGATCATTAAACTCATTCTCAGGGTTAAGAAAGGAATGTAAATTTC

TGCCTCAATTTGTACTTCATCAATAAGTTTTTGAAGAGTGCAGATTTTTAGTCAGGTCTT

AAAAATAAACTCACAAATCTGGATGCATTTCTAAATTCTGCAAATGTTTCCTGGGGTGAC

TTAACAAGGAATAATCCCACAATATACCTAGCTACCTAATACATGGAGCTGGGGCTCAAC

CCACTGTTTTTAAGGATTTGCGCTTACTTGTGGCTGAGGAAAAATAAGTAGTTCGAGGAA

GTAGTTTTTAAATGTGAGCTTATAGATAGAAACAGAATATCAACTTAATTATGAAATTGT

TAGAACCTGTTCTCTTGTATCTGAATCTGATTGCAATTACTATTGTACTGATAGACTCCA

GCCATTGCAAGTCTCAGATATCTTAGCTGTGTAGTGATTCTTGAAATTCTTTTTAAGAAA

AATTGAGTAGAAAGAAATAAACCCTTTGTAAATGAGGCTTGGCTTTTGTGAAAGATCATC

CGCAGGCTATGTTAAAAGGATTTTAGCTCACTAAAAGTGTAATAATGGAAATGTGGAAAA

TATCGTAGGTAAAGGAAACTACCTCATGCTCTGAAGGTTTTGTAGAAGCACAATTAAACA

TCTAAAATGGCTTTGTTACACCAGAGCCATCTGGTGTGAAGAACTCTATATTTGTATGTT

GAGAGGGCATGGAATAATTGTATTTTGCTGGCAATAGACACATTCTTTATTATTTGCAGA

TTCCTCATCAAATCTGTAATTATGCACAGTTTCTGTTATCAATAAAACAAAAGAATCCTG

TTAAAAAAAAAAAAAAAAAAAAA

>AW118445

TGGCTCTCTCCTTCAAAAGGNCCAGGCCCTGTCCCCCTTTCTCCCCGANTCCAACCCCAG

CTCCCCTGTGAAGAAAAAAGTTAAAAAATTTGTTATTTATTTGCTTTTTGCGTTGGGATG

GGTTCGTGTCCAGTCCCGGGGGTCTGATATGGCCATCACAGGCTGGGTGTTCCCAGCAGC

CCTGGCTTGGGGGCTTGACGCCCTTCCCCTTGCCCCAGGCCATCATCTCCCCACCTCTCC

TCCCCTCTCCTCAGTTTTGCCGACTGCTTTTCATCTGAGTCACCATTTACTCCAAGCATG

TATTCCAGACTTGTCACTGACTTTCCTTCTGGAGCAGGTGGCTAGAAAAAGAGGCTGTGG

GCAGGAAAGAAAGGCTCCTGTTTCTCATTTGTGAGGCCAGCCTCTGGCTTTTCTGCCGTG

GATTCTCCCCCTGTCTTCTCCCCTCAGCAATTCCTGCAAAGGGTTAAAAATTTAACTGGT

TTTTACTACTGATGACTTGATTTAAAAAAAATACAAAGATGCTGGATGCTAACTTGATAC

TAACCATCAGATTGTACAGTTTGGTTGTTGCTGTAAATATGGTAGCGTTTTGTTGTTGTT

GTTTTTTCATGCCCCATACTACTGAATAAACTAGTTCTGTGCGGGTAAAAAAAAAAAAAA

AAAAAAAAAAA

>AL137761

CACAAAGAAAAAAGAAATACCTGTAGAAGCGCATCGAAAGCTCCTGGAACAGAGTTGTGT

CTCATATTTGCAAAGATGCAGAAAAAATAAACCCGGGACATCCAGCTTTCTTTTCCTTTC

TTCTTTGACTATTCTGAGAAGCTATGCGACTAGGAGCACATTTTAGGTAAACACGTGGCT

TGAGTAGCCATAAGGCCACTCTTCCCTGTCGTGTGACCCGCGCCTGGGCCTTTAAGAGAT

ATTGGTGTTTGAAAAGGGAGGAATCTGTTTGCCCTCAGATATTTAGTTCAACTGCCTGCA

TTGCTTCCTATTTTGTTGTCCAACTCTGTAGTAGTTAGCACTGGCCTTACCAACATGTAA

AGAAATTTTCTTTACTGCCCCATGAGTAGTTGGAGGCAAAGAGAAATTTTTAAAGCGCAG

AAAAAGGCCTGCAGGGAGATGGAATTTGTTCTGCCAGAGAAACGAGATGATAGCTGTATT

TAATAAAGTTACTGACCTCTTGTCAAAATTTAAAACGCAAAAGAAGATGTTTCAAAATGC

AGAGAATGTCAGAAAACAAAAACTACAGGGACCAGACCAGTATAATGTTTAGTTTTCATT

ATACTAACTTTTGTCTAGACTGGAGTTGATTCACTATTTTTTCTTTAACTCCTCAGGAAG

CAAACCTTCCCGATGATGAAGACTTCTTGAAGGATTTCATGGGTGATTTGGGATCCCAGG

ACCATTTGGCTAGTGTGCCTAGGTGACCACATGATTGCTGTTTTACCAGGAATGCAGCAT

CCCATTGACAAAACAAGTGCTCTGAGAAGGTTTAAAATACTACAGAGAATATGGGAACAC

AGACCTTGAAATTTAGCTGAGTTGTAACAGCTGAAACTCCAAGAGGTGTCTTCCTTGTTT

GAGGTGAAACTAGTGTTGCTTCCAGAGGGCAGCTGGAAACCGTAAAGCTGTTTGGAAATC

TTTTTGACTGACTTGCTGACAAAGAGGTACTGTGATGCATTTTAACAATATCTAAGTTGA

TTTTTTTTTAAATCAAGGAAAATAAAAACCAAGCATGAATGCTATGGTATGTGCCCCTTT

TGACCATCCTGGGCTGATTAACATCATTTAAATCAAAGTAATCATAAAAAGGCATATTCT

ACTTCAATTATGTGGTCAAATAAGAGTAAACACACACACTCACACATGCTGACCCCAATT

GCCAGAGCATTACTGCACTATAAATTACGGTTAATTCCCAAATTATACTACTGTTTATCT

TATTTAACAAGTCAGAAAGCACTTTTAAAATAACTTGAGGGCTACAAGGTCATTCTATTA

ATGTCATTCTCCATTCGGGTTGTAGGCATGTGGAAGTACCCATTAAAAGATAAGTTAGAG

TTTAAATACTGATAAACAAAACCTTTTATTGCAACTGGACAGTTTCTGGAGAGTTAGCGG

AAGAATCTTGGAGTTTCCTTTGGTCAGATGAATACAACATTTCACTTTTGCAGCACTATT

TAGAATGTACTCCATGGTTCTCTTGTTCCCAACTTCCAAAAAGAACAGAAAACTTTGGTT

TACACAGAACACGGGCATCTGAGGCAGGACCTCTTCCCTGCCCTTTGATCTGACTCACAC

CTCCACATATGACGTAATCAACCCAAATTTGACACCAATTCACTCTTTTCTGCAAAGGGC

ATATTTTGAAACAAGGGACAGCCTGAGGGCGGCTATAATGAGAATGTTCATGGGGGTTAC

TGGGTCCCTAATTCTGAACTTGCTTATGACACCCAGAGTGAATAGATTCAGATTCAGAAC

CTTCTGAGAAATAACCCAAAGAAAATTTGTTACCCAGCCAATTCTTCGAAAGCTTAATAT

CAAAATATATCTTTTCAAGAAGAAAATCGTTAGAGAGAAGAATGTGGAGGGGAGAGAAAT

GGGTTTCTCATTGATATGATATTTTGTTAACCATTTCATTTTGAATTATTCAAGTTTTGG

TTAATATTGTATTCTTTTTTCGTAACTATTTTACCGTGAGAGTAGGTCATTGGGTTACTT

AGATATTTATTTTTACACAGTTATTAGTCTTCAGATAGTTTTATTTTACTTCATATGATT

TTAGTTTTTGTCAGTATAATTTTAAATCATGTTTTTCTTGGTCATCTCTTTGTGTATATT

GTGTAATTGGATTTTCATTGACTGCAAGTGGAGTGTTTGCCACTCAATTCAGTACTCAGT

ACTATGGTGACTTGTTTTCAAATAAGTCTCAGATACACATTTAGGGAGCCTTTGCTGGCC

GAATATAGACTCTGTCAGGACAGCAGGTCCCCTGATCTAAGAATTTTCCCCAATGGTTGC

TCTAAAAATGCTGCTATTTTGCTGTTCACTGTATTGCACTTAGTTAAAAAGAAGATAATG

TGAAAGATGAGAGCAGTTTTTTAAAGGATCTTTTCATATACCCAATTCCCTTATTTTCAG

ATGTCCCATCAATTTTAGATATGAAAGCTTTAAGTAAAAGTGTGTATGCCTTTCTACTGT

CAGAACAGGATGGATGCAGCCTGGGTCAGATTTATTTAAGATAAAAATCATGCAGACTCA

TCATTCATATCATAGGTGAAAAATGTAAAAACCAAATGGTTTCCACTAAAGCCACCAAGA

TCTTTTAGAAATGTTTGCACCTTTGGTGGTGGCACAGGAAAAGAGAAGAATTCAGCTGGA

GTGAATTCTAGAAGTAGATATCAGAAACGGGGCATGAAGAACAGGGGAACTGGGTGGCAT

CAGACTCCTAAAGAAGTGAGTTAATTTTCCTTCCCTTCCATTCAGATTCATGCCACAGCT

CCATATCTTGAGTATGTGTAAGAGGTGAGTTCCTTCTTCAGCCAGGGGCGGTGGCTCATG

CCTTTAATCCCAATGCTTTGGGAGGCCAAGGTGGGAGGATCACTTGTGCCTTGGGGTTCA

AGGTTGCAGTGAACCATGATTGCACCACTGCACTCCAGCCTGAGTGACAGAGCAAGACCC

TGTCTCTAAAAATATATATAAAAAGTAAAACTAAAGAACTTCTTGCCTAAACCTGAATTA

CCGCAATTTGCTGAGTGACTTTGAGAAAAATCAGACTGTTTAGTTCAGTCGGGATGAAAA

GCTTGCGATTGCTTCCCACAAGAATGGGCAATAGTGACGGCTGCAAGGTACTTTTATTTG

TTCATGAAAGAACGACAATTTTTCAAAATGTAATTAAACATAATAGAATGTTTTAAACTA

CTGGGCACTGAAACTGGAAGAAAAAGGAGGCTTTATTGAACATTCCCCTTTTTCAGTTGG

TTCAAAGTTCAGCACTGTGGTTATCATTGGTGATGCCAGAAAACATTAGTAGACTTAGAC

AATTGCTATGGCAGTTTCTAAACAGAGCTTTTTCTATACACTATTTGCAACTGGAGTGCA

ATATTGTATATTCTGTGTTAAAGAAATAAAGTATTTTTATCATTTATTAAAAAAAAAAAA

AAAAA

>AF038191

CCATCCAGAACGATGAGGCCGTGGCCCCGCTCATGAAGTACCTGGATGAGAAGCTGGCCC

TGCTGAACGCCTCGCTGGTGAAGGGGAACCTGAGCAGGGTGCTGGAGGCCCTGTGGGAGC

TACTCCTCCAGGCCATTCTGCAGGCGCTGGGTGCAAACCGTGACGTCTCTGCTGATTTCT

ACAGCCGCTTCCATTTCACGCTGGAGGCCCTGGTCAGTTTTTTCCACGCAGAGGGTCAGG

GTTTGCCCCTGGAGAGCCTGAGGGATGGAAGCTACAAGAGGCTGAAGGAGGAGCTGCGGC

TGCACAAATGTTCCACCCGCGAGTGCATCGAGCAGTTCTACCTGGACAAGCTCAAACAGA

GGACCCTGGAGCAGAACCGGTTTGGACGCCTGAGCGTCCGTTGCCATTACGAGGCGGCTG

AGCAGCGGCTGGCCGTGGAGGTGCTGCACGCCGCGGACCTGCTCCCCCTGGATGCCAACG

GCTTAAGTGACCCCTTTGTGATTGTGGAGCTGGGCCCACCGCATCTCTTTCCACTGGTCC

GCAGCCAGAGGACCCAGGTGAAGACCCGGACGCTGCACCCTGTATACGACGAACTCTTCT

ACTTTTCCGTGCCTGCCGAGGCGTGCCGCCGCCGCGCGGCCTGTGTGTTGTTCACCGTCA

TGGACCACGACTGGCTGTCCACCAACGACTTCGCTGGGGAGGCGGCCCTCGGCCTAGGTG

GCGTCACTGGTGTCGCCCGGCCCCAGGTGGGCGGGGGTGCAAGGGCTGGGCAGCCTGTCA

CCCTGCACCTGTGCCGGCCCAGAGCCCAGGTGAGATCTGCGCTGAGGAGGCTGGAAGGCC

GCACCAGCAAGGAGGCGCAGGAGTTCGTGAAGAAACTCAAGGAGCTGGAGAAGTGCATGG

AGGCGGACCCCTGAGTCCATCAGCTGCCAGCCCCGGCCCTGGCCCCCACCCCAAGTTCCC

TGAAGCATCCTCCAGCTCACTGTGGCCAGCTTTGTGCAACCAGGGCCCACGGCGCCCCTC

CTGTGCTGTGACGTGTGTGTCGTGGCTGGCCCCGCGGCGCCTACCGCCCTGGCCGTGTCT

GTCTGGTGTGTGCTGTGAACCCCTGCACCCAACCCCACATCTGGGTGGCCAACTTGGCAG

GACTTGGCCAGCAGCTGCCCAGGACACAGTGCAGGCCAGAGCGGGCTTGACCACCTGGTG

GGCCTCCCTGCCCGCTTCCTTGGGCTCCCCGGCCCTGGGTGGGCGGTGCGCAGCTGGTCT

CCAGGGACTCAGTGAGTGGCTGTGCTCTCTGCACAACGGGCAATGTGCAGACGCATTTTT

GGTAATCACAGCTGGGGAGTGAAAAGGGTGCCACTGGCACCACTGGGTGGATGGTCCAGA

GCCTCCACCCACAGAGGGGATGCAAAGGGCAGGTGAGTCAAGAACCGCATAGGTCTCCAG

TCCCCACGGGGCTCCCAGGCCGGGGAAAGGTTCCCCTGAGGTCACTCTGAGGCCAGGGAC

GTCACCCAAGGCTGGTGGTCAGTGTGAAGGGCTCCGTGCCAACTGGTCAGCTGTCCTTCA

CGCACATATCCGTGGCCACCTGAGACCTGCTCCACGACCCTTCCAGGCAGAGCCGAGAGT

TCGCCCCAACCCTTCCCCAGGCCCAGTGTGAAAAACAGACTCACAAGGGGCTTCTTGGCC

TGCAGCTTCATTTGCGAGAGCGCCGAGGCAGGACACAGAGCACAGCTGTGCTGGAAGTGT

GGGGAGAACCCGGACAGCTCAGTCCTGCCAGCAGCCGCAAAGAGCCGAGGCTGCCAGGCC

CATTTATGTCCCTCATGTCTCTAGATTTTCTCGTCACCCAGCCTCAAAAATATATGTGTC

TGCAACCCTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>BC016340

GGGGGGGCTCCGTGACAGCCAACGCAGTGACCCTCGCCCCTTCCTTGGCAGCACATCATG

CTTGTGCAGCGGCAGATGTCTGTGATGGAAGAGGACCTGGAAGAATTCCAGCTCGCTCTG

AAACACTACGTGGAGAGTGCTTCCTCCCAAAGTGGATGCTTGCGTATTTCTATACAGAAG

CTTTCAAATGAATCTCGCTACATGATCTATGAGTTCTGGGAGAATAGTAGTGTATGGAAT

AGCCACCTTCAGACAAATTATAGCAAGACATTCCAAAGAAGTAATGTGGATTTCTTGGAA

ACTCCAGAACTCACATCTACAATGCTAGTTCCTGCTTCGTGGTGGATCCTGAACAACTAG

ATGTTCCTAGACATTTTCTTTATGGTTCCAAGTGCAAAACAGGTGTTCTTATCTAAAACG

TCAATTAGAAAATTATCTGCGGTTGTTAATCTACTGTATATTTTTGTTTGGTATATTTAC

TAAGTGCACTCTTTCAAAACTTATTCTATAACTTTATCAATTCATGTGAATTTTAGCTCA

ATTTTCAAAGTTCACTAATATTCTCAATATTTAATGCTAAATGCTTTGCTACATTGTAAC

TCACCTAAAACCTTTTAGTGACAAAATCCTAATATGTGGAAAAAAGCATATGCATAAAGG

AATAATATTGTGAAAATGAATCTGTTATGATAAAGAAAAAATAAAGTGGAAACTTTTAGA

GTATTACTTCATAGGGCAGATTTTGTAAACTGTCGTATACTGTAAAGGGTTAAATCAGCG

TTTTGTGATTTTTAAGTAACTGTGAGTGAAGTTTATTCTTCAACAATGTCTACTCCATCC

CCAACCCAACTCACAGCCCTATGACTACTATCTTTGCATTAGTTAAAAAGTTAGTATATA

GGCATCAAACAACCTTGGCTGTAACCTATAGAATCTCTATCCATGTATCAGGTTATAGAC

TGGTTTTTCAAAAGTGAACAATCCTGTGATAAGTTGGAGTACCATTTAGTAATACAGCAA

CATTGTGTCATTTATTAGCATCATAATTCTTTGTTATGTAAGTTAAATATATCAAGAAAG

AAGAGACTGTTTGGAAAAATGTGGTTCAAGTTTTATGCTATATAGTTTTGGTATGCGATA

CAGACAGCTAACTTTTCTTATGAAAAATACATATTTGCATGTAAACAATGATTTCAAAAT

ACTTGAAAAATAAAATTTTAACCCAAATGAATAACTAAGAAATATAAAACAAGCACAAAA

TCTTAGGGAAGTCATAAAATAGTAGTGAAAGTATTAGACAGAAGACATCTGTTTTCGAAT

TTCAACACTAGAATGACTAAAACTATCTACCTATAGAACTATCTGTAGATAGTATACTAT

CTACACTCTGCTCAACAAGCTCAGAAATTAAATATTTTTAGTAATAAAAATCTGTTCTGG

TTATAAACCTTGCTAATGAAAATACAATACATATAAAAATGTATAGCCATGTTATTTTCT

AGTATAAATTCCTTTGAAACTATAAGTCTTTGAGGAAAATTATAAGGTAAAATTTTCCTG

TTTTTCCCCCTTTGAAAAACTCAGGAAAAAAGGAAGATTGAACTAATAAAATTTTATTTC

TTAAATATAAATTTGACCTAAAATATTTTCTCAAACTAATTCATGAAACAGCAACTTTTA

CCAATACCTTTGTATACTCTCAGTTCTCATTCAGTATAAATAAAATTTTAAAATCCTTTC

ATAGTTCTATTAGAAATAAGTAGTAAATTTTGATATATTGTACATACACACGTGTGTGTG

TGTGTGTGTGTGTGTGTGTATTTGTGTGCCTCTGGTCAACTCTAAGGATGACAGACACTG

TGTAACAACACCTGGGTCAACTCTTTTAATTTATATACAAAGCAAAGAACAACATTAATG

GAGATGCACAATGATTATTCAAACAAGCTATATATATGTACAAAGGCAAACAGACACATA

ACAGTCTCTGCAGACTGATTGTATATAGTAAGAAAAGATCAAAAGACTTTAAAACCTAAA

TGACTTTTGACATACAAACTCTTCTTGAGAATGTTTGTTGTAAATGGTTTCAAAAATACA

AATTATAGCCAATCAAAACATTGCTTTGGTTGGTGCATTTAAGTATCCAACTCAAAAAGC

ATATCAAATATTTTGGGTACTAGGCAGTTTCCAAAGTAGCATGGTAGTATTACTTGTTAA

AAGGGTTCTGTTTTCATTAACAGTACTAAGTGGAAGGGATCTGCAGATTCCAAATTGGAA

TAAGCTCTATCATATTCTGAAACAAGAATTAGAATGACTTGAGAACGGGCAAATAACAAA

GCAAACCAATATAATTATATGGTCATTCTGACCCCAGCTCTTATACAAATTATACATGTA

TTTTTGTGTATGTTTGTGAGAGTTGTATGTATGTGAATGTGTGTGAGTGTGTATTCACAT

ACACATATATACTGGAACCTATAGTAGAAAAGGAAACTAGTAGGGCCAAAAAAAAAAAGA

AAAAGAAAAAGAAAAAAGAAAAAAAAAGAAAAAACTGGGACCTAAGTATAAATATCTCAT

CCTAAAGTAAACAATAAGTTTATAGTTAACGAAGATTTTTTTCTATTTAAAACCCCATTT

TCCTAAAGAACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

>BC013282

GGCACGAGGGCAGGGGGAAGGGAAGTGCGGCTCGGTCGGCGCGGGTGGAGGGGGCGTGAG

GCCGCCCTACGGTGGCCGTCGAGGGACGGCGCTACGGCTCCCACGCTAGGCCAAACGCCT

CCGGCGGCCGCGCCCGAGAGCCCCTTCACCTGCAGGGCGACCCCAGCCGGCGACGCGTGA

ACCACGCCCTCAGCCGCCTTGCCAGCGCCCCCAGCCGCGCGCCCCAGCACCATGCGGCCG

CCCTGCGCACGGAGCCCCGAGGGACAGGGGCACCCGCAGGCCCGGCCCCTAGCACCGCCG

GCCGGCCCCGAGGTCCGGGACGCCGGCGCCGCCGCGGAGAGGGCACCGGGCCGACGCCTC

CCCCCAGGGTCAGCTGCGGGCTCCCAGGCCTAGGCGCCCATGACCCCTACGCCAACCGCC

GCCTGGACACCGCCGCCGCCACTGCGACCTAGCGCCGCCGCCGCCGGGGCCCAATGCCGG

TCATGCCCATTCCGCGGCGGGTGCGCTCCTTCCACGGCCCGCACACCACCTGCCTGCATG

CGGCCTGCGGGCCCGTGCGCGCCTCCCACCTGGCCCGCACCAAGTACAACAACTTCGACG

TGTACATCAAGACGCGCTGGCTGTACGGCTTCATCCGCTTCCTACTCTACTTTAGCTGCA

GCCTGTTCACTGCGGCGCTCTGGGGTGCGCTGGCCGCCCTCTTCTGCCTACAGTACCTGG

GCGTTCGCGTCCTGCTGCGCTTCCAGCGCAAGCTGTCGGTGCTGCTGCTGCTGCTGGGCC

GCCGGCGCGTGGACTTCCGCCTGGTGAACGAGCTGCTCGTCTATGGCATCCACGTCACCA

TGCTGCTGGTCGGGGGCCTGGGCTGGTGCTTCATGGTCTTCGTGGACATGTGAGGGCCGT

GGGTGCGAGCTTGATGTATCGTCCCGGCCTGTGGCTGTGTTCTCTCCATGGGTGGGGTCG

GCCAGCGCCTTCCCTTCGCCCATCCCCCAGGCAGTCGCTGCTGCCCGGCGCCCACGGAGA

GAAAAGAAAGGGCTGAGACTTCTGTGATGGGGGCGCGGACACCACCCCTAGGCTGGCTTC

CTGGACCCACCCTCCCCGTATGCACTCTCAGGGGCAGCGCCCACCTGCCGGTGGCTCCTG

CTCACATGTCTTCGGGTCGTACTGCGGGGTGGGCCCTCCGTTCCGCCTCTCTGTGGGCCT

CTCTCCAGGACCACAGCTGCCAGGGACTTTAGACATCACCCTGGGAGGCCCCTGGACACA

GAGGGCTGTGTGCCCAGGAGCAATTCCGGAGGGGGGCCCTCCTGGCTGCACAGCCCCTTC

TGCGTGCCCTGGCCCCAGCCCCAGCCAACGGGACACGGAAGGCTCCCCTCGCTGACACAC

CACACTGCCACAAAGCTGCTTACTCTGCCCTGGGCCGCCTGAGGCCTGGCACTGCCCGCG

GACCACCCTGTGTGTGTCATCCTGAGGGGCTGTGTGGGTCCTGAGTCCCCAGCCAGCCTT

CAGGGTCCCCTTGGATTGTGTAGATGCAGTCTAGCGGGGGGCCGGAGAAGGGCTCAGGTG

GGAGGGGCCTCAGCAGGCTCCCAGCTCAGGGGCTGGCCTGGGGGGAACCCTGGGAGCCAG

GGGCTGACTCCAGCAACACTGGCCTGTCTGCCTGTTCTGGGAGGGCTGTGAGGATGTCTT

GCAGATGCTCTGGATTTCTGCGGAGGCACCTCCATTCCTTTCTGGCTTTTTTTGCGGGGG

AGGGCTTTGGGCCTCTTTCTTTGAGGGAACACCGTCAAAGAAAGCCTGGGAGATCGAGGC

TTCAGTGAGCCAGGATGGAAACGCGTGTCCCAAGTGTCCGGAGCAGGCGGCAGAGGCCTC

AGTGCGGCAAACACAGCCCCAGAGCCTGTGTGGCACCAGCAGCATCTTAGAGCCCCAGGT

ATATGCTGAGATCTTATCTCACGCTGTCCTCCAGTGTCTGGGGGGCCCAAATGATGGCAC

AGGGTCAGGTGGGCTGGAGGGGCGCAGATGCCTGTGTTCAGGGAGGGTGGCCACCATGGG

CCGAGGTCTCACCCAGGACCCCTTGCTCTGCTCCTCAGCCTTGCAGTCACGGCAGCACTA

TGGTGGACTGCCCATGGCCGTGTGACTTTGGGGGCAAGTGGGAGGGCGCCCTGAATAATG

ATTGCAAGGACAACAGGCAGAGGCTACCCTAGAGCAGGACACAGGGTGTGGTACTGACAA

CCCTAGTGTCACCTCAAATCCATGTCCCCACACTCTGGGCATGGGTGGGACTTGTGACCC

TACCCTGTCAGGCGGACCAGTGGCCCAGGAGCCATGAGGACAGTTGTGTGCCACTGGAAG

AGAAACTTTTTGAAAAACCCTAAATCAGGTAGAGAAAGCAAAAAATCTCTGGCCGTAAAC

CGTGCTCTCTAATTTATCGGCAGCTTCTGTGGATGACCTCTGATGAGCCCGGGCTGCGTC

CACGCCCTGGGCAGGTAGGCGGGAGCTTCCCTGCGTGGGCCTCATTTCTTGCTGCAGAGA

ATCTTTTGCACTAAGTCATGCTGTTTCCTCAAAGAAGCTTTGTTTTTTGTTAACGTATTA

CTCAGAGTCACCCAAGCCTCTTGGCTGAGGGTGAAGGTGGGACGGGAGGCGGGAGGGGGC

TGGTGGTGCCGCTCGTGCGGTGTCAACGCTGCAGGGAGTTGTGGCACCTTGGTGCCCTCT

GAGCACCTGGCCGCCTGCTGTCCCCGGTGCCTGTGAAATTCGTCATGCCATGACCCACCT

GCATTAAACCTATTTTTTTAATGTGTTAAAAAAAAAAAAAAAAAA

>H09748

GNGGAAACACGGGCCAAACCCGTGANTTTGGTGCCCCTTGTAAACTCANCCCCTGCAAAN

CCAAAGACCCCAATGGATTTAAAGTTGNTTGGCATTTGTACTGGCAAGGCAAAANATTTT

TAANTACCTTTTCCTAATACTTATTGTATGAGCTTTTGNTGTTTACTTGGAGGTTTTGTC

TTTTACTACAAGTTTGGAACTATTTANTATTGCCTTGGTATTTGTGCTCTGTTTAAGAAA

CAGGCACTTTTTTTTATTATGGATAAAATGTTGAGATGACAGGAGGTCATTTCAATATGG

CTTAGTAAAATATTTATTGTTCCTTTATTCTCTGTACAAGATTTTGGGCCTCTTTTTTTC

CTTAATGTCACAATGTTGAGTTCAGCATGTGTCTGTCCATTTCATTTGTACGCTTGTTCA

AAACCAAGTTTGTTCTGGTTTCAAGTTATAAAAATAAATTGGACATTTAACTTGATCTCC

AAAAAAAAAAAAAAAA

>BC001665

GGCACGAGGCAATCTGAGGAGCAGGAGGACCGGGGCGCCGGTGTCCTGCCGCCTCCTTCT

CCTTGCTCTCACCTGCGCCTATTAGTCCACGCGCCTTCAAGGCCAGGGGCTACAGCCCAG

ACAGAGAGGGGACAGCAGAGGGAGAGAGAGCACCTGAGGATACAGAGCTGGCACTGGACT

GCCTTTTCACCCCCCAGGTGATGAGTGAGGTTCGAAGAACGGAAGATTTAAAAAGCAGCC

GGGGCCTCCGTATTGAATGAAAGACCCAGTGCAAAGACATCACCATGAACACTAGCATTC

CTTATCAGCAGAATCCTTACAATCCACGGGGCAGCTCCAATGTCATCCAGTGCTACCGCT

GTGGAGACACCTGCAAAGGGGAAGTGGTCCGCGTGCACAACAACCACTTCCACATCAGAT

GCTTCACCTGTCAAGTATGTGGCTGTGGCCTGGCCCAGTCAGGCTTCTTCTTCAAGAACC

AGGAGTACATCTGCACCCAGGACTACCAGCAACTCTATGGCACCCGCTGTGACAGCTGCC

GGGACTTCATCACAGGCGAAGTCATCTCGGCCCTGGGCCGCACTTACCACCCCAAGTGCT

TCGTGTGCAGCTTGTGCAGGAAGCCTTTCCCCATTGGAGACAAGGTGACCTTCAGCGGTA

AAGAATGTGTGTGCCAAACGTGCTCCCAGTCCATGGCCAGCAGTAAGCCCATCAAGATTC

GTGGACCAAGCCACTGTGCCGGGTGCAAGGAGGAGATCAAGCACGGCCAGTCACTCCTGG

CTCTGGACAAGCAGTGGCACGTCAGCTGCTTCAAGTGCCAGACCTGCAGCGTCATCCTCA

CCGGGGAGTATATCAGCAAGGATGGTGTTCCATACTGTGAGTCCGACTACCATGCCCAGT

TTGGCATTAAATGTGAGACTTGTGACCGATACATCAGTGGCAGAGTCTTGGAGGCAGGAG

GGAAGCACTACCACCCAACCTGTGCCAGGTGTGTACGCTGCCACCAGATGTTCACCGAAG

GAGAGGAAATGTACCTCACAGGTTCCGAGGTTTGGCACCCCATCTGCAAACAGGCAGCCC

GGGCAGAGAAGAAGTTAAAGCATAGACGGACATCTGAAACCTCCATCTCACCCCCTGGAT

CCAGCATTGGGTCACCCAACCGAGTCATCTGCGACATCTACGAGAACCTGGACCTCCGGC

AGAGACGGGCCTCCAGCCCGGGGTACATAGACTCCCCCACCTACAGCCGGCAGGGCATGT

CCCCCACCTTCTCCCGCTCACCTCACCACTACTACCGCTCTGGTGATTTGTCTACAGCAA

CCAAGAGCAAAACAAGTGAAGACATCAGCCAGACCTCCAAGTACAGTCCCATCTACTCGC

CAGACCCCTACTATGCTTCGGAGTCTGAGTACTGGACCTACCATGGGTCCCCCAAAGTGC

CCCGAGCCAGAAGGTTCTCGTCTGGAGGAGAGGAGGATGATTTTGACCGCAGCATGCACA

AGCTCCAAAGTGGAATTGGCCGGCTGATTCTGAAGGAAGAAATGAAGGCCCGGTCGAGCT

CCTATGCAGATCCCTGGACCCCTCCCCGGAGCTCCACCAGCAGCCGGGAAGCCCTGCACA

CAGCTGGCTATGAGATGTCCCTCAATGGCTCCCCTCGGTCGCACTACCTGGCTGACAGTG

ATCCTCTCATCTCCAAATCTGCCTCCCTGCCTGCCTACCGAAGAAATGGGCTGCACAGGA

CACCCAGCGCAGACCTCTTCCACTACGACAGCATGAACGCAGTCAACTGGGGCATGCGAG

AGTACAAGATCTACCCTTATGAACTGCTGCTGGTGACTACAAGAGGAAGAAACCGACTGC

CCAAGGATGTAGACAGGACCCGTTTAGAGGGAAACTTTTGGAAGAGTGGCTGCTTATGAG

ATTCCAAAATGAAGTGTTGGCCAACACCGCTCATGGCCATCCTGGATTTTCCCAGTGGCT

TCCCTTCCTGCTCGCCTCCCTGAACAGGGGAGAAAGCTTAACCTCTCTTCTCCTCTCCAA

ACCTTTCACCTTGAATGGGTAATGTTTGGTGGGGGCTGTTCCTTCTTGGAGAAGCCTTGA

GTCGGACCATTTTGAGATCATGGAGGAAGGATGAAGAAGTGAAAATGACAATAATGACTC

TCAAGAGGCTGGCGATGTGACATGGCAAATGTAGAACTGACTTAAATTGAACAAACCCTC

ACTGAGCACCTCTGATGTTGAGCACCTGCTGAATACTGAGCACTGAATGGGGGAGGGGGA

GGGGAGCACGGGGTGAGTCAACCTGGGACTCGGTCTCAGGGATATGCCTACCAATAGCGG

GTATCGTAAGGCATGTACCCAAACATAACGGATGTAAGGCAGAAAGTGATCGGAGAAGGA

ATGAGAAAGTGTGCGTGATGTTAATGAAAAGTCATATGCAGCTAGAGCAGACCCAGGAAA

GCTTTCTGGAAGAGATTGCATCTGAGGAAATTCAGGAAGGATCTTTGTAGATTGGGGGGA

GATTCTAAATTGAAGGGGTGATGGGGTGAGGGGCCAGAGGGAAGTCTGCTGTGTTCTCAT

GTAGGATGTCAGCCCTCCCTGCAACTTCTCTTTTTGGCCAATGTCTTTTCACTTTCCTGA

CCCTTTAGAATCATCCCCAGCCAGACGCAATCATGGAAGTTGCCTTATTGTCACTGGTTA

AGAACTTGGCGAGATTGAAGGGCTTTTGTTATTGTTGTTGGATATTTTTGTTTCCCATAA

AAGCACATCATTTCAACCCTAAAAAAAAAAAAAAAAAAAAAA

>BC016451

GAAGAATTAGATACTTTTGAGTGGGCTTTGAAGAGCTGGTCTCAGTGTTCCAAACCCTGT

GGTGGAGGTTTCCAGTACACTAAATATGGATGCCGTAGGAAAAGTGATAATAAAATGGTC

CATCGCAGCTTCTGTGAGGCCAACAAAAAGCCGAAACCTATTAGACGAATGTGCAATATT

CAAGAGTGTACACATCCACTCTGGGTAGCAGAAGAATGGGAACACTGCACCAAAACCTGT

GGAAGTTCTGGCTATCAGCTTCGCACTGTACGCTGCCTTCAGCCACTCCTTGATGGCACC

AACCGCTCTGTGCACAGCAAATACTGCATGGGTGACCGTCCCGAGAGCCGCCGGCCCTGT

AACAGAGTGCCCTGCCCTGCACAGTGGAAAACAGGACCCTGGAGTGAGTGTTCAGTGACC

TGCGGTGAAGGAACGGAGGTGAGGCAGGTCCTCTGCAGGGCTGGGGACCACTGTGATGGT

GAAAAGCCTGAGTCGGTCAGAGCCTGTCAACTGCCTCCTTGTAATGATGAACCATGTTTG

GGAGACAAGTCCATATTCTGTCAAATGGAAGTGTTGGCACGATACTGCTCCATACCAGGT

TATAACAAGTTATGTTGTGAGTCCTGCAGCAAGCGCAGTAGCACCCTGCCACCACCATAC

CTTCTAGAAGCTGCTGAAACTCATGATGATGTCATCTCTAACCCTAGTGACCTCCCTAGA

TCTCTAGTGATGCCTACATCTTTGGTTCCTTATCATTCAGAGACCCCTGCAAAGAAGATG

TCTTTGAGTAGCATCTCTTCAGTGGGAGGTCCAAATGCATATGCTGCTTTCAGGCCAAAC

AGTAAACCTGATGGTGCTAATTTACGCCAGAGGAGTGCTCAGCAAGCAGGAAGTAAGACT

GTGAGACTGGTCACCGTACCATCCTCCCCACCCACCAAGAGGGTCCACCTCAGTTCAGCT

TCACAAATGGCTGCTGCTTCCTTCTTTGCAGCCAGTGATTCAATAGGTGCTTCTTCTCAG

GCAAGAACCTCAAAGAAAGATGGAAAGATCATTGACAACAGACGTCCGACAAGATCATCC

ACCTTAGAAAGATGAGAAAGTGAACCAAAAAGGCTAGAAACCAGAGGAAAACCTGGACAA

CCTCTCTCTTCCCATGGTGCATATGCTTGTTTAAAGTGGAAATCTCTATAGATCGTCAGC

TCATTTTATCTGTAATTGGAAGAACAGAAAGTGCTGGCTCACTTTCTAGTTGCTTTCATC

CTCCTTTTGTTCTGCATTGACTCATTTACCAGAATTCATTGGAAGAAATCACCAAAGATT

ATTACAAAAGAAAAATATGTTGCTAAGATTGTGTTGGTCGCTCTCTGAAGCAGAAAAGGG

ACTGGAACCAATTGTGCATATCAGCTGACTTTTTGTTTGTTTTAGAAAAGTTACAGTAAA

AATTAAAAAGAGATACCAATGGTTTACACTTTAACAAGAAATTTTGGATATGGAACAAAG

AATTCTTAGACTTGTATTCCTATTTATCTATATTAGAAATATTGTATGAGCAAATTTGCA

GCTGTTGTGTAAATACTGTATATTGCAAAAATCAGTATTATTTTAAGAGATGTGTTCTCA

AATGATTGTTTACTATATTACATTTCTGGATGTTCTAGGTGCCTGTCGTTGAGTATTGCC

TTGTTTGACATTCTATAGGTTAATTTTCAAAGCAGAGTATTACAAAAGAGAAGTTAGAAT

TACAGCTACTGACAATATAAAGGGTTTTGTTGAATCAACAATGTGATACGTAAATTATAG

AAAAAGAAAAGAAACACAAAAGCTATAGATATACAGATATCAGCTTACCTATTGCCTTCT

ATACTTATAATTTAAAGGATTGGTGTCTTAGTACACTTGTGGTCACAGGGATCAACGAAT

AGTAAATAATGAACTCGTGCAAGACAAAACTGAAACCCTCTTTCCAGGACCTCAGTAGGC

ACCGTTGAGGTGTCCTTTGTTTTTGTGTGTGTGTGTTCTTTTTTAATTTTCGCATTGTTG

ACAGATACAAACAGTTATACTCAATGTACTGTAATAATCGCAAAGGAAAAAGTTTTGGGA

TAACTTATTTGTATGTTGGTAGCTGAGAAAAATATCATCAGTCTAGAATTGATATTTGAG

TATAGTAGAGCTTTGGGGCTTTGAAGGCAGGTTCAAGAAAGCATATGTCGATGGTTGAGA

TATTTATTTTCCATATGGTTCATGTTCAAATGTTCACAACCACAATGCATCTGACTGCAA

TAATGTGCTAATAATTTATGTCAGTAGTCACCTTGCTCACAGCAAAGCCAGAAATGCTCT

CTCCAGGGAGTAGATGTAAAGTACTTGTACATAGAATTCAGAACTGAAGATATTTATTAA

AAGTTGATTTTTTTTTCTTGATAGTATTTTTATGTACTAAATATTTACACTAATATCAAT

TACATATTTTGGTAAACTAGAGAGACATAATTAGAGATGCATGCTTTGTTCTGTGCATAG

AGACCTTTAAGCAAACTACTACAGCCAACTCAAAAGCTAAAACTGAACAAATTTGATGTT

ATGCAAACATCTTGCATTTTTAGTAGTTGATATTAAGTTGATGACTTGTTTCCCTTCAAG

GAAACATTAAATTGTATGGACTCAGCTAGCTGTTCAATGAAATTGTGAATTAGAAACATT

TTTAAAAGTTTTTGAAAGAGATAAGTGCATCATGAATTACATGTACATGAGAGGAGATAG

TGATATCAGCATAATGATTTTGAGGTCAGTACCTGAGCTGTCTAAAAATATATTATACAA

ACTAAAATGTAGATGAATTAACCTCTCAAAGCACAGAATGTGCAAGAACTTTTGCATTTT

AATCGTTGTAAACTAACAGCTTAAACTATTGACTCTATACCTCTAAAGAATTGCTGCTAC

TTTGTGCAAGAACTTTGAAGGTCAAATTAGGCAAATTCCAGATAGTAAAACAATCCCTAA

GCCTTAAGTCTTTTTTTTTTTCCTAAAAATTCCCATAGAATAAAATTCTCTCTAGTTTAC

TTGTGTGTGCATACATCTCATCCACAGGGGAAGATAAAGATGGTCACACAAACAGTTTCC

ATAAAGATGTACATATTCATTATACTTCTGACCTTTGGGCTTTCTTTTCTACTAAGCTAA

AAATTCCTTTTTATCAAAGTGTACACTACTGATGCTGTTTGTTGTACTGAGAGCACGTAC

CAATAAAAATGTTAACAAAATATAAAAAAAAAAAAAAA

>BF510316

TCCTGTGTTCTAGACCTCTGGAGGCTGCTGTGGGGACCACACTGATCCTGGAGAAAAGGG

ATGGAGCTGAAAAAGATGGAATGCTTGCAGAGCATGACCTGAGGAGGGAGGAACGTGGTC

AACTCACACCTGCCTCTTCCTGCAGCCTCACCTCTACCTGCCCCCATCATAAGGGCACTG

AGCCCTTCCCAGGCTGGATACTAAGCACAAAGCCCATAGCACTGGGCTCTGATGGCTGCT

CCACTGGGTTACAGAATCACAGCCCTCATGATCATTCTCAGTGAGGGCTCTGGATTGAGA

GGGAGGCCCTGGGAGGAGAGAAGGGGGCAGAGTCTTCCCTACCAGGTTTCTACACCCCCG

CCAGGCTGCCCATCAGGGCCCAGGGAGCCCCCAGAGGACTTTATTCGGACCAAGCAGAGC

TCACAGCTGGACAGGTGTTGTATATAGAGTGGAATCTCTTGGATGCAGCTTCAAGAATAA

ATTTTTCTTCTCTTTTCAAAAATGTATAAAAATCATTATACATAGCATTAAAGAAACATT

TTTGAGAAGTACAAAACAAAAAAAAAA

>AF301598

CGGGCGCCGCAGGAGCGAGTGAGCTGGGAGCGAGGGGCGAAGGCGCGGAGAAGCCCGGCC

GCCCGGTGGGCGGCAGAAGGCTCAGCCGAGGCGGCGGCGCCGACTCCGTTCCACTCTCGG

CCCGGATCCAGGCCTCCGGGTTCCCAGGCGCTCACCTCCCTCTGACGCACTTTAAAGAGT

CTCCCCCCTTCCACCTCAGGGCGAGTAATAGCGACCAATCATCAAGCCATTTACCAGGCT

TCGGAGGAAGCTGTTTATGTGATCCCCGCACTAATTAGGCTCATGAACTAACAAATCGTT

TGCACAACTTGTGAAGAAGCGAACACTTCCATGGATTGTCCTTGGACTTAGGGCGCCCTG

CCCGCCTTTTGCAGAGGAGAAAAAACTTTTTTTTTTTTTTGCCTCCCCCGAGAACTTTCC

CCCCTTCTCCTCCCTGCCTCTAACTCCGATCCCCCCACGCCATCTCGCCAAAAAAAAAAA

AAAAAAAAAAAAAGAAAAAAAAAGAAAAAAAAAGAAAAAAAATTACCCCAATCCACGCCT

GCAAATTCTTCTGGAAGGATTTTCCCCCCTCTCTTCAGGTTGGGCGCGTTTGGTGCAAGA

TTCTCGGGATCCTCGGCTTTGCCTCTCCCTCTCCCTCCCCCCTCCTTTCCTTTTTCCTTT

CCTTTCCTTTCTTTCTTCCTTTCCTTCCCCCCACCCCCACCCCCACCCCAAACAAACGAG

TCCCCAATTCTCGTCCGTCCTCGCCGCGGGCAGCGGGCGGCGGAGGCAGCGTGCGGCGGT

CGCCAGGAGCTGGGAGCCCAGGGCGCCCGCTCCTCGGCGCAGCATGTTCCAGCCGGCGCC

CAAGCGCTGCTTCACCATCGAGTCGCTGGTGGCCAAGGACAGTCCCCTGCCCGCCTCGCG

CTCCGAGGACCCCATCCGTCCCGCGGCACTCAGCTACGCTAACTCCAGCCCCATAAATCC

GTTCCTCAACGGCTTCCACTCGGCCGCCGCCGCCGCCGCCGGTAGGGGCGTCTACTCCAA

CCCGGACTTGGTGTTCGCCGAGGCGGTCTCGCACCCGCCCAACCCCGCCGTGCCAGTGCA

CCCGGTGCCGCCGCCGCACGCCCTGGCCGCCCACCCCCTACCCTCCTCGCACTCGCCACA

CCCCCTATTCGCCTCGCAGCAGCGGGATCCGTCCACCTTCTACCCCTGGCTCATCCACCG

CTACCGATATCTGGGTCATCGCTTCCAAGGGAACGACACTAGCCCCGAGAGTTTCCTTTT

GCACAACGCGCTGGCCCGAAAGCCCAAGCGGATCCGAACCGCCTTCTCCCCGTCCCAGCT

TCTAAGGCTGGAACACGCCTTTGAGAAGAATCACTACGTGGTGGGCGCCGAAAGGAAGCA

GCTGGCACACAGCCTCAGCCTCACGGAAACTCAGGTAAAAGTATGGTTTCAGAACCGAAG

AACAAAGTTCAAAAGGCAGAAGCTGGAGGAAGAAGGCTCAGATTCGCAACAAAAGAAAAA

AGGGACGCACCATATTAACCGGTGGAGAATCGCCACCAAGCAGGCGAGTCCGGAGGAAAT

AGACGTGACCTCAGATGATTAAAAACATAAACCTAACCCCACAGAAACGGACAACATGGA

GCAAAAGAGACAGGGAGAGGTGGAGAAGGAAAAAACCCTACAAAACAAAAACAAACCGCA

TACACGTTCACCGAGAAAGGGAGAGGGAATCGGAGGGAGCAGCGGAATGCGGCGAAGACT

CTGGACAGCGAGGGCACAGGGTCCCAAACCGAGGCCGCGCCAAGATGGCAGAGGATGGAG

GCTCCTTCATCAACAAGCGACCCTCGTCTAAAGAGGCAGCTGAGTGAGAGACACAGAGAG

AAGGAGAAAGAGGGAGGGAGAGAGAGAAAGAGAGAGAAAGAGAGAGAGAGAGAGAGAGAG

AGAAAGCTGAACGTGCACTCTGACAAGGGGAGCTGTCAATCAAACACCAAACCGGGGAGA

CAAGATGATTGGCAGGTATTCCGTTTATCACAGTCCACTTAAAAAATGATGATGATGATA

AAAACCACGACCCAACCAGGCACAGGACTTTTTTGTTTTTTGCACTTCGCTGTGTTTCCC

CCCCATCTTTAAAAATAATTAGTAATAAAAAACAAAAATTCCATATCTAGCCCCATCCCA

CACCTGTTTCAAATCCTTGAAATGCATGTAGCAGTTGTTGGGCGAATGGTGTTTAAAGAC

CGAAAATGAATTGTAATTTTCTTTTCCTTTTAAAGACAGGTTCTGTGTGCTTTTTATTTT

GATTTTTTTTCCCAAGAAATGTGCAGTCTGTAAACACTTTTTGATACCTTCTGATGTCAA

AGTGATTGTGCAAGCTAAATGAAGTAGGCTCAGCGATAGTGGTCCTCTTACAGAGAAACG

GGGAGCAGGACGACGGGGGGGCTGGGGGTGGCGGGGGAGGGTGCCCACAAAAAGAATCAG

GACTTGTACTGGGAAAAAAACCCCTAAATTAATTATATTTCTTGGACATTCCCTTTCCTA

ACATCCTGAGGCTTAAAACCCTGATGCAAACTTCTCCTTTCAGTGGTTGGAGAAATTGGC

CGAGTTCAACCATTCACTGCAATGCCTATTCCAAACTTTAAATCTATCTATTGCAAAACC

TGAAGGACTGTAGTTAGCGGGGATGATGTTAAGTGTGGCCAAGCGCACGGCGGCAAGTTT

TCAAGCACTGAGTTTCTATTCCAAGATCATAGACTTACTAAAGAGAGTGACAAATGCTTC

CTTAATGTCTTCTATACCAGAATGTAAATATTTTTGTGTTTTGTGTTAATTTGTTAGAAT

TCTAACACACTATATACTTCCAAGAAGTATGTCAATGTCAATATTTTGTCAATAAAGATT

TATCAATATGCCAAAAAAAAAAAAAAA

GTGGCGGCGGAGGCGGCGGAGGCCAGGGAGGAAGATGTCGTAATGAGCGATCCACAGACC

AGCATGGCTGCCACTGCTGCTGTGAGTCCCAGTGACTACCTGCAGCCTGCCGCCTCCACC

ACCCAGGACTCCCAGCCATCTCCCTTAGCCCTGCTTGCTGCAACATGTAGCAAAATTGGC

CCTCCAGCAGTTGAAGCTGCTGTGACACCTCCTGCTCCCCCACAGCCCACACCGCGGAAA

CTTGTCCCTATCAAACCTGCCCCTCTCCCTCTCAGCCCCGGCAAGAATAGCTTTGGAATC

TTGTCCTCCAAAGGAAATATACTTCAGATTCAGGGGTCACAACTGAGCGCCTCCTATCCT

GGAGGGCAGCTGGTGTTCGCTATCCAGAATCCCACCATGATCAACAAAGGGACCCGATCA

AATGCCAATATCCAGTACCAGGCGGTCCCTCAGATTCAGGCAAGCAATTCCCAAACCATC

CAAGTACAGCCCAATCTCACCAACCAGATCCAGATCATCCCTGGCACCAACCAAGCCATC

ATCACCCCCTCACCGTCCAGTCACAAGCCTGTCCCCATCAAGCCAGCCCCCATCCAGAAG

TCGAGTACGACCACCACCCCCGTGCAGAGCGGGGCCAATGTGGTGAAGTTGACAGGTGGG

GGCGGCAATGTGACGCTCACTCTGCCCGTCAACAACCTCGTGAACGCCAGTGACACCGGG

GCCCCTACTCAGCTCCTCACTGAAAGCCCCCCAACCCCGCTGTCTAAGACTAACAAGAAA

GCAAGGAAGAAGAGCCTTCCTGCCTCCCAGCCCCCTGTGGCTGTGGCTGAGCAGGTGGAG

ACGGTGCTGATCGAGACCACCGCGGACAACATCATCCAGGCAGGAAATAACCTGCTCATT

GTTCAGAGCCCTGGTGGGGGCCAGCCAGCTGTGGTCCAGCAGGTCCAGGTGGTGCCCCCC

AAGGCCGAGCAGCAGCAGGTGGTACAGATCCCCCAGCAGGCTCTGCGGGTGGTGCAGGCG

GCATCTGCCACCCTCCCCACTGTACCCCAGAAGCCCTCCCAGAACTTTCAGATCCAGGCA

GCTGAGCCGACACCTACTCAGGTCTACATCCGCACGCCTTCCGGTGAGGTGCAGACAGTC

CTTGTCCAGGACAGCCCCCCAGCAACAGCTGCAGCCACCTCTAACACCACCTGTAGCAGC

CCTGCATCCCGTGCTCCCCATCTGAGTGGGACCAGCAAAAAGCACTCAGCTGCAATTCTC

CGAAAAGAGCGTCCCCTGCCAAAGATTGCCCCAGCCGGGAGCATCATCAGCCTGAATGCA

GCCCAGTTGGCGGCAGCTGCCCAGGCAATGCAGACCATCAACATCAATGGTGTCCAGGTC

CAGGGCGTGCCTGTCACCATCACCAACACAGGCGGGCAGCAGCAGCTGACAGTGCAGAAT

GTTTCTGGGAACAACCTGACCATCAGTGGGCTGAGCCCCACCCAGATCCAGCTGCAAATG

GAACAAGCCCTGGCCGGAGAGACCCAGCCCGGGGAGAAGCGGCGCCGCATGGCCTGCACG

TGTCCCAACTGCAAGGATGGGGAGAAGAGGTCTGGAGAGCAGGGCAAGAAGAAGCACGTG

TGCCACATCCCCGACTGTGGCAAGACGTTCCGTAAGACGTCCTTGCTGCGTGCCCATGTG

CGCCTGCACACTGGCGAGCGGCCCTTTGTCTGCAACTGGTTCTTCTGTGGGAAGAGGTTC

ACACGGAGTGACGAGCTCCAACGGCATGCTCGCACCCACACAGGGGACAAACGCTTCGAG

TGCGCCCAGTGTCAGAAGCGCTTCATGAGGAGTGACCACCTCACCAAGCATTACAAGACC

CACCTGGTCACGAAGAACTTGTAAGGCCAACTGCGGCGGGAGGCCCTGAAGATGCAGTCC

CCCACCTGTGTCCTCCCTGGGCCCCTGGTGGAAAGGAGCCCTGTGGCTGCCTTGGGCCTG

CCCTCAGCCCCACTCCTGTTCTGCAACTGTCCCCACAGGAAGGGGCTCTGTTCCCTGTAT

TGTCCTCCTTCTGAAGCCCCTTGGCTCTGCCTTGGCCCTTCCCCTCACCACGAGCTCCCG

GCCTGCCCAGACTGTGGACACTGGCCGTGCCCAATGAGACGTTCTAAACCAGGACGCGTG

GGAACCCTTATTTCCAAAGGAAAAACATGCATTTCACTCCGTCGAGGAGCAAAGTGAGCC

CCTACCCCCCACCCCGATCCCCGCTCCCAACACTGCCGGAGTCGCGTCATGCCATGCCCC

CTCTCCTGCACCTCCCTGGCCCTGCCGGCCACTGTGGACGCCCTGGGGCTTGGCACCCAC

CTCTGGAGAAACTCGGGGCCACCTCCACTCCATGTGCCCAGCCCCGCCACAACCTCTCCT

CCAGCACATTCCAGCTCTATTTAAAAAGTAAAGACACCCACCGACTCCTGATCCCCCTCT

TTTTCTATGGAGAACGTTGCCTTATACTCTCTACTTCAGATGATGAACACTGTGTACTGT

GTGTGCTTTAAAGAAGTTTTATTTAATTGCTCCCTTCTTCCTTTCCTTGTTATTCACCTC

CCTGATGCCTGCTTTCAGTTGAGGGTTGGGGGCAATGATGAGCATATGAATTTTTTCTCA

CTCTAGCAATTCCCTTTTCTAAATGACACAGCATTTAAACTCAAATCTGGATTCAGATAA

CAGCACCTGCACATCCTGCACCTCCTCCCTCTCCCTTCACCTCACCCCTGCCCGGCCCAA

GCTCTACTTGTGTACAGTGTATATTGTATAATAGACAATTGTGTCTACTACATGTTTAAA

AACACATTGCTTGTTATTTTTGAGGCTTTTAAATTAAACAAAAATCCAACTTTAAAAAAA

AAAAAAAA

CCCGCGTCGGTGCCCGCGCCCCTCCCCGGGCCCCGCCATGGGCCTCACCGTGTCCGCGCT

CTTTTCGCGGATCTTCGGGAAGAAGCAGATGCGGATTCTCATGGTTGGCTTGGATGCGGC

TGGCAAGACCACAATCCTGTACAAACTGAAGTTGGGGGAGATTGTCACCACCATCCCAAC

CATAGGCTTCAATGTAGAAACAGTGGAATATAAGAACATCTGTTTCACAGTCTGGGACGT

GGGAGGCCAGGACAAGATTCGGCCTCTGTGGCGGCACTACTTCCAGAACACTCAGGGCCT

CATCTTTGTGGTGGACAGTAATGACCGGGAGCGGGTCCAAGAATCTGCTGATGAACTCCA

GAAGATGCTGCAGGAGGACGAGCTGCGGGATGCAGTGCTGCTGGTATTTGCCAACAAGCA

GGACATGCCCAACGCCATGCCCGTGAGCGAGCTGACTGACAAGCTGGGGCTACAGCACTT

ACGCAGCCGCACGTGGTATGTCCAGGCCACCTGTGCCACCCAAGGCACAGGTCTGTACGA

TGGTCTGGACTGGCTGTCCCACGAGCTGTCAAAGCGCTAACCAGCCAGGGGCAGGCCCCT

GATGCCCGGAAGCTCCTGCGTGCATCCCCGGATGACCATACTCCCGGACTCCTCAGGCAG

TGCCCTTTCCTCCCACTTTTCCTCCCCCATAGCCACAGGCCTCTGCTCCTGCTCCTGCCT

GCATGTTCTCTCTGTTGTTGGAGCCTGGAGCCTTGCTCTCTGGGCACAGAGGGGTCCACT

CTCCTGCCTGCTGGGACCTATGGAAGGGGCTTCCTGGCCAAGGCCCCCTCTTCCAGAGGA

GGAGCAGGGATCTGGGTTTCCTTTTTTTTTTCTGTTTTGGGTGTACTCTAGGGGCCAGGT

TGGGAGGGGGAAGGTGAGGGCTTCGGGTGGTGCTATAATGTGGCACTGGATCTTGAGTAA

TAAATTTGCTGTGGTTTGAAAAAAAAAAAAAAAAAAAAA

GTGGCGGTGGCTGCGGCGACGGCAGAGGCGAAGGGAGCCGGATCGCCGACCTGAGCGGGA

GGCGGCGGTGGCGGCCATGGCGGCAGATGGAGAGCGTTCCCCGCTGCTGTCTGAGCCCAT

CGACGGTGGCGCGGGCGGCAACGGTTTAGTGGGGCCCGGCGGGAGTGGGGCTGGGCCCGG

GGGAGGCCTGACCCCCTCCGCACCACCGTACGGAGCCGGTAAACATGCCCCGCCCCAGGG

TAAGCCGGGGCGGGTCCGAGGTGCTCCCCGGGGTACTCTGAAAGCCGGGGAGGGGGCGGG

ACCGAGGGCGGAGGCGGGTCCCAGTCGCCAGGTGCGGGACTGCTGCACCTGTGACTGGGC

GAGGCTTCCTTCCCTCCGTAATCGCGACCACAGCCTAGGGACGGAAGGGGGTTCTGAGCA

ACCTGATAGAAGTGCCAATTATGAGAAGCCCTCCGAGCTTGGTCAGAGGGTTGAAGATCA

GAAGGACTTCCCTACCACCGTGGAGCATCAGTGGGGGTGTAAGTGATCCCAGCCCTTCTA

TTTGCTTCCTCTCCAGCATTTCCCCCGTTTCCCGAGGGGCATCCAGCCGTGTTGCCTGGG

GAGGACCCACCCCCCTATTCACCCTTAACTAGCCCGGACAGTGGGAGTGCCCCTATGATC

ACCTGCCGAGTCTGCCAATCTCTCATCAACGTGGAAGGCAAGATGCATCAGCATGTAGTC

AAATGTGGTGTCTGCAATGAAGCCACCGTGAGTTACACATATCTATGAAATGGGCCCTGT

TTCCTGGATCCTCTTTCTGATGTCTTGGTTCTAGACCCTGACCTTCCGGCTATTAGCCAA

GTGCTTTTGATGATACCCAGGTTTCAGTTCCAGGTGTCTCACACAGCCATTTCCCCAGAA

GCCACTCACCAAAGCTAATGTTCACTTTCTCTCACTTTTACACCTAGCCTAGTTCCTATT

TGCAAATCTCATGATATAGTCTTTCTTTTATTTCTCCTTCCTGGTTAGCACCTTATTTTT

CTGATCTCATAAAGTGTTTTTGGAGGGAAGTGGAGGGGATTGGGATTAGAGGTTTGCTTG

CTGATGACCCTATTATTCTCTAGCCAATCAAGAATGCACCCCCAGGGAAAAAATATGTTC

GATGCCCCTGTAACTGTCTCCTTATCTGCAAAGTGACATCCCAACGGATTGCATGCCCTC

GTCCCTACTGGTAAGAGGCATAAGGTGGGGAAGGGCCTAAGTGGGGAACTGGAAAGTCAA

AAAAGGATGAGCGTATACAGAGAATGTAAAGGTGAGAGAGCCTAGTGTTTATTTAGGAGA

AAAGGCTTTGAAGCATGTGCCTCAGGAATGTTATAGCTGTCTTTCTCGTTTCTCAATAAA

AATATTGAGATGAAATGATGTCGTTTCGGAGAATAGAGAGCCTTGGGGACTGGGTGTGTT

ATCCTGAGGTCGGAGGGGAATTGGGGACCTGAAGTTTAAACAGTGCTCTTTCTTTCTCAA

GGATTCTTGAGGGTATACAGTTGGGGGACAGAGTATCTTAAGTACAGAGAAGTCGAGTGA

CTTAATAGACAGGGAGTGGGGGATGTGGAACAGGGACTGTGAAGATTTTTAGGATTAAAA

ATTTTTCAAACACAAGTTTGAAAATACAAGTCTTTTTCTTTTGTATAGCAAAAGAATCAT

CAACCTGGGGCCTGTGCATCCCGGACCTCTGAGTCCAGAACCCCAACCCATGGGTGTCAG

GGTTATCTGTGGACATTGCAAGAATACTTTTCTGGTGAGGAAGGGGTATTGGGAAGGGGA

GGGGAAAGGAGACTAAGAGTCATTTCGAGTATATTTCTTAGAGTAATGGTAATGACCCCT

GAAAGGTCTGTCCTATGGGAACATGTTCTGCATCCCCACCCCAAGGTTCTCATTGAGGGA

GACCCTGCTTGTGCTATTATTTTTGTTTTCTTTCTCCATAGTGGACAGAGTTCACAGACC

GCACTTTGGCACGTTGTCCTCACTGCAGGAAAGTGTCATCTATTGGGCGCAGATACCCAC

GTAAGAGATGTATCTGCTGCTTCTTGCTTGGCTTGCTTTTGGCAGTCACTGCCACTGGCC

TTGCCGTGAGTACCCTTGCCCCAACCTCTTTCATTCTGCAGCCTCATCTCCATAGGCTAA

GATTTGGGAAACTGCTACCCTAAAAAAAAGTGGAAGAAACTTAGGGGACTAGTTTGTTTT

GTTTTAAGATATGGATGAGCTAAAGTGCAAAGTGGCTGATCAAACAGACTTTATTACTAC

TACAAGAGTGAAAAACAGCCTTCCTTTCTCTGTAGGATGAGGATAGGACAGTGAAATTCT

TAATTTAAGAGTTGCTATTTTTCAAACCTGGCTCAGTTGTCAGATATTAAGAAAAACTGA

GATACAGTGTGGGATGGGATGAGTATGTTACGCCTAAGGGAAGGAAGCTGATCAGCTCTG

CCTTTAAGAAGGTCCCTGAGGGTGGCTACATGTGGATAAGGAACAAGGACTGAAGCGTGA

GTTATTACTGTTCTTAGAACTAATAGGAGGTAGTGGAGACCAACATTAACCCCATCTTTC

TTTTCTTCTCCCTCCTTATCTTCATCAGTTTGGCACATGGAAGCATGCACGGCGATATGG

AGGCATCTATGCAGCCTGGGCATTTGTCATCCTGTTGGCTGTGCTGTGTTTGGGCCGGGC

TCTTTATTGGGCCTGTATGAAGGTCAGCCACCCTGTCCAGAACTTCTCCTGAGCCTGATG

ACCCACAGACTGTGCCTGGCCCCTCCCTGGTGGGGACAGTGACACTACGAAGGGAGCTGG

GGTAGTTAAAGGCTCCCGGGGCTTCTAGAAGGAAGCCAAGCAGCTGCCTTCCTTTTCCCT

GGGGAGAGGTAGGAAGGAACCAGGCCCTCACTTAGGTTTGGAGGGGCAGATAAGAGCACT

GCTGACCATCTGCTTTCCTCCAAGGGTTGCTGTGTCTAGGGTGAAGTAGGCAAAACGTTG

CCCTTAAAACTGGGCCCTGAAGACGGTTCCAGCCTTGTCCTTCCTGTGTGCTCCCTGAGA

GCCATTCCTGTCCCTTACACATTCCAGGGCAGGGTGGGGGTGGGTAGCCCTGGGGGTTCC

CCTCCCTCTTGTGCACCATTAGGACTTTGCTGCTGCTATTGCACTTCACCAGAGGTTGGC

TCTGGCCTCAGTACCCTCAGTCTCCTCTCCCCACATTGTGTCCTGTGGGGGTGGGGTCAG

CCGCTGCTCTGTACAGAACCACAGGAACTGATGTGTATATAACTATTTAATGTGGGATAT

GTTCCCCTATTCCTGTATTTCCCTTAATTCCTCCTCCCGACCTTTTTTACCCCCCCAGTT

GCAGTATTTAACTGGGCTGGGTAGGGTTGCTCAGTCTTTGGGGGAGGTTAGGGACTTATC

CTGTGCTTGTAAATAAATAAGGTCATGACTCTAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAA

CTGTCAGCACGGGGCCTGGCATGTAATTGGTCTGCACCCACTGGTGCACTGAACTGCCAT

AACCTCAGGTTTTCTTTCTTGCTGATACCCCTGGGTCATGTTCTTTGGCAAATAACATGA

TTCATTATGAAGTAGAGTTCAGCAAAGGACAAGGATGAAAGTTGTCATTTAGAGAACTGC

CATTCAGACTTTCTTGTCTAGGTAAAGAGCAAGGTCTTCTCTCTTTTCAACTCATTTTCT

AAATTTAAACTGACGATGAGAATATGGATGATGTGTAGCTTCCTTCTCCCCCACTGATTT

TTGGTTCAGGCTCTGGGTTTTTGGCAAGAACTTACAGATCTCACTTATTATTGGCCACCC

TTCTGCTTTAAGACCTGTCAGGGCTTGTCTGAAATAAAACTGGAAGCACTTCTGATTCCA

TCCTCACTGCTTTCCTCCTTCACCGTCAGACAGCATTACTGTATAGCACTGAGTGAGGGG

CCCTGACACTGGAAGGTGGCAGGTGGGGCCTGGCCGCCAGTGAGGTATCATCATTTGTGT

GTGCTCATGTGTGCGTTGGGCTTGTTGTATCTGAGGCATGAACATTCCATATACACGGCT

TAAAGAGTTTTCTTCCCATACCGAAAGCATATATTCGGAGAGGACCCAACTTATTCAGCA

TAGCCTTGTTCCCATAGTAGCCATCCTATTCCCCCACAGCCTCTACTTTAGGAAAGCTCC

CCGTCCCCATATGAAATCCAAACCAAAAAAGATATATCACTTTCAGCTCAATTATTCCAT

AATTACAAGATATTAGGCTAGTGGGCTCTTTATTGGTTGGGTCTTATATTAATGTTATAT

GCTAGCCTTGTAATTTTGAGCTCCTCTATGGATGTTAATTTTAGTGAAACTCTATATTGA

AGAAAAGATGGGACTAAGGGGGAGACAGGAGGAGGAAAGAAAGCAGAGACAGGCAAAGAA

TCATAGCCTGAAATTCAACAGCAAGCATGGCTTATGAAGATCAAGTTATATTTTTGCTTC

ATGAATCATTGTCAGACAAATTAAGAACATATTGTTTCTTATTTATCTATTGTCAAGGAT

TCACTATCAGACACTAAGAATGAATCTTGATTTTCATAAGCTCTGTTGACACCATGGAGC

CACAGAGCATAAAACTTGCATCTAATAAAGAAAGTGCAACATGGAACAGCAGGGAGTGGA

ATACCAGCACAACTCACAGCTGCTTCCTGTTCCTCGTCCCTGTTTTCAGGAATGTTTCTT

AGCAGGAAGTTTTTTAATAGACCGAGAATTTGTTATATGTATTCTAAGAAAAGTTGTAGT

TGTAGATGCATTACTCTCCCAAATCTTAGAGATCAGGGATGATTATGTTCCATTTTTGTT

TGGTGAGTTCCCATCTTTGTATGTACCTCCTTGCTCCCGGCTGTCCTCCTCTCCTCTTCC

CTAGTGAGTGGTTAATGAGTGTTAATGCCTAAACCATACTTGTTTTATGGACACTTCTAT

AATGGATTCGTTGCATAATTTTCATGCAGTGTATAGTGTTACTAGTTGGAAATTCTTGGA

GGACTCTTAGCTGTCTGATGAAATTCCTAGTAGAAATTTTTGTTTTGAATTCCTAAAGTT

GAAATATGAAAATTATATTTTAATTTGATTC

AGTTTTTCTGGTAGAAGGCGGGGTTCTCCTCGTACGCTGCGGAGTCTCTGCGGGGTGTAG

ACCGGAATCCTGCTGACGGGCAGAGTGGATCAGGGAGGGAGGGTCGAGACACGGTGGCTG

CAGGTCTGAGACAAGGCTGCTCCGAGGTAGTAGCTCTCTTGCCTGGAGGTGGCCATTCAT

TCCTGGAGTGCTGCTGAGGAGCGAGGGCCCATCTGGGGTCTCTGGAAGTCGGTGCCCAGG

CCTGAAGGATAGCCCCCCTTGCGCTTCCCTGGGCTGCGGCCGGCCTTCTCAGAACGAAGG

GCGTCCTTCCACCCCGCGGCGCAGGTGACCGCTGCCATGGCTTTTCCCCATCGGCCGGAC

GCCCCTGAGCTGCCTGACTTCTCCATGCTGAAGAGGCTGGCTCGAGACCAGCTCATCTAT

CTGCTGGAGCAGCTTCCTGGAAAAAAGGATTTATTCATTGAGGCAGATCTCATGAGCCCT

TTGGATCGAATTGCCAATGTCTCCATCCTGAAGCAACACGAAGTAGACAAGCTATACAAG

GTGGAGAACAAGCCAGCCCTCAGCTCCAATGAACAATTGTGCTTCTTGGTCAGACCCCGC

ATCAAGAATATGCGATACATTGCCAGTCTTGTCAATGCTGACAAATTGGCTGGCCGAACT

CGCAAATACAAAGTGATCTTCAGCCCTCAAAAGTTCTATGCGTGTGAGATGGTGCTTGAG

GAAGAGGGAATCTATGGAGATGTGAGCTGTGATGAATGGGCCTTCTCTTTGCTGCCTCTT

GATGTGGATCTGCTGAGCATGGAACTACCAGAATTTTTCAGGGATTACTTTCTGGAAGGA

GATCAGCGTTGGATCAACACTGTAGCTCAGGCCTTACACCTTCTCAGCACTCTCTATGGA

CCCTTTCCAAACTGCTATGGAATTGGCAGGTGCGCCAAGATGGCATATGAATTGTGGAGG

AACCTGGAGGAGGAGGAGGATGGCGAAACCAAGGGCCGAAGGCCAGAGATTGGACATATC

TTTCTCTTGGACAGAGATGTGGACTTTGTGACAGCACTTTGCTCCCAAGTGGTTTATGAG

GGCCTAGTAGATGACACCTTCCGCATCAAGTGTGGGAGTGTCGACTTTGGCCCAGAAGTC

ACATCCTCTGACAAGAGCCTGAAGGTGCTACTCAATGCCGAGGACAAGGTGTTTAATGAG

ATTCGGAACGAGCACTTCTCCAATGTCTTTGGCTTCTTGAGCCAGAAGGCCCGGAACTTG

CAGGCCCAGTATGATCGCCGGAGAGGCATGGACATTAAGCAGATGAAGAATTTCGTGTCC

CAGGAGCTCAAGGGCCTGAAACAGGAGCACCGCCTGCTGAGTCTCCATATTGGGGCCTGT

GAATCCATCATGAAGAAGAAAACCAAGCAGGATTTCCAGGAGCTAATCAAGACTGAGCAT

GCACTGCTAGAGGGGTTCAACATCCGGGAGAGCACCAGCTACATTGAGGAACACATAGAC

CGGCAGGTGTCGCCTATAGAAAGCCTGCGCCTCATGTGCCTTTTGTCCATCACTGAGAAT

GGTTTGATCCCCAAGGATTACCGATCTCTGAAAACACAGTATCTGCAGAGCTATGGCCCT

GAGCACCTGCTAACCTTCTCCAATCTGCGAAGAGCTGGGCTCCTAACGGAGCAGGCCCCC

GGGGACACCCTCACAGCCGTGGAGAGTAAAGTGAGCAAGCTGGTGACCGACAAGGCTGCA

GGAAAGATTACTGATGCCTTCAGTTCTCTGGCCAAGAGGAGCAATTTTCGTGCCATCAGC

AAAAAGCTGAATTTGATCCCACGTGTGGACGGCGAGTATGATCTGAAAGTGCCCCGAGAC

ATGGCTTACGTCTTCAGTGGTGCTTATGTGCCCCTGAGCTGCCGAATCATTGAGCAGGTG

CTAGAGCGGCGAAGCTGGCAGGGCCTTGATGAGGTGGTACGGCTGCTCAACTGCAGTGAC

TTTGCATTCACAGATATGACTAAGGAAGACAAGGCTTCCAGTGAGTCCCTGCGCCTCATC

TTGGTGGTGTTCTTGGGTGGTTGTACATTCTCTGAGATCTCAGCCCTCCGGTTCCTGGGC

AGAGAGAAAGGCTACAGGTTCATTTTCCTGACGACAGCAGTCACAAACAGCGCTCGCCTT

ATGGAGGCCATGAGTGAGGTGAAAGCCTGATGTTTTTCCCGGCCAGTGTTGACATCTTCC

CTGAACACATTCCTCAGTGAGATGCAGGCATCTGGCACCCAGCTGCTATAACCAAGTGTC

CACCAACTACCTGCTAAGAGCCGGGAGCATGGAACGTGTTGGGATTTAGAGAACATTATC

TGAGAAAAGAGTTCACTTCCTGCTCCCAGGATATTTCTCTTTTCTGTTTATGAAGTACAA

CCCATGCTGCTAAGATGCGAGCAGGAAGAGGCATCCTTTGCTAAATCCTGTTTGAATGTC

ATTGTAAATAAAGCCTCTGCTCTCAGATGTAAAAAAAAAAAAAAAAAAAAA

GGCACGAGGGGTCGCGCTGCCGCCGTTTTATTTGAAGACATCGTCCAGTTCTGACCATGG

ACTCGCAGCCATCGGCCCTTAGTTTCCATCCCCTCTAGTGGGCCTTCGGGGGCTCTACTG

ACGTCCCTCCTTCCCTTGGTACCGGGCCGGGGAAGTGTTCTCGGGCGCGGGAGGTTCCGC

ATGCCCAGGCCTGGCCAGGGGAGATGACCGATCCGTCGCTGGGGCTGACAGTCCCCATGG

CGCCGCCTCTGGCCCCGCTCCCTCCCCGGGACCCAAACGGGGCGGGATCCGAGTGGAGAA

AGCCCGGGGCCGTGAGCTTCGCCGACGTGGCCGTGTACTTCTCCCGGGAGGAGTGGGGCT

GCCTGCGGCCCGCGCAGAGGGCCCTGTACCGGGACGTGATGCGGGAGACCTACGGCCACC

TGGGCGCGCTCGGTGAGAGCCCCACCTGCTTGCCTGGGCCCTGCGCCTCCACAGGCCCTG

CCGCGCCTCTGGGAGCTGCGTGTGGAGTTGGGGGCCCCGGGGCCGGGCAGGCGGCCTCCT

CGCAGCGTGGGGTTTGCGTTCTTCTCCCCCAGGAGTCGGAGGCAGCAAGCCGGCGCTCAT

CTCCTGGGTGGAGGAGAAGGCCGAACTGTGGGATCCGGCTGCCCAGGATCCGGAGGTGGC

GAAGTGTCCGACAGAAGCGGACCCAGCAGATTCCAGAAACAAGGAAGAGGAAAGACAAAG

GGAAGGGACGGGAGCCCTGGAGAAGCCCGACCCTGTGGCCGCCGGGTCTCCTGGGCTGAA

GGCTCCCCAAGCCCCCTTTGCCGGGTTGGAGCAGCTGTCCAAGGCCCGGCGCCGGAGTCG

CCCCCGCTTTTTTGCCCACCCCCCTGTCCCCCGAGCTGACCAGCGTCACGGCTGCTACGT

GTGCGGGAAGAGCTTCGCCTGGCGCTCCACACTGGTGGAGCACATTTACAGCCACAGGGG

CGAGAAGCCCTTCCACTGCGCAGACTGCGGCAAGGGCTTCGGCCACGCTTCCTCCCTGAG

CAAACACCGGGCCATCCATCGTGGGGAGCGGCCCCACCGCTGTCCCGAGTGTGGTCGGGC

CTTCATGCGCCGCACGGCGCTGACTTCTCACCTGCGCGTTCACACTGGCGAGAAGCCCTA

CCGCTGCCCGCAGTGTGGCCGCTGCTTCGGCCTGAAGACCGGCATGGCCAAGCACCAATG

GGTCCATCGGCCCGGGGGCGAGGGGCGTAGGGGCCGGCGCCCTGGGGGGCTGTCTGTGAC

CCTGACTCCTGTCCGCGGGGACCTGGACCCGCCTGTGGGCTTCCAGCTGTATCCAGAGAT

ATTCCAGGAATGTGGGTGACGGCCTAAAAAGTGACCATCTAGACATTGTGGGCGGCCCGA

GATGGGCTCAGGGGCCCGAACCTCTGCAGCGGCCTGCAGGGAGGTCCCAGAATCCACCGC

AAGAGCTGGCCTGGGGTGCGGACAGTCTGATCTTGGGCTCTCAGCAGCCTCTTCTGCCAG

CACCTTGCTCCCCGCTGCCCTGGGCTCTCCAAGGCCCCCTTTGCTGAGGCAGGGCTGAGG

TGAGAACCCCCCAGACCTCCATACAGGGAAGCAAAAGCTGTTTCTCCTCCCAGAGATGCT

AAGAGGATTGAGGTAGAGAAGAACCTTGTTTTCTCTGTTGTCTTTTTCTTTTTACTTTTT

TAATTTTTTGAGACGGAGTTTTGCTCTTGTTGCCCAGGCTGGAGTGCAATGGTGCGATCT

CGACTCACTGCAACTTCCACCTCCTGGAGTCAAGCGATTCTCCTGCCTCAGCCACCCAAG

TAGCTGGAATTACAGGCACCTGCCACTATGCCCGGCTAACTTTTTGTATTTTTAGTAGAG

ATGGGGTTTCACCATGTTGGCTAGGCTGGTCTCGAACTCCTGCCCTCAGGTGATCCACCC

ACCTCTGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACCTCACCTGGCCTTTTCTT

TTTTATTCTTTGACCTTCCCACAAGACAATACCCATTGTCTGTTTTTTTTGTTTATTTAT

TTACTTATTAAGACAGCATCTTGCTCCTCACCCAGGCTGGAATGCAGTGGTGTGAACTGG

GCTCACTGCAGCCTAGACCTGCTGGGCTCAAGGAATCCTCCTGCCCCAGCCTCTCAGATG

GCTGTGACTACAGGTGGGCAACACTATGCCTGGTTAATTTTTAAATTTTTTTGCAGAGAT

GGGGTTCCCACTATGTTGATCAGGCTGGTCTCAAACTCCTCGGTTCAAGCAATTCGCCCA

CCTTGGCCTCCCAAAGTGCTGGGATTACAGGGGAGCCACTGCACTGGCCTTCATTGTCTT

TTTGCTGCACAACCTAAAAAACCAGTGACCCTGTATTGGAAAAAAAAAAAAAAAAAAAAA

A

GCCATGGCCGCCGGCCCCGCGCCGCCCCCCGGCCGCCCCCGGGCGCAGATGCCGCATCTG

AGGAAGGTGCGAGGCGGATGGAGCGGGTGGTCGTGAGCATGCAGGACCCCGACCAGGGCG

TGAAGATGCGGAGCCAGCGCCTGCTGGTCACCGTCATTCCCCACGCGGTGACAGGCAGCG

ACGTCGTGCAGTGGTTGGCCCAGAAGTTCTGCGTCTCGGAGGAGGAGGCCCTGCACCTGG

GCGCCGTCCTGGTGCAGCATGGCTACATCTACCCGCTGCGCGACCCCCGTAGCCTCATGC

TCCGGCCAGACGAGACGCCCTACAGGTTCCAGACCCCGTACTTCTGGACAAGTACCCTGA

GGCCGGCTGCAGAGCTGGACTATGCCATCTACCTGGCCAAGAAGAACATCCGAAAACGGG

GGACCCTGGTGGATTATGAGAAGGACTGCTATGACCGGCTACACAAGAAGATCAACCACG

CATGGGACCTGGTGCTGATGCAGGCGAGGGAGCAGCTGAGGGCAGCCAAGCAGCGCAGCA

AGGGGGACAGGCTGGTCATTGCGTGCCAGGAGCAGACCTACTGGCTGGTGAACAGGCCCC

CGCCCGGGGCCCCCGATGTGCTGGAGCAGGGTCCAGGGCGGGGATCCTGCGCTGCCAGCC

GTGTGCTCATGACCAAGAGTGCAGATTTCCATAAGCGGGAGATCGAGTACTTCAGGAAAG

CGCTGGGCAGGACCCGAGTGAAGTCCTCCGTCTGCCTTGAGGCGTACCTGAGTTTCTGCG

GCCAGCGTGGACCCCACGATCCCCTCGTGTCGGGGTGCCTGCCCAGCAATCCCTGGATCT

CAGACAATGACGCCTACTGGGTCATGAATGCCCCCACGGTGGCTGCCCCCACGAAGCTCC

GTGTGGAGAGATGGGGCTTCAGCTTCCGGGAGCTCCTGGAGGACCCCGTGGGGCGGGCCC

ACTTCATGGACTTTCTGGGAAAGGAGTTCAGTGGAGAAAACCTCAGCTTCTGGGAGGCAT

GTGAGGAGCTTCGATATGGAGCGCAGGCCCAGGTCCCCACCCTGGTGGATGCCGTGTACG

AGCAGTTCCTGGCCCCCGGAGCTGCCCACTGGGTCAACATCGACAGCCGGACCATGGAGC

AGACCCTGGAGGGGCTGCGCCAGCCCCACCGCTATGTCCTGGATGACGCCCAGCTGCACA

TATACATGCTCATGAAGAAGGACTCCTACCCAAGGTTCCTGAAGTCTGACATGTACAAGG

CCCTCCTGGCAGAGGCTGGGATCCCGCTGGAGATGAAGAGACGCGTGTTCCCGTTTACGT

GGAGGCCACGGCACTCGAGCCCCAGCCCTGCACTCCTTCCCACCCCTGTGGAGCCCACAG

CGGCTTGTGGCCCTGGGGGTGGAGATGGGGTGGCCTAGTGGACCTGGCCCATCTGCCACT

CTAGTCCCTGCAGCTCAACGTCCTGCGTGAATGCAGCAGCCACCCCCGTCTTGGCCCAGG

TCCTGGGGGCTGCTGAACCCAGCACCAGTGTCCCCTTGTGCCCAGGGGGCCCAGTCTTCT

GTGGGGTGCACAGCCTCCCTCCCTCCAGCAAGCCCTCCCTGCCCAGAAGGAATGGGTCCA

GGTGTGGATTCCCAGGGAGGGGGTTCATTGGCTCAGCTTGGGTCAGGGCAGAGCCTGTTA

CCTGAAGAGAGGTGAGACCAAGGCCACAGGGAGCTCCACCTTCTCTGGTCTTCAGTCCAG

CACTGGGTGCCCATCCCCATCTCTAAAACCAGTAAATCAGCCAGCGAATACCCGGAAGCA

AGATGCACAGGCGGGCGGCTTCCCACACACCCGTCACAAGACGCGGACATGCAGGTCTCG

GCGCGAGCTCTGCCCCGTCCAAGAGCCTCTCCGCTGTCGCCCAGTGTGAGCCTGGAAGAG

GACCCAAGAGAGTGCCGTGCTGAGGCTGCCTCGAGGTCACTGCCTTCCGGAGCTGCGCCT

ATTCCTCCCTCGCCAAACGCGTTCCAGAATTTGTCCACAGGTGCGCCGGCACCTGCTTTC

CCACCTCGAGGCCGCGGCCTCCCCCCCGATTTATAGACAACTCTGACATTGTCACCCCAC

TGACGAGGCCCGATTCCATAGGGTGGATCCTTGCCAGGCGTCCCTGATCCTCCCTGCCCA

AGTCTTCCTTCGTGAGCTGGCCTTGCTCCCCATCCCCCAAGTGCCTCACCAGTCCCCCAG

ACTGGGTGAAGGTACAGCTGGCTCCTTTCGGGGGTGCAGCTTCAACTCTCTCGGCGGTAG

GGCGGTGCCATCCCCACCCATAGGGCTGGCTCACATCCAGTCACTCCCAACAGCGTCCAG

CACACAAATAAAAGACCCTTGGGCCCTGGCTCTGAGAAAAAAAA

AGACTGCCGAGCAGCCTTGAGCCGTTGAGCAGCTGAACAGAGGCCATGCCGGGGCACTCC

GAGGCCTGAGACGACCACGCCTGTGCCGCTGAGGACCTTCATCAGGGCTCCGTCCACTTG

GCCCGCTTGGCTGTCCAATCACACTCCAGTGTCAACCACTGGCACCCAGCAGCCAAGAGA

GGTGTGGCGTGGCCCTGGGGACGCATGGCTGAGGCAGGAACAGGTGAGCCGTCCCCCAGC

GTGGAGGGCGAACACGGGACGGAGTATGACACGCTGCCTTCCGACACAGTCTCCCTCAGT

GACTCGGACTCTGACCTCAGCTTGCCCGGTGGTGCTGAAGTGGAAGCACTGTCCCCGATG

GGGCTGCCTGGGGAGGAGGATTCAGGTCCTGATGAGCCGCCCTCACCCCCGTCAGGCCTC

CTCCCAGCCACGGTGCAGCCATTCCATCTGAGAGGCATGAGCTCCACCTTCTCCCAGCGC

AGCCGTGACATCTTTGACTGCCTGGAGGGGGCGGCCAGACGGGCTCCATCCTCTGTGGCC

CACACCAGCATGAGTGACAACGGAGGCTTCAAGCGGCCCCTAGCGCCCTCAGGCCGGTCT

CCAGTGGAAGGCCTGGGCAGGGCCCATCGGAGCCCTGCCTCACCAAGGGTGCCTCCGGTC

CCCGACTACGTGGCACACCCCGAGCGCTGGACCAAGTACAGCCTGGAAGATGTGACCGAG

GTCAGCGAGCAGAGCAATCAGGCCACCGCCCTGGCCTTCCTGGGCTCCCAGAGCCTGGCT

GCCCCCACTGACTGCGTGTCCTCCTTCAACCAGGATCCCTCCAGCTGTGGGGAGGGGAGG

GTCATCTTCACCAAACCAGTCCGAGGGGTCGAAGCCAGACACGAGAGGAAGAGGGTCCTG

GGGAAGGTGGGAGAGCCAGGCAGGGGCGGCCTTGGGAATCCTGCCACAGACAGGGGCGAG

GGCCCTGTGGAGCTGGCCCATCTGGCCGGGCCCGGGAGCCCAGAGGCTGAGGAGTGGGGC

AGCCCCCATGGAGGCCTGCAGGAGGTGGAGGCACTGTCAGGGTCTGTCCACAGTGGGTCT

GTGCCAGGTCTCCCGCCGGTGGAAACTGTTGGCTTCCATGGCAGCAGGAAGCGGAGTCGA

GACCACTTCCGGAACAAGAGCAGCAGCCCCGAGGACCCAGGTGCTGAGGTCTGAGAGGGA

GATGGCCCAGCCTGACCCCACTGGCCACTGCCATCCTGCTGCCTTCCCAGTGGGGCTGGT

CAGGGGGCAGCCTGGCCACTGCCTAGCTGGAATGGGAGGAAGCCTGCAGGTGGCACCGGT

GGCCCTGGCTGCAGTTCTGGGCAGCATCCTCCCAAGCAGAGACCTTGCTGAAGCTCCTGG

GGTGTGGGGTGTGGGCTGGAAGCACTGGCTCCCTGGTAGGGACAATAAAGGTTTTGGGTC

TTTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAC

Claims

1.一种将含细胞样品分类为含有某类型组织的肿瘤细胞的方法，所述方法包括

测定获自人对象的含细胞样品中细胞的约5-49种转录序列的表达水平，其中所述样品不是冰冻组织切片，和

根据所述序列的表达水平，将样品分类为含有多种肿瘤类型中某类型组织的肿瘤细胞，

其中用于所述分类的转录序列与肿瘤类型数量之比约为1∶2-5∶2或更高。

2.一种将含细胞样品分类为含有某类型组织的肿瘤细胞的方法，所述方法包括

测定获自人对象的含细胞样品中细胞的约5-49种转录序列的表达水平，和

其中用于所述分类的转录序列与肿瘤类型数量之比约为1∶2-5∶2或更高，

其中a)超过50％的所述转录序列的表达与另一种所述转录序列的表达无关，或

b)所述5-49种转录序列不是根据利用已知肿瘤样品的督导学习、不是根据它们的表达与所述多种肿瘤类型之间的相关性水平、也不是根据它们的表达与所述多种肿瘤类型之间相关性中它们的排序来选择。

3.如权利要求1或2所述的方法，其特征在于，所述比值最高约为20∶1。

4.如权利要求1-3中任一项所述的方法，其特征在于，所述比值约为3∶2-5∶2，所述肿瘤类型数量为2-38。

5.如权利要求1-4中任一项所述的方法，还包括测定基于所述比值和肿瘤类型数量以外的过多转录序列的表达水平。

6.如权利要求5所述的方法，其特征在于，利用微阵列测定所述表达水平。

7.如权利要求1-6中任一项所述的方法，其特征在于，所述分类的精确度为60％以上。

8.如权利要求1-7中任一项所述的方法，其特征在于，所述5-49种转录序列包括选自所述74种基因序列组的两种或多种序列。

9.如权利要求8所述的方法，其特征在于，所述5-49种转录序列包括选自所述74种基因序列组的5种或多种序列。

10.如权利要求1-7中任一项所述的方法，其特征在于，所述测定包括与一种或多种参比转录序列作比较进行检测。

11.如权利要求1-10中任一项所述的方法，其特征在于，所述测定包括检测所有所述转录序列或其一部分的表达。

12.如权利要求1-10中任一项所述的方法，其特征在于，所述测定包括扩增所有所述转录序列或其一部分，或者逆转录和标记对应于所述转录序列的RNA。

13.如权利要求12所述的方法，其特征在于，所述扩增包括线性RNA扩增或定量PCR。

14.如权利要求12所述的方法，其特征在于，所述扩增是扩增位于所述转录物聚腺苷酸化位点的600个核苷酸之内的序列。

15.如权利要求12所述的方法，其特征在于，所述扩增是用定量PCR扩增所述转录物的至少50个核苷酸。

16.一种包含用于检测权利要求12所述扩增产物的寡核苷酸探针的微阵列。

17.如权利要求1-10中任一项所述的方法，其特征在于，选择的所述转录序列是非冗余的。

18.如权利要求17所述的方法，还包括测定过多转录序列的表达水平，所述转录序列对于用于所述分类的转录序列而言是冗余的。

19.如权利要求1-18中任一项所述的方法，其特征在于，所述样品是人患者的临床样品。

20.如权利要求19所述的方法，其特征在于，所述样品是固定的样品。

21.如权利要求20所述的方法，其特征在于，所述样品是福尔马林固定、石蜡包埋(FFPE)的样品。

22.如权利要求1所述的方法，对所述约5-49种转录序列的表达水平进行所述检测之前还包括：

诊断需要进行所述测定的人对象；或

由人对象获得含细胞样品；或

接收含细胞样品；或

对含细胞样品进行切片；或

分离含细胞样品中的细胞；或

获得含细胞样品的细胞中的RNA。

23.如权利要求1所述的方法，对所述约5-49种转录序列的表达水平进行所述检测和对所述样品进行所述分类之后还包括：

通过表示：1)报酬已收到，或2)将由另一付款人付费，或3)尚未付费，为所述测定或分类偿付或支付处理；或

接收对所述测定或所述分类支付的费用；或

为所述测定或分类向保险公司、保健组织、联邦卫生部门或所述患者发出或已发出偿付要求；或

接收批准为所述测定或分类付费或拒绝付费的表示；或

为所述测定或分类而发出偿付要求；或

在表格上或在数据库中表明需要为所述测定或分类而支付或付费；或

在表格上或在数据库中表明执行了所述测定或分类；或

任选向医疗护理机构、卫生保健人员、医生、护士或所述患者报告所述测定或分类的结果；或者

接收所述患者为实施了所述测定或分类而支付的费用。