CN101297045A - 肿瘤和组织的鉴定 - Google Patents

肿瘤和组织的鉴定 Download PDF

Info

Publication number
CN101297045A
CN101297045A CNA200680026655XA CN200680026655A CN101297045A CN 101297045 A CN101297045 A CN 101297045A CN A200680026655X A CNA200680026655X A CN A200680026655XA CN 200680026655 A CN200680026655 A CN 200680026655A CN 101297045 A CN101297045 A CN 101297045A
Authority
CN
China
Prior art keywords
group
gene
adopted
sample
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200680026655XA
Other languages
English (en)
Inventor
M·G·厄兰德
马小骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biotheranostics Inc
Original Assignee
Aviaradx Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aviaradx Inc filed Critical Aviaradx Inc
Publication of CN101297045A publication Critical patent/CN101297045A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis

Abstract

本发明提供了利用检测基因表达对获自临床对象的样品,例如福尔马林固定的石蜡包埋(FFPE)样品进行肿瘤分类或鉴定的方法。

Description

肿瘤和组织的鉴定
相关申请
本申请要求2005年6月3日提交的美国临时专利申请60/687,174的优先权,将其全文纳入本文作参考。
发明领域
本发明涉及利用基因表达对人肿瘤进行分类。可利用约5-49种与特定组织产生的肿瘤相关以及与特定肿瘤类型相关的表达序列的基因表达概况或模式进行此分类。本发明也提供约5-49种其表达与各种癌症的组织来源和肿瘤类型相关的特定基因序列的应用。可用所述基因表达概况,无论是核酸表达、蛋白质表达或其它表达形式均可用于测定含细胞的样品是否含有某组织类型或组织来源的肿瘤细胞,从而可更精确地鉴定获得该样品是对象的癌症及其治疗(效果)和预后。
发明概述
本发明涉及利用检测基因表达对获自临床对象的含细胞样品,例如福尔马林固定的石蜡包埋(FFPE)样品以及未经或经过很少处理(如只是储存于降低的非冷冻温度下)的新鲜样品和冻存样品中的肿瘤进行分类或鉴定。因此,本发明能使必须进行临床FFPE样品检验的医院和其它实验室在其面临的现实条件下进行肿瘤分类。所述样品可以是原发肿瘤样品或另一肿瘤转移所产生的肿瘤。或者,样品可以是细胞学样品,例如但不限于血液样品中的细胞。在肿瘤样品的一些情况中,所述肿瘤尚未经传统病理学技术分类,而是经初步分类(但需要验证),或者已归类为“未知原发癌症”(CUP)或“未知来源的肿瘤”(TUO)或“未知的原发肿瘤”。鉴于用标准技术进行分类估计存在5-10%的错误,因而特别需要验证。因此,本发明可视作提供了癌症鉴定的方法或CID。
在本发明的第一方面,利用约5-49种表达序列的基因表达概况或模式进行此分类。可利用基因表达概况,无论是核酸表达、蛋白质表达或基因表达的其它标记均可用于测定含细胞的样品是否含有某组织类型或组织来源的肿瘤细胞,从而可更精确地鉴定获得该样品的对象的癌症及其治疗(效果)和预后。
在一些实施方案中,本发明用于对临床上至少34种或至少39种肿瘤进行显著精确地分类。本发明部分依据惊人且出乎意料地发现人基因组中约5-49种表达序列能以有意义方式对至少34种或至少39种肿瘤及其那些肿瘤亚组进行分类。换言之,本发明部分依据发现无需利用督导学习(supervised learning)即可鉴定其表达的与不同肿瘤类型相关的基因序列。因此,本发明部分基于认识到利用任意约5-49种表达序列,甚至这些表达序列的随机组合能将细胞分类为某组织或组织来源的肿瘤细胞,所以可用于分类。而且,对不同肿瘤类型进行分类需要的表达序列相对较少。根据序列的表达水平,表达序列与可分类的肿瘤类型数量之比约为1∶2-5∶2,或者更高,如本文所述。
在另一方面,本发明通过测定约5-49种转录序列的表达水平,然后将含细胞的样品分类为含有多种(两种以上)肿瘤类型的肿瘤细胞而将含细胞的样品分类为含某组织类型或来源的肿瘤细胞。为分类34种到39种肿瘤及其亚组,可利用少至任意约5种表达序列以有意义方式分类。本发明发现,所述表达序列无需是那些表达水平与任何一种肿瘤明显或高度相关(直接相关或通过与另一序列相关而间接相关)的序列。因此,在另一实施方案中,本发明利用其表达水平不与具体肿瘤样品的实际类型强烈相关的基因,例如所述约5-49种转录序列之一的表达水平。所有选择的基因可以是如此非相关的,或者只是这些基因的一部分,通常至少是90%、85%、75%、50%或25%可以是不相关的,以及属于上述任意两个百分点作为端点的某范围内的各部分可以不相关。
可通过测定基因序列的表达水平来实施本发明,所述序列无需根据其表达水平与待分类肿瘤类型的相关性而选择。因此,作为非限制性例子,这些基因序列无需根据其与肿瘤类型的相关性值或基于该相关性值的排序而选择。此外,可利用不一定与一种或多种用于分类的其它基因表达水平相关的基因表达水平来实施本发明。因此,在其它实施方案中,某表达序列的表达水平在分类中的功能与用于分类的至少一种其它基因表达水平能力相比不是多余的(即,独立于)。
可用本发明鉴定各种病例患者的癌症来源:包括但不限于:鉴定临床上癌症的来源。在一些实施方案中,通过对已知含有癌细胞,但其来源未知的含细胞样品进行分类作鉴定。在其它实施方案中,通过将含细胞样品分类为含有一种或多种癌细胞,然后鉴定各种癌细胞来源进行这种鉴定。在还有的实施方案中,用以前有癌症病史的对象样品来实施本发明,通过将细胞分类为以前来源的或新来源的癌症进行所述鉴定。其它实施方案包括在同一器官或组织中发现多种癌症时,用本发明测定各癌症的来源以及这些癌症是否是同一来源。
本发明也部分依据发现可用特定基因序列的表达水平对肿瘤类型进行分类比用基因序列随机组的表达水平更精确。在一个实施方案中,本发明利用人基因组中的第一组74种表达序列中约5-49种表达序列的表达水平可对至少39种肿瘤进行显著精确地分类。因此,本发明根据与所述至少39种肿瘤相关的约5-49种表达序列提供了基因表达模式(或概况或“签名”)的鉴定及其应用。本发明也利用这74种表达序列中约5-49种表达序列对所述39种肿瘤的亚组进行分类。表达序列与可根据序列表达水平进行分类的肿瘤类型数量(2-39)之比约为1∶2-5∶2,其精确度高于采用随机表达序列组时。根据肿瘤类型的数目,可实现75%-95%的精确度。
在另一实施方案中,本发明利用人基因组的第二组90种表达序列中约5-49种表达序列的表达水平可对至少39种肿瘤或其亚组进行显著精确地分类。第二组中的38种序列存在于第一组的74种序列中。第二组中的约5-49种序列可以和第一组的74种序列所述的相同方式使用。取决于肿瘤类型的数目,可实现约75%到约95%的精确度。
本发明也部分依据发现利用约5-49种表达序列对53种肿瘤(包括但不限于本文所述的34和39种类型)进行分类受限于某些肿瘤类型的可获得样品数。如下所述,精确度与各肿瘤类型的可获得样品数有关,故而通过增加各肿瘤类型(样品)的数目不难实现对其它肿瘤类型的分类。因此,虽然以在34或39种肿瘤以及所述34或39种肿瘤的亚组分类中的应用为例说明了本发明,但也可用约5-49种表达序列对含有其它肿瘤类型样品的所有肿瘤类型进行分类。因此,本发明也可用于对本文所述34或39种类型以外的肿瘤进行分类。
本发明依据一组源自不同组织或不同肿瘤类型的已知肿瘤细胞中所述基因序列的表达水平。无论采取核酸表达、蛋白质表达或其它表达形式,可将这些基因表达的概况(不同的已知肿瘤细胞/类型中所述基因序列的表达概况)与未知肿瘤样品中相同序列的表达水平作比较从而将样品鉴定为具体类型和/或具体来源或肿瘤细胞类型。本发明的优点在于(例如在临床上)可更精确地鉴定癌症进而治疗该癌症以及对获得该样品的对象作预后判断(包括存活率和/或治疗后癌症复发的可能性)。
本发明还部分依据发现利用本文所述约5-49种表达序列能将两种以上肿瘤进行所需分类同时有效地将一种或多种肿瘤剔除在考虑范围外。这反映了无需选择其表达水平与该分类系统范围内所有肿瘤类型高度相关的基因。换言之,可利用其表达水平不与待分类肿瘤组中单种或多种肿瘤高度相关的多种基因来实施本发明。这与依据选择和利用高度相关基因的其它方法相反,与基于正相关将某肿瘤“归类”相反,此方法可能不会“排除”其它肿瘤类型。
将某肿瘤样品分类为本文所述可能的肿瘤类型之一而排除其它肿瘤类型当然要根据下述可信度水平进行。当可信度水平低,或者优选可信度水平提高时,可就具体组织来源或细胞类型水平对样品的肿瘤作出简单分类。或者当不易将某肿瘤样品归类为单一肿瘤类型时,本发明可将该样品分类为本文所述少数可能的肿瘤类型之一。本方法的优点在于能减少获得该样品的患者选择和给予治疗时要考虑的组织、细胞和肿瘤可能类型的数量。
因此,本发明提供了一种鉴定患病对象的一种或多种癌症组织来源和/或肿瘤类型的非主观方法。以前曾用主观解释来确定组织来源和/或肿瘤类型以及根据这种确定来判断癌症预后和/或进行治疗,本发明提供了可单独或与主观标准联用的客观基因表达模式对癌症类型作更精确的鉴定。本发明特别可用于继发性或转移性肿瘤的样品,但也可用于任何含细胞样品(包括原发性肿瘤样品),对其组织来源和/或肿瘤类型也优选通过客观标准确定。当然,可联合客观与非客观(或主观/部分主观)标准作出最终确定。
本发明可用作患者的临床或医学护理的一部分。因此,除了用本文所述基因的表达概况来检验患癌症对象的含细胞样品以确定癌症的组织来源和/或肿瘤类型外,也可用该表达概况作为确定对象癌症预后方法的一部分。可用肿瘤/癌症的分类和/或预后来选择或决定或改变所述对象的治疗方案。因此,本发明分类方法可涉及针对全部或部分根据该分类作出诊断的疾病治疗。根据该诊断,可采用给予合适的抗肿瘤药物或疗法,或者维持或改变抗肿瘤药物或疗法来治疗癌症。
其它临床方法包括根据本文所述分类为患者提供医学护理的方法。在一些实施方案中,这些方法涉及根据所述基因序列的表达水平提供诊断服务(包括或不包括对样品中细胞分类水平的解释)。在一些实施方案中,先确定(是否)需要服务再提供本发明诊断服务的方法。在其它实施方案中,所述方法包括监测服务的执行情况以及为服务行为要求或接收支付(费用)的行为。
本发明一个或多个实施方案的细节见附图与以下描述。本发明的其它特征、目的和优点将通过附图和详述以及权利要求得以明了。
定义
本文所用的“基因”是编码分离产物(无论本质上是RNA还是蛋白质)的多核苷酸。应知道一种以上多核苷酸能编码一种分离产物。根据染色体位置和在正常有丝分裂期间重组的能力,该术语包括编码同一产物的某基因的等位基因和多态性基因,或其功能上相关(包括功能的得到、丧失或调节)的类似物。
本文所用的“序列”或“基因序列”是由不连续的核苷酸碱基序列组成的核酸分子或多核苷酸。该术语包括编码分离产物(无论本质上是RNA还是蛋白质)的碱基序列(即“编码区”)。应知道一种以上多核苷酸能编码一种分离产物。也应知道人基因序列可能存在等位基因和多态性基因,但可用其实施本发明来鉴定所述基因序列或其等位基因或多态性基因的表达水平。鉴定等位基因或多态性基因部分取决于染色体位置和有丝分裂期间重组的能力。
术语“相关”或“相关性”或其等价术语指一种或多种基因的表达与另一事件,例如但不限于生理表型或特征,如肿瘤类型相关联。
“多核苷酸”是任何长度的多聚形式核苷酸,无论是核糖核苷酸或脱氧核糖核苷酸。此术语只表示该分子的一级结构。因此,此术语包括双链和单链DNA和RNA。也包括已知类型的修饰,包括本领域已知的标记,甲基化,“加帽”,用类似物取代一个或多个天然产生的核苷酸,核苷酸间修饰,如不带电荷的连接键(,例如硫代磷酸酯、二硫代磷酸酯等)以及多核苷酸的未修饰形式。
广义使用的术语“扩增”表示产生可利用DNA或RNA聚合酶酶法制备的扩增产物。本文所用的“扩增”一般指产生所需序列(特别是样品中的序列)多份拷贝的过程。“多份拷贝”指至少两份拷贝。“拷贝”不一定表示与模板序列完美互补或相同的序列。本领域一般知道扩增mRNA的方法,包括逆转录PCR(RT-PCR)、定量PCR(或Q-PCR)或实时PCR。或者,可采用本领域已知的方法将RNA直接标记(labeled)为相应的cDNA。
“相应”表示某核酸分子与另一核酸分子具有基本数量的序列相同性。基本数量表示至少95%、通常至少98%、更常见至少99%,序列相同性采用Altschul等,(1990),J.Mol.Biol.,215:403-410所述的BLAST算法测定(采用公布的默认设置,即参数w=4,t=17)。
“微阵列”是各具有确定面积的各不连续区域在固体支持物(例如但不限于:玻璃、塑料或合成膜)的表面上形成的线性或两维或三维(和固相)阵列。一块固相支持物表面上待检测的固定多核苷酸总数决定了微阵列上分离区域的密度,例如至少约50/cm2、至少约100/cm2、或至少约500/cm2、最多约1,000/cm2以上。这些阵列总共可含有少于约500、约1000、约1500、约2000、约2500或约3000个固定的多核苷酸。本文所用的DNA微阵列是用于和样品中扩增或克隆的多核苷酸杂交,置于芯片或其它表面上的寡核苷酸或多核苷酸阵列。由于阵列中具体各组探针的位置已知,可根据样品多核苷酸与微阵列中具体位置的结合来测定它们的身份(identity)。作为微阵列的替代方法,可利用任何大小的阵列来实施本发明,包括在固体支持物的二维或三维配置中安排一个或多个位置来检测某种基因序列的表达。在一些实施方案中,可通过光版印刷技术(例如在表面上从3’末端合成核酸探针)或先合成核酸再沉积到固体表面来制备本发明所用的微阵列。
由于本发明依赖对基因表达的鉴定,本发明的一些实施方案通过使样品细胞的mRNA或其扩增或克隆序列与某特定基因序列的独特多核苷酸杂交来测定其表达。此类多核苷酸含有未在其它基因序列中发现的某基因序列的至少约16、至少约18、至少约20、至少约22、至少约24、至少约26、至少约28、至少约30或至少约32个连续碱基对。以上句子中使用的术语“约”指从所述数值加减1。其它实施方案是未在其它基因序列中发现的某序列的至少或约50、至少或约100、至少约或150、至少或约200、至少或约250、至少或约300、至少或约350、至少或约400、至少或约450或至少或约500个连续碱基。以上句子中使用的术语“约”指从所述数值加减10%。较长的多核苷酸当然可能含有不影响核酸与样品杂交的少许错配(例如,存在突变所致)。这种多核苷酸也可称为能与本文所述基因的序列或其独特部分杂交的多核苷酸探针。可标记这种多核苷酸从而有助于检测它们。这些序列可以是所述基因编码的mRNA序列,这种mRNA的相应cDNA和/或其扩增序列。在本发明的一些实施方案中,所述多核苷酸探针固定在阵列、其它固体支持装置上,或固定在定位探针的各个点中。
在本发明的其它实施方案中,可通过以下方法扩增与检测某基因的所有或部分序列,所述方法例如有聚合酶链式反应(PCR)及其变化形式,例如但不限于:定量PCR(Q-PCR)、逆转录PCR(RT-PCR)和实时PCR(包括检测样品中各序列的mRNA拷贝初始含量的方法),任选实时RT-PCR或实时Q-PCR。这些方法可利用一种或两种与某基因序列的各部分互补的引物,这些引物用于引发核酸合成。新合成的核酸任选作标记,可直接检测或通过与本发明多核苷酸杂交来检测。可使新合成的核酸在杂交条件下与本发明多核苷酸(含有各序列)接触。其它检测表达核酸的方法包括RNA酶保护试验,包括液相杂交和细胞原位杂交。
或者,在本发明的其它实施方案中,可用感兴趣细胞样品或对象体液中各基因产物(蛋白质)或其蛋白水解片段的一个或多个表位具有特异性的一种或多种抗体来分析所述细胞样品中表达的蛋白质进而测定基因表达。细胞样品可以是从对象血液富集的乳腺癌上皮细胞之一,例如可用抗细胞表面标记的标记抗体然后通过荧光激活细胞分选(FACS)。可标记这些抗体使其在与基因产物结合后能检测它们。适用于实施本发明的检测方法包括但不限于:含细胞的样品或组织的免疫组织化学、酶联免疫吸附测定(ELISA),包括含细胞的组织或血液样品的抗体夹心试验、质谱和免疫-PCR。
术语“标记”或“标记的”指能产生表示标记分子存在的可检测信号的组合物。合适的标记物包括放射性同位素、核苷酸生色团、酶、底物、荧光分子、生物发光部分、磁性颗粒、生物发光部分等。因此,标记物是可通过光谱、光化学、生物化学、免疫化学、电学、光学或化学方法检测的任何组合物。
术语“支持物”指常规支持物,例如珠、颗粒、浸渍片、纤维、滤膜、膜、和硅烷或硅酸盐支持物,例如载玻片。
“表达”和“基因表达”包括核酸物质的转录和/或翻译。
本文所用的术语“包含”及其同源词以它们的含意使用;即,与术语“包括”及其相应的同源词等价。
“允许”某事件发生的条件或“适合于”某事件发生的条件,例如杂交、链延伸等,或者“合适”的条件是不会阻止这种事件发生的条件。因此,这些条件可允许、增强、有助于和/或有益于该事件。本领域已知的与本文所述的这些条件取决于,例如核苷酸序列的性质,温度和缓冲液条件。这些条件也取决于所需要的事件,例如杂交、切割、链延伸或转录。
本文所用的序列“突变”指与参比序列相比,感兴趣的本文所述基因的序列中任何的序列改变。序列突变包括因诸如取代、缺失或插入机制所造成的序列中单个核苷酸改变或多个核苷酸改变。单核苷酸多态性(SNP)也是本文所用的一种序列突变。因为本发明依据基因表达的相对水平,所以也可检验本文所述基因的非编码区中的突变来实施本发明。
“检测”包括任何检测方式,包括直接或间接测定基因表达的水平及其变化。
除非另有定义,本文所用的所有技术和科学术语具有与本发明所属领域的普通技术人员共同理解的相同意义。
附图简要说明
图1显示可用一组100种表达基因序列的若干亚组表达水平对39种肿瘤及其亚组进行分类的能力图。该100种序列中的5、10、15、20、25、30、35、40、45和49种的随机组合的表达水平(各取样10次)与肿瘤类型的数据联用,然后用于预测2-39种类型的各组随机测试肿瘤样品(各取样10次)。以非限制性例子的形式显示肿瘤类型数目(x轴)与用5-49种基因所得结果的预测性精确度(y轴)绘制的图。采用5种基因获得的数据产生的曲线最接近x轴,而采用49种基因获得的数据产生的曲线距离x轴最远。精确度一般随着基因序列数目增加而升高,30-49种基因序列(距离x轴最远的三条曲线)提供的精确度水平大约相同。
图2显示了图1所用数据的另一种表现形式。显示所用基因序列的数目(5-49,x轴)与肿瘤类型不同代表性数目的预测精确度(y轴)绘制的图。绘制的线条从上到下分别是对2、10、20、30和39种肿瘤类型的结果。
图3进一步分析了采用采用一组100种随机选择的表达基因序列的亚组的表达水平来分类39种肿瘤类型的能力。采用图1和2所用数据绘制预测精确度为55-70%时肿瘤类型数量与所用基因序列的数量的图,显示为非限制性例子。通常,基因序列的数量越多,精确度越高。
图4显示可用第一组74种表达基因序列的一部分的表达水平对39种肿瘤及其亚组进行分类的能力图。所有74种序列中5、10、15、20、25、30、35、40、45和49种的随机组合(各取样10次)的表达水平与肿瘤类型的数据联用,然后用于预测2-39种类型的各组随机测试肿瘤样品(各取样10次)。肿瘤类型数量与用5-49种基因所得结果的预测精确度绘制的图以非限制性例子显示。绘制的线条从上到下分别是49、40、30、20、10和5种基因序列的结果。。
图5显示了图4所用数据的另一种表现形式。显示所用基因序列的数目(5-49)与肿瘤类型不同代表性数目的预测精确度绘制的图。绘制的线条从上到下分别是2、10、20、30和39种肿瘤类型的结果。
图6类似于图3,但采用了图4和5所用的数据。
图7显示可用一组90种表达基因序列的各亚组的表达水平对39种肿瘤及其亚组进行分类的能力图。90种序列中5、10、15、20、25、30、35、40、45和49种的随机组合(各取样10次)的表达水平与肿瘤类型的数据联用,然后用于预测2-39种类型的各组随机测试肿瘤样品(各取样10次)。肿瘤类型数目与用5-49种基因所得结果的预测精确度绘制的图以非限制性例子显示。绘制的线条从上到下分别是49、40、30、20、10和5种基因序列的结果。
图8显示了图7所用数据的另一种表现形式。显示所用基因序列的数目(5-49)与肿瘤类型不同代表性数目的预测精确度绘制的图。绘制的线条从上到下分别是2、10、20、30和39种肿瘤类型的结果。
图9类似于图3和6,但采用了图7和8所用的数据。
图10A-10D显示了对本文所述肿瘤类型以及其它已知肿瘤类型进行分类的“树结构”。它是主要根据《癌症,肿瘤学的原理与实践》(Cancer,Principles and Practice ofOncology),(DeVito,Hellman和Rosenberg),第六版构建。因此,以“未知来源的肿瘤”(或“tuo”)开始,第一种可能性是它是生殖细胞或非生殖细胞来源。如果是前者,肿瘤可能是卵巢或睾丸来源。在睾丸来源中,肿瘤可能是精原细胞瘤来源或“其它”来源。
如果肿瘤是非生殖细胞来源,可以是上皮细胞或非上皮细胞来源。如果是前者,则可以是鳞状或非鳞状来源。鳞状来源肿瘤是宫颈、食管、喉、肺或皮肤来源。非鳞状来源肿瘤是膀胱、乳腺、类癌-肠、胆管癌、消化道、肾脏、肝脏、肺、前列腺、生殖系统、皮肤基底细胞或甲状腺-滤泡-乳头来源。在消化道来源类型中,肿瘤是小肠和大肠、胃-腺癌、胆管、食管、胆囊和胰腺来源。食道来源肿瘤可以是巴雷特食管或腺癌类型。生殖系统来源肿瘤可以是宫颈腺癌类型、子宫内膜肿瘤或卵巢来源。卵巢来源肿瘤是透明(细胞)、浆液(细胞)、黏液(细胞)和子宫内膜类型。
如果肿瘤是非上皮来源,则是肾上腺、脑、GIST(胃肠基质肿瘤)、淋巴瘤、脑膜瘤、间皮瘤、肉瘤、皮肤黑色素瘤或甲状腺-髓质来源。就淋巴瘤而言,有B细胞、何杰金或T细胞类型。就肉瘤而言,有平滑肌肉瘤(leimyosarcoma)、骨肉瘤、软组织肉瘤、软组织MFH(恶性纤维组织细胞瘤)、软组织滑膜肉瘤、软组织尤因肉瘤、软组织纤维肉瘤和软组织横纹肌肉瘤类型。
本发明实施方式详述
本发明提供利用基因表达信息以比常规病理学技术可能更客观的方式对肿瘤进行分类的方法。因此,在第一方面,本发明提供将含细胞的样品分类为包含某类型组织(或来自某类型组织)或某组织来源的肿瘤细胞。该方法包括测定或检测得自对象的含细胞样品中细胞的约5-49种转录序列的表达水平,根据所述序列的表达水平将该样品从多种肿瘤类型中分类为含有某类型组织的肿瘤细胞。本文所用的“多种”指两种以上。
可根据所述约5-49种转录序列在样品细胞中的表达水平与它们在已知肿瘤样品和/或已知的非肿瘤样品中的表达水平作比较进行分类。或者,与(或根据)在已知肿瘤样品和/或已知的非肿瘤样品中进行的同一比较相比,可根据在同一样品中所述约5-49种转录序列的表达水平与参比序列的表达水平相比较进行分类。因此,作为一非限制性例子,可测定一组已知肿瘤样品中所述基因序列的表达水平以提供数据库,将其与对象的含细胞样品所检测或测定到的表达水平作比较。也可将样品中基因序列的表达水平与所述序列在正常或非癌性细胞(优选得自同一样品或对象)中的表达水平作比较。如下文和采用Q-PCR或实时Q-PCR的本发明实施方案中所述,可将所述表达水平与同一样品中参比基因的表达水平作比较,或者可利用表达水平的比例。
在实践中,该方法利用的转录序列与分类的肿瘤类型数量之比约为1∶2-5∶2或更高。换言之,所需的表达水平数量与可根据该水平进行分类的肿瘤类型数量之比约为1∶2至1∶1至3∶2至2∶1至5∶2或更高。能够采用少至约20种表达水平对39肿瘤类型进行分类反映了这种比值(参见图6)。因此,根据图1-9所示数据,可用评估基因与分类肿瘤之比之内的约5-49种基因序列实施本发明。
可随机选用约5-49种基因序列,或根据各种标准选择。作为一非限制性例子,可根据无督导学习(unsupervised learning)选择所述基因序列,包括簇集技术。作为另一非限制性例子,选择可以是降低或除去它们分类肿瘤类型能力的冗余度。例如,可根据其表达与用于分类的一种或多种其它基因序列的表达之间缺乏相关性来选择基因序列。这可通过评估多个样品的表达数据组中各基因的表达水平与该数据组中其它各基因序列的表达水平的相关性,产生相关系数的相关矩阵来实现。这些相关性的测定可直接比较各对基因序列之间的表达,或者不直接比较各对基因序列的表达值而间接进行。
可采用各种相关性(分析)方法使数据组内各基因序列的表达数据相关联。非限制性例子包括参数和非参数方法,以及基于相互信息交流的方法与非线性方法。参数方法的非限制性例子包括Pearson相关性(或Pearson r,也称为线性或产物-时刻相关性(product-moment))和余弦相关性。非参数方法的非限制性例子包括Spearman R(或等级排序)相关性、Kendall Tau相关性和γ统计学方法。可采用各相关性方法来测定数据组中各基因序列表达的相关性水平。所有序列与所有其它序列的相关性最易于视作矩阵。采用Pearson相关性方法作为非限制性例子,该方法的相关系数r用于表示相关性水平。当采用其它相关性方法时,可采用类似于r的相关系数,以及认为对应于r是0.25或约0.25到r是0.5或约0.5的相关性是等价水平。
可视需要选择相关系数从而将相关的基因序列数目减少至不同数值。在采用r的本发明实施方案中,所选择的系数值可以是约0.25以上、约0.3以上、约0.35以上、约0.4以上、约0.45以上或约0.5以上。系数值的选择表示当该数据组中基因序列之间的表达在该值以上相关,它们可能不包括在本发明的亚组内。因此,在一些实施方案中,所述方法包括排除或除去(不用于分类的)与肿瘤类型数据组中另一基因序列的表达相关的在所需相关系数之上的一种或多种基因序列。然而,应指出也存在基因序列与任何其它序列不相关的情况,在此情况中无需将它们从分类应用中除去。
因此,可利用与所用基因序列(组)中另一序列的表达水平在大于约10%、大于约20%、大于约30%、大于约40%、大于50%、大于约60%、大于约70%、大于约80%或大于约90%水平不相关的基因序列的表达水平来实施本发明。表达水平间的相关性值小于约0.9、约0.8、约0.7、约0.6、约0.5、约0.4、约0.3或约0.2。能排除某些基因序列的表达水平而进行分类是因为该亚组中基因序列的表达与从该亚组中排除的基因序列的表达相关。由于信息是依据仍留在该亚组中的序列提供而不是被排除基因序列所表达,所以没有损失信息。因此,该亚组中基因序列的表达提供了与细胞的性能和/或特征(或表型)相关的信息内容。这可应用于对未作为原始基因表达数据组一部分而包括的其它肿瘤类型进行分类并与之具有相关性,由于根据该亚组中序列的表达与其它类型的序列表达之间的信息冗余度,可用本发明的该亚组序列对肿瘤进行分类。因此,本发明可用于将细胞分类为用于产生原始基因表达数据组的多种已知肿瘤以外的肿瘤类型。
也可根据其表达与某具体肿瘤类型的相关性降低来选择基因序列。这也反映在本发明依据以下观察的发现:与一种或多种肿瘤相关程度最高的表达水平在不同肿瘤类型分类中不一定最有价值。可利用随机选择的基因序列来分类以及采用其表达不与一种或多种肿瘤类型最显著相关的本文所述特定序列反映了这点。因此,实施本发明不必根据最显著的P值或根据基因表达与一种或多种肿瘤类型相关性的排序来选择基因序列。故而,无需利用根据诸如Kruskal-Wallis H-检验的方法得到的排序来实施本发明。
用于实施本发明的基因序列可包括观察到其表达与特定肿瘤类型相关联的那些基因序列,例如观察到雌激素受体的表达与一些乳腺和卵巢癌相关联。然而,在本发明的一些实施方案中,利用至少一种以前未鉴定为与分类任何肿瘤类型相关的基因序列的表达水平来实施本发明。因此,可不用以前用于将含细胞样品分类为2种以上(最多39种以上)肿瘤类型的表达有关或相关的所有基因序列来实施本发明。
虽然主要根据人对象描述本发明,但也可用于其它对象的样品。总之均需能评估多种已知肿瘤样品中基因序列的表达水平,从而可将未知或测试样品中(该序列)的表达水平与之作比较。因此,本发明可应用于含多种表达序列的任何生物的样品和多种已知肿瘤的样品。一个非限制性例子是根据小鼠基因组中可用于检测所表达的小鼠序列、和可利用的已知小鼠肿瘤样品或得到已知样品的能力而将本发明应用于小鼠样品。因此,考虑了本发明可用于其它样品,包括作为非限制性例子的哺乳动物、灵长类动物和用于临床检验的动物(例如大鼠、小鼠、家兔、狗、猫和黑猩猩)的那些样品。
虽然利用含细胞的样品不难实施本发明,但用于检测基因表达水平的任何含核酸样品也可用于实施本发明。不是限制本发明,本发明的样品可以是怀疑或已知含有肿瘤细胞的样品。或者,本发明的样品可以是分离自怀疑患有或处于患癌症风险对象的组织或体液的“肿瘤样品”或“含有肿瘤的样品”。本发明所用样品的非限制性例子包括临床样品,例如但不限于:固定的样品、新鲜样品或冷冻样品。样品可以是含有至少一些关于样品中细胞原位成分的信息的吸出物、细胞学样品(包括血液或其它体液)或组织样本,只要可利用相应的细胞或核酸来测定基因表达水平。本发明部分根据发现冷冻组织切片得到的结果可有效地应用于固定的组织和细胞样品以及拓展至新鲜样品。
固定样品的非限制性例子包括用福尔马林或甲醛(包括FFPE样品)、Boudin、戊二醛(glutaldehyde)、丙酮、酒精或任何其它固定剂,如用于固定免疫组织化学(HIC)的细胞或组织样品的那些固定剂来固定的样品。其它例子包括沉淀细胞相关核酸与蛋白质的固定剂。鉴于处理冷冻组织样本可能复杂,例如需要维持其冷冻状态,可用非冷冻样品,例如固定的样品、新鲜样品(包括血液或其它体液或组织的细胞)与最低限度处理的样品来实施本发明。在本发明的一些应用中,不采用标准病理学技术,例如但不限于免疫组织化学试验对样品进行分类。
在本发明的一些实施方案中,将样品分类为含有选自以下53种类型及其亚组的肿瘤细胞:乳腺癌、宫颈腺癌、食道腺癌、胆囊腺癌、肺腺癌、胰腺癌、小肠-大肠腺癌、胃腺癌、星形细胞瘤、皮肤基底细胞癌、肝脏胆管癌、卵巢透明细胞腺癌(ClearCell Adenocarcinoma of Ovary)、弥散性大B细胞淋巴瘤、胚胎睾丸癌、子宫内膜子宫癌、尤因肉瘤、滤泡性甲状腺癌、胃肠基质肿瘤、卵巢生殖细胞瘤、睾丸生殖细胞瘤、多形性成胶质细胞瘤、肝细胞肝癌、何杰金淋巴瘤、大细胞肺癌、平滑肌肉瘤、脂肉瘤、乳腺小叶癌、恶性纤维组织细胞瘤、甲状腺髓样癌、黑色素瘤、脑膜瘤、肺间皮瘤、卵巢黏液腺癌、肌纤维肉瘤(Myofibrosarcoma)、大肠神经内分泌肿瘤(Neuroendocrine Tumor of Bowel)、少突神经胶质细胞瘤、骨肉瘤、甲状腺乳头状癌、嗜铬细胞瘤、肾细胞肾癌、横纹肌肉瘤、睾丸精原细胞瘤、卵巢浆液腺癌、小细胞肺癌、宫颈鳞状细胞癌、食道鳞状细胞癌、喉鳞状细胞癌、肺鳞状细胞癌、皮肤鳞状细胞癌、滑膜肉瘤、T细胞淋巴瘤和膀胱移行细胞癌。
在本发明的其它实施方案中,将样品分类为含有选自以下34种类型及其亚组的肿瘤细胞:肾上腺(癌)、脑(癌)、乳腺(癌)、小肠类癌(carcinoid-intestine)、子宫颈(鳞状细胞癌)、胆管癌、子宫内膜(癌)、生殖细胞(癌)、GIST(胃肠基质肿瘤)、肾(癌)、平滑肌肉瘤、肝(癌)、肺(大细胞腺癌)、肺(小细胞癌)、肺(鳞状细胞癌)、淋巴瘤(B细胞)、淋巴瘤(何杰金)、脑膜瘤、间皮瘤、骨肉瘤、卵巢(透明细胞)、卵巢(浆液细胞)、胰腺、前列腺、皮肤(基底细胞)、皮肤(黑色素瘤)、小肠与大肠、软组织(脂肉瘤)、软组织(MFH或恶性纤维组织细胞瘤)、软组织(肉瘤-滑膜)、睾丸(精原细胞瘤)、甲状腺(滤泡性-乳头状)、甲状腺(髓样癌)和膀胱(癌)。
在本发明的其它实施方案中,样品分类为含有选自以下39种类型及其亚组的肿瘤细胞:肾上腺(癌)、脑(癌)、乳腺(癌)、小肠类癌、宫颈癌、宫颈鳞状细胞(癌)、子宫内膜(癌)、胆囊(癌)、卵巢生殖细胞(癌)、GIST、肾(癌)、平滑肌肉瘤、肝(癌)、大细胞肺癌、小细胞肺(癌)、肺鳞状细胞(癌)、B细胞淋巴瘤、何杰金淋巴瘤、T细胞淋巴瘤、脑膜瘤、间皮瘤、骨肉瘤、卵巢-透明细胞、卵巢-浆液细胞、胰腺、前列腺、皮肤-基底细胞、皮肤黑色素瘤、鳞状细胞皮肤(癌)、小肠和大肠(癌)、软组织-脂肉瘤、软组织-MFH、肉瘤-滑膜软组织(癌)、胃腺癌、其它睾丸(癌)(或非精原细胞瘤)、睾丸精原细胞瘤、甲状腺滤泡性-乳头状(癌)、甲状腺髓样(癌)和膀胱(癌)。
本发明的方法也可应用于将含细胞的样品分类为含有上述各组任一亚组肿瘤的肿瘤细胞。该亚组一般不大,包括上述肿瘤类型的2、3、4、5、6、7、8、9或10种。或者,该亚组的大小可以是该组全部大小的任何整数。因此,本发明的实施方案包括在11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51或52种上述类型中分类。在一些实施方案中,所述亚组包括同一组织或器官类型的肿瘤。或者,该亚组可包括不同组织或器官的肿瘤类型。在一些实施方案中,该亚组包括选自以下的一种或多种肿瘤类型:肾上腺(癌)、脑(癌)、小肠类癌、宫颈腺癌、宫颈鳞状细胞癌、胆囊癌、卵巢生殖细胞(癌)、GIST、平滑肌肉瘤、肝(癌)、脑膜瘤、骨肉瘤、皮肤基底细胞癌、皮肤鳞状细胞癌、软组织-脂肉瘤、软组织-MFH、肉瘤-滑膜软组织癌、其它睾丸(癌)、睾丸-精原细胞瘤、甲状腺滤泡性-乳头状(癌)和甲状腺-髓样(癌)。
图1-9所示结果证明上述肿瘤类型各亚组的分类,可利用少至约5种以上的基因序列表达水平对上述一组39种(类型)中的两种肿瘤类型的随机样品进行分类。可采用少至约20-49种基因序列的表达水平对所有39种肿瘤类型进行不同精确程度的分类。可利用在人“转录组(transcriptome)”(基因组的转录部分)中发现的约10种以上、约15种以上、约20种以上、约25种以上、约30种以上、约35种以上、约40种以上、或约45种以上至49种转录序列的表达水平来实施本发明。也可利用约10-20种以上、约20-30种以上、约30-40种以上、约40-50种以上或49种转录序列的表达水平来实施本发明。在本发明的一些实施方案中,可随机选出被转录的基因或包括本文所述全部或一些具体基因序列。如本文所述,利用本发明可以进行约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%或约95%以上的精确度分类。
在其它实施方案中,可与上述测定用于分类的表达水平一起测定其它基因序列的基因表达水平。一个这样的非限制性例子是利用微阵列平台测定基因表达,其中也检测了其它基因序列的表达。当不采用其它基因表达水平来分类时,可认为它们是“过度”转录序列的结果,对实施本发明不重要。或者,当采用那些其它基因表达水平来分类时,它们属于本发明范围内,当说到所用序列的特定数目时不一定排除利用其它序列的表达水平。在一些实施方案中,本发明包括利用一种或多种“过度”基因序列的表达水平,例如提供的信息多于本发明方法所用的一种或多种其它基因序列的那些基因序列。
因为将样品分类为含有上述肿瘤类型之一的细胞在本质上也对样品来源的组织或器官作了分类,本发明方法可应用于分类患者肿瘤样品的具体组织或器官来源。本发明的此应用特别可用于判断肿瘤样品是否是另一肿瘤转移所致。在本发明的一些实施方案中,肿瘤样品分类为以下24种之一:肾上腺、膀胱、骨、脑、乳腺、子宫颈、子宫内膜、食道、胆囊、肾脏、喉、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、皮肤、软组织、小肠/大肠、胃、睾丸、甲状腺和子宫。
尽管本发明也根据与39种肿瘤类型中所述序列表达水平的比较来分类上述肿瘤类型之一,但此分类可能要求更高水平的可信度。如果偏向提高该分类的可信度,可调整该分类将肿瘤样品鉴定为图10所示的具体来源或细胞类型。因此,可信度的提高是以降低鉴定肿瘤类型的来源或细胞类型的特异性为代价。
将含细胞的样品分类为上述39种肿瘤之一的肿瘤细胞实质上也对该样品来源的组织或器官部位作了分类。例如,将某样品鉴定为子宫颈-鳞状细胞需要将肿瘤归类于图10所示的子宫颈来源的鳞状细胞类型(进而分类为上皮而不是非上皮来源)。这也表示该肿瘤无需是生殖细胞来源。因此,可用本发明方法将肿瘤样品分类为对象或患者的某特定组织或器官部位。本发明的此应用在样品是另一肿瘤转移所致肿瘤的情况中特别有用。
通过采用合适的分类算法来实施本发明将含细胞的样品分类为上述类型之一的肿瘤细胞,所述算法采用督导学习来接收(以下信息)将样品分类为上述肿瘤类型之一的细胞:1)作为训练组的基因序列在多种已知肿瘤类型中的表达水平和2)同一基因在样品的一种或多种细胞中的表达水平。对于此点的进一步讨论见本文的实施例部分。表达水平可以任何形式的信号提供,包括本文所述的核酸表达或蛋白质表达。
技术人员知道分类的范围受到肿瘤类型的数目以及各肿瘤类型样品的数目影响。但鉴于本文提供了所有人肿瘤的充足样品,本发明不难应用于那些肿瘤类型以及其它类型的分类。
可用于实施本发明的分类算法的非限制性例子包括督导学习算法、机械学习算法(machine learning algorithm)、线性区别分析(linear discriminant analysis)、属性选择算法(attribute selection algorithm)和人工神经网络(ANN)。在本发明的优选实施方案中,采用距离分类算法(distance-based classification algorithm),例如k-最近邻(nearestneighbor)(KNN)算法或支持向量机制(support vector machine)(SVM)。
本发明的一些实施方案中采用了KNN,作为非限制性代表性例子进一步得到讨论。可采用KNN来分析包括本文所述所有39种肿瘤的已知肿瘤样品的“训练组”中基因的表达数据。然后可将该训练数据组与含细胞样品中同一基因的表达数据作比较。再通过KNN将样品中基因的表达水平与该训练数据组作比较而鉴定具有最相似表达模式的那些肿瘤样品。作为非限制性例子,可鉴定五种“最相近”肿瘤类型来分类未知肿瘤样品。当然可利用其它数目的“最相近”(肿瘤类型)。非限制性例子包括5种以下、约7种、约9种或约11种以上“最相近”(肿瘤类型)。
作为一种假定的例子,如果某未知样品的五种“最相近”(肿瘤)是四种B细胞淋巴瘤和一种T细胞淋巴瘤,那么可以高精确度确定将该样品归类为B细胞淋巴瘤。如实施例中所述,应用此分类方法的精确度为84%,例如90%。
将这种分类能力与该分类方案的固有性质相结合可以提高某些条件下肿瘤分类的可信度。例如,如果某样品的五种“最相近”(肿瘤)是三种卵巢透明细胞瘤和两种卵巢浆液肿瘤,则可简单地将该肿瘤归类为卵巢来源并据此治疗对象或患者(从其获得样品的)而提高可信度。参见图8。这是为提高可信度而降低特异性的例子。这提供了判断该未知样品是粘液瘤或子宫内膜肿瘤可能性的额外益处。当然,专业医师可自由地将肿瘤视作此两种最大可能肿瘤的一种或两种,并根据该测定结果进行治疗。
因为某些肿瘤类型的肿瘤细胞(例如,生殖细胞)的发育谱系复杂且涉及多种细胞类型,图8看上去可能过于简单了。然而,它可用作与已知组织病理学相关联的良好基础并用作分析和联系肿瘤相关基因表达标记的“引导树(guide tree)”。
在“最相近”(肿瘤)模糊不清时,该分类方案的固有性质也提供了提高肿瘤分类可信度的方法。例如,如果五种“最相近”(肿瘤)是一种膀胱、一种乳腺、一种肾脏、一种肝脏和一种前列腺,可以简单地归类为非鳞状细胞肿瘤(类型)。可以显著可信度作出这种测定,据此治疗获得样品的对象或患者。不想受理论的束缚并且只是为增进对本发明的理解而提供的后两个例子反映了相似的细胞类型和/或组织来源的细胞具有相似的基因表达。
本发明的实施方案包括用本文所述方法和材料来鉴定患者癌症的来源。因此,假定某样品含肿瘤细胞,可采用本发明鉴定该肿瘤细胞的组织来源。一个非限制性例子是其发炎淋巴结含有癌细胞的对象。这些细胞可来自该淋巴结引流的组织或器官,或者可以是另一组织来源。可用本发明将这些细胞分类为具体的肿瘤或组织类型(或来源)从而鉴定癌细胞的来源。在另一非限制性例子中,首先用本发明(方法)检验样品(例如淋巴结)含有的细胞从而将至少一种细胞分类为某组织类型或来源的肿瘤细胞。然后利用此(结果)鉴定该样品中癌细胞的来源。二者均是本发明优于采用其它癌症诊断检验的省时、省力、省成本的例子。
在其它实施方案中,利用以前有癌症史的对象的样品实施本发明。作为非限制性例子,可能发现此对象的含细胞样品(来自淋巴结或其它组织)含有癌细胞从而可用本发明来测定癌细胞是否来自先前癌症的同一组织或不同组织。本发明的此应用也可用于鉴定新的原发性肿瘤,例如在曾患乳腺癌的对象的肝脏中发现的新癌细胞。本发明可用于鉴定以前乳腺癌转移所致(或来自另一种肿瘤,无论以前是否鉴定过)或新产生的原发性肝癌的新癌细胞。本发明也可应用于发现有多种癌症的组织或器官的样品来测定各种癌症的来源以及这些癌症是否为同一来源。
虽然可用随机分组的表达基因序列的表达水平来实施本发明,但本发明也提供了用于实施本发明的示范性基因序列。本发明提供了第一组74种基因序列,其中约5-49种可用于实施本发明。这5-49种基因序列可与其它序列表达水平的测定联用,只要该组74种基因序列的表达水平可用于分类。本发明这种实施方案的非限制性例子是联合测定这74种基因序列中约5-49种的表达,与多种其它序列的表达水平,例如利用实施本发明所用的微阵列平台。当不用那些其它序列的表达水平来分类时,可认为它们是“过度”转录序列所致,对实施本发明不重要。或者,当用那些其它序列的表达水平来时,它们属于本发明范围内,在此情况中利用上述序列无需排除利用其它序列的表达水平。
实施本发明所用的一组74种基因序列的相应mRNA序列和其它鉴定信息见附件(序列表)。下文提供了包括登录号和其它信息在内的鉴定信息的清单。
>Hs.73995_mRNA_1 gi|190403|gb|M60502.1|HUMPROFILE人原聚角蛋白微丝蛋白(profilaggrin)mRNA,3′末端聚腺苷酸=1
>Hs.75236_mRNA_4 gi|14280328|gb|AY033998.1|智人(Homo sapiens)聚腺苷酸=3
>Hs.299867_mRNA_1 gi|4758533|ref|NM_004496.1|智人肝细胞核因子3,α(HNF3A),mRNA聚腺苷酸=3
>Hs.285401_contig1
AI147926|AI880620|AA768316|AA761543|AA279147|AI216016|AI738663|N79248|AI684489|AA960845|AI718599|AI379138|N29366|BF002507|AW044269|R34339|R66326|H04648|R67467|AI523112|BF941500聚腺苷酸=2聚腺苷酸=3
>Hs.182507_mRNA_1 gi|15431324|ref|NM_002283.2|智人角蛋白,毛发,碱性,5(KRTHB5),mRNA聚腺苷酸=3
>Hs.292653_contig1
AI200660|AW014007|AI341199|AI692279|AI393765|AI378686|AI695373|AW292108|T10352|R44346|AW470408|AI380925|BF938983|AW003704|H08077|F03856|H08075|F08895|AW468398|AI865976|H22568|AI858374|AI216499聚腺苷酸=2聚腺苷酸=3
>Hs.97616_mRNA_3 gi|12654852|gb|BC001270.1|BC001270智人克隆MGC:5069IMAGE:3458016聚腺苷酸=3
>Hs.123078_mRNA_3 gi|14328043|gb|BC009237.1|BC009237智人克隆MGC:2216 IMAGE:2989823聚腺苷酸=3
>Hs.285508_contig1 AW194680|BF939744|BF516467聚腺苷酸=1聚腺苷酸=1
>Hs.183274_contig1
BF437393|BF064008|BF509951|AW134603|AI277015|AI803254|AA887915|BF054958|AI004413|AI393911|AI278517|AW612644|AI492162|AI309226|AI863671|AA448864|AI640165|AA479926|AA461188|AA780161|BF591180|AI918020|AI758226|AI291375|BF001845|BF003064|AI337393|AI522206|BE856784|BF001760|AI280300 FLAG=1聚腺苷酸=2 WARN聚腺苷酸=3
>Hs.334841_mRNA_3 gi|14290606|gb|BC009084.1|BC009084智人克隆MGC:9270 IMAGE:3853674聚腺苷酸=3
>Hs.3321_contig1
AI804745|AI492375|AA594799|BE672611|AA814147|AA722404|AW170088|D11718|BG153444|AI680648|AA063561|BE219054|AI590287|R55185|AI479167|AI796872|AI018324|AI701122|BE218203|AA905336|AI681917|BI084742|AI480008|AI217994|AI401468聚腺苷酸=2 聚腺苷酸=3
>Hs.306216_singlet1 AW083022聚腺苷酸=1聚腺苷酸=2
>Hs.99235_contig1 AA456140|AI167259|AA450056聚腺苷酸=2聚腺苷酸=3
>Hs.169172_mRNA_2 gi|2274961|emb|AJ000388.1|HSCANPX(需)钙蛋白酶样蛋白酶的智人mRNA,CANPX聚腺苷酸=3
>Hs.351486_mRNA_1 gi|16549178|dbj|AK054605.1|AK054605智人cDNAFLJ30043 fis,克隆3NB692001548聚腺苷酸=0
>Hs.153504_contig2
BE962007|AW016349|AW016358|AW139144|AA932969|AI025620|AI688744|AI865632|AA854291|AA932970|AU156702|AI634439|AA152496|AI539557|AI123490|AI613215|AI318363|AW105672|AA843483|AI366889|AW181938|AI813801|AI433695|AA934772|N72230|AI760632|BE858965|AW058302|AI760087|AI682077|AA886672|AI350384|AW243848|AW300574|BE466359|AI859529|AI921588|BF062899|BE855597|BE617708聚腺苷酸=2聚腺苷酸=3
>Hs.199354_singlet1 AI669760聚腺苷酸=1聚腺苷酸=2
>Hs.162020_contig1 AW291189|AA505872聚腺苷酸=2聚腺苷酸=3
>Hs.30743_mRNA_3 gi|18201906|ref|NM_006115.2|黑色素瘤中的智人优选表达抗原(PRAME),mRNA聚腺苷酸=3
>Hs.271580_contig1
AI632869|AW338882|AW338875|AW613773|AI982899|AW193151|BE206353|BE208200|AI811548|AW264021聚腺苷酸=2聚腺苷酸=3
>Hs.69360_mRNA_2 gi|14250609|gb|BC008764.1|BC008764智人克隆MGC:1266IMAGE:3347571聚腺苷酸=3
>Hs.30827_contig1 H07885|N39347|W85913|AA583408|W86449聚腺苷酸=2聚腺苷酸=3
>Hs.211593_contig2
BF592799|AI570478|AA234440|R40214|BE501078|AW593784|AI184050|AI284161|W72149|AW780437|AI247981|AW241273|H60824聚腺苷酸=2聚腺苷酸=3
>Hs.155097_mRNA_1 gi|15080385|gb|BC011949.1|BC011949智人克隆MGC:9006 IMAGE:3863603聚腺苷酸=3
>Hs.5163_mRNA_1gi|15990433|gb|BC015582.1|BC015582智人克隆MGC:23280IMAGE:4637504聚腺苷酸=3
>Hs.55150_mRNA_1 gi|17068414|gb|BC017586.1|BC017586智人克隆MGC:26610 IMAGE:4837506聚腺苷酸=3
>Hs.170177_contig3
AI620495|AW291989|AA780896|AA976262|AI298326|BF111862|AW591523|AI922518|AI480280|BF589437|AA600354|AI886238|AA035599|H90049|BF112011|N52601|AI570965|AI565367|AW768847|H90073|BE504361|N45292|AI632075|AA679729|AW168052|AI978827|AI968410|AI669255|N45300|AI651256|AI698970|AI521256|AW078614|AI802070|AI885947|AI342534|AI653624|AW243936|T16586|R15989|AI289789|AI871636|AI718785|AW148847聚腺苷酸=2聚腺苷酸=3
>Hs.184601_mRNA_5 gi|4426639|gb|AF104032.1|AF104032智人聚腺苷酸=2
>Hs.351972_singlet1 AA865917聚腺苷酸=2聚腺苷酸=3
>Hs.5366_mRNA_2 gi|15277845|gb|BC012926.1|BC012926智人克隆MGC:16817IMAGE:3853503聚腺苷酸=3
>Hs.18140_contig1
AI685931|AA410954|T97707|AA706873|AI911572|AW614616|AA548520|AW027764|BF511251|AI914294|AW151688聚腺苷酸=1聚腺苷酸=1
>Hs.133196_contig2
BF224381|BE467992|AW137689|AI695045|AW207361|BF445141|AA405473聚腺苷酸=2 WARN 聚腺苷酸=3
>Hs.63325_mRNA_5gi|15451939|ref|NM_019894.1|智人跨膜蛋白酶,丝氨酸4(TMPRSS4),mRNA 聚腺苷酸=3
>Hs.250692_mRNA_2 gi|184223|gb|M95585.1|HUMHLF肝脏白血病因子(HLF)mRNA,完整cds聚腺苷酸=3
>Hs.250726_singlet4 AW298545聚腺苷酸=2聚腺苷酸=3
>Hs.79217_mRNA_2 gi|16306657|gb|BC001504.1|BC001504智人克隆MGC:2273IMAGE:3505512聚腺苷酸=3
>Hs.47986_mRNA_1 gi|13279253|gb|BC004331.1|BC004331智人克隆MGC:10940 IMAGE:3630835聚腺苷酸=3
>Hs.94367_mRNA_1 gi|10440200|dbj|AK027147.1|AK027147智人cDNA:FLJ23494 fis,克隆LNG01885聚腺苷酸=3
>Hs.4921b_contig1
BI493248|N66529|AA452255|BI492877|AW196683|AI963900|BF478125|AI421654|BE466675聚腺苷酸=1聚腺苷酸=1
>Hs.281587_contig2
R61469|R15891|AA007214|R61471|AI014624|N69765|AW592075|H09780|AA709038|AI335898|AI559229|F09750|R49594|H11055|T72573|AA935558|AA988654|AA826438|AI002431|AI299721聚腺苷酸=1聚腺苷酸=2
>Hs.79378_mRNA_1 gi|16306528|ref|NM_003914.2|智人细胞周期蛋白A1(CCNA1),mRNA聚腺苷酸=3
>Hs.156469_contig2
AI341378|AI670817|AI701687|AI335022|AW235883|AI948598|AA446356聚腺苷酸=2聚腺苷酸=3
>Hs.6631_mRNA_1gi|7020430|dbj|AK000380.1|AK000380智人cDNA FLJ20373fis,克隆HEP19740聚腺苷酸=3
>Hs.155977_contig1 AI309080|AI313045聚腺苷酸=1 WARN 聚腺苷酸=1
>Hs.95197_mRNA_4 gi|5817138|emb|AL110274.1|HSM800829智人mRNA;cDNADKFZp564I0272(来自克隆DKFZp564I0272)聚腺苷酸=3
>Hs.48956_contig1 N64339|AI569513|AI694073聚腺苷酸=1聚腺苷酸=1
>Hs.118825_mRNA_10 gi|1495484|emb|X96757.1|HSSAPKK3 MAP激酶激酶的智人mRNA聚腺苷酸=3
>Hs.135118_contig3
AI683181|AI082848|AW770198|AI333188|AI873435|AW169942|AI806302|AW340718|BF196955|AA909720聚腺苷酸=1聚腺苷酸=2
>Hs.171857_mRNA_1 gi|13161080|gb|AF332224.1|AF332224智人睾丸蛋白mRNA,部分cds聚腺苷酸=3
>Hs.18910_mRNA_3gi|12804464|gb|BC001639.1|BC001639智人克隆MGC:1944IMAGE:2959372聚腺苷酸=3
>Hs.194774_mRNA_1gi|16306633|gb|BC001492.1|BC001492智人克隆MGC:1774 IMAGE:3510004聚腺苷酸=3
>Hs.127428_mRNA_2gi|16306818|gb|BC006537.1|BC006537智人克隆MGC:1934 IMAGE:2987903聚腺苷酸=3
>Hs.126852_contig1
AI802118|BF197404|BF224434|AA931964|AW236083|AI253119|AW614335|AI671372|AI793240|AW006851|AI953604|AI640505|AI633982|AW195809|AI493069|AW058576|AW293622聚腺苷酸=2聚腺苷酸=3
>Hs.28149_mRNA_1 gi|14714936|gb|BC010626.1|BC010626智人克隆MGC:17687 IMAGE:3865868聚腺苷酸=3
>Hs.35453_mRNA_3 gi|7018494|emb|AL157475.1|HSM802461智人mRNA;cDNADKFZp761G151(来自克隆DKFZp761G151);部分cds聚腺苷酸=3
>Hs.180570_contig1
R08175|AA707224|AA699986|R11209|W89099|T98002|AA494546聚腺苷酸=2聚腺苷酸=3
>Hs.196270_mRNA_1 gi|11545416|gb|AF283645.1|AF283645智人染色体8遗传图8q21聚腺苷酸=3
>Hs.9030_mRNA_3gi|12652600|gb|BC000045.1|BC000045智人克隆MGC:2032IMAGE:3504527聚腺苷酸=3
>Hs.1282_mRNA_3 gi|4559405|ref|NM_000065.1|智人互补组件6(C6),mRNA聚腺苷酸=1
>Hs.268562_mRNA_2 gi|15341874|gb|BC013117.1|BC013117智人克隆MGC:8711 IMAGE:3882749聚腺苷酸=3
>Hs.151301_mRNA_3 gi|16041747|gb|BC015754.1|BC015754智人克隆MGC:23085 IMAGE:4862492聚腺苷酸=3
>Hs.111_contig1 AA946776|AW242338|H24274|AI078616聚腺苷酸=1聚腺苷酸=2
>Hs.150753_contig1 AI123582|AI288234聚腺苷酸=0聚腺苷酸=0
>Hs.82109_mRNA_1 gi|14250611|gb|BC008765.1|BC008765智人克隆MGC:1622IMAGE:3347793聚腺苷酸=3
>Hs.44276_mRNA_2 gi|12654896gb|BC001293.1|BC001293智人克隆MGC:5259IMAGE:3458115聚腺苷酸=3
>Hs.2142_mRNA_4 gi|13325274gb|BC004453.1|BC004453智人克隆MGC:4303IMAGE:2819400聚腺苷酸=3
>Hs.180908_contig1 AA846824|AW611680|AA846182|AA846342|AA846360聚腺苷酸=2聚腺苷酸=3
>Hs.89436_mRNA_1 gi|16507959|ref|NM_004063.2|智人钙黏着蛋白17,LI钙黏着蛋白(肝-肠)(CDH17),mRNA聚腺苷酸=1
>Hs.151544_mRNA_8 gi|3153107|emb|AL023657.1|HSDSHP智人SH2D1A cDNA,以前称为DSHP聚腺苷酸=3
>Hs.1657_contig4
AW473119|AA164586|AI540656|AI758480|AI810941|AI978964|AI675862|AI784397|AW591562|AW514102|AI888116|AI983175|AI634735|AI669577|AI202659|AI910598|AI961352|AI565481|AI886254|AI538838|AA291749|AW571455|AI370308|AI274727|AW473925|AW514787|AI273871|AW470552|AI524356|AI888281|AW089672|AI952766|AW440601|AI654044|AW438839|AI972926聚腺苷酸=2聚腺苷酸=3
>Hs.35984_mRNA_1 gi|6049161|gb|AF133587.1|AF133587智人染色体22遗传图22q11.2聚腺苷酸=3
>Hs.334534_mRNA_2 gi|17389403|gb|BC017742.1|BC017742智人,克隆IMAGE:4391536,mRNA聚腺苷酸=3
>Hs.60162_mRNA_1 gi|10437644|dbj|AK025181.1|AK025181智人cDNA:FLJ21528 fis,克隆COL05977聚腺苷酸=3
技术人员应理解可通过检测任何一种以上鉴定的序列或附件(序列表)中提供序列来检测这些序列的任何合适部分或片段的表达。所述部分宜足够大从而与含细胞样品中表达的其它序列相比可含有独特的序列。此外,技术人员应知道所述序列代表了双链分子的一条链,可检测两条链之一表明所述序列已表达。这是因为所述序列在细胞中表达为RNA分子,而为便于操作和检测宜将该RNA分子转化为cDNA分子。得到的cDNA分子可具有所表达的RNA的序列及其互补链的序列。因此,可检测RNA序列链或互补链。当然,也可能不用转化为cDNA而检测表达的RNA。
在本发明的一些实施方案中,可通过检测含细胞样品中所表达的序列与以下寡核苷酸的杂交来检测所述基因序列的表达水平,以下寡核苷酸对应于所提供的登录号所示的上述序列。
>AF133587
CCCGGATCGCCATCAGTGTCATCGAGTTCAAACCCTGAGCCCTTCATTCACCTCTGTGAG
>BC017742
TGCCCTTGCTCTGTGTCATCTCAGTCATTTGACTTAGAAAGTGCCCTTCAAAAGGACCCT
>BF437393
GGAGGGAGGGCTAATTATATATTTTGTTGTTCCTCTATACTTTGTTCTGTTGTCTGCGCC
>AI620495
CAGTTTGGATTGTATAATAACGCCAAGCCCAGTTGTAGTCGTTTGAGTGCAGTAATGAAA
>AK000380
AAATCAGAGTAACCCTTTCTGTATTGAGTGCAGTGTTTTTTACTCTTTTCTCATGCACAT
>BC009237
TGCCTGGCACAAAGAAGGAAGAATATAAATGATAGTTCGACTCGTCTGTGGAAGAACTTA
>BC008765
AGTCTTTTGCTTTTGGCAAAACTCTACTTAATCCAATGGGTTTTTCCCTGTACAGTAGAT
>BC001504
GGTTACTGTGGGTGGAATAGTGGAGGCCTTCAACTGATTAGACAAGGCCCGCCCACATCT
>NM_019894
TAAAATGCACTGCCCTACTGTTGGTATGACTACCGTTACCTACTGTTGTCATTGTTATTA
>BF224381
TTCTCTTTTGGGGGCAAACACTATGTCCTTTTCTTTTTCTAGATACAGTTAATTCCTGGA
>AL157475
AAGACCCACACCCTGTAGCAATACCAAGTGCTATTACATAATCAATGGACGATTTATACT
>AY033998
AGTGTTGCAAGTTTCCTTTAAAACCAACAAAGCCCACAAGTCCTGAATTTCCCATTCTTA
>H07885
GTCACTGTCATAGCAGCTGTGATTTCACAAGGAAGGGTGCTGCAGGGGGACCTGGTTGAT
>NM_004496
TTTCATCCAGTGTTATGCACTTTCCACAGTTGGTGTTAGTATAGCCAGAGGGTTTCATTA
>AA846824
GGGAAGTAGGGATTATTCGTTTAAATTCAATCGCGAGCACCAAGTCGGACTGGCCGGGGA
>BC017586
GGGACCAGGCCCTGGGACAGCCATGTGGCTCCAAATGACTAAATGTCAGCTCAAAAACCA
>AA456140
TCCGTTTATGGAGGCAATTCCATATCCTTTCTTGAACGCACATTCAGCTTACCCCAGAGA
>NM_002283
AGAGTTAAGCCACTTCCTGGGTCTCCTTCTTATGACTGTCTATGGGTGCATTGCCTTCTG
>AL023657
GTGGCCTGAGTAATGCATTATGGGTGGTTTACCATTTCTTGAGGTAAAAGCATCACATGA
>BC001639
ACACATGCATGTGTCTGTGTATGTGTGAATGTGAGAGAGACACAGCCCTCCTTTCAGAAG
>BC015754
TCTGTAACTGCACAACCCTGGGGTTTGCTGCAGAGCTATTTCTTTCCATGTAAAGTAGTG
>AF332224
AAACACTCTTTCCGACTCCAGAGGAGAAGCTGGCAGCTCTCTGTAAGAAATATGCTGATC
>BC001270
GCTTCCTCTATCGCCCAATGCAAAATCGATGAAATGGGGAGTTCTCTGGGCCAGGCCACA
>AI147926
GTAGAATCCTCTGTTCATAATGAACAAGATGAACCAATGTGGATTAGAAAGAAGTCCGAG
>AW298545
CTGTTTTAAAACTGAATGGCACGAAATTGTTTTCCTCAACTCGGAGATTCCTGTATGGAG
>AI802118
AATAAATAGTAGCTCTGCTGATGATGACGTTGATAACCAAACTGTTCTGTGGTCTTAAGT
>AI683181
CAAACAGCCCGGTCTTGATGCAGGAGAGTCTGGAAAAGGAAGAAAATGGTTTCAGTTTCA
>M95585
AACATGGACCATCCAAATTTATGGCCGTATCAAATGGTAGCTGAAAAAACTATATTTGAG
>AK027147
TTGTAATCATGCCAATTCCAGATCAATAACTGCATGTCTGTTCTTTGGTAGAAATAGCTT
>AW291189
AAAGATTATTAACCCAAATCACCTTTCTTGCTTACTCCAGATGCCTCAGCCTCTGATATA
>AI632869
GACTTCCTTTAGGATCTCAGGCTTCTGCAGTTCTCATGACTCCTACTTTTCATCCTAGTC
>BC006537
CTGTATATTTTGCAATAGTTACCTCAAGGCCTACTGACCAAATTGTTGTGTTGAGATGAT
>R61469
TGTTCAAACAGACTTTAACCTCTGCATCATACTTAACCCTGCGACATGCGTACAGTATGC
>BC009084
TGAGTCATATACATTTACTGACCACTGTTGCTTGTTGCTCACTGTGCTGCTTTTCCATGA
>N64339
CTGAAATGTGGATGTGATTGCCTCAATAAAGCTCGTCCCCATTGCTTAAGCCTTCAAAAA
>AI200660
ATCAAGAAAACCTAATCTTCTGACTCCCAGGCCAGGATGTTTTATTTCTCACATCATGTC
>AK054605
TTCATTTCCAAACATCATCTTTAAGACTCCAAGGATTTTTCCAGGCACAGTGGCTCATAC
>NM_006115
AGTTAGAAATAGAATCTGAATTTCTAAAGGGAGATTCTGGCTTGGGAAGTACATGTAGGA
>X96757
CAATTTTCTTTTTACTCCCCCTCTTAAGGGGGCCTTGGAATCTATAGTATAGAATGAACT
>AI804745
GGGTGGAGTTTCAGTGAGAATAAACGTGTCTGCCTTTGTGTGTGTGTATATATACAGAGA
>AJ000388
CTCGCTCATTTTTTACCATGTTTTCCAGTCTGTTTAACTTCTGCAGTGCCTTCACTACAC
>BC008764
CTTTGGGCCGAGCACTGAATGTCTTGTACTTTAAAAAAATGTTTCTGAGACCTCTTTCTA
>AI309080
CTGGACCCTTGGAGCAGTGTTGTGTGAACTTGCCTAGAACTCTGCCTTCTCCGTTGTCAA
>AA865917
CCACCTCCTTCGACCTCCACTGCGCCCCACCTCCCTGCCTGTGTGTGTTATTTCAAAGGA
>AA946776
TCTGGCTGGTGGCCTGCGCGAGGGTGCAGTCTTACTTAAAAGACTTTCAGTTAATTCTCA
>AF104032
AGATGCTGTCGGCACCATGTTTATTTATTTCCAGTGGTCATGCTCAGCCTTGCTGCTCTG
>AW194680
TCCTTCCTCTTCGGTGAATGCAGGTTATTTAAACTTTGGGAAATGTACTTTTAGTCTGTC
>BC001293
GTCCTGTCCCTGTCTGGGAGTTGTGTTATTTAAAGATATTCTGTATGTTGTATCTTTTGC
>BE962007
ATTATATTTCAGGTGTCCTGAACAGGTCACTAGACTCTACATTGGGCAGCCTTTAAATAT
>BI493248
AGGAATGGTACTACCGTTCCAGATTTTCTGTAATTGCTTCTGCAAAGTAATAGGCTTCTT
>AF283645
CTGTACCCAAAGGATGCCAGAATACTAGTATTTTTATTTATCGTAAACATCCACGAGTGC
>AI669760
ATTGCCCCCCTAACCAATCATGCAAACTTTTCCCCCCCTGGGGTAATTCACCAGTTAAAA
>BC001492
CCCACAGTATTTAATGCCCTGTCAGTCCCTTCTAGTCTGACTCAATGGTAACTTGCTGTA
>BC004453
AAAACCAACTCTCTACTACACAGGCCTGATAACTCTGTACGAGGCTTCTCTAACCCCTAG
>BC010626
CTCAGACTGGGCTCCACACTCTTGGGCTTCAGTCTGCCCATCTGCTGAATGGAGACAGCA
>BC013117
CCTAATGGGGATTCCTCTGGTTGTTCACTGCCAAAACTGTGGCATTTTCATTACAGGAGA
>BC011949
CACTCACAATTGTTGACTAAAATGCTGCCTTTAAAACATAGGAAAGTAGAATGGTTGAGT
>AW083022
CTTTGAAGGGCTGCTGCACATTGTTGAATCCATCGACCTTTAGCTGCAATGGGATCTCTA
>R08175
TGCCTCATCGATATTATAGGGGTCCATCACAACCCAACTGTGTGGCCGGATCCTGAGTCT
>NM_000065
AAAACAGACAAAAGCCTTTGCCTTCATGAAGCATACATTCATTCAGGGGTAGACACACAA
>AK025181
TAACAAACAAAGGCAGTAGCTCATCACTTGGGTAGCAGGTACCCATTTTAGGACCCTACA
>NM_003914
ATATCAGAAGTGCCAATAATCGTCATAGGCTTCTGCACGTTGGATCAACTAATGTTGTTT
>AI123582
ATCATAGCCCAACCATGTGAGAAGAAGGAGAAGGCCCCCCTTTCTTCATTAATCTGAAAA
>BC004331
GCAGACCATTCTATCATACCTGGCAGGGCTTCTGTTTTATTTTGTAGGCTGGATGCTACC
>AI341378
ACTACAAGCCTCTTGTTTTTCACCAAAACCCTACATCTCAGGCTTACTAATTTTTGTGAT
>NM_004063
GCCATGCATACATGCTGCGCATGTTTTCTTCATTCGTATGTTAGTAAAGTTTTGGTTATT
>BC012926
CACCTATTTATTTTACCTCTTTCCCAAACCTGGAGCATTTATGCCTAGGCTTGTCAAGAA
>AL110274
GTGGACATAGCCACTAACCAACTAGTTACCTTTGGACTGCAACAAAAAATGTGAAAATGA
>AW473119
ACTTGTAAACCTCTTTTGCACTTTGAAAAAGAATCCAGCGGGATGCTCGAGCACCTGTAA
>AI685931
AATTCTCTATAAACGGTTCACCAGCAAACCACCAATACATTCCATTGTTTGCCTAGAGAG
>BF592799
AATGGCCCATGCATGCTGTTTGCAGCAGTCAATTGAGTTGAATTAGAATTCCAACCATAC
>BC000045
GAGCTCAGTACTTGCCCTGTGAAAATCCCAGAAGCCCCCGCTGTCAATGTTCCCCATCCA
>BC015582
ATGAAGCGGAATTAGGCTCCCGAGCTAAGGGACTCGCCTAGGGTCTCACAGTGAGTAGGA
>M60502
AGTGGCTATATCAACATCAGGGCTAGCACATCTTTCTCTATTATCCTTCTATTGGAATTC
本发明也提供第二组90种基因序列,其中约5-49种可用于实施本发明。这约5-49种基因序列可与其它序列表达水平的测定联用,只要该组90种(序列)中的基因序列表达水平可用于分类。本发明这种实施方案的一个非限制性例子是联合测定这90种基因序列中约5-49种的表达与多种其它序列的表达水平,例如利用实施本发明所用的微阵列平台来测定。当不用那些其它基因的表达水平来分类时,可认为它们是“过度”转录序列所致,对实施本发明不重要。或者,当利用那些其它基因的表达水平来分类时,它们属于本发明范围内,在此情况中利用上述序列无需排除利用其它序列的表达水平。
90种(基因序列)组中的38种包括在上述第一组74种(序列)中。两组之间相同成员的登录号是:AA456140、AA846824、AA946776、AF332224、AI620495、AI632869、AI802118、AI804745、AJ000388、AK025181、AK027147、AL157475、AW194680、AW291189、AW298545、AW473119、BC000045、BC001293、BC001504、BC004453、BC006537、BC008765、BC009084、BC011949、BC012926、BC013117、BC015754、BE962007、BF224381、BF437393、BI493248、M60502、NM_000065、NM_003914、NM_004063、NM_004496、NM_006115和R61469。这90种(基因序列)组中不存在于74种基因序列组中的成员的相应mRNA序列和其它鉴定信息见附件(序列表)。下文通过登录号以及相应的寡核苷酸序列提供了可用于实施本发明的这52种独特成员的鉴定信息清单。
>R15881
ACTTCTGGTGATGATAAAAATGGTTTTATCACCCAGATGTGAAAGAAGCTGCCTGTTTAC
>AI041545
GTGGTTCTGTAAAAACGCAGAGGAAAAGAGCCAGAAGGTTTCTGTTTAATGCATCTTGCC
>NM_024423
TTTATAAGGAAGCAGCTGTCTAAAATGCAGTGGGGTTTGTTTTGCAATGTTTTAAACAGA
>AB038160
CTTATGAAGCTGGCCGGGCCACTCACGTTCAATGGTACATCTGGGTCTCTATGTGGTTCT
>AK026790
GTGAGCCAGCATTTCCCATAGCTAACCCTATTCTCTTAGTCTTTCAAAATGTAGAATGGG
>BC012727
CTTTACACCTGATAAAATATTTTGCGAAGAGAGGTGTTCTTTTTCCTTACTGGTGCTGAA
>BC016451
GCATACATCTCATCCACAGGGGAAGATAAAGATGGTCACACAAACAGTTTCCATAAAGAT
>H09748
TGAGTTCAGCATGTGTCTGTCCATTTCATTTGTACGCTTGTTCAAAACCAAGTTTGTTCT
>NM_006142
AAGACCGAGACTGAGGGAAAGCATGTCTGCTGGGTGTGACCATGTTTCCTCTCAATAAAG
>AF191770
GGCATCTGGCCCCTGGTAGCCAGCTCTCCAGAATTACTTGTAGGTAATTCCTCTCTTCAT
>NM_006378
TGGATGTTTGTGCGCGTGTGTGGACAGTCTTATCTTCCAGCATGATAGGATTTGACCATT
>BC006819
TCCTGGCAGAGCCATGGTCCCAGGCTTCCCAAAAGTGTTTGTGGCAATTATTCCCCTAGG
>X79676
TTTGATGATAGCAGACATTGTTACAAGGACATGGTGAGTCTATTTTTAATGCACCAATCT
>BC006811
TTCTTCCAGTTGCACTATTCTGAGGGAAAATCTGACACCTAAGAAATTTACTGTGAAAAA
>NM_000198
GAACAATTGTGGTCTCTCTTAACTTGAGGTTCTCTTTTGACTAATAGAGCTCCATTTCCC
>AF301598
GTTAAGTGTGGCCAAGCGCACGGCGGCAAGTTTTCAAGCACTGAGTTTCTATTCCAAGAT
>NM_002847
CGGCCTACTGAGCGGACAGAATGATGCCAAAATATTGCTTATGTCTCTACATGGTATTGT
>NM_004062
CAGGGTGTTTGCCCAATAATAAAGCCCCAGAGAACTGGGCTGGGCCCTATGGGATTGGTA
>AW118445
TGTACAGTTTGGTTGTTGCTGTAAATATGGTAGCGTTTTGTTGTTGTTGTTTTTTCATGC
>BC002551
TACCAAACTGGGACTCACAGCTTTATTGGGCTTTCTTTGTGTCTTGTGTGTTTCTTTTAT
>AA765597
CATTGAGGTTTGGATGGTGGCAGGTAAAACAGAAAGGCAAGATGTCATCTGACATTAGGC
>AL137761
AGTTCAGCACTGTGGTTATCATTGGTGATGCCAGAAAACATTAGTAGACTTAGACAATTG
>X78202
TAAAATTTCTTGATTGTGACTATGTGGTCATATGCCCGTGTTTGTCACTTACAAAAATGT
>AK025615
AGCCATCTGGTGTGAAGAACTCTATATTTGTATGTTGAGAGGGCATGGAATAATTGTATT
>BC001665
CTTATTGTCACTGGTTAAGAACTTGGCGAGATTGAAGGGCTTTTGTTATTGTTGTTGGAT
>AI985118
CTTTCTAGTGAGCTAACCGTAACAGAGAGCCTACAGGATACACGTGAGATAATGTCACGT
>AL039118
TTGTCTTAAAATTTCTTGATTGTGATACTGTGGTCATATGCCCGTGTTTGTCACTTACAA
>AA782845
CCTGGGGGAAAGGGGCATTCATGACCTGAACTTTTTAGCAAATTATTATTCTCAGTTTCC
>BC016340
TTCATTAACAGTACTAAGTGGAAGGGATCTGCAGATTCCAAATTGGAATAAGCTCTATCA
>AA745593
CCAATGCAGAAGAGTATTAAGAAAGATGCTCAAGTCCCATGGCACAGAGCAAGGCGGGCA
>NM_004967
CAAGGCTACGATGGCTATGATGGTCAGAATTACTACCACCACCAGTGAAGCTCCAGCCTG
>BF510316
AGCTCACAGCTGGACAGGTGTTGTATATAGAGTGGAATCTCTTGGATGCAGCTTCAAGAA
>AA993639
TCCAAAGTAGAAAGGGTTCTTTTAGAAAACTTGAAGAATGTGCCTCCTCTTAGCATCTGT
>AV656862
GATGCATTTTTCAGTCCCTTTTCAGAGCAAATGCTTTTGCAATGGTAGTAATGTTTAGTT
>X69699
CCTGTGGGGCTTCTCTCCTTGATGCTTCTTTCTTTTTTTAAAGACAACCTGCCATTACCA
>BC013282
TTGCACTAAGTCATGCTGTTTCCTCAAAGAAGCTTTGTTTTTTGTTAACGTATTACTCAG
>AI457360
CTGGATCCCAGGCCCTGGCACCCCTCAGGAAATACAAGAAAAAGAATATTCACATCTGTT
>AW445220
TTAGAGGGGCCACCTATCAACTCATCAGTGTTCAAAGAATATGCTGGGAGCATGGGTGAG
>AF038191
GGCCCATTTATGTCCCTCATGTCTCTAGATTTTCTCGTCACCCAGCCTCAAAAATATATG
>X05615
TCCCCAAAAACCTCACCCGAGGCTGCCCACTATGGTCATCTTTTTCTCTAAAATAGTTAC
>BC005364
GAAATTCCTCACACCTTGCACCTTCCCTACTTTTCTGAATTGCTATGACTACTCCTTGTT
>AK025701
TGTCTGTCCACCACGAGATGGGAGGAGGAGAAAAAGCGGTACGATGCCTTCCTGACCTCA
>BF446419
GTCTTATCTCTCAGGGGGGGTTTAAGTGCCGTTTGCAATAATGTCGTCTTATTTATTTAG
>AK025470
CCGAGTAGTATGGGTCTCTGTGTGAGAAACCAGGAGATATTTTCATCTTGTTCGGAAATA
>BE552004
TTGTGCAAAAGTCCCACAACCTTTCTGGATTGATAGTTTGTGGTGAAATAAACAATTTTA
>H05388
TCCAGTATTCTGCAGGGCCAGTCAGTTGTACAGAAGTTGGAATATTCTGTTCCAGAATTA
>NM_033229
GTCTCGAACAGCGGTTGTTTTTACTTTATTTATCTTAGGCCCTCAGCTCCCTGACGTCCT
>BC010437
AGTGAATCTTTTCCTCTTGGTAGCATCAACACTGGGGATAAATCAGAACCATTCTGTGGA
>AI952953
TGAGAGCCCAGAACAAGAAGGAGCAGAAGGGCACTTTGACCTTCATTATTATGAAAATCA
>R45389
GGAAGAACTGATGCTTGCTGCTAACTAAAGTTTTGGATGTATCGATTTAGAGAACCAATT
>NM_001337
GAATGAGAGAATAAGTCATGTTCCTTCAAGATCATGTACCCCAATTTACTTGCCATTACT
>AI499593
TACGGAAAGGAAACAGGTTATACTCTTAGATTTAAAAAGTGAAAGAAACTGCAGGCGCCT
在本发明的一些实施方案中,可通过检测含细胞样品中所表达的序列与以上寡核苷酸的杂交来检测基因序列的表达水平,所述寡核苷酸对应于附件(序列表)所提供的登录号所示的序列。
在其它实施方案中,本发明提供74种(基因序列)组或90种(基因序列)组中任何数目基因序列在本发明方法中的应用。因此,在任何情况中本发明采用上述一组或两组中的49种基因序列的1种到全部。因此,可采用74种(基因序列)组或90种(基因序列)组中的约5-49种序列的1、2、3、4或5种以上。类似地,采用10-49种序列时,可采用来自这两组之一的6、7、8、9或10种序列。
本文所用的“肿瘤样品”或“含有肿瘤的样品”或“含有肿瘤细胞的样品”或其变化形式指分离自怀疑患有或处于患癌症风险的个体的含细胞组织或液体样品。这些样品可含有用已知方法或技术人员认为合适的其它方法分离的肿瘤细胞。这些方法包括但不限于:显微解剖、激光捕获显微解剖(LCM)或激光显微解剖(LMD)然后用于本发明。或者,可以利用组织“切片”中未经切割的细胞。这种样品的非限制性例子包括原代分离物(与培养的细胞相反),可用非侵入性或最低限度侵入性方法收集这些样品,所述方法包括但不限于:导管灌洗、细针吸取、针刺活检、美国专利6,328,709所述的装置和方法或本领域已知的任何其它合适方法。或者,可通过非侵入性方法,包括但不限于外科手术活检来收集样品。
可通过本领域已知的各种方法或技术人员认为合适的方法来检测与测量转录序列。基本上可采用任何试验方法,只要该试验能定量或定性反映所要检测的转录序列的表达。
认识到所述基因序列(无论随机选择的还是专门化的)表达水平的相关性而不是用测定实际表达水平的试验形式即能对肿瘤样品进行分类。本发明的试验可利用本文所述各个基因序列的任何经鉴定的特征,只要该试验能定量或定性反映“转录组”(基因组中各基因的转录组分)或“蛋白质组”(基因组中各基因表达的翻译组分)中该基因的表达。其它试验包括检测蛋白质组相关成员的多肽片段的那些试验。后者的非限制性例子包括检测生物液体,例如血液或血清中的蛋白酶解片段。要鉴定的特征包括但不限于编码(DNA)或表达(RNA)的独特核酸序列,所述的某基因序列编码蛋白质的特异性基因或表位,或该蛋白质的活性。
其它方法包括检测可表明表达水平增加的核酸扩增,可表明表达水平降低的核酸灭活、缺失或甲基化。换言之,可通过检验作为各个基因序列表达基础的DNA模板、用作表达该序列的中间体的RNA或该序列所表达的蛋白质产物的一个或多个方面,以及这种产物的蛋白酶解片段来实施本发明。同样,可通过检测这种DNA、RNA和蛋白质分子的存在、含量、稳定性或降解(包括速率)来实施本发明。
在一些实施方案中,可通过诸如聚合酶链式反应(PCR)及其变化形式,例如但不限于定量PCR(Q-PCR)、逆转录PCR(RT-PCR)和实时PCR(包括检测样品中各序列的mRNA拷贝的初始量的方法),任选实时RT-PCR或实时Q-PCR来扩增和检测某基因的全部或部分序列。这种方法可利用与某基因序列各部分互补的一种或两种引物,利用这种引物来引发核酸合成。任选标记新合成的核酸,可直接或通过与本发明多核苷酸杂交来检测。可使新合成的核酸在杂交条件下与本发明(含有基因序列)的多核苷酸接触。检测所述核酸表达的其它方法包括RNA酶保护试验,包括液相杂交和细胞原位杂交。
或者,可如2003年9月19日提交的美国专利申请60/504,087、2003年12月2日提交的10/727,100和2004年2月6日提交的10/773,761(所有三份申请如同全文列出一样纳入本文作为参考)所述检测FFPE样品中基因序列的表达。简言之,作为非限制性例子可采用杂交介导的检测(例如但不限于微阵列、珠或颗粒技术)或定量PCR介导的检测(例如但不限于实时PCR和逆转录PCR)来检测某基因序列全部或一部分的表达的或转录物。作为非限制性例子可采用免疫组织化学技术或其它抗体介导的检测(例如但不限于利用与其它相比能特异性结合该多肽至少一部分的标记抗体)来检测某表达多肽的全部或一部分的表达。也可用分析基因表达的其它方法,包括在一次试验中检测样品中全部或接近全部的基因表达(例如,作为基因表达概况分析的一部分,如在微阵列上进行分析)。线性RNA扩增的非限制性例子描述于美国专利申请10/062,857(2001年10月25日提交),以及美国临时专利申请60/298,847(2001年6月15日提交)和60/257,801(2000年12约22日提交),所有这些申请如同全文列出一样全文纳入本文作为参考。
利用核酸试验来测定表达的实施方案包括根据本领域已知的技术将一种或多种基因序列固定在固体支持物上,包括但不限于固定在诸如阵列或珠固体基材。或者,也可采用本领域已知的溶液表达试验。固定的基因序列可采取独特的或者所述基因的特异性多核苷酸形式从而使这些多核苷酸能与所述基因的DNA或RNA杂交。这些多核苷酸可以是全长基因或任选干扰最少(例如因错配或插入非互补碱基对)从而不影响与这些基因的相应DNA或RNA杂交的这些基因的短序列(由于删除了该序列的5’或3’末端,最长的也比本领域已知的全长序列短一个核苷酸)。在一些实施方案中,所用的多核苷酸是所述基因的3’末端,例如从某基因或所表达序列的聚腺苷酸化信号或聚腺苷酸化位点计算长约350、约300、约250、约200、约150、约100或约50个核苷酸。与所述基因的序列相比,也可利用含有突变的多核苷酸,只要这些突变虽存在但仍能杂交而产生可检测信号。因此,在所述序列和对象样品的细胞所表达的那些序列之间虽存在少量错配但不影响本发明的实施。在某种动物个体之间的序列多态性的情况中可观察到存在这种错配的非限制性例子,例如智人中的个别人患者。
本领域技术人员应知道,一些基因序列包含不会造成所述序列的独特性的3’poly A(或互补链上的poly T)延伸段。因此,可利用缺乏3’poly A(或3’poly T)延伸段的基因序列实施本发明。所述序列的独特性指只见于核酸中的这些序列的各部分或全部,包括见于其3’非翻译部分的独特序列。实施本发明的一些独特序列是形成所述基因的共有序列的那些序列,这些独特序列可用于检测不同个体中的表达而不是存在于一些个体中的多态性特异性序列。或者,可利用某个体或某亚群的独特序列。这些独特序列可以是本文所述的本发明多核苷酸的长度。
在本发明的其它实施方案中,可利用含有存在于所述基因序列3’非翻译区和/或非编码区的序列的多核苷酸来检测本发明含细胞样品中的表达水平。这种多核苷酸可任选含有见于所述基因序列编码区3’部分的序列。含有编码和3’非编码区序列相组合的多核苷酸优选具有连续排列和没有间插异源序列的序列。
或者,可利用含所述基因序列5’非翻译区和/或非编码区的序列的多核苷酸来实施本发明从而可检测本发明细胞和样品中的表达水平。这种多核苷酸可任选含有所述编码区5’部分的序列。含有编码区和5’非编码区序列相组合的多核苷酸可具有连续排列和没有间插异源序列的序列。也可利用所述基因序列编码区的序列实施本发明。
一些实施方案的多核苷酸含有由至少约16、至少约18、至少约20、至少约22、至少约24、至少约26、至少约28、至少约30、至少约32、至少约34、至少约36、至少约38、至少约40、至少约42、至少约44或至少约46个连续核苷酸组成的3’或5’非翻译区和/或非编码区序列。上句所用的术语“约”指所述数值加减1。其它实施方案利用含有至少或约50、至少或约100、至少约或150、至少或约200、至少或约250、至少或约300、至少或约350或至少或约400个连续核苷酸的序列的多核苷酸。上句所用的术语“约”指所述数值加减10%。
本发明多核苷酸中的基因编码区3’或5’端的序列与上述那些序列长度相同,除了它们受限于该编码区的天然长度。编码区的3’端可包括多达该编码区3’一半的序列。反之,编码区的5’端可包括多达该编码区5’一半的序列。当然,可采用上述序列或含有其各部分的编码区和多核苷酸的全长。
在本发明的另一实施方案中,可利用所述基因序列5’和/或3’端含有核苷酸缺失的多核苷酸。宜是5’和/或3’端缺失1-5、5-10、10-15、15-20、20-25、25-30、30-35、35-40、40-45、45-50、50-60,60-70、70-80、80-90、90-100、100-125、125-150、150-175或175-200个核苷酸,虽然缺失的程度受限于该序列的天然长度和能否利用这些多核苷酸检测表达水平的需要。
所述基因序列3’端衍生的本发明其它多核苷酸包含用于定量PCR的引物与任选探针的那些(序列)。引物和探针优选是能扩增以下区域的那些:即从某基因或所表达序列的聚腺苷酸化信号或聚腺苷酸化位点算起长度少于约750、少于约700、少于约650、少于约6000、少于约550、少于约500、少于约450、少于约400、少于约350、少于约300、少于约250、少于约200、少于约150、少于约100或少于约50个核苷酸的区域。本发明的PCR扩增子可以是任何大小,包括至少或约50、至少或约100、至少约或150、至少或约200、至少或约250、至少或约300、至少或约350或至少或约400个连续核苷酸,所有均包含与所用PCR引物互补的部分。
用于实施本发明的其它多核苷酸包括与所述基因序列具有足够同源性可采用杂交技术来检测它们表达的那些(序列)。这种多核苷酸优选与待用基因序列具有约或95%、约或96%、约或97%、约或98%或约或99%的相同性。如上所述,采用BLAST算法测定相同性。用于实施本发明的其它多核苷酸也可根据能否在严谨性条件下与本发明多核苷酸杂交的能力来描述,所述严谨性条件是用约30%v/v-约50%甲酰胺和约0.01M-约0.15M盐进行杂交,用约0.01M-约0.15M盐和约55-约65℃洗涤,或与其等价的条件。
在本发明的其它实施方案中,提供含有人基因序列的一条或两条链的单链核酸分子群作为探针,使该(分子)群的至少一部分与定量扩增的本发明细胞或样品的RNA核酸分子的一条或两条链杂交。该(分子)群可以只是人基因序列的反义链,从而使细胞中的或从细胞中扩增的分子的有义链可与所述(分子)群的一部分杂交。与含有互补基因序列的表达(或扩增)的核酸分子的含量相比,该(分子)群优选包含充分过量的人基因序列的一条或两条链。
本发明还提供通过检测获自人对象的含核酸或细胞样品中约5-49种转录序列表达水平对人肿瘤样品进行分类,与将该样品分类为含有人的某肿瘤类型的肿瘤细胞而排除其它一种或多种人肿瘤的方法。在一些实施方案中,可采用该方法将某样品分类为上述53种肿瘤或肿瘤细胞之一从而排除其它52种的一种或多种。在其它实施方案中,可采用该方法将某样品分类为上述34种肿瘤或肿瘤细胞之一从而排除其它33种肿瘤的一种或多种。在其它实施方案中,可采用该方法将某样品分类为上述39种肿瘤或肿瘤细胞之一从而排除其它38种肿瘤的一种或多种。
本发明也提供通过检测获自人对象含核酸的肿瘤样品中50种以上转录序列表达水平将肿瘤样品分类为本文所述可能的肿瘤类型某亚组,与将该样品分类为人多肿瘤类型之一而排除其它一种或多种人肿瘤的方法。在本发明的一些实施方案中,其它肿瘤类型数目是1-约3种、更优选1-约5种、1-约7种、1-约9种或约10种。在其它实施方案中,肿瘤类型数目是同一组织或器官来源的所有类型,例如上述那些类型。本发明的此方面与以上图10所讨论的和为提高可信度用特异性作为交换有关,并优选应用于将样品分类为可能的肿瘤类型某一亚组而提高将样品分类为单一类型肿瘤的精确度或性能水平的情况中。
在其它实施方案中,可通过分析一种细胞或均质细胞群的基因表达来实施本发明,所述细胞群除去了简单活检中存在的污染细胞,或者从中分离或纯化。这些实施方案的一个优点是可除去污染性非肿瘤细胞(例如浸润淋巴细胞或其它免疫系统细胞)从而不会影响对本文所鉴定的基因或随后基因表达水平的分析。这种污染细胞存在于用于产生基因表达概况的活性组织中。
在采用Q-PCR或逆转录Q-PCR作为试验平台的本发明其它实施方案中,可将本发明基因序列的表达水平与同一样品中的参比基因的表达水平作比较或者利用此表达水平的比例。这为多种已知肿瘤与测试的含细胞样品的数据比较提供了表达数据“标准化”的方法。尽管可利用多种参比基因,但也可利用39种肿瘤组这经鉴定的8种特定基因序列来实施本发明。此外,可采用多重形式的全部或一部分进行Q-PCR。
此8种参比序列的相应mRNA序列和其它鉴定信息见附件(序列表)。下文提供了包括登录号和其它信息在内的鉴定信息的清单。
>Hs.77031_mRNA_1 gi|16741772|gb|BC016680.1|BC016680智人克隆MGC:21349IMAGE:4338754聚腺苷酸=3
>Hs.77541_mRNA_1 gi|12804364|gb|BC003043.1|BC003043智人克隆MGC:4370 IMAGE:2822973聚腺苷酸=3
>Hs.7001_mRNA_1 gi|6808256|emb|AL137727.1|HSM802274智人mRNA;cDNA DKFZp434M0519(来自克隆DKFZp434M0519);部分cds聚腺苷酸=3
>Hs.302144_mRNA_1 gi|11493400|gb|AF130047.1|AF130047智人克隆FLB3020聚腺苷酸=0
>Hs.26510_mRNA_2 gi|11345385|gb|AF308803.1|AF308803智人染色体15遗传图15q26聚腺苷酸=3
>Hs.324709_mRNA_2 gi|12655026|gb|BC001361.1|BC001361智人克隆MGC:2474IMAGE:3050694聚腺苷酸=2
>Hs.65756_mRNA_3 gi|3641494|gb|AF035154.1|AF035154智人染色体16遗传图16p13.3聚腺苷酸=3
>Hs.165743_mRNA_2 gi|13543889|gb|BC006091.1|BC006091智人克隆MGC:12673IMAGE:3677524聚腺苷酸=3
可通过与上述其它基因序列相同或不同的方法来检测任何上述参比序列之一的表达。在本发明的一些实施方案中,可通过检测含细胞样品中表达的序列与以下寡核苷酸的杂交来检测所述基因序列的表达水平,以下寡核苷酸对应于所提供的登录号所示的上述序列。
>BC006091
TCATCTTCACCAAACCAGTCCGAGGGGTCGAAGCCAGACACGAGAGGAAGAGGGTCCTGG
>BC003043
CTCTGCTCCTGCTCCTGCCTGCATGTTCTCTCTGTTGTTGGAGCCTGGAGCCTTGCTCTC
>AF130047
TGCTCCCGGCTGTCCTCCTCTCCTCTTCCCTAGTGAGTGGTTAATGAGTGTTAATGCCTA
>AF035154
CCCCATCTCTAAAACCAGTAAATCAGCCAGCGAATACCCGGAAGCAAGATGCACAGGCGG
>BC001361
CCAGAAACAAGGAAGAGGAAAGACAAAGGGAAGGGACGGGAGCCCTGGAGAAGCCCGACC
>AF308803
AAGTACAACCCATGCTGCTAAGATGCGAGCAGGAAGAGGCATCCTTTGCTAAATCCTGTT
>BC016680
ACCTCACCCCTGCCCGGCCCAAGCTCTACTTGTGTACAGTGTATATTGTATAATAGACAA
>AL137727
TTCCCTTAATTCCTCCTCCCGACCTTTTTTACCCCCCCAGTTGCAGTATTTAACTGGGCT
在其它方面,本发明提供的方法也可全部或部分自动进行。这包括本发明的软件实施方案。非限制性例子包括一个或多个计算机可读存储装置上的处理器可执行指令,其中所述指令可根据本文所述的基因表达水平指导对肿瘤样品的分类。(本发明)考虑了一个或多个计算机可读存储装置上的处理器可执行指令,其中所述指令通过计算机输出装置提供和/或操纵分类方法的过程或结果。
本发明包括软件和硬件实施方案,其中将多种已知肿瘤类型的一组基因序列的基因表达数据具体化为一数据集。在一些实施方案中,可利用该基因表达数据集来实施本发明方法。本发明也提供用于执行本文所述方法的计算机相关工具和系统。一些实施方案提供了对含细胞样品进行分类的设备。这种设备可包括配置为接收查询存储的查询输入,而查询存储配置为能存储从查询输入接收到的本文所述基因表达的数据集;与访问并在本文所述分类算法中使用存储数据的模块。该设备还可包括(作为)分类算法结果的串存储,任选具有访问并在本文所述输出算法中使用该串存储数据的模块。
结合上述方法、工艺或算法的各步骤与本文所述实施方案直接体现在硬件、处理器所执行的软件模块或二者的结合。可以所示顺序,或以另一顺序进行某方法或工艺的各步骤或行为(act)。因此,可省去一个或多个工艺或方法步骤,或者可在这些方法和工艺中加入一个或多个工艺或方法步骤。可在这些方法和工艺的开始、结束或中间阶段加入额外的步骤、块(block)或行为(action)。
本发明的其它方面提供了本发明与临床活动相关的应用。在一些实施方案中,进行本文所述的测定或检测基因表达作为向患者提供医疗护理的一部分,包括提供用于支持医疗护理的诊断服务。因此,本发明包括患者的医疗护理方法,该方法包括如本文所述测定或检测获自患者的含细胞样品中所述基因序列的表达水平。该方法还包括以本文所述方式根据测定/检测(结果)将样品分类为含某肿瘤类型或组织来源的肿瘤细胞。所述测定和/或分类(结果)可如本文所述用于本发明的任何方面或实施方案中。
可先进行各种相关行为再测定或检测表达水平。在一些实施方案中,先测定或诊断需要所述检测的人对象,再进行这种检测。可先由经批准能从事这种检测要求为该检测偿付或支付费用的医生、护士或其他卫生保健人员或专职人员,或在他们指导下工作的人员,或健康保险或保健组织(health insurance or maintenanceorganization)的人员确定是否需要检测后再检测。
也可先做好实际检测所需的准备后再检测。非限制性例子包括实际获得人对象的含细胞样品;或接受含细胞样品;或者制作含细胞样品的切片;或者分离含细胞样品中的细胞;或者分离含细胞样品中的细胞RNA;或者逆转录含细胞样品中细胞的RNA。样品可以是可用于实施本发明的本文所述的任何样品。
在其它实施方案中,本发明提供对患者实施医疗护理或本发明其它方法的预订或接收订单的方法。医生、护士或其他卫生保健人员,或在他们的指导下工作的人员可作出预订,而能执行这些方法的任何人可直接或间接接收(订单)。可通过任何联系方式预订,包括手写、口述、电子、数字、模拟、电话、亲自、传真、邮件或通过美国国内管辖区域的其它方式。
本发明还提供处理检验(例如上述患者的医疗护理方法或本发明的其它方法)的偿付或支付的方法。处理偿付或支付的方法包括在实施本发明的表达水平检测、测定或测试后以书面或数据库形式表明:1)报酬已收到,或2)将由另一付款人付费,或3)仍未付费。所述数据库可以是任何形式,本发明范围包括电子形式,例如计算机可执行数据库。表明可采取书面或数据库中密码的形式(如CPT密码)。“另一付款人”可以是除以前作出要求偿付或支付的人以外的任何个人或团体。
或者,该方法可包括为在技术上或实际上实施了上述患者医疗护理方法,解释所述方法的结果或本发明任何其它方法而接受偿付或支付(的费用)。当然本发明也包括让另一人或团体接收偿付或支付(的费用)的指令的实施方案。这种指令可以用任何联系方式,包括上述方式。接收者可以是任何实体,包括作为非限制性例子的保险公司、保健组织、政府卫生部门或患者。付费可以是全部或部分付费。在患者的情况中,付费可以是称为共同付费(co-pay)的一部分付费形式。
在另一实施方案中,该方法可包括因实施了上述患者的医疗护理方法或本发明其它方法而向保险公司、保健组织、政府卫生部门或患者发出或已发出偿付或支付要求。这种要求可以用任何联系方式,包括上述方式。
在其它实施方案中,该方法可包括接收为实施了上述患者的医疗护理方法或本发明其它方法而批准的费用,或拒绝付费的指示。这种指示来自被要求偿付或支付的任何个人或团体。非限制性例子包括保险公司、保健组织或政府卫生部门,例如作为非限制性例子的Medicare或Medicaid部门。这种指示可以用任何联系方式,包括上述方式。
另一实施方案是该方法包括因实施了上述患者的医疗护理方法或本发明其它方法而发出偿付或支付要求。这种要求可以用任何联系方式,包括上述方式。可向保险公司、保健组织或联邦卫生部门或实施了该方法的患者作出此要求。
其它方法包括因实施了上述患者的医疗护理方法或本发明其它方法而以数据库形式或在数据库中显示需要偿付或支付(费用)。或者,该方法可简单显示已执行了该方法。数据库可以是任何形式,本发明范围包括电子形式,例如计算机可执行数据库。所述显示可采取书面或数据库密码的形式(如CPT密码)。
在上述患者的医疗护理方法或本发明其它方法中,该方法可包括任选向医疗护理机构、卫生保健人员或专职人员、医生、护士或为其工作的人员报道该方法获得的结果。报道可直接或间接(给予)患者。报道可以用任何联系方式,包括上述方式。
本发明还提供测定或检测本文所述含细胞样品中基因表达水平的试剂盒。试剂盒一般装有一种或多种试剂来检测用于实施本发明的本文所述的基因表达。非限制性例子包括用于检测表达水平的多核苷酸探针或引物,用于本发明方法的一种或多种酶,用于实施本发明的一根或多根试管。在一些实施方案中,该试剂盒装有用于检测本文所述基因表达的阵列或能组装到阵列中的固体介质。在其它实施方案中,该试剂盒装有的一种或多种抗体与多肽上存在的表位发生免疫相互作用而表明基因序列的表达。在一些实施方案中,所述抗体可以是抗体片段。
本发明的试剂盒也可装有显示或描述该试剂盒或本发明引物或探针在本文提供的本发明方法中的应用的说明书。试剂盒也可装有其它组分以帮助实施试剂盒所设计的具体应用。因此,例如试剂盒可额外装有检测标记物(例如,酶标记物的酶底物,检测荧光标记物的过滤装置,合适的第二标记物,例如绵羊抗-小鼠-HRP等)的装置。试剂盒还可装有用于本发明方法的缓冲液和其它识别试剂。
现已总体描述了本发明,参考以下实施例更易于理解本发明,除非另有指定,提供这些实施例是为了说明而不是要限制本发明的范围。
实施例
实施例1:随机基因组的信息容量
测试了用于分类39种肿瘤的100种随机选择的表达基因序列的亚组分类39种肿瘤的诸亚组的能力。将100种表达序列的5、10、15、20、25、30、35、40、45和49种的随机组合(各组合取样10次)的表达水平与肿瘤类型的数据联用,然后用于预测2-所有39种类型肿瘤样品的诸随机测试组(各取样10次)。图1显示了各基因组的分类能力与所分类肿瘤类型的数目相关。如预期的一样,肿瘤类型分类的精确度越高,需要的基因序列数目越多。图2显示对数目不同的肿瘤类型的分类能力与所用基因序列的数目相关。
所述100种基因序列的GenBank登录号是:AF269223、BC006286、AK025501、AJ002367、AI469140、AW013883、NM_001238、AI476350、BC006546、AI041212、BF724944、AI376951、R56211、BC006393、X13274、BC001133、N62397、BC000885、AK001588、AK057901、AF146760、AI951287、AK025604、BC007581、BC015025、R43102、AW449550、AI922539、AI684144、AI277662、BC015999、AW444656、BC011612、BC015401、BF447279、BC009956、AL050163、BC001248、BE672684、AL137353、BC001340、U45975、BE856598、BC009060、AL137728、AA713797、AL583913、AK054617、AI028262、AI753041、BG939593、AL080179、AA814915、AF131798、AI961568、BC009849、AK021603、BC012561、AI570494、BC006973、AW294857、BC004952、AK026535、AI923614、AW082090、AI005513、AF339768、AK023167、AF169693、AF076249、BC007662、BC015520、AI814187、AI565381、AW271626、AK024120、AF139065、BC014075、AI887245、AF257081、AI767898、AF070634、AF155132、X69804、U65579、NM_004933、AI655104、AW131780、AI650407、AF131774、AA814057、AJ311123、BC009702、AF264036、AL161961、AJ010857、AF106912、AK023542、AF073518和D83032。以1-100号给它们编索引,以下是本发明所用的代表性随机组:
就2种基因而言,基因33和63、基因17和72、基因64和21、基因48和25、基因88和54、基因80和32、基因24和99、基因14和31、基因80和23和基因18和34用作10个随机组。
就5种基因而言,第1组采用了基因27、97、56、88和50。第2组采用了基因24、26、35、48和83。第3组采用了基因46、62、75、91和2。第4组采用了基因19、61、34、87和13。第5组采用了基因56、32、66、20和55。第6组采用了基因90、21、6、78和66。第7组采用了基因73、47、3、82和86。第8组采用了基因74、39、13、7和67。第9组采用了基因34、1、24、85和62。第10组采用了基因23、89、15、54和98。
就10种基因而言,第1组采用了基因11、58、90、40、20、44、10、78、72和74。第2组采用了基因79、71、42、48、93、56、55、14、92和52。第3组采用了基因62、53、52、19、98、26、76、65、33和40。第4组采用了基因94、8、16、99、58、19、97、92、76和86。第5组采用了基因18、97、16、94、84、52、11、24、89和92。第6组采用了基因12、42、45、51、2、75、63、28、13和58。第7组采用了基因67、98、55、32、82、42、2、45、37和23。第8组采用了基因40、43、69、68、13、97、35、3、44和42。第9组采用了基因69、47、96、80、100、50、42、26、65和17。第10组采用了基因83、84、69、67、19、85、35、11、70和64。
就15种基因而言,第1组采用了基因98、81、43、63、18、56、19、97、47、13、48、99、75、45和83。第2组采用了基因5、72、31、59、81、40、92、3、23、50、57、74、62、21和93。第3组采用了基因11、69、91、100、38、1、73、64、90、26、62、2、37、23和18。第4组采用了基因76、9、53、4、11、41、77、44、87、51、54、49、43、56和67。第5组采用了基因55、34、13、89、52、74、96、80、48、22、31、39、43、91和54。第6组采用了基因59、88、15、90、4、73、93、7、10、18、98、83、43、3和5。第7组采用了基因68、91、77、33、88、94、95、41、46、27、36、51、97、7和2。第8组采用了基因7、10、78、40、70、84、55、1、98、22、99、91、8、17和89。第9组采用了基因65、10、38、8、77、98、37、43、93、99、86、16、82、27和9。第10组采用了基因97、27、78、38、24、19、55、47、77、13、45、25、43、70和68。
就20种基因而言,第1组采用了基因41、94、38、76、35、65、92、26、49、7、85、54、77、66、98、15、86、69、70和67。第2组采用了基因43、87、1、81、7、14、94、28、25、55、100、41、18、47、96、89、26、53、29和32。第3组采用了基因48、80、90、99、50、98、36、91、6、41、61、96、74、66、9、5、16、18、20和1。第4组采用了基因49、58、73、24、94、22、41、52、18、19、63、91、74、37、59、95、53、87、72和13。第5组采用了基因67、74、2、98、46、69、5、42、22、66、60、20、100、80、24、76、63、9、39和15。第6组采用了基因10、74、50、92、69、68、52、56、63、71、11、17、29、64、88、59、25、94、35和57。第7组采用了基因97、72、16、19、14、42、70、31、29、13、22、37、95、69、87、39、18、81、58和100。第8组采用了基因5、3、18、91、77、19、82、31、92、22、93、45、76、84、46、100、53、99、89和42。第9组采用了基因62、3、85、37、34、93、52、40、74、25、86、57、33、60、20、77、78、17、28和13。第10组采用了基因22、26、23、39、35、10、43、32、65、38、54、45、8、17、90、20、83、60、6和58。
就25种基因而言,第1组采用了基因21、28、50、27、8、48、74、80、38、96、71、15、89、84、32、26、55、36、29、68、13、7、18、63和72。第2组采用了基因61、38、59、92、3、80、33、68、79、70、44、26、95、63、85、27、60、43、75、96、42、99、58、48和91。第3组采用了基因75、83、78、5、99、56、26、36、57、23、37、28、88、16、63、2、72、59、9、80、52、91、62、3和27。第4组采用了基因48、75、84、83、88、29、13、9、98、6、31、63、45、5、51、52、39、22、100、91、74、12、94、21和8。第5组采用了基因79、84、47、43、26、37、46、19、85、91、2、10、81、89、38、71、17、57、7、93、31、87、29、78和73。第6组采用了基因62、93、83、42、97、96、78、98、47、22、67、48、89、95、24、81、16、45、8、90、66、64、2、3和58。第7组采用了基因100、34、58、28、104、35、88、76、6、30、83、81、67、36、39、87、66、45、20、15、86、56、55和95。第8组采用了基因17、43、50、63、47、58、95、32、79、60、16、91、86、22、97、21、9、55、72、78、77、45、100、14和30。第9组采用了基因24、67、60、94、59、14、70、84、8、89、63、23、39、11、81、42、33、3、12、93、54、35、78、73和90。第10组采用了基因11、2、19、62、13、51、30、80、81、82、52、34、67、57、25、95、93、39、26、48、44、89、61、17和18。
就30种基因而言,第1组采用了基因30、97、54、21、34、9、56、71、62、14、24、23、89、61、76、41、29、67、94、22、88、4、40、33、38、78、82、66、84和100。第2组采用了基因89、41、56、43、98、44、35、26、19、86、15、67、8、69、3、76、48、17、55、31、25、91、72、36、18、82、37、50、9和75。第3组采用了基因28、39、78、15、65、93、66、29、88、35、49、69、50、9、53、80、81、95、76、44、48、64、83、11、70、33、73、96、56和92。第4组采用了基因4、2、19、6、11、84、94、44、60、37、29、97、53、83、98、45、65、9、85、35、20、89、10、17、23、74、70、41、18和76。第5组采用了基因27、4、43、1、10、95、88、74、77、47、63、81、31、9、41、100、87、57、8、79、24、6、26、20、55、61、34、42、25和39。第6组采用了基因47、67、98、56、37、44、5、70、48、12、20、86、83、89、27、59、19、54、69、97、43、71、58、82、8、50、51、10、25和72。第7组采用了基因100、99、37、58、44、60、39、3、59、96、50、68、94、69、83、90、17、4、5、67、88、56、29、79、23、1、38、25、49和74。第8组采用了基因26、23、58、47、6、68、41、31、16、64、19、75、36、32、87、2、12、97、73、21、53、78、15、94、1、20、79、81、70和7。第9组采用了基因61、48、78、75、12、36、37、66、91、2、92、32、8、26、6、82、14、68、4、88、39、89、43、41、40、87、69、74、42和9。第10组采用了基因58、99、60、39、50、25、22、57、48、85、24、10、97、68、36、38、93、62、52、56、34、18、32、64、95、81、74、88、61和96。
就35种基因而言,第1组采用了基因52、68、22、92、43、75、20、62、15、76、99、61、64、36、12、66、24、21、31、88、25、6、93、91、55、74、69、90、23、4、80、72、97、58和1。第2组采用了基因48、21、68、16、96、10、1、69、36、20、3、14、59、53、12、84、90、17、9、65、4、32、75、81、88、37、38、5、94、60、64、45、7、43和55。第3组采用了基因33、95、59、86、83、76、36、55、90、22、62、98、34、46、4、87、5、66、38、78、97、100、71、25、30、2、21、99、12、54、9、14、81、32和52。第4组采用了基因27、64、40、59、63、100、50、19、1、10、96、2、34、28、67、26、87、41、15、57、33、11、94、66、82、6、52、55、84、47、97、83、80、62和5。第5组采用了基因99、86、92、72、83、48、79、46、91、2、90、9、23、44、85、31、38、81、76、54、71、14、3、13、62、11、39、4、95、36、20、30、75、63和51。第6组采用了基因41、89、81、29、86、95、34、42、50、9、45、21、64、84、74、91、69、98、57、79、39、87、93、63、26、82、2、59、30、71、83、38、77、24和73。第7组采用了基因87、60、59、98、43、38、28、64、29、92、22、27、40、33、69、71、73、79、15、70、32、90、76、93、6、50、55、9、49、54、36、5、48、19和10。第8组采用了基因100、70、98、79、91、23、37、29、73、65、78、31、3、11、30、51、16、40、95、94、62、38、67、39、82、72、22、5、87、57、6、75、35、99和46。第9组采用了基因46、61、59、86、29、74、56、89、52、26、54、20、84、97、33、71、14、36、38、49、28、60、19、90、11、42、87、92、82、21、94、3、22、2和39。第10组采用了基因31、76、77、27、72、38、42、36、53、82、61、39、98、81、34、80、22、100、8、32、17、21、28、56、59、29、55、5、62、40、90、87、24、68和37。
就40种基因而言,第1组采用了基因64、50、46、22、51、6、47、12、2、30、45、7、63、55、91、90、80、49、71、8、79、82、77、76、97、5、95、11、32、70、20、62、38、26、41、58、44、87、35和23。第2组采用了基因44、26、16、12、30、45、71、90、37、68、32、70、58、43、51、6、62、92、87、20、56、5、47、48、86、29、98、22、59、76、8、79、64、14、50、3、54、83、96和80。第3组采用了基因20、34、57、70、39、15、25、33、78、51、87、46、67、80、28、52、66、72、22、88、97、3、90、6、82、42、41、94、85、61、54、84、14、9、81、19、7、91、23和40。第4组采用了基因61、46、64、71、35、58、100、23、95、17、87、68、54、8、50、4、27、49、47、52、53、28、24、34、45、2、89、48、3、65、42、9、92、36、6、84、51、60、77和94。第5组采用了基因28、97、21、43、22、89、94、87、99、5、4、20、13、61、37、42、72、62、7、12、31、23、60、98、48、38、53、56、29、69、26、82、24、74、86、10、67、2、47和46。第6组采用了基因12、74、96、77、78、72、53、87、47、29、40、98、52、22、69、3、58、97、60、48、55、80、57、39、50、89、71、9、63、51、21、23、73、32、20、19、25、5、38和46。第7组采用了基因88、79、54、44、37、36、32、91、47、50、60、92、82、80、46、19、98、20、76、29、9、95、2、77、97、74、90、73、100、1、34、85、24、71、57、99、68、13、43和53。第8组采用了基因23、39、7、64、20、27、69、43、38、89、50、3、16、79、83、72、65、66、32、30、100、82、28、22、54、84、53、75、59、37、34、49、12、86、71、97、26、88、70和57。第9组采用了基因74、96、80、39、40、82、38、56、35、93、55、73、44、17、81、27、2、83、65、89、76、8、18、45、58、77、14、49、21、6、4、92、33、13、12、88、98、24、84和36。第10组采用了基因35、77、48、62、26、12、41、68、81、5、37、70、28、72、50、83、64、99、74、57、84、76、52、14、87、97、3、31、73、58、44、24、15、66、45、91、4、32、46和49。
就45种基因而言,第1组采用了基因52、97、84、72、96、34、18、38、88、80、91、49、71、64、93、26、62、40、68、29、67、39、60、9、13、74、95、99、27、47、25、45、31、8、69、17、75、53、51、12、23、1、6、30和50。第2组采用了基因97、80、55、32、94、84、28、3、6、48、17、41、65、37、79、34、61、83、35、49、27、38、43、2、24、77、25、71、58、14、8、30、46、98、82、75、22、72、26、74、93、66、73、1和53。第3组采用了基因64、45、38、92、23、74、66、60、100、3、82、20、54、11、19、16、80、86、14、75、62、10、52、47、13、31、35、53、41、9、79、39、17、22、99、58、46、83、43、40、44、90、95、12和81。第4组采用了基因20、66、9、24、16、76、99、42、86、58、15、93、48、28、26、50、68、12、2、37、82、36、27、57、45、41、32、1、52、54、30、39、7、100、59、23、94、75、8、60、55、34、38、29和87。第5组采用了基因66、88、73、53、51、69、36、87、78、40、58、76、31、65、56、42、100、68、5、18、17、91、45、22、74、82、1、44、67、43、10、63、79、92、6、72、80、75、9、30、19、61、99、3和38。第6组采用了基因75、66、84、59、9、70、100、27、79、41、73、67、23、39、28、68、21、69、38、72、86、82、36、46、77、34、47、54、13、16、7、88、22、26、4、89、55、24、61、12、35、50、95、92和80。第7组采用了基因59、86、10、29、53、88、43、64、11、13、19、17、36、65、73、94、20、51、80、24、66、83、44、47、21、6、52、82、69、54、100、28、18、34、35、30、74、91、49、46、60、5、38、71和2。第8组采用了基因77、32、55、44、6、98、94、19、10、71、72、85、67、75、78、88、90、58、89、27、69、42、31、47、1、37、52、7、57、45、11、83、49、46、34、64、14、24、87、9、56、8、20、36和15。第9组采用了基因4、27、83、61、46、15、35、26、51、54、23、38、100、7、42、58、44、8、22、37、20、89、56、91、70、29、11、19、87、99、21、65、72、75、49、40、45、30、43、48、63、3、18、74和1。第10组采用了基因68、19、90、52、55、23、17、53、3、2、74、82、26、88、48、6、8、43、15、73、57、67、85、91、13、44、81、1、75、33、51、21、4、41、77、86、40、18、31、78、92、10、64、99和69。
利用39种(肿瘤类型)组作肿瘤类型随机选择对39种肿瘤诸亚组进行分类。利用本文所述诸基因序列组的表达水平对这些肿瘤类型作随机组合进行分类。如这些实施例所述这些肿瘤类型的不同随机组与100、74和90种基因序列的各组联用。以下是所用的2到20种肿瘤的随机组的代表性和非限制性例子,其中从1-39给90种肿瘤类型组编索引。
就2种肿瘤类型而言,第1组采用了类型26和16。第2组采用了类型8和5。第3组采用了类型39和8。第4组采用了类型27和23。第5组采用了类型8和19。第6组采用了12和21。第7组采用了类型30和15。第8组采用了类型30和5。第9组采用了类型18和22。第10组采用了类型27和26。
就4种肿瘤类型而言,第1组采用了类型20、35、15和7。第2组采用了类型36、1、28和19。第3组采用了类型13、4、12和21。第4组采用了类型12、33、14和28。第5组采用了类型6、28、5和37。第6组采用了类型5、25、36和15。第7组采用了类型12、26、21和19。第8组采用了类型19、3、20和17。第9组采用了类型18、10、8和9。第10组采用了类型28、20、2和22.
就6种肿瘤类型而言,第1组采用了类型27、3、10、39、11和20。第2组采用了类型33、10、20、32、13和19。第3组采用了类型31、27、18、39、8和16。第4组采用了类型25、28、10、12、7和39。第5组采用了类型14、13、28、24、30和36。第6组采用了类型9、24、8、17、36和26。第7组采用了类型20、1、34、26、6和19。第8组采用了类型12、13、3、17、34和22。第9组采用了类型7、1、17、13、20和34。第10组采用了类型5、11、25、29、28和35。
就8种肿瘤类型而言,第1组采用了类型34、33、28、3、23、25、9和29。第2组采用了类型27、8、38、28、20、14、12和9。第3组采用了类型29、21、19、1、13、26、11和31。第4组采用了类型25、17、7、20、34、8、28和10。第5组采用了类型36、28、35、26、2、8、29和7。第6组采用了类型10、23、2、27、33、21、25和35。第7组采用了类型10、18、38、2、6、7、19和32。第8组采用了类型11、37、6、28、3、9、2和16。第9组采用了类型22、2、、10、8、17、19和33。第10组采用了类型35、39、8、10、37、4、36和6。
就10种肿瘤类型而言,第1组采用了类型25、10、26、2、32、31、39、23、22和18。第2组采用了类型12、35、6、16、20、3、39、36、11和2。第3组采用了类型34、1、15、29、5、39、2、12、25和18。第4组采用了类型10、8、14、18、31、19、23、20、32和33。第5组采用了types10、18、37、15、4、35、33、24、39和20。第6组采用了类型22、16、4、3、18、21、1、25、37和13。第7组采用了类型14、6、28、18、11、13、2、32、33和19。第8组采用了类型39、2、38、4、34、8、25、6、32和35。第9组采用了类型3、10、11、16、6、15、18、14、12和26。第10组采用了类型24、25、21、9、36、29、20、39、10和37。
就12种肿瘤类型而言,第1组采用了类型26、20、4、12、2、31、38、18、16、39、3和33。第2组采用了类型25、16、4、9、29、27、14、24、21、7、23和2。第3组采用了类型31、18、23、13、25、1、29、21、35、10、32和39。第4组采用了类型8、34、23、9、35、14、25、21、2、33、18和28。第5组采用了类型6、11、21、8、5、7、19、32、3、13、36和9。第6组采用了类型12、33、14、26、27、15、、2、21、36、35、9和39。第7组采用了类型26、29、32、17、31、19、6、5、20、34、2和24。第8组采用了类型17、12、8、22、28、9、27、29、14、35、4和32。第9组采用了类型29、9、36、23、33、18、21、35、3、6、2和1。第10组采用了类型1、3、35、29、22、27、8、23、2、36、14和19。
就14种肿瘤类型而言,第1组采用了类型9、26、38、25、31、3、15、14、17、33、12、35、39和16。第2组采用了类型1、26、16、25、20、12、14、37、38、24、23、33、27和35。第3组采用了类型11、21、35、38、32、34、27、39、16、15、4、5、13和18。第4组采用了类型27、5、13、28、18、17、15、20、29、37、21、36、25和14。第5组采用了类型5、12、17、9、25、21、33、37、8、15、24、3、34和28。第6组采用了类型11、19、34、26、9、6、32、14、27、29、30、16、24和17。第7组采用了类型31、26、11、18、19、20、9、8、5、36、12、6、27和38。第8组采用了类型20、17、11、5、15、9、2、39、34、24、27、26、35和10。第9组采用了类型1、14、39、30、17、6、10、35、31、33、15、29、32和7。第10组采用了类型1、19、24、28、34、12、13、18、32、11、14、21、22和25。
就16种肿瘤类型而言,第1组采用了类型27、15、8、12、6、20、26、19、25、2、37、38、7、39、4和33。第2组采用了类型17、18、28、5、6、31、25、13、8、20、37、36、35、9、23和27。第3组采用了类型23、37、34、14、16、27、32、33、21、38、4、30、24、22、17和25。第4组采用了类型7、37、38、21、34、31、32、25、10、36、19、11、6、26、18和35。第5组采用了类型9、32、12、24、20、13、38、21、39、23、36、18、37、22、5和3。第6组采用了类型14、21、5、17、6、20、18、35、22、10、3、23、13、2、34和26。第7组采用了类型1、8、19、6、9、39、28、18、13、31、14、16、37、12、3和25。第8组采用了类型32、36、28、38、9、33、2、5、4、11、19、18、13、8、12和3。第9组采用了类型9、14、10、5、28、32、23、6、39、3、17、8、19、1、31和12。第10组采用了类型4、34、11、6、38、19、7、20、23、3、25、37、26、1、15和12。
就18种肿瘤类型而言,第1组采用了类型15、24、39、35、7、30、16、13、20、3、26、4、12、10、34、25、21和28。第2组采用了类型21、23、29、11、10、19、13、28、4、20、17、24、30、12、39、34、31和9。第3组采用了类型7、17、27、6、30、8、22、2、32、26、21、14、4、38、1、35、16和28。第4组采用了类型17、13、20、33、10、3、16、22、1、38、2、9、28、5、6、19、12和11。第5组采用了类型4、35、21、25、18、17、8、14、31、30、9、1、2、23、36、29、32和37。第6组采用了类型17、34、2、18、19、15、16、13、4、24、5、35、6、22、28、37、38和1。第7组采用了类型34、26、12、25、27、3、17、7、2、32、9、36、21、19、22、8、20和29。第8组采用了类型12、34、38、25、17、22、14、39、10、7、31、2、3、11、29、30、16和24。第9组采用了类型13、26、27、14、5、10、8、7、16、30、37、4、6、35、28、1、36和20。第10组采用了类型15、2、17、23、26、28、36、38、12、6、19、37、20、14、9、39、11和21。
就20种肿瘤类型而言,第1组采用了类型25、13、21、15、37、20、12、28、9、10、26、22、14、24、16、7、39、34、33和4。第2组采用了类型20、17、10、27、19、28、5、1、23、21、38、7、13、22、32、31、9、4、3和24。第3组采用了类型17、13、7、20、11、38、34、3、15、12、5、39、9、10、4、35、27、6、21和33。第4组采用了类型6、13、17、26、1、7、33、5、10、32、3、23、35、4、14、28、12、38、8和27。第5组采用了类型10、23、9、38、5、29、12、27、25、6、7、26、37、31、24、36、19、15、16和11。第6组采用了类型30、24、21、11、23、25、8、9、7、31、27、5、14、29、1、19、16、12、22和17。第7组采用了类型26、13、23、19、22、11、25、21、33、20、6、17、2、10、31、34、27、37、7和9。第8组采用了类型30、1、38、7、31、37、11、25、6、19、28、33、17、29、10、27、16、3、14和15。第9组采用了类型15、19、26、24、5、33、11、2、13、18、31、22、32、20、23、6、10、25、36和3。第10组采用了类型24、25、21、29、14、18、31、2、20、39、23、9、38、12、6、32、22、26、33和7。
实施例4:所述的基因组
利用共有38个成员的第一组74种基因和第二组90种基因来实施本发明。
以类似于实施例3所述的方式评估了74种表达基因序列组的约5-49种成员的随机亚组。再一次将该74种表达序列中5、10、15、20、25、30、35、40、45和49种的随机组合(各组合取样10次)的表达水平与肿瘤类型的数据联用,然后用于预测2到所有39种肿瘤样品(各取样10次)的随机测试组。图4-6显示所得到的数据。
从1-74给该74种基因序列的成员编索引,下文是本发明所用的各代表性随机组:
就2种基因而言,第1组采用了基因64和6。第2组采用了基因64和13。第3组采用了基因67和51。第4组采用了基因51和29。第5组采用了基因46和12。第6组采用了基因68和65。第7组采用了基因6和28。第8组采用了基因9和55。第9组采用了基因55和71。第10组采用了基因63和39。
就5种基因而言,第1组采用了基因8、64、50、54和4。第2组采用了基因39、17、45、34和15。第3组采用了基因10、4、61、21和55。第4组采用了基因59、37、21、23和64。第5组采用了基因69、8、25、59和63。第6组采用了基因45、71、19、59和38。第7组采用了基因21、43、14、48和30。第8组采用了基因73、35、36、10和9。第9组采用了基因62、28、11、70和64。第10组采用了基因8、16、70、18和59。
就10种基因而言,第1组采用了基因49、72、38、68、52、21、1、10、2和40。第2组采用了基因54、70、28、64、68、41、44、20、7和2。第3组采用了基因71、49、51、11、18、53、8、42、36和58。第4组采用了基因72、15、35、3、23、8、2、48、22和65。第5组采用了基因44、19、6、22、38、5、37、9、30和14。第6组采用了基因15、27、3、10、31、19、44、39、48和46。第7组采用了基因70、30、9、33、63、71、32、34、20和7。第8组采用了基因45、29、54、58、15、21、68、5、42和62。第9组采用了基因74、17、66、46、10、8、63、5、24和2。第10组采用了基因33、2、34、19、60、71、42、51、70和66。
就15种基因而言,第1组采用了基因13、22、26、67、64、40、68、71、4、28、24、33、46、69和41。第2组采用了基因10、1、14、70、71、64、46、67、45、48、65、74、34、49和37。第3组采用了基因58、30、44、40、51、36、33、60、39、21、54、64、25、13和35。第4组采用了基因63、70、60、32、31、16、49、65、38、5、72、47、40、2和46。第5组采用了基因43、6、40、13、39、72、68、41、27、73、36、25、33、34和1。第6组采用了基因68、67、71、59、73、62、31、43、7、44、21、48、54、58和6。第7组采用了基因16、50、61、62、27、2、21、1、41、28、68、35、17、47和46。第8组采用了基因27、18、44、66、2、20、53、64、46、70、57、7、51、10和45。第9组采用了基因65、8、43、23、50、46、21、41、44、3、31、17、7、66和70。第10组采用了基因16、14、61、51、39、33、43、31、53、65、74、42、29、9和11。
就20种基因而言,第1组采用了基因14、60、6、71、74、16、62、39、56、44、32、72、18、42、66、49、1、9、69和21。第2组采用了基因23、1、7、27、26、71、12、4、22、69、62、44、6、25、57、28、33、9、21和51。第3组采用了基因46、48、29、54、55、69、73、47、6、27、24、21、15、43、45、7、62、25、22和74。第4组采用了基因12、65、24、73、45、57、49、63、61、1、58、10、2、18、8、51、67、69、59和13。第5组采用了基因33、43、9、52、54、38、8、16、48、1、39、60、17、6、15、66、68、63、37和42。第6组采用了基因43、19、44、28、56、34、66、42、73、40、65、38、54、20、51、37、30、35、53和61。第7组采用了基因61、6、20、4、34、53、70、38、35、46、36、16、1、23、68、12、59、71、65和14。第8组采用了基因25、68、69、3、33、49、19、56、54、4、32、6、45、16、67、52、65、14、12和40。第9组采用了基因47、7、36、32、61、74、14、45、26、51、69、12、41、42、64、25、27、57、23和58。第10组采用了基因27、13、3、17、51、7、37、43、20、12、52、21、25、2、5、32、62、47、4和26。
就25种基因而言,第1组采用了基因57、61、31、38、3、7、72、43、32、23、28、71、48、17、2、49、10、30、66、12、69、41、20、63和68。第2组采用了基因18、54、47、57、24、42、66、46、16、58、37、60、62、9、2、27、36、52、13、32、45、6、43、21和56。第3组采用了基因47、48、52、16、56、54、42、37、17、41、35、21、6、9、63、10、49、68、23、25、70、3、58、2和31。第4组采用了基因50、10、25、16、68、15、29、73、27、63、3、17、28、66、19、13、4、9、36、48、23、57、59、26和14。第5组采用了基因40、39、43、49、66、15、14、29、36、21、19、44、72、58、69、12、11、9、37、46、32、51、3、24和6。第6组采用了基因42、49、44、32、46、35、70、40、3、21、11、67、25、56、37、43、60、55、16、27、30、53、63、23和33。第7组采用了基因70、27、68、17、64、65、18、69、10、67、42、23、48、14、31、11、55、25、52、34、13、45、12、29和47。第8组采用了基因48、10、17、27、25、55、12、62、30、65、15、49、70、14、54、24、33、26、50、60、6、40、67、11和2。第9组采用了基因41、47、24、59、7、44、2、67、12、19、13、17、35、56、28、14、61、15、60、58、1、64、31、45和23。第10组采用了基因42、72、41、38、57、27、4、13、9、43、34、28、8、62、64、46、12、70、21、66、16、7、48、3和54。
就30种基因而言,第1组采用了基因16、47、67、9、22、10、64、72、46、6、60、74、3、68、57、63、14、54、58、30、28、18、70、73、52、39、34、61、12、21。第2组采用了基因18、1、44、24、68、26、62、10、47、67、37、55、32、35、34、14、49、30、17、16、51、45、74、31、9、57、66、39、53和8。第3组采用了基因58、45、55、39、22、32、9、49、31、13、51、56、28、12、3、59、74、35、42、67、69、47、66、18、52、57、43、5、26和4。第4组采用了基因45、1、74、12、18、23、59、27、38、40、72、56、50、20、52、32、5、16、9、21、60、64、49、70、30、61、6、10、31和24。第5组采用了基因60、53、7、32、73、25、69、48、17、45、16、3、14、9、37、41、72、43、68、39、20、51、59、23、6、15、74、19、31和66。第6组采用了基因47、54、9、38、60、33、40、12、57、45、26、56、11、27、67、25、69、59、68、7、61、72、23、21、28、48、29、65、37和15。第7组采用了基因21、42、30、57、65、59、53、74、45、66、68、41、19、24、8、10、61、43、38、67、37、47、40、22、63、35、70、72、5和6。第8组采用了基因58、11、28、36、24、34、53、9、44、23、51、70、22、17、15、59、5、60、1、64、21、50、35、52、31、43、38、39、32和62。第9组采用了基因43、30、63、7、60、40、39、1、48、17、69、57、6、62、19、38、36、13、66、64、25、31、65、47、27、16、53、68、37和41。第10组采用了基因22、17、4、2、37、16、49、7、63、64、14、15、74、43、25、54、46、50、53、67、39、62、59、10、55、72、65、52、58和19。
就35种基因而言,第1组采用了基因4、43、55、49、13、26、32、21、18、50、14、20、65、7、24、52、58、8、30、37、54、71、2、31、44、61、66、67、28、39、10、70、17、19和45。第2组采用了基因14、13、67、21、48、28、69、47、50、3、68、63、22、41、60、61、5、44、56、65、7、66、15、6、45、2、36、5、30、72、34、46、24、29和12。第3组采用了基因67、25、58、11、17、16、3、69、21、1、59、26、72、41、47、2、34、24、10、19、33、5、50、9、71、20、62、8、68、61、23、37、35、60和32。第4组采用了基因5、30、14、1、59、27、28、51、55、61、18、37、17、73、6、44、67、12、35、11、53、72、70、25、21、7、34、13、74、43、52、39、54、2和19。第5组采用了基因56、64、58、35、1、23、43、4、73、28、54、6、51、68、49、37、16、71、3、21、48、69、70、10、26、22、50、44、2、60、38、40、66、63和65。第6组采用了基因72、49、51、44、19、28、1、11、3、40、33、41、70、29、48、62、50、4、47、60、68、10、61、32、20、13、22、59、65、64、67、21、35、39和24。第7组采用了基因14、35、31、20、8、59、50、15、52、62、19、30、71、68、72、47、38、74、36、49、73、22、41、25、69、16、32、24、51、43、65、3、6、53和29。第8组采用了基因22、44、23、9、26、56、72、59、35、61、51、69、64、30、53、27、11、55、39、67、48、28、14、10、8、12、40、24、57、34、50、32、42、41和38。第9组采用了基因15、7、27、6、67、9、26、57、30、37、58、23、42、11、36、52、32、29、62、21、41、61、64、18、40、35、66、1、2、56、16、3、55、10和51。第10组采用了基因9、14、71、25、44、37、49、46、66、53、7、33、22、12、73、50、27、24、13、5、41、51、61、16、28、56、23、20、10、8、70、48、42、52和34。
就40种基因而言,第1组采用了基因26、36、43、30、62、19、20、51、41、71、1、63、10、56、65、17、15、50、5、35、4、54、12、70、48、31、47、37、34、8、3、69、40、44、46、59、61、74、23、27。第2组采用了基因1、4、38、24、37、69、21、52、13、2、63、51、30、16、27、58、74、20、32、53、59、31、50、10、42、8、54、36、5、47、70、41、12、46、28、19、35、9、61和48。第3组采用了基因35、48、40、47、20、67、57、72、15、17、46、37、9、2、60、30、65、49、29、64、16、21、7、74、61、11、58、71、62、23、24、55、3、53、52、27、18、50、25和66。第4组采用了基因35、10、59、19、27、40、30、4、9、52、2、29、26、41、55、17、13、53、71、63、58、44、45、62、70、16、64、48、43、8、38、72、49、37、18、36、74、42、46和54。第5组采用了基因16、61、1、10、20、51、22、6、43、65、66、24、30、9、14、40、32、74、18、71、15、28、52、31、56、55、23、4、58、36、60、54、25、63、27、64、50、29、44和45。第6组采用了基因15、30、3、50、61、47、13、48、45、17、46、10、28、37、8、54、9、5、63、18、39、49、34、68、14、23、43、11、1、51、56、67、20、57、6、19、25、31、21和12。第7组采用了基因45、73、53、29、35、56、70、51、30、59、49、22、6、43、28、31、40、4、66、25、37、19、12、65、26、74、46、50、23、62、17、69、36、41、34、27、67、7、24和13。第8组采用了基因62、30、38、41、18、13、49、71、68、47、50、70、66、5、23、33、27、56、6、7、34、28、26、58、53、46、16、52、72、42、10、54、67、64、12、8、19、57、73和17。第9组采用了基因11、32、48、54、42、67、13、53、21、44、57、22、40、12、5、29、69、37、17、39、45、73、60、26、14、72、4、59、24、46、18、51、36、61、35、9、19、16、38和28。第10组采用了基因58、1、55、59、11、63、3、26、49、69、34、47、65、46、14、39、5、67、16、66、64、38、44、32、15、22、19、71、23、52、45、53、48、8、60、73、9、30、25和37。
就45种基因而言,第1组采用了基因26、21、17、34、19、27、6、61、24、42、3、60、70、43、54、13、9、20、28、58、12、23、33、4、63、56、67、1、11、68、41、59、45、5、48、32、10、44、16、65、51、62、22、38和74。第2组采用了基因21、41、67、5、51、53、28、25、31、60、52、17、50、11、29、45、2、32、71、13、68、22、74、33、48、56、62、42、26、14、61、23、9、46、66、10、64、59、54、69、27、47、44、34和40。第3组采用了基因68、48、43、74、17、4、49、34、38、60、12、42、18、5、51、32、1、57、9、11、30、13、37、15、29、33、44、20、55、70、45、41、24、56、35、52、59、7、25、2、31、64、71、22和39。第4组采用了基因44、61、51、69、65、72、29、57、40、62、66、63、67、55、74、14、56、11、16、58、1、15、3、48、42、7、8、30、18、19、23、60、4、10、21、43、12、37、32、25、22、50、34、59和2。第5组采用了基因67、54、33、41、5、61、3、10、2、71、73、53、25、42、44、23、9、38、45、62、32、46、40、8、66、49、16、24、68、69、21、52、20、6、48、11、57、39、22、31、63、36、34、35和17。第6组采用了基因43、45、19、17、4、58、37、7、42、52、2、62、25、66、24、15、22、74、68、67、8、1、33、70、31、50、64、14、61、51、6、38、35、39、72、5、27、36、11、18、12、48、46、54和71。第7组采用了基因41、45、58、11、66、26、53、13、60、4、65、18、67、73、28、55、56、57、29、68、23、19、42、17、22、62、61、10、43、64、38、71、7、40、16、34、74、12、37、8、63、44、49、47和3。第8组采用了基因47、40、59、14、50、71、1、57、19、28、6、34、68、4、30、20、31、33、38、39、17、41、24、65、70、61、3、35、45、11、9、8、73、42、26、23、46、72、25、64、16、53、62、18和7。第9组采用了基因61、5、69、22、7、17、26、13、2、30、55、33、47、14、59、32、9、44、23、45、42、25、15、57、48、50、1、68、18、72、46、73、67、36、63、60、28、21、20、8、29、35、37、38和71。第10组采用了基因22、31、58、50、64、11、17、67、41、2、21、4、61、70、54、3、71、25、40、43、69、38、9、73、45、16、34、10、7、52、35、19、66、24、5、60、18、14、59、32、68、15、56、63和65。
利用90种表达基因序列组中约5-49种成员的随机亚组进行了类似的实验。再一次将该90种表达序列中5、10、15、20、25、30、35、40、45和49种的随机组合(各组合取样10次)的表达水平与肿瘤类型的数据联用,然后用于预测2到所有39种肿瘤样品(各取样10次)的随机测试组。图7-9显示所得到的数据。
从1-90给该90种基因序列的成员编索引,下文是本发明所用的代表性随机组:
就2种基因而言,第1组采用了基因30和72。第2组采用了基因65和88。第3组采用了基因76和88。第4组采用了基因5和86。第5组采用了基因30和32。第6组采用了基因6和59。第7组采用了基因57和2。第8组采用了基因49和28。第9组采用了基因37和35。第10组采用了基因34和18。
就5种基因而言,第1组采用了基因1、83、59、36、66和88。第2组采用了基因58、13、59、22和64。第3组采用了基因46、72、51、88和14。第4组采用了基因23、74、22、27和20。第5组采用了基因58、54、78、87和50。第6组采用了基因59、6、56、78和9。第7组采用了基因30、78、69、83和21。第8组采用了基因5、39、54、56和55。第9组采用了基因9、70、54、67和43。第10组采用了基因80、81、63、90和53。
就10种基因而言,第1组采用了基因70、17、45、5、2、37、6、76、39和14。第2组采用了基因54、16、80、26、15、45、50、8、73和48。第3组采用了基因66、87、31、74、37、45、19、1、70和7。第4组采用了基因85、17、78、61、23、59、27、18、58和24。第5组采用了基因44、89、36、76、49、3、21、24、38和69。第6组采用了基因32、72、55、2、86、81、53、45、17和74。第7组采用了基因27、55、62、33、32、84、21、45、23和7。第8组采用了基因62、45、68、31、69、39、33、63、19和22。第9组采用了基因71、39、11、56、88、80、37、77、62和35。第10组采用了基因38、83、41、47、66、87、10、4、88和22。
就15种基因而言,第1组采用了基因61、17、64、14、1、41、72、47、69、48、49、70、12、20和35。第2组采用了基因26、49、69、31、84、42、24、56、82、12、29、2、21、15和71。第3组采用了基因54、62、8、32、58、65、39、44、35、22、34、77、43、83和75。第4组采用了基因62、50、57、80、28、83、32、56、14、2、3、48、67、79和72。第5组采用了基因55、58、77、68、90、76、17、72、85、34、43、33、62、6和64。第6组采用了基因41、63、90、9、25、35、2、14、65、87、11、36、10、79和17。第7组采用了基因69、89、77、33、71、4、6、46、72、13、68、81、31、50和32。第8组采用了基因29、69、34、47、32、52、63、73、23、25、33、10、37、17和55。第9组采用了基因24、13、45、17、51、48、20、30、29、40、53、19、88、76和28。第10组采用了基因86、33、19、4、84、25、78、29、88、10、7、67、85、45和8。
就20种基因而言,第1组采用了基因57、78、43、50、14、71、56、25、80、31、88、4、49、13、3、38、32、8、52和75。第2组采用了基因84、46、23、85、55、82、56、83、48、89、8、60、21、40、20、17、87、24、34和39。第3组采用了基因72、88、53、46、82、9、34、21、76、24、14、35、90、31、58、30、15、41、7和28。第4组采用了基因22、62、21、3、45、50、58、72、69、82、49、42、47、9、15、59、17、24、40和52。第5组采用了基因71、18、74、53、43、75、76、54、63、64、10、5、90、51、31、58、28、35、70和23。第6组采用了基因7、30、77、25、17、16、35、68、56、37、78、87、45、8、42、82、72、23、58和54。第7组采用了基因3、58、67、5、87、62、56、88、73、50、22、52、10、60、57、42、46、26、7和82。第8组采用了基因63、19、22、13、82、12、44、52、8、90、35、81、79、15、83、76、51、27、45和56。第9组采用了基因65、34、76、81、58、86、83、46、40、55、48、42、57、70、21、72、71、17、22和24。第10组采用了基因34、74、2、53、76、73、19、72、88、87、44、70、40、39、22、45、83、77、30和46。
就25种基因而言,第1组采用了基因13、77、22、85、58、8、23、2、40、81、50、31、14、41、21、52、6、74、11、17、83、7、9、19、18。第2组采用了基因3、12、8、87、34、75、31、88、77、39、40、60、54、9、37、5、51、53、32、35、66、4、26、59和29。第3组采用了基因29、41、44、56、88、72、90、6、19、63、42、24、49、70、39、17、82、13、9、4、51、40、22、71和25。第4组采用了基因70、82、55、43、40、32、16、13、22、41、7、85、46、42、73、76、14、60、50、72、5、81、67、57和83。第5组采用了基因88、83、53、26、29、4、38、71、11、66、14、89、39、34、84、41、7、64、87、3、67、43、50、79和6。第6组采用了基因88、16、83、4、7、39、56、82、10、20、87、79、3、35、76、49、43、11、74、13、48、22、64、34和89。第7组采用了基因6、64、39、50、44、46、61、28、79、43、35、85、48、9、59、47、57、5、24、33、80、11、42、20和26。第8组采用了基因59、24、46、33、50、71、53、21、86、10、75、23、74、60、43、22、16、62、85、79、81、34、73、2和1。第9组采用了基因68、11、64、54、37、28、44、73、83、89、2、41、59、75、21、23、88、71、34、29、1、47、84、60和72。第10组采用了基因5、12、60、84、32、58、70、2、38、42、24、13、85、10、49、90、55、81、39、27、65、56、31、34和57。
就30种基因而言,第1组采用了基因24、88、10、69、64、8、19、54、80、70、11、9、29、56、36、79、30、65、2、58、23、74、41、16、77、4、78、14、85和32。第2组采用了基因73、27、19、52、87、51、63、4、76、64、90、81、42、47、9、62、40、65、83、30、39、59、10、11、54、44、43、6、86和41。第3组采用了基因28、47、41、8、24、54、26、49、61、17、46、64、20、16、1、33、82、79、85、5、86、69、31、65、83、7、67、35、48和57。第4组采用了基因13、21、83、35、47、57、8、66、75、17、38、70、39、23、9、1、2、28、68、81、36、80、52、22、44、37、85、15、72和86。第5组采用了基因81、20、36、89、13、14、46、58、59、62、28、7、1、25、35、83、26、50、51、15、16、56、71、5、47、6、78、80、85和84。第6组采用了基因68、74、73、89、38、72、33、35、15、79、3、37、23、67、10、62、64、77、44、60、75、7、51、12、46、76、81、26、42和6。第7组采用了基因34、55、62、40、78、35、76、30、21、77、46、71、66、69、63、81、51、38、84、53、82、89、29、14、36、45、60、7、52和27。第8组采用了基因56、12、35、79、57、4、16、9、24、58、40、72、80、67、23、76、88、69、52、78、32、47、14、46、64、83、17、59、81和20。第9组采用了基因73、27、12、58、54、62、48、43、16、41、49、84、9、75、13、50、19、3、76、78、56、68、71、25、24、60、18、35、45和51。第10组采用了基因82、21、24、85、51、18、72、28、89、22、34、4、53、75、83、23、50、5、42、13、88、63、40、64、38、35、39、44、59和70。
就35种基因而言,第1组采用了基因2、69、70、89、9、11、5、17、63、18、12、59、58、85、26、71、61、10、3、1、22、79、84、30、48、82、38、44、56、42、88、6、60、14和28。第2组采用了基因84、81、88、46、12、50、38、78、62、48、19、43、26、66、4、20、40、58、9、52、87、47、6、55、21、75、31、77、57、53、45、34、30、32和39。第3组采用了基因6、3、22、89、8、78、87、71、42、63、18、40、68、77、64、88、5、58、43、72、80、10、21、56、11、59、61、2、19、76、30、20、14、69和35。第4组采用了基因55、42、89、41、56、33、24、28、15、61、63、18、90、60、35、76、70、52、8、1、64、23、13、39、71、31、3、81、10、34、66、44、16、7和78。第5组采用了基因59、58、12、50、47、42、28、22、76、54、1、18、7、53、68、73、20、67、14、72、23、13、39、10、70、55、45、17、31、51、80、3、24、30和46。第6组采用了基因53、66、26、3、73、47、61、63、51、41、29、5、19、10、57、22、64、11、34、89、43、24、31、60、27、76、17、86、70、81、50、46、36、14和45。第7组采用了基因18、88、90、13、73、81、64、56、84、2、4、22、3、25、35、54、89、86、27、41、6、34、38、14、74、36、59、8、40、55、42、83、39、44和60。第8组采用了基因46、32、22、15、67、89、14、5、70、39、49、9、84、71、12、78、27、86、26、57、20、43、58、87、42、8、31、1、54、62、69、40、29、52和64。第9组采用了基因3、39、55、25、90、10、9、77、62、78、18、12、58、51、22、67、7、61、59、35、52、4、65、38、32、71、87、88、63、50、73、70、44、45和84。第10组采用了基因65、54、51、38、40、5、43、71、34、30、22、6、36、64、63、13、70、85、21、88、77、86、79、66、25、18、26、19、76、56、23、60、75、2和49。
就40种基因而言,第1组采用了基因81、80、68、77、17、71、34、33、48、88、90、32、23、2、38、59、75、82、50、56、12、36、6、87、72、37、26、15、35、66、13、76、55、3、78、18、52、47、73和20。第2组采用了基因11、65、27、44、88、49、55、57、1、72、9、28、56、67、13、58、42、36、8、31、40、14、26、35、62、22、19、84、78、21、2、41、74、71、52、30、25、76、85和63。第3组采用了基因50、22、10、54、9、51、15、34、29、35、76、89、33、6、88、56、36、70、87、40、83、62、1、42、25、78、30、26、44、60、69、47、49、31、18、59、37、52、61和17。第4组采用了基因27、33、7、89、36、59、48、42、66、39、90、52、2、14、30、80、9、56、21、87、65、67、41、73、82、20、4、46、5、84、88、15、44、58、78、85、3、64、6和8。第5组采用了基因43、24、86、29、46、90、40、1、71、57、12、84、69、19、42、62、28、35、5、63、52、17、39、4、67、81、50、47、61、54、87、70、77、6、10、38、37、79、31和36。第6组采用了基因28、5、78、85、16、20、36、52、43、29、67、83、12、79、84、8、81、46、11、3、54、86、10、60、71、51、39、53、59、69、44、61、7、56、27、50、66、70、1和25。第7组采用了基因39、47、48、24、25、3、41、16、65、73、63、14、70、57、12、64、90、23、27、38、66、71、54、21、83、28、72、53、11、30、80、15、6、88、89、85、81、61、78和34。第8组采用了基因61、8、57、16、24、64、48、36、58、28、27、40、70、77、25、76、52、35、62、4、60、7、54、37、11、20、72、34、56、78、10、86、51、29、84、47、30、21、59和67。第9组采用了基因67、3、83、33、35、26、25、79、68、19、18、84、14、58、66、57、1、2、27、64、23、24、76、81、17、37、38、30、45、75、49、39、5、53、43、15、51、40、69和12。第10组采用了基因39、77、29、70、85、45、54、79、31、43、15、11、47、83、76、21、67、14、4、19、49、42、18、13、12、7、88、8、3、35、81、55、71、60、72、57、46、40、56和32。
就45种基因而言,第1组采用了基因7、63、45、87、19、55、36、42、9、4、79、68、46、35、40、80、59、58、38、17、50、30、13、39、33、84、34、64、2、57、24、88、65、16、53、18、28、8、60、15、43、73、77、20和78。第2组采用了基因70、19、81、68、38、35、48、9、53、11、73、42、54、28、32、40、60、88、25、7、67、17、36、51、44、46、10、89、14、80、39、41、27、8、75、47、61、57、59、76、86、65、63、74和77。第3组采用了基因55、24、63、17、32、81、2、67、51、85、27、46、60、90、25、35、58、11、47、33、73、3、74、52、15、86、6、78、36、66、57、13、49、28、75、70、4、77、43、26、61、64、20、1和23。第4组采用了基因49、72、13、51、55、11、29、5、43、44、40、6、38、67、47、35、36、28、81、24、80、32、16、88、63、87、86、79、21、1、30、10、62、58、23、12、78、26、69、56、85、42、17、84和39。第5组采用了基因53、33、18、65、22、83、50、88、76、40、82、68、85、5、63、45、78、16、42、54、27、66、70、74、7、51、89、64、49、37、84、86、34、39、80、31、61、87、69、4、81、30、14、41和29。第6组采用了基因7、60、38、14、73、9、79、81、22、10、85、51、40、87、3、26、57、56、12、72、39、59、63、28、64、71、69、21、67、48、50、66、46、88、11、13、24、8、58、75、2、41、5、44和55。第7组采用了基因15、65、31、19、11、38、2、9、64、66、22、35、49、3、77、43、32、56、39、54、80、21、6、40、27、86、10、16、70、30、85、23、26、4、55、73、42、13、41、68、29、57、28、72和58。第8组采用了基因83、27、9、62、84、78、13、5、74、55、12、34、58、3、67、57、24、45、42、47、75、25、29、44、46、61、56、70、86、37、14、49、60、89、28、72、59、38、2、81、50、7、6、21和82。第9组采用了基因7、10、35、14、79、66、33、52、16、55、68、59、57、19、11、47、22、38、61、30、71、50、63、88、53、80、6、54、77、21、37、84、9、65、12、49、40、73、76、2、28、29、3、72和18。第10组采用了基因12、19、9、80、84、15、7、2、39、21、48、40、51、69、74、83、5、66、27、26、89、60、4、86、41、44、35、10、76、53、63、16、37、79、11、42、68、3、59、82、77、73、85、67和14。
就49种基因而言,第1组采用了基因84、47、56、1、18、21、57、54、27、89、44、85、64、10、77、34、65、66、80、70、46、23、53、61、24、81、43、35、30、74、83、51、20、17、72、4、49、68、60、28、67、19、42、55、73、36、7、39和33。第2组采用了基因47、29、58、36、21、53、40、7、83、77、24、89、71、64、60、4、37、86、27、57、62、63、72、1、88、78、68、17、51、16、82、42、81、18、32、49、55、10、11、66、35、23、70、20、61、25、48、43和54。第3组采用了基因54、2、62、67、44、25、8、53、86、33、75、32、45、76、43、65、59、58、42、64、47、78、3、57、71、88、14、23、51、83、1、41、7、56、40、20、39、72、70、19、5、35、50、82、37、48、15、31和16。第4组采用了基因35、65、48、43、69、62、64、74、82、39、37、1、88、45、66、12、79、55、38、84、17、30、25、26、89、56、28、57、59、34、85、14、47、44、41、19、60、20、73、2、63、75、49、80、58、77、27、54和29。第5组采用了基因64、51、36、12、84、24、65、47、88、26、10、19、73、90、35、53、18、55、80、70、79、82、87、77、15、85、83、7、72、1、6、57、38、45、74、33、62、86、31、69、27、14、4、29、54、44、63、78和42。第6组采用了基因24、39、85、42、88、32、65、23、6、75、53、77、64、90、13、82、47、31、48、8、78、67、63、44、26、40、14、34、18、59、2、17、20、56、83、68、86、9、38、73、89、55、29、69、72、16、28、51和81。第7组采用了基因32、70、57、67、1、73、52、38、65、83、5、40、49、31、66、85、6、82、12、48、89、3、19、41、62、16、46、61、24、18、55、30、33、56、68、20、81、10、86、9、15、63、78、22、75、14、13、43和77。第8组采用了基因17、30、47、85、7、3、6、35、76、77、25、86、36、75、44、29、69、60、63、64、82、51、19、68、41、28、73、18、10、26、42、78、67、12、80、33、13、57、38、87、49、59、74、50、90、46、8、81和4。第9组采用了基因20、76、42、36、66、21、8、28、22、15、56、5、2、86、17、62、23、1、80、73、52、83、32、65、44、82、35、60、47、90、74、9、84、50、4、77、55、57、19、71、25、48、81、53、34、38、3、37和16。第10组采用了基因84、87、3、41、36、71、33、57、85、26、53、22、82、31、2、45、24、18、37、35、77、20、63、25、6、17、58、7、9、49、28、76、79、67、13、80、66、5、43、4、74、75、21、86、23、39、42、27和54。
实施例5:PCR检测
如上所述,可通过PCR测定或检测基因表达,例如采用定量PCR。检测人基因组中约5-49种表达序列的表达可用于本发明的这种实施方案。此外,也可利用所述74种(基因序列)组、90种(基因序列)组或该两组的组合(已知该两组之间共有38种基因序列,总基因序列是126种)中的约5-49种基因序列的表达水平。如上所述,本发明考虑如上所述采用定量PCR来检测87种基因序列中约5-49种序列的表达水平,这些序列均存在于74种(基因序列)组或90种(基因序列)组中。在这87种基因序列中,60种存在于74种(基因序列)组中,63种存在于90种(基因序列)组中。该87种基因序列的标识符/登录号是:AA456140、AA745593、AA765597、AA782845、AA865917、AA946776、AA993639、AB038160、AF104032、AF133587、AF301598、AF332224、AI041545、AI147926、AI309080、AI341378、AI457360、AI620495、AI632869、AI683181、AI685931、AI802118、AI804745、AI952953、AI985118、AJ000388、AK025181、AK027147、AK054605、AL023657、AL039118、AL110274、AL157475、AW118445、AW194680、AW291189、AW298545、AW445220、AW473119、AY033998、BC000045、BC001293、BC001504、BC001639、BC002551、BC004331、BC004453、BC005364、BC006537、BC006811、BC006819、BC008764、BC008765、BC009084、BC009237、BC010626、BC011949、BC012926、BC013117、BC015754、BC017586、BE552004、BE962007、BF224381、BF437393、BF446419、BF592799、BI493248、H05388、H07885、H09748、M95585、N64339、NM_000065、NM_001337、NM_003914、NM_004062、NM_004063、NM_004496、NM_006115、NM_019894、NM_033229、R15881、R45389、R61469、X69699和X96757。
利用这些序列中约5-49种来实施本发明可包括利用本文所述所检测到的参比序列表达水平。在一些实施方案中,参比基因序列是本文所述8种序列的一种或多种。本发明考虑将鉴定为AF308803、AL137727、BC003043、BC006091和BC016680的一种或多种参比序列用于本发明的PCR或QPCR的实施方案中。当然也可联合使用所有这5种参比序列。
无论曾是否专门引入,本文所引用的所有参考文献,包括专利、专利申请和出版物均全文纳入本文作为参考。
现已充分描述了本发明,本领域技术人员应该知道在同等的参数、浓度和条件的广泛范围内即可进行同样检测而不脱离本发明的构思和范围并且无需过多实验。
尽管结合具体实施方案描述了本发明,但应该知道可对它作出进一步修改。总之,本申请要涵盖根据本发明主旨作出的任何改变、应用或适用性,包括在本发明所属领域的已知或惯常实践范围内以及可应用上述基本特征的这种改变。
mRNA序列的附件(序列表)
>Hs.73995_mRNA_1 gi|190403|gb|M60502.1|HUMPROFILE人原聚角蛋白微丝蛋白mRNA,3′末端 聚腺苷酸=1
GGCCACTCTGCAGACAGCTCCAGACAATCAGGCACTCGTCACACAGAGTCTTCCTCTCGT
GGACAGGCTGCGTCATCCCATGAACAGGCAAGATCAAGTGCAGGAGAAAGACATGGATCC
CACCACCAGCAGTCAGCAGACAGCTCCAGACACGCAGGCATTGGGCACGGACAAGCTTCA
TCTGCAGTCAGAGACAGTGGACACCGAGGGTACAGAGGTAGTCAGGCCACTGACAGTGAG
GGACATTCAGAAGACTCAGACACACAGTCAGTGTCAGCACAGGGACAAGCTGGGCCCCAT
CAGCAGAGCCACCAAGAGTCCGCACGTGGCCAGTCAGGGGAAAGCTCTGGACGTTCAGGG
TCTTTCCTCTACCAGGTGAGCACTCATGAACAGTCTGAGTCCACCCATGGACAGTCTGTG
CCCAGCACTGGAGGAAGACAAGGATCCCACCATGATCAGGCACAAGACAGCTCCAGGCAC
TCAGCATCCCAAGAGGGTCAGGACACCATTCGTGGACACCCGGGGCCAAGCAGAGGAGGA
AGACAGGGGTCCCACCACGAGCAATCGGTAGATAGGTCTGGACACTCAGGGTCCCATCAC
AGCCACACCACATCCCAGGGAAGGTCTGATGCCTCCCGTGGGCAGTCAGGATCCAGAAGT
GCAAGCAGACAAACACATGACCAGGAACAATCAGGAGACGGCTCTAGGCACTCAGGGTCG
CGTCATCAGGAAGCTTCCTCTTGGGCCGACAGCTCTAGACACTCACAGGCAGTCCAGGGA
CAATCAGAGGGGTCCAGGACAAGCAGGCGCCAGGGATCCAGTGTTAGCCAGGACAGTGAC
AGTCAGGGACACTCAGAAGACTCTGAGAGGCGGTCTGGGTCTGCTTCCAGAAACCATCGT
GGATCTGCTCAGGAGCAGTCAAGAGATGGCTCCAGACACCCCAGGTCCCATCACGAAGAC
AGAGCCGGTCACGGGGACTCTGCAGAGAGCTCCAGACAATCAGGCACTCATCATGCAGAG
AATTCCTCTGGTGGACAGGCTGCATCATCCCATGAACAGGCAAGATCAAGTGCAGGAGAG
AGACATGGATCCCACTACCAGCAGTCAGCAGACAGCTCCAGACACTCAGGCATTGGGCAC
GGACAAGCTTCATCTGCAGTCAGAGACAGTGGACACCGAGGGTCCAGTGGTAGTCAGGCC
AGTGACAATGAGGGACATTCAGAAGACTCAGACACACAGTCAGTGTCAGCCCACCGACAG
GCTGGGCGCCATCACGAGAGCCACCAAGAGTCCACACGTGGCCGGTCACGAGGAAGGTCT
GGACGTTCAGGGTCTTTCCTCTACCAGGTGAGCACTCATGAACAGTCTGAGTCTGCCCAT
GGACGGGCTGGGCCCAGTACTGGAGGAAGACAAGGATCCCGCCACGAGCAGGCACGAGAC
AGCTCCAGGCACTCAGCGTCCCAAGAGGGTCAGGACACCATTCGTGGACACCCGGGGTCA
AGGAGAGGAGGAAGACAGGGATCCTACCACGAGCAATCGGTAGATAGGTCTGGACACTCA
GGGTCCCATCACAGCCACACCACATCCCAGGGAAGGTCTGATGCCTCCCATGGGCAGTCA
GGATCCAGAAGTGCAAGCAGAGAAACACGTAATGAGGAACAGTCAGGAGACGGCTCCAGG
CACTCAGGGTCGCGTCACCATGAAGCTTCCACTCAGGCTGACAGCTCTAGACACTCACAG
TCCGGCCAGGGTGAATCAGCGGGGTCCAGGAGAAGCAGGCGCCAGGGATCCAGTGTTAGC
CAGGACAGTGACAGTGAGGCATACCCAGAGGACTCTGAGAGGCGATCTGAGTCTGCTTCC
AGAAACCATCATGGATCTTCTCGGGAGCAGTCAAGAGATGGCTCCAGACACCCCGGATCC
TCTCACCGCGATACAGCCAGTCATGTACAGTCTTCACCTGTACAGTCAGACTCTAGTACC
GCTAAGGAACATGGTCACTTTAGTAGTCTTTCACAAGATTCTGCGTATCACTCAGGAATA
CAGTCACGTGGCAGTCCTCACAGTTCTAGTTCTTATCATTATCAATCTGAGGGCACTGAA
AGGCAAAAAGGTCAATCAGGTTTAGTTTGGAGACATGGCAGCTATGGTAGTGCAGATTAT
GATTATGGTGAATCCGGGTTTAGACACTCTCAGCACGGAAGTGTTAGTTACAATTCCAAT
CCTGTTCTTTTCAAGGAAAGATCTGATATCTGTAAAGCAAGTGCGTTTGGTAAAGATCAT
CCAAGGTATTATGCAACGTATATTAATAAGGACCCAGGTTTATGTGGCCATTCTAGTGAT
ATATCGAAACAACTGGGATTTAGTCAGTCACAGAGATACTATTACTATGAGTAAGAAATT
AATGGCAAAGGAATTAATCCAAGAATAGAAGAATGAAGCAAGTTCACTTTCAATCAAGAA
ACTTCATAATACTTTCAGGGAAGTTATCTTTTCCTGTCAATCTGTTTAAAATATGCTATA
GTATTTCATTAGTTTGGTGGTAACTTATTTTTATTGTGTAATGATCTTTAAACGCTATAT
TTCAGAAATATTAAATGGAAGAAATCAATATCATGGAGAGCTAACTTTAGAAAACTAGCT
GGAGTATTTTAGGAGATTCTGGGTCAAGTAATGTTTTATGTTTTTGAAAGTTTAAGTTTT
AGACACTCCCCAAATTTCTAAATTAATCTTTTTCAGAAATATCGAAGGAGCCAAAAATAT
AAAACAGTTCTGATATCCAAAGTGGCTATATCAACATCAGGGCTAGCACATCTTTCTCTA
TTATCCTTCTATTGGAATTCTAGTATTCTGTATTCAAAAAATCATCTTGGACATAATTAA
TATTTTAGTAAGCTGCATCTAAATTAAAAATAAACTATTCATCATATAAT
>Hs.75236_mRNA_4 gi|14280328|gb|AY033998.1|智人 聚腺苷酸=3
TAGAATCGGGGGTTTCAGCTCACTGCTCCTTTTCTTTTTTTTCTTTCTCTCCCCCGCCCA
CCCCCCCAAAAATAATTGATTTGCTTTACAATCATCCACACTGTGTTTTGTGGATCTTTA
ATTATATATAACAATAGTAGTCATTTTAAATATATATTCTGAAATCTTTGCAAATTTTAA
CAGAAGAGTCGAAGCTCTGCGAGACCCAATATTTGCCAATAAGAATGGTTATGATAATTA
GCACCATGGAGCCTCAGGTGTCAAATGGTCCGACATCCAATACAAGCAATGGACCCTCCA
GCAACAACAGAAACTGTCCTTCTCCCATGCAAACAGGGGCAACCACAGATGACAGCAAAA
CCAACCTCATCGTCAACTATTTACCCCAGAATATGACCCAAGAAGAATTCAGGAGTCTCT
TCGGGAGCATTGGTGAAATAGAATCCTGCAAACTTGTGAGAGACAAAATTACAGGACAGA
GTTTAGGGTATGGATTTGTTAACTATATTGATCCAAAGGATGCAGAGAAAGCCATCAACA
CTTTAAATGGACTCAGACTCCAGACCAAAACCATAAAGGTCTCATATGCCCGTCCGAGCT
CTGCCTCAATCAGGGATGCTAACCTCTATGTTAGCGGCCTTCCCAAAACCATGACCCAGA
AGGAACTGGAGCAACTTTTCTCGCAATACGGCCGTATCATCACCTCACGAATCCTGGTTG
ATCAAGTCACAGGAGTGTCCAGAGGGGTGGGATTCATCCGCTTTGATAAGAGGATTGAGG
CAGAAGAAGCCATCAAAGGGCTGAATGGCCAGAAGCCCAGCGGTGCTACGGAACCGATTA
CTGTGAAGTTTGCCAACAACCCCAGCCAGAAGTCCAGCCAGGCCCTGCTCTCCCAGCTCT
ACCAGTCCCCTAACCGGCGCTACCCAGGTCCACTTCACCACCAGGCTCAGAGGTTCAGGC
TGGACAATTTGCTTAATATGGCCTATGGCGTAAAGAGACTGATGTCTGGACCAGTCCCCC
CTTCTGCTTGTTCCCCCAGGTTCTCCCCAATTACCATTGATGGAATGACAAGCCTTGTGG
GAATGAACATCCCTGGTCACACAGGAACTGGGTGGTGCATCTTTGTCTACAACCTGTCCC
CCGATTCCGATGAGAGTGTCCTCTGGCAGCTCTTTGGCCCCTTTGGAGCAGTGAACAACG
TAAAGGTGATTCGTGACTTCAACACCAACAAGTGCAAGGGATTCGGCTTTGTCACCATGA
CCAACTATGATGAGGCGGCCATGGCCATCGCCAGCCTCAACGGGTACCGCCTGGGAGACA
GAGTGTTGCAAGTTTCCTTTAAAACCAACAAAGCCCACAAGTCCTGAATTTCCCATTCTT
ACTTACTAAAATATATATAGAAATATATACGAACAAAACACACGCGCGCACACACACACA
TACACGAAAGAGAGAGAAACAAACTTTTCAAGGCTTATATTCAACCATGGACTTTATAAG
CCAGTGTTGCCTAAGTATTAAAACATTGGATTATCCTGAGGTGTACCAGGAAAGGATTTT
ATAATGCTTAGAAAAAAAAAAAAAAAAAAAA
>Hs.299867_mRNA_1 gi|4758533|ref|NM_004496.1|智人肝细胞核因子3,α(HNF3A),mRNA 聚腺苷酸=3
TCCAGGAATCGATAGTGCATTCGTGCGCGCGGCCGCCCGTCGCTTCGCACAGGGCTGGAT
GGTTGTATTGGGCAGGGTGGCTCCAGGATGTTAGGAACTGTGAAGATGGAAGGGCATGAA
ACCAGCGACTGGAACAGCTACTACGCAGACACGCAGGAGGCCTACTCCTCGGTCCCGGTC
AGCAACATGAACTCAGGCCTGGGCTCCATGAACTCCATGAACACCTACATGACCATGAAC
ACCATGACTACGAGCGGCAACATGACCCCGGCGTCCTTCAACATGTCCTATGCCAACCCG
GCCTTAGGGGCCGGCCTGAGTCCCGGCGCAGTAGCCGGCATGCCGGGGGGCTCGGCGGGC
GCCATGAACAGCATGACTGCGGCCGGCGTGACGGCCATGGGTACGGCGCTGAGCCCGAGC
GGCATGGGCGCCATGGGTGCGCAGCAGGCGGCCTCCATGATGAATGGCCTGGGCCCCTAC
GCGGCCGCCATGAACCCGTGCATGAGCCCCATGGCGTACGCGCCGTCCAACCTGGGCCGC
AGCCGCGCGGGCGGCGGCGGCGACGCCAAGACGTTCAAGCGCAGTTACCCGCACGCCAAG
CCGCCCTACTCGTACATCTCGCTCATCACCATGGCCATCCAGCGGGCGCCCAGCAAGATG
CTCACGCTGAGCGAGATCTACCAGTGGATCATGGACCTCTTCCCCTATTACCGGCAGAAC
CAGCAGCGCTGGCAGAACTCCATCCGCCACTCGCTGTCCTTCAATGACTGCTTCGTCAAG
GTGGCACGCTCCCCGGACAAGCCGGGCAAGGGCTCCTACTGGACGCTGCACCCGGACTCC
GGCAACATGTTCGAGAACGGCTGCTACTTGCGCCGCCAGAAGCGCTTCAAGTGCGAGAAG
CAGCCGGGGGCCGGCGGCGGGGGCGGGAGCGGAAGCGGGGGCAGCGGCGCCAAGGGCGGC
CCTGAGAGCCGCAAGGACCCCTCTGGCGCCTCTAACCCCAGCGCCGACTCGCCCCTCCAT
CGGGGTGTGCACGGGAAGACCGGCCAGCTAGAGGGCGCGCCGGCCCCGGGCCCGGCCGCC
AGCCCCCAGACTCTGGACCACAGTGGGGCGACGGCGACAGGGGGCGCCTCGGAGTTGAAG
ACTCCAGCCTCCTCAACTGCGCCCCCCATAAGCTCCGGGCCCGGGGCGCTGGCCTCTGTG
CCCGCCTCTCACCCGGCACACGGCTTGGCACCCCACGAGTCCCAGCTGCACCTGAAAGGG
GACCCCCACTACTCCTTCAACCACCCGTTCTCCATCAACAACCTCATGTCCTCCTCGGAG
CAGCAGCATAAGCTGGACTTCAAGGCATACGAACAGGCACTGCAATACTCGCCTTACGGC
TCTACGTTGCCCGCCAGCCTGCCTCTAGGCAGCGCCTCGGTGACCACCAGGAGCCCCATC
GAGCCCTCAGCCCTGGAGCCGGCGTACTACCAAGGTGTGTATTCCAGACCCGTCCTAAAC
ACTTCCTAGCTCCCGGGACTGGGGGGTTTGTCTGGCATAGCCATGCTGGTAGCAAGAGAG
AAAAAATCAACAGCAAACAAAACCACACAAACCAAACCGTCAACAGCATAATAAAATCCA
ACAACTATTTTTATTTCATTTTTCATGCACAACCTTGCCCCCAGTGCAAAAGACTGTTAC
TTTATTATTGTATTCAAAATTCATTGTGTATATTACTACAAAGACGGCCCCAAACCAATT
TTTTTCCTGCGAAGTTTAATGATCCACAAGTGTATATATGAAATTCTCCTCCTTCCTTGC
CCCCCTCTCTTTCTTCCCTCTTGGCCCTCCAGACATTCTAGTTTGTGGAGGGTTATTTAA
AAAACAAAAAGGAAGATGGTCAAGTTTGTAAAATATTTGTTTGTGCTTTTCCCCCCTCCT
TACCTGACCCCCTACGAGTTTACAGGCTTGTGGCAATACTCTTAACCATAAGAATTGAAA
TGGTGAAGAAACAAGTATACACTAGAGGCTCTTAAAAGTATTGAAAAGACAATACTGCTG
TTATATAGCAAGACATAAACAGATTATAAACATCAGAGCCATTTGCTTCTCAGTTTACAT
TTCTGATACATGCAGATAGCAGATGTCTTTAAATGAAATACATGTATATTGTGTATGGAC
TTAATTATGCACATGCTCAGATGTGTAGACATCCTCCGTATATTTACATAACATATAGAG
GTAATAGATAGGTGATATACGTGATACGTTCTCAAGAGTTGCTTGACCGAAAGTTACAAG
GACCCCAACCCCTTTGCTCTCTACCCACAGATGGCCCTGGGAACAATCCTCAGGAATTGC
CCTCAAGAACTCGCTTCTTTGCTTTGAGAGTGCCATGGTCATGTCATTCTGAGGTACATA
ACACATAAATTAGTTTCTATGAGTGTATACCATTTAAAGATTTTTTCAGTAAAGGGAATA
TTACATGTTGGGAGGAGGAGATAAGTTATAGGGAGCTGGATTTCAAACGGTGGTCCAAGA
TTCAAAAATCCTATTGATAGTGGCCATTTTAATCATTGCCATCGTGTGCTTGTTTCATCC
AGTGTTATGCACTTTCCACAGTTGGTGTTAGTATAGCCAGAGGGTTTCATTATTATTTCT
CTTTGCTTTCTCAATGTTAATTTATTGCATGGTTTATTCTTTTTCTTTACAGCTGAAATT
GCTTTAAATGATGGTTAAAATTACAAATTAAATTGGGAATTTTTATCAATGTGATTGTAA
TTAAAAATATTTTGATTTAAATAACAAAAATAATACCAGATTTTAAGCCGCGGAAAATGT
TCTTGATCATTTGCAGTTAAGGACTTTAAATAAATCAAATGTTAACAAAAAA
>Hs.285401_contig1
AI147926|AI880620|AA768316|AA761543|AA279147|AI216016|AI738663|N79248|AI684489|AA960845|AI718599|AI379138|N29366|BF002507|AW044269|R34339|R66326|H04648|R67467|AI523112|BF941500聚腺苷酸=2聚腺苷酸=3
TGTTTTTCTAGTTCATTTTGTGTTTCCAACTTTTCATGTAAAATTTTAATTATTTTTGAA
TGTGTGGATGTGAGACTGAGGTGCCTTTTGGTACTGAAATTCTTTTTCCATGTACCTGAA
GTGTTACTTTTGTGATATAGGAAATCCTTGTATATATACTTTATTGGTCCCTAGGCTTCC
TATTTTGTTACCTTGCTTTCTCTATGGCATCCACCATTTTGATTGTTCTACTTTTATGAT
ATGTTTTCATAAGTGGTTAAGCAAGTATTCTCGTTACTTTTGCTCTTAAATCCCTATTCA
TTACAGCAATGTTGGTGGTCAAAGAAAATGATAAACAACTTGAATGTTCAATGGTCCTGA
AATACATAACAACATTTTAGTACATTGTAAAGTAGAATCCTCTGTTCATAATGAACAAGA
TGAACCAATGTGGATTAGAAAGAAGTCCGAGATATTAATTCCAAAATATCCAGACATTGT
TAAAGGGAAAAAATTGCAATAAAATATTTGTAACATAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.182507_mRNA_1 gi|15431324|ref|NM_002283.2|智人角蛋白,毛发,碱性,5(KRTHB5),mRNA聚腺苷酸=3
AGCTCTCCCCACCAATAAAAGGACCAGGGAGGATCAGAGAGAGCAGAAGGATCCTGAGCC
TCGCACTCTGCCGCCCGCACCACCTTCCGCTGCCTCTCAGACTCTGCTCAGCCTCACACG
ATGTCGTGCCGCTCCTACAGGATCAGCTCAGGATGCGGGGTCACCAGGAACTTCAGCTCC
TGCTCAGCTGTGGCCCCCAAAACTGGCAACCGCTGCTGCATCAGCGCCGCCCCCTACCGA
GGGGTGTCCTGCTACCGAGGGCTGACGGGCTTCGGCAGCCGCAGCCTCTGCAACCTGGGC
TCCTGCGGGCCCCGGATAGCTGTAGGTGGCTTCCGAGCCGGCTCCTGCGGACGCAGCTTC
GGCTACCGCTCCGGGGGCGTGTGCGGACCCAGCCCCCCATGCATCACTACCGTGTCGGTC
AACGAGAGCCTCCTCACGCCCCTCAACCTGGAGATCGACCCCAACGCACAGTGCGTGAAG
CAGGAGGAGAAGGAGCAGATCAAGTCCCTCAACAGCAGGTTCGCGGCCTTCATCGACAAG
GTGCGCTTCCTGGAGCAGCAGAACAAGCTGCTGGAGACCAAGTGGCAGTTCTACCAGAAC
CAGCGCTGCTGCGAGAGCAACCTGGAGCCACTGTTCAGTGGCTACATCGAGACTCTGCGG
CGGGAGGCCGAGTGCGTGGAGGCCGACAGCGGGAGGCTGGCCTCAGAGCTCAACCATGTG
CAGGAGGTGCTGGAGGGCTACAAGAAGAAGTATGAAGAGGAGGTGGCCCTGAGAGCCACA
GCAGAGAATGAGTTTGTCGTTCTAAAGAAGGACGTGGACTGTGCCTACCTGCGGAAATCA
GACCTGGAGGCCAATGTGGAGGCCCTGGTGGAGGAGTCTAGCTTCCTGAGGCGCCTCTAT
GAAGAGGAGATCCGCGTTCTCCAAGCCCACATCTCAGACACCTCGGTCATAGTCAAGATG
GACAACAGCCGAGACCTGAACATGGACTGCATCATCGCTGAGATCAAGGCTCAGTATGAC
GATGTTGCCAGCCGCAGCCGGGCCGAGGCTGAGTCCTGGTACCGTAGCAAGTGTGAGGAG
ATGAAGGCCACGGTGATCAGGCATGGGGAGACCCTGCGCCGCACCAAGGAGGAGATCAAC
GAGCTGAACCGCATGATCCAGAGGCTGACGGCCGAGATTGAGAATGCCAAGTGCCAGCGT
GCCAAGCTGGAGGCTGCTGTGGCTGAGGCAGAGCAGCAGGGTGAGGCGGCCCTCAGCGAT
GCCCGCTGCAAGCTGGCTGAGCTGGAGGGCGCCCTGCAGAAGGCCAAGCAGGACATGGCC
TGCCTGCTCAAGGAGTACCAGGAGGTGATGAACTCCAAGCTGGGCCTGGACATCGAGATC
GCCACCTACAGGCGCCTGCTGGAGGGCGAGGAACACAGGCTGTGTGAAGGTGTGGGCTCT
GTGAATGTCTGTGTCAGCAGCTCCCGTGGTGGAGTCTCCTGTGGGGGCCTCTCCTACAGC
ACCACCCCAGGGCGCCAGATCACTTCTGGCCCCTCAGCCATAGGCGGCAGCATCACGGTG
GTGGCCCCTGACTCCTGTGCCCCCTGCCAGCCTCGTTCCTCCAGCTTCAGCTGCGGGAGT
AGCCGGTCGGTCCGCTTTGCCTAGTAGAGTCATGGAGCCAGGGCTTCCTGCCAAGCACCT
GCCTGCCTGCATCACTGCACTGAATGGCATGTGAATGGAAAATGTGTGCTTGCTTCCAGA
ATCTTCTGGATGTTCCTACAGAGGGAAAGACCTACAGAGGGAAAGACCCTCGGGCCGCTC
CCCTGCGCCTTTTCATGCTAGGGAGATGCATCCTAGTTGTCCTCCTGGCAGCTGTTTTCA
GAGGCATTCCCAGCCCTTCACTTAACTCCTACTTAGCTCCAAAATACCTGTATCCAATTT
GTATTATTCCCCCAGCTCTCAGGGACAAGACCAGTCCCCCAGCGTGGTGGTCAGCACGGA
AGCTCCACCTTCTGGGTGGAGGCGCCATCCTAACCATCCAGCCAGGCCACCCACAACCCG
AGAATCAGGGAGAAAGTCCCTCCCCAGCAGCCCCCTCCTCCTGGCTGGGAAGAATGGTCC
CCCAGCAAGCACTTGCCTGTTCATTCCCGTTCATGTTTTGCTTCTCTCTCAGACTGCCTT
CCTGCTTCTGGGCTAACCTGTTCCAGCCAGGCTCCTCATGTGACCTCGCAGTTGAGAAGC
CCATTATCGTGGGGCATCCTTTTGCCTACAGCCCCTGGTTAGGGCACTTTGGACAGGTCT
TGCTATTCAGTGAACCTTTGTACATTTCAAAGAAGACTCCATGGCTGCTCCAGATGCCCC
CTTGCTGGGTGCAGGTGGGGACTGTCCAATGCAGAGCTGGCGGGACAGAGAGTTAAGCCA
CTTCCTGGGTCTCCTTCTTATGACTGTCTATGGGTGCATTGCCTTCTGGGTTGTCTCGAT
CTGTGTTTCAATAAATGCCGCTGCAATGCAAAAAAAAAAAAAAAAAAA
>Hs.292653_contig1
AI200660|AW014007|AI341199|AI692279|AI393765|AI378686|AI695373|AW292108|T10352|R44346|AW470408|AI380925|BF938983|AW003704|H08077|F03856|H08075|F08895|AW468398|AI865976|H22568|AI858374|AI216499聚腺苷酸=2聚腺苷酸=3
CAATCAGTGAAAATTCTATATTCCTTTGGCATTTTTGTGACATATTCAATTCAGTTNTAT
GTTCCAGCAGAGATCATTATCCCTGGGATCACATCCAAATTTCATACTAAATGGAAGCAA
ATCTGTGAATTTGGGATAAGATCCTTCTTGGTTAGTATTACTTGCGCCGGAGCAATGTCT
TATTCCTCGTTTAGACATTGTGATTTCCTTCGTTGGAGCTGTGAGCAGCAGCACATTGGC
CCTAATCCTGCCACCTTTGGTTGAAATTCTTACATTTTCGAAGGAACATTATAATATATG
GATGGTCCTGAAAAATATTTCTATAGCATTCACTGGAGTTGTTGGCTTCTTATTAGGTAC
ATATATAACTGTTGAAGAAATTATTTATCCTACTCCCAAAGTTGTAGCTGGCACTCCACA
GAGTCCTTTTCTAAATTTGAATTCAACATGCTTAACATCTGGTTTGAAATAGTAAAAGCA
GAATCATGAGTCTTCTATTTTTGTCCCATTTCTGAAAATTATCAAGATAACTAGTAAAAT
ACATTGCTATATACATAAAAATGGTAACAAACTCTGTTTTCTTTGGCACGATATTAATAT
TTTGGAAGTAATCATAACTCTTTACCAGTAGTGGTAAACCTATGAAAAATCCTTGCTTTT
AAGTGTTAGCAATAGTTCAAAAAATTAAGTTCTGAAAATTGAAAAAATTAAAATGTAAAA
AAATTAAAGAATAAAAATACTTCTATTATTCTTTTATCTCAGTAAGAAATACCTTAACCA
AGATATCTCTCTTTTATGCTACTCTTTTGCCACTCACTTGAGAACAGAATAGGATTTCAA
CAATAAGAGAATAAAATAAGAACATGTATAACAAAAAGCTCTCTCCAGATCATCCCTGTG
AATGCCAAAGTAAACTTTATGTACAGTGTAAAAAAAAAAAAATCTCAGTTATGTTTTTAT
TAGCCAAATTCTAATGATTGGCTCCTGGAAGTATAGAAAACTCCCATTAACATAATATAA
GCATCAGAAAATTGCAAACACTAGAATTAATTTTACACTCTAATGGTAGTTGATCTTCAT
AGTCAAGAGGCACTGTTCAAGATCATGACTTAGTGTTTCAATGAAATTTGAAAAGGGACT
TTAAAACTTATCCAGTGCAACTCCCTTGTTTTTCGTCAGAGGAAAAGGAGGCCTAGAAAG
GTTAAGTAACTTGGTCGAGACCACTCAGCCTTGAGATCAAGAAAACCTAATCTTCTGACT
CCCAGGCCAGGATGTTTTATTTCTCACATCATGTCCAAGAAAAAGAATAAATTATGTTCA
GCTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.97616_mRNA_3 gi|12654852|gb|BC001270.1|BC001270智人克隆MGC:5069 IMAGE:3458016聚腺苷酸=3
CGGAGGCGGCGCCGACGGGGACTGCTGAGGCGCGCAGAGGGTCGGCGGCGCCCGGGAGCC
TGTCGCTGGCGCGGTCCGGGCGGGAGGCTCGGCGGCGGGCGGCAGCATGTCGGTGGCGGG
GCTGAAGAAGCAGTTCTACAAGGCGAGCCAGCTGGTCAGTGAGAAGGTCGGAGGGGCCGA
GGGGACCAAGCTGGATGATGACTTCAAAGAGATGGAGAAGAAGGTGGATGTCACCAGCAA
GGCGGTGACAGAAGTGCTGGCCAGGACCATCGAGTACCTGCAGCCCAACCCAGCCTCGCG
GGCTAAGCTGACCATGCTCAACACGGTGTCCAAGATCCGGGGCCAGGTGAAGAACCCCGG
CTACCCGCAGTCGGAGGGGCTTCTGGGCGAGTGCATGATCCGCCACGGGAAGGAGCTGGG
CGGCGAGTCCAACTTTGGTGACGCATTGCTGGATGCCGGCGAGTCCATGAAGCGCCTGGC
AGAGGTGAAGGACTCCCTGGACATCGAGGTCAAGCAGAACTTCATTGACCCCCTCCAGAA
CCTGTGCGAGAAAGACCTGAAGGAGATCCAGCACCACCTGAAGAAACTGGAGGGCCGCCG
CCTGGACTTTGACTACAAGAAGAAGCGGCAGGGCAAGATCCCCGATGAGGAGCTACGCCA
GGCGCTGGAGAAGTTCGAGGAGTCCAAGGAGGTGGCAGAAACCAGCATGCACAACCTCCT
GGAGACTGACATCGAGCAGGTGAGTCAGCTCTCGGCCCTGGTGGATGCACAGCTGGACTA
CCACCGGCAGGCCGTGCAGATCCTGGACGAGCTGGCGGAGAAGCTCAAGCGCAGGATGCG
GGAAGCTTCCTCACGCCCTAAGCGGGAGTATAAGCCGAAGCCCCGGGAGCCCTTTGACCT
TGGAGAGCCTGAGCAGTCCAACGGGGGCTTCCCCTGCACCACAGCCCCCAAGATCGCAGC
TTCATCGTCTTTCCGATCTTCCGACAAGCCCATCCGGACCCCTAGCCGGAGCATGCCGCC
CCTGGACCAGCCGAGCTGCAAGGCGCTGTACGACTTCGAGCCCGAGAACGACGGGGAGCT
GGGCTTCCATGAGGGCGACGTCATCACGCTGACCAACCAGATCGATGAGAACTGGTACGA
GGGCATGCTGGACGGCCAGTCGGGCTTCTTCCCGCTCAGCTACGTGGAGGTGCTTGTGCC
CCTGCCGCAGTGACTCACCCGTGTCCCCGCCCCGCCCCTCCGTCCACACTGGCCGGCACC
CCCTGCTGGGTCTCCTGCATTCCACGGAGCCCCTGCTGCCAGGGCGGTGTCTGAGCCTGC
CGGCGCCACCTGGGCCCCGGCCCTTGAGGTACTCCCTGAGCAGGACCCCACACTTGGGTG
GGGGGGCTTATCTGGGTGGGTGGGGATGCCTGTTTACACTAGCGCTGACTCCCAACGGTG
ACGGCTCCCTTCCCCACTCCATGGCGCCAGCCTCCTCCCCCGCTCCCCAACTTCTCGCCC
AGCTGGCCGAGGCGGGGCAACACTAAGGTGCTCTTAGAAACACTAATGTTCCTCTGGGGC
AGCCCCCACCTCCGTCCTGACCCGACGGGGGCCCGGCCCACTGCCTACCCTCGAGTCCCG
CAGCCTTAACAGGATGGGATCGAGGGTCCCCATGGGGTGGCTCAGAGATAGGACCCTGGT
TTTAAATCCCTCCCAGCCTGGTGCTGGTGATGGGCCCTGGCCCTACTCCAGGGCCAATGC
ACCCCCGCCTCACACACGCACTCCTTCTCCTCAAGGCCAGGGCAGAGGGCCTCACCGCCT
CCCGGGCCTGCTGTCAGCTTGCAGCCCGGGGACAGAGGCCAGCTGGGATCTGCCTGAGGA
CAGAGAACATGGTCTCCTGCAGGGCCCTGCCTCCCAAGCCCCGCCCTCAGAAAGCCAAGT
ACCTTTTCAGCTTTTTAACTGCCCCCATCCCAACCCAGGGAGGCCTGTGTCACTCTGGCA
CAAGCTGCCACCACCAGCCACCCACACCCACCCCAGCACACCTCACACGGGACCACAGCC
GCGCTGCCGAGGGCCAAGCACAAAGGTTCCAGTGAGCGCATGTCCCAGCCCCTGGTGGCC
AGGCTCCCCTTGCTGAGCCGCTGCCACTTCACCCTGTGGGAAGTGGCCCCAGCCATCTCC
TCTAGACCAAGGCAGGCAGCCCCGACATCTGCTTCCTCTATCGCCCAATGCAAAATCGAT
GAAATGGGGAGTTCTCTGGGCCAGGCCACATTCACATTCCCCTCCCCCTGTGGTCCAGTG
AAGCCTCCGGACCCCAGGCTCTGCTCTGCCCTGCCCTGCACCCCCCTCGTCAGAAGTACA
TGAGGGGCGCAGAGATGAGCACACAGCTTTGGGCACGGTCCAGGGCAAACTGAAATGTAC
GCCTGAATTTTGTAAACAGAAGTATTAAATGTCTCTTTCTACAAAAAAAAAAAAAAAAAA
>Hs.123078_mRNA_3 gi|14328043|gb|BC009237.1|BC009237智人克隆MGC:2216IMAGE:2989823聚腺苷酸=3
GGCACGAGGGAGGTGCAGAGCTGAGAATGAGGCGATTTCGGAGGATGGAGAAATAGCCCC
GAGTCCCGTGGAAAATGAGGCCGGCGGACTTGCTGCAGCTGGTGCTGCTGCTCGACCTGC
CCAGGGACCTGGGCGGAATGGGGTGTTCGTCTCCACCCTGCGAGTGCCATCAGGAGGAGG
ACTTCAGAGTCACCTGCAAGGATATTCAACGCATCCCCAGCTTACCGCCCAGTACGCAGA
CTCTGAAGCTTATTGAGACTCACCTGAGAACTATTCCAAGTCATGCATTTTCTAATCTGC
CCAATATTTCCAGAATCTACGTATCTATAGATGTGACTCTGCAGCAGCTGGAATCACACT
CCTTCTACAATTTGAGTAAAGTGACTCACATAGAAATTCGGAATACCAGGAACTTAACTT
ACATAGACCCTGATGCCCTCAAAGAGCTCCCCCTCCTAAAGTTCCTTGGCATTTTCAACA
CTGGACTTAAAATGTTCCCTGACCTGACCAAAGTTTATTCCACTGATATATTCTTTATAC
TTGAAATTACAGACAACCCTTACATGACGTCAATCCCTGTGAATGCTTTTCAGGGACTAT
GCAATGAAACCTTGACACTGAAGCTGTACAACAATGGCTTTACTTCAGTCCAAGGATATG
CTTTCAATGGGACAAAGCTGGATGCTGTTTACCTAAACAAGAATAAATACCTGACAGTTA
TTGACAAAGATGCATTTGGAGGAGTATACAGTGGACCAAGCTTGCTGCTGCCTCTTGGAA
GAAAGTCCTTGTCCTTTGAGACTCAGAAGGCCCCAAGCTCCAGTATGCCATCATGATGCC
TGCTAAGGCAGCCACCTTGGTGTACATGCTCACAGAGGCTCTGTTCATGGAGCAGCTGCT
GTTTGAAAAATTTTGAAATGCAAGATCCACAACTAGATGGAAGGCACTCTAGTCTTTGCA
GAAAAAAATGTACCTGAATGTACATTGCACAATGCCTGGCACAAAGAAGGAAGAATATAA
ATGATAGTTCGACTCGTCTGTGGAAGAACTTACAATCATGGGGAAAGATGGAATAAAAAC
ATTTTTTAAACAGCAAAAAAAAAAAAAAAAAA
>Hs.285508_contig1 AW194680|BF939744|BF516467聚腺苷酸=1聚腺苷酸=1
CCCCAGCCCCACTCACCCACCCTCCTTCCCACCAGCCTGCTCTCCGCAGGCCCACTGTCT
TTGGGTTTAATGACGTCTCTTCTCTGTGGAACTTCACGATTCCTTCCCACGGTCAACTCG
GGACCTCCCAGCGACCACTGCAGCCTGCGGACGAGGCCGGGACTTGGCCGAGCGGATCCT
AATAAGGGGAAAATGGTAAATGCAAACGTCCCGTTACAATTTTACCGCCAGTGTGCTGTC
GTTCCCCCTCCCCCTCTCCGAGTCCTCGTGGGGACACGGCGGGGTCTGTAGGAAGTTGGG
CCGGGTTGGGGGTTGCTAGAAGGCGCTGGTGTTTTGCTCTGAGTTTTAAGAGATCCCTTC
CTTCCTCTTCGGTGAATGCAGGTTATTTAAACTTTGGGAAATGTACTTTTAGTCTGTCAT
ATCAAGGCATGAGTCACTGTCTTTTTTTGTGTGAATAAATGGTTTCTAGTACAATGGA
>Hs.183274_contig1
BF437393|BF064008|BF509951|AW134603|AI277015|AI803254|AA887915|BF054958|AI004413|AI393911|AI278517|AW612644|AI492162|AI309226|AI863671|AA448864|AI640165|AA479926|AA461188|AA780161|BF591180|AI918020|AI758226|AI291375|BF001845|BF003064|AI337393|AI522206|BE856784|BF001760|AI280300 FLAG=1聚腺苷酸=2 WARN 聚腺苷酸=3
GCGGCCGCCCGCACGTCCGCGGGTCCCGGCCGCGCCGCCGCCGCGCGCCCCTGCCCGAGA
GAGCTCTGGCCCCGCTAGCGGGGCCAGGAGCCGGGCCTCCCACCGCAGCGTCCCCCGCCG
CGCCAGTCCCCGCTAGTGGTAGTATCTCGTAATAGCTTCTGTGTGTGAGCTACCGTGGAT
CTCCTTCCCTTCTCTTGGGGGCCGGGGGGAAAGAAAAGGATTTAAGCAAAGGCTCCCTCG
CCCTGTGAGGGCGAGCGGCAAAGGCCCGGCTGAGCCCCCCATGCCCCTCCCCTCCCCGTG
TAAAAAGCCTCCTTGTGCAATTGTCTTTTTTTTCCTTTGAACGTGCTTCTTTGTAATGAC
CAAGGTACCGATTTCTGCTAAGTTCTCCCAACAACATGAAACTGCCTATTCACGCCGTAA
TTCTTTCTGTCTCCCTTCTCTCTCTCTCTCTCGCTCGCTCGCTCTCGCTCTCGCTCTCTC
TCGCTGCGTCCTCATTTCCCCTCCCAATCCTCTCTCCCCTCTGCAACCCCCCAGCTCGCT
GGCTTTCTCTCTGGCTTCTCTCTTTTCCTCCTCCACCCACCCCCTTTGGTTTGACAATTT
TGTCTTAAGTGTTTCTCAAAAGAGGTTACTTTAGTTAGCATGCGCGCTGTGGGCAATTGT
TACAAGTGTTCTTAGGTTTACTGTGAAGAGAATGTATTCTGTATCCGTGAATTGCTTTAT
GGGGGGGAGGGAGGGCTAATTATATATTTTGTTGTTCCTCTATACTTTGTTCTGTTGTCT
GCGCCTGAAAAGGGCGGAAGAGTTACAATAAAGTTTACAAGCGAGAACCCGAAAAAAAAA
AAAAA
>Hs.334841_mRNA_3 gi|14290606|gb|BC009084.1|BC009084智人克隆MGC:9270IMAGE:3853674聚腺苷酸=3
CACCAGCACAGCAAACCCGCCGGGATCAAAGTGTACCAGTCGGCAGCATGGCTACGAAAT
GTGGGAATTGTGGACCCGGCTACTCCACCCCTCTGGAGGCCATGAAAGGACCCAGGGAAG
AGATCGTCTACCTGCCCTGCATTTACCGAAACACAGGCACTGAGGCCCCAGATTATCTGG
CCACTGTGGATGTTGACCCCAAGTCTCCCCAGTATTGCCAGGTCATCCACCGGCTGCCCA
TGCCCAACCTGAAGGACGAGCTGCATCACTCAGGATGGAACACCTGCAGCAGCTGCTTCG
GTGATAGCACCAAGTCGCGCACCAAGCTGGTGCTGCCCAGTCTCATCTCCTCTCGCATCT
ATGTGGTGGACGTGGGCTCTGAGCCCCGGGCCCCAAAGCTGCACAAGGTCATTGAGCCCA
AGGACATCCATGCCAAGTGCGAACTGGCCTTTCTCCACACCAGCCACTGCCTGGCCAGCG
GGGAAGTGATGATCAGCTCCCTGGGAGACGTCAAGGGCAATGGCAAAGGGGGTTTTGTGC
TGCTGGATGGGGAGACGTTCGAGGTGAAGGGGACATGGGAGAGACCTGGGGGTGCTGCAC
CGTTGGGCTATGACTTCTGGTACCAGCCTCGACACAATGTCATGATCAGCACTGAGTGGG
CAGCTCCCAATGTCTTACGAGATGGCTTCAACCCCGCTGATGTGGAGGCTGGACTGTACG
GGAGCCACTTATATGTATGGGACTGGCAGCGCCATGAGATTGTGCAGACCCTGTCTCTAA
AAGATGGGCTTATTCCCTTGGAGATCCGCTTCCTGCACAACCCAGACGCTGCCCAAGGCT
TTGTGGGCTGCGCACTCAGCTCCACCATCCAGCGCTTCTACAAGAACGAGGGAGGTACAT
GGTCAGTGGAGAAGGTGATCCAGGTGCCCCCCAAGAAAGTGAAGGGCTGGCTGCTGCCCG
AAATGCCAGGCCTGATCACCGACATCCTGCTCTCCCTGGACGACCGCTTCCTCTACTTCA
GCAACTGGCTGCATGGGGACCTGAGGCAGTATGACATCTCTGACCCACAGAGACCCCGCC
TCACAGGACAGCTCTTCCTCGGAGGCAGCATTGTTAAGGGAGGCCCTGTGCAAGTGCTGG
AGGACGAGGAACTAAAGTCCCAGCCAGAGCCCCTAGTGGTCAAGGGAAAACGGGTGGCTG
GAGGCCCTCAGATGATCCAGCTCAGCCTGGATGGGAAGCGCCTCTACATCACCACGTCGC
TGTACAGTGCCTGGGACAAGCAGTTTTACCCTGATCTCATCAGGGAAGGCTCTGTGATGC
TGCAGGTTGATGTAGACACAGTAAAAGGAGGGCTGAAGTTGAACCCCAACTTCCTGGTGG
ACTTCGGGAAGGAGCCCCTTGGCCCAGCCCTTGCCCATGAGCTCCGCTACCCTGGGGGCG
ATTGTAGCTCTGACATCTGGATTTGAACTCCACCCTCATCACCCACACTCCCTATTTTGG
GCCCTCACTTCCTTGGGGACCTGGCTTCATTCTGCTCTCTCTTGGCACCCGACCCTTGGC
AGCATGTACCACACAGCCAAGCTGAGACTGTGGCAATGTGTTGAGTCATATACATTTACT
GACCACTGTTGCTTGTTGCTCACTGTGCTGCTTTTCCATGAGCTCTTGGAGGCACCAAGA
AATAAACTCGTAACCCTGTCCTTCAAAAAAAAAAAAAAAAA
>Hs.3321_contig1
AI804745|AI492375|AA594799|BE672611|AA814147|AA722404|AW170088|D11718|BG153444|AI680648|AA063561|BE219054|AI590287|R55185|AI479167|AI796872|AI018324|AI701122|BE218203|AA905336|AI681917|BI084742|AI480008|AI217994|AI401468聚腺苷酸=2聚腺苷酸=3
CCGGAGATAACTTGAGGGCTATAGAGGACCGGCTAATACTGGTCCTGAATTTGGCTTCAG
GCCTCACCAACCAAGTGGCCGTGGCCTTGCCGTCTTGCCCGTCGGCCCCCGGTGAGGCCT
GGACCCCTGGGGTCCCGGCACCAGGCCCCGGCTTCCGACCCTGGCAGAAGCCCAAGATCT
GGTCCCTCGCGGAGACTGCCACAAGCCCCGGACACCCGCGCCGGCTCGCCTCCCGGCGCG
GGGGGGTCTCCACCGGGGGGCAACGGTCGCGCCTTTCCGCCCTGCAGCTCTCTCCGGGCC
GCCGCCGCCGCCGCCGCTCACAGACTGGTCTCAGCGCCGCTGGGCAAGTTCCCGGCTTGG
ACCAACCGGCCGTTTCCAGGCCCACCGCCCGGCCCCCGCCCGCACCCGCTCTCCCTGCTG
GGCTCTGCCCCTCCGCACCTGCTGGGACTTCCCGGAGCCGCGGGCCACCCGGCTGCCGCC
GCCGCCTTCGCTCGGCCAGCGGAGCCCGAAGGCGGAACAGATCGCTGTAGTGCCTTGGAA
GTGGAGAAAAAGTTACTCAAGACAGCTTTCCATCCCGTGCCCAGGCGGCCCCAGAACCAT
CTGGACGCCGCCCTGGTCTTATCGGCTCTCTCCTCATCCTAGTTCTTTAAAAAAAAACAA
AAAAACAAAAAAAACTTTTTTTAATCGTTGTAATAATTGTATAAAAAAAATCGCTCTGTA
TAGTTACAACTTGTAAGCATGTCCGTGTATAAATACCTAAAAGCAAAACTAAACAAAGAA
AGTAAGAAAAAGAAATAAAACCAGTCCTCCTCAGCCCTCCCCAAGTCGCTTCTGTGGCAC
CCCGCATTCGCTGTGAGGTTTGTTTGTCCGGTTGATTTTGGGGGGTGGAGTTTCAGTGAG
AATAAACGTGTCTGCCTTTGTGTGTGTGTATATATACAGAGAAATGTACATATGTGTGAA
CCAAATTGTACGAGAAAGTATCTATTTTTGGCTAAATAAATGAGCTGCTGCCACTTTGAC
TATAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.306216_singlet1 AW083022聚腺苷酸=1聚腺苷酸=2
TATGAGCACCTTCACATGGATCCACTTGAGGAAAGAAGGTGGACCGAATTTGTAAACGGT
GTGCAGCAATATATATCAATTCGTTCTGAGATAATCGCCACTTACGCTCTCTGTGGTTTT
GCCAATATCGGGTCCCTAGGAATCGTGATCGGCGGACTCACATCCATGGCTCCTTCCAGA
AAGCGTGATATCGCCTCGGGGGCAGTGAGAGCTCTGATTGCGGGGACCGTGGCCTGCTTC
ATGACAGCCTGCATCGCAGGCATACTCTCCAGCACTCCTGTGGACATCAACTGCCATCAC
GTTTTAGAGAATGCCTTCAACTCCACTTTCCCTGGAACCCCAACCAAGGGTGATAGCTTG
TTGCCAAAGTCTGTTGAGCAGCCCTGTTGCCCAGGGTCCTGGTGAAGTCATCCCAGGAGG
AAACCCCAGTCTGTATTCTTTGAAGGGCTGCTGCACATTGTTGAATCCATCGACCTTTAG
CTGCAATGGGATCTCTAATACATTTTGAGGTCAGCCACTTCTCCAGTGGAACTCTGAAGT
ACAGATGCTGAATTTTCTGCTTTGGAAAGAAAAAAAA
>Hs.99235_contig1 AA456140|AI167259|AA450056聚腺苷酸=2聚腺苷酸=3
ACTCGGCATGTGATGAACACCCATAGTTAAGAAACCATGGAGCAAGAAAGCTTGTGGAAA
GTCTCTCTCCTTCCTCATAAGACATGCACACTAATACACATACACACCAAAAAATTACAC
ATTTTAAAACTGCTAAGCTTGGATTTAACTGAATCATATATCTTTTATCATGTTATCCTA
AAAGTGAGAAGACATAACCAAGACATGGAAATAAATGTGAAAGCTGGAGCCGAAGAGTCA
AAGAGCTAAAAAATTAAGTCTAGAACATTCTATGAGGATAGTATAAATAAAAAGAAATAC
AGTCTAGACATGCTGCAAGGAAAGAAGATTCTAAAGTCCGTTTATGGAGGCAATTCCATA
TCCTTTCTTGAACGCACATTCAGCTTACCCCAGAGAGCAAGTGAGGCAATCTGGCAAAAG
ATTAATAAAGATGTAAACCCCTGGAAAAAAAAAAAA
>Hs.169172_mRNA_2 gi|2274961|emb|AJ000388.1|HSCANPX(需)钙蛋白酶样蛋白酶的智人mRNACANPX聚腺苷酸=3
GAATTCGGCACGAGATAGTTTTCAGGTTAAGAAAGCCAGAATCTTTGTTCAGCCACACTG
ACTGAACAGACTTTTAGTGGGGTTACCTGGCTAACAGCAGCAGCGGCAACGGCAGCAGCA
GCAGCAGCAGCAGCAGCAGCAGCAGCAGGGCTCCTGGGATAACTCAGGCATAGTTCAACA
CTATGGGTCCTCCTCTGAAGCTCTTCAAAAACCAGAAATACCAGGAACTGAAGCAGGAAT
GCATCAAAGACAGCAGACTTTTCTGTGATCCAACATTTCTGCCTGAGAATGATTCTCTTT
TCTACTTCCGACTGCTTCCTGGAAAGGTGGTGTGGAAACGTCCCCAGGACATCTGTGATG
ACCCCCATCTGATTGTGGGCAACATTAGCAACCACCAGCTGACCCAAGGGAGACTGGGGC
ACAAGCCAATGGTTTCTGCATTTTCCTGTTTGGCTGTTCAGGAGTCTCATTGGACAAAGA
CAATTCCCAACCATAAGGAACAGGAATGGGACCCTCAAAAAACAGAAAAATACGCTGGGA
TATTTCACTTTCGTTTCTGGCATTTTGGAGAATGGACTGAAGTGGTGATTGATGACTTGT
TGCCCACCATTAACGGAGATCTGGTCTTCTCTTTCTCCACTTCCATGAATGAGTTTTGGA
ATGCTCTGCTGGAAAAAGCTTATGCAAAGCTGCTAGGCTGTTATGAGGCCCTGGATGGTT
TGACCATCACTGATATTATTGTGGACTTCACGGGCACATTGGCTGAAACTGTTGACATGC
AGAAAGGAAGATACACTGAGCTTGTTGAGGAGAAGTACAAGCTATTCGGAGAACTGTACA
AAACATTTACCAAAGGTGGTCTGATCTGCTGTTCCATTGAGTCTCCCAATCAGGAGGAGC
AAGAAGTTGAAACTGATTGGGGTCTGCTGAAGGGCCATACCTATACCATGACTGATATTC
GCAAAATTCGTCTTGGAGAGAGACTTGTGGAAGTCTTCAGTGCTGAGAAGGTGTATATGG
TTCGCCTGAGAAACCCCTTGGGAAGACAGGAATGGAGTGGCCCCTGGAGTGAAATTTCTG
AAGAGTGGCAGCAACTGACTGCATCAGATCGCAAGAACCTGGGGCTTGTTATGTCTGATG
ATGGAGAGTTTTGGATGAGCTTGGAGGACTTTTGCCGCAACTTTCACAAACTGAATGTCT
GCCGCAATGTGAACAACCCTATTTTTGGCCGAAAGGAGCTGGAATCGGTGTTGGGATGCT
GGACTGTGGATGATGATCCCCTGATGAACCGCTCAGGAGGCTGCTATAACAACCGTGATA
CCTTCCTGCAGAATCCCCAGTACATCTTCACTGTGCCTGAGGATGGGCACAAGGTCATTA
TGTCACTGCAGCAGAAGGACCTGCGCACTTACCGCCGAATGGGAAGACCTGACAATTACA
TCATTGGCTTTGAGCTCTTCAAGGTGGAGATGAACCGCAAATTCCGCCTCCACCACCTCT
ACATCCAGGAGCGTGCTGGGACTTCCACCTATATTGACACCCGCACAGTGTTTCTGAGCA
AGTACCTGAAGAAGGGCAACTATGTGCTTGTCCCAACCATGTTCCAGCATGGTCGCACCA
GCGAGTTTCTCCTGAGAATCTTCTCTGAAGTGCCTGTCCAGCTCAGGGAACTGACTCTGG
ACATGCCCAAAATGTCCTGCTGGAACCTGGCTCGTGGCTACCCGAAAGTAGTTACTCAGA
TCACTGTTCACAGTGCTGAGGACCTGGAGAAGAAGTATGCCAATGAAACTGTAAACCCAT
ATTTGGTCATCAAATGTGGAAAGGAGGAAGTCCGTTCTCCTGTCCAGAAGAATACAGTTC
ATGCCATTTTTGACACCCAGGCCATTTTCTACAGAAGGACCACTGACATTCCTATTATAG
TACAGGTCTGGAACAGCCGAAAATTCTGTGATCAGTTCTTGGGGCAGGTTACTCTGGATG
CTGACCCCAGCGACTGCCGTGATCTGAAGTCTCTGTACCTGCGTAAGAAGGGTGGTCCAA
CTGCCAAAGTCAAGCAAGGCCACATCAGCTTCAAGGTTATTTCCAGCGATGATCTCACTG
AGCTCTAAATCTGCAATCCCAGAGAATCCTGACAAAGCGTGCCACCCTTTTATTTTCCGT
CAGGTGCCAGGTCTTAGTTAAGATTCACAATCTTTAGAAAGAATGAGATTCACAATAATT
AACTCTTCCTCTCTTCTGATAAATTCCCCATACCTCCCAATCCAAGTAGCATCTGTAGCT
ACATAACCTATATACCTCCAGCAGCTGGACATGGGGAGCGACAGTCCTATCTAGACATCA
TACACATTTGCCAAGAAAGGATCTCTGGGGCTTCCGGGGGTGAGATTCAAGCAGGACAAT
AACAAGAGGCTGGACACCCTACAGATGTCTTTGATGTTTTCAGTTGTTTGATATATCTCC
CCTGTAGGGCATGTTGAGGAAGGAGGAGGGCTGATCAAGGCCAAGCTGGTCTAGCCTGAC
ATCCTAGCTCCTGACTGAACACTATAGACTTCCCAGCAGCATTTTCACCCAGCAGCCAGA
GCCGGCTTTAAGTCCCCAACCCTTACAGACACCACTGCCACCACCACCAACCACGACCAC
CACCACCACCACCACTCACCACCATCATCACCTCCGGAAAGTGTAGTCCTGCCCTAACCC
TAACCCCAAGTCACCCCCCACAGTAAATTTTACCTTCATGTTGAGAAAGCTTCCTGGTGC
TTAATCAAGAGCTGGAGTTCAATGAGTCCTAGACAGTGAGAGGGGCCTGAGCTTCAGCTC
AATGGAAGCCTGCTGTGTGCTCACAAGACGGAAAAGTGGAAGAAGCTGCAGTGGGAGACA
AAGCCTCGGTCCCCCACCCATCCACACACACCTACACTCACACACGCGCACATGGGCGCG
CAACGGAACTACCATTTCAGGCAGTCAGTGGGCAAGAGGAAAGATAAGTAAGTACCATAC
ACACCTTAAAAGATGAGGAGAATTCATCCAGACATATTACAGCCAGTTTGGGGCCCCTGA
CTTGCAATGTGAAACCTCTTCGCTTGCTGCTAGGTTTACAAACAAGCCCATTGTTCCTGT
GCCTCCTAATATTCATTTGTTACTGAAGGACCCCATCTGGGGACTTGAGACTTTGGTCCC
AGCCCAGACGCCTCAGACTGGTCTCAAAGTCAAGCAAGGCTTCACATCAGCTGCAAGTGT
TAGTTTGCCAGCGCATGATCTCACTGAGCTTCTACAGAATCTGCAATCCCAGAGTCAATC
ATGACGAAATGTACGTCCCACCATCTTAACCTATCAACTTTCTGCCCCTCCTTCAAGGCC
CAGTATAAATGCCACCTCCTCCATGAAGCCTTCCCTAATTCCACCCCAAACCCCCACCTT
CAACAATATTTCAACGCTTCTGCAATGATGAAAAAGAAACATAGTTGTAGTACTTAGCCT
ACCTAGACCAGCAAGCATTCATTTTTAGCTCGCTCATTTTTTACCATGTTTTCCAGTCTG
TTTAACTTCTGCAGTGCCTTCACTACACTGCCTTACATAAACCAAATCACAATAAAGTTC
ATATTCAGTACAATTAAAAAAAAAAAAA
>Hs.351486_mRNA_1 gi|16549178|dbj|AK054605.1|AK054605智人cDNA FLJ30043 fis,克隆3NB692001548聚腺苷酸=0
TATGCAAGTGTTTAACAGATGCTTCACTATTAAAATATTTTCCCCCCAAGTCTCAAATAT
TGAAGAATCTCTAACCAGGGACACCAGTCCCTACGAAGACCTTGGGCGATTTTGAAGTGC
GGGCACCTCGATTCCCCGAATCTGTAGTGTGGCTGGTATCGGTGTTCCCCTGGTTTAACT
AGCCTGTTTGAAGGCACAGATCATTCATGGGGAAGTATAACCGAATCCAGTCCTCTCCAC
CGCCTGGGGATCTTCACTTTCGCAGTCTACGACTGCCTGTGACTCCAGAAAGACAAACTG
CAGATTGGCCAAGATGGGGAAATTGAGGCAGAGAAGCCAAGACATGTGCTAAAGGTCATG
CAGGCTATGAATGGAGCTGGAATGTGAACGCAGGCCATATGACCCCAGAGCCCATGTTCT
TGAACCCTTAGAAAGACAGCAGCAACACACCTGGTGCAGCAGCTGCTTAGTTGGAGTGGC
TGACAAGGAGAGAATGATTTCCAGGAAGAGCGGAACACATATGGAAGGCCTTAGCTTATC
TTTAGCGCCTCATACACCCGTTCTGGACTTCAGAAAGGCCAGTGAGTGGGATTAGGCCTC
AGAGATAGGATGTCAGTCCCAGTGAGGGATGGCCTAGAGCATTCTTTAATTCTTTCCTTT
GGGTCACACATAAGAAACAATTTTCCAGCACTGATGAGTGTTATTAACAATGAGATGGGA
TAGAATTTAGTTTTCCCTATGGCTGTGCTTCAAAAATAGAAAAGCTGTCTTTTCTCTGGA
ATGATTGAATGAAGCTCTGGGGAGGAAAAGGTGGATTGGCAGATCTCTTAAAGGAAGCTT
CTCCTTCTAGGCACTATTCTAAGGCTTAATATTTTAACTCCCTATATTAACCTAGTTCAA
CTAAACAGTGATCTGAGTAATTTTATTTTTATTAAAGCTCAGATCAAAATGCCATTAACA
TTGATTGAGAAAATCAAAGGAATCTTTGATGTGAGTGGTTAAATTGCTGAATTATTTCAG
TCCCATACCCTCACAGCATGAGTACCTGATCTGATAGACTTCTTTGGAATTCCTTTTTTG
TTTGAGACAGAGTCTTGCTCTGTCGCCCAGGCTGGAGTGCAGCGGTGTGATCTCAACCAT
TGCAACCTCCACCTCCCAGGTTCAGGTGATTCTCATGCCTCAGCCTCCTGAGTAGCTGGG
ATTACAGATGTGCACCACCATGCCCGGCTAATTATTTTGTATCTTTAGTAGAGATGAAGT
TTTGCCATGTGGGCCAGGCTGTTCTCAAACTACTGGCCTCAAGTGATCTGCCCGCCTCGG
CCTCCCAGACTGCTGGGATTACAGGCGTGAGGCACCGTGCCTGGCTGGGATTCCATAATA
AATCCCTCTGTGTCTATTTCTTTTTTCAAATATAATTTTCTTCATTTCCAAACATCATCT
TTAAGACTCCAAGGATTTTTCCAGGCACAGTGGCTCATACCTGTAATCCCATTGCTTGGA
GAGGCCAAGGTGGAAGTTCATTTGAGGCCAGGAGTTCGAGACCAGGTGGGCAACATAGTG
AAACCTTGTCTCTACAACAT
>Hs.153504_contig2
BE962007|AW016349|AW016358|AW139144|AA932969|AI025620|AI688744|AI865632|AA854291|AA932970|AU156702|AI634439|AA152496|AI539557|AI123490|AI613215|AI318363|AW105672|AA843483|AI366889|AW181938|AI813801|AI433695|AA934772|N72230|AI760632|BE858965|AW058302|AI760087|AI682077|AA886672|AI350384|AW243848|AW300574|BE466359|AI859529|AI921588|BF062899|BE855597|BE617708聚腺苷酸=2聚腺苷酸=3
TGTTTATATAACTGTGTTCGTTTTTGTTGTTCCGTCCCGTCGTCCTTGTAGACTCTCATC
CTCGTGTGTTTTGGACCCTCCAGGGGTGACATCGGGTCTTGTGTTCAGCTCTCCTGGACT
GTTATTCCTTGTCCGCGTGTTCGTGTTAGACATTGTCCACGATCTGTATCATGCCTATGT
CTCACTTTGGTCTCTTATTTCAGCGTGAACACTATAGTTCCAAGTTTGTTCGGATAATTC
TGATTCTTGTCACCAGCGTGAGATTTCAACAGAACTTGTTTGGAACAAATACTCACTTAA
AACTTCAGCAGAAGAAAAATTACTTAGTCCTTAGGCCAACCAATTTAACTGCAGTGTCAT
GTTTCACAGGCCTTCCTACATTTAGAAATCGTCACACAGCTGTGATAAGAGTAGATTATT
TTACTATGAAATAATTCTGAATAGATGAAAGCATAAAATGTGAGAAACTGAATGTATTAT
TCAGGAAGAATACTGAGTGCCTTCATTTAACTAAAGTTGAATGTAAAAGTCAATTTGCAC
TTCTTTATAATCCTCTGGTTTAGAATTATAAATTGTTAAAACCTTGATAATTGTCATTTA
ATTATATTTCAGGTGTCCTGAACAGGTCACTAGACTCTACATTGGGCAGCCTTTAAATAT
GATTCTTTGTAATGCTAAATAGCCTTTTTTTCTCTTTTTACTGCAACTTAATATTTCTAT
TTAGAACACAGAAAATGAAAATATTTAGAATAAGTTGTACATTTGATGACAAATAAATCA
CTATTAAAATAAAAAAAAAAAAAAAAAAA
>Hs.199354_singlet1 AI669760聚腺苷酸=1聚腺苷酸=2
AGGAACCCCTGTGGGAAAGGTTTAAACCTAAAACAGTGCCCCCTTTGGCTCCTCCTCCCT
TGGCGGAATGGGTTCCTGGACCATGTGCATTTCANTGGGCCATGGGATTTACATTTCCTT
GCATCCCCAGGTGGTTTGATCCCTGCCAGGGCCCCTTCCTTCCTGCTCATGGTTTTCAGG
GGGCCTGATCATGGAAAGTAAGGGGGTTGGGCCTTCCCTTTTGGGGGTGAACCCTGACTC
CATCCCCCTATTGCCCCCCTAACCAATCATGCAAACTTTTCCCCCCCTGGGGTAATTCAC
CAGTTAAAAAAAGCTTTTTTTAAATGTTTTGTTTTGGGGGGGGGGCAGGGCCCCCTTTTT
GTTTTTTTAAGGAGTTGGTTTTGGTTTTTGGCTGATGTTTTGTTTTTTAACATGCCCCCA
GTTTGTAAGGCCAAAGGTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
>Hs.162020_contig1 AW291189|AA505872聚腺苷酸=2聚腺苷酸=3
TAAGCTTTAAAGGCTCTGTGTTAGGGCATAGTCTAGAAACATGGGGCCCAAGGGCACCGG
GAAAACTTACAAAGGGAAGAGATGGAACTGGGAGGGTTCAAGCTACCAGTTCCATCTCTC
CATGTTTTAGAGAATTGGGGCACTAAGTCAGCCAGGTAAGGTCAGGTCAGAGGAGGGCCC
GGATGAAGCATGAGATGCAGAGGGACAGTGCGTGAATGGAGACCTTGGGTAGCACCAACG
TGTAGCGGCAGAGGTGGGGTGGATGTGGCTGATGTCAGGGAGAGAATGGGGAGCATGCAC
AGGGCTCAGTCTTATACATACATTGAAAATCCTTTAGCCTTTCAAAGATTATTAACCCAA
ATCACCTTTCTTGCTTACTCCAGATGCCTCAGCCTCTGATATAATTGCTAAGTATCTGCC
GTGTTAAAAATAAACATTTGAGAATCAAAAAAAAAAAAAAAAA
>Hs.30743_mRNA_3 gi|18201906|ref|NM_006115.2|黑色素瘤中的智人优选表达抗原(PRAME),mRNA聚腺苷酸=3
GCTTCAGGGTACAGCTCCCCCGCAGCCAGAAGCCGGGCCTGCAGCGCCTCAGCACCGCTC
CGGGACACCCCACCCGCTTCCCAGGCGTGACCTGTCAACAGCAACTTCGCGGTGTGGTGA
ACTCTCTGAGGAAAAACCATTTTGATTATTACTCTCAGACGTGCGTGGCAACAAGTGACT
GAGACCTAGAAATCCAAGCGTTGGAGGTCCTGAGGCCAGCCTAAGTCGCTTCAAAATGGA
ACGAAGGCGTTTGTGGGGTTCCATTCAGAGCCGATACATCAGCATGAGTGTGTGGACAAG
CCCACGGAGACTTGTGGAGCTGGCAGGGCAGAGCCTGCTGAAGGATGAGGCCCTGGCCAT
TGCCGCCCTGGAGTTGCTGCCCAGGGAGCTCTTCCCGCCACTCTTCATGGCAGCCTTTGA
CGGGAGACACAGCCAGACCCTGAAGGCAATGGTGCAGGCCTGGCCCTTCACCTGCCTCCC
TCTGGGAGTGCTGATGAAGGGACAACATCTTCACCTGGAGACCTTCAAAGCTGTGCTTGA
TGGACTTGATGTGCTCCTTGCCCAGGAGGTTCGCCCCAGGAGGTGGAAACTTCAAGTGCT
GGATTTACGGAAGAACTCTCATCAGGACTTCTGGACTGTATGGTCTGGAAACAGGGCCAG
TCTGTACTCATTTCCAGAGCCAGAAGCAGCTCAGCCCATGACAAAGAAGCGAAAAGTAGA
TGGTTTGAGCACAGAGGCAGAGCAGCCCTTCATTCCAGTAGAGGTGCTCGTAGACCTGTT
CCTCAAGGAAGGTGCCTGTGATGAATTGTTCTCCTACCTCATTGAGAAAGTGAAGCGAAA
GAAAAATGTACTACGCCTGTGCTGTAAGAAGCTGAAGATTTTTGCAATGCCCATGCAGGA
TATCAAGATGATCCTGAAAATGGTGCAGCTGGACTCTATTGAAGATTTGGAAGTGACTTG
TACCTGGAAGCTACCCACCTTGGCGAAATTTTCTCCTTACCTGGGCCAGATGATTAATCT
GCGTAGACTCCTCCTCTCCCACATCCATGCATCTTCCTACATTTCCCCGGAGAAGGAAGA
GCAGTATATCGCCCAGTTCACCTCTCAGTTCCTCAGTCTGCAGTGCCTGCAGGCTCTCTA
TGTGGACTCTTTATTTTTCCTTAGAGGCCGCCTGGATCAGTTGCTCAGGCACGTGATGAA
CCCCTTGGAAACCCTCTCAATAACTAACTGCCGGCTTTCGGAAGGGGATGTGATGCATCT
GTCCCAGAGTCCCAGCGTCAGTCAGCTAAGTGTCCTGAGTCTAAGTGGGGTCATGCTGAC
CGATGTAAGTCCCGAGCCCCTCCAAGCTCTGCTGGAGAGAGCCTCTGCCACCCTCCAGGA
CCTGGTCTTTGATGAGTGTGGGATCACGGATGATCAGCTCCTTGCCCTCCTGCCTTCCCT
GAGCCACTGCTCCCAGCTTACAACCTTAAGCTTCTACGGGAATTCCATCTCCATATCTGC
CTTGCAGAGTCTCCTGCAGCACCTCATCGGGCTGAGCAATCTGACCCACGTGCTGTATCC
TGTCCCCCTGGAGAGTTATGAGGACATCCATGGTACCCTCCACCTGGAGAGGCTTGCCTA
TCTGCATGCCAGGCTCAGGGAGTTGCTGTGTGAGTTGGGGCGGCCCAGCATGGTCTGGCT
TAGTGCCAACCCCTGTCCTCACTGTGGGGACAGAACCTTCTATGACCCGGAGCCCATCCT
GTGCCCCTGTTTCATGCCTAACTAGCTGGGTGCACATATCAAATGCTTCATTCTGCATAC
TTGGACACTAAAGCCAGGATGTGCATGCATCTTGAAGCAACAAAGCAGCCACAGTTTCAG
ACAAATGTTCAGTGTGAGTGAGGAAAACATGTTCAGTGAGGAAAAAACATTCAGACAAAT
GTTCAGTGAGGAAAAAAAGGGGAAGTTGGGGATAGGCAGATGTTGACTTGAGGAGTTAAT
GTGATCTTTGGGGAGATACATCTTATAGAGTTAGAAATAGAATCTGAATTTCTAAAGGGA
GATTCTGGCTTGGGAAGTACATGTAGGAGTTAATCCCTGTGTAGACTGTTGTAAAGAAAC
TGTTGAAAATAAAGAGAAGCAATGTGAAGCAAAAAAAAAAAAAAAAAA
>Hs.271580_contig1
AI632869|AW338882|AW338875|AW613773|AI982899|AW193151|BE206353|BE208200|AI811548|AW264021聚腺苷酸=2聚腺苷酸=3
AACACAGCCCTACCAANCAATGATGACCAGTGGAAAACAATGAAGTCACCAAACCCTGGA
CAGGGCTCATGCTCCAGGACAANTTGCTGTGGCGTAAATGGTCCATCAGACTGGCAAAAA
TACACATCTGCCTTCCGGACTGAGAATAATGATGCTGACTATCCCTGGCCTCGTCAATGC
TGTGTTATGAACAATCTTAAAGAACCTCTCAACCTGGAGGCTTGTAAACTAGGCGTGCCT
GGTTTTTATCACAATCAGGGCTGCTATGAACTGATCTCTGGTCCAATGAACCGACACGCC
TGGGGGGTTGCCTGGTTTGGATTTGCCATTCTCTGCTGGACTTTTTGGGTTCTCCTGGGT
ACCATGTTCTACTGGAGCAGAATTGAATATTAAGCATAAAGTGTTGCCACCATACCTCCT
TCCCCGAGTGACTCTGGATTTGGTGCTGGAACCAGCTCTCTCCTAATATTCCACGTTTGT
GCCCCACACTAACGTGTGTGTCTTACATTGCCAAGTCAGATGGTACGGACTTCCTTTAGG
ATCTCAGGCTTCTGCAGTTCTCATGACTCCTACTTTTCATCCTAGTCTAGCATTCTGCAA
CATTTATATAGACTGTTGAAAGGAGAATTTGAAAAATGCATAATAACTACTTCCATCCCT
GCTTATTTTTAATTTGGGAAAATAAATACATTCGAAGGAAAAAAAAA
>Hs.69360_mRNA_2 gi|14250609|gb|BC008764.1|BC008764智人克隆MGC:1266 IMAGE:3347571聚腺苷酸=3
GGCACGAGGGCGAAATTGAGGTTTCTTGGTATTGCGCGTTTCTCTTCCTTGCTGACTCTC
CGAATGGCCATGGACTCGTCGCTTCAGGCCCGCCTGTTTCCCGGTCTCGCTATCAAGATC
CAACGCAGTAATGGTTTAATTCACAGTGCCAATGTAAGGACTGTGAACTTGGAGAAATCC
TGTGTTTCAGTGGAATGGGCAGAAGGAGGTGCCACAAAGGGCAAAGAGATTGATTTTGAT
GATGTGGCTGCAATAAACCCAGAACTCTTACAGCTTCTTCCCTTACATCCGAAGGACAAT
CTGCCCTTGCAGGAAAATGTAACAATCCAGAAACAAAAACGGAGATCCGTCAACTCCAAA
ATTCCTGCTCCAAAAGAAAGTCTTCGAAGCCGCTCCACTCGCATGTCCACTGTCTCAGAG
CTTCGCATCACGGCTCAGGAGAATGACATGGAGGTGGAGCTGCCTGCAGCTGCAAACTCC
CGCAAGCAGTTTTCAGTTCCTCCTGCCCCCACTAGGCCTTCCTGCCCTGCAGTGGCTGAA
ATACCATTGAGGATGGTCAGCGAGGAGATGGAAGAGCAAGTCCATTCCATCCGAGGCAGC
TCTTCTGCAAACCCTGTGAACTCAGTTCGGAGGAAATCATGTCTTGTGAAGGAAGTGGAA
AAAATGAAGAACAAGCGAGAAGAGAAGAAGGCCCAGAACTCTGAAATGAGAATGAAGAGA
GCTCAGGAGTATGACAGTAGTTTTCCAAACTGGGAATTTGCCCGAATGATTAAAGAATTT
CGGGCTACTTTGGAATGTCATCCACTTACTATGACTGATCCTATCGAAGAGCACAGAATA
TGTGTCTGTGTTAGGAAACGCCCACTGAATAAGCAAGAATTGGCCAAGAAAGAAATTGAT
GTGATTTCCATTCCTAGCAAGTGTCTCCTCTTGGTACATGAACCCAAGTTGAAAGTGGAC
TTAACAAAGTATCTGGAGAACCAAGCATTCTGCTTTGACTTTGCATTTGATGAAACAGCT
TCGAATGAAGTTGTCTACAGGTTCACAGCAAGGCCACTGGTACAGACAATCTTTGAAGGT
GGAAAAGCAACTTGTTTTGCATATGGCCAGACAGGAAGTGGCAAGACACATACTATGGGC
GGAGACCTCTCTGGGAAAGCCCAGAATGCATCCAAAGGGATCTATGCCATGGCCTCCCGG
GACGTCTTCCTCCTGAAGAATCAACCCTGCTACCGGAAGTTGGGCCTGGAAGTCTATGTG
ACATTCTTCGAGATCTACAATGGGAAGCTGTTTGACCTGCTCAACAAGAAGGCCAAGCTG
CGCGTGCTGGAGGACGGCAAGCAACAGGTGCAAGTGGTGGGGCTGCAGGAGCATCTGGTT
AACTCTGCTGATGATGTCATCAAGATGATCGACATGGGCAGCGCCTGCAGAACCTCTGGG
CAGACATTTGCCAACTCCAATTCCTCCCGCTCCCACGCGTGCTTCCAAATTATTCTTCGA
GCTAAAGGGAGAATGCATGGCAAGTTCTCTTTGGTAGATCTGGCAGGGAATGAGCGAGGC
GCGGACACTTCCAGTGCTGACCGGCAGACCCGCATGGAGGGCGCAGAAATCAACAAGAGT
CTCTTAGCCCTGAAGGAGTGCATCAGGGCCCTGGGACAGAACAAGGCTCACACCCCGTTC
CGTGAGAGCAAGCTGACACAGGTGCTGAGGGACTCCTTCATTGGGGAGAACTCTAGGACT
TGCATGATTGCCACGATCTCACCAGGCATAAGCTCCTGTGAATATACTTTAAACACCCTG
AGATATGCAGACAGGGTCAAGGAGCTGAGCCCCCACAGTGGGCCCAGTGGAGAGCAGTTG
ATTCAAATGGAAACAGAAGAGATGGAAGCCTGCTCTAACGGGGCGCTGATTCCAGGCAAT
TTATCCAAGGAAGAGGAGGAACTGTCTTCCCAGATGTCCAGCTTTAACGAAGCCATGACT
CAGATCAGGGAGCTGGAGGAGAAGGCTATGGAAGAGCTCAAGGAGATCATACAGCAAGGA
CCAGACTGGCTTGAGCTCTCTGAGATGACCGAGCAGCCAGACTATGACCTGGAGACCTTT
GTGAACAAAGCGGAATCTGCTCTGGCCCAGCAAGCCAAGCATTTCTCAGCCCTGCCAGAT
GTCATCAAGGCCTTGCGCCTGGCCATGCAGCTGGAAGAGCAGGCTAGCAGACAAATAAGC
AGCAAGAAACGGCCCCAGTGACGACTGCAAATAAAAATCTGTTTGGTTTGACACCCAGCC
TCTTCCCTGGCCCTCCCCAGAGAACTTTGGGTACCTGGTGGGTCTAGGCAGGGTCTGAGC
TGGGACAGGTTCTGGTAAATGCCAAGTATGGGGGCATCTGGGCCCAGGGCAGCTGGGGAG
GGGGTCAGAGTGACATGGGACACTCCTTTTCTGTTCCTCAGTTGTCGCCCTCACGAGAGG
AAGGAGCTCTTAGTTACCCTTTTGTGTTGCCCTTCTTTCCATCAAGGGGAATGTTCTCAG
CATAGAGCTTTCTCCGCAGCATCCTGCCTGCGTGGACTGGCTGCTAATGGAGAGCTCCCT
GGGGTTGTCCTGGCTCTGGGGAGAGAGACGGAGCCTTTAGTACAGCTATCTGCTGGCTCT
AAACCTTCTACGCCTTTGGGCCGAGCACTGAATGTCTTGTACTTTAAAAAAATGTTTCTG
AGACCTCTTTCTACTTTACTGTCTCCCTAGAGATCCTAGAGGATCCCTACTGTTTTCTGT
TTTATGTGTTTATACATTGTATGTAACAATAAAGAGAAAAAATAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
>Hs.30827_contig1 H07885|N39347|W85913|AA583408|W86449聚腺苷酸=2聚腺苷酸=3
ATCGGACTTCGGTNAACTNTGGCAAGGATTGGACAGNCTAGGTAGGCTAAATGTGTGCTC
TGTCCCTGTTTGCTTCAACAGAGGAGCAAGCCTCAGCTGAGAAGGAGGGCACNTGGAACA
CCTAGCTCCTCCCGTGATTCCCCAAACCCATAACATTCTTCCATAGGGCTGGAACCAGTG
CCCCGTCCTGACAGGGATGAAAAGTGAACCCCTCAGGTCAGGAGAGGCCAGAGTTGAGGT
TCTGCCACTTCCTGTCCCTGGGGAGCCACTCAAGTTACCAGGGCTACCGGCTGAAATAAA
TCTTTTCCGGGTAGGGTCAAGGGCAGTGTGTTCCAAGGCAACTGATGTAGGCCAGTTGCG
TGACTCCAGGTTTGTCCTGGTACTCAGTGGGTCCAATCACCTGGCATTGATCACCTGGCA
TTGATCAGCACCCACCCCACCCCTGAGGCTTGCCCAGCCCCCAGGCCCTCAGATCCCTGC
TCTTCCTGCCTTTCCTGCCCATGTGTCACCCAGCACCCAAGGTTCAGTGACACAGGGTGG
TTTGGAGCTGGTCACTGTCATAGCAGCTGTGATTTCACAAGGAAGGGTGCTGCAGGGGGA
CCTGGTTGATGGGGAGTGGGAAGGGGAAGGAATAAAGAGATCTTCCTCAGGTAAAAAAAA
AAAAAAAAAA
>Hs.211593_contig2
BF592799|AI570478|AA234440|R40214|BE501078|AW593784|AI184050|AI284161|W72149|AW780437|AI247981|AW241273|H60824聚腺苷酸=2聚腺苷酸=3
ACCTCGTTTGCTCCCAGTTACTTCTTATCTGGAGCAGTAATGTAGTCCACTTCACTCATG
CCTACCCCGCGTGTCTCGTCTCCTGACATGTCTCACAGACGCTCCTGAAGTTAGGTCATT
ACCTAACCCATAGTTATTTACCTTGAAAGATGGGTCTCCGCACTTGGAAAGGTTTCAAGA
CTTGATACTGCAATAAATTATGGCTCTTCACCTGGGCGCCAACTGCTGATCAACGAAATG
CTTGTTGAATCAGGGGCAAACGGAGTACAGACGTCTCAAGACTGAAACGGCCCCATTGCC
TGGTCTAGTAGCGGATCTCACTCAGCCGCAGACAAGTAATCACTAACCCGTTTTATTCTA
TTCCTATCTGTGGATGTGTAAATGGCTGGGGGGCCAGCCCTGGATAGGTTTTTATGGGAA
TTCTTTACAATAAACATAGCTTGTAACTTGAGATCTACAAATCCATTCATCCTGATTGGG
CATGAAATCCATGGTCAAGAGGACAAGTGGAAAGTGAGAGGGAAGGTTTGCTAGACACCT
TCGCTTGTTATCTTGTCAAGATAGAAAAGATAGTATCATTTCACCCTTGCCAGTAAAAAC
CTTTCCATCCACCCATTCTCAGCAGACTCCAGTATTGGCACAGTCACTCACTGCCATTCT
CACACTATAACAAGAAAAGAAATGAAGTGCATAAGTCTCCTGGGAAAAGAACCTTAACCC
CTTCTCGTGCCATGACTGGTGATTTCATGACTCATAAGCCCCTCCGTAGGCATCATTCAA
GATCAATGGCCCATGCATGCTGTTTGCAGCAGTCAATTGAGTTGAATTAGAATTCCAACC
ATACATTTTAAAGGTATTTGTGCTGTGTGTATATTTTGATAAAATGTTGTGACTTCATGG
CAAACAGGTGGATGTGTAAAAATGGAATAAAAAAAAAAAAAGAGTCAAAAAAAAAAAAAA
AATT
>Hs.155097_mRNA_1 gi|15080385|gb|BC011949.1|BC011949智人克隆MGC:9006IMAGE:3863603聚腺苷酸=3
GGCGCCCAAGCCGCCGCCGCCAGATCGGTGCCGATTCCTGCCCTGCCCCGACCGCCAGCG
CGACCATGTCCCATCACTGGGGGTACGGCAAACACAACGGACCTGAGCACTGGCATAAGG
ACTTCCCCATTGCCAAGGGAGAGCGCCAGTCCCCTGTTGACATCGACACTCATACAGCCA
AGTATGACCCTTCCCTGAAGCCCCTGTCTGTTTCCTATGATCAAGCAACTTCCCTGAGGA
TCCTCAACAATGGTCATGCTTTCAACGTGGAGTTTGATGACTCTCAGGACAAAGCAGTGC
TCAAGGGAGGACCCCTGGATGGCACTTACAGATTGATTCAGTTTCACTTTCACTGGGGTT
CACTTGATGGACAAGGTTCAGAGCATACTGTGGATAAAAAGAAATATGCTGCAGAACTTC
ACTTGGTTCACTGGAACACCAAATATGGGGATTTTGGGAAAGCTGTGCAGCAACCTGATG
GACTGGCCGTTCTAGGTATTTTTTTGAAGGTTGGCAGCGCTAAACCGGGCCTTCAGAAAG
TTGTTGATGTGCTGGATTCCATTAAAACAAAGGGCAAGAGTGCTGACTTCACAAACTTTG
CAGCTCGTGGCCTCCTTCCTGAATCCCTGGATTACTGGACCTACCCAGGCTCACTGACCA
CCCCTCCTCTTCTGGAATGTGTGACCTGGATTGTGCTCAAGGAACCCATCAGCGTCAGCA
GCGAGCAGGTGTTGAAATTCCGTAAACTTAACTTCAATGGGGAGGGTGAACCCGAAGAAC
TGATGGTGGACAACTGGCGCCCAGCTCAGCCACTGAAGAACAGGCAAATCAAAGCTTCCT
TCAAATAAGATGGTCCCATAGTCTGTATCCAAATAATGAATCTTCGGGTGTTTCCCTTTA
GCTAAGCACAGATCTACCTTGGTGATTTGGACCCTGGTTGCTTTGTGTCTAGTTTTCTAG
ACCCTTCATCTCTTACTTGATAGACTTACTAATAAAATGTGAAGACTAGACCAATTGTCA
TGCTTGACACAACTGCTGTGGCTGGTTGGTGCTTTGTTTATGGTAGTAGTTTTTCTGTAA
CACAGAATATAGGATAAGAAATAAGAATAAAGTACCTTGACTTTGTTCACAGCATGTAGG
GTGATGAGCACTCACAATTGTTGACTAAAATGCTGCCTTTAAAACATAGGAAAGTAGAAT
GGTTGAGTGCAAATCCATAGCACAAGATAAATTGAGCTAGTTAAGGCAAATCAGGTAAAA
TAGTCATGATTCTATGTAATGTAAACCAGAAAAAATAAATGTTCATGATTTCAAGATGTT
ATATTAAAGAAAAACTTTAAAAATTATTATATATTTATAGCAAAGTTATCTTAAATATGA
ATTCTGTTGTAATTTAATGACTTTTGAATTACAGAGATATAAATGAAGTATTATCTGTAA
AAATTGTTATAATTAGAGTTGTGATACAGAGTATATTTCCATTCAGACAATATATCATAA
CTTAATAAATATTGTATTTTAGATATATTCTCTAATAAAATTCAGAATTCTAAAAAAAAA
AAAAAAAA
>Hs.5163_mRNA_1 gi|15990433|gb|BC015582.1|BC015582智人克隆MGC:23280 IMAGE:4637504聚腺苷酸=3
GGCACGAGGCATGGAGGCGCTGCTGCTGGGCGCGGGGTTGCTGCTGGGCGCTTACGTGCT
TGTCTACTACAACCTGGTGAAGGCCCCGCCGTGCGGCGGCATGGGCAACCTGCGGGGCCG
CACGGCCGTGGTCACGGGTGAGTGCGGAGGCGGGTGAGTGCGAGCTGGCGGGGCGCGCGG
AGAGGAGGCCGGGCCGGCGGTAGCAGCGGCCCGCCGGGCTCAGCTCAGCTCGGCTCCCGC
CCGCGGTCCGCAGGCGCCAACAGCGGCATCGGAAAGATGACGGCGCTGGAGCTGGCGCGC
CGGGGAGCGCGCGTGGTGCTGGCCTGCCGCAGCCAGGAGCGCGGGGAGGCGGCTGCCTTC
GACCTCCGCCAGGAGAGTGGGAACAATGAGGTCATCTTCATGGCCTTGGACTTGGCCAGT
CTGGCCTCGGTGCGGGCCTTTGCCACTGCCTTTCTGAGCTCTGAGCCACGGTTGGACATC
CTCATCCACAATGCCGGTATCAGTTCCTGTGGCCGGACCCGTGAGGCGTTTAACCTGCTG
CTTCGGGTGAACCATATCGGTCCCTTTCTGCTGACACATCTGCTGCTGCCTTGCCTGAAG
GCATGTGCCCCTAGCCGCGTGGTGGTGGTAGCCTCAGCTGCCCACTGTCGGGGACGTCTT
GACTTCAAACGCCTGGACCGCCCAGTGGTGGGCTGGCGGCAGGAGCTGCGGGCATATGCT
GACACTAAGCTGGCTAATGTACTGTTTGCCCGGGAGCTCGCCAACCAGCTTGAGGCCACT
GGCGTCACCTGCTATGCAGCCCACCCAGGGCCTGTGAACTCGGAGCTGTTCCTGCGCCAT
GTTCCTGGATGGCTGCGCCCACTTTTGCGCCCATTGGCTTGGCTGGTGCTCCGGGCACCA
AGAGGGGGTGCCCAGACACCCCTGTATTGTGCTCTACAAGAGGGCATCGAGCCCCTCAGT
GGGAGATATTTTGCCAACTGCCATGTGGAAGAGGTGCCTCCAGCTGCCCGAGACGACCGG
GCAGCCCATCGGCTATGGGAGGCCAGCAAGAGGCTGGCAGGGCTTGGGCCTGGGGAGGAT
GCTGAACCCGATGAAGACCCCCAGTCTGAGGACTCAGAGGCCCCATCTTCTCTAAGCACC
CCCCACCCTGAGGAGCCCACAGTTTCTCAACCTTACCCCAGCCCTCAGAGCTCACCAGAT
TTGTCTAAGATGACGCACCGAATTCAGGCTAAAGTTGAGCCTGAGATCCAGCTCTCCTAA
CCCTCAGGCCAGGATGCTTGCCATGGCACTTCATGGTCCTTGAAAACCTCGGATGTGTGC
GAGGCCATGCCCTGGACACTGACGGGTTTGTGATCTTGACCTCCGTGGTTACTTTCTGGG
GCCCCAAGCTGTGCCCTGGACATCTCTTTTCCTGGTTGAAGGAATAATGGGTGATTATTT
CTTCCTGAGAGTGACAGTAACCCCAGATGGAGAGATAGGGGTATGCTAGACACTGTGCTT
CTCGGAAATTTGGATGTAGTATTTTCAGGCCCCACCCTTATTGATTCTGATCAGCTCTGG
AGCAGAGGCAGGGAGTTTGCAATGTGATGCACTGCCAACATTGAGAATTAGTGAACTGAT
CCCTTTGCAACCGTCTAGCTAGGTAGTTAAATTACCCCCATGTTAATGAAGCGGAATTAG
GCTCCCGAGCTAAGGGACTCGCCTAGGGTCTCACAGTGAGTAGGAGGAGGGCCTGGGATC
TGAACCCAAGGGTCTGAGGCCAGGGCCGACTGCCGTAAGATGGGTGCTGAGAAGTGAGTC
AGGGCAGGGCAGCTGGTATCGAGGTGCCCCATGGGAGTAAGGGGACGCCTTCCGGGCGGA
TGCAGGGCTGGGGTCATCTGTATCTGAAGCCCCTCGGAATAAAGCGCGTTGACCGCCAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.55150_mRNA_1 gi|17068414|gb|BC017586.1|BC017586智人克隆MGC:26610IMAGE:4837506聚腺苷酸=3
AGCGGTGGAGAAAAGGCAGAACCAGAGTAGAGATTGACAGTGAGCTGAGCCAATCAGGCT
GTGAATCTGCAGCAGTGATCCCAGGTCCTCCAATTAATACTAAGAGAGTGGACCAGGGCC
CCTGAGGAAGACAGATGGCAGGGACAGCGCGCCATGACCGAGAGATGGCGATCCAGGCCA
AGAAAAAGCTCACCACGGCCACCAACCCCATTGAAAGACTCCGACTGCAGTGCCTGGCCA
GGGGCTCTGCTGGGATCAAAGGACTTGGCAGAGTGTTTAGAATTATGGATGACGATAATA
ATCGAACCCTTGATTTTAAAGAATTTATGAAAGGGTTAAATGATTATGCTGTGGTCATGG
AAAAAGAAGAGGTGGAAGAACTTTTCCGGAGGTTTGATAAAGATGGAAATGGAACAATAG
ACTTCAATGAATTTCTTCTCACATTAAGACCTCCAATGTCCAGAGCCAGAAAAGAGGTAA
TCATGCAAGCTTTTAGAAAGTTAGACAAGACTGGAGATGGTGTTATAACAATCGAAGACC
TTCGTGAAGTATATAATGCAAAACACCACCCAAAGTACCAGAATGGGGAATGGAGTGAGG
AACAAGTATTTAGGAAATTTCTGGATAACTTTGATTCACCCTATGACAAAGATGGATTGG
TGACCCCTGAGGAGTTCATGAACTACTATGCAGGTGTGAGCGCATCCATTGACACTGATG
TGTACTTCATCATCATGATGAGAACCGCCTGGAAGCTTTAAGCACATGACCTGGGGACCA
GGCCCTGGGACAGCCATGTGGCTCCAAATGACTAAATGTCAGCTCAAAAACCAGAATCGT
ATTTGATTTCACACTCATCCTAATGTTTTTTTCTGTGTCAAAATATTGCATTTTCTGGGG
CCAAAAAACAGGCAGAAATAAAAGACATTGAGTAGTCAAAAAAAAAAAAAAAA
>Hs.170177_contig3
AI620495|AW291989|AA780896|AA976262|AI298326|BF111862|AW591523|AI922518|AI480280|BF589437|AA600354|AI886238|AA035599|H90049|BF112011|N52601|AI570965|AI565367|AW768847|H90073|BE504361|N45292|AI632075|AA679729|AW168052|AI978827|AI968410|AI669255|N45300|AI651256|AI698970|AI521256|AW078614|AI802070|AI885947|AI342534|AI653624|AW243936|T16586|R15989|AI289789|AI871636|AI718785|AW148847聚腺苷酸=2聚腺苷酸=3
TAGAGCATTAAAATAACTATCAGGCAGAAGAATCTTTCTTCTCGCCTAGGATTTCAGCCA
TGCGCGCGCTCTCTCTCTTTCTCTCTCTTTTCCTCTCTCTCCCTCTTTCTAGCCTGGGGC
TTGAATTTGCATGTCTAATTCATTTACTCACCATATTTGAATTGGCCTGAACAGATGTAA
ATCGGGAAGGATGGGAAAAACTGCAGTCATCAACAATGATTAATCAGCTGTTGCAGGCAG
TGTCTTAAGGAGACTGGTAGGAGGAGGCATGGAAACCAAAAGGCCGTGTGTTTAGAAGCC
TAATTGTCACATCAAGCATCATTGTCCCCATGCAACAACCACCACCTTATACATCACTTC
CTGTTTTAAGCAGCTCTAAAACATAGACTGAAGATTTATTTTTAATATGTTGACTTTATT
TCTGAGCAAAGCATCGGTCATGTGTGTATTTTTTCATAGTCCCACCTTGGAGCATTTATG
TAGACATTGTAAATAAATTTTGTGCAAAAAGGACTGGAAAAATGAACTGTATTATTGCAA
TTTTTTTTTGTAAAAGTAGCAGTTTGGTATGAGTTGGCATGCATACAAGATTTACTAAGT
GGGATAAGCTAATTATACTTTTTGTTGTGGATAAACAAATGCTTGTTGATAGCCTTTTTC
TATCAAGAAACCAAGGAGCTAATTATTAATAACAATCATTGCACACTGAGTCTTAGCGTT
TCTGATGGAAACAGTTTGGATTGTATAATAACGCCAAGCCCAGTTGTAGTCGTTTGAGTG
CAGTAATGAAATCTGAATCTAAAATAAAAACAAGATTATTTTTGTCAAAAAAAAAAAAAA
AAAAAAAAAA
>Hs.184601_mRNA_5 gi|4426639|gb|AF104032.1|AF104032智人 聚腺苷酸=2
GCGGCGCGCACACTGCTCGCTGGGCCGCGGCTCCCGGGTGTCCCAGGCCCGGCCGGTGCG
CAGAGCATGGCGGGTGCGGGCCCGAAGCGGCGCGCGCTAGCGGCGCCGGCGGCCGAGGAG
AAGGAAGAGGCGCGGGAGAAGATGCTGGCCGCCAAGAGCGCGGACGGCTCGGCGCCGGCA
GGCGAGGGCGAGGGCGTGACCCTGCAGCGGAACATCACGCTGCTCAACGGCGTGGCCATC
ATCGTGGGGACCATTATCGGCTCGGGCATCTTCGTGACGCCCACGGGCGTGCTCAAGGAG
GCAGGCTCGCCGGGGCTGGCGCTGGTGGTGTGGGCCGCGTGCGGCGTCTTCTCCATCGTG
GGCGCGCTCTGCTACGCGGAGCTCGGCACCACCATCTCCAAATCGGGCGGCGACTACGCC
TACATGCTGGAGGTCTACGGCTCGCTGCCCGCCTTCCTCAAGCTCTGGATCGAGCTGCTC
ATCATCCGGCCTTCATCGCAGTACATCGTGGCCCTGGTCTTCGCCACCTACCTGCTCAAG
CCGCTCTTCCCCACCTGCCCGGTGCCCGAGGAGGCAGCCAAGCTCGTGGCCTGCCTCTGC
GTGCTGCTGCTCACGGCCGTGAACTGCTACAGCGTGAAGGCCGCCACCCGGGTCCAGGAT
GCCTTTGCCGCCGCCAAGCTCCTGGCCCTGGCCCTGATCATCCTGCTGGGCTTCGTCCAG
ATCGGGAAGGGTGATGTGTCCAATCTAGATCCCAACTTCTCATTTGAAGGCACCAAACTG
GATGTGGGGAACATTGTGCTGGCATTATACAGCGGCCTCTTTGCCTATGGAGGATGGAAT
TACTTGAATTTCGTCACAGAGGAAATGATCAACCCCTACAGAAACCTGCCCCTGGCCATC
ATCATCTCCCTGCCCATCGTGACGCTGGTGTACGTGCTGACCAACCTGGCCTACTTCACC
ACCCTGTCCACCGAGCAGATGCTGTCGTCCGAGGCCGTGGCCGTGGACTTCGGGAACTAT
CACCTGGGCGTCATGTCCTGGATCATCCCCGTCTTCGTGGGCCTGTCCTGCTTCGGCTCC
GTCAATGGGTCCCTGTTCACATCCTCCAGGCTCTTCTTCGTGGGGTCCCGGGAAGGCCAC
CTGCCCTCCATCCTCTCCATGATCCACCCACAGCTCCTCACCCCCGTGCCGTCCCTCGTG
TTCACGTGTGTGATGACGCTGCTCTACGCCTTCTCCAAGGACATCTTCTCCGTCATCAAC
TTCTTCAGCTTCTTCAACTGGCTCTGCGTGGCCCTGGCCATCATCGGCATGATCTGGCTG
CGCCACAGAAAGCCTGAGCTTGAGCGGCCCATCAAGGTGAACCTGGCCCTGCCTGTGTTC
TTCATCCTGGCCTGCCTCTTCCTGATCGCCGTCTCCTTCTGGAAGACACCCGTGGAGTGT
GGCATCGGCTTCACCATCATCCTCAGCGGGCTGCCCGTCTACTTCTTCGGGGTCTGGTGG
AAAAACAAGCCCAAGTGGCTCCTCCAGGGCATCTTCTCCACGACCGTCCTGTGTCAGAAG
CTCATGCAGGTGGTCCCCCAGGAGACATAGCCAGGAGGCCGAGTGGCTGCCGGAGGAGCA
TGCGCAGAGGCCAGTTAAAGTAGATCACCTCCTCGAACCCACTCCGGTTCCCCGCAACCC
ACAGCTCAGCTGCCCATCCCAGTCCCTCGCCGTCCCTCCCAGGTCGGGCAGTGGAGGCTG
CTGTGAAAACTCTGGTACGAATCTCATCCCTCAACTGAGGGCCAGGGACCCAGGTGTGCC
TGTGCTCCTGCCCAGGAGCAGCTTTTGGTCTCCTTGGGCCCTTTTTCCCTTCCCTCCTTT
GTTTACTTATATATATATTTTTTTTAAACTTAAATTTTGGGTCAACTTGACACCACTAAG
ATGATTTTTTAAGGAGCTGGGGGAAGGCAGGAGCCTTCCTTTCTCCTGCCCCAAGGGCCC
AGACCCTGGGCAAACAGAGCTACTGAGACTTGGAACCTCATTGCTACGACAGACTTGCAC
TGAAGCCGGACAGCTGCCCAGACACATGGGCTTGTGACATTCGTGAAAACCAACCCTGTG
GGCTTATGTCTCTGCCTTAGGGTTTGCAGAGTGGAAACTCAGCCGTAGGGTGGCACTGGG
AGGGGGTGGGGGATCTGGGCAAGGTGGGTGATTCCTCTCAGGAGGTGCTTGAGGCCCCGA
TGGACTCCTGACCATAATCCTAGCCCTGAGACACCATCCTGAGCCAGGGAACAGCCCCAG
GGTTGGGGGGTGCCGGCATCTCCCCTAGCTCACCAGGCCTGGCCTCTGGGCAGTGTGGCC
TCTTGGCTATTTCTGTGTCCAGTTTTGGAGGCTGAGTTCTGGTTCATGCAGACAAAGCCC
TGTCCTTCAGTCTTCTAGAAACAGAGACAAGAAAGGCAGACACACCGCGGCCAGGCACCC
ATGTGGGCGCCCACCCTGGGCTCCACACAGCAGTGTCCCCTGCCCCAGAGGTCGCAGCTA
CCCTCAGCCTCCAATGCATTGGCCTCTGTACCGCCCGGCAGCCCCTTCTGGCCGGTGCTG
GGTTCCCACTCCCGGCCTAGGCACCTCCCCGCTCTCCCTGTCACGCTCATGTCCTGTCCT
GGTCCTGATGCCCGTTGTCTAGGAGACAGAGCCAAGCACTGCTCACGTCTCTGCCGCCTG
CGTTTGGAGGCCCCTGGGCTCTCACCCAGTCCCCACCCGCCTGCAGAGAGGGAACTAGGG
CACCCCTTGTTTCTGTTGTTCCCGTGAATTTTTTTCGCTATGGGAGGCAGCCGAGGCCTG
GCCAATGCGGCCCACTTTCCTGAGCTGTCGCTGCCTCCATGGCAGCAGCCAAGGACCCCC
AGAACAAGAAGACCCCCCCGCAGGATCCCTCCTGAGCTCGGGGGGCTCTGCCTTCTCAGG
CCCCGGGCTTCCCTTCTCCCCAGCCAGAGGTGGAGCCAAGTGGTCCAGCGTCACTCCAGT
GCTCAGCTGTGGCTGGAGGAGCTGGCCTGTGGCACAGCCCTGAGTGTCCCAAGCCGGGAG
CCAACGAAGCCGGACACGGCTTCACTGACCAGCGGCTGCTCAAGCCGCAAGCTCTCAGCA
AGTGCCCAGCGGAGCCTGCCGCCCCCACCTGGGCACCGGGACCCCCTCACCATCCAGTGG
GCCCGGAGAAACCTGATGAACAGTTTGGGGACTCAGGACCAGATGTCCGTCTCTCTTGCT
TGAGGAATGAAGACCTTTATTCACCCCTGCCCCGTTGCTTCCCGCTGCACATGGACAGAC
TTCACAGCGTCTGCTCATAGGACCTGCATCCTTCCTGGGGACGAATTCCACTCGTCCAAG
GGACAGCCCACGGTCTGGAGGCCGAGGACCACCAGCAGGCAGGTGGACTGACTGTGTTGG
GCAAGACCTCTTCCCTCTGGGCCTGTTCTCTTGGCTGCAAATAAGGACAGCAGCTGGTGC
CCCACCTGCCTGGTGCATTGCTGTGTGAATCCAGGAGGCAGTGGACATCGTAGGCAGCCA
CGGCCCCGGGTCCAGGAGAAGTGCTCCCTGGAGGCACGCACCACTGCTTCCCACTGGGGC
CGGCGGGGCCCACGCACGACGTCAGCCTCTTACCTTCCCGCCTCGGCTAGGGGTCCTCGG
GATGCCGTTCTGTTCCAACCTCCTGCTCTGGGACGTGGACATGCCTCAAGGATACAGGGA
GCCGGCGGCCTCTCGACGGCACGCACTTGCCTGTTGGCTGCTGCGGCTGTGGGCGAGCAT
GGGGGCTGCCAGCGTCTGTTGTGGAAAGTAGCTGCTAGTGAAATGGCTGGGGCCGCTGGG
GTCCGTCTTCACACTGCGCAGGTCTCTTCTGGGCGTCTGAGCTGGGGTGGGAGCTCCTCC
GCAGAAGGTTGGTGGGGGGTCCAGTCTGTGATCCTTGGTGCTGTGTGCCCCACTCCAGCC
TGGGGACCCCACTTCAGAAGGTAGGGGCCGTGTCCCGCGGTGCTGACTGAGGCCTGCTTC
CCCCTCCCCCTCCTGCTGTGCTGGAATTCCACAGGGACCAGGGCCACCGCAGGGGACTGT
CTCAGAAGACTTGATTTTTCCGTCCCTTTTTCTCCACACTCCACTGACAAACGTCCCCAG
CGGTTTCCACTTGTGGGCTTCAGGTGTTTTCAAGCACAACCCACCACAACAAGCAAGTGC
ATTTTCAGTCGTTGTGCTTTTTTGTTTTGTGCTAACGTCTTACTAATTTAAAGATGCTGT
CGGCACCATGTTTATTTATTTCCAGTGGTCATGCTCAGCCTTGCTGCTCTGCGTGGCGCA
GGTGCCATGCCTGCTCCCTGTCTGTGTCCCAGCCACGCAGGGCCATCCACTGTGACGTCG
GCCGACCAGGCTGGACACCCTCTGCCGAGTAATGACGTGTGTGGCTGGGACCTTCTTTAT
TCTGTGTTAATGGCTAACCTGTTACACTGGGCTGGGTTGGGTAGGGTGTTCTGGCTTTTT
TGTGGGGTTTTTATTTTTAAAGAAACACTCAATCATCCTAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.351972_singlet1 AA865917聚腺苷酸=2聚腺苷酸=3
GGGACTTGGAAAGGGGAACTGGGATTTGGGGAGGGGCTGGAGGACTTCCGCACGCTTCCA
CCTCCTTCGACCTCCACTGCGCCCCACCTCCCTGCCTGTGTGTGTTATTTCAAAGGAAAA
GAACAAAAGGAATAAATTTTCTAAGCTCTTTAAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.5366_mRNA_2 gi|15277845|gb|BC012926.1|BC012926智人克隆MGC:16817 IMAGE:3853503聚腺苷酸=3
GCAGGCTCTGCCTGTGGCCACTAGCAGAGAAGCTGCTGTCCTTCCACCACCAGCACCGGA
CCACCTGCTCCAAGACCAGCCTCCTGGGGGGACCAGGCACCCGGCCTTCACTGGCACCCA
GGGAGCCGTCCTCAGCAGCGTCAACATGTCAAGGCCCAGCAGCAGAGCCATTTACTTGCA
CCGGAAGGAGTACTCCCAGAACCTCACCTCAGAGCCCACCCTCCTGCAGCACAGGGTGGA
GCACTTGATGACATGCAAGCAGGGGAGTCAGAGAGTCCAGGGGCCCGAGGATGCCTTGCA
GAAGCTGTTCGAGATGGATGCACAGGGCCGGGTGTGGAGCCAAGACTTGATCCTGCAGGT
CAGGGACGGCTGGCTGCAGCTGCTGGACATTGAGACCAAGGAGGAGCTGGACTCTTACCG
CCTAGACAGCATCCAGGCCATGAATGTGGCGCTCAACACATGTTCCTACAACTCCATCCT
GTCCATCACCGTGCAGGAGCCGGGCCTGCCAGGCACTAGCACTCTGCTCTTCCAGTGCCA
GGAAGTGGGGGCAGAGCGACTGAAGACCAGCCTGCAGAAGGCTCTGGAGGAAGAGCTGGA
GCAAAGCAGACCTCGACTTGGAGGCCTTCAGCCAGGCCAGGACAGATGGAGGGGGCCTGC
TATGGAAAGGCCGCTCCCTATGGAGCAGGCACGCTATCTGGAGCCGGGGATCCCTCCAGA
ACAGCCCCACCAGAGGACCCTAGAGCACAGCCTCCCACCATCCCCAAGGCCCCTGCCACG
CCACACCAGTGCCCGAGAACCAAGTGCCTTTACTCTGCCTCCTCCAAGGCGGTCCTCTTC
CCCCGAGGACCCAGAGAGGGACGAGGAAGTGCTGAACCATGTCCTAAGGGACATTGAGCT
GTTCATGGGAAAGCTGGAGAAGGCCCAGGCAAAGACCAGCAGGAAGAAGAAATTTGGGAA
AAAAAACAAGGACCAGGGAGGTCTCACCCAGGCACAGTACATTGACTGCTTCCAGAAGAT
CAAGTACAGCTTCAACCTCCTGGGAAGGCTGGCCACCTGGCTGAAGGAGACAAGTGCCCC
TGAGCTCGTACACATCCTCTTCAAGTCCCTGAACTTCATCCTGGCCAGGTGCCCTGAGGC
TGGCCTAGCAGCCCAAGTGATCTCACCCCTCCTCACCCCTAAAGCTATCAACCTGCTACA
GTCCTGTCTAAGCCCACCTGAGAGTAACCTTTGGATGGGGTTGGGCCCAGCCTGGACCAC
TAGCCGGGCCGACTGGACAGGCGATGAGCCCCTGCCCTACCAACCCACATTCTCGGATGA
CTGGCAACTTCCAGAGCCCTCCAGCCAAGCACCCTTAGGATACCAGGACCCTGTTTCCCT
TCGGCGGGGAAGTCATAGGTTAGGGAGCACCTCACACTTTCCTCAGGAGAAGACACACAA
CCATGACCCTCAGCCTGGGGACCCCAACTCCAGGCCCTCCAGCCCCAAACCTGCCCAGCC
AGCCCTGAAAATGCAAGTCTTGTACGAGTTTGAAGCTAGGAACCCACGGGAACTGACTGT
GGTCCAGGGAGAGAAGCTGGAGGTTCTGGACCACAGCAAGCGGTGGTGGCTGGTGAAGAA
TGAGGCGGGACGGAGCGGCTACATTCCAAGCAACATCCTGGAGCCCCTACAGCCGGGGAC
CCCTGGGACCCAGGGCCAGTCACCCTCTCGGGTTCCAATGCTTCGACTTAGCTCGAGGCC
TGAAGAGGTCACAGACTGGCTGCAGGCAGAGAACTTCTCCACTGCCACGGTGAGGACACT
TGGGTCCCTGACGGGGAGCCAGCTACTTCGCATAAGACCTGGGGAGCTACAGATGCTATG
TCCACAGGAGGCCCCACGAATCCTGTCCCGGCTGGAGGCTGTCAGAAGGATGCTGGGGAT
AAGCCCTTAGGCACCAGCTTAGACACCTCCAAGAACCAGGCCCCGCTGATGCAAGATGGC
AGATCTGATACCCATTAGAGCCCCGAGAATTCCTCTTCTGGATCCCAGTTTGCAGCAAAC
CCCACACCCCAGCTCACACAGCAAAAACAATGGACAGGCCCAGAGGGTGAAGCAAACAGT
GTCCCTTCTGGCTGTGTTGGAGCCTCCCCAGTAACCACCTATTTATTTTACCTCTTTCCC
AAACCTGGAGCATTTATGCCTAGGCTTGTCAAGAATCTGTTCAGTCCCTCTCCTTCTCAA
TAAAAGCATCTTCAAGCTTGAAAAAAAAAAAAAAA
>Hs.18140_contig1
AI685931|AA410954|T97707|AA706873|AI911572|AW614616|AA548520|AW027764|BF511251|AI914294|AW151688聚腺苷酸=1聚腺苷酸=1
CCTTCCATTGAATTCCACCAGACACATTCAGGTTANCTTCGTAATGTCTTCATATGAGTA
TCAATCAACACCTTCCCCAACTCAATTGTACTAGGTTGTAGAGCACAAGGATGGTCTCGT
GCTGCTCTGTGGCACCTGTGCCTACACTGCTCTGAGCTTTGAGGAGGCTGCTCTCTTTGC
TGACCCCATGATCTTTTCTGCCCTTCTGTTAAGGGCATTGGCCACAGCAACGGGGCAAAT
GCCCCAAGCTGGCTGTAAGTGACCCATCCCTTTGGCTCCCATGATTAGACCAAGGAGAGG
CATGGGGTCCAGCTGAGCCATTCAGAACCATTCCTTAGCATTTTCCACTCAAAGGTTAGA
GATGAGATTTTCTCTTCCCAAGGCTACCTCTGGCCATGGTTCCAGCTTCATGGGGGCAAT
GGGATTAGGAAAATGAGGTCAACCTGCAAAGGAAAGCAGATGCAAGAGATGGAGACAGAA
TGGGGGTGTCCTGGGGATCTTGGAGCCTGAATTCATTGGCACAAAAGGCAGCAGCATCCT
CACTGTATCTGCAGTCCATTTGGACTCAATAAAAACTTTGAAAGTCACATGTGTTATGGA
ATTCCTTCTCAGTGACACATTCATCTGTGCTCAGTTGTCCCAGCAAGGGTCAGCCCCTCA
TACCCCTGCAGCATCCGCTGCTATGAAGCAGAGCTGTAAACGCCCTCCCTGTGTATAGGA
AAAGCTACATGGAGCAAATCCTCCTGCCTGAAGAAGTGCATCTCAGCATCACTTCAGCTG
TCGGGGCATTTGTGGGGAGAACCAGACCACCTCTGCGGAAGGCAGCAGACCCTCTTCCAG
CCATGGATGGAGTTGAATTCTCTATAAACGGTTCACCAGCAAACCACCAATACATTCCAT
TGTTTGCCTAGAGAGAAATTTAAAAATAAATAAATGTTCACTTAT
>Hs.133196_contig2
BF224381|BE467992|AW137689|AI695045|AW207361|BF445141|AA405473聚腺苷酸=2 WARN 聚腺苷酸=3
TGCGGCCGCGGCATGAAAGGCGGCGAGGAGAGGCAGCACTGCTGCTCTTGACTTCTGAGC
AGGGCTTAGAGAGCCTGCCCCGGCTTAAGCCGAGCTGCTGGTGCTGACCCTGAGCGCCGA
GTCCGCGAGCTCTGAGTCCGGAGCCTCCCAGCCGTGGAGCCGTGGGATGAGGGGGGCGTT
GGGGGACAGGGCAAAGTCGATCTTGGTTGTACAGCCGCCCGATCCTAGCGCGGAGCTGCG
AGCCTGACCGGCCGCGTCTGGCATGGTCAGAGAAAGAATTTTCTTTTCCCAACTCCGGCT
TTTGGTTTTGTGTGTCCACCTTGCGCAACTCCGGAGCCAGCCGACCCCACATGGATTCTC
AACAGGTGGCCGGCACATCTTCTGAGCCTCGCTCTCTCATCTGAAAGTGGAGTGTAAGTC
CAAGAAGATTCATTTAGACAAAGAAGGTGGAAAAAAAGGACTTTCTGGGCCAGCAAGTCG
GATGACCACCCTCCAAGGGGCAGAGGAGGGCCCATTTTGTGAAGAAGAAATCAACTACCC
GGAAAACGCCACAGGAGGACATGTTTCTGCAGATGTAGTTGCCCTAGAAACAGAAGAGTA
TGGGGGTGTGAATGTCTTCTCTTTTGGGGGCAAACACTATGTCCTTTTCTTTTTCTAGAT
ACAGTTAATTCCTGGAAATTTTAGCGAGTTTGTTCTTGTGGATATTTTGAACAATAAAGA
GTGAAAATCAAAAAAA
>Hs.63325_mRNA_5 gi|15451939|ref|NM_019894.1|智人跨膜蛋白酶,丝氨酸4 TMPRSS4),mRNA聚腺苷酸=3
CCCAATCACTCCTGGAATACACAGAGAGAGGCAGCAGCTTGCTCAGCGGACAAGGATGCT
GGGCGTGAGGGACCAAGGCCTGCCCTGCACTCGGGCCTCCTCCAGCCAGTGCTGACCAGG
GACTTCTGACCTGCTGGCCAGCCAGGACCTGTGTGGGGAGGCCCTCCTGCTGCCTTGGGG
TGACAATCTCAGCTCCAGGCTACAGGGAGACCGGGAGGATCACAGAGCCAGCATGTTACA
GGATCCTGACAGTGATCAACCTCTGAACAGCCTCGATGTCAAACCCCTGCGCAAACCCCG
TATCCCCATGGAGACCTTCAGAAAGGTGGGGATCCCCATCATCATAGCACTACTGAGCCT
GGCGAGTATCATCATTGTGGTTGTCCTCATCAAGGTGATTCTGGATAAATACTACTTCCT
CTGCGGGCAGCCTCTCCACTTCATCCCGAGGAAGCAGCTGTGTGACGGAGAGCTGGACTG
TCCCTTGGGGGAGGACGAGGAGCACTGTGTCAAGAGCTTCCCCGAAGGGCCTGCAGTGGC
AGTCCGCCTCTCCAAGGACCGATCCACACTGCAGGTGCTGGACTCGGCCACAGGGAACTG
GTTCTCTGCCTGTTTCGACAACTTCACAGAAGCTCTCGCTGAGACAGCCTGTAGGCAGAT
GGGCTACAGCAGCAAACCCACTTTCAGAGCTGTGGAGATTGGCCCAGACCAGGATCTGGA
TGTTGTTGAAATCACAGAAAACAGCCAGGAGCTTCGCATGCGGAACTCAAGTGGGCCCTG
TCTCTCAGGCTCCCTGGTCTCCCTGCACTGTCTTGCCTGTGGGAAGAGCCTGAAGACCCC
CCGTGTGGTGGGTGGGGAGGAGGCCTCTGTGGATTCTTGGCCTTGGCAGGTCAGCATCCA
GTACGACAAACAGCACGTCTGTGGAGGGAGCATCCTGGACCCCCACTGGGTCCTCACGGC
AGCCCACTGCTTCAGGAAACATACCGATGTGTTCAACTGGAAGGTGCGGGCAGGCTCAGA
CAAACTGGGCAGCTTCCCATCCCTGGCTGTGGCCAAGATCATCATCATTGAATTCAACCC
CATGTACCCCAAAGACAATGACATCGCCCTCATGAAGCTGCAGTTCCCACTCACTTTCTC
AGGCACAGTCAGGCCCATCTGTCTGCCCTTCTTTGATGAGGAGCTCACTCCAGCCACCCC
ACTCTGGATCATTGGATGGGGCTTTACGAAGCAGAATGGAGGGAAGATGTCTGACATACT
GCTGCAGGCGTCAGTCCAGGTCATTGACAGCACACGGTGCAATGCAGACGATGCGTACCA
GGGGGAAGTCACCGAGAAGATGATGTGTGCAGGCATCCCGGAAGGGGGTGTGGACACCTG
CCAGGGTGACAGTGGTGGGCCCCTGATGTACCAATCTGACCAGTGGCATGTGGTGGGCAT
CGTTAGCTGGGGCTATGGCTGCGGGGGCCCGAGCACCCCAGGAGTATACACCAAGGTCTC
AGCCTATCTCAACTGGATCTACAATGTCTGGAAGGCTGAGCTGTAATGCTGCTGCCCCTT
TGCAGTGCTGGGAGCCGCTTCCTTCCTGCCCTGCCCACCTGGGGATCCCCCAAAGTCAGA
CACAGAGCAAGAGTCCCCTTGGGTACACCCCTCTGCCCACAGCCTCAGCATTTCTTGGAG
CAGCAAAGGGCCTCAATTCCTGTAAGAGACCCTCGCAGCCCAGAGGCGCCCAGAGGAAGT
CAGCAGCCCTAGCTCGGCCACACTTGGTGCTCCCAGCATCCCAGGGAGAGACACAGCCCA
CTGAACAAGGTCTCAGGGGTATTGCTAAGCCAAGAAGGAACTTTCCCACACTACTGAATG
GAAGCAGGCTGTCTTGTAAAAGCCCAGATCACTGTGGGCTGGAGAGGAGAAGGAAAGGGT
CTGCGCCAGCCCTGTCCGTCTTCACCCATCCCCAAGCCTACTAGAGCAAGAAACCAGTTG
TAATATAAAATGCACTGCCCTACTGTTGGTATGACTACCGTTACCTACTGTTGTCATTGT
TATTACAGCTATGGCCACTATTATTAAAGAGCTGTGTAACATCAAAAAAAAAAAAAAAAA
AAAA
>Hs.250692_mRNA_2 gi|184223|gb|M95585.1|HUMHLF人肝脏白血病因子(HLF)mRNA,完整cds聚腺苷酸=3
TTTTTCAATTTTGAACATTTTGCAAAACGAGGGGTTCGAGGCAGGTGAGAGCATCCTGCA
CGTCGCCGGGGAGCCCGCGGGCACTTGGCGCGCTCTCCTGGGACCGTCTGCACTGGAAAC
CCGAAAGTTTTTTTTTAATATATATTTTTATGCAGATGTATTTATAAAGATATAAGTAAT
TTTTTTCTTCCCTTTTCTCCACCGCCTTGAGAGCGAGTACTTTTGGCAAAGGACGGAGGA
AAAGCTCAGCAACATTTTAGGGGGCGGTTGTTTCTTTCTTTCTTATTTCTTTTTTAAGGG
GAAAAAATTTGAGTGCATCGCGATGGAGAAAATGTCCCGACCGCTCCCCCTGAATCCCAC
CTTTATCCCGCCTCCCTACGGCGTGCTCAGGTCCCTGCTGGAGAACCCGCTGAAGCTCCC
CCTTCACCACGAAGACGCATTTAGTAAAGATAAAGACAAAGAAAAGAAGCTGGATGATGA
GAGTAACAGCCCGACGGTCCCCCAGTCGGCATTCCTGGGGCCTACCTTATGGGACAAAAC
CCTTCCCTATGACGGAGATACTTTCCAGTTGGAATACATGGACCTGGAGGAGTTTTTGTC
AGAAAATGGCATTCCCCCCAGCCCATCTCAGCATGACCACAGCCCTCACCCTCCTGGGCT
GCAGCCAGCTTCCTCGGCTGCCCCCTCGGTCATGGACCTCAGCAGCCGGGCCTCTGCACC
CCTTCACCCTGGCATCCCATCTCCGAACTGTATGCAGAGCCCCATCAGACCAGGTCAGCT
GTTGCCAGCAAACCGCAATACACCAAGTCCCATTGATCCTGACACCATCCAGGTCCCAGT
GGGTTATGAGCCAGACCCAGCAGATCTTGCCCTTTCCAGCATCCCTGGCCAGGAAATGTT
TGACCCTCGCAAACGCAAGTTCTCTGAGGAAGAACTGAAGCCACAGCCCATGATCAAGAA
AGCTCGCAAAGTCTTCATCCCTGATGACCTGAAGGATGACAAGTACTGGGCAAGGCGCAG
AAAGAACAACATGGCAGCCAAGCGCTCCCGCGACGCCCGGAGGCTGAAAGAGAACCAGAT
CGCCATCCGGGCCTCGTTCCTGGAGAAGGAGAACTCGGCCCTCCGCCAGGAGGTGGCTGA
CTTGAGGAAGGAGCTGGGCAAATGCAAGAACATACTTGCCAAGTATGAGGCCAGGCACGG
GCCCCTGTAGGATGGCATTTTTGCAGGCTGGCTTTGGAATAGATGGACAGTTTGTTTCCT
GTCTGATAGCACCACACGCAAACCAACCTTTCTGACATCAGCACTTTACCAGAGGCATAA
ACACAACTGACTCCCATTTTGGTGTGCATCTGTGTGTGTGTGCGTGTATATGTGCTTGTG
CTCATGTGTGTGGTCAGCGGTATGTGCGTGTGCGTGTTCCTTTGCTCTTGCCATTTTAAG
GTAGCCCTCTCATCGTCTTTTAGTTCCAACAAAGAAAGGTGCCATGTCTTTACTAGACTG
AGGAGCCCTCTCGCGGGTCTCCCATCCCCTCCCTCCTTCACTCCTGCCTCCTCAGCTTTG
CTTCATGTTCGAGCTTACCTACTCTTCCAGGACTCTCTGCTTGGATTCACTAAAAAGGGC
CCTGGTAAAATAGTGGATCTCAGTTTTTAAGAGTACAAGCTCTTGTTTCTGTTTAGTCCG
TAAGTTACCATGCTAATGAGGTGCACACAATAACTTAGCACTACTCCGCAGCTCTAGTCC
TTTATAAGTTGCTTTCCTCTTACTTTCAGTTTTGGTGATAATCGTCTTCAAATTAAAGTG
CTGTTTAGATTTATTAGATCCCATATTTACTTACTGCTATCTACTAAGTTTCCTTTTAAT
TCTACCAACCCCAGATAAGTAAGAGTACTATTAATAGAACACAGAGTGTGTTTTTGCACT
GTCTGTACCTAAAGCAATAATCCTATTGTACGCTAGAGCATGCTGCCTGAGTATTACTAG
TGGACGTAGGATATTTTCCCTACCTAAGAATTTCACTGTCTTTTAAAAAACAAAAAGTAA
AGTAATGCATTTGAGCATGGCCAGACTATTCCCTAGGACAAGGAAGCAGAGGGAAATGGG
AGGTCTAAGGATGAGGGGTTAATTTATCAGTACATGAGCCAAAAACTGCGTCTTGGATTA
GCCTTTGACATTGATGTGTTCGGTTTTGTTGTTCCCCTTCCCTCACACCCTGCCTCGCCC
CCACTTTTCTAGTTAACTTTTTCCATATCCCTCTTGACATTCAAAACAGTTACTTAAGAT
TCAGTTTTCCCACTTTTTGGTAATATATATATTTTTGTGAATTATACTTTGTTGTTTTTA
AAAAGAAAATCAGTTGATTAAGTTAATAAGTTGATGTTTTCTAAGGCCCTTTTTCCTAGT
GGTGTCATTTTTGAATGCCTCATAAATTAATGATTCTGAAGCTTATGTTTCTTATTCTCT
GTTTGCTTTTGAACGTATGTGCTCTTATAAAGTGGACTTCTGAAAAATGAATGTAAAAGA
CACTGGTGTATCTCAGAAGGGGATGGTGTTGTCACAAACTGTGGTTAATCCAATCAATTT
AAATGTTTACTATAGACCAAAAGGAGAGATTATTAAATCGTTTAATGTTTATACAGAGTA
ATTATAGGAAGTTCTTTTTTGTACAGTATTTTTCAGATATAAATACTGACAATGTATTTT
GGAAGACATATATTATATATAGAAAAGAGGAGAGGAAAACTATTCCATGTTTTAAAATTA
TATAGCAAAGATATATATTCACCAATGTTGTACAGAGAAGAAGTGCTTGGGGGTTTTTGA
AGTCTTTAATATTTTAAGCCCTATCACTGACACATCAGCATGTTTTCTGCTTTAAATTAA
AATTTTATGACAGTATCGAGGCTTGTGATGACGAATCCTGCTCTAAAATACACAAGGAGC
TTTCTTGTTTCTTATTAGGCCTCAGAAAGAAGTCAGTTAACGTCACCCAAAAGCACAAAA
TGGATTTTAGTCAAATATTTATTGGATGATACAGTGTTTTTTAGGAAAAGCATCTGCCAC
AAAAATGTTCACTTCGAAATTCTGAGTTCCTGGAATGGCACGTTGCTGCCAGTGCCCCAG
ACAGTTCTTTTCTACCCTGCGGGCCCGCACGTTTTATGAGGTTGATATCGGTGCTATGTG
TTTGGTTTATAATTTGATAGATGTTTGACTTTAAAGATGATTGTTCTTTTGTTTCATTAA
GTTGTAAAATGTCAAGAAATTCTGCTGTTACGACAAAGAAACATTTTACGCTAGATTAAA
ATATCCTTTCATCAATGGGATTTTCTAGTTTCCTGCCTTCAGAGTATCTAATCCTTTAAT
GATCTGGTGGTCTCCTCGTCAATCCATCAGCAATGCTTCTCTCATAGTGTCATAGACTTG
GGAAACCCAACCAGTAGGATATTTCTACAAGGTGTTCATTTTGTCACAAGCTGTAGATAA
CAGCAAGAGATGGGGGTGTATTGGAATTGCAATACATTGTTCAGGTGAATAATAAAATCA
AAAACTTTTGCAATCTTAAGCAGAGATAAATAAAAGATAGCAATATGAGACACAGGTGGA
CGTAGAGTTGGCCTTTTTACAGGCAAAGAGGCGAATTGTAGAATTGTTAGATGGCAATAG
TCATTAAAAACATAGAAAAATGATGTCTTTAAGTGGAGAATTGTGGAAGGATTGTAACAT
GGACCATCCAAATTTATGGCCGTATCAAATGGTAGCTGAAAAAACTATATTTGAGCACTG
GTCTCTCTTGGAATTAGATGTTTATATCAAATGAGCATCTCAAATGTTTTCTGCAGAAAA
AAATAAAAAGATTCTAATAAAAAAA
>Hs.250726_singlet4 AW298545聚腺苷酸=2聚腺苷酸=3
TTCCTTCCCTCCCTCCNTTCCTCAGGAGCCGCCAGTCCCCAAGTTGGCTGTGGTTGGGCA
CCTGGTTTGGGTCCTGCAGAGCTGGGCTCAGGCCCTGGGCTCTGAACCTGTGAACCCTTG
CTGTGTTACGAAACTTTCCTTCCTCTGAGGGCCTTGAACCCTCTCCTTTTCTTCTTTTGG
GGGTGGGGGTTAACTTTATTTTCTCTTCCCTGTATCTGCCTCTCCCTTCCCTCAATTTCC
TGTTTTAAAACTGAATGGCACGAAATTGTTTTCCTCAACTCGGAGATTCCTGTATGGAGA
GAATCAATTTCTATATTTGCAATAAATTTCTTATTTAAAGCTAAAAAAAAAAAAAAAAA
>Hs.79217_mRNA_2 gi|16306657|gb|BC001504.1|BC001504智人克隆MGC:2273 IMAGE:3505512聚腺苷酸=3
GGCACGAGGGCCATCTGTGGGGGCTTTGGGCCAGGGGTCTCCGGACAGCATGAGCGTGGG
CTTCATCGGCGCTGGCCAGCTGGCTTTTGCCCTGGCCAAGGGCTTCACAGCAGCAGGCGT
CTTGGCTGCCCACAAGATAATGGCTAGCTCCCCAGACATGGACCTGGCCACAGTTTCTGC
TCTCAGGAAGATGGGGGTGAAGTTGACACCCCACAACAAGGAGACGGTGCAGCACAGTGA
TGTGCTCTTCCTGGCTGTGAAGCCACACATCATCCCCTTCATCCTGGATGAAATAGGCGC
CGACATTGAGGACAGACACATTGTGGTGTCCTGCGCGGCCGGCGTCACCATCAGCTCCAT
TGAGAAGAAGCTGTCAGCGTTTCGGCCAGCCCCCAGGGTCATCCGCTGCATGACCAACAC
TCCAGTCGTGGTGCGGGAGGGGGCCACCGTGTATGCCACAGGCACGCACGCCCAGGTGGA
GGACGGGAGGCTCATGGAGCAGCTGCTGAGCAGCGTGGGCTTCTGCACGGAGGTGGAAGA
GGACCTGATTGATGCCGTCACGGGGCTCAGTGGCAGCGGCCCCGCCTACGCATTCACAGC
CCTGGATGCCCTGGCTGATGGGGGCGTGAAGATGGGACTTCCAAGGCGCCTGGCAGTCCG
CCTCGGGGCCCAGGCCCTCCTGGGGGCTGCCAAGATGCTGCTGCACTCAGAACAGCACCC
AGGCCAGCTCAAGGACAACGTCAGCTCTCCTGGTGGGGCCACCATCCATGCCTTGCATGT
GCTGGAGAGTGGGGGCTTCCGCTCCCTGCTCATCAACGCTGTGGAGGCCTCCTGCATCCG
CACACGGGAGCTGCAGTCCATGGCTGACCAGGAGCAGGTGTCACCAGCCGCCATCAAGAA
GACCATCCTGGACAAGGTGAAGCTGGACTCCCCTGCAGGGACCGCTCTGTCGCCTTCTGG
CCACACCAAGCTGCTCCCCCGCAGCCTGGCCCCAGCGGGCAAGGATTGACACGTCCTGCC
TGACCACCATCCTGCCACCACCTTCTCTTCTCTTGTCACTAGGGGGACTAGGGGGTCCCC
AAAGTGGCCCACTTTCTGTGGCTCTGATCAGCGCAGGGGCCAGCCAGGGACATAGCCAGG
GAGGGGCCACATCACTTCCCACTGGAAATCTCTGTGGTCTGCAAGTGCTTCCCAGCCCAG
AACAGGGGTGGATTCCCCAACCTCAACCTCCTTTCTTCTCTGCTCCCAAACCATGTCAGG
ACCACCTTCCTCTAGAGCTCGGGAGCCCGGAGGGTCTTCACCCACTCCTACTCCAGTATC
AGCTGGCACGGGCTCCTTCCTGAGAGCAAAGGTCAAGGACCCCCTCTGTGAAGGCTCAGC
AGAGGTGGGATCCCACGCCCCCTCCCGGCCCCTCCCTGCCCTCCATTCAGGGAGAAACCT
CTCCTTCCCGTGTGAGAAGGGCCAGAGGGTCCAGGCATCCCAAGTCCAGCGTGAAGGGCC
ACAGCCCCTCTTGGCTGCCAAGCACGCAGATCCCATGGACATTTGGGGAAAGGGCTCCTT
GGGCTGCTGGTGAACTTCTGTGGCCACCACCTCCTGCTCCTGACCTCCCTGGGAGGGTGC
TATCAGTTCTGTCCTGGCCCTTTCAGTTTTATAAGTTGGTTTCCAGCCCCCAGTGTCCTG
ACTTCTGTCTGCCACATGAGGAGGGAGGCCCTGCCTGTGTGGGAGGGTGGTTACTGTGGG
TGGAATAGTGGAGGCCTTCAACTGATTAGACAAGGCCCGCCCACATCTTGGAGGGCATCT
GCCTTACTGATTAAAATGTCAATGTAATCTAAAAAAAAAAAAAAAAAA
>Hs.47986_mRNA_1 gi|13279253|gb|BC004331.1|BC004331智人克隆MGC:10940IMAGE:3630835聚腺苷酸=3
GATAAATGCGGAGGGACGGTCCAGCTTTAGCTCTCTGCTCGCCGCCGCCGCTGTCGCCGC
CACCTCCTCTGATCTACGAAAGTCATGTTACCCAACACCGGGAGGCTGGCAGGATGTACA
GTTTTTATCACAGGTGCAAGCCGTGGCATTGGCAAAGCTATTGCATTGAAAGCAGCAAAG
GATGGAGCAAATATTGTTATTGCTGCAAAGACCGCCCAGCCACATCCAAAACTTCTAGGC
ACAATCTATACTGCTGCTGAAGAAATTGAAGCAGTTGGAGGAAAGGCCTTGCCATGTATT
GTTGATGTGAGAGATGAACAGCAGATCAGTGCTGCAGTGGAGAAAGCCATCAAGAAATTT
GGAGCTTATACCATTGCTAAGTATGGTATGTCTATGTATGTGCTTGGAATGGCAGAAGAA
TTTAAAGGTGAAATTGCAGTCAATGCATTATGGCCTAAAACAGCCATACACACTGCTGCT
ATGGATATGCTGGGAGGACCTGGTATCGAAAGCCAGTGTAGAAAAGTTGATATCATTGCA
GATGCAGCATATTCCATTTTCCAAAAGCCAAAAAGTTTTACTGGCAACTTTGTCATTGAT
GAAAATATCTTAAAAGAAGAAGGAATAGAAAATTTTGACGTTTATGCAATTAAACCAGGT
CATCCTTTGCAACCAGATTTCTTCTTAGATGAATACCCAGAAGCAGTTAGCAAGAAAGTG
GAATCAACTGGTGCTGTTCCAGAATTCAAAGAAGAGAAACTGCAGCTGCAACCAAAACCA
CGTTCTGGAGCTGTGGAAGAAACATTTAGAATTGTTAAGGACTCTCTCAGTGATGATGTT
GTTAAAGCCACTCAAGCAATCTATCTGTTTGAACTCTCCGGTGAAGATGGTGGCACGTGG
TTTCTTGATCTGAAAAGCAAGGGTGGGAATGTCGGATATGGAGAGCCTTCTGATCAGGCA
GATGTGGTGATGAGTATGACTACTGATGACTTTGTAAAAATGTTTTCAGGGAAACTAAAA
CCAACAATGGCATTCATGTCAGGGAAATTGAAGATTAAAGGTAACATGGCCCTAGCAATC
AAATTGGAGAAGCTAATGAATCAGATGAATGCCAGACTGTGAAGGAAAATATAAAAAAAA
AGTCGACTGCTATGCTCAAAAAGTAAAAAAAGCTCAACAGTTAAAATCTAATGTTTGTTT
TCTTTCCTGTTATATTATAAGGATATGCACGTTTGTTCTGGAAAAGATAGAATTTGTCTC
TAAAAGACTTGAAATTGTAATTAAAATGGCAAGCTAATCAAACATAAGCTTCATTAAGTG
GGATTCTAAGACAGTCTGTGTTTTTATATTTCAAGGGTTTAACCCTTTGAGCCTTACATC
TCATTCACTGTCTTTCTCCAAGAAAAGTATTTTGGGCGGACAGTCAGATCAAGCAGTAAA
ATTAGCTCTTTCAAATCTTCTTGTCATGTAAAATGAAGCTAGTCTGTTTTAAAATTTTTA
GTTTTGGATTGTATACTAATGAAAATCTTAATGATGTTTTTGATTTTTATATACTTATTT
TAAAGAAAATCTTATATAGTACATTTTACAAAAATTATAAAAAATGAATTAGTACTGGCG
AGGACTAAATGAAACAATAATTTTTCATTTTGATAACTAGCTTTCCAGGTGGACTTAGCC
ATAGGAAAATATTACTAATGTAATTTAACAAATTGCTGCATGTATTCCATTTAAAAATAT
GTTTAAATTGTCCTAAAACAAAATAATTTTCTCCCTAGGAGTATGCATTTGGCTACAGTG
TTTTGAAACAGAAACCTTAGAATAGGTCATTGGTATGGGCTGAACTGTGTATCCCCCAAT
TCATTTGTTGAGGTCCTAACTCCCATTTCTTTTGAATGTGACTGTTCGGAGATGAGGCCT
TTAAAGAGGTGACTTAAGTTCAAAGGAGGCTGTTAGTCTAATCCAACATGGTGTCCTTTG
GACATAAGAGATACCAGCAATGTGTGCACAGAACAAAGACCAGGAGAGGACACAGTGAGA
AGGCAGTTATCTGCAAGCAAAGAGAGAGGCTTCAGAAGAAACAAAATCACCAGCACCTTG
ATCTTTGACTTCTAATCTCCAGAATAGTGAGAAATAAATTTCTGTTGTTAAGCCGTCCAC
TGTGGGAGGCCGACGCAGGAGGATTGCTTGAGGCCAGGAGTTCAAGGCCAGCCTGGACAA
CATAGTAAGACCCTATCTCTACCCCCCTAATAAATTAATTTAAAAAGCCCCCCAATCTGT
GGTATTTTATTATGGCAGCCCTAGCAAGCTAATACAGTGGTTTGAGAGGCTGGGAGGGTT
GAGGGGAAGATAAACTTTTAAAAAGCTCTTATCTTTCATTTCAATCAGTTAAAAATACTT
GCTCAGTGTAACAATTTTGCTTCTCAGCTTCCACTCTAATATTGTTGTGCCATTAAGCAA
TTTAGCTAATCCTGACATTTCTTAGATTCATAATGTTAGGAGCATTTAATCTGTATTTTA
CAAGTTAGGAAGCAGAGGATCAGAGATGGGAAAGGACTAGCCCAAGGCCAACATTAACAA
GCCCTCTAACAAAAACTTTACAATACATTTATGTTGAATGGAACTCCAAGATCTCACCTC
TCCATCCAGGAATGGAGTCCATGTAATCAAAGTGAACTTAAAAATAGGACAGTTTCAACA
AGTCAGGAGATTCACAGCAACTGATCAAAGGGAGTCCAGTCAACGTGAGCAAGCGTGATT
ATGATGAGGAAGCCCCCTCTGCTTTAATCCACACAAGGAACGTAACCTGAAGTAACCTGA
TGTTAACCAATCTGCTGTGTCTACTATGCTGTTTCCTTGTTCCTGCTAGTGCTGCTTTAC
AAATGCAGACCATTCTATCATACCTGGCAGGGCTTCTGTTTTATTTTGTAGGCTGGATGC
TACCCAGTTCATGAATCGCTAATAAAAGCCAATTAGATCTTTAAAAAAAAAAAAAAAAAA
AAA
>Hs.94367_mRNA_1 gi|10440200|dbj|AK027147.1|AK027147智人cDNA:FLJ23494 fis,克隆LNG01885聚腺苷酸=3
TATTAAAAGTACCCCATGGATGGACCTCCAAATGAGTTTAGGGTAATTGCGCTTAAAATA
TTAGGACCAAAGTACATTTATTTTATAGATGGAGGAGGGGAGGAGACGAGTGGGGACCAG
CTTGACATCCAGTCTTCACCTGGACATATGGAAAGAACAAATGTGCGATCTGCTCGTTCC
CTCTGAAGGTCTCTGTTACGTATTTCCTCCTCTCCTCCAGAGCATAATAACCAATGACTG
CTCTCAGAAAGGTACTGTGACCACCACTTGCTTGGCTCTCCAACTTCCTCCCCCATTTCC
CTCTTGACTCCTGTTTGCCATAACACCTTCTGTCCCCTAGCCTTGCCTCAGGTCCCCGAC
GAATCCTGCCCTTAATCTGTGGGGGTGGTAGGTGGCACTGGTTTGAAGAGCTTACTGGAT
CTCCCTCAGTGAGTCAGCCTGGAGTTGTGTTTGAAAACCACAGGCCCTGACTGTGGCTGT
AAGACCTCCCAGACACCACCTGCTGCTGCCTATCATCATCTTCAGGTGCTGGGCTCCCCT
GTGGGCCTCGTCTGCCCGCCCTCTGCTGCAGCTGTCCCATGGGCGCCCGCCCTCTCTGAC
ACCACAAGAGAGCCCATCTAGATTCCAGGAAAAAACTCATCTTTATTTGCCTTCTTCCCA
CTGAAGGTAAAAGCAACATTAATAACCACAACAAATACTTAGTGAGTGCTTACTATTATT
CATTTAATTGTAGGCCCTTCCATCCCTGGCCATGATGAGAGACATGCCATAGCTTACTCC
TAAAGAGACCTGAGGACACACGTGCACAAACATATTGGGCATATCATCAATGGCATCAAA
ACTGATTTTCCCTGTCTACCCAGAACAGGCCTGAGGGAGAGGGAAAAGCGGATACCCACC
TGTGTCGCTGTTTGCGTGCCAAGTCCAGGAACAGTCCATACAGCCCTGCTGCATCCCACG
ACGCTGTCACAAAGCAGGAGTTCATCCGAGGCCAAGGTATGGAGAAACTGAGGCCCAGAA
ATTGATGTCCAGAATGCTTTGCTCTTAGCCACTGTACTATTATGGCATATTTTATCTTTA
TGTATTGCATCATTTCATGGATTCAAGTTTATCAATGTCCTTTGACAAGTTTAAAAATCT
GTCTGCTAAAATCTATCAAATACATTAAGGAAAAGTCCCACTTGGCACATCTCCCACACC
AGATGTTAATTATTCATACTGCATGACTGAGGATTTTGGAGGCAGAGAGAGATTCATCTG
CAATATTTGGAACACCAATGGAGGTCTATGTCAACACAGAATTTATACAGCAGCTGGTGC
TAGTCAGAGCTAATGACAGAATTTCAGTTTAATAAAAAGACCCCCAACTGAGCACACCAT
CTTGAAAAAAGTATACTTATCAAACAGCTTTCAATCAGTTCAAGAGAGACACCTTAATTG
GGGAGAGGAAGAATTGCAGAGTAGTTTGTAATCATGCCAATTCCAGATCAATAACTGCAT
GTCTGTTCTTTGGTAGAAATAGCTTTTGCTTTATATTAAGTAATCACATATATATTCTCT
CTATTTGGATAAGGAAACCTTCGCTTTATTTGACAATGTATAATGATATACTCTTCTAAT
TCACCTCTGTGTCTTCACAATAAACATGAGTAAAATTTAGACAAGTGATGGTAAAGGTCA
ATATAATTATTTATTTTTAAAATAAATTTTGTATCTAACAGGAAAGCAGTTCTTATGAAA
TTTTTATATTTTCAAAAATTGTTTTGTTCAAATAAAATTTTATGAGTAAAGTTAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
>Hs.49215_contig1
BI493248|N66529|AA452255|BI492877|AW196683|AI963900|BF478125|AI421654|BE466675聚腺苷酸=1聚腺苷酸=1
GGGTACCTGGTGGGGCCAATCACCGAGCCATGAACATCAGTAACGTACTCTAAAGACCAA
GGCTACGATGGCTATGATGGTCAGAATTACTACCACCACCAGTGAAGCTCCAGCCTGGGA
TGAATTCATCCATTCTGGCTTTGCATCCGGCTACCATTTTCGAAGTTCAACTCAGGAAGG
TGCAATATAACAAATGTGCATATTATAATGAGGAATGGTACTACCGTTCCAGATTTTCTG
TAATTGCTTCTGCAAAGTAATAGGCTTCTTGTCCCTTTTTTTTCTGGCATGTTATGGAAT
GATCATTGTAAATCAGGACCATTTATCAAGCAGTACACCAACTCATAAGATCAAATTTCA
TTGAATGGTTTGAGGTTGTAGCTCTATAAATAGTAGTTTTTAACATGCCTGTAGTATTGC
TAACTGCAAAAACATACTCTTTGTACAAGAAGTGCTTCTAAGAATTTCATTGACATTAAT
GACACTGTATACAATAAATGTGTAGTTTCTTAATCGCACTACCTATGCAACACTGTGTAT
TAGGTTTATCATCCTCATGTATTTTTATGTGACCTGTATGTATATTCTAATCTACGAGTT
TTATCACAAATAAAAATGCAATCCTTCAAA
>Hs.281587_contig2
R61469|R15891|AA007214|R61471|AI014624|N69765|AW592075|H09780|AA709038|AI335898|AI559229|F09750|R49594|H11055|T72573|AA935558|AA988654|AA826438|AI002431|AI299721聚腺苷酸=1聚腺苷酸=2
AAGGTGGGCTTTCATTGTGATTTTTGTTCTGTTGCAGTAATATAGGAGCACATTTTGGCC
ATTGTAATTACAGGGAACAAAGGGATTGCGGACACATATCTGGACTTCTTTTCCTCCCTT
ATTGTTGTGGAAGAGACACTAGAAATGCTCAAACACCTGCAATATACAGAATATACACAA
TTTTATTCCAGTATTTCCCTAACATATGGTTTAAAATTATTCCAGGTATACAGTGTATGC
AATTCTGCATTATCACAGAGGAACAACTTCTTTTTTAAAAAATAAATAGGTCAGCCATTT
TTATTAACGTGCAAAAACTTTATCACTCTAACATGCTCTAGGTAGTTGAGGAAAAGAGGT
CTGATCACTGTTTGTATTTTATTTTCTTTGTGGGAACATTTCACCTGCTGAGTGTACATG
AATTTGCTTTCTATAAAAGGCTTTTATGAGTTTACAGTAGAATCAGTGGAAGGAAGAGTT
AATAAGGGCTGTTTTTAAAAAAACAAACAAACAAACAAAACAAATAATTAAAAAAAAATT
TTACATTCCTTCCTATTCTCTAACTACACTTGGGAAGTGCACTTCAGATAAGTTTGCAGT
GTGACTGAGAGATGAAGGAAATCCATAGAAAAGGTCCTCTTAGTGAACAAAATTTAGTTA
TTAACTTTATAGCTATGAAATTTCCCCGGGCATTTGTTTTTGTTCAAACAGACTTTAACC
TCTGCATCATACTTAACCCTGCGACATGCGTACAGTATGCATATTTTGTTTTGAAAAAAA
ATGTTTCGTTCCAGTCTGTTAAGAATATTCAAAAATAATAAAGGTATTGCTTAATAAAAT
TGCTAGAATTGTTTAGCAGTACATGCACAATATTTTACTAGATTCTTTGTTTTAATAGTG
TTTTGTTGAGACTGAAAATCTTAAAATGGTCTGCGCAAATACAAAAAAAAAGAAAACACC
AAAAAAAAAA
>Hs.79378_mRNA_1 gi|16306528|ref|NM_003914.2|智人细胞周期蛋白A1(CCNA1),mRNA聚腺苷酸=3
GGTGTTGTTCCGGACACATAGAAAGATAACGACGGGAAGAGCGGGGCCCGCTTTGGGGTC
CAGGCAGGTTTTGGGGCCTCCTGTCTGGTGGGAGGAGGCCGCAGCGCAGCACCCTGCTCG
TCACTTGGGATGGAGACCGGCTTTCCCGCAATCATGTACCCTGGATCTTTTATTGGGGGC
TGGGGAGAAGAGTATCTCAGCTGGGAAGGACCGGGGCTCCCAGATTTCGTCTTCCAGCAG
CAGCCCGTGGAGTCTGAAGCAATGCACTGCAGCAACCCCAAGAGTGGAGTTGTGCTGGCT
ACAGTGGCCCGAGGTCCCGATGCTTGTCAGATACTCACCAGAGCCCCGCTGGGCCAGGAT
CCCCCGCAGAGGACAGTGCTAGGGCTGCTAACTGCAAATGGGCAGTACAGGAGGACCTGT
GGCCAGGGGATCACAAGAATCAGGTGTTATTCTGGATCAGAAAATGCCTTCCCTCCAGCT
GGAAAGAAAGCACTCCCTGACTGTGGGGTCCAAGAGCCCCCCAAGCAAGGGTTTGACATC
TACATGGATGAACTAGAGCAGGGGGACAGAGACAGCTGCTCGGTCAGAGAGGGGATGGCA
TTTGAGGATGTGTATGAAGTAGACACCGGCACACTCAAGTCAGACCTGCACTTCCTGCTG
GATTTCAACACAGTTTCCCCTATGCTGGTAGATTCATCTCTCCTCTCCCAGTCTGAAGAT
ATATCCAGTCTTGGCACAGATGTGATAAATGTGACTGAATATGCTGAAGAAATTTATCAG
TACCTTAGGGAAGCTGAAATAAGGCACAGACCCAAAGCACACTACATGAAGAAGCAGCCA
GACATCACGGAAGGCATGCGCACGATTCTGGTGGACTGGCTGGTGGAGGTTGGGGAAGAA
TATAAACTTCGAGCAGAGACCCTGTATCTGGCTGTCAACTTCCTGGACAGGTTCCTTTCA
TGTATGTCTGTTCTGAGAGGGAAACTGCAGCTCGTAGGAACAGCAGCTATGCTTTTGGCT
TCGAAATATGAAGAGATATATCCTCCTGAAGTAGACGAGTTTGTCTATATCACCGATGAT
ACATACACAAAACGACAACTGTTAAAAATGGAACACTTGCTTCTGAAAGTTCTAGCTTTT
GATCTGACAGTACCAACCACCAACCAGTTTCTCCTTCAGTACTTGAGGCGACAAGGAGTG
TGCGTCAGGACTGAGAACCTGGCTAAGTACGTAGCAGAGCTGAGTCTACTTGAAGCAGAT
CCATTCTTGAAATATCTTCCTTCACTGATAGCTGCAGCAGCTTTTTGCCTGGCAAACTAT
ACTGTGAACAAGCACTTTTGGCCAGAAACCCTTGCTGCATTTACAGGGTATTCATTAAGT
GAAATTGTGCCTTGCCTGAGTGAGCTTCATAAAGCGTACCTTGATATACCCCATCGACCT
CAGCAAGCAATTAGGGAGAAGTACAAGGCTTCAAAGTACCTGTGTGTGTCCCTCATGGAG
CCACCTGCAGTTCTTCTTCTACAATAAGTTTCTGAATGGAAGCACTTCCAGAACTTCACC
TCCATATCAGAAGTGCCAATAATCGTCATAGGCTTCTGCACGTTGGATCAACTAATGTTG
TTTACAATATAGATGACATTTTAAAAATGTAAATGAATTTAGTTTCCCTTAGACTTTAGT
AGTTTGTAATATAGTCCAACATTTTTTAAACAATAAACTGCTTGTCTTATGACAAAAAAA
AAA
>Hs.156469_contig2
AI341378|AI670817|AI701687|AI335022|AW235883|AI948598|AA446356聚腺苷酸=2聚腺苷酸=3
TCCAAGCCATTAAGGACTGTGGAACTTGCTATGATCATGGACGTGCTGTATGGTGGCGTT
TGTTATGCAGGAATTGATACAGATCCTGAGCTAAAATACCCAAAAGGTGCTGGGCGAGTT
GCTTTCTCCAATCAGCAGAGCTATATTGCTGCCATTAGTGCTCGGTTTGTTCAGCTTCAG
CATGGTGATATTGATAAACGTGTGGAGGTAAAGCCATATGTGCTAGATGACCAGATGTGT
GATGAATGCCAGGGCGCACGCTGTGGTGGAAAATTTGCTCCCTTTTTTTGTGCCAATGTC
ACTTGCCTGCAGTATTACTGTGAGTTTTGTTGGGCAAATATCCACTCTCGTGCTGGACGT
GAGTTCCATAAGCCATTGGTAAAGGAAGGTGCTGATCGCCCACGTCAGATCCACTTCCGC
TGGAACTAAGAATAGCAAACTGGCCTCTGTTTAACAAGGAAAGAAAGGGTGCATGTGGCT
TACTGTGTCTGAAGATACTGACATGCAGAAGAAATAAGTGCATTCTTCTGCTTTTCACCC
CAGCTATCAATACATGCATCTTTATCAGCAGCCAAAACACTACAAGCCTCTTGTTTTTCA
CCAAAACCCTACATCTCAGGCTTACTAATTTTTGTGATATTTTCATGTTCAAATAAAATG
TTTTTTTGTATTTTCAAAAAAAAAAAAAAAAAAAAAA
>Hs.6631_mRNA_1 gi|7020430|dbj|AK000380.1|AK000380智人cDNA FLJ20373 fis,克隆HEP19740聚腺苷酸=3
CTCGATGTAGAGGGGTTGGTAGCAGACAGGTGGTTACATTAGAATAGTCACACAAACTGT
TCAGTGTTGCAGGAACCTTTTCTTGGGGGTGGGGGAGTTTCCCTTTTCTAAAAATGCAAT
GCACTAAAACTATTTTAAGAATGTAGTTAATTCTGCTTATTCATAAAGTGGGCATCTTCT
GTGTTTTAGGTGTAATATCGAAGTCCTGGCTTTTCTCGTTTTCTCACTTGCTCTCTTGTT
CTCTGTTTTTTTAAACCAATTTTACTTTATGAATATATTCATGACATTTGTAATAAATGT
CTTGAGAAAGAATTTGTTTCATGGCTTCATGGTCATCACTCAAGCTCCCGTAAGGATATT
ACCGTCTCAGGAAAGGATCAGGACTCCATGTCACAGTCCTGCCATCTTACTTTCCTCTTG
TCGAGTTCTGAGTGGAAATAACTGCATTATGGCTGCTTTAACCTCAGTCATCAAAAGAAA
CTTGCTGTTTTTTAGGCTTGATCTTTTTCCTTTGTGGTTAATTTTCCTGTATATTGTGAA
AATGGGGGATTTTCCCTCTGCTCCCACCCACCTAAACACAGCAGCCATTTGTACCTGTTT
GCTTCCCATCCCACTTGGCACCCACTCTGACCTCTTGTCAGTTTCCTGTTCCTGGTTCCA
TCTTTTTGAAAAAGGCCCTCCTTTGAGCTACAAACATCTGGTAAGACAAGTACATCCACT
CATGAATGCAGACACAGCAGCTGGTGGTTTTGTGTATACCTGTAAAGACAAGCTGAGAGG
CTTACTTTTTGGGGAAGTAAAAGAAGATGGAAATGGATGTTTCATTTGTATGAGTTTGGA
GCAGTGCTGAAGGCCAAAGCCGCCTACTGGTTTGTAGTTAACCTAGAGAAGGTTGAAAAA
TTAATCCTACCTTTAAAGGGATTTGAGGTAGGCTGGATTCCATCGCCACAGGACTTTAGT
TAGAATTAAATTCCTGCTTGTAATTTATATCCATGTTTAGGCTTTTCATAAGATGAAACA
TGCCACAGTGAACACACTCGTGTACATATCAAGAGAAGAAGGAAAGGCACAGGTGGAGAA
CAGTAAAAGGTGGGCAGATGTCTTTGAAGAAATGCTCAATGTCTGATGCTAAGTGGGAGA
AGGCAGAGAACAAAGGATGTGGCATAATGGTCTTAACATTATCCAAAGACTTGAAGCTCC
ATGTCTGTAAGTCAAATGTTACACAAAAAAAAATGCAAATGGTGTTTCATTGGAATTACC
AAGTGCTTAGAACTTGCTGGCTTTCCCATAGGTGGTAAAGGGGTCTGAGCTCACACCGAG
TTGTGCTTGGCTTGCTTGTGCAGCTCCAGGCACCCGGTGGGCACTCTGGTGGTGTTTGTG
GTGAACTGAATTGAATCCATTGTTGGGCTTAAGTTACTGAAATTGGAACACCCTTTGTCC
TTCTCGGCGGGGGCTTCCTGGTCTGTGCTTTACTTGGCTTTTTTCCTTCCCGTCTTAGCC
TCACCCCCTTGTCAACCAGATTGAGTTGCTATAGCTTGATGCAGGGACCCAGTGAAGTTT
CTCCGTTAAAGATTGGGAGTCGTCGAAATGTTTAGATTCTTTTAGGAAAGGAATTATTTT
CCCCCCTTTTACAGGGTAGTAACTTCTCCACAGAAGTGCCAATATGGCAAAATTACACAA
GAAAACAGTATTGCAATGACACCATTACATAAGGAACATTGAACTGTTAGAGGAGTGCTC
TTCCAAACAAAACAAAAATGTCTCTAGGTTTAGTCAGAGCTTTCACAAGTAATAACCTTT
CTGTATTAAAATCAGAGTAACCCTTTCTGTATTGAGTGCAGTGTTTTTTACTCTTTTCTC
ATGCACATGTTACGTTGGAGAAAATGTTTACAAAAATGGTTTTGTTACACTAATGCGCAC
CACATATTTATGGTATATTTTAAGTGACTTTTTATGGGTTATTTAGGTTTTCGTCTTAGT
TGTAGCACACTTACCCTAATTTTGCCAATTATTAATTTGCTAAATAGTAATACAAATGAC
AACTGCATTAAATTTACTAATTATAAAAGCTGCAAGCAGACTGGTGGCAAGTACACAGCC
CTTTTTTTTGCAGTGCTAACTTGTCTACTGTGTATTATGAAAATTACTGTTGTCCCCCCA
CCCTTTTTTCCTTAAATAAAGTAAAAATGACACCCTAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
>Hs.155977_contig1 AI309080|AI313045聚腺苷酸=1 WARN聚腺苷酸=1
TATACGGCTGCTAGAAGACGACAGAAGGTGGCTTGGGGGTGGATATCTTTGGGTTGCTGG
AAAAGGTGTGGGAAGGTTCAGGATGGTGGGAGGGACTGAGGTCCCTGAGGTGAAGAGGCC
CTTGGTCCTGACGGGTTTGACCCGTGCCTGGACCCTTGGAGCAGTGTTGTGTGAACTTGC
CTAGAACTCTGCCTTCTCCGTTGTCAATAAAGCCTCCCCCTCATGACCTAAAAAAAAAAA
AAAAAAAAAAAAAAAAAGTCGTATCGA
>Hs.95197_mRNA_4 gi|5817138|emb|AL110274.1|HSM800829智人mRNA;cDNA DKFZp564I0272(来自克隆DKFZp564I0272)聚腺苷酸=3
GAGCAGGAAAATATATACCCTAAACAGAAACTCTTACTTGTTTTATGAGCAAGTCTGAGT
GAGTCCTAAAATGGCTGGCGAAGAGCTACCAATACTGACTGACAGGTCACCTTAAAGCCT
CTAGGTGTGCCAAGTTTGATTTATCTTAGGGACTAGAACCTAGTCTTCTAAATGTGATTT
TGCCTTGCTGTTTCGTCCTGATGTGAAGGTAACCACACAGAGAGATTGGGCTGCATCAGT
AATGATATGCATACCTTTCGTGCATCAGTGAGCTTCTTCCCTGTTAACTGTATGACCACA
AAATTTAGCTGGAGTAAATAAATATGCGACAGAAATCCTGGAACAAGATGGTGAAATTGC
TTAAGAATCGAGACTTCAGGGCTCAATGACCTCTGAGCATGTTTCCCAAAGTGTGACCCA
CATGACCATCTGTCTCTCAGTCTCCTGGTCCCTCCGTAGAGCTTCTGAAACTGAATCTTT
GTGGGGTGGGGGTAGCGTTCAAGAATCAAAAGTTGAACCAAGCTCTTTGGGTGATACTTA
TGTATACTGAGGTTCAGGAACTGCTGGAGAGATGACTGGGCACCAAGAGGATGACAGTGA
CTCAGCTGGCATCCCTTAGCTGGTTCATGGCAGAGCTGAGTGGGCACTCCTGTCTCTGAC
CCCAGCTTCAGTGCTCTTTATCTCCTCCATGCCTCCTCAGTCGTGCTGCTCTAAGACTGC
TTACTGGCTTTCCTTCATGTCCTGGGCACAGAGCAGTTCTTTTGGTAGCAGATTTGAGTC
CACTTCCCCCGTGCACAGATCACTGCTCAGGACCCAGAGAGGAGCAGCTCTGCTCCAGCA
GGGTTTTCCATTGCATCACACACCCAAACGGTAGGATCCAACAGTCACACTTGAAAGCAA
CCATAATTGTGAGGTTTCTGATGCTGTAGACTTCCTTACATTTCTCACAACCTAGTTAGA
GAGTCACATGGGGGTGAAGTGTGGCTCGCGACCTGCCCCAACAAGTGCGTGCAGAAGCCA
GGAAACAAAGGAGTAAATTCACTTCAAATGGGATGCACATGGTGTCCGTGATGAAGAGAC
ACATTCAGAATTGCCCAAGGACAGGAAAATGACCAGAGAGAGCCAGAGCTGAGCTGGTAA
TAAAGAGACTCCGAGACTGAGTGGAGTTAATGAGGGAAGCATGCAACGAGTGGGGCAATT
TCAGTTGGTTTCTCTCATTGCTTTAAGCGAAATGAACTATACGGACAGGAGAACAGCCTG
CTTGCCCCAGTCTCTCCTTGGCCGCCCTCTGTTGTCCCTGTCAACTCAGGTGCCCACGGT
GCTCAGAGGAGGTGCTGGCAAAGCCCCTGGAGCCTTATGTAGGCCATGGGGGCTCCTAAA
AGGAACCTGAATGAATCATTTACAGCAGGTCTCTCTTGTAAAGCCCAGCCACAGTAACTC
GTACACTGACTGTTTCAAAAGACAGCCTTTCTTAATCATTTAATTGTTTCATATTCAAAT
ATATCTCCTAATTGTTTTTATTTTTTCCTGATCTAGAAGATATGACAACAGGGTAGAACT
TGGGAAGAGGGAATAGGAAGCTCGCCCTTCCTCCTTCCCTCCTCCCCTCTCTACTTTCCT
TCCTTCCTTGGTCATCAGGTACCTTCTTTGTGCCTGCTGTTGTAGGCTACACCCTATGTT
TGGTGGAAGGCAAAAAGAAAAATCAGTAGGATACAACTCAGTAGGGAAGACAGAGATATT
CAAGCCCCTTGTCCTCCCAGTGTGATAAGTGTGGTGGTTGAGGTGTGAACAAGGGGCTCT
GTGAACAGAGAGGACGAAAGAGGAGCTCCTCCTGAGGCTGTTGGGAAAAGCATCACTGAA
GAGTGACTTTCAGAAGAAGAGAAGAAAAAGAGGAGAACATGCGTGATTTTATAATGAAAT
AGATTAGATAAGGGGAAAAAAGGCATTTAAACAAGGCAAAAAGAACAGGAGAATAGAGAA
GAGATGTGGAGGAGAAGGAGCACTGTAGTAAACACGCAGAAGGACAGGAACACTTAGACA
TGCAACCCACTCCCACCCTCCGTCTTGGGGGAGGAAAGCACACTACTGTCCCAAAGAACT
AATACTGAACCAGTGCTGCCTTGTGGAGAGAGGCATGGCCAAGGCGTTCAGAGACCTGGG
CCTGGTCCCACCGCTGCCCACAGCACTCAGCCTCTGAGCACAGCCTGGGGTCATCTGTGT
GCCCTCTGGCCAAGGCTGATGGTAGTTCTCTGAGTAATTGAGAGTCATTGCCTGTCTGTG
CAGTATTGTGAAAACAAGTCACCTTTTAACTTTAAAACTACTTTAAAAAACTTTAAAGTT
TTAAAAAAACTTCTTTAAAAACTACTCATGAGATGACAGTTTCTCTGACCCTCAGAGGAA
GGCTGGGCTGCGCATACGTGAGGAATTTTTACATGAACATCCCAGGACTTGCTGTTCGCA
GGTGATAAACTGCACCTCCCCAGGACTCCCGCTGCACTCACATGCAGCTCCCTGGACTTC
TGGTATCTGACCCGGCCCATTTCTGTGTTTCAGGGGAGAATTTGGCTTGCGGGAGTACTC
AGAAGTTAAGACGGTGACAGTAAAGATCCCCCAGAAGAACTCCTAAGAAGGCCAAGAAGG
AGGATGAAGCCCAGCCTGCACGTCTGTCCCTCTCTGCTTTCTCTGTAGGGCCCAGCTCTC
AGGAATACAAAGTTGAGCCACGGTCCTTACTTAAAGATTGAAAAGATAACATGTAGGCCA
GGCAGGTCACTGCACAACTAAAGCAAACCAGCTGGGTACAGTTTCTTGGCACTCTGTAAG
GGGCCACCTTAATCATACCAAATATTGGGGAAAGTGGGATAAAGGGAGGAGGAGGAGCTA
GCAGACACATCCAGTATCTCCTTCTGGAGCACAGGATGAAATAAGGGAGCTGTATTATTT
CATGTCTTTGTCACAAAGAACTTTCCTCTCAAGGAAAGGTGACCTTTCTCCTGTCTTCAT
TTTCCTCCTTCCAGGCCCTCCTCGCTCACCCACCCCTCCCTCTCTTCCAAGGAGATGTCA
GCTGAGCTCATTCTGGGGCAGATGTTTGGGCCGGGAACAATTTTTCAAGGTTGTAAAGCC
AAATTATCATTTCATGTTATCCATTTCTTCAAAGCAAAACATGAAATGGTTTTAGCTAGA
GTCAGACCAGAATGAAAATGCCAGGAGCTGGTACACTACAGATGTAGTAAGAACCTGGGA
TATTCCTGACCCAATCTGGTTTTCTTTTACCCATAAATAACATGAATGAAAAAAGATTGG
GACAATAGAGACTGGAAGTCATCATGTGCAGTTCACCGCTTCTGAGCTTGCTGCAGTTTT
GGGGTGTGTGTGTATTAGATTCCTTCTCAGTTATTCTGGAATAAGGCAAGGAGTGGGTTG
TTTTTCATAGCTAGATAAGATCTTTTCCAAAGTTTTTCTTAGAACCAACCAAAAAACAAT
CCGAGTAGGCCCGAGAATTTGATAATGCTGGATGCCTTGCAGACATCATTCAGTTTCTAA
TATTGGGCAACAATTATTATTAAATGAATTATTTCTGTAGTTGGAATCTGTACCTTCTGA
ACCTCTACACCAATAACTGCTGCAGGTGTGATTTTGGTCTGTCACACTGTACATCTATCA
TAATGTGCCCTGTATCTATTGGCAGTGACCTTGGAAAATCTGGCCAAGCCTAGGGGTTTC
CTTTTCCATTTGCCAAGTTCCATTGTGCCAGGACTGCCGTGCTCCACTGAGCTCCTCTGT
CACACCCCATTCTTGCCCCTCACTGGGCAGGCCATGGCCTACAGCTTGCAGGGAGTAAAG
CAGGCCCGCCTCCCTTTCTTCCCATCCACATACTCCTCTTCTGCTTTCCAGTGACTCCAC
CAGTTTGATGTGGGAAGTGTTAGCTTCCTTTCCTTCTTCCATCCCTTCTTCCATCTTTCC
AGCTGTCAAATCCAATCCAGTCTCTAACCTAAATGCAGATCATTTATTTAAAAGTACCAA
ACATAACCCAGAGTATGTGGAATATGGGCAACATATATATAGCCTTCTGTATTTAACGAT
CTTCTGCTTCTTAACCGTACCAGTTTTCTATTTATAACTCTTATCTATCCATGATGTTTT
AAAGTCTCCACTTGCTGTTATTTACAAACGACAGTGCATTCAGCAGCCCAGTGCCGTGAG
CCCTGACAGATGCCGTATTTCTGAGTGCTTCCATGTGAATGCTGCCCTCCTGTAGCATGT
GTCCAAGTGGACATAGCCACTAACCAACTAGTTACCTTTGGACTGCAACAAAAAATGTGA
AAATGAAGATTTATTTCTTTTAATTTACTTAAAAAGAAACCTCTGTGCTAGCAATAAAGC
ATTTATATTGTGCAAAAAAAAAAAAAAAAAAAAAC
>Hs.48956_contig1 N64339|AI569513|AI694073聚腺苷酸=1聚腺苷酸=1
TGAAAATTTATATAACTGTTGTTGATAAGGAACATTATCCAGGAATTGATACGTTTATTA
GGAAAAGATATTTTTATAGGCTTGGATGTTTTTAGTTCTGACTTTGAATTTATATAAAGT
ATTTTTATAATGACTGGTCTTCCTTACCTGGAAAAACATGCGATGTTAGTTTTAGAATTA
CACCACAAGTATCTAAATTTGGAACTTACAAAGGGTCTATCTTGTAAATATTGTTTTGCA
TTGTCTGTTGGCAAATTTGTGAACTGTCATGATACGCTTAAGGTGGAAAGTGTTCATTGC
ACAATATATTTTTACTGCTTTCTGAATGTAGACGGAACAGTGTGGAAGCAGAAGGCTTTT
TTAACTCATCCGTTTGCCAATCATTGCAAACAACTGAAATGTGGATGTGATTGCCTCAAT
AAAGCTCGTCCCCATTGCTTAAGCCTTCAAAAA
>Hs.118825_mRNA_10 gi|1495484|emb|X96757.1|HSSAPKK3 MAP激酶激酶的智人mRNA 聚腺苷酸=3
CTTTTAGCTGCCAGCCCTGGCCCATCATGTAGCTGCAGCACAGCCTTCCCTAACGTTGCA
ACTGGGGGAAAAATCACTTTCCAGTCTGTTTTGCAAGGTGTGCATTTCCATCTTGATTCC
CTGAAAGTCCATCTGCTGCATCGGTCAAGAGAAACTCCACTTGCATGAAGATTGCACGCC
TGCAGCTTGCATCTTTGTTGCAAAACTAGCTACAGAAGAGAAGCAAGGCAAAGTCTTTTG
TGCTCCCCTCCCCCATCAAAGGAAAGGGGAAAATGTCTCAGTCGAAAGGCAAGAAGCGAA
ACCCTGGCCTTAAAATTCCAAAAGAAGCATTTGAACAACCTCAGACCAGTTCCACACCAC
CTAGAGATTTAGACTCCAAGGCTTGCATTTCTATTGGAAATCAGAACTTTGAGGTGAAGG
CAGATGACCTGGAGCCTATAATGGAACTGGGACGAGGTGCGTACGGGGTGGTGGAGAAGA
TGCGGCACGTGCCCAGCGGGCAGATCATGGCAGTGAAGCGGATCCGAGCCACAGTAAATA
GCCAGGAACAGAAACGGCTACTGATGGATTTGGATATTTCCATGAGGACGGTGGACTGTC
CATTCACTGTCACCTTTTATGGCGCACTGTTTCGGGAGGGTGATGTGTGGATCTGCATGG
AGCTCATGGATACATCACTAGATAAATTCTACAAACAAGTTATTGATAAAGGCCAGACAA
TTCCAGAGGACATCTTAGGGAAAATAGCAGTTTCTATTGTAAAAGCATTAGAACATTTAC
ATAGTAAGCTGTCTGTCATTCACAGAGACGTCAAGCCTTCTAATGTACTCATCAATGCTC
TCGGTCAAGTGAAGATGTGCGATTTTGGAATCAGTGGCTACTTGGTGGACTCTGTTGCTA
AAACAATTGATGCAGGTTGCAAACCATACATGGCCCCTGAAAGAATAAACCCAGAGCTCA
ACCAGAAGGGATACAGTGTGAAGTCTGACATTTGGAGTCTGGGCATCACGATGATTGAGT
TGGCCATCCTTCGATTTCCCTATGATTCATGGGGAACTCCATTTCAGCAGCTCAAACAGG
TGGTAGAGGAGCCATCGCCACAACTCCCAGCAGACAAGTTCTCTGCAGAGTTTGTTGACT
TTACCTCACAGTGCTTAAAGAAGAATTCCAAAGAACGGCCTACATACCCAGAGCTAATGC
AACATCCATTTTTCACCCTACATGAATCCAAAGGAACAGATGTGGCATCTTTTGTAAAAC
TGATTCTTGGAGACTAAAAAGCAGTGGACTTAATCGGTTGACCCTACTGTGGATTGGTGG
GTTTCGGGGTGAAGCAAGTTCACTACAGCATCAATAGAAAGTCATCTTTGAGATAATTTA
ACCCTGCCTCTCAGAGGGTTTTCTCTCCCAATTTTCTTTTTACTCCCCCTCTTAAGGGGG
CCTTGGAATCTATAGTATAGAATGAACTGTCTAGATGGATGAATTATGATAAAGGCTTAG
GACTTCAAAAGGTGATTAAATATTTAATGATGTGTCATATGAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.135118_contig3
AI683181|AI082848|AW770198|AI333188|AI873435|AW169942|AI806302|AW340718|BF196955|AA909720聚腺苷酸=1聚腺苷酸=2
CAGTCCCACCATGTATTTTGCTTTGTTTCTAAAAAGCTTTTTAAAAACTGTTATTTAATA
CCAAAGGGAGGAATCGTATGGGTTCTTCTGCCCACCGTTGTGACTAAGAATGCACAGGGA
CTTGGTTCTCGTTGCACCTTTTTTTAGTAACATGTTTCATGGGGACCCACTGTACAGCCC
TTCATTCTGCTGTGTCAGTTTGGCCTGGCCTGACACTGGCTGCCCCAGCGGGGACCACGG
AAGCAGAGTGAGAGCCTTCGCTGAGTCAATGCTACCTTCAGCCCCAGACGCATCCCATTT
CCATGTCTTCCATGCTCACTGCTCATGCACTTTTTACACGGTTTCTTCCAAACAGCCCGG
TCTTGATGCAGGAGAGTCTGGAAAAGGAAGAAAATGGTTTCAGTTTCAAAATTCAAAGGA
AAAAGTTGAGGACTTATTTTGTCCTGTCAAGATTGCAAGAACATGTAAAATGTACGGAGC
TTCATAATACGTTATATTGTTCCGAAGCAGCTCGTTGAGAAACATTTGTTTTCAATAACA
TTTTAGCTTAAAAAAAAA
>Hs.171857_mRNA_1gi|13161080|gb|AF332224.1|AF332224智人睾丸蛋白mRNA,部分cds聚腺苷酸=3
TCACCTCGTGGCGTAGGGGAGAGGTAACACCGAGAAGAGGCAGCGGCGGTGGCNCAGAGA
CGATTGGTGCCAAACAGGGCAGAACGCAACTCAGCTCTGGGTTTGTGAATAGCACAATGG
AAGAAGCTGGACTTTGTGGGTTAAGAGAGAAAGCAGATATGTTGTGTAACTCTGAATCAC
ATGATATTCTTCAACATCAAGACTCAAATTGCAGTGCCACAAGTAATAAACATTTATTGG
AAGATGAAGAAGGCCGTGACTTTATAACAAAGAACAGGAGTTGGGTGAGCCCAGTGCACT
GCACACAAGAGTCAAGAAGGGAGCTTCCTGAGCAAGAAGTAGCCCCTCCGTCTGGTCAGC
AAGCTTTACAATTGCAACAGGAACAAAGAAAAAGTCTTAGGAAAAGAAGTTTTATTATTG
ATGCAAGCCCTAAACACTCTTTCCGACTCCAGAGGAGAAGCTGGCAGCTCTCTGTAAGAA
ATATGCTGATCTTGGAAATTCACCTCTTCTATAGAAGAGTTTGTTTTGAACTATACGATT
TGAAACAAAATTCTTTTTTTGGAGACTATGGAAACATTCTCAACAGGGAAACCCTACTAG
ACTTTGTAAAGCAAATAATGGAAAAGATACAGAACTTTTTGAAGAATCATGGGAAATTTT
TATAATTAAATAAATGCTAAAATTCTGTTTTGTGAAACATTTATGGGAATTATCACTGAC
AGTTTTTGTACACTTTCAAATAGTGTTAAAGCAGCAACTCCATGTTGTAAATGCACAAAA
CAAATATTTAGTTAATAATCAACTCCAAGAATAAAGCTGTAACAATAATAGTTAAAAAAA
A
>Hs.18910_mRNA_3 gi|12804464|gb|BC001639.1|BC001639智人克隆MGC:1944 IMAGE:2959372聚腺苷酸=3
GGCACGAGGGTCAGCAGCCGCCAGACTTCCTGCCGAAGTCCGAGCCCCCTCCCGGGGCTG
GAGGGGGGCAAGCGGGTTCCGAGGTGCAAAGCCTGGTGCCCCGAGCCCTGCGGAGCTCGG
GGCCAGCATGGCCCCCACGCTGCAACAGGCGTACCGGAGGCGCTGGTGGATGGCCTGCAC
GGCTGTGCTGGAGAACCTCTTCTTCTCTGCTGTACTCCTGGGCTGGGGCTCCCTGTTGAT
CATTCTGAAGAACGAGGGCTTCTATTCCAGCACGTGCCCAGCTGAGAGCAGCACCAACAC
CACCCAGGATGAGCAGCGCAGGTGGCCAGGCTGTGACCAGCAGGACGAGATGCTCAACCT
GGGCTTCACCATTGGTTCCTTCGTGCTCAGCGCCACCACCCTGCCACTGGGGATCCTCAT
GGACCGCTTTGGCCCCCGACCCGTGCGGCTGGTTGGCAGTGCCTGCTTCACTGCGTCCTG
CACCCTCATGGCCCTGGCCTCCCGGGACGTGGAAGCTCTGTCTCCGTTGATATTCCTGGC
GCTGTCCCTGAATGGCTTTGGTGGCATCTGCCTAACGTTCACTTCACTCACGCTGCCCAA
CATGTTTGGGAACCTGCGCTCCACGTTAATGGCCCTCATGATTGGCTCTTACGCCTCTTC
TGCCATTACGTTCCCAGGAATCAAGCTGATCTACGATGCCGGTGTGGCCTTCGTGGTCAT
CATGTTCACCTGGTCTGGCCTGGCCTGCCTTATCTTTCTGAACTGCACCCTCAACTGGCC
CATCGAAGCCTTTCCTGCCCCTGAGGAAGTCAATTACACGAAGAAGATCAAGCTGAGTGG
GCTGGCCCTGGACCACAAGGTGACAGGTGACCTCTTCTACACCCATGTGACCACCATGGG
CCAGAGGCTCAGCCAGAAGGCCCCCAGCCTGGAGGACGGTTCGGATGCCTTCATGTCACC
CCAGGATGTTCGGGGCACCTCAGAAAACCTTCCTGAGAGGTCTGTCCCCTTACGCAAGAG
CCTCTGCTCCCCCACTTTCCTGTGGAGCCTCCTCACCATGGGCATGACCCAGCTGCGGAT
CATCTTCTACATGGCTGCTGTGAACAAGATGCTGGAGTACCTTGTGACTGGTGGCCAGGA
GCATGAGACAAATGAACAGCAACAAAAGGTGGCAGAGACAGTTGGGTTCTACTCCTCCGT
CTTCGGGGCCATGCAGCTGTTGTGCCTTCTCACCTGCCCCCTCATTGGCTACATCATGGA
CTGGCGGATCAAGGACTGCGTGGACGCCCCAACTCAGGGCACTGTCCTCGGAGATGCCAG
GGACGGGGTTGCTACCAAATCCATCAGACCACGCTACTGCAAGATCCAAAAGCTCACCAA
TGCCATCAGTGCCTTCACCCTGACCAACCTGCTGCTTGTGGGTTTTGGCATCACCTGTCT
CATCAACAACTTACACCTCCAGTTTGTGACCTTTGTCCTGCACACCATTGTTCGAGGTTT
CTTCCACTCAGCCTGTGGGAGTCTCTATGCTGCAGTGTTCCCATCCAACCACTTTGGGAC
GCTGACAGGCCTGCAGTCCCTCATCAGTGCTGTGTTCGCCTTGCTTCAGCAGCCACTTTT
CATGGCGATGGTGGGACCCCTGAAAGGAGAGCCCTTCTGGGTGAATCTGGGCCTCCTGCT
ATTCTCACTCCTGGGATTCCTGTTGCCTTCCTACCTCTTCTATTACCGTGCCCGGCTCCA
GCAGGAGTACGCCGCCAATGGGATGGGCCCACTGAAGGTGCTTAGCGGCTCTGAGGTGAC
CGCATAGACTTCTCAGACCAAGGGACCTGGATGACAGGCAATCAAGGCCTGAGCAACCAA
AAGGAGTGCCCCATATGGCTTTTCTACCTGTAACATGCACATAGAGCCATGGCCGTAGAT
TTATAAATACCAAGAGAAGTTCTATTTTTGTAAAGACTGCAAAAAGGAGGAAAAAAAACC
TTCAAAAACGCCCCCTAAGTCAACGCTCCATTGACTGAAGACAGTCCCTATCCTAGAGGG
GTTGAGCTTTCTTCCTCCTTGGGTTGGAGGAGACCAGGGTGCCTCTTATCTCCTTCTAGC
GGTCTGCCTCCTGGTACCTCTTGGGGGGATCGGCAAACAGGCTACCCCTGAGGTCCCATG
TGCCATGAGTGTGCACACATGCATGTGTCTGTGTATGTGTGAATGTGAGAGAGACACAGC
CCTCCTTTCAGAAGGAAAGGGGCCTGAGGTGCCAGCTGTGTCCTGGGTTAGGGGTTGGGG
GTCGGCCCCTTCCAGGGCCAGGAGGGCAGGTTCCCTCTCTGGTGCTGCTGCTTGCAAGTC
TTAGAGGAAATAAAAAGGGAAGTGAGAAAAAAAAAAAAAAAAAA
>Hs.194774_mRNA_1 gi|16306633|gb|BC001492.1|BC001492智人克隆MGC:1774IMAGE:3510004聚腺苷酸=3
GGCACGAGGGAGGCGGCGGCTCCAGCCGGCGCGGCGCGAGGCTCGGCGGTGGGATCCGGC
GGGCGGTGCTAGCTCCGCGCTCCCTGCCTCGCTCGCTGCCGGGGGCGGTCGGAAGGCGCG
GCGCGAAGCCCGGGTGGCCCGAGGGCGCGATGGCTGCTCCTGTCCCGTGGGCCTGCTGTG
CTGTGCTTGCCGCCGCCGCCGCAGTTGTCTACGCCCAGAGACACAGTCCACAGGAGGCAC
CCCATGTGCAGTACGAGCGCCTGGGCTCTGACGTGACACTGCCATGTGGGACAGCAAACT
GGGATGCTGCGGTGACGTGGCGGGTAAATGGGACAGACCTGGCCCCTGACCTGCTCAACG
GCTCTCAGCTGGTGCTCCATGGCCTGGAACTGGGCCACAGTGGCCTCTACGCCTGCTTCC
ACCGTGACTCCTGGCACCTGCGCCACCAAGTCCTGCTGCATGTGGGCTTGCCGCCGCGGG
AGCCTGTGCTCAGCTGCCGCTCCAACACTTACCCCAAGGGCTTCTACTGCAGCTGGCATC
TGCCCACCCCCACCTACATTCCCAACACCTTCAATGTGACTGTGCTGCATGGCTCCAAAA
TTATGGTCTGTGAGAAGGACCCAGCCCTCAAGAACCGCTGCCACATTCGCTACATGCACC
TGTTCTCCACCATCAAGTACAAGGTCTCCATAAGTGTCAGCAATGCCCTGGGCCACAATG
CCACAGCTATCACCTTTGACGAGTTCACCATTGTGAAGCCTGATCCTCCAGAAAATGTGG
TAGCCCGGCCAGTGCCCAGCAACCCTCGCCGGCTGGAGGTGACGTGGCAGACCCCCTCGA
CCTGGCCTGACCCTGAGTCTTTTCCTCTCAAGTTCTTTCTGCGCTACCGACCCCTCATCC
TGGACCAGTGGCAGCATGTGGAGCTGTCCGACGGCACAGCACACACCATCACAGATGCCT
ACGCCGGGAAGGAGTACATTATCCAGGTGGCAGCCAAGGACAATGAGATTGGGACATGGA
GTGACTGGAGCGTAGCCGCCCACGCTACGCCCTGGACTGAGGAACCGCGACACCTCACCA
CGGAGGCCCAGGCTGCGGAGACCACGACCAGCACCACCAGCTCCCTGGCACCCCCACCTA
CCACGAAGATCTGTGACCCTGGGGAGCTGGGCAGCGGCGGGGGACCCTCGGCACCCTTCT
TGGTCAGCGTCCCCATCACTCTGGCCCTGGCTGCCGCTGCCGCCACTGCCAGCAGTCTCT
TGATCTGAGCCCGGCACCCCATGAGGACATGCAGAGCACCTGCAGAGGAGCAGGAGGCCG
GAGCTGAGCCTGCAGACCCCGGTTTCTATTTTGCACACGGGCAGGAGGACCTTTTGCATT
CTCTTCAGACACAATTTGTGGAGACCCCGGCGGGCCCGGGCCTGCCGCCCCCCAGCCCTG
CCGCACCAAGCTGGCCCTCCTTCCTCCCTCAGGGGAGGTGGGCCATGCAGCTAACCCACC
CACCAAAGACCCCCTCACCCTGGCCCCTTGGGCTGGACCCTCCAATGCCAGCGACTCCCA
GGAGCCCTTGGGGGACGTGAGGGGAGCCTCTCACATCCGATTTCTCCTCCTGCCCCAGCC
TCCTGTCTATCCCAGGGTCTCTGTTGCCACCATCAGATTATAAGCTCCTGATGCTGGGGG
GGCCCAGCCATCCCCCTCCCCCCAGCACCCACAATTTTCAGTCCCCTCCCCTCTGCCCTG
TTTTGTATACCCCTCCCCTGACCCTGCTCCTATCCCACAGTATTTAATGCCCTGTCAGTC
CCTTCTAGTCTGACTCAATGGTAACTTGCTGTATTTGAATTTTTTATAGATGTATATACA
GGGTGGGGGGAGTGGGCGGTTCTCATTAAACGTCACCATTTCATGAAAAAAAAAAAAAAA
AAA
>Hs.127428_mRNA_2 gi|16306818|gb|BC006537.1|BC006537智人克隆MGC:1934IMAGE:2987903聚腺苷酸=3
GGCACGAGGAGTTTCATAATTTCCGTGGGTCGGGCCGGGCGGGCCAGGCGCTGGGCACGG
TGATGGCCACCACTGGGGCCCTGGGCAACTACTACGTGGACTCGTTCCTGCTGGGCGCCG
ACGCCGCGGATGAGCTGAGCGTTGGCCGCTATGCGCCGGGGACCCTGGGCCAGCCTCCCC
GGCAGGCGGCGACGCTGGCCGAGCACCCCGACTTCAGCCCGTGCAGCTTCCAGTCCAAGG
CGACGGTGTTTGGCGCCTCGTGGAACCCAGTGCACGCGGCGGGCGCCAACGCTGTACCCG
CTGCGGTGTACCACCACCATCACCACCACCCCTACGTGCACCCCCAGGCGCCCGTGGCGG
CGGCGGCGCCGGACGGCAGGTACATGCGCTCCTGGCTGGAGCCCACGCCCGGTGCGCTCT
CCTTCGCGGGCTTGCCCTCCAGCCGGCCTTATGGCATTAAACCTGAACCGCTGTCGGCCA
GAAGGGGTGACTGTCCCACGCTTGACACTCACACTTTGTCCCTGACTGACTATGCTTGTG
GTTCTCCTCCAGTTGATAGAGAAAAACAACCCAGCGAAGGCGCCTTCTCTGAAAACAATG
CTGAGAATGAGAGCGGCGGAGACAAGCCCCCCATCGATCCCAATAACCCAGCAGCCAACT
GGCTTCATGCGCGCTCCACTCGGAAAAAGCGGTGCCCCTATACAAAACACCAGACCCTGG
AACTGGAGAAAGAGTTTCTGTTCAACATGTACCTCACCAGGGACCGCAGGTACGAGGTGG
CTCGACTGCTCAACCTCACCGAGAGGCAGGTCAAGATCTGGTTCCAGAACCGCAGGATGA
AAATGAAGAAAATCAACAAAGACCGAGCAAAAGACGAGTGATGCCATTTGGGCTTATTTA
GAAAAAAGGGTAAGCTAGAGAGAAAAAGAAAGAACTGTCCGTCCCCCTTCCGCCTTCTCC
CTTTTCTCACCCCCACCCTAGCCTCCACCATCCCCGCACAAAGCGGCTCTAAACCTCAGG
CCACATCTTTTCCAAGGCAAACCCTGTTCAGGCTGGCTCGTAGGCCTGCCGCTTTGATGG
AGGAGGTATTGTAAGCTTTCCATTTTCTATAAGAAAAAGGAAAAGTTGAGGGGGGGGCAT
TAGTGCTGATAGCTGTGTGTGTTAGCTTGTATATATATTTTTAAAAATCTACCTGTTCCT
GACTTAAAACAAAAGGAAAGAAACTACCTTTTTATAATGCACAACTGTTGATGGTAGGCT
GTATAGTTTTTAGTCTGTGTAGTTAATTTAATTTGCAGTTTGTGCGGCAGATTGCTCTGC
CAAGATACTTGAACACTGTGTTTTATTGTGGTAATTATGTTTTGTGATTCAAACTTCTGT
GTACTGGGTGATGCACCCATTGTGATTGTGGAAGATAGAATTCAATTTGAACTCAGGTTG
TTTATGAGGGGAAAAAAACAGTTGCATAGAGTATAGCTCTGTAGTGGAATATGTCTTCTG
TATAACTAGGCTGTTAACCTATGATTGTAAAGTAGCTGTAAGAATTTCCCAGTGAAATAA
AAAAAAATTTTAAGTGTTCTCGGGGATGCATAGATTCATCATTTTCTCCACCTTAAAAAT
GCGGGCATTTAAGTCTGTCCATTATCTATATAGTCCTGTCTTGTCTATTGTATATATAAT
CTATATGATTAAAGAAAATATGCATAATCAGACAAGCTTGAATATTGTTTTTGCACCAGA
CGAACAGTGAGGAAATTCGGAGCTATACATATGTGCAGAAGGTTACTACCTAGGGTTTAT
GCTTAATTTTAATCGGAGGAAATGAATGCTGATTGTAACGGAGTTAATTTTATTGATAAT
AAATTATACACTATGAAACCGCCATTGGGCTACTGTAGATTTGTATCCTTGATGAATCTG
GGGTTTCCATCAGACTGAACTTACACTGTATATTTTGCAATAGTTACCTCAAGGCCTACT
GACCAAATTGTTGTGTTGAGATGATATTTAACTTTTTGCCAAATAAAATATATTGATTCT
TTTCTAAAAAAAAAAAAAAAAAAAA
>Hs126852_contig1
AI802118|BF197404|BF224434|AA931964|AW236083|AI253119|AW614335|AI671372|AI793240|AW006851|AI953604|AI640505|AI633982|AW195809|AI493069|AW058576|AW293622聚腺苷酸=2聚腺苷酸=3
AAACCAGTGTATCCAGTCATGGAAAAGAAGGAGGAAGATGGCACCCTGGAGCGGGGGCAC
TGGAACAACAAGATGGAGTTTGTGCTGTCAGTGGCTGGGGAGATCATTGGCTTAGGCAAC
GTCTGGAGGTTTCCCTATCTCTGCTACAAAAATGGGGGAGGTGAGATGAGAGCCCTTGTG
CCACCCCACCCACTCCTGGAAGGAGGATACTTCCATCTCCTGCACTTACGGCCCCTCTGG
GGAGTCCCATAGATGTATAGAATTCTGGAGGTAGGAGGACGCTTGGAGGTCATTAAGGAC
ACTCTGTAAGAGACTAAGACCTAGAAAGGTTACGTGACTATCCCAGGGCTCTTTCTATTA
TAACGTGGCATCGTAGAAATATGAGCACAAGCTGGAACCAGGTGGATGAGAGTTTGGATT
CTGGCTCTGCTACTTAACACTCTGTGTGATCTTGGACAAGTTACTTAAGCTCTCAGAGCA
TCAATTGCCGCTCCTGCAAATTGAGATAATAATGCCTGCCTTTCAAGGTCATTGTAAGGA
TTAGAGACAATGTGTGTAAAGCACTTAATAAATAGTAGCTCTGCTGATGATGACGTTGAT
AACCAAACTGTTCTGTGGTCTTAAGTAATAAATAGTAGCTCTGCTGATGATGACGTTGAT
AACCAAACTGTTCTGTGGTCTTAAGTAATAAGTAGTAGCTCTGTTGATGATGACGTTGAT
AACCAAACTGTTCTGTGGTCTTAAGTAATAAGTAGTAGCTCTGCTGATGATGACGTTGAT
AACCAAACTGTTCTGTGGTCTTAAGTAATAAATAGTAGCTCTGCTGATGATGATGTTGAT
AACCAAACTGTTCTGTGGTCTTAAGTAATAAATAGTAGCTCTGCTGATGATGACGTTGAT
AACCAAACTGTTCTGTGGTCTTAAGTAATAAATAGTAGCTCTGCTGATGATGACGTTGAT
AACCAAACTGTTCTGTGGTCTTAAGTAATAAATAGTAGCTCTGCTGATGATGACGTTGAT
AAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.28149_mRNA_1 gi|14714936|gb|BC010626.1|BC010626智人克隆MGC:17687IMAGE:3865868聚腺苷酸=3
GGAAGACATCAGGATGTACCATCTGCCCTTCTGTCGGACCCCAGGGTACGTCCCATGAGC
GCGGCCGAGCTGCGTCGAGGGCAGCAGAGCGTGCTGCACTGCTCAGGGACCCGGACTCTG
CAGTTTCTCCTGCACTGTTTTCACCTTTGGCCAGACGGGCTCTGGGAAGACCTACACCCT
GACTGGACCCCCTCCCCAGGGGGAGGGGGTGCCTGTACCCCCCAGCCTGGCTGGCATCAT
GCAGAGGACCTTCGCCTGGCTGTTGGACCGCGTGCAGCACCTGGGTGCCCCTGTCACCCT
TCGCGCCTCTTATCTGGAGATCTACAATGAGCAGGTTCGGGACTTGCTGAGCCTGGGGTC
TCCCCGGCCCCTCCCTGTTCGCTGGAACAAGACTCGGGGCTTCTATGTGGAGCAGCTGCG
GGTGGTGGAATTTGGGAGTCTGGAGGCCCTGATGGAACTTTTGCAAACGGGTCTCAGCCG
TCGAAGGAACTCAGCCCACACCCTGAACCAGGCCTCCAGCCGAAGCCATGCCCTGCTCAC
CCTTTACATCAGCCGTCAAACTGCCCAGCAGATGCCTTCTGTGGACCCTGGGGAGCCCCC
TGTTGGTGGGAAGCTGTGCTTTGTGGACCTGGCAGGCAGTGAGAAGGTAGCAGCCACGGG
ATCCCGTGGGGAGCTGATGCTTGAGGCTAACAGCATCAACCGAAGCCTGCTGGCCCTGGG
TCACTGCATCTCCCTGCTGCTGGACCCACAGCGGAAGCAGAGCCACATCCCTTTCCGGGA
CAGCAAGCTCACCAAGTTGCTGGCAGACTCACTGGGAGGGCGCGGGGTCACCCTCATGGT
GGCCTGCGTGTCCCCCTCAGCCCAGTGCCTTCCTGAGACTCTCAGCACCCTGCGATATGC
AAGCCGAGCTCAGCGGGTCACCACCCGACCACAGGCCCCCAAGTCTCCTGTGGCAAAGCA
GCCCCAGCGTTTGGAGACAGAGATGCTGCAGCTCCAGGAGGAGAACCGTCGCCTGCAGTT
CCAGCTGGACCAAATGGACTGCAAGGCCTCAGGGCTCAGTGGAGCCCGGGTGGCCTGGGC
CCAGCGGAACCTGTACGGGATGCTACAGGAGTTCATGCTAGAGAATGAGAGGCTCAGGAA
AGAAAAGAGCCAGCTGCAGAATAGCCGAGACCTGGCCCAGAATGAGCAGCGCATCCTGGC
CCAGCAGGTCCATGCACTAGAGAGGCGTCTCCTCTCTGCCTGCTACCATCACCAGCAGGG
TCCTGGCCTGACCCCACCGTGTCCCTGCTTGATGGCCCCAGCTCCCCCTTGCCATGCACT
GCCACCCCTCTACTCCTGCCCCTGCTGCCACATCTGCCCACTGTGTCGAGTGCCCCTGGC
CCACTGGGCCTGCCTGCCAGGGGAGCACCACCTGCCCCAGGTGTTGGACCCTGAGGCCTC
AGGTGGCAGGCCCCCATCTGCCCGGCCCCCACCCTGGGCACCCCCATGCAGCCCTGGCTC
TGCCAAGTGCCCAAGAGAGAGGAGTCACAGTGACTGGACTCAGACCCGAGTCCTGGCAGA
GATGTTGACGGAGGAGGAGGTGGTACCTTCTGCACCTCCCCTGCCTGTGAGGCCCCCGAA
GACATCACCAGGGCTCAGAGGTGGGGCCGGGGTTCCAAACCTGGCCCAGAGACTGGAGGC
CCTCAGAGACCAGATTGGCAGCTCCCTGCGACGTGGCCGCAGCCAGCCACCCTGCAGTGA
GGGCGCACGGAGCCCAGGCCAAGTCCTCCCTCCCCATTGAAGGCCAAGTGGGAACCCAGG
AGACTGCTGTGTGACCTCAGACTGGGCTCCACACTCTTGGGCTTCAGTCTGCCCATCTGC
TGAATGGAGACAGCAGCTGCTACTCCACCTGCAGCTGGGCTAGGGGCGGGGACTGGGGGT
GCTATTTAGGGGAACAAGGGGATTCAGGAGAAACCAGGCAGCAGGGGATGAAATACATGA
ATAAAGAGAGGCATCAGCTCCAAAAAAAAAAAAAAAAAAAAAAA
>Hs.35453_mRNA_3 gi|7018494|emb AL157475.1|HSM802461智人mRNA;cDNA DKFZp761G151(来自克隆DKFZp761G151);部分cds聚腺苷酸=3
CTCCCCCTGAGAGAGGCTGGGCAGCACCCCCCTTCTGCCAGGAGTGCCAGCCAAGGTGCC
AGACCCCTGTCCAGTGGCAAGCTGGAAGGCTTTCAGAGCATCGATGAAGCTATAGCCTGG
CTCAGGAAGGAACTGACGGAGATGCGGCTGCAGGACCAGCAACTGGCCAGACAGCTCATG
CGCCTGCGTGGCGACATCAACAAGCTGAAAATCGAACACACCTGCCGCCTCCACAGGAGG
ATGCTCAACGATGCCACCTACGAGCTGGAGGAGCGGGATGAGCTGGCCGACCTCTTCTGT
GACTCCCCTCTTGCCTCCTCCTTCAGCCTCTCCACACCACTCAAGCTTATTGGCGTGACC
AAGATGAACATCAACTCTCGGAGGTTCTCTCTCTGCTGAGGAGCCCTCAGACTGGGCGGA
GGGGCTGGAGCGGAGGGCTTGGGCTGGAGGGGTGTCAGAGGAAGCTGAGGCCAAGTTACT
CCAGTGGGTCTCCCGGAGGCAGGGGTCCCTGGGACTGGCGACTCAAGGGCCCCAGGACCT
ATTCAGTGGTGCTCTCCCACCCAGGGGCCCTGGGTGTGGATGCCAGTGTCTCTGTGACTG
GCTCTTGCTTACTACCCAAAGAGCTCTGCAGAAGGGCCGCTCCAACCAAGATGTTAAAGG
AGACCTGGGTTCCCACCATAATCCATCCCTCCACGGTCACGTTCCTGTTTCCTGGAATCA
CTGGTGCTATGAACTGGGATTCCCAAAGGGAGGCCCCCCAACAAAGCTGTCATTTTTGCA
GAAGGCTGTCCCGCAAGGGCCTTGGGGGAAATTAGGCATGTCAGATGTGCCTGTCTCACG
TGCTGTTGCTGTCCTCTAAGTATTGTCTCAAATTCACCCTAAGTACATGACTCAGCAACA
TTGACAGGGAGCTACTAGGAAGGGAAAATCGAAAGGCATGACAAATGGGCACTTGGGGAC
GCAGCCCCAGTGGCTGGCAGCCAGTGTCTCTGGTGAGCCTGACACTACAAGGCTGTGTAA
ATTGTAAATTCTGGCGTGTGCTGGGACATGTGATGGGGGCACTAGCGTAGCTTGGGTGCA
ACAAGCACAGATGTCCCCATTGTCTCCCCTGGCCACATGCATCTCCAAAGAGCCTCTTCA
CTGCCACCCACACCCCAGGGTGACAGCCTGGGAGACCACTGGTGACTGAACCAGGCAGGT
CCTGAAAGCATTTTCCATAACTGAATTCTCCTGCAGGGGCGTGACCGGGGCCTCCTGGTG
GATTCTGGTGGTGTCACCTTACTGCCCTCTCTGGAAAGACAATCTAGGGAGCCCAGAGGC
CCATCCTGAGCCTCCTCTGAGATTTTGTGCCTGACCTAAACAACTAGTTTTAATAAGACT
GTTACTGATGTGTTGTTCACTTGTTAGTAACTGATTTTTGTCCAAATGCGGAAGCCACTT
GTGTAGGTCAACTACAGTGCGTAGGATTTGATTTTAAGAGTTTCTCCCTCCCAACAGGCT
TGAGGATCAGCAAGTTAAGACCCCAGCAGGTTAGGGAGGTCAGTCTGGGGTCATACGGCA
TGGCAGGGGTCCCTCGGCCAGACCCGTAGAATCCTGAGATAAGGAGTGTTTCTGACCTTT
GGTGTCATCTAGTCGAGTCCTCTCATTAGTAAAGGAGCAAAGTGAAACCTGGGGGAGGAG
AAGGACTTCCCTCAGGTTGCACAGCTGTTTAGGCTATAGAATATTGATGTGTGAAACCAT
TATTGATAATGCCTAGTAGATCACATGTCAATGAACTTGAACCCCAAAGATGGTCGTGAT
GCTTTGCCAAACCCGCACACTGCCAACCCCTCTACTCTCCACCTCAGCCCCCACCCACAT
CTCCCAGAGTATTGCAATTCAGAACATTTGGGTCAAGGTGGAGCAAGGCACTGACAGTGG
CCCCACAGGGCATGTGTCACTAATCACTGTCCCATGGTCTACGCACGGCATCTGGCTGCT
CTGTCTACTGTGACTTCTTCCTGTGTAATCTCAGTGGGGCCCGTGTCCACCCACACATCG
TGACCCACATAGGGGAGAGGTTGCTTTTCTTTTGTGGGCTGAGAGTAGGACAATGCAAAT
GAATGATCTCTAGTAGACAGAAAAGAACTTGGTCTCTTTTTTAAAATTTCAAAGAGCCAG
AAGTTCTATGCCTCCTTCAAAGTAGGCAGAACAACGCAGCCAAGATCTACTGTCTGCCAT
GCTCTGTGCAATGAAGTCTGCAGGCCTGAGGACCATGTACTGCTGTCCTTCCTCAGAGCT
CTGCACAAACACTGCCAAGTCCTGAAGACGCATTCCTTTCCTGCCAACCTCTTTCCAGAT
AAGCCCTTGAGGTCTCGGGCTGACCTACACACACACACACACACACACACACACACACAC
ACACCCCCACACACACACACACACGACAGAGAACATGCCATAAACATCCTTGAACCCATG
CAGGAAAGCCCATCCCATATTCTGAAAAAATGCCAAATTAGGTTTTTCTTTCTTTTTGGA
AATCAGTCATTACAGTAACCGAAACCATTGGGTTCAGCGAAAATGGAAAGATTTAGCTGA
ATGTAGTCAGTCCAATTAAGTTGGATGCAACTGAGTGATTTAGTTGCTTGGGTAACCCAG
TGCTTGCTTGCTTTCTTCATTCTCTGGGTGGAAACTAAGATCAAGACACATGTTTGGGGA
TAAGTTAAATGTCTGAGCTATTTTGCTCGGTTTATCCTAAGAGAACTTTATTATGGGATG
AGGAGGTGACCCAAGATGAGAAGTGGAGGGGGACAGCGATGTTTTCTAAACATCGTCCAG
TGTTGACTGGCTTCCTTACTTTGCACAGTGAACACAACTAACCACATTAATTCAGCTTTG
TGAAGTCCCTGCTCTCTGTGGGTTCTATGAGTCAGCAGCAACATTGGCCTAACCTCCGTC
CCAGCCTCCTGGCTCACCACATGTGTACAGTGCTGTTTGCAGTTGTACTCATTATCCATC
CATCTCTCTGCCATCCCCAAGCATCGCTGGGTGTAAAACGCAAACTCTCCACCGACACTG
CCATGCGTGGTCATGTCTTGATGCCTTCAGGGGCTCAGTAGCTATCAAAGAGGCCTGGAG
GGCCTGGGCAGGCTTGACGATGCCTGACCGAGTTCAAGACCCACACCCTGTAGCAATACC
AAGTGCTATTACATAATCAATGGACGATTTATACTTTTATTTTTTATGATTATTTGTTTC
TATATTGCTGTTAGAAAAAGTGAAATAAAAATACTTCAAAAGAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAGAAAAAAAAAAAAAAAAAAA
>Hs.180570_contig1 R08175|AA707224|AA699986|R11209|W89099|T98002|AA494546聚腺苷酸=2聚腺苷酸=3
TGAAGGACCGCGATCCTAAAGAGATTGAATGGGACGACCTGGCCCAGCTGCCCTTCCTGA
CCATGTGCGTGAAGGAGAGCCTGAGGTTACATCCCCCAGCTCCCTTCATCTCCCGATGCT
GCACCCAGGACATTGTTCTCCCAGATGGCCGAGTCATCCCCAAGGGCATTACCTGCCTCA
TCGATATTATAGGGGTCCATCACAACCCAACTGTGTGGCCGGATCCTGAGTCTACGACCC
CTTCCGCTTTGACCCAGAGAACAGCAAGGGGAGGTCACCTCTGGCTTTTAATTCCCTTCT
CCGCAGGGCCCAGGAACTGCATCGGGCCAGCGTTTCCCATGGCGGAGATGAAAGTGGTTC
CTGGCGTTGATGCTGCTGCACTTCCGGTTCCTGCCAGACCACACTGAGCCCCGCAGGAAG
CTGGAACTGATCATTGCGGCCGAGGGCGGGCTTTGGCTGCGGGTGGAGCCCCTGAATGTA
GGCTTGCAGTGACTTTCTGACCCATCCACCTGTTTTTTTGCAGATTGTCATGAATAAAAC
GGTGCTGTCACCTCAAAAAAAAAAAANNNAAAA
>Hs.196270_mRNA_1 gi|11545416|gb|AF283645.1|AF283645智人染色体8遗传图8q21聚腺苷酸=3
GAGTCCTCTCGTTGGTCCCGGAGGTGGGGTTGCGCTCACAAGGGGCGACCGTCGCCACGG
TGGCGGCCACTGCATCGCGTCCCACCTCCGCGGCCCTGGGCGCCGTGGTGTCGACGGGCC
CCGAGCCTATGACGGGCCAGGGCCAGTCGGCGTCCGGGTCGTCGGCGTGGAGCACGGTAT
TCCGCCACGTCCGGTATGAGAACCTGATAGCGGGCGTGAGCGGCGGCGTCTTATCCAACC
TTGCGCTGCATCCGCTCGACCTCGTGAAGATCCGCTTCGCCGTGAGTGATGGATTGGAAC
TGAGACCGAAATATAATGGAATTTTACATTGCTTGACTACCATTTGGAAACTTGATGGAC
TACGGGGACTTTATCAAGGAGTAACCCCAAATATATGGGGTGCAGGTTTATCCTGGGGAC
TCTACTTTTTCTTTTACAATGCCATCAAGTCATATAAAACAGAAGGAAGAGCTGAACATT
TAGAGGCAACAGAATACCTTGTCTCAGCTGCTGAAGCTGGAGCCATGACCCTCTGCATTA
CAAACCCATTATGGGTAACAAAAACTCGCCTTATGTTACAGTATGATGCTGTTGTTAACT
CCCCACACCGACAATATAAAGGAATGTTTGATACACTTGTGAAAATATATAAGTATGAAG
GTGTGCGTGGATTATATAAGGGATTTGTTCCTGGGCTGTTTGGAACATCGCATGGTGCCC
TTCAGTTTATGGCATATGAATTGCTGAAGTTGAAGTACAACCAGCATATCAATAGATTAC
CAGAAGCCCAGTTGAGCACAGTAGAATATATATCTGTTGCAGCACTATCCAAAATATTTG
CTGTCGCAGCAACATACCCATATCAAGTCGTAAGAGCTCGTCTTCAGGATCAACACATGT
TTTACAGTGGTGTAATAGATGTAATCACAAAGACATGGAGGAAAGAAGGCGTCGGTGGAT
TTTACAAGGGAATTGCTCCTAATTTGATTAGAGTGACTCCAGCCTGCTGTATTACCTTTG
TGGTATATGAAAACGTCTCACATTTTTTACTTGACCTTAGAGAAAAGAGAAAGTAAGCTC
AAAGAGGACAATTCCAGTATATCTGCCCAAGGCAGCAACAAGCTCTTTTGTGTTTAAGGC
ATAAAAGAAGAATTCTGCATAGAAACATGGCTCATATTCGAAATTGCTCTATAGTCATTA
GAAGCCAGAGAACTGCTAAGTCTCCTGCAATGTTTTTCTTGCTTTTTGCCTTCCCCATAT
ATATGGAACTTGGCTACCTCTGCCTGAAATGGCTGCCATCAACACAATGTTAAAACTGAC
ACGAAGGATAGAGTTTCACAGATTTCTACGTTTTATTGGTGGAAGCTGATTTGCAACATT
TGCTAAATGGATTAGATGAATGTACTTCTTTTTGTGAGCTTACTTGCCTGGATTGCTTTA
AAATTAACCTTTGTGCAATACCAAGAAAATAGCTCTTTAAAAGAATGTCTTTGTATGTCT
CAAGGTAAATTAAGGATTTACTGAATAAGGTGTTGACCAAATCCAGACCATTTTATTTTA
TTTTTTTATTTATTTATTTTTTGAGATGGAGTCTTGCTTTGTCGCCCAGGCTGGAGTGCA
GTGGCGTGATCTCAGCTCACTGCAACCTCCACCTCCCGGGTTCACGCCATTCTCCTGCCT
CAGCCTCCTGAGTAGCTGGGACTACAGGCACCTGCCACCACGCCTGGCTAACTTTTTTTT
ATATTTTGAGTAGAAATGGGGTTTCACCATGTTAGCCAGGATGGTCTCAATCTCCTGACC
TTGTGATCCGCCTGCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACTGCGC
CTGGCCAGACCATTTTAGAATTGGGAAATTTTAGTGAGAAAAAATGCACTGTAAATATGC
TTTAGTTTTAATTCAGTTGGGATGCACTACCTAGCGAAAATTGAGAAACTATATACTTCT
CAGAGAAATATCTGACATCTATTGTCATTCCATTGCTATTTTTTTTCCCCAGAGACTTCC
ATAATTTAAAATAAAATCCTAGATCCAGTTCTTGTTTTTTGGCATAAATACTTAATCTAT
TTTAAATTTATAAAATCTGAGCTTCTAGGATCCAGCTGTGTCAACCTTTATTTAGCATAT
ATAACTATAAATCACTTATTACAGATGCTAAATAGATCACCTTTTACAGATGCTGAAATG
TTTGGGATATGTTTGTTGACAAGGTAAATGGAAATGAGAAACTTTATACTTCAGTTTTCA
GATATATGGATCTAGATCCCAAATAAATGATTAATCTTCATTGGTTTCTCAAATTCAGGT
TGAAATACAAATTAATAGCCTTTATTGATTTTACTTTTATGAGTCATTGTAGACATCTAT
AAATATAAAAGGGCCTGTACCCAAAGGATGCCAGAATACTAGTATTTTTATTTATCGTAA
ACATCCACGAGTGCTGTTGCACTACCATCTATTTGTTGTAAATAAAAGTGTTGTTTTCAA
AAAAAAAAAAAAAA
>Hs.9030_mRNA_3 gi|12652600|gb|BC000045.1|BC000045智人克隆MGC:2032 IMAGE:3504527聚腺苷酸=3
CTAGAGGGGCGGAAAGTAACAAGGAGGTGGGGGTACAAATCCTCAGCTCCTGCTTCCGCA
AGCACTAACCTGCTCTGAAGTGAGCCAGGCAGCTCTGGCCATCTTTTCCCAGCCACAGAA
TCAGGTGATGGTCCAGAATTAAGAGCTGTCACCTGTGTCATTCACTCACAATGGAAGAAA
TGAAGAAGACTGCCATCCGGCTGCCCAAAGGCAAACAGAAGCCTATAAAGACGGAATGGA
ATTCCCGGTGTGTCCTTTTCACCTACTTCCAAGGGGACATCAGCAGCGTAGTGGATGAAC
ACTTCTCCAGAGCTCTGAGCAATATCAAGAGCCCCCAGGAATTGACCCCCTCGAGTCAGA
GTGAAGGTGTGATGCTGAAAAACGATGATAGCATGTCTCCAAATCAGTGGCGTTACTCGT
CTCCATGGACAAAGCCACAACCAGAAGTACCTGTCACAAACCGTGCCGCCAACTGCAACT
TGCATGTGCCTGGTCCCATGGCTGTGAATCAGTTCTCACCGTCCCTGGCTAGGAGGGCCT
CTGTTCGGCCTGGGGAGCTGTGGCATTTCTCCTCCCTGGCGGGCACCAGCTCCTTAGAGC
CTGGCTACTCTCATCCCTTCCCCGCTCGGCACCTGGTTCCAGAGCCCCAGCCTGATGGGA
AACGTGAGCCTCTCCTAAGTCTCCTCCAGCAAGACAGATGCCTAGCCCGTCCTCAGGAAT
CTGCCGCCAGGGAGAATGGCAACCCTGGCCAGATAGCTGGAAGCACAGGGTTGCTCTTCA
ACCTGCCTCCCGGCTCAGTTCACTATAAGAAACTATATGTATCTCGTGGATCTGCCAGTA
CCAGCCTTCCAAATGAAACTCTTTCAGAGTTAGAGACACCTGGGAAATACTCACTTACAC
CACCAAACCACTGGGGCCACCCACATCGATACCTGCAGCATCTTTAGTCAAGTTGGAGGA
GAAAGACAACACTTGGTCTAAGACACGGCAGCAAGACATCCCTGCATATTGTTCCAGATA
AAAATGAAAGCTGCTCACACCCACTTGCCTCCCCAATCTGTTAAACAGCTTCGTGTCTAG
TATGAGCTCAGTACTTGCCCTGTGAAAATCCCAGAAGCCCCCGCTGTCAATGTTCCCCAT
CCACACCCTGCTTGCTCCTGTGTAACAGCTCAGATGATGAATAATAATAAAACTGTACTT
TTTTGGATGGTGAAAAAAAAAAAAAAAAAAAA
>Hs.1282_mRNA_3 gi|4559405|ref|NM_000065.1|智人互补组件6(C6),mRNA聚腺苷酸=1
TTGCCTTGTGTTAGCTAGCAATAAGAAAAGAAGCTTTGTTTGGATTAACATATATACCCT
CTTCATTCTGCATACCTATTTTTTCCCCAATAATTTGCAGCTTAGGTCCGAGGACACCAC
AAACTCTGCTTAAAGGGCCTGGAGGCTCTCAAGGCATGGCCAGACGCTCTGTCTTGTACT
TCATCCTGCTGAATGCTCTGATCAACAAGGGCCAAGCCTGCTTCTGTGATCACTATGCAT
GGACTCAGTGGACCAGCTGCTCAAAAACTTGCAATTCTGGAACCCAGAGCAGACACAGAC
AAATAGTAGTAGATAAGTACTACCAGGAAAACTTTTGTGAACAGATTTGCAGCAAGCAGG
AGACTAGAGAATGTAACTGGCAAAGATGCCCCATCAACTGCCTCCTGGGAGATTTTGGAC
CATGGTCAGACTGTGACCCTTGTATTGAAAAACAGTCTAAAGTTAGATCTGTCTTGCGTC
CCAGTCAGTTTGGGGGACAGCCATGCACTGAGCCTCTGGTAGCCTTTCAACCATGCATTC
CATCTAAGCTCTGCAAAATTGAAGAGGCTGACTGCAAGAATAAATTTCGCTGTGACAGTG
GCCGCTGCATTGCCAGAAAGTTAGAATGCAATGGAGAAAATGACTGTGGAGACAATTCAG
ATGAAAGGGACTGTGGGAGGACAAAGGCAGTATGCACACGGAAGTATAATCCCATCCCTA
GTGTACAGTTGATGGGCAATGGGTTTCATTTTCTGGCAGGAGAGCCCAGAGGAGAAGTCC
TTGATAACTCTTTCACTGGAGGAATATGTAAAACTGTCAAAAGCAGTAGGACAAGTAATC
CATACCGTGTTCCGGCCAATCTGGAAAATGTCGGCTTTGAGGTACAAACTGCAGAAGATG
ACTTGAAAACAGATTTCTACAAGGATTTAACTTCTCTTGGACACAATGAAAATCAACAAG
GCTCATTCTCAAGTCAGGGGGGGAGCTCTTTCAGTGTACCAATTTTTTATTCCTCAAAGA
GAAGTGAAAATATCAACCATAATTCTGCCTTCAAACAAGCCATTCAAGCCTCTCACAAAA
AGGATTCTAGTTTTATTAGGATCCATAAAGTGATGAAAGTCTTAAACTTCACAACGAAAG
CTAAAGATCTGCACCTTTCTGATGTCTTTTTGAAAGCACTTAACCATCTGCCTCTAGAAT
ACAACTCTGCTTTGTACAGCCGAATATTCGATGACTTTGGGACTCATTACTTCACCTCTG
GCTCCCTGGGAGGCGTGTATGACCTTCTCTATCAGTTTAGCAGTGAGGAACTAAAGAACT
CAGGTTTAACCGAGGAAGAAGCCAAACACTGTGTCAGGATTGAAACAAAGAAACGCGTTT
TATTTGCTAAGAAAACAAAAGTGGAACATAGGTGCACCACCAACAAGCTGTCAGAGAAAC
ATGAAGGTTCATTTATACAGGGAGCAGAGAAATCCATATCCCTGATTCGAGGTGGAAGGA
GTGAATATGGAGCAGCTTTGGCATGGGAGAAAGGGAGCTCTGGTCTGGAGGAGAAGACAT
TTTCTGAGTGGTTAGAATCAGTGAAGGAAAATCCTGCTGTGATTGACTTTGAGCTTGCCC
CCATCGTGGACTTGGTAAGAAACATCCCCTGTGCAGTGACAAAACGGAACAACCTCAGGA
AAGCTTTGCAAGAGTATGCAGCCAAGTTCGATCCTTGCCAGTGTGCTCCATGCCCTAATA
ATGGCCGACCCACCCTCTCAGGGACTGAATGTCTGTGTGTGTGTCAGAGTGGCACCTATG
GTGAGAACTGTGAGAAACAGTCTCCAGATTATAAATCCAATGCAGTAGACGGACAGTGGG
GTTGTTGGTCTTCCTGGAGTACCTGTGATGCTACTTATAAGAGATCGAGAACCCGAGAAT
GCAATAATCCTGCCCCCCAACGAGGAGGGAAACGCTGTGAGGGGGAGAAGCGACAAGAGG
AAGACTGCACATTTTCAATCATGGAAAACAATGGACAACCATGTATCAATGATGATGAAG
AAATGAAAGAGGTCGATCTTCCTGAGATAGAAGCAGATTCCGGGTGTCCTCAGCCAGTTC
CTCCAGAAAATGGATTTATCCGGAATGAAAAGCAACTATACTTGGTTGGAGAAGATGTTG
AAATTTCATGCCTTACTGGCTTTGAAACTGTTGGATACCAGTACTTCAGATGCTTACCAG
ACGGGACCTGGAGACAAGGGGATGTGGAATGCCAACGGACGGAGTGCATCAAGCCAGTTG
TGCAGGAAGTCCTGACAATTACACCATTTCAGAGATTGTATAGAATTGGTGAATCCATTG
AGCTAACTTGCCCCAAAGGCTTTGTTGTTGCTGGGCCATCAAGGTACACATGCCAGGGGA
ATTCCTGGACACCACCCATTTCAAACTCTCTCACCTGTGAAAAAGATACTCTAACAAAAT
TAAAAGGCCATTGTCAGCTGGGACAGAAACAATCAGGATCTGAATGCATTTGTATGTCTC
CAGAAGAAGACTGTAGCCATCATTCAGAAGATCTCTGTGTGTTTGACACAGACTCCAACG
ATTACTTTACTTCACCCGCTTGTAAGTTTTTGGCTGAGAAATGTTTAAATAATCAGCAAC
TCCATTTTCTACATATTGGTTCCTGCCAAGACGGCCGCCAGTTAGAATGGGGTCTTGAAA
GGACAAGACTTTCATCCAACAGCACAAAGAAAGAATCCTGTGGCTATGACACCTGCTATG
ACTGGGAAAAATGTTCAGCCTCCACTTCCAAATGTGTCTGCCTATTGCCCCCACAGTGCT
TCAAGGGTGGAAACCAACTCTACTGTGTCAAAATGGGATCATCAACAAGTGAGAAAACAT
TGAACATCTGTGAAGTGGGAACTATAAGATGTGCAAACAGGAAGATGGAAATACTGCATC
CTGGAAAGTGTTTGGCCTAGCACAATTACTGCTAGGCCCAGCACAATGAACAGATTTACC
ATCCCGAAGAACCAACTCCTACAAATGAGAATTCTTGCACAAACAGCAGACTGGCATGCT
CAAAGTTACTGACAAAAATTATTTTCTGTTAGTTTGAGATCATTATTCTCCCCTGACTCT
CCTGTTTGGGCATGTCTTATTCAGTTCCAGCTCATGACGCCCTGTAGCATACCCCTAGGT
ACCAACTTCCACAGCAGTCTCGTAAATTCTCCTGTTCACATTGTACAAAAATAATGTGAC
TTCTGAGGCCCTTATGTAGCCTGTGACATTAAGCATTCTCACAATTAGAAATAAGAATAA
AACCCATAATTTTCTTCAATGAGTTAATAAACAGAAATCTCCAGAACCTCTGAAACACAT
TCTTGAAGCCCAGCTTTCATATCTTCATTCAACAAATAATTTCTGAGTGTGTATACAGGA
TGTCAAGTACTGACCAAAGTCCTGAGAACTCGGCAGATAATAAAACAGACAAAAGCCTTT
GCCTTCATGAAGCATACATTCATTCAGGGGTAGACACACAAAAAATGAAATAAACAGGTA
AAATATGTAGC
>Hs.268562_mRNA_2 gi|15341874|gb|BC013117.1|BC013117智人克隆MGC:8711IMAGE:3882749聚腺苷酸=3
CTCTCCTCGCCCGCTGGGTGCTGAAGTTGGGCGGATGGCAGCAAACCGGCTCCGCTAGAG
GACCGAGCCGCCCAGCCCCGCTCCCCCGGACCCATCGGCGCGCTGCCCACACCTCCAGGC
GACCGGCCAACTGGGTCCTGAAGTAGCTGAAATGCGAAAAAGGCAGCAGTCCCAAAATGA
AGGAACACCTGCCGTGTCTCAAGCTCCTGGAAACCAGAGGCCCAACAACACCTGTTGCTT
TTGTTGGTGCTGTTGTTGCAGCTGCTCCTGCCTCACTGTGAGGAATGAAGAAAGAGGGGA
AAATGCGGGAAGACCCACACACACTACAAAAATGGAGAGTATCCAGGTCCTAGAGGAATG
CCAAAACCCCACTGCAGAGGAAGTCTTGTCCTGGTCTCAAAATTTTGACAAGATGATGAA
GGCCCCAGCAGGAAGAAACCTTTTCAGAGAGTTCCTCCGAACAGAATACAGTGAAGAGAA
CCTACTTTTCTGGCTTGCTTGTGAAGACTTAAAGAAGGAGCAGAACAAAAAAGTAATTGA
AGAAAAGGCTAGGATGATATATGAAGATTACATTTCTATACTATCACCAAAAGAGGTCAG
TCTTGATTCTCGAGTTAGAGAGGTGATCAATAGAAATCTGTTGGATCCCAATCCTCACAT
GTATGAAGATGCCCAACTTCAGATATATACTTTAATGCACAGAGATTCTTTTCCAAGGTT
TTTGAACTCTCAAATTTATAAGTCATTTGTTGAAAGTACTGCTGGCTCTTCTTCTGAATC
TTAATGTTCATTTAAAAACAATCATTTTGGAGGGCTGAGATGGGAAATAAAAGTAGTTAA
ATAACATCAGAAACTGAGTTCCTGGAGAACTACAGTTTAGCATTCCTCAGGCTACTGTGA
AAACACAACCGTTATGGTCTTTGTCTCCATTTTTATCAAGGTTTTCCATGGTTAAGTTTG
GAGAAAATACCACACAAAACAATGAATTGCCAAATTGTTTGTTTTATTCAAGACTCATTC
TACTTGCAAGCAAAGTGTATTTGTAGTCCTATGAACAGTCTCCTCGTGTATCTCCAGAGA
CTGCATGTGCAAAGTAAAATGCTTCATTTGCCACATAGTTGTTGTAATATTTAATCCAGT
AGCATAACTTATATCTGTATTTAAGGACTTTTGTGCAATATGGTCTTAAGAAATAATTGC
CAAAAAAATCGGCCATGGTTCTGCATTTTTAACATAATCTAAGACAGAAAAAAAGCAATT
TTTACTATGTAACAATGGTATTCAACATTCTATATACTGTGTTTAGTACACTAATTTTGA
AGCCAATATTTCTGTACATGAAAAAGAGCTATTTATCTCTGTTTGTTGGAAAATCCTAAT
GGGGATTCCTCTGGTTGTTCACTGCCAAAACTGTGGCATTTTCATTACAGGAGAGTTTAC
TATGCTAAAAGCAAAAAACAAAAAAAAAAAAAAAGGGAAGAAGGAAAAAAGCAAAAAACA
ATTTGAAGATATCCTATCTCAATGACAAATCAAAAGAGTGATATTGCTTTTAACTGTAAT
AGAAGAAAATGAATTTATGTATATATCAGATGTCCAATACTGTAATTAATTTATTAAAGA
CTGGCTCTCCAGTTTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.151301_mRNA_3 gi|16041747|gb|BC015754.1|BC015754智人克隆MGC:23085IMAGE:4862492聚腺苷酸=3
AAAAGAACCAGGATTGCATTTGAAGTTAAGCTGCAAAAAACCAGTCGATCAACAGATTTT
CGAGTCCCACAGTCAATATGCACCATGTTTAATGTTATGGTTGATGCCAAAGCTCAATCA
ACAAAACTTTGCAGCATGGAAATGGGCCAAGAGTTTGCTAAAATGTGGCATCAATACCAT
TCAAAAATAGACGAACTAATTGAAGAAACTGTTAAAGAAATGATAACACTCTTGGTTGCA
AAGTTCGTTACTATCTTGGAAGGAGTGCTGGCAAAATTATCCAGATATGACGAAGGGACT
TTGTTTTCTTCTTTTCTGTCATTTACCGTGAAGGCAGCTTCCAAATATGTGGATGTACCT
AAACCCGGGATGGACGTGGCCGACGCCTACGTGACTTTCGTCCGCCATTCTCAGGATGTC
CTGCGTGATAAGGTCAATGAGGAGATGTACATAGAAAGGTTATTTGATCAATGGTACAAC
AGCTCCATGAACGTGATCTGCACCTGGTTGACGGACCGGATGGACTTACAGCTTCATATT
TATCAGTTGAAAACACTAATTAGGATGGTAAAGAAAACCTACAGAGATTTCCGATTGCAA
GGGGTCCTGGACTCCACCTTAAACAGCAAGACCTATGAAACGATCCGGAACCGTCTCACT
GTGGAGGAAGCCACAGCATCAGTGAGTGAAGGTGGGGGACTGCAGGGCATCAGCATGAAG
GACAGCGATGAGGAAGACGAAGAAGACGATTAGACCATTTGGTCCTAGAGTCTGCTGGGA
CAGAGTCCTGTAATCAGTGCATGTCCTTAGTCTGTTAGTTAAACCCATTAGGAATTTTCT
GTCAACTACCATGCCCATGAGATGTTTATCAATACAACTGCCATTTTAGCTATGTGGTAC
CAAGATTAGCAAATGACCTTCATATCCACTGATTTCCTGATGTCCATGTCTATATGTTTA
CAAGCAATATGGAGCACCATTCTTTAAATACTGTTCATGGAGAATACATAGTCTAACCAC
TAGGCGTGTCCCTGTTATCAGCAAAGATCAATGATGCTTCATTCATGTACTATGTATGCA
TTGGTGGTAAATGGATGTGAGGGCAAGTACATCAAGTACATTCACTCTGTTTCACGTATG
TGGATGCCAGTTAATTAAATGAGTACGTAAATAAATTAATTAAAACACATAGATCTGCTT
TGTGTTTTTATTTTTATTTTTTGAAAAACAAAAGGCAAGTCTCCAACAATTAACTTTTGA
TGCTTTCTGTTCCCCTAAAACCAAAAAATGAACCCCTTGTGTCGTTGTTAACCCATCCTT
TCATTTACTCATATAATTAGCCAAAAAAAAAAGGATGGCTACATACCAATGGATTGATTC
TCTTAATTGCCACGGCAAGGGGGCGATCCTATCATGACTTAACATCAAGCGCGCAGTTCA
AAACTACTGTCTTCTGTCAAAGTTTTCTCCTCTTAAATGTTATTTTGCTTTTACGTCTCA
ACTGTGTATGTAAAAAAAACGAATATTTAAATTACAACCCTAGACTAAAAATGTGTTTAT
AATAAGATGTGGATATTTCCTTCAGTAGATTGTAACCATAATTTAAATTATTTTGTTCCA
CACTGTTTTTTATATCTGTCATGTACATTGCATTTTGATCTGTAACTGCACAACCCTGGG
GTTTGCTGCAGAGCTATTTCTTTCCATGTAAAGTAGTGGATCCATCTTGCTTTTGCCTTA
TATAAAGCCTACAGTTATGGAAGTGTGGAAAACTGTGGCTTCTCAATAAATATTCAGATG
TCCTAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
>Hs.111_contig1 AA946776|AW242338|H24274|AI078616聚腺苷酸=1聚腺苷酸=2
ACCTGAACTGTCTAAGATATTCTAAGCAAAGTTGACAAAGACAATTCTCCACTTGAGCCC
TTAAAAATGTAACCACTATAAAGGTTTCACGCGGTGGTTCTTATTGATTCGCTGTGTCAT
CACATCAGCTCCACTGTTGCCAAACTTTGTCGCATGCATAATGTATGATGGAGGCTTGGA
TGGGAATATGCTGATTTTGTTCTGCACTTAAAGGCTTCTCCTCCTGGAGGGCTGCCTAGG
GCCACTTGCTTGATTTATCATGAGAGAAGAGGAGAGAGAGAGAGACTGAGCGCTAGGAGT
GTGTGTATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATGTGTGTAGCGGGAGATGTGG
GCGGAGCGAGAGCAAAAGGACTGCGGCCTGATGCATGCTGGAAAAAGACACGCTTTTCAT
TTCTGATCAGTTGTACTTCATCCTATATCAGCACAGCTGCCATACTTCGACTTATCAGGA
TTCTGGCTGGTGGCCTGCGCGAGGGTGCAGTCTTACTTAAAAGACTTTCAGTTAATTCTC
ACTGGTATCATCGCAGTGAACTTAAAGCAAAGACCTCTTAGTAAAAAATAAAAAAAATAA
A
>Hs.150753_contig1 AI123582|AI288234聚腺苷酸=0聚腺苷酸=0
GCTTCTCTTTAAAATTGACCCAAGGCATGAGCCACTGCGCCTGGCCAGCAAATGCTTTTT
GTGCAGAATACACTTCTTTCAGGCATTGTCAGGTGCTGTTTTGTTTAAGCTCTAACTCAC
CCCTGGAATACAGGGGAATGATGACAACCAGCCCAGCCAGGCCTGACTCATCATGGTCAC
ATCCAGCCCCCACCCCCGGCCAACTAACCACTGCAGGCTCCTCTTCCAGACTCACCAGGG
GGCCTCGAGGCCCCGGCATCTCCCTTGGCCCTGGGTGTGGGTTTTACAAGACTGTGTCTT
TCATGACATCATAGCCCAACCATGTGAGAAGAAGGAGAAGGCCCCCCTTTCTTCATTAAT
CTGAAAA
>Hs.82109_mRNA_1 gi|14250611|gb|BC008765.1|BC008765智人克隆MGC:1622 IMAGE:3347793聚腺苷酸=3
GGCACGAGGAAGGGCCTGTGGGTTTATTATAAGGCGGAGCTCGGCGGGAGAGGTGCGGGC
CGAATCCGAGCCGAGCGGAGAGGAATCCGGCAGTAGAGAGCGGACTCCAGCCGGCGGACC
CTGCAGCCCTCGCCTGGGACAGCGGCGCGCTGGGCAGGCGCCCAAGAGAGCATCGAGCAG
CGGAACCCGCGAAGCCGGCCCGCAGCCGCGACCCGCGCAGCCTGCCGCTCTCCCGCCGCC
GGTCCGGGCAGCATGAGGCGCGCGGCGCTCTGGCTCTGGCTGTGCGCGCTGGCGCTGAGC
CTGCAGCCGGCCCTGCCGCAAATTGTGGCTACTAATTTGCCCCCTGAAGATCAAGATGGC
TCTGGGGATGACTCTGACAACTTCTCCGGCTCAGGTGCAGGTGCTTTGCAAGATATCACC
TTGTCACAGCAGACCCCCTCCACTTGGAAGGACACGCAGCTCCTGACGGCTATTCCCACG
TCTCCAGAACCCACCGGCCTGGAGGCTACAGCTGCCTCCACCTCCACCCTGCCGGCTGGA
GAGGGGCCCAAGGAGGGAGAGGCTGTAGTCCTGCCAGAAGTGGAGCCTGGCCTCACCGCC
CGGGAGCAGGAGGCCACCCCCCGACCCAGGGAGACCACACAGCTCCCGACCACTCATCAG
GCCTCAACGACCACAGCCACCACGGCCCAGGAGCCCGCCACCTCCCACCCCCACAGGGAC
ATGCAGCCTGGCCACCATGAGACCTCAACCCCTGCAGGACCCAGCCAAGCTGACCTTCAC
ACTCCCCACACAGAGGATGGAGGTCCTTCTGCCACCGAGAGGGCTGCTGAGGATGGAGCC
TCCAGTCAGCTCCCAGCAGCAGAGGGCTCTGGGGAGCAGGACTTCACCTTTGAAACCTCG
GGGGAGAATACGGCTGTAGTGGCCGTGGAGCCTGACCGCCGGAACCAGTCCCCAGTGGAT
CAGGGGGCCACGGGGGCCTCACAGGGCCTCCTGGACAGGAAAGAGGTGCTGGGAGGGGTC
ATTGCCGTAGGCCTCGTGGGGCTCATCTTTGCTGTGTGCCTGGTGGGTTTCATGCTGTAC
CGCATGAAGAAGAAGGACGAAGGCAGCTACTCCTTGGAGGAGCCGAAACAAGCCAACGGC
GGGGCCTACCAGAAGCCCACCAAACAGGAGGAATTCTATGCCTGACGCGGGAGCCATGCG
CCCCCTCCGCCCTGCCACTCACTAGGCCCCCACTTGCCTCTTCCTTGAAGAACTGCAGGC
CCTGGCCTCCCCTGCCACCAGGCCACCTCCCCAGCATTCCAGCCCCTCTGGTCGCTCCTG
CCCACGGAGTCGTGGGGTGTGCTGGGAGCTCCACTCTGCTTCTCTGACTTCTGCCTGGAG
ACTTAGGGCACCAGGGGTTTCTCGCATAGGACCTTTCCACCACAGCCAGCACCTGGCATC
GCACCATTCTGACTCGGTTTCTCCAAACTGAAGCAGCCTCTCCCCAGGTCCAGCTCTGGA
GGGGAGGGGGATCCGACTGCTTTGGACCTAAATGGCCTCATGTGGCTGGAAGATCCTGCG
GGTGGGGCTTGGGGCTCACACACCTGTAGCACTTACTGGTAGGACCAAGCATCTTGGGGG
GGTGGCCGCTGAGTGGCAGGGGACAGGAGTCCACTTTGTTTCGTGGGGAGGTCTAATCTA
GATATCGACTTGTTTTTGCACATGTTTCCTCTAGTTCTTTGTTCATAGCCCAGTAGACCT
TGTTACTTCTGAGGTAAGTTAAGTAAGTTGATTCGGTATCCCCCCATCTTGCTTCCCTAA
TCTATGGTCGGGAGACAGCATCAGGGTTAAGAAGACTTTTTTTTTTTTTTTTTTTAAACT
AGGAGAACCAAATCTGGAAGCCAAAATGTAGGCTTAGTTTGTGTGTTGTCTCTTGAGTTT
GTCGCTCATGTGTGCAACAGGGTATGGACTATCTGTCTGGTGGCCCCGTTTCTGGTGGTC
TGTTGGCAGGCTGGCCAGTCCAGGCTGCCGTGGGGCCGCCGCCTCTTTCAAGCAGTCGTG
CCTGTGTCCATGCGCTCAGGGCCATGCTGAGGCCTGGGCCGCTGCCACGTTGGAGAAGCC
CGTGTGAGAAGTGAATGCTGGGACTCAGCCTTCAGACAGAGAGGACTGTAGGGAGGGCGG
CAGGGGCCTGGAGATCCTCCTGCAGACCACGCCCGTCCTGCCTGTGGCGCCGTCTCCAGG
GGCTGCTTCCTCCTGGAAATTGACGAGGGGTGTCTTGGGCAGAGCTGGCTCTGAGCGCCT
CCATCCAAGGCCAGGTTCTCCGTTAGCTCCTGTGGCCCCACCCTGGGCCCTGGGCTGGAA
TCAGGAATATTTTCCAAAGAGTGATAGTCTTTTGCTTTTGGCAAAACTCTACTTAATCCA
ATGGGTTTTTCCCTGTACAGTAGATTTTCCAAATGTAATAAACTTTAATATAAAGTAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
>Hs.44276_mRNA_2 gi|12654896|gb|BC001293.1|BC001293智人克隆MGC:5259 IMAGE:3458115聚腺苷酸=3
CGGATGGGGAAAAAAAAAGATGTCAGCTCCTCCGCTGTAGTATTGCTCCTTAAAAACCCC
TCTCTCTGAAAATGACATGCCCTCGCAATGTAACTCCGAACTCGTACGCGGAGCCCTTGG
CTGCGCCCGGCGGAGGAGAGCGCTATAGCCGGAGCGCAGGCATGTATATGCAGTCTGGGA
GTGACTTCAATTGCGGGGTGATGAGGGGCTGCGGGCTCGCGCCCTCGCTCTCCAAGAGGG
ACGAGGGCAGCAGCCCCAGCCTCGCCCTCAACACCTATCCGTCCTACCTCTCGCAGCTGG
ACTCCTGGGGCGACCCCAAAGCCGCCTATCGCCTGGAACAACCTGTTGGCAGGCCGCTGT
CCTCCTGCTCCTACCCACCTAGTGTCAAGGAGGAGAATGTCTGCTGCATGTACAGCGCAG
AGAAGCGGGCGAAAAGTGGCCCCGAGGCAGCTCTCTACTCCCACCCCTTGCCGGAGTCCT
GCCTTGGGGAGCACGAGGTACCCGTGCCCAGCTACTACCGCGCCAGCCCGAGCTACTCCG
CGCTGGACAAGACGCCCCACTGTTCTGGGGCCAACGACTTCGAAGCCCCTTTCGAGCAGC
GGGCCAGTCTCAACCCGCGCGCCGAACATCTGGAATCGCCTCAGCTGGGGGGCAAAGTGA
GTTTCCCTGAGACCCCCAAGTCCGACAGCCAGACCCCCAGCCCCAATGAAATCAAGACGG
AGCAGAGCCTGGCGGGCCCTAAAGGGAGCCCCTCGGAGAGCGAAAAGGAGAGGGCCAAAG
CTGCCGACTCCAGCCCAGACACCTCGGATAACGAAGCGAAAGAGGAGATAAAGGCAGAAA
ACACCACAGGAAATTGGCTGACAGCAAAGAGCGGAAGGAAGAAGAGGTGCCCCTATACTA
AACACCAGACGCTGGAATTGGAGAAAGAATTTCTGTTCAATATGTATTTGACGCGAGAGC
GCCGCCTGGAGATTAGCAAGACCATTAACCTTACAGACAGACAAGTCAAAATCTGGTTTC
AAAATCGCAGAATGAAACTCAAGAAAATGAACCGAGAGAATCGGATCCGGGAACTGACCT
CCAATTTTAATTTCACCTGAGAGCGCGGCCTCTCCTCCTCCCTTCCCGCTCCTTCCTCTC
CCCGCCCCTCCTCCCTTTGTGCCTGGTGATATATTTTTTTTTCCTCCCTGAGTATAAATG
CAATGCGACTGCAAAAAAGGCAAAGACCTCAGACTCTCCTTCCAAGGGACCTGTGGTTCG
TGCTGCGAAGATGCTTCCACTTAAAGCATGAGAAATGGGGTGCCGGGATGTGGGGTGTGG
TGTGTGCCCTCATAGATGGGGGTGGGAGTGTGGCTGGTGTGTGTGTCAAACCCTCACTCA
CCCACGCACTCACACACAGCATTCTGTTCTCCATGCAAAGTTAAGATCGAATCCATCCGC
TTGTAGGGGAAAAAAAGGAAAAAAATTAACCAGAGAGGGTCTGTAATCTCGCAGAGCACA
GGCAGAATCGTTCCTTCCTTGCTGCATTTCCTCCTTAGACTAATAGACGTTTTGGAAAGT
TCGGCTAGTGTTCGTGTGTTTGTCGTAGCACCCAGAGCCTCCACCAAACCCTCTCCATGT
CTTTACCTCCCAGTCGCTCTAAGAATCTGCTTGAAGTCTCGTATTTGTACTGCTTTCTGC
TTTTCTCCCACCCCTCCTAGCACCCCCACATCCCCCATCTAGTAACATCTCAGAAATTTC
ATCCAGAGGAACAAAAAAATTAAAAATAGAACATAGCAAAGCAAAGACAGAATGCCCCCC
CCCAAATATTGTCCTGTCCCTGTCTGGGAGTTGTGTTATTTAAAGATATTCTGTATGTTG
TATCTTTTGCATGTAGCTTCCTTAATGGAGAAAAAAAAATCCTAATAAATTTCCAGAATC
ATAATCCTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAA
>Hs.2142_mRNA_4 gi|13325274|gb|BC004453.1|BC004453智人克隆MGC:4303 IMAGE:2819400聚腺苷酸=3
GCAGTGGCCACGAGAGGCAGGCTGGCTGGGACATGAGGTTGGCAGAGGGCAGGCAAGCTG
GCCCTTGGTGGGCCTCGTCCTGAGCACTCGGAGGCACTCCTATGCTTGGAAAGCTCGCTA
TGCTGCTGTGGGTCCAGCAGGCGCTGCTCGCCTTGCTCCTCCCCACACTCCTGGCACAGG
GAGAAGCCAGGAGGAGCCGAAACACCACCAGGCCCGCTCTGCTGAGGCTGTCGGATTACC
TTTTGACCAACTACAGGAAGGGTGTGCGCCCCGTGAGGGACTGGAGGAAGCCAACCACCG
TATCCATTGACGTCATTGTCTATGCCATCCTCAACGTGGATGAGAAGAATCAGGTGCTGA
CCACCTACATCTGGTACCGGCAGTACTGGACTGATGAGTTTCTCCAGTGGAACCCTGAGG
ACTTTGACAACATCACCAAGTTGTCCATCCCCACGGACAGCATCTGGGTCCCGGACATTC
TCATCAATGAGTTCGTGGATGTGGGGAAGTCTCCAAATATCCCGTACGTGTATATTCGGC
ATCAAGGCGAAGTTCAGAACTACAAGCCCCTTCAGGTGGTGACTGCCTGTAGCCTCGACA
TCTACAACTTCCCCTTCGATGTCCAGAACTGCTCGCTGACCTTCACCAGTTGGCTGCACA
CCATCCAGGACATCAACATCTCTTTGTGGCGCTTGCCAGAAAAGGTGAAATCCGACAGGA
GTGTCTTCATGAACCAGGGAGAGTGGGAGTTGCTGGGGGTGCTGCCCTACTTTCGGGAGT
TCAGCATGGAAAGCAGTAACTACTATGCAGAAATGAAGTTCTATGTGGTCATCCGCCGGC
GGCCCCTCTTCTATGTGGTCAGCCTGCTACTGCCCAGCATCTTCCTCATGGTCATGGACA
TCGTGGGCTTCTACCTGCCCCCCAACAGTGGCGAGAGGGTCTCTTTCAAGATTACACTCC
TCCTGGGCTACTCGGTCTTCCTGATCATCGTTTCTGACACGCTGCCGGCCACTGCCATCG
GCACTCCTCTCATTGGTGTCTACTTTGTGGTGTGCATGGCTCTGCTGGTGATAAGTTTGG
CCGAGACCATCTTCATTGTGCGGCTGGTGCACAAGCAAGACCTGCAGCAGCCCGTGCCTG
CTTGGCTGCGTCACCTGGTTCTGGAGAGAATCGCCTGGCTACTTTGCCTGAGGGAGCAGT
CAACTTCCCAGAGGCCCCCAGCCACCTCCCAAGCCACCAAGACTGATGACTGCTCAGCCA
TGGGAAACCACTGCAGCCACATGGGAGGACCCCAGGACTTCGAGAAGAGCCCGAGGGACA
GATGTAGCCCTCCCCCACCACCTCGGGAGGCCTCGCTGGCGGTGTGTGGGCTGCTGCAGG
AGCTGTCCTCCATCCGGCAATTCCTGGAAAAGCGGGATGAGATCCGAGAGGTGGCCCGAG
ACTGGCTGCGCGTGGGCTCCGTGCTGGACAAGCTGCTATTCCACATTTACCTGCTGGCGG
TGCTGGCCTACAGCATCACCCTGGTTATGCTCTGGTCCATCTGGCAGTACGCTTGAGTGG
GTACAGCCCAGTGGAGGAGGGGGTACAGTCCTGGTTAGGTGGGGACAGAGGATTTCTGCT
TAGGCCCCTCAGGACCCAGGGAATGCCAGGGACATTTTCAAGACACAGACAAAGTCCCGT
GCCCTGTTTCCAATGCCAATTCATCTCAGCAATCACAAGCCAAGGTCTGAACCCTTCCAC
CAAAAACTGGGTGTTCAAGGCCCTTACACCCTTGTCCCACCCCCAGCAGCTCACCATGGC
TTTAAAACATGCTCTCTTAGATCAGGAGAAACTCGGGCACTCCCTAAGTCCACTCTAGTT
GTGGACTTTTCCCCATTGACCCTCACCTGAATAAGGGACTTTGGAATTCTGCTTCTCTTT
CACAACTTTGCTTTTAGGTTGAAGGCAAAACCAACTCTCTACTACACAGGCCTGATAACT
CTGTACGAGGCTTCTCTAACCCCTAGTGTCTTTTTTTTCTTCACCTCACTTGTGGCAGCT
TCCCTGAACACTCATCCCCCATCAGATGATGGGAGTGGGAAGAATAAAATGCAGTGAAAC
CCTAAAAAAAAAAAAAAAAAAAAAA
>Hs.180908_contig1 AA846824|AW611680|AA846182|AA846342|AA846360聚腺苷酸=2聚腺苷酸=3
TCTTCGCTCCTCTACCCCATAAAATTCCCTACAAATGCAAAAATTCGAGATAGAAGAAGC
CGTCCCTGAAATTGCTGTCTAACATTCACCGGAAACCTCTCCATAAACAAGGAGAAACGA
ATGCACACGCATTTTTGCTAAGAAGCCCGGGATTAAGATTTAAGGATACAAGCTGAAAGA
AAAAATGAAAAATGCTTCTCCGCGCGTCAATCGAGGGGTGGATGCGCCACGCAGCTGAGC
CCAGCTCACAGCCACGCGTAAGACCAAAAGCTGCCATGGGTTCTGCGCGCGGAGACCTCA
GAGCCGAAGAGAGAAGTCCCCGCGTCAGAAACGCTGCGGATGCCAGGTCTTGAAAATGCT
GACTTCTGAGGCTAAGAATTATTTCAAAGACAAAAAGAAAAGACTGGTGAGGAGGCCTTC
CGGTGCAAGGGCGCCTATCCGCTAATTTTGGATGGGGAAGTAGGGATTATTCGTTTAAAT
TCAATCGCGAGCACCAAGTCGGACTGGCCGGGGATGGAGAAGGGCAACCCCCACCTTTAG
AAAAATAAAAGATCTCGAAGGCCAAAAAAAAAAA
>Hs.89436_mRNA_1 gi|16507959|ref|NM_004063.2|智人钙黏着蛋白17,LI钙黏着蛋白(肝-肠)(CDH17),mRNA聚腺苷酸=1
AGGGAGTGTTCCCGGGGGAGATACTCCAGTCGTAGCAAGAGTCTCGACCACTGAATGGAA
GAAAAGGACTTTTAACCACCATTTTGTGACTTACAGAAAGGAATTTGAATAAAGAAAACT
ATGATACTTCAGGCCCATCTTCACTCCCTGTGTCTTCTTATGCTTTATTTGGCAACTGGA
TATGGCCAAGAGGGGAAGTTTAGTGGACCCCTGAAACCCATGACATTTTCTATTTATGAA
GGCCAAGAACCGAGTCAAATTATATTCCAGTTTAAGGCCAATCCTCCTGCTGTGACTTTT
GAACTAACTGGGGAGACAGACAACATATTTGTGATAGAACGGGAGGGACTTCTGTATTAC
AACAGAGCCTTGGACAGGGAAACAAGATCTACTCACAATCTCCAGGTTGCAGCCCTGGAC
GCTAATGGAATTATAGTGGAGGGTCCAGTCCCTATCACCATAGAAGTGAAGGACATCAAC
GACAATCGACCCACGTTTCTCCAGTCAAAGTACGAAGGCTCAGTAAGGCAGAACTCTCGC
CCAGGAAAGCCCTTCTTGTATGTCAATGCCACAGACCTGGATGATCCGGCCACTCCCAAT
GGCCAGCTTTATTACCAGATTGTCATCCAGCTTCCCATGATCAACAATGTCATGTACTTT
CAGATCAACAACAAAACGGGAGCCATCTCTCTTACCCGAGAGGGATCTCAGGAATTGAAT
CCTGCTAAGAATCCTTCCTATAATCTGGTGATCTCAGTGAAGGACATGGGAGGCCAGAGT
GAGAATTCCTTCAGTGATACCACATCTGTGGATATCATAGTGACAGAGAATATTTGGAAA
GCACCAAAACCTGTGGAGATGGTGGAAAACTCAACTGATCCTCACCCCATCAAAATCACT
CAGGTGCGGTGGAATGATCCCGGTGCACAATATTCCTTAGTTGACAAAGAGAAGCTGCCA
AGATTCCCATTTTCAATTGACCAGGAAGGAGATATTTACGTGACTCAGCCCTTGGACCGA
GAAGAAAAGGATGCATATGTTTTTTATGCAGTTGCAAAGGATGAGTACGGAAAACCACTT
TCATATCCGCTGGAAATTCATGTAAAAGTTAAAGATATTAATGATAATCCACCTACATGT
CCGTCACCAGTAACCGTATTTGAGGTCCAGGAGAATGAACGACTGGGTAACAGTATCGGG
ACCCTTACTGCACATGACAGGGATGAAGAAAATACTGCCAACAGTTTTCTAAACTACAGG
ATTGTGGAGCAAACTCCCAAACTTCCCATGGATGGACTCTTCCTAATCCAAACCTATGCT
GGAATGTTACAGTTAGCTAAACAGTCCTTGAAGAAGCAAGATACTCCTCAGTACAACTTA
ACGATAGAGGTGTCTGACAAAGATTTCAAGACCCTTTGTTTTGTGCAAATCAACGTTATT
GATATCAATGATCAGATCCCCATCTTTGAAAAATCAGATTATGGAAACCTGACTCTTGCT
GAAGACACAAACATTGGGTCCACCATCTTAACCATCCAGGCCACTGATGCTGATGAGCCA
TTTACTGGGAGTTCTAAAATTCTGTATCATATCATAAAGGGAGACAGTGAGGGACGCCTG
GGGGTTGACACAGATCCCCATACCAACACCGGATATGTCATAATTAAAAAGCCTCTTGAT
TTTGAAACAGCAGCTGTTTCCAACATTGTGTTCAAAGCAGAAAATCCTGAGCCTCTAGTG
TTTGGTGTGAAGTACAATGCAAGTTCTTTTGCCAAGTTCACGCTTATTGTGACAGATGTG
AATGAAGCACCTCAATTTTCCCAACACGTATTCCAAGCGAAAGTCAGTGAGGATGTAGCT
ATAGGCACTAAAGTGGGCAATGTGACTGCCAAGGATCCAGAAGGTCTGGACATAAGCTAT
TCACTGAGGGGAGACACAAGAGGTTGGCTTAAAATTGACCACGTGACTGGTGAGATCTTT
AGTGTGGCTCCATTGGACAGAGAAGCCGGAAGTCCATATCGGGTACAAGTGGTGGCCACA
GAAGTAGGGGGGTCTTCCTTGAGCTCTGTGTCAGAGTTCCACCTGATCCTTATGGATGTG
AATGACAACCCTCCCAGGCTAGCCAAGGACTACACGGGCTTGTTCTTCTGCCATCCCCTC
AGTGCACCTGGAAGTCTCATTTTCGAGGCTACTGATGATGATCAGCACTTATTTCGGGGT
CCCCATTTTACATTTTCCCTCGGCAGTGGAAGCTTACAAAACGACTGGGAAGTTTCCAAA
ATCAATGGTACTCATGCCCGACTGTCTACCAGGCACACAGAGTTTGAGGAGAGGGAGTAT
GTCGTCTTGATCCGCATCAATGATGGGGGTCGGCCACCCTTGGAAGGCATTGTTTCTTTA
CCAGTTACATTCTGCAGTTGTGTGGAAGGAAGTTGTTTCCGGCCAGCAGGTCACCAGACT
GGGATACCCACTGTGGGCATGGCAGTTGGTATACTGCTGACCACCCTTCTGGTGATTGGT
ATAATTTTAGCAGTTGTGTTTATCCGCATAAAGAAGGATAAAGGCAAAGATAATGTTGAA
AGTGCTCAAGCATCTGAAGTCAAACCTCTGAGAAGCTGAATTTGAAAAGGAATGTTTGAA
TTTATATAGCAAGTGCTATTTCAGCAACAACCATCTCATCCTATTACTTTTCATCTAACG
TGCATTATAATTTTTTAAACAGATATTCCCTCTTGTCCTTTAATATTTGCTAAATATTTC
TTTTTTGAGGTGGAGTCTTGCTCTGTCGCCCAGGCTGGAGTACAGTGGTGTGATCCCAGC
TCACTGCAACCTCCGCCTCCTGGGTTCACATGATTCTCCTGCCTCAGCTTCCTAAGTAGC
TGGGTTTACAGGCACCCACCACCATGCCCAGCTAATTTTTGTATTTTTAATAGAGACGGG
GTTTCGCCATTTGGCCAGGCTGGTCTTGAACTCCTGACGTCAAGTGATCTGCCTGCCTTG
GTCTCCCAATACAGGCATGAACCACTGCACCCACCTACTTAGATATTTCATGTGCTATAG
ACATTAGAGAGATTTTTCATTTTTCCATGACATTTTTCCTCTCTGCAAATGGCTTAGCTA
CTTGTGTTTTTCCCTTTTGGGGCAAGACAGACTCATTAAATATTCTGTACATTTTTTCTT
TATCAAGGAGATATATCAGTGTTGTCTCATAGAACTGCCTGGATTCCATTTATGTTTTTT
CTGATTCCATCCTGTGTCCCCTTCATCCTTGACTCCTTTGGTATTTCACTGAATTTCAAA
CATTTGTCAGAGAAGAAAAACGTGAGGACTCAGGAAAAATAAATAAATAAAAGAACAGCC
TTTTCCCTTAGTATTAACAGAAATGTTTCTGTGTCATTAACCATCTTTAATCAATGTGAC
ATGTTGCTCTTTGGCTGAAATTCTTCAACTTGGAAATGACACAGACCCACAGAAGGTGTT
CAAACACAACCTACTCTGCAAACCTTGGTAAAGGAACCAGTCAGCTGGCCAGATTTCCTC
ACTACCTGCCATGCATACATGCTGCGCATGTTTTCTTCATTCGTATGTTAGTAAAGTTTT
GGTTATTATATATTTAACATGTGGAAGAAAACAAGACATGAAAAGAGTGGTGACAAATCA
AGAATAAACACTGGTTGTAGTCAGTTTTGTTTGTTAA
>Hs.151544_mRNA_8 gi|3153107|emb|AL023657.1|HSDSHP智人SH2D1A cDNA,以前称为DSHP聚腺苷酸=3
AAATCCTTCTTCCAATGTTCCTCCCCTCTCTGTATGAACCCTGTGTTGGGGGGCAGAAGA
TGGAAGCCCTTGGCAAGCTCGATCGAACCAAGCTACTAAATTGCTGAGCTCGTTTTAACT
GAAGTGTGAGAAGGAGGTTTAAGGCAAGTAGACAACATCCTGTTGTTGGGGTGCTTCTCT
CTTTTTTGCACATCTGGCTGAACTGGGAGTCAGGTGGTTGACTTGTGCCTGGCTGCAGTA
GCAGCGGCATCTCCCTTGCACAGTTCTCCTCCTCGGCCTGCCCAAGAGTCCACCAGGCCA
TGGACGCAGTGGCTGTGTATCATGGCAAAATCAGCAGGGAAACCGGCGAGAAGCTCCTGC
TTGCCACTGGGCTGGATGGCAGCTATTTGCTGAGGGACAGCGAGAGCGTGCCAGGCGTGT
ACTGCCTATGTGTGCTGTATCACGGTTACATTTATACATACCGAGTGTCCCAGACAGAAA
CAGGTTCTTGGAGTGCTGAGACAGCACCTGGGGTACATAAAAGATATTTCCGGAAAATAA
AAAATCTCATTTCAGCATTTCAGAAGCCAGATCAAGGCATTGTAATACCTCTGCAGTATC
CAGTTGAGAAGAAGTCCTCAGCTAGAAGTACACAAGGTACTACAGGGATAAGAGAAGATC
CTGATGTCTGCCTGAAAGCCCCATGAAGAAAAATAAAACACCTTGTACTTTATTTTCTAT
AATTTAAATATATGCTAAGTCTTATATATTGTAGATAATACAGTTCGGTGAGCTACAAAT
GCATTTCTAAAGCCATTGTAGTCCTGTAATGGAAGCATCTAGCATGTCGTCAAAGCTGAA
ATGGACTTTTGTACATAGTGAGGAGCTTTGAAACGAGGATTGGGAAAAAGTAATTCCGTA
GGTTATTTTCAGTTATTATATTTACAAATGGGAAACAAAAGGATAATGAATACTTTATAA
AGGATTAATGTCAATTCTTGCCAAATATAAATAAAAATAATCCTCAGTTTTTGTGAAAAG
CTCCATTTTTAGTGAAATATTATTTTATAGCTACTAATTTTAAAATGTCTTGCTTGATTG
TATGGTGGGAAGTTGGCTGGTGTCCCTTGTCTTTGCCAAGTTCTCCACTAGCTATGGTGT
CATAGGCTCTTTTGGGATTTTTGAAGCTGTATACTGTGTGCTAAAACAAGCACTAAACAA
AGAGTGAAGGATTTATGTTTAATTCTGAAAGCAACCTTCTTGCCTAGTGTTCTGATATTG
GACAGTAAAATCCACAGACCAACCTGGAGTTGAAAATCTTATAATTTAAAATATGCTCTA
AACATGTTTATCGTATTTGATGCTACAGGATTTGAAATTGTATTACAAATCCAATGAAAT
GAGTTTTTCTTTTCATTTACCTCTGCCCCAGTTGTTTCTACTACATGGAAGACCTCATTT
TGAAGGGAAATTTCAGCAGCTGCAGCTCATGAGTAACTGATTTGTAACAAGCCTCCTTTT
AAAGTAACCCTACAAAACCACTGGAAAGTTTATGGTTGTATTATTTTTTAAAAAAATTCC
AAGTGATTGAAACCTACACGAGATACAGAATTTTATGCGGCATTTTCTTCTCACATTTAT
ATTTTTGTGATTTTGTGATTGATTATATGTCACTTTGCTACAGGGCTCACAGAATTCATT
CACTCAACAAACATAATAGGGCGCTGAGGGCATAGAAGTAAAAACACCTGGTCCCTGCTC
TCAGTTCACTGTCTTGTTGGACGAGAAAAGAAACAATAACGATAAAAGACAGTGAAAGAA
AATAACGATAAAAGACAGTGAAAGAAAATAACAATAAAAGACAAGGAAAAAATAACAATG
AAAGTTGATAAGTACATGATAAGCGAGGTTCCCCGTGTGTAGGTAGATCTGGTCTTTAGA
GGCAGATAGATAGGTCAGTGCAAATACTCTGGTCCATGGGCCATATGAAAAGGCTAAGCT
TCACTGTAAAATAATAACTGGGAATTCTGGATTGTGTATGGGTGTTGGTGAACTTGGTTT
TAATTAGTGAACTGCTGAGAGACAGAGCTATTCTCCATGTACTGGCAAGACCTGATTTCT
GAGCATTTAATATGGATGCCGTGGGAGTACAAAAGTGGAGTGTGGCCTGAGTAATGCATT
ATGGGTGGTTTACCATTTCTTGAGGTAAAAGCATCACATGAACTTGTAAAGGAATTTAAA
AATCCTACTTTCATAATAAGTTGCATAGGTTTAATAATTTTTAATTATATGGCTTGAGTT
TAAATTGTAATAGGCGTAACTAATTTTAACTCTATAATGTGTTCATTCTGGAATAATCCT
AAACATATGAATTATGTTTGCATGTTCACTTCCAAGAGCCTTTTTTTGAAAAAAAGCTTT
TTTTGAATCATCAAGTCTTTCACATTTAAATAAAGTGTTTGAAAGCTTTATTTAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAGAAAAAAA
>Hs.1657_contig4
AW473119|AA164586|AI540656|AI758480|AI810941|AI978964|AI675862|AI784397|AW591562|AW514102|AI888116|AI983175|AI634735|AI669577|AI202659|AI910598|AI961352|AI565481|AI886254|AI538838|AA291749|AW571455|AI370308|AI274727|AW473925|AW514787|AI273871|AW470552|AI524356|AI888281|AW089672|AI952766|AW440601|AI654044|AW438839|AI972926聚腺苷酸=2聚腺苷酸=3
AATTGTTTTCTAAGTAATTGCTGCCTCTATTATGGCACTTCATTTTTGCACTGTCTTTTG
AGATTCAAGAAAAATTTCTATTCTTTTTTTTGCATCCAATTGTGCCTGAACTTTTAAAAT
ATGTAAATGCTGCCATGTTCCAAACCCATCGTCAGTGTGTGTGTTTAGAGCTGTGCACCC
TAGAAACAACATATTGTCCCATGAGCAGGTGCCTGAGACACAGACCCCTTTGCATTCACA
GAGAGGTCATTGGTTATAGAGACTTGAATTAATAAGTGACATTATGCCAGTTTCTGTTCT
CTCACAGGTGATAAACAATGCTTTTTGTGCACTACATACTCTTCAGTGTAGAGCTCTTGT
TTTATGGGAAAAGGCTCAAATGCCAAATTGTGTTTGATGGATTAATATGCCCTTTTGCCG
ATGCATACTATTACTGATGTGACTCGGTTTTGTCGCAGCTTTGCTTTGTTTAATGAAACA
CACTTGTAAACCTCTTTTGCACTTTGAAAAAGAATCCAGCGGGATGCTCGAGCACCTGTA
AACAATTTTCTCAACCTATTTGATGTTCAAATAAAGAATTAAACTAAAAAAAAAAAAAAA
A
>Hs.35984_mRNA_1 gi|6049161|gb|AF133587.1|AF133587智人染色体22遗传图22q11.2聚腺苷酸=3
GGCGCCGCGGACGCTGCTGGAGTCGCCTGGCAACGATGTCGCCTGGCAACTGAATAGGTT
GGCCAGTGGCGCGGGCTACTGGAAGCAGAAAGGGCTGCGGAGGCAGTGAGTGGTTTCTGC
AGAGCTTCATTTGGAAAGGCCTCTGTAGTTGGGGAAAGATGGCCCATTCCCAGAACTCCT
TGGAGCTTCCCATTAACATCAATGCCACCCAGATTACCACTGCCTATGGCCATCGGGCCC
TGCCCAAGCTGAAGGAGGAGCTGCAGTCAGAGGACCTCCAGACGAGGCAGAAAGCCCTCA
TGGCCCTGTGTGACCTCATGCATGACCCCGAGTGTATCTACAAGGCCATGAACATAGGCT
GTATGGAGAACCTGAAAGCTTTGCTGAAGGATAGCAACAGTATGGTGCGCATAAAGACCA
CCGAGGTGCTCCACATCACGGCAAGCCATAGCGTGGGCAGATACGCCTTTCTAGAGCACG
ACATCGTCCTTGCCCTGTCCTTCCTGCTGAATGACCCCAGCCCAGTCTGCCGGGGGAACC
TGTACAAGGCATACATGCAGCTGGTCCAGGTGCCTAGAGGGGCCCAAGAGATCATCAGCA
AAGGTCTGATTTCCTCACTGGTATGGAAGCTGCAGGTGGAGGTGGAGGAGGAGGAGTTCC
AGGAGTTCATCCTGGACACACTGGTCCTCTGCCTGCAGGAGGATGCCACCGAGGCCCTGG
GCAGCAATGTGGTGCTTGTCCTGAAGCAGAAGCTCCTCAGCGCCAACCAGAACATCCGCA
GCAAGGCCGCCCGTGCGCTCCTTAATGTCAGCATATCTCGAGAGGGCAAGAAACAGGTGT
GTCATTTTGACGTCATCCCCATCCTGGTCCATCTGCTGAAAGACCCAGTGGAGCATGTGA
AGTCTAACGCTGCCGGTGCCCTGATGTTCGCCACAGTGATCACTGAAGGGAAGTATGCGG
CCCTGGAGGCACAAGCCATCGGCCTGCTCCTGGAGCTGCTGCACTCCCCCATGACCATAG
CGCGCCTGAATGCCACCAAGGCCCTTACCATGCTGGCAGAGGCCCCCGAGGGCCGCAAGG
CCCTGCAGACGCACGTGCCCACTTTCCGTGCCATGGAGGTGGAGACTTACGAAAAGCCTC
AAGTGGCCGAAGCCTTACAGCGGGCAGCCCGGATCGCCATCAGTGTCATCGAGTTCAAAC
CCTGAGCCCTTCATTCACCTCTGTGAGTGAATAAATGTGCTAAGTCTCTTTAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAA
>Hs.334534_mRNA_2 gi|17389403|gb|BC017742.1|BC017742智人,克隆IMAGE:4391536,mRNA聚腺苷酸=3
AGAGCAGTAAGCTTGTGATAAAGGCCAATTCCAGGTAGCTCTTGAAGGTGATAGCCATCT
ACTTTCCAGTGGCTGCCAACCACAGGGAGTGCCAGTTAACACTGGAAGGATTAAGGCAAG
GTCCCTTCTCTTGAGACTCCCCTCTGAGATCTGAAAAATGAAGTGGCTTAGGAACATCAG
CAGTGAAGAACTGCCAAGAGTTGGTGAAGGTTGTCTCTTCCGAGGGCCTTCTGAAGACAG
GGCTCTTGAACAGACAAGTGGAAGGGCTGTACCAGGGATAAAGGAAAGAAGTGCCTGTCC
AGCAGGGAGCTTGAATTTAAGTTCCATGTATGAAGTCATTGGCTCTATCTGCATTTTTCT
GTCATTCTCTTCATTTGTTTTAAGGTGGAAAATTTTCTTACAGTTGATGCAAAGTATCAA
CTACTTTACCCTACCTTCTCCCCTTTTAGATGGGTTCTTCCTGAGTTTTGGAGTCTTGTA
TGATTATCAGTATTCCCCTGTCAAAATCAAATCTATTCAGGTTTCTTCACTGTTGAGAAC
ACCTAAATGTTTTTATTTTTGAGAAGTGGGGACAGAGTCTCACTATGTCACCCAGGCTGG
AGTGCAATGGCATGATCTCAGCTCACTGCAACCTTCGCCTCCTGGGTTCAAGCGATTCTC
CTGCCTCCGCCTCCTGAGTAGCTGGGATTATAGGCACGCACCACCACGCCCAGCTAATTT
TTTGTATTTTTAGTAGAGACAGAGTTTCACCATGTTGGCCAGGCTGGTCTTGAACTCCTG
ACCTTGTGATCCACCCACCTCGGCCTCCCAGAGTGCTGGGATTACAGGCATGAGCCACCA
CGCTTGGCTAAGAACACCTAAATTTTTATGTTTCTTGGCTCAAAAACCAGTTCCATTTCT
AATGTTGTCCTCACAAGAAGGCTAATTGGTGGTGAGACAGCAGGGGAGGAGGAAGAGCTG
TGGTTTGTAACTTGTTCAACTCAGGCAATAAGCGATTTTAGCTTTATTTAAAGTCTTCTG
TCCAGCTTTAAGCACTTTGTAAGACATGGCTGAAAGTAGCTTTTCTATCAGAATTGCAGA
TAGTCATGTTGGGCTAACAGTCAATTGGATATATTCCTTTACCTCACATGACCCCAGCAA
CTGTGGTGGTATCTAGAGGTGAAACAGGCAAGTGAAATGGACACCTCTGCTGTGAATGTT
TTAGAGAAGGAAATTCAAAAAATGTTGTAACTGAAAGCACTGTTGAATATGGGTATCGGC
TTTCTTTTTCACTTTGACTCTTAACATTATCAGTCAACTTCCACATTAATGAAAGTTGAC
CATAGTTATTTCCAAATAAAAAGAAACCAACTCTTACCAGGTCTTGGACTGTGATGTCAT
ATTATTCAGTTTTATGCTTGTTCCTGAGCAGAACTCATAAGAGTGACATAGTCAGCTGCT
GACGGCACCTCAGCCACGCCACTCTTACTCAGTTCAGTGGGTGTGCTTGCGTGGTAGGAT
GTGGTGCAGCCCTCTCTACGCTCTTCTATTTTTGGTATATTTCCTATCTAACCTTCAAAT
AGCTTCCAATTCTTTTTTTCTTGGACTGGCTTCATTCTGAATTTGTGCTAAAATAATCTT
TCATAAAGAGACCTCAGTTTATAGCGTAACAGACTACACAATGCACTGATGTTTTCATAA
TGTTTAAGGGACCCACTGCAAGAAGCTTGCTGCCTCCTTTTAATTGTATTCATTTAGATT
TTGATTTTCCATGTTAAGAAGGTGAGGTCCATGTTGGTGCCCTTCAGAGTAGAGAACCAT
GTAAACATTAGGAATGAACAGAGGCCTTAGGAATGAATAGAGAGTTTGCCTTATACAATT
TCCTGTTACAAAGCTCTCCCTCTCATGCAAAGTAGGGAACACCTTTTGAGCATCTTTGAA
TTTGACAAATGGTGCTGTTGCAAACACTTTTTTTTTGAGATGAAGTCTCGCGGTTGTCAC
CCGGGCTGGAGTGCAGTGGCGTGATCTCGGCTCACTGCAACTTCCACCTCCTGGGTTCCA
GCAGTTCTCCTGCCTCAGCCTCCCAAGTAGCTGAGATTACAGGCGCCTGCCACCCCACCT
GGCTGATTTTTGTAATTTTAGTAGAGACGGGGTTTCACCATGTTGGCCAGGCTGATTAAC
TCCTGACCTCAGGTGATCCACCTTTCTCGGCCTCCCAAAGTGCTGGGATTACGGGTGTGA
GCCACCGTGCCCGGCCTGCAAACACATTTTAATTGACAACACTAGGGCTGTTGTACAAAA
TAGTAATGATAGCCATGGAAGTTTTACCTTATTCTGTGAGAAGTGTTCTTAAACTTATTA
AGTGTCTAAACTAAGGTTTAGTGCTTTTTTAAAGGAAAGTTGTCCCAGGATTCATCCTAA
AGAAAGCAAAAGTTAATTCAACTGATCCACCAATGGAATTAGATGGGTAGAGTTGGGTTC
TTGAGTTTTACCACCACTTAGTTCCCACTGAATTTTGTAACTTCCTGTGTTTGCATCCTC
TGTTCCTATTCTGCCCTTGCTCTGTGTCATCTCAGTCATTTGACTTAGAAAGTGCCCTTC
AAAAGGACCCTGTTCACTGCTGCACTTTTCAATGAATTAAAATTTATTTCTGTTCTAAAA
AAAAAAAAAAA
>Hs.60162_mRNA_1 gi|10437644|dbj|AK025181.1|AK025181智人cDNA:FLJ21528 fis,克隆COL05977聚腺苷酸=3
TGATCAACAACTGTCAGCTCCCAGTCAGAGAGAAAGGGCCTCTTCAGTCTGTCTCAGGAG
ACTGGGAGAAACAGCATAAAGGACCCCACAAGGAAGGGAGAGGTACCCTGGGTCAGGCGC
TTGTGGAGAGAGGGCTTCGCATGTAAAGTGACGTCAGGGAAAATAGAACAGAAAAAAAGC
CAGGGCCAGCCCAGAGGCACCTGAGAAGAATCAGACCCACAGCTCAGCCCAGCCCTGGCA
CAGAGAAGAGACAGGCCTGGCAGCACCCAGGGACCCCCTTTCCTCAGCCTCCACCTGCAG
GACAGCAGGAGCACTGATGCGCTGAAGGTACGTTCTGGAGTCTGGAAGCAGCAGAACTGA
AGGAAGTAAACACGGGTGTCTGGGAAGACCCCTCAAGCTGCAGTAAAGCCCAGGACTGAA
TTGGCCACCTGAGGCCAAGGGTGGCACTCCAACCTCCTCCTAAAGGCTGGCTAGAGCCAC
AGGAAAGGGCCAGAAGCCAGAGAAAGGGCAAAGGTGGACCCCTGCCTCCAAACCTCCTCT
GGAGACTGACCTCCTCTTTCCTGTGCCTTATTGTTTCTCCCTCTTCTCTTTGTTCGCCAC
TGGGCGGTGACCTCAGGGATCCTGGCCTAACCTGGTGATTGTGCAGGCAACTGTGTCCGA
GAAGACCCTTCTCTGGAAGATTGAACCCCAATTCAGCCATGGTGACTCCTTTGATGTCAA
ACTGGTAAGGGCTGAGCCGTGGGCACAGGATACCACTCCTTCCAGCTCTTCTGCTGTGAC
CTGCCCATGGAAGTCCCTGTGGACACGAAATCCTGTTTGGATCATCTAACTGGAGGCTCT
CTGTTCTTCACCTCCACGCGCCCTCTTGACCCCAGGAGGTTCAGGGGAGGAAGTACGCCA
CTCTCCACTGGCACCCTCCTTGGCCTACACAGAGTCACCCCTGAGCCCCTCAATGTGTGC
TGAGGTGGGCCCTGCTCTCTGCAGGGGTATGGAGAGAAATAGCTTGGGGTGCTGTGAGGC
CCCGAAGAAGCTGGGCCTGTCCTTCTCCATCGAGGCGATCCTAAAGAGGCCTGCCAGGAG
GAGTGATATGGACAGACCAGAAGGGCCAGGTGAAGAGGGCCCCGGAGAAGCTGCGGCCTC
AGGCTCTGGGCTAGAAAAGCCTCCAAAGGACCAGCCCCAGGAAGGAAGGAAGAGCAAGCG
GAGGGTTCGTACCACCTTCACCACTGAGCAGCTGCATGAGCTGGAGAAGATCTTCCACTT
TACCCACTACCCAGACGTTCACATCCGCAGCCAGCTGGCAGCCAGGATCAACCTCCCAGA
AGCTCGGGTGCAGATCTGGTTCCAGAATCAGCGAGCCAAGTGGCGGAAGCAGGAGAAGAT
TGGCAACCTGGGGGCTCCACAGCAGCTGAGTGAAGCCAGTGTGGTCCTGCCCACAAATCT
GGATGTGGCTGGGCCCACGTGGACATCCACTGCTCTGCGCAGGCTGGCTCCTCCCACGAG
CTGTTGTCCATCGGCTCAAGATCAGCTGGCCTCTGCCTGGTTCCCTGCCTGGATCACCCT
CCTCCCAGCGCACCCATGGGAAACACAGCCTGTCCCAGGTCTTCCCATCCATCAAACTTG
CATCCCTGTGCTATGCATCCTTCCACCTCCACACCCCAAATGGGGCAGCATCTGTGCTAC
TTCAACATAGAGATTGGACATGCTCTCCCCAAATGAGCCACTTTCCTCTCCAGGTGAAGG
CAGGTAGCAGATGTGCCCTGGGCCTCTGGGGAAATCGATCTCACAATCCAAAAATGGCCC
ACAGCCCAGGAAGCTACCCTGAACATGCCAGTTGGAAGGCTGCACCAGACTCAAAAGCAA
ACTAAACAATAAAGGACAGCTCTCTTCTCTCCTGGCTAAAGCTGCTCTCCTGGTTCAGAA
GACAGGCTGGATGAGATCTCAGGCCGAGCTCTGAAATAGGGAGGTAATCCTCCAGCACCT
GTGTTTCCTCTAACTTGCTGTGTGACCTCCAGCCGGTCACTCACCCTCTCTGGACCTCAT
CTGTAAGAGGAGCCAGCTGGATAAGATGATTTCTGAAGACGCTTCCATGGTGGGCACTGA
GGCACAGAGGAGGCCAAGGAGAGGTTGTTTGTTCATGCATGCATTCATCCGTGACACATG
AGTACCTACTGAGGACTCCATAAACAGAACGGGATACAGAGATAAACAATTTGGGTTCTG
TCCACGTTTGTCAAAAGGTGGTGCTGGCCCACCTCTGAAAGCAGAACACTTGCTCAACAA
CCTTGCTGTTGGCCCAAGTCTAACACATTCTTTATGACTGTGAGCATCTCAGAGTGAGAG
AAAAATGTAGAAAGTTTTTTAAATTCTAAACAGGATTTAGTGTCTTTAGTTATCTTGCTG
GATGGGAAAGGGATGTTGTCATTTCTGGCACAAATGAAAAGTAGGACGGAAAGCTCCTTT
CATTCAGTTTATCTTTCCAGGATATATGAAAAGGGACCAGCTGGAAGACTAGCCTCACTC
TGTCCTCGAAAGCCTGAGCTTTCATTCAACTCCCTATTTCCATGCAAAGACGCTGGGCAA
ACCACATGTTCTGTCTGAGCCTCAGTTTTCCTATCCATAAAATGAAGGTAGCCAGGCCTG
CCTCAAAGAGCATTCAGGAGGCTCTGAGAGGACATGAGAGTATTTTGCAAAGTGAGGGCA
AGGCCCAGTGTGGAGTGATATTGTTATTCCAAGATTCCACTGCAAAAGTGGCTGCTTTGG
ATGCCAGCCCAGGATGAGTAGTTCCTGTTCTCAGGGAGGTCATCCGCTGAGCATCCCTTC
TGCACAGATGTCTCTGATTCTTGTCCTTGCAGGTGGAGGACAGGGCCTGCTCCCCTAAGC
TGGGAAGCCTGGAATGACCTCTTGCACAAGCCTAAATTCCAGGAATCTTCCCCAAATCCC
AGATCCTCTGCAATCTACCTGCACCCCTGACCCACCCAGGAGTTGGACCGGGAGTTGGGA
AGCCTAGGTCTTAGTCCTACACTCCTTCTAATTTGCTGTGTAACCTTACCATTAATCTCT
CTGGGTCTCAGTTTTCTCATCTGTATTGGAGGTAGCAGTGCTAGCTCTGCCTTCAGGCAT
GCAATATGCCAGAACTACAGACAACAGCCCACAGGATGCAAAAGTGCTTTGCCATCTTAA
AAATGCCAGATCACTCAGAGCCTATGAATGTGGATATCAACACCAGGTCTCTAGCACCGC
TGGATGAAAGGAGAAGGCTAGAGGCTGAGGGAGGAAAGAGCAGTTAACAAACAAAGGCAG
TAGCTCATCACTTGGGTAGCAGGTACCCATTTTAGGACCCTACACTCAAATGTGCAAAAT
AAAATTTCTATCATTTTGCTATAAAAAAAAAAAAAAAAAAAAA
>NM_004967
GAGTGAGTGAGAGGGCAGAGGAAATACTCAATCTGTGCCACTCACTGCCTTGAGCCTGCT
TCCTCACTCCAGGACTGCCAGAGGCTCACTCCCTTGAGCCTGCTTCCTCACTCCAGGACT
GCCAGAGGAAGCAATCACCAAAATGAAGACTGCTTTAATTTTGCTCAGCATTTTGGGAAT
GGCCTGTGCTTTCTCAATGAAAAATTTGCATCGAAGAGTCAAAATAGAGGATTCTGAAGA
AAATGGGGTCTTTAAGTACAGGCCACGATATTATCTTTACAAGCATGCCTACTTTTATCC
TCATTTAAAACGATTTCCAGTTCAGGGCAGTAGTGACTCATCCGAAGAAAATGGAGATGA
CAGTTCAGAAGAGGAGGAGGAAGAAGAGGAGACTTCAAATGAAGGAGAAAACAATGAAGA
ATCGAATGAAGATGAAGACTCTGAGGCTGAGAATACCACACTTTCTGCTACAACACTGGG
CTATGGAGAGGACGCCACGCCTGGCACAGGGTATACAGGGTTAGCTGCAATCCAGCTTCC
CAAGAAGGCTGGGGATATAACAAACAAAGCTACAAAAGAGAAGGAAAGTGATGAAGAAGA
AGAGGAGGAAGAGGAAGGAAATGAAAACGAAGAAAGCGAAGCAGAAGTGGATGAAAACGA
ACAAGGCATAAACGGCACCAGTACCAACAGCACAGAGGCAGAAAACGGCAACGGCAGCAG
CGGAGGAGACAATGGAGAAGAAGGGGAAGAAGAAAGTGTCACTGGAGCCAATGCAGAAGG
CACCACAGAGACCGGAGGGCAGGGCAAGGGCACCTCGAAGACAACAACCTCTCCAAATGG
TGGGTTTGAACCTACAACCCCACCACAAGTCTATAGAACCACTTCCCCACCTTTTGGGAA
AACCACCACCGTTGAATACGAGGGGGAGTACGAATACACGGGCGTCAATGAATACGACAA
TGGATATGAAATCTATGAAAGTGAGAACGGGGAACCTCGTGGGGACAATTACCGAGCCTA
TGAAGATGAGTACAGCTACTTTAAAGGACAAGGCTACGATGGCTATGATGGTCAGAATTA
CTACCACCACCAGTGAAGCTCCAGCCTG
>NM_002847
GCCTCCCGCCGCCTCCCGCGCGGCCATGGACTGAGCGCCGCCGGCCAGGCCGCGGGGATG
GGGCCGCCGCTCCCGCTGCTGCTGCTGCTACTGCTGCTGCTGCCGCCACGCGTCCTGCCT
GCCGCCCCTTCGTCCGTCCCCCGCGGCCGGCAGCTCCCGGGGCGTCTGGGCTGCCTGCTC
GAGGAGGGCCTCTGCGGAGCGTCCGAGGCCTGTGTGAACGATGGAGTGTTTGGAAGGTGC
CAGAAGGTTCCGGCAATGGACTTTTACCGCTACGAGGTGTCGCCCGTGGCCCTGCAGCGC
CTGCGCGTGGCGTTGCAGAAGCTTTCCGGCACAGGTTTCACGTGGCAGGATGACTATACT
CAGTATGTGATGGACCAGGAACTTGCAGACCTCCCGAAAACCTACCTGAGGCGTCCTGAA
GCATCCAGCCCAGCCAGGCCCTCAAAACACAGCGTTGGCAGCGAGAGGAGGTACAGTCGG
GAGGGCGGTGCTGCCCTGGCCAACGCCCTCCGACGCCACCTGCCCTTCCTGGAGGCCCTG
TCCCAGGCCCCAGCCTCAGACGTGCTCGCCAGGACCCATACGGCGCAGGACAGACCCCCC
GCTGAGGGTGATGACCGCTTCTCCGAGAGCATCCTGACCTATGTGGCCCACACGTCTGCG
CTGACCTACCCTCCCGGGCCCCGGACCCAGCTCCGCGAGGACCTCCTGCCGCGGACCCTC
GGCCAGCTCCAGCCAGATGAGCTCAGCCCTAAGGTGGACAGTGGTGTGGACAGACACCAT
CTGATGGCGGCCCTCAGTGCCTATGCTGCCCAGAGGCCCCCAGCTCCCCCCGGGGAGGGC
AGCCTGGAGCCACAGTACCTTCTGCGTGCACCCTCAAGAATGCCCAGGCCTTTGCTGGCA
CCAGCCGCCCCCCAGAAGTGGCCTTCACCTCTGGGAGATTCCGAAGACCCCTCCAGCACA
GGCGATGGAGCACGGATTCATACCCTCCTGAAGGACCTGCAGAGGCAGCCGGCTGAGGTG
AGGGGCCTGAGTGGCCTGGAGCTGGACGGCATGGCTGAGCTGATGGCTGGCCTGATGCAA
GGCGTGGACCATGGAGTAGCTCGAGGCAGCCCTGGGAGAGCGGCCCTGGGAGAGTCTGGA
GAACAGGCGGATGGCCCCAAGGCCACCCTCCGTGGAGACAGCTTTCCAGATGACGGAGTG
CAGGACGACGATGATAGACTTTACCAAGAGGTCCATCGTCTGAGTGCCACACTCGGGGGC
CTCCTGCAGGACCACGGGTCTCGACTCTTACCTGGAGCCCTCCCCTTTGCAAGGCCCCTC
GACATGGAGAGGAAGAAGTCCGAGCACCCTGAGTCTTCCCTGTCTTCAGAAGAGGAGACT
GCCGGAGTGGAGAACGTCAAGAGCCAGACGTATTCCAAAGATCTGCTGGGGCAGCAGCCG
CATTCGGAGCCCGGGGCCGCTGCGTTTGGGGAGCTCCAAAACCAGATGCCTGGGCCCTCG
AAGGAGGAGCAGAGCCTTCCAGCGGGTGCTCAGGAGGCCCTCAGCGACGGCCTGCAATTG
GAGGTCCAGCCTTCCGAGGAAGAGGCGCGGGGCTACATCGTGACAGACAGAGACCCCCTG
CGCCCCGAGGAAGGAAGGCGGCTGGTGGAGGACGTCGCCCGCCTCCTGCAGGTGCCCAGC
AGTGCGTTCGCTGACGTGGAGGTTCTCGGACCAGCAGTGACCTTCAAAGTGAGCGCCAAT
GTCCAAAACGTGACCACTGAGGATGTGGAGAAGGCCACAGTTGACAACAAAGACAAACTG
GAGGAAACCTCTGGACTGAAAATTCTTCAAACCGGAGTCGGGTCGAAAAGCAAACTCAAG
TTCCTGCCTCCTCAGGCGGAGCAAGAAGACTCCACCAAGTTCATCGCGCTCACCCTGGTC
TCCCTCGCCTGCATCCTGGGCGTCCTCCTGGCCTCTGGCCTCATCTACTGCCTCCGCCAT
AGCTCTCAGCACAGGCTGAAGGAGAAGCTCTCGGGACTAGGGGGCGACCCAGGTGCAGAT
GCCACTGCCGCCTACCAGGAGCTGTGCCGCCAGCGTATGGCCACGCGGCCACCAGACCGA
CCTGAGGGCCCGCACACGTCACGCATCAGCAGCGTCTCATCCCAGTTCAGCGACGGGCCG
ATCCCCAGCCCCTCCGCACGCAGCAGCGCCTCATCCTGGTCCGAGGAGCCTGTGCAGTCC
AACATGGACATCTCCACCGGCCACATGATCCTGTCCTACATGGAGGACCACCTGAAGAAC
AAGAACCGGCTGGAGAAGGAGTGGGAAGCGCTGTGCGCCTACCAGGCGGAGCCCAACAGC
TCGTTCGTGGCCCAGAGGGAGGAGAACGTGCCCAAGAACCGCTCCCTGGCTGTGCTGACC
TATGACCACTCCCGGGTCCTGCTGAAGGCGGAGAACAGCCACAGCCACTCAGACTACATC
AACGCTAGCCCCATCATGGATCACGACCCGAGGAACCCCGCGTACATCGCCACCCAGGGA
CCGCTGCCCGCCACCGTGGCTGACTTTTGGCAGATGGTGTGGGAGAGCGGCTGCGTGGTG
ATCGTCATGCTGACACCCCTCGCGGAGAACGGCGTCCGGCAGTGCTACCACTACTGGCCG
GATGAAGGCTCCAATCTCTACCACATCTATGAGGTGAACCTGGTCTCCGAGCACATCTGG
TGTGAGGACTTCCTGGTGAGGAGCTTCTATCTGAAGAACCTGCAGACCAACGAGACGCGC
ACCGTGACGCAGTTCCACTTCCTGAGTTGGTATGACCGAGGAGTCCCTTCCTCCTCAAGG
TCCCTCCTGGACTTCCGCAGAAAAGTAAACAAGTGCTACAGGGGCCGTTCTTGTCCAATA
ATTGTTCATTGCAGTGACGGTGCAGGCCGGAGCGGCACCTACGTCCTGATCGACATGGTT
CTCAACAAGATGGCCAAAGGTGCTAAAGAGATTGATATCGCAGCGACCCTGGAGCACTTG
AGGGACCAGAGACCCGGCATGGTCCAGACGAAGGAGCAGTTTGAGTTCGCGCTGACAGCC
GTGGCTGAGGAGGTGAACGCCATCCTCAAGGCCCTTCCCCAGTGAGCGGCAGCCTCAGGG
GCCTCAGGGGAGCCCCCACCCCACGGATGTTGTCAGGAATCATGATCTGACTTTAATTGT
GTGTCTTCTATTATAACTGCATAGTAATAGGGCCCTTAGCTCTCCCGTAGTCAGCGCAGT
TTAGCAGTTAAAAGTGTATTTTTGTTTAATCAAACAATAATAAAGAGAGATTTGTGGAAA
AATCCAGTTACGGGTGGAGGGGAATCGGTTCATCAATTTTCACTTGCTTAAAAAAAATAC
TTTTTCTTAAAGCACCCGTTCACCTTCTTGGTTGAAGTTGTGTTAACAATGCAGTAGCCA
GCACGTTCGAGGCGGTTTCCAGGAAGAGTGTGCTTGTCATCTGCCACTTTCGGGAGGGTG
GATCCACTGTGCAGGAGTGGCCGGGGAAGCTGGCAGCACTCAGTGAGGCCGCCCGGCACA
CAAGGCACGTTTGGCATTTCTCTTTGAGAGAGTTTATCATTGGGAGAAGCCGCGGGGACA
GAACTGAACGTCCTGCAGCTTCGGGGCAAGTGAGACAATCACAGCTCCTCGCTGCGTCTC
CATCAACACTGCGCCGGGTACCATGGACGGCCCCGTCAGCCACACCTGTCAGCCCAAGCA
GAGTGATTCAGGGGCTCCCCGGGGGCAGACACCTGTGCACCCCATGAGTAGTGCCCACTT
GAGGCTGGCACTCCCCTGACCTCACCTTTGCAAAGTTACAGATGCACCCCAACATTGAGA
TGTGTTTTTAATGTTAAAATATTGATTTCTACGTTATGAAAACAGATGCCCCCGTGAATG
CTTACCTGTGAGATAACCACAACCAGGAAGAACAAATCTGGGCATTGAGCAAGCTATGAG
GGTCCCCGGGAGCACACGAACCCTGCCAGGCCCCCGCTGGCTCCTCCAGGCACGTCCCGG
ACCTGTGGGGCCCCAGAGAGGGGACATTTCCCTCCTGGGAGAGAAGGAGATCAGGGCAAC
TCGGAGAGGGCTGCGAGCATTTCCCTCCCGGGAGAGGAGATCAGGGCGACCTGCACGCAC
TGCGTAGAGCCTGGAAGGGAAGTGAGAAACCAGCCGACCGGCCCTGCCCCTCTTCCCGGG
ATCACTTAATGAACCACGTGTTTTGACATCATGTAAACCTAAGCACGTAGAGATGATTCG
GATTTGACAAAATAACATTTGAGTATCCGATTCGCCATCACCCCCTACCCCAGAAATAGG
ACAATTCACTTCATTGACCAGGATGATCACATGGAAGGCGGCGCAGAGGCAGCTGTGTGG
GCTGCAGATTTCCTGTGTGGGGTTCAGCGTAGAAAACGCACCTCCATCCCGCCCTTCCCA
CAGCATTCCTCCATCTTAGATAGATGGTACTCTCCAAAGGCCCTACCAGAGGGAACACGG
CCTACTGAGCGGACAGAATGATGCCAAAATATTGCTTATGTCTCTACATGGTATTGTAAT
GAATATCTGCTTTAATATAGCTATCATTTCTTTTCCAAAATTACTTCTCTCTATCTGGAA
TTTAATTAATCGAAATGAATTTATCTGAATATAGGAAGCATATGCCTACTTGTAATTTCT
AACTCCTTATGTTTGAAGAGAAACCTCCGGTGTGAGATATACAAATATATTTAATTGTGT
CATATTAAACTTCTGATTCAAAAAAAA
>BC002551
GGCACGAGGCCACGAGCTGTTGTGCATCCAGAGGTGGAATTGGGGCCCGGCATTCCCTCC
TCGTCCCGGGCTGGCCCTTGCCCCCACCCTGCAACTCCTGGTTGAGATGGGCTCAGCCAA
GAGCGTCCCAGTCACACCAGCGCGGCCTCCGCCGCACAACAAGCATCTGGCTCGAGTGGC
GGACCCCCGTTCACCTAGTGCTGGCATCCTGCGCACTCCCATCCAGGTGGAGAGCTCTCC
ACAGCCAGGCCTACCAGCAGGGGAGCAACTGGAGGGTCTTAAACATGCCCAGGACTCAGA
TCCCCGCTCTCCTACTCTTGGTATTGCACGGACACCTATGAAGACCAGCAGTGGAGACCC
CCCAAGCCCACTGGTGAAACAGCTGAGTGAAGTATTTGAAACTGAAGACTCTAAATCAAA
TCTTCCCCCAGAGCCTGTTCTGCCCCCAGAGGCACCTTTATCTTCTGAATTGGACTTGCC
TCTGGGTACCCAGTTATCTGTTGAGGAACAGATGCCACCTTGGAACCAGACTGAGTTCCC
CTCCAAACAGGTGTTTTCCAAGGAGGAAGCAAGACAGCCCACAGAAACCCCTGTGGCCAG
CCAGAGCTCCGACAAGCCCTCAAGGGACCCTGAGACTCCCAGATCTTCAGGTTCTATGCG
CAATAGATGGAAACCAAACAGCAGCAAGGTACTAGGGAGATCCCCCCTCACCATCCTGCA
GGATGACAACTCCCCTGGCACCCTGACACTACGACAGGGTAAGCGGCCTTCACCCCTAAG
TGAAAATGTTAGTGAACTAAAGGAAGGAGCCATTCTTGGAACTGGACGACTTCTGAAAAC
TGGAGGACGAGCATGGGAGCAAGGCCAGGACCATGACAAGGAAAATCAGCACTTTCCCTT
GGTGGAGAGCTAGGCCCTGCATGGCCCCAGCAATGCAGTCACCCAGGGCCTGGTGATATC
TGTGTCCTCTCACCCCTTCTTTCCCAGGGATACTGAGGAATGGCTTGTTTTCTTAGACTC
CTCCTCAGCTACCAAACTGGGACTCACAGCTTTATTGGGCTTTCTTTGTGTCTTGTGTGT
TTCTTTTATATTAAAGGAAGTAATTTTAAATGTTACTTTAAAAAGGTAAAAAAAAAAAAA
AAAAAAAA
>AL039118
GCATTCGTAGTAAAGGTGCCCAAGAAATTATTTTGGCCATTTATTGTTTTGTCCTTTTCT
TTAAAGAACTGTTTTTTTTTCTTTTGTTTACTTTTAGACCAAAGATTGGGTTCTAGAAAA
TGCACTTGGTATACTAAGTATTAAAACAAACAAAAAGGAAAGTTGTTTCAGTTGGCAACA
CTGCCCATTCAATTGAATCAGAAGGGGACAAAATTAACGATTGCCTTCAGTTTGTGTTGT
GTATATTTTGATGTATGTGGTCACTAACAGGTCACTTTTATTTTTTCTAAATGTAGTGAA
ATGTTAATACCTATTGTACTTATAGGTAAACCTTGCAAATATGTAACCTGTGTTGCGCAA
ATGCCGCATAAATTTGAGTGATTGTTAATGTTGTCTTAAAATTTCTTGATTGTGATACTG
TGGTCATATGCCCGTGTTTGTCACTTACAAAAATGTTTACTATGAACACACAGAAATAAA
AAATAGGCTAAATTCATATAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>NM_000198
GAGGCAGTAAGGACTTGGACTCCTCTGTCCAGCTTTTAACAATCTAAGTTACGGTTACCC
TCTTCTGGGTCACGCTAGAATCAGATCTGCTCTCCAGCATCTTCTGTTTCCTGGCAAGTG
TTTCCTGCTACTTTGGATTGGCCACGATGGGCTGGAGCTGCCTTGTGACAGGAGCAGGAG
GGCTTCTGGGTCAGAGGATCGTCCGCCTGTTGGTGGAAGAGAAGGAACTGAAGGAGATCA
GGGCCTTGGACAAGGCCTTCAGACCAGAATTGAGAGAGGAATTTTCTAAGCTCCAGAACA
GGACCAAGCTGACTGTACTTGAAGGAGACATTCTGGATGAGCCATTCCTGAAAAGAGCCT
GCCAGGACGTCTCGGTCGTCATCCACACCGCCTGTATCATTGATGTCTTTGGTGTCACTC
ACAGAGAGTCCATCATGAATGTCAATGTGAAAGGTACCCAGCTACTGTTGGAGGCCTGTG
TCCAAGCCAGTGTGCCAGTCTTCATCTACACCAGTAGCATAGAGGTAGCCGGGCCCAACT
CCTACAAGGAAATCATCCAGAACGGCCACGAAGAAGAGCCTCTGGAAAACACATGGCCCA
CTCCATACCCGTACAGCAAAAAGCTTGCTGAGAAGGCTGTGCTGGCGGCTAATGGGTGGA
ATCTAAAAAATGGTGATACCTTGTACACTTGTGCGTTAAGACCCACATATATCTATGGGG
AAGGAGGCCCATTCCTTTCTGCCAGTATAAATGAGGCCCTGAACAACAATGGGATCCTGT
CAAGTGTTGGAAAGTTCTCTACAGTCAACCCAGTCTATGTTGGCAACGTGGCCTGGGCCC
ACATTCTGGCCTTGAGGGCTCTGCGGGACCCCAAGAAGGCCCCAAGTGTCCGAGGTCAAT
TCTATTACATCTCAGATGACACGCCTCACCAAAGCTATGATAACCTTAATTACATCCTGA
GCAAAGAGTTTGGCCTCCGCCTTGATTCCAGATGGAGCCTTCCTTTAACCCTGATGTACT
GGATTGGCTTCCTGCTGGAAGTAGTGAGCTTCCTACTCAGCCCAATTTACTCCTATCAAC
CCCCCTTCAACCGCCACACAGTCACATTATCAAATAGTGTGTTCACCTTCTCTTACAAGA
AGGCTCAGCGAGATCTGGCGTATAAGCCACTCTACAGCTGGGAGGAAGCCAAGCAGAAAA
CCGTGGAGTGGGTTGGTTCCCTTGTGGACCGGCACAAGGAGACCCTGAAGTCCAAGACTC
AGTGATTTAAGGATGACAGAGATGTGCATGTGGGTATTGTTAGGAAATGTCATCAAACTC
CACCCACCTGGCTTCATACAGAAGGCAACAGGGGCACAAGCCCAGGTCCTGCTGCCTCTC
TTTCACACAATGCCCAACTTACTGTCTTCTTCATGTCATCAAAATCTGCACAGTCACTGG
CCCAACCAGAACTTTCTGTCCTAATCATACACCAGAAGACAAACAATATGATTTGCTGTT
ACCAAATCTCAGTGGCTGATTCTGAACAATTGTGGTCTCTCTTAACTTGAGGTTCTCTTT
TGACTAATAGAGCTCCATTTCCCCTCTTAAATGAGAAAGCATTTCTTTTCTCTTTAATCT
CCTATTCCTTCACACAGTTCAACATAAAGAGCAATAAATGTTTTAATGCTTAA
>H05388
AAATTTTGACCCCATATAAAGAAATGTGTTATGTATGTTGTGCCTCCTTAGAGACATAAA
TTTAGTGTCAAAACATGGGAGATGGCTTACTCAGAAGCATACTCCACTTAACATACCATG
GCCTGAGCTAAGTACCATGTCCTGTTTGTGTCTTATTTTTAAATATTTTCTTTGTCCACA
TGGGCCGTTGACCTTAGAGTTAAGGCGGTTGCTTTTTTGAAGAAATCACCAAAGTTTCTG
GGAAACTATGTTCAAGGTTGAAATGGAGAGTAGATTTAATTTTATTTGTCTTGTAGGGAA
GAAATCTTCCTTTGAACCGCTTTTCTTGCTTTTTCCCTTTTTCCCAAACTAGGTTACAGG
TTCTTATCTGCAAGGTTCAAGTTGCTTAGACATTGTTTTCCAGTATTCTGCAGGGCCAGT
CAGTTGTACAGAAGTTGGAATATTCTGTTCCAGAATTAAAGAAGTTTTTAGATTATGAAA
TATTATGATAATAAAGCTATATTTCTGAAAAAAAAAAA
>NM_004062
GAAGGAGCTCTCTTCTTGCTTGGCAGCTGGACCAAGGGAGCCAGTCTTGGGCGCTGGAGG
GCCTGTCCTGACCATGGTCCCTGCCTGGCTGTGGCTGCTTTGTGTCTCCGTCCCCCAGGC
TCTCCCCAAGGCCCAGCCTGCAGAGCTGTCTGTGGAAGTTCCAGAAAACTATGGTGGAAA
TTTCCCTTTATACCTGACCAAGTTGCCGCTGCCCCGTGAGGGGGCTGAAGGCCAGATCGT
GCTGTCAGGGGACTCAGGCAAGGCAACTGAGGGCCCATTTGCTATGGATCCAGATTCTGG
CTTCCTGCTGGTGACCAGGGCCCTGGACCGAGAGGAGCAGGCAGAGTACCAGCTACAGGT
CACCCTGGAGATGCAGGATGGACATGTCTTGTGGGGTCCACAGCCTGTGCTTGTGCACGT
GAAGGATGAGAATGACCAGGTGCCCCATTTCTCTCAAGCCATCTACAGAGCTCGGCTGAG
CCGGGGTACCAGGCCTGGCATCCCCTTCCTCTTCCTTGAGGCTTCAGACCGGGATGAGCC
AGGCACAGCCAACTCGGATCTTCGATTCCACATCCTGAGCCAGGCTCCAGCCCAGCCTTC
CCCAGACATGTTCCAGCTGGAGCCTCGGCTGGGGGCTCTGGCCCTCAGCCCCAAGGGGAG
CACCAGCCTTGACCACGCCCTGGAGAGGACCTACCAGCTGTTGGTACAGGTCAAGGACAT
GGGTGACCAGGCCTCAGGCCACCAGGCCACTGCCACCGTGGAAGTCTCCATCATAGAGAG
CACCTGGGTGTCCCTAGAGCCTATCCACCTGGCAGAGAATCTCAAAGTCCTATACCCGCA
CCACATGGCCCAGGTACACTGGAGTGGGGGTGATGTGCACTATCACCTGGAGAGCCATCC
CCCGGGACCCTTTGAAGTGAATGCAGAGGGAAACCTCTACGTGACCAGAGAGCTGGACAG
AGAAGCCCAGGCTGAGTACCTGCTCCAGGTGCGGGCTCAGAATTCCCATGGCGAGGACTA
TGCGGCCCCTCTGGAGCTGCACGTGCTGGTGATGGATGAGAATGACAACGTGCCTATCTG
CCCTCCCCGTGACCCCACAGTCAGCATCCCTGAGCTCAGTCCACCAGGTACTGAAGTGAC
TAGACTGTCAGCAGAGGATGCAGATGCCCCCGGCTCCCCCAATTCCCACGTTGTGTATCA
GCTCCTGAGCCCTGAGCCTGAGGATGGGGTAGAGGGGAGAGCCTTCCAGGTGGACCCCAC
TTCAGGCAGTGTGACGCTGGGGGTGCTCCCACTCCGAGCAGGCCAGAACATCCTGCTTCT
GGTGCTGGCCATGGACCTGGCAGGCGCAGAGGGTGGCTTCAGCAGCACGTGTGAAGTCGA
AGTCGCAGTCACAGATATCAATGATCACGCCCCTGAGTTCATCACTTCCCAGATTGGGCC
TATAAGCCTCCCTGAGGATGTGGAGCCCGGGACTCTGGTGGCCATGCTAACAGCCATTGA
TGCTGACCTCGAGCCCGCCTTCCGCCTCATGGATTTTGCCATTGAGAGGGGAGACACAGA
AGGGACTTTTGGCCTGGATTGGGAGCCAGACTCTGGGCATGTTAGACTCAGACTCTGCAA
GAACCTCAGTTATGAGGCAGCTCCAAGTCATGAGGTGGTGGTGGTGGTGCAGAGTGTGGC
GAAGCTGGTGGGGCCAGGCCCAGGCCCTGGAGCCACCGCCACGGTGACTGTGCTAGTGGA
GAGAGTGATGCCACCCCCCAAGTTGGACCAGGAGAGCTACGAGGCCAGTGTCCCCATCAG
TGCCCCAGCCGGCTCTTTCCTGCTGACCATCCAGCCCTCCGACCCCATCAGCCGAACCCT
CAGGTTCTCCCTAGTCAATGACTCAGAGGGCTGGCTCTGCATTGAGAAATTCTCCGGGGA
GGTGCACACCGCCCAGTCCCTGCAGGGCGCCCAGCCTGGGGACACCTACACGGTGCTTGT
GGAGGCCCAGGATACAGATGAGCCGAGACTGAGCGCTTCTGCACCCCTGGTGATCCACTT
CCTAAAGGCCCCTCCTGCCCCAGCCCTGACTCTTGCCCCTGTGCCCTCCCAATACCTCTG
CACACCCCGCCAAGACCATGGCTTGATCGTGAGTGGACCCAGCAAGGACCCCGATCTGGC
CAGTGGGCACGGTCCCTACAGCTTCACCCTTGGTCCCAACCCCACGGTGCAACGGGATTG
GCGCCTCCAGACTCTCAATGGTTCCCATGCCTACCTCACCTTGGCCCTGCATTGGGTGGA
GCCACGTGAACACATAATCCCCGTGGTGGTCAGCCACAATGCCCAGATGTGGCAGCTCCT
GGTTCGAGTGATCGTGTGTCGCTGCAACGTGGAGGGGCAGTGCATGCGCAAGGTGGGCCG
CATGAAGGGCATGCCCACGAAGCTGTCGGCAGTGGGCATCCTTGTAGGCACCCTGGTAGC
AATAGGAATCTTCCTCATCCTCATTTTCACCCACTGGACCATGTCAAGGAAGAAGGACCC
GGATCAACCAGCAGACAGCGTGCCCCTGAAGGCGACTGTCTGAATGGCCCAGGCAGCTCT
AGCTGGGAGCTTGGCCTCTGGCTCCATCTGAGTCCCCTGGGAGAGAGCCCAGCACCCAAG
ATCCAGCAGGGGACAGGACAGAGTAGAAGCCCCTCCATCTGCCCTGGGGTGGAGGCACCA
TCACCATCACCAGGCATGTCTGCAGAGCCTGGACACCAACTTTATGGACTGCCCATGGGA
GTGCTCCAAATGTCAGGGTGTTTGCCCAATAATAAAGCCCCAGAGAACTGGGCTGGGCCC
TATGGGATTGGTA
>AA782845
TCTTTACCTATGTGAAGCGAGGTGACGTGATACGTCACTGGCGCCGTCTTATAATTTAGA
TGTAAAAATCTTTAGAAACAAATAAAACTCTCTATATATGTGTATGTCTGTGTACAAAAA
AATGACAGAGCTGATGGCCAGTGTATACAGAGCGTGGCCCGCGGTGTACAATACCCATAT
AAGGTACATTGTGCAGGAGGGGAATTGCTGGCTGCTTTTACTTCCTGACCAAGACTGAAA
AATTATTTACTGAAATCTGTAAACCTTTTTATGAAACTTTTAAGCACCAGGCTGTTTACT
TACACAATTTAGGTCTGCCAGAAAATTCTATCTGTGATAGATCTGTAAAGAGGGTCAGGG
GTTAGAGTTTACTATTTTTGAAGTTTACATTGTTACATATGAAATGGAAACATTATTTTG
AAACGTTGTCATAACCCAATGGTGCATTCTGTAACCATGGAGTCTTCTGTTTCCTGGGGG
AAAGGGGCATTCATGACCTGAACTTTTTAGCAAATTATTATTCTCAGTTTCCATTACCTG
TTTGGCCAAACAGATTAATAAAATATTTGAAAAAGAAGCAATAAAAAAAAAA
>AI457360
CTGAGAAAGTCCGGTCCCTATAAGGGGACATCAGTGCGAGACCTGCTCCGTGCTGTGAGN
ACAAGAGGCACCATACAAGNAAGCTCCCAGTTGAGGTGCGACAGGCACTCGCCNAAGTCC
NTGATGGCTTCGTCCAGTACTCACAAAACGGCTCCCCCCGGCTGGTCCTTCACACGCACC
GAGCCATGAGGAGCTGGCGCCTCTGAGAGCCTCTTCCTGCCCTACTACCCGCCAGACTCA
GAGGCCAGGAGGCCATGCCCTGGGGCCACAGGGAGGTGAGGTGGGCTGGATGCCACACAG
ATGGTCTCCGTGCTGGCTCACTGAAGAGCTGAGCCTGTGGCTGGCCTCAGAATCAGGCTG
GGTGCAGTGGCTCACACCTGTAATCCCAGCATTTTGGGAGGCTGAGTGAGAGGATCACTT
GAGCTCAGGAGTTCGAGACCAGCCTGGCCAACATGGCAACACCCCATTTCTACAAAAAAT
TTGTAAAATTAGCCAGGCATGGTGGCGCACGCCTGTAGTCCCAGCTGCTTGGGAGGCTGA
GGTGGGAGAATCACTTGAGCCCAGGAGTTCGAGGCTGCAGTGAGCCAGGATCATGCCACT
GCACTCCAGCCTGGTCCACAGAGAGACACTGTCACCCCCTTTCCCCCACAAGACTGGCAG
AGGCTGGGCAGCCTGGGGCTGATGAAGCAGAGATGTTCGCTGGATCCCAGGCCCTGGCAC
CCCTCAGGAAATACAAGAAAAAGAATATTCACATCTGTTTAATGTGCATAAAGCCAAGGA
AAGGACAGTTCCGAATTCAAAAAAAAAAAAAAAAAAAA
>BF446419
TTTTTTTTTTTTTTTTTAAATATTTAACTTATTTATTTAACAAAGTAGAAGGGAATCCAT
TGCTAGCTTTTCTGTGTTGGTGTCTAATATTTGGGTAGGGTGGGGGATCCCCAACAATCA
GGTCCCCTGAGATAGCTGGTCATTGGGCTGATCATTGCCAGAATCTTCTTCTCCTGGGGT
CTGGCCCCCCAAAATGCCTAACCCAGGACCTTGGGAATTCTACTCATCCCAAATGATAAT
TCCAAATGCTGTTACCCAAGGTTAGGGTGTTGAAGGAAGGTAGAGGGTGGGGCTTCAGGT
CTCAACGGCTTCCCTAACCACCCCTCTTCTCTTGGCCCAGCCTGGTTCCCCCCACTTCCA
CTCCCCTCTACTCTCTCTAGGACTGGGCTGATGAAGGCACTGCCCAAAATTTCCCCTACC
CCCAACTTTCCCCTACCCCCAACTTTCCCCACCAGCTCCACAACCCTGTTTGGAGCTACT
GCAGGACCAGAAGCACAAAGTGCGGTTTCCCAAGCCTTTGTCCATCTCAGCCCCCAGAGT
ATATCTGTGCTTGGGGAATCTCACACAGAAACTCAGGAGCACCCCCTGCCTGAGCTAAGG
GAGGTCTTATCTCTCAGGGGGGGTTTAAGTGCCGTTTGCAATAATGTCGTCTTATTTATT
TAGCGGGGTGAATATTTTATACTGTAAGTGAGCAATCAGAGTATAATGTTTATGGTGACA
AAATTAAAGGCTTTCTTATATGTTTAAAAAAAA
>BC006819
GCCTTATAAAGCACCAAGAGGCTGCCAGTGGGACATTTTCTCGGCCCTGCCAGCCCCCAG
GAGGAAGGTGGGTCTGAATCTAGCACCATGACGGAACTAGAGACAGCCATGGGCATGATC
ATAGACGTCTTTTCCCGATATTCGGGCAGCGAGGGCAGCACGCAGACCCTGACCAAGGGG
GAGCTCAAGGTGCTGATGGAGAAGGAGCTACCAGGCTTCCTGCAGAGTGGAAAAGACAAG
GATGCCGTGGATAAATTGCTCAAGGACCTGGACGCCAATGGAGATGCCCAGGTGGACTTC
AGTGAGTTCATCGTGTTCGTGGCTGCAATCACGTCTGCCTGTCACAAGTACTTTGAGAAG
GCAGGACTCAAATGATGCCCTGGAGATGTCACAGATTCCTGGCAGAGCCATGGTCCCAGG
CTTCCCAAAAGTGTTTGTGGCAATTATTCCCCTAGGCTGAGCCTGCTCATGTACCTCTGA
TTAATAAATGCTTATGAAATGAAAAAAAAAAAAAAA
>AA765597
CCAGCAAAGTCTCTTTTGACCACACGCTTTATCCGAGATGCTTAGAAGTATATTTGGCTG
TTTTATTTGCATCTTTGATTAAGATGTCTATCATTGTAAAAAGGTATTCAAAACAAAAGT
GTACTCTTTTATTATTATGAATCACATTGTACTGAGCTGTGAAGTCAGTGTTTTAAAAAT
GTAGAGTTTATTCATGGAGCATGCCATTGAGGTTTGGATGGTGGCAGGTAAAACAGAAAG
GCAAGATGTCATCTGACATTAGGCTACTTATAAATAAATGTTTATCTAGCTTTTATTTCA
TGCCCTAATGAATAAAACATGCTTCGAAAAAGAAAGTAAAAAAAAAAAACAAAA
>X78202
GGCGAGAGAGACGCTCCCGCTCGCCGCCAGCTCTGATTGGCCCAGCGGTAGGAAAGGTTA
AACCAAAAATTTTTTTACAGCCCTAGTGTGCGCCTGTAGCTCGGAAAATTAATTGTGGCT
ATAGCCGCCTCGATCGCTGTCTCCCCAGCCTCGCCGCGGACGCTCCGGGACGCGCCCGCC
CGCCGCCCGGTTCTCCCCCCCTTTGGGCTGGTGCTGCTGCTGCTGTGACTGCTGCTGCGA
AAGGAGGAGGAGGAGGAGGAAGCAGCGGGGGGGGGAGCGGTGGGTGTGGGGGAAACCAAG
AGTACAGTGGACGAGGACTCACCCCGGCGTGGTGTTCTTTTTTCTTCTTCTTTTTCTTTC
CTTTTTTTTTTTTTTTTCTAATTCCTGAGGGGTGGTTGCTGCTTTTGCTACATGACTTGC
CAGCGCCCGAGCCTGCGGTCCAACTGCGCTGCTGCCGGAGCGCTCAGTGCCGCCGCTGCC
GCCCGTGCCCCCCGCGCCCCGTTCGGCACCCACCGGTCGCCGCCCCGCCCGCGCGCCGCT
GTCCCGCTCCCGCGCCGCCGCCGCCGTTTCCCCCCGACGACTGGGTGATGCTGGACATGG
GAGATAGGAAAGAGGTGAAAATGATCCCCAAGTCCTCGTTCAGCATCAACAGCCTGGTGC
CCGAGGGCCTCCAGAACGACAACCACCACGCGAGCCACGGCCACCACAACAGCCACCACC
CCCAGCACCACCACCACCACCACCACCATCACCACCACCCGCCGCCGCCCGCCCCGCAAC
CGCCGCCGCCGCCGCAGCAGCAGCAGCCGCCGCCGCCGCCGAGACGCGGGGCCCGGCGCC
GACGACGACGAGGCCCCAGCAGTTGTTGTTCCGCCGCGCACGCACACGGCGCGCCTGAGG
GCCAACGGCAGCTGGCGCAAGGCGACCGGCGCGGCCGGGGGATCTGCCCCGTCGGGCCGG
ACGAGAAGGAGAAGGCCCGCGCCGGGGGGGAGGAGAAGAAGGGGGCGGGCGAGGGCGGCA
AGGACGGGGAGGGGGGCAAGGAGGGCGAGAAGAAGAACGGCAAGTACGAGAAGCCGCCGT
TCAGCTACAACGCGCTCATCATGATGGCCATGCGGCAGAGCCCCGAGAAGCGGCTCACGC
TCAACGGCATCTACGAGTTCATCATGAAGAACTTCCCTTACTACCGCGAGAACAAGCAGG
GCTGGCAGAACTCCATCCGCCACAATCTGTCCCTCAACAAGTGCTTCGTGAAGGTGCCGC
GCCACTACGACGACCCGGGCAAGGGCAACTACTGGATGCTGGACCCGTCGAGCGACGACG
TGTTCATCGGCGGCACCACGGGCAAGCTGCGGCGCTCCACCACCTCGCCGGCCAAGCCGG
CCTTCAAGCGCGGTGCCGCGCTCACCTCCACCGGCCTCACCTTCATGGACGCGCCGGCTC
CCTCTACTGGCCCATGTCGCCCTTCCTGTCCCTGCACCACCCCCGCCAGCAGCACTTTGA
GTTACAACGGGACCACGTCGGCCTACCCCAGCCACCCCATGCCCTACAGCTCCGTGTTGA
CTCAAAACTCGCTGGGCAACAACCACTCCTCCTCCACCGCCAACGGGCTGAGCGTGGACC
GGCTGGTCAACGGGGGAATCCCGTACGCCACGCACCACCTCACGGCCGCCGCGCTAACCG
CCTCGGTGCCCTGCGGCCTGCTGGTGCCCTGCTCTGGGACCTACTCCCTCAACCCCTGCT
CCGTCAACCTGCTCGCGGGCCAGACCAGTTACTTTTTCCCCCACGTCCCGCACCCGTCAA
TGACTTCGCAGAGCAGCACGTCCATGAGCGCCAGGGCCGCGTCCTCCTCCACGTCGCCGG
CAGGCCCCCCTCGACCCCTGCCCTGTGAGTCTTTAAGACCCTCTTTGCCAAGTTTTACGA
CGGGACTGTCTGGGGGACTGTCTGATTATTTCACACATCAAAATCAGGGGTCTTCTTCCA
ACCCTTTAATACATTAACATCCCTGGGACCAGACTGTAAGTGAACGTTTTACACACATTT
GCATTGTAAATGATAATTAAAAAAATAAGTCCAGGTATTTTTTATTAAGCCCCCCCCTCC
CATTTCTGTACGTTTGTTCAGTCTCTAGGGTTGTTTATTATTCTAACAAGGTGTGGAGTG
TCAGCGAGGTGCAATGTGGGGAGAATACATTGTAGAATATAAGGTTTGGAAGTCAAATTA
TAGTAGAATGTGTATCTAAATAGTGACTGCTTTGCCATTTCATTCAAACCTGACAAGTCT
ATCTCTAAGAGCCGCCAGATTTCCATGTGTGCAGTATTATAAGTTATCATGGAACTATAT
GGTGGACGCAGACCTTGAGAACAACCTAAATTATGGGGAGAATTTTAAAATGTTAAACTG
TAATTTGTATTTAAAAAGCATTCGTAGTAAAGGTGCCCAAGAAATTATTTTGGCCATTTA
TTGTTTTCTCCTTTTCTTTAAAGAACTGTTTTTTTTTCTTTTGTTTACTTTTAGACCAAA
GATTGGGCGGTTCTAGAAAATGCGCCTTGGTATACTAAGTATTAAAACAAACAAAAAGGA
AAGTTGTTTCAGTTAACGCTGCCCATTCAATTGAATCAGAAGGGGACAAAATTAACGATT
GCCTTCAGTTTGTGTTGTGTATATTTTGATGTATGTGGTCACTAACAGGTCACTTTTATT
TTTTCTAAATGTAGTGAAATGTTAATACCTATTGTACTTATAGGTAAACCTTGCAAATAT
GTAACCTGTGTTGCGCAAATGCCGCATAAATTTGAGTGATTGTTAATGTTGTCTTAAAAT
TTCTTGATTGTGACTATGTGGTCATATGCCCGTGTTTGTCACTTACAAAAATGTTTACTA
TGAACACACATAAATAAAAAATAG
>AK026790
AAAATGCTTACTCTTGTGGGCTACTTGTTGTGTGGAAAAAGGAAAACGGATTCATTTTCC
CATCGGCGACTTTATGACGACAGAAATGAACCAGTTCTGCGATTAGACAATGCACCGGAA
CCTTATGATGTGAGTTTTGGGAATTCTAGCTACTACAATCCAACTTTGAATGATTCAGCC
ATGCCAGAAAGTGAAGAAAATGCACGTGATGGCATTCCTATGGATGACATACCTCCACTT
CGTACTTCTGTATAGAACTAACAGCAAAAAGGCGTTAAACAGCAAGTGTCATCTACATCC
TAGCCTTTTGACAAATTCATCTTTCAAAAGGTTACACAAAATTACTGTCACGTTGGATTT
TGTCAAGGAGAATCATAAAAGCAGGAGACCAGTAGCAGAAATGTAGACAGGATGTATCAT
CCAAAGGTTTTCTTTCTTACAATTTTTGGCCATCCTGAGGCATTTACTAAGTAGCCTTAA
TTTGTATTTTAGTAGTATTTTCTTAGTAGAAAATATTTGTGGAATCAGATAAAACTAAAA
GATTTCACCATTACAGCCCTGCCTCATAACTAAATAATAAAAATTATTCCACCAAAAAAT
TCTAAAACAATGAAGATGACTCTTTACTGCTCTGCCTGAAGCCCTAGTACCATAATTCAA
GATTGCATTTTCTTAAATGAAAATTGAAAGGGTGCTTTTTAAAGAAAATTTGACTTAAAG
CTAAAAAGAGGACATAGCCCAGAGTTTCTGTTATTGGGAAATTGAGGCAATAGAAATGAC
AGACCTGTATTCTAGTACGTTATAATTTTCTAGATCAGCACACACATGATCAGCCCACTG
AGTTATGAAGCTGACAATGACTGCATTCAACGGGGCCATGGCAGGAAAGCTGACCCTACC
CAGGAAAGTAATAGCTTCTTTAAAAGTCTTCAAAGGTTTTGGGAATTTTAACTTGTCTTA
ATATATCTTAGGCTTCAATTATTTGGGTGCCTTAAAAACTCAATGAGAATCATGGTAAAA
AAAAAAAGTTAACCAAAGAATATACCTGTACATAATTTGTACAGTTTTAAGTTGTTAGAT
AGGAACTGGATTTCTTATGTATTAGACATTATTGCTCAATCATAATGGAATAGATTCTGC
ATCCCTAAATGTATGAACCATAAGGTTAAAAAAGATGAATGGAAATATCAAACAACTTTT
CACTGAGCATCAGTTTCATAATCAATAATATAAGAAGATTAATTTGGATTCTAGTATGTT
TCAGTTTGTTTTTAATTACCACCTTCCTTTGGTAGAAAAAATATGTTCCTTGATGTAGGA
AAGTCTAGGTTTTAGAGATTAGAGGATGAGATCAAGAGTTAAATTCCTAAAGAAGCACTG
AATATATGAAGAGAGCAAACAAATCAAGTACCAACCTAGAGGCTTTATTTTTGAATTGAT
TCATGGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTAACACAGAAACAGCT
TTCAGAAAATAAGGGATAGAAAGTAATGAAGAAAGTACTTACCCCATATTGCCATAAAAA
TAGCAAAGAAGACTGTCCCTCCATTATCGAACAAATATGTCACCTGAGTAGAAAACAAAC
AGAAATATTAGTCATGCAAATTGATTATAATAAGCCAGTGAATACTGTTTGCACTCAGGT
ACTATGATTTTTTCTCAAATAGAATCATATTATTTTATAGTACAGAAATATTATATATGA
ATTCCTTTCATGGGTCTTGCAACAATTTCACATGATTTTTCTCATGGGGAGAGGTGAAGA
AACAACATTAGCCCTCTTCTCTCCTCTCTTGATTCCCTTTATACCCCACCATCATTTCTG
ATTATAAATAATTCTACCATTCTATGGAAGTATTTGTGGGTCACAGATTGTCAAACTACT
TAATGAAAGTTGTATGAAATTAGTTTTTCAGGTGAGGCATTCCTAGTTGCAATTCCTGTT
AGCAAAACTTCTAGGAGTGGGGAAGTTGGAAAATGCAGGATTCTTCCAGTGAGCCAGCAT
TTCCCATAGCTAACCCTATTCTCTTAGTCTTTCAAAATGTAGAATGGGTCCAATAATGGC
TATAAGATGTAATAAATCCCATCTTAATTTGTTTTAAAAGTTTCATAAATCACTGAACAC
TTATGAAACAAAGTGTTTTTTAATCAGATATCAACTGAAACTTCATAAAGGATGCATAGT
TTTATAATGTTATTGAATCAAATTTTAAGGCTTGTATTGTTTGATTTTAATAAAGTATAA
TCTCCTTTTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>BC012727
GGCACGAGGCTGCCTGCCCCCCGGGTGGGGCTGCGGCTCTGGCCTCCCAGGCCCATCCTC
AACAGCTACCCCAGCCAACACCAAGGCCACAAGGGGACCCCGGCCTAGGAGGCAGGAAGC
CAAGGTACAGAGAGCAGCCTGGCCCTCACCAGTGCGCAAGCTGGGGCAGCAAGGCTGACA
GTTGCTGCATGCCCAGGGCAGGGTGTGGTACTGGCACCCAAGTTCAGCATGGCAGAGCTG
GCCAACAGCTTGTCCCCGATCTGCCTCCAGCCCCAAGATGCCTACAGCCCCCAGGCCCCT
TCGGCAGCACTGCCTCTGCCCACCTGCCTTTAAGAGACTCCAGGGCTGCTCCTGTCATGC
AGCGAAGGTTTTGTCTGTTTCAAAGTTCGAGACTCAACTTGAGGGACTGTTTTTGACAAT
CCCCGCTGACCTCCGCTCCTCGTGGCGCCCTGGCCCTACACCCAGCCTGGCCCAGGGCCG
GCTTTGCCTGGTGAGGCTGGAGGGAGCACCAGGACCTGCTGTCTGCTGTCAGCCCCTCCT
GGTGCTGGTGCCCTGATGCTGTGCCTTGTCACCCATTGAGCTGCAAGAGGGACCAAGAGG
GGGCCACGCAGCCAGCCAGATGCCTGGCCCTGTGCTGGGGCAGACAACGCTGCAGAGCCC
AGGGAGCCTGGCGCTAGGACGTGCGTCCTTGTGACACTGGCCTGTCTGAACTCACCTGGC
CTGGGAAGCACCGTCTGCCCGGGCCCAAGCCCTGCCCCTCCAGAGTCCAGAGCCAGGAAG
GGGCTGCTGAGGGCGAGCATCCTGCTGGGCTCTCTGCCCGGCCCACCCCTCCAAGGGGCT
GGCCTGTGAGCCTTGACTGGGATTCATGATGTGGAGGCCCCCAACTTCCAGAAGCAGCTG
GTACTCTGCTCACACAAGCGACTGGGCCGGCCGGCCCTGGACCCCTAGACCCCGAGCCGC
CTGCCGACTGCCTGCACAGGGAGAGCAGTTGAGGCCCGGGCAGGGCCCCCACACCAGACC
CCAACATAGCTTCCCCACCCAGGCACCCCCTCCCGGGGCAGCAGGCGTGGGAGTCAGGGC
TGCATGCTCCTCCCCTCCCACCTCACAGGCGGCCTTAGGCAAGTCATTTTCTGTCATCAC
AAGGTCGCCTCTGCCTAGTCAGGTCCTGGCGTCCAGAGTAAGGATGTGCGGCCCCCAGGC
CCCCGCACACCTCCCTCAGCACCAAGACCGGGACCCCCCCACCCACGTGTCTCATTGTGG
CTGCCTATGGACTCCCGGGCCTTGTGTGCAGGCCAGGCCCTTCCACTGATTTTTTAAAGT
GAACCATTGCTGGATCTCAGATTCTGTGGCATCTAAGGCCTAGCAGGGGTGGGCACACGG
GTCACCCGAGGCCCATACCAAGACTCTGTTCCTGCCCTAGGCCCAGTCTCAAAGGAAGCC
ACAAGGCGCGGGGGCCACTGAGGAAGGAAATGTTCATTTTCATTTGTCCAAAACCACCTT
AAGTTTTAAGTATATTAATCTTGATGCTTTTTAACTATTGCTTTTTAACTTGCTGAGATT
TAGAAATACTGTTATAAAAACTTTTTTAATTTCTGTATTTTTTTTCTGTATTGTATCTTC
ATGGGACATTAGGGGTTTTCTATGGTAAGCACACCTATGGTTTTGGTAAAAACATTATCA
AATATATATCCAGACGGTTCTTCCCTAGAAGAAAAACAAGTCTTTACACCTGATAAAATA
TTTTGCGAAGAGAGGTGTTCTTTTTCCTTACTGGTGCTGAAAGGAAGGATGGATAACGAG
GAGAAAATAAAACTGTGAGGCTCAAAAAAAAAAAAAAAAAA
>R45389
CCTGCCCTTCTCTATATGTACCATCTCCAAAAACCATGTACATCTCCAAAAACTGGAGTA
GAAAGTTAGATTGCTCAACTACAACTCCTCTAGAACTCTATAGCTCTGACATACAGATTC
ACACTCTCCTCTATTTGCTAAGTATGTAAAGAATGTTTTCTTTTAAAATGTTCTCTTTTG
AGAACAACTGCTTATTTGTTATAAAAGCATTTGGTTAAAATGATGTCATCATAAAGAACA
GTGGCTTTGTTTCAATACATATTTTTGAGATGATTATCTAGAAGCCAGATTAATAAAATC
AGCTTGTGACCTTGCTAAGCATATAAACTGGAAATTCAGATACATTCAAAATTATGGGTT
CATTTAAAAGTGTTCTACCTTTTGGGTATGAGACTAATATCACTAATTCCTCAATAGTTA
TCATGGCTCTATCTTAATTAATTAGAAAATATGTGTGTTTAATTCTTTGAGAATTAAAAT
AGAGAATATTAACAGAGGGTTAAAAACTGCTTCAACTCCAATAAGATAAAGGAAGCTCAA
AATCTATGAGCTGAGTGTTCAATTAGCTTTGCCTACTGAGTTCAATTTTATGTCAATACA
ACAGTGGATCAGACAGTACGACTTTGAACTGGTGAATGTAAACAATTGTTTTTCACCTAA
GCTGCTTTGGAAGAACTGATGCTTGCTGCTAACTAAAGTTTTGGATGTATCGATTTAGAG
AACCAATTAATACCTGCAAAATAAAGCATACTGTGGTACTTCTGTTTGATCTAGTATGTG
TGATTTTAGATTGATGGATTAAAAATTAATAAAGATCATACATTCCATACCAAAAAAAAA
AAAAAAAA
>BC006811
CCAGAAGCCTGCATTTCTGCATTCTGCTTAATTCCCTTTCCTTAGATTTGAAAGAAGCCA
ACACTAAACCACAAATATACAACAAGGCCATTTTCTCAAACGAGAGTCAGCCTTTAACGA
AATGACCATGGTTGACACAGAGATGCCATTCTGGCCCACCAACTTTGGGATCAGCTCCGT
GGATCTCTCCGTAATGGAAGACCACTCCCACTCCTTTGATATCAAGCCCTTCACTACTGT
TGACTTCTCCAGCATTTCTACTCCACATTACGAAGACATTCCATTCACAAGAACAGATCC
AGTGGTTGCAGATTACAAGTATGACCTGAAACTTCAAGAGTACCAAAGTGCAATCAAAGT
GGAGCCTGCATCTCCACCTTATTATTCTGAGAAGACTCAGCTCTACAATAAGCCTCATGA
AGAGCCTTCCAACTCCCTCATGGCAATTGAATGTCGTGTCTGTGGAGATAAAGCTTCTGG
ATTTCACTATGGAGTTCATGCTTGTGAAGGATGCAAGGGTTTCTTCCGGAGAACAATCAG
ATTGAAGCTTATCTATGACAGATGTGATCTTAACTGTCGGATCCACAAAAAAAGTAGAAA
TAAATGTCAGTACTGTCGGTTTCAGAAATGCCTTGCAGTGGGGATGTCTCATAATGCCAT
CAGGTTTGGGCGGATGCCACAGGCCGAGAAGGAGAAGCTGTTGGCGGAGATCTCCAGTGA
TATCGACCAGCTGAATCCAGAGTCCGCTGACCTCCGGGCCCTGGCAAAACATTTGTATGA
CTCATACATAAAGTCCTTCCCGCTGACCAAAGCAAAGGCGAGGGCGATCTTGACAGGAAA
GACAACAGACAAATCACCATTCGTTATCTATGACATGAATTCCTTAATGATGGGAGAAGA
TAAAATCAAGTTCAAACACATCACCCCCCTGCAGGAGCAGAGCAAAGAGGTGGCCATCCG
CATCTTTCAGGGCTGCCAGTTTCGCTCCGTGGAGGCTGTGCAGGAGATCACAGAGTATGC
CAAAAGCATTCCTGGTTTTGTAAATCTTGACTTGAACGACCAAGTAACTCTCCTCAAATA
TGGAGTCCACGAGATCATTTACACAATGCTGGCCTCCTTGATGAATAAAGATGGGGTTCT
CATATCCGAGGGCCAAGGCTTCATGACAAGGGAGTTTCTAAAGAGCCTGCGAAAGCCTTT
TGGTGACTTTATGGAGCCCAAGTTTGAGTTTGCTGTGAAGTTCAATGCACTGGAATTAGA
TGACAGCGACTTGGCAATATTTATTGCTGTCATTATTCTCAGTGGAGACCGCCCAGGTTT
GCTGAATGTGAAGCCCATTGAAGACATTCAAGACAACCTGCTACAAGCCCTGGAGCTCCA
GCTGAAGCTGAACCACCCTGAGTCCTCACAGCTGTTTGCCAAGCTGCTCCAGAAAATGAC
AGACCTCAGACAGATTGTCACGGAACACGTGCAGCTACTGCAGGTGATCAAGAAGACGGA
GACAGACATGAGTCTTCACCCGCTCCTGCAGGAGATCTACAAGGACTTGTACTAGCAGAG
AGTCCTGAGCCACTGCCAACATTTCCCTTCTTCCAGTTGCACTATTCTGAGGGAAAATCT
GACACCTAAGAAATTTACTGTGAAAAAGCATTTTAAAAAGAAAAGGTTTTAGAATATGAT
CTATTTTATGCATATTGTTTATAAAGACACATTTACAATTTACTTTTAATATTAAAAATT
ACCATATTATGAAAAAAAAAAAAAAAA
>X05615
GCAGTGGTTTCTCCTCCTTCCTCCCAGGAAGGGCCAGGAAAATGGCCCTGGTCCTGGAGA
TCTTCACCCTGCTGGCCTCCATCTGCTGGGTGTCGGCCAATATCTTCGAGTACCAGGTTG
ATGCCCAGCCCCTTCGTCCCTGTGAGCTGCAGAGGGAAACGGCCTTTCTGAAGCAAGCAG
ACTACGTGCCCCAGTGTGCAGAGGATGGCAGCTTCCAGACTGTCCAGTGCCAGAACGACG
GCCGCTCCTGCTGGTGTGTGGGTGCCAACGGCAGTGAAGTGCTGGGCAGCAGGCAGCCAG
GACGGCCTGTGGCTTGTCTGTCATTTTGTCAGCTACAGAAACAGCAGATCTTACTGAGTG
GCTACATTAACAGCACAGACACCTCCTACCTCCCTCAGTGTCAGGATTCAGGGGACTACG
CGCCTGTTCAGTGTGATGTGCAGCATGTCCAGTGCTGGTGTGTGGACGCAGAGGGGATGG
AGGTGTATGGGACCCGCCAGCTGGGGAGGCCAAAGCGATGTCCAAGGAGCTGTGAAATAA
GAAATCGTCGTCTTCTCCACGGGGTGGGAGATAAGTCACCACCCCAGTGTTCTGCGGAGG
GAGAGTTTATGCCTGTCCAGTGCAAATTTGTCAACACCACAGACATGATGATTTTTGATC
TGGTCCACAGCTACAACAGGTTTCCAGATGCATTTGTGACCTTCAGTTCCTTCCAGAGGA
GGTTCCCTGAGGTATCTGGGTATTGCCACTGTGCTGACAGCCAAGGGCGGGAACTGGCTG
AGACAGGTTTGGAGTTGTTACTGGATGAAATTTATGACACCATTTTTGCTGGCCTGGACC
TTCCTTCCACCTTCACTGAAACCACCCTGTACCGGATACTGCAGAGACGGTTCCTCGCAG
TTCAATCAGTCATCTCTGGCAGATTCCGATGCCCCACAAAATGTGAAGTGGAGCGGTTTA
CAGCAACCAGCTTTGGTCACCCCTATGTTCCAAGCTGCCGCCGAAATGGCGACTATCAGG
CGGTGCAGTGCCAGACGGAAGGGCCCTGCTGGTGTGTGGACGCCCAGGGGAAGGAAATGC
ATGGAACCCGGCAGCAAGGGGAGCCGCCATCTTGTGCTGAAGGCCAATCTTGTGCCTCCG
AAAGGCAGCAGGCCTTGTCCAGACTCTACTTTGGGACCTCAGGCTACTTCAGCCAGCACG
ACCTGTTCTCTTCCCCAGAGAAAAGATGGGCCTCTCCAAGAGTAGCCAGATTTGCCACAT
CCTGCCCACCCACGATCAAGGAGCTCTTTGTGGACTCTGGGCTTCTCCGCCCAATGGTGG
AGGGACAGAGCCAACAGTTTTCTGTCTCAGAAAATCTTCTCAAAGAAGCCATCCGAGCAA
TTTTTCCCTCCCGAGGGCTGGCTCGTCTTGCCCTTCAGTTTACCACCAACCCAAAGAGAC
TCCAGCAAAACCTTTTTGGAGGGAAATTTTTGGTGAATGTTGGCCAGTTTAACTTGTCTG
GAGCCCTTGGCACAAGAGGCACATTTAACTTCAGTCAATTTTTCCAGCAACTTGGTCTTG
CAAGCTTCTTGAATGGAGGGAGACAAGAAGATTTGGCCAAGCCACTCTCTGTGGGATTAG
ATTCAAATTCTTCCACAGGAACCCCTGAAGCTGCTAAGAAGGATGGTACTATGAATAAGC
CAACTGTGGGCAGCTTTGGCTTTGAAATTAACCTACAAGAGAACCAAAATGCCCTCAAAT
TCCTTGCTTCTCTCCTGGAGCTTCCAGAATTCCTTCTCTTCTTGCAACATGCTATCTCTG
TGCCAGAAGATGTGGCAAGAGATTTAGGTGATGTGATGGAAACGGTACTCGACTCCCAGA
CCTGTGAGCAGACACCTGAAAGGCTATTTGTCCCATCATGCACGACAGAAGGAAGCTATG
AGGATGTCCAATGCTTTTCCGGAGAGTGCTGGTGTGTGAATTCCTGGGGCAAAGAGCTTC
CAGGCTCAAGAGTCAGAGATGGACAGCCAAGGTGCCCCACAGACTGTGAAAAGCAAAGGG
CTCGCATGCAAAGCCTCATGGGCAGCCAGCCTGCTGGCTCCACCTTGTTTGTCCCTGCTT
GTACTAGTGAGGGACATTTCCTGCCTGTCCAGTGCTTCAACTCAGAGTGCTACTGTGTTG
ATGCTGAGGGTCAGGCCATTCCTGGAACTCGAAGTGCAATAGGGAAGCCCAAGAAATGCC
CCACGCCCTGTCAATTACAGTCTGAGCAAGCTTTCCTCAGGACGGTGCAGGCCCTGCTCT
CTAACTCCAGCATGCTACCCACCCTTTCCGACACCTACATCCCACAGTGCAGCACCGATG
GGCAGTGGAGACAAGTGCAATGCAATGGGCCTCCTGAGCAGGTCTTCGAGTTGTACCAAC
GATGGGAGGCTCAGAACAAGGGCCAGGATCTGACGCCTGCCAAGCTGCTAGTGAAGATCA
TGAGCTACAGAGAAGCAGCTTCCGGAAACTTCAGTCTCTTTATTCAAAGTCTGTATGAGG
CTGGCCAGCAAGATGTCTTCCCGGTGCTGTCACAATACCCTTCTCTGCAAGATGTCCCAC
TAGCAGCACTGGAAGGGAAACGGCCCCAGCCCAGGGAGAATATCCTCCTGGAGCCCTACC
TCTTCTGGCAGATCTTAAATGGCCAACTCAGCCAATACCCGGGGTCCTACTCAGACTTCA
GCACTCCTTTGGCACATTTTGATCTTCGGAACTGCTGGTGTGTGGATGAGGCTGGCCAAG
AACTGGAAGGAATGCGGTCTGAGCCAAGCAAGCTCCCAACGTGTCCTGGCTCCTGTGAGG
AAGCAAAGCTCCGTGTACTGCAGTTCATTAGGGAAACGGAAGAGATTGTTTCAGCTTCCA
ACAGTTCTCGGTTCCCTCTGGGGGAGAGTTTCCTGGTGGCCAAGGGAATCCGGCTGAGGA
ATGAGGACCTCGGCCTTCCTCCGCTCTTCCCGCCCCGGGAGGCTTTCGCGGAGTTTCTGC
GTGGGAGTGATTACGCCATTCGCCTGGCGGCTCAGTCTACCTTAAGCTTCTATCAGAGAC
GCCGCTTTTCCCCGGACGACTCGGCTGGAGCATCCGCCCTTCTGCGGTCGGGCCCCTACA
TGCCACAGTGTGATGCGTTTGGAAGTTGGGAGCCTGTGCAGTGCCACGCTGGGACTGGGC
ACTGCTGGTGTGTAGATGAGAAAGGAGGGTTCATCCCTGGCTCACTGACTGCCCGCTCTC
TGCAGATTCCACAGTGCCCGACAACCTGCGAGAAATCTCGAACCAGTGGGCTGCTTTCCA
GTTGGAAACAGGCTAGATCCCAAGAAAACCCATCTCCAAAAGACCTGTTCGTCCCAGCCT
GCCTAGAAACAGGAGAATATGCCAGGCTGCAGGCATCGGGGGCTGGCACCTGGTGTGTGG
ACCCTGCATCAGGAGAAGAGTTGCGGCCTGGCTCGAGCAGCAGTGCCCAGTGCCCAAGCC
TCTGCAATGTGCTCAAGAGTGGAGTCCTCTCTAGGAGAGTCAGCCCAGGCTATGTCCCAG
CCTGCAGGGCAGAGGATGGGGGCTTTTCCCCAGTGCAATGTGACCAGGCCCAGGGCAGCT
GCTGGTGTGTCATGGACAGCGGAGAAGAGGTGCCTGGGACGCGCGTGACCGGGGGCCAGC
CCGCCTGTGAGAGCCCGCGGTGTCCGCTGCCATTCAACGCGTCGGAGGTGGTTGGTGGAA
CAATCCTGTGTGAGACAATCTCGGGCCCCACAGGCTCTGCCATGCAGCAGTGCCAATTGC
TGTGCCGCCAAGGCTCCTGGAGCGTGTTTCCACCAGGGCCATTGATATGTAGCCTGGAGA
GCGGACGCTGGGAGTCACAGCTGCCTCAGCCCCGGGCCTGCCAACGGCCCCAGCTGTGGC
AGACCATCCAGACCCAAGGGCACTTTCAGCTCCAGCTCCCGCCGGGCAAGATGTGCAGTG
CTGACTACGCGGGTTTGCTGCAGACTTTCCAGGTTTTCATATTGGATGAGCTGACAGCCC
GCGGCTTCTGCCAGATCCAGGTGAAGACTTTTGGCACCCTGGTTTCCATTCCTGTCTGCA
ACAACTCCTCTGTGCAGGTGGGTTGTCTGACCAGGGAGCGTTTAGGAGTGAATGTTACAT
GGAAATCACGGCTTGAGGACATCCCAGTGGCTTCTCTTCCTGACTTACATGACATTGAGA
GAGCCTTGGTGGGCAAGGATCTCCTTGGGCGCTTCACAGATCTGATCCAGAGTGGCTCAT
TCCAGCTTCATCTGGACTCCAAGACGTTCCCAGCGGAAACCATCCGCTTCCTCCAAGGGG
ACCACTTTGGCACCTCTCCTAGGACACGGTTTGGGTGCTCGGAAGGATTCTACCAAGTCT
TGACAAGTGAGGCCAGTCAGGACGGACTGGGATGCGTTAAGTGCCATGAAGGAAGCTATT
CCCAAGATGAGGAATGCATTCCTTGTCCTGTTGGATTCTACCAAGAACAGGCAGGGAGCT
TGGCCTGTGTCCCATGTCCTGTGGGCAGAACGACCATTTCTGCCGGAGCTTTCAGCCAGA
CTCACTGTGTCACTGACTGTCAGAGGAACGAAGCAGGCCTGCAATGTGACCAGAATGGCC
AGTATCGAGCCAGCCAGAAGGACAGGGGCAGTGGGAAGGCCTTCTGTGTGGACGGCGAGG
GGCGGAGGCTGCCATGGTGGGAAACAGAGGCCCCTCTTGAGGACTCACAGTGTTTGATGA
TGCAGAAGTTTGAGAAGGTTCCAGAATCAAAGGTGATCTTCGACGCCAATGCTCCTGTGG
CTGTCAGATCCAAAGTTCCTGATTCTGAGTTCCCCGTGATGCAGTGCTTGACAGATTGCA
CAGAGGACGAGGCCTGCAGCTTCTTCACCGTGTCCACGACGGAGCCAGAGATTTCCTGTG
ATTTCTATGCTTGGACAAGTGACAATGTTGCCTGCATGACTTCTGACCAGAAACGAGATG
CACTGGGGAACTCAAAGGCCACCAGCTTTGGAAGTCTTCGCTGCCAGGTGAAAGTGAGGA
GCCATGGTCAAGATTCTCCAGCTGTGTATTTGAAAAAGGGCCAAGGATCCACCACAACAC
TTCAGAAACGCTTTGAACCCACTGGTTTCCAAAACATGCTTTCTGGATTGTACAACCCCA
TTGTGTTCTCAGCCTCAGGAGCCAATCTAACCGATGCTCACCTCTTCTGTCTTCTTGCAT
GCGACCGTGATCTGTGTTGCGATGGCTTCGTCCTCACACAGGTTCAAGGAGGTGCCATCA
TCTGTGGGTTGCTGAGCTCACCCAGTGTCCTGCTTTGTAATGTCAAAGACTGGATGGATC
CCTCTGAAGCCTGGGCTAATGCTACATGTCCTGGTGTGACATATGACCAGGAGAGCCACC
AGGTGATATTGCGTCTTGGAGACCAGGAGTTCATCAAGAGTCTGACACCCTTAGAAGGAA
CTCAAGACACCTTTACCAATTTTCAGCAGGTTTATCTCTGGAAAGATTCTGACATGGGGT
CTCGGCCTGAGTCTATGGGATGTAGAAAAAACACAGTGCCAAGGCCAGCATCTCCAACAG
AAGCAGGTTTGACAACAGAACTTTTCTCCCCTGTGGACCTCAACCAGGTCATTGTCAATG
GAAATCAATCACTATCCAGCCAGAAGCACTGGCTTTTCAAGCACCTGTTTTCAGCCCAGC
AGGCAAACCTATGGTGCCTTTCTCGTTGTGTGCAGGAGCACTCTTTCTGTCAGCTCGCAG
AGATAACAGAGAGTGCATCCTTGTACTTCACCTGCACCCTCTACCCAGAGGCACAGGTGT
GTGATGACATCATGGAGTCCAATACCCAGGGCTGCAGACTGATCCTGCCTCAGATGCCAA
AGGCCCTGTTCCGGAAGAAAGTTATACTGGAAGATAAAGTGAAGAACTTTTACACTCGCC
TGCCGTTCCAAAAACTGATGGGGATATCCATTAGAAATAAAGTGCCCATGTCTGAAAAAT
CTATTTCTAATGGGTTCTTTGAATGTGAACGACGGTGCGATGCGGACCCATGCTGCACTG
GCTTTGGATTTCTAAATGTTTCCCAGTTAAAAGGAGGAGAGGTGACATGTCTCACTCTGA
ACAGCTTGGGAATTCAGATGTGCAGTGAGGAGAATGGAGGAGCCTGGCGCATTTTGGACT
GTGGCTCTCCTGACATTGAAGTCCACACCTATCCCTTCGGATGGTACCAGAAGCCCATTG
CTCAAAATAATGCTCCCAGTTTTTGCCCTTTGGTTGTTCTGCCTTCCCTCACAGAGAAAG
TGTCTCTGGAATCGTGGCAGTCCCTGGCCCTCTCTTCAGTGGTTGTTGATCCATCCATTA
GGCACTTTGATGTTGCCCATGTCAGCACTGCTGCCACCAGCAATTTCTCTGCTGTCCGAG
ACCTCTGTTTGTCGGAATGTTCCCAACATGAGGCCTGTCTCATCACCACTCTGCAAACCC
AACTCGGGGCTGTGAGATGTATGTTCTATGCTGATACTCAAAGCTGCACACATAGTCTGC
AGGGTCGGAACTGCCGACTTCTGCTTCGTGAAGAGGCCACCCACATCTACCGGAAGCCAG
GAATCTCTCTGCTCAGCTATGAGGCATCTGTACCTTCTGTGCCCATTTCCACCCATGGCC
GGCTGCTGGGCAGGTCCCAGGCCATCCAGGTGGGTACCTCATGGAAGCAAGTGGACCAGT
TCCTTGGAGTTCCATATGCTGCCCCGCCCCTGGCAGAGAGGCACTTCCAGGCACCAGAGC
CCTTGAACTGGACAGGCTCCTGGGATGCCAGCAAGCCAAGGGCCAGCTGCTGGCAGCCAG
GCACCAGAACATCCACGTCTCCTGGAGTCAGTGAAGATTGTTTGTATCTCAATGTGTTCA
TCCCTCAGAATGTGGCCCCTAACGCGTCTGTGCTGGTGTTCTTCCACAACACCATGGACA
GGGAGGAGAGTGAAGGATGGCCGGCTATCGACGGCTCCTTCTTGGCTGCTGTTGGCAACC
TCATCGTGGTCACTGCCAGCTACCGAGTGGGTGTCTTCGGCTTCCTGAGTTCTGGATCCG
GAGAGGTGAGTGGCAACTGGGGGCTGCTGGACCAGGTGGCGGCTCTGACCTGGGTGCAGA
CCCACATCCGAGGATTTGGCGGGGACCCTCGGCGCGTGTCCCTGGCAGCAGACCGTGGCG
GGGCTGATGTGGCCAGCATCCACCTTCTCACGGCCAGGGCCACCAACTCCCAACTTTTCC
GGAGAGCTGTGCTGATGGGAGGCTCCGCACTCTCCCCGGCCGCCGTCATCAGCCATGAGA
GGGCTCAGCAGCAGGCAATTGCTTTGGCAAAGGAGGTCAGTTGCCCCATGTCATCCAGCC
AAGAAGTGGTGTCCTGCCTCCGCCAGAAGCCTGCCAATGTCCTCAATGATGCCCAGACCA
AGCTCCTGGCCGTGAGTGGCCCTTTCCACTACTGGGGTCCTGTGATCGATGGCCACTTCC
TCCGTGAGCCTCCAGCCAGAGCACTGAAGAGGTCTTTATGGGTAGAGGTCGATCTGCTCA
TTGGGAGTTCTCAGGACGACGGGCTCATCAACAGAGCAAAGGCTGTGAAGCAATTTGAGG
AAAGTCGAGGCCGGACCAGTAGCAAAACAGCCTTTTACCAGGCACTGCAGAATTCTCTGG
GTGGCGAGGACTCAGATGCCCGCGTCGAGGCTGCTGCTACATGGTATTACTCTCTGGAGC
ACTCCACGGATGACTATGCCTCCTTCTCCCGGGCTCTGGAGAATGCCACCCGGGACTACT
TTATCATCTGCCCTATAATCGACATGGCCAGTGCCTGGGCAAAGAGGGCCCGAGGAAACG
TCTTCATGTACCATGCTCCTGAAAACTACGGCCATGGCAGCCTGGAGCTGCTGGCGGATG
TTCAGTTTGCCTTGGGGCTTCCCTTCTACCCAGCCTACGAGGGGCAGTTTTCTCTGGAGG
AGAAGAGCCTGTCGCTGAAAATCATGCAGTACTTTTCCCACTTCATCAGATCAGGAAATC
CCAACTACCCTTATGAGTTCTCACGGAAAGTACCCACATTTGCAACCCCCTGGCCTGACT
TTGTACCCCGTGCTGGTGGAGAGAACTACAAGGAGTTCAGTGAGCTGCTCCCCAATCGAC
AGGGCCTGAAGAAAGCCGACTGCTCCTTCTGGTCCAAGTACATCTCGTCTCTGAAGACAT
CTGCAGATGGAGCCAAGGGCGGGCAGTCAGCAGAGAGTGAAGAGGAGGAGTTGACGGCTG
GATCTGGGCTAAGAGAAGATCTCCTAAGCCTCCAGGAACCAGGCTCTAAGACCTACAGCA
AGTGACCAGCCCTTGAGCTCCCCAAAAACCTCACCCGAGGCTGCCCACTATGGTCATCTT
TTTCTCTAAAATAGTTACTTACCTTCAATAAAGTATCTACATGCGGTG
>X79676
AGATCTCTCCAGATCACACTGTCACGTGTACCTAGCACATCTCGAGAACTCCTTTGGGCC
GTCTGGGGCCCGGGAAGGAAGCCTGAGTTCTCAAGATTCCAGGACTGAGAGTGCCAGCTT
GTCTCAAAGCCAGGTCAATGGTTTCTTTGCCAGCCATTTAGGTGACCAAACCTGGCAGGA
ATCACAGCATGGCAGCCCTTCCCCATCTGTAATATCCAAAGCCACCGAGAAAGAGACTTT
CACTGATAGTAACCAAAGCAAAACTAAAAAGCCAGGCATTTCTGATGTAACTGATTACTC
AGACCGTGGAGATTCAGACATGGATGAAGCCACTTACTCCAGCAGTCAGGATCATCAAAC
ACCAAAACAGGAATCTTCCTCTTCAGTGAATACATCCAACAAGATGAATTTTAAAACTTT
TCCTTCATCACCTCCTAGGTCTGGAGATATCTTTGAGGTTGAACTGGCTAAAAATGATAA
CAGCTTGGGGATAAGTGTCACGGGAGGTGTGAATACGAGTGTCAGACATGGTGGCATTTA
TGTGAAAGCTGTTATTCCCCAGGGAGCAGCAGAGTCTGATGGTAGAATTCACAAAGGTGA
TCGCGTCCTAGCTGTCAATGGAGTTAGTCTAGAAGGAGCCACCCATAAGCAAGCTGTGGA
AACACTGAGAAATACAGGACAGGTGGTTCATCTGTTATTAGAAAAGGGACAATCTCCAAC
ATCTAAAGAACATGTCCCGGTAACCCCACAGTGTACCCTTTCAGATCAGAATGCCCAAGG
TCAAGGCCCAGAAAAAGTGAAGAAAACAACTCAGGTCAAAGACTACAGCTTTGTCACTGA
AGAAAATACATTTGAGGTAAAATTATTTAAAAATAGCTCAGGTCTAGGATTCAGTTTTTC
TCGAGAAGATAATCTTATACCGGAGCAAATTAATGCCAGCATAGTAAGGGTTAAAAAGCT
CTTTCCTGGACAGCCAGCAGCAGAAAGTGGAAAAATTGATGTAGGAGATGTTATCTTGAA
AGTGAATGGAGCCTCTTTGAAAGGACTATCTCAGCAGGAAGTCATATCTGCTCTCAGGGG
AACTGCTCCAGAAGTATTCTTGCTTCTCTGCAGACCTCCACCTGGTGTGCTACCGGAAAT
TGATACTGCGCTTTTGACCCCACTTCAGTCTCCAGCACAAGTACTTCCAAACAGCAGTAA
AGACTCTTCTCAGCCATCATGTGTGGAGCAAAGCACCAGCTCAGATGAAAATGAAATGTC
AGACAAAAGCAAAAAACAGTGCAAGTCCCCATCCAGAAAAGACAGTTACAGTGACAGCAG
TGGGAGTGGAGAAGATGACTTAGTGACAGCTCCAGCAAACATATCAAATTCGACCTGGAG
TTCAGCTTTGCATCAGACTCTAAGCAACATGGTATCACAGGCACAGAGTCATCATGAAGC
ACCAAGAGTCAAGAAGATACCATTTGTACCATGTTTTACTATCCTCAGGAAAAGGCCCAA
TAAACCAGAGTTTGAGGACAGTAATCCTTCCCCTCTACCACCGGATATGGCTCCTGGGCA
GAGTTATCAACCCCAATCAGAATCTGCTTCCTCTAGTTCGATGGATAAGTATCATATACA
TCACATTTCTGAACCAACTAGACAAGAAAACTGGACACCTTTGAAAAATGACTTGGAAAA
TCACCTTGAAGACTTTGAACTGGAAGTAGAACTCCTCATTACCCTAATTAAATCAGAAAA
AGGAAGCCTGGGTTTTACAGTAACCAAAGGCAATCAGAGAATTGGTTGTTATGTTCATGA
TGTCATACAGGATCCAGCCAAAAGTGATGGAAGGCTAAAACCTGGGGACCGGCTCATAAA
GGTTAATGATACAGATGTTACTAATATGACTCATACAGATGCAGTTAATCTGCTCCGGGG
ATCCAAAACAGTCAGATTAGTTATTGGACGAGTTCTAGAATTACCCAGAATACCAATGTT
GCCTCATTTGCTACCGGACATAACACTAACGTGCAACAAAGAGGAGTTGGGTTTTTCCTT
ATGTGGAGGTCATGACAGCCTTTATCAAGTGGTATATATTAGTGATATTAATCCAAGGTC
CGTCGCAGCCATTGAGGGTAATCTCCAGCTATTAGATGTCATCCATTATGTGAACGGAGT
CAGCACACAAGGAATGACCTTGGAGGAAGTTAACAGAGCATTAGACATGTCACTTCCTTC
ATTGGTATTGAAAGCAACAAGAAATGATCTTCCAGTGGTCCCCAGCTCAAAGAGGTCTGC
TGTTTCAGCTCCAAAGTCAACCAAAGGCAATGGTTCCTACAGTGTGGGGTCTTGCAGCCA
GCCTGCCCTCACTCCTAATGATTCATTCTCCACGGTTGCTGGGGAAGAAATAAATGAAAT
ATCGTACCCCAAAGGAAAATGTTCTACTTATCAGATAAAGGGATCACCAAACTTGACTCT
GCCCAAAGAATCTTATATACAAGAAGATGACATTTATGATGATTCCCAAGAAGCTGAAGT
TATCCAGTCTCTGCTGGATGTTGTGGATGAGGAGTCCCAGAATCTTTTAAACGAAAATAA
TGCAGCAGGATACTCCTGTGGTCCAGGTACATTAAAGATGAATGGGAAGTTATCAGAAGA
GAGAACAGAAGATACAGACTGCGATGGTTCACCTTTACCTGAGTATTTTACTGAGGCCAC
CAAAATGAATGGCTGTGAAGAATATTGTGAAGAAAAAGTAAAAAGTGAAAGCTTAATTCA
GAAGCCACAAGAAAAGAAGACTGATGATGATGAAATAACATGGGGAAATGATGAGTTGCC
AATAGAGAGAACAAACCATGAAGATTCTGATAAAGATCATTCCTTTCTGACAAACGATGA
GCTCGCTGTACTCCCTGTCGTCAAAGTGCTTCCCTCTGGTAAATACACGGGCGCCAACTT
AAAATCAGTCATTCGAGTCCTGCGGGTTGCTAGATCAGGAATTCCTTCTAAGGAGCTGGA
GAATCTTCAAGAATTAAAACCTTTGGATCAGTGTCTAATTGGGCAAACTAAGGAAAACAG
AAGGAAGAACAGATATAAAAATATACTTCCCTATGATGCTACAAGAGTGCCTCTTGGAGA
TGAAGGTGGCTATATCAATGCCAGCTTCATTAAGATACCAGTTGGGAAAGAAGAGTTCGT
TTACATTGCCTGCCAAGGACCACTGCCTACAACTGTTGGAGACTTCTGGCAGATGATTTG
GGAGCAAAAATCCACAGTGATAGCCATGATGACTCAAGAAGTAGAAGGAGAAAAAATCAA
ATGCCAGCGCTATTGGCCCAACATCCTAGGCAAAACAACAATGGTCAGCAACAGACTTCG
ACTGGCTCTTGTGAGAATGCAGCAGCTGAAGGGCTTTGTGGTGAGGGCAATGACCCTTGA
AGATATTCAGACCAGAGAGGTGCGCCATATTTCTCATCTGAATTTCACTGCCTGGCCAGA
CCATGATACACCTTCTCAACCAGATGATCTGCTTACTTTTATCTCCTACATGAGACACAT
CCACAGATCAGGCCCAATCATTACGCACTGCAGTGCTGGCATTGGACGTTCAGGGACCCT
GATTTGCATAGATGTGGTTCTGGGATTAATCAGTCAGGATCTTGATTTTGACATCTCTGA
TTTGGTGCGCTGCATGAGACTACAAAGACACGGAATGGTTCAGACAGAGGATCAATATAT
TTTCTGCTATCAAGTCATCCTTTATGTCCTGACACGTCTTCAAGCAGAAGAAGAGCAAAA
ACAGCAGCCTCAGCTTCTGAAGTGACATGAAAAGAGCCTCTGGATGCATTTCCATTTCTC
TCCTTAACCTCCAGCAGACTCCTGCTCTCTATCCAAAATAAAGATCACAGAGCAGCAAGT
TCATACAACATGCATGTTCTCCTCTATCTTAGAGGGGTATTCTTCTTGAAAATAAAAAAT
ATTGAAATGCTGTATTTTTACAGCTACTTTAACCTATGATAATTATTTACAAAATTTTAA
CACTAACCAAACAATGCAGATCTTAGGGATGATTAAAGGCAGCATTTGATGATAGCAGAC
ATTGTTACAAGGACATGGTGAGTCTATTTTTAATGCACCAATCTTGTTTATAGCAAAAAT
GTTTTCCAATATTTTAATAAAGTAGTTATTTATAGGCATACTTGAAACCAGTATTTAAGC
TTTAAATGACAGTAATATTGGCATAGAAAAAAGTAGCAAATGTTTACTGTATCAATTTCT
AATGTTTACTATATAGAATTTCCTGTAATATATTTATATACTTTTTCATGAAAATGGAGT
TATCAGTTATCTGTTTGTTACTGCATCATCTGTTTGTAATCATTATCTCACTTTGTAAAT
AAAAACACACCTTAAAACATGAACAAGCCAAAAAAAAAAAAAAA
>NM_006142
CCAGGCAGCAGTTAGCCCGCCGCCCGCCTGTGTGTCCCCAGAGCCATGGAGAGAGCCAGT
CTGATCCAGAAGGCCAAGCTGGCAGAGCAGGCCGAACGCTATGAGGACATGGCAGCCTTC
CCAGGCAGCAGTTAGCCCGCCGCCCGCCTGTGTGTCCCCAGAGCCATGGAGAGAGCCAGT
CTGATCCAGAAGGCCAAGCTGGCAGAGCAGGCCGAACGCTATGAGGACATGGCAGCCTTC
ATGAAAGGCGCCGTGGAGAAGGGCGAGGAGCTCTCCTGCGAAGAGCGAAACCTGCTCTCA
GTAGCCTATAAGAACGTGGTGGGCGGCCAGAGGGCTGCCTGGAGGGTGCTGTCCAGTATT
GAGCAGAAAAGCAACGAGGAGGGCTCGGAGGAGAAGGGGCCCGAGGTGCGTGAGTACCGG
GAGAAGGTGGAGACTGAGCTCCAGGGCGTGTGCGACACCGTGCTGGGCCTGCTGGACAGC
CACCTCATCAAGGAGGCCGGGGACGCCGAGAGCCGGGTCTTCTACCTGAAGATGAAGGGT
GACTACTACCGCTACCTGGCCGAGGTGGCCACCGGTGACGACAAGAAGCGCATCATTGAC
TCAGCCCGGTCAGCCTACCAGGAGGCCATGGACATCAGCAAGAAGGAGATGCCGCCCACC
AACCCCATCCGCCTGGGCCTGGCCCTGAACTTTTCCGTCTTCCACTACGAGATCGCCAAC
AGCCCCGAGGAGGCCATCTCTCTGGCCAAGACCACTTTCGACGAGGCCATGGCTGATCTG
CACACCCTCAGCGAGGACTCCTACAAAGACAGCACCCTCATCATGCAGCTGCTGCGAGAC
AACCTGACACTGTGGACGGCCGACAACGCCGGGGAAGAGGGGGGCGAGGCTCCCCAGGAG
CCCCAGAGCTGAGTGTTGCCCGCCACCGCCCCGCCCTGCCCCCTCCAGTCCCCGCCCTGC
CGAGAGGACTAGTATGGGGTGGGAGGCCCCACCCTTCTCCCCTAGGCGCTGTTCTTGCTC
CAAAGGGCTCCGTGGAGAGGGACTGGCAGAGCTGAGGCCACCTGGGGCTGGGGATCCCAC
TCTTCTTGCAGCTGTTGAGCGCACCTAACCACTGGTCATGCCCCCACCCCTGCTCTCCGC
ACCCGCTTCCTCCCGACCCCAGGACCAGGCTACTTCTCCCCTCCTCTTGCCTCCCTCCTG
CCCCTGCTGCCTCTTGATTCGTAGGAATTGAGGAGTGTCTCCGCCTTGTGGCTGAGAACT
GGACAGTGGCAGGGGCTGGAGATGGGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGCGCG
CGCGCCAGTGCAAGACCGAGACTGAGGGAAAGCATGTCTGCTGGGTGTGACCATGTTTCC
TCTCAATAAAGTTCCCCTGTGACACTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAA
>AW445220
CGGCCGCGAGGCCCTGAGATGAGGCTCCAAAGACCCCGACAGGCCCCGGCGGGTGGGAGG
CGCGCGCCCCGGGGCGGGCGGGGCTCCCCCTACCGGCCAGACCCGGGGAGAGGCGCGCGG
AGGCTGCGAAGGTTCCAGAAGGGCGGGGAGGGGGCGCCGCGCGCTGACCCTCCCTGGGCA
CCGCTGGGGACGATGGCGCTGCTCGCCTTGCTGCTGGTCGTGGCCCTACCGCGGGTGTGG
ACAGACGCCAACCTGACTGCGAGACAACGAGATCCAGAGGACTCCCAGCGAACGGACGAG
GGTGACAATAGAGTGTGGTGTCATGTTTGTGAGAGAGAAAACACTTTCGAGTGCCAGAAC
CCAAGGAGGTGCAAATGGACAGAGCCATACTGCGTTATAGCGGCCGTGAAAATATTTCCA
CGTTTTTTCATGGTTGCGAAGCAGTGCTCCGCTGGTTGTGCAGCGATGGAGAGACCCAAG
CCAGAGGAGAAGCGGTTTCTCCTGGAAGAGCCCATGCCCTTCTTTTACCTCAAGTGTTGT
AAAATTCGCTACTGCAATTTAGAGGGGCCACCTATCAACTCATCAGTGTTCAAAGAATAT
GCTGGGAGCATGGGTGAGAGCTGTGGTGGGCTGTGGCTGGCCATCCTCCTGCTGCTGGCC
TCCATTGCAGCCGGCCTCAGCCTGTCTTGAGCCACGGGACTGCCACAGACTGAGCCTTCC
GGAGCATGGACTCGCTCCAGACCGTTGTCACCTGTTGCATTAAACTTGTTTTCTGTTGAT
TAAAAAAAAAAAAAAAAA
>AK025701
TTCAGCCGGAACGTTACTCCGTGTCCACCCGGATCGTGTGTGTGATCGAGGCTGCGGAGA
CGCCTTTCACGGGGGGTGTCGAGGTGGACGTCTTCGGGAAACTGGGCCGTTCGCCTCCCA
ATGTCCAGTTCACCTTCCAACAGCCCAAGCCTCTCAGTGTGGAGCCGCAGCAGGGACCGC
AGGCGGGCGGCACCACACTGACCATCCACGGCACCCACCTGGACACGGGCTCCCAGGAGG
ACGTGCGGGTGACCCTCAACGGCGTCCCGTGTAAAGTGACGAAGTTTGGGGCGCAGCTCC
AGTGTGTCACTGGCCCCCAGGCGACACGGGGCCAGATGCTTCTGGAGGTCTCCTACGGGG
GGTCCCCCGTGCCCAACCCCGGCATCTTCTTCACCTACCGCGAAAACCCCGTACTGCGAG
CCTTCGAGCCGCTACGAAGCTTTGCCAGTGGTGGCCGCAGCATCAACGTCACGGGTCAGG
GCTTCAGCCTGATCCAGAGGTTTGCCATGGTGGTCATCGCGGAGCCCCTGCAGTCCTGGC
AGCCGCCGCGGGAGGCTGAATCCCTGCAGCCCATGACGGTGGTGGGTACAGACTACGTGT
TCCACAATGACACCAAGGTCGTCTTCCTGTCCCCGGCTGTGCCTGAGGAGCCAGAGGTCT
ACAACCTCACGGTGCTGATCGAGATGGACGGGCACCGTGCCCTGCTCAGAACAGAGGCCG
GGGCCTTCGAGTACGTGCCTGACCCCACCCTTGAGAACTTCACAGGTGGCGTCAAGAAGC
AGGTCAACAAGCTCATCCACGCCCGGGGCACCAATCTGAACAAGGCGATGACGCTGCAGG
AGGCCGAGGCCTTCGTGGGTGCCGAGCGCTGCACCATGAAGACGCTGACGGAGACCGACC
TGTACTGTGAGCCCCCGGAGGTGCAGCCCCCGCCCAAGCGGCGGCAGAAACGAGACACCA
CACACAACCTGCCCGAGTTCATTGTGAAGTTCGGCTCTCGCGAGTGGGTGCTGGGCCGCG
TGGAGTACGACACACGGGTGAGCGACGTGCCGCTCAGCCTCATCTTGCCGCTGGTCATCG
TGCCCATGGTGGTCGTCATCGCGGTGTCTGTCTACTGCTACTGGAGGAAGAGCCAGCAGG
CCGAACGAGAGTATGAGAAGATCAAGTCCCAGCTGGAGGGCCTGGAGGAGAGCGTGCGGG
ACCGCTGCAAGAAGGAATTCACAGACCTGATGATCGAGATGGAGGACCAGACCAACGACG
TGCACGAGGCCGGCATCCCCGTGCTGGACTACAAGACCTACACCGACCGCGTCTTCTTCC
TGCCCTCCAAGGACGGCGACAAGGACGTGATGATCACCGGCAAGCTGGACATCCCCGAGC
CGCGGCGGCCGGTGGTGGAGCAGGCCCTCTACCAGTTCTCCAACCTGCTGAACAGCAAGT
CTTTCCTCATCAATTTCATCCACACCCTGGAGAACCAGCGGGAGTTCTCGGCCCGCGCCA
AGGTCTACTTCGCGTCCCTGCTGACGGTGGCGCTGCACGGGAAACTGGAGTACTACACGG
ACATCATGCACACGCTCTTCCTGGAGCTCCTGGAGCAGTACGTGGTGGCCAAGAACCCCA
AGCTGATGCTGCGCAGGTCTGAGACTGTGGTGGAGAGGATGCTGTCCAACTGGATGTCCA
TCTGCCTGTACCAGTACCTCAAGGACAGTGCCGGGGAGCCCCTGTACAAGCTCTTCAAGG
CCATCAAACATCAGGTGGAAAAGGGCCCGGTGGATGCGGTACAGAAGAAGGCCAAGTACA
CTCTCAACGACACGGGGCTGCTGGGGGATGATGTGGAGTACGCACCCCTGACGGTGAGCG
TGATCGTGCAGGACGAGGGAGTGGACGCCATCCCGGTGAAGGTCCTCAACTGTGACACCA
TCTCCCAGGTCAAGGAGAAGATCATTGACCAGGTGTACCGTGGGCAGCCCTGCTCCTGCT
GGCCCAGGCCAGACAGCGTGGTCCTGGAGTGGCGTCCGGGCTCCACAGCGCAGATCCTGT
CGGACCTGGACCTGACGTCACAGCGGGAGGGCCGGTGGAAGCGCGTCAACACCCTTATGC
ACTACAATGTCCGGGATGGAGCCACCCTCATCCTGTCCAAGGTGGGGGTCTCCCAGCAGC
CGGAGGACAGCCAGCAGGACCTGCCTGGGGAGCGCCATGCCCTCCTGGAGGAGGAGAACC
GGGTGTGGCACCTGGTGCGGCCGACCGACGAGGTGGACGAGGGCAAGTCCAAGAGAGGCA
GCGTGAAAGAGAAGGAGCGGACGAAGGCCATCACCGAGATCTACCTGACGCGGCTGCTCT
CAGTCAAGGGCACACTGCAGCAGTTTGTGGACAACTTCTTCCAGAGCGTGCTGGCGCCTG
GGCACGCGGTGCCACCTGCAGTCAAGTACTTCTTCGACTTCCTGGACGAGCAGGCAGAGA
AGCACAACATCCAGGATGAAGACACCATCCACATCTGGAAGACGAACAGTTTACCGCTCC
GGTTCTGGGTGAACATCCTCAAGAACCCCCACTTCATCTTTGACGTGCATGTCCACGAGG
TGGTGGACGCCTCGCTGTCAGTCATCGCGCAGACCTTCATGGATGCCTGCACGCGCACGG
AGCATAAGCTGAGCCGCGATTCTCCCAGCAACAAGCTGCTGTACGCCAAGGAGATCTCCA
CCTACAAGAAGATGGTGGAGGATTACTACAAGGGGATCCGGCAGATGGTGCAGGTCAGCG
ACCAGGACATGAACACACACCTGGCAGAGATTTCCCGGGCGCACACGGACTCCTTGAACA
CCCTCGTGGCACTCCACCAGCTCTACCAATACACGCAGAAGTACTATGACGAGATCATCA
ATGCCTTGGAGGAGGATCCTGCCGCCCAGAAGACGCAGCTGGCCTTCCGCCTGCAGCAGA
TTGCCGCTGCACTGGAGAACAAGGTCACTGACCTCTGACCTACAATCTCCAGTGCTGCCT
TGGGACATAGGTACCTGAGGTACCTGAGAGCCCCTCAGGGGAGGAGGCCGAGTGGCTGTG
GCTGAGGCCCCCACCCTCCCCTGGAACGCGCCCCAAGCCGGAGTGGGTGCAGCCGGAACC
CGCCCAGCGTCTAGACTGTAGCATCTTCCTCTGAGCAATACCGCCGGGCACCGCACCAGC
ACCAGCCCCAGCCCCAGCTCCCTCCGGCCGCAGAACCAGCATCGGGTGTTCACTGTCGAG
TCTCGAGTGATTTGAAAATGTGCCTTACGCTGCCACGCTGGGGGCAGCTGGCCTCCGCCT
CCGCCCACGCACCAGCAGCCGCCTCCATGCCCTAGGTTGGGCCCCTGGGGGATCTGAGGG
CCTGTGGCCCCCAGGGCAAGTTCCCAGATCCTATGTCTGTCTGTCCACCACGAGATGGGA
GGAGGAGAAAAAGCGGTACGATGCCTTCCTGACCTCACCGGCCTCCCCAAGGGTGCCGGC
ACTCTGGGTGGACTCACGGCTGCTGGGCCCCACGTCAAAGGTCAAGTGAGACGTAGGTCA
AGTCCTACGTCGGGGCCCAGACATCCTGGGGTCCTGGTCTGTCAGACAGGCTGCCCTAGA
GCCCCACCCAGTCCGGGGGGACTGGGAGCAGTTCCAAGACCACCCCACCCCTTTTTGTAA
ATCTTGTTCATTGTAAATCAAATACAGCGTCTTTTTCACTCCGAAAAAAAAAAAAAAAAA
AAAAAA
>NM_033229
GATGTGGGCACGCCTCAGAGCCAGAAGTTTATGGCTCCCACCTGCTCAATCTGACAGGAA
GCTTCTGCTCCCCAGTTCTCCCCAGCCACTGTGGTCTACAGATTCCAGGAAACCCATCCC
CCTGTGACCTCAGGGTGTGCTCTGTTCTCCACCCTAGGGACCAGAAGGAGCCAGGAGTAA
AGAACTGGCTTACTTGGCCGCCACTGGGAAATTCTGGGTAATTCGAGACGCCCTGGAATT
TGGACCCACTCCGCTGATAGGTGGTGGGCAGGGTTCTAGGGAACACAAGAGGCGGAGCCA
GGTGGCTTCCCTGTGCTGGCATTCTTGGCTCTCTCTCTCTCTCTTTCTCTCTCTCTGTCT
CTCTCTCTCTCTCTGTCTCTCAGCCTTGAAGCCGTTTCCCTCTGCGATTCATGTAAGTGT
GACTCGATTTCAGGGAAAGGGAACTCGCGTGGGCTGAGGAGACCGGAGTGGACGGGCTGG
GGAAGGCACCGTGATGCCCGCAACCCCGTCCCTGAAGGTGGTCCATGAGCTGCCTGCCTG
TACCCTCTGTGCGGGGCCGCTGGAGGATGCGGTGACCGTTCCCTGTGGACACACCTTCTG
CCGGCTCTGCCTCCCCGCGCTCTCCCAGATGGGGGCCCAATCCTCGGGCAAGATCCTGCT
CTGCCCGCTCTGCCAAGAGGAGGAGCAGGCAGAGACTCCCATGGCCCCTGTGCCCCTGGG
CCCGCTGGGAGAAACTTACTGCGAGGAGCACGGCGAGAAGATCTACTTCTTCTGCGAGAA
CGATGCCGAGTTCCTCTGTGTGTTCTGCAGGGAGGGTCCCACGCACCAGGCGCACACCGT
GGGGTTCCTGGACGAGGCCATTCAGCCCTACCGGGATCGTCTCAGGAGTCGACTGGAAGC
TCTGAGCACGGAGAGAGATGAGATTGAGGATGTAAAGTGTCAAGAAGACCAGAAGCTTCA
AGTGCTGCTGACTCAGATCGAAAGCAAGAAGCATCAGGTGGAAACAGCTTTTGAGAGGCT
GCAGCAGGAGCTGGAGCAGCAGCGATGTCTCCTGCTGGCCAGGCTGAGGGAGCTGGAGCA
GCAGATTTGGAAGGAGAGGGATGAATATATCACAAAGGTCTCTGAGGAAGTCACCCGGCT
TGGAGCCCAGGTCAAGGAGCTGGAGGAGAAGTGTCAGCAGCCAGCAAGTGAGCTTCTACA
AGATGTCAGAGTCAACCAGAGCAGGTGTGAGATGAAGACTTTTGTGAGTCCTGAGGCCAT
TTCTCCTGACCTTGTCAAGAAGATCCGTGATTTCCACAGGAAAATACTCACCCTCCCAGA
GATGATGAGGATGTTCTCAGAAAACTTGGCGCATCATCTGGAAATAGATTCAGGGGTCAT
CACTCTGGACCCTCAGACCGCCAGCCGGAGCCTGGTTCTCTCGGAAGACAGGAAGTCAGT
GAGGTACACCCGGCAGAAGAAGAGCCTGCCAGACAGCCCCCTGCGCTTCGACGGCCTCCC
GGCGGTTCTGGGCTTCCCGGGCTTCTCCTCCGGGCGCCACCGCTGGCAGGTTGACCTGCA
GCTGGGCGACGGCGGCGGCTGCACGGTGGGGGTGGCCGGGGAGGGGGTGAGGAGGAAGGG
AGAGATGGGACTCAGCGCCGAGGACGGCGTCTGGGCCGTGATCATCTCGCACCAGCAGTG
CTGGGCCAGCACCTCCCCGGGCACCGACCTGCCGCTGAGCGAGATCCCGCGCGGCGTGAG
AGTCGCCCTGGACTACGAGGCGGGGCAGGTGACCCTCCACAACGCCCAGACCCAGGAGCC
CATCTTCACCTTCACTGCCTCTTTCTCCGGCAAAGTCTTCCCTTTCTTTGCCGTCTGGAA
AAAAGGTTCCTGCCTTACGCTGAAAGGCTGAAGTGGGGCGCGCGAAGGGCGGCGAAGCGG
AGACGGCGGCTCTCCGGGATCCAGCTCCGCCCCTGGCCAGTGTGCGGCCCGGGGGCTCCC
TGTGCCCGCGTGAGGCGAGAGAACAGGGGACTTGAGTCTCGAACAGCGGTTGTTTTTACT
TTATTTATCTTAGGCCCTCAGCTCCCTGACGTCCTGAGCCTCCCTGTGACGCTCTGGCCT
TCTCTGCACCTCAGAGTGCAGAACCACAGACGGCTTCGGCTGTGCCTAGGGCAACAGCCA
ACCTAGGAGCCAGCGGGCTTTCGGGGAAAAAAAAGAAAAAGACATCTAAAATAAAATGTT
TAAACTGTTTCAAAATAAAAAAAAAAAAAAAAAAA
>AV656862
TTTATACATTCTAAATCTCCCCAGTTTCTTTGGGGCTGGAAGATGCAACTTCCATTTAAT
AGAAACTTTGAAATCTTGGGGTAAGGGAGCAGTGGGGGGACTAGGGAGAAGGATAAGAAA
TAGAATTATTGAAAAGCCCCCACCAGGGACCTTCCTGGCCAGAATATGCAGAGTAATTCC
TGCTGGCTTCACCTTTGAAAGTCCCTCGAAACTATGCAGATGAAACTGAGTCTGTTTTTG
ATATTGTCAGATGTATTCTACCTTGGAAGTCCCAACACCTAAACTGGAATTCTTGTATTT
ACATCTCCTCCACTGTCCCCCACACCACCCCTCAATTCCTGCTGCCCCTGCTAATGTTAA
GCATTTTTCTCTTGTTATCATCAGGTTCACATTAAAAACAGATACTTACAAACTGACTTG
AAGCACAGATACTTTTACGAATGTGATAAAATATTTTCTTAAGAAAAGGAAAGAGGATGT
GGGTCAAATAAAACACCGCATGGATGTTGATTGGTGAATACTGGTGTAAGAAAAGGGAGC
TCAGGAATTTTTATTACTGTATTTGTAAATGAGTTTGAAGGAATTTGTAAATGCCACTGG
TACATTTTTAAGGTGACACATTTGCTCCTTATAAAGTTATTAAAAATTACAGGGTAAGCT
TAAATGACGTTTGCCAGTAGTTTTACTTTATATAATCAATATTGATATTGTTGCTGAACT
ATGTAACTTTATGATGCATTTTTCAGTCCCTTTTCAGAGCAAATGCTTTTGCAATGGTAG
TAATGTTTAGTTTAAATTGACTTAATAAATTATTACCTGAGCAAAAAAAAAAAAAAAAAA
AAAAAAAAAATAAAAAAAAAAAAAAAAAAAAAAAAAAAAATAATAAAAAAAAAAAAAACA
AACAAATCAATAAAACTTAAACAAAAAAAAAATAAAAAAAAA
>AI499593
GCAGAGATCGCCACATCGTCGGACAAGGTCAAGGACGGGGGCGGCGGGAACGAGGGCTCT
CCATGCCCACCGTGTCCCGGGCCCATAGCCGGGCAAGCCCTAGGAGGCAGCCGGGCGTCG
CCGGCCCCGGCGCCGTCACGCTCGCCCTCGGCGCAGTGTCCTTTTCCAGGCGGGACGGTG
CTGTCCCGGCCTCTCTACTACACCGCGCCCTTCTATCCCGGCTACACGAACTATGGCTCC
TTCGGACACCTTCATGGCCACCCGGGGCCGGGGCCGGGCCCCACACCCGGTCCGGGGTCT
CATTTCAATGGATTAAACCAGACCGTGTTGAACCGAGCGGACGCTTTGGCTAAAGACCCG
AAAATGTTGCGGAGCCAGTCTCAGCTAGACCTGTGCAAAGACTCTCCCTATGAATTGAAG
AAAGGTATGTCCGACATTTAACGCGGGCTGCGTCGGTCCCGGACTTTTCTAATTTATTAA
AAACATGGCCTTGGCAGTTATTTTTCCATCACCGAGAGAGAGAGACAGAGAGAGAAAATA
AACTACCCCTCCTATTCAGAAGTTTATAGTTTATGGAGATGGATGACATAAAAATGTAAA
CATCTCCACACACACAAAAAAATGTCTTAACCAACCGAAAAGAAAAATTAAAAAAGGATT
TGTATTAAATCTTATTCTGTATATTTAATGTAGCATTTTTGTATTTAAATTGATAATTCA
ATATCTTTGAAGTAAATTATGAAATCAAGACACCTGTACAGGCATTTAATGTTTTTTTGT
AATATAAATATATACATTTGTGTTTCCCCCAAAACTGTTTCATAGTTAAAAAATACAAGT
TTAATTTAATTTTTTACACCTATTGATTCTGCTGGGTATGAGCTAAAGTATTACGGAAAG
GAAACAGGTTATACTCTTAGATTTAAAAAGTGAAAGAAACTGCAGGCGCCTTTGTAAAAT
GCAAAATATTTAATTAAAAGAGATTTTAACATAATGAGAGCCACTCATTACTTTTTAGAA
GCCTCAATAAACTGTCCATTGCCTTGGTCAAAAAAAAAAAAAAAAAAAAA
>AI952953
ATATCCAAGAAATTTGGACACCTATACCTACAGAATAATGAAATAGAAAAGATGAATCTN
ACAGTGATGTGTCCTTCTATTGACCCACTACATTACCACCATTTAACATACATTCGTGTG
GACCAAAATAAACTAAAAGAACCAATAAGCTCATACATCTTCTTCTGCTTCCCTCATATA
CACACTATTTATTATGGTGAACAACGAAGCACTAATGGTCAAACAATACAACTAAAGACC
CAAGTTTTCAGGAGATTTCCAGATGATGATGATGAAAGTGAAGATCACGATGATCCTGAC
AATGCTCATGAGAGCCCAGAACAAGAAGGAGCAGAAGGGCACTTTGACCTTCATTATTAT
GAAAATCAAGAATAGCAAGAAACTATATAGGTATACACTTACGACTTCACAAAACCTATA
CTTAATATAGTAAATCTAAGTAAACATGTATTACTCAAAGTAATATATTTAGAATTATGT
ATTAGTATAAGATCAGAATTGAATTTAAGTTGTTGGTGACATCTGCATCATTTCATAGGA
TTAGAACTTACTCAAAATAATGTAAATCTTTAAAAATATAAATTAGAATGACAAGTGGGA
ATCATAAATTAAACGTTAATGGTTTCTTATGCTCTTTTTAAATATAGAAATATCATGTTA
AAAAAAAA
>AK025470
ATGATTGCAACAGTGGATTTAAAAGTCAATGAATATGAGAAAAACCAAAAATGGCTTGAG
ATCCTAAATAAGATTGAAAACAAAACATACACGAAGCTCAAAAATGGACATGTGTTTAGG
AAGCAGGCACTGATGAGTGAAGAAAGGACTCTGTTATATGATGGCCTTGTTTACTGGAAA
ACTGCTACAGGTCGTTTCAAAGATATCCTAGCTCTACTTCTAACTGATGTGCTGCTCTTT
TTACAAGAAAAAGACCAGAAATACATCTTTGCAGCCGTTGATCAGAAGCCATCAGTTATT
TCCCTTCAAAAGCTTATTGCTAGAGAAGTTGCTAATGAGGAGAGAGGAATGTTTCTGATC
AGTGCTTCATCTGCTGGTCCTGAGATGTATGAAATTCACACCAATTCCAAGGAGGAACGC
AATAACTGGATGAGACGGATCCAGCAGGCTGTAGAAAGTTGTCCTGAAGAAAAAGGGGGA
AGGACAAGTGAATCTGATGAAGACAAGAGGAAAGCTGAAGCCAGAGTGGCCAAAATTCAG
CAATGTCAAGAAATACTCACTAACCAAGACCAACAAATTTGTGCGTATTTGGAGGAGAAG
CTGCATATCTATGCTGAACTTGGAGAACTGAGCGGATTTGAGGACGTCCATCTAGAGCCC
CACCTCCTTATTAAACCTGACCCAGGCGAGCCTCCCCAGGCAGCCTCATTACTGGCAGCA
GCACTGAAAGAAGCATTAGTCACAGGAGGGAGAGAAGGAAGAGGCTGTTCGGATGTGGAT
CCCGGGATCCAGGGTGTGGTAACCGACTTGGCCGTCTCTGATGCAGGGGAGAAGGTGGAA
TGTAGAAATTTTCCAGGTTCTTCACAATCAGAGATTATACAAGCCATACAGAATTTAACC
CGTCTCTTATACAGCCTTCAGGCCGCCTTGACCATTCAGGACAGCCACATTGAGATCCAC
AGGCTGGTTCTCCAGCAGCAGGAGGGCCTGTCTCTCGGCCACTCTATCCTCCGAGGCGGC
CCCTTGCAGGACCAGAAGTCTCGCGACGCGGACAGGCAGCATGAGGAGCTGGCCAATGTG
CACCAGCTTCAGCACCAGCTCCAGCAGGGGCAGCGGCGCTGGCTGCGCAGGTGTGAGCAG
CAGCAGCGGGCGCAGGCGACCAGGGAGAGCTGGCTGCAGGAGCGGGAGCGGGAGTGCCAG
TCGCAGGAGGAGCTGCTGCTGCGGAGCCGGGGCGAGCTGGACCTCCAGCTCCAGGAGTAC
CAGCACAGCCTGGAGCGGCTGAGGGAGGGCCAGCGCCTGGTGGAGAGGGAGCAGGCGAGG
ATGCGGGCCCAGCAGAGCCTGCTGGGCCACTGGAAGCACGGCCGGCAGAGGAGCCTGTCC
GCGGTGCTCCTTCCGGGTGGCCCCGAGGTAATGGAACTTAATCGATCTGAGAGTTTATGT
CATGAAAACTCATTCTTCATCAATGAAGCTTTAGTACAAATGTCATTTAACACTTTCAAC
AAACTGAATCCATCAGTTATCCATCAGGATGCCACTTACCCTACAACTCAATCTCATTCT
GACTTGGTGAGGACTAGTGAACATCAAGTAGACCTCAAGGTGGACCCTTCTCAGCCTTCG
AATGTCAGTCACAAACTGTGGACAGCCGCTGGTTCCGGCCATCAGATACTTCCTTTCCAT
GAAAGCAGCAAGGATTCTTGTAAAAATGGCTCCAGTATGACAAAGTGCAGTTGTACGTTG
ACATCTCCCCCGGGACTGTGGACTGGAACCACATCTACTTTGAAGGATTTGGACACCTCC
CACACTGAGTCCCCAACCCCCCATGACTCAAATTCACACCGCCCTCAACTGCAGGCGTTT
ATAACAGAAGCAAAGCTAAATCTACCGACAAGGACAATGACCAGACAAGATGGGGAAACT
GGAGATGGAGCCAAAGAAAATATTGTTTACCTCTAATTGTGTTGTCATTTTTCCAAACAA
AACAAAACACTGGCACTTTTGGGAGAAACTTTTTGTCTCCATTCCTTATGTATGTGTGAT
TGTCTGTGTCCAAATTGCTTTAAGAATAATATTTAATATTTCCTGGAAGCTCATTTTTTT
GGCATGAGTCTAATTAAATTATTGAAAGCCACCCTGTTTGTATAATCTTTAACTTATCAA
ATCTAATTTCAGATTTCTGGAGGAGAAACTAACTTGAATAAGCAGGACTATTTTAAAAGT
TGTTTTGACGCTAGAGTAAAATTCCATGTCACATTTTCTACCCAATCATCTGGATTTCAA
GATTCCTTTTAAGATCTCAATGAAGCAATTTGGATTTAAAGAGTGGTATTCACAAGGGGT
GAACTTTCACAGTCAGGGCAGTTGCCTCAGTGCCCACATAGGCAGAGGAGGATGTGGGAA
AGGGCTTTTCTCAGCTAGTTTTTGTGTGCTCATTTCTTCTGGGAGCATTAAAAGTGGTGA
TCTGTTACAGTCACTATTCAACTGGGCACGTGTTGTGATTGGTCAGTCACTGAGCCAGGG
ATACAGTCCGGACTTGCTTAGTACCTAAGCCTAATGCTGGTGGGGTTTCAAGACATGGTT
CAGCATCATCTTTTAACAAGGCCCAGAGGCCCAGAGCCCGCATCAAGTCATTTTGATGTA
AATAGTGAACTTTGTTAGAGCCCTCACTTCTATCAATCAGCTGTCCTGTCCCTGCCAGCA
CCTGGAGCACCAACTACCACTCCCTGGAAAGAACCCTTCCCTGCAGTTTTTTAAGGACAA
AACTGCCCACTCCTCATTAAGTTTGCTGCCTGGATACACTTTTCCACAAAGGAAAACTGG
CATATCCTGCCTTCCGAGTAGTATGGGTCTCTGTGTGAGAAACCAGGAGATATTTTCATC
TTGTTCGGAAATACTTGTATGTATTTTGGTGTCAATAAATATCTTGTACCTCATTAAAAA
AAAAAAAAAAAAA
>NM_006378
CTGAGCCGCATCTGCAATAGCACACTTGCCCGGCCACCTGCTGCCGTGAGCCTTTGCTGC
TGAAGCCCCTGGGGTCGCCTCTACCTGATGAGGATGTGCACCCCCATTAGGGGGCTGCTC
ATGGCCCTTGCAGTGATGTTTGGGACAGCGATGGCATTTGCACCCATACCCCGGATCACC
TGGGAGCACAGAGAGGTGCACCTGGTGCAGTTTCATGAGCCAGACATCTACAACTACTCA
GCCTTGCTGCTGAGCGAGGACAAGGACACCTTGTACATAGGTGCCCGGGAGGCGGTCTTC
GCTGTGAACGCACTCAACATCTCCGAGAAGCAGCATGAGGTGTATTGGAAGGTCTCAGAA
GACAAAAAAGCAAAATGTGCAGAAAAGGGGAAATCAAAACAGACAGAGTGCCTCAACTAC
ATCCGGGTGCTGCAGCCACTCAGCGCCACTTCCCTTTACGTGTGTGGGACCAACGCATTC
CAGCCGGCCTGTGACCACCTGAACTTAACATCCTTTAAGTTTCTGGGGAAAAATGAAGAT
GGCAAAGGAAGATGTCCCTTTGACCCAGCACACAGCTACACATCCGTCATGGTTGATGGA
GAACTTTATTCGGGGACGTCGTATAATTTTTTGGGAAGTGAACCCATCATCTCCCGAAAT
TCTTCCCACAGTCCTCTGAGGACAGAATATGCAATCCCTTGGCTGAACGAGCCTAGTTTC
GTGTTTGCTGACGTGATCCGAAAAAGCCCAGACAGCCCCGACGGCGAGGATGACAGGGTC
TACTTCTTCTTCACGGAGGTGTCTGTGGAGTATGAGTTTGTGTTCAGGGTGCTGATCCCA
CGGATAGCAAGAGTGTGCAAGGGGGACCAGGGCGGCCTGAGGACCTTGCAGAAGAAATGG
ACCTCCTTCCTGAAAGCCCGACTCATCTGCTCCCGGCCAGACAGCGGCTTGGTCTTCAAT
GTGCTGCGGGATGTCTTCGTGCTCAGGTCCCCGGGCCTGAAGGTGCCTGTGTTCTATGCA
CTCTTCACCCCACAGCTGAACAACGTGGGGCTGTCGGCAGTGTGCGCCTACAACCTGTCC
ACAGCCGAGGAGGTCTTCTCCCACGGGAAGTACATGCAGAGCACCACAGTGGAGCAGTCC
CACACCAAGTGGGTGCGCTATAATGGCCCGGTACCCAAGCCGCGGCCTGGAGCGTGCATC
GACAGCGAGGCACGGGCCGCCAACTACACCAGCTCCTTGAATTTGCCAGACAAGACGCTG
CAGTTCGTTAAAGACCACCCTTTGATGGATGACTCGGTAACCCCAATAGACAACAGGCCC
AGGTTAATCAAGAAAGATGTGAACTACACCCAGATCGTGGTGGACCGGACCCAGGCCCTG
GATGGGACTGTCTATGATGTCATGTTTGTCAGCACAGACCGGGGAGCTCTGCACAAAGCC
ATCAGCCTCGAGCACGCTGTTCACATCATCGAGGAGACCCAGCTCTTCCAGGACTTTGAG
CCAGTCCAGACCCTGCTGCTGTCTTCAAAGAAGGGCAACAGGTTTGTCTATGCTGGCTCT
AACTCGGGCGTGGTCCAGGCCCCGCTGGCCTTCTGTGGGAAGCACGGCACCTGCGAGGAC
TGTGTGCTGGCGCGGGACCCCTACTGCGCCTGGAGCCCGCCCACAGCGACCTGCGTGGCT
CTGCACCAGACCGAGAGCCCCAGCAGGGGTTTGATTCAGGAGATGAGCGGCGATGCTTCT
GTGTGCCCGGATAAAAGTAAAGGAAGTTACCGGCAGCATTTTTTCAAGCACGGTGGCACA
GCGGAACTGAAATGCTCCCAAAAATCCAACCTGGCCCGGGTCTTTTGGAAGTTCCAGAAT
GGCGTGTTGAAGGCCGAGAGCCCCAAGTACGGTCTTATGGGCAGAAAAAACTTGCTCATC
TTCAACTTGTCAGAAGGAGACAGTGGGGTGTACCAGTGCCTGTCAGAGGAGAGGGTTAAG
AACAAAACGGTCTTCCAAGTGGTCGCCAAGCACGTCCTGGAAGTGAAGGTGGTTCCAAAG
CCCGTAGTGGCCCCCACCTTGTCAGTTGTTCAGACAGAAGGTAGTAGGATTGCCACCAAA
GTGTTGGTGGCATCCACCCAAGGGTCTTCTCCCCCAACCCCAGCCGTGCAGGCCACCTCC
TCCGGGGCCATCACCCTTCCTCCCAAGCCTGCGCCCACCGGCACATCCTGCGAACCAAAG
ATCGTCATCAACACGGTCCCCCAGCTCCACTCGGAGAAAACCATGTATCTTAAGTCCAGC
GACAACCGCCTCCTCATGTCCCTCTTCCTCTTCTTCTTTGTTCTCTTCCTCTGCCTCTTT
TTCTACAACTGCTATAAGGGATACCTGCCCAGACAGTGCTTGAAATTCCGCTCGGCCCTA
CTAATTGGGAAGAAGAAGCCCAAGTCAGATTTCTGTGACCGTGAGCAGAGCCTGAAGGAG
ACGTTAGTAGAGCCAGGGAGCTTCTCCCAGCAGAATGGGGAGCACCCCAAGCCAGCCCTG
GACACCGGCTATGAGACCGAGCAAGACACCATCACCAGCAAAGTCCCCACGGATAGGGAG
GACTCACAGAGGATCGACGACCTTTCTGCCAGGGACAAGCCCTTTGACGTCAAGTGTGAG
CTGAAGTTCGCTGACTCAGACGCAGATGGAGACTGAGGCCGGCTGTGCATCCCCGCTGGT
GCCTCGGCTGCGACGTGTCCAGGCGTGGAGAGTTTTGTGTTTCTCCTGTTCAGTATCCGA
GTCTCGTGCAGTGCTGCGTAGGTTAGCCCGCATCGTGCAGACAACCTCAGTCCTCTTGTC
TATTTTCTCTTGGGTTGAGCCTGTGACTTGGTTTCTCTTTGTCCTTTTGGAAAAATGACA
AGCATTGCATCCCAGTCTTGTGTTCCGAAGTCAGTCGGAGTACTTGAAGAAGGCCCACGG
GCGGCACGGAGTTCCTGAGCCCTTTCTGTAGTGGGGGAAAGGTGGCTGGACCTCTGTTGG
CTGAGAAGAGCATCCCTTCAGCTTCCCCTCCCCGTAGCAGCCACTAAAAGATTATTTAAT
TCCAGATTGGAAATGACATTTTAGTTTATCAGATTGGTAACTTATCGCCTGTTGTCCAGA
TTGGCACGAACCTTTTCTTCCACTTAATTATTTTTTTAGGATTTTGCTTTGATTGTGTTT
ATGTCATGGGTCATTTTTTTTTAGTTACAGAAGCAGTTGTGTTAATATTTAGAAGAAGAT
GTATATCTTCCAGATTTTGTTATATATTTGGCATAAAATACGGCTTACGTTGCTTAAGAT
TCTCAGGGATAAACTTCCTTTTGCTAAATGCATTCTTTCTGCTTTTAGAAATGTAGACAT
AAACACTCCCCGGAGCCCACTCACCTTTTTTCTTTTTCTTTTTTTTTTTTTAACTTTATT
CCTTGAGGGAAGCATTGTTTTTGGAGAGATTTTCTTTCTGTACTTCGTTTTACTTTTCTT
TTTTTTTAACTTTTACTCTCTCGAAGAAGAGGACCTTCCCACATCCACGAGGTGGGTTTT
GAGCAAGGGAAGGTAGCCTGGATGAGCTGAGTGGAGCCAGGCTGGCCCAGAGCTGAGATG
GGAGTGCGGTACAATCTGGAGCCCACAGCTGTCGGTCAGAACCTCCTGTGAGACAGATGG
AACCTTCACAAGGGCGCCTTTGGTTCTCTGAACATCTCCTTTCTCTTCTTGCTTCAATTG
CTTACCCACTGCCTGCCCAGACTTTCTATCCAGCCTCACTGAGCTGCCCACTACTGGAAG
GGAACTGGGCCTCGGTGGCCGGGGCCGCGAGCTGTGACCACAGCACCCTCAAGCATACGG
CGCTGTTCCTGCCACTGTCCTGAAGATGTGAATGGGTGGTACGATTTCAACACTGGTTAA
TTTCACACTCCATCTCCCCGCTTTGTAAATACCCATCGGGAAGAGACTTTTTTTCCATGG
TGAAGAGCAATAAACTCTGGATGTTTGTGCGCGTGTGTGGACAGTCTTATCTTCCAGCAT
GATAGGATTTGACCATTTTGGTGTAAACATTTGTGTTTTATAAGATTTACCTTGTTTTTA
TTTTTCTACTTTGAATTGTATACATTTGGAAAGTACCCAAATAAATGAGAAGCTTCTATC
CTTAAAAAAAAAAAAAA
>AA993639
CCCNTCCCCAGAGGCAGGAAAANCAGTNTGCCGAAAGGATAGACTGNGGTGCNGTCTTTC
CCCAAGTTNTGAACTAGTTTTAAGGTAGCTTAGGATGAAAAATGGAGAATGATTGGGGGT
TCCAAACCACTTTCTTCTCCCTTGGCTTATATCTCTTCACCATTTGGTGGTCAACTGTGG
GCCTACCCTGGACCTCATCTACTCAGCGAGAATTGGACATGAAGCTAGAGGCAGCTGCCT
TGGAAGGGAAGTCAGGCTCACTTGGACAGCCCAGGCCATGGCAGGAAGAATCCCTTCCTC
TTGGGGTCCTTGATGGGCATGTGTGATGGGGAAGGAGCAGTCTCCCAGCCCTGGGTCTGC
TCCCCACATCTCTCCTAATTCCACTTCACCTTTTGCCACCCCCTCCCCACCAGAGGCCTA
GCCCTTTTGTCACCGAAGGCCCCCAGAGTGTTTCTGTGTGAAACCCTCTCATTTACACTG
TGGCATCAAAATCCACAAAAGATGGATTAATTGCACTCTGGTTAATAGCAGCAGCACAAT
GATTAAAATCTATATTCCTATCTTCTCTAGCACCCTGGTGTGGGGATGGGGCGGAAGGGT
GTCTTGAGGGGCAGGGAGGACCCCATAAAACAATCCCTCCTGCATTCTCAGGCTAAATAG
GGCCCCCAGTGACTACCTGTTCTTGGCTGTCCCCTCTGAAGAGCTCTGCCTTCTCACAGC
CACCACCAGTTGCCCCACTCCCAGGAAAACAGCACATGTTCTTCTTCTCCTGCCTTGAGA
CTGCGTGTTAGTCTTCCATTCATAACTCATCAGCAGCTCAGTCCTTCTTATGTCTAGTCT
CAGTTCATTCAGCCAAAGCTCATTTTTGTCCTATCCAAAGTAGAAAGGGTTCTTTTAGAA
AACTTGAAGAATGTGCCTCCTCTTAGCATCTGTTTCTGACTCCCAGTTATTTTTAAAATA
AATGATGAATAAAATGCCTGCCCTGAAGGGTTCTGGAGGAGTCAGGTATCAAAAAAAAAA
AAA
>BE552004
TTTTTAAGATGATCTTGCTCCGTCACCCAGGCTGGAGTGCAGTGGCGTAATCATGGCTTC
CTGCAGCCTCAAACTCCTGGGCTCAATGAGTTCCTTGAGATCTTCCATCCTCAGCTTCCC
AAGTAGCTAGTAGTAGTAGTGGCTTGCACCAACGCTCCTGCCCTAATTTTCAATATTTTT
TTTGTAGAGATAGGATCTCACTGTGTTACCCAAGCTAGACTTGAACTCCTGGCCTCAAGC
GATCCTTCCGCCTTGGCCTCCCAAAGTGTTGGGATTACAGGCATTAGCTACCACACCTGG
CCAAGGCCCAGGTTTCGACAGAAAGGGAGAGAAAACCTGCCAGAGATGCCATTTCGGAGC
CACTCTGCTTGGCAGGGACCTGTGTTCCCCTCATGCAGGTTCATCCTTAGAGGGCTGCGG
TCTTATCTGGTTGTGCAAAAGTCCCACAACCTTTCTGGATTGATAGTTTGTGGTGAAATA
AACAATTTTAGTTTGTTTGGAGAATCTTTTGTATACAAAATACAAATAAAACCTAAATCA
AAGAAACAGA
>BC010437
GAGGGGCCGGAGGCGTCCCCGCTCCCGCTCGCTACTAGCCCGCGGGCCAGCGCCGCGTCC
CGAGCCCCGGCGGGAGCCATGGCTCTAAAAGGACAAGAAGATTATATTTATCTTTTCAAG
GATTCAACACATCCAGTGGATTTTCTGGATGCATTCAGAACATTTTACTTGGATGGATTA
TTTACTGATATTACTCTTCAGTGTCCTTCAGGCATAATTTTCCATTGTCACCGAGCCGTT
TTAGCTGCTTGCAGCAATTATTTTAAGGCAATGTTCACAGCTGACATGAAAGAAAAATTT
AAAAATAAAATAAAACTCTCTGGCATCCACCATGATATTCTGGAAGGCCTTGTAAATTAT
GCATACACTTCCCAAATTGAAATAACTAAAAGAAATGTTCAAAGCCTGCTTGAGGCAGCG
GATCTGCTACAGTTCCTTTCAGTAAAGAAGGCTTGTGAGCGGTTTTTGGTAAGGCACTTG
GATATTGATAATTGTATTGGAATGCACTCCTTTGCAGAATTTCATGTGTGTCCAGAACTA
GAGAAGGAATCTCGAAGAATTCTATGTTCAAAGTTTAAGGAAGTGTGGCAACAAGAAGAA
TTTCTGGAAATCAGCCTTGAAAAGTTTCTCTTTATCTTGTCCAGAAAGAATCTCAGTGTT
TGGAAAGAAGAAGCTATCATAGAGCCAGTTATTAAGTGGACTGCTCATGATGTAGAAAAT
CGAATTGAATGCCTCTATAATCTACTGAGCTATATCAACATTGATATAGATCCAGTGTAC
TTAAAAACAGCCTTAGGCCTTCAAAGAAGCTGCCTGCTCACCGAAAATAAGATCCGCTCC
CTAATATACAATGCCTTGAATCCCATGCATAAAGAGATTTCCCAGAGGTCCACAGCCACA
ATGTATATAATTGGAGGCTATTACTGGCATCCTTTATCAGAGGTTCACATATGGGATCCT
TTGACAAATGTTTGGATTCAGGGAGCAGAAATACCAGATTATACCAGGGAGAGCTATGGT
GTTACATGTTTAGGACCCAACATTTATGTAACTGGGGGCTACAGGACGGATAACATAGAA
GCTCTTGACACAGTGTGGATCTATAACAGTGAAAGTGATGAATGGACAGAAGGTTTGCCA
ATGCTCAATGCCAGGTATTACCACTGTGCAGTCACCTTGGGTGGCTGTGTCTATGCTTTA
GGTGGTTACAGAAAAGGGGCTCCAGCAGAAGAGGCTGAGTTCTATGATCCTTTAAAAGAG
AAATGGATTCCTATTGCAAACATGATTAAAGGTGTGGGAAATGCTACTGCCTGTGTCTTA
CATGATGTTATCTACGTCATTGGTGGCCACTGTGGCTACAGAGGAAGCTGCACCTATGAC
AAAGTTCAGAGCTACAATTCCGATATCAACGAATGGAGCCTCATCACCTCCAGTCCACAT
CCAGAATATGGATTGTGCTCAGTTCCGTTTGAAAATAAGCTCTATCTAGTCGGTGGACAA
ACTACAATCACAGAATGCTATGACCCTGAACAAAATGAATGGAGAGAGATAGCTCCCATG
ATGGAAAGGAGGATGGAGTGCGGTGCCGTCATCATGAATGGATGTATTTATGTCACTGGA
GGATACTCCTACTCAAAGGGAACGTATCTTCAGAGCATTGAGAAATATGATCCAGATCTT
AATAAGTGGGAAATAGTGGGTAATCTTCCCAGTGCCATGCGGTCTCATGGGTGTGTTTGT
GTGTATAATGTCTAATTGAATCTGCAGAAATGACCAAGCAATCACTTTTTTGGAGTATAG
TTTTATAAAAAAAGAATGCAGGGTTTGAAGTTCCTTACCTGATAATTGTGTCTGGCACAT
GATAGGGGATCAGTAAATTGTAATTCCTAACCCTACTGTACTCCCAAACATGGTGATTCA
TGGTCAAGAAAAATCTTATATATATATATACACACACATATATATGTGTTCATATATATG
TATACATATATGTGTATATATACGCATGTATGTATACATATATGTGTATATATACGCATG
TATGTATGCATATGTGTGTATATATACGTATGTATGTATACATATGTGTATATATACGTA
TGTATGTATACATATATGTGTATATATGCGTATGTATGTATACATATATGTGTATATATA
CGTATGTATGTATACATATATGTGTATATATACGTATGTATGTATACATATATGTGTATA
TATACGTATGTATGTATACATATATGTGTGTATATACGTGTGTATGTATACATATATGTG
TATATATACGTGTGTATGTATACATATATGTGTATATATGCGTGTGTATGTATACATATA
TGTGTATATATACGTGTGTATGTATACATATATGTGTATATATACGTGTGTATGTATACA
TATATGTGTATATATGCGTGTGTATATATATACACATATATACGTATATATGTATATATA
TATACACAGTTGAATCAGTGGGATTAATACCTATAATCTCTGGTTTTCAAAGGTAATATG
GAATATTTGACACTTGGTAAAAGGTGAACTACCTTTGTAGTGAATCTTTTCCTCTTGGTA
GCATCAACACTGGGGATAAATCAGAACCATTCTGTGGAATGAAATGTTTCTCAAGAGCCT
ATAATATAGTAGATAGTGCATATTAAGATGTCTGGCTGGGCATGGTGGCTCATGCCTGTA
ATCCCAGCACTTTGGGAGGCTGAGGCGGGAGGATCACTTGAGCCTAGAAGTTGGAGACTA
ACCTGGCGAGACCCTGTCTCAAAAAAAAAAAAAAAAAA
>R15881
ACCCTTTTGTGACCAGCTGCATACCCCAAAACCTTTTGGAATCTGGGCTAACTGGCTGTG
CCTACATCAACAGCACCCGTGAACCCCCGTGTGCTATGCTCTGTGCAACAAAACATTCAG
AACCCACTTTCAAGATGCTGCTGCTGTGCCAGTGTGACAAAAAAAAGAGGCGCAAGCAGC
AGTACCAGCAGAGACAGTCGGTCATTTTTCACAAGCGCGCACCCGAGCAGGCCTTGTAGA
ATGAGGTTGTATCAATAGCAGTGACAAAACGCACACATCAACCCACAGACCTTAGGAGGA
GGAAGGCGAGGGCGGGGTGACTTCTGGTGATGATAAAAATGGTTTTATCACCCAGATGTG
AAAGAAGCTGCCTGTTTACTGATCCATTGAATAAACCCATTTTAATAGAAAAAGTCAATA
CCAATTCAGCAAAAAAAAA
>AF191770
TATCTATGTAACAAATCGCAGCACAGGAGTCCCCTGGGCTCCCTCAGGCTCTGGTATGAC
ATATTTGAGCCATATAAATTCAGCTTCTCCTCTGGCATCTGTTAGCCGACTCACTTGCAA
CTCCACCTCAGCAGTGGTCTCTCAGTCCTCTCAAAGCAAGGAAAGAGTACTGTGTGCTGA
GAGACCATGGCAAAGAATCCTCCAGAGAATTGTGAAGACTGTCACATTCTAAATGCAGAA
GCTTTTAAATCCAAGAAAATATGTAAATCACTTAAGATTTGTGGACTGGTGTTTGGTATC
CTGACCCTAACTCTAATTGTCCTGTTTTGGGGGAGCAAGCACTTCTGGCCGGAGGTACCC
AAAAAAGCCTATGACATGGAGCACACTTTCTACAGCAGTGGAGAGAAGAAGAAGATTTAC
ATGGAAATTGATCCTGTGACCAGAACTGAAATATTCAGAAGCGGAAATGGCACTGATGAA
ACATTGGAAGTACACGACTTTAAAAACGGATACACTGGCATCTACTTCGTGGGTCTTCAA
AAATGTTTTATCAAAACTCAGATTAAAGTGATTCCTGAATTTTCTGAACCAGAAGAGGAA
ATAGATGAGAATGAAGAAATTACCACAACTTTCTTTGAACAGTCAGTGATTTGGGTCCCA
GCAGAAAAGCCTATTGAAAACCGAGATTTTCTTAAAAATTCCAAAATTCTGGAGATTTGT
GATAACGTGACCATGTATTGGATCAATCCCACTCTAATATCAGTTTCTGAGTTACAAGAC
TTTGAGGAGGAGGGAGAAGATCTTCACTTTCCTGCCAACGAAAAAAAAGGGATTGAACAA
AATGAACAGTGGGTGGTCCCTCAAGTGAAAGTAGAGAAGACCCGTCACGCCAGACAAGCA
AGTGAGGAAGAACTTCCAATAAATGACTATACTGAAAATGGAATAGAATTTGATCCCATG
CTGGATGAGAGAGGTTATTGTTGTATTTACTGCCGTCGAGGCAACCGCTATTGCCGCCGC
GTCTGTGAACCTTTACTAGGCTACTACCCATATCCATACTGCTACCAAGGAGGACGAGTC
ATCTGTCGTGTCATCATGCCTTGTAACTGGTGGGTGGCCCGCATGCTGGGGAGGGTCTAA
TAGGAGGTTTGAGCTCAAATGCTTAAACTGCTGGCAACATATAATAAATGCATGCTATTC
AATGAATTTCTGCCTATGAGGCATCTGGCCCCTGGTAGCCAGCTCTCCAGAATTACTTGT
AGGTAATTCCTCTCTTCATGTTCTAATAAACTTCTACATTATCAAAAAA
>BC005364
GCGGATCGCTGCTCCCTCTCGCCATGGCGCAGGTGCTGATCGTGGGCGCCGGGATGACAG
GAAGCTTGTGCGCTGCGCTGCTGAGGAGGCAGACGTCCGGTCCCTTGTACCTTGCTGTGT
GGGACAAGGCTGACGACTCAGGGGGAAGAATGACTACAGCCTGCAGTCCTCATAATCCTC
AGTGCACAGCTGACTTGGGTGCTCAGTACATCACCTGCACTCCTCATTATGCCAAAAAAC
ACCAACGTTTTTATGATGAACTGTTAGCCTATGGCGTTTTGAGGCCTCTAAGCTCGCCTA
TTGAAGGAATGGTGATGAAAGAAGGAGACTGTAACTTTGTGGCACCTCAAGGAATTTCTT
CAATTATTAAGCATTACTTGAAAGAATCAGGTGCAGAAGTCTACTTCAGACATCGTGTGA
CACAGATCAACCTAAGAGATGACAAATGGGAAGTATCCAAACAAACAGGCTCCCCTGAGC
AGTTTGATCTTATTGTTCTCACAATGCCAGTTCCTGAGATTCTGCAGCTTCAAGGTGACA
TCACCACCTTAATTAGTGAATGCCAAAGGCAGCAACTGGAGGCTGTGAGCTACTCCTCTC
GATATGCTCTGGGCCTCTTTTATGAAGCTGGTACGAAGATTGATGTCCCTTGGGCTGGGC
AGTACATCACCAGTAATCCCTGCATACGCTTCGTCTCCATTGATAATAAGAAGCGCAATA
TAGAGTCATCAGAAATTGGGCCTTCCCTCGTGATTCACACCACTGTCCCATTTGGAGTTA
CATACTTGGAACACAGCATTGAGGATGTGCAAGAGTTAGTCTTCCAGCAGCTGGAAAACA
TTTTGCCGGGTTTGCCTCAGCCAATTGCTACCAAATGCCAAAAATGGAGACATTCACAGG
TTACAAATGCTGCTGCCAACTGTCCTGGCCAAATGACTCTGCATCACAAACCTTTCCTTG
CATGTGGAGGGGATGGATTTACTCAGTCCAACTTTGATGGCTGCATCACTTCTGCCCTAT
GTGTTCTGGAAGCTTTAAAGAATTATATTTAGTGCCTATATCCTTATTCTCTATATGTGT
ATTGGGTTTTTATTTTCACAATTTTCTGTTATTGATTATTTTGTTTTCTATTTTGCTAAG
AAAAATTACTGGAAAATTGTTCTTCACTTATTATCATTTTTCATGTGGAGTATAAAATCA
ATTTTGTAATTTTGATAGTTACAACCCATGCTAGAATGGAAATTCCTCACACCTTGCACC
TTCCCTACTTTTCTGAATTGCTATGACTACTCCTTGTTGGAGGAAAAGTGGTACTTAAAA
AATAACAAACGACTCTCTCAAAAAAATTACATTAAATCACAATAACAGTTTGTATGCCAA
AAACTTGATTATCCTTATGAAAATTTCAATTCTGAATAAAGAATAATCACATTATCAAAG
CCCCATCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>NM_001337
ACTCGTCTCTGGTAAAGTCTGAGCAGGACAGGGTGGCTGACTGGCAGATCCAGAGGTTCC
CTTGGCAGTCCACGCCAGGCCTTCACCATGGATCAGTTCCCTGAATCAGTGACAGAAAAC
TTTGAGTACGATGATTTGGCTGAGGCCTGTTATATTGGGGACATCGTGGTCTTTGGGACT
GTGTTCCTGTCCATATTCTACTCCGTCATCTTTGCCATTGGCCTGGTGGGAAATTTGTTG
GTAGTGTTTGCCCTCACCAACAGCAAGAAGCCCAAGAGTGTCACCGACATTTACCTCCTG
AACCTGGCCTTGTCTGATCTGCTGTTTGTAGCCACTTTGCCCTTCTGGACTCACTATTTG
ATAAATGAAAAGGGCCTCCACAATGCCATGTGCAAATTCACTACCGCCTTCTTCTTCATC
GGCTTTTTTGGAAGCATATTCTTCATCACCGTCATCAGCATTGATAGGTACCTGGCCATC
GTCCTGGCCGCCAACTCCATGAACAACCGGACCGTGCAGCATGGCGTCACCATCAGCCTA
GGCGTCTGGGCAGCAGCCATTTTGGTGGCAGCACCCCAGTTCATGTTCACAAAGCAGAAA
GAAAATGAATGCCTTGGTGACTACCCCGAGGTCCTCCAGGAAATCTGGCCCGTGCTCCGC
AATGTGGAAACAAATTTTCTTGGCTTCCTACTCCCCCTGCTCATTATGAGTTATTGCTAC
TTCAGAATCATCCAGACGCTGTTTTCCTGCAAGAACCACAAGAAAGCCAAAGCCATTAAA
CTGATCCTTCTGGTGGTCATCGTGTTTTTCCTCTTCTGGACACCCTACAACGTTATGATT
TTCCTGGAGACGCTTAAGCTCTATGACTTCTTTCCCAGTTGTGACATGAGGAAGGATCTG
AGGCTGGCCCTCAGTGTGACTGAGACGGTTGCATTTAGCCATTGTTGCCTGAATCCTCTC
ATCTATGCATTTGCTGGGGAGAAGTTCAGAAGATACCTTTACCACCTGTATGGGAAATGC
CTGGCTGTCCTGTGTGGGCGCTCAGTCCACGTTGATTTCTCCTCATCTGAATCACAAAGG
AGCAGGCATGGAAGTGTTCTGAGCAGCAATTTTACTTACCACACGAGTGATGGAGATGCA
TTGCTCCTTCTCTGAAGGGAATCCCAAAGCCTTGTGTCTACAGAGAACCTGGAGTTCCTG
AACCTGATGCTGACTAGTGAGGAAAGATTTTTGTTGTTATTTCTTACAGGCACAAAATGA
TGGACCCAATGCACACAAAACAACCCTAGAGTGTTGTTGAGAATTGTGCTCAAAATTTGA
AGAATGAACAAATTGAACTCTTTGAATGACAAAGAGTAGACATTTCTCTTACTGCAAATG
TCATCAGAACTTTTTGGTTTGCAGATGACAAAAATTCAACTCAGACTAGTTTAGTTAAAT
GAGGGTGGTGAATATTGTTCATATTGTGGCACAAGCAAAAGGGTGTCTGAGCCCTCAAAG
TGAGGGGAAACCAGGGCCTGAGCCAAGCTAGAATTCCCTCTCTCTGACTCTCAAATCTTT
TAGTCATTATAGATCCCCCAGACTTTACATGACACAGCTTTATCACCAGAGAGGGACTGA
CACCCATGTTTCTCTGGCCCCAAGGGAAAATTCCCAGGGAAGTGCTCTGATAGGCCAAGT
TTGTATCAGGTGCCCATCCCTGGAAGGTGCTGTTATCCATGGGGAAGGGATATATAAGAT
GGAAGCTTCCAGTCCAATCTCATGGAGAAGCAGAAATACATATTTCCAAGAAGTTGGATG
GGTGGGTACTATTCTGATTACACAAAACAAATGCCACACATCACCCTTACCATGTGCCTG
ATCCAGCCTCTCCCCTGATTACACCAGCCTCGTCTTCATTAAGCCCTCTTCCATCATGTC
CCCAAACCTGCAAGGGCTCCCCACTGCCTACTGCATCGAGTCAAAACTCAAATGCTTGGC
TTCTCATACGTCCACCATGGGGTCCTACCAATAGATTCCCCATTGCCTCCTCCTTCCCAA
AGGACTCCACCCATCCTATCAGCCTGTCTCTTCCATATGACCTCATGCATCTCCACCTGC
TCCCAGGCCAGTAAGGGAAATAGAAAAACCCTGCCCCCAAATAAGAAGGGATGGATTCCA
ACCCCAACTCCAGTAGCTTGGGACAAATCAAGCTTCAGTTTCCTGGTCTGTAGAAGAGGG
ATAAGGTACCTTTCACATAGAGATCATCCTTTCCAGCATGAGGAACTAGCCACCAACTCT
TGCAGGTCTCAACCCTTTTGTCTGCCTCTTAGACTTCTGCTTTCCACACCTGCACTGCTG
TGCTGTGCCCAAGTTGTGGTGCTGACAAAGCTTGGAAGAGCCTGCAGGTGCCTTGGCCGC
GTGCATAGCCCAGACACAGAAGAGGCTGGTTCTTACGATGGCACCCAGTGAGCACTCCCA
AGTCTACAGAGTGATAGCCTTCCGTAACCCAACTCTCCTGGACTGCCTTGAATATCCCCT
CCCAGTCACCTTGTGCAAGCCCCTGCCCATCTGGGAAAATACCCCATCATTCATGCTACT
GCCAACCTGGGGAGCCAGGGCTATGGGAGCAGCTTTTTTTTCCCCCCTAGAAACGTTTGG
AACAATGTAAAACTTTAAAGCTCGAAAACAATTGTAATAATGCTAAAGAAAAAGTCATCC
AATCTAACCACATCAATATTGTCATTCCTGTATTCACCCGTCCAGACCTTGTTCACACTC
TCACATGTTTAGAGTTGCAATCGTAATGTACAGATGGTTTTATAATCTGATTTGTTTTCC
TCTTAACGTTAGACCACAAATAGTGCTCGCTTTCTATGTAGTTTGGTAATTATCATTTTA
GAAGACTCTACCAGACTGTGTATTCATTGAAGTCAGATGTGGTAACTGTTAAATTGCTGT
GTATCTGATAGCTCTTTGGCAGTCTATATGTTTGTATAATGAATGAGAGAATAAGTCATG
TTCCTTCAAGATCATGTACCCCAATTTACTTGCCATTACTCAATTGATAAACATTTAACT
TGTTTCCAATGTTTAGCAAATACATATTTTATAGAACTTC
>AI041545
TGAACATATTCAGGCTGATTGGGGACGTGTCCCACCTGGCGGCCATCGTCATCTTGATGG
TAGAGATCTGGAAGACGCGCTCCTGCGCCGGTATTTCTGGGAAAAGCCAGCTTCTGTCTG
CACTGGTCTTCACAACTCGTGACCTGGATCTTTTCACTTCATTTATTTCAGTGTATCACA
CATCTATCAAGGTTATCTACGTTGCCTGCTCGTATGCCACAGTGTACCTGATCTACCTTA
AATTTAAGGCAACATCGGATGGAAATCATGATACCTTCCGAGTGGAGTTTCTGGTGGTCC
CTGTGGGAGGCCTCCTCATTTTTAGTTAATCACGATTTCTCTCCTCTTGAGTACTCAAGG
GAAAGAAGCTCAGTTTGCCAGCATAAGTGCCAAAGACCATCGCCAGCATCTGTCCTTCAG
GGTGTTCGGACAGAATTCTTACCACAGCAAAGGCATAAGATGCTTGATACGGAAAATCAA
GAACTTAACTTTTTTGTTGCAGATAGTCATCAGTGGTTCTGTAAAAACGCAGAGGAAAAG
AGCCAGAAGGTTTCTGTTTAATGCATCTTGCCTTATCTTTTTTTATTACTGTGCACAAAG
ATTTTTTTACACAAACATCCTTAATGCTGTTTTAATAAATTCAGTGTGTAGCTTCAAAAA
AA
>NM_024423
GGCAGGTCTCGCTCTCGGCACCCTCCCGGCGCCCGCGTTCTCCTGGCCCTGCCCGGCATC
CCGATGGCCGCCGCTGGGCCCCGGCGCTCCGTGCGCGGAGCCGTCTGCCTGCATCTGCTG
CTGACCCTCGTGATCTTCAGTCGTGATGGTGAAGCCTGCAAAAAGGTGATACTTAATGTA
CCTTCTAAACTAGAGGCAGACAAAATAATTGGCAGAGTTAATTTGGAAGAGTGCTTCAGG
TCTGCAGACCTCATCCGGTCAAGTGATCCTGATTTCAGAGTTCTAAATGATGGGTCAGTG
TACACAGCCAGGGCTGTTGCGCTGTCTGATAAGAAAAGATCATTTACCATATGGCTTTCT
GACAAAAGGAAACAGACACAGAAAGAGGTTACTGTGCTGCTAGAACATCAGAAGAAGGTA
TCGAAGACAAGACACACTAGAGAAACTGTTCTCAGGCGTGCCAAGAGGAGATGGGCACCT
ATTCCTTGCTCTATGCAAGAGAATTCCTTGGGCCCTTTCCCATTGTTTCTTCAACAAGTT
GAATCTGATGCAGCACAGAACTATACTGTCTTCTACTCAATAAGTGGACGTGGAGTTGAT
AAAGAACCTTTAAATTTGTTTTATATAGAAAGAGACACTGGAAATCTATTTTGCACTCGG
CCTGTGGATCGTGAAGAATATGATGTTTTTGATTTGATTGCTTATGCGTCAACTGCAGAT
GGATATTCAGCAGATCTGCCCCTCCCACTACCCATCAGGGTAGAGGATGAAAATGACAAC
CACCCTGTTTTCACAGAAGCAATTTATAATTTTGAAGTTTTGGAAAGTAGTAGACCTGGT
ACTACAGTGGGGGTGGTTTGTGCCACAGACAGAGATGAACCGGACACAATGCATACGCGC
CTGAAATACAGCATTTTGCAGCAGACACCAAGGTCACCTGGGCTCTTTTCTGTGCATCCC
AGCACAGGCGTAATCACCACAGTCTCTCATTATTTGGACAGAGAGGTTGTAGACAAGTAC
TCATTGATAATGAAAGTACAAGACATGGATGGCCAGTTTTTTGGATTGATAGGCACATCA
ACTTGTATCATAACAGTAACAGATTCAAATGATAATGCACCCACTTTCAGACAAAATGCT
TATGAAGCATTTGTAGAGGAAAATGCATTCAATGTGGAAATCTTACGAATACCTATAGAA
GATAAGGATTTAATTAACACTGCCAATTGGAGAGTCAATTTTACCATTTTAAAGGGAAAT
GAAAATGGACATTTCAAAATCAGCACAGACAAAGAAACTAATGAAGGTGTTCTTTCTGTT
GTAAAGCCACTGAATTATGAAGAAAACCGTCAAGTGAACCTGGAAATTGGAGTAAACAAT
GAAGCGCCATTTGCTAGAGATATTCCCAGAGTGACAGCCTTGAACAGAGCCTTGGTTACA
GTTCATGTGAGGGATCTGGATGAGGGGCCTGAATGCACTCCTGCAGCCCAATATGTGCGG
ATTAAAGAAAACTTAGCAGTGGGGTCAAAGATCAACGGCTATAAGGCATATGACCCCGAA
AATAGAAATGGCAATGGTTTAAGGTACAAAAAATTGCATGATCCTAAAGGTTGGATCACC
ATTGATGAAATTTCAGGGTCAATCATAACTTCCAAAATCCTGGATAGGGAGGTTGAAACT
CCCAAAAATGAGTTGTATAATATTACAGTCCTGGCAATAGACAAAGATGATAGATCATGT
ACTGGAACACTTGCTGTGAACATTGAAGATGTAAATGATAATCCACCAGAAATACTTCAA
GAATATGTAGTCATTTGCAAACCAAAAATGGGGTATACCGACATTTTAGCTGTTGATCCT
GATGAACCTGTCCATGGAGCTCCATTTTATTTCAGTTTGCCCAATACTTCTCCAGAAATC
AGTAGACTGTGGAGCCTCACCAAAGTTAATGATACAGCTGCCCGTCTTTCATATCAGAAA
AATGCTGGATTTCAAGAATATACCATTCCTATTACTGTAAAAGACAGGGCCGGCCAAGCT
GCAACAAAATTATTGAGAGTTAATCTGTGTGAATGTACTCATCCAACTCAGTGTCGTGCG
ACTTCAAGGAGTACAGGAGTAATACTTGGAAAATGGGCAATCCTTGCAATATTACTGGGT
ATAGCACTGCTCTTTTCTGTATTGCTAACTTTAGTATGTGGAGTTTTTGGTGCAACTAAA
GGGAAACGTTTTCCTGAAGATTTAGCACAGCAAAACTTAATTATATCAAACACAGAAGCA
CCTGGAGACGATAGAGTGTGCTCTGCCAATGGATTTATGACCCAAACTACCAACAACTCT
AGCCAAGGTTTTTGTGGTACTATGGGATCAGGAATGAAAAATGGAGGGCAGGAAACCATT
GAAATGATGAAAGGAGGAAACCAGACCTTGGAATCCTGCCGGGGGGCTGGGCATCATCAT
ACCCTGGACTCCTGCAGGGGAGGACACACGGAGGTGGACAACTGCAGATACACTTACTCG
GAGTGGCACAGTTTTACTCAACCCCGTCTCGGTGAAGAATCCATTAGAGGACACACTGGT
TAAAAATTAAACATAAAAGAAATTGCATCGATGTAATCAGAATGAAGACCGCATGCCATC
CCAAGATTATGTCCTCACTTATAACTATGAGGGAAGAGGATCTCCAGCTGGTTCTGTGGG
CTGCTGCAGTGAAAAGCAGGAAGAAGATGGCCTTGACTTTTTAAATAATTTGGAACCCAA
ATTTATTACATTAGCAGAAGCATGCACAAAGAGATAATGTCACAGTGCTACAATTAGGTC
TTTGTCAGACATTCTGGAGGTTTCCAAAAATAATATTGTAAAGTTCAATTTCAACATGTA
TGTATATGATGATTTTTTTCTCAATTTTGAATTATGCTACTCACCAATTTATATTTTTAA
AGCCAGTTGTTGCTTATCTTTTCCAAAAAGTGAAAAATGTTAAAACAGACAACTGGTAAA
TCTCAAACTCCAGCACTGGAATTAAGGTCTCTAAAGCATCTGCTCTTTTTTTTTTTTACG
GATATTTTAGTAATAAATATGCTGGATAAATATTAGTCCAACAATAGCTAAGTTATGCTA
ATATCACATTATTATGTATTCACTTTAAGTGATAGTTTAAAAAATAAACAAGAAATATTG
AGTATCACTATGTGAAGAAAGTTTTGGAAAAGAAACAATGAAGACTGAATTAAATTAAAA
ATGTTGCAGCTCATAAAGAATTGGGACTCACCCCTACTGCACTACCAAATTCATTTGACT
TTGGAGGCAAAATGTGTTGAAGTGCCCTATGAAGTAGCAATTTTCTATAGGAATATAGTT
GGAAATAAATGTGTGTGTGTATATTATTATTAATCAATGCAATATTTAAAATGAAATGAG
AACAAAGAGGAAAATGGTAAAAACTTGAAATGAGGCTGGGGTATAGTTTGTCCTACAATA
GAAAAAAGAGAGAGCTTCCTAGGCCTGGGCTCTTAAATGCTGCATTATAACTGAGTCTAT
GAGGAAATAGTTCCTGTCCAATTTGTGTAATTTGTTTAAAATTGTAAATAAATTAAACTT
TTCTGGTTTCTGTGGGAAGGAAATAGGGAATCCAATGGAACAGTAGCTTTGCTTTGCAGT
CTGTTTCAAGATTTCTGCATCCACAAGTTAGTAGCAAACTGGGGAATACTCGCTGCAGCT
GGGGTTCCCTGCTTTTTGGTAGCAAGGGTCCAGAGATGAGGTGTTTTTTTCGGGGAGCTA
ATAACAAAAACATTTTAAAACTTACCTTTACTGAAGTTAAATCCTCTATTGCTGTTTCTA
TTCTCTCTTATAGTGACCAACATCTTTTTAATTTAGATCCAAATAACCATGTCCTCCTAG
AGTTTAGAGGCTAGAGGGAGCTGAGGGGAGGATCTTACTGAAAGCACCCTGGGGAGATTG
ATTGTCCTTAAACCTAAGCCCCACAAACTTGACACCTGATCAGGTCTGGGAGCTACAAAA
TTTCATTTTTCTCCTCACTGCCCTTCTTCTGAGTGGCATTGGCCTGAATCAAGGAAAGCC
AGGCCTTGTGGGCCCCCTTCTTTCGGCTTTCTGCTAAAGCAACACCTCCAGCAGAGATTC
CCTTAAGTGACTCCAGGTTTTCCACCATCCTTCAGCGTGAATTAATTTTTAATCAGTTTG
CTTTCTCCAGAGAAATTTTAAAATAATAGAAGAAATAGAAATTTTGAATGTATAAAAGAA
AAAGATCAAGTTGTCATTTTAGAACAGAGGGAACTTTGGGAGAAAGCAGCCCAAGTAGGT
TATTTGTACAGTCAGAGGGCAACAGGAAGATGCAGGCCTTCAAGGGCAAGGAGAGGCCAC
AAGGAATATGGGTGGGAGTAAAAGCAACATCGTCTGCTTCATACTTTTTCCTAGGCTTGG
CACTGCCTTTTCCTTTCTCAGGCCAATGGCAACTGCCATTTGAGTCCGGTGAGGGATCAG
CCAACCTCTTCTCTATGGCTCACCTTATTTGGAGTGAGAAATCAAGGAGACAGAGCTGAC
TGCATGATGAGTCTGAAGGCATTTGCAGGATGAGCCTGAACTGGTTGTGCAGAACAAACA
AGGCATTCATGGGAATTGTTGTATTCCTTCTGCAGCCCTCCTTCTGGGCACTAAGAAGGT
CTATGAATTAAATGCCTATCTAAAATTCTGATTTATTCCTACATTTTCTGTTTTCTAATT
TGACCCTAAAATCTATGTGTTTTAGACTTAGACTTTTTATTGCCCCCCCCCCCTTTTTTT
TTGAGACGGAGTCTCGCTCTGACGCACAGGCTGGAGTGCAGTGGCTCCGATCTCTGCTCA
CTGAAAGCTCCGCCTCCCGGGTTCATGCCATTCTCCTGCCTCAGCCTCCTGAGTAGCTGG
GACTACAGGCGCCCACCACCACGCCCGGCTAATTTTTTGTATTTTTAATAGAGACGGGGT
TTCACTGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCCGCCTGCCTCGGCC
TCCCAAAGTGCTGGGATTACAGGCATGACCCACCGCTCCCGGCCTTGTTTTCCGTTTAAA
GTCGTCTTCTTTTAATGTAATCATTTTGAACATGTGTGAAAGTTGATCATACGAATTGGA
TCAATCTTGAAATACTCAACCAAAAGACAGTCGAGAAGCCAGGGGGAGAAAGAACTCAGG
GCACAAAATATTGGTCTGAGAATGGAATTCTCTGTAAGCCTAGTTGCTGAAATTTCCTGC
TGTAACCAGAAGCCAGTTTTATCTAACGGCTACTGAAACACCCACTGTGTTTTGCTCACT
CCCACTCACCGATCAAAACCTGCTACCTCCCCAAGACTTTACTAGTGCCGATAAACTTTC
TCAAAGAGCAACCAGTATCACTTCCCTGTTTATAAAACCTCTAACCATCTCTTTGTTCTT
TGAACATGCTGAAAACCACCTGGTCTGCATGTATGCCCGAATTTGTAATTCTTTTCTCTC
AAATGAAAATTTAATTTTAGGGATTCATTTCTATATTTTCACATATGTAGTATTATTATT
TCCTTATATGTGTAAGGTGAAATTTATGGTATTTGAGTGTGCAAGAAAATATATTTTTAA
AGCTTTCATTTTTCCCCCAGTGAATGATTTAGAATTTTTTATGTAAATATACAGAATGTT
TTTTCTTACTTTTATAAGGAAGCAGCTGTCTAAAATGCAGTGGGGTTTGTTTTGCAATGT
TTTAAACAGAGTTTTAGTATTGCTATTAAAAGAAGTTACTTTGCTTTTAAAGAAACTTGG
CTGCTTAAAATAAGCAAAAATTGGATGCATAAAGTAATATTTACAGATGTGGGGAGATGT
AATAAAACAATATTAACTTGGAAAAAAAAAAAAAAAAAAA
>AA745593
GACTCAGNCTTCAGCCGCTCTCCTCCCCCTGGGCAAACAGGACTCATCTGATGATGTGAG
AAGAGTTCAGAGGAGGGAGAAAAATCGTATTGCCGCCCAGAAGAGCCGACAGAGGCAGAC
ACAGAAGGCCGACACCCTGCACCTGGAGAGCGAAGACCTGGAGAAACAGAACGCGGCTCT
ACGCAAGGAGATCAAGCAGCTCACAGAGGAACTGAAGTACTTCACGTCGGTGCTGAACAG
CCACGAGCCCCTGTGCTCGGTGCTGGCCGCCAGCACGCCCTCGCCCCCCGAGGTGGTGTA
CAGCGCCCACGCATTCCACCAACCTCATGTCAGCTCCCCGCGCTTCCAGCCCTGAGCTTC
CGATGCGGGGAGAGCAGAGCCTCGGGAGGGGCACACAGACTGTGGCAGAGCTGCGCCCAT
CCCGCAGAGGCCCCTGTCCACCTGGAGACCCGGAGACAGAGGCCTGGACAAGGAGTGAAC
ACGGGAACTGTCACGACTGGAAGGGCGTGAGGCCTCCCAGCAGTGCCGCAGCGTTTCGAG
GGGCGTGTGCTGGACCCCACCACTGTGGGTTGCAGGCCCAATGCAGAAGAGTATTAAGAA
AGATGCTCAAGTCCCATGGCACAGAGCAAGGCGGGCAGGGAACGGTTATTTTTCTAAATA
AATGCTTTAAAAGAAAAAAAAAAAAAAAAAAAAAAA
>AI985118
ATGCAAGGNNTAGGCAAAGATTGTTGACCCNGGAGATAGAGGTNNCAATGAGCCAGATCA
TTCCATTGCATTCCAGCTTGGGCGACAGAATGAGACTCTGTCTCAAAATTAAAAANCAAA
AAACCAAAANCAAATAGATGAAAAAGTAGACTGGAGACAAATAAAAGTGAGTTTCTAAAG
GAAATTCACAGTAATGCTGCATTAAACACTAAGCTCACTTAGGTCACTTTCTAGTGAGCT
AACCGTAACAGAGAGCCTACAGGATACACGTGAGATAATGTCACGTGTAGAAGATCGTTG
TGAATTAAAGTTCAAAATTAAGACTTCTTAGATTATGATGTAGATTTTAGAGCTCCTTAA
AACATAAAGCGAATCTTATAAATGTTCAATTCTAAAGTTATTCCACTTGGAAAAATTAGC
TTTTGGGACAATTTTTAAGAACTTTTGTGTAAAATGCAGCTCCATGTTTAGCATAATCTA
AAAATAATTTCAAGCAATCCAGAATCTTCCAAGAATGTTATTAAAGCTTTAAAACAAAGC
AAAACAAAAAGACCCTTTTGTGCCTTATATGGGAAGACTAAAAAAA
>AB038160
ACCGGGCACCGGACGGCTCGGGTACTTTCGTTCTTAATTAGGTCATGCCCGTGTGAGCCA
GGAAAGGGCTGTGTTTATGGGAAGCCAGTAACACTGTGGCCTACTATCTCTTCCGTGGTG
CCATCTACATTTTTGGGACTCGGGAATTATGAGGTAGAGGTGGAGGCGGAGCCGGATGTC
AGAGGTCCTGAAATAGTCACCATGGGGGAAAATGATCCGCCTGCTGTTGAAGCCCCCTTC
TCATTCCGATCGCTTTTTGGCCTTGATGATTTGAAAATAAGTCCTGTTGCACCAGATGCA
GATGCTGTTGCTGCACAGATCCTGTCACTGCTGCCATTGAAGTTTTTTCCAATCATCGTC
ATTGGGATCATTGCATTGATATTAGCACTGGCCATTGGTCTGGGCATCCACTTCGACTGC
TCAGGGAAGTACAGATGTCGCTCATCCTTTAAGTGTATCGAGCTGATAGCTCGATGTGAC
GGAGTCTCGGATTGCAAAGACGGGGAGGACGAGTACCGCTGTGTCCGGGTGGGTGGTCAG
AATGCCGTGCTCCAGGTGTTCACAGCTGCTTCGTGGAAGACCATGTGCTCCGATGACTGG
AAGGGTCACTACGCAAATGTTGCCTGTGCCCAACTGGGTTTCCCAAGCTATGTGAGTTCA
GATAACCTCAGAGTGAGCTCGCTGGAGGGGCAGTTCCGGGAGGAGTTTGTGTCCATCGAT
CACCTCTTGCCAGATGACAAGGTGACTGCATTACACCACTCAGTATATGTGAGGGAGGGA
TGTGCCTCTGGCCACGTGGTTACCTTGCAGTGCACAGCCTGTGGTCATAGAAGGGGCTAC
AGCTCACGCATCGTGGGTGGAAACATGTCCTTGCTCTCGCAGTGGCCCTGGCAGGCCAGC
CTTCAGTTCCAGGGCTACCACCTGTGCGGGGGCTCTGTCATCACGCCCCTGTGGATCATC
ACTGCTGCACACTGTGTTTATGACTTGTACCTCCCCAAGTCATGGACCATCCAGGTGGGT
CTAGTTTCCCTGTTGGACAATCCAGCCCCATCCCACTTGGTGGAGAAGATTGTCTACCAC
AGCAAGTACAAGCCAAAGAGGCTGGGCAATGACATCGCCCTTATGAAGCTGGCCGGGCCA
CTCACGTTCAATGGTACATCTGGGTCTCTATGTGGTTCTGCAGCTCTTCCTTTGTTTCAA
GAGGATTTGCAATTGCTCATTGAAGCATTCTTATGATGGCTGCTTTATAATCCTTGTCAG
ATATTAATAATTCCAACTCCTGATTCATGTTGGTGTTGGCATCAGTTGATTATCTTTTCT
CATTAAAATTGTGATGCTCCTAAAAAAAAAAAAAAAAAA
>X69699
TTCAGAAGGAGGAGAGACACCGGGCCCAGGGCACCCTCGCGGGCGGGCGGACCCAAGCAG
TGAGGGCCTGCAGCCGGCCGGCCAGGGCAGCGGCAGGCGCGGCCCGGACCTACGGGAGGA
AGCCCCGAGCCCTCGGCGGGCTGCGAGCGACTCCCCGGCGATGCCTCACAACTCCATCAG
ATCTGGCCATGGAGGGCTGAACCAGCTGGGAGGGGCCTTTGTGAATGGCAGACCTCTGCC
GGAAGTGGTCCGCCAGCGCATCGTAGACCTGGCCCACCAGGGTGTAAGGCCCTGCGACAT
CTCTCGCCAGCTCCGCGTCAGCCATGGCTGCGTCAGCAAGATCCTTGGCAGGTACTACGA
GACTGGCAGCATCCGGCCTGGAGTGATAGGGGGCTCCAAGCCCAAGGTGGCCACCCCCAA
GGTGGTGGAGAAGATTGGGGACTACAAACGCCAGAACCCTACCATGTTTGCCTGGGAGAT
CCGAGACCGGCTCCTGGCTGAGGGCGTCTGTGACAATGACACTGTGCCCAGTGTCAGCTC
CATTAATAGAATCATCCGGACCAAAGTGCAGCAACCATTCAACCTCCCTATGGACAGCTG
CGTGGCCACCAAGTCCCTGAGTCCCGGACACACGCTGATCCCCAGCTCAGCTGTAACTCC
CCCGGAGTCACCCCAGTCGGATTCCCTGGGCTCCACCTACTCCATCAATGGGCTCCTGGG
CATCGCTCAGCCTGGCAGCGACAAGAGGAAAATGGATGACAGTGATCAGGATAGCTGCCG
ACTAAGCATTGACTCACAGAGCAGCAGCAGCGGACCCCGAAAGCACCTTCGCACGGATGC
CTTCAGCCAGCACCACCTCGAGCCGCTCGAGTGCCCATTTGAGCGGCAGCACTACCCAGA
GGCCTATGCCTCCCCCAGCCACACCAAAGGCGAGCAGGGCCTCTACCCGCTGCCCTTGCT
CAACAGCACCCTGGACGACGGGAAGGCCACCCTGACCCCTTCCAACACGCCACTGGGGCG
CAACCTCTCGACTCACCAGACCTACCCCGTGGTGGCAGATCCTCACTCACCCTTGGCCAT
AAAGCAGGAAACCCCCGAGGTGTCCAGTTCTAGCTCCACCCCTTGCTCTTTATCTAGCTC
CGCCCTTTTGGATCTGCAGCAAGTCGGCTCCGGGGTCCCGCCCTTCAATGCCTTTCCCCA
TGCTGCCTCCGTGTACGGGCAGTTCACGGGCCAGGCCCTCCTCTCAGGGCGAGAGATGGT
GGGGCCCACGCTGCCCGGATACCCACCCCACATCCCCACCAGCGGACAGGGCAGCTATGC
CTCCTCTGCCATCGCAGGCATGGTGGCAGGAAGTGAATACTCTGGCAATGCCTATGGCCA
CACCCCCTACTCCTCCTACAGCGAGGCCTGGGGCTTCCCCAACTCCAGCTTGCTGAGTTC
CCCATATTATTACAGTTCCACATCAAGGCCGAGTGCACCGCCCACCACTGCCACGGCCTT
TGACCATCTGTAGTTGCCATGGGGACAGTGGGAGCGACTGAGCAACAGGAGGACTCAGCC
TGGGACAGGCCCCAGAGAGTCACACAAAGGAATCTTTATTATTACATGAAAAATAACCAC
AAGTCCAGCATTGCGGCACACTCCCTGTGTGGTTAATTTAATGAACCATGAAAGACAGGA
TGACCTTGGACAAGGCCAAACTGTCCTCCAAGACTCCTTAATGAGGGGCAGGAGTCCCAG
GGAAAGAGAACCATGCCATGCTGAAAAAGACAAAATTGAAGAAGAAATGTAGCCCCAGCC
GGTACCCTCCAAAGGAGAGAAGAAGCAATAGCCGAGGAACTTGGGGGGATGGCGAATGGT
TCCTGCCCGGGCCCAAGGGTGCACAGGGCACCTCCATGGCTCCATTATTAACACAACTCT
AGCAATTATGGACCATAAGCACTTCCCTCCAGCCCACAAGTCACAGCCTGGTGCCGAGGC
TCTGCTCACCAGCCACCCAGGGAGTCACCTCCCTCAGCCTCCCGCCTGCCCCACACGGAG
GCTCTGGCTGTCCTCTTTCCTCCACTCCATTTGCTTGGCTCTTTCTACACCTCCCTCTTG
GATGGGCTGAGGGCTGGAGCGAGTCCCTCAGAAATTCCACCAGGCTGTCAGCTGACCTCT
TTTTCCTGCTGCTGTGAAGGTATAGCACCACCCAGGTCCTCCTGCAGTGCGGCATCCCCT
TGGCAGCTGCCGTCAGCCAGGCCAGCCCCAGGGAGCTTAAAACAGACATTCCACAGGGCC
TGGGCCCCTGGGAGGTGAGGTGTGGTGTGCGGCTTCACCCAGGGCAGAACAAGGCAGAAT
CGCAGGAAACCCGCTTCCCCTTCCTGACAGCTCCTGCCAAGCCAAATGTGCTTCCTGCAG
CTCACGCCCACCAGCTACTGAAGGGACCCAAGGCACCCCCTGAAGCCAGCGATAGAGGGT
CCCTCTCTGCTCCCCAGCAGCTCCTGCCCCCAAGGCCTGACTGTATATACTGTAAATGAA
ACTTTGTTTGGGTCAAGCTTCCTTCTTTCTAACCCCCAGACTTTGGCCTCTGAGTGAAAT
GTCTCTCTTTGCCCTGTGGGGCTTCTCTCCTTGATGCTTCTTTCTTTTTTTAAAGACAAC
CTGCCATTACCACATGACTCAATAAACCATTGCTCTTCAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAA
>AK025615
TGCTTCATAAAATTTACCTAAGCAAGTGGTCTTGCTTGCCTCAAATCCAAGCAGTCTTGA
ACACTTGGAGGCAATTAATGAGTATATCTTAGTCAAAAGAATTGTTGGAGCTTTTTATTA
AAGCTGCAGTTTCAGTTCTGCTTTTGGGGAATTGTGCTATGAAAGCAGCTGCCAAAATAA
GCTCATTTATTTTCTTCAATCCCACTCAGTGCTCAGTCACTATATTCTGTTTCCTTTTTT
TTTTTCAAGTTGCATATTTGGTTTCCCCTTATGATTGGGAAAGATGAATTTTCAGCAGAA
AACAGTGTTTGTTCACTTTCAAAGAGTGATAGTTTCTAAAACATTTAGAGCAATAAATAT
TCATCAGAGGTACCAAGTAAGCCAGCAGAAGAGTTAAGGGTTAGAGAAATCCCTTATTTC
ATGTCTTGACTCTAAAATGATCAAAGTACTTTTCCTTGTAATGTGGATTTCTTCTTATGC
GGATATGCAAAAACTTCAGTTATACGTAGTAATGCTAGCAGGTAATTTTAGTGGACATTT
TATAACAACTGTCACTTTGTTTTGCCACATGTAGAGTTTGTTCAGCTATTTTCCAGATAT
CTCCCCACAAAAGGAGGCAAAGGGTACCAGCTTTTCAATGAGCATTACCTATTACTTGGC
AAAGATGATGAAGACTCTATTAATAGTTCATTTGATAAATGTTGACATAACCAACAATAG
AGATTAGGAAGTTAGTTTTAAGAAATCAATAGCATATAGACATTACCCTCATGGAGTTTG
TATTCTACTACTTGAACTGATTGTAGCTATAAAAGCATAGTTAGATAGCTGAATAGTTAG
ATCATAAGCAAAGAAGGCCAGAACACATCTCTTATCAAGAAATCAATGAATAGTTTATCT
CATTTTTAAAGCAACTTTATCCTTCTTTAATTCCTTCCTTTCTTCTAGTGCAAAACTACT
TAATAAGGTTGGTGTTTAGGTTAGTGTTCACACCATTCCTCATCTGGTGTGAATTACCTT
CTCTTTCTTTACTATTTACTACCAACCTAGTACATGTGTTGACTGAATTCTTTTCAAACA
ATGTTGAGTTATCATGGTGCACCTAATAAATTAACACCACAGATTACAGCATCCTTGCTG
ATTTTCTCAGCAAAGCCAGATTAGATGGAAATAAACAAAGAAAATGATCCTAGAGTGAAT
TTTTCTAGAAAATATCTATTATGAACCATGCTGTTTAAAGTATTAGCTTGAAGGTGATGG
ATCCAGCTATTCAGAAAATAACTTTCATATAACCATGATTTTGCACAGTATGAGGTCTTA
AATGTGTGGAAAGAGATAAATTTTTTATCATTACCACAAACCCCTTTTAAAGATTCAAAG
GTGGAAGAAAGTGATTTATTTTTTCTCTTCAGCATACATATATAAAAGACTTGTCAGATG
TTTAATTTGGGGAGGTTGATAATGAAACATATCAACAGAGTATAGTAGTTATAGTAGTGT
TTGTGGGTAAATAATTTCCTGGGGTCAGACATATATAAACATATTTGCTTCAAAATGATA
AAGGCATGAAATCAGTCTTAAAAATTGAAATGGGGGTGATGGGGGAGAAAAAGAAGAACA
AATTTGAAGTGCCCTTTCAAATCTGCTGGATACAAGTATTGAAGTTTTAAGTCATCTTAT
TCTGTCTGAAAGTGTATTTTTCATTCTACAATAGACCCAATCAACAAGACGTATAACTTG
AGTTGCATGATGTTCAGTTTATGTAATCTACTGTTGGGATGGTAAGAATTGATGTAGGCT
GTGGTGTAAGAATGAATTAAAATATAGTTTCACTGGCTTTTCTCTACATATCCACTATCA
CAATGGCTAGGTTTCCTGTTGCTCACTGTTGGATTCTGGAGAAAAATTTAATGAAAGATG
ATATCAGAGGAAGAATAAGTGGAGGTAGAGAAGAAAGGAGTGATAGAGGAGGGGAAAAAA
ACAAAACATATTTTTGTGTTATCCAAAGGAGCTTTTTCCTTATTCTGTCAAGCATTGAGA
TCTTCTTCAGCTTTCAATGTAGTTGCTAAATACAAATAATGCTACTAGGTAGTGACTAAA
TATAGCAAACACTTCATCAGATATTAGAATTAGGTCACACTATTGAGGTTATAATCTGAA
GGTTGTGTTACATAGAAACCACTTTAGATTATTATCAACTTGGGCTAGGCTTTATTTTAT
AATAGCATAGTAAGTAATATCTATTGTGTCATTTCTTCAACCATTTTATTCTAAGATCCA
TGAAGCTTCTTGAGGCCAAATAAAATAATAAGTTTAGACAAGAAGTAGATTGTGACTTTT
TTTCCCTTAGAGATACTATTTACTATCTCCTATCCTGATAGGTGGAAGGTTTACTGAATT
GGAAATTGGTTGACTATTAGTTTTTAACTAAAATGTGCAATAACACATTGCAGTTTCCTC
AAACTAGTTTCCTATGATCATTAAACTCATTCTCAGGGTTAAGAAAGGAATGTAAATTTC
TGCCTCAATTTGTACTTCATCAATAAGTTTTTGAAGAGTGCAGATTTTTAGTCAGGTCTT
AAAAATAAACTCACAAATCTGGATGCATTTCTAAATTCTGCAAATGTTTCCTGGGGTGAC
TTAACAAGGAATAATCCCACAATATACCTAGCTACCTAATACATGGAGCTGGGGCTCAAC
CCACTGTTTTTAAGGATTTGCGCTTACTTGTGGCTGAGGAAAAATAAGTAGTTCGAGGAA
GTAGTTTTTAAATGTGAGCTTATAGATAGAAACAGAATATCAACTTAATTATGAAATTGT
TAGAACCTGTTCTCTTGTATCTGAATCTGATTGCAATTACTATTGTACTGATAGACTCCA
GCCATTGCAAGTCTCAGATATCTTAGCTGTGTAGTGATTCTTGAAATTCTTTTTAAGAAA
AATTGAGTAGAAAGAAATAAACCCTTTGTAAATGAGGCTTGGCTTTTGTGAAAGATCATC
CGCAGGCTATGTTAAAAGGATTTTAGCTCACTAAAAGTGTAATAATGGAAATGTGGAAAA
TATCGTAGGTAAAGGAAACTACCTCATGCTCTGAAGGTTTTGTAGAAGCACAATTAAACA
TCTAAAATGGCTTTGTTACACCAGAGCCATCTGGTGTGAAGAACTCTATATTTGTATGTT
GAGAGGGCATGGAATAATTGTATTTTGCTGGCAATAGACACATTCTTTATTATTTGCAGA
TTCCTCATCAAATCTGTAATTATGCACAGTTTCTGTTATCAATAAAACAAAAGAATCCTG
TTAAAAAAAAAAAAAAAAAAAAA
>AW118445
TGGCTCTCTCCTTCAAAAGGNCCAGGCCCTGTCCCCCTTTCTCCCCGANTCCAACCCCAG
CTCCCCTGTGAAGAAAAAAGTTAAAAAATTTGTTATTTATTTGCTTTTTGCGTTGGGATG
GGTTCGTGTCCAGTCCCGGGGGTCTGATATGGCCATCACAGGCTGGGTGTTCCCAGCAGC
CCTGGCTTGGGGGCTTGACGCCCTTCCCCTTGCCCCAGGCCATCATCTCCCCACCTCTCC
TCCCCTCTCCTCAGTTTTGCCGACTGCTTTTCATCTGAGTCACCATTTACTCCAAGCATG
TATTCCAGACTTGTCACTGACTTTCCTTCTGGAGCAGGTGGCTAGAAAAAGAGGCTGTGG
GCAGGAAAGAAAGGCTCCTGTTTCTCATTTGTGAGGCCAGCCTCTGGCTTTTCTGCCGTG
GATTCTCCCCCTGTCTTCTCCCCTCAGCAATTCCTGCAAAGGGTTAAAAATTTAACTGGT
TTTTACTACTGATGACTTGATTTAAAAAAAATACAAAGATGCTGGATGCTAACTTGATAC
TAACCATCAGATTGTACAGTTTGGTTGTTGCTGTAAATATGGTAGCGTTTTGTTGTTGTT
GTTTTTTCATGCCCCATACTACTGAATAAACTAGTTCTGTGCGGGTAAAAAAAAAAAAAA
AAAAAAAAAAA
>AL137761
CACAAAGAAAAAAGAAATACCTGTAGAAGCGCATCGAAAGCTCCTGGAACAGAGTTGTGT
CTCATATTTGCAAAGATGCAGAAAAAATAAACCCGGGACATCCAGCTTTCTTTTCCTTTC
TTCTTTGACTATTCTGAGAAGCTATGCGACTAGGAGCACATTTTAGGTAAACACGTGGCT
TGAGTAGCCATAAGGCCACTCTTCCCTGTCGTGTGACCCGCGCCTGGGCCTTTAAGAGAT
ATTGGTGTTTGAAAAGGGAGGAATCTGTTTGCCCTCAGATATTTAGTTCAACTGCCTGCA
TTGCTTCCTATTTTGTTGTCCAACTCTGTAGTAGTTAGCACTGGCCTTACCAACATGTAA
AGAAATTTTCTTTACTGCCCCATGAGTAGTTGGAGGCAAAGAGAAATTTTTAAAGCGCAG
AAAAAGGCCTGCAGGGAGATGGAATTTGTTCTGCCAGAGAAACGAGATGATAGCTGTATT
TAATAAAGTTACTGACCTCTTGTCAAAATTTAAAACGCAAAAGAAGATGTTTCAAAATGC
AGAGAATGTCAGAAAACAAAAACTACAGGGACCAGACCAGTATAATGTTTAGTTTTCATT
ATACTAACTTTTGTCTAGACTGGAGTTGATTCACTATTTTTTCTTTAACTCCTCAGGAAG
CAAACCTTCCCGATGATGAAGACTTCTTGAAGGATTTCATGGGTGATTTGGGATCCCAGG
ACCATTTGGCTAGTGTGCCTAGGTGACCACATGATTGCTGTTTTACCAGGAATGCAGCAT
CCCATTGACAAAACAAGTGCTCTGAGAAGGTTTAAAATACTACAGAGAATATGGGAACAC
AGACCTTGAAATTTAGCTGAGTTGTAACAGCTGAAACTCCAAGAGGTGTCTTCCTTGTTT
GAGGTGAAACTAGTGTTGCTTCCAGAGGGCAGCTGGAAACCGTAAAGCTGTTTGGAAATC
TTTTTGACTGACTTGCTGACAAAGAGGTACTGTGATGCATTTTAACAATATCTAAGTTGA
TTTTTTTTTAAATCAAGGAAAATAAAAACCAAGCATGAATGCTATGGTATGTGCCCCTTT
TGACCATCCTGGGCTGATTAACATCATTTAAATCAAAGTAATCATAAAAAGGCATATTCT
ACTTCAATTATGTGGTCAAATAAGAGTAAACACACACACTCACACATGCTGACCCCAATT
GCCAGAGCATTACTGCACTATAAATTACGGTTAATTCCCAAATTATACTACTGTTTATCT
TATTTAACAAGTCAGAAAGCACTTTTAAAATAACTTGAGGGCTACAAGGTCATTCTATTA
ATGTCATTCTCCATTCGGGTTGTAGGCATGTGGAAGTACCCATTAAAAGATAAGTTAGAG
TTTAAATACTGATAAACAAAACCTTTTATTGCAACTGGACAGTTTCTGGAGAGTTAGCGG
AAGAATCTTGGAGTTTCCTTTGGTCAGATGAATACAACATTTCACTTTTGCAGCACTATT
TAGAATGTACTCCATGGTTCTCTTGTTCCCAACTTCCAAAAAGAACAGAAAACTTTGGTT
TACACAGAACACGGGCATCTGAGGCAGGACCTCTTCCCTGCCCTTTGATCTGACTCACAC
CTCCACATATGACGTAATCAACCCAAATTTGACACCAATTCACTCTTTTCTGCAAAGGGC
ATATTTTGAAACAAGGGACAGCCTGAGGGCGGCTATAATGAGAATGTTCATGGGGGTTAC
TGGGTCCCTAATTCTGAACTTGCTTATGACACCCAGAGTGAATAGATTCAGATTCAGAAC
CTTCTGAGAAATAACCCAAAGAAAATTTGTTACCCAGCCAATTCTTCGAAAGCTTAATAT
CAAAATATATCTTTTCAAGAAGAAAATCGTTAGAGAGAAGAATGTGGAGGGGAGAGAAAT
GGGTTTCTCATTGATATGATATTTTGTTAACCATTTCATTTTGAATTATTCAAGTTTTGG
TTAATATTGTATTCTTTTTTCGTAACTATTTTACCGTGAGAGTAGGTCATTGGGTTACTT
AGATATTTATTTTTACACAGTTATTAGTCTTCAGATAGTTTTATTTTACTTCATATGATT
TTAGTTTTTGTCAGTATAATTTTAAATCATGTTTTTCTTGGTCATCTCTTTGTGTATATT
GTGTAATTGGATTTTCATTGACTGCAAGTGGAGTGTTTGCCACTCAATTCAGTACTCAGT
ACTATGGTGACTTGTTTTCAAATAAGTCTCAGATACACATTTAGGGAGCCTTTGCTGGCC
GAATATAGACTCTGTCAGGACAGCAGGTCCCCTGATCTAAGAATTTTCCCCAATGGTTGC
TCTAAAAATGCTGCTATTTTGCTGTTCACTGTATTGCACTTAGTTAAAAAGAAGATAATG
TGAAAGATGAGAGCAGTTTTTTAAAGGATCTTTTCATATACCCAATTCCCTTATTTTCAG
ATGTCCCATCAATTTTAGATATGAAAGCTTTAAGTAAAAGTGTGTATGCCTTTCTACTGT
CAGAACAGGATGGATGCAGCCTGGGTCAGATTTATTTAAGATAAAAATCATGCAGACTCA
TCATTCATATCATAGGTGAAAAATGTAAAAACCAAATGGTTTCCACTAAAGCCACCAAGA
TCTTTTAGAAATGTTTGCACCTTTGGTGGTGGCACAGGAAAAGAGAAGAATTCAGCTGGA
GTGAATTCTAGAAGTAGATATCAGAAACGGGGCATGAAGAACAGGGGAACTGGGTGGCAT
CAGACTCCTAAAGAAGTGAGTTAATTTTCCTTCCCTTCCATTCAGATTCATGCCACAGCT
CCATATCTTGAGTATGTGTAAGAGGTGAGTTCCTTCTTCAGCCAGGGGCGGTGGCTCATG
CCTTTAATCCCAATGCTTTGGGAGGCCAAGGTGGGAGGATCACTTGTGCCTTGGGGTTCA
AGGTTGCAGTGAACCATGATTGCACCACTGCACTCCAGCCTGAGTGACAGAGCAAGACCC
TGTCTCTAAAAATATATATAAAAAGTAAAACTAAAGAACTTCTTGCCTAAACCTGAATTA
CCGCAATTTGCTGAGTGACTTTGAGAAAAATCAGACTGTTTAGTTCAGTCGGGATGAAAA
GCTTGCGATTGCTTCCCACAAGAATGGGCAATAGTGACGGCTGCAAGGTACTTTTATTTG
TTCATGAAAGAACGACAATTTTTCAAAATGTAATTAAACATAATAGAATGTTTTAAACTA
CTGGGCACTGAAACTGGAAGAAAAAGGAGGCTTTATTGAACATTCCCCTTTTTCAGTTGG
TTCAAAGTTCAGCACTGTGGTTATCATTGGTGATGCCAGAAAACATTAGTAGACTTAGAC
AATTGCTATGGCAGTTTCTAAACAGAGCTTTTTCTATACACTATTTGCAACTGGAGTGCA
ATATTGTATATTCTGTGTTAAAGAAATAAAGTATTTTTATCATTTATTAAAAAAAAAAAA
AAAAA
>AF038191
CCATCCAGAACGATGAGGCCGTGGCCCCGCTCATGAAGTACCTGGATGAGAAGCTGGCCC
TGCTGAACGCCTCGCTGGTGAAGGGGAACCTGAGCAGGGTGCTGGAGGCCCTGTGGGAGC
TACTCCTCCAGGCCATTCTGCAGGCGCTGGGTGCAAACCGTGACGTCTCTGCTGATTTCT
ACAGCCGCTTCCATTTCACGCTGGAGGCCCTGGTCAGTTTTTTCCACGCAGAGGGTCAGG
GTTTGCCCCTGGAGAGCCTGAGGGATGGAAGCTACAAGAGGCTGAAGGAGGAGCTGCGGC
TGCACAAATGTTCCACCCGCGAGTGCATCGAGCAGTTCTACCTGGACAAGCTCAAACAGA
GGACCCTGGAGCAGAACCGGTTTGGACGCCTGAGCGTCCGTTGCCATTACGAGGCGGCTG
AGCAGCGGCTGGCCGTGGAGGTGCTGCACGCCGCGGACCTGCTCCCCCTGGATGCCAACG
GCTTAAGTGACCCCTTTGTGATTGTGGAGCTGGGCCCACCGCATCTCTTTCCACTGGTCC
GCAGCCAGAGGACCCAGGTGAAGACCCGGACGCTGCACCCTGTATACGACGAACTCTTCT
ACTTTTCCGTGCCTGCCGAGGCGTGCCGCCGCCGCGCGGCCTGTGTGTTGTTCACCGTCA
TGGACCACGACTGGCTGTCCACCAACGACTTCGCTGGGGAGGCGGCCCTCGGCCTAGGTG
GCGTCACTGGTGTCGCCCGGCCCCAGGTGGGCGGGGGTGCAAGGGCTGGGCAGCCTGTCA
CCCTGCACCTGTGCCGGCCCAGAGCCCAGGTGAGATCTGCGCTGAGGAGGCTGGAAGGCC
GCACCAGCAAGGAGGCGCAGGAGTTCGTGAAGAAACTCAAGGAGCTGGAGAAGTGCATGG
AGGCGGACCCCTGAGTCCATCAGCTGCCAGCCCCGGCCCTGGCCCCCACCCCAAGTTCCC
TGAAGCATCCTCCAGCTCACTGTGGCCAGCTTTGTGCAACCAGGGCCCACGGCGCCCCTC
CTGTGCTGTGACGTGTGTGTCGTGGCTGGCCCCGCGGCGCCTACCGCCCTGGCCGTGTCT
GTCTGGTGTGTGCTGTGAACCCCTGCACCCAACCCCACATCTGGGTGGCCAACTTGGCAG
GACTTGGCCAGCAGCTGCCCAGGACACAGTGCAGGCCAGAGCGGGCTTGACCACCTGGTG
GGCCTCCCTGCCCGCTTCCTTGGGCTCCCCGGCCCTGGGTGGGCGGTGCGCAGCTGGTCT
CCAGGGACTCAGTGAGTGGCTGTGCTCTCTGCACAACGGGCAATGTGCAGACGCATTTTT
GGTAATCACAGCTGGGGAGTGAAAAGGGTGCCACTGGCACCACTGGGTGGATGGTCCAGA
GCCTCCACCCACAGAGGGGATGCAAAGGGCAGGTGAGTCAAGAACCGCATAGGTCTCCAG
TCCCCACGGGGCTCCCAGGCCGGGGAAAGGTTCCCCTGAGGTCACTCTGAGGCCAGGGAC
GTCACCCAAGGCTGGTGGTCAGTGTGAAGGGCTCCGTGCCAACTGGTCAGCTGTCCTTCA
CGCACATATCCGTGGCCACCTGAGACCTGCTCCACGACCCTTCCAGGCAGAGCCGAGAGT
TCGCCCCAACCCTTCCCCAGGCCCAGTGTGAAAAACAGACTCACAAGGGGCTTCTTGGCC
TGCAGCTTCATTTGCGAGAGCGCCGAGGCAGGACACAGAGCACAGCTGTGCTGGAAGTGT
GGGGAGAACCCGGACAGCTCAGTCCTGCCAGCAGCCGCAAAGAGCCGAGGCTGCCAGGCC
CATTTATGTCCCTCATGTCTCTAGATTTTCTCGTCACCCAGCCTCAAAAATATATGTGTC
TGCAACCCTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>BC016340
GGGGGGGCTCCGTGACAGCCAACGCAGTGACCCTCGCCCCTTCCTTGGCAGCACATCATG
CTTGTGCAGCGGCAGATGTCTGTGATGGAAGAGGACCTGGAAGAATTCCAGCTCGCTCTG
AAACACTACGTGGAGAGTGCTTCCTCCCAAAGTGGATGCTTGCGTATTTCTATACAGAAG
CTTTCAAATGAATCTCGCTACATGATCTATGAGTTCTGGGAGAATAGTAGTGTATGGAAT
AGCCACCTTCAGACAAATTATAGCAAGACATTCCAAAGAAGTAATGTGGATTTCTTGGAA
ACTCCAGAACTCACATCTACAATGCTAGTTCCTGCTTCGTGGTGGATCCTGAACAACTAG
ATGTTCCTAGACATTTTCTTTATGGTTCCAAGTGCAAAACAGGTGTTCTTATCTAAAACG
TCAATTAGAAAATTATCTGCGGTTGTTAATCTACTGTATATTTTTGTTTGGTATATTTAC
TAAGTGCACTCTTTCAAAACTTATTCTATAACTTTATCAATTCATGTGAATTTTAGCTCA
ATTTTCAAAGTTCACTAATATTCTCAATATTTAATGCTAAATGCTTTGCTACATTGTAAC
TCACCTAAAACCTTTTAGTGACAAAATCCTAATATGTGGAAAAAAGCATATGCATAAAGG
AATAATATTGTGAAAATGAATCTGTTATGATAAAGAAAAAATAAAGTGGAAACTTTTAGA
GTATTACTTCATAGGGCAGATTTTGTAAACTGTCGTATACTGTAAAGGGTTAAATCAGCG
TTTTGTGATTTTTAAGTAACTGTGAGTGAAGTTTATTCTTCAACAATGTCTACTCCATCC
CCAACCCAACTCACAGCCCTATGACTACTATCTTTGCATTAGTTAAAAAGTTAGTATATA
GGCATCAAACAACCTTGGCTGTAACCTATAGAATCTCTATCCATGTATCAGGTTATAGAC
TGGTTTTTCAAAAGTGAACAATCCTGTGATAAGTTGGAGTACCATTTAGTAATACAGCAA
CATTGTGTCATTTATTAGCATCATAATTCTTTGTTATGTAAGTTAAATATATCAAGAAAG
AAGAGACTGTTTGGAAAAATGTGGTTCAAGTTTTATGCTATATAGTTTTGGTATGCGATA
CAGACAGCTAACTTTTCTTATGAAAAATACATATTTGCATGTAAACAATGATTTCAAAAT
ACTTGAAAAATAAAATTTTAACCCAAATGAATAACTAAGAAATATAAAACAAGCACAAAA
TCTTAGGGAAGTCATAAAATAGTAGTGAAAGTATTAGACAGAAGACATCTGTTTTCGAAT
TTCAACACTAGAATGACTAAAACTATCTACCTATAGAACTATCTGTAGATAGTATACTAT
CTACACTCTGCTCAACAAGCTCAGAAATTAAATATTTTTAGTAATAAAAATCTGTTCTGG
TTATAAACCTTGCTAATGAAAATACAATACATATAAAAATGTATAGCCATGTTATTTTCT
AGTATAAATTCCTTTGAAACTATAAGTCTTTGAGGAAAATTATAAGGTAAAATTTTCCTG
TTTTTCCCCCTTTGAAAAACTCAGGAAAAAAGGAAGATTGAACTAATAAAATTTTATTTC
TTAAATATAAATTTGACCTAAAATATTTTCTCAAACTAATTCATGAAACAGCAACTTTTA
CCAATACCTTTGTATACTCTCAGTTCTCATTCAGTATAAATAAAATTTTAAAATCCTTTC
ATAGTTCTATTAGAAATAAGTAGTAAATTTTGATATATTGTACATACACACGTGTGTGTG
TGTGTGTGTGTGTGTGTGTATTTGTGTGCCTCTGGTCAACTCTAAGGATGACAGACACTG
TGTAACAACACCTGGGTCAACTCTTTTAATTTATATACAAAGCAAAGAACAACATTAATG
GAGATGCACAATGATTATTCAAACAAGCTATATATATGTACAAAGGCAAACAGACACATA
ACAGTCTCTGCAGACTGATTGTATATAGTAAGAAAAGATCAAAAGACTTTAAAACCTAAA
TGACTTTTGACATACAAACTCTTCTTGAGAATGTTTGTTGTAAATGGTTTCAAAAATACA
AATTATAGCCAATCAAAACATTGCTTTGGTTGGTGCATTTAAGTATCCAACTCAAAAAGC
ATATCAAATATTTTGGGTACTAGGCAGTTTCCAAAGTAGCATGGTAGTATTACTTGTTAA
AAGGGTTCTGTTTTCATTAACAGTACTAAGTGGAAGGGATCTGCAGATTCCAAATTGGAA
TAAGCTCTATCATATTCTGAAACAAGAATTAGAATGACTTGAGAACGGGCAAATAACAAA
GCAAACCAATATAATTATATGGTCATTCTGACCCCAGCTCTTATACAAATTATACATGTA
TTTTTGTGTATGTTTGTGAGAGTTGTATGTATGTGAATGTGTGTGAGTGTGTATTCACAT
ACACATATATACTGGAACCTATAGTAGAAAAGGAAACTAGTAGGGCCAAAAAAAAAAAGA
AAAAGAAAAAGAAAAAAGAAAAAAAAAGAAAAAACTGGGACCTAAGTATAAATATCTCAT
CCTAAAGTAAACAATAAGTTTATAGTTAACGAAGATTTTTTTCTATTTAAAACCCCATTT
TCCTAAAGAACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>BC013282
GGCACGAGGGCAGGGGGAAGGGAAGTGCGGCTCGGTCGGCGCGGGTGGAGGGGGCGTGAG
GCCGCCCTACGGTGGCCGTCGAGGGACGGCGCTACGGCTCCCACGCTAGGCCAAACGCCT
CCGGCGGCCGCGCCCGAGAGCCCCTTCACCTGCAGGGCGACCCCAGCCGGCGACGCGTGA
ACCACGCCCTCAGCCGCCTTGCCAGCGCCCCCAGCCGCGCGCCCCAGCACCATGCGGCCG
CCCTGCGCACGGAGCCCCGAGGGACAGGGGCACCCGCAGGCCCGGCCCCTAGCACCGCCG
GCCGGCCCCGAGGTCCGGGACGCCGGCGCCGCCGCGGAGAGGGCACCGGGCCGACGCCTC
CCCCCAGGGTCAGCTGCGGGCTCCCAGGCCTAGGCGCCCATGACCCCTACGCCAACCGCC
GCCTGGACACCGCCGCCGCCACTGCGACCTAGCGCCGCCGCCGCCGGGGCCCAATGCCGG
TCATGCCCATTCCGCGGCGGGTGCGCTCCTTCCACGGCCCGCACACCACCTGCCTGCATG
CGGCCTGCGGGCCCGTGCGCGCCTCCCACCTGGCCCGCACCAAGTACAACAACTTCGACG
TGTACATCAAGACGCGCTGGCTGTACGGCTTCATCCGCTTCCTACTCTACTTTAGCTGCA
GCCTGTTCACTGCGGCGCTCTGGGGTGCGCTGGCCGCCCTCTTCTGCCTACAGTACCTGG
GCGTTCGCGTCCTGCTGCGCTTCCAGCGCAAGCTGTCGGTGCTGCTGCTGCTGCTGGGCC
GCCGGCGCGTGGACTTCCGCCTGGTGAACGAGCTGCTCGTCTATGGCATCCACGTCACCA
TGCTGCTGGTCGGGGGCCTGGGCTGGTGCTTCATGGTCTTCGTGGACATGTGAGGGCCGT
GGGTGCGAGCTTGATGTATCGTCCCGGCCTGTGGCTGTGTTCTCTCCATGGGTGGGGTCG
GCCAGCGCCTTCCCTTCGCCCATCCCCCAGGCAGTCGCTGCTGCCCGGCGCCCACGGAGA
GAAAAGAAAGGGCTGAGACTTCTGTGATGGGGGCGCGGACACCACCCCTAGGCTGGCTTC
CTGGACCCACCCTCCCCGTATGCACTCTCAGGGGCAGCGCCCACCTGCCGGTGGCTCCTG
CTCACATGTCTTCGGGTCGTACTGCGGGGTGGGCCCTCCGTTCCGCCTCTCTGTGGGCCT
CTCTCCAGGACCACAGCTGCCAGGGACTTTAGACATCACCCTGGGAGGCCCCTGGACACA
GAGGGCTGTGTGCCCAGGAGCAATTCCGGAGGGGGGCCCTCCTGGCTGCACAGCCCCTTC
TGCGTGCCCTGGCCCCAGCCCCAGCCAACGGGACACGGAAGGCTCCCCTCGCTGACACAC
CACACTGCCACAAAGCTGCTTACTCTGCCCTGGGCCGCCTGAGGCCTGGCACTGCCCGCG
GACCACCCTGTGTGTGTCATCCTGAGGGGCTGTGTGGGTCCTGAGTCCCCAGCCAGCCTT
CAGGGTCCCCTTGGATTGTGTAGATGCAGTCTAGCGGGGGGCCGGAGAAGGGCTCAGGTG
GGAGGGGCCTCAGCAGGCTCCCAGCTCAGGGGCTGGCCTGGGGGGAACCCTGGGAGCCAG
GGGCTGACTCCAGCAACACTGGCCTGTCTGCCTGTTCTGGGAGGGCTGTGAGGATGTCTT
GCAGATGCTCTGGATTTCTGCGGAGGCACCTCCATTCCTTTCTGGCTTTTTTTGCGGGGG
AGGGCTTTGGGCCTCTTTCTTTGAGGGAACACCGTCAAAGAAAGCCTGGGAGATCGAGGC
TTCAGTGAGCCAGGATGGAAACGCGTGTCCCAAGTGTCCGGAGCAGGCGGCAGAGGCCTC
AGTGCGGCAAACACAGCCCCAGAGCCTGTGTGGCACCAGCAGCATCTTAGAGCCCCAGGT
ATATGCTGAGATCTTATCTCACGCTGTCCTCCAGTGTCTGGGGGGCCCAAATGATGGCAC
AGGGTCAGGTGGGCTGGAGGGGCGCAGATGCCTGTGTTCAGGGAGGGTGGCCACCATGGG
CCGAGGTCTCACCCAGGACCCCTTGCTCTGCTCCTCAGCCTTGCAGTCACGGCAGCACTA
TGGTGGACTGCCCATGGCCGTGTGACTTTGGGGGCAAGTGGGAGGGCGCCCTGAATAATG
ATTGCAAGGACAACAGGCAGAGGCTACCCTAGAGCAGGACACAGGGTGTGGTACTGACAA
CCCTAGTGTCACCTCAAATCCATGTCCCCACACTCTGGGCATGGGTGGGACTTGTGACCC
TACCCTGTCAGGCGGACCAGTGGCCCAGGAGCCATGAGGACAGTTGTGTGCCACTGGAAG
AGAAACTTTTTGAAAAACCCTAAATCAGGTAGAGAAAGCAAAAAATCTCTGGCCGTAAAC
CGTGCTCTCTAATTTATCGGCAGCTTCTGTGGATGACCTCTGATGAGCCCGGGCTGCGTC
CACGCCCTGGGCAGGTAGGCGGGAGCTTCCCTGCGTGGGCCTCATTTCTTGCTGCAGAGA
ATCTTTTGCACTAAGTCATGCTGTTTCCTCAAAGAAGCTTTGTTTTTTGTTAACGTATTA
CTCAGAGTCACCCAAGCCTCTTGGCTGAGGGTGAAGGTGGGACGGGAGGCGGGAGGGGGC
TGGTGGTGCCGCTCGTGCGGTGTCAACGCTGCAGGGAGTTGTGGCACCTTGGTGCCCTCT
GAGCACCTGGCCGCCTGCTGTCCCCGGTGCCTGTGAAATTCGTCATGCCATGACCCACCT
GCATTAAACCTATTTTTTTAATGTGTTAAAAAAAAAAAAAAAAAA
>H09748
GNGGAAACACGGGCCAAACCCGTGANTTTGGTGCCCCTTGTAAACTCANCCCCTGCAAAN
CCAAAGACCCCAATGGATTTAAAGTTGNTTGGCATTTGTACTGGCAAGGCAAAANATTTT
TAANTACCTTTTCCTAATACTTATTGTATGAGCTTTTGNTGTTTACTTGGAGGTTTTGTC
TTTTACTACAAGTTTGGAACTATTTANTATTGCCTTGGTATTTGTGCTCTGTTTAAGAAA
CAGGCACTTTTTTTTATTATGGATAAAATGTTGAGATGACAGGAGGTCATTTCAATATGG
CTTAGTAAAATATTTATTGTTCCTTTATTCTCTGTACAAGATTTTGGGCCTCTTTTTTTC
CTTAATGTCACAATGTTGAGTTCAGCATGTGTCTGTCCATTTCATTTGTACGCTTGTTCA
AAACCAAGTTTGTTCTGGTTTCAAGTTATAAAAATAAATTGGACATTTAACTTGATCTCC
AAAAAAAAAAAAAAAA
>BC001665
GGCACGAGGCAATCTGAGGAGCAGGAGGACCGGGGCGCCGGTGTCCTGCCGCCTCCTTCT
CCTTGCTCTCACCTGCGCCTATTAGTCCACGCGCCTTCAAGGCCAGGGGCTACAGCCCAG
ACAGAGAGGGGACAGCAGAGGGAGAGAGAGCACCTGAGGATACAGAGCTGGCACTGGACT
GCCTTTTCACCCCCCAGGTGATGAGTGAGGTTCGAAGAACGGAAGATTTAAAAAGCAGCC
GGGGCCTCCGTATTGAATGAAAGACCCAGTGCAAAGACATCACCATGAACACTAGCATTC
CTTATCAGCAGAATCCTTACAATCCACGGGGCAGCTCCAATGTCATCCAGTGCTACCGCT
GTGGAGACACCTGCAAAGGGGAAGTGGTCCGCGTGCACAACAACCACTTCCACATCAGAT
GCTTCACCTGTCAAGTATGTGGCTGTGGCCTGGCCCAGTCAGGCTTCTTCTTCAAGAACC
AGGAGTACATCTGCACCCAGGACTACCAGCAACTCTATGGCACCCGCTGTGACAGCTGCC
GGGACTTCATCACAGGCGAAGTCATCTCGGCCCTGGGCCGCACTTACCACCCCAAGTGCT
TCGTGTGCAGCTTGTGCAGGAAGCCTTTCCCCATTGGAGACAAGGTGACCTTCAGCGGTA
AAGAATGTGTGTGCCAAACGTGCTCCCAGTCCATGGCCAGCAGTAAGCCCATCAAGATTC
GTGGACCAAGCCACTGTGCCGGGTGCAAGGAGGAGATCAAGCACGGCCAGTCACTCCTGG
CTCTGGACAAGCAGTGGCACGTCAGCTGCTTCAAGTGCCAGACCTGCAGCGTCATCCTCA
CCGGGGAGTATATCAGCAAGGATGGTGTTCCATACTGTGAGTCCGACTACCATGCCCAGT
TTGGCATTAAATGTGAGACTTGTGACCGATACATCAGTGGCAGAGTCTTGGAGGCAGGAG
GGAAGCACTACCACCCAACCTGTGCCAGGTGTGTACGCTGCCACCAGATGTTCACCGAAG
GAGAGGAAATGTACCTCACAGGTTCCGAGGTTTGGCACCCCATCTGCAAACAGGCAGCCC
GGGCAGAGAAGAAGTTAAAGCATAGACGGACATCTGAAACCTCCATCTCACCCCCTGGAT
CCAGCATTGGGTCACCCAACCGAGTCATCTGCGACATCTACGAGAACCTGGACCTCCGGC
AGAGACGGGCCTCCAGCCCGGGGTACATAGACTCCCCCACCTACAGCCGGCAGGGCATGT
CCCCCACCTTCTCCCGCTCACCTCACCACTACTACCGCTCTGGTGATTTGTCTACAGCAA
CCAAGAGCAAAACAAGTGAAGACATCAGCCAGACCTCCAAGTACAGTCCCATCTACTCGC
CAGACCCCTACTATGCTTCGGAGTCTGAGTACTGGACCTACCATGGGTCCCCCAAAGTGC
CCCGAGCCAGAAGGTTCTCGTCTGGAGGAGAGGAGGATGATTTTGACCGCAGCATGCACA
AGCTCCAAAGTGGAATTGGCCGGCTGATTCTGAAGGAAGAAATGAAGGCCCGGTCGAGCT
CCTATGCAGATCCCTGGACCCCTCCCCGGAGCTCCACCAGCAGCCGGGAAGCCCTGCACA
CAGCTGGCTATGAGATGTCCCTCAATGGCTCCCCTCGGTCGCACTACCTGGCTGACAGTG
ATCCTCTCATCTCCAAATCTGCCTCCCTGCCTGCCTACCGAAGAAATGGGCTGCACAGGA
CACCCAGCGCAGACCTCTTCCACTACGACAGCATGAACGCAGTCAACTGGGGCATGCGAG
AGTACAAGATCTACCCTTATGAACTGCTGCTGGTGACTACAAGAGGAAGAAACCGACTGC
CCAAGGATGTAGACAGGACCCGTTTAGAGGGAAACTTTTGGAAGAGTGGCTGCTTATGAG
ATTCCAAAATGAAGTGTTGGCCAACACCGCTCATGGCCATCCTGGATTTTCCCAGTGGCT
TCCCTTCCTGCTCGCCTCCCTGAACAGGGGAGAAAGCTTAACCTCTCTTCTCCTCTCCAA
ACCTTTCACCTTGAATGGGTAATGTTTGGTGGGGGCTGTTCCTTCTTGGAGAAGCCTTGA
GTCGGACCATTTTGAGATCATGGAGGAAGGATGAAGAAGTGAAAATGACAATAATGACTC
TCAAGAGGCTGGCGATGTGACATGGCAAATGTAGAACTGACTTAAATTGAACAAACCCTC
ACTGAGCACCTCTGATGTTGAGCACCTGCTGAATACTGAGCACTGAATGGGGGAGGGGGA
GGGGAGCACGGGGTGAGTCAACCTGGGACTCGGTCTCAGGGATATGCCTACCAATAGCGG
GTATCGTAAGGCATGTACCCAAACATAACGGATGTAAGGCAGAAAGTGATCGGAGAAGGA
ATGAGAAAGTGTGCGTGATGTTAATGAAAAGTCATATGCAGCTAGAGCAGACCCAGGAAA
GCTTTCTGGAAGAGATTGCATCTGAGGAAATTCAGGAAGGATCTTTGTAGATTGGGGGGA
GATTCTAAATTGAAGGGGTGATGGGGTGAGGGGCCAGAGGGAAGTCTGCTGTGTTCTCAT
GTAGGATGTCAGCCCTCCCTGCAACTTCTCTTTTTGGCCAATGTCTTTTCACTTTCCTGA
CCCTTTAGAATCATCCCCAGCCAGACGCAATCATGGAAGTTGCCTTATTGTCACTGGTTA
AGAACTTGGCGAGATTGAAGGGCTTTTGTTATTGTTGTTGGATATTTTTGTTTCCCATAA
AAGCACATCATTTCAACCCTAAAAAAAAAAAAAAAAAAAAAA
>BC016451
GAAGAATTAGATACTTTTGAGTGGGCTTTGAAGAGCTGGTCTCAGTGTTCCAAACCCTGT
GGTGGAGGTTTCCAGTACACTAAATATGGATGCCGTAGGAAAAGTGATAATAAAATGGTC
CATCGCAGCTTCTGTGAGGCCAACAAAAAGCCGAAACCTATTAGACGAATGTGCAATATT
CAAGAGTGTACACATCCACTCTGGGTAGCAGAAGAATGGGAACACTGCACCAAAACCTGT
GGAAGTTCTGGCTATCAGCTTCGCACTGTACGCTGCCTTCAGCCACTCCTTGATGGCACC
AACCGCTCTGTGCACAGCAAATACTGCATGGGTGACCGTCCCGAGAGCCGCCGGCCCTGT
AACAGAGTGCCCTGCCCTGCACAGTGGAAAACAGGACCCTGGAGTGAGTGTTCAGTGACC
TGCGGTGAAGGAACGGAGGTGAGGCAGGTCCTCTGCAGGGCTGGGGACCACTGTGATGGT
GAAAAGCCTGAGTCGGTCAGAGCCTGTCAACTGCCTCCTTGTAATGATGAACCATGTTTG
GGAGACAAGTCCATATTCTGTCAAATGGAAGTGTTGGCACGATACTGCTCCATACCAGGT
TATAACAAGTTATGTTGTGAGTCCTGCAGCAAGCGCAGTAGCACCCTGCCACCACCATAC
CTTCTAGAAGCTGCTGAAACTCATGATGATGTCATCTCTAACCCTAGTGACCTCCCTAGA
TCTCTAGTGATGCCTACATCTTTGGTTCCTTATCATTCAGAGACCCCTGCAAAGAAGATG
TCTTTGAGTAGCATCTCTTCAGTGGGAGGTCCAAATGCATATGCTGCTTTCAGGCCAAAC
AGTAAACCTGATGGTGCTAATTTACGCCAGAGGAGTGCTCAGCAAGCAGGAAGTAAGACT
GTGAGACTGGTCACCGTACCATCCTCCCCACCCACCAAGAGGGTCCACCTCAGTTCAGCT
TCACAAATGGCTGCTGCTTCCTTCTTTGCAGCCAGTGATTCAATAGGTGCTTCTTCTCAG
GCAAGAACCTCAAAGAAAGATGGAAAGATCATTGACAACAGACGTCCGACAAGATCATCC
ACCTTAGAAAGATGAGAAAGTGAACCAAAAAGGCTAGAAACCAGAGGAAAACCTGGACAA
CCTCTCTCTTCCCATGGTGCATATGCTTGTTTAAAGTGGAAATCTCTATAGATCGTCAGC
TCATTTTATCTGTAATTGGAAGAACAGAAAGTGCTGGCTCACTTTCTAGTTGCTTTCATC
CTCCTTTTGTTCTGCATTGACTCATTTACCAGAATTCATTGGAAGAAATCACCAAAGATT
ATTACAAAAGAAAAATATGTTGCTAAGATTGTGTTGGTCGCTCTCTGAAGCAGAAAAGGG
ACTGGAACCAATTGTGCATATCAGCTGACTTTTTGTTTGTTTTAGAAAAGTTACAGTAAA
AATTAAAAAGAGATACCAATGGTTTACACTTTAACAAGAAATTTTGGATATGGAACAAAG
AATTCTTAGACTTGTATTCCTATTTATCTATATTAGAAATATTGTATGAGCAAATTTGCA
GCTGTTGTGTAAATACTGTATATTGCAAAAATCAGTATTATTTTAAGAGATGTGTTCTCA
AATGATTGTTTACTATATTACATTTCTGGATGTTCTAGGTGCCTGTCGTTGAGTATTGCC
TTGTTTGACATTCTATAGGTTAATTTTCAAAGCAGAGTATTACAAAAGAGAAGTTAGAAT
TACAGCTACTGACAATATAAAGGGTTTTGTTGAATCAACAATGTGATACGTAAATTATAG
AAAAAGAAAAGAAACACAAAAGCTATAGATATACAGATATCAGCTTACCTATTGCCTTCT
ATACTTATAATTTAAAGGATTGGTGTCTTAGTACACTTGTGGTCACAGGGATCAACGAAT
AGTAAATAATGAACTCGTGCAAGACAAAACTGAAACCCTCTTTCCAGGACCTCAGTAGGC
ACCGTTGAGGTGTCCTTTGTTTTTGTGTGTGTGTGTTCTTTTTTAATTTTCGCATTGTTG
ACAGATACAAACAGTTATACTCAATGTACTGTAATAATCGCAAAGGAAAAAGTTTTGGGA
TAACTTATTTGTATGTTGGTAGCTGAGAAAAATATCATCAGTCTAGAATTGATATTTGAG
TATAGTAGAGCTTTGGGGCTTTGAAGGCAGGTTCAAGAAAGCATATGTCGATGGTTGAGA
TATTTATTTTCCATATGGTTCATGTTCAAATGTTCACAACCACAATGCATCTGACTGCAA
TAATGTGCTAATAATTTATGTCAGTAGTCACCTTGCTCACAGCAAAGCCAGAAATGCTCT
CTCCAGGGAGTAGATGTAAAGTACTTGTACATAGAATTCAGAACTGAAGATATTTATTAA
AAGTTGATTTTTTTTTCTTGATAGTATTTTTATGTACTAAATATTTACACTAATATCAAT
TACATATTTTGGTAAACTAGAGAGACATAATTAGAGATGCATGCTTTGTTCTGTGCATAG
AGACCTTTAAGCAAACTACTACAGCCAACTCAAAAGCTAAAACTGAACAAATTTGATGTT
ATGCAAACATCTTGCATTTTTAGTAGTTGATATTAAGTTGATGACTTGTTTCCCTTCAAG
GAAACATTAAATTGTATGGACTCAGCTAGCTGTTCAATGAAATTGTGAATTAGAAACATT
TTTAAAAGTTTTTGAAAGAGATAAGTGCATCATGAATTACATGTACATGAGAGGAGATAG
TGATATCAGCATAATGATTTTGAGGTCAGTACCTGAGCTGTCTAAAAATATATTATACAA
ACTAAAATGTAGATGAATTAACCTCTCAAAGCACAGAATGTGCAAGAACTTTTGCATTTT
AATCGTTGTAAACTAACAGCTTAAACTATTGACTCTATACCTCTAAAGAATTGCTGCTAC
TTTGTGCAAGAACTTTGAAGGTCAAATTAGGCAAATTCCAGATAGTAAAACAATCCCTAA
GCCTTAAGTCTTTTTTTTTTTCCTAAAAATTCCCATAGAATAAAATTCTCTCTAGTTTAC
TTGTGTGTGCATACATCTCATCCACAGGGGAAGATAAAGATGGTCACACAAACAGTTTCC
ATAAAGATGTACATATTCATTATACTTCTGACCTTTGGGCTTTCTTTTCTACTAAGCTAA
AAATTCCTTTTTATCAAAGTGTACACTACTGATGCTGTTTGTTGTACTGAGAGCACGTAC
CAATAAAAATGTTAACAAAATATAAAAAAAAAAAAAAA
>BF510316
TCCTGTGTTCTAGACCTCTGGAGGCTGCTGTGGGGACCACACTGATCCTGGAGAAAAGGG
ATGGAGCTGAAAAAGATGGAATGCTTGCAGAGCATGACCTGAGGAGGGAGGAACGTGGTC
AACTCACACCTGCCTCTTCCTGCAGCCTCACCTCTACCTGCCCCCATCATAAGGGCACTG
AGCCCTTCCCAGGCTGGATACTAAGCACAAAGCCCATAGCACTGGGCTCTGATGGCTGCT
CCACTGGGTTACAGAATCACAGCCCTCATGATCATTCTCAGTGAGGGCTCTGGATTGAGA
GGGAGGCCCTGGGAGGAGAGAAGGGGGCAGAGTCTTCCCTACCAGGTTTCTACACCCCCG
CCAGGCTGCCCATCAGGGCCCAGGGAGCCCCCAGAGGACTTTATTCGGACCAAGCAGAGC
TCACAGCTGGACAGGTGTTGTATATAGAGTGGAATCTCTTGGATGCAGCTTCAAGAATAA
ATTTTTCTTCTCTTTTCAAAAATGTATAAAAATCATTATACATAGCATTAAAGAAACATT
TTTGAGAAGTACAAAACAAAAAAAAAA
>AF301598
CGGGCGCCGCAGGAGCGAGTGAGCTGGGAGCGAGGGGCGAAGGCGCGGAGAAGCCCGGCC
GCCCGGTGGGCGGCAGAAGGCTCAGCCGAGGCGGCGGCGCCGACTCCGTTCCACTCTCGG
CCCGGATCCAGGCCTCCGGGTTCCCAGGCGCTCACCTCCCTCTGACGCACTTTAAAGAGT
CTCCCCCCTTCCACCTCAGGGCGAGTAATAGCGACCAATCATCAAGCCATTTACCAGGCT
TCGGAGGAAGCTGTTTATGTGATCCCCGCACTAATTAGGCTCATGAACTAACAAATCGTT
TGCACAACTTGTGAAGAAGCGAACACTTCCATGGATTGTCCTTGGACTTAGGGCGCCCTG
CCCGCCTTTTGCAGAGGAGAAAAAACTTTTTTTTTTTTTTGCCTCCCCCGAGAACTTTCC
CCCCTTCTCCTCCCTGCCTCTAACTCCGATCCCCCCACGCCATCTCGCCAAAAAAAAAAA
AAAAAAAAAAAAAGAAAAAAAAAGAAAAAAAAAGAAAAAAAATTACCCCAATCCACGCCT
GCAAATTCTTCTGGAAGGATTTTCCCCCCTCTCTTCAGGTTGGGCGCGTTTGGTGCAAGA
TTCTCGGGATCCTCGGCTTTGCCTCTCCCTCTCCCTCCCCCCTCCTTTCCTTTTTCCTTT
CCTTTCCTTTCTTTCTTCCTTTCCTTCCCCCCACCCCCACCCCCACCCCAAACAAACGAG
TCCCCAATTCTCGTCCGTCCTCGCCGCGGGCAGCGGGCGGCGGAGGCAGCGTGCGGCGGT
CGCCAGGAGCTGGGAGCCCAGGGCGCCCGCTCCTCGGCGCAGCATGTTCCAGCCGGCGCC
CAAGCGCTGCTTCACCATCGAGTCGCTGGTGGCCAAGGACAGTCCCCTGCCCGCCTCGCG
CTCCGAGGACCCCATCCGTCCCGCGGCACTCAGCTACGCTAACTCCAGCCCCATAAATCC
GTTCCTCAACGGCTTCCACTCGGCCGCCGCCGCCGCCGCCGGTAGGGGCGTCTACTCCAA
CCCGGACTTGGTGTTCGCCGAGGCGGTCTCGCACCCGCCCAACCCCGCCGTGCCAGTGCA
CCCGGTGCCGCCGCCGCACGCCCTGGCCGCCCACCCCCTACCCTCCTCGCACTCGCCACA
CCCCCTATTCGCCTCGCAGCAGCGGGATCCGTCCACCTTCTACCCCTGGCTCATCCACCG
CTACCGATATCTGGGTCATCGCTTCCAAGGGAACGACACTAGCCCCGAGAGTTTCCTTTT
GCACAACGCGCTGGCCCGAAAGCCCAAGCGGATCCGAACCGCCTTCTCCCCGTCCCAGCT
TCTAAGGCTGGAACACGCCTTTGAGAAGAATCACTACGTGGTGGGCGCCGAAAGGAAGCA
GCTGGCACACAGCCTCAGCCTCACGGAAACTCAGGTAAAAGTATGGTTTCAGAACCGAAG
AACAAAGTTCAAAAGGCAGAAGCTGGAGGAAGAAGGCTCAGATTCGCAACAAAAGAAAAA
AGGGACGCACCATATTAACCGGTGGAGAATCGCCACCAAGCAGGCGAGTCCGGAGGAAAT
AGACGTGACCTCAGATGATTAAAAACATAAACCTAACCCCACAGAAACGGACAACATGGA
GCAAAAGAGACAGGGAGAGGTGGAGAAGGAAAAAACCCTACAAAACAAAAACAAACCGCA
TACACGTTCACCGAGAAAGGGAGAGGGAATCGGAGGGAGCAGCGGAATGCGGCGAAGACT
CTGGACAGCGAGGGCACAGGGTCCCAAACCGAGGCCGCGCCAAGATGGCAGAGGATGGAG
GCTCCTTCATCAACAAGCGACCCTCGTCTAAAGAGGCAGCTGAGTGAGAGACACAGAGAG
AAGGAGAAAGAGGGAGGGAGAGAGAGAAAGAGAGAGAAAGAGAGAGAGAGAGAGAGAGAG
AGAAAGCTGAACGTGCACTCTGACAAGGGGAGCTGTCAATCAAACACCAAACCGGGGAGA
CAAGATGATTGGCAGGTATTCCGTTTATCACAGTCCACTTAAAAAATGATGATGATGATA
AAAACCACGACCCAACCAGGCACAGGACTTTTTTGTTTTTTGCACTTCGCTGTGTTTCCC
CCCCATCTTTAAAAATAATTAGTAATAAAAAACAAAAATTCCATATCTAGCCCCATCCCA
CACCTGTTTCAAATCCTTGAAATGCATGTAGCAGTTGTTGGGCGAATGGTGTTTAAAGAC
CGAAAATGAATTGTAATTTTCTTTTCCTTTTAAAGACAGGTTCTGTGTGCTTTTTATTTT
GATTTTTTTTCCCAAGAAATGTGCAGTCTGTAAACACTTTTTGATACCTTCTGATGTCAA
AGTGATTGTGCAAGCTAAATGAAGTAGGCTCAGCGATAGTGGTCCTCTTACAGAGAAACG
GGGAGCAGGACGACGGGGGGGCTGGGGGTGGCGGGGGAGGGTGCCCACAAAAAGAATCAG
GACTTGTACTGGGAAAAAAACCCCTAAATTAATTATATTTCTTGGACATTCCCTTTCCTA
ACATCCTGAGGCTTAAAACCCTGATGCAAACTTCTCCTTTCAGTGGTTGGAGAAATTGGC
CGAGTTCAACCATTCACTGCAATGCCTATTCCAAACTTTAAATCTATCTATTGCAAAACC
TGAAGGACTGTAGTTAGCGGGGATGATGTTAAGTGTGGCCAAGCGCACGGCGGCAAGTTT
TCAAGCACTGAGTTTCTATTCCAAGATCATAGACTTACTAAAGAGAGTGACAAATGCTTC
CTTAATGTCTTCTATACCAGAATGTAAATATTTTTGTGTTTTGTGTTAATTTGTTAGAAT
TCTAACACACTATATACTTCCAAGAAGTATGTCAATGTCAATATTTTGTCAATAAAGATT
TATCAATATGCCAAAAAAAAAAAAAAA
>Hs.77031_mRNA_1 gi|16741772|gb|BC016680.1|BC016680智人克隆MGC:21349IMAGE:4338754聚腺苷酸=3
GTGGCGGCGGAGGCGGCGGAGGCCAGGGAGGAAGATGTCGTAATGAGCGATCCACAGACC
AGCATGGCTGCCACTGCTGCTGTGAGTCCCAGTGACTACCTGCAGCCTGCCGCCTCCACC
ACCCAGGACTCCCAGCCATCTCCCTTAGCCCTGCTTGCTGCAACATGTAGCAAAATTGGC
CCTCCAGCAGTTGAAGCTGCTGTGACACCTCCTGCTCCCCCACAGCCCACACCGCGGAAA
CTTGTCCCTATCAAACCTGCCCCTCTCCCTCTCAGCCCCGGCAAGAATAGCTTTGGAATC
TTGTCCTCCAAAGGAAATATACTTCAGATTCAGGGGTCACAACTGAGCGCCTCCTATCCT
GGAGGGCAGCTGGTGTTCGCTATCCAGAATCCCACCATGATCAACAAAGGGACCCGATCA
AATGCCAATATCCAGTACCAGGCGGTCCCTCAGATTCAGGCAAGCAATTCCCAAACCATC
CAAGTACAGCCCAATCTCACCAACCAGATCCAGATCATCCCTGGCACCAACCAAGCCATC
ATCACCCCCTCACCGTCCAGTCACAAGCCTGTCCCCATCAAGCCAGCCCCCATCCAGAAG
TCGAGTACGACCACCACCCCCGTGCAGAGCGGGGCCAATGTGGTGAAGTTGACAGGTGGG
GGCGGCAATGTGACGCTCACTCTGCCCGTCAACAACCTCGTGAACGCCAGTGACACCGGG
GCCCCTACTCAGCTCCTCACTGAAAGCCCCCCAACCCCGCTGTCTAAGACTAACAAGAAA
GCAAGGAAGAAGAGCCTTCCTGCCTCCCAGCCCCCTGTGGCTGTGGCTGAGCAGGTGGAG
ACGGTGCTGATCGAGACCACCGCGGACAACATCATCCAGGCAGGAAATAACCTGCTCATT
GTTCAGAGCCCTGGTGGGGGCCAGCCAGCTGTGGTCCAGCAGGTCCAGGTGGTGCCCCCC
AAGGCCGAGCAGCAGCAGGTGGTACAGATCCCCCAGCAGGCTCTGCGGGTGGTGCAGGCG
GCATCTGCCACCCTCCCCACTGTACCCCAGAAGCCCTCCCAGAACTTTCAGATCCAGGCA
GCTGAGCCGACACCTACTCAGGTCTACATCCGCACGCCTTCCGGTGAGGTGCAGACAGTC
CTTGTCCAGGACAGCCCCCCAGCAACAGCTGCAGCCACCTCTAACACCACCTGTAGCAGC
CCTGCATCCCGTGCTCCCCATCTGAGTGGGACCAGCAAAAAGCACTCAGCTGCAATTCTC
CGAAAAGAGCGTCCCCTGCCAAAGATTGCCCCAGCCGGGAGCATCATCAGCCTGAATGCA
GCCCAGTTGGCGGCAGCTGCCCAGGCAATGCAGACCATCAACATCAATGGTGTCCAGGTC
CAGGGCGTGCCTGTCACCATCACCAACACAGGCGGGCAGCAGCAGCTGACAGTGCAGAAT
GTTTCTGGGAACAACCTGACCATCAGTGGGCTGAGCCCCACCCAGATCCAGCTGCAAATG
GAACAAGCCCTGGCCGGAGAGACCCAGCCCGGGGAGAAGCGGCGCCGCATGGCCTGCACG
TGTCCCAACTGCAAGGATGGGGAGAAGAGGTCTGGAGAGCAGGGCAAGAAGAAGCACGTG
TGCCACATCCCCGACTGTGGCAAGACGTTCCGTAAGACGTCCTTGCTGCGTGCCCATGTG
CGCCTGCACACTGGCGAGCGGCCCTTTGTCTGCAACTGGTTCTTCTGTGGGAAGAGGTTC
ACACGGAGTGACGAGCTCCAACGGCATGCTCGCACCCACACAGGGGACAAACGCTTCGAG
TGCGCCCAGTGTCAGAAGCGCTTCATGAGGAGTGACCACCTCACCAAGCATTACAAGACC
CACCTGGTCACGAAGAACTTGTAAGGCCAACTGCGGCGGGAGGCCCTGAAGATGCAGTCC
CCCACCTGTGTCCTCCCTGGGCCCCTGGTGGAAAGGAGCCCTGTGGCTGCCTTGGGCCTG
CCCTCAGCCCCACTCCTGTTCTGCAACTGTCCCCACAGGAAGGGGCTCTGTTCCCTGTAT
TGTCCTCCTTCTGAAGCCCCTTGGCTCTGCCTTGGCCCTTCCCCTCACCACGAGCTCCCG
GCCTGCCCAGACTGTGGACACTGGCCGTGCCCAATGAGACGTTCTAAACCAGGACGCGTG
GGAACCCTTATTTCCAAAGGAAAAACATGCATTTCACTCCGTCGAGGAGCAAAGTGAGCC
CCTACCCCCCACCCCGATCCCCGCTCCCAACACTGCCGGAGTCGCGTCATGCCATGCCCC
CTCTCCTGCACCTCCCTGGCCCTGCCGGCCACTGTGGACGCCCTGGGGCTTGGCACCCAC
CTCTGGAGAAACTCGGGGCCACCTCCACTCCATGTGCCCAGCCCCGCCACAACCTCTCCT
CCAGCACATTCCAGCTCTATTTAAAAAGTAAAGACACCCACCGACTCCTGATCCCCCTCT
TTTTCTATGGAGAACGTTGCCTTATACTCTCTACTTCAGATGATGAACACTGTGTACTGT
GTGTGCTTTAAAGAAGTTTTATTTAATTGCTCCCTTCTTCCTTTCCTTGTTATTCACCTC
CCTGATGCCTGCTTTCAGTTGAGGGTTGGGGGCAATGATGAGCATATGAATTTTTTCTCA
CTCTAGCAATTCCCTTTTCTAAATGACACAGCATTTAAACTCAAATCTGGATTCAGATAA
CAGCACCTGCACATCCTGCACCTCCTCCCTCTCCCTTCACCTCACCCCTGCCCGGCCCAA
GCTCTACTTGTGTACAGTGTATATTGTATAATAGACAATTGTGTCTACTACATGTTTAAA
AACACATTGCTTGTTATTTTTGAGGCTTTTAAATTAAACAAAAATCCAACTTTAAAAAAA
AAAAAAAA
>Hs.77541_mRNA_1 gi|12804364|gb|BC003043.1|BC003043智人克隆MGC:4370 IMAGE:2822973聚腺苷酸=3
CCCGCGTCGGTGCCCGCGCCCCTCCCCGGGCCCCGCCATGGGCCTCACCGTGTCCGCGCT
CTTTTCGCGGATCTTCGGGAAGAAGCAGATGCGGATTCTCATGGTTGGCTTGGATGCGGC
TGGCAAGACCACAATCCTGTACAAACTGAAGTTGGGGGAGATTGTCACCACCATCCCAAC
CATAGGCTTCAATGTAGAAACAGTGGAATATAAGAACATCTGTTTCACAGTCTGGGACGT
GGGAGGCCAGGACAAGATTCGGCCTCTGTGGCGGCACTACTTCCAGAACACTCAGGGCCT
CATCTTTGTGGTGGACAGTAATGACCGGGAGCGGGTCCAAGAATCTGCTGATGAACTCCA
GAAGATGCTGCAGGAGGACGAGCTGCGGGATGCAGTGCTGCTGGTATTTGCCAACAAGCA
GGACATGCCCAACGCCATGCCCGTGAGCGAGCTGACTGACAAGCTGGGGCTACAGCACTT
ACGCAGCCGCACGTGGTATGTCCAGGCCACCTGTGCCACCCAAGGCACAGGTCTGTACGA
TGGTCTGGACTGGCTGTCCCACGAGCTGTCAAAGCGCTAACCAGCCAGGGGCAGGCCCCT
GATGCCCGGAAGCTCCTGCGTGCATCCCCGGATGACCATACTCCCGGACTCCTCAGGCAG
TGCCCTTTCCTCCCACTTTTCCTCCCCCATAGCCACAGGCCTCTGCTCCTGCTCCTGCCT
GCATGTTCTCTCTGTTGTTGGAGCCTGGAGCCTTGCTCTCTGGGCACAGAGGGGTCCACT
CTCCTGCCTGCTGGGACCTATGGAAGGGGCTTCCTGGCCAAGGCCCCCTCTTCCAGAGGA
GGAGCAGGGATCTGGGTTTCCTTTTTTTTTTCTGTTTTGGGTGTACTCTAGGGGCCAGGT
TGGGAGGGGGAAGGTGAGGGCTTCGGGTGGTGCTATAATGTGGCACTGGATCTTGAGTAA
TAAATTTGCTGTGGTTTGAAAAAAAAAAAAAAAAAAAAA
>Hs.7001_mRNA_1 gi|6808256|emb|AL137727.1|HSM802274智人mRNA;cDNA DKFZp434M0519(来自克隆DKFZp434M0519);部分cds聚腺苷酸=3
GTGGCGGTGGCTGCGGCGACGGCAGAGGCGAAGGGAGCCGGATCGCCGACCTGAGCGGGA
GGCGGCGGTGGCGGCCATGGCGGCAGATGGAGAGCGTTCCCCGCTGCTGTCTGAGCCCAT
CGACGGTGGCGCGGGCGGCAACGGTTTAGTGGGGCCCGGCGGGAGTGGGGCTGGGCCCGG
GGGAGGCCTGACCCCCTCCGCACCACCGTACGGAGCCGGTAAACATGCCCCGCCCCAGGG
TAAGCCGGGGCGGGTCCGAGGTGCTCCCCGGGGTACTCTGAAAGCCGGGGAGGGGGCGGG
ACCGAGGGCGGAGGCGGGTCCCAGTCGCCAGGTGCGGGACTGCTGCACCTGTGACTGGGC
GAGGCTTCCTTCCCTCCGTAATCGCGACCACAGCCTAGGGACGGAAGGGGGTTCTGAGCA
ACCTGATAGAAGTGCCAATTATGAGAAGCCCTCCGAGCTTGGTCAGAGGGTTGAAGATCA
GAAGGACTTCCCTACCACCGTGGAGCATCAGTGGGGGTGTAAGTGATCCCAGCCCTTCTA
TTTGCTTCCTCTCCAGCATTTCCCCCGTTTCCCGAGGGGCATCCAGCCGTGTTGCCTGGG
GAGGACCCACCCCCCTATTCACCCTTAACTAGCCCGGACAGTGGGAGTGCCCCTATGATC
ACCTGCCGAGTCTGCCAATCTCTCATCAACGTGGAAGGCAAGATGCATCAGCATGTAGTC
AAATGTGGTGTCTGCAATGAAGCCACCGTGAGTTACACATATCTATGAAATGGGCCCTGT
TTCCTGGATCCTCTTTCTGATGTCTTGGTTCTAGACCCTGACCTTCCGGCTATTAGCCAA
GTGCTTTTGATGATACCCAGGTTTCAGTTCCAGGTGTCTCACACAGCCATTTCCCCAGAA
GCCACTCACCAAAGCTAATGTTCACTTTCTCTCACTTTTACACCTAGCCTAGTTCCTATT
TGCAAATCTCATGATATAGTCTTTCTTTTATTTCTCCTTCCTGGTTAGCACCTTATTTTT
CTGATCTCATAAAGTGTTTTTGGAGGGAAGTGGAGGGGATTGGGATTAGAGGTTTGCTTG
CTGATGACCCTATTATTCTCTAGCCAATCAAGAATGCACCCCCAGGGAAAAAATATGTTC
GATGCCCCTGTAACTGTCTCCTTATCTGCAAAGTGACATCCCAACGGATTGCATGCCCTC
GTCCCTACTGGTAAGAGGCATAAGGTGGGGAAGGGCCTAAGTGGGGAACTGGAAAGTCAA
AAAAGGATGAGCGTATACAGAGAATGTAAAGGTGAGAGAGCCTAGTGTTTATTTAGGAGA
AAAGGCTTTGAAGCATGTGCCTCAGGAATGTTATAGCTGTCTTTCTCGTTTCTCAATAAA
AATATTGAGATGAAATGATGTCGTTTCGGAGAATAGAGAGCCTTGGGGACTGGGTGTGTT
ATCCTGAGGTCGGAGGGGAATTGGGGACCTGAAGTTTAAACAGTGCTCTTTCTTTCTCAA
GGATTCTTGAGGGTATACAGTTGGGGGACAGAGTATCTTAAGTACAGAGAAGTCGAGTGA
CTTAATAGACAGGGAGTGGGGGATGTGGAACAGGGACTGTGAAGATTTTTAGGATTAAAA
ATTTTTCAAACACAAGTTTGAAAATACAAGTCTTTTTCTTTTGTATAGCAAAAGAATCAT
CAACCTGGGGCCTGTGCATCCCGGACCTCTGAGTCCAGAACCCCAACCCATGGGTGTCAG
GGTTATCTGTGGACATTGCAAGAATACTTTTCTGGTGAGGAAGGGGTATTGGGAAGGGGA
GGGGAAAGGAGACTAAGAGTCATTTCGAGTATATTTCTTAGAGTAATGGTAATGACCCCT
GAAAGGTCTGTCCTATGGGAACATGTTCTGCATCCCCACCCCAAGGTTCTCATTGAGGGA
GACCCTGCTTGTGCTATTATTTTTGTTTTCTTTCTCCATAGTGGACAGAGTTCACAGACC
GCACTTTGGCACGTTGTCCTCACTGCAGGAAAGTGTCATCTATTGGGCGCAGATACCCAC
GTAAGAGATGTATCTGCTGCTTCTTGCTTGGCTTGCTTTTGGCAGTCACTGCCACTGGCC
TTGCCGTGAGTACCCTTGCCCCAACCTCTTTCATTCTGCAGCCTCATCTCCATAGGCTAA
GATTTGGGAAACTGCTACCCTAAAAAAAAGTGGAAGAAACTTAGGGGACTAGTTTGTTTT
GTTTTAAGATATGGATGAGCTAAAGTGCAAAGTGGCTGATCAAACAGACTTTATTACTAC
TACAAGAGTGAAAAACAGCCTTCCTTTCTCTGTAGGATGAGGATAGGACAGTGAAATTCT
TAATTTAAGAGTTGCTATTTTTCAAACCTGGCTCAGTTGTCAGATATTAAGAAAAACTGA
GATACAGTGTGGGATGGGATGAGTATGTTACGCCTAAGGGAAGGAAGCTGATCAGCTCTG
CCTTTAAGAAGGTCCCTGAGGGTGGCTACATGTGGATAAGGAACAAGGACTGAAGCGTGA
GTTATTACTGTTCTTAGAACTAATAGGAGGTAGTGGAGACCAACATTAACCCCATCTTTC
TTTTCTTCTCCCTCCTTATCTTCATCAGTTTGGCACATGGAAGCATGCACGGCGATATGG
AGGCATCTATGCAGCCTGGGCATTTGTCATCCTGTTGGCTGTGCTGTGTTTGGGCCGGGC
TCTTTATTGGGCCTGTATGAAGGTCAGCCACCCTGTCCAGAACTTCTCCTGAGCCTGATG
ACCCACAGACTGTGCCTGGCCCCTCCCTGGTGGGGACAGTGACACTACGAAGGGAGCTGG
GGTAGTTAAAGGCTCCCGGGGCTTCTAGAAGGAAGCCAAGCAGCTGCCTTCCTTTTCCCT
GGGGAGAGGTAGGAAGGAACCAGGCCCTCACTTAGGTTTGGAGGGGCAGATAAGAGCACT
GCTGACCATCTGCTTTCCTCCAAGGGTTGCTGTGTCTAGGGTGAAGTAGGCAAAACGTTG
CCCTTAAAACTGGGCCCTGAAGACGGTTCCAGCCTTGTCCTTCCTGTGTGCTCCCTGAGA
GCCATTCCTGTCCCTTACACATTCCAGGGCAGGGTGGGGGTGGGTAGCCCTGGGGGTTCC
CCTCCCTCTTGTGCACCATTAGGACTTTGCTGCTGCTATTGCACTTCACCAGAGGTTGGC
TCTGGCCTCAGTACCCTCAGTCTCCTCTCCCCACATTGTGTCCTGTGGGGGTGGGGTCAG
CCGCTGCTCTGTACAGAACCACAGGAACTGATGTGTATATAACTATTTAATGTGGGATAT
GTTCCCCTATTCCTGTATTTCCCTTAATTCCTCCTCCCGACCTTTTTTACCCCCCCAGTT
GCAGTATTTAACTGGGCTGGGTAGGGTTGCTCAGTCTTTGGGGGAGGTTAGGGACTTATC
CTGTGCTTGTAAATAAATAAGGTCATGACTCTAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
>Hs.302144_mRNA_1 gi|11493400|gb|AF130047.1|AF130047智人克隆FLB3020聚腺苷酸=0
CTGTCAGCACGGGGCCTGGCATGTAATTGGTCTGCACCCACTGGTGCACTGAACTGCCAT
AACCTCAGGTTTTCTTTCTTGCTGATACCCCTGGGTCATGTTCTTTGGCAAATAACATGA
TTCATTATGAAGTAGAGTTCAGCAAAGGACAAGGATGAAAGTTGTCATTTAGAGAACTGC
CATTCAGACTTTCTTGTCTAGGTAAAGAGCAAGGTCTTCTCTCTTTTCAACTCATTTTCT
AAATTTAAACTGACGATGAGAATATGGATGATGTGTAGCTTCCTTCTCCCCCACTGATTT
TTGGTTCAGGCTCTGGGTTTTTGGCAAGAACTTACAGATCTCACTTATTATTGGCCACCC
TTCTGCTTTAAGACCTGTCAGGGCTTGTCTGAAATAAAACTGGAAGCACTTCTGATTCCA
TCCTCACTGCTTTCCTCCTTCACCGTCAGACAGCATTACTGTATAGCACTGAGTGAGGGG
CCCTGACACTGGAAGGTGGCAGGTGGGGCCTGGCCGCCAGTGAGGTATCATCATTTGTGT
GTGCTCATGTGTGCGTTGGGCTTGTTGTATCTGAGGCATGAACATTCCATATACACGGCT
TAAAGAGTTTTCTTCCCATACCGAAAGCATATATTCGGAGAGGACCCAACTTATTCAGCA
TAGCCTTGTTCCCATAGTAGCCATCCTATTCCCCCACAGCCTCTACTTTAGGAAAGCTCC
CCGTCCCCATATGAAATCCAAACCAAAAAAGATATATCACTTTCAGCTCAATTATTCCAT
AATTACAAGATATTAGGCTAGTGGGCTCTTTATTGGTTGGGTCTTATATTAATGTTATAT
GCTAGCCTTGTAATTTTGAGCTCCTCTATGGATGTTAATTTTAGTGAAACTCTATATTGA
AGAAAAGATGGGACTAAGGGGGAGACAGGAGGAGGAAAGAAAGCAGAGACAGGCAAAGAA
TCATAGCCTGAAATTCAACAGCAAGCATGGCTTATGAAGATCAAGTTATATTTTTGCTTC
ATGAATCATTGTCAGACAAATTAAGAACATATTGTTTCTTATTTATCTATTGTCAAGGAT
TCACTATCAGACACTAAGAATGAATCTTGATTTTCATAAGCTCTGTTGACACCATGGAGC
CACAGAGCATAAAACTTGCATCTAATAAAGAAAGTGCAACATGGAACAGCAGGGAGTGGA
ATACCAGCACAACTCACAGCTGCTTCCTGTTCCTCGTCCCTGTTTTCAGGAATGTTTCTT
AGCAGGAAGTTTTTTAATAGACCGAGAATTTGTTATATGTATTCTAAGAAAAGTTGTAGT
TGTAGATGCATTACTCTCCCAAATCTTAGAGATCAGGGATGATTATGTTCCATTTTTGTT
TGGTGAGTTCCCATCTTTGTATGTACCTCCTTGCTCCCGGCTGTCCTCCTCTCCTCTTCC
CTAGTGAGTGGTTAATGAGTGTTAATGCCTAAACCATACTTGTTTTATGGACACTTCTAT
AATGGATTCGTTGCATAATTTTCATGCAGTGTATAGTGTTACTAGTTGGAAATTCTTGGA
GGACTCTTAGCTGTCTGATGAAATTCCTAGTAGAAATTTTTGTTTTGAATTCCTAAAGTT
GAAATATGAAAATTATATTTTAATTTGATTC
>Hs.26510_mRNA_2 gi|11345385|gb|AF308803.1|AF308803智人染色体15遗传图15q26聚腺苷酸=3
AGTTTTTCTGGTAGAAGGCGGGGTTCTCCTCGTACGCTGCGGAGTCTCTGCGGGGTGTAG
ACCGGAATCCTGCTGACGGGCAGAGTGGATCAGGGAGGGAGGGTCGAGACACGGTGGCTG
CAGGTCTGAGACAAGGCTGCTCCGAGGTAGTAGCTCTCTTGCCTGGAGGTGGCCATTCAT
TCCTGGAGTGCTGCTGAGGAGCGAGGGCCCATCTGGGGTCTCTGGAAGTCGGTGCCCAGG
CCTGAAGGATAGCCCCCCTTGCGCTTCCCTGGGCTGCGGCCGGCCTTCTCAGAACGAAGG
GCGTCCTTCCACCCCGCGGCGCAGGTGACCGCTGCCATGGCTTTTCCCCATCGGCCGGAC
GCCCCTGAGCTGCCTGACTTCTCCATGCTGAAGAGGCTGGCTCGAGACCAGCTCATCTAT
CTGCTGGAGCAGCTTCCTGGAAAAAAGGATTTATTCATTGAGGCAGATCTCATGAGCCCT
TTGGATCGAATTGCCAATGTCTCCATCCTGAAGCAACACGAAGTAGACAAGCTATACAAG
GTGGAGAACAAGCCAGCCCTCAGCTCCAATGAACAATTGTGCTTCTTGGTCAGACCCCGC
ATCAAGAATATGCGATACATTGCCAGTCTTGTCAATGCTGACAAATTGGCTGGCCGAACT
CGCAAATACAAAGTGATCTTCAGCCCTCAAAAGTTCTATGCGTGTGAGATGGTGCTTGAG
GAAGAGGGAATCTATGGAGATGTGAGCTGTGATGAATGGGCCTTCTCTTTGCTGCCTCTT
GATGTGGATCTGCTGAGCATGGAACTACCAGAATTTTTCAGGGATTACTTTCTGGAAGGA
GATCAGCGTTGGATCAACACTGTAGCTCAGGCCTTACACCTTCTCAGCACTCTCTATGGA
CCCTTTCCAAACTGCTATGGAATTGGCAGGTGCGCCAAGATGGCATATGAATTGTGGAGG
AACCTGGAGGAGGAGGAGGATGGCGAAACCAAGGGCCGAAGGCCAGAGATTGGACATATC
TTTCTCTTGGACAGAGATGTGGACTTTGTGACAGCACTTTGCTCCCAAGTGGTTTATGAG
GGCCTAGTAGATGACACCTTCCGCATCAAGTGTGGGAGTGTCGACTTTGGCCCAGAAGTC
ACATCCTCTGACAAGAGCCTGAAGGTGCTACTCAATGCCGAGGACAAGGTGTTTAATGAG
ATTCGGAACGAGCACTTCTCCAATGTCTTTGGCTTCTTGAGCCAGAAGGCCCGGAACTTG
CAGGCCCAGTATGATCGCCGGAGAGGCATGGACATTAAGCAGATGAAGAATTTCGTGTCC
CAGGAGCTCAAGGGCCTGAAACAGGAGCACCGCCTGCTGAGTCTCCATATTGGGGCCTGT
GAATCCATCATGAAGAAGAAAACCAAGCAGGATTTCCAGGAGCTAATCAAGACTGAGCAT
GCACTGCTAGAGGGGTTCAACATCCGGGAGAGCACCAGCTACATTGAGGAACACATAGAC
CGGCAGGTGTCGCCTATAGAAAGCCTGCGCCTCATGTGCCTTTTGTCCATCACTGAGAAT
GGTTTGATCCCCAAGGATTACCGATCTCTGAAAACACAGTATCTGCAGAGCTATGGCCCT
GAGCACCTGCTAACCTTCTCCAATCTGCGAAGAGCTGGGCTCCTAACGGAGCAGGCCCCC
GGGGACACCCTCACAGCCGTGGAGAGTAAAGTGAGCAAGCTGGTGACCGACAAGGCTGCA
GGAAAGATTACTGATGCCTTCAGTTCTCTGGCCAAGAGGAGCAATTTTCGTGCCATCAGC
AAAAAGCTGAATTTGATCCCACGTGTGGACGGCGAGTATGATCTGAAAGTGCCCCGAGAC
ATGGCTTACGTCTTCAGTGGTGCTTATGTGCCCCTGAGCTGCCGAATCATTGAGCAGGTG
CTAGAGCGGCGAAGCTGGCAGGGCCTTGATGAGGTGGTACGGCTGCTCAACTGCAGTGAC
TTTGCATTCACAGATATGACTAAGGAAGACAAGGCTTCCAGTGAGTCCCTGCGCCTCATC
TTGGTGGTGTTCTTGGGTGGTTGTACATTCTCTGAGATCTCAGCCCTCCGGTTCCTGGGC
AGAGAGAAAGGCTACAGGTTCATTTTCCTGACGACAGCAGTCACAAACAGCGCTCGCCTT
ATGGAGGCCATGAGTGAGGTGAAAGCCTGATGTTTTTCCCGGCCAGTGTTGACATCTTCC
CTGAACACATTCCTCAGTGAGATGCAGGCATCTGGCACCCAGCTGCTATAACCAAGTGTC
CACCAACTACCTGCTAAGAGCCGGGAGCATGGAACGTGTTGGGATTTAGAGAACATTATC
TGAGAAAAGAGTTCACTTCCTGCTCCCAGGATATTTCTCTTTTCTGTTTATGAAGTACAA
CCCATGCTGCTAAGATGCGAGCAGGAAGAGGCATCCTTTGCTAAATCCTGTTTGAATGTC
ATTGTAAATAAAGCCTCTGCTCTCAGATGTAAAAAAAAAAAAAAAAAAAAA
>Hs.324709_mRNA_2 gi|12655026|gb|BC001361.1|BC001361智人克隆MGC:2474IMAGE:3050694聚腺苷酸=2
GGCACGAGGGGTCGCGCTGCCGCCGTTTTATTTGAAGACATCGTCCAGTTCTGACCATGG
ACTCGCAGCCATCGGCCCTTAGTTTCCATCCCCTCTAGTGGGCCTTCGGGGGCTCTACTG
ACGTCCCTCCTTCCCTTGGTACCGGGCCGGGGAAGTGTTCTCGGGCGCGGGAGGTTCCGC
ATGCCCAGGCCTGGCCAGGGGAGATGACCGATCCGTCGCTGGGGCTGACAGTCCCCATGG
CGCCGCCTCTGGCCCCGCTCCCTCCCCGGGACCCAAACGGGGCGGGATCCGAGTGGAGAA
AGCCCGGGGCCGTGAGCTTCGCCGACGTGGCCGTGTACTTCTCCCGGGAGGAGTGGGGCT
GCCTGCGGCCCGCGCAGAGGGCCCTGTACCGGGACGTGATGCGGGAGACCTACGGCCACC
TGGGCGCGCTCGGTGAGAGCCCCACCTGCTTGCCTGGGCCCTGCGCCTCCACAGGCCCTG
CCGCGCCTCTGGGAGCTGCGTGTGGAGTTGGGGGCCCCGGGGCCGGGCAGGCGGCCTCCT
CGCAGCGTGGGGTTTGCGTTCTTCTCCCCCAGGAGTCGGAGGCAGCAAGCCGGCGCTCAT
CTCCTGGGTGGAGGAGAAGGCCGAACTGTGGGATCCGGCTGCCCAGGATCCGGAGGTGGC
GAAGTGTCCGACAGAAGCGGACCCAGCAGATTCCAGAAACAAGGAAGAGGAAAGACAAAG
GGAAGGGACGGGAGCCCTGGAGAAGCCCGACCCTGTGGCCGCCGGGTCTCCTGGGCTGAA
GGCTCCCCAAGCCCCCTTTGCCGGGTTGGAGCAGCTGTCCAAGGCCCGGCGCCGGAGTCG
CCCCCGCTTTTTTGCCCACCCCCCTGTCCCCCGAGCTGACCAGCGTCACGGCTGCTACGT
GTGCGGGAAGAGCTTCGCCTGGCGCTCCACACTGGTGGAGCACATTTACAGCCACAGGGG
CGAGAAGCCCTTCCACTGCGCAGACTGCGGCAAGGGCTTCGGCCACGCTTCCTCCCTGAG
CAAACACCGGGCCATCCATCGTGGGGAGCGGCCCCACCGCTGTCCCGAGTGTGGTCGGGC
CTTCATGCGCCGCACGGCGCTGACTTCTCACCTGCGCGTTCACACTGGCGAGAAGCCCTA
CCGCTGCCCGCAGTGTGGCCGCTGCTTCGGCCTGAAGACCGGCATGGCCAAGCACCAATG
GGTCCATCGGCCCGGGGGCGAGGGGCGTAGGGGCCGGCGCCCTGGGGGGCTGTCTGTGAC
CCTGACTCCTGTCCGCGGGGACCTGGACCCGCCTGTGGGCTTCCAGCTGTATCCAGAGAT
ATTCCAGGAATGTGGGTGACGGCCTAAAAAGTGACCATCTAGACATTGTGGGCGGCCCGA
GATGGGCTCAGGGGCCCGAACCTCTGCAGCGGCCTGCAGGGAGGTCCCAGAATCCACCGC
AAGAGCTGGCCTGGGGTGCGGACAGTCTGATCTTGGGCTCTCAGCAGCCTCTTCTGCCAG
CACCTTGCTCCCCGCTGCCCTGGGCTCTCCAAGGCCCCCTTTGCTGAGGCAGGGCTGAGG
TGAGAACCCCCCAGACCTCCATACAGGGAAGCAAAAGCTGTTTCTCCTCCCAGAGATGCT
AAGAGGATTGAGGTAGAGAAGAACCTTGTTTTCTCTGTTGTCTTTTTCTTTTTACTTTTT
TAATTTTTTGAGACGGAGTTTTGCTCTTGTTGCCCAGGCTGGAGTGCAATGGTGCGATCT
CGACTCACTGCAACTTCCACCTCCTGGAGTCAAGCGATTCTCCTGCCTCAGCCACCCAAG
TAGCTGGAATTACAGGCACCTGCCACTATGCCCGGCTAACTTTTTGTATTTTTAGTAGAG
ATGGGGTTTCACCATGTTGGCTAGGCTGGTCTCGAACTCCTGCCCTCAGGTGATCCACCC
ACCTCTGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACCTCACCTGGCCTTTTCTT
TTTTATTCTTTGACCTTCCCACAAGACAATACCCATTGTCTGTTTTTTTTGTTTATTTAT
TTACTTATTAAGACAGCATCTTGCTCCTCACCCAGGCTGGAATGCAGTGGTGTGAACTGG
GCTCACTGCAGCCTAGACCTGCTGGGCTCAAGGAATCCTCCTGCCCCAGCCTCTCAGATG
GCTGTGACTACAGGTGGGCAACACTATGCCTGGTTAATTTTTAAATTTTTTTGCAGAGAT
GGGGTTCCCACTATGTTGATCAGGCTGGTCTCAAACTCCTCGGTTCAAGCAATTCGCCCA
CCTTGGCCTCCCAAAGTGCTGGGATTACAGGGGAGCCACTGCACTGGCCTTCATTGTCTT
TTTGCTGCACAACCTAAAAAACCAGTGACCCTGTATTGGAAAAAAAAAAAAAAAAAAAAA
A
>Hs.65756_mRNA_3 gi|3641494|gb|AF035154.1|AF035154智人染色体16遗传图16p13.3聚腺苷酸=3
GCCATGGCCGCCGGCCCCGCGCCGCCCCCCGGCCGCCCCCGGGCGCAGATGCCGCATCTG
AGGAAGGTGCGAGGCGGATGGAGCGGGTGGTCGTGAGCATGCAGGACCCCGACCAGGGCG
TGAAGATGCGGAGCCAGCGCCTGCTGGTCACCGTCATTCCCCACGCGGTGACAGGCAGCG
ACGTCGTGCAGTGGTTGGCCCAGAAGTTCTGCGTCTCGGAGGAGGAGGCCCTGCACCTGG
GCGCCGTCCTGGTGCAGCATGGCTACATCTACCCGCTGCGCGACCCCCGTAGCCTCATGC
TCCGGCCAGACGAGACGCCCTACAGGTTCCAGACCCCGTACTTCTGGACAAGTACCCTGA
GGCCGGCTGCAGAGCTGGACTATGCCATCTACCTGGCCAAGAAGAACATCCGAAAACGGG
GGACCCTGGTGGATTATGAGAAGGACTGCTATGACCGGCTACACAAGAAGATCAACCACG
CATGGGACCTGGTGCTGATGCAGGCGAGGGAGCAGCTGAGGGCAGCCAAGCAGCGCAGCA
AGGGGGACAGGCTGGTCATTGCGTGCCAGGAGCAGACCTACTGGCTGGTGAACAGGCCCC
CGCCCGGGGCCCCCGATGTGCTGGAGCAGGGTCCAGGGCGGGGATCCTGCGCTGCCAGCC
GTGTGCTCATGACCAAGAGTGCAGATTTCCATAAGCGGGAGATCGAGTACTTCAGGAAAG
CGCTGGGCAGGACCCGAGTGAAGTCCTCCGTCTGCCTTGAGGCGTACCTGAGTTTCTGCG
GCCAGCGTGGACCCCACGATCCCCTCGTGTCGGGGTGCCTGCCCAGCAATCCCTGGATCT
CAGACAATGACGCCTACTGGGTCATGAATGCCCCCACGGTGGCTGCCCCCACGAAGCTCC
GTGTGGAGAGATGGGGCTTCAGCTTCCGGGAGCTCCTGGAGGACCCCGTGGGGCGGGCCC
ACTTCATGGACTTTCTGGGAAAGGAGTTCAGTGGAGAAAACCTCAGCTTCTGGGAGGCAT
GTGAGGAGCTTCGATATGGAGCGCAGGCCCAGGTCCCCACCCTGGTGGATGCCGTGTACG
AGCAGTTCCTGGCCCCCGGAGCTGCCCACTGGGTCAACATCGACAGCCGGACCATGGAGC
AGACCCTGGAGGGGCTGCGCCAGCCCCACCGCTATGTCCTGGATGACGCCCAGCTGCACA
TATACATGCTCATGAAGAAGGACTCCTACCCAAGGTTCCTGAAGTCTGACATGTACAAGG
CCCTCCTGGCAGAGGCTGGGATCCCGCTGGAGATGAAGAGACGCGTGTTCCCGTTTACGT
GGAGGCCACGGCACTCGAGCCCCAGCCCTGCACTCCTTCCCACCCCTGTGGAGCCCACAG
CGGCTTGTGGCCCTGGGGGTGGAGATGGGGTGGCCTAGTGGACCTGGCCCATCTGCCACT
CTAGTCCCTGCAGCTCAACGTCCTGCGTGAATGCAGCAGCCACCCCCGTCTTGGCCCAGG
TCCTGGGGGCTGCTGAACCCAGCACCAGTGTCCCCTTGTGCCCAGGGGGCCCAGTCTTCT
GTGGGGTGCACAGCCTCCCTCCCTCCAGCAAGCCCTCCCTGCCCAGAAGGAATGGGTCCA
GGTGTGGATTCCCAGGGAGGGGGTTCATTGGCTCAGCTTGGGTCAGGGCAGAGCCTGTTA
CCTGAAGAGAGGTGAGACCAAGGCCACAGGGAGCTCCACCTTCTCTGGTCTTCAGTCCAG
CACTGGGTGCCCATCCCCATCTCTAAAACCAGTAAATCAGCCAGCGAATACCCGGAAGCA
AGATGCACAGGCGGGCGGCTTCCCACACACCCGTCACAAGACGCGGACATGCAGGTCTCG
GCGCGAGCTCTGCCCCGTCCAAGAGCCTCTCCGCTGTCGCCCAGTGTGAGCCTGGAAGAG
GACCCAAGAGAGTGCCGTGCTGAGGCTGCCTCGAGGTCACTGCCTTCCGGAGCTGCGCCT
ATTCCTCCCTCGCCAAACGCGTTCCAGAATTTGTCCACAGGTGCGCCGGCACCTGCTTTC
CCACCTCGAGGCCGCGGCCTCCCCCCCGATTTATAGACAACTCTGACATTGTCACCCCAC
TGACGAGGCCCGATTCCATAGGGTGGATCCTTGCCAGGCGTCCCTGATCCTCCCTGCCCA
AGTCTTCCTTCGTGAGCTGGCCTTGCTCCCCATCCCCCAAGTGCCTCACCAGTCCCCCAG
ACTGGGTGAAGGTACAGCTGGCTCCTTTCGGGGGTGCAGCTTCAACTCTCTCGGCGGTAG
GGCGGTGCCATCCCCACCCATAGGGCTGGCTCACATCCAGTCACTCCCAACAGCGTCCAG
CACACAAATAAAAGACCCTTGGGCCCTGGCTCTGAGAAAAAAAA
>Hs.165743_mRNA_2 gi|13543889|gb|BC006091.1|BC006091智人克隆MGC:12673IMAGE:3677524聚腺苷酸=3
AGACTGCCGAGCAGCCTTGAGCCGTTGAGCAGCTGAACAGAGGCCATGCCGGGGCACTCC
GAGGCCTGAGACGACCACGCCTGTGCCGCTGAGGACCTTCATCAGGGCTCCGTCCACTTG
GCCCGCTTGGCTGTCCAATCACACTCCAGTGTCAACCACTGGCACCCAGCAGCCAAGAGA
GGTGTGGCGTGGCCCTGGGGACGCATGGCTGAGGCAGGAACAGGTGAGCCGTCCCCCAGC
GTGGAGGGCGAACACGGGACGGAGTATGACACGCTGCCTTCCGACACAGTCTCCCTCAGT
GACTCGGACTCTGACCTCAGCTTGCCCGGTGGTGCTGAAGTGGAAGCACTGTCCCCGATG
GGGCTGCCTGGGGAGGAGGATTCAGGTCCTGATGAGCCGCCCTCACCCCCGTCAGGCCTC
CTCCCAGCCACGGTGCAGCCATTCCATCTGAGAGGCATGAGCTCCACCTTCTCCCAGCGC
AGCCGTGACATCTTTGACTGCCTGGAGGGGGCGGCCAGACGGGCTCCATCCTCTGTGGCC
CACACCAGCATGAGTGACAACGGAGGCTTCAAGCGGCCCCTAGCGCCCTCAGGCCGGTCT
CCAGTGGAAGGCCTGGGCAGGGCCCATCGGAGCCCTGCCTCACCAAGGGTGCCTCCGGTC
CCCGACTACGTGGCACACCCCGAGCGCTGGACCAAGTACAGCCTGGAAGATGTGACCGAG
GTCAGCGAGCAGAGCAATCAGGCCACCGCCCTGGCCTTCCTGGGCTCCCAGAGCCTGGCT
GCCCCCACTGACTGCGTGTCCTCCTTCAACCAGGATCCCTCCAGCTGTGGGGAGGGGAGG
GTCATCTTCACCAAACCAGTCCGAGGGGTCGAAGCCAGACACGAGAGGAAGAGGGTCCTG
GGGAAGGTGGGAGAGCCAGGCAGGGGCGGCCTTGGGAATCCTGCCACAGACAGGGGCGAG
GGCCCTGTGGAGCTGGCCCATCTGGCCGGGCCCGGGAGCCCAGAGGCTGAGGAGTGGGGC
AGCCCCCATGGAGGCCTGCAGGAGGTGGAGGCACTGTCAGGGTCTGTCCACAGTGGGTCT
GTGCCAGGTCTCCCGCCGGTGGAAACTGTTGGCTTCCATGGCAGCAGGAAGCGGAGTCGA
GACCACTTCCGGAACAAGAGCAGCAGCCCCGAGGACCCAGGTGCTGAGGTCTGAGAGGGA
GATGGCCCAGCCTGACCCCACTGGCCACTGCCATCCTGCTGCCTTCCCAGTGGGGCTGGT
CAGGGGGCAGCCTGGCCACTGCCTAGCTGGAATGGGAGGAAGCCTGCAGGTGGCACCGGT
GGCCCTGGCTGCAGTTCTGGGCAGCATCCTCCCAAGCAGAGACCTTGCTGAAGCTCCTGG
GGTGTGGGGTGTGGGCTGGAAGCACTGGCTCCCTGGTAGGGACAATAAAGGTTTTGGGTC
TTTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAC

Claims (23)

1.一种将含细胞样品分类为含有某类型组织的肿瘤细胞的方法,所述方法包括
测定获自人对象的含细胞样品中细胞的约5-49种转录序列的表达水平,其中所述样品不是冰冻组织切片,和
根据所述序列的表达水平,将样品分类为含有多种肿瘤类型中某类型组织的肿瘤细胞,
其中用于所述分类的转录序列与肿瘤类型数量之比约为1∶2-5∶2或更高。
2.一种将含细胞样品分类为含有某类型组织的肿瘤细胞的方法,所述方法包括
测定获自人对象的含细胞样品中细胞的约5-49种转录序列的表达水平,和
根据所述序列的表达水平,将样品分类为含有多种肿瘤类型中某类型组织的肿瘤细胞,
其中用于所述分类的转录序列与肿瘤类型数量之比约为1∶2-5∶2或更高,
其中a)超过50%的所述转录序列的表达与另一种所述转录序列的表达无关,或
b)所述5-49种转录序列不是根据利用已知肿瘤样品的督导学习、不是根据它们的表达与所述多种肿瘤类型之间的相关性水平、也不是根据它们的表达与所述多种肿瘤类型之间相关性中它们的排序来选择。
3.如权利要求1或2所述的方法,其特征在于,所述比值最高约为20∶1。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述比值约为3∶2-5∶2,所述肿瘤类型数量为2-38。
5.如权利要求1-4中任一项所述的方法,还包括测定基于所述比值和肿瘤类型数量以外的过多转录序列的表达水平。
6.如权利要求5所述的方法,其特征在于,利用微阵列测定所述表达水平。
7.如权利要求1-6中任一项所述的方法,其特征在于,所述分类的精确度为60%以上。
8.如权利要求1-7中任一项所述的方法,其特征在于,所述5-49种转录序列包括选自所述74种基因序列组的两种或多种序列。
9.如权利要求8所述的方法,其特征在于,所述5-49种转录序列包括选自所述74种基因序列组的5种或多种序列。
10.如权利要求1-7中任一项所述的方法,其特征在于,所述测定包括与一种或多种参比转录序列作比较进行检测。
11.如权利要求1-10中任一项所述的方法,其特征在于,所述测定包括检测所有所述转录序列或其一部分的表达。
12.如权利要求1-10中任一项所述的方法,其特征在于,所述测定包括扩增所有所述转录序列或其一部分,或者逆转录和标记对应于所述转录序列的RNA。
13.如权利要求12所述的方法,其特征在于,所述扩增包括线性RNA扩增或定量PCR。
14.如权利要求12所述的方法,其特征在于,所述扩增是扩增位于所述转录物聚腺苷酸化位点的600个核苷酸之内的序列。
15.如权利要求12所述的方法,其特征在于,所述扩增是用定量PCR扩增所述转录物的至少50个核苷酸。
16.一种包含用于检测权利要求12所述扩增产物的寡核苷酸探针的微阵列。
17.如权利要求1-10中任一项所述的方法,其特征在于,选择的所述转录序列是非冗余的。
18.如权利要求17所述的方法,还包括测定过多转录序列的表达水平,所述转录序列对于用于所述分类的转录序列而言是冗余的。
19.如权利要求1-18中任一项所述的方法,其特征在于,所述样品是人患者的临床样品。
20.如权利要求19所述的方法,其特征在于,所述样品是固定的样品。
21.如权利要求20所述的方法,其特征在于,所述样品是福尔马林固定、石蜡包埋(FFPE)的样品。
22.如权利要求1所述的方法,对所述约5-49种转录序列的表达水平进行所述检测之前还包括:
诊断需要进行所述测定的人对象;或
由人对象获得含细胞样品;或
接收含细胞样品;或
对含细胞样品进行切片;或
分离含细胞样品中的细胞;或
获得含细胞样品的细胞中的RNA。
23.如权利要求1所述的方法,对所述约5-49种转录序列的表达水平进行所述检测和对所述样品进行所述分类之后还包括:
通过表示:1)报酬已收到,或2)将由另一付款人付费,或3)尚未付费,为所述测定或分类偿付或支付处理;或
接收对所述测定或所述分类支付的费用;或
为所述测定或分类向保险公司、保健组织、联邦卫生部门或所述患者发出或已发出偿付要求;或
接收批准为所述测定或分类付费或拒绝付费的表示;或
为所述测定或分类而发出偿付要求;或
在表格上或在数据库中表明需要为所述测定或分类而支付或付费;或
在表格上或在数据库中表明执行了所述测定或分类;或
任选向医疗护理机构、卫生保健人员、医生、护士或所述患者报告所述测定或分类的结果;或者
接收所述患者为实施了所述测定或分类而支付的费用。
CNA200680026655XA 2005-06-03 2006-06-02 肿瘤和组织的鉴定 Pending CN101297045A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US68717405P 2005-06-03 2005-06-03
US60/687,174 2005-06-03

Publications (1)

Publication Number Publication Date
CN101297045A true CN101297045A (zh) 2008-10-29

Family

ID=37309082

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200680026655XA Pending CN101297045A (zh) 2005-06-03 2006-06-02 肿瘤和组织的鉴定

Country Status (10)

Country Link
US (3) US20070020655A1 (zh)
EP (2) EP2365092A1 (zh)
JP (1) JP2008545431A (zh)
KR (1) KR20080104113A (zh)
CN (1) CN101297045A (zh)
AU (1) AU2006255282A1 (zh)
CA (1) CA2610752A1 (zh)
DK (1) DK1899484T3 (zh)
ES (1) ES2550652T3 (zh)
WO (1) WO2006132971A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102203789A (zh) * 2008-10-31 2011-09-28 雅培制药有限公司 基于基因拷贝数改变的模式的恶性黑色素瘤的基因组分类
CN102696034A (zh) * 2008-10-31 2012-09-26 雅培制药有限公司 基于基因拷贝数改变的模式的非小细胞肺癌的基因组分类
CN106897581A (zh) * 2017-01-25 2017-06-27 人和未来生物科技(长沙)有限公司 一种面向基因数据解读的可重构异构平台

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030198972A1 (en) 2001-12-21 2003-10-23 Erlander Mark G. Grading of breast cancer
US9856533B2 (en) 2003-09-19 2018-01-02 Biotheranostics, Inc. Predicting breast cancer treatment outcome
WO2005118879A2 (en) * 2004-06-04 2005-12-15 Arcturus Bioscience, Inc. Identification of tumors
US20120258442A1 (en) * 2011-04-09 2012-10-11 bio Theranostics, Inc. Determining tumor origin
EP2365092A1 (en) 2005-06-03 2011-09-14 Aviaradx, Inc. Identification of tumors and tissues
US8535677B2 (en) 2006-06-06 2013-09-17 Oxford Biotherapeutics, Ltd. Antibody drug conjugate treatment of colorectal cancer
WO2009108215A1 (en) * 2007-09-06 2009-09-03 Aviaradx, Inc. Tumor grading and cancer prognosis
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
US10236078B2 (en) 2008-11-17 2019-03-19 Veracyte, Inc. Methods for processing or analyzing a sample of thyroid tissue
US9074258B2 (en) 2009-03-04 2015-07-07 Genomedx Biosciences Inc. Compositions and methods for classifying thyroid nodule disease
EA030182B1 (ru) 2009-04-20 2018-07-31 Оксфорд Байотерепьютикс Лтд. Антитела, специфические для кадгерина-17
EP2427575B1 (en) * 2009-05-07 2018-01-24 Veracyte, Inc. Methods for diagnosis of thyroid conditions
US10446272B2 (en) 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
WO2012079059A2 (en) 2010-12-09 2012-06-14 Biotheranostics, Inc. Post-treatment breast cancer prognosis
WO2013002750A2 (en) * 2011-06-29 2013-01-03 Biotheranostics, Inc. Determining tumor origin
AU2013240261A1 (en) * 2012-03-27 2014-09-18 Genentech, Inc. Diagnosis and treatments relating to HER3 inhibitors
US9158965B2 (en) * 2012-06-14 2015-10-13 The Board Of Trustees Of The Leland Stanford Junior University Method and system for optimizing accuracy-specificity trade-offs in large scale visual recognition
CA2905620A1 (en) 2013-03-15 2014-10-02 Biotheranostics, Inc. Neuroendocrine tumors
US10015806B2 (en) * 2013-11-15 2018-07-03 Sony Corporation Information processing device, information processing method and program
CN107206043A (zh) 2014-11-05 2017-09-26 维拉赛特股份有限公司 使用机器学习和高维转录数据在经支气管活检上诊断特发性肺纤维化的系统和方法
WO2017083675A1 (en) 2015-11-13 2017-05-18 Biotheranostics, Inc. Integration of tumor characteristics with breast cancer index
US11217329B1 (en) 2017-06-23 2022-01-04 Veracyte, Inc. Methods and systems for determining biological sample integrity

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5871697A (en) 1995-10-24 1999-02-16 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US20020172965A1 (en) * 1996-12-13 2002-11-21 Arcaris, Inc. Methods for measuring relative amounts of nucleic acids in a complex mixture and retrieval of specific sequences therefrom
US6285701B1 (en) 1998-08-06 2001-09-04 Lambda Physik Ag Laser resonator for improving narrow band emission of an excimer laser
AU1820100A (en) 1998-11-13 2000-06-05 Pro Duct Health, Inc. Devices and methods to identify ductal orifices during nipple aspiration
US20040241728A1 (en) * 1999-01-06 2004-12-02 Chondrogene Limited Method for the detection of lung disease related gene transcripts in blood
US6647341B1 (en) 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
CA2411601A1 (en) 2000-06-05 2001-12-13 Avalon Pharmaceuticals Cancer gene determination and therapeutic screening using signature gene sets
AU2001292802A1 (en) 2000-09-19 2002-04-02 Dana-Farber Cancer Institute Inc. Genetic markers for tumors
EP1342201A2 (en) 2000-12-07 2003-09-10 phase IT Intelligent Solutions AG Expert system for classification and prediction of genetic diseases
US6794141B2 (en) 2000-12-22 2004-09-21 Arcturus Bioscience, Inc. Nucleic acid amplification
JP4222835B2 (ja) 2001-03-14 2009-02-12 株式会社Dnaチップ研究所 癌の予測方法
EP1370696A4 (en) 2001-03-20 2009-04-22 Ortho Clinical Diagnostics Inc EXPRESSION PROFILES AND METHOD OF USE
JP2005503779A (ja) 2001-06-10 2005-02-10 アイアールエム,エルエルシー 致死性の高い癌の分子シグネチャー
CA2451074C (en) 2001-06-18 2014-02-11 Rosetta Inpharmatics, Inc. Diagnosis and prognosis of breast cancer patients
US7504222B2 (en) 2001-10-31 2009-03-17 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
WO2003041562A2 (en) * 2001-11-14 2003-05-22 Whitehead Institute For Biomedical Research Molecular cancer diagnosis using tumor gene expression signature
US20040002067A1 (en) 2001-12-21 2004-01-01 Erlander Mark G. Breast cancer progression signatures
US20030198972A1 (en) * 2001-12-21 2003-10-23 Erlander Mark G. Grading of breast cancer
EP2241636A1 (en) 2002-03-13 2010-10-20 Genomic Health, Inc. Gene expression profiling in biopsied tumor tissues
WO2004005891A2 (en) * 2002-07-10 2004-01-15 The Regents Of The University Of Michigan Expression profile of lung cancer
US20040098367A1 (en) * 2002-08-06 2004-05-20 Whitehead Institute For Biomedical Research Across platform and multiple dataset molecular classification
US7364846B2 (en) 2002-10-11 2008-04-29 Molecular Devices Corporation Gene expression profiling from FFPE samples
WO2004048938A2 (en) 2002-11-26 2004-06-10 Protein Design Labs, Inc. Methods of detecting soft tissue sarcoma, compositions and methods of screening for soft tissue sarcoma modulators
US20050143334A1 (en) * 2002-12-20 2005-06-30 David Tarin Genetic markers and methods for the diagnosis, treatment and prevention of tumor metastasis
WO2004079014A2 (en) 2003-03-04 2004-09-16 Arcturus Bioscience, Inc. Signatures of er status in breast cancer
WO2004081564A1 (en) 2003-03-14 2004-09-23 Peter Maccallum Cancer Institute Expression profiling of tumours
US20050003341A1 (en) 2003-07-01 2005-01-06 Hanan Polansky Drug discovery assays based on the biology of atherosclerosis, cancer, and alopecia
US9856533B2 (en) 2003-09-19 2018-01-02 Biotheranostics, Inc. Predicting breast cancer treatment outcome
US7504214B2 (en) 2003-09-19 2009-03-17 Biotheranostics, Inc. Predicting outcome with tamoxifen in breast cancer
EP1709152A4 (en) * 2003-12-15 2007-11-07 Univ California MOLECULAR SIGNATURE OF PTEN TUMOR SUPPRESSOR
JP2008504803A (ja) * 2004-01-09 2008-02-21 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 遺伝子発現の細胞型特異的パターン
US20050272061A1 (en) 2004-02-19 2005-12-08 Seattle Genetics, Inc. Expression profiling in non-small cell lung cancer
WO2005118879A2 (en) * 2004-06-04 2005-12-15 Arcturus Bioscience, Inc. Identification of tumors
US20120258442A1 (en) 2011-04-09 2012-10-11 bio Theranostics, Inc. Determining tumor origin
US7871774B2 (en) 2005-01-31 2011-01-18 Digital Genomics Inc. Markers for the diagnosis of lung cancer
EP2365092A1 (en) * 2005-06-03 2011-09-14 Aviaradx, Inc. Identification of tumors and tissues
WO2007137366A1 (en) 2006-05-31 2007-12-06 Telethon Institute For Child Health Research Diagnostic and prognostic indicators of cancer
WO2008116592A1 (en) 2007-03-23 2008-10-02 F. Hoffmann-La Roche Ag Apex as a marker for lung cancer
US20100273172A1 (en) 2007-03-27 2010-10-28 Rosetta Genomics Ltd. Micrornas expression signature for determination of tumors origin
CA2678919A1 (en) 2007-03-27 2008-10-02 Ranit Aharonov Gene expression signature for classification of cancers
WO2009108215A1 (en) * 2007-09-06 2009-09-03 Aviaradx, Inc. Tumor grading and cancer prognosis
US9133522B2 (en) 2007-10-31 2015-09-15 Rosetta Genomics Ltd. Compositions and methods for the diagnosis and prognosis of mesothelioma
US20110077168A1 (en) 2008-06-17 2011-03-31 Nitzan Rosenfeld Methods for distinguishing between specific types of lung cancers
GB0904957D0 (en) 2009-03-23 2009-05-06 Univ Erasmus Medical Ct Tumour gene profile
WO2013002750A2 (en) 2011-06-29 2013-01-03 Biotheranostics, Inc. Determining tumor origin

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102203789A (zh) * 2008-10-31 2011-09-28 雅培制药有限公司 基于基因拷贝数改变的模式的恶性黑色素瘤的基因组分类
CN102696034A (zh) * 2008-10-31 2012-09-26 雅培制药有限公司 基于基因拷贝数改变的模式的非小细胞肺癌的基因组分类
CN102203789B (zh) * 2008-10-31 2015-06-03 Abbvie公司 基于基因拷贝数改变的模式的恶性黑色素瘤的基因组分类
CN102696034B (zh) * 2008-10-31 2016-01-20 Abbvie公司 基于基因拷贝数改变的模式的非小细胞肺癌的基因组分类
CN106897581A (zh) * 2017-01-25 2017-06-27 人和未来生物科技(长沙)有限公司 一种面向基因数据解读的可重构异构平台

Also Published As

Publication number Publication date
EP2365092A1 (en) 2011-09-14
WO2006132971A2 (en) 2006-12-14
JP2008545431A (ja) 2008-12-18
CA2610752A1 (en) 2006-12-14
AU2006255282A1 (en) 2006-12-14
EP1899484A2 (en) 2008-03-19
WO2006132971A3 (en) 2007-03-29
ES2550652T3 (es) 2015-11-11
US20070020655A1 (en) 2007-01-25
US20170286596A1 (en) 2017-10-05
US11430544B2 (en) 2022-08-30
KR20080104113A (ko) 2008-12-01
US20230023867A1 (en) 2023-01-26
DK1899484T3 (da) 2015-11-23
WO2006132971A9 (en) 2007-05-18
EP1899484B1 (en) 2015-08-12

Similar Documents

Publication Publication Date Title
CN101297045A (zh) 肿瘤和组织的鉴定
Pertile et al. Rare autosomal trisomies, revealed by maternal plasma DNA sequencing, suggest increased risk of feto-placental disease
US10538816B2 (en) Identification of tumors
JP6684775B2 (ja) 甲状腺状態の診断のための方法および組成物
Karagiannis et al. Signatures of breast cancer metastasis at a glance
CN105378104A (zh) 用于样品分类的方法和组合物
CN103038635A (zh) 用于诊断病状的方法和组合物
Kawaguchi et al. Gene Expression Signature–Based Prognostic Risk Score in Patients with Primary Central Nervous System Lymphoma
Nicholson et al. An update on the status of molecular testing for the indeterminate thyroid nodule and risk stratification of differentiated thyroid cancer
Moldovan et al. Classification of breast carcinomas according to gene expression profiles
US20210358571A1 (en) Systems and methods for predicting pathogenic status of fusion candidates detected in next generation sequencing data
Kundel et al. Comparison of microarray analysis of fine needle aspirates and tissue specimen in thyroid nodule diagnosis
Sandinha et al. Correlation of heterogeneity for chromosome 3 copy number with cell type in choroidal melanoma of mixed-cell type
Thorner et al. Use of chromogenic in situ hybridization to identify MYCN gene copy number in neuroblastoma using routine tissue sections
Bansal et al. Integrative Analysis of Potential Biomarkers Involved in the Progression of Papillary Thyroid Cancer
Mazumder et al. Gene-expression signatures in oncology diagnostics
Jack Organisation of neoplastic haematopathology services: a UK perspective
Sáez et al. Identification of biological markers of sensitivity to high-clinical-risk-adapted therapy for patients with diffuse large B-cell lymphoma
Espinel et al. MammaPrint Feasibility in a Large Tertiary Urban Medical Center: An Initial Experience
MX2007015252A (en) Identification of tumors and tissues

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20081029