CN1969047A - 预测乳腺癌治疗结局 - Google Patents

预测乳腺癌治疗结局 Download PDF

Info

Publication number
CN1969047A
CN1969047A CNA200480033469XA CN200480033469A CN1969047A CN 1969047 A CN1969047 A CN 1969047A CN A200480033469X A CNA200480033469X A CN A200480033469XA CN 200480033469 A CN200480033469 A CN 200480033469A CN 1969047 A CN1969047 A CN 1969047A
Authority
CN
China
Prior art keywords
breast cancer
expression
sequence
gene
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200480033469XA
Other languages
English (en)
Inventor
马小骏
M·G·厄兰德
D·C·斯格罗
E·恩赖特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arcturus Engineering Inc
Biotheranostics Inc
Original Assignee
Arcturus Engineering Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arcturus Engineering Inc filed Critical Arcturus Engineering Inc
Publication of CN1969047A publication Critical patent/CN1969047A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了用于鉴定ER+乳腺癌病例表达特征的方法和组合物,所述特征与对他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗反应性或无反应相关。根据从乳腺癌独立病例采集的参照乳腺组织样品所鉴定的该特征概貌图,并提供一组可靠的分子标准可预测用他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗患乳腺癌患者的效果。还提供了在乳腺癌病例中利用多种生物标志预测对他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗反应性的其它方法和组合物。两种生物标志显示与他莫昔芬反应相关的表达增加,而另两种生物标志显示与他莫昔芬反应相关的表达降低。

Description

预测乳腺癌治疗结局
相关申请
本申请要求分别于2003年9月19日和2004年2月23日提交的美国专利申请60/504,087和60/547,199,以及分别于2003年12月2日和2004年2月6日提交的美国专利申请10/727,100和10/773,761的优先权。所有四份申请的内容被纳入本文作为参考如其完全列出那样。
发明领域
本发明涉及鉴定和使用与临床上用他莫昔芬(诺瓦得士)和其它抗乳腺癌的“抗雌激素”药物,包括其它“选择性雌激素受体调节剂”(“SERM”),“选择性雌激素受体下调剂”(“SERD”)和芳香酶抑制剂(“AI”)治疗乳腺癌相关的基因表达概貌图或模式。具体地说,本发明提供了其表达与用他莫昔芬或其它抗乳腺癌的“抗雌激素”药物治疗的女性患者存活率和乳腺癌复发相关的基因序列的鉴定。可利用这种基因表达概貌图无论是以核酸表达、蛋白表达,或是其它表达形式来选择对他莫昔芬或其它抗乳腺癌的“抗雌激素”药物治疗可能有正反应的乳腺癌患者,和选择对其它治疗无反应的患者和候选者。本发明还鉴定了数组其表达模式能有力地预测对他莫昔芬和其它抗乳腺癌的“抗雌激素”药物反应性的多个基因序列。
发明背景
乳腺癌是迄今女性中最常见的癌症。每年,在美国和全世界分别有180,000和1百万以上的妇女诊断患有乳腺癌。乳腺癌是50-55岁之间女性死亡的首要原因,且在西半球是最常见的不能预防的恶性肿瘤。目前美国约有2,167,000名妇女患有该疾病(国家癌症研究所,监督流行病学和最终结果(NCI SEER)项目(National Cancer Institute,Surveillance Epidemiology and End Results(NCI SEER)program),Cancer Statistics Review(CSR),www-seer.ims.nci.nih.gov/Publications/CSR1973(1998))。根据1995-1997的癌症发病率,国家癌症研究所(NCI)的一个报告估计美国大约每8名妇女中有1人(约12.8%)一生中将发生乳腺癌(NCI监督、流行病学和最终结果项目(SEER)出版物SEER Cancer Statistics Review 1973-1997)。乳腺癌是继皮肤癌之后,美国妇女中第二常见的癌症形式。估计2001年美国将诊断出250,100例新的乳腺癌病例。其中,预计妇女中将发生192,200例新的较晚期(侵入性)乳腺癌(比去年升高5%),妇女中将发生46,400例新的早期(原位)乳腺癌(比去年升高9%),男性中将诊断出约1,500例新的乳腺癌(Cancer Facts & Figures 2001美国癌症学会)。估计2001年大约将有40,600人死于乳腺癌(40,300妇女,400男性)。女性中,乳腺癌仅次于肺癌在癌症死亡原因中排名第二。接近86%诊断患有乳腺癌的女性可再存活5年,虽然10年后她们中的24%将死于乳腺癌,20年后接近一半(47%)将死于乳腺癌。
每位女性都有患乳腺癌的风险。70%以上的乳腺癌发生在除年龄外无其它可鉴定为危险因素的女性中(U.S.General Accounting Office.Breast Cancer,1971-1991:Prevention,Treatment和Research.GAO/PEMD-92-12;1991)。只有5-10%的乳腺癌有相关的乳腺癌家族史(Henderson IC,Breast Cancer.In:Murphy GP,Lawrence WL,Lenhard RE(编).Clinical Oncology.Atlanta,GA:American Cancer Society;1995:198-219)。
每个乳房有15-20个称为叶的区域。每叶有许多更小的小叶。小叶末端有几十个可产生乳汁的微乳球(bulb)。叶、小叶和乳球通过称为导管的细管连接。这些导管延伸至皮肤一深色区即乳晕(areola)中心的乳头处。脂肪围绕小叶和导管。乳房中没有肌肉,但每个乳房下方有肌肉覆盖肋骨。每个乳房还包含血管和淋巴管。淋巴管可将无色体液即淋巴液转运至淋巴结。发现淋巴结聚集在乳房附近(臂下)的腋部、锁骨上方和胸中。
乳腺肿瘤可为良性或恶性。良性肿瘤不是癌性的,不会扩散至身体其它部位,也不会威胁生命。通常可将它们切除,大多数病例不会复发。恶性肿瘤是癌,可侵入和破坏周围组织和器官。恶性肿瘤细胞可转移,进入血流或淋巴系统。当乳腺癌细胞转移至乳房外时,常可在臂下(腋下淋巴结)发现它们。如果癌已到达这些淋巴结,意味着癌细胞已扩散到其它淋巴结或其它器官,例如骨、肝或肺。
主要和广泛的研究集中在早期检测、治疗和预防。这包括强调确定是否存在前癌性或癌性导管上皮细胞。分析这些细胞,例如细胞形态、蛋白标记、核酸标记、染色体异常、生物化学标记和其它标志癌细胞或前癌细胞存在的特征性改变。这导致检测乳腺癌所报道的各种分子改变,其中一些是人体临床乳房样品所熟知的特征。分子改变包括存在/不存在雌激素和孕酮类固醇受体,HER-2表达/扩增产物(Mark HF等,用荧光原位杂交检测I-IV期乳腺癌HER-2/neu基因扩增产物,HER-2/neu gene amplification in stages I-IV breastcancer detected by fluorescent in situ hybridization.)Genet Med;1(3):98-1031999),Ki-67(一种存在于除G0期外细胞周期所有阶段的、用作肿瘤细胞增殖标记和预后标记的抗原(包括癌基因、肿瘤抑制基因和新血管生成标记)如p53、p27、组织蛋白酶D、pS2、多种药耐药(MDR)基因和CD31。
他莫昔芬是早期和转移性激素受体的阳性乳腺癌妇女处方中最常用的抗雌激素药物(综述参见Clarke,R.等,乳腺癌的抗雌激素耐受性及雌激素受体信号传导的作用(“Antiestrogen resistance in breast cancer and the role of estrogenreceptor signaling.”) Oncogene 22,7316-39(2003)和Jordan,C.“对晚期乳腺癌激素治疗的历史性展望(“Historical perspective on hormonal therapy of advancedbreast cancer.”) Clin.Ther.24 Suppl A,A3-16(2002))。在辅助性治疗中,他莫昔芬治疗使每年复发的风险减低了40-50%,使淋巴结阴性患者10年存活率提高了5.6%,使淋巴结阳性患者存活率相应地提高了10.9%(Group,E.B.C.T.C.Tamoxifen for early Breast Cancer.Cochrane Database Syst Rev,CD000486(2001))。认为他莫昔芬主要作用是雌激素与雌激素受体(ER)结合的竞争性抑制剂。目前,ER表达的绝对水平,以及孕酮受体(PR,功能型ER途径的一种指标)表达的绝对水平是临床治疗时他莫昔芬反应的最佳预测指标(Group,(2001)和Bardou,V.J.等“在两大乳腺癌数据库中,只用辅助性内分泌治疗时,孕酮受体状态超过的预后价值明显超过雌激素受体状态”(“Progesterone receptorstatus significantly improves outcome prediction over estrogen receptor statusalone for adjuvant endocrine therapy in two large breast cancer databases.”) J Clin Oncol 21,1973-9(2003))。
然而,25%的ER+/PR+肿瘤,66%的ER+/PR-病例和55%的ER-/PR+病例虽然机制尚不清楚但对他莫昔芬治疗无反应,或发生早期耐药。(见Clarke等;Nicholson,R.I.等“乳腺癌抗激素治疗失败的生物学”(“The biology ofantihormone failure in breast cancer.”) Breast Cancer Res Treat 80 Suppl 1,S29-34;discussion S35(2003)和Osborne,C.K.等“乳腺癌中生长因子受体与雌激素受体的交叉作用是他莫昔芬耐受的一种机制”(“Growth factor receptor cross-talkwith estrogen receptor as a mechanism for tamoxifen resistance in breastcancer”) Breast 12,362-7(2003))。目前,尚没有可靠的方法来鉴定这些无反应患者。在这些患者中,使用替代性激素治疗如芳香酶抑制剂来曲唑和阿那曲唑(Ellis,M.J.等“对于ErbB-1-和/或ErbB-2-阳性,雌激素受体阳性原发性乳腺癌来说,来曲唑是比他莫昔芬更有效的新辅助性内分泌治疗方法:得自III期随机试验的证据”(“Letrozole is more effective neoadjuvant endocrine therapy thantamoxifen for ErbB-1-and/or ErbB-2-positive,estrogen receptorpositive primarybreast cancer:evidence from a phase III randomized trial.”) J Clin Oncol 19,3808-16(2001);Buzdar,A.U.“阿那曲唑:一种新的抗晚期乳腺癌的物质”(“Anastrozole:a new addition to the armamentarium against advanced breastcancer.”) Am J Clin Oncol 21,161-6(1998);和Goss,P.E.等“在用他莫昔芬治疗早期乳腺癌5年后的绝经后妇女中,来曲唑的随机试验”(“A randomized trialof letrozole in postmenopausal women after five years of tamoxifen therapy forearly-stage breast cancer.”) N Engl J Med 349,1793-802(2003));化学治疗剂,或其它信号传递途径的抑制剂如曲妥单抗和gefitinib,可能改善临床结局。因此,若能通过鉴定不能从TAM获益而寻求其它或替代疗法治疗的患者,精确地预测他莫昔芬治疗结局应能显著提高对早期乳腺癌的处理效果。
本文引用的文献并非承认任何文献都是该领域的现有技术。迄今的所有说明或提供的文献内容是以可获得的专利申请资料为基础,不意味承认文献的日期或内容是正确的。
发明概述
本发明涉及对与乳腺癌临床相关的各个基因序列的基因表达模式(或概貌图或“特征”)的鉴定和应用。具体地说,提供了对与患者存活率和乳腺癌复发(例如乳腺癌的转移)有关的基因鉴定。可利用这种基因表达模式,无论以核酸表达、蛋白表达或是其它表达形式,来预测乳腺癌患者的存活率和乳腺癌复发包括癌症转移的可能性。
因此,本发明鉴定和使用了与具有好或差存活结局的患者有关(因而能够区分好和差存活结局)的各基因序列的基因表达模式(或概貌图或“特征”)和表达水平。在一个实施方式中,本发明提供的模式,能够将雌激素受体(α同种型)阳性(ER+)乳腺肿瘤患者区分为对他莫昔芬(TAM)或其它抗乳腺癌的“抗雌激素”药物(例如“选择性雌激素受体调节剂”(“SERM”)、“选择性雌激素受体下调剂”(“SERD”)或芳香酶抑制剂(“AI”))治疗有反应或可能有反应的患者,与对此种治疗无反应、或可能无反应的患者。在另一个实施方式中,本发明可用于治疗没有显示可检测水平的ER表达(称为“ER-”患者)、但由于存在低水平ER表达可从应用本发明获益的乳腺肿瘤患者。反应性可表现为随时间推移有较佳的存活结局。因此,这些模式可将ER+乳腺肿瘤患者区分为至少两种亚型。
第一方面,本发明提供一种鉴定对用TAM或其它抗乳腺癌的“抗雌激素”药物治疗可能有好或差存活结局的乳腺癌患者(ER+或ER-)的非主观方法,该方法是通过分析本文所述的表达模式。过去曾用主观解释来确定乳腺癌患者的预后和/或治疗,而本发明提供客观的基因表达模式,该模式可单独使用或与主观标准联用来更精确地评估用TAM或其它抗乳腺癌的“抗雌激素”药物治疗ER+或ER-乳腺癌患者的结局或期望的结局,包括存活和癌症的复发。因此,本发明表达模式提供了确定ER+或ER-乳腺癌预后的方法。而且,本发明表达模式还可用于分析其它方法不易分析的小型、淋巴结阴性肿瘤。
该基因表达模式包括一个或多个能够以有效准确度区分乳腺癌结局的基因。鉴定与ER+乳腺癌结果相关的基因序列,其表达水平与确定ER+或ER-患者的优选治疗方案有关。因此,在一个实施方式中,本发明提供一种方法,该方法通过测定含有所述患者样品的细胞所表达一种或多种与乳腺癌结局相关的本文所述的基因,以确定用TAM或其它抗乳腺癌的“抗雌激素”药物治疗该乳腺癌患者的结局。
由于多达40%的ER+患者对TAM治疗无反应,若能将基因表达与乳腺癌的结局相关联对它们是特别有利的。因此,若能可信地鉴定出这些早期无反应者就可考虑和/或应用另一种疗法(例如不同的抗乳腺癌的“抗雌激素”药物或其它抗乳腺癌治疗)来治疗这些无反应者。换句话说,若能鉴定出TAM无反应者可使医务人员在将时间花费在无效的TAM疗法之前,考虑和/或采用替代疗法治疗患者。花费在无效治疗上的时间常常使得癌进一步生长,替代疗法的成功可能使这种生长随时间推移而减小。因此,本发明还提供改善无反应者存活结局的方法,该方法是采用用本文所述方法来鉴定需用替代疗法治疗的无反应者。
本发明基因表达模式的鉴定如下所述。通常,通过登陆测定许多基因的相应mRNA表达水平,来获得样品的基因表达概貌图的大样品。然后分析该图以鉴定与用TAM或其它抗乳腺癌的“抗雌激素”药物治疗的ER+乳腺癌结局是阳性、或阴性相关的基因。然后用本发明方法鉴定与某特定结局相关的人基因亚组的表达概貌图。使用多个样品可提高(鉴定)据信与某特定存活结局相关的基因的可信性。没有足够的可信性,仍然无法预测某特定基因的表达是否真的与结局相关,也无法预测是否可成功地利用某特定基因表达来鉴定乳腺癌患者的结局。虽然可根据本文所述基因序列鉴定或使用不依赖于该鉴定的实际序列来实施本发明,但也可用表达与本文所述序列表达相关的任何其它序列来实施本发明。这些其它序列可通过本领域已知的方式,包括本文所述方法来鉴定。
可利用一种结局与另一种结局高度相关的基因概貌图来分析乳腺癌患者的样品,以预测取得该样品的患者对TAM或其它抗乳腺癌的“抗雌激素”药物的可能反应(或无反应)。这种试验可用作本方法的一部分,根据乳腺癌鉴定的结局来确定所述患者的治疗方法。
如下所述,可以有效的精确性单独使用或联合使用相关基因,以提高(该试验)使分子表达表型与乳腺癌结局精确相关的能力。这种相关性提供了利用分子确定本文所述存活结局的方法。相关基因还可用于细胞和组织的分类;诊断和/或预后的确定;以及疗法的确定和/或改变。
可通过鉴定各个相关基因的表达而不是用于测定表达实际水平的试验来提供这种鉴别能力。试验可利用如本文所述鉴定到的基因的任何可鉴定的特征,只要该试验能定量或定性地反映“转录子组”(“transcriptome”)(基因组中基因的转录片段)或“蛋白质组”(基因组中表达基因的翻译片段)中的基因表达。其它试验包括那些基于对蛋白质组相关成员的多肽片段检测的试验。可鉴定的特征包括但不限于,用于编码(DNA)或表达(RNA)的独特核酸序列、所述基因、或对所述基因编码的蛋白质或其活性具有特异性的表位。所有需要的物质是鉴别乳腺癌结局所需的基因序列,以及含有表达试验所用样品的适当细胞。
在另一个实施方式中,本发明提供鉴定基因表达模式的方法,该方法通过分析单个细胞或同源细胞群的全部、或几乎全部基因表达,所述单个细胞或同源细胞群来源于简单的活检组织,可能含有污染细胞或经过分离或纯化。因为多种基因的表达在不同患者的细胞之间以及同一患者样品的细胞之间有所波动,可利用个基因的表达和基因表达模式的多种数据作为参考数据来构建模型,进而鉴定其表达与特定乳腺癌结局最高度相关的各个基因。
在另一个实施方式中,本发明提供通过各(基因)表达模式产生的模型来检测所鉴定基因的表达的物理方法和方法学方法。这些方法涉及检测以下的一方面或多方面:构成该基因表达的DNA模板,用作中间物表达该基因的RNA,或该基因所表达的蛋白质产物。
在另一个实施方式中,可利用能够区分乳腺癌结局的模型所鉴定的基因来鉴定乳腺细胞未知样品的细胞状态。优选通过非侵入性方式分离得到该样品。可测定未知样品中所述基因的表达并将其与乳腺癌结局相关基因表达模式参考数据中所述基因的表达进行比较。任选地,与参照样品的比较可比较根据参照样品构建的模型。
本发明的一个优点是,不存在可能影响基因鉴定或后续基因表达分析来鉴定乳腺癌患者存活结局的污染性、非乳腺细胞(如浸润性淋巴细胞或其它免疫系统细胞)。当使用活检组织构建基因表达概貌图时存在这种污染。然而,如本文所述,本发明包括即使在污染细胞存在下,也可相当精确地鉴定所用的基因。
第二方面,本发明提供基于多种基因表达,或其组合的非主观方法,来鉴定对TAM或其它抗乳腺癌的“抗雌激素”药物治疗具有好或差存活结局的乳腺癌患者。这些基因是本文所述表达模式的成员,发现它们可有力地预测ER+乳腺癌TAM治疗后的临床结局。
因此,本发明提供经鉴定与对TAM的反应有关的ER+乳腺癌中差异性表达的基因序列。两种基因的序列显示在对TAM治疗有反应的ER+乳腺细胞中表达增加(而在无反应病例中表达不增加)。其它两种基因的序列显示在对TAM治疗有反应的ER+乳腺细胞中表达降低(而在无反应病例中表达不降低)。
在TAM有反应的ER+乳腺细胞中发现表达程度较高的第一组序列是白细胞介素17受体B(IL17RB)序列,基因图谱中位于人染色体3的3p21.1处。IL17RB也称为白介素17B受体(IL17BR),和其对应的的序列,因此可用于实施本发明,这是由UniGene Cluster Hs.5470.鉴定的。
在TAM有反应的ER+乳腺细胞中发现表达程度较高的第二组序列是新鉴定的胆碱脱氢酶(CHDH)的转录区序列,基因图中位于人染色体3的3p21.1处。其靠近3p14.3处钙离子通道、电压依赖性、L型、α1D亚单位(CACNA1D)的位置。本发明部分依据对公共数据库中一个错误的意外发现,将AI240933序列鉴定为对应于CACNA1D的转录区部分(在Hs.399966中)。如下所述,CHDH和CACNA1D的转录区有会聚倾向,使得转录从一个调节区向另一个调节区进行。换句话说,它们在染色体3的相同区域中从互补链会聚转录。
因此,本发明包括鉴定对于CACNA1D转录具有错误取向,但在CHDH转录中位于CHDH转录物3’末端正确取向的AI240933。不受理论束缚,而是为帮助理解本发明,认为AI240933序列是CHDH转录物3’末端的一部分。可能是CHDH3’端非翻译区(UTR)的一部分。可采用对应于CHDH的序列以及由Hs.126688鉴定的序列来实施本发明。
在TAM有反应的ER+乳腺细胞中发现表达水平较低的第一组序列是同源框B13(HOXB13)序列,基因图中位于人染色体17的17q21处。因此,对应于HOXB13的序列可用于实施本发明,由UniGene Cluster Hs.66731所鉴定。
在TAM有反应的ER+乳腺细胞中发现表达水平较低的第二组序列是喹啉酸磷酸核糖酰转移酶(QPRT,也称为烟酸-核酸焦磷酸化酶,羧基化),基因图中位于人染色体16的16p12.1处。对应于QPRT的序列可用于实施本发明,由UniGene Cluster Hs.335116.所鉴定。
虽然可根据上述鉴定的基因序列或不依赖所述鉴定而使用的实际序列来实施本发明,但也可用其表达与本文所述序列的表达相关的任何其它序列来实施本发明。这些其它序列可通过本领域已知的方法,包括本文所述方法来鉴定。
因此,可通过分析含有样品的组织或细胞中的乳腺细胞中所鉴定的序列来确定患者的ER+或ER-乳腺癌对TAM治疗、或其它抗乳腺癌的“抗雌激素”药物治疗的反应性或无反应。作为非限制性的例子,IL17BR和/或CHDH序列表达不增加和/或HOXB13和/或QPRT序列表达不降低可用作无反应病例的指标。本发明提供一种非经验性方法来确定ER+或ER-患者对TAM或其它SERM的反应性。此方法比用TAM或其它抗乳腺癌的“抗雌激素”药物治疗后″等着看″方法更优。这些序列的表达水平也可用于分析常规方法不易评估的小型、淋巴结阴性肿瘤。
表位所鉴定序列的表达水平可单独使用或与能确定对用TAM或其它抗乳腺癌的“抗雌激素”药物治疗有反应的其它序列联合使用。优选单独使用或联合使用本发明的序列,例如表达水平的比率模式与根据对应于各基因序列的表达分析相比能够改进的预测能力。本发明提供某序列过低表达水平与过度表达的序列表达水平比例,可作为反应或无反应的指标。例如,可利用HOXB13或QPRT相对于IL17BR或CHDH的比率。当然也可利用IL17BR或CHDH相对于HOXB13或QPRT的比率。
本发明提供了将分子表达表型与ER+或ER-乳腺癌患者的生理反应相关联的方法。这种相关性可用于分子诊断和/或确定乳腺癌患者治疗的方法。这些序列的其它用途是分类细胞和组织;和确定诊断和/或预后。利用这些序列来鉴定样品中的细胞对TAM或其它抗乳腺癌的“抗雌激素”药物治疗有无反应,以确定用于治疗获得样品患者中的这种细胞、以及治疗患者本身的治疗方法的选择或替代方法。
本发明方法有助于确定是否采用他莫昔芬或其它抗乳腺癌的“抗雌激素”药物作为乳腺癌发生高危患者的化学预防剂或化学保护剂。本发明方法优于Fabian等的研究( J Natl Cancer Inst.92(15):1217-27,2000),此研究提出联合应用细胞形态学和Gail风险模型来鉴定高危患者。该方法可与如Tan-Chiu等所述( J Natl Cancer Inst.95(4):302-307,2003)的乳腺癌相对风险的评估联合使用。非限制性的例子包括乳腺细胞的最小侵入性取样样品检测如随机(乳晕缘)细针抽吸物或导管灌洗样品(例如Fabian等所述的样品,任选地与良性或恶性乳腺癌乳房X光照片阳性联用或作为其补充)中本文所述基因序列的表达水平,以帮助确定是否给予抗乳腺癌的“抗雌激素”药物治疗,例如高危患者中发生的情况(如Tan-Chiu等所述)。这些试验可鉴定出采用抗乳腺癌的“抗雌激素”药物作为化学预防剂或化学保护剂可能有效的患者。考虑本发明的这种应用可获得例如给予他莫昔芬所见的有益效果(例如参见,Wickerham D.L.,Breast Cancer Res.and Treatment 75 Suppl 1:S7-12,DiscussionS33-5,2000)。本发明的其它应用包括分析晚期乳腺癌,包括转移性癌,以确定其对抗乳腺癌的“抗雌激素”药物治疗的反应性或无反应。
本发明试验可采用与本文所述序列表达水平相关的方法,只要该试验能定量或定性地反映该序列的表达。然而,优选采用定量试验方法。通过识别所鉴定序列表达水平的相关性而不是测定实际表达水平的试验形式,能够确定对TAM或其它抗乳腺癌的“抗雌激素”药物治疗的反应性和治疗效果。序列的特征鉴定包括但不限于:用于编码(DNA)或表达(RNA)的独特核酸序列,所述序列或表位编码的蛋白质的特异性或与活性。其它方法包括检测核酸扩增产物作为表达水平增加的指标,以及核酸的失活、缺失或甲基化作为表达水平降低的指标。换句话说,可通过检测以下的一方面或多方面:成所述序列表达的DNA模板、用作中间物表达该序列的RNA、或该序列所表达的蛋白质产物、以及该产物的蛋白水解片段来实施本发明。这样,检测这些DNA、RNA和蛋白质分子的存在、量、稳定性、降解(包括降解率)可用于实施本发明。
所述序列与患者样品细胞表达的序列之间的少量错配不会影响本发明的实施。存在这些错配的非限制性例子见于物种个体(例如智人)中各个患者之间序列的多态性。知道了所述序列(和由于少量错配而不同的序列)的表达与不正常或异常乳腺细胞和乳腺癌的存在相关,就足以用含有样品的适当细胞、通过分析表达来实施本发明。
在一个实施方式中,本发明通过分析含有ER+或ER-乳腺细胞的样品中所述序列的表达来鉴定表达水平。在一个优选的实施方式中,样品含有单一细胞或同源细胞群,该单个细胞或同源细胞群来源于简单的活检组织,可能含有污染细胞、或经过分离或纯化。或者,可使用组织“切片”中的未分离细胞。有多种方法可用于这种分析,包括在试验中检测样品的全部、几乎全部基因表达(如在微阵列上基因表达概貌图一部分的分析),或通过特异性检测如定量PCR(Q-PCR)或实时定量PCR。
优选通过非侵入性或最小侵入性方法分离获得样品。可检测样品中所述序列的表达,并与不正常或癌性乳腺细胞参考数据中所述序列的表达进行比较。或者,将该表达水平与正常或非癌性细胞的表达水平进行比较,优选得自相同样品或患者的细胞。在本发明采用Q-PCR的实施方式中,可将该表达水平与相同样品中的参比基因的表达水平进行比较,或可采用表达水平的比率。
在实施本发明中分离各乳腺细胞时,一个优点在于,不存在可能影响所述序列表达检测的污染性非乳腺细胞(如浸润的淋巴细胞或其它免疫系统细胞)。当利用活检组织构建基因表达概貌图时存在这种污染。然而,如本文所述,在用分离和未分离的样品分析不同基因的表达及与ER+乳腺癌结局的相关性时,由于用任何一种样品都具有显著的预测能力而提高了所述序列的可信水平。
虽然主要就人乳腺癌描述了本发明,本发明也可应用于已知可能患有乳腺癌的任何动物的乳腺癌。应用本发明优选的动物是哺乳动物,尤其是对农业应用重要的哺乳动物(例如但不限于,牛、羊、马和其它“农场动物”),乳腺癌动物模型以及智人的伴侣动物(例如但不限于狗和猫)。
本发明上述各方面和实施方式可与一种以上的抗乳腺癌的“抗雌激素”药物同时使用。在联合使用药物的情况下,可利用一种以上的SERM、SERD或AI来代替TAM或其它抗乳腺癌的“抗雌激素”药物。芳香酶是一种在机体组织,包括乳房、肝、肌肉和脂肪中提供雌激素主要来源的酶。不受理论的束缚,只是为了帮助更好地理解本发明,认为AI以相当于TAM和其它抗乳腺癌的“抗雌激素”药物的方式起作用,即作为乳腺组织中雌激素受体的拮抗剂而抗乳腺癌。AI可以是非类固醇或类固醇药物。上述通过血红素辅基抑制芳香酶的AI药物的例子包括但不限于:阿那曲唑(瑞宁得)、来曲唑(弗隆)和伏氯唑(rivisor),已用于或考虑用于治疗转移性乳腺癌。能灭活芳香酶的类固醇AI的例子包括但不限于:依西美坦(aromasin)、雄甾烯二酮和福美坦(兰他隆)。
降低雌激素水平治疗的其它形式包括手术或化学方法卵巢摘除。前者是物理摘除卵巢,而后者使用阻断卵巢产生雌激素的试剂。后者的一个非限制性的例子是促性腺激素释放激素(GnRH)的激动剂如戈舍瑞林(诺雷德)。当然,也可用这些疗法代替一种或多种抗乳腺癌的“抗雌激素”药物治疗来实施本发明。
本文所述本发明的内容部分依据了对单用他莫昔芬辅助性治疗的60位患者的激素受体阳性侵入性乳腺肿瘤(样品)的广泛基因组微阵列的分析,鉴定到可高度预测临床结局的两种基因表达比率。该表达比率适合于标准石蜡包埋的临床样品的PCR分析,该比例在一组独立的20位患者中得到验证,如下所述。
附图简要说明
图1显示IL17BR,HOXB13和CACNA1D表达水平的受试者工作特性(ROC)分析,在全部组织切片(上方3图)和激光显微解剖分离的细胞(下方3图)中预测乳腺癌结果。AUC表示曲线下面积。
图2包含六部分,涉及HOXB13表达与IL17BR表达比例的验证,作为对TAM有反应或无反应的指标。部分a和b显示在反应者和无反应者样品用Q-PCR得到的HOXB13和IL17BR序列的基因表达分析结果。反应者和无反应者训练(training)和验证数据组绘制的图显示在部分c和d中,两图中“0”表示反应者的数据点,“1”表示无反应者的数据点。部分e和f显示反应者和无反应者训练和验证数据组为存活率的函数所绘制的图,其中每个部分中上方的线代表反应者,下方的线代表无反应者。
图3显示已知的CHDH基因序列3’区以及本发明所鉴定的其它CHDH 3’非未翻译序列的示意图。
图4显示PCR扩增反应结果,其中扩增子与从图1所示预想的扩增子相一致。使用以下PCR引物:向前CHDH引物:5′-AAAGTCTTGGGAAATGAGACAAGT-3’;反向引物83R:5′-AGCTGTCATTTGCCAGTGAGA-3′和81R:5′-CTGTCATTTGCCAGTGAGAGC-3′。
图5显示28个序列的排列对比,以鉴定含CHDH 3’端区的毗连群。排列对比包括序列AI240933,其包括装配的共有序列的3’端。
图6显示包含新的CHDH 3’端的装配的毗连群序列。
图7显示人染色体3的一部分区域,其中,由“Hs.399966”鉴定的CACNA1D位置,由“Hs.126688”鉴定的CHDH位置。
图8,部分A包括六部分,涉及QPRT表达与CHDH表达比率的验证,作为对TAM反应或无反应的指标。由“QPRT:CHDH AI240933”鉴定的三个部分反映了用探针测定GenBank AI240933序列表达的比率。由“QPRT:CHDHAJ272267”鉴定的三个部分反映了用探针测定GenBank AJ272267序列表达的比率,鉴定为CHDH的部分mRNA的比率。部分B包括HOXB13表达与IL17BR表达比率的类似应用,作为TAM反应性的指标。显示了反应者(“R”)和无反应者(“NR”)数据组绘制的图。P值为两样品t-检验。
发明详述
本发明所用术语的定义:
基因表达“模式”或“概貌图”或“特征”指与对TAM或其它抗乳腺癌的“抗雌激素”药物治疗ER+乳腺癌反应性相关的基因的相对表达。反应或无反应可表示为与能够区分它们并预测所述结局的表达“模式”或“概貌图”或“特征”相关的存活结局。
“选择性雌激素受体调节剂”或SERM是一种“抗雌激素”药物,在某些组织中起着类似雌激素的作用(激动剂)但在其它组织中能阻断雌激素作用(拮抗剂)。“选择性雌激素受体下调剂”(或“SERD”)或“纯”抗雌激素剂包括在所有组织中能阻断雌激素活性的试剂。见Howell等(Best Bractice & Res.Clin.Endocrinol.Metab.18(1):47-66,2004)。本发明优选的SERM是那些在乳腺组织和细胞中雌激素的拮抗剂,包括乳腺癌拮抗剂。非限制性的例子包括TAM、雷洛昔芬、GW5638和ICI 182,780。已有关于各种SERM的可能作用机制的综述(例如参见Jordan等,2003,Breast Cancer Res.5:281-283;Hall等,2001,J.Biol.Chem.276(40):36869-36872;Dutertre等2000,J.Pharmacol.Exp.Therap.295(2):431-437;和Wijayaratne等,1999,Endocrinology 140(12):5828-5840)。本发明内容中其它SERM非限制性的例子包括三苯乙烯类,例如他莫昔芬、GW5638、TAT-59、氯米芬、托瑞米芬、屈洛昔芬和艾多昔芬;苯并噻吩,例如阿佐昔芬(LY353381或LY353381-HCl);苯并吡喃,例如EM-800;萘,例如CP-336,156;及ERA-923。
SERD或“纯”抗雌激素剂的非限制性例子包括诸如ICI 182,780(氟维司群或faslodex)等的制剂、或口服类似物SR16243和ZK 191703、以及芳香酶抑制剂和本文所述化学性卵巢摘除试剂。
本文所述SERM涵盖的其它试剂包括孕酮受体抑制剂及相关药物,例如,模拟孕酮制剂如乙酸甲羟孕酮、甲地孕酮和RU-486;和肽基ER作用抑制剂,例如LH-RH类似物(醋酸亮丙瑞林、戈舍瑞林、[D-Trp6]LH-RH)、促生长素抑制素类似物和ER的LXXLL基序模拟物以及替勃龙和白藜芦醇。如本文所述,本发明优选的SERM是乳腺组织和细胞中的雌激素拮抗剂,包括乳腺癌的拮抗剂。优选的SERM非限制性的例子包括任何SERM的实际或设想的代谢物(体内),例如但不限于,4-羟基他莫昔芬(他莫昔芬的代谢物)、EM652(或SCH57068,其中EM-800是EM-652的前药)和GW7604(GW5638的代谢物)。见Willson等(1997,Endocrinology 138(9):3901-3911)和Dauvois等(1992,Proc.Nat’l.Acad.Sci.,USA 89:4037-4041),描述了某些特异性SERM。
其它优选的SERM是那些可产生与他莫昔芬或4-羟基他莫昔芬相同的相关基因表达概貌图的制剂。Levenson等提供了一种鉴定这类SERM的方法(2002,Cancer Res.62:4419-4426)。
“基因”是编码一种产物无论性质是RNA或是蛋白质的多核苷酸。应理解一个以上的多核苷酸可能编码一种产物。该术语包括编码相同产物的等位基因和基因多态性,或其功能相关(包括功能的获得、缺失或调节)类似物,根据正常有丝分裂期间染色体的位置和能否重组而定。
术语“序列”或“基因序列”在这里是指由一系列核苷酸碱基构成的核酸分子或多核苷酸。该术语包括编码一种产物的一系列碱基(即“编码区),无论性质是RNA或蛋白质,以及“编码区”之前或之后的一系列碱基。后者的非限制性例子包括5’和3’基因非翻译区。应理解多种多核苷酸可编码同一个产物。还应理解,所述序列可存在等位基因和多态性,用于实施本发明来鉴定所述序列或等位基因或多态性的表达水平。等位基因或多态性的鉴定部分依赖于染色体位置和有丝分裂期间的能否重组。
术语“相关”或“相关性”或其等价形式指与无反应相比,一种或多种基因的表达与乳腺癌细胞和/或乳腺癌患者生理反应之间的关系。这些基因表达水平可高可低,但仍与反应性、无反应或乳腺癌存活或结局相关。例如,本发明提供了IL17BR和/或CHDH序列表达增加与ER+乳腺细胞对TAM或其它抗乳腺癌的“抗雌激素”药物的反应性之间的相关性。这种增加是反应性的指标。相反,表达水平不增加,包括表达水平无变化则表示无反应。类似地,例如,本发明提供了HOXB13和/或QPRT序列表达降低与ER+乳腺细胞对TAM或其它SERM反应性之间的相关性。这种降低是反应性的指标,而表达水平不降低,包括表达水平无变化表示无反应。
增加或降低不难以不正常细胞和正常细胞表达之间的比率形式表示,因此该比率为(1)时表示无差异而比率为(2)和一半时表示不正常细胞的表达为正常细胞表达的2倍和一半。表达水平不难通过下述定量方法测定。
例如,基因表达的增加可表示为比率约1.1,或约1.2、或约1.3、或约1.4、或约1.5、或约1.6、或约1.7、或约1.8、或约1.9、或约2、或约2.5、或约3、或约3.5、或约4、或约4.5、或约5、或约5.5、或约6、或约6.5、或约7、或约7.5、或约8、或约8.5、或约9、或约9.5、或约10、或约15、或约20、或约30、或约40、或约50、或约60、或约70、或约80、或约90、或约100、或约150、或约200、或约300、或约400、或约500、或约600、或约700、或约800、或约900或约1000。比率为2表示表达增加100%(或2倍)。基因表达降低可表示为比率约0.9、或约0.8、或约0.7、或约0.6、或约0.5、或约0.4、或约0.3、或约0.2、或约0.1、或约0.05、或约0.01、或约0.005、或约0.001、或约0.0005、或约0.0001、或约0.00005、或约0.00001、或约0.000005或约0.000001。
对于某给定表型,也可利用与该表型相关的基因序列的表达水平增加和与该表型相关的基因序列的表达水平降低之间的比率作为该表型的指标。作为非限制性的例子,对乳腺癌的他莫昔芬治疗无反应的表型与HOXB13和/或QPRT表达增加以及IL17BR和/或CHDH表达降低有关。因此,HOXB13或QPRT与IL17BR或CHDH表达水平之间的比率可用作无反应的指标。
“多核苷酸”是任何长度的核苷酸或核糖核苷酸或脱氧核糖核苷酸的聚合形式。此术语仅指分子的一级结构。因此,此术语包括双链和单链DNA和RNA,也包括已知类型的修饰,包括本领域已知的标记、甲基化、“加帽”、用类似物取代一个或多个天然产生的核苷酸和核苷酸间的修饰如该多核苷酸的不带电的连接键(例如硫代磷酸酯键、二硫代磷酸酯键等)以及非修饰形式。
术语“扩增”广义用于指用DNA或RNA聚合酶酶促产生的扩增产物。如本文所用,“扩增”一般指产生多个拷贝的所需序列特别是样品的序列的过程。“多拷贝”指至少2个拷贝。“拷贝”不一定指与模板序列互补或相同的完全序列。扩增mRNA的方法通常是本领域已知的,包括逆转录PCR(RT-PCR)和美国专利申请10/062,857(2001年10月25日提交)以及美国临时专利申请60/298,847(2001年6月15日提交)和60/257,801(2000年12月22日提交)中所述的方法,上述所有专利申请的全部内容被纳入本文作为参考。另一种可使用的方法是定量PCR(或Q-PCR)。或者,RNA可通过本领域已知方法直接标记为对应的cDNA。
“相应的”指一个核酸分子与另一个核酸分子共有相当数量的序列相同性。相当数量指至少95%,通常至少98%更常至少99%的序列相同可用BLAST算法测定,如Altschul等(1990),J.Mol.Biol.215:403-410所述(用发表的默认设置,即参数w=4,t=17)。
“微阵列”是优选不连续区域组成的线性或二维或三维(和固相)阵列,各自具有在固相支持物表面形成的限定区域,所述固相支持物包括但不限于玻璃、塑料或合成膜。一个固相支持物表面上可用于检测的固定的多核苷酸总数,确定了微阵列上不连续区域的密度,优选至少约50/cm2,更优选至少约100/cm2,甚至更加优选至少约500/cm2或至少约1,000/cm2。优选该阵列至少含有总共不到约500个、约1000个、约1500个、约2000个、约2500上或约3000个固定的多核苷酸。如本文所用,DNA微阵列是安置在芯片或其它表面上的寡核苷酸或多核苷酸的阵列,用于杂交样品中扩增的或克隆的多核苷酸。由于各特定探针组在阵列中的位置是已知的,故样品多核苷酸的鉴定可根据它们与微阵列中特定位置的结合而确定。作为使用微阵列的可选方案,实施本发明中可使用任何尺寸的阵列,包括在固相中将一个或多个位置安排成二维或三维排列以检测单个基因序列的表达。
由于本发明依赖于对过量或过低表达基因的鉴定,本发明的一个实施方案涉及通过使样品细胞中的mRNA或其扩增或克隆产物与特定基因序列的独特多核苷酸的杂交来测定(所述基因的)表达。此类型的优选多核苷酸包含在其它基因序列中未发现的基因序列的至少约16个、约18个、约20个、约22个、约24个、约26个、约28个、约30个或约32个连续碱基对。如前面句子所用的术语“约”指比所述数值多1或少1。甚至更优选多核苷酸包含在其它基因序列中未发现的基因序列至少或约50个、至少或约100个、至少或约150个、至少或约200个、至少或约250个、至少或约300个、至少或约350个、至少或约400个、至少或约450个或至少或约500个连续碱基对。前面句子所用的术语“约”指比所述数值多或少10%。更长的多核苷酸当然可包含不影响与样品中核酸杂交的小量错配(例如通过存在的突变)。这种多核苷酸还指能够与本文所述的基因序列或其独特部分杂交的多核苷酸探针。可标记这种多核苷酸以协助其检测。优选地,序列是基因编码的mRNA的序列,这种mRNA序列对应的cDNA和/或这种序列的扩增形式。在本发明优选的实施方式中,可将多核苷酸探针固定在可定位该探针的阵列、其它固相支持装置或各个点中。
在本发明的另一个实施方案中,可扩增和检测所有或部分的所述序列,方法是例如聚合酶链式反应(PCR)和其变体,例如但不限于:定量PCR(QPCR)、逆转录PCR(RT-PCR)和实时PCR(包括测定样品中各个序列mRNA拷贝的初始量)的方法。任选实时RT-PCR或实时Q-PCR。这些方法采用与所述序列的一部分互补的1种或2种引物,利用引物引发核酸合成。任选地标记新合成的核酸,并可直接检测或通过与本发明的多核苷酸杂交来检测。可使新合成的核酸在允许它们杂交的条件下接触本发明的多核苷酸(包括序列)。其它检测需表达的核酸表达的方法包括RNA酶保护试验,包括液相杂交、和细胞原位杂交。
或者,在本发明又一个实施方式中,对患者的所述细胞样品或体液,可利用能对各基因产物(蛋白质)或其蛋白水解片段的一个或多个表位的一种或多种特异性抗体,分析细胞样品中感兴趣蛋白质的表达,来检测基因表达。细胞样品可以是患者血液中的乳腺癌上皮细胞,例如可采用抗细胞表面标志的标记抗体再用荧光激活细胞分选术(FACS)来富集。优选标记该抗体,使其结合该基因产物后易于检测。适用于实施本发明的检测方法包括但不限于:对含细胞的样品或组织进行免疫组织化学分析、酶联免疫吸附试验(ELISA)包括对含有细胞的组织或血液样品进行抗体夹心法试验、质谱分析和免疫-PCR。
术语“标记物”指能产生可检测信号表明标记分子存在的一种成分。适当的标记物包括:放射性同位素、核苷酸生色团、酶、底物、荧光分子、化学发光分子、磁性粒子、生物发光分子等。因此,标记物是可用光谱、光化学、生化、免疫化学、电学、光学或化学方法检测的任何成分。
术语“支持物”指常规支持物,例如小珠、颗粒、浸渍片、纤维、滤膜、薄膜和甲硅烷或硅酸盐支持物如载玻片。
如本文所用,“乳腺组织样品”或“乳腺细胞样品”指从怀疑患有,或可能患乳腺癌的个体分离得到的乳腺组织或体液样品。这些样品是原始分离物(与培养的细胞相反),可通过任何非侵入性或最小侵入性方法来收集,包括但不限于,导管灌洗、细针吸取、针吸组织活检、美国专利6,328,709中所述的装置和方法,或任何其它本领域已知合适的方法。或者,“样品”可通过侵入性方法收集,包括但不限于手术组织活检。
“表达”和“基因表达”包括核酸物质的转录和/或翻译。
如本文所用,术语“包括”和其同源词以它们所含的意义使用,即等同于术语“包含”和其对应的同源词。
“允许”某事件发生的条件,或“适合”某事件如杂交、链延伸等发生的条件,或“适当”的条件是不阻止这类事件发生的条件。因此,这些条件可允许、提高、促进和/或有助于该事件的发生。本领域已知的和本文所述的这种条件取决于,例如核苷酸序列的性质、温度和缓冲液条件。这些条件也取决于需要何种事件,如杂交、切割、链延长或转录。
如本文所用,序列“突变”指本文所述感兴趣基因序列与参比序列相比较的任何序列变化。序列突变包括由于例如取代、缺失或插入等机制所致的单个核苷酸的变化或序列中一个以上核苷酸的改变。单核苷酸多态性(SNP)也是本文所用的一种序列突变。由于本发明根据的是基因表达的相对水平,因此在实施本发明中也可测定本文所述基因非编码区中的突变。
“检测”包括任何检测方法,包括直接和间接检测基因表达和其变化。例如,可以直接或间接观察“可检测到较少”的产物,该术语表示任何减少(包括缺乏可检测信号)。类似地,“可检测到更多”产物指任何增加,无论是直接或是间接观察到的。
基于经过正常细胞表达的百分比或倍数,所述序列表达的增加或降低表示为以下形式。增加可以是高于正常细胞表达水平的10、20、30、40、50、60、70、80、90、100、120、140、160、180或200%。或者,倍数增加可以是高于正常细胞表达水平的1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10倍。降低可以是低于正常细胞表达水平的10、20、30、40、50、55、60、65、70、75、80、82、84、86、88、90、92、94、96、98、99或100%。
除非另有说明,本文所用的所有技术和科学术语具有与本领域所属领域普通技术人员通常所理解的相同意义。
具体实施方式
第一方面,本发明涉及能区分(或关联)用他莫昔芬(TAM)或其它抗乳腺癌的“抗雌激素”药物治疗的乳腺癌患者存活的基因表达模式(或概貌图或“特征”)的鉴定和应用。本发明方法采用了许多对照细胞或组织样品,如乳腺癌病理学领域普通技术人员所知道的那些细胞和组织是乳腺癌细胞而非正常细胞或其它非癌性细胞来鉴定这种表达模式。可将患者的结局与表达数据相关联,来鉴定与用TAM或其它抗乳腺癌的“抗雌激素”药物治疗后的结局相关的表达模式。因为人与人、癌与癌、癌细胞与癌细胞之间总的基因表达概貌图不同,如本文所述可将某些细胞与表达的或低表达的基因之间相关联,来鉴定能够区分乳腺癌结局的基因。
可利用据信或可能对乳腺癌的结局、尤其是ER+乳腺癌的结局有关的差异性表达的任何数目的基因来实施本发明。可通过显微解剖分离,例如但不限于激光俘获显微解剖分离(LCM)100-1000个细胞,利用各种同源乳腺癌细胞群的表达概貌图,进行这种鉴定。可将表达概貌图中每个基因的表达与某特定结局相关联。或者,集合多个基因的表达水平来鉴定与特定结局的相关性。
可利用与他莫昔芬治疗乳腺癌患者的存活具有明显相关性的基因来构建基因表达模型,最大程度地区分对他莫昔芬或其它抗乳腺癌的“抗雌激素”药物有反应的患者结局与该治疗结局不成功的患者。或者,可联合利用具有明显相关性的基因与具有较差相关性的但不明显丧失区分结局能力的基因。这种模型可用本领域已知的任何合适的方法构建,包括但不限于:集合分析、支持的向量机制、神经网络或本领域已知的其它算法。该模型能够根据用于区分的基因表达来预测未知样品的分类。可利用“Leave one out”交叉验证检验各种模型的性能,帮助鉴定不能预测或对该模型预测能力有害的权重(基因)。交叉验证还可用于鉴定可提高该模型预测能力的基因。
通过上述模型鉴定到与他莫昔芬治疗的特定乳腺癌结局相关的基因后,就能将基因表达分析只集中在对那些能提高鉴定能力的基因的分析,当患者可能具有不同于其它的特定结局时。乳腺癌细胞中其它基因的表达相对不能提供相关信息,因而有助于乳腺癌结局的鉴别。
如本领域技术人员将理解的那样,即使只有一小组参比基因的表达数据,该模型也非常有用,并且,随着包含更多的对照数据,该模型变得更加精确,虽然精确性的增幅可能随着各个数据的加入而减小。用他莫昔芬或其它抗乳腺癌的“抗雌激素”药物治疗后,利用本发明所述和鉴定的基因鉴别乳腺癌的不同结局来得到其它对照基因表达数据是常规方法,本领域技术人员不难进行,来产生上述模型根据这些基因的表达水平预测未知样品的状态。
为在本发明实施过程中测定这些基因的表达水平(增加或降低),可采用任何本领域已知方法。在本发明一个优选的实施方式中,利用测定与本文鉴定和描述的基因杂交的RNA的表达。这不难通过本领域已知或认为是等价形式的RNA检测或扩增+检测方法进行,例如但不限于逆转录-PCR、美国专利6,794,141所述方法和检测RNA稳定或不稳定序列的存在或不存在的方法。
或者,可利用对DNA表达状态的检测。检测甲基化或缺失的本文所鉴定基因的DNA,用作与特定乳腺癌结局相关表达降低的基因。这不难通过本领域已知的PCR方法包括但不限于Q-PCR进行。相反,检测扩增的本文所鉴定基因的DNA,用作与特定乳腺癌结局相关表达增加的基因。这不难通过本领域已知的PCR、荧光原位杂交(FISH)和染色体原位杂交(CISH)进行。
也可利用对蛋白质水平或活性的存在、增加或降低的检测来检测表达。检测可通过本领域已知并认为是适合检测蛋白质的免疫组织化学(IHC)、血液(尤其是对分泌蛋白)、抗体(包括抗蛋白质的自身抗体)、脱落细胞(来自癌)、质谱和成形(包括使用标记的配体)等方法来检测。当癌细胞来源未知时,抗体和成形方法还适合于用非侵入性方法(例如导管灌洗或细针抽吸)获得的细胞确定癌症之后给肿瘤定位。可利用标记的抗体或配基定位患者体内肿瘤或帮助从体液中富集脱落的癌细胞。
利用核酸试验来测定表达的优选实施方式是将一个或多个本文鉴定的基因序列固定在固体支持物上,包括但不限于,诸如本领域已知的阵列、或小珠技术的固相底物。或者,也可采用本领域已知的溶液表达试验。固定的基因可以是这些基因的独特或特异性多核苷酸形式,从而该使得多核苷酸能够与这些基因对应的DNA或RNA杂交。这些多核苷酸可以是全长的基因或是基因的短序列(通过缺该序列的5’或3’端而比本领域已知的全长序列短至多一个核苷酸),任选被间断最小(例如错配或插入了不互补的碱基对)而不影响与该基因对应的DNA或RNA杂交。所用多核苷酸宜从该基因的3’端开始,例如从基因或表达序列的聚腺苷酸信号或聚腺苷酸化位点开始长约350、约300、约250、约200、约150、约100或约50个核苷酸。也可使用相对于本文所述基因序列含有突变的多核苷酸,只要该突变的存在仍然能够实现杂交产生可检测的信号。
可利用固定的基因、或与其互补的序列来检测从乳腺细胞样品制备的核酸样品的状态,以预测未知样品患者(例如,获取样品的患者)的结局,或证实样品患者已预测的结局。并非限制本发明,这些细胞可得自ER+或ER-乳腺癌患者。
固定的多核苷酸只要在适当条件下就能充分与得自样品的相应核酸分子特异性杂交。虽然即使是一个相关基因序列就可提供足够的准确度来区分两种乳腺癌结局,但两个或以上、三个或以上、四个或以上、五个或以上、六个或以上、七个或以上、八个或以上、九个或以上、十个或以上、十一个或以上或任何整数的本文鉴定的基因作为能区分的亚组,联合使用可增加该方法的准确度。本发明特别考虑选择一个以上、两个或以上、三个或以上、四个或以上、五个或以上、六个或以上、七个或以上、八个或以上、九个或以上、十个或以上、十一个或以上或任何整数本文表和图中公开的基因用作亚组来鉴定乳腺癌的存活结局。
当然可使用1个或以上、2个或以上、3个或以上、4个或以上、5个或以上、6个或以上、7个或以上、8个或以上、9个或以上、任何整数的或所有的以下表2、3和/或XXX提供的基因。本文各表中以及本发明中使用的“登录号”指每个基因序列的GenBank登录号,这些序列的内容被纳入本文作为参考,如可在本发明申请日从GenBank获得此登录号。P值表示指定值,如以下实施例中所述。“E-xx”(其中,“xx”表示两个数字)表示指数数字的可选符号(其中,“E-xx”是“10-xx”)。因此,与“E-xx”的左侧数字组合,该值表示左侧数字乘以10-xx。表中所用的“描述”提供序列/基因编码的简要标识符。
优选用p值约0.02或以下、约0.01或以下、约0.005或以下、约0.001或以下所鉴定的相关性基因来实施本发明。本发明包括采用能鉴定TAM或其它抗乳腺癌的“抗雌激素”药物治疗后不同乳腺癌结局的基因表达,并能根据所述患者乳腺癌样品的测试同时鉴定乳腺癌患者的存活结局。
第二方面,也作为利用本文所述基因亚组的实施方式,本发明涉及多个序列组的鉴定和使用来测定ER+乳腺癌对TAM或其它抗乳腺癌的“抗雌激素”药物治疗的反应性。利用这些序列在乳腺癌中与正常乳腺细胞中的差异性表达来预测患者对TAM或其它抗乳腺癌的“抗雌激素”药物的反应性。
为鉴定可预测激素疗法反应性的ER阳性、早期侵入性乳腺癌中的基因表达模式,对统一只用辅助的他莫昔芬治疗的60位女性患者的肿瘤进行微阵列基因表达分析。
这些患者是1987-1997年之间Massachusetts综合医院中经鉴定的总共103位ER+早期病人,速冻其肿瘤样品并进行至少5年随访(具体见表1)。这些患者中,28(46%)位妇女发生远处转移,复发中位时间4年(“他莫昔芬无反应者”),32(54%)位妇女随访中位时间10年后仍无发病(“他莫昔芬反应者”)。将反应者与无反应者病例就TNM分期(参见Singletary,S.E.等“美国联合委员会乳腺癌分期系统修订本”(“Revision of the American Joint Committee on Cancerstaging system for Breast Cancer.”) J Clin Oncol 20,3628-36(2002))和肿瘤级别(见Dalton,L.W.等“乳腺癌的组织学分级:患者结局与病理学报告间的关联”(“Histologic grading of Breast Cancer:linkage of patient outcome with level ofpatholo gist agreement.”) Mod Pathol 13,730-5.(2000))进行匹配。
过去将基因表达概貌图与乳腺癌临床结局相关联的研究已表明,可通过诊断时原发性肿瘤的生物学特征可预测远处转移的可能性和总存活率(见Huang,E.等“乳腺癌结局的基因表达预测”(“Gene expression predictors of breast canceroutcome.”) Lancet 361,1590-6(2003);Sorlie,T.等“乳腺癌的基因表达模式可鉴别肿瘤亚类与临床适应症”(“Gene expression patterns of breast carcinomasdistinguish Tumor subclasses with clinical implications.”) Proc Natl Acad Sci U SA 98:10869-74(2001);Sorlie,T.等“在独立的基因表达数据组合中重复观察乳腺癌肿瘤亚型”(“Repeated observation of breast肿瘤subtypes inindependent Gene expression data sets.”) Proc Natl Acad Sci USA 100,8418-23(2003);Sotiriou,C.等“从根据群体研究得到的基因表达概貌图作出的乳腺癌分类和预后”(“breast cancer classification and prognosis based on Geneexpression profiles from a population-based study.”) Proc Natl Acad Sci USA100,10393-8(2003);van′t Veer,L.J.等“基因表达概貌图可预测乳腺癌的临床结局”(“Gene expression profiling predicts clinical outcome of breast cancer.”)Nature 415,530-6(2002);和van de Vijver,M.J.等“基因表达特征可作为乳腺癌存活的预测”(“A gene-expression signature as a predictor of survival in breastcancer.”) N Engl J Med 347,1999-2009(2002))。具体地说,已证明70种基因表达特征是有力的预后因素,优于所有已知的临床病理学参数。然而,在这些研究中,患者或没有接受辅助性治疗(van′t Veer,L.J.等Nature 2002)或是所用的激素和化学治疗方案无统一(Huang,E.等;Sorlie,T.等;Sorlie,T.等;Sotiriou,C.等;和van de Vijver,M.J.等 N Engl J Med 2002)。单用他莫昔芬治疗的ER+早期乳腺癌患者,如这里的群组研究哪一,仅代表采用70种基因特征的群体的一个亚组。需注意的是,下述采用微阵列上存在70种基因特征中的61种在所述患者亚组中未观察到与临床结局的明显相关性。
与现有生物标志物,包括ESR1、PGR、ERBB2和EGFR相比,本文所述的基因序列组显然更能预测对TAM治疗的反应性。多元变量分析表明,这三种基因不依赖肿瘤大小、结状态和肿瘤级别而能有效预测临床结局。ER和孕酮受体(PR)的表达曾是对TAM反应性的主要临床病理学预测参数。然而,多达40%的ER+肿瘤对TAM产生耐药性或不反应。因此,本发明使用本文鉴定的生物标志物,通过能够鉴定更可能从TAM或其它内分泌疗法受益的患者与可能产生耐药性或肿瘤复发的患者而更好地治疗患者。
如本文所述,本发明鉴定的序列的表达与ER+乳腺癌细胞相关。例如,发现用I.M.A.G.E.Consortium Clusters NM_018725和NM_172234鉴定的IL17BR (“I.M.A.G.E.联合体:基因组及其表达的集成性分子分析”(“TheI.M.A.G.E.Consortium:An Integrated Molecular Analysis of Genomes and theirExpression”)Lennon等,1996,Genomics 33:151-152;也可参见image.llnl.gov)可用于预测对TAM治疗的反应。
在本发明优选的实施方式中,可利用集簇IL17BR序列以及UniGene智人集簇Hs.5470中的任何序列或其独特部分。类似地,可使用编码任何本文所述IL17BR序列所编码的整个蛋白质或其一部分的序列。I.M.A.G.E.联合体集簇的共有序列如下,包括下划线标出的编码区(终止于末端密码子),前面为5’非翻译区和/或非编码区,后面是3’非翻译区和/或非编码区:
SEQ ID NO.:1(IL17BR的共有序列,转录变体1,鉴定为NM_018725或NM_018725.2):
agcgcagcgt gcgggtggcc tggatcccgc gcagtggccc ggcg atgtcg ctcgtgctgc
taagcctggc cgcgctgtgc aggagcgccg taccccgaga gccgaccgtt caatgtggct
ctgaaactgg gccatctcca gagtggatgc tacaacatga tctaatcccc ggagacttga
gggacctccg agtagaacct gttacaacta gtgttgcaac aggggactat tcaattttga
tgaatgtaag ctgggtactc cgggcagatg ccagcatccg cttgttgaag gccaccaaga
tttgtgtgac gggcaaaagc aacttccagt cctacagctg tgtgaggtgc aattacacag
aggccttcca gactcagacc agaccctctg gtggtaaatg gacattttcc tacatcggct
tccctgtaga gctgaacaca gtctatttca ttggggccca taatattcct aatgcaaata
tgaatgaaga tggcccttcc atgtctgtga atttcacctc accaggctgc ctagaccaca
taatgaaata taaaaaaaag tgtgtcaagg ccggaagcct gtgggatccg aacatcactg
cttgtaagaa gaatgaggag acagtagaag tgaacttcac aaccactccc ctgggaaaca
gatacatggc tcttatccaa cacagcacta tcatcgggtt ttctcaggtg tttgagccac
accagaagaa acaaacgcga gcttcagtgg tgattccagt gactggggat agtgaaggtg
ctacggtgca gctgactcca tattttccta cttgtggcag cgactgcatc cgacataaag
gaacagttgt gctctgccca caaacaggcg tccctttccc tctggataac aacaaaagca
agccgggagg ctggctgcct ctcctcctgc tgtctctgct ggtggccaca tgggtgctgg
tggcagggat ctatctaatg tggaggcacg aaaggatcaa gaagacttcc ttttctacca
ccacactact gccccccatt aaggttcttg tggtttaccc atctgaaata tgtttccatc
acacaatttg ttacttcact gaatttcttc aaaaccattg cagaagtgag gtcatccttg
aaaagtggca gaaaaagaaa atagcagaga tgggtccagt gcagtggctt gccactcaaa
agaaggcagc agacaaagtc gtcttccttc tttccaatga cgtcaacagt gtgtgcgatg
gtacctgtgg caagagcgag ggcagtccca gtgagaactc tcaagacctc ttcccccttg
cctttaacct tttctgcagt gatctaagaa gccagattca tctgcacaaa tacgtggtgg
tctactttag agagattgat acaaaagacg attacaatgc tctcagtgtc tgccccaagt
accacctcat gaaggatgcc actgctttct gtgcagaact tctccatgtc aagcagcagg
tgtcagcagg aaaaagatca caagcctgcc acgatggctg ctgctccttg tagcccaccc
atgagaagca agagacctta aaggcttcct atcccaccaa ttacagggaa aaaacgtgtg
atgatcctga agcttactat gcagcctaca aacagcctta gtaattaaaa cattttatac
caataaaatt ttcaaatatt gctaactaat gtagcattaa ctaacgattg gaaactacat
ttacaacttc aaagctgttt tatacataga aatcaattac agttttaatt gaaaactata
accattttga taatgcaaca ataaagcatc ttcagccaaa catctagtct tccatagacc
atgcattgca gtgtacccag aactgtttag ctaatattct atgtttaatt aatgaatact
aactctaaga acccctcact gattcactca atagcatctt aagtgaaaaa ccttctatta
catgcaaaaa atcattgttt ttaagataac aaaagtaggg aataaacaag ctgaacccac
ttttaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa
SEQ ID NO.:2(IL17BR的共有序列,转录变体2,鉴定为NM_172234或NM_172234.1):
agcgcagcgt gcgggtggcc tggatcccgc gcagtggccc ggcg atgtcg ctcgtgctgc
taagcctggc cgcgctgtgc aggagcgccg taccccgaga gccgaccgtt caatgtggct
ctgaaactgg gccatctcca gagtggatgc tacaacatga tctaatcccc ggagacttga
gggacctccg agtagaacct gttacaacta gtgttgcaac aggggactat tcaattttga
tgaatgtaag ctgggtactc cgggcagatg ccagcatccg cttgttgaag gccaccaaga
tttgtgtgac gggcaaaagc aacttccagt cctacagctg tgtgaggtgc aattacacag
aggccttcca gactcagacc agaccctctg gtggtaaatg gacattttcc tacatcggct
tccctgtaga gctgaacaca gtctatttca ttggggccca taatattcct aatgcaaata
tgaatgaaga tggcccttcc atgtctgtga atttcacctc accaggctgc ctagaccaca
taatgaaata taaaaaaaag tgtgtcaagg ccggaagcct gtgggatccg aacatcactg
cttgtaagaa gaatgaggag acagtagaag tgaacttcac aaccactccc ctgggaaaca
gatacatggc tcttatccaa cacagcacta tcatcgggtt ttctcaggtg tttgagccac
accagaagaa acaaacgcga gcttcagtgg tgattccagt gactggggat agtgaaggtg
ctacggtgca ggtaaagttc agtgagctgc tctggggagg gaagggacat agaagactgt
tccatcattc attgctttta aggatgagtt ctctcttgtc aaatgcactt ctgccagcag
acaccagtta agtggcgttc atgggggctc tttcgctgca gcctccaccg tgctgaggtc
aggaggccga cgtggcagtt gtggtccctt ttgcttgtat taatggctgc tgaccttcca
aagcactttt tattttcatt ttctgtcaca gacactcagg gatagcagta ccattttact
tccgcaagcc tttaactgca agatgaagct gcaaagggtt tgaaatggga aggtttgagt
tccaggcagc gtatgaactc tggagagggg ctgccagtcc tctctgggcc gcagcggacc
cagctggaac acaggaagtt ggagcagtag gtgctccttc acctctcagt atgtctcttt
caactctagt ttttgaggtg gggacacagg aggtccagtg ggacacagcc actccccaaa
gagtaaggag cttccatgct tcattccctg gcataaaaag tgctcaaaca caccagaggg
ggcaggcacc agccagggta tgatggctac tacccttttc tggagaacca tagacttccc
ttactacagg gacttgcatg tcctaaagca ctggctgaag gaagccaaga ggatcactgc
tgctcctttt ttctagagga aatgtttgtc tacgtggtaa gatatgacct agccctttta
ggtaagcgaa ctggtatgtt agtaacgtgt acaaagttta ggttcagacc ccgggagtct
tgggcacgtg ggtctcgggt cactggtttt gactttaggg ctttgttaca gatgtgtgac
caaggggaaa atgtgcatga caacactaga ggtatgggcg aagccagaaa gaagggaagt
tttggctgaa gtaggagtct tggtgagatt ttgctctgat gcatggtgtg aactttctga
gcctcttgtt tttcctcagc tgactccata ttttcctact tgtggcagcg actgcatccg
acataaagga acagttgtgc tctgcccaca aacaggcgtc cctttccctc tggataacaa
caaaagcaag ccgggaggct ggctgcctct cctcctgctg tctctgctgg tggccacatg
ggtgctggtg gcagggatct atctaatgtg gaggcacgaa aggatcaaga agacttcctt
ttctaccacc acactactgc cccccattaa ggttcttgtg gtttacccat ctgaaatatg
tttccatcac acaatttgtt acttcactga atttcttcaa aaccattgca gaagtgaggt
catccttgaa aagtggcaga aaaagaaaat agcagagatg ggtccagtgc agtggcttgc
cactcaaaag aaggcagcag acaaagtcgt cttccttctt tccaatgacg tcaacagtgt
gtgcgatggt acctgtggca agagcgaggg cagtcccagt gagaactctc aagacctctt
cccccttgcc tttaaccttt tctgcagtga tctaagaagc cagattcatc tgcacaaata
cgtggtggtc tactttagag agattgatac aaaagacgat tacaatgctc tcagtgtctg
ccccaagtac cacctcatga aggatgccac tgctttctgt gcagaacttc tccatgtcaa
gcagcaggtg tcagcaggaa aaagatcaca agcctgccac gatggctgct gctccttgta
gcccacccat gagaagcaag agaccttaaa ggcttcctat cccaccaatt acagggaaaa
aacgtgtgat gatcctgaag cttactatgc agcctacaaa cagccttagt aattaaaaca
ttttatacca ataaaatttt caaatattgc taactaatgt agcattaact aacgattgga
aactacattt acaacttcaa agctgtttta tacatagaaa tcaattacag ttttaattga
aaactataac cattttgata atgcaacaat aaagcatctt cagccaaaca tctagtcttc
catagaccat gcattgcagt gtacccagaa ctgtttagct aatattctat gtttaattaa
tgaatactaa ctctaagaac ccctcactga ttcactcaat agcatcttaa gtgaaaaacc
ttctattaca tgcaaaaaat cattgttttt aagataacaa aagtagggaa taaacaagct
gaacccactt ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa
下面列出了经鉴定属于I.M.A.G.E.联合体和UniGene集簇的序列的I.M.A.G.E.联合体克隆ID编号和对应的GenBank登录号。还包括未经鉴定具有克隆ID编号但仍鉴定为IL17BR的序列。这些序列包括“有义”序列和对应于IL17BR的互补链序列。每个有GenBank登录号的序列提高在所附附录中。
  克隆ID编号   GenBank登录号
  2985728   AW675096,AW673932,BC000980
  5286745   BI602183
  5278067   BI458542
  5182255   BI823321
  924000   AA514396
  3566736   BF110326
  3195409   BE466508
  3576775   BF740045
  2772915   AW299271
  1368826   AA836217
  1744837   AI203628
  2285564   AI627783
  2217709   AI744263
  2103651   AI401622
  2419487   AI826949
  3125592   BE047352
  2284721   AI911549
  3643302   BF194822
  1646910   AI034244
  1647001   AI033911
  3323709   BF064177
  1419779   AA847767
  2205190   AI538624
  2295838   AI913613
  2461335   AI942234
  2130362   AI580483
  2385555   AI831909
  2283817   AI672344
  2525596   AW025192
  454687   AA677205
  1285273   AA721647
  3134106   BF115018
  342259   W61238,W61239
  1651991   AI032064
  2687714   AW236941
  3302808   BG057174
  2544461   AW058532
  122014   T98360,T98361
  2139250   AI470845
  2133899   AI497731
  121300   T96629,T96740
  162274   H25975,H25941
  3446667   BE539514,BX282554
  156864   R74038,R74129
  4611491   BG433769
  4697316   BG530489
  429376   AA007528,AA007529
  5112415   BI260259
  701357   AA287951,AA287911
  121909   T97852,T97745
  268037   N40294
  1307489   AA809841
  1357543   AA832389
  48442   H14692
  1302619   AA732635
  1562857   AA928257
  1731938   AI184427
  1896025   AI298577
  2336350   AI692717
  1520997   AA910922
  240506   H90761
  2258560   AI620122
  1569921   AI793318,AA962325,AI733290
  6064627   BQ226353
  299018   W04890
  5500181   BM455231
  2484011   BI492426
  4746376   BG674622
  233783   BX111256
  1569921   BX117618
  450450   AA682806
  1943085   AI202376
  2250390   AI658949
  4526156   BG403405
  3249181   BE673417
  2484395   AW021469
  30515867   CF455736
  2878155   AW339874
  4556884   BG399724
  3254505   BF475787
  3650593   BF437145
  233783   H64601
无(mRNA序列)   AF212365,AF208110,AF208111,AF250309,AK095091
  BM983744,CB305764,BM715988,BM670929,BI792416,BI715216,N56060,
  CB241389,AV660618,BX088671,CB154426,CA434589,CA412162,CA314073,BF921554,BF920093,AV685699,AV650175,BX483104,CD675121,BE081436,AW970151,AW837146,AW368264,D25960,AV709899,BX431018,AL535617,AL525465,BX453536,BX453537,AV728945,AV728939,AV727345
在一个优选的实施方式中,由AF208111或AF208111.1鉴定的以下IL17BR序列的任何序列或其独特部分可用于实施本发明。
SEQ ID NO.:3(IL17BR序列):
CGGCGATGTCGCTCGTGCTGATAAGCCTGGCCGCGCTGTGCAGGAGCGCCGTACCCCGAG
AGCCGACCGTTCAATGTGGCTCTGAAACTGGGCCATCTCCAGAGTGGATGCTACAACATG
ATCTAATCCCCGGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACAACTAGTGTTGCAA
CAGGGGACTATTCAATTTTGATGAATGTAAGCTGGGTACTCCGGGCAGATGCCAGCATCC
GCTTGTTGAAGGCCACCAAGATTTGTGTGACGGGCAAAAGCAACTTCCAGTCCTACAGCT
GTGTGAGGTGCAATTACACAGAGGCCTTCCAGACTCAGACCAGACCCTCTGGTGGTAAAT
GGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAACACAGTCTATTTCATTGGGGCCC
ATAATATTCCTAATGCAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCT
CACCAGGCTGCCTAGACCACATAATGAAATATAAAAAAAAGTGTGTCAAGGCCGGAAGCC
TGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGAGGAGACAGTAGAAGTGAACTTCA
CAACCACTCCCCTGGGAAACAGATACATGGCTCTTATCCAACACAGCACTATCATCGGGT
TTTCTCAGGTGTTTGAGCCACACCAGAAGAAACAAACGCGAGCTTCAGTGGTGATTCCAG
TGACTGGGGATAGTGAAGGTGCTACGGTGCAGGTAAAGTTCAGTGAGCTGCTCTGGGGAG
GGAAGGGACATAGAAGACTGTTCCATCATTCATTGCTTTTAAGGATGAGTTCTCTCTTGT
CAAATGCACTTCTGCCAGCAGACACCAGTTAAGTGGCGTTCATGGGGGTTCTTTCGCTGC
AGCCTCCACCGTGCTGAGGTCAGGAGGCCGACGTGGCAGTTGTGGTCCCTTTTGCTTGTA
TTAATGGCTGCTGACCTTCCAAAGCACTTTTTATTTTCATTTTCTGTCACAGACACTCAG
GGATAGCAGTACCATTTTACTTCCGCAAGCCTTTAACTGCAAGATGAAGCTGCAAAGGGT
TTGAAATGGGAAGGTTTGAGTTCCAGGCAGCGTATGAACTCTGGAGAGGGGCTGCCAGTC
CTCTCTGGGCCGCAGCGGACCCAGCTGGAACACAGGAAGTTGGAGCAGTAGGTGCTCCTT
CACCTCTCAGTATGTCTCTTTCAACTCTAGTTTTTGAAGTGGGGACACAGGAAGTCCAGT
GGGGACACAGCCACTCCCCAAAGAATAAGGAACTTCCATGCTTCATTCCCTGGCATAAAA
AGTGNTCAAACACACCAGAGGGGGCAGGCACCAGCCAGGGTATGATGGGTACTACCCTTT
TCTGGAGAACCATAGACTTCCCTTACTACAGGGACTTGCATGTCCTAAAGCACTGGCTGA
AGGAAGCCAAGAGGATCACTGCTGCTCCTTTTTTGTAGAGGAAATGTTTGTGTACGTGGT
AAGATATGACCTAGCCCTTTTAGGTAAGCGAACTGGTATGTTAGTAACGTGTACAAAGTT
TAGGTTCAGACCCCGGGAGTCTTGGGCATGTGGGTCTCGGGTCACTGGTTTTGACTTTAG
GGCTTTGTTACAGATGTGTGACCAAGGGGAAAATGTGCATGACAACACTAGAGGTAGGGG
CGAAGCCAGAAAGAAGGGAAGTTTTGGCTGAAGTAGGAGTCTTGGTGAGATTTTGCTGTG
ATGCATGGTGTGAACTTTCTGAGCCTCTTGTTTTTCCTCAGCTGACTCCATATTTTCCTA
CTTGTGGCAGCGACTGCATCCGACATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCG
TCCCTTTCCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGC
TGTCTCTGCTGGTGGCCACATGGGTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACG
AAAGGATCAAGAAGACTTCCTTTTCTACCACCACACTACTGCCCCCCATTAAGGTTCTTG
TGGTTTACCCATCTGAAATATGTTTCCATCACACAATTTGTTACTTCACTGAATTTCTTC
AAAACCATTGCAGAAGTGAGGTCATCCTTGAAAAGTGGCAGAAAAAGAAAATAGCAGAGA
TGGGTCCAGTGCAGTGGCTTGCCACTCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTC
TTTCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCA
GTGAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAA
GCCAGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACG
ATTACAATGCTCTCAGTGTCTGCCCCAAGTACCACTTCATGAAGGATGCCACTGCTTTCT
GTGCAGAACTTCTCCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCC
ACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCT
ATCCCACCAATTACAGGGAAAAAACGTGTGATGATCCTGAAGCTTACTATGCAGCCTACA
AACAGCCTTAGTAATTAAAACATTTTATACCAATAAAATTTTCAAATATTACTAACTAAT
GTAGCATTAACTAACGATTGGAAACTACATTTACAACTTCAAAGCTGTTTTATACATAGA
AATCAATTACAGCTTTAATTGAAAACTGTAACCATTTTGATAATGCAACAATAAAGCATC
TTCCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
在本发明优选的实施方式中,可使用CHDH序列集簇以及UniGene智人集簇Hs.126688的任何序列或其独特部分。类似的,可使用任何编码任何本文所述CHDH序列所编码的整个蛋白质或其一部分的序列。I.M.A.G.E.联合体集簇的共有序列如下,包括下划线标出的编码区(终止于末端密码子),前面为5’非翻译区和/或非编码区,后面是3’非翻译区和/或非编码区:
SEQ ID NO:4(CHDH的共有序列,鉴定为NM_018397或NM_018397.1):
agcgggccgc ggccacccgc tcctcccgct ccggtcccga ctgtcgggct ctcggccgag
tcgccccgga caatcacaaa gagtgtgtag gccagccccg gtcacagagt gcaccgtatc
ctgtcacttc tggatgtgag ggagaagtga gtcatctcat tcccctccgt ggatcagagg
acttggacta gatagaagca tgtggtgtct cctacgaggc ctgggccggc ctggagccct
ggcacgggga gccctggggc agcagcaatc cctgggtgcc cgggccctgg ccagcgcagg
ctctgagagc cgggacgagt acagctatgt ggtggtgggc gcgggctcgg cgggctgcgt
gctggctggg aggctcacgg aggaccccgc cgagcgcgtg ctgctgctgg aggccgggcc
caaggacgtg cgcgcgggga gcaagcggct ctcgtggaag atccacatgc ccgcggccct
ggtggccaac ctgtgcgacg acaggtacaa ctggtgctac cacacagagg tgcagcgggg
cctggacggc cgcgtgctgt actggccacg cggccgcgtc tggggtggct cctcatccct
caatgccatg gtctacgtcc gtgggcacgc cgaggactac gagcgctggc agcgccaggg
cgcccgcggc tgggactacg cgcactgcct gccctacttc cgcaaggcgc agggccacga
gctgggcgcc agccggtacc ggggcgccga tggcccgctg cgggtgtccc ggggcaagac
caaccacccg ctgcactgcg cattcctgga ggccacgcag caggccggct acccgctcac
cgaggacatg aatggcttcc agcaggaggg cttcggctgg atggacatga ccatccatga
aggcaaacgg tggagcgcag cctgtgccta cctgcaccca gcactgagcc gcaccaacct
caaggccgag gccgagacgc ttgtgagcag ggtgctattt gagggcaccc gtgcagtggg
cgtggagtat gtcaagaatg gccagagcca cagggcttat gccagcaagg aggtgattct
gagtggaggt gccatcaact ctccacagct gctcatgctc tctggcatcg ggaatgctga
tgacctcaag aaactgggca tccctgtggt gtgccaccta cctggggttg gccagaacct
gcaagaccac ctggagatct acattcagca ggcatgcacc cgccctatca ccctccattc
agcacagaag cccctgcgga aggtctgcat tggtctggag tggctctgga aattcacagg
ggagggagcc actgcccatc tggaaacagg tgggttcatc cgcagccagc ctggggtccc
ccacccggac atccagttcc atttcctgcc atcccaagtg attgaccacg ggcgggtccc
cacccagcag gaggcttacc aggtacatgt ggggcccatg cggggcacga gtgtgggctg
gctcaaactg agaagtgcca atccccaaga ccaccctgtg atccagccca actacttgtc
aacagaaact gatattgagg atttccgtct gtgtgtgaag ctcaccagag aaatttttgc
acaggaagcc ctggctccgt tccgagggaa agagctccag ccaggaagcc acattcagtc
agataaagag atagatgcct ttgtgcgggc aaaagccgac agcgcctacc acccctcgtg
cacctgtaag atgggccagc cctccgatcc cactgccgtg gtggatccgc agacaagggt
cctcggggtg gaaaacctca gggtcgtcga tgcctccatc atgcctagca tggtcagcgg
caacctgaac gcccccacaa tcatgatcgc agagaaggca gctgacatta tcaaggggca
gcctgcactc tgggacaaag atgtccctgt ctacaagccc aggacgctgg ccacccagcg
ctaagacagt tgctgctgga ggatgaccag ggaagccccc tgataagcca agagggccag
cacagccctt gctcccaggc tcctgcctga aactatctag cacactagga cccaggtggt
accctactca gtggctgaga attggataaa gtcttgggaa atgagacaaa aaaaaaaaaa
aa
下面列出了经鉴定属于I.M.A.G.E.联合体和UniGene集簇的序列的I.M.A.G.E.联合体克隆ID编号和对应的GenBank序列登录号。还包括未经鉴定的具有克隆ID编号但仍鉴定为CHDH的序列。这些序列包括“有义”序列和对应于CHDH的互补链序列。其它可用于实施本发明的序列如图5所示,也在附录中提供。
  克隆ID编号/GenBank登录号
  4824572/BC034502和BG720228
  5191415/BI765156
  5311690/BI667529
  5267676/BI460380
  1031605/AA609488
  3842653/BE732217
  4543273/BG336766
  3504516/BE279319
  3140587/BE279968
  6297066/BQ648069
  2734263/AW449121
  2735859/AW450678
  2720363/AW139168
  3642981/BF195860
  5931105/BQ066460
  3574335/BF430927
  3268842/BF435866
  3267752/BF435185
  1868020/AI264647和BX116752和AI733810和AI792632
  2365837/AI741739
  3085519/BF510364
  1647746/AI034449
  2695349/AW194822
  2285283/AI628996
  2694067/AW235087
  2285315/AI629023
  2463061/AI928186
  2462306/AI927042
  2381448/AI768443
  2298488/AI650346
  3134601/BF197300
  2300327/AI631941
  2697626/AW167538
  3034918/AW779820
  2525301/AW024823
  2300291/AI631914
  2137091/AI473735
  4147169/BG060119
  2772286/AW299654
  2172535/AI564145
  2690214/AW241612
  1868068/AI241086
  1608918/AA991365
  3134810/BF197431
  1869723/AI245204
  2691133/AW242403
  6109050/BU500214
  2384051/AI796286
  2055388/AI308167
  3032446/AW771262
  2907815/AW340332
  1636795//AI792354和AI017355
  2299592/AI640195
  2054920/AI334627
  2690173/AW237735
  1869819/AI245373
  3195030/BE464406
  1646613/AI025866
  2773291/AW299629
  2461358/AI942245
  5678397/BM142449和BM142311
  5672209/BM052814和BM053126
  2137904/AI800207
  511224/AA088689和AA088826
  2734357/AW449405
  381379/AA052926和AA052927
  2337545/AI914219
  2528186/AW337722
  2028284/AI262965
  3436048/BF940636
  2344677/AI695649
  123940/R00867和R01524/
  240988/H90906和H91018
  240077/H82409和H82667
  无(mRNA序列)/NM_018397.1和AJ272267.1和AK055402.1
  无/AA772473.1和BM682615.1和BM713059.1和BM716959.1和BU738538.1和AA324019.1和AA302740.1和C20981.1和BF930030.1和BQ303877.1和BM769931.1和AW900269.1和F26419.1和CB147231.1和BE765491.1 AV656671.1
在一个优选的实施方式中,可利用图5和6中CHDH序列的任何序列或其独特部分来实施本发明。
在本发明另一组优选的实施方式中,可使用I.M.A.G.E.联合体集簇NM_014298的QPRT序列以及UniGene智人集簇Hs.126688中的任何序列或其独特部分。类似地,可使用编码本文所述QPRT序列所编码的整个蛋白质或其一部分的任何序列。I.M.A.G.E.联合体集簇的共有序列如下,包括下划线标出的编码区(终止于末端密码子),前面为5’非翻译区和/或非编码区,后面是3’非翻译区和/或非编码区:
SEQ ID NO:5(QPRT的共有序列,鉴定为NM_014298或NM_014298.2):
gtcctgagca gccaacacac cagcccagac agctgcaagt caccatggac gctgaaggcc
tggcgctgct gctgccgccc gtcaccctgg cagccctggt ggacagctgg ctccgagagg
actgcccagg gctcaactac gcagccttgg tcagcggggc aggcccctcg caggcggcgc
tgtgggccaa atcccctggg gtactggcag ggcagccttt cttcgatgcc atatttaccc
aactcaactg ccaagtctcc tggttcctcc ccgagggatc gaagctggtg ccggtggcca
gagtggccga ggtccggggc cctgcccact gcctgctgct gggggaacgg gtggccctca
acacgctggc ccgctgcagt ggcattgcca gtgctgccgc cgctgcagtg gaggccgcca
ggggggccgg ctggactggg cacgtggcag gcacgaggaa gaccacgcca ggcttccggc
tggtggagaa gtatgggctc ctggtgggcg gggccgcctc gcaccgctac gacctgggag
ggctggtgat gttgaaggat aaccatgtgg tgccccccgg tggcgtggag aaggcggtgc
gggcggccag acaggcggct gacttcgctc tgaaggtgga agtggaatgc agcagcctgc
aggaggtcgt ccaggcagct gaggctggcg ccgaccttgt cctgctggac aacttcaagc
cagaggagct gcaccccacg gccaccgcgc tgaaggccca gttcccgagt gtggctgtgg
aagccagtgg gggcatcacc ctggacaacc tcccccagtt ctgcgggccg cacatagacg
tcatctccat ggggatgctg acccaggcgg tcccagccct tgatttctcc ctcaagctgt
ttgccaaaga ggtggctcca gtgcccaaaa tccactagtc ctaaaccgga agaggatgac
accggccatg ggttaacgtg gctcctcagg accctctggg tcacacatct ttagggtcag
tgaacaatgg ggcacatttg gcactagctt gagcccaact ctggctctgc cacctgctgc
tcctgtgacc tgtcagggct gacttcacct ctgctcatct cagtttccta atctgtaaaa
tgggtctaat aaaggatcaa ccaaaaaaaa aaaaaaaaaa aa
下面列出了经鉴定属于I.M.A.G.E.联合体和UniGene集簇的序列的I.M.A.G.E.联合体克隆ID编号和对应的GenBank序列登录号。还包括未经鉴定具有克隆ID编号但仍鉴定为QPRT的序列。这些序列包括“有义”序列和对应于QPRT的互补链序列。每个有GenBank登录号的序列提供在所附附录中。
  克隆ID编号/GenBank登录号
  2960170/BC005060和BE299670和BE299712
  3506460/BE273102和BC010033
  3959973/BC018910和BE902622
  267692/N23182和N32648
  3843834/BE735342
  4872092/BX283118和BG769505
  4845859/BG750434
  4868806/BG766440
  4594651/BG401877
  4553618/BG337811
  4554044/BG338063
  4473161/BG251163
  4581127/BG396079
  4136221/BF316915
  4127089/BF313098
  4508387/BG257831
  4125826/BF312975
  4416920/BG115486
  4842556/BG748194
  4395232/BF980859
  4122808/BF304964
  6305325/BQ643384
  4107138/BF204965
  4875437/BG753310/
  6337913/BU501237
  4136491/BF317004
  4131857/BF307788
  4302204/BF684687
  5092370/BI195027
  3353576/BE257622
  4473768/BG252578
  3912491/BE887856
  6012403/BU186666
  4873695/BG751315
  4873694/BG751234
  4080072/BF237708
  6300166/BQ876922
  896716/BI198351
  4877853/BG770209
  4896715/BI198375
  5087154/BI252426和BI252874
  6085289/BU174626
  5741237/BM558378
  4995462/BI088884
  6720160/CA488404
  5764841/BM926410
  6208509/BQ879962
  4581968/BG396587
  5554997/BM477735
  3451668/BE538581
  5803440/BQ069150
  6250974/BQ688755
  6251079/BQ685759
  5535758/BM468306
  6146330/BU165540
  1740729/AI191477
  2729947/AW293885
  6082577/BU174653
  2753118/AW275889
  2437568/AI884372
  2507497/AI961218
  5207705/BI771713
  2067750/AI383718
  263894/N28522和H99843
  1148416/AA627205
  138014/R63144
  70610/T49073和T49074
  5531252/BM800219
  3629874/BE409186
  5001398/BI093643
  4361336/BF971224
  4451023/BG121013
  3844815/BE730924
  4361451/BF970190
  4154033/BF346117
  4915206/BG818225
  4444686/BG118070
  6086243/BU149745
  4899066/BG829478
  6086128/BU180123
  4366207/BG108477
  3140355/BE280221
  5459527/BM012505
  3627907/BE382922
  5418599/BM016313
  4862852/BG765156
  4877780/BG769917
  3162024/BE262076
  5182393/BI518189和BI517759
  5417445/BM015407
  6015713/BU175170
  417111/W87557和W87461
  4580196/BG395022
  6271908/BQ648651
  6298174/BQ652789
  6271910/BQ653475
  6271630/BQ647246
  5798664/BM928534
  6652195/BU860925
  6299767/BQ651366
  5225259/BI838658
  4895399/BI198873
  740128/AA477534和AA479051
  6172561/BU178924
  4562784/BG326197
  3957711/BE902093
  6293406/BQ650920
  无(mRNA序列)/BT007231.1和NM_014298.2和AK090801.1和D78177.1
  无/CB156177.1和BM711970.1和BM675916.1和BM675420.1和BM714918.1和AA337770.1和AA305670.1和AA305611.1和and BU622082.1和AV705250.1和AL528086.2和AL531128.2和AL543783.2和AL548817.2和AL554386.2和AL563056.2和AL563955.2和AL570131.2和AL573234.2和BF956608.1和AV648116.1和AV645766.1和BF742969.1和AL577191.2和CD050133.1和CD049103.1和BX417895.1和CB529044.1和CD250136.1和AA054830.1和BX508036.1和BX454610.1
在本发明另一组优选的实施方式中,可使用I.M.A.G.E.联合体集簇的NM_006361HOXB13序列以及UniGene智人集簇Hs.66731中的任何序列或其独特部分。类似地,可使用编码本文所述任何HOXB13序列所编码的整个蛋白或某一部分的任何序列。I.M.A.G.E.联合体集簇的共有序列如下,包括下划线标出的编码区(终止于末端密码子),前面是5’非翻译区和/或非编码区,后面是3’非翻译区和/或非编码区:
SEQ ID NO:6(HOXB13的共有序列,鉴定为NM_006361或NM_006361.2):
cgaatgcagg cgacttgcga gctgggagcg atttaaaacg ctttggattc ccccggcctg
ggtggggaga gcgagctggg tgccccctag attccccgcc cccgcacctc atgagccgac
cctcggctcc  atggagcccg gcaattatgc caccttggat ggagccaagg atatcgaagg
cttgctggga gcgggagggg ggcggaatct ggtcgcccac tcccctctga ccagccaccc
agcggcgcct acgctgatgc ctgctgtcaa ctatgccccc ttggatctgc caggctcggc
ggagccgcca aagcaatgcc acccatgccc tggggtgccc caggggacgt ccccagctcc
cgtgccttat ggttactttg gaggcgggta ctactcctgc cgagtgtccc ggagctcgct
gaaaccctgt gcccaggcag ccaccctggc cgcgtacccc gcggagactc ccacggccgg
ggaagagtac cccagtcgcc ccactgagtt tgccttctat ccgggatatc cgggaaccta
ccacgctatg gccagttacc tggacgtgtc tgtggtgcag actctgggtg ctcctggaga
accgcgacat gactccctgt tgcctgtgga cagttaccag tcttgggctc tcgctggtgg
ctggaacagc cagatgtgtt gccagggaga acagaaccca ccaggtccct tttggaaggc
agcatttgca gactccagcg ggcagcaccc tcctgacgcc tgcgcctttc gtcgcggccg
caagaaacgc attccgtaca gcaaggggca gttgcgggag ctggagcggg agtatgcggc
taacaagttc atcaccaagg acaagaggcg caagatctcg gcagccacca gcctctcgga
gcgccagatt accatctggt ttcagaaccg ccgggtcaaa gagaagaagg ttctcgccaa
ggtgaagaac agcgctaccc cttaagagat ctccttgcct gggtgggagg agcgaaagtg
ggggtgtcct ggggagacca gaaacctgcc aagcccaggc tggggccaag gactctgctg
agaggcccct agagacaaca cccttcccag gccactggct gctggactgt tcctcaggag
cggcctgggt acccagtatg tgcagggaga cggaacccca tgtgacaggc ccactccacc
agggttccca aagaacctgg cccagtcata atcattcatc ctcacagtgg caataatcac
gataaccagt
下面列出了经鉴定属于I.M.A.G.E.联合体和UniGene集簇的序列的I.M.A.G.E.联合体克隆ID编号和对应的GenBank序列登录号。还包括未经鉴定具有克隆ID编号但仍鉴定为HOXB13的序列。这些序列包括“有义”序列和对应于HOXB13的互补链序列。每个有GenBank登录号的序列提供在所附附录中。
  克隆ID编号   GenBank登录号
  4250486   BF676461,BC007092
  5518335   BM462617
  4874541   BG752489
  4806039   BG778198
  3272315   CB050884,CB050885
  4356740   BF965191
  6668163   BU930208
  1218366   AA807966
  2437746   AI884491
  1187697   AA652388
  3647557   BF446158
  1207949   AA657924
  1047774   AA644637
  3649397   BF222357
  971664   AA527613
  996191   AA533227
  813481   AA456069,AA455572,BX117624
  6256333   BQ673782
  2408470   AI814453
  2114743   AI417272
  998548   AA535663
  2116027   AI400493
  3040843   AW779219
  1101311   AA594847
  1752062   AI150430
  898712   AA494387
  1218874   AA662643
  2460189   AI935940
  986283   AA532530
  1435135   AA857572
  1871750   AI261980
  3915135   BE888751
  2069668   AI378797
  667188   AA234220,AA236353
  1101561   AA588193
  1170268   AI821103,AI821851,AA635855
  2095067   AI420753
  4432770   BG180547
  783296   AA468306,AA468232
  3271646   CB050115,CB050116
  1219276   AA661819
  30570598   CF146837
  30570517   CF146763
  30568921   CF144902
  3099071   CF141511
  3096992   CF139563
  3096870   CF139372
  3096623   CF139319
  3096798   CF139275
  30572408   CF122893
  2490082   AI972423
  2251055   AI918975
  2419308   AI826991
  2249105   AI686312
  2243362   AI655923
  30570697   CF146922
  3255712   BF476369
  3478356   BF057410
  3287977   BE645544
  3287746   BE645408
  3621499   BE388501
  30571128   CF147366
  30570954   CF147143
  无(mRNA序列)   BT007410,BC007092,U57052,U81599
  CB120119,CB125764,AU098628,CB126130,BI023924,BM767063,BM794275,BQ363211,BM932052,AA357646,AW609525,CB126919,AW609336,AW609244,BF855145,AU126914,CB126449,AW582404,BX641644
在一个优选的实施方式中,可利用以下鉴定为BC007092或BC007092.1的HOXB13序列的任何序列或其独特部分来实施本发明。
SEQ ID NO:7(HOXB13序列):
GGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCG
CACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAG
CCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCC
CTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGG
ATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGG
GGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAG
TGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGG
AGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGG
GATATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTC
TGGGTGCTCCTGGAGAACCGCGACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTT
GGGCTCTCGCTGGTGGCTGGAACAGCCAGATGTGTTGCCAGGGAGAACAGAACCCACCAG
GTCCCTTTTGGAAGGCAGCATTTGCAGACTCCAGCGGGCAGCACCCTCCTGACGCCTGCG
CCTTTCGTCGCGGCCGCAAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGAGCTGG
AGCGGGAGTATGCGGCTAACAAGTTCATCACCAAGGACAAGAGGCGCAAGATCTCGGCAG
CCACCAGCCTCTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAGA
AGAAGGTTCTCGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGT
GGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGG
GCCAAGGACTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTG
GACTGTTCCTCAGGAGCGGCCTGGGTACCCAGTATGTGCAGGGAGACGGAACCCCATGTG
ACAGCCCACTCCACCAGGGTTCCCAAAGAACCTGGCCCAGTCATAATCATTCATCCTGAC
AGTGGCAATAATCACGATAACCAGTACTAGCTGCCATGATCGTTAGCCTCATATTTTCTA
TCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATTGAGCTAATTATGAATAA
ATTTGGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
提供了以SEQ ID NO.鉴定的从5’磷酸末端开始到3’羟基末端的常规DNA链序列。一般通过与可获得的共有序列作比较来确定编码区,因而该编码区可能含有与指定的同一集簇其它序列不一致之处。这对实施本发明没有影响,因为可通过使用上述三组序列之一的独特序列较短区段(或其组合)来实施本发明而不受这种不一致性的影响。作为非限制性的例子,可利用由3’非翻译区序列组成的IL17BR、CHDH、QPRT或HOXB13核酸序列区段和/或该编码区的3’端序列为探针,来分别检测IL17BR、CHDH、QPRT或HOXB13的表达,而不受该编码区中由于序列之间的差异所致存在的不一致性的影响。类似地,可用能特异性识别本文所述IL17BR、CHDH、QPRT或HOXB13序列编码的蛋白质、或其片段的抗体来检测其表达,将不会受到上述编码区中存在的任何不一致性的影响。
如本领域技术人员将理解的那样,上述序列中的一些含有对本文所述序列独特性无贡献的3’聚A(或互补链上的聚T)延伸段。因此,可使用缺少3’聚A(或聚T)延伸段的序列来实施本发明。所述序列的独特性指只在IL17BR、CHDH、QPRT或HOXB13核酸中发现的序列的一部分或全部,包括在这些基因的3’非翻译区部分发现的序列。实施本发明优选的独特序列是这三组的共有序列部分,该独特序列可用于检测多种个体中的表达,而不是对一些个体中存在的多态性特异性检测。或者,可使用对某个体或某亚群独特的序列。优选的独特序列具有上述本发明多核苷酸的长度。
为在实施本发明中测定上述序列的表达水平(增加或降低),可采用任何本领域已知方法。在本发明一个优选的实施方式中,可检测能与含上述序列的多核苷酸杂交的RNA的表达。这不难通过本领域已知的或认为是等价的RNA测定或扩增+测定方法进行,例如但不限于:逆转录-PCR(任选实时PCR)、美国专利6,794,141中所述方法、美国专利6,291,170中所述方法和定量PCR。也可使用能鉴定RNA稳定性增加(观察到表达增加)或RNA稳定性降低(观察到表达降低)的方法。这些方法包括检测能提高或降低包含本文所述IL17BR、CHDH、QPRT或HOXB13序列的mRNA稳定性的序列。这些方法还包括检测mRNA降解的增加。
在本发明特别优选的实施方式中,在实施本发明时,使用具有上述序列3’非翻译区和/或非编码区序列的多核苷酸,来检测IL17BR、CHDH、QPRT或HOXB13序列在乳腺细胞中的表达或不表达。这种多核苷酸可任选地包含上述序列编码区3’部分中的序列。包含编码区和3’非编码区组合序列的多核苷酸优选具有毗连排布的序列,并无干扰性异源序列。
或者,可利用具有IL17BR、CHDH、QPRT或HOXB13序列的5’非翻译区和/或非编码区的多核苷酸来实施本发明,检测乳腺细胞中它们的表达水平。这种多核苷酸可任选地包含编码区5’部分的序列。包含编码区和5’非编码区组合组合的多核苷酸优选具有毗连排布的序列,并无干扰性异源序列。也可用IL17BR、CHDH、QPRT或HOXB13编码区中的序列实施本发明。
优选多核苷酸包含3’或5’非翻译区和/或非编码区的至少约16、至少约18、至少约20、至少约22、至少约24、至少约26、至少约28、至少约30、至少约32、至少约34、至少约36、至少约38、至少约40、至少约42、至少约44或至少约46个保守性核苷酸。上句中使用的术语“约”指所述数值加1或减1。甚至更优选的是包含至少或约50、至少或约100、至少或约150、至少或约200、至少或约250、至少或约300、至少或约350、至少或约400个连续核苷酸的多核苷酸。上句中使用的术语“约”指所述数值加或减10%。
本发明多核苷酸中上述编码区3’或5’端的序列与上述多核苷酸长度相同,除了它们天然受限于编码区长度以外。编码区的3’端可包括多达3’编码区一半的序列。相反的编码区5’端可包括多达5’编码区一半的序列。当然,可使用全部上述序列、或编码区和包含编码区一部分的多核苷酸。
组合3’非翻译区和/或非编码区与相关的编码区3’端的多核苷酸优选至少或约100、至少或约150、至少或约200、至少或约250、至少或约300、至少或约350或至少或约400个连续核苷酸。优选所用的多核苷酸包括该基因3’端的,例如从该基因或表达的序列的聚腺苷酸信号或聚腺苷酸化位点算起的约350、约300、约250、约200、约150、约100或约50个核苷酸。也可使用对于所述基因的序列含有突变的多核苷酸,只要该突变仍然允许杂交从而产生可检测的信号。
在本发明另一个实施方式中,可使用包含上述序列5’和/或3’端中有核苷酸缺失的多核苷酸。缺失优选从5’和/或3’端算起的1-5、5-10、10-15、15-20、20-25、25-30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-125、125-150、150-175或175-200位核苷酸,虽然缺失的程度天然地受限于所述序列的长度并能够使用该核苷酸来检测表达水平。
得自上述序列3’端的本发明其它多核苷酸包括引物和任选的探针序列,用于定量PCR。优选引物和探针是能扩增距离基因或表达的序列的聚腺苷酸信号或聚腺苷酸化位点不到约350、不到约300、不到约250、不到约200、不到约150、不到约100、或不到约50个核苷酸区域的因为和探针。
在本发明又一个实施方式中,本发明实施中可使用包括3’端的上述序列部分的多核苷酸。这种多核苷酸含有从所述序列3’端算起的至少或约50、至少或约100、至少或约150、至少或约200、至少或约250、至少或约300、至少或约350、或至少或约400个连续核苷酸。
本发明还包括利用多核苷酸检测乳腺细胞中的IL17BR、CHDH、QPRT或HOXB13表达。该多核苷酸可包括由上述SEQ ID NO序列与IL17BR、CHDH、QPRT或HOXB13序列中天然不存在的异源序列组合构成的较短多核苷酸。
作为非限制性的例子,本发明实施过程中可使用包含下述序列之一的多核苷酸。
SEQ ID NO:8:
GCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTCCCAAGTATAAAAATTATTAC
SEQ ID NO:9:
TGCCTAATTTCACTCTCAGAGTGAGGCAGGTAACTGGGGCTCCACTGGGTCACTCTGAGA
SEQ ID NO:10:
GATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCA
SEQ ID NO:8是AI240933序列的一部分,而SEQ ID NO:9是AJ272267(CHDHmRNA)序列的一部分。它们对应于图3中指出的两个“60mer”位置。SEQ ID NO:10是能够与本文所述某些HOXB13序列杂交的多核苷酸。
因此,可用由SEQ ID NO:8、9或10序列与一种或多种SEQ ID NO:8、9或10中通常不存在的异源序列组合构成的多核苷酸来实施本发明。或者,也可使用由SEQ ID NO:8、9或10序列与一种或多种SEQ ID NO:8、9或10中天然存在的序列组合构成的多核苷酸来实施本发明。
可使用包含天然来源或合成的SEQ ID NO:8或9序列的多核苷酸,来检测在对TAM或其它抗乳腺癌的“抗雌激素”药物治疗有反应的乳腺癌细胞中过度表达的核酸,或检测在对TAM或其它抗乳腺癌的“抗雌激素”药物治疗无反应的乳腺细胞中不过度表达的核酸。可使用包含天然来源或合成的SEQ ID NO:10序列的多核苷酸来检测在对TAM或其它抗乳腺癌的“抗雌激素”药物治疗有反应的乳腺癌细胞中低表达的核酸,或检测在对TAM或其它抗乳腺癌的“抗雌激素”药物治疗无反应的乳腺细胞中检测不低表达的核酸。
可用于SEQ ID NO:8和9所示多核苷酸中的其它序列如下所示,它们与本文所述IL17BR序列的一部分互补:
SEQ ID NO:11:TCCAATCGTTAGTTAATGCTACATTAGTT
可用于SEQ ID NO:10上述多核苷酸中的其它序列如下所示,它们与本文所述IL17BR序列的一部分互补:
SEQ ID NO:12:CAATTCATGAAAGCGGTTTCTAAAG
此外,可利用所述序列的引物作PCR,扩增CHDH序列的各部分,以测定其表达水平。例如,可使用含有以下序列的引物来扩增AI240933序列的一部分。
前向引物(SEQ ID NO:13):TGAAGTGTTTTTGCCTGGATCA
反向引物(SEQ ID NO:14):CACCACTTTGTTATGAAGACCTTACAA
在本发明的一些实施方式中,可用于本领域已知的定量RT-PCR方法中的引物任选包括能与双链核酸(例如Sybr GreenTM)结合的标记的或可检测的探针,或诸如“TaqMan”探针等特异性探针。在一个实施方式中,这种探针可包含序列AGTAAGAATGTCTTAAGAAGAGG(SEQ ID NO:15),用于测定AI240933的表达。
此外,本发明实施过程中可使用含有其它序列,特别是含SEQ ID NO:8-15的天然核酸分子中存在的独特序列的多核苷酸。
其它可用于实施本发明的多核苷酸包括与上述多核苷酸具有充分同源性的多核苷酸,通过杂交技术来检测表达。这种多核苷酸优选与本文所述IL17BR、CHDH、QPRT或HOXB13的序列相同约或95%、约或96%、约或97%、约或98%、或约或99%。相同性可用如上所述的BLAST算法测定。在约30-50%v/v的甲酰胺、0.01-0.15M的盐条件下;在约0.01-0.15M的和约55-65℃或更高温度的严谨洗涤条件下,或相当的条件下与本发明多核苷酸杂交的其它多核苷酸也可用于实施本发明。
在本发明的另一个实施方式中,提供了包含人IL17BR、CHDH、QPRT或HOXB13序列的单链或双链的单链核酸分子群作为探针,这样所述核酸分子群的至少一部分可与从乳腺癌细胞的RNA定量扩增得到单链或双链核酸分子杂交。此群可以只是人IL17BR、CHDH、QPRT或HOXB13序列的反义链,这样乳腺癌细胞的或从乳腺癌细胞扩增的反义链分子可与所述群的一部分杂交。就IL17BR或CHDH而言,与包含正常乳腺细胞的互补IL17BR或CHDH序列的核酸分子表达(或扩增)的量相比,该群优选包含充分过量的所述单链或双链的人IL17BR或CHDH序列。这种过量条件可使乳腺癌细胞中核酸的表达量增加至易于检测。
或者,单链分子群(的量)等于或多于所有从乳腺癌细胞扩增的单链或双链核酸分子,从而此核酸分子群足以与所有的单链或双链杂交。考虑的优选细胞是ER+或他莫昔芬或一种或多种其它抗乳腺癌的“抗雌激素”药物治疗的乳腺癌患者的细胞。当然,所述单链分子可以包括含有双链核酸分子或本文所述多核苷酸的IL17BR、CHDH、QPRT或HOXB13序列的变性形式。
所述核酸分子群也能与包含的核酸分子水平至少是正常乳腺细胞核酸分子两倍的IL17BR或CHDH序列杂交。在上述实施方式中,所述核酸分子可以是从乳腺癌细胞定量扩增得到的核酸分子,因而可反映所述细胞表达的量。
优选将该核酸的群固定在固相支持物上,任选以固定在微阵列位置上的形式。一部分核酸分子群优先与RNA定量扩增的不正常或异常乳腺细胞的核酸分子杂交。扩增的RNA是乳腺癌细胞产生的RNA,只要所用的扩增方法是含IL17BR、CHDH、QPRT或HOXB13的序列的定量扩增方法。
在本发明另一个实施方式中,可检测DNA表达的状态。检测甲基化、缺失或失活的QPRT或HOXB13 DNA,用作不正常乳腺细胞表达降低的指标。这不难通过本领域已知的PCR方法进行。也可测定QPRT或HOXB13启动子区的状态作为QPRT或HOXB13序列表达降低的指标。非限制性的例子是启动子区中序列的甲基化状态。
相反,扩增后DNA序列的检测可用作不正常乳腺细胞中表达增加的指标。这不难用本领域已知的PCR、荧光原位杂交(FISH)和染色体原位杂交(CISH)方法进行。
利用核酸的试验来检测表达的优选实施方式是将一种或多种本文所鉴定的序列固定在固相支持物上,包括但不限于,本领域已知的阵列、或小珠技术等的固相基质。或者,也可用本领域已知的溶液表达试验。固定的序列可以是本文所述的多核苷酸的形式,例如能够与该序列对应的DNA或RNA杂交的多核苷酸。
可利用该固定的多核苷酸来测定乳腺癌细胞制备的核酸样品的状态,任选地检测所述细胞ER状态方法的一部分。不是限制本发明,这类细胞可以是疑患有、或很可能患有乳腺癌的患者的细胞。固定的多核苷酸只需要足以与得自样品的对应的核酸分子特异性杂交(且不能与其它核酸分子产生可检测的或明显的杂交)。
在本发明又一个实施方式中,可利用两种所述基因的表达比率来预测对TAM或其它SERM治疗的反应。优选利用在与同一表型相关上表达模式相反的两种基因,例如低表达基因与过度表达基因的比率。非限制性的例子包括HOXB13与IL17BR的比率或QPRT与CHDH的比率。本发明此方面内容部分是根据以下观察:这种比率与TAM治疗结局的相关性比与任一种基因表达水平的相关性更强。例如,观察到HOXB13与IL17BR比率的分类准确度为77%。
作为非限制性的例子,可利用Q-PCR检测到的基因表达水平的Ct值所产生比率,来预测对用一种或多种抗乳腺癌的“抗雌激素”药物治疗的反应。
本发明其它实施方式
在仅分析一种或少数几种基因的实施方式中,使用合适的引物优先扩增得自乳腺癌细胞样品的核酸,使得只扩增待分析的基因以减少乳腺细胞所表达的其它基因产生的背景污染信号。或者,当分析多种基因或使用很少的细胞(或一个细胞)时,可在与固定的多核苷酸杂交之前全部扩增得自样品的核酸。当然,可无需扩增,而用本领域已知方法直接标记和使用RNA、或其cDNA对应物。
也可通过检测蛋白质水平或活性的存在、增加或降低来检测序列表达。检测可通过本领域已知并认为合适的免疫组织化学(IHC)、体液(体液例如但不限于血液中所发现的IL17BR、CHDH、QPRT或HOXB13,或其片段)、抗体(如果存在,包括抗蛋白质的自身抗体)、脱落细胞(来自癌)、质谱和成形(如果可获得,包括采用标记配体)方法来检测蛋白质。当癌细胞来源未知时,抗体和成形方法还适用于在确定用非侵入性方法(例如导管灌洗或细针抽吸)获得的细胞为癌细胞之后给肿瘤定位。标记的抗体或配基可用于定位患者体内肿瘤。
用于该检测方法的抗体包括多克隆抗体和单克隆抗体,其中,多克隆抗体任选分离自可获得的天然来源,单克隆抗体包括用IL17BR、CHDH、QPRT或HOXB13多肽(或其片段)作为抗原制备的抗体。这些抗体及其片段(包括但不限于Fab片段)凭借其能够特异性结合IL17BR、CHDH、QPRT或HOXB13多肽而非其它多肽而产生可检测信号,可用于检测或诊断不正常的或癌性乳腺细胞。本发明实施过程中也可使用具有相同能力的重组、合成和杂交抗体。通过用IL17BR、CHDH、QPRT或HOXB13多肽(或其片段)免疫接种不难产生这类抗体,多克隆血清也可用于实施本发明。
抗体检测方法是本领域熟知的,非限制性的例子包括夹心法和ELISA试验以及蛋白质印迹和流式细胞术试验。这些方法所分析的样品包括含有IL17BR、CHDH、QPRT或HOXB13多肽或其片段的样品。非限制性的例子包括含有乳腺细胞和细胞成分的任何样品,以及含有上述多肽的体液(非限制性的例子包括血液、血清、唾液、淋巴液、以及粘膜液和其它细胞分泌物)。
可以许多不同的方式应用上述试验实施方式,根据乳腺癌患者细胞样品中的基因表达情况来鉴定或检测对TAM或其它抗乳腺癌的“抗雌激素”药物治疗的反应。在一些病例中,这将体现为对已经完成作为初步筛选的乳房造影或体检的患者的第二次筛选。如果初次筛选为阳性,则经后续的细针吸取活组织、导管灌洗、细针抽吸或其它类似的最小侵入性方法提供样品,用于上述试验实施方式同时或之后检测ER状态。本发明尤其适合与非侵入性方法例如导管灌洗或细针抽吸联用,来制备乳腺细胞样品。
本发明提供了一套更客观的标准,以不同基因组的基因表达概貌图形式,区分(或描绘)乳腺癌结局。在本发明特别优选的实施方式中,利用这些试验来区分他莫昔芬或其它抗乳腺癌的“抗雌激素”药物治疗后好和差的结局。在约10、约20、约30、约40、约50、约60、约70、约80、约90、约100或约150个月后进行比较区分不同结局。
好和差存活结局可通过相互比较而相对地确定,“好”的结局可视作手术介入切除乳腺癌肿瘤后,大约60个月之后存活率优于50%。“好”的结局也可以是手术介入后,大约60个月之后存活率优于约60%、约70%、约80%或约90%。“差”的结局可视作手术介入切除乳腺癌肿瘤后,大约60个月之后存活率50%或更低。“差”的结局也可以是手术介入后,大约40个月之后存活率约60%或更低,或大约20个月之后存活率约80%或更低。
在依据几个基因表达(进行预测)的本发明另一个实施方式中,乳腺癌细胞样品的分离和分析过程如下:
(1)对患者进行导管灌洗或其它非侵入性方法以获取样品。
(2)制备样品并将其涂覆在载玻片上。应注意,导管灌洗可导致上述细胞学检查见到的细胞聚集。
(3)病理学家或图像分析软件扫描样品,是否存在不典型细胞。
(4)如果观察到不典型细胞,则收集这些细胞(例如,通过显微解剖分离如LCM)。
(5)提取收集细胞的RNA。
(6)直接检测RNA或转化为cDNA或扩增后,检测IL17BR、CHDH、QPRT和/或HOXB13序列的表达。
利用本发明,有经验的内科医生可根据通过实施本发明所确定的预后开处方或不用TAM或其它抗乳腺癌的“抗雌激素”药物治疗。
上述讨论也可用于检查到有可触摸病损时,然后用细针抽吸或细针吸取活检乳腺细胞。平铺这些细胞,由病理学家或用可选择细胞的自动成像系统观察进行分析。
然而,本发明也可用于实体组织活检样品,包括储存作为FFPE的样品。例如,可收集和制备实体组织活检样品用于肉眼观察,然后测定本文所鉴定的一种或多种基因的表达以确定乳腺癌结局。作为另一个非限制性的例子,可收集和制备实体组织活检样品用于肉眼观察,然后测定IL17BR、CHDH、QPRT和/或HOXB13的表达。一个优选方法是利用与多核苷酸或蛋白质鉴定探针原位杂交,来分析所述基因的表达。
在另一个方法中,可用实体组织活检样品提取分子,然后分析一种或多种基因的表达。这可能不需要肉眼观察和只收集癌细胞或怀疑的癌细胞。当然可改进该方法,使得仅选择和收集阳性细胞用于提取要分析的分子。这需要肉眼观察和选择作为基因表达分析的前提。对于FFPE样品,获取细胞后如上所述提取RNA,扩增并检测。
在另一个可选的实施方式中,可利用本文所鉴定的序列作为简单PCR或阵列试验的一部分,通过使用非侵入性或最小侵入性取样方法获得的样品来测定对TAM或其它抗乳腺癌的“抗雌激素”药物治疗的反应。样品中序列表达的检测可采用能够分析所述序列以及其它序列(包括已知在正常和不正常乳腺细胞中表达水平不变的序列)的表达的一个微阵列,具有方便和改进准确度。
本发明的其它应用包括能够鉴定出对TAM或其它抗乳腺癌的“抗雌激素”药物治疗具有不同反应的乳腺癌细胞样品,用于进一步研究或试验。基于客观的基因/分子标准而提供了改进。
在根据多个基因在表达模式或概貌图中的表达(进行预测)的另一个本发明实施方式中,乳腺癌细胞样品的分离和分析过程如下:
(1)对患者进行导管灌洗或其它非侵入性方法以获取样品。
(2)制备样品并将其涂覆在载玻片上。应注意,导管灌洗可导致上述细胞学检查见到的细胞聚集。
(3)病理学家或图像分析软件扫描样品是否存在不不正常和/或不典型的乳腺癌细胞。
(4)如果观察到这种细胞,则收集这些细胞(例如,通过显微解剖分离如LCM分离)。
(5)提取收集细胞的RNA。
(6)纯化RNA、扩增和标记。
(7)在合适的杂交条件下,使标记的核酸与含有与一种或多种本文所鉴定的与区分乳腺癌聚集相关的基因全部或部分互补的多核苷酸的微阵列接触,然后加工和扫描以得到每个点强度模式(相对于细胞中一般基因表达的对照)的模式,测定细胞中这些基因的表达水平。
(8)通过与已知乳腺癌样品中与结局相关(相对于相同的对照)的基因表达模式作比较,分析该强度模式。
上述方法的一个具体实施例是初步筛选后进行导管灌洗,观察和收集分析不正常和/或不典型的细胞。与已知表达模式进行比较,例如可通过算法(例如但不限于最接近的类型分析、SVM、或神经网络)产生的模型,参考不同乳腺癌存活结局的基因表达数据,以鉴定与患者好或差的结局相关的细胞。
另一个实施例是将手术介入后从患者取得的乳腺肿瘤,任选将其全部或部分转化为FFPE样品然后从肿瘤分离和制备乳腺癌细胞,检测/鉴定不典型、不正常的细胞或癌细胞,所述细胞的分离按照上述步骤5-8。
或者,可收集样品进行正常细胞和癌细胞的分析。将这两种样品各自的基因表达模式相互比较,并根据参考数据组比较模型和正常细胞与各自的基因表达模式。该方法明显比只检测癌细胞的方法更有效,因为它利用了显著更多的正常细胞的信息和正常细胞和癌细胞之间的差异(样品和参考数据组)信息,根据样品中癌细胞的基因表达情况确定乳腺癌患者的结局。
本文所鉴定的基因还可根据样品中所鉴定基因的表达情况,来产生能够预测ER+乳腺细胞样品(患者)的乳腺癌存活和复发结局的模式。这种模式可用本文所述算法或本领域已知方法以及本领域认为等价的方法构建,利用本文所述基因(及其亚组)来鉴定乳腺癌结局。该模式提供了一种方法,可对样品的基因亚组表达概貌图和用于建立该模式的参考数据概貌图进行比较。该模式可对样品的概貌图与各参考概貌图或与根据该参考概貌图的模式确定的示意图进行比较。此外,样品概貌图的相对值可用于与该模式或参考概貌图进行比较。
在本发明一个优选的实施方式中,可任选用一个微阵列,分析同一患者乳腺细胞样品中用于产生该模式的基因表达概貌图以见到正常细胞和癌细胞。这提供了根据与正常样品表达概貌图的差异来鉴定存活和复发结局的有益方法。然后,将这些差异与也用于产生该模式的正常和各个癌性参考数据相互之间进行比较。
生产工艺
本发明的材料和方法适于制备按照熟知的方法生产的试剂盒。因此,本发明提供了装有用于检测所述序列表达的试剂(非限制性例子如本文所述的多核苷酸和/或抗体)的试剂盒。提供的这种试剂盒,任选含有所述鉴定试剂,和关于它们在本发明方法中如何使用的标签或说明书。这种试剂盒包括容器,每个容器装有一种或多种本发明中使用的各种试剂(通常为浓缩形式),例如包括,预制的微阵列、缓冲液、合适的核苷酸三磷酸(例如,dATP、dCTP、dGTP和dTTP;或rATP、rCTP、rGTP和UTP)、逆转录酶、DNA聚合酶、RNA聚合酶和一种或多种本发明的引物复合物(例如,连接于可与RNA聚合酶反应的启动子的合适长度的聚(T)或随机引物)。通常还包括一套说明书。
本发明方法也可全部或部分实现自动化。也可实施本发明的所有方面,它们基本上由所述基因的亚组构成,不包括与通过含细胞样品鉴定乳腺癌存活结局无关的物质。
现已总体上描述了本发明,通过参考以说明形式提供的以下实施例将更容易地理解本发明,除非另有说明,阐述这些实施例不意味着限制本发明。
实施例
                           实施例
                          一般方法
患者和肿瘤选择标准及试验设计
本研究的患者的标准为:1987-2000年期间在马萨诸塞州综合医院(Massachusetts综合医院,MGH)被诊断为ER阳性乳腺癌的女性患者,用标准乳房手术(改良的乳房根治术或肿块切除术)和放射治疗后,用全身性辅助他莫昔芬治疗5年;复发前患者没有接受过化学治疗。从MGH肿瘤登记处获取临床和随访数据。不存在错失的登记数据,并且对所有可获得的医疗记录进行第二级数据确认。
在马萨诸塞州综合医院,从冷冻和福尔马林固定的石蜡包埋(FFPE)组织储库中获得最初诊断时收集到的所有肿瘤标本。选择20%以上为肿瘤细胞的肿瘤样品,所有样品(肿瘤细胞比例)的中位数大于75%。评价每个样品的以下特征:肿瘤类型(导管或小叶性)、肿瘤大小、和Nottingham联合组织学级别。通过生物化学激素结合试验和/或免疫组织化学染色来测定雌激素和孕酮受体的表达,见(Long,A.A.等“高特异性原位杂交。方法和应用”(“High-specificity in-situhybridization.Methods and application.”) Diagn Mol Pathol 1,45-57(1992))所述;受体阳性分别定义为生物化学分析大于3fmol/mg肿瘤组织(Long等)和免疫组织化学试验大于1%核染色。
研究设计如下:选择60个冷冻乳腺癌标本组成的训练组,来鉴定对辅助性他莫昔芬治疗中可预测结局或反应性的基因的表达特征。就TNM分期和肿瘤分级将反应者的肿瘤与无反应者相匹配。在20个侵袭性乳腺肿瘤的独立组中用福尔马林固定的石蜡包埋(FFPE)组织样品,验证该训练组中所鉴定的不同基因表达。
LCM、RNA的分离和扩增
分离60个病例组内的每个冷冻肿瘤样品的8μm后全组织切片和用PixCell IIe LCM system(Arcturus,Mountain View,CA)激光捕获显微解剖分离获得的4000-5000个高度富含恶性上皮细胞群的RNA。分离20例试验组内每个肿瘤样品的四片8μm厚FFPE组织切片的RNA。根据生产商的说明书用RiboAmpTM试剂盒(冻干样品)或另一种用于FFPE样品的系统(ArcturusBioscience,Inc.,Mountain View,CA for RiboAmpTM),对分离得到的RNA进行一轮T7聚合酶体外转录。在5-[3-氨基烯丙基]尿苷5’-三磷酸(Sigma-Aldrich,St.Louis,MO)的存在下,通过第二轮基于T7的RNA体外转录,产生标记的cRNA。以相同的方式扩增通用的人RNA参照品(Universal Human Reference RNA,Stratagene,San Diego,CA)。然后将纯化的RNA与Cy5(试验样品)或Cy3(参照样品)染料(Amersham Biosciences)偶联。
微阵列分析
用喷墨(ink-jet)原位合成技术(Agilent Technologies,Palo Alto,CA),制造用户定制设计的22,000-基因寡核苷酸(60mer)微阵列。在65℃、1X杂交缓冲液(Agilent Technologies)中,共杂交Cy5标记的样品RNA和Cy3标记的参照RNA。37℃用0.1X SSC/0.005% Triton X-102洗涤载玻片。用Agilent的图像分析软件进行图像分析。用强度依赖性非线性回归标准化Cy5/Cy3粗比率。
将包含所有样品标准化Cy5/Cy3比率的数据矩阵每个基因中数位的中心。计算出所有样品每个基因的差异,选择多达25%的高差异基因(5,475)作进一步研究。用Dr.Richard Simon和Amy Peng开发的BRB ArrayTool(见网站linus.nci.nih.gov/BRB-ArrayTools.html)对差异性基因表达的显著性进行鉴定和置换检验。用GeneMaths软件(Applied-Maths,Belgium),利用余弦相关和完全连锁进行分级集簇分析。在开放源R统计学环境(见网站 www.r-project.org)中进行所有其它统计学过程(两样品t检验、受试者工作特性分析、多变量逻辑回归和存活分析)。用DeLong的方法(“比较两条或多条相关的受试者工作特性曲线下区域:一种非参数方法”“Comparing the areas under two or more correlatedrecerver operation characteristic curves:a nonparametric approach.” Biometrics 44,837-45(1988))进行ROC曲线显著性的统计学检验。从诊断日起计算无疾病存活(时间)。监察评分为第一次远处转移情况,和在最后一次随访时仍然无疾病的患者。通过Kaplan-Meier估计计算出存活曲线并用对数秩次(log rank)检验作比较。
实时定量PCR分析
对60例训练样品的59例(由于材料不充分删去一例)和20例验证样品进行实时PCR。简单地说,将2μg扩增的RNA转化为双链cDNA。每一例,三复孔中加入12ng cDNA,用ABI 7900HT(Applied Biosystems)进行实时PCR(Gelmini,S.等“采用荧光探针的定量聚合酶链反应同源性试验来测定c-erbB-2癌基因的扩增”(“Quantitative polymerase chain reaction-basedhomogeneous assay with fluorogenic probes to measure c-erbB-2 oncogeneamplification.”) Clin Chem 43,752-8(1997))。每个基因所用的PCR引物序列对和荧光MGB探针(5′到3′)分别如下所示:
HoxB13
TTCATCCTGACAGTGGCAATAATC,
CTAGATAGAAAATATGAGGCTAACGATCAT,
VIC-CGATAACCAGTACTAGCTG;
IL17BR
GCATTAACTAACGATTGGAAACTACATT,
GGAAGATGCTTTATTGTTGCATTATC,
VIC-ACAACTTCAAAGCTGTTTTA.
HOXB13在正常、DCIS和IDC样品中的相对表达水平的计算如下。首先,通过减去所有样品中的最高CT值(40)调整所有的CT值,然后,计算相对表达=1/2^CT。
原位杂交
使用购自Roche Applied Science的DIG RNA标记试剂盒(SP6/T7),按试剂盒中所提供的方法,制备地高辛(Dig)标记的RNA探针。在冷冻组织切片上进行原位杂交(Long等)。
表1:训练组的患者和肿瘤特征
  样品编号   肿瘤类型 大小 级别 淋巴结 ER PR 年龄 DFS 状态
  13896482897494206336628493561304141910931047103731925180687856104512051437150746982986812068433421218547112513686055968317   DDDDD/LDDDDDDDD/LD/LDDDDDDDDDDDDDDDDD/LDDDLDD   1.71.131.822.712122.512.61.543.51.63.51.62.52.71.73.711.234.13.434.51.52.62.62.2331.2   2222333123232222232322312332212222223   0/10/150/152/9ND0/116/110/262/200/141/81/140/180/41/130/92/193/160/161/121/192/220/400/190/90/130/1511/209/213/16ND0/18ND6/1833/380/171/10   PosPosPosPosPosPosPosPosPosPosPosPosPosPosPosNegPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPos   PosNDNDPosPosNDPosNegNDPosPosPosNegPosNDPosPosNDPosNegPosPosPosNDNDPosNegNegNDPosNDPosPosNDNDNDPos   80627561726179755857596670856762697373737167706669658476626274548270705371   941606313758202723242086851288344751691428812188897016113613056122102101291236311021385   0010111111000011000000000011111000111
  3748232806517631085136329587113431402602971260140551860763865577287812791370   DDDDDDDDDDLD/LDDDLDDDDD/LDD   122.24.71.84.72.13.542.5>2.00.90.83.515.51.2222.51.622   32332222332222322232222   0/150/60/1210/130/140/80/153/210/16ND18/281/131/160/14ND3/205/141/24ND0/180/90/12ND   PosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPosPos   NegPosNDNDPosPosPosPosNegPosNDNDPosPosPosNDPosPosPosPosNegPosPos   5751664863485652617963736658816876677368766873   476944137118101114118621434216979951561141481436913810261   11110101111100000001000
缩写:D导管;L小叶;D/L导管和小叶特征;pos阳性;neg阴性;ND未检测到;ER雌激素受体;PR孕酮受体;DFS无疾病存活(单位为月);状态=1复发;状态=0无疾病。
                            实施例2
                      差异性表达基因的鉴定
用上述22,000-基因的寡核苷酸微阵列进行基因表达模式分析。在最初的分析中,使用从取自最初活检组织的冷冻肿瘤组织切片分离的RNA。根据各个基因的总差异首先过滤所得的表达数据组,选择前5,475个高差异基因(75%)作进一步研究。利用这种减少的数据组,对每个基因进行比较他莫昔芬反应者和肺反应者的t检验,导致鉴定出P值为0.001的19个差异性表达基因(表2)。对于治疗结局随机置换患者类型和重复t检验程序2,000次,估计偶然选出这种有许多差异或更加差异性表达的基因的概率约为0.04。因此,该分析表明他莫昔芬反应者和无反应者原发性乳腺癌之间的基因表达存在着有统计学显著性的差异。
表2:在切片数据组中用t检验鉴定到的19个基因的特征
  参数的p值   反应者的平均值 无反应者的平均值 差异倍数的平均值 GB acc 说明
1 1.96E-05 0.759 1.317 0.576 AW006861   SCYA4|小型可诱导性细胞因子A4
  2   2.43E-05   1.31   0.704   1.861   AI240933   ESTs
3 8.08E-05 0.768 1.424 0.539 X59770   IL1R2|白细胞介素1受体,II型
4 9.57E-05 0.883 1.425 0.62 AB000520   APS|带有普列克底物蛋白同源性和src同源性2结构域的衔接蛋白
5 9.91E-05 1.704 0.659 2.586 AF208111   IL17BR|白细胞介素17B受体
  6   0.0001833   0.831   1.33   0.625   AI820604   ESTs
  7   0.0001935   0.853   1.459   0.585   AI087057 DOK2|停靠蛋白质2,56kD
  8   0.0001959   1.29   0.641   2.012   AJ272267   CHDH|胆碱脱氢酶
9 0.0002218 1.801 0.943 1.91 N30081   ESTs,稍稍类似于I38022假设蛋白[H.sapiens]
  10   0.0004234   1.055   2.443   0.432   AI700363   ESTs
11 0.0004357 0.451 1.57 0.287 AL117406   ABCC11|ATP-结合盒,亚家族C(CFTR/MRP),成员11
  12   0.0004372   1.12   3.702   0.303   BC007092   HOXB13|同源盒13
13 0.0005436 0.754 1.613 0.467 M92432   GUCY2D|鸟苷酸环化酶2D,膜(视网膜特异性)
14 0.0005859 1.315 0.578 2.275 AL050227   智人mRNA;cDNADKFZp586M0723(得自克隆DKFZp586M0723)
15 0.000635 1.382 0.576 2.399 AW613732   智人cDNA FLJ31137fis克隆IMR322001049
16 0.0008714 0.794 1.252 0.634 BC007783   SCYA3|小型可诱导性细胞因子A3
17 0.0008912 2.572 1.033 2.49 X81896   C11orf25|染色体11开放读码框25
18 0.0009108 0.939 1.913 0.491 BC004960 MGC10955|假设蛋白MGC10955
19 0.0009924 1.145 0.719 1.592 AK027250   智人cDNA:FLJ23597fis,克隆LNG15281
为精细化我们对肿瘤细胞和导致基质细胞污染的周围潜在差异性的分析,对每张组织切片内的肿瘤细胞进行激光捕获显微解剖分离(LCM)后,再次分析了同一组。利用与全组织切片数据组所用的相同的差异性基因过滤和t检验筛选,鉴定到9个差异性表达的基因序列,其P<0.001(表3)。
表3:LCM数据组中t-检验鉴定到9个基因的特征
参数的p值   反应者的平均值   无反应者的平均值   差异倍数的平均值 GB acc 说明
  1   2.67E-05   1.101   4.891   0.225   BC007092   HOXB13|同源盒B13
  2   0.0003393   1.045   2.607   0.401   AI700363   ESTs
3 0.0003736 0.64 1.414 0.453 NM 014298   QPRT|喹啉酸磷酸核糖酰转移酶(烟酸-核苷酸焦磷酸化酶(羧化))
4 0.0003777 1.642 0.694 2.366 AF208111   IL17BR|白细胞介素17B受体
5 0.0003895 0.631 1.651 0.382 AF033199   ZNF204|锌指蛋白204
6 0.0004524 1.97 0.576 3.42 AI688494   FLJ13189|假设蛋白FLJ13189
  7   0.0005329   1.178   0.694   1.697   AI240933   ESTs
8 0.0007403 0.99 1.671 0.592 AL157459   智人mRNA;cDNADKFZp434B0425(得自克隆DKFZp434B0425)
9 0.0007739 0.723 1.228 0.589 BC002480   FLJ13352|假设蛋白FLJ13352
鉴定到只有3个基因在LCM和全组织切片分析中都有差异性表达:同源盒基因HOXB13(两次鉴定为AI700363和BC007092)、白细胞介素17B受体IL17BR(AF208111)和电压门控性钙通道CACNA1D(AI240933)。HOXB13在他莫昔芬无反应者中有差异性过度表达,而IL17BR和CACNA1D在他莫昔芬反应者中过度表达。令人感兴趣的是,QPRT序列与HOXB13序列在反应者和无反应者中表达水平具有相似性。由于在两次独立的分析中,鉴定它们是与临床结局显著相关的肿瘤衍生标记,评价这些基因各自的自身或相互组合的用途。
为确定作为临床结局标志的HOXB13、IL17BR和CACNA1D表达的灵敏度和特异性,采用了受试者工作特性(ROC)分析(Pepe,M.S.“ROC曲线的解释和使用GLM程序推论”(“An interpretation for the ROC curve和inference usingGLM procedures.”) Biometrics 56,352-9(2000))。对来源于全组织切片的数据,IL17BR、HOXB13和CACNAID的曲线下面积(AUC)值为分别为0.79、0.67和0.81(参见表4和如1,上方部分)。
对显微解剖肿瘤细胞产生的数据的ROC分析得到这些基因的AUC值,分别为0.76、0.8和0.76(参见表4和图1,下方部分)。
表4:利用对IL17BR、CACNA1D和HOXB13表达的ROC分析预测他莫昔芬反应
  组织切片   LCM
  AUC   P值   AUC   P值
  IL17BRCACNA1DHOXB13ESR1PGRERBB2EGFR   0.790.810.670.550.630.690.56   1.58E-063.02E-080.0120.2770.0360.0040.200   0.760.760.790.630.630.640.61   2.73E-051.59E-059.94E-070.0380.0330.0270.068
AUC为曲线下面积;P值为AUC>0.5。
显著性的统计学检验表明,这些AUC值都显著大于0.5的随机预测临床结局零点模型的预期值。因此,这三种基因有可能用于预测辅助性他莫昔芬治疗的临床结局。作为比较,分析比较目前用于评价对他莫昔芬反应的可能性的标记。已知ER(基因符号ESR1)和孕酮受体(PR,基因符号PGR)的水平与他莫昔芬反应性呈正相关(见Fernandez,M.D.等,“定量原发性乳腺癌的雌二醇和孕酮受体值及预测对内分泌治疗的反应”(“Quantitative oestrogen and progesteronereceptor values in primary breast cancer and predictability of response to endocrinetherapy.”) Clin Oncol 9,245-50(1983);Ferno,M.等“与类固醇受体和S-相水平相关的辅助性他莫昔芬的2年或5年结果”(“Results of two or five years ofadjuvant tamoxifen correlated to steroid receptor and S-phase levels”)SouthSweden Breast Group和South-East Sweden Breast Cancer Group. Breast Cancer Res Treat 59,69-76(2000);Nardelli,G.B.等“在预测乳腺癌对内分泌疗法反应中雌激素和孕酮受体的状态(初步报告)”(“Estrogen and progesterone receptorsstatus in the prediction of response of breast cancer to endocrine therapy(preliminary report).”) Eur J Gynaecol Oncol 7,151-8(1986);和Osborne,C.K.等“乳腺癌治疗中雌激素和孕酮受体的值”(“The value of estrogen andprogesterone receptors in the treatment of Breast Cancer.”)U 46,2884-8(1980))。
此外,认为生长因子信号途径(EGFR,ERBB2)可负调节雌激素依赖性信号传导,因而导致丧失对他莫昔芬的反应性(见Dowsett,M.“HER-2的过度表达成为乳腺癌激素治疗的耐受机制”(“Overexpression of HER-2 as a resistancemechanism to hormonal therapy for Breast Cancer.”) Endocr Relat Cancer 8,191-5(2001))。这些基因的ROC分析证实其与临床结局的相关性,但AUC值的范围仅为0.55-0.69,达到PGR和ERBB2的统计学显著性(见表4)。
LCM数据组尤其相关,因为目前用免疫组织化学或荧光原位杂交测定的EGFR、ERBB2、ESR1和PGR为肿瘤细胞水平。作为各个临床结局的标志,HOXB13、IL17BR和CAC1D都优于ESR1、PGR、EGFR和ERBB2(见表4)。
                            实施例3
                 鉴定HOXB13∶IL17BR表达比率
如下所述,鉴定到HOXB13∶IL17BR表达比率可作为结局的有力组合性预测参考。由于HOXB13和IL17BR具有相反的表达模式,检测了HOXB13与IL17BR的表达比率以确定它是否提供了更佳的他莫昔芬反应性组合预测参数。确实,t检验和ROC分析都表明,在全组织切片和LCM数据组中,两-基因比率与治疗结局的相关性都要比任一单个基因更强(见表5)。HOXB13∶IL17BR的AUC值达到0.81(组织切片数据组)和0.84(LCM数据组)。将HOXB13与CACNA1D配对或一起分析所有三种标记都不能提供增加的预测能力。
表5.HOXB13∶IL17BR比率是治疗结局的更强预测参考
  t-检验   ROC
  t-统计   P值   AUC   P值
组织切片   IL17BRHOXB13HOXB13∶IL17BR   4.15-3.57-4.91   1.15E-041.03E-031.48E-05   0.790.670.81   1.58E-060.011.08E-07
LCM   IL17BRHOXB13HOXB13∶IL17BR   3.70-4.39-5.42   5.44E-048.00E-052.47E-06   0.760.790.84   2.73E-059.94E-074.40E-11
AUC为曲线下面积;P值为AUC>0.5。
将HOXB13/IL7BR比率与已确立的乳腺癌预后因素(例如患者年龄、肿瘤大小、级别和淋巴结状态)进行比较(见Fitzgibbons,P.L.等“乳腺癌的预后因素。美国病理学家学会共同声明1999.”(“Prognostic factors in breast cancer.Collegeof American Pathologists Consensus Statement 1999.”) Arch Pathol Lab Med 124,966-78(2000))。单变量逻辑回归分析表明,在此组中只有肿瘤大小有临界显著性(P=0.04);这并不意外,因为在患者选择过程中根据肿瘤大小、肿瘤级别和淋巴结状态紧密匹配反应组和无反应组。在他莫昔芬的已知正(ESR1和PGR)和负(ERBB2和EGFR)预测参数中,组织切片数据的ROC分析表明只有PGR和ERBB2是显著的(见表4)。因此,进行了包含HOXB13∶IL17BR比率的逻辑回归模型本身的比较或与肿瘤大小以及PGR和ERBB2表达水平组合的比较(见表6)。只有HOXB13∶IL17BR比率是有高度显著性的预测参数(P=0.0003),其差异比为10.2(95%CI 2.9-35.6)。在多变量模型中,HOXB13∶IL17BR比率是唯一有显著性的变量(P=0.002),其差异比为7.3(95%CI 2.1-26)。因此,HOXB13∶IL17BR的表达比率在辅助性他莫昔芬治疗中是治疗结局有力的独立预测参数。
表6.逻辑回归
  单变量模型
  预测参数   差异比   95% CI   P值
  HOXB13∶IL17BR   10.17   2.9-35.6   0.0003
  多变量模型
  预测参数   差异比   95% CI   P值
  肿瘤大小PGRERBB2HOXB13∶IL17BR   1.50.81.77.3   0.7-3.50.3-1.80.8-3.82.1-26.3   0.32890.56000.16200.0022
所有预测参数是连续变量。基因表达值得自微阵列测定。差异比是四分位数之间的差异比,根据预测参数较低的四分位数(0.25)与较高的四分位数(0.75)的差异;CI为可信区间。
                            实施例4
               HOXB13∶IL17BR表达比率的独立验证
对两-基因表达比率的复合微阵列特征降低得以采用更简单的检测策略,例如实时定量PCR(RT-QPCR)分析。利用得自60各训练病例中59例的冷冻组织切片,用RT-QPCR分析了HOXB13∶IL17BR的表达比率(图2,部分a)。RT-QPCR数据与冷冻肿瘤标本的微阵列数据高度一致(HOXB13的相关系数r=0.83,IL17BR的是0.93)。此外,PCR产生的HOXB13∶IL17BR比率(表示为ΔCT,其中CT是达到预定域值的PCR扩增轮次(例如,图2,部分a和b),ΔCT是HOXB13和IL17BR之间的CT差异)与微阵列的数据(r=0.83)和治疗结局高度相关(t检验P=0.0001,图2,部分c)。因此,对HOXB13与IL17BR表达比率的常规RT-QPCR分析看来与冷冻肿瘤组织微阵列的分析是等价的。
为在独立的患者组中验证HOXB13∶IL17BR表达比率的预测用途,对1991-2000期间、仅在MGH的20例额外的用辅助性他莫昔芬治疗并且可获得其医疗记录和石蜡包埋组织的妇女的ER-阳性早期原发性乳腺癌进行了鉴定。在20例记录中,有10例复发,复发时间中位数为5年,10例保持无疾病,随访时间中位数为9年(具体见表7)。
表7:验证组的患者和肿瘤特征
样品   肿瘤类型 大小 级别   淋巴结 ER PR 年龄 DFS 状态
  试验1   D   1.9   3   0/10   Pos   Pos   69   15   1
  试验2   D   1.7   3   0/19   Pos   Pos   61   117   1
  试验3   D   1.7   2   0/26   Pos   ND   65   18   1
  试验4   D   1.2   2   0/19   Pos   Pos   63   69   1
  试验5   D   1.7   2   2/2   Pos   Pos   60   52   1
  试验6   D   1.1   1   0/10   Pos   Pos   54   59   1
  试验7   D   >1.6   2   0/17   Pos   Neg   66   32   1
  试验8   L   2.6   1-2   0/14   Pos   Pos   58   67   1
  试验9   D   1.2   2   ND   Pos   Pos   93   58   1
  试验10   D   4   3   0/20   Pos   Pos   66   27   1
  Test11   D   1.1   2   0/19   Pos   Pos   64   97   0
  试验12   D   2.7   2   0/10   Pos   Pos   66   120   0
  试验13   D   0.9   1   0/22   Pos   Pos   66   123   0
  试验14   D   2.1   2   0/16   Pos   Pos   57   83   0
  试验15   D   0.8   1-2   0/8   Pos   Pos   74   80   0
  试验16   D   1   2   0/13   Pos   Pos   74   93   0
  试验17   D   1.6   2   0/29   Pos   Pos   66   121   0
  试验18   L   1.5   1-2   0/8   Pos   Pos   65   25   0
  试验19   D   1.5   3   0/16   Pos   Pos   60   108   0
  试验20*   L   4   1-2   0/19   Pos   Pos   60   108   0
缩写:与表1相同。*患者接受他莫昔芬2年。
从福尔马林固定石蜡包埋的(FFPE)全组织切片中提取RNA,线性扩增,并用作RT-QPCR分析的模板。与训练组的结果一致,独立患者组中的HOXB13∶IL17BR表达比率与临床结局高度相关(t基因P=0.035),较高的HOXB13表达(低ΔCT)与差结局相关(图2,部分d)。为检验HOXB13∶IL17BR比率的预测准确性,利用冷冻组织切片的RT-QPCR数据(n=59)来构建了逻辑回归模型。在该训练组中,此模型预测的治疗结局,总的准确度为76%(P=0.000065,95%可信区间63%-86%)。正和负预测值分别为78%和75%。将该模型应用于验证组中的20例独立患者,正确预测了20位患者中15位的治疗结局(总准确度为75%,P=0.04,95%可信区间51%-91%),正和负预测值分别为78%和73%。
在训练组和独立试验组中,此模型所预测的患者组的Kaplan-Meier分析导致显著不同的无疾病存活曲线(图2,部分e和f)。
60位患者组的切片样品和LCM样品比率的另一个代表性应用实施例见图8,部分B所示(分别由“切片”和“LCM”表示)。其中还显示了31个FFPE样品(表示为“FFPE”)的示例性应用。
                            实施例5
               鉴定作为CHDH表达结果的其它序列
由于AI240933序列与CACNA1D的编码链互补,产生的问题是在上述实施例2中是否要检测除CACNA1D外的序列表达。因此,进行序列的组合,结果鉴定到表达为CHDH一部分的已知序列的较大3’区(见图5和3)。采用能扩增横跨前面鉴定的CHDH序列和AI240933序列两部分的计算出的4283核苷酸区域的探针,通过PCR分析,证实了此较大序列的表达(见图4)。
图5中序列的组合导致鉴定到图6所示较大的序列毗连群。通过坯料对比该毗连群与小鼠的CHDH序列,提供了对该较大毗连群可能性的附加支持。
CHDH和CACNA1D序列之间的可能关系见图7所示。
                            实施例6
                OPRT∶CHDH表达比率的鉴定和用途
以类似于上述实施例3所述方式,鉴定QPRT∶CHDH表达比率可作为治疗结局有力组合性预测参数。由于QPRT和CHDH具有相反的表达模式,测定了QPRT与CHDH的表达比率以确定其是否能够作为他莫昔芬反应的组合性预测参数起作用。将此比率应用于60位患者组的切片样品和LCM样品所得结果见图8,部分A所示(分别表示为“切片”和“LCM)。图中还显示了31个FFPE样品(表示为“FFPE”)的示例性应用。
其它参考文献
Ma,X.J.等人乳腺癌进程的基因表达概貌图(Gene expression profiles ofhuman breast cancer progression)Proc Natl Acad Sci USA 100,5974-9(2003)。
Nicholson,R.I.等乳腺癌中表皮生长因子受体的表达:与对内分泌治疗反应的相关性(Epidermal growth factor receptor expression in breast cancer:association with response to endocrine therapy).Breast Cancer Res Treat 29,117-25(1994)。
无论曾经专门纳入或不纳入,本文所引用的所有参考文献,包括专利、专利申请和出版物全部被纳入本文作为参考。
现已全面描述了本发明,本领域技术人员懂得可在广泛范围的同等参数、浓度和条件内实施本发明,而不背离本发明的精神和范围且无需过多实验。虽然已结合具体实施方案描述了本发明,但应理解可对本发明作进一步修改。此专利申请应包括按照本发明原理对本发明作的任何变化、应用或改编,包括那些脱离本说明书内容的,如本发明所属领域内已知或常规实践的范围中和可应用于上述基本特征的变化和应用。
                            附录
鉴定为IL17BR集簇的序列
AW675096
CCGGCGATGTCGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCAGGAGCGCCGTACCCCGA
GAGCCGACCGTTCAATGTGGCTCTGAAACTGGGCCATCTCCAGAGTGGATGCTACAACAT
GATCTAATCCCGGGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACAACTAGTGTTGCA
ACAGGGGACTATTCAATTTTGATGAATGTAAGCTGGGTACTCCGGGCAGATGCCAGCATC
CGCTTGTTGAAGGCCACCAAGATTTGTGTGACGGGCAAAAGCAACTTCCAGTCCTACAGC
TGTGTGAGGTGCAATTACACAGAGGCCTTCCAGACTCAGACCAGACCCTCTGGTGGTAAA
TGGACATTTTCCTACATCGGCTTCCCTGTAGAGCTGAACACAGTCTATTTCATTGGGGCC
CATAATATTCCTAATGCAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATNTCACC
TCACCAGGCTGCCTAGACCACATAATGAAATATAAAAAAAAGTGTGTCAAGGCCGGAAGC
CTGTGGGATCCGAACATCACT
AW673932
TTTTTTTTTTTTTTTTTTTAAAAGTGGGTTCAGCTTGTTTATTCCCTACTTTTGTTATCT
TAAAAACAATGATTTTTTGCATGTAATAGAAGGTTTTTCACTTAAGATGCTATTGAGTGA
ATCAGTGAGGGGTTCTTAGAGTTAGTATTCATTAATTAAACATAGAATATTAGCTAAACA
GTTCTGGGTACACTGCAATGCATGGTCTATGGAAGACTAGATGTTTGGCTGAAGATGCTT
TATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGTAATTGATTTCTATGT
ATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTAATGCTACATTAGTT
AGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGC
TGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGG
BC000980
ggcccggcga tgtcgctcgt gctgctaagc ctggccgcgc tgtgcaggag cgccgtaccc
cgagagccga ccgttcaatg tggctctgaa actgggccat ctccagagtg gatgctacaa
catgatctaa tcccgggaga cttgagggac ctccgagtag aacctgttac aactagtgtt
gcaacagggg actattcaat tttgatgaat gtaagctggg tactccgggc agatgccagc
atccgcttgt tgaaggccac caagatttgt gtgacgggca aaagcaactt ccagtcctac
agctgtgtga ggtgcaatta cacagaggcc ttccagactc agaccagacc ctctggtggt
aaatggacat tttcctacat cggcttccct gtagagctga acacagtcta tttcattggg
gcccataata ttcctaatgc aaatatgaat gaagatggcc cttccatgtc tgtgaatttc
acctcaccag gctgcctaga ccacataatg aaatataaaa aaaagtgtgt caaggccgga
agcctgtggg atccgaacat cactgcttgt aagaagaatg aggagacagt agaagtgaac
ttcacaacca ctcccctggg aaacagatac atggctctta tccaacacag cactatcatc
gggttttctc aggtgtttga gccacaccag aagaaacaaa cgcgagcttc agtggtgatt
ccagtgactg gggatagtga aggtgctacg gtgcagctga ctccatattt tcctacttgt
ggcagcgact gcatccgaca taaaggaaca gttgtgctct gcccacaaac aggcgtccct
ttccctctgg ataacaacaa aagcaagccg ggaggctggc tgcctctcct cctgctgtct
ctgctggtgg ccacatgggt gctggtggca gggatctatc taatgtggag gcacgaaagg
atcaagaaga cttccttttc taccaccaca ctactgcccc ccattaaggt tcttgtggtt
tacccatctg aaatatgttt ccatcacaca atttgttact tcactgaatt tcttcaaaac
cattgcagaa gtgaggtcat ccttgaaaag tggcagaaaa agaaaatagc agagatgggt
ccagtgcagt ggcttgccac tcaaaagaag gcagcagaca aagtcgtctt ccttctttcc
aatgacgtca acagtgtgtg cgatggtacc tgtggcaaga gcgagggcag tcccagtgag
aactctcaag acctcttccc ccttgccttt aaccttttct gcagtgatct aagaagccag
attcatctgc acaaatacgt ggtggtctac tttagagaga ttgatacaaa agacgattac
aatgctctca gtgtctgccc caagtaccac ctcatgaagg atgccactgc tttctgtgca
gaacttctcc atgtcaagca gcaggtgtca gcaggaaaaa gatcacaagc ctgccacgat
ggctgctgct ccttgtagcc cacccatgag aagcaagaga ccttaaaggc ttcctatccc
accaattaca gggaaaaaac gtgtgatgat cctgaagctt actatgcagc ctacaaacag
ccttagtaat taaaacattt tataccaata aaattttcaa atattgctaa ctaatgtagc
attaactaac gattggaaac tacatttaca acttcaaagc tgttttatac atagaaatca
attacagttt taattgaaaa ctataaccat tttgataatg caacaataaa gcatcttcag
ccaaacatct agtcttccat agaccatgca ttgcagtgta cccagaactg tttagctaat
attctatgtt taattaatga atactaactc taagaacccc tcactgattc actcaatagc
atcttaagtg aaaaaccttc tattacatgc aaaaaatcat tgtttttaag ataacaaaag
tagggaataa acaagctgaa cccactttta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa
aa
BI602183
AGCGGAGCTGCGGGTGGCCTGGATCCCGCGCAGTGGCCCGGCGATGTCGCTCGTGCTGCT
AAGCCTGGCCACGCTGTGCAGGAGCGCCGTACCCCGAGAGCCGACCGTTCAATGTGGCTC
TGAAACTGTGGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAAAACAGTCTATTTCA
TTGGGGCCCATAATATTCCTAATGCAAATATGAATGAAGATGGCCCTTCCATGTCTGTGA
ATTTCACCTCACCAGGCTGCCTAGACCACATAATGAAATATAAAAAAAGTGTGTCAAGGC
CGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGAGGAGACAGTAGAAGT
GAACTTCACAACCACTCCCCTGGGAAACAGATACATGGCTCATCCAACACAGCACTATCA
TCGGGTTTTCTCAGGTGTTTGAGCCACACCAGAAGAAACAAACGCGAGCTTCAGTGGTGA
TTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCCATATTTTCCTACTT
GTGGCAGCGACTGCATCCGACATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGTCC
CTTTCCCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGCTG
TCTCTGCTGGTTGGCCACATTGGGTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACG
AAAGGATCCAGAAGACTTCCTTTTCTACCACAAACTACTGCCCCCATTAAGGTCCTGTGG
TTACCCATCTTGAAATATGTTCCTCACACAATTTGTTACTTCACTGAATTCTTCAAAACC
TG
BI458542
AGCGGAGCGTGCGGGTGGCCTGGATCCCGCGCAGTGGCCCGGCGATGTCGCTCGTGCTGC
TAAGCCTGGCCACGCTGTGCAGGAGCGCCGTACCCCGAGAGCCGACCGTTCAATGTGGCT
CTGAAACTGTGGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAAAACAGTCTATTTC
ATTGGGGCCCATAATATTCCTAATGCAAATATGAATGAAGATGGCCCTTCCATGTCTGTG
AATTTCACCTCACCAGGCTGCCTAGACCACATAATGAAATATAAAAAAAAGTGTGTCAAG
GCCGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGAGGAGACAGTAGAA
GTGAACTTCACAACCACTCCCCTGGGAAACAGATACATGGCTCATCCAACACAGCACTAT
CATCGGGTTTTCTCAGGTGTTTGAGCCACACCAGAAGAAACAAACGCGAGCTTCAGTGGT
GATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCCATATTTTCCTAC
TTGTGGCAGCGACTGCATCCGACATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGT
CCCTTTCCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGCT
GTCTCTGCTGGTGGNCACATTGGGTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACG
AAAGGATCAGAAGACTTCCTTTTCTACCACCACATACTGCCCCCCATTAAGGTTCTTGTG
GTTTACCC
BI823321
GGCGATGTCGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCAGGAGCGCCGTACCCCGAGA
GCCGACCGTTCAATGTGGCTCTGAAACTGGGCCATCTCCAGAGTGGATGCTACAACATGA
TCTAATCCCGGGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACAACTAGTGTTGCAAC
AGGGGACTATTCAATTTTGATGAATGTAAGCTGGGTACTCCGGGCAGATGCCAGCATCCG
CTTGTTGAAGGCCACCAAGATTTGTGTGACGGGCAAAAGCAACTTCCAGTCCTACAGCTG
TGTGAGGTGCAATTACACAGAGGCCTTCCAGACTCAGACCAGACCCTCTGGTGGTAAATG
GACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAACACAGTCTATTTCATTGGGGCCCA
TAATATTCCTAATGCAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCTC
ACCAGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAAGAATGAGGAGACAGTAG
AAGTGAACTTCACAACCACTCCCCTGGGAAACAGATACATGGCTCTTATCCAACACAGCA
CTATCATCGGGTTTCTCAGGTGTTTGAGCCACACCAGAAGAAACAAACGCGAGCTTCAGT
GGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCCATATTTTCC
TACTTGTGGCAGCGACTGCAATCCGACATAAAGGAACAGTTGTGCTCTGCCCACAAACAG
GCGTCCCTTTCCCTCTTGGATAGCAACAGAAGCAAGCCGGGAGGCTGGTGCCTCTTCTTC
TGGTGTCTCTGCTGGTGGCACATTGAGTGCTGGTGGCAGGATCCATCTAATGTGGAGGCC
CCAAAGGACCAGGAAAGACTTCCTTTATTAGCACCAAGTATTGCCC
AA514396
TGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGT
AATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTT
AATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTA
AGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATT
GGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCA
GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAAG
TTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGC
ATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATG
AATCTGGC
BF110326
TTTGTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAA
AACTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCG
TTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAA
TTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCT
GTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTTTCATGGGTGGGCTACAAGGA
GCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATG
GAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACT
GAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTG
CAGATGAATCTGGCTTCTTAGATCACTGC
BE466508
TGGCATGAGATGCTATATTGTTGCATTATCAAAATGGGTTTAGTCTTCAATTAACACTGT
AATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTGGTTTCCAATCGTCAGTT
AATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTA
AGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATT
GGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCA
GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAG
TTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGC
ATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATG
AATCTGGCTTCTTAGATCACTG
BF740045
GTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAAC
TGTAATTGATTTCTATGTATAAAACACGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTT
AGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATT
ACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGT
AATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGC
AGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGA
GAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGA
GAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTA
AW299271
TGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGT
AATTGATTTCTATGTATAAAACAGCGTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTT
AATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTA
AGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATT
GGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCA
GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAG
TTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGC
ATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATG
AATCTGGCTTCTTAGATCACTGCAGAAAAG
AA836217
TTTTTTTTTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGTTTTAATTGA
AAACTATAACCATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAACATCTAGTCTTC
CATAGACCATGCATTGCAGTGTACCCAGAACTGTTTAGCTAATATTCTATGTTTAATTAA
TGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATCTTAAGTGAAAAACC
TTCTATTACATGCAAAAAATCATTGTTTTTAAGATAACAAAAGTAGGGAATAAACAAGCT
GAACCCACTTTTACTGGACCAAATGATCTATTATATGTGTACCACTTGTATGATTTGGTA
TTTGCATAAGACCTTCCCTCTACAAACTAGATTCATATCTTGATTCTTGTACAGGTGCCT
TTTAACATGAACAACAAAATACCCACAAACTTGTCTACTTTTGCC
AI203628
TAGTAATTAAAACATTTTATACCAATAAAATTTTCAAATATTGCTAACTAATGTAGCATT
AACTAACGATTGGAAACTACATTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATT
ACAGTTTTAATTGAAAACTATAACCATTTTGATAATGCAACAATAAAGCATCTTCAGCCA
AACATCTAGTCTTCCATAGACCATGCATTGCAGTGTACCCAGAACTGTTTAGCTAATATT
CTATGTTTAATTAATGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATC
TTAAGTGAAAAACCTTCTATTACATGCAAAAAATCATTGTTTTTAAGATAACAAAAGTAG
GGAATAAACAAGCTGAACCCACTTTTACTGGACCAAATGATCTATTATATGTGTAACCAC
TTGTATGATTTGGTATTTGCATAAGACCTTCCCTCTACAAACTAGATTCATATCTTGATT
CTTGTACAGGTGCCTTTTAACATGAA
AI627783
TTTTTTTTTTTTTTTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACT
AAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAAT
TGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGC
AGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAA
GTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAG
CATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGAT
GAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAG
AGTTCTC
AI744263
TTAAAGTGGGTTCAGCTTGTTTATTCCCTACTTTTGTTATCTTAAAAACAATGATTTTTT
GCATGTAATAGAAGGTTTTTCACTTAAGATGCTATTGAGTGAATCAGTGAGGGGTTCTTA
GAGTTAGTATTCATTAATTAAACATAGAATATTAGCTAAACAGTTCTGGGTACACTGCAA
TGCATGGTCTATGGAAGACTAGATGTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAA
ATGGTTACAGTTTTCAATTAAAGCTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGT
TGTAAATGTAGTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTT
TATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGG
ATCATCACACGTTNTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTA
AI401622
AGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGT
AGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGGGATAGG
AAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCATCGTGGC
AGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAAGTTCTGCACAGA
AAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGT
CTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCTGGCTTC
TTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCTCACTGG
AI826949
TTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTG
TAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGT
TAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACT
AAGGCTGTTTGTAGGCTTGCATAGAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAAT
TGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGC
AGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAA
GTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAG
CATTGTAATCGTCT
BE047352
TTTTTTTTTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCT
GTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGG
GATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCAT
CGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAAGTTCTG
CACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGT
AATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCT
GGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAG
AI911549
TTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAAGCT
GTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAG
TTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTAC
TAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAA
TTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAG
CAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGA
AGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACA
BF194822
TTCTCTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAA
GCTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGT
TAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAAT
TACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTG
TAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAG
CAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGG
AGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGG
AI034244
TTTTTTTTTTTTTTTTACAACCTTGAAAGCTGTTTTATACATAGAAATCAATTACAGTTT
TAATTGAAAACTATAACCATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAACATCT
AGTCTTCCATAGACCATGCATTGCAGTGTACCCAGAACTGTTTAGCTAATATTCTATGTT
TAATTAATGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATCTTAAGTG
AAAAACCTTCTATTACATGCAAAAAATCATTGTTTTTAAGATAACAAAAGTAGGGAATAA
ACAAGCTGAACCCACTTTTACTGGACCAAATGATCTATTATATGTGTAACCACTTGTATG
ATTTGGATTTGCATAAGACCTTCCCTCTACAAACTAGATTCATATCTTGATTCT
AI033911
TTTTTTTTTTTTTTTTACAACTGCAAAGCTGTTTTATACATAGAAATCAATTACAGTTTT
AATTGAAAACTATAACCATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAACATCTA
GTCTTCCATAGACCATGCATTGCAGTGTACCCAGAACTGTTTAGCTAATATTCTATGTTT
AATTAATGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATCTTAAGTGA
AAAACCTTCTATTACATGCAAAAAATCATTGTTTTTAAGATAACAAAAGTAGGGAATAAA
CAAGCTGAACCCACTTTTACTGGACCAAATGATCTATTATATGTGTAACCACTTGTATGA
TTTGGTATTTGCATAAGACCTTCCCTCTACAAACTAGATTCATATCTTGATTCT
BF064177
TTTTTTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCT
GTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGG
GATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCAT
CGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAAGTTCTG
CACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGT
AATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCT
GGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCT
CACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATCGCACACACTGTTGACGTCATTGG
AAAG
AA847767
GGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGTA
ATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTA
ATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAA
GGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTG
GTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAG
CCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGT
TCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTA
AI538624
TTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAAGCTG
TAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGT
TAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACT
AAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAAT
TGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGC
AGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAA
GTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTAC
AI913613
TTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTG
TAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGT
TAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACT
AAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTNTTTCCCTGTAAT
TGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGC
AGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAA
GTTCTGCACAGAAAGCAGTGGCATCCTTCATG
AI942234
GTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAAC
TGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA
GTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA
CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTA
ATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCA
GCAGCCATCGTGGCAGCTTGGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGAAG
AAGTTCTGCACAGAAAGCAGTGGCAT
AI580483
GTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAAC
TGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA
GTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA
CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTA
ATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCA
GCAGCCATCGTGGCAGGCTTGGATCTTTTTCCTGCTGACACCTGCTGCTTGACATTGGAA
AGTTCTGCACAGAAAGCAGTGGCATC
AI831909
TTTTGGCTGATGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAAGC
TGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA
GTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA
CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTA
ATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCA
GCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAG
AAGTTCTGCACAGAAAGCAGTGGCAT
AI672344
GGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAAGCTGTA
ATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTA
ATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAA
GGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTG
GTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAG
CCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGT
TCTGCACAGAAAG
AW025192
GATTGGCTGTTTTATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAA
CTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTT
AGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATT
ACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGT
TATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGC
AGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGA
GAAGTTCTGCACAAAAAGCAGTGGCATCCTTCATGAGGTGGTA
AA677205
GCAATATTTTAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGCT
GCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGGCATAGGAAGCC
TTTAAGGTCTCTTGCTTCTCATGGTGTGGGCTACAAGGAGCAGCAGCCATCGTGGCAGGC
TTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCTGCACAGAAAGC
AGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGTCTTT
TGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCTGGCTTCTTAG
ATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCTCACTGGGACT
GCCCTCGCTCTTGCCACAGGTACCATCGCACACACTG
AA721647
TTTTTTTTTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGTTTTAATTGA
AAACTATAACCATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAACATCTAGTCTTC
CATAGACCATGCATTGCAGTGTACCCAGAACTGTTTAGCTAATATTCTATGTTTAATTAA
TGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATCTTAAGTGAAAAACC
TTCTATTACATGCAAAAAATCATTGTTTTTAAGATAACAAAAGTAGGGAATAAACAAGCT
GAACCCACTTTTACTGGACCAAATGATCTATTATATGTGTAACCACTTGTATGATTTGGT
ATTTG
BF115018
GTTTCGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAAC
TGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA
GTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA
CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTAAGGCCCATCACACGTTTTTTCCCTGTA
ATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTNTCATGGGTGGGCTACAAGGAGCA
GCAGCCATCGTGGCAGGCTTGNGATCTTTTTCCTGCTGGCCCCTGCTGCTTGACAT
W61238
NAAAGCACTGGCTGAAGGAAGCCAAGAGGATCACTGCTGCTCCTTTTTTCTAGAGGAAAT
GTTTGTCTACGTGGTAAGATATGACCTAGCCCTTTTAGGTAAGCGAACTGGTATGTTAGT
AACGTGTACAAAGTTTAGGTTCAGACCCCGGGAGTCTTGGGCACGTGGGTCTCGGGTCAC
TGGTTTTGACTTTAGGGCTTTGTTACAGATGTGTGACCAAGGGGAAAATGTGCATGACAA
CACTAGAGGTATGGGCGACACGANAACGAACGGGAAGTTTTGGCTGAAGTAGGAGTCTTG
GTGAGATTTTGCTCTGATGCATGGTGTGAACTTTCTGAGCCTCTTGTTTTTCCTCAAGCT
GACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGACATAAAGGAACAG
W61239
TAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGG
CTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGGGATAGGAAG
CCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCATCGTGGCAGG
CTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCTGCACAGAAAG
CAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGTCTT
TTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCTGGCTTCTTA
GATCACTGCAGAAAAGGTTAAAGGCAAGGGGGGA
AI032064
AGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGC
TGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGGCATAGGAAGC
CTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCATCGTGGCAGGC
TTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCTGCACAGAAAGC
AGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGTCTTT
TGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCTGGCTTCTTAG
ATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCTCACTGGGACT
GCCCTCGCTCTTGCCAC
AW236941
TTTTTTTTTTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGC
TGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTG
GGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCA
TCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCT
GCACAAAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTG
TAATCGTCTTTTGTATCAATC
AW236941
TTTTTTTTTTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGC
TGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTG
GGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCA
TCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCT
GCACAAAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTG
TAATCGTCTTTTGTATCAATC
BG057174
TTTTATACATAGAAATCAATTACAGCTTTAATTGAAAACTATAACCATTTTGATAATGCA
ACAATAAAGCATCTTCAGCCAAACATCTAGTCTTCCATAGACCATGCATTGCAGTGTACC
CAGAACTGTTTAGCTAATATTCTATGTTTAATTAATGAATACTAACTCTAAGAACCCCTC
ACTGATTCACTCAATAGCATCTTAAGTGAAAAACCTTCTATTACATGCAAAAAATCATTG
TTTTTAAGATAACAAAAGTAGGGAATAAACAAGCTGAACCCACTTTTACTGGACCAAATG
ATCTATTATATGTG
AW058532
GGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGTA
ATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTA
ATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAA
GGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCCTGTATGG
GTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCT
T98360
TNAGGAANGAGAAGAAGCGAGATNNANNTNNAGAAATANGTGGTGGCNTANTTTAGAGAG
ATTGATNCAAAAGCNGATTNCAATNNNCTCAGTGNCTNCCCAAGTNCCNCCTCATGAAGG
ATNCACTNCTTTCTGTGCAGACTNNNCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGAN
CACAAGCTCCNCGATGGCTGCTGCTCCTTGTAGCCCNCCATGAGAAGCAAGAGNCTTAAA
GGCTTCCTATCCCACCAATTACAGGGAAAAACGTGTGATGACCTGAGCTTACTATGCAGC
CTACAANCAGCCTTAGTAATTAAACCNTTTATT
T98361
NANNATGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAAGCTG
TAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGT
TAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGNATAAAATGTTTTAATTACT
AAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTNCCCTGTAAT
TGGGTGGGGATAGGGAAGCCCTTTAAGGGTCTCTTGCTTCTCATGGGGTGGGGCCTACNA
AGGGAGCAGCCAGCCCATCGTGGCCAGGGCCTTGTGGANCCTTTTTCCCTGCCTGGACAC
CCTGCCTGCCTTGGACCATGGGGAGGAAGGTTCTGGCACCAGGAAAGCCAGGTGGCCCAT
CCCTTCCATGAGGGTGGGGTACTTNGGGGGGCCAGGACCACTGAGGNGCCATTGGTAATC
CGTCCTTTTNGTATCCAATCCCCTCCTAAGGTAGGNCCCCCC
AI470845
TTTTGTGGGTTCAGCTTGTTTATTCCCTACTTTTGTTATCTTAAAAACAATGATTTTTTG
CATGTAATAGAAGGTTTTTCACTTAAGATGCTATTGAGTGAATCAGTGAGGGGTTCTTAG
AGTTAGTATTCATTAATTAAACATAGAATATTAGCTAAACAGTTCTGGGTACACTGCAAT
GCATGGTCTATGGAAGACTAGATGTTTGGCTGAAGATGCTTTTATTGTTGCATTATCAAN
ATGGTTTATAGTTTTCAATTAAAACTGTAATTGATTT
AI497731
GGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGTA
ATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTA
ATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAA
GGCTGTTTGTAGGCTGCATAGTAAGCTTAANGATCATACNCACGTTTTTCCCTGAATTTG
GTGGGATAANGAAGCCTTTAAAGGT
T96629
TTGAAAATTTTATTGGNATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGT
AAGCTTCAGGANCATCACACGTTTTTTCCCTGTAATTGGTGGCATAGGAAGCCTTTAAGG
TCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATC
TTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCTGCACAGAAAGCAGTGGCAT
CCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGTCTTTTGTATCAA
TCTCTCTAAAGTAGACCACCACCGTNTTTGTGCAGATGGANTCTGGCTTC
T96740
AGGCACTATCATCGGGTTTTCTCAGGTGTTTGAGCCACACCAGAAGAAACAAACGCGAGC
TTCAGTGGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCCATA
TTTTCCTACTTGTGGCAGCGACTGCATCCGACATAAAGGAACAGTTGTGCTCTGCCCACA
AACAGGCGTCCCTTTCCCTCTGGATAACAACAAAAGCAAGCCGGGANGGNCTGNCCTCTC
CTCCTGCTGTCTCTGCTGGTGGCCACATGGGTGCTGGTGGCAGGGATCTATCTAATGTGG
AGGCACGAAAGGATCAAGAAGACTTCCTTTTCTAACCACCACATTACTGCCCCCCATTTA
AGGTTCTTGTGGTTTTACCCATCTGGAAATATGTTTTCCCTTCACACATTTGTTTATTTC
ATTGATTTNTTTCAAAACCTTGGCAGGAGTTT
H25975
GGGTCCAGTGCAGTGGCTTGCNTGCAGAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTCT
TTCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAG
TGAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAG
CCAGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGA
TTACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTG
TGCAGAACTTCTCCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGATTCACAAGCCTGCC
ACGATGGCTGCTTGCTTCCTTTGTAGCCCACCCATGAGGAAGNCAAGAGACCTTNAAAGG
GTTCCTTTTCCCATCANTTTACAGGGGANAAAACGTGTGATGATC
H25941
TTTTGTTTGGCTNATNTNNTTCTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATT
AAAACTGTAATTGATTNCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAAT
CGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAANGTTTT
AATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTCCC
CTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTNGCTTCTCATGGGTGGGCTACAAG
GAGCAGCAGCCATCGTGGCAGGCTTGTGANCTTTTNCCTGCTGACACCTGCTGCTTGACA
TGGGAGAAGTTCTGCACAGAAAGGCAGTGGGCATCCTTCATGAGGTGGGTACTTGGGGGN
CAGACACTGAGGAGCATTGT
BE539514
ACTCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTCTTTCCAATGACGTCAACAGTGTG
TGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAGTGAGAACTCTCAAGACCTCTTC
CCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGCCAGATTCATCTGCACAAATAC
GTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGATTACAGTGCTCTCAGTGTCTGC
CCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGTGCAGAACTTCTCCATGTCAAG
CAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCCACGATGGCCGCTGCTCCTTGTAG
CCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCTATCCCACCAATTACAGGGAAAAA
ACGTGTGATGATCCTGAAGCTTACTATGCAGCCTACAAACAGCCTTAGTAATTAAAACAT
TTTATACCAATAAAATTTTCAAATATGCTAACTAATGTAGCATTAACTAACGATTGGAAA
CTACATTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGCTTTAATTGAAA
ACTGTAACCATTTTGATAATGCAACAATAAAGCATCTTCAG
BX282554
GTCCAGTGCAGTGGCTTGCCACTCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTCTTT
CCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAGTG
AGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGCC
AGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGATT
ACAGTGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGTG
CAGAACTTCTCCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCCACG
ATGGCCGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCTATC
CCACCAATTACAGGGGAAAAAACGTGTGATGATCCTGAAGCTTACTAT
R74038
TATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGTAATTGATTTCTATGT
ATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTAATGCTACATTAGTT
AGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGC
TGCATAGTAAGCTTCAGGATCATCACACGTTTTTNCCCTGTAATTGGGTGGGGATAGGGA
AGCCTTTAAGGTCTCTTGCTTCTCATGGGGTGGGGCTACAAGGGAGGCAGGCAGCCATCG
TGGGCAGGGCTTGTGATCTTTTTCCCTGCTGACACCTGCTGCTTGACATGGGGGGAAGGT
TCTGGCACAGAAAGCAGTGGGCATCCTTCATGAGGGTGGTACTTGGGGGGCAGACACTGA
GGAGGCNTTGTAAATCGNCTTTTTNGTATCCAANCTCTNCTAAAGTAGGGNCCACCNCGT
TTTTTNTTGCAGGTGGATNCGGGGCTN
R74129
GGGTCCAGTGCAGTGGCTTGCNTNCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTCTT
TCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAGT
GAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGC
CAGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGAT
TACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGT
GCAGAACTTCTCCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCCAC
GATNGCTGCTGCTCCTTGTAGNCCACCCATGAGAAGCAAGTGACCTTTAAAGGNTTTCCT
ATTNCCACCNATTTACAGGG
BG433769
GACTAGATGTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCA
ATTAAAACTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCC
AATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGT
TTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTT
TCCCTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTAC
AAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTG
ACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAG
ACACTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTAT
TTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAG
AGGTCTTGAGAGTTCTCACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATCGCACACA
CTGTTGACGTCATTGGAAAAGAAGGAAGAC
BG530489
GAGTTCTCACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATCGCACACACTGTTGACG
TCATTGGAAAGAAGGAAGACGACCTTGTCTGCTACCTTCTTTTGAGTGGCAAGCCACTGC
ACTGGACCCATCTCTGCTATTTTCTTTTTCTGCCACTTTTCAAGGATGACCTCACTTCTG
CAATGGTTTTGAAGAAATTCAGTGAAGTAACAAATTGTGTGATGGAAACATATTTCAGAT
GGGTAAACCACAAGAACCTTAATGGGGGGCAGTAGTGTGGTGGTAGAAAAGGAAGTCTTC
TTGATCCTTTCTGTGAGAGGAGAAAAGCATTTGTTATCTGTGAATAGCAAACAGCAGGCT
TTCACTCTGTAAACCATCCCTGACAAATGATCCCTTGCTAGAGAATGTCAGCTGAGCACC
AAGGGCCTTGTTAGTGACAGCAAGGAAAAACATCCTGATGTTCCTTTTGAACACATCACC
TGAAACACACTGATGCTTAAACCTTAACTTTTTTTTTTTGGGGGACATAGTCTCACTCTG
TCGCCCAGGCTGGAGTGCGTGGGAGAGGACCTCGGAAAGACTGGCAAGCATCCGCATACA
AGGGAGTAACAGCACAATACTCCGTGAACTTCGGAGCCCTCCAAAGGAATACTCAAGGGC
GGGTAAAGGATGGCAAGGGTCGACGGAGAGCCCACGAGGAGAGCGGAAGGTAGAGAGGAG
ACAAGCATAAGACGCGAGAGGAACTCCAAGGCGGGGCCAAAGAGAGAAACCACGGTCACC
AACAGAAG
AA007528
AGAAGCCAGATTCATCTGCACAAATACGTGGTGNTCTACTTTAGAGAGATTGATACAAAA
GACGATTACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCT
TTCTGTGCAGAACTTCTCCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGATCACAAGCC
TGCCACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCT
TCCTATCCCACCAATTACAGGGNAAAAACNGTAGTGATNATCCCTGACAGCTTACTATGC
CAGCCNT
AA007529
TTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATCGGTTACAGTTTTCAATTAAAGCT
GTAATTNGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA
GTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA
CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTA
ATTGGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATTGGGTGGGCTACAAGGAG
CAGCAGCCATCCGTNGGCAAGGCTTTGTGGATNCT
BI260259
GGAAGAGAAAGATCGTCCAGAGGTTCCATCGCACACACTGTATGACGTCATTGGAAATGA
AGGAAGACGACTTTGTCTGCTGGCTTCTTGTGAGTGGCAAGCCACTGCAGTGGACCCATC
TCTGCTATTTTCTTTATTCTGCCACTTTTCAAGGATGACCTCACTTCTGCAATGGTTTTG
AAGAAAGTTCAGTGAAGTAACAAATTGTGTGATGGAAACATATTTCAGATGGGTAAACCA
CAAGAACCTTAATGGGGGGCAGTAGTGTGGTGGTAGAAAAGGAAGTCTTCTTGATCCTTT
CTGTGAGAGGAGAAAAGCATTAGTTATCTGTGAACAGCAAACAGCAGGCATTTCACATCT
GTAAACCATCCCTGACAAATGATCCCTTGCTAGAGAATGTCAGCTGAGCACCAAGGGGCC
TTGTTAGTGACAGCAAGGACAAAACATCCTGATGTTCCTTTTGAACACATCAGCTGAAAC
ACACTGATGCTCTAAACCGTTAACTATTTATTAATGGGGGAACATAGGTCTCAACTCATG
TACGACCAGGCTGGAGTGCAGTGGGGTTGAACATCGACAGACATAGCAAACCACCGATCA
CTAGGGAAACAACGCACAGAACTCCAGACTTAAAACACC
AA287951
ATTCGGCACCTGGGGGGCAGACACTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTC
TAAAGTAGACCACCACGTATTTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAA
GGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCTCACTGGGACTGCCCTCGCTCTTGC
CACAGGTACCATCGCACACACTGTTGACGTCATTGGAAAGAAGGAAGACGACTTTGTCTG
CTGCCTTCTTTTGAGTGGCAAGCCACTGCACTGGACCCATCTCTGCTATTTTCTTTTTCT
GCCACTTTTCAAGGATGACCTCACTTCTGCAATGGTTTTGAAGAAATTCAGTGAAGTAAC
AAATNTGTGTGATGGAAACATATTTCAGATGGGTAAACCACAAGAACCTTAATGGGGGGC
AGTAGTGTGGTGGTAGAAAAGGAAGTCTTCTTGATCCTTTCTGTGAGAGGAGAAAGC
AA287911
TTTTGATGGTCCACTTCCATTTAATGAATTAGTAAATATCTTTTCTCATGATTTTAATTA
CATTTTTTTCTCTAGCTTACTTTATTATAATACAGCACATAATACACCTAACATGCAAAA
TATGTGTTAATTGGCTGTTTATGTTATTGGTAAGACTTCCAGTCAACAGTAGGCTATTAG
AAGTTAAGTTGTGGGAAAATCAAAGGTTATAGGAGATTTTCAACTGCATGCAGGGCCGGT
GCCCTCCCCACTGTGTTGTTCAAGGGTCAGCTGTACTCTCTAAGGGCTTTGCTAACTTCA
AAACATGGAGTATTTGAATACAGAAACCAGAGCATTTACATACTCAGCTCAAGGCAGAGC
TATTAAAAAAACTCCTCTTCTCCATATGTAGGAAAGGAAATACAAATGCATCCTTTGAGT
CATTTGTGATGT
T97852
AACAGTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAACAAAAGCAA
GCCGGGANGNCTGNCGCTCTCCTCCTGCTGTCTCTGCTGGTGGCCACATGGGTGCTGGTN
GCAGGGATCTATCTAATGTNGAGGCACGAAAGGGATCAAGAGGACTTCCTTTTCTACCAC
CACACTACTGCCCCCCATTAAGGTTCTTGTNGGTTTACCCATCTGGAAATATGTTTCCAT
CACACAATTTGTTACTTCACTGGAATTTCTTCAAAACCATTGGCAGGANGTGAGGGTCAT
CCTTGGAAAAGTGGGC
T97745
CCTCACTTCTGCAATGGTTTTGAAGAAATTCAGTGAAGTAACAAATTGTGTGATGGAAAC
ATATTTCAGATGGGTAAACCACAAGAACCTTAATGGGGGGCAGTAGTGTGGTGGTAGAAA
AGGAAGTCTTCTTGATCCTTTCGTGCCTCCACATTAGATAGATCCCTGCCACCAGCACCC
ATGTGGCCACCAGCAGAGACAGCAGGAGGAGAGGCAGCCAGCCTCCCGGCTTTGCTTTTG
TTGTTATCCAGAGGGGAAAGGGGACGCCTGTTTNTGGGGCAGAGCACAACTGTTTCCCTC
GTGCCCGAATTCTTTGGGCCTTCGAGGGGCCAAATTTCCCTATTAGGTGAGGTCGTATTT
TAAATTTCGGTAATTCATGGTCATAGGCTTGTTTTTCCCCG
N40294
GTTTCAACACAATTTTGGATCAGCTGCCTGTTTGCAAAAACATAATATATTTCTGTTAAA
CAGTTCTTCACCTAACAGCATATTGCTCTTATAACTGGTAGAGCTGTTTCAAAGGAAGTT
GGTTTCTGGTCCAAGTTTTGACCTAAACCATGTCCATCTTCTATTACCAGCACTTACAAG
CACTGTGAAAACTGATCATGACAAATAAGTAAAATTTGCTACATTAAACATATTGCCTCA
GCCATTACTAAGCGTCCACTTGTAAAGCTGGACACAGTTTTTACTTTATGCTTCATTTTG
ATTTTTTATCCGTAAGACATAAATTAGAAGGCATGAGGTGGCCCTTTAAGGATAATCTGC
AAATATACACATTTTAAATAGTCATCCATCTGGAAATCGNTCCACCATTCCAGGGGAAGG
ATTCCAGGTATTGGTGCTGTGGTGGAAATAAAGCATTCCCCNGGGAAAAAAACCATTTTA
TGNCTAAATAATTACCACCATTAACCTCNTGGGGTT
AA809841
GAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATCTTAAGTGAAAAACCT
TCTATTACATGCAAAAAATCATTGTTTTTAAGATAACAAAAGTAGGGAATAAACAAGCTG
AACCCACTTTTACTGGACCAAATGATCTATTATATGTGTAACCACTTGTATGATTTGGGA
TTTGCAT
AA832389
TTTTTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGTTTTAATTGAAAAC
 TATAACCATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAACATCTAGTCTTCCATA
GACCATGCATTGCAGTGTACCCAGAACTGTTTAGCT
H14692
CTGAGTGTGATGGTGTAAGCCTGTGGTCCCAGCTACTAGGGAGGCTGAGATGGGATTACA
GGTGTGAGCCACGGCGCCTGGCCTAAAAGCATCTTTTTCTTTAACGCAGAGGTTATGTTG
TATTATTAGCATAAATGTTTTTTTCTGGGAATGCTTATTTCACACAGCACAATACTGAAT
CTTCTCTGGAATGTGGATCGATTTCAGATGGATGACTATTAAAATGTGTATATTTGCAGA
TTATCCTTAAAGGGCCACCTCATGCCTTCTAATTTATGTCTTACGGATAAAAAATCAAAA
TGAAGCATAAAGTAAAAACTGTGTCCAGCTTTACAAGTGGACGCTTAGTAATGGCTGAGG
CAATATGTTTAATGTAGCCAAATTTTACTTATTTGTCCATGATCCAGTTTTTCACAGTGC
TTGTTAAGTGCTGGTAATTAGGAAGGTGGGACATGGGTTAGGTCAAAACTTGGGACCNGA
AACCAACTTGN
AA732635
TTTTTTTTTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGTTTTAATTGA
AAACTATAACCATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAACATCTAGTCTTC
CATAGACCATGCATTGCATTGTACCCAGAACTGTTTAGCTAATATTCTATGTTTAATTAA
TGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATCTTAAGTGAAAAACC
TTCTATTACATGCAAAAAATCATTGGTTTT
AA928257
TTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAGCAGGA
TACACAGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAGTGCCACAAGGATCT
GCTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTAT
ATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGGTCACATGGC
CAACATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGCCTGAGAACAGCA
TGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGATGGAGAA
ATACAATGTTTACACAACAGTCCAGGGGTGGGGTCAAAAGTTGGAAGGTGTCATTAGACG
CAGCCAAATAAAGTGAAGACAACCCAGGTGACTGGCAGCCCTGACTTGTGCGTGGGCG
AI184427
TTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAGCAGGAT
ACACAGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAGTGCCACAAGGATCTG
CTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTATA
TTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTGGTGGTGGTCACATGGCC
AACATTTGGATAACAAATGAGGA
AI298577
GAGATGGAGGTCTCGCTTTGTGACGTAGCCTGGTCTTGAGCGATCCTTTTGCCTTGGCCT
TGCCAAAGTGCTGGGATTGGAGGCATGAGCCACTGCACCCACCCCTGTTTTTTTTTTAAG
TAAACCATTATAATAACTCATTTATAAAAAGGTTACTTCAAGAGGGCTTTCAACTTAAGA
ATTATTTTCATTTTGAACATGAAAAGTTAAATAGTAACTAAGAAACTGAGAACTCTGACA
GTGACCTCTAATAGGTAACTTTAGGCAAAAGTAGACAAGTTTGTGGGTATTTTGTTGTTC
ATGTTAAAAGGCACCTGTACAAGAATCAAGATATGAATCTAGTTTGTAGAGGGAAGGTCT
TATGCAAATACCAAATCATACAAGTGGT
AI692717
AGAGATGTTGGTCTCGCTTTGTGACGTAGCCTGGGCTTGAGCGATCCTTTTGCCTTGGCC
TTGCCAAAGTGCTGGGATTGGAGGCATGAGCCACTGCACCCACCCCTGTTTTTTTTTTAA
GTAAACCATTATAATAACTCATTTATAAAAAGGTTACTTCAAGAGGGCTTTCAACTTAAG
AATTATTTTCATTTTGAACATGAAAAGTTAAATAGTAACTAAGAAACTGAGAACTCTGAC
AGTGACCTCTAATAGGTAACTTTAGGCAAAAGTAGACAAGTTTGTGGGTATTTTGTTGTT
CATGTTAAAAGGCACCTGTACAAGAATCAAGATATGAATCTAGTTTGTAGAGGGAAGGTC
TTATGCAAATACCAAATCATACAAGTGGTTACACATATAATAGATCATTTGGTCCAGTAA
AAGTGGGTTCAGCTTGTTTATTCCCTACTT
AA910922
GAGATGGAGGTCTCGCTTTGTGACGTAGCCTGGTCTTGAGCGATCCTTTTGCCTTGGCTT
GCAAAGTGCTGGGATTGGAGGCATGAGCACTGCACCCACCCCTGTTTTTTTTTTTAAGTA
AACCATTATAATAACTCATTTATAAAAAGGTTACTTCAAGAG
H90761
TTCACTCAATAGCATCTTAAGTGAAAAACCTTCTATTACATGCAAAAAATCATTGTTTTT
AAGATAACAAAAGTAGGGAATAAACAAGCTGAACCCACTTTTACTGGACCAAATGANCTA
TTATATGTATAACCACTTGTATGATTTGGTATTTGCATAAGACCTTCCCTCTACAAACTA
GATTCATATCTTGATTCTTGTACAGGTGCCTTTTTAATATTCTGTGATGAAATCGTTCAC
AGTCAGAGTACATGTCTGCTGCATATGGGAAATAGGGACTGTTGTTCTGAGGGACAAGGC
ACTCAATTCAGCCGTAAAGGCTGACCCGGGCTACTTTTTTTCCANGGGAATACAATTTTT
TTACCTTGGAATAAAATNGGGCCCGACNGGAC
AI620122
TTTTTTTTTTTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAG
CAGGATACACAGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAGTGCCACAAG
GATCTGCTGAAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTT
CACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGGTCA
CATGGCCAACATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGCCTGAGA
ACAGCATGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGAT
GGAGAAATACAATGTTTACACAACAGTCCAGGGGTGGGGTCAAAAGTTGGAAGGTGTCAT
TAGACGCA
AI793318
AAATTTTTAACTTTTAATAGTTAAAATAGTTAACTATTGGTATGGTAGGAAATGATAAAG
TAGACTAGTATCTGTATACATTTTCTGCATTTATGACATACCTTTTTCTTCATTTTTTTC
AATATTTTAATTGAAAAGTTCATCCGAGTTTCATCTAAGTTTTTTCAAAGTGATACAAAT
CTCCAAAAAATTTTCCAATATATGTATTGAAAAAATCCAGGTGTAAGTGGCTCTGCGCAG
TCCAAACCTGTGTTGTTCAAGGGTCAACTGTGTATGAATCCAAGCGAAAGCTTTTCTTAA
CACCTCATAAGAACTATTTTTTAAAAAACAGGAACTAGCATAGAGTAACCATCACAGGTA
AAGTGTAATTTGTTATCAGCCATCTTTTGCCCATTTCAGTACTGGTAGAAGGCTCAATGG
TAAAAATAAA
AA962325
TTTTTTTTTTTTTTTTTTTTTTTTCTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTT
CTACCAGTACTGAAATGGGCAAAAGATGGCTGATAACAAATTACACTTTACCTGTGATGG
TTACTCTATGCTAGTTCCTGTTTTTTAAAAAATAGTTCTTATGAGGTGTTAAGAAAAGCT
TTCGCTTGGATTCATACACAGTTGACCCTTGAACAACACAGGTTTGGACTGCGCAGACCA
CTTACACCTGGATTTTTTCAATACATATATTGGAAAATTTTTTGGGGATTTGTATCACTT
TGAAAAAACTTAGATGAAACTCGGATGGACTTTTCCATTAAAATATTGGAAAAAATGAAG
AAAAAGGT
AI733290
TTTTTTTTTTTTTTTTTTTTTTTTCTGACTGGCCCGTTTTTATTTTTACCATTGAGCCTT
CTACCAGTACTGAAATGGGCAAAAGATGGCTGATAACAAATTACACTTTACCTGGGATGG
TTACTCTATGCTAGTTCCTGTTTTTTAAAAAATAGTTCTTATGAGGGGTTAAAAAAAGCT
TTCGCTTGGATTCATACACAGTTGACCCTTGAACAACACAGGTTTGGACTGCGCAGAGCC
ACTTACACCTGGATTTTTTCAATACATATATTGGAAAATTTTTTGGAGATTTGTATCACT
TTGAAAAAACTTAGATGAAACTCGGATGAACTTTTCAATTAAAATATTGAAAAAAATGAA
GAAAAAGGTATGTCATAAATGCAGAAAATGTATACAGATACTAGTCTACTTTATCATTTC
CTACCATACCAATAG
BQ226353
TAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAGTAA
GTGCCCAGTAACTTCAACCAGATGATCAAAGTGGCTCACACACAGTCACTGCCCCCCACT
CAGTATGTGGAAGGGTTGTGTGTATGTGGGCAGTGCAAGGGGTCGCTGCCTGTGTACACT
GAACTGGGGTGCAGAGAAAGCCAACAGTGCTGTCCCAGAGAACCTAGAATCTGAGTAAGA
ACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAGCAGGATACACAGAAGGGAA
AAAAATACACAGTGCAAAATGGATGTTCTGAGTGCCACAAGGATCTGCTGAAAAAAGCCA
AAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTATATTCTGATTCAATT
ACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGGTCACATGGCCAACATTTGGATAA
CAAATGAGGAATAATGGTACCGCCTCACTAGTGCCTGAGAACAGCATGTTCTGGAAAATG
TCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGATGGAGAAATACAATGTTTACA
CAACAGTCCAGGGGTGGGGGTCAAAAGTTGGAAGGTGTCATTAGACGCAGCCAAATAAAG
TGAAGACCACCCAGGTGACTGGCAGCCCTGACTTGTGCGTGGGCGAAACCTTACAGATTC
CTGGGGCACTCTGTGCCTGAACTTACCTGGATGGTCTTTGTGAGGCGGGTGGGCACTTAT
CCTCCATNAATGGTCAGTCTAACAAGACCGGCCTGTAAAAATGGCATCTAATAGGGGCTA
TGGAATGGAAAACAGTTGGTACCCAGAAATAACTTTAATT
W04890
GACAGTCTGGGAGCCCAGAGCTCTGGGAGGAGTNGGGAAAATGCTGCTTCCTGCTGCTTG
CTTCTAGGCACCTGCTTCCGCCATCTCACTTACCATGGCTAGAGATGGGGGTGAGACTGG
GGAAGGACAAAAGCAGGGAACAGATAAGGGATGGAAATCAGAAGGGAATATAGAAAGAAC
TCTGGATATGCNAGAAATGCCGGTACCTGAGCATTTTGTATCAATGGGAGTACCCTCTGT
AACTGCTCAGTAGGTTACAAATGAAGAGTCCACCAGTATTAGAAACAATTTAAACTTGCC
AGTACCAACTGGGATGTGTGCCTTCAATTTGAAAATTGTATGTTTTATTTTTTAAATTTG
GTTAACAGCATTAATTTATAGAGTATTTGATGTCATTTATGGTTCCCGAGGTGTTTCCAA
CACAATTTTTGGGATCA
BM455231
CTTTTAATAGTTAAAATAGTTAACTATTGGTATGGTAGGAAATGATAAAGTAGACTAGTA
TCTGTATACATTTTCTGCATTTATGACATACCTTTTTCTTCATTTTTTTCAATATTTTAA
TTGAAAAGTTCATCCGAGTTTCATCTAAGTTTTTTCAAAGTGATACAAATCTCCAAAAAA
TTTTCCAATATATGTATTGAAAAAATCCAGGTGTAAGTGGCTCTGCGCAGTCCAAACCTG
TGTTGTTCAAGGGTCAACTGTGTATGAATCCAAGCGAAAGCTTTTCTTAACACCTCATAA
GAACTATTTTTTAAAAAACAGGAACTAGCATAGAGTAACCATCACAGGTAAAGTGTAATT
TGTTATCAGCCATCTTTTGCCCATTTCAGTACTGGTAGAAGGCTCAATGGTAAAAATAAA
AACGGGACAGTCAGAAGATCTGGAAGTCCTGACCCTGCTTTCACCTGGCATGTGTAATCC
AGTCATGCTCGTATCAGTCTCTGTAGGAGCACTTGAAGGTATTACATAAATGCTATCTAA
CTCTGGGAAACGCCAACATGTGATTGCCTCCAGAGGAATCTTCTTTAAAAAAAAATTCAA
AATGTTATTTCCTTACTAGGATGTCTTTAAAGAATTATAACCCTTACCGTGCCTCCACAT
TAGATAGATCCCTGCCACCAGCACCCATGTGGCCACCAGCAGAGACAGCAGGAGGAGAGG
CAGCCAGCCTCCCGGCTTGCTTTTGTCTGGAAAAAAACAAAGCTTATTCACCTTTGGAAA
AAAATCCACACTTATCTCTTAATTTAAAAACTAAGACTTGGTATACTTTATAGAGGGTTA
TTTATTTTTTATTATTTTTTAGTTTTGAGACAGAGTCTCGCTTTGTTGCCTANGCTGGAG
TGCAGTGGCGCAATCTCGGTTCACTGCAGCCTCCGTTCTCCGGGGTTCAAGGCATGCTGG
CTCAGCCTCCTGTATAGCTGGGGATTAAAGGCATGTGTTCACGCGGCCCAGCCCCTTTTG
TAAAAGATTTAGATCCCTTTTAAAACCATCAGTCAGGAGGCTCCTTTAAAAAGTCTGGCC
ATCTAATCTTTTTTCCCCCAAAAGGGG
BI492426
TTTTTTTTTTTCTTTTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTC
TTTACAAAGCAGGATACACAGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAG
TGCCACAAGGATCTGCTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAAT
GAATATTTCACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGG
TGTGGTCACATGGCCAACATTTGGATAACAAATGAGGAATAATCTCGTGC
BG674622
AATTTATAGAGTATTGATGTCATTTATGTTTCTGAGGTGTTTCAACACAATTTTGGATCA
GCTGCCTGTTTGCAAAAACATAATATATTTCTGTTAAACAGTTCTTCACCTAACAGCATA
TTGCTCTTATAACTGGTAGAGCTGTTTCAAAGGAAGTTGGTTTCTGGTCCAAGTTTTGAC
CTAAACCATGTCCATCTTCTATTACCAGCACTTACAAGCACTGTGAAAACTGATCATGAC
AAATAAGTAAAATTTGCTACATTAAACATATTGCCTCAGCCATTACTAAGCGTCCACTTG
TAAAGCTGGACACAGTTTTTACTTTATGCTTCATTTTGATTTTTTATCCGTAAGACATAA
ATTAGAAGGCATGAGGTGGCCCTTTAAGGATAATCTGCAAATATACACATTTTAATAGTC
ATCCATCTGAAATCGATCCACATTCCAGAGAAGATTCAGTATTGTGCTGTGTGAAATAAG
CATTCCCAGAAAAAAAACATTTATGCTAATAATACAACATAACCTCTGCATTAAAGAAAA
AGATGCTTTTAGGCCAGGCGCCGTGGCTCACGCCTGTAATCCCTGCACTTTGAGAGGCTG
AGGTGGGTGGATCATGAGGTCAGGAGATCAAGACCATCCTGGCTAACAGGGTGAAACCCC
GTCTCTACTGGGGATATAACAAAGTTAGCTGGGTGTGGTGGTGGGTGCTTGTGGTCCCAG
CTACTCAGGAGGCTGAGGCAGGAGAATGGCGTGAACCCGGAAGGCAGAGGTTGTAGTGAC
GCGAGGTTCACGCCACTGCATTCCAGTCTGGG
BX111256
CAGGAAGNTAAGAACAGTCCTAAAATCTCTTTGGCTTCTTTGTCCTGATATGCACCGGCA
TTTTCACAGTAGGAACTAGGGTTTCTGTCCAGTTTTTTTGGTTCTTTAAGGAATTAATGT
TATTCTGGGTACAACTGCTTACATACATAGCACATATAGATGACATTTTTACAGGCCGTC
TTGTTAGACTGACATACATGGAGGATAGTGCCACCCGCCTCACAAGAACATCAGGTAAGC
TCAGGCACAGAGTGCCCAGGAATCTGTAAGGCTTCGCCCACGCACAAGTCAGGGCTGCCA
GTCACCTGGGTTGTCTTCACTTTATTTGGCTGCGTCTAATGACACCTTCCAACTTTTGAC
CCCACCCCTGGACTGTTGTGTAAACATTGTATTTCTCCATCTGTAATGAAAAAGCTAACA
CATCTCTAACTCCAGAGACATTTTCCAGAACATGCTGTTCTCAGGCACTAGTGAGGCGGT
ACCATTATTCCTCATTTGTTATCCAAATGTTGGCCATGTGACCACACCAAAAGCTCATCC
TGGGCCACTGAGACTGGTAATTGAATCAGAATATAGTGAAATATTCATTCTCATATATAC
CCAGCCATCTTACATCTTTGGCTTTTTTCAGCAGATCCTTGTGGCACTCAGAACATCCAT
TTTGCACTGTGTATTTTTT
BX117618
AAATTTTTAACTTTTAATAGTTAAAATAGTTAACTATTGGTATGGTAGGAAATGATAAAG
TAGACTAGTATCTGTATACATTTTCTGCATTTATGACATACCTTTTTCTTCATTTTTTTC
AATATTTTAATTGAAAAGTTCATCCGAGTTTCATCTAAGTTTTTTCAAAGTGATACAAAT
CTCCAAAAAATTTTCCAATATATGTATTGAAAAAATCCAGGTGTAAGTGGCTCTGCGCAG
TCCAAACCTGTGTTGTTCAAGGGTCAACTGTGTATGAATCCAAGCGAAAGCTTTTCTTAA
CACCTCATAAGAACTATTTTTTAAAAAACAGGAACTAGCATAGAGTAACCATCACAGGTA
AAGTGTAATTTGTTATCAGCCATCTTTTGCCCATTTCAGTACTGGTAGAAGGCTCAATGG
TAAAAATAAAAACGGGACAGTCAGAAAAA
AA682806
TCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAGCAGGATAC
ACAGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAGTGCCACAAGGATCTGCT
GAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTATATT
CTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGGTCACATGGCCAA
CATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGCCTGAGAACAGCATGT
TCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGATGGAGAAATA
CAATGTTTACACAACAGTCCAGGGGTGGGGTCAAAG
AI202376
CTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTTCTACCAGTACTGAAATGGGCAAAA
GATGGCTGATAACAAATTACACTTTACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTT
TTAAAAAATAGTTCTTATGAGGTGTTAAGAAAAGCTTTCGCTTGGATTCATACACAGTTG
ACCCTTGAACAACACAGGTTTGGACTGCGCAGAGCCACCCTCGTGCCGAATT
AI658949
CTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTTCTACCAGTACTGAAATGGGCAAAA
GATGGCTGATAACAAATTACACTTTACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTT
TTAAAAAATAGTTCTTATGAGGTGTTAAGAAAAGCTTTCGCTTGGATTCATACACAGTTG
ACCCT
BG403405
GGAAATGATAAAGTAGACTAGTATCTGTATACATTTTCTGCATTTATGACATACCTTTTT
CTTCATTTTTTTCAATATTTTAATTGAAAAGTTCATCCGAGTTTCATCTAAGTTTTTTCA
AAGTGATACAAATCTCCAAAAAATTTTCCAATATATGTATTGAAAAAATCCAGGTGTAAG
TGGCTCTGCGCAGTCCAAACCTGTGTTGTTCAAGGGTCAACTGTGTATGAATCCAAGCGA
AAGCTTTTCTTAACACCTCATAAGAACTATTTTTTAAAAAACAGGAACTAGCATAGAGTA
ACCATCACAGGTAAAGTGTAATTTGTTATCAGCCATCTTTGCCCATTTCAGTACTGGTAG
AAGGCTCAATGGTAAAAATAAAAACGGGACAGTCAGAAGATCTGGAAGTCCTGACCCTGC
TTTCACCTGGCATGTGTAATCCAGTCATGCTCGTATCAGTCTCTGTAGGAGCACTTGAAG
GTATTACATAAATGCTATCTAACTCTGGGAAACGCCAACATGTGATTGCCTCCAGAGGAA
TCTTCTTTAAAAAAAAATTCAAAATGTTATTTCCTTACTAGGATGTCTTTAAAGAATTAT
AACCCTTACCGTGCCTCCACATTAGATAGATCCCTGCAACAGACCCATGTGGCACCAGCA
GAGACAGCAGGAGGAGAGGCAGCAGCTCCCGGTTGTTTGTCTGGAAAAACAAAGGTTATC
ACTTTG
BE673417
CTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTTCTACCAGTACTGAAATGGGCAAAA
GATGGCTGATAACAAATTACACTTTACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTT
TTAAAAAATAGTTCTTATGAGGTGTTAAGAAAAGCTTTCGCTTGGATTCATACACAGTTG
ACCCT
AW021469
GCACGAGATTATTCCTCATTTGTTATCCAAATGTTGGCCATGTGACCACACCAAAAGCTC
ATCCTGGGCCACTGAGACTGGTAATTGAATCAGAATATAGTGAAATATTCATTCTCATAT
ATACCCAGCCATCTTACATCTTTGGCTTTTTTCAGCAGATCCTTGTGGCACTCAGAACAT
CCATTTTGCACTGTGTATTTTTTTCCCTTCTGTGTATCCTGCTTTGTAAAGAGTCACGAG
TGGTTTTACAAATAAAGCCTGTTCTTACTCAGAAAAAAAAAAAAAAAAAAA
CF455736
NNTTGAACAGGCGTGACGGTCCGGATTCCCGGGATGTTGTGCTCTGCCCACAAACAGGCG
TCCCTTTCCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGC
TGTCTCTGCTGGTGGCCACATGGGTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACG
AAAGGATCAAGAAGACTTCCTTTTCTACCACCACACTACTGCCCCCCATTAAGGTTCTTG
TGGTTTACCCATCTGAAATATGTTTCCATCACACAATTTGTTACTTCACTGAATTTCTTC
AAAACCATTGCAGAAGTGAGGTCATCCTTGAAAAGTGGCAGAAAAAGAAAATAGCAGAGA
TGGGTCCAGTGCAGTGGCTTGCCACTCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTC
TTTCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCA
GTGAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAA
GCCAGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACG
ATTACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCT
GTGCAGAACTTCTCCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCC
ACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTNAAGGCTTCCT
ATCCCACCATTACAG
AW339874
TTTTTTTTTTTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTAC
AAAGCAGGATACACAGAAGGGAAAAAAATACACAGGGCAAAATGGATGTTCTGAGTGCCA
CAAGGATCTGCTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATA
TTTCACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGG
TCACATGGCCAACATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGCCTG
AGAACAGCATGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACA
GATGGAGAAATACAATGTTTACACAAC
BG399724
CATGATGTTCAGTATGATCAGTTAACCTTAACCTCTGAGCATCCTGAAGCAAAATCTAAA
TAATGCAGCTATTACCACTGGTGGTCCAGGCTCTGGTGAAGCCCTCTGAGCCCAGGAGGA
AGAGAAAGCATTGTCCAGAGGTAGGAACACAGTCTGGGAGCCCAGAGCTCTGGGAGGAGT
GGGAAAATGCTGCTTCCTGCTGCTTGCTTCTAGGCACCTGCTTCCGCCATCTCACTTACC
ATGGCTAGAGATGGGGGTGAGACTGGGGAAGGACAAAAGCAGGGAACAGATAAGGGATGG
AAATCAGAAGGGAATATAGAAAGAACTCTGGATGTGGAGAAATGCCGGTACCTGAGCATT
TTGTATCAATGGGAGTACCCTCTGTAACTGCTCAGTAGGTTACAAATGAAGAGTCCACCA
GTATTAGAAACAATTTAAACTTGCCAGTACCAACTGGGATGTGTGCCTTCAATTTGAAAA
TTGTATGTTTTATTTTTTAAATTTGTTAACAGCATTAATTTATAGAGTATTGATGTCATT
TATGTTTCTGAGGTGTTTCAA
BF475787
TCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAGCAGGATAC
ACAGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAGTGCCACAAGGATCTGCT
GAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTATATT
CTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGGTCACATGGCCAA
CATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGCCTGAGAACAGCATGT
TCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGATGGAGAAATA
CAATGTTTACACAACAGTCCAGGGGTGGGGTCAAAAGTTGGAAGGTGTCATTAGACGCAG
CCAAATAAAGTGAAGACAACCCAGGTGACTGGCAGCCCTGACTTGTGCGTGGGCGA
BF437145
CTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTTCTACCAGTACTGAAATGGGCAAAA
GATGGCTGATAACAAATTACACTTTACCTGTGATGGTTACTCTATGCTAGTATCCTGTTT
TTTAAAAAATAGTTCTTATGAGGTGTTAAGAAAAGCTTTCGCTTGGATTCATACACAGTT
GACCCT
H64601
AGGAAGTTAAGAACAGTCCTAAAATCTCTTTGGCTTCTTTGTCCTGATATGCACCGGCAT
TTTCACAGTAGGAACTAGGGTTTCTGTCCAGTTTTTTTGGTTCTTTAAGGAATTAATGTT
ATTCTGGGTACAACTGCTTACATACATAGCACATATAGATGACATTTTTACAGGCCGTCT
TGTTAGACTGACATACATGGAGGATAGTGCCACCCGCCTCACAAGAACATCAGGTAAGCT
CAGGCACAGAGTCCNAGGGNATCTGTAAGGGCTTCGCCCACGCACAAGTCAGGGCTGCCA
GTCACCNGGGTTGTCTTCACTTTATTTGGGCTGCGTCTAATGACACCTTNCCAACTTTTT
GACCCCACCCTGGGGCTTGTTGTGTAAACCATTGTTATTTCTCCCNTCTGTAATGGAAAA
AGGTTAACACNTTTTTAACTTCCGGNGACATTTTTC
AF212365
gcacgagcga tgtcgctcgt gctgctaagc ctggccgcgc tgtgcaggag cgccgtaccc
cgagagccga ccgttcaatg tggctctgaa actgggccat ctccagagtg gatgctacaa
catgatctaa tccccggaga cttgagggac ctccgagtag aacctgttac aactagtgtt
gcaacagggg actattcaat tttgatgaat gtaagctggg tactccgggc agatgccagc
atccgcttgt tgaaggccac caagatttgt gtgacgggca aaagcaactt ccagtcctac
agctgtgtga ggtgcaatta cacagaggcc ttccagactc agaccagacc ctctggtggt
aaatggacat tttcctacat cggcttccct gtagagctga acacagtcta tttcattggg
gcccataata ttcctaatgc aaatatgaat gaagatggcc cttccatgtc tgtgaatttc
acctcaccag gctgcctaga ccacataatg aaatataaaa aaaagtgtgt caaggccgga
agcctgtggg atccgaacat cactgcttgt aagaagaatg aggagacagt agaagtgaac
ttcacaacca ctcccctggg aaacagatac atggctctta tccaacacag cactatcatc
gggttttctc aggtgtttga gccacaccag aagaaacaaa cgcgagcttc agtggtgatt
ccagtgactg gggatagtga aggtgctacg gtgcagctga ctccatattt tcctacttgt
ggcagcgact gcatccgaca taaaggaaca gttgtgctct gcccacaaac aggcgtccct
ttccctctgg ataacaacaa aagcaagccg ggaggctggc tgcctctcct cctgctgtct
ctgctggtgg ccacatgggt gctggtggca gggatctatc taatgtggag gcacgaaagg
atcaagaaga cttccttttc taccaccaca ctactgcccc ccattaaggt tcttgtggtt
tacccatctg aaatatgttt ccatcacaca atttgttact tcactgaatt tcttcaaaac
cattgcagaa gtgaggtcat ccttgaaaag tggcagaaaa agaaaatagc agagatgggt
ccagtgcagt ggcttgccac tcaaaagaag gcagcagaca aagtcgtctt ccttctttcc
aatgacgtca acagtgtgtg cgatggtacc tgtggcaaga gcgagggcag tcccagtgag
aactctcaag actcttcccc ttgcctttaa ccttttctgc agtgatctaa gaagccagat
tcatctgcac aaatacgtgg tggtctactt tagagagatt gatacaaaag acgattacaa
tgctctcagt gtctgcccca agtaccacct catgaaggat gccactgctt tctgtgcaga
acttctccat gtcaagtagc aggtgtcagc aggaaaaaga tcacaagcct gccacgatgg
ctgctgctcc ttgtagccca cccatgagaa gcaagagacc ttaaaggctt cctatcccac
caattacagg gaaaaaacgt gtgatgatcc tgaagcttac tatgcagcct acaaacagcc
ttagtaatta aaacatttta taccaataaa attttcaaat attgctaact aatgtagcat
taactaacga ttggaaacta catttacaac ttcaaagctg ttttatacat agaaatcaat
tacagtttta attgaaaact ataaccattt tgataatgca acaataaagc atcttcagcc
aaaaaaaaaa aaaaaa
AF208110
cggcgatgtc gctcgtgctg ataagcctgg ccgcgctgtg caggagcgcc gtaccccgag
agccgaccgt tcaatgtggc tctgaaactg ggccatctcc agagtggatg ctacaacatg
atctaatccc cggagacttg agggacctcc gagtagaacc tgttacaact agtgttgcaa
caggggacta ttcaattttg atgaatgtaa gctgggtact ccgggcagat gccagcatcc
gcttgttgaa ggccaccaag atttgtgtga cgggcaaaag caacttccag tcctacagct
gtgtgaggtg caattacaca gaggccttcc agactcagac cagaccctct ggtggtaaat
ggacattttc ctatatcggc ttccctgtag agctgaacac agtctatttc attggggccc
ataatattcc taatgcaaat atgaatgaag atggcccttc catgtctgtg aatttcacct
caccaggctg cctagaccac ataatgaaat ataaaaaaaa gtgtgtcaag gccggaagcc
tgtgggatcc gaacatcact gcttgtaaga agaatgagga gacagtagaa gtgaacttca
caaccactcc cctgggaaac agatacatgg ctcttatcca acacagcact atcatcgggt
tttctcaggt gtttgagcca caccagaaga aacaaacgcg agcttcagtg gtgattccag
tgactgggga tagtgaaggt gctacggtgc agctgactcc atattttcct acttgtggca
gcgactgcat ccgacataaa ggaacagttg tgctctgccc acaaacaggc gtccctttcc
ctctggataa caacaaaagc aagccgggag gctggctgcc tctcctcctg ctgtctctgc
tggtggccac atgggtgctg gtggcaggga tctatctaat gtggaggcac gaaaggatca
agaagacttc cttttctacc accacactac tgccccccat taaggttctt gtggtttacc
catctgaaat atgtttccat cacacaattt gttacttcac tgaatttctt caaaaccatt
gcagaagtga ggtcatcctt gaaaagtggc agaaaaagaa aatagcagag atgggtccag
tgcagtggct tgccactcaa aagaaggcag cagacaaagt cgtcttcctt ctttccaatg
acgtcaacag tgtgtgcgat ggtacctgtg gcaagagcga gggcagtccc agtgagaact
ctcaagacct cttccccctt gcctttaacc ttttctgcag tgatctaaga agccagattc
atctgcacaa atacgtggtg gtctacttta gagagattga tacaaaagac gattacaatg
ctctcagtgt ctgccccaag taccacttca tgaaggatgc cactgctttc tgtgcagaac
ttctccatgt caagcagcag gtgtcagcag gaaaaagatc acaagcctgc cacgatggct
gctgctcctt gtagcccacc catgagaagc aagagacctt aaaggcttcc tatcccacca
attacaggga aaaaacgtgt gatgatcctg aagcttacta tgcagcctac aaacagcctt
agtaattaaa acattttata ccaataaaat tttcaaatat tactaactaa tgtagcatta
actaacgatt ggaaactaca tttacaactt caaagctgtt ttatacatag aaatcaatta
cagctttaat tgaaaactgt aaccattttg ataatgcaac aataaagcat cttccaaaaa
aaaaaaaaaa aaaaaaaaaa aaaaaaaa
AF208111
cggcgatgtc gctcgtgctg ataagcctgg ccgcgctgtg caggagcgcc gtaccccgag
agccgaccgt tcaatgtggc tctgaaactg ggccatctcc agagtggatg ctacaacatg
atctaatccc cggagacttg agggacctcc gagtagaacc tgttacaact agtgttgcaa
caggggacta ttcaattttg atgaatgtaa gctgggtact ccgggcagat gccagcatcc
gcttgttgaa ggccaccaag atttgtgtga cgggcaaaag caacttccag tcctacagct
gtgtgaggtg caattacaca gaggccttcc agactcagac cagaccctct ggtggtaaat
ggacattttc ctatatcggc ttccctgtag agctgaacac agtctatttc attggggccc
ataatattcc taatgcaaat atgaatgaag atggcccttc catgtctgtg aatttcacct
caccaggctg cctagaccac ataatgaaat ataaaaaaaa gtgtgtcaag gccggaagcc
tgtgggatcc gaacatcact gcttgtaaga agaatgagga gacagtagaa gtgaacttca
caaccactcc cctgggaaac agatacatgg ctcttatcca acacagcact atcatcgggt
tttctcaggt gtttgagcca caccagaaga aacaaacgcg agcttcagtg gtgattccag
tgactgggga tagtgaaggt gctacggtgc aggtaaagtt cagtgagctg ctctggggag
ggaagggaca tagaagactg ttccatcatt cattgctttt aaggatgagt tctctcttgt
caaatgcact tctgccagca gacaccagtt aagtggcgtt catgggggtt ctttcgctgc
agcctccacc gtgctgaggt caggaggccg acgtggcagt tgtggtccct tttgcttgta
ttaatggctg ctgaccttcc aaagcacttt ttattttcat tttctgtcac agacactcag
ggatagcagt accattttac ttccgcaagc ctttaactgc aagatgaagc tgcaaagggt
ttgaaatggg aaggtttgag ttccaggcag cgtatgaact ctggagaggg gctgccagtc
ctctctgggc cgcagcggac ccagctggaa cacaggaagt tggagcagta ggtgctcctt
cacctctcag tatgtctctt tcaactctag tttttgaagt ggggacacag gaagtccagt
ggggacacag ccactcccca aagaataagg aacttccatg cttcattccc tggcataaaa
agtgntcaaa cacaccagag ggggcaggca ccagccaggg tatgatgggt actacccttt
tctggagaac catagacttc ccttactaca gggacttgca tgtcctaaag cactggctga
aggaagccaa gaggatcact gctgctcctt ttttgtagag gaaatgtttg tgtacgtggt
aagatatgac ctagcccttt taggtaagcg aactggtatg ttagtaacgt gtacaaagtt
taggttcaga ccccgggagt cttgggcatg tgggtctcgg gtcactggtt ttgactttag
ggctttgtta cagatgtgtg accaagggga aaatgtgcat gacaacacta gaggtagggg
cgaagccaga aagaagggaa gttttggctg aagtaggagt cttggtgaga ttttgctgtg
atgcatggtg tgaactttct gagcctcttg tttttcctca gctgactcca tattttccta
cttgtggcag cgactgcatc cgacataaag gaacagttgt gctctgccca caaacaggcg
tccctttccc tctggataac aacaaaagca agccgggagg ctggctgcct ctcctcctgc
tgtctctgct ggtggccaca tgggtgctgg tggcagggat ctatctaatg tggaggcacg
aaaggatcaa gaagacttcc ttttctacca ccacactact gccccccatt aaggttcttg
tggtttaccc atctgaaata tgtttccatc acacaatttg ttacttcact gaatttcttc
aaaaccattg cagaagtgag gtcatccttg aaaagtggca gaaaaagaaa atagcagaga
tgggtccagt gcagtggctt gccactcaaa agaaggcagc agacaaagtc gtcttccttc
tttccaatga cgtcaacagt gtgtgcgatg gtacctgtgg caagagcgag ggcagtccca
gtgagaactc tcaagacctc ttcccccttg cctttaacct tttctgcagt gatctaagaa
gccagattca tctgcacaaa tacgtggtgg tctactttag agagattgat acaaaagacg
attacaatgc tctcagtgtc tgccccaagt accacttcat gaaggatgcc actgctttct
gtgcagaact tctccatgtc aagcagcagg tgtcagcagg aaaaagatca caagcctgcc
acgatggctg ctgctccttg tagcccaccc atgagaagca agagacctta aaggcttcct
atcccaccaa ttacagggaa aaaacgtgtg atgatcctga agcttactat gcagcctaca
aacagcctta gtaattaaaa cattttatac caataaaatt ttcaaatatt actaactaat
gtagcattaa ctaacgattg gaaactacat ttacaacttc aaagctgttt tatacataga
aatcaattac agctttaatt gaaaactgta accattttga taatgcaaca ataaagcatc
ttccaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa
AF250309
atgtcgctcg tgctgctaag cctggccgcg ctgtgcagga gcgccgtacc ccgagagccg
accgttcaat gtggctctga aactgggcca tctccagagt ggatgctaca acatgatcta
atcccgggag acttgaggga cctccgagta gaacctgtta caactagtgt tgcaacaggg
gactattcaa ttttgatgaa tgtaagctgg gtactccggg cagatgccag catccgcttg
ttgaaggcca ccaagatttg tgtgacgggc aaaagcaact tccagtccta cagctgtgtg
aggtgcaatt acacagaggc cttccagact cagaccagac cctctggtgg taaatggaca
ttttcctata tcggcttccc tgtagagctg aacacagtct atttcattgg ggcccataat
attcctaatg caaatatgaa tgaagatggc ccttccatgt ctgtgaattt cacctcacca
ggctgcctag accacataat gaaatataaa aaaaagtgtg tcaaggccgg aagcctgtgg
gatccgaaca tcactgcttg taagaagaat gaggagacag tagaagtgaa cttcacaacc
actcccctgg gaaacagata catggctctt atccaacaca gcactatcat cgggttttct
caggtgtttg agccacacca gaagaaacaa acgcgagctt cagtggtgat tccagtgact
ggggatagtg aaggtgctac ggtgcagctg actccatatt ttcctacttg tggcagcgac
tgcatccgac ataaaggaac agttgtgctc tgcccacaaa caggcgtccc tttccctctg
gataacaaca aaagcaagcc gggaggctgg ctgcctctcc tcctgctgtc tctgctggtg
gccacatggg tgctggtggc agggatctat ctaatgtgga ggcacgaaag gatcaagaag
acttcctttt ctaccaccac actactgccc cccattaagg ttcttgtggt ttacccatct
gaaatatgtt tccatcacac aatttgttac ttcactgaat ttcttcaaaa ccattgcaga
agtgaggtca tccttgaaaa gtggcagaaa aagaaaatag cagagatggg tccagtgcag
tggcttgcca ctcaaaagaa ggcagcagac aaagtcgtct tccttctttc caatgacgtc
aacagtgtgt gcgatggtac ctgtggcaag agcgagggca gtcccagtga gaactctcaa
gacctcttcc cccttgcctt taaccttttc tgcagtgatc taagaagcca gattcatctg
cacaaatacg tggtggtcta ctttagagag attgatacaa aagacgatta caatgctctc
agtgtctgcc ccaagtacca cctcatgaag gatgccactg ctttctgtgc agaacttctc
catgtcaagc agcaggtgtc agcaggaaaa agatcacaag cctgccacga tggctgctgc
tccttgtagc ccacccatga gaagcaagag accttaaagg gttccttttc ccatcattta
caggggaaaa acgtgtgatg atc
AK095091
catattagag tctacagata tgcctttctt acagcaatcc tgcacccaca taaaagctac
attttcaata caagattaaa aggtattctg caaaatgtgc aaggttttca tgtctgctgg
tgtagctgta gtgatggctt catgaatttt tttctttttt gactatggtc cttacgctgg
attcatttat cttgaaatgg tgaacaatca cagctgcaga ccctcaattt atggtacata
tcaagcaatt tggctttttt tcttgtaatg aaaaaaaaaa gttttttttg ctttttttca
tgacactgct tcttgggagc actgccagca ttactagtgg cacttcgtat gggtcctaag
gtgttattga aggtttacga tattgcacta aacacgaaaa ataccagaga accactggag
atacttttta ctgtgatatg taatttactg gagacaggaa ctgctcgttt ggagatggtt
agcatcacag ggtgttttaa gtcgatactt gcaacccttg agctcaccac agtagcaaca
ggaggtggct aggaaattat tcacagcagg acagtacgca ctgcaattaa ttgtatgcag
ttatgattta ataccacatc tttatgctca cgtttctctc aactgtgaat ggtgccatgt
acagttggta tgtgtgtgtt taagttttga taaattttta acttttaata gttaaaatag
ttaactattg gtatggtagg aaatgataaa gtagactagt atctgtatac attttctgca
tttatgacat acctttttct tcattttttt caatatttta attgaaaagt tcatccgagt
ttcatctaag ttttttcaaa gtgatacaaa tctccaaaaa attttccaat atatgtattg
aaaaaatcca ggtgtaagtg gctctgcgca gtccaaacct gtgttgttca agggtcaact
gtgtatgaat ccaagcgaaa gcttttctta acacctcata agaactattt tttaaaaaac
aggaactagc atagagtaac catcacaggt aaagtgtaat ttgttatcag ccatcttttg
cccatttcag tactggtaga aggctcaatg gtaaaaataa aaacgggaca gtcagaagat
ctggaagtcc tgaccctgct ttcacctggc atgtgtaatc cagtcatgct cgtatcagtc
tctgtaggag cacttgaagg tattacataa atgctatcta actctgggaa acgccaacat
gtgattgcct ccagaggaat cttctttaaa aaaaaattca aaatgttatt tccttactag
gatgtcttta aagaattata acccttaccg tgcctccaca ttagatagat ccctgccacc
agcacccatg tggccaccag cagagacagc aggaggagag gcagccagcc tcccggcttg
cttttgtctg gaaaaaacaa agcttattca cctttggaaa acaaatccac acttatctct
taatttaaaa actaagactt ggtatacttt atagaggttt atttattttt tattattttt
tagttttgag acagagtctc gctttgttgc ctaggctgga gtgcagtggc gcaatctcgg
ttcactgcag cctccgtctc ccgggttcaa gcaatgctgc ctcagcctcc tgagtagctg
ggattacagg catgtgtcac cgcgcccagc cactttgtag agatttagat ccctttaaaa
ccatcagtca gaagctcttt agatagtctg ccaatcatat ctttttccct agagtgtgca
ggtcttgcat tagattctca aaagggatat gggacccagg aagttaagaa cagtcctaaa
atctctttgg cttctttgtc ctgatatgca ccggcatttt cacagtagga actagggttt
ctgtccagtt tttttggttc tttaaggaat taatgttatt ctgggtacaa ctgcttacat
acatagcaca tatagatgac atttttacag gccgtcttgt tagactgaca tacatggagg
atagtgccac ccgcctcaca agaacatcag gtaagctcag gcacagagtg cccaggaatc
tgtaaggctt cgcccacgca caagtcaggg ctgccagtca cctgggttgt cttcacttta
tttggctgcg tctaatgaca ccttccaact tttgacccca cccctggact gttgtgtaaa
cattgtattt ctccatctgt aatgaaaaag ctaacacatc tctaactcca gagacatttt
ccagaacatg ctgttctcag gcactagtga ggcggtacca ttattcctca tttgttatcc
aaatgttggc catgtgacca caccaaaagc tcatcctggg ccactgagac tagtaattga
atcagaatat agtgaaatat tcattctcat atatacccag ccatcttaca tctttggctt
ttttcagcag atccttgtgg cactcagaac atccattttg cactgtgtat ttttttccct
tctgtgtatc ctgctttgta aagagtcacg agtggtttta caaataaagc ctgttcttac
tcag
BM983744
TTTTTTTTTTTTTTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTT
TACAAAGCAGGATACACAGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAGTG
CCACAAGGATCTGCTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGA
ATATTTCACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTG
TGGTCACATGGCCAACATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGC
CTGAGAACAGCATGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATT
ACAGATGGAGAAATACAATGTTTACACAACAGTCCAGGGGTGGGGTCAAAAGTTGGAAGG
TGTCATTAGACGCAGCCAAATAAAGTGAAGACAACCCAGGTGACTGGCAGCCCTGACTTG
TGCGTGGGCGAAGCCTTACAGATTCCTGGGCACTCTGTGCCTGAGCTTACCTGATGTTCT
TGTGAGGCGGGTGGCACTATCCTCCATGTATGTCAGTCTAACAAGACGGCCTGTAAAAAT
GTCATCTATATGTGCTATGTATGTAAGCAGTTGTACCCAGAATAACATTAATCCTCGTGC
CGAAT
CB305764
TTTTTTTTTTTTTTTGTTGGGCTGAAGATGCTTTATTATTGCATTATCAAAATGGTTATA
GTTTTCAATTAAAACTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGT
AGTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTAT
AAAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACA
CGTTTTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGT
GGGCTACAAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTG
CTGCTTGACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTT
GGGGCAGACACTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCAC
CACGTATTTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAG
GGGGAAGAGGTCTTGAGAGTTCTCACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATC
GCACACACTGTTNACGTCATTGGAAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTG
AGTG
BM715988
TGGTTTTTGTTTTTTTTTCATTTTCTGTTGGATTACAGAAAAAGAATGGGACCCATTCAG
GTCTCGATTTCCAAAGGTAAAGATGGAAGGCTGGGCAGACTGGCTTTTGTTACCTGACAT
GCCGTAGGGTGAGCTTAGAGGAAGAAAGAAAACAATTTTTATTTGGCCAAAACAGAACAA
ATGCTGAAAAGGAAATCTTGTTTTTTTCCTAAAGCCAAATAGAAATGATTTGGGTATAAT
TTAAGAGTCCTTGTGTTGTACAGATATGGTGACTGATGTAGTTATTAATACTACCAACTT
AGTCATCAAGCCTCAATTTTCCTTTACCTGAAGGATTAAGTGAAAGCTTTTGGAGTTCAT
GATGTTCAGTATGATCAGTTAACCTTAACCTCTGAGCATCCTGAAGCAAAATCTAAATAA
TGCAGCTATTACCACTGGTGGTCCAGGCTCTGGTGAAGCCCTCTGAGCCCAGGAGGAAGA
GAAAGCATTGTCCAGAGGTAGGAACACAGTCTGGGAGCCCAGAGCTCTGGGAGGAGTGGG
AAAATGCTGCTTCCTGCTGCTTGCTTCTAGGCACCTGCTTCCGCCATCTCACTTACCATG
GCTAGAGATGGGGGTGAGACTGGGGAAGGACACAAGCAGGGAACAGATAAGGGATGGAAA
TCAGAAGGGAATATAGAAAGAACTCTGGATGTGGAGACATGCCGGTACCTGAGCATTTTG
TATCAATGGGAGTACCTCT
BM670929
TTTTTTTTTTTTTTTTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAG
TTTTCAATTAAAGCTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTA
GTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATA
AAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACAC
GTTTTTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGT
GGGCTACAAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTG
CTGCTTGACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTT
GGGGCAGACACTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCAC
CACGTATTTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAG
GGGGAAGAGGTCTTGAGAGTTCTCACTGGGACTTGCCTCGCTCTTGCCACAGGTACCATC
GCACACACTGTTGACGTCATTGGAAAGAAAGAAGACGACTTTGTCTGCTGCCTTCTT
BI792416
GCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAAGCTGTAA
TTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGT
BI715216
CACGCGTCCGATTTTATACCAATAAAATTTTCAAATATTGCTAACTAATGTAGCATTAAC
TAACGATTGGAAACTACATTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACA
GCTTTAATTGAAAACTGTAACCATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAAA
AAAAAAA
N56060
AGAAAAAGAAAATAGCAGAGATGGGTCCAGTGCAGTGGCTTGCATAAAAAAGAAGGCAGC
AGACAAAGTCGTCTTCCTTCTTTCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGG
CAAGAGCGAGGGCAGTCCCAGTGAGAACTCTCAAGACCTCTTCCCCCCTTGCCTTTAACC
TTTTCTGCAGTGATCTAAGAAGCCAGATTCATCTGCACAAATACGTGGTGGTCTACTTTA
GAGAGATTGATACAAAAGACGATTACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCA
TGAAGGATGCCACTGCTTTCTGTGCAGAACTTCTCCATGTCAAGCAGCAGGTTTCAGCAG
G
CB241389
TTTTTTTTTTTTTTGTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAG
TTTTCAATTAAAGCTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTA
GTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATA
AAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACAC
GTTTTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTG
GGCTACAAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGC
TGCTTGACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTG
GGGCAGACACTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACC
ACGTATTTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGG
GGGAAGAGGTCTTGAGAGTTCTCACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATCG
CACACACTGTTGACGTCATTGGAAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTGA
GTGGCAAGCCACTGCACTGGACCCATCTCTGCTATTTTCTTTTTCTNGCACTTTTCAAGG
ATGACTCACTTCTGCAATGGTTTTTGAGAATTCAGTGAAGTACAAATGTGTGATGGAACA
TAT
AV660618
CGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCAGGAGCGCCGTACCCCGAGAGCCGACCG
TTCAATGTGGCTCTGAAACTGGGCCATCTCCAGAGTGGATGCTACAACATGATCTAATCC
CCGGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACAACTAGTGTTGCAACAGGGGACT
ATTCAATTTTGATGAATGTAAGCTGGGTACTCCGGGCAGATGCCACACCAGAAGAAACAA
ACGCGAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTG
ACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGACATAAAGGAACAGTTGTGCTC
TGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAAC
BX088671
GCTGAGTGTGATGGTGTAAGCCTGTGGTCCCAGCTACTAGGGAGGCTGAGATGGGATTAC
AGGTGTGAGCCACGGCGCCTGGCCTAAAAGCATCTTTTTCTTTAACGCAGAGGTTATGTT
GTATTATTAGCATAAATGTTTTTTTCTGGGAATGCTTATTTCACACAGCACAATACTGAA
TCTTCTCTGGAATGTGGATCGATTTCAGATGGATGACTATTAAAATGTGTATATTTGCAG
ATTATCCTTAAAGGGCCACCTCATGCCTTCTAATTTATGTCTTACGGATAAAAAATCAAA
ATGAAGCATAAAGTAAAAACTGTGTCCAGCTTTACAAGTGGACGCTTAGTAATGGCTGAG
GCAATATGTTTAATGTAGCAAATTTTACTTATTTGTCATGATCAGTTTTCACAGTGCTTG
TAAGTGCTGGTAATAGAAGATGGACATGGTTTAGGTCAAAACTTGGACCAGAAACCAACT
TCCTTTGAAACAGCTCTACCAGNTATAAGAGCAATATG
CB154426
CTGTTGACGTCATTGGAAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTGAGTGGCA
AGCCACTGCACTGGACCCATCTCTGCTATTTTCTTTTTCTGCCACTTTTCAAGGATGACC
TCACTTCTGCAATGGTTTTGAAGAAATTCAGTGAAGTAACAAATTGTGTGATGGAAACAT
ATTTCAGATGGGTAAACCACAAGAACCTTAATGGGGGGCAGTAGTGTGGTGGTAGAAAAG
GAAGTCTTCTTGATCCTTTCTGTGAGAGGAGAAAAGCATTTGTTATCTGTGAACAGCAAA
CAGCAGGCTTTCACTCTGTAAACCATCCCTGACAAATGATCCCTTGCTAGAGAATGTCAG
CTGAGCACCAAGGGCCTTGTTAGTGACAGCAAGGAAAAACATCCTGATGTTCCTTTTGAA
CACATCACCTGAAACACACTGATGCTTAAACCTTAACTTTTTTTTTTTTGGAGACACAGT
CTCACTCTGT
CA434589
TTTTTTTTTTTTTTTTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTC
TTTACAAAGCAGGATACACAGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAG
TGCCACAAGGATCTGCTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAAT
GAATATTTCACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGG
TGTGGTCACATGGCCAACATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGT
GCCTGAGAACAGCATGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCA
TTACAGATGGAGAAATACAATGTTTACACAACAGTCCAGGGGTGGGGTCAAAAGTTGGAA
G
CA412162
TTTTTTTTTTTTTTTTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAG
TTTTCAATTAAAACTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTA
GTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATA
AAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACAC
GTTTTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTG
GGCTACAAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGC
TGCTTGACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACGTG
GGGCAGACACTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACC
ACGTATTTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGG
GGGAAGA
CA314073
TTTTTTTTTTTTTTTTTTGAAAGGGTCAGGACTTCCAGATCTTCTGACTGTCCCGTTTTT
ATTTTTACCATTGAGCCTTCTACCAGTACTGAAATGGGCAAAAGATGGCTGATAACAAAT
TACACTTTACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTTTTAAAAAATAGTTCTTA
TGAGGTGTTAAGAAAAGCTTTCGCTTGGATTCATACACAGTTGACCCTTGAACAACACAG
GTTTGGACTGCGCAGAGCCACTTACACCTGGATTTTTTCAATACATATATTGGAAAATTT
TTTGGAGATTTGTATCACTTTGAAAAAACTTAGATGAAACTCGGATGAACTTTTCAATTA
AAATATTGAAAAAAATGAAGAAAAAGGTATGTCATAAATGCAGAAAATGTATACAGATAC
TAGTCTACTTTATCATTTCCTACCATACCAATAGTTAACTATTTTAACTATTAAAAGTTA
AAAATTTATCAAAACTTAAACACACACATACCAACTGTACATGGCACCATTCACAGTTGA
GAGAAACGTGAGCATAAAGATGTGGTATTAAATCATAACTGCATACAATTAATTGCAGTG
CGTACTGTCCTGCTGTGAATATTTCCTAGCCCTCGTGCCGAATC
BF921554
GTGGGTGACCGTGGCTTGCCACTCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTCTTT
CCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAGTG
AGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGCC
AGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGATT
ACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGTG
CATAACTTCTCCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCCACG
ATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCTATC
CCACCAATTACAGGGAAAAAAACGTGTGATGATCCTGAAGCCACGGTCAA
BF920093
TAGAGGATCCCGGTCGACGGTGGTTCAGTGATCATCACACTTTTTCCCTGTAATAGGTGG
GATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCAT
CGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTATG
CACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGT
AATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCT
GGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCT
CACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATCGCACACACTGTTGACGTCATTGG
AAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTGAGTGGCAAGCCACGGTCAACCCA
CAAGCCACGGTCAACCCAC
AV685699
TCTACGTGGTAAGATATGACCTAGCCCTTTTAGGTAAGCGAACTGGTATGTTAGTAACGT
GTACAAAGTTTAGGTTCAGACCCCGGGAGTCTTGGGCATGTGGGTCTCGGGTCACTGGTT
TTGACTTTAGGGCTTTGTTACAGATGTGTGACCAAGGGGAAAATGTGCATGACAACACTA
GAGGTAGGGGCGAAGCCAGAAAGAAGGGAAGTTTTGGCTGAAGTAGGAGTCTTGCGACTG
CATCCGACATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGA
TAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGCTGTCTCTGCTGGTGGC
CACATGGGTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACGAAAGGATCAAGAAGAC
TTCCTTTTCTACCACCACACTACTGCCCCCCATTAAGGTTCTTGTGGTTTACCCATCTGA
AATATGTTTCCATCACACAATTTGTTACTTCACTGAATTTCTTCAAAACCATTGCAGAAG
TGAGGTCATCCTTGAAAGTGGCAGAGTAGCAGAGATGGGTCCAGTGCAGTGGCTTGCCAC
TCGTGCGATGGTCTT
AV650175
GGCACGAGCACTGGCTGAAGGAAGCCAAGAGGATCACTGCTGCTCCTTTNTTCTAGAGGA
AATGTTTGTCTACGTGGTAAGATATGACCTAGCCCTTTTAGGTAAGCGAACTGGTATGTT
AGTAACGTGTACAAAGTTTAGGTTCAGACCCCGGGAGTCTTGGGCATGTGGGTCTCGGGT
CACTGGTTTTGACTTTAGGGCTNTGTTACAGATGTGTGACCAAGGGGAAAATGTGCATGA
CAACACTAGAGCTGACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGACATAAAG
GAACAGTTGTGCTCTGCCCACANACAGGCGTCCCTTTCCCTCTGGATAACAACATAAGCA
AGCCGGGAGGCTGGCTGCCTCTCCTCCTGCTGTCTCTGCTGGTGGCACATGGGTGCTGGT
GGAGGGATCTATCTAATGTGGAGGCACGGATCAAGAAGACTTNCTTNTCTACCACCACAC
TACTGGCCCCAATAAGGGTCTNGTGGNTACCCCATCTGAATATGTTCATACACAATTTGT
ACTCACTGAATTCTCAAAACATTGAGAGTGAGGCATCCTGAAAGTGCGAAAAGANATGCN
AATGGTCAGTGCATGCTGCACTAGCAGCATGGACTT
BX483104
GATCCCGCGCAGTGGCCCGGCGATGTCGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCAG
GAGCGCCGTACCCCGAGAGCCGACCGTTCAATGTGGCTCTGAAACTGGGCCATCTCCAGA
GTGGATGCTACAACATGATCTAATCCCCGGAGACTTGAGGGACCTCCGAGTAGAACCTGT
TACAACTAGTGTTGCAACAGGGGACTATTCAATTTTGATGAATGTAAGCTGGGTACTCCG
GGCAGATGCCAGCATCCGCTTGTTGAAGGCCACCAAGATTTGTGTGACGGGCAAAAGCAA
CTTCCAGTCCTACAGCTGTGTGAGGTGCAATTACACAGAGGCCTTCCAGACTCAGACCAG
ACCCTCTGGTGGTAAATGGACATTTTCCTACATCGGCTTCCCTGTAGAGCTGAACACAGT
CTATTTCATTGGGGCCCATAATATTCCTAATGCAAATATGAATGAAGATGGCCCTTCCAT
GTCTGTGAATTTCACCTCACCAGGCTGCCTAGACCACATAATGAAATATAAAAAAAAGTG
TGTCAAGGCCGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGAGGAGAC
AGTAGAAGTGAACTTCACAACCACTCCCCTGGGAAACAGATACATGGCTCTTATCCAACA
CAGCACTATCATTCGG
CD675121
GTCTTGCATTAGATTCTCAAAAGGGATATGGGACCCAGGAAGTTAAGAACAGTCCTAAAA
TCTCTTTGGCTTCTTTGTCCTGATATGCACCGGCATTTTCACAGTAGGAACTAGGGTTTC
TGTCCAGTTTTTTTGGTTCTTTAAGGAATTAATGTTATTCTGGGTACAACTGCTTACATA
CATAGCACATATAGATGACATTTTTACAGGCCGTCTTGTTAGACTGACATACATGGAGGA
TAGTGCCACCCGCCTCACAAGAACATCAGGTAAGCTCAGGCACAGAGTGCCCAGGAATCT
GTAAGGCTTCGCCCACGCACAAGTCAGGGCTGCCAGTCACCTGGGTTGTCTTCACTTTAT
TTGGCTGCGTCTAATGACACCTTCCAACTTTTGACCCCACCCCTGGACTGTTGTGTAAAC
ATTGTATTTCTCCATCTGTAATGAAAAAGCTAACACATCTCTAACTCCAGAGACATTTTC
CAGAACATGCTGTTCTCAGGCACTAGTGAGGCGGTACCATTATTCCTCATTTGTTATCCA
AATGTTGGCCATGTGACCACACCAAAAGCTCATCCTGGGCCACTGAGACTGGTAATTGAA
TCAGAATATAGTGAAATATTCATTCTCATATATACCCAGCCATCTTACATCTTTGGCTTT
TTTCAGCAGATCCTTGTGGCACTCAGAACATCCATTTTGCACTGTGTATTTTTTTCCCTT
CT
BE081436
TGTGTAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAA
GCCAGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACG
ATTACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGGAGGATGCCACTGCTTTCT
GTGCAGAACTTCTCCATGTCAAGTAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCC
ACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCT
ATCCCACCAATTACAGGGAAAAAACGTGTGATGAT
AW970151
CTGAAATATGTTTCCATCACACAATTTGTTACTTCACTGAATTTCTTCAAAACCATTGCA
GAAGTGAGGTCATCCTTGAAAAGTGGCAGAAAAAGAAAATAGCAGAGATGGGTCCAGTGC
AGTGGCTTGCCACTCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTCTTTCCAATGACG
TCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAGTGAGAACTCTC
AAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGCCAGATTCATC
TGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGATTACAATGCTC
TCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGTGCAGAACTTC
TCCATGTCAAGTAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCCACGATGGCTGCT
GCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCTATCCCACCAATT
ACAGGGAAAAAAACGTGTGATGATCCCTGAAGCTTACTATGCAGCCTACANACAGCCTTA
GTAATAAAACATTTTATCCAATAAAATTTCAAATTTTGCTTAACTATGTGCATAAACTAC
GATTGAAAACTCTTTACACT
AW837146
CATTGTGGTTGCAGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATT
GGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCA
GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAG
TTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGC
ATTGTAATCGTCTTTTGTATCAATCTCCCTAAAGTAGACCACCACGTATTTGTGCAGATG
AATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGA
GTTCTCACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATCGCACACACTGTTGACGTC
ATTGGAAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTGAGTGGCAAGCCACTGCAC
TGGACCCATCT
AW368264
GTGAATAAGCTTTGTTTTTTCCAGACAAAAGCAAGCCAGGAGGCTGGCTGCCTCTCCTCC
TGCTGTCTCTGCTGGTGGCCACATGGTTGCTGGTGGCAGGGATCTATCTAATGTGGAGGC
ACGGTAAGGGTTATAATTCTTTAAAGTCATCCTAGTAAGGAAATAACATTTGGAATTTTT
TTTTAAAGAAGATTCCTCTGGAGGCAATCACCTGTTGGCGTTTCCCAGAGTTAGATAGCA
TTTATGTAATACCTTCAAGTGCTCCTACAGAGACTGATACGAGCATGACTGGATTACACA
TGCCAGGTGAAAGCAGGGCCAGGACTTCCAGATCTTCTGACTGTCCCGTTTTTATTTTTA
CCATTGAGCCTTCTACCAGAACTGAAATGGGCAAAAGATGGCTGATAACAAATTACACTT
TACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTTTAAAAAAATAGTTCTTATGAGGTG
TCAAGAAAAGCTTTCGCTTGGATTCATACACAGTTGACCCTTGAACAACACAG
D25960
GATCCTGAAGCTTACTATGCAGCCTACAAACAGCCTTAGTAATTAAAACATTTTATACCA
ATAAAATTTTCAAATATTGCTAACTAATGTAGCATTAACTAACGATTGGAAACTACATNN
ACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGCTTTAATTGAAAACTATAAC
CATTTTGATAATGCAACANTAAAGCATCTTCAGCCAAA
AV709899
GCAACTTCCAGTCCTACAGCTGTGTGAGGTGCAATTACACAGAGGCCTTCCAGACTCAGA
CCAGACCCTCTGGTGGTAAATGGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAACA
CAGTCTATTTCATTGGGGCCCATAATATTCCTAATGCAAATATGAATGAAGATGGCCCTT
CCATGTCTGTGAATTTCACCTCACCAGGCTGCCTAGACCACATAATGAAATATAAAAAAA
AGTGTGTCAAGGCCGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGAGG
AGACAGTAGAAGTGAACTTCACAACCACTCCCCTGGGAAACAGATACATGGCTCTTATCC
AACACAGCACTATCATCGGGTTTTCTCAGGTGTTTGAGCCACACCAGAAGAAACAAACGC
GAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTC
CATATTTTCCTACTTGTGGCAGCGACTGCATCCGACATAAAGGAACAGTTGTGCTCTGCC
CACAAACAGGCGTNCCTTTTCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTTGGCTG
CTCTCCTTCTGCTGGCCTTTGCTGTGGCCACATTGGTGCTGGTGGCAGGGATCTATCTAA
TGTGGATGCACGTCTCGTGGTTTACCCATCTGAAATATGTTCN
BX431018
ATTTTTCCTCTTGTGGCAGCGACTGGCATCCGACATAAAGGAACAGTTGTGCTCTGCCCA
CAAACAGGCGTCCCTTTCCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCT
CTCCTCCTGCTGTCTCTGCTGGTGGCCACATGGGTGCTGGTGGCAGGGATCTATCTAATG
TGGAGGCACGAAAGGATCAAGAAGACTTCCTTTTCTACCACCACACTACTGCCCCCCATT
AAGGTTCTTGTGGTTTACCCATCTGAAATATGTTTCCATCACACAATTTGTTACTTCACT
GAATTTCTTCAAAACCATTGCAGAAGTGAGGTCATCCTTGAAAAGTGGCAGAAAAAGAAA
ATAGCAGAGATGGGTCCAGTGCAGTGGCTTGCCACTCAAAAGAAGGCAGCAGACAAAGTC
GTCTTCCTTCTTTCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAG
GGCAGTCCCAGTGAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGT
GATCTAAGAAGCCAGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGAT
ACAAAAGACGATTACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCC
ACTGCTTTCTGTGCAGAACTTCTCCATGTCAAGCAGCAGGTGTCAGCAGGAAAAAGATCA
CAAGCCTGCCACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTA
AGGCTTCTATCCCACCANTACAGGNAAAAACGTGTGATGATCCTGAAGCTTACTATGCAG
CCTACAACAGGCTTAGTATTAAAACATTTATACCCATAAATTTTCAAATTGCT
AL535617
TAGGTGACACTATAGAACAAGTTTGTACAAAAAAGCAGGCTGGTACCGGTCCGGAATTCC
CGGGATAGTGGMCCGGCGAKGTCGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCAGGAGC
GCCGTACCCCGAGAGCCGACCGTTCAATGTGGCTCTGAAACTGGGCCATCTCCARAGTGG
ATGSKACAACATGATCTAATCCCGGGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACA
ACTAGTGTTGCAACAGGGGACTATTCAATTTTGATGAATGTAAGCTGGGTACTCCGGGSA
GATGCCAGCATCCGCTTGTTGAAGGCCACCAAGATTTGTGTGAMGGGCAAAAGCAACWTC
CAGTCCTACAGCWGTGTGAGGTAGCAATTACACAGAGAGCACATATCCAGACTCTAGACC
AGACCCTCTGGWGGTAAATGGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAACACA
GTCTATATTCATTGGGGCCCAWAATAWWCCTAATGCAAATATGAATGAAGATGGCCCTTC
CATGTCTGTGAATTTCACCTCACCAGGCTGCCTAGACCACATAATGAAATAWAAAAAAAA
GTGTGTCAAGGCCGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGARGA
GACAGTAGAAGTGAACTTCACAACCACTCCCCTGGGAAACAGATAMATKGCTCTTATCCA
ACACARMACTATCATCGGGTTTTCTCAGGTGTTTGAGCCACACCAGAAGAAACAAACGCG
AGCTTCAGTGGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCC
ATATTTTCCTACTTGTGGCAGCGWCTGCATCCGACATAAAGGAACAGTTGTGCTCTGCCC
ACAAACAGGCGTCCCTTTYCCTCTGGATAACAACAAAAGCAACYGGGAGSTGGYTGYCT
AL525465
WAATWAKADDRATANHTGAAAACTATAACCATTTNTGATAATNGNAANAATAAAGCATCT
TCAGCCAAACATCTAGTCTTCCATAGACCATGCATTGCAGTGTACCCAGAWCTGTTTAGC
TAATATTCTATGTTTAATTAATGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAA
TAGCATCTTAAGTGAAAAACCTTCTATTACATGCAAAAAATCATTGTTTTTAAGATAACA
AAAGTAGGGAATAAACAAGCTGAACCCACTTTTACTGGACCAAATGATCTATTATATGTG
TAACCACTTGTATGATTTGGTATTTGCATAAGACCTTCCCTCTACAAACTAGATTCATAT
CTTGATTCTTGTACAGGTGCCTTTTAACATGAACAACAAAATACCCACAAACTTGTCTAC
TTTTGCCTAAAGTTACCTATTAGAGGTCACTGTSAGAGTKCTCAGTTTCTTAGTTACTAT
TTAASTTTTSATGTTCAAAATGAAAATAATTCTKAAGTKGAAAGSGCTCTTGAAGTAACC
TTTTTATAAATGAGTTATTATAATGGTTTACTTAAATAAAAVAGAGGGGKTTTTGCGGTG
GCTCATGCCTCCAATCCCAGCACTTTGGCAAGGCCAAGGCAAAAVGATCGCTCAAGACCA
GGCTACGTCACAAAGCGAGACCTCCATCTCTACAAAAGATTTAAAAAATTAGCTGAGTGT
GATGGTGTGAGCCTGTGGTCCCAGCTACTAGGGAGGCTGAGATGGGAGGATCACTTGAGC
CCTGGAGGTCAAGGGTGCAGTAAACGGTGATTGTGCCACTGCACTCCATCCTGGGTGAGA
GCAGACCCTGTCTAAAACAAACAAACGAAAAAACCCCCACAGAATGACAGAACATAAAAG
ATGCACATTTTGTCTTCCAACTTTTTACTCTTCTAAAAGCATCTTTTTTAAATTTTTTAA
ATTTTTTTTTTTTTGAGACAGAGTTTCACTCTGTCACACAGGCTGGAGTGMGTGGCGTGA
CTCGGCTCACTAMAACTCTGCYTCCGGGGTYACSCATCTCCTGCWCAGCTCCTGAGAAGC
KGGAYAMAGGMCCACACAAACCAGTAAYTTTATWTTTTGAAAAAGGGTTYACCTGTASMA
GRAGGCTGAATCCGACMAARTMACCMCCACYYCAAADGAGGAWAAGKGKRSMGGSCBGGC
A
BX453536
TTATGGGGGGCAGTAGTGTGGTGGTAGAAAAGGAAGTCTTCTTGATCCTTTCGTGCCTCC
CATTAGATAGATCCCTGCCACCAGCACCCATGTGGCCACCAGCAGAGACAGCAGGAGGAG
AGGCAGCCAGCCTCCCGGCTTGCTTTTGTTGTTATCCAGAGGGAAAGGGACGCCTGTTTG
TGGGCAGAGCACAACTGTTCCTTTATGTCGGATGCAGTCGCTGCCACAAGTAGGAAAATA
TGGAGTCAGCTGCACCGTAGCACCTTCACTATCCCCAGTCACTGGAATCACCACTGAAGC
TCGCGTTTGTTTCTTCTGGTGTGGCTCAAACACCTGAGAAAACCCGATGATAGTGCTGTG
TTGGATAAGAGCCATGTATCTGTTTCCCAGGGGAGTGGTTGTGAAGTTCACTTCTACTGT
CTCCTCATTCTTCTTACAAGCAGTGATGTTCGGATCCCACAGGCTTCCGGCCTTGACACA
CTNTNTTTTATATTTCATTATGTGGTCTAGGCAGCCTGGTGAGGTGAAATTCACAGACAT
GGAAGGGCCATCTTCATTCATATTTGCATTAGGAATATTATGGGCCCCAATGAAATAGAC
TGTGTTCAGCTCTACAGGGGAAGCCGATATAGGAAAATGTCCATTTACCACCAGAGGGTC
TGGTCTGAGTCTTGAAGGCCTTTTGTGTTATTGCACCTTACACAGCTGTTAGACTGGGAA
GTTGCTTTTGCCCCGCACACAAATCTTGTGGGCCTTCAACAGCGGATGCTGCCATTTGCC
CCGAAGTCCCCAGCTCAATTCATTAAAAATTGAATAGGCCCCTTGTGGCAACCCTAGTTG
GTACAGGGTTTTACTTGGGGGGCCCCTCTAAGTTTCCCCGGGATATAAACAAAGTGTGG
BX453537
TTATGGGGGGCAGTAGTGTGGTGGTAGAAAAGGAAGTCTTCTTGATCCTTTCGTGCCTCC
ACATTAGATAGATCCCTGCCACCAGCACCCATGTGGCCACCAGCAGAGACAGCAGGAGGA
GAGGCAGCCAGCCTCCCGGCTTGCTTTTGTTGTTATCCAGAGGGAAAGGGACGCCTGTTT
GTGGGCAGAGCACAACTGTTCCTTTATGTCGGATGCAGTCGCTGCCACAAGTAGGAAAAT
ATGGAGTCAGCTGCACCGTAGCACCTTCACTATCCCCAGTCACTGGAATCACCACTGAAG
CTCGCGTTTGTTTCTTCTGGTGTGGCTCAAACACCTGAGAAAACCCGATGATAGTGCTGT
GTTGGATAAGAGCCATGTATCTGTTTCCCAGGGGAGTGGTTGTGAAGTTCACTTCTACTG
TCTCCTCATTCTTCTTACAAGCAGTGATGTTCGGATCCCACAGGCTTCCGGCCTTGACAC
ACTTTTTTTTATATTTCATTATGTGGTCTAGGCAGCCTGGTGAGGTGAAATTCACAGACA
TGGAAGGGCCATCTTCATTCATATTTGCATTAGGAATATTATGGGCCCCAATGAAATAGA
CTGTGTTCAGCTCTACAGGGAAGCCGATATAGGAAAATGTCCATTTACCACCAGAGGGTC
TGGTCTGAGTCTGGAAGGCCTCTGTGTAATTGCACCTCACACAGCTGTAGGACTGGGAGT
TGCTTTTGCCCGTACACAAATCTTGTTGGCCTTCAACAAGCGGATGCTGGCATCTGGCGG
GGGTACCCAGCTTACATTCATCAAAATTGAATAGTCCCCTTGTTGCAACACTAGTTTGTA
AACAGGTTCTACTCCGGGGGTCCCCTCAGTCTCCCGG
AV728945
CAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCTCACCAGGCTGCCTAG
ACCACATAATGAAATATAAAAAAAAGTGTGTCAAGGCCGGAAGCCTGTGGGATCCGAACA
TCACTGCTTGTAAGAAGAATGAGGAGACAGTAGAAGTGAACTTCACAACCACTCCCCTGG
GAAACAGATACATGGCTCTTATCCAACACAGCACTATCATCGGGTTTTCTCAGGTGTTTG
AGCCACACCAGAAGAAACAAACGCGAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGTG
AAGGTGCTACGGTGCAACTGACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGAC
ATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAAC
AV728939
GCAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCTCACCAGGCTGCCTA
GACCACATAATGAAATATAAAAAAAAGTGTGTCAAGGCCGGAAGCCTGTGGGATCCGAAC
ATCACTGCTTGTAAGAAGAATGAGGAGACAGTAGAAGTGAACTTCACAACCACTCCCCTG
GGAAACAGATACATGGCTCTTATCCAACACAGCACTATCATCGGGTTTTCTCAGGTGTTT
GAGCCACACCAGAAGAAACAAACGCGAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGT
GAAGGTGCTACGGTGCAGCTGACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGA
CATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAAC
AV727345
GCAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCTCACCAGGCTGCCTA
GACCACATAATGAAATATAAAAAAAAGTGTGTCAAGGCCGGAAGCCTGTGGGATCCGAAC
ATCACTGCTTGTAAGAAGAATGAGGAGACAGTAGAAGTGAACTTCACAACCACTCCCCTG
GGAAACAGATACATGGCTCTTATCCAACACAGCACTATCATCGGGTTTTCTCAGGTGTTT
GAGCCACACCAGAAGAAACAAACGCGAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGT
GAAGGTGCTACGGTGCAGCTGACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGA
CATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAAC
AAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGCTGTCTCTGCTGGTGGCCACATGG
GTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACGAAAGGATCAAGAAGACTTCCTTT
TTTACCACCACACTACTGTCTCCCATTAAAGATCTTGTGGTTTATCCATCTGAAATATTG
TTCCATTACACATATTGGTACCTAACTGAAATTCTTTAAAACCATTGCAAATTGAGGTCA
CTCTTGAAAGGGCGTG
鉴定为CHDH的序列
>gi|26011703|gb|CA774243.1|CA774243 in24a07.x1人胎胰1B智人cDNA克隆IMAGE:3′
TAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCTT
ACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAATC
CTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACTT
GGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGT
ACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCC
AATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTG
TCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCC
AAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTCCAAAGTCA
GTACTTACAAACTGGCATTCTTACAGGCTGCACCATTTCCTAGTATGTCTGCTTTAAGCC
TGGTTCAACCTCTCATCGAATATTAAATTTTTCTTTGTA
>gi|23527150|gb|BU679327.1|BU679327 UI-CF-DU1-aau-i-03-0-UI.s1 UI-CF-DU1智人cDNA克隆UI-CF-DU1-aau-i-03-0-UI 3′
TTTTTTTTTTTTTTTCTTACAAAGAAAAATTTAATATTCGATNGAGAGGTTGAACCAGGC
TTAAAGCAGACATACTAGGAAATGGTGCAGCCTGTAAGAATGCCAGTTTGTAAGTACT
GACTTTGGAAAAGATCATCGCCTCTATCAGACACTTAGGGTCCTGGTCTGGCAATTTTG
GCCTGATGTGATGCCACAAGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTG
ACAGTGGTGTAGCCCTTTAGGAGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCAT
TGGCACCGAAGGAACCAGGAGGATAAGAATATCCATAATTTCAGAGCTGCCCTGGCAC
AGTACCTGCCCCGTCGGAGGCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTC
CCAAGTATAAAAATTATTACACAGTTTTATTCTGAAGAACATTTTGCATTTTAATAAAA
AAGGATTTATGTCAGGAAAGAGTCATTTACAAACCTTGAAGTGTTTTTGCCTGGATCAG
AGTAAGAATGTCTTAAGAAGAGGTTTGTAAGGTCTTCATAACANAGTGGTGTTTGTTAT
TTACAAAAAAAAAAAAAAAAAAAATAAAAAAAAAAAAAAAAACCTCGTGCCGAATTC
T
>gi|23274053|gb|BU608029.1|BU608029 UI-CF-FN0-aes-1-02-0-UI.s1 UI-CF-FN0智人cDNA克隆UI-CF-FN0-aes-1-02-0-UI 3′
TTTTTTTTTTTTTTTTGTAAATAACAAACACCACTTTGGTTATGAAGACCTTACAAACCT
CTTCTTAAGACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACT
CTTTCCTGACATAAATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTG
TAATAATTTTTATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGC
CTCCGACAGGGCAGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTC
CTGGTTCCTTCGGTGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCT
AAAGGGCTACACCACTGTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTG
TGGCATCACATCAGGCCAAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGA
TGATCTTTTCCAAAGTCAGTACTTACAAACTGGCATTCTTACAGGCTGCACCATTTCCTA
GTATGTCTGCTTTAAGCCTGGTTCAACCTCTCATCGAATATTAAATTTTTCTTTGTAAGA
AAAATTTGAAGTTGTAGAGCATGGTTTTTTGTTTTCCCTTGTCTTAGGAAAGTTTTAAGA
TGAAATGTTTTTCC
>gi|11451784|gb|BF439267.1|BF439267 nab62a07.x1 Soares_NSF_F8_9W_OT_PA_P_S1智人cDNA克隆IMAGE:3272340 3′
TTTTTTTTTTTTTTGGGCCAAAATTTTTAATAGTATACAGACAACCTGTTAATTTTTTTTT
TTTTTTTTTTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTTTT
AAGACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTTTTTCC
TGACATAAATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATA
ATTTTTATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCG
ACGGGGCAGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGT
TCCTTCGGTGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGG
GCTACACCACTGTCAACATTATCCTGG
>gi|11448468|gb|BF436153.1|BF436153 nab77h10.x1 Soares_NSF_F8_9W_OT_PA_P_S1智人cDNA克隆IMAGE:3273859 3′
TTTTTTTTTGGTCCAAAATTTTTAATAGTATACAGACAACCTGTTAATTTTTTTTTTTTTT
TTTTTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGAC
ATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACAT
AAATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTA
TACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGC
AGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGG
TGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACC
ACTGTCAACATTATCCTGGACTC
>gi|10033200|gb|BE672659.1|BE672659 7b71b03.x1 NCI_CGAP_Lu24智人cDNA克隆IMAGE:3233645 3′
TTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACAT
TCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATA
AATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTAT
ACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACAGGGCA
GGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGT
GCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACC
ACTGTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCA
GGCCAAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTCCAAA
GTCAGTACTTACAAACTGGCATTCTTACAGGCTGCACCATTTCCTAGTATGTCTGCTTTA
AGCCTGGTTCAACC
>gi|6837905|gb|AW341279.1|AW341279 xz97e03.x1 NCI_CGAP_Lu24智人cDNA克隆IMAGE:2872156 3′
TAAATAACTAACACCATTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCTTA
CTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAATCC
TTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACTT
GGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGT
ACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCC
AATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTG
TCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCC
AAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTCCAAAGTCA
GTACTTACAAACTGGCATTCTTACAGGCTGCACCATTTCCTAGTATGTCTG
>gi|5543775|gb|AI869807.1|AI869807 wm04b02.x1 NCI_CGAP_Ut4智人cDNA克隆IMAGE:2434923 3′
GTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCT
TACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAAT
CCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACT
TGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGCAGGTA
CTGTGCCAGGGCAGCTCTGAAATATGGATATTCTTACCTCCTGGTTCTTTCGGTGCAAAT
GGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCT
>gi|5543768|gb|AI869800.1|AI869800 wm04a03.x1 NCI_CGAP_Ut4智人cDNA克隆IMAGE:2434924 3′
GTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCT
TACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAAT
CCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACT
TGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGNGCAGGT
ACTGTGCCAGGGCAGCTCTGAATTATGGATATTCTTATCCTCCTG
>gi|4610281|gb|AI601252.1|AI601252 ar88c09.x1 Barstead结肠HPLRB7智人cDNA克隆IMAGE:2152336 3′
TTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACAT
TCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATA
AATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTAT
ACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCA
GGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGT
GCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACC
ACTGTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCA
GGCCAAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTCCAAA
GTCAGTACTTACAAACT
>gi|4330088|gb|AI467998.1|AI467998 tj84e10.x1 Soares_NSF_F8_9W_OT_PA_P_S1智人cDNA克隆IMAGE:2148234 3′
TTTTTTTTTTTTTTTTTGGTCCAAAATTTTTAATAGTATACAGACAACCTGTTAATTTTTT
TTTTTTTTTTTTTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTT
CTTAAGACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTT
TCCTGACATAAATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTA
ATAATTTTTATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCT
CCGACGGGGCAGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCT
GGTTCCTTCGGTGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAA
AGGGCTACACCACTGTCAACATTATCC
>gi|4311745|gb|AI459166.1|AI459166 tj65h07.x1 Soares_NSF_F8_9W_OT_PA_P_S1智人cDNA克隆IMAGE:2146429 3′
TTTTTTTTTGGTCCAAAATTTTTAATAGTATACAGACAACCTGTTAATTTTTTTTTTTTTT
TTTTTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGAC
ATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACAT
AAATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTA
TACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGC
AGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGG
TGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATT
T
>gi|4222874|gb|AI393327.1|AI393327 tg44a12.x1 Soares_NFL_T_GBC_S1智人cDNA克隆IMAGE:2111614 3′
TTTATATTATTCACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCTTA
CTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAATCC
TTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACTTG
GGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACAGGGCAGGTAC
TGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCCAA
TGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTC
AACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCCAA
AATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTT
>gi|3933768|gb|AI290994.1|AI290994 qm09e05.x1 NCI_CGAP_Lu5智人cDNA克隆IMAGE:1881344 3′
TAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCTT
ACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAATC
CTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACTT
GGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGT
ACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCC
AATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTG
TCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCC
AAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGA
>gi|3844395|gb|AI248998.1|AI248998 qh80f04.x1 Soares_胎_肝_脾_1NFLS_S1智人cDNA克隆IMAGE:1851007 3′
TGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTC
TTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAA
TCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATAC
TTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGG
TACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGC
CAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACT
GTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGC
CAAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTCCAAAGTC
AGTACTTACAAACTGGCATTCTTACAG
>gi|3405022|gb|AI075844.1|AI075844 oz16d08.x1 Soares_胎_肝_脾_1NFLS_S1智人cDNA克隆IMAGE:1675503 3′
TTTTTTTTTTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTT
AAGACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCC
TGACATAAATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATA
ATTTTTATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCG
ACGGGGCAGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGT
TCCTTCGGTGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGG
GCTACACCACTGTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTG
>gi|3307963|gb|AI051972.1|AI051972 ow83h10.x1 Soares_胎_肝_脾_1NFLS_S1智人cDNA克隆IMAGE:1653475 3′
TTTTTTTTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAA
GACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTG
ACATAAATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAAT
TTTTATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGAC
AGGGCAGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTC
CTTCGGTGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGC
TACACCACTGTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGAGTCTTGTGGCATC
ACATCAGGCCAAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTT
>gi|3254601|gb|AI033648.1|AI033648 ow22e09.x1 Soares_甲状旁腺_肿瘤_NbHPA智人cDNA克隆IMAGE:1647592 3′
TGTAAATAACAAACACCACTTGGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTC
TTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAA
TCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATAC
TTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGG
TACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGC
CAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACT
GTCAACATTATCCTGGACTC
>gi|3229367|gb|AI015031.1|AI015031 ot30f04.s1 Soares_睾丸_NHT智人cDNA克隆IMAGE:1618303 3′
TTTTTCTTACAAAGAAAAATTTAATATTCGATGAGAGGTTGAACCAGGCTTAAAGCAGA
CATACTAGGAAATGGTGCAGCCTGTAAGAATGCCAGTTTGTAAGTACTGACTTTGGAAA
AGATCATCGCCTCTATCAGACACTTAGGGTCCTGGTCTGGCAATTTTGGCCTGATGTGA
TGCCACAAGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTGACAGTGGTGTA
GCCCTTTAGGAGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCATTGGCACCGAAG
AGACCAGGAGGATAAGAATATCCATAATTTCAGAGCTGCCCTGGCACAGTACCTGCCC
CGTCGGAGGCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTCCCAAGTATAA
AAATTATTACACAGTTTTATTCTG
>gi|3055333|gb|AA915941.1|AA915941 on18d06.s1 NCI_CGAP_Lu5智人cDNA克隆IMAGE:1557035 3′
TTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATT
CTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAA
ATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATA
CTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGAAGGGGCAG
GTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTG
CCAATGGTAACCTAATACCAGCCGCAGGAGCGCCATTTCTCCTAAAGGGCTACACCACT
GTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGC
CAAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTCCAAAGTC
AGTACTTA
>gi|2953300|gb|AA861160.1|AA861160 ak36b12.s1 Soares_睾丸_NHT智人cDNA克隆IMAGE:1408031 3′
TTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACAT
TCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATA
AATCCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTAT
ACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGAC
>gi|1782040|gb|AA192157.1|AA192157 zq02g05.s1 Stratagene肌肉937209智人cDNA克隆IMAGE:628568 3′
GTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCT
TACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAAT
CCTTTTTTATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACT
TGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGT
ACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCC
AATGGTAACCTAATACCAGCCGCAGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGT
CAACATTATCCTGGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCC
AAAATTGGCCAGACCAGGACCCCAAGTGGTCTGATAGAAGGCGATGATCTTTTCCAAA
GTCAGTACTTACA
>gi|1230953|gb|N73668.1|N73668 yz78h05.s1 Soares_多发性_硬化_2NbHMSP智人cDNA克隆IMAGE:289209 3′
GGTCCAAAATTTTTAATAGTATACAGACAACCTGTTAATTTTTTTTTTTTTTTTTTTTGTA
AATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCTTAC
TCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATCGACTCTTTCCTGACATAAATCC
TTTTTTATTAAAATNGCAAAATTGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACT
TGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGT
ACTGTGCCAGGGCAGCTCTGAAATTATGGAAATTCTTATCCCCCTGGTTCCTNCGGTGG
CCAATGGGTAACCTAATACCAGCCCGCGGGAAGCGCCAATTTCNCCCAAAAGGGGGTA
AACCACTGGTNAAACATTA
>gi|2142013|gb|AA437099.1|AA437099 zv53b09.s1 Soares_睾丸_NHT智人cDNA克隆IMAGE:757337 3′
CTTACAAAGAAAAATTTAATATTCGATGAGAGGTTGAACCAGGCTTAAAGCAGACATA
CTAGGAAATGGTGCAGCCTGTAAGAATGCCAGTTTGTAAGTACTGACTTTGGAAAAGAT
CATCGCCTCTATCAGACACTTAGGGTCCTGGTCTGGCAATTTTGGCCTGATGTGATGCC
ACAAGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTGACAGTGGTGTAGCCC
TTTAGGAGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCATTGGCACCGAAGAGAC
CAGGAGGATAAGAATATCCATAATTTCAGAGCTGCCCTGGCACAGTACCTGCCCCGTCG
GAGGCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTCCCAAGTATAAAAATT
AT
>gi|3836330|gb|AI240933.1|AI240933 qk01b11.x1 NCI_CGAP_Kid3智人cDNA克隆IMAGE:1867677 3′
TTTTTTTTTTTTTTTTTTTTGGTCCAAAATTTTTAATAGTATACAGACAACCTGTTAATTT
TTTTTTTTTTTTTTTTTGGAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCT
CTTCTTAAGACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGGAAATGACT
CTTTCCTGACATAAATCCTTTTTTATTAAAATGCAAAAGGTTCTTCAGAATAAAACTGTG
TAATAATTTTTATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAG
>gi|2669971|gb|AA682690.1|AA682690 zj86f07.s1 Soares_胎_肝_脾_1NFLS_S1智人cDNA克隆IMAGE:461797 3′
AATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTTTTATACTTGGGATGTGCTC
CTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCGACAGGCAGGTACTGTGCCAGGGC
AGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCTGTGCTCAATGGTAACCTA
ATACCAGCCGCAGGACNCGCCATTTCTCCTAAAGGGCTACACCACTGTCAACATTATC
>gi|1162804|gb|N39597.1|N39597 yy51e04.s1 Soares_多发性_硬化_2NbHMSP智人cDNA克隆IMAGE:277086 3′
ACAAAGAAAAATTTAATATTCGATGAGAGGTTGAACCAGGCTTAAAGCAGACATACTA
GGAAATGGTGCAGCCTGTAAGAATGCCAGTTTGTAAGTACTGACTTTGGAAAAGATCAT
CGCCTCTATCAGACACTTAGGGTCCTGGTCTGGCAATTTTGGCCTGATGTGATGCCACA
AGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTGACAGTGGTGTAGCCCTTT
AGGAGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCATTGGCACCGAAGAACCAG
GAGGATAAGAATATCCATAATTTCAGAGCTTGCCCTGGCACAGTACCTGCCCCGTCGGA
GGCTCTCACTGGGCAAATGGACAGCTCTGTGCAAGGAGCACTCCCAAGTATAANAATT
ATTACACAGTTTTATTCTGAAGAACATTTTGCATTTTAATAAAAAANGGA
>gi|3838507|gb|AI243110.1|AI243110 qh26f06.x1 Soares_NFL_T_GBC_S1智人cDNA克隆IMAGE:1845827 3′
TTTTTCTTACAAAGAAAAATTTAATATTCGATGAGAGGTTGAACCAGGCTTAAAGCAGA
CATACTAGGAAATGGTGCAGCCTGTAAGAATGCCAGTTTGTAAGTACTGACTTTGGAAA
AGATCATCGCCTCTATCAGACACTTAGGGTCCTGGTCTGGCAATTTTGGCCTGATGTGA
TGCCACAAGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTGACAGTGGTGTA
GCCCTTTAGGAGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCATTGGCACCGAAG
GAACCAGGAGGATAAGAATATCCATAATTTCAGAGCTGCCCTGGCACAGTACCTGCCC
CGTCGGAGGCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTC
鉴定为QPRT集簇的序列
BC005060
1   caccagccca gacagctgca agtcaccatg gacgctgaag gcctggcgct gctgctgccg
61  cccgtcaccc tggcagccct ggtggacagc tggctccgag aggactgccc agggctcaac
121 tacgcagcct tggtcagcgg ggcaggcccc tcgcaggcgg cgctgtgggc caaatcccct
181 gggatactgg cagggcagcc tttcttcgat gccatattta cccaactcaa ctgccaagtc
241 tcctggttcc tccccgaggg atcgaagctg gtgccggtgg ccagagtggc cgaggtccgg
301 ggccctgccc actgcctgct gctgggggaa cgggtggccc tcaacacgct ggcccgctgc
361 agtggcattg ccagtgctgc cgccgctgca gtggaggccg ccaggggggc cggctggact
421 gggcacgtgg caggcacgag gaagaccacg ccaggcttcc ggctggtgga gaagtatggg
481 ctcctggtgg gcggggccgc ctcgcaccgc tacgacctgg gagggctggt gatggtgaag
541 gataaccatg tggtggccgc cggtggcgtg gagaaggcgg tgcgggcggc cagacaggcg
601 gctgacttcg ctctgaaggt ggaagtggaa tgcagcagcc tgcaggaggc cgtgcaggca
661 gctgaggctg gtgccgacct tgtcctgctg gacaacttca agccagagga gctgcacccc
721  acggccaccg tgctgaaggc ccagttcccg agtgtggctg tggaagccag tgggggcatc
781  accctggaca acctccccca gttctgcggg ccgcacatag acgtcatctc catggggatg
841  ctgacccagg cggccccagc ccttgatttc tccctcaagc tgtttgccaa agaggtggct
901  ccagtgccca aaatccacta gtcctaaacc ggaagaggat gacaccggcc atgggttaac
961  gtggctcctc aggaccctct gggtcacaca tctttagggt cagtggccaa tggggcacat
1021 ttggcactag cttgagccca actctggctc tgccacctgc tgctcctgtg acctgtcagg
1081 gctgacttca cctctgctca tctcagtttc ctaatctgta aaatgggtct aataaaggat
1141 caaccacatg gggttctgcg gtgataatga gcacatagtg aggggtcagc aaatgtcaga
1201 agttacctgg gacagccggg cacgatggct cacacctgta atcccagcac tttgggaggc
1261 tgaggcggga agatcacttg agttcaggag tttgagacca gcctggccaa catggtgaaa
1321 ccccatctct accaaaaata gaagaattag ctgggtgtgg tggcacgcgc ctgtaatccc
1381 agctacttag gaggctgagg caggagaatc gcttgaaccc aggaagtgga ggttgcagtg
1441 agctgatggt gccactgcac tccagcctgg gtgatagagc gagactctgt ctccaaagaa
1501 gaaacaaaaa aaaaaaaaaa aaaa
BE299670
1   gtggccacca ctcagctcga tgcaacctac acttcctggg ttcaagcgat tctcctgcct
61  cagcctccta agtagctggg attacaggcg cgtgccacca cacccagcta attcttctat
121 ttttggtaga gatggggttt caccatgttg gccaggctgg tctcaaactc ctgaactcaa
181 gtgatcttcc cgcctcagcc tcccaaagtg ctgggattac aggtgtgagc catcgtgccc
241 ggctgtccca ggtaacttct gacatttgct gacccctcac tatgtgctca ttatcaccgc
301 agaaccccat gtggttgatc ctttattaga cccattttac agattaggaa actgagatga
361 gcagaggtga agtcagccct gacaggtcac aggagcagca ggtggcagag ccagagttgg
421 gctcaagcta gtgccaaatg tgccccattg gccactgacc ctaaaagatg tgtgacccag
481 agggtcctga ggagccacgt taacccatgg ccggtgtcat cctcttccgg tttaggacta
541 gtggattttc gggcactgga gccacctctt tggcaaacta gctttgaggg agaaatcaag
601 ggctggggcc gctgggtcag catccccatg gagatgacgt ctatgtgcgg ccgccgaact
661 gggggaggtt gtccaggttg atgccccact ggcttcccag ccacactcgg gaaccggggc
721 ttccgcacgg tggccgttgg ggtgcagctc ctctggcttg aagttgtcca gcaggccaag
781 gtcggcacgc tcagctgctg cacgctctgc agctgcgtcc cactccactt cgagcaaccg
841 cgctgtttgc cgccaacgct atcaggcacg gggcacctgt atcttacctc ccgcccccgt
901 taggggcggg cccacaggca ttcacgcgac tggtaacccg agccgaccgc cggcaggaga
961 caggcgtgcc acgaggccac cgtcgcagtt tcgtcccgtg cctc
BE273102
1   atggacgctg aaggcctggc tgctgctgct gcctgccctg tcacccttgc agccctggtg
61  gacagcgtgg ctccgagagg actgcccagt ggctcaacta cgcagccttg gtcagcgggg
121 caggcccctc cgcagtgcgg cgcgttgtgg ggcaagatcc cctgggtgta ctggcagtgg
181 cagccgtttc gttcgatgcc gatatttacc cagactcaac ttgccaaggt ctccttggtt
241 ccgtcccctg agggcgatcg aagcttggtt gcctggttgg gccagagttg gcctgagtgt
301 cctgtgtggc cgctgccgca cttgccttgc ttggctgggg ggaacggggt tggccgcgtc
361 aagcactgct tgtgccctgg ctgcatgttg tgcatttgcc catgtgcttg cctggcctgc
421 ttgcatgttg tgagtgcctg cccagtgtgg tgcctgtgct gtgagctggt gcacgtgtgt
481 gcagtggcga ctgagggaat gacccactgc ccgaggggct tcctggcctg tgttggacgc
541 aacgtattgg ggcgtcctgt gtgggcgggg gcgcgcgctc tgcaccggct tacggaccct
601 gggtgagggc tgcgtgcatg cgtgaagggg attaacgcat gttgttttgg cccgcctggt
661 ggcgctgtgt gacagtgcgg tgctggcctg tgccaacatg gcgtgctgac gttcgggtc
BC010033
1   cagacagctg caagtcacca tggacgctga aggcctggcg ctgctgctgc cgcccgtcac
61  cctggcagcc ctggtggaca gctggctccg agaggactgc ccagggctca actacgcagc
121 cttggtcagc ggggcaggcc cctcgcaggc ggcgctgtgg gccaaatccc ctggggtact
181 ggcagggcag cctttcttcg atgccatatt tacccaactc aactgccaag tctcctggtt
241 cctccccgag ggatcgaagc tggtgccggt ggccagagtg gccgaggtcc ggggccctgc
301 ccactgcctg ctgctggggg aacgggtggc cctcaacacg ctggcccgct gcagtggcat
361 tgccagtgct gccgccgctg cagtggaggc cgccaggggg gccggctgga ctgggcacgt
421 ggcaggcacg aggaagacca cgccaggctt ccggctggtg gagaagtatg ggctcctggt
481 gggcggggcc gcctcgcacc gctacgacct gggagggctg gtgatggtga aggataacca
541 tgtggtggcc gccggtggcg tggagaaggc ggtgcgggcg gccagacagg cggctgactt
601 cgctctgaag gtggaagtgg aatgcagcag cctgcaggag gccgtgcagg cagctgaggc
661 tggtgccgac cttgtcctgc tggacaactt caagccagag gagctgcacc ccacggccac
721  cgtgctgaag gcccagttcc cgagtgtggc tgtggaagcc agtgggggca tcaccctgga
781  caacctcccc cagttctgcg ggccgcacat agacgtcatc tccatgggga tgctgaccca
841  ggcggcccca gcccttgatt tctccctcaa gctgtttgcc aaagaggtgg ctccagtgcc
901  caaaatccac tagtcctaaa ccggaagagg atgacaccgg ccatgggtta acgtggctcc
961  tcaggaccct ctgggtcaca catctttagg gtcagtggcc aatggggcac atttggcact
1021 agcttgagcc caactctggc tctgccacct gctgctcctg tgacctgtca gggctgactt
1081 cacctctgct catctcagtt tcctaatctg taaaatgggt ctaataaagg atcaaccaca
1141 tggggttctg cggtgataat gagcacatag tgaggggtca gcaaatgtca gaagttacct
1201 gggacagccg ggcacgatgg ctcacacctg taatcccagc actttgggag gctgaggcgg
1261 gaagatcact tgagttcagg agtttgagac cagcctggcc aacatggtga aaccccatct
1321 ctaccaaaaa tagaagaatt agctgggtgt ggtggcacgc gcctgtaatc ccagctactt
1381 aggaggctga ggcaggagaa tcgcttgaac ccaggaagtg gaggttgcag tgagctgatg
1441 gtgccactgc actccagcct gggtgataga gcgagactct gtctccaaag aagaaaaaaa
1501 aaaaaaaaaa a
BC018910
1    gtcctgagca gccaacacac cagcccagac agctgcaagt caccatggac gctgaaggcc
61   tggcgctgct gctgccgccc gtcaccctgg cagccctggt ggacagctgg ctccgagagg
121  actgcccagg gctcaactac gcagccttgg tcagcggggc aggcccctcg caggcggcgc
181  tgtgggccaa atcccctggg gtactggcag ggcagccttt cttcgatgcc atatttaccc
241  aactcaactg ccaagtctcc tggttcctcc ccgagggatc gaagctggtg ccggtggcca
301  gagtggccga ggtccggggc cctgcccact gcctgctgct gggggaacgg gtggccctca
361  acacgctggc ccgctgcagt ggcattgcca gtgctgccgc cgctgcagtg gaggccgcca
421  ggggggccgg ctggactggg cacgtggcag gcacgaggaa gaccacgcca ggcttccggc
481  tggtggagaa gtatgggctc ctggtgggcg gggccgcctc gcaccgctac gacctgggag
541  ggctggtgat ggtgaaggat aaccatgtgg tggccgccgg tggcgtggag aaggcggtgc
601  gggcggccag acaggcggct gacttcgctc tgaaggtgga agtggaatgc agcagcctgc
661  aggaggccgt gcaggcagct gaggctggtg ccgaccttgt cctgctggac aacttcaagc
721  cagaggagct gcaccccacg gccaccgtgc tgaaggccca gttcccgagt gtggctgtgg
781  aagccagtgg gggcatcacc ctggacaacc tcccccagtt ctgcgggccg cacatagacg
841  tcatctccat ggggatgctg acccaggcgg ccccagccct tgatttctcc ctcaagctgt
901  ttgccaaaga ggtggctcca gtgcccaaaa tccactagtc ctaaaccgga agaggatgac
961  accggccatg ggttaacgtg gctcctcagg accctctggg tcacacatct ttagggtcag
1021 tggccaatgg ggcacatttg gcactagctt gagcccaact ctggctctgc cacctgctgc
1081 tcctgtgacc tgtcagggct gacttcacct ctgctcatct cagtttccta atctgtaaaa
1141 tgggtctaat aaaggatcaa ccacaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa
1201 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa
BE902622
1   agcccagaca gctgcaagtc acatggacgc tgaaggcctg gcgctgctgc tgccgcccgt
61  caccctggca gccctggtgg acagctggct ccgagaggac tgcccagggc tcaactacgc
121 agccttggtc agcggggcag gcccctcgca ggcggcgctg tgggccaaat cccctggggt
181 actggcaggg cagcctttct tcgatgccat atttacccaa ctcaactgcc aagtctcctg
241 gttcctcccc gagggatcga agctggtgcc ggtggccaga gtggccgagg tccggggccc
301 tgcccactgc ctgctgctgg gggaacgggt ggccctcaac acgctggccg ctgcagtggc
361 attgccagtg ctgccgccgc tgcagtggag gccgcagggg ggccggctgg actgggcacg
421 tggcaggcac gaggaagacc acgccaggct tccggctggt ggagaagtat gggctcctgg
481 tgggcgggcc gctcgcaccg tacgacctgg gagggctggt gatggtgaag gataaccatg
541 tggtggccgc cggtggcgtg gagaaggcgg tgcgggcggc agacaggcgg tgacttcgct
601 ctgaaggtgg aagtggaatg cagcagcctg caggaggccg tgcaggcagt gaggctggtg
661 cgacttgtcc tgctggacaa ttcagccaga ggagctgcac ccagggcacg tgctgaaggc
721 cagtccgagt gtggtgtgga accaggtggg ggatcacctg gaaacctccc caatctgcgg
N23182
1   gtggttgatc ctttattaga cccattttac agattaggaa actgagatga gcagaggtga
61  agtcagccct gacaggtcac aggagcagca ggtggcagag cagaggttgg gctcaagcta
121 gtgccaaatg tgccccattg gccactgacc ctaaagatgt gtgacccaga ggncttgagg
181 agccacgtta acccatggcc ggtgtcatcc tcttccggtt taggactagt ggattttggg
241 cactggagcc acctctttgg caaacagctt gaagggagaa atcaagggct ggggccgcct
301 gggtcagcat ccccatggag atgacgtcta tntgcggccc gcagaactgg gggaggttgt
361 ccagggtgat gcccccactg gcttccacag ccacactcgg gaactgggcc ttcagcacgg
421 tggccgtg
N32648
1   agccaacaca ccannccaga cagctgcaag tcaccatgga cgctgaaggc tggcgctgct
61  gctgccgccc gtcaccctgg cagccctggt ggacagctgg ctccgagaga ctgcccaggg
121 ctcaactacg cagccttggt cagcggggca ggccctcgca ggcggcgctg tgggccaaat
181 cccctggggt actggcaggg cagcctttct tcgatgccat atttacccaa ctcaactgcc
241 aagtctcctg gttcctcccc 9agggatcga agctggtgcc ggtgncagag tggcgaaggt
301 ccggggccct gccaactgcc tgctgctggg ggaacgggtg gccctcaaca cgctggcccg
361 ctgcagtggc attncagtgc tgccgccgct g
BE735342
1   tagtcaggct gggtgttaat cggcaccgag ggcaagtcac catggacgct gaaggctggc
61  gctgctgctg ccgcccgcac cctggcagcc ctggtggaca gctggctccg agaggactgc
121 ccaggctcaa ctacgcagcc ttggtcagcg gggcaggccc ctcgcaggcg gcgctgtggg
181 ccaaatcccc tggggtactg gcagggcagc ctttcttcga tgccatattt acccaactca
241 actgccaagt ctcctggttc ctccccgagg gatcgaagct ggtgccggtg gccagagtgg
301 ccgaggtccg gggccgcctc gcaccgctac gacctgggag ggctggtgat ggtgaaggat
361 aaccatgtgg tggccgccgg tggcgtggag aaggcggtgc gggcggccag acaggcggct
421 gacttcgctc tgaaggtgga agtggaatgc agcagcctgc aggaggccgt gcaggcagct
481 gaggctggtg ccgaccttgt cctgctggac aacttcaagc cagaggagct gcaccccacg
541 gccaccgtgc tgaaggccca gttcccgagt gtggctgtgg aagccagtgg gggcatcacc
601 ctggacaact cccccagttc tgcgggccgc acatagacgt catctccatg gggatgctga
661 cccaggcggc ccagcccttg atttctccct caagctgttt tgccacagag gtggctccag
721 tgcccaaaaa tcactagtcc taaaccggaa gaggatgaca ccggcatggg taacgtggct
781 cctcagaccc tctgggtcac acatcttagg gtccaggcca atgggcccat ttggccctac
841 ttgagcccaa tctggtctgc actgctgtct gtgaccgtca gggtagcttc acttctgctc
901 ctctcagttc taacctgtaa cggtcctcta agcgtcaccc caaaaaaaaa aaactcggtc
961 ttttcgtcgg cgaaaggtcg aaggctgtcc gtccgcacct g
BX283118
1   gacagctgca agtcaccatg gacgctgaag gcctggcgct gctgctgccg cccgtcaccc
61  tggcagccct ggtggacagc tggctccgag aggactgccc agggctcaac tacgcagcct
121 tggtcagcgg ggcaggcccc tcgcaggcgg cgctgtgggc caaatcccct ggggtactgg
181 cagggcagcc tttcttcgat gccatattta cccaactcaa ctgccaagtc tcctggttcc
241 tccccgaggg atcgaagctg gtgccggtgg ccagagtggc cgaggtccgg ggccctgccc
301 actgcctgct gctgggggaa cgggtggccc tcaacacgct ggcccgctgc agtggcantg
361 ccagtgctgc cgccgctgca gtggaggccg ccaggggggc cggctggact gggcacgtgg
421 caggcacgag gaagaccacg ccaggcttcc ggctggtgga gaagtatggg ctcctggtgg
481 gcggggccgc ctcgcaccgc tacgacctgg gaggg
BG769505
1   ggacgctgaa ggcctggcgc tggtgctgcc gcccgtcacc ctggcagccc tggtggacag
61  ctggctccga gaggactgcc cagggctcaa ctacgcagcc ttggtcagcg gggcaggccc
121 ctcgcaggcg gcgctgtggg ccaaatcccc tggggtactg gcagggcagc ctttcttcga
181 tgccatattt acccaactca actgccaagt ctcctggttc ctccccgagg gatcgaagct
241 ggtgccggtg gccagagtgg ccgaggtccg gggccctgcc cactgcctgc tgctggggga
301 acgggtggcc ctcaacacgc tggcccgctg cagtggcatt gccagtgctg ccgccgctgc
361 agtggaggcc gccagggggg ccggctggac tgggcacgtg gcaggcacga ggaagaccac
421 gccaggcttc cggctggtgg agaagtatgg gctcctggtg ggcggggccg cctcgcaccg
481 ntacgacctg ggagggctgg tgatggtgaa ggataaccat gtggtggccg ccggtggcgt
541 ggagaaggcg gtgcgggcgg cagacaggcg gctgacttcg ctctgaacgg tggcaagtgg
601 actgcagcag cctgcagcga ggccgtgcag gcagctgagg ctggtgccga ccttgtcctg
661 ctggacaact tcaagccaga ggagctgcaa ccccacggcc acgtgctgaa ggccagttcc
721 agagtgtggc tgtggacgcc agtggcggca tcacctggac aacctccccc agttctgcgg
781 gccgcacata gacgtcatct tccatggcga tgctgaccca ggcggcccca gccctggatt
841 tctcctcagc tggttgcaca gaggtgcctc agtgcccaaa tcactcatct aacc
BG750434
1  ggacagctgc aagtcaccat ggacgctgaa ggcctggcgc tgctgctgcc gcccgtcacc
61 ctggcagccc tggtggacag ctggctccga gaggactgcc cagggctcaa ctacgcagcc
121 ttggtcagcg gggcaggccc ctcgcaggcg gcgctgtggg ccaaatcccc tggggtactg
181 gcagggcagc ctttcttcga tgccatattt acccaactca actgccaagt ctcctggttc
241 ctccccgagg gatcgaagct ggtgccggtg gccagagtgg ccgaggtccg gggccctgcc
301 cactgcctgc tgctggggga acgggtggcc ctcaacacgc tggcccgctg cagtggcatt
361 gccagtgctg ccgccgctgc agtggaggcc gccagggggg ccggctggac tgggcacgtg
421 gcaggcacga ggaagaccac gccaggcttc cggctggtgg agaagtatgg gctcctggtg
481 ggcggggccg cctcgcaccg ctacgacctg ggagggctgg tgatggtgaa cggataacca
541 tgtggtggcc gccggtggcg tggagaaggc ggtgcgggcg gccagaccag gcggctgact
601 tcgctctgaa ggtggaagtg gaatgcagca gcctgcagga ggccgtgcag gcagcttgag
661 gctggtgccg accttgtcct gcttggacaa cttcaaagcc aggaggagct ggacccacgg
721 ccaccgtgct gaaggccagt tcccgagtgt ggctgtggaa gccagtgggg gcatcagcct
781 ggacaagctc cccccagttc ctggagggcc cgcacattaa accgtcatct ccatggggga
841 ttgctgaacc aaggcggacc cagcccttgg atttctcctc aagctgttgc cacaggaggt
901 ggtccagtgg ccaaaatcca ctagtcctaa acgggaagga tgacccgggc catggttacc
961 gggtcctaag acct
BG766440
1   ggctgcaagt caccatggac gctgaaggcc tggcgctgct gctgccgccc gtcaccctgg
61  cagccctggt ggacagctgg ctccgagagg actgcccagg gctcaactac gcagccttgg
121 tcagcggggc aggcccctcg caggcggcgc tgtgggccaa atcccctggg gtactggcag
181 ggcagccttt cttcgatgcc atatttaccc aactcaactg ccaagtctcc tggttcctcc
241 ccgagggatc gaagctggtg ccggtggcca gagtggccga ggtccggggc cctgcccact
301 gcctgctgct gggggaacgg gtggccctca acacgctggc ccgctgcagt ggcattgcca
361 gtgctgccgc cgctgcagtg gaggccgcca ggggggccgg ctggactggg cacgtggcag
421 gcacgaggaa gaccacgcca ggcttccggc tggtggagaa gtatgggctc ctggtgggcg
481 gggccgcctc gcaccgctac gacctgggag ggctggtgat ggtgaaggat aaccatgtgg
541 tggccgccgg tggcgtggag acaggcggtg cgggcggcca gacaggcggc ttgacttcgc
601 tctgaaggtg gaagcggaat tgcagcagcc tgcaggaggc cgtgcaggca gctgaggctg
661 gtgccgacct tgtcctgctg gacaacttca agccagagga gctgaaccca cggcaccgtg
721 ctgaaagcca gttcccgagt gtggctgtgg aagccagtgg gggcatcacc tggaacacct
781 cccca
BG401877
1   agccttggtc ctgagcagcc aacacaccag cccagacagc tgcaagtcac catggacgct
61  gaaggcctgg cgctgctgct gccgcccgtc accctggcag ccctggtgga cagctggctc
121 cgagaggact gcccaggctc aactacgcag ccttggtcag cggggcaggc ccctcgcagg
181 cggcgctgtg ggccaaatcc cctggggtac tggcagaggc agcctttctt cgatgccata
241 tttacccaac tcaactgcca agtctcctgg ttcctccccg agggatcgaa gctggtggag
301 aagtatgggc tcctggtggg cggagccgac tcgcaccgct acgaccctga gagggctggt
361 gatggtgaag gataaccatg tggtggccgc cggtggcgtg gagaaggcgg tgcgggcggc
421 cagacaggcg gctgacttcg ctctgaaggt ggaagtggaa tgcagcacgc ctggcaggag
481 ggccgtgcag gcagctgagg ctggtgcgac cttgtcactg ctgagcactt caagccagag
541 aagctgcacc ccagagccac gtgcttgaag ccccagtcca aagtgtggct gtgaaaccag
601 tgcggcttca ccctgtgaca cctcccccag tactgctgcc ggcattagac gtcatctcca
661 tgggatgctg ccaggatgcc agcctgaatc tccctcagct gtgccaaaag tgtccagtcc
721 aatcactatc tacgaaaaga taccggacag gttagggcca agcctggtac acttagacga
781 cccagggcac ttgcatagtg cactaggtga cgagtctgag agagaagacc ggaacataca
841 aggaaagacc agtcagaaat ggagagcagc aagaaaggac ggcccacatg ctaactct
BG337811
1   gagccaacac accagcccag acagctgcaa gtcaccatgg acgctgaagg cctggcgctg
61  ctgctgccgc ccgtcaccct ggcagccctg gtggacagct ggctccgaga ggactgccca
121 gggctcaact acgcagcctt ggtcagcggg gcaggcccct cgcaggcggc gctgtgggcc
181 aaatcccctg gggtactggc agggcagcct ttcttcgatg ccatatttac ccaactcaac
241 tgccaagtct cctggttcct ccccgaggga tcgaagctgg tgccggtggc cagagtggcc
301 gaggtccggg gccctgccca ctgcctgctg ctgggggaac gggtggccct caacacgctg
361 gcccgctgca gtggcattgc cagtgctgcc gccgctgcag tggaggccgc caggggggcc
421 ggctggactg ggcacgtggc aggcacgagg aagaccacgc caggcttccg gctggtggag
481 aagtatgggc tcctggtggg cggggccgcc tcgcaccgct acgacctggg agggctggtg
541 atggtgaagg ataaccatgt ggtggccgac ggtggcgtgg aagaaggcgg tgcgggcggc
601 cagacaggcg gctgacttcg ctctgaaggt ggaagtggaa tgcagcagac tgcaggaggg
661 cgtgcacgca gctgaggctg gctgccgact tgtcctggtg gacaccttca agccagagga
721  gctggacgca aggcaacgtg ctgaaggaca gttccgagtg ttggtgtgga agccacatgg
781  agggcatatc actggaaaaa ctcccccaaa tctgcggaac ggaactaaac gataagcacc
841  aggcggaaat cagaccccag gaaggcccag acccgaaata ctccccaaga ggatggccaa
901  gagggggcac acgcccaaaa cacacaaacc aacgcgaaag aacacggcag gcaaaatggc
961  ccaagacacg ggaccaacct acgcagggcc aaggcaatgg aacatgccaa gagccacgac
1021 ccagcaggac cag
BG338063
1   gtggacgctg aaggcctggc gctgctgctg ccgcccgtca ccctggcagc cctggtggac
61  agctggctcc gagaggactg cccagggctc aactacgcag ccttggtcag cggggcaggc
121 ccctcgcagg cggcgctgtg ggccaaatcc cctggggtac tggcagggca gcctttcttc
181 gatgccatat ttacccaact caactgccaa gtctcctggt tcctccccga gggatcgaag
241 ctggtgccgg tggccagagt ggccgaggtc cggggccctg cccactgcct gctgctgggg
301 gaacgggtgg ccctcaacac gctggcccgc tgcagtggca ttgccagtgc tgccgccgct
361 gcagtggagg ccgccagggg gccggctgga ctgggcacgt ggcaggcacg aggaagacca
421 cgccaggctt ccggctggtg gagaagtatg ggctcctggt ggggcgggcc gcctcgcacc
481 gctacgacct gggagggctg gtgatggtga aggataacca tgtggtggcc gcggtggcgt
541 gagaagcggt gcgggcggcc agacaggcgg tgacttcgct ctgaaggtgg aagtggaatg
601 cagcagcctg caggaggccg tgcaggcagc tgaggctggt gccgaccttg tcctgctgga
661 caacttcaag ccagaggagc tgcaacccac ggcaccgtgc tgaaggccca gttccgagtg
721 tggtgtggaa cccagtgggg gcatcacccg gaaaaactcc cccag
BG251163
1   gctgcaagtc accatggacg ctgaaggcct ggcgctgctg ctgccgcccg tcaccctggc
61  agccctggtg gacagctggc tccgagagga ctgcccaggg ctcaactacg cagccttggt
121 cagcggggca ggcccctcgc aggcggcgct gtgggccaaa tcccctgggg tactggcagg
181 gcagcctttc ttcgatgcca tatttaccca actcaactgc caagtctcct ggttcctccc
241 cgagggatcg aagctggtgc cggtggccag agtggccgag gtccggggcc ctgcccactg
301 cctgctgctg ggggaacggg tggccctcaa cacgctggcc cgctgcagtg gcattgccag
361 tgctgccgcc gctgcagtgg aggccgccag gggggccggc tggactgggc acgtggcagg
421 cacgaggaag accacgccag gcttccggct ggtggagaag tatgggctcc tggtgggcgg
481 ggccgcctcg caccgctacg acctgggagg gctggtgatg gtgaaggata accatgtggt
541 ggccgccggt ggcgtggaga aggcggtgcg ggcggcagac aggcggctga cttcgctctg
601 aaggtggaag tggaatgcag cagcctgcag gaggccgtgc aggcagctga ggctggtgcc
661 gacttgctcc tgctggacaa ccttcaagcc agaggagctg cacccacggc acgtgctgaa
721 ggccagttcc cgatgtggct gtggaaccct ggggctcacc tggaaaactc cccatn
BG396079
1   gcttggtcct gagcagccaa cacaccagcc cagacagctg caagtcacca tggacgctga
61  aggcctggcg ctgctgctgc cgcccgtcac cctggcagcc ctggtggaca gctggctccg
121 agaggactgc ccagggctca actacgcagc cttggtcagc ggggcaggcc cctcgcaggc
181 ggcgctgtgg gccaaatccc ctggggtact ggcagggcag cctttcttcg atgccatatt
241 tacccaactc aactgccaag tctcctggtt cctccccgag ggatcgaagc tggtgccggt
301 ggccagagtg gccgaggtcc ggggccctgc ccactgcctg ctgctggggg aacgggtggc
361 cctcaacacg ctggcccgct gcagtggcat tgccagtgct gccgccgctg cagtggaggc
421 cgccaggggg gccggctgga ctgggcacgt ggcaggcacg aggaagacca cgccaggctt
481 ccggctggtg gagaagtatg ggctcctggt gggcggggcc gctcgcaccg ctacgacctg
541 ggagggctgg tgatggtgaa ggataaccat gtggtggccg ccggtggcgt gtagaaggcg
601 gtgcgggcgg cagacaggcg gtgacttcgc tctgaaggtg gaagtggaat gcagcagctg
661 caggaggccg tgcaaggcag tgaggtggtg ccgacttgtt ctgctggaaa ttcagcaagg
721 agtgacca
BF316915
1   ggtcaccatg gacgctgaag gcctggcgct gctgctgccg cccgtcaccc tggcagccct
61  ggtggacagc tggctccgag aggactgccc agggctcaac tacgcagcct tggtcagcgg
121 ggcaggcccc tcgcaggcgg cgctgtgggc caaatcccct ggggtactgg cagggcagcc
181 tttcttcgat gccatattta cccaactcaa ctgccaagtc tcctggttcc tccccgaggg
241 atcgaagctg gtgccggtgg ccagagtggc cgaggtccgg ggccctgccc actgcctgct
301 gctgggggaa cgggtggccc tcaacacgct ggcccgctgc agtggcattg ccagtgctgc
361 cgcgctgcag tggaggccgc cagggggccg gctggactgg gcacgtggca ggcacgagga
421 agaccacgcc aggcttccgg ctggtggaga agtatgggct cctggtgggc ggggcgctcg
481 caccgtacga ctgggagggc tggtgatggt gaaggataac atgtggtggc gcggtggggt
541 ggagaagggt gcgggctggc agaaggcggt gactttcgct ctgaaggtgg aaggtggaat
601 gaggagctgt aggaggcgtg caggcagtga ggctggtgca gacttgttct gtggaaattc
661 aagcagagga gtgacccacg gcacgggtga ggcagttccc agtgtggtgg tggagcagtg
721 gggtcacctg aaacctccca ggctgggcga atgagtgttc catgggatcg acaggggcag
781 cctgatttcc tcaaggt
BF313098
1   gcagacagct gcaagtcacc atggacgctg aaggcctggc gctgctgctg ccgcccgtca
61  ccctggcagc cctggtggac agctggctcc gagaggactg cccagggctc aactacgcag
121 ccttggtcag cggggcaggc ccctcgcagg cggcgctgtg ggccaaatcc cctggggtac
181 tggcagggca gcctttcttc gatgccatat ttacccaact caactgccaa gtctcctggt
241 tcctccccga gggatcgaag ctggtgccgg tggccagagt ggccgaggtc cggggccctg
301 cccactgcct gctgctgggg gaacgggtgg ccctcaacac gctggcccgc tgcagtggca
361 ttgccagtgc tgccgccgct gcagtggagg ccgccagggg gccggctgga ctgggcacgt
421 ggcaggcacg aggaagacca cgccaggctt ccggctggtg gagaagtatg ggctcctggt
481 gggcggggcc gtctcgcacc gctacgacct gggagggctg gtgatggtga aggataacca
541 tgtggtggcc gccggtggcg tggaaagcag cggtgcgggc ggcaacaggc ggtgacttcg
601 tctgaaggtg gaagtggact gcagcaggcc tgcaggaggc cgtgcacggc agctgagggc
661 tggttgccga ccttgtctgc tgcacacttc aagccaggag gagctgcacc ccacgccacc
721 gtgctgactg cccagtcccg agtgtgggtg tggaacgcag gggggcatca cctggacact
781 cccagttttg cgggccgcat gacgtctctc ctggggtgtt gccagggccc ggctgacttt
841 cctccactgt tgccagtggc ggccaccttc cacggaggga cggcggttgg gcccgcctgc
901 c
BG257831
1   gcagacaggt tgacctgcaa aaaaagacag gggaggcatg gaaacaaagg acccatcgca
61  aatgttttcc atgctgatct ccaaagtgtc ccacccccag cctggggcct ctgggagcct
121 tggtcctgag cagccaacac accagcccag acagctgcaa gtcaccatgg acgctgaagg
181 cctggcgctg ctgctgccgc ccgtcaccct ggcagccctg gtggacagct ggctccgaga
241 ggactgccca ggctcaacta cgcagccttg gtcagcgggg caggcccctc gcaggcggcg
301 ctgtgggcca aatcccctgg ggtactggca gggcagcctt tcttcgatgc catatttacc
361 caactcaact gccaagtctc ctggttcctc cccgagggat cgaagctggt gccggtggcc
421 agagtgggcc gaggtccggg gccctgccca ctgcctgctg ctgggggaac gggtggacct
481 caacacgctg gccgctgcag tggcattgcc agtgctgccg cgctgcagtg gaggccgcca
541 ggtgggccgg ctggactggc acgtggcagg cacgaggaag acacgccagg ttccggctgg
601 tggagaagta tgggctccct gggtgggcgg ggcagctcga caccggatac gaacctggag
661 gggctggtga tgggtgaagg gatacaccat gtgttggccg cggttgagtg gagaagcggt
721 ggggggaggc caaacaggcg gtgattgtct gaggtggaag tgaatgcaga cactgagagg
781 cagagcagca gtgaaggttg tgagaactgt ctgaggacaa taacacaaag atgaaca
BF312975
1   ggacagctgc aagtcaccat ggacgctgaa ggcctggcgc tgctgctgcc gcccgtcacc
61  ctggcagccc tggtggacag ctggctccga gaggactgcc cagggctcaa ctacgcagcc
121 ttggtcagcg gggcaggccc ctcgcaggcg gcgctgtggg ccaaatcccc tggggtactg
181 gcagggcagc ctttcttcga tgccatattt acccaactca actgccaagt ctcctggttc
241 ctccccgagg gatcgaagct ggtgccggtg gccagagtgg ccgaggtccg gggccctgcc
301 cactgcctgc tgctggggga acgggtggcc ctcaacacgc tggcccgctg cagtggcatt
361 gccagtgctg ccgccgctgc agtggaggcc gccagggggc cggctggact gggcacgtgg
421 caggcacgag gaagaccacg ccaggcttcc ggctggtgga gaagtatggg ctcctggtgg
481 ggcggggccg cctcgcaccg ctacgacctg ggagggctgg tgatggtgaa ggataccatg
541 tggtggccgc cggtgcgtgg gaggcggtgc gggcggccag acaggcggct gacttcgctc
601 tgaaggtgga gtggaatgca gcagcctgtc aggagggccg tgcaggcagc tgaggctggt
661 gccgaccttt ggtctgctgg taccacttcg agccagagga gctgacccca cgggcaccgt
721 gctgcaggcc ccgttccccg agtgtggctg tggacgcccg tgggggcctc actcttggac
781 acctccccgg ttctgcgggc gccctagacg tcctctcctg gggtgctgac caggggccc
BG115486
1   gtcctgagca gccaacacac cagcccagac agctgcaagt caccatggac gctgaaggcc
61  tggcgctgct gctgccgccc gtcaccctgg cagccctggt ggacagctgg ctccgagagg
121 actgcccagg gctcaactac gcagccttgg tcagcggggc aggcccctcg caggcggcgc
181 tgtgggccaa atcccctggg gtactggcag ggcagccttt cttcgatgcc atatttaccc
241 aactcaactg ccaagtctcc tggttcctcc ccgagggatc gaagctggtg ccggtggcca
301 gagtggccga ggtccggggc cctgcccact gcctgctgct gggggaacgg gtggccctca
361 acacgctggc ccgctgcagt ggcattgcca gtgctgccgc cgctgcagtg gaggccgcca
421 ggggggccgg ctggactggg cacgtggcag gcacgaggaa gaccacgcca ggcttccggc
481 tggtggagaa gtatgggctc ctggtgggcg gggccgcctc gcaccgctac gagctgggag
541 ggctggtgat ggtgaaggat aaccatgtgg tggcccgcgg tggcgtggag aaggcggtgc
601 gggccggcag acaggcggtg gacttcgctc tgaaggtgga agtggaatgc aggagcctgc
661 aggaggcgtg aaggcagtcg aggatggtgg cgaccttgtc ctggctggac aaacttcagc
721 cagaggagct ggacaccaca gccaacgggc tgaaggccag gtcccgagag tgcagaggaa
781 ccaaaggggc tacacctggg acactaccca gactgcagac gccaaaaagc gcatccggcg
BG748194
1   ggcctggcag aggacaggag ggaggcttgg ggagcctggg aagggccggc tgacagcttg
61  atgggccctc cctccctcca cagtcccacc cccagcctgg ggcctctggg agccttggtc
121 ctgagcagcc aacacaccag cccagacagc tgcaagtcac catggacgct gaaggcctgg
181 cgctgctgct gccgcccgtc accctggcag ccctggtgga cagctggctc cgagaggact
241 gcccaggctc aactacgcag ccttggtcag cggggcaggc ccctcgcagg cggcgctgtg
301 ggccaaatcc cctggggtac tggcagggca gcctttcttc gatgccatat ttacccaact
361 caactgccaa gtctcctggt tcctccccga gggatcgaag ctggtgccgg tggccagagt
421 ggccgaggtc cggggccctg cccactgcct gctgctgggg gaacgggtgg ccctcaacac
481 gctggcccgc tgcagtggca ttgccagtgc tgccgccgct gcagtggagg ccgccagggg
541 ggccggctgg actgggcacg tggcaggcac gaggaagacc acgccaggct tccggctggt
601 ggagaagtat gggctcctgg tgggccgggc cgcctcgcac cgctacgacc tgggaggg
BF980859
1   ccccagcctg gggcctctgg gagccttggt cctgagcagg ccaacacacc agcccagaca
61  gctgcaagtc accatggacg ctgaaggcct ggcgctgctg ctgccgcccg tcaccctggc
121 agccctggtg gacagctggc tccgagagga ctgcccaggc tcaactacgc agccttggtc
181 agcggggcag gcccctcgca ggcggcgctg tgggccaaat cccctggggt actggcaggg
241 cagcctttct tcgatgccat atttacccaa ctcaactgcc aagtctcctg gttcctcccc
301 gagggatcga agctggtgcc ggtggccaga gtggccgagg tccggggccc tgcccactgc
361 ctgctgctgg gggaacgggt ggccctcaac acgctggccc gctgcagtgg cattgccagt
421 gctgccgccg ctgcagtgga ggccgccagg ggggccggct ggactgggca cgtggcaggc
481 acgaggaaga ccacgccagg cttccggctg gtggagaagt atgggctcct ggtgggcggg
541 gccgcctcgc accgctacga cctgggaggg ctggtgatgg tgaaggataa ccatgtggtg
601 gccgccggtg gcgtggagaa agcggtgcgg gcggccagac aggcgggtga cttcgcctct
661 gaatgtggag tggaatgaga gctgcagagg cgtgcagagc tgaggtgggg cacctggtct
721 ggtggacaac tcagcaagga gctggccacg gcacggctga aggccatccg agtgtggcgt
781 gagccggggc gttccgggac ccgcagtcgg gggcaaaagc ccccgggggg gccagggccc
841 ccatttcccc caggcgacag ggcgcgcgca ccacgaaaag cgccgcgggg cgccccgcac
901 aagaggcgga aacacacccg cggcgcgaca cgggcgacgc gtctcagctt gtcgcn
Sequences identified as those of HOXB13 cluster
BF676461
GGGATTCCCCCGGCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCATAGATTCCCCTGCCCG
AACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGAAATTATGCCACCTTGGATGGAG
CCAAGGATATCGAAGGCTTGTTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCC
TCTCTGACCAGCCACCCAGCGCGCTACGCTTGATGCCTGTGTCAATATGCCCCCTTGATC
TGCCAGGCTCGGGGAGCGGCCAAAAGCAATGCCCACCCTATGCTCTGGGGGTGCCCAGGG
GACTGTCCCCGGCTCCGTGCCTTATGGTTACTGTGGGGCGGGGTACATACTCCTGCAGAG
TTGTCCCGGAGCTCGTTGAAACCTTGTGCCGAGGAGAGCCACCCTGGCGGTACCCGGGAA
GACTCCCCAGGGCGGGAAGAGTACCCCAGCGGCCCAATGAGTTGTGCTTCTATCGGGATA
TCCGGGACCTACCAGGCCTATGTGCAGGTACTGGACGTGTCCTGTGCTGCAGACTCTGGG
TGTCCGTGGAGCACCGGACATTGGCTCGCTGTGGCCTGTGGCCGGTACCAGTCTTGGGCT
CTCGGTGTGTGGCTGGACACGCCGGTTGTGTTCGCGGGAGACCGCACCCACCAGGTTCCT
TTGGGAGGGCCGCTTTGCAGACTCCGGGGGAGGCCCCTCTGAGGCGGGGCCTTTTCGGGG
GGGCGAAGAAAGCTTTCCGACGCAGGCGCTTGCGGAGCTGGCGGGACATCGGGACACTTC
ACCCAGCGAAGCGCGGCTTGGGGCCCCTCTGGGCGCGGTCTCGGTTGACACCGGCGAAGA
GTTTCGGGAGAGGCCCATATCTTCTGGGGAGGGCGTTGCGTCGCCCCCG
BC007092
ggattccccc ggcctgggtg gggagagcga gctgggtgcc ccctagattc cccgcccccg
cacctcatga gccgaccctc ggctccatgg agcccggcaa ttatgccacc ttggatggag
ccaaggatat cgaaggcttg ctgggagcgg gaggggggcg gaatctggtc gcccactccc
ctctgaccag ccacccagcg gcgcctacgc tgatgcctgc tgtcaactat gcccccttgg
atctgccagg ctcggcggag ccgccaaagc aatgccaccc atgccctggg gtgccccagg
ggacgtcccc agctcccgtg ccttatggtt actttggagg cgggtactac tcctgccgag
tgtcccggag ctcgctgaaa ccctgtgccc aggcagccac cctggccgcg taccccgcgg
agactcccac ggccggggaa gagtacccca gccgccccac tgagtttgcc ttctatccgg
gatatccggg aacctaccag cctatggcca gttacctgga cgtgtctgtg gtgcagactc
tgggtgctcc tggagaaccg cgacatgact ccctgttgcc tgtggacagt taccagtctt
gggctctcgc tggtggctgg aacagccaga tgtgttgcca gggagaacag aacccaccag
gtcccttttg gaaggcagca tttgcagact ccagcgggca gcaccctcct gacgcctgcg
cctttcgtcg cggccgcaag aaacgcattc cgtacagcaa ggggcagttg cgggagctgg
agcgggagta tgcggctaac aagttcatca ccaaggacaa gaggcgcaag atctcggcag
ccaccagcct ctcggagcgc cagattacca tctggtttca gaaccgccgg gtcaaagaga
agaaggttct cgccaaggtg aagaacagcg ctacccctta agagatctcc ttgcctgggt
gggaggagcg aaagtggggg tgtcctgggg agaccaggaa cctgccaagc ccaggctggg
gccaaggact ctgctgagag gcccctagag acaacaccct tcccaggcca ctggctgctg
gactgttcct caggagcggc ctgggtaccc agtatgtgca gggagacgga accccatgtg
acagcccact ccaccagggt tcccaaagaa cctggcccag tcataatcat tcatcctgac
agtggcaata atcacgataa ccagtactag ctgccatgat cgttagcctc atattttcta
tctagagctc tgtagagcac tttagaaacc gctttcatga attgagctaa ttatgaataa
atttggaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa
BM462617
ATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCA
CCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCC
AAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCT
CTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGAT
CTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGG
ACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTG
TCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAG
ACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGA
TATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTG
GGTGCTCCTGGAGAACCGCGACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCCTGG
GCTCTCGCTGGTGGCTGGAACAGCCAGATGTGTTGCCAGGGAGAACAGAACCCACCAGGT
CCCCTTTTGGAAGGCAGCATTTGCAGACTCCAGCGGGCAGCACCCTCCTGACGCCTGCGC
CTTTCGT
BG752489
GCAGGCGACTTGCGAGCTGGGAGCGATTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGG
GGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCG
GCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGC
TGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGG
CGCCTACGCTGATGCCTGCTGTCAACTATCCCCCCTTGGATCTGCCAGGCTCGGCGGAGC
CGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCGTGC
CTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAAC
CCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAG
AGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAGC
CTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGC
GACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGA
ACAGCCAGATGTGTTGCCAGGGAGAACAGAAGCCACCAGGTCCCTTTTGGAAGGCAGCAT
CTGCAGACTCCAGCGGGCAGGACCTCCTGACGCCTGCGGCCTTTCGTCGCGAGCGCAAGA
AACGCATTCCGTA
BG778198
GGATTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCT
AGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTAT
GCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAAT
CTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTC
AACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGC
CCTGGGGTGCCCCAGGGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGT
ACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGG
CCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGT
TTGCCTTCTATCCGGGATATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGT
CTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACATGACTCCCTGTTGCCTGTGG
ACAGTTACCAGTCTTGGGCTCTCGCTGGTGGGCTGGAACAGCCAGATGTGTTGCCAGCGC
AGAACAGAACCCACCAGGTCCCTTTTGGAAGGCAGCATTTGCAGACTCCAGCGGGCAGAA
CCCTCCTGACGCCTGCGCCTTTCGTTCGCGGGCGAAAAA
CB050884
AAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGAGCTGGAGCGGGAGTATGCGGCT
AACAAGTTCATCACCAAGGACAAGAGGCGCAAGATCTCGGCAGCCACCAGCCTCTCGGAG
CGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTTCTCGCCAAG
GTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTGG
GGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGACTCTGCTGA
GAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCTCAGGAGC
GGCCTGGGTACCCAGTATGTGCAGGGAGACGGAACCCCATGTGACAGCCCACTCCACCAG
GGTTCCCAAAGAACCTGGCCCAGTCATAATCATTCATCCTGACAGTGGCAATAATCACGA
TAACCAGTACTAGCTGCCATGATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAG
CACTTTAGAAACCGCTTTCATGAATTGAGCTAATTATGAATAAATTTGGAAGGCGAAAAA
AAAAACCTCGTGCC
CB050885
ATTCGGCACGAGGTTTTTTTTTTCGCCTTCCAAATTTATTCATAATTAGCTCAATTCATG
AAAGCGGTTTCTAAAGTGCTCTACAGAGCTCTAGATAGAAAATATGAGGCTAACGATCAT
GGCAGCTAGTACTGGTTATCGTGATTATTGCCACTGTCAGGATGAATGATTATGACTGGG
CCAGGTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCCCTGCAC
ATACTGGGTACCCAGGCCGCTCCTGAGGAACAGTCCAGCAACCAGTGGCCTGGGAAGGGT
GTTGTCTCTAGGGGCCTC
BF965191
GGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGA
CCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAG
GCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACC
CAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGG
CGGAGCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTC
CCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGC
TGAAACCCTGTGCCAGGCAGCCACCCTGGCCGCGTAACCCGACGGAGACTCTCACGTGCG
GGGAAGAGTACCCCTAGCGCCCCACATGAGTTTGCCTTCTATCCGGGATATCCGGGACCG
TACCAGCCTATGGCAGTTACCTGGACGTGTCTGTGGTGCCGACTCTGGGTGCTCCTGGAG
AACCGCGGACATGACTCCTTGTTTGCTGTGCGACGCTCACCAGTCTGGGCTCCTCGTCGG
TGGTCGCACTCCCACTTTTTGCCGGGCGACATCCCCCGGGGCCCCTTCCGGAACAGCGAC
CTTGCGAGCCCCCGGGGACACACCCCCGTAAGCGGCCTATCATCGCTGATAAACCTCATC
AGAGGGCACCGAAAGCCGCGACTCTAACCCCCCCACTACGACTCACGACCGCACAGGTAC
TCGAACCGCCCAATATCTGGTTCTAACCCATGGCGCATCTCAGCCGCTAGAGAGCCAACC
AAACGCGCCACGCGCAACCACACTACACCACGGCACCCCTTTCATCTCACTCCCACGCCG
ATCACTCTTCACCCTCCAGAATCATTCCCCTCGCACATCCTACCTATCTCATGCCTCCCA
GTTCACCCCATTCCCTCCCCTAATCTCACCCACACATTCACGCACGTTCTCACTACGCTT
CGCTCCGACCCACATCCTCACCCCCACATTCATACCACTTCACCATCACGACCCCCCCCT
CTCATCGACTCCTGTCTCATTCTCAACCACAGTACTACCAGCTCCAACACACCACTCACC
CCAAGCTATCCATCACCTACACGCTTTCACCCCTCACCGCTCCCAAGTAATTCAGATCAC
TCAAACACAATCTGCTACATACTCATCCCTCCCCCACTCCCAGTACAGTCCAACCACCGA
CCAACTACCTCCGCGCCACCCGCGCCGCCCCACCTCACCGGCCCCAACCGCCCGCACAGG
GCACGCACCCCCCGGCAACCGCGCGATCCGGCCGTACACACTCTTGGGCGGCACGCAGCT
GAGGACATTCCGCGGGAGCGCCCCACCGTGGGCTACGTGGGTCGCGACCCGGCGGGGCGC
GTGCGGCGTCGCCCGCCCGCCCGCCGACTGCGACCCAGTCGAG
BU930208
GGGGCTTTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCC
CGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTT
GGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGC
CCACTCCCCTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGC
CCCCTTGGATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGGGGT
GCCCCAGGGGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTC
CTGCCGAGTGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTA
CCCCGCGGAGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGCCTT
CTATCCGGGATATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGTCTGTGGT
GCAGACTCTGGGTGCTCCTGNAGAACCGCGACATGACTCCCTGTTGCCTGTGGACAGTTA
CCAGTCTTGGGCTCTCGCTGGTGGCCTGGAACAGCCCAGATGTGTTTGCCCAGGGNAGAA
CACGAACCCCACCCGGTTCCCCCTTTTGGGAAAGGGCAGCCATTTTGGCCAGCCTTCCAA
GCGGGGCCAACCACCCCCTCCCCTGGACAGGCCCTGGT
AA807966
GCGGCCGCAAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGACTGGAGCGGGAGTA
TGCGGCTAACAAGTTCATCACCAAGGACAAGAGGCGCAAGATCTCGGCAGCCACCAGCCT
CTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTTCT
CGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCG
AAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGACT
CTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCT
CAGGAGCGGCCTGGGTACCCAGTATGTGCAGGGAGACGGAACCCCATGTGACAGCCCATT
CCACCAGGGTTCCCAAAGAACCTGGCCCAGTCATAATCATTCATCCTGACAGTGGC
AI884491
AGCGGCCGCAAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGAGCTGGAGCGGGAG
TATGCGGCTAACAAGTTCATCACCAAGGACAAGAGGCGCAAGATCTCGGCAGCCACCAGC
CTCTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTT
CTCGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAG
CGAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGA
CTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTC
CTCAGGAGCGGCCTGGGTACCCAGTATGTGCAGGGAGACGGAACCCCATGTGACAGCCCA
CTCCACCAGGGTTCCCAAAGAACCTGGCCCAGTCATAATCATTCATCCTGACAGTGGCAA
TAATCACGATAACCAGTACTAGCTGCCATGATCGTTAGCCTCATATTTTCTATCTAGAGC
TCTGTAGAGCAC
AA652388
GCGGCCGCAAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGACTGGAGCGTGAGTA
TGCGGCTAACAAGTTCATCACCAAGGACAAGAGGCGCAAGATCTCGGCAGCCACCAGCCT
CTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTTCT
CGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCG
AAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGACT
CTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCT
CAGGAGCGGCCTGGGTACCCAGTATGTGCAGGGAGACGGAACCCCATGTGACAGCCCACT
CCACCAGGGTTCCCAAAGAACCTGGCC
BF446158
TTTTTTTTTTTTTTTTTTTCGCCTTCCAAATTTATTCATAATTAGCTCAATTCATGAAAG
CGGTTTCTAAAGTGCTCTACAAAGCTCTAAATAAAAAATATGAGGCTAACGATCATGGCA
GCTAGTACTGGTTATCGGGATTATTGCCACTGTCAGGATGAATGATTATGACTGGGCCAG
GTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCCCTGCACATAC
TGGGTACCCAGGCCGTTCCTGAGGAACAGTCCACCACCCAGTGGCCTGGGAAGGGTGTTG
TCTCTAGGGGCCTCTCAACAAAGTCCTTGGCCCCAGCCTGGGCTTGGCAGGTTCCTGGTC
TCCCCAGGACACCCCCACTTTCGCTCCTCCCACCCAGGCAAGGAGATCTCTTAAGGGG
AA657924
GACGCNAGGTATGCGGCTAACAAGTTCATCACCAAGGACAAGAGGCGCAAGATCTCGGCA
GCCACCAGCCTCTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAG
AAGAAGGTTCTCGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGG
TGGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGG
GGCCAAGGACTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCT
GGACTGTTCCTCAGGAGCGGCCTGGGTACCCATGTATGTGCAGGGAGACGGAACCCCATG
TGACAGCCCACTCCACCAGNGTTCCTAAAGAACCCTGGCCAGTCA
AA644637
GCAGGCGACTTGCGAGCTGGGAGCGGTTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGG
GGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCG
GTCCATGGACACGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTG
GGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCG
CCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGACTCT
NAAAGCATATGCCACCCNATGCCCTGGGGTGCCCCAGGGGAACGTCCCCAGCTCCCGTGC
CTTATGGTT
BF222357
GCGGCCGCAAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGAGCTGGAGCGGGAGT
ATGCGGCTAACAAGTTCATCACCAAGGACAAGAGGCGCAAGATCTCGGCAGCCACCAGCC
TCTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTTC
TCGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGC
GAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGAC
TCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCC
TCAGGAGCGGCCTG
AA527613
GTCGACGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTG
GGGGTGTCCTGGGGAGACCGGGAACTGCCAAGCCCAGGCTGGGGCAAGGACTCTGCTGAG
AGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGCTGCTGGACTGTTCCTCAGGAGCGG
CCTGGGTACCCAGTATGTGCAGGGAGACGGAACCCCATGTGACAGCCCACTCCACCAGGG
TTCCCAAAGAACCTGGCCCAGTCATAATCATTCATCCTGACAGTGGCAATAATCACGATA
ACCAGTACTCAGCTGCCATGATCGTTAGCCTCATATT
AA533227
GCGTCGACCCCTTGAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTGGGGGTGTCC
TGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGACTCTGCTGAGAGGCCCC
TAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCTCAGGAGCGGCCTGGG
TACCCAGTATGTGCAGGGAGACGGAACCCCATGTGACAGCCCACTCCACCAGGGTTCCCA
AAGAACCTGGCCCAGTCATAATCATTCATCCTGACAGTGGCAATAATCACGATAACCAGT
ACTAGCTGCCATGATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAGCACTTGTA
GAAACCGCTTTCATGAATTGAGCTAATTATGAATAGATTTGGAAGGGGAAAAAAGTGGAA
AAAGTTTTGCCCAAAGTGGGTCGTTTACGTCG
AA456069
CTCCCTGGCAACACATCTGGCTGTTCCAGCACCAGCGAGACCCAAGACTGGTAACTGTCC
ACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACAGAC
ACGTCCAGGTAACTGGCCATAGCTGAGTAGGTTCCCGGATATCCCGGATAGAAGGCAAAC
TCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGAGAGTCTCCGCGGGGTACGGCCC
AGGGTGGCTGCCTGGGCATCAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGTA
CCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGGGGACGTCCCTGGGGCACCCCAG
AA455572
TTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGA
TTCCCCGCCCCCGCACCTCATGAGCCGACCCTCGGTCCATGGAGCCGGCGAATTATGCCA
CCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGG
TCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGCTACGTGATGCCTGCTGTCAACTAT
GCCCTTGGATCTGCCAGCTCGCGGAGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCC
AGGTGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCC
GAGTGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCG
CGATGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGCCT
BX117624
CAGGCGACTTGCGAGTCTGGGAGCGATTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGG
GGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCG
GCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGC
TGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGG
CGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGAGC
CGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCGTGC
CTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAAC
CCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAG
AGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAGC
CTATGGCCAGTTACCTTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCG
CGACATGACTCCCTGNTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGG
AACAGCCAGATGTGTTGNCAGGGAGAACAGAACCCACCAGGTCCCTTTTGGAAGGCAGAT
TTGCAGACTNCAGCGGGCA
BQ673782
AGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAGAGTACCCCA
GCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAGCCTATGGCCA
GTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACATGACT
CCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGAACAGCCAGA
TGTGTTGCCAGGGAGAACAGAACCCACCAGGTCCCTTTTGGAAGGCAGCATTTGCAGACT
CCAGCGGGCAGCACCCTCCTGACGCCTGCGCCTTTCGTCGCGGCCGCAAGAAACGCATTC
CGTACAGCAAGGGGCAGTTGCGGGAGCTGGAGCGGGAGTATGCGGCTAACAAGTTCATCA
CCAAGGACAAGAGGCGCAAGATCTCGGCAGCCACCAGCCTCTCGGAGCGCCAGATTACCA
TCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACAGCG
CTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTGGGGGTGTCCTGGGG
AGACCAGGAACCTGCCAAGCCCCAGGCTGGGGCCAAGGACTCTGCTGAGAGGCCCCTAGA
GACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCTCAGGAGCGGCCTGAGTACC
CCGTATGTGCAGGGGAGACGGAACCCCCTGTGACCAGCCCCCCTCCACCCGTGGTCTCCC
AGATAACCTGGCCCCCACTCATAAATCATTTCTTCCCGGGCCGGGGGCCAATCATTCCCC
GAACTACCCCGGTACCTTATACAATTAGATTGGACATGAATCCTCTCGGGGGCATTCCCT
ATGGCGCTGAGGCCCCTCACACCT
AI814453
GGGTGCTGTCCTCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT
TCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGAGCCCAAGACTGGTAACTG
TCCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACA
GACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCCCGGATAGAAGGCA
AACTCAATGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCG
GCCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAG
TACCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGGGGACGTCCCCTGGGGCACCCCA
NGGCATGGGTGGCATTGCTTTGGCGGCTCCGCCGAGCCTGGCAGATCCAAGGGGGCATAG
TTGACAGCAGGCATCAGCGTAGGCGCCGCTGGGTGGCTGGTCAAAAGGGAGTGGCGACCA
NATTCCGCCCCCCTCCCGCTTCCCAG
AI417272
GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT
TCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGAGCCCAGGACTGGTAACTG
TCCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACA
GACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCCCGGATAGAAGGCA
AACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGCCGTGGGAGTCTCCGCGGGGTACGCGG
CCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGT
ACCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGGGGACGTCCCCTGGGGCACCCCAG
GGCATGGGTGGCATTGCTTTGGCGGCTCCGCCGAGCCTGGCAGATCCAAGGNGGCATAGT
TGACAGCAGGCATCAGCGTANGCGCCGCTGGGTGGCTGTCAAGAGG
AA535663
TCGACGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACA
TGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGAACAG
CAGATGTGTTGCCAGGGAGAACAGAACCCACCAGGTCCCTTTTGGAAGGCAGCATTTGCA
GACTCCAGCGGGCAGCACCCTCCTGACGCCTGCGCCTTTCGTCGCGGCCGCAAGAAACGC
ATTCCGTACAGCAAGGGGCAGTTGCGGGACTGGAGCGGGAGTATGCGGCTAACAAGTTCA
TCACCAAGGACAAGAGGCGCAAGATCTCGGCAGCCACCAGCCTCTCGGAGCGCCAGATTA
CCATCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACA
GCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTGTG
AI400493
GTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGG
GTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGAGCCCAGGACTG
GTAACTGTCCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTG
CACCACAGACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCCCGGATA
GAAGGCAAACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGG
GTACGCGGCCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCA
TGAGTAGACCCGCCTTCCAAGTAACCATAAGGCACGGGAGCTGGTAACGTCCCCTGGGGC
ACCCCANGGCCATGGGTGCATTGCTTTGGCGGCTCCGCCGAGCCCTGCAGATCCAAGGTG
GGCATATTGACAGCAGGCATTCACGTATGCGCCCCCTGGGTGGCTGTCATATTGGGGATT
GCGAC
AW779219
GCAGGCGTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACC
TGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGAGCCCA
AGACTGGTAACTGTCCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAG
AGTCTGCACCACAGACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCC
CGGATAGAAGGCAAACTCAGTGGGGCGACTGGGGTACTCTTCCCGGCCGTGGGGAGTCTC
CGCGGGGTACGCGGCCAGGGGTGGCTGCCTGGGCACCAGGGGTTTCAGCGAGCTCCGGGA
CACTCNGCAGGAAANTAGTACCCGCCTCCCAAAGTAACCATAAGCACCGGACTGNGGGNN
GGACGTCCCCTGGGGCAC
AA594847
GCGACCGGACGAAAGGAGGCGTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCC
TTCCAAAAGGGACCTGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCCAGCAC
CAGCGAGACCCAAGACTGGTAACTGTCCACAGGCAACAGGGAGTCATGTCGCGGTTCTCC
AGGAGCACCCAGAGTCTGCACCACAGACACGTCCAGGTAACTGGCCATAGCTAGGTAGGT
TCCCGGATATCCCGGATAGAAGGCAAACTCAGTGGGGCGACTGGGGTACTCTTCCCCGGC
CGTGGGAGTCTCCGCGGGGTACGCCCATGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAG
CTCCGGGACA
AI150430
GCAGGCGTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACC
TGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGAGCCCA
AGACTGGTAACTGTCCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAG
AGTCTGCACCACAGACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCC
CGGATAGAAGGCAAACTCAGTGGGGCGACTGGGGTACTCTTCCCCGGCCGTGGGAGTCTC
CGCGGGGTACGCGGCCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACAC
TCGGCAGGAGTAGTACCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGGATGCGTCCC
CTAGGGCACCCCATGGCATGGGTGGCATTGCTTTGGCGGCTCCGCCGAGCCTGGCAGATC
CAAGGAGGCACTGTT
AA494387
GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT
TCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGACCCAAGACTGGTAACTGT
CCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACAG
ACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCCCGGATAGAAGGCAA
ACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCGT
CCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGT
ACCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGGGGACGTCCCTG
AA662643
GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT
TCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGACCCAAGACTGGTAACTGT
CCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACAG
ACACGTCCAGGTAACTGGCCATAGGTGGTAGGTTCCCGGATATCCCGGATAGAAGGCAAA
CTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCGGC
CAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACA
AI935940
GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT
TCTCCCTGGCAACACATCTGGCTGTTCCTGCCACCAGCGAGAGCCCAAGACTGGTAACTG
TCCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACA
GACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCCCGGATAGAAGGCA
AACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCG
GCCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCG
AA532530
GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT
TCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGACCCAAGACTGGTAACTGT
CCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACAG
ACACGTCCAGGTAACTGGCCATAGGTNGGTAGGTTCCCGGATATCCCGGATAGAAGGCAA
ACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCG
AA857572
CTCCCTGGCAACACATCTGGCTGTTCCAGCACCAGCGAGAGCCAAGACTGGTAACTGTCC
ACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACAGAC
ACGTCCAGGTAACTGGCCATAGGTCGGTAGGTTCCCGGATATCCCGGATAGAAGGCAAAC
TCAGTGGGGCGACTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGGCNAC
AGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGTAN
CCGCCTCAAAGTAACCATAANGCACGGGAGCTGGGGACGTCCC
AI261980
ACGAAAGGCGCAGGCGTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCA
AAAGGGACCTGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGC
GAGAGCCCAAGACTGGTAACTGTCCACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGG
AGCACCCAGAGTCTGCACCACAGACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCC
CGGATATCCCGGATAGAAGGCAAACTCAGTGGGGCGACTGGGGTACTCTTCCCCGGCCCG
GGGAGTCTCCGCGGGGTACGCGGCCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCT
CCGGGACACTCGGCGGAGNTAGTACCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGG
GGAACCGTCCCCTGGGGCACC
BE888751.1
GAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCGGCT
CCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGG
GAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGC
CTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGAGCCGC
CAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGACGTCCCCAGCTCCCGTGCCTTA
TGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAACCCTG
TGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAGAGTA
CCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAGCCTAT
GGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACA
TGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGAACAG
CCAGATGTGTTGCCAGGGAGAACAGAACCCACCAGGTCCCTTTTTGGAAGGCAGCATTTG
CAGACTCCAGCGGCAGGACCTCCTGAACGCCTGCGCCTTTCGTCGCGGCGTCTAAAGTAA
TCCTCGAGG
AI378797
GCGGCCGCGGCCCACCACCAACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCT
GCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAG
AATGCGCCGGCAGGCCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCG
CTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGAC
ATCAGAGAATGAACACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCA
NAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTG
GGAAAACAGGGTTGGCACCACTCTGCCACTCCGTTTGTGCCTGGGAAGGGCTAAGTATGC
AAGGCTACAAACATCTACTTCACTGGGATCCCAAATGCTCAACAAACCATGACCTGCTNT
GGTCAGAACCACCAGAAATATT
AA234220
GCAGGCGACTTGCGAGCTGGGAGCACTTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGG
GGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCG
GCTCCATGGAGCCTGGCATATTATGCCACCTTGGTATGGAGCCAAGGATATCGAAGGCTT
GCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGC
GGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGA
AA236353
GCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGTTCTCCCT
GGCAACACATCTGGCTGTTCCAGCCACCAGCGAGACGCCAAGACTGGTAACTGTCCACAG
GCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCACCACAGACACGT
CCAGGTAACTGGCCATAGGTNGGTAGGTTCCCGGATATCCCGGATAGAAGGCAAACTCAG
TGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCGCACAGGG
TGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGTACCCGC
CTCCAAAGTAACCATAAGGCA
AA588193
AACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCTGCTCGGAGCTTCGGTTCTG
CGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAGAATGCGCCGGCAGCCCCCA
CCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCGCTGGCTTTGCTGCGCGGCCAG
GAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGACATCAGAGAATGAACACAGAGG
CAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCAAAGAGCCCGTCTGTCTCCAGC
TTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTGGGAAAACAGGGTTGGCACCAC
TCTGCCACTCCGTTTGTGCCTGGGAAGGGCTAAGTATGCAAGGCT
AI821103
GATCCCTTTGCAGGGAAGCTTTCTCTCAGACCCCCTTCCATTACACCTCTCACCCTGGTA
ACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAGATTCGTTGTGTGGCTGTGATGTCCGT
TTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTGGACAATTGTAGAGGCTGTCTCTTCCT
CCCTCCTTGTCCACCCCATAGGGTGTACCCACTGGTCTTGGAAGCACCCATCCTTAATAC
GATGATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTT
CCAGAGAAAAAGAGATTTGAGAAAGTGA
AI821851
TTTTTTTTTTTTTTTTTTTTCTTTTTCACTTTCTCAAATCTCTTTTTCTCTGGAAGGAAG
GACTGACTAGGGGCAGCCTGCTGGCTTCATTTTCACACGACAAAAAAATCATCGTATTAA
GGATGGGTGCTTCCAAAACCAGTGGGTACACCCTATGGGGGGGACAAGGAGGGAGGAAGA
GACAGCCTCTACAATTGTCCACCTACCCAGCTGTCAGCTGAGAAAAATGCTAAACGGACA
TCACAGCCACACAACGAATCTGCCCGTTCCCCTCTCCTCAGTCTTCCTGCTGTTACCAGG
GTGAGAGGTGTAATGGAAGG
AA635855
TTTTTTTTTTTTTTTTTTTTCTTTTTCACTTTCCCAAATCTCTTTTTCTCTGGAAGGAAG
GACTGACTAGGGGCAGCCTGCTGGCTTCATTTTCACACGACAGAAAAATCATCGTATTAA
GGATGGGTGCTTCCAAGACCAGTGGGTACACCCTATGGGGTGGACACAGGAGGGAGGAAG
AGACAGCCTCTACAATTGTCCACCTACCCAGCTGTCAGCTGAGAAAAATGCTAAACGGAC
ATCACAGCCACACAACGAATCTGCCCGTTCCCCTCTCCTCAGTCTTCCTGCTGTTACCAG
GGTGAGAGGTGTAATGGAAGG
AI420753
GCGGCCGCGGCCCACCACCAACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCT
GCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCTTGGAG
AATGCGCCGGCAGGCCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCG
CTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGAC
ATCAGAGAATGAACACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCA
AAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGT
BG180547
CACGCGTCGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGTCCTTCCCAGGC
ACAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCAC
AGTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAG
GGACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGC
CCGGTGGGACTCATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCT
GCACCTTAGGCTGGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGATTGAGCGCACAGGC
CTGAAGTCTGGACAACCCGCAGAACCGAAGCTCCGAGCAGCGGGTCGGTGGCGAGTAGTG
GGGTCGGTGGCGAGCAGTTGGTGGTGGG
AA468306
TCGACCTCGCCAAGGTGAAGAACAACGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGG
AGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCC
AAGGACTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGAC
TGTTCCTCAGGAGCGGCCTGGGTACCCAGTATGTGCAGGGAGA
AA468232
TTTTTTACTGGTTATCGTGGTTATTGCCACTGTCAGGATGAATGATTATGACTGGGCCAG
GTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCCCTGCACATAC
TGGGTACCCAGGCCGCTCCTGAGGAACAGTCCAGCAG
CB050115
GGCCCACCACCAACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCTGCTCGGAG
CTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAGAATGCGCC
GGCAGGCCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCGCTGGCTTT
GCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGACATCAGAGA
ATGAACACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCAAAGAGCCC
GTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAACCTCGTGCC
CB050116
GGCACGAGGTTCACAGTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGC
CGGGACTCTGAGAGGGACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTA
CCTGGGCTCAGTGCCCGGTGGGACTCATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCG
TGCTGGTCCTTCCTGCACCTTAGGCTGGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGA
TTGAGCGCACAGGCCTGAAGTCTGGACAACCCGCAGAACCGAAGCTCCGAGCAGCGGGTC
GGTGGCGAGTAGTGGGGTCGGTGGCGAGCAGTTGGTGGTGGGCC
AA661819
GCTGCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTG
GAGAATGCGCCGGCAGCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCC
GCTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGCACTGAGCCAGGTACAGGACA
TCAGAGAATGAACACAGAGGCAGAGGCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCAAA
GAGCCGTACTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTGGG
AAAAC
CF146837
CACGAGGATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATTGA
GCTAATTATGAATAAATTTGGAAGGCGATCCCTTTGCAGGGAAGCTTTCTCTCAGACCCC
CTTCCATTACACCTCTCACCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAG
ATTCGTTGTGTGGCTGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTG
GACAATTGTAGAGGCTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCACTG
GTCTTGGAAACACCCATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGC
AGGCTGCCCCTAGTCAGTCCTTCCTTCCAGAGAAAAAGAGATTTGAGAAAGTGCCTGGGT
AATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGT
TCTGACCAAAGCAGGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTTG
TAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAACCCT
GTTTTCCCAGTCCACGTAGACAGATTCACAGTGCGGAATTCTGGAAGCTGGAGACAGACG
GGCTCTTTGCAGAGCCGGGACTCTGAG
CF146763
CACGAGGATTTTCTATNCTAGAGCTCTGGTAGAGCACTTTANAAACCGCTTTCATGAATT
GAGCTAATTATGAATAAATTTGGAAGGCGATCCCTTTGCAGGGAAGCTTTCTCTCAGACC
CCCTTCCATTACACCTCTCACCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGC
AGATTCGTTGTGTGGCTGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGG
TGGACAATTGTAGAGGCTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCAC
TGGTCTTGGAAACACCCATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCA
GCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAGAGAAAAAGAGATTGAGAAAGTGCCTGGG
TAATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGG
TTCTGACCAAAGCAGGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTT
GTAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAACCC
TGTTTTCCCAGTCCACGTAGACAGATTCACAGTGCGGAATTCTGGAAGCTGGAGACAGAC
GGGCTCTTTGCAGAGCCGGGACTCTGA
CF144902
CACGAGGGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAGAGAAAAAGAGATTT
GAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCT
TAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAGCATTTGGGATCCCA
GTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTGGCA
GAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCACAGTGCGGAATTCTGG
AAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGGGACATGAGGGCCTC
TGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCCCGGTGGGACTCATC
TCCTGGGCGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTGCACCTTA
CF141511.1
CACGAGGCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAGATTCGTTGTGTG
GCTGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTGGACAATTGTAGA
GGCTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCACTGGTCTTGGAAACA
CCCATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTA
GTCAGTCCTTCCTTCCAGAGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTA
ATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGC
AGGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATA
CTTAGCCCTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTC
CACGTAGACAGATTCACAGTGCGGAATTCTGGAA
CF139563.1
CACGAGGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGA
GCATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGC
ACAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCAC
AGTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAG
GGACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGC
CCGGTGGGACTCATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCT
GCACCTTAGGCTGGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGATTGAGCGCACAGGC
CTGAAGTCTGGACAACCCGCAGAACCGAAGCTCCGAGCAGCGGGTCGGTGGCGAGTA
CF139372
CACGAGGATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAGCATTTGGGATC
CCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTG
GCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCACAGTGCGGAATTC
TGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGGGACATGAGGGC
CTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCCCGGTGGGACTC
ATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTGCACCTT
CF139319
CACGAGGAAGGCGATCCCTTTGCAGGGAAGCTTTCTCTCAGACCCCCTTCCATTACACCT
CTCACCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAGATTCGTTGTGTGGC
TGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTGGACAATTGTAGAGG
CTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCACTGGTCTTGGAAACACC
CATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGT
CAGTCCTTCCTTCCAGAGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAAT
TTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAG
GTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACT
TAGCCCTTCC
CF139275
CACGAGGTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCC
CGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTT
GGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGC
CCACTCCCCTCTGAGCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGC
CCCCTTGGATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGGGGT
GCCCCAGGGGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTC
CTGCCGAGTGTCGCGGAGCTCGCTGAAACCCTGTGCCCAGGCA
CF122893
CACGAGGATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATTGA
GCTAATTATGAATAAATTTGGAAGGCGATCCCTTTGCAGGGAAGCTTTCTCTCAGACCCC
CTTCCATTACACCTCTCACCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAG
ATTCGTTGTGTGGCTGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTG
GACAATTGTAGAGGCTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCACTG
GTCTTGGAAACACCCATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGC
AGGCTGCCCCTAGTCAGTCCTTCCTTCCAGAGAAAAAGAGATTTGAGAAAGTGCCTGGGT
AATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGT
TCTGACCAAAGCAGGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTANATGTTTG
TAGCCTTGCATACTTAGCCCTT
AI972423
CATTTTCACACGACTGTAAAATCATCGTATTAAGGATGGGTGCTTCCAAGACCAGTGGGT
ACACCCTATGGGGTGGACAAGGAGGGAGGAAGAGACAGCCTCTACAATTGTCCACCTACC
CAGCTGTCAGCTGAGAAAAATGCTAAACGGACATCACAGCCACACAACGAATCTGCCCGT
TCCCCTCTCCTCAGTCTTCCTGCTGTTACCAGGGTGAGAGGTGTAATGGAAGGGGGTCTG
AGAGAAAGCTTCCCTGCAAAGGGATCGCCTTCCAAATTTATTCATAATTAGCTCAATTCA
TGAAAGCGGTTTCTAAAGTGCTCTACAGAGCTCTAGATAGAAAATATGAGGCTAACGATC
ATGGCAGCTAGTACTGGTTATCGTGATTATTGCCACTGTCAGGATGAATGATTATGACTG
GGCCAGGTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATG
AI918975
TGCAGCTAGTACTGGTTATCGTGATTATTGCCACTGTCAGGATGAATGATTATGACTGGG
CCAGGTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCCCTGCAC
ATACTGGGTACCCAGGCCGCTCCTGAGGAACAGTCCAGCACAGGGTTTCAGCGAGCTCCG
GGACACTCGGCCTCGTGC
AI826991
TTTTTTTTTTTTTTTTTTTTCTTTTTCACTTTCTCAAATCTCTTTTTCTCTGGAAGGAAG
GACTGACTAGGGGCAGCCTGCTGGCTTCATTTTCACACCACAAAAAAATCATCGTATTAA
GGATGGGTGCTTCCAAAACCAGTGGGTACACCCTATGGGGTGGACAAGGAGGGAGGAAAA
AACAGCCTCTACAATTGTCCACCTACCCAGCTGTCAGCTGAAAAAAATGCTAAACGGACA
TCACAGCCACACAACGAATCTGCCCGTTCCCCTCTCCTCAGTCTTCCTGCTGTTACCAGG
GTGAAAGGTGTAATGGAAGG
AI686312
ACCGACCCCACTACTTGCCACCGACCCGCTGCTCGGAGCTTCGGTTCTGCGGGTTGTCCA
GACTTCAGGCCTGTGCGCTCAATCGTGGAGAATGCGCCGGCAGGCCCCCCACCCCCAGCC
TAAGGTGCAGGAAGGACCAGCACGAACCCGCTGGCTTTGCTGCGCGGCCAGGAGATGAGT
CCCACCGGGCACTGAGCCCAGGTACAGGACATCAGAGAATGAACACAGAGGCAGAGGCCC
TCATGTCCCTCTCAGAGTCCCGGCTCTGCAAAGAGCCCGTCTGTCTCCAGCTTCCAGAAT
TCCGCACTGTGAATCTGTCTACGTGGACTGGGAAAACAGGGTTGGCACCACTCTGCCACT
CCGTTTGTGCCTGGGAAGGGCTAAGTATGCAAGGCTACAAACATCTACTTCACTGGGATC
C
AI655923
TTTTTTTTTTTTTTTCCCTGCAAAGGGATCGCCTTCCAAATTTATTCATAATTAGCTCAA
TTCATGAAAGCGGTTTCTAAAGTGCTCTACAGAGCTCTAGATAGAAAATATGAGGCTAAC
GATCATGGCAGCTAGTACTGGTTATCGTGATTATTGCCACTGTCAGGATGAATGATTATG
ACTGGGCCAGGTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCC
CTGCACATACTGGGTACCCAGGCCGCTCCTGA
CF146922
CACGAGGCGACTTGCGAGCTGGGAGCGATTTAAAACGCTTTGGATTCCCCGGCCTGGGTG
GGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTC
GGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTG
CTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCG
GCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGAG
CCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCGTG
CCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAA
CCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAA
GAGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAG
CCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACGC
GACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGA
ACAGCCAGATGTGTTGCCA
BF476369
GCGGCCGCGGCCCACCACCAACTGCTCGCCATTCGACCCCACTACTCGCCACCGACCCGC
TGCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGA
GAATGCGCCGGCAGGCCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCC
GCTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGA
CATCAGAGAATGAACACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGC
AAAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACT
GGGAAAACAGGGTTGGCACCACTCTGCCACTCC
BF057410
GCGGCCGCGGCCCACCACCAACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCT
GCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAG
AATGCGCCGGCAGGCCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCG
CTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGAC
ATCAGAGAATGAACACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCA
AAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTG
GGAAAACAGGGTTGGCACCACTCTGCCACTCCGTTTGTGCCTGGGAAGGGCTAAGTATGC
AAGGCTACAAACATCTACTTCACTGGGATCCCAAATGCTCAACAAACCATGACCTGCTNT
GGTCAGAACCACCAGAAATATTAA
BE645544
GCGGCCGCGGCCCACCACCAACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCT
GCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAG
AATGCGCCGGCAGGCCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCG
CTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGAC
ATCAGAGAATGAACACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCA
AAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTG
GGAAAACAGGGTTGGCACCACTCTGCCACTCCGTTTGTGCCTGGGAAGGGCTAAGTATGC
AAGGCTACAAACATCTACTTCACTGGGATCC
BE645408
TCCTCCCTCTAAGAAAGGCGCAAGCGTCAAGAGGGTGCTGCCCGCTGGTTTCTGCAAATG
CTGCCTTCCAAAAAGGACCTGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCC
AGCCACCAGCGAGAGCCCAAGACTGGTAACTGTCCACAGGCAACAGGGAGTCATGTCGCG
GTTCTCCAGGAGCACCCAGAGTCTGCACCACAGACACGT
BE388501
TTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTC
CTTCCTTCCAGAGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCT
CCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCAT
GGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCC
CTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAG
ACAGATTCACAGTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGG
ACTCTGAGAGGGACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTG
GGCTCAGTGCCCGGTGGGACTCATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCGTGCT
GGTCCTTCCTGCACCTTAGGCTGGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGATTGA
GCGCACAGGCCTGAAGTCTGGACAACCCGCAGAACCGAAGCTCCGAGCAGCGGGTCGGTG
GCGAGTAGTGGGGGTCGGTGGCGAACAAGTGGTGGTGGGCCGGGGCCGCATAACTCGAGG
ACTTTCCTCCCGGAGCAGTCCCTAAAAACCCGGGGGCGC
CF147366
GACGAGGACAATTGTAGAGGCTGTCTCTTCCTCCCTCCTTGTCACCCCATAGGGTGTACC
ACTGGTCTTGGAAGCACCCATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGC
CAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAGAGAAAAAGAGATTTGAGAAAGTGCCT
GGGTAATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGG
TGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATG
TTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAA
CCCTGTTTTCCCAGTCCACGTAGACAGATTCACAGTGCGGAATTCTGGAAGCTGGAGACA
GACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGGGACATGAGGGCCTCTGCCTCTGTGTT
CATTCTCTGATGTCCTGTACCTGGGCTCAGTGCCCGGTGGGACTCATCTCCTGGCCGCGC
AGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTGC
CF147143
CACGAGGCGACTTGCGAGCTGGGAGCGATTTAAAACGCTTTGGATTCCCCCGGCCTGGGT
GGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCT
CGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTT
GCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGC
GGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGA
GCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCGT
GCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAA
ACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGA
AGAGTACCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAG
CCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACGC
GACATGACTCCCTGTTGCCTGTGGACAGTTACCAATCTTGGGCTCTCGCTGGTGGCTGGA
ACAGCCAGATGTGTTGCCAGGGAG
BT007410
atggagcccg gcaattatgc caccttggat ggagccaagg atatcgaagg cttgctggga
gcgggagggg ggcggaatct ggtcgcccac tcccctctga ccagccaccc agcggcgcct
acgctgatgc ctgctgtcaa ctatgccccc ttggatctgc caggctcggc ggagccgcca
aagcaatgcc acccatgccc tggggtgccc caggggacgt ccccagctcc cgtgccttat
ggttactttg gaggcgggta ctactcctgc cgagtgtccc ggagctcgct gaaaccctgt
gcccaggcag ccaccctggc cgcgtacccc gcggagactc ccacggccgg ggaagagtac
cccagccgcc ccactgagtt tgccttctat ccgggatatc cgggaaccta ccagcctatg
gccagttacc tggacgtgtc tgtggtgcag actctgggtg ctcctggaga accgcgacat
gactccctgt tgcctgtgga cagttaccag tcttgggctc tcgctggtgg ctggaacagc
cagatgtgtt gccagggaga acagaaccca ccaggtccct tttggaaggc agcatttgca
gactccagcg ggcagcaccc tcctgacgcc tgcgcctttc gtcgcggccg caagaaacgc
attccgtaca gcaaggggca gttgcgggag ctggagcggg agtatgcggc taacaagttc
atcaccaagg acaagaggcg caagatctcg gcagccacca gcctctcgga gcgccagatt
accatctggt ttcagaaccg ccgggtcaaa gagaagaagg ttctcgccaa ggtgaagaac
agcgctaccc cttag
BC007092
ggattccccc ggcctgggtg gggagagcga gctgggtgcc ccctagattc cccgcccccg
cacctcatga gccgaccctc ggctccatgg agcccggcaa ttatgccacc ttggatggag
ccaaggatat cgaaggcttg ctgggagcgg gaggggggcg gaatctggtc gcccactccc
ctctgaccag ccacccagcg gcgcctacgc tgatgcctgc tgtcaactat gcccccttgg
atctgccagg ctcggcggag ccgccaaagc aatgccaccc atgccctggg gtgccccagg
ggacgtcccc agctcccgtg ccttatggtt actttggagg cgggtactac tcctgccgag
tgtcccggag ctcgctgaaa ccctgtgccc aggcagccac cctggccgcg taccccgcgg
agactcccac ggccggggaa gagtacccca gccgccccac tgagtttgcc ttctatccgg
gatatccggg aacctaccag cctatggcca gttacctgga cgtgtctgtg gtgcagactc
tgggtgctcc tggagaaccg cgacatgact ccctgttgcc tgtggacagt taccagtctt
gggctctcgc tggtggctgg aacagccaga tgtgttgcca gggagaacag aacccaccag
gtcccttttg gaaggcagca tttgcagact ccagcgggca gcaccctcct gacgcctgcg
cctttcgtcg cggccgcaag aaacgcattc cgtacagcaa ggggcagttg cgggagctgg
agcgggagta tgcggctaac aagttcatca ccaaggacaa gaggcgcaag atctcggcag
ccaccagcct ctcggagcgc cagattacca tctggtttca gaaccgccgg gtcaaagaga
agaaggttct cgccaaggtg aagaacagcg ctacccctta agagatctcc ttgcctgggt
gggaggagcg aaagtggggg tgtcctgggg agaccaggaa cctgccaagc ccaggctggg
gccaaggact ctgctgagag gcccctagag acaacaccct tcccaggcca ctggctgctg
gactgttcct caggagcggc ctgggtaccc agtatgtgca gggagacgga accccatgtg
acagcccact ccaccagggt tcccaaagaa cctggcccag tcataatcat tcatcctgac
agtggcaata atcacgataa ccagtactag ctgccatgat cgttagcctc atattttcta
tctagagctc tgtagagcac tttagaaacc gctttcatga attgagctaa ttatgaataa
atttggaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa
U57052
cgggtgcccc ctagattccc cgcccccgca cctcatgagc cgaccctcgg ctccatggag
cccggcaatt atgccacctt ggatggagcc aaggatatcg aaggcttgct gggagcggga
ggggggcgga atctggtcgc ccactcccct ctgaccagcc acccagcggc gcctacgctg
atgcctgctg tcaactatgc ccccttggat ctgccaggct cggcggagcc gccaaagcaa
tgccacccat gccctggggt gccccagggg acgtccccag ctcccgtgcc ttatggttac
tttggaggcg ggtactactc ctgccgagtg tcccggagct cgctgaaacc ctgtgcccag
gcagccaccc tggccgcgta ccccgcggag actcccacgg ccggggaaga gtaccccagc
cgccccactg agtttgcctt ctatccggga tatccgggaa cctaccacgc tatggccagt
tacctggacg tgtctgtggt gcagactctg ggtgctcctg gagaaccgcg acatgactcc
ctgttgcctg tggacagtta ccagtcttgg gctctcgctg gtggctggaa cagccagatg
tgttgccagg gagaacagaa cccaccaggt cccttttgga aggcagcatt tgcagactcc
agcgggcagc accctcctga cgcctccgcc tttcgtcgcg gccgcaagaa acgcattccg
tacagcaagg ggcagttgcg ggagctggag cgggagtatg cggctaacaa gttcatcacc
aaggacaaga ggcgcaagat ctcggcagcc accagcctct cggagcgcca gattaccatc
tggtttcaga accgccgggt caaagagaag aaggttctcg ccaaggtgaa gaacagcgct
accccttaag agatctcctt gcctgggtgg gaggagcgaa agtgggggtg tcctggggag
accaggaacc tgccaagccc aggctggggc caaggactct gctgagaggc ccctagagac
aacacc
U81599
tcctaatacg actcactata gggctcgagc ggccgcccgg gcaggtcgaa tgcaggcgac
ttgcgagctg ggagcgattt aaaacgcttt ggattccccc ggcctgggtg gggagagcga
gctgggtgcc ccctagattc cccgcccccg cacctcatga gccgaccctc ggctccatgg
agcccggcaa ttatgccacc ttggatggag ccaaggatat cgaaggcttg ctgggagcgg
gaggggggcg gaatctggtc gcccactccc ctctgaccag ccacccagcg gcgcctacgc
tgatgcctgc tgtcaactat gcccccttgg atctgccagg ctcggcggag ccgccaaagc
aatgccaccc atgccctggg gtgccccagg ggacgtcccc agctcccgtg ccttatggtt
actttggagg cgggtactac tcctgccgag tgtcccggag ctcgctgaaa ccctgtgccc
aggcagccac cctggccgcg taccccgcgg agactcccac ggccggggaa gagtacccca
gtcgccccac tgagtttgcc ttctatccgg gatatccggg aacctaccac gctatggcca
gttacctgga cgtgtctgtg gtgcagactc tgggtgctcc tggagaaccg cgacatgact
ccctgttgcc tgtggacagt taccagtctt gggctctcgc tggtggctgg aacagccaga
tgtgttgcca gggagaacag aacccaccag gtcccttttg gaaggcagca tttgcagact
ccagcgggca gcaccctcct gacgcctgcg cctttcgtcg cggccgcaag aaacgcattc
cgtacagcaa ggggcagttg cgggagctgg agcgggagta tgcggctaac aagttcatca
ccaaggacaa gaggcgcaag atctcggcag ccaccagcct ctcggagcgc cagattacca
tctggtttca gaaccgccgg gtcaaagaga agaaggttct cgccaaggtg aagaacagcg
ctacccctta agagatctcc ttgcctgggt gggaggagcg aaagtggggg tgtcctgggg
agaccagaaa cctgccaagc ccaggctggg gccaaggact ctgctgagag gcccctagag
acaacaccct tcccaggcca ctggctgctg gactgttcct caggagcggc ctgggtaccc
agtatgtgca gggagacgga accccatgtg acaggcccac tccaccaggg ttcccaaaga
acctggccca gtcataatca ttcatcctca cagtggcaat aatcacgata accagt
CB120119
ATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAG
AGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTC
TCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAG
CATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCA
CAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCACA
GTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGG
GACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCC
CGGTGGGACTCATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTG
CACCTTAGGCTGGGGGTGGGGGGCCT
CB125764
ATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAG
AGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTC
TCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAG
CATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCA
CAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCACA
GTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGG
GACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCC
CGGTGGGACTCATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTG
CACCTTAGGCTGGGGGTGGGGGGGGCCTGCCGGCGCATTCTCCACGATTGAGCGCACAGG
CCTGAAGTCTGGACAACCCGCAGAACCGAAGCTCCGAGCAGCGGGTCGGTGGCGAGT
AU098628
ATTTAAAACGCTTTGGATTCTTTCGTCCTGCGTGGGGAGAGCGAGCTGGGTGCCCCCTAG
ATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCACTTATGC
CACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCT
GGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAA
TTATGCCCCCTTGCATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGCCC
CB126130
ATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAG
AGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTC
TCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAG
CATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCA
CAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCACA
GTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGG
GACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCC
CGGTGGGACTCATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTG
CACCTTAGGCTGGGGGTGGGGGGCCTGC
B1023924
AGGCCGCACCCAGTCTTAAGGTGCAGTGAAGGACAGCACGAACCCGCTGTGCTTTGCTGC
GCGGCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGACATCAGAGAATGAAC
ACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCAAAGAGCCCGTCTGT
CTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTGNGAAAACAGGGTTG
GCACCACTCTGCCACTCCGTTTGTGCCTNGGGGCGGGCAGAGGG
BM767063.1
AAAAACGCTTTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATT
CCCCGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCAC
CTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGT
CGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTA
TGCCCCCTTGGATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGG
GGTGCCCCAGGGGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTA
CTCCTGCCGAGTGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGC
GTACCCCGCGGAGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGC
CTTCTATCCGGGATATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGTCTGT
GGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACATGACTCCCTGTTGCCTGTGGACAG
TTACCAGTCTTGGGCTCTCGCTGGTGGCTGGAACAGCCAGATGTGTTGCCA
BM794275
GCAGACTCTGGGTGCTCCTGGAGAACCGCGACGTGACTCCCTGTTGCCTGTGGACAGTTA
CCACTCTTGGGCTCTCGCTGGTGGCTGGAACAGCCAGATGTGTTGCCAGGGAGAACAGAA
CCCACCAGGTCCCTTTTGGAAGGCAGCATTTGCAGACTCCAGCGGGCAGCACCCTCCTGA
CGCCTGCGCCTTTCGTCGCGGCCGCAAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCG
GGAGCTGGAGCGGGAGTATGCGGCTAACAAGTTCATCACCAAGGACAAGAGGCGCAAGAT
CTCGGCAGCCACCAGCCTCTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGT
CAAAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTT
GCCTGGGTGGGAGGATCTAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCC
AGGCTGGGGCCAAGGACT
BQ363211
ACGCTGCACTGCGTTTCAAAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACAGCGCTACCC
CTTAAGAGATCTCCTTGCTTGGGTGGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCA
GGAACCTGCCATCACCAGGCTGGGCCCAAGGACTCTGCTGAGAGGCCCCTAGAGACAACA
CCCTTCCCAGGCCATTGCTTGCTGGACTGTGCCTCAGGAGCGGCCTGGGTACC
BM932052
GAGTTTTCCAATTTCCAAAGAAAAATTTAGGTTTCCTGCAGCCGTGACATATGTGTGTGC
ACTGGGATGGGTTAATGTGTGTGTGTGTGTGTGTATGCGCATGTATTGGGAGTGGGGGCA
GAAACGTGTTTCCAGAATTTGCCTGTAGAATCTAAAAGAGTGGCCAAGAGTCTGGAAATG
CATGAAGACTGGACGTATGTGATGGTGGGCAAAGGCCTGACTGTGTGTGGTGTGTGGGTA
TGTTTGCAGATTCGCGGGTGTGAGAGCAGTGATGGGTGAGGGTGGCCTTCAGGAGCCAAG
GCTGATCGGTGGTGAGAGAACAAGCCGGAAGCCAGGGTGCTGTCCTGGTATGCTTTGGAG
GAACAGGATTGCACGTGCGCCTGTAGGGTGACCTGTGTGCACCTGTGAGATGACTTAGCT
TGGGGCTTGCAAGGCCTGGGTCTGCATGGGTGGGTATCTGACCATGCCTTTTCCTCCCTC
CCTTTCACGCCGCGCAGACTCCAGCGGGCAGCACCCTCCTGACGCCTGCGCCTTTCGTC
AA357646.1
CCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCAT
GAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGAT
ATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACC
AGCCACCCAGCGGCGCCTACGCTTGATGCCTGCTTGTCAACTATGCCCCCTTGGATCTGC
AW609525
ACCGCGGGTCAAATTTATTCATAATTAGCTCAATCATGAAAGCGGTTCTAAAGTGCTCTA
CAGAGCTCTAGATAGAAAATATGAGGCTAACGATCATGGCAGCTAGTACTGGTTATCGTG
ATTATGGCCACTGTCAGGATGAATGATAATGACTGGGCCAGGTCCTTTGGAAACCCTGGT
GGAGTGGGCTGTCACATGGGGTCCCGTCTCCCTGCACATACTGGGTACCCAGGCCGCTCC
TGAGGAACAGTCCAGCAGCCAGTGGCCTGGGAAGGGTGTGGTCTCTAGGGGCCTCTCAGC
AGAGTCCTTGGCCCCAGCCTGGGCTTGGCAGGTCCCTGGTCTCCCCAGGACACCCCCACT
TTCGCTCCTCCCACCCAGGCAAGGAGATCTCTTAAGGGGTAGCGCTGTTCTTCACCTTGG
CGAGAACCTTCTTCTCTTTGAACCGGCGGTGCGGCGTGGGGTACCGAGC
CB126919
ATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAG
AGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTC
TCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAAGTCATGGTTTGTTGAG
CATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCA
CAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCACA
GTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGG
GACATGAAGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCC
CGGTGGGACTCATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGT
AW609336
CCAACGAGAAGAAGGTTCTCGCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTT
GCGTGGGTGGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAGCCCA
GGCTGAGGCCAAGGACTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTG
GATGCTGAACTGTCCCTCAGGAGCGGCCTGGGTACCCAGTATGTGCAGGGAGACGGAACC
CCATGTGACAGCCCACTCCACCAGGGTTCCCAAAGAACCTGGCCCCAGTCATAATCATTC
ATCCTGACAGTGGCAATAATCACGATAACCAGTACTAGCTGCCATGATCGTAAGCCTCAT
ATTTGCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATTGAGCTAATT
ATGACTCAATTTGAACCGGCGTCCGGCGTG
AW609244
ACGCGCACCGCGGTCAAGAGAAGAAGGTTCTCGCAAGGTGAAGAACAGCGCTACCCCTTA
AGAGATCTCCTTGCGTGGGTGGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAA
CCTGCCAAGCCCAGGCTGTGGCCAAGGACTCTGCTGAGAGGCCCCTATGAGACAACACCC
TTCCCAGGCCACTGGCTGCTGGGACTGTTCCTCAGGAGCGGCCTGGGTACCCGAGTAATG
TGCAGGGGAGACGGAACCCCATGTGACAGCCCACTCCACCAGGGTTCCCAAAAGAACCCT
GGCCCAGTCATAATCATTCATCCTGACAGTGGCAATAATCACGATAACCAGTACTAGCTG
CCATGATCGTAAGCCTCATATTTGCTATCTAGAGCTCTGTAGAGCCCTTTAGAAACCGCT
TTCATGAATGGAGCTAAATTATGAATACATTTGAACCGGCGATCCGACGTGA
BF855145
CTAGAGGATCCCGGAAGCAACTGCAACAGGTTCCCAAAGAACCGGGCCAGTCATAATCAT
TCATCCTGACAGGGCAATAATCACGATAACCAGTACTAGCTGCCATGATCGTTAGCCTCA
TATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATGGAGCTAAT
TATGAATAAATTTGGAAGGCGATCCCTTGGCAGGGAAGCTTTCTCTCAGACCCCCTTCCA
TTACACCTCTCACCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAGATTCGT
GGTGTTGCAGTGTGCTTCCG
AU126914
GAGCGAATGCAGGCGACTTGCGAGCTGGGAGCGATTTAAAACGCTTTGGATTCCCCCGGC
CTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCC
GACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGA
AGACTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCA
CCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTC
GGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGC
TCCCGTGCCTTATGGTTACTTTGGAGGCGGGTNCTACTCCTGCCGAGTGTCCCGGAGCTC
GCTGAAACCCTGTGCCCANNCANCCACCCTGGCCGCGTN
CB126449
CTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGTGCTCAGTGCCCGGTGGGACTC
ATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTGCACCTTCGGCT
GGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGATT
AW582404
ACGCTGCACCGCCGGTCCAAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACAGCGCTACCC
CTTTAAGAGATCTCCTTGCTGGGGTGGGAGGAGCGAAAGTGGGGGTGTCTGGGGAGACCA
GGAACCTGCCAGCCCCAGGCTGGGCCCAAGGACTCTGCTGAGAGGCCCCTAGAGACAACA
CCCTTCCCAGGCCACTGTCTGCTGGACTGTTCCTCAGGAGCGGCCTGGGTACNCAGTATG
TGCAGGGAGACGGAACCCCATGTGACAGCCCACTCCACCAGGGTTCCCAAAGAACCTGGC
CCAGTCATAATCATTCATCCTGACAGTGGCAATAATCACGATAACCAGTACTAGCTGCCA
TGATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTC
ATGAATTGAGCTACTTATGAATCACTTTGAACCGGCGGTGCGGCGTG
BX641644
GGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCC
TCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCT
TGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAG
CGGCGCCTACGCTGACGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGG
AGCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCG
TGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGA
AACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGG
AAGAGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACC
AGCCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAAC
CGCGACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTNGTGGCT
GGAACAGCCAGATGTGTTGCCAGGGAGAACAGAACCCACCAGGTCCCTTTTGGAAGGCAG
CATTTG
Sequences from Table 4 not disclosed above
AW006861(IMAGE克隆ID::2497262)
GCTGAGTTCTGAAGCTTCTGAGTTCTGCAGCCTCACCTCTGAGAAAACCTCTTTTCCACC
AATACCATGAAGCTCTGCGTGACTGTCCTGTCTCTCCTCATGCTAGTAGCTGCCTTCTGC
TCTCTAGCGCTCTCAGCACCAATGGGCTCAGACCCTCCCACCGCCTGCTGCTTTTCTTAC
ACCGCGAGGAAGCTTCCTCGCAACTTTGTGGTAGATTACTATGAGACCAGCAGCCTCTGC
TCCCAGCCAGCTGTGGTATTCCAAACCAAAAGAAGCAAGCAAGTCTGTGCTGATCCCAGT
GAATCCTGGGTCCAGGAGTACGTGTATGACCTGGAACTGAACTGAGCTGCTCAGAGACAG
GAAGTCTTCAGGGAAGGTCACCTGAGCCCGGATGCTTCTCCATGAGACACATCTCCTCCA
TACTCAGGACTCCTCTCCGCAGTTCCTGTCCCTTCTCTTAATTTAATCTTTTTTATGTGC
CGTGTTATTGTATTAGGTGTCATTTCCATTATTTATATTAGTTTAGCCAAAGGATAAGTG
TCCCCTATGGGGATGGTCCACTGTCACTGTTTCTCTGCTGTTGCAAATACATGGATAACA
CATTTGATTCTGTGTGTTTTCATAATAAAACTTTAAAATAAAATGCAAAAAAAAAAAAAA
AAAA
X59770
GCCACGTGCTGCTGGGTCTCAGTCCTCCACTTCCCGTGTCCTCTGGAAGTTGTCAGGAGC
AATGTTGCGCTTGTACGTGTTGGTAATGGGAGTTTCTGCCTTCACCCTTCAGCCTGCGGC
ACACACAGGGGCTGCCAGAAGCTGCCGGTTTCGTGGGAGGCATTACAAGCGGGAGTTCAG
GCTGGAAGGGGAGCCTGTAGCCCTGAGGTGCCCCCAGGTGCCCTACTGGTTGTGGGCCTC
TGTCAGCCCCCGCATCAACCTGACATGGCATAAAAATGACTCTGCTAGGACGGTCCCAGG
AGAAGAAGAGACACGGATGTGGGCCCAGGACGGTGCTCTGTGGCTTCTGCCAGCCTTGCA
GGAGGACTCTGGCACCTACGTCTGCACTACTAGAAATGCTTCTTACTGTGACAAAATGTC
CATTGAGCTCAGAGTTTTTGAGAATACAGATGCTTTCCTGCCGTTCATCTCATACCCGCA
AATTTTAACCTTGTCAACCTCTGGGGTATTAGTATGCCCTGACCTGAGTGAATTCACCCG
TGACAAAACTGACGTGAAGATTCAATGGTACAAGGATTCTCTTCTTTTGGATAAAGACAA
TGAGAAATTTCTAAGTGTGAGGGGGACCACTCACTTACTCGTACACGATGTGGCCCTGGA
AGATGCTGGCTATTACCGCTGTGTCCTGACATTTGCCCATGAAGGCCAGCAATACAACAT
CACTAGGAGTATTGAGCTACGCATCAAGAAAAAAAAAGAAGAGACCATTCCTGTGATCAT
TTCCCCCCTCAAGACCATATCAGCTTCTCTGGGGTCAAGACTGACAATCCCGTGTAAGGT
GTTTCTGGGAACCGGCACACCCTTAACCACCATGCTGTGGTGGACGGCCAATGACACCCA
CATAGAGAGCGCCTACCCGGGAGGCCGCGTGACCGAGGGGCCACGCCAGGAATATTCAGA
AAATAATGAGAACTACATTGAAGTGCCATTGATTTTTGATCCTGTCACAAGAGAGGATTT
GCACATGGATTTTAAATGTGTTGTCCATAATACCCTGAGTTTTCAGACACTACGCACCAC
AGTCAAGGAAGCCTCCTCCACGTTCTCCTGGGGCATTGTGCTGGCCCCACTTTCACTGGC
CTTCTTGGTTTTGGGGGGAATATGGATGCACAGACGGTGCAAACACAGAACTGGAAAAGC
AGATGGTCTGACTGTGCTATGGCCTCATCATCAAGACTTTCAATCCTATCCCAAGTGAAA
TAAATGGAATGAAATAATTCAAACACAAAAAAAAAAAAAAAAAAAAAA
AB000520
GGATCCAAGCTATTGTCCTGCCCATGGCTTCCCATCTCAGGACGCTCTCTGGCCGCTATC
ATCCCAGCAGTGGAGTTCAGCCCACTACTCTGAACCAGCCGCAGGTGGCTGCTATGGGAC
TGAAGCCATGAATGGTGCCGGCCCTGGCCCCGCCGCAGCCGCCCCGGTCCCAGTCCCGGT
CCCGGTCCCGGACTGGCGGCAGTTCTGCGAGCTGCATGCGCAGGCGGCCGCCGTGGACTT
TGCGCACAAGTTCTGCCGTTTCCTGCGGGACAACCCAGCTTACGACACGCCCGACGCCGG
CGCCTCCTTCTCCCGCCACTTCGCCGCCAACTTCCTGGACGTCTTCGGCGAGGAGGTGCG
CCGCGTGCTGGTGGCTGGGCCGACGACTCGGGGCGCGGCCGTGAGCGCAGAGGCCATGGA
GCCGGAGCTCGCGGACACCTCTGCACTCAAGGCGGCGTCCTACGGCCACTCGCGGAGCTC
GGAGGACGTGTCCACGCACGCGGCCACCAAGGCCCGCGTTCGCAAGGGCTTCTCGCTGCG
CAACATGAGCCTGTGCGTGGTGGACGGCGTGCGCGACATGTGGCACCGGCGCGCCTCGCC
CGAGCCCGACGCGGCAGCTGCCCCGCGCACCGCCGAGCCCCGCGACAAGTGGACGCGGCG
CCTGAGGCTGTCGCGGACGCTGGCTGCCAAGGTGGAGCTGGTGGACATTCAACGCGAGGG
GGCGCTGCGCTTCATGGTGGCCGACGACGCGGCCGCGGGCTCCGGGGGCTCGGCTCAGTG
GCAGAAGTGCCGCCTGCTCCTGCGCAGGGCTGTGGCCGAGGAACGCTTCCGCCTGGAGTT
CTTCGTGCCGCCCAAAGCCTCCAGGCCCAAGGTCAGCATCCCACTGTCAGCCATCATTGA
GGTCCGCACCACCATGCCCCTGGAAATGCCAGAGAAGGATAACACATTCGTCCTCAAGGT
AGAGAATGGAGCCGAATACATCTTGGAGACCATCGACTCTCTGCAGAAGCACTCGTGGGT
AGCTGACATCCAGGGCTGCGTGGACCCCGGTGACAGTGAGGAAGACACCGAGCTCTCCTG
TACCCGAGGAGGCTGTCTGGCCAGCCGCGTGGCCTCCTGCAGCTGTGAGCTCCTGACTGA
TGCAGTCGACCTGCCCCGCCCCCCAGAGACGACAGCCGTGGGTGCAGTGGTGACAGCCCC
CCACAGCCGAGGTCGAGATGCCGTCAGAGAATCCCTGATCCACGTCCCGCTAGAGACCTT
TCTGCAGACCCTGGAATCCCCGGGCGGCAGCGGCAGTGACAGCAATAACACAGGGGAACA
GGGTGCAGAGACGGATCCCGAGGCTGAACCCGAGCTGGAGCTATCCGACTACCCATGGTT
CCACGGGACACTGTCCCGGGTCAAGGCTGCTCAACTGGTTCTGGCAGGGGGGCCCCGGAA
CCACGGCCTCTTCGTGATCCGCCAAAGTGAGACTCGGCCTGGGGAGTACGTGCTGACCTT
CAACTTCCAGGGCAAGGCCAAGCACCTGCGCCTGTCCCTGAACGGCCACGGCCAGTGTCA
CGTACAGCATCTGTGGTTCCAGTCTGTGCTTGACATGCTCCGCCACTTCCACACACACCC
CATCCCACTGGAGTCAGGGGGCTCGGCCGACATCACCCTTCGCAGCTATGTGCGGGCCCA
GGACCCCCCACCAGAGCCGGGCCCCACGCCCCCTGCCGCGCCCGCGTCCCCGGCCTGCTG
GAGCGACTCGCCCGGCCAGCACTACTTCTCCAGCCTCGCCGCGGCCGCCTGCCCGCCTGC
CTCGCCCTCCGACGCCGCCGGCGCCTCCTCGTCTTCCGCCTCGTCGTCCTCTGCCGCGTC
GGGGCCCGCCCCCCCGCGCCCCGTCGAGGGCCAGCTCAGCGCGCGGAGCCGCAGCAACAG
CGCCGAGCGCCTGCTGGAGGCCGTGGCCGCCACCGCCGCCGAGGAGCCCCCGGAGGCCGC
GCCCGGCCGCGCGCGCGCCGTGGAGAACCAGTACTCCTTCTACTAGCCCGCGGCGCCGCC
CGGGTGGGACACGCCAAGCTCTTCAGTGAAGACACGATGTTATTAAAAGCCTGTTTTAGG
GACTGCAAAA
AI820604(IMAGE克隆Id:1605108
GATTCCAGCACGGGCTTCGCAGACTGCAGGACACAGAGGCACGCGTGCACATCATGTCTT
CTAAGGAATTTGAACACTGTTGAGAAGACTGTGTACAAGAGAGATGTGCCATGTCAGCCT
TGCAAGGGACAGCGTGAAAACTACCCATCTCCGGTCACCAAGTTGCAGGAGGCCAGGAGC
CAGGAGGGGAAACCGCTCAGTTTGCAAAACGTCGCTTCCACAAGCCTGATGGCTGAAACT
GCTCACTGTACCCTGAAACCAGCTTTACCTACAGCTTCTGAGATAAACTGCTGCAACTCT
GGGACCCACGATGCCTATCACAGTGGCTCATCAATGGAACCTGCCGGCTCCCAACCCTTC
CTAGGGCCCATGAACTCTCTGAAAAGAGGAACAGAAATATTTCTCCTTTTTGTAAAATCT
TTAACCTTCCCTTTGTTCTTCATGTACACGCTGAACTGCAATTCTTCTTCCCAAATAAAA
CATTAAATTTAAAAAA
AI087057(IMAGE克隆ID:1671188)
GGCCCCGGAGGGAGAGTAACCCGGCCCATCCATCCGTCGCCCGGTTCTTGGGGAACTACT
TTCAGGGGCTTCTTGCCGTCCCCTCATCAGCTCTGTGCGAACCCTCTGTCGGCAGCCATT
GAGGAGACCCTGCCCCCTGGACCCTGACCACATATAGATTGAGGCCGAGGAGTGGCTGCC
CTGTCCCTTTTATGACAGCCCGCAGAAGCCCCGGGGTGAGGCATGGAGGAGGCAGGCGAC
AGCTGACAGGGACCCTGTTGGCCTCCAGCATGTCCAGCCAGCCGGGCAGGATTTCTCTGC
TTCTGGCTGGCAGCCAGGAACTGAGTATGACAATGTTGTACTAAAGAAAGGCCCAAAGTG
ACAGAGGCAGCAGAGGGATGGTCCACCGCCCCTTGGCTTCTGCTGGTGACTCCTCCTGGC
CACTGCATCAGAAGAACCTCCTCTGCCCCTTCTGGAGCCCGAGGCCTGGCCTGTCTTCGT
TGGGGCTGATAAATTGCCTCTCCCAGGGCCTGCTGGGTGAGTCACCATCCCAAAGCAGGA
AGGGTGCCCTGGAGAGAACCACCCTCCTCCTACTCTTTTTCCACTTCCTCCTCTTTCTTT
CCCCAGCTGAGGAGGAACCTGGGGCATTTAGGGCAGAGGACAAAAGGATGTCAGCAATTG
CTTGGGCTGCTTGGCTATGCAAGCCTCCTGCCTGCTGATGGCCACTTCAGGGACAGCCTG
GGCCCAGGCACCCAGGGGGATGGCGGCAGCTTCCTGCACCTTTCAGATTTCTTGGTGGCA
TTAAAGCATTTTCAGAACAAAAAAAAAAAAAAAAAAAAAAAAAA
AJ272267
GGCGGGCCTGGACGGCCGCGTGCTGTACTGGCCACGCGGCCGCGTCTGGGGTGGCTCCTC
ATCCCTCAATGCCATGGTCTACGTCCGTGGGCACGCCGAGGACTACGAGCGCTGGCAGCG
CCAGGGCGCCCGCGGCTGGGACTACGCGCACTGCCTGCCCTACTTCCGCAAGGCGCAGGG
CCACGAGCTGGGCGCCAGCCGGTACCGGGGCGCCGATGGCCCGCTGCGGGTGTCCCGGGG
CAAGACCAACCACCCGCTGCACTGCGCATTCCTGGAGGCCACGCAGCAGGCCGGCTACCC
GCTCACCGAGGACATGAATGGCTTCCAGCAGGAGGGCTTCGGCTGGATGGACATGACCAT
CCATGAAGGCAAACGGTGGAGCGCGGCCTGTGCCTACCTGCACCCAGCACTGAGCCGCAC
CAACCTCAAGGCCGAGGCCGAGACGCTTGTGAGCAGGGTGCTATTTGAGGGCACCCGTGC
AGTGGGCGTGGAGTATGTTAAGAATGGCCAGAGCCACAGGGCTTATGCCAGCAAGGAGGT
GATTCTGAGTGGAGGTGCCATCAACTCTCCACAGCTGCTCATGCTCTCTGGCATCGGGAA
TGCTGATGACCTCAAGAAACTGGGCATCCCTGTGGTGTGCCACCTACCTGGGGTTGGCCA
GAACCTGCAAGACCACCTGGAGATCTACATTCAGCAGGCATGCACCCGCCCTATCACCCT
CCATTCAGCACAGAAGCCCCTGCGGAAGGTCTGCATTGGTCTGGAGTGGCTCTGGAAATT
CACAGGGGAGGGAGCCACTGCCCATCTGGAAACAGGTGGGTTCATCCGCAGCCAGCCTGG
GGTCCCCCACCCGGACATCCAGTTCCATTTCCTGCCATCCCAAGTGATTGACCACGGGCG
GGTCCCCACCCAGCAGGAGGCTTACCAGGTACATGTGGGGCCCATGCGGGGCACGAGTGT
GGGCTGGCTCAAACTGAGAAGTGCCAATCCCCAAGACCACCCTGTGATCCAGCCCAACTA
CTTGTCAACAGAAACTGATATTGAGGATTTCCGTCTGTGTGTGAAGCTCACCAGAGAAAT
TTTTGCACAGGAAGCCCTGGCTCCGTTCCGAGGGAAAGAGCTCCAGCCAGGAAGCCACAT
TCAGTCAGATAAAGAGATAGATGCCTTTGTGCGGGCAAAAGCCGACAGCGCCTACCACCC
CTCGTGCACCTGTAAGATGGGCCAGCCCTCCGATCCCACTGCCGTGGTGGATCCGCAGAC
AAGGGTCCTCGGGGTGGAAAACCTCAGGGTCGTCGATGCCTCCATCATGCCTAGCATGGT
CAGCGGCAACCTGAACGCCCCCACAATCATGATCGCAGAGAAGGCAGCTGACATTATCAA
GGGGCAGCCTGCACTCTGGGACAAAGATGTCCCTGTCTACAAGCCCAGGACGCTGGCCAC
CCAGCGCTAAGACAGTTGCTGCTGGAGGATGACCAGGGAAGCCCCCTGATAAGCCAAGAG
GGCCAGCACAGCCCTTGCTCCCAGGCTCCTGCCTGAAACTATCTAGCACACTAGGACCCA
GGTGGTACCCTACTCAGTGGCTGAGAATTGGATAAAGTCTTKGGGAAATGAGACAAGTAC
TGGGCAGTGAATCCAGCTCCTTTTCCCCAGCCTTTCCCTGTGGGCCATTTGGGGAAGGCC
AGCATTYCAGCCTGAGATGTTCCTCCCTGCCTCCTGGGGGGGCARAAGGGVTAGGWTGGT
TAACTCCTGCCGCATCCTTCCCTGCCTCCTGGAGGGACAGAAGGGGAGGATGGTTAACTC
CTGCCGCATCCTTTTTCTTGTGTTCACGTGGCATTCTCTAACCCAGGGCAGTGGTTCCTT
CCCAGGCCATGCACAGAGGCTGGGTGCCTGCCAGACCCACGGAGGGTTCGCGAAGGAAGG
GGCATCCTCCTTCTTGAGCTGCAAGCTTTAGCTGAGGCAGTAAGTCACACAGTAGTTAGT
TCAGCCTGGGCTGGCACATAAGTCCCCAGTGTCCCTGTTGAGAGGGGAAAGTTGCCTGCT
GGTTGAAAAACTGGCTTTTCCTTTCTCGCTGCCTAATTTCACTCTCAGAGTGAGGCAGGT
AACTGGGGCTCCACTGGGTCACTCTGAGAGGGTTGTGGCTCTGGTTCTTATTAAACCAGG
GCCAGGTGCAGGGCTCACACCTGTAATCCCAGCACTTTGGGAAGGTCACTTGAGCTCAGG
AGTTCAAGACCAGCCTGGGCAACATAGTGAGACCTTGTCTCTGGAAAACAATTAGCTGGG
CATGGTGGTACACACCTGTAGTCCCAGCTACTTGGGAGGCTGAGGCGGGAGGATGGCTTT
AGCCCAGGAGGTTGAGGCTCCTGTGAACCCTGATGGCACCACTGCACTCCAGCCTGGGTG
ACAGGGTGAGACCCTGTCTCAAAAAAAAA
N30081(IMAGE克隆ID:258695)
CCGCCGTTGNCAAAGGGCCCAGAATATGGGCCATGGACNATCTCCATGCCTGGGGAAATT
CCCTCGGGTCTTTTGGNTAACCNCCTTATAGAAAGGTAATGNCATGGAGTCTCTACAGGG
NGCACAAGGTGGACTAATTGATACGAAGAGCCCTGTAAATATGTGGGCAGCGGCAGATTT
TGACCATTTGGACCGAACTGTATTTGACACAGCGCAATATCTGGAACTGGTTGGTCAAAA
ACCTGCTTGTCTTGTTAAATTTCCTCTGTCCAAGGACATGGAATCTCTCTCTAATTTTAC
TTCAAATTTCCCTTTCCTTCATTTCTCTAAAAACGTTAAATAAGAAAGAAGATTGTAAAG
CCAGCATTTGAAGCCTAAGTATTGAAAGTCTTTGACAATTTCTGAAATCAGACTTGACAT
CTTTCCCCCGCCTTGCAAATTTCTTGAAGAAATAAGAAGCTACATGTAAGCATCATCATG
TTTATTAAATTACAATGAGAACTCTCACTCAATCTTGACCAGAGCAGACTCTTAACTTGG
AAGCAGAGTCCCTCTAAAGGTAACTCTTGTGGTCACTCAATATTGTATTGGCATTTGCAT
ATTAAATAGACATTTCAGTAGCATTT
AI700363(IMAGE克隆ID:2327403)
TGGCCCGCGGTCGCGGTGGGATCCTAGCCCTGTCTCCTCTCCTGGGAAGGAGTGAGGGTG
GGACGTGACTTAGACACCTACAAATCTATTTACCAAAGAGGAGCCCGGGACTGAGGGAAA
AGGCCAAAGAGTGTGAGTGCATGCGGACTGGGGGTTCAGGGGAAGAGGACGAGGAGGAGG
AAGATGAGGTCGATTTCCTGATTTAAAAAATCGTCCAAGCCCCGTGGTCCAGCTTAAGGT
CCTCGGTTACATGCGCCGCTCAGAGCAGGTCACTTTCTGCCTTCCACGTCCTCCTTCAAG
GAAGCCCCATGTGGGTAGCTTTCAATATCGCAGGTTCTTACTCCTCTGCCTCTATAAGCT
CAAACCCACCAACGATCGGGCAAGTAAACCCCCTCCCTCGCCGACTTCGGAACTGGCGAG
AGTTCAGCGCAGATGGGCCTGTGGGGAGGGGGCAAGATAGATGAGGGGGAGCGGCATGGT
GCGGGGTGACCCCTTGGAGAGAGGAAAAAGGCCACAAGAGGGGCTGCCACCGCCACTAAC
GGAGATGGCCCTGGTAGAGACCTTTGGGGGTCTGGAACCTCTGGACTCCCCATGCTCTAA
CTCCCACACTCTGCTATCAGAAACTTAAACTTGAGGATTTTCTCTGTTTTTCACTCGCAA
TAAATTCAGAGCAAACAAAAAAAAAAAAAAA
AL117406
CAATAGGCCGGCTTTTGAACTGCTTCGCAGGGGACTTGGAACAGCTGGACCAGCTCTTGC
CCATCTTTTCAGAGCAGTTCCTGGTCCTGTCCTTAATGGTGATCGCCGTCCTGTTGATTG
TCAGTGTGCTGTCTCCATATATCCTGTTAATGGGAGCCATAATCATGGTTATTTGCTTCA
TTTATTATATGATGTTCAAGAAGGCCATCGGTGTGTTCAAGAGACTGGAGAACTATAGCC
GGTCTCCTTTATTCTCCCACATCCTCAATTCTCTGCAAGGCCTGAGCTCCATCCATGTCT
ATGGAAAAACTGAAGACTTCATCAGCCAGTTTAAGAGGCTGACTGATGCGCAGAATAACT
ACCTGCTGTTGTTTCTATCTTCCACACGATGGATGGCATTGAGGCTGGAGATCATGACCA
ACCTTGTGACCTTGGCTGTTGCCCTGTTCGTGGCTTTTGGCATTTCCTCCACCCCCTACT
CCTTTAAAGTCATGGCTGTCAACATCGTGCTGCAGCTGGCGTCCAGCTTCCAGGCCACTG
CCCGGATTGGCTTGGAGACAGAGGCACAGTTCACGGCTGTAGAGAGGATACTGCAGTACA
TGAAGATGTGTGTCTCGGAAGCTCCTTTACACATGGAAGGCACAAGTTGTCCCCAGGGGT
GGCCACAGCATGGGGAAATCATATTTCAGGATTATCACATGAAATACAGAGACAACACAC
CCACCGTGCTTCACGGCATCAACCTGACCATCCGCGGCCACGAAGTGGTGGGCATCGTGG
GAAGGACGGGCTCTGTAGGTTTTTACTGAGCACCTACTATGTGCCTGGGAACCGAAAGGG
AAGTCCTCCTTGGGCATGGCTCTCTTCCGCCTGGTGGAGCCCATGGCAGGCCGGATTCTC
ATTGACGGCGTGGACATTTGCAGCATCGGCCTGGAGGACTTGCGGTCCAAGCTCTCAGTG
ATCCCTCAAGATCCAGTGCTGCTCTCAGGAACCATCAGATTCAACCTAGATCCCTTTGAC
CGTCACACTGACCAGCAGATCTGGGATGCCTTGGAGAGGACATTCCTGACCAAGGCCATC
TCAAAGTTCCCCAAAAAGCTGCATACAGATGTGGTGGAAAACGGTGGAAACTTCTCTGTG
GGGGAGAGGCAGCTGCTCTGCATTGCCAGGGCTGTGCTTCGCAACTCCAAGATCATCCTT
ATCGATGAAGCCACAGCCTCCATTGACATGGAGACAGACACCCTGATCCAGCGCACAATC
CGTGAAGCCTTCCAGGGCTGCACCGTGCTCGTCATTGCCCACCGTGTCACCACTGTGCTG
AACTGTGACCACATCCTGGTTATGGGCAATGGGAAGGTGGTAGAATTTGATCGGCCGGAG
GTACTGCGGAAGAAGCCTGGGTCATTGTTCGCAGCCCTCATGGCCACAGCCACTTCTTCA
CTGAGATAAGGAGATGTGGAGACTTCATGGAGGCTGGCAGCTGAGCTCAGAGGTTCACAC
AGGTGCAGCTTCGAGGCCCACAGTCTGCGACCTTCTTGTTTGGAGATGAGAACTTCTCCT
GGAAGCAGGGGTAAATGTAGGGGGGGTGGGGATTGCTGGATGGAAACCCTGGAATAGGCT
ACTTGATGGCTCTCAAGACCTTAGAACCCCAGAACCATCTAAGACATGGGATTCAGTGAT
CATGTGGTTCTCCTTTTAACTTACATGCTGAATAATTTTATAATAAGGTAAAAGCTTATA
GTTTTCTGATCTGTGTTAGAAGTGTTGCAAATGCTGTACTGACTTTGTAAAATATAAAAC
TAAGGAAAACTCAAAAAAAAAAAA
M92432
CCCACAGGGGGACCGGCCCTGTGACCCCTCACCGGGGCCGTGGGCCCGAGCCCCGGACTT
CCCTAAGCCGGCAATGACCGCCTGCGCCCGCCGAGCGGGTGGGCTTCCGGACCCCGGGCT
CTGCGGTCCCGCGTGGTGGGCTCCGTCCCTGCCCCGCCTCCCCCGGGCCCTGCCCCGGCT
CCCGCTCCTGCTGCTCCTGCTTCTGCTGCAGCCCCCCGCCCTCTCCGCCGTGTTCACGGT
GGGGGTCCTGGGCCCCTGGGCTTGCGACCCCATCTTCTCTCGGGCTCGCCCGGACCTGGC
CGCCCGCCTGGCCGCCGCCCGCCTGAACCGCGACCCCGGCCTGGCAGGCGGTCCCCGCTT
CGAGGTAGCGCTGCTGCCCGAGCCTTGCCGGACGCCGGGCTCGCTGGGGGCCGTGTCCTC
CGCGCTGGCCCGCGTGTCGGGCCTCGTGGGTCCGGTGAACCCTGCGGCCTGCCGGCCAGC
CGAGCTGCTCGCCGAAGAAGCCGGGATCGCGCTGGTGCCCTGGGGCTGCCCCTGGACGCA
GGCGGAGGGCACCACGGCCCCTGCCGTGACCCCCGCCGCGGATGCCCTCTACGCCCTGCT
TCGCGCATTCGGCTGGGCGCGCGTGGCCCTGGTCACCGCCCCCCAGGACCTGTGGGTGGA
GGCGGGACGCTCACTGTCCACGGCACTCAGGGCCCGGGGGCTGCCTGTCGCCTCCGTGAC
TTCCATGGAGCCCTTGGACCTGTCTGGAGCCCGGGAGGCCCTGAGGAAGGTTCGGGACGG
GCCCAGGGTCACAGCAGTGATCATGGTGATGCACTCGGTGCTGCTGGGTGGCGAGGAGCA
GCGCTACCTCCTGGAGGCCGCAGAGGAGCTGGGCCTGACCGATGGCTCCCTGGTCTTCCT
GCCCTTCGACACGATCCACTACGCCTTGTCCCCAGGCCCGGAGGCCTTGGCCGCACTCGC
CAACAGCTCCCAGCTTCGCAGGGCCCACGATGCCGTGCTCACCCTCACGCGCCACTGTCC
CTCTGAAGGCAGCGTGCTGGACAGCCTGCGCAGGGCTCAAGAGCGCCGCGAGCTGCCCTC
TGACCTCAATCTGCAGCAGGTCTCCCCACTCTTTGGCACCATCTATGACGCGGTCTTCTT
GCTGGCAAGGGGCGTGGCAGAAGCGCGGGCTGCCGCAGGTGGCAGATGGGTGTCCGGAGC
AGCTGTGGCCCGCCACATCCGGGATGCGCAGGTCCCTGGCTTCTGCGGGGACCTAGGAGG
AGACGAGGAGCCCCCATTCGTGCTGCTAGACACGGACGCGGCGGGAGACCGGCTTTTTGC
CACATACATGCTGGATCCTGCCCGGGGCTCCTTCCTCTCCGCCGGTACCCGGATGCACTT
CCCGCGTGGGGGATCAGCACCCGGACCTGACCCCTCGTGCTGGTTCGATCCAAACAACAT
CTGCGGTGGAGGACTGGAGCCGGGCCTCGTCTTTCTTGGCTTCCTCCTGGTGGTTGGGAT
GGGGCTGGCTGGGGCCTTCCTGGCCCATTATGTGAGGCACCGGCTACTTCACATGCAAAT
GGTCTCCGGCCCCAACAAGATCATCCTGACCGTGGACGACATCACCTTTCTCCACCCACA
TGGGGGCACCTCTCGAAAGGTGGCCCAGGGGAGTCGATCAAGTCTGGGTGCCCGCAGCAT
GTCAGACATTCGCAGCGGCCCCAGCCAACACTTGGACAGCCCCAACATTGGTGTCTATGA
GGGAGACAGGGTTTGGCTGAAGAAATTCCCAGGGGATCAGCACATAGCTATCCGCCCAGC
AACCAAGACGGCCTTCTCCAAGCTCCAGGAGCTCCGGCATGAGAACGTGGCCCTCTACCT
GGGGCTTTTCCTGGCTCGGGGAGCAGAAGGCCCTGCGGCCCTCTGGGAGGGCAACCTGGC
TGTGGTCTCAGAGCACTGCACGCGGGGCTCTCTTCAGGACCTCCTCGCTCAGAGAGAAAT
AAAGCTGGACTGGATGTTCAAGTCCTCCCTCCTGCTGGACCTTATCAAGGGAATAAGGTA
TCTGCACCATCGAGGCGTGGCTCATGGGCGGCTGAAGTCACGGAACTGCATAGTGGATGG
CAGATTCGTACTCAAGATCACTGACCACGGCCACGGGAGACTGCTGGAAGCACAGAAGGT
GCTACCGGAGCCTCCCAGAGCGGAGGACCAGCTGTGGACAGCCCCGGAGCTGCTTAGGGA
CCCAGCCCTGGAGCGCCGGGGAACGCTGGCCGGCGACGTCTTTAGCTTGGCCATCATCAT
GCAAGAAGTAGTGTGCCGCAGTGCCCCTTATGCCATGCTGGAGCTCACTCCCGAGGAAGT
GGTGCAGAGGGTGCGGAGCCCCCCTCCACTGTGTCGGCCCTTGGTGTCCATGGACCAGGC
ACCTGTCGAGTGTATCCTCCTGATGAAGCAGTGCTGGGCAGAGCAGCCGGAACTTCGGCC
CTCCATGGACCACACCTTCGACCTGTTCAAGAACATCAACAAGGGCCGGAAGACGAACAT
CATTGACTCGATGCTTCGGATGCTGGAGCAGTACTCTAGTAACCTGGAGGATCTGATCCG
GGAGCGCACGGAGGAGCTGGAGCTGGAAAAGCAGAAGACAGACCGGCTGCTTACACAGAT
GCTGCCTCCGTCTGTGGCTGAGGCCTTGAAGACGGGGACACCAGTGGAGCCCGAGTACTT
TGAGCAAGTGACACTGTACTTTAGTGACATTGTGGGCTTCACCACCATCTCTGCCATGAG
TGAGCCCATTGAGGTTGTGGACCTGCTCAACGATCTCTACACACTCTTTGATGCCATCAT
TGGTTCCCACGATGTCTACAAGGTGGAGACAATAGGGGACGCCTATATGGTGGCCTCGGG
GCTGCCCCAGCGGAATGGGCAGCGACACGCGGCAGAGATCGCCAACATGTCACTGGACAT
CCTCAGTGCCGTGGGCACTTTCCGCATGCGCCATATGCCTGAGGTTCCCGTGCGCATCCG
CATAGGCCTGCACTCGGGTCCATGCGTGGCAGGCGTGGTGGGCCTCACCATGCCGCGGTA
CTGCCTGTTTGGGGACACGGTCAACACCGCCTCGCGCATGGAGTCCACCGGGCTGCCTTA
CCGCATCCACGTGAACTTGAGCACTGTGGGGATTCTCCGTGCTCTGGACTCGGGCTACCA
GGTGGAGCTGCGAGGCCGCACGGAGCTGAAGGGCAAGGGCGCCGAGGACACTTTCTGGCT
AGTGGGCAGACGCGGCTTCAACAAGCCCATCCCCAAACCGCCTGACCTGCAACCGGGGTC
CAGCAACCACGGCATCAGCCTGCAGGAGATCCCACCCGAGCGGCGACGGAAGCTGGAGAA
GGCGCGGCCGGGCCAGTTCTCTTGAGAAGTGAGGCCCGGCCCCGGACAGGGTCTGGGCCC
TGCTCCCTGTCCCATCTGCAGTGGACCCCAGGCACCCCCCTTTGAGGAGGTGGGGTGAAC
TGCTCCTTGGCAGGGATTTGTGACACTGCATTGCTGGGCTGTGTTCCTCGGGCTCTTCTG
GACCTTGCACCGTGGATACCAGGCCATGTGCCATGGTATTTGGGTCCTGGGAGGGTGGGT
GAAATAAAGGCATACTGTCTT
AL050227
CTTTCACAGAAAGAAAGTAACAGGCATAATTCCTGTTGATGAGGCTGGGATTGTTTTTAA
GAGGAGAGATAATAACTTCATATTTTTAAAGTGCCAGTAGCCTAATATGTGAAACAGATC
AGAATCTGTTGTGTAGTAAGTCTGCTTTGTTGAAGAATTTATTATGGGAGTAAAGATAAG
AAGGAAAGAGATCACCATCAGAAACAAGTCAGCCTTTTCATGCTTTTTTGAGCATTTTTG
GAGATGATTCCACTTCTCAAGTTATTATCATTTGTGCATCTCTTCAATGCTATTGTTAAA
TGCTTTAGAATTAGAATATTTTGATCCTTTAATTAAAGTAAGCCAAACGTCTAGGCAAAA
ACAGCCAATCATTAAACTTTAATAGTAATTCAAATATAGATTTCTCATACAGTTTTCCAT
GTCTGTAGAAATCAAAGTTGTAATGTTAAGCAGAGGGAAATGCGTGTGATTTACTAATAC
ACTTCAACGTTCTACTTTTGAAAGGATACTCATGTGGGTGGGGCAGAGAACATAGAAAAA
GATATGATGGAAAACCTGTCCATTTTCTACCTGTTAACCTTCATCATTTTGTGCAGGCCC
TGGAAGCAAAGAGAGGAAGGGACCGACTGCATTTATCTTTGAACACTTGAGCATCAGTAG
TACTACTGAGTGGCCAGGGGTCTTGTCTGTCAAAGCAAATGATAAGTTCACTCAGGCCAT
TATTGACTGCTGAACTCTCTTCCTTCCCAACTCTTCCTTGAAAGAGAAAAAAATACTTTG
CCTTCTTGCTCTCCTTATCAAATGTTTTTGTACAAATAGTGTAAGCCTGTTTAAGCAAAC
CAATTAAAATAGGCACTGATTATTTTGATCTGTTTGTAACAAATGAATGTAAGTACTATT
TACATGGTGTGCCTAGGAGGAGCTGAAATCATTGGCACTTTAATCCATATTGTAAAGATC
AGTATCAAAAGCATAGTGTTCTTCACCTCTCCTCCTCAGCATCCATCTCTATATACTTGA
TTAAATGGAAAAGTCTCTTTTATCACCTCTATGTAAAGTTTTATGGGTAGTTATCGTCAG
TGTATTTAAATATATCTTCTAGTATGTTTTAAAGGCTGGTCTTCAATACTGTGGAGACAA
AAAATAAAAGAGCGTATGAAAAGTACGTTAGACTTTTGCTGGCATTCAAGTCATGGCTAG
TCTGTGTATTTAATAAATGTGTGTTATTTATGTCGTGTTTGTCAATGGAAAATAAAGTTG
AATATTCTGAAAAAAAAAAAAAAA
AW613732(IMAGE克隆ID:2953502)
CCTANAAGTNCCATTTTGGCAAGGATAAACTCCCATGACAANCTCCCANTACTGCATGTG
AATGAATAAGAAACAAGAANTGACCACACCAAAGCCTCCCTGGCTGGTGTTACANGGGAT
CAGGTCCACAGTGGTGCAGATTCAACCACCACCCAGGGAGTGCTTGCAGACTCTGCATAG
ATGTTGCTGCATGCGTCCCATGTGCCTGTCAGAATGGCAGTGTTTAATTCTCTTGAAAGA
AAGTTATTTGCTCACTATCCCCAGCCTCAAGGAGCCAAGGAAGAGTCATTCACATGGAAG
GTCCGGGACTGGTCAGCCACTCTGACTTTTCTACCACATTAAATTCTCCATTACATCTCA
CTATTGGTAATGGCTTAAGTGTAAAGAGCCATGATGTGTATATTAAGCTATGTGCCACAT
ATTTATTTTTAGACTCTCCACAGCATTCATGTCAATATGGGATTAATGCCTAAACTTTGT
AAATATTGTACAGTTTGTAAATCAATGAATAAAGGTTTTGAGTGTAAAAAAAAAAAAAAA
AAAAAAA
BC007783(IMAGE克隆ID:4308472)
GGCACGAGGGCAAAGAGTAGTCAGTCCCTTCTTGGCTCTGCTGACACTCGAGCCCACATT
CCATCACCTGCTCCCAATCATGCAGGTCTCCACTGCTGCCCTTGCCGTCCTCCTCTGCAC
CATGGCTCTCTGCAACCAGGTCCTCTCTGCACCACTTGCTGCTGACACGCCGACCGCCTG
CTGCTTCAGCTACACCTCCCGGCAGATTCCACAGAATTTCATAGCTGACTACTTTGAGAC
GAGCAGCCAGTGCTCCAAGCCCAGTGTCATCTTCCTAACCAAGAGAGGCCGGCAGGTCTG
TGCTGACCCCAGTGAGGAGTGGGTCCAGAAATACGTCAGTGACCTGGAGCCGAGTGCCTG
AGGGGTCCAGAAGCTTCGAGGCCCAGCGACCTCAGTGGGCCCAGTGGGGAGGAGCAGGAG
CCTGAGCCTTGGGAACATGCGTGTGACCTCCACAGCTACCTCTTCTATGGACTGGTTATT
GCCAAACAGCCACACTGTGGGACTCTTCTTAACTTAAATTTTAATTTATTTATACTATTT
AGTTTTTATAATTTATTTTTGATTTCACAGTGTGTTTGTGATTGTTTGCTCTGAGAGTTC
CCCCTGTCCCCTCCACCTTCCCTCACAGTGTGTCTGGTGACAACCGAGTGGCTGTCATCG
GCCTGTGTAGGCAGTCATGGCACCAAAGCCACCAGACTGACAAATGTGTATCAGATGCTT
TTGTTCAGGGCTGTGATCGGCCTGGGGAAATAATAAAGATGTTCTTTTAAACGGTAAAAA
AAAA
X81896
AGAAAACTATTTTCTAAATATTAACACTGAAAATGTTTTGTTAGCTTTTCCTTCTTTCTC
TCCAGAAGAAACATGGATAGATGATAGCTGTTTCATTGTTTGTTTTTGTCAAGCATATTC
ACTTTCCTCCTTGTCCTCTGATTCTGAGCAAAGGGCCTCAGACTCTGAACTTCCCTCAAG
TGCCGTTGTTATGTGAACTCTTCCATTCAGATTCCAGAGAGGTTCTCATGCTCCCCCCCC
CTCCTTATTTGTAGCAATCGTAGCAACTAATTCCACTAAGTACAAGGGAGTTTTTTACAC
TCCTCCATTTTTATAGCATCTGCATTTTTTTTTTTTGTTAGGTACATGTATACACCTGCC
TGAGTATAAATACTCTCTCTACCTAATAATAACATCAACCAACATCTTTTCCAAATTAGG
GCCACAGAACAGCAACATTTGTCTGACAGTAGTATAAAGAATAATGATAGCTCTATCCTT
AAGAAGTATTTCCTTTCCTTTTTATATAGTCCCGTTAGGGTTTAAAACCATATTGATCAA
CTAGAAAGAAAAATATGAAAAGAGAAAAATATTTTAATTTAAAAATTGTAATACATTGAT
TTATAAAATGCCTTCTCTGATACTTTTGAAACAGATGTGAAAAACAGAAAAAGAAAAAAT
TGTCTGAAATGTTTATTTTGCAAAACAGTGCAATAGAATCTAGTTATGCCTTCATCACTG
TTGACAGTAAATACTGACAGCCCCTTGCAGTGTGTTAGTTTTAGATCACTCTGTTTTAGT
TGAGAGAAATGTTTTATATCATGGTTTTTATATGAATACAAATTATTTCTCAAAGATTTA
TAGCACACACTATTCTCAGGAATTCTGTATTACATGAATGCTGCTTATATATTTTCATAT
TCTAACTTGTCTTTTCAAGCAAATAACTAATATATATGTGCATGCAGTCTGCCTTGACAA
GTTGTTCCAAGCTGAAGAGCTTTCACTGTACAATGTGTGGAAAATCACCATAGATCATGG
CTGAAATAGTTTGTAATTGTCTGAGTCTGTGCACGTACTTTTAGATAAAATGCTGCTGAG
TGACTGCATGATGAGATACAACTTCTGAATGCTGCACATTCTTCCAAAATGATCCTTAGC
ACAATCTATTGTATGATGGAATGAATAGAAAACTTTTTCACTCAATAAATTATTATTTGA
TATGGTAAAAAAAAAA
BC004960(IMAGE克隆ID:3632495)
CCCAAGGTTGTTATATCTTCATGTCCTCATTTCTTAGGGAGGTACCTTCAGAACCAATAG
TGACCCCTAACTTCTCTGGTGGTCGGTTCCATGAAAGGCAAAGGAGTGTGAGAGAGGAGT
GGATGGTCAACCTCCCACTGCCATGGTAACATGGGTGCTGGCTGATGGGAGCAGAAAATA
ATTTAGTGAAAGTCTGTGGGGGCAGTCACAAGATGTCTGAGAAAACTGGCGAGCCAGCTG
CTGAAAACAGGGACAAGGAAGCCTCCGTGGCTGGAGCCCAAATCACACTGCAGACCCAGA
CACCGTGACCACCACCATGGACTCCAGAGAGAGCAGCTTATAGTACTCAATCAGCTGCCA
CTACCACCATCCAGAACACCAGATGTTGTAGCCATGGCTGCAGCAGGAATGGATGTCCCA
CTGTCCCTGCTCCTCGGTGTGACTTGCTCCCAAGTTCAGGGCAGGTCCATCTGATTGGCT
GAGTCTGGAATGTCTGCCTGTGCCTCAGCTGTGAGGGAGGCAGGGAAAGTAAGCCTTTTC
AGCTTCTGTCGTGGGAGGTGGGCTCTGCCTCCTACCAAGAATCAAAGGGTGGAGGATCTT
CAAACACAGGAAAAGAACCCGGATCCTGGCACCCCCAAATTTTCAGAGTCCATTTCAGAG
CATAAGAAATTGAGGGTCCAAGATCATTCATGTAAGAAGTTTAGAGGGGGAAGAAAAGAA
TGATAAACGAAAAGAACAGCAATAGTAAAGGATCTTTTCTTTGTTTCAGTAAGATGAAGA
GGCCTGAGCAGTTTCGTGGAGGGGAAGAAACAGGAAAACCTCTTCAAAAGACAAAAAGCT
GGCACTGCATTCTCTCTCTGTAGCAGGACAGAACTGTCTAAAGACAAGACCCCTTTGGCC
AAAATAAAGGAACCTGAAACATTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAACCTCGGG
AK027250
AAATTTAATTAATTATAAACTCAGTCTCTTGGTTGCACCAGCCACATTTCAGATGCTCAA
TAGCCACATGTGGCTAGTGGGTACCATATTGGACAGGGCAGCTATAGAATATTTCCATCA
TTGCAGAAAGTTCTATTGGATAGTACCATAATCTTTTTATAGTAACTTGGAAATACTATT
TGATATTAGATGTTAGACCACAAAAAGAAGAAAAATGTTAGGACTATTTCAGATATAAAA
AGGAACTGAATTGTGACATAATTAGCATCTTACATTCCATACAGTTGAATACCTTATGCT
GTGACAACCATAGTTAATCATTTCAGTGCTGTTCAACATACATACCTATCAGCAGTGTGT
TTAGACCAGGGGTCTGCAAACTTTCTGTGAATGGACAAAGAGTAAATACTTTAGTAAATG
TCTTAGGCTTTGTGGCCTACATGATCTTTGTTGCAAGTACTCAACTCTGCCATTATAGAG
TTAAAGCAGCCATACACAATATATAAACAAAATGGGCATAGTTGTATTTCAGTAAAACTT
TATTTACAAAGACAGGCGGTAGGCCAGATTTGGCTTGCATGCTGTAGAGCTGTGGTCTAA
ATTTTATTCATAGACTTTCTTTGCAAATACAGTGTGAGTATTGTTCCATTTACAGTATTA
TTATTTTTTAGATACCTGGTTTTTAGATTCTTGCCTGGTAACTTTTTACTGAAAATACAA
GAATTTCGTACTGCATTTGCATCTCCGAGATTAGGGAGCACCTGTCAGGATATGTTGTTC
TATCAGGGTTACTTCTGTTGACTACCTCTTAGATTTTGATACAGTTATATTGTTGAGTTT
CATTTTCATATATTCTTGTAGTGTCTGCTTGCCTGTGACTTCTGGTAAAATAAAATAAGC
CTTTGAAAATATTTTAGCATGGTATTTAACATTTTCTAAATATTATGGCATTTTGACATA
TTTTAGTCAGCGAAGACATCTGCCCCTTTGGTGTTTCTACTTGCTTATGATTGAGATTTT
ACAAGCCCTTCAAACTCCGTTTTAAAGGAATTTATTGTAAAACATTAACTTTAATAAATT
AGTGTTTTCACAGATCAGATCATTATACTTGGAACTTCTAAATCATGCAATTTCTGAATA
AGGACATAAGGCTAGATTCATTTTTCTTAATAGAGAAAAAGGAAATTTCTGATTTATCAC
TTTTCTAGTTGATAAGTAGGATTCAAAACGTTTGATATGTAAGTATTTATATAAGACTAA
TGTAATTTAAAGTTCTGTATTATTGTGATTAATCATACAGAAATTCAGGAACTGATCAGA
AGTGAGATTCTTTTCCACATCTGGTTAATGTAGTGAGTTGACACCCTGTGGGTGGTAAAG
CATTATAAACATTTCATCTTGAACCATGATTTATACACATCTGTGTTATAAGGGAGGCTT
GAGTACATATACCAATGAAGAGATATTCAGCATTTGTCTATTTGATAAGGAATTAAATGT
CCTAGTGATTATAAAGTAAAACCACAGACCAATTTGCAAATGATCTTCAATGTTAAGCAC
TTGCTCTAAGATTAAAATTCCTTTTCTTTTTAAGGTTAAGGGTGTGTACGTATGGCAGTG
ATGTCTATGTTGAGATTAACTTATGTATTGAGGAAAATTTGAAGTTTATTTTTTCGATGA
ATAAGGCTGTCAAATGATTTAGTATAGATTAATGACATCTTTTTTAGAAATATTAAAGTG
AGTATTCCTCATTATGTCATCATTTCTGATAATTAGAGTGCTAATTTGAATGTTAGATAA
TGTTTCCACATCTATACCTATTTCTTTCTAGGGCACTTCTGACCCTGGGGCTTGGGGATG
GCCTTTAGGCCACAGTAGTGTCTGTGTTAAGTTCACTAAATGTGTATTTAATGAGAAACA
TTCCTATGTAAAAATGTGTGTATGTGAACGTATGCATACATTTTTATTGTGCACCTGTAC
ATTGTGAAGAAGTAGTTTGGAAATTTGTAAAGCACAAACCATAAAAGAGTGTGGAGTTAT
TAAATGATGTAGCACAAATGTAATGTTTAGCTTATAAAAGGTCCTTTCTATTTTCTATGG
CAAAGACTTTGACACTTGAAAAATAAAACCAATATTTGATTTATTTTTGTAAGTATTTAG
GATATTATTTTAAATAAATGATTGTCCATTATCAATAAAAAAAAAAAAAAAAAA
上述未描述的表5中的序列
NM_014298
GTCCTGAGCAGCCAACACACCAGCCCAGACAGCTGCAAGTCACCATGGACGCTGAAGGCC
TGGCGCTGCTGCTGCCGCCCGTCACCCTGGCAGCCCTGGTGGACAGCTGGCTCCGAGAGG
ACTGCCCAGGGCTCAACTACGCAGCCTTGGTCAGCGGGGCAGGCCCCTCGCAGGCGGCGC
TGTGGGCCAAATCCCCTGGGGTACTGGCAGGGCAGCCTTTCTTCGATGCCATATTTACCC
AACTCAACTGCCAAGTCTCCTGGTTCCTCCCCGAGGGATCGAAGCTGGTGCCGGTGGCCA
GAGTGGCCGAGGTCCGGGGCCCTGCCCACTGCCTGCTGCTGGGGGAACGGGTGGCCCTCA
ACACGCTGGCCCGCTGCAGTGGCATTGCCAGTGCTGCCGCCGCTGCAGTGGAGGCCGCCA
GGGGGGCCGGCTGGACTGGGCACGTGGCAGGCACGAGGAAGACCACGCCAGGCTTCCGGC
TGGTGGAGAAGTATGGGCTCCTGGTGGGCGGGGCCGCCTCGCACCGCTACGACCTGGGAG
GGCTGGTGATGTTGAAGGATAACCATGTGGTGCCCCCCGGTGGCGTGGAGAAGGCGGTGC
GGGCGGCCAGACAGGCGGCTGACTTCGCTCTGAAGGTGGAAGTGGAATGCAGCAGCCTGC
AGGAGGTCGTCCAGGCAGCTGAGGCTGGCGCCGACCTTGTCCTGCTGGACAACTTCAAGC
CAGAGGAGCTGCACCCCACGGCCACCGCGCTGAAGGCCCAGTTCCCGAGTGTGGCTGTGG
AAGCCAGTGGGGGCATCACCCTGGACAACCTCCCCCAGTTCTGCGGGCCGCACATAGACG
TCATCTCCATGGGGATGCTGACCCAGGCGGTCCCAGCCCTTGATTTCTCCCTCAAGCTGT
TTGCCAAAGAGGTGGCTCCAGTGCCCAAAATCCACTAGTCCTAAACCGGAAGAGGATGAC
ACCGGCCATGGGTTAACGTGGCTCCTCAGGACCCTCTGGGTCACACATCTTTAGGGTCAG
TGAACAATGGGGCACATTTGGCACTAGCTTGAGCCCAACTCTGGCTCTGCCACCTGCTGC
TCCTGTGACCTGTCAGGGCTGACTTCACCTCTGCTCATCTCAGTTTCCTAATCTGTAAAA
TGGGTCTAATAAAGGATCAACCAAAAAAAAAAAAAAAAAAAA
AF033199
CGGGGCATGCTGCTTCCCTTCACCTTCCACCATGATTGTAAGTTTCCTGAGGCCTCCCCA
GGTGTGCTTCTGTACAGCCTGTGGAATGTTACCAAAGACGTTGGAAGAGGTGGCTATGGG
ACATCACCTGGGAGAAGTGGAAGCAAATGGACACTGTTCAGAAGTCCATATACAGAAACA
TACTTGGAAAAATATAGAAACCTGGTTTTGCTAGATGGGAAGCTTGCAGCTGGGGCCAAG
ACATCAAGAGTAGAGCAGCAGGACATTTCAAAAGAAGATTAACTCAAAGATTAGAGATGG
AAGAACTTGCAAAGAGAAAGTCTGTACCGGAAGAAATCTGGAAATCTAGAGGCCAGTTTA
AGAATCAGCAGCTAAACAAGGAGAATAATCTAGGGCAAGAGATAGCTACCTGCACAAAAA
TTCCTACCAGAAAAAGAGACATAGAATCTAATGAATTTGTGAAAAATTTTACTGTAAGAT
CAATACTTGTTGCAGAACAGATAGATCCTATGGAAGAGAATTGTCATAAATATGGTACAT
GTTGAAAGATGCTCAAACAAAACTCAGATTTAATTATACAAAGAAAGTATGATGGAAAAA
AAAAAACCTTGTAAATATAGTGAATGTGGGAGAACCTTCAGAGGCCACATCACTCTTGTT
CAGCATCAAATAACTCATTGTGGAGAGAGACCCTGTAAATGTACTGAGTGTAGAAAGGGA
TTTAATCAGAGTTCCCACTTAAGAAATAATCAGAGAAAAACTCTTTCAGGAGAAAAGCCC
TACAAATGCAGTGAGTGTGGGAAGGCCTTCAGTTATTGCTTAGTTCTTAATCAACACCAG
AGAATTCACAGTGGAGAGAAACCTTATGAGGGTACTGAATGTGGCAAGACATTCATTCAG
TCGTACATACCTTACTCAGCATCAAAGAATTCACACACTGGTGAGAAGCCCTATACATGT
CTTGAATGTGGAAGGCTTTTTAGTCAGAACACACATCTTACTCTACATCAGAGAATCCAT
ACTGGAGAGAAACCTTATGAATGCAATGAATGTGGTAGGTCCTTTAGTCAGACTGCACAT
CTTACTCAACATCAAAGAATGTATACAGGAGAAAAACTCTATGAATGTAATGAATGTGAG
AAAGCCTTCCATGATCACTCAGCTCTTATTCAACATCATATTGTCCATACTGCAGAGAAA
CCCTATGATATCATGACTGGGAAAACTTTCAGTTACTGTTCAGACCTCATTCAACATCAG
AGAATGCACACTGGAGAGAAACCATACAAATGCAATGAATGTGGGAATGCCTTTAGTGAT
TGTTCATCCCTTATTCAGCATCAAAGAACTCACACTGGAGAAGAGCCTTATGAATGTAAG
CAATGTGGAAAAGCCTTTAGCAGAAGCACATACCTTACTCAACATCAGAGAAGTCACGCA
GGAGAGAAACAGTATAAATGCAATGAATGTGAGAAAACTTTCAGCCTGAGTTCATTCCTT
ACACAGCATATGAGGGTTCAGACTGGAGAAAAACCCTACAAATATAATGAATATGGAAAA
GCTTTTAGTGACTGCTCAGGACATTTTCAGAGAACTCACACTGGAGAGAAGCCCTGTGAA
TGTAATGACTGTGGGAAACCTTTCAGTTTCTGTTCAGCCCTAATTCAACATAAGAGAATT
CATACCAGAAAGAAGCCCTGACTGTACCTTCATACCAGTAAATGCACTGACTGTGGAAAA
GCCTTCAGTGATTGGTTAGCACTTGTTCAACATCAGATAACTCAACACTGGAGAAAAACC
GTATAAATGTACTGAATGTGGAAAAGCCTTCAGTTGGAGTACAGACCTCAAAAATCACCA
GAAAACTCATACTAGTGAAAAATCCTATAAATGTAATGAATGTAGAAAGGCCTTTAGTTA
CTGCTCTGGTCTTATTCAATGTCAGGTCATTCATACTATAGAAAAACCTTATGAATACGG
TAAATGTGGCAAAGCCTTTAGGCAGAGGACAGACCTTAAAAAACATCAGAAAATGCATAC
CGAAGAGAAACCCTATGAATGTAATGAATGTGGGAAAGCCTTTAGCCAGAGCACATATCT
TACAAAACACCAAAAAATTCATAGTGAAGAGAAATCAAATATACATACTGAGTGTGGGGA
AACCATTAGACAAAACTCTTCTTTTTACAACAATAAAACCTCACACTGGAGAGTTCTCTG
AATGCCTTAAGAATTTGGTTAATATGGAGACCCTTCCCAGGGAAACAGAAGGAGGATCGT
GAAAACCGTTGACTACTTGAATGATCACATGGTTTAGTGGAGAGAGCATGATTCTGGGTT
TTAAAAGTCATGGATCTCAATCTCAGCTCCTATTACTAACTAGATCTTTTACTTTGGGGT
AAGTCACTTCATATCTTTAGGCCTTAATTTCCTCATCTGAAAACTGGAAGGCCTGACTTG
ACTTGTTGAGCTTAAGATCCTCAATTATTATATTTACTAGGAATTCAAGTTTCTATAGAT
GTGGTTCAGAATTGTGACTTATTTATTGTACATCAGGTGTGATTCACAAGTGAGCTTGTA
GTAGTTATTAAGGAGTCAATAAAGATATGATATAAAAAAAAAAAAAAAAA
AI688494(IMAGE克隆ID:2330499)
CATTTCATCTTCATTGGATAGTGTTACATAGTAATATATTTATGTTTTCTTTTAATCATT
TCATAACTTGGAAAATACTAACATAGTCAAAACTCTAGGGTAGGTGATACATGAGTTTCT
GTAGTAATCTGGTTGGAGACATGTTGTAATTCTGTATATATATGTACATTTATCCCATGC
ATGTTATGCCTAAACTAAGACGGATACCCCTGAATTAAGAGGTGCTGTTATACATTGACC
AGGCTTAAGAATATCTCTTTAAAGTGTGTCGACATTTAATTGACCTTTGGAAGTTCATTC
TGTTAATCATACTCAAAGTGCTAAAGCTATGGTTGACTGCTCTGGTGTTTTTATATTCAT
TCGTGCTTTAGCATATAAATTCTTCAGCATAATTGCTACTTATTTAGCAAGAGTTTCCTT
TATTTGAAAATGTGAGTTGTGCTTGTATTTTTGTGTCTTTCTTTCTTTCTTTCTTTTTTT
AAACTTTGCTTCAGGCTGGGTAGTGGTAGAGGTTTGAATTAAAATGTTTTCCTGTCAGTA
AAAAAAAAAAA
AL157459
GAGCGAGCCCAGCAGCTTGCCCTTGACAGGTGGGGGCTGGCTGGGGCCTTAATGTGAAAA
GACAGTGGCAGGCAGCTGGAGTAGAGCGAGCCCAGCAGCCCTAAAAGGCTGCCTTCATGG
CCATCTAGCCCCAGTTCAGGGCAGCATCCATAGCCCACAAGCCAGCGTGGGTGGGGCGGG
GGTGGTCCCACAGCTGGGTTCCACCTGAAGAGCCTCCGTGCCTCGGAGCAGGAGAGGCAG
GCTATGGCTGTCACCCTCCCTCCTGCCTGTGTCCCAGTGAGAACTGACCTGAGTCCCCTT
CCAAACCCAGACCCACCTCCTGCCCCAGGCCCACTGAAGCATGTTCCATTTCTAAAAAGC
CCAGAGTTCAGTGTGTCCCAAGGAAAACCCAAAGTGGAGGTGCTCAGGTCCAGGGGAGTC
CAGTGGGCAGGACCCTTGGCAGGCAAGCCCCTCCCTTCACTCCCAGGACCTACCTTCTGC
TAGTAAAGGACTGGCTTCATTCTAATTATGGCCCACAGACTGCCCCGGAGACCTGGAGGA
CAGCAGTGCTGGCACTTGGGTGTCCATGGGCCCGTCTGCCGGCTCTGCCTGTGCTGCAAG
TGTTGGCCGTGGGTCCAGCCAACAACTCCCTACGTCCTGTGTGGGGCCCTGCCCAAGTGG
ATGAGGCATTCCTTGAGGAGTATCATTTTCCCTGACAATCCCCATCACCTTTAGGGGTTC
CCTGCTTGGCTCCTTTCCAGCTGAAAAACTAGACCTGTGCCATTGGGGAAGCTGGACAAA
GTCTAGGGGGCCCGCCTGGTAGAGGGTCCCGGGAAGCTGGATCTGTCAGCCTCGGCCCTG
AGGCCCCTGTTAACTCAAGACTGTGAGCTGCCTCTAGGTGGTCACGTCTGGGAGCTAGCT
TGTATGGCTTCTGACCAGTATCAGGATTTCTGTTCTGAGAGCAGCGTGGGCAGCAAGGCA
GGGCAGCCCAGAGGTGGCAGCGGCAGGCAATCTGGTCACTAGGTCTTTGTGATGCCAAAA
ATAAAAGAGGGTGGGGTGGGTGCTTTCTGTTCCTCTGATTGGATGGAGTCCGCCAGCAGG
CATGGGGCTACATTCCAGTGCCTGACTATAGGGAGGCACTCCTGATTCCATGGAGCAGCC
CGGACTTTGAGAATGGGCTCTGGTTTGCGGGGGGCAGGCGTACCAGACTGCAAGACCCCC
CAGTACCTCACCGTGCCAAATAGGAAGAGGTGGCCTTGGTGTAGCCAAATGGATCTTTTT
AACAGTGTGCCTTTGGGGAGGGACCCATGTCCATGGCTTCGTTGAGGGCCATCCATATGC
CAGCTGGGGGCCAGCCCACAGTGGCCATATTGGCTGCAGCAGGAATGGTGCCCACCTCGG
CGAATTGAAGGGCTAAGAGTCCCAGATAGCTAGGCCAGAGCTGGAAGCAGACAGTAAGGG
GAAGAGCTGCTCCCACAGGAGAGGGAGAGATTCCAGCTCACTGCGCAGCCTGGGAGGAGG
CGTGGATCCTGGCACGCTGAGCCTCAGGCACCAGCCTCCCTGTGCTCGACAGCAAAGTCT
TGACTCCTTCCTGCTGAGCACTGTGCTACCTTCACTGCTCCAAAGCCAGACTAACAGCTC
TCCAAGCCCTTGGGGTGACTCGGCTTCCAGGAGCTGTTGGAGAAATGAGGATGTCTGTCC
CTGTCTGCCTGGGCAGGCCAGATTCCTCCCCAGCAGCCGGGTCTCTCCAGACCCTGATTC
GGTGCCTTTCTGTTTACCAGCTACTTCAATCCCAAAGTTTGAATCTGCAGATACCTTACT
CCCAGCCACTTTGCCTTCTTACTGTGTTGTGTGTTTTTCCTGGTGCTTCAAGAGCGTGTG
CAGGGCAAGTGCCGTCACTGGGAACTGCACCAGATGCTCAGACTTGGTTGTCTTATGTTT
ACCAATAAATAAAAGTAGACTTTTTCTATTTTTATTTGCTGCTATTTGTGTGTGTGTTTG
TGTTTGTGTAGCTAGGTATCTGGCACTTCTGACGATGCATTGTTGCTTTTTTCCCGAAGG
TCCCGCAGGAACTGTGGCAATGGTGTGTGTGTGAAATGGTGTGTTAACCGCGTTTTGTTT
GCTCCTGTATTGAATAGGAAGCAGTGGCCAGTCTGTCTTCCTTAGAGATGTTAGCATATT
TTTATATGTATATATTTTGTACCAAAAAAGAGTGTTCCTTGTTTTGGTTACACTCGAAAT
TCTGACCTAGCTGGAGAGGGCTCTGGGCCGAGAGCTTTCACTAAGGGGAGACTTCAGGGG
AGGATCAAGCTTTGAACCAAAGCCAATCACTGGCTTGATTTGTGTTTTTTAATTAAAAAA
AAAATCATTCATGTATGCCACTTCTAAAAAAAAAAAAAAAAAAAAAAAAA
BC002480(IMAGE克隆ID:3350037)
GGCACGAGGCTGAGACCGGTGCGCCGCGCGCTAGTGGCCGCTCTTCCGCGGGCTAGCGGG
CGGTGGGGGCGCCAGCAGCGCGGAAGGCGGGCACGCGGGCCATGGCTCCCTGGGCGGAGG
CCGAGCACTCGGCGCTGAACCCGCTGCGCGCGGTGTGGCTCACGCTGACCGCCGCCTTCC
TGCTGACCCTACTGCTGCAGCTCCTGCCGCCCGGCCTGCTCCCGGGCTGCGCGATCTTCC
AGGACCTGATCCGCTATGGGAAAACCAAGTGTGGGGAGCCGTCGCGCCCCGCCGCCTGCC
GAGCCTTTGATGTCCCCAAGAGATATTTTTCCCACTTTTATATCATCTCAGTGCTGTGGA
ATGGCTTCCTGCTTTGGTGCCTTACTCAATCTCTGTTCCTGGGAGCACCTTTTCCAAGCT
GGCTTCATGGTTTGCTCAGAATTCTCGGGGCGGCACAGTTCCAGGGAGGGGAGCTGGCAC
TGTCTGCATTCTTAGTGCTAGTATTTCTGTGGCTGCACAGCTTACGAAGACTCTTCGAGT
GCCTCTACGTCAGTGTCTTCTCCAATGTCATGATTCACGTCGTGCAGTACTGTTTTGGAC
TTGTCTATTATGTCCTTGTTGGCCTAACTGTGCTGAGCCAAGTGCCAATGGATGGCAGGA
ATGCCTACATAACAGGGAAAAATCTATTGATGCAAGCACGGTGGTTCCATATTCTTGGGA
TGATGATGTTCATCTGGTCATCTGCCCATCAGTATAAGTGCCATGTTATTCTCGGCAATC
TCAGGAAAAATAAAGCAGGAGTGGTCATTCACTGTAACCACAGGATCCCATTTGGAGACT
GGTTTGAATATGTTTCTTCCCCTAACTACTTAGCAGAGCTGATGATCTACGTTTCCATGG
CCGTCACCTTTGGGTTCCACAACTTAACTTGGTGGCTAGTGGTGACAAATGTCTTCTTTA
ATCAGGCCCTGTCTGCCTTTCTCAGCCACCAATTCTACAAAAGCAAATTTGTCTCTTACC
CGAAGCATAGGAAAGCTTTCCTACCATTTTTGTTTTAAGTTAACCTCAGTCATGAAGAAT
GCAAACCAGGTGATGGTTTCAATGCCTAAGGACAGTGAAGTCTGGAGCCCAAAGTACAGT
TTCAGCAAAGCTGTTTGAAACTCTCCATTCCATTTCTATACCCCACAAGTTTTCACTGAA
TGAGCATGGCAGTGCCACTCAAGAAAATGAATCTCCAAAGTATCTTCAAAGAATAAATAC
TAATGGCAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Claims (50)

1.一种测定如果用他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗时患乳腺癌对象存活结局的方法,所述方法包括检测来自所述对象的乳腺癌细胞样品的一种或多种表2或3所示基因的表达水平。
2.如权利要求1所述的方法,其特征在于,所述表达水平是癌症转移复发可能性的指标。
3.如权利要求1所述的方法,其特征在于,所述抗乳腺癌的抗雌激素药物选自:选择性雌激素受体调节剂(SERM)、选择性雌激素受体下调剂(SERD)或芳香酶抑制剂(AI)。
4.如权利要求1所述的方法,其特征在于,所述乳腺癌细胞样品为ER+
5.如权利要求1所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测所述乳腺癌细胞样品通过mRNA扩增制备的核酸。
6.如权利要求1所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测所述乳腺癌细胞样品通过定量PCR产生的核酸。
7.如权利要求1所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测由所述基因编码的蛋白质或所述蛋白质的蛋白水解片段。
8.如权利要求7所述的方法,其特征在于,所述检测蛋白质或其蛋白水解片段包括检测所述对象血液中的或从所述对象血液富集的乳腺癌上皮细胞中的蛋白质或蛋白水解片段。
9.如权利要求1所述的方法,其特征在于,所述的一种或多种基因选自:IL17BR、CHDH、QPRT和HOXB13。
10.一种测定如果用他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗时患乳腺癌对象的预后,或患乳腺癌并用他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗时对象的预后的方法,所述方法包括:
检测所述对象的乳腺癌细胞样品的一种或多种表2或3所示基因的表达水平。
11.如权利要求10所述的方法,其特征在于,所述表达水平是癌症转移复发可能性的指标。
12.如权利要求10所述的方法,其特征在于,所述抗乳腺癌的抗雌激素药物选自:选择性雌激素受体调节剂(SERM)、选择性雌激素受体下调剂(SERD)或芳香酶抑制剂(AI)。
13.如权利要求10所述的方法,其特征在于,所述乳腺癌细胞样品为ER+
14.如权利要求10所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测所述乳腺癌细胞样品通过mRNA扩增制备的核酸。
15.如权利要求10所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测所述乳腺癌细胞样品通过定量PCR产生的核酸。
16.如权利要求10所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测由所述基因编码的蛋白质或所述蛋白质的蛋白水解片段。
17.如权利要求16所述的方法,其特征在于,所述检测蛋白质或其蛋白水解片段包括检测所述对象血液中的或从所述对象血液富集的乳腺癌上皮细胞中的蛋白质或蛋白水解片段。
18.如权利要求10所述的方法,其特征在于,所述样品是通过最小侵入性技术获得,或选自核心组织活检、切除活检、导管灌洗样品、细针抽吸样品或所述样品显微解剖分离的细胞。
19.如权利要求10所述的方法,其特征在于,所述的一种或多种基因选自:IL17BR、CHDH、QPRT和HOXB13。
20.一种根据所述患者对他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗的预期反应或无反应来确定乳腺癌患者的治疗的方法,所述方法包括:
通过检测所述患者的乳腺癌细胞样品的一种或多种表2或3所示基因的表达水平,来确定所述患者对他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗有预期反应或无反应;和
选择能使患者具有这种存活结局的适当治疗。
21.如权利要求20所述的方法,其特征在于,所述表达水平是癌症转移复发可能性的指标。
22.如权利要求20所述的方法,其特征在于,所述抗乳腺癌的抗雌激素药物选自:选择性雌激素受体调节剂(SERM)、选择性雌激素受体下调剂(SERD)或芳香酶抑制剂(AI)。
23.如权利要求20所述的方法,其特征在于,所述乳腺癌细胞样品为ER+
24.如权利要求20所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测所述乳腺癌细胞样品通过mRNA扩增制备的核酸。
25.如权利要求20所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测所述乳腺癌细胞样品通过定量PCR产生的核酸。
26.如权利要求20所述的方法,其特征在于,所述检测一种或多种基因的表达水平包括检测由所述基因编码的蛋白质或所述蛋白质的蛋白水解片段。
27.如权利要求26所述的方法,其特征在于,所述检测蛋白质或其蛋白水解片段包括检测所述对象血液中的或从所述对象血液富集的乳腺癌上皮细胞中的蛋白质或蛋白水解片段。
28.如权利要求20所述的方法,其特征在于,所述样品是通过最小侵入性技术获得,或选自核心组织活检、切除活检、导管灌洗样品、细针抽吸样品或所述样品显微解剖分离的细胞。
29.如权利要求20所述的方法,其特征在于,所述的一种或多种基因选自:IL17BR、CHDH、QPRT和HOXB13。
30.一种测定如果用他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗时患乳腺癌的人存活结局的方法,所述方法包括检测所述患者的乳腺癌细胞样品中一种或多种人HOXB13、IL17BR、QPRT或CHDH序列或与乳腺癌细胞中这些基因的表达相关的另一序列的表达,
其中,HOXB13和/或QPRT序列低表达是对他莫昔芬或其它抗乳腺癌的抗雌激素药物治疗有反应的指标,而IL17BR和/或CHDH序列过度表达是无反应的指标。
31.如权利要求30所述的方法,其特征在于,所述抗乳腺癌的抗雌激素药物选自:选择性雌激素受体调节剂(SERM)、选择性雌激素受体下调剂(SERD)或芳香酶抑制剂(AI)。
32.如权利要求30所述的方法,其特征在于,所述乳腺癌细胞样品为ER+,或是通过最小侵入性技术获得,或选自核心组织活检、切除活检、导管灌洗样品、细针抽吸样品或所述样品显微解剖分离的细胞。
33.如权利要求30所述的方法,其特征在于,所述表达检测包括检测所述乳腺癌细胞样品通过mRNA扩增制备的核酸,或检测所述乳腺癌细胞样品通过定量PCR产生的核酸。
34.如权利要求30所述的方法,其特征在于,所述表达检测包括检测由所述基因编码的蛋白质或所述蛋白质的蛋白水解片段。
35.如权利要求34所述的方法,其特征在于,所述检测蛋白质或其蛋白水解片段包括检测所述对象血液中的或从所述对象血液富集的乳腺癌上皮细胞中的蛋白质或蛋白水解片段。
36.如权利要求30所述的方法,其特征在于,所述检测是通过与含有人HOXB13、IL17BR、QPRT或CHDH序列的3’非翻译区、编码区或5’非翻译区的至少15个核苷酸序列的多核苷酸杂交。
37.如权利要求30所述的方法,其特征在于,所述检测是检测无HOXB13序列低表达或无IL17BR或CHDH序列的过度表达。
38.如权利要求30所述的方法,其特征在于,所述检测包括测定HOXB13或QPRT序列表达水平与IL17BR或CHDH序列表达水平的比率。
39.如权利要求39所述的方法,其特征在于,所述检测包括测定HOXB13或QPRT序列表达水平与IL17BR或CHDH序列表达水平的比率,作为对他莫昔芬或其它抗乳腺癌的抗雌激素药物无反应的指标。
40.如权利要求32所述的方法,其特征在于,所述表达检测包括测定HOXB13、IL17BR、QPRT或CHDH序列的失活或甲基化。
41.如权利要求32所述的方法,其特征在于,所述HOXB13或QPRT表达的检测包括检测HOXB13或QPRT的mRNA降解。
42.一种含有人IL17BR或CACNA1D或HOXB13或QPRT序列的一条或两条链的单链核酸分子群,其中,所述分子群的至少一部分能与从乳腺细胞RNA定量扩增的核酸分子的一条或两条链杂交。
43.如权利要求42所述的分子群,其特征在于,所述分子群被固定在固相支持物如微阵列上。
44.如权利要求42所述的分子群,其特征在于,从乳腺细胞扩增的所述核酸分子是扩增的RNA分子。
45.如权利要求42所述的分子群,其特征在于,所述乳腺细胞为ER+
46.一种包含多核苷酸探针的阵列,所述探针能与表2或3所示的一种或多种基因的核酸分子杂交,其杂交于衍生自一种或多种乳腺癌细胞的核酸。
47.如权利要求46所述的阵列,其特征在于,所述一种或多种乳腺癌细胞为ER+
48.如权利要求46所述的阵列,其特征在于,所述衍生自一种或多种乳腺癌细胞的核酸是通过mRNA扩增制备的。
49.如权利要求46所述的阵列,其特征在于,所述衍生自一种或多种乳腺癌细胞的核酸是cDNA。
50.如权利要求46所述的阵列,其特征在于,所述一种或多种ER+细胞来自对象的组织切片或是从所述切片显微解剖的。
CNA200480033469XA 2003-09-19 2004-09-17 预测乳腺癌治疗结局 Pending CN1969047A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US50408703P 2003-09-19 2003-09-19
US60/504,087 2003-09-19
US10/727,100 2003-12-02
US10/773,761 2004-02-06
US60/547,199 2004-02-23

Publications (1)

Publication Number Publication Date
CN1969047A true CN1969047A (zh) 2007-05-23

Family

ID=38077121

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200480033469XA Pending CN1969047A (zh) 2003-09-19 2004-09-17 预测乳腺癌治疗结局

Country Status (2)

Country Link
US (1) US7504214B2 (zh)
CN (1) CN1969047A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102089442A (zh) * 2008-05-16 2011-06-08 阿特拉斯抗体有限公司 涉及hmgcr蛋白的治疗预测
CN102109525A (zh) * 2011-01-26 2011-06-29 牛刚 一种检测血液中游离乳腺癌细胞标志物的试剂盒
CN109072481A (zh) * 2015-12-07 2018-12-21 安大略省癌症研究所 早期乳腺癌内分泌治疗后剩余风险的基因特征
CN109411015A (zh) * 2018-09-28 2019-03-01 深圳裕策生物科技有限公司 基于循环肿瘤dna的肿瘤突变负荷检测装置及存储介质
CN109468380A (zh) * 2018-10-31 2019-03-15 复旦大学附属肿瘤医院 Il1r2在乳腺癌预后评估与靶向治疗中的应用
CN109642257A (zh) * 2016-06-10 2019-04-16 国立研究开发法人国立癌症研究中心 药物疗法对癌的效果的预测方法
CN110075097A (zh) * 2012-06-01 2019-08-02 拜耳股份公司 基于基因型或表型的药物制剂
CN114480652A (zh) * 2022-02-21 2022-05-13 深圳市陆为生物技术有限公司 评价乳腺癌患者对于辅助内分泌治疗的响应性的产品

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004512540A (ja) * 2000-11-01 2004-04-22 マウント・サイナイ・ホスピタル 卵巣癌の検出
US20030198972A1 (en) 2001-12-21 2003-10-23 Erlander Mark G. Grading of breast cancer
JP2006519620A (ja) * 2003-03-04 2006-08-31 アークチュラス バイオサイエンス,インコーポレイティド 乳がんにおけるer状態の弁別特性
US20060078893A1 (en) 2004-10-12 2006-04-13 Medical Research Council Compartmentalised combinatorial chemistry by microfluidic control
GB0307428D0 (en) 2003-03-31 2003-05-07 Medical Res Council Compartmentalised combinatorial chemistry
GB0307403D0 (en) 2003-03-31 2003-05-07 Medical Res Council Selection by compartmentalised screening
EP1651775A2 (en) * 2003-06-18 2006-05-03 Arcturus Bioscience, Inc. Breast cancer survival and recurrence
CA2539107A1 (en) * 2003-09-19 2005-03-31 Arcturus Bioscience, Inc. Predicting breast cancer treatment outcome
US9856533B2 (en) 2003-09-19 2018-01-02 Biotheranostics, Inc. Predicting breast cancer treatment outcome
US20050221339A1 (en) 2004-03-31 2005-10-06 Medical Research Council Harvard University Compartmentalised screening by microfluidic control
JP2008501346A (ja) * 2004-06-04 2008-01-24 アビアラデックス,インコーポレイティド がんに関する遺伝子hoxb13の重要性
US7968287B2 (en) 2004-10-08 2011-06-28 Medical Research Council Harvard University In vitro evolution in microfluidic systems
EP1672079A1 (en) * 2004-12-20 2006-06-21 Georg-August-Universität Göttingen Stiftung öffentlichen Rechts Method of diagnosing cancer
CA2610752A1 (en) 2005-06-03 2006-12-14 Aviaradx, Inc. Identification of tumors and tissues
JP2009536313A (ja) 2006-01-11 2009-10-08 レインダンス テクノロジーズ, インコーポレイテッド ナノリアクターの形成および制御において使用するマイクロ流体デバイスおよび方法
US20080014589A1 (en) 2006-05-11 2008-01-17 Link Darren R Microfluidic devices and methods of use thereof
US9562837B2 (en) 2006-05-11 2017-02-07 Raindance Technologies, Inc. Systems for handling microfludic droplets
US9012390B2 (en) 2006-08-07 2015-04-21 Raindance Technologies, Inc. Fluorocarbon emulsion stabilizing surfactants
US8772046B2 (en) 2007-02-06 2014-07-08 Brandeis University Manipulation of fluids and reactions in microfluidic systems
US8592221B2 (en) 2007-04-19 2013-11-26 Brandeis University Manipulation of fluids, fluid components and reactions in microfluidic systems
CA2698569A1 (en) 2007-09-06 2009-09-03 Mark G. Erlander Tumor grading and cancer prognosis
WO2009072001A2 (en) * 2007-09-12 2009-06-11 Aurelium Biopharma Inc. Slc9a3r1 directed diagnostics for neoplastic disease
US20090233295A1 (en) * 2008-01-29 2009-09-17 Elias Georges Trim59 directed diagnostics for neoplastic disease
WO2010009365A1 (en) 2008-07-18 2010-01-21 Raindance Technologies, Inc. Droplet libraries
US12038438B2 (en) 2008-07-18 2024-07-16 Bio-Rad Laboratories, Inc. Enzyme quantification
US8528589B2 (en) 2009-03-23 2013-09-10 Raindance Technologies, Inc. Manipulation of microfluidic droplets
WO2011042564A1 (en) 2009-10-09 2011-04-14 Universite De Strasbourg Labelled silica-based nanomaterial with enhanced properties and uses thereof
WO2011072244A1 (en) * 2009-12-10 2011-06-16 Mount Sinai School Of Medicine Of New York University Method of treatment of breast cancer with tamoxifen
US10837883B2 (en) 2009-12-23 2020-11-17 Bio-Rad Laboratories, Inc. Microfluidic systems and methods for reducing the exchange of molecules between droplets
US9366632B2 (en) 2010-02-12 2016-06-14 Raindance Technologies, Inc. Digital analyte analysis
WO2011100604A2 (en) 2010-02-12 2011-08-18 Raindance Technologies, Inc. Digital analyte analysis
US10351905B2 (en) 2010-02-12 2019-07-16 Bio-Rad Laboratories, Inc. Digital analyte analysis
US9399797B2 (en) 2010-02-12 2016-07-26 Raindance Technologies, Inc. Digital analyte analysis
US9562897B2 (en) 2010-09-30 2017-02-07 Raindance Technologies, Inc. Sandwich assays in droplets
WO2012079059A2 (en) 2010-12-09 2012-06-14 Biotheranostics, Inc. Post-treatment breast cancer prognosis
EP2668504A4 (en) 2011-01-28 2015-06-10 Biodesix Inc PREDICTIVE TEST FOR SELECTING PATIENTS WITH METASTATIC BREAST CANCERS TO RECEIVE HORMONE THERAPY AND POLY THERAPY
US9364803B2 (en) 2011-02-11 2016-06-14 Raindance Technologies, Inc. Methods for forming mixed droplets
EP3736281A1 (en) 2011-02-18 2020-11-11 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
US8841071B2 (en) 2011-06-02 2014-09-23 Raindance Technologies, Inc. Sample multiplexing
EP2714970B1 (en) 2011-06-02 2017-04-19 Raindance Technologies, Inc. Enzyme quantification
US8658430B2 (en) 2011-07-20 2014-02-25 Raindance Technologies, Inc. Manipulating droplet size
EP2823303A4 (en) 2012-02-10 2015-09-30 Raindance Technologies Inc MOLECULAR DIAGNOSTIC SCREEN TYPE ASSAY
WO2013165748A1 (en) 2012-04-30 2013-11-07 Raindance Technologies, Inc Digital analyte analysis
WO2013188600A1 (en) 2012-06-12 2013-12-19 Washington University Copy number aberration driven endocrine response gene signature
EP2986762B1 (en) 2013-04-19 2019-11-06 Bio-Rad Laboratories, Inc. Digital analyte analysis
CA2923606A1 (en) 2013-09-11 2015-03-19 bio Theranostics, Inc. Predicting breast cancer recurrence
US11901041B2 (en) 2013-10-04 2024-02-13 Bio-Rad Laboratories, Inc. Digital analysis of nucleic acid modification
US9944977B2 (en) 2013-12-12 2018-04-17 Raindance Technologies, Inc. Distinguishing rare variations in a nucleic acid sequence from a sample
US11193176B2 (en) 2013-12-31 2021-12-07 Bio-Rad Laboratories, Inc. Method for detecting and quantifying latent retroviral RNA species
US10647981B1 (en) 2015-09-08 2020-05-12 Bio-Rad Laboratories, Inc. Nucleic acid library generation methods and compositions
MX2018005867A (es) 2015-11-13 2018-09-21 Biotheranostics Inc Integracion de las caracteristicas tumorales con el indice de cancer de mama.
US10998178B2 (en) 2017-08-28 2021-05-04 Purdue Research Foundation Systems and methods for sample analysis using swabs

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE503023T1 (de) 2001-06-18 2011-04-15 Rosetta Inpharmatics Llc Diagnose und prognose von brustkrebspatientinnen
US7622260B2 (en) * 2001-09-05 2009-11-24 The Brigham And Women's Hospital, Inc. Diagnostic and prognostic tests

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102089442A (zh) * 2008-05-16 2011-06-08 阿特拉斯抗体有限公司 涉及hmgcr蛋白的治疗预测
US8945832B2 (en) 2008-05-16 2015-02-03 Atlas Antibodies Ab Treatment prediction involving HMGCR
CN102089442B (zh) * 2008-05-16 2015-03-11 阿特拉斯抗体有限公司 涉及hmgcr蛋白的治疗预测
CN102109525A (zh) * 2011-01-26 2011-06-29 牛刚 一种检测血液中游离乳腺癌细胞标志物的试剂盒
CN102109525B (zh) * 2011-01-26 2013-10-16 牛刚 一种检测血液中游离乳腺癌细胞标志物的试剂盒
CN110075097A (zh) * 2012-06-01 2019-08-02 拜耳股份公司 基于基因型或表型的药物制剂
CN109072481A (zh) * 2015-12-07 2018-12-21 安大略省癌症研究所 早期乳腺癌内分泌治疗后剩余风险的基因特征
CN109072481B (zh) * 2015-12-07 2022-03-18 安大略省癌症研究所 早期乳腺癌内分泌治疗后剩余风险的基因特征
CN109642257A (zh) * 2016-06-10 2019-04-16 国立研究开发法人国立癌症研究中心 药物疗法对癌的效果的预测方法
CN109642257B (zh) * 2016-06-10 2022-08-12 国立研究开发法人国立癌症研究中心 药物疗法对癌的效果的预测方法
CN109411015A (zh) * 2018-09-28 2019-03-01 深圳裕策生物科技有限公司 基于循环肿瘤dna的肿瘤突变负荷检测装置及存储介质
CN109411015B (zh) * 2018-09-28 2020-12-22 深圳裕策生物科技有限公司 基于循环肿瘤dna的肿瘤突变负荷检测装置及存储介质
CN109468380A (zh) * 2018-10-31 2019-03-15 复旦大学附属肿瘤医院 Il1r2在乳腺癌预后评估与靶向治疗中的应用
CN109468380B (zh) * 2018-10-31 2022-05-17 复旦大学附属肿瘤医院 Il1r2在乳腺癌预后评估与靶向治疗中的应用
CN114480652A (zh) * 2022-02-21 2022-05-13 深圳市陆为生物技术有限公司 评价乳腺癌患者对于辅助内分泌治疗的响应性的产品

Also Published As

Publication number Publication date
US7504214B2 (en) 2009-03-17
US20050239079A1 (en) 2005-10-27

Similar Documents

Publication Publication Date Title
CN1969047A (zh) 预测乳腺癌治疗结局
US20180127834A1 (en) Predicting breast cancer treatment outcome
AU2004274973A1 (en) Predicting breast cancer treatment outcome
Kim et al. BRAF V600E mutation analysis in fine-needle aspiration cytology specimens for evaluation of thyroid nodule: a large series in a BRAF V600E-prevalent population
Agnelli et al. Molecular classification of multiple myeloma: a distinct transcriptional profile characterizes patients expressing CCND1 and negative for 14q32 translocations
Kiyotani et al. A genome-wide association study identifies locus at 10q22 associated with clinical outcomes of adjuvant tamoxifen therapy for breast cancer patients in Japanese
Casulo et al. Unmet needs in the first-line treatment of follicular lymphoma
CN1313891A (zh) 使用基因表达特征监控疾病状态和治疗的方法
CN101057144A (zh) 用于评价乳腺癌预后的方法和组合物
CN101351563A (zh) 用于预测或监测病人对于ErbB受体药物的响应的方法
KR20100095564A (ko) 항-cd40 항체를 사용한 치료에 대한 b-세포 림프종의 반응성 평가를 위한 방법 및 조성물
CN1950701A (zh) 乳腺癌预后
CN101180407A (zh) 白血病疾病基因和其用途
CN1721553A (zh) 用于评估和治疗癌症的方法
CN1625602A (zh) 选择药物敏感性决定因子的方法和利用所选择的因子预测药物敏感性的方法
CN1890384A (zh) 与炎性疾病的治疗功效相关的遗传多态性的用途
NZ549384A (en) Leptin promoter polymorphisms and uses thereof
EP1651775A2 (en) Breast cancer survival and recurrence
CN1533435A (zh) 用于诊断及治疗胰岛素抗性及相关病症之方法和试剂
WO2013090419A1 (en) Gene expression signatures for detection of underlying philadelphia chromosome-like (ph-like) events and therapeutic targeting in leukemia
CN1845999A (zh) 在卵巢癌中作为预后和治疗靶标而被调控的基因
US20050136438A1 (en) Genetic analysis for stratification of cancer risk
Lee et al. Association between polymorphisms in leptin, leptin receptor, and β-adrenergic receptor genes and bone mineral density in postmenopausal Korean women
CA2924669C (en) Compositions and methods for the analysis of radiosensitivity
CN1711361A (zh) 预测药物治疗副效应水肿的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070523