牛催乳素基因组序列、含其基因的载体及其应用
本发明属基因工程领域和转基因工程领域,具体涉及一种新的牛催乳素基因核苷酸序列、利用牛催乳素基因组DNA和cDNA构建的载体、由这些载体转染的细胞以及载体和细胞的应用。
牛的催乳素(bovine Prolactin;bPRL)是牛腺垂体分泌的单链多肽类激素。1928年Stricker等用牛腺垂体提取物导致兔泌乳,提示腺垂体中含有催乳的活性物质。(Stricker P,Gruter R1928.Action du lobe anterieur de l′hypophyse sur la monteelaiteuse.C R soc Biol 99:1978-1980)Riddle等根据该活性物质的特性命名为催乳素(prolactin,PRL)。(Riddle O,Bates RW,andDykshorn SW.1933.The preparation,identification and assay ofprolactin-a hormone of anterior pituitary.Am J physiol105:191-216)。随后在鱼类、两栖类和哺乳类(鼠、猫、兔、羊、牛、人)动物的腺垂体组织中均分离、纯化和鉴定了相应的催乳素。
PRL生物学功能非常广泛,以往的文献报告(Nicoll CS,Bern H.1972.On the actions of PRL among the vertebrates:is there acommon denominator?In:Wolstenholme G,Knight J,editors.Lactogenic Hormone.London:Churchill Livingstone,299-327),在各种脊椎动物中PRL的生物学作用多达85种,这比其它垂体激素生物学作用的总和还多。近期文献报导(Bole-Feysit C,Goffin V,Edery M et al.,1998.Prolactin and its receptor:actions,signaltransduction pathways and phenotypes observed in PRL receptorknockout mice.Endocr Rev 19:225-268)PRL的生物学作用至少在300种以上,其中主要集中在:(1)乳腺相关的功能:PRL对于哺乳动物的乳腺发育和乳汁生成、发动和维持泌乳是必不可少的激素;(2)生殖相关的功能;(3)免疫相关的功能;(4)生长代谢及其它功能等。
牛PRL相对分子质量为23000-24000,初始的翻译产物为229个氨基酸的多肽,成熟的多肽含有199个氨基酸。在PRL分子的氨基端、羧基端以及中间区有3对半胱氨酸之间的二硫键,使PRL分子形成3个环。垂体中PRL主要相对分子质量为23000,但在大多数哺乳动物中包括牛的体内存在一些与其本源PRL(native PRL)分子大小、结构不同的异型,这些异型PRL的结构和生理学功能有待于更深入的研究。
牛PRL基因位于22号染色体,长度超过10Kb。与其它物种基因结构相似,编码区具有5个外显子、4个内含子,第1、部分2外显子编码信号肽,部分2,第3、4、5外显子编码成熟的PRL的多肽分子。其内含子的长度远远大于外显子,成熟的mRNA全长907bp。
在本发明之前,牛PRL基因cDNA序列已经公布(Genebank),全长907bp,但牛PRL基因全长未见报告,用牛PRL基因(GenomicDNA,cDNA)构建载体、特别是乳腺特异表达载体未见报告,用牛PRL基因(Genomic DNA,cDNA)载体转染细胞以及建立转基因动物模型未见报告。
本发明的目的在于提供全长牛催乳素基因组DNA,并提供利用牛PRL基因构建的载体,由载体转染的细胞,以及载体、细胞的应用。
在本发明中,牛PRL基因全长核苷酸序列是通过以下方法得出的:以牛外周血DNA为模板,用二对(A1/A2、B1/B2)核苷酸为引物:寡核苷酸A1:5′-CCACTGTCACTTCCCCAGTATGAAC-3′为正向引物,寡核苷酸A2:5′-GCATGAGCGCTCTAAGATGATGTA-3′为反向引物;寡核苷酸B1:5′-CTCAGAGAAGTTTGCCAGGGAATG-3′为正向引物,寡核苷酸B2:5′-ACATCATCTTAGAGCGGCTCATGC-3′为反向引物,采用Long-PCRKit(Perkin Elemer公司)进行PCR扩增。PCR反应条件为:98℃1min;(94℃,15sec;65℃,8min)*16;(94℃,15sec;65℃,8min,增加15sec/循环)*12;72℃,10min。然后电泳检测目的片段。
将上面获得PCR扩增产物A1/A2、B1/B2分别与pGEM-T载体(Promega公司)连接,常规方法转染大肠杆菌Top 10F′宿主菌感受态细胞,质粒小量扩增,碱裂解法提取质粒。取小量提取的质粒,分别用NotI(New England Bio公司)、ApaI(Amersham Pharmacia Bio公司)酶切初步鉴定,ABI370自动测序仪(Perkin-Elemer公司)测序,分别获得5764bp和4102bp二个bPRL片段。
通过Internet站点Webcutter查询经测序bPRL序列酶谱图。选择单一酶切位点(BsrBI:GAGCGG),用BsrBI,NotI、ApaI双酶切经上述测序的二片段以及pcDNA3.1(+)表达载体(Invitrogen公司),T4连接酶(New England Bio公司)将经酶切的两个片段同时插入到pcDNA3.1(+)表达载体上,经ABI370对构建的三处接头测序,结果正确无误,获得如SEQ ID No:1所示的9389bp的牛PRL全长基因。
为了验证本发明所分离的牛PRL基因序列的正确性,本发明利用获得的基因序列,进行了牛PRL cDNA的序列克隆,并将获得的cDNA序列与Genebank中公布的bPRL cDNA序列进行比较。首先构建pcDNA3.1(+)的启动子表达的bPRL Genomic DNA表达载体,将非洲绿毛猴肾细胞COS-7(中科院细胞所提供)按常规方法复苏、传代、培养,然后DOTAP脂质体介导bPRL Genomic DNA表达载体转染COS-7细胞。经培养72小时,收集转染bPRL Genomic DNA的COS-7细胞,提取总RNA,采用RT-PCR Kit(Gibeo BRL)进行逆转录PCR。以逆转录的cDNA为模板,用能覆盖bPRL cDNA全部编码序列的寡核苷酸作为引物:寡核苷酸C1::5′-ATAGGACGAGAGCTTCCTGGTGA-3′为正向引物,寡核苷酸C2:5′-CTCAGAGAAGTTTGCCAGGGAATG-3′为反向引物,进行RT-PCR。C1/C2的PCR反应条件为:94℃ 5min;(94℃ 1min,65℃45sec,72℃ 1min)*28个循环,72℃ 10min。电泳检测得到804bp bPRLcDNA片段。以上获得的PCR扩增产物C1/C2与pGEM-T载体(Promega)连接,按常规方法转染JM109宿主菌感受态细胞,质粒小量扩增,碱裂解提取质粒,取小量提取的质粒,分别用PvuII、NotI、AvaII(均为New England Bio公司)酶切鉴定,经ABI370自动测序仪测序,证实C1/C2片段804bp(核苷酸序列如SEQ ID No:2所示),包括全部的编码区,与Genebank中公布的bPRL cDNA序列完全一致。
利用本发明所提供的牛PRL Genomic DNA或者cDNA,与常规的或者特别构建的表达质粒相结合,可以成功构建多种牛PRL基因表达载体。本发明利用pcDNA3.1(+)的pCMV和pcDNA3.1(-)的pCMV分别与bPRL基因组DNA以及bPRL基因cDNA构建成功由pcDNA3.1(+)的pCMV启动表达的bPRL基因组DNA的表达载体、由pcDNA3.1(+)的pCMV启动表达的bPRL基因cDNA的表达载体、由pcDNA3.1(-)的pCMV启动表达的bPRL基因组DNA的表达载体、由pcDNA3.1(-)的pCMV启动表达的bPRL基因cDNA的表达载体。
利用本发明所提供的牛PRL Genomic DNA或者cDNA,与常规的或者特别构建的乳腺表达质粒相结合,特别适合构建bPRL基因乳腺表达载体。本发明构建了山羊β-酪蛋白基因乳腺表达载体:从山羊血白细胞中提取基因组DNA,参照绵羊β-酪蛋白(β-casein)基因的序列,利用引物设计软件Oligo 4.0辅助设计了5组扩增引物,通过PCR分段扩增山羊β-酪蛋白5’端片段,包括5’端上游以及外显子1、2和内含子1共6608bp的DNA序列,并通过点突变使密码子ATG突变为AAG,PCR产物经DNA限制性酶切位点鉴定和测序分析后,依次进行克隆及连接,从而得到具有SEQ ID No:3核苷酸序列的山羊β-酪蛋白基因乳腺表达载体。本发明利用构建的山羊β-酪蛋白基因乳腺表达载体,结合本发明所提供的牛PRL Genomic DNA或者cDNA,再结合其他的表达质粒,可以构建多种bPRL基因乳腺表达载体,如由pcDNA3.1(+)或pcDNA3.1(-)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的乳腺组织特异的bPRL基因组DNA或cDNA的表达载体。
利用本发明所提供的牛PRL Genomic DNA或者cDNA,与特异性乳腺表达载体结合,或/和其他表达质粒结合,再结合其他的人或动物的目的基因,可以构建多种多样的共同表达的特异性乳腺表达载体。结合牛PRL Genomic DNA或者cDNA和其他目的基因的共同表达的特异性乳腺表达载体,可以提高利用转基因动物乳腺生物反应器生产的目的基因产品的质和量。发明人据此构建了由pcDNA3.1(-)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的乳腺组织特异的人乳铁蛋白基因cDNA和pcDNA3.1(-)的pCMV启动的bPRL基因cDNA的共表达载体、由pcDNA3.1(-)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的乳腺组织特异的人乳球蛋白基因cDNA和pcDNA3.1(-)的pCMV启动的bPRL基因组DNA的共表达载体、由pcDNA3.1(+)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的乳腺组织特异的人凝血因子IX基因cDNA和pcDNA3.1(+)的pCMV启动的bPRL基因cDNA的共表达载体、由pcDNA3.1(+)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的乳腺组织特异的人血清白蛋白基因cDNA和pcDNA3.1(+)的pCMV启动的bPRL基因组DNA的共表达载体等。
为了证实本发明所提供的牛PRL基因和各种载体的有效性和实用性,本发明选择了部分载体,采用脂质转染法,转染非洲绿毛猴肾细胞COS-7和孕中期小鼠乳腺上皮细胞HC-11。经细胞培养,提取RNA,进行RT-PCR扩增,目的片段测序证实,证明了在mRNA水平上的表达。同时通过酶联免疫实验,证明了在蛋白质水平上的表达。
为了进一步证实本发明的实用性,发明人通过转基因技术建立了由pcDNA3.1(+)和pcDNA3.1(-)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的bPRL Genomic DNA和cDNA表达载体整合的转基因小鼠。经PCR和Southern blot印记杂交检测证实,转基因小鼠体内有bPRL基因整合。
本发明所提供的牛催乳素基因组、含其基因的载体和由载体转染的细胞,可以用于科学研究,也可以用于畜牧业以提高家畜的产奶质量,还可用于转基因动物乳腺生物反应器,提高转基因动物乳腺生物反应器中目的基因产品的质和量。
本发明中,以上所述和以下的实施例中,所使用的技术,包括基因测序、PCR扩增与检测、细胞转染、载体构建、转基因等分子生物学技术,以及细胞培养、检测技术等,除有特别说明的,均为本领域内的技术人员已知的常规技术;所使用的仪器设备、试剂、质粒和载体、细胞株等,除非是本说明书中特别注明,均为一般本领域的研究和技术人员可以通过公共途径获得的。
以下结合具体的实施例,对本发明做进一步的阐述。这些实施例仅用于对本发明做说明而不是对本发明的限制。
实施例1:
bPRL的Genomic DNA序列的克隆和测定
1.PCR扩增
以牛外周血DNA为模板,二对(A1/A2;B1/B2)核苷酸为引物:
寡核苷酸A1:5′-CCACTGTCACTTCCCCAGTATGAAC-3′为正向引物
寡核苷酸A2:5′-GCATGAGCGCTCTAAGATGATGTA-3′为反向引物
寡核苷酸B1:5′-CTCAGAGAAGTTTGCCAGGGAATG-3′为正向引物
寡核苷酸B2:5′-ACATCATCTTAGAGCGGCTCATGC-3′为反向引物
采用Long-PCR Kit进行PCR扩增。PCR反应条件为:98℃ 1min;(94℃,15sec;15℃,8min)*16;(94℃,15sec;65℃,8min,增加15sec/循环)*12;72℃,10min
电泳检测目的片段。
2.PCR产物的测序
将上面获得PCR扩增产物A1/A2、B1/B2分别与pGEM-T载体连接,按常规方法转染大肠杆菌Top 10F′宿主菌感受态细胞,质粒小量扩增,碱裂解法提取质粒。取小量提取的质粒,分别用NotI(New EnglandBio公司)、ApaI(Amersham Pharmacia Bio公司)酶切初步鉴定。ABI370自动测序仪(Perkin-Elemer公司)测序。分别获得5764bp和4102bp二个bPRL片段。
实施例2:
bPRL genomic DNA二个片段连接:
通过Internet站点Webcutter查询测序bPRL序列酶谱,获得全长的酶谱图。选择单一酶切位点(BsrBI:GAGCGG),用BsrBI,NotI、ApaI双酶切经上述测序的二片段以及pcDNA3.1(+)表达载体(Invitrogen公司),T4连接酶(New England Bio公司)将经酶切的两个片段同时插入到pcDNA3.1(+)表达载体上,经ABI370对构建的三处接头测序,结果正确无误,获得如SEQ ID No:1所示的9389bp的牛PRL全长基因。
实施例3
bPRL cDNA的序列克隆和测定
1.真核细胞的转染
对非洲绿毛猴肾细胞COS-7复苏、传代、培养,DOTAP脂质体介导由pcDNA3.1(+)的启动子表达的bPRL Genomic DNA表达载体转染COS-7细胞,经培养72小时,收集COS-7细胞。
2.RT-PCR
收集转染bPRL Genomic DNA的COS-7细胞,提取总RNA,采用RT-PCR Kit(Gibco BRL)进行逆转录PCR。用能覆盖bPRL cDNA全部编码序列的寡核苷酸作为引物:
寡核苷酸C1::5′-ATAGGACGAGAGCTTCCTGGTGA-3′为正向引物,
寡核苷酸C2:5′-CTCAGAGAAGTTTGCCAGGGAATG-3′为反向引物。
C1/C2的PCR反应条件为:94℃ 5min;(94℃ 1min,65℃ 45sec,72℃ 1min)*28个循环,72℃ 10min。电泳检测得到804bp bPRL cDNA片段。
3.PCR产物测序
将以上获得的PCR扩增产物C1/C2与pGEM-T载体(Promega)连接,按常规方法转染JM109宿主菌感受态细胞,质粒小量扩增,碱裂解提取质粒,取小量提取的质粒,分别用PvuII、NotI、AvaII(均为New England Bio公司)酶切鉴定,经ABI370自动测序仪测序,C1/C2片段804bp,包括全部的编码区,核苷酸序列如SEQ ID No:2所示。
实施例4:
乳腺特异的表达载体构建:
将克隆测序正确的bPRL Genomic DNA(cDNA),用NotI,BamHI(NewEngland Bio公司),ApaI(Amershem公司)双酶切,同样酶切含有山羊β-酪蛋白基因5′端6608bp(β6608:P1A3)的载体DNA及pcDNA3.1质粒,电泳回收目的片段,用T4连接酶(New England Bio公司)将上述片段一次有顺序地装载到pcDNA3.1表达载体中。形成pcDNA3.1/P1A3+BP1-4和pcDNA3.1/P1A3+BPE(BP1-4:系指bPRL genomicDNA;BPE:系指bPRL cDNA)。按常规转化、质粒扩增、提取,经ApaI、NotI、BamHI(来源同前)、XhoI(New England Bio公司)酶切鉴定正确,送经酶切鉴定正确克隆子对连接处测序,结果正确。
实施例5:
共表达的表达载体构建
将克隆测序正确的bPRL cDNA酶切装入pcDNA3.1表达载体中,用SalI(NEB公司)酶切,再将含pCMV-BPE-BGH pA单元转入pSL301质粒。对已经构建鉴定的pcDNA3.1/P1A3.Lactoferrin(Lactoferrin:人乳铁蛋白基因cDNA)和pcDNA3.1/P1A3.FIX(人凝血因子IX基因cDNA)的表达载体(上海医学遗传研究所提供)及pSL301/pCMV-BPE-BGH pA用BssHII(TakaRa公司)酶切,电泳回收目的片段,将pCMV-BPE-BGH pA的表达单元连接到pcDNA3.1/P1A3.Lactoferrin和pcDNA3.1/P1A3.FIX载体的BssHII位点,形成共表达的载体。
实施例6
bPRL基因在真核细胞中的表达
1.转染COS-7细胞株:
按常规细胞培养。pcDNA3.1/P1A3+BP1-4和pcDNA3.1/P1A3+BPE质粒转染COS-7细胞是采用DOTAP(BM公司)脂质体转染法,转染COS-7细胞72小时,收集细胞的上清液,进行ELISA测定,证明是有bPRL表达。收集COS-7细胞,提取总RNA,按实施例3之2进行RT-PCR,证明在mRNA水平是有表达。
2.转染HC-11细胞株:
pcDNA3.1/P1A3+BP1-4,pcDNA3.1/P1A3+BPE,pcDNA3.1/P1A3Laf+BPE和pcDNA3.1/P1A3FIX+BPE质粒转染HC-11细胞是采用脂质体转染法,按生长期培养、休克期培养及诱导期培养三种要求进行培养HC-11细胞,转染HC-11细胞72小时,收集细胞的上清液,进行ELISA测定,证明是有bPRL表达。收集HC-11细胞,提取RNA,按实施例3之2进行进行RT-PCR,检测证实在mRNA水平上有表达。
实施例7:
转基因小鼠的建立
pcDNA3.1/P1A3+BP1-4,pcDNA3.1/P1A3+BPE的质粒,QIAquick公司Kit提取质粒,纯化定量测定,供显微注射。按常规进行转基因小鼠的制备程序。现已建立的转基因小鼠,经PCR和Southern blot印记杂交检测证实,其体内有bPRL基因整合。
附图说明:
图1是牛催乳素基因组序列构建图。
图2是pcDNA3.1(+)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的乳腺组织特异的牛催乳素基因组DNA表达载体构建图。
图3是pcDNA3.1(-)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的乳腺组织特异的牛催乳素基因cDNA表达载体构建图。
图4是pcDNA3.1(-)的pCMV和山羊β-酪蛋白基因5’端6608bp序列共同启动表达的乳腺组织特异的人乳铁蛋白基因cDNA和pcDNA3.1(-)的pCMV启动的牛催乳素基因cDNA的共表达载体构建图。
序列表
(1)一般资料:
(i)申请人:
(A)名称:上海滔滔转基因工程股份有限公司
(B)地址:上海市北京西路1277号1209室
(C)邮政编码:200040
(D)电话:021-62793980
(E)传真:021-62894066
(ii)发明名称:牛催乳素基因组序列、含其基因的载体及其应用
(iii)序列数目:3
(2)SEQ ID No:1的资料:
(i)序列特征:
(A)长度:9389碱基
(B)类型:核酸
(C)拓扑结构:线形
(ii)分子类型:核苷酸
(iii)序列描述:SEQ ID No:1
1 CCACT GTCAC TTCCC CAGTA TGAAC TCCCT AAAGT
36 TAGGG GTGAG TTTTG TGCTC ATTGT AGAAG AGAGG
71 GCAAC GTATG TTGGA GGATT CATTT TCCAG CCCTC
106 TTCAC ATCCC TCCTG ATTTC TCTTG AAGTG ATAAA
141 CATTT CGGTA TCTAA CTTGA CTAAT TCTAT ATCCT
176 TGACA TTTAA ACTCC CCATC CCACT GTTTC TCAAT
211 CTGGG GACGA AAGAT ATAAC TTTAC ATACA TGTTA
246 AAATC AAAAG ACTTA TGTGA AAATG CACAT TTTAC
281 CACAG AGATA TATCC TTTTA GAAAG GACAA AACAG
316 AATGT GTAAA AATCA AGAAA AAAAA ATGAG GAAAA
351 TGTAT TGAGA GTATA ACAGG AACTG AAAAT CTTAC
386 TTACT CATCC TTATT CTATA TTTCT TAGTA TTTAG
421 TGTGT AAATT TTGAA ATCTT GACTT CAGCC AGCAA
456 TTTTG AATGA GAATA AAATA CTCTT TGATA ATACA
491 TGAGA CACCT AAGTG AGAGA TAATG CTATA TTCAA
526 GAAAC TGCAG AGAAA TAAAG GCAAA TGTTA CAAGA
561 AATGA CTGCT ATAAT TTTAT AGTTC CTCTA ACTCA
596 AACTA GTCTC CAGAT CTCAC CATCA TTATC TCTCT
631 CATTT CCTTT CAGTC TAATT AATCA AAATC CTTCC
666 TAGAT GTTCA TTTCT GGTCA GTATG TCTTC CTGAA
701 TATGA ATAAG AAATA GAATA CCATT CAATG TTTGA
736 AATTA TGGGG GTAAT CTCAA TGACG GAAAT AGATG
771 ACTGG CAAAA GGGAA GGGAA TGCCT GATTA AATAT
806 ATTCA TGAAG ATGTC AAAGC CTTAT AAAGC CAACA
841 TCTGG GGAAG AGAAA GCCAT AGGAC GAGAG CTTCC
876 TGGTG AAGTG TGTTT CTTGA AATCA TCACC ACCAT
911 GGACA GCAAA GGTTC GTCGC AGAAA GGTAT GTACA
946 GCAGC TTGTG GAGTT GTTGG GTTTT ATCCA TGTTC
981 CAATG GGGGC ATTAA TTTGA AATTT GAGGA AATAT
1016 TCTCT TAGGT TTCAG GATTA CAGAG TTTAG AAGAA
1051 CTAGC TAATC CTGCT CTAGA AATCA ATTGT ATAGG
1086 GGCAC AATAG GACAG TGGTT CTTGA ATGGA GGACT
1121 GTCTT CCAGA GACAT TTGGT TAATG TCTGG AGATG
1156 GTTTT GGTTG TCTTA ATATG GGGCA GGGGT GCAAC
1191 TGGTG CCCAG GGGGT AGAGA ACAGT GATAT TGCTA
1226 AGCAT ACTAC AATGC ACAAG TTAGC CCCCA GAACA
1261 AGTAC TTATC TAGCT CAGGG TGCCA ATCAT GTCAA
1296 AGTTG AGAAA ACTTA GACTG GAATA AGACC AAAAA
1331 TGTCT ATGAG TCCAA TTCAT CACAA CTCCA GAAGG
1366 TAGAA ACAAA CATTT TCTAG TTACC AAGAT TCTTA
1401 TGTGG TGTGG CTAAG ATGAG TCAGC CTGAT GAAAC
1436 TTTTA ACTCT GAAGC TATAA TACAG ACAGT GACAG
1471 CAGAG TAGTC TCCTA CAATA CTTTG TTGAC TGGGT
1506 TCAAT CCAAA TGATA TCTTA GAAGA AAACA CAGGC
1541 TAGTA ACAAT AATCG CCTTT ACTTG CTTGG TTGAC
1576 ATTCG CTAGA AAAAG AAATT GCAGA TAACT AATGA
1611 GAACT TACTG TATAG CAAGG ACAAA TCTAC TCAGT
1646 GCTCT CTGGT GACCT AACTG GGAAG GAAAT CCAAA
1681 AAAGA GGGTA TATAT GTATA CATAC AGCTA ATTCA
1716 CTTTG CTATA CAGCA GGAAC TAGCA TAATA TTCTA
1751 AAGCA AGTAT ATTCC GATAA AAATT AATTT AACAA
1786 AAGAA ATTAT AAGGC AAAGA CAATT ACAAA ATTTA
1821 TCTTA TGAAA CAACA AAAAC ATTTC TTTTT TATCT
1856 CATCT TAGGC TGTGG AAAAA AGTCC TTCAG ATGAT
1891 AAAGG TTCAG ATAAA TGTAG TCAGA GTTAA AGAAT
1926 GTCTA TCCAG TTATG AATTT CCTAG AACCA ATATT
1961 CCAAT TTCTC TATCT GTAAA GTACT TTATA TTTAT
1996 ACTTG TAGAT AAAAC AGTTA ATCAG CTGTG TTACA
2031 TGACT GTAAA GTACC TAAAA TAATC TCTTT GGAAA
2066 TATGC CTTTG AAAAA TTAAA AGACT GTTAT ATGAA
2101 TTATC TCACA ATATT GATAT TTTTA TTTTG CAACT
2136 AAAAG GTTGT TCATT CTATA CTACA TTCTA TACTA
2171 AATAG TCTTT TAGAT ATTTT CAGGT GTTGA AGGTT
2206 AGGTA TTTTT TCACC CTAAA TCTTT AGCCC TTGCC
2241 TCGTT TTGTC TTGGA CACTT TCCAA TTACA TTTAT
2276 TCAAG ATTCC AGACG AAAGG AGTTT TTTGG TAAAC
2311 ACATT TCTAC ATTCT TTATT TTATT TGGAG CAATT
2346 TGAAC TTAAA CATGA TTTAA ATCAT TGCCT TTTTC
2381 CTTTT GAAAG TGTAA GTTAT TGATA TGTTA GTGGT
2416 TCATA TCAGT CCATC TGCTG AGATA GTAAA TCGGT
2451 GACTA CATTG TCTCT GCTAA TTGTA AAGGA CTTTA
2486 AAAAT GAATG TTTTA TAGAC AGAGC AGAAT GAGTG
2521 GATAA AATCG TCTTT CTAGG GTCAC TGCTG TCATG
2556 CAAAG ACAAA ATATT TTTCT CTACT AGTAA CGGCA
2591 ATGAT CGCCC CAAGC ACGGG TCATC ACAGC TACTG
2626 ATGGG GTCCC TGTTA CACAC ATGCA ACCCA AGAGC
2661 CCAGC TGCCT GTGTG TTGTG ACATG AGGAA GTGAA
2696 AAGAT GACAG TGTGG TCCCC AGTCA TCTCC ATCTG
2731 CTAAT CATGG GACTT GGGGG AAAAT CACTT GCCCT
2766 AAGTC ACTGT TTATT AATAA AATCT GATGA TAATA
2801 ATGGA GATCA CTGGA GAGAG CCCTG ATGCT GCGAA
2836 GATTG AAGGC AATAC AAGAA GTGGG CGGGA GAGGA
2871 TGAGA TGGTT AAATA GCATC ACTGA CTTAA CAGAC
2906 ATAAA TTTGA GCAAA CTCCA GGATA TAATG AATGA
2941 AGGGG AGCCT AGAAT GCTGC AGTCT ATGGG GTGAC
2976 AAAGA GACTG AACTT AGTTA TGCAC AACAA TAATA
3011 CAGTG AAGGC CAAGG CTATC TCAGA GGATT ATCAT
3046 GAAAC ACAAA TTTTA CACAT TTTTA AAAGC TTTTA
3081 GCAAA GTATC AAGGA AATGG ATGGG GTTAG CAGAT
3116 CCAAG ATGCA GTATC CTTTT TCTCT TAGAA TTCTC
3151 TTTGT GTTCA ATAAT AGGGT TCAGG AAGTC ATGTG
3186 TTTCT TCTTA CCCAC CATGA TGGTA AACCA CACAA
3221 ATCAG ACTGT GCTGT TCTTG CCATT TCAGT GTCTA
3256 AAATG CAAGC ATGAG TCAGT AACAG TGAAA AAATG
3291 ACGAA CTCCT ACAAG CTGCT GAGAA TCTGC AGAGA
3326 ATCCC AAGAC ATTAG ACTAT CGTAG GAGAA TGACC
3361 TAAAC ACGCT GACTC ACATT AAATT TAAAT TCCAA
3396 GTGTT TGCAG AACAC AGGAG CACTT CTGGG AGCAA
3431 TACAA AAATG CATGG GGTAA CCTAC TTCTG CAACT
3466 ATATA TCTGT GCAAA TATCA TCATC CATCT AAATT
3501 TACAC AGTGG AAGGT GTTGC TTCTT CCCCA CCCCA
3536 GCTGC TACAG CACCA AATCC TGCTC AGGGC AACGG
3571 GGAGA GATGA GGCCT CCCTG GACAG GATGG CTTTT
3606 GCTAA CCTTG GGCTA ATACA TCATC TTAGA GCGGC
3641 TCATG CTTTT ATTTA AGCAG GGTCC CGCCT GCTCC
3676 TGCTG CTGGT GGTGT CAAAT CTACT CTTGT GCCAG
3711 GGTGT GGTCT CCACC CCCGT CTGTC CCAAT GGGCC
3746 TGGCA ACTGC CAGGT ATCCC TTCGA GACCT GTTTG
3781 ACCGG GCAGT CATGG TGTCC CACTA CATCC ATGAC
3816 CTCTC CTCGG AAATG TTCAA CGAAT TTGTA AGTAC
3851 TGTAT TTCTT GCTTA TTTCC AGAAG AAACC TTTGC
3886 GTAAG TGACT GGGCT ATACT ATCCT TTAAA CAAGA
3921 AGGCT GCATC AGCCA AACTT CAAAG AACAC ACTTT
3956 CTAGG TCAAA TAAGA CATTA GCTCA TAAGA TGTGG
3991 TAACT GAAGA AAAGA TGTTT CATGA AATCT CCAGG
4026 ATTCT TAAGC AGTGA CATAC CTGTT TCAAT TTGCT
4061 TTTAT TTGTT AAATT TCCAA AATAA ATTTA AAGCA
4096 CCTGT ATTTG TCAGC TTGGA CTCTC ATAGC AGAAT
4131 ACCAT AGACT CAGTG GATTA AACAA CAGAA CTTTA
4166 TTTCC TTGCA CTTCT GGGGG CTGGT GGTCC CCGAT
4201 CAGAG TGCCA GCAAG GTCAG TTTCT GGTAA GGGCT
4236 CTGTC TACCC AGGTT GGCTT CTCCC TGTGT CCATG
4271 CAGGG TTGGG GGCAG GGAAG AGAAA CAGAG GAAAG
4306 GCACA GAGAC AAAAG AGAAA ACTCT CCAGT GTTTC
4341 TCTTC ATAAA GACTC TAACA TTTTG GATCA GTGTT
4376 CCACC CTACG AGCTC ATTTA ACTTT AATTA ATCCT
4411 CATAA TCTTC TGGGC TTCCC TTGTG GCTCA GCTGG
4446 TAAAG AATCC ACCTG CAATG TGGGA GATCT GGGTT
4481 CAATC CCTGG GTTGG GAAGA TCCCC TGGAT AAGGG
4516 AAAGG CTACC CACTC CAGTA TTCTG GCCTG GAGAA
4551 TTCCA TGAGT GGGAC ACAAA TGAGT GATTT TCACT
4586 TTTAT TGTCA ATCTT CATAA GGGCT TCCTA GGTGG
4621 TGCTC GTGGG GAAGA ACCCT CCTGC CAATG CAGGA
4656 GACAT AAAAA ATGCA GGTGC AATCC CTGGG TCAGG
4691 AAGAT GCCCT GGAGG AGGGC ATGAC AACCC ATTCC
4726 AGTAT TCTTG CCTGG AGAAT CTCCA TGGAC AGAGG
4761 AGCCT AGAGG GCTAT AGTCC ACAGG GTTGC AAATA
4796 GCGGT GCACA ACTGA AGCGA CGTAG CTTGC ACACA
4831 GTCTT CATAA AGACC CTTCT CCAAA CACAG TACTT
4866 CGGAG ATTTT TGCTT CAACA CATGA ATTTG GGGGA
4901 GAAGG AAATG GCAAC CCACT CCAGT GTTCT TGCCT
4936 GGAGA ATCCC AGGGA CTGGG GAGCC TGGTG GGCTG
4971 CCGTC TATGG GGTCG CACAG AGTCG GACAC GACTG
5006 AAGTG ACTTA GCAGC AGCAG CAGCA TTCAG TTCAT
5041 AGCAG TACCT GACAA AAAGC ACTCT TAGGT GGGGC
5076 TGGGG AAAAG AACCA TCTTG ATTTT CTGGT CCTTC
5111 AGTGT CCCTC TGGGC ATTCT TCACC CAGCA CACAG
5146 TAAAT AGCCA ATAAA TGGGA ACTGC ACTTC AGTGA
5181 ACTGG GTGGA TGGAA CACAT TAGAC AGAGC TGAAT
5216 TCCTG TAATG AAAAC AAATA ATGAT AGTTT TTTAA
5251 ATGCT ACAAA TTACT GTTCT AAGAT GTGCA ATATA
5286 TGGGT TTATA ACTAC AATAG AATGC TTGGT TTATA
5321 ATTGG AAACA AAATT ATTCT CTTTC TGATG AAATT
5356 ACTTT TAAAG TTGTA TACTC TTTTA TGTCA ATCAA
5391 GGAGC CCATA GTAGA GCAGA AAACT GATAA AAAAT
5426 GGTGC TCAAA GTTTC TATTA AATTC ATATA GTTCT
5461 TTTTA TTCAC TAGTT TTCCT TTCAT CTTCC ATTTT
5496 TGACT GTCAT CTTTT TTCCA GATCT TCGAA GTAAT
5531 CTCTT TAAAT GCTCA CAACT TTTGC TAAAG ATAAG
5566 GTTTT CTTTA TCAAC ATGTT AGCTA GTTAT TGCGA
5601 CTCTC CTTCT CAGTC CATTG CTTAC TATTT TCAAA
5636 AATTT TATGC CATGT TTTTC TGACT TACCA CTTTC
5671 TCATC ATCAA CAATG CTGTA TTCTG CATCT GTGAA
5706 GCATA CTAAG CTATA GGTTT GTGGA TTCAG ATTAG
5741 TCAAA GAAAA GTTAT AATTA TATAT CTTCT TTTAA
5776 GGGAG TACAT TGGTT CCAAC CCAAA GTAAA CAAGA
5811 GATTA AATGT CTACA TAGGT ATCAT ACATA TGCAC
5846 TATAT TTGGT TCAAA TACTG AAAAT AGATG ATACT
5881 TAATA AAGCA GTTAA TATTT CATAT TTGGG TTATT
5916 TTTAG TGTTT GCTAT CCAAA TAGTA ACTAT GGGAA
5951 GGATG AAATG AAACA AGGGA AAAAA AAGAA GGAAA
5986 GAGGT TGGAA TTTAG ATGAC AAGCA ACTGT TTTCA
6021 GAGAT AATAG AAAGT AAAAG TAGGA AAAAG AATTA
6056 CTTTC AATTT TTATG TGACC CTCAT TAAAA AAAAT
6091 TATTC ATCTA TCAAA CGTGT TAATA TTCTG CTAAA
6126 GGTTC ATTTA TTGAA TGCCC AAACA ACCCT AACGA
6161 ATTGA ATTTG CTTGA TTGCT TCCAG GATAA ACGGT
6196 ATGCC CAGGG CAAAG GGTTC ATTAC CATGG CCCTC
6231 AACAG CTGCC ATACC TCCTC CCTTC CTACC CCGGA
6266 AGATA AAGAA CAAGC CCAAC AGACC CATGT GAGTC
6301 TTTTA TCCGG GTTTT CACCA GAACA AGTGA GACAG
6336 TGCAC TGGTG TCAGC AGGCT TCAGG TTATT AGAGG
6371 TCATG GTAAC TGGAC ATGCA GAGAA AGGTG GAGAA
6406 ACATT ATGCA TTATG CAGTT GCATT ATGCA GTTGA
6441 TGAAA TATGA GTAAA ATCAA GGGAT GACTA TAAAG
6476 ATCTG TAGCA GCAAA ATAAA TAACA GATCT ATGAA
6511 TTGTC CATGT GGACA ACATA AGTTC AACCA ATGCA
6546 TTAGA TCCAA GGTTG CAGCC ATTAT ACTGC ATGAA
6581 AACAT GAAAT AAATG GAATG TCCAT GTTTA AAATA
6616 TAGAT TTAAA AAATT CATGG ATATG TAAGA AACAC
6651 AACCC CAGTT TTGAG TATTC CCTGT ACTAG TGACT
6686 CCTAC ATGGG AGTCA CTTCT ACACT GCACT ACTTA
6721 AGCCA CCAAT TCTGC CTTTC AAGGC CCACC TGATT
6756 CTTCT ACTTC TCTGA CACCT ACCTC ATTCT TGACT
6791 GACTC CTCTA ACACC TCTTA TTTTT AATTA TAAAT
6826 CTCCC TCCAA AACGG GTCCT AAAAA ATATT ATGTT
6861 TTGCT TCTCA TGGTT GTGAT GATTG CCTTT GTACT
6896 GATGA CCACA TGTCT ACCGA TAAGC CTCAA TCATG
6931 TATCC CAGAT CCAAA TTTTT ATCAT TATAA TCGCT
6966 CCTTC CTCAT TCCCT GAACT AGGCA CAGCG CTAAC
7001 ATTAT TTAAA ATATT TCCAC ATGCA CCTCC CCTTA
7036 AGTAC AATCT GTTCT CTTGC TTCAG CTTTG TTAGT
7071 GATAC CAGGA TTTTT TTCAT CTGCT AATCT TCTTA
7106 ATAAG GAGGA TGATA AAATG AAGGA AGAAG GTCAA
7141 GAAGA AAAAG GAGGA CTTTT AAAAT AAGTT TAAAA
7176 TAAAT TTAAA ATTTA TTGAG AGCTA TTACC TTGCC
7211 ATACA ATTTA CAAAG TACTT TGTTT TCATT ACTAT
7246 GTTTA ATCCT CATGA AAATT CCTGT AGCAC AATGA
7281 CCGTT ATTAC ACTTC CTGTA ATATG GAAAC CAAGA
7316 CTCAG AAAAA TTGTG GAATT TGTAC CAGTC ACATA
7351 GGTAG TAAGC AGTGA TTCTG GGTTT CTTCC AATCA
7386 GAGCT CTCAC TCTTC CTCTT TAAGC TACAA CGCCC
7421 CCAGG AAAAC CATGC TGCCA CTCAC CCTAG AGTCT
7456 GAATT TCATT TCAGC TCCCT TACTC TCACA TCCCA
7491 TCATG TTTCT ATTGC AATGT CTGTT TGATT CTTCT
7526 CTGCT GTTCA TTTCC TGTAC CATTA AAGTA GTTCA
7561 TGGCC ATCAA GAAAT CAAGA ATTTT AATCA GAGAT
7596 GCTCA GCCCC TGGGG GCATG TCCAG TCCTG ATAGT
7631 AGTGA ACTAG GGGGC AAAAC CCTCC ATGGG GAATC
7666 CCACT AATGC TCTTA ATAAA GACAA CACTG TGCCA
7701 TTTCC TGCCC AGACA CATGT CAACA AAATA GACTG
7736 CTCTG ATATC AGCTT GGGGG CTGAT GTTGG GAGGA
7771 CTGAG GAAAG TGTGG TTAGG AATGT CATAT CTTCT
7806 TTACT GCCTC TTTGT TCTAA TATCA TAAAA GGAAC
7841 TACCA CTCAA AAACT AAAAA TACAT GAATG AATAC
7876 ATCGA TTCAT TAATA TGAAT GAATC ACTGG GTGAA
7911 AATGA GTTGG GCACT GGTGG AGTCC TTCTT TCCTG
7946 GGTCA GGTAC TCCAG GCACA TACTG AGTTC CAACA
7981 AAATA CTTAG ATTTC TCTCC CCAGA CAAGC AAAGC
8016 ATTCA AATAT AAAAG AACTC ACTCA GTGGA TGGCA
8051 GAATT TCAGA GGGAA AAAGA AAATT CTTTA TGTTA
8086 TAAAT TAGAA CTCAT CAGAA ACATT GGTTA CTAAA
8121 ATAAG CCAGA TTTTT AAGTA TTTCA GCAAA GTATA
8156 AACCG ATAGC TTACA TTTTA TAATT TTGCA ACCTT
8191 CAAAA AATTT TCAAT ACATA TAGGA AAAAC CAGGA
8226 GTTTT TTAGG TCAAT CACTC TGAGC AAAAA TCACA
8261 TGTTA CCAAA TCCAC TGAAT TATGC TTATT TTAAT
8296 GAGAT TGTTT CTTGT GGTCG TTCAG CATGA AGTCC
8331 TTATG AGCTT GATTC TTGGG TTGCT GCGCT CTTGG
8366 AATGA CCCTC TGTAT CACCT AGTCA CCGAG GTACG
8401 GGGTA TGAAA GGAGC CCCAG ATGCT ATCCT ATCGA
8436 GGGCC ATAGA GATTG AGGAA GAAAA CAAAC GACTT
8471 CTGGA AGGCA TGGAG ATGAT ATTTG GCCAG GTGAG
8506 CAGCT TCATG AAAGC TTCCT TGCTA TTTTC ATGAA
8541 TGAGA GAGGT GATTT CTGTA ATGAG GAATG AGTTT
8576 TGAAC TATCT CACTG TACAA GAACA CAATT CAGGC
8611 CTTCT TTTTC TAGAC CGGTG TTACA TAAAG CAAGA
8646 ACCTG TTCAT TCATA GTGAT AGATT CTATT GTAAG
8681 TGAAT TAGAA TTCCA CAGCA ATTTT TCACA GGTAT
8716 AGTCT TTCTT GAATT GTACA GTTAC ACCAA AATCT
8751 TGCCT CTTCC TGGGT ACAGA TGGCT GAAAT ATTTT
8786 CAAGG ATAAG AGAAT TAGAG AATAC AATTT GCAAG
8821 ATAAA TGTTT TCTTC AAAAT ATCCC AAGAT ATCCT
8856 CTACT GAAAT TCAGC TTGTA TTCTT TCTCT ATTCT
8891 CCTCA AACCA CAGGA TGAGA ATGAG AAGAA AGAAA
8926 AGAGA AGATC AAAAC CAAAT ACTTG AGTTC TGCTT
8961 TAGTT TTTAT TAATA AATTA CTAAC ATATA TCTGA
8996 TACAC TGGCT CCAAA ATCCA AGTGT AGAGA CTTTC
9031 ATGTA TCTTC CCTAA TTTTT AATTT GATAA ATAGA
9066 AAGAA CAAAG ATGAG CTAAT ACTAC TAAAA CTCAT
9101 AATAA CTCAT TATCT TTTGG ATGTT TAGGT TATTC
9136 CTGGA GCCAA AGAGA CTGAG CCCTA CCCTG TGTGG
9171 TCAGG ACTCC CGTCC CTGCA AACTA AGGAT GAAGA
9206 TGCAC GTTAT TCTGC TTTTT ATAAC CTGCT CCACT
9241 GCCTG CGCAG GGATT CAAGC AAGAT TGACA CTTAC
9276 CTTAA GCTCC TGAAT TGCAG AATCA TCTAC AACAA
9311 CAACT GCTAA GCCCA CATTC ATCCT ATCCA TTTCT
9346 GAGAT GGTCC TTAAT GATCC ATTCC CTGGC AAACT
9381 TCTCT GAGA
(3)SEQ ID No:2的资料:
(i)序列特征:
(A)长度:804碱基
(B)类型:核酸
(C)拓扑结构:线形
(ii)分子类型:核苷酸
(iii)序列描述:SEQ ID No:2
1 GACGA GAGCT TCCTG GTGAA GTGTG TTTCT TGAAA
36 TCATC ACCAC CATGG ACAGC AAAGG TTCGT CGCAG
71 AAAGG GTCCC GCCTG CTCCT GCTGC TGGTG GTGTC
106 AAATC TACTC TTGTG CCAGG GTGTG GTCTC CACCC
141 CCGTC TGTCC CAATG GGCCT GGCAA CTGCC AGGTA
176 TCCCT TCGAG ACCTG TTTGA CCGGG CAGTC ATGGT
211 GTCCC ACTAC ATCCA TGACC TCTCC TCGGA AATGT
246 TCAAC GAATT TGATA AACGG TATGC CCAGG GCAAA
281 GGGTT CATTA CCATG GCCCT CAACA GCTGC CATAC
316 CTCCT CCCTT CCTAC CCCGG AAGAT AAAGA ACAAG
351 CCCAA CAGAC CCATC ATGAA GTCCT TATGA GCTTG
386 ATTCT TGGGT TGCTG CGCTC TTGGA ATGAC CCTCT
421 GTATC ACCTA GTCAC CGAGG TACGG GGTAT GAAAG
456 GAGCC CCAGA TGCTA TCCTA TCGAG GGCCA TAGAG
491 ATTGA GGAAG AAAAC AAACG ACTTC TGGAA GGCAT
526 GGAGA TGATA TTTGG CCAGG TTATT CCTGG AGCCA
561 AAGAG ACTGA GCCCT ACCCT GTGTG GTCAG GACTC
596 CCGTC CCTGC AAACT AAGGA TGAAG ATGCA CGTTA
631 TTCTG CTTTT TATAA CCTGC TCCAC TGCCT GCGCA
666 GGGAT TCAAG CAAGA TTGAC ACTTA CCTTA AGCTC
701 CTGAA TTGCA GAATC ATCTA CAACA ACAAC TGCTA
736 AGCCC ACATT CATCC TATCC ATTTC TGAGA TGGTC
771 CTTAA TGATC CATTC CCTGG CAAAC TTCTC TGAG
(4)SEQ ID No:3的资料:_
(i)序列特征:
(A)长度:6608碱基
(B)类型:核酸
(C)拓扑结构:线形
(ii)分子类型:核苷酸
(iii)序列描述:SEQ ID No:3
1 TAGCA GGAAT CACAG CATCT ACACA TTTTT TCATT
36 TTGTG ACTTT TCAAG TCTTC TAGCT CAGTC ATTCT
71 AAATG TGAGA TGATT TTGCA ACCCC CTGCC TCAGG
106 AGACA CTGGG AAATT TCCTG AGACA TTTTT GATTC
141 CAAAA GCTGT GCAGT TGGTG CTTCT ACCAT CTTCG
176 TGGTA GAGGT CAAGG ATGCT GCTAA ACATT CTACA
211 ACACA TTAAG AAAAC CCCCA CAACA AAGAA TTCTT
246 CCGCC AAAAA TATCA ATAAT ATGAA GGTTG AAAAA
281 TACTG GTCTA GCATG TAGTA TGTGC TCAAT AGCAA
316 GGAGA GAAAA GAAAG CCTTC CTCAC TGATT AATGC
351 AAAGA AATAG AGGAA AACAA TAGAA TGGGA AAGAC
386 TAGAG AGCTC TTCAA GCAAA TTAGA GATAT CAAGG
421 GAACA TTTCA CGCAA AGATG GGCAC AATAA AGGAC
456 AGAAA TTTTA TGGAG GAGTT GCTGA TGGAG AGGGA
491 GGCCT GGCGT GCTGC GATTC ATGGG GTCGC AAAGA
526 GTCGG ACACA ACTGA GCGAC TGAAT TGAAC TGAAC
561 TGAAC TGGAC AAAGC AGAAG ATATT AAGAA GAGGT
596 GGTAA GAATA CACAG AAGAA CAATA TAAAA AAGAT
631 CTTCA TGACC CAGAT AACCA CGATG ATGTG ATCAC
666 TCACC TAGAG CCAGA CACCC TGGAA TGCAA AGTCA
701 AGCGG CCTTA GAAAG CCTCA CTATG AACAA AGCTA
736 GTGGA GGTGA TGGAA TTCCA GTTGA GCTAT TTCAA
771 ATCTT AAAAG GTGAT GCTGT GAAAG TGCTG CACTC
806 AATAT GTCAG CAAAT TTGGA AAACT CAGCA GTGGC
841 CACAG GACTG CCACA ATCCC AAAGA AAAGC AATGA
876 CAAAG AATGT TCAAA CACCC ACATG ATTGC ACTCA
911 TCTCA CATGC TAGCA AAATA ACTCT CAAAA TTCTC
946 CAAGC CAGGC TTCAA CAGTA CGTGG ACCAT GAACT
981 TCCAG ATGTT CAAGC TGGAT TTAGA AAAGG CAGAG
1016 GAACC AGAGA TCAAA TTGCC AACAT CCATT GGATC
1051 ATCAA AAAAG CACGA GAGTT CCAGA AAAAC ATCTG
1086 CTTTA TTGAC TACGC TAAAG CCTTT GATTG TGTGG
1121 ATCAC AATAA ACTGT GGAAA ATTCT TCAAG AGATG
1156 GGAAT ACCAG ACCAC TTTAC CTGCC TCCTG AGAAA
1191 TCTGT ATACA GGTCC AGAAG CAGCA GTTAG AACTG
1226 GACAT GGAAC AACAG ACTGG TTCCA AACTG CGAAA
1261 GGGGT ACATC AAGGA ATATT CATTG GAAGG ATTGA
1296 TGCTG AAGCT GAAAC TCCTA TACTT TGGCC ACCTA
1331 ATGTG AAGAT CTGAC TCATT GGAAA AGACT CCAAT
1366 GCTGG GAAAG ATTGA AGGCA GGAGA AGAGG ATGAC
1401 AGAGG ATGAG ATGGT TGGAT GGGAT CACTG ACTCA
1436 ATGGA CATGA GTTTG AGTAA GCTCC AGGGG TTGGT
1471 GGTGG ACAGG AAAGC CTGGC GTGCT GCAGT CCACA
1506 AGGTC ACAAA GATTC GGACA TGACT GAGTG ACTGG
1541 ACTGA TACTG ATGTG CTCAA CAAAT GTATC TTGAA
1576 CTTGT GTGAA GCTCT ATGGT CACAT GTAAA GGAAG
1611 AATAA TCAGG ATTAG CTGTG TGTCT TAGGA GTCAG
1646 GGTTC TGAGT TTTAT GTGTT CATAG TATCT GCTGG
1681 TTCAC AAAAC ATTTT TCTTA TTCTC TGGTT CTTGA
1716 TTTAC TTTAT AAAGT AATCT TAATA GTTAT ACTTC
1751 ACATA GATAC GAAAT TATTA TATTT GGATA ATCTC
1786 ATGGA AAGGA TTAAA TACTC CATCT ATACG AGTAA
1821 TGCTG AACTA TCTAC TCCTA CCTAA TAATT TGTCA
1856 GAATT CACTA ATTCT GTGTT ATATT GTTTC TAAAT
1891 CTGAA TCATT ATATG AATCC TCAGT ATTTT GTTTT
1926 CCTTC CTCTA TATTT TGGAA TTTAT TAAAC AGTGC
1961 TTCAA ATAAT TTTTA GGAAA CTGAA GTTTT TAGTA
1996 ACAGC TCTAT CTCTA AATAG CTTTA GTATC TTGAA
2031 AAAGT AATAC AAATT CTCAC ATCCT TAATT TCCTC
2066 TTCTC TAAAA TATCT TTAAA ATATT CTATG AATGA
2101 TATCT CTTAA TATTT ATTTT TTTGG CAATC CAACA
2136 CAGCT TATGG GATCT TAGTT CCCCA GTGAG GGATT
2171 ATATC CATGC CAACT GCAGT GAAAG TACAA AATCC
2206 TAAAC TGGAC TCACC AGGGA TTTCC CAATA TCTCC
2241 TCTAG TTCTT ATTTC TGAAT ATTTT TGGTC CCTTT
2276 ATTGA CTCTT CATCC AACTT TTCTA TTGAT TTCTT
2311 TCTTG AGGAT ATTAT TTACT TGGTT TCAGC TAGAA
2346 ATATA TGCAA GTCTC AGGAC TGCAT ATTTC AGATT
2381 CATTG GCCAA TATGG GAAAA AACCT TTGGC TGAAC
2416 AAATC ATGCT TATAA AAAAT AGTAC TAGAG CATCT
2451 TACTT TGACT ATATC TTGCT CCTCA TTCAG GGTTA
2486 TCTAA TACAA TTTCC CCATA TGAAA TTCTT TTGCA
2521 TTATA AAAAT GGAAG CTCTT AGGTA ACATT GCAAA
2556 AATTC GAGTT GCTCA TATGG CACTT TGCTT CTTAC
2591 TGGTC ATTGT GTTCT GAGGC TTACC TGGAC AGTGG
2626 TACCT GATGT CATCT TAAAT TGCTG GCTTT TTAAT
2661 TTTCC ATTGG ACAAG CTTCT TTCTT TAGTA TATTG
2696 TTAAG GATTT CCTTG ATCAA GATTT TACCT ACTTT
2731 TCTGG TCCAA TTGGT GAGAG ACAGT CATAA GGAAA
2766 TGCTG TGTTT ATTGC ACAAT ATGTA AAGCA TCTTC
2801 CTGAG AAAAT AAAAG GGAAA TGTTG AATGG GAAGG
2836 ATATG CTTTC TTTTG TATTC CTTTT CTGAG AAATC
2871 AGACT TTTTC ACCTG TGGCC TTGGC CACCA AAAGC
2906 TAACA AATAA AGGCA TATGA AGTAG CCAAG GCCTT
2941 TTCTA GTTAT ATCTA TGACA CTGAG TTCAT TTCAT
2976 CATTT ATTTT CCTGA CTTCC TCCTG GGTCC ATATG
3011 AGCAG TCTTA GAATG AATAT TAGCT GAATA ATCCA
3046 AATAC ATAGT AGATG TTGAT TTGGG TTTTC TAAGC
3081 AATCC AAGAC TTGTA TGACA GTAAG ATGTA TTACC
3116 ATCCA ACACA CATCT CAGCA TGATA TAAAT GCAAG
3151 GTATA TTGTG AAGAA AAATT TTTAA TTATG TCAAA
3186 GTGCT TACTT TAGAA GGTCA TCTAT CTGTC CCAAA
3221 GCTGT GAATA TATAT ATTGA AGGTA ATGAA TAGAT
3256 GAAGC TAACC TTGTA AAAAT GAGTA GTGTG AAATA
3291 CAACT ACAAT TATGA ACATC TGTCA CTAAA GAGGC
3326 AAAGA AACTT GAAGA TTGCT TTTGC AAATG GGCTC
3361 CTATT AATAA AAAGT ACTTT TGAGG TCTGG CTCAG
3396 ACTCT ATTGT AGTAC TTAGG GTAAG ACCCT CCTCC
3431 TGTAT GGGCT TTCAT TTTCT TTCTT GCTTC CCTCA
3466 TTTGC CCTTC CATGA ATACT AGCTG ATAAA CATTG
3501 ACTAT AAAAG ATATG AGGCC AAACT TGAGC TGTCC
3536 CATTT TAATA AATCT GTATA AATAA TATTT GTTCT
3571 ACAAA AGTAT TATCT AAATA AATGT TACTT TCTGT
3606 CTTAA AATCC CTCAA CAAAT CCCCA CTATC TAGAG
3641 AATAA GATTG ACATT CCCTG GAATC ACAGC ATGCT
3676 TTGTC TGCCA TTATC TGACC CCTTT CTCTT TCTCT
3711 CTTCT CACCT CCATC TACTC CTTTT TCCTT GCAAT
3746 TCATG ACCCA GATTC ACTGT TTGAT TTGGC TTGCA
3781 TGTGT GTGTG CTGAG TTGCG TCTGA CTGTT ATCAA
3816 CCCCA TGAAT GATAG TCCAC CAGGC TCTAC TGTCC
3851 ATGAA ATTTT CCAGT CAAGA ATACT GGAGT GGATT
3886 GCATT TCCTA CTCCA TTTGA TTAAT TTAGT GACTT
3921 TTAAA TTTCT TTTTC CATAT TCGGG AGCCT ATTCT
3956 TCCTT TTTAG TCTAT ACTCT CTTCA CTCTT CAGGT
3991 CTAAG GTATC ATCGT GTGCT TGTTA GCTTG TTACT
4026 TTCTC CATTA TAGCT TAAGC ACTAA CAACT GTTCA
4061 GGTTG GCATG AAATT GTGTT CTTTG TGTGG CCTGT
4096 ATATT TCTGT TGTGT ATTAG AATTT ACCCC AAGAT
4131 CTCAA AGACC CACTG AATAC TAAAG AGACC TCATT
4166 GTGGT TACAA TAATT TGGGG ACTGG GCCAA AACTT
4201 CCGTG CATCC CAGCC AAGAT CTGTA GCTAC TGGAC
4236 AATTT CATTT CCTTT ATCAG ATTGT GAGTT ATTCC
4271 TGTTA AAATG CTCCC CAGAA TTTCT GGGGA CAGAA
4306 AAATA GGAAG AATTC ATTTC CTAAT CATGC AGATT
4341 TCTAG GAATT CAAAT CCACT GTTGG TTTTA TTTCA
4376 AACCA CAAAA TTAGC ATGCC ATTAA ATACT ATATA
4411 TAAAC AGCCA CTAAA TCAGA TCATT ATCCA TTCAG
4446 CTTCT CCTTC ACTTC TTCTC CTCTA CTTTG GAAAA
4481 AAGGT AAGAA TCTCA GATAT AATTT CAGTG TATCT
4516 GCTAC TCATC TTTAT TTTGG ACTAG GTTAA AATGT
4551 AGAAA GAACA TAATT GCTTA AAATA GATCT TAAAA
4586 ATAAG GGTGT TTAAG ATAAG GTTTA CACTA TTTTC
4621 AGCAG ATATG TTAAA AAATA GAAGT GACTA TAAAG
4656 ACTTG ATAAA AATTA TAGTG ACTGC AAATG TTTTA
4691 GGAAT ATAAT AAGAT ATAAT AACAG TGGTT GCTAT
4726 TTTCT TTAGC ACAAG ACTAG TTAAC AGGCT GTATT
4761 AAAAG ATCTT TTCTT GAATT AAATA TTTTC AATTT
4796 GATTA AACCT ACCTC AGCCA TAAAG GCAAG CACAT
4831 TTCAT TTATA CTATG GGGAT TTGAA TAATT ATTAC
4866 TGAAG AAGCT CTACC AACAA AAAGT TTATA GAGCT
4901 ATCAT ATTTA GTCAA GAGAT AAAGA GGGTT GTTAG
4936 GATAT ATATG CTATT TGAAA GGTAT TTATA AAAGA
4971 AGAGT ATATT TATCA AAATT TCTCA GAACA TCCAA
5006 ATTTC AAGTT TATCA TTTAT CCTAC AGTAT TTCAA
5041 AAATA TTAAA ATAGA TACAT GAAAT ACAGA AGTAA
5076 ATTAA AGAGA AAGTA TTTTA CTTGG TAAAA AAATT
5111 CTAGG TTGGA CAGAG AGTGC CAGGA AACAA AAACA
5146 ATGAA AAATG TGACC TGACA GGAAT TATAG CTCAA
5181 AGTAT AGTAG TAAGT AATGA AATGG CTTAA AAATT
5216 GGTAT ATAAA ATGCT AGTTA TAAAA TAAAC AAAAT
5251 GCAAT AATAT CCTCC CTACA TGTAA TGAAT TCTAG
5286 GTATT ATGCT CTTTT TTGAA GTCTT GACAA TAAAA
5321 ATTTT TTTAG AAGTT TATAG GCATC TTGAA TAAAG
5356 TGAAA CAAAT TAAGA ATTAG TATCC ATGAG AAAAA
5391 TATAG AACAA TTTTC CTAAT TTAGT TTGAA AATCT
5426 GGGAT TGAAG ATGTG TGTCA AGAGA TGTTG GTGGC
5461 AAGAA CATTT TTTTT TCAAG AACTT ATAAA AATGC
5496 AACAA AACAA ACCAT TTAAT ACATT TTGGT CAAAA
5531 TCAAT AATGT ATTTT ATTTT ATGCT CCAAG GAGCA
5566 TAAAA TTGGG GACTG GGCAA GAGAA ACTGA CACCC
5601 TGGTA AATTA CCAAG AGATA AGTAC ACAGT TCTAT
5636 GTAGA GAAAA TAAGC ATAGT GTATG ATCTC TAAAA
5671 TTATG TGAGA CAAAG GAGAG ATGAC ATTAG GCATG
5706 TGGGG ATGAA GACTG AGTAG AGAAG AAACA ATCTA
5741 ATCAG TCCAA GAAAA CATCT CGATC AGTGG AACAA
5776 ATAGA AGAAA TGCTA AAATG AAACA GAAGT CTTAC
5811 TGGAA ATAAA AGATA TGCAT AAGAC AAAAA TTCAT
5846 GAAAA TCACT TAGTT TAGCA GAGAA AAGAT AAAAA
5881 TAAAG TATGA CCTTC TTCAT ATACA TTGTT TGATC
5916 ATATG CACCT CAATA AAACT GAGTC TCCAA CAGAA
5951 ATGAA ACATT AATAT TTTGT TCACT GCTCT AATCC
5986 CAGAA TCTAA GCGAT ATCTG GCAAT AAAAA TAATA
6021 AATAT ATATT TTTTA ATAAA TGAAT CAACC ACTTA
6056 ATTTT TCTGT AAATA TCTGT AACTT CTCTT CTGTC
6091 TTTCC AAAAA CACTC ATAAG TACTG TGAAT GAGAT
6126 GAAAA AGAGT GAAGT AGGAT ATAGG CTGTT AGCAG
6161 AAAAC ATCTG AATGG CTGGC AGTGA AACAT TAACT
6196 TGAAA TGTAA GATTA ATGAG TAATA GTAAA TTTTA
6231 ACCTT GGCCA TATGA TAAAA TGTTC ATTAA TATTT
6266 TTCTA GAATA CAGGG CTTTT TGTTT TTGCC ATGAG
6301 GTTTG CAGGA TCTTG GTTCC CTGAC CAGGG ATCAA
6336 ACCTG CACTC CCCTG GAAGC ATGGA GTCTT GGACA
6371 TTTGT ATTAT ACACT ATCTT TGGTT CCTTT TAAAG
6406 GGAAG TAATT TTACT TAAAT AAGAA AATAG ATTGA
6441 CAAGT AATAC GCTGT TTCCT CATCT TCCCA TTCAC
6476 AGGAA TCGAG AGCCA AGAAG GATCC TCATC CTTGC
6511 CTGTC TGGTG GCTCT GGCCA TTGCA AGAGA GGTAA
6546 ATACA GAAAA AAATG TTGAA ATAAA TAAGA CTAGT
6581 ACTGT CTGCC TATGT GTAGA AATCA CATT