CN108949831A - 一种构建自闭症谱系障碍的小鼠模型的方法 - Google Patents

一种构建自闭症谱系障碍的小鼠模型的方法 Download PDF

Info

Publication number
CN108949831A
CN108949831A CN201810914416.2A CN201810914416A CN108949831A CN 108949831 A CN108949831 A CN 108949831A CN 201810914416 A CN201810914416 A CN 201810914416A CN 108949831 A CN108949831 A CN 108949831A
Authority
CN
China
Prior art keywords
methylation
carrier
mouse model
dna
mouse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810914416.2A
Other languages
English (en)
Other versions
CN108949831B (zh
Inventor
陆宗阳
刘真
黄行许
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201810914416.2A priority Critical patent/CN108949831B/zh
Publication of CN108949831A publication Critical patent/CN108949831A/zh
Application granted granted Critical
Publication of CN108949831B publication Critical patent/CN108949831B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/89Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microinjection
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • A01K2267/0318Animal model for neurodegenerative disease, e.g. non- Alzheimer's

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Environmental Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种构建自闭症谱系障碍的小鼠模型的方法,其特征在于,包括:在小鼠受精卵时期利用胚胎显微注射技术胞浆注射甲基化载体以及靶向MeCP2基因TSS区的gRNA载体,得到自闭症谱系障碍的小鼠模型;其中,所述的甲基化载体含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域。本发明的定点甲基化载体,可以有效实现细胞中的位点特异的甲基化。

Description

一种构建自闭症谱系障碍的小鼠模型的方法
技术领域
本发明涉及一种小鼠体内位点特异甲基化的技术,属于表观基因编辑领域,更具体的说涉及基于CRISPR系统与甲基转移酶融合,并结合胚胎显微注射技术进行在体MeCP2基因特异甲基化来构建自闭症谱系障碍的小鼠模型。该技术同时也可用于模拟和构建因其他基因发育过程中甲基化异常而引起的生理状态变化的小鼠模型,和在体干预表观修饰异常引起的疾病。
背景技术
自闭症谱系障碍(Autism spectrum disorders,ASD)是一类复杂的神经疾病,影响了1.5%的新生儿童。ASD患者有社交障碍,焦虑和重复刻板行为等症状。ASD有很强的遗传因素和临床异质性。超过400个基因被证明与ASD有关。然而,现在没有确定的基因突变能在大多数的ASD病人中被证明1,同时,越来越多的证据表明环境因素在ASD的发病进程中起到重要作用2。例如,同卵双生的两个个体拥有几乎完全相同的基因组序列信息,但在同卵双生患者的ASD病例中,两个个体是否发病和个体之间的发病进程有很大差异,这些结果都暗示了非遗传因素(环境因素)可能在ASD中起到重要作用3。环境因素对ASD影响的可能的作用机制是表观修饰的异常,例如,DNA甲基化和组蛋白甲基化的异常。事实上,ASD的相关基因,例如MeCP2,Fmr1和Shank3等,的DNA甲基化异常已经在ASD病人中被报道4-10
MeCP2编码的甲基化CpG结合蛋白2(methylated CpG-binding protein 2)是可以结合上甲基化的CpG位点的转录抑制因子。MeCP2蛋白的功能丧失或功能获得(Loss orgain of function)性突变都会导致RTT综合征或自闭症。ASD患者通常被诊断带有智力障碍,自闭,发育迟缓等症状。正如我们所说ASD有很强的遗传因素的同时,现在也有越来越多的证据说明表观修饰异常在ASD中具有重要作用。MeCP2启动子区的异常高甲基化和MeCP2蛋白的表达量降低已经在ASD患者的额叶皮层中被检测到7,8。同时,我们利用ASD病人的外周血在,病人中可以观察到MeCP2基因的转录起始位点(transcription start sites,TSS)区域的异常高甲基化。然而,MeCP2基因的甲基化和ASD表型之间的直接因果关系还未被证明和建立。为了达到这一目的和建立甲基化异常导致的自闭症小鼠模型就必须在实现体内位点特异的甲基化。
自从2013年利用CRISPR/Cas9第一次对哺乳动物细胞进行基因编辑以来11,12,基因编辑这个领域被摆到了最显眼的位置。CRISPR/Cas系统是来源于细菌和古细菌免疫系统,由RNA介导的可靶向特异性核苷酸序列的核酸内切酶系统,其中来源为化脓性链球菌的Cas9蛋白(SpCas9)使用最为广泛。RNA介导的Cas9起作用主要依靠gRNA和Cas9蛋白所形成的复合物,Cas9与gRNA复合物首先识别2-4个碱基的protospacer临近模块(protospacer-adjacent motif,PAM)。PAM高度保守地存在于靶向序列的5’端或3’端。一旦复合物结合上PAM,DNA双链打开,与gRNA互补配对,随后发生切割。例如SpCas9就由RuvC和HNH功能域在PAM序列上游第三和第四个碱基之间造成基因组双链断裂。随着断裂基因组的修复,在双链断裂位点会随机丢失或插入碱基,造成开放阅读框移码突变,从而达到敲除基因的目的。失去切割DNA活性的dCas9蛋白保留了与gRNA形成复合物和结合特异性核苷酸序列的能力,dCas9蛋白融合一系列表观修饰因子后可以做为有效操作特异位点表观修饰的工具。2016年陆续有实验室报道利用dCas9进行了体内和体外的定点甲基化和去甲基化13-16。这为我们的研究提供了理论基础。
参考文献
1.Woodbury-Smith,M.&Scherer,S.W.Progress in the genetics of autismspectrum disorder.Dev Med Child Neurol 60,445-451(2018).
2.Pacchierotti,F.&Spano,M.Environmental Impact on DNA Methylation inthe Germline:State of the Art and Gaps of Knowledge.Biomed Res Int 2015,123484(2015).
3.Wong,C.C.et al.Methylomic analysis of monozygotic twins discordantforautism spectrum disorder and related behavioural traits.Mol Psychiatry 19,495-503(2014).
4.Strong,E.et al.Symmetrical Dose-Dependent DNA-Methylation ProfilesinChildren with Deletion or Duplication of 7q11.23.Am J Hum Genet 97,216-27(2015).
5.Elagoz Yuksel,M.,Yuceturk,B.,Karatas,O.F.,Ozen,M.&Dogangun,B.Thealtered promoter methylation of oxytocin receptor gene in autism.JNeurogenet30,280-284(2016).
6.Zhu,L.et al.Epigenetic dysregulation of SHANK3in brain tissues fromindividuals with autism spectrum disorders.Hum Mol Genet 23,1563-78(2014).
7.Nagarajan,R.P,Hogart,A.R.,Gwye,Y.,Martin,M.R.&LaSalle,J.M.ReducedMeCP2 expression isfrequent in autism frontal cortex and correlates withaberrant MECP2 promoter methylation.Epigenetics 1,e1-11(2006).
8.Nagarajan,R.P.et al.MECP2promoter methylation and X chromosomeinactivation in autism.Autism Res 1,169-78(2008).
9.Nichol Edamura,K.&Pearson,C.E.DNA methylation and replication:
implications for the″deletion hotspot″region of FMR1.HumGenet 118,301-4(2005).
10.Stoger,R.,Kajimura,T.M.,Brown,W.T.&Laird,C.D.Epigenetic variationillustrated by DNA methylation pattems of the fragile-X gene FMR1.Hum MolGenet6,1791-801(1997).
11.Cong,L.et al.Multiplex genome engineering using CRISPR/Cassystems.Science 339,819-23(2013).
12.Mali,P.et al.RNA-guided human genome engineering via Cas9.Science339,823-6(2013).
13.Liu,X.S.et al.Editing DNA Methylation in the Mammalian Genome.Cell167,233-247e17(2016).
14.Morita,S.et al.Targeted DNA demethylation in vivo using dCas9-peptide repeat and scFv-TET1 catalytic domain fusions.Nat Biotechnol 34,1060-1065(2016).
15.Vojta,A.et al.Repurposing the CRISPR-Cas9system for targeted DNAmethylation.Nucleic Acids Res 44,5615-28(2016).
16.Xu,X.et al.A CRISPR-based approach for targeted DNAdemethylation.Cell Discov 2,16009(2016).
发明内容
本发明的目的是开发新型定点甲基化工具,利用工具实现小鼠体内定点甲基化,并建立甲基化异常导致的ASD小鼠模型。
为了达到上述目的,本发明提供了一种构建自闭症谱系障碍的小鼠模型的方法,其特征在于,包括:在小鼠受精卵时期利用胚胎显微注射技术胞浆注射甲基化载体以及靶向MeCP2基因TSS区(转录起始区域)的gRNA载体,得到自闭症谱系障碍的小鼠模型;其中,所述的甲基化载体含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域。
优选地,所述的甲基化载体通过将人源DNMT3L和DNMT3A的催化功能域连接至dCas9蛋白N端形成。
优选地,所述的甲基化载体为DNMT3L-DNMT3A-dCas9质粒。
优选地,所述的甲基化载体的序列为SEQ ID NO:11。
优选地,所述的靶向MeCP2基因TSS区的gRNA载体含有至少一条靶向MeCP2基因特异位点的gRNA片段。
优选地,所述的构建自闭症谱系障碍的小鼠模型的方法还包括:在小鼠受精卵时期利用胚胎显微注射技术胞浆注射甲基化对照载体以及靶向MeCP2基因TSS区的gRNA载体,得到自闭症谱系障碍的小鼠对照模型,其中,所述的甲基化对照载体通过突变甲基化载体的DNMT3A催化活性位点得到。
更优选地,所述的甲基化对照载体为DNMT3L-DNMT3Amut-dCas9质粒。
更优选地,所述的甲基化对照载体的序列为SEQ ID NO14。
更优选地,所述的显微注射的条件为20-80ng/μl甲基化载体或甲基化对照载体,5-50ng/μl靶向MeCP2基因TSS区的gRNA载体。
更优选地,所述的显微注射的条件为50ng/μl甲基化载体或甲基化对照载体,25ng/μl靶向MeCP2基因TSS区的gRNA载体。
本发明还提供了一种甲基化载体,其特征在于,含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域。
优选地,所述的甲基化载体的序列为SEQ ID NO:11。
本发明还提供了一种甲基化对照载体,其特征在于,通过突变甲基化载体的DNMT3A催化活性位点得到,所述的甲基化载体含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域。
优选地,所述的甲基化对照载体的序列为SEQ ID NO:14。
本发明还提供了一种载体组合,其特征在于,包括上述的甲基化载体和gRNA载体。
优选地,所述的gRNA载体为靶向MeCP2基因TSS区(转录起始区域)的gRNA载体。
优选地,所述的靶向MeCP2基因TSS区(转录起始区域)的gRNA载体的序列为SEQ IDNO:24。
优选地,所述的载体组合还包括上述的甲基化对照载体。
本发明还提供了上述的甲基化载体或甲基化对照载体在用于构建位点特异甲基化的细胞系中的应用。
本发明还提供了上述的甲基化载体或甲基化对照载体在实现体外细胞中位点特异的甲基化进而研究基因特异位点甲基化后对功能的影响中的应用。
本发明还提供了一种细胞系,其特征在于,其转染了甲基化载体或甲基化对照载体,所述的甲基化载体含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域,所述的甲基化对照载体通过突变甲基化载体的DNMT3A催化活性位点得到。
本发明还提供了一种构建小鼠模型的方法,其特征在于,包括:在小鼠受精卵时期利用胚胎显微注射技术胞浆注射定点甲基化载体以及gRNA载体,得到小鼠模型;其中,所述的定点甲基化载体含有dCas9片段。
优选地,所述的显微注射的条件为20-80ng/μl定点甲基化载体,5-50ng/μl gRNA载体。
更优选地,所述的显微注射的条件为50ng/μl定点甲基化载体,25ng/μl gRNA载体。
优选地,所述的gRNA载体为靶向MeCP2特异位点的gRNA。
本发明还提供了上述的构建小鼠模型的方法在用于构建MeCP2位点特异甲基化引起的ASD的小鼠模型,用于构建其他基因甲基化异常引起的小鼠疾病模型,用于模拟其他基因发育过程中甲基化异常而引起的生理状态变化的小鼠模型中的应用。
本发明还提供了一种实现在体定点甲基化的方法,其特征在于,包括:利用胚胎显微注射技术胞浆注射定点甲基化所用载体,用于在体干预因表观修饰异常引起的疾病。
本发明提供了一种位点特异甲基化的工具及利用该工具建立了MeCP2启动子区甲基化引起自闭症的小鼠模型。
本发明利用dCas9蛋白融合人源甲基转移酶DNMT3A及其配体DNMT3L蛋白,在小鼠受精卵时期通过利用胚胎显微注射技术胞浆注射DNMT3L-DNMT3A-dCas9载体和靶向MeCP2基因TSS区的gRNA,模拟ASD病人,构建了MeCP2甲基化特异性升高导致的ASD小鼠模型。
与现有技术相比,本发明的有益效果是:
1,本发明的定点甲基化载体,可以有效实现细胞中的位点特异的甲基化。
2,本发明的定点甲基化载体,可以有效实现小鼠体内的位点特异的甲基化。
3,本发明的定点甲基化载体具有高准确性,脱靶效应低。
4,本发明的MeCP2甲基化异常引起的ASD小鼠模型,可以有效模拟ASD病人的症状。
5,本发明的MeCP2甲基化异常引起的ASD小鼠模型可以有效提供DNA甲基化对ASD产生具有直接作用的证据。
附图说明
图1为DNMT3L-DNMT3A-dCas9和5U6-gRNA的示意图;
图2为DNMT3L-DNMT3A-dCas9在Neuro-2a细胞中的编辑结果;
(a)实时荧光定量PCR检测N2a细胞中MeCP2的表达量;
(b)MeCP2定点甲基化亚硫酸氢盐测序结果;
图3为MeCP2TSS区附近的gRNA的位置示意图及基因编辑结果;
(a)gRNA在TSS区所在位置;
(b)T7EN1酶切结果;
(c)Sanger测序结果;
图4为DNMT3L-DNMT3A-dCas9在Neuro-2a细胞中编辑后的脱靶效应的分析结果。
(a)简化重亚硫酸盐甲基化测序(RRBS)样本之间相关性分析结果;
(b)检测到的CpG位点甲基化水平图谱;
(c)差异甲基化区域平均甲基化水平结果;
(d)差异甲基化区域甲基化百分比结果;
(e)潜在脱靶位点甲基化水平;
图5为DNMT3L-DNMT3A-dCas9在小鼠体内甲基化结果。
(a)甲基化小鼠MeCP2甲基化比例;
(b)MeCP2定点甲基化亚硫酸氢盐测序结果;
图6为MeCP2TSS区位点特异甲基化小鼠MeCP2表达量降低。
图7为MeCP2TSS区位点特异甲基化小鼠具有ASD行为表型。
(a)三箱实验(阶段二)结果;
(b)三箱实验(阶段三)结果;
(c)旷场实验结果;
(d)十字高架实验结果;
(e)梳毛实验结果;
(f)悬尾实验结果;
(g)新物体识别实验结果;
(h)食物偏好性社交传递实验结果;
具体实施方式
如下通过实施例对本发明做进一步解释说明。所描述的实施例仅用于说明本发明的特征,不因此限制本发明。他人一些非本质替换或改进在本发明的保护范围内。实施例中未注明厂商的试剂或仪器均可通过市场购买获得。未详细注明的实验方法,按照常规条件或试剂厂商推荐的方法实施。
实施例1
1.定点甲基化系统质粒的构建
设计正向引物带有NheI酶切位点及15bp骨架载体同源臂GGGAGACCCAAGCTGGCTAGCACCATGGGACCTAAGAAAAAGAGGAAGGTGGCGGCCGCTGGCGGCAGCATGTTCGAAACCGTGCCTGTG(SEQ ID NO:1),反向引物带有15bp同源臂CCTCTTCTCAGCTGGGTGGCTGCCGCGGGGCACTAGTCCGCTGCTGAAGCTGCGCCCGCTGCTTGAAAAATACTTGAAATATTCT(SEQ ID NO:2),加水溶解至10μM。使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增人源DNMT3L cDNA(来源为用反转录试剂盒(Takara,DRR036A)反转录获得,模板浓度:1ng/μl)。设计正向引物CCAGCTGAGAAGAGGAAGCCC(SEQ ID NO:3),反应引物带有15bp同源臂TAGAGTATTTCTTGTCGCTCTCGGGGGTGGCGCTCTCGCTGGTACCGGGGGTCTCGCTGCCGCT(SEQ ID NO:4),加水溶解至10μM。使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增人源DNMT3A cDNA(来源为用反转录试剂盒(Takara,DRR036A)反转录获得,模板浓度:1ng/μl)。反转录体系,扩增体系和PCR反应条件如下示:
PCR反应条件:37℃15min-----85℃5S-----4℃hold。总RNA用Trizol提取HEK 293细胞(ATCC,CRL-12108)得到。
PCR扩增产物经通过AxyPrep PCR Clean-up试剂盒(Axygen,AP-PCR-500G)纯化回收。
以1μg的pST1374-Cas9-N-NLS-flag-linker载体(Addgene ID:44758)为模板用NheI(NEB,R0131S),buffer为10xCutsmart buffer(NEB,B7200S)作酶切37℃孵育1h。酶切体系如下:
酶切产物用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)纯化回收。
PCR回收产物和酶切回收产物混合后用重组试剂盒(Vazyme,C215-02)构建载体,重组体系如下:
重组反应即为将重组体系放于37℃孵育30-60min,转化涂板,经Sanger测序得到正确的pSt1374-N-NLS-DNMT3L-L-DNMT3A-L-cas9-NLS质粒。
设计正向引物GGACTGGCTATCGGGACAAACTCCGTTGGCTG(SEQ ID NO:5),反向引物CCCGATAGCCAGTCCAATAGAGTATTTCTTG(SEQ ID NO:6),加水溶解至10μM。使用诺唯赞点突变试剂盒(Vazyme,C214-01)突变D10A位点。设计正向引物CGTGGACGCTATTGTTCCACAGTCCTTCCTCAA(SEQ ID:7),反向引物ACAATAGCGTCCACGTCATAATCGGACAGCCG(SEQ ID:8),加水溶解至10μM。使用诺唯赞点突变试剂盒(Vazyme,C214-01)突变H840A位点。设计正向引物GATAAGGCCCGCGGTAAGTCTGACAATGTTCC(SEQ ID:9),反向引物CCGCGGGCCTTATCGGATCTGGTCAGCACCTTGTT(SEQ ID:10),加水溶解至10μM。使用诺唯赞点突变试剂盒(Vazyme,C214-01)突变H863A位点。反应体系如下:
PCR完成后,进行扩增产物Dpn I(NEB,R0176S)消化,去除甲基化模板质粒,反应体系如下:
将反应体系置于37℃孵育1-2h。之后进行重组反应(Vazyme,C215-01/02),反应体系如下:
重组反应即为将重组体系放于37℃孵育30-60min,转化涂板,经Sanger测序得到正确的pSt1374-N-NLS-DNMT3L-L-DNMT3A-L-dcas9-NLS质粒(又称DNMT3L-DNMT3A-dCas9质粒),序列信息见附录序列表SEQ ID NO:11。
设计正向引物GCAGTCCCTCCAATGACCTCTCCATCGTCAACCCTGCTCG(SEQ ID NO:12),反向引物TCATTGGAGGGACTGCCCCCAATCACCAGATCGAAT(SEQ ID NO:13),加水溶解至10μM。使用诺唯赞点突变试剂盒(Vazyme,C214-01)突变DNMT3A催化活性位点。反应体系如下:
PCR完成后,进行扩增产物Dpn I消化,去除甲基化模板质粒,反应体系如下:
将反应体系置于37℃孵育1-2h。之后进行重组反应,反应体系如下:
重组反应即为将重组体系放于37℃孵育30-60min,转化涂板,经Sanger测序得到正确的pSt1374-N-NLS-DNMT3L-L-DNMT3Amut-L-dCas9-NLS质粒(又称DNMT3L-DNMT3Amut-dCas9质粒),序列信息见附录序列表SEQ ID NO:14。
设计构建5U6载体的引物,片段1正向引物:ATGCGTCTCAACCGCAGGAGTTCCTGTCTGTTTGTTTTAGAGCTAGAAATAGCAAG(SEQ ID NO:15),片段1反向引物ATGCGTCTCGTAAAACACCAGCCTGTGTGCTGCTGCGGTGTTTCGTCCTTTCCACAAG(SEQ ID NO:16),片段2正向引物ATGCGTCTCATTTAGAGCTAGAAATAGCAAGTTAAAATAAG(SEQ ID NO:17),片段2反向引物:ATGCGTCTCGGCTCTAAAACTCTCTCCGAGAGGAGGGAGCGGTGTTTCGTCCTTTCCACAAG(SEQ ID NO:18),片段3正向引物:ATGCGTCTCAGAGCTAGAAATAGCAAGTTAAAATAAGGC,片段3反向引物:ATGCGTCTCGTCTAGCTCTAAAACCGGCCTTGGCGGTCCCACTCGGTGTTTCGTCCTTTCCACAAG(SEQ ID NO:19),片段4正向引物:ATGCGTCTCATAGAAATAGCAAGTTAAAATAAGGCTAG(SEQ ID NO:20),片段4反向引物:ATGCGTCTCGAAACCCGGTGGTGGCTTTCTCCACGGTGTTTCGTCCTTTCCACAAG(SEQ ID NO:21)。使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增载体pUC57kan-T7-gRNA-U6(由华大基因按照常规方法合成,或者获得自Addgene,115520)。载体pUC57kan-T7-gRNA-U6序列信息见附录序列表SEQ ID NO:23。扩增体系和PCR反应条件如下所示:
PCR扩增产物经通过AxyPrep PCR Clean-up试剂盒(Axygen,AP-PCR-500G)纯化回收,共4个片段。以pGL3-U6-ccdB-EF1a-Puromycin载体(由华大基因按照常规方法合成,或者获得自Addgene,115519)为骨架,T4连接酶及其buffer(NEB,M0202L)和ESP3I酶(Life,ER0452)配置切连体系,体系如下:
反应程序:(37℃5min-----16℃10min)*10cycle-----37℃15min-----80℃15min-----4℃hold。得到的产物取1μl转化涂板,经Sanger测序得到正确的pGL3-5U6-gRNA质粒(又称5U6-gRNA质粒)序列信息见附录序列表SEQ ID NO:24。pGL3-U6-ccdB-EF1a-Puromycin质粒序列信息见附录序列表SEQ ID NO:25。DNMT3L-DNMT3A-dCas9和5U6-gRNA的示意图如图1所示。
2.细胞内定点甲基化MeCP2基因
利用上述的甲基化系统转染Neuro-2a(N2a)细胞,过程如下:
1)Neuro-2a细胞(来自ATCC)复苏在10cm培养皿(Coming,430167)中培养,培养基为含有10%胎牛血清(HyClone,SV30087)的DMEM(HyClone,SH30243.01)。放于37℃恒温培养箱培养,培养箱内二氧化碳浓度为5%。当细胞密度达到50-80%时,细胞分盘至6孔板。
2)当每个孔中细胞密度为50%时,用含10%胎牛血清的DMEM培养基换液,培养2小时后,当细胞状态达到最佳时进行转染。每孔转染的质粒量分别是DNMT3L-DNMT3A-dCas9质粒和DNMT3L-DNMT3Amut-dCas9质粒2μg,5U6-gRNA质粒1μg。将质粒混入100μl的Opti-MEM(Gibco,11058021)培养基中,静置待用。
3)将6μl的Lipofectamine 2000转染试剂(Thermo,11668019)混入100μl的Opti-MEM培养基,静置5分钟。
4)将混有质粒的Opti-MEM加入混有Lipofectamine 2000的Opti-MEM,慢速吹打混匀,静置20分钟。
5)将混匀静置后的200μl液体加入6孔板中。
6)转染6小时后用含有10%胎牛血清的DMEM培养液换液。
7)转染24小时后,用终浓度为2μg/ml的Puromycin(InvivoGen,nt-pr-1)做药杀处理。
8)转染72小时后收细胞,部分细胞用酚氯仿法抽取基因组DNA,部分细胞用Trizol提取总RNA。
抽取的总RNA(Takara,RR047A)按照试剂盒操作方法反转录为cDNA,cDNA做为qPCR模板来检测MeCP2的表达量,qPCR引物序列见附录序列表SEQ ID:24-27所示(SEQ ID:26-27为GAPDH定量引物,SEQ ID:28-29为MeCP2定量引物)。用诺唯赞qPCR试剂盒(Q331-03)检测MeCP2的表达量。qPCR反应体系如下:
酚氯仿抽提得到的基因组DNA用亚硫酸氢盐转化试剂盒(QIAGEN,59104)进行转化。反应体系和反应程序如下:
转化后的DNA用亚硫酸氢盐转化试剂盒(QIAGEN,59104)回收,以回收后的产物为模板,进行亚硫酸氢盐PCR(BSP),PCR引物序列见附录序列表SEQ ID:28-32所示(SEQ IDNO:30为BSP上游引物1,SEQ ID NO:31为BSP下游引物1,SEQ ID NO:32为BSP上游引物2,SEQID NO:33为BSP上游引物2,SEQ ID NO:34为BSP下游引物2)。用Takara Taq酶和10xbuffer(Takara,R007B)PCR扩增位点特异甲基化靶位点。PCR反应体系和程序如下所示:
PCR产物用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)。回收后的产物连接入pMD-19T载体(Takara,6013)中,连接步骤为:将纯化后的PCR产物,与T载体混合,再与Solution 1(Takara,6013)混合,冰上静置30min后转化。
送至少10个以上阳性单克隆做Sanger测序,表达量结果和BSP结果如图2所示。
3.MeCP2TSS区附近的gRNA的位置示意图及基因编辑结果
为了获得本发明所使用的gRNA的基因编辑能力,设计了每条gRNA对应的20个碱基互补配对的上下游引物,加水溶解至100μM。用10x buffer 2(NEB,B7002S),引物和水配成退火体系。经退火后连接进入pGL3-U6-sgRNA(Addgene,51133)载体的BsaI(NEB,R0535S)酶切位点上,以构建特异性gRNA表达载体。gRNA的引物序列及gRNA序列见附录序列表SEQ IDNO:33-47所示(SEQ ID NO:35和36为MeCP2sgRNA1的正义链和反义链退火引物,SEQ ID NO:37和38为MeCP2sgRNA2的正义链和反义链退火引物,SEQ ID NO:39和40为MeCP2sgRNA3的正义链和反义链退火引物,SEQ ID NO:41和42为MeCP2sgRNA4的正义链和反义链退火引物,SEQ ID NO:43和44为MeCP2sgRNA5的正义链和反义链退火引物,SEQ ID NO:45和49分别为MeCP2sg1-5的序列)。退火体系和退火程序如下所示:
利用限制性内切酶BsaI(NEB,R0535S)对pGL3-U6-sgRNA(Addgene,51133)质粒进行酶切以得到线性化gRNA载体。酶切体系如下所示:
酶切产物用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)。回收后的产物连接入pMD-19T载体(Takara,6013)中,连接步骤如下:
将纯化后的PCR产物,同T载体混合,再与Solution 1混合,冰上静置30min后转化。
送至少10个以上阳性单克隆做Sanger测序。
MeCP2TSS区所用gRNA切割效率如图3所示,所用PCR引物序列见附录序列表SEQID:50-51所示(SEQ ID:50和51分别为PCR产物的上游和下游引物),图3中对比所用的序列范围见附录列表SEQ ID:52-56(SEQ ID:52-56分别为图3中MeCP2sg1-5对比时展示序列)。
4.MeCP2小鼠体内甲基化编辑
为了获得甲基化系统在MeCP2基因上编辑后的脱靶效应,本发明利用限制性代表区域甲基化测序(RRBS)对所选的5条gRNA对应预测脱靶位点所在100bp范围的区域进行了甲基化水平分析。RRBS可以检测到131个预测脱靶位点序列,其中有3个位点的甲基化水平略有上升(99.7%vs 93.81%,99.55%vs96.13%和3.29%vs 0.16%)。图4中代表性结果序列信息见附录序列表SEQ ID NO:57-96(SEQ ID NO:57-64为MeCP2sgl的代表脱靶位点序列,SEQ ID NO:65-72为MeCP2sg2的代表脱靶位点序列,74-80为MeCP2sg3的代表脱靶位点序列,81-88为MeCP2sg4的代表脱靶位点序列,89-96为MeCP2sg4的代表脱靶位点序列)。因此,本发明的甲基化系统脱靶效率低。
5.MeCP2小鼠体内甲基化编辑
利用“定点甲基化系统质粒的构建”所述系统进行胚胎显微注射,过程如下:
1)超排4周C57BL/6母鼠后与C57BL/6雄鼠合笼交配。0.5天后,取母鼠输卵管,收集受精的卵子。
2)将终浓度为50ng/ul的pSt1374-N-NLS-DNMT3L-L-DNMT3AL-dCas9-NLS载体(即pSt1374-N-NLS-DNMT3L-L-DNMT3A-L-dcas9-NLS质粒)和25ng/ul的pGL3-5U6-gRNA载体的混合液进行胞浆注射进入一细胞胚胎中。
3)注射后的胚胎培养于KSOM(Merck,MR-106-D)中,能正常发育至二细胞期的胚胎移植如代孕ICR母鼠输卵管内。
4)小鼠出生后进行编号。
酚氯仿抽提得到的鼠尾基因组DNA用亚硫酸氢盐转化试剂盒(QIAGEN,59104)进行转化。反应体系和反应程序如下:
转化后的DNA用亚硫酸氢盐转化试剂盒(QIAGEN,59104)回收,以回收后的产物为模板,进行亚硫酸氢盐PCR(BSP),PCR引物序列见附录序列表SEQ ID:28-32所示(SEQ IDNO:30为BSP上游引物1,SEQ ID NO:31为BSP下游引物1,SEQ ID NO:32为BSP上游引物2,SEQID NO:33为BSP上游引物2,SEQ ID NO:34为BSP下游引物2)。用TakaraTaq酶和10xbuffer(Takara,R007B)PCR扩增位点特异甲基化靶位点。PCR反应体系和程序如下所示:
PCR产物用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)。回收后的产物连接入pMD-19T载体(Takara,6013)中,连接步骤为:将纯化后的PCR产物,与T载体混合,再与Solution 1(Takara,6013)混合,冰上静置30min后转化。
送至少10个以上阳性单克隆做Sanger测序,表达量结果和BSP结果如图5所示。图5.胚胎显微注射小鼠甲基化测序分析。(a)雄鼠鼠尾甲基化水平,Treatment为甲基化组,Control为对照组;(b)代表性的MeCP2DNA甲基化小鼠的DNA甲基化模式,Treatment为甲基化组,Control为对照组。
取出生后8周小鼠的海马组织,将组织取出,放在1.5ml EP管中,使用组织匀浆机使其均匀。预冷的PBS洗三次。按1ml裂解液加10μlPMSF(100mM),摇匀置于冰上。(PMSF要摇匀至无结晶时才可与裂解液混合)。一个样加400ul的混合裂解液,冰上30min,为使细胞充分裂解培养瓶要经常来回摇动。消化后12000xg,5min,4℃,取上清,-80℃储存。用提取出蛋白跑SDS-PAGE胶,80V电压30分钟,后120V电压60分钟。跑好的胶转膜到PDVF膜,条件为恒流250A,90分钟。转膜完成后,5%脱脂牛奶封闭1小时,TBST漂洗3次,每次5-10分钟,MeCP2(Cell Signaling,3456T)一抗1∶10004℃过夜,第二天TBST漂洗3次,每次5-10分钟,加(1∶5000)稀释于5%脱脂奶粉中的二抗(ABclonal,AS014_100u1)室温孵育2小时,TBST漂洗3次,每次5-10分钟。孵育好的PVDF膜用超敏显色液(Merck/Millipore,WBKLS0100)显色,检测蛋白表达程度。图6.胚胎显微注射小鼠MeCP2表达量检测分析。13#和34#为甲基化小鼠,Control为对照小鼠。
6.MeCP2甲基化小鼠具有ASD表型
MeCP2缺陷的小鼠具有明显的ASD症状,例如社交障碍,重复刻板行为和焦虑等。为了确认MeCP2甲基化的小鼠是否也有类似症状,从一系列行为学实验分析了MeCP2甲基化小鼠的表型。分析结果如图7所示,(a-b)三箱实验结果结果,(a)三箱实验phase 2行为结果,(b)三箱实验phase 3行为结果;(c)旷场行为结果;(d)十字高架行为结果;(e)梳毛实验结果;(f)悬尾实验结果;(g)新物体识别实验结果,左边为新旧物体识别时间百分比,右边为新旧物体识别时间;(h)食物偏好性社交传递实验结果,左边为食物摄入重量,右边为不同食物摄入百分比。在三箱实验中,MeCP2甲基化小鼠对陌生小鼠显示较少的兴趣,倾向于靠近熟悉的小鼠,P值小于0.01和P值小于0.001;在梳毛实验中,MeCP2甲基化小鼠呈现出更多的重复刻板行为,P值小于0.01;在高架十字迷宫实验中,MeCP2甲基化小鼠在开臂中时间比对照组小鼠少,提示实验组小鼠呈现焦虑行为,P值小于0.01;在旷场实验中,MeCP2甲基化小鼠总运动距离减少,运动能力降低,P值小于0.05;在新物体识别实验中,MeCP2甲基化小鼠显示记忆能力更强,P值小于0.01;在食物偏好性社会传递实验(STFP)中,MeCP2甲基化小鼠缺失对肉桂(Cin)和可可粉(Coc)的偏好性,提示社交能力降低,P值小于0.01和P值小于0.001。以上所有实验证明了MeCP2甲基化小鼠具有ASD表型。
以上所述仅为本发明较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 上海科技大学
<120> 一种构建自闭症谱系障碍的小鼠模型的方法
<130> 1
<160> 96
<170> SIPOSequenceListing 1.0
<210> 1
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 1
gggagaccca agctggctag caccatggga cctaagaaaa agaggaaggt ggcggccgct 60
ggcggcagca tgttcgaaac cgtgcctgtg 90
<210> 2
<211> 85
<212> DNA
<213> Artificial Sequence
<400> 2
cctcttctca gctgggtggc tgccgcgggg cactagtccg ctgctgaagc tgcgcccgct 60
gcttgaaaaa tacttgaaat attct 85
<210> 3
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 3
ccagctgaga agaggaagcc c 21
<210> 4
<211> 64
<212> DNA
<213> Artificial Sequence
<400> 4
tagagtattt cttgtcgctc tcgggggtgg cgctctcgct ggtaccgggg gtctcgctgc 60
cgct 64
<210> 5
<211> 32
<212> DNA
<213> Artificial Sequence
<400> 5
ggactggcta tcgggacaaa ctccgttggc tg 32
<210> 6
<211> 31
<212> DNA
<213> Artificial Sequence
<400> 6
cccgatagcc agtccaatag agtatttctt g 31
<210> 7
<211> 33
<212> DNA
<213> Artificial Sequence
<400> 7
cgtggacgct attgttccac agtccttcct caa 33
<210> 8
<211> 32
<212> DNA
<213> Artificial Sequence
<400> 8
acaatagcgt ccacgtcata atcggacagc cg 32
<210> 9
<211> 32
<212> DNA
<213> Artificial Sequence
<400> 9
gataaggccc gcggtaagtc tgacaatgtt cc 32
<210> 10
<211> 35
<212> DNA
<213> Artificial Sequence
<400> 10
ccgcgggcct tatcggatct ggtcagcacc ttgtt 35
<210> 11
<211> 10818
<212> DNA
<213> Artificial Sequence
<400> 11
gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
accatgggac ctaagaaaaa gaggaaggtg gcggccgctg gcggcagcat gttcgaaacc 960
gtgcctgtgt ggaggagaca gccagtccgg gtgctgtccc tttttgaaga catcaagaaa 1020
gagctgacga gtttgggctt tttggaaagt ggttctgacc cgggacaact gaagcatgtg 1080
gttgatgtca cagacacagt gaggaaggat gtggaggagt ggggaccctt cgatcttgtg 1140
tacggcgcca cacctcccct gggccacacc tgtgaccgtc ctcccagctg gtacctgttc 1200
cagttccacc ggctcctgca gtacgcacgg cccaagccag gcagccccag gcccttcttc 1260
tggatgttcg tggacaatct ggtgctgaac aaggaagacc tggacgtcgc atctcgcttc 1320
ctggagatgg agccagtcac catcccagat gtccacggcg gatccttgca gaatgctgtc 1380
cgcgtgtgga gcaacatccc agccataagg agcagcaggc actgggctct ggtttcggaa 1440
gaagaattgt ccctgctggc ccagaacaag cagagctcga agctcgcggc caagtggccc 1500
accaagctgg tgaagaactg ctttctcccc ctaagagaat atttcaagta tttttcaagc 1560
agcgggcgca gcttcagcag cggactagtg ccccgcggca gccacccagc tgagaagagg 1620
aagcccatcc gggtgctgtc tctctttgat ggaatcgcta cagggctcct ggtgctgaag 1680
gacttgggca ttcaggtgga ccgctacatt gcctcggagg tgtgtgagga ctccatcacg 1740
gtgggcatgg tgcggcacca ggggaagatc atgtacgtcg gggacgtccg cagcgtcaca 1800
cagaagcata tccaggagtg gggcccattc gatctggtga ttgggggcag tccctgcaat 1860
gacctctcca tcgtcaaccc tgctcgcaag ggcctctacg agggcactgg ccggctcttc 1920
tttgagttct accgcctcct gcatgatgcg cggcccaagg agggagatga tcgccccttc 1980
ttctggctct ttgagaatgt ggtggccatg ggcgttagtg acaagaggga catctcgcga 2040
tttctcgagt ccaaccctgt gatgattgat gccaaagaag tgtcagctgc acacagggcc 2100
cgctacttct ggggtaacct tcccggtatg aacaggccgt tggcatccac tgtgaatgat 2160
aagctggagc tgcaggagtg tctggagcat ggcaggatag ccaagttcag caaagtgagg 2220
accattacta cgaggtcaaa ctccataaag cagggcaaag accagcattt tcctgtcttc 2280
atgaatgaga aagaggacat cttatggtgc actgaaatgg aaagggtatt tggtttccca 2340
gtccactata ctgacgtctc caacatgagc cgcttggcga ggcagagact gctgggccgg 2400
tcatggagcg tgccagtcat ccgccacctc ttcgctccgc tgaaggagta ttttgcgtgt 2460
gtgagcggca gcgagacccc cggtaccagc gagagcgcca cccccgagag cgacaagaaa 2520
tactctattg gactggctat cgggacaaac tccgttggct gggccgtcat aaccgacgag 2580
tataaggtgc caagcaagaa attcaaggtg ctgggtaata ctgaccgcca ttcaatcaag 2640
aagaacctga tcggagcact cctcttcgac tccggtgaaa ccgctgaagc tactcggctg 2700
aagcggaccg caaggcggag atacacccgc cgcaagaatc ggatatgtta tctgcaagag 2760
atctttagca acgaaatggc taaggtggac gactccttct ttcaccgcct ggaagagagc 2820
tttctggtgg aggaggataa gaaacacgag aggcacccta tattcggaaa tatcgtggat 2880
gaggtggctt accatgaaaa gtatcctaca atctaccatc tgaggaagaa gctggtggac 2940
agcaccgata aagcagacct gaggctcatc tatctggccc tggctcatat gataaagttt 3000
agaggacact ttctgatcga gggcgacctg aatcccgata attccgatgt ggataaactc 3060
ttcattcaac tggtgcagac atataaccaa ctgttcgagg agaatcccat aaacgcttct 3120
ggtgtggatg ccaaggctat tctgtccgct cggctgtcca agtcacgcag actggagaat 3180
ctgattgccc aactgccagg agaaaagaag aacggcctgt ttgggaacct catcgccctg 3240
agcctgggcc tgacacctaa cttcaagtcc aattttgatc tggccgaaga tgctaaactc 3300
cagctctcca aggacaccta tgacgatgat ctggacaacc tgctcgcaca gataggcgac 3360
cagtacgccg atctctttct ggctgctaag aatctctccg acgccattct gctgagcgac 3420
atactccggg tcaacactga gatcaccaaa gcacctctga gcgcctccat gataaaacgc 3480
tatgatgaac accatcaaga cctgactctg ctcaaagccc tcgtgaggca acagctgcca 3540
gagaagtaca aagagatatt cttcgaccag agcaagaatg gatatgccgg atacatcgat 3600
ggcggagcat cacaggaaga attttacaag ttcatcaaac caatcctcga gaagatggac 3660
ggtactgaag agctgctggt gaagctgaac agggaggacc tgctgaggaa gcagaggacc 3720
tttgataatg gctccattcc acatcagata cacctgggag agctgcatgc aatcctccgc 3780
aggcaggagg atttctatcc tttcctgaag gataaccggg agaagataga gaagatcctg 3840
accttcagga tcccttatta cgtcggccct ctggctagag gcaactcccg cttcgcttgg 3900
atgaccagga aatctgagga gacaattact ccttggaact tcgaagaggt cgtggataag 3960
ggcgcaagcg cccagtcatt catcgaacgg atgaccaatt tcgataagaa cctgccaaac 4020
gagaaggtcc tgcccaaaca ttcactcctg tacgagtatt tcaccgtcta taacgagctg 4080
actaaagtga agtacgtgac cgagggcatg aggaagcctg ccttcctgtc cggagagcag 4140
aagaaggcta tcgttgatct gctcttcaag actaatagaa aggtgacagt gaagcagctc 4200
aaggaggatt actttaagaa gatcgaatgc tttgactcag tggaaatctc tggcgtggag 4260
gaccgcttta atgccagcct gggcacttac catgatctgc tgaagataat caaagacaaa 4320
gatttcctcg ataatgagga gaacgaggac atcctggaag atatcgtgct gaccctgact 4380
ctgttcgagg atagagagat gatcgaagag cgcctgaaga cctatgccca tctgtttgac 4440
gataaagtca tgaaacagct caagcggcgg cgctacactg ggtggggtag actctccagg 4500
aaactcataa acggcatccg cgacaaacag agcggaaaga ccatcctgga tttcctgaaa 4560
tccgacggat tcgctaacag gaacttcatg caactgattc acgatgactc tctgacattt 4620
aaagaggaca tccagaaggc acaggtgagc ggtcaaggcg acagcctgca cgagcacatc 4680
gccaacctcg ctggatcacc cgccataaag aagggaatac tgcagacagt caaggtcgtg 4740
gacgaactcg tcaaagtgat gggtcggcac aagccagaga atatcgttat cgaaatggca 4800
agggagaacc aaaccaccca gaagggccag aagaactctc gggaacggat gaaaagaatc 4860
gaagagggaa ttaaggagct gggatctcag atactgaagg agcaccctgt ggagaataca 4920
cagctccaga acgagaaact ctacctgtac tacctccaga acgggcggga catgtacgtt 4980
gaccaggaac tcgacatcaa ccggctgtcc gattatgacg tggacgctat tgttccacag 5040
tccttcctca aagatgactc cattgacaac aaggtgctga ccagatccga taaggcccgc 5100
ggtaagtctg acaatgttcc atcagaagag gtggtcaaga agatgaagaa ttactggcgg 5160
cagctcctca acgccaaact gatcacccag cggaagtttg acaatctgac taaggcagaa 5220
agaggaggtc tgagcgaact cgacaaggcc ggctttatta agaggcaact ggtcgaaaca 5280
cgccagatta ccaaacacgt ggcacaaatc ctcgactcta ggatgaacac taagtacgat 5340
gagaacgata agctgatcag ggaagtgaaa gtgataactc tgaagagcaa gctggtgtct 5400
gacttccgga aggactttca attctacaaa gttcgcgaaa taaacaatta ccatcatgct 5460
cacgatgcct atctcaatgc tgtcgttggc accgccctga tcaagaaata ccctaaactg 5520
gagtctgagt tcgtgtacgg tgactataaa gtctacgatg tgaggaagat gatagcaaag 5580
tctgagcaag agattggcaa agccaccgcc aagtacttct tctactctaa tatcatgaat 5640
ttctttaaga ctgagataac cctggctaac ggcgaaatcc ggaagcgccc actgatcgaa 5700
acaaacggag aaacaggaga aatcgtgtgg gataaaggca gggacttcgc aactgtgcgg 5760
aaggtgctgt ccatgccaca agtcaatatc gtgaagaaga ccgaagtgca gaccggcgga 5820
ttctcaaagg agagcatcct gccaaagcgg aactctgaca agctgatcgc caggaagaaa 5880
gattgggacc caaagaagta tggcggtttc gattccccta cagtggctta ttccgttctg 5940
gtcgtggcaa aagtggagaa aggcaagtcc aagaaactca agtctgttaa ggagctgctc 6000
ggaattacta ttatggagag atccagcttc gagaagaatc caatcgattt cctggaagct 6060
aagggctata aagaagtgaa gaaagatctc atcatcaaac tgcccaagta ctctctcttt 6120
gagctggaga atggtaggaa gcggatgctg gcctccgccg gagagctgca gaaaggaaac 6180
gagctggctc tgccctccaa atacgtgaac ttcctgtatc tggcctccca ctacgagaaa 6240
ctcaaaggta gccctgaaga caatgagcag aagcaactct ttgttgagca acataaacac 6300
tacctggacg aaatcattga acagattagc gagttcagca agcgggttat tctggccgat 6360
gcaaacctcg ataaagtgct gagcgcatat aataagcaca gggacaagcc aattcgcgaa 6420
caagcagaga atattatcca cctctttact ctgactaatc tgggcgctcc tgctgccttc 6480
aagtatttcg atacaactat tgacaggaag cggtacacct ctaccaaaga agttctcgat 6540
gccaccctga tacaccagtc aattaccgga ctgtacgaga ctcgcatcga cctgtctcag 6600
ctcggcggcg acggttctcc caagaagaag aggaaagtct cgagcggtgg agctgcagga 6660
taggaattcg ggcccttcga aggtaagcct atccctaacc ctctcctcgg tctcgattct 6720
acgcgtaccg gtcatcatca ccatcaccat tgagtttaaa cccgctgatc agcctcgact 6780
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 6840
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 6900
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 6960
gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcttctga ggcggaaaga 7020
accagctggg gctctagggg gtatccccac gcgccctgta gcggcgcatt aagcgcggcg 7080
ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct 7140
ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat 7200
cggggcatcc ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt 7260
gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg 7320
acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac 7380
cctatctcgg tctattcttt tgatttataa gggattttgg ggatttcggc ctattggtta 7440
aaaaatgagc tgatttaaca aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt 7500
tagggtgtgg aaagtcccca ggctccccag gcaggcagaa gtatgcaaag catgcatctc 7560
aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa 7620
agcatgcatc tcaattagtc agcaaccata gtcccgcccc taactccgcc catcccgccc 7680
ctaactccgc ccagttccgc ccattctccg ccccatggct gactaatttt ttttatttat 7740
gcagaggccg aggccgcctc tgcctctgag ctattccaga agtagtgagg aggctttttt 7800
ggaggcctag gcttttgcaa aaagctcccg ggagcttgta tatccatttt cggatctgat 7860
cagcacgtgt tgacaattaa tcatcggcat agtatatcgg catagtataa tacgacaagg 7920
tgaggaacta aaccatggcc aagcctttgt ctcaagaaga atccaccctc attgaaagag 7980
caacggctac aatcaacagc atccccatct ctgaagacta cagcgtcgcc agcgcagctc 8040
tctctagcga cggccgcatc ttcactggtg tcaatgtata tcattttact gggggacctt 8100
gtgcagaact cgtggtgctg ggcactgctg ctgctgcggc agctggcaac ctgacttgta 8160
tcgtcgcgat cggaaatgag aacaggggca tcttgagccc ctgcggacgg tgtcgacagg 8220
tgcttctcga tctgcatcct gggatcaaag cgatagtgaa ggacagtgat ggacagccga 8280
cggcagttgg gattcgtgaa ttgctgccct ctggttatgt gtgggagggc taagcacttc 8340
gtggccgagg agcaggactg acacgtgcta cgagatttcg attccaccgc cgccttctat 8400
gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg 8460
gatctcatgc tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac 8520
aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt 8580
tgtggtttgt ccaaactcat caatgtatct tatcatgtct gtataccgtc gacctctagc 8640
tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 8700
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 8760
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 8820
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 8880
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 8940
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 9000
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 9060
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 9120
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 9180
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 9240
agcgtggcgc tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 9300
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 9360
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 9420
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 9480
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 9540
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 9600
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 9660
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 9720
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 9780
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 9840
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 9900
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 9960
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 10020
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 10080
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 10140
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 10200
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 10260
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 10320
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 10380
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 10440
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 10500
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 10560
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 10620
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 10680
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 10740
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 10800
aaagtgccac ctgacgtc 10818
<210> 12
<211> 40
<212> DNA
<213> Artificial Sequence
<400> 12
gcagtccctc caatgacctc tccatcgtca accctgctcg 40
<210> 13
<211> 36
<212> DNA
<213> Artificial Sequence
<400> 13
tcattggagg gactgccccc aatcaccaga tcgaat 36
<210> 14
<211> 10818
<212> DNA
<213> Artificial Sequence
<400> 14
gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
accatgggac ctaagaaaaa gaggaaggtg gcggccgctg gcggcagcat gttcgaaacc 960
gtgcctgtgt ggaggagaca gccagtccgg gtgctgtccc tttttgaaga catcaagaaa 1020
gagctgacga gtttgggctt tttggaaagt ggttctgacc cgggacaact gaagcatgtg 1080
gttgatgtca cagacacagt gaggaaggat gtggaggagt ggggaccctt cgatcttgtg 1140
tacggcgcca cacctcccct gggccacacc tgtgaccgtc ctcccagctg gtacctgttc 1200
cagttccacc ggctcctgca gtacgcacgg cccaagccag gcagccccag gcccttcttc 1260
tggatgttcg tggacaatct ggtgctgaac aaggaagacc tggacgtcgc atctcgcttc 1320
ctggagatgg agccagtcac catcccagat gtccacggcg gatccttgca gaatgctgtc 1380
cgcgtgtgga gcaacatccc agccataagg agcagcaggc actgggctct ggtttcggaa 1440
gaagaattgt ccctgctggc ccagaacaag cagagctcga agctcgcggc caagtggccc 1500
accaagctgg tgaagaactg ctttctcccc ctaagagaat atttcaagta tttttcaagc 1560
agcgggcgca gcttcagcag cggactagtg ccccgcggca gccacccagc tgagaagagg 1620
aagcccatcc gggtgctgtc tctctttgat ggaatcgcta cagggctcct ggtgctgaag 1680
gacttgggca ttcaggtgga ccgctacatt gcctcggagg tgtgtgagga ctccatcacg 1740
gtgggcatgg tgcggcacca ggggaagatc atgtacgtcg gggacgtccg cagcgtcaca 1800
cagaagcata tccaggagtg gggcccattc gatctggtga ttgggggcag tccctccaat 1860
gacctctcca tcgtcaaccc tgctcgcaag ggcctctacg agggcactgg ccggctcttc 1920
tttgagttct accgcctcct gcatgatgcg cggcccaagg agggagatga tcgccccttc 1980
ttctggctct ttgagaatgt ggtggccatg ggcgttagtg acaagaggga catctcgcga 2040
tttctcgagt ccaaccctgt gatgattgat gccaaagaag tgtcagctgc acacagggcc 2100
cgctacttct ggggtaacct tcccggtatg aacaggccgt tggcatccac tgtgaatgat 2160
aagctggagc tgcaggagtg tctggagcat ggcaggatag ccaagttcag caaagtgagg 2220
accattacta cgaggtcaaa ctccataaag cagggcaaag accagcattt tcctgtcttc 2280
atgaatgaga aagaggacat cttatggtgc actgaaatgg aaagggtatt tggtttccca 2340
gtccactata ctgacgtctc caacatgagc cgcttggcga ggcagagact gctgggccgg 2400
tcatggagcg tgccagtcat ccgccacctc ttcgctccgc tgaaggagta ttttgcgtgt 2460
gtgagcggca gcgagacccc cggtaccagc gagagcgcca cccccgagag cgacaagaaa 2520
tactctattg gactggctat cgggacaaac tccgttggct gggccgtcat aaccgacgag 2580
tataaggtgc caagcaagaa attcaaggtg ctgggtaata ctgaccgcca ttcaatcaag 2640
aagaacctga tcggagcact cctcttcgac tccggtgaaa ccgctgaagc tactcggctg 2700
aagcggaccg caaggcggag atacacccgc cgcaagaatc ggatatgtta tctgcaagag 2760
atctttagca acgaaatggc taaggtggac gactccttct ttcaccgcct ggaagagagc 2820
tttctggtgg aggaggataa gaaacacgag aggcacccta tattcggaaa tatcgtggat 2880
gaggtggctt accatgaaaa gtatcctaca atctaccatc tgaggaagaa gctggtggac 2940
agcaccgata aagcagacct gaggctcatc tatctggccc tggctcatat gataaagttt 3000
agaggacact ttctgatcga gggcgacctg aatcccgata attccgatgt ggataaactc 3060
ttcattcaac tggtgcagac atataaccaa ctgttcgagg agaatcccat aaacgcttct 3120
ggtgtggatg ccaaggctat tctgtccgct cggctgtcca agtcacgcag actggagaat 3180
ctgattgccc aactgccagg agaaaagaag aacggcctgt ttgggaacct catcgccctg 3240
agcctgggcc tgacacctaa cttcaagtcc aattttgatc tggccgaaga tgctaaactc 3300
cagctctcca aggacaccta tgacgatgat ctggacaacc tgctcgcaca gataggcgac 3360
cagtacgccg atctctttct ggctgctaag aatctctccg acgccattct gctgagcgac 3420
atactccggg tcaacactga gatcaccaaa gcacctctga gcgcctccat gataaaacgc 3480
tatgatgaac accatcaaga cctgactctg ctcaaagccc tcgtgaggca acagctgcca 3540
gagaagtaca aagagatatt cttcgaccag agcaagaatg gatatgccgg atacatcgat 3600
ggcggagcat cacaggaaga attttacaag ttcatcaaac caatcctcga gaagatggac 3660
ggtactgaag agctgctggt gaagctgaac agggaggacc tgctgaggaa gcagaggacc 3720
tttgataatg gctccattcc acatcagata cacctgggag agctgcatgc aatcctccgc 3780
aggcaggagg atttctatcc tttcctgaag gataaccggg agaagataga gaagatcctg 3840
accttcagga tcccttatta cgtcggccct ctggctagag gcaactcccg cttcgcttgg 3900
atgaccagga aatctgagga gacaattact ccttggaact tcgaagaggt cgtggataag 3960
ggcgcaagcg cccagtcatt catcgaacgg atgaccaatt tcgataagaa cctgccaaac 4020
gagaaggtcc tgcccaaaca ttcactcctg tacgagtatt tcaccgtcta taacgagctg 4080
actaaagtga agtacgtgac cgagggcatg aggaagcctg ccttcctgtc cggagagcag 4140
aagaaggcta tcgttgatct gctcttcaag actaatagaa aggtgacagt gaagcagctc 4200
aaggaggatt actttaagaa gatcgaatgc tttgactcag tggaaatctc tggcgtggag 4260
gaccgcttta atgccagcct gggcacttac catgatctgc tgaagataat caaagacaaa 4320
gatttcctcg ataatgagga gaacgaggac atcctggaag atatcgtgct gaccctgact 4380
ctgttcgagg atagagagat gatcgaagag cgcctgaaga cctatgccca tctgtttgac 4440
gataaagtca tgaaacagct caagcggcgg cgctacactg ggtggggtag actctccagg 4500
aaactcataa acggcatccg cgacaaacag agcggaaaga ccatcctgga tttcctgaaa 4560
tccgacggat tcgctaacag gaacttcatg caactgattc acgatgactc tctgacattt 4620
aaagaggaca tccagaaggc acaggtgagc ggtcaaggcg acagcctgca cgagcacatc 4680
gccaacctcg ctggatcacc cgccataaag aagggaatac tgcagacagt caaggtcgtg 4740
gacgaactcg tcaaagtgat gggtcggcac aagccagaga atatcgttat cgaaatggca 4800
agggagaacc aaaccaccca gaagggccag aagaactctc gggaacggat gaaaagaatc 4860
gaagagggaa ttaaggagct gggatctcag atactgaagg agcaccctgt ggagaataca 4920
cagctccaga acgagaaact ctacctgtac tacctccaga acgggcggga catgtacgtt 4980
gaccaggaac tcgacatcaa ccggctgtcc gattatgacg tggacgctat tgttccacag 5040
tccttcctca aagatgactc cattgacaac aaggtgctga ccagatccga taaggcccgc 5100
ggtaagtctg acaatgttcc atcagaagag gtggtcaaga agatgaagaa ttactggcgg 5160
cagctcctca acgccaaact gatcacccag cggaagtttg acaatctgac taaggcagaa 5220
agaggaggtc tgagcgaact cgacaaggcc ggctttatta agaggcaact ggtcgaaaca 5280
cgccagatta ccaaacacgt ggcacaaatc ctcgactcta ggatgaacac taagtacgat 5340
gagaacgata agctgatcag ggaagtgaaa gtgataactc tgaagagcaa gctggtgtct 5400
gacttccgga aggactttca attctacaaa gttcgcgaaa taaacaatta ccatcatgct 5460
cacgatgcct atctcaatgc tgtcgttggc accgccctga tcaagaaata ccctaaactg 5520
gagtctgagt tcgtgtacgg tgactataaa gtctacgatg tgaggaagat gatagcaaag 5580
tctgagcaag agattggcaa agccaccgcc aagtacttct tctactctaa tatcatgaat 5640
ttctttaaga ctgagataac cctggctaac ggcgaaatcc ggaagcgccc actgatcgaa 5700
acaaacggag aaacaggaga aatcgtgtgg gataaaggca gggacttcgc aactgtgcgg 5760
aaggtgctgt ccatgccaca agtcaatatc gtgaagaaga ccgaagtgca gaccggcgga 5820
ttctcaaagg agagcatcct gccaaagcgg aactctgaca agctgatcgc caggaagaaa 5880
gattgggacc caaagaagta tggcggtttc gattccccta cagtggctta ttccgttctg 5940
gtcgtggcaa aagtggagaa aggcaagtcc aagaaactca agtctgttaa ggagctgctc 6000
ggaattacta ttatggagag atccagcttc gagaagaatc caatcgattt cctggaagct 6060
aagggctata aagaagtgaa gaaagatctc atcatcaaac tgcccaagta ctctctcttt 6120
gagctggaga atggtaggaa gcggatgctg gcctccgccg gagagctgca gaaaggaaac 6180
gagctggctc tgccctccaa atacgtgaac ttcctgtatc tggcctccca ctacgagaaa 6240
ctcaaaggta gccctgaaga caatgagcag aagcaactct ttgttgagca acataaacac 6300
tacctggacg aaatcattga acagattagc gagttcagca agcgggttat tctggccgat 6360
gcaaacctcg ataaagtgct gagcgcatat aataagcaca gggacaagcc aattcgcgaa 6420
caagcagaga atattatcca cctctttact ctgactaatc tgggcgctcc tgctgccttc 6480
aagtatttcg atacaactat tgacaggaag cggtacacct ctaccaaaga agttctcgat 6540
gccaccctga tacaccagtc aattaccgga ctgtacgaga ctcgcatcga cctgtctcag 6600
ctcggcggcg acggttctcc caagaagaag aggaaagtct cgagcggtgg agctgcagga 6660
taggaattcg ggcccttcga aggtaagcct atccctaacc ctctcctcgg tctcgattct 6720
acgcgtaccg gtcatcatca ccatcaccat tgagtttaaa cccgctgatc agcctcgact 6780
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 6840
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 6900
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 6960
gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcttctga ggcggaaaga 7020
accagctggg gctctagggg gtatccccac gcgccctgta gcggcgcatt aagcgcggcg 7080
ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct 7140
ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat 7200
cggggcatcc ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt 7260
gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg 7320
acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac 7380
cctatctcgg tctattcttt tgatttataa gggattttgg ggatttcggc ctattggtta 7440
aaaaatgagc tgatttaaca aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt 7500
tagggtgtgg aaagtcccca ggctccccag gcaggcagaa gtatgcaaag catgcatctc 7560
aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa 7620
agcatgcatc tcaattagtc agcaaccata gtcccgcccc taactccgcc catcccgccc 7680
ctaactccgc ccagttccgc ccattctccg ccccatggct gactaatttt ttttatttat 7740
gcagaggccg aggccgcctc tgcctctgag ctattccaga agtagtgagg aggctttttt 7800
ggaggcctag gcttttgcaa aaagctcccg ggagcttgta tatccatttt cggatctgat 7860
cagcacgtgt tgacaattaa tcatcggcat agtatatcgg catagtataa tacgacaagg 7920
tgaggaacta aaccatggcc aagcctttgt ctcaagaaga atccaccctc attgaaagag 7980
caacggctac aatcaacagc atccccatct ctgaagacta cagcgtcgcc agcgcagctc 8040
tctctagcga cggccgcatc ttcactggtg tcaatgtata tcattttact gggggacctt 8100
gtgcagaact cgtggtgctg ggcactgctg ctgctgcggc agctggcaac ctgacttgta 8160
tcgtcgcgat cggaaatgag aacaggggca tcttgagccc ctgcggacgg tgtcgacagg 8220
tgcttctcga tctgcatcct gggatcaaag cgatagtgaa ggacagtgat ggacagccga 8280
cggcagttgg gattcgtgaa ttgctgccct ctggttatgt gtgggagggc taagcacttc 8340
gtggccgagg agcaggactg acacgtgcta cgagatttcg attccaccgc cgccttctat 8400
gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg 8460
gatctcatgc tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac 8520
aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt 8580
tgtggtttgt ccaaactcat caatgtatct tatcatgtct gtataccgtc gacctctagc 8640
tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 8700
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 8760
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 8820
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 8880
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 8940
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 9000
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 9060
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 9120
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 9180
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 9240
agcgtggcgc tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 9300
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 9360
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 9420
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 9480
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 9540
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 9600
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 9660
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 9720
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 9780
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 9840
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 9900
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 9960
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 10020
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 10080
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 10140
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 10200
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 10260
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 10320
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 10380
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 10440
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 10500
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 10560
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 10620
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 10680
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 10740
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 10800
aaagtgccac ctgacgtc 10818
<210> 15
<211> 56
<212> DNA
<213> Artificial Sequence
<400> 15
atgcgtctca accgcaggag ttcctgtctg tttgttttag agctagaaat agcaag 56
<210> 16
<211> 58
<212> DNA
<213> Artificial Sequence
<400> 16
atgcgtctcg taaaacacca gcctgtgtgc tgctgcggtg tttcgtcctt tccacaag 58
<210> 17
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 17
atgcgtctca tttagagcta gaaatagcaa gttaaaataa g 41
<210> 18
<211> 62
<212> DNA
<213> Artificial Sequence
<400> 18
atgcgtctcg gctctaaaac tctctccgag aggagggagc ggtgtttcgt cctttccaca 60
ag 62
<210> 19
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 19
atgcgtctca gagctagaaa tagcaagtta aaataaggc 39
<210> 20
<211> 66
<212> DNA
<213> Artificial Sequence
<400> 20
atgcgtctcg tctagctcta aaaccggcct tggcggtccc actcggtgtt tcgtcctttc 60
cacaag 66
<210> 21
<211> 38
<212> DNA
<213> Artificial Sequence
<400> 21
atgcgtctca tagaaatagc aagttaaaat aaggctag 38
<210> 22
<211> 56
<212> DNA
<213> Artificial Sequence
<400> 22
atgcgtctcg aaacccggtg gtggctttct ccacggtgtt tcgtcctttc cacaag 56
<210> 23
<211> 2959
<212> DNA
<213> Artificial Sequence
<400> 23
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acctcgcgaa 420
tgcatctaga tatcggatcc ctaatacgac tcactatagg tgagaccgag agagggtctc 480
agttttagag ctagaaatag caagttaaaa taaggctagt ccgttatcaa cttgaaaaag 540
tggcaccgag tcggtgcttt ttttaaaggg cccgtcgact gcagaggcta gctcaccgag 600
ggcctatttc ccatgattcc ttcatatttg catatacgat acaaggctgt tagagagata 660
attggaatta atttgactgt aaacacaaag atattagtac aaaatacgtg acgtagaaag 720
taataatttc ttgggtagtt tgcagtttta aaattatgtt ttaaaatgga ctatcatatg 780
cttaccgtaa cttgaaagta tttcgatttc ttggctttat atatcttgtg gaaaggacga 840
aacaccgcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 900
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 960
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg cggccgccgc ttcctcgctc 1020
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 1080
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 1140
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 1200
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 1260
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 1320
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 1380
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 1440
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 1500
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 1560
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 1620
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 1680
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 1740
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 1800
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 1860
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 1920
tatgagtaaa cttggtctga cagttagaaa aactcatcga gcatcaaatg aaactgcaat 1980
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 2040
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 2100
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 2160
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 2220
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 2280
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 2340
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 2400
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccagggatc 2460
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 2520
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 2580
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 2640
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 2700
tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 2760
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 2820
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 2880
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 2940
atcacgaggc cctttcgtc 2959
<210> 24
<211> 7797
<212> DNA
<213> Artificial Sequence
<400> 24
ggtaccgatt agtgaacgga tctcgacggt atcgatcacg agactagcct cgagcggccg 60
cccccttcac cgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 120
ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata 180
cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 240
tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 300
tgtggaaagg acgaaacacc gcaggagttc ctgtctgttt gttttagagc tagaaatagc 360
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 420
tttctagctc accgagggcc tatttcccat gattccttca tatttgcata tacgatacaa 480
ggctgttaga gagataattg gaattaattt gactgtaaac acaaagatat tagtacaaaa 540
tacgtgacgt agaaagtaat aatttcttgg gtagtttgca gttttaaaat tatgttttaa 600
aatggactat catatgctta ccgtaacttg aaagtatttc gatttcttgg ctttatatat 660
cttgtggaaa ggacgaaaca ccgcagcagc acacaggctg gtgttttaga gctagaaata 720
gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt 780
tttttctagc tcaccgaggg cctatttccc atgattcctt catatttgca tatacgatac 840
aaggctgtta gagagataat tggaattaat ttgactgtaa acacaaagat attagtacaa 900
aatacgtgac gtagaaagta ataatttctt gggtagtttg cagttttaaa attatgtttt 960
aaaatggact atcatatgct taccgtaact tgaaagtatt tcgatttctt ggctttatat 1020
atcttgtgga aaggacgaaa caccgctccc tcctctcgga gagagtttta gagctagaaa 1080
tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc 1140
tttttttcta gctcaccgag ggcctatttc ccatgattcc ttcatatttg catatacgat 1200
acaaggctgt tagagagata attggaatta atttgactgt aaacacaaag atattagtac 1260
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 1320
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 1380
atatcttgtg gaaaggacga aacaccgagt gggaccgcca aggccggttt tagagctaga 1440
aatagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 1500
gctttttttc tagctcaccg agggcctatt tcccatgatt ccttcatatt tgcatatacg 1560
atacaaggct gttagagaga taattggaat taatttgact gtaaacacaa agatattagt 1620
acaaaatacg tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg 1680
ttttaaaatg gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt 1740
atatatcttg tggaaaggac gaaacaccgt ggagaaagcc accaccgggt tttagagcta 1800
gaaatagcaa gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg 1860
gtgctttttt taaagggccc gtcgactgca gaggcctgca tgcaagcttg gcgtaatcat 1920
aaattctcga cctcgagaca aatggcagta ttcatccaca attttaaaag aaaagggggg 1980
attggggggt acagtgcagg ggaaagaata gtagacataa tagcaacaga catacaaact 2040
aaagaattac aaaaacaaat tacaaaaatt caaaattttc gggtttatta cagggacagc 2100
agagatccac tttggccgcc gtgaggctcc ggtgcccgtc agtgggcaga gcgcacatcg 2160
cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt gaaccggtgc ctagagaagg 2220
tggcgcgggg taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt 2280
gggggagaac cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt 2340
gccgccagaa cacaggtaag tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt 2400
tatggccctt gcgtgccttg aattacttcc acgcccctgg ctgcagtacg tgattcttga 2460
tcccgagctt cgggttggaa gtgggtggga gagttcgagg ccttgcgctt aaggagcccc 2520
ttcgcctcgt gcttgagttg aggcctggcc tgggcgctgg ggccgccgcg tgcgaatctg 2580
gtggcacctt cgcgcctgtc tcgctgcttt cgataagtct ctagccattt aaaatttttg 2640
atgacctgct gcgacgcttt ttttctggca agatagtctt gtaaatgcgg gccaagatct 2700
gcacactggt atttcggttt ttggggccgc gggcggcgac ggggcccgtg cgtcccagcg 2760
cacatgttcg gcgaggcggg gcctgcgagc gcggccaccg agaatcggac gggggtagtc 2820
tcaagctggc cggcctgctc tggtgcctgg cctcgcgccg ccgtgtatcg ccccgccctg 2880
ggcggcaagg ctggcccggt cggcaccagt tgcgtgagcg gaaagatggc cgcttcccgg 2940
ccctgctgca gggagctcaa aatggaggac gcggcgctcg ggagagcggg cgggtgagtc 3000
acccacacaa aggaaaaggg cctttccgtc ctcagccgtc gcttcatgtg actccacgga 3060
gtaccgggcg ccgtccaggc acctcgatta gttctcgagc ttttggagta cgtcgtcttt 3120
aggttggggg gaggggtttt atgcgatgga gtttccccac actgagtggg tggagactga 3180
agttaggcca gcttggcact tgatgtaatt ctccttggaa tttgcccttt ttgagtttgg 3240
atcttggttc attctcaagc ctcagacagt ggttcaaagt ttttttcttc catttcaggt 3300
gtcgtgagga tccaccggag cttaccatgg ccgagtacaa gcccacggtg cgcctcgcca 3360
cccgcgacga cgtccccagg gccgtacgca ccctcgccgc cgcgttcgcc gactaccccg 3420
ccacgcgcca caccgtcgat ccggaccgcc acatcgagcg ggtcaccgag ctgcaagaac 3480
tcttcctcac gcgcgtcggg ctcgacatcg gcaaggtgtg ggtcgcggac gacggcgccg 3540
cggtggcggt ctggaccacg ccggagagcg tcgaagcggg ggcggtgttc gccgagatcg 3600
gcccgcgcat ggccgagttg agcggttccc ggctggccgc gcagcaacag atggaaggcc 3660
tcctggcgcc gcaccggccc aaggagcccg cgtggttcct ggccaccgtc ggcgtctcgc 3720
ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct ccccggagtg gaggcggccg 3780
agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc ccgcaacctc cccttctacg 3840
agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc cgaaggaccg cgcacctggt 3900
gcatgacccg caagcccggt gccactagag tgagcaaggg cgaggagctg ttcaccgggg 3960
tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg 4020
gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc tgcaccaccg 4080
gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagtgct 4140
tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag 4200
gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg 4260
aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca 4320
aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct 4380
atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc cgccacaaca 4440
tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg 4500
gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg agcaaagacc 4560
ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc 4620
tcggcatgga cgagctgtac aagtaaacta gtggcgcgcc acatgcatcg gtacctttaa 4680
gaccaatgac ttacaaggca gctgtagatc ttagccactt tctagagtcg gggcggccgg 4740
ccgcttcgag cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg 4800
cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt 4860
ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag 4920
ggggaggtgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatcgat 4980
aaggatccgt cgaccgatgc ccttgagagc cttcaaccca gtcagctcct tccggtgggc 5040
gcggggcatg actatcgtcg ccgcacttat gactgtcttc tttatcatgc aactcgtagg 5100
acaggtgccg gcagcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 5160
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 5220
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 5280
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 5340
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 5400
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 5460
cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt 5520
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 5580
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 5640
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 5700
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 5760
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 5820
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 5880
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 5940
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 6000
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 6060
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 6120
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 6180
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 6240
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 6300
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 6360
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 6420
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 6480
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 6540
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 6600
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 6660
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 6720
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 6780
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 6840
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 6900
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 6960
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 7020
cgcgcacatt tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg 7080
cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc 7140
ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa 7200
atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac 7260
ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt 7320
tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca 7380
accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt 7440
taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgttta 7500
caatttccca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 7560
cttcgctatt acgccagccc aagctaccat gataagtaag taatattaag gtacgggagg 7620
tacttggagc ggccgcaata aaatatcttt attttcatta catctgtgtg ttggtttttt 7680
gtgtgaatcg atagtactaa catacgctct ccatcaaaac aaaacgaaac aaaacaaact 7740
agcaaaatag gctgtcccca gtgcaagtgc aggtgccaga acatttctct atcgata 7797
<210> 25
<211> 6978
<212> DNA
<213> Artificial Sequence
<400> 25
ggtaccgatt agtgaacgga tctcgacggt atcgatcacg agactagcct cgagcggccg 60
cccccttcac cgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 120
ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata 180
cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 240
tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 300
tgtggaaagg acgaaacacc gggagacgcc gcattaggca ccccaggctt tacactttat 360
gcttccggct cgtataatgt gtggattttg agttaggatc cgtcgagatt ttcaggagct 420
aaggaagcta aaatggagaa aaaaatcact ggatatacca ccgttgatat atcccaatgg 480
catcgtaaag aacattttga ggcatttcag tcagttgctc aatgtaccta taaccagacc 540
gttcagctgg atattacggc ctttttaaag accgtaaaga aaaataagca caagttttat 600
ccggccttta ttcacattct tgcccgcctg atgaatgctc atccggaatt ccgtatggca 660
atgaaagacg gtgagctggt gatatgggat agtgttcacc cttgttacac cgttttccat 720
gagcaaactg aaacgttttc atcgctctgg agtgaatacc acgacgattt ccggcagttt 780
ctacacatat attcgcaaga tgtggcgtgt tacggtgaaa acctggccta tttccctaaa 840
gggtttattg agaatatgtt tttcgtctca gccaatccct gggtgagttt caccagtttt 900
gatttaaacg tggccaatat ggacaacttc ttcgcccccg ttttcaccat gggcaaatat 960
tatacgcaag gcgacaaggt gctgatgccg ctggcgattc aggttcatca tgccgtttgt 1020
gatggcttcc atgtcggcag aatgcttaat gaattacaac agtactgcga tgagtggcag 1080
ggcggggcgt aaagatctgg atccggctta ctaaaagcca gataacagta tgcgtatttg 1140
cgcgctgatt tttgcggtat aagaatatat actgatatgt atacccgaag tatgtcaaaa 1200
agaggtatgc tatgaagcag cgtattacag tgacagttga cagcgacagc tatcagttgc 1260
tcaaggcata tatgatgtca atatctccgg tctggtaagc acaaccatgc agaatgaagc 1320
ccgtcgtctg cgtgccgaac gctggaaagc ggaaaatcag gaagggatgg ctgaggtcgc 1380
ccggtttatt gaaatgaacg gctcttttgc tgacgagaac aggggctggt gaaatgcagt 1440
ttaaggttta cacctataaa agagagagcc gttatcgtct gtttgtggat gtacagagtg 1500
atattattga cacgcccggg cgacggatgg tgatccccct ggccagtgca cgtctgctgt 1560
cagataaagt ctcccgtgaa ctttacccgg tggtgcatat cggggatgaa agctggcgca 1620
tgatgaccac cgatatggcc agtgtgccgg tctccgttat cggggaagaa gtggctgatc 1680
tcagccaccg cgaaaatgac atcaaaaacg ccattaacct gatgttctgg ggaatataaa 1740
tgtcaggctc ccttatacac agccagtctg caggtcgacg cgtctcctaa attctcgacc 1800
tcgagacaaa tggcagtatt catccacaat tttaaaagaa aaggggggat tggggggtac 1860
agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaattacaa 1920
aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccactt 1980
tggccgccgt gaggctccgg tgcccgtcag tgggcagagc gcacatcgcc cacagtcccc 2040
gagaagttgg ggggaggggt cggcaattga accggtgcct agagaaggtg gcgcggggta 2100
aactgggaaa gtgatgtcgt gtactggctc cgcctttttc ccgagggtgg gggagaaccg 2160
tatataagtg cagtagtcgc cgtgaacgtt ctttttcgca acgggtttgc cgccagaaca 2220
caggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct ttacgggtta tggcccttgc 2280
gtgccttgaa ttacttccac gcccctggct gcagtacgtg attcttgatc ccgagcttcg 2340
ggttggaagt gggtgggaga gttcgaggcc ttgcgcttaa ggagcccctt cgcctcgtgc 2400
ttgagttgag gcctggcctg ggcgctgggg ccgccgcgtg cgaatctggt ggcaccttcg 2460
cgcctgtctc gctgctttcg ataagtctct agccatttaa aatttttgat gacctgctgc 2520
gacgcttttt ttctggcaag atagtcttgt aaatgcgggc caagatctgc acactggtat 2580
ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg tcccagcgca catgttcggc 2640
gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg gggtagtctc aagctggccg 2700
gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc ccgccctggg cggcaaggct 2760
ggcccggtcg gcaccagttg cgtgagcgga aagatggccg cttcccggcc ctgctgcagg 2820
gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg ggtgagtcac ccacacaaag 2880
gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac tccacggagt accgggcgcc 2940
gtccaggcac ctcgattagt tctcgagctt ttggagtacg tcgtctttag gttgggggga 3000
ggggttttat gcgatggagt ttccccacac tgagtgggtg gagactgaag ttaggccagc 3060
ttggcacttg atgtaattct ccttggaatt tgcccttttt gagtttggat cttggttcat 3120
tctcaagcct cagacagtgg ttcaaagttt ttttcttcca tttcaggtgt cgtgaggatc 3180
caccggagct taccatgacc gagtacaagc ccacggtgcg cctcgccacc cgcgacgacg 3240
tccccagggc cgtacgcacc ctcgccgccg cgttcgccga ctaccccgcc acgcgccaca 3300
ccgtcgatcc ggaccgccac atcgagcggg tcaccgagct gcaagaactc ttcctcacgc 3360
gcgtcgggct cgacatcggc aaggtgtggg tcgcggacga cggcgccgcg gtggcggtct 3420
ggaccacgcc ggagagcgtc gaagcggggg cggtgttcgc cgagatcggc ccgcgcatgg 3480
ccgagttgag cggttcccgg ctggccgcgc agcaacagat ggaaggcctc ctggcgccgc 3540
accggcccaa ggagcccgcg tggttcctgg ccaccgtcgg cgtgtcgccc gaccaccagg 3600
gcaagggtct gggcagcgcc gtcgtgctcc ccggagtgga ggcggccgag cgcgccgggg 3660
tgcccgcctt cctggagacc tccgcgcccc gcaacctccc cttctacgag cggctcggct 3720
tcaccgtcac cgccgacgtc gaggtgcccg aaggaccgcg cacctggtgc atgacccgca 3780
agcccggtgc ctgacgcccg ccccacgacc cgcagcgccc gaccgaaagg agcgcacgac 3840
cccatgcatc ggtaccttta agaccaatga cttacaaggc agctgtagat cttagccact 3900
ttctagagtc ggggcggccg gccgcttcga gcagacatga taagatacat tgatgagttt 3960
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4020
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4080
cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaaagcaa gtaaaacctc 4140
tacaaatgtg gtaaaatcga taaggatccg tcgaccgatg cccttgagag ccttcaaccc 4200
agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta tgactgtctt 4260
ctttatcatg caactcgtag gacaggtgcc ggcagcgctc ttccgcttcc tcgctcactg 4320
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 4380
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 4440
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 4500
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 4560
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 4620
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct 4680
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 4740
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 4800
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 4860
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 4920
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 4980
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 5040
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 5100
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 5160
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 5220
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 5280
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 5340
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 5400
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 5460
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 5520
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 5580
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 5640
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 5700
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 5760
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 5820
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 5880
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 5940
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 6000
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 6060
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 6120
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 6180
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgcgccct 6240
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 6300
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 6360
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 6420
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 6480
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 6540
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 6600
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 6660
ttaacaaaat attaacgttt acaatttccc attcgccatt caggctgcgc aactgttggg 6720
aagggcgatc ggtgcgggcc tcttcgctat tacgccagcc caagctacca tgataagtaa 6780
gtaatattaa ggtacgggag gtacttggag cggccgcaat aaaatatctt tattttcatt 6840
acatctgtgt gttggttttt tgtgtgaatc gatagtacta acatacgctc tccatcaaaa 6900
caaaacgaaa caaaacaaac tagcaaaata ggctgtcccc agtgcaagtg caggtgccag 6960
aacatttctc tatcgata 6978
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 26
ccagcatggg tacagacaac 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 27
agctgaataa agcagcagca 20
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 28
acaactttgg cattgtggaa 20
<210> 29
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 29
gatgcaggga tgatgttc 18
<210> 30
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 30
tgggttttat aattaatgaa gggt 24
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 31
ttaaygatcc cactcacaat 20
<210> 32
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 32
ataaagagta aggggtggg 19
<210> 33
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 33
gggttttata attaatgaag ggtaa 25
<210> 34
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 34
tcccactcac aatctctc 18
<210> 35
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 35
accggcagga gttcctgtct gttt 24
<210> 36
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 36
aaacaaacag acaggaactc ctgc 24
<210> 37
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 37
accggcagca gcacacaggc tggt 24
<210> 38
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 38
aaacaccagc ctgtgtgctg ctgc 24
<210> 39
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 39
accggctccc tcctctcgga gaga 24
<210> 40
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 40
aaactctctc cgagaggagg gagc 24
<210> 41
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 41
accggagtgg gaccgccaag gccg 24
<210> 42
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 42
aaaccggcct tggcggtccc actc 24
<210> 43
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 43
accggtggag aaagccacca ccgg 24
<210> 44
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 44
aaacccggtg gtggctttct ccac 24
<210> 45
<211> 20
<212> DNA
<213> Mus musculus
<400> 45
gcaggagttc ctgtctgttt 20
<210> 46
<211> 20
<212> DNA
<213> Mus musculus
<400> 46
gcagcagcac acaggctggt 20
<210> 47
<211> 20
<212> DNA
<213> Mus musculus
<400> 47
gctccctcct ctcggagaga 20
<210> 48
<211> 20
<212> DNA
<213> Mus musculus
<400> 48
gagtgggacc gccaaggccg 20
<210> 49
<211> 20
<212> DNA
<213> Mus musculus
<400> 49
gtggagaaag ccaccaccgg 20
<210> 50
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 50
aactccacca atccgcagc 19
<210> 51
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 51
aactggcgaa gcccagacga 20
<210> 52
<211> 53
<212> DNA
<213> Mus musculus
<400> 52
cgcctctttt ccctgcctaa acagacagga actcctgcca attgagggcg tca 53
<210> 53
<211> 53
<212> DNA
<213> Mus musculus
<400> 53
cgcgggcgcg caggtgcagc agcacacagg ctggtcggga gggcggggcg cga 53
<210> 54
<211> 53
<212> DNA
<213> Mus musculus
<400> 54
atcggttgcg cgcgcgctcc ctcctctcgg agagagggct gtggtaaaac ccg 53
<210> 55
<211> 53
<212> DNA
<213> Mus musculus
<400> 55
aggaggagag actgtgagtg ggaccgccaa ggccgcgggc ggggaccctt gct 53
<210> 56
<211> 53
<212> DNA
<213> Mus musculus
<400> 56
ctccccctcc ctctgccgcc ggtggtggct ttctccactc gtctcccgca atc 53
<210> 57
<211> 23
<212> DNA
<213> Mus musculus
<400> 57
acacgagttc ctttgtgatt ggg 23
<210> 58
<211> 23
<212> DNA
<213> Mus musculus
<400> 58
gcagcaggtg gtgtctgctt ggg 23
<210> 59
<211> 23
<212> DNA
<213> Mus musculus
<400> 59
gtaagtgttc ctgtctcttc tgg 23
<210> 60
<211> 23
<212> DNA
<213> Mus musculus
<400> 60
ccaggggagc ctgtctgttc tgg 23
<210> 61
<211> 23
<212> DNA
<213> Mus musculus
<400> 61
gcaggaggcc ctcgctgttt ggg 23
<210> 62
<211> 23
<212> DNA
<213> Mus musculus
<400> 62
gcatctgttc ttgcctgttt ggg 23
<210> 63
<211> 23
<212> DNA
<213> Mus musculus
<400> 63
cctggagatc ctgtcagtgt tgg 23
<210> 64
<211> 23
<212> DNA
<213> Mus musculus
<400> 64
gccggatttc ctggatgttt tgg 23
<210> 65
<211> 23
<212> DNA
<213> Mus musculus
<400> 65
gcagcagcac gcgggctggc tgg 23
<210> 66
<211> 23
<212> DNA
<213> Mus musculus
<400> 66
gcagcagccg agaagctgga agg 23
<210> 67
<211> 23
<212> DNA
<213> Mus musculus
<400> 67
gcagccggag acaggctggc tgg 23
<210> 68
<211> 23
<212> DNA
<213> Mus musculus
<400> 68
gcagctgccc acagtctggc agg 23
<210> 69
<211> 23
<212> DNA
<213> Mus musculus
<400> 69
gccgcagtac accgtctggg ggg 23
<210> 70
<211> 23
<212> DNA
<213> Mus musculus
<400> 70
gccgctgcac acagcgcggt ggg 23
<210> 71
<211> 23
<212> DNA
<213> Mus musculus
<400> 71
gctgcaggac acagggtgtt ggg 23
<210> 72
<211> 23
<212> DNA
<213> Mus musculus
<400> 72
tcaacagccc actggctgct agg 23
<210> 73
<211> 23
<212> DNA
<213> Mus musculus
<400> 73
cctccctcct ctcagagatc cgg 23
<210> 74
<211> 23
<212> DNA
<213> Mus musculus
<400> 74
gctctctcct ttcccagaaa tgg 23
<210> 75
<211> 23
<212> DNA
<213> Mus musculus
<400> 75
gctgactcct ccagaagaga cgg 23
<210> 76
<211> 23
<212> DNA
<213> Mus musculus
<400> 76
ggcctctcct ctagcagaga cgg 23
<210> 77
<211> 23
<212> DNA
<213> Mus musculus
<400> 77
ggtccctcct gtagcagaga agg 23
<210> 78
<211> 23
<212> DNA
<213> Mus musculus
<400> 78
ggttctgcct ctcggagcga cgg 23
<210> 79
<211> 23
<212> DNA
<213> Mus musculus
<400> 79
gttccctcca ccctgagagg agg 23
<210> 80
<211> 23
<212> DNA
<213> Mus musculus
<400> 80
tctccctctt ctggcagagc cgg 23
<210> 81
<211> 23
<212> DNA
<213> Mus musculus
<400> 81
tagtaggtcc gccaaggttg ggg 23
<210> 82
<211> 23
<212> DNA
<213> Mus musculus
<400> 82
tagggggagc gctcaggccg cgg 23
<210> 83
<211> 23
<212> DNA
<213> Mus musculus
<400> 83
gtgttggaac ggcacggccg tgg 23
<210> 84
<211> 23
<212> DNA
<213> Mus musculus
<400> 84
ggttcggccc gccaaggccg cgg 23
<210> 85
<211> 23
<212> DNA
<213> Mus musculus
<400> 85
gcgtgggagc cctaaggcag agg 23
<210> 86
<211> 23
<212> DNA
<213> Mus musculus
<400> 86
gccagggacc gccgaggacg tgg 23
<210> 87
<211> 23
<212> DNA
<213> Mus musculus
<400> 87
gagtagaaac accaaggccg agg 23
<210> 88
<211> 23
<212> DNA
<213> Mus musculus
<400> 88
gagggagaaa cccaaggccg cgg 23
<210> 89
<211> 23
<212> DNA
<213> Mus musculus
<400> 89
cagaagaaag ccttcaccgg ggg 23
<210> 90
<211> 23
<212> DNA
<213> Mus musculus
<400> 90
gagggagaaa cccaaggccg cgg 23
<210> 91
<211> 23
<212> DNA
<213> Mus musculus
<400> 91
gtcgagacag cacccacggg agg 23
<210> 92
<211> 23
<212> DNA
<213> Mus musculus
<400> 92
gtcgagagcg cccccgccgg cgg 23
<210> 93
<211> 23
<212> DNA
<213> Mus musculus
<400> 93
gtggagaagc ccaccaagtg tgg 23
<210> 94
<211> 23
<212> DNA
<213> Mus musculus
<400> 94
gtggggaaag ccatcagtga tgg 23
<210> 95
<211> 23
<212> DNA
<213> Mus musculus
<400> 95
gtgttggaag ccaccagcgt ggg 23
<210> 96
<211> 23
<212> DNA
<213> Mus musculus
<400> 96
ttggagagag tcagctccgg agg 23

Claims (15)

1.一种构建自闭症谱系障碍的小鼠模型的方法,其特征在于,包括:在小鼠受精卵时期利用胚胎显微注射技术胞浆注射甲基化载体以及靶向MeCP2基因TSS区的gRNA载体,得到自闭症谱系障碍的小鼠模型;其中,所述的甲基化载体含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域。
2.如权利要求1所述的构建自闭症谱系障碍的小鼠模型的方法,其特征在于,所述的甲基化载体通过将人源DNMT3L和DNMT3A的催化功能域连接至dCas9蛋白N端形成。
3.如权利要求1所述的构建自闭症谱系障碍的小鼠模型的方法,其特征在于,所述的甲基化载体的序列为SEQ ID NO:11。
4.如权利要求1所述的构建自闭症谱系障碍的小鼠模型的方法,其特征在于,所述的靶向MeCP2基因TSS区的gRNA载体含有至少一条靶向MeCP2基因特异位点的gRNA片段。
5.如权利要求1所述的构建自闭症谱系障碍的小鼠模型的方法,其特征在于,所述的构建自闭症谱系障碍的小鼠模型的方法还包括:在小鼠受精卵时期利用胚胎显微注射技术胞浆注射甲基化对照载体以及靶向MeCP2基因TSS区的gRNA载体,得到自闭症谱系障碍的小鼠对照模型,其中,所述的甲基化对照载体通过突变甲基化载体的DNMT3A催化活性位点得到。
6.如权利要求1所述的构建自闭症谱系障碍的小鼠模型的方法,其特征在于,所述的甲基化对照载体的序列为SEQ ID NO:14。
7.如权利要求1或5所述的构建自闭症谱系障碍的小鼠模型的方法,其特征在于,所述的显微注射的条件为20-80ng/μl甲基化载体或甲基化对照载体,5-50ng/μl靶向MeCP2基因TSS区的gRNA载体。
8.一种甲基化载体,其特征在于,含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域。
9.一种载体组合,其特征在于,包括权利要求8所述的甲基化载体和gRNA载体。
10.一种甲基化对照载体,其特征在于,通过突变甲基化载体的DNMT3A催化活性位点得到,所述的甲基化载体含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域。
11.权利要求8所述的甲基化载体或权利要求9所述的甲基化对照载体在实现体外细胞中位点特异的甲基化进而研究基因特异位点甲基化后对功能的影响中的应用。
12.一种细胞系,其特征在于,其转染了甲基化载体或甲基化对照载体,所述的甲基化载体含有dCas9片段以及人源DNMT3L和DNMT3A催化功能域,所述的甲基化对照载体通过突变甲基化载体的DNMT3A催化活性位点得到。
13.一种构建小鼠模型的方法,其特征在于,包括:在小鼠受精卵时期利用胚胎显微注射技术胞浆注射定点甲基化载体以及gRNA载体,得到小鼠模型;其中,所述的定点甲基化载体含有dCas9片段。
14.权利要求13所述的构建小鼠模型的方法在用于构建MeCP2位点特异甲基化引起的ASD的小鼠模型,用于构建其他基因甲基化异常引起的小鼠疾病模型,用于模拟其他基因发育过程中甲基化异常而引起的生理状态变化的小鼠模型中的应用。
15.一种实现在体定点甲基化的方法,其特征在于,包括:利用胚胎显微注射技术胞浆注射定点甲基化所用载体,用于在体干预因表观修饰异常引起的疾病。
CN201810914416.2A 2018-08-10 2018-08-10 一种构建自闭症谱系障碍的小鼠模型的方法 Active CN108949831B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810914416.2A CN108949831B (zh) 2018-08-10 2018-08-10 一种构建自闭症谱系障碍的小鼠模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810914416.2A CN108949831B (zh) 2018-08-10 2018-08-10 一种构建自闭症谱系障碍的小鼠模型的方法

Publications (2)

Publication Number Publication Date
CN108949831A true CN108949831A (zh) 2018-12-07
CN108949831B CN108949831B (zh) 2022-06-21

Family

ID=64469235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810914416.2A Active CN108949831B (zh) 2018-08-10 2018-08-10 一种构建自闭症谱系障碍的小鼠模型的方法

Country Status (1)

Country Link
CN (1) CN108949831B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109706184A (zh) * 2018-12-21 2019-05-03 北京希诺谷生物科技有限公司 自闭症模型犬的建立方法
CN111150854A (zh) * 2020-01-21 2020-05-15 中国科学院生物物理研究所 一种改善自闭症社交障碍的方法
CN111304245A (zh) * 2018-12-10 2020-06-19 中国科学院昆明动物研究所 基于mecp2基因的非治疗目的的将病毒注入动物特定脑区进行基因编辑的方法
WO2023010135A1 (en) * 2021-07-30 2023-02-02 Tune Therapeutics, Inc. Compositions and methods for modulating expression of methyl-cpg binding protein 2 (mecp2)
WO2023029532A1 (en) * 2021-08-30 2023-03-09 Huigene Therapeutics Co., Ltd. Engineered cas6 protein and uses thereof
WO2023185889A1 (en) * 2022-03-28 2023-10-05 Huidagene Therapeutics Co., Ltd. Guide nucleic acid targeting mecp2 and uses thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103260612A (zh) * 2010-10-25 2013-08-21 艾克斯-马赛大学 MeCP2相关性病症的治疗
CN107475300A (zh) * 2017-09-18 2017-12-15 上海市同济医院 Ifit3‑eKO1基因敲除小鼠动物模型的构建方法和应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103260612A (zh) * 2010-10-25 2013-08-21 艾克斯-马赛大学 MeCP2相关性病症的治疗
CN107475300A (zh) * 2017-09-18 2017-12-15 上海市同济医院 Ifit3‑eKO1基因敲除小鼠动物模型的构建方法和应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
PETER STEPPER等: "Efficient targeted DNA methylation with chimeric dCas9–Dnmt3a–Dnmt3L methyltransferase", 《NUCLEIC ACIDS RESEARCH》 *
RAMAN P NAGARAJAN等: "Reduced MeCP2 expression is frequent in autism frontal cortex and correlates with aberrant MECP2 promoter methylation", 《EPIGENETICS》 *
ZONGYANG LU等: "Locus-specific DNA methylation of Mecp2 promoter leads to autism-like phenotypes in mice", 《CELL DEATH DIS.》 *
翟伟等: "Rett综合征相关基因MeCP2敲除大鼠模型的构建及分析", 《遗传》 *
赵晖等: "自闭症谱系障碍的分子遗传学研究进展", 《遗传》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111304245A (zh) * 2018-12-10 2020-06-19 中国科学院昆明动物研究所 基于mecp2基因的非治疗目的的将病毒注入动物特定脑区进行基因编辑的方法
CN111304245B (zh) * 2018-12-10 2024-02-20 中国科学院昆明动物研究所 基于mecp2基因的非治疗目的的将病毒注入动物特定脑区进行基因编辑的方法
CN109706184A (zh) * 2018-12-21 2019-05-03 北京希诺谷生物科技有限公司 自闭症模型犬的建立方法
CN109706184B (zh) * 2018-12-21 2022-11-22 北京希诺谷生物科技有限公司 自闭症模型犬的建立方法
CN111150854A (zh) * 2020-01-21 2020-05-15 中国科学院生物物理研究所 一种改善自闭症社交障碍的方法
WO2023010135A1 (en) * 2021-07-30 2023-02-02 Tune Therapeutics, Inc. Compositions and methods for modulating expression of methyl-cpg binding protein 2 (mecp2)
WO2023029532A1 (en) * 2021-08-30 2023-03-09 Huigene Therapeutics Co., Ltd. Engineered cas6 protein and uses thereof
WO2023185889A1 (en) * 2022-03-28 2023-10-05 Huidagene Therapeutics Co., Ltd. Guide nucleic acid targeting mecp2 and uses thereof

Also Published As

Publication number Publication date
CN108949831B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN108949831B (zh) 一种构建自闭症谱系障碍的小鼠模型的方法
KR102606929B1 (ko) 동족 항원과 t-세포 수용체 상호작용의 발견 및 특징규명을 위한 조작된 2-부분 세포 디바이스
AU2020264412B2 (en) Dna-binding protein using ppr motif, and use thereof
US5667992A (en) Mammalian expression systems for HCV proteins
KR20230091894A (ko) 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물
CN107108707A (zh) 高亲和力pd‑1药剂以及使用方法
CN110684804B (zh) 递送外源rnp的慢病毒载体及其制备方法
CN108753823B (zh) 利用碱基编辑技术实现基因敲除的方法及其应用
KR20100049084A (ko) 질병 진단을 위한 방법 및 조성물
AU2024200154A1 (en) An engineered multi-component system for identification and characterisation of T-cell receptors, T-cell antigens and their functional interaction
JP2023025182A (ja) T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム
KR20190076995A (ko) T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스
CN107287238A (zh) 一种基因载体及其用于治疗雷柏氏先天性黑矇2型疾病的基因治疗药物
CN115968300A (zh) 用于体内转导的载体和方法
CA2335278A1 (en) Method for screening of modulators of calcineurin activity
CN110087676A (zh) 用于治疗癌症的包含表达nfatc4的细胞的分泌性胞外囊泡的组合物
CN109762846B (zh) 利用碱基编辑修复与克拉伯病相关的galcc1586t突变的试剂和方法
CN101677523A (zh) 有条件的且可诱导的转基因表达来指导干细胞发育的方法
CN111727244B (zh) 循环肿瘤细胞的通用检测探针
CN112980800A (zh) Car-t细胞、其构建方法及其应用
KR20180099537A (ko) 근섬유모세포의 병리적 활성이 초래하는 섬유증식성 질병 치료제
CN108690839B (zh) Tp53基因敲除的动物模型的构建方法及其短肽
KR20230159994A (ko) 하이브리드 신호서열을 포함하는 재조합 벡터 및 이를 이용한 인간 인슐린 유사 성장인자-1의 분비 생산방법
KR20240021211A (ko) Klk2-gpi 융합 단백질에 대한 핵산 코딩, 재조합 세포 및 이의 용도
CN114686449A (zh) 一种表达绿色荧光蛋白分裂肽的重组乙型肝炎病毒复制子及其构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant