CN114525304B - 一种基因编辑的方法 - Google Patents

一种基因编辑的方法 Download PDF

Info

Publication number
CN114525304B
CN114525304B CN202011326638.6A CN202011326638A CN114525304B CN 114525304 B CN114525304 B CN 114525304B CN 202011326638 A CN202011326638 A CN 202011326638A CN 114525304 B CN114525304 B CN 114525304B
Authority
CN
China
Prior art keywords
seq
vector
nucleotide sequence
sgrna
safe harbor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011326638.6A
Other languages
English (en)
Other versions
CN114525304A (zh
Inventor
牛冬
汪滔
曾为俊
马翔
王磊
程锐
黄彩云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Qizhen Genetic Engineering Co Ltd
Original Assignee
Nanjing Qizhen Genetic Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Qizhen Genetic Engineering Co Ltd filed Critical Nanjing Qizhen Genetic Engineering Co Ltd
Priority to CN202011326638.6A priority Critical patent/CN114525304B/zh
Publication of CN114525304A publication Critical patent/CN114525304A/zh
Application granted granted Critical
Publication of CN114525304B publication Critical patent/CN114525304B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/48Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种基因编辑的方法,所述的方法包括将包含外源基因的安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞。本发明还提供了一种SEQ ID NO:2所示的Cas载体,其与现有载体相比,具有更高的基因编辑效率。

Description

一种基因编辑的方法
技术领域
本发明涉及一种基因编辑的方法,具体涉及采用新研发的Cas载体优化CRISPR/Cas9基因编辑方法,对猪进行基因编辑。
背景技术
转基因技术目前已被广泛用于生物生产、药物筛选和治疗等多个方面,但通常采用的病毒转染或转座子系统会导致随机和多拷贝插入,导致转基因表达的不稳定,并可能干扰内源基因的表达,且不可能达到纯合插入,导致外源基因较难稳定地遗传。
将外源基因插入基因组的特定位点需要采用基因编辑技术,该技术是近年来发展的一种生物技术,其包括从基于同源重组的基因敲入到基于核酸酶的ZFN、TALEN、CRISPR/Cas9等编辑手段,其中CRISPR/Cas9技术是当前最先进的基因编辑技术。目前,基因编辑技术被越来越多地应用到动植物及微生物的转基因中。
将外源基因稳定整合到基因组的安全港位点是目前较好的解决方案。例如,专利CN111088282A公开了AAVS1、H11安全港位点在重组表达蛋白中的应用,即利用人基因组上的AAVS1、H11位点作为整合位点高表达重组人血白蛋白,并且以人肝细胞直接作为表达细胞,得到的人血清白蛋白更加安全,大大降低了其安全性风险,但是该专利并没有完全公开安全位点的具体位置,同时,基于人与猪基因组序列的差异性比较大,是否可以将此安全位点直接用于猪,以及如何用于猪的基因编辑现有技术仍然无法确定。
发明内容
为解决上述问题,本发明以猪为研究对象,获得特定靶向猪基因组不同安全港位点的sgRNA,揭示适合外源基因表达的最佳安全位点靶向序列,同时,创造性的获得了优化的携带编码Cas蛋白核苷酸序列的Cas载体,显著提高了基因编辑效率,更重要的是可以稳定遗传,为基于猪基因组的研究如构建转基因猪模式动物奠定基础。
本发明的第一方面,提供了一种基因编辑的方法,所述的方法包括将包含外源基因的安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞。
所述的Cas载体包含编码Cas蛋白、EGFP和Puro蛋白的核苷酸序列。优选的,所述的Cas载体还包含EF1a启动子、WPRE元件和3’LTR序列元件。进一步优选的,所述的Cas载体的核苷酸序列从5’-3’依次为:CMV增强子、EF1a启动子、核定位信号NLS(优选为SV40NLS)、核定位信号NLS(优选为SV40 NLS)、编码Cas蛋白的核苷酸序列、核定位信号NLS(优选为nucleoplasmin NLS),核定位信号NLS(优选为nucleoplasmin NLS)、编码自剪切多肽P2A(自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”,发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)的核苷酸序列、编码EGFP的核苷酸序列、编码自裂解多肽T2A(自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”,发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)的核苷酸序列、编码Puro蛋白的核苷酸序列、WPRE序列元件、3’LTR序列元件和poly A信号序列元件(即bGH poly(A)signal序列元件)。
优选的,所述的Cas蛋白选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t,Cas5h,Cas5a、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx1O、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、C2c1、C2c2、C2c3、Cpf1、CARF、DinG、其同源物或其修饰形式。
在本发明的一个具体实施方式中,所述的Cas蛋白为Cas9蛋白。
在本发明的一个具体实施方式中,所述的Cas载体的核苷酸序列如SEQ ID NO:2所示。
所述的方法包括将包含外源基因的安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞中,使安全港位点载体上的外源基因分别整合入ROSA26、AAVS1、H11或COL1A1任一个或两个以上安全港位点。
例如,可以将包含外源基因的ROSA26安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞中,使ROSA26安全港位点载体上的外源基因整合入ROSA26安全港位点。或者将包含外源基因的AAVS1安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞中,使AAVS1安全港位点载体上的外源基因整合入AAVS1安全港位点。或者将包含外源基因的H11安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞中,使H11安全港位点载体上的外源基因整合入H11安全港位点。或者将包含外源基因的COL1A1安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞中,使COL1A1安全港位点载体上的外源基因整合入COL1A1安全港位点。
其中,外源基因可以代表一个单独的基因、两个基因的拼接或者具有某种功能的核苷酸片段。
当然,也可以按照上述描述将两个或其以上相同或者不同的外源基因同时分别整合入不同的安全港位点。
优选的,ROSA26安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO:8所示,AAVS1安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO:9所示,H11安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO:10所示,COL1A1安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO:11所示。
所述的sgRNA载体包含靶向ROSA26、AAVS1、H11或COL1A1安全港位点的sgRNA。优选的,靶向ROSA26的sgRNA的核苷酸序列如SEQ ID NO:45-48任一所示,靶向AAVS1的sgRNA的核苷酸序列如SEQ ID NO:49-52任一所示,靶向H11的sgRNA的核苷酸序列如SEQ ID NO:53-56任一所示,靶向COL1A1的sgRNA的核苷酸序列如SEQ ID NO:57-60任一所示。
所述的安全港位点载体包含与ROSA26、AAVS1、H11或COL1A1安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂。优选的,还包含绝缘子区域、EF-1d启动子,编码EGFP蛋白的核苷酸序列,EF-1d poly(A)信号序列,PGK启动子,编码mCherry蛋白的核苷酸序列,bGH poly(A)信号序列,loxP-puro-loxP表达框区域,pCAG启动子,和/或β-globinpoly(A)信号序列。进一步优选的,ROSA26安全港位点载体如SEQ ID NO:4所示,AAVS1安全港位点载体如SEQ ID NO:5所示,H11安全港位点载体如SEQ ID NO:6所示,COL1A1安全港位点载体如SEQ ID NO:7所示。
优选的,所述的安全港位点载体、sgRNA载体或Cas载体均为环状质粒。
优选的,所述的外源基因的核苷酸序列位于安全港位点5’同源臂与3’同源臂之间。其中,所述的外源基因可以为任何欲导入宿主细胞进行表达的基因,包括但不限于RAG1、绿色荧光蛋白(GFP)、红色荧光蛋白DsRed及其变体突变体mBanana、mOrange、dTomato、mTangerine、mStrawberry和mCherry,蓝色荧光蛋白(BFP)及其变体Azurite、橙色荧光蛋白及其变体mCitrine、mVenus、Topaz、YPet,黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)等等。
所述的宿主细胞来源于非人动物或人,所述的非人动物选自猪、狗、牛、羊、猴或小鼠。优选的,所述的宿主细胞来源于猪,进一步优选为猪的成纤维细胞。
优选的,所述的宿主细胞还可以选自胚胎干细胞、成体干细胞、造血干细胞、骨髓间充质干细胞、神经干细胞、肝干细胞、肌肉卫星细胞、皮肤表皮干细胞、肠上皮干细胞、视网膜干细胞、胰腺干细胞、体细胞、成纤维细胞、肌细胞、胶质细胞、脂肪细胞或生殖细胞等等。
本发明的第二方面,提供了一种Cas载体,所述的Cas载体包含编码Cas蛋白、EGFP和Puro蛋白的核苷酸序列。
优选的,所述的Cas载体还包含EF1a启动子、WPRE元件和3’LTR序列元件。进一步优选的,所述的Cas载体的核苷酸序列从5’-3’依次为:CMV增强子、EF1a启动子、核定位信号NLS(优选为SV40 NLS)、核定位信号NLS(优选为SV40 NLS)、编码Cas蛋白的核苷酸序列、核定位信号NLS(优选为nucleoplasmin NLS),核定位信号NLS(优选为nucleoplasmin NLS)、编码自剪切多肽P2A(自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”,发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)的核苷酸序列、编码EGFP的核苷酸序列、编码自裂解多肽T2A(自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”,发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)的核苷酸序列、编码Puro蛋白的核苷酸序列、WPRE序列元件、3’LTR序列元件和poly A信号序列元件(即bGH poly(A)signal序列元件)。
优选的,所述的Cas蛋白选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t,Cas5h,Cas5a、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、C2c1、C2c2、C2c3、Cpf1、CARF、DinG、其同源物或其修饰形式。
在本发明的一个具体实施方式中,所述的Cas蛋白为Cas9蛋白。
在本发明的一个具体实施方式中,所述的Cas载体的核苷酸序列如SEQ ID NO:2所示。
优选的,所述的Cas载体为环状质粒。
本发明的第三方面,提供了一种靶向ROSA26的sgRNA,所述的靶向ROSA26的sgRNA的核苷酸序列如SEQ ID NO:45-48任一所示。
本发明的第四方面,提供了一种靶向AAVS1的sgRNA,所述的靶向AAVS1的sgRNA的核苷酸序列如SEQ ID NO:49-52任一所示。
本发明的第五方面,提供了一种靶向H11的sgRNA,所述的靶向H11的sgRNA的核苷酸序列如SEQ ID NO:53-56任一所示。
本发明的第六方面,提供了一种靶向COL1A1的sgRNA,所述的靶向COL1A1的sgRNA的核苷酸序列如SEQ ID NO:57-60任一所示。
本发明的第七方面,提供了一种sgRNA载体,所述的sgRNA载体包含上述的靶向ROSA26、AAVS1、H11或COL1A1的sgRNA。
优选的,所述的sgRNA载体为环状质粒。
本发明的第八方面,提供了一种sgRNA载体的制备方法,所述的制备方法包括:
1)提供上述的靶向ROSA26、AAVS1、H11或COL1A1的sgRNA;
2)采用步骤1)中的sgRNA制备双链DNA分子;
3)将步骤2)获得的双链DNA分子连接至相应的载体骨架,获得相应的sgRNA载体。
优选的,所述的载体骨架的核苷酸序列如SEQ ID NO:3所示。
本发明的第九方面,提供了一种ROSA26安全港位点载体,所述的ROSA26安全港位点载体包含与ROSA26安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂。优选的,还包含绝缘子区域、EF-1d启动子,编码EGFP蛋白的核苷酸序列,EF-1dpoly(A)信号序列,PGK启动子,编码mCherry蛋白的核苷酸序列,bGH poly(A)信号序列,loxP-puro-loxP表达框区域,pCAG启动子,和/或β-globin poly(A)信号序列。进一步优选的,ROSA26安全港位点载体如SEQ ID NO:4所示。
所述的ROSA26安全港位点载体采用引物对SH1-L-F(SEQ ID NO:70)/SH1-L-R(SEQID NO:71)进行ROSA26安全港位点切点左侧(5’同源臂)基因组序列的PCR扩增,采用引物对SH1-R-F(SEQ ID NO:72)/SH1-R-R(SEQ ID NO:73)进行ROSA26安全港位点切点右侧(3’同源臂)基因组序列的PCR扩增。然后,选择8只猪中序列保守的区域进一步分别采用引物对SH1-LR-F(SEQ ID NO:75)/SH1-LR-R(SEQ ID NO:76)和SH1-RR-F(SEQ ID NO:77)/SH1-RR-R(SEQ ID NO:78)进行ROSA26安全港位点切点左侧和右侧基因组同源序列的扩增。
优选的,所述的安全港位点载体还包含外源基因的核苷酸序列,所述的外源基因的核苷酸序列位于安全港位点5’同源臂与3’同源臂之间。其中,所述的外源基因可以为任何欲导入宿主细胞进行表达的基因,包括但不限于RAG1、绿色荧光蛋白(GFP)、红色荧光蛋白DsRed及其变体突变体mBanana、mOrange、dTomato、mTangerine、mStrawberry和mCherry,蓝色荧光蛋白(BFP)及其变体Azurite、橙色荧光蛋白及其变体mCitrine、mVenus、Topaz、YPet,黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)等等。
本发明的第十方面,提供了一种AAVS1安全港位点载体,所述的AAVS1安全港位点载体包含与AAVS1安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂。优选的,还包含绝缘子区域、EF-1α启动子,编码EGFP蛋白的核苷酸序列,EF-1α poly(A)信号序列,PGK启动子,编码mCherry蛋白的核苷酸序列,bGH poly(A)信号序列,loxP-puro-loxP表达框区域,pCAG启动子,和/或β-globin poly(A)信号序列。进一步优选的,AAVS1安全港位点载体如SEQ ID NO:5所示。
所述的AAVS1安全港位点载体采用引物对SH2-L-F(SEQ ID NO:83)/SH2-L-R(SEQID NO:84)进行AAVS1安全港位点切点左侧基因组序列的PCR扩增,采用引物对SH2-R-F(SEQID NO:85)/SH2-R-R(SEQ ID NO:86)进行AAVS1安全港位点切点右侧基因组序列的PCR扩增。然后,选择8只猪中序列保守的区域进一步分别采用引物对SH2-LR-F(SEQ ID NO:87)/SH2-LR-R(SEQ ID NO:88)和SH2-RR-F(SEQ ID NO:89)/SH2-RR-R(SEQ ID NO:90)进行AAVS1安全港位点切点左侧和右侧基因组同源序列的扩增。
本发明的第十一方面,提供了一种H11安全港位点载体,所述的H11安全港位点载体包含与H11安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂。优选的,还包含绝缘子区域、EF-1α启动子,编码EGFP蛋白的核苷酸序列,EF-1α poly(A)信号序列,PGK启动子,编码mCherry蛋白的核苷酸序列,bGH poly(A)信号序列,loxP-puro-loxP表达框区域,pCA6启动子,和/或β-globin poly(A)信号序列。进一步优选的,H11安全港位点载体如SEQID NO:6所示。
所述的H11安全港位点载体采用引物对SH3-L-F(SEQ ID NO:95)/SH3-L-R(SEQ IDNO:96)进行H11安全港位点切点左侧基因组序列的PCR扩增,采用引物对SH3-R-F(SEQ IDNO:97)/SH3-R-R(SEQ ID NO:98)进行H11安全港位点切点右侧基因组序列的PCR扩增。然后,选择8只猪中序列保守的区域进一步分别采用引物对SH3-LR-F(SEQ ID NO:99)/SH3-LR-R(SEQ ID NO:100)和SH3-RR-F(SEQ ID NO:101)/SH3-RR-R(SEQ ID NO:102)进行H11安全港位点切点左侧和右侧基因组同源序列的扩增。
本发明的第十二方面,提供了一种COL1A1安全港位点载体,所述的COL1A1安全港位点载体包含与COL1A1安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂。优选的,还包含绝缘子区域、EF-1d启动子,编码EGFP蛋白的核苷酸序列,EF-1d poly(A)信号序列,PGK启动子,编码mCherry蛋白的核苷酸序列,bGH poly(A)信号序列,loxP-puro-loxP表达框区域,pCAG启动子,和/或β-globin poly(A)信号序列。进一步优选的,COL1A1安全港位点载体如SEQ ID NO:7所示。
所述的COL1A1安全港位点载体采用引物对SH4-L-F(SEQ ID NO:107)/SH4-L-R(SEQ ID NO:108)进行COL1A1安全港位点切点左侧基因组序列的PCR扩增,采用引物对SH4-R-F(SEQ ID NO:109)/SH4-R-R(SEQ ID NO:110)进行COL1A1安全港位点切点右侧基因组序列的PCR扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对SH4-LR-F(SEQ ID NO:111)/SH4-LR-R(SEQ ID NO:112)和SH4-RR-F(SEQID NO:113)/SH4-RR-R(SEQ ID NO:114)进行H1安全港位点切点左侧和右侧基因组同源序列的扩增。
本发明的第十三方面,提供了一种基因编辑的试剂盒,所述的试剂盒中包含上述的Cas载体、上述的sgRNA、上述的sgRNA载体和/或上述ROSA26、AAVS1、H11或COL1A1安全港位点载体。
本发明所述的sgRNA载体可以转录成gRNA与Cas蛋白结合为复合物,靶向结合猪基因组特定区域,引起预期的DNA切割,从而对猪基因组进行编辑。
术语“安全港位点”是染色体的一部分,当供体基因被整合进其中时,不会对宿主细胞或生物体产生不利影响,被用于基因安全敲入并能保证转入基因的正常稳定表达。参见Sadelain等人(2012)Nat.Rev.Cancer 12:51-58。
术语“载体”是细胞内能够在自身控制下复制的多核苷酸,或者通过插入到宿主细胞染色体进行复制和/或表达的遗传元件,例如质粒、染色体、病毒、转座子。合适的载体包括但不限于质粒、转座子、细菌噬菌体和粘粒。
本发明所述的“gRNA”,也称指导RNA,是由sgRNA载体在细胞中转录得到的,对细胞中的靶序列具有特异性并且可与Cas蛋白形成复合体的RNA。
附图说明
图1为质粒pX330的结构示意图。
图2为质粒pKG-GE3的结构示意图。
图3为质粒pKG-U6gRNA的结构示意图。
图4为将20bp左右的DNA分子(用于转录形成gRNA的靶序列结合区)插入质粒pKG-U6gRNA的示意图。
图5为ROSA26位点重组donor质粒的结构示意图。
图6为AAVS1位点重组donor质粒的结构示意图。
图7为H11位点重组donor质粒的结构示意图。
图8为COLiA1位点重组donor质粒的结构示意图。
图9A为实施例2中单gRNA质粒与Cas9质粒不同摩尔比的测序峰图。
图9B为实施例2中质粒pKG-GE3(RAG1-KG)与质粒pX330(RAG1-330)进行基因编辑的测序峰图。
图10为实施例3中以8只猪的基因组DNA为模板采用ROSA26-F195/ROSA26-R1092组成的引物对进行PCR扩增后的电泳图。
图11为实施例3中各种具有粘性末端的双链DNA分子,其中A对应ROSA26-g1S和ROSA26-g1A,B对应ROSA26-g2S和ROSA26-g2A,C对应ROSA26-g3S和ROSA26-g3A,D对应ROSA26-g4S和ROSA26-g4A。
图12为实施例4中以8只猪的基因组DNA为模板采用AAVS1-F101/AAVS1-R1088组成的引物对进行PCR扩增后的电泳图。
图13为实施例4中各种具有粘性末端的双链DNA分子,其中,A对应AAVS1-g1S和AAVS1-g1A,B对应AAVS1-g2S和AAVS1-g2A,C对应AAVS1-g3S和AAVS1-g3A,D对应AAVS1-g4S和AAVS1-g4A。
图14为实施例5中以8只猪的基因组DNA为模板采用H11-F3/H11-R843组成的引物对进行PCR扩增后的电泳图。
图15为实施例5中各种具有粘性末端的双链DNA分子,其中,A对应H11-g1S和H11-g1A,B对应H11-g2S和H11-g2A,C对应H11-g3S和H11-g3A,D对应H11-g4S和H11-g4A。
图16为实施例6中以8只猪的基因组DNA为模板采用COL1A1-F157/COL1A1-R1084组成的引物对进行PCR扩增后的电泳图。
图17为实施例6中各种具有粘性末端的双链DNA分子,其中,A对应COL1A1-g1S和COL1A1-g1A,B对应COL1A1-g2S和COL1A1-g2A,C对应COL1A1-g3S和COL1A1-g3A,D对应COL1A1-g4S和COL1A1-g4A。
图18为实施例3中采用ROSA26-F477和ROSA26-R899组成的引物对进行PCR扩增,然后进行测序确定不同靶点编辑效率的测序峰图。
图19为实施例4中采用AAVS1-F378和AAVS1-R749组成的引物对进行PCR扩增,然后进行测序确定不同靶点编辑效率的测序峰图。
图20为实施例5中采用H11-F194和H11-R574组成的引物对进行PCR扩增,然后进行测序确定不同靶点编辑效率的测序峰图。
图21为实施例6中采用COL1A1-F473和COL1A1-R870组成的引物对进行PCR扩增,然后进行测序确定不同靶点编辑效率的测序峰图。
图22为安全港位点调控GFP绿色荧光表达图片。
图23为安全港位点调控GFP转录水平荧光定量PCR结果。
图24为GFP基因的流式细胞荧光分选检测,以比较GFP基因整合入四个不同安全港位点后GFP蛋白的表达情况。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。完全培养液(%为体积比):15%胎牛血清(Gibco)+83%DMEM培养基(Gibco)+1%Penicillin-Streptomycin(Gibco)+1%HEPES(Solarbio)。细胞培养条件:37℃,5%CO2、5%O2的恒温培养箱。
实施例中的8只猪均为刚出生从江香猪,其中雌性4只(分别命名1、2、3、4)、雄性4只(分别命名为A、B、C、D)。
制备猪原代成纤维细胞的方法:①取猪耳组织0.5g,除毛,然后用75%酒精浸泡30-40s,然后用含5%(体积比)Penicillin-Streptomycin(Gibco)的PBS缓冲液洗涤5次,然后用PBS缓冲液洗涤一次;②用剪刀将组织剪碎,采用5mL1%胶原酶溶液(Sigma),37℃消化1h,然后500g离心5min,弃上清;③将沉淀用1mL完全培养液重悬,然后铺入含10mL完全培养基并已用0.2%明胶(VWR)封盘的直径为9cm的细胞培养皿中,培养至细胞长满皿底60%左右;④完成步骤③后,采用胰蛋白酶消化并收集细胞,使用细胞冻存液(90%完全培养基+10%DMSO,体积比)将细胞冻存。
用于实施例2至5的猪原代成纤维细胞均获自上述命名为1的猪原代成纤维细胞(雌性,血型AO)。
实施例1:质粒的制备
制备质粒pX330-U6-Chimeric_BB-CBh-hSpCas9,如SEQ ID NO:1所示。质粒pX330-U6-Chimeric_BB-CBh-hSpCas9,简称质粒pX330。
制备质粒pU6gRNAeEF1a-mNLS-hSpCas9-EGFP-PURO,如SEQ ID NO:2所示。质粒pU6gRNAeEF1a-mNLS-hSpCas9-EGFP-PURO,简称质粒pKG-GE3。
制备质粒pKG-U6gRNA,如SEQ ID NO:3所示。pKG-U6gRNA结构示意图见图3。
制备质粒PB-1G 2R 3-puro-ROSA26,如SEQ ID NO:4所示,质粒PB-1G 2R 3-puro-ROSA26,简称ROSA26质粒。ROSA26质粒的结构示意图见图5。
制备质粒PB-1G 2R 3-puro-AAVS1,如SEQ ID NO:5所示,质粒PB-1G 2R 3-puro-AAVS1,简称AAVS1质粒。AAVS1质粒的结构示意图见图6。
制备质粒PB-1G 2R 3-puro-H11,如SEQ ID NO:6所示,质粒PB-1G 2R 3-puro-H11,简称H11质粒。H11质粒的结构示意图见图7。
制备质粒PB-1G 2R 3-puro-COL1A1,如SEQ ID NO:7所示,质粒PB-1G 2R 3-puro-COL1A1,简称COL1A1质粒。SH4质粒的结构示意图见图8。
质粒pX330、质粒pKG-GE3、质粒pKG-U6gRNA、质粒ROSA26、质粒AAVS1、质粒H11、质粒COL1A1均为环形质粒。
质粒pX330的结构示意图见图1。SEQ ID NO:1中,第440-725位核苷酸组成CMV增强子,第727-1208位核苷酸组成chickenβ-actin启动子,第1304-1324位核苷酸编码SV40核定位信号(NLS),第1325-5449位核苷酸编码Cas9蛋白,第5450-5497位核苷酸编码nucleoplasmin核定位信号(NLS)。
质粒pKG-GE3的结构示意图见图2。SEQ ID NO:2中,第395-680位核苷酸组成CMV增强子,第682-890位核苷酸组成EF1a启动子,第986-1006位核苷酸编码核定位信号(NLS),第1016-1036位核苷酸编码核定位信号(NLS),第1037-5161位核苷酸编码Cas9蛋白,第5162-5209位核苷酸编码核定位信号(NLS),第5219-5266位核苷酸编码核定位信号(NLS),第5276-5332位核苷酸编码自剪切多肽P2A(自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”,发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间),第5333-6046位核苷酸编码EGFP蛋白,第6056-6109位核苷酸编码自裂解多肽T2A(自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”,发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间),第6110-6703位核苷酸编码Puromycin蛋白(简称Puro蛋白),第6722-7310位核苷酸组成WPRE序列元件,第7382-7615位核苷酸组成3’LTR序列元件,第7647-7871位核苷酸组成bGH poly(A)signal序列元件。SEQID NO:2中,第911-6706形成融合基因,表达融合蛋白。由于自剪切多肽P2A和自裂解多肽T2A的存在,融合蛋白自发形成如下三个蛋白:具有Cas9蛋白的蛋白、具有EGFP蛋白的蛋白和具有Puro蛋白的蛋白。
与质粒pX330相比,质粒pKG-GE3主要进行了如下改造:①去除残留的gRNA骨架序列(GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTTT),降低干扰;②将原有chickenβ-actin启动子改造为具更高表达活性的EF1a启动子,增加Cas9基因的蛋白表达能力;③在Cas9基因的上游和下游均增加核定位信号编码基因(NLS),增加Cas9蛋白的核定位能力;④原质粒无任何真核细胞筛选标记,不利于阳性转化细胞的筛选和富集,依次在Cas9基因的下游插入P2A-EGFP-T2A-PURO编码基因,赋予载体荧光和真核细胞抗性筛选能力;⑤插入WPRE元件和3’LTR序列元件,增强Cas9基因的蛋白翻译能力。
质粒pKG-U6gRNA的结构示意图见图3。SEQ ID NO:3中,第2280-2539位核苷酸组成hU6启动子,第2558-2637位核苷酸用于转录形成gRNA骨架。使用时,将20bp左右的DNA分子(用于转录形成gRNA的靶序列结合区)插入质粒pKG-U6gRNA,形成重组质粒,示意图见图4,在细胞中重组质粒转录得到gRNA。
SEQ ID NO:4中,第1-345位核苷酸组成ROSA26安全港位点左侧猪基因组区域(SH1左臂),第9184-10195位核苷酸组成ROSA26安全港位点右侧猪基因组区域(SH1右臂),第346-546、3132-3531、6506-6707、8975-9175位核苷酸分别组成4个不同的绝缘子区域,第1954-3131位核苷酸组成EF-1d启动子,第1216-1935位核苷酸编码EGFP蛋白,第637-1209位核苷酸组成EF-1α poly(A)信号,第3543-4042位核苷酸组成PGK启动子,第4059-5769位核苷酸编码mCherry蛋白,第4791-5015位核苷酸组成bGH poly(A)信号,第5054-6504位核苷酸为loxP-puro-loxP表达框区域,第7259-8974位核苷酸组成pCAG启动子,第6969-7233位核苷酸组成β-globin poly(A)信号。
SEQ ID NO:5中,第1-1081位核苷酸组成AAVS1安全港位点左侧猪基因组区域(SH2左臂),第9920-10179位核苷酸组成AAVS1安全港位点右侧猪基因组区域(SH2右臂),第1082-1282、3868-4267、7242-7442、9711-9911位核苷酸分别组成4个不同的绝缘子区域,第1373-1945位核苷酸组成EF-1d启动子,第1952-2671位核苷酸编码EGFP蛋白,第2690-3867位核苷酸组成EF-1α poly(A)信号,第4279-4778位核苷酸组成PGK启动子,第4795-5502位核苷酸编码mCherry蛋白,第5527-5751位核苷酸组成bGH poly(A)信号,第5790-7240位核苷酸为loxP-puro-loxP表达框区域,第7995-9710位核苷酸组成pCAG启动子,第7705-7969位核苷酸组成β-globin poly(A)信号。
SEQ ID NO:6中,第1-555位核苷酸组成H11安全港位点左侧猪基因组区域(SH3左臂),第9394-10402位核苷酸组成H11安全港位点右侧猪基因组区域(SH3右臂),第556-756、3342-3741、6716-6916、9185-9385位核苷酸分别组成4个不同的绝缘子区域,第2164-3341位核苷酸组成EF-1α启动子,第1426-2145位核苷酸编码EGFP蛋白,第847-1419位核苷酸组成EF-1d poly(A)信号,第3753-4252位核苷酸组成PGK启动子,第4269-4979位核苷酸编码mCherry蛋白,第5001-5225位核苷酸组成bGH poly(A)信号,第5264-6714位核苷酸为loxP-puro-loxP表达框区域,第7469-9184位核苷酸组成pCA6启动子,第7179-7443位核苷酸组成β-globin poly(A)信号。
SEQ ID NO:7中,第1-886位核苷酸组成COL1A1安全港位点左侧猪基因组区域(SH4左臂),第9725-10451位核苷酸组成Col1A1安全港位点右侧猪基因组区域(SH4右臂),第887-1087、3673-4072、7047-7247、9516-9716位核苷酸分别组成4个不同的绝缘子区域,第2495-3672位核苷酸组成EF-1d启动子,第1757-2476位核苷酸编码EGFP蛋白,第1178-1750位核苷酸组成EF-1d poly(A)信号,第4084-4583位核苷酸组成PGK启动子,第4600-5310位核苷酸编码mCherry蛋白,第5332--5556位核苷酸组成bGH poly(A)信号,第5595-7045位核苷酸为loxP-puro-loxP表达框区域,第7800-9515位核苷酸组成pCA6启动子,第7510-7774位核苷酸组成β-globin poly(A)信号。
实施例2:质粒pX330和质粒pKG-GE3的效果比较
选择位于RAG1基因的高效gRNA靶点:
RAG1-gRNA4的靶点:5’-AGTTATGGCAGAACTCAGTG-3’(SEQ ID NO:61)。
用于扩增包含靶点的片段的引物为:
RAG1-nF126:5’-CCCCATCCAAAGTTTTTAAAGGA-3’(SEQ ID NO:62);
RAG1-nR525:5’-TGTGGCAGATGTCACAGTTTAGG-3’(SEQ ID NO:63)。
一、制备重组质粒
取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。
分别合成RAG1-4S和RAG1-4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG1-4)。
RAG1-4S:5’-caccgAGTTATGGCAGAACTCAGTG-3’(SEQ ID NO:64);
RAG1-4A:5’-aaacCACTGAGTTCTGCCATAACTc-3’(SEQ ID NO:65)。
二、质粒配比优化
1、组别
第一组:将质粒pKG-U6gRNA(RAG1-4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.44μg质粒pKG-U6gRNA(RAG1-4):1.56μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-4)和质粒pKG-GE3的摩尔配比为:1∶1。
第二组:将质粒pKG-U6gRNA(RAG1-4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.72μg质粒pKG-U6gRNA(RAG1-4):1.28μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-4)和质粒pKG-GE3的摩尔配比为:2∶1。
第三组:将质粒pKG-U6gRNA(RAG1-4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(RAG1-4):1.08μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-4)和质粒pKG-GE3的摩尔配比为:3∶1。
第四组:将质粒pKG-U6gRNA(RAG1-4)转染致猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1μg质粒pKG-U6gRNA(RAG1-4)。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用RAG1-nF126和RAG1-nR525组成的引物对进行PCR扩增,然后进行电泳。
电泳后回收目的条带并进行测序,测序结果见图9A。
通过利用SynthegoICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第四组的编辑效率依次为9%、53%、66%和0%。结果表明,第三组编辑效率最高,确定单gRNA质粒与Cas9质粒最适用量为摩尔比3∶1,质粒实际用量为0.92μg∶1.08μg。
三、质粒pX330和质粒pKG-GE3的效果比较
1、共转染
RAG1-B组:将质粒pKG-U6gRNA(RAG1-4)转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(RAG1-4)。
RAG1-330组:将质粒pKG-U6gRNA(RAG1-4)和质粒pX330共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(RAG1-gRNA4):1.08μg质粒pX330。
RAG1-KG组:将质粒pKG-U6gRNA(RAG1-4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(RAG1-4):1.08μg质粒pKG-GE3。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用RAG1-nF126和RAG1-nR525组成的引物对进行PCR扩增,将产物进行测序。测序结果利用网页版SynthegoICE工具分析测序峰图得出RAG1-330组、RAG1-KG组的编辑效率分别为28%、68%,测序结果示例性峰图见图9B,结果表明,与采用质粒pX330相比,采用质粒pKG-GE3使得基因编辑效率显著提高。
实施例3:ROSA26安全港位点猪基因组区域定位及ROSA26的高效切割靶点筛选
一、猪ROSA26安全港位点及其临近基因组序列的保守性分析
猪ROSA26安全港位点信息:通过将小鼠的ROSA26安全港位点序列与猪全基因组序列进行比对,将猪的ROSA26安全港位点区域定位在猪13号染色体,该区域及其上下游500bp序列如SEQ ID NO:8所示。
分别以8只猪的基因组DNA为模板,采用引物ROSA26-F195/ROSA26-R1092组成的引物对进行PCR扩增,然后进行电泳,见图10。回收PCR扩增产物并进行测序,将测序结果与公共数据库中的基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:ROSA26-F477/ROSA26-R899。
ROSA26-F195:5’-ACAGGTGAGGAGAAAGCCAATGG-3’(SEQ ID NO:66);
ROSA26-R1092:5’-CTGCGCAACGTGGCAGGAAG-3’(SEQ ID NO:67);
ROSA26-F477:5’-GCATAAAATCAGGCTTAGGTGTTGC-3’(SEQ ID NO:68);
ROSA26-R899:5’-GGTGGGAGGCGCATGTTCTCC-3’(SEQ ID NO:69)。
二、筛选靶点
通过筛选NGG(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。
4个靶点分别如下:
SgRNAROSA26-g1靶点:5’-CCAAGAATCAGGTTAAGCCA-3’(SEQ ID NO:45);
sgRNAR0SA26-g2靶点:5’-CGAGAAGGAGCAAACTGACA-3’(SEQ ID NO:46);
SgRNAROSA26-g3靶点:5’-GAAGGAGCAAACTGACATGG-3’(SEQ ID NO:47);
SgRNAROSA26-g4靶点:5’-CAGGACAACGCCCAAGAATC-3’(SEQ ID NO:48)。
三、制备重组质粒
取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。
分别合成ROSA26-g1S和ROSA26-g1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图11A)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(ROSA26-g1)。质粒pKG-U6gRNA(ROSA26-g1)表达SEQ ID NO:115所示的sgRNAROSA26-g1
SEQ ID NO:115:
分别合成ROSA26-g2S和ROSA26-g2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图11B)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(ROSA26-g2)。质粒pKG-U6gRNA(ROSA26-g2)表达SEQ ID NO:116所示的sgRNAROSA26-g2
SEQ ID NO:116:
分别合成ROSA26-g3S和ROSA26-g3A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图11C)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(ROSA26-g3)。质粒pKG-U6gRNA(ROSA26-g3)表达SEQ ID NO:117所示的sgRNAROsA26-g3
SEQ ID NO:117:
分别合成ROSA26-g4S和ROSA26-g4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图11D)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(ROSA26-g4)。质粒pKG-U6gRNA(ROSA26-g4)表达SEQ ID NO:118所示的sgRNAROSA26-g4
SEQ ID NO:118:
sgRNA-ROSA26-1S:5’-caccgCCAAGAATCAGGTTAAGCCA-3’;SEQ ID NO:13
sgRNA-ROSA26-1A:5’-aaacTGGCTTAACCTGATTCTTGGc-3’。SEQ ID NO:14
sgRNA-ROSA26-2S:5’-caccgCGAGAAGGAGCAAACTGACA-3’;SEQ ID NO:15
sgRNA-ROSA26-2A:5’-aaacTGTCAGTTTGCTCCTTCTCGc-3’。SEQ ID NO:16
sgRNA-ROSA26-3S:5’-caccGAAGGAGCAAACTGACATGG-3’;SEQ ID NO:17
sgRNA-ROSA26-3A:5’-aaacCCATGTCAGTTTGCTCCTTC-3’。SEQ ID NO:18
sgRNA-ROSA26-4S:5’-caccgCAGGACAACGCCCAAGAATC-3’;SEQ ID NO:19
sgRNA-ROSA26-4A:5’-aaacGATTCTTGGGCGTTGTCCTGc-3’。SEQ ID NO:20
sgRNA-ROSA26-1S、sgRNA-ROSA26-1A、sgRNA-ROSA26-2S、sgRNA-ROSA26-2A、sgRNA-ROSA26-3S、sgRNA-ROSA26-3A、sgRNA-ROSA26-4S、sgRNA-ROSA26-4A均为单链DNA分子。
四、不同靶点的编辑效率比较
1、共转染
第一组:将质粒pKG-U6gRNA(ROSA26-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(ROSA26-g1):1.08μg质粒pKG-GE3。
第二组:将质粒pKG-U6gRNA(ROSA26-g2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(ROSA26-g2):1.08μg质粒pKG-GE3。
第三组:将质粒pKG-U6gRNA(ROSA26-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(ROSA26-g3):1.08μg质粒pKG-GE3。
第四组:将质粒pKG-U6gRNA(ROSA26-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(ROSA26-g4):1.08μg质粒pKG-GE3。
第五组:猪原代成纤维细胞,未进行任何转染操作。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用ROSA26-F477和ROSA26-R899组成的引物对进行PCR扩增,然后进行电泳并测序,结果见图18。
通过利用SynthegoICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组的编辑效率依次为35%、3%、38%、14%和0%。结果表明,第三组编辑效率最高,sgRNAROSA26-g3为最优靶点。
五、高效靶点两侧基因组区域同源臂序列扩增
分别以8只猪的基因组DNA为模板,采用引物对SH1-L-F/SH1-L-R进行ROSA26安全港位点切点左侧基因组序列的PCR扩增,采用引物对SH1-R-F/SH1-R-R进行ROSA26安全港位点切点右侧基因组序列的PCR扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对SH1-LR-F/SH1-LR-R和SH1-RR-F/SH1-RR-R进行ROSA26安全港位点切点左侧和右侧基因组同源序列的扩增。
SH1-L-F:5’-GACTCATTTCCCATCTCCACCCC-3’;SEQ ID NO:70
SH1-L-R:5’-ATGGGTGCTTGAGGTGGTCTGAC-3’;SEQ ID NO:71
SH1-R-F:5’-GGGTAAGGACTATGGAGGGTAGC-3’;SEQ ID NO:72
SH1-R-R∶5’-TCTCTGCTGCCTCCTTTTCCTAA-3’;SEQ ID NO:73
SH1-LR-F:5’-TCTTGTTATAGATATCGGCGCGCCCTCTACCTGCTCTCGGACCCGTGGG-3’;SEQID NO:75
SH1-LR-R:5’-CCAGGCCCGGGTCTGGGGCGCGCCAGGGCAAAAGAATCCCGCCCATAATCG-3’;SEQ ID NO:76
SH1-RR-F:5’-AGCCATTGTACGCGTTGCTTAACCTGATTCTTGGGCGTTGTCCTG-3’;SEQ IDNO:77
SH1-RR-R:5’-CTTTTATGGCGGCCGCATAAGTACTTTTTGTAGGCATGTGTGGAAAATTG-3’。SEQID NO:78
实施例4:AAVS1安全港位点猪基因组区域定位及AAVS1的高效切割靶点筛选
一、猪AAVS1安全港位点信息:通过将人的AAVS1安全港位点序列与猪全基因组序列进行比对,将猪的AAVS1安全港位点区域定位在猪6号染色体PPP1R12C基因内,该区域及其上下游500bp序列如SEQ ID NO:9所示。
分别以8只猪的基因组DNA为模板,采用引物AAVS1-F101/AAVS1-R1088组成的引物对进行PCR扩增,然后进行电泳,见图12。回收PCR扩增产物并进行测序,将测序结果与公共数据库中的基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:AAVS1-F378/AAVS1-R749。
AAVS1-F101:5’-CTGTAGGCTCTCTCTTGGGGATG-3’;SEQ ID NO:79
AAVS1-R1088:5’-AGCCGATTAAGACCCCAGCATAG-3’;SEQ ID NO:80
AAVS1-F378:5’-TGCTAGGTCCTCTCTCTCCACAA-3’;SEQ ID NO:81
AAVS1-R749:5’-CTCTTCAGGCATCCTCCCCATTC-3’。SEQ ID NO:82
二、筛选靶点
通过筛选NGG(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。
4个靶点分别如下:
sgRNAAAVS1-g1靶点:5’-AAGACCCACTGCAGCCAGGC-3’;SEQ ID NO:49
sgRNAAAVS1-g2靶点:5’-GAGGAGTAGAGGCTCTTCTG-3’;SEQ ID NO:50
sgRNAAAVS1-g3靶点:5’-CCCAAAGACCCACTGCAGCC-3’;SEQ ID NO:51
sgRNAAAVS1-g4靶点:5’-TGCAGTGGGTCTTTGGGGAC-3’。SEQ ID NO:52
三、制备重组质粒
取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。
分别合成AAVS1-g1S和AAVS1-g1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图13A)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(AAVS1-g1)。质粒pKG-U6gRNA(AAVS1-g1)表达SEQ ID NO:119所示的sgRNAAAVS1-g1
SEQ ID NO:119:
分别合成AAVS1-g2S和AAVS1-g2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图13B)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(AAVS1-g2)。质粒pKG-U6gRNA(AAVS1-g2)表达SEQ ID NO:120所示的sgRNAAAVS1-g2
SEQ ID NO:120:
分别合成AAVS1-g3S和AAVS1-g3A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图13C)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(AAVS1-g3)。质粒pKG-U6gRNA(AAVS1-g3)表达SEQ ID NO:121所示的sgRNAAAVS1-g3
SEQ ID NO:121:
分别合成AAVS1-g4S和AAVS1-g4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图13D)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(AAVS1-g4)。质粒pKG-U6gRNA(AAVS1-g4)表达SEQ ID NO:122所示的sgRNAAAVS1-g4
SEQ ID NO:122:
sgRNA-AAVS1-1S:5’-caccgAAGACCCACTGCAGCCAGGC-3’;SEQ ID NO:21
sgRNA-AAVS1-1A:5’-aaacGCCTGGCTGCAGTGGGTCTTc-3’。SEQ ID NO:22
sgRNA-AAVS1-2S:5’-caccgGAGGAGTAGAGGCTCTTCTG-3’;SEQ ID NO:23
sgRNA-AAVS1-2A:5’-aaacCAGAAGAGCCTCTACTCCTCc-3’。SEQ ID NO:24
sgRNA-AAVS1-3S:5’-caccgCCCAAAGACCCACTGCAGCC-3’;SEQ ID NO:25
sgRNA-AAVS1-3A:5’-aaacGGCTGCAGTGGGTCTTTGGGc-3’。SEQ ID NO:26
sgRNA-AAVS1-4S:5’-caccgTGCAGTGGGTCTTTGGGGAC-3’;SEQ ID NO:27
sgRNA-AAVS1-4A:5’-aaacGTCCCCAAAGACCCACTGCAc-3’。SEQ ID NO:28
sgRNA-AAVS1-1S、sgRNA-AAVS1-1A、sgRNA-AAVS1-2S、sgRNA-AAVS1-2A、sgRNA-AAVS1-3S、sgRNA-AAVS1-3A、sgRNA-AAVS1-4S、sgRNA-AAVS1-4A均为单链DNA分子。
四、不同靶点的编辑效率比较
1、共转染
第一组:将质粒pKG-U6gRNA(AAVS1-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(AAVS1-g1):1.08μg质粒pKG-GE3。
第二组:将质粒pKG-U6gRNA(AAVS1-g2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(AAVS1-g2):1.08μg质粒pKG-GE3。
第三组:将质粒pKG-U6gRNA(AAVS1-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(AAVS1-g3):1.08μg质粒pKG-GE3。
第四组:将质粒pKG-U6gRNA(AAVS1-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(AAVS1-g4):1.08μg质粒pKG-GE3。
第五组:猪原代成纤维细胞,未进行任何转染操作。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用AAVS1-F378和AAVS1-R749组成的引物对进行PCR扩增,然后进行电泳并测序,结果见图19。
通过利用SynthegoICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组的编辑效率依次为5%、27%、4%、30%和0%。结果表明,第四组编辑效率最高,sgRNAAAVS1-g4为最优靶点。
五、高效靶点两侧基因组区域同源臂序列扩增
分别以8只猪的基因组DNA为模板,采用引物对SH2-L-F/SH2-L-R进行AAVS1安全港位点切点左侧基因组序列的PCR扩增,采用引物对SH2-R-F/SH2-R-R进行AAVS1安全港位点切点右侧基因组序列的PCR扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对SH2-LR-F/SH2-LR-R和SH2-RR-F/SH2-RR-R进行AAVS1安全港位点切点左侧和右侧基因组同源序列的扩增。
SH2-L-F:5’-CGTGCTGAGTCCTTTTCCCATC-3’;SEQ ID NO:83
SH2-L-R:5’-CCCCAAAGTAACCGAACCTGACG-3’;SEQ ID NO:84
SH2-R-F:5’-CTGCCTCCATTGGTCTTGTGTTC-3’;SEQ ID NO:85
SH2-R-R:5’-GTGCAGCTCCTCAGGAAGTGG-3’;SEQ ID NO:86
SH2-LR-F:5’-TCTTGTTATAGATATCGGCGCGCCGTGCTGAGTCCTTTTCCCATCCCACCCACCTG-3’;SEQ ID NO:87
SH2-LR-R:5’-CCAGGCCCGGGTCTGGGGCGCCCAAAGACCCACTGCAGCCAGGCAGG-3’;SEQ IDNO:88
SH2-RR-F:5’-AGCCATTGTACGCGTTGGACAGGCCACAGAAGAGCCTCTACTCCTC-3’;SEQ IDNO:89
SH2-RR-R:5’-CTTTTATGGCGGCCGCATTTTCCCTGAACTGCTCCTCTTCTGGG-3’。SEQ IDNO:90
实施例5:H11安全港位点猪基因组区域定位及H11的高效切割靶点筛选
一、猪H11安全港位点信息:猪H11安全港位点位于Drg1和Eif4enif1基因之间的间隔区,该区域及其上下游500bp序列如SEQ ID NO:10所示。
分别以8只猪的基因组DNA为模板,采用引物H11-F3/H11-R843组成的引物对进行PCR扩增,然后进行电泳,见图14。回收PCR扩增产物并进行测序,将测序结果与公共数据库中的基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:H11-F194/H11-R574。
H11-F3:5’-TGGCTTTGCTTGGTACCTACATCT-3’;SEQ ID NO:91
H11-R843:5’-TTAGGGAAAATGGGGCCTCAGAG-3’;SEQ ID NO:92
H11-F194:5’-TGCGAGAATTCTAAACTGGAGTA-3’;SEQ ID NO:93
H11-R574:5’-GGTGACAGTCTCAAGCTCCTCAA-3’。SEQ ID NO:94
二、筛选靶点
通过筛选NGG(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。
4个靶点分别如下:
sgRNAH11-g1靶点:5’-TTCCAGGAACATAAGAAAGT-3’;SEQ ID NO:53
sgRNAH11-g2靶点:5’-TGTTCCTGGAAGTTTAGATC-3’;SEQ ID NO:54
sgRNAH11-g3靶点:5’-AGGCTACACTGTTAACACTC-3’;SEQ ID NO:55
sgRNAH11-g4靶点:5’-GACCTACTTTCTTATGTTCC-3’。SEQ ID NO:56
三、制备重组质粒
取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。
分别合成H11-g1S和H11-g1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图15A)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(H11-g1)。质粒pKG-U6gRNA(H11-g1)表达SEQ ID NO:123所示的sgRNAH11-g1
SEQ ID NO:123:
分别合成H11-g2S和H11-g2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图15B)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(H11-g2)。质粒pKG-U6gRNA(H11-g2)表达SEQ ID NO:124所示的sgRNAH11-g2
SEQ ID NO:124:
分别合成H11-g3S和H11-g3A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图15C)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(H11-g3)。质粒pKG-U6gRNA(H11-g3)表达SEQ ID NO:125所示的sgRNAH11-g3
SEQ ID NO:125:
分别合成H11-g4S和H11-g4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图15D)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(H11-g4)。质粒pKG-U6gRNA(H11-g4)表达SEQ ID NO:126所示的sgRNAH11-g4
SEQ ID NO:126:
sgRNA-H11-1S:5’-caccgTTCCAGGAACATAAGAAAGT-3’;SEQ ID NO:29
sgRNA-H11-1A:5’-aaacACTTTCTTATGTTCCTGGAAc-3’。SEQ ID NO:30
sgRNA-H11-2S:5’-caccgTGTTCCTGGAAGTTTAGATC-3’;SEQ ID NO:31
sgRNA-H11-2A:5’-aaacGATCTAAACTTCCAGGAACAc-3’。SEQ ID NO:32
sgRNA-H11-3S:5’-caccgAGGCTACACTGTTAACACTC-3’;SEQ ID NO:33
sgRNA-H11-3A:5’-aaacGAGTGTTAACAGTGTAGCCTc-3’。SEQ ID NO:34
sgRNA-H11-4S:5’-caccgGACCTACTTTCTTATGTTCC-3’;SEQ ID NO:35
sgRNA-H11-4A:5’-aaacGGAACATAAGAAAGTAGGTCc-3’。SEQ ID NO:36
sgRNA-H11-1S、sgRNA-H11-1A、sgRNA-H11-2S、sgRNA-H11-2A、sgRNA-H11-3S、sgRNA-H11-3A、sgRNA-H11-4S、sgRNA-H11-4A均为单链DNA分子。
四、不同靶点的编辑效率比较
1、共转染
第一组:将质粒pKG-U6gRNA(H11-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(H11-g1):1.08μg质粒pKG-GE3。
第二组:将质粒pKG-U6gRNA(H11-g2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(H11-g2):1.08μg质粒pKG-GE3。
第三组:将质粒pKG-U6gRNA(H11-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(H11-g3):1.08μg质粒pKG-GE3。
第四组:将质粒pKG-U6gRNA(H11-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(H11-g4):1.08μg质粒pKG-GE3。
第五组:猪原代成纤维细胞,未进行任何转染操作。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用H11-F194和H11-R574组成的引物对进行PCR扩增,然后进行电泳并测序,结果见图20。
通过利用SynthegoICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组的编辑效率依次为60%、27%、26%、0%和0%。结果表明,第一组编辑效率最高,sgRNAH11-g1为最优靶点。
五、高效靶点两侧基因组区域同源臂序列扩增
分别以8只猪的基因组DNA为模板,采用引物对SH3-L-F/SH3-L-R进行H11安全港位点切点左侧基因组序列的PCR扩增,采用引物对SH3-R-F/SH3-R-R进行H11安全港位点切点右侧基因组序列的PCR扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对SH3-LR-F/SH3-LR-R和SH3-RR-F/SH3-RR-R进行H1安全港位点切点左侧和右侧基因组同源序列的扩增。
SH3-L-F:5’-AGACAGACCATGCTCAATCCACA-3’;SEQ ID NO:95
SH3-L-R:5’-GATGCCCGATGTTGTCAATCCTG-3’;SEQ ID NO:96
SH3-R-F:5’-AAGATACTCAGCAGCAGTCTCCT-3’;SEQ ID NO:97
SH3-R-R:5’-GATGGACAGGTGAAGCAGGCAAG-3’;SEQ ID NO:98
SH3-LR-F:5’-TCTTGTTATAGATATCGGCGCGCCCAAATACCCACGTTTATTGGGACAAAAG-3’;SEQ ID NO:99
SH3-LR-R:5’-CCAGGCCCGGGTCTGGGGCGCGTTCTTATGTTCCTGGAAGTTTAGATCAG-3’;SEQID NO:100
SH3-RR-F:5’-AGCCATTGTACGCGTTGAGTAGGTCACATTTCAGTAAAACCTGG-3’;SEQ IDNO:101
SH3-RR-R:5’-CTTTTATGGCGGCCGCATCTTTTCTACGGCCACTTCCAGGGCATATGG-3’。SEQID NO:102
实施例6:Col1A1安全港位点猪基因组区域定位及Col1A1的高效切割靶点筛选
一、猪COL1A1安全港位点信息:猪Col1A1安全港位点位于Col1A1基因的下游区域,该区域及其上下游500bp序列如SEQ ID NO:11所示。
分别以8只猪的基因组DNA为模板,采用引物COL1A1-F157/COL1A1-R1084组成的引物对进行PCR扩增,然后进行电泳,见图16。回收PCR扩增产物并进行测序,将测序结果与公共数据库中的基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:COL1A1-F473/COL1A1-R870。
COL1A1-F157:5’-TGACCCAAACCAATCTTGCACTG-3’;SEQ ID NO:103
COL1A1-R1084:5’-TGAGTTCTGGCTTCCTGGATTCT-3’;SEQ ID NO:104
COL1A1-F473:5’-GATGCCACCAACTCTCTCGCTC-3’;SEQ ID NO:105
COL1A1-R870:5’-CCAGAGGTCTCATGTTTGGGGAA-3’。SEQ ID NO:106
二、筛选靶点
通过筛选NGG(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。
4个靶点分别如下:
sgRNACOL1A1-g1靶点:5’-CTACCAAGAGAGTGACCAGC-3’;SEQ ID NO:57
sgRNACOL1A1-g2靶点:5’-GGTCCTGCTGGTCACTCTCT-3’;SEQ ID NO:58
sgRNACOL1A1-g3靶点:5’-GCAGTCTCAGCAACCACTGA-3’;SEQ ID NO:59
sgRNACOL1A1-g4靶点:5’-AGCCAGCAACAAGGCTCAAG-3’。SEQ ID NO:60
三、制备重组质粒
取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。
分别合成COL1A1-g1S和COL1A1-g1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图17A)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(COL1A1-g1)。质粒pKG-U6gRNA(COL1A1-g1)表达SEQ ID NO:127所示的sgRNACOL1A1-g1
SEQ ID NO:127:
分别合成COL1A1-g2S和COL1A1-g2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图17B)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(COL1A1-g2)。质粒pKG-U6gRNA(COL1A1-g2)表达SEQ ID NO:128所示的sgRNACOL1A1-g2
SEQ ID NO:128:
分别合成COL1A1-g3S和COL1A1-g3A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图17C)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(COL1A1-g3)。质粒pKG-U6gRNA(COL1A1-g3)表达SEQ ID NO:129所示的sgRNACOL1A1-g3
SEQ ID NO:129:
分别合成COL1A1-g4S和COL1A1-g4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图17D)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(COL1A1-g4)。质粒pKG-U6gRNA(COL1A1-g4)表达SEQ ID NO:130所示的sgRNACOL1A1-g4
SEQ ID NO:130:
sgRNA-COL1A1-1S:5’-caccgCTACCAAGAGAGTGACCAGC-3’;SEQ ID NO:37
sgRNA-COL1A1-1A:5’-aaacGCTGGTCACTCTCTTGGTAGc-3’。SEQ ID NO:38
sgRNA-COL1A1-2S:5’-caccgGGTCCTGCTGGTCACTCTCT-3’;SEQ ID NO:39
sgRNA-COL1A1-2A:5’-aaacAGAGAGTGACCAGCAGGACCc-3’。SEQ ID NO:40
sgRNA-COL1A1-3S:5’-caccgGCAGTCTCAGCAACCACTGA-3’;SEQ ID NO:41
sgRNA-COL1A1-3A:5’-aaacTCAGTGGTTGCTGAGACTGCc-3’。SEQ ID NO:42
sgRNA-COL1A1-4S:5’-caccgAGCCAGCAACAAGGCTCAAG-3’;SEQ ID NO:43
sgRNA-COL1A1-4A:5’-aaacCTTGAGCCTTGTTGCTGGCTc-3’。SEQ ID NO:44
sgRNA-COL1A1-1S、sgRNA-COL1A1-1A、sgRNA-COL1A1-2S、sgRNA-COL1A1-2A、sgRNA-COL1A1-3S、sgRNA-COL1A1-3A、sgRNA-COL1A1-4S、sgRNA-COL1A1-4A均为单链DNA分子。
四、不同靶点的编辑效率比较
1、共转染
第一组:将质粒pKG-U6gRNA(COL1A1-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(COL1A1-g1):1.08μg质粒pKG-GE3。
第二组:将质粒pKG-U6gRNA(COL1A1-g2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(COL1A1-g2):1.08μg质粒pKG-GE3。
第三组:将质粒pKG-U6gRNA(COL1A1-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(COL1A1-g3):1.08μg质粒pKG-GE3。
第四组:将质粒pKG-U6gRNA(COL1A1-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(COL1A1-g4):1.08μg质粒pKG-GE3。
第五组:猪原代成纤维细胞,未进行任何转染操作。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用COL1A1-F473和COL1A1-R870组成的引物对进行PCR扩增,然后进行电泳并测序,结果见图21。
通过利用SynthegoICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组的编辑效率依次为50%、49%、56%、45%和0%。结果表明,第三组编辑效率最高,sgRNACOL1A1-g3为最优靶点。
五、高效靶点两侧基因组区域同源臂序列扩增
分别以8只猪的基因组DNA为模板,采用引物对SH4-L-F/SH4-L-R进行COL1A1安全港位点切点左侧基因组序列的PCR扩增,采用引物对SH4-R-F/SH4-R-R进行COL1A1安全港位点切点右侧基因组序列的PCR扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对SH4-LR-F/SH4-LR-R和SH4-RR-F/SH4-RR-R进行H1安全港位点切点左侧和右侧基因组同源序列的扩增。
SH4-L-F:5’-CCGCTCTGTTCCTTGCCTAATTG-3’;SEQ ID NO:107
SH4-L-R:5’-AGCAACTCTCCAAGGCCCTG-3’;SEQ ID NO:108
SH4-R-F:5’-GCAAGTTCTCTCCCTAGGCGAA-3’;SEQ ID NO:109
SH4-R-R:5’-GCAAACTCAAAGGCAAACTCAGC-3’;SEQ ID NO:110
SH4-LR-F:5’-TCTTGTTATAGATATCGGCGCGCCGGATGGGGACTCATGTGAATTTTCTAAAG-3’;SEQ ID NO:111
SH4-LR-R:5’-CCAGGCCCGGGTCTGGGGCGCGTGATGGTGCGGTCCTGCTGGTCACTCTCTTG-3’;SEQ ID NO:112
SH4-RR-F:5’-AGCCATTGTACGCGTTGGTGGTTGCTGAGACTGCGTGGGGGCCCAAG-3’;SEQ IDNO:113
SH4-RR-R:5’-CTTTTATGGCGGCCGCATATAGGAACAAACTTTTGTTTACTAGCTG-3’。SEQ IDNO:114
实施例7:使外源基因高效表达的安全港位点的筛选
一、安全港位点荧光载体、靶点载体和Cas9载体混合电转猪原代成纤维细胞
分别将PB-1G 2R 3-puro-不同安全港位点载体与对应的高效靶点载体(同sgRNA载体)以及高效Cas9表达载体(同Cas载体)共转染猪原代成纤维细胞。使用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪进行电转实验(参数设置为:1450V、10ms、3pulse)。
共转染质粒组合及配比:
第一组:将质粒PB-1G 2R 3-puro-ROSA26、质粒pKG-U6gRNA(ROSA26-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.6μg质粒PB-1G2R3-puro-ROSA26、0.5μg质粒pKG-U6gRNA(ROSA26-g3):0.9μg质粒pKG-GE3。
第二组:将质粒PB-1G 2R 3-puro-AAVS1、质粒pKG-U6gRNA(AAVS1-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.6μg质粒PB-1G 2R3-puro-AAVS1、0.5μg质粒pKG-U6gRNA(AAVS1-g4):0.9μg质粒pKG-GE3。
第三组:将质粒PB-1G 2R 3-puro-H11、质粒pKG-U6gRNA(H11-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.6μg质粒PB-1G 2R 3-puro-H11、0.5μg质粒pKG-U6gRNA(H11-g1):0.9μg质粒pKG-GE3。
第四组:将质粒PB-1G 2R 3-puro-COL1A1、质粒pKG-U6gRNA(COL1A1-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.6μg质粒PB-1G2R3-puro-COL1A1、0.5μg质粒pKG-U6gRNA(COL1A1-g3):0.9μg质粒pKG-GE3。
第五组:猪原代成纤维细胞,同等电转参数不加任何质粒进行电转染操作。
具体实施方法:
细胞:电转前猪原代成纤维细胞融合度达到60%,0.25%胰蛋白酶消化,台盼蓝染色计数,取等量细胞进行五组电转。
猪原代细胞电转:
(1)将细胞用胰酶消化,得到的细胞悬液用PBS磷酸缓冲液(Solarbio)洗一遍,600g离心6min,弃去上清,使用58uL电转基本液R Buffer重悬细胞(11uL/个),重悬过程中要避免气泡的产生;
(2)吸取10uL细胞悬液与质粒电转反应液混匀,混匀过程中注意切勿产生气泡;
(3)将试剂盒带有的电转杯放置于Neon TM transfection system电转仪杯槽内,加入3mL E Buffer;
(4)用电转枪吸取10uL步骤2)得到的混合液,插入电转杯内,选择电转程序(1450V10ms3pulse),电击转染后立即在超净台内将电转枪中混合液转入到6孔板中,每孔3mL完全培养液(含15%胎牛血清(Gibco)+83%DMEM培养基(Gibco)+1%P/S(Gibco Penicillin-Streptomycin)+1%HEPES(Solarbio));
(5)混匀后放置于37℃,5%CO2、5%O2的恒温培养箱中进行培养;
(6)电转18-24h换液,电转48h使用嘌呤霉素进行筛选阳性细胞。
二、嘌呤霉素筛选
细胞经质粒电转48h,加入1.5μg/ml嘌呤霉素筛选,每两天更换含有相同浓度嘌呤霉素的培养基,同时进行GFP绿色荧光拍照,连续筛选两周,待细胞内质粒完全降解后再继续加药筛选一周。通过GFP荧光表达的强弱判断安全港位点对外源基因表达效率的影响。
嘌呤霉素筛选一周后,ROSA26、COL1A1安全港位点实验组荧光强度明显强于AAVS1、H11实验组;嘌呤霉素筛选两周后,荧光强度由强到弱依次为:COL1A1>ROSA26>H11>AAVS1,其中H11组部分荧光弱整体荧光强,ROSA26组整体荧光强度较均一,AAVS1组细胞荧光表达最弱,COL1A1组荧光细胞数增多,荧光最强;嘌呤霉素继续筛选三周后,荧光强度由强到弱依次为:COL1A1>ROSA26>H11>AAVS1,结果如图22。
三、GFP基因转录水平检测
为了比较GFP基因整合入四个不同安全港位点后其mRNA转录水平的差异性,即四个不同安全港位点是否参与GFP的表达调控及其对GFP表达量的影响。我们针对GFP基因设计一对引物,取嘌呤霉素筛选三周后的细胞,提取总RNA,反转录成cDNA,用于检测原代细胞在四个不同安全港位点整合GFP基因后的转录水平,同时用野生型原代细胞作为对照。以GAPDH为内参基因按照2-ΔCt法进行计算。
(1)引物信息(表1)
表1荧光定量PCR引物信息
/>
(2)细胞总RNA提取
利用Bio Flux的Simply P总RNA提取试剂盒进行细胞总RNA提取。
(3)cDNA第一链获得
根据Vazyme反转录试剂盒II 1st Strand cDNA Synthesis Kit(R211-01/02)说明书合成cDNA第一链,具体步骤和程序如下:
1)配制第一链cDNA合成反应液
在RNase-free离心管中配制如下混合液:
用移液枪轻轻吹打混匀。
2)按下列条件进行第一链cDNA合成反应
产物立即用于qPCR反应,或存放于-80℃保存,避免反复冻融。
(4)荧光定量PCR
利用实时荧光定量PCR法检测插入四组不同安全港位点(ROSA26、AAVS1、H11、COL1A1)猪原代成纤维细胞中GFP的表达量,GAPDH作为内参基因。操作步骤及程序如下:
1)反应体系配制如下
/>
2)qPCR反应程序如下
3)统计与分析
用Prism5统计学软件进行数据分析,以(平均数±标准差)表示,采用双因素方差分析进行统计学分析。2-ΔCt值结果显示嘌呤霉素筛选三周后AAVS1、H11组GFP表达量较低,ROSA26、COL1A1组GFP表达量较高,且ROSA26、COL1A1组相对于AAVS1和H11组GFP转录水平差异极显著(P<0.01),2-ΔCt值结果见表2,差异显著性分析结果如图23。
表2 2-ΔCt值信息
综上,根据培养细胞三周后的荧光信号强度与GFP基因实时荧光定量PCR的结果,可以得出如下结论,在ROSA26、AAVS1、H11、COL1A1这四个基因组安全港位点中,COL1A1位点插入基因后表达的最好,COL1A1位点是最适合猪原代细胞表达外源基因的安全港位点。
三、GFP基因的流式细胞荧光分选检测
为了比较GFP基因整合入四个不同安全港位点后GFP蛋白的表达情况。分别用胰蛋白酶消化细胞,400g离心4min后,弃上清。以1mL培养基重悬细胞,并将细胞悬液分别转移至流式管内。在BD FACSMelody流式细胞仪的FITC通道内检测GFP信号,并以野生型细胞作为阴性对照,收集5×104个细胞进行分析,结果如图24所示。结果显示GFP荧光信号COL1A1>ROSA26>H11>AAVS1。
序列表
<110> 南京启真基因工程有限公司
<120> 一种基因编辑的方法
<130> 1
<160> 132
<170> SIPOSequenceListing 1.0
<210> 1
<211> 8484
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360
agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420
aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480
ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840
ggggggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 900
agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 960
aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgcgctg ccttcgcccc gtgccccgct 1020
ccgccgccgc ctcgcgccgc ccgccccggc tctgactgac cgcgttactc ccacaggtga 1080
gcgggcggga cggcccttct cctccgggct gtaattagct gagcaagagg taagggttta 1140
agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 1200
ctttttttca ggttggaccg gtgccaccat ggactataag gaccacgacg gagactacaa 1260
ggatcatgat attgattaca aagacgatga cgataagatg gccccaaaga agaagcggaa 1320
ggtcggtatc cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg 1380
caccaactct gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt 1440
caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct 1500
gttcgacagc ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata 1560
caccagacgg aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa 1620
ggtggacgac agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa 1680
gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta 1740
ccccaccatc taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg 1800
gctgatctat ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg 1860
cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta 1920
caaccagctg ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct 1980
gtctgccaga ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga 2040
gaagaagaat ggcctgttcg gaaacctgat tgccctgagc ctgggcctga cccccaactt 2100
caagagcaac ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga 2160
cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc 2220
cgccaagaac ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat 2280
caccaaggcc cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct 2340
gaccctgctg aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt 2400
cgaccagagc aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt 2460
ctacaagttc atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa 2520
gctgaacaga gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca 2580
ccagatccac ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt 2640
cctgaaggac aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt 2700
gggccctctg gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac 2760
catcaccccc tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat 2820
cgagcggatg accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag 2880
cctgctgtac gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga 2940
gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct 3000
gttcaagacc aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat 3060
cgagtgcttc gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg 3120
cacataccac gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa 3180
cgaggacatt ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat 3240
cgaggaacgg ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa 3300
gcggcggaga tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga 3360
caagcagtcc ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa 3420
cttcatgcag ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca 3480
ggtgtccggc cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc 3540
cattaagaag ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg 3600
ccggcacaag cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa 3660
gggacagaag aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg 3720
cagccagatc ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta 3780
cctgtactac ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg 3840
gctgtccgac tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat 3900
cgacaacaag gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc 3960
cgaagaggtc gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat 4020
tacccagaga aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga 4080
taaggccggc ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc 4140
acagatcctg gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga 4200
agtgaaagtg atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt 4260
ttacaaagtg cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt 4320
cgtgggaacc gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga 4380
ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc 4440
taccgccaag tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct 4500
ggccaacggc gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat 4560
cgtgtgggat aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt 4620
gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc 4680
caagaggaac agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg 4740
cggcttcgac agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg 4800
caagtccaag aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag 4860
cagcttcgag aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa 4920
ggacctgatc atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag 4980
aatgctggcc tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata 5040
tgtgaacttc ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa 5100
tgagcagaaa cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca 5160
gatcagcgag ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc 5220
cgcctacaac aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct 5280
gtttaccctg accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga 5340
ccggaagagg tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat 5400
caccggcctg tacgagacac ggatcgacct gtctcagctg ggaggcgaca aaaggccggc 5460
ggccacgaaa aaggccggcc aggcaaaaaa gaaaaagtaa gaattcctag agctcgctga 5520
tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 5580
tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 5640
tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 5700
ggggaggatt gggaagagaa tagcaggcat gctggggagc ggccgcagga acccctagtg 5760
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 5820
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc 5880
ctgcaggggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 5940
atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6000
tggttacgcg cagcgtgacc gctacacttg ccagcgcctt agcgcccgct cctttcgctt 6060
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6120
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgatttgg 6180
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6240
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aactctatct 6300
cgggctattc ttttgattta taagggattt tgccgatttc ggtctattgg ttaaaaaatg 6360
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaattttat 6420
ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc 6480
caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 6540
ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 6600
cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg 6660
tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 6720
ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 6780
aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct 6840
tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag 6900
atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta 6960
agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc 7020
tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca 7080
tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg 7140
atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg 7200
ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca 7260
tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa 7320
acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa 7380
ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata 7440
aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat 7500
ctggagccgg tgagcgtgga agccgcggta tcattgcagc actggggcca gatggtaagc 7560
cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata 7620
gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt 7680
actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga 7740
agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 7800
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 7860
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 7920
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 7980
ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 8040
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 8100
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 8160
gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 8220
gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 8280
gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 8340
tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 8400
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct 8460
tttgctggcc ttttgctcac atgt 8484
<210> 2
<211> 10476
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttc tagcgcgtgc 360
gccaattctg cagacaaatg gctctagagg tacccgttac ataacttacg gtaaatggcc 420
cgcctggctg accgcccaac gacccccgcc cattgacgtc aatagtaacg ccaataggga 480
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 540
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 600
ggcattgtgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 660
tagtcatcgc tattaccatg ggggcagagc gcacatcgcc cacagtcccc gagaagttgg 720
ggggaggggt cggcaattga tccggtgcct agagaaggtg gcgcggggta aactgggaaa 780
gtgatgtcgt gtactggctc cgcctttttc ccgagggtgg gggagaaccg tatataagtg 840
cagtagtcgc cgtgaacgtt ctttttcgca acgggtttgc cgccagaaca caggttggac 900
cggtgccacc atggactata aggaccacga cggagactac aaggatcatg atattgatta 960
caaagacgat gacgataaga tggcccccaa aaagaaacga aaggtgggtg ggtccccaaa 1020
gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt acagcatcgg 1080
cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc 1140
cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga agaacctgat 1200
cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga agagaaccgc 1260
cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa 1320
cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga 1380
agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg aggtggccta 1440
ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa 1500
ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc ggggccactt 1560
cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct 1620
ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc 1680
caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc tgatcgccca 1740
gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga gcctgggcct 1800
gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa 1860
ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga 1920
cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca tcctgagagt 1980
gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca 2040
ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa 2100
agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg gcggagccag 2160
ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga 2220
actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg 2280
cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga 2340
tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttccgcat 2400
cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga tgaccagaaa 2460
gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgcttccgc 2520
ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg agaaggtgct 2580
gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga ccaaagtgaa 2640
atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat 2700
cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga aagaggacta 2760
cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa 2820
cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga 2880
caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga 2940
cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat 3000
gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa 3060
cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt 3120
cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat 3180
ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc 3240
cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt 3300
gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca 3360
gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat 3420
caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa 3480
cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact 3540
ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa 3600
ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga 3660
caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa 3720
cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct 3780
gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac 3840
aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa 3900
gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa 3960
ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta 4020
cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt 4080
cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga 4140
aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac 4200
cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga 4260
aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag 4320
catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga 4380
gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc 4440
taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa 4500
agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat 4560
catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa 4620
agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa 4680
cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct 4740
gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc 4800
ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga 4860
gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga 4920
caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa 4980
tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga 5040
caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat 5100
ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga 5160
caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagg gcggctccaa 5220
gcggcctgcc gcgacgaaga aagcgggaca ggccaagaaa aagaaaggat ccggcgcaac 5280
aaacttctct ctgctgaaac aagccggaga tgtcgaagag aatcctggac cggtgagcaa 5340
gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa 5400
cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac 5460
cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 5520
cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt 5580
cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 5640
cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 5700
cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 5760
caactacaac agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt 5820
gaacttcaag atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 5880
gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 5940
ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 6000
cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagggct ccggcgaggg 6060
caggggaagt cttctaacat gcggggacgt ggaggaaaat cccggcccaa ccgagtacaa 6120
gcccacggtg cgcctcgcca cccgcgacga cgtccccagg gccgtacgca ccctcgccgc 6180
cgcgttcgcc gactaccccg ccacgcgcca caccgtcgat ccggaccgcc acatcgagcg 6240
ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg ctcgacatcg gcaaggtgtg 6300
ggtcgcggac gacggcgccg cggtggcggt ctggaccacg ccggagagcg tcgaagcggg 6360
ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg agcggttccc ggctggccgc 6420
gcagcaacag atggaaggcc tcctggcgcc gcaccggccc aaggagcccg cgtggttcct 6480
ggccaccgtc ggagtctcgc ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct 6540
ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc 6600
ccgcaacctc cccttctacg agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc 6660
cgaaggaccg cgcacctggt gcatgacccg caagcccggt gcctgaacgc gttaagtcga 6720
caatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 6780
tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 6840
tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 6900
gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 6960
tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 7020
tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 7080
gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 7140
cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 7200
caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 7260
tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc gtcgacttta 7320
agaccaatga cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga 7380
ctggaagggc taattcactc ccaacgaaga caagatctgc tttttgcttg tactgggtct 7440
ctctggttag accagatctg agcctgggag ctctctggct aactagggaa cccactgctt 7500
aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac 7560
tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagggcc 7620
cgtttaaacc cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 7680
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 7740
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 7800
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 7860
gggctctatg gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 7920
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 7980
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ttagcgcccg 8040
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 8100
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 8160
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 8220
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 8280
tcaactctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggtctatt 8340
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 8400
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 8460
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 8520
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 8580
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 8640
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 8700
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 8760
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 8820
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 8880
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 8940
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 9000
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 9060
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 9120
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 9180
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 9240
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 9300
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 9360
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 9420
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 9480
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 9540
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 9600
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 9660
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 9720
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 9780
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 9840
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 9900
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 9960
taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 10020
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 10080
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 10140
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 10200
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 10260
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 10320
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 10380
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 10440
ggttcctggc cttttgctgg ccttttgctc acatgt 10476
<210> 3
<211> 3120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctt gcatgcaggc ctctgcagtc gacgggcccg ggatccgatg 2280
ataaacatgt gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 2340
tgttagagag ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 2400
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 2460
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 2520
gtggaaagga cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag 2580
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttc 2640
tagcgcgtgc gccaattctg cagacaaatg gctctagagg tacccataga tctagatgca 2700
ttcgcgaggt accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa 2760
accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta 2820
atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat 2880
ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt 2940
gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 3000
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3060
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3120
<210> 4
<211> 14138
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ggcgcgccct ctacctgctc tcggacccgt gggggtgggg ggtggaggaa ggagtggggg 60
gtcggtcctg ctggcttgtg ggtgggaggc gcatgttctc caaaaacccg cgcgagctgc 120
aatcctgagg gagctgcagt ggaggaggcg gagagaaggc cgcacccttc tccgcagggg 180
gaggggagtg ccgcaatacc tttatgggag ttctctgctg cctccttttc ctaaggaccg 240
ccctgggcct agaaaaatcc ctccctcccc cgcgatctcg tcatcgcctc catgtcagtt 300
tgctccttct cgattatggg cgggattctt ttgccctggc gcgccccaga cccgggcctg 360
gggggcaagt cggggggcgg ggggaggtcg ggcagggtcc cctgggagga tggggacgtg 420
ctgtgcccct agcggccacc agagggcacc aggacaccac tgcggtcggc tcagcggctc 480
ctgccctggt cagggggcgc caggtcctgc ccctcctggg gagggcgggg ggcgagaagg 540
gcgattttaa ttaacccacg tttcaacatg cacatcccag taatttggaa acattttgtt 600
tccaaagatt cacttaacat tggtttagca acatgaagct ttctatgcaa cccaaggact 660
cagtttttgg cctgttttag tgacaggcaa tcagcaacat gctgcatttc tctccagtgt 720
tgtaatcaaa gaaaccctcc catagcttta aatgatattc cttccccttc caattatgtg 780
gggggaaaac aaccctattc tccacccaga agtgttaact caagaattac attttcaaga 840
agtttccaga ttcgtaaaac cagaattaga tgtctttcac ctaaatgtct cggtgttgac 900
caaaggaaca cacaggtttc tcatttaact tttttaatgg gtctcaaaat tctgtgacaa 960
atttttggtc aagttgtttc cattaaaaag tactgatttt aaaaactaat aacttaaaac 1020
tgccacacgc aaaaaagaaa accaaagtgg tccacaaaac attctccttt ccttctgaag 1080
gttttacgat gcattgttat cattaaccag tcttttacta ctaaacttaa atggccaatt 1140
gaaacaaaca gttctgagac cgttcttcca ccactgatta agagtggggt ggcaggtatt 1200
agggataatg ctagcttact tgtacagctc gtccatgccg agagtgatcc cggcggcggt 1260
cacgaactcc agcaggacca tgtgatcgcg cttctcgttg gggtctttgc tcagggcgga 1320
ctgggtgctc aggtagtggt tgtcgggcag cagcacgggg ccgtcgccga tgggggtgtt 1380
ctgctggtag tggtcggcga gctgcacgct gccgtcctcg atgttgtggc ggatcttgaa 1440
gttcaccttg atgccgttct tctgcttgtc ggccatgata tagacgttgt ggctgttgta 1500
gttgtactcc agcttgtgcc ccaggatgtt gccgtcctcc ttgaagtcga tgcccttcag 1560
ctcgatgcgg ttcaccaggg tgtcgccctc gaacttcacc tcggcgcggg tcttgtagtt 1620
gccgtcgtcc ttgaagaaga tggtgcgctc ctggacgtag ccttcgggca tggcggactt 1680
gaagaagtcg tgctgcttca tgtggtcggg gtagcggctg aagcactgca cgccgtaggt 1740
cagggtggtc acgagggtgg gccagggcac gggcagcttg ccggtggtgc agatgaactt 1800
cagggtcagc ttgccgtagg tggcatcgcc ctcgccctcg ccggacacgc tgaacttgtg 1860
gccgtttacg tcgccgtcca gctcgaccag gatgggcacc accccggtga acagctcctc 1920
gcccttgctc accatggtgg cgtcgaccgt acgtcacgac acctgaaatg gaagaaaaaa 1980
actttgaacc actgtctgag gcttgagaat gaaccaagat ccaaactcaa aaagggcaaa 2040
ttccaaggag aattacatca agtgccaagc tggcctaact tcagtctcca cccactcagt 2100
gtggggaaac tccatcgcat aaaacccctc cccccaacct aaagacgacg tactccaaaa 2160
gctcgagaac taatcgaggt gcctggacgg cgcccggtac tccgtggagt cacatgaagc 2220
gacggctgag gacggaaagg cccttttcct ttgtgtgggt gactcacccg cccgctctcc 2280
cgagcgccgc gtcctccatt ttgagctccc tgcagcaggg ccgggaagcg gccatctttc 2340
cgctcacgca actggtgccg accgggccag ccttgccgcc cagggcgggg cgatacacgg 2400
cggcgcgagg ccaggcacca gagcaggccg gccagcttga gactaccccc gtccgattct 2460
cggtggccgc gctcgcaggc cccgcctcgc cgaacatgtg cgctgggacg cacgggcccc 2520
gtcgccgccc gcggccccaa aaaccgaaat accagtgtgc agatcttggc ccgcatttac 2580
aagactatct tgccagaaaa aaagcgtcgc agcaggtcat caaaaatttt aaatggctag 2640
agacttatcg aaagcagcga gacaggcgcg aaggtgccac cagattcgca cgcggcggcc 2700
ccagcgccca ggccaggcct caactcaagc acgaggcgaa ggggctcctt aagcgcaagg 2760
cctcgaactc tcccacccac ttccaacccg aagctcggga tcaagaatca cgtactgcag 2820
ccagtggaag taattcaagg cacgcaaggg ccataacccg taaagaggcc aggcccgcgg 2880
gaaccacaca cggcacttac ctgtgttctg gcggcaaacc cgttgcgaaa aagaacgttc 2940
acggcgacta ctgcacttat atacggttct cccccaccct cgggaaaaag gcggagccag 3000
tacacgacat cactttccca gtttaccccg cgccaccttc tctaggcacc ggttcaattg 3060
ccgacccctc cccccaactt ctcggggact gtgggcgatg tgcgctctgc ccactgacgg 3120
gcaccggagc cctagattcg attccctttg gggcaaaact caccgcctaa tcccctataa 3180
ctctaccggg gagcccggtg gagagcagac gggctgacgc tgccacctgc cggccatccc 3240
aggataggac cgccgtattc aagtcgccct caggaaggac cctcggggca ccagaggcct 3300
tcgaagcccc aatgagtgag gcaactgagg gtcgcgggtg ccattacaag gcccagccaa 3360
ggcctagagc caaggcttga accgtggggg acccccaagc cccacctgcc caggaacagc 3420
agacactggg acactttgtt tcaggtcctg cccaggcccc tcccactgtg aggctgggat 3480
ttgtcgccca gggtgcagat gagaagagtg gggaaagcag tcctgagcca ggaaattcta 3540
ccgggtaggg gaggcgcttt tcccaaggca gtctggagca tgcgctttag cagccccgct 3600
gggcacttgg cgctacacaa gtggcctctg gcctcgcaca cattccacat ccaccggtag 3660
gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc ctcccctagt 3720
caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc 3780
acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc gggtaggcct 3840
ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga ggctgggaag 3900
gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc 3960
ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc 4020
ttcctcatct ccgggccttt cgacctccta gggccaccat ggtgagcaag ggcgaggacg 4080
acaacatggc catcatcaag gagttcatgc gcttcaaggt gcacatggag ggctccgtga 4140
acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga 4200
ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc 4260
ctcagttcat gtacggctcc aaggcctacg tgaagcaccc cgccgacatc cccgactact 4320
tgaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg 4380
gcgtggtgac cgtgacccag gactcctccc tgcaggacgg cgagttcatc tacaaggtga 4440
agctgcgcgg caccaacttc ccctccgacg gccccgtaat gcagaagaag accatgggct 4500
gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc gagatcaagc 4560
agaggctgaa gctgaaggac ggcggccact acgacgccga ggtcaagacc acctacaagg 4620
ccaagaagcc cgtgcagctg cccggcgcct acaacgtcaa catcaagctg gacatcacct 4680
cccacaacga ggactacacc atcgtggaac agtacgagcg cgccgagggc cgccactcca 4740
ccggcggcat ggacgagctg tacaagtgag gatccgctga tcagcctcga ctgtgccttc 4800
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4860
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4920
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 4980
tagcaggcat gctggggatg cggtgggctc tatggcttct gaggcggaaa gaacccttct 5040
gaggcggaaa gaaccagctg ccttaatata acttcgtata atgtatgcta tacgaagtta 5100
ttaggtctga agaggagttt acgtccagcc aattctgtgg aatgtgtgtc agttagggtg 5160
tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 5220
agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 5280
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 5340
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 5400
cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 5460
aggcttttgc aaaaagctcc cgggagcttg tatatccatt ttcggcggcc gcgccaccat 5520
gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg 5580
caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg atccggaccg 5640
ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg ggctcgacat 5700
cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca cgccggagag 5760
cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt tgagcggttc 5820
ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc ccaaggagcc 5880
cgcgtggttc ctggccaccg tcggagtctc gcccgaccac cagggcaagg gtctgggcag 5940
cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga 6000
gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga 6060
cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgaga 6120
attcgcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct gccatcacga 6180
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 6240
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 6300
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 6360
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 6420
catgtctgta taccgctcga ctagagcttg cggaaccctt aatataactt cgtataatgt 6480
atgctatacg aagttattag gtccgctggc catctacgag ccaaagactt tcaaatcttt 6540
ggctgccttg gccagtagga ggcgacacga aggatttgct gctgccttgg gggatgggaa 6600
ggaacctgaa ggcatttttt ccagagtggt gcagtaccac tgaggactgt tgctgtattg 6660
attaggaaaa gagacagagt aatttgcagt ttgtttgatt tatactgggc tgcaggtcga 6720
gggatcttca taagagaaga gggacagcta tgactgggag tagtcaggag aggaggaaaa 6780
atctggctag taaaacatgt aaggaaaatt ttagggatgt taaagaaaaa aataacacaa 6840
aacaaaatat aaaaaaaatc taacctcaag tcaaggcttt tctatggaat aaggaatgga 6900
cagcaggggg ctgtttcata tactgatgac ctctttatag ccacctttgt tcatggcagc 6960
cagcatatgg catatgttgc caaactctaa accaaatact cattctgatg ttttaaatga 7020
tttgccctcc catatgtcct tccgagtgag agacacaaaa aattccaaca cactattgca 7080
atgaaaataa atttccttta ttagccagaa gtcagatgct caaggggctt catgatgtcc 7140
ccataatttt tggcagaggg aaaaagatct cagtggtatt tgtgagccag ggcattggcc 7200
acaccagcca ccaccttctg ataggcagcc tgcggtacct tacatggtgg cgaattcgtt 7260
tgccaaaatg atgagacagc acaataacca gcacgttgcc caggagctgt aggaaaaaga 7320
agaaggcatg aacatggtta gcagaggctc tagagccgcc ggtcacacgc cagaagccga 7380
accccgccct gccccgtccc ccccgaaggc agccgtcccc ctgcggcagc cccgaggctg 7440
gagatggaga aggggacggc ggcgcggcga cgcacgaagg ccctccccgc ccatttcctt 7500
cctgccggcg ccgcaccgct tcgcccgcgc ccgctagagg gggtgcggcg gcgcctccca 7560
gatttcggct ccgccagatt tgggacaaag gaagtccctg cgccctctcg cacgattacc 7620
ataaaaggca atggctgcgg ctcgccgcgc ctcgacagcc gccggcgctc cggggccgcc 7680
gcgcccctcc cccgagccct ccccggcccg aggcggcccc gccccgcccg gcacccccac 7740
ctgccgccac cccccgcccg gcacggcgag ccccgcgcca cgccccgcac ggagccccgc 7800
acccgaagcc gggccgtgct cagcaactcg gggagggggg tgcagggggg ggttacagcc 7860
cgaccgccgc gcccacaccc cctgctcacc cccccacgca cacaccccgc acgcagcctt 7920
tgttcccctc gcagcccccc cgcaccgcgg ggcaccgccc ccggccgcgc tcccctcgcg 7980
cacacgcgga gcgcacaaag ccccgcgccg cgcccgcagc gctcacagcc gccgggcagc 8040
gcgggccgca cgcggcgctc cccacgcaca cacacacgca cgcacccccc gagccgctcc 8100
cccccgcaca aagggccctc ccggagccct ttaaggcttt cacgcagcca cagaaaagaa 8160
acgagccgtc attaaaccaa gcgctaatta cagcccggag gagaagggcc gtcccgcccg 8220
ctcacctgtg ggagtaacgc ggtcagtcag agccggggcg ggcggcgcga ggcggcgcgg 8280
agcggggcac ggggcgaagg caacgcagcg actcccgccc gccgcgcgct tcgcttttta 8340
tagggccgcc gccgccgccg cctcgccata aaaggaaact ttcggagcgc gccgctctga 8400
ttggctgccg ccgcacctct ccgcctcgcc ccgccccgcc cctcgccccg ccccgccccg 8460
cctggcgcgc gccccccccc cccccgcccc catcgctgca caaaataatt aaaaaataaa 8520
taaatacaaa attgggggtg gggagggggg ggagatgggg agagtgaagc agaacgtggg 8580
gctcacctcg acccatggta atagcgatga ctaatacgta gatgtactgc caagtaggaa 8640
agtcccataa ggtcatgtac tgggcataat gccaggcggg ccatttaccg tcattgacgt 8700
caataggggg cgtacttggc atatgataca cttgatgtac tgccaagtgg gcagtttacc 8760
gtaaatagtc cacccattga cgtcaatgga aagtccctat tggcgttact atgggaacat 8820
acgtcattat tgacgtcaat gggcgggggt cgttgggcgg tcagccaggc gggccattta 8880
ccgtaagtta tgtaacgcgg aactccatat atgggctatg aactaatgac cccgtaattg 8940
attactatta ataactagtc aataatcaat gtcgtaaatg tcgtaaatgt ctcagctagt 9000
caggtagtaa aaggtgtcaa ctaggcagtg gcagagcagg attcaaattc agggctgttg 9060
tgatgcctcc gcagactctg agcgccacct ggtggtaatt tgtctgtgcc tcttctgacg 9120
tggaagaaca gcaactaaca cactaacacg gcatttacta tgggccagcc attgtacgcg 9180
ttgcttaacc tgattcttgg gcgttgtcct gcaggggatt gagcaggtgt acgaggacga 9240
gcccaatttc tctatattcc cacagtcttg agtttgtgtc acaaaataat tatagtgggg 9300
tggagatggg aaatgagtcc aggcaacacc taagcctgat tttatgcatt gagactgcgt 9360
gttattacta aagatctttg tgtcgcaatt tcctgatgaa gggagatagg ttaaaaagca 9420
cggatctact gagttttaca gtcatcccat ttgtagactt ttgctacacc accaaagtat 9480
agcatctgag attaaatatt aatctccaaa ccttaggccc cctcacttgc atccttacgg 9540
tcagataact ctcactcata ctttaagccc attttgtttg ttgtacttgc tcatccagtc 9600
ccagacatag cattggcttt ctcctcacct gttttaggta gccagcaagt catgaaatca 9660
gataagttcc accaccaatt aacactaccc atcttgagca taggcccaac agtgcattta 9720
ttcctcattt actgatgttc gtgaatattt accttgattt tcattttttt ctttttctta 9780
agctgggatt ttactcctga ccctattcac agtcagatga tcttgactac cactgcgatt 9840
ggacctgagg ttcagcaata ctccccttta tgtcttttga atacttttca ataaatctgt 9900
ttgtattttc attagttagt aactgagctc agttgccgta atgctaatag cttccaaact 9960
agtgtctctg tctccagtat ctgataaatc ttaggtgttg ctgggacagt tgtcctaaaa 10020
ttaagataaa gcatgaaaat aactgacaca actccattac tggctcctaa ctacttaaac 10080
aatgcattct atcatcacaa atgtgaaaaa ggagttccct cagtggacta accttatctt 10140
ttctcaacac ctttttcttt gcacaatttt ccacacatgc ctacaaaaag tacttatgcg 10200
gccgccataa aagttttgtt actttataga agaaattttg agtttttgtt ttttttaata 10260
aataaataaa cataaataaa ttgtttgttg aatttattat tagtatgtaa gtgtaaatat 10320
aataaaactt aatatctatt caaattaata aataaacctc gatatacaga ccgataaaac 10380
acatgcgtca attttacaca tgattatctt taacgtacgt cacaatatga ttatctttct 10440
agggttaatc tagctgcgtg ttctgcagcg tgtcgagcat cttcatctgc tccatcacgc 10500
tgtaaaacac atttgcaccg cgagtctgcc cgtcctccac gggttcaaaa acgtgaatga 10560
acgaggcgcg ctcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta 10620
cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg 10680
cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg gacgcgccct 10740
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 10800
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 10860
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 10920
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 10980
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 11040
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 11100
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 11160
ttaacaaaat attaacgctt acaatttagg tggcactttt cggggaaatg tgcgcggaac 11220
ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 11280
ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 11340
cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 11400
ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 11460
tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 11520
cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 11580
actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 11640
aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 11700
tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 11760
ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 11820
tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 11880
gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 11940
gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 12000
tattgctgat aaatctggag ccggtgagcg tggttcacgc ggtatcattg cagcactggg 12060
gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 12120
ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 12180
gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 12240
aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 12300
ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 12360
ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 12420
tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 12480
gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 12540
agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 12600
taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 12660
gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 12720
gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 12780
caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 12840
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 12900
tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 12960
acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 13020
ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 13080
gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 13140
tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 13200
agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 13260
tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca 13320
cacaggaaac agctatgacc atgattacgc caagcgcgcc cgccgggtaa ctcacggggt 13380
atccatgtcc atttctgcgg catccagcca ggatacccgt cctcgctgac gtaatatccc 13440
agcgccgcac cgctgtcatt aatctgcaca ccggcacggc agttccggct gtcgccggta 13500
ttgttcgggt tgctgatgcg cttcgggctg accatccgga actgtgtccg gaaaagccgc 13560
gacgaactgg tatcccaggt ggcctgaacg aacagttcac cgttaaaggc gtgcatggcc 13620
acaccttccc gaatcatcat ggtaaacgtg cgttttcgct caacgtcaat gcagcagcag 13680
tcatcctcgg caaactcttt ccatgccgct tcaacctcgc gggaaaaggc acgggcttct 13740
tcctccccga tgcccagata gcgccagctt gggcgatgac tgagccggaa aaaagacccg 13800
acgatatgat cctgatgcag ctagattaac cctagaaaga tagtctgcgt aaaattgacg 13860
catgcattct tgaaatattg ctctctcttt ctaaatagcg cgaatccgtc gctgtgcatt 13920
taggacatct cagtcgccgc ttggagctcc cgtgaggcgt gcttgtcaat gcggtaagtg 13980
tcactgattt tgaactataa cgaccgcgtg agtcaaaatg acgcatgatt atcttttacg 14040
tgacttttaa gatttaactc atacgataat tatattgtta tttcatgttc tacttacgtg 14100
ataacttatt atatatatat tttcttgtta tagatatc 14138
<210> 5
<211> 14122
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ggcgcgccgt gctgagtcct tttcccatcc cacccacctg gagctcccct cttccagtcc 60
tgagccactt gaactggcct ggtttttgcc atcctgcgct gccctctctc cggactcgag 120
ccactgctga gggcctcagg ccagtccatc ctcgtcttgt ctctttcgcc ctgctctttc 180
cccaccttga gcgctcttaa ccagcctggc ccgtgccacc tctactctgc catcgaatgc 240
tgccccactt tctcgagtcc gccacttctc ccagcttcac cggtacccac tgtttcccct 300
agtccaggca ggtaccactt tccctgagcg tcctcctcct ctctcctggg cctgtgctgc 360
ttcttttccc gctctctggc ctgggccgtt tcttcggcca gcccccgagc cttccatgcc 420
ctttccttca ggtttctgct cttcatcctt ggtctctgcc atctgttgcc atgtaagggt 480
gctctttcct gagccatcgc cctcaaggcg ctctgctcct caagtggatg cttccctcgc 540
ctggctcacc tcctgctctc tctcctgccc ccttcacctg cgtgccctcc tcattctccc 600
tctgtgccac ctctggcctt gcactgtagg ctctctcttg gggatgtttc tccttctcca 660
cacacttctc tttcactctg tcctcttgct ttgtgtgggc ctgcagcgtt accctttttt 720
ctgggcacac tcagagcacc ctcctctttc tggttctggg ccacctgtct gtcctcgggt 780
catcttgctc tctctgcctg gatgccctcc tgtggctttg ggcagcttct ccctccttca 840
gagtgcaccg ccagttctcc taggcccggt cacttcccct tcccagggga cctagagccc 900
tgctaggtcc tctctctcca caacctgggc ccccaaacct ttccaaaaca ccttgctttc 960
tgcctccatt ggtcttgtgt tccagagcca gagtcactat atgtcccaga accaggattc 1020
cctctggttc tgagggcttt tatcgcatcc cctgcctggc tgcagtgggt ctttgggcgc 1080
cccagacccg ggcctggggg gcaagtcggg gggcgggggg aggtcgggca gggtcccctg 1140
ggaggatggg gacgtgctgt gcccctagcg gccaccagag ggcaccagga caccactgcg 1200
gtcggctcag cggctcctgc cctggtcagg gggcgccagg tcctgcccct cctggggagg 1260
gcggggggcg agaagggcga ttttaattaa cccacgtttc aacatgcaca tcccagtaat 1320
ttggaaacat tttgtttcca aagattcact taacattggt ttagcaacat gaagctttct 1380
atgcaaccca aggactcagt ttttggcctg ttttagtgac aggcaatcag caacatgctg 1440
catttctctc cagtgttgta atcaaagaaa ccctcccata gctttaaatg atattccttc 1500
cccttccaat tatgtggggg gaaaacaacc ctattctcca cccagaagtg ttaactcaag 1560
aattacattt tcaagaagtt tccagattcg taaaaccaga attagatgtc tttcacctaa 1620
atgtctcggt gttgaccaaa ggaacacaca ggtttctcat ttaacttttt taatgggtct 1680
caaaattctg tgacaaattt ttggtcaagt tgtttccatt aaaaagtact gattttaaaa 1740
actaataact taaaactgcc acacgcaaaa aagaaaacca aagtggtcca caaaacattc 1800
tcctttcctt ctgaaggttt tacgatgcat tgttatcatt aaccagtctt ttactactaa 1860
acttaaatgg ccaattgaaa caaacagttc tgagaccgtt cttccaccac tgattaagag 1920
tggggtggca ggtattaggg ataatgctag cttacttgta cagctcgtcc atgccgagag 1980
tgatcccggc ggcggtcacg aactccagca ggaccatgtg atcgcgcttc tcgttggggt 2040
ctttgctcag ggcggactgg gtgctcaggt agtggttgtc gggcagcagc acggggccgt 2100
cgccgatggg ggtgttctgc tggtagtggt cggcgagctg cacgctgccg tcctcgatgt 2160
tgtggcggat cttgaagttc accttgatgc cgttcttctg cttgtcggcc atgatataga 2220
cgttgtggct gttgtagttg tactccagct tgtgccccag gatgttgccg tcctccttga 2280
agtcgatgcc cttcagctcg atgcggttca ccagggtgtc gccctcgaac ttcacctcgg 2340
cgcgggtctt gtagttgccg tcgtccttga agaagatggt gcgctcctgg acgtagcctt 2400
cgggcatggc ggacttgaag aagtcgtgct gcttcatgtg gtcggggtag cggctgaagc 2460
actgcacgcc gtaggtcagg gtggtcacga gggtgggcca gggcacgggc agcttgccgg 2520
tggtgcagat gaacttcagg gtcagcttgc cgtaggtggc atcgccctcg ccctcgccgg 2580
acacgctgaa cttgtggccg tttacgtcgc cgtccagctc gaccaggatg ggcaccaccc 2640
cggtgaacag ctcctcgccc ttgctcacca tggtggcgtc gaccgtacgt cacgacacct 2700
gaaatggaag aaaaaaactt tgaaccactg tctgaggctt gagaatgaac caagatccaa 2760
actcaaaaag ggcaaattcc aaggagaatt acatcaagtg ccaagctggc ctaacttcag 2820
tctccaccca ctcagtgtgg ggaaactcca tcgcataaaa cccctccccc caacctaaag 2880
acgacgtact ccaaaagctc gagaactaat cgaggtgcct ggacggcgcc cggtactccg 2940
tggagtcaca tgaagcgacg gctgaggacg gaaaggccct tttcctttgt gtgggtgact 3000
cacccgcccg ctctcccgag cgccgcgtcc tccattttga gctccctgca gcagggccgg 3060
gaagcggcca tctttccgct cacgcaactg gtgccgaccg ggccagcctt gccgcccagg 3120
gcggggcgat acacggcggc gcgaggccag gcaccagagc aggccggcca gcttgagact 3180
acccccgtcc gattctcggt ggccgcgctc gcaggccccg cctcgccgaa catgtgcgct 3240
gggacgcacg ggccccgtcg ccgcccgcgg ccccaaaaac cgaaatacca gtgtgcagat 3300
cttggcccgc atttacaaga ctatcttgcc agaaaaaaag cgtcgcagca ggtcatcaaa 3360
aattttaaat ggctagagac ttatcgaaag cagcgagaca ggcgcgaagg tgccaccaga 3420
ttcgcacgcg gcggccccag cgcccaggcc aggcctcaac tcaagcacga ggcgaagggg 3480
ctccttaagc gcaaggcctc gaactctccc acccacttcc aacccgaagc tcgggatcaa 3540
gaatcacgta ctgcagccag tggaagtaat tcaaggcacg caagggccat aacccgtaaa 3600
gaggccaggc ccgcgggaac cacacacggc acttacctgt gttctggcgg caaacccgtt 3660
gcgaaaaaga acgttcacgg cgactactgc acttatatac ggttctcccc caccctcggg 3720
aaaaaggcgg agccagtaca cgacatcact ttcccagttt accccgcgcc accttctcta 3780
ggcaccggtt caattgccga cccctccccc caacttctcg gggactgtgg gcgatgtgcg 3840
ctctgcccac tgacgggcac cggagcccta gattcgattc cctttggggc aaaactcacc 3900
gcctaatccc ctataactct accggggagc ccggtggaga gcagacgggc tgacgctgcc 3960
acctgccggc catcccagga taggaccgcc gtattcaagt cgccctcagg aaggaccctc 4020
ggggcaccag aggccttcga agccccaatg agtgaggcaa ctgagggtcg cgggtgccat 4080
tacaaggccc agccaaggcc tagagccaag gcttgaaccg tgggggaccc ccaagcccca 4140
cctgcccagg aacagcagac actgggacac tttgtttcag gtcctgccca ggcccctccc 4200
actgtgaggc tgggatttgt cgcccagggt gcagatgaga agagtgggga aagcagtcct 4260
gagccaggaa attctaccgg gtaggggagg cgcttttccc aaggcagtct ggagcatgcg 4320
ctttagcagc cccgctgggc acttggcgct acacaagtgg cctctggcct cgcacacatt 4380
ccacatccac cggtaggcgc caaccggctc cgttctttgg tggccccttc gcgccacctt 4440
ctactcctcc cctagtcagg aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt 4500
gacaaatgga agtagcacgt ctcactagtc tcgtgcagat ggacagcacc gctgagcaat 4560
ggaagcgggt aggcctttgg ggcagcggcc aatagcagct ttgctccttc gctttctggg 4620
ctcagaggct gggaaggggt gggtccgggg gcgggctcag gggcgggctc aggggcgggg 4680
cgggcgcccg aaggtcctcc ggaggcccgg cattctgcac gcttcaaaag cgcacgtctg 4740
ccgcgctgtt ctcctcttcc tcatctccgg gcctttcgac ctcctagggc caccatggtg 4800
agcaagggcg aggacgacaa catggccatc atcaaggagt tcatgcgctt caaggtgcac 4860
atggagggct ccgtgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc 4920
tacgagggca cccagaccgc caagctgaag gtgaccaagg gcggccccct gcccttcgcc 4980
tgggacatcc tgtcccctca gttcatgtac ggctccaagg cctacgtgaa gcaccccgcc 5040
gacatccccg actacttgaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg 5100
aacttcgagg acggcggcgt ggtgaccgtg acccaggact cctccctgca ggacggcgag 5160
ttcatctaca aggtgaagct gcgcggcacc aacttcccct ccgacggccc cgtaatgcag 5220
aagaagacca tgggctggga ggcctcctcc gagcggatgt accccgagga cggcgccctg 5280
aagggcgaga tcaagcagag gctgaagctg aaggacggcg gccactacga cgccgaggtc 5340
aagaccacct acaaggccaa gaagcccgtg cagctgcccg gcgcctacaa cgtcaacatc 5400
aagctggaca tcacctccca caacgaggac tacaccatcg tggaacagta cgagcgcgcc 5460
gagggccgcc actccaccgg cggcatggac gagctgtaca agtgaggatc cgctgatcag 5520
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 5580
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 5640
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 5700
aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg gcttctgagg 5760
cggaaagaac ccttctgagg cggaaagaac cagctgcctt aatataactt cgtataatgt 5820
atgctatacg aagttattag gtctgaagag gagtttacgt ccagccaatt ctgtggaatg 5880
tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 5940
tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa 6000
gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta actccgccca 6060
tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt 6120
ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag tagtgaggag 6180
gcttttttgg aggcctaggc ttttgcaaaa agctcccggg agcttgtata tccattttcg 6240
gcggccgcgc caccatgacc gagtacaagc ccacggtgcg cctcgccacc cgcgacgacg 6300
tccccagggc cgtacgcacc ctcgccgccg cgttcgccga ctaccccgcc acgcgccaca 6360
ccgtcgatcc ggaccgccac atcgagcggg tcaccgagct gcaagaactc ttcctcacgc 6420
gcgtcgggct cgacatcggc aaggtgtggg tcgcggacga cggcgccgcg gtggcggtct 6480
ggaccacgcc ggagagcgtc gaagcggggg cggtgttcgc cgagatcggc ccgcgcatgg 6540
ccgagttgag cggttcccgg ctggccgcgc agcaacagat ggaaggcctc ctggcgccgc 6600
accggcccaa ggagcccgcg tggttcctgg ccaccgtcgg agtctcgccc gaccaccagg 6660
gcaagggtct gggcagcgcc gtcgtgctcc ccggagtgga ggcggccgag cgcgccgggg 6720
tgcccgcctt cctggagacc tccgcgcccc gcaacctccc cttctacgag cggctcggct 6780
tcaccgtcac cgccgacgtc gaggtgcccg aaggaccgcg cacctggtgc atgacccgca 6840
agcccggtgc ctgagaattc gcgggactct ggggttcgaa atgaccgacc aagcgacgcc 6900
caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 6960
aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 7020
cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 7080
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 7140
catcaatgta tcttatcatg tctgtatacc gctcgactag agcttgcgga acccttaata 7200
taacttcgta taatgtatgc tatacgaagt tattaggtcc gctggccatc tacgagccaa 7260
agactttcaa atctttggct gccttggcca gtaggaggcg acacgaagga tttgctgctg 7320
ccttggggga tgggaaggaa cctgaaggca ttttttccag agtggtgcag taccactgag 7380
gactgttgct gtattgatta ggaaaagaga cagagtaatt tgcagtttgt ttgatttata 7440
ctgggctgca ggtcgaggga tcttcataag agaagaggga cagctatgac tgggagtagt 7500
caggagagga ggaaaaatct ggctagtaaa acatgtaagg aaaattttag ggatgttaaa 7560
gaaaaaaata acacaaaaca aaatataaaa aaaatctaac ctcaagtcaa ggcttttcta 7620
tggaataagg aatggacagc agggggctgt ttcatatact gatgacctct ttatagccac 7680
ctttgttcat ggcagccagc atatggcata tgttgccaaa ctctaaacca aatactcatt 7740
ctgatgtttt aaatgatttg ccctcccata tgtccttccg agtgagagac acaaaaaatt 7800
ccaacacact attgcaatga aaataaattt cctttattag ccagaagtca gatgctcaag 7860
gggcttcatg atgtccccat aatttttggc agagggaaaa agatctcagt ggtatttgtg 7920
agccagggca ttggccacac cagccaccac cttctgatag gcagcctgcg gtaccttaca 7980
tggtggcgaa ttcgtttgcc aaaatgatga gacagcacaa taaccagcac gttgcccagg 8040
agctgtagga aaaagaagaa ggcatgaaca tggttagcag aggctctaga gccgccggtc 8100
acacgccaga agccgaaccc cgccctgccc cgtccccccc gaaggcagcc gtccccctgc 8160
ggcagccccg aggctggaga tggagaaggg gacggcggcg cggcgacgca cgaaggccct 8220
ccccgcccat ttccttcctg ccggcgccgc accgcttcgc ccgcgcccgc tagagggggt 8280
gcggcggcgc ctcccagatt tcggctccgc cagatttggg acaaaggaag tccctgcgcc 8340
ctctcgcacg attaccataa aaggcaatgg ctgcggctcg ccgcgcctcg acagccgccg 8400
gcgctccggg gccgccgcgc ccctcccccg agccctcccc ggcccgaggc ggccccgccc 8460
cgcccggcac ccccacctgc cgccaccccc cgcccggcac ggcgagcccc gcgccacgcc 8520
ccgcacggag ccccgcaccc gaagccgggc cgtgctcagc aactcgggga ggggggtgca 8580
ggggggggtt acagcccgac cgccgcgccc acaccccctg ctcacccccc cacgcacaca 8640
ccccgcacgc agcctttgtt cccctcgcag cccccccgca ccgcggggca ccgcccccgg 8700
ccgcgctccc ctcgcgcaca cgcggagcgc acaaagcccc gcgccgcgcc cgcagcgctc 8760
acagccgccg ggcagcgcgg gccgcacgcg gcgctcccca cgcacacaca cacgcacgca 8820
ccccccgagc cgctcccccc cgcacaaagg gccctcccgg agccctttaa ggctttcacg 8880
cagccacaga aaagaaacga gccgtcatta aaccaagcgc taattacagc ccggaggaga 8940
agggccgtcc cgcccgctca cctgtgggag taacgcggtc agtcagagcc ggggcgggcg 9000
gcgcgaggcg gcgcggagcg gggcacgggg cgaaggcaac gcagcgactc ccgcccgccg 9060
cgcgcttcgc tttttatagg gccgccgccg ccgccgcctc gccataaaag gaaactttcg 9120
gagcgcgccg ctctgattgg ctgccgccgc acctctccgc ctcgccccgc cccgcccctc 9180
gccccgcccc gccccgcctg gcgcgcgccc cccccccccc cgcccccatc gctgcacaaa 9240
ataattaaaa aataaataaa tacaaaattg ggggtgggga ggggggggag atggggagag 9300
tgaagcagaa cgtggggctc acctcgaccc atggtaatag cgatgactaa tacgtagatg 9360
tactgccaag taggaaagtc ccataaggtc atgtactggg cataatgcca ggcgggccat 9420
ttaccgtcat tgacgtcaat agggggcgta cttggcatat gatacacttg atgtactgcc 9480
aagtgggcag tttaccgtaa atagtccacc cattgacgtc aatggaaagt ccctattggc 9540
gttactatgg gaacatacgt cattattgac gtcaatgggc gggggtcgtt gggcggtcag 9600
ccaggcgggc catttaccgt aagttatgta acgcggaact ccatatatgg gctatgaact 9660
aatgaccccg taattgatta ctattaataa ctagtcaata atcaatgtcg taaatgtcgt 9720
aaatgtctca gctagtcagg tagtaaaagg tgtcaactag gcagtggcag agcaggattc 9780
aaattcaggg ctgttgtgat gcctccgcag actctgagcg ccacctggtg gtaatttgtc 9840
tgtgcctctt ctgacgtgga agaacagcaa ctaacacact aacacggcat ttactatggg 9900
ccagccattg tacgcgttgg acaggccaca gaagagcctc tactcctccc tctgtccccg 9960
aggctgtctc cctcccagtc ttcccagctc aggccagtcc ccaggcctct cttccctgcc 10020
agagcccgtc aggttcggtt actttggggc ccagagagga ccctgtgaag gaagcgtggg 10080
taggggcacg ggaatgggga ggatgcctga agaggccccc ttagccagaa gaggagcaga 10140
agaggagcag gtacccagaa gaggagcagt tcagggaaaa tgcggccgcc ataaaagttt 10200
tgttacttta tagaagaaat tttgagtttt tgtttttttt aataaataaa taaacataaa 10260
taaattgttt gttgaattta ttattagtat gtaagtgtaa atataataaa acttaatatc 10320
tattcaaatt aataaataaa cctcgatata cagaccgata aaacacatgc gtcaatttta 10380
cacatgatta tctttaacgt acgtcacaat atgattatct ttctagggtt aatctagctg 10440
cgtgttctgc agcgtgtcga gcatcttcat ctgctccatc acgctgtaaa acacatttgc 10500
accgcgagtc tgcccgtcct ccacgggttc aaaaacgtga atgaacgagg cgcgctcact 10560
ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 10620
tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 10680
ttcccaacag ttgcgcagcc tgaatggcga atgggacgcg ccctgtagcg gcgcattaag 10740
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 10800
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 10860
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 10920
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 10980
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 11040
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 11100
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 11160
gcttacaatt taggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt 11220
ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa 11280
taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt 11340
tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat 11400
gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag 11460
atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg 11520
ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata 11580
cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat 11640
ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc 11700
aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg 11760
ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac 11820
gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact 11880
ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa 11940
gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct 12000
ggagccggtg agcgtggttc acgcggtatc attgcagcac tggggccaga tggtaagccc 12060
tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga 12120
cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac 12180
tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag 12240
atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 12300
tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 12360
tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 12420
ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc 12480
cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 12540
ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 12600
gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 12660
tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 12720
gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 12780
ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 12840
tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 12900
ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 12960
tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt 13020
attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag 13080
tcagtgagcg aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg 13140
ccgattcatt aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc 13200
aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt 13260
ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat 13320
gaccatgatt acgccaagcg cgcccgccgg gtaactcacg gggtatccat gtccatttct 13380
gcggcatcca gccaggatac ccgtcctcgc tgacgtaata tcccagcgcc gcaccgctgt 13440
cattaatctg cacaccggca cggcagttcc ggctgtcgcc ggtattgttc gggttgctga 13500
tgcgcttcgg gctgaccatc cggaactgtg tccggaaaag ccgcgacgaa ctggtatccc 13560
aggtggcctg aacgaacagt tcaccgttaa aggcgtgcat ggccacacct tcccgaatca 13620
tcatggtaaa cgtgcgtttt cgctcaacgt caatgcagca gcagtcatcc tcggcaaact 13680
ctttccatgc cgcttcaacc tcgcgggaaa aggcacgggc ttcttcctcc ccgatgccca 13740
gatagcgcca gcttgggcga tgactgagcc ggaaaaaaga cccgacgata tgatcctgat 13800
gcagctagat taaccctaga aagatagtct gcgtaaaatt gacgcatgca ttcttgaaat 13860
attgctctct ctttctaaat agcgcgaatc cgtcgctgtg catttaggac atctcagtcg 13920
ccgcttggag ctcccgtgag gcgtgcttgt caatgcggta agtgtcactg attttgaact 13980
ataacgaccg cgtgagtcaa aatgacgcat gattatcttt tacgtgactt ttaagattta 14040
actcatacga taattatatt gttatttcat gttctactta cgtgataact tattatatat 14100
atattttctt gttatagata tc 14122
<210> 6
<211> 14345
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ggcgcgccca aatacccacg tttattggga caaaagttgt tagggaaaat ggggcctcag 60
agttatgatt caagtcataa ttctttccat ttataatttc actcgagact ctgttaactg 120
attccttgtg tgttgtatct tactcctcag ctcacaatta cttttagtta ttcaccttaa 180
ctgtatgaat aacagtggag aaaaggattc taccagaata ctctaattat ggttttgagt 240
cccctttcca gactgaagat ttttcagtct ttttgatctg aggtgatttt tcagtctttt 300
cgatctgagg tgacagtctc aagctcctca attcacccag tctcttgata cttgtccatt 360
tagggccacc aaagctactt tgacttcata ctagagagtc aattaatgag gccattctct 420
gatggacagg tgaagcaggc aaggtgacta tattttgact aaacggtaga aaacagcctg 480
agtgttaaca gtgtagccta taaaacccag agctgcccac cctgatctaa acttccagga 540
acataagaac gcgccccaga cccgggcctg gggggcaagt cggggggcgg ggggaggtcg 600
ggcagggtcc cctgggagga tggggacgtg ctgtgcccct agcggccacc agagggcacc 660
aggacaccac tgcggtcggc tcagcggctc ctgccctggt cagggggcgc caggtcctgc 720
ccctcctggg gagggcgggg ggcgagaagg gcgattttaa ttaacccacg tttcaacatg 780
cacatcccag taatttggaa acattttgtt tccaaagatt cacttaacat tggtttagca 840
acatgaagct ttctatgcaa cccaaggact cagtttttgg cctgttttag tgacaggcaa 900
tcagcaacat gctgcatttc tctccagtgt tgtaatcaaa gaaaccctcc catagcttta 960
aatgatattc cttccccttc caattatgtg gggggaaaac aaccctattc tccacccaga 1020
agtgttaact caagaattac attttcaaga agtttccaga ttcgtaaaac cagaattaga 1080
tgtctttcac ctaaatgtct cggtgttgac caaaggaaca cacaggtttc tcatttaact 1140
tttttaatgg gtctcaaaat tctgtgacaa atttttggtc aagttgtttc cattaaaaag 1200
tactgatttt aaaaactaat aacttaaaac tgccacacgc aaaaaagaaa accaaagtgg 1260
tccacaaaac attctccttt ccttctgaag gttttacgat gcattgttat cattaaccag 1320
tcttttacta ctaaacttaa atggccaatt gaaacaaaca gttctgagac cgttcttcca 1380
ccactgatta agagtggggt ggcaggtatt agggataatg ctagcttact tgtacagctc 1440
gtccatgccg agagtgatcc cggcggcggt cacgaactcc agcaggacca tgtgatcgcg 1500
cttctcgttg gggtctttgc tcagggcgga ctgggtgctc aggtagtggt tgtcgggcag 1560
cagcacgggg ccgtcgccga tgggggtgtt ctgctggtag tggtcggcga gctgcacgct 1620
gccgtcctcg atgttgtggc ggatcttgaa gttcaccttg atgccgttct tctgcttgtc 1680
ggccatgata tagacgttgt ggctgttgta gttgtactcc agcttgtgcc ccaggatgtt 1740
gccgtcctcc ttgaagtcga tgcccttcag ctcgatgcgg ttcaccaggg tgtcgccctc 1800
gaacttcacc tcggcgcggg tcttgtagtt gccgtcgtcc ttgaagaaga tggtgcgctc 1860
ctggacgtag ccttcgggca tggcggactt gaagaagtcg tgctgcttca tgtggtcggg 1920
gtagcggctg aagcactgca cgccgtaggt cagggtggtc acgagggtgg gccagggcac 1980
gggcagcttg ccggtggtgc agatgaactt cagggtcagc ttgccgtagg tggcatcgcc 2040
ctcgccctcg ccggacacgc tgaacttgtg gccgtttacg tcgccgtcca gctcgaccag 2100
gatgggcacc accccggtga acagctcctc gcccttgctc accatggtgg cgtcgaccgt 2160
acgtcacgac acctgaaatg gaagaaaaaa actttgaacc actgtctgag gcttgagaat 2220
gaaccaagat ccaaactcaa aaagggcaaa ttccaaggag aattacatca agtgccaagc 2280
tggcctaact tcagtctcca cccactcagt gtggggaaac tccatcgcat aaaacccctc 2340
cccccaacct aaagacgacg tactccaaaa gctcgagaac taatcgaggt gcctggacgg 2400
cgcccggtac tccgtggagt cacatgaagc gacggctgag gacggaaagg cccttttcct 2460
ttgtgtgggt gactcacccg cccgctctcc cgagcgccgc gtcctccatt ttgagctccc 2520
tgcagcaggg ccgggaagcg gccatctttc cgctcacgca actggtgccg accgggccag 2580
ccttgccgcc cagggcgggg cgatacacgg cggcgcgagg ccaggcacca gagcaggccg 2640
gccagcttga gactaccccc gtccgattct cggtggccgc gctcgcaggc cccgcctcgc 2700
cgaacatgtg cgctgggacg cacgggcccc gtcgccgccc gcggccccaa aaaccgaaat 2760
accagtgtgc agatcttggc ccgcatttac aagactatct tgccagaaaa aaagcgtcgc 2820
agcaggtcat caaaaatttt aaatggctag agacttatcg aaagcagcga gacaggcgcg 2880
aaggtgccac cagattcgca cgcggcggcc ccagcgccca ggccaggcct caactcaagc 2940
acgaggcgaa ggggctcctt aagcgcaagg cctcgaactc tcccacccac ttccaacccg 3000
aagctcggga tcaagaatca cgtactgcag ccagtggaag taattcaagg cacgcaaggg 3060
ccataacccg taaagaggcc aggcccgcgg gaaccacaca cggcacttac ctgtgttctg 3120
gcggcaaacc cgttgcgaaa aagaacgttc acggcgacta ctgcacttat atacggttct 3180
cccccaccct cgggaaaaag gcggagccag tacacgacat cactttccca gtttaccccg 3240
cgccaccttc tctaggcacc ggttcaattg ccgacccctc cccccaactt ctcggggact 3300
gtgggcgatg tgcgctctgc ccactgacgg gcaccggagc cctagattcg attccctttg 3360
gggcaaaact caccgcctaa tcccctataa ctctaccggg gagcccggtg gagagcagac 3420
gggctgacgc tgccacctgc cggccatccc aggataggac cgccgtattc aagtcgccct 3480
caggaaggac cctcggggca ccagaggcct tcgaagcccc aatgagtgag gcaactgagg 3540
gtcgcgggtg ccattacaag gcccagccaa ggcctagagc caaggcttga accgtggggg 3600
acccccaagc cccacctgcc caggaacagc agacactggg acactttgtt tcaggtcctg 3660
cccaggcccc tcccactgtg aggctgggat ttgtcgccca gggtgcagat gagaagagtg 3720
gggaaagcag tcctgagcca ggaaattcta ccgggtaggg gaggcgcttt tcccaaggca 3780
gtctggagca tgcgctttag cagccccgct gggcacttgg cgctacacaa gtggcctctg 3840
gcctcgcaca cattccacat ccaccggtag gcgccaaccg gctccgttct ttggtggccc 3900
cttcgcgcca ccttctactc ctcccctagt caggaagttc ccccccgccc cgcagctcgc 3960
gtcgtgcagg acgtgacaaa tggaagtagc acgtctcact agtctcgtgc agatggacag 4020
caccgctgag caatggaagc gggtaggcct ttggggcagc ggccaatagc agctttgctc 4080
cttcgctttc tgggctcaga ggctgggaag gggtgggtcc gggggcgggc tcaggggcgg 4140
gctcaggggc ggggcgggcg cccgaaggtc ctccggaggc ccggcattct gcacgcttca 4200
aaagcgcacg tctgccgcgc tgttctcctc ttcctcatct ccgggccttt cgacctccta 4260
gggccaccat ggtgagcaag ggcgaggacg acaacatggc catcatcaag gagttcatgc 4320
gcttcaaggt gcacatggag ggctccgtga acggccacga gttcgagatc gagggcgagg 4380
gcgagggccg cccctacgag ggcacccaga ccgccaagct gaaggtgacc aagggcggcc 4440
ccctgccctt cgcctgggac atcctgtccc ctcagttcat gtacggctcc aaggcctacg 4500
tgaagcaccc cgccgacatc cccgactact tgaagctgtc cttccccgag ggcttcaagt 4560
gggagcgcgt gatgaacttc gaggacggcg gcgtggtgac cgtgacccag gactcctccc 4620
tgcaggacgg cgagttcatc tacaaggtga agctgcgcgg caccaacttc ccctccgacg 4680
gccccgtaat gcagaagaag accatgggct gggaggcctc ctccgagcgg atgtaccccg 4740
aggacggcgc cctgaagggc gagatcaagc agaggctgaa gctgaaggac ggcggccact 4800
acgacgccga ggtcaagacc acctacaagg ccaagaagcc cgtgcagctg cccggcgcct 4860
acaacgtcaa catcaagctg gacatcacct cccacaacga ggactacacc atcgtggaac 4920
agtacgagcg cgccgagggc cgccactcca ccggcggcat ggacgagctg tacaagtgag 4980
gatccgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 5040
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 5100
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 5160
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 5220
tatggcttct gaggcggaaa gaacccttct gaggcggaaa gaaccagctg ccttaatata 5280
acttcgtata atgtatgcta tacgaagtta ttaggtctga agaggagttt acgtccagcc 5340
aattctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 5400
aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 5460
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 5520
cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 5580
ctgactaatt ttttttattt atgcagaggc cgaggccgcc tctgcctctg agctattcca 5640
gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc cgggagcttg 5700
tatatccatt ttcggcggcc gcgccaccat gaccgagtac aagcccacgg tgcgcctcgc 5760
cacccgcgac gacgtcccca gggccgtacg caccctcgcc gccgcgttcg ccgactaccc 5820
cgccacgcgc cacaccgtcg atccggaccg ccacatcgag cgggtcaccg agctgcaaga 5880
actcttcctc acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc 5940
cgcggtggcg gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat 6000
cggcccgcgc atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg 6060
cctcctggcg ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggagtctc 6120
gcccgaccac cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc 6180
cgagcgcgcc ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta 6240
cgagcggctc ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg 6300
gtgcatgacc cgcaagcccg gtgcctgaga attcgcggga ctctggggtt cgaaatgacc 6360
gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 6420
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 6480
ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 6540
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 6600
ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgctcga ctagagcttg 6660
cggaaccctt aatataactt cgtataatgt atgctatacg aagttattag gtccgctggc 6720
catctacgag ccaaagactt tcaaatcttt ggctgccttg gccagtagga ggcgacacga 6780
aggatttgct gctgccttgg gggatgggaa ggaacctgaa ggcatttttt ccagagtggt 6840
gcagtaccac tgaggactgt tgctgtattg attaggaaaa gagacagagt aatttgcagt 6900
ttgtttgatt tatactgggc tgcaggtcga gggatcttca taagagaaga gggacagcta 6960
tgactgggag tagtcaggag aggaggaaaa atctggctag taaaacatgt aaggaaaatt 7020
ttagggatgt taaagaaaaa aataacacaa aacaaaatat aaaaaaaatc taacctcaag 7080
tcaaggcttt tctatggaat aaggaatgga cagcaggggg ctgtttcata tactgatgac 7140
ctctttatag ccacctttgt tcatggcagc cagcatatgg catatgttgc caaactctaa 7200
accaaatact cattctgatg ttttaaatga tttgccctcc catatgtcct tccgagtgag 7260
agacacaaaa aattccaaca cactattgca atgaaaataa atttccttta ttagccagaa 7320
gtcagatgct caaggggctt catgatgtcc ccataatttt tggcagaggg aaaaagatct 7380
cagtggtatt tgtgagccag ggcattggcc acaccagcca ccaccttctg ataggcagcc 7440
tgcggtacct tacatggtgg cgaattcgtt tgccaaaatg atgagacagc acaataacca 7500
gcacgttgcc caggagctgt aggaaaaaga agaaggcatg aacatggtta gcagaggctc 7560
tagagccgcc ggtcacacgc cagaagccga accccgccct gccccgtccc ccccgaaggc 7620
agccgtcccc ctgcggcagc cccgaggctg gagatggaga aggggacggc ggcgcggcga 7680
cgcacgaagg ccctccccgc ccatttcctt cctgccggcg ccgcaccgct tcgcccgcgc 7740
ccgctagagg gggtgcggcg gcgcctccca gatttcggct ccgccagatt tgggacaaag 7800
gaagtccctg cgccctctcg cacgattacc ataaaaggca atggctgcgg ctcgccgcgc 7860
ctcgacagcc gccggcgctc cggggccgcc gcgcccctcc cccgagccct ccccggcccg 7920
aggcggcccc gccccgcccg gcacccccac ctgccgccac cccccgcccg gcacggcgag 7980
ccccgcgcca cgccccgcac ggagccccgc acccgaagcc gggccgtgct cagcaactcg 8040
gggagggggg tgcagggggg ggttacagcc cgaccgccgc gcccacaccc cctgctcacc 8100
cccccacgca cacaccccgc acgcagcctt tgttcccctc gcagcccccc cgcaccgcgg 8160
ggcaccgccc ccggccgcgc tcccctcgcg cacacgcgga gcgcacaaag ccccgcgccg 8220
cgcccgcagc gctcacagcc gccgggcagc gcgggccgca cgcggcgctc cccacgcaca 8280
cacacacgca cgcacccccc gagccgctcc cccccgcaca aagggccctc ccggagccct 8340
ttaaggcttt cacgcagcca cagaaaagaa acgagccgtc attaaaccaa gcgctaatta 8400
cagcccggag gagaagggcc gtcccgcccg ctcacctgtg ggagtaacgc ggtcagtcag 8460
agccggggcg ggcggcgcga ggcggcgcgg agcggggcac ggggcgaagg caacgcagcg 8520
actcccgccc gccgcgcgct tcgcttttta tagggccgcc gccgccgccg cctcgccata 8580
aaaggaaact ttcggagcgc gccgctctga ttggctgccg ccgcacctct ccgcctcgcc 8640
ccgccccgcc cctcgccccg ccccgccccg cctggcgcgc gccccccccc cccccgcccc 8700
catcgctgca caaaataatt aaaaaataaa taaatacaaa attgggggtg gggagggggg 8760
ggagatgggg agagtgaagc agaacgtggg gctcacctcg acccatggta atagcgatga 8820
ctaatacgta gatgtactgc caagtaggaa agtcccataa ggtcatgtac tgggcataat 8880
gccaggcggg ccatttaccg tcattgacgt caataggggg cgtacttggc atatgataca 8940
cttgatgtac tgccaagtgg gcagtttacc gtaaatagtc cacccattga cgtcaatgga 9000
aagtccctat tggcgttact atgggaacat acgtcattat tgacgtcaat gggcgggggt 9060
cgttgggcgg tcagccaggc gggccattta ccgtaagtta tgtaacgcgg aactccatat 9120
atgggctatg aactaatgac cccgtaattg attactatta ataactagtc aataatcaat 9180
gtcgtaaatg tcgtaaatgt ctcagctagt caggtagtaa aaggtgtcaa ctaggcagtg 9240
gcagagcagg attcaaattc agggctgttg tgatgcctcc gcagactctg agcgccacct 9300
ggtggtaatt tgtctgtgcc tcttctgacg tggaagaaca gcaactaaca cactaacacg 9360
gcatttacta tgggccagcc attgtacgcg ttgagtaggt cacatttcag taaaacctgg 9420
ctttgtggat tgagcatggt ctgtctcttc ctggtacttc attagtcccc taagtgggat 9480
ttgctgagca agactcctca attacagaaa tactccagtt tagaattctc gcaaaggctt 9540
tttgtttcca caagtagaat ctagaaagca atctcaagta acaacagcag agacctgaat 9600
cccaatccat ctttcctgtg tgtcctcttt tacctccttc cctttcatgt tgaaccaaca 9660
gtcctttttc agtctagaag ctagtacgaa agaaatgtac agatgtaggt accaagcaaa 9720
gccattagcc aataactggt gagatggagc taagaggaaa taaaagtgtt cctaagaata 9780
gcacagcaga agctagatcc acagatctta aaacaatttt ggttgagtaa gagtagaggc 9840
aaaagaggaa gctaataatg cagtttttag gagctaagag ccagataaag ggtaagggca 9900
ggaggaagtg ctatctcagc taacgagata catgaaacaa cggtggaagt ccagcaggca 9960
caagatgagt tgagaagcaa tcagggccag aaggatgtgc aaggcctcaa aataaaaaag 10020
cacagggcca cagggaacct tatggaaatt aaaaggaaga ggatgcagtc aggagaggaa 10080
aaaatagtgc tccctccccc atgcccaagg aagcagctga gcagccagta cttgggaagt 10140
tagtagtaat aagttggtaa gagggagttc tgttcgtggc tcaatggtta acaaatcaga 10200
ctagaaaccg tgaggttgcg ggtttgatcc ctggccttgc tcagtgggtt aaggatccgg 10260
cattgccgtg acctgtggtg taggtcacag acgtggctca gttcccgcat tcctgtggct 10320
ctggtgtagg ctggtggcta cagctctgat tagaccccta ggctgggaac ctccatatgc 10380
cctggaagtg gccgtagaaa agatgcggcc gccataaaag ttttgttact ttatagaaga 10440
aattttgagt ttttgttttt tttaataaat aaataaacat aaataaattg tttgttgaat 10500
ttattattag tatgtaagtg taaatataat aaaacttaat atctattcaa attaataaat 10560
aaacctcgat atacagaccg ataaaacaca tgcgtcaatt ttacacatga ttatctttaa 10620
cgtacgtcac aatatgatta tctttctagg gttaatctag ctgcgtgttc tgcagcgtgt 10680
cgagcatctt catctgctcc atcacgctgt aaaacacatt tgcaccgcga gtctgcccgt 10740
cctccacggg ttcaaaaacg tgaatgaacg aggcgcgctc actggccgtc gttttacaac 10800
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 10860
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 10920
gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 10980
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 11040
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 11100
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 11160
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 11220
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 11280
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 11340
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttaggtgg 11400
cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa 11460
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 11520
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 11580
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 11640
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 11700
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 11760
atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 11820
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 11880
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 11940
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 12000
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 12060
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 12120
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 12180
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 12240
ttcacgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 12300
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 12360
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 12420
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 12480
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 12540
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 12600
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 12660
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 12720
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 12780
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 12840
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 12900
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 12960
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 13020
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 13080
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 13140
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 13200
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 13260
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 13320
ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 13380
ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag 13440
ttagctcact cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg 13500
tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa 13560
gcgcgcccgc cgggtaactc acggggtatc catgtccatt tctgcggcat ccagccagga 13620
tacccgtcct cgctgacgta atatcccagc gccgcaccgc tgtcattaat ctgcacaccg 13680
gcacggcagt tccggctgtc gccggtattg ttcgggttgc tgatgcgctt cgggctgacc 13740
atccggaact gtgtccggaa aagccgcgac gaactggtat cccaggtggc ctgaacgaac 13800
agttcaccgt taaaggcgtg catggccaca ccttcccgaa tcatcatggt aaacgtgcgt 13860
tttcgctcaa cgtcaatgca gcagcagtca tcctcggcaa actctttcca tgccgcttca 13920
acctcgcggg aaaaggcacg ggcttcttcc tccccgatgc ccagatagcg ccagcttggg 13980
cgatgactga gccggaaaaa agacccgacg atatgatcct gatgcagcta gattaaccct 14040
agaaagatag tctgcgtaaa attgacgcat gcattcttga aatattgctc tctctttcta 14100
aatagcgcga atccgtcgct gtgcatttag gacatctcag tcgccgcttg gagctcccgt 14160
gaggcgtgct tgtcaatgcg gtaagtgtca ctgattttga actataacga ccgcgtgagt 14220
caaaatgacg catgattatc ttttacgtga cttttaagat ttaactcata cgataattat 14280
attgttattt catgttctac ttacgtgata acttattata tatatatttt cttgttatag 14340
atatc 14345
<210> 7
<211> 14394
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ggcgcgccgg atggggactc atgtgaattt tctaaaggtg ctatttaaac ggggggcacg 60
agtgccggct ttggacaggg ccgctcgctc tccacccttt cttcttcccc ctcggccgcc 120
tctcaccccc tgaggcctct ctccccccac gacctcctct ctctcctctg aaaccctctc 180
ctcctcagct gcatcccacc ctcgtggcct ctctctctct ctgtctgtcc tgtgtcctct 240
ctcactgggt ttcagagcac agatgcccaa agcacaaaag cagttttccc ctggggtggg 300
aggaagcaag agactttgta cctattttgt atgtgtataa taatttgaga tgtttttaat 360
tattttgatt gctggaataa agcatgtgga aatgacccaa accaatcttg cactggcctc 420
ctgatttcct tccttggaga cggagggagg gggagacctg ggggagggcg cttggggggg 480
ggtgggctct cttctttctg cgctcccccc ccccacctcc aacaccttga cgacccctcc 540
tgcttccgct tgcctttctc aggctttaac actttctcct cgccctctca gcatgcgcat 600
gcgcgtgcct ctacctcccc cgcacatcct ggcctgccca ccctgaatgg cctggcccag 660
cgatgccacc aactctctcg ctccgtccac ggctggggag gggggcactc tgcagggttg 720
gggggcactg ggaggctggg ttgggtgagg gaggggtgcc tgggccccca ccccccagca 780
agttctctcc ctaggcgaac tggagggtcg tctggcctct tgagccttgt tgctggctct 840
gagctctacc aagagagtga ccagcaggac cgcaccatca cgcgccccag acccgggcct 900
ggggggcaag tcggggggcg gggggaggtc gggcagggtc ccctgggagg atggggacgt 960
gctgtgcccc tagcggccac cagagggcac caggacacca ctgcggtcgg ctcagcggct 1020
cctgccctgg tcagggggcg ccaggtcctg cccctcctgg ggagggcggg gggcgagaag 1080
ggcgatttta attaacccac gtttcaacat gcacatccca gtaatttgga aacattttgt 1140
ttccaaagat tcacttaaca ttggtttagc aacatgaagc tttctatgca acccaaggac 1200
tcagtttttg gcctgtttta gtgacaggca atcagcaaca tgctgcattt ctctccagtg 1260
ttgtaatcaa agaaaccctc ccatagcttt aaatgatatt ccttcccctt ccaattatgt 1320
ggggggaaaa caaccctatt ctccacccag aagtgttaac tcaagaatta cattttcaag 1380
aagtttccag attcgtaaaa ccagaattag atgtctttca cctaaatgtc tcggtgttga 1440
ccaaaggaac acacaggttt ctcatttaac ttttttaatg ggtctcaaaa ttctgtgaca 1500
aatttttggt caagttgttt ccattaaaaa gtactgattt taaaaactaa taacttaaaa 1560
ctgccacacg caaaaaagaa aaccaaagtg gtccacaaaa cattctcctt tccttctgaa 1620
ggttttacga tgcattgtta tcattaacca gtcttttact actaaactta aatggccaat 1680
tgaaacaaac agttctgaga ccgttcttcc accactgatt aagagtgggg tggcaggtat 1740
tagggataat gctagcttac ttgtacagct cgtccatgcc gagagtgatc ccggcggcgg 1800
tcacgaactc cagcaggacc atgtgatcgc gcttctcgtt ggggtctttg ctcagggcgg 1860
actgggtgct caggtagtgg ttgtcgggca gcagcacggg gccgtcgccg atgggggtgt 1920
tctgctggta gtggtcggcg agctgcacgc tgccgtcctc gatgttgtgg cggatcttga 1980
agttcacctt gatgccgttc ttctgcttgt cggccatgat atagacgttg tggctgttgt 2040
agttgtactc cagcttgtgc cccaggatgt tgccgtcctc cttgaagtcg atgcccttca 2100
gctcgatgcg gttcaccagg gtgtcgccct cgaacttcac ctcggcgcgg gtcttgtagt 2160
tgccgtcgtc cttgaagaag atggtgcgct cctggacgta gccttcgggc atggcggact 2220
tgaagaagtc gtgctgcttc atgtggtcgg ggtagcggct gaagcactgc acgccgtagg 2280
tcagggtggt cacgagggtg ggccagggca cgggcagctt gccggtggtg cagatgaact 2340
tcagggtcag cttgccgtag gtggcatcgc cctcgccctc gccggacacg ctgaacttgt 2400
ggccgtttac gtcgccgtcc agctcgacca ggatgggcac caccccggtg aacagctcct 2460
cgcccttgct caccatggtg gcgtcgaccg tacgtcacga cacctgaaat ggaagaaaaa 2520
aactttgaac cactgtctga ggcttgagaa tgaaccaaga tccaaactca aaaagggcaa 2580
attccaagga gaattacatc aagtgccaag ctggcctaac ttcagtctcc acccactcag 2640
tgtggggaaa ctccatcgca taaaacccct ccccccaacc taaagacgac gtactccaaa 2700
agctcgagaa ctaatcgagg tgcctggacg gcgcccggta ctccgtggag tcacatgaag 2760
cgacggctga ggacggaaag gcccttttcc tttgtgtggg tgactcaccc gcccgctctc 2820
ccgagcgccg cgtcctccat tttgagctcc ctgcagcagg gccgggaagc ggccatcttt 2880
ccgctcacgc aactggtgcc gaccgggcca gccttgccgc ccagggcggg gcgatacacg 2940
gcggcgcgag gccaggcacc agagcaggcc ggccagcttg agactacccc cgtccgattc 3000
tcggtggccg cgctcgcagg ccccgcctcg ccgaacatgt gcgctgggac gcacgggccc 3060
cgtcgccgcc cgcggcccca aaaaccgaaa taccagtgtg cagatcttgg cccgcattta 3120
caagactatc ttgccagaaa aaaagcgtcg cagcaggtca tcaaaaattt taaatggcta 3180
gagacttatc gaaagcagcg agacaggcgc gaaggtgcca ccagattcgc acgcggcggc 3240
cccagcgccc aggccaggcc tcaactcaag cacgaggcga aggggctcct taagcgcaag 3300
gcctcgaact ctcccaccca cttccaaccc gaagctcggg atcaagaatc acgtactgca 3360
gccagtggaa gtaattcaag gcacgcaagg gccataaccc gtaaagaggc caggcccgcg 3420
ggaaccacac acggcactta cctgtgttct ggcggcaaac ccgttgcgaa aaagaacgtt 3480
cacggcgact actgcactta tatacggttc tcccccaccc tcgggaaaaa ggcggagcca 3540
gtacacgaca tcactttccc agtttacccc gcgccacctt ctctaggcac cggttcaatt 3600
gccgacccct ccccccaact tctcggggac tgtgggcgat gtgcgctctg cccactgacg 3660
ggcaccggag ccctagattc gattcccttt ggggcaaaac tcaccgccta atcccctata 3720
actctaccgg ggagcccggt ggagagcaga cgggctgacg ctgccacctg ccggccatcc 3780
caggatagga ccgccgtatt caagtcgccc tcaggaagga ccctcggggc accagaggcc 3840
ttcgaagccc caatgagtga ggcaactgag ggtcgcgggt gccattacaa ggcccagcca 3900
aggcctagag ccaaggcttg aaccgtgggg gacccccaag ccccacctgc ccaggaacag 3960
cagacactgg gacactttgt ttcaggtcct gcccaggccc ctcccactgt gaggctggga 4020
tttgtcgccc agggtgcaga tgagaagagt ggggaaagca gtcctgagcc aggaaattct 4080
accgggtagg ggaggcgctt ttcccaaggc agtctggagc atgcgcttta gcagccccgc 4140
tgggcacttg gcgctacaca agtggcctct ggcctcgcac acattccaca tccaccggta 4200
ggcgccaacc ggctccgttc tttggtggcc ccttcgcgcc accttctact cctcccctag 4260
tcaggaagtt cccccccgcc ccgcagctcg cgtcgtgcag gacgtgacaa atggaagtag 4320
cacgtctcac tagtctcgtg cagatggaca gcaccgctga gcaatggaag cgggtaggcc 4380
tttggggcag cggccaatag cagctttgct ccttcgcttt ctgggctcag aggctgggaa 4440
ggggtgggtc cgggggcggg ctcaggggcg ggctcagggg cggggcgggc gcccgaaggt 4500
cctccggagg cccggcattc tgcacgcttc aaaagcgcac gtctgccgcg ctgttctcct 4560
cttcctcatc tccgggcctt tcgacctcct agggccacca tggtgagcaa gggcgaggac 4620
gacaacatgg ccatcatcaa ggagttcatg cgcttcaagg tgcacatgga gggctccgtg 4680
aacggccacg agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag 4740
accgccaagc tgaaggtgac caagggcggc cccctgccct tcgcctggga catcctgtcc 4800
cctcagttca tgtacggctc caaggcctac gtgaagcacc ccgccgacat ccccgactac 4860
ttgaagctgt ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc 4920
ggcgtggtga ccgtgaccca ggactcctcc ctgcaggacg gcgagttcat ctacaaggtg 4980
aagctgcgcg gcaccaactt cccctccgac ggccccgtaa tgcagaagaa gaccatgggc 5040
tgggaggcct cctccgagcg gatgtacccc gaggacggcg ccctgaaggg cgagatcaag 5100
cagaggctga agctgaagga cggcggccac tacgacgccg aggtcaagac cacctacaag 5160
gccaagaagc ccgtgcagct gcccggcgcc tacaacgtca acatcaagct ggacatcacc 5220
tcccacaacg aggactacac catcgtggaa cagtacgagc gcgccgaggg ccgccactcc 5280
accggcggca tggacgagct gtacaagtga ggatccgctg atcagcctcg actgtgcctt 5340
ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 5400
ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 5460
gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 5520
atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa agaacccttc 5580
tgaggcggaa agaaccagct gccttaatat aacttcgtat aatgtatgct atacgaagtt 5640
attaggtctg aagaggagtt tacgtccagc caattctgtg gaatgtgtgt cagttagggt 5700
gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 5760
cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 5820
atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 5880
cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 5940
ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 6000
taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggcggc cgcgccacca 6060
tgaccgagta caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc agggccgtac 6120
gcaccctcgc cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc gatccggacc 6180
gccacatcga gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc gggctcgaca 6240
tcggcaaggt gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc acgccggaga 6300
gcgtcgaagc gggggcggtg ttcgccgaga tcggcccgcg catggccgag ttgagcggtt 6360
cccggctggc cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg cccaaggagc 6420
ccgcgtggtt cctggccacc gtcggagtct cgcccgacca ccagggcaag ggtctgggca 6480
gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc gccttcctgg 6540
agacctccgc gccccgcaac ctccccttct acgagcggct cggcttcacc gtcaccgccg 6600
acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc ggtgcctgag 6660
aattcgcggg actctggggt tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg 6720
agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg ttttccggga 6780
cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa 6840
cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa 6900
taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta 6960
tcatgtctgt ataccgctcg actagagctt gcggaaccct taatataact tcgtataatg 7020
tatgctatac gaagttatta ggtccgctgg ccatctacga gccaaagact ttcaaatctt 7080
tggctgcctt ggccagtagg aggcgacacg aaggatttgc tgctgccttg ggggatggga 7140
aggaacctga aggcattttt tccagagtgg tgcagtacca ctgaggactg ttgctgtatt 7200
gattaggaaa agagacagag taatttgcag tttgtttgat ttatactggg ctgcaggtcg 7260
agggatcttc ataagagaag agggacagct atgactggga gtagtcagga gaggaggaaa 7320
aatctggcta gtaaaacatg taaggaaaat tttagggatg ttaaagaaaa aaataacaca 7380
aaacaaaata taaaaaaaat ctaacctcaa gtcaaggctt ttctatggaa taaggaatgg 7440
acagcagggg gctgtttcat atactgatga cctctttata gccacctttg ttcatggcag 7500
ccagcatatg gcatatgttg ccaaactcta aaccaaatac tcattctgat gttttaaatg 7560
atttgccctc ccatatgtcc ttccgagtga gagacacaaa aaattccaac acactattgc 7620
aatgaaaata aatttccttt attagccaga agtcagatgc tcaaggggct tcatgatgtc 7680
cccataattt ttggcagagg gaaaaagatc tcagtggtat ttgtgagcca gggcattggc 7740
cacaccagcc accaccttct gataggcagc ctgcggtacc ttacatggtg gcgaattcgt 7800
ttgccaaaat gatgagacag cacaataacc agcacgttgc ccaggagctg taggaaaaag 7860
aagaaggcat gaacatggtt agcagaggct ctagagccgc cggtcacacg ccagaagccg 7920
aaccccgccc tgccccgtcc cccccgaagg cagccgtccc cctgcggcag ccccgaggct 7980
ggagatggag aaggggacgg cggcgcggcg acgcacgaag gccctccccg cccatttcct 8040
tcctgccggc gccgcaccgc ttcgcccgcg cccgctagag ggggtgcggc ggcgcctccc 8100
agatttcggc tccgccagat ttgggacaaa ggaagtccct gcgccctctc gcacgattac 8160
cataaaaggc aatggctgcg gctcgccgcg cctcgacagc cgccggcgct ccggggccgc 8220
cgcgcccctc ccccgagccc tccccggccc gaggcggccc cgccccgccc ggcaccccca 8280
cctgccgcca ccccccgccc ggcacggcga gccccgcgcc acgccccgca cggagccccg 8340
cacccgaagc cgggccgtgc tcagcaactc ggggaggggg gtgcaggggg gggttacagc 8400
ccgaccgccg cgcccacacc ccctgctcac ccccccacgc acacaccccg cacgcagcct 8460
ttgttcccct cgcagccccc ccgcaccgcg gggcaccgcc cccggccgcg ctcccctcgc 8520
gcacacgcgg agcgcacaaa gccccgcgcc gcgcccgcag cgctcacagc cgccgggcag 8580
cgcgggccgc acgcggcgct ccccacgcac acacacacgc acgcaccccc cgagccgctc 8640
ccccccgcac aaagggccct cccggagccc tttaaggctt tcacgcagcc acagaaaaga 8700
aacgagccgt cattaaacca agcgctaatt acagcccgga ggagaagggc cgtcccgccc 8760
gctcacctgt gggagtaacg cggtcagtca gagccggggc gggcggcgcg aggcggcgcg 8820
gagcggggca cggggcgaag gcaacgcagc gactcccgcc cgccgcgcgc ttcgcttttt 8880
atagggccgc cgccgccgcc gcctcgccat aaaaggaaac tttcggagcg cgccgctctg 8940
attggctgcc gccgcacctc tccgcctcgc cccgccccgc ccctcgcccc gccccgcccc 9000
gcctggcgcg cgcccccccc ccccccgccc ccatcgctgc acaaaataat taaaaaataa 9060
ataaatacaa aattgggggt ggggaggggg gggagatggg gagagtgaag cagaacgtgg 9120
ggctcacctc gacccatggt aatagcgatg actaatacgt agatgtactg ccaagtagga 9180
aagtcccata aggtcatgta ctgggcataa tgccaggcgg gccatttacc gtcattgacg 9240
tcaatagggg gcgtacttgg catatgatac acttgatgta ctgccaagtg ggcagtttac 9300
cgtaaatagt ccacccattg acgtcaatgg aaagtcccta ttggcgttac tatgggaaca 9360
tacgtcatta ttgacgtcaa tgggcggggg tcgttgggcg gtcagccagg cgggccattt 9420
accgtaagtt atgtaacgcg gaactccata tatgggctat gaactaatga ccccgtaatt 9480
gattactatt aataactagt caataatcaa tgtcgtaaat gtcgtaaatg tctcagctag 9540
tcaggtagta aaaggtgtca actaggcagt ggcagagcag gattcaaatt cagggctgtt 9600
gtgatgcctc cgcagactct gagcgccacc tggtggtaat ttgtctgtgc ctcttctgac 9660
gtggaagaac agcaactaac acactaacac ggcatttact atgggccagc cattgtacgc 9720
gttggtggtt gctgagactg cgtgggggcc caaggagacc tggagaaagg aatgcttcct 9780
gctccttctt ctggggcccc aggagagcct tcccagggcc ttggagaggt gctgtccagg 9840
gactaaccct gtgctctagg aaggctgcag gccctgacca gctgggcagg tcctgggtcc 9900
ctcctggcct tctaagttcc ccaaacatga gacctctggg tgtggggtgg cctggggagg 9960
tcattttgcc caggccctac ctcctgccca ttcctaaccc tttttaaaaa tctgtgcgtc 10020
ctcttcttcc ttcttctccc tcccttccct tttcgctcac cctctgctgc tggcctgaga 10080
gccggaggcc cccaggggga aggcgactgg tctcctcccc agtctcaggg aagggagaca 10140
gagaatccag gaagccagaa ctcagcagac gaagcaccca gggacctaga gatgggttga 10200
aaagttgaca gctgtcccac ctgcctccca aggtctcagg gcctaaacct ccaaggcagg 10260
aaaggcccct gtccctccct ggggtccata gaaagaggga caagtctgca cggaccattt 10320
gctgtaatat taacaccttg gctgtcatta ggtagtcttg gctgttaatt atgtcctgtg 10380
ataatgtatt attagcacgc cgaccacata gggtagggaa ctgcagctag taaacaaaag 10440
tttgttccta tatgcggccg ccataaaagt tttgttactt tatagaagaa attttgagtt 10500
tttgtttttt ttaataaata aataaacata aataaattgt ttgttgaatt tattattagt 10560
atgtaagtgt aaatataata aaacttaata tctattcaaa ttaataaata aacctcgata 10620
tacagaccga taaaacacat gcgtcaattt tacacatgat tatctttaac gtacgtcaca 10680
atatgattat ctttctaggg ttaatctagc tgcgtgttct gcagcgtgtc gagcatcttc 10740
atctgctcca tcacgctgta aaacacattt gcaccgcgag tctgcccgtc ctccacgggt 10800
tcaaaaacgt gaatgaacga ggcgcgctca ctggccgtcg ttttacaacg tcgtgactgg 10860
gaaaaccctg gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg 10920
cgtaatagcg aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc 10980
gaatgggacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 11040
gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 11100
ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc 11160
cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 11220
agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 11280
aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 11340
gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa 11400
aaatttaacg cgaattttaa caaaatatta acgcttacaa tttaggtggc acttttcggg 11460
gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc 11520
tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 11580
ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 11640
ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 11700
gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 11760
gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg 11820
acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 11880
actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 11940
ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 12000
cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 12060
gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 12120
caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 12180
aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 12240
ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggt tcacgcggta 12300
tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 12360
ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 12420
ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 12480
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 12540
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 12600
cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 12660
taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 12720
gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 12780
acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 12840
ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 12900
ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 12960
cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 13020
aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 13080
gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 13140
gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 13200
gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 13260
ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 13320
ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 13380
caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca 13440
ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt tagctcactc 13500
attaggcacc ccaggcttta cactttatgc ttccggctcg tatgttgtgt ggaattgtga 13560
gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag cgcgcccgcc 13620
gggtaactca cggggtatcc atgtccattt ctgcggcatc cagccaggat acccgtcctc 13680
gctgacgtaa tatcccagcg ccgcaccgct gtcattaatc tgcacaccgg cacggcagtt 13740
ccggctgtcg ccggtattgt tcgggttgct gatgcgcttc gggctgacca tccggaactg 13800
tgtccggaaa agccgcgacg aactggtatc ccaggtggcc tgaacgaaca gttcaccgtt 13860
aaaggcgtgc atggccacac cttcccgaat catcatggta aacgtgcgtt ttcgctcaac 13920
gtcaatgcag cagcagtcat cctcggcaaa ctctttccat gccgcttcaa cctcgcggga 13980
aaaggcacgg gcttcttcct ccccgatgcc cagatagcgc cagcttgggc gatgactgag 14040
ccggaaaaaa gacccgacga tatgatcctg atgcagctag attaacccta gaaagatagt 14100
ctgcgtaaaa ttgacgcatg cattcttgaa atattgctct ctctttctaa atagcgcgaa 14160
tccgtcgctg tgcatttagg acatctcagt cgccgcttgg agctcccgtg aggcgtgctt 14220
gtcaatgcgg taagtgtcac tgattttgaa ctataacgac cgcgtgagtc aaaatgacgc 14280
atgattatct tttacgtgac ttttaagatt taactcatac gataattata ttgttatttc 14340
atgttctact tacgtgataa cttattatat atatattttc ttgttataga tatc 14394
<210> 8
<211> 1101
<212> DNA
<213> Sus scrofa
<400> 8
aataaatgca ctgttgggcc tatgctcaag atgggtagtg ttaattggtg gtggaactta 60
tctgatttca tgacttgctg gctacctaaa acaggtgagg agaaagccaa tgggactggg 120
actggatgag caagtacaac aaacaaaatg ggcttaaagt atgagtgaga gttatctgac 180
cgtaaggatg caagtgaggg ggcctaaggt ttggagatta atatttaatc tcagatgcta 240
tactttggtg gtgtagcaaa agtctacaaa tgggatgact gtaaaactca gtagatccgt 300
gctttttaac ctatctccct tcatcaggaa attgcgacac aaagatcttt agtaataaca 360
cgcagtctca atgcataaaa tcaggcttag gtgttgcctg gactcatttc ccatctccac 420
cccactataa ttattttgtg acacaaactc aagactgtgg gaatatagag aaattgggct 480
cgtcctcgta cacctgctca atcccctgca ggacaacgcc caagaatcag gttaagccag 540
ggcaaaagaa tcccgcccat aatcgagaag gagcaaactg acatggaggc gatgacgaga 600
tcgcggggga gggagggatt tttctaggcc cagggcggtc cttaggaaaa ggaggcagca 660
gagaactccc ataaaggtat tgcggcactc ccctccccct gcggagaagg gtgcggcctt 720
ctctccgcct cctccactgc agctccctca ggattgcagc tcgcgcgggt ttttggagaa 780
catgcgcctc ccacccacaa gccagcagga ccgacccccc actccttcct ccacccccca 840
cccccacggg tccgagagca ggtagagagc tagtctcgtc cttcaggcgg cggacgccca 900
gggcggagcc gcagtcacca ccacccagaa gcctcggccc ggcagcccgc ccccgcctcc 960
tgcgcgcgct tcctgccacg ttgcgcaggg gcgaggggcc agacactgcg gcgctggcct 1020
cggggagggc cgtaccaaag accgcctccc tgccgactcg cgtagtggtt tcgctcattt 1080
gggacccaag ccaataacaa g 1101
<210> 9
<211> 1056
<212> DNA
<213> Sus scrofa
<400> 9
tgctctctct cctgccccct tcacctgcgt gccctcctca ttctccctct gtgccacctc 60
tggccttgca ctgtaggctc tctcttgggg atgtttctct ttctccacac acttctcttt 120
cactctgtcc tcttgctttg tgtgggcctg cagcgttacc cttttttctg ggcacactca 180
gagcaccctc ctctttctgg ttctgggcca cctgtctgtc ctcgggtcat cttgctctct 240
ctgcctggat gccctcctgt ggctttgggc agcttctccc tccttcagag tgcaccgcca 300
gttctcctag gcccggtcac ttccccttcc caggggacct agagccctgc taggtcctct 360
ctctccacaa cctgggcccc caaacctttc caaaacacct tgctttctgc ctccattggt 420
cttgtgttcc agagccagag tcactatatg tcccagaacc aggattccct ctggttctga 480
gggcttttat cgcatcccct gcctggctgc agtgggtctt tggggacagg ccacagaaga 540
gcctctactc ctccctctgt ccccgaggct gtctccctcc cagtcttccc agctcaggcc 600
agtccccagg cctctcttcc ctgccagagc ccgtcaggtt cggttacttt ggggcccaga 660
gaggaccctg tgaaggaagc gtgggtaggg gcacgggaat ggggaggatg cctgaagagg 720
cccccttagc cagaagagga gcagaagagg agcaggtacc cagaagagga gcagttcagg 780
gaaatagaag agtcccgagc tctttttttt tttttttttt atttcttttc ttttcttttc 840
tttttatggc agcatccgtg gtatatggag gttcccagcc taggggtcag atcatacctg 900
caactgccag cctacaccac agccacagca ctcaggatcc gagctgcatc tgcggcttac 960
gccacaggtc acagcaacgc tggatcctta acccactgaa tgaggccagg gattgaacct 1020
gcaacctcat gcacactatg ctggggtctt aatcgg 1056
<210> 10
<211> 1108
<212> DNA
<213> Sus scrofa
<400> 10
acttcctcct gcccttaccc tttatctggc tcttagctcc taaaaactgc attattagct 60
tcctcttttg cctctactct tactcaacca aaattgtttt aagatctgtg gatctagctt 120
ctgctgtgct attcttagga acacttttat ttcctcttag ctccatctca ccagttattg 180
gctaatggct ttgcttggta cctacatctg tacatttctt tcgtactagc ttctagactg 240
aaaaaggact gttggttcaa catgaaaggg aaggaggtaa aagaggacac acaggaaaga 300
tggattggga ttcaggtctc tgctgttgtt acttgagatt gctttctaga ttctacttgt 360
ggaaacaaaa agcctttgcg agaattctaa actggagtat ttctgtaatt gaggagtctt 420
gctcagcaaa tcccacttag gggactaatg aagtaccagg aagagacaga ccatgctcaa 480
tccacaaagc caggttttac tgaaatgtga cctactttct tatgttcctg gaagtttaga 540
tcagggtggg cagctctggg ttttataggc tacactgtta acactcaggc tgttttctac 600
cgtttagtca aaatatagtc accttgcctg cttcacctgt ccatcagaga atggcctcat 660
taattgactc tctagtatga agtcaaagta gctttggtgg ccctaaatgg acaagtatca 720
agagactggg tgaattgagg agcttgagac tgtcacctca gatcgaaaag actgaaaaat 780
cacctcagat caaaaagact gaaaaatctt cagtctggaa aggggactca aaaccataat 840
tagagtattc tggtagaatc cttttctcca ctgttattca tacagttaag gtgaataact 900
aaaagtaatt gtgagctgag gagtaagata caacacacaa ggaatcagtt aacagagtct 960
cgagtgaaat tataaatgga aagaattatg acttgaatca taactctgag gccccatttt 1020
ccctaacaac ttttgtccca ataaacgtgg gtatttgttt gggagaaact atcatataca 1080
tgattaccca gtaaacagac tgtttact 1108
<210> 11
<211> 1288
<212> DNA
<213> Sus scrofa
<400> 11
actttgtacc tattttgtat gtgtataata atttgagatg tttttaatta ttttgattgc 60
tggaataaag catgtggaaa tgacccaaac caatcttgca ctggcctcct gatttccttc 120
cttggagacg gagggagggg gagacctggg ggagggcgct tggggggggg tgggctctct 180
tctttctgcg ctcccccccc ccacctccaa caccttgacg acccctcctg cttccgcttg 240
cctttctcag gctttaacac tttctcctcg ccctctcagc atgcgcatgc gcgtgcctct 300
acctcccccg cacatcctgg cctgcccacc ctgaatgtcc tggcccagcg atgccaccaa 360
ctctctcgct ccgtccacgg ctggggaggg gggcactctg cagggttggg gggcactggg 420
aggctgggtt gggtgaggga ggggtgcctg ggcccccacc ccccagcaag ttctctccct 480
aggcgaactg gagggtcgtc tggcctcttg agccttgttg ctggctctga gctctaccaa 540
gagagtgacc agcaggaccg caccatcagt ggttgctgag actgcgtggg ggcccaagga 600
gacctggaga aaggaatgct tcctgctcct tcttctgggg ccccaggaga gccttcccag 660
ggccttggag agttgctgtc cagggactaa ccctgtgctc taggaaggct gcaggccctg 720
accagctggg caggtcctgg gtccctcctg gccttctaag ttccccaaac atgagacctc 780
tgggtgtggg gtggcctggg gaggtcattt tgcccaggcc ctacctcctg cccattccta 840
acccttttta aaaatctgtg cgtcctcttc ttccttcttc tccctccctt cccttttcgc 900
tcaccctctg ctgctggcct gagagccgga ggcccccagg gggaaggcga ctggtctcct 960
ccccagtctc agggaaggga gacagagaat ccaggaagcc agaactcagc agacgaagca 1020
cccagggacc tagagatggg ttgaaaagtt gacagctgtc ccacctgcct cccaaggtct 1080
cagggcctac acccttctcc gcagggggag gggagtgccg caataccttt atgggagttc 1140
tctgctgcct ccttttccta aggaccgccc tgggcctaga aaaatccctc cctcccccgc 1200
gatctcgtca tcgcctccat gtcagtttgc tccttctcga ttatgggcgg gattcttttg 1260
ccctggcgcg ccccagaccc gggcctgg 1288
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ggtcggagtg aacggatttg 20
<210> 13
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
caccgccaag aatcaggtta agcca 25
<210> 14
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aaactggctt aacctgattc ttggc 25
<210> 15
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
caccgcgaga aggagcaaac tgaca 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aaactgtcag tttgctcctt ctcgc 25
<210> 17
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
caccgaagga gcaaactgac atgg 24
<210> 18
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aaacccatgt cagtttgctc cttc 24
<210> 19
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
caccgcagga caacgcccaa gaatc 25
<210> 20
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aaacgattct tgggcgttgt cctgc 25
<210> 21
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
caccgaagac ccactgcagc caggc 25
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
aaacgcctgg ctgcagtggg tcttc 25
<210> 23
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
caccggagga gtagaggctc ttctg 25
<210> 24
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aaaccagaag agcctctact cctcc 25
<210> 25
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
caccgcccaa agacccactg cagcc 25
<210> 26
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
aaacggctgc agtgggtctt tgggc 25
<210> 27
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
caccgtgcag tgggtctttg gggac 25
<210> 28
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
aaacgtcccc aaagacccac tgcac 25
<210> 29
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
caccgttcca ggaacataag aaagt 25
<210> 30
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
aaacactttc ttatgttcct ggaac 25
<210> 31
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
caccgtgttc ctggaagttt agatc 25
<210> 32
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
aaacgatcta aacttccagg aacac 25
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
caccgaggct acactgttaa cactc 25
<210> 34
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
aaacgagtgt taacagtgta gcctc 25
<210> 35
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
caccggacct actttcttat gttcc 25
<210> 36
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
aaacggaaca taagaaagta ggtcc 25
<210> 37
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
caccgctacc aagagagtga ccagc 25
<210> 38
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
aaacgctggt cactctcttg gtagc 25
<210> 39
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
caccgggtcc tgctggtcac tctct 25
<210> 40
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
aaacagagag tgaccagcag gaccc 25
<210> 41
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
caccggcagt ctcagcaacc actga 25
<210> 42
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
aaactcagtg gttgctgaga ctgcc 25
<210> 43
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
caccgagcca gcaacaaggc tcaag 25
<210> 44
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
aaaccttgag ccttgttgct ggctc 25
<210> 45
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ccaagaatca ggttaagcca 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
cgagaaggag caaactgaca 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
gaaggagcaa actgacatgg 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
caggacaacg cccaagaatc 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
aagacccact gcagccaggc 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
gaggagtaga ggctcttctg 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
cccaaagacc cactgcagcc 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
tgcagtgggt ctttggggac 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
ttccaggaac ataagaaagt 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
tgttcctgga agtttagatc 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
aggctacact gttaacactc 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
gacctacttt cttatgttcc 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
ctaccaagag agtgaccagc 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ggtcctgctg gtcactctct 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
gcagtctcag caaccactga 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
agccagcaac aaggctcaag 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
agttatggca gaactcagtg 20
<210> 62
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
ccccatccaa agtttttaaa gga 23
<210> 63
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
tgtggcagat gtcacagttt agg 23
<210> 64
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
caccgagtta tggcagaact cagtg 25
<210> 65
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
aaaccactga gttctgccat aactc 25
<210> 66
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
acaggtgagg agaaagccaa tgg 23
<210> 67
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
ctgcgcaacg tggcaggaag 20
<210> 68
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
gcataaaatc aggcttaggt gttgc 25
<210> 69
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
ggtgggaggc gcatgttctc c 21
<210> 70
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
gactcatttc ccatctccac ccc 23
<210> 71
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
atgggtgctt gaggtggtct gac 23
<210> 72
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
gggtaaggac tatggagggt agc 23
<210> 73
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
tctctgctgc ctccttttcc taa 23
<210> 74
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
ccatttgatg ttggcgggat 20
<210> 75
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
tcttgttata gatatcggcg cgccctctac ctgctctcgg acccgtggg 49
<210> 76
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
ccaggcccgg gtctggggcg cgccagggca aaagaatccc gcccataatc g 51
<210> 77
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
agccattgta cgcgttgctt aacctgattc ttgggcgttg tcctg 45
<210> 78
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
cttttatggc ggccgcataa gtactttttg taggcatgtg tggaaaattg 50
<210> 79
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
ctgtaggctc tctcttgggg atg 23
<210> 80
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
agccgattaa gaccccagca tag 23
<210> 81
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
tgctaggtcc tctctctcca caa 23
<210> 82
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
ctcttcaggc atcctcccca ttc 23
<210> 83
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
cgtgctgagt ccttttccca tc 22
<210> 84
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
ccccaaagta accgaacctg acg 23
<210> 85
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
ctgcctccat tggtcttgtg ttc 23
<210> 86
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gtgcagctcc tcaggaagtg g 21
<210> 87
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
tcttgttata gatatcggcg cgccgtgctg agtccttttc ccatcccacc cacctg 56
<210> 88
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
ccaggcccgg gtctggggcg cccaaagacc cactgcagcc aggcagg 47
<210> 89
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
agccattgta cgcgttggac aggccacaga agagcctcta ctcctc 46
<210> 90
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
cttttatggc ggccgcattt tccctgaact gctcctcttc tggg 44
<210> 91
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
tggctttgct tggtacctac atct 24
<210> 92
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
ttagggaaaa tggggcctca gag 23
<210> 93
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
tgcgagaatt ctaaactgga gta 23
<210> 94
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
ggtgacagtc tcaagctcct caa 23
<210> 95
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
agacagacca tgctcaatcc aca 23
<210> 96
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
gatgcccgat gttgtcaatc ctg 23
<210> 97
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
aagatactca gcagcagtct cct 23
<210> 98
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
gatggacagg tgaagcaggc aag 23
<210> 99
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
tcttgttata gatatcggcg cgcccaaata cccacgttta ttgggacaaa ag 52
<210> 100
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
ccaggcccgg gtctggggcg cgttcttatg ttcctggaag tttagatcag 50
<210> 101
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
agccattgta cgcgttgagt aggtcacatt tcagtaaaac ctgg 44
<210> 102
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
cttttatggc ggccgcatct tttctacggc cacttccagg gcatatgg 48
<210> 103
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
tgacccaaac caatcttgca ctg 23
<210> 104
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
tgagttctgg cttcctggat tct 23
<210> 105
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
gatgccacca actctctcgc tc 22
<210> 106
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
ccagaggtct catgtttggg gaa 23
<210> 107
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
ccgctctgtt ccttgcctaa ttg 23
<210> 108
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
agcaactctc caaggccctg 20
<210> 109
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
gcaagttctc tccctaggcg aa 22
<210> 110
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
gcaaactcaa aggcaaactc agc 23
<210> 111
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
tcttgttata gatatcggcg cgccggatgg ggactcatgt gaattttcta aag 53
<210> 112
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
ccaggcccgg gtctggggcg cgtgatggtg cggtcctgct ggtcactctc ttg 53
<210> 113
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
agccattgta cgcgttggtg gttgctgaga ctgcgtgggg gcccaag 47
<210> 114
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
cttttatggc ggccgcatat aggaacaaac ttttgtttac tagctg 46
<210> 115
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 115
ccaagaauca gguuaagcca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 116
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 116
cgagaaggag caaacugaca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 117
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 117
gaaggagcaa acugacaugg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 118
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 118
caggacaacg cccaagaauc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 119
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 119
aagacccacu gcagccaggc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 120
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 120
gaggaguaga ggcucuucug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 121
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 121
cccaaagacc cacugcagcc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 122
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 122
ugcagugggu cuuuggggac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 123
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 123
uuccaggaac auaagaaagu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 124
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 124
uguuccugga aguuuagauc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 125
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 125
aggcuacacu guuaacacuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 126
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 126
gaccuacuuu cuuauguucc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 127
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 127
cuaccaagag agugaccagc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 128
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 128
gguccugcug gucacucucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 129
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 129
gcagucucag caaccacuga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 130
<211> 100
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 130
agccagcaac aaggcucaag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 131
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 131
agatccgcca caacatcgag 20
<210> 132
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 132
gtccatgccg agagtgatcc 20

Claims (44)

1.一种基因编辑的方法,其特征在于,所述的方法包括将包含外源基因的安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞,安全港位点载体上的外源基因分别整合入ROSA26、AAVS1、H11或COL1A1任一个或两个以上安全港位点;
所述的Cas载体的核苷酸序列从5’-3’依次为:CMV增强子、EF1a启动子、核定位信号、核定位信号、编码Cas蛋白的核苷酸序列、核定位信号,核定位信号、编码自剪切多肽P2A的核苷酸序列、编码EGFP的核苷酸序列、编码自裂解多肽T2A的核苷酸序列、编码Puro蛋白的核苷酸序列、WPRE序列元件、3’LTR序列元件和polyA信号序列元件;
所述的Cas蛋白为Cas9;
所述的宿主细胞来源于非人动物或人,
所述的非人动物选自猪或小鼠。
2.根据权利要求1所述的方法,其特征在于,所述的编码Cas蛋白的核苷酸序列为SEQID NO:2的第1037-5161位。
3.根据权利要求1所述的方法,其特征在于,所述的编码EGFP蛋白的核苷酸序列为SEQID NO:2的第5333-6046位。
4.根据权利要求1所述的方法,其特征在于,所述的编码Puro蛋白的核苷酸序列为SEQID NO:2的第6110-6703位。
5.根据权利要求1所述的方法,其特征在于,所述的CMV增强子的核苷酸序列为SEQ IDNO:2的第395-680位。
6.根据权利要求1所述的方法,其特征在于,所述的EF1a启动子的核苷酸序列为SEQ IDNO:2的第682-890位。
7.根据权利要求1所述的方法,其特征在于,编码所述的核定位信号的核苷酸序列为SEQ ID NO:2的第986-1006、1016-1036、5162-5209或5219-5266位。
8.根据权利要求1所述的方法,其特征在于,所述的自剪切多肽P2A的氨基酸序列为ATNFSLLKQAGDVEENPGP。
9.根据权利要求1所述的方法,其特征在于,所述的自裂解多肽T2A的氨基酸序列为EGRGSLLTCGDVEENPGP。
10.根据权利要求1所述的方法,其特征在于,所述的WPRE元件的核苷酸序列为SEQ IDNO:2的6722-7310位。
11.根据权利要求1所述的方法,其特征在于,所述的3’LTR序列元件的核苷酸序列为SEQ ID NO:2的7382-7615位。
12.根据权利要求1所述的方法,其特征在于,所述的polyA信号序列元件的核苷酸序列为SEQ ID NO:2的7647-7871位。
13.根据权利要求1所述的方法,其特征在于,所述的Cas载体的核苷酸序列如SEQ IDNO:2所示。
14.根据权利要求1所述的方法,其特征在于,ROSA26安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO:8所示,AAVS1安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO:9所示,H11安全港位点区域及其上下游各500bp的核苷酸序列如SEQID NO:10所示,COL1A1安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO:11所示。
15.根据权利要求1所述的方法,其特征在于,所述的sgRNA载体包含靶向ROSA26、AAVS1、H11或COL1A1安全港位点的sgRNA,其中,
靶向ROSA26的sgRNA的核苷酸序列如SEQ ID NO:45-48任一所示,靶向AAVS1的sgRNA的核苷酸序列如SEQ ID NO:49-52任一所示,靶向H11的sgRNA的核苷酸序列如SEQ ID NO:53-56任一所示,靶向COL1A1的sgRNA的核苷酸序列如SEQ ID NO:57-60任一所示。
16.根据权利要求1所述的方法,其特征在于,所述的安全港位点载体包含与ROSA26、AAVS1、H11或COL1A1安全港位点5’端同源的5’同源臂和3’端同源的3’同源臂。
17.根据权利要求16所述的方法,其特征在于,所述的安全港位点载体还包含绝缘子区域、EF-1α启动子,编码EGFP蛋白的核苷酸序列,EF-1α poly(A)信号序列,PGK启动子,编码mCherry蛋白的核苷酸序列,bGH poly(A)信号序列,loxP-puro-loxP表达框区域,pCAG启动子,和/或β-globin poly(A)信号序列。
18.根据权利要求1所述的方法,其特征在于,ROSA26安全港位点载体如SEQ ID NO:4所示,AAVS1安全港位点载体如SEQ ID NO:5所示,H11安全港位点载体如SEQ ID NO:6所示,COL1A1安全港位点载体如SEQ ID NO:7所示。
19.根据权利要求16所述的方法,其特征在于,所述的外源基因的核苷酸序列位于安全港位点5’同源臂与3’同源臂之间。
20.根据权利要求1所述的方法,其特征在于,所述的安全港位点载体为环状质粒。
21.根据权利要求1所述的方法,其特征在于,所述的sgRNA载体为环状质粒。
22.根据权利要求1所述的方法,其特征在于,所述的Cas载体为环状质粒。
23.根据权利要求1所述的方法,其特征在于,所述的宿主细胞为猪的成纤维细胞。
24.一种Cas载体,其特征在于,所述的Cas载体的核苷酸序列从5’-3’依次为:CMV增强子、EF1a启动子、核定位信号、核定位信号、编码Cas蛋白的核苷酸序列、核定位信号,核定位信号、编码自剪切多肽P2A的核苷酸序列、编码EGFP的核苷酸序列、编码自裂解多肽T2A的核苷酸序列、编码Puro蛋白的核苷酸序列、WPRE序列元件、3’LTR序列元件和polyA信号序列元件;
所述的Cas蛋白为Cas9。
25.根据权利要求24所述的Cas载体,其特征在于,所述的编码Cas蛋白的核苷酸序列为SEQ ID NO:2的第1037-5161位。
26.根据权利要求24所述的Cas载体,其特征在于,所述的编码EGFP蛋白的核苷酸序列为SEQ ID NO:2的第5333-6046位。
27.根据权利要求24所述的Cas载体,其特征在于,所述的编码Puro蛋白的核苷酸序列为SEQ ID NO:2的第6110-6703位。
28.根据权利要求24所述的Cas载体,其特征在于,所述的CMV增强子的核苷酸序列为SEQ ID NO:2的第395-680位。
29.根据权利要求24所述的Cas载体,其特征在于,所述的EF1a启动子的核苷酸序列为SEQ ID NO:2的第682-890位。
30.根据权利要求24所述的Cas载体,其特征在于,编码所述的核定位信号的核苷酸序列为SEQ ID NO:2的第986-1006、1016-1036、5162-5209或5219-5266位。
31.根据权利要求24所述的Cas载体,其特征在于,所述的自剪切多肽P2A的氨基酸序列为ATNFSLLKQAGDVEENPGP。
32.根据权利要求24所述的Cas载体,其特征在于,所述的自裂解多肽T2A的氨基酸序列为EGRGSLLTCGDVEENPGP。
33.根据权利要求24所述的Cas载体,其特征在于,所述的WPRE元件的核苷酸序列为SEQID NO:2的6722-7310位。
34.根据权利要求24所述的Cas载体,其特征在于,所述的3’LTR序列元件的核苷酸序列为SEQ ID NO:2的7382-7615位。
35.根据权利要求24所述的Cas载体,其特征在于,所述的polyA信号序列元件的核苷酸序列为SEQ ID NO:2的7647-7871位。
36.根据权利要求24所述的Cas载体,其特征在于,所述的Cas载体的核苷酸序列如SEQID NO:2所示,所述的Cas载体为环状质粒。
37.一种靶向ROSA26的sgRNA,其特征在于,所述的靶向ROSA26的sgRNA的核苷酸序列如SEQ ID NO:45-48任一所示。
38.一种靶向AAVS1的sgRNA,其特征在于,所述的靶向AAVS1的sgRNA的核苷酸序列如SEQ ID NO:49-52任一所示。
39.一种靶向H11的sgRNA,其特征在于,所述的靶向H11的sgRNA的核苷酸序列如SEQ IDNO:53-56任一所示。
40.一种靶向COL1A1的sgRNA,其特征在于,所述的靶向COL1A1的sgRNA的核苷酸序列如SEQ ID NO:57-60任一所示。
41.一种sgRNA载体,其特征在于,所述的sgRNA载体包含权利要求37所述的ROSA26的sgRNA,或,权利要求38所述的靶向AAVS1的sgRNA,或,权利要求39所述的靶向H11的sgRNA,或,权利要求40所述的靶向COL1A1的sgRNA。
42.一种sgRNA载体的制备方法,其特征在于,所述的制备方法包括:
1)提供权利要求37所述的ROSA26的sgRNA,或,权利要求38所述的靶向AAVS1的sgRNA,或,权利要求39所述的靶向H11的sgRNA,或,权利要求40所述的靶向COL1A1的sgRNA;
2)采用步骤1)中的sgRNA制备双链DNA分子;
3)将步骤2)获得的双链DNA分子连接至相应的载体骨架,获得相应的sgRNA载体,其中,所述的载体骨架的核苷酸序列如SEQ ID NO:3所示。
43.一种安全港位点载体,其特征在于,所述的安全港位点载体包含与ROSA26、AAVS1、H11或COL1A1安全港位点5’端同源的5’同源臂和3’端同源的3’同源臂;
ROSA26安全港位点载体如SEQ ID NO:4所示,AAVS1安全港位点载体如SEQ ID NO:5所示,H11安全港位点载体如SEQ ID NO:6所示,COL1A1安全港位点载体如SEQ ID NO:7所示。
44.一种基因编辑的试剂盒,其特征在于,所述的试剂盒中包含权利要求24-36任一所述的Cas载体、权利要求37-40任一所述的sgRNA、权利要求41所述的sgRNA载体和/或权利要求43所述的安全港位点载体。
CN202011326638.6A 2020-11-23 2020-11-23 一种基因编辑的方法 Active CN114525304B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011326638.6A CN114525304B (zh) 2020-11-23 2020-11-23 一种基因编辑的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011326638.6A CN114525304B (zh) 2020-11-23 2020-11-23 一种基因编辑的方法

Publications (2)

Publication Number Publication Date
CN114525304A CN114525304A (zh) 2022-05-24
CN114525304B true CN114525304B (zh) 2023-12-22

Family

ID=81619167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011326638.6A Active CN114525304B (zh) 2020-11-23 2020-11-23 一种基因编辑的方法

Country Status (1)

Country Link
CN (1) CN114525304B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115058451A (zh) * 2022-06-23 2022-09-16 五邑大学 一种用于同源重组和单碱基编辑的双报告质粒及其构建方法和应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106591364A (zh) * 2016-11-14 2017-04-26 西北农林科技大学 利用单一Cas9切口酶介导NRAMP1定点插入获取转基因牛胎儿成纤维细胞的方法
US20180334685A1 (en) * 2017-05-10 2018-11-22 Eugene Yeo Directed editing of cellular rna via nuclear delivery of crispr/cas9
WO2020225287A1 (en) * 2019-05-06 2020-11-12 Veterinärmedizinische Universität Wien Lentiviral nanoparticles

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210044795A (ko) * 2018-08-15 2021-04-23 지머젠 인코포레이티드 고 처리량 대사 공학에서 CRISPRi의 응용

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106591364A (zh) * 2016-11-14 2017-04-26 西北农林科技大学 利用单一Cas9切口酶介导NRAMP1定点插入获取转基因牛胎儿成纤维细胞的方法
US20180334685A1 (en) * 2017-05-10 2018-11-22 Eugene Yeo Directed editing of cellular rna via nuclear delivery of crispr/cas9
WO2020225287A1 (en) * 2019-05-06 2020-11-12 Veterinärmedizinische Universität Wien Lentiviral nanoparticles

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Synthetic plasmid,complete sequence;KY657281.1;Genbank;全文 *
猪转基因友好整合位点的筛选与应用;马林媛;中国博士学位论文全文数据库 农业科技辑;全文 *

Also Published As

Publication number Publication date
CN114525304A (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN112779292B (zh) 构建瘦肉率高、生长快且抗蓝耳病和系列腹泻病的优质猪核移植供体细胞的方法及其应用
CN112779291B (zh) 构建瘦肉率高、生长快、繁殖力高且抗系列流行病的优质猪核移植供体细胞的方法及其应用
CN114525304B (zh) 一种基因编辑的方法
CN112877362A (zh) 构建高繁殖力、抗蓝耳病和系列腹泻病的优质猪核移植供体细胞的基因编辑系统及其应用
CN114958760B (zh) 一种构建阿尔兹海默症模型猪的基因编辑技术及其应用
CN114958762B (zh) 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用
CN113046388B (zh) 用于构建双基因联合敲除的动脉粥样硬化猪核移植供体细胞的crispr系统及其应用
CN114958759B (zh) 一种肌萎缩侧索硬化症模型猪的构建方法及应用
CN112522264B (zh) 一种导致先天性耳聋的CRISPR/Cas9系统及其在制备模型猪核供体细胞中的应用
CN112522313A (zh) 用于构建TPH2基因突变的抑郁症克隆猪核供体细胞的CRISPR/Cas9系统
CN112680453B (zh) Crispr系统及其在构建stxbp1突变的癫痫性脑病克隆猪核供体细胞中的应用
CN112575033B (zh) Crispr系统及其在构建scn1a基因突变的癫痫性脑病克隆猪核供体细胞中的应用
CN112522256B (zh) CRISPR/Cas9系统及其在构建抗肌萎缩蛋白基因缺陷的猪源重组细胞中的应用
CN112522255B (zh) CRISPR/Cas9系统及其在构建胰岛素受体底物基因缺陷的猪源重组细胞中的应用
CN112680444B (zh) 用于oca2基因突变的crispr系统及其在构建白化病克隆猪核供体细胞中的应用
CN112899306B (zh) Crispr系统及其在构建gabrg2基因突变的克隆猪核供体细胞中的应用
CN112608941B (zh) 用于构建mc4r基因突变的肥胖症猪核移植供体细胞的crispr系统及其应用
CN112522311B (zh) 用于adcy3基因编辑的crispr系统及其在构建肥胖症猪核移植供体细胞中应用
CN112813101B (zh) 一种构建瘦肉率高、生长快的优质猪核移植供体细胞的基因编辑系统及其应用
CN112795566B (zh) 用于构建骨质疏松症克隆猪核供体细胞系的opg基因编辑系统及其应用
CN114958761B (zh) 一种胃癌模型猪的构建方法及应用
CN113584078B (zh) 用于双靶标基因编辑的crispr系统及其在构建抑郁症猪核移植供体细胞中的应用
CN114958758B (zh) 一种乳腺癌模型猪的构建方法及应用
CN112522202B (zh) 制备addi四个基因联合敲除的重症免疫缺陷猪源重组细胞的方法及其专用试剂盒
CN114686438A (zh) Ace2人源化猪的构建方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant