CN114958762B - 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用 - Google Patents

一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用 Download PDF

Info

Publication number
CN114958762B
CN114958762B CN202110214796.0A CN202110214796A CN114958762B CN 114958762 B CN114958762 B CN 114958762B CN 202110214796 A CN202110214796 A CN 202110214796A CN 114958762 B CN114958762 B CN 114958762B
Authority
CN
China
Prior art keywords
dna molecule
gene
plasmid
seq
humanized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110214796.0A
Other languages
English (en)
Other versions
CN114958762A (zh
Inventor
牛冬
汪滔
马翔
刘瑜
曾为俊
王磊
程锐
黄彩云
赵泽英
陶裴裴
段星
刘璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Qizhen Genetic Engineering Co Ltd
Original Assignee
Nanjing Qizhen Genetic Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Qizhen Genetic Engineering Co Ltd filed Critical Nanjing Qizhen Genetic Engineering Co Ltd
Priority to CN202110214796.0A priority Critical patent/CN114958762B/zh
Publication of CN114958762A publication Critical patent/CN114958762A/zh
Application granted granted Critical
Publication of CN114958762B publication Critical patent/CN114958762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0276Knock-out vertebrates
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/108Swine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • A01K2267/0318Animal model for neurodegenerative disease, e.g. non- Alzheimer's
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Environmental Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Medicinal Chemistry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Diabetes (AREA)
  • Endocrinology (AREA)
  • Pathology (AREA)
  • Rheumatology (AREA)
  • Urology & Nephrology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种构建神经组织特异过表达人源SNCA的帕金森病模型猪的方法及应用,具体涉及一种采用CRISPR/Cas9系统及同源重组技术构建的在基因组中的特定位置整合并由人源神经组织特异性表达启动子Syn驱动表达人源SNCA基因的猪重组细胞及由该重组细胞通过体细胞克隆技术所获得的帕金森病模型猪。本发明提供了制备重组细胞的方法,将命名为DNA分子甲的DNA分子整合至猪细胞的基因组DNA,得到重组细胞;所述DNA分子甲中具有人源SNCA基因。将所述重组细胞作为核移植供体细胞进行体细胞克隆,得到了克隆猪,即为帕金森病模型猪。该模型猪可用于下一步的药物筛选及药效评价、基因及细胞治疗、帕金森病发病机制的研究等生物医药领域。

Description

一种构建神经组织特异过表达人源SNCA的帕金森病模型猪的 方法及应用
技术领域
本发明涉及生物技术领域,涉及一种构建神经组织特异过表达人源SNCA的帕金森病模型猪的方法及应用,具体涉及一种采用CRISPR/Cas9系统及同源重组技术构建的在基因组中的特定位置整合并由人源神经组织特异性表达启动子Syn驱动表达人源SNCA基因的猪重组细胞,该重组猪细胞被用于克隆生产帕金森病模型猪,该模型猪可用于下一步的药物筛选及药效评价、基因及细胞治疗、帕金森病发病机制的研究等生物医药领域。
背景技术
帕金森病(parkinson’s disease,PD)又称震颤麻痹,是一种中枢神经系统的慢性神经退化疾病,主要影响运动神经系统,其带来的主要运动症状合称为帕金森综合症。据估计,全球约有700万-1000万人患有帕金森综合症,且该病的症状会随着年龄的增长缓慢出现,且男性较女性更容易发病。在60岁以上的老人中,其发病率高达1%;在80岁以上的老人中,其发病率更是高达1.9%。在我国,有超过300万帕金森综合症患者,其中47%的患者没能得到及时合理的治疗。
α-突触核蛋白(alpha-synuclein,ASN)错误折叠并以路易氏体的形式在大脑中大量堆积被认为是帕金森病发病的重要原因之一。编码ASN蛋白的SNCA基因是首个被发现的与帕金森病发病相关的基因,目前已经发现SNCA基因在家族性帕金森病患者中存在5种错义突变。在帕金森病的多个全基因组关联分析中,也发现与帕金森病显著关联的SNP位点能够增加α-突触核蛋白的表达水平,从而增加帕金森病的患病风险。
一直以来,帕金森病新疗法的进展都很有限,目前的医疗手段只能缓解症状,尚不能治愈疾病。目前的研究方向主要包括开发基因治疗、干细胞移植、神经保护性物质以及寻找新的模式生物。帕金森病动物模型的构建对上述治疗研究具有重要的基础支持作用。帕金森病目前在除人类以外的其他动物中尚未发现,但研究上通常会采用MTPT(1-甲基-4-苯基-1,2,3,6-四氢吡啶)或者6-OHDA(6-羟基多巴胺)诱发实验动物来产生帕金森病候群用以研究。另外,人神经元内特异表达一种名为Synapsin I(Syn I)的蛋白,该蛋白由SYN1基因编码,因此,一般选择其启动子(即Syn启动子)作为神经元的特异启动子,用来驱动外源基因仅在神经组织中表达。因此,Syn启动子是研究神经系统病理生理功能的有力工具。
帕金森病的发生发展机制及治疗研究均需要在相应的动物模型的基础上进行,目前常用的动物模型为小鼠模型,但是小鼠不论从体型、器官大小、生理、病理等方面都与人相差巨大,不能真实地模拟人类正常的生理、病理状态。猪作为大动物,是人类长期以来主要的肉食供应动物,其体型大小和生理功能与人类近似,易于大规模繁殖饲养,而且在伦理道德及动物保护等方面要求较低,是理想的人类疾病模型动物。
基因编辑是近年来不断取得重大发展的一种生物技术,其包括从基于同源重组的基因编辑到基于核酸酶的ZFN、TALEN、CRISPR/Cas9等编辑技术,其中CRISPR/Cas9技术是当前最先进的基因编辑技术。目前,基因编辑技术被越来越多地应用到动物模型的制作上。
发明内容
本发明解决的技术问题为提供了采用CRISPR/Cas9系统及同源重组技术构建的在基因组中的特定位置整合并由人源神经组织特异性表达启动子Syn驱动表达人源SNCA基因的猪重组细胞,进一步,该重组猪细胞作为核移植细胞供体克隆生产帕金森病模型猪,该模型猪可用于下一步的药物筛选及药效评价、基因及细胞治疗、帕金森病发病机制的研究等生物医药领域。
本发明提供了一种制备重组细胞的方法,包括如下步骤:将命名为DNA分子甲的DNA分子整合至猪细胞的基因组DNA,得到重组细胞;所述DNA分子甲中具有人源SNCA基因。
所述DNA分子甲中具有人源SNCA基因表达盒;人源SNCA基因表达盒中,启动子为人源神经组织特异性表达启动子。
人源SNCA基因表达盒中,由同一启动子驱动多个拷贝的人源SNCA基因表达。
人源SNCA基因表达盒中,所述多个拷贝的人源SNCA基因存在于同一编码框,它们之间由自剪接肽的编码基因间隔。
所述多个拷贝的人源SNCA基因具体可为4个拷贝的人源SNCA基因。
4个拷贝的人源SNCA基因可分别如SEQ ID NO:11中第1585-2004位核苷酸、第2071-2490位核苷酸、第2554-2973位核苷酸、第3043-3462位核苷酸所示。
所述自剪接肽可为P2A多肽、T2A多肽、E2A多肽。
具有多个拷贝的人源SNCA基因的编码框具体可如SEQ ID NO:11中第1585-3462位核苷酸所示。
所述人源神经组织特异性表达启动子具体可为人Syn启动子。
人Syn启动子如SEQ ID NO:11中第1088-1535位核苷酸所示。
人源SNCA基因表达盒中,终止子可为bGH Poly(A)。
bGH Poly(A)如SEQ ID NO:11中第3511-3735位核苷酸所示。
所述人源SNCA基因表达盒具体可如SEQ ID NO:11中第1088-3735位核苷酸所示。
所述DNA分子甲中还包括筛选基因表达盒。所述筛选基因可为编码Puromycin抗性蛋白的基因。所述筛选基因表达盒如SEQ ID NO:11中第3842-5117位核苷酸所示。
所述DNA分子甲中还包括LoxP序列。
所述DNA分子甲中具体包括2个LoxP序列,分别如SEQ ID NO:11中第3766-3799位核苷酸、第5162-5195位核苷酸所示。
所述DNA分子甲中还包括绝缘子。
所述DNA分子甲中具体包括2个绝缘子,分别如SEQ ID NO:11中第887-1087位核苷酸、第5204-5404位核苷酸所示。
所述“将命名为DNA分子甲的DNA分子整合至猪细胞的基因组DNA”的实现方式为:将命名为DNA分子乙的DNA分子导入猪细胞或者将具有所述DNA分子乙的重组质粒导入猪细胞;所述DNA分子乙中,具有所述DNA分子甲且在所述DNA分子甲的上游具有上游同源臂且在所述DNA分子甲的下游具有下游同源臂,所述上游同源臂和所述下游同源臂用于将所述DNA分子甲整合至猪细胞的基因组DNA。
所述同源臂为针对ROSA26基因的同源臂,上游同源臂为SH1左臂,下游同源臂为SH1右臂。SH1左臂如SEQ ID NO:4中第9-339位核苷酸所示,SH1右臂如SEQ ID NO:4中第9184-10195位核苷酸所示。
所述同源臂为针对AAVS1基因的同源臂,上游同源臂为SH2左臂,下游同源臂为SH2右臂。SH2左臂如SEQ ID NO:5所示,SH2右臂如SEQ ID NO:6所示。
所述同源臂为针对H11位点的同源臂,上游同源臂为SH3左臂,下游同源臂为SH3右臂。SH3左臂如SEQ ID NO:7所示,SH3右臂如SEQ ID NO:8所示。
所述同源臂为针对COL1A1基因的同源臂,上游同源臂为SH4左臂,下游同源臂为SH4右臂。SH4左臂如SEQ ID NO:9所示,SH4右臂如SEQ ID NO:10所示。
所述同源臂为针对COL1A1基因的同源臂,上游同源臂为SH4左臂,下游同源臂为SH4右臂。SH4左臂如SEQ ID NO:11中第9-880位核苷酸所示,SH4右臂如SEQ ID NO:11中第5405-6131位核苷酸所示。
所述DNA分子甲自上游至下游依次包括如下区段:人Syn启动子、hSNCA基因第1拷贝、编码P2A的核苷酸序列、hSNCA基因第2拷贝、编码T2A的核苷酸序列、hSNCA基因第3拷贝、编码E2A的核苷酸序列、hSNCA基因第4拷贝、bGH Poly(A)序列、LoxP序列、SV40启动子、Puromycin抗性蛋白编码序列、SV40 Poly(A)序列、LoxP序列。
所述DNA分子甲自上游至下游依次包括如下区段:绝缘子1、人Syn启动子、hSNCA基因第1拷贝、编码P2A的核苷酸序列、hSNCA基因第2拷贝、编码T2A的核苷酸序列、hSNCA基因第3拷贝、编码E2A的核苷酸序列、hSNCA基因第4拷贝、bGH Poly(A)序列、LoxP序列、SV40启动子、Puromycin抗性蛋白编码序列、SV40 Poly(A)序列、LoxP序列、绝缘子2。
所述DNA分子乙自上游至下游依次包括如下区段:上游同源臂、绝缘子1、人Syn启动子、hSNCA基因第1拷贝、编码P2A的核苷酸序列、hSNCA基因第2拷贝、编码T2A的核苷酸序列、hSNCA基因第3拷贝、编码E2A的核苷酸序列、hSNCA基因第4拷贝、bGH Poly(A)序列、LoxP序列、SV40启动子、Puromycin抗性蛋白编码序列、SV40 Poly(A)序列、LoxP序列、绝缘子2、下游同源臂。
所述DNA分子甲具体可如SEQ ID NO:11中第881-5404位核苷酸所示。
所述DNA分子乙具体可如SEQ ID NO:11中第9-6131位核苷酸所示。
DNA分子甲整合至猪细胞的基因组DNA的ROSA26基因或者AAVS1基因或者H11位点或者COL1A1基因中。优选为COL1A1基因。
DNA分子甲整合至猪细胞的基因组DNA的ROSA26安全港插入位点或者AAVS1安全港插入位点或者H11安全港插入位点或者COL1A1安全港插入位点。优选为COL1A1安全港插入位点。
DNA分子甲整合至猪细胞的基因组DNA的ROSA26基因中指的是将DNA分子甲插入至基因组DNA中SH1左臂和SH1右臂之间;SH1左臂如SEQ ID NO:4中第9-339位核苷酸所示,SH1右臂如SEQ ID NO:4中第9184-10195位核苷酸所示。
DNA分子甲整合至猪细胞的基因组DNA的AAVS1基因中指的是将DNA分子甲插入至基因组DNA中SH2左臂和SH2右臂之间;SH2左臂如SEQ ID NO:5所示,SH2右臂如SEQ ID NO:6所示。
DNA分子甲整合至猪细胞的基因组DNA的H11位点中指的是将DNA分子甲插入至基因组DNA中SH3左臂和SH3右臂之间;SH3左臂如SEQ ID NO:7所示,SH3右臂如SEQ ID NO:8所示。
DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因中指的是将DNA分子甲插入至基因组DNA中SH4左臂和SH4右臂之间;SH4左臂如SEQ ID NO:9所示,SH4右臂如SEQ ID NO:10所示。
DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因中指的是将DNA分子甲插入至基因组DNA中SH4左臂和SH4右臂之间;SH4左臂如SEQ ID NO:11中第9-880位核苷酸所示,SH4右臂如SEQ ID NO:11中第5405-6131位核苷酸所示。
所述方法中,具有所述DNA分子乙的重组质粒与两个辅助质粒共同导入猪细胞;所述两个辅助质粒为sgRNA质粒和Cas9质粒;
sgRNA质粒转录得到特异sgRNA;所述特异sgRNA为sgRNAROSA26-g3、sgRNAAAVS1-g4、sgRNAH11-g1或sgRNACOL1A1-g3;sgRNAROSA26-g3的靶序列结合区如SEQ ID NO:13中第1-20位核苷酸所示;sgRNAAAVS1-g4的靶序列结合区如SEQ ID NO:14中第1-20位核苷酸所示;sgRNAH11-g1的靶序列结合区如SEQ ID NO:15中第1-20位核苷酸所示;sgRNACOL1A1-g3的靶序列结合区如SEQID NO:16中第1-20位核苷酸所示;
Cas9质粒表达Cas9蛋白。
所述Cas9质粒具体可为质粒pKG-GE3。
具体来说,所述sgRNA质粒是借助限制性内切酶BbsI将特异sgRNA的靶序列结合区的编码序列插入pKG-U6gRNA载体得到的。
具有所述DNA分子乙的重组质粒、sgRNA质粒和Cas9质粒的摩尔配比具体可为1:3:1。
猪细胞、具有所述DNA分子乙的重组质粒、sgRNA质粒和Cas9质粒的配比具体可为:约20万个猪细胞:1.01μg具有所述DNA分子乙的重组质粒:0.94μg sgRNA质粒:1.05μg Cas9质粒。
本发明还保护一种试剂盒,包括以上任一所述DNA分子乙。
本发明还保护一种试剂盒,包括具有以上任一所述DNA分子乙的重组质粒。
所述试剂盒还包括所述sgRNA质粒和所述的Cas9质粒。
具有所述DNA分子乙的重组质粒、sgRNA质粒和Cas9质粒的摩尔配比具体可为1:3:1。
本发明还保护以上任一所述DNA分子乙在制备试剂盒中的应用。
本发明还保护具有以上任一所述DNA分子乙的重组质粒在制备试剂盒中的应用。
本发明还保护具有以上任一所述DNA分子乙的重组质粒、sgRNA质粒和Cas9质粒在制备试剂盒中的应用。
本发明还保护以上任一所述DNA分子乙、所述具有以上任一所述DNA分子乙的重组质粒或以上任一所述的试剂盒应用。
以上任一所述试剂盒的用途为如下(a)或(b)或(c):(a)制备重组细胞;(b)制备帕金森病模型猪;(c)制备帕金森病细胞模型或帕金森病组织模型或帕金森病器官模型。
帕金森病细胞模型具体可为帕金森病模型猪的神经元细胞或神经胶质细胞。
以上任一所述猪细胞为猪原代成纤维细胞。
所述猪可为任何品种的猪,优选的,所述猪可为从江香猪。
以上任一所述人源SNCA基因为编码人源SNCA蛋白的基因。
人源SNCA蛋白具体如SEQ ID NO:12所示。
质粒pKG-GE3中,具有特异融合基因;所述特异融合基因编码特异融合蛋白;
所述特异融合蛋白自N端至C端依次包括如下元件:两个核定位信号、Cas9蛋白、两个核定位信号、自剪切多肽P2A、荧光报告蛋白、自裂解多肽T2A、抗性筛选标记蛋白;
质粒pKG-GE3中,由EF1a启动子启动所述特异融合基因的表达;
质粒pKG-GE3中,所述特异融合基因下游具有WPRE序列元件、3’LTR序列元件和bGHpoly(A)signal序列元件。
质粒pKG-GE3中,依次具有如下元件:CMV增强子、EF1a启动子、所述特异融合基因、WPRE序列元件、3’LTR序列元件、bGH poly(A)signal序列元件。
所述特异融合蛋白中,Cas9蛋白上游的两个核定位信号为SV40核定位信号,Cas9蛋白下游的两个核定位信号为nucleoplasmin核定位信号。
所述特异融合蛋白中,荧光报告蛋白具体可为EGFP蛋白。
所述特异融合蛋白中,抗性筛选标记蛋白具体可为Puromycin抗性蛋白。
自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”(发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)。
自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”(发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)。
特异融合基因具体如SEQ ID NO:2中第911-6706位核苷酸所示。
CMV增强子如SEQ ID NO:2中第395-680位核苷酸所示。
EF1a启动子如SEQ ID NO:2中第682-890位核苷酸所示。
WPRE序列元件如SEQ ID NO:2中第6722-7310位核苷酸所示。
3’LTR序列元件如SEQ ID NO:2中第7382-7615位核苷酸所示。
bGH poly(A)signal序列元件如SEQ ID NO:2中第7647-7871位核苷酸所示。
质粒pKG-GE3具体如SEQ ID NO:2所示。
质粒pKG-U6gRNA中,具有SEQ ID NO:3中第2280-2637位核苷酸所示的DNA分子。
质粒pKG-U6gRNA具体如SEQ ID NO:3所示。
sgRNAROSA26-g3(SEQ ID NO:13):
GAAGGAGCAAACUGACAUGGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
sgRNAAAVS1-g4(SEQ ID NO:14):
UGCAGUGGGUCUUUGGGGACguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
sgRNAH11-g1(SEQ ID NO:15):
UUCCAGGAACAUAAGAAAGUguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
sgRNACOL1A1-g3(SEQ ID NO:16):
GCAGUCUCAGCAACCACUGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
本发明还保护以上任一所述方法制备得到的重组细胞。
本发明还保护具有以上任一所述重组细胞的猪组织或猪器官。
所述猪组织可为猪神经组织,例如猪脑组织、猪脊髓组织、猪中枢神经组织、猪周围神经组织等。
本发明还保护所述重组细胞在制备帕金森病模型猪中的应用。
将所述重组细胞作为核移植供体细胞进行体细胞克隆,可以得到克隆猪,即为帕金森病模型猪。
将所述重组细胞作为核移植供体细胞进行体细胞克隆从而制备克隆猪具体可采用如下方法:
(1)取离体卵巢,从直径3~6mm的卵泡中抽取卵丘卵母细胞复合体(Cumulus-oocyte complexes,COCs),选择至少具有三层致密卵丘细胞的COCs,接种至4孔板中,每孔装有200μL猪卵母细胞体外成熟培养基,每孔接种50个,将含COCs的培养板在38.5℃、5%CO2和饱和湿度的培养箱中培养42小时;
(2)完成步骤(1)后,用0.1%(w/v)透明质酸酶反复吹打去除COCs的扩张卵丘细胞,将具有完整膜且含排出的第一极体的卵母细胞在含有0.1mg/mL地美可辛、0.05M蔗糖和4mg/mL牛血清白蛋白的NCSU23培养基中培养0.5-1h,促使卵母细胞核突起,然后使用尖部倾斜的显微注射针在含有10μm HEPES、0.3%(w/v)聚乙烯吡咯烷酮、10%FBS、0.1mg/mL地美可辛和5mg/mL细胞松弛素B的Tyrode乳酸培养基中去除突起的细胞核和极体;然后,将单个核供体细胞注入去核卵母细胞的卵周隙,使用胚胎细胞融合仪在融合培养基中用200V/mm的直流脉冲将核供体细胞与受体卵母细胞融合20μs;然后,将重构胚在PZM-3培养基中培养2h以允许细胞核重编程,然后在激活培养基中用150V/mm的单脉冲激活100μs;然后,将激活的重构胚置于含5μg/mL细胞松弛素B的PZM-3培养基中,培养2小时,以进一步激活胚胎;然后将重构胚置于PZM-3培养基中培养;
(3)将激活后培养6h的重构胚移植到代孕母猪的输卵管中,正常饲养,得到子代,即为克隆猪。
代孕母猪具体可为大白猪(母本)和长白猪(父本)杂交得到的子代母猪。
本发明还保护以上任一所述重组细胞、具有以上任一所述重组细胞的猪组织猪组织、具有以上任一所述重组细胞的猪器官或者用所述重组细胞制备的帕金森病模型猪的应用,为如下(d1)或(d2)或(d3)或(d4):
(d1)筛选治疗帕金森病的药物;
(d2)进行帕金森病药物的药效评价;
(d3)帕金森病的基因治疗和/或细胞治疗;
(d4)研究帕金森病的发病机制。
猪COL1A1基因信息:编码I型胶原α1链(collagen type I alpha 1chain);位于12号染色体;Gene ID为100738123,Sus scrofa。猪COL1A1基因编码的蛋白质如GENBANKACCESSION XP_020922812.1(linear MAM 13-MAY-2017)所示。
猪ROSA26基因信息:编码SLIT-ROBO Rho GTPase-activating protein 3;位于13号染色体;Gene ID为102167373,Sus scrofa。猪ROSA26基因编码的蛋白质如GENBANKACCESSION XP_020926756.1(linear MAM 13-MAY-2017)所示。
猪AAVS1基因信息:编码蛋白磷酸酶1调节亚基12C(protein phosphatase 1regulatory subunit 12C);位于6号染色体;Gene ID为100626700,Sus scrofa。猪AAVS1基因编码的蛋白质如GENBANK ACCESSION XP_020950647.1(linear MAM 13-MAY-2017)所示。
猪H11位点信息:位于猪DRG1和EIF4ENIF1基因之间,大小约3.7Kbp,不编码蛋白;位于14号染色体,Sus scrofa。
与现有技术相比,本发明至少具有如下有益效果:
(1)本发明研究对象(猪)比其他动物(大小鼠、灵长类)具有更好的应用性。
大小鼠等啮齿类动物不论从体型、器官大小、生理、病理等方面都与人相差巨大,无法真实地模拟人类正常的生理、病理状态。研究表明,95%以上在大小鼠中验证有效的药物在人类临床试验中是无效的。就大动物而言,灵长类是与人亲缘关系最近的动物,但其体型小、性成熟晚(6-7岁开始交配),且为单胎动物,群体扩繁速度极慢,饲养成本很高。另外,灵长类动物克隆效率低、难度大、成本高。
而猪作为模型动物就没有上述缺点,猪是除灵长类外与人亲缘关系最近的动物,其体型、体重、器官大小等与人相近,在解剖学、生理学、免疫学、营养代谢、疾病发病机制等方面与人类极为相似。同时,猪的性成熟早(4-6个月),繁殖力高,一胎多仔,在2-3年内即可形成一个较大群体。另外,猪的克隆技术非常成熟,克隆及饲养成本也较灵长类低得多。因此猪是非常适合作为人类疾病模型的动物。
(2)本发明中经过实验验证改造的pU6gRNA eEF1a-mNLS-hSpCas9-EGFP-PURO(简称pKG-GE3)载体相对改造前的pX330载体,更换了更强的启动子及添加了增强蛋白翻译的元件,提高了Cas9的表达,并且增加了核定位信号个数,提高了Cas9蛋白的核定位能力,具有更高的基因编辑效率。本发明还在载体中加入了荧光标记及抗性标记,使其更方便运用于载体阳性转化细胞的筛选及富集。采用本发明改造的Cas9高效表达载体进行基因编辑,编辑效率比原载体提高100%以上。
(3)本发明针对猪基因组进行了4个安全港位点基因敲入后表达情况的摸索,从中筛选出了最佳的供外源基因插入的猪基因组安全港位点,可有效改善基因敲入后目的基因的表达情况。
(4)本发明采用人源神经组织特异启动子来驱动人源SNCA基因在神经组织中的特异表达,将使外源基因在靶组织特异地发挥作用,同时避免外源基因高水平泛表达对机体造成的影响。
(5)利用本发明所得到的hSyn-hSNCA-4×表达框纯合敲入的单细胞克隆株进行体细胞核移植动物克隆可直接得到hSyn-hSNCA-4×表达框纯合敲入的克隆猪,并且该纯合插入基因可稳定遗传。进一步的,可用于下一步的药物筛选及药效评价、基因及细胞治疗、帕金森病发病机制的研究等生物医药领域。
在小鼠模型制作中,通常采用受精卵显微注射基因编辑材料后再进行胚胎移植,因其直接获得基因敲入后代的概率非常低(低于1%),同时需要进行后代的杂交选育来筛选纯合敲入的个体,这不太适用于妊娠期较长的大动物(如猪)模型制作。因此,本发明采用技术难度大、挑战性高的原代细胞体外编辑并筛选阳性编辑单细胞克隆的方法,后期再通过体细胞核移植动物克隆技术直接获得相应模型猪,可大大缩短模型猪制作周期,并节省人力、物力、财力。
本发明通过基因编辑及体细胞克隆技术获得了高度类似人帕金森病疾病发展进程的hSNCA基因过表达模型猪,将有助于研究并揭示由hSNCA基因过表达导致的帕金森病发病机制,并可用于进行药物筛选、药效检测、基因及细胞治疗等研究,能够为进一步的临床应用提供有效的实验数据,进而为预防和治疗人类帕金森病提供有力的实验手段。本发明对于人类帕金森病的发病机制研究、治疗药物的研发及临床前试验均具有重大应用价值。
附图说明
图1为质粒pX330的结构示意图。
图2为质粒pKG-GE3的结构示意图。
图3为质粒pKG-U6gRNA的结构示意图。
图4为将20bp左右的DNA分子插入质粒pKG-U6gRNA的示意图。
图5为不同质粒配比编辑效果比较的测序结果。
图6为质粒pX330和质粒pKG-GE3编辑效果比较的测序结果。
图7为质粒PB-1G 2R 3-puro-ROSA26的结构示意图。
图8为质粒pKG-hSyn-hSNCA-4×的结构示意图。
图9为不同安全港位点调控GFP绿色荧光表达图。
图10为不同安全港位点调控GFP转录水平荧光定量PCR结果。
图11为不同安全港位点调控GFP蛋白表达的FACS检测结果。
图12为鉴定猪COL1A1安全港插入位点5’端hSyn-hSNCA-4×表达框是否重组成功的电泳图,其中,WT为野生型对照,Blank为空白对照,sh4代表安全港位点COL1A1,Lr代表5’同源臂,JDF代表鉴定引物F,JDR代表鉴定引物R,1414或5965代表检测位点信息。
图13为鉴定猪COL1A1安全港插入位点3’端hSyn-hSNCA-4×表达框是否重组成功的电泳图,其中,WT为野生型对照,Blank为空白对照,sh4代表安全港位点COL1A1,Rr代表3’同源臂,JDF代表鉴定引物F,JDR代表鉴定引物R,282或4723代表检测位点信息。
图14为鉴定hSyn-hSNCA-4×表达框是否纯合插入猪COL1A1安全港位点的电泳图,其中,WT为野生型对照,Blank为空白对照,sh4代表安全港位点COL1A1,JDF代表鉴定引物F,JDR代表鉴定引物R,1085或1560代表检测位点信息。
图15为猪COL1A1安全港位点调控人源SNCA基因转录水平荧光定量PCR示例性结果。
图16为猪COL1A1安全港位点调控人源SNCA蛋白表达的FACS检测示例性结果,其中,WT代表野生型对照猪神经元细胞,SNCA代表帕金森病模型猪的神经元细胞。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。实施例中构建的重组质粒,均已进行测序验证。完全培养液(%为体积比):15%胎牛血清(Gibco)+83%DMEM培养基(Gibco)+1%Penicillin-Streptomycin(Gibco)+1%HEPES(Solarbio)。细胞培养条件:37℃,5%CO2、5%O2的恒温培养箱。
实施例中采用的猪原代成纤维细胞均是用初生从江香猪(雌性,血型AO)的耳组织制备得到的。制备猪原代成纤维细胞的方法:①取猪耳组织0.5g,去除毛发及骨组织,然后用75﹪酒精浸泡30-40s,然后用含5%(体积比)Penicillin-Streptomycin(Gibco)的PBS缓冲液洗涤5次,然后用PBS缓冲液洗涤一次;②用剪刀将组织剪碎,采用5mL 0.1%胶原酶溶液(Sigma),37℃消化1h,然后500g离心5min,弃上清;③将沉淀用1mL完全培养液重悬,然后铺入含10mL完全培养液并已用0.2%明胶(VWR)封盘的直径为10cm的细胞培养皿中,培养至细胞长满皿底60%左右;④完成步骤③后,采用胰蛋白酶消化并收集细胞,然后重悬于完全培养液。用于进行后续电转实验。
实施例1、Cas9高效表达载体及pKG-U6gRNA表达载体的构建
一、Cas9高效表达载体的构建
出发质粒为pX330-U6-Chimeric_BB-CBh-hSpCas9,简称质粒pX330,如SEQ ID NO:1所示。
以质粒pX330为基础,构建质粒pU6gRNA eEF1a-mNLS-hSpCas9-EGFP-PURO。质粒pU6gRNA eEF1a-mNLS-hSpCas9-EGFP-PURO简称质粒pKG-GE3,如SEQ ID NO:2所示。
质粒pX330和质粒pKG-GE3均为环形质粒。
质粒pX330的结构示意图见图1。SEQ ID NO:1中,第440-725位核苷酸组成CMV增强子,第727-1208位核苷酸组成chickenβ-actin启动子,第1304-1324位核苷酸编码SV40核定位信号(NLS),第1325-5449位核苷酸编码Cas9蛋白,第5450-5497位核苷酸编码nucleoplasmin核定位信号(NLS)。
质粒pKG-GE3的结构示意图见图2。SEQ ID NO:2中,第395-680位核苷酸组成CMV增强子,第682-890位核苷酸组成EF1a启动子,第986-1006位核苷酸编码核定位信号(NLS),第1016-1036位核苷酸编码核定位信号(NLS),第1037-5161位核苷酸编码Cas9蛋白,第5162-5209位核苷酸编码核定位信号(NLS),第5219-5266位核苷酸编码核定位信号(NLS),第5276-5332位核苷酸编码自剪切多肽P2A(自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”,发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间),第5333-6046位核苷酸编码EGFP蛋白,第6056-6109位核苷酸编码自裂解多肽T2A(自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”,发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间),第6110-6703位核苷酸编码Puromycin蛋白(简称Puro蛋白),第6722-7310位核苷酸组成WPRE序列元件,第7382-7615位核苷酸组成3’LTR序列元件,第7647-7871位核苷酸组成bGH poly(A)signal序列元件。SEQID NO:2中,第911-6706形成融合基因,表达融合蛋白。由于自剪切多肽P2A和自裂解多肽T2A的存在,融合蛋白自发形成如下三个蛋白:具有Cas9蛋白的蛋白、具有EGFP蛋白的蛋白和具有Puro蛋白的蛋白。
与质粒pX330相比,本发明所构建的质粒pKG-GE3主要进行了如下改造:①去除残留的gRNA骨架序列(GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTTT),降低干扰;②将原有chickenβ-actin启动子改造为具更高表达活性的EF1a启动子,增加Cas9基因的蛋白表达能力;③在Cas9基因的上游和下游均增加核定位信号编码基因(NLS),增加Cas9蛋白的核定位能力;④原质粒无任何真核细胞筛选标记,不利于阳性转化细胞的筛选和富集,依次在Cas9基因的下游插入P2A-EGFP-T2A-PURO编码基因,赋予载体荧光和真核细胞抗性筛选能力;⑤插入WPRE元件和3’LTR序列元件,增强Cas9基因的蛋白翻译能力。
二、pKG-U6gRNA表达载体的构建
以pUC57为出发质粒,构建pKG-U6gRNA载体。pKG-U6gRNA载体即质粒pKG-U6gRNA,结构示意图见图3,为环形质粒,如SEQ ID NO:3所示。SEQ ID NO:3中,第2280-2539位核苷酸组成hU6启动子,第2558-2637位核苷酸用于转录形成gRNA骨架。使用时,将20bp左右的DNA分子(用于转录形成gRNA的靶序列结合区)插入质粒pKG-U6gRNA,形成重组质粒,示意图见图4,在细胞中重组质粒转录得到gRNA。
实施例2、质粒pX330和质粒pKG-GE3的效果比较
选择位于RAG1基因的高效gRNA靶点:
RAG1-gRNA4的靶点:5’-AGTTATGGCAGAACTCAGTG-3’。
用于扩增包含靶点的片段的引物如下:
RAG1-nF126:5’-CCCCATCCAAAGTTTTTAAAGGA-3’;
RAG1-nR525:5’-TGTGGCAGATGTCACAGTTTAGG-3’。
一、构建RAG1基因gRNA重组载体
对质粒pKG-U6gRNA用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。分别合成RAG1-4S和RAG1-4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG1-gRNA4)。
RAG1-4S:5’-caccgAGTTATGGCAGAACTCAGTG-3’;
RAG1-4A:5’-aaacCACTGAGTTCTGCCATAACTc-3’。
RAG1-4S和RAG1-4A均为单链DNA分子。
二、质粒配比优化
1、质粒共转染猪原代成纤维细胞
第一组:将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.44μg质粒pKG-U6gRNA(RAG1-gRNA4):1.56μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3的摩尔配比为:1:1。
第二组:将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.72μg质粒pKG-U6gRNA(RAG1-gRNA4):1.28μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3的摩尔配比为:2:1。
第三组:将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(RAG1-gRNA4):1.08μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3的摩尔配比为:3:1。
第四组:将质粒pKG-U6gRNA(RAG1-gRNA4)转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1μg质粒pKG-U6gRNA(RAG1-gRNA4)。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用RAG1-nF126和RAG1-nR525组成的引物对进行PCR扩增,然后进行电泳。
电泳后回收目的条带并进行测序,测序结果见图5。
通过利用Synthego ICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第三组的基因编辑效率依次为9%、53%、66%。第四组不发生基因编辑。结果表明,第三组编辑效率最高,确定单gRNA质粒与Cas9质粒最适配比为摩尔比3:1,质粒实际用量为0.92μg:1.08μg。
三、质粒pX330和质粒pKG-GE3的效果比较
1、共转染
RAG1-B组:将质粒pKG-U6gRNA(RAG1-gRNA4)转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(RAG1-gRNA4)。
RAG1-330组:将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pX330共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(RAG1-gRNA4):1.08μg质粒pX330,即两种质粒的摩尔配比依次为3:1。
RAG1-KG组:将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(RAG1-gRNA4):1.08μg质粒pKG-GE3,即两种质粒的摩尔配比依次为3:1。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)进行转染。
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用RAG1-nF126和RAG1-nR525组成的引物对进行PCR扩增,将产物进行测序。
通过利用Synthego ICE工具分析测序峰图得出不同靶点的编辑效率。RAG1-B组不发生基因编辑。RAG1-330组、RAG1-KG组的编辑效率依次为28%、68%。测序结果示例性峰图见图6。结果表明,与采用质粒pX330相比,采用质粒pKG-GE3使得基因编辑效率显著提高。
实施例3、含GFP基因的不同安全港位点Donor载体及pKG-hSyn-hSNCA-4×Donor载体的构建
一、构建含GFP基因的不同安全港位点Donor载体
构建质粒PB-1G 2R 3-puro-ROSA26、质粒PB-1G 2R 3-puro-AAVS1、质粒PB-1G 2R3-puro-H11和质粒PB-1G 2R 3-puro-COL1A1。四个质粒均为环形质粒。
质粒PB-1G 2R 3-puro-ROSA26如SEQ ID NO:4所示,结构示意图见图7。SEQ IDNO:4中,第9-339位核苷酸组成ROSA26安全港插入位点5’端猪基因组区域(SH1左臂),第9184-10195位核苷酸组成ROSA26安全港插入位点3’端猪基因组区域(SH1右臂)。SEQ IDNO:4中,第346-546、3132-3531、6506-6706、8975-9175位核苷酸分别组成4个不同的绝缘子区域。SEQ ID NO:4中,第637-1209位核苷酸组成EF-1αpoly(A)信号,第1216-1935位核苷酸编码EGFP蛋白,第1954-3131位核苷酸组成EF-1α启动子,第3543-4042位核苷酸组成PGK启动子,第4059-4769位核苷酸编码mCherry蛋白,第4791-5015位核苷酸组成bGH poly(A)信号,第5054-6504位核苷酸为loxP-puro-loxP表达框区域,第6969-7233位核苷酸组成β-globin poly(A)信号,第7259-8974位核苷酸组成pCAG启动子。
质粒PB-1G 2R 3-puro-AAVS1与质粒PB-1G 2R 3-puro-ROSA26的差异仅在于:将SH1左臂替换为AAVS1安全港插入位点5’端猪基因组区域(SH2左臂,SH2左臂如SEQ ID NO:5所示)并且将SH1右臂替换为AAVS1安全港插入位点3’端猪基因组区域(SH2右臂,SH2右臂如SEQ ID NO:6所示)。
质粒PB-1G 2R 3-puro-H11与质粒PB-1G 2R 3-puro-ROSA26的差异仅在于:将SH1左臂替换为H11安全港插入位点5’端猪基因组区域(SH3左臂,SH3左臂如SEQ ID NO:7所示)并且将SH1右臂替换为H11安全港插入位点3’端猪基因组区域(SH3右臂,SH2右臂如SEQ IDNO:8所示)。
质粒PB-1G 2R 3-puro-COL1A1与质粒PB-1G 2R 3-puro-ROSA26的差异仅在于:将SH1左臂替换为COL1A1安全港插入位点5’端猪基因组区域(SH4左臂,SH4左臂如SEQ ID NO:9所示)并且将SH1右臂替换为COL1A1安全港插入位点3’端猪基因组区域(SH4右臂,SH4右臂如SEQ ID NO:10所示)。
二、构建pKG-hSyn-hSNCA-4×Donor载体
质粒pKG-hSyn-hSNCA-4×如SEQ ID NO:11所示,为环形质粒,结构示意图见图8。SEQ ID NO:11中,第9-880位核苷酸为COL1A1安全港插入位点5’端猪基因组区域(SH4左臂),第887-1087位核苷酸为绝缘子1(Insulator 1)序列,第1088-1535位核苷酸为人Syn启动子序列,第1585-2004位核苷酸为hSNCA基因第1拷贝,第2014-2070位核苷酸为编码P2A的核苷酸序列,第2071-2490位核苷酸为hSNCA基因第2拷贝,第2500-2553位核苷酸为编码T2A的核苷酸序列,第2554-2973位核苷酸为hSNCA基因第3拷贝,第2983-3042位核苷酸为编码E2A的核苷酸序列,第3043-3462位核苷酸为hSNCA基因第4拷贝,第3511-3735位核苷酸为bGHPoly(A)序列,第3842-4171位核苷酸为SV40启动子序列,第4217-4816位核苷酸为Puromycin抗性蛋白(简称PuroR蛋白)编码序列,第4996-5117位核苷酸为SV40 Poly(A)序列,第3766-3799及5162-5195位核苷酸分别为同向相同的LoxP序列,第5204-5404位核苷酸为绝缘子2(Insulator 2)序列,第5405-6131位核苷酸为猪基因组COL1A1安全港插入位点3’端同源序列(SH4右臂)。质粒pKG-hSyn-hSNCA-4×中,为防止4个拷贝的hSNCA基因之间发生同源重组,分别将4个拷贝的hSNCA基因的密码子进行优化,使其DNA序列不完全相同,但所编码的氨基酸序列完全相同。
实施例4、筛选供外源基因定点插入的猪基因组最佳安全港位点
一、猪ROSA26、AAVS1、H11、COL1A1基因组安全港位点的高效切割靶点筛选
通过前期筛选,ROSA26安全港位点的高效切割靶点为sgRNAROSA26-g3(切割效率38%),AAVS1安全港位点的高效切割靶点为sgRNAAAVS1-g4(切割效率30%)、H11安全港位点的高效切割靶点为sgRNAH11-g1(切割效率60%),COL1A1安全港位点的高效切割靶点为sgRNACOL1A1-g3(切割效率56%)。
靶点序列如下:
sgRNAROSA26-g3靶点:5’-GAAGGAGCAAACTGACATGG-3’;
sgRNAAAVS1-g4靶点:5’-TGCAGTGGGTCTTTGGGGAC-3’;
sgRNAH11-g1靶点:5’-TTCCAGGAACATAAGAAAGT-3’;
sgRNACOL1A1-g3靶点:5’-GCAGTCTCAGCAACCACTGA-3’。
二、制备安全港位点gRNA重组载体
取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。
分别合成ROSA26-g3-S和ROSA26-g3-A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(ROSA26-g3)。质粒pKG-U6gRNA(ROSA26-g3)表达SEQ ID NO:13所示的sgRNAROSA26-g3
分别合成AAVS1-g4-S和AAVS1-g4-A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(AAVS1-g4)。质粒pKG-U6gRNA(AAVS1-g4)表达SEQ ID NO:14所示的sgRNAAAVS1-g4
分别合成H11-g1-S和H11-g1-A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(H11-g1)。质粒pKG-U6gRNA(H11-g1)表达SEQ ID NO:15所示的sgRNAH11-g1
分别合成COL1A1-g3-S和COL1A1-g3-A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(COL1A1-g3)。质粒pKG-U6gRNA(COL1A1-g3)表达SEQ ID NO:16所示的sgRNACOL1A1-g3
ROSA26-g3-S、ROSA26-g3-A、AAVS1-g4-S、AAVS1-g4-A、H11-g1-S、H11-g1-A、COL1A1-g3-S和COL1A1-g3-A均为单链DNA分子。
ROSA26-g3-S:caccGAAGGAGCAAACTGACATGG;
ROSA26-g3-A:aaacCCATGTCAGTTTGCTCCTTC。
AAVS1-g4-S:caccgTGCAGTGGGTCTTTGGGGAC;
AAVS1-g4-A:aaacGTCCCCAAAGACCCACTGCAc。
H11-g1-S:caccgTTCCAGGAACATAAGAAAGT;
H11-g1-A:aaacACTTTCTTATGTTCCTGGAAc。
COL1A1-g3-S:caccGCAGTCTCAGCAACCACTGA;
COL1A1-g3-A:aaacTCAGTGGTTGCTGAGACTGC。
sgRNAROSA26-g3(SEQ ID NO:13):
GAAGGAGCAAACUGACAUGGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
sgRNAAAVS1-g4(SEQ ID NO:14):
UGCAGUGGGUCUUUGGGGACguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
sgRNAH11-g1(SEQ ID NO:15):
UUCCAGGAACAUAAGAAAGUguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
sgRNACOL1A1-g3(SEQ ID NO:16):
GCAGUCUCAGCAACCACUGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
三、含不同安全港插入位点两侧同源臂的荧光Donor载体(即包含外源基因GFP的不同安全港位点载体)、sgRNA载体和Cas9载体(实施例1制备的pKG-GE3)混合电转猪原代成纤维细胞及细胞GFP荧光强度检测
1、共转染
第一组(ROSA26组):将质粒PB-1G 2R 3-puro-ROSA26、质粒pKG-U6gRNA(ROSA26-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.26μg质粒PB-1G 2R 3-puro-ROSA26:0.82μg质粒pKG-U6gRNA(ROSA26-g3):0.92μg质粒pKG-GE3;即3种质粒的摩尔配比依次为:1:3:1。
第二组(AAVS1组):将质粒质粒PB-1G 2R 3-puro-AAVS1、质粒pKG-U6gRNA(AAVS1-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.26μg质粒PB-1G 2R 3-puro-AAVS1:0.82μg质粒pKG-U6gRNA(AAVS1-g4):0.92μg质粒pKG-GE3;即3种质粒的摩尔配比依次为:1:3:1。
第三组(H11组):将质粒PB-1G 2R 3-puro-H11、质粒pKG-U6gRNA(H11-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.26μg质粒PB-1G2R 3-puro-H11:0.82μg质粒pKG-U6gRNA(H11-g1):0.92μg质粒pKG-GE3;即3种质粒的摩尔配比依次为:1:3:1。
第四组(COL1A1组):将质粒PB-1G 2R 3-puro-COL1A1、质粒pKG-U6gRNA(COL1A1-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.26μg质粒PB-1G 2R 3-puro-COL1A1:0.82μg质粒pKG-U6gRNA(COL1A1-g3):0.92μg质粒pKG-GE3;即3种质粒的摩尔配比依次为:1:3:1。
第五组:猪原代成纤维细胞,同等电转参数不加任何质粒进行电转操作。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)进行转染。
2、完成步骤1后,采用完全培养液培养12-24小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
3、完成步骤2后,更换为含1.5μg/mL嘌呤霉素的完全培养液培养3周(每2天更换新的含1.5μg/mL嘌呤霉素的完全培养液),持续观察并对GFP绿色荧光进行拍照,通过GFP荧光表达的强弱判断安全港位点表达外源基因效率的高低。
嘌呤霉素筛选一周后,ROSA26、COL1A1安全港位点试验组荧光强度明显强于AAVS1、H11试验组。嘌呤霉素筛选两周后,荧光强度由强到弱依次为:COL1A1>ROSA26>H11>AAVS1,其中H11组荧光强度不太均一,ROSA26组整体荧光强度较均一且荧光强度较高,AAVS1组细胞荧光表达最弱,COL1A1组荧光细胞数最多且荧光最强。嘌呤霉素继续筛选三周后,荧光强度由强到弱依次为:COL1A1>ROSA26>H11>AAVS1,照片见如图9。
四、GFP基因转录水平检测
为了比较GFP基因整合入四个不同安全港位点后mRNA转录水平的差异性,能否参与GFP的表达调控及对表达量的影响。在GFP基因外显子处设计一对引物,取步骤三中嘌呤霉素筛选三周后的细胞,提取总RNA,反转录成cDNA,检测原代细胞在四个不同安全港位点整合GFP基因后的转录水平,同时用第五组的细胞(无质粒的对照电转组)所得到的定量结果作为对照。以GAPDH基因为内参基因按照2-ΔCt法进行计算。
用于检测GFP基因的引物:F:AGATCCGCCACAACATCGAG;R:GTCCATGCCGAGAGTGATCC。
用于检测GAPDH基因的引物:F:GGTCGGAGTGAACGGATTTG;R:CCATTTGATGTTGGCGGGAT。
用SPSS统计学软件进行数据分析,以(平均数±标准差)表示,采用双因素方差分析进行统计学分析。2-ΔCt值结果显示嘌呤霉素筛选三周后AAVS1、H11组GFP表达量较低,ROSA26、COL1A1组GFP表达量较高,且COL1A1组和ROSA26组相对于AAVS1和H11组GFP转录水平差异极显著(P<0.01)。2-ΔCt值见表1,差异显著性分析结果见图10。
表1 2-ΔCt值信息
综上,根据培养细胞三周后的荧光信号强度与GFP基因实时荧光定量PCR的结果,可以得出如下结论,在ROSA26、AAVS1、H11、COL1A1这四个基因组安全港位点中,COL1A1位点插入外源基因后表达效果最好。
五、GFP基因的蛋白表达水平FACS检测
为了比较GFP基因整合入四个不同安全港位点后GFP蛋白的表达情况。分别用胰蛋白酶消化步骤三中嘌呤霉素筛选三周后的电转细胞,400g离心4min,弃上清。以1mL完全培养液重悬细胞,并将细胞悬液分别转移至流式管内。在BD FACSMelody流式细胞仪的FITC通道内检测GFP信号,收集5×104个细胞进行分析,结果见图11。
结果显示,GFP荧光信号强度COL1A1>ROSA26>H11>AAVS1。
因此,综合上述结果,COL1A1位点是ROSA26、AAVS1、H11、COL1A1四个安全港位点中最高效表达外源基因的猪原代细胞安全港位点。
实施例5、制备hSyn-hSNCA-4×定点插入猪COL1A1安全港位点的单细胞克隆
人SNCA基因(hSNCA基因)信息:编码人synuclein alpha蛋白;位于人4号染色体;GeneID为6622。hSNCA基因主要在脑和骨髓的神经细胞中特异表达,在其他组织中表达量较低,其编码的蛋白质如SEQ ID NO:12所示(6LRQ_A)。
一、共转染
将质粒pKG-hSyn-hSNCA-4×、质粒pKG-U6gRNA(COL1A1-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1.01μg质粒pKG-hSyn-hSNCA-4×:0.94μg质粒pKG-U6gRNA(COL1A1-g3):1.05μg质粒pKG-GE3;即3种质粒的摩尔配比依次为:1:3:1。
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)进行转染。
二、嘌呤霉素加压筛选
1、嘌呤霉素筛选hSyn-hSNCA-4×基因阳性插入细胞
(1)完成步骤一后,采用完全培养液培养电转后的细胞16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
(2)完成步骤(1)后,更换为含1.5μg/mL嘌呤霉素的完全培养液进行筛选培养(每2天更换新的含1.5μg/mL嘌呤霉素的完全培养液),筛选培养的时间为3周。
筛选培养1周时,细胞出现大量死亡。
筛选培养2周时,细胞只有零星死亡,部分阳性克隆开始分裂增殖,细胞数不断增多。
筛选培养第3周的目的是使细胞内质粒降解完全以排除假阳性细胞克隆。
(3)完成步骤(2)后,收集细胞,采用不含嘌呤霉素的完全培养液恢复培养2代(每2天1代),让细胞恢复至良好状态以用于下一步的单细胞分选。
2、单细胞分选,放大培养
(1)完成步骤1后,收集细胞,使用胰蛋白酶进行消化,然后采用完全培养液中和,然后500g离心5min,弃除上清,将沉淀用1mL完全培养液重悬并适当稀释,用口吸管挑取单细胞转移到96孔板中(每孔预先加入100μl完全培养液)(每组细胞一个96孔板,每孔一个细胞),进行培养,培养2天后更换为含1.5μg/mL嘌呤霉素的完全培养液,之后每2~3天更换新的含1.5μg/mL嘌呤霉素的完全培养液,期间用显微镜观察每孔细胞生长情况,排除无细胞及非单细胞克隆的孔。
(2)待步骤(1)中的96孔板的孔中细胞长满孔底(大约2周左右),使用胰蛋白酶消化并收集细胞,其中2/3细胞接种到含有完全培养液的6孔板中,剩余的1/3细胞收集在1.5mL离心管中。
(3)待步骤(2)中的6孔板的孔中细胞长至50%丰满度时使用0.25%(Gibco)的胰蛋白酶消化并收集细胞,使用细胞冻存液(90%完全培养液+10%DMSO,体积比)将细胞冻存。
三、猪COL1A1安全港位点定点插入hSNCA的单细胞克隆基因组水平鉴定
为了检测猪COL1A1安全港位点是否成功定点插入了hSyn-hSNCA-4×表达框。取步骤二的2的(2)中的离心管,提取细胞基因组DNA,采用特异引物对(特异引物对分别为:sh4-Lr-JDF1414和sh4-Lr-JDR5965组成的引物对、sh4-Rr-JDF282和sh4-Rr-JDR4723组成的引物对、sh4-wt-JDF1085和sh4-wt-JDR1560组成的引物对)进行PCR扩增,然后进行电泳。将猪原代成纤维细胞作为野生型对照(WT)。
sh4-Lr-JDF1414和sh4-Lr-JDR5965组成的引物对用来鉴定猪COL1A1安全港插入位点5’端hSNCA表达框是否重组成功(靶序列为4552bp);sh4-Rr-JDF282和sh4-Rr-JDR4723组成的引物对用来鉴定猪COL1A1安全港插入位点3’端hSNCA的4拷贝表达框是否重组成功(靶序列为4442bp);sh4-wt-JDF1085和sh4-wt-JDR1560组成的引物对用来鉴定猪COL1A1安全港位点定点插入的hSyn-hSNCA-4×表达框为纯合型还是杂合型(野生型基因组可扩增出476bp片段,外源插入片段太大无法实现扩增;因此,如果不显示扩增产物,说明细胞为插入hSyn-hSNCA-4×表达框的纯合型;如果显示476bp扩增产物,说明细胞为插入hSyn-hSNCA-4×表达框的杂合型或者是野生型)。
sh4-Lr-JDF1414:CCTGCTGTAAGTGCCGTAGT;
sh4-Lr-JDR5965:CTAGGGGCACAGCACGTC。
sh4-Rr-JDF282:AAGTTATTAGGTCTGAAGAGGAGTTT;
sh4-Rr-JDR4723:CCCATCATTCCGTCCCAGAG。
sh4-wt-JDF1085:TGCTGAGTTCTGGCTTCCTG;
sh4-wt-JDR1560:TCTACCAAGAGAGTGACCAGCAG。
电泳图分别见图12、图13和图14。图中的泳道编号与表2中的细胞编号一致。根据电泳的结果,编号为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20的单细胞克隆为成功在猪COL1A1安全港位点定点插入4个拷贝hSNCA基因的克隆,其中编号为2、14的单细胞克隆为纯合定点插入,1、3、4、5、6、7、8、9、10、11、12、13、15、16、17、18、20为杂合定点插入。结果见表2。
表2 hSyn-hSNCA-4×表达框定点插入猪COL1A1安全港位点单细胞克隆的基因型
表2中编号为hSNCA-1的重组细胞(杂合定点插入型)命名为hSNCA-1重组细胞。
表2中编号为hSNCA-2的重组细胞(纯合定点插入型)命名为hSNCA-2重组细胞。
将hSNCA-1重组细胞和hSNCA-2重组细胞分别进行实施例6的体细胞核移植生产疾病模型克隆猪。
实施例6、帕金森病模型猪的克隆生产及所插入的目标基因在模型猪中的表达分析一、利用体细胞核移植技术克隆生产帕金森病模型猪
1、卵母细胞体外成熟
从屠宰场采集新鲜的离体猪卵巢,卵巢在含75mg/mL青霉素和50mg/mL链霉素的0.9%氯化钠溶液中保存,于25-30℃温度下运输至实验室。
取卵巢,从直径3~6mm的卵泡中抽取卵丘卵母细胞复合体(Cumulus-oocytecomplexes,COCs),选择至少具有三层致密卵丘细胞的COCs,接种至4孔板中,每孔装有200μL猪卵母细胞体外成熟培养基,每孔接种50个,每次移植需培养300-400个COCs。将含COCs的培养板在38.5℃、5%CO2和饱和湿度的培养箱中培养42-44小时。
猪卵母细胞体外成熟培养基(IVM培养基):含0.1mg/mL丙酮酸、0.1mg/mL盐酸半胱氨酸、10ng/mL表皮生长因子、10%(v/v)猪卵泡液、75mg/mL青霉素、50mg/mL链霉素、10IU/mL eCG和10IU/mL hCG,余量为TCM-199培养基。
2、体细胞核移植与胚胎移植
(1)体细胞核移植(SCNT)
核供体细胞为hSNCA-1重组细胞或hSNCA-2重组细胞。
完成步骤1后,用0.1%(w/v)透明质酸酶反复吹打去除COCs的扩张卵丘细胞。将具有完整膜且含排出的第一极体的卵母细胞在含有0.1mg/mL地美可辛、0.05M蔗糖和4mg/mL牛血清白蛋白的NCSU23培养基中培养0.5-1h,促使卵母细胞核突起,然后使用尖部倾斜的显微注射针(直径约20μm)在含有10μm HEPES、0.3%(w/v)聚乙烯吡咯烷酮、10%FBS、0.1mg/mL地美可辛和5mg/mL细胞松弛素B的Tyrode乳酸培养基中去除突起的细胞核和极体。将单个核供体细胞注入去核卵母细胞的卵周隙,使用胚胎细胞融合仪(ET3,Fuj ihiraIndustry)在融合培养基中用200V/mm的直流脉冲将核供体细胞与受体卵母细胞融合20μs。然后,将重构胚在PZM-3培养基(配方见表3)中培养2h以允许细胞核重编程,然后在激活培养基中用150V/mm的单脉冲激活100μs。然后,将激活的重构胚置于含5μg/mL细胞松弛素B的PZM-3培养基中,于38.5℃、5%CO2、5%O2、90%N2和饱和湿度的培养箱中培养2小时,以进一步激活;然后将重构胚置于PZM-3培养基中,于38.5℃、5%CO2、5%O2、90%N2和饱和湿度的培养箱中培养。大部分重构胚在激活后培养6h即可用于后续的胚胎移植。
融合培养基:含0.25M D-山梨醇、0.05mM Mg(C2H3O2)2,20mg/mL BSA和0.5mMHEPES[acid-free],余量为水。
激活培养基:含0.25M D-山梨醇,0.01mM Ca(C2H3O2)2,0.05mM Mg(C2H3O2)2和0.1mg/mL BSA,余量为水。
表3 PZM-3培养基的配方
/>
*使用前添加
(2)胚胎移植
杂交母猪:大白猪(母本)和长白猪(父本)杂交得到的子代母猪。
选择6头处于发情期的杂交母猪作为重构胚的代孕母猪,将激活后培养6h的重构胚移植到代孕母猪的输卵管中,每头母猪移植300-350个重构胚。6头代孕母猪中,2头移植hSNCA-1重组细胞得到的重构胚,4头移植hSNCA-2重组细胞得到的重构胚。在胚胎移植后约23天,使用超声波扫描仪(HS-101V,日本本田电子)检查妊娠情况,确认受体母猪是否怀孕。6头代孕母猪进行上述移植后,3头成功怀孕并获得后代。3头成功怀孕的母猪中,1头移植了hSNCA-1重组细胞得到的重构胚,2头移植了hSNCA-2重组细胞得到的重构胚。
克隆猪在胚胎移植后第116-117天左右出生。3头成功怀孕的母猪共生产获得6头克隆猪。6头克隆猪中,2头由hSNCA-1重组细胞发育而来(统称为hSNCA-1克隆猪,分别命名为hSNCA-1-1克隆猪和hSNCA-1-2克隆猪),4头由hSNCA-2重组细胞发育而来(统称为hSNCA-2克隆猪,分别命名为hSNCA-2-1克隆猪、hSNCA-2-2克隆猪、hSNCA-2-3克隆猪和hSNCA-2-4克隆猪)。克隆猪即为帕金森病模型猪。
3、野生型对照猪的制备
将同一来源的猪原代成纤维细胞代替重组细胞作为核供体细胞进行步骤2,得到克隆猪,即为野生型对照猪。野生型对照猪的遗传背景除不具有外源插入DNA外,其余与帕金森病模型猪完全一致。
二、帕金森病模型猪hSNCA基因的转录水平检测
为了检测猪COL1A1安全港位点定点插入hSyn-hSNCA-4×表达框的模型猪的4个拷贝的hSNCA基因的表达情况。针对密码子优化后的4个拷贝的hSNCA基因的分别设计了一对特异的引物。分别获取出生90天后的帕金森病模型猪和野生型对照猪的脑组织,提取总RNA并反转录得到cDNA。将cDNA作为模板,检测猪脑组织hSNCA基因不同拷贝的转录水平。以β-actin基因为内参基因,按照2-ΔCt法进行计算。
引物信息见表4。
表4荧光定量PCR引物信息
用SPSS统计学软件进行数据分析,以(平均数±标准差)表示,采用单因素方差分析进行统计学分析。结果见图15。2-ΔCt值结果显示,帕金森病模型猪脑组织的hSNCA基因4拷贝的表达量均显著高于野生型对照猪脑组织的hSNCA基因的表达量,并且靶基因纯合细胞株所得到的克隆猪的hSNCA基因4拷贝的表达量要高于靶基因杂合细胞株所得到的克隆猪的表达量。
综上,根据hSNCA基因实时荧光定量PCR的结果,hSNCA基因4拷贝在帕金森病模型猪的脑组织中均有显著的表达。
三、帕金森病模型猪hSNCA基因的蛋白表达水平FACS检测
为了比较hSNCA基因在帕金森病模型猪神经元细胞以及野生型对照猪神经元细胞中的表达情况,进行下述实验:
1、分别采集出生90天后的hSNCA-2克隆猪和野生型对照猪脑组织的海马组织,去除脑膜和血管后,用含3%青霉素/链霉素的PBS洗涤3次,然后再用PBS洗涤1次,充分剪碎后,放入消化液中,37℃震荡消化30min,然后用含10%FBS的DMEM培养基中和消化酶,过200目的细胞筛,收集滤液,300g离心5min,去上清,获得神经元细胞沉淀。
消化液:0.25%(w/v)胰酶、0.1%(w/v)IV型胶原酶、1%青霉素/链霉素,溶剂为DMEM培养基。
2、完成步骤1后,用PBS缓冲液洗涤细胞,然后用-20℃预冷90%甲醇水溶液充分重悬细胞,固定20min,然后离心并弃除固定液,然后加入3%BSA水溶液封闭1h,然后离心弃除封闭液,然后用含10%FBS的DMEM培养基洗涤。
3、完成步骤2后,用特异性的human SNCA抗体(abcam,ab138501)工作液重悬细胞(工作液稀释度为1:200),室温孵育2h,然后用含10%FBS的DMEM培养基充分洗涤细胞。
4、完成步骤3后,加入羊抗兔二抗(abcam,ab150077)工作液(二抗工作液稀释度为1:1000),室温孵育1h,然后用含10%FBS的DMEM培养基充分洗涤细胞。
5、完成步骤4后,用500μL含10%FBS的DMEM培养基重悬细胞,并将细胞悬液转移至流式管内,在BD FACSMelody流式细胞仪的FITC通道内检测hSNCA抗体荧光信号,收集5×104个细胞进行分析。
结果如图16。图16中,WT代表野生型对照猪,hSNCA代表hSNCA-2克隆猪。结果显示在帕金森病模型猪的神经元细胞中检测到明显的hSNCA的抗体荧光信号,而在野生型对照猪的神经元细胞中没有检测到hSNCA抗体荧光信号,这说明所插入的人源SNCA基因在帕金森病模型猪的神经元细胞中有较高的表达,也进一步说明了帕金森病模型猪被成功构建。
进一步的,本发明制备的帕金森病模型猪可用于下一步的药物筛选及药效评价、基因及细胞治疗、帕金森病发病机制的研究等生物医药领域。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 南京启真基因工程有限公司
<120> 一种构建神经组织特异过表达人源SNCA的帕金森病模型猪的方法及应用
<130> GNCYX210482
<160> 16
<170> SIPOSequenceListing 1.0
<210> 1
<211> 8484
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360
agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420
aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480
ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840
ggggggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 900
agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 960
aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgcgctg ccttcgcccc gtgccccgct 1020
ccgccgccgc ctcgcgccgc ccgccccggc tctgactgac cgcgttactc ccacaggtga 1080
gcgggcggga cggcccttct cctccgggct gtaattagct gagcaagagg taagggttta 1140
agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 1200
ctttttttca ggttggaccg gtgccaccat ggactataag gaccacgacg gagactacaa 1260
ggatcatgat attgattaca aagacgatga cgataagatg gccccaaaga agaagcggaa 1320
ggtcggtatc cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg 1380
caccaactct gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt 1440
caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct 1500
gttcgacagc ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata 1560
caccagacgg aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa 1620
ggtggacgac agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa 1680
gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta 1740
ccccaccatc taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg 1800
gctgatctat ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg 1860
cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta 1920
caaccagctg ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct 1980
gtctgccaga ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga 2040
gaagaagaat ggcctgttcg gaaacctgat tgccctgagc ctgggcctga cccccaactt 2100
caagagcaac ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga 2160
cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc 2220
cgccaagaac ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat 2280
caccaaggcc cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct 2340
gaccctgctg aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt 2400
cgaccagagc aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt 2460
ctacaagttc atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa 2520
gctgaacaga gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca 2580
ccagatccac ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt 2640
cctgaaggac aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt 2700
gggccctctg gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac 2760
catcaccccc tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat 2820
cgagcggatg accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag 2880
cctgctgtac gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga 2940
gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct 3000
gttcaagacc aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat 3060
cgagtgcttc gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg 3120
cacataccac gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa 3180
cgaggacatt ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat 3240
cgaggaacgg ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa 3300
gcggcggaga tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga 3360
caagcagtcc ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa 3420
cttcatgcag ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca 3480
ggtgtccggc cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc 3540
cattaagaag ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg 3600
ccggcacaag cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa 3660
gggacagaag aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg 3720
cagccagatc ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta 3780
cctgtactac ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg 3840
gctgtccgac tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat 3900
cgacaacaag gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc 3960
cgaagaggtc gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat 4020
tacccagaga aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga 4080
taaggccggc ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc 4140
acagatcctg gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga 4200
agtgaaagtg atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt 4260
ttacaaagtg cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt 4320
cgtgggaacc gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga 4380
ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc 4440
taccgccaag tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct 4500
ggccaacggc gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat 4560
cgtgtgggat aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt 4620
gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc 4680
caagaggaac agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg 4740
cggcttcgac agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg 4800
caagtccaag aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag 4860
cagcttcgag aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa 4920
ggacctgatc atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag 4980
aatgctggcc tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata 5040
tgtgaacttc ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa 5100
tgagcagaaa cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca 5160
gatcagcgag ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc 5220
cgcctacaac aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct 5280
gtttaccctg accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga 5340
ccggaagagg tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat 5400
caccggcctg tacgagacac ggatcgacct gtctcagctg ggaggcgaca aaaggccggc 5460
ggccacgaaa aaggccggcc aggcaaaaaa gaaaaagtaa gaattcctag agctcgctga 5520
tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 5580
tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 5640
tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 5700
ggggaggatt gggaagagaa tagcaggcat gctggggagc ggccgcagga acccctagtg 5760
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 5820
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc 5880
ctgcaggggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 5940
atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6000
tggttacgcg cagcgtgacc gctacacttg ccagcgcctt agcgcccgct cctttcgctt 6060
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6120
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgatttgg 6180
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6240
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aactctatct 6300
cgggctattc ttttgattta taagggattt tgccgatttc ggtctattgg ttaaaaaatg 6360
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaattttat 6420
ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc 6480
caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 6540
ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 6600
cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg 6660
tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 6720
ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 6780
aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct 6840
tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag 6900
atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta 6960
agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc 7020
tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca 7080
tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg 7140
atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg 7200
ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca 7260
tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa 7320
acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa 7380
ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata 7440
aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat 7500
ctggagccgg tgagcgtgga agccgcggta tcattgcagc actggggcca gatggtaagc 7560
cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata 7620
gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt 7680
actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga 7740
agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 7800
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 7860
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 7920
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 7980
ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 8040
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 8100
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 8160
gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 8220
gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 8280
gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 8340
tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 8400
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct 8460
tttgctggcc ttttgctcac atgt 8484
<210> 2
<211> 10476
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttc tagcgcgtgc 360
gccaattctg cagacaaatg gctctagagg tacccgttac ataacttacg gtaaatggcc 420
cgcctggctg accgcccaac gacccccgcc cattgacgtc aatagtaacg ccaataggga 480
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 540
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 600
ggcattgtgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 660
tagtcatcgc tattaccatg ggggcagagc gcacatcgcc cacagtcccc gagaagttgg 720
ggggaggggt cggcaattga tccggtgcct agagaaggtg gcgcggggta aactgggaaa 780
gtgatgtcgt gtactggctc cgcctttttc ccgagggtgg gggagaaccg tatataagtg 840
cagtagtcgc cgtgaacgtt ctttttcgca acgggtttgc cgccagaaca caggttggac 900
cggtgccacc atggactata aggaccacga cggagactac aaggatcatg atattgatta 960
caaagacgat gacgataaga tggcccccaa aaagaaacga aaggtgggtg ggtccccaaa 1020
gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt acagcatcgg 1080
cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc 1140
cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga agaacctgat 1200
cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga agagaaccgc 1260
cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa 1320
cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga 1380
agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg aggtggccta 1440
ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa 1500
ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc ggggccactt 1560
cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct 1620
ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc 1680
caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc tgatcgccca 1740
gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga gcctgggcct 1800
gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa 1860
ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga 1920
cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca tcctgagagt 1980
gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca 2040
ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa 2100
agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg gcggagccag 2160
ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga 2220
actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg 2280
cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga 2340
tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttccgcat 2400
cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga tgaccagaaa 2460
gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgcttccgc 2520
ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg agaaggtgct 2580
gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga ccaaagtgaa 2640
atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat 2700
cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga aagaggacta 2760
cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa 2820
cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga 2880
caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga 2940
cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat 3000
gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa 3060
cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt 3120
cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat 3180
ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc 3240
cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt 3300
gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca 3360
gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat 3420
caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa 3480
cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact 3540
ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa 3600
ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga 3660
caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa 3720
cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct 3780
gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac 3840
aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa 3900
gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa 3960
ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta 4020
cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt 4080
cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga 4140
aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac 4200
cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga 4260
aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag 4320
catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga 4380
gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc 4440
taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa 4500
agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat 4560
catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa 4620
agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa 4680
cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct 4740
gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc 4800
ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga 4860
gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga 4920
caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa 4980
tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga 5040
caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat 5100
ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga 5160
caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagg gcggctccaa 5220
gcggcctgcc gcgacgaaga aagcgggaca ggccaagaaa aagaaaggat ccggcgcaac 5280
aaacttctct ctgctgaaac aagccggaga tgtcgaagag aatcctggac cggtgagcaa 5340
gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa 5400
cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac 5460
cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 5520
cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt 5580
cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 5640
cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 5700
cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 5760
caactacaac agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt 5820
gaacttcaag atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 5880
gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 5940
ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 6000
cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagggct ccggcgaggg 6060
caggggaagt cttctaacat gcggggacgt ggaggaaaat cccggcccaa ccgagtacaa 6120
gcccacggtg cgcctcgcca cccgcgacga cgtccccagg gccgtacgca ccctcgccgc 6180
cgcgttcgcc gactaccccg ccacgcgcca caccgtcgat ccggaccgcc acatcgagcg 6240
ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg ctcgacatcg gcaaggtgtg 6300
ggtcgcggac gacggcgccg cggtggcggt ctggaccacg ccggagagcg tcgaagcggg 6360
ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg agcggttccc ggctggccgc 6420
gcagcaacag atggaaggcc tcctggcgcc gcaccggccc aaggagcccg cgtggttcct 6480
ggccaccgtc ggagtctcgc ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct 6540
ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc 6600
ccgcaacctc cccttctacg agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc 6660
cgaaggaccg cgcacctggt gcatgacccg caagcccggt gcctgaacgc gttaagtcga 6720
caatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 6780
tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 6840
tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 6900
gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 6960
tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 7020
tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 7080
gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 7140
cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 7200
caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 7260
tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc gtcgacttta 7320
agaccaatga cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga 7380
ctggaagggc taattcactc ccaacgaaga caagatctgc tttttgcttg tactgggtct 7440
ctctggttag accagatctg agcctgggag ctctctggct aactagggaa cccactgctt 7500
aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac 7560
tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagggcc 7620
cgtttaaacc cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 7680
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 7740
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 7800
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 7860
gggctctatg gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 7920
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 7980
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ttagcgcccg 8040
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 8100
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 8160
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 8220
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 8280
tcaactctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggtctatt 8340
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 8400
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 8460
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 8520
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 8580
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 8640
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 8700
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 8760
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 8820
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 8880
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 8940
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 9000
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 9060
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 9120
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 9180
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 9240
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 9300
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 9360
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 9420
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 9480
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 9540
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 9600
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 9660
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 9720
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 9780
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 9840
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 9900
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 9960
taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 10020
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 10080
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 10140
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 10200
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 10260
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 10320
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 10380
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 10440
ggttcctggc cttttgctgg ccttttgctc acatgt 10476
<210> 3
<211> 3120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctt gcatgcaggc ctctgcagtc gacgggcccg ggatccgatg 2280
ataaacatgt gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 2340
tgttagagag ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 2400
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 2460
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 2520
gtggaaagga cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag 2580
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttc 2640
tagcgcgtgc gccaattctg cagacaaatg gctctagagg tacccataga tctagatgca 2700
ttcgcgaggt accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa 2760
accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta 2820
atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat 2880
ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt 2940
gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 3000
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3060
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3120
<210> 4
<211> 14138
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ggcgcgccct ctacctgctc tcggacccgt gggggtgggg ggtggaggaa ggagtggggg 60
gtcggtcctg ctggcttgtg ggtgggaggc gcatgttctc caaaaacccg cgcgagctgc 120
aatcctgagg gagctgcagt ggaggaggcg gagagaaggc cgcacccttc tccgcagggg 180
gaggggagtg ccgcaatacc tttatgggag ttctctgctg cctccttttc ctaaggaccg 240
ccctgggcct agaaaaatcc ctccctcccc cgcgatctcg tcatcgcctc catgtcagtt 300
tgctccttct cgattatggg cgggattctt ttgccctggc gcgccccaga cccgggcctg 360
gggggcaagt cggggggcgg ggggaggtcg ggcagggtcc cctgggagga tggggacgtg 420
ctgtgcccct agcggccacc agagggcacc aggacaccac tgcggtcggc tcagcggctc 480
ctgccctggt cagggggcgc caggtcctgc ccctcctggg gagggcgggg ggcgagaagg 540
gcgattttaa ttaacccacg tttcaacatg cacatcccag taatttggaa acattttgtt 600
tccaaagatt cacttaacat tggtttagca acatgaagct ttctatgcaa cccaaggact 660
cagtttttgg cctgttttag tgacaggcaa tcagcaacat gctgcatttc tctccagtgt 720
tgtaatcaaa gaaaccctcc catagcttta aatgatattc cttccccttc caattatgtg 780
gggggaaaac aaccctattc tccacccaga agtgttaact caagaattac attttcaaga 840
agtttccaga ttcgtaaaac cagaattaga tgtctttcac ctaaatgtct cggtgttgac 900
caaaggaaca cacaggtttc tcatttaact tttttaatgg gtctcaaaat tctgtgacaa 960
atttttggtc aagttgtttc cattaaaaag tactgatttt aaaaactaat aacttaaaac 1020
tgccacacgc aaaaaagaaa accaaagtgg tccacaaaac attctccttt ccttctgaag 1080
gttttacgat gcattgttat cattaaccag tcttttacta ctaaacttaa atggccaatt 1140
gaaacaaaca gttctgagac cgttcttcca ccactgatta agagtggggt ggcaggtatt 1200
agggataatg ctagcttact tgtacagctc gtccatgccg agagtgatcc cggcggcggt 1260
cacgaactcc agcaggacca tgtgatcgcg cttctcgttg gggtctttgc tcagggcgga 1320
ctgggtgctc aggtagtggt tgtcgggcag cagcacgggg ccgtcgccga tgggggtgtt 1380
ctgctggtag tggtcggcga gctgcacgct gccgtcctcg atgttgtggc ggatcttgaa 1440
gttcaccttg atgccgttct tctgcttgtc ggccatgata tagacgttgt ggctgttgta 1500
gttgtactcc agcttgtgcc ccaggatgtt gccgtcctcc ttgaagtcga tgcccttcag 1560
ctcgatgcgg ttcaccaggg tgtcgccctc gaacttcacc tcggcgcggg tcttgtagtt 1620
gccgtcgtcc ttgaagaaga tggtgcgctc ctggacgtag ccttcgggca tggcggactt 1680
gaagaagtcg tgctgcttca tgtggtcggg gtagcggctg aagcactgca cgccgtaggt 1740
cagggtggtc acgagggtgg gccagggcac gggcagcttg ccggtggtgc agatgaactt 1800
cagggtcagc ttgccgtagg tggcatcgcc ctcgccctcg ccggacacgc tgaacttgtg 1860
gccgtttacg tcgccgtcca gctcgaccag gatgggcacc accccggtga acagctcctc 1920
gcccttgctc accatggtgg cgtcgaccgt acgtcacgac acctgaaatg gaagaaaaaa 1980
actttgaacc actgtctgag gcttgagaat gaaccaagat ccaaactcaa aaagggcaaa 2040
ttccaaggag aattacatca agtgccaagc tggcctaact tcagtctcca cccactcagt 2100
gtggggaaac tccatcgcat aaaacccctc cccccaacct aaagacgacg tactccaaaa 2160
gctcgagaac taatcgaggt gcctggacgg cgcccggtac tccgtggagt cacatgaagc 2220
gacggctgag gacggaaagg cccttttcct ttgtgtgggt gactcacccg cccgctctcc 2280
cgagcgccgc gtcctccatt ttgagctccc tgcagcaggg ccgggaagcg gccatctttc 2340
cgctcacgca actggtgccg accgggccag ccttgccgcc cagggcgggg cgatacacgg 2400
cggcgcgagg ccaggcacca gagcaggccg gccagcttga gactaccccc gtccgattct 2460
cggtggccgc gctcgcaggc cccgcctcgc cgaacatgtg cgctgggacg cacgggcccc 2520
gtcgccgccc gcggccccaa aaaccgaaat accagtgtgc agatcttggc ccgcatttac 2580
aagactatct tgccagaaaa aaagcgtcgc agcaggtcat caaaaatttt aaatggctag 2640
agacttatcg aaagcagcga gacaggcgcg aaggtgccac cagattcgca cgcggcggcc 2700
ccagcgccca ggccaggcct caactcaagc acgaggcgaa ggggctcctt aagcgcaagg 2760
cctcgaactc tcccacccac ttccaacccg aagctcggga tcaagaatca cgtactgcag 2820
ccagtggaag taattcaagg cacgcaaggg ccataacccg taaagaggcc aggcccgcgg 2880
gaaccacaca cggcacttac ctgtgttctg gcggcaaacc cgttgcgaaa aagaacgttc 2940
acggcgacta ctgcacttat atacggttct cccccaccct cgggaaaaag gcggagccag 3000
tacacgacat cactttccca gtttaccccg cgccaccttc tctaggcacc ggttcaattg 3060
ccgacccctc cccccaactt ctcggggact gtgggcgatg tgcgctctgc ccactgacgg 3120
gcaccggagc cctagattcg attccctttg gggcaaaact caccgcctaa tcccctataa 3180
ctctaccggg gagcccggtg gagagcagac gggctgacgc tgccacctgc cggccatccc 3240
aggataggac cgccgtattc aagtcgccct caggaaggac cctcggggca ccagaggcct 3300
tcgaagcccc aatgagtgag gcaactgagg gtcgcgggtg ccattacaag gcccagccaa 3360
ggcctagagc caaggcttga accgtggggg acccccaagc cccacctgcc caggaacagc 3420
agacactggg acactttgtt tcaggtcctg cccaggcccc tcccactgtg aggctgggat 3480
ttgtcgccca gggtgcagat gagaagagtg gggaaagcag tcctgagcca ggaaattcta 3540
ccgggtaggg gaggcgcttt tcccaaggca gtctggagca tgcgctttag cagccccgct 3600
gggcacttgg cgctacacaa gtggcctctg gcctcgcaca cattccacat ccaccggtag 3660
gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc ctcccctagt 3720
caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc 3780
acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc gggtaggcct 3840
ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga ggctgggaag 3900
gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc 3960
ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc 4020
ttcctcatct ccgggccttt cgacctccta gggccaccat ggtgagcaag ggcgaggacg 4080
acaacatggc catcatcaag gagttcatgc gcttcaaggt gcacatggag ggctccgtga 4140
acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga 4200
ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc 4260
ctcagttcat gtacggctcc aaggcctacg tgaagcaccc cgccgacatc cccgactact 4320
tgaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg 4380
gcgtggtgac cgtgacccag gactcctccc tgcaggacgg cgagttcatc tacaaggtga 4440
agctgcgcgg caccaacttc ccctccgacg gccccgtaat gcagaagaag accatgggct 4500
gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc gagatcaagc 4560
agaggctgaa gctgaaggac ggcggccact acgacgccga ggtcaagacc acctacaagg 4620
ccaagaagcc cgtgcagctg cccggcgcct acaacgtcaa catcaagctg gacatcacct 4680
cccacaacga ggactacacc atcgtggaac agtacgagcg cgccgagggc cgccactcca 4740
ccggcggcat ggacgagctg tacaagtgag gatccgctga tcagcctcga ctgtgccttc 4800
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4860
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4920
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 4980
tagcaggcat gctggggatg cggtgggctc tatggcttct gaggcggaaa gaacccttct 5040
gaggcggaaa gaaccagctg ccttaatata acttcgtata atgtatgcta tacgaagtta 5100
ttaggtctga agaggagttt acgtccagcc aattctgtgg aatgtgtgtc agttagggtg 5160
tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 5220
agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 5280
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 5340
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 5400
cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 5460
aggcttttgc aaaaagctcc cgggagcttg tatatccatt ttcggcggcc gcgccaccat 5520
gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg 5580
caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg atccggaccg 5640
ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg ggctcgacat 5700
cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca cgccggagag 5760
cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt tgagcggttc 5820
ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc ccaaggagcc 5880
cgcgtggttc ctggccaccg tcggagtctc gcccgaccac cagggcaagg gtctgggcag 5940
cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga 6000
gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga 6060
cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgaga 6120
attcgcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct gccatcacga 6180
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 6240
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 6300
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 6360
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 6420
catgtctgta taccgctcga ctagagcttg cggaaccctt aatataactt cgtataatgt 6480
atgctatacg aagttattag gtccgctggc catctacgag ccaaagactt tcaaatcttt 6540
ggctgccttg gccagtagga ggcgacacga aggatttgct gctgccttgg gggatgggaa 6600
ggaacctgaa ggcatttttt ccagagtggt gcagtaccac tgaggactgt tgctgtattg 6660
attaggaaaa gagacagagt aatttgcagt ttgtttgatt tatactgggc tgcaggtcga 6720
gggatcttca taagagaaga gggacagcta tgactgggag tagtcaggag aggaggaaaa 6780
atctggctag taaaacatgt aaggaaaatt ttagggatgt taaagaaaaa aataacacaa 6840
aacaaaatat aaaaaaaatc taacctcaag tcaaggcttt tctatggaat aaggaatgga 6900
cagcaggggg ctgtttcata tactgatgac ctctttatag ccacctttgt tcatggcagc 6960
cagcatatgg catatgttgc caaactctaa accaaatact cattctgatg ttttaaatga 7020
tttgccctcc catatgtcct tccgagtgag agacacaaaa aattccaaca cactattgca 7080
atgaaaataa atttccttta ttagccagaa gtcagatgct caaggggctt catgatgtcc 7140
ccataatttt tggcagaggg aaaaagatct cagtggtatt tgtgagccag ggcattggcc 7200
acaccagcca ccaccttctg ataggcagcc tgcggtacct tacatggtgg cgaattcgtt 7260
tgccaaaatg atgagacagc acaataacca gcacgttgcc caggagctgt aggaaaaaga 7320
agaaggcatg aacatggtta gcagaggctc tagagccgcc ggtcacacgc cagaagccga 7380
accccgccct gccccgtccc ccccgaaggc agccgtcccc ctgcggcagc cccgaggctg 7440
gagatggaga aggggacggc ggcgcggcga cgcacgaagg ccctccccgc ccatttcctt 7500
cctgccggcg ccgcaccgct tcgcccgcgc ccgctagagg gggtgcggcg gcgcctccca 7560
gatttcggct ccgccagatt tgggacaaag gaagtccctg cgccctctcg cacgattacc 7620
ataaaaggca atggctgcgg ctcgccgcgc ctcgacagcc gccggcgctc cggggccgcc 7680
gcgcccctcc cccgagccct ccccggcccg aggcggcccc gccccgcccg gcacccccac 7740
ctgccgccac cccccgcccg gcacggcgag ccccgcgcca cgccccgcac ggagccccgc 7800
acccgaagcc gggccgtgct cagcaactcg gggagggggg tgcagggggg ggttacagcc 7860
cgaccgccgc gcccacaccc cctgctcacc cccccacgca cacaccccgc acgcagcctt 7920
tgttcccctc gcagcccccc cgcaccgcgg ggcaccgccc ccggccgcgc tcccctcgcg 7980
cacacgcgga gcgcacaaag ccccgcgccg cgcccgcagc gctcacagcc gccgggcagc 8040
gcgggccgca cgcggcgctc cccacgcaca cacacacgca cgcacccccc gagccgctcc 8100
cccccgcaca aagggccctc ccggagccct ttaaggcttt cacgcagcca cagaaaagaa 8160
acgagccgtc attaaaccaa gcgctaatta cagcccggag gagaagggcc gtcccgcccg 8220
ctcacctgtg ggagtaacgc ggtcagtcag agccggggcg ggcggcgcga ggcggcgcgg 8280
agcggggcac ggggcgaagg caacgcagcg actcccgccc gccgcgcgct tcgcttttta 8340
tagggccgcc gccgccgccg cctcgccata aaaggaaact ttcggagcgc gccgctctga 8400
ttggctgccg ccgcacctct ccgcctcgcc ccgccccgcc cctcgccccg ccccgccccg 8460
cctggcgcgc gccccccccc cccccgcccc catcgctgca caaaataatt aaaaaataaa 8520
taaatacaaa attgggggtg gggagggggg ggagatgggg agagtgaagc agaacgtggg 8580
gctcacctcg acccatggta atagcgatga ctaatacgta gatgtactgc caagtaggaa 8640
agtcccataa ggtcatgtac tgggcataat gccaggcggg ccatttaccg tcattgacgt 8700
caataggggg cgtacttggc atatgataca cttgatgtac tgccaagtgg gcagtttacc 8760
gtaaatagtc cacccattga cgtcaatgga aagtccctat tggcgttact atgggaacat 8820
acgtcattat tgacgtcaat gggcgggggt cgttgggcgg tcagccaggc gggccattta 8880
ccgtaagtta tgtaacgcgg aactccatat atgggctatg aactaatgac cccgtaattg 8940
attactatta ataactagtc aataatcaat gtcgtaaatg tcgtaaatgt ctcagctagt 9000
caggtagtaa aaggtgtcaa ctaggcagtg gcagagcagg attcaaattc agggctgttg 9060
tgatgcctcc gcagactctg agcgccacct ggtggtaatt tgtctgtgcc tcttctgacg 9120
tggaagaaca gcaactaaca cactaacacg gcatttacta tgggccagcc attgtacgcg 9180
ttgcttaacc tgattcttgg gcgttgtcct gcaggggatt gagcaggtgt acgaggacga 9240
gcccaatttc tctatattcc cacagtcttg agtttgtgtc acaaaataat tatagtgggg 9300
tggagatggg aaatgagtcc aggcaacacc taagcctgat tttatgcatt gagactgcgt 9360
gttattacta aagatctttg tgtcgcaatt tcctgatgaa gggagatagg ttaaaaagca 9420
cggatctact gagttttaca gtcatcccat ttgtagactt ttgctacacc accaaagtat 9480
agcatctgag attaaatatt aatctccaaa ccttaggccc cctcacttgc atccttacgg 9540
tcagataact ctcactcata ctttaagccc attttgtttg ttgtacttgc tcatccagtc 9600
ccagacatag cattggcttt ctcctcacct gttttaggta gccagcaagt catgaaatca 9660
gataagttcc accaccaatt aacactaccc atcttgagca taggcccaac agtgcattta 9720
ttcctcattt actgatgttc gtgaatattt accttgattt tcattttttt ctttttctta 9780
agctgggatt ttactcctga ccctattcac agtcagatga tcttgactac cactgcgatt 9840
ggacctgagg ttcagcaata ctccccttta tgtcttttga atacttttca ataaatctgt 9900
ttgtattttc attagttagt aactgagctc agttgccgta atgctaatag cttccaaact 9960
agtgtctctg tctccagtat ctgataaatc ttaggtgttg ctgggacagt tgtcctaaaa 10020
ttaagataaa gcatgaaaat aactgacaca actccattac tggctcctaa ctacttaaac 10080
aatgcattct atcatcacaa atgtgaaaaa ggagttccct cagtggacta accttatctt 10140
ttctcaacac ctttttcttt gcacaatttt ccacacatgc ctacaaaaag tacttatgcg 10200
gccgccataa aagttttgtt actttataga agaaattttg agtttttgtt ttttttaata 10260
aataaataaa cataaataaa ttgtttgttg aatttattat tagtatgtaa gtgtaaatat 10320
aataaaactt aatatctatt caaattaata aataaacctc gatatacaga ccgataaaac 10380
acatgcgtca attttacaca tgattatctt taacgtacgt cacaatatga ttatctttct 10440
agggttaatc tagctgcgtg ttctgcagcg tgtcgagcat cttcatctgc tccatcacgc 10500
tgtaaaacac atttgcaccg cgagtctgcc cgtcctccac gggttcaaaa acgtgaatga 10560
acgaggcgcg ctcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta 10620
cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg 10680
cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg gacgcgccct 10740
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 10800
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 10860
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 10920
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 10980
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 11040
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 11100
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 11160
ttaacaaaat attaacgctt acaatttagg tggcactttt cggggaaatg tgcgcggaac 11220
ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 11280
ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 11340
cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 11400
ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 11460
tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 11520
cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 11580
actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 11640
aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 11700
tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 11760
ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 11820
tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 11880
gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 11940
gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 12000
tattgctgat aaatctggag ccggtgagcg tggttcacgc ggtatcattg cagcactggg 12060
gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 12120
ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 12180
gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 12240
aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 12300
ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 12360
ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 12420
tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 12480
gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 12540
agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 12600
taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 12660
gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 12720
gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 12780
caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 12840
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 12900
tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 12960
acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 13020
ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 13080
gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 13140
tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 13200
agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 13260
tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca 13320
cacaggaaac agctatgacc atgattacgc caagcgcgcc cgccgggtaa ctcacggggt 13380
atccatgtcc atttctgcgg catccagcca ggatacccgt cctcgctgac gtaatatccc 13440
agcgccgcac cgctgtcatt aatctgcaca ccggcacggc agttccggct gtcgccggta 13500
ttgttcgggt tgctgatgcg cttcgggctg accatccgga actgtgtccg gaaaagccgc 13560
gacgaactgg tatcccaggt ggcctgaacg aacagttcac cgttaaaggc gtgcatggcc 13620
acaccttccc gaatcatcat ggtaaacgtg cgttttcgct caacgtcaat gcagcagcag 13680
tcatcctcgg caaactcttt ccatgccgct tcaacctcgc gggaaaaggc acgggcttct 13740
tcctccccga tgcccagata gcgccagctt gggcgatgac tgagccggaa aaaagacccg 13800
acgatatgat cctgatgcag ctagattaac cctagaaaga tagtctgcgt aaaattgacg 13860
catgcattct tgaaatattg ctctctcttt ctaaatagcg cgaatccgtc gctgtgcatt 13920
taggacatct cagtcgccgc ttggagctcc cgtgaggcgt gcttgtcaat gcggtaagtg 13980
tcactgattt tgaactataa cgaccgcgtg agtcaaaatg acgcatgatt atcttttacg 14040
tgacttttaa gatttaactc atacgataat tatattgtta tttcatgttc tacttacgtg 14100
ataacttatt atatatatat tttcttgtta tagatatc 14138
<210> 5
<211> 1069
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtgctgagtc cttttcccat cccacccacc tggagctccc ctcttccagt cctgagccac 60
ttgaactggc ctggtttttg ccatcctgcg ctgccctctc tccggactcg agccactgct 120
gagggcctca ggccagtcca tcctcgtctt gtctctttcg ccctgctctt tccccacctt 180
gagcgctctt aaccagcctg gcccgtgcca cctctactct gccatcgaat gctgccccac 240
tttctcgagt ccgccacttc tcccagcttc accggtaccc actgtttccc ctagtccagg 300
caggtaccac tttccctgag cgtcctcctc ctctctcctg ggcctgtgct gcttcttttc 360
ccgctctctg gcctgggccg tttcttcggc cagcccccga gccttccatg ccctttcctt 420
caggtttctg ctcttcatcc ttggtctctg ccatctgttg ccatgtaagg gtgctctttc 480
ctgagccatc gccctcaagg cgctctgctc ctcaagtgga tgcttccctc gcctggctca 540
cctcctgctc tctctcctgc ccccttcacc tgcgtgccct cctcattctc cctctgtgcc 600
acctctggcc ttgcactgta ggctctctct tggggatgtt tctccttctc cacacacttc 660
tctttcactc tgtcctcttg ctttgtgtgg gcctgcagcg ttaccctttt ttctgggcac 720
actcagagca ccctcctctt tctggttctg ggccacctgt ctgtcctcgg gtcatcttgc 780
tctctctgcc tggatgccct cctgtggctt tgggcagctt ctccctcctt cagagtgcac 840
cgccagttct cctaggcccg gtcacttccc cttcccaggg gacctagagc cctgctaggt 900
cctctctctc cacaacctgg gcccccaaac ctttccaaaa caccttgctt tctgcctcca 960
ttggtcttgt gttccagagc cagagtcact atatgtccca gaaccaggat tccctctggt 1020
tctgagggct tttatcgcat cccctgcctg gctgcagtgg gtctttggg 1069
<210> 6
<211> 260
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gacaggccac agaagagcct ctactcctcc ctctgtcccc gaggctgtct ccctcccagt 60
cttcccagct caggccagtc cccaggcctc tcttccctgc cagagcccgt caggttcggt 120
tactttgggg cccagagagg accctgtgaa ggaagcgtgg gtaggggcac gggaatgggg 180
aggatgcctg aagaggcccc cttagccaga agaggagcag aagaggagca ggtacccaga 240
agaggagcag ttcagggaaa 260
<210> 7
<211> 540
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aaatacccac gtttattggg acaaaagttg ttagggaaaa tggggcctca gagttatgat 60
tcaagtcata attctttcca tttataattt cactcgagac tctgttaact gattccttgt 120
gtgttgtatc ttactcctca gctcacaatt acttttagtt attcacctta actgtatgaa 180
taacagtgga gaaaaggatt ctaccagaat actctaatta tggttttgag tcccctttcc 240
agactgaaga tttttcagtc tttttgatct gaggtgattt ttcagtcttt tcgatctgag 300
gtgacagtct caagctcctc aattcaccca gtctcttgat acttgtccat ttagggccac 360
caaagctact ttgacttcat actagagagt caattaatga ggccattctc tgatggacag 420
gtgaagcagg caaggtgact atattttgac taaacggtag aaaacagcct gagtgttaac 480
agtgtagcct ataaaaccca gagctgccca ccctgatcta aacttccagg aacataagaa 540
<210> 8
<211> 1009
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
agtaggtcac atttcagtaa aacctggctt tgtggattga gcatggtctg tctcttcctg 60
gtacttcatt agtcccctaa gtgggatttg ctgagcaaga ctcctcaatt acagaaatac 120
tccagtttag aattctcgca aaggcttttt gtttccacaa gtagaatcta gaaagcaatc 180
tcaagtaaca acagcagaga cctgaatccc aatccatctt tcctgtgtgt cctcttttac 240
ctccttccct ttcatgttga accaacagtc ctttttcagt ctagaagcta gtacgaaaga 300
aatgtacaga tgtaggtacc aagcaaagcc attagccaat aactggtgag atggagctaa 360
gaggaaataa aagtgttcct aagaatagca cagcagaagc tagatccaca gatcttaaaa 420
caattttggt tgagtaagag tagaggcaaa agaggaagct aataatgcag tttttaggag 480
ctaagagcca gataaagggt aagggcagga ggaagtgcta tctcagctaa cgagatacat 540
gaaacaacgg tggaagtcca gcaggcacaa gatgagttga gaagcaatca gggccagaag 600
gatgtgcaag gcctcaaaat aaaaaagcac agggccacag ggaaccttat ggaaattaaa 660
aggaagagga tgcagtcagg agaggaaaaa atagtgctcc ctcccccatg cccaaggaag 720
cagctgagca gccagtactt gggaagttag tagtaataag ttggtaagag ggagttctgt 780
tcgtggctca atggttaaca aatcagacta gaaaccgtga ggttgcgggt ttgatccctg 840
gccttgctca gtgggttaag gatccggcat tgccgtgacc tgtggtgtag gtcacagacg 900
tggctcagtt cccgcattcc tgtggctctg gtgtaggctg gtggctacag ctctgattag 960
acccctaggc tgggaacctc catatgccct ggaagtggcc gtagaaaag 1009
<210> 9
<211> 872
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ggatggggac tcatgtgaat tttctaaagg tgctatttaa acggggggca cgagtgccgg 60
ctttggacag ggccgctcgc tctccaccct ttcttcttcc ccctcggccg cctctcaccc 120
cctgaggcct ctctcccccc acgacctcct ctctctcctc tgaaaccctc tcctcctcag 180
ctgcatccca ccctcgtggc ctctctctct ctctgtctgt cctgtgtcct ctctcactgg 240
gtttcagagc acagatgccc aaagcacaaa agcagttttc ccctggggtg ggaggaagca 300
agagactttg tacctatttt gtatgtgtat aataatttga gatgttttta attattttga 360
ttgctggaat aaagcatgtg gaaatgaccc aaaccaatct tgcactggcc tcctgatttc 420
cttccttgga gacggaggga gggggagacc tgggggaggg cgcttggggg ggggtgggct 480
ctcttctttc tgcgctcccc ccccccacct ccaacacctt gacgacccct cctgcttccg 540
cttgcctttc tcaggcttta acactttctc ctcgccctct cagcatgcgc atgcgcgtgc 600
ctctacctcc cccgcacatc ctggcctgcc caccctgaat ggcctggccc agcgatgcca 660
ccaactctct cgctccgtcc acggctgggg aggggggcac tctgcagggt tggggggcac 720
tgggaggctg ggttgggtga gggaggggtg cctgggcccc caccccccag caagttctct 780
ccctaggcga actggagggt cgtctggcct cttgagcctt gttgctggct ctgagctcta 840
ccaagagagt gaccagcagg accgcaccat ca 872
<210> 10
<211> 727
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gtggttgctg agactgcgtg ggggcccaag gagacctgga gaaaggaatg cttcctgctc 60
cttcttctgg ggccccagga gagccttccc agggccttgg agaggtgctg tccagggact 120
aaccctgtgc tctaggaagg ctgcaggccc tgaccagctg ggcaggtcct gggtccctcc 180
tggccttcta agttccccaa acatgagacc tctgggtgtg gggtggcctg gggaggtcat 240
tttgcccagg ccctacctcc tgcccattcc taaccctttt taaaaatctg tgcgtcctct 300
tcttccttct tctccctccc ttcccttttc gctcaccctc tgctgctggc ctgagagccg 360
gaggccccca gggggaaggc gactggtctc ctccccagtc tcagggaagg gagacagaga 420
atccaggaag ccagaactca gcagacgaag cacccaggga cctagagatg ggttgaaaag 480
ttgacagctg tcccacctgc ctcccaaggt ctcagggcct aaacctccaa ggcaggaaag 540
gcccctgtcc ctccctgggg tccatagaaa gagggacaag tctgcacgga ccatttgctg 600
taatattaac accttggctg tcattaggta gtcttggctg ttaattatgt cctgtgataa 660
tgtattatta gcacgccgac cacatagggt agggaactgc agctagtaaa caaaagtttg 720
ttcctat 727
<210> 11
<211> 10074
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ggcgcgccgg atggggactc atgtgaattt tctaaaggtg ctatttaaac ggggggcacg 60
agtgccggct ttggacaggg ccgctcgctc tccacccttt cttcttcccc ctcggccgcc 120
tctcaccccc tgaggcctct ctccccccac gacctcctct ctctcctctg aaaccctctc 180
ctcctcagct gcatcccacc ctcgtggcct ctctctctct ctgtctgtcc tgtgtcctct 240
ctcactgggt ttcagagcac agatgcccaa agcacaaaag cagttttccc ctggggtggg 300
aggaagcaag agactttgta cctattttgt atgtgtataa taatttgaga tgtttttaat 360
tattttgatt gctggaataa agcatgtgga aatgacccaa accaatcttg cactggcctc 420
ctgatttcct tccttggaga cggagggagg gggagacctg ggggagggcg cttggggggg 480
ggtgggctct cttctttctg cgctcccccc ccccacctcc aacaccttga cgacccctcc 540
tgcttccgct tgcctttctc aggctttaac actttctcct cgccctctca gcatgcgcat 600
gcgcgtgcct ctacctcccc cgcacatcct ggcctgccca ccctgaatgg cctggcccag 660
cgatgccacc aactctctcg ctccgtccac ggctggggag gggggcactc tgcagggttg 720
gggggcactg ggaggctggg ttgggtgagg gaggggtgcc tgggccccca ccccccagca 780
agttctctcc ctaggcgaac tggagggtcg tctggcctct tgagccttgt tgctggctct 840
gagctctacc aagagagtga ccagcaggac cgcaccatca cgcgccccag acccgggcct 900
ggggggcaag tcggggggcg gggggaggtc gggcagggtc ccctgggagg atggggacgt 960
gctgtgcccc tagcggccac cagagggcac caggacacca ctgcggtcgg ctcagcggct 1020
cctgccctgg tcagggggcg ccaggtcctg cccctcctgg ggagggcggg gggcgagaag 1080
ggcgattagt gcaagtgggt tttaggacca ggatgaggcg gggtgggggt gcctacctga 1140
cgaccgaccc cgacccactg gacaagcacc caacccccat tccccaaatt gcgcatcccc 1200
tatcagagag ggggagggga aacaggatgc ggcgaggcgc gtgcgcactg ccagcttcag 1260
caccgcggac agtgccttcg cccccgcctg gcggcgcgcg ccaccgccgc ctcagcactg 1320
aaggcgcgct gacgtcactc gccggtcccc cgcaaactcc ccttcccggc caccttggtc 1380
gcgtccgcgc cgccgccggc ccagccggac cgcaccacgc gaggcgcgag ataggggggc 1440
acgggcgcga ccatctgcgc tgcggcgccg gcgactcagc gctgcctcag tctgcggtgg 1500
gcagcggagg agtcgtgtcg tgcctgagag cgcagtcgac tctagagctt ggtaccgcgg 1560
gcccgggatc caccggtcgc caccatggat gttttcatga aagggctgag taaagccaag 1620
gagggggtgg tggccgctgc agaaaaaact aaacaagggg tggcagaagc cgcgggtaaa 1680
acaaaggaag gcgtgctgta tgtgggctca aaaaccaaag aaggggtagt acatggggtg 1740
acgaccgtgg ctgagaagac caaagaacag gtcaccaatg ttggtggagc tgtggtgacc 1800
ggggtcacag ccgtggctca gaaaactgtt gaaggggctg gctcgattgc tgccgccacc 1860
ggcttcgtga agaaggatca gcttggaaag aatgaagaag gagcccccca agagggcatt 1920
ttggaagata tgcccgtgga tcctgataat gaggcctacg agatgccttc agaggaagga 1980
taccaggact atgaaccaga agcaggctcc ggtgccacaa actttagcct gttgaagcag 2040
gcgggggatg tggaggaaaa tcctggcccc atggatgtgt tcatgaaagg cctgtcaaag 2100
gctaaagagg gggttgttgc agcagcagaa aagaccaagc agggcgtcgc tgaagccgct 2160
gggaaaacta aagaaggcgt tctttacgta ggatccaaaa caaaggaagg ggtagttcat 2220
ggagtcacca cagtggctga gaaaactaag gagcaggtga ctaatgtagg cggcgcggtt 2280
gtcaccggtg tgacagctgt agcccagaag acagtggaag gagctggcag tatagcagcc 2340
gcaacaggat ttgtaaagaa agatcagctc ggcaagaacg aagagggcgc tccccaggaa 2400
gggatccttg aggacatgcc agtggacccc gacaacgagg cgtacgaaat gccctccgag 2460
gagggctatc aggactacga gcctgaagcc ggctctgggg agggaagggg ctccctactc 2520
acctgtgggg acgtagaaga gaacccaggc ccaatggacg tgtttatgaa gggcctcagc 2580
aaagccaagg agggcgtggt cgcggccgct gagaagacga agcaaggggt cgcagaggct 2640
gcgggtaaga caaaagaggg ggtcctctac gtgggtagca aaaccaagga gggagtcgtg 2700
cacggagtga ccacggtggc cgagaagacc aaggaacaag tgacaaatgt tggtggggca 2760
gtggtgactg gagttactgc cgtggcgcaa aagacagttg aaggggccgg aagtattgca 2820
gccgcaacag gtttcgtcaa aaaagaccag ctgggcaaaa acgaggaggg ggctccacag 2880
gagggcatct tggaggacat gcctgtggat ccggataatg aagcttatga gatgccgtct 2940
gaggagggct accaagacta cgagcccgag gcagggagcg gccagtgcac caactacgcc 3000
ctgctgaagc tggcaggtga cgtggagagc aaccccgggc ccatggacgt cttcatgaag 3060
ggactgtcca aggcaaagga aggtgtcgtt gctgctgccg agaaaaccaa acagggagta 3120
gccgaggccg cggggaagac taaggaggga gtcctctatg tcggatctaa aaccaaggag 3180
ggagtggtcc acggcgtgac gacggtagca gaaaagacaa aagagcaggt taccaacgtg 3240
ggaggagccg tagtcacggg agtcactgcc gtcgcccaga agactgtgga aggagctggt 3300
agcatcgccg ccgccactgg ctttgtgaaa aaggaccagt taggtaaaaa tgaagagggc 3360
gcgcctcagg agggtatctt agaagacatg cctgttgacc cagataacga ggcctatgag 3420
atgccgtctg aagaggggta ccaggattat gagccagagg catgaagcgg ccgctcgagc 3480
atgcatctag agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg 3540
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 3600
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 3660
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 3720
cggtgggctc tatggtctga ggcggaaaga accagctgcc ttaatataac ttcgtataat 3780
gtatgctata cgaagttatt aggtctgaag aggagtttac gtccagccaa ttctgtggaa 3840
tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 3900
catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag 3960
aagtatgcaa agcatgcatc tcaattagtc agcaaccata gtcccgcccc taactccgcc 4020
catcccgccc ctaactccgc ccagttccgc ccattctccg ccccatggct gactaatttt 4080
ttttatttat gcagaggccg aggccgcctc tgcctctgag ctattccaga agtagtgagg 4140
aggctttttt ggaggcctag gcttttgcaa aaagctcccg ggagcttgta tatccatttt 4200
cggcggccgc gccaccatga ccgagtacaa gcccacggtg cgcctcgcca cccgcgacga 4260
cgtccccagg gccgtacgca ccctcgccgc cgcgttcgcc gactaccccg ccacgcgcca 4320
caccgtcgat ccggaccgcc acatcgagcg ggtcaccgag ctgcaagaac tcttcctcac 4380
gcgcgtcggg ctcgacatcg gcaaggtgtg ggtcgcggac gacggcgccg cggtggcggt 4440
ctggaccacg ccggagagcg tcgaagcggg ggcggtgttc gccgagatcg gcccgcgcat 4500
ggccgagttg agcggttccc ggctggccgc gcagcaacag atggaaggcc tcctggcgcc 4560
gcaccggccc aaggagcccg cgtggttcct ggccaccgtc ggagtctcgc ccgaccacca 4620
gggcaagggt ctgggcagcg ccgtcgtgct ccccggagtg gaggcggccg agcgcgccgg 4680
ggtgcccgcc ttcctggaga cctccgcgcc ccgcaacctc cccttctacg agcggctcgg 4740
cttcaccgtc accgccgacg tcgaggtgcc cgaaggaccg cgcacctggt gcatgacccg 4800
caagcccggt gcctgagaat tcgcgggact ctggggttcg aaatgaccga ccaagcgacg 4860
cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4980
ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 5040
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 5100
ctcatcaatg tatcttatca tgtctgtata ccgctcgact agagcttgcg gaacccttaa 5160
tataacttcg tataatgtat gctatacgaa gttattaggt ccgctggcca tctacgagcc 5220
aaagactttc aaatctttgg ctgccttggc cagtaggagg cgacacgaag gatttgctgc 5280
tgccttgggg gatgggaagg aacctgaagg cattttttcc agagtggtgc agtaccactg 5340
aggactgttg ctgtattgat taggaaaaga gacagagtaa tttgcagttt gtttgattta 5400
tactgtggtt gctgagactg cgtgggggcc caaggagacc tggagaaagg aatgcttcct 5460
gctccttctt ctggggcccc aggagagcct tcccagggcc ttggagaggt gctgtccagg 5520
gactaaccct gtgctctagg aaggctgcag gccctgacca gctgggcagg tcctgggtcc 5580
ctcctggcct tctaagttcc ccaaacatga gacctctggg tgtggggtgg cctggggagg 5640
tcattttgcc caggccctac ctcctgccca ttcctaaccc tttttaaaaa tctgtgcgtc 5700
ctcttcttcc ttcttctccc tcccttccct tttcgctcac cctctgctgc tggcctgaga 5760
gccggaggcc cccaggggga aggcgactgg tctcctcccc agtctcaggg aagggagaca 5820
gagaatccag gaagccagaa ctcagcagac gaagcaccca gggacctaga gatgggttga 5880
aaagttgaca gctgtcccac ctgcctccca aggtctcagg gcctaaacct ccaaggcagg 5940
aaaggcccct gtccctccct ggggtccata gaaagaggga caagtctgca cggaccattt 6000
gctgtaatat taacaccttg gctgtcatta ggtagtcttg gctgttaatt atgtcctgtg 6060
ataatgtatt attagcacgc cgaccacata gggtagggaa ctgcagctag taaacaaaag 6120
tttgttccta tatgcggccg ccataaaagt tttgttactt tatagaagaa attttgagtt 6180
tttgtttttt ttaataaata aataaacata aataaattgt ttgttgaatt tattattagt 6240
atgtaagtgt aaatataata aaacttaata tctattcaaa ttaataaata aacctcgata 6300
tacagaccga taaaacacat gcgtcaattt tacacatgat tatctttaac gtacgtcaca 6360
atatgattat ctttctaggg ttaatctagc tgcgtgttct gcagcgtgtc gagcatcttc 6420
atctgctcca tcacgctgta aaacacattt gcaccgcgag tctgcccgtc ctccacgggt 6480
tcaaaaacgt gaatgaacga ggcgcgctca ctggccgtcg ttttacaacg tcgtgactgg 6540
gaaaaccctg gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg 6600
cgtaatagcg aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc 6660
gaatgggacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 6720
gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 6780
ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc 6840
cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 6900
agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 6960
aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 7020
gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa 7080
aaatttaacg cgaattttaa caaaatatta acgcttacaa tttaggtggc acttttcggg 7140
gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc 7200
tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 7260
ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 7320
ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 7380
gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 7440
gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg 7500
acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 7560
actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 7620
ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 7680
cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 7740
gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 7800
caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 7860
aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 7920
ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggt tcacgcggta 7980
tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 8040
ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 8100
ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 8160
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 8220
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 8280
cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 8340
taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 8400
gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 8460
acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 8520
ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 8580
ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 8640
cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 8700
aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 8760
gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 8820
gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 8880
gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 8940
ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 9000
ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 9060
caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca 9120
ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt tagctcactc 9180
attaggcacc ccaggcttta cactttatgc ttccggctcg tatgttgtgt ggaattgtga 9240
gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag cgcgcccgcc 9300
gggtaactca cggggtatcc atgtccattt ctgcggcatc cagccaggat acccgtcctc 9360
gctgacgtaa tatcccagcg ccgcaccgct gtcattaatc tgcacaccgg cacggcagtt 9420
ccggctgtcg ccggtattgt tcgggttgct gatgcgcttc gggctgacca tccggaactg 9480
tgtccggaaa agccgcgacg aactggtatc ccaggtggcc tgaacgaaca gttcaccgtt 9540
aaaggcgtgc atggccacac cttcccgaat catcatggta aacgtgcgtt ttcgctcaac 9600
gtcaatgcag cagcagtcat cctcggcaaa ctctttccat gccgcttcaa cctcgcggga 9660
aaaggcacgg gcttcttcct ccccgatgcc cagatagcgc cagcttgggc gatgactgag 9720
ccggaaaaaa gacccgacga tatgatcctg atgcagctag attaacccta gaaagatagt 9780
ctgcgtaaaa ttgacgcatg cattcttgaa atattgctct ctctttctaa atagcgcgaa 9840
tccgtcgctg tgcatttagg acatctcagt cgccgcttgg agctcccgtg aggcgtgctt 9900
gtcaatgcgg taagtgtcac tgattttgaa ctataacgac cgcgtgagtc aaaatgacgc 9960
atgattatct tttacgtgac ttttaagatt taactcatac gataattata ttgttatttc 10020
atgttctact tacgtgataa cttattatat atatattttc ttgttataga tatc 10074
<210> 12
<211> 140
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 12
Met Asp Val Phe Met Lys Gly Leu Ser Lys Ala Lys Glu Gly Val Val
1 5 10 15
Ala Ala Ala Glu Lys Thr Lys Gln Gly Val Ala Glu Ala Ala Gly Lys
20 25 30
Thr Lys Glu Gly Val Leu Tyr Val Gly Ser Lys Thr Lys Glu Gly Val
35 40 45
Val His Gly Val Thr Thr Val Ala Glu Lys Thr Lys Glu Gln Val Thr
50 55 60
Asn Val Gly Gly Ala Val Val Thr Gly Val Thr Ala Val Ala Gln Lys
65 70 75 80
Thr Val Glu Gly Ala Gly Ser Ile Ala Ala Ala Thr Gly Phe Val Lys
85 90 95
Lys Asp Gln Leu Gly Lys Asn Glu Glu Gly Ala Pro Gln Glu Gly Ile
100 105 110
Leu Glu Asp Met Pro Val Asp Pro Asp Asn Glu Ala Tyr Glu Met Pro
115 120 125
Ser Glu Glu Gly Tyr Gln Asp Tyr Glu Pro Glu Ala
130 135 140
<210> 13
<211> 100
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 13
gaaggagcaa acugacaugg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 14
<211> 100
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 14
ugcagugggu cuuuggggac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 15
<211> 100
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 15
uuccaggaac auaagaaagu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 16
<211> 100
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 16
gcagucucag caaccacuga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

Claims (8)

1.一种制备重组细胞的方法,包括如下步骤:将DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因位点中,得到重组细胞;所述DNA分子甲中具有人源SNCA基因;
所述“将DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因位点中”的实现方式为:将具有DNA分子乙的重组质粒与两个辅助质粒共同导入猪细胞;所述DNA分子乙中,具有所述DNA分子甲且在所述DNA分子甲的上游具有上游同源臂且在所述DNA分子甲的下游具有下游同源臂,所述上游同源臂和所述下游同源臂用于将所述DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因位点中;
所述人源SNCA基因编码如SEQ ID NO:12所示的蛋白质;
所述上游同源臂如SEQ ID NO:9所示,所述下游同源臂如SEQ ID NO:10所示;所述两个辅助质粒为sgRNA质粒和质粒pKG-GE3;所述sgRNA质粒转录得到特异sgRNA,其靶序列结合区如SEQ ID NO:16中第1-20位核苷酸所示;所述质粒pKG-GE3如SEQ ID NO:2所示;
所述DNA分子甲中具有人源SNCA基因表达盒;人源SNCA基因表达盒中,启动子为人源神经组织特异性表达启动子,由同一启动子驱动4个拷贝的人源SNCA基因表达。
2.如权利要求1所述的方法,其特征在于:人源SNCA基因表达盒中,所述4个拷贝的人源SNCA基因存在于同一编码框,它们之间由自剪接肽的编码基因间隔。
3.一种试剂盒,包括具有DNA分子乙的重组质粒、sgRNA质粒和质粒pKG-GE3;
所述DNA分子乙中,具有DNA分子甲且在所述DNA分子甲的上游具有上游同源臂且在所述DNA分子甲的下游具有下游同源臂,所述上游同源臂和所述下游同源臂用于将所述DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因位点中;
所述DNA分子甲中具有人源SNCA基因;所述人源SNCA基因编码如SEQ ID NO:12所示的蛋白质;所述上游同源臂如SEQ ID NO:9所示,所述下游同源臂如SEQ ID NO:10所示;
所述sgRNA质粒转录得到特异sgRNA,其靶序列结合区如SEQ ID NO:16中第1-20位核苷酸所示;
所述质粒pKG-GE3如SEQ ID NO:2所示;
所述DNA分子甲中具有人源SNCA基因表达盒;人源SNCA基因表达盒中,启动子为人源神经组织特异性表达启动子,由同一启动子驱动4个拷贝的人源SNCA基因表达。
4.如权利要求3所述的试剂盒,其特征在于:人源SNCA基因表达盒中,所述4个拷贝的人源SNCA基因存在于同一编码框,它们之间由自剪接肽的编码基因间隔。
5.具有DNA分子乙的重组质粒、sgRNA质粒和质粒pKG-GE3在制备试剂盒中的应用;
所述DNA分子乙中,具有DNA分子甲且在所述DNA分子甲的上游具有上游同源臂且在所述DNA分子甲的下游具有下游同源臂,所述上游同源臂和所述下游同源臂用于将所述DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因位点中;
所述DNA分子甲中具有人源SNCA基因;所述人源SNCA基因编码如SEQ ID NO:12所示的蛋白质;所述上游同源臂如SEQ ID NO:9所示,所述下游同源臂如SEQ ID NO:10所示;
所述sgRNA质粒转录得到特异sgRNA,其靶序列结合区如SEQ ID NO:16中第1-20位核苷酸所示;
所述质粒pKG-GE3如SEQ ID NO:2所示;
所述DNA分子甲中具有人源SNCA基因表达盒;人源SNCA基因表达盒中,启动子为人源神经组织特异性表达启动子,由同一启动子驱动4个拷贝的人源SNCA基因表达;
所述试剂盒的用途为如下(a)或(b)或(c):(a)制备重组细胞;(b)制备帕金森病模型猪;(c)制备帕金森病细胞模型或帕金森病组织模型或帕金森病器官模型。
6.如权利要求5所述的应用,其特征在于:人源SNCA基因表达盒中,所述4个拷贝的人源SNCA基因存在于同一编码框,它们之间由自剪接肽的编码基因间隔。
7.权利要求3或4所述的试剂盒的应用,为如下(a)或(b)或(c):(a)制备重组细胞;(b)制备帕金森病模型猪;(c)制备帕金森病细胞模型或帕金森病组织模型或帕金森病器官模型。
8.权利要求1或2所述方法制备得到的重组细胞在制备帕金森病模型猪中的应用。
CN202110214796.0A 2021-02-26 2021-02-26 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用 Active CN114958762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110214796.0A CN114958762B (zh) 2021-02-26 2021-02-26 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110214796.0A CN114958762B (zh) 2021-02-26 2021-02-26 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用

Publications (2)

Publication Number Publication Date
CN114958762A CN114958762A (zh) 2022-08-30
CN114958762B true CN114958762B (zh) 2024-04-23

Family

ID=82973245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110214796.0A Active CN114958762B (zh) 2021-02-26 2021-02-26 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用

Country Status (1)

Country Link
CN (1) CN114958762B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114774468B (zh) * 2022-04-20 2022-12-20 温氏食品集团股份有限公司 一种等位基因分子标记及抗蓝耳病猪群体组建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101617051A (zh) * 2006-05-01 2009-12-30 奥胡斯大学 动物模型以及用于产生动物模型的方法
KR20190053649A (ko) * 2017-11-10 2019-05-20 대한민국(농촌진흥청장) 복합 파킨슨 유전자를 포함하는 벡터 및 이를 이용한 파킨슨병 질환 모델

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210047623A1 (en) * 2018-01-30 2021-02-18 Parkinson's Institute Crispr knock-out of the alpha-synuclein triplication model of parkinson's disease

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101617051A (zh) * 2006-05-01 2009-12-30 奥胡斯大学 动物模型以及用于产生动物模型的方法
KR20190053649A (ko) * 2017-11-10 2019-05-20 대한민국(농촌진흥청장) 복합 파킨슨 유전자를 포함하는 벡터 및 이를 이용한 파킨슨병 질환 모델

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
梁德生等.《基因组拷贝数变异与基因组病》.西安:西安交通大学出版社,2016,第28页. *
猪转基因友好整合位点的筛选与应用;马林媛;《中国博士学位论文全文数据库 农业科技辑》;第6-24 页、第3.1.3节 *

Also Published As

Publication number Publication date
CN114958762A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN112779291B (zh) 构建瘦肉率高、生长快、繁殖力高且抗系列流行病的优质猪核移植供体细胞的方法及其应用
CN112779292B (zh) 构建瘦肉率高、生长快且抗蓝耳病和系列腹泻病的优质猪核移植供体细胞的方法及其应用
CN112877362A (zh) 构建高繁殖力、抗蓝耳病和系列腹泻病的优质猪核移植供体细胞的基因编辑系统及其应用
CN112522260A (zh) Crispr系统及其在制备ttn基因突变的扩张型心肌病克隆猪核供体细胞中的应用
CN114958762B (zh) 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用
CN114958760B (zh) 一种构建阿尔兹海默症模型猪的基因编辑技术及其应用
CN112522264B (zh) 一种导致先天性耳聋的CRISPR/Cas9系统及其在制备模型猪核供体细胞中的应用
CN113046388B (zh) 用于构建双基因联合敲除的动脉粥样硬化猪核移植供体细胞的crispr系统及其应用
CN112522313B (zh) 用于构建TPH2基因突变的抑郁症克隆猪核供体细胞的CRISPR/Cas9系统
CN114958759B (zh) 一种肌萎缩侧索硬化症模型猪的构建方法及应用
CN112522261B (zh) 用于制备lmna基因突变的扩张型心肌病克隆猪核供体细胞的crispr系统及其应用
CN114958761B (zh) 一种胃癌模型猪的构建方法及应用
CN112680453B (zh) Crispr系统及其在构建stxbp1突变的癫痫性脑病克隆猪核供体细胞中的应用
CN112608941B (zh) 用于构建mc4r基因突变的肥胖症猪核移植供体细胞的crispr系统及其应用
CN112795566B (zh) 用于构建骨质疏松症克隆猪核供体细胞系的opg基因编辑系统及其应用
CN113584078B (zh) 用于双靶标基因编辑的crispr系统及其在构建抑郁症猪核移植供体细胞中的应用
CN112899306B (zh) Crispr系统及其在构建gabrg2基因突变的克隆猪核供体细胞中的应用
CN112522311B (zh) 用于adcy3基因编辑的crispr系统及其在构建肥胖症猪核移植供体细胞中应用
CN112813101B (zh) 一种构建瘦肉率高、生长快的优质猪核移植供体细胞的基因编辑系统及其应用
CN112575033B (zh) Crispr系统及其在构建scn1a基因突变的癫痫性脑病克隆猪核供体细胞中的应用
CN112522256B (zh) CRISPR/Cas9系统及其在构建抗肌萎缩蛋白基因缺陷的猪源重组细胞中的应用
CN112522255B (zh) CRISPR/Cas9系统及其在构建胰岛素受体底物基因缺陷的猪源重组细胞中的应用
CN112522202B (zh) 制备addi四个基因联合敲除的重症免疫缺陷猪源重组细胞的方法及其专用试剂盒
CN112522258B (zh) Il2rg基因和ada基因联合敲除的重组细胞及其在制备免疫缺陷猪模型中的应用
CN112680444B (zh) 用于oca2基因突变的crispr系统及其在构建白化病克隆猪核供体细胞中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant