CN115161335A - 用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用 - Google Patents

用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用 Download PDF

Info

Publication number
CN115161335A
CN115161335A CN202110361873.5A CN202110361873A CN115161335A CN 115161335 A CN115161335 A CN 115161335A CN 202110361873 A CN202110361873 A CN 202110361873A CN 115161335 A CN115161335 A CN 115161335A
Authority
CN
China
Prior art keywords
tardbp
gene
protein
grna
editing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110361873.5A
Other languages
English (en)
Other versions
CN115161335B (zh
Inventor
牛冬
汪滔
陶裴裴
曾为俊
刘瑜
王磊
程锐
赵泽英
马翔
黄彩云
段星
刘璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Qizhen Genetic Engineering Co Ltd
Original Assignee
Nanjing Qizhen Genetic Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Qizhen Genetic Engineering Co Ltd filed Critical Nanjing Qizhen Genetic Engineering Co Ltd
Priority to CN202110361873.5A priority Critical patent/CN115161335B/zh
Publication of CN115161335A publication Critical patent/CN115161335A/zh
Application granted granted Critical
Publication of CN115161335B publication Critical patent/CN115161335B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • C12N15/72Expression systems using regulatory sequences derived from the lac-operon
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4707Muscular dystrophy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0652Cells of skeletal and connective tissues; Mesenchyme
    • C12N5/0656Adult fibroblasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/108Swine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • A01K2267/0318Animal model for neurodegenerative disease, e.g. non- Alzheimer's
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/35Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • Environmental Sciences (AREA)
  • Plant Pathology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Rheumatology (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统及其应用。该基因编辑系统包含按照本发明所述方法制备的Cas9蛋白,针对TARDBP基因的gRNA以及含有TARDBP突变位点的单链Donor DNA。采用本发明构建并表达的Cas9高效蛋白联合体外转录的gRNA进行基因编辑,并对Cas9和gRNA的最佳用量配比进行了优化,配合合成的ssODN作为Donor DNA,最终获得靶标位点精确点突变的单细胞克隆比率高达22.5%,远高于常规的点突变效率(<5%)。所构建的TARDBP基因突变猪细胞可用于进行体细胞克隆,生产肌萎缩侧索硬化症模型猪。

Description

用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基 因编辑系统及其应用
技术领域
本发明属于基因编辑技术领域,具体涉及CRISPR/Cas9系统及ssODN同源重组技术在构建TARDBP基因突变的肌萎缩侧索硬化症模型猪核移植供体细胞中的应用。
背景技术:
肌萎缩性脊髓侧索硬化症,又名肌萎缩侧索硬化症(Amyotrophic LateralSclerosis,ALS),是运动神经元疾病(Motor Neuron Disease,MND)的主要类型,俗称“渐冻人症”,其特征是脑和脊髓中的运动神经细胞(神经元)进行性退化。运动神经元控制着人体运动、说话、吞咽和呼吸时的肌肉活动,若其功能发生障碍,肌肉将逐渐萎缩退化,表现为肌肉逐渐无力以至瘫痪,说话、吞咽和呼吸功能减退,直至呼吸衰竭死亡。此病症未侵犯人体的感觉神经,所以并不影响患者的智力、记忆或感觉。病情的发展一般较迅速,从出现症状开始,平均寿命为3-5年,但因个体异质性波动较大。“渐冻人症”被世界卫生组织列为与艾滋病、癌症等并列的5大绝症之一,发病率大约为十万分之三,属于世界罕见病。
“渐冻人”协会国际联盟在2000年于丹麦举行的国际病友大会上确定每年的6月21日为“世界渐冻人日”,各地在这一天举行各类认识运动神经元疾病的相关活动,希望通过这种活动,引起人们对患有这种可怕疾病患者的重视和社会关爱。目前,ALS的病理生理机制尚不完全清楚,国内也尚无准确的ALS发病率的流行病学报道,但有关ALS的遗传因素影响已经得到广泛认可。约90%以上的ALS病例为散发性(sporadic ALS,SALS),余下病例为家族遗传性(familial ALS,FALS),已经确定超过30种基因和FALS有关。其中,最常见和研究最多的基因为ALS1(SOD1)、ALS10(TARDBP)、ALS6(FUS)、FTDALS1(C9orf72)等,它们和ALS的某些特定临床特征包括起病年龄、部位及生存期有关。
TDP-43是一个多功能的DNA和RNA结合蛋白,由TARDBP基因编码,在细胞内的RNA转录、选择性剪接及mRNA稳定性调节等过程中发挥功能。正常情况下,TDP-43在细胞应激环境下能参与形成应激颗粒,以应对细胞环境变化。应激颗粒是通过可逆的液液相分离聚集成的无膜结构,但是错误的聚集会导致不可逆的淀粉样蛋白沉淀。TDP-43蛋白在ALS和FTLD(frontotemporal lobar degeneration,额颞叶变性运动神经元疾病)患者细胞如神经元和神经胶质细胞内以淀粉样形式存在,已成为此两种疾病的主要病理标志性蛋白之一,另外在20-50%的阿尔茨海默病(Alzheimer’s disease,AD)患者中也发现了该蛋白的异常变化。已有研究发现在ALS病例中,约4%的FALS和1.5%的SALS是由TARDBP基因突变引起的,已鉴定出40多个TARDBP基因的突变,它们多集中于该蛋白C端的甘氨酸富集区,然而关于TDP-43蛋白如何造成神经元细胞死亡及其引起神经退行性疾病的细胞和分子机制尚不清楚。
研究由TARDBP突变导致ALS或其他神经退行性疾病发生发展的细胞和分子机制及研发相应的药物均需要在动物模型的基础上进行,目前常用的动物模型为小鼠模型,然而小鼠不论从体型、器官大小、生理、病理等方面都与人相差巨大,不能真实地模拟人类正常的生理、病理状态。而猪作为大动物,是人类长期以来主要的肉食供应动物,其体型大小和生理功能与人类近似,易于大规模繁殖饲养,而且在伦理道德及动物保护等方面要求较低,是理想的人类疾病模型动物。
基因编辑是近年来不断取得重大发展的一种生物技术,其包括从基于同源重组的基因编辑到基于核酸酶的ZFN、TALEN、CRISPR/Cas9等编辑技术,其中CRISPR/Cas9技术是当前最先进的基因编辑技术。目前,基因编辑技术被越来越多地应用到动物模型的制作上。
同源重组(HDR)是通过序列同源性交换DNA序列信息:即修复模板中包含所需插入片段,修复模板的两端则是与插入位点附近具有序列同源性的重组臂。过去通常使用双链DNA(dsDNA)作为修复模板,但最近的研究揭示了单链寡核苷酸脱氧核苷酸(ssODN)作为HDR供体模板的优越性。首先,ssODN作为供体模板比dsDNA模板的插入位点特异性高,dsDNA模板容易产生随机插入。其次,ssODN对同源重组臂的长度要求比dsDNA模板更短,单侧30~60个碱基的重组臂设计可以获得高效且稳定的HDR,相比类似的dsDNA模板,其提供的插入效率更高。第三,dsDNA容易被NHEJ修复途径合并,从而导致同源臂的复制或者dsDNA模板的部分整合,而ssODN就不易产生这种现象。另外,dsDNAs对培养的细胞是有害的,线型或者质粒dsDNAs的转染效率较低,并使细胞产生不良反应,而ssODN模板在这些方面就更有优势。
因此,本发明采用CRISPR/Cas9技术联合ssODN同源重组技术进行了TARDBP基因的点突变基因编辑,模拟ALS的自然发病遗传特征,并获得了TARDBP基因精确点突变的单细胞克隆,为后期通过体细胞核移植动物克隆技术培育ALS疾病模型猪奠定了基础。该模型猪将为研究ALS的发病机制及药物研发提供有力的实验工具。
发明内容
本发明的目的是提供一种原核Ca9高效表达载体pKG-GE4及其构建方法和应用。
本发明的另一目的是提供一种用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统及其应用。
本发明的又一目的是提供一种重组细胞及其应用。
本发明的目的可通过以下技术方案实现:
一种原核Ca9高效表达载体pKG-GE4,序列如SEQ ID NO.1所示。
具体的,质粒pKG-GE4的主要元件有:
T7启动子(T7 Promoter),Lac操纵子(Lac Operatore),核糖体结合位点(RBS),碱性磷酸酶(phoA)信号肽(phoA:SP),硫氧还原蛋白(TrxA),His标签蛋白,肠激酶酶切位点(EK),核定位信号(SV40NLS),Cas9蛋白(spCas9),核定位信号(nucleoplasmin NLS),T7终止子(T7 terminator),载体骨架(包括Amp抗性元件、ori复制起始子及LacI组成型表达元件等)。
质粒pKG-GE4中,具有特异融合基因;所述特异融合基因编码特异融合蛋白;
所述特异融合蛋白自N端至C端依次包括如下元件:碱性磷酸酶(phoA)信号肽(phoA:SP),硫氧还原蛋白(TrxA),His标签蛋白,肠激酶酶切位点(EK),核定位信号(SV40NLS),Cas9蛋白(spCas9),核定位信号(nucleoplasmin NLS)。
质粒pKG-GE4中,由T7启动子启动所述特异融合基因的表达;
质粒pKG-GE4中,由Lac操纵子控制所述特异融合基因的诱导表达。
质粒pKG-GE4中,所述特异融合基因下游具有T7终止子序列元件。
质粒pKG-GE4中,依次具有如下元件:T7启动子(T7 Promoter),Lac操纵子(LacOperator),核糖体结合位点(RBS)、所述特异融合基因、T7终止子序列元件。
所述特异融合基因表达特异融合蛋白。
所述特异融合蛋白中,用于目的蛋白分泌表达的信号肽可选自大肠杆菌碱性磷酸酶(phoA)信号肽、金黄色葡萄球菌蛋白A信号肽、大肠杆菌外膜蛋白(ompa)信号肽或任何其他原核基因的信号肽,优选为碱性磷酸酶(phoA)信号肽。
所述特异融合蛋白中,增加目的蛋白可溶性的分子伴侣融合蛋白可为任何帮助形成二硫键的蛋白,进一步优选为硫氧还原蛋白。
所述特异融合蛋白中,用于去除融合标签,从融合蛋白中获取天然形式Cas9蛋白的内切蛋白酶识别位点可选自肠激酶(Enterokinase)、因子Xa(Factor Xa),凝血酶(Thrombin)、TEV蛋白酶(TEV protease)、HRV 3C蛋白酶(HRV 3C protease)、WELQut蛋白酶或任何其他内切蛋白酶的识别位点,进一步优选为肠激酶识别位点。
所述特异融合蛋白中,便于目的蛋白纯化的蛋白标签可选自His标签、GST标签、Flag标签、HA标签、c-Myc标签或其他任何蛋白标签,进一步优选为His蛋白标签。
所述特异融合蛋白中,引导Cas9蛋白进入细胞核的核定位信号可为任何核定位信号,进一步优选为SV40核定位信号和/或nucleoplasmin核定位信号。
所述特异融合蛋白中,cas蛋白可选自Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9、CaslO、Csyl、Csy2、Csy3、Csy4、Csel、Cse2、Cse3、Cse4、Cse5e、Cscl、Csc2、Csa5、Csnl、Csn2、Csml、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csx17、Csx14、CsxlO、Csx16、CsaX、Csx3、Csxl、CsxlS、Csfl、Csf2、CsO、Csf4、Csdl、Csd2、Cstl、Cst2、Cshl、Csh2、Csal、Csa2、Csa3、Csa4、Csa5、C2cl、C2c2、C2c3、Cpfl、CARF、DinG、其同源物或其修饰形式,优选为Cas9,进一步优选为spCas9。
特异融合基因具体如SEQ ID NO.1中第5209-9849位核苷酸所示。
T7启动子如SEQ ID NO.1中第5121-5139位核苷酸所示。
Lac操纵子如SEQ ID NO.1中第5140-5164位核苷酸所示。
RBS如SEQ ID NO.1中第5178-5201位核苷酸所示
T7终止子如SEQ ID NO.1第9902-9949位核苷酸所示。
经过上述各项优化设计及改造,pKG-GE4载体所表达得到的Cas9蛋白活性比商品Cas9蛋白有了极显著的提高。
本发明所述的原核Ca9高效表达载体在制备Ca9蛋白中的应用。
含有本发明所述的原核Ca9高效表达载体pKG-GE4的基因工程菌。
本发明所述的基因工程菌在制备Ca9蛋白中的应用。
一种制备Ca9蛋白的方法,包含以下步骤:
(1)培养本发明所述的基因工程菌,加入IPTG,在低于前期培养温度5℃的温度下诱导所述的基因工程菌表达目的蛋白,并收集菌体沉淀;
(2)粗提融合蛋白,采用Ni-NTA琼脂糖柱进行融合蛋白的纯化;
(3)用带his标签的重组牛肠激酶酶切融合蛋白,并用Ni-NTA树脂纯化得到酶切后去除TrxA-His的NLS-spCas9-NLS目的蛋白。
一种用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统,包含按照本发明所述方法制备的Ca9蛋白,针对TARDBP基因的gRNA以及含有TARDBP突变位点的单链Donor DNA。
作为本发明的一种优选,所述的针对TARDBP基因的gRNA的靶点选自SEQ ID NO.15所示的TARDBP-E6-gRNA2和SEQ ID NO.16所示的TARDBP-E6-gRNA3。
作为本发明的一种优选,所述的针对TARDBP基因的TARDBP-T7-gRNA2,其转录模板如SEQ ID NO.25所示;针对TARDBP基因的TARDBP-T7-gRNA3,其转录模板如SEQ ID NO.26所示。
作为本发明的一种优选,所述的含有TARDBP突变位点的单链Donor DNA序列如SEQID NO.27所示。
作为本发明的进一步优选,所述的基因编辑系统,Ca9蛋白:TARDBP-T7-gRNA2:TARDBP-T7-gRNA3:单链Donor DNA的质量比为1:1:4:2。
本发明所述的基因编辑系统在构建TARDBP基因突变的猪重组细胞中的应用。
一种重组细胞,由本发明所述的基因编辑系统共转染猪原代成纤维细胞经验证后所得。
本发明所述的基因编辑系统、所述的重组细胞在构建TARDBP基因突变的肌萎缩侧索硬化症模型猪中的应用。
与现有技术相比,本发明至少具有如下有益效果:
(1)本发明研究对象(猪)比其他动物(大小鼠、灵长类)具有更好的应用性。
大小鼠等啮齿类动物不论从体型、器官大小、生理、病理等方面都与人相差巨大,无法真实地模拟人类正常的生理、病理状态。研究表明,95%以上在大小鼠中验证有效的药物在人类临床试验中是无效的。就大动物而言,灵长类是与人亲缘关系最近的动物,但其体型小、性成熟晚(6-7岁开始交配),且为单胎动物,群体扩繁速度极慢,饲养成本很高。另外,灵长类动物克隆效率低、难度大、成本高。
而猪作为模型动物就没有上述缺点,猪是除灵长类外与人亲缘关系最近的动物,其体型、体重、器官大小等与人相近,在解剖学、生理学、免疫学、营养代谢、疾病发病机制等方面与人类极为相似。同时,猪的性成熟早(4-6个月),繁殖力高,一胎多仔,在2-3年内即可形成一个较大群体。另外,猪的克隆技术非常成熟,克隆及饲养成本也较灵长类低得多。因此猪是非常适合作为人类疾病模型的动物。
(2)本发明所构建的pET32a-T7lac-phoA:SP-TrxA-His-EK-NLS-spCas9-NLS-T7ter(简称pKG-GE4)载体,使用了能够高效表达目的蛋白的强启动子T7lac来进行目的蛋白的表达,用细菌周质蛋白碱性磷酸酶(phoA)的信号肽来引导目的蛋白分泌表达至细菌周质腔中,从而与细菌胞内蛋白分离,且分泌到细菌周质腔中的目的蛋白为可溶性表达。同时还采用硫氧还原蛋白TrxA与Cas9蛋白融合表达,TrxA能帮助所共表达的目的蛋白形成二硫键,提高蛋白的稳定性、折叠的正确性,增加目的蛋白的溶解性及活性。为了方便目的蛋白的纯化,设计了His标签,可以通过一步法Ni柱亲和层析纯化目的蛋白,极大地简化了目的蛋白的纯化流程。同时在His标签后设计了一个肠激酶酶切位点,便于切除所融合的TrxA-His多肽片段,得到天然形式的Cas9蛋白。利用带His标签的肠激酶酶切融合蛋白后,可通过一次亲和层析除去TrxA-His多肽片段及带His标签的肠激酶,得到天然形式的Cas9蛋白,避免了多次纯化透析对目的蛋白的伤害和损耗。同时,本发明也在Cas9的N端及C端分别设计了一个NLS位点,使Cas9能更有效地进入细胞核进行基因编辑。另外,本发明选择了E.coliBL21(DE3)菌株为目的蛋白表达菌株,该菌株可高效表达克隆于含有噬菌体T7启动子的表达载体(如pET-32a)的外源基因。同时,对于Cas9蛋白的密码子,本发明进行了密码子优化,使之完全适应表达菌株的密码子偏好,从而提高目的蛋白的表达水平。另外,本发明在细菌生长至一定数量后,再用IPTG在低温下诱导目的蛋白的表达,可避免目的蛋白过早表达对宿主菌生长的影响,低温下诱导表达也显著提高所表达的目的蛋白的可溶性。经过上述各项优化设计及实验实施,所得到的Cas9蛋白活性比商品Cas9蛋白有了极显著的提高。
(3)采用本发明构建并表达的Cas9高效蛋白联合体外转录的gRNA进行基因编辑,并对Cas9和gRNA的最佳用量配比进行了优化,配合合成的ssODN作为Donor DNA,最终获得靶标位点精确点突变的单细胞克隆比率高达22.5%,远高于常规的点突变效率(<5%)。
(4)利用本发明所得到的靶基因点突变单细胞克隆株进行体细胞核移植动物克隆可直接得到含靶标基因点突变的克隆猪,并且该突变可稳定遗传。
在小鼠模型制作中采用的受精卵显微注射基因编辑材料后再进行胚胎移植的方法,因其直接获得点突变后代的概率非常低(低于1%),需要进行后代的杂交选育,这不太适用于妊娠期较长的大动物(如猪)模型制作。因此,本发明采用技术难度大、挑战性高的原代细胞体外编辑并筛选阳性编辑单细胞克隆的方法,后期再通过体细胞核移植动物克隆技术直接获得相应疾病模型猪,可大大缩短模型猪制作周期并节省人力、物力、财力。
本发明为通过基因编辑手段获得类似人ALS疾病发展进程的TARDBP点突变模型猪奠定了坚实的基础,将有助于研究并揭示由TARDBP突变导致ALS的发病机制,并可用于进行药物筛选、药效检测、基因及细胞治疗等研究,能够为进一步的临床应用提供有效的实验数据,进而为预防和治疗人类ALS提供有力的实验手段。本发明对人类ALS疾病治疗药物的研发及临床前实验具有重大应用价值。
附图说明
图1为质粒pET-32a的结构示意图。
图2为质粒pKG-GE4的结构示意图。
图3为实施例3中步骤3.3.3的电泳图。
图4为实施例3中步骤3.4.3的电泳图。
图5为实施例4中步骤4.2.3的电泳图。
图6为实施例4中步骤4.2.4的电泳图。
图7为实施例4中步骤4.6.4的电泳图。
图8为实施例5中步骤5.1.3的电泳图。
图9为实施例5中步骤5.6.3的电泳图。
图10为实施例5中步骤5.6.4判定为野生型的示例性测序峰图。
图11为实施例5中步骤5.6.4判定为杂合突变型的示例性测序峰图。
图12为实施例5中步骤5.6.4判定为双等位基因不同变异的纯合突变型示例性测序峰图。
图13为实施例5中步骤5.6.4判定为双等位基因相同变异的纯合突变型示例性测序峰图。
图14为实施例5中步骤5.6.4判定为靶标位点点突变的杂合突变型示例性测序峰图。
图15为实施例5中步骤5.6.4判定为靶标位点点突变的纯合突变型示例性测序峰图。
具体实施方式
实施例1原核Ca9高效表达载体(简称pKG-GE4)的构建
质粒pET32a-T7lac-phoA:SP-TrxA-His-EK-NLS-spCas9-NLS-T7ter(简称pKG-GE4,质粒图谱如图2)是以质粒pET-32a(结构示意图见图1)作为骨架进行改造而来,主要改造如下:①保留了TrxA蛋白的编码区域,可以帮助所表达的目的蛋白形成二硫键,增加目的蛋白溶解性及活性,但是在此序列之前加入碱性磷酸酶(phoA)的信号肽(SP)序列,该SP可以引导所表达的目的蛋白分泌至细菌的膜周质腔中,并可被原核周质信号肽酶酶切;②在TrxA蛋白编码序列之后增加His-Tag标签基团,可用于所表达的目的蛋白的富集;③在His-Tag标签下游增加肠激酶(EK)酶切位点DDDDK(Asp-Asp-Asp-Asp-Lys),纯化出的蛋白将在肠激酶作用下去除His-Tag标签和上游所融合的TrxA蛋白。④插入密码子优化后的适宜大肠杆菌BL21(DE3)菌株表达的Cas9蛋白的编码序列,同时在该基因的上游和下游均增加核定位信号编码序列(NLS),增加后期纯化出的Cas9蛋白的核定位能力。
pKG-GE4载体构建方法如下:
(1)骨架载体的制备
质粒pET-32a用XbaI、XhoI酶切,回收载体片段(约5329bp左右)。
(2)全基因合成插入序列
全基因合成如SEQ ID NO.2所示序列,依次包含前述的phoA signal peptide序列、TrxA蛋白编码序列、His-Tag标签基团、EK酶切位点、spCas9蛋白编码序列及其两端的NLS序列,在全基因合成的N端和C端分别包含与骨架载体序列同源的25个碱基对。
(3)全基因合成片段与骨架载体连接
将步骤(1)回收的骨架载体和步骤(2)全基因合成的序列重组得到质粒pKG-GE4,核苷酸序列见SEQ ID NO.1。SEQ ID NO.1中,第5121-5139位核苷酸组成T7启动子,第5140-5164位核苷酸编码Lac操纵子(lac operator),第5178-5201位核苷酸编码核糖体结合位点(RBS),第5209-5271位核苷酸编码phoA(碱性磷酸酶)信号肽(signal peptide,SP),第5272-5598位核苷酸编码TrxA蛋白,第5620-5637位核苷酸编码His-Tag标签,第5638-5652位核苷酸编码肠激酶酶切位点,第5656-5670位核苷酸编码SV40核定位信号(NLS),第5701-9801位核苷酸编码spCas9蛋白(其密码子已优化为适宜在大肠杆菌BL21(DE3)菌株中进行表达),第9802-9849位核苷酸编码nucleoplasmin核定位信号(NLS),第9902-9949位核苷酸编码T7终止子。
实施例2 pKG-GE4融合蛋白TrxA-His-EK-NLS-spCas9-NLS的诱导表达、纯化、酶切及pKG-GE4-Cas9蛋白的纯化
2.1 pKG-GE4融合蛋白TrxA-His-EK-NLS-spCas9-NLS的诱导表达
将鉴定正确的pKG-GE4质粒转化入大肠杆菌表达菌株BL21(DE3)(武汉灵淼生物公司)中,涂氨苄抗性(AmpR)平板,培养过夜后,挑选单菌落,接种到含100μg/ml氨苄青霉素的LB液体培养基中,在37℃、200转/min条件下培养过夜,然后将过夜培养的菌液接种到500mLLB培养基中,接种比例为1:200,30℃、230转/min条件下培养至OD600达到1.0左右,加入终浓度为0.5mM的异丙基硫代半乳糖苷(IPTG)诱导BL21(DE3)菌株表达目的蛋白,然后25℃培养12小时进行目的蛋白的低温诱导可溶性表达。4℃,10000g离心15分钟收集菌体,用PBS洗涤菌体并离心收集菌体沉淀。
2.2 pKG-GE4融合蛋白TrxA-His-EK-NLS-spCas9-NLS的纯化
2.2.1融合蛋白的粗提
粗提缓冲液为20mM Tris-HCl pH 8.0,0.5M NaCl,5mM Imidazole,1mM PMSF。粗提方法:按每克湿菌加入10ml上述缓冲液,悬浮细菌,均质机破碎,1000par循环三次。然后4℃,15000g离心细菌悬液30min,收集上清,经0.22μm滤膜过滤用于下一步的亲和层析蛋白纯化。
2.2.2融合蛋白的纯化
采用Ni-NTA琼脂糖柱(金斯瑞,L00250/L00250-C)进行融合蛋白的纯化。首先用平衡液(20mM Tris-HCl pH 8.0,0.5M NaCl,5mM Imidazole)对Ni柱进行平衡,然后将上述过滤后的菌液上清上样到平衡后的Ni柱,再用平衡液洗涤Ni柱,然后用缓冲液(20mM Tris-HCl pH 8.0,0.5M NaCl,50mM Imidazole)洗去杂蛋白,最后用洗脱液(20mM Tris-HCl pH8.0,0.5M NaCl,500mM Imidazole)洗脱目的蛋白。
2.3 pKG-GE4融合蛋白(TrxA-His-EK-NLS-spCas9-NLS)的酶切与pKG-GE4-Cas9蛋白的纯化
使用Amicon超滤管(Sigma,UFC9100)将上述Ni柱纯化后的融合蛋白溶液浓缩至200μl并用25mM Tris-HCl pH 8.0稀释至1ml。然后将商品来源的带his标签的重组牛肠激酶(生工生物,C620031)加入到25mM Tris-HCl pH 8.0稀释后的融合蛋白液中,进行酶切反应。酶切用量为每50μg融合蛋白用肠激酶2个单位,酶切缓冲体系为25mM Tris-HCl pH8.0,酶切温度25℃,酶切时间16小时。
酶切结束后,将酶切后溶液与80μl的Ni-NTA树脂混匀,在室温下剧烈搅拌15min,然后7000g离心3min,上清与树脂分离,取上清即为酶切后去除TrxA-His的NLS-spCas9-NLS目的蛋白。酶切后的TrxA-His多肽片段及带His标签的肠激酶EK均结合在Ni-NTA树脂上,从而将上清中的Cas9蛋白分离纯化。最后将纯化后的Cas9蛋白(命名为pKG-GE4-Cas9蛋白)浓缩后用50%的甘油于-80℃保存。
实施例3 pKG-GE4-Cas9与gRNA最佳用量配比优化及与商品Cas9蛋白的切割效率比较
3.1 TTN基因靶点gRNA设计及转录
3.1.1使用Benchling对TTN基因进行gRNA靶点设计,经预筛确定选用以下两条gRNA靶点序列:
TTN-gRNA1:AGAGCACAGTCAGCCTGGCG(SEQ ID NO.3)
TTN-gRNA2:CTTCCAGAATTGGATCTCCG(SEQ ID NO.4)
3.1.2设计并合成gRNA分子不同区段序列(由基因合成公司合成)
T7-gRNA1:GGCTTGTCGGACTCTTCGCTATTACGCCAGCTGGCGAAGGGGGAT
T7-gRNA2:TGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTCGCCAGCT7-gRNA3:ACGCCAGGGTTTTCCCAGTCACGACGTTAGGAAATTAATACGACTCACTATAGG
TTN-g1T7-gRNA4:TTCTAGCTCTAAAACCGCCAGGCTGACTGTGCTCTCCTATAGTGAGTCGTATTAATTTC
TTN-g1T7-gRNA5:CCTGGCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTT
TTN-g2T7-gRNA4:TTCTAGCTCTAAAACCGGAGATCCAATTCTGGAAGCCTATAGTGAGTCGTATTAATTTC
TTN-g2T7-gRNA5:ATCTCCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTT
T7-gRNA6:AAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTAT
3.1.3设计用于鉴定包含TTN gRNA靶点片段的引物
TTN-F55:TACGGAATTGGGGAGCCAGCGGA(SEQ ID NO.5)
TTN-R560:CAAAGTTAACTCTCTGTGTCT(SEQ ID NO.6)
3.1.4转录模板的扩增
TTN-T7-gRNA1转录模板序列如SEQ ID NO.7所示,是使用T7-gRNA1、T7-gRNA2、T7-gRNA3、TTN-g1T7-gRNA4、TTN-g1T7-gRNA5、T7-gRNA6共计6条合成引物采用重叠延伸PCR扩增技术制作的,该序列中含有T7启动子,可启动相关序列的转录。扩增后将目的条带切胶后按照FastPure Gel DNA Extraction Mini Kit(Vazyme,DC301)说明书进行操作,回收产物作为转录模板。
TTN-T7-gRNA2转录模板序列如SEQ ID NO.8所示,是使用T7-gRNA1、T7-gRNA2、T7-gRNA3、TTN-g2T7-gRNA4、TTN-g2T7-gRNA5、T7-gRNA6共计6条合成引物采用重叠延伸PCR扩增技术制作的,该序列中含有T7启动子,可启动相关序列的转录。扩增后将目的条带切胶后按照FastPure Gel DNA Extraction Mini Kit(Vazyme,DC301)说明书进行操作,回收产物作为转录模板。
3.1.5gRNA的转录
以步骤3.1.4制备的转录模板用Transcript Aid T7High Yield TranscriptionKit(Fermentas,K0441)进行体外gRNA的转录,然后用MEGA clearTMTranscription Clean-UpKit(Thermo,AM1908)进行所转录的gRNA的回收纯化,操作步骤按说明书进行,所获产物即为可用于细胞电转的gRNA。
3.2猪原代成纤维细胞制备
3.2.1取刚出生从江香猪耳组织0.5g,去除毛发及骨组织,75﹪酒精浸泡30-40s;
3.2.2用含5%P/S(Gibco Penicillin-Streptomycin)的PBS洗涤5次,不含P/S的PBS洗一次;
其中5%P/S的PBS配方为:5%P/S(Gibco Penicillin-Streptomycin)+95%PBS,5%、95%为体积百分比。
3.2.3用剪刀将组织剪碎,加入5mL 0.1%的胶原酶(Sigma)溶液,37℃摇床消化1h;
3.2.4 500g离心5min,去上清,将沉淀用1mL完全培养基重悬,铺入含10mL完全培养基并已用0.2%明胶(VWR)封盘的10cm细胞培养皿中。
其中,细胞完全培养基的配方为:15%胎牛血清(Gibco)+83%DMEM培养基(Gibco)+1%P/S(Gibco Penicillin-Streptomycin)+1%HEPES(Solarbio),15%、83%、1%、1%为体积百分比。
3.2.5置于37℃,5%CO2(体积百分比)、5%O2(体积百分比)的恒温培养箱中进行培养;
3.2.6将细胞培养至长满皿底60%左右时使用0.25%(Gibco)的胰蛋白酶将细胞消化下来,然后加入完全培养基终止消化,将细胞悬液转入15mL离心管中,400g离心4min,弃去上清,得到细胞沉淀,以备下一步的细胞转染实验。
3.3gRNA与pKG-GE4-Cas9用量配比优化
3.3.1共转染分组情况
第一组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:0.5μg TTN-T7-gRNA1:0.5μg TTN-T7-gRNA2:4μg pKG-GE4-Cas9。
第二组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:0.75μg TTN-T7-gRNA1:0.75μg TTN-T7-gRNA2:4μg pKG-GE4-Cas9。
第三组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:1μg TTN-T7-gRNA1:1μg TTN-T7-gRNA2:4μg pKG-GE4-Cas9。
第四组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:1.25μg TTN-T7-gRNA1:1.25μg TTN-T7-gRNA2:4μg pKG-GE4-Cas9。
第五组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:1μg TTN-T7-gRNA1:1μg TTN-T7-gRNA2。
3.3.2共转染操作方法
使用哺乳动物细胞转染试剂盒(Neon kit)与Neon TM transfection system电转仪进行转染实验。
1)按照上述分组配制电转DNA,混匀过程中注意切勿产生气泡;
2)将3.2.6制备得到的细胞沉淀使用1ml PBS缓冲液(Solarbio)清洗,并转移到1.5ml离心管中,600g离心6min,弃去上清,使用11μL电转基本溶液Opti-MEM重悬细胞,重悬过程中要避免气泡的产生;
3)吸取10μL细胞悬液,加入至步骤1)中的电转DNA液中混匀,混匀过程中注意切勿产生气泡;
4)将试剂盒带有的电转杯放置于Neon TM transfection system电转仪杯槽内,加入3mLBuffer E;
5)用电转枪吸取10μL步骤3)得到的混合液,插入电击杯内,选择电转程序(1450V10ms 3 pulse),电击转染后立即将电转枪中混合液转入到6孔板中,每孔含3mL的完全培养液(15%胎牛血清(Gibco)+83%DMEM培养基(Gibco)+1%P/S(Gibco Penicillin-Streptomycin)+1%HEPES(Solarbio));
6)混匀后放置于37℃,5%CO2、5%O2的恒温培养箱中进行培养;
7)电转后12-18h换液,36-48h用0.25%(Gibco)的胰蛋白酶消化并收集细胞于1.5mL离心管中。
3.3.3基因编辑效率分析
提取3.3.2中收集的细胞基因组DNA,采用TTN-F55和TTN-R560组成的引物对进行PCR扩增,然后进行1%琼脂糖凝胶电泳(见图3)。505bp条带为野生型条带(WT),254bp左右(条带505bp理论缺失251bp)为缺失突变条带(MT)。
基因缺失突变效率=(MT灰度/MT条带bp数)/(WT灰度/WT条带bp数+MT灰度/MT条带bp数)×100%。据此计算,第一组基因缺失突变效率为19.9%,第二组基因缺失突变效率为39.9%,第三组基因缺失突变效率为79.9%,第四组基因缺失突变效率为44.3%。
结果表明,当两个gRNA与pKG-GE4-Cas9蛋白的质量比为1:1:4,实际用量为1μg:1μg:4μg时基因编辑效率最高,确定两个gRNA与pKG-GE4-Cas9蛋白的最适用量为1μg:1μg:4μg。
3.4 pKG-GE4-Cas9蛋白和商品Cas9蛋白的基因编辑效率对比
3.4.1共转染分组情况
Cas9-A组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和商品Cas9-A蛋白共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:1μg TTN-T7-gRNA1:1μg TTN-T7-gRNA2:4μg Cas9-A。
pKG-GE4组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和pKG-GE4-Cas9蛋白共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:1μg TTN-T7-gRNA1:1μg TTN-T7-gRNA2:4μg pKG-GE4-Cas9。
Cas9-B组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2和商品Cas9-B蛋白共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:1μg TTN-T7-gRNA1:1μg TTN-T7-gRNA2:4μg Cas9-B。
Control组:将转录的TTN-T7-gRNA1、TTN-T7-gRNA2共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:1μg TTN-T7-gRNA1:1μg TTN-T7-gRNA2。
3.4.2共转染操作方法
同本实施例中步骤3.3.2。
3.4.3基因编辑效率分析
提取3.4.2中收集的细胞基因组DNA,采用TTN-F55和TTN-R560组成的引物对进行PCR扩增,然后进行1%琼脂糖凝胶电泳(见图4)。505bp条带为野生型条带(WT),254bp左右(条带505bp理论缺失251bp)为缺失突变条带(MT)。
基因缺失突变效率=(MT灰度/MT条带bp数)/(WT灰度/WT条带bp数+MT灰度/MT条带bp数)×100%。据此计算,采用商品Cas9-A蛋白的基因缺失突变效率为28.5%,采用pKG-GE4-Cas9蛋白的基因缺失突变效率为85.6%,采用商品Cas9-B蛋白的基因缺失突变效率为16.6%。
结果表明,与采用商品的Cas9蛋白相比,采用本发明制备的pKG-GE4-Cas9蛋白使得基因编辑效率显著提高。
实施例4 TARDBP基因高效gRNA靶点的筛选
4.1基因组DNA的提取
使用Vazyme公司FastPure Cell/Tissue DNA Isolation Mini Kit(VazymeCat.DC102-01)分别进行18只猪(雄性A、B、C、D、E、F、G、H雌性1、2、3、4、5、6、7、8、9、10)耳组织的基因组DNA的柱式提取,使用NanoDrop进行定量,-20℃保存备用。
4.2 TARDBP基因预设点突变位点及邻近基因组序列保守性分析
4.2.1猪TARDBP基因信息
编码反式反应DNA结合蛋白43(TDP-43);位于6号染色体;GeneID为100739753,Susscrofa。猪TARDBP基因编码的TDP-43蛋白氨基酸序列如SEQ ID NO.9所示。基因组DNA中,猪TARDBP基因具有6个外显子,而与人类DCM相关的TARDBP突变研究中Q331K和M337V均对应猪第6外显子(猪TARDBP基因第5至第6外显子,含第5内含子和部分3’UTR序列如SEQ ID NO.10所示)。
4.2.2 TARDBP基因预设点突变位点外显子及邻近基因组序列PCR扩增引物设计
根据查到的猪TARDBP基因组序列
(https://www.ncbi.nlm.nih.gov/nuccore/NC_010448.4?report=genbank& from=71213584&to=71227707),设计引物扩增前述18只猪基因组样品TARDBP基因外显子6的位点。
使用Oligo7进行引物设计,设计结果如下:
TARDBP-E6g-JDF53:CAGCGTACATATATCCAATGC(SEQ ID NO.11)
TARDBP-E6g-JDR541:TCTACATTCCCCAGCCCGAAG(SEQ ID NO.12)
TARDBP-E6g-JDF100:AGTTAGAAAGAAGTGGAAGAT(SEQ ID NO.13)
TARDBP-E6g-JDR488:CATTAAAACCACTGCCTGACCCT(SEQ ID NO.14)
4.2.3 TARDBP基因组PCR扩增引物筛选
使用猪(雌性1#)耳朵组织提取的基因组为模板,使用设计的两条上游引物和两条下游引物组合,Max酶(Vazyme公司货号:P505)进行PCR,产物进行1%琼脂糖凝胶电泳以筛选好的扩增引物,结果如图5,组1:TARDBP-E6g-JDF100/TARDBP-E6g-JDR488;组2:TARDBP-E6g-JDF53/TARDBP-E6g-JDR541;组3:TARDBP-E6g-JDF53/TARDBP-E6g-JDR488;组4:TARDBP-E6g-JDF100/TARDBP-E6g-JDR541,优选TARDBP-E6g-JDF53/TARDBP-E6g-JDR541引物对进行目的片段扩增。
4.2.4 18只猪TARDBP基因片段PCR扩增
分别以18只猪的基因组DNA为模板(雄性A、B、C、D、E、F、G、H雌性1、2、3、4、5、6、7、8、9、10),采用引物TARDBP-E6g-JDF53/TARDBP-E6g-JDR541及Max酶进行TARDBP基因组片段的扩增,产物进行1%琼脂糖凝胶电泳,结果如图6。
4.2.5 TARDBP基因序列保守性分析
将上述PCR扩增产物使用扩增引物进行测序(通用生物公司测序),将测序结果与公共数据库中的TARDBP基因序列进行比对分析,选择18只猪中共有的保守区进行gRNA靶点的设计。
4.3 gRNA靶点设计及表达载体构建
4.3.1使用Benchling进行靶点gRNA设计
设计靶点已避开可能的突变位点,使用Benchling(https://benchling.com/)进行靶点gRNA设计。
TARDBP基因敲除gRNA靶点设计如下:
TARDBP-E6-gRNA1:GATGATGGCTGCAGCCCAGG
TARDBP-E6-gRNA2:GCGGCTCTGCAGAGCAGCTG(SEQ ID NO15)
TARDBP-E6-gRNA3:GCCAGTCAGCAGAACCAGTC(SEQ ID NO.16)
TARDBP-E6-gRNA4:TATTACCCGATGGGCCTGAC
TARDBP-E6-gRNA5:CAGAGCAGCTGGGGTATGAT
TARDBP-E6-gRNA6:GCCTGACTGGTTCTGCTGAC
合成的TARDBP基因共6个靶点的插入序列互补DNA Oligo如下:
TARDBP-E6-gRNA1-S:caccGATGATGGCTGCAGCCCAGG
TARDBP-E6-gRNA1-A:aaacCCTGGGCTGCAGCCATCATC
TARDBP-E6-gRNA2-S:caccGCGGCTCTGCAGAGCAGCTG(SEQ ID NO.17)
TARDBP-E6-gRNA2-A:aaacCAGCTGCTCTGCAGAGCCGC(SEQ ID NO.18)
TARDBP-E6-gRNA3-S:caccGCCAGTCAGCAGAACCAGTC(SEQ ID NO.19)
TARDBP-E6-gRNA3-A:aaacGACTGGTTCTGCTGACTGGC(SEQ ID NO.20)
TARDBP-E6-gRNA4-S:caccgTATTACCCGATGGGCCTGAC
TARDBP-E6-gRNA4-A:aaacGTCAGGCCCATCGGGTAATAc
TARDBP-E6-gRNA5-S:caccgCAGAGCAGCTGGGGTATGAT
TARDBP-E6-gRNA5-A:aaacATCATACCCCAGCTGCTCTGc
TARDBP-E6-gRNA6-S:caccGCCTGACTGGTTCTGCTGAC
TARDBP-E6-gRNA6-A:aaacGTCAGCAGAACCAGTCAGGC
TARDBP-E6-gRNA1-S、TARDBP-E6-gRNA1-A、TARDBP-E6-gRNA2-S、TARDBP-E6-gRNA2-A、TARDBP-E6-gRNA3-S、TARDBP-E6-gRNA3-A、TARDBP-E6-gRNA4-S、TARDBP-E6-gRNA4-A、TARDBP-E6-gRNA5-S、TARDBP-E6-gRNA5-A、TARDBP-E6-gRNA6-S、TARDBP-E6-gRNA6-A均为单链DNA分子。
4.3.2gRNA载体构建
1)将合成的TARDBP-E6-gRNA1-S和TARDBP-E6-gRNA1-A混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA(构建方法详见CN112442515A具体实施方式1.2构建MSTN和FNDC5基因gRNA靶点载体来检测所改造的cas9载体的效率)连接,得到质粒pKG-U6gRNA(TARDBP-E6-gRNA1)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA1序列所对应的gRNA。
2)将合成的TARDBP-E6-gRNA2-S和TARDBP-E6-gRNA2-A混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接,得到质粒pKG-U6gRNA(TARDBP-E6-gRNA2)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA2序列所对应的的gRNA。
3)将合成的TARDBP-E6-gRNA3-S和TARDBP-E6-gRNA3-A混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接,得到质粒pKG-U6gRNA(TARDBP-E6-gRNA3)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA3序列所对应的gRNA。
4)将合成的TARDBP-E6-gRNA4-S和TARDBP-E6-gRNA4-A混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接,得到质粒pKG-U6gRNA(TARDBP-E6-gRNA4)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA4序列所对应的gRNA。
5)将合成的TARDBP-E6-gRNA5-S和TARDBP-E6-gRNA5-A混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接,得到质粒pKG-U6gRNA(TARDBP-E6-gRNA5)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA5序列所对应的gRNA。
6)将合成的TARDBP-E6-gRNA6-S和TARDBP-E6-gRNA6-A混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架pKG-U6gRNA连接,得到质粒pKG-U6gRNA(TARDBP-E6-gRNA6)。该质粒将会在所转染的细胞中转录出与TARDBP-E6-gRNA6序列所对应的gRNA。
4.3.3 gRNA载体鉴定
从LB平板上挑取单克隆置入加有相应抗生素的LB培养液内,37℃恒温摇床内培养12-16h后小提质粒送通用公司测序,经序列比对确认pKG-U6gRNA(TARDBP-E6-gRNA1)、pKG-U6gRNA(TARDBP-E6-gRNA2)、pKG-U6gRNA(TARDBP-E6-gRNA3)、pKG-U6gRNA(TARDBP-E6-gRNA4)、pKG-U6gRNA(TARDBP-E6-gRNA5)和pKG-U6gRNA(TARDBP-E6-gRNA6)载体均构建成功。
4.4猪原代成纤维细胞制备
同实施例3中3.2。
4.5使用构建好的gRNA质粒、Cas9质粒(pKG-GE3)共转染猪原代成纤维细胞。
4.5.1共转染分组情况
第一组:将质粒pKG-U6gRNA(TARDBP-E6-gRNA1)、质粒pKG-GE3(构建方法见CN112442515A中具体实施方式1.1Cas9高效表达载体的构建)共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA1):1.08μg质粒pKG-GE3。
第二组:将质粒pKG-U6gRNA(TARDBP-E6-gRNA2)、质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA2):1.08μg质粒pKG-GE3。
第三组:将质粒pKG-U6gRNA(TARDBP-E6-gRNA3)、质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA3):1.08μg质粒pKG-GE3。
第四组:将质粒pKG-U6gRNA(TARDBP-E6-gRNA4)、质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA4):1.08μg质粒pKG-GE3。
第五组:将质粒pKG-U6gRNA(TARDBP-E6-gRNA5)、质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA5):1.08μg质粒pKG-GE3。
第六组:将质粒pKG-U6gRNA(TARDBP-E6-gRNA6)、质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pKG-U6gRNA(TARDBP-E6-gRNA6):1.08μg质粒pKG-GE3。
第七组:猪原代成纤维细胞,同等电转参数不加质粒进行电转操作。
4.5.2共转染操作方法
同实施例3中3.3.2。
4.6 TARDBP基因不同靶点的编辑效率分析
4.6.1分别向步骤4.5.2中收集在1.5mL离心管中的5组细胞加入10μL KAPA2G裂解液裂解细胞,得到释放出基因组DNA的细胞裂解液
KAPA2G裂解液配制体系如下:
10×extract Buffer 1μL
Enzyme 0.2μL
ddH2O 8.8μL
75℃15min—95℃5min—4℃,反应结束后细胞裂解液于-20℃保存;
4.6.2采用前述针对TARDBP基因E4的引物对TARDBP-E6g-JDF53/TARDBP-E6g-JDR541,并以上述细胞裂解液为DNA模板,进行PCR扩增TARDBP基因靶点区域,检测细胞靶基因突变情况,目的PCR产物长度为488bp;
4.6.3使用常规PCR反应扩增TARDBP靶点基因;
4.6.4TARDBP基因不同靶点的编辑效率分析
将PCR反应产物进行1%琼脂糖凝胶电泳,如图7,将目的产物切胶回收后送测序公司进行测序,然后将测序结果利用网页版Synthego ICE工具分析测序峰图得出TARDBP-E6-gRNA1、TARDBP-E6-gRNA2、TARDBP-E6-gRNA3、TARDBP-E6-gRNA4、TARDBP-E6-gRNA5、TARDBP-E6-gRNA6不同靶点的编辑效率依次为30%、63%、55%、9%、3%、15%。结果表明,TARDBP-E6-gRNA2和TARDBP-E6-gRNA3编辑效率较高。
实施例5制备TARDBP基因点突变的从江香猪单细胞克隆
5.1 TARDBP基因高效gRNA靶点模板制备及转录
5.1.1选用实施例4中筛到的两个高效gRNA靶点
TARDBP-E6-gRNA2:GCGGCTCTGCAGAGCAGCTG(SEQ ID NO.15)
TARDBP-E6-gRNA3:GCCAGTCAGCAGAACCAGTC(SEQ ID NO.16)
5.1.2设计并合成靶点gRNA转录模板的不同区段序列(由基因合成公司合成)
T7-gRNA1、T7-gRNA2、T7-gRNA3、T7-gRNA6序列同实施例3中步骤3.1.2;
TARDBP-g2T7-gRNA4:
TTCTAGCTCTAAAACCAGCTGCTCTGCAGAGCCGCCCTATAGTGAGTCGTATTAATTTC(SEQ IDNO.21)
TARDBP-g2T7-gRNA5:
GCAGCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTT(SEQ IDNO.22)
TARDBP-g3T7-gRNA4:
TTCTAGCTCTAAAACGACTGGTTCTGCTGACTGGCCCTATAGTGAGTCGTATTAATTTC(SEQ IDNO.23)
TARDBP-g3T7-gRNA5:
ACCAGTCGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTT(SEQ IDNO.24)
5.1.3转录模板的扩增
TARDBP-T7-gRNA2转录模板序列如SEQ ID NO.25所示,是使用T7-gRNA1、T7-gRNA2、T7-gRNA3、TARDBP-g2T7-gRNA4、TARDBP-g2T7-gRNA5、T7-gRNA6共计6条合成引物采用重叠延伸PCR扩增技术制作的,该序列中含有T7启动子,可启动相关序列的转录。扩增结果如图8所示,将目的条带切胶后按照Fast Pure Gel DNA Extraction Mini Kit(Vazyme,DC301)说明书进行操作,回收产物作为转录模板。
TARDBP-T7-gRNA3转录模板序列如SEQ ID NO.26所示,是使用T7-gRNA1、T7-gRNA2、T7-gRNA3、TARDBP-g3T7-gRNA4、TARDBP-g3T7-gRNA5、T7-gRNA6共计6条合成引物采用重叠延伸PCR扩增技术制作的,该序列中含有T7启动子,可启动相关序列的转录。扩增结果如图8所示,将目的条带切胶后按照Fast Pure Gel DNA Extraction Mini Kit(Vazyme,DC301)说明书进行操作,回收产物作为转录模板。
5.1.4高效gRNA的转录
以步骤5.1.3制备的转录模板用Transcript Aid T7High Yield TranscriptionKit(Fermentas,K0441)进行体外gRNA的转录,然后用MEGA clearTM Transcription Clean-Up Kit(Thermo,AM1908)进行所转录的gRNA的回收纯化,操作步骤按说明书进行,所获产物即为可用于细胞电转的gRNA。
5.2合成含有TARDBP突变位点的单链Donor DNA
合成对应人TARDBP Q331K和M337V氨基酸突变的单链DNA作为Donor DNA,该单链DNA除靶位点突变外还含有TARDBP-E6-gRNA2和TARDBP-E6-gRNA3靶点PAM邻近的3’端序列同义突变,命名为TARDBP-mutant-ss189,序列如SEQ ID NO.27所示。
5.3制备猪原代成纤维细胞
同实施例3中3.2。
5.4转染猪原代成纤维细胞
使用转录的TARDBP-T7-gRNA2和TARDBP-T7-gRNA3、pKG-GE4-Cas9蛋白、TARDBP-mutant-ss189 Donor DNA共转染猪原代成纤维细胞。配比:约10万个猪原代成纤维细胞:1μg TARDBP-T7-gRNA2:1μg TARDBP-E6-gRNA3:4μg pKG-GE4-Cas9蛋白:2μgTARDBP-mutant-ss189。共转染操作方法同实施例3中3.3.2。
5.5筛选TARDBP-mutant-ss189 Donor DNA发生同源重组(HDR)的单细胞克隆株
5.5.1将步骤5.4所得电转48h的群体细胞,使用胰蛋白酶进行消化,完全培养基中和,500g离心5min,去上清,将沉淀用200μL完全培养基重悬,并适当稀释,用口吸管挑取单细胞转移到每孔含100μL完全培养基的96孔板中,每孔放置一个细胞。
5.5.2 37℃、5%CO2、5%O2的恒温培养箱中进行培养,每2~3天换一次细胞培养基,期间用显微镜观察每孔细胞生长情况,排除无细胞及非单细胞克隆的孔;
5.5.3待96孔板的孔中细胞长满孔底,使用胰蛋白酶消化并收集细胞,其中2/3细胞接种到含有完全培养基的6孔板中,剩余的1/3细胞收集在1.5mL离心管中备后续基因型测定;
5.5.4待6孔板长至80%汇合度时使用0.25%(Gibco)的胰蛋白酶消化并收集细胞,使用细胞冻存液(90%完全培养基+10%DMSO,体积比)将细胞冻存。
5.6单细胞克隆的基因型鉴定
5.6.1在步骤5.5.3收集在1.5mL离心管中得到的细胞中加入10μL KAPA2G裂解液裂解细胞,得到释放出基因组DNA的细胞裂解液。
KAPA2G裂解液配制体系如下:
10×extract Buffer 1μL
Enzyme 0.2μL
ddH2O 8.8μL
75℃15min—95℃5min—4℃,反应结束后细胞裂解液于-20℃保存;
5.6.2采用前述针对TARDBP基因E6的引物对TARDBP-E6g-JDF53/TARDBP-E6g-JDR541,并以上述细胞裂解液为DNA模板,进行PCR扩增TARDBP基因靶点区域,检测单细胞克隆的靶基因突变情况,目的PCR产物长度为488bp;
5.6.3将PCR产物进行电泳,电泳结果如图9,泳道编号与单细胞克隆编号一致。回收PCR扩增产物并测序。
5.6.4将测序结果与TARDBP靶标位点突变序列信息进行比对,从而判断该单细胞克隆株是否为靶标位点成功突变株。
编号为1、5、16、26、33、39的单细胞克隆的基因型为野生型。编号为2、7、11、12、14、17、19、23、24、27、29、30、32、34、36、37、40的单细胞克隆的基因型为杂合突变型。编号为4、6、8、13、18、20、21、28、35、38的单细胞克隆的基因型为双等位基因不同变异的纯合突变型。编号为3、9、10、15、22、25、31的单细胞克隆的基因型为双等位基因相同变异的纯合突变型。其中,12、14、19、32的单细胞克隆为靶标位点点突变的杂合突变型,3、10、31的单细胞克隆为靶标位点点突变的纯合突变型。得到TARDBP基因编辑单细胞克隆的比率为85%,得到靶标位点点突变的单细胞克隆的比率为22.5%。
示例性的测序比对结果如图10至图15,其中图10是克隆号为TARDBP-ss189-1的正向测序与靶标位点突变序列的比对结果,判定为野生型;图11是克隆号为TARDBP-ss189-2的正向测序与靶标位点突变序列的比对结果,判定为杂合突变型;图12是克隆号为TARDBP-ss189-6的正向测序和反向测序同时与靶标位点突变序列的比对结果,为双等位基因不同变异的纯合突变型;图13是克隆号为TARDBP-ss189-9的正向测序与靶标位点突变序列的比对结果,为双等位基因相同变异的纯合突变型;图14是克隆号为TARDBP-ss189-12的正向测序与靶标位点突变序列的比对结果,为靶标位点点突变的杂合突变型;图15是克隆号为TARDBP-ss189-3的正向测序与靶标位点突变序列的比对结果,为靶标位点点突变的纯合突变型。
通过具体序列的分析,TARDBP各单细胞克隆基因型如表1:
表1 TARDBP基因点突变单细胞克隆的基因型测定结果
Figure BDA0003005865110000171
Figure BDA0003005865110000181
Figure BDA0003005865110000191
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 南京启真基因工程有限公司
<120> 用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统及其应用
<160> 27
<170> SIPOSequenceListing 1.0
<210> 1
<211> 9974
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 600
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 660
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 720
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 780
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 840
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 900
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 960
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 1020
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 1080
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 1140
tgcagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 1200
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 1260
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 1320
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 1380
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 1440
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 1500
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 1560
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1620
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1680
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1740
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1800
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1860
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1920
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1980
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 2040
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 2100
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 2160
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 2220
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2280
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2340
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2400
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatatgg 2460
tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 2520
cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 2580
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 2640
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagctg cggtaaagct 2700
catcagcgtg gtcgtgaagc gattcacaga tgtctgcctg ttcatccgcg tccagctcgt 2760
tgagtttctc cagaagcgtt aatgtctggc ttctgataaa gcgggccatg ttaagggcgg 2820
ttttttcctg tttggtcact gatgcctccg tgtaaggggg atttctgttc atgggggtaa 2880
tgataccgat gaaacgagag aggatgctca cgatacgggt tactgatgat gaacatgccc 2940
ggttactgga acgttgtgag ggtaaacaac tggcggtatg gatgcggcgg gaccagagaa 3000
aaatcactca gggtcaatgc cagcgcttcg ttaatacaga tgtaggtgtt ccacagggta 3060
gccagcagca tcctgcgatg cagatccgga acataatggt gcagggcgct gacttccgcg 3120
tttccagact ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag 3180
acgttttgca gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac 3240
cagtaaggca accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca 3300
cccgtggggc cgccatgccg gcgataatgg cctgcttctc gccgaaacgt ttggtggcgg 3360
gaccagtgac gaaggcttga gcgagggcgt gcaagattcc gaataccgca agcgacaggc 3420
cgatcatcgt cgcgctccag cgaaagcggt cctcgccgaa aatgacccag agcgctgccg 3480
gcacctgtcc tacgagttgc atgataaaga agacagtcat aagtgcggcg acgatagtca 3540
tgccccgcgc ccaccggaag gagctgactg ggttgaaggc tctcaagggc atcggtcgag 3600
atcccggtgc ctaatgagtg agctaactta cattaattgc gttgcgctca ctgcccgctt 3660
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 3720
gcggtttgcg tattgggcgc cagggtggtt tttcttttca ccagtgagac gggcaacagc 3780
tgattgccct tcaccgcctg gccctgagag agttgcagca agcggtccac gctggtttgc 3840
cccagcaggc gaaaatcctg tttgatggtg gttaacggcg ggatataaca tgagctgtct 3900
tcggtatcgt cgtatcccac taccgagatg tccgcaccaa cgcgcagccc ggactcggta 3960
atggcgcgca ttgcgcccag cgccatctga tcgttggcaa ccagcatcgc agtgggaacg 4020
atgccctcat tcagcatttg catggtttgt tgaaaaccgg acatggcact ccagtcgcct 4080
tcccgttccg ctatcggctg aatttgattg cgagtgagat atttatgcca gccagccaga 4140
cgcagacgcg ccgagacaga acttaatggg cccgctaaca gcgcgatttg ctggtgaccc 4200
aatgcgacca gatgctccac gcccagtcgc gtaccgtctt catgggagaa aataatactg 4260
ttgatgggtg tctggtcaga gacatcaaga aataacgccg gaacattagt gcaggcagct 4320
tccacagcaa tggcatcctg gtcatccagc ggatagttaa tgatcagccc actgacgcgt 4380
tgcgcgagaa gattgtgcac cgccgcttta caggcttcga cgccgcttcg ttctaccatc 4440
gacaccacca cgctggcacc cagttgatcg gcgcgagatt taatcgccgc gacaatttgc 4500
gacggcgcgt gcagggccag actggaggtg gcaacgccaa tcagcaacga ctgtttgccc 4560
gccagttgtt gtgccacgcg gttgggaatg taattcagct ccgccatcgc cgcttccact 4620
ttttcccgcg ttttcgcaga aacgtggctg gcctggttca ccacgcggga aacggtctga 4680
taagagacac cggcatactc tgcgacatcg tataacgtta ctggtttcac attcaccacc 4740
ctgaattgac tctcttccgg gcgctatcat gccataccgc gaaaggtttt gcgccattcg 4800
atggtgtccg ggatctcgac gctctccctt atgcgactcc tgcattagga agcagcccag 4860
tagtaggttg aggccgttga gcaccgccgc cgcaaggaat ggtgcatgca aggagatggc 4920
gcccaacagt cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat 4980
gagcccgaag tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc 5040
aaccgcacct gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat 5100
cgatctcgat cccgcgaaat taatacgact cactataggg gaattgtgag cggataacaa 5160
ttcccctcta gaaataattt tgtttaactt taagaaggag atatacatgt gaaacaaagc 5220
actattgcac tggcactctt accgttactg tttacccctg tgacaaaagc catgagcgat 5280
aaaattattc acctgactga cgacagtttt gacacggatg tactcaaagc ggacggggcg 5340
atcctcgtcg atttctgggc agagtggtgc ggtccgtgca aaatgatcgc cccgattctg 5400
gatgaaatcg ctgacgaata tcagggcaaa ctgaccgttg caaaactgaa catcgatcaa 5460
aaccctggca ctgcgccgaa atatggcatc cgtggtatcc cgactctgct gctgttcaaa 5520
aacggtgaag tggcggcaac caaagtgggt gcactgtcta aaggtcagtt gaaagagttc 5580
ctcgacgcta acctggccgg ttctggttct ggccatatgc accatcatca tcatcatgac 5640
gatgacgata agatgcccaa aaagaaacga aaggtgggta tccacggagt cccagcagcc 5700
gacaaaaaat atagcatcgg cctggacatc ggtaccaaca gcgttggctg ggcagtgatc 5760
actgatgaat acaaagttcc atccaaaaaa tttaaagtac tgggcaacac cgaccgtcac 5820
tctatcaaaa aaaacctgat tggtgctctg ctgtttgaca gcggcgaaac tgctgaggct 5880
acccgtctga aacgtacggc tcgccgtcgc tacactcgtc gtaaaaaccg catctgttat 5940
ctgcaggaaa ttttctctaa cgaaatggca aaagttgatg atagcttctt tcatcgtctg 6000
gaagagagct tcctggtgga agaagataaa aaacacgaac gtcacccgat tttcggtaac 6060
attgtggatg aggttgccta ccacgagaaa tatccgacca tctaccatct gcgtaaaaaa 6120
ctggttgata gcactgacaa agcggatctg cgtctgatct acctggctct ggcacacatg 6180
atcaaattcc gtggtcactt cctgatcgaa ggtgatctga accctgataa ctccgacgtg 6240
gacaaactgt tcattcagct ggttcagacc tataaccagc tgttcgaaga aaacccgatc 6300
aacgcgtccg gtgtagacgc taaggcaatt ctgtctgcgc gtctgtctaa gtctcgtcgt 6360
ctggaaaacc tgattgcgca actgccaggt gaaaagaaaa acggcctgtt cggcaatctg 6420
atcgccctgt ccctgggtct gactccgaac tttaaatcca actttgacct ggcggaagat 6480
gccaagctgc agctgagcaa agatacctat gacgatgacc tggataacct gctggcacag 6540
atcggtgatc agtatgccga tctgttcctg gccgcgaaaa acctgtctga tgcgattctg 6600
ctgtctgata tcctgcgcgt taacactgaa attactaaag cgccgctgag cgcatccatg 6660
attaaacgtt acgatgaaca ccaccaggat ctgaccctgc tgaaagcgct ggtgcgtcag 6720
cagctgccgg aaaaatacaa ggagatcttc ttcgaccaga gcaaaaacgg ttacgcgggc 6780
tacattgatg gtggtgcatc tcaggaggaa ttctacaaat tcattaaacc gatcctggaa 6840
aaaatggatg gtactgaaga gctgctggtt aaactgaatc gtgaagatct gctgcgcaaa 6900
cagcgtacct tcgataacgg ttccatcccg catcagattc atctgggcga actgcacgct 6960
atcctgcgcc gtcaggaaga cttttatccg ttcctgaaag acaaccgtga gaaaattgaa 7020
aaaatcctga ccttccgtat tccgtactat gtaggtccgc tggcgcgtgg taactcccgt 7080
ttcgcttgga tgacccgcaa aagcgaagaa accatcaccc cgtggaattt cgaagaagtc 7140
gttgacaaag gcgcgtccgc gcagtctttc atcgaacgca tgacgaactt cgacaaaaac 7200
ctgccgaacg agaaagtgct gccgaaacac tctctgctgt acgagtactt cactgtgtac 7260
aacgaactga ccaaagtgaa atacgtcacc gaaggtatgc gtaaaccggc attcctgtcc 7320
ggtgagcaaa aaaaagcaat cgtggatctg ctgttcaaaa ccaaccgtaa agtaaccgtg 7380
aaacagctga aggaagacta tttcaagaaa atcgaatgtt ttgattctgt tgaaatctcc 7440
ggcgtggaag atcgcttcaa tgcgtccctg ggtacgtatc acgacctgct gaaaattatc 7500
aaagacaaag attttctgga caacgaggaa aacgaagaca tcctggagga tattgtactg 7560
accctgaccc tgttcgaaga ccgtgagatg atcgaagaac gcctgaaaac ctacgcccac 7620
ctgttcgatg acaaggtaat gaagcagctg aaacgtcgtc gttataccgg ctggggtcgt 7680
ctgtcccgta aactgatcaa tggcatccgt gataaacagt ctggcaaaac catcctggac 7740
ttcctgaaat ccgacggttt cgcgaatcgt aacttcatgc aactgattca tgacgattct 7800
ctgactttca aagaagacat ccagaaagca caggtttccg gccagggtga ctctctgcac 7860
gagcacattg ccaatctggc tggttctccg gctattaaaa agggtattct gcagactgtg 7920
aaagtagttg atgagctggt caaagtaatg ggccgtcaca agccggaaaa cattgtgatc 7980
gaaatggcac gtgaaaacca gacgacccag aaaggtcaga aaaactctcg tgaacgcatg 8040
aaacgtatcg aagaaggcat caaagaactg ggctctcaga tcctgaagga acaccctgta 8100
gaaaataccc agctgcagaa cgaaaagctg tatctgtatt acctgcagaa cggccgcgat 8160
atgtatgtgg accaggaact ggatatcaac cgcctgtccg attacgatgt agatcacatc 8220
gtgccgcaaa gcttcctgaa agacgacagc attgacaaca aagtactgac ccgttctgat 8280
aagaaccgtg gcaaatccga taacgtcccg tctgaagaag ttgttaaaaa aatgaaaaac 8340
tattggcgtc agctgctgaa cgcgaaactg atcacccagc gtaagttcga caatctgact 8400
aaagctgagc gcggtggtct gtccgaactg gataaagcgg gttttatcaa acgccagctg 8460
gttgaaaccc gtcagatcac gaagcacgtt gcgcagattc tggactctcg tatgaacacc 8520
aaatacgacg aaaacgacaa actgatccgc gaggttaagg ttatcaccct gaaaagcaaa 8580
ctggtatccg attttcgtaa agactttcag ttctacaaag tgcgcgaaat taacaactat 8640
caccacgctc acgatgcata tctgaatgca gttgttggca cggcgctgat caaaaagtat 8700
ccgaaactgg aatctgaatt cgtatacggc gattacaaag tgtatgacgt tcgtaagatg 8760
atcgcaaaat ccgagcagga aattggtaag gcgacggcga aatacttctt ttattccaat 8820
attatgaact ttttcaaaac cgaaatcacc ctggcgaatg gtgaaattcg taaacgcccg 8880
ctgatcgaaa ccaacggtga aactggtgaa atcgtttggg acaaaggccg cgacttcgcg 8940
accgtgcgta aagttctgtc tatgccgcaa gtgaacatcg tcaagaagac cgaagtacaa 9000
accggcggtt ttagcaaaga gagcattctg ccaaaacgta actccgacaa actgatcgcg 9060
cgcaagaaag actgggatcc gaaaaaatac ggtggtttcg attctccaac cgttgcttat 9120
tccgttctgg tggtagccaa agttgagaaa ggtaaaagca aaaaactgaa atccgtaaag 9180
gaactgctgg gtattactat catggagcgt agctccttcg aaaaaaaccc gatcgatttt 9240
ctggaagcga aaggctataa agaagtcaaa aaggacctga tcatcaaact gccaaaatac 9300
agcctgttcg agctggaaaa cggccgtaaa cgtatgctgg catctgcggg cgaactgcag 9360
aaaggcaacg agctggctct gccgtccaaa tacgtgaact ttctgtacct ggcctctcac 9420
tacgaaaaac tgaaaggttc cccggaagac aacgaacaga aacagctgtt cgtagagcag 9480
cacaaacact acctggacga gatcatcgaa cagatttctg aattttctaa acgtgtgatt 9540
ctggctgatg cgaatctgga taaagttctg tctgcctata acaagcatcg tgacaaaccg 9600
atccgcgaac aggctgagaa catcatccac ctgttcactc tgactaacct gggcgcgcca 9660
gcggctttca agtactttga taccaccatt gaccgcaagc gttacacctc cactaaagaa 9720
gtgctggacg cgactctgat ccaccagtcc atcaccggtc tgtacgagac ccgtatcgat 9780
ctgagccagc tgggcggtga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 9840
aagaaaaagt gacaaagccc gaaaggaagc tgagttggct gctgccaccg ctgagcaata 9900
actagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc tgaaaggagg 9960
aactatatcc ggat 9974
<210> 2
<211> 4694
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ttaactttaa gaaggagata tacatgtgaa acaaagcact attgcactgg cactcttacc 60
gttactgttt acccctgtga caaaagccat gagcgataaa attattcacc tgactgacga 120
cagttttgac acggatgtac tcaaagcgga cggggcgatc ctcgtcgatt tctgggcaga 180
gtggtgcggt ccgtgcaaaa tgatcgcccc gattctggat gaaatcgctg acgaatatca 240
gggcaaactg accgttgcaa aactgaacat cgatcaaaac cctggcactg cgccgaaata 300
tggcatccgt ggtatcccga ctctgctgct gttcaaaaac ggtgaagtgg cggcaaccaa 360
agtgggtgca ctgtctaaag gtcagttgaa agagttcctc gacgctaacc tggccggttc 420
tggttctggc catatgcacc atcatcatca tcatgacgat gacgataaga tgcccaaaaa 480
gaaacgaaag gtgggtatcc acggagtccc agcagccgac aaaaaatata gcatcggcct 540
ggacatcggt accaacagcg ttggctgggc agtgatcact gatgaataca aagttccatc 600
caaaaaattt aaagtactgg gcaacaccga ccgtcactct atcaaaaaaa acctgattgg 660
tgctctgctg tttgacagcg gcgaaactgc tgaggctacc cgtctgaaac gtacggctcg 720
ccgtcgctac actcgtcgta aaaaccgcat ctgttatctg caggaaattt tctctaacga 780
aatggcaaaa gttgatgata gcttctttca tcgtctggaa gagagcttcc tggtggaaga 840
agataaaaaa cacgaacgtc acccgatttt cggtaacatt gtggatgagg ttgcctacca 900
cgagaaatat ccgaccatct accatctgcg taaaaaactg gttgatagca ctgacaaagc 960
ggatctgcgt ctgatctacc tggctctggc acacatgatc aaattccgtg gtcacttcct 1020
gatcgaaggt gatctgaacc ctgataactc cgacgtggac aaactgttca ttcagctggt 1080
tcagacctat aaccagctgt tcgaagaaaa cccgatcaac gcgtccggtg tagacgctaa 1140
ggcaattctg tctgcgcgtc tgtctaagtc tcgtcgtctg gaaaacctga ttgcgcaact 1200
gccaggtgaa aagaaaaacg gcctgttcgg caatctgatc gccctgtccc tgggtctgac 1260
tccgaacttt aaatccaact ttgacctggc ggaagatgcc aagctgcagc tgagcaaaga 1320
tacctatgac gatgacctgg ataacctgct ggcacagatc ggtgatcagt atgccgatct 1380
gttcctggcc gcgaaaaacc tgtctgatgc gattctgctg tctgatatcc tgcgcgttaa 1440
cactgaaatt actaaagcgc cgctgagcgc atccatgatt aaacgttacg atgaacacca 1500
ccaggatctg accctgctga aagcgctggt gcgtcagcag ctgccggaaa aatacaagga 1560
gatcttcttc gaccagagca aaaacggtta cgcgggctac attgatggtg gtgcatctca 1620
ggaggaattc tacaaattca ttaaaccgat cctggaaaaa atggatggta ctgaagagct 1680
gctggttaaa ctgaatcgtg aagatctgct gcgcaaacag cgtaccttcg ataacggttc 1740
catcccgcat cagattcatc tgggcgaact gcacgctatc ctgcgccgtc aggaagactt 1800
ttatccgttc ctgaaagaca accgtgagaa aattgaaaaa atcctgacct tccgtattcc 1860
gtactatgta ggtccgctgg cgcgtggtaa ctcccgtttc gcttggatga cccgcaaaag 1920
cgaagaaacc atcaccccgt ggaatttcga agaagtcgtt gacaaaggcg cgtccgcgca 1980
gtctttcatc gaacgcatga cgaacttcga caaaaacctg ccgaacgaga aagtgctgcc 2040
gaaacactct ctgctgtacg agtacttcac tgtgtacaac gaactgacca aagtgaaata 2100
cgtcaccgaa ggtatgcgta aaccggcatt cctgtccggt gagcaaaaaa aagcaatcgt 2160
ggatctgctg ttcaaaacca accgtaaagt aaccgtgaaa cagctgaagg aagactattt 2220
caagaaaatc gaatgttttg attctgttga aatctccggc gtggaagatc gcttcaatgc 2280
gtccctgggt acgtatcacg acctgctgaa aattatcaaa gacaaagatt ttctggacaa 2340
cgaggaaaac gaagacatcc tggaggatat tgtactgacc ctgaccctgt tcgaagaccg 2400
tgagatgatc gaagaacgcc tgaaaaccta cgcccacctg ttcgatgaca aggtaatgaa 2460
gcagctgaaa cgtcgtcgtt ataccggctg gggtcgtctg tcccgtaaac tgatcaatgg 2520
catccgtgat aaacagtctg gcaaaaccat cctggacttc ctgaaatccg acggtttcgc 2580
gaatcgtaac ttcatgcaac tgattcatga cgattctctg actttcaaag aagacatcca 2640
gaaagcacag gtttccggcc agggtgactc tctgcacgag cacattgcca atctggctgg 2700
ttctccggct attaaaaagg gtattctgca gactgtgaaa gtagttgatg agctggtcaa 2760
agtaatgggc cgtcacaagc cggaaaacat tgtgatcgaa atggcacgtg aaaaccagac 2820
gacccagaaa ggtcagaaaa actctcgtga acgcatgaaa cgtatcgaag aaggcatcaa 2880
agaactgggc tctcagatcc tgaaggaaca ccctgtagaa aatacccagc tgcagaacga 2940
aaagctgtat ctgtattacc tgcagaacgg ccgcgatatg tatgtggacc aggaactgga 3000
tatcaaccgc ctgtccgatt acgatgtaga tcacatcgtg ccgcaaagct tcctgaaaga 3060
cgacagcatt gacaacaaag tactgacccg ttctgataag aaccgtggca aatccgataa 3120
cgtcccgtct gaagaagttg ttaaaaaaat gaaaaactat tggcgtcagc tgctgaacgc 3180
gaaactgatc acccagcgta agttcgacaa tctgactaaa gctgagcgcg gtggtctgtc 3240
cgaactggat aaagcgggtt ttatcaaacg ccagctggtt gaaacccgtc agatcacgaa 3300
gcacgttgcg cagattctgg actctcgtat gaacaccaaa tacgacgaaa acgacaaact 3360
gatccgcgag gttaaggtta tcaccctgaa aagcaaactg gtatccgatt ttcgtaaaga 3420
ctttcagttc tacaaagtgc gcgaaattaa caactatcac cacgctcacg atgcatatct 3480
gaatgcagtt gttggcacgg cgctgatcaa aaagtatccg aaactggaat ctgaattcgt 3540
atacggcgat tacaaagtgt atgacgttcg taagatgatc gcaaaatccg agcaggaaat 3600
tggtaaggcg acggcgaaat acttctttta ttccaatatt atgaactttt tcaaaaccga 3660
aatcaccctg gcgaatggtg aaattcgtaa acgcccgctg atcgaaacca acggtgaaac 3720
tggtgaaatc gtttgggaca aaggccgcga cttcgcgacc gtgcgtaaag ttctgtctat 3780
gccgcaagtg aacatcgtca agaagaccga agtacaaacc ggcggtttta gcaaagagag 3840
cattctgcca aaacgtaact ccgacaaact gatcgcgcgc aagaaagact gggatccgaa 3900
aaaatacggt ggtttcgatt ctccaaccgt tgcttattcc gttctggtgg tagccaaagt 3960
tgagaaaggt aaaagcaaaa aactgaaatc cgtaaaggaa ctgctgggta ttactatcat 4020
ggagcgtagc tccttcgaaa aaaacccgat cgattttctg gaagcgaaag gctataaaga 4080
agtcaaaaag gacctgatca tcaaactgcc aaaatacagc ctgttcgagc tggaaaacgg 4140
ccgtaaacgt atgctggcat ctgcgggcga actgcagaaa ggcaacgagc tggctctgcc 4200
gtccaaatac gtgaactttc tgtacctggc ctctcactac gaaaaactga aaggttcccc 4260
ggaagacaac gaacagaaac agctgttcgt agagcagcac aaacactacc tggacgagat 4320
catcgaacag atttctgaat tttctaaacg tgtgattctg gctgatgcga atctggataa 4380
agttctgtct gcctataaca agcatcgtga caaaccgatc cgcgaacagg ctgagaacat 4440
catccacctg ttcactctga ctaacctggg cgcgccagcg gctttcaagt actttgatac 4500
caccattgac cgcaagcgtt acacctccac taaagaagtg ctggacgcga ctctgatcca 4560
ccagtccatc accggtctgt acgagacccg tatcgatctg agccagctgg gcggtgacaa 4620
aaggccggcg gccacgaaaa aggccggcca ggcaaaaaag aaaaagtgac aaagcccgaa 4680
aggaagctga gttg 4694
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
agagcacagt cagcctggcg 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cttccagaat tggatctccg 20
<210> 5
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tacggaattg gggagccagc gga 23
<210> 6
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
caaagttaac tctctgtgtc t 21
<210> 7
<211> 225
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120
ataggagagc acagtcagcc tggcggtttt agagctagaa atagcaagtt aaaataaggc 180
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225
<210> 8
<211> 225
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120
ataggcttcc agaattggat ctccggtttt agagctagaa atagcaagtt aaaataaggc 180
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225
<210> 9
<211> 414
<212> PRT
<213> 猪(Sus scrofa)
<400> 9
Met Ser Glu Tyr Ile Arg Val Thr Glu Asp Glu Asn Asp Glu Pro Ile
1 5 10 15
Glu Ile Pro Ser Glu Asp Asp Gly Thr Val Leu Leu Ser Thr Val Thr
20 25 30
Ala Gln Phe Pro Gly Ala Cys Gly Leu Arg Tyr Arg Asn Pro Val Ser
35 40 45
Gln Cys Met Arg Gly Val Arg Leu Val Glu Gly Ile Leu His Ala Pro
50 55 60
Asp Ala Gly Trp Gly Asn Leu Val Tyr Val Val Asn Tyr Pro Lys Asp
65 70 75 80
Asn Lys Arg Lys Met Asp Glu Thr Asp Ala Ser Ser Ala Val Lys Val
85 90 95
Lys Arg Ala Val Gln Lys Thr Ser Asp Leu Ile Val Leu Gly Leu Pro
100 105 110
Trp Lys Thr Thr Glu Gln Asp Leu Lys Glu Tyr Phe Ser Thr Phe Gly
115 120 125
Glu Val Leu Met Val Gln Val Lys Lys Asp Ile Lys Thr Gly His Ser
130 135 140
Lys Gly Phe Gly Phe Val Arg Phe Thr Glu Tyr Glu Thr Gln Val Lys
145 150 155 160
Val Met Ser Gln Arg His Met Ile Asp Gly Arg Trp Cys Asp Cys Lys
165 170 175
Leu Pro Asn Ser Lys Gln Ser Pro Asp Glu Pro Leu Arg Ser Arg Lys
180 185 190
Val Phe Val Gly Arg Cys Thr Glu Asp Met Thr Ala Asp Glu Leu Gln
195 200 205
Gln Phe Phe Cys Gln Tyr Gly Glu Val Val Asp Val Phe Ile Pro Lys
210 215 220
Pro Phe Arg Ala Phe Ala Phe Val Thr Phe Ala Asp Asp Gln Val Ala
225 230 235 240
Gln Ser Leu Cys Gly Glu Asp Leu Ile Ile Lys Gly Ile Ser Val His
245 250 255
Ile Ser Asn Ala Glu Pro Lys His Asn Ser Asn Arg Gln Leu Glu Arg
260 265 270
Ser Gly Arg Phe Gly Gly Asn Pro Gly Gly Phe Gly Asn Gln Gly Gly
275 280 285
Phe Gly Asn Ser Arg Gly Gly Gly Ala Gly Leu Gly Asn Asn Gln Gly
290 295 300
Ser Asn Met Gly Gly Gly Met Asn Phe Gly Ala Phe Ser Ile Asn Pro
305 310 315 320
Ala Met Met Ala Ala Ala Gln Ala Ala Leu Gln Ser Ser Trp Gly Met
325 330 335
Met Gly Met Leu Ala Ser Gln Gln Asn Gln Ser Gly Pro Ser Gly Asn
340 345 350
Asn Gln Ser Gln Gly Asn Met Gln Arg Glu Pro Asn Gln Ala Phe Gly
355 360 365
Ser Gly Asn Asn Ser Tyr Ser Gly Ser Asn Ser Gly Ala Ala Ile Gly
370 375 380
Trp Gly Ser Ala Ser Asn Ala Gly Ser Gly Ser Gly Phe Asn Gly Gly
385 390 395 400
Phe Gly Ser Ser Met Asp Ser Lys Ser Ser Gly Trp Gly Met
405 410
<210> 10
<211> 1600
<212> DNA
<213> 猪(Sus scrofa)
<400> 10
caaagcccag atgagccttt gagaagcaga aaggtgtttg ttgggcgctg tacagaggac 60
atgactgctg atgagctgca gcagttcttt tgccagtacg gagaagtggt agatgtcttc 120
attcccaaac cattcagggc ttttgccttt gttacatttg cagatgatca ggtatttttc 180
tcttcctaat tttgtctcag ctaattaggt aatttctgtt gaactttttg cccttccata 240
tcagctaagc tctctgacct tataagctgt ggtgtatcgg ggcctagata tttgtggtaa 300
actccttagg ttattttttt agtatgcgac atttaagtgg acgtgttaaa tatcctttga 360
aaatgaacta aaatccctgt ttctgttact aaagtgaaag gctattttat gggtttaaat 420
gaaatgtgtt cattgcttat ttttcctcta gatagaggct tgtagatagt ggcctgaaat 480
ctaagtttta tcactatttt gatgtatgag tcaatggttt aatctttatt tacatccctt 540
atttcttata ggtcgcccag tctctttgtg gagaggactt gatcattaaa ggaatcagcg 600
tacatatatc caatgctgaa cctaaacaca atagcaatag acagttagaa agaagtggaa 660
gatttggtgg taatccaggt ggctttggga atcagggtgg ctttggtaac agtagagggg 720
gtggagctgg tttggggaac aatcaaggta gtaacatggg tggagggatg aactttggtg 780
ctttcagcat caatccagcg atgatggctg cagcccaggc ggctctgcag agcagctggg 840
gtatgatggg catgttagcc agtcagcaga accagtcagg cccatcgggt aataaccaaa 900
gccaaggcaa catgcaaaga gagccaaacc aggcctttgg ttctggaaat aactcgtata 960
gtggttctaa ttcaggggca gcgattggtt ggggatcagc atcaaatgca gggtcaggca 1020
gtggttttaa tggaggcttt ggctcaagca tggattccaa atcttcgggc tggggaatgt 1080
agacgttggg ttatggttgg ttggtataga ctggtgggaa ttcaaatttt tctaaactca 1140
tggtaagtat attgtaaaat acatatgtac taagaatttt caaaattggt ttgttcggtg 1200
tggagtatat tcagcagtat ttttgacatt tttctttaga aaaaggaaga gctaaaggaa 1260
ttttataagt tttgttacat aaagggttga aatattgagt gtttgaaagt gaactgctgt 1320
ttgcctgatt ggtaaaccaa cacactacaa ttgatatcaa aaggtttctc ctgtaatatt 1380
ttatccctgg acttgtcaag tgaattcttt gcatgttcaa aatggaaacc attgattaga 1440
actacattct tttctccttg ttttaatttg aaccccacca tatggatttt tcccttagga 1500
aaatctcctt tttggagatc atggtgtcac agtgttcttt cgttttcgtt tttgtttttt 1560
taacacttgt ctcccttcat atacaaaagt acaatatgaa 1600
<210> 11
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
cagcgtacat atatccaatg c 21
<210> 12
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
tctacattcc ccagcccgaa g 21
<210> 13
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
agttagaaag aagtggaaga t 21
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
cattaaaacc actgcctgac cct 23
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gcggctctgc agagcagctg 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gccagtcagc agaaccagtc 20
<210> 17
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
caccgcggct ctgcagagca gctg 24
<210> 18
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aaaccagctg ctctgcagag ccgc 24
<210> 19
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
caccgccagt cagcagaacc agtc 24
<210> 20
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aaacgactgg ttctgctgac tggc 24
<210> 21
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ttctagctct aaaaccagct gctctgcaga gccgccctat agtgagtcgt attaatttc 59
<210> 22
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gcagctggtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaactt 59
<210> 23
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ttctagctct aaaacgactg gttctgctga ctggccctat agtgagtcgt attaatttc 59
<210> 24
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
accagtcgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaactt 59
<210> 25
<211> 225
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120
atagggcggc tctgcagagc agctggtttt agagctagaa atagcaagtt aaaataaggc 180
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225
<210> 26
<211> 225
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120
atagggccag tcagcagaac cagtcgtttt agagctagaa atagcaagtt aaaataaggc 180
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225
<210> 27
<211> 189
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gtttggggaa caatcaaggt agtaacatgg gtggagggat gaactttggt gctttcagca 60
tcaatccagc gatgatggct gcagcccagg cggctctgaa atcatcatgg ggtatggtgg 120
gcatgttagc cagtcagcag aaccaaagcg gcccatcggg taataaccaa agccaaggca 180
acatgcaaa 189

Claims (13)

1.一种原核Ca9高效表达载体pKG-GE4,其特征在于序列如SEQ ID NO.1所示。
2.权利要求1所述的原核Ca9高效表达载体在制备Ca9蛋白中的应用。
3.含有权利要求1所述的原核Ca9高效表达载体pKG-GE4的基因工程菌。
4.权利要求3所述的基因工程菌在制备Ca9蛋白中的应用。
5.一种制备Ca9蛋白的方法,其特征在于包含以下步骤:
(1)培养权利要求3所述的基因工程菌,加入IPTG,在低于前期培养温度5℃的温度下诱导所述的基因工程菌表达目的蛋白,并收集菌体沉淀;
(2)粗提融合蛋白,采用Ni-NTA琼脂糖柱进行融合蛋白的纯化;
(3)用带his标签的重组牛肠激酶酶切融合蛋白,并用Ni-NTA树脂纯化得到酶切后去除TrxA-His的NLS-spCas9-NLS目的蛋白。
6.一种用于构建TARDBP基因突变的ALS模型猪核移植供体细胞的基因编辑系统,其特征在于包含按照权利要求5所述方法制备的Ca9蛋白,针对TARDBP基因的gRNA以及含有TARDBP突变位点的单链Donor DNA。
7.根据权利要求6所述的基因编辑系统,其特征在于所述的针对TARDBP基因的gRNA的靶点选自SEQ ID NO.15所示的TARDBP-E6-gRNA2和SEQ ID NO.16所示的TARDBP-E6-gRNA3。
8.根据权利要求6所述的基因编辑系统,其特征在于所述的针对TARDBP基因的TARDBP-T7-gRNA2,其转录模板如SEQ ID NO.25所示;针对TARDBP基因的TARDBP-T7-gRNA3,其转录模板如SEQ ID NO.26所示。
9.根据权利要求6所述的基因编辑系统,其特征在于所述的含有TARDBP突变位点的单链Donor DNA序列如SEQ ID NO.27所示。
10.根据权利要求6-9中任意一项所述的基因编辑系统,其特征在于Ca9蛋白:TARDBP-T7-gRNA2:TARDBP-T7-gRNA3:单链Donor DNA的质量比为1:1:4:2。
11.权利要求6-9中任一项所述的基因编辑系统在构建TARDBP基因突变的猪重组细胞中的应用。
12.一种重组细胞,其特征在于由权利要求6-9中任一项所述的基因编辑系统共转染猪原代成纤维细胞经验证后所得。
13.权利要求6-9中任一项所述的基因编辑系统、权利要求12所述的重组细胞在构建TARDBP基因突变的肌萎缩侧索硬化症模型猪中的应用。
CN202110361873.5A 2021-04-02 2021-04-02 用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用 Active CN115161335B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110361873.5A CN115161335B (zh) 2021-04-02 2021-04-02 用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110361873.5A CN115161335B (zh) 2021-04-02 2021-04-02 用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用

Publications (2)

Publication Number Publication Date
CN115161335A true CN115161335A (zh) 2022-10-11
CN115161335B CN115161335B (zh) 2023-08-25

Family

ID=83475697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110361873.5A Active CN115161335B (zh) 2021-04-02 2021-04-02 用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用

Country Status (1)

Country Link
CN (1) CN115161335B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190169597A1 (en) * 2016-08-19 2019-06-06 Bluebird Bio, Inc. Genome editing enhancers
CN110541028A (zh) * 2019-08-27 2019-12-06 深圳市宝安区妇幼保健院 一种检测fus基因突变和tardbp基因突变的方法
CN111349697A (zh) * 2018-12-24 2020-06-30 中国科学院生物物理研究所 Tdp-43蛋白病诊断和治疗的新靶点
CN112442515A (zh) * 2019-09-02 2021-03-05 南京启真基因工程有限公司 gRNA靶点组合在构建血友病模型猪细胞系中的应用
CN114990157A (zh) * 2021-03-01 2022-09-02 南京启真基因工程有限公司 用于构建lmna基因突变的扩张型心肌病模型猪核移植供体细胞的基因编辑系统及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190169597A1 (en) * 2016-08-19 2019-06-06 Bluebird Bio, Inc. Genome editing enhancers
CN111349697A (zh) * 2018-12-24 2020-06-30 中国科学院生物物理研究所 Tdp-43蛋白病诊断和治疗的新靶点
CN110541028A (zh) * 2019-08-27 2019-12-06 深圳市宝安区妇幼保健院 一种检测fus基因突变和tardbp基因突变的方法
CN112442515A (zh) * 2019-09-02 2021-03-05 南京启真基因工程有限公司 gRNA靶点组合在构建血友病模型猪细胞系中的应用
CN114990157A (zh) * 2021-03-01 2022-09-02 南京启真基因工程有限公司 用于构建lmna基因突变的扩张型心肌病模型猪核移植供体细胞的基因编辑系统及其应用

Also Published As

Publication number Publication date
CN115161335B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
KR101307880B1 (ko) 폴리진을 사용한 멀티단백질 복합체의 재조합 발현
DK3087178T3 (en) PROCEDURE FOR PREPARING OXALATE OXIDASES WITH ACTIVITY OPTIMUM NEAR PHYSIOLOGICAL PH AND APPLICATION OF SUCH RECOMBINANT OXALATE OXIDASES IN THE TREATMENT OF OXALATE-RELATED DISEASES
AU636537B2 (en) Improvement of the yield when disulfide-bonded proteins are secreted
CN111893104B (zh) 一种基于结构的crispr蛋白的优化设计方法
CN110923183A (zh) 产羊毛甾醇大肠杆菌菌株的构建方法
CN113278061B (zh) 一种生物化学法制备索马鲁肽的方法
CN112553176B (zh) 一种热稳定性提高的谷氨酰胺转氨酶
CN115247173A (zh) 构建tmprss6基因突变的缺铁性贫血猪核移植供体细胞的基因编辑系统及其应用
CN115232817A (zh) 用于构建三基因联合突变的小型猪核移植供体细胞的基因编辑系统及其应用
CN115161335B (zh) 用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用
CN115247163A (zh) 用于构建gp130基因突变的胃癌模型猪核移植供体细胞的基因编辑系统及其应用
CN115232793A (zh) 用于构建sod1基因突变的als模型猪核移植供体细胞的基因编辑系统及其应用
CN115232811A (zh) 用于构建hbb基因突变的镰刀型细胞贫血症模型猪核移植供体细胞的方法及应用
CN115232834A (zh) 用于构建oca-1a型白化病模型猪核移植供体细胞的基因编辑系统及其应用
CN115232794A (zh) 一种基因编辑系统及其在构建oca-1b型白化病模型猪核移植供体细胞中的应用
CN115232812A (zh) 一种构建mrap2基因突变的重症早发性肥胖症模型猪核移植供体细胞的方法
CN115247153A (zh) 用于构建hnf1a基因突变的糖尿病模型猪核移植供体细胞的基因编辑系统及其应用
CN115232818A (zh) 构建dok7基因突变的先天性肌无力模型猪核移植供体细胞的基因编辑系统及其应用
CN115247164A (zh) 构建腺瘤性息肉病模型猪及结直肠癌模型猪的基因编辑系统及其应用
CN115232814A (zh) 用于构建crybb2基因突变的先天性白内障疾病模型猪核移植供体细胞的方法和系统
CN115247175A (zh) 构建setdb1基因突变的表观遗传失调模型猪核移植供体细胞的基因编辑系统及其应用
CN115232836A (zh) 构建crygc基因突变的先天性白内障模型猪核移植供体细胞的基因编辑系统及其应用
CN115232813A (zh) 用于构建vWF基因突变的血管性血友病模型猪核移植供体细胞的基因编辑系统及其应用
CN115247191A (zh) 基因编辑系统及其在构建双基因突变的痣样基底细胞癌综合征猪核移植供体细胞中的应用
CN115232816A (zh) 用于构建yap1基因突变的白内障模型猪核移植供体细胞的crispr系统及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant