CN112824529A - 一种条件性基因敲除或者拯救方法 - Google Patents

一种条件性基因敲除或者拯救方法 Download PDF

Info

Publication number
CN112824529A
CN112824529A CN201911151416.2A CN201911151416A CN112824529A CN 112824529 A CN112824529 A CN 112824529A CN 201911151416 A CN201911151416 A CN 201911151416A CN 112824529 A CN112824529 A CN 112824529A
Authority
CN
China
Prior art keywords
segment
target gene
site
sequence
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911151416.2A
Other languages
English (en)
Other versions
CN112824529B (zh
Inventor
张亚鸽
韩冰舟
张博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201911151416.2A priority Critical patent/CN112824529B/zh
Publication of CN112824529A publication Critical patent/CN112824529A/zh
Application granted granted Critical
Publication of CN112824529B publication Critical patent/CN112824529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种条件性基因敲除或者基因拯救的方法。本发明利用基因组定点修饰技术(如TALEN或Cas9/gRNA系统)将可条件性翻转的载体插入靶基因序列中,所述载体包含方向相反的两个DNA区段,分别用于维持靶基因表达和破坏靶基因功能,并且还可以任选连接有带有不同颜色的荧光报告基因,通过所述载体的翻转实现基因的条件性敲除或拯救,并且同时标记基因敲除或者拯救的结果。

Description

一种条件性基因敲除或者拯救方法
技术领域
本发明涉及基因编辑领域,更具体涉及一种基因敲除或者拯救的方法。
背景技术
近年来,基于TALEN和CRISPR/Cas等人工核酸酶的基因编辑技术正越来越广泛地应用于生命科学基础理论研究,在农业、医疗健康等领域也逐渐展现出巨大的应用潜力。目前该类技术在制备indel等简单突变体方面的应用已经较为成熟,但是在对基因功能进行精确控制,例如制备条件性基因敲除或者基因拯救等方面仍然存在效率低、周期长等问题,严重制约了对基因功能的深入与精细研究,限制了基因编辑技术在疾病模型构建与基因治疗等方面的应用。
构建条件性基因敲除的经典方法主要是利用同源重组(homologousrecombination,HR)介导的基因敲入将外源DNA序列引入靶基因中。但是HR事件在细胞中发生的概率很低,因而极大地限制了HR介导的基因敲入效率。人工核酸酶诱导DNA发生双链断裂后,细胞主要是通过非同源末端连接(non-homologous end joining,NHEJ)的方式进行损伤修复。因此,基于NHEJ进行基因敲入(靶向插入)可以获得比HR更高的效率,但是,该目前基于该策略还尚未实现对基因敲除或拯救的灵活操作的目的。
因此,迫切需要提供一种能够精确调节基因功能,高效实现基因组水平的条件性基因敲除或者拯救的技术。
发明内容
本发明人经过多年的研究,为了实现高效快速的条件性基因敲除和拯救的转换,开发了一种基因功能编辑方法,其能够便捷的实现基因敲除和/或拯救,具体而言,该方法利用基因组定点修饰技术(如TALEN或Cas9/gRNA系统)将可条件性翻转的核酸构建体插入靶基因的选定位置中。所述核酸构建体包含区段1和编码方向与区段1相反的区段2,在区段1和区段2的两端包含位点特异性酶的识别位点,能够在位点特异性酶的作用下实现区段1和区段2的翻转。其中,区段1包含能够还原目的基因表达的基因编码序列,区段1的编码方向与靶基因转录方向一致时,不会破坏基因的功能,并且还可以任选连接有带有荧光报告基因,从而在保持原有基因表达的同时,标记基因的內源表达情况。区段2携带能够破坏內源基因表达(转录或者翻译)的元件,当区段2的编码方向与靶基因转录方向一致时,即能够破坏靶基因的正常功能。
于是,当核酸构建体的插入方向为区段1-区段2时,则区段1能够正常编码,区段2不会发挥功能,于是靶基因能够正常发挥功能;此时,当进一步与位点特异性酶接触时,核酸构建体在插入位置翻转,调转为区段2-区段1,则区段2正常编码,而区段1不会发挥功能,此时靶基因被失活或者功能被降低,从而实现条件性敲除;
当核酸构建体的插入方向为区段2-区段1时,则区段2能够正常编码,区段1不会发挥功能,此时靶基因被失活或者功能被降低,从而实现了靶基因的敲除;如果进一步与位点特异性酶接触,则核酸构建体在插入位置翻转,调转为区段1-区段2,则区段1正常编码,而区段2失去功能,此时靶基因重新恢复正常表达,从而实现条件性的基因拯救。正是基于上述设计,完成了本发明。具体而言:
本发明第一个方面提供了一种基因敲除的方法,其包括如下步骤:
(1)在靶基因的选定位置处制造双链缺口,所述选定位置优选地位于靶基因的内含子中;
(2)将可条件性翻转的核酸构建体连接入所述双链缺口中,
(3)翻转所述核酸构建体;
其中连接入所述双链接口的所述核酸构建体沿靶基因转录方向依次包含区段1和区段2,其中所述区段1的有义链(编码链)位于靶基因的有义链(编码链)上,且所述区段1的编码方向与靶基因的转录方向相同;所述区段2的有义链(编码链)位于靶基因的反义链(模板链)上,且所述区段2的编码方向与靶基因的转录方向相反;
所述区段1包含靶基因选定位置后的剩余编码序列C1,用于与选定位置前的靶基因编码序列组成完整的靶基因编码序列,以维持靶基因的正常表达;
所述区段2包含表达终止信号,用于在所述核酸构建体翻转后降低或者终止靶基因的转录和/或翻译。
本发明的第二个方面同样提供了一种基因敲除的方法,其包含如下步骤:
(1)在靶基因的选定位置处制造双链缺口,其中所述选定位置优选地位于靶基因的内含子中;
(2)将可条件性翻转的核酸构建体连接入所述双链缺口中;
其中连接入所述双链接口的所述核酸构建体沿靶基因转录方向依次包含区段2和区段1,其中所述区段2的有义链(编码链)位于靶基因的有义链(编码链)上,且所述区段2的编码方向与靶基因的转录方向相同;所述区段1的有义链(编码链)位于靶基因的反义链(模板链)上,且所述区段1的编码方向与靶基因的转录方向相反;
所述区段1包含靶基因选定位置后的剩余编码序列C1,用于与选定位置前的靶基因编码序列组成完整的靶基因编码序列,从而在所述核酸构建体翻转后维持靶基因的正常表达;
所述区段2包含表达终止信号,用于降低或者终止靶基因的转录和/或翻译。
其中第一个方面和第二个方面技术方案的主要差别在于核酸构建体初始连接入双链缺口的方向不同,按照第一个方面中所描述的方向插入时,此时核酸构建体并不能敲除靶基因的功能,因此需要将核酸构建体进行翻转以实现基因敲除的效果。
此外,如果连接入双链缺口的方法不具有方向性(例如使用非同源重组的方法),则核酸构建体会具有两个方向的插入,各自占比约为50%;此时,只需要筛选具有所需要方向的插入即可。
本发明的第三个方面提供了一种基因拯救的方法,其包括如下步骤:
(1)在靶基因的选定位置处制造双链缺口,其中所述选定位置优选地位于靶基因的内含子中;
(2)将可条件性翻转的核酸构建体连接入所述双链缺口中;
(3)翻转所述核酸构建体;
其中连接入所述双链接口的所述核酸构建体沿靶基因转录方向依次包含区段2和区段1,其中所述区段2的有义链(编码链)位于靶基因的有义链(编码链)上,且所述区段2的编码方向与靶基因的编码方向相同;所述区段1的有义链(编码链)位于靶基因的反义链(模板链)上,且所述区段1的编码方向与靶基因的转录方向相反;
所述区段1包含靶基因选定位置后的剩余编码序列C1,用于与选定位置前的靶基因编码序列组成完整的靶基因编码序列,用于在所述核酸构建体翻转后维持靶基因的正常表达;
所述区段2包含表达终止信号,用于降低或者终止靶基因的转录或/翻译。
根据以上的任一方面,在一个实施方案中,其中区段1(沿其编码方向)依次包含位点特异性重组酶的识别位点S1、所述选定位置之后的第一个剪接位点以及选定位置之后所述待修饰基因的剩余编码序列C1和转录终止序列T1,所述转录终止序列T1包含1-50个,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个串联的转录终止信号(TTS),和/或翻译终止信号;或者
所述区段2(沿其编码方向)依次包含位点特异性重组酶的识别位点S2、所述选定位置之后的第一个剪接位点、转录终止序列T2,所述转录终止序列T2包含1-50个,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个串联的转录终止信号(TTS);例如,所述转录终止信号可以是SV40 polyA和/或BGH polyA等;
其中所述特异性重组酶的识别位点S1和S2用于在识别所述识别位点S1和S2的位点特异性重组酶的作用下,翻转所述核酸构建体。
根据以上的任一方面,在另一个实施方案中,其中步骤(3)的翻转所述核酸构建体是通过将能够识别所述识别位点S1和/或S2的位点特异性重组酶与连接入所述双链缺口的所述核酸构建体接触而实现的。
根据以上的任一方面,在另一个实施方案中,其中步骤(1)中所述选定位置是ZFN、TALEN或CRISPR/Cas系统的识别位点,具体的,步骤(1)包括下列步骤:将包含待修饰基因的基因组与ZFN、TALEN或Cas以及辅助核酸序列接触,优选的,所述选定位置是CRISPR/Cas(例如CRISPR/Cas9或Cas9/gRNA)的识别位点,所述辅助核酸序列为单链向导RNA(sgRNA),或者crRNA(CRISPR-derived RNA)与tracrRNA(trans-activating RNA)形成的tracrRNA/crRNA核酸复合物。
根据以上的任一方面,在另一个实施方案中,其中所述区段2中,所述剪接位点后还包含所述选定位置之后的靶基因的部分编码C2,所述部分编码序列C2连同所述选定位置前的部分靶基因编码序列编码得到突变型蛋白,所述突变型蛋白与所述靶基因编码的野生型蛋白相比功能降低或者丧失。
根据以上的任一方面,在另一个实施方案中,其中所述区段2中,所述部分编码序列C2后还包含报告基因R2,优选地,所述报告基因R2编码荧光蛋白或荧光素酶及其衍生物,例如荧光素酶、绿色荧光蛋白、tdTomato、DsRed、tdGFP、mCherry、mStrawberry、mRFP、dsRed、EYFP、EBFP、ECFP、mCerulean、mScarlet、mEmerald、mCitrine、mVenus、YPet、mKO、mKate、mPlum、mTFP1、Dendra2或Kaede、Kakumi、Zebrabow等;还优选地,所述剩余编码序列C2和报告基因R2之间通过接头连接或者直接融合表达;进一步优选地,所述接头是2A肽段,例如T2A肽段、P2A肽段、E2A肽段、F2A肽段、BmCPV2A肽段或BmIFV2A肽段,或者IRES序列。
根据以上的任一方面,在另一个实施方案中,其中步骤(2)包括:
1)提供包含区段1和区段2的载体,所述载体例如质粒载体或微环载体(minicircle vector),优选地,所述质粒载体或微环载体中还包含用于线性化的切割位点;
2)获得步骤1)所述载体的线性化形式;所述线性化为体内线性化或者体外线性化;优选地,所述线性化为体内线性化,更优选地,所述体内线性化包括:将步骤1)的载体在细胞内与能够识别所述线性化的切割位点的酶和/或辅助核酸序列接触;
3)通过非同源末端连接(NHEJ)将步骤2)得到的线性化形式的载体连接入所述双链缺口中;
在一个实施方案中,所述核酸构建体即上述线性化形式的载体。
优选地,所述用于线性化的切割位点是ZFN、TALEN或CRISPR/Cas的识别位点,并且所述识别位点的序列不存在于所述细胞的基因组中,更优选地,所述能够识别所述用于线性化的切割位点的酶选自ZFN、TALEN和Cas(例如Cas9),进一步优选地,所述线性化的切割位点是CRISPR/Cas9的识别位点,更进一步优选地,所述CRISPR/Cas9的识别位点是hEMX1位点,所述hEMX1位点的序列例如为GTCACCTCCAATGACTAGGGTGG;或者lamGolden位点,所述lamGolden位点的序列例如为GGGTCAACGACTTCCTGCACGGG;
还优选地,所述用于线性化的切割位点例如位于区段1和区段2外侧,具体地,
当载体从5’-3’依次包含区段1和区段2,其中区段1的有义链位于载体的有义链上,区段2的有义链序列位于载体的反义链上,并且转录方向与区段1相反时,线性化的切割位点位于区段1的5’上游或者区段2的3’下游;或者
当载体从5’-3’依次包含区段2和区段1,其中区段2的有义链序列位于载体的有义链上,区段1的有义链位于载体的反义链上,并且转录方向与区段1相反时,线性化的切割位点位于区段2的5’上游或者区段1的3’下游;
或者所述线性化的切割位点位于区段1和区段2之间,并且区段1和区段2优选地位于质粒载体中时,优选地,在所述区段1和区段2沿各自编码方向的最末端位置设置一组位点特异性重组酶的识别位点,所述一组位点特异性重组酶识别位点用于在选定位置插入核酸构建体后,去除区段1和区段2之间的载体序列;所述位点特异性重组酶识别位点例如attB和attP位点,两个rox位点或者两个FRT位点等;进一步优选地,当核酸构建体连接入所述选定位置后,还包括将所述核酸构建体与phiC31、Dre或Flp的蛋白质或者mRNA相接触的步骤。
根据以上的任一方面,在另一个实施方案中,其中所述区段1中的剩余编码序列C1包含一个或多个核苷酸位点的替换、插入和/或缺失,从而使由所述剩余编码序列C1恢复表达的靶基因的功能与野生型靶基因的功能相同或者不同。
根据以上的任一方面,在另一个实施方案中,其中所述区段1中的剩余编码序列C1还与报告基因R1相连接,优选地,所述报告基因R1选自荧光素酶、荧光蛋白或其衍生物,所述荧光蛋白例如绿色荧光蛋白、tdTomato、DsRed、tdGFP、mCherry、mStrawberry、mRFP、dsRed、EYFP、EBFP、ECFP、mCerulean、mScarlet、mEmerald、mCitrine、mVenus、YPet、mKO、mKate、mPlum、mTFP1、Dendra2或Kaede、Kakumi、Zebrabow等;还优选地,所述剩余编码序列C1和报告基因R1之间通过接头连接或者直接连接;更优选地,所述接头是是2A肽段,例如T2A肽段、P2A肽段、E2A肽段、F2A肽段、BmCPV2A肽段、BmIFV2A肽段,或者IRES序列。
根据以上的任一方面,在另一个实施方案中,其中所述位点特异性重组酶的识别位点S1和位点特异性重组酶的识别位点S2的序列不同并且匹配使用,例如所述位点特异性重组酶的识别位点S1和识别位点S2分别包含lox序列,优选地,所述识别位点S1和识别位点S2包含方向相反(对置)的lox序列;更优选地,所述lox序列是野生型loxP位点的变体序列,使得识别位点S1和S2的lox序列被所述位点特异性重组酶识别切割并介导区段1和区段2的翻转后,所产生的两个新lox序列中的至少一个难以被所述位点特异性重组酶再次识别和/或所述两个新的lox序列在所述位点特异性重组酶作用下实现重组的效率降低或者丧失,从而使得经过一次翻转后的区段1和区段2不能被再次翻转;例如所述识别位点S1和S2分别选自lox66和lox71、lox43和lox44或者lox75和lox76;或者
所述位点特异性重组酶的识别位点S1和S2分别包含选自attB和attP的序列,且所述attB与attP的方向相反从而介导二者之间的序列翻转;
优选地,所述位点特异性重组酶为Cre重组酶、Flp重组酶或phiC31重组酶等。
本发明的第四个方面提供了用于以上任一方面所述方法的重组载体,所述重组载体例如质粒载体或者微环载体,其包含前述定义的区段1、区段2以及线性化位点,优选地,所述线性化位点位于区段1和区段2的外侧或者位于区段1和区段2之间。
在一个实施方案中,所述重组载体的序列如SEQ ID NO:1-3所示。
本发明的第五个方面提供了一种包含本发明第四个方面所述重组载体的细胞、组织或器官,所述细胞优选是细菌细胞、真菌细胞、动物细胞或植物细胞,其中更优选为动物细胞,最优选为哺乳动物细胞或鱼类细胞,例如大鼠、小鼠或斑马鱼细胞;所述组织和/或器官优选为皮肤、角膜、肌腱、骨、血液、血管、神经、心脏瓣膜、软骨组织、神经嵴、朗格罕氏岛和肌肉组织;所述器官优选选自:肾脏、肝脏、心脏、小肠、胃、大肠、脾、骨髓、胸腺、淋巴结、肺和胰腺。
本发明的第六个方面提供了一种基因组敲除和/或拯救试剂盒,其包含本发明第四个方面的重组载体或者第五个方面所述的细胞、组织或器官。
本发明所述的方法,能够方便灵活的靶向细胞内的任何基因,并且实现基因表达可控性调节,同时能够实时标记基因敲除或者拯救的结果,具有广阔的应用前景。
附图说明
图1显示了通过基因敲入技术在斑马鱼sox10基因中定点产生条件性敲除并耦合基因标记的双功能等位基因。其中图A是基于双功能FoRe供体的基因敲入策略示意图,该供体由两部分组成(左半侧阴影突出显示部分用于维持sox10的功能,右半侧阴影突出显示部分用于破坏sox10的功能)。sox10位点显示为深色矩形框,而hEMX1位点显示为浅色矩形框。图B中上图(对照):成功实现FoRe供体敲入的斑马鱼F0(#2)的F1胚胎的共聚焦图像,显示了耳泡和色素细胞中只有红色荧光(如白色箭头所示)。下图(+Cre mRNA):对F1胚胎进行CremRNA注射之后,可以看到明显的荧光信号转换,从红色荧光变为绿色荧光(如白色箭头所示)。比例尺=100μm。图C是基因型为sox1066-FoR-ReG-71/+F1胚胎的基因敲入等位基因的接口PCR和测序结果。KI:sox10 FoRe供体敲入F1胚胎的基因组DNA模板。WT:野生型胚胎的基因组DNA模板。图D是注射Cre mRNA后,对重组的胚胎进行5'接口检测的PCR结果。WT:野生型胚胎的基因组DNA模板。EGFP+:Cre mRNA注射后重组的胚胎基因组DNA模板。
图2显示了利用Cre重组酶使sox10 FoRe等位基因失活,并对表达正常和突变sox10的细胞进行嵌合体追踪分析。其中图A是对sox1066-PoR-ReG-71/+杂合子(源自#2F0)自交产生的后代进行单细胞阶段Cre mRNA注射,并对注射后的48hpf的F2胚胎进行表型分析的结果。所有注射的胚胎几乎没有显示tdTomato荧光信号。在这些胚胎中,有26.7%(32/120)的胚胎显示正常数量的无荧光的色素细胞(组I),其基因型最有可能是sox10+/+。有50%(60/120)的胚胎的色素细胞较少,带有EGFP荧光信号(组II),其基因型最有可能是sox10p -ReG-FoR-72/+。有23.3%(28/120)的胚胎显示除眼睛之外的身体出现大量的色素丢失的表型,并带有EGFP荧光信号(III组),其基因型最有可能是sox10p-ReG-FoR-72/p-ReG-FoR-72。白色箭头表示耳泡。在框状区域的较高放大倍数下,可以看到躯干中精细的sox10表达模式。比例尺=200μm。图B是对图A中的单个胚胎进行基因分型的结果。通过一对引物sF3和sR1可以从内源性野生型等位基因上扩增出一条407bp的条带或从敲入的等位基因上扩增出一条约560bp的条带。琼脂糖凝胶电泳结果显示组I中的胚胎只有一条较小的野生型条带,组II中的胚胎同时有一条野生型条带和一条较大的基因敲入条带,而组III中的胚胎只有一条较大的基因敲入条带,这些结果说明图A中的胚胎的表型和基因型之间有很好的对应关系。
图3显示了Bi-FoRe策略可以在sox10基因座上实现条件性敲除和拯救。其中图A是基于双功能Bi-FoRe供体的基因敲入策略示意图,该供体由两部分组成:左半侧阴影突出显示部分用来维持sox10的功能,右半侧阴影突出显示部分用来破坏sox10的功能。sox10位点显示为深色矩形框,hEMX1位点显示为浅色矩形框,并位于供体的中间,可以通过正向整合以便之后实现基因的条件性敲除,或者通过反向整合以便之后实现基因的条件性拯救。图B是sox10Bi-66-FoR-ReG-71/+F1胚胎和sox10Bi-71-ReG-FoR-66/+F1胚胎的共聚焦图像。比例尺=200μm。图C是各个sox10Bi-66-FoR-ReG-71/+F1后代的敲入等位基因的接口PCR和直接测序结果。KI:sox10 Bi-FoRe载体正向敲入胚胎的基因组DNA模板。WT:野生型胚胎的基因组DNA模板。图D是各个sox10Bi-71-ReG-FoR-66/+F1后代的敲入等位基因的接口PCR和直接测序结果。KI:sox10Bi-FoRe载体反向敲入胚胎的基因组DNA模板。WT:野生型胚胎的基因组DNA模板。比例尺=200μm。
图4显示了在sox10基因座上对Bi-FoRe技术进行条件性基因敲除和拯救的可行性评估。其中图A是通过Cre介导的重组,利用正向整合的sox10等位基因实现条件性基因敲除。正常的sox10Bi-66-FoR-ReG-71/+F1自交的对照组胚胎显示有tdTomato信号和色素。但在F2子代中注射了Cre mRNA的实验组表现出严重的色素损失和荧光转换。说明sox10正向整合的Bi-FoRe等位基因可以实现条件性基因敲除。比例尺=200μm。图B是对Cre介导的重组后胚胎的敲入等位基因的接口进行检测的PCR结果。EGFP+:Cre mRNA注射的重组胚胎的基因组DNA模板。WT:野生型胚胎的基因组DNA模板。图C是分别以未注射Cre mRNA的基因敲入胚胎(Ctrl)和注射Cre mRNA后突变(Mutated)的胚胎的cDNA为模板进行的RT-PCR结果。图D是通过Cre介导的重组,利用反向整合的sox10等位基因实现条件性基因拯救。两个实现反向整合的F0杂交后的一部分胚胎显示出EGFP信号和严重的色素损失。而在两个F0杂交产生的后代中注射Cre mRNA后,一些注射的胚胎显示出荧光转换和色素的恢复,说明sox10反向整合的Bi-FoRe等位基因可以实现条件性基因拯救。比例尺=200μm。图E是对Cre介导的重组后的红色荧光胚胎的敲入等位基因的接口进行检测的PCR结果。tdTomato+:Cre mRNA注射后重组的红色荧光胚胎的基因组DNA模板。WT:野生型胚胎的基因组DNA模板。图F是分别以未注射Cre mRNA的突变胚胎(Ctrl)和注射Cre mRNA后色素恢复(Rescued)的胚胎的cDNA为模板进行的RT-PCR结果。
图5显示了通过phiC31介导的重组去除整合质粒的骨架示意图和结果,其中图A是通过phiC31介导的位点重组去除sox10 Bi-FoRe等位基因的骨架示意图。phiC31介导重组后,sox10等位基因分别命名为sox10Mini-66-FoR-ReG-71或sox10Mini-71-FoR-ReG-66,这里以前者为例。图B是phiC31介导的重组后,对重组后的胚胎的等位基因接口进行PCR检测的结果。WT:野生型胚胎的基因组DNA模板。图C是分别对sox10Bi-66-FoR-ReG-71/+或sox10Bi-66-ReG-FoR-71/+F1胚胎注射phiC31 mRNA之后的共聚焦图像。去除骨架之后,荧光强度与以前相当。比例尺=200μm。图D是在体外去除骨架后基于微环Bi-FoRe供体的敲入策略示意图。图E是注射了微环Bi-FoRe供体敲入实验的F0胚胎发育至48hpf时的共聚焦图像。比例尺=200μm。
具体实施方式
还可进一步通过实施例来理解本发明,然而,要理解的是,这些实施例不限制本发明。现在已知的或进一步开发的本发明的变化被认为落入本文中描述的和以下要求保护的本发明范围之内。
定义
术语“基因敲除”是指使靶基因的功能降低或者完全缺失,例如,使靶基因的编码序列发生改变(例如突变、序列片段的缺失或者插入等)、降低或者完全缺失靶基因的转录和/或翻译。
术语“基因拯救”是指对恢复已发生功能降低或者缺失的内源靶基因的功能。例如,恢复靶基因的编码序列,或者使靶基因的转录和/或翻译恢复至正常水平。
术语“靶基因”是指存在于生物体中任何被选定的用于基因敲除或者基因拯救的基因,其具体功能不限,可以是任何发育、代谢过程所涉及的基因。
术语“选定位置”是指基于所使用的基因靶向技术的基因序列识别特性而在待修饰基因序列中筛选获得的能够被基因靶向技术所识别(如切割获得单链或双链缺口)的位点。
在一个实施方式中,所述选定位置ZFN技术的识别位点,ZFN即人工锌指核酸酶技术(Zinc FingerNuclease),ZFN的锌指蛋白结构域可以靶向识别DNA序列,每个锌指蛋白可以识别特定的3个DNA碱基。其结构包括一个α螺旋和两个β折叠。其中α螺旋的–1~+6位氨基酸残基起到识别碱基的功能。其中,–1、+3、+6位氨基酸残基直接同三联子DNA序列中的3个碱基相互作用。在这7个氨基酸残基中,第4位是固定不变的亮氨酸,其他六个氨基酸残基可以进行改变,使其能够识别特定的DNA序列(Wolfe,S.A.,Nekludova,L.,and Pabo,C.O.(2000).DNA recognition by Cys2His2 zinc finger proteins.Annu Rev BiophysBiomol Struct 29,183-212)。ZFN包含3–6个锌指蛋白串联结构,可以识别9–18bp的DNA序列。FokI内切酶可以对DNA进行切割,FokI是在二聚体的情况下才可以切断双链DNA。因此,ZFN是成对起作用的,需要在切割位点的上下游各设计一个ZFN,分别靶向识别DNA正义链和反义链。一对ZFN识别序列之间需要留出足够的空间便于FokI对DNA进行切割,长度通常为5–7bp,称为间隔区(spacer)。
ZFN已经在细胞和小鼠、大鼠、果蝇、斑马鱼等多种模式生物中实现了基因打靶,可以通过建立锌指蛋白库,利用大规模筛选的方式找到可以靶向识别目的序列的锌指蛋白。
在一个实施方式中,所述选定位置TALEN技术的识别位点。TALE(transcriptionactivator-like effector)蛋白家族是在植物病原体黄单胞菌(Xanthomonas)中发现的一种类似转录激活因子的效应因子。当病原体侵染宿主植物后,TALE蛋白可以结合宿主植物特定内源基因的启动子,并调节该基因的表达,从而创造出病原体侵染宿主植物的有利条件(Boch,J.,and Bonas,U.(2010).Xanthomonas AvrBs3 family-type III effectors:discovery and function.Annual review of phytopathology 48,419-436;Heuer,H.,Yin,Y.N.,Xue,Q.Y.,Smalla,K.,and Guo,J.H.(2007).Repeat domain diversity ofavrBs3-like genes in Ralstonia solanacearum strains and association with hostpreferences in the field.Applied and environmental microbiology 73,4379-4384)。
TALEs可以靶向识别宿主植物DNA序列,是由若干个长度为33-35个氨基酸残基的重复单元串联结构,以及末端一个20个氨基酸残基的半重复单元共同构成。每个重复单元及末端的半重复单元可以特异识别并结合靶序列中一个核苷酸。在每个TALE单元中,第12和13位的氨基酸残基是TALE蛋白能够特异识别DNA碱基的关键位点,被称作RVD(repeatvariable di-residue),除RVD之外的氨基酸残基序列比较保守。相比于锌指蛋白,TALEs因为具有RVD可以分别特异的结合A、T、C、G四种碱基。RVD与碱基的对应关系为:NI识别A,NG识别T,HD识别C,NN识别A和G(Boch,J.,and Bonas,U.(2010).Xanthomonas AvrBs3 family-type III effectors:discovery and function.Annual review of phytopathology 48,419-436;Moscou,M.J.,and Bogdanove,A.J.(2009).A simple cipher governs DNArecognition by TAL effectors.Science 326,1501)。
TALEN介导基因打靶技术的建立,正是基于一种RVD特异识别一种碱基的特性。与ZFN的策略相同,利用TALEs替换掉锌指蛋白而作为靶向识别目的序列的结构域,并于FokI内切酶结构域融合形成TALEN人工核算内切酶。如前文所述,FokI是通过异源二聚体的形式起作用,因此TALEN的设计也是成对,在切割位点上下游各设计一个TALEN,分别靶向结合DNA的正义链和反义链,通过FokI内切酶对DNA切割生成双链断裂(DSBs),经过NHEJ修复引入indels造成基因发生移码突变。
在一个实施方式中,所述选定位置CRISPER/Cas技术的识别位点,CRISPR/Cas系统是一种以核酸为基础的适应性免疫系统(nucleic-acid-based adaptive immunesystems),广泛的存在于细菌和古生菌中。很多病毒是以细菌为宿主,在侵染宿主时将自己的核酸注入,并整合到细菌的染色体上来完成的自身的复制增殖,进而瓦解宿主细胞。CRISPR/Cas系统就是存在于细菌中的免疫系统,可以定向识别外来病毒核酸和质粒,并摧毁其寄生的能力(Barrangou,R.,Fremaux,C.,Deveau,H.,Richards,M.,Boyaval,P.,Moineau,S.,Romero,D.A.,and Horvath,P.(2007).CRISPR provides acquiredresistance against viruses in prokaryotes.Science 315,1709-1712;Brouns,S.J.J.,Jore,M.M.,Lundgren,M.,Westra,E.R.,Slijkhuis,R.J.H.,Snijders,A.P.L.,Dickman,M.J.,Makarova,K.S.,Koonin,E.V.,and van der Oost,J.(2008b).SmallCRISPR RNAs guide antiviral defense in prokaryotes.Science 321,960-964;Godde,J.S.,and Bickerton,A.(2006).The repetitive DNA elements called CRISPRs andtheir associated genes:Evidence of horizontal transfer among prokaryotes.JMol Evol 62,718-729;Wiedenheft,B.,Sternberg,S.H.,and Doudna,J.A.(2012).RNA-guided genetic silencing systems in bacteria and archaea.Nature 482,331-338)。
CRISPR/Cas系统对入侵的病毒和质粒免疫反应,主要有三个阶段。首先,是适应期(adaptive phase),细菌需要先获得一段外源核酸(protospacers),并将它整合到染色体末端的一个叫做CRISPR(clustered regularly interspaced short palindromicrepeat)的回文重复元件中(Bhaya,D.,Davison,M.,and Barrangou,R.(2011).CRISPR-Cassystems in bacteria and archaea:versatile small RNAs for adaptive defenseand regulation.Annual review of genetics 45,273-297;Terns,M.P.,and Terns,R.M.(2011).CRISPR-based adaptive immune systems.Current opinion in microbiology14,321-327;Wiedenheft,B.,Sternberg,S.H.,and Doudna,J.A.(2012).RNA-guidedgenetic silencing systems in bacteria and archaea.Nature 482,331-338)。其次,是表达期和干扰期(expression and interference phases),CRISPR位点会被转录生成初级crRNAs(precursor CRISPR-derived RNA),再经过Cas蛋白或者RNaseIII加工处理,形成由若干成熟的crRNAs构成的文库,每个crRNA上都有一段核苷酸序列可以与外源核酸形成碱基互补(Carte,J.,Wang,R.,Li,H.,Terns,R.M.,and Terns,M.P.(2008).Cas6 is anendoribonuclease that generates guide RNAs for invader defense inprokaryotes.Genes&development 22,3489-3496;Deltcheva,E.,Chylinski,K.,Sharma,C.M.,Gonzales,K.,Chao,Y.,Pirzada,Z.A.,Eckert,M.R.,Vogel,J.,and Charpentier,E.(2011).CRISPR RNA maturation by trans-encoded small RNA and host factor RNaseIII.Nature 471,602-607;Sashital,D.G.,Jinek,M.,and Doudna,J.A.(2011).An RNA-induced conformational change required for CRISPR RNA cleavage by theendoribonuclease Cse3.Nature structural&molecular biology 18,680-687)。Cas蛋白是另外一个重要的元件,具有内切酶的活性。相应的Cas蛋白可以与crRNA形成切割复合体,通过crRNA与外源核酸的碱基互补,就可以定向识别和切割外源核酸(Brouns,S.J.,Jore,M.M.,Lundgren,M.,Westra,E.R.,Slijkhuis,R.J.,Snijders,A.P.,Dickman,M.J.,Makarova,K.S.,Koonin,E.V.,and van der Oost,J.(2008a).Small CRISPR RNAs guideantiviral defense in prokaryotes.Science 321,960-964;Marraffini,L.A.,andSontheimer,E.J.(2008).CRISPR Interference Limits Horizontal Gene Transfer inStaphylococci by Targeting DNA.Science 322,1843-1845;Semenova,E.,Jore,M.M.,Datsenko,K.A.,Semenova,A.,Westra,E.R.,Wanner,B.,van der Oost,J.,Brouns,S.J.,and Severinov,K.(2011).Interference byclustered regularly interspaced shortpalindromic repeat(CRISPR)RNA is governed by a seed sequence.Proceedings ofthe National Academy of Sciences of the United States of America 108,10098-10103;Westra,E.R.,van Erp,P.B.,Kunne,T.,Wong,S.P.,Staals,R.H.,Seegers,C.L.,Bollen,S.,Jore,M.M.,Semenova,E.,Severinov,K.,et al.(2012).CRISPR immunityrelies on the consecutive binding and degradation of negatively supercoiledinvaderDNAby Cascade and Cas3.Molecular cell 46,595-605;Wiedenheft,B.,Lander,G.C.,Zhou,K.,Jore,M.M.,Brouns,S.J.,van der Oost,J.,Doudna,J.A.,and Nogales,E.(2011a).Structures of the RNA-guided surveillance complex from a bacterialimmune system.Nature 477,486-489)。
目前,已发现的CRISPR/Cas系统共有三种类型(Makarova,K.S.,Aravind,L.,Wolf,Y.I.,and Koonin,E.V.(2011a).Unification of Cas protein families and asimple scenario for the origin and evolution of CRISPR-Cas systems.Biologydirect 6,38;Makarova,K.S.,Grishin,N.V.,Shabalina,S.A.,Wolf,Y.I.,and Koonin,E.V.(2006).A putative RNA-interference-based immune system in prokaryotes:computational analysis of the predicted enzymatic machinery,functionalanalogies with eukaryotic RNAi,and hypothetical mechanisms of action.Biologydirect 1,7)。I型和III型CRISPR/Cas系统在crRNA的形成上具有相似性,都是具有专门的Cas蛋白加工pre-crRNA,当crRNA成熟后就与多种Cas蛋白的复合体融合,识别并切断可以与crRNA互补的核酸序列。II型CRISPR/Cas系统的crRNA形成比较特殊。需要一段可以与重复回文序列互补配对的反式激活crRNA(trans-activating crRNA,tracrRNA),才能启动对前体crRNA的加工。再通过特异切割双链RNA的RNaseIII以及Cas9(Csn1)蛋白的参与,就可形成具有活性的内切酶复合体(Deltcheva,E.,Chylinski,K.,Sharma,C.M.,Gonzales,K.,Chao,Y.,Pirzada,Z.A.,Eckert,M.R.,Vogel,J.,and Charpentier,E.(2011).CRISPR RNAmaturation by trans-encoded small RNA and host factor RNase III.Nature 471,602-607;Gottesman,S.(2011).Microbiology:Dicing defence in bacteria.Nature471,588-589)。Cas9蛋白是II型CRISPR/Cas系统特有的内切酶。CRISPR/Cas9系统同时需要具有激活作用的tracrRNA和靶向作用的crRNA。除此之外,在与被捕获的外源核酸(protospacer)毗邻的区域有一个重要的元件,叫做PAM(Protospacer Adjacent Motif)。PAM是由NGG三个碱基构成,是CRISPR/Cas系统识别protospacer的必要条件(Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,and Charpentier,E.(2012).Aprogrammable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity.Science 337,816-821)。
研究表明,如果满足上述条件,II型CRISPR/Cas系统在细菌体外仍然具有对双链DNA的定向切割活性(Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,andCharpentier,E.(2012).A programmable dual-RNA-guided DNA endonuclease inadaptive bacterial immunity.Science 337,816-821)。此研究报道后不久,CRISPR/Cas9系统在真核细胞及多个模式生物中成功实现基因打靶,并逐步趋于完善(Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,et al.(2013).Multiplex genome engineering using CRISPR/Cassystems.Science 339,819-823;Hwang,W.Y.,Fu,Y.,Reyon,D.,Maeder,M.L.,Kaini,P.,Sander,J.D.,Joung,J.K.,Peterson,R.T.,and Yeh,J.R.(2013a).Heritable andprecise zebrafish genome editing using a CRISPR-Cas system.PloS one 8,e68708;Mali,P.,Yang,L.,Esvelt,K.M.,Aach,J.,Guell,M.,DiCarlo,J.E.,Norville,J.E.,andChurch,G.M.(2013b).RNA-guided human genome engineering via Cas9.Science 339,823-826;Nekrasov,V.,Staskawicz,B.,Weigel,D.,Jones,J.D.,and Kamoun,S.(2013).Targeted mutagenesis in the model plant Nicotiana benthamiana using Cas9RNA-guided endonuclease.Nat Biotechnol 31,691-693)。已报道的研究中,所用到的SpCas9蛋白是克隆自M1型化脓性链球菌(Streptococcus pyogenes,SF370),SpCas9蛋白具有两个内切酶活性的功能域,分别与HNH和RuvC内切酶同源,这两个功能域分别可将双链DNA的一条链切断,从而可形成DSBs,切点位置是在PAM区上游3bp处,形成平末端的DNA双链断裂(Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,and Charpentier,E.(2012).A programmable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity.Science 337,816-821)。此后,CRISPR/Cas9系统不断被优化。比如,为了避免物种差异造成的Cas9工作效率降低,对cas9核苷酸序列进行相应物种的密码子优化。同时,需要在Cas9蛋白的N端和C端添加核定位信号(nuclear localization signal,NLS),才可以在真核细胞中起到作用(Chang,N.,Sun,C.,Gao,L.,Zhu,D.,Xu,X.,Zhu,X.,Xiong,J.W.,and Xi,J.J.(2013).Genome editing with RNA-guided Cas9 nuclease in zebrafishembryos.Cell Res 23,465-472;Liu,D.,Wang,Z.,Xiao,A.,Zhang,Y.,Li,W.,Zu,Y.,Yao,S.,Lin,S.,and Zhang,B.(2014a).Efficient gene targeting in zebrafish mediatedby a zebrafish-codon-optimized cas9and evaluation of off-targeting effect.JGenet Genomics 41,43-46)。其次,将crRNA的3’端和tracrRNA的5’端,利用一段碱基序列为GAAA的linker融合在一起形成gRNA(guide RNA)(Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,and Charpentier,E.(2012).A programmable dual-RNA-guidedDNA endonuclease in adaptive bacterial immunity.Science 337,816-821)。可以通过体外转录直接获得,这样就构成了CRISPR/Cas基因打靶系统。
在本发明的一个实施方案中,采用gRNA的方式实现CRISPR/Cas基因靶向。
在另一个实施方案中,gRNA采用化学合成的方式获得。
在另一个实施方案中,gRNA采用体外转录的方式获得,并且通过纯化得到mRNA备用;在一个优选的实施方案中,gRNA的纯化采用LiCl纯化。
在本发明中,选定位置可以位于基因的外显子或者内含子中,优选位于基因的内含子中,此时外源修饰序列的插入并不会直接破坏目标基因的编码序列,从而更有利于实现本发明的目的。
在一个实施方案中,内含子选择靠前的内含子,例如基因的第一、第二或第三内含子,选择靠前的内含子的优点在于修饰序列位点后存在更长的剩余编码序列,一旦修饰序列实现转录和/或翻译的提前终止,可以使被靶向基因缺失更多的编码序列,从而完全或者大部分缺失基因的正常生理功能。但是本领域技术人员可以理解的是,选择靠后的内含子仍然可以实现本发明的目的,因为只要基因的3’端部分包含重要的功能结构域,通过缺失该结构域,仍然可以使得该基因的功能丧失。
术语“双链缺口”,即通过基因靶向技术在基因组DNA的两条链中切割产生的断裂,其中缺口两端的DNA末端可以是平末端或者是粘性末端,因此也叫做双链断裂或者DSBs。
已知在基因编辑中,利用人工核酸酶技术主要目的,就是在细胞内定向诱导DNA双链断裂的产生。当细胞内存在DSBs时,主要有两种修复机制:同源重组修复(homologydirected repair,HDR)和非同源性末端接合修复(nonhomologous end joining,NHEJ)。同源重组是比较精确地修复机制,细胞中一条染色体的DNA受到损伤时,会以另一条同源染色体作为模板进行修复,这种修复不会引入错误。同源重组修复主要在细胞周期的S期和G2期发生。非同源性末端接合修复是在DSBs产生时,直接将断裂连接在一起,在这个过程中会对断口处进行一些处理,从而引入若干碱基的删除或插入(indels)。因此,NHEJ是一种非常不精确的修复方式,如果DSBs发生在蛋白编码基因的读码框内,那么NHEJ介导DNA修复引入的indels就有可能造成移码突变。NHEJ是发生在整个细胞周期过程中的,并且相对于HDR,NHEJ发生的概率要更高中产生的双链。
双链缺口的存在可以大大的增加同源重组的效率(Urnov,F.D.,Rebar,E.J.,Holmes,M.C.,Zhang,H.S.,and Gregory,P.D.(2010).Genome editing with engineeredzinc finger nucleases.Nature reviews Genetics 11,636-646)。利用TALEN和CRISPR/Cas系统诱导DSBs,同时提供人工合成的同源臂,已经在人类细胞和多种模式生物中实现了HDR介导的基因敲入(Byrne,S.M.,Ortiz,L.,Mali,P.,Aach,J.,and Church,G.M.(2015).Multi-kilobase homozygous targeted gene replacement in human inducedpluripotent stem cells.NucleicAcids Research 43;Hoshijima,K.,Jurynec,M.J.,andGrunwald,D.J.(2016).Precise Editing of the Zebrafish Genome Made Simple andEfficient.Developmental Cell 36,654-667;Irion,U.,Krauss,J.,and Nusslein-Volhard,C.(2014).Precise and efficient genome editing in zebrafish using theCRISPR/Cas9 system.Development 141,4827-4830;Li,H.L.,Fujimoto,N.,Sasakawa,N.,Shirai,S.,Ohkame,T.,Sakuma,T.,Tanaka,M.,Amano,N.,Watanabe,A.,Sakurai,H.,etal.(2015a).Precise Correction of the Dystrophin Gene in Duchenne MuscularDystrophy Patient Induced Pluripotent Stem Cells by TALEN and CRISPR-Cas9.Stem Cell Reports 4,143-154;Li,T.,Liu,B.,Chen,C.Y.,and Yang,B.(2016).TALEN-Mediated Homologous Recombination Produces Site-Directed DNA BaseChange and Herbicide-Resistant Rice.Journal of Genetics and Genomics 43,297-305;Ma,Y.W.,Zhang,X.,Shen,B.,Lu,Y.D.,Chen,W.,Ma,J.,Bai,L.,Huang,X.X.,andZhang,L.F.(2014).Generating rats with conditional alleles using CRISPR/Cas9.Cell Research 24,122-125;Menoret,S.,De Cian,A.,Tesson,L.,Remy,S.,Usal,C.,Boule,J.B.,Boix,C.,Fontaniere,S.,Creneguy,A.,Nguyen,T.H.,et al.(2015).Homology-directed repair in rodent zygotes using Cas9 and TALEN engineeredproteins.Sci Rep-Uk 5;Shin,J.,Chen,J.K.,and Solnica-Krezel,L.(2014).Efficienthomologous recombination-mediated genome engineering in zebrafish using TALEnucleases.Development 141,3807-3818;Wang,H.,Hu,Y.C.,Markoulaki,S.,Welstead,G.G.,Cheng,A.W.,Shivalila,C.S.,Pyntikova,T.,Dadon,D.B.,Voytas,D.F.,Bogdanove,A.J.,et al.(2013).TALEN-mediated editing of the mouse Y chromosome.NatBiotechnol 31,530-532;Yu,Z.S.,Chen,H.Q.,Liu,J.Y.,Zhang,H.T.,Yan,Y.,Zhu,N.N.,Guo,Y.W.,Yang,B.,Chang,Y.,Dai,F.,et al.(2014).Various applications of TALEN-and CRISPR/Cas9-mediated homologous recombination to modify the Drosophilagenome.Biology Open 3,271-280;Zhao,P.,Zhang,Z.,Lv,X.,Zhao,X.,Suehiro,Y.,Jiang,Y.,Wang,X.,Mitani,S.,Gong,H.,and Xue,D.(2016).One-step homozygosity inprecise gene editing by an improved CRISPR/Cas9 system.Cell Res 26,633-636;Zu,Y.,Tong,X.,Wang,Z.,Liu,D.,Pan,R.,Li,Z.,Hu,Y.,Luo,Z.,Huang,P.,Wu,Q.,et al.(2013a).TALEN-mediated precise genome modification by homologousrecombination in zebrafish.Nat Methods 10,329-331)。
相比较HDR,NHEJ也同样能够介导基因敲入,并且具有一个最明显优势就是敲入效率高。特别是在模式生物斑马鱼中,由于同源重组的发生效率极低,因此NHEJ具有明显的优势。
在本发明的一个实施方式中,利用NHEJ将核酸构建体连接入所述双链缺口中。
术语“核酸构建体”,是外源DNA片段,其区段1和编码方向与区段1相反的区段2,在区段1和区段2的两端包含位点特异性酶的识别位点,能够在位点特异性酶的作用下实现区段1和区段2的翻转。其中,区段1包含能够还原目的基因表达的基因编码序列,区段1的编码方向与靶基因转录方向一致时,不会破坏基因的功能,并且还可以任选连接有带有荧光报告基因,从而在保持原有基因表达的同时,标记基因的內源表达情况。区段2携带能够破坏內源基因表达(转录或者翻译)的元件,当区段2的编码方向与靶基因转录方向一致时,即能够破坏靶基因的正常功能。
在一个实施方案中,所述核酸构建体仅包含区段1和区段2以及任选的必要辅助序列(例如酶切位点,供扩增引物结合的DNA序列);
在另一个实施方案中,所述核酸构建体除了区段1和区段2之外,还包含载体骨架序列;在一个具体实施方案中,所述核酸构建体是线性化的载体序列,例如线性化的质粒载体或者线性化的微环载体。
在一些实施方案中,所述核酸构建体插入双联缺口的方向是随机的,可以通过筛选(例如筛选荧光、表型)获得沿所需要方向插入的核酸构建体。
术语“条件性翻转”是指能够在特定的条件下将核酸构建体进行翻转,所述翻转可以被理解为以核酸构建体的中心点为转轴,沿平面方向旋转180度。在一个实施方案中,所述条件性翻转的手段是指位点特异性重组系统,例如Cre-LoxP系统。
术语“条件性敲除”和“条件性拯救”是指通过将插入至选定位置的核酸构建体进行条件性翻转的方式实现靶基因的敲除或者拯救。
在一个实施方案中,本发明提供了一种核酸构建体,通过导入至特定的位置可以实现对靶向基因的条件性敲除和/或条件性拯救,在一个具体实施方式中,所述核酸构建体包括两个区段:区段1,也被称为正向部分或者正向元件,区段1包含靶基因选定位置后的剩余编码序列C1,用于与选定位置前的靶基因编码序列组成完整的靶基因编码序列,以维持靶基因的正常表达;和区段2,也被称为反向部分或者反向元件,包含表达终止信号,能够降低或者终止靶基因的转录和/或翻译;其中在两个区段的外侧带有能够将区段1和区段2翻转的序列,例如同向排列的loxP位点。需要注意的是,所述“正向”和“反向”的概念是指区段1和区段2的编码序列位于核酸构建体DNA双链的不同链上,并且编码方向相反。因此“正向”和“反向”是相对的而非绝对的,例如,如果核酸构建体从5’-3’方向依次为区段1(正向)和区段2(反向);此时如果将核酸构建体翻转,则5’-3’方向就变为了区段2(也可被称为正向)-区段1(也可被称为反向)。因此核酸构建体本身的方向并不重要,而关键在于核酸构建体插入选定位置的方向:
方向1:连接入所述双链接口的所述核酸构建体沿靶基因转录方向依次包含区段1和区段2,其中所述区段1的有义链(编码链)位于靶基因的有义链(编码链)上,且所述区段1的编码方向与靶基因的转录方向相同;所述区段2的有义链(编码链)位于靶基因的反义链(模板链)上,且所述区段2的编码方向与靶基因的转录方向相反。此时,区段1发挥功能,能够继续保持目标基因的表达,而区段2则不会发挥功能。
方向2:连接入所述双链接口的所述核酸构建体沿靶基因转录方向依次包含区段2和区段1,其中所述区段2的有义链(编码链)位于靶基因的有义链(编码链)上,且所述区段2的编码方向与靶基因的转录方向相同;所述区段1的有义链(编码链)位于靶基因的反义链(模板链)上,且所述区段1的编码方向与靶基因的转录方向相反。此时,区段2发挥功能,从而实现目标基因功能的敲除;而区段1则不会发挥功能。
在一个实施方案中,核酸构建体是线性化的载体(vector),优选质粒载体、或者在大肠杆菌体内利用位点特异性重组获得微环载体或者微环DNA(胡春生等,微环DNA研究进展,生物技术通讯,第22卷第1期,2011年1月)。核酸构建体以线性化载体的方式插入双联缺口中,此时优选对载体进行线性化的操作,从而提高NHEJ的效率。线性化包括“体外线性化”和“体内线性化”,体外线性化是指在环状质粒导入目标生物体或细胞之前,在体外进行线性化,例如利用在质粒上存在的或者引入的单一限制性内切酶位点,在体外进行酶切消化并纯化,从而获得线性化DNA。
体内线性化是指将环状质粒或者微环DNA导入细胞之后,在细胞内完成线性化的步骤。已知如果用于基因导入的模板使用环状质粒,并在细胞内进行线性化可以大大提高同源重组或NHEJ介导基因敲入的效率(Hoshijima,K.,Jurynec,M.J.,and Grunwald,D.J.(2016).Precise Editing of the Zebrafish Genome Made Simple andEfficient.Developmental Cell36,654-667;Irion,U.,Krauss,J.,and Nusslein-Volhard,C.(2014).Precise and efficient genome editing in zebrafish using theCRISPR/Cas9 system.Development 141,4827-4830;Shin,J.,Chen,J.K.,and Solnica-Krezel,L.(2014).Efficient homologous recombination-mediated genomeengineering in zebrafish using TALE nucleases.Development 141,3807-3818),因此本发明优选的技术方案中,采用体内线性化。
在一个具体方案中,线性化位点(在本专利中还被称为“用于线性化的切割位点”)是待修饰基因序列中基因编辑工具的切割靶点,该靶点序列被克隆出来并连接进入供体质粒载体;在另一个具体方案中,利用已经报道过的人类基因EMX1的高效靶点(hEMX1 site)(Lin,S.,Staahl,B.,Alla,R.K.,and Doudna,J.A.(2014).Enhanced homology-directedhuman genome engineering by controlled timing of CRISPR/Cas9 delivery.Elife3)或者lamGolden作为外外源靶点。由于使用外源靶点可以避免使用內源靶点时,载体线性化位点与靶基因位点潜在发生的竞争,降低对內源靶点切割效率,因此可以实现更好的切割和重组效率。
在一个实施方案中,载体中的线性化位点位于区段1+区段2的外侧,例如上游或者下游,相应的,线性化位点可以位于临近区段1的上游或者下游位置,也可以位于临近区段2的上游或者下游位置。
由于线性化的载体插入选定位置时,以靶基因转录方向为标准,基因组中会产生两种方向的插入,即“区段1-区段2”的方向和“区段2-区段1”的方向,实验者可以根据不同的实验目的筛选携带特定插入方向的细胞。例如如果为了实现条件性敲除,则筛选沿“区段1-区段2”方向插入的细胞;如果为了直接筛选基因敲除的细胞或者可用于条件性拯救的细胞,则筛选沿“区段2-区段1”方向插入的细胞。不过,考虑到载体骨架也会一并插入到选定位置中,因此在筛选时,优选载体骨架序列位于区段1和区段2的下游的细胞。例如假设线性化位点位于区段1附近(如线性化位点位于包含区段1-区段2方向的构建体的区段1的上游,或者线性化位点位于包含区段2-区段1方向的构建体的区段1的下游),则沿靶基因转录方向观察,插入选定位置的核酸构建体即包含如下两种情形:1)区段1-区段2-载体骨架,以及
2)载体骨架-区段2-区段1。
此时优选筛选第1)种情形,因为第二种情形里,载体骨架也被转录出来,虽然区段2中包含的剪接位点通常能够将载体骨架片段去除掉,但是也可能会有一定的概率载体骨架片段的部分或者全部也存在,从而影响方法的效率。
在另一个实施方案中,线性化位点位于区段1和区段2之间,如图3所示,此时不论核酸构建体的插入方向如何,不论核酸构建体沿哪个方向插入,由于载体骨架仅位于区段1和2之间,不会被转录出来,即:
1)区段1-载体骨架-区段2,以及
2)区段2-载体骨架-区段1。
因此不论筛选哪种方向插入的细胞均具有相同的效果,即可以同时筛选得到条件性敲除和条件性拯救的细胞,且均不会存在被载体骨架所干扰的担忧。
在另一个具体实施方案中,还可以通过改进载体的结构,从而在核酸构建体插入选定位置后,能够去除中间的载体骨架,进一步减少序列的复杂性。例如,可以在所述区段1和区段2各自编码方向的最末端位置可以再设置一组位点特异性重组酶的识别位点,所述一组位点特异性重组酶识别位点用于在选定位置插入核酸构建体后,去除区段1和区段2之间的载体序列,所述位点特异性重组酶的识别位点优选不同于区段1和区段2各自最上游所携带的位点特异性重组酶的识别位点,从而互相不干扰;所述位点特异性重组酶识别位点例如attB和attP位点,两个rox位点或者两个FRT位点等;进一步优选地,当核酸构建体连接入所述选定位置后,还包括将所述核酸构建体与phiC31、Dre或Flp的蛋白质或者mRNA相接触,从而去除载体骨架序列的步骤。
实施例
材料与方法
1. 斑马鱼系
1.1 野生型斑马鱼
实验中所用野生型斑马鱼均为Tu野生型斑马鱼(德国图宾根大学,University ofT点bingen)。并通过测序,筛选出敲入位点处无SNP干扰的Tu野生型作为主要材料。
2. CRISPR/Cas靶点设计及RNA合成
2.1 CRISPR/Cas靶点设计
目前有一些常用的CRISPR/Cas设计网站,例如美国麻省理工的CRISPRDesignhttp://crispr.mit.edu/,以及德国癌症研究中心的E-CRISP http://www.e-crisp.org/E-CRISP/。该网站可以根据实验需求进行靶点设计,该设计工具比较方便且信息较全面,但设计所需时间往往比较长。因此,也可以人工寻找靶点序列。对需要基因敲入的DNA序列进行分析,首先找到所有正义链和反义链上的PAM序列。然后,将靶序列及PAM序列在斑马鱼基因组中进行BLAST分析,可以使用NCBI或者ensembl。若所选择的靶点在斑马鱼基因组中有多个拷贝或者多个相似度高的序列,则放弃选择。而特异性高的序列作为候选靶点。利用限制性内切酶分析工具NEBcutterV2.0 http://nc2.neb.com/NEBcutter2/,可以分析靶序列是否可以通过单一限制性酶切进行效率检测。
2.2 PCR扩增gRNA模板及纯化
制备gRNA模板通用引物如下:gRNA oligo:
Figure BDA0002283638600000231
其中,下划线区域为T7启动子核心序列,方框标出为靶点序列,要求第一个碱基为G,便于T7启动子识别。阴影区域为gRNA骨架部分序列,用于PCR扩增gRNA模板。反向引物为Tracr Reverse:5’-AAAAAAAGCACCGACTCGGTGCCAC-3’(SEQ ID NO:5)。
gRNA骨架模板为pMD9-T-gRNA scaffold(Chang,N.,Sun,C.,Gao,L.,Zhu,D.,Xu,X.,Zhu,X.,Xiong,J.W.,and Xi,J.J.(2013).Genome editing with RNA-guided Cas9nuclease in zebrafish embryos.Cell Res 23,465-472)。
反应体系如下:
Figure BDA0002283638600000232
程序:94℃30s;56℃30s;72℃30s;40个循环。
反应结束后,体系中取1μL进行1%琼脂糖凝胶电泳,检测是否PCR得到单一条带。检测后使用超薄DNA产物纯化试剂盒(Tiangen)回收剩余DNA,溶于25μL RNase free ddH2O中,使用Nanodrop定量。
2.3 体外转录合成gRNA及纯化
利用T7 RNA polymerase(TAKARA)进行体外转录,37℃反应2.5-3小时,体系如下:
Figure BDA0002283638600000233
Figure BDA0002283638600000241
从转录体系中取0.5μL进行1%琼脂糖凝胶电泳检测gRNA合成质量。然后,在反应体系中加入30.0μL RNase free ddH2O和30.0μL 7.5mM LiCl溶液。放置于-20℃环境中2h以上。之后,4℃离心30min,转速为14000rpm。弃去上清液,利用75%的乙醇溶液清洗沉淀,然后4℃离心15min,转速为14000rpm。弃去上清液,待乙醇全部挥发之后,溶于30μL RNasefree ddH2O中,并进行Nanodrop定量以及1%琼脂糖凝胶电泳检测。
2.4 nCas9 mRNA、Cre mRNA和phiC31 mRNA的体外转录与纯化
使用XbaI内切酶(NEB)对pX-T7-Cre,pT3TS-nCas9以及pT3TS-zphiC31质粒进行线性化作为体外转录mRNA的模板。其中,pT3TS-nCas9为他人实验室报道的斑马鱼密码子优化并添加了核定位序列的Cas9(以下即简称为Cas9)(Jao,L.E.,Wente,S.R.and Chen,W.(2013).Efficient multiplex biallelic zebrafish genome editing using a crisprnuclease system.Proceedings of the National Academy of Sciences,110(34),13904-13909.)。pX-T7-Cre为本实验室已发表的质粒(Li,W.et al.,(2019).One-stepefficient generation of dual-function conditional knockout and geno-taggingallele in Zebrafish.Elife,8,e48081)。zphiC31为由公司(睿博兴科)体外合成的经斑马鱼密码子优化得到的phiC31重组酶(Uniprot登录号:Q9T221)的编码序列,然后用NcoI和SpeI酶切pT3TS-nCas9质粒,回收pT3TS骨架,将zphiC31连接后即获得pT3TS-zphiC31。在10.0μg质粒中加入1.0μL XbaI内切酶,总体系为50.0μL,在37℃恒温孵育3h,凝胶电泳检测线性化是否完全。之后,利用超薄DNA产物纯化试剂盒(Tiangen公司)对质粒线性化产物进行纯化,溶于30.0μL RNase free ddH2O,并进行Nanodrop定量。
使用T7或T3 mMESSAGE mMACHINE试剂盒(Ambion)分别进行体外转录(与骨架的启动子对应使用),37℃反应2h,体系如下:
Figure BDA0002283638600000242
从转录体系中取0.5μL进行1%琼脂糖凝胶电泳检测mRNA。然后,在反应体系中加入30.0μL RNase free ddH2O和30.0μL 7.5mM LiCl溶液。放置于-20℃环境中2h以上。之后,4℃离心30min,转速为14000rpm。弃去上清液,利用75%的乙醇溶液清洗沉淀,然后4℃离心15min,转速为14000rpm。弃去上清液,待乙醇全部挥发之后,溶于40.0μL RNase freeddH2O中,并进行Nanodrop定量以及1%琼脂糖凝胶电泳检测。
2.5 利用限制性内切酶评估CRISPR/Cas靶点的效率
(1)根据具体的基因序列信息设计CRISPR/Cas靶点,并利用T7体外转录体系合成gRNA。
(2)通过显微注射,将CRISPR/Cas体系注射进斑马鱼一细胞期胚胎中,得到F0,注射体系终浓度配比为:nCas9 mRNA 600ng/μL、gRNA100ng/μL。每枚受精卵注射量为1-2nL。
(3)待F0发育至24hpf,选取15枚胚胎分三组,同时选取5枚野生型胚胎做对照组。利用NaOH碱裂解法快速提取基因组。选用表1中对应引物,以碱裂解法提取的基因组为模板,进行PCR扩增。
(4)根据靶点设计时所选的用于效率检测的单一限制性内切酶,对PCR产物进行酶切消化。反应体系根据限制性内切酶的特性进行配制(可查阅NEB实验手册),之后进行琼脂糖凝胶电泳检测,并评估靶点效率。
2.6 实施例中所选择的靶点以及相应的所CRISPR/Cas靶点效率检测引物
表1a
Figure BDA0002283638600000251
表1b
Figure BDA0002283638600000252
Figure BDA0002283638600000261
3. 载体质粒构建
3.1 构建sox10正反载体(FoRe donor)
sox10正反载体包括“正向”和“反向”两个部分。首先,将lox66位点序列克隆到pMD19-T simple载体(TAKARA,Code No.3271)中,然后,将包含sox10内部靶点(选择的Cas9靶点位于sox10基因的第三个内含子中)后的内含子3(包括剪接受体)和外显子4序列(不含终止密码子和3’UTR序列)的序列区段S10F0克隆到前述lox66位点的下游。之后,将上述序列与T2A-tdTomato-SV40 pA序列融合,从而得到载体的正向部分。
之后,将lox71序列、包含sox10内部靶点下游的内含子3序列和sox10外显子4序列前98bp的序列区段S10R与P2A-EGFP-BGH pA融合,并将其反向互补序列克隆到SV40 pA序列的下游,作为载体的反向部分。
最后,将hEMXI位点序列和带有从pMD18-T载体(TAKARA,Code No.6011)克隆获得的111bp DNA保护片段(以避免由于NHEJ介导的DSB修复而破坏lox66序列)克隆到lox66位点序列的上游。为后续载体改造的方便,将KpnI和AvrII识别位点分别正向引入内含子3和外显子4序列的上游和下游,同时将SalI和EcoRV识别位点的反向互补序列分别引入内含子3和98bp外显子4序列的上游和下游。引入和融合克隆均使用2×GibsonAssembly MasterMix(NEB)进行无缝克隆完成。
sox10正反载体的序列如SEQ ID NO:1所示:
ACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGAATTCGGGTCAACGACTTCCTGCACGGGACCGTCACCTCCAATGACTAGGGTGGCATGCACCCAAAACCCAGTGTCAACTTTTGCTTTAAATAGTACAGAATCCGTTTAAGGAACAGTGTCTATTTATCGTCTGACAGTCTTGTTTTGAGGACTGCATAGGAGGGATAACTTCGTATAGCATACATTATACGAACGGTACAATCGTCGAGCGGCGCTTGTAATGGAAAGGTACCGCTATGCTTCACATTAGACATTATACGATGGCAAATTGTTCAACATTGCCCAATCCTAATATACATTTAGATTGATATATTTAATGGACCTAGTGTATAGTTTCTATTAAATATACAGATATACACCTATTAAGTATGAATATGAATTAAAATTAAAAATTATTTGTATATATATATATACACACACATAATAAATATACAAAGTACGCACGAATATATTATGCAAATACAAACTTTTAAATGTGAAAATTCATTCAATAATATTATTAAAATAAATTAATTTTAAATAAATTTCAAATAGCAATAACACTTTTTCCACTCTATTTTTGAGTAAACAACAACTACTTTTGAAAAACGAAAAACCAACTAAAACTATTTTCTTGTATTTGTTTGCTCAGGTCAGAGTCACAGCCCTCCAACGCCCCCTACCACCCCCAAGACGGAACTGCAGGGAGGAAAATCAGGCGAGGGCAAGCGTGAGGGCGGAGCCTCTCGGAGTGGACTGGGGGTGGGAGCAGATGGAAGCTCCGCCTCATCGTCTGCCAGCGGGAAACCGCACATCGACTTCGGTAACGTGGACATTGGCGAAATCAGCCATGACGTGATGGCCAACATGGAGCCGTTCGACGTGAACGAGTTCGACCAGTATCTCCCACCCAATGGCCACCCGCAGGCGTCCGCCACTGCCAGCGCAGGATCTGCAGCGCCATCGTATACATACGGCATCTCCAGCGCGCTAGCGGCCGCTAGTGGCCACTCCACCGCATGGCTGTCCAAGCAGCAACTGCCGTCCCAGCAGCATTTGGGCGCAGATGGCGGAAAAACGCAGATAAAGAGTGAAACACACTTCCCCGGGGATACAGCGGCGAGCGGTTCACACGTCACATACACGCCGCTAACACTGCCGCACTACAGCTCCGCCTTCCCCTCGCTGGCGTCCCGCGCACAGTTCGCCGAATACGCCGAGCACCAGGCCTCGGGATCCTACTACGCCCACTCCAGCCAGACCTCAGGCCTCTACTCCGCCTTCTCCTACATGGGCCCCTCACAGCGGCCCCTGTACACCGCCATTCCGGATCCGGGATCCGTGCCGCAGTCGCACAGCCCCACGCACTGGGAGCAGCCCGTATACACCACACTGTCTCGACCGCCTAGGGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTCGAGGAGAATCCCGGCCCTACTAGTATGGTGAGCAAGGGCGAGGAGGTCATCAAAGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCTCCATGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCATGTACGGCTCCAAGGCGTACGTGAAGCACCCCGCCGACATCCCCGATTACAAGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGTCTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCACGCTGATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCCCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCACCGAGCGCCTGTACCCCCGCGACGGCGTGCTGAAGGGCGAGATCCACCAGGCCCTGAAGCTGAAGGACGGCGGCCACTACCTGGTGGAGTTCAAGACCATCTACATGGCCAAGAAGCCCGTGCAACTGCCCGGCTACTACTACGTGGACACCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAGCGCTCCGAGGGCCGCCACCACCTGTTCCTGGGGCATGGCACCGGCAGCACCGGCAGCGGCAGCTCCGGCACCGCCTCCTCCGAGGACAACAACATGGCCGTCATCAAAGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCTCCATGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCATGTACGGCTCCAAGGCGTACGTGAAGCACCCCGCCGACATCCCCGATTACAAGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGTCTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCACGCTGATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCCCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCACCGAGCGCCTGTACCCCCGCGACGGCGTGCTGAAGGGCGAGATCCACCAGGCCCTGAAGCTGAAGGACGGCGGCCACTACCTGGTGGAGTTCAAGACCATCTACATGGCCAAGAAGCCCGTGCAACTGCCCGGCTACTACTACGTGGACACCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAGCGCTCCGAGGGCCGCCACCACCTGTTCCTGTACGGCATGGACGAGCTGTACAAGTAAACTATAGTGAGTCGTATTACGTAGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAATTCGCGGCCGCTCTAGATGGCCAGATCCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTCACTTGTAGAGCTCGTCCATGCCGAGAGTGATCCCGGCGGCGGTCACGAACTCCAGCAGGACCATGTGATCGCGCTTCTCGTTGGGGTCTTTGCTCAGGGCGGACTGGGTGCTCAGGTAGTGGTTGTCGGGCAGCAGCACGGGGCCGTCGCCGATGGGGGTGTTCTGCTGGTAGTGGTCGGCGAGCTGCACGCTGCCGTCCTCGATGTTGTGGCGGATCTTGAAGTTCACCTTGATGCCGTTCTTCTGCTTGTCGGCCATGATATAGACGTTGTGGCTGTTGTAGTTGTACTCCAGCTTGTGCCCCAGGATGTTGCCGTCCTCCTTGAAGTCGATGCCCTTCAGCTCGATGCGGTTCACCAGGGTGTCGCCCTCGAACTTCACCTCGGCGCGGGTCTTGTAGTTGCCGTCGTCCTTGAAGAAGATGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTCATGTGGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTCAGGGTGGTCACGAGGGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCATCGCCCTCGCCCTCGCCGGACACGCTGAACTTGTGGCCGTTTACGTCGCCGTCCAGCTCGACCAGGATGGGCACCACCCCGGTGAACAGCTCCTCGCCCTTGCTCACAGGTCCAGGGTTCTCCTCCACGTCTCCAGCCTGCTTCAGCAGGCTGAAGTTAGTAGCTCCGCTTCCGATATCCCGAGAGGCTCCGCCCTCACGCTTGCCCTCGCCTGATTTTCCTCCCTGCAGTTCCGTCTTGGGGGTGGTAGGGGGCGTTGGAGGGCTGTGACTCTGACCTGAGCAAACAAATACAAGAAAATAGTTTTAGTTGGTTTTTCGTTTTTCAAAAGTAGTTGTTGTTTACTCAAAAATAGAGTGGAAAAAGTGTTATTGCTATTTGAAATTTATTTAAAATTAATTTATTTTAATAATATTATTGAATGAATTTTCACATTTAAAAGTTTGTATTTGCATAATATATTCGTGCGTACTTTGTATATTTATTATGTGTGTGTATATATATATATACAAATAATTTTTAATTTTAATTCATATTCATACTTAATAGGTGTATATCTGTATATTTAATAGAAACTATACACTAGGTCCATTAAATATATCAATCTAAATGTATATTAGGGTTGGGCAATGTTGAACAATTTGCCATCGTATAATGTCTAATGTGAAGCATAGCGTCGACATAACTTCGTATAATGTATGCTATACGAACGGTACATAGAAAGCTTGGCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTAC(SEQ ID NO:1)
构建上述sox10正反载体中涉及PCR扩增所用的引物序列如下表所示:
表2
Figure BDA0002283638600000301
Figure BDA0002283638600000311
3.2 构建isl1正反载体(FoRe donor)
在sox10正反载体的基础上进行改造以构建isl1正反载体。首先,使用限制性内切酶KpnI和AvrII将sox10正部分剪接位点及蛋白编码序列切除,并凝胶回收载体骨架。然后,从斑马鱼基因组DNA中扩增isl1剪接位点及之后的第四外显子克隆得到,再从斑马鱼cDNA中扩增isl1第四外显子之后的其余蛋白编码序列。利用无缝克隆体系2×Gibson AssemblyMaster Mix(NEB)将上述两个片段连入载体骨架,构成isl1正反载体中间载体。其次,利用SalI和EcoNI将中间载体反向部分中的sox10剪接位点及剩余CDS切除,回收中间载体骨架。从斑马鱼基因组DNA序列中克隆isl1剪接位点及相邻的第四外显子17bp蛋白编码序列。最后,利用无克隆体系2×Gibson Assembly Master Mix(NEB)连入上述回收的中间载体骨架中,从而构成isl1正反载体。
isl1正反载体的序列如SEQ ID NO:2所示:
ACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGAATTCGGGTCAACGACTTCCTGCACGGGACCGTCACCTCCAATGACTAGGGTGGCATGCACCCAAAACCCAGTGTCAACTTTTGCTTTAAATAGTACAGAATCCGTTTAAGGAACAGTGTCTATTTATCGTCTGACAGTCTTGTTTTGAGGACTGCATAGGAGGGATAACTTCGTATAGCATACATTATACGAACGGTACAATCGTCGAGCGGCGCTTGTAATGGAAAGGTACCGTAGATGGGCCTCGGAGACAACTGAGTTAAAATAATTAACAGCTGACCGCTTAACATATGTGCATTTTTTTACAAATGTAAAACATCATACAACAGCTCTTTGCATTTAATATTTATTTATTTTTGTTTGTTTCGTAATTTTATGCAGCAGAGCCCATTTCGGCACGTCAGCCTGCGCTTCGACCTCATGTGCACAAGCAACCTGAGAAAACAACCCGCGTCCGGACAGTCCTCAACGAAAAACAGCTCCATACCTTGAGGACTTGTTACAATGCCAACCCTCGACCCGACGCCCTCATGAAAGAGCAGCTCGTTGAGATGACGGGTCTTAGTCCGAGAGTCATCAGGGTTTGGTTTCAAAACAAGCGCTGCAAGGATAAAAAGAGGAGCATACTGATGAAGCAACTCCAGCAGCAGCAACCCAACGACAAAACGAACATCCAGGGGATGACAGGTACTCCAATGGTGGCGACCAGTCCAGAGAGACACGACGGTGGTTTGCAGGCAAACCAAGTGGAGGTGCAGAGTTACCAACCGCCTTGGAAAGTCCTAAGTGACTTCGCACTGCAGAGTGACATCGACCAGCCTGCTTTCCAACAACTGGTTAATTTTTCTGAAGGTGGTCCAGGCTCAAACTCCACAGGGAGCGAGGTCGCGTCAATGTCCTCGCAACTGCCAGATACACCAAACAGCATGGTAGCGAGTCCTATAGAGGCCCCTAGGGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTCGAGGAGAATCCCGGCCCTACTAGTATGGTGAGCAAGGGCGAGGAGGTCATCAAAGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCTCCATGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCATGTACGGCTCCAAGGCGTACGTGAAGCACCCCGCCGACATCCCCGATTACAAGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGTCTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCACGCTGATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCCCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCACCGAGCGCCTGTACCCCCGCGACGGCGTGCTGAAGGGCGAGATCCACCAGGCCCTGAAGCTGAAGGACGGCGGCCACTACCTGGTGGAGTTCAAGACCATCTACATGGCCAAGAAGCCCGTGCAACTGCCCGGCTACTACTACGTGGACACCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAGCGCTCCGAGGGCCGCCACCACCTGTTCCTGGGGCATGGCACCGGCAGCACCGGCAGCGGCAGCTCCGGCACCGCCTCCTCCGAGGACAACAACATGGCCGTCATCAAAGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCTCCATGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCATGTACGGCTCCAAGGCGTACGTGAAGCACCCCGCCGACATCCCCGATTACAAGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGTCTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCACGCTGATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCCCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCACCGAGCGCCTGTACCCCCGCGACGGCGTGCTGAAGGGCGAGATCCACCAGGCCCTGAAGCTGAAGGACGGCGGCCACTACCTGGTGGAGTTCAAGACCATCTACATGGCCAAGAAGCCCGTGCAACTGCCCGGCTACTACTACGTGGACACCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAGCGCTCCGAGGGCCGCCACCACCTGTTCCTGTACGGCATGGACGAGCTGTACAAGtaaACTATAGTGAGTCGTATTACGTAGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAATTCGCGGCCGCTCTAGATGGCCAGATCCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTCACTTGTAGAGCTCGTCCATGCCGAGAGTGATCCCGGCGGCGGTCACGAACTCCAGCAGGACCATGTGATCGCGCTTCTCGTTGGGGTCTTTGCTCAGGGCGGACTGGGTGCTCAGGTAGTGGTTGTCGGGCAGCAGCACGGGGCCGTCGCCGATGGGGGTGTTCTGCTGGTAGTGGTCGGCGAGCTGCACGCTGCCGTCCTCGATGTTGTGGCGGATCTTGAAGTTCACCTTGATGCCGTTCTTCTGCTTGTCGGCCATGATATAGACGTTGTGGCTGTTGTAGTTGTACTCCAGCTTGTGCCCCAGGATGTTGCCGTCCTCCTTGAAGTCGATGCCCTTCAGCTCGATGCGGTTCACCAGGGTGTCGCCCTCGAACTTCACCTCGGCGCGGGTCTTGTAGTTGCCGTCGTCCTTGAAGAAGATGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTCATGTGGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTCAGGGTGGTCACGAGGGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCATCGCCCTCGCCCTCGCCGGACACGCTGAACTTGTGGCCGTTTACGTCGCCGTCCAGCTCGACCAGGATGGGCACCACCCCGGTGAACAGCTCCTCGCCCTTGCTCACAGGTCCAGGGTTCTCCTCCACGTCTCCAGCCTGCTTCAGCAGGCTGAAGTTAGTAGCTCCGCTTCCGCTAGCTGCCGAAATGGGCTCTGCTGCATAAAATTACGAAACAAACAAAAATAAATAAATATTAAATGCAAAGAGCTGTTGTATGATGTTTTACATTTGTAAAAAAATGCACATATGTTAAGCGGTCAGCTGTTAATTATTTTAACTCAGTTGTCTCCGAGGCCCATCTACGGGTCGACATAACTTCGTATAATGTATGCTATACGAACGGTACATAGAAAGCTTGGCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTAC(SEQ ID NO:2)
构建isl1正反载体过程中涉及PCR扩增所用的引物序列如下表所示:
表3
Figure BDA0002283638600000351
Figure BDA0002283638600000361
3.3 构建sox10 CKO+conditional rescue+骨架去除载体(Bi-FoRe donor)
在sox10正反载体和微环母载体pTubb3-MC的基础上进行构建(Suzuki K.et al.,In vivo genome editing via CRISPR/Cas mediated homology-independent targetedintegration.(2016)Nature 540,144-149)。首先,利用限制性内切酶BsrGI和XmaI对pTubb3-MC载体中进行酶切,利用DNA凝胶回收载体骨架。然后,从sox10正反载体中克隆EMX1位点和正部分(结束于tdTomato和之后的polyA序列),利用无缝克隆体系2×GibsonAssembly Master Mix(NEB)连入上述骨架。之后在上述连接得到的载体上,利用EMX1上游的AfeI酶切位点线性化骨架并进行DNA凝胶纯化作为新骨架,并从sox10正反载体中克隆反部分(lox71与EGFP以及polyA信号及中间部分)连入回收的载体骨架中,构成完整的sox10 CKO+conditional rescue+骨架去除载体(Bi-FoRedonor),其序列如SEQ ID NO:3所示:
ACATTACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCAGATGACATTACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCTAGATGACATTTACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCAGATGACATTACCCTGTTATCCCTAGATACATTACCCTGTTATCCCAGATGACATACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCAGATGACATTACCCTGTTATCCCTAGATACATTACCCTGTTATCCCAGATGACATACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCAGATGACATTACCCTGTTATCCCTAGATACATTACCCTGTTATCCCAGATGACATACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCAGATGACATTACCCTGTTATCCCTAGATACATTACCCTGTTATCCCAGATGACATACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCAGATGACATTACCCTGTTATCCCTAGATACATTACCCTGTTATCCCAGATGACATACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCAGATGACATTACCCTGTTATCCCTAGATACATTACCCTGTTATCCCAGATGACATACCCTGTTATCCCTAGATGACATTACCCTGTTATCCCAGATAAACTCAATGATGATGATGATGATGGTCGAGACTCAGCGGCCGCGGTGCCAGGGCGTGCCCTTGGGCTCCCCGGGCGCGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAATTCGCGGCCGCTCTAGATGGCCAGATCCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTCACTTGTAGAGCTCGTCCATGCCGAGAGTGATCCCGGCGGCGGTCACGAACTCCAGCAGGACCATGTGATCGCGCTTCTCGTTGGGGTCTTTGCTCAGGGCGGACTGGGTGCTCAGGTAGTGGTTGTCGGGCAGCAGCACGGGGCCGTCGCCGATGGGGGTGTTCTGCTGGTAGTGGTCGGCGAGCTGCACGCTGCCGTCCTCGATGTTGTGGCGGATCTTGAAGTTCACCTTGATGCCGTTCTTCTGCTTGTCGGCCATGATATAGACGTTGTGGCTGTTGTAGTTGTACTCCAGCTTGTGCCCCAGGATGTTGCCGTCCTCCTTGAAGTCGATGCCCTTCAGCTCGATGCGGTTCACCAGGGTGTCGCCCTCGAACTTCACCTCGGCGCGGGTCTTGTAGTTGCCGTCGTCCTTGAAGAAGATGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTCATGTGGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTCAGGGTGGTCACGAGGGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCATCGCCCTCGCCCTCGCCGGACACGCTGAACTTGTGGCCGTTTACGTCGCCGTCCAGCTCGACCAGGATGGGCACCACCCCGGTGAACAGCTCCTCGCCCTTGCTCACAGGTCCAGGGTTCTCCTCCACGTCTCCAGCCTGCTTCAGCAGGCTGAAGTTAGTAGCTCCGCTTCCGATATCCCGAGAGGCTCCGCCCTCACGCTTGCCCTCGCCTGATTTTCCTCCCTGCAGTTCCGTCTTGGGGGTGGTAGGGGGCGTTGGAGGGCTGTGACTCTGACCTGAGCAAACAAATACAAGAAAATAGTTTTAGTTGGTTTTTCGTTTTTCAAAAGTAGTTGTTGTTTACTCAAAAATAGAGTGGAAAAAGTGTTATTGCTATTTGAAATTTATTTAAAATTAATTTATTTTAATAATATTATTGAATGAATTTTCACATTTAAAAGTTTGTATTTGCATAATATATTCGTGCGTACTTTGTATATTTATTATGTGTGTGTATATATATATATACAAATAATTTTTAATTTTAATTCATATTCATACTTAATAGGTGTATATCTGTATATTTAATAGAAACTATACACTAGGTCCATTAAATATATCAATCTAAATGTATATTAGGGTTGGGCAATGTTGAACAATTTGCCATCGTATAATGTCTAATGTGAAGCATAGCGTCGACATAACTTCGTATAATGTATGCTATACGAACGGTACATAGAAAGCTTGGCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACAGCGCTGGGTCAACGACTTCCTGCACGGGACCGTCACCTCCAATGACTAGGGTGGCATGCACCCAAAACCCAGTGTCAACTTTTGCTTTAAATAGTACAGAATCCGTTTAAGGAACAGTGTCTATTTATCGTCTGACAGTCTTGTTTTGAGGACTGCATAGGAGGGATAACTTCGTATAGCATACATTATACGAACGGTACAATCGTCGAGCGGCGCTTGTAATGGAAAGGTACCGCTATGCTTCACATTAGACATTATACGATGGCAAATTGTTCAACATTGCCCAATCCTAATATACATTTAGATTGATATATTTAATGGACCTAGTGTATAGTTTCTATTAAATATACAGATATACACCTATTAAGTATGAATATGAATTAAAATTAAAAATTATTTGTATATATATATATACACACACATAATAAATATACAAAGTACGCACGAATATATTATGCAAATACAAACTTTTAAATGTGAAAATTCATTCAATAATATTATTAAAATAAATTAATTTTAAATAAATTTCAAATAGCAATAACACTTTTTCCACTCTATTTTTGAGTAAACAACAACTACTTTTGAAAAACGAAAAACCAACTAAAACTATTTTCTTGTATTTGTTTGCTCAGGTCAGAGTCACAGCCCTCCAACGCCCCCTACCACCCCCAAGACGGAACTGCAGGGAGGAAAATCAGGCGAGGGCAAGCGTGAGGGCGGAGCCTCTCGGAGTGGACTGGGGGTGGGAGCAGATGGAAGCTCCGCCTCATCGTCTGCCAGCGGGAAACCGCACATCGACTTCGGTAACGTGGACATTGGCGAAATCAGCCATGACGTGATGGCCAACATGGAGCCGTTCGACGTGAACGAGTTCGACCAGTATCTCCCACCCAATGGCCACCCGCAGGCGTCCGCCACTGCCAGCGCAGGATCTGCAGCGCCATCGTATACATACGGCATCTCCAGCGCGCTAGCGGCCGCTAGTGGCCACTCCACCGCATGGCTGTCCAAGCAGCAACTGCCGTCCCAGCAGCATTTGGGCGCAGATGGCGGAAAAACGCAGATAAAGAGTGAAACACACTTCCCCGGGGATACAGCGGCGAGCGGTTCACACGTCACATACACGCCGCTAACACTGCCGCACTACAGCTCCGCCTTCCCCTCGCTGGCGTCCCGCGCACAGTTCGCCGAATACGCCGAGCACCAGGCCTCGGGATCCTACTACGCCCACTCCAGCCAGACCTCAGGCCTCTACTCCGCCTTCTCCTACATGGGCCCCTCACAGCGGCCCCTGTACACCGCCATTCCGGATCCGGGATCCGTGCCGCAGTCGCACAGCCCCACGCACTGGGAGCAGCCCGTATACACCACACTGTCTCGACCGCCTAGGGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTCGAGGAGAATCCCGGCCCTACTAGTATGGTGAGCAAGGGCGAGGAGGTCATCAAAGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCTCCATGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCATGTACGGCTCCAAGGCGTACGTGAAGCACCCCGCCGACATCCCCGATTACAAGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGTCTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCACGCTGATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCCCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCACCGAGCGCCTGTACCCCCGCGACGGCGTGCTGAAGGGCGAGATCCACCAGGCCCTGAAGCTGAAGGACGGCGGCCACTACCTGGTGGAGTTCAAGACCATCTACATGGCCAAGAAGCCCGTGCAACTGCCCGGCTACTACTACGTGGACACCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAGCGCTCCGAGGGCCGCCACCACCTGTTCCTGGGGCATGGCACCGGCAGCACCGGCAGCGGCAGCTCCGGCACCGCCTCCTCCGAGGACAACAACATGGCCGTCATCAAAGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCTCCATGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCATGTACGGCTCCAAGGCGTACGTGAAGCACCCCGCCGACATCCCCGATTACAAGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGTCTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCACGCTGATCTACAAGGTGAAGATGCGCGGCACCAACTTCCCCCCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCACCGAGCGCCTGTACCCCCGCGACGGCGTGCTGAAGGGCGAGATCCACCAGGCCCTGAAGCTGAAGGACGGCGGCCACTACCTGGTGGAGTTCAAGACCATCTACATGGCCAAGAAGCCCGTGCAACTGCCCGGCTACTACTACGTGGACACCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAGCGCTCCGAGGGCCGCCACCACCTGTTCCTGTACGGCATGGACGAGCTGTACAAGTAAACTATAGTGAGTCGTATTACGTAGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAATTCGCGGCCGCTCTAGATGGCCAGATCCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGCTGGGGATGTACAAGGGGCCCGCCCCAACTGGGGTAACCTTTGAGTTCTCTCAGTTGGGGGTAATCAGCATCATGATGTGGTACCACATCATGATGCTGATTATAAGAATGCGGCCGCCACACTCTAGTGGATCTCGAGTTAATAATTCAGAAGAACTCGTCAAGAAGGCGATAGAAGGCGATGCGCTGCGAATCGGGAGCGGCGATACCGTAAAGCACGAGGAAGCGGTCAGCCCATTCGCCGCCAAGCTCTTCAGCAATATCACGGGTAGCCAACGCTATGTCCTGATAGCGGTCCGCCACACCCAGCCGGCCACAGTCGATGAATCCAGAAAAGCGGCCATTTTCCACCATGATATTCGGCAAGCAGGCATCGCCATGGGTCACGACGAGATCCTCGCCGTCGGGCATGCTCGCCTTGAGCCTGGCGAACAGTTCGGCTGGCGCGAGCCCCTGATGCTCTTCGTCCAGATCATCCTGATCGACAAGACCGGCTTCCATCCGAGTACGTGCTCGCTCGATGCGATGTTTCGCTTGGTGGTCGAATGGGCAGGTAGCCGGATCAAGCGTATGCAGCCGCCGCATTGCATCAGCCATGATGGATACTTTCTCGGCAGGAGCAAGGTGTAGATGACATGGAGATCCTGCCCCGGCACTTCGCCCAATAGCAGCCAGTCCCTTCCCGCTTCAGTGACAACGTCGAGCACAGCTGCGCAAGGAACGCCCGTCGTGGCCAGCCACGATAGCCGCGCTGCCTCGTCTTGCAGTTCATTCAGGGCACCGGACAGGTCGGTCTTGACAAAAAGAACCGGGCGCCCCTGCGCTGACAGCCGGAACACGGCGGCATCAGAGCAGCCGATTGTCTGTTGTGCCCAGTCATAGCCGAATAGCCTCTCCACCCAAGCGGCCGGAGAACCTGCGTGCAATCCATCTTGTTCAATCATGCGAAACGATCCTCATCCTGTCTCTTGATCAGAGCTTGATCCCCTGCGCCATCAGATCCTTGGCGGCGAGAAAGCCATCCAGTTTACTTTGCAGGGCTTCCCAACCTTACCAGAGGGCGCCCCAGCTGGCAATTCCGGTTCGCTTGCTGTCCATAAAACCGCCCAGTCTAGCTATCGCCATGTAAGCCCACTGCAAGCTACCTGCTTTCTCTTTGCGCTTGCGTTTTCCCTTGTCCAGATAGCCCAGTAGCTGACATTCATCCGGGGTCAGCACCGTTTCTGCGGACTGGCTTTCTACGTGCTCGAGGGGGGCCAAACGGTCTCCAGCTTGGCTGTTTTGGCGGATGAGAGAAGATTTTCAGCCTGATACAGATTAAATCAGAACGCAGAAGCGGTCTGATAAAACAGAATTTGCCTGGCGGCAGTAGCGCGGTGGTCCCACCTGACCCCATGCCGAACTCAGAAGTGAAACGCCGTAGCGCCGATGGTAGTGTGGGGTCTCCCCATGCGAGAGTAGGGAACTGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCCTGAGTAGGACAAATCCGCCGGGAGCGGATTTGAACGTTGCGAAGCAACGGCCCGGAGGGTGGCGGGCAGGACGCCCGCCATAAACTGCCAGGCATCAAATTAAGCAGAAGGCCATCCTGACGGATGGCCTTTTTGCGTTTCTACAAACTCTTTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATACACTCCGCTATCGCTACGTGACTGGGTCATGGCTGCGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGGCAGCAGATCAATTCGCGCGCGAAGGCGAAGCGGCATGCATAATGTGCCTGTCAAATGGACGAAGCAGGGATTCTGCAAACCCTATGCTACTCCGTCAAGCCGTCAATTGTCTGATTCGTTACCAATTATGACAACTTGACGGCTACATCATTCACTTTTTCTTCACAACCGGCACGGAACTCGCTCGGGCTGGCCCCGGTGCATTTTTTAAATACCCGCGAGAAATAGAGTTGATCGTCAAAACCAACATTGCGACCGACGGTGGCGATAGGCATCCGGGTGGTGCTCAAAAGCAGCTTCGCCTGGCTGATACGTTGGTCCTCGCGCCAGCTTAAGACGCTAATCCCTAACTGCTGGCGGAAAAGATGTGACAGACGCGACGGCGACAAGCAAACATGCTGTGCGACGCTGGCGAT(SEQ ID NO:3)
构建上述Bi-FoRe donor中涉及PCR扩增时所使用的引物序列如下:
表4
Figure BDA0002283638600000411
4. 显微注射
4.1 显微注射相关器材及试剂
利用型号为MODEL P-2000的拉针仪,将Harvard 1.0D×0.58ID×100L mm毛细管拉制成注射针,参数为HEAT 400、FIL 4、VEL 20、DEL130、PUL 100。制备注射皿,30mL 3%琼脂糖煮沸后倒入直径9cm塑料培养皿中,用注射皿模具排出气泡悬浮凝胶上,待凝固后移开模具,在注射皿表面加入少许蒸馏水4℃保存。酚红(SIGMA),货号P0290。
4.2 显微注射操作
首先,根据实验具体要求配置注射样品,体系中含有添加10×酚红指示剂。选取合适质量较好的注射针,利用无齿镊断开针,断口尖呈切面。使用微量上样枪头吸取注射样品,从注射针尾端上样,尽量不要碰到注射针外壁,以免沾染固体杂质堵塞注射针,上样需连续,中间不能有气柱。然后,使用定量毛细管进行定量(CAMAG),在毛细管内注射33次,液柱长度为1mm时,可保证每次注射量为1nL。最后,收集受精卵,排列在注射皿上进行注射。
5. 利用CRISPR/Cas创建基因敲入鱼系
5.1 通过显微注射创建基因敲入F0及筛选
将nCas9 mRNA、hEMX1 gRNA、靶基因gRNA和对应FoRe donor,按照一定比例混合,注射入一细胞期斑马鱼受精卵中,得到F0。体系浓度配比如下:
Figure BDA0002283638600000421
将F0置于28.5℃恒温培养箱中,待胚胎发育至一定时期(根据基因表达谱选择),利用Zeiss Axioimager Z1显微镜对F0进行荧光筛查。挑选出带有荧光报告基因表达的F0胚胎,并进行计数统计,计算基因敲入的效率。利用lysis buffer提取挑选出F0的基因组。利用5’和3’接口处PCR检测敲入情况,并进行测序鉴定。PCR扩增所用引物如下:
表6
Figure BDA0002283638600000422
Figure BDA0002283638600000431
其中,sF1和sR2用来检测sox10 FoRe基因组的5’接口;bF2和sR1用来检测sox10FoRe基因组的3’接口;sF1和sR3用来检测sox10 FoRe基因组Cre重组之后的5’接口。
iF1和iR2用来检测isl1 FoRe基因组的5’接口;bF2和iR1用来检测isl1 FoRe基因组的3’接口;iF1和iR3用来检测isl1 FoRe基因组Cre重组之后的5’接口。
Bi-FoRe载体正向整合:sF1和sR2用来检测sox10 Bi-FoRe基因组的5’接口;sF4和sR4用来检测sox10 Bi-FoRe基因组的3’接口;sF1和sR3用来检测sox10 Bi-FoRe基因组Cre重组之后的5’接口;sR2和sR4用来检测sox10 Bi-FoRe基因组Cre重组之后的3’接口。
Bi-FoRe载体反向整合:sF1和sF4用来检测sox10 Bi-FoRe基因组的5’接口;sR2和sR4用来检测sox10 Bi-FoRe基因组的3’接口;sF1和sR2用来检测sox10 Bi-FoRe基因组Cre重组之后的5’接口;sR3和sR4用来检测sox10 Bi-FoRe基因组Cre重组之后的3’接口。
Mini-F和Mini-R用来检测sox10 Bi-FoRe基因组phiC31重组之后的基因组接口;Mini-1F和Mini-R1用来检测sox10 Bi-FoRe基因组phiC31重组之后的去除骨架接口。
5.2 筛选条件性敲除F1
将注射过条件性敲除体系的F0饲养至性成熟,与野生型斑马鱼外交,得到F1。利用ZeissAxioimager Z1和A1显微镜对F1进行荧光筛查。并利用AxioCam MRc5(Zeiss)进行图片拍摄及图像处理。挑选出带有荧光表达的F1胚胎,并计算种系传递(germlinetransmission)的效率和嵌合率(mosaicism)。利用lysis buffer提取单枚F1胚胎的基因组,通过5’和3’接口处PCR检测敲入情况,并进行测序鉴定。
实施例1通过基于NHEJ的基因敲入创建sox10条件性敲除鱼系
1.sox10 FoRe载体的构建
基于NCBI网站中的核酸数据库(Nucleotide,https://www.ncbi.nlm.nih.gov/nucleotide/)和ENSEMBL中斑马鱼基因组数据库(版本Zv10,http://asia.ensembl.org/Danio_rerio/Info/Index)对sox10的基因结构和序列进行了分析。sox10只有一个转录本,因此以此转录本的相关信息进行靶点筛选和载体设计与构建。在斑马鱼基因sox10的第三个内含子中设计了CRISPR/Cas靶点,命名为sox10 I3,其序列如SEQ ID NO:6所示。同时设计了一对效率检测引物sF3和sR1(序列见表1),可以通过PCR扩增出长度为407bp的DNA片段,其中含有单一限制性内切酶AciI的识别位点,该酶的识别位点序列为CCGC。随后对该sox10靶点进行了效率评估。结果显示,该sox10靶点的CRISPR/Cas切割活性约为85%,非常适宜作为基因敲入位点。
随后根据sox10的基因序列信息和sox10靶点位置,设计并构建了sox10正反载体(sox10 FoRe donor),其序列如SEQ ID NO:1所示。
其中,正向部分包括lox66位点,sox10靶点下游的第三内含子剩余序列和剩余的SOX10蛋白编码序列(不含终止密码子)以及tdTomato编码序列,被2A序列分隔开,其中SV40pA被用来终止转录。所述正向部分用于维持内源sox10基因的正常表达和功能(图1A)。
反向部分包括lox71位点、sox10靶点下游的第三内含子剩余序列和接下来长度为98bp的sox10蛋白编码序列、2A-EGFP编码序列以及BGH pA转录终止信号,将上述反向部分的反向互补序列插入正向部分的下游,因此反向部分的转录方向就与正向部分相对且有义链位于不同的DNA双链上。所述反向部分被设计用于终止sox10基因的转录,从而破坏sox10基因的功能。利用已经报道过的人类基因EMX1高效靶点(hEMX1 site)(Lin,S.,Staahl,B.,Alla,R.K.,and Doudna,J.A.(2014).Enhanced homology-directed human genomeengineering by controlled timing of CRISPR/Cas9 delivery.Elife 3.)来对载体进行体内线性化(图1A)。
2.sox10 FoRe等位基因的产生和评估
sox10 FoRe载体构建完成后,构建斑马鱼sox10基因的条件性敲除F0。显微注射体系为:nCas9 mRNA 500-600ng/μL、sox10 gRNA 100ng/μL、hEMX1 gRNA 100ng/μL、sox10FoRe donor 15ng/μL。向单细胞期斑马鱼受精卵中注射1-2nL的上述体系。如果在斑马鱼F0胚胎中发生基因敲入事件,利用荧光显微镜即可观察到tdTomato在斑马鱼的耳泡,神经嵴以及色素细胞等位置的表达信号。需要注意的是:实际上,线性化的载体插入基因组中选定位置后的方向是随机的,即可以是sox10 FoRe载体的正向部分与基因组sox10基因的转录方向一致(可称之为情形一),也可以是sox10 FoRe载体的反向部分与基因组sox10基因的转录方向一致(可称之为情形二),两种比例大约各占50%。因此理论上,当出现情形一时,能够观察到tdTomato的红色荧光,并且恢复sox10基因的表达,而反向部分的EGFP不表达;当出现情形二时,能够观察到EGFP的绿色荧光表达,同时敲除sox10的功能,但是没有tdTomato的红色荧光。不过,由于本实施例构建的载体中,hEMX1位点位于正向部分上游非常近的距离内,因此情形一中被转录的无关序列较少,因此结果更加稳定(情形二中还会将质粒载体的大量片段被转录出来,虽然对载体功能没有影响,但是不利于后期的分析)。因此本实施例中筛选的是注射后表达tdTomato红色荧光的转基因鱼后代。
观察结果显示,待F0发育至24hpf左右,利用ZeissAxioimagerA1荧光显微镜对F0进行观察时,在波长为561nm激发光下,可以看到40.9%(38/93)F0胚胎具有tdTomato的红色荧光表达,并且主要表达在耳泡和色素细胞中,初步证明F0胚胎中发生了基因敲入事件,并且正向部分能够有效地维持sox10基因的表达和功能。同时,这些表达tdTomato的胚胎中不能够观察到EGFP的表达。
将表达pattern范围较大的F0饲养到性成熟,分别与野生型杂交,并对F1胚胎进行荧光观察,能够检测到tdTomato荧光在F1胚胎中的表达,进一步证实了在斑马鱼成功发生了由NHEJ介导的基因敲入事件。随后在F1胚胎中注射Cre mRNA,能够看到明显的荧光转换,即从tdTomato的红色荧光变为EGFP的绿色荧光(图1B)。然后利用5’和3’接口PCR实验和测序分析,结果表明sox10 FoRe donor在CRISPR/Cas系统的介导下定向整合进入了sox10的靶位点中,并且能够在Cre的介导下实现整体核酸载体的翻转(图1C和D)。
3.sox10 FoRe等位基因的条件性敲除
在斑马鱼单细胞期受精卵中注射基因敲入体系所产生的F0均为嵌合体胚胎,为了保证所有细胞均发生基因敲入事件,随后将上述经鉴定存在tdTomato表达的F0进行饲养和外交,最终获得能够稳定遗传tdTomato(即能够稳定遗传sox10基因敲入allele)的F1代斑马鱼并饲养至性成熟。
创建基因条件性敲除的最终目的,是利用Cre/loxP系统使目的基因在特定的时间和空间(特定组织器官)发生突变。为了通过表型验证基于sox10正反载体创建的基因敲入斑马鱼系能够实现sox10的条件性敲除,接下来在斑马鱼sox10通过正反载体策略创建的条件性敲除突变的携带者的内交后代中注射Cre mRNA,检测条件性突变的发生。
通过对F1内交后经注射Cre mRNA得到的F2进行表型分析,可以观察到约1/4(28/120)的胚胎在发育至48hpf时出现严重的发育异常,主要表现为全身除眼睛之外的组织中黑色素细胞的缺失,并在发育晚期观察到由于神经发育问题导致的胚胎不规则颤动与无法正常运动的问题(图2A)。上述表型与前人报道的斑马鱼sox10突变体的表型完全一致(Kelsh,R.N.&Eisen,J.S.(2000)The zebrafish colourless gene regulatesdevelopment of non-ectomesenchymal neural crest derivatives.(2000)Development127,515-525)。因此,可以确信注射后的sox10正反载体等位基因导致了sox10的功能失活突变。
在荧光显微镜下观察,发现所有注射过Cre mRNA的胚胎中均无法明显检测到tdTomato的表达,或是有点状的红色荧光残留;而73.3%的胚胎(包括所有突变胚胎)均观察到了按照sox10表达谱表达的绿色荧光,即EGFP的表达。说明Cre重组酶诱导lox66与lox71发生重组的效率比较高,绝大部分的正反元件都发生了翻转(图2A)。
随后选取部分注射过Cre mRNA并发育至72hpf的胚胎,单胚胎提取基因组DNA,通过PCR的方法进行基因型鉴定。其中,在sox10靶点I3的两侧设计了一对引物sF3和sR1,野生型等位基因会由此引物扩增出407bp的条带,而敲入的正反载体等位基因则得到一个560bp左右的更长的条带。结果显示,从表型异常的胚胎中均只能通过PCR扩增得到560bp的片段,说明这些胚胎中只有有正反载体等位基因;在表型相对正常且表达EGFP的胚胎中能同时PCR扩增出407bp和560bp两个条带,说明这些胚胎是正反载体等位基因和野生型等位基因的杂合子;在表型正常且无荧光的胚胎中PCR只能得到407bp的条带,证明这些胚胎只有野生型的sox10等位基因(图2B)。
实施例2通过基于NHEJ的基因敲入创建isl1条件性敲除鱼系
isl1基因主要表达于斑马鱼的运动神经元、胰腺和心脏等组织。isl1对斑马鱼的心脏发育非常重要,主要作用于第二生心区(second heart field,SHF)来源的心肌细胞(Caputo,L.,Witzel,H.R.,Kolovos,P.,Cheedipudi,S.,Looso,M.,Mylona,A.,van,I.W.F.,Laugwitz,K.L.,Evans,S.M.,Braun,T.,et al.(2015).The Isl1/Ldb1 ComplexOrchestrates Genome-wide Chromatin Organization to Instruct Differentiationof Multipotent Cardiac Progenitors.Cell Stem Cell 17,287-299;Sirbu,I.O.,Zhao,X.,and Duester,G.(2008).Retinoic acid controls heart anteroposteriorpatterning by down-regulating Isl1 through the Fgf8pathway.Dev Dyn 237,1627-1635;Witzel,H.R.,Cheedipudi,S.,Gao,R.,Stainier,D.Y.,and Dobreva,G.D.(2017).Isl2b regulates anterior second heart field development in zebrafish.Sci Rep7,41043;Witzel,H.R.,Jungblut,B.,Choe,C.P.,Crump,J.G.,Braun,T.,and Dobreva,G.(2012).The LIM protein Ajuba restricts the second heart field progenitor poolby regulatingIsl1 activity.Dev Cell 23,58-70)。利用ENSEMBL中的斑马鱼基因数据库对isl1进行分析发现该基因共有六个外显子,目前只有一个转录本isl1-201,转录本编号为ENSDART00000010896.5。经过对该基因的所有内含子进行序列分析发现只有第三个内含子比较适合用于筛选CRISPR/Cas靶点。通过显微注射和HpyCH4III酶切进行靶点效率评估,在第三个内含子获得了一个效率接近98%的靶点,将该靶点命名为isl1I3。
基于与实施例1类似的策略,设计构建了用于isl1基因敲入的正反载体,其序列如SEQ ID NO:2所示。
以通过基因敲入构建isl1的条件性敲除与标记转换斑马鱼。
随后通过显微注射向单细胞期斑马鱼胚胎注射了isl1的基因敲入体系,注射体系为:Cas9 mRNA300-400 ng/μL、isl1 I3 gRNA 100ng/μL、hEMX1 gRNA 100ng/μL、isl1正反载体15ng/μL。
在斑马鱼单细胞期受精卵中注射基因敲入体系所产生的F0均为嵌合体胚胎,为了保证所有细胞均发生基因敲入事件,将上述经鉴定存在tdTomato表达的F0进行饲养和外交,最终获得能够稳定遗传tdTomato的(即稳定遗传isl1基因敲入)F1代斑马鱼。进一步通过F1内交与注射Cre mRNA进行条件性敲除实验表明敲入载体能够实现isl1基因的条件性敲除与红-绿荧光转换,且表型与基因型有严格的对应关系且符合孟德尔遗传定律(与实施例1的结果类似,数据未展示)。
实施例3同时创建并筛选sox10条件性敲除以及条件性拯救且携带不同荧光标记的鱼系,以及实现载体质粒骨架去除
首先同样利用实施例1中sox10 I3靶点作为基因敲入位点,构建了sox10 CKO+conditional rescue+骨架去除载体,其序列如SEQ ID NO:3所示。
由于质粒载体的线性化位点位于正反元件之间,因此发生线性化之后,正反元件上游保留的质粒载体序列都比较短,因此当线性化载体插入基因组后,不论其插入方向是正向元件位于上游还是反向元件位于上游,转录后所得到的转录本均仅包含较短的来自于质粒载体的无关序列,因此本实施例中由上述两种插入方向获得的转基因鱼均可以作为筛选对象供后续应用研究。其中,如果正元件位于上游,即正元件的转录方向与内源sox10基因的转录方向一致,这样的转基因鱼系可用于实现条件性基因敲除;反之,如果反向元件位于上游,则反向元件的转录方向与内源sox10基因的转录方向一致,这样的转基因鱼系会直接缺失sox10基因的功能,可用于后续实现条件性基因拯救,具体原理如图3A所示。
通过显微注射向单细胞期斑马鱼胚胎中注射基因敲入体系:nCas9mRNA 300-400ng/μL、sox10 I3 gRNA 100ng/μL、hEMX1 gRNA 100ng/μL、sox10 CKO+conditionalrescue+骨架去除载体15ng/μL,得到了有荧光表达的F0斑马鱼胚胎,其中,红色荧光胚胎占所有注射胚胎的20.7%,绿色占42.2%(有11.8%的胚胎能同时观察到红色和绿色的荧光),总计效率为52.1%(69/135)。在筛选的18个F0中,有3个只携带红色荧光的种系传递,4个只携带绿色荧光的种系传递,另个同时携带红色和绿色荧光的种系传递,总计,种系传递效率高达50%,F1的荧光表达模式如图3B所示,之后我们分别对两种整合的等位基因进行了接口PCR检测,结果如图3C和图3D所示,这些再次证明了两种基因敲入事件的发生。由于我们可以一次性获得不同荧光标记不同等位基因的鱼系,这样我们可以很容易拿到同时携带两种荧光的稳定鱼系,将其进行自交,便可以通过荧光判定胚胎的基因型,这对于研究基因功能有很大的帮助。
条件性敲除与条件性拯救
同实施例1和实施例2,通过对有荧光F0进行饲养和外交,分别得到能够稳定遗传tdTomato或EGFP表达的F1胚胎。其中表达tdTomato的胚胎饲养至性成熟后进行条件性敲除实验。如同例1,在F1自交得到的单细胞胚胎中注射Cre mRNA,能够观察到如同例1的实验结果,即红色荧光的消失与绿色荧光的出现,以及部分个体中出现与例1相同的表型(图4A),基因型鉴定也证明了表型与基因型的一致性(结果略),对重组之后的等位基因进行接口PCR检测,再次证明了重组事件的发生(图4B)。对突变的胚胎进行RT-PCR实验,在sox10突变体中几乎检测不到野生型sox10的转录本(图4C),这表明条件性基因敲除已经被有效实现。
为了节约实验时间,分别采用了两条子代胚胎中有绿色荧光表达的F0成鱼进行杂交,并在子代胚胎一细胞期注射Cre mRNA。注射后待胚胎发育至24-30小时观察荧光,发现基本无法观察到绿色荧光,且部分个体带有红色荧光。对重组之后的等位基因进行接口PCR检测,再次证明了重组事件的发生(图4E)。挑取带有红色荧光的个体,以及未注射Cre的对照胚胎中有绿色荧光的个体进行进一步观察。在发育至48小时后,所有红色荧光的个体均没有光学显微镜下可见的表型,而对照组中有绿色荧光的个体中出现了一部分与实施例1注射后相类似的表型,证明在未注射Cre的胚胎中,有部分胚胎由于同时携带两个F0的反向敲入等位基因,因而产生了sox10突变的表型,这一表型在注射Cre mRNA后被拯救(图4D)。单胚胎提取红色荧光F1基因组,并通过引物sF3和sR1来进行基因型鉴定,结果证明在随机挑选的7枚胚胎中,2枚携带有两个不同的分别来源于双方F0的敲入等位基因,而其他5枚则携带一个敲入等位基因和一个野生型sox10基因。对拯救的红色荧光胚胎进行RT-PCR实验,可以检测到野生型sox10转录本的恢复,而未注射Cre mRNA的突变体中几乎检测不到野生型sox10的转录本(图4F),结果充分证明了条件性拯救已经被有效实现。
通过体内注射phiC31mRNA实现载体质粒骨架的去除
sox10 CKO+conditional rescue+骨架去除载体的骨架两侧带有attB与attP位点,能够在phiC31重组酶的作用下发生重组并去除骨架,原理如图5A所示。利用上述得到的稳定表达tdTomato或EGFP的F1成鱼与野生型鱼外交,并注射斑马鱼密码子优化的phiC31mRNA,待胚胎发育至24小时后提取基因组,利用引物Mini-F和Mini-R扩增重组之后的基因组,发现在注射了phiC31 mRNA且有荧光的胚胎中,能够得到条带,而未注射的有荧光的胚胎或是注射后的无荧光胚胎则没有条带(图5B)。同样地,通过设计引物Mini-F1和Mini-R1扩增去除的骨架,也仅在注射后并有荧光的胚胎中才能得到条带,而对照组不能(图5B)。对上述两组PCR产物进行测序对比,其结果也证明了注射phiC31 mRNA能够去除已经敲入的等位基因的质粒骨架(测序数据略)。对注射phiC31 mRNA后的胚胎进行荧光观察,发现荧光强度与未注射phiC31 mRNA的相当(图5C)。
实施例4通过微环载体进行敲入实验
sox10 CKO+conditional rescue+骨架去除载体能够实现在特殊的菌种中于阿拉伯糖诱导下体外去除质粒骨架序列(ZYCY10P3S2T菌株,MN900A-1,System Biosciences)(Kay,M.A.,He,C.Y.&Chen,Z.Y.A robust system for production of minicircle DNAvectors.(2010)Nature Biotechnology.28,1287-1289)。将上述载体转化到ZYCY10P3S2T菌株中,并涂布于含卡那霉素的LB平板上,后挑取单克隆进行鉴定,并按照引文与说明书建议的实验方法进行完整操作,后通过质粒小提试剂盒(DP103-03,天根)获得微环sox10 CKO+conditional rescue载体。
按照Cas9 mRNA300-400 ng/μL、sox10I3 gRNA 100ng/μL、hEMX1gRNA 100ng/μL、微环sox10 CKO+conditional rescue载体9ng/μL的体系配制注射样品,并注射至野生型斑马鱼1细胞期胚胎中,微环载体的整合原理如图5D所示。结果显示在注射得到的147枚F0胚胎中,51.7%能观察到红色荧光,29.9%能观察到绿色荧光(图5E)。并且,上述胚胎中有25枚能够同时观察到两种荧光信号,总计效率为64.4%,高于未去骨架载体的51.1%,说明了更小的载体可以提升敲入的效率,而且骨架的去除也可以避免过多的外源DNA序列由于DNA甲基化等原因可能对内源基因,尤其是靶基因表达水平造成干扰,具有良好的应用前景。
SEQUENCE LISTING
<110> 北京大学
<120> 一种条件性基因敲除或者拯救方法
<130> 201911
<160> 45
<170> PatentIn version 3.2
<210> 1
<211> 7298
<212> DNA
<213> 人工序列
<400> 1
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 60
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 120
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 180
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 240
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 300
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 360
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc 420
aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc 480
gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca 540
ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa 600
caatttcaca caggaaacag ctatgaccat gattacgaat tcgggtcaac gacttcctgc 660
acgggaccgt cacctccaat gactagggtg gcatgcaccc aaaacccagt gtcaactttt 720
gctttaaata gtacagaatc cgtttaagga acagtgtcta tttatcgtct gacagtcttg 780
ttttgaggac tgcataggag ggataacttc gtatagcata cattatacga acggtacaat 840
cgtcgagcgg cgcttgtaat ggaaaggtac cgctatgctt cacattagac attatacgat 900
ggcaaattgt tcaacattgc ccaatcctaa tatacattta gattgatata tttaatggac 960
ctagtgtata gtttctatta aatatacaga tatacaccta ttaagtatga atatgaatta 1020
aaattaaaaa ttatttgtat atatatatat acacacacat aataaatata caaagtacgc 1080
acgaatatat tatgcaaata caaactttta aatgtgaaaa ttcattcaat aatattatta 1140
aaataaatta attttaaata aatttcaaat agcaataaca ctttttccac tctatttttg 1200
agtaaacaac aactactttt gaaaaacgaa aaaccaacta aaactatttt cttgtatttg 1260
tttgctcagg tcagagtcac agccctccaa cgccccctac cacccccaag acggaactgc 1320
agggaggaaa atcaggcgag ggcaagcgtg agggcggagc ctctcggagt ggactggggg 1380
tgggagcaga tggaagctcc gcctcatcgt ctgccagcgg gaaaccgcac atcgacttcg 1440
gtaacgtgga cattggcgaa atcagccatg acgtgatggc caacatggag ccgttcgacg 1500
tgaacgagtt cgaccagtat ctcccaccca atggccaccc gcaggcgtcc gccactgcca 1560
gcgcaggatc tgcagcgcca tcgtatacat acggcatctc cagcgcgcta gcggccgcta 1620
gtggccactc caccgcatgg ctgtccaagc agcaactgcc gtcccagcag catttgggcg 1680
cagatggcgg aaaaacgcag ataaagagtg aaacacactt ccccggggat acagcggcga 1740
gcggttcaca cgtcacatac acgccgctaa cactgccgca ctacagctcc gccttcccct 1800
cgctggcgtc ccgcgcacag ttcgccgaat acgccgagca ccaggcctcg ggatcctact 1860
acgcccactc cagccagacc tcaggcctct actccgcctt ctcctacatg ggcccctcac 1920
agcggcccct gtacaccgcc attccggatc cgggatccgt gccgcagtcg cacagcccca 1980
cgcactggga gcagcccgta tacaccacac tgtctcgacc gcctagggag ggcagaggaa 2040
gtcttctaac atgcggtgac gtcgaggaga atcccggccc tactagtatg gtgagcaagg 2100
gcgaggaggt catcaaagag ttcatgcgct tcaaggtgcg catggagggc tccatgaacg 2160
gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc acccagaccg 2220
ccaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc ctgtcccccc 2280
agttcatgta cggctccaag gcgtacgtga agcaccccgc cgacatcccc gattacaaga 2340
agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag gacggcggtc 2400
tggtgaccgt gacccaggac tcctccctgc aggacggcac gctgatctac aaggtgaaga 2460
tgcgcggcac caacttcccc cccgacggcc ccgtaatgca gaagaagacc atgggctggg 2520
aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag atccaccagg 2580
ccctgaagct gaaggacggc ggccactacc tggtggagtt caagaccatc tacatggcca 2640
agaagcccgt gcaactgccc ggctactact acgtggacac caagctggac atcacctccc 2700
acaacgagga ctacaccatc gtggaacagt acgagcgctc cgagggccgc caccacctgt 2760
tcctggggca tggcaccggc agcaccggca gcggcagctc cggcaccgcc tcctccgagg 2820
acaacaacat ggccgtcatc aaagagttca tgcgcttcaa ggtgcgcatg gagggctcca 2880
tgaacggcca cgagttcgag atcgagggcg agggcgaggg ccgcccctac gagggcaccc 2940
agaccgccaa gctgaaggtg accaagggcg gccccctgcc cttcgcctgg gacatcctgt 3000
ccccccagtt catgtacggc tccaaggcgt acgtgaagca ccccgccgac atccccgatt 3060
acaagaagct gtccttcccc gagggcttca agtgggagcg cgtgatgaac ttcgaggacg 3120
gcggtctggt gaccgtgacc caggactcct ccctgcagga cggcacgctg atctacaagg 3180
tgaagatgcg cggcaccaac ttcccccccg acggccccgt aatgcagaag aagaccatgg 3240
gctgggaggc ctccaccgag cgcctgtacc cccgcgacgg cgtgctgaag ggcgagatcc 3300
accaggccct gaagctgaag gacggcggcc actacctggt ggagttcaag accatctaca 3360
tggccaagaa gcccgtgcaa ctgcccggct actactacgt ggacaccaag ctggacatca 3420
cctcccacaa cgaggactac accatcgtgg aacagtacga gcgctccgag ggccgccacc 3480
acctgttcct gtacggcatg gacgagctgt acaagtaaac tatagtgagt cgtattacgt 3540
agatccagac atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg 3600
aaaaaaatgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag 3660
ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga 3720
ggtgtgggag gttttttaat tcgcggccgc tctagatggc cagatcctgt gccttctagt 3780
tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3840
cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3900
tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3960
aggcatgctc acttgtagag ctcgtccatg ccgagagtga tcccggcggc ggtcacgaac 4020
tccagcagga ccatgtgatc gcgcttctcg ttggggtctt tgctcagggc ggactgggtg 4080
ctcaggtagt ggttgtcggg cagcagcacg gggccgtcgc cgatgggggt gttctgctgg 4140
tagtggtcgg cgagctgcac gctgccgtcc tcgatgttgt ggcggatctt gaagttcacc 4200
ttgatgccgt tcttctgctt gtcggccatg atatagacgt tgtggctgtt gtagttgtac 4260
tccagcttgt gccccaggat gttgccgtcc tccttgaagt cgatgccctt cagctcgatg 4320
cggttcacca gggtgtcgcc ctcgaacttc acctcggcgc gggtcttgta gttgccgtcg 4380
tccttgaaga agatggtgcg ctcctggacg tagccttcgg gcatggcgga cttgaagaag 4440
tcgtgctgct tcatgtggtc ggggtagcgg ctgaagcact gcacgccgta ggtcagggtg 4500
gtcacgaggg tgggccaggg cacgggcagc ttgccggtgg tgcagatgaa cttcagggtc 4560
agcttgccgt aggtggcatc gccctcgccc tcgccggaca cgctgaactt gtggccgttt 4620
acgtcgccgt ccagctcgac caggatgggc accaccccgg tgaacagctc ctcgcccttg 4680
ctcacaggtc cagggttctc ctccacgtct ccagcctgct tcagcaggct gaagttagta 4740
gctccgcttc cgatatcccg agaggctccg ccctcacgct tgccctcgcc tgattttcct 4800
ccctgcagtt ccgtcttggg ggtggtaggg ggcgttggag ggctgtgact ctgacctgag 4860
caaacaaata caagaaaata gttttagttg gtttttcgtt tttcaaaagt agttgttgtt 4920
tactcaaaaa tagagtggaa aaagtgttat tgctatttga aatttattta aaattaattt 4980
attttaataa tattattgaa tgaattttca catttaaaag tttgtatttg cataatatat 5040
tcgtgcgtac tttgtatatt tattatgtgt gtgtatatat atatatacaa ataattttta 5100
attttaattc atattcatac ttaataggtg tatatctgta tatttaatag aaactataca 5160
ctaggtccat taaatatatc aatctaaatg tatattaggg ttgggcaatg ttgaacaatt 5220
tgccatcgta taatgtctaa tgtgaagcat agcgtcgaca taacttcgta taatgtatgc 5280
tatacgaacg gtacatagaa agcttggcac tggccgtcgt tttacaacgt cgtgactggg 5340
aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc 5400
gtaatagcga agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg 5460
aatggcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat 5520
ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc 5580
caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 5640
ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 5700
cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg 5760
tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 5820
ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 5880
aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct 5940
tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag 6000
atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta 6060
agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc 6120
tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca 6180
tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg 6240
atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg 6300
ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca 6360
tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa 6420
acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa 6480
ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata 6540
aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat 6600
ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc 6660
cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata 6720
gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt 6780
actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga 6840
agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 6900
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 6960
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 7020
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 7080
tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 7140
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 7200
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 7260
gttcgtgcac acagcccagc ttggagcgaa cgacctac 7298
<210> 2
<211> 6536
<212> DNA
<213> 人工序列
<400> 2
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 60
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 120
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 180
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 240
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 300
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 360
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc 420
aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc 480
gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca 540
ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa 600
caatttcaca caggaaacag ctatgaccat gattacgaat tcgggtcaac gacttcctgc 660
acgggaccgt cacctccaat gactagggtg gcatgcaccc aaaacccagt gtcaactttt 720
gctttaaata gtacagaatc cgtttaagga acagtgtcta tttatcgtct gacagtcttg 780
ttttgaggac tgcataggag ggataacttc gtatagcata cattatacga acggtacaat 840
cgtcgagcgg cgcttgtaat ggaaaggtac cgtagatggg cctcggagac aactgagtta 900
aaataattaa cagctgaccg cttaacatat gtgcattttt ttacaaatgt aaaacatcat 960
acaacagctc tttgcattta atatttattt atttttgttt gtttcgtaat tttatgcagc 1020
agagcccatt tcggcacgtc agcctgcgct tcgacctcat gtgcacaagc aacctgagaa 1080
aacaacccgc gtccggacag tcctcaacga aaaacagctc cataccttga ggacttgtta 1140
caatgccaac cctcgacccg acgccctcat gaaagagcag ctcgttgaga tgacgggtct 1200
tagtccgaga gtcatcaggg tttggtttca aaacaagcgc tgcaaggata aaaagaggag 1260
catactgatg aagcaactcc agcagcagca acccaacgac aaaacgaaca tccaggggat 1320
gacaggtact ccaatggtgg cgaccagtcc agagagacac gacggtggtt tgcaggcaaa 1380
ccaagtggag gtgcagagtt accaaccgcc ttggaaagtc ctaagtgact tcgcactgca 1440
gagtgacatc gaccagcctg ctttccaaca actggttaat ttttctgaag gtggtccagg 1500
ctcaaactcc acagggagcg aggtcgcgtc aatgtcctcg caactgccag atacaccaaa 1560
cagcatggta gcgagtccta tagaggcccc tagggagggc agaggaagtc ttctaacatg 1620
cggtgacgtc gaggagaatc ccggccctac tagtatggtg agcaagggcg aggaggtcat 1680
caaagagttc atgcgcttca aggtgcgcat ggagggctcc atgaacggcc acgagttcga 1740
gatcgagggc gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt 1800
gaccaagggc ggccccctgc ccttcgcctg ggacatcctg tccccccagt tcatgtacgg 1860
ctccaaggcg tacgtgaagc accccgccga catccccgat tacaagaagc tgtccttccc 1920
cgagggcttc aagtgggagc gcgtgatgaa cttcgaggac ggcggtctgg tgaccgtgac 1980
ccaggactcc tccctgcagg acggcacgct gatctacaag gtgaagatgc gcggcaccaa 2040
cttccccccc gacggccccg taatgcagaa gaagaccatg ggctgggagg cctccaccga 2100
gcgcctgtac ccccgcgacg gcgtgctgaa gggcgagatc caccaggccc tgaagctgaa 2160
ggacggcggc cactacctgg tggagttcaa gaccatctac atggccaaga agcccgtgca 2220
actgcccggc tactactacg tggacaccaa gctggacatc acctcccaca acgaggacta 2280
caccatcgtg gaacagtacg agcgctccga gggccgccac cacctgttcc tggggcatgg 2340
caccggcagc accggcagcg gcagctccgg caccgcctcc tccgaggaca acaacatggc 2400
cgtcatcaaa gagttcatgc gcttcaaggt gcgcatggag ggctccatga acggccacga 2460
gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga ccgccaagct 2520
gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc cccagttcat 2580
gtacggctcc aaggcgtacg tgaagcaccc cgccgacatc cccgattaca agaagctgtc 2640
cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gtctggtgac 2700
cgtgacccag gactcctccc tgcaggacgg cacgctgatc tacaaggtga agatgcgcgg 2760
caccaacttc ccccccgacg gccccgtaat gcagaagaag accatgggct gggaggcctc 2820
caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc gagatccacc aggccctgaa 2880
gctgaaggac ggcggccact acctggtgga gttcaagacc atctacatgg ccaagaagcc 2940
cgtgcaactg cccggctact actacgtgga caccaagctg gacatcacct cccacaacga 3000
ggactacacc atcgtggaac agtacgagcg ctccgagggc cgccaccacc tgttcctgta 3060
cggcatggac gagctgtaca agtaaactat agtgagtcgt attacgtaga tccagacatg 3120
ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt 3180
atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa 3240
gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt 3300
ttttaattcg cggccgctct agatggccag atcctgtgcc ttctagttgc cagccatctg 3360
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 3420
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 3480
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctcact 3540
tgtagagctc gtccatgccg agagtgatcc cggcggcggt cacgaactcc agcaggacca 3600
tgtgatcgcg cttctcgttg gggtctttgc tcagggcgga ctgggtgctc aggtagtggt 3660
tgtcgggcag cagcacgggg ccgtcgccga tgggggtgtt ctgctggtag tggtcggcga 3720
gctgcacgct gccgtcctcg atgttgtggc ggatcttgaa gttcaccttg atgccgttct 3780
tctgcttgtc ggccatgata tagacgttgt ggctgttgta gttgtactcc agcttgtgcc 3840
ccaggatgtt gccgtcctcc ttgaagtcga tgcccttcag ctcgatgcgg ttcaccaggg 3900
tgtcgccctc gaacttcacc tcggcgcggg tcttgtagtt gccgtcgtcc ttgaagaaga 3960
tggtgcgctc ctggacgtag ccttcgggca tggcggactt gaagaagtcg tgctgcttca 4020
tgtggtcggg gtagcggctg aagcactgca cgccgtaggt cagggtggtc acgagggtgg 4080
gccagggcac gggcagcttg ccggtggtgc agatgaactt cagggtcagc ttgccgtagg 4140
tggcatcgcc ctcgccctcg ccggacacgc tgaacttgtg gccgtttacg tcgccgtcca 4200
gctcgaccag gatgggcacc accccggtga acagctcctc gcccttgctc acaggtccag 4260
ggttctcctc cacgtctcca gcctgcttca gcaggctgaa gttagtagct ccgcttccgc 4320
tagctgccga aatgggctct gctgcataaa attacgaaac aaacaaaaat aaataaatat 4380
taaatgcaaa gagctgttgt atgatgtttt acatttgtaa aaaaatgcac atatgttaag 4440
cggtcagctg ttaattattt taactcagtt gtctccgagg cccatctacg ggtcgacata 4500
acttcgtata atgtatgcta tacgaacggt acatagaaag cttggcactg gccgtcgttt 4560
tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 4620
cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt 4680
tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt tctccttacg catctgtgcg 4740
gtatttcaca ccgcatatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa 4800
gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg 4860
catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac 4920
cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt ttataggtta 4980
atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg 5040
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 5100
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 5160
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 5220
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 5280
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 5340
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag 5400
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 5460
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 5520
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 5580
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 5640
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 5700
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 5760
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 5820
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 5880
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 5940
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 6000
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 6060
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 6120
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 6180
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 6240
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 6300
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 6360
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 6420
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 6480
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctac 6536
<210> 3
<211> 9198
<212> DNA
<213> 人工序列
<400> 3
acattaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 60
atccctagat gacattaccc tgttatccct agatgacatt taccctgtta tccctagatg 120
acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 180
tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 240
accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 300
gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 360
gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagatga 420
cattaccctg ttatccctag atacattacc ctgttatccc agatgacata ccctgttatc 480
cctagatgac attaccctgt tatcccagat gacattaccc tgttatccct agatacatta 540
ccctgttatc ccagatgaca taccctgtta tccctagatg acattaccct gttatcccag 600
atgacattac cctgttatcc ctagatacat taccctgtta tcccagatga cataccctgt 660
tatccctaga tgacattacc ctgttatccc agataaactc aatgatgatg atgatgatgg 720
tcgagactca gcggccgcgg tgccagggcg tgcccttggg ctccccgggc gcggatccag 780
acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 840
gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 900
aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg 960
aggtttttta attcgcggcc gctctagatg gccagatcct gtgccttcta gttgccagcc 1020
atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt 1080
cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct 1140
ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc 1200
tcacttgtag agctcgtcca tgccgagagt gatcccggcg gcggtcacga actccagcag 1260
gaccatgtga tcgcgcttct cgttggggtc tttgctcagg gcggactggg tgctcaggta 1320
gtggttgtcg ggcagcagca cggggccgtc gccgatgggg gtgttctgct ggtagtggtc 1380
ggcgagctgc acgctgccgt cctcgatgtt gtggcggatc ttgaagttca ccttgatgcc 1440
gttcttctgc ttgtcggcca tgatatagac gttgtggctg ttgtagttgt actccagctt 1500
gtgccccagg atgttgccgt cctccttgaa gtcgatgccc ttcagctcga tgcggttcac 1560
cagggtgtcg ccctcgaact tcacctcggc gcgggtcttg tagttgccgt cgtccttgaa 1620
gaagatggtg cgctcctgga cgtagccttc gggcatggcg gacttgaaga agtcgtgctg 1680
cttcatgtgg tcggggtagc ggctgaagca ctgcacgccg taggtcaggg tggtcacgag 1740
ggtgggccag ggcacgggca gcttgccggt ggtgcagatg aacttcaggg tcagcttgcc 1800
gtaggtggca tcgccctcgc cctcgccgga cacgctgaac ttgtggccgt ttacgtcgcc 1860
gtccagctcg accaggatgg gcaccacccc ggtgaacagc tcctcgccct tgctcacagg 1920
tccagggttc tcctccacgt ctccagcctg cttcagcagg ctgaagttag tagctccgct 1980
tccgatatcc cgagaggctc cgccctcacg cttgccctcg cctgattttc ctccctgcag 2040
ttccgtcttg ggggtggtag ggggcgttgg agggctgtga ctctgacctg agcaaacaaa 2100
tacaagaaaa tagttttagt tggtttttcg tttttcaaaa gtagttgttg tttactcaaa 2160
aatagagtgg aaaaagtgtt attgctattt gaaatttatt taaaattaat ttattttaat 2220
aatattattg aatgaatttt cacatttaaa agtttgtatt tgcataatat attcgtgcgt 2280
actttgtata tttattatgt gtgtgtatat atatatatac aaataatttt taattttaat 2340
tcatattcat acttaatagg tgtatatctg tatatttaat agaaactata cactaggtcc 2400
attaaatata tcaatctaaa tgtatattag ggttgggcaa tgttgaacaa tttgccatcg 2460
tataatgtct aatgtgaagc atagcgtcga cataacttcg tataatgtat gctatacgaa 2520
cggtacatag aaagcttggc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 2580
ggcgttacag cgctgggtca acgacttcct gcacgggacc gtcacctcca atgactaggg 2640
tggcatgcac ccaaaaccca gtgtcaactt ttgctttaaa tagtacagaa tccgtttaag 2700
gaacagtgtc tatttatcgt ctgacagtct tgttttgagg actgcatagg agggataact 2760
tcgtatagca tacattatac gaacggtaca atcgtcgagc ggcgcttgta atggaaaggt 2820
accgctatgc ttcacattag acattatacg atggcaaatt gttcaacatt gcccaatcct 2880
aatatacatt tagattgata tatttaatgg acctagtgta tagtttctat taaatataca 2940
gatatacacc tattaagtat gaatatgaat taaaattaaa aattatttgt atatatatat 3000
atacacacac ataataaata tacaaagtac gcacgaatat attatgcaaa tacaaacttt 3060
taaatgtgaa aattcattca ataatattat taaaataaat taattttaaa taaatttcaa 3120
atagcaataa cactttttcc actctatttt tgagtaaaca acaactactt ttgaaaaacg 3180
aaaaaccaac taaaactatt ttcttgtatt tgtttgctca ggtcagagtc acagccctcc 3240
aacgccccct accaccccca agacggaact gcagggagga aaatcaggcg agggcaagcg 3300
tgagggcgga gcctctcgga gtggactggg ggtgggagca gatggaagct ccgcctcatc 3360
gtctgccagc gggaaaccgc acatcgactt cggtaacgtg gacattggcg aaatcagcca 3420
tgacgtgatg gccaacatgg agccgttcga cgtgaacgag ttcgaccagt atctcccacc 3480
caatggccac ccgcaggcgt ccgccactgc cagcgcagga tctgcagcgc catcgtatac 3540
atacggcatc tccagcgcgc tagcggccgc tagtggccac tccaccgcat ggctgtccaa 3600
gcagcaactg ccgtcccagc agcatttggg cgcagatggc ggaaaaacgc agataaagag 3660
tgaaacacac ttccccgggg atacagcggc gagcggttca cacgtcacat acacgccgct 3720
aacactgccg cactacagct ccgccttccc ctcgctggcg tcccgcgcac agttcgccga 3780
atacgccgag caccaggcct cgggatccta ctacgcccac tccagccaga cctcaggcct 3840
ctactccgcc ttctcctaca tgggcccctc acagcggccc ctgtacaccg ccattccgga 3900
tccgggatcc gtgccgcagt cgcacagccc cacgcactgg gagcagcccg tatacaccac 3960
actgtctcga ccgcctaggg agggcagagg aagtcttcta acatgcggtg acgtcgagga 4020
gaatcccggc cctactagta tggtgagcaa gggcgaggag gtcatcaaag agttcatgcg 4080
cttcaaggtg cgcatggagg gctccatgaa cggccacgag ttcgagatcg agggcgaggg 4140
cgagggccgc ccctacgagg gcacccagac cgccaagctg aaggtgacca agggcggccc 4200
cctgcccttc gcctgggaca tcctgtcccc ccagttcatg tacggctcca aggcgtacgt 4260
gaagcacccc gccgacatcc ccgattacaa gaagctgtcc ttccccgagg gcttcaagtg 4320
ggagcgcgtg atgaacttcg aggacggcgg tctggtgacc gtgacccagg actcctccct 4380
gcaggacggc acgctgatct acaaggtgaa gatgcgcggc accaacttcc cccccgacgg 4440
ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc accgagcgcc tgtacccccg 4500
cgacggcgtg ctgaagggcg agatccacca ggccctgaag ctgaaggacg gcggccacta 4560
cctggtggag ttcaagacca tctacatggc caagaagccc gtgcaactgc ccggctacta 4620
ctacgtggac accaagctgg acatcacctc ccacaacgag gactacacca tcgtggaaca 4680
gtacgagcgc tccgagggcc gccaccacct gttcctgggg catggcaccg gcagcaccgg 4740
cagcggcagc tccggcaccg cctcctccga ggacaacaac atggccgtca tcaaagagtt 4800
catgcgcttc aaggtgcgca tggagggctc catgaacggc cacgagttcg agatcgaggg 4860
cgagggcgag ggccgcccct acgagggcac ccagaccgcc aagctgaagg tgaccaaggg 4920
cggccccctg cccttcgcct gggacatcct gtccccccag ttcatgtacg gctccaaggc 4980
gtacgtgaag caccccgccg acatccccga ttacaagaag ctgtccttcc ccgagggctt 5040
caagtgggag cgcgtgatga acttcgagga cggcggtctg gtgaccgtga cccaggactc 5100
ctccctgcag gacggcacgc tgatctacaa ggtgaagatg cgcggcacca acttcccccc 5160
cgacggcccc gtaatgcaga agaagaccat gggctgggag gcctccaccg agcgcctgta 5220
cccccgcgac ggcgtgctga agggcgagat ccaccaggcc ctgaagctga aggacggcgg 5280
ccactacctg gtggagttca agaccatcta catggccaag aagcccgtgc aactgcccgg 5340
ctactactac gtggacacca agctggacat cacctcccac aacgaggact acaccatcgt 5400
ggaacagtac gagcgctccg agggccgcca ccacctgttc ctgtacggca tggacgagct 5460
gtacaagtaa actatagtga gtcgtattac gtagatccag acatgataag atacattgat 5520
gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt 5580
gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat 5640
tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta attcgcggcc 5700
gctctagatg gccagatcct gtgccttcta gttgccagcc atctgttgtt tgcccctccc 5760
ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg 5820
aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg 5880
acagcaaggg ggaggattgg gaagacaata gcagctgggg atgtacaagg ggcccgcccc 5940
aactggggta acctttgagt tctctcagtt gggggtaatc agcatcatga tgtggtacca 6000
catcatgatg ctgattataa gaatgcggcc gccacactct agtggatctc gagttaataa 6060
ttcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 6120
taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 6180
gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 6240
atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 6300
cgacgagatc ctcgccgtcg ggcatgctcg ccttgagcct ggcgaacagt tcggctggcg 6360
cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 6420
tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 6480
gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 6540
gtagatgaca tggagatcct gccccggcac ttcgcccaat agcagccagt cccttcccgc 6600
ttcagtgaca acgtcgagca cagctgcgca aggaacgccc gtcgtggcca gccacgatag 6660
ccgcgctgcc tcgtcttgca gttcattcag ggcaccggac aggtcggtct tgacaaaaag 6720
aaccgggcgc ccctgcgctg acagccggaa cacggcggca tcagagcagc cgattgtctg 6780
ttgtgcccag tcatagccga atagcctctc cacccaagcg gccggagaac ctgcgtgcaa 6840
tccatcttgt tcaatcatgc gaaacgatcc tcatcctgtc tcttgatcag agcttgatcc 6900
cctgcgccat cagatccttg gcggcgagaa agccatccag tttactttgc agggcttccc 6960
aaccttacca gagggcgccc cagctggcaa ttccggttcg cttgctgtcc ataaaaccgc 7020
ccagtctagc tatcgccatg taagcccact gcaagctacc tgctttctct ttgcgcttgc 7080
gttttccctt gtccagatag cccagtagct gacattcatc cggggtcagc accgtttctg 7140
cggactggct ttctacgtgc tcgagggggg ccaaacggtc tccagcttgg ctgttttggc 7200
ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata 7260
aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca 7320
gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac 7380
tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg 7440
ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt 7500
tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca 7560
aattaagcag aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctcttttgtt 7620
tatttttcta aatacattca aatatgtatc cgctcatgac caaaatccct taacgtgagt 7680
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 7740
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 7800
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 7860
agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 7920
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 7980
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 8040
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 8100
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 8160
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 8220
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 8280
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 8340
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 8400
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 8460
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc 8520
tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt acaatctgct 8580
ctgatgccgc atagttaagc cagtatacac tccgctatcg ctacgtgact gggtcatggc 8640
tgcgccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 8700
atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 8760
gtcatcaccg aaacgcgcga ggcagcagat caattcgcgc gcgaaggcga agcggcatgc 8820
ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa accctatgct actccgtcaa 8880
gccgtcaatt gtctgattcg ttaccaatta tgacaacttg acggctacat cattcacttt 8940
ttcttcacaa ccggcacgga actcgctcgg gctggccccg gtgcattttt taaatacccg 9000
cgagaaatag agttgatcgt caaaaccaac attgcgaccg acggtggcga taggcatccg 9060
ggtggtgctc aaaagcagct tcgcctggct gatacgttgg tcctcgcgcc agcttaagac 9120
gctaatccct aactgctggc ggaaaagatg tgacagacgc gacggcgaca agcaaacatg 9180
ctgtgcgacg ctggcgat 9198
<210> 4
<211> 57
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> N=A,T,C or G
<220>
<221> misc_feature
<223> n=a,t,c or g
<220>
<221> misc_feature
<222> (19)..(37)
<223> n is a, c, g, or t
<400> 4
taatacgact cactatagnn nnnnnnnnnn nnnnnnngtt ttagagctag aaatagc 57
<210> 5
<211> 25
<212> DNA
<213> 人工序列
<400> 5
aaaaaaagca ccgactcggt gccac 25
<210> 6
<211> 19
<212> DNA
<213> 人工序列
<400> 6
ccgcccattg ctatgcttc 19
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<400> 7
ccgtagatgg gcctcggaga 20
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<400> 8
ttgttctgta gactatctaa caa 23
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<400> 9
gaaactatac actaggtcca 20
<210> 10
<211> 19
<212> DNA
<213> 人工序列
<400> 10
ccggtctctt aaacagatc 19
<210> 11
<211> 21
<212> DNA
<213> 人工序列
<400> 11
gcaaagagct gttgtatgat g 21
<210> 12
<211> 34
<212> DNA
<213> 人工序列
<400> 12
ataacttcgt atagcataca ttatacgaac ggta 34
<210> 13
<211> 35
<212> DNA
<213> 人工序列
<400> 13
ccgctcgacg attgtaccgt tcgtataatg tatgc 35
<210> 14
<211> 47
<212> DNA
<213> 人工序列
<400> 14
gagcggcgct tgtaatggaa aggtaccgct atgcttcaca ttagaca 47
<210> 15
<211> 52
<212> DNA
<213> 人工序列
<400> 15
gttagaagac ttcctctgcc ctccctaggc ggtcgagaca gtgtggtgta ta 52
<210> 16
<211> 53
<212> DNA
<213> 人工序列
<400> 16
gcccgtatac accacactgt ctcgaccgcc tagggagggc agaggaagtc ttc 53
<210> 17
<211> 31
<212> DNA
<213> 人工序列
<400> 17
gcatgcctgc tattgtcttc ccaatcctcc c 31
<210> 18
<211> 47
<212> DNA
<213> 人工序列
<400> 18
ggattgggaa gacaatagca ggcatgctca cttgtagagc tcgtcca 47
<210> 19
<211> 48
<212> DNA
<213> 人工序列
<400> 19
cgtgagggcg gagcctctcg ggatatcgga agcggagcta ctaacttc 48
<210> 20
<211> 41
<212> DNA
<213> 人工序列
<400> 20
ccgttcgtat agcatacatt atacgaagtt atgtcgaccc g 41
<210> 21
<211> 48
<212> DNA
<213> 人工序列
<400> 21
gaagttagta gctccgcttc cgatatcccg agaggctccg ccctcacg 48
<210> 22
<211> 71
<212> DNA
<213> 人工序列
<400> 22
gggtcaacga cttcctgcac gggaccgtca cctccaatga ctagggtggc atgcacccaa 60
aacccagtgt c 71
<210> 23
<211> 22
<212> DNA
<213> 人工序列
<400> 23
cgttttgtcg ttgggttgct gc 22
<210> 24
<211> 22
<212> DNA
<213> 人工序列
<400> 24
gcagcaaccc aacgacaaaa cg 22
<210> 25
<211> 51
<212> DNA
<213> 人工序列
<400> 25
gttagaagac ttcctctgcc ctccctaggg gcctctatag gactcgctac c 51
<210> 26
<211> 53
<212> DNA
<213> 人工序列
<400> 26
tgaagttagt agctccgctt ccgctagctg ccgaaatggg ctctgctgca taa 53
<210> 27
<211> 47
<212> DNA
<213> 人工序列
<400> 27
ggattgggaa gacaatagca ggcatgctca cttgtagagc tcgtcca 47
<210> 28
<211> 46
<212> DNA
<213> 人工序列
<400> 28
agcgctgggt caacgacttc ctgcacggga ccgtcacctc caatga 46
<210> 29
<211> 55
<212> DNA
<213> 人工序列
<400> 29
ccccagttgg ggcgggcccc ttgtacatcc ccagctgcta ttgtcttccc aatcc 55
<210> 30
<211> 47
<212> DNA
<213> 人工序列
<400> 30
atgatggtcg agactcagcg gccgcggtgc cagggcgtgc ccttggg 47
<210> 31
<211> 48
<212> DNA
<213> 人工序列
<400> 31
cgtgcaggaa gtcgttgacc cagcgctgta acgccagggt tttcccag 48
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<400> 32
cggtatataa cggtaggcta c 21
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<400> 33
cctgcgttat cccctgattc 20
<210> 34
<211> 27
<212> DNA
<213> 人工序列
<400> 34
ggtacctttc cattacaagc gccgctc 27
<210> 35
<211> 21
<212> DNA
<213> 人工序列
<400> 35
gaagcatagc gtcgacataa c 21
<210> 36
<211> 21
<212> DNA
<213> 人工序列
<400> 36
atgtatgcta tacgaacggt a 21
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<400> 37
tgttgaacaa tttgccatcg t 21
<210> 38
<211> 22
<212> DNA
<213> 人工序列
<400> 38
gtcatcccct ggatgttcgt tt 22
<210> 39
<211> 22
<212> DNA
<213> 人工序列
<400> 39
cgctgaactt gtggccgttt ac 22
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<400> 40
aactggggta acctttgggc t 21
<210> 41
<211> 21
<212> DNA
<213> 人工序列
<400> 41
gctggcaact agaaggcaca g 21
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<400> 42
actcgagatc cactagagtg 20
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<400> 43
cccagataaa ctcaatgatg atg 23
<210> 44
<211> 23
<212> DNA
<213> 人工序列
<400> 44
gtcacctcca atgactaggg tgg 23
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<400> 45
gggtcaacga cttcctgcac ggg 23

Claims (16)

1.一种基因敲除的方法,其包括如下步骤:
(1)在靶基因的选定位置处制造双链缺口,所述选定位置优选地位于靶基因的内含子中;
(2)将可条件性翻转的核酸构建体连接入所述双链缺口中,
(3)翻转所述核酸构建体;
其中连接入所述双链接口的所述核酸构建体沿靶基因转录方向依次包含区段1和区段2,其中所述区段1的有义链(编码链)位于靶基因的有义链(编码链)上,且所述区段1的编码方向与靶基因的转录方向相同;所述区段2的有义链(编码链)位于靶基因的反义链(模板链)上,且所述区段2的编码方向与靶基因的转录方向相反;
所述区段1包含靶基因选定位置后的剩余编码序列C1,用于与选定位置前的靶基因编码序列组成完整的靶基因编码序列,以维持靶基因的正常表达;
所述区段2包含表达终止信号,用于在所述核酸构建体翻转后降低或者终止靶基因的转录和/或翻译。
2.一种基因敲除的方法,其包含如下步骤:
(1)在靶基因的选定位置处制造双链缺口,其中所述选定位置优选地位于靶基因的内含子中;
(2)将可条件性翻转的核酸构建体连接入所述双链缺口中;
其中连接入所述双链接口的所述核酸构建体沿靶基因转录方向依次包含区段2和区段1,其中所述区段2的有义链(编码链)位于靶基因的有义链(编码链)上,且所述区段2的编码方向与靶基因的转录方向相同;所述区段1的有义链(编码链)位于靶基因的反义链(模板链)上,且所述区段1的编码方向与靶基因的转录方向相反;
所述区段1包含靶基因选定位置后的剩余编码序列C1,用于与选定位置前的靶基因编码序列组成完整的靶基因编码序列,从而在所述核酸构建体翻转后维持靶基因的正常表达;
所述区段2包含表达终止信号,用于降低或者终止靶基因的转录和/或翻译。
3.一种基因拯救的方法,其包括如下步骤:
(1)在靶基因的选定位置处制造双链缺口,其中所述选定位置优选地位于靶基因的内含子中;
(2)将可条件性翻转的核酸构建体连接入所述双链缺口中;
(3)翻转所述核酸构建体;
其中连接入所述双链接口的所述核酸构建体沿靶基因转录方向依次包含区段2和区段1,其中所述区段2的有义链(编码链)位于靶基因的有义链(编码链)上,且所述区段2的编码方向与靶基因的编码方向相同;所述区段1的有义链(编码链)位于靶基因的反义链(模板链)上,且所述区段1的编码方向与靶基因的转录方向相反;
所述区段1包含靶基因选定位置后的剩余编码序列C1,用于与选定位置前的靶基因编码序列组成完整的靶基因编码序列,用于在所述核酸构建体翻转后维持靶基因的正常表达;
所述区段2包含表达终止信号,用于降低或者终止靶基因的转录或/翻译。
4.根据权利要求1-3中任一项所述的方法,其中区段1(沿其编码方向)依次包含位点特异性重组酶的识别位点S1、所述选定位置之后的第一个剪接位点以及选定位置之后所述待修饰基因的剩余编码序列C1和转录终止序列T1,所述转录终止序列T1包含1-50个,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个串联的转录终止信号(TTS),和/或翻译终止信号;或者
所述区段2(沿其编码方向)依次包含位点特异性重组酶的识别位点S2、所述选定位置之后的第一个剪接位点、转录终止序列T2,所述转录终止序列T2包含1-50个,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个串联的转录终止信号(TTS);例如,所述转录终止信号可以是SV40 polyA和/或BGH polyA等;
其中所述特异性重组酶的识别位点S1和S2用于在识别所述识别位点S1和S2的位点特异性重组酶的作用下,翻转所述核酸构建体。
5.根据权利要求4所述的方法,其中步骤(3)的翻转所述核酸构建体是通过将能够识别所述识别位点S1和/或S2的位点特异性重组酶与连接入所述双链缺口的所述核酸构建体接触而实现的。
6.根据权利要求1-5中任一项所述的方法,其中步骤(1)中所述选定位置是ZFN、TALEN或CRISPR/Cas系统的识别位点,具体的,步骤(1)包括下列步骤:将包含待修饰基因的基因组与ZFN、TALEN或Cas以及辅助核酸序列接触,优选的,所述选定位置是CRISPR/Cas(例如CRISPR/Cas9或Cas9/gRNA)的识别位点,所述辅助核酸序列为单链向导RNA(sgRNA),或者crRNA(CRISPR-derived RNA)与tracrRNA(trans-activating RNA)形成的tracrRNA/crRNA核酸复合物。
7.根据权利要求1-6中任一项所述的方法,其中所述区段2中,所述剪接位点后还包含所述选定位置之后的靶基因的部分编码C2,所述部分编码序列C2连同所述选定位置前的部分靶基因编码序列编码得到突变型蛋白,所述突变型蛋白与所述靶基因编码的野生型蛋白相比功能降低或者丧失。
8.根据权利要求1-7中任一项所述的方法,其中所述区段2中,所述部分编码序列C2后还包含报告基因R2,优选地,所述报告基因R2编码荧光蛋白或荧光素酶及其衍生物,例如荧光素酶、绿色荧光蛋白、tdTomato、DsRed、tdGFP、mCherry、mStrawberry、mRFP、dsRed、EYFP、EBFP、ECFP、mCerulean、mScarlet、mEmerald、mCitrine、mVenus、YPet、mKO、mKate、mPlum、mTFP1、Dendra2或Kaede、Kakumi、Zebrabow等;还优选地,所述剩余编码序列C2和报告基因R2之间通过接头连接或者直接融合表达;进一步优选地,所述接头是2A肽段,例如T2A肽段、P2A肽段、E2A肽段、F2A肽段、BmCPV2A肽段或BmIFV2A肽段,或者IRES序列。
9.根据权利要求1-8中任一项所述的方法,其中步骤(2)包括:
1)提供包含区段1和区段2的载体,所述载体例如质粒载体或微环载体(mini circlevector),优选地,所述质粒载体或微环载体中还包含用于线性化的切割位点;
2)获得步骤1)所述载体的线性化形式;所述线性化为体内线性化或者体外线性化;优选地,所述线性化为体内线性化,更优选地,所述体内线性化包括:将步骤1)的载体在细胞内与能够识别所述线性化的切割位点的酶和/或辅助核酸序列接触;
3)通过非同源末端连接(NHEJ)将步骤2)得到的线性化形式的载体连接入所述双链缺口中;
优选地,所述用于线性化的切割位点是ZFN、TALEN或CRISPR/Cas的识别位点,并且所述识别位点的序列不存在于所述细胞的基因组中,更优选地,所述能够识别所述用于线性化的切割位点的酶选自ZFN、TALEN和Cas(例如Cas9),进一步优选地,所述线性化的切割位点是CRISPR/Cas9的识别位点,更进一步优选地,所述CRISPR/Cas9的识别位点是hEMX1位点,所述hEMX1位点的序列例如为GTCACCTCCAATGACTAGGGTGG(SEQ ID NO:44);或者lamGolden位点,所述lamGolden位点的序列例如为GGGTCAACGACTTCCTGCACGGG(SEQ ID NO:45);
还优选地,所述用于线性化的切割位点例如位于区段1和区段2外侧,具体地,
当载体从5’-3’依次包含区段1和区段2,其中区段1的有义链位于载体的有义链上,区段2的有义链序列位于载体的反义链上,并且转录方向与区段1相反时,线性化的切割位点位于区段1的5’上游或者区段2的3’下游;或者
当载体从5’-3’依次包含区段2和区段1,其中区段2的有义链序列位于载体的有义链上,区段1的有义链位于载体的反义链上,并且转录方向与区段1相反时,线性化的切割位点位于区段2的5’上游或者区段1的3’下游;
或者所述线性化的切割位点位于区段1和区段2之间,并且区段1和区段2优选地位于质粒载体中时,优选地,在所述区段1和区段2沿各自编码方向的最末端位置设置一组位点特异性重组酶的识别位点,所述一组位点特异性重组酶识别位点用于在选定位置插入核酸构建体后,去除区段1和区段2之间的载体序列;所述位点特异性重组酶识别位点例如attB和attP位点,两个rox位点或者两个FRT位点等;进一步优选地,当核酸构建体连接入所述选定位置后,还包括将所述核酸构建体与phiC31、Dre或Flp的蛋白质或者mRNA相接触的步骤。
10.根据权利要求9所述的方法,其中所述区段1中的剩余编码序列C1包含一个或多个核苷酸位点的替换、插入和/或缺失,从而使由所述剩余编码序列C1恢复表达的靶基因的功能与野生型靶基因的功能相同或者不同。
11.根据权利要求1-10中任一项所述的方法,其中所述区段1中的剩余编码序列C1还与报告基因R1相连接,优选地,所述报告基因R1选自荧光素酶、荧光蛋白或其衍生物,所述荧光蛋白例如绿色荧光蛋白、tdTomato、DsRed、tdGFP、mCherry、mStrawberry、mRFP、dsRed、EYFP、EBFP、ECFP、mCerulean、mScarlet、mEmerald、mCitrine、mVenus、YPet、mKO、mKate、mPlum、mTFP1、Dendra2或Kaede、Kakumi、Zebrabow等;还优选地,所述剩余编码序列C1和报告基因R1之间通过接头连接或者直接连接;更优选地,所述接头是是2A肽段,例如T2A肽段、P2A肽段、E2A肽段、F2A肽段、BmCPV2A肽段、BmIFV2A肽段,或者IRES序列。
12.根据权利要求1至11中任一项所述的方法,其中所述位点特异性重组酶的识别位点S1和位点特异性重组酶的识别位点S2的序列不同并且匹配使用,例如所述位点特异性重组酶的识别位点S1和识别位点S2分别包含lox序列,优选地,所述识别位点S1和识别位点S2包含方向相反(对置)的lox序列;更优选地,所述lox序列是野生型loxP位点的变体序列,使得识别位点S1和S2的lox序列被所述位点特异性重组酶识别切割并介导区段1和区段2的翻转后,所产生的两个新lox序列中的至少一个难以被所述位点特异性重组酶再次识别和/或所述两个新的lox序列在所述位点特异性重组酶作用下实现重组的效率降低或者丧失,从而使得经过一次翻转后的区段1和区段2不能被再次翻转;例如所述识别位点S1和S2分别选自lox66和lox71、lox43和lox44或者lox75和lox76;或者
所述位点特异性重组酶的识别位点S1和S2分别包含选自attB和attP的序列,且所述attB与attP的方向相反从而介导二者之间的序列翻转;
优选地,所述位点特异性重组酶为Cre重组酶、Flp重组酶或phiC31重组酶等。
13.一种用于权利要求1-12任一项所述方法的重组载体,所述重组载体例如质粒载体或者微环载体,其包含如权利要求1-12中任一项中所定义的区段1、区段2以及线性化位点,优选地,所述线性化位点位于区段1和区段2的外侧或者位于区段1和区段2之间。
14.根据权利要求13所述的重组载体,其序列如SEQ ID NO:1-3所示。
15.一种包含权利要求权利要求13或14所述重组载体的细胞、组织或器官,所述细胞优选是细菌细胞、真菌细胞、动物细胞或植物细胞,其中更优选为动物细胞,最优选为哺乳动物细胞或鱼类细胞,例如大鼠、小鼠或斑马鱼细胞;所述组织和/或器官优选为皮肤、角膜、肌腱、骨、血液、血管、神经、心脏瓣膜、软骨组织、神经嵴、朗格罕氏岛和肌肉组织;所述器官优选选自:肾脏、肝脏、心脏、小肠、胃、大肠、脾、骨髓、胸腺、淋巴结、肺和胰腺。
16.一种基因组敲除和/或拯救试剂盒,其包含权利要求13或14所述的重组载体或者权利要求15所述的细胞、组织或器官。
CN201911151416.2A 2019-11-21 2019-11-21 一种条件性基因敲除或者拯救方法 Active CN112824529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911151416.2A CN112824529B (zh) 2019-11-21 2019-11-21 一种条件性基因敲除或者拯救方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911151416.2A CN112824529B (zh) 2019-11-21 2019-11-21 一种条件性基因敲除或者拯救方法

Publications (2)

Publication Number Publication Date
CN112824529A true CN112824529A (zh) 2021-05-21
CN112824529B CN112824529B (zh) 2022-09-09

Family

ID=75907850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911151416.2A Active CN112824529B (zh) 2019-11-21 2019-11-21 一种条件性基因敲除或者拯救方法

Country Status (1)

Country Link
CN (1) CN112824529B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114921480A (zh) * 2022-06-09 2022-08-19 国科宁波生命与健康产业研究院 一种骨细胞Terc基因敲除小鼠模型的构建方法
CN115458063A (zh) * 2022-09-22 2022-12-09 云舟生物科技(广州)股份有限公司 载体推荐方法、系统、计算机存储介质及电子设备
CN117587013A (zh) * 2023-11-27 2024-02-23 湖南师范大学 一种血管发育异常的斑马鱼模型的构建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999050426A1 (en) * 1998-03-27 1999-10-07 Lexicon Genetics Incorporated Vectors for gene mutagenesis and gene discovery
WO2001029208A1 (en) * 1999-10-16 2001-04-26 Artemis Pharmaceuticals Gmbh Conditional gene trapping construct for the disruption of genes
CN107739739A (zh) * 2017-01-17 2018-02-27 中国科学院广州生物医药与健康研究院 使用表达Cre依赖的Cas9基因的哺乳动物进行基因修饰和疾病建模的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999050426A1 (en) * 1998-03-27 1999-10-07 Lexicon Genetics Incorporated Vectors for gene mutagenesis and gene discovery
WO2001029208A1 (en) * 1999-10-16 2001-04-26 Artemis Pharmaceuticals Gmbh Conditional gene trapping construct for the disruption of genes
CN107739739A (zh) * 2017-01-17 2018-02-27 中国科学院广州生物医药与健康研究院 使用表达Cre依赖的Cas9基因的哺乳动物进行基因修饰和疾病建模的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WENYUAN LI 等: "One-step efficient generation of dual-function conditional knockout and geno-tagging alleles in zebrafish", 《ELIFE》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114921480A (zh) * 2022-06-09 2022-08-19 国科宁波生命与健康产业研究院 一种骨细胞Terc基因敲除小鼠模型的构建方法
CN115458063A (zh) * 2022-09-22 2022-12-09 云舟生物科技(广州)股份有限公司 载体推荐方法、系统、计算机存储介质及电子设备
CN115458063B (zh) * 2022-09-22 2023-06-16 云舟生物科技(广州)股份有限公司 载体推荐方法、系统、计算机存储介质及电子设备
CN117587013A (zh) * 2023-11-27 2024-02-23 湖南师范大学 一种血管发育异常的斑马鱼模型的构建方法

Also Published As

Publication number Publication date
CN112824529B (zh) 2022-09-09

Similar Documents

Publication Publication Date Title
CN112824529B (zh) 一种条件性基因敲除或者拯救方法
CN107614012A (zh) 使用工程化的细胞检测、监测或治疗疾病或病况的系统及制备和使用它们的方法
US11939594B2 (en) Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
AU2016293527A1 (en) Microorganisms having increased lipid productivity
CN116083398B (zh) 分离的Cas13蛋白及其应用
CN112912112A (zh) 肝特异性核酸调节元件以及其方法及用途
CN114525304B (zh) 一种基因编辑的方法
CN108992665B (zh) 基于重组减毒单增李斯特菌的宫颈癌治疗性疫苗
KR20210100585A (ko) 형질전환 생물체 선별용 마커 조성물, 형질전환 생물체 및 형질전환 방법
CN109010819B (zh) 重组减毒李斯特菌在制备宫颈癌治疗性疫苗中的应用
CN114958762B (zh) 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用
US20030186291A1 (en) Genetically engineered phiC31-integrase genes
CN114990157B (zh) 用于构建lmna基因突变的扩张型心肌病模型猪核移植供体细胞的基因编辑系统及其应用
Zhou et al. Current landscape of gene‐editing technology in biomedicine: Applications, advantages, challenges, and perspectives
CN114958760B (zh) 一种构建阿尔兹海默症模型猪的基因编辑技术及其应用
CN114480470A (zh) 高通量制备模式生物基因编辑突变体的方法及相关质粒
KR20240032025A (ko) 내이의 세포 유형-특이적 유전자 발현을 위한 조성물 및 방법
CN114807202A (zh) 噬菌体辅助的纤维寡糖转运蛋白连续定向进化系统和方法
CN112522261A (zh) 用于制备lmna基因突变的扩张型心肌病克隆猪核供体细胞的crispr系统及其应用
CN112680453B (zh) Crispr系统及其在构建stxbp1突变的癫痫性脑病克隆猪核供体细胞中的应用
CN105002198B (zh) 用于培育表达人血清白蛋白的转基因猪的成套产品及其应用
CN112522256B (zh) CRISPR/Cas9系统及其在构建抗肌萎缩蛋白基因缺陷的猪源重组细胞中的应用
CN114958758B (zh) 一种乳腺癌模型猪的构建方法及应用
CN112522255B (zh) CRISPR/Cas9系统及其在构建胰岛素受体底物基因缺陷的猪源重组细胞中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant