CN109321599B - 人多能干细胞中的谱系示踪系统的构建与应用 - Google Patents

人多能干细胞中的谱系示踪系统的构建与应用 Download PDF

Info

Publication number
CN109321599B
CN109321599B CN201811132450.0A CN201811132450A CN109321599B CN 109321599 B CN109321599 B CN 109321599B CN 201811132450 A CN201811132450 A CN 201811132450A CN 109321599 B CN109321599 B CN 109321599B
Authority
CN
China
Prior art keywords
fragment
cre
gfp
aavs1
pax6
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811132450.0A
Other languages
English (en)
Other versions
CN109321599A (zh
Inventor
章小清
刘玲
陈祯钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201811132450.0A priority Critical patent/CN109321599B/zh
Publication of CN109321599A publication Critical patent/CN109321599A/zh
Application granted granted Critical
Publication of CN109321599B publication Critical patent/CN109321599B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及生物技术领域,特别是涉及人多能干细胞中的谱系示踪系统的构建与应用。本发明提供一种谱系示踪方法,包括:通过谱系示踪系统进行谱系示踪,所述谱系示踪系统的构建方法包括:将人多能干细胞的重组酶驱动基因中整合重组酶基因片段;将染色体开放位点AAVS整合报告基因系统,所述报告基因系统包括转录终止调控元件片段和报告基因片段,所述转录终止调控元件片段与所述重组酶相对应。本发明在人细胞中构建出谱系示踪系统,利用报告基因标记目的基因蛋白表达后的所有子代细胞,从而对这些细胞以及其子代细胞的分化、增殖、空间定位等进行示踪的技术。

Description

人多能干细胞中的谱系示踪系统的构建与应用
技术领域
本发明涉及生物技术领域,特别是涉及人多能干细胞中的谱系示踪系统的构建与应用。
背景技术
谱系示踪(Lineage-Tracing,LT),是利用特定方法标记某个或某一类特定细胞,从而对这些细胞以及其子代细胞的分化、增殖、空间定位等进行示踪的技术。随着基因编辑技术的兴起与转基因小鼠技术的推广普及,谱系示踪技术已成为研究鼠的胚胎发育、肿瘤、细胞移植等领域的重要技术手段,受到了普遍的关注。但是由于人细胞尤其是人胚胎干细胞操作的复杂性,对于人细胞中构建谱系示踪系统是非常困难的。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种谱系示踪方法,用于解决现有技术中的问题。
为实现上述目的及其他相关目的,本发明提供一种谱系示踪方法,包括:通过谱系示踪系统进行谱系示踪,所述谱系示踪系统的构建方法包括:
将人多能干细胞的重组酶驱动基因中整合重组酶基因片段;
将染色体开放位点AAVS整合报告基因系统,所述报告基因系统包括转录终止调控元件片段和报告基因片段,所述转录终止调控元件片段与所述重组酶相对应。
在本发明一些实施方式中,所述重组酶驱动基因选自PAX6或FOXA2。
在本发明一些实施方式中,所述重组酶基因片段包括重组酶片段。
在本发明一些实施方式中,所述重组酶选自Cre、Flp。
在本发明一些实施方式中,所述重组酶基因片段还包括2A片段。
在本发明一些实施方式中,所述重组酶基因片段还包括诱导片段,所述诱导片段优选选自ERT2片段。
在本发明一些实施方式中,染色体开放位点AAVS整合报告基因系统的位点为第24285到24303碱基区域。
在本发明一些实施方式中,所述转录终止调控元件片段选自LSL片段、FSF片段。
在本发明一些实施方式中,所述LSL片段中,STOP序列如SEQ ID NO.2所示。
在本发明一些实施方式中,所述LSL片段中,所述LoxP序列选自SEQ ID NO.1所示的序列,或者与SEQ ID NO.1所示的序列具有80%以上同源性、且具有SEQ ID NO.1所限定的序列的功能的序列。
在本发明一些实施方式中,所述FSF片段中,STOP序列如SEQ ID NO.2所示。
在本发明一些实施方式中,所述FSF片段中,FRT序列如SEQ ID NO.20所示。
在本发明一些实施方式中,所述报告基因片段选自GFP片段、红色荧光蛋白tdTomato片段、萤火虫荧光素酶片段、半乳糖苷酶片段中的一种或多种的组合。
在本发明一些实施方式中,所述报告基因系统还包括启动子,所述启动子选自CAG启动子、CMV启动子,UBC启动子、ef1α启动子。
在本发明一些实施方式中,报告基因系统还可以包括抗性基因,所述抗性基因选自是嘌呤霉素、杀稻瘟菌素、新霉素、博莱霉素中的一种或多种的组合。
附图说明
图1显示为本发明AAVS1-LSL-GFP细胞系构建示意图。F1、F2、R1、R2为PCR鉴定引物;BsaI、EcoRI为限制性内切酶酶切位点,用于SB鉴定;5‘Probe、GFP Probe为SB鉴定的探针结合的区域。
图2显示为本发明AAVS1-LSL-GFP细胞系基因组PCR鉴定结果。上:用F1/R1引物PCR得到1270bp的WT片段;下:用F2/R2引物PCR得到1492bp的HR片段。从左到右分别为Marker(M)、WT细胞、Hetero细胞和Homo细胞。
图3显示为本发明AAVS1-LSL-GFP细胞系的SB鉴定结果。A:使用5’Probe探针,用于区分WT与HR的基因组,;B:使用GFP Probe探针。从左到右分别为WT、Hetero和Homo细胞。
图4显示为本发明不感染/感染pLneti-Cre病毒后,明视野(bright field,BF)与绿色荧光通道下的AAVS1-LSL-GFP细胞。左:没有感染pLneti-Cre病毒的AAVS1-LSL-GFP细胞;右:感染pLneti-Cre病毒的AAVS1-LSL-GFP细胞;上:BF;下:绿色荧光通道。比例尺:100μm。
图5显示为本发明PAX6-2A-Cre和FOXA2-2A-Cre细胞系构建示意图。F、R和Cre-R为PCR鉴定引物;Stop Codon代表终止密码子所在区域。
图6显示为本发明构建PAX6-2A-Cre(上)和FOXA2-2A-Cre(下)细胞系所用到的sgRNA序列与效率检测的测序峰图。下划线为sgRNA识别的DNA序列;红字代表终止密码子所在的区域;蓝色阴影代表sgRNA识别区域对应的的测序峰图;套峰现象出现在sgRNA切割位点之后。
图7显示为本发明H9细胞电转PAX6-2A-Cre和FOXA2-2A-Cre质粒后的单克隆基因组PCR鉴定结果。A:上为用PAX6-F与PAX6-R引物PCR得到的1107bp的WT片段,下为PAX6-F与Cre-R引物PCR得到的2046bp的HR片段;B:上为用FOXA2-F与FOXA2-R引物PCR得到的1162bp的WT片段,下为FOXA2-F与Cre-R引物PCR得到的1706bp的HR片段。
图8显示为本发明PAX6-2A-Cre细胞系用EB法分化,不同时期的PAX6、Cre与NKX2.1表达水平的RT-PCR结果。从左到右分别为PAX6、Cre、NKX2.1。不同分化时期的细胞类型标注在右上角。表达水平用与内参相比的结果展示。
图9显示为本发明PAX6-2A-Cre细胞系在EB法分化不同时期的免疫荧光染色结果。从左到右分别为PAX6、Cre、细胞核与合并。从上到下为Day0ES阶段、Day10NE阶段、Day17Dorsal NP和Day17Ventral NP。比例尺:100μm。
图10显示为本发明PAX6-2A-Cre细胞系在EB法分化不同时期的WB结果。从左到右分别为Day0ES阶段、Day6早期NE、Day10NE阶段、Day17Dorsal NP与Day17Ventral NP、Day25晚期Dorsal NP与Day25晚期Ventral NP。从上到下为anti-PAX6抗体、anti-Cre抗体、内参anti-β-Actin。
图11显示为本发明FOXA2-2A-Cre细胞系在AD法分化不同时期PAX6、Cre与FOXA2mRNA水平的RT-PCR结果。从左到右分别为PAX6、Cre、FOXA2。不同分化时期的细胞类型标注在右上角。表达水平用与内参相比的结果展示
图12显示为本发明FOXA2-2A-Cre细胞系在AD法分化的不同时期免疫荧光染色结果。从左到右分别是FOXA2、Cre、细胞核以及合并。从上到下为Day6NP与FP,Day12NP与FP。比例尺:100μm。
图13显示为本发明FOXA2-2A-Cre细胞系在AD法分化不同时期的WB结果。从左到右分别为Day0ES阶段、Day6、Day12、Day20的Dorsal NP与FP。从上到下为anti-FOXA2抗体、anti-Cre抗体、内参anti-β-Actin。其中FOXA2-2-Cre未完全切割的融合蛋白处于100KDMarker的下方约90KD的位置。
图14显示为本发明PAX6-2A-Cre细胞系电转AAVS1-LSL-GFP质粒后的单克隆基因组PCR鉴定结果。用AAVS1-F1/R1引物PCR得到1270bp的WT片段,用AAVS1-F2/R2引物PCR得到1492bp的HR片段。#1、#3、#4、#6、#8为Homo,#2、#5、#7为Hetero。
图15显示为本发明PAX6-2A-Cre/AAVS1-LSL-GFP的#4克隆SB鉴定结果,所用的探针为GFP Probe。
图16显示为本发明PAX6-2A-Cre/AAVS1-LSL-GFP细胞系EB法分化Day10的NE染色结果。上:从左到右分别是GFP、PAX6、细胞核以及合并。下:从左到右分别是GFP、Cre、细胞核以及合并的结果。比例尺:100μm。
图17显示为本发明PAX6-2A-Cre/AAVS1-LSL-GFP细胞系EB法分化Day17的NE染色结果。上均为Dorsal NP,下均为Ventral NP。A:从左到右分别是GFP、PAX6、细胞核以及合并;B:从左到右分别是GFP、Cre、细胞核以及合并的结果;C:从左到右分别是GFP、NKX2.1、细胞核以及合并的结果。比例尺:100μm。
图18显示为本发明在H7细胞系中构建PAX6-2A-Cre/AAVS1-LSL-GFP细胞系的基因组PCR结果。A:上为用PAX6-F与PAX6-R引物PCR得到的1107bp的WT片段,下为PAX6-F与Cre-R引物PCR得到的2046bp的HR片段,#4克隆是成功整合的Hetero;B:上为AAVS1-F1/R1引物PCR得到1270bp的WT片段,下为AAVS1-F2/R2引物PCR得到1492bp的HR片段。
图19显示为本发明H7的PAX6-2A-Cre/AAVS1-LSL-GFP细胞系分化Day17的免疫荧光染色结果。上:Dorsal NP,下:Ventral NP;染色结果从左到右分别为GFP、PAX6、Cre和NKX2.1。比例尺:100μm。
图20显示为本发明PAX6-2A-Cre/AAVS1-LSL-GFP细胞形成的畸胎瘤HE染色与GFP免疫荧光染色结果。从上到下的切片分别含有外胚层的神经管(NT)、中胚层的软骨(CT)和内胚层的肠道(IN);左边是HE染色结果,中间的GFP和右边的细胞核是HE染色的相邻切片。比例尺:200μm。
图21显示为本发明PAX6-2A-Cre/AAVS1-LSL-GFP细胞形成的畸胎瘤中NT的HE染色与免疫荧光染色结果。上为GFP、PAX6、细胞核、合并以及HE染色结果;下为GFP、NKX2.1、细胞核、荧光染色合并以及HE染色结果。比例尺:100μm。
图22显示为本发明PAX6-2A-Cre/AAVS1-LSL-GFP细胞系对PAX6的谱系示踪示意图。PAX6-2A-Cre/AAVS1-LSL-GFP细胞系在Day10NE表达PAX6,出现绿色荧光,随后形成Day17PAX6+的Dorsal NP与NKX2.1+的Ventral NP。
图23显示为本发明FOXA2-2A-Cre细胞系电转AAVS1-LSL-GFP质粒后的单克隆基因组PCR鉴定结果。用AAVS1-F1/R1引物PCR得到1270bp的WT片段,用AAVS1-F2/R2引物PCR得到1492bp的HR片段。#1、#2、#3、#8为Homo,#4、#5、#6、#7为Hetero。
图24显示为本发明FOXA2-2A-Cre/AAVS1-LSL-GFP#3克隆的SB鉴定,所用的探针为GFP Probe。
图25显示为本发明FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系在Day0ES与Day2FP的免疫荧光染色结果。A:从左到右分别为GFP、OCT4、细胞核与合并;B:从左到右分别为GFP、Cre、细胞核与合并的结果;C:从左到右分别为GFP、FOXA2、细胞核与合并的结果。上:Day0ES;下:Day2早期FP。比例尺:100μm。
图26显示为本发明在H7细胞中构建FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系的基因组PCR结果。A:上为用FOXA2-F与FOXA2-R引物PCR得到的1162bp的WT片段,下为FOXA2-F与Cre-R引物PCR得到的1706bp的HR片段;B:上为AAVS1-F1/R1引物PCR得到1270bp的WT片段,下为AAVS1-F2/R2引物PCR得到1492bp的HR片段。
图27显示为本发明在H7细胞中构建的FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系于Day2FP早期的免疫荧光染色结果。从左到右的别是GFP、OCT4、GFP与OCT4合并、Cre、FOXA2。比例尺:100μm。
图28显示为本发明FOXA2谱系示踪细胞系在ES阶段连续传代的GFP泄漏表达。A:H9的FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系从P26到P43连续传代的BF(上)与绿色荧光(下)图片;B:H7的FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系从P37到P44连续传代的BF(上)与绿色荧光(下)图片;C:H9的FOXA2-2A-Flp/AAVS1-FSF-GFP细胞系建系后传代10次的BF(左)与绿色荧光(右)图片。比例尺:100μm。
图29显示为本发明293FT细胞分别转染100ng的AAVS1-LSL-GFP、AAVS1-LSLm1-GFP、AAVS1-LSLm2-GFP、AAVS1-LSLm3-GFP和AAVS1-LSLm4-GFP质粒与pLenti-Cre质粒,60h后统计视野中GFP阳性细胞个数。n=3,***:p<0.005,**:p<0.05,ns:no significant。
图30显示为本发明FOXA2-2A-Cre细胞系分别电转AAVS1-LSLm1-GFP和AAVS1-LSLm2-GFP质粒后的AAVS1位点基因组PCR鉴定结果。从左到右为电转AAVS1-LSLm1-GFP和AAVS1-LSLm2-GFP的细胞。上为AAVS1-F1/R1引物PCR得到1270bp的WT片段,下为AAVS1-F2/R2引物PCR得到1492bp的HR片段
图31显示为本发明FOXA2-2A-Cre/AAVS1-LSLm2-GFP细胞系建系后与传代15次后在显微镜下的图片。上:BF;下:绿色荧光通道;左:建系后P35的细胞;右:建系后P49的细胞。比例尺:100μm。
图32显示为本发明FOXA2-2A-Cre/AAVS1-LSLm2-GFP细胞系FP分化不同时间点的免疫荧光染色结果。从左到右为GFP、PAX6/FOXA2/Cre(从上到下)、细胞核以及合并。A、B、C、D分别为FP的Day5、Day8、Day 10、Day 12。比例尺:100μm。
图33显示为本发明FOXA2-2A-Cre/AAVS1-LSLm1-GFP细胞系FP分化Day12的免疫荧光染色结果。从左到右为GFP、Cre/FOXA2/PAX6(从上到下)、细胞核以及合并。比例尺:100μm。
图34显示为本发明H7的FOXA2-2A-Cre/AAVS1-LSLm2-GFP细胞系在ES阶段显微镜下观察图与FP分化免疫荧光染色结果图。A:建系后(左)与传代8次后(右)的细胞BF(上)与GFP(下)的图片;B:从上到下为FP的Day5、Day8、Day10、Day12免疫荧光结果,从左到右分别为GFP、FOXA2和Cre。比例尺:100μm。
图35显示为本发明构建FOXA2-CreERT2细胞系示意图。F1’、F2、R1’和Cre-R’为PCR鉴定引物;ATG代表起始密码子。
图36显示为本发明构建FOXA2-CreERT2细胞系所用到的sgRNA测序结果图。下划线为sgRNA识别的DNA序列;红字代表起始密码子ATG所在的区域;蓝色阴影代表sgRNA识别区域的测序峰图;套峰出现在sgRNA切割位点之后。
图37显示为本发明电转FOXA2-CreERT2质粒的H9细胞基因组PCR鉴定结果。上:FOXA2-F2与FOXA2-R1’引物PCR得到的886bp的WT片段;下:FOXA2-F1’与Cre-R’引物PCR得到的1291bp的HR片段。
图38显示为本发明FOXA2-CreERT2细胞系电转AAVS1-LSL-GFP质粒后的单克隆PCR鉴定结果。用AAVS1-F1/R1引物PCR得到1270bp的WT片段,用AAVS1-F2/R2引物PCR得到1492bp的HR片段。#1、#2、#4、#5、#8为Homo,#3、#6、#7为Hetero。
图39显示为本发明FOXA2-CreERT2/AAVS1-LSL-GFP的#4克隆SB鉴定结果,所用的探针为GFP Probe。
图40显示为本发明FOXA2-CreERT2/AAVS1-LSL-GFP细胞系在分化Day6和Day12的免疫荧光染色结果。A:Day6染色;B:Day12染色;从左到右分别为GFP、FOXA2、Cre和PAX6的染色;从上到下为Dorsal NP加4-OHT、FP不加4-OHT与FP加4-OHT。比例尺:100μm。
图41显示为本发明构建FOXA2-2A-FlpERT2细胞系示意图。F、R和Flp-R为PCR鉴定引物;Stop Codon代表终止密码子所在区域。
图42显示为本发明构建FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞系的PCR结果图。A:上为用FOXA2-F与FOXA2-R引物PCR得到的1549bp的WT片段,下为FOXA2-F与Flp-R引物PCR得到的2162bp的HR片段;B:上为用AAVS1-F1/R1引物PCR得到1270bp的WT片段,下为用AAVS1-F2/R2引物PCR得到1492bp的HR片段。
图43显示为本发明FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞系在分化Day6和Day12的免疫荧光染色结果。A:Day6的染色结果;B:Day12的染色结果。从左到右的染色分别为GFP、FOXA2和PAX6;从上到下为Dorsal NP加4-OHT、FP不加4-OHT和FP加4-OHT。比例尺:100μm。
图44显示为本发明FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞系形成的畸胎瘤免疫荧光染色结果。从左到右为GFP、FOXA2、细胞核和重叠结果。比例尺:100μm。
图45显示为本发明构建PAX6-CreERT2细胞系的示意图。F1’、R1’和Cre-R’为PCR鉴定引物;ATG代表PAX6的起始密码子。
图46显示为本发明构建PAX6-CreERT2细胞系所用到的sgRNA测序结果图。下划线为sgRNA识别的DNA序列;红字代表转录起始位点ATG所在的区域;蓝色阴影代表sgRNA识别区域的测序峰图;套峰出现在sgRNA切割位点之后。
图47显示为本发明电转PAX6-CreERT2质粒的H9细胞基因组PCR鉴定结果。上:PAX6-F1’与PAX6-R1’引物PCR得到的1115bp的WT片段;下:PAX6-F1’与Cre-R’引物PCR得到的1138bp的HR片段。
图48显示为本发明PAX6-CreERT2细胞系电转AAVS1-LSL-GFP质粒后的单克隆PCR鉴定结果。用AAVS1-F1/R1引物PCR得到1270bp的WT片段,用AAVS1-F2/R2引物PCR得到1492bp的HR片段。#2、#3、#5、#6、#7、#8为Homo,#1、#4为Hetero。
图49显示为本发明PAX6-CreERT2/AAVS1-LSL-GFP#4克隆的SB鉴定,所用的探针为GFP Probe。
图50显示为本发明Day8-10加入4-OHT的PAX6-CreERT2/AAVS1-LSL-GFP细胞系Day17免疫荧光的染色结果。上:Day17的Dorsal NP;下:Day17的Ventral NP;从左到右分别为GFP、PAX6、Cre和NKX2.1染色结果。比例尺:100μm。
图51显示为本发明PAX6-CreERT2/AAVS1-LSL-GFP细胞系的Day17NP免疫荧光染色结果。从上到下分别为:不加4-OHT的Dorsal NP、加4-OHT的Dorsal NP和加4-OHT的VentralNP;从左到右分别为GFP、PAX6、Cre和NKX2.1染色。比例尺:100μm。
图52显示为本发明PAX6-CreERT2/AAVS1-LSL-GFP细胞系谱系示踪示意图。A:在Day8加入4-OHT则示踪Day10NE,Day17的Dorsal NP和Ventral NP均表达GFP;B:Day17NP,仅有在Day15加入4-OHT的Dorsal NP有GFP表达,没有4-OHT的Dorsal NP与加入4-OHT的Ventral NP则没有GFP表达。
具体实施方式
本发明发明人经过大量研究发现,在人多能干细胞(hPSCs)特异的染色体开放位点AAVS1整合重组酶控制的转录终止调控元件片段,同时引入报告基因,构成可控制的报告基因系统;在谱系特异性表达的调控开关方面,选取目的基因驱动重组酶表达的基因,从而提供了一种人多能干细胞中的谱系示踪系统和方法。
本发明第一方面提供一种谱系示踪系统的构建方法,包括:
将人多能干细胞(hPSCs)的重组酶驱动基因中整合重组酶基因片段;
将染色体开放位点AAVS整合报告基因系统,所述报告基因系统包括转录终止调控元件片段和报告基因片段,所述转录终止调控元件片段与所述重组酶相对应。
本发明所提供的构建方法中,所述多能干细胞可以是胚胎干细胞、诱导的多能干细胞(IPS)等。
本发明所提供的构建方法中,通过在重组酶驱动基因中整合重组酶,以驱动重组酶的基因表达。所述重组酶驱动基因可以是PAX6(Gene ID:5080)或FOXA2(Gene ID:3170),所述PAX6是人特异的早期神经外胚层(neuroectoderm,NE)转录因子,所述FOXA2是早期神经管底板(floor plate,FP)转录因子。所述重组酶通常与转录终止调控元件片段相对应,从而可以介导转录终止调控元件片段中的特异性重组,例如,所述重组酶可以是Cre、Flp,所述Cre的序列可以如SEQ ID NO.10所述,所述Flp的序列可以如SEQ ID NO.21所示。
本发明所提供的构建方法中,所述重组酶基因片段可以包括重组酶片段,所述重组酶片段的序列通常与所需表达的重组酶相对应。所述重组酶基因片段还可以包括2A片段,具体可以是例如P2A片段、T2A片段(LC087167.1)等,所述2A片段通常用于连接两个所需翻译的蛋白,在翻译到它的时候会断开,把同一条mRNA表达出的蛋白前后分开产生两个蛋白,实现同一个启动子控制下的两蛋白共翻译。所述重组酶基因片段还可以包括诱导片段,所述诱导片段具体可以是例如ERT2片段等,用于在特定物质(例如,雌激素及其类似物)作用下使重组酶进入细胞核,切除转录终止序列,例如,在不加外源4-OH的情况下,即使重组酶驱动基因CreERT2的表达,CreERT2只能定位于胞浆,不能入核介导转录终止调控元件片段中的特异性重组,当加入外源4-OH时,CreERT2与4-OH结合而入核,对LSL切割重组,引起报告基因如GFP的表达,从而实现谱系追踪的精准时空调节。在本发明一具体实施方式中,所述重组酶供体基因片段自5’端至3’端依次包括2A片段和重组酶片段;在本发明另一具体实施方式中,所述重组酶供体基因片段自5’端至3’端依次包括重组酶片段和诱导片段;在本发明一具体实施方式中,所述重组酶基因片段自5’端至3’端依次包括2A片段、重组酶片段和诱导片段。
本发明所提供的构建方法中,重组酶驱动基因中整合重组酶基因片段后,在构建获得的系统中,依然保留了重组酶驱动基因本身的表达,且同时可以引入重组酶的表达。例如,可以将重组酶驱动基因的终止密码子替换为重组酶基因片段,再例如,可以将基因组上重组酶驱动基因的两个拷贝中的其中一个的起始密码子替换为重组酶基因片段,再例如,可以将基因组上重组酶驱动基因的两个拷贝中的其中一个替换为重组酶基因片段。
本发明所提供的构建方法中,所述染色体开放位点AAVS(Gene ID:17)是一种人多能干细胞特异的染色体开放位点,其整合报告基因系统的位点为第24285到24303碱基区域。
本发明所提供的构建方法中,所述转录终止调控元件片段选自LSL片段、FSF片段。所述LSL片段(LoxP-STOP-LoxP)通常基于Cre-LoxP重组酶系统,所述LSL片段通常包括由STOP序列插入两个LoxP位点(序列)之间所构成的片段,Cre酶可以介导两个LoxP位点(序列)之间的特异性重组,使LoxP位点间的基因序列被删除或重组。所述LSL片段中,STOP序列如SEQ ID NO.2所示;所述LoxP序列选自SEQ ID NO.1所示的序列,或者与SEQ ID NO.1所示的序列具有80%、85%、90%、92%、94%、96%、98%、99%以上同源性、且具有SEQ ID NO.1所限定的序列的功能的序列,具体可以是如SEQ ID NO.13~16所示的序列。
所述FSF片段(FRT-STOP-FRT)通常基于FLP-FRT重组酶系统,所述FSF片段通常包括由STOP序列插入两个FRT位点(序列)之间所构成的片段,FLP酶可以介导两个FRT位点(序列)之间的特异性重组,使FRT位点间的基因序列被删除或重组。所述FSF片段中,STOP序列如SEQ ID NO.2所示;所述FRT序列如SEQ ID NO.20所示。
本发明所提供的构建方法中,所述报告基因可以是本领域各种适用于谱系示踪的报告基因,例如,所述报告基因片段可以选自GFP片段(JQ064508.1)、红色荧光蛋白tdTomato片段、萤火虫荧光素酶片段、半乳糖苷酶片段等,所述报告基因片段可以如SEQ IDNO.22~26所示。
本发明所提供的构建方法中,所述报告基因系统还包括启动子,所述启动子可以是本领域各种适用于谱系示踪的启动子,例如,所述启动子可以是CAG启动子、CMV启动子、UBC启动子、ef1α启动子等,所述启动子的序列可以如SEQ ID NO.27所示。在本发明一具体实施方式中,所述报告基因系统自5’端至3’端依次包括启动子、转录终止调控元件片段、报告基因片段。
本发明所提供的构建方法中,报告基因系统还可以包括抗性基因,所述抗性基因通常可以在细胞培养过程中,用于细胞的筛选。所述抗性基因可以是本领域各种适用于谱系示踪的抗性基因,例如,所述抗性基因可以是Puro(嘌呤霉素)、BSD(Blasticidin,杀稻瘟菌素)、G418(Neomycin,新霉素)、Zeo(Zeosin,博莱霉素)等,所述报告基因片段可以如SEQID NO.28所示。在本发明一具体实施方式中,所述报告基因系统自5’端至3’端依次包括抗性基因、启动子、转录终止调控元件片段、报告基因片段。
本发明所提供的构建方法中,所述报告基因系统还包括剪接受体序列(SA),用于利用内源启动子(例如,图1中的AAVS1)来驱动下游基因表达(例如,图1中抗性基因puro)。在本发明一具体实施方式中,所述报告基因系统中剪接受体序列位于抗性基因上游,所述剪接受体序列可以如SEQ ID NO.21所示:
CTGACCTCTTCTCTTCCTCCCACAGGGCCTCGAGAGATCTGGCAGCGGAGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTGGAGGAGAATCCCGGCCCTAGGCTCGAG(SEQ ID NO.21)
本发明所提供的构建方法中,将染色体开放位点AAVS整合报告基因系统后,在构建获得的系统中,包括以基因编辑为基础的谱系示踪系统需要两大基本元件,其一是可控制的报告基因系统,其二是谱系特异性表达的调控开关,从而形成完整的谱系示踪系统。在染色体开放位点AAVS整合报告基因系统的方法对于本领域技术人员可以是电转后加入抗性药物筛选单克隆建系鉴定方法。
在本发明一具体实施方式中,先将人多能干细胞(hPSCs)的重组酶驱动基因中整合重组酶基因片段;再将染色体开放位点AAVS整合报告基因系统,所述报告基因系统包括转录终止调控元件片段和报告基因片段,所述转录终止调控元件片段与所述重组酶相对应。
本申请中,利用同源重组方法,在人多能干细胞(hPSCs)特异的染色体开放位点AAVS1整合受重组酶Cre或Flp控制的转录终止调控元件片段LoxP-STOP-LoxP(LSL)或FRT-STOP-FRT(FSF),同时引入报告基因,构成可控制的报告基因系统,并通过对LoxP序列的突变,改变了Cre的重组效率;在谱系特异性表达的调控开关方面,可选取目的基因驱动重组酶Cre或Flp表达的基因。通过2A连接重组酶替换目的基因终止密码子,以及在一条同源染色体上将重组酶替换目的基因起始密码子,构建成目的基因驱动的谱系特异性表达的GFP示踪系统。此外,采用重组酶羧基末端连接突变雌激素受体片段(estrogen receptor,ER)的策略,构建出可诱导的重组酶入核的细胞系,提高谱系示踪的灵活性与可控性。通过体外神经定向分化系统和体内畸胎瘤实验,证明上述的多种方法可以成功用于谱系示踪,为构建谱系示踪人细胞系提供更灵活、精确的选择。
本发明第二方面提供一种谱系示踪系统,由本发明第一方面所述的谱系示踪系统的构建方法构建获得。
本发明第三方面提供一种谱系示踪方法,包括:通过所述的谱系示踪系统,进行谱系示踪。所述谱系示踪方法可以是非诊断或者治疗目的的,所述谱系示踪方法可以是体外的谱系示踪方法。
本发明所提供的谱系示踪方法中,通过所述谱系示踪系统进一步进行谱系示踪的方法对于本领域技术人员来说应该是已知的。例如,可以是将所述谱系示踪系统进行分化、繁殖、空间定位等,以进行谱系示踪。
由于人多能干细胞成集落生长的特殊性,以及人基因的保守性及对外来基因的排斥性等因素,使得基因编辑技术的效率,单克隆筛选、获得的效率较低等因素,使得该技术有很高的门槛。本发明首次在人细胞中构建出谱系示踪系统,利用报告基因标记目的基因蛋白表达后的所有子代细胞,从而对这些细胞以及其子代细胞的分化、增殖、空间定位等进行示踪的技术。可运用于人类发育、再生医学以及药物研究等多种领域。具有有效性、精准性和可控性,并在体内外实验系统得到证实。该谱系示踪系统适用于人类发育的研究、疾病模型的构建和精准细胞谱系的移植治疗即再生医学的研究以及药物研究等多种领域,其运用前景广泛。
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指出,单数形式“一个”、“一”和“这个”包括复数形式。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明,具体可参见Sambrook等MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring HarborLaboratory Press,1989and Third edition,2001;Ausubel等,CURRENT PROTOCOLS INMOLECULAR BIOLOGY,John Wiley&Sons,New York,1987and periodic updates;theseries METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATINSTRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS INENZYMOLOGY,Vol.304,Chromatin(P.M.Wassarman and A.P.Wolffe,eds.),AcademicPress,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,Vol.119,ChromatinProtocols(P.B.Becker,ed.)Humana Press,Totowa,1999等。
实施例1
可控制报告基因元件在hPSCs中的功能验证:
将LSL-GFP元件整合到人类基因组的AAVS1位点。AAVS1-CAGGS-eGFP质粒含有整合到AAVS1位点所需要的同源臂,SA(剪接受体序列),用于筛选的抗性基因Puro,以及CAG启动子驱动表达的报告基因GFP(Genetic engineering of human pluripotent cells usingTALE nucleases.Nat Biotechnol.2011Jul 7;29(8):731-4.doi:10.1038/nbt.1927.)。通过PCR得到LSL片段,所述LSL片段具体为LoxP-STOP-LoxP,两个LoxP片段中插入一个STOP片段,LoxP片段和STOP片段的具体序列如下:
LoxP:ATAACTTCGTATAATGTATGCTATACGAAGTTAT(SEQ ID NO.1)
STOP:TCGCGATGAATAAATGAAAGCTTGCAGATCTGCGACTCTAGAGGATCTGCGACTCTAGAGGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCTGCGACTCTAGAGGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCTGCGACTCTAGAGGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCCCCATCAAGCTGATCCGGAACCCTTAAT(SEQ ID NO.2)
PCR中所使用的引物序列如下:
AAVS1-F1:CTTCCGCATTGGAGTCGCTTTA(SEQ ID NO.3)
AAVS1-F2:CAGCCGGTCCTGGACTTTGTC(SEQ ID NO.4)
AAVS1-R1:ACAGGAGGTGGGGGTTAGAC(SEQ ID NO.5)
AAVS1-R2:AGCCGGGAACCGCTCAACTC(SEQ ID NO.6)
随后酶切连接的方法插入CAG启动子与GFP之间,酶切位点为AscI,即形成所需的AAVS1-LSL-GFP质粒,具体如图1所示。
将AAVS1-LSL-GFP和hAAVS1-1L-TALEN、hAAVS1-1R-TALEN质粒(质粒信息参考上述文献)一起电转hESCs细胞系H9,其中hAAVS1-1L-TALEN、hAAVS1-1R-TALEN质粒能够在人的AAVS1位点引起DSB(double strand breaks)。挑选加入嘌呤霉素筛选后存活的单克隆并扩大培养,随后进行PCR鉴定。
PCR引物F1在5’同源臂外部,R1在3’同源臂中,当没有插入外源DNA片段时,PCR能够得到1270bp的条带,得到此条带说明细胞有野生型(wild type,WT)的AAVS1基因组位点。
引物F2在5’同源臂外侧,R2在HR供体的Puro片段上,当外源LSL-GFP片段整合到AAVS1基因组位点,PCR能够得到1492bp的条带,得到此条带说明细胞有同源重组型(HR)的AAVS1基因组位点(参见图1)。通过PCR鉴定,证明得到LSL-GFP片段整合一条染色体的杂合子细胞(heterozygote,Hetero)和LSL-GFP片段整合两条染色体的纯合子细胞(homozygote,Homo),具体如图2所示。
随后进行Southern Blot(SB)鉴定,进一步确定片段整合的正确性与特异性。将WT细胞、Hetero细胞和Homo细胞裂解并抽提基因组DNA,分别用限制性内切酶BsaI和EcoRI进行酶切,用与5’同源臂结合的探针5’Probe和与GFP片段结合的探针GFP Probe(参见图1)鉴定。其中,5’Probe与WT与HR的基因组均能够结合,由于WT与HR的AAVS1基因组酶切后条带大小不同,可以从曝光结果中区分出WT或HR的片段;GFP Probe只与含有GFP的片段结合,可以用来检测是否有AAVS1-LSL-GFP质粒整合,以及根据条带大小判断是否有整合到正确的位点,或有整合到其他基因组位点的脱靶现象,探针的具体结构如下:
5’Probe:
TTTCTGTCTGCAGCTTGTGGCCTGGGTCACCTCTACGGCTGGCCCAGATCCTTCCCTGCCGCCTCCTTCAGGTTCCGTCTTCCTCCACTCCCTCTTCCCCTTGCTCTCTGCTGTGTTGCTGCCCAAGGATGCTCTTTCCGGAGCACTTCCTTCTCGGCGCTGCACCACGTGATGTCCTCTGAGCGGATCCTCCCCGTGTCTGGGTCCTCTCCGGGCATCTCTCCTCCCTCACCCAACCCCATGCCGTCTTCACTCGCTGGGTTCCCTTTTCCTTCTCCTTCTGGGGCCTGTGCCATCTCTCGTTTCTTAGGATGGCCTTCTCCGACGGATGTCTCCCTTGCGTCCCGCCTCCCCTTCTTGTAGGCCTGCATCATCACCGTTTTTCTGGACAACCCCAAAGTACCCCGTCTCCCTGGCTTTAGCCACCTCTCCATCCTCTTGCTTTCTTTGCCTGGACACCCCGTTCTCCTGTGGATTCGGGTCACCTCTCACTCCTTTCATTTGGGCAGCTCCCCTACCCCCCTTACCTCTCTAGTCTGTGCTAGCTCTTCCAGCC(SEQ ID NO.7)
GFP Probe:
ACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTC(SEQ ID NO.8)
从SB鉴定结果看到,5’Probe在WT细胞中有一条8249bp的WT条带,Hetero细胞有一条8249bp的WT条带与一条4928bp的HR条带,Homo细胞有一条4928bp的HR条带,详见图3A。GFP Probe在WT细胞中没有条带,在Hetero和Homo细胞中有一条7492bp的条带,详见图3B。
接下来验证LSL元件是否能被重组酶Cre切割重组,从而使下游报告基因GFP表达。HEK293FT、pLenti-Cre质粒包装病毒后,取病毒上清进行超速离心得到病毒浓缩液,感染整合LSL-GFP元件的细胞。感染两天后,在荧光显微镜下观察到开始出现绿色的细胞,三天后大约30%的细胞表达明显的绿色荧光,而没有感染病毒的细胞则没有出现绿色细胞,详见图4。
实施例2
谱系特异性开关元件Cre在hPSCs中的功能验证:
要让PAX6和FOXA2驱动Cre的表达,将PAX6和FOXA2的终止密码子替换成2A-Cre序列,2A-Cre自5’端至3’端由依次连接的P2A序列和Cre序列组成,具体如下:
P2A:GCCACTAACTTCTCCCTGTTGAAACAAGCAGGGGATGTCGAAGAGAATCCCGGGCCA
(SEQ ID NO.9)
Cre序列:
ATGTCCAATTTACTGACCGTACACCAAAATTTGCCTGCATTACCGGTCGATGCAACGAGTGATGAGGTTCGCAAGAACCTGATGGACATGTTCAGGGATCGCCAGGCGTTTTCTGAGCATACCTGGAAAATGCTTCTGTCCGTTTGCCGGTCGTGGGCGGCATGGTGCAAGTTGAATAACCGGAAATGGTTTCCCGCAGAACCTGAAGATGTTCGCGATTATCTTCTATATCTTCAGGCGCGCGGTCTGGCAGTAAAAACTATCCAGCAACATTTGGGCCAGCTAAACATGCTTCATCGTCGGTCCGGGCTGCCACGACCAAGTGACAGCAATGCTGTTTCACTGGTTATGCGGCGGATCCGAAAAGAAAACGTTGATGCCGGTGAACGTGCAAAACAGGCTCTAGCGTTCGAACGCACTGATTTCGACCAGGTTCGTTCACTCATGGAAAATAGCGATCGCTGCCAGGATATACGTAATCTGGCATTTCTGGGGATTGCTTATAACACCCTGTTACGTATAGCCGAAATTGCCAGGATCAGGGTTAAAGATATCTCACGTACTGACGGTGGGAGAATGTTAATCCATATTGGCAGAACGAAAACGCTGGTTAGCACCGCAGGTGTAGAGAAGGCACTTAGCCTGGGGGTAACTAAACTGGTCGAGCGATGGATTTCCGTCTCTGGTGTAGCTGATGATCCGAATAACTACCTGTTTTGCCGGGTCAGAAAAAATGGTGTTGCCGCGCCATCTGCCACCAGCCAGCTATCAACTCGCGCCCTGGAAGGGATTTTTGAAGCAACTCATCGATTGATTTACGGCGCTAAGGATGACTCTGGTCAGAGATACCTGGCCTGGTCTGGACACAGTGCCCGTGTCGGAGCCGCGCGAGATATGGCCCGCGCTGGAGTTTCAATACCGGAGATCATGCAAGCTGGTGGCTGGACCAATGTAAATATTGTCATGAACTATATCCGTAACCTGGATAGTGAAACAGGGGCAATGGTGCGCCTGCTGGAAGATGGCGAT(SEQ ID NO.10)
因此,需要构建的供体质粒需要有如下元件:5’同源臂与3’同源臂,同源臂中间的2A-Cre,以及其后的转录终止信号polyA(PA),具体如图5所示。
PAX6-2A-Cre质粒中5’同源臂至3’同源臂的具体序列如下,其中,5’端的下划线部分为5’同源臂,3’端的下划线部分为3’同源臂:
GAACAGTCAGCCAATGGGCACCTCGGGCACCACTTCAACAGGTGAGCCACTGCTTTCTGCAGGCTGCA CAGAGGCGATCTCTCTTCACTAGAAGTTTACCCAAACAGAATCTCCTGGTCTTATGGGAGGGCGTGTTTAACTCCT TGCTTTCCTTGTCCCTGGGGGATGGGGATTGAAAAGGGAAATTCAGTTAAGCTAATTAGTAACTTTACACCATATA GACAAAAACTAAAATTGTTTTTCCTGAATTTGGTCACAAAAGTTGTGTATGAAGACAAGGCCTGAGACTGCAAGTT TTCTGAGGACAGATTATTAGACGAAGCTCAGTAGGGGGCCCACTGAGCTGTAGGTGCGTGCTTGTTGAAATGCTTC TTGCCCTCATAGCTCCTCTAGACCTTTTGCTGGAAATAAAAAGTGACACATTGGTTTTCCAGAGACAGCTTTATTG TAAAAGTTCCAAACATGCAAACAAACAGAGGATTTTTTTTTTCTTTTCCTTTGGATTGGGGTGGGGGGTACTTGGG ATCCAATAGGTATATATACATATATTGTCTAGTTTCTGAAGGTGCTACTTTTATTTGTAACAATTGAAGTGATTTT AATACAGTAAAAAATGTTAGAAAGTATTAGTTTTTTTTTTTTTTTTTTTTTTTGTAAACCTATAAATTTGTATTCC ATGTCTGTTTCTCAAAGGGAATATCTACATGGCTATTTCTTTCATCCACTTCTAGGACTCATTTCCCCTGGTGTGT CAGTTCCAGTTCAAGTTCCCGGAAGTGAACCTGATATGTCTCAATACTGGCCAAGATTACAGGCTAGCGCCACTAACTTCTCCCTGTTGAAACAAGCAGGGGATGTCGAAGAGAATCCCGGGCCAATGTCCAATTTACTGACCGTACACCAAAATTTGCCTGCATTACCGGTCGATGCAACGAGTGATGAGGTTCGCAAGAACCTGATGGACATGTTCAGGGATCGCCAGGCGTTTTCTGAGCATACCTGGAAAATGCTTCTGTCCGTTTGCCGGTCGTGGGCGGCATGGTGCAAGTTGAATAACCGGAAATGGTTTCCCGCAGAACCTGAAGATGTTCGCGATTATCTTCTATATCTTCAGGCGCGCGGTCTGGCAGTAAAAACTATCCAGCAACATTTGGGCCAGCTAAACATGCTTCATCGTCGGTCCGGGCTGCCACGACCAAGTGACAGCAATGCTGTTTCACTGGTTATGCGGCGGATCCGAAAAGAAAACGTTGATGCCGGTGAACGTGCAAAACAGGCTCTAGCGTTCGAACGCACTGATTTCGACCAGGTTCGTTCACTCATGGAAAATAGCGATCGCTGCCAGGATATACGTAATCTGGCATTTCTGGGGATTGCTTATAACACCCTGTTACGTATAGCCGAAATTGCCAGGATCAGGGTTAAAGATATCTCACGTACTGACGGTGGGAGAATGTTAATCCATATTGGCAGAACGAAAACGCTGGTTAGCACCGCAGGTGTAGAGAAGGCACTTAGCCTGGGGGTAACTAAACTGGTCGAGCGATGGATTTCCGTCTCTGGTGTAGCTGATGATCCGAATAACTACCTGTTTTGCCGGGTCAGAAAAAATGGTGTTGCCGCGCCATCTGCCACCAGCCAGCTATCAACTCGCGCCCTGGAAGGGATTTTTGAAGCAACTCATCGATTGATTTACGGCGCTAAGGATGACTCTGGTCAGAGATACCTGGCCTGGTCTGGACACAGTGCCCGTGTCGGAGCCGCGCGAGATATGGCCCGCGCTGGAGTTTCAATACCGGAGATCATGCAAGCTGGTGGCTGGACCAATGTAAATATTGTCATGAACTATATCCGTAACCTGGATAGTGAAACAGGGGCAATGGTGCGCCTGCTGGAAGATGGCGATCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGGGCGCGCCAAAAAAAAAAAAAAAAAAAAAGGAAAGGAAATATTGTGTTAATTCAGTCAGTGACTA TGGGGACACAACAGTTGAGCTTTCAGGAAAGAAAGAAAAATGGCTGTTAGAGCCGCTTCAGTTCTACAATTGTGTC CTGTATTGTACCACTGGGGAAGGAATGGACTTGAAACAAGGACCTTTGTATACAGAAGGCACGATATCAGTTGGAA CAAATCTTCATTTTGGTATCCAAACTTTTATTCATTTTGGTGTATTATTTGTAAATGGGCATTTGTATGTTATAAT GAAAAAAAGAACAATGTAGACTGGATGGATGTTTGATCTGTGTTGGTCATGAAGTTGTTTTTTTTTTTTTTAAAAA GAAAACCATGATCAACAAGCTTTGCCACGAATTTAAGAGTTTTATCAAGATATATCGAATACTTCTACCCATCTGT TCATAGTTTATGGACTGATGTTCCAAGTTTGTATCATTCCTTTGCATATAATTAAACCTGGAACAACATGCACTAG ATTTATGTCAGAAATATCTGTTGGTTTTCCAAAGGTTGTTAACAGATGAAGTTTATGTGCAAAAAAGGGTAAGATA TAAATTCAAGGAAGAAAAAAAGTTGATAGCTAAAAGGTAGAGTGTGTCTTCGATATAATCCAATTTGTTTTATGTC AAAATGTAAGTATTTGTCTTCCCTAGAAATCCTCAGAATGATTTCTATAATAAAGTTAATTTCATTTATATTTGAC AAGAATATAGATGTTTTATACACATTTTCATGCAATCATACGTTTCTTTTTTGGCCAGCAAAAGTTAATTGTTCTT AGATATAGTTGTATTACTGTTCACGGTCC(SEQ ID NO.11)
FOXA2-2A-Cre质粒中5’同源臂至3’同源臂的具体序列如下,其中,5’端的下划线部分为5’同源臂,3’端的下划线部分为3’同源臂:
ATCCAGCAGAGCCCCAACAAGATGCTGACGCTGAGCGAGATCTACCAGTGGATCATGGACCTCTTCCC CTTCTACCGGCAGAACCAGCAGCGCTGGCAGAACTCCATCCGCCACTCGCTCTCCTTCAACGACTGTTTCCTGAAG GTGCCCCGCTCGCCCGACAAGCCCGGCAAGGGCTCCTTCTGGACCCTGCACCCTGACTCGGGCAACATGTTCGAGA ACGGCTGCTACCTGCGCCGCCAGAAGCGCTTCAAGTGCGAGAAGCAGCTGGCGCTGAAGGAGGCCGCAGGCGCCGC CGGCAGCGGCAAGAAGGCGGCCGCCGGAGCCCAGGCCTCACAGGCTCAACTCGGGGAGGCCGCCGGGCCGGCCTCC GAGACTCCGGCGGGCACCGAGTCGCCTCACTCGAGCGCCTCCCCGTGCCAGGAGCACAAGCGAGGGGGCCTGGGAG AGCTGAAGGGGACGCCGGCTGCGGCGCTGAGCCCCCCAGAGCCGGCGCCCTCTCCCGGGCAGCAGCAGCAGGCCGC GGCCCACCTGCTGGGCCCGCCCCACCACCCGGGCCTGCCGCCTGAGGCCCACCTGAAGCCGGAACACCACTACGCC TTCAACCACCCGTTCTCCATCAACAACCTCATGTCCTCGGAGCAGCAGCACCACCACAGCCACCACCACCACCAAC CCCACAAAATGGACCTCAAGGCCTACGAACAGGTGATGCACTACCCCGGCTACGGTTCCCCCATGCCTGGCAGCTT GGCCATGGGCCCGGTCACGAACAAAACGGGCCTGGACGCCTCGCCCCTGGCCGCAGATACCTCCTACTACCAGGGG GTGTACTCCCGGCCCATTATGAACTCCTCTGCTAGCgccactaacttctccctgttgaaacaagcaggggatgtcgaagagaatcccgggccaATGTCCAATTTACTGACCGTACACCAAAATTTGCCTGCATTACCGGTCGATGCAACGAGTGATGAGGTTCGCAAGAACCTGATGGACATGTTCAGGGATCGCCAGGCGTTTTCTGAGCATACCTGGAAAATGCTTCTGTCCGTTTGCCGGTCGTGGGCGGCATGGTGCAAGTTGAATAACCGGAAATGGTTTCCCGCAGAACCTGAAGATGTTCGCGATTATCTTCTATATCTTCAGGCGCGCGGTCTGGCAGTAAAAACTATCCAGCAACATTTGGGCCAGCTAAACATGCTTCATCGTCGGTCCGGGCTGCCACGACCAAGTGACAGCAATGCTGTTTCACTGGTTATGCGGCGGATCCGAAAAGAAAACGTTGATGCCGGTGAACGTGCAAAACAGGCTCTAGCGTTCGAACGCACTGATTTCGACCAGGTTCGTTCACTCATGGAAAATAGCGATCGCTGCCAGGATATACGTAATCTGGCATTTCTGGGGATTGCTTATAACACCCTGTTACGTATAGCCGAAATTGCCAGGATCAGGGTTAAAGATATCTCACGTACTGACGGTGGGAGAATGTTAATCCATATTGGCAGAACGAAAACGCTGGTTAGCACCGCAGGTGTAGAGAAGGCACTTAGCCTGGGGGTAACTAAACTGGTCGAGCGATGGATTTCCGTCTCTGGTGTAGCTGATGATCCGAATAACTACCTGTTTTGCCGGGTCAGAAAAAATGGTGTTGCCGCGCCATCTGCCACCAGCCAGCTATCAACTCGCGCCCTGGAAGGGATTTTTGAAGCAACTCATCGATTGATTTACGGCGCTAAGGATGACTCTGGTCAGAGATACCTGGCCTGGTCTGGACACAGTGCCCGTGTCGGAGCCGCGCGAGATATGGCCCGCGCTGGAGTTTCAATACCGGAGATCATGCAAGCTGGTGGCTGGACCAATGTAAATATTGTCATGAACTATATCCGTAACCTGGATAGTGAAACAGGGGCAATGGTGCGCCTGCTGGAAGATGGCGATctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggggcgcgccGAAGACGACGGCT TCAGGCCCGGCTAACTCTGGCACCCCGGATCGAGGACAAGTGAGAGAGCAAGTGGGGGTCGAGACTTTGGGGAGAC GGTGTTGCAGAGACGCAAGGGAGAAGAAATCCATAACACCCCCACCCCAACACCCCCAAGACAGCAGTCTTCTTCA CCCGCTGCAGCCGTTCCGTCCCAAACAGAGGGCCACACAGATACCCCACGTTCTATATAAGGAGGAAAACGGGAAA GAATATAAAGTTAAAAAAAAGCCTCCGGTTTCCACTACTGTGTAGACTCCTGCTTCTTCAAGCACCTGCAGATTCT GATTTTTTTGTTGTTGTTGTTCTCCTCCATTGCTGTTGTTGCAGGGAAGTCTTACTTAAAAAAAAAAAAAAATTTT GTGAGTGACTCGGTGTAAAACCATGTAGTTTTAACAGAACCAGAGGGTTGTACTATTGTTTAAAAACAGGAAAAAA AATAATGTAAGGGTCTGTTGTAAATGACCAAGAAAAAGAAAAAAAAAGCATTCCCAATCTTGACACGGTGAAATCC AGGTCTCGGGTCCGATTAATTTATGGTTTCTGCGTGCTTTATTTATGGCTTATAAATGTGTATTCTGGCTGCAAGG GCCAGAGTTCCACAAATCTATATTAAAGTGTTATACCCGGTTTTATCCC(SEQ ID NO.12)
要在PAX6和FOXA2的终止密码子区域整合Cre元件,就需要在这些区域附近造成DSB。首先在终止密码子附近设计几条sgRNA,通过与Cas9质粒共同转染293FT细胞,并提取基因组DNA进行测序,选取引起测序结果中套峰现象最显著的sgRNA,视为切割效率最高的sgRNA。将PAX6和FOXA2切割效率最高的sgRNA质粒大量抽提,用于电转hESCs,具体如图5和图6所示。
将构建好的PAX6-2A-Cre和FOXA2-2A-Cre质粒与相对应的sgRNA和pCas9-GFP、pCAG-Puro-GFP一起电转H9细胞。挑出经过嘌呤霉素筛选后存活的单克隆并扩大培养,进行基因组DNA的PCR鉴定。鉴定引物F位于5’同源臂上游,鉴定引物R位于3’同源臂中,鉴定引物Cre-R位于Cre片段。用F与R引物PCR出条带,则说明此处的基因组是没有整合外源Cre片段的WT型,用F与Cre-R引物PCR出条带则说明此处的基因组是整合外源Cre片段的HR型(参见图5)。这样,通过基因组PCR鉴定所挑选的单克隆,保留整合Cre片段的克隆(参见图7)并扩大培养,进行进一步鉴定。
选取PAX6-2A-Cre细胞系,用EB法进行分化。hPSCs采用EB法分,会经历Day0的ES、Day6的早期NE(neuroectoderm,神经外胚层)、Day10的NE、Day17的NP(neutralprogenitor,神经祖细胞)以及Day25的晚期NP几个特定阶段。其中,如果Day10的NE在不加入任何外源信号分子或诱导物,Day17的NP会成为表达PAX6神经管背侧的Dorsal NP;如果在Day10的NE中加入腹侧化信号分子SHH,Day17的NP则会由原来的Dorsal状态转变为Ventral状态,此时细胞的标志基因是NKX2.1而不表达PAX6。因此通过Day10加入或不加入SHH,可以在Day17和Day25得到PAX6阳性或阴性的NP,再通过检测Cre的表达量变化情况,就可以判断Cre的表达是否与其驱动基因PAX6一致。
收集Day0ES、Day6早期NE、Day10NE、Day17Dorsal NP及Ventral NP,抽提RNA并逆转录成cDNA,随后进行RT-PCR对PAX6、Cre和NKX2.1的表达量进行测定。从柱状图中可以看到,PAX6的mRNA水平随着细胞分化为NE而逐渐升高,在Dorsal NP达到高峰,而在VentralNP中则处于极低水平;NKX2.1的mRNA仅在Ventral NP中高表达;Cre的mRNA变化趋势与PAX6基本吻合,也是在NE阶段上升,在Dorsal NP到达最高峰,在Ventral NP中降低,说明其表达在mRNA水平与PAX6一致,具体如图8所示。
之后,选取在Day0ES、Day10NE、Day17Dorsal与Ventral NP阶段的PAX6-2A-Cre细胞,用免疫荧光的方法检测PAX6和Cre表达情况。在ES阶段,PAX6和Cre都没有阳性信号;在NE阶段,PAX6出现阳性信号,同时Cre也检测到阳性信号;在NP阶段,Dorsal NP同时有PAX6和Cre阳性信号,而在Ventral NP都没有PAX6和Cre阳性信号,证明Cre在蛋白水平上的表达趋势与PAX6相同,具体如图9所示。
最后,提取Day0ES、Day6早期NE、Day10NE、Day17NP及Day25晚期NP的蛋白,用WB的方法对PAX6与Cre表达情况进行检测。结果显示,ES阶段PAX6与Cre均没有表达;NE阶段PAX6与Cre开始表达并且表达量逐渐上升;Dorsal NP中PAX6与Cre的表达量达到高峰,而Ventral NP则没有PAX6与Cre的表达,具体如图10所示。再次从蛋白水平证明Cre的表达情况与PAX6表达情况基本一致。
为验证FOXA2-2A-Cre细胞系中Cre的表达情况是否与FOXA2的一致,选取FOXA2-2A-Cre细胞系并用AD法分化。AD分化时,如果不再加入任何信号分子或诱导物,hPSCs则会成为Dorsal NP,表达PAX6,不表达FOXA2;当加入腹侧化信号分子SHH时,hPSCs向腹侧分化,成为FP,表达FOXA2,不表达PAX6。
首先,选取Day0ES、Day6的Dorsal NP与FP、Day12的Dorsal NP与FP的细胞,抽提RNA逆转录成cDNA并进行RT-PCR,检测PAX6、Cre与FOXA2的mRNA表达水平。结果显示,在ES阶段,PAX6、FOXA2和Cre均没有表达;Day6、Day12的Dorsal NP中PAX6表达量高,而FOXA2与Cre表达量极低;Day6、Day12的FP中PAX6表达量极低,而FOXA2与Cre表达量高,且二者的表达趋势基本相同,具体如图11所示。
随后,选取AD的Day6、Day12Dorsal NP与FP细胞,进行免疫荧光染色鉴定。从染色结果可以看到,当细胞处于Day6、Day12的Dorsal NP时,没有FOXA2和Cre的阳性信号;只有当细胞处于FP时,才有FOXA2与Cre的阳性信号,具体如图12所示。说明在蛋白水平上,Cre的表达与FOXA2的表达一致。
最后,提取Day0ES阶段与Day6、Day12、Day20的Dorsal NP和FP细胞的蛋白质进行WB鉴定。曝光结果显示,FOXA2在ES阶段与Dorsal NP阶段均没有表达,而在FP阶段均有表达;同时,Cre的表达情况基本与FOXA2相同,在ES和Dorsal NP中均是阴性的,只在FP中有阳性条带,具体如图13所示。从蛋白水平再次证明Cre的表达情况与PAX6表达情况基本一致。
实施例3
构建PAX6-2A-Cre/AAVS1-LSL-GFP细胞系:
在PAX6-2A-Cre和FOXA2-2A-Cre细胞系中电转AAVS1-LSL-GFP和hAAVS1-1L-TALEN、hAAVS1-1R-TALEN质粒。经过嘌呤霉素筛选并挑选存活的单克隆,进行基因组AAVS1位点的PCR,所用的PCR引物对为AAVS1-F1/AAVS1-R1与AAVS1-F2/AAVS1-R2,具体引物参见实施例1。
用AAVS1-F1/R1引物PCR得到1270bp的WT片段,用AAVS1-F2/R2引物PCR得到1492bp的HR片段。#1、#3、#4、#6、#8为Homo,#2、#5、#7为Hetero(参见图14)。保留在PAX6-2A-Cre细胞系中成功整合LSL-GFP片段的克隆,并选取其中的#4克隆用GFP Probe(同实施例1)进行SB鉴定,可以看到在此PAX6-2A-Cre/AAVS1-LSL-GFP细胞系中,LSL-GFP片段没有异位整合的脱靶现象发生(参见图15),说明LSL-GFP片段整合到AAVS1位点。通过上述基因组PCR及SB鉴定,证明在PAX6-2A-Cre细胞系中,成功的在AAVS1位点整合LSL-GFP片段,所得到的PAX6-2A-Cre/AAVS1-LSL-GFP细胞系可以对表达PAX6的细胞进行谱系示踪。
实施例4
PAX6-2A-Cre/AAVS1-LSL-GFP细胞系对PAX6的体外示踪
为验证PAX6-2A-Cre/AAVS1-LSL-GFP细胞系是否可以用来对表达PAX6的细胞进行示踪,将所得到的PAX6-2A-Cre/AAVS1-LSL-GFP细胞系用EB法分化,并进行免疫荧光染色鉴定。
在分化过程中,Day0的ES没有PAX6表达。从ES分化到Day6的早期NE阶段,PAX6表达量开始迅速升高,经过Day10NE,在Day17的Dorsal NP达到高峰。因此,首先选取分化到Day10的NE进行进行免疫荧光染色。从染色结果可以看到Day10的NE细胞表达PAX6与Cre,同时GFP染色结果也是阳性的(参见图16),证明LSL已经被Cre切割重组,STOP被移除,下游的GFP表达。
为进一步验证PAX6-2A-Cre/AAVS1-LSL-GFP细胞系的示踪效果,对Day17的DorsalNP与Ventral NP进行免疫荧光染色。在Day17Dorsal NP中,PAX6表达量达到高峰,而Day17Ventral NP中则表达NKX2.1而不表达PAX6。在Day17的Dorsal NP中,GFP与PAX6染色均为阳性;在Ventral NP中仅有GFP的阳性信号,而没有PAX6阳性信号(图17A)。Dorsal NP中有GFP与Cre的阳性信号;在Ventral NP中只表达GFP,而没有Cre的阳性信号(图17B)。Day17的Dorsal NP中仅有GFP的阳性信号,没有NKX2.1的阳性信号;Ventral NP中GFP和NKX2.1的染色均为阳性(图17C)。
上述实验证明H9的PAX6-2A-Cre/AAVS1-LSL-GFP细胞系能够对PAX6进行谱系示踪,为验证谱系示踪系统的适用性,是否能在其他细胞系中得到相同的结论,选取另一个hESCs细胞系H7来进行重复,H7细胞系的构建方法参照如上所述的hESCs细胞系H9细胞系的构建方法。首先在H7细胞中构建PAX6-2A-Cre细胞系,随后电转AAVS1-LSL-GFP质粒使LSL-GFP片段整合到AAVS1位点,基因组DNA的PCR结果显示所得到的细胞是正确整合的(图18)。
把鉴定正确的H7的PAX6-2A-Cre/AAVS1-LSL-GFP细胞系用EB法分化,并在Day17进行免疫荧光染色。从染色结果中可以看到,Day17的Dorsal NP有GFP、PAX6、Cre的阳性信号而没有NKX2.1的阳性信号,Day17的Ventral NP中有GFP、NKX2.1的阳性信号而没有PAX6和Cre的阳性信号(图19)。染色结果与H9细胞系中的一致,GFP不仅表达在Dorsal NP中,还表达在Ventral NP中,即使此时Ventral NP没有PAX6与Cre的表达。这些结果再次证明DorsalNP与Ventral NP均起源于PAX6阳性的NE,也说明采用PAX6-2A-Cre/AAVS1-LSL-GFP构建hPSCs细胞系的策略可以在体外实验中对PAX6进行谱系示踪。
实施例5
PAX6-2A-Cre/AAVS1-LSL-GFP细胞系对PAX6的体内示踪:
采用畸胎瘤形成实验,来验证PAX6-2A-Cre/AAVS1-LSL-GFP细胞是否可以在体内对PAX6进行谱系示踪。把生长状态良好的PAX6-2A-Cre/AAVS1-LSL-GFP细胞用Dispase消化后,注射进NOD/SCID小鼠背部皮下的四个点。当6~8周后小鼠皮下形成明显可见的鼓起,说明PAX6-2A-Cre/AAVS1-LSL-GFP细胞在小鼠体内生长增殖并且形成畸胎瘤。在畸胎瘤直径达到~1.5厘米时,用4%PFA灌注小鼠,取出畸胎瘤再用4%PFA固定3小时,并用含蔗糖20%、30%的PBS脱水并冷冻切片,随后进行染色鉴定。
首先对切片进行HE染色,检验形成的畸胎瘤是否具有不同胚层的组织,以及PAX6-2A-Cre/AAVS1-LSL-GFP细胞系在体内分化的能力是否在细胞系构建过程中受到影响。HE染色的结果显示,PAX6-2A-Cre/AAVS1-LSL-GFP细胞形成的畸胎瘤中含有外胚层的神经管(neural tube,NT),中胚层的软骨(cartilages,CT)和内胚层的肠道(intestine,IN)三个胚层的组织(参见图20),说明PAX6-2A-Cre/AAVS1-LSL-GFP细胞系具有体内形成畸胎瘤的能力,而且其全能性和分化能力在细胞系构建过程中没有受到影响。此外,对上述HE染色的相邻的切片进行GFP的免疫荧光染色,可以看到有GFP阳性信号的细胞只出现在NT组织中,而在中内胚层的组织中则没有GFP信号(参见图20)。
最后,为探究体内发育时,Ventral NP是否源自PAX6阳性的NE,与体外的实验结果一致,对具有NT结构的切片进行GFP、PAX6和NKX2.1的免疫荧光染色。首先通过HE染色,证明进行免疫荧光染色的组织是NT(参见图21)。随后选取HE染色相邻切片,进行免疫荧光染色。染色结果显示,PAX6阳性信号与GFP重合,NKX2.1阳性信号与GFP重合(参见图21),证明在体内所形成的Dorsal NP与Ventral NP是由PAX6阳性的NE发育而来的,因此依旧保留GFP的表达。
上述实验证明了PAX6-2A-Cre/AAVS1-LSL-GFP细胞系可以在体内形成畸胎瘤并形成三胚层组织,其分化能力与多能性没有异常。此外,通过PAX6-2A-Cre/AAVS1-LSL-GFP细胞系对PAX6的体内示踪进一步证明在体内,NT与NP同样是来自于PAX6阳性的NE,PAX6是人类NE形成中不可或缺的转录因子(参见图22)。
实施例6
构建FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系:
要构建FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系,在FOXA2-2A-Cre细胞系的基础上,电转AAVS1-LSL-GFP质粒和hAAVS1-1L-TALEN、hAAVS1-1R-TALEN质粒。经过嘌呤霉素筛选并挑取存活单克隆进行AAVS1位点的基因组PCR,所用的PCR引物对为AAVS1-F1/AAVS1-R1与AAVS1-F2/AAVS1-R2(同实施例3)。挑出成功整合LSL-GFP片段的克隆(参见图23),选取#3克隆扩大培养并用GFP Probe(同实施例1)进行SB鉴定,可以看到LSL-GFP片段没有整合其他位点发生脱靶现象(参见图24)。
FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系出现GFP错误表达:
首先将构建成功的FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系扩大培养并冻存保种,细胞经历2次传代。随后用AD法分化细胞,分化的第二天在显微镜下观察细胞,发现部分绿色细胞出现。随后复苏冻存的低代数细胞并在Day0的ES阶段和Day2的分化早期进行免疫荧光染色,检测多能性基因OCT4与FOXA2、Cre、GFP的表达情况。从OCT4染色结果可以看到,在ES阶段所有细胞表达OCT4,细胞呈现多能性状态;在Day2的早期FP中,OCT4表达量开始下降,但多数细胞的OCT4依旧处于可以被染色抗体识别的表达水平(参见图25A)。但是,Day2FP的FOXA2与Cre尽管开始表达,但没有达到用免疫荧光方法能够检测到的水平(参见图25B、图25C)。
为确定这种现象是否能在其他的细胞系中重现的,还是H9细胞系所特有的,选取另一个ES细胞系H7进行重复。在H7细胞中建立FOXA2-2A-Cre细胞系后,将LSL-GFP片段进行整合,继而得到H7的FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系,通过基因组PCR鉴定确定整合是正确的(参见图26)。
将在H7中构建的FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系进行AD法分化并在Day2用OCT4、FOXA2、Cre、GFP抗体进行免疫荧光染色鉴定,可以看到此时OCT4依旧在部分细胞中表达,而FOXA2、Cre没有阳性信号,并且GFP有阳性的结果,同时部分GFP阳性信号与OCT4阳性信号重叠(参见图27)。由此可以证明FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系在FP分化早期还没有完全退出多能性状态未进入分化进程的中间过渡状态下,就已经有GFP表达,无法对FOXA2进行正确的谱系示踪,并且这种现象能够在多个细胞系中重复,是普遍存在的。
由于在H9与H7细胞系的免疫荧光染色中都观察到OCT4信号与GFP重叠,故推测GFP的阳性信号在细胞处于多能性状态下也可以出现。因此,将H9的FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系进行连续的传代,随后发现在ES状态下,会出现表达GFP的绿色细胞,且随着传代次数的增加,绿色细胞的比例还不断上升(参见图28A)。同样的,在H7的FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系中也观察到绿色细胞出现在ES阶段,并随传代次数增加而不断增多(参见图28B)。此外,采用另一套重组酶系统Flp-FRT构建FOXA2-2A-Flp/AAVS1-FRT-STOP-FRT(FSF)-GFP细胞系,在细胞进行连续传代后,也发现GFP在ES阶段表达的现象(参见图28C),其中,FOXA2-2A-Flp/AAVS1-FRT-STOP-FRT(FSF)-GFP细胞系的构建方法参照FOXA2-2A-Cre/AAVS1-LSL-GFP细胞系,其中,FRT序列替换LoxP序列,Flp序列替换Cre序列,序列信息具体如下:
FRT序列:GAAGTTCCTATTCTCTAGAAAGTATAGGAACTTC(SEQ ID NO.20)
Flp序列:
ATGAGCCAATTTGATATATTATGTAAAACACCACCTAAGGTCCTGGTTCGTCAGTTTGTGGAAAGGTTTGAAAGACCTTCAGGGGAAAAAATAGCATCATGTGCTGCTGAACTAACCTATTTATGTTGGATGATTACTCATAACGGAACAGCAATCAAGAGAGCCACATTCATGAGCTATAATACTATCATAAGCAATTCGCTGAGTTTCGATATTGTCAACAAATCACTCCAGTTTAAATACAAGACGCAAAAAGCAACAATTCTGGAAGCCTCATTAAAGAAATTAATTCCTGCTTGGGAATTTACAATTATTCCTTACAATGGACAAAAACATCAATCTGATATCACTGATATTGTAAGTAGTTTGCAATTACAGTTCGAATCATCGGAAGAAGCAGATAAGGGAAATAGCCACAGTAAAAAAATGCTTAAAGCACTTCTAAGTGAGGGTGAAAGCATCTGGGAGATCACTGAGAAAATACTAAATTCGTTTGAGTATACCTCGAGATTTACAAAAACAAAAACTTTATACCAATTCCTCTTCCTAGCTACTTTCATCAATTGTGGAAGATTCAGCGATATTAAGAACGTTGATCCGAAATCATTTAAATTAGTCCAAAATAAGTATCTGGGAGTAATAATCCAGTGTTTAGTGACAGAGACAAAGACAAGCGTTAGTAGGCACATATACTTCTTTAGCGCAAGGGGTAGGATCGATCCACTTGTATATTTGGATGAATTTTTGAGGAACTCTGAACCAGTCCTAAAACGAGTAAATAGGACCGGCAATTCTTCAAGCAACAAACAGGAATACCAATTATTAAAAGATAACTTAGTCAGATCGTACAACAAGGCTTTGAAGAAAAATGCGCCTTATCCAATCTTTGCTATAAAGAATGGCCCAAAATCTCACATTGGAAGACATTTGATGACCTCATTTCTGTCAATGAAGGGCCTAACGGAGTTGACTAATGTTGTGGGAAATTGGAGCGATAAGCGTGCTTCTGCCGTGGCCAGGACAACGTATACTCATCAGATAACAGCAATACCTGATCACTACTTCGCACTAGTTTCTCGGTACTATGCATATGATCCAATATCAAAGGAAATGATAGCATTGAAGGATGAGACTAATCCAATTGAGGAGTGGCAGCATATAGAACAGCTAAAGGGTAGTGCTGAAGGAAGCATACGATACCCCGCATGGAATGGGATAATATCACAGGAGGTACTAGACTACCTTTCATCCTACATAAATAGACGCATA(SEQ ID NO.21)
实施例7
改变LoxP序列影响Cre重组酶的切割重组效率:
将AAVS1-LSL-GFP质粒中的第一个LoxP序列进行不同程度的突变,构建出AAVS1-LSLm1-GFP、AAVS1-LSLm2-GFP、AAVS1-LSLm3-GFP和AAVS1-LSLm4-GFP质粒,第一个LoxP序列突变后的序列具体如下所示:
LoxPm1:ATACATACGTATATATGTATATATACATATATAT(SEQ ID NO.13)
LoxPm2:ACAACCATTTATAATATATAATATATGATGTTAT(SEQ ID NO.14)
LoxPm3:ATAACCATTTATA ATGTATGC TATACGAAGTTAT(SEQ ID NO.15)
LoxPm4:ACAACTTCGTATA ATATATAA TATATGATGTTAT(SEQ ID NO.16)
为检测突变后的LSLm1、LSLm2、LSLm3和LSLm4序列与原始的LSL序列相比,被重组酶Cre重组切割效率下降多少,将100ng的AAVS1-LSL-GFP、AAVS1-LSLm1-GFP、AAVS1-LSLm2-GFP、AAVS1-LSLm3-GFP和AAVS1-LSLm4-GFP质粒分别与pLenti-Cre质粒一起转染293FT细胞,并在60h后观察统计每个视野中GFP阳性细胞的个数(图6.2)。通过统计GFP阳性细胞个数可以看到,重组效率为LSL>m4>m2>m1>m3,证明改变LoxP序列确实可以在不同程度上降低Cre与LoxP相互作用的能力。
实施例8
使用突变的LoxP序列提高FOXA2谱系示踪的精确性和特异性:
要检验突变后的低效率LoxP序列在hPSCs中是否可以真正改善FOXA2示踪细胞系的GFP泄漏表达的问题,选取AAVS1-LSLm1-GFP、AAVS1-LSLm2-GFP质粒,分别与hAAVS1-1L-TALEN、hAAVS1-1R-TALEN质粒一起电转FOXA2-2A-Cre细胞系。经过嘌呤霉素筛选并挑取存活的单克隆,进行AAVS1位点的基因组PCR,所用的PCR引物对为AAVS1-F1/AAVS1-R1与AAVS1-F2/AAVS1-R2(同实施例3)(参见图30)。随后挑选多个成功整合LSLm1-GFP、LSLm2-GFP的克隆进行后续实验。
首先将FOXA2-2A-Cre/AAVS1-LSLm2-GFP多个细胞系进行连续传代,观察在ES阶段是否有GFP阳性细胞出现。通过15次的传代,观察到在这些细胞系中均没有绿色细胞出现,证明在ES阶段经历15次传代,FOXA2-2A-Cre/AAVS1-LSLm2-GFP细胞系没有发生LSLm2的重组以及GFP的表达(参见图31)。
随后将FOXA2-2A-Cre/AAVS1-LSLm2-GFP细胞系向FP分化,在不同时间点对细胞进行免疫荧光染色鉴定。通过染色结果可以看到,在Day5FP中,FOXA2与Cre在大部分细胞中出现表达,并且在Day8、Day10、Day12出现在所有细胞中(参见图32);而GFP在Day5还无法检测到阳性信号(图32A),在Day8出现少量的阳性信号(图32B),随着分化时间的增加,绿色细胞的数目也持续增多,到Day12超过一半的细胞中都出现GFP的表达(图32C,图32D)。
随后,证明FOXA2-2A-Cre/AAVS1-LSLm1-GFP细胞系在多能性状态时没有GFP泄漏表达后,同样将细胞往FP分化。由于LSLm1的重组效率低于LSLm2,在Day12FP,其绿色细胞的数量比FOXA2-2A-Cre/AAVS1-LSLm2-GFP细胞系更少(图33)。
最后,在H7细胞中构建FOXA2-2A-Cre/AAVS1-LSLm2-GFP细胞系,验证上述结果的可重复性。将FOXA2-2A-Cre/AAVS1-LSLm2-GFP细胞系连续传代,并在FP分化的Day5、Day8、Day10和Day12进行免疫荧光染色。可以看到在Day0的ES阶段,连续传代没有出现GFP的泄漏表达现象(图34A)。在FP分化过程中,GFP细胞在Day5仅有少量出现,随着分化的进行GFP细胞逐渐增多(图34B)。这些现象与H9中的类似,再次证明低敏感性的LoxP序列在不同细胞系中具有通用性,可以对FOXA2进行正确的谱系示踪。
实施例9
构建含有CreERT2的FOXA2谱系示踪细胞系:
在选用CreERT2来替换原先的Cre重组酶的基础上,将CreERT2整合到FOXA2起始密码子后的编码区,并且仅整合两个FOXA2拷贝中的一个。这样,CreERT2的表达就受到内源FOXA2的启动子驱动,只有当FOXA2表达时,CreERT2才受FOXA2启动子驱动而表达。并且,CreERT2在没有4-OHT的情况下,只会位于细胞浆中;而当有4-OHT时,4-OHT结合ERT2引起CreERT2进入细胞核,对LSL切割重组,引起GFP表达。其中,CreERT2序列自5’端至3’端由Cre序列和ERT2序列依次连接,Cre序列如SEQ ID NO.10所示,ERT2序列具体如下:
CTCGAGCCATCTGCTGGAGACATGAGAGCTGCCAACCTTTGGCCAAGCCCGCTCATGATCAAACGCTCTAAGAAGAACAGCCTGGCCTTGTCCCTGACGGCCGACCAGATGGTCAGTGCCTTGTTGGATGCTGAGCCCCCCATACTCTATTCCGAGTATGATCCTACCAGACCCTTCAGTGAAGCTTCGATGATGGGCTTACTGACCAACCTGGCAGACAGGGAGCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTCTCGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGAACCAGGGAAAATGTGTAGAGGGCATGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGTCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCATCTGTACAGCATGAAGTGCAAGAACGTGGTGCCCCTCTATGACCTGCTGCTGGAGGCGGCGGACGCCCACCGCCTACATGCGCCCACTAGCCGTGGAGGGGCATCCGTGGAGGAGACGGACCAAAGCCACTTGGCCACTGCGGGCTCTACTTCATCGCATTCCTTGCAAAAGTATTACATCACGGGGGAGGCAGAGGGTTTCCCTGCCACAGCTTGA(SEQ ID NO.17)
针对FOXA2编码区来构建FOXA2-CreERT2细胞系的供体质粒,需要包含左右同源臂、同源臂之间的CreERT2片段和转录终止序列PA(参见图35),CreERT2片段如上所示。
将针对FOXA2起始密码子ATG附近的多个备选sgRNA分别与Cas9质粒共同转染293FT细胞并提取基因组DNA进行测序,挑选引起测序结果中引起套峰现象最明显的sgRNA(图36),抽提准备用于电转,sgRNA序列如下:
AGGGCACGAGCCGTCCGAC(SEQ ID NO.18)
为构建FOXA2-CreERT2细胞系,电转H9使用的质粒为sgRNA、pCas9-GFP、pCAG-Puro-GFP及供体FOXA2-CreERT2-PA。挑出经过嘌呤霉素筛选后存活的单克隆,进行基因组PCR鉴定。鉴定引物F1’位于5’同源臂上游,F2位于5’同源臂中,R1’位于3’同源臂下游,鉴定引物Cre-R’位于Cre片段3’端。用F2与R1’引物PCR出现条带,说明此处的基因组是没有整合外源片段的WT型;用F1’与Cre-R’引物PCR出条带,说明此处的基因组是整合外源片段的HR型(图35)。通过基因组PCR鉴定出成功整合CreERT2片段的克隆(图37),并将这些克隆扩大培养,进行下一步实验。
随后,在FOXA2-CreERT2细胞系中电转AAVS1-LSL-GFP质粒和hAAVS1-1L-TALEN、hAAVS1-1R-TALEN质粒。经过嘌呤霉素筛选并挑取存活克隆,对这些克隆进行AAVS1位点基因组PCR鉴定,所用的PCR引物对为AAVS1-F1和AAVS1-R1与AAVS1-F2和AAVS1-R2(同实施例3),挑出成功整合LSL-GFP片段的克隆(图38)。选取#4克隆扩大培养,并用GFP Probe(同实施例1)进行SB鉴定,可以看到LSL-GFP片段没有出现整合到其他位点的脱靶现象发生(图39),可以用构建的FOXA2-CreERT2/AAVS1-LSL-GFP细胞系进行下一步实验。
接下来把FOXA2-CreERT2/AAVS1-LSL-GFP细胞系进行分化,在Day6和Day12进行免疫荧光染色鉴定。为使CreERT2进入细胞核切割重组LSL序列引起GFP表达,在固定细胞进行免疫荧光染色的前两天加入4-OHT诱导CreERT2入核。从免疫荧光染色的结果可以看到,在Day6和Day12的Dorsal NP中,PAX6为阳性,FOXA2、Cre、GFP为阴性,加入4-OHT也没有出现表达绿色荧光的细胞;在Day6和Day12的FP中,FOXA2、Cre均为阳性,没有加入4-OHT时没有GFP阳性细胞,只有加入4-OHT后才出现GFP阳性细胞(图40)。
实施例10
构建含有FlpERT2的FOXA2谱系示踪细胞系:
构建FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞系并用其来进行FOXA2的谱系示踪(图41)。
在电转sgRNA、pCas9-GFP、pCAG-Puro-GFP及供体FOXA2-2A-FlpERT2质粒后(原始质粒:Addgene#14756,并参照Controlled expression of transgenes introduced by invivo electroporation.Proc Natl Acad Sci U S A 104,1027-1032),经过嘌呤霉素筛选及单克隆的基因组PCR鉴定,得到FOXA2-2A-FlpERT2细胞系(图42A)。随后在此细胞系的基础上电转AAVS1-FSF-GFP质粒和hAAVS1-1L-TALEN、hAAVS1-1R-TALEN质粒,经过药物筛选和单克隆的基因组PCR鉴定,最终得到FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞系(图42B)。
将FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞系分化为Dorsal NP与FP,在Day6和Day12进行免疫荧光染色,在固定染色的前2天加入4-OHT,诱导FlpERT2进入细胞核。从免疫荧光染色的结果可以看到,在加入4-OHT的Dorsal NP中,只有PAX6阳性细胞而没有GFP和FOXA2阳性细胞;在没有4-OHT的情况下,FP细胞中仅有FOXA2阳性细胞而没有GFP与PAX6的阳性细胞;在有4-OHT的情况下,Day6的FP均有FOXA2阳性信号及少量的GFP阳性信号,并且在Day12的FP中GFP阳性细胞比例有显著提高(图43)。
为验证FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞系是否可以用于体内的FOXA2谱系示踪,将FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞注射进NOD/SCID小鼠皮下,在形成~1.5cm畸胎瘤的时候用灌胃的方法给予TAM,并在7天后4%PFA灌注小鼠取出畸胎瘤切片染色。通过染色结果可以看到,GFP阳性信号与FOXA2阳性信号发生重叠(图44),说明FOXA2-2A-FlpERT2/AAVS1-FSF-GFP细胞系在体内对表达FOXA2的细胞进行谱系示踪。
实施例11
构建含有CreERT2的PAX6谱系示踪细胞系
为此要把基因组上两个PAX6拷贝中其中一个的起始密码子ATG替换成CreERT2-PA序列,从而构建PAX6-CreERT2细胞系(图45)。
将针对PAX6起始密码子附近ATG区域的备选sgRNA分别与Cas9质粒共同转染293FT细胞并提取基因组DNA进行测序,选择引起测序结果中套峰现象最明显的sgRNA(图46),质粒大量抽提用于下一步的电转,sgRNA序列如下:
GCCCCATATTCGAGCCCCG(SEQ ID NO.19)
为构建PAX6-CreERT2细胞系,用sgRNA、pCas9-GFP、pCAG-Puro-GFP及供体PAX6-CreERT2-PA的质粒电转H9细胞。挑出经过嘌呤霉素筛选并存活的单克隆,进行基因组PCR鉴定。鉴定引物F1’位于5’同源臂上游,R1’位于3’同源臂中,Cre-R’位于Cre片段3’端。用F1’与R1’引物PCR出现条带,则说明此处的基因组没有整合外源片段的WT型;用F1’与Cre-R’引物PCR出现条带则,说明此处的基因组是整合外源片段的HR型(图45)。通过基因组PCR鉴定出整合一条PAX6染色体的克隆(图47),并将这些克隆扩大培养进行下一步实验。
随后,在PAX6-CreERT2细胞系的基础上电转AAVS1-LSL-GFP质粒和hAAVS1-1L-TALEN、hAAVS1-1R-TALEN质粒。经过嘌呤霉素筛选并挑取单克隆,进行AAVS1位点基因组PCR,所用的PCR引物对为AAVS1-F1和AAVS1-R1与AAVS1-F2和AAVS1-R2(同实施例3),挑出成功整合LSL-GFP的克隆(图48)。选取#4克隆扩大培养,并用GFP Probe(同实施例1)进行SB鉴定,可以看到LSL-GFP片段没有整合其他位点发生脱靶现象(图49),说明所构建的PAX6-CreERT2/AAVS1-LSL-GFP细胞系是整合正确的,可以用来对PAX6进行谱系示踪。
首先示踪Day10的NE,在Day8加入4-OHT持续至Day10,随后撤除4-OHT,将NE细胞往Dorsal NP和Ventral NP分化,在Day17进行免疫荧光染色。从染色结果中可以看到,Day17的Dorsal NP和Ventral NP均有GFP表达,同时其各自特异的标志基因PAX6和NKX2.1也均为阳性(图50),说明Dorsal NP和Ventral NP都来自于Day10的PAX6+NE,与PAX6-2A-Cre/AAVS1-LSL-GFP细胞系谱系示踪的结论一致。
随后,为标记NP细胞,在Day15加入4-OHT并在Day17进行免疫荧光染色。可以看到,没有加入4-OHT的Dorsal NP仅有PAX6和Cre表达,没有GFP阳性信号;加入4-OHT的VentralNP仅有NKX2.1表达,没有GFP、PAX6、Cre阳性信号;只有当加入4-OHT的时候,Dorsal NP才出现GFP阳性信号,并且Cre信号更多的分布在细胞核中(图51)。这些结果说明在从NE向NP分化时,PAX6由NE的标志基因变成Dorsal NP的标记基因,其不再分布于所有类型的NP中。这些结果展示CreERT2系统由于其在时间上的可控性,让PAX6-CreERT2/AAVS1-LSL-GFP细胞系可以用来标记不同时间点表达PAX6的不同类型细胞(图52)。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
序列表
<110> 同济大学
<120> 人多能干细胞中的谱系示踪系统的构建与应用
<160> 28
<170> SIPOSequenceListing 1.0
<210> 1
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ataacttcgt ataatgtatg ctatacgaag ttat 34
<210> 2
<211> 837
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tcgcgatgaa taaatgaaag cttgcagatc tgcgactcta gaggatctgc gactctagag 60
gatcataatc agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca 120
cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 180
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 240
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 300
ctgcgactct agaggatcat aatcagccat accacatttg tagaggtttt acttgcttta 360
aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt 420
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 480
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 540
tatcatgtct ggatctgcga ctctagagga tcataatcag ccataccaca tttgtagagg 600
ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg 660
caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 720
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 780
tcatcaatgt atcttatcat gtctggatcc ccatcaagct gatccggaac ccttaat 837
<210> 3
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cttccgcatt ggagtcgctt ta 22
<210> 4
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cagccggtcc tggactttgt c 21
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
acaggaggtg ggggttagac 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
agccgggaac cgctcaactc 20
<210> 7
<211> 556
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tttctgtctg cagcttgtgg cctgggtcac ctctacggct ggcccagatc cttccctgcc 60
gcctccttca ggttccgtct tcctccactc cctcttcccc ttgctctctg ctgtgttgct 120
gcccaaggat gctctttccg gagcacttcc ttctcggcgc tgcaccacgt gatgtcctct 180
gagcggatcc tccccgtgtc tgggtcctct ccgggcatct ctcctccctc acccaacccc 240
atgccgtctt cactcgctgg gttccctttt ccttctcctt ctggggcctg tgccatctct 300
cgtttcttag gatggccttc tccgacggat gtctcccttg cgtcccgcct ccccttcttg 360
taggcctgca tcatcaccgt ttttctggac aaccccaaag taccccgtct ccctggcttt 420
agccacctct ccatcctctt gctttctttg cctggacacc ccgttctcct gtggattcgg 480
gtcacctctc actcctttca tttgggcagc tcccctaccc cccttacctc tctagtctgt 540
gctagctctt ccagcc 556
<210> 8
<211> 608
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 60
agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 120
tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 180
acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 240
aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 300
accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 360
tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 420
tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 480
actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 540
tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 600
tggagttc 608
<210> 9
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gccactaact tctccctgtt gaaacaagca ggggatgtcg aagagaatcc cgggcca 57
<210> 10
<211> 1029
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atgtccaatt tactgaccgt acaccaaaat ttgcctgcat taccggtcga tgcaacgagt 60
gatgaggttc gcaagaacct gatggacatg ttcagggatc gccaggcgtt ttctgagcat 120
acctggaaaa tgcttctgtc cgtttgccgg tcgtgggcgg catggtgcaa gttgaataac 180
cggaaatggt ttcccgcaga acctgaagat gttcgcgatt atcttctata tcttcaggcg 240
cgcggtctgg cagtaaaaac tatccagcaa catttgggcc agctaaacat gcttcatcgt 300
cggtccgggc tgccacgacc aagtgacagc aatgctgttt cactggttat gcggcggatc 360
cgaaaagaaa acgttgatgc cggtgaacgt gcaaaacagg ctctagcgtt cgaacgcact 420
gatttcgacc aggttcgttc actcatggaa aatagcgatc gctgccagga tatacgtaat 480
ctggcatttc tggggattgc ttataacacc ctgttacgta tagccgaaat tgccaggatc 540
agggttaaag atatctcacg tactgacggt gggagaatgt taatccatat tggcagaacg 600
aaaacgctgg ttagcaccgc aggtgtagag aaggcactta gcctgggggt aactaaactg 660
gtcgagcgat ggatttccgt ctctggtgta gctgatgatc cgaataacta cctgttttgc 720
cgggtcagaa aaaatggtgt tgccgcgcca tctgccacca gccagctatc aactcgcgcc 780
ctggaaggga tttttgaagc aactcatcga ttgatttacg gcgctaagga tgactctggt 840
cagagatacc tggcctggtc tggacacagt gcccgtgtcg gagccgcgcg agatatggcc 900
cgcgctggag tttcaatacc ggagatcatg caagctggtg gctggaccaa tgtaaatatt 960
gtcatgaact atatccgtaa cctggatagt gaaacagggg caatggtgcg cctgctggaa 1020
gatggcgat 1029
<210> 11
<211> 2985
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gaacagtcag ccaatgggca cctcgggcac cacttcaaca ggtgagccac tgctttctgc 60
aggctgcaca gaggcgatct ctcttcacta gaagtttacc caaacagaat ctcctggtct 120
tatgggaggg cgtgtttaac tccttgcttt ccttgtccct gggggatggg gattgaaaag 180
ggaaattcag ttaagctaat tagtaacttt acaccatata gacaaaaact aaaattgttt 240
ttcctgaatt tggtcacaaa agttgtgtat gaagacaagg cctgagactg caagttttct 300
gaggacagat tattagacga agctcagtag ggggcccact gagctgtagg tgcgtgcttg 360
ttgaaatgct tcttgccctc atagctcctc tagacctttt gctggaaata aaaagtgaca 420
cattggtttt ccagagacag ctttattgta aaagttccaa acatgcaaac aaacagagga 480
tttttttttt cttttccttt ggattggggt ggggggtact tgggatccaa taggtatata 540
tacatatatt gtctagtttc tgaaggtgct acttttattt gtaacaattg aagtgatttt 600
aatacagtaa aaaatgttag aaagtattag tttttttttt tttttttttt tttgtaaacc 660
tataaatttg tattccatgt ctgtttctca aagggaatat ctacatggct atttctttca 720
tccacttcta ggactcattt cccctggtgt gtcagttcca gttcaagttc ccggaagtga 780
acctgatatg tctcaatact ggccaagatt acaggctagc gccactaact tctccctgtt 840
gaaacaagca ggggatgtcg aagagaatcc cgggccaatg tccaatttac tgaccgtaca 900
ccaaaatttg cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat 960
ggacatgttc agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt 1020
ttgccggtcg tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc 1080
tgaagatgtt cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat 1140
ccagcaacat ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag 1200
tgacagcaat gctgtttcac tggttatgcg gcggatccga aaagaaaacg ttgatgccgg 1260
tgaacgtgca aaacaggctc tagcgttcga acgcactgat ttcgaccagg ttcgttcact 1320
catggaaaat agcgatcgct gccaggatat acgtaatctg gcatttctgg ggattgctta 1380
taacaccctg ttacgtatag ccgaaattgc caggatcagg gttaaagata tctcacgtac 1440
tgacggtggg agaatgttaa tccatattgg cagaacgaaa acgctggtta gcaccgcagg 1500
tgtagagaag gcacttagcc tgggggtaac taaactggtc gagcgatgga tttccgtctc 1560
tggtgtagct gatgatccga ataactacct gttttgccgg gtcagaaaaa atggtgttgc 1620
cgcgccatct gccaccagcc agctatcaac tcgcgccctg gaagggattt ttgaagcaac 1680
tcatcgattg atttacggcg ctaaggatga ctctggtcag agatacctgg cctggtctgg 1740
acacagtgcc cgtgtcggag ccgcgcgaga tatggcccgc gctggagttt caataccgga 1800
gatcatgcaa gctggtggct ggaccaatgt aaatattgtc atgaactata tccgtaacct 1860
ggatagtgaa acaggggcaa tggtgcgcct gctggaagat ggcgatctgt gccttctagt 1920
tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 1980
cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 2040
tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 2100
aggcatgctg gggatgcggt gggctctatg gggcgcgcca aaaaaaaaaa aaaaaaaaaa 2160
ggaaaggaaa tattgtgtta attcagtcag tgactatggg gacacaacag ttgagctttc 2220
aggaaagaaa gaaaaatggc tgttagagcc gcttcagttc tacaattgtg tcctgtattg 2280
taccactggg gaaggaatgg acttgaaaca aggacctttg tatacagaag gcacgatatc 2340
agttggaaca aatcttcatt ttggtatcca aacttttatt cattttggtg tattatttgt 2400
aaatgggcat ttgtatgtta taatgaaaaa aagaacaatg tagactggat ggatgtttga 2460
tctgtgttgg tcatgaagtt gttttttttt tttttaaaaa gaaaaccatg atcaacaagc 2520
tttgccacga atttaagagt tttatcaaga tatatcgaat acttctaccc atctgttcat 2580
agtttatgga ctgatgttcc aagtttgtat cattcctttg catataatta aacctggaac 2640
aacatgcact agatttatgt cagaaatatc tgttggtttt ccaaaggttg ttaacagatg 2700
aagtttatgt gcaaaaaagg gtaagatata aattcaagga agaaaaaaag ttgatagcta 2760
aaaggtagag tgtgtcttcg atataatcca atttgtttta tgtcaaaatg taagtatttg 2820
tcttccctag aaatcctcag aatgatttct ataataaagt taatttcatt tatatttgac 2880
aagaatatag atgttttata cacattttca tgcaatcata cgtttctttt ttggccagca 2940
aaagttaatt gttcttagat atagttgtat tactgttcac ggtcc 2985
<210> 12
<211> 2853
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
atccagcaga gccccaacaa gatgctgacg ctgagcgaga tctaccagtg gatcatggac 60
ctcttcccct tctaccggca gaaccagcag cgctggcaga actccatccg ccactcgctc 120
tccttcaacg actgtttcct gaaggtgccc cgctcgcccg acaagcccgg caagggctcc 180
ttctggaccc tgcaccctga ctcgggcaac atgttcgaga acggctgcta cctgcgccgc 240
cagaagcgct tcaagtgcga gaagcagctg gcgctgaagg aggccgcagg cgccgccggc 300
agcggcaaga aggcggccgc cggagcccag gcctcacagg ctcaactcgg ggaggccgcc 360
gggccggcct ccgagactcc ggcgggcacc gagtcgcctc actcgagcgc ctccccgtgc 420
caggagcaca agcgaggggg cctgggagag ctgaagggga cgccggctgc ggcgctgagc 480
cccccagagc cggcgccctc tcccgggcag cagcagcagg ccgcggccca cctgctgggc 540
ccgccccacc acccgggcct gccgcctgag gcccacctga agccggaaca ccactacgcc 600
ttcaaccacc cgttctccat caacaacctc atgtcctcgg agcagcagca ccaccacagc 660
caccaccacc accaacccca caaaatggac ctcaaggcct acgaacaggt gatgcactac 720
cccggctacg gttcccccat gcctggcagc ttggccatgg gcccggtcac gaacaaaacg 780
ggcctggacg cctcgcccct ggccgcagat acctcctact accagggggt gtactcccgg 840
cccattatga actcctctgc tagcgccact aacttctccc tgttgaaaca agcaggggat 900
gtcgaagaga atcccgggcc aatgtccaat ttactgaccg tacaccaaaa tttgcctgca 960
ttaccggtcg atgcaacgag tgatgaggtt cgcaagaacc tgatggacat gttcagggat 1020
cgccaggcgt tttctgagca tacctggaaa atgcttctgt ccgtttgccg gtcgtgggcg 1080
gcatggtgca agttgaataa ccggaaatgg tttcccgcag aacctgaaga tgttcgcgat 1140
tatcttctat atcttcaggc gcgcggtctg gcagtaaaaa ctatccagca acatttgggc 1200
cagctaaaca tgcttcatcg tcggtccggg ctgccacgac caagtgacag caatgctgtt 1260
tcactggtta tgcggcggat ccgaaaagaa aacgttgatg ccggtgaacg tgcaaaacag 1320
gctctagcgt tcgaacgcac tgatttcgac caggttcgtt cactcatgga aaatagcgat 1380
cgctgccagg atatacgtaa tctggcattt ctggggattg cttataacac cctgttacgt 1440
atagccgaaa ttgccaggat cagggttaaa gatatctcac gtactgacgg tgggagaatg 1500
ttaatccata ttggcagaac gaaaacgctg gttagcaccg caggtgtaga gaaggcactt 1560
agcctggggg taactaaact ggtcgagcga tggatttccg tctctggtgt agctgatgat 1620
ccgaataact acctgttttg ccgggtcaga aaaaatggtg ttgccgcgcc atctgccacc 1680
agccagctat caactcgcgc cctggaaggg atttttgaag caactcatcg attgatttac 1740
ggcgctaagg atgactctgg tcagagatac ctggcctggt ctggacacag tgcccgtgtc 1800
ggagccgcgc gagatatggc ccgcgctgga gtttcaatac cggagatcat gcaagctggt 1860
ggctggacca atgtaaatat tgtcatgaac tatatccgta acctggatag tgaaacaggg 1920
gcaatggtgc gcctgctgga agatggcgat ctgtgccttc tagttgccag ccatctgttg 1980
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2040
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2100
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2160
cggtgggctc tatggggcgc gccgaagacg acggcttcag gcccggctaa ctctggcacc 2220
ccggatcgag gacaagtgag agagcaagtg ggggtcgaga ctttggggag acggtgttgc 2280
agagacgcaa gggagaagaa atccataaca cccccacccc aacaccccca agacagcagt 2340
cttcttcacc cgctgcagcc gttccgtccc aaacagaggg ccacacagat accccacgtt 2400
ctatataagg aggaaaacgg gaaagaatat aaagttaaaa aaaagcctcc ggtttccact 2460
actgtgtaga ctcctgcttc ttcaagcacc tgcagattct gatttttttg ttgttgttgt 2520
tctcctccat tgctgttgtt gcagggaagt cttacttaaa aaaaaaaaaa aattttgtga 2580
gtgactcggt gtaaaaccat gtagttttaa cagaaccaga gggttgtact attgtttaaa 2640
aacaggaaaa aaaataatgt aagggtctgt tgtaaatgac caagaaaaag aaaaaaaaag 2700
cattcccaat cttgacacgg tgaaatccag gtctcgggtc cgattaattt atggtttctg 2760
cgtgctttat ttatggctta taaatgtgta ttctggctgc aagggccaga gttccacaaa 2820
tctatattaa agtgttatac ccggttttat ccc 2853
<210> 13
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atacatacgt atatatgtat atatacatat atat 34
<210> 14
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
acaaccattt ataatatata atatatgatg ttat 34
<210> 15
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ataaccattt ataatgtatg ctatacgaag ttat 34
<210> 16
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
acaacttcgt ataatatata atatatgatg ttat 34
<210> 17
<211> 954
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ctcgagccat ctgctggaga catgagagct gccaaccttt ggccaagccc gctcatgatc 60
aaacgctcta agaagaacag cctggccttg tccctgacgg ccgaccagat ggtcagtgcc 120
ttgttggatg ctgagccccc catactctat tccgagtatg atcctaccag acccttcagt 180
gaagcttcga tgatgggctt actgaccaac ctggcagaca gggagctggt tcacatgatc 240
aactgggcga agagggtgcc aggctttgtg gatttgaccc tccatgatca ggtccacctt 300
ctagaatgtg cctggctaga gatcctgatg attggtctcg tctggcgctc catggagcac 360
ccagtgaagc tactgtttgc tcctaacttg ctcttggaca ggaaccaggg aaaatgtgta 420
gagggcatgg tggagatctt cgacatgctg ctggctacat catctcggtt ccgcatgatg 480
aatctgcagg gagaggagtt tgtgtgcctc aaatctatta ttttgcttaa ttctggagtg 540
tacacatttc tgtccagcac cctgaagtct ctggaagaga aggaccatat ccaccgagtc 600
ctggacaaga tcacagacac tttgatccac ctgatggcca aggcaggcct gaccctgcag 660
cagcagcacc agcggctggc ccagctcctc ctcatcctct cccacatcag gcacatgagt 720
aacaaaggca tggagcatct gtacagcatg aagtgcaaga acgtggtgcc cctctatgac 780
ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc ccactagccg tggaggggca 840
tccgtggagg agacggacca aagccacttg gccactgcgg gctctacttc atcgcattcc 900
ttgcaaaagt attacatcac gggggaggca gagggtttcc ctgccacagc ttga 954
<210> 18
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
agggcacgag ccgtccgac 19
<210> 19
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gccccatatt cgagccccg 19
<210> 20
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gaagttccta ttctctagaa agtataggaa cttc 34
<210> 21
<211> 1269
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
atgagccaat ttgatatatt atgtaaaaca ccacctaagg tcctggttcg tcagtttgtg 60
gaaaggtttg aaagaccttc aggggaaaaa atagcatcat gtgctgctga actaacctat 120
ttatgttgga tgattactca taacggaaca gcaatcaaga gagccacatt catgagctat 180
aatactatca taagcaattc gctgagtttc gatattgtca acaaatcact ccagtttaaa 240
tacaagacgc aaaaagcaac aattctggaa gcctcattaa agaaattaat tcctgcttgg 300
gaatttacaa ttattcctta caatggacaa aaacatcaat ctgatatcac tgatattgta 360
agtagtttgc aattacagtt cgaatcatcg gaagaagcag ataagggaaa tagccacagt 420
aaaaaaatgc ttaaagcact tctaagtgag ggtgaaagca tctgggagat cactgagaaa 480
atactaaatt cgtttgagta tacctcgaga tttacaaaaa caaaaacttt ataccaattc 540
ctcttcctag ctactttcat caattgtgga agattcagcg atattaagaa cgttgatccg 600
aaatcattta aattagtcca aaataagtat ctgggagtaa taatccagtg tttagtgaca 660
gagacaaaga caagcgttag taggcacata tacttcttta gcgcaagggg taggatcgat 720
ccacttgtat atttggatga atttttgagg aactctgaac cagtcctaaa acgagtaaat 780
aggaccggca attcttcaag caacaaacag gaataccaat tattaaaaga taacttagtc 840
agatcgtaca acaaggcttt gaagaaaaat gcgccttatc caatctttgc tataaagaat 900
ggcccaaaat ctcacattgg aagacatttg atgacctcat ttctgtcaat gaagggccta 960
acggagttga ctaatgttgt gggaaattgg agcgataagc gtgcttctgc cgtggccagg 1020
acaacgtata ctcatcagat aacagcaata cctgatcact acttcgcact agtttctcgg 1080
tactatgcat atgatccaat atcaaaggaa atgatagcat tgaaggatga gactaatcca 1140
attgaggagt ggcagcatat agaacagcta aagggtagtg ctgaaggaag catacgatac 1200
cccgcatgga atgggataat atcacaggag gtactagact acctttcatc ctacataaat 1260
agacgcata 1269
<210> 22
<211> 720
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 23
<211> 1431
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
atggtgagca agggcgagga ggtcatcaaa gagttcatgc gcttcaaggt gcgcatggag 60
ggctccatga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120
ggcacccaga ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180
atcctgtccc cccagttcat gtacggctcc aaggcgtacg tgaagcaccc cgccgacatc 240
cccgattaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300
gaggacggcg gtctggtgac cgtgacccag gactcctccc tgcaggacgg cacgctgatc 360
tacaaggtga agatgcgcgg caccaacttc ccccccgacg gccccgtaat gcagaagaag 420
accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480
gagatccacc aggccctgaa gctgaaggac ggcggccact acctggtgga gttcaagacc 540
atctacatgg ccaagaagcc cgtgcaactg cccggctact actacgtgga caccaagctg 600
gacatcacct cccacaacga ggactacacc atcgtggaac agtacgagcg ctccgagggc 660
cgccaccacc tgttcctggg gcatggcacc ggcagcaccg gcagcggcag ctccggcacc 720
gcctcctccg aggacaacaa catggccgtc atcaaagagt tcatgcgctt caaggtgcgc 780
atggagggct ccatgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc 840
tacgagggca cccagaccgc caagctgaag gtgaccaagg gcggccccct gcccttcgcc 900
tgggacatcc tgtcccccca gttcatgtac ggctccaagg cgtacgtgaa gcaccccgcc 960
gacatccccg attacaagaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg 1020
aacttcgagg acggcggtct ggtgaccgtg acccaggact cctccctgca ggacggcacg 1080
ctgatctaca aggtgaagat gcgcggcacc aacttccccc ccgacggccc cgtaatgcag 1140
aagaagacca tgggctggga ggcctccacc gagcgcctgt acccccgcga cggcgtgctg 1200
aagggcgaga tccaccaggc cctgaagctg aaggacggcg gccactacct ggtggagttc 1260
aagaccatct acatggccaa gaagcccgtg caactgcccg gctactacta cgtggacacc 1320
aagctggaca tcacctccca caacgaggac tacaccatcg tggaacagta cgagcgctcc 1380
gagggccgcc accacctgtt cctgtacggc atggacgagc tgtacaagta a 1431
<210> 24
<211> 936
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
atgacttcga aagtttatga tccagaacaa aggaaacgga tgataactgg tccgcagtgg 60
tgggccagat gtaaacaaat gaatgttctt gattcattta ttaattatta tgattcagaa 120
aaacatgcag aaaatgctgt tattttttta catggtaacg cggcctcttc ttatttatgg 180
cgacatgttg tgccacatat tgagccagta gcgcggtgta ttataccaga ccttattggt 240
atgggcaaat caggcaaatc tggtaatggt tcttataggt tacttgatca ttacaaatat 300
cttactgcat ggtttgaact tcttaattta ccaaagaaga tcatttttgt cggccatgat 360
tggggtgctt gtttggcatt tcattatagc tatgagcatc aagataagat caaagcaata 420
gttcacgctg aaagtgtagt agatgtgatt gaatcatggg atgaatggcc tgatattgaa 480
gaagatattg cgttgatcaa atctgaagaa ggagaaaaaa tggttttgga gaataacttc 540
ttcgtggaaa ccatgttgcc atcaaaaatc atgagaaagt tagaaccaga agaatttgca 600
gcatatcttg aaccattcaa agagaaaggt gaagttcgtc gtccaacatt atcatggcct 660
cgtgaaatcc cgttagtaaa aggtggtaaa cctgacgttg tacaaattgt taggaattat 720
aatgcttatc tacgtgcaag tgatgattta ccaaaaatgt ttattgaatc ggacccagga 780
ttcttttcca atgctattgt tgaaggtgcc aagaagtttc ctaatactga atttgtcaaa 840
gtaaaaggtc ttcatttttc gcaagaagat gcacctgatg aaatgggaaa atatatcaaa 900
tcgttcgttg agcgagttct caaaaatgaa caataa 936
<210> 25
<211> 1653
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720
gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780
cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840
aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900
attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960
aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020
gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080
gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140
acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt 1200
tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260
ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct 1320
ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa 1380
caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt 1440
cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat 1500
tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac 1560
gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata 1620
aaggccaaga agggcggaaa gatcgccgtg taa 1653
<210> 26
<211> 3048
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 60
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 120
caacagttgc gcagcctgaa tggcgaatgg cgctttgcct ggtttccggc accagaagcg 180
gtgccggaaa gctggctgga gtgcgatctt cctgaggccg atactgtcgt cgtcccctca 240
aactggcaga tgcacggtta cgatgcgccc atctacacca acgtgaccta tcccattacg 300
gtcaatccgc cgtttgttcc cacggagaat ccgacgggtt gttactcgct cacatttaat 360
gttgatgaaa gctggctaca ggaaggccag acgcgaatta tttttgatgg cgttaactcg 420
gcgtttcatc tgtggtgcaa cgggcgctgg gtcggttacg gccaggacag tcgtttgccg 480
tctgaatttg acctgagcgc atttttacgc gccggagaaa accgcctcgc ggtgatggtg 540
ctgcgctgga gtgacggcag ttatctggaa gatcaggata tgtggcggat gagcggcatt 600
ttccgtgacg tctcgttgct gcataaaccg actacacaaa tcagcgattt ccatgttgcc 660
actcgcttta atgatgattt cagccgcgct gtactggagg ctgaagttca gatgtgcggc 720
gagttgcgtg actacctacg ggtaacagtt tctttatggc agggtgaaac gcaggtcgcc 780
agcggcaccg cgcctttcgg cggtgaaatt atcgatgagc gtggtggtta tgccgatcgc 840
gtcacactac gtctgaacgt cgaaaacccg aaactgtgga gcgccgaaat cccgaatctc 900
tatcgtgcgg tggttgaact gcacaccgcc gacggcacgc tgattgaagc agaagcctgc 960
gatgtcggtt tccgcgaggt gcggattgaa aatggtctgc tgctgctgaa cggcaagccg 1020
ttgctgattc gaggcgttaa ccgtcacgag catcatcctc tgcatggtca ggtcatggat 1080
gagcagacga tggtgcagga tatcctgctg atgaagcaga acaactttaa cgccgtgcgc 1140
tgttcgcatt atccgaacca tccgctgtgg tacacgctgt gcgaccgcta cggcctgtat 1200
gtggtggatg aagccaatat tgaaacccac ggcatggtgc caatgaatcg tctgaccgat 1260
gatccgcgct ggctaccggc gatgagcgaa cgcgtaacgc gaatggtgca gcgcgatcgt 1320
aatcacccga gtgtgatcat ctggtcgctg gggaatgaat caggccacgg cgctaatcac 1380
gacgcgctgt atcgctggat caaatctgtc gatccttccc gcccggtgca gtatgaaggc 1440
ggcggagccg acaccacggc caccgatatt atttgcccga tgtacgcgcg cgtggatgaa 1500
gaccagccct tcccggctgt gccgaaatgg tccatcaaaa aatggctttc gctacctgga 1560
gagacgcgcc cgctgatcct ttgcgaatac gcccacgcga tgggtaacag tcttggcggt 1620
ttcgctaaat actggcaggc gtttcgtcag tatccccgtt tacagggcgg cttcgtctgg 1680
gactgggtgg atcagtcgct gattaaatat gatgaaaacg gcaacccgtg gtcggcttac 1740
ggcggtgatt ttggcgatac gccgaacgat cgccagttct gtatgaacgg tctggtcttt 1800
gccgaccgca cgccgcatcc agcgctgacg gaagcaaaac accagcagca gtttttccag 1860
ttccgtttat ccgggcaaac catcgaagtg accagcgaat acctgttccg tcatagcgat 1920
aacgagctcc tgcactggat ggtggcgctg gatggtaagc cgctggcaag cggtgaagtg 1980
cctctggatg tcgctccaca aggtaaacag ttgattgaac tgcctgaact accgcagccg 2040
gagagcgccg ggcaactctg gctcacagta cgcgtagtgc aaccgaacgc gaccgcatgg 2100
tcagaagccg ggcacatcag cgcctggcag cagtggcgtc tggcggaaaa cctcagtgtg 2160
acgctccccg ccgcgtccca cgccatcccg catctgacca ccagcgaaat ggatttttgc 2220
atcgagctgg gtaataagcg ttggcaattt aaccgccagt caggctttct ttcacagatg 2280
tggattggcg ataaaaaaca actgctgacg ccgctgcgcg atcagttcac ccgtgcaccg 2340
ctggataacg acattggcgt aagtgaagcg acccgcattg accctaacgc ctgggtcgaa 2400
cgctggaagg cggcgggcca ttaccaggcc gaagcagcgt tgttgcagtg cacggcagat 2460
acacttgctg atgcggtgct gattacgacc gctcacgcgt ggcagcatca ggggaaaacc 2520
ttatttatca gccggaaaac ctaccggatt gatggtagtg gtcaaatggc gattaccgtt 2580
gatgttgaag tggcgagcga tacaccgcat ccggcgcgga ttggcctgaa ctgccagctg 2640
gcgcaggtag cagagcgggt aaactggctc ggattagggc cgcaagaaaa ctatcccgac 2700
cgccttactg ccgcctgttt tgaccgctgg gatctgccat tgtcagacat gtataccccg 2760
tacgtcttcc cgagcgaaaa cggtctgcgc tgcgggacgc gcgaattgaa ttatggccca 2820
caccagtggc gcggcgactt ccagttcaac atcagccgct acagtcaaca gcaactgatg 2880
gaaaccagcc atcgccatct gctgcacgcg gaagaaggca catggctgaa tatcgacggt 2940
ttccatatgg ggattggtgg cgacgactcc tggagcccgt cagtatcggc ggaattccag 3000
ctgagcgccg gtcgctacca ttaccagttg gtctggtgtc aaaaataa 3048
<210> 27
<211> 1726
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 720
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 780
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 840
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 900
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 960
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 1020
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 1080
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 1140
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 1200
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 1260
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 1320
cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 1380
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 1440
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 1500
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc 1560
gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt 1620
gaccggcggc tctagtgcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct 1680
cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaa 1726
<210> 28
<211> 600
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
atgaccgagt acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta 60
cgcaccctcg ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac 120
cgccacatcg agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac 180
atcggcaagg tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag 240
agcgtcgaag cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt 300
tcccggctgg ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag 360
cccgcgtggt tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc 420
agcgccgtcg tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg 480
gagacctccg cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc 540
gacgtcgagg tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga 600

Claims (6)

1.一种非用于疾病的诊断和/或治疗的谱系示踪方法,包括:通过谱系示踪系统进行谱系示踪,所述谱系示踪系统的构建方法包括:
将人多能干细胞的重组酶驱动基因中整合重组酶基因片段;
将染色体开放位点AAVS1整合报告基因系统,所述报告基因系统包括转录终止调控元件片段、报告基因片段和启动子,所述转录终止调控元件片段与所述重组酶相对应;
所述染色体开放位点AAVS1整合报告基因系统的位点为第24285到24303碱基区域;
所述重组酶基因片段还包括诱导片段,所述诱导片段为ERT2片段;
所述重组酶驱动基因选自PAX6或FOXA2;
所述重组酶基因片段包括重组酶片段。
2.如权利要求1所述的谱系示踪方法,其特征在于,所述重组酶选自Cre或Flp。
3.如权利要求1所述的谱系示踪方法,其特征在于,所述重组酶基因片段还包括2A片段。
4.如权利要求1所述的谱系示踪方法,其特征在于,所述转录终止调控元件片段选自LSL片段或FSF片段。
5.如权利要求4所述的谱系示踪方法,其特征在于,所述LSL片段中,STOP序列如SEQIDNO.2所示,所述LoxP序列如SEQ ID NO.1所示的序列;
和/或,所述FSF片段中,STOP序列如SEQ ID NO.2所示,FRT序列如SEQ ID NO.20所示。
6.如权利要求1所述的谱系示踪方法,其特征在于,所述报告基因片段选自GFP片段、红色荧光蛋白tdTomato片段、萤火虫荧光素酶片段或半乳糖苷酶片段中的一种或多种的组合;
和/或,所述启动子选自CAG启动子、CMV启动子,UBC启动子或EF1α启动子;
和/或,报告基因系统还包括抗性基因,所述抗性基因选自嘌呤霉素、杀稻瘟菌素、新霉素或博莱霉素中的一种或多种的组合。
CN201811132450.0A 2018-09-27 2018-09-27 人多能干细胞中的谱系示踪系统的构建与应用 Active CN109321599B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811132450.0A CN109321599B (zh) 2018-09-27 2018-09-27 人多能干细胞中的谱系示踪系统的构建与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811132450.0A CN109321599B (zh) 2018-09-27 2018-09-27 人多能干细胞中的谱系示踪系统的构建与应用

Publications (2)

Publication Number Publication Date
CN109321599A CN109321599A (zh) 2019-02-12
CN109321599B true CN109321599B (zh) 2023-08-22

Family

ID=65265589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811132450.0A Active CN109321599B (zh) 2018-09-27 2018-09-27 人多能干细胞中的谱系示踪系统的构建与应用

Country Status (1)

Country Link
CN (1) CN109321599B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112852746A (zh) * 2021-02-04 2021-05-28 中吉智药(南京)生物技术有限公司 基于Cre重组酶诱导的大规模慢病毒基因药物制备系统及方法
CN113355294A (zh) * 2021-06-03 2021-09-07 杭州致祺生物科技有限公司 一种检测真核细胞遗传毒性的体系和真核细胞遗传毒性的检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017522016A (ja) * 2014-06-27 2017-08-10 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 培養哺乳動物輪部幹細胞、その産生方法及びその使用
KR20180101535A (ko) * 2016-01-26 2018-09-12 세다르스-신나이 메디칼 센터 생체내 이중 재조합효소-매개된 카세트 교환 (dRMCE)을 위한 시스템과 방법 및 이들의 질환 모형

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ludovic Vallier等.An efficient system for conditional gene expression in embryonic stem cells and in their in vitro and in vivo differentiated derivative.《Proceedings of the National Academy of Sciences》.2001,第98卷(第98期),第2469页Fig. 1. *

Also Published As

Publication number Publication date
CN109321599A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
JP4901471B2 (ja) 体細胞核初期化物質のスクリーニング方法
Wilber et al. Efficient and stable transgene expression in human embryonic stem cells using transposon-mediated gene transfer
US20230322956A1 (en) Compositions and methods for making antibodies based on use of an expression-enhancing locus
US20170233765A1 (en) Non-disruptive gene targeting
KR20220032050A (ko) 조작된 casx 시스템
KR20200132849A (ko) CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
KR20170096999A (ko) 신규한 cho 통합 부위 및 이의 용도
KR20220038362A (ko) 재조합 ad35 벡터 및 관련 유전자 요법 개선
Hofemeister et al. Recombineering, transfection, Western, IP and ChIP methods for protein tagging via gene targeting or BAC transgenesis
JP2023014185A (ja) 哺乳動物合成染色体の構築をリアルタイムでモニタリングするための、及び哺乳動物合成染色体を生体工学的に操作するための組成物及び方法
EP3359676B1 (en) Transposon system, kit comprising the same, and uses thereof
US20170298384A1 (en) Stem cell gene targeting
CN109321599B (zh) 人多能干细胞中的谱系示踪系统的构建与应用
KR20190122232A (ko) 망막층간분리증의 비인간 동물 모델
US20210032612A1 (en) CRISPR/Cas9 Systems, and Methods of Use Thereof
JP2019503653A (ja) トランスポゾン系、それを含むキット及びそれらの使用
KR20230029603A (ko) 필수 유전자 녹-인에 의한 선택
JP2021513847A (ja) 相同性非依存的ユニバーサルゲノムエンジニアリングテクノロジーを用いた遺伝子編集
JP2002512787A (ja) 幹細胞を得る方法
KR20220108041A (ko) 지속된 트랜스진 발현을 갖는 세포
US20040241851A1 (en) Conditional knockout method for gene trapping and gene targeting using an inducible gene silencer
CN108949756B (zh) 一种斑马鱼心脏特异表达模型的构建方法及相关载体
JP7055469B2 (ja) ホモ接合型細胞の作製方法
JP4624100B2 (ja) 胚性幹細胞から分化した目的細胞の選別的単離又は可視化方法及び単離又は可視化用キット
JP2004500879A (ja) 腎の調節エレメントおよびそれらの使用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant