CN110862984B - 一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用 - Google Patents
一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用 Download PDFInfo
- Publication number
- CN110862984B CN110862984B CN201911070123.1A CN201911070123A CN110862984B CN 110862984 B CN110862984 B CN 110862984B CN 201911070123 A CN201911070123 A CN 201911070123A CN 110862984 B CN110862984 B CN 110862984B
- Authority
- CN
- China
- Prior art keywords
- sgrna
- dna
- sequence
- artificial sequence
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0055—Oxidoreductases (1.) acting on diphenols and related substances as donors (1.10)
- C12N9/0057—Oxidoreductases (1.) acting on diphenols and related substances as donors (1.10) with oxygen as acceptor (1.10.3)
- C12N9/0059—Catechol oxidase (1.10.3.1), i.e. tyrosinase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y110/00—Oxidoreductases acting on diphenols and related substances as donors (1.10)
- C12Y110/03—Oxidoreductases acting on diphenols and related substances as donors (1.10) with an oxygen as acceptor (1.10.3)
- C12Y110/03001—Catechol oxidase (1.10.3.1), i.e. tyrosinase
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
- G01N33/5044—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2503/00—Use of cells in diagnostics
- C12N2503/02—Drug screening
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/10—Screening for compounds of potential therapeutic value involving cells
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Food Science & Technology (AREA)
- Pathology (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Analytical Chemistry (AREA)
- Tropical Medicine & Parasitology (AREA)
- Toxicology (AREA)
- Virology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明公开了一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用,属于医学遗传学和分子生物学技术领域。所述sgRNA对应的核苷酸序列为SEQ ID NO.1、SEQ ID NO.2和SEQ ID NO.3中的任意一种序列。本发明还公开了利用上述的特异靶向小鼠Tyr基因的sgRNA导向序列编辑小鼠Tyr基因的方法。本发明的sgRNA导向序列可以介导Cas9蛋白高效地切割靶点DNA,进而用于编辑小鼠Tyr基因,影响小鼠Tyr基因编码蛋白的功能。本发明的sgRNA导向序列可以通过CRISPR/Cas9系统实现高效打靶,效率均为100%。
Description
技术领域
本发明涉及一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用,属于医学遗传学和分子生物学技术领域。
背景技术
CRISPR/Cas系统最早在细菌中被发现,其在真细菌和古细菌中行使获得性免疫功能,可抵抗外源病毒和质粒入侵。人们通过基因工程手段对微生物自身的CRISPR/Cas系统进行改造,从而创造了可广泛应用于高等生物的基因编辑的打靶系统,CRISPR/Cas9系统。该系统自2012年问世以来,其为生命科学以及生物医学研究注入了强大的动力,成为近年来的研究热点。2013年起,研究者们利用CRISPR/Cas9的DNA结合活性与内切酶活性,成功地在哺乳动物细胞中对基因组进行了编辑。在CRISPR/Cas9系统中,Cas9内切酶在单链向导RNA(single guide RNA,sgRNA)的指引下,通过碱基互补配对原则,结合到基因组靶点位置,产生双链DNA断裂(DSBs),从而引发细胞内的修复机制,即非同源末端连接途径(NHEJ)或同源重组定向修复(HDR),在修复过程中发生碱基的缺失或插入,最终达到基因编辑的目的。Cas9蛋白结合靶点的关键是sgRNA(与靶点互补的序列约20bp),仅改变sgRNA序列,即可对感兴趣的几乎任意基因组区域进行编辑。与应用较早的基因编辑技术如锌指蛋白核酸酶(ZFN)或转录激活因子样效应物核酸酶(TALENs)相比,CRISPR/Cas9系统具有设计灵活、成本低、操作简单、准确性高、可多位点同时打靶等优势。
sgRNA中文名称为向导RNA。原核生物中Cas9靶向切割DNA是需要两种小RNA--crRNA(CRISPR RNA)和tracrRNA(transactivating crRNA)和靶序列互补识别的原理实现的。目前,通过基因工程手段将这两种小RNA融合为一种RNA,即sgRNA。sgRNA的主要功能是识别和结合到目标基因组DNA上,并介导Cas9蛋白切割DNA双链。因此,sgRNA能否做到高效靶向识别和结合目标基因是CRISPR/Cas9能否特异性编辑目标基因的先决条件,尤其是基因敲除和基因敲入,sgRNA的高效性对基因打靶的影响至关重要。因此,能够设计、制备出高效靶向目标基因的sgRNA是基于CRISPR/Cas9系统进行基因编辑的关键。
人类白化病是以黑色素缺乏或缺失为主要临床表现的疾病。通常,白化病为常染色体隐性遗传,发病率为1:17000。该病累及眼部和皮肤,眼部的临床表现常为虹膜呈浅灰色或浅粉色,视网膜常表现为少色素或无色素。此外,患者也常有视力不佳、畏光、眼球震颤等症状。皮肤病变表现为色浅、毛发呈白色或黄色。由于该病患者缺乏黑色素的保护,日晒后易诱发皮肤癌。据报道,中国的白化病群体人数众多,目前主要通过遗传咨询、禁止近亲结婚以及产前诊断等多种方法进行预防,但对已病患者仍无有效治疗手段。
目前,已发现至少16种基因突变与白化病有关,其中TYR基因突变是引起I型白化病的主要病因。TYR基因编码蛋白为酪氨酸酶,是黑色素生成过程中的重要限速酶。人体黑色素生化合成的第一步是酪氨酸酶催化酪氨酸生成多巴,然后多巴在酪氨酸酶的催化作用下生成多巴醌,最后多巴醌与半胱氨酸生成褐黑素。由此可见,TYR在黑色素的生成过程中至关重要。TYR基因突变具有多种类型,包括点突变、无义突变以及错义突变等,遍布整个基因上。然而不同的突变可能引起的临床症状不同,患病程度亦不相同。因此,有必要筛查明确的、典型的TYR致病突变位点,并将突变位点定位于小鼠基因组上,然后通过CRISPR/Cas9系统对该位点进行打靶,可以建立小鼠Tyr基因突变细胞模型或动物模型,从而精准的模拟I型白化病,为深入的理解TYR基因的致病机制以及探索可行的治疗策略具有重要意义。然而,目前并没有针对小鼠Tyr基因的sgRNA导向序列以及编辑该基因的方法。鉴于此,有必要提供一种可以模拟人类致病突变的特异靶向小鼠Tyr基因的sgRNA导向序列及利用其编辑小鼠Tyr基因的方法,以解决现有技术的不足。
发明内容
本发明的目的之一,提供一种特异靶向小鼠Tyr基因的sgRNA导向序列。本发明的sgRNA导向序列是参考I型白化病TYR基因的致病突变位点,然后将该位点定位于小鼠Tyr基因上,根据定位的位点DNA序列而设计的。本发明的sgRNA导向序列可以介导Cas9蛋白高效、特异性地切割靶点DNA,进而用于编辑小鼠Tyr基因,影响小鼠Tyr基因编码蛋白的功能。该sgRNA导向序列可以通过CRISPR/Cas9系统实现高效打靶,效率为100%。
本发明解决上述问题的技术方案如下:一种特异靶向小鼠Tyr基因的sgRNA导向序列,所述sgRNA对应的核苷酸序列为SEQ ID NO.1、SEQ ID NO.2和SEQ ID NO.3中的任意一种序列。
所述sgRNA的核苷酸序列如下:
SEQ ID NO.1:5'-acacagagggccaggactca-3'。
SEQ ID NO.2:5'-ggtcctattataaaacacag-3'。
SEQ ID NO.3:5'-attataaaacacagagggcc-3'。
本申请的发明人,为了得到上述特异靶向小鼠Tyr基因的sgRNA导向序列,进行了如下工作:
第一步:进行了人TYR基因致病突变位点的筛查,确定人TYR基因第81号位的脯氨酸(简称Pro)位点为拟突变位点。
I型白化病是由TYR基因突变引起的,利用OMIM在线数据库筛查到38种致病突变(如表1所示,共列出20种)。由于OMIM收录的突变位点有限,本发明也利用ExAC数据库筛查了人TYR基因的突变情况,共筛查到283个突变位点(如表2和图1所示,表2列出20种突变)。然后利用ClinVar数据库检索TYR致病位点的突变情况,共检索到65个突变位点(如表3所示,共列出15种突变)。根据三个数据库的综合结果最终确定人TYR基因第81号位的脯氨酸(简称Pro)位点拟突变位点。
第二步:小鼠Tyr基因致病突变位点的定位,定位小鼠第81号位的pro位点编码序列。
由于人和小鼠的物种差异,同一功能基因所编码的蛋白质序列及功能域可能不同,因此本申请的发明人利用Clustal Omega在线软件比对了人TYR和小鼠Tyr蛋白序列,发现人TYR基因第81号位的脯氨酸与小鼠Tyr基因第81号位的脯氨酸相对应(如图2所示)。然后从Ensembl数据库中导出小鼠Tyr基因序列,利用Vector NTI软件定位第81号位的脯氨酸位点编码序列,然后在编码序列附近设计基因打靶位点。
第三步:致病位点的基因编辑:符合5'-N(21)GG序列特征的位点为CRISPR/Cas9系统的编辑靶点,然后找到第81号位Pro位点编码序列附近的靶点。
人TYR蛋白多肽链中81号位的Pro与小鼠Tyr蛋白多肽链中的81号位的Pro相对应。利用Vector NTI软件的“Find Motifs”功能搜索具有5'-N(21)GG序列特征的位点,凡是符合该序列特征的位点均被认为是CRISPR/Cas9系统的编辑靶点,然后找到第81号位Pro编码序列附近的靶点(如图3所示)。
所述sgRNA在Tyr基因上的靶序列符合5'-N(21)GG的序列排列规则,所述sgRNA在Tyr基因上的靶序列位于基因的外显子,所述sgRNA在Tyr基因上的靶序列位于不同的各种剪切形式的共有外显子上,所述sgRNA在Tyr基因上的靶序列是唯一的。
本发明的目的之二,提供一种利用上述特异靶向小鼠Tyr基因的sgRNA导向序列编辑小鼠Tyr基因的方法。本发明利用上述特异靶向小鼠Tyr基因的sgRNA导向序列,构建了可模拟人类Tyr基因的致病突变的CRISPR/Cas9系统,实现了小鼠N2a细胞的高效转染,确定了合适的阳性细胞药物筛选浓度,并实现了微量细胞的基因型分析,用于非医疗诊断或治疗目的,对研究Tyr功能、Ⅰ型糖原贮积病致病机理以及相关治疗方法等具有极其重要的作用。
本发明解决上述问题的技术方案如下:一种利用上述特异靶向小鼠Tyr基因的sgRNA导向序列编辑小鼠Tyr基因的方法,包括如下步骤:
步骤1:在上述的特异靶向小鼠Tyr基因的sgRNA导向序列的5'端加上accg合成得到正向寡核苷酸;
同时上述的特异靶向小鼠Tyr基因的sgRNA导向序列获得sgRNA导向序列对应的DNA互补链,并且在DNA互补链的5'端加上aaac合成得到反向寡核苷酸;
将正向寡核苷酸和反向寡核苷酸退火,形成具有粘性末端的双链DNA片段;
步骤2:利用Bsa I限制性内切酶酶切SEQ ID NO.4所示的目标载体pGL3-U6-sgRNA质粒,得到酶切产物pGL3-U6-sgRNA-Bsa I;
步骤3:将步骤1得到的具有粘性末端的双链DNA片段和步骤2得到的酶切产物pGL3-U6-sgRNA-Bsa I连接,将连接产物转化感受态大肠杆菌并涂布于含氨苄抗性的LB培养基表面,37℃过夜培养20h后,挑取单克隆并用SEQ ID NO.5所示的通用引物U6通过测序鉴定出阳性克隆,对阳性克隆摇菌培养过夜、提取质粒,得到pGL3-U6-Tyr-sgRNA质粒;
步骤4:将步骤3得到的pGL3-U6-Tyr-sgRNA质粒和SEQ ID NO.6所示的pST1374-NLS-flag-linker-Cas9表达质粒,共转染小鼠N2a细胞,经药物筛选后,得到阳性的sgRNA-Cas9共转染细胞;
步骤5:将步骤4得到的阳性的sgRNA-Cas9共转染细胞,进行细胞裂解,以得到的细胞裂解液为模板进行打靶位点DNA的PCR扩增反应,取打靶位点DNA的PCR扩增产物进行Sanger测序,如果打靶位点出现套峰,则初步确认发生了基因编辑;
步骤6:TA克隆测序分析步骤5初步确认发生了基因编辑的打靶位点的基因型,并获得基因编辑后的小鼠细胞。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,步骤1中,所述退火的反应体系具体为:10μM正向寡核苷酸,5μL;10μM反向寡核苷酸,5μL;10×T7 Endonuclease I buffer,2μL;ddH2O,8μL;反应程序具体为:95℃,5min;95℃到85℃,-1℃/循环,共10个循环;85℃到25℃,-0.1℃/循环,共600个循环,退火产物-20℃保存。
采用上述进一步的有益效果是:采用上述反应体系和反应程序,可以实现正向寡核苷酸和反向寡核苷酸加精准的配对互补,从而高效形成带有粘性末端的双链DNA片段。其中,-1℃/循环是指每降低1℃,循环一次;-0.1℃/循环,是指每降低0.1℃,循环一次。
进一步,步骤2中,所述酶切的反应体系具体为:pGL3-U6-sgRNA质粒,2μg;10×酶切buffer,2μL;Bsa I限制性内切酶,2μL;补充ddH2O至总体积20μL,将酶切反应体系置于37℃反应3h。
采用上述进一步的有益效果是:采用上述反应体系,可以将pGL3-U6-sgRNA质粒充分酶切。
进一步,步骤3中,所述转化感受态大肠杆菌的具体方法为:取5μL连接产物快速加入到30μL感受态大肠杆菌中,充分混匀,冰上静置25min,42℃水浴热激90s,冰上冷却2min,加入150μL的LB液体培养基,转速为220转/min,37℃活化30min。
采用上述进一步的有益效果是:使得连接产物可以高效转化到感受态大肠杆菌中,使得重组子充分活化,提高阳性重组子的比例。
进一步,步骤3中,所述含氨苄抗性的LB培养基中,氨苄青霉素的浓度为50μg/mL。
采用上述进一步的有益效果是:采用含氨苄抗性的LB培养基,可以有效杀伤阴性大肠杆菌,提高阳性菌落数量。
进一步,步骤3中,所述摇菌的温度为37℃,转速为220转/min。
进一步,步骤3中,所述提取质粒采用去内毒素质粒中提试剂盒
采用上述进一步的有益效果是:采用去内毒素质粒中提试剂盒,可以获得高质量、高浓度、无内毒素的质粒,提高后续的细胞转染效率。
上述去内毒素质粒中提试剂盒可以市售购买,如可以购自北京康为世纪生物科技有限公司,货号为CW2105S。
进一步,步骤4中,所述药物为浓度为50μg/ml的嘌呤霉素和浓度为100μg/ml的杀稻瘟菌素。
采用上述进一步的有益效果是:利用嘌呤霉素和杀稻瘟菌素,可以高效筛选出sgRNA-Cas9的阳性转染细胞。
进一步,步骤4中,所述小鼠N2a细胞在转染前,先接种培养于含10%v/v胎牛血清的DMEM完全培养基中,于37℃,5%CO2培养箱中培养,每2d-3d更换新鲜培养基,待细胞汇合度达到80%-90%后,以0.25%胰蛋白酶消化,然后传代于6孔板中,18h-20h后,待细胞汇合度达到60%-70%时进行转染。
采用上述进一步的有益效果是:小鼠N2a细胞,即小鼠神经瘤母细胞。采用小鼠N2a细胞,可以验证sgRNA导向序列具有高效的基因编辑效率。小鼠N2a细胞具有较高的外源DNA转染效率,且对嘌呤霉素和杀稻瘟菌素具有较高的敏感性,便于药物筛选阳性转染细胞。
转染小鼠N2a细胞,采用LipofectamineTM 3000Transfection Reagent(InvitrogenTM)试剂盒。上述试剂盒可以市售购买,如可以购自Thermo Fisher Scientific公司,货号为L3000015。转染时,每个孔(直径34.8mm)转染sgRNA表达质粒2.5μg和Cas9质粒2.5μg。
上述含胎牛血清和DMEM培养基,可以从市面购买,如购自Thermo FisherScientific公司,货号为16140071或11965118,都可以达到相同的效果。
进一步,步骤5中,所述打靶位点DNA的PCR扩增反应的体系为:细胞裂解液2μL,上游引物1μL,下游引物1μL,dNTP Mixture 2μL,TaKaRa Ex Taq 1μL,10×Ex Taq Buffer2.5μL,灭菌水补充至25μL;所述打靶位点DNA的PCR扩增反应的程序为:95℃,5min;95℃,20s,72℃,20s,-1℃/循环,72℃,25s,共10个循环;95℃,20s,62℃,20s,72℃,25s,共25个循环;72℃,5min,16℃,无穷。
其中,上述-1℃/循环是指每降低1℃,循环一次。
更进一步,所述上游引物的序列如SEQ ID NO.7所示。
SEQ ID NO.7:5'-cgagcctgtgcctcctctaa-3'。
更进一步,所述下游引物的序列如SEQ ID NO.8所示。
SEQ ID NO.8:5'-gggtgacgacctcccaagta-3'。
上述上游引物和下游引物由上海百力格生物技术有限公司合成。上述dNTPMixture、TaKaRa Ex Taq和10×Ex Taq Buffer均购自宝日医生物技术(北京)有限公司,货号为RR001A。
进一步,步骤6中,所述TA克隆测序具体为:将步骤5得到的打靶位点的PCR扩增产物进行胶回收纯化,将纯化后的DNA进行连接,然后16℃金属浴1h,得到连接产物;将连接产物转化感受态大肠杆菌并涂含氨苄抗性的LB培养基上,37℃过夜培养20h后,进行菌落PCR反应验证,筛选出阳性克隆,并将阳性克隆进行Sanger测序。
采用上述更进一步的有益效果是:采用TA克隆测序,可以将单条PCR产物连接到载体上,通过测序分析可以得到打靶位点的基因型。
上述Solution I和PMD19载体属于一个试剂盒中的两个物品,可以市售购买,如可以购自宝日医生物技术(北京)有限公司,试剂盒货号为6013。
更进一步,所述连接的反应体系体系为:PCR纯化产物40ng、Solution I 2.5μL和PMD19载体0.5μL,加水补充至5μL;所述转化感受态大肠杆菌的具体方法为:取5μL连接产物快速加入到30μL感受态大肠杆菌中,充分混匀,冰上静置25min,42℃水浴热激90s,冰上冷却2min,加入150μL的LB液体培养基,转速为220转/min,37℃活化30min,然后涂布于含氨苄抗性的LB培养基表面。
更进一步,所述含氨苄抗性的LB培养基中,氨苄青霉素的浓度为50μg/mL。
采用上述更进一步的有益效果是:采用含氨苄抗性的LB培养基,可以有效杀伤阴性大肠杆菌,提高阳性菌落数量。
更进一步,所述菌落PCR反应的体系为:菌落水溶液1μL,Premix Taq酶5μL,上游引物0.5μL,下游引物0.5μL,灭菌水补充至10μL;所述菌落PCR反应的程序为:95℃,5min;95℃,20s,60℃,20s,72℃,25s,26个循环;72℃,5min。
更进一步,所述上游引物的序列如SEQ ID NO.9所示。
SEQ ID NO.9:5'-gtaaaacgacggccagt-3'。
更进一步,所述下游引物的序列如SEQ ID NO.10所示。
SEQ ID NO.10:5'-caggaaacagctatgac-3'。
上述上游引物和下游引物由上海百力格生物技术有限公司合成。上述Premix Taq酶购自宝日医生物技术(北京)有限公司,货号为R004Q。
更进一步,所述菌落水溶液是取直径为1mm的单克隆菌落溶解于10μL灭菌水中制备而成。
本发明的有益效果:
(1)本发明的sgRNA导向序列可以介导Cas9蛋白高效、特异性地切割靶点DNA,进而用于编辑小鼠Tyr基因,影响小鼠Tyr基因编码蛋白的功能。sgRNA导向序列可以介导CRISPR/Cas9系统实现高效打靶,效率为100%。
(2)本发明利用上述特异靶向小鼠Tyr基因的sgRNA导向序列,构建了可模拟人类Tyr基因的致病突变的CRISPR/Cas9系统,实现了小鼠N2a细胞的高效转染,确定了合适的阳性细胞药物筛选浓度,并实现了微量细胞的基因型分析,用于非医疗诊断或治疗目的,对研究Tyr功能、Ⅰ型糖原贮积病致病机理以及相关治疗方法等具有极其重要的作用。
附图说明
图1为ExAC数据库中人TYR外显子结构及突变示意图。图中,圆点代表突变位点。箭头代表基因的转录方向。
图2为人TYR和小鼠Tyr蛋白序列比对。框内代表拟突变的人Pro81位点和小鼠Pro81位点相对应。
图3为模拟人TYR基因突变的小鼠Tyr基因打靶位点示意图及序列。
图4为sgRNA1-Cas9药筛后的阳性转染细胞。
图5为药筛后的阳性转染细胞打靶区域PCR产物电泳图。图中,M代表Marker,1、2、3和4分别代表sgRNA1打靶位点、sgRNA2打靶位点、sgRNA3打靶位点以及对照组PCR产物。
图6为sgRNA1靶点基因编辑序列。
图7为sgRNA2靶点基因编辑序列。
图8为sgRNA3靶点基因编辑序列。
具体实施方式
以下结合具体附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
一、人Tyr基因致病突变位点的筛查,确定人TYR基因第81号位的脯氨酸(简称Pro)位点为拟突变位点。
I白化病是由TYR基因突变引起的,利用OMIM在线数据库筛查到38种致病突变(如表1所示,共列出20种)。由于OMIM收录的突变位点有限,本发明也利用ExAC数据库筛查了人TYR基因的突变情况,共筛查到283个突变位点(如表2和图1所示,表2列出20种突变)。然后利用ClinVar数据库检索TYR致病位点的突变情况,共检索到65个突变位点(如表3所示,共列出15种)。根据三个数据库的综合结果最终确定人TYR基因第81号位的脯氨酸(简称Pro)位点拟突变位点。
表1 OMIM数据库中人TYR基因的致病突变情况
注:表中加粗字体为拟突变位点。共筛查到38种突变位点,本表列出20种。
表2 ExAC数据库中人Tyr基因突变情况
注:表中加粗字体为拟突变位点。共筛查到283种突变位点,本表列出20种。
表3 ClinVar数据库中人TYR基因致病突变位点情况
注:加粗字体为拟突变位点。共筛查到65种致病突变位点,本表列出15种。
二、小鼠Tyr基因致病突变位点的定位,定位小鼠第81号位的pro位点编码序列。
由于人和小鼠的物种差异,同一功能基因所编码的蛋白质序列及功能域可能不同,因此本申请的发明人利用Clustal Omega在线软件比对了人TYR和小鼠Tyr蛋白序列,发现人TYR基因第81号位的脯氨酸与小鼠Tyr基因第81号位的脯氨酸相对应(如图2所示)。然后从Ensembl数据库中导出小鼠Tyr基因序列,利用Vector NTI软件定位第81号位的Leu位点编码序列,然后在编码序列附近设计基因打靶位点。
三、致病位点的基因编辑:符合5'-N(21)GG序列特征的位点为CRISPR/Cas9系统的编辑靶点,然后找到第81号位Pro位点编码序列附近的靶点。
人TYR蛋白多肽链中81号位的Pro与小鼠Tyr蛋白多肽链中的81号位的Pro相对应。利用Vector NTI软件的“Find Motifs”功能搜索具有5'-N(21)GG序列特征的位点,凡是符合该序列特征的位点均被认为是CRISPR/Cas9系统的编辑靶点,然后找到第81号位Pro编码序列附近的靶点(如图3所示)。
所述sgRNA在Tyr基因上的靶序列符合5'-N(21)GG的序列排列规则,所述sgRNA在Tyr基因上的靶序列位于基因的外显子,所述sgRNA在Tyr基因上的靶序列位于不同的各种剪切形式的共有外显子上,所述sgRNA在Tyr基因上的靶序列是唯一的。
本发明共设计3个打靶位点的sgRNA导向序列,分别为SEQ ID NO.1、SEQ ID NO.2和SEQ ID NO.3所示的序列。
SEQ ID NO.1:5'-acacagagggccaggactca-3'(以下简称为“sgRNA1”)。
SEQ ID NO.2:5'-ggtcctattataaaacacag-3'(以下简称为“sgRNA2”)。
SEQ ID NO.3:5'-attataaaacacagagggcc-3'(以下简称为“sgRNA3”)。
四、利用上述sgRNA导向序列编辑小鼠Tyr基因
步骤1:sgRNA表达载体的构建
在上述4个sgRNA导向序列的5'端加上accg合成得到正向寡核苷酸(Tyr-M-sg1+、Tyr-M-sg2+、Tyr-M-sg3+);
同时根据上述sgRNA导向序列获得sgRNA导向序列对应的DNA互补链,并且在DNA互补链的5'端加上aaac合成得到反向寡核苷酸(Tyr-M-sg1-、Tyr-M-sg2-、Tyr-M-sg3-);
将正向寡核苷酸和反向寡核苷酸退火,形成具有粘性末端的双链DNA片段。其中,退火的反应体系具体为:10μM正向寡核苷酸,5μL;10μM反向寡核苷酸,5μL;10×T7Endonuclease I buffer,2μL;ddH2O,8μL;反应程序具体为:95℃,5min;95℃到85℃,-1℃/循环(即每降低1℃,循环一次),共10个循环;85℃到12℃,-0.1℃/循环(即每降低0.1℃,循环一次),共600个循环,退火产物-20℃保存。
化学合成的正向寡核苷酸和反向寡核苷酸,具体如表4所示。
表4 化学合成的正向寡核苷酸和反向寡核苷酸
Tyr-M-sg1<sup>+</sup> | 5'-accgacacagagggccaggactca-3'(SEQ ID NO.51) |
Tyr-M-sg1<sup>-</sup> | 5'-aaactgagtcctggccctctgtgt-3'(SEQ ID NO.52) |
Tyr-M-sg2<sup>+</sup> | 5'-accgggtcctattataaaacacag-3'(SEQ ID NO.53) |
Tyr-M-sg2<sup>-</sup> | 5'-aaacctgtgttttataataggacc-3'(SEQ ID NO.54) |
Tyr-M-sg3<sup>+</sup> | 5'-accgattataaaacacagagggcc-3'(SEQ ID NO.55) |
Tyr-M-sg3<sup>-</sup> | 5'-aaacggccctctgtgttttataat-3'(SEQ ID NO.56) |
步骤2:利用Bsa I限制性内切酶酶切如SEQ ID NO.4所示的目标载体pGL3-U6-sgRNA质粒,得到酶切产物pGL3-U6-sgRNA-Bsa I。其中,酶切的反应体系具体为:pGL3-U6-sgRNA质粒,2μg;10×酶切buffer,2μL;Bsa I限制性内切酶,2μL;补充ddH2O至总体积20μL,将酶切反应体系置于37℃反应3h。
步骤3:将步骤1得到的具有粘性末端的双链DNA片段和步骤2得到的酶切产物pGL3-U6-sgRNA-Bsa I连接,取5μL连接产物快速加入到30μL感受态大肠杆菌中,充分混匀,冰上静置25min,42℃水浴热激90s,冰上冷却2min,加入150μL的LB液体培养基,转速为220转/min,37℃活化30min。然后涂布于氨苄抗性的LB固体培养基(其中氨苄青霉素的浓度为50μg/mL),37℃过夜培养20h后,挑取单克隆并用菌液PCR和琼脂糖凝胶电泳的出阳性克隆。将阳性克隆在37℃,转速为220转/min,摇菌过夜培养。采用去内毒素质粒中提试剂盒提取质粒,分别得到pGL3-U6-Tyr-sgRNA1质粒、pGL3-U6-Tyr-sgRNA2质粒和pGL3-U6-Tyr-sgRNA3质粒。上述质粒利用方法SEQ ID NO.5所示的通用引物U6进行测序确认目标DNA片段插入到载体的特定位点。上述去内毒素质粒中提试剂盒可以市售购买,如可以购自北京康为世纪生物科技有限公司,货号为CW2105S。
SEQ ID NO.5:5'-atggactatcatatgcttaccgta-3'。
步骤4:将小鼠N2a细胞先接种培养于含10%v/v胎牛血清的DMEM完全培养基中,于37℃,5%CO2培养箱中培养,每2d-3d更换新鲜培养基,待细胞汇合度达到80%-90%后,以0.25%胰蛋白酶消化并传代。然后,分至6孔板中,18h-20h后,待细胞汇合度达到60%-70%时进行转染。
采用LipofectamineTM 3000Transfection Reagent(InvitrogenTM)试剂盒分别装载步骤3得到的pGL3-U6-Tyr-sgRNA1质粒、pGL3-U6-Tyr-sgRNA2质粒、pGL3-U6-Tyr-sgRNA3质粒,以及SEQ ID NO.6所示的pST1374-NLS-flag-linker-Cas9表达质粒,共转染小鼠N2a细胞。上述LipofectamineTM 3000Transfection Reagent(InvitrogenTM)试剂盒可以市售购买,如可以购自Thermo Fisher Scientific公司,货号为L3000015。转染时,每个孔(直径34.8mm)转染sgRNA表达质粒
2.5μg和pST1374-NLS-flag-linker-Cas9表达质粒2.5μg。
采用浓度为50μg/ml的嘌呤霉素和浓度为100μg/ml的杀稻瘟菌素进行药物筛选,分别得到阳性的sgRNA1-Cas9共转染细胞(如图4所示)、sgRNA2-Cas9共转染细胞和sgRNA3-Cas9共转染细胞。将上述3组共转染细胞用磷酸盐缓冲液洗涤3次,然后用0.25%的胰蛋白酶消化,并离心收集。上述0.25%的胰蛋白酶购自Solarbio,货号为T1300。
步骤5:采用TransDirect Animal Tissue PCR kit试剂盒将步骤4得到的阳性的sgRNA1-Cas9共转染细胞(如图5所示)、阳性的sgRNA2-Cas9共转染细胞和阳性的sgRNA3-Cas9共转染细胞分别于8000转/min,5min离心去上清,加入8μL的AD1悬浮细胞沉淀,然后取8μL液体至PCR管,加入2μL的AD2,55℃孵育10min,95℃,3min;加入8μL的AD3混匀,分别得到3组细胞的细胞裂解液,作为后续打靶位点DNA的PCR扩增的模板,-20℃保存。上述TransDirect Animal Tissue PCR kit试剂盒可以市售购买,如可以购自北京全式金生物公司,货号为AD201-01。
分别以上述3组细胞的细胞裂解液为模板,进行打靶位点DNA的PCR扩增反应。三组打靶位点的PCR扩增反应体系为:细胞裂解液2μL,上游引物1μL,下游引物1μL,dNTPMixture 2μL,TaKaRa Ex Taq 1μL,10×Ex Taq Buffer 2.5μL,灭菌水补充至25μL。上游引物的序列如SEQ ID NO.7所示,SEQ ID NO.7:5'-cgagcctgtgcctcctctaa-3'。下游引物的序列如SEQ ID NO.8所示,SEQ ID NO.8:5'-gggtgacgacctcccaagta-3'。
上述两组上游引物和下游引物均由上海百力格生物技术有限公司合成。上述dNTPMixture、TaKaRa Ex Taq和10×Ex Taq Buffer均购自宝日医生物技术(北京)有限公司,货号为RR001A。
上述3组打靶位点DNA的PCR扩增反应的程序均为:95℃,5min;95℃,20s,72℃,20s,-1℃/循环(即每降低1℃,循环一次),72℃,25s,共10个循环;95℃,20s,62℃,20s,72℃,25s,共25个循环;72℃,5min,16℃,无穷。分别取5μL上述3组打靶位点DNA的PCR扩增产物进行质量百分数为1%的琼脂糖凝胶电泳检测,并以小鼠基因组DNA作为对照(如图5所示)。
分别取上述3组打靶位点DNA的PCR产物进行Sanger测序,Sanger测序由上海百力格生物技术有限公司完成。如果打靶位点出现套峰,则初步确认发生了基因编辑。测序结果如图6-图8所示。测序结果表明,在设计的3个打靶位点中,均发生了基因编辑,证明sgRNA1、sgRNA2和sgRNA3位点是可靠的基因编辑靶点。
步骤6:TA克隆测序分析步骤5初步确认发生了基因编辑的打靶位点的基因型,并获得基因编辑后的小鼠细胞。
将扩增的sgRNA1、sgRNA2和sgRNA3靶点的PCR产物进行胶回收纯化,将纯化后的DNA进行连接,连接的反应体系为:PCR纯化产物40ng、Solution I 2.5μL和PMD19载体0.5μL,加水补充至5μL;然后16℃金属浴1h,得到连接产物。上述Solution I和PMD19载体可以市售购买,如可以购自宝日医生物技术(北京)有限公司,货号为6013。
取5μL连接产物快速加入到30μL感受态大肠杆菌中,充分混匀,冰上静置25min,42℃水浴热激90s,冰上冷却2min,加入150μL的LB液体培养基,转速为220转/min,37℃活化30min后涂布于氨苄抗性的LB固体培养基(其中氨苄青霉素的浓度为50μg/mL),37℃过夜培养20h后,进行菌落PCR反应验证。菌落PCR反应的体系为:菌落水溶液1μL,Premix Taq酶5μL,上游引物0.5μL,下游引物0.5μL,灭菌水补充至10μL。其中,所述菌落水溶液是取直径1mm的单克隆菌落溶解于10μL灭菌水中制备而成。上游引物的序列如SEQ ID NO.9所示,SEQ IDNO.9:5'-gtaaaacgacggccagt-3'。下游引物的序列如SEQ ID NO.10所示,SEQ ID NO.10:5'-caggaaacagctatgac-3'。
上述上游引物和下游引物由上海百力格生物技术有限公司合成。上述Premix Taq酶购自宝日医生物技术(北京)有限公司,货号为R004Q。
菌落PCR反应的程序为:95℃,5min;95℃,20s,60℃,20s,72℃,25s,26个循环;72℃,5min,然后进行电泳鉴定。
筛选出阳性克隆,并将阳性克隆进行Sanger测序。Sanger测序由上海百力格生物技术有限公司完成。测序结果与野生型列比对分析表明,在sgRNA1、sgRNA2和sgRNA3靶点位置发生了碱基的随机插入和缺失,编辑效率均为100%(如表5-表7所示)。
表5 sgRNA1靶点基因型分析
序号 | 序列(Sequence) | 插入或缺失突变(Indel) |
taaaacacagagggccaggactcacggt(SEQ ID NO.57) | 野生型 | |
1 | taaaacacagagggccaggacatcacggt(SEQ ID NO.58) | (+1,4/20) |
2 | taaaacacagagggccaggacctcacggt(SEQ ID NO.59) | (+1,3/20) |
3 | taaaacacagatcacggt(SEQ ID NO.60) | (-10,3/20) |
4 | taaaacacagagggccaggacacggt(SEQ ID NO.61) | (-2,2/20) |
5 | taaaacacagagggccaggac(SEQ ID NO.62) | (-23,2/20) |
6 | taaaacacagagggccaggaccacggt(SEQ ID NO.63) | (-1,2/20) |
7 | taaaacacagagggccaggacggt(SEQ ID NO.64) | (-4,2/20) |
8 | taaaacacagagggccacacggt(SEQ ID NO.65) | (-5,2/20) |
注:加粗字体代表靶点序列;斜体字母代表插入序列。
表6 sgRNA2靶点基因型分析
序号 | 序列(Sequence) | 插入或缺失突变(Indel) |
ggcaggtcctattataaaacacagagggcca(SEQ ID NO.66) | 野生型 | |
1 | ggcaggtcctattataaaacagagggcca(SEQ ID NO.67) | (-2,4/18) |
2 | ggcaggtcctattataaaaccagagggcca(SEQ ID NO.68) | (-1,4/18) |
3 | ggcaggtcctattataaaacaacagagggcca(SEQ ID NO.69) | (+1,3/18) |
4 | ggcaggtcctattataaaacaa(SEQ ID NO.70) | (-9,3/18) |
5 | cagagggcca(SEQ ID NO.71) | (-40,2/18) |
6 | ggcaggtcctattataaaacaggcca(SEQ ID NO.72) | (-5,2/18) |
注:加粗字体代表靶点序列;斜体字母代表插入序列。
表7 sgRNA3靶点基因型分析
注:加粗字体代表靶点序列;斜体字母代表插入序列。
由此可见,sgRNA1、sgRNA2和sgRNA3导向序列可以介导Cas9蛋白,高效、特异性地切割靶点DNA,进而用于编辑小鼠Tyr基因,影响小鼠Tyr基因的功能。本发明的三种sgRNA导向序列可以通过CRISPR/Cas9系统实现高效打靶,效率均为100%。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 桂林医学院
<120> 一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用
<160> 80
<170> SIPOSequenceListing 1.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
acacagaggg ccaggactca 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ggtcctatta taaaacacag 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
attataaaac acagagggcc 20
<210> 4
<211> 4951
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ggtaccgatt agtgaacgga tctcgacggt atcgatcacg agactagcct cgagcggccg 60
cccccttcac cgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 120
ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata 180
cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 240
tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 300
tgtggaaagg acgaaacacc gggagaccga gagagggtct cagttttaga gctagaaata 360
gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt 420
tttttaaaga attctcgacc tcgagacaaa tggcagtatt catccacaat tttaaaagaa 480
aaggggggat tggggggtac agtgcagggg aaagaatagt agacataata gcaacagaca 540
tacaaactaa agaattacaa aaacaaatta caaaaattca aaattttcgg gtttattaca 600
gggacagcag agatccactt tggccgcggc tcgagggggt tggggttgcg ccttttccaa 660
ggcagccctg ggtttgcgca gggacgcggc tgctctgggc gtggttccgg gaaacgcagc 720
ggcgccgacc ctgggactcg cacattcttc acgtccgttc gcagcgtcac ccggatcttc 780
gccgctaccc ttgtgggccc cccggcgacg cttcctgctc cgcccctaag tcgggaaggt 840
tccttgcggt tcgcggcgtg ccggacgtga caaacggaag ccgcacgtct cactagtacc 900
ctcgcagacg gacagcgcca gggagcaatg gcagcgcgcc gaccgcgatg ggctgtggcc 960
aatagcggct gctcagcagg gcgcgccgag agcagcggcc gggaaggggc ggtgcgggag 1020
gcggggtgtg gggcggtagt gtgggccctg ttcctgcccg cgcggtgttc cgcattctgc 1080
aagcctccgg agcgcacgtc ggcagtcggc tccctcgttg accgaatcac cgacctctct 1140
ccccaggggg atccaccgga gcttaccatg accgagtaca agcccacggt gcgcctcgcc 1200
acccgcgacg acgtccccag ggccgtacgc accctcgccg ccgcgttcgc cgactacccc 1260
gccacgcgcc acaccgtcga tccggaccgc cacatcgagc gggtcaccga gctgcaagaa 1320
ctcttcctca cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc 1380
gcggtggcgg tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc 1440
ggcccgcgca tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc 1500
ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg 1560
cccgaccacc agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc 1620
gagcgcgccg gggtgcccgc cttcctggaa acctccgcgc cccgcaacct ccccttctac 1680
gagcggctcg gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg 1740
tgcatgaccc gcaagcccgg tgcctgacgc ccgccccacg acccgcagcg cccgaccgaa 1800
aggagcgcac gaccccatgc atcggtacct ttaagaccaa tgacttacaa ggcagctgta 1860
gatcttagcc actttctaga gtcggggcgg ccggccgctt cgagcagaca tgataagata 1920
cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga 1980
aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa 2040
caacaattgc attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaaag 2100
caagtaaaac ctctacaaat gtggtaaaat cgataaggat ccgtcgaccg atgcccttga 2160
gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc gtcgccgcac 2220
ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg ctcttccgct 2280
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 2340
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2400
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2460
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2520
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2580
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2640
ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2700
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2760
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2820
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2880
ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2940
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 3000
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 3060
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 3120
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 3180
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 3240
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 3300
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgggaccca 3360
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3420
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3480
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3540
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3600
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3660
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3720
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3780
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3840
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3900
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3960
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 4020
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 4080
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 4140
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 4200
cctgacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 4260
accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 4320
gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 4380
tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 4440
gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 4500
agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 4560
ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 4620
tttaacgcga attttaacaa aatattaacg tttacaattt cccattcgcc attcaggctg 4680
cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gcccaagcta 4740
ccatgataag taagtaatat taaggtacgg gaggtacttg gagcggccgc aataaaatat 4800
ctttattttc attacatctg tgtgttggtt ttttgtgtga atcgatagta ctaacatacg 4860
ctctccatca aaacaaaacg aaacaaaaca aactagcaaa ataggctgtc cccagtgcaa 4920
gtgcaggtgc cagaacattt ctctatcgat a 4951
<210> 5
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atggactatc atatgcttac cgta 24
<210> 6
<211> 9317
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctct 240
agctagaggt cgacggtata cagacatgat aagatacatt gatgagtttg gacaaaccac 300
aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 360
tgtaaccatt ataagctgca ataaacaagt tggggtgggc gaagaactcc agcatgagat 420
ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag cccaaccttt 480
catagaaggc ggcggtggaa tcgaaatctc gtagcacgtg tcagtcctgc tcctcggcca 540
cgaagtgctt agccctccca cacataacca gagggcagca attcacgaat cccaactgcc 600
gtcggctgtc catcactgtc cttcactatg gctttgatcc caggatgcag atcgagaagc 660
acctgtcggc accgtccgca ggggctcaag atgcccctgt tctcatttcc gatcgcgacg 720
atacaagtca ggttgccagc tgccgcagca gcagcagtgc ccagcaccac gagttctgca 780
caaggtcccc cagtaaaatg atatacattg acaccagtga agatgcggcc gtcgctagag 840
agagctgcgc tggcgacgct gtagtcttca gagatgggga tgctgttgat tgtagccgtt 900
gctctttcaa tgagggtgga ttcttcttga gacaaaggct tggccatggt ttagttcctc 960
accttgtcgt attatactat gccgatatac tatgccgatg attaattgtc aacacgtgct 1020
gatcagatcc gaaaatggat atacaagctc ccgggagctt tttgcaaaag cctaggcctc 1080
caaaaaagcc tcctcactac ttctggaata gctcagaggc agaggcggcc tcggcctctg 1140
cataaataaa aaaaattagt cagccatggg gcggagaatg ggcggaactg ggcggagtta 1200
ggggcgggat gggcggagtt aggggcggga ctatggttgc tgactaattg agatgcatgc 1260
tttgcatact tctgcctgct ggggagcctg gggactttcc acacctggtt gctgactaat 1320
tgagatgcat gctttgcata cttctgcctg ctggggagcc tggggacttt ccacacccta 1380
actgacacac attccacaga attaattcgc gttaaatttt tgttaaatca gctcattttt 1440
taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg 1500
gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt 1560
caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc 1620
aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg 1680
atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa 1740
aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc 1800
cgccgcgctt aatgcgccgc tacagggcgc gtggggatac cccctagagc cccagctggt 1860
tctttccgcc tcagaagcca tagagcccac cgcatcccca gcatgcctgc tattgtcttc 1920
ccaatcctcc cccttgctgt cctgccccac cccacccccc agaatagaat gacacctact 1980
cagacaatgc gatgcaattt cctcatttta ttaggaaagg acagtgggag tggcaccttc 2040
cagggtcaag gaaggcacgg gggaggggca aacaacagat ggctggcaac tagaaggcac 2100
agtcgaggct gatcagcggg tttaaactca atggtgatgg tgatgatgac cggtacgcgt 2160
agaatcgaga ccgaggagag ggttagggat aggcttacct tcgaagggcc cctagtcgcc 2220
gccgagctga gacaggtcga tgcgagtctc gtacagtccg gtaattgact ggtgtatcag 2280
ggtggcatcg agaacttctt tggtagaggt gtaccgcttc ctgtcaatag ttgtatcgaa 2340
atacttgaag gcagcaggag cgcccagatt agtcagagta aagaggtgga taatattctc 2400
tgcttgttcg cgaattggct tgtccctgtg cttattatat gcgctcagca ctttatcgag 2460
gtttgcatcg gccagaataa cccgcttgct gaactcgcta atctgttcaa tgatttcgtc 2520
caggtagtgt ttatgttgct caacaaagag ttgcttctgc tcattgtctt cagggctacc 2580
tttgagtttc tcgtagtggg aggccagata caggaagttc acgtatttgg agggcagagc 2640
cagctcgttt cctttctgca gctctccggc ggaggccagc atccgcttcc taccattctc 2700
cagctcaaag agagagtact tgggcagttt gatgatgaga tctttcttca cttctttata 2760
gcccttagct tccaggaaat cgattggatt cttctcgaag ctggatctct ccataatagt 2820
aattccgagc agctccttaa cagacttgag tttcttggac ttgcctttct ccacttttgc 2880
cacgaccaga acggaataag ccactgtagg ggaatcgaaa ccgccatact tctttgggtc 2940
ccaatctttc ttcctggcga tcagcttgtc agagttccgc tttggcagga tgctctcctt 3000
tgagaatccg ccggtctgca cttcggtctt cttcacgata ttgacttgtg gcatggacag 3060
caccttccgc acagttgcga agtccctgcc tttatcccac acgatttctc ctgtttctcc 3120
gtttgtttcg atcagtgggc gcttccggat ttcgccgtta gccagggtta tctcagtctt 3180
aaagaaattc atgatattag agtagaagaa gtacttggcg gtggctttgc caatctcttg 3240
ctcagacttt gctatcatct tcctcacatc gtagacttta tagtcaccgt acacgaactc 3300
agactccagt ttagggtatt tcttgatcag ggcggtgcca acgacagcat tgagataggc 3360
atcgtgagca tgatggtaat tgtttatttc gcgaactttg tagaattgaa agtccttccg 3420
gaagtcagac accagcttgc tcttcagagt tatcactttc acttccctga tcagcttatc 3480
gttctcatcg tacttagtgt tcatcctaga gtcgaggatt tgtgccacgt gtttggtaat 3540
ctggcgtgtt tcgaccagtt gcctcttaat aaagccggcc ttgtcgagtt cgctcagacc 3600
tcctctttct gccttagtca gattgtcaaa cttccgctgg gtgatcagtt tggcgttgag 3660
gagctgccgc cagtaattct tcatcttctt gaccacctct tctgatggaa cattgtcaga 3720
cttaccgcga ttcttatcgg atctggtcag caccttgttg tcaatggagt catctttgag 3780
gaaggactgt ggaacaatat ggtccacgtc ataatcggac agccggttga tgtcgagttc 3840
ctggtcaacg tacatgtccc gcccgttctg gaggtagtac aggtagagtt tctcgttctg 3900
gagctgtgta ttctccacag ggtgctcctt cagtatctga gatcccagct ccttaattcc 3960
ctcttcgatt cttttcatcc gttcccgaga gttcttctgg cccttctggg tggtttggtt 4020
ctcccttgcc atttcgataa cgatattctc tggcttgtgc cgacccatca ctttgacgag 4080
ttcgtccacg accttgactg tctgcagtat tcccttcttt atggcgggtg atccagcgag 4140
gttggcgatg tgctcgtgca ggctgtcgcc ttgaccgctc acctgtgcct tctggatgtc 4200
ctctttaaat gtcagagagt catcgtgaat cagttgcatg aagttcctgt tagcgaatcc 4260
gtcggatttc aggaaatcca ggatggtctt tccgctctgt ttgtcgcgga tgccgtttat 4320
gagtttcctg gagagtctac cccacccagt gtagcgccgc cgcttgagct gtttcatgac 4380
tttatcgtca aacagatggg cataggtctt caggcgctct tcgatcatct ctctatcctc 4440
gaacagagtc agggtcagca cgatatcttc caggatgtcc tcgttctcct cattatcgag 4500
gaaatctttg tctttgatta tcttcagcag atcatggtaa gtgcccaggc tggcattaaa 4560
gcggtcctcc acgccagaga tttccactga gtcaaagcat tcgatcttct taaagtaatc 4620
ctccttgagc tgcttcactg tcacctttct attagtcttg aagagcagat caacgatagc 4680
cttcttctgc tctccggaca ggaaggcagg cttcctcatg ccctcggtca cgtacttcac 4740
tttagtcagc tcgttataga cggtgaaata ctcgtacagg agtgaatgtt tgggcaggac 4800
cttctcgttg ggcaggttct tatcgaaatt ggtcatccgt tcgatgaatg actgggcgct 4860
tgcgccctta tccacgacct cttcgaagtt ccaaggagta attgtctcct cagatttcct 4920
ggtcatccaa gcgaagcggg agttgcctct agccagaggg ccgacgtaat aagggatcct 4980
gaaggtcagg atcttctcta tcttctcccg gttatccttc aggaaaggat agaaatcctc 5040
ctgcctgcgg aggattgcat gcagctctcc caggtgtatc tgatgtggaa tggagccatt 5100
atcaaaggtc ctctgcttcc tcagcaggtc ctccctgttc agcttcacca gcagctcttc 5160
agtaccgtcc atcttctcga ggattggttt gatgaacttg taaaattctt cctgtgatgc 5220
tccgccatcg atgtatccgg catatccatt cttgctctgg tcgaagaata tctctttgta 5280
cttctctggc agctgttgcc tcacgagggc tttgagcaga gtcaggtctt gatggtgttc 5340
atcatagcgt tttatcatgg aggcgctcag aggtgctttg gtgatctcag tgttgacccg 5400
gagtatgtcg ctcagcagaa tggcgtcgga gagattctta gcagccagaa agagatcggc 5460
gtactggtcg cctatctgtg cgagcaggtt gtccagatca tcgtcatagg tgtccttgga 5520
gagctggagt ttagcatctt cggccagatc aaaattggac ttgaagttag gtgtcaggcc 5580
caggctcagg gcgatgaggt tcccaaacag gccgttcttc ttttctcctg gcagttgggc 5640
aatcagattc tccagtctgc gtgacttgga cagccgagcg gacagaatag ccttggcatc 5700
cacaccagaa gcgtttatgg gattctcctc gaacagttgg ttatatgtct gcaccagttg 5760
aatgaagagt ttatccacat cggaattatc gggattcagg tcgccctcga tcagaaagtg 5820
tcctctaaac tttatcatat gagccagggc cagatagatg agcctcaggt ctgctttatc 5880
ggtgctgtcc accagcttct tcctcagatg gtagattgta ggatactttt catggtaagc 5940
cacctcatcc acgatatttc cgaatatagg gtgcctctcg tgtttcttat cctcctccac 6000
cagaaagctc tcttccaggc ggtgaaagaa ggagtcgtcc accttagcca tttcgttgct 6060
aaagatctct tgcagataac atatccgatt cttgcggcgg gtgtatctcc gccttgcggt 6120
ccgcttcagc cgagtagctt cagcggtttc accggagtcg aagaggagtg ctccgatcag 6180
gttcttcttg attgaatggc ggtcagtatt acccagcacc ttgaatttct tgcttggcac 6240
cttatactcg tcggttatga cggcccagcc aacggagttt gtcccgatat ccagtccaat 6300
agagtatttc ttgtctctag tgtgggtccg ctggtgtctg gtcagagcac cagactgaga 6360
gaaagattta ccacactctg ggcatttgta tggcttctcg ccgggttcca gtctagattt 6420
atcgtcgtca tccttgtagt cagcggccgc caccttcctc tttttcttag gtcccatggt 6480
gctagccagc ttgggtctcc ctatagtgag tcgtattaat ttcgataagc cagtaagcag 6540
tgggttctct agttagccag agagctctgc ttatatagac ctcccaccgt acacgcctac 6600
cgcccatttg cgtcaatggg gcggagttgt tacgacattt tggaaagtcc cgttgatttt 6660
ggtgccaaaa caaactccca ttgacgtcaa tggggtggag acttggaaat ccccgtgagt 6720
caaaccgcta tccacgccca ttgatgtact gccaaaaccg catcaccatg gtaatagcga 6780
tgactaatac gtagatgtac tgccaagtag gaaagtccca taaggtcatg tactgggcat 6840
aatgccaggc gggccattta ccgtcattga cgtcaatagg gggcgtactt ggcatatgat 6900
acacttgatg tactgccaag tgggcagttt accgtaaata ctccacccat tgacgtcaat 6960
ggaaagtccc tattggcgtt actatgggaa catacgtcat tattgacgtc aatgggcggg 7020
ggtcgttggg cggtcagcca ggcgggccat ttaccgtaag ttatgtaacg cggaactcca 7080
tatatgggct atgaactaat gaccccgtaa ttgattacta ttaataacta gtcaataatc 7140
aatgtcaacg cgtatatctg gcccgtacat cgcgaagcag cgcaaaacgc ctaaccctaa 7200
gcagattctt catgcaattg tcggtcaagc cttgccttgt tgtagcttaa attttgctcg 7260
cgcactactc agcgacctcc aacacacaag cagggagcag atactggctt aactatgcgg 7320
catcagagca gattgtactg agagtgcacc ataggggatc gggagatctc ccgatccgtc 7380
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 7440
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 7500
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 7560
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 7620
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 7680
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 7740
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 7800
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 7860
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 7920
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 7980
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 8040
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 8100
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 8160
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 8220
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 8280
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 8340
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 8400
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 8460
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 8520
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 8580
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 8640
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgttcttct 8700
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 8760
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 8820
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 8880
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 8940
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 9000
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 9060
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 9120
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 9180
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 9240
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 9300
gagcgaggaa gcggaag 9317
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cgagcctgtg cctcctctaa 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gggtgacgac ctcccaagta 20
<210> 9
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gtaaaacgac ggccagt 17
<210> 10
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
caggaaacag ctatgac 17
<210> 11
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
g 1
<210> 12
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
a 1
<210> 13
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
c 1
<210> 14
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
t 1
<210> 15
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
t 1
<210> 16
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
c 1
<210> 17
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
c 1
<210> 18
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
t 1
<210> 19
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
c 1
<210> 20
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
t 1
<210> 21
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
g 1
<210> 22
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
a 1
<210> 23
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
t 1
<210> 24
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
a 1
<210> 25
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
t 1
<210> 26
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
a 1
<210> 27
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
a 1
<210> 28
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
g 1
<210> 29
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
g 1
<210> 30
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
a 1
<210> 31
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
a 1
<210> 32
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
g 1
<210> 33
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
c 1
<210> 34
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
a 1
<210> 35
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
g 1
<210> 36
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
t 1
<210> 37
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
c 1
<210> 38
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
a 1
<210> 39
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
a 1
<210> 40
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
g 1
<210> 41
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
g 1
<210> 42
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
c 1
<210> 43
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
t 1
<210> 44
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
a 1
<210> 45
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
t 1
<210> 46
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
c 1
<210> 47
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
g 1
<210> 48
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
a 1
<210> 49
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
g 1
<210> 50
<211> 1
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
a 1
<210> 51
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
accgacacag agggccagga ctca 24
<210> 52
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
aaactgagtc ctggccctct gtgt 24
<210> 53
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
accgggtcct attataaaac acag 24
<210> 54
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
aaacctgtgt tttataatag gacc 24
<210> 55
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
accgattata aaacacagag ggcc 24
<210> 56
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
aaacggccct ctgtgtttta taat 24
<210> 57
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
taaaacacag agggccagga ctcacggt 28
<210> 58
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
taaaacacag agggccagga catcacggt 29
<210> 59
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
taaaacacag agggccagga cctcacggt 29
<210> 60
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
taaaacacag atcacggt 18
<210> 61
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
taaaacacag agggccagga cacggt 26
<210> 62
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
taaaacacag agggccagga c 21
<210> 63
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
taaaacacag agggccagga ccacggt 27
<210> 64
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
taaaacacag agggccagga cggt 24
<210> 65
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
taaaacacag agggccacac ggt 23
<210> 66
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ggcaggtcct attataaaac acagagggcc a 31
<210> 67
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
ggcaggtcct attataaaac agagggcca 29
<210> 68
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
ggcaggtcct attataaaac cagagggcca 30
<210> 69
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
ggcaggtcct attataaaac aacagagggc ca 32
<210> 70
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
ggcaggtcct attataaaac aa 22
<210> 71
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
cagagggcca 10
<210> 72
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
ggcaggtcct attataaaac aggcca 26
<210> 73
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
tcctattata aaacacagag ggccaggact ca 32
<210> 74
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
tcctattata aaacacagag ga 22
<210> 75
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
tcctattata aaacacagcc aggactca 28
<210> 76
<211> 2
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
ca 2
<210> 77
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
tcctattata aaacacagag gggccaggac tca 33
<210> 78
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
tcctattata aaacacagag gccaggactc a 31
<210> 79
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
tcctattata aaacac 16
<210> 80
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
tcctattata aaacacaga 19
Claims (10)
1.一种特异靶向小鼠Tyr基因的sgRNA导向核苷酸片段,其特征在于,所述sgRNA对应的核苷酸序列为SEQ ID NO.1、SEQ ID NO.2和SEQ ID NO.3中的任意一种序列。
2.一种利用权利要求1所述的特异靶向小鼠Tyr基因的sgRNA导向序列编辑小鼠Tyr基因的方法,其特征在于,包括如下步骤:
步骤1:在权利要求1所述的特异靶向小鼠Tyr基因的sgRNA导向序列的5'端加上accg合成得到正向寡核苷酸;
同时根据权利要求1所述的特异靶向小鼠Tyr基因的sgRNA导向序列获得sgRNA导向序列对应的DNA互补链,并且在DNA互补链的5'端加上aaac合成得到反向寡核苷酸;
将正向寡核苷酸和反向寡核苷酸退火,形成具有粘性末端的双链DNA片段;
步骤2:利用Bsa I限制性内切酶酶切SEQ ID NO.4所示的目标载体pGL3-U6-sgRNA质粒,得到酶切产物pGL3-U6-sgRNA-Bsa I;
步骤3:将步骤1得到的具有粘性末端的双链DNA片段和步骤2得到的酶切产物pGL3-U6-sgRNA-Bsa I连接,将连接产物转化感受态大肠杆菌并涂布于氨苄抗性的LB培养基表面,37℃过夜培养20h后,挑取单克隆并用SEQ ID NO.5所示的通用引物U6通过测序鉴定出阳性克隆,对阳性克隆摇菌培养过夜、提取质粒,得到pGL3-U6-Tyr-sgRNA质粒;
步骤4:将步骤3得到的pGL3-U6-Tyr-sgRNA质粒和SEQ ID NO.6所示的pST1374-NLS-flag-linker-Cas9表达质粒,共转染小鼠N2a细胞,经药物筛选后得到阳性的sgRNA-Cas9共转染细胞;
步骤5:将步骤4得到的阳性的sgRNA-Cas9共转染细胞进行细胞裂解,以得到的细胞裂解液为模板进行打靶位点DNA的PCR扩增反应,取打靶位点DNA的PCR扩增产物进行Sanger测序,如果打靶位点出现套峰,则初步确认发生了基因编辑;
步骤6:TA克隆测序分析步骤5初步确认发生了基因编辑的打靶位点的基因型,并获得基因编辑后的小鼠细胞。
3.根据权利要求2所述的编辑小鼠Tyr基因的方法,其特征在于,步骤1中,所述退火的反应体系具体为:10μM正向寡核苷酸,5μL;10μM反向寡核苷酸,5μL;10×T7 EndonucleaseI buffer,2μL;ddH2O,8μL;反应程序具体为:95℃,5min;95℃到85℃,-1℃/循环,共10个循环;85℃到25℃,-0.1℃/循环,共600个循环,退火产物-20℃保存。
4.根据权利要求2所述的编辑小鼠Tyr基因的方法,其特征在于,步骤2中,所述酶切的反应体系具体为:pGL3-U6-sgRNA质粒,2μg;10×酶切buffer,2μL;Bsa I限制性内切酶,2μL;补充ddH2O至总体积20μL,将酶切反应体系置于37℃反应3h。
5.根据权利要求2所述的编辑小鼠Tyr基因的方法,其特征在于,步骤3中,所述转化感受态大肠杆菌的具体方法为:取5μL连接产物,快速加入到30μL感受态大肠杆菌中,充分混匀,冰上静置25min,42℃水浴热激90s,冰上冷却2min,加入150μL的LB液体培养基,转速为220转/min,37℃活化30min;所述含氨苄抗性的LB培养基中,氨苄青霉素的浓度为50μg/mL;所述摇菌的温度为37℃,转速为220转/min;所述提取质粒采用去内毒素质粒中提试剂盒。
6.根据权利要求2所述的编辑小鼠Tyr基因的方法,其特征在于,步骤4中,所述药物为浓度为50μg/ml的嘌呤霉素和浓度为100μg/ml的杀稻瘟菌素;所述小鼠N2a细胞在转染前,先接种培养于含10%v/v胎牛血清的DMEM完全培养基中,于37℃,5%CO2培养箱中培养,每2d-3d更换新鲜培养基,待细胞汇合度达到80%-90%后,以0.25%胰蛋白酶消化,然后传代于6孔板中,18h-20h后,待细胞汇合度达到60%-70%时进行转染。
7.根据权利要求2所述的编辑小鼠Tyr基因的方法,其特征在于,步骤5中,所述打靶位点DNA的PCR扩增反应的体系为:细胞裂解液2μL,上游引物1μL,下游引物1μL,dNTP Mixture2μL,TaKaRa Ex Taq 1μL,10×Ex Taq Buffer 2.5μL,灭菌水补充至25μL;所述打靶位点DNA的PCR扩增反应的程序为:95℃,5min;95℃,20s,72℃,20s,-1℃/循环,72℃,25s,共10个循环;95℃,20s,62℃,20s,72℃,25s,共25个循环;72℃,5min,16℃,无穷。
8.根据权利要求7所述的编辑小鼠Tyr基因的方法,其特征在于,所述上游引物的序列如SEQ ID NO.7所示;所述下游引物的序列如SEQ ID NO.8所示。
9.根据权利要求2所述的编辑小鼠Tyr基因的方法,其特征在于,步骤6中,所述TA克隆测序具体为:将步骤5得到的打靶位点的PCR扩增产物进行胶回收纯化,将纯化后的DNA连接于质粒载体上,得到连接产物;将连接产物转化感受态大肠杆菌并涂含氨苄抗性的LB培养基上,37℃过夜培养20h后,进行菌落PCR反应验证,筛选出阳性克隆,并将阳性克隆进行Sanger测序。
10.根据权利要求9所述的编辑小鼠Tyr基因的方法,其特征在于,所述连接的反应体系体系为:PCR纯化产物40ng、Solution I 2.5μL和PMD19载体0.5μL,加水补充至5μL;所述转化感受态大肠杆菌的具体方法为:取5μL连接产物快速加入到30μL感受态大肠杆菌中,充分混匀,冰上静置25min,42℃水浴热激90s,冰上冷却2min,加入150μL的LB液体培养基,转速为220转/min,37℃活化30min,然后涂布于含氨苄抗性的LB培养基表面;所述含氨苄抗性的LB培养基中,氨苄青霉素的浓度为50μg/mL;所述菌落PCR反应的体系为:菌落水溶液1μL,Premix Taq酶5μL,上游引物0.5μL,下游引物0.5μL,灭菌水3μL;所述菌落PCR反应的程序为:95℃,5min;95℃,20s,60℃,20s,72℃,25s,26个循环;72℃,5min;所述上游引物的序列如SEQ ID NO.9所示;所述下游引物的序列如SEQ ID NO.10所示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911070123.1A CN110862984B (zh) | 2019-11-05 | 2019-11-05 | 一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911070123.1A CN110862984B (zh) | 2019-11-05 | 2019-11-05 | 一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110862984A CN110862984A (zh) | 2020-03-06 |
CN110862984B true CN110862984B (zh) | 2021-04-06 |
Family
ID=69653422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911070123.1A Active CN110862984B (zh) | 2019-11-05 | 2019-11-05 | 一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110862984B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018177351A1 (zh) * | 2017-03-31 | 2018-10-04 | 中国科学院上海生命科学研究院 | 基于CRISPR/Cas9技术的制备无嵌合基因敲除动物的方法 |
CN110029130A (zh) * | 2019-04-24 | 2019-07-19 | 皖南医学院第一附属医院(皖南医学院弋矶山医院) | 基于CRISPR/Cas9系统在Beta-TC-6细胞株中剔除Sidt2基因方法 |
-
2019
- 2019-11-05 CN CN201911070123.1A patent/CN110862984B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018177351A1 (zh) * | 2017-03-31 | 2018-10-04 | 中国科学院上海生命科学研究院 | 基于CRISPR/Cas9技术的制备无嵌合基因敲除动物的方法 |
CN110029130A (zh) * | 2019-04-24 | 2019-07-19 | 皖南医学院第一附属医院(皖南医学院弋矶山医院) | 基于CRISPR/Cas9系统在Beta-TC-6细胞株中剔除Sidt2基因方法 |
Non-Patent Citations (1)
Title |
---|
No unexpected CRISPR-Cas9 off-target activity revealed by trio sequencing of gene-edited mice;Iyer Vivek等;《PLOS GENETICS》;20180731;第14卷(第7期);e1007503 * |
Also Published As
Publication number | Publication date |
---|---|
CN110862984A (zh) | 2020-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110777144B (zh) | 一种特异靶向小鼠Krt14基因的sgRNA导向序列及其应用 | |
CN109609636B (zh) | 一种肺腺癌差异性表达circRNA的检测试剂盒及其应用 | |
CN113862235B (zh) | 一种嵌合酶及其在体外一步反应合成Cap0 mRNA的用途和方法 | |
CN107604004A (zh) | 用于痘苗病毒天坛株tk基因的示踪打靶质粒及其制备方法 | |
CN110944656B (zh) | 编码人类fkrp蛋白的新型多核苷酸 | |
CN111239386B (zh) | 一种靶向抑制维生素K依赖性γ-谷氨酰羧化酶的小分子化合物的筛选方法及应用 | |
CN110878301B (zh) | 一种特异靶向小鼠G6pc基因的sgRNA导向序列及其应用 | |
WO1992017581A1 (en) | Mammalian expression vector | |
KR20200086902A (ko) | 신경세포 분화 추적용 벡터 및 이를 이용한 신경세포로의 분화 추적 방법 | |
CN101463362B (zh) | 融合表达绿色荧光蛋白的表达载体及其构建方法与应用 | |
CN110862984B (zh) | 一种特异靶向小鼠Tyr基因的sgRNA导向序列及其应用 | |
CN110862982B (zh) | 一种特异靶向小鼠Gaa基因的sgRNA导向序列及其应用 | |
CN110885821B (zh) | 一种特异靶向小鼠Idua基因的sgRNA导向序列及其应用 | |
CN110862983B (zh) | 一种特异靶向小鼠Gdf5基因的sgRNA导向序列及其应用 | |
CN110777145B (zh) | 一种特异靶向小鼠Galt基因的sgRNA导向序列及其应用 | |
CN113046369B (zh) | 一种新型冠状病毒的mRNA疫苗 | |
CN111239385B (zh) | 一种靶向抑制维生素k环氧化物还原酶的小分子化合物的筛选方法及应用 | |
CN111560392B (zh) | miRNA表达载体及其应用 | |
CN110115770B (zh) | 一种防治丙型病毒性肝炎的新靶点及其CRISPR-Cas9靶向系统与应用 | |
KR20120043657A (ko) | 인간 혈액응고 7인자의 대량 생산 방법 | |
CN101880652A (zh) | 表达猪干扰素(α、β或γ)的重组新城疫弱毒疫苗株 | |
CN114457113B (zh) | 一种抑制单倍体胚胎干细胞二倍化的方法 | |
KR102699731B1 (ko) | 흰 반점 증후군 바이러스 외피 단백질을 발현하는 형질전환 미세조류를 유효성분으로 포함하는 흰 반점 증후군의 예방 또는 개선용 사료첨가제 조성물 및 이의 용도 | |
CN110607267B (zh) | 一种绵羊李斯特菌平衡致死系统、构建方法及应用 | |
CN101220374A (zh) | 鸡痘病毒双基因表达载体(pg7.5n) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |