CN113423823A - 经基因组编辑的细胞的制造方法 - Google Patents

经基因组编辑的细胞的制造方法 Download PDF

Info

Publication number
CN113423823A
CN113423823A CN201980091726.1A CN201980091726A CN113423823A CN 113423823 A CN113423823 A CN 113423823A CN 201980091726 A CN201980091726 A CN 201980091726A CN 113423823 A CN113423823 A CN 113423823A
Authority
CN
China
Prior art keywords
sequence
allele
cell
guide rna
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980091726.1A
Other languages
English (en)
Inventor
铃木淳史
川又理树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu University NUC
Original Assignee
Kyushu University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu University NUC filed Critical Kyushu University NUC
Publication of CN113423823A publication Critical patent/CN113423823A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6486Measuring fluorescence of biological material, e.g. DNA, RNA, cells
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/34Allele or polymorphism specific uses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • C12N2320/53Methods for regulating/modulating their activity reducing unwanted side-effects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Mycology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种仅单侧等位基因经基因组编辑的细胞的制造方法,包括将(A)和(B)导入细胞的工序,所述(A)为选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA及(a3)可表达所述(a1)或所述(a2)的向导RNA的表达载体组成的组中的至少1种,所述(B)为选自由Cas蛋白及能表达所述Cas蛋白的表达载体组成的组中的至少1种。

Description

经基因组编辑的细胞的制造方法
技术领域
本发明涉及基因组编辑的领域。本发明尤其涉及仅单侧等位基因经基因组编辑的细胞的制造方法、能够在该制造方法中使用的向导RNA、表达载体及试剂盒、以及基因组编辑模式的预测方法。进而,本发明涉及基因组编辑模式的分析方法以及能够在该分析方法中使用的细胞。
本申请基于在2018年12月12日在日本申请的日本特愿2018-232946号要求优先权,并将其内容援引于此。
背景技术
已知成簇的规则排列的短回文重复序列(Clustered Regularly InterspacedShort Palindromic Repeats:CRISPR)和Cas(CRISPR-相关)基因一起构成适应性免疫系统,该系统在细菌和古细菌中提供针对侵入外源核酸的获得性抗性。CRISPR往往是由噬菌体或质粒DNA引起的,由24~48bp的短保守重复序列(其间插入有大小类似的被称作间隔序列的独特可变DNA序列)构成。另外,在重复序列和间隔序列的附近存在编码Cas蛋白家族的基因组。
在CRISPR-Cas系统中,外源性DNA被Cas蛋白家族切割成30bp左右的片段,并插入CRISPR中。作为Cas蛋白家族之一的Cas1和Cas2蛋白识别外源性DNA的被称作前间隔序列邻近基序(proto-spacer adjacent motif,PAM)的碱基序列,切取其上游,插入到宿主的CRISPR序列中,这成为细菌的免疫记忆。包含免疫记忆的CRISPR序列被转录而生成的RNA(称作pre-crRNA。)与部分互补的RNA(反式激活crRNA(trans-activating crRNA:tracrRNA))配对,被摄入到作为Cas蛋白家族之一的Cas9蛋白中。摄入到Cas9中的pre-crRNA及tracrRNA被RNaseIII切割,成为包含外源序列(向导序列)的小的RNA片段(CRISPR-RNAs:crRNAs),形成Cas9-crRNA-tracrRNA复合体。Cas9-crRNA-tracrRNA复合体与同crRNA互补的外源侵入性DNA结合,切割DNA的酶(核酸酶)即Cas9蛋白切割外源侵入性DNA,从而抑制和排除外来侵入的DNA的功能。
Cas9蛋白识别外源侵入性DNA中的PAM序列,在其上游切割双链DNA使其形成平滑末端。PAM序列的长度或碱基序列根据细菌种类的不同而多种多样,在酿脓链球菌(Streptococcus pyogenes)(S.pyogenes)中识别“NGG”这3个碱基。嗜热链球菌(Streptococcus thermophilus)(S.thermophilus)持有2个Cas9,分别将“NGGNG”或“NNAGAA”这5~6个碱基识别为PAM序列。(N表示任意的碱基)。切割PAM序列上游的几bp的位置也根据细菌种类而不同,但包含S.pyogenes的大部分的Cas9直系同源物切割PAM序列的上游3个碱基。
近年来,正在积极开发将细菌中的CRISPR-Cas系统应用于基因组编辑的技术。使crRNA与tracrRNA融合而作为tracrRNA-crRNA嵌合体来表达,并进行有效利用。由此,称为RNA诱导型核酸酶(RNA-guided nuclease:RGN),并在目标部位切割基因组DNA。
CRISPR-Cas系统有I、II、III型,但在基因组编辑中专门使用II型CRISPR/Cas系统,在II型中使用Cas9蛋白作为RGN。由于来自S.pyogenes的Cas9蛋白识别NGG这3个碱基作为PAM序列,因此只要存在并列有2个鸟嘌呤的序列,就可切割其上游。
使用CRISPR-Cas系统的方法不仅可以合成具有与靶DNA序列相同的序列的短gRNA,还可以使用作为单一蛋白的Cas9蛋白进行基因组编辑。因此,无需像以往使用的锌指核酸酶(ZFN)或类反式激活因子激动剂(TALEN)那样对每个DNA序列合成不同大小的蛋白,能够简便且迅速地进行基因组编辑。
例如,在专利文献1中公开了有效利用来自S.pyogenes的CRISPR/Cas系统的基因组编辑技术。
现有技术文献
专利文献
专利文献1:国际公开第2014/093661号
发明内容
发明所要解决的技术问题
已知通过基因组编辑已切割双链的DNA可通过同源重组修复(HomologousDirected Repair:HDR)或非同源末端连接修复(Non-Homologous End-Joining Repair:NHEJ)来进行修复。在NHEJ时,由于在修复时高频率地诱导插入和/或缺失(insertion/deletion:indel),因此有发生无法预期的基因变异的风险。
例如在杂合有疾病基因和正常基因的情况下,若想要通过基因组编辑来敲除疾病基因,则有在正常基因中也高频率地诱导变异的风险。另外,即便想要通过HDR来敲入正常基因,在两等位基因中发生敲入的概率也极低。因此,在未诱导敲入的等位基因中有因NHEJ而导入indel的风险。
因此,在通过基因组编辑而在两等位基因中发生双链切割的情况下,有在单侧的等位基因中诱导无法预期的变异的风险。
本发明是鉴于上述情况而完成的,其目的在于提供仅单侧等位基因经基因组编辑的细胞的制造方法、以及能够在上述方法中使用的向导RNA、表达载体、试剂盒。进而,其目的还在于提供基因组编辑模式的预测方法、以及基因组编辑模式的分析方法及能够在上述分析方法中使用的细胞。
用于解决技术问题的方案
本发明包含以下方案。
[1]一种仅单侧等位基因经基因组编辑的细胞的制造方法,其中,包括将(A)和(B)导入细胞的工序,所述(A)为选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)所述(a1)或所述(a2)的向导RNA的表达载体组成的组中的至少1种,所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
[2]根据[1]所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,所述(A)是在间隔序列的5’末端添加1个以上核苷酸残基且所述间隔序列是相对于靶序列具有1个碱基或多个碱基错配的间隔序列的、向导RNA或编码该向导RNA的表达载体。
[3]根据[1]或[2]所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,被添加至所述间隔序列的5’末端的核苷酸残基全部为相同的核苷酸残基。
[4]根据[3]所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,被添加至所述间隔序列的5’末端的核苷酸残基为胞嘧啶残基或鸟嘌呤残基。
[5]根据[1]~[4]中任一项所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,还包括将(C)供体载体导入细胞的工序。
[6]根据[1]~[5]中任一项所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,所述Cas蛋白为Cas9蛋白。
[7]一种向导RNA,其在间隔序列的5’末端添加有1个以上的核苷酸残基。
[8]根据[7]所述的向导RNA,其中,所述间隔序列相对于靶序列具有1个碱基或多个碱基的错配。
[9]一种[7]或[8]所述的向导RNA的表达载体。
[10]根据[9]所述的表达载体,其还能表达Cas蛋白。
[11]根据[10]所述的表达载体,其中,所述Cas蛋白为Cas9蛋白。
[12]一种仅单侧等位基因经基因组编辑的细胞的制造试剂盒,其中,包含(A),所述(A)为选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)所述(a1)或所述(a2)的向导RNA的表达载体组成的组中的至少1种。
[13]根据[12]所述的制造试剂盒,其中,还包含(B),所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
[14]一种基因组编辑模式的预测方法,包括:
(i)将向导RNA或其表达载体、以及Cas蛋白或其表达载体导入细胞而进行基因组编辑的工序;
(ii)从进行了所述基因组编辑的细胞中提取DNA的工序;
(iii)从所述DNA扩增包含靶区域的DNA片段的工序;
(iv)对所述扩增的DNA片段进行序列分析,求出对所述靶区域的indel诱导率(P)的工序;以及
(v)根据下述式(m)或(m1)以及(b)或(b1),求出对仅单侧等位基因的indel诱导率(mono)及对两侧等位基因的indel诱导率(bi)的工序。
mono=2×P×(1-P)···(m)
bi=P2···(b)
mono=-1.303P2+1.2761P+0.0274···(m1)
bi=0.6515P2+0.3619P-0.0137···(b1)
[15]一种细胞,其中,
一侧等位基因中包含将定位蛋白编码序列、切割位点和第1荧光蛋白编码序列依次框内连接而成的嵌合基因,
另一侧等位基因中包含将所述定位蛋白编码序列、所述切割位点和第2荧光蛋白编码序列依次框内连接而成的嵌合基因。
[16]一种基因组编辑模式的分析方法,包括:
(I)向[15]所述的细胞中导入以所述切割位点作为靶标的向导RNA或其表达载体、以及Cas蛋白或其表达载体而进行基因组编辑的工序;
(II)在所述工序(I)之后对所述细胞的荧光图案进行分析的工序;以及
(III)基于所述工序(II)中已分析的荧光图案判定基因组编辑模式的工序。
发明效果
根据本发明,可提供仅单侧等位基因经基因组编辑的细胞的制造方法、以及能够在上述方法中使用的向导RNA、表达载体、试剂盒。进而,还可提供基因组编辑模式的预测方法、以及基因组编辑模式的分析方法及能够在上述分析方法中使用的细胞。
附图说明
图1A是对实施例中构建的AIMS的概要进行说明的图。图1A是对实施例中制作的AIMS细胞所具有的基因构成进行说明的图。
图1B是对基于AIMS的indel评价方法进行说明的图。
图1C表示在实施例的AIMS细胞的制作中使用的P2A肽编码序列以及向上述序列中导入了沉默突变的aP2A序列。
图2A是表示在实施例的基因组编辑中使用的质粒的构成的图。
图2B是表示在实施例的基因组编辑中使用的质粒的转染后的操作步骤的图。
图3A~3B表示针对两侧等位基因indel及单侧等位基因indel的导入率是否会因向sgRNA的间隔序列中导入相对于靶序列的1个碱基错配而发生变化进行调查得到的结果。图3A表示实施例中使用的间隔序列的一例。
图3B是使用Tbx3-P2A-AIMS作为AIMS细胞进行indel模式分析的结果。
图3C是使用Tbx3-P2A-AIMS作为AIMS细胞进行indel模式分析的结果。
图3D是使用Cdh1-aP2A-AIMS作为AIMS细胞进行indel模式分析的结果。
图4A~4F表示针对两侧等位基因indel及单侧等位基因indel的导入率是否会因在sgRNA的间隔序列的5’末端添加核苷酸残基而发生变化进行调查得到的结果。图4A表示实施例中使用的sgRNA的一例。
图4B是使用Cdh1-P2A-AIMS作为AIMS细胞进行indel模式分析的结果。
图4C是使用Cdh1-P2A-AIMS作为AIMS细胞进行indel模式分析的结果。
图4D表示针对两侧等位基因indel及单侧等位基因indel的导入率是否会因改变所转染的sgRNA表达质粒的量而发生变化进行调查得到的结果。
图4E表示针对两侧等位基因indel及单侧等位基因indel的导入率是否会因改变所转染的sgRNA表达质粒的量而发生变化进行调查得到的结果。将Cas9及嘌呤霉素抗性基因表达质粒与sgRNA表达质粒分离为不同的质粒,仅改变sgRNA表达质粒的量。
图4F表示以Rosa26及白蛋白基因(Alb)作为靶标进行基因组编辑的结果。使用了在间隔序列的5’末端添加了胞嘧啶(C)的sgRNA。
图5A~5C表示使用AIMS细胞对不包含indel的同源重组的导入率进行评价的结果。图5A是对实施例5中使用的方法的概略进行说明的图。
图5B表示使用包含具有1个碱基错配的间隔序列的sgRAN进行同源重组的结果。
图5C表示使用在间隔序列的5’末端添加了胞嘧啶的sgRAN进行同源重组的结果。
图6A~6C表示针对两侧等位基因indel及单侧等位基因indel的导入率是否会因组合了1个碱基错配的导入与核苷酸残基在5’末端上的添加而发生变化进行调查得到的结果。图6A表示使用了相对于靶序列具有1个碱基错配的sgRNA的结果。
图6B表示使用下述sgRNA的结果,该sgRNA包含相对于靶序列具有1个碱基错配且在5’末端添加有10个胞嘧啶的间隔序列。
图6C表示使用下述sgRNA的结果,该sgRNA包含相对于靶序列具有1个碱基错配且在5’末端添加有25个胞嘧啶的间隔序列。
图7表示根据实施例7中记载的式(m)算出的单侧等位基因indel的频率与图3B~3D、图4B及图6A~6C中实际检测到的单侧等位基因indel的频率的相关关系。
图8A~8B表示将Pre-Demo-Prediction的预测值与实测值进行比较的结果。图8A表示Pre-Demo-Prediction的操作方案。
图8B表示Pre-Demo-Prediction的预测值(左图)及实测值(右图)。
图9A表示针对是否能够通过在间隔序列的5’末端添加核苷酸残基来抑制脱靶效应进行调查得到的结果。图9A表示基于图6A~6C的数据并根据实施例7中记载的式(1)算出indel诱导率(P)的结果。
图9B表示对由在间隔序列的5’末端添加胞嘧啶所获得的、脱靶作用的抑制效果进行验证得到的结果。其是将在EMX1基因中的相对于靶序列(GAGTCCGAGCAGAAGAAGAA:序列号83的第5~24位)而言的间隔序列的5’末端添加了0个、10个或25个胞嘧啶的sgRNA表达载体导入HEK293T中、并对中靶区域及作为脱靶区域的MFAP1基因区域(GAGTCtaAGCAGAAGAAGAA:序列号91;用小文字表示EMX1基因中的与靶序列不同的部分)中的indel进行验证得到的结果。
图9C表示对由在间隔序列的5’末端添加胞嘧啶所获得的、脱靶作用的抑制效果进行验证得到的结果。在与图9B相同的条件下,将间隔序列的5’末端的胞嘧啶的添加数量设为0个、5个、10个、15个、20个、25个或30个。
图10A~10C表示进行性骨化性纤维发育不良(FOP)中的遗传性疾病变异的修复试验的结果。图10A表示FOP遗传性疾病变异修复方法的概要。
图10B是针对使用具有FOP遗传性疾病变异(wt/R206H)的人iPS细胞进行了修复变异等位基因(R206H)的HDR诱导时的HDR诱导效率进行评价得到的结果。
图10C是针对在具有FOP遗传性疾病变异(wt/R206H)的人iPS细胞中通过以变异等位基因(R206H)作为靶标的基因组编辑所获得的indel导入效率进行评价得到的结果。
图11A~11D表示FOP遗传性疾病模型的制作试验的结果。图11A表示FOP遗传性疾病变异诱导方法的概要。
图11B是针对使用小鼠ES细胞(wt/wt)进行了诱导变异等位基因(R206H)的HDR诱导时的HDR诱导效率进行评价得到的结果。
图11C是针对在小鼠ES细胞(wt/wt)中通过以Acvr1基因(wt)作为靶标的基因组编辑所获得的indel导入效率进行评价得到的结果。
图11D是表示在嵌合小鼠中形成的异常的骨(箭头)的照片,所述嵌合小鼠是将通过HDR诱导制作的具有FOP遗传性疾病变异(wt/R206H)的小鼠ES细胞微注射至小鼠受精卵所制作的。
图12A表示使用了AIMS的细胞毒性评价试验的结果。
图12B表示通过以ACVR1作为靶标的基因组编辑所进行的细胞毒性评价试验的结果。
图13A是以由基于AIMS的253个数据算出的P值作为横轴、并且以两侧等位基因indel比例(Bi;上图)、单侧等位基因indel(Mono;中图)及无indel(Nono;下图)的比例作为纵轴而绘制得到的图。
图13B表示利用由图13A的图得到的数式对两侧等位基因indel比例(Bi;上图)、单侧等位基因indel(Mono;中图)及无indel(None;下图)的比例进行预测得到的结果。实际的实测值(横轴)与基于数式得到的预测值(纵轴)显示出高相关性。
图13C表示Cdh1-P2A-AIMS中以P2A作为靶标进行基因组编辑的结果。上图表示Cdh1-P2A-AIMS中以P2A作为靶标进行基因组编辑时的实际数据。中图表示将由所得的数据利用上述式(1)算出的P值代入图13A的数式(P=x)而作成的预测图表。下图表示基于本发明的一个实施方式的基因组编辑模式的预测方法得到的indel模式预测图表。
图14A表示复合杂合子(Compound heterozygous)的制作方法的概略。其示出P2A-sgRNA1及Cdh1-sgRNA4的靶位置。
图14B表示复合杂合子的制作方法的概略。其示出基于P2A-sgRNA1及Cdh1-sgRNA4进行的基因组编辑后的基因组构成和各引物的退火位置。
图15表示基于添加了0个、10个、或25个胞嘧啶的sgRNA进行的体外切割测定的结果。
具体实施方式
[定义]
在本说明书中,术语“多核苷酸”及“核酸”可以彼此互换地使用,是指核苷酸通过磷酸二酯键键合而成的核苷酸聚合物。“多核苷酸”及“核酸”可以是DNA,也可以是RNA,还可以由DNA与RNA的组合构成。另外,“多核苷酸”及“核酸”可以是天然核苷酸的聚合物,也可以是天然核苷酸与非天然核苷酸(天然核苷酸的类似物、碱基部分、糖部分及磷酸部分中的至少一个部分被修饰的核苷酸(例如硫代磷酸酯骨架)等)的聚合物,还可以是非天然核苷酸的聚合物。
在本说明书中,只要没有特别说明,“多核苷酸”或“核酸”的碱基序列以通常认可的单字母代码来记载。只要没有特别说明,碱基序列从5’侧向3’侧记载。
在本说明书中,构成“多核苷酸”或“核酸”的核苷酸残基有时简单记载为腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤或尿嘧啶等、或者它们的单字母代码。
在本说明书中,术语“基因”是指包含编码特定蛋白的至少1个开放读码框的多核苷酸。基因可包含外显子及内含子两者。
在本说明书中,术语“多肽”、“肽”及“蛋白”可以彼此互换地使用,是指通过酰胺键键合而成的氨基酸的聚合物。“多肽”、“肽”或“蛋白”可以是天然氨基酸的聚合物,也可以是天然氨基酸与非天然氨基酸(天然氨基酸的化学类似物、修饰衍生物等)的聚合物,还可以是非天然氨基酸的聚合物。只要没有特别说明,氨基酸序列从N末端侧向C末端侧记载。
在本说明书中,术语“等位基因”是指在1对染色体上的同一基因座中所存在的1对基因或在同一座位中所存在的1对碱基序列。上述1对基因不是必须为为对立基因,上述1对碱基序列不是必须为不同的碱基序列。术语“两侧等位基因”是指上述1对基因或1对碱基序列两者,术语“单侧等位基因”是指上述1对基因或1对碱基序列中的任一者。
在本说明书中,术语“基因组编辑”是指对基因组上的所期望的位置(靶区域)诱导变异。基因组编辑可包括以切割靶区域的DNA的方式进行操作的核酸酶的使用。典型而言,通过部位特异性核酸酶的使用,从而对靶区域的DNA诱导双链切割(DSB),之后,通过如同源重组修复(Homologous Directed Repair:HDR)及非同源末端连接修复(Non-HomologousEnd-Joining Repair:NHEJ)之类的、细胞的内源过程来修复基因组。NHEJ是不使用修复用模板DNA而将被双链切割的末端连接的修复方法,在修复时高频率地诱导插入和/或缺失(indel)。HDR是使用了修复用模板DNA的修复机构,还能对靶区域导入所期望的变异。作为基因组编辑技术,例如,优选举出CRISPR/Cas系统。
在本说明书中,术语“修复用模板DNA”是在DNA的双链切割的修复中所使用的DNA,是指能与靶区域周边的DNA同源重组的DNA。
在本说明书中,术语“供体载体”是指被用作修复用模板DNA的外源性DNA。供体载体包含作为同源臂与靶区域邻接的碱基序列。在本说明书中,有时将由与靶区域的5’侧邻接的碱基序列构成的同源臂记载为“5为臂”、将由与靶序列的3’侧邻接的碱基序列构成的同源臂记载为“3’臂”。供体载体可以在5以臂与3以臂之间包含所期望的碱基序列。各同源臂的长度优选为3kb以上,通常为5~10kb左右。5右臂及3右臂的长度可以相同,也可以不同,但优选相同。
在本说明书中,术语“安全港区域”是指经实验证实了不对细胞显示有害效果便能插入外源DNA的基因组上的区域。作为安全港区域,已知例如人的AAVS1、小鼠的Rosa26等。
在本说明书中,术语“Cas蛋白”是指CRISPR相关(CRISPR-associated)蛋白。在优选的方式中,Cas蛋白与向导RNA形成复合体,显示内切核酸酶活性或切口酶活性。作为Cas蛋白,并无特别限定,可列举例如Cas9蛋白、Cpf1蛋白、C2c1蛋白、C2c2蛋白及C2c3蛋白等。Cas蛋白只要与向导RNA协作而显示内切核酸酶活性或切口酶活性,则可包含野生型Cas蛋白及其同源物(旁系同源物及直系同源物)、以及它们的变异体。
在优选的方式中,Cas蛋白为与第2类CRISPR/Cas系统相关的蛋白,更优选为与II型CRISPR/Cas系统相关的蛋白。作为Cas蛋白的优选例,可例示Cas9蛋白。
在本说明书中,术语“Cas9蛋白”是指与II型CRISPR/Cas系统相关的Cas蛋白。Cas9蛋白与向导RNA形成复合体,并且与向导RNA协作而显示切割靶区域的DNA的活性。Cas9蛋白只要具有上述活性,则可包含野生型Cas9蛋白及其同源物(旁系同源物及直系同源物)、以及它们的变异体。野生型Cas9蛋白具有作为核酸酶结构域的RuvC结构域及HNH结构域,但是,本说明书中的Cas9蛋白也可以是RuvC结构域及HNH结构域的任一者失活的蛋白。
Cas9蛋白的源性生物种类并无特别限定,可优选例示属于链球菌(Streptococcus)属、葡萄球菌(Staphylococcus)属、奈瑟菌(Neisseria)属或密螺旋体(Treponema)属的细菌等。更具体而言,可优选例示来自酿脓链球菌(S.pyogenes)、嗜热链球菌(S.thermophilus)、金黄色葡萄球菌(S.aureus)、脑膜炎奈瑟菌(N.meningitidis)或齿垢密螺旋体(T.denticola)等的Cas9蛋白。在优选的方式中,Cas9蛋白是来自S.pyogenes的Cas9蛋白。
各种Cas蛋白的氨基酸序列及其编码序列的信息可以在GenBank、UniProt等各种数据库上获得。例如S.pyogenes的Cas9蛋白的氨基酸序列可以使用以登录号Q99ZW2登记于UniProt的氨基酸序列。将S.pyogenes的Cas9蛋白的编码序列的一例示于序列号9。序列号9所示的碱基序列是在S.pyogenes的Cas9蛋白的5’末端添加有3×Flag及核定位信号、并且在3’末端添加有核定位信号的碱基序列。
在本说明书中,术语“向导RNA”及“gRNA”可以彼此互换地使用,是指能够与Cas蛋白形成复合体、并在靶区域诱导Cas蛋白的RNA。在优选的方式中,向导RNA包含CRISPR RNA(crRNA)及反式激活型CRISPR RNA(tracrRNA)。crRNA参与向基因组上的靶区域的结合,tracrRNA参与与Cas蛋白的结合。在优选的方式中,crRNA包含间隔序列和重复序列,间隔序列在靶区域中与靶序列的互补链结合。在优选的方式中,tracrRNA包含反向重复序列(anti-repeat sequence)和3’尾部序列。反向重复序列具有与crRNA的重复序列互补的序列,并且与重复序列形成碱基对,3’尾部序列通常形成3个茎环。
向导RNA可以是在crRNA的3’末端上连接tracrRNA的5’末端而成的单链向导RNA(sgRNA),也可以将crRNA及tracrRNA设为不同的RNA分子、并且以重复序列及反向重复序列形成碱基对。在优选的方式中,向导RNA为sgRNA。
crRNA的重复序列及tracrRNA的序列可以根据Cas蛋白的种类来适当选择,可以使用来自与Cas蛋白相同的细菌种类的序列。
例如,在使用来自S.pyogenes的Cas9蛋白的情况下,sgRNA的长度可以为50~220核苷酸(nt)左右,优选为60~180nt左右,更优选为80~120nt左右。crRNA的长度包括间隔序列在内可以为约25~70个碱基长,优选为25~50nt左右。tracrRNA的长度可以为10~130nt左右,优选为30~80nt左右。
crRNA的重复序列可以与Cas蛋白的源性细菌种类中的重复序列相同,也可以是删除了3’末端的一部分的重复序列。tracrRNA可以具有与Cas蛋白的源性细菌种类中的成熟tracrRNA相同的序列,也可以是切割了该成熟tracrRNA的5’末端和/或3’末端的末端切割型。例如,tracrRNA可以是从成熟tracrRNA的3’末端除去了1~40个左右的核苷酸残基的末端切割型。另外,tracrRNA可以是从成熟tracrRNA的5’末端除去了1~80个左右的核苷酸残基的末端切割型。另外,tracrRNA可以是例如从5’末端除去了1~20左右的核苷酸残基、且从3’末端除去了1~40个左右的核苷酸残基的末端切割型。
用于设计sgRNA的crRNA重复序列及tracrRNA的序列已经提出各种方案,本领域技术人员可以基于公知技术来设计sgRNA(例如Jinek et al.(2012)Science,337,816-21;Mali et al.(2013)Science,339:6121,823-6;Cong et al.(2013)Science,339:6121,819-23;Hwang et al.(2013)Nat.Biotechnol.31:3,227-9;Jinek et al.(2013)eLife,2,e00471)。
在本说明书中,术语“靶序列”是指成为基于Cas蛋白进行切割的对象的、基因组中的DNA序列。在使用Cas9蛋白作为Cas蛋白的情况下,靶序列需要为与前间隔序列邻近基序(PAM)的5’侧邻接的序列。靶序列通常选择紧接在PAM的5’侧前的17~30个碱基(优选为18~25个碱基,更优选为19~22个碱基,进一步优选为20个碱基)的序列。在靶序列的设计中可以利用CRISPR DESIGN(crispr.mit.edu/)等公知的设计工具。
在本说明书中,术语“靶区域”是指包含靶序列及其互补链的基因组区域。
在本说明书中,术语“前间隔序列邻近基序”及“PAM”可以彼此互换地使用,是指在基于Cas蛋白进行DNA切割时被Cas蛋白识别的序列。PAM的序列及位置因Cas蛋白的种类而异。例如在Cas9蛋白的情况下,PAM需要紧接在靶序列的3’侧后。与Cas9蛋白对应的PAM的序列因Cas9蛋白的源性细菌种类而异。例如与S.pyogenes的Cas9蛋白对应的PAM为“NGG”,与S.thermophilus的Cas9蛋白对应的PAM为“NNAGAA”,与S.aureus的Cas9蛋白对应的PAM为“NNGRRT”或“NNGRR(N)”,与N.meningitidis的Cas9蛋白对应的PAM为“NNNNGATT”,与T.denticola的Cas9蛋白对应的PAM为“NAAAAC”(“R”为A或G;“N”为A、T、G或C)。
在本说明书中,术语“间隔序列”及“向导序列”可以彼此互换地使用,是指向导RNA中所含的序列、且可与靶序列的互补链结合的序列。通常,间隔序列是与靶序列相同的序列(但是,靶序列中的T在间隔序列中变成U)。在本发明的实施方式中,间隔序列可以相对于靶序列包含1个碱基或多个碱基的错配。在包含多个碱基的错配的情况下,可以在邻接的位置具有错配,也可以在分离开的位置具有错配。在优选的方式中,间隔序列可以相对于靶序列包含1~5个碱基的错配。在特别优选的方式中,间隔序列可以相对于靶序列包含1个碱基的错配。
在向导RNA中,间隔序列配置于crRNA的5’侧。
在本说明书中,术语“错配”是指间隔序列包含与靶序列不同的碱基、或者间隔序列为该不同的碱基。例如“间隔序列包含1个碱基错配”是指间隔序列与靶序列相比有1个碱基不同。
在本说明书中,术语“indel”是指插入和/或缺失(insertion/deletion)。
在本说明书中,术语“两侧等位基因indel”是指因基因组编辑而在两侧等位基因的靶区域产生indel的状态。
在本说明书中,术语“单侧等位基因indel”是指因基因组编辑而仅在单侧等位基因的靶区域产生indel的状态。
在本说明书中,术语“框移indel”是指发生框移的indel。
在本说明书中,术语“框内indel”是指未发生框移的indel。
在本说明书中,术语“AIMS”是指等位基因特异性Indel监控系统(Allele-specific Indel Monitor System),是指能够等位基因特异性地检出indel的技术。
在本说明书中,术语“AIMS细胞”是指为了进行AIMS而构建的细胞,是指能够等位基因特异性地检出indel的细胞。
在本说明书中,术语“嵌合基因”是指将2个以上的不同蛋白的编码序列在框内连接而成的多核苷酸。术语“嵌合蛋白”是指由嵌合基因表达的蛋白。
在本说明书中,术语“定位蛋白”是指定位在细胞中的某个部分(例如核或细胞膜)内存在的蛋白。“核定位蛋白”是指定位在核内存在的蛋白,“细胞膜定位蛋白”是指定位在细胞膜内存在的蛋白。
本说明书中所使用的术语“切割位点”是指:例如为了使其被切割酶识别、且/或可被切割酶分割而将该序列定向分割的、氨基酸序列或核苷酸序列。典型而言,在切割位点处,多肽链因结合氨基酸的一个以上的肽键的水解而被切割。另外,在切割位点处,多核苷酸链因核苷酸间的一个以上的磷酸二酯键的水解而被切割。肽键或磷酸二酯键的切割可以来自化学切割或酶切割。就酶切割而言,在多核苷酸链的情况下,例如是指通过限制内切核酸酶(例如I型、II型、III型、IV型或人工的限制酶)达成的、多核苷酸的切割。在多肽链的情况下,是指通过蛋白分解酶达成的、多肽的切割,所述蛋白分解酶可列举出内肽酶、外肽酶或蛋白酶(例如丝氨酸-蛋白酶、半胱氨酸-蛋白酶、金属-蛋白酶、苏氨酸-蛋白酶、天冬氨酸-蛋白酶、谷氨酸-蛋白酶)等,但并不限定于此。典型而言,酶切割因自切割而发生、或通过独立的蛋白分解酶来达成。蛋白或多肽的酶切割在翻译的同时或翻译后均可发生。因此,本说明书中所使用的术语“内肽酶切割位点”是指:该序列被内肽酶(例如胰蛋白酶、胃蛋白酶、弹性蛋白酶、凝血酶、胶原酶、弗林蛋白酶、嗜热菌蛋白酶、内肽酶V8、组织蛋白酶)切割或可被上述内肽酶切割的、氨基酸序列内的切割位点。切割位点可以通过自蛋白酶(即,也包含蛋白酶的将同一蛋白分子内的肽键进行切割的蛋白酶)来进行切割。作为该自蛋白酶的例子,可列举黄病毒的NS2蛋白酶或双核糖核酸病毒的VP4蛋白酶。或者,术语“切割位点”是指阻止氨基酸间形成肽键或核苷酸间形成磷酸二酯键的、氨基酸序列或核苷酸序列。例如,可能会因与多肽的翻译同时发生的自加工而妨碍肽键的形成,所述自加工会带来源自单个开放读码框的单个翻译事件的2个非连续的翻译产物。典型而言,该自加工通过由伪终止密码子(pseudo stop-codon)序列引起的“核糖体跳跃(ribosomal skip)”来达成,其诱导翻译复合体从一个密码子移动到下一个密码子而不形成肽键。作为诱导核糖体跳跃的序列的例子,可列举被若干病毒家族(包括小核糖核酸病毒、昆虫病毒、口蹄疫病毒科(Aphtoviridae)、轮状病毒及锥虫(Trypanosoma))使用的病毒2A肽或2A样肽(在本说明书中,将两者统称为“2A肽”),但不限于此。最常见的是通常用于由单个ORF产生多个多肽的、小核糖核酸病毒科家族的鼻病毒及口蹄疫病毒的2A肽。
因此,本说明书中所使用的术语“自切割位点”是指氨基酸序列内或核苷酸序列内的切割位点,能够无需任意其他分子即切割该序列或可能切割该序列、或者能够在最初的阶段(例如经由如上述那样的与翻译同时发生的自加工)阻止该序列内形成肽键或磷酸二酯键。可理解为:切割位点通常包含若干个氨基酸、或者被若干个密码子编码(例如在这样的情况下,“切割位点”不翻译成蛋白但会对翻译造成干扰)。因此,切割位点也起到肽接头的作用,即在空间上分离两个肽。因此,在一些实施方式中,“切割位点”既是肽接头,又提供上述的切割功能。在该实施方式中,切割位点可以包含其他N和/或C末端氨基酸。
在本说明书中,术语“2A肽”是指病毒的2A肽或2A样肽。2A肽是被肽酶或核糖体跳跃机构切割的肽。作为2A肽,可列举例如来自口蹄疫病毒(FMDV)的2A肽(F2A)、来自马鼻炎A病毒(ERAV)的2A肽(E2A)、来自猪捷申病毒(Porcine teschovirus)(PTV-1)的2A肽(P2A)及来自明脉扁刺蛾病毒(Thosea asigna virus)(TaV)的2A肽(T2A)等。
在本说明书中,术语“基因组编辑模式”是指成为基因组编辑对象的细胞的靶区域的各等位基因中的基因组编辑的诱导状态。即,是指在两侧等位基因诱导基因组编辑、或者仅在单侧等位基因诱导基因组编辑这样的状态。
在本说明书中,与多核苷酸关联使用的术语“功能性连接”是指第一碱基序列被配置于充分接近第二碱基序列的部位、并且第一碱基序列可能对第二碱基序列或第二碱基序列的控制下的区域造成影响。例如,多核苷酸与启动子功能性连接是指该多核苷酸以在该启动子的控制下得以表达的方式被连接。
在本说明书中,术语“可表达的状态”是指处于可在导入了多核苷酸的细胞内转录该多核苷酸的状态。
在本说明书中,术语“表达载体”是包含对象多核苷酸的载体,是指具备在导入了该载体的细胞内使对象多核苷酸为可表达的状态的系统的载体。例如,“Cas蛋白的表达载体”是指在导入了该载体的细胞内可表达Cas蛋白的载体。另外,例如,“向导RNA的表达载体”是指在导入了该载体的细胞内可表达向导RNA的载体。
在本说明书中,术语“沉默突变”是指所编码的蛋白的氨基酸序列不发生变化的基因变异。
在本说明书中,碱基序列之间或氨基酸序列之间的序列一致性(或同源性)以下述比例的形式求出,即,将2个碱基序列或氨基酸序列并列放置同时以使对应的碱基或氨基酸最多一致的方式在相当于插入及缺失的部分加入空位(gap),在不包括所得比对中的空位的条件下求出一致的碱基或氨基酸相对于碱基序列整体或氨基酸序列整体的比例。碱基序列或氨基酸序列之间的序列一致性可以使用该技术领域中公知的各种同源性检索软件来求得。例如,碱基序列的序列一致性的值可以基于由公知的同源性检索软件BLASTN得到的比对进行计算来得到,氨基酸序列的序列一致性的值可以通过基于由公知的同源性检索软件BLASTP得到的比对进行计算来得到。
[仅单侧等位基因经基因组编辑的细胞的制造方法]
在一个实施方式中,本发明提供一种仅单侧等位基因经基因组编辑的细胞的制造方法,包括将(A)和(B)导入细胞的工序,所述(A)为选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种,所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
<(A)向导RNA>
在本实施方式的制造方法中,使用选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种。
《(a1)的向导RNA》
(a1)的向导RNA是在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA。通过使用该向导RNA进行基因组编辑,从而仅单侧等位基因处被基因组编辑的比例提高,能够制造仅单侧等位基因经基因组编辑的细胞。
间隔序列只要是以任意的靶序列作为靶标的间隔序列即可,并无特别限定。间隔序列的长度只要是与靶序列对应的长度即可,通常选择17~30个碱基、优选为18~25个碱基、更优选为19~21个碱基、进一步优选为20个碱基的序列。
通常,间隔序列是与靶序列相同的序列(但是,靶序列中的“T”在间隔序列中变成“U”),只要具有与靶序列的互补链的结合能力,则也可以具有错配。一般而言,容许在间隔序列的5’侧出现错配。在本实施方式的制造方法中,优选如后述(a2)的向导RNA那样相对于靶序列具有1个碱基错配的间隔序列。
添加至间隔序列的5’末端的核苷酸残基(以下有时称作“添加核苷酸残基”)为1个以上,并无特别限定,可列举例如1~50个的范围。所添加的核苷酸残基的数量可以根据间隔序列的种类来适当设定。例如,所添加的核苷酸残基的数量可以为5个以上、10个以上、15个以上、20个以上或25个以上等。若添加核苷酸残基的数量为上述下限值以上,则可以进一步提高仅单侧等位基因处被基因组编辑的比例。添加核苷酸残基数的上限并无特别限定,从不改变仅单侧等位基因处被基因组编辑的比例的方面考虑,例如可以为50个以下,优选为40个以下,更优选为35个以下。作为添加核苷酸残基数的优选范围,可例示例如5~50个,优选为5~40个、5~35个、10~40个、10~35个、15~35个或20~30个等。
添加核苷酸残基的种类并无特别限定,例如可以全部为相同的核苷酸残基。例如,添加核苷酸残基可以从由聚腺嘌呤(聚A)、聚尿嘧啶(聚U)、聚胞嘧啶(聚C)及聚鸟嘌呤(聚G)组成的组中进行选择。其中,从提高仅单侧等位基因处被基因组编辑的比例的方面考虑,添加核苷酸残基的种类优选为聚C(全部为胞嘧啶残基)或聚G(全部为鸟嘌呤残基),更优选为聚C。
如后述(a3)的表达载体那样,在使用编码(a1)的向导RNA的表达载体的情况下,添加多核苷酸残基通常不包括终止序列(其终止来自所用启动子的转录)的互补序列。例如,在使用U6启动子的情况下,若5个胸腺嘧啶连续,则转录终止,因此添加核苷酸残基通常不包含5个以上连续的尿嘧啶的序列。
《(a2)的向导RNA》
(a2)的向导RNA是包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA。通过使用该向导RNA进行基因组编辑,从而仅单侧等位基因处被基因组编辑的比例提高,能够制造仅单侧等位基因经基因组编辑的细胞。
(a2)的向导RNA的间隔序列相对于任意的靶序列具有1个碱基或多个碱基错配。多碱基错配例如为2~5个碱基错配,优选为2~4个碱基错配,更优选为2或3个碱基错配,进一步优选为2个碱基错配。间隔序列的长度与上述(a1)的向导RNA同样,但特别优选为20个碱基。
间隔序列相对于靶序列具有1个碱基或多个碱基错配的位置并无特别限定。例如,在间隔序列为20个碱基的情况下,可以是从3’末端侧向5’末端侧计数在第1~20的任意碱基上存在错配,例如可以在第1~17的碱基上具有错配。通过使间隔序列在上述范围具有1个碱基错配,从而可以进一步提高仅单侧等位基因处被基因组编辑的比例。作为一例,可以在选自由从3’末端侧向5’末端侧计数在第2~6、第8~9及第15~17组成的组中的1个碱基或多个碱基上具有错配。
错配碱基中的碱基只要是与靶序列中的碱基不同的碱基即可,并无特别限定。例如,如果靶序列中的碱基为嘌呤碱基(腺嘌呤或鸟嘌呤),则间隔序列中的错配碱基可以为嘧啶碱基(胞嘧啶或尿嘧啶)。同样,例如,如果靶序列中的碱基为嘧啶碱基(胞嘧啶或胸腺嘧啶),则间隔序列中的错配碱基可以为嘌呤碱基(腺嘌呤或鸟嘌呤)。例如,如果靶序列中的碱基为腺嘌呤,则间隔序列中的错配碱基可以为尿嘧啶,如果靶序列中的碱基为胸腺嘧啶,则间隔序列中的错配碱基可以为腺嘌呤,如果靶序列中的碱基为鸟嘌呤,则间隔序列中的错配碱基可以为胞嘧啶,如果靶序列中的碱基为胞嘧啶,则间隔序列中的错配碱基可以为鸟嘌呤。
《具有(a1)及(a2)的特征的向导RNA(a12)》
本实施方式的制造方法中使用的向导RNA可以是兼具上述(a1)及(a2)的向导RNA的特征的向导RNA。即,向导RNA可以是在间隔序列的5’末端添加1个以上的核苷酸残基且上述间隔序列是相对于靶序列具有1个碱基或多个碱基错配的间隔序列的、向导RNA。
通过兼具上述(a1)及(a2)的特征,从而可以提高仅单侧等位基因处被基因组编辑的比例。添加核苷酸残基的数量及种类与上述“《(a1)的向导RNA》”中列举的添加核苷酸残基的数量和种类同样。另外,错配碱基的位置及种类与上述《(a2)的向导RNA》”中列举的错配碱基的位置及种类同样。
《(a3)向导RNA的表达载体》
在本实施方式的制造方法中,可以代替上述(a1)、(a2)或(a12)的向导RNA而使用上述(a1)、(a2)或(a12)的向导RNA的表达载体。在优选的方式中,本实施方式的制造方法使用上述(a1)、(a2)或(a12)的向导RNA的表达载体。
上述(a1)、(a2)或(a12)的向导RNA的表达载体优选包含编码上述(a1)、(a2)或(a12)的向导RNA的序列和控制上述向导RNA编码序列的表达的启动子。在表达载体中,向导RNA编码序列与启动子功能性连接。
启动子并无特别限定,例如也可以使用pol II系启动子,但是,从更准确地进行较短的RNA的转录的观点考虑,优选pol III系启动子。作为pol III系启动子,并无特别限制,可列举例如小鼠及人的U6-snRNA启动子、人H1-RNase P RNA启动子、人缬氨酸-tRNA启动子等。在使用U6启动子的情况下,为了启动转录,向导RNA的5’末端优选为“G”。因此,在向导RNA为上述(a1)或(a12)的向导RNA的情况下,优选在添加至间隔序列的5’末端的5~50个核苷酸残基的5’末端进一步添加“G”。另外,在向导RNA为上述(a2)的向导RNA的情况下,优选选择5’末端为“G”的间隔序列、或者在间隔序列的5’末端添加“G”。
除向导RNA的编码序列及启动子外,表达载体还可以根据需要包含增强子、多腺苷酸化信号、标记物基因、复制起点、编码与复制起点结合来控制复制的蛋白的基因等。“标记物基因”是指能够通过将该标记物基因导入细胞来进行细胞的挑选、选择的基因。作为标记物基因的具体例,可列举例如耐药性基因、荧光蛋白基因、发光酶基因、发色酶基因等。它们可以单独使用1种,也可以并用2种以上。作为上述耐药性基因的具体例,可列举例如嘌呤霉素抗性基因、遗传霉素抗性基因、新霉素抗性基因、四环素抗性基因、卡那霉素抗性基因、博莱霉素(zeocin)抗性基因、潮霉素抗性基因、氯霉素抗性基因等。作为上述荧光蛋白基因的具体例,可列举例如绿色荧光蛋白(GFP)基因、黄色荧光蛋白(YFP)基因、红色荧光蛋白(RFP)基因等。作为上述发光酶基因的具体例,可列举例如荧光素酶基因等。作为上述发色酶基因的具体例,可列举例如β-半乳糖苷酶基因、β-葡糖苷酸酶基因、碱性磷酸酶基因等。
表达载体的种类并无特别限定,可以使用公知的表达载体。
作为表达载体,可列举例如质粒载体及病毒载体等。
质粒载体只要是可在成为基因组编辑对象的细胞内表达的质粒载体即可,并无特别限定。例如在为动物细胞的情况下,作为动物细胞表达用质粒载体,可以使用通常所使用的质粒载体。作为动物细胞表达用质粒载体,可列举但不限于例如pX459、pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo等。
作为病毒载体,可列举例如逆转录病毒(包括慢病毒)载体、腺病毒载体、腺伴随病毒载体、仙台病毒载体、疱疹病毒载体、牛痘病毒载体、痘病毒载体、脊髓灰质炎病毒载体、辛德毕斯病毒(Sindbis virus)载体、弹状病毒载体、副粘病毒载体、正粘病毒载体等。
其中,作为表达载体,优选质粒载体。
<(B)Cas蛋白>
《Cas蛋白》
Cas蛋白只要是在CRISPR/Cas系统中所使用的Cas蛋白即可,并无特别限定。例如可以使用能够与向导RNA形成复合体、并且被向导RNA诱导至靶区域而对靶区域的DNA进行双链切割的各种Cas蛋白。
在本实施方式的制造方法中,Cas蛋白优选为Cas9蛋白,更优选为S.pyogenes的Cas9蛋白。
Cas蛋白只要是与向导RNA形成复合体、并且显示内切核酸酶活性或切口酶活性(以下称作“Cas蛋白活性”)的Cas蛋白即可,可以为野生型Cas蛋白的变异体。作为Cas蛋白的变异体,可例示例如以下(b1)或(b2)的蛋白。
(b1)蛋白,包含与野生型Cas蛋白的氨基酸序列具有例如85%以上、优选90%以上、更优选95%以上、进一步优选98%以上的序列一致性的氨基酸序列、且具有Cas蛋白活性。
(b2)蛋白,包含对野生型Cas蛋白的氨基酸序列置换、缺失、添加或插入1个或多个(例如2~100个、优选2~50个、更优选2~20个、进一步优选2~10个、更进一步优选2~5个、特别优选2个)氨基酸而成的氨基酸序列,并且具有Cas蛋白活性。
《Cas蛋白的表达载体》
在本实施方式的制造方法中,可以代替上述Cas蛋白而使用Cas蛋白的表达载体。在优选的方式中,本实施方式的制造方法使用Cas蛋白的表达载体。
Cas蛋白的表达载体优选包含Cas蛋白的编码序列和控制上述Cas蛋白编码序列的表达的启动子。在表达载体中,Cas蛋白编码序列与启动子功能性连接。
启动子并无特别限定,例如可以使用各种pol II系启动子。作为pol II系启动子,并无特别限制,可列举例如CMV启动子、EF1启动子、SV40启动子、MSCV启动子、hTERT启动子、β-肌动蛋白启动子、CAG启动子、CBh启动子等。
表达载体除Cas蛋白编码序列及启动子外还可以根据需要包含增强子、多腺苷酸化信号、标记物基因、复制起点、编码与复制起点结合来控制复制的蛋白的基因等。作为标记物基因,可列举与上述同样的基因。
表达载体的种类并无特别限定,可以使用公知的表达载体。
作为表达载体,可列举例如质粒载体及病毒载体等。作为这些载体,可列举与上述同样的载体。
其中,作为表达载体,优选质粒载体。
表达载体中所含的Cas蛋白编码序列可以根据导入该表达载体的细胞的源性生物种类进行密码子优化。一般而言,密码子优化是指维持原有的氨基酸序列、并且将原有碱基序列的至少1个密码子用在对象生物种中更频繁使用的密码子进行置换。密码子使用频率表可易于在例如公益财团法人Kazusa DNA研究所提供的“Codon Usage Database”(www.kazusa.or.jp/codon/)中获得,可以使用这些表来优化密码子。关于用于为了在特定的动物种中表达而对特定的序列进行密码子优化的计算机算法,也可在例如Gene Forge(Aptagen公司;Jacobus、PA)等中获得。
向导RNA的表达载体与Cas蛋白的表达载体可以是相同的表达载体。即,在本实施方式的制造方法中,可以使用以分别可表达的状态含有向导RNA编码序列和Cas蛋白编码序列的表达载体。在该表达载体中,向导RNA编码序列和Cas蛋白编码序列优选分别与不同的启动子功能性连接。
<导入工序>
在本实施方式的制造方法中包括将(A)以及(B)导入细胞的工序,所述(A)为上述(a1)、(a2)或(a12)的向导RNA或者其表达载体,所述(B)为Cas蛋白或其表达载体。
导入上述(A)及(B)的细胞并无特别限定,可以使用成为基因组编辑对象的所需细胞。细胞的源性生物并无特别限定,可列举:人、猴、小鼠、大鼠、狗、猫、兔、牛、马、猪、山羊、绵羊等哺乳类动物;鸡等鸟类动物;蛇、蜥蜴等爬虫类动物;非洲爪蟾(Xenopus laevis)等两栖类动物;斑马鱼、青鳉鱼、河豚等鱼类动物;海鞘等的脊索动物;斑翅果蝇、蚕等节肢动物;等等的动物;拟南芥、稻、小麦、烟等植物;酵母、粗壮脉纹孢菌等菌类;大肠菌、枯草菌、蓝藻等细菌等。
细胞的种类并无特别限定,可列举例如来自各种组织的细胞或各种性质的细胞、例如血液细胞、造血干细胞·前体细胞、配子(精子、卵子)、受精卵、成纤维细胞、上皮细胞、血管内皮细胞、神经细胞、肝细胞、角蛋白生成细胞、肌细胞、表皮细胞、内分泌细胞、组织干细胞、iPS细胞、ES细胞、癌细胞等。另外,还可列举具有镰刀形红细胞贫血症、亨廷顿舞蹈病、假肥大型肌营养不良症、进行性骨化性纤维发育不良(FOP)等各种遗传性疾病的细胞等。
上述(A)及(B)的导入方法并无特别限定,可以根据对象细胞、材料的种类(是核酸还是蛋白等)进行适当选择。
作为表达载体导入至细胞中的导入方法,可列举例如脂质转染法、微注射法、DEAE葡聚糖法、基因枪法、电穿孔法、磷酸钙法等。在表达载体为病毒载体的情况下,作为使细胞感染病毒载体的方法,可列举例如凝聚胺法。
将RNA导入细胞的方法并无特别限定,可以适当选择公知的方法。例如,RNA可以使用Lipofectamine(注册商标)MessengerMAX(Life Technologies公司制)等市售的RNA转染试剂等。
将蛋白导入细胞的方法并无特别限定,可以适当选择使用公知的方法。作为这样的方法,可列举例如使用蛋白导入试剂的方法、使用蛋白导入结构域(PTD)融合蛋白的方法、微注射法等。
上述(A)及(B)可以同时导入细胞,也可以逐次地导入,或者也可以间隔一定时间而分开导入。在优选的方式中,将上述(A)及(B)同时导入细胞中。
<任意工序>
本实施方式的制造方法除上述导入工序外还可以包含任意的工序。作为任意的工序,可列举例如将(C)供体载体导入细胞的工序。
《(C)供体载体》
供体载体包含作为同源臂与靶区域邻接的碱基序列。供体载体可以在5在臂与3在臂之间包含所期望的碱基序列(以下有时称作“敲入序列”)。敲入序列并无特别限定,可以为任意的序列。敲入序列例如可以为基因敲除用的序列,可以为碱基置换用的序列,也可以为任意的基因序列。在敲入序列为任意的基因序列的情况下,优选在安全港区域内设定靶序列。
供体载体可以为环状DNA载体(例如质粒载体),也可以为线状DNA载体。供体载体除同源臂及敲入序列外还可以包含其他序列。作为其他序列,可列举例如标记物基因、复制起点、编码与复制起点结合来控制复制的蛋白的基因等。作为标记物基因,可列举与上述同样的标记物基因。
供体载体的导入方法并无特别限定,可以根据对象细胞进行适当选择。作为供体载体导入至细胞的导入方法,可列举例如脂质转染法、微注射法、DEAE葡聚糖法、基因枪法、电穿孔法、磷酸钙法等。
供体载体可以与上述(A)及(B)同时导入细胞中,也可以逐次地导入,或者也可以在导入(A)及(B)后间隔一定时间来导入。在优选的方式中,将供体载体与上述(A)及(B)同时导入细胞中。
《培养工序》
任意的工序可以是将上述(A)及(B)、以及根据需要的上述(C)导入细胞后对细胞进行培养的工序。细胞的培养只要根据细胞的种类在适当的培养条件下进行即可。在上述(A)、(B)和/或(C)为包含耐药性标记物的载体的情况下,培养可以在该药剂的存在下进行。通过在该药剂的存在下进行培养,从而可以效率良好地选择经基因组编辑的细胞。另外,通过细胞培养液的稀释或平板培养(plating)等,可以进行细胞的克隆化。
《基因组编辑模式分析工序》
任意的工序可以是将上述(A)及(B)、以及根据需要的上述(C)导入细胞后对基因组编辑模式进行分析的工序。
基因组编辑模式的分析方法并无特别限定,可列举如下方法等:在上述导入工序后、例如适当进行培养工序后,进行细胞培养液的平板培养,从已产生的菌落中提取DNA,进行靶区域的序列分析。
通过进行两等位基因的靶区域的序列分析,从而可以确认该细胞是否为仅单侧等位基因经基因组编辑的细胞。
本实施方式的制造方法通过使用(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、或(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA作为向导RNA,从而可以提高在基因组编辑时仅单侧等位基因处经基因组编辑的细胞的比例。因此,根据本实施方式的制造方法,能够效率良好地制造仅单侧等位基因处经基因组编辑的细胞。另外,根据本实施方式的制造方法,能够抑制因sgRNA及Cas9等的导入所致的细胞毒性。
在其他方式中,本发明提供一种对仅单侧等位基因进行基因组编辑的方法,包括将(A)与(B)导入细胞的工序,所述(A)为选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种,所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
[向导RNA、载体、试剂盒]
在一个实施方式中,本发明提供一种向导RNA,其在间隔序列的5’末端添加有1个以上的核苷酸残基。
本实施方式的向导RNA与已在上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<(A)向导RNA>一项中说明的(a1)的向导RNA相同。
本实施方式的向导RNA优选其间隔序列为相对于靶序列具有1个碱基或多个碱基错配的序列。即,优选为上述(a12)的向导RNA。
在一个实施方式中,本发明提供一种向导RNA的表达载体,所述向导RNA在间隔序列的5’末端添加有1个以上的核苷酸残基。
本实施方式的表达载体与已在上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<(A)向导RNA>一项中说明的(a1)或(a12)的向导RNA的表达载体相同。
本实施方式的表达载体可以进一步以能表达Cas蛋白编码序列(优选Cas9蛋白编码序列)的状态包含该Cas蛋白编码序列。
在一个实施方式中,本发明提供一种仅单侧等位基因经基因组编辑的细胞的制造试剂盒,其包含(A),所述(A)为选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种。上述制造试剂盒优选还包含(B),所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
(a1)及(a2)的向导RNA与已在上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<(A)向导RNA>一项中说明的(a1)及(a2)的向导RNA相同。向导RNA可以为上述(a12)的向导RNA。
(a3)的表达载体与上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<(A)向导RNA>一项中说明的(a3)的向导RNA的表达载体相同。
(B)的Cas蛋白及其表达载体与上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<(B)Cas蛋白>一项中说明的Cas蛋白及其表达载体相同。
在(A)及(B)为表达载体的情况下,向导RNA编码序列及Cas蛋白编码序列可以以各自可表达的状态包含在同一表达载体中。
本实施方式的试剂盒除上述(A)及(B)外可以还包含其他构成。其他构成并无特别限制,可列举例如用于制作仅单侧等位基因经基因组编辑的细胞的说明书、用于将表达载体导入细胞的试剂等。
[基因组编辑模式的预测方法]
在一个实施方式中,本发明提供一种基因组编辑模式的预测方法,包括:(i)将向导RNA或其表达载体、以及Cas蛋白或其表达载体导入细胞而进行基因组编辑的工序;(ii)从进行了上述基因组编辑的细胞中提取DNA的工序;(iii)从上述DNA扩增包含靶区域的DNA片段的工序;(iv)对上述扩增的DNA片段进行序列分析,求出对上述靶区域的indel诱导率(P)的工序;以及(v)根据下述式(m)或(m1)及(b)或(b1),求出对仅单侧等位基因的indel诱导率(mono)及对两侧等位基因的indel诱导率(bi)的工序。
mono=2×P×(1-P)···(m)
bi=P2···(b)
mono=-1.303P2+1.2761P+0.0274···(m1)
bi=0.6515P2+0.3619P-0.0137···(b1)
<工序(i)>
工序(i)是将向导RNA或其表达载体、以及Cas蛋白或其表达载体导入细胞而进行基因组编辑的工序。
向导RNA并无特别限定,只要使用能够用于CRISPR/Cas系统的向导RNA即可。间隔序列只要是以任意的靶序列作为靶序列的间隔序列即可,并无特别限定。
向导RNA的表达载体可以与已在上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<(A)向导RNA>一项中说明的表达载体同样地制作。
Cas蛋白并无特别限定,只要使用能够用于CRISPR/Cas系统中的Cas蛋白即可。Cas蛋白优选为Cas9蛋白,更优选为S.pyogenes的Cas9蛋白。
Cas蛋白的表达载体可以与已在上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<(B)Cas蛋白>一项中说明的表达载体同样地制作。
向导RNA及Cas蛋白、或它们的表达载体向细胞中的导入可以与已在上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<导入工序>中说明的方法同样地进行。
向细胞中导入后可以适当进行培养。将向导RNA及Cas蛋白的表达载体导入细胞,在该表达载体具有耐药性标记物的情况下,通过在该药剂的存在下下培养细胞,从而可以选择导入有表达载体的细胞。
<工序(ii)>
工序(ii)是从工序(i)中进行了基因组编辑的细胞中提取DNA的工序。
DNA的提取方法并无特别限定,只要使用公知的DNA提取方法即可。作为DNA提取方法,可列举例如苯酚·氯仿提取法、在碱性条件下进行加热的方法(例如在50mM NaOH存在下以99℃加热10分钟等)等。另外,也可利用市售的DNA提取试剂盒等。
<工序(iii)>
工序(iii)是从工序(ii)中提取的DNA扩增包含靶区域的DNA片段的工序。
靶区域的扩增方法并无特别限定,只要使用公知的核酸片段扩增方法即可。作为核酸片段扩增方法,可列举例如PCR法、等温扩增法等。例如可以设计能扩增靶区域的引物再利用PCR法或等温扩增法等来扩增靶区域的DNA片段。
扩增DNA片段的长度只要包含靶区域,则并无特别限定,例如可以为20~1000bp左右,通常为350~750bp左右。
扩增DNA片段可以使用市售的克隆载体等来进行克隆。进而,还可以将插入有扩增DNA片段的克隆载体导入大肠菌等、并培养该大肠菌而形成菌落。可以从这样得到的菌落中提取DNA并将其供于工序(iv)中的序列分析。进行序列分析的菌落数并无特别限定,例如可以为10~200个左右、20~100个左右、或20~50个左右等。
<工序(iv)>
工序(iv)是对工序(iii)中扩增的DNA片段进行序列分析并求出对靶区域的indel诱导率(P)的工序。
DNA片段的序列分析的方法并无特别限定,只要使用公知的序列分析方法即可。在序列分析中可以使用市售的测序仪,可以按照制造业者推荐的方法来进行DNA测序。另外,扩增的DNA片段中有无indel的分析可以通过T7E1分析来进行,也可以并用基于测序仪进行的序列分析和T7E1分析。
对靶区域的indel诱导率(P)可以基于序列分析的结果并根据以下的式(p)来算出。
【数学式1】
Figure BDA0003204594410000301
<工序(v)>
工序(v)是根据下述式(m)及(b)来求出对仅单侧等位基因的indel诱导率(mono)及对两侧等位基因的indel诱导率(bi)的工序。
mono=2×P×(1-P)···(m)
bi=P2···(b)
也可以代替上述式(m)及(b)使用下述式(m1)及(b1)。
mono=-1.303P2+1.2761P+0.0274···(m1)
bi=0.6515P2+0.3619P-0.0137···(b1)
通过将工序(iv)中求出的indel诱导率(P)的值代入上述式(m)或(m1)以及(b)或(b1),从而可以分别求出对仅单侧等位基因的indel诱导率(mono)及对两侧等位基因的indel诱导率(bi)。如后述的实施例所示,通过本实施方式的方法求出的indel诱导率(mono)及indel诱导率(bi)的值与通过实际的试验确认到的各自的indel诱导率近似。
根据本实施方式的预测方法,可以利用简易的操作来预测对仅单侧等位基因的indel诱导率及对两侧等位基因的indel诱导率。因此,通过使用任意的向导RNA来实施本实施方式的预测方法,从而可以预测通过使用了该向导RNA的基因组编辑得到的基因组编辑模式。
[AIMS细胞]
在一个实施方式中,本发明提供一种细胞,其一侧的等位基因中包含将定位蛋白编码序列、切割位点编码序列和第1荧光蛋白编码序列依次框内连接而成的嵌合基因,其另一侧的等位基因中包含将上述定位蛋白编码序列、上述切割位点编码序列和第2荧光蛋白编码序列依次框内连接而成的嵌合基因。需要说明的是,在本说明书中,术语“第1”及“第2”是为了便于记载。
本实施方式的细胞是可以在基于后述AIMS进行的基因组编辑模式的分析中使用的细胞(AIMS细胞)。如果使用本实施方式的细胞,则可以简易地调查是在两侧等位基因处诱导基因组编辑还是在仅单侧等位基因处诱导基因组编辑。
<定位蛋白编码序列>
定位蛋白可以根据成为基因组编辑对象的细胞进行适当选择。定位蛋白只要是定位在细胞内的蛋白即可,可以是天然蛋白,也可以是人工蛋白(例如天然定位蛋白的变异型蛋白、切割型蛋白、包含定位信号的肽等)。在定位蛋白为天然蛋白的情况下,上述天然蛋白可以是对象细胞的内源蛋白,也可以是外源蛋白(来自其他生物的定位蛋白)。定位蛋白优选是对象细胞的内源蛋白、是通常表达的蛋白。定位蛋白可以是核定位蛋白,也可以是细胞膜定位蛋白。
在为人细胞的情况下,作为核定位蛋白,可列举例如各种转录因子、各种转录调节因子等。作为具体例,可列举TBX3蛋白等TBX家族、SOX2蛋白等SOX家族等。另外,作为细胞膜定位蛋白,可列举例如各种细胞膜受体、各种细胞膜抗原等。作为具体例,可列举E-钙粘蛋白等钙粘蛋白家族、SSEA4等SSEA家族等。
定位蛋白编码序列只要具有编码定位蛋白的碱基序列即可,并无特别限定,可以包含沉默突变。定位蛋白编码序列可以是利用了内源定位蛋白的内源性基因序列的序列,也可以是外源性DNA。在定位蛋白编码序列为外源性DNA(例如外源天然定位蛋白编码序列、人工定位蛋白编码序列等)的情况下,该定位蛋白编码序列可以与对象细胞中组成性表达的启动子功能性连接。
<切割位点>
切割位点并无特别限定,可列举例如自切割位点或内肽酶切割位点,作为具体例,可例示2A肽编码序列。
2A肽并无特别限定,可以使用公知的2A肽或2A样肽。例如可以使用选自由P2A肽、F2A肽、E2A肽及T2A肽组成的组中的2A肽。
在切割位点编码像核糖体跳跃那样的自切割序列或像肽酶识别序列那样的氨基酸序列的情况下,可以包含沉默突变。例如,2A肽编码序列只要具有编码2A肽的碱基序列即可,并无特别限定,可以包含沉默突变。另外,2A肽编码序列可以根据对象细胞进行密码子优化。作为2A肽编码序列的具体例,将P2A肽编码序列、以及上述P2A肽编码序列中包含沉默突变的编码序列(aP2A)分别示于序列号14及序列号15。
<第1荧光蛋白编码序列>
第1荧光蛋白并无特别限定,可以使用公知的荧光蛋白。作为荧光蛋白,可列举但不限于例如Sirius、BFP、EBFP、ECFP、mTurquoise、TagCFP、AmCyan、mTFP1、MidoriishiCyan、CFP、TurboGFP、AcGFP、TagGFP、Azami-Green、ZsGreen、EmGFP、GFP、EGFP、GFP2、HyPer、TagYFP、EYFP、Venus、YFP、PhiYFP、PhiYFP-m、TurboYFP、ZsYellow、mBanana、KusabiraOrange、mOrange、TurboRFP、tdTomato、DsRed、DsRed-Express、DsRed2、TagRFP、DsRed-Monomer、AsRed、AsRed2、mStrawberry、TurboFP602、RFP、ERFP、mRFP1、JRed、KillerRed、mCherry、HcRed、KeimaRed、TurboFP650、mRasberry、mPlum、PS-CFP、Dendra2、Kaede、EosFP、KikumeGR等。
第1荧光蛋白编码序列只要具有编码荧光蛋白的碱基序列即可,并无特别限定,可以包含沉默突变。另外,也可以根据对象细胞进行密码子优化。作为荧光蛋白编码序列的具体例,将tdTomato编码序列及Venus编码序列分别示于序列号16及序列号17。
<第2荧光蛋白编码序列>
第2荧光蛋白是与第1荧光蛋白不同的荧光蛋白。第2荧光蛋白只要是与第1荧光蛋白不同的荧光蛋白即可,并无特别限定,可以使用公知的荧光蛋白。作为荧光蛋白,可列举与上述第1荧光蛋白中所例示的荧光蛋白同样的荧光蛋白。第2荧光蛋白优选为荧光波长与第1荧光蛋白不同的荧光蛋白。
第2荧光蛋白编码序列只要具有编码荧光蛋白的碱基序列即可,并无特别限定,可以包含沉默突变。另外,也可以根据对象细胞进行密码子优化。
<嵌合基因>
本实施方式的细胞在一侧的等位基因(以下,有时称作“第1等位基因”)中包含将定位蛋白编码序列、切割位点(例如2A肽编码序列)和第1荧光蛋白编码序列依次框内连接而成的嵌合基因(以下,有时称作“第1嵌合基因”)。在另一侧的等位基因(以下,有时称作“第2等位基因”)中包含将定位蛋白编码序列、切割位点(例如2A肽编码序列)和第2荧光蛋白编码序列依次框内连接而成的嵌合基因(以下,有时称作“第2嵌合基因”)。
第1嵌合基因及第2嵌合基因所具有的切割位点(例如2A肽编码序列)相同。第1嵌合基因及第2嵌合基因所具有的定位蛋白编码序列优选相同。
在优选的方式中,第1嵌合基因及第2嵌合基因位于细胞的内源性定位蛋白基因的基因座。或者,第1嵌合基因及第2嵌合基因可以位于安全港区域内的同一座位。
第1嵌合基因及第2嵌合基因以在细胞内能各自表达的状态分别存在于第1等位基因及第2等位基因上。
<AIMS细胞的制作方法>
包含上述第1嵌合基因及第2嵌合基因的AIMS细胞可以使用基因组编辑等技术来制作。以下记载AIMS细胞的制作方法的具体例,但并不限定于此。
首先,作为用于将第1嵌合基因及第2嵌合基因敲入对象细胞的基因组中的载体,分别制作包含第1嵌合基因及第2嵌合基因的供体载体(敲入载体)。敲入载体可以利用公知的方法来制作。同源臂可以根据插入有嵌合基因的基因组上的位置进行适当设计。同源臂优选为内源性定位蛋白基因及与该定位蛋白基因邻接的区域的碱基序列。
接着,设计以敲入有嵌合基因的区域内的序列作为靶序列的向导RNA。在敲入载体的同源臂为内源性定位蛋白基因及与该定位蛋白基因邻接的区域的碱基序列的情况下,靶序列例如从内源性定位蛋白基因内的序列中进行选择。
接着,将上述向导RNA或其表达载体、及Cas蛋白或其表达载体、以及第1嵌合基因的敲入载体及第2嵌合基因的敲入载体导入细胞中。在使用向导RNA及Cas蛋白的表达载体的情况下,这些表达载体可以为相同的表达载体。
导入方法可列举与上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<导入工序>一项中说明的方法同样的方法。
导入至细胞后可以进行适当培养。在将向导RNA及Cas蛋白的表达载体导入细胞、且该表达载体具有耐药性标记物的情况下,可以通过在该药剂的存在下培养细胞来选择导入有表达载体的细胞。在第1嵌合基因及第2嵌合基因的各敲入载体具有耐药性标记物的情况下,也可以通过在该药剂的存在下培养细胞来选择导入有敲入载体的细胞。
接着,采集观察到第1荧光蛋白及第2荧光蛋白两者的荧光的细胞。荧光细胞的挑选可以利用公知的方法来进行,例如可以使用流式细胞仪、荧光显微镜等来进行。
所取得的细胞可以通过PCR等来确认在第1等位基因及第2等位基因的各目标基因座分别插入有第1嵌合基因及第2嵌合基因。
在本实施方式的细胞中,由第1嵌合基因及第2嵌合基因所表达的嵌合蛋白被切割位点(例如2A肽)切割。第1荧光蛋白及第2荧光蛋白分别从定位蛋白分离,因此不定位在细胞内而分布于细胞全体中(参照图1A“wt”)。
另一方面,若以切割位点(例如2A肽编码序列)作为靶标而进行了基因组编辑的结果是在切割位点(例如2A肽编码序列)产生框移indel,则不会生成荧光蛋白。因此,导入至产生了框移indel的等位基因中的荧光蛋白的荧光消失(参照图1A“frame-shift”)。
另一方面,若以切割位点(例如2A肽)作为靶标而进行了基因组编辑的结果是在切割位点(例如2A肽编码序列)产生框内indel,则不会发生2A肽上的切割。因此,导入至产生了框移indel的等位基因中的荧光蛋白不与定位蛋白分离而追随定位蛋白进行定位(参照图1A“in-frame”)。
用于制作AIMS细胞的对象细胞并无特别限定,可以使用所期望的细胞。细胞的源性生物并无特别限定,可列举:人、猴、小鼠、大鼠、狗、猫、兔、牛、马、猪、山羊、绵羊等哺乳类动物;鸡等鸟类动物;蛇、蜥蜴等爬虫类动物;非洲爪蟾(Xenopus laevis)等两栖类动物;斑马鱼、青鳉鱼、河豚等鱼类动物;海鞘等的脊索动物;斑翅果蝇、蚕等节肢动物;等等的动物;拟南芥、稻、小麦、烟等植物;酵母、粗壮脉纹孢菌等菌类;大肠菌、枯草菌、蓝藻等细菌等。
对象细胞的种类并无特别限定,可列举例如来自各种组织的细胞或各种性质的细胞、例如血液细胞、造血干细胞·前体细胞、配子(精子、卵子)、受精卵、成纤维细胞、上皮细胞、血管内皮细胞、神经细胞、肝细胞、角蛋白生成细胞、肌细胞、表皮细胞、内分泌细胞、组织干细胞、iPS细胞、ES细胞、癌细胞等。另外,还可列举具有镰刀形红细胞贫血症、亨廷顿舞蹈病、假肥大型肌营养不良症等各种遗传性疾病的细胞等。
对象细胞可以为初代培养细胞,也可以为实施过永生化处理的株化细胞。作为株化细胞的例子,可列举来自人的Hela细胞、来自非洲绿猴的COS7细胞、来自小鼠的3T3细胞、来自仓鼠的CHO细胞、来自大鼠的PC12细胞等。
在后述的基因组编辑模式的分析方法中,利用本实施方式的细胞的上述特性,进行基因组编辑模式的分析。
[基因组编辑模式的分析方法]
在一个实施方式中,本发明提供一种基因组编辑模式的分析方法,包括如下工序:(I)向上述实施方式的细胞(AIMS细胞)中导入以上述切割位点(例如2A肽编码序列)作为靶标的向导RNA或其表达载体、以及Cas蛋白或其表达载体而进行基因组编辑的工序;(II)在上述工序(I)之后对上述细胞的荧光图案进行分析的工序;以及(III)基于上述工序(II)中已分析的荧光图案判定基因组编辑模式的工序。
本实施方式的基因组编辑模式的分析方法的特征在于使用上述AIMS细胞。通过使用上述AIMS细胞,从而可以利用简易的方法对基因组编辑模式进行分析。
<工序(I)>
工序(I)是向AIMS细胞中导入以切割位点(例如2A肽编码序列)作为靶标的向导RNA或其表达载体、以及Cas蛋白或其表达载体而进行基因组编辑的工序。
以切割位点(例如2A肽编码序列)作为靶标的向导RNA可以根据所使用的AIMS细胞所具有的切割位点(例如2A肽编码序列)的碱基序列进行适当设计。例如,在作为切割位点使用的2A肽为P2A肽的情况下,作为靶序列,可例示序列号14中记载的序列。
向导RNA或其表达载体、以及Cas蛋白或其表达载体导入方法可列举与上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<导入工序>一项中说明的方法同样的方法。在使用向导RNA及Cas蛋白的表达载体的情况下,这些表达载体可以为相同的表达载体。
导入至细胞后可以进行适当培养。在将向导RNA及Cas蛋白的表达载体导入细胞、且该表达载体具有耐药性标记物的情况下,可以通过在该药剂的存在下培养细胞来选择导入有表达载体的细胞。另外,通过细胞培养液的稀释或平板培养等,从而可以进行细胞的克隆化。
<工序(II)>
工序(II)为在上述工序(I)之后对AIMS细胞的荧光图案进行分析的工序。
基因组编辑后的AIMS细胞的荧光图案的分析可以利用公知的方法来进行。作为荧光图案的分析方法,可列举例如通过荧光显微镜进行观察、使用流式细胞仪的方法等。从能够精度良好地分析荧光图案的观点考虑,例如优选通过荧光显微镜进行观察。但是,如果能够对荧光图案进行分析,则分析方法并无特别限定。
将可通过本工序检出的荧光图案示于表1中。
【表1】
荧光图案 第1荧光蛋白的荧光 第2荧光蛋白的荧光
(1) 分布于细胞全体 分布于细胞全体
(2) 分布于细胞全体 定位
(3) 分布于细胞全体 消失
(4) 定位 分布于细胞全体
(5) 定位 定位
(6) 定位 消失
(7) 消失 分布于细胞全体
(8) 消失 定位
(9) 消失 消失
<工序(III)>
工序(III)为基于上述工序(II)中已分析的荧光图案判定基因组编辑模式的工序。
基于工序(II)中已分析的荧光图案,如表2所示判定基因组编辑模式。
【表2】
荧光图案 第1等位基因 第2等位基因 经基因组编辑的等位基因
(1) 无indel 无indel
(2) 无indel 框内indel 第2等位基因
(3) 无indel 框移indel 第2等位基因
(4) 框内indel 无indel 第1等位基因
(5) 框内indel 框内indel 第1等位基因和第2等位基因
(6) 框内indel 框移indel 第1等位基因和第2等位基因
(7) 框移indel 无indel 第1等位基因
(8) 框移indel 框内indel 第1等位基因和第2等位基因
(9) 框移indel 框移indel 第1等位基因和第2等位基因
如上所述,在荧光图案(2)及(3)中,判定为仅第2等位基因被基因组编辑。在荧光图案(4)及(7)中,判定为仅第1等位基因被基因组编辑。在荧光(5)、(6)、(8)及(9)中,判定为第1等位基因及第2等位基因两者被基因组编辑。在荧光图案(1)中,判定为所有等位基因均未被基因组编辑。
根据本实施方式的方法,可以利用简易的方法对基因组编辑模式进行分析。进而,可以统计各个细胞中已分析的基因组编辑模式,分别求出两侧等位基因被基因组编辑的比例、以及仅单侧等位基因被基因组编辑的比例。因此,例如可以对新设计的向导RNA是容易在两侧等位基因上诱导基因组编辑、还是容易在仅单侧等位基因上诱导基因组编辑等进行分析。因此,本实施方式的方法对于用于诱导所期望的基因组编辑模式的新型向导RNA的开发有用。
[基于单侧等位基因的基因组编辑进行的遗传性疾病的治疗、缓和和/或预防]
在一个实施方式中,本发明提供通过利用上述本发明的实施方式而实现的单侧等位基因的基因组编辑进行的遗传性疾病的治疗、缓和和/或预防。即,通过利用上述本发明的实施方式实现的单侧等位基因的基因组编辑,对导致遗传性疾病的纯合变异或杂合变异(包括复合杂合变异(compound heterozygous mutation))进行修复,由此可以对该疾病进行治疗、缓和和/或预防。在对象以杂合形式具有疾病基因和正常基因的情况下,通过上述本发明的实施方式涉及的仅单侧等位基因的基因组编辑方法仅对疾病基因进行基因组编辑,由此可以治疗、缓和和/或预防遗传性疾病。在对象以纯合形式具有疾病基因的情况下,通过本发明的实施方式涉及的仅单侧等位基因的基因组编辑方法对一侧的等位基因进行基因组编辑,从而使纯合型的疾病基因成为疾病基因与正常基因的杂合型,由此由修复等位基因表达正常蛋白,从而可以治疗、缓和和/或预防遗传性疾病。通过上述本发明的实施方式实现的单侧等位基因的基因组编辑可以如后述那样既维持中靶的基因组编辑活性又抑制脱靶效应,因此治疗安全性高。对于可通过上述本发明的实施方式涉及的单侧等位基因的基因组编辑来治疗、缓和和/或预防的遗传性疾病,只要是因基因变异产生的疾病即可,并无特别限定,可列举但不限于例如癌症、镰刀形红细胞贫血症、亨廷顿舞蹈病、假肥大型肌营养不良症、进行性骨化性纤维发育不良(FOP)等。上述实施方式的单侧等位基因的基因组编辑方法可抑制因基因组编辑引起的细胞毒性,因此可以适合进行遗传性疾病的治疗。尤其是,在使用后述的(a1)在相对于疾病基因中靶序列的间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、或上述向导RNA的表达载体的基因组编辑中,可以抑制因基因组编辑引起的细胞毒性。
本发明提供例如一种遗传性疾病的治疗、缓和和/或预防方法,包括对对象施予以下的(A)和(B)的工序,所述(A)为选自由(a1)在相对于疾病基因中靶序列的间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于上述靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种,所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
该疾病可以是因杂合变异(包括复合杂合变异)引起的疾病,也可以是因纯合变异引起的疾病。(A)及(B)的施予方法只要是可引起单侧等位基因的基因组编辑的方法即可,并无特别限定,可以是经口施予,也可以是非经口施予。作为非经口施予的形态,可列举例如静脉内注射、点滴静注、皮下注射、皮内注射、或腹腔内注射等。(A)及(B)可以同时施予,也可以分开施予。(A)及(B)的施予量根据疾病的程度、对象的年龄、性别、体重、敏感性差、施予方法、施予时期、施予间隔、施予时间、制剂的性质、有效成分的种类等而不同,但只要是本领域技术人员便可适当设定。
本发明提供例如一种用于治疗、缓和和/或预防遗传性疾病的药物组合物,其包含(A),所述(A)为选自由(a1)在相对于疾病基因中靶序列的间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于上述靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种。
该药物组合物可以还包含(B),所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
或者,该药物组合物可以与包含(B)的其他药物组合物组合使用,所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。在该情况下,该其他药物组合物可以与上述本发明的药物组合物同时施予,也可以分开施予。
本发明的药物组合物可以配合药学上允许的载体等而制成制剂。作为在药学上允许的载体,可列举例如赋形剂、粘合剂、崩解剂、润滑剂、着色剂、矫味矫臭剂、稳定化剂、乳化剂、吸收促进剂、表面活性剂、pH调节剂、防腐剂及抗氧化剂等。
该疾病可以是因杂合变异(包括复合杂合变异)引起的疾病,也可以是因纯合变异引起的疾病。本发明的药物组合物的施予形态并无特别限定,可以经口施予或非经口施予。作为非经口施予的形态,可列举例如静脉内注射、点滴静注、皮下注射、皮内注射或腹腔内注射等。本发明的药物组合物的施予量根据疾病的程度、对象的年龄、性别、体重、敏感性差、施予方法、施予时期、施予间隔、施予时间、制剂的性质、有效成分的种类等而不同,但只要是本领域技术人员便可适当设定。
本发明提供例如用于在遗传性疾病的治疗、缓和和/或预防中使用的(A)和(B),所述(A)为选自由(a1)在相对于疾病基因中靶序列的间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于上述靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种;所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
该疾病可以是因杂合变异(包括复合杂合变异)引起的疾病,也可以是因纯合变异引起的疾病。
本发明提供例如下述(A)及(B)在制造遗传性疾病的治疗药、缓和药和/或预防药中的应用,所述(A)为选自由(a1)在相对于疾病基因中靶序列的间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于该靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种;所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
该疾病可以是因杂合变异(包括复合杂合变异)引起的疾病,也可以是因纯合变异引起的疾病。
在上述的[基于单侧等位基因的基因组编辑进行的遗传性疾病的治疗、缓和和/或预防]中,可以使用从通过导入(A)及(B)而修复了疾病基因的对象中获得的细胞来代替(A)及(B)。即,通过向从对象取得的细胞中导入上述的(A)及(B),从而利用通过上述本发明的实施方式实现的单侧等位基因的基因组编辑来修复导致细胞中的遗传性疾病的纯合变异或杂合变异(包括复合杂合变异)。通过将修复了该疾病基因的细胞(以下,称作“修复细胞”)返回对象内,由修复细胞表达正常蛋白,从而可以治疗、缓和和/或预防遗传性疾病。
[遗传性疾病模型细胞]
在一个实施方式中,本发明提供利用通过上述本发明的实施方式实现的单侧等位基因的基因组编辑来制造遗传性疾病模型细胞的方法、以及通过该方法制造的模型细胞。即,对于已知为遗传性疾病的原因基因的基因或疑似为遗传性疾病的原因基因的某个基因,以该基因的正常基因作为靶标,利用通过上述本发明的实施方式实现的单侧等位基因的基因组编辑,向单侧等位基因中导入indel或所期望的变异,由此可以制造遗传性疾病模型细胞。对于作为基因组编辑的对象的细胞,可以是以纯合型具有正常基因的细胞,也可以是以杂合型具有正常基因和疾病基因的细胞。本实施方式的遗传性疾病模型细胞所具有的遗传性疾病只要是因基因变异产生的疾病即可,并无特别限定,可列举但不限于例如癌症、镰刀形红细胞贫血症、亨廷顿舞蹈病、假肥大型肌营养不良症、进行性骨化性纤维发育不良(FOP)等。
本发明提供例如一种制造遗传性疾病模型细胞的方法,包括将(A)和(B)体外施予(导入)至细胞中的工序,所述(A)为选自由(a1)在相对于靶序列(即,遗传性疾病的原因基因或其疑似原因基因的某个基因的正常基因中的靶序列)的间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于上述靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种,所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
该疾病可以是因杂合变异(包括复合杂合变异)引起的疾病,也可以是因纯合变异引起的疾病。
施予(A)及(B)的细胞可以是初代培养细胞,也可以是实施过永生化处理的株化细胞。作为株化细胞的例子,可列举来自人的Hela细胞、来自非洲绿猴的COS7细胞、来自小鼠的3T3细胞、来自仓鼠的CHO细胞、来自大鼠的PC12细胞等。施予(A)及(B)的细胞可以是多能干细胞、双能干细胞、单能干细胞、ES细胞或iPS细胞。施予(A)及(B)的细胞为例如人、小鼠、大鼠、豚鼠、仓鼠、兔、狗、猪、牛、马、山羊、猴或鸡的细胞。(A)及(B)可以同时施予,也可以分开施予。(A)及(B)向细胞的施予方法(导入方法)并无特别限定,可以使用公知的方法。可列举例如与上述[仅单侧等位基因经基因组编辑的细胞的制造方法]<导入工序>一项中说明的方法同样的方法。
[遗传性疾病的非人模型动物]
在一个实施方式中,本发明提供利用通过上述本发明的实施方式实现的单侧等位基因的基因组编辑来制造遗传性疾病的非人模型动物的方法、以及通过该方法制造的非人模型动物。即,对已知为遗传性疾病的原因基因的基因或疑似为遗传性疾病的原因基因的某个基因,以该基因的正常基因作为靶标,利用通过上述本发明的实施方式实现的单侧等位基因的基因组编辑,向单侧等位基因中导入indel或所期望的变异,由此可以制造遗传性疾病非人模型动物。对于作为基因组编辑的对象的动物,可以是以纯合型具有正常基因的动物,也可以是以杂合型具有正常基因和疾病基因的动物。本实施方式的遗传性疾病模型动物所具有的遗传性疾病只要是因基因变异产生的疾病即可,并无特别限定,可列举但不限于例如癌症、镰刀形红细胞贫血症、亨廷顿舞蹈病、假肥大型肌营养不良症、进行性骨化性纤维发育不良(FOP)等。
本发明提供例如一种制造遗传性疾病的非人模型动物的方法,包括将(A)和(B)施予至非人动物的工序,所述(A)为选自由(a1)在相对于靶序列(即,遗传性疾病的原因基因或其疑似原因基因的某个基因的正常基因中的靶序列)的间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于上述靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)上述(a1)或上述(a2)的向导RNA的表达载体组成的组中的至少1种,所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
另外,在一个实施方式中,本发明可以是包括将上述遗传性疾病模型细胞施予至非人动物的工序的、制造遗传性疾病的非人模型动物的方法。另外,在一个实施方式中,本发明可以是包括将上述(A)及(B)、或者上述遗传性疾病模型细胞注射至非人动物的受精卵的工序的、制造遗传性疾病的非人模型动物的方法。
该疾病可以是因杂合变异(包括复合杂合变异)引起的疾病,也可以是因纯合变异引起的疾病。
作为施予(A)及(B)的非人动物,可以使用小鼠、大鼠、豚鼠、仓鼠、兔、狗、猪、牛、马、山羊、猴、鸡等在该技术领域中能够获得的任意的实验动物。(A)及(B)的施予方法只要是可以引起单侧等位基因的基因组编辑的方法即可,并无特别限定,可以是经口施予,也可以是非经口施予。作为非经口施予的形态,可列举例如静脉内注射、点滴静注、皮下注射、皮内注射、或腹腔内注射等。(A)及(B)可以同时施予,也可以分开施予。(A)及(B)的施予量根据所施予的非人动物的种类、周龄/月龄、性别、体重、敏感性差、施予方法、施予时期、施予间隔、施予时间等而不同,但只要是本领域技术人员,便能适当设定。
实施例
以下,利用实施例对本发明进行说明,但本发明并不受以下实施例限定。
以下示出下述实施例中所使用的主要缩写等的含义。
P2A-tdTomato等位基因:敲入有P2A-tdTomato嵌合基因的等位基因
P2A-Venus等位基因:敲入有P2A-Venus嵌合基因的等位基因
P2A-Neo等位基因:敲入有P2A-Neo嵌合基因的等位基因
All-in-One CRISPR质粒:表达Cas9、sgRNA及选择标记物的质粒
p:RCP:具有嘌呤霉素抗性基因(Puro)作为选择标记物的All-in-One CRISPR质粒
PX459:pSpCas9(BB)-2A-Puro(PX459)V2.0质粒(Addgene,质粒#62988)
P2A_PX459:在BpiI位点插入有以P2A肽编码序列作为靶标的间隔序列的PX459
aP2A_PX459:在BpiI位点插入有以aP2A序列作为靶标的间隔序列的PX459
PX459(del_Cas9-T2A-Puro):从PX459除去Cas9-T2A-Puro嵌合基因后的质粒
Cdh1-P2A-tdTomato KI载体:用于向Cdh1基因下游敲入P2A-tdTomato嵌合基因的敲入载体
Cdh1-P2A-Venus KI载体:用于向Cdh1基因下游敲入P2A-Venus嵌合基因的敲入载体
Tbx3-P2A-tdTomato KI载体:用于向Tbx3基因下游敲入P2A-tdTomato嵌合基因的敲入载体
Tbx3-P2A-Venus KI载体:用于向Tbx3基因下游敲入P2A-Venus嵌合基因的模板质粒
Cdh1-aP2A-tdTomato KI载体:用于向Cdh1基因下游敲入aP2A-tdTomato嵌合基因的敲入载体
Cdh1-aP2A-Venus KI载体:用于向Cdh1基因下游敲入aP2A-Venus嵌合基因的敲入载体
Tbx3-P2A-Neo KI载体:用于向Tbx3基因下游敲入P2A-Neo嵌合基因的敲入载体
Cdh1-P2A-AIMS:在两等位基因的Cdh1基因座分别具有Cdh1-P2A-tdTomato嵌合基因及Cdh1-P2A-Venus嵌合基因的AIMS细胞
Tbx3-P2A-AIMS:在两等位基因的Tbx3基因座分别具有Tbx3-P2A-tdTomato嵌合基因及Tbx3-P2A-Venus嵌合基因的AIMS细胞
Cdh1-aP2A-AIMS:在两等位基因的Cdh1基因座分别具有Cdh1-aP2A-tdTomato嵌合基因及Cdh1-aP2A-Venus嵌合基因的AIMS细胞
P2A(错配):相对于P2A肽编码序列内的靶序列具有1个碱基错配的间隔序列
aP2A(错配):相对于aP2A序列内的靶序列具有1个碱基错配的间隔序列
P2A(nX):在5’末端添加有n个核苷酸残基X的、以P2A肽编码序列作为靶标的间隔序列
aP2A(nX):在5’末端添加有n个核苷酸残基X的、以aP2A序列作为靶标的间隔序列
P2A(5’添加):在5’末端添加有任意数量的核苷酸残基的、以P2A肽编码序列作为靶标的间隔序列
aP2A(5’添加):在5’末端添加有任意数量的核苷酸残基的、以aP2A序列作为靶标的间隔序列
P2A(错配_nX):相对于P2A肽编码序列内的靶序列具有1个碱基错配、且在5’末端添加有n个核苷酸残基X的间隔序列。
将下述的实施例中使用的质粒、接头及引物等示于表3~5中。
【表3】
Figure BDA0003204594410000461
【表4】
Figure BDA0003204594410000471
【表5】
Figure BDA0003204594410000481
[实施例1]小鼠ES细胞的培养
将小鼠ES细胞用DMEM(Dulbecco’s Modified Eagle培养基;Nacalai Tesque)进行了培养。培养中使用的DMEM是包含2mM的Glutamax(Nacalai Tesque)、1×非必须氨基酸(NEAA)(Nacalai Tesque)、1mM的丙酮酸钠、100U/mL的青霉素、100μg/mL的链霉素(P/S)(Nacalai Tesque)、0.1mM的2-巯基乙醇(Sigma)及15%的胎牛血清(FBS)(GIBCO)并且还添加了1μM或0.2μM的PD0325901(Sigma)、3μM的CHIR99021(Cayman)及1,000U/mL的重组小鼠LIF(Millipore)的培养基。细胞是在无饲养条件下维持在37℃、5%CO2中。在将细胞进行传代时,添加了Y-27632(10μM、Sigma)。
[实施例2]AIMS的构建
(AIMS的概要)
图1是对本实施例中构建的AIMS的概要进行说明的图。图1A是对本实施例中制作的AIMS细胞所具有的基因构成进行说明的图,图1B是对基于AIMS进行的indel的评价方法进行说明的图。
在本实施例的AIMS细胞中,作为定位蛋白编码序列,使用了Cdh1(E-钙粘蛋白基因)或Tbx3(TBX3蛋白基因)。作为切割位点编码序列,使用了P2A肽编码序列。作为第1荧光蛋白编码序列,使用了tdTomato基因,作为第2荧光蛋白编码序列,使用了Venus基因。因此,第1等位基因中的第1嵌合基因具有Cdh1-P2A-tdTomato或Tbx3-P2A-tdTomato的结构,第2等位基因中的第2嵌合基因具有Cdh1-P2A-Venus或Tbx3-P2A-Venus的结构(图1A)。
在具有图1A的基因构成的AIMS细胞中,由各嵌合基因表达的嵌合蛋白被P2A肽序列切割而分离成定位蛋白和荧光蛋白。因此,荧光蛋白未被定位而是分布于细胞全体中(图2B“wt”)。因此,若用荧光显微镜等观察野生株(wt)的AIMS细胞,则在细胞全体中观察到荧光。
另一方面,若使用以P2A编码序列作为靶标的sgRNA来进行基于CRISPR/Cas系统的基因组编辑,则荧光蛋白的表达及定位会因通过该基因组编辑导入至P2A肽编码序列中的indel的种类而发生变化。即,在向P2A编码序列中导入框移indel的情况下,因该框移而使得荧光蛋白不表达(图1B框移(frame-shift))。
另外,在向P2A肽编码序列中导入框内indel的情况下,不被P2A肽切割。因此,由第1或第2嵌合基因所表达的嵌合蛋白不会被P2A肽序列切割,而根据定位蛋白的种类定位在细胞内。在定位蛋白为Tbx3的情况下,AIMS蛋白定位在核中(图1B框内(in-frame),Tbx3-AIMS)。在定位蛋白为Cdh1的情况下,AIMS蛋白定位在细胞膜中(图1B框内,Cdh1-AIMS)。
因此,在tdTomato及Venus两者的荧光消失或已定位的情况下,可以判定在第1等位基因(P2A-tdTomato等位基因)及第2等位基因(P2A-Venus等位基因)两者中产生了indel。在仅tdTomato及Venus的任一者的荧光消失或已定位的情况下,可以判定仅在P2A-tdTomato等位基因及P2A-Venus等位基因的任一者中产生了indel。在tdTomato及Venus两者的荧光既未消失又未定位的情况下,可以判定在P2A-tdTomato等位基因及P2A-Venus等位基因中均未产生indel。
如以上所述,通过使用AIMS细胞,从而可以分别评价两侧等位基因indel导入率及单侧等位基因indel导入率。
图1C表示在本实施例的AIMS细胞的制作中使用的P2A编码序列。图中作为“靶标”而包含的区域是sgRNA的靶序列。图中,作为aP2A所示的序列是在P2A编码序列中导入了沉默突变的序列。在后述的AIMS细胞的制作中使用P2A编码序列及aP2A编码序列中的任一者。
(AIMS细胞制作用敲入质粒的构建)
在包含P2A-Venus嵌合基因的质粒或包含P2A-tdTomato嵌合基因的质粒上连接Cdh1的5d臂及3d臂,制作成Cdh1-P2A-tdTomato KI载体及Cdh1-P2A-tdTomato KI载体。为了分别独立地产生E-钙粘蛋白(Cdh1)及荧光蛋白(tdTomato或Venus),以Cdh1编码序列末端在框内与P2A编码序列连接的方式设计Cdh1的5d臂。
除了代替Cdh1的5d臂及3d臂而使用Tbx3的5b臂及3b臂以外,利用与上述同样的方法制作Tbx3-P2A-tdTomato KI载体及Tbx3-P2A-tdTomato KI载体。
除了代替P2A序列而使用aP2A序列以外,利用与上述同样的方法制作Cdh1-aP2A-tdTomato KI载体及Cdh1-aP2A-tdTomato KI载体。
(All-in-One CRISPR质粒的构建)
在PX459的BpiI位点连接sgRNA用衔接子接头(序列号63、64),该衔接子接头包含以Tbx中的靶序列(3’-CCAGTTTGGTCAAATCTGCCAGT-5’(序列号94))作为靶标的间隔序列的编码序列,由此制作AIMS细胞制作用的All-in-One CRISPR质粒。同样,在PX459的BpiI位点连接sgRNA用衔接子接头(序列号65、66),该衔接子接头包含以Cdh中的序列作为靶标的间隔序列的编码序列,由此制作AIMS细胞制作用的All-in-One CRISPR质粒。以终止密码子的下游作为靶标的sgRNA使用CRISPR DESIGN(crispr.mit.edu/)来设计。
(AIMS细胞的制作)
使用Lipofectamine(注册商标)3000(ThermoFisher SCIENTIFIC),将上述制作的All-in-One CRISPR质粒、Cdh1-P2A-tdTomato KI载体及Cdh1-P2A-Venus KI载体同时导入小鼠ES细胞中。向分注于涂布有明胶的24孔板的500μL的2iL+Y培养基中接种用胰蛋白酶(Nacalai Tesque)分离得到的ES细胞。按照Lipofectamine 3000的标准使用说明书(protocol),制备核酸-Lipofectamine3000复合体。将1μL的Lipofectamine 3000添加至25μL的Opti-MEM培养基(ThermoFisher SCIENTIFIC)中。另外,将250ng的上述3种质粒及1μL的P3000试剂添加至另外的25μL的Opti-MEM培养基中再进行混合。将它们的混合液一起混合,在室温下孵育5分钟。之后,添加至接种有ES细胞的24孔板中。细胞自然沉降至板底后,将板在600g、37℃下离心分离1小时,接着,孵育一夜。转染1~2天后,用嘌呤霉素(12μg/mL)对细胞处理24~48小时。将利用嘌呤霉素处理所选择出的嘌呤霉素抗性细胞在不存在嘌呤霉素下培养数天,采集双色阳性(dual color-positive)的菌落。利用PCR对所采集的菌落的基因型进行了确认。使用在两等位基因中分别确认到导入有Cdh1-P2A-tdTomat嵌合基因及Cdh1-P2A-Venus嵌合基因的细胞作为Cdh1-P2A-AIMS。
除了代替Cdh1-P2A-Venus KI载体及Cdh1-P2A-tdTomato KI载体而使用Tbx3-P2A-Venus KI载体及Tbx3-P2A-tdTomato KI载体以外,利用与上述同样的方法制作Tbx3-P2A-AIMS。
除了代替Cdh1-P2A-Venus KI载体及Cdh1-P2A-tdTomato KI载体而使用Cdh1-aP2A-Venus KI载体及Cdh1-aP2A-tdTomato KI载体以外,利用与上述同样的方法制作Cdh1-aP2A-AIMS。
(使用了AIMS细胞的indel模式分析)
使用了AIMS细胞的indel模式的分析按照以下方式来进行。
在P2A肽编码序列内或aP2A序列内设定靶序列,设计了sgRNA。将该sgRNA的间隔序列的编码序列连接于PX459的BpiI位点,制作p:RCP。将实施例中使用的p:RCP的结构示于图2A中。
使用Lipofectamine(注册商标)3000(ThermoFisher SCIENTIFIC),将p:RCP转染至AIMS细胞(Cdh1-P2A-AIMS、Tbx3-P2A-AIMS或Cdh1-aP2A-AIMS)中。作为细胞使用AIMS细胞,作为质粒使用p:RCP,除此以外,与上述的“(AIMS细胞的制作)”中记载的方法同样地进行了转染及嘌呤霉素处理。将利用嘌呤霉素处理所选择出的嘌呤霉素抗性细胞在不存在嘌呤霉素下培养数天后,使其传代并进行了克隆。对经克隆的细胞,使用荧光显微镜(倒置型研究级显微镜IX73、奥林巴斯),观察tdTomato及Venus的荧光,进行了两等位基因中的indel的评价。在图2B中示出从转染到荧光分析的时间轴(timeline)。
在1次的转染中,进行了30~170个克隆的indel模式分析。针对1种sgRNA,将转染及之后的indel模式分析进行最少3次。
[实施例3]错配法的评价
对于两侧等位基因indel及单侧等位基因indel的导入率是否会因向sgRNA的间隔序列中导入相对于靶序列的1个碱基错配而发生变化进行了研究。
分别设计了将P2A的靶序列(TAACTTCAGCCTGCTGAAGC:序列号95)的任意1个碱基置换为不同碱基的1碱基错配间隔序列(参照图3A)。在间隔序列(该间隔序列在与PAM邻接的碱基(1位)具有1个碱基错配)的编码序列上,添加用于与PX459的BpiI位点连接的衔接子序列,制作1碱基错配sgRNA用衔接子接头(序列号69、70)。添加同样的衔接子序列,分别制作了错配碱基的位置为2~20位(将与PAM邻接的碱基设为1位,沿着3’→5’的方向而设为2位→20位)的1碱基错配sgRNA用衔接子接头。
将在P2A靶序列上不具有错配的sgRNA用衔接子接头的序列示于序列号67、68中。
同样,分别设计将aP2A的靶序列(TAGTCTACTAAAACAAGCCG:序列号96)的任意1个碱基置换为不同碱基的1碱基错配间隔序列,向该间隔序列的编码序列上添加衔接子序列,分别制作1碱基错配sgRNA用衔接子接头。将相对于aP2A的靶序列在与PAM邻接的碱基(1位)具有1个碱基错配的、1碱基错配sgRNA用衔接子接头的序列示于序列号73、74中。其他的1碱基错配sgRNA用衔接子接头除错配的位置不同以外也同样。将在aP2A靶序列上不具有错配的sgRNA用衔接子接头的序列示于序列号71、72中。
将这些1碱基错配sgRNA用衔接子接头分别插入PX459质粒的BpiI位点,制作各P2A(错配)_PX459。
将以上的各P2A(错配)_PX459分别导入AIMS细胞,进行了indel的评价。
将结果示于图3中。图3B是使用Tbx3-P2A-AIMS作为AIMS细胞进行ndel模式分析的结果。
图3B的图的横轴表示P2A靶序列,在其下方示出P2A(错配)中的置换后的碱基。在图的上部示出已置换的碱基的距离PAM的距离(将与PAM邻接的碱基设为1时的各碱基的位置)。“P”为使用P2A_PX459(无错配)的情况,“N”为使用PX459(无间隔序列)的情况。
如图3B所示,在使用P2A_PX459的情况下,导入了大致100%的两侧等位基因indel。另一方面,在使用P2A(错配)_PX459的情况下,单侧等位基因indel的导入率变高。另外,indel的导入倾向因导入错配的位置不同而出现差别。
图3C是使用Tbx3-P2A-AIMS作为AIMS细胞进行indel模式分析的结果。在图3C的图的上部示出靶序列的距离PAM的位置,在图的横轴示出与该位置对应的间隔序列中的碱基。用下划线表示的碱基是与靶序列一致的碱基。
如图3C所示,indel导入率、两侧等位基因indel导入率及单侧等位基因indel导入率因导入错配的位置及错配碱基的种类不同而出现差别。
图3D是使用Cdh1-aP2A-AIMS作为AIMS细胞进行indel模式分析的结果。图3D的图的标记与图3B同样。
如图3D所示,在使用完全一致sgRNA的情况下,导入了大致100%的两侧等位基因indel。另一方面,在使用aP2A(错配)_PX459的情况下,单侧等位基因indel的导入率变高。另外,indel的导入倾向因导入错配的位置的不同而出现差别。indel的导入倾向与图3B相比出现差别。
由以上结果确认到:通过选择导入1个碱基错配的位置及错配碱基的种类,可以调节单侧等位基因indel的比例。
[实施例4]5’核苷酸添加法的评价
(基于P2A(5’添加)_PX459进行的indel导入)
对于两侧等位基因indel及单侧等位基因indel的导入率是否会因在sgRNA的间隔序列的5’末端添加核苷酸残基而发生变化进行了研究。
分别设计了在P2A靶序列的5’侧添加有0~40个胞嘧啶的间隔序列(参照图4A)。在这些间隔序列的编码序列上添加用于与PX459的BpiI位点连接的衔接子序列,分别制作5’C添加sgRNA用衔接子接头。
同样,分别设计在P2A的靶序列的5’侧添加有15个鸟嘌呤、腺嘌呤或尿嘧啶的间隔序列,向该间隔序列的编码序列上添加衔接子序列,分别制作P2A(15G)、P2A(15A)、P2A(15U)sgRNA用衔接子接头。将这些sgRNA用衔接子接头分别插入PX459质粒的BpiI位点,分别制作P2A(5’添加)_PX459。
作为用于制作上述质粒的sgRNA用衔接子接头的一例,将在间隔序列的5’末端添加15G的sgRNA用衔接子接头的序列示于序列号75、76中。其他的sgRNA用衔接子接头除在间隔序列的5’末端所添加的核苷酸残基的数量及种类不同以外也具有完全同样的序列。需要说明的是,将在以aP2A作为靶标的间隔序列的5’末端添加5C的sRNA用衔接子接头的序列示于序列号81、82中。
将上述制作的P2A(5’添加)_PX459分别导入AIMS细胞中,进行了indel的评价。
将结果示于图4B及图4C中。图4B是使用Cdh1-P2A-AIMS作为AIMS细胞进行indel模式分析的结果。
在图4B的图的横轴示出添加至靶序列的5’末端的核苷酸残基。如图4B所示,在使用P2A_PX459(0C)的情况下,导入了大致100%的两侧等位基因indel。另一方面,随着所添加的胞嘧啶的个数变多,indel导入率减少。另外,随着所添加的胞嘧啶的个数变多,单侧等位基因indel的导入率变高。但是,在胞嘧啶添加数为25个以上时,indel导入倾向未出现差别。
图4C是使用Cdh1-P2A-AIMS作为AIMS细胞进行indel模式分析的结果。图4C的图的标记与图4B同样。如图4C所示,indel导入率及单侧等位基因indel的导入率因所添加的核苷酸的种类不同而出现差别。在添加腺苷(A)的情况下,indel导入率基本不降低、单侧等位基因indel的导入率也低。按照鸟苷(G)、胞嘧啶(C)的顺序,indel导入率降低,单侧等位基因indel的导入率变高。在添加尿苷(U)的情况下,indel导入率显著降低,基本未确认到两侧等位基因indel的导入。
进而,对于indel的导入率是否会因在sgRNA的间隔序列的3’末端添加核苷酸残基而发生变化,也进行了确认。除了使用在间隔序列的3’末端添加5C或10C的sgRNA用衔接子接头的序列(序列号77~80)以外,利用与上述同样的方法制作P2A(3’添加)_PX459,将其导入AIMS细胞中,进行了indel导入率的评价。其结果为:在3’末端添加5C及10C的任意者时,indel导入率均大致为0%。认为这是由于:当在间隔序列的3’末端添加有序列的情况下,在间隔序列与PAM序列之间夹设有多余的序列。
(sgRNA表达质粒使用量针对indel导入率造成的影响)
对于通过在靶序列的5’侧添加核苷酸残基而导致indel导入率降低,有可能起因于由于添加核苷酸残基而抑制sgRNA的转录。为此,对于转染中使用的sgRNA表达质粒的使用量对indel导入率造成的影响进行了评价。
〔转染时的p:RCP使用量的影响〕
作为AIMS用小鼠ES细胞,使用Tbx3-P2A-AIMS,并对其转染了P2A_PX459。转染中使用的P2A_PX459的使用量设为2.5ng、25ng、250ng或2500ng。
将结果示于图4D中。图4D中,左图表示indel分析的结果,右图表示在P2A_PX459的转染后得到的菌落数。如图4D右图所示,若减少P2A_PX459的使用量,则菌落数减少。认为这是由于:随着转染时的p:RCP的使用量的减少,P2A_PX459向AIMS细胞中的导入率降低,呈嘌呤霉素抗性的细胞数减少。另一方面,在呈嘌呤霉素抗性的细胞中,导入了大致100%的两侧等位基因indel。
〔转染时的sgRNA表达质粒使用量的影响〕
在上述试验中,使用表达sgRNA、Cas9及嘌呤霉素抗性基因全体的p:RCP,因此在转染后所得的嘌呤霉素抗性细胞中有可能导入了大致100%两侧等位基因indel。为此,利用KpnI及NotI将PX459切割后,利用T4聚合酶将切割末端平滑化,再进行连接,由此制作PX459(del_Cas9-T2A-Puro)。在PX459(del_Cas9-T2A-Puro)的BpiI位点插入以aP2A作为靶标的间隔序列的编码序列,制作aP2A_PX459(del_Cas9-T2A-Puro)。使aP2A_PX459(del_Cas9-T2A-Puro)的量(0~250ng)发生变化,与一定量(250ng)的PX459(无间隔序列)一起共转染至AIMS细胞中。AIMS细胞使用了Cdh1-aP2A-AIMS。
将结果示于图4E中。随着aP2A_PX459(del_Cas9-T2A-Puro)的使用量的减少,indel导入率降低,但是单侧等位基因indel的导入率基本未增加。
由这些结果确认到:即使在转染时减少sgRNA表达质粒的使用量,单侧等位基因indel的导入率也不会增加。
(对Rosa26及白蛋白基因的基因组编辑)
在PX459的BpiI位点分别插入下述衔接子接头序列,分别制作10C(8A)接头PX459及25C(23A)接头PX459。通过在这些质粒的BPiI位点插入所期望的间隔序列的编码序列,从而可以分别表达在5’侧添加有10C及23C的sgRNA。但是,在这些质粒中,为了向BPiI位点导入连接用的突出端序列CACC,而将10C的第8位及25C的第23位的C分别置换为A。
10C(8A)衔接子接头:
(F)5’-CACCGCCCCCCCACCGGGTCTTCGAGAAGACCT-3’(序列号59)
(R)5’-AAACAGGTCTTCTCGAAGACCCGGTGGGGGGGC-3’(序列号60)
25C(23A)衔接子接头:
(F)5’-CACCGCCCCCCCCCCCCCCCCCCCCCCACCGGGTCTTCGAGAAGACCT-3’(序列号61)
(R)5’-AAACAGGTCTTCTCGAAGACCCGGTGGGGGGGGGGGGGGGGGGGGGGC-3’(序列号62)
在上述10C(8A)接头PX459或25C(23A)接头PX459的BPiI位点插入以Rosa26作为靶标的间隔序列的编码序列或以白蛋白基因(Alb)作为靶标的间隔序列的编码序列,分别制作Rosa26_PX459(10C(8A))、Rosa26_PX459(25C(23A))、Alb_PX459(10C(8A))及Alb_PX459(25C(23A))。将以Rosa26作为靶标的sgRNA制作用接头的序列示于序列号87、88中。将以Alb作为靶标的sgRNA制作用接头的序列示于序列号89、90中。
将上述制作的Rosa26_PX459(10C(8A))、Rosa26_PX459(25C(23A))、Alb_PX459(10C(8A))或Alb_PX459(25C(23A))导入野生型ES细胞中。与上述的“(AIMS细胞的制作)”中记载的方法同样地进行转染及嘌呤霉素处理。将利用嘌呤霉素处理所选择出的嘌呤霉素抗性细胞在不存在嘌呤霉素下培养数天后,使其传代并进行了克隆。从经克隆的细胞的菌落中回收基因组,通过PCR及序列分析来判定有无各等位基因的indel。
将结果示于图4F中。即使在以Rosa26及Alb之类的基因组区域作为靶标的情况下,也能确认到单侧等位基因indel的导入率因在间隔序列的5’末端添加胞嘧啶而上升。
作为转染用细胞,使用野生型小鼠ES细胞,作为转染用质粒,使用上述制作的质粒,除此以外,与实施例2的“(使用了AIMS细胞的indel模式分析)”中记载的方法同样地进行转染及嘌呤霉素处理,并且选择了嘌呤霉素抗性细胞。将所得的嘌呤霉素抗性细胞在不存在嘌呤霉素下培养数天后,使其传代并进行了克隆而得到菌落。从上述菌落中提取基因组DNA,通过PCR,将包含sgRNA的靶序列的DNA片段扩增并进行序列分析,判定有无indel。将以Rosa26作为靶标时的indel分析用PCR引物的序列示于序列号55、56中。将以白蛋白基因作为靶标时的indel分析用PCR引物的序列示于序列号57、58中。
将结果示于图4F中。在图4F的图的横轴示出添加至靶序列的5’末端的核苷酸残基。
与图4B中的结果同样,在不进行核苷酸添加的情况(0C)下,导入了大致100%的两侧等位基因indel。另一方面,在Rosa26及白蛋白基因(Alb)中,indel导入率均会随着所添加的胞嘧啶的个数变多而减少。另外,单侧等位基因indel的导入率因胞嘧啶的添加而变高。
由这些结果确认到:即使在以内源性基因作为靶标的情况下,单侧等位基因indel的导入率也会因在靶序列的5’末端添加核苷酸残基而上升。
[实施例5]使用AIMS细胞的同源重组试验
(评价方法的概要)
接着,使用AIMS细胞,对不包含indel的同源重组的导入率进行了评价。
图5A是对本试验中使用的方法的概略进行说明的图。在本试验中,将以P2A编码序列内的序列作为靶标的p:RCP和Tbx3-P2A-Neo KI载体共转染于Tbx3-P2A-AIMS。在导入有两质粒的Tbx3-P2A-AIMS中,首先,由All-in-One CRISPR质粒表达以P2A作为靶标的sgRNA及Cas9,由此来切割P2A编码序列。接着,通过与Tbx3-P2A-Neo KI载体的同源重组,从而在Tbx3基因下游敲入P2A-Neo嵌合基因(参照图5A左图)。通过在共转染后在嘌呤霉素存在下进行培养,接着在遗传霉素存在下进行培养,从而可以选择利用基因组编辑敲入了P2A-Neo嵌合基因的细胞。
对于在P2A-tdTomat等位基因中敲入P2A-Neo嵌合基因、且在P2A-Venus等位基因中不包含indel的细胞而言,tdTomato的荧光消失,在细胞全体中检出Venus的荧光(图5A右图(a))。对于在P2A-Venus等位基因中敲入P2A-Neo嵌合基因、且在P2A-tdTomato等位基因中不包含indel的细胞而言,Venus的荧光消失,在细胞全体中检出tdTomato的荧光(图5A右图(b))。对于在P2A-Venus等位基因或P2A-tdTomato等位基因中敲入P2A-Neo嵌合基因、且在P2A-tdTomato等位基因或P2A-Venus等位基因中包含框移indel的细胞而言,Venus及tdTomato两者的荧光消失(图5A右图(c)左)。对于在P2A-tdTomato等位基因中敲入P2A-Neo嵌合基因、且在P2A-Venus等位基因中包含框内indel的细胞而言,tdTomato的荧光消失,Venus的荧光发生核定位(图5A右图(c)中)。对于在P2A-Venus等位基因中敲入P2A-Neo嵌合基因、且在P2A-tdTomato等位基因中包含框内indel的细胞而言,Venus的荧光消失,tdTomato的荧光发生核定位(图5A右图(c)右)。
这样,可以对未被敲入时的等位基因中是否包含indel进行评价。由于同时被敲入两等位基因的情况非常少,因此,tdTomato及Venus两者的荧光消失的情况全部视为在一侧的等位基因中敲入P2A-Neo嵌合基因、并且在另一侧的等位基因中产生框移indel。
(试验方法)
以Rosa26 mT/mG质粒(Addgene,质粒#17787)作为模板,通过PCR,扩增了P2A-Neo嵌合基因。将PCR中使用的引物的序列示于序列号30、32中。将上述P2A-Neo嵌合基因置换成Tbx3-P2A-tdTomato KI载体的P2A-tdTomato嵌合基因,制作Tbx3-P2A-Neo KI载体。
将包含试验对象的间隔序列的编码序列的p:RCP和Tbx3-P2A-Neo KI载体共转染于Tbx3-P2A-AIMS中,进行了嘌呤霉素处理。共转染及嘌呤霉素处理的条件与实施例2的“(使用了AIMS细胞的indel模式分析)”中记载的方法同样。
在从共转染起3天后除去嘌呤霉素,添加包含遗传霉素(400μg/mL,GIBCO)的培养基,选择遗传霉素抗性细胞。将所得的遗传霉素抗性细胞进行克隆,并对9克隆进行基因分型。其结果为:在9克隆中全部确认到P2A-Neo嵌合基因的敲入。由该结果确认到:大多遗传霉素抗性克隆是P2A-Neo嵌合基因的敲入克隆。另外,由于在9克隆中均观察到Tomato的荧光,因此判定为向P2A-Venus等位基因的单侧敲入。
利用上述方法进行共转染,并进行嘌呤霉素处理及遗传霉素处理,选择了遗传霉素抗性细胞。对这些细胞,使用荧光显微镜(倒置型研究级显微镜IX73、奥林巴斯),观察tdTomato及Venus的荧光,并且对在未被敲入时的等位基因中是否包含indel进行了评价。在1次的共转染中,对40~230个克隆进行分析。针对1种sgRNA,将转染及之后的indel分析至少进行3次。
(错配法的评价)
与实施例3同样,分别设计将P2A的靶序列(序列号95)的任意1个碱基置换为不同碱基的1碱基错配间隔序列,向该间隔序列的编码序列上添加衔接子序列,制作1碱基错配sgRNA用衔接子接头。将这些1碱基错配sgRNA用衔接子接头分别插入PX459质粒的BpiI位点,制作各P2A(错配)_PX459。使用以上的各P2A(错配)_PX459作为共转染用的p:RCP。
将结果示于图5B中。图5B的图的横轴表示相对于P2A的靶序列进行了置换的碱基的位置(将与PAM邻接的碱基设为1时的各碱基的位置)。在间隔序列中,将靶序列的A置换为T,将T置换为A,将C置换为G,将G置换为C。“P”是使用P2A_PX459(无错配)的情况。图中,“HR+wt”是在一侧的等位基因中具有同源重组(HR)、且在另一侧的等位基因中不包含indel的情况,“HR+indel”是在一侧的等位基因中具有同源重组(HR)、且在另一侧的等位基因中包含indel的情况。“unknown”是除上述以外的情况。
如图5B所示,在使用P2A_PX459的情况下,为伴有大致100%indel的同源重组。另一方面,在使用P2A(错配)_PX459的情况下,不伴有indel的同源重组的比例增加。另外,不伴有indel的同源重组的比例因错配的位置不同而出现差别。
由以上结果确认到:错配法作为不伴有indel的同源重组的诱导方法是有效的。
(5’核苷酸添加法的评价)
分别设计在P2A靶序列(序列号95)的5’侧添加有10个或20个胞嘧啶的间隔序列,向这些间隔序列的编码序列上添加衔接子序列,分别制作5’C添加sgRNA用衔接子接头。将这些sgRNA用衔接子接头分别插入PX459质粒的BpiI位点,分别制作P2A(5’添加)_PX459。使用以上的各P2A(5’添加)_PX459作为共转染用的p:RCP。
将结果示于图5C中。图5C的图的横轴表示添加至靶序列的5’末端的核苷酸残基。“0C”是使用P2A_PX459(无5’添加)的情况。图中、“HR+wt”、“HR+indel”及“unknown”的含义与图5B同样。
如图5C所示,在使用P2A_PX459的情况下,为伴有大致100%indel的同源重组。另一方面,在使用P2A(5’)_PX459的情况下,不伴有indel的同源重组的比例增加。另外,随着所添加的胞嘧啶的个数的增加,不伴有indel的同源重组的比例增加。
由以上结果确认到:5’核苷酸添加法作为不伴有indel的同源重组的诱导方法是有效的。
[实施例6]错配法与5’核苷酸添加法的组合
通过将实施例3中已评价的错配法和实施例4中已评价的5’核苷酸添加法组合,从而对单侧等位基因indel的导入率是否增加进行了试验。作为AIMS细胞,使用了Tbx3-P2A-AIMS。
图6A表示使用了相对于P2A的靶序列(序列号95)具有1个碱基错配的sgRNA的结果。将P2A(错配)_PX459导入Tbx3-P2A-AIMS中,进行了indel的评价。在图的上部示出已置换的碱基的距离PAM的距离(将与PAM邻接的碱基设为1时的各碱基的位置)。“P”是使用P2A_PX459(无错配)的情况。在间隔序列中,将靶序列的A置换为T,将T置换为A,将C置换为G,将G置换为C。
与实施例3的图3B同样,在使用P2A_PX459的情况下,导入了大致100%的两侧等位基因indel。另一方面,在使用P2A(错配)_PX459的情况下,单侧等位基因indel的导入率变高。
图6B表示使用了包含下述间隔序列的sgRNA的结果,该间隔序列相对于P2A的靶序列(序列号95)具有1个碱基错配且在5’末端添加有10个胞嘧啶。将P2A(错配_10C)_PX459导入Tbx3-P2A-AIMS中,进行了indel的评价。图的记载方法及碱基的置换方法与图6A的情况同样。“P”是使用P2A(10C(8A))_PX459的情况。在上述中,“P2A(10C(8A))”表示在P2A的靶序列的5’末端所添加的10个胞嘧啶中第8位的胞嘧啶被置换为腺苷的情况。
在图6B中,与图6A的结果相比,单侧等位基因indel的导入率整体性地增加。
图6C表示使用了包含下述间隔序列的sgRNA的结果,该间隔序列相对于P2A的靶序列(序列号95)具有1个碱基错配且在5’末端添加有25个胞嘧啶。将P2A(错配_25C)_PX459导入Tbx3-P2A-AIMS中,进行了indel的评价。图的记载方法及碱基的置换方法与图6A的情况同样。“P”是使用P2A(25C(23A))_PX459的情况。在上述中,“P2A(25C(23A))”表示在P2A的靶序列的5’末端所添加的25个胞嘧啶中第23位的胞嘧啶被置换成腺苷的情况。
在图6C中,与图6A及图6B的结果相比,indel导入率降低。尤其是两侧等位基因indel的导入率大幅降低。其结果是仅诱导单侧等位基因indel的错配位置增加。
这些结果表明:通过将错配法及5’核苷酸添加法组合,从而可以控制单侧等位基因indel的导入率。
[实施例7]indel诱导率(Probability:P)的计算及单侧等位基因indel频率的预测
若将基于CRISPR-Cas9获得的对靶区域的indel诱导率设为P,则单侧等位基因indel的频率、两侧等位基因indel的频率及无indel的频率可以分别由以下的式(m)、(b)及(n)来表示。
单侧等位基因indel的频率(mono)=2×P×(1-P)···(m)
两侧等位基因indel的频率(bi)=P2···(b)
无indel的频率(none)=(1-P)2···(n)
在此,若mono+bi+none=1,则P可以根据以下的式(1)来求得。
P=(2×bi+mono)/2···(1)
为此,由图3B~3D、图4B及图6A~6C的结果根据上述式(1)算出各sgRNA中的P值。使用这些P值并根据上述式(m)算出各sgRNA中的单侧等位基因indel的频率。
将根据上述式(m)算出的单侧等位基因indel的频率与图3B~3D、图4B及图6A~6C中实际检出的单侧等位基因indel的频率的相关关系示于图7中。
如图7所示,根据式(m)所预测的单侧等位基因indel的频率与实际所检出的单侧等位基因indel的频率显示出高相关性(R2=0.8943)。该结果表明单侧等位基因indel的频率可根据式(m)进行预测。
[实施例8]indel模式的预测
(Pre-Demo-Prediction)
Pre-Demo-Prediction是用于根据上述式(1)算出P值的简易的试验方法。Pre-Demo-Prediction按照图8A所示的使用说明书来进行。
将相对于任意靶序列的间隔序列的编码序列连接于PX459的BpiI位点,制作p:RCP。将上述p:RCP与实施例2的“(使用AIMS细胞的indel模式分析)”中记载的方法同样地转染于细胞,进行嘌呤霉素处理,选择嘌呤霉素抗性细胞。
对所得嘌呤霉素抗性细胞的DNA进行提取,利用PCR扩增包含靶序列的区域,将扩增片段插入T-Easy载体(pGEM-T Easy Vector System;Promega),进行了克隆。进行20~30个克隆的序列分析,算出已确认到indel的克隆的比例。以该值作为indel诱导率(P)。进而,使用所算出的P值,根据上述式(m)、(b)及(n)分别预测了单侧等位基因indel的频率、两侧等位基因indel的频率及无indel的频率。
(indel模式预测的评价)
选择白蛋白基因(Alb)作为基因组编辑的靶基因,使用包含间隔序列(以Alb作为靶标)的编码序列的sgRNA用接头(序列号89、90),制作Alb_PX459、Alb(10C(8A))_PX459及Alb(25C(23A))_PX459作为p:RCP。将它们分别导入野生型ES细胞中,按照上述方式进行了Pre-Demo-Prediction。将其预测结果示于图8B的左图。
另外,同样地进行Alb_PX459的转染及嘌呤霉素处理,得到嘌呤霉素抗性细胞的菌落。从各个嘌呤霉素抗性细胞菌落分别提取DNA,进行包含靶序列的区域的序列分析,对各个克隆中的indel模式进行了分析。由其结果分别求出单侧等位基因indel的频率、两侧等位基因indel的频率及无indel的频率。将其结果示于图8B右图中。
如图8B所示,基于Pre-Demo-Prediction得到的预测值与实际的indel模式类似。该结果表明可以通过Pre-Demo-Prediction来预测indel模式。
[实施例9]基于5’核苷酸添加法的脱靶效应的抑制(使用具有1个碱基错配的sgRNA的试验)
对于基于具有1个碱基错配的sgRNA进行的靶序列的基因组编辑,由于靶序列与间隔序列不一致,因此可以认为是脱靶的基因组编辑。为此,对于是否可以通过5’核苷酸添加法来抑制脱靶效应进行了研究。
图9A表示基于图6A~6C的数据并根据上述式(1)算出indel诱导率(P)的结果。基于在1~20的位置具有1个碱基错配的sgRNA进行的靶序列的基因组编辑可以视为脱靶的基因组编辑。
如图9A所示,通过在5’末端添加胞嘧啶,从而可以抑制脱靶作用。例如,当使用在1的位置具有错配的sgRNA的情况下,若不添加胞嘧啶,则indel诱导率(P)大致为1。但是,若在间隔序列的5’末端添加10个胞嘧啶,则indel诱导率(P)显著地降低。另一方面,在使用不具有错配的sgRNA的情况下,即使添加10个胞嘧啶,indel诱导率(P)也未显著降低。该结果表明:通过5’核苷酸添加法,既能维持中靶的基因组编辑活性,又能抑制脱靶效应。
(对基因组中的脱靶区域上的脱靶效应的验证)
针对EMX1基因中的靶序列(GAGTCCGAGCAGAAGAAGAA:序列号83(sgRNA制作用接头)的第5~24位),利用HEK293T细胞验证了脱靶区域即MFAP1基因区域(GAGTCtaAGCAGAAGAAGAA:序列号91;将与EMX1基因中的靶序列不同的部分用小文字表示)中的indel。
向上述实施例4中制作的10C(8A)接头PX459或25C(23A)接头PX459中插入以上述EMX1基因作为靶标的间隔序列的编码序列,分别制作EMX1_PX459(10C(8A))及EMX1_PX459(25C(23A))。将质粒的制作中使用的接头示于序列号83、84中。将这些质粒导入HEK293T细胞中。与上述的“(AIMS细胞的制作)”中记载的方法同样地进行转染及嘌呤霉素处理。Indel的确认通过T7E1分析和序列分析来进行。
利用PCR(EMX1中靶区域扩增用引物:序列号85、86;MFAR脱靶区域扩增用引物:序列号92、93)将从进行了转染及嘌呤霉素处理的HEK293T细胞中提取的DNA进行扩增,关于0C,将扩增片段插入T-Easy载体,进行了克隆。接着,通过利用T7E1酶(NEB)的分析及序列分析来确定indel的诱导率(P)。关于0C以外的(P),对已扩增的PCR产物直接进行T7E1分析,由切割条带量的比率算出(P)值,并示于图9B中。
通过在间隔序列的5’末端添加胞嘧啶,从而确认到与中靶的EMX1基因中的靶序列(中靶区域)相比在MFAP1基因中的脱靶区域中indel诱导率显著降低。该结果表明:通过在5’末端添加核苷酸,从而可以降低脱靶效应。
除了上述制作的10C(8A)接头PX459或25C(23A)接头PX459之外,还制作5C(3A)接头PX459、15C(13A)接头PX459、20C(18A)接头PX459及30C(28A)接头PX459,插入以上述EMX1基因作为靶标的间隔序列的编码序列,分别制作EMX1_PX459(5C(3A))、EMX1_PX459(10C(8A))、EMX1_PX459(15C(13A))、EMX1_PX459(20C(18A))、EMX1_PX459(25C(23A))及EMX1_PX459(30C(28A))。将在质粒的制作中使用的接头示于序列号117~124中。将这些质粒导入HEK293T细胞中。与上述的“(AIMS细胞的制作)”中记载的方法同样地进行转染及嘌呤霉素处理。Indel的确认通过T7E1分析和序列分析来进行。
利用PCR(EMX1中靶区域扩增用引物:序列号85、86;MFAR脱靶区域扩增用引物:序列号92、93)将从进行了转染及嘌呤霉素处理的HEK293T细胞中提取的DNA进行扩增,关于0C,将扩增片段插入T-Easy载体,进行了克隆。接着,通过利用T7E1酶(NEB)的分析及序列分析来确定indel的诱导率(P)。关于0C以外的(P),对已扩增的PCR产物直接进行T7E1分析,由切割条带量的比率算出(P)值,并示于图9C中。
通过在间隔序列的5’末端添加胞嘧啶,从而确认到与中靶的EMX1基因中的靶序列(中靶区域)相比在MFAP1基因中的脱靶区域中indel诱导率显著降低。该结果表明:通过在5’末端添加核苷酸,从而可以降低脱靶效应。
[实施例10]进行性骨化性纤维发育不良(FOP)中的遗传性疾病变异的修复试验
(细胞株)
使用在ACVR1基因的一个等位基因中具有FOP遗传性疾病变异((206位的精氨酸(CGC)变异为组氨酸(CAC):R206H))的人iPS细胞(wt/R206H)。
(FOP遗传性疾病变异修复方法)
将FOP遗传性疾病变异修复方法的概要示于图10A中。
作为针对ACVR1基因的变异等位基因(R206H)的选择性靶序列,选择(GGCTC[A]CCAGATTACACTGT:序列号112;[]表示变异碱基。),制作在上述靶序列上添加有衔接子序列的DNA(序列号100、101)。将其插入PX459、5C(3A)接头PX459、10C(8A)接头PX459及15C(13A)接头PX459的BPiI位点,分别制作ACVR1(R206H)_PX459、ACVR1(R206H)_PX459(5C(3A))、ACVR1(R206H)_PX459(10C(8A))及ACVR1(R206H)_PX459(15C(13A))。其结果得到表达包含在间隔序列的5’末端添加有0个、5个(其中1个为A)、10个(其中1个为A)或15个(其中1个为A)胞嘧啶的序列的sgRNA和Cas9的变异等位基因(R206H)编辑用质粒。若将这些质粒插入人iPS细胞(wt/R206H),则变异等位基因(R206H)优先被Cas9切割(图10A虚线箭头)。
接着,作为上述变异等位基因的修复用模板DNA,制作具有序列号102所示的碱基序列的单链寡核苷酸供体DNA(ssODN)。上述ssODN除修复R206H的变异的[G]外还在上述[G]的2碱基5’上游具有沉默突变[G]。通过上述沉默突变[G]能够阻止基因组修复后再导入indel(图10A黑箭头)。另外,可以确认存在ACVR1基因(wt/correct),该ACVR1基因具有wt的等位基因和被修复的等位基因(correct)。若进行变异等位基因(R206H)的基因组编辑,则因Cas9的作用而屡屡发生变异等位基因(R206H)的缺失、长缺失(unknown indel)。此时,在不存在沉默突变[G]的情况下,有可能将具有wt/unknown indel的克隆误认成具有wt/correct的克隆。进而,通过沉默突变[G]可导入限制酶BstUI的切割位点,因此可以简易地进行修复克隆的基因分型(genotyping)。
将上述各质粒及上述ssODN导入人iPS细胞(wt/R206H)中,诱导了HDR(HomologyDirected Repair)。
(基因型分析)
针对利用上述方法诱导了HDR的iPS细胞克隆,进行基因型分析,并确认了HDR的诱导效率。针对HDR诱导后的克隆,使用引物Pr.KW1181(序列号No.103)及Pr.KW1182(序列号No.104),利用PCR扩增了上述靶部位的DNA。关于扩增片段被BustUI切割的情况,使用Pr.KW1181进行了序列分析。
(结果)
将结果示于图10B中。图10B中,“overall”是在诱导了HDR的克隆中包含除wt/correct以外的基因型(indel/correct、wt/correct+indel等)的克隆的比例。如图10B所示,在5’末端未添加胞嘧啶的sgRNA(0C)中不能取得经准确修复的wt/correct的克隆。另一方面,添加有5个或10个胞嘧啶的sgRNA(5C、10C)中可以取得wt/correct的克隆。
(靶基因组切割效率的评价)
将上述变异等位基因(R206H)编辑用的各质粒中的任意质粒导入人iPS细胞(wt/R206H)中,以ACVR1基因序列内的变异等位基因(R206H)作为靶标进行了基因组编辑。接着,从细胞回收基因组,使用引物Pr.KW1181及Pr.KW1182,对DNA进行了PCR扩增。接着,使用扩增片段,进行基于T7Endonuclease I(T7E1)(购自NEB公司)的切割分析,并对indel诱导效率进行了测定。
将其结果示于图10C中。确认到:与在5’末端未添加胞嘧啶的sgRNA(0C)相比,添加有胞嘧啶的sgRNA(5C、10C、15C)中indel诱导效率显著降低。其表明该indel诱导效率的降低对于wt/correct克隆的取得(图10B)是必要的。
[实施例11]FOP遗传性疾病模型的制作试验
(细胞株)
使用不具有Acvr1基因的变异的小鼠ES细胞(wt/wt)。
(FOP遗传性疾病变异的诱导方法)
将FOP遗传性疾病变异诱导方法的概要示于图11A中。
作为针对Acvr1基因(wt/wt)的靶序列,选择(GGCTCGCCAGATAACCCTGT:序列号115),制作在上述靶序列上添加有衔接子序列的DNA(序列号105、106)。将其插入PX459、5C(3A)接头PX459、10C(8A)接头PX459、15C(13A)接头PX459、20C(18A)接头PX459、25C(23A)接头PX459及30C(28A)接头PX459的BPiI位点,分别制作ACVR1(R206H)_PX459、ACVR1(R206H)_PX459(5C(3A))、ACVR1(R206H)_PX459(10C(8A))、ACVR1(R206H)_PX459(15C(13A))、ACVR1(R206H)_PX459(20C(18A))、ACVR1(R206H)_PX459(25C(23A))及ACVR1(R206H)_PX459(30C(28A))。其结果得到Acvr1基因(wt/wt)编辑用质粒,其表达包含在间隔序列的5’末端添加有0个、5个(其中1个为A)、10个(其中1个为A)、15个(其中1个为A)、20个(其中1个为A)、25个(其中1个为A)或30个(其中1个为A)胞嘧啶的序列的sgRNA、和Cas9。若将这些质粒导入小鼠ES细胞,则Acvr1基因的wt等位基因被Cas9切割(图11A虚线箭头)。
接着,作为变异诱导用模板DNA,制作了具有序列号107所示碱基序列的ssODN。上述ssODN具有诱导R206H的变异的[A]。
将上述各质粒及上述ssODN导入小鼠ES细胞(wt/wt)中,诱导了HDR(HomologyDirected Repair)。上述质粒对杂合型变异克隆(wt/R206H)的变异等位基因(R206H)也能诱导indel(图11A白箭头),通过5’核苷酸添加sgRNA的脱靶抑制效果,可抑制对变异等位基因(R206H)的indel的诱导。因此认为能够有效地取得杂合型变异克隆(wt/R206H)。
(基因型分析)
针对利用上述方法诱导了HDR的ES细胞克隆,进行基因型分析,并确认了HDR的诱导效率。针对HDR诱导后的克隆,使用引物Pr.KW1201(序列号No.108)及Pr.KW1202(序列号No.109),利用PCR扩增了上述靶部位的DNA。针对扩增片段,使用Pr.KW1201进行了序列分析。
(结果)
将结果示于图11B中。图11B中,“overall”是在诱导了HDR的克隆中包含除wt/R206H以外的基因型(indel/R206H、wt/R206H+indel等)的克隆的比例。如图11B所示,在5’末端添加有5个胞嘧啶的sgRNA(5C)中,HDR诱导效率最高。随着由胞嘧啶添加数的增加所致的Cas9的活性降低(图11C),HDR诱导效率也变低。另一方面,杂合型变异克隆(wt/R206H)的取得率随着由胞嘧啶添加数的增加所致的Cas9活性的降低(图11C)而增加。
(靶基因组切割效率的评价)
将上述wt等位基因编辑用的各质粒中的任意质粒导入小鼠ES细胞(wt/wt)中,以Acvr1基因序列作为靶标进行了基因组编辑。接着,从细胞回收基因组,使用引物Pr.KW1201及Pr.KW1202,对DNA进行了PCR扩增。接着,使用扩增片段,进行基于T7 Endonuclease I(T7E1)(购自NEB公司)的切割分析,并对indel诱导效率进行了测定。
将其结果示于图11C中。确认到:随着胞嘧啶添加数的增加,indel诱导效率降低。图11C中,pX459是使用了不具有间隔序列的sgRNA的阴性对照。
(FOP遗传性疾病模型动物的制作)
将上述试验中取得的杂合型变异克隆(wt/R206H)微注射至小鼠的受精卵,制作嵌合小鼠。在上述嵌合小鼠中,在ES细胞做出贡献的部位观察到异常的骨的形成(图11D的箭头)。由以上结果证实了可以制作FOP遗传性疾病模型动物。
[实施例12]细胞毒性评价试验
(使用了AIMS的细胞毒性评价试验)
利用与实施例4同样的方法,以P2A的靶序列(TAACTTCAGCCTGCTGAAGC:序列号95)作为靶标,进行了AIMS细胞的基因组编辑。作为间隔序列,使用了在上述P2A靶序列的5’末端添加有0~20个胞嘧啶的序列。基因组编辑后,对细胞数进行了计数。
将其结果示于图12A中。在未添加胞嘧啶的sgRNA(0C)中,与添加有5个胞嘧啶的sgRNA(5C)相比,细胞数降低至1/5。如上述图4B所示,sgRNA(0C)及sgRNA(5C)中的indel诱导效率均为大致100%。因此暗示了可以通过添加胞嘧啶来抑制与基因组切割及indel诱导效率无关的细胞毒性。
(基于以ACVR1作为靶标的基因组编辑进行的细胞毒性评价试验)
作为针对ACVR1基因的靶序列,选择(GGCTCGCCAGATTACACTGT:序列号113),制作了在上述靶序列上添加有衔接子序列的DNA(序列号110、111)。将其插入PX459、5C(3A)接头PX459、10C(8A)接头PX459、15C(13A)接头PX459及20C(18A)接头PX459的BpiI位点,分别制作ACVR1(R206H)_PX459、ACVR1(R206H)_PX459(5C(3A))、ACVR1(R206H)_PX459(10C(8A))、ACVR1(R206H)_PX459(15C(13A))及ACVR1(R206H)_PX459(20C(18A))。其结果得到表达包含在间隔序列的5’末端添加有0个、5个(其中1个为A)、10个(其中1个为A)、15个(其中1个为A)或20个(其中1个为A)胞嘧啶的序列的sgRNA和Cas9的wt/wt编辑用质粒。将这些质粒导入人iPS细胞(wt/wt)中,进行了基因组编辑。基因组编辑后,对细胞数进行了计数。
将其结果示于图12B中。在未添加胞嘧啶的sgRNA(0C)中,与添加有5个胞嘧啶的sgRNA(5C)相比,细胞数降低至1/22。
[实施例13]indel诱导率(Probability:P)的计算及indel频率的预测
取得从AIMS得到的253个数据(由全部的C添加gRNA、mismatch gRNA、C添加+mismatch gRNA构成),基于这些数据,根据上述式(1)算出P值。以该算出的P值作为横轴,以Bi、Meno、None各自的indel数据值P作为纵轴而绘制成图。由该图得到二次函数的数式(图13A)。若将P值代入这些所得的数式,则可以分别预测Bi、Mono、None的indel比例。
在图13B中示出实际的实测值与基于上述式得到的预测值的关系。以实际的实测值Bi indel(P)、Mono indel(P)、None(P)作为横轴,以预测值(Prediction)作为纵轴而绘制成图。实测值和预测值显示出高相关性。
由于Bi indel(P)+Mono indel(P)+None(P)=1,因此,图13B的下图制作成None(P)=1-Bi indel(P)-Mono indel(P)。
在图13C上图中,示出Cdh1-P2A-AIMS中以P2A作为靶标进行基因组编辑时的实际数据。
在图13C中图中,示出将由所得的数据利用上述式(1)算出的P值代入图13A的数式(P=x)而作成的预测图。
在图13C下图中,示出indel模式预测图,该图如下获得:对在图13C上图的实验时提取的基因组进行PCR、由按照上述“[基因组编辑模式的预测方法]”进行的细菌(大肠菌)分析(实施例8:Pre-Demo-Prediction)求出P值、再将其代入图13A的数式而得到indel模式预测图表。图13C下图与图13C上图大体一致,由此证明了图13A的数式的正确性以及细菌分析的有效性。因此,即使在不使用AIMS而以内源性基因(基因组)作为靶标的情况下,通过对基因组编辑诱导后的细胞基因组进行PCR,并进行细菌分析,也能准确地预测不同等位基因的indel模式。
[实施例14]基于复合杂合子进行的预测
针对Cdh1-P2A-AIMS ES细胞,设定了P2A-sgRNA1(接头的序列号67、68)和Cdh1-sgRNA4(接头的序列号125、126)的2个部位的靶序列(图14A)。使不同的等位基因(反式的关系)中产生各自的单侧等位基因indel,利用1次重组操作制作复合杂合子indel克隆(图14B)。通过荧光图案(关于P2A部位:不需要序列)和设定引物(内源性Cdh1基因区域)中的基于PCR的PCR产物的序列,确定了基因型。Tomato等位基因的Cdh1-sgRNA4 target区域的基因型为Pr.KW1287(序列号127)和Pr.KW1118(序列号54)。Venus等位基因的Cdh1-sgRNA4target区域的基因型为Pr.KW558(序列号39)和Pr.KW1118(序列号54)。
结果如表6所示。
【表6】
Figure BDA0003204594410000721
P2A-sgRNA1和Cdh1-sgRNA4通过添加有0个胞嘧啶的sgRNA(0C)与添加有25个胞嘧啶的sgRNA(25C)的组合进行了实验。即使[0C]彼此或仅Cdh1为[25C],也不能取得复合杂合子indel克隆。在[25C]彼此中可以取得21克隆。因此表明由活性降低所致的Mono indel的诱导对于两靶标而言是必须的。
由21/363克隆的单侧等位基因indel的产生概率,算出复合杂合子indel概率为P=0.050。该P值验证了是否能够由基于按照图13的细菌分析得到的Mono P值进行预测。使用P2A-sgRNA1与Cdh1-sgRNA4的[0C]的sgRNA和[25C]的sgRNA,分别利用来自细菌分析的图13A的数式求出预测Mono P值(表6的Mono(P))。对于Compound预测P值,可以通过P2A Mono(P)xCdh1 Mono(P)x1/2(成为反式的概率)求出,为0.047。该预测P值0.047与实测P值0.050大体一致,由此证明了复合杂合子indel的产生比例也能利用细菌分析来准确地预测。
在本试验中,制作了一个基因内的复合杂合子,利用同样的原理,也可以用于预测例如对不同的多个基因(以全部为异源型、全部为同源型或混合型的形式)诱导indel时的概率,等。
例如,如果是Gene A~C三个基因,则可以按照以下方式进行预测。
全部为异源型P=Gene A Mono(P)×Gene B Mono(P)×Gene C Mono(P)
全部为同源型P=Gene A Bi(P)×Gene B Bi(P)×Gene C Bi(P)
混合型P=Gene A Bi(P)×Gene B Mono(P)×Gene C None(P)
[实施例15]体外切割分析
以P.KW13-3质粒(序列号4)作为模板,以Pr.KW541(序列号41)和Pr.KW607(序列号128)作为引物,进行了PCR。针对PCR产物300ng(951bp),使sgRNA与Cas9的复合体在体外作用,测定了C添加gRNA-Cas9的DNA切割活性(切割DNA:741bp和210bp)。
[0C]sgRNA、[10C]sgRNA及[25C]sgRNA利用以下的步骤来制作。以插入有P2A-gRNA1接头(序列号67、68)的PX459质粒作为模板,分别使用正向引物(Pr.KW1105(序列号129),Pr.KW1106(序列号130),Pr.KW1107(序列号131))和反向引物(Pr.KW1108(序列号132))进行了PCR。针对该PCR产物,基于T7 RNA聚合酶进行体外转录,由此得到上述各sgRNA。Cas9蛋白购自IDT公司。
将结果示于图15中。确认到:在同一摩尔浓度gRNA(200nM)作用下,DNA切割活性的降低依赖于C链长度。因此表明:5’核苷酸添加法不限于体内(细胞水平),在体外(试管内)也是有效的。
产业上的可利用性
根据本发明,可提供仅单侧等位基因经基因组编辑的细胞的制造方法、以及能够用于上述方法的向导RNA、表达载体、试剂盒。进而,还可提供基因组编辑模式的预测方法、以及基因组编辑模式的分析方法及能够用于上述分析方法的细胞。
序列表
<110> 国立大学法人九州大学
<120> 经基因组编辑的细胞的制造方法
<130> PC-29093
<150> JP2018-232946
<151> 2018-12-12
<160> 132
<170> PatentIn version 3.5
<210> 1
<211> 9175
<212> DNA
<213> 人工序列
<220>
<223> CRISPR all-in-one 质粒
<400> 1
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360
agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420
aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480
ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 900
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 960
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 1020
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1080
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1140
ctgagcaaga ggtaagggtt taagggatgg ttggttggtg gggtattaat gtttaattac 1200
ctggagcacc tgcctgaaat cacttttttt caggttggac cggtgccacc atggactata 1260
aggaccacga cggagactac aaggatcatg atattgatta caaagacgat gacgataaga 1320
tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt 1380
acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt 1440
acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga 1500
agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga 1560
agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga 1620
tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct 1680
tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg 1740
aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca 1800
gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc 1860
ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt 1920
tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg 1980
gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc 2040
tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga 2100
gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc 2160
agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc 2220
agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca 2280
tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat 2340
acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg 2400
agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg 2460
gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg 2520
gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct 2580
tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc 2640
ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga 2700
ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga 2760
tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg 2820
gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg 2880
agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga 2940
ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga 3000
aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga 3060
aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag 3120
atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg 3180
acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac 3240
tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg 3300
acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga 3360
agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt 3420
ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta 3480
aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg 3540
ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg 3600
acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca 3660
gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg 3720
aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc 3780
agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg 3840
accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga 3900
gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg 3960
gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc 4020
agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga 4080
gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc 4140
ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg 4200
agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg 4260
atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc 4320
acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg 4380
aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga 4440
gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact 4500
ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga 4560
caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga 4620
aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct 4680
tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg 4740
actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg 4800
tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg 4860
ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca 4920
agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg 4980
agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg 5040
aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc 5100
tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact 5160
acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg 5220
ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc 5280
aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca 5340
agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg 5400
ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc 5460
tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagg 5520
aattcggcag tggagagggc agaggaagtc tgctaacatg cggtgacgtc gaggagaatc 5580
ctggcccaat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca 5640
gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg 5700
atccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg 5760
ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca 5820
cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt 5880
tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc 5940
ccaaggagcc cgcgtggttc ctggccaccg tcggagtctc gcccgaccac cagggcaagg 6000
gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg 6060
ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg 6120
tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg 6180
gtgcctgaga attctaacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 6240
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 6300
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 6360
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaga atagcaggca 6420
tgctggggag cggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 6480
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 6540
ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcctgatgc ggtattttct 6600
ccttacgcat ctgtgcggta tttcacaccg catacgtcaa agcaaccata gtacgcgccc 6660
tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt 6720
gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc 6780
ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta 6840
cggcacctcg accccaaaaa acttgatttg ggtgatggtt cacgtagtgg gccatcgccc 6900
tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg 6960
ttccaaactg gaacaacact caaccctatc tcgggctatt cttttgattt ataagggatt 7020
ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 7080
tttaacaaaa tattaacgtt tacaatttta tggtgcactc tcagtacaat ctgctctgat 7140
gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 7200
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 7260
cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta 7320
tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg 7380
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 7440
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 7500
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 7560
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 7620
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 7680
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 7740
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 7800
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 7860
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 7920
ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 7980
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 8040
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 8100
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 8160
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg aagccgcggt 8220
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 8280
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 8340
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 8400
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 8460
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 8520
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 8580
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 8640
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 8700
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 8760
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 8820
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 8880
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 8940
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 9000
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 9060
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 9120
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 9175
<210> 2
<211> 2744
<212> DNA
<213> 人工序列
<220>
<223> sgRNA表达载体
<400> 2
ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 60
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 120
gcgagcgagc gcgcagctgc ctgcaggggc gcctgatgcg gtattttctc cttacgcatc 180
tgtgcggtat ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc 240
attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 300
agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 360
tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 420
ccccaaaaaa cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt 480
ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 540
aacaacactc aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc 600
ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 660
attaacgttt acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 720
aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 780
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 840
accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 900
taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg 960
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 1020
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 1080
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 1140
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 1200
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 1260
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 1320
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 1380
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 1440
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 1500
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 1560
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 1620
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 1680
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 1740
ctggtttatt gctgataaat ctggagccgg tgagcgtgga agccgcggta tcattgcagc 1800
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 1860
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 1920
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 1980
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 2040
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 2100
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 2160
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 2220
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa 2280
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 2340
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 2400
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 2460
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 2520
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 2580
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 2640
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 2700
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgt 2744
<210> 3
<211> 2804
<212> DNA
<213> 人工序列
<220>
<223> Tbx3-P2A-tdTomato KI载体(无主链T-easy载体序列)
<400> 3
gttccccact ctctaactcc ctatgtttct tctctctctt ccccagggct tggctatgtc 60
gcctttcggg agcctgtttc cttaccccta cacatacatg gctgcagcag ctgcagcctc 120
caccgcggcc gcctccagct ccgtgcaccg ccacccgttc ctcaatttga acagcatgcg 180
ccccaggctg cgttacagcc cctattccat ccccgtccca gtgccggata gcagcagttt 240
gctggccaca gctttaccat caatggcttc cgccgcgggg cccctagacg gcaaagcggc 300
cgccctggca gccagcccag cctcggtggc tgtggactcg gggtcggaac tgaacagccg 360
ctcgtccacg ctgtcctctg gctcagtgtc cttgtcaccc aaactctgct ccgagaagga 420
ggcggctacc agcgaactgc agagtatcca gcggctggtc agtggcttgg aagccaagcc 480
agacaggtct tgcagcgggt ccccttatgg taccggaagc ggagctacta acttcagcct 540
gctgaagcag gctggagacg tggaggagaa ccctggacct atggtgagca agggcgagga 600
ggtcatcaaa gagttcatgc gcttcaaggt gcgcatggag ggctccatga acggccacga 660
gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga ccgccaagct 720
gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc cccagttcat 780
gtacggctcc aaggcgtacg tgaagcaccc cgccgacatc cccgattaca agaagctgtc 840
cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gtctggtgac 900
cgtgacccag gactcctccc tgcaggacgg cacgctgatc tacaaggtga agatgcgcgg 960
caccaacttc ccccccgacg gccccgtaat gcagaagaag accatgggct gggaggcctc 1020
caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc gagatccacc aggccctgaa 1080
gctgaaggac ggcggccgct acctggtgga gttcaagacc atctacatgg ccaagaagcc 1140
cgtgcaactg cccggctact actacgtgga caccaagctg gacatcacct cccacaacga 1200
ggactacacc atcgtggaac agtacgagcg ctccgagggc cgccaccacc tgttcctggg 1260
gcatggcacc ggcagcaccg gcagcggcag ctccggcacc gcctcctccg aggacaacaa 1320
catggccgtc atcaaagagt tcatgcgctt caaggtgcgc atggagggct ccatgaacgg 1380
ccacgagttc gagatcgagg gcgagggcga gggccgcccc tacgagggca cccagaccgc 1440
caagctgaag gtgaccaagg gcggccccct gcccttcgcc tgggacatcc tgtcccccca 1500
gttcatgtac ggctccaagg cgtacgtgaa gcaccccgcc gacatccccg attacaagaa 1560
gctgtccttc cccgagggct tcaagtggga gcgcgtgatg aacttcgagg acggcggtct 1620
ggtgaccgtg acccaggact cctccctgca ggacggcacg ctgatctaca aggtgaagat 1680
gcgcggcacc aacttccccc ccgacggccc cgtaatgcag aagaagacca tgggctggga 1740
ggcctccacc gagcgcctgt acccccgcga cggcgtgctg aagggcgaga tccaccaggc 1800
cctgaagctg aaggacggcg gccactacct ggtggagttc aagaccatct acatggccaa 1860
gaagcccgtg caactgcccg gctactacta cgtggacacc aagctggaca tcacctccca 1920
caacgaggac tacaccatcg tggaacagta cgagcgctcc gagggccgcc accacctgtt 1980
cctgtacggc atggacgagc tgtacaagta aaagcttggc cgccatggcc caacgtcgac 2040
ctgccagtgc actttgttag atgtaaaata aaccacgggc cttccacatg gggtgacccc 2100
cgccctgtcc ctttcagttt tgtctgggag ggagcactaa agcctttcca gagactatgc 2160
tagataccac aggccctgcc accatgggct gtgtaaccag gctgctgttg ctttgaaacg 2220
cgggactgag ggggcgggag gagtggtggc aaacaggctt ttgtgtctag agcgactttt 2280
gtgcaggctg gtatggaagt cggggctgaa gaacaaggta gccaggccag ccaggagcgc 2340
gggtctttga gagacttcac cggaatcttt cccccttcgt gtgtttagtg gaaacatccc 2400
ccctcctaaa caaactaaca aaaccaatat ggaggtgggg ggagatgaag tcctgtggaa 2460
ctgtctatga agactgaaac tcaccaattg ctgagtactt tcgttggggc agagagaaga 2520
ggggccttac cttgccccat ctatattaaa ggaatcctgt ctttttttgt ttgtttgttt 2580
ttaaatattg tgatgtttta agagccgatg ctggcttctt ttttgcatgt tacagttttc 2640
tgggtttatt ttgccccccc ccccttttat ggaaaaacaa cggaagtccc attatcctca 2700
accttgctca aggcggcaac caggaggaag tggggtaaaa ggggcagcta tgggcatgaa 2760
accaaccgag ttgattttta tctgagcgct tgtagaggat gcat 2804
<210> 4
<211> 2070
<212> DNA
<213> 人工序列
<220>
<223> Tbx3-P2A-Venus KI载体(无主链T-easy载体序列)
<400> 4
gttccccact ctctaactcc ctatgtttct tctctctctt ccccagggct tggctatgtc 60
gcctttcggg agcctgtttc cttaccccta cacatacatg gctgcagcag ctgcagcctc 120
caccgcggcc gcctccagct ccgtgcaccg ccacccgttc ctcaatttga acagcatgcg 180
ccccaggctg cgttacagcc cctattccat ccccgtccca gtgccggata gcagcagttt 240
gctggccaca gctttaccat caatggcttc cgccgcgggg cccctagacg gcaaagcggc 300
cgccctggca gccagcccag cctcggtggc tgtggactcg gggtcggaac tgaacagccg 360
ctcgtccacg ctgtcctctg gctcagtgtc cttgtcaccc aaactctgct ccgagaagga 420
ggcggctacc agcgaactgc agagtatcca gcggctggtc agtggcttgg aagccaagcc 480
agacaggtct tgcagcgggt ccccttatgg taccggaagc ggagctacta acttcagcct 540
gctgaagcag gctggagacg tggaggagaa ccctggacct atggtgagca agggcgagga 600
gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 660
gttcagcgtg tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagct 720
gatctgcacc accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgggcta 780
cggcctgcag tgcttcgccc gctaccccga ccacatgaag cagcacgact tcttcaagtc 840
cgccatgccc gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta 900
caagacccgc gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa 960
gggcatcgac ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa 1020
cagccacaac gtctatatca ccgccgacaa gcagaagaac ggcatcaagg ccaacttcaa 1080
gatccgccac aacatcgagg acggcggcgt gcagctcgcc gaccactacc agcagaacac 1140
ccccatcggc gacggccccg tgctgctgcc cgacaaccac tacctgagct accagtccaa 1200
gctgagcaaa gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc 1260
cgccgggatc actctcggca tggacgagct gtacaagtaa gtcgacctgc cagtgcactt 1320
tgttagatgt aaaataaacc acgggccttc cacatggggt gacccccgcc ctgtcccttt 1380
cagttttgtc tgggagggag cactaaagcc tttccagaga ctatgctaga taccacaggc 1440
cctgccacca tgggctgtgt aaccaggctg ctgttgcttt gaaacgcggg actgaggggg 1500
cgggaggagt ggtggcaaac aggcttttgt gtctagagcg acttttgtgc aggctggtat 1560
ggaagtcggg gctgaagaac aaggtagcca ggccagccag gagcgcgggt ctttgagaga 1620
cttcaccgga atctttcccc cttcgtgtgt ttagtggaaa catcccccct cctaaacaaa 1680
ctaacaaaac caatatggag gtggggggag atgaagtcct gtggaactgt ctatgaagac 1740
tgaaactcac caattgctga gtactttcgt tggggcagag agaagagggg ccttaccttg 1800
ccccatctat attaaaggaa tcctgtcttt ttttgtttgt ttgtttttaa atattgtgat 1860
gttttaagag ccgatgctgg cttctttttt gcatgttaca gttttctggg tttattttgc 1920
cccccccccc ttttatggaa aaacaacgga agtcccatta tcctcaacct tgctcaaggc 1980
ggcaaccagg aggaagtggg gtaaaagggg cagctatggg catgaaacca accgagttga 2040
tttttatctg agcgcttgta gaggatgcat 2070
<210> 5
<211> 2498
<212> DNA
<213> 人工序列
<220>
<223> Cdh1-P2A-tdTomato KI载体(无主链T-easy载体序列)
<400> 5
ccgcggctga ttcccccaac ttcagaatta acatttaaca atagcagttt gtcatctgtc 60
cttcgaggat tttctgggct gaactgtaac ctacgtgttt tagtatgacg actctcgttg 120
ctcttaccct ctgtccagcc tggccttggg actttgcctt ctgtgctggt gtgtgtgtgt 180
gtgtgtgtgt gtgtgtgtgt accttgaagg ggttaactac tccttggtta gtttttcatg 240
tttggggtgt tgcttgcctc tgatgcatac tgataagtac ggtgctcttc cttttagaac 300
ctgaaggcag ccgacagcga ccccacggca cccccttacg actctctgtt ggtgttcgat 360
tacgagggca gtggttctga agccgctagc ctgagctcac tgaactcctc tgagtcggat 420
caggaccagg actacgatta tctgaacgag tggggcaacc gattcaagaa gctggcggac 480
atgtacggcg gtggtgagga cgacggtacc ggaagcggag ctactaactt cagcctgctg 540
aagcaggctg gagacgtgga ggagaaccct ggacctatgg tgagcaaggg cgaggaggtc 600
atcaaagagt tcatgcgctt caaggtgcgc atggagggct ccatgaacgg ccacgagttc 660
gagatcgagg gcgagggcga gggccgcccc tacgagggca cccagaccgc caagctgaag 720
gtgaccaagg gcggccccct gcccttcgcc tgggacatcc tgtcccccca gttcatgtac 780
ggctccaagg cgtacgtgaa gcaccccgcc gacatccccg attacaagaa gctgtccttc 840
cccgagggct tcaagtggga gcgcgtgatg aacttcgagg acggcggtct ggtgaccgtg 900
acccaggact cctccctgca ggacggcacg ctgatctaca aggtgaagat gcgcggcacc 960
aacttccccc ccgacggccc cgtaatgcag aagaagacca tgggctggga ggcctccacc 1020
gagcgcctgt acccccgcga cggcgtgctg aagggcgaga tccaccaggc cctgaagctg 1080
aaggacggcg gccgctacct ggtggagttc aagaccatct acatggccaa gaagcccgtg 1140
caactgcccg gctactacta cgtggacacc aagctggaca tcacctccca caacgaggac 1200
tacaccatcg tggaacagta cgagcgctcc gagggccgcc accacctgtt cctggggcat 1260
ggcaccggca gcaccggcag cggcagctcc ggcaccgcct cctccgagga caacaacatg 1320
gccgtcatca aagagttcat gcgcttcaag gtgcgcatgg agggctccat gaacggccac 1380
gagttcgaga tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag 1440
ctgaaggtga ccaagggcgg ccccctgccc ttcgcctggg acatcctgtc cccccagttc 1500
atgtacggct ccaaggcgta cgtgaagcac cccgccgaca tccccgatta caagaagctg 1560
tccttccccg agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggtctggtg 1620
accgtgaccc aggactcctc cctgcaggac ggcacgctga tctacaaggt gaagatgcgc 1680
ggcaccaact tcccccccga cggccccgta atgcagaaga agaccatggg ctgggaggcc 1740
tccaccgagc gcctgtaccc ccgcgacggc gtgctgaagg gcgagatcca ccaggccctg 1800
aagctgaagg acggcggcca ctacctggtg gagttcaaga ccatctacat ggccaagaag 1860
cccgtgcaac tgcccggcta ctactacgtg gacaccaagc tggacatcac ctcccacaac 1920
gaggactaca ccatcgtgga acagtacgag cgctccgagg gccgccacca cctgttcctg 1980
tacggcatgg acgagctgta caagtaaagc ttggccgcca tggcccaacg tcgaccgtgt 2040
ggcaccatgg gagatgcaga ataattatat cagtggtctt tcagctcctt ccctgagtgt 2100
gtagaagaga gactgatctg agaagtgtgc agattgcata gtggtctcac tctccctact 2160
ggactgtctg tgttaggatg gttttcactg attgttgaaa tcttttttta ttttttattt 2220
ttacagtgct gagatataaa ctgtgccttt ttttgtttgt ttgtttctgt ttttgttctt 2280
ttgagctatg atctgcccca gacacaacag ccccaagccc ctcacacctc actaattttt 2340
tacattgtgt acttgccctc aattaccatg tttgctgtat tctaatagtc actcatgttc 2400
ctgaattctg ttgccctgcc caggtgatat tctaggatgc agaaatgcct gggccctttt 2460
atggtgagag acaggtatct tggtgtgggt gcgtcgac 2498
<210> 6
<211> 1594
<212> DNA
<213> 人工序列
<220>
<223> Cdh1-P2A-Venus KI载体(无主链T-easy载体序列)
<400> 6
ccgcggctga ttcccccaac ttcagaatta acatttaaca atagcagttt gtcatctgtc 60
cttcgaggat tttctgggct gaactgtaac ctacgtgttt tagtatgacg actctcgttg 120
ctcttaccct ctgtccagcc tggccttggg actttgcctt ctgtgctggt gtgtgtgtgt 180
gtgtgtgtgt gtgtgtgtgt accttgaagg ggttaactac tccttggtta gtttttcatg 240
tttggggtgt tgcttgcctc tgatgcatac tgataagtac ggtgctcttc cttttagaac 300
ctgaaggcag ccgacagcga ccccacggca cccccttacg actctctgtt ggtgttcgat 360
tacgagggca gtggttctga agccgctagc ctgagctcac tgaactcctc tgagtcggat 420
caggaccagg actacgatta tctgaacgag tggggcaacc gattcaagaa gctggcggac 480
atgtacggcg gtggtgagga cgacggtacc ggaagcggag ctactaactt cagcctgctg 540
aagcaggctg gagacgtgga ggagaaccct ggacctatgg tgagcaaggg cgaggagctg 600
ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 660
agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagctgatc 720
tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gggctacggc 780
ctgcagtgct tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 840
atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 900
acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 960
atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 1020
cacaacgtct atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc 1080
cgccacaaca tcgaggacgg cggcgtgcag ctcgccgacc actaccagca gaacaccccc 1140
atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagctacca gtccaagctg 1200
agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 1260
gggatcactc tcggcatgga cgagctgtac aagtaagtcg acgggactag caagtctcca 1320
ccgtgtggca ccatgggaga tgcagaataa ttatatcagt ggtctttcag ctccttccct 1380
gagtgtgtag aagagagact gatctgagaa gtgtgcagat tgcatagtgg tctcactctc 1440
cctactggac tgtctgtgtt aggatggttt tcactgattg ttgaaatctt tttttatttt 1500
ttatttttac agtgctgaga tataaactgt gccttttttt gtttgtttgt ttctgttttt 1560
gttcttttga gctatgatct gccccagagt cgac 1594
<210> 7
<211> 2498
<212> DNA
<213> 人工序列
<220>
<223> Cdh1-aP2A-tdTomato KI载体(无主链T-easy载体序列)
<400> 7
ccgcggctga ttcccccaac ttcagaatta acatttaaca atagcagttt gtcatctgtc 60
cttcgaggat tttctgggct gaactgtaac ctacgtgttt tagtatgacg actctcgttg 120
ctcttaccct ctgtccagcc tggccttggg actttgcctt ctgtgctggt gtgtgtgtgt 180
gtgtgtgtgt gtgtgtgtgt accttgaagg ggttaactac tccttggtta gtttttcatg 240
tttggggtgt tgcttgcctc tgatgcatac tgataagtac ggtgctcttc cttttagaac 300
ctgaaggcag ccgacagcga ccccacggca cccccttacg actctctgtt ggtgttcgat 360
tacgagggca gtggttctga agccgctagc ctgagctcac tgaactcctc tgagtcggat 420
caggaccagg actacgatta tctgaacgag tggggcaacc gattcaagaa gctggcggac 480
atgtacggcg gtggtgagga cgacggtacc gggagtgggg ccaccaattt tagtctacta 540
aaacaagccg gggatgtaga agaaaatccc gggcccatgg tgagcaaggg cgaggaggtc 600
atcaaagagt tcatgcgctt caaggtgcgc atggagggct ccatgaacgg ccacgagttc 660
gagatcgagg gcgagggcga gggccgcccc tacgagggca cccagaccgc caagctgaag 720
gtgaccaagg gcggccccct gcccttcgcc tgggacatcc tgtcccccca gttcatgtac 780
ggctccaagg cgtacgtgaa gcaccccgcc gacatccccg attacaagaa gctgtccttc 840
cccgagggct tcaagtggga gcgcgtgatg aacttcgagg acggcggtct ggtgaccgtg 900
acccaggact cctccctgca ggacggcacg ctgatctaca aggtgaagat gcgcggcacc 960
aacttccccc ccgacggccc cgtaatgcag aagaagacca tgggctggga ggcctccacc 1020
gagcgcctgt acccccgcga cggcgtgctg aagggcgaga tccaccaggc cctgaagctg 1080
aaggacggcg gccgctacct ggtggagttc aagaccatct acatggccaa gaagcccgtg 1140
caactgcccg gctactacta cgtggacacc aagctggaca tcacctccca caacgaggac 1200
tacaccatcg tggaacagta cgagcgctcc gagggccgcc accacctgtt cctggggcat 1260
ggcaccggca gcaccggcag cggcagctcc ggcaccgcct cctccgagga caacaacatg 1320
gccgtcatca aagagttcat gcgcttcaag gtgcgcatgg agggctccat gaacggccac 1380
gagttcgaga tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag 1440
ctgaaggtga ccaagggcgg ccccctgccc ttcgcctggg acatcctgtc cccccagttc 1500
atgtacggct ccaaggcgta cgtgaagcac cccgccgaca tccccgatta caagaagctg 1560
tccttccccg agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggtctggtg 1620
accgtgaccc aggactcctc cctgcaggac ggcacgctga tctacaaggt gaagatgcgc 1680
ggcaccaact tcccccccga cggccccgta atgcagaaga agaccatggg ctgggaggcc 1740
tccaccgagc gcctgtaccc ccgcgacggc gtgctgaagg gcgagatcca ccaggccctg 1800
aagctgaagg acggcggcca ctacctggtg gagttcaaga ccatctacat ggccaagaag 1860
cccgtgcaac tgcccggcta ctactacgtg gacaccaagc tggacatcac ctcccacaac 1920
gaggactaca ccatcgtgga acagtacgag cgctccgagg gccgccacca cctgttcctg 1980
tacggcatgg acgagctgta caagtaaagc ttggccgcca tggcccaacg tcgaccgtgt 2040
ggcaccatgg gagatgcaga ataattatat cagtggtctt tcagctcctt ccctgagtgt 2100
gtagaagaga gactgatctg agaagtgtgc agattgcata gtggtctcac tctccctact 2160
ggactgtctg tgttaggatg gttttcactg attgttgaaa tcttttttta ttttttattt 2220
ttacagtgct gagatataaa ctgtgccttt ttttgtttgt ttgtttctgt ttttgttctt 2280
ttgagctatg atctgcccca gacacaacag ccccaagccc ctcacacctc actaattttt 2340
tacattgtgt acttgccctc aattaccatg tttgctgtat tctaatagtc actcatgttc 2400
ctgaattctg ttgccctgcc caggtgatat tctaggatgc agaaatgcct gggccctttt 2460
atggtgagag acaggtatct tggtgtgggt gcgtcgac 2498
<210> 8
<211> 1594
<212> DNA
<213> 人工序列
<220>
<223> Cdh1-aP2A-Venus KI载体(无主链T-easy载体序列)
<400> 8
ccgcggctga ttcccccaac ttcagaatta acatttaaca atagcagttt gtcatctgtc 60
cttcgaggat tttctgggct gaactgtaac ctacgtgttt tagtatgacg actctcgttg 120
ctcttaccct ctgtccagcc tggccttggg actttgcctt ctgtgctggt gtgtgtgtgt 180
gtgtgtgtgt gtgtgtgtgt accttgaagg ggttaactac tccttggtta gtttttcatg 240
tttggggtgt tgcttgcctc tgatgcatac tgataagtac ggtgctcttc cttttagaac 300
ctgaaggcag ccgacagcga ccccacggca cccccttacg actctctgtt ggtgttcgat 360
tacgagggca gtggttctga agccgctagc ctgagctcac tgaactcctc tgagtcggat 420
caggaccagg actacgatta tctgaacgag tggggcaacc gattcaagaa gctggcggac 480
atgtacggcg gtggtgagga cgacggtacc gggagtgggg ccaccaattt tagtctacta 540
aaacaagccg gggatgtaga agaaaatccc gggcccatgg tgagcaaggg cgaggagctg 600
ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 660
agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagctgatc 720
tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gggctacggc 780
ctgcagtgct tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 840
atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 900
acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 960
atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 1020
cacaacgtct atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc 1080
cgccacaaca tcgaggacgg cggcgtgcag ctcgccgacc actaccagca gaacaccccc 1140
atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagctacca gtccaagctg 1200
agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 1260
gggatcactc tcggcatgga cgagctgtac aagtaagtcg acgggactag caagtctcca 1320
ccgtgtggca ccatgggaga tgcagaataa ttatatcagt ggtctttcag ctccttccct 1380
gagtgtgtag aagagagact gatctgagaa gtgtgcagat tgcatagtgg tctcactctc 1440
cctactggac tgtctgtgtt aggatggttt tcactgattg ttgaaatctt tttttatttt 1500
ttatttttac agtgctgaga tataaactgt gccttttttt gtttgtttgt ttctgttttt 1560
gttcttttga gctatgatct gccccagagt cgac 1594
<210> 9
<211> 4269
<212> DNA
<213> 人工序列
<220>
<223> PX459内的hSpCas9序列
<400> 9
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260
aagaaaaag 4269
<210> 10
<211> 507
<212> DNA
<213> 小鼠(mus musculus)
<400> 10
gttccccact ctctaactcc ctatgtttct tctctctctt ccccagggct tggctatgtc 60
gcctttcggg agcctgtttc cttaccccta cacatacatg gctgcagcag ctgcagcctc 120
caccgcggcc gcctccagct ccgtgcaccg ccacccgttc ctcaatttga acagcatgcg 180
ccccaggctg cgttacagcc cctattccat ccccgtccca gtgccggata gcagcagttt 240
gctggccaca gctttaccat caatggcttc cgccgcgggg cccctagacg gcaaagcggc 300
cgccctggca gccagcccag cctcggtggc tgtggactcg gggtcggaac tgaacagccg 360
ctcgtccacg ctgtcctctg gctcagtgtc cttgtcaccc aaactctgct ccgagaagga 420
ggcggctacc agcgaactgc agagtatcca gcggctggtc agtggcttgg aagccaagcc 480
agacaggtct tgcagcgggt cccctta 507
<210> 11
<211> 758
<212> DNA
<213> 小鼠
<400> 11
ctgccagtgc actttgttag atgtaaaata aaccacgggc cttccacatg gggtgacccc 60
cgccctgtcc ctttcagttt tgtctgggag ggagcactaa agcctttcca gagactatgc 120
tagataccac aggccctgcc accatgggct gtgtaaccag gctgctgttg ctttgaaacg 180
cgggactgag ggggcgggag gagtggtggc aaacaggctt ttgtgtctag agcgactttt 240
gtgcaggctg gtatggaagt cggggctgaa gaacaaggta gccaggccag ccaggagcgc 300
gggtctttga gagacttcac cggaatcttt cccccttcgt gtgtttagtg gaaacatccc 360
ccctcctaaa caaactaaca aaaccaatat ggaggtgggg ggagatgaag tcctgtggaa 420
ctgtctatga agactgaaac tcaccaattg ctgagtactt tcgttggggc agagagaaga 480
ggggccttac cttgccccat ctatattaaa ggaatcctgt ctttttttgt ttgtttgttt 540
ttaaatattg tgatgtttta agagccgatg ctggcttctt ttttgcatgt tacagttttc 600
tgggtttatt ttgccccccc ccccttttat ggaaaaacaa cggaagtccc attatcctca 660
accttgctca aggcggcaac caggaggaag tggggtaaaa ggggcagcta tgggcatgaa 720
accaaccgag ttgattttta tctgagcgct tgtagagg 758
<210> 12
<211> 498
<212> DNA
<213> 小鼠
<400> 12
ctgattcccc caacttcaga attaacattt aacaatagca gtttgtcatc tgtccttcga 60
ggattttctg ggctgaactg taacctacgt gttttagtat gacgactctc gttgctctta 120
ccctctgtcc agcctggcct tgggactttg ccttctgtgc tggtgtgtgt gtgtgtgtgt 180
gtgtgtgtgt gtgtaccttg aaggggttaa ctactccttg gttagttttt catgtttggg 240
gtgttgcttg cctctgatgc atactgataa gtacggtgct cttcctttta gaacctgaag 300
gcagccgaca gcgaccccac ggcaccccct tacgactctc tgttggtgtt cgattacgag 360
ggcagtggtt ctgaagccgc tagcctgagc tcactgaact cctctgagtc ggatcaggac 420
caggactacg attatctgaa cgagtggggc aaccgattca agaagctggc ggacatgtac 480
ggcggtggtg aggacgac 498
<210> 13
<211> 457
<212> DNA
<213> 小鼠
<400> 13
cgtgtggcac catgggagat gcagaataat tatatcagtg gtctttcagc tccttccctg 60
agtgtgtaga agagagactg atctgagaag tgtgcagatt gcatagtggt ctcactctcc 120
ctactggact gtctgtgtta ggatggtttt cactgattgt tgaaatcttt ttttattttt 180
tatttttaca gtgctgagat ataaactgtg cctttttttg tttgtttgtt tctgtttttg 240
ttcttttgag ctatgatctg ccccagacac aacagcccca agcccctcac acctcactaa 300
ttttttacat tgtgtacttg ccctcaatta ccatgtttgc tgtattctaa tagtcactca 360
tgttcctgaa ttctgttgcc ctgcccaggt gatattctag gatgcagaaa tgcctgggcc 420
cttttatggt gagagacagg tatcttggtg tgggtgc 457
<210> 14
<211> 66
<212> DNA
<213> 猪捷申病毒-1型
<400> 14
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66
<210> 15
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> aP2A序列
<400> 15
gggagtgggg ccaccaattt tagtctacta aaacaagccg gggatgtaga agaaaatccc 60
gggccc 66
<210> 16
<211> 1431
<212> DNA
<213> 圆盘海葵属(Discosoma sp)
<400> 16
atggtgagca agggcgagga ggtcatcaaa gagttcatgc gcttcaaggt gcgcatggag 60
ggctccatga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120
ggcacccaga ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180
atcctgtccc cccagttcat gtacggctcc aaggcgtacg tgaagcaccc cgccgacatc 240
cccgattaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300
gaggacggcg gtctggtgac cgtgacccag gactcctccc tgcaggacgg cacgctgatc 360
tacaaggtga agatgcgcgg caccaacttc ccccccgacg gccccgtaat gcagaagaag 420
accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480
gagatccacc aggccctgaa gctgaaggac ggcggccgct acctggtgga gttcaagacc 540
atctacatgg ccaagaagcc cgtgcaactg cccggctact actacgtgga caccaagctg 600
gacatcacct cccacaacga ggactacacc atcgtggaac agtacgagcg ctccgagggc 660
cgccaccacc tgttcctggg gcatggcacc ggcagcaccg gcagcggcag ctccggcacc 720
gcctcctccg aggacaacaa catggccgtc atcaaagagt tcatgcgctt caaggtgcgc 780
atggagggct ccatgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc 840
tacgagggca cccagaccgc caagctgaag gtgaccaagg gcggccccct gcccttcgcc 900
tgggacatcc tgtcccccca gttcatgtac ggctccaagg cgtacgtgaa gcaccccgcc 960
gacatccccg attacaagaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg 1020
aacttcgagg acggcggtct ggtgaccgtg acccaggact cctccctgca ggacggcacg 1080
ctgatctaca aggtgaagat gcgcggcacc aacttccccc ccgacggccc cgtaatgcag 1140
aagaagacca tgggctggga ggcctccacc gagcgcctgt acccccgcga cggcgtgctg 1200
aagggcgaga tccaccaggc cctgaagctg aaggacggcg gccactacct ggtggagttc 1260
aagaccatct acatggccaa gaagcccgtg caactgcccg gctactacta cgtggacacc 1320
aagctggaca tcacctccca caacgaggac tacaccatcg tggaacagta cgagcgctcc 1380
gagggccgcc accacctgtt cctgtacggc atggacgagc tgtacaagta a 1431
<210> 17
<211> 720
<212> DNA
<213> 维多利亚多管发光水母(Aequorea Victoria)
<400> 17
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagct gatctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgggcta cggcctgcag tgcttcgccc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca ccgccgacaa gcagaagaac 480
ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagct accagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Tbx3 5'同源臂的引物(F)
<400> 18
gttccccact ctctaactcc 20
<210> 19
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> Tbx3 5'同源臂的引物(R)
<400> 19
ggtaccataa ggggacccgc tgcaaga 27
<210> 20
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> Tbx3 3'同源臂的引物(F)
<400> 20
gtcgacctgc cagtgcactt tgttag 26
<210> 21
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> Tbx3 3'同源臂的引物(R)
<400> 21
atgcatcctc tacaagcgct cagata 26
<210> 22
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> Cdh1 5'同源臂的引物(F)
<400> 22
ccgcggctga ttcccccaac ttcaga 26
<210> 23
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> Cdh1 5'同源臂的引物(R)
<400> 23
ggtaccgtcg tcctcaccac cgccgt 26
<210> 24
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> Cdh1 3'同源臂的引物(F)
<400> 24
gtcgaccgtg tggcaccatg ggagatg 27
<210> 25
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Cdh1 3'同源臂的引物(R)
<400> 25
gcacccacac caagatacct g 21
<210> 26
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> tdTomato的引物(F)
<400> 26
ggtaccggaa gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag 60
aaccctggac ctatggtgag caagggcgag gaggtcat 98
<210> 27
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> tdTomato的引物(R)
<400> 27
gtcgacgttg ggccatggcg gccaagctt 29
<210> 28
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> Venus的引物(F)
<400> 28
ggtaccggaa gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag 60
aaccctggac ctatggtgag caagggcgag gaggtcat 98
<210> 29
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> Venus的引物(R)
<400> 29
gtcgacttac ttgtacagct cgtccat 27
<210> 30
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> Neo+pA的引物(F)
<400> 30
ggtaccggaa gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag 60
aaccctggac ctatgggatc ggccattgaa caagatgg 98
<210> 31
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> Neo+pA的引物(F)
<400> 31
ggtaccggga gtggggccac caattttagt ctactaaaac aagccgggga tgtagaagaa 60
aatcccgggc ccatgggatc ggccattgaa caagatgg 98
<210> 32
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> Neo+pA的引物(R)
<400> 32
gtcgaccagc tggttctttc cgcctcag 28
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Tbx3-tdTomato KI的基因分型的引物(F)
<400> 33
tagtaggcgg tggaggagaa 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Tbx3-tdTomato KI的基因分型的引物(R)
<400> 34
accttgaagc gcatgaactc 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Tbx3-tdTomato KI的基因分型的引物(F)
<400> 35
caccatcgtg gaacagtacg 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Tbx3-tdTomato KI的基因分型的引物(R)
<400> 36
ctaatggtcc aacaggcaca 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Tbx3-Venus KI的基因分型的引物(F)
<400> 37
tagtaggcgg tggaggagaa 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Tbx3-Venus KI的基因分型的引物(R)
<400> 38
agatcagctt cagggtcagc 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Tbx3-Venus KI的基因分型的引物(F)
<400> 39
acatggtcct gctggagttc 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Tbx3-Venus KI的基因分型的引物(R)
<400> 40
ctaatggtcc aacaggcaca 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于检测Tbx3-tdTomato(Venus)KI后的野生型的引物(F)
<400> 41
actcggggtc ggaactgaac 20
<210> 42
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 用于检测Tbx3-tdTomato(Venus)KI后的野生型的引物(R)
<400> 42
cctggctacc ttgttcttc 19
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cdh1-tdTomato KI的基因分型的引物(F)
<400> 43
aggccacacc tcctaatcct 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cdh1-tdTomato KI的基因分型的引物(R)
<400> 44
accttgaagc gcatgaactc 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cdh1-tdTomato KI的基因分型的引物(F)
<400> 45
caccatcgtg gaacagtacg 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cdh1-tdTomato KI的基因分型的引物(R)
<400> 46
gcatgcatag tggtcccttt 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cdh1-Venus KI的基因分型的引物(F)
<400> 47
aggccacacc tcctaatcct 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cdh1-Venus KI的基因分型的引物(R)
<400> 48
agatcagctt cagggtcagc 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cdh1-Venus KI的基因分型的引物(F)
<400> 49
acatggtcct gctggagttc 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cdh1-Venus KI的基因分型的引物(R)
<400> 50
gcatgcatag tggtcccttt 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于检测 Tbx3-tdTomato(Venus) KI后的野生型的引物(F)
<400> 51
ggtgttgctt gcctctgatg 20
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于检测 Tbx3-tdTomato(Venus) KI后的野生型的引物(R)
<400> 52
ccagtaggga gagtgagacc a 21
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于检测 Tbx3-tdTomato(Venus) KI后的野生型的引物(F)
<400> 53
cgactctctg ttggtgttcg 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于检测 Tbx3-tdTomato(Venus) KI后的野生型的引物(R)
<400> 54
tctggggcag atcatagctc 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于检测Rosa26区域中的indel的引物(F)
<400> 55
cgtgttcgtg caagttgagt 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于检测Rosa26区域中的indel的引物(R)
<400> 56
ctccactgca gctcccttac 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于检测Albmin区域中的indel的引物(F)
<400> 57
ggagagccac ttgcctcata 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于检测Albmin区域中的indel的引物(R)
<400> 58
ttgtggtctt tccctcatcc 20
<210> 59
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(10C)表达PX459载体的接头(F)
<400> 59
caccgccccc ccaccgggtc ttcgagaaga cct 33
<210> 60
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(10C)表达PX459载体的接头(R)
<400> 60
aaacaggtct tctcgaagac ccggtggggg ggc 33
<210> 61
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(25C)表达PX459载体的接头(F)
<400> 61
caccgccccc cccccccccc cccccccacc gggtcttcga gaagacct 48
<210> 62
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(25C)表达PX459载体的接头(R)
<400> 62
aaacaggtct tctcgaagac ccggtggggg gggggggggg gggggggc 48
<210> 63
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Tbx3-tdTomato(Venus) KI用sgRNA表达载体的接头(F)
<400> 63
caccgactgg cagatttgac caaac 25
<210> 64
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Tbx3-tdTomato(Venus) KI用sgRNA表达载体的接头(R)
<400> 64
aaacgtttgg tcaaatctgc cagtc 25
<210> 65
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Cdh1-tdTomato(Venus) KI用sgRNA表达载体的接头(F)
<400> 65
caccgtctcc cccgtgtggc accat 25
<210> 66
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Cdh1-tdTomato(Venus) KI用sgRNA表达载体的接头(R)
<400> 66
aaacatggtg ccacacgggg gagac 25
<210> 67
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体的接头(F)
<400> 67
caccgtaact tcagcctgct gaagc 25
<210> 68
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体的接头(R)
<400> 68
aaacgcttca gcaggctgaa gttac 25
<210> 69
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体(错配位置为1)的接头(F)
<400> 69
caccgtaact tcagcctgct gaagg 25
<210> 70
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体(错配位置为1)的接头(R)
<400> 70
aaacccttca gcaggctgaa gttac 25
<210> 71
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建aP2A sgRNA表达载体的接头(F)
<400> 71
caccgtagtc tactaaaaca agccg 25
<210> 72
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建aP2A sgRNA表达载体的接头(R)
<400> 72
aaaccggctt gttttagtag actac 25
<210> 73
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建aP2A sgRNA表达载体(错配位置为1)的接头(F)
<400> 73
caccgtagtc tactaaaaca agccc 25
<210> 74
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建aP2A sgRNA表达载体(错配位置为1)的接头(R)
<400> 74
aaacgggctt gttttagtag actac 25
<210> 75
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体(在5'末端添加15G)的接头(F)
<400> 75
caccgggggg gggggggggt aacttcagcc tgctgaagc 39
<210> 76
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体(在5'末端添加15G)的接头(R)
<400> 76
aaacgcttca gcaggctgaa gttacccccc ccccccccc 39
<210> 77
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体(在3'末端添加5C)的接头(F)
<400> 77
caccgtaact tcagcctgct gaagcccccc 30
<210> 78
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体(在3'末端添加5C)的接头(R)
<400> 78
aaacgggggg cttcagcagg ctgaagttac 30
<210> 79
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体(在3'末端添加10C)的接头(F)
<400> 79
caccgtaact tcagcctgct gaagcccccc ccccc 35
<210> 80
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 用于构建P2A sgRNA表达载体(在3'末端添加10C)的接头(R)
<400> 80
aaacgggggg gggggcttca gcaggctgaa gttac 35
<210> 81
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 用于构建aP2A sgRNA表达载体(在5'末端添加5C)的接头(F)
<400> 81
caccgccccc tagtctacta aaacaagccg 30
<210> 82
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 用于构建aP2A sgRNA表达载体(在5'末端添加5C)的接头(R)
<400> 82
aaaccggctt gttttagtag actagggggc 30
<210> 83
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于构建人EMX1 sgRNA表达载体的接头(F)
<400> 83
caccgagtcc gagcagaaga agaa 24
<210> 84
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于构建人EMX1 sgRNA表达载体的接头(R)
<400> 84
aaacttcttc ttctgctcgg actc 24
<210> 85
<211> 21
<212> DNA
<213> 智人
<400> 85
aaaaccaccc ttctctctgg c 21
<210> 86
<211> 21
<212> DNA
<213> 智人
<400> 86
ggagattgga gacacggaga g 21
<210> 87
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Rosa26 sgRNA表达载体的接头(F)
<400> 87
agacctccat cgcgcactcc 20
<210> 88
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Rosa26 sgRNA表达载体的接头(R)
<400> 88
ggagtgcgcg atggaggtct 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Alb sgRNA表达载体的接头(F)
<400> 89
actccatcac ttaaggcccc 20
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Alb sgRNA表达载体的接头(R)
<400> 90
ggggccttaa gtgatggagt 20
<210> 91
<211> 20
<212> DNA
<213> 智人
<400> 91
gagtctaagc agaagaagaa 20
<210> 92
<211> 21
<212> DNA
<213> 智人
<400> 92
tgaaatctca cctgggcgag a 21
<210> 93
<211> 20
<212> DNA
<213> 智人
<400> 93
tgcagtctgc ctttttgggg 20
<210> 94
<211> 23
<212> DNA
<213> 智人
<400> 94
tgaccgtcta aactggtttg acc 23
<210> 95
<211> 20
<212> DNA
<213> 猪捷申病毒-1型
<400> 95
taacttcagc ctgctgaagc 20
<210> 96
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> aP2A靶序列
<400> 96
tagtctacta aaacaagccg 20
<210> 97
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> AIMS中包含P2A靶序列的区域
<400> 97
ctactaactt cagcctgctg aagcaggct 29
<210> 98
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 用于P2A的sgRNA (one mismatch)
<400> 98
uaacuucugc cugcugaagc 20
<210> 99
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 用于P2A的sgRNA
<400> 99
uaacuucugc cugcugaagc 20
<210> 100
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于构建人ACVR1(R206H) sgRNA表达载体的接头(F)
<400> 100
caccggctca ccagattaca ctgt 24
<210> 101
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于人ACVR1(R206H) sgRNA表达载体的接头(R)
<400> 101
aaacacagtg taatctggtg agcc 24
<210> 102
<211> 155
<212> DNA
<213> 人工序列
<220>
<223> 用于校正人ACVR1(R206H)的ssODN
<400> 102
ggccgcattt attggatcat tcgtgtacat caggaagtgg ctctggtctt ccttttctgg 60
tacaaagaac agtggcgcgc cagattacac tgttggagtg tgtcggtaat tctttttttt 120
cctttctttg tgggtaatat gcaatgttac ctgca 155
<210> 103
<211> 20
<212> DNA
<213> 智人
<400> 103
agttgctgga aatcctgtgg 20
<210> 104
<211> 20
<212> DNA
<213> 智人
<400> 104
ttcacgctag gcattgtctg 20
<210> 105
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于构建小鼠Acvr1(wt) sgRNA表达载体的接头(F)
<400> 105
caccggctcg ccagataacc ctgt 24
<210> 106
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于构建小鼠Acvr1(wt) sgRNA表达载体的接头(R)
<400> 106
aaacacaggg ttatctggcg agcc 24
<210> 107
<211> 153
<212> DNA
<213> 人工序列
<220>
<223> 用于诱导小鼠Acvr1(R206H)的ssODN
<400> 107
ggccgcctac tagatcactc gtgtacatca ggaagtggct ccggtcttcc tttcctggta 60
cagagaacgg tggctcacca gataaccctg ttggagtgtg tcggtaattc tatgtttccc 120
ttccttttgg gcagcaggca atgttggcct gca 153
<210> 108
<211> 20
<212> DNA
<213> 小鼠
<400> 108
agttgctgga aatcctgtgg 20
<210> 109
<211> 20
<212> DNA
<213> 小鼠
<400> 109
ttcacgctag gcattgtctg 20
<210> 110
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于构建人ACVR1(wt) sgRNA表达载体的接头(F)
<400> 110
caccggctcg ccagattaca ctgt 24
<210> 111
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于构建人ACVR1(wt) sgRNA表达载体的接头(R)
<400> 111
aaacacagtg taatctggcg agcc 24
<210> 112
<211> 20
<212> DNA
<213> 智人
<400> 112
ggctcaccag attacactgt 20
<210> 113
<211> 20
<212> DNA
<213> 智人
<400> 113
ggctcgccag attacactgt 20
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人ACVR1(R206H)校正用ssODN的靶序列
<400> 114
ggcgcgccag attacactgt 20
<210> 115
<211> 20
<212> DNA
<213> 小鼠
<400> 115
ggctcgccag ataaccctgt 20
<210> 116
<211> 20
<212> DNA
<213> 小鼠
<400> 116
ggctcaccag ataaccctgt 20
<210> 117
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(5C)表达PX459载体的接头(F)
<400> 117
caccgccacc gggtcttcga gaagacct 28
<210> 118
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(5C)表达PX459载体的接头(R)
<400> 118
aaacaggtct tctcgaagac ccggtggc 28
<210> 119
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(15C)表达PX459载体的接头(F)
<400> 119
caccgccccc cccccccacc gggtcttcga gaagacct 38
<210> 120
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(15C)表达PX459载体的接头(R)
<400> 120
aaacaggtct tctcgaagac ccggtggggg gggggggc 38
<210> 121
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(20C)表达PX459载体的接头(F)
<400> 121
caccgccccc cccccccccc ccaccgggtc ttcgagaaga cct 43
<210> 122
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(00C)表达PX459载体的接头(R)
<400> 122
aaacaggtct tctcgaagac ccggtggggg gggggggggg ggc 43
<210> 123
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(30C)表达PX459载体的接头(F)
<400> 123
caccgccccc cccccccccc cccccccccc ccaccgggtc ttcgagaaga cct 53
<210> 124
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 用于构建sgRNA(30C)表达PX459载体的接头(R)
<400> 124
aaacaggtct tctcgaagac ccggtggggg gggggggggg gggggggggg ggc 53
<210> 125
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Cdh1-P2A-AIMS细胞的复合杂合子中的Cdh1区域的接头(F)
<400> 125
caccgagtct ctcttctaca cactc 25
<210> 126
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于构建Cdh1-P2A-AIMS细胞的复合杂合子中的Cdh1区域的接头(R)
<400> 126
aaacgagtgt gtagaagaga gactc 25
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于复合杂合子中的Tomato等位基因的基因分型的引物(F)
<400> 127
cctgttcctg tacggcatgg 20
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于体外切割分析(in vitro digestion assay)的引物(R)
<400> 128
cgtccatgcc gagagtgatc 20
<210> 129
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 用于体外切割分析(T7启动子+0C-P2A-sgRNA)的引物(F)
<400> 129
gcggcctcta atacgactca ctatagggta acttcagcct gctgaagc 48
<210> 130
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 用于体外切割分析(T7启动子+10C-P2A-sgRNA)的引物(F)
<400> 130
gcggcctcta atacgactca ctatagggcc ccccccccta acttcagcct gctgaagc 58
<210> 131
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 用于体外切割分析(T7启动子+25C-P2A-sgRNA)的引物(F)
<400> 131
gcggcctcta atacgactca ctatagggcc cccccccccc cccccccccc ccctaacttc 60
agcctgctga agc 73
<210> 132
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于体外切割分析(sgRNA)的引物(R)
<400> 132
aaaaaagcac cgactcggtg ccac 24

Claims (16)

1.一种仅单侧等位基因经基因组编辑的细胞的制造方法,其中,包括将(A)和(B)导入细胞的工序,
所述(A)为选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)所述(a1)或所述(a2)的向导RNA的表达载体组成的组中的至少1种,
所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
2.根据权利要求1所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,所述(A)是在间隔序列的5’末端添加1个以上核苷酸残基且所述间隔序列是相对于靶序列具有1个碱基或多个碱基错配的间隔序列的、向导RNA或编码该向导RNA的表达载体。
3.根据权利要求1或2所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,被添加至所述间隔序列的5’末端的核苷酸残基全部为相同的核苷酸残基。
4.根据权利要求3所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,被添加至所述间隔序列的5’末端的核苷酸残基为胞嘧啶残基或鸟嘌呤残基。
5.根据权利要求1~4中任一项所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其还包括将(C)供体载体导入细胞的工序。
6.根据权利要求1~5中任一项所述的仅单侧等位基因经基因组编辑的细胞的制造方法,其中,所述Cas蛋白为Cas9蛋白。
7.一种向导RNA,其在间隔序列的5’末端添加有1个以上的核苷酸残基。
8.根据权利要求7所述的向导RNA,其中,所述间隔序列相对于靶序列具有1个碱基或多个碱基的错配。
9.一种权利要求7或8所述的向导RNA的表达载体。
10.根据权利要求9所述的表达载体,其还能表达Cas蛋白。
11.根据权利要求10所述的表达载体,其中,所述Cas蛋白为Cas9蛋白。
12.一种仅单侧等位基因经基因组编辑的细胞的制造试剂盒,其中,包含(A),所述(A)为选自由(a1)在间隔序列的5’末端添加有1个以上核苷酸残基的向导RNA、(a2)包含相对于靶序列具有1个碱基或多个碱基错配的间隔序列的向导RNA、及(a3)所述(a1)或所述(a2)的向导RNA的表达载体组成的组中的至少1种。
13.根据权利要求12所述的制造试剂盒,其中,还包含(B),所述(B)为选自由Cas蛋白及其表达载体组成的组中的至少1种。
14.一种基因组编辑模式的预测方法,包括:
(i)将向导RNA或其表达载体、以及Cas蛋白或其表达载体导入细胞而进行基因组编辑的工序;
(ii)从进行了所述基因组编辑的细胞中提取DNA的工序;
(iii)从所述DNA扩增包含靶区域的DNA片段的工序;
(iv)对所述扩增的DNA片段进行序列分析,求出对所述靶区域的indel诱导率(P)的工序;以及
(v)根据下述式(m)或(m1)以及(b)或(b1),求出对仅单侧等位基因的indel诱导率(mono)及对两侧等位基因的indel诱导率(bi)的工序,
mono=2×P×(1-P)···(m)
bi=P2···(b)
mono=-1.303P2+1.2761P+0.0274···(m1)
bi=0.6515P2+0.3619P-0.0137···(b1)。
15.一种细胞,其中,
一侧等位基因中包含将定位蛋白编码序列、切割位点和第1荧光蛋白编码序列依次框内连接而成的嵌合基因,
另一侧等位基因中包含将所述定位蛋白编码序列、所述切割位点和第2荧光蛋白编码序列依次框内连接而成的嵌合基因。
16.一种基因组编辑模式的分析方法,包括:
(I)向权利要求15所述的细胞中导入以所述切割位点作为靶标的向导RNA或其表达载体、以及Cas蛋白或其表达载体而进行基因组编辑的工序;
(II)在所述工序(I)之后对所述细胞的荧光图案进行分析的工序;以及
(III)基于所述工序(II)中已分析的荧光图案判定基因组编辑模式的工序。
CN201980091726.1A 2018-12-12 2019-12-12 经基因组编辑的细胞的制造方法 Pending CN113423823A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-232946 2018-12-12
JP2018232946 2018-12-12
PCT/JP2019/048781 WO2020122195A1 (ja) 2018-12-12 2019-12-12 ゲノム編集された細胞の製造方法

Publications (1)

Publication Number Publication Date
CN113423823A true CN113423823A (zh) 2021-09-21

Family

ID=71076488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980091726.1A Pending CN113423823A (zh) 2018-12-12 2019-12-12 经基因组编辑的细胞的制造方法

Country Status (6)

Country Link
US (1) US20220025405A1 (zh)
EP (1) EP3896155A4 (zh)
JP (1) JPWO2020122195A1 (zh)
CN (1) CN113423823A (zh)
CA (1) CA3122465A1 (zh)
WO (1) WO2020122195A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115397997A (zh) * 2020-12-23 2022-11-25 浙江大学 侵染性植物弹状病毒载体及无转基因植物基因组定点编辑的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104854241A (zh) * 2012-05-25 2015-08-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
CN104968784A (zh) * 2012-10-23 2015-10-07 基因工具股份有限公司 包含特异于靶dna的向导rna和cas蛋白质编码核酸或cas蛋白质的用于切割靶dna的组合物及其用途
CN105829536A (zh) * 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
CN106191116A (zh) * 2016-08-22 2016-12-07 西北农林科技大学 基于CRISPR/Cas9的外源基因敲入整合系统及其建立方法和应用
WO2018060238A1 (en) * 2016-09-29 2018-04-05 F. Hoffmann-La Roche Ag Method to analyze and optimize gene editing modules and delivery approaches
US20180282722A1 (en) * 2016-11-21 2018-10-04 Massachusetts Institute Of Technology Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104854241A (zh) * 2012-05-25 2015-08-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
CN104968784A (zh) * 2012-10-23 2015-10-07 基因工具股份有限公司 包含特异于靶dna的向导rna和cas蛋白质编码核酸或cas蛋白质的用于切割靶dna的组合物及其用途
CN105829536A (zh) * 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
CN106191116A (zh) * 2016-08-22 2016-12-07 西北农林科技大学 基于CRISPR/Cas9的外源基因敲入整合系统及其建立方法和应用
WO2018060238A1 (en) * 2016-09-29 2018-04-05 F. Hoffmann-La Roche Ag Method to analyze and optimize gene editing modules and delivery approaches
US20180282722A1 (en) * 2016-11-21 2018-10-04 Massachusetts Institute Of Technology Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EMILY M. ANDERSON等: "Systematic analysis of CRISPR-Cas9 mismatch tolerance reveals low levels of off-target activity", 《JOURNAL OF BIOTECHNOLOGY》, vol. 211, pages 55 - 65 *
周林: "两种用于CRISPR/Cas9靶效应和脱靶效应检测新方法的建立", 《中国优秀硕士学位论文全文数据库 基础科学辑》, no. 02, pages 006 - 691 *
谢胜松 等: "CRISPR/Cas9 系统中sgRNA设计与脱靶效应评估", 《遗传》, vol. 37, no. 11, pages 1125 - 1136 *

Also Published As

Publication number Publication date
CA3122465A1 (en) 2020-06-18
EP3896155A1 (en) 2021-10-20
US20220025405A1 (en) 2022-01-27
WO2020122195A1 (ja) 2020-06-18
EP3896155A4 (en) 2022-08-17
JPWO2020122195A1 (ja) 2021-10-21

Similar Documents

Publication Publication Date Title
CN105960413B (zh) 人工dna-结合蛋白及其用途
KR101229418B1 (ko) 활성형 재조합 혈액응고 9인자의 대량생산 방법
US11926839B2 (en) Platform for T lymphocyte genome engineering and in vivo high-throughput screening thereof
CN112313334A (zh) 用以编辑血红蛋白相关突变的同源定向修复模板设计和递送
CN101772580A (zh) 专能细胞群的生产和使用方法
CN112552380A (zh) 一种SARS-CoV-2病毒的免疫原及其应用
KR20120099376A (ko) 강화된 전이 유전자 발현과 공정 방법 및 그 산물
US11873322B2 (en) Systems and methods for increasing efficiency of genome editing
CA2665080C (en) Regulatable fusion promoters
Ahmadi et al. Monoclonal antibodies expression improvement in CHO cells by PiggyBac transposition regarding vectors ratios and design
KR20040086247A (ko) 분비 단백질
CN113423823A (zh) 经基因组编辑的细胞的制造方法
CN110029109B (zh) 一种唾液酸诱导表达元件及应用
CN114958760B (zh) 一种构建阿尔兹海默症模型猪的基因编辑技术及其应用
CN102154368B (zh) 一种组织特异性兼可调控性慢病毒基因表达载体
CN114525304B (zh) 一种基因编辑的方法
CN110831614A (zh) 用于递送Na/K ATP酶/Src受体复合物拮抗剂的表达载体和相关方法
CN114480470A (zh) 高通量制备模式生物基因编辑突变体的方法及相关质粒
RU2805173C1 (ru) Способ получения генно-модифицированных лабораторных животных с нуль-аллелем гена P2rx3
NL2027815B1 (en) Genomic integration
US20040161753A1 (en) Creation and identification of proteins having new dna binding specificities
US20230265405A1 (en) Engineered nucleases and methods of use thereof
RU2726764C1 (ru) Рекомбинантная плазмидная ДНК AAV SynH1-2_shRNA Freud-1, обеспечивающая синтез shPHK, подавляющей экспрессию гена, кодирующего селективный сайленсер 5-HT1A рецептора Freud-1, в мозге млекопитающих
CN115997022A (zh) 用于细菌细胞中蛋白质合成的完全正交系统
CN116987693A (zh) 一种优化的CRISPR/SpCas12f1系统、工程化向导RNA及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination