WO2019128743A1 - 一种猪全基因组sgRNA文库及其构建方法和应用 - Google Patents

一种猪全基因组sgRNA文库及其构建方法和应用 Download PDF

Info

Publication number
WO2019128743A1
WO2019128743A1 PCT/CN2018/121326 CN2018121326W WO2019128743A1 WO 2019128743 A1 WO2019128743 A1 WO 2019128743A1 CN 2018121326 W CN2018121326 W CN 2018121326W WO 2019128743 A1 WO2019128743 A1 WO 2019128743A1
Authority
WO
WIPO (PCT)
Prior art keywords
sgrna
sgrnas
sequence
genome
gene
Prior art date
Application number
PCT/CN2018/121326
Other languages
English (en)
French (fr)
Inventor
许朋阳
徐凤丹
段广有
闵文波
夏步高
葛毅
Original Assignee
苏州金唯智生物科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 苏州金唯智生物科技有限公司 filed Critical 苏州金唯智生物科技有限公司
Priority to EP18897080.0A priority Critical patent/EP3733936A4/en
Publication of WO2019128743A1 publication Critical patent/WO2019128743A1/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/12Applications; Uses in screening processes in functional genomics, i.e. for the determination of gene function
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • C12N2330/31Libraries, arrays

Definitions

  • the inventor deeply studied the theoretical knowledge and practical methods of the DNA editing system of CRISPR/Cas9-sgRNA, and optimized the experimental flow and algorithm for constructing high-quality sgRNA library with high activity and meeting the experimental requirements.
  • the module designed a large number of experiments to explore the design rules and screening methods of sgRNA, and finally found the optimal screening combination and filtration criteria to obtain a genome-wide custom sgRNA library specific for pigs.
  • the criteria for screening according to step (3) further comprise: selecting no more than 6 sgRNAs per target sequence, retaining only the optimal and low-risk sgRNA, and ensuring that the selected sgRNA covers as much as possible different transcription of the gene.
  • the plurality of sgRNAs of each gene are targeted as far as possible to different positions of the gene, and the GC content is in any one of 20%-80% or a combination of at least two, for example, no more than 6 pieces can be selected for each target sequence.

Abstract

一种猪全基因组sgRNA文库及其构建方法和应用,该文库包括猪(Sus scrofus)全基因组中20438个基因的sgRNA序列,其中17410个基因设计得到6条sgRNA,2828个基因设计得到sgRNA数量在1-5条之间,该sgRNA的获取过程为:首先在靶序列上获取候选sgRNA,然后对候选sgRNA进行脱靶分析并打分,最后根据打分结果对sgRNA过滤;通过采用多种设计标准及筛选原则,优化模块内细节及流程,最终构建得到猪全基因组sgRNA文库。

Description

一种猪全基因组sgRNA文库及其构建方法和应用
相关申请的交叉引用
本申请要求于2017年12月29日提交中国专利局的申请号为CN201711490244.2、名称为“一种猪全基因组sgRNA文库及其构建方法和应用”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及基因工程领域,尤其涉及一种猪全基因组sgRNA文库及其构建方法和应用。
背景技术
CRISPR(Clustered regularly interspaced short palindromic repeats),被称为规律成簇间隔短回文重复,实际上就是一种基因编辑器,是细菌用以保护自身对抗病毒的一个系统,也是一种对付攻击者的基因武器。后来,研究人员发现,它似乎是一种精确的万能基因武器,可以用来删除、添加、激活或抑制其他生物体的目标基因,这些目标基因包括人、老鼠、斑马鱼、细菌、果蝇、酵母、线虫和农作物细胞内的基因,这也意味着基因编辑器是一种可以广泛使用的生物技术,CRISPR基因编辑器的工作过程图如图1所示。
CRISPR簇是一个广泛存在于细菌和古生菌基因组中的特殊DNA重复序列家族,其序列由一个前导区(Leader)、多个短而高度保守的重复序列区(Repeat)和多个间隔区(Spacer)组成。前导区一般位于CRISPR簇上游,是富含AT长度为300~500bp的区域,被认为可能是CRISPR簇的启动子序列。重复序列区长度为21~48bp,含有回文序列,可形成发卡结构。重复序列之间被长度为26~72bp的间隔区隔开。Spacer区域由俘获的外源DNA组成,类似免疫记忆,当含有同样序列的外源DNA入侵时,可被细菌机体识别,并进行剪切使之表达沉默,达到保护自身安全的目的。
通过对CRISPR簇的侧翼序列分析发现,在其附近存在一个多态性家族基因。该家族编码的蛋白质均含有可与核酸发生作用的功能域(具有核酸酶、解旋酶、整合酶和聚合酶等活性),并且与CRISPR区域共同发挥作用,因此被命名为CRISPR关联基因(CRISPR associated),缩写为Cas。目前发现的Cas包括Cas1~Cas10等多种类型。Cas基因与CRISPR共同进化,共同构成一个高度保守的系统,CRISPR簇的系统结构图如图2所示。
当细菌抵御噬菌体等外源DNA入侵时,在前导区的调控下,CRISPR被转录为长的RNA前体(Pre RISPR RNA,pre-crRNA),然后加工成一系列短的含有保守重复序列和间隔区的成熟crRNA,最终识别并结合到与其互补的外源DNA序列上发挥剪切作用。
目前发现的CRISPR/Cas系统有三种不同类型即I型、II型和III型,它们存在于大约40%已测序的真细菌和90%已测序的古细菌中。其中II型的组成较为简单,以Cas9蛋白 以及向导RNA(gRNA)为核心组成,也是目前研究中最深入的类型。
在II型系统中pre-crRNA的加工由Cas家族中的Cas9单独参与,Cas9含有在氨基末端的RuvC和蛋白质中部的HNH2个独特的活性位点,在crRNA成熟和双链DNA剪切中发挥作用。此外,pre-crRNA转录的同时,与其重复序列互补的反式激活crRNA(Trans-activating crRNA,tracrRNA)也转录出来,并且激发Cas9和双链RNA特异性RNase III核酸酶对pre-crRNA进行加工。加工成熟后,crRNA、tracrRNA和Cas9组成复合体,识别并结合于crRNA互补的序列,然后解开DNA双链,形成R-loop,使crRNA与互补链杂交,另一条链保持游离的单链状态,然后由Cas9中的HNH活性位点剪切crRNA的互补DNA链,RuvC活性位点剪切非互补链,最终引入DNA双链断裂(DSB)。CRISPR/Cas9的剪切位点位于crRNA互补序列下游邻近的PAM区(Protospacer Adjacent Motif)的5'-GG-N18-NGG-3'特征区域中的NGG位点,而这种特征的序列在每128bp的随机DNA序列中就重复出现一次。研究结果表明,Cas9还可以剪切线性和超螺旋的质粒,其剪切效率堪比限制性内切酶。由于crRNA参与并且起到精确导向的作用,所以CRISPR/Cas9打靶系统也被称为RNA导向(RNA guided)打靶系统,打把系统的原理图如图3所示。
基于CRISPR/Cas9-sgRNA的DNA编辑系统已经发展成基因编辑的一个有效工具。CRISPR/Cas9-sgRNA系统包含两个主要组分—Cas9蛋白和sgRNA。sgRNA决定了基因编辑的位点和基因编辑的效率。研究已经表明,不同的sgRNA有不同的编辑效率。在动物和人类中通过高通量比较分析sgRNA的效率,研究人员已经获得了高效sgRNA的参数。
CN106845151A公开一种CRISPR-Cas9系统sgRNA作用靶点的筛选方法,包括:(1)利用已公布物种的全基因组序列及基因注释信息,获取基因组中具有5’-Nx-NGG-3’序列的区段(x为19~22之间的整数,N代表A/T/C/G),作为CRISPR-Cas9系统sgRNA的候选靶点;(2)将基因组打断成22~25bp的片段并筛选以NGG结尾的,且在基因组上无重复的序列;(3)将步骤(1)的候选靶点序列与步骤(2)中筛到的序列进行比对,根据错配信息及评选公式对相应的优选序列进行筛选及排序,获取最优的全基因组sgRNA作用靶点集合。CN105886616A公开了一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法,所述筛选方法包括步骤:功能基因筛选及ORF分析、功能基因sgRNA识别位点引导序列预测、全基因组脱靶位点检测、依据脱靶信息与靶位点位置对预测的靶位点打分,排序、结果筛选与统计、算法优化与软件开发。本申请的猪的特异性sgRNA识别位点引导序列经过了严格的筛选与检验,包含所有猪蛋白编码基因的用于CRISPR-Cas9基因编辑的sgRNA识别位点引导序列。但上述现有技术的构建步骤繁琐,优化筛选标准落后,得到的sgRNA质量不高。
但是,由于低质量sgRNA直接浪费科研人员的时间和金钱,因此选择高效率的sgRNA 是避免该结果发生的一个有效途径。目前,尽管已经有一些sgRNA设计软件,但是这些软件大多都是逐个基因设计sgRNA,缺乏定制全基因组sgRNA文库设计的生物信息学工作流程。因此,提供一种针对猪的全基因组定制sgRNA文库制备方法,得到高质量的猪全基因组sgRNA,具有重要的科研价值和应用前景。
发明内容
针对现有技术的不足及实际的需求,本申请提供一种猪全基因组sgRNA文库及其构建方法和应用,通过采用多种设计标准及筛选原则,优化算法和流程,最终构建得到高质量和高活性的猪全基因组sgRNA文库,所述方法简洁高效,得到的文库质量高,活性好,便于应用在基因编辑研究中。
为达此目的,本申请采用以下技术方案:
第一方面,本申请提供一种猪全基因组sgRNA文库,所述文库包括猪(Sus scrofus)全基因组中的20438个基因的sgRNA序列;
所述sgRNA主要通过在获取的靶序列上筛选候选sgRNA,然后对候选sgRNA进行脱靶分析并打分,最后根据打分结果对sgRNA过滤得到。
优选地,所述候选sgRNA的筛选标准包括20%-80%的GC含量。
所述GC含量为20-80%,例如可以是20%、30%、45%、46%、48%、50%、52%、55%、60%、70%或80%,优选为40-70%。
优选地,所述sgRNA的筛选标准包括19-21nt的长度。
所述长度为19-21nt,例如可以是19nt、20nt或21nt。
优选地,所述sgRNA的过滤标准包括选择靠近5’端的sgRNA。
优选地,所述sgRNA的过滤标准包括每个CDS片段的sgRNA数量不超过2条。
发明人在长期的生物信息测序实验过程中,深入研究CRISPR/Cas9-sgRNA的DNA编辑系统理论知识和实践手段,为构建高质量和能满足实验要求的高活性的sgRNA文库,优化实验流程和算法模块,设计大量实验探讨sgRNA的设计规则和筛选方法,最终发现最优的筛选组合和过滤标准,得到特异性针对猪的全基因组定制sgRNA文库。
第二方面,本申请提供一种如第一方面所述的猪全基因组sgRNA文库用于构建基于敲除突变体文库和/或基于敲除动物模型。
第三方面,本申请提供一种猪全基因组sgRNA文库的构建方法,包括如下步骤:
(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’-20 nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
(2)sgRNA设计:根据GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对,并根据指定允许的错配数进行脱靶率评估并分级;
(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA和每个CDS片段的sgRNA数量不超过2条。
优选地,步骤(1)所述靶序列的选择标准包括蛋白质编码基因选择CDS区域作为靶序列。
优选地,步骤(2)所述筛选依据还包括PAM序列和单双链模式。
优选地,步骤(2)所述允许的错配数为0-5个,例如可以是0个、1个、2个、3个、4个或5个,优选为5个。
优选地,步骤(2)所述sgRNA设计的脱靶率评估标准为:
1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高。
优选地,步骤(2)所述分级的级别包括:最优、低风险、风险适中和高风险四个级别。
优选地,步骤(3)所述筛选的标准还包括:每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%中的任意一种或至少两种的组合,例如可以是每个靶序列选择不大于6条的sgRNA和只保留级别为最优和低风险的sgRNA的组合,每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%中的组合,每个靶序列选择不大于的6条sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%的组合,优选为每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%的组合。
作为优选技术方案,本申请提供一种猪全基因组sgRNA文库的构建方法,具体包括如下步骤:
(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’-20 nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
其中,蛋白质编码基因选择CDS区域作为靶序列;
(2)sgRNA设计:根据PAM序列、单双链模式、GC含量为20-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对,进行序列同源分析,并根据指定0-5个的错配数进行脱靶率评估并分为最优、低风险、风险适中和高风险四个级别;
其中,脱靶率评估的标准为:
1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高;
(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA、每个CDS片段的sgRNA数量不超过2条、每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%。
与现有技术相比,本申请具有如下有益效果:
(1)本申请提供的sgRNA文库质量较高,全基因组的20438个基因均设计得到对应的sgRNA,,其中17410个基因设计得到6条sgRNA,2828个基因设计得到sgRNA数量在1-5条之间,所有sgRNA的活性均能满足后续实验的要求;
(2)本申请提供的猪全基因组sgRNA文库的构建方法简洁高效,便于操作和实际应用,通过优化模块内流程及细节,调整sgRNA的设计标准及筛选原则,全面且特异性地针对猪全基因组进行sgRNA设计和过滤,节省时间和人力,便于推广应用。
附图说明
图1为本申请的CRISPR基因编辑器的工作过程图;
图2为本申请的CRISPR簇的系统结构图;
图3为本申请的CRISPR/Cas9打靶系统的原理图;
图4为本申请的sgRNA构建流程图。
具体实施方式
为更进一步阐述本申请所采取的技术手段及其效果,以下结合附图并通过具体实施方式来进一步说明本申请的技术方案,但本申请并非局限在实施例范围内。
实施例1
sgRNA的构建流程如图4所示,流程依次为全基因组CDS序列筛选、根据sgRNA识别位点选取候选sgRNA序列、全基因组脱靶位点检测、根据脱靶位点信息和脱靶位点位置对设计的候选sgRNA打分、结果筛选和设计以及对全程的算法优化和软件开发。
具体步骤如下:
(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’20 nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
其中,蛋白质编码基因选择CDS区域作为靶序列;
(2)sgRNA设计:根据PAM序列、单双链模式、GC含量为20%-80%和长度为20nt筛选候选sgRNA,并进行全基因组序列比对,并根据指定5个的错配数进行脱靶率评估并分为最优、低风险、风险适中和高风险四个级别;
其中,脱靶率评估的标准为:
1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高;
(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA、每个CDS片段的sgRNA数量不超过2条、每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%。
最终构建得到的猪全基因组sgRNA文库中,一共有20438个基因设计得到sgRNA,其中17410个基因设计得到6条sgRNA,2828个基因设计得到sgRNA数量在1-5条之间,实验对sgRNA质量的检验结果显示,Lowrisk以上的均为高质量的sgRNA,文库构建所得到的sgRNA活性均能满足后续实验的要求。
申请人声明,本申请通过上述实施例来说明本申请的详细方法,但本申请并不局限于上述详细方法,即不意味着本申请必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本申请的任何改进,对本申请产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本申请的保护范围和公开范围之内。

Claims (10)

  1. 一种猪全基因组sgRNA文库,其特征在于,所述文库包括猪(Sus scrofus)全基因组中的20438个基因的sgRNA;
    所述sgRNA的获取过程为:首先在靶序列上获取候选sgRNA,然后对候选sgRNA进行脱靶分析并打分,最后根据打分结果对sgRNA过滤。
  2. 根据权利要求1所述的sgRNA文库,其特征在于,所述候选sgRNA的筛选标准包括20%-80%的GC含量;
    优选地,所述候选sgRNA的筛选标准包括40%-70%的GC含量;
    优选地,所述候选sgRNA的筛选标准还包括19-21nt的长度。
  3. 根据权利要求1或2所述的sgRNA文库,其特征在于,所述sgRNA的过滤标准包括选择靠近5’端的sgRNA;
    优选地,所述sgRNA的过滤标准包括每个CDS片段的sgRNA数量不超过2条。
  4. 一种如权利要求1-3中任一项所述的猪全基因组sgRNA文库用于构建基于敲除突变体文库和/或基于敲除动物模型。
  5. 一种猪全基因组sgRNA文库的构建方法,其特征在于,包括如下步骤:
    (1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’20nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
    (2)sgRNA设计:根据GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对,并根据指定允许的错配数进行脱靶率评估并分级;
    (3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA和每个CDS片段的sgRNA数量不超过2条。
  6. 根据权利要求5所述的方法,其特征在于,步骤(1)所述靶序列的选择标准包括蛋白质编码基因选择CDS区域作为靶序列;
    优选地,步骤(2)所述筛选依据还包括PAM序列和单双链模式。
  7. 根据权利要求5或6所述的方法,其特征在于,步骤(2)所述允许的错配数为0-5个,优选为5个;
    优选地,步骤(2)所述sgRNA设计的脱靶率评估标准为:
    1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
    2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
    3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高。
  8. 根据权利要求4-7中任一项所述的方法,其特征在于,步骤(2)所述分级的级别包括:最优、低风险、风险适中和高风险四个级别。
  9. 根据权利要求5-8中任一项所述的方法,其特征在于,步骤(3)所述筛选的标准还包括:每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%中的任意一种或至少两种的组合,优选为每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%的组合。
  10. 根据权利要求5-9中任一项所述的方法,其特征在于,具体包括如下步骤:
    (1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’-20nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
    其中,蛋白质编码基因选择CDS区域作为靶序列;
    (2)sgRNA设计:根据PAM序列、单双链模式、GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对并根据指定0-5个的错配数进行脱靶率评估并分为最优、低风险、风险适中和高风险四个级别;
    其中,脱靶率评估的标准为
    1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
    2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
    3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高;
    (3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA、每个CDS片段的sgRNA数量不超过2条、每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%。
PCT/CN2018/121326 2017-12-29 2018-12-14 一种猪全基因组sgRNA文库及其构建方法和应用 WO2019128743A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP18897080.0A EP3733936A4 (en) 2017-12-29 2018-12-14 WHOLE GENOME SGRNA LIBRARY OF THE PIG AND METHOD FOR PRODUCING AND USING IT

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201711490244.2A CN108221058A (zh) 2017-12-29 2017-12-29 一种猪全基因组sgRNA文库及其构建方法和应用
CN201711490244.2 2017-12-29

Publications (1)

Publication Number Publication Date
WO2019128743A1 true WO2019128743A1 (zh) 2019-07-04

Family

ID=62646440

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/121326 WO2019128743A1 (zh) 2017-12-29 2018-12-14 一种猪全基因组sgRNA文库及其构建方法和应用

Country Status (3)

Country Link
EP (1) EP3733936A4 (zh)
CN (1) CN108221058A (zh)
WO (1) WO2019128743A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113990394A (zh) * 2021-10-27 2022-01-28 云舟生物科技(广州)有限公司 向导rna作用靶点的筛选方法、计算机存储介质及电子设备
CN116206684A (zh) * 2022-12-26 2023-06-02 纳昂达(南京)生物科技有限公司 一种评估基因组重复区探针捕获安全性的方法及其装置
WO2023116681A1 (zh) * 2021-12-21 2023-06-29 翌圣生物科技(上海)股份有限公司 靶序列随机sgRNA全覆盖组的制备方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108221058A (zh) * 2017-12-29 2018-06-29 苏州金唯智生物科技有限公司 一种猪全基因组sgRNA文库及其构建方法和应用
CN109817340B (zh) * 2019-01-16 2023-06-23 苏州金唯智生物科技有限公司 疾病风险分布信息确定方法、装置、存储介质及设备
CN109957842B (zh) * 2019-02-11 2022-06-24 王纪武 一种用模块化设计构建双系统表达质粒文库的方法
CN110358766A (zh) * 2019-06-10 2019-10-22 云南农业大学 一种基于全基因组CRISPR/Cas9文库筛选异种移植抗原基因的方法
CN113436683A (zh) * 2020-03-23 2021-09-24 北京合生基因科技有限公司 筛选候选插入片段的方法和系统
CN111733159B (zh) * 2020-06-01 2022-09-27 五邑大学 用于猪MBP基因敲除的sgRNA组合物及用途
CN111849983A (zh) * 2020-07-17 2020-10-30 中国农业大学 一种sgRNA及其应用
CN112992277B (zh) * 2021-03-18 2021-10-26 南京先声医学检验实验室有限公司 一种微生物基因组数据库构建方法及其应用
GB202114206D0 (en) * 2021-10-04 2021-11-17 Genome Res Ltd Novel method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105886616A (zh) 2016-04-20 2016-08-24 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法
WO2017075529A1 (en) * 2015-10-29 2017-05-04 The Research Foundation For The State University Of New York Genomic combinatorial screening platform
CN106845151A (zh) 2015-12-07 2017-06-13 中国农业大学 CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置
CN108205614A (zh) * 2017-12-29 2018-06-26 苏州金唯智生物科技有限公司 一种全基因组sgRNA文库的构建系统及其应用
CN108221058A (zh) * 2017-12-29 2018-06-29 苏州金唯智生物科技有限公司 一种猪全基因组sgRNA文库及其构建方法和应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX9305855A (es) * 1992-09-24 1995-01-31 Tadatsugu Taniguchi Factores 1 y 2 reguladores del interferon en el diagnostico de latumorigenicidad.
WO2014204727A1 (en) * 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
WO2015065964A1 (en) * 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
CA3001683A1 (en) * 2015-06-05 2016-12-08 The Regents Of The University Of California Methods and compositions for generating crispr/cas guide rnas
CN107365793A (zh) * 2017-06-19 2017-11-21 百格基因科技(江苏)有限公司 一种适用于植物的大规模基因组编辑的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017075529A1 (en) * 2015-10-29 2017-05-04 The Research Foundation For The State University Of New York Genomic combinatorial screening platform
CN106845151A (zh) 2015-12-07 2017-06-13 中国农业大学 CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置
CN105886616A (zh) 2016-04-20 2016-08-24 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法
CN108205614A (zh) * 2017-12-29 2018-06-26 苏州金唯智生物科技有限公司 一种全基因组sgRNA文库的构建系统及其应用
CN108221058A (zh) * 2017-12-29 2018-06-29 苏州金唯智生物科技有限公司 一种猪全基因组sgRNA文库及其构建方法和应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PATRICK D. HSU.: "Development and Applications of CRISPR-Cas9 for Genome Engineering", CELL, vol. 157, no. 6, 5 June 2014 (2014-06-05), pages 1262 - 1278, XP028849523, ISSN: 0092-8674, DOI: 10.1016/j.cell.2014.05.010 *
See also references of EP3733936A4
YANG XIAOFENG; TANG FEI; LI ZICONG; LIU DEWU; WU ZHENFANG; CAI GENGYUAN; ZHENG ENQIN: "Application of the CRISPR/Cas9 Gene Editing Technology in Pigs", HEILONGJIANG ANIMAL SCIENCE AND VETERINARY MEDICINE., vol. 293, no. 5-9, 31 May 2017 (2017-05-31), CN, pages 71 - 76, XP009522195, ISSN: 1004-7034, DOI: 10.13881/j.cnki.hljxmsy.2017.0771 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113990394A (zh) * 2021-10-27 2022-01-28 云舟生物科技(广州)有限公司 向导rna作用靶点的筛选方法、计算机存储介质及电子设备
CN113990394B (zh) * 2021-10-27 2023-01-24 云舟生物科技(广州)股份有限公司 向导rna作用靶点的筛选方法、计算机存储介质及电子设备
WO2023116681A1 (zh) * 2021-12-21 2023-06-29 翌圣生物科技(上海)股份有限公司 靶序列随机sgRNA全覆盖组的制备方法
CN116206684A (zh) * 2022-12-26 2023-06-02 纳昂达(南京)生物科技有限公司 一种评估基因组重复区探针捕获安全性的方法及其装置
CN116206684B (zh) * 2022-12-26 2024-01-30 纳昂达(南京)生物科技有限公司 一种评估基因组重复区探针捕获安全性的方法及其装置

Also Published As

Publication number Publication date
CN108221058A (zh) 2018-06-29
EP3733936A1 (en) 2020-11-04
EP3733936A4 (en) 2022-01-05

Similar Documents

Publication Publication Date Title
WO2019128743A1 (zh) 一种猪全基因组sgRNA文库及其构建方法和应用
WO2019128744A1 (zh) 一种全基因组sgRNA文库的构建系统及其应用
Hu et al. Engineering non-transgenic gynoecious cucumber using an improved transformation protocol and optimized CRISPR/Cas9 system
CN107475300B (zh) Ifit3-eKO1基因敲除小鼠动物模型的构建方法和应用
Soyars et al. Cutting edge genetics: CRISPR/Cas9 editing of plant genomes
Waaijers et al. Engineering the Caenorhabditis elegans genome with CRISPR/Cas9
Ghoshal et al. A viral guide RNA delivery system for CRISPR-based transcriptional activation and heritable targeted DNA demethylation in Arabidopsis thaliana
JP2018535689A5 (zh)
Shilo et al. T-DNA-genome junctions form early after infection and are influenced by the chromatin state of the host genome
JP7244885B2 (ja) 機能的なIncRNAをスクリーニングおよび同定するための方法
EP3940078A1 (en) Off-target single nucleotide variants caused by single-base editing and high-specificity off-target-free single-base gene editing tool
CN107365793A (zh) 一种适用于植物的大规模基因组编辑的方法
US20210198660A1 (en) Compositions and methods for making guide nucleic acids
KR20170138566A (ko) 가닥 특이적 cDNA 라이브러리를 작제하기 위한 조성물 및 방법
US11946163B2 (en) Methods for measuring and improving CRISPR reagent function
Matyášek et al. Intragenomic heterogeneity of intergenic ribosomal DNA spacers in Cucurbita moschata is determined by DNA minisatellites with variable potential to form non-canonical DNA conformations
CN113493786B (zh) 阻断或者减弱水稻中OsMIR3979的表达以改良水稻籽粒性状的方法
CN109628447B (zh) 特异靶向羊友好位点H11的sgRNA及其编码DNA和应用
Xie et al. Construction of cDNA library of cotton mutant (Xiangmian-18) library during gland forming stage
CN113493787B (zh) 一种阻断或减弱水稻OsMIR7695表达以改良籽粒性状的方法
CN116751764B (zh) 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
CN117210485A (zh) 一种提高植物基因编辑效率的方法
Yao et al. Transcription-wide impact by RESCUE-induced off-target single nucleotide variants in mammalian cell
Daniel et al. CRISPR/Cas9-Mediated Genome Editing in Zebrafish
US20200370093A1 (en) Methods for preparing RNA probes for exome sequencing and for depleting organelle DNA

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18897080

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2018897080

Country of ref document: EP

Effective date: 20200729