WO2019128743A1 - 一种猪全基因组sgRNA文库及其构建方法和应用 - Google Patents
一种猪全基因组sgRNA文库及其构建方法和应用 Download PDFInfo
- Publication number
- WO2019128743A1 WO2019128743A1 PCT/CN2018/121326 CN2018121326W WO2019128743A1 WO 2019128743 A1 WO2019128743 A1 WO 2019128743A1 CN 2018121326 W CN2018121326 W CN 2018121326W WO 2019128743 A1 WO2019128743 A1 WO 2019128743A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sgrna
- sgrnas
- sequence
- genome
- gene
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/10—Design of libraries
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/10—Applications; Uses in screening processes
- C12N2320/12—Applications; Uses in screening processes in functional genomics, i.e. for the determination of gene function
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/30—Production chemically synthesised
- C12N2330/31—Libraries, arrays
Definitions
- the inventor deeply studied the theoretical knowledge and practical methods of the DNA editing system of CRISPR/Cas9-sgRNA, and optimized the experimental flow and algorithm for constructing high-quality sgRNA library with high activity and meeting the experimental requirements.
- the module designed a large number of experiments to explore the design rules and screening methods of sgRNA, and finally found the optimal screening combination and filtration criteria to obtain a genome-wide custom sgRNA library specific for pigs.
- the criteria for screening according to step (3) further comprise: selecting no more than 6 sgRNAs per target sequence, retaining only the optimal and low-risk sgRNA, and ensuring that the selected sgRNA covers as much as possible different transcription of the gene.
- the plurality of sgRNAs of each gene are targeted as far as possible to different positions of the gene, and the GC content is in any one of 20%-80% or a combination of at least two, for example, no more than 6 pieces can be selected for each target sequence.
Abstract
一种猪全基因组sgRNA文库及其构建方法和应用,该文库包括猪(Sus scrofus)全基因组中20438个基因的sgRNA序列,其中17410个基因设计得到6条sgRNA,2828个基因设计得到sgRNA数量在1-5条之间,该sgRNA的获取过程为:首先在靶序列上获取候选sgRNA,然后对候选sgRNA进行脱靶分析并打分,最后根据打分结果对sgRNA过滤;通过采用多种设计标准及筛选原则,优化模块内细节及流程,最终构建得到猪全基因组sgRNA文库。
Description
相关申请的交叉引用
本申请要求于2017年12月29日提交中国专利局的申请号为CN201711490244.2、名称为“一种猪全基因组sgRNA文库及其构建方法和应用”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及基因工程领域,尤其涉及一种猪全基因组sgRNA文库及其构建方法和应用。
CRISPR(Clustered regularly interspaced short palindromic repeats),被称为规律成簇间隔短回文重复,实际上就是一种基因编辑器,是细菌用以保护自身对抗病毒的一个系统,也是一种对付攻击者的基因武器。后来,研究人员发现,它似乎是一种精确的万能基因武器,可以用来删除、添加、激活或抑制其他生物体的目标基因,这些目标基因包括人、老鼠、斑马鱼、细菌、果蝇、酵母、线虫和农作物细胞内的基因,这也意味着基因编辑器是一种可以广泛使用的生物技术,CRISPR基因编辑器的工作过程图如图1所示。
CRISPR簇是一个广泛存在于细菌和古生菌基因组中的特殊DNA重复序列家族,其序列由一个前导区(Leader)、多个短而高度保守的重复序列区(Repeat)和多个间隔区(Spacer)组成。前导区一般位于CRISPR簇上游,是富含AT长度为300~500bp的区域,被认为可能是CRISPR簇的启动子序列。重复序列区长度为21~48bp,含有回文序列,可形成发卡结构。重复序列之间被长度为26~72bp的间隔区隔开。Spacer区域由俘获的外源DNA组成,类似免疫记忆,当含有同样序列的外源DNA入侵时,可被细菌机体识别,并进行剪切使之表达沉默,达到保护自身安全的目的。
通过对CRISPR簇的侧翼序列分析发现,在其附近存在一个多态性家族基因。该家族编码的蛋白质均含有可与核酸发生作用的功能域(具有核酸酶、解旋酶、整合酶和聚合酶等活性),并且与CRISPR区域共同发挥作用,因此被命名为CRISPR关联基因(CRISPR associated),缩写为Cas。目前发现的Cas包括Cas1~Cas10等多种类型。Cas基因与CRISPR共同进化,共同构成一个高度保守的系统,CRISPR簇的系统结构图如图2所示。
当细菌抵御噬菌体等外源DNA入侵时,在前导区的调控下,CRISPR被转录为长的RNA前体(Pre RISPR RNA,pre-crRNA),然后加工成一系列短的含有保守重复序列和间隔区的成熟crRNA,最终识别并结合到与其互补的外源DNA序列上发挥剪切作用。
目前发现的CRISPR/Cas系统有三种不同类型即I型、II型和III型,它们存在于大约40%已测序的真细菌和90%已测序的古细菌中。其中II型的组成较为简单,以Cas9蛋白 以及向导RNA(gRNA)为核心组成,也是目前研究中最深入的类型。
在II型系统中pre-crRNA的加工由Cas家族中的Cas9单独参与,Cas9含有在氨基末端的RuvC和蛋白质中部的HNH2个独特的活性位点,在crRNA成熟和双链DNA剪切中发挥作用。此外,pre-crRNA转录的同时,与其重复序列互补的反式激活crRNA(Trans-activating crRNA,tracrRNA)也转录出来,并且激发Cas9和双链RNA特异性RNase III核酸酶对pre-crRNA进行加工。加工成熟后,crRNA、tracrRNA和Cas9组成复合体,识别并结合于crRNA互补的序列,然后解开DNA双链,形成R-loop,使crRNA与互补链杂交,另一条链保持游离的单链状态,然后由Cas9中的HNH活性位点剪切crRNA的互补DNA链,RuvC活性位点剪切非互补链,最终引入DNA双链断裂(DSB)。CRISPR/Cas9的剪切位点位于crRNA互补序列下游邻近的PAM区(Protospacer Adjacent Motif)的5'-GG-N18-NGG-3'特征区域中的NGG位点,而这种特征的序列在每128bp的随机DNA序列中就重复出现一次。研究结果表明,Cas9还可以剪切线性和超螺旋的质粒,其剪切效率堪比限制性内切酶。由于crRNA参与并且起到精确导向的作用,所以CRISPR/Cas9打靶系统也被称为RNA导向(RNA guided)打靶系统,打把系统的原理图如图3所示。
基于CRISPR/Cas9-sgRNA的DNA编辑系统已经发展成基因编辑的一个有效工具。CRISPR/Cas9-sgRNA系统包含两个主要组分—Cas9蛋白和sgRNA。sgRNA决定了基因编辑的位点和基因编辑的效率。研究已经表明,不同的sgRNA有不同的编辑效率。在动物和人类中通过高通量比较分析sgRNA的效率,研究人员已经获得了高效sgRNA的参数。
CN106845151A公开一种CRISPR-Cas9系统sgRNA作用靶点的筛选方法,包括:(1)利用已公布物种的全基因组序列及基因注释信息,获取基因组中具有5’-Nx-NGG-3’序列的区段(x为19~22之间的整数,N代表A/T/C/G),作为CRISPR-Cas9系统sgRNA的候选靶点;(2)将基因组打断成22~25bp的片段并筛选以NGG结尾的,且在基因组上无重复的序列;(3)将步骤(1)的候选靶点序列与步骤(2)中筛到的序列进行比对,根据错配信息及评选公式对相应的优选序列进行筛选及排序,获取最优的全基因组sgRNA作用靶点集合。CN105886616A公开了一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法,所述筛选方法包括步骤:功能基因筛选及ORF分析、功能基因sgRNA识别位点引导序列预测、全基因组脱靶位点检测、依据脱靶信息与靶位点位置对预测的靶位点打分,排序、结果筛选与统计、算法优化与软件开发。本申请的猪的特异性sgRNA识别位点引导序列经过了严格的筛选与检验,包含所有猪蛋白编码基因的用于CRISPR-Cas9基因编辑的sgRNA识别位点引导序列。但上述现有技术的构建步骤繁琐,优化筛选标准落后,得到的sgRNA质量不高。
但是,由于低质量sgRNA直接浪费科研人员的时间和金钱,因此选择高效率的sgRNA 是避免该结果发生的一个有效途径。目前,尽管已经有一些sgRNA设计软件,但是这些软件大多都是逐个基因设计sgRNA,缺乏定制全基因组sgRNA文库设计的生物信息学工作流程。因此,提供一种针对猪的全基因组定制sgRNA文库制备方法,得到高质量的猪全基因组sgRNA,具有重要的科研价值和应用前景。
发明内容
针对现有技术的不足及实际的需求,本申请提供一种猪全基因组sgRNA文库及其构建方法和应用,通过采用多种设计标准及筛选原则,优化算法和流程,最终构建得到高质量和高活性的猪全基因组sgRNA文库,所述方法简洁高效,得到的文库质量高,活性好,便于应用在基因编辑研究中。
为达此目的,本申请采用以下技术方案:
第一方面,本申请提供一种猪全基因组sgRNA文库,所述文库包括猪(Sus scrofus)全基因组中的20438个基因的sgRNA序列;
所述sgRNA主要通过在获取的靶序列上筛选候选sgRNA,然后对候选sgRNA进行脱靶分析并打分,最后根据打分结果对sgRNA过滤得到。
优选地,所述候选sgRNA的筛选标准包括20%-80%的GC含量。
所述GC含量为20-80%,例如可以是20%、30%、45%、46%、48%、50%、52%、55%、60%、70%或80%,优选为40-70%。
优选地,所述sgRNA的筛选标准包括19-21nt的长度。
所述长度为19-21nt,例如可以是19nt、20nt或21nt。
优选地,所述sgRNA的过滤标准包括选择靠近5’端的sgRNA。
优选地,所述sgRNA的过滤标准包括每个CDS片段的sgRNA数量不超过2条。
发明人在长期的生物信息测序实验过程中,深入研究CRISPR/Cas9-sgRNA的DNA编辑系统理论知识和实践手段,为构建高质量和能满足实验要求的高活性的sgRNA文库,优化实验流程和算法模块,设计大量实验探讨sgRNA的设计规则和筛选方法,最终发现最优的筛选组合和过滤标准,得到特异性针对猪的全基因组定制sgRNA文库。
第二方面,本申请提供一种如第一方面所述的猪全基因组sgRNA文库用于构建基于敲除突变体文库和/或基于敲除动物模型。
第三方面,本申请提供一种猪全基因组sgRNA文库的构建方法,包括如下步骤:
(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’-20
nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
(2)sgRNA设计:根据GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对,并根据指定允许的错配数进行脱靶率评估并分级;
(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA和每个CDS片段的sgRNA数量不超过2条。
优选地,步骤(1)所述靶序列的选择标准包括蛋白质编码基因选择CDS区域作为靶序列。
优选地,步骤(2)所述筛选依据还包括PAM序列和单双链模式。
优选地,步骤(2)所述允许的错配数为0-5个,例如可以是0个、1个、2个、3个、4个或5个,优选为5个。
优选地,步骤(2)所述sgRNA设计的脱靶率评估标准为:
1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高。
优选地,步骤(2)所述分级的级别包括:最优、低风险、风险适中和高风险四个级别。
优选地,步骤(3)所述筛选的标准还包括:每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%中的任意一种或至少两种的组合,例如可以是每个靶序列选择不大于6条的sgRNA和只保留级别为最优和低风险的sgRNA的组合,每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%中的组合,每个靶序列选择不大于的6条sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%的组合,优选为每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%的组合。
作为优选技术方案,本申请提供一种猪全基因组sgRNA文库的构建方法,具体包括如下步骤:
(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’-20
nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
其中,蛋白质编码基因选择CDS区域作为靶序列;
(2)sgRNA设计:根据PAM序列、单双链模式、GC含量为20-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对,进行序列同源分析,并根据指定0-5个的错配数进行脱靶率评估并分为最优、低风险、风险适中和高风险四个级别;
其中,脱靶率评估的标准为:
1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高;
(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA、每个CDS片段的sgRNA数量不超过2条、每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%。
与现有技术相比,本申请具有如下有益效果:
(1)本申请提供的sgRNA文库质量较高,全基因组的20438个基因均设计得到对应的sgRNA,,其中17410个基因设计得到6条sgRNA,2828个基因设计得到sgRNA数量在1-5条之间,所有sgRNA的活性均能满足后续实验的要求;
(2)本申请提供的猪全基因组sgRNA文库的构建方法简洁高效,便于操作和实际应用,通过优化模块内流程及细节,调整sgRNA的设计标准及筛选原则,全面且特异性地针对猪全基因组进行sgRNA设计和过滤,节省时间和人力,便于推广应用。
图1为本申请的CRISPR基因编辑器的工作过程图;
图2为本申请的CRISPR簇的系统结构图;
图3为本申请的CRISPR/Cas9打靶系统的原理图;
图4为本申请的sgRNA构建流程图。
为更进一步阐述本申请所采取的技术手段及其效果,以下结合附图并通过具体实施方式来进一步说明本申请的技术方案,但本申请并非局限在实施例范围内。
实施例1
sgRNA的构建流程如图4所示,流程依次为全基因组CDS序列筛选、根据sgRNA识别位点选取候选sgRNA序列、全基因组脱靶位点检测、根据脱靶位点信息和脱靶位点位置对设计的候选sgRNA打分、结果筛选和设计以及对全程的算法优化和软件开发。
具体步骤如下:
(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’20
nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
其中,蛋白质编码基因选择CDS区域作为靶序列;
(2)sgRNA设计:根据PAM序列、单双链模式、GC含量为20%-80%和长度为20nt筛选候选sgRNA,并进行全基因组序列比对,并根据指定5个的错配数进行脱靶率评估并分为最优、低风险、风险适中和高风险四个级别;
其中,脱靶率评估的标准为:
1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高;
(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA、每个CDS片段的sgRNA数量不超过2条、每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%。
最终构建得到的猪全基因组sgRNA文库中,一共有20438个基因设计得到sgRNA,其中17410个基因设计得到6条sgRNA,2828个基因设计得到sgRNA数量在1-5条之间,实验对sgRNA质量的检验结果显示,Lowrisk以上的均为高质量的sgRNA,文库构建所得到的sgRNA活性均能满足后续实验的要求。
申请人声明,本申请通过上述实施例来说明本申请的详细方法,但本申请并不局限于上述详细方法,即不意味着本申请必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本申请的任何改进,对本申请产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本申请的保护范围和公开范围之内。
Claims (10)
- 一种猪全基因组sgRNA文库,其特征在于,所述文库包括猪(Sus scrofus)全基因组中的20438个基因的sgRNA;所述sgRNA的获取过程为:首先在靶序列上获取候选sgRNA,然后对候选sgRNA进行脱靶分析并打分,最后根据打分结果对sgRNA过滤。
- 根据权利要求1所述的sgRNA文库,其特征在于,所述候选sgRNA的筛选标准包括20%-80%的GC含量;优选地,所述候选sgRNA的筛选标准包括40%-70%的GC含量;优选地,所述候选sgRNA的筛选标准还包括19-21nt的长度。
- 根据权利要求1或2所述的sgRNA文库,其特征在于,所述sgRNA的过滤标准包括选择靠近5’端的sgRNA;优选地,所述sgRNA的过滤标准包括每个CDS片段的sgRNA数量不超过2条。
- 一种如权利要求1-3中任一项所述的猪全基因组sgRNA文库用于构建基于敲除突变体文库和/或基于敲除动物模型。
- 一种猪全基因组sgRNA文库的构建方法,其特征在于,包括如下步骤:(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’20nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;(2)sgRNA设计:根据GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对,并根据指定允许的错配数进行脱靶率评估并分级;(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA和每个CDS片段的sgRNA数量不超过2条。
- 根据权利要求5所述的方法,其特征在于,步骤(1)所述靶序列的选择标准包括蛋白质编码基因选择CDS区域作为靶序列;优选地,步骤(2)所述筛选依据还包括PAM序列和单双链模式。
- 根据权利要求5或6所述的方法,其特征在于,步骤(2)所述允许的错配数为0-5个,优选为5个;优选地,步骤(2)所述sgRNA设计的脱靶率评估标准为:1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高。
- 根据权利要求4-7中任一项所述的方法,其特征在于,步骤(2)所述分级的级别包括:最优、低风险、风险适中和高风险四个级别。
- 根据权利要求5-8中任一项所述的方法,其特征在于,步骤(3)所述筛选的标准还包括:每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%中的任意一种或至少两种的组合,优选为每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%的组合。
- 根据权利要求5-9中任一项所述的方法,其特征在于,具体包括如下步骤:(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’-20nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;其中,蛋白质编码基因选择CDS区域作为靶序列;(2)sgRNA设计:根据PAM序列、单双链模式、GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对并根据指定0-5个的错配数进行脱靶率评估并分为最优、低风险、风险适中和高风险四个级别;其中,脱靶率评估的标准为1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高;(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA、每个CDS片段的sgRNA数量不超过2条、每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18897080.0A EP3733936A4 (en) | 2017-12-29 | 2018-12-14 | WHOLE GENOME SGRNA LIBRARY OF THE PIG AND METHOD FOR PRODUCING AND USING IT |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711490244.2A CN108221058A (zh) | 2017-12-29 | 2017-12-29 | 一种猪全基因组sgRNA文库及其构建方法和应用 |
CN201711490244.2 | 2017-12-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2019128743A1 true WO2019128743A1 (zh) | 2019-07-04 |
Family
ID=62646440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2018/121326 WO2019128743A1 (zh) | 2017-12-29 | 2018-12-14 | 一种猪全基因组sgRNA文库及其构建方法和应用 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP3733936A4 (zh) |
CN (1) | CN108221058A (zh) |
WO (1) | WO2019128743A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113990394A (zh) * | 2021-10-27 | 2022-01-28 | 云舟生物科技(广州)有限公司 | 向导rna作用靶点的筛选方法、计算机存储介质及电子设备 |
CN116206684A (zh) * | 2022-12-26 | 2023-06-02 | 纳昂达(南京)生物科技有限公司 | 一种评估基因组重复区探针捕获安全性的方法及其装置 |
WO2023116681A1 (zh) * | 2021-12-21 | 2023-06-29 | 翌圣生物科技(上海)股份有限公司 | 靶序列随机sgRNA全覆盖组的制备方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108221058A (zh) * | 2017-12-29 | 2018-06-29 | 苏州金唯智生物科技有限公司 | 一种猪全基因组sgRNA文库及其构建方法和应用 |
CN109817340B (zh) * | 2019-01-16 | 2023-06-23 | 苏州金唯智生物科技有限公司 | 疾病风险分布信息确定方法、装置、存储介质及设备 |
CN109957842B (zh) * | 2019-02-11 | 2022-06-24 | 王纪武 | 一种用模块化设计构建双系统表达质粒文库的方法 |
CN110358766A (zh) * | 2019-06-10 | 2019-10-22 | 云南农业大学 | 一种基于全基因组CRISPR/Cas9文库筛选异种移植抗原基因的方法 |
CN113436683A (zh) * | 2020-03-23 | 2021-09-24 | 北京合生基因科技有限公司 | 筛选候选插入片段的方法和系统 |
CN111733159B (zh) * | 2020-06-01 | 2022-09-27 | 五邑大学 | 用于猪MBP基因敲除的sgRNA组合物及用途 |
CN111849983A (zh) * | 2020-07-17 | 2020-10-30 | 中国农业大学 | 一种sgRNA及其应用 |
CN112992277B (zh) * | 2021-03-18 | 2021-10-26 | 南京先声医学检验实验室有限公司 | 一种微生物基因组数据库构建方法及其应用 |
GB202114206D0 (en) * | 2021-10-04 | 2021-11-17 | Genome Res Ltd | Novel method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105886616A (zh) | 2016-04-20 | 2016-08-24 | 广东省农业科学院农业生物基因研究中心 | 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法 |
WO2017075529A1 (en) * | 2015-10-29 | 2017-05-04 | The Research Foundation For The State University Of New York | Genomic combinatorial screening platform |
CN106845151A (zh) | 2015-12-07 | 2017-06-13 | 中国农业大学 | CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置 |
CN108205614A (zh) * | 2017-12-29 | 2018-06-26 | 苏州金唯智生物科技有限公司 | 一种全基因组sgRNA文库的构建系统及其应用 |
CN108221058A (zh) * | 2017-12-29 | 2018-06-29 | 苏州金唯智生物科技有限公司 | 一种猪全基因组sgRNA文库及其构建方法和应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX9305855A (es) * | 1992-09-24 | 1995-01-31 | Tadatsugu Taniguchi | Factores 1 y 2 reguladores del interferon en el diagnostico de latumorigenicidad. |
WO2014204727A1 (en) * | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
WO2015065964A1 (en) * | 2013-10-28 | 2015-05-07 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof |
CA3001683A1 (en) * | 2015-06-05 | 2016-12-08 | The Regents Of The University Of California | Methods and compositions for generating crispr/cas guide rnas |
CN107365793A (zh) * | 2017-06-19 | 2017-11-21 | 百格基因科技(江苏)有限公司 | 一种适用于植物的大规模基因组编辑的方法 |
-
2017
- 2017-12-29 CN CN201711490244.2A patent/CN108221058A/zh active Pending
-
2018
- 2018-12-14 EP EP18897080.0A patent/EP3733936A4/en not_active Withdrawn
- 2018-12-14 WO PCT/CN2018/121326 patent/WO2019128743A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017075529A1 (en) * | 2015-10-29 | 2017-05-04 | The Research Foundation For The State University Of New York | Genomic combinatorial screening platform |
CN106845151A (zh) | 2015-12-07 | 2017-06-13 | 中国农业大学 | CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置 |
CN105886616A (zh) | 2016-04-20 | 2016-08-24 | 广东省农业科学院农业生物基因研究中心 | 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法 |
CN108205614A (zh) * | 2017-12-29 | 2018-06-26 | 苏州金唯智生物科技有限公司 | 一种全基因组sgRNA文库的构建系统及其应用 |
CN108221058A (zh) * | 2017-12-29 | 2018-06-29 | 苏州金唯智生物科技有限公司 | 一种猪全基因组sgRNA文库及其构建方法和应用 |
Non-Patent Citations (3)
Title |
---|
PATRICK D. HSU.: "Development and Applications of CRISPR-Cas9 for Genome Engineering", CELL, vol. 157, no. 6, 5 June 2014 (2014-06-05), pages 1262 - 1278, XP028849523, ISSN: 0092-8674, DOI: 10.1016/j.cell.2014.05.010 * |
See also references of EP3733936A4 |
YANG XIAOFENG; TANG FEI; LI ZICONG; LIU DEWU; WU ZHENFANG; CAI GENGYUAN; ZHENG ENQIN: "Application of the CRISPR/Cas9 Gene Editing Technology in Pigs", HEILONGJIANG ANIMAL SCIENCE AND VETERINARY MEDICINE., vol. 293, no. 5-9, 31 May 2017 (2017-05-31), CN, pages 71 - 76, XP009522195, ISSN: 1004-7034, DOI: 10.13881/j.cnki.hljxmsy.2017.0771 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113990394A (zh) * | 2021-10-27 | 2022-01-28 | 云舟生物科技(广州)有限公司 | 向导rna作用靶点的筛选方法、计算机存储介质及电子设备 |
CN113990394B (zh) * | 2021-10-27 | 2023-01-24 | 云舟生物科技(广州)股份有限公司 | 向导rna作用靶点的筛选方法、计算机存储介质及电子设备 |
WO2023116681A1 (zh) * | 2021-12-21 | 2023-06-29 | 翌圣生物科技(上海)股份有限公司 | 靶序列随机sgRNA全覆盖组的制备方法 |
CN116206684A (zh) * | 2022-12-26 | 2023-06-02 | 纳昂达(南京)生物科技有限公司 | 一种评估基因组重复区探针捕获安全性的方法及其装置 |
CN116206684B (zh) * | 2022-12-26 | 2024-01-30 | 纳昂达(南京)生物科技有限公司 | 一种评估基因组重复区探针捕获安全性的方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108221058A (zh) | 2018-06-29 |
EP3733936A1 (en) | 2020-11-04 |
EP3733936A4 (en) | 2022-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019128743A1 (zh) | 一种猪全基因组sgRNA文库及其构建方法和应用 | |
WO2019128744A1 (zh) | 一种全基因组sgRNA文库的构建系统及其应用 | |
Hu et al. | Engineering non-transgenic gynoecious cucumber using an improved transformation protocol and optimized CRISPR/Cas9 system | |
CN107475300B (zh) | Ifit3-eKO1基因敲除小鼠动物模型的构建方法和应用 | |
Soyars et al. | Cutting edge genetics: CRISPR/Cas9 editing of plant genomes | |
Waaijers et al. | Engineering the Caenorhabditis elegans genome with CRISPR/Cas9 | |
Ghoshal et al. | A viral guide RNA delivery system for CRISPR-based transcriptional activation and heritable targeted DNA demethylation in Arabidopsis thaliana | |
JP2018535689A5 (zh) | ||
Shilo et al. | T-DNA-genome junctions form early after infection and are influenced by the chromatin state of the host genome | |
JP7244885B2 (ja) | 機能的なIncRNAをスクリーニングおよび同定するための方法 | |
EP3940078A1 (en) | Off-target single nucleotide variants caused by single-base editing and high-specificity off-target-free single-base gene editing tool | |
CN107365793A (zh) | 一种适用于植物的大规模基因组编辑的方法 | |
US20210198660A1 (en) | Compositions and methods for making guide nucleic acids | |
KR20170138566A (ko) | 가닥 특이적 cDNA 라이브러리를 작제하기 위한 조성물 및 방법 | |
US11946163B2 (en) | Methods for measuring and improving CRISPR reagent function | |
Matyášek et al. | Intragenomic heterogeneity of intergenic ribosomal DNA spacers in Cucurbita moschata is determined by DNA minisatellites with variable potential to form non-canonical DNA conformations | |
CN113493786B (zh) | 阻断或者减弱水稻中OsMIR3979的表达以改良水稻籽粒性状的方法 | |
CN109628447B (zh) | 特异靶向羊友好位点H11的sgRNA及其编码DNA和应用 | |
Xie et al. | Construction of cDNA library of cotton mutant (Xiangmian-18) library during gland forming stage | |
CN113493787B (zh) | 一种阻断或减弱水稻OsMIR7695表达以改良籽粒性状的方法 | |
CN116751764B (zh) | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 | |
CN117210485A (zh) | 一种提高植物基因编辑效率的方法 | |
Yao et al. | Transcription-wide impact by RESCUE-induced off-target single nucleotide variants in mammalian cell | |
Daniel et al. | CRISPR/Cas9-Mediated Genome Editing in Zebrafish | |
US20200370093A1 (en) | Methods for preparing RNA probes for exome sequencing and for depleting organelle DNA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 18897080 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2018897080 Country of ref document: EP Effective date: 20200729 |