CN107145767A - 通用rgen基因编辑靶位点快速筛选系统 - Google Patents

通用rgen基因编辑靶位点快速筛选系统 Download PDF

Info

Publication number
CN107145767A
CN107145767A CN201710250569.7A CN201710250569A CN107145767A CN 107145767 A CN107145767 A CN 107145767A CN 201710250569 A CN201710250569 A CN 201710250569A CN 107145767 A CN107145767 A CN 107145767A
Authority
CN
China
Prior art keywords
nucleotides
nucleic acid
sequence
base
rgen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710250569.7A
Other languages
English (en)
Other versions
CN107145767B (zh
Inventor
张涌
陈奇
佟琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest A&F University
Original Assignee
Northwest A&F University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest A&F University filed Critical Northwest A&F University
Priority to CN201710250569.7A priority Critical patent/CN107145767B/zh
Publication of CN107145767A publication Critical patent/CN107145767A/zh
Application granted granted Critical
Publication of CN107145767B publication Critical patent/CN107145767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种通用RGEN基因编辑靶位点快速筛选系统。本发明通过“流水‑管道”设计思想,设计了碱基模式匹配模块、GC含量分析模块、连续n个相同碱基识别模块,形成了一个兼容性强、方便快捷并且适用于大规模数据分析的系统。支持任意模式序列在全基因组范围的匹配与查找,有效应对RNA介导核酸内切酶的快速发展。极大改善目前现有核酸内切酶工具仅能以有限模式和低通量筛选靶位点的现状。另外,本系统的模块构架及相关算法也适用于解决从任意长度字符串中抓取特定要求的子字符串这一类问题。

Description

通用RGEN基因编辑靶位点快速筛选系统
技术领域
本发明属于基因编辑技术领域,涉及利用算法和功能模块高效率筛选自定义基因编辑打靶序列,特别涉及RNA引导的核酸内切酶靶位点筛选。
背景技术
近二十年来,基因组编辑技术的发展促进了生物技术领域和医学领域研究的不断进步。RNA介导核酸内切酶(RGENs:RNA-guided DNA endonucleases)是近几年来发展最迅速、研究最深入的基因组精确打靶体系,由于其具有易操作、高效率、普遍适用性等特点而取代了锌指核酸酶(ZFNs)和类转录激活因子核酸酶(TALENs),成为目前广泛应用于生物学、医学、分子遗传学等领域的技术。
RGEN是CRISPR/Cas及其衍生体系的核酸内切酶蛋白总称,以Cas9和Cpf1蛋白为代表,通过向导RNA(sgRNA:single-guide RNA)的引导识别基因组中靶位点的PAM区域,切割与sgRNA匹配的目标序列,形成双链、单链或粘性末端切口。利用DNA断裂切口引发片段插入、缺失或突变,从而对基因功能研究和转基因模式生物构建提供基础。
随着高通量测序技术的发展,利用RGEN进行的与细胞活性、抗药性和肿瘤发生发展等相关的大规模基因筛选和鉴定成为当前的研究热点。现有的CRISPR/Cas相关程序仅能筛选Cas9和Cpf1两种亚型核酸酶位点,在大批量靶位点查找方面具有很大缺陷,不能满足长片段序列的分析。由于RGEN系统的研究不断扩展和深入,越来越多的具有不同模式识别序列的核酸内切酶蛋白投入应用,因此迫切需要具有通用性和高效率的可以进行全基因组大规模快速筛选靶位点序列的系统。
发明内容
针对目前现有的RGEN靶位点筛选工具的不足,本发明提供一种兼容性强、方便快捷的通用RGEN基因编辑靶位点快速筛选系统。
为达到上述目的,本发明采用了以下技术方案:
该筛选系统整体采用“流水-管道”思想进行设计。流水即为待分析的核酸序列(目标核酸序列),流水简化为由连续排列的水滴组成,每滴水代表核酸序列的一个核苷酸碱基;管道具有预设的长度,即仅能容纳预设数量(数量根据靶位点的模式序列长度确定)的水滴(核苷酸)。当计算机读取核酸序列后,核酸序列中的核苷酸依次通过管道,即水滴按顺序一滴一滴流入管道又流出管道。每流动一滴水,管道就对内部的有序水滴(即核酸序列中的一段)分析一次,匹配该段核酸序列是否和模式序列、GC含量、连续相同碱基个数等要求相符,如果相符则输出。
所述筛选系统包括核酸序列读取模块、集合容器以及综合分析功能模块,所述综合分析功能模块包括碱基模式匹配模块。
核酸序列读取模块:以缓冲字符流形式读取核酸序列,可以降低计算机I/O消耗,提高字符处理速度。
集合容器:集合容器用于存储核酸序列中的一段,长度与模式序列一致,在对集合容器中的该段核酸序列完成一次分析后,集合容器对所存储的核酸序列片段进行更新,更新后进行下一次分析。
以集合容器采用数组为例,更新的优选方案为:对于数组中单独存储的一段核酸序列中的各个核苷酸碱基,将其中排列于该段核酸序列中上游第一个位置的核苷酸碱基替换为与该段核酸序列紧邻的下游第一个核苷酸碱基,并利用游标变量对所存储的所有核苷酸碱基在该段核酸序列中的位置进行坐标标注。
集合容器也用于记录模式序列。
碱基模式匹配模块:建立模式序列匹配机,包括所有简并碱基及其相应的核苷酸字符集,初始化时针对模式序列中每个核苷酸位点(包括简并碱基位点和非简并碱基位点)记录其坐标(即在序列中的位置)及碱基符号,简并碱基的碱基符号通常包括N、S、K、R、W、D、V、H、B等,对于非简并碱基,碱基符号就是相应的核苷酸字符。集合容器内的每个核苷酸按序列顺序依次进入模式序列匹配机,模式序列匹配机根据该核苷酸的坐标找到模式序列中相同坐标的碱基符号,然后按字符的形式进行判断。若该碱基符号属于集合{A,T,C,G},则直接判断集合容器中具有相同坐标的核苷酸字符和该碱基符号是否相同;若该碱基符是简并碱基,例如V={A,C,G},则判断集合容器中具有相同坐标的核苷酸字符是否属于该碱基符号代表的核苷酸字符集。如果判断结果为true,则判断集合容器中下一个核苷酸;如果判断结果为false,则终止判断;如果集合容器中所有核苷酸都判断为true,则表示核酸序列当前处于集合容器中的那一部分序列片段符合模式序列,可进入下一步进行GC含量分析或/和连续相同碱基识别。
为此,所述综合分析功能模块还包括GC含量分析模块或/和连续相同碱基识别模块。
GC含量分析模块:采用入记录、出记录、中间过程不记录的思想。G以及C的数量统计主要步骤为:设定一整数变量gc_Num记录管道中所有核苷酸是G或C的数量。每个刚进管道的核苷酸判断一次它是否属于{G,C},若是则gc_Num数值加1;每个刚出管道的核苷酸判断一次它是否属于{G,C},若是则gc_Num数值减1。对于集合容器而言,所述刚进及刚出管道的核苷酸就是在集合容器更新中用于替换及被替换的核苷酸碱基。gc_Num的初始化值在上述初始化中确定,即通过对最先存储在集合容器中的位于核酸序列起始部分的核苷酸进行G及C数量统计而得到。
连续相同碱基识别模块:可采用以Knuth-Morris-Pratt算法作为核心的字符串快速匹配机。当预设的连续相同碱基参数为n个时,初始化时分别生成用于查找长度为n且核苷酸字符分别为A、T、G、C的连续相同碱基序列的匹配机。集合容器中的每个核苷核按序列顺序同时进入四个匹配机,按字符的形式进行判断是否存在相匹配的n个连续相同的碱基。
在寻找RGEN靶位点时,当集合容器中的核酸序列符合碱基模式匹配和GC含量两个条件时,再进行连续相同碱基识别,一旦发现匹配成功,则终止所有字符串匹配机进程;若集合容器中的核酸序列不包含有n个以上连续相同的碱基,则输出靶位点结果,然后更新集合容器。
与现有技术相比,本发明具有以下有益的技术效果:
本发明采用“流水-管道”思想来处理核酸序列,通过模拟水滴通过管道的过程,从而能够边读边处理,具有高通量的特性,且计算机内存占用率低,对待处理核酸序列长度无限制,适合任意模式序列在全基因组范围的匹配与查找,有效应对RNA介导核酸内切酶的快速发展。同时,本发明对任意形式、任意长度的字符序列都能查找,兼容性强。
进一步的,本发明中建立了核酸字符集库,同时采用剪枝算法思想,即碱基模式匹配模块根据设定的模式序列,在进行核酸与模式序列匹配时,一旦某个核苷酸匹配不成功,则终止核酸后续所有核苷酸的匹配运算,避免无效运算,在读取入新的核苷酸后重新开始匹配,使核酸序列的匹配判断具有通用性和高效性。
进一步的,本发明提供的GC含量分析模块和连续相同碱基识别模块,能方便的筛选出符合用户要求的靶位点核酸子序列。其中,GC含量分析模块根据“流水-管道”思想,采用入记录、出记录、中间过程不记录G或C碱基统计方式。使得每个核苷酸实际仅在进行入管道和离开管道时各判断一次,中间过程不用判断,保证低运算量。另外变量gc_Num动态记录管道中核苷酸的GC含量,可方便调用。连续相同碱基识别模块建立了字符串快速匹配机并采用剪枝算法思想,即在连续相同碱基识别时,一旦四个匹配机中任意一个发现匹配成功,则终止所有匹配机进程,判断相应段核酸序列不符合要求,避免无效运算,节约了大量计算时间,避免了大量无用偏移匹配的判断。
附图说明
图1为本发明实施例中通用RGEN基因编辑靶位点筛选系统结构示意图。
图2为本发明实施例中通用RGEN基因编辑靶位点筛选系统工作界面示意图。
图3为本发明实施例中通用RGEN基因编辑靶位点筛选系统输出结果示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细说明。所述是对本发明的解释,而不是限定。
本发明所述通用RGEN基因编辑靶位点筛选系统整体采用“流水-管道”思想,参见图1,所述靶位点筛选系统包括工作界面(模式序列输入及参数设定)、核酸序列读取模块、碱基模式匹配模块、GC含量分析模块(可选)以及连续n个相同碱基识别模块(可选)。
流水即为需要进行靶位点筛选的核酸序列,在工作界面上利用“DNA sequencefile”指定文件目录(图2)。核酸序列读取模块令计算机以缓冲字符流形式读取文件中的核酸序列。然后以循环的方式按5’至3’方向每次仅抛出一个核苷酸字符传递至管道进行处理,直到最后一个核苷酸被处理。
管道被设计为一个对象,具有四个属性:GC含量、连续n个相同碱基的排除阈值(Eliminate N…N,图2,即n)、一定长度模式序列,以及当前分析的核酸序列的片段。对前两项均采用数值变量记录,后两项均采用相同大小的集合容器来记录,例如,用户输入的模式序列(Input Pattern,图2),在初始化时,其各个核苷酸位点的碱基符号可按5’至3’方向顺序存储在一个数组A中(点击图3中所示“Get Targets Result”即开始初始化以及分析过程,结果保存在“Result Directory”给定的目录下)。
核酸序列按5’至3’方向依次进入管道中,每进一个核苷酸,就有一个核苷酸被挤出管道。需要设计两个游标变量以及一个数组B来完成这一过程。游标变量中,一个(称首游标)记录管道中第一个核苷酸位置,一个(称末游标)记录最后一个核苷酸位置,管道中每个核酸都可以通过游标变量转换成其坐标值而在数组B中找到。如果输入模式序列包括4个核苷酸,那么初始化时,数组B的大小自动设定为4,即可存储核酸序列中的一段长度为4个核苷酸的片段。匹配运算开始时,首先将核酸序列5’端起始的四个核苷酸存储在数组B中,此时,首游标取值为1,末游标取值为4,分别标识核酸序列片段的首末核苷酸在数组B中的位置,当需要读入核酸序列中第5个核苷酸时,将其替换第1个核苷酸,替换的同时,令首末游标取值分别增加1,即首末游标数值分别为2和5,对于超过4的取值需要通过与4相除取余数变换为4以内的自然数(本例为1),即数组B中存储了核酸序列第2至第5位的核苷酸,且首核苷酸在数组B第2位,末核苷酸在数组B第1位。尽管随模式序列长度增加,数组的大小也会增加,但在存储待分析的核酸序列片段时,无需对其所包括的所有核苷酸在数组中的位置进行调整或更新全部坐标,因此,极大的减低了计算量。
碱基模式匹配模块:根据用户输入的模式序列,建立模式序列处理对象,其中内置所有简并碱基及其相应核苷酸字符集。初始化时,针对模式序列中每个核苷酸记录其坐标及碱基符号。当一个新核苷酸进入管道,自动触发一次管道中的新核酸序列与模式序列匹配。核苷酸按游标变量的记录从第一个到最后一个核苷酸字符依次作为参数传递给处理对象。对象中的判断函数可根据该核苷酸的坐标找到模式序列中对应坐标的碱基符号,并按字符的形式进行判断。若该碱基符号是{‘A’,‘T’,‘C’,‘G’}之一,则直接判断管道中该核苷酸字符和碱基符号是否相同;若该碱基符是简并碱基,则调出其代表的核苷酸字符集,例如’V’={‘A’,‘C’,‘G’},再判断管道中该核苷酸字符是否属于核苷酸字符集。如果判断结果为true,则判断管道中下一个核苷酸;如果判断结果为false,则终止判断;如果管道中所有核苷酸都判断为true,则表示管道中核酸序列符合模式序列,进入下一步GC含量分析。
GC含量分析模块:设定一整数变量gc_Num记录管道中所有核苷酸是G或C的数量。每个刚进管道的核苷酸都判断一次它是否属于{G,C},若是,则gc_Num数值加1;每个刚出管道的核苷酸都判断一次它是否属于{G,C},若是,则gc_Num数值减1。当管道中的核酸序列符合模式序列样式,即通过模式匹配模块检测,则计算该核酸序列GC百分比(gc_ratio),即gc_Num除以管道中所有核苷酸个数,再判断gc_ratio是否在用户设定的GC含量百分比范围(GC propotion,图2)内。若结果为false,则返回,管道新进一个核苷酸,重新进行碱基模式匹配;若结果为true,则进入连续相同碱基识别分析。
连续n个相同碱基识别模块:采用Knuth-Morris-Pratt算法作为核心,开发字符串快速匹配对象。当预设的连续相同碱基数为n个,例如n=4,程序在初始化时自动生成匹配对象为“AAAA”、“TTTT”、“CCCC”、“GGGG”四个字符串匹配机。当管道中的核酸序列符合碱基模式匹配和GC含量两个条件时,再进行连续相同碱基识别。管道中的核酸按游标变量记录的核苷酸从第一个到最后一个依次作为参数传递给字符串匹配机,每个核苷酸同时进入四个匹配机,并按字符的形式进行判断。一旦发现匹配成功,即管道中的核酸序列包含有4个连续相同的碱基,则终止所有匹配机进程,管道新进一个核苷酸,重新进行碱基模式匹配;若最后一个核苷酸被四个匹配机处理后仍无成功匹配,则说明管道中的核酸序列不包含有4个及以上的连续相同碱基,输出该核酸序列作为潜在靶位点,然后管道新进一个核苷酸,继续进行靶位点寻找,直至核酸序列分析完毕,输出结果如图3所示。
本发明在各个模块中均采用了快速算法设计思想,保证快速分析。对于人一号染色体(约250Mb)寻找Cas9/Cpf1共同靶位点,即模式序列为“TTTVNNNNNNNNNNNNNNNNNNNNNGG”,整个分析过程仅需15秒。其他形式的模式序列,例如“AWDNNNNSKR”仅需15秒、“ATCGNNNNNNNNNNNNKHATCG”仅需15秒以及“BWKNNNNNNNNNNNNNNNNNNGG”仅需18秒。
本发明重新设计算法和功能模块,RGEN中的任意核酸酶本筛选系统都能适用。另外,本系统的模块构架也适用于解决“从任意长度字符串中抓取特定要求的子字符串”这一类问题。

Claims (8)

1.一种通用RGEN基因编辑靶位点快速筛选系统,其特征在于:该筛选系统包括碱基模式匹配模块,碱基模式匹配模块随目标核酸序列的读取,根据预先设定的任意形式和长度的靶位点碱基模式序列,将目标核酸序列中包含最新读取的核苷酸位点且长度与所述模式序列一致的部分序列与所述碱基模式序列进行同向匹配,每多读取至少1个核苷酸,就完成一次匹配,直至在目标核酸序列上全部或指定的序列范围内完成匹配,通过匹配确定与所述碱基模式形式相符的核酸子序列。
2.根据权利要求1所述的通用RGEN基因编辑靶位点快速筛选系统,其特征在于:所述筛选系统还包括以缓冲字符流形式读取目标核酸序列的核酸序列读取模块。
3.根据权利要求1所述的通用RGEN基因编辑靶位点快速筛选系统,其特征在于:所述碱基模式匹配模块包括所有简并碱基相应的核苷酸字符集,所述匹配是指按字符的形式判断目标核酸序列对应部分的核苷酸是否符合模式序列中的相应碱基要求,与模式序列匹配时,一旦某个核苷酸匹配不成功,则终止该对应部分余下所有核苷酸的匹配运算。
4.根据权利要求1所述的通用RGEN基因编辑靶位点快速筛选系统,其特征在于:所述模式序列中每个核苷酸位点的位置坐标及碱基符号通过集合容器A记录。
5.根据权利要求1所述的通用RGEN基因编辑靶位点快速筛选系统,其特征在于:所述部分序列通过集合容器B记录,随目标核酸序列的读取,集合容器B对所存储的核酸序列片段进行更新。
6.根据权利要求5所述的通用RGEN基因编辑靶位点快速筛选系统,其特征在于:所述集合容器B选自数组,随着目标核酸序列的读取,对于数组中单独存储的一段目标核酸序列中的各个核苷酸,将其中排列于该段核酸序列中首位置的核苷酸替换为新读取的核苷酸,然后利用游标变量对所存储的所有核苷酸在目标核酸序列中的相对位置进行标注。
7.根据权利要求1所述的通用RGEN基因编辑靶位点快速筛选系统,其特征在于:所述筛选系统还包括用于对所述核酸子序列进行GC含量分析的模块,该模块随着目标核酸序列的读取,对于新读取的目标核酸序列的核苷酸以及随该核苷酸读取而排除至所述部分序列之外的核苷酸进行分析,若新读取的核苷酸为G或C,则整数变量gc_Num加1,若排除的核苷酸为G或C,则整数变量gc_Num减1,gc_Num为记录所述部分序列中G及C的数量的变量。
8.根据权利要求1所述的通用RGEN基因编辑靶位点快速筛选系统,其特征在于:所述筛选系统还包括连续相同碱基识别模块,该模块包括用于在所述核酸子序列中查找长度为n且核苷酸字符分别为A、T、G或C的连续相同碱基序列的字符串匹配机,目标核酸序列中的核苷核按序列顺序同时进入各个字符串匹配机,按字符的形式判断是否存在n个连续相同的核苷酸碱基,字符串匹配机中任意一个发现匹配成功,则终止所有字符串匹配机进程。
CN201710250569.7A 2017-04-17 2017-04-17 通用rgen基因编辑靶位点快速筛选系统 Active CN107145767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710250569.7A CN107145767B (zh) 2017-04-17 2017-04-17 通用rgen基因编辑靶位点快速筛选系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710250569.7A CN107145767B (zh) 2017-04-17 2017-04-17 通用rgen基因编辑靶位点快速筛选系统

Publications (2)

Publication Number Publication Date
CN107145767A true CN107145767A (zh) 2017-09-08
CN107145767B CN107145767B (zh) 2018-09-25

Family

ID=59774698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710250569.7A Active CN107145767B (zh) 2017-04-17 2017-04-17 通用rgen基因编辑靶位点快速筛选系统

Country Status (1)

Country Link
CN (1) CN107145767B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682226A (zh) * 2012-04-18 2012-09-19 盛司潼 一种核酸测序信息处理系统及方法
CN103907117A (zh) * 2011-09-01 2014-07-02 基因组编译器公司 用于多核苷酸构建体设计、可视化和交易以对其进行生产的系统
CN103902852A (zh) * 2014-03-21 2014-07-02 深圳华大基因科技有限公司 基因表达的定量方法及装置
US20140249764A1 (en) * 2011-06-06 2014-09-04 Koninklijke Philips N.V. Method for Assembly of Nucleic Acid Sequence Data
CN105925664A (zh) * 2016-03-30 2016-09-07 广州精科生物技术有限公司 一种确定核酸序列的方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140249764A1 (en) * 2011-06-06 2014-09-04 Koninklijke Philips N.V. Method for Assembly of Nucleic Acid Sequence Data
CN103907117A (zh) * 2011-09-01 2014-07-02 基因组编译器公司 用于多核苷酸构建体设计、可视化和交易以对其进行生产的系统
CN102682226A (zh) * 2012-04-18 2012-09-19 盛司潼 一种核酸测序信息处理系统及方法
CN103902852A (zh) * 2014-03-21 2014-07-02 深圳华大基因科技有限公司 基因表达的定量方法及装置
CN105925664A (zh) * 2016-03-30 2016-09-07 广州精科生物技术有限公司 一种确定核酸序列的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马骊 等: "白菜型冬油菜类甜蛋白的筛选、克隆及其在低温胁迫下的表达", 《作物学报》 *

Also Published As

Publication number Publication date
CN107145767B (zh) 2018-09-25

Similar Documents

Publication Publication Date Title
Kong et al. Identification of suitable reference genes for gene expression normalization in qRT-PCR analysis in watermelon
CN106446600B (zh) 一种基于CRISPR/Cas9的sgRNA的设计方法
CN107190062B (zh) 梨果实不同发育时期荧光定量内参基因的筛选及应用
CN103069427B (zh) qPCR基因分型数据的可视化工具
CN106845151A (zh) CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置
CN110021352B (zh) 一种基于miRBase数据库的植物有参的miRNA数据分析方法
CN104805080A (zh) 一种油菜角果数主效qtl的分子标记及应用
CN108660246A (zh) 一组马家柚InDel分子标记及其在柑橘品种种苗早期区分粗皮马家柚中的应用
CN103555717A (zh) 一种甜瓜甜味酸味性状相关基因功能性分子标记及应用
CN109402241A (zh) 鉴定和分析古dna样本的方法
CN103013986B (zh) 利用est序列的冗余性开发辣椒ssr标记及其方法
CN105426700A (zh) 一种批量计算基因组直系同源基因进化速率的方法
CN104531870B (zh) 中国近海海马微卫星标记的特异性引物及鉴定方法
CN114717355A (zh) 一种西瓜全基因组SNP-Panel
CN107937397A (zh) 与番茄雄性不育基因紧密连锁的snp分子标记及其获得方法和应用
CN109243531B (zh) 一种批量计算近缘物种间基因组编码区snp位点的方法
CN106498048A (zh) 一种与大豆结瘤数相关的qtl、snp分子标记及应用
US7127354B1 (en) Method of displaying gene data, and recording medium
CN107145767B (zh) 通用rgen基因编辑靶位点快速筛选系统
CN108441566A (zh) 一种山羊atbf1基因插入/缺失多态性的检测方法及其应用
CN111607661B (zh) 基于油茶转录组hAT转座子的分子标记引物组及其应用
JP5469882B2 (ja) 生物種同定方法及びシステム
CN105886651B (zh) 一种与油菜苗期抗旱性关联的功能标记及其应用
CN105063201B (zh) 玉米第9号染色体穗行数主效qtl的分子标记及其应用
CN109706231A (zh) 一种用于凡纳滨对虾分子育种的高通量snp分型方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant