CN114333989B - 性状定位的方法及装置 - Google Patents

性状定位的方法及装置 Download PDF

Info

Publication number
CN114333989B
CN114333989B CN202111679978.1A CN202111679978A CN114333989B CN 114333989 B CN114333989 B CN 114333989B CN 202111679978 A CN202111679978 A CN 202111679978A CN 114333989 B CN114333989 B CN 114333989B
Authority
CN
China
Prior art keywords
kmer
unique
positions
marks
markers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111679978.1A
Other languages
English (en)
Other versions
CN114333989A (zh
Inventor
姜亚菲
金岳
李萍
陶琳娜
王静
杨凌云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Novogene Biological Information Technology Co ltd
Original Assignee
Tianjin Novogene Biological Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Novogene Biological Information Technology Co ltd filed Critical Tianjin Novogene Biological Information Technology Co ltd
Priority to CN202111679978.1A priority Critical patent/CN114333989B/zh
Publication of CN114333989A publication Critical patent/CN114333989A/zh
Application granted granted Critical
Publication of CN114333989B publication Critical patent/CN114333989B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种性状定位的方法及装置。该方法包括:将测序序列按照长度L进行切割,获得若干Kmer标记;对Kmer标记进行去重,获得唯一性Kmer标记及各唯一性Kmer标记在参考基因组上的位置;比对性状不同的群体中唯一性Kmer标记不一致的位置,不一致的位置即为与性状关联的位置。通过采用Kmer作为分子标记,代替传统的SNP或INDEL标记,进而通过比较不同性状的群体中的所不一致的Kmer标记及其位置,则该不一致的Kmer标记所在的位置即是与所比较的群体中所不同的性状关联的位置。在不同条件下均能准确定位,定位稳定性高。

Description

性状定位的方法及装置
技术领域
本发明涉及分子育种领域,具体而言,涉及一种性状定位的方法及装置。
背景技术
相对传统育种而言,分子育种发掘优异基因资源是作物种质资源分子评价的重要部分,对作物育种尤其是分子育种具有十分重要的实践意义。而分子育种的一个关键问题,就是找到控制性状的基因。现有最常用的方法是通过混池测序分析(BSA)法寻找控制性状的基因。
传统BSA分析的缺点主要以下几点:1)BSA分析要求混池,混池后的文库数据只能用于单一性状,无法重复利用。2)BSA的分析都严重依赖于单核酸多态性(SNP)或插入缺失(INDEL)之类的小变异,受深度和比对等的影响大,对于大的结构变异导致的性状差异定位效果差。3)BSA严重依赖参考基因组的完整性。4)如果群体与参考基因组差异大,找不到定位区间,特别针对外源插入群体。
发明内容
本发明的主要目的在于提供一种性状定位的方法及装置,以解决现有技术中定位稳定性差的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种性状定位的方法,该方法包括:将测序序列按照长度L进行切割,获得若干Kmer标记;对Kmer标记进行去重,获得唯一性Kmer标记及各唯一性Kmer标记在参考基因组上的位置;比对性状不同的群体中唯一性Kmer标记不一致的位置,不一致的位置即为与性状关联的位置。
进一步地,各群体中的样本数量为45~55个。
进一步地,测序序列为来源于单样本的测序序列。
进一步地,性状为数量性状或质量性状。
进一步地,长度L随物种基因组的大小而变化。
根据本发明的第二个方面,提供了一种性状定位的装置,该装置包括:切割模块,被设置为将测序序列按照长度L进行切割,获得若干Kmer标记;去重模块,被设置为对Kmer标记进行去重,获得唯一性Kmer标记及各唯一性Kmer标记在参考基因组上的位置;群体比对模块,被设置为比对性状不同的群体中唯一性Kmer标记不一致的位置,不一致的位置即为与性状关联的位置。
进一步地,各群体中的样本数量为45~55个。
进一步地,测序序列为来源于单样本的测序序列。
进一步地,性状为数量性状或质量性状。
进一步地,长度L随物种基因组的大小而变化。
根据本发明的第三个方面,提供了一种计算机可读存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述性状定位的方法。
根据本发明的第四个方面,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述性状定位的方法。
应用本发明的技术方案,通过采用Kmer作为分子标记,代替传统的SNP或INDEL标记,进而通过比较不同性状的群体中的所不一致的Kmer标记及其位置,则该不一致的Kmer标记所在的位置即是与所比较的群体中所不同的性状关联的位置。该定位方法受测序深度、参考基因组的完整性、变异结构的大小等的影响较小,因而,在不同测序深度、不同完整性的参考基因组以及变异结构大小不同的情形下,均能准确定位,定位稳定性高。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明的一种实施例所提供的一种性状定位的方法流程示意图;
图2示出了根据本发明的一种实施例所提供的一种性状定位的装置的结构示意图;
图3至图5分别示出了不同测序深度下,Kmer差异在基因组上的分布,其中,图3显示的是1×;图4显示的是5×;图5显示的是10×;
图6A和图6B分别示出了基于Kmer的-lg(p-value)的manhattan图和基于SNP+INDEL的-lg(p-value)的manhattan图;
图7示出了基于Kmer和基于SNP+INDEL所能够涉及的基因数量。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
如背景技术所提到的,现有的分子育种方法中,对与性状相关就基因进行定位的方法大多依赖于SNP或INDEL,而测序深度、参考基因组的完整性、变异结构的大小等均对定位结果的稳定性有影响。为改善这一现状,申请人对现有的定位方法进行了改进,提出了一种新的定位思路。
在本申请一种典型的实施例中,提供了一种性状定位的方法,如图1所示,该方法包括:
S101,将测序序列按照长度L进行切割,获得若干Kmer标记;
S103,对Kmer标记进行去重(去除序列相同,但有多个比对位置的Kmer),获得唯一性Kmer标记(此处的唯一性,是指在参考基因组上的比对位置是唯一的)及各唯一性Kmer标记在参考基因组上的位置;
S105,比对性状不同的群体中唯一性Kmer标记不一致的位置,不一致的位置即为与性状关联的位置。
本申请提供的性状定位方法,通过采用Kmer作为分子标记,代替传统的SNP或INDEL标记,进而通过比较不同性状的群体中的所不一致的Kmer标记及其位置,则该不一致的Kmer标记所在的位置即是与所比较的群体中所不同的性状关联的位置。该定位方法受测序深度、参考基因组的完整性、变异结构的大小等的影响较小,因而,在不同测序深度、不同完整性的参考基因组以及变异结构大小不同的情形下,均能准确定位,定位稳定性高。
需要说明的是,本申请的测序序列的深度可以为1×~更多×。
采用本申请的上述定位方法,由于Kmer采用单个样品建库,可以更精确的获得每个样品的表型,同时与SNP和Indel相比,Kmer由于长度更长,在基因组上的分布更加均匀和稳定,从而使S105步更容易发现不同的地方,所以对群体中样本的数量要求较低,一般50个样本左右的群体即可进行定位分析。因而在本申请非常适合样本群体较少的性状的定位。在一种优选的实施例中,各群体中的样本数量为40~60个。具体地,可以是40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个样本的群体。在某些特殊情况下,理论上少于40个样本的群体也能实现。而大于60个样本的群体则更容易进行定位,因为理论上样本群体数量越大,能够被定位的可能性就越大,能够定位的位置也相对更精确。
需要说明的是,本申请的群体中的各样本可以单独测序,也可以通过混池测序。为了进一步提高该群体的利用效率,即对该群体中各样本中的其他性状进行定位,或者对各样本进行其他方面的研究之用,本申请优选的实施例中,所利用的测序序列均为来源于各群体中单个样本的测序序列。提高了群体中各样本的测序数据的利用率,可用于其他分析。
本申请的上述定位方法,不论所关注的性状是数量性,状还是质量性状,其测序序列上的Kmer标记均能进行体现,因而本申请的方法不受性状所属性质的影响。即对于正态分布的数量性状或非正态分布的质量性状,均有稳定的表现。
需要说明的是,上述Kmer的具体长度L随物种基因组的大小而变化。在实际应用中,通过评估基因组的大小杂合选取合适的长度。比如,对于栽培种可选择L=41,对于杂合度更高的野生种可选择L=41,其他物种可在31~51之间选择。(相比来说kmer的覆盖程度更大,通常L=41,可覆盖4的41次方大小的基因组,对于标准物种可选L=41,对于杂合度高的可降低L例如贝类可选L=25左右,对于高重复多倍体的可选长一些的,例如棉花L=51,可根据个体特性相对调整kmer大小)。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的检测仪器等硬件设备的方式来实现。基于这样的理解,本申请的技术方案中数据处理的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分的方法。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
显然,本领域的技术人员应该明白,上述的本申请的部分模块或步骤可以在通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
实施例2
本实施例提供了一种性状定位的装置,如图2所示,该装置包括:切割模块10、去重模块30及群体比对模块50,其中,
切割模块10,被设置为将测序序列按照长度L进行切割,获得若干Kmer标记;
去重模块30,被设置为对Kmer标记进行去重,获得唯一性Kmer标记及各唯一性Kmer标记在参考基因组上的位置;
群体比对模块50,被设置为比对性状不同的群体中唯一性Kmer标记不一致的位置,不一致的位置即为与性状关联的位置。
本申请的上述定位装置,通过利用切割模块将测序序列切割为若干个Kmer作为分子标记,补充传统的SNP或INDEL标记不足,然后再由去重模块去除重复的有多个比对位置的Kmer标记,获得唯一性的Kmer标记,最后通过执行群体比对模块,比较不同性状的群体中的所不一致的Kmer标记及其位置,则该不一致的Kmer标记所在的位置即是与所比较的群体中所不同的性状关联的位置。该装置对测序深度、参考基因组的完整性、变异结构的大小等的依赖较小,因而,在不同测序深度、不同完整性的参考基因组以及变异结构大小不同的情形下,均能准确定位,定位稳定性高。
采用本申请的上述定位装置,(传统的BSA是混池建库,深度与群体大小是基本相等的,是因为只有达到一定深度对SNP检测的准确性才有保证,例如GATK一般要20×以上,如果INDEL其实相对需要更高的测序深度,同时也要求更多的群体数量)由于Kmer采用单个样品建库,可以更精确的获得每个样品的表型,同时与SNP和Indel相比,Kmer由于长度更长,在基因组上的分布更加均匀和稳定,从而使S105步更容易发现不同的地方,所以对群体中样本的数量要求较低,一般50个样本左右的群体即可进行定位分析。因而在本申请非常适合样本群体较少的性状的定位。在一种优选的实施例中,各群体中的样本数量为40~60个。具体地,可以是40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个样本的群体。在某些特殊情况下,理论上少于40个样本的群体也能实现。而大于60个样本的群体则更容易进行定位,因为理论上样本群体数量越大,能够被定位的可能性就越大,能够定位的位置也相对更精确。
需要说明的是,本申请的群体中的各样本的测序序列,可以是单独测序获得的测序序列,也可以通过混池测序获得的测序序列。为了进一步提高该群体的利用效率,即对该群体中各样本中的其他性状进行定位,或者对各样本进行其他方面的研究之用,本申请优选的实施例中,所利用的测序序列均为来源于各群体中单个样本的测序序列。提高了群体中各样本的测序数据的利用率,可用于其他分析。
本申请的上述定位装置,不论所关注的性状是数量性,状还是质量性状,其测序序列上的Kmer标记均能进行体现,因而本申请的定位装置不受性状所属性质的影响。即对于正态分布的数量性状或非正态分布的质量性状,均有稳定的表现。
需要说明的是,上述Kmer的具体长度L随物种基因组的大小而变化。在实际应用中,通过评估基因组的大小杂合选取合适的长度。比如,对于栽培种可选择L=31,对于杂合度更高的野生种可选择L=47,其他物种可在31~47之间选择。(相比来说Kmer的覆盖程度更大,通常L=41,可覆盖4的41次方大小的基因组,对于标准物种可选L=41,对于杂合度高的可降低L例如贝类可选L=25左右,对于高重复多倍体的可选长一些的,例如棉花L=51,可根据个体特性相对调整Kmer大小)。
实施例3
本实施例提供了一种计算机可读存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述性状定位的方法。
本实施例还一种处理器,处理器用于运行程序,其中,程序运行时执行上述性状定位的方法。
实施例4
本实施例对某栽培种在不同测序深度下(1×,5×,10×)的Kmer差异在基因组的分布进行了检测,检测结果见图3至图5。
实施例5
Kmer能补充定位到SNP+INDEL定位不到的位置
为了使SNP+INDEL与Kmer的结果有直观的比较,本实施例中将Kmer与SNP+INDEL的-lg(p-value)的manhattan图进行分别绘制,结果见图6A和图6B。图6A为Kmer的-lg(p-value)超过Threshold点,图6B为SNP+INDEL的-lg(p-value)。可见,Kmer的定位方法能够有效补充SNP+INDE定位方法的不足。
图7示出了在获得涉及到区域(region)的基因中,(BSA+InDel)涉及1046个基因,Kmer涉及1196个基因,其中共同的基因为757个。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:对测序的序列,按照一定的长度(评估基因组的大小杂合选取合适的长度)进行切割,每个切割的Kmer作为标记,将标记进行去重的操作,去重的Kmer标记广泛的分布于基因组的各个位置。通过比对的手段确定各个Kmer小片段的位置,当我们比较性状不同的群体时,Kmer在2个群体的表现也不一致。这不一致的位置便是和性状关联的位置。
因而,本申请的定位方法和装置,通过使用Kmer标记提升传统的SNP和INDEL对性状进行定位,具有如下优势:
1)样品数量要求少,一般50左右的样品就可以进行分析。
2)对正态分布的数据性状和非正态分布的质量性状表现一致。
3)样品不要求混池,数据可应用于其他分析。
4)分析使用Kmer标记做性状定位,与SNP和INDEL相比,Kmer标记分布更加均匀,在基因组上的覆盖更多,深度对Kmer标记影响有限,例如对于5x的INDEL的检测准确率较低,Kmer的准确性会更高,所以在面对大结构变异导致性状的情形,表现稳定。
5)Kmer性状定位标记对于参考基因组差的基因组,表现稳定。
6)Kmer性状定位不仅能找到单点的定位,并且能找到结构变异的差异引起的混池差异
7)对于与参考基因组差异大的群体,非比对基因组上的区域也可找到定位区间,受基因组与研究群体的差异影响小。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种性状定位的方法,其特征在于,所述方法包括:
将测序序列按照长度L进行切割,获得若干Kmer标记;
对所述Kmer标记进行去重,获得唯一性Kmer标记及各所述唯一性Kmer标记在参考基因组上的位置;
比对性状不同的群体中所述唯一性Kmer标记不一致的位置,所述不一致的位置即为与所述性状关联的位置;
其中,所述唯一性Kmer标记为在参考基因组上的比对位置是唯一的Kmer标记;
所述性状为数量性状或质量性状。
2.根据权利要求1所述的方法,其特征在于,各所述群体中的样本数量为45~55个。
3.根据权利要求1所述的方法,其特征在于,所述测序序列为来源于单样本的测序序列。
4.根据权利要求1所述的方法,其特征在于,所述长度L随物种基因组的大小而变化。
5.一种性状定位的装置,其特征在于,所述装置包括:
切割模块,被设置为将测序序列按照长度L进行切割,获得若干Kmer标记;
去重模块,被设置为对所述Kmer标记进行去重,获得唯一性Kmer标记及各所述唯一性Kmer标记在参考基因组上的位置;
群体比对模块,被设置为比对性状不同的群体中所述唯一性Kmer标记不一致的位置,所述不一致的位置即为与所述性状关联的位置;
其中,所述唯一性Kmer标记为在参考基因组上的比对位置是唯一的Kmer标记;
所述性状为数量性状或质量性状。
6.根据权利要求5所述的装置,其特征在于,各所述群体中的样本数量为45~55个。
7.根据权利要求5所述的装置,其特征在于,所述测序序列为来源于单样本的测序序列。
8.根据权利要求5所述的装置,其特征在于,所述长度L随物种基因组的大小而变化。
9.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至4中任一项所述的性状定位的方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至4中任一项所述的性状定位的方法。
CN202111679978.1A 2021-12-31 2021-12-31 性状定位的方法及装置 Active CN114333989B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111679978.1A CN114333989B (zh) 2021-12-31 2021-12-31 性状定位的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111679978.1A CN114333989B (zh) 2021-12-31 2021-12-31 性状定位的方法及装置

Publications (2)

Publication Number Publication Date
CN114333989A CN114333989A (zh) 2022-04-12
CN114333989B true CN114333989B (zh) 2023-06-13

Family

ID=81023847

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111679978.1A Active CN114333989B (zh) 2021-12-31 2021-12-31 性状定位的方法及装置

Country Status (1)

Country Link
CN (1) CN114333989B (zh)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150120210A1 (en) * 2011-12-29 2015-04-30 Bgi Tech Solutions Co., Ltd. Method and device for labelling single nucleotide polymorphism sites in genome
WO2014186604A1 (en) * 2013-05-15 2014-11-20 Edico Genome Corp. Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
US11085084B2 (en) * 2014-09-12 2021-08-10 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acids
MX2018004615A (es) * 2015-10-16 2018-08-16 Bridgestone Corp Marcadores moleculares y cebadores de guayule y uso de marcadores moleculares, cebadores e indice de apomixis para la identificacion, caracterizacion y mejoramiento del guayule.
CN106282330B (zh) * 2015-12-02 2019-09-06 香港中文大学深圳研究院 一种开发沙冬青植物基因组简单重复序列分子标记的方法
WO2017143585A1 (zh) * 2016-02-26 2017-08-31 深圳华大基因研究院 对分隔长片段序列进行组装的方法和装置
CN107133493B (zh) * 2016-02-26 2020-01-14 中国科学院数学与系统科学研究院 基因组序列的组装方法、结构变异探测方法和相应的系统
US20190318807A1 (en) * 2016-10-26 2019-10-17 The Joan & Irwin Jacobs Technion-Cornell Institute Systems and methods for ultra-fast identification and abundance estimates of microorganisms using a kmer-depth based approach and privacy-preserving protocols
WO2018152267A1 (en) * 2017-02-14 2018-08-23 Bahram Ghaffarzadeh Kermani Reliable and secure detection techniques for processing genome data in next generation sequencing (ngs)
CN110444253B (zh) * 2019-08-30 2023-09-29 上海美吉生物医药科技有限公司 一种适用于混池基因定位的方法及系统
CN112837746B (zh) * 2019-11-22 2022-11-15 成都天成未来科技有限公司 用于小麦外显子测序基因定位的探针设计方法及定位方法
CN113808672A (zh) * 2021-08-11 2021-12-17 广州影子科技有限公司 一种基于动物基因组功能突变位点基因芯片的构建及其应用

Also Published As

Publication number Publication date
CN114333989A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
Kumar et al. Multiple sequence alignment: in pursuit of homologous DNA positions
Cai et al. The perfect storm: gene tree estimation error, incomplete lineage sorting, and ancient gene flow explain the most recalcitrant ancient angiosperm clade, Malpighiales
Blanchette et al. Aligning multiple genomic sequences with the threaded blockset aligner
Sheng et al. Multi-perspective quality control of Illumina RNA sequencing data analysis
Song et al. Capturing the phylogeny of Holometabola with mitochondrial genome data and Bayesian site-heterogeneous mixture models
Portik et al. An evaluation of transcriptome‐based exon capture for frog phylogenomics across multiple scales of divergence (Class: Amphibia, Order: Anura)
Pollard et al. Benchmarking tools for the alignment of functional noncoding DNA
Wolf Principles of transcriptome analysis and gene expression quantification: an RNA‐seq tutorial
Chen et al. TIGRA: a targeted iterative graph routing assembler for breakpoint assembly
Tu et al. Gene structure in the sea urchin Strongylocentrotus purpuratus based on transcriptome analysis
Zhang et al. SVseq: an approach for detecting exact breakpoints of deletions with low-coverage sequence data
Barley et al. Sun skink landscape genomics: assessing the roles of micro‐evolutionary processes in shaping genetic and phenotypic diversity across a heterogeneous and fragmented landscape
Chowdhury et al. Differential expression analysis of RNA-seq reads: overview, taxonomy, and tools
Sinha et al. Sequence turnover and tandem repeats in cis-regulatory modules in Drosophila
Melsted et al. Fusion detection and quantification by pseudoalignment
Simmons Relative benefits of amino‐acid, codon, degeneracy, DNA, and purine‐pyrimidine character coding for phylogenetic analyses of exons
Ockendon et al. Optimization of next‐generation sequencing transcriptome annotation for species lacking sequenced genomes
Zhao et al. Bioinformatics for RNA-seq data analysis
Nygaard et al. Long-and short-term selective forces on malaria parasite genomes
Lee et al. Prioritizing disease‐linked variants, genes, and pathways with an interactive whole‐genome analysis pipeline
Singh et al. Next-generation sequencing (NGS) tools and impact in plant breeding
Webster et al. Gene expression, synteny, and local similarity in human noncoding mutation rates
KR101770962B1 (ko) 유전자 서열 기반 개인 마커에 관한 정보를 제공하는 방법 및 이를 이용한 장치
Lammers et al. Phylogenetic conflict in bears identified by automated discovery of transposable element insertions in low-coverage genomes
Said et al. Patterns of piRNA regulation in Drosophila revealed through transposable element clade inference

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant