CN108846258B - 一种自动检测分节段rna病毒重配的方法 - Google Patents

一种自动检测分节段rna病毒重配的方法 Download PDF

Info

Publication number
CN108846258B
CN108846258B CN201810586291.5A CN201810586291A CN108846258B CN 108846258 B CN108846258 B CN 108846258B CN 201810586291 A CN201810586291 A CN 201810586291A CN 108846258 B CN108846258 B CN 108846258B
Authority
CN
China
Prior art keywords
virus
segment
tree
reassortment
genome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810586291.5A
Other languages
English (en)
Other versions
CN108846258A (zh
Inventor
任洪广
梁龙
岳俊杰
靳远
黄志松
周静
胡明达
彭小川
周江林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Pharmacology and Toxicology of AMMS
Original Assignee
Institute of Pharmacology and Toxicology of AMMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Pharmacology and Toxicology of AMMS filed Critical Institute of Pharmacology and Toxicology of AMMS
Priority to CN201810586291.5A priority Critical patent/CN108846258B/zh
Publication of CN108846258A publication Critical patent/CN108846258A/zh
Application granted granted Critical
Publication of CN108846258B publication Critical patent/CN108846258B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种自动检测分节段RNA病毒重配的方法。本发明提供了一种基于病毒各个节段系统发育树进化关系进行病毒重配检测的方法,包括如下步骤:1)建立病毒各个节段系统发育树;2)将步骤1)得到的分节段系统发育树进行依据平均成对距离的聚类划分,得到每个毒株的各个节段的划分类重定义;3)依据该定义可实现病毒毒株的重配历史检测,同时对于新毒株数据,可依据分节段相似度进行相应的重配检测。本发明的实验证明,本发明通过进化树聚类划分,不需要进行各个节段的拼接比对即可实现对病毒毒株重配的检测,检测结果合理高效。

Description

一种自动检测分节段RNA病毒重配的方法
技术领域
本发明涉及生物技术领域,尤其涉及一种自动检测分节段RNA病毒重配的方法。
背景技术
病毒重配(Reassortment)是基因重组的一种过程,它是分节段RNA病毒所特有的,指的是多个病毒共感染同一宿主细胞,由于病毒基因节段重排从而产生新的基因组合后代病毒的现象。重配在几乎所有的分节段病毒家族中都可以检测到,最典型的是甲型流感病毒。重配是流感病毒实现跨宿主传播或形成大规模流行的重要进化动力。例如,病毒可以通过重配快速获得跨越宿主屏障的关键位点突变,而单纯通过突变累积获得这些宿主标记则需要漫长的进化历程。人类历史上的多次流感疫情都与不同病毒之间的重配有关。
重配与重组(recombination)虽然都涉及到基因片段之间的重新组合,但二者是不同的。重配指的是病毒之间以基因节段为单位进行的重新组合,而重组指的是基因之间以核酸片段为单位进行的插入或交换,二者存在较大差异。
重配的检测对于研究病毒的毒力增强、跨宿主传播、免疫逃逸具有重要意义。一般通过不同节段在系统发育关系上的不一致来进行重配事件的具体分析和检测,往往采用人工查看进化树分支关系的方法来进行,这种效率往往比较低。一些研究采用了自动化方法进行重配检测分析,但是这些方法往往需要把病毒基因组的不同节段进行串联,然后构建基因组进化树,通过研究串联基因组进化树的分支情况来检测重组事件。事实上,分节段病毒的不同节段在进化上是存在较大差异的,一方面不同节段受到的选择压力是不同的,另一方面不同节段的进化速率也是有很大差异的,简单把各个节段串联在一起进行进化树构建,会产生不合理的基因组进化关系,导致错误的重配检测结果。
发明内容
本发明的一个目的是提供一种待测病毒基因组分节片段重配检测的方法。
本发明提供的方法,为先构建已有病毒的各个节段的系统发育树,再依据所述系统发育树中分支节点和叶节点的距离分布进行聚类划分,获得各个节段的划分类,依据现有病毒或待测病毒与划分类的映射关系,获得对病毒重配过程的溯源分析或检测。
上述方法包括如下步骤:
1)从原始数据库中获得所有完整基因组且具有全长序列的与所述待测病毒同种病毒的基因组核酸序列;对所述同种病毒不同病毒株的基因组核酸序列的每个节段的序列进行多序列比对,得到所有病毒株的每个节段的多序列比对结果,记作病毒基因组节段数据库;
2)将所述所有病毒株的每个节段的多序列比对结果均采用最大似然法分别进行系统发育树构建,得到每个节段的系统发育树;
3)步骤2)得到所有节段的系统发育树均按照如下方法分别进行分支聚类:
(1)计算进化树中内部节点下所有叶节点之间的成对距离(mpd),然后求出整棵树所有内部节点mpd值的平均值
Figure BDA0001689333890000021
或确定每个划分类的最小粒度参数阈值Nmin,即当某个类的叶节点数目小于该数值时不再进行进一步划分,而把该类直接确定为一个最终划分类;
所述计算进化树中内部节点下所有叶节点之间的成对距离(mpd),然后求出整棵树所有内部节点mpd值的平均值
Figure BDA0001689333890000022
的方法包括如下:
(a)计算每个进化树中每个内部节点下所对应的子树中任意两个叶节点之间的距离,然后计算内部节点下所有叶节点之间的成对距离mpd,计算公式如下:
Figure BDA0001689333890000023
其中,n表示当前的内部节点下有n个叶节点,i,j代表叶节点,δi,j代表叶节点i,j之间的距离;
(b)根据每个进化树中所有内部节点的mpd值,算出进化树中所有内部节点mpd植的平均值
Figure BDA0001689333890000024
(2)对每颗进化树从根节点开始广度优先方法遍历整棵进化树,依次查看当前节点v的以下参考条件,当如下条件满足其中一个时,确定该节点下的叶节点集合构成一个划分类,得到每个节段的划分类:
Figure BDA0001689333890000025
②Nv≤Nmin
mpdv为当前内部节点下的叶节点之间的成对距离;Nv为当前节点下的叶子节点数目。;
4)对步骤3)得到每个划分类进行时间、地域、宿主或亚型的信息提取,得到每个划分类的具体特征,为每一个划分类进行命名标注,得到标释后的每个节段的具体划分类的进化树;
5)
若待测病毒为所述病毒基因组节段数据库中的已有病毒,则从每个节段进化树上找出所述已有病毒基因组的每个节段在各自进化树上的具体划分类,实现待测病毒基因组分节片段的重配检测;
若待测病毒不为所述病毒基因组节段数据库中的已有病毒,则将所述待测病毒每个节段的序列,与所述病毒基因组节段数据库中对应节段的所有序列进行相似性比对(可采用Blast软件方法进行),所述待测病毒每个节段的序列与所述病毒基因组节段数据库中对应节段序列相似度最高,则所述待测病毒该节段归入所述病毒基因组节段数据库对应节段所属于的划分类,从而实现待测病毒基因组分解片段的重配检测。
上述方法中,所述多序列比对采用的软件为MAFFT软件;
上述方法中,所述最大似然法采用的程序为RaxML程序;
上述方法中,所述原始数据库为GISAID;
上述方法中,所述相似性比对采用的软件方法为Blast方法。
所述病毒为基因组分节段病毒。
上述方法中,所述基因组分节段病毒具体为流感病毒。
上述方法在待测病毒重配的回溯检测中的应用也是本发明保护的范围。
上述中,所述待测病毒为原始数据库外病毒或病毒基因组节段数据库中病毒。
本发明的实验表明,与现有技术相比,本发明的优点在于:1、不需要拼接各个节段构建基因组系统发育树,各个节段的分析相对独立,这更符合分节段病毒各个节段单独进化的基本特征。2、基于划分类对每个病毒基因组进行重定义分型可以实现对所有病毒各个节段的来源进行判断,实现对所有病毒重配过程的回溯,系统还原病毒重配历史。3、对新待分析病毒的重配检测只需要进行简单的序列相似性比对即可实现对其重配过程的检测,快速简捷。
综上所述,本发明通过构建现有分节段病毒各个节段的系统发育树并对其进行聚类划分,可实现对已有病毒及待分析病毒重配事件的全面检测,检测速度快,方法简单有效,可系统全面还原病毒重配历史过程。该发明避免了传统方法中将病毒各个节段进行拼接然后构建系统发育树的不合理性和复杂性。该方法主要体现在自动化进行重配检测,不需要人工进行进化树分析和判读即可实现重配检测分析。利用该技术优势,将为分节段病毒的重配检测及进化动力学研究提供重要技术支撑。
附图说明
图1为流感病毒PB1节段系统发育树。
图2为流感病毒PB1节段的划分类情况。
图3为流感病毒PB1节段划分类之间的关系及特征信息。
图4为毒株A/Shanghai/1/2013的重配历史。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、病毒重配检测方法
一、标释后的每个节段的具体划分类的进化树的制备
针对同种的多个病毒株,检测病毒重配的方法包括如下步骤:
1、构建病毒基因组节段数据库
从数据库中获得所有完整基因组且具有全长序列的同种病毒的基因组核酸序列,同种病毒株的基因组核酸序列分节的节段相同;
对不同病毒株的基因组核酸序列的每个节段的序列采用软件进行多序列比对,得到所有病毒株的每个节段的多序列比对结果,记作病毒基因组节段数据库。
2、构建系统发育树
将步骤1得到的所有病毒株的每个节段的多序列比对结果均采用最大似然法分别进行系统发育树构建,得到每个节段的系统发育树。1个节段对应一个系统发育树。
3、每个节段系统发育树的聚类划分
步骤2得到所有节段的系统发育树均按照如下方法分别进行分支聚类:
1)计算进化树中内部节点下所有叶节点之间的成对距离mpd,然后求出整棵树所有内部节点mpd值的平均值
Figure BDA0001689333890000041
或确定每个划分类的最小粒度参数阈值Nmin,即当某个类的叶节点数目小于该数直时不再进行进一步划分,而把该类直接确定为一个最终划分类;
上述计算进化树中所有节点下的叶节点的成对距离(mpd),然后求出整棵树所有内部节点mpd值的平均值
Figure BDA0001689333890000042
具体包括如下:
(1)计算每个进化树中每个内部节点下所对应的子树中任意两个叶节点之间的距离,然后计算内部节点下所有叶节点之间的成对距离mpd,具体计算公式如下:
Figure BDA0001689333890000051
其中,n表示当前的内部节点下有n个叶节点,i,j代表叶节点,δi,j代表叶节点i,j之间的距离。
(2)计算每个进化树中所有内部节点的mpd值,算出进化树中所有内部节点mpd值的平均值
Figure BDA0001689333890000052
2)将每个进化树中的所有叶节点划分为若干个划分类,对所有节段的进化树进行该聚类划分过程,得到每个分支节段的划分类;
划分过程如下:
对每颗进化树从根节点开始广度优先方法遍历整棵进化树,依次查看当前节点v的以下参考条件,当如下条件满足其中一个时,确定该节点下的叶节点集合构成一个最终划分类:
Figure BDA0001689333890000053
②Nv≤Nmin
mpdv为当前内部节点下的叶节点之间的成对距离;Nv为当前节点下的叶子节点数目。
4、对划分类命名及特征提取
对步骤3得到每个划分类进行时间、地域、宿主、亚型等信息提取,得到每个划分类的具体特征,为每一个划分类进行命名标注,如PB1_32。将原来的进化树进行依据划分类的折叠,同时对划分类进行标识。
二、重配检测
1、对已有病毒的重配分析
依据已有病毒基因组的每个节段在各自进化树上的具体划分类归属及其划分类命名,可实现对现有病毒的具体划分类定义,例如:
A/Shanghai/1/2013 PB2_160 PB1_200 PA_278 HA_252 NP_342 NA_173 MP_253 NS_225
依据该病毒对应的每个划分类的信息特征,得到病毒的重配检测结果,即可实现对该病毒重配的回溯检测。
2、对数据库外病毒的重配检测
数据库外病毒应与数据库中病毒属同种,且存在同源进化关系。
若待测病毒不为所述病毒基因组节段数据库中的已有病毒,则将所述待测病毒每个节段的序列,与所述病毒基因组节段数据库中对应节段的所有序列进行相似性比对(可采用Blast软件方法进行),所述待测病毒每个节段的序列与所述病毒基因组节段数据库中对应节段序列相似度最高,则所述待测病毒该节段归入所述病毒基因组节段数据库对应节段所属于的划分类,从而实现待测病毒基因组分解片段的重配检测。
依据数据库外病毒某个病毒StrainX每个节段的序列,与上述一的1中的病毒基因组节段数据库中所有病毒株的每个节段的进行序列相似性比对(可采用Blast软件方法进行),从数据库中找出与StrainX每个节段最高相似度的节段序列,将与StrainX所有节段最高相似度的节段序列组合成为一株病毒StrainXMock,并用该病毒代表数据库外病毒,该病毒的重配检测结果即视为对原病毒StrainX的重配检测结果。
对于上述分析之外的病毒株的重配检测,首先要对病毒的各个节段序列与病毒基因组节段数据库中的序列进行序列相似性比对,取得与待测病毒各个节段相似度最高的数据库内序列数据,依据该数据库内病毒节段所属划分类情况进行类似(1)中的重配检测分析。
实施例2、流感病毒重配检测
1、下载GISAID网站下载完整流感病毒基因组序列数据
登陆GISAID(http://platform.gisaid.org),筛选下载含有完整基因组且具有全长序列的甲型流感病毒基因组核酸序列,生成下载文件,下载文件中包含每个流感病毒基因组序列数据;剔除其中还有非法字符等数据质量低的基因组,删除其中的冗余基因组。
本实施例于2016-10-26日在GISAID网站数据库中下载的完整流感病毒基因组序列数据,数据质量控制后共18564株病毒基因组。
对不同病毒株的基因组核算序列的每个节段的序列利用MAFFT软件进行多序列比对,得到所有病毒株的每个节段的多序列比对结果,记作病毒基因组节段数据库。
2、构建系统发育树
将步骤1得到的所有病毒株的每个节段的多序列比对结果均利用RaxML程序进行最大似然树的系统发育树构建,获得流感病毒每个节段的系统发育树。
图1给出了流感病毒PB1节段对应的进化树。
3、每个节段系统发育树的聚类划分
(1)编写python脚本处理进化树文件,计算进化树中所有节点下的叶节点的成对距离(mpd),然后求出整棵树的平均值
Figure BDA0001689333890000061
(2)对每颗进化树从根节点开始广度优先方法遍历整棵进化树,依次查看当前节点v的以下参考条件,当如下条件满足其中一个时,确定该节点下的叶节点集合构成一个最终划分类:
Figure BDA0001689333890000071
②Nv≤Nmin
图2给出了PB1节段聚类后的进化树;图3则是将每个划分类进行折叠后的结果,体现的是划分类之间的关系。
4、对划分类命名及特征提取
对步骤3得到每个划分类进行时间、地域、宿主、亚型等信息提取,得到每个划分类的具体特征,为每一个划分类进行命名标注,如PB1_32。
表1给出了部分毒株的划分类重定义结果。
表1
毒株名字 PB2 PB1 PA HA NP NA MP NS
A/Nicaragua/AGA2-114/2013 PB2_418 PB1_435 PA_422 HA_508 NP_442 NA_443 MP_360 NS_480
A/American_Samoa/4786/2013 PB2_419 PB1_436 PA_423 HA_509 NP_436 NA_446 MP_363 NS_471
A/swine/Nebraska/A01445765/2013 PB2_368 PB1_392 PA_343 HA_333 NP_370 NA_397 MP_210 NS_305
A/swine/Iowa/A01445788/2013 PB2_369 PB1_364 PA_343 HA_333 NP_37C NA_406 MP_252 NS_379
A/Hangzhou/A155/2013 PB2_418 PB1_435 PA_422 HA_508 NP_446 NA_443 MP_358 NS_487
A/Shanghai/1/2013 PB2_160 PB1_200 PA_278 HA_252 NP_342 NA_173 MP_253 NS_225
A/swine/Iowa/13B092/2013 PB2_328 PB1_367 PA_323 HA_333 NP_309 NA_406 MP_210 NS_303
A/swine/Iowa/13B093/2013 PB2_328 PB1_367 PA_323 HA_333 NP_309 NA_406 MP_210 NS_303
A/Shanghai/3/2013 PB2_160 PB1_200 PA_278 HA_252 NP_353 NA_173 MP_253 NS_225
A/SRI_LANKA/27/2013 PB2_418 PB1_435 PA_422 HA_508 NP_445 NA_443 MP_363 NS_481
A/chicken/Egypt/D7436C/2013 PB2_34 PB1_42 PA_154 HA_80 NP_162 NA_90 MP_136 NS_44
二、重配检测
依据病毒各个节段对应的划分类的特征信息及划分类之间的进化关系,得出病毒重配历史。
图4给出了毒株A/Shanghai/1/2013的重配历史,结果显示该病毒的部分内部片段(PB2、PA、NP、MP、NS)来自亚洲地区禽流感病毒H9N2,而HA和NA片段则来自亚洲的H7和N9亚型禽流感病毒。
检测结果与已有文献报导结果一致,显示该发明的有效性。
此外,该实施例完成了流感病毒整个重配历史的重构,可追溯数据库中任一流感病毒毒株的重配历史。

Claims (6)

1.一种待测病毒基因组分节片段重配检测的方法,为先构建已有病毒的各个节段的系统发育树,再依据所述系统发育树中分支节点和叶节点的距离分布进行聚类划分,获得各个节段的划分类,依据现有病毒或待测病毒与划分类的映射关系,获得对病毒重配过程的溯源分析或检测;
所述病毒为基因组分节病毒;
所述方法包括如下步骤:
1)从原始数据库中获得所有完整基因组且具有全长序列的与所述待测病毒同种病毒的基因组核酸序列;对所述同种病毒不同病毒株的基因组核酸序列的每个节段的序列进行多序列比对,得到所有病毒株的每个节段的多序列比对结果,记作病毒基因组节段数据库;
2)将所述所有病毒株的每个节段的多序列比对结果均采用最大似然法分别进行系统发育树构建,得到每个节段的系统发育树;
3)步骤2)得到所有节段的系统发育树均按照如下方法分别进行分支聚类:
(1)计算进化树中内部节点下所有叶节点之间的成对距离(mpd),然后求出整棵树所有内部节点mpd值的平均值
Figure FDA0002945351490000011
或确定每个划分类的最小粒度参数阈值Nmin,即当某个类的叶节点数目小于该数值时不再进行进一步划分,而把该类直接确定为一个最终划分类;
所述计算进化树中内部节点下所有叶节点之间的成对距离(mpd),然后求出整棵树所有内部节点mpd值的平均值
Figure FDA0002945351490000012
的方法包括如下:
(a)计算每个进化树中每个内部节点下所对应的子树中任意两个叶节点之间的距离,然后计算内部节点下所有叶节点之间的成对距离mpd,计算公式如下:
Figure FDA0002945351490000013
其中,n表示当前的内部节点下有n个叶节点,i,j代表叶节点,δi,j代表叶节点i,j之间的距离;
(b)根据每个进化树中所有内部节点的mpd值,算出进化树中所有内部节点mpd值的平均值
Figure FDA0002945351490000014
(2)对每颗进化树从跟节点开始广度优先方法遍历整棵进化树,依次查看当前节点v的以下参考条件,当如下条件满足其中一个时,确定该节点下的叶节点集合构成一个划分类,得到每个节段的划分类:
Figure FDA0002945351490000021
②Nv≤Nmin
mpdv为当前内部节点下的叶节点之间的成对距离;Nv为当前节点下的叶子节点数目;
4)对步骤3)得到每个划分类进行时间、地域、宿主或亚型的信息提取,得到每个划分类的具体特征,为每一个划分类进行命名标注,得到标释后的每个节段的具体划分类的进化树;
5)
若待测病毒为所述病毒基因组节段数据库中的已有病毒,则从每个节段进化树上找出所述已有病毒基因组的每个节段在各自进化树上的具体划分类,实现待测病毒基因组分节片段的重配检测;
若待测病毒不为所述病毒基因组节段数据库中的已有病毒,则将所述待测病毒每个节段的序列,与所述病毒基因组节段数据库中对应节段的所有序列进行相似性比对,所述待测病毒每个节段的序列与所述病毒基因组节段数据库中对应节段序列相似度最高,则所述待测病毒该节段归入所述病毒基因组节段数据库对应节段所属于的划分类,从而实现待测病毒基因组分解片段的重配检测。
2.根据权利要求1所述的方法,其特征在于:所述多序列比对采用的软件为MAFFT软件。
3.根据权利要求1或2所述的方法,其特征在于:所述最大似然法采用的程序为RaxML程序。
4.根据权利要求1或2所述的方法,其特征在于:所述原始数据库为GISAID;
所述序列相似性比对方法为Blast软件方法。
5.根据权利要求4所述的方法,其特征在于:所述基因组分节病毒为流感病毒。
6.根据权利要求1或2所述的方法,其特征在于:所述待测病毒为原始数据库外病毒或病毒基因组节段数据库中病毒。
CN201810586291.5A 2018-06-08 2018-06-08 一种自动检测分节段rna病毒重配的方法 Active CN108846258B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810586291.5A CN108846258B (zh) 2018-06-08 2018-06-08 一种自动检测分节段rna病毒重配的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810586291.5A CN108846258B (zh) 2018-06-08 2018-06-08 一种自动检测分节段rna病毒重配的方法

Publications (2)

Publication Number Publication Date
CN108846258A CN108846258A (zh) 2018-11-20
CN108846258B true CN108846258B (zh) 2021-05-18

Family

ID=64210690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810586291.5A Active CN108846258B (zh) 2018-06-08 2018-06-08 一种自动检测分节段rna病毒重配的方法

Country Status (1)

Country Link
CN (1) CN108846258B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111477281B (zh) * 2020-04-03 2024-05-31 北京诺禾致源科技股份有限公司 基于系统进化树的泛基因组构建方法和构建装置
CN115910377B (zh) * 2022-12-06 2023-09-26 中国人民解放军军事科学院军事医学研究院 一种非进化树依赖的分节段rna病毒重配的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103539842A (zh) * 2013-10-25 2014-01-29 中国水产科学研究院珠江水产研究所 草鱼呼肠孤病毒ⅱ型s10基因编码的重组蛋白、由其制备的多克隆抗体及应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2695935A1 (en) * 2006-08-11 2008-02-28 Baylor Research Institute Gene expression signatures in blood leukocytes permit differential diagnosis of acute infections
CN101627050A (zh) * 2006-10-10 2010-01-13 美国国有健康与人类服务部(马里兰州) 禽流感疫苗
CN102971417B (zh) * 2009-10-14 2016-11-16 俄克拉荷马州大学评议会 自浣熊分离犬细小病毒-2相关病毒
EP3011029B1 (en) * 2013-06-17 2019-12-11 The Broad Institute, Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103539842A (zh) * 2013-10-25 2014-01-29 中国水产科学研究院珠江水产研究所 草鱼呼肠孤病毒ⅱ型s10基因编码的重组蛋白、由其制备的多克隆抗体及应用

Also Published As

Publication number Publication date
CN108846258A (zh) 2018-11-20

Similar Documents

Publication Publication Date Title
Zhang et al. Phylogenomics from low‐coverage whole‐genome sequencing
KR102562419B1 (ko) 심층 신경망에 기반한 변이체 분류자
US20190318806A1 (en) Variant Classifier Based on Deep Neural Networks
Powell et al. Empirical evaluation of partitioning schemes for phylogenetic analyses of mitogenomic data: an avian case study
CN105740650B (zh) 一种快速准确鉴定高通量基因组数据污染源的方法
US20180137243A1 (en) Therapeutic Methods Using Metagenomic Data From Microbial Communities
CN108846258B (zh) 一种自动检测分节段rna病毒重配的方法
CN112863606B (zh) 细菌鉴定和分型分析基因组数据库及鉴定和分型分析方法
CN114420212B (zh) 一种大肠杆菌菌株鉴定方法和系统
Liang et al. Comparative analysis of the mitochondrial genomes of Colletotrichum gloeosporioides sensu lato: insights into the evolution of a fungal species complex interacting with diverse plants
Fischer et al. Defining objective clusters for rabies virus sequences using affinity propagation clustering
US11062790B2 (en) Method for thoroughly designing valid and ranked primers for genome-scale DNA sequence database
Chafee et al. The effects of variable sample biomass on comparative metagenomics
Kastanis et al. In‐depth comparative analysis of Illumina® MiSeq run metrics: Development of a wet‐lab quality assessment tool
Goraichuk et al. First complete genome sequence of a subgenotype Vd Newcastle disease virus isolate
Cronk et al. Infection and tissue distribution of highly pathogenic avian influenza A type H5N1 (clade 2.3. 4.4 b) in red fox kits (Vulpes vulpes)
CN107862177B (zh) 一种区分鲤群体的单核苷酸多态性分子标记集的构建方法
CN115910377B (zh) 一种非进化树依赖的分节段rna病毒重配的方法
CN104293941A (zh) 构建测序文库的方法及其应用
CN113539369B (zh) 一种优化的kraken2算法及其在二代测序中的应用
CN115101126B (zh) 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统
US10937523B2 (en) Methods, systems and computer readable storage media for generating accurate nucleotide sequences
Huber et al. Random amplified polymorphic DNA and amplified fragment length polymorphism analyses of Pasteurella multocida isolates from fatal fowl cholera infections
Seoane et al. QuasiFlow: A bioinformatic tool for genetic variability analysis from next generation sequencing data
CN105989247A (zh) 一种甲型流感病毒快速分型与分析流程

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant