CN114220502A - 一种hiv分子传播网络可视化展示系统和方法 - Google Patents
一种hiv分子传播网络可视化展示系统和方法 Download PDFInfo
- Publication number
- CN114220502A CN114220502A CN202111501720.2A CN202111501720A CN114220502A CN 114220502 A CN114220502 A CN 114220502A CN 202111501720 A CN202111501720 A CN 202111501720A CN 114220502 A CN114220502 A CN 114220502A
- Authority
- CN
- China
- Prior art keywords
- hiv
- molecular
- module
- network
- optimal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012800 visualization Methods 0.000 title claims description 10
- 230000002068 genetic effect Effects 0.000 claims abstract description 81
- 230000005540 biological transmission Effects 0.000 claims abstract description 49
- 238000010586 diagram Methods 0.000 claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 230000000007 visual effect Effects 0.000 claims abstract description 15
- 238000003012 network analysis Methods 0.000 claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 108090000623 proteins and genes Proteins 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 241000725303 Human immunodeficiency virus Species 0.000 description 102
- 238000004590 computer program Methods 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种HIV分子传播网络可视化展示系统和方法,包括:用户输入模块,用于输入待测HIV序列及阈值参数;容器模块,用于存储参考HIV序列、待测HIV序列和用于HIV分子传播网络的生成子模块;计算集群模块,通过调用容器模块中子模块,获得参考HIV序列和待测HIV序列的最佳遗传距离阈值,并根据最佳遗传距离阈值建立最优HIV分子传播网络;分子传播网络分析模块,用于对最优HIV分子传播网络的属性信息进行分析;分子传播网络展示模块,用于对HIV分子传播网络的分析结果进行可视化展示,并输出HIV分子传播网络的矢量图。其能对HIV分子传播网络进行直观的显示,显示结果简单,方便非计算机专业人士使用。
Description
技术领域
本发明涉及一种HIV分子传播网络可视化展示系统和方法,属于HIV基因研究技术领域,特别是涉及基因领域中的分子传播网络研究。
背景技术
艾滋病毒(Human immunodeficiency virus,HIV)的感染流动方向受社会网络结构变化的影响,因此要遏制HIV传播蔓延需要掌握HIV感染者的社会网络结构特点。HIV 分子传播网络利用感染者HIV基因序列的遗传信息建立分子水平的网络,尝试尽可能还原宏观的感染者社会网络,建立一种更快更高效的手段,同时通过对网络中活跃的感染者实施及时的靶向干预,减少传播源并提高干预效果。
由于基因数据量巨大,结构复杂,可读性差,通常需要依赖于有计算机背景的专业人士进行编写程序代码对基因数据进行处理后,方可实现数据的有效分析以及可视化。目前在国际、国内数据库中已积累大量HIV基因序列数据,繁多复杂,而获取这些数据的通常是具有医学背景的专业人士,如从事传染病专业,分子流行病专业人员,进行疾病相关的基础科学研究使用。而国际上新兴起的HIV分子网络分析是通过计算 HIV病毒序列间差异建立潜在传播关系的一种创新性应用,目前该分析技术需计算机专业人士编写代码方可开展数据分析,尚无可同时处理大量基因序列的成熟人机对话界面应用软件发布,因此,非计算机专业背景的医学人士无法直接通过编程代码分析基因数据,并根据分析结果指导HIV的预防干预。故本领域亟需研发一种可以对大量HIV 基因序列进行快速、高效分析,且操作简单(无需编写代码)、可生动的直观展示分析结果的HIV分子传播网络分析系统。
发明内容
针对上述问题,本发明的目的是提供一种能够简单生动的对HIV分子传播网络进行可视化展示的系统和方法。
为实现上述目的,本发明提出了以下技术方案:一种HIV分子传播网络可视化展示系统,包括:用户输入模块、容器模块、计算集群模块、分子传播网络分析模块和分子传播网络展示模块。用户输入模块,用于输入待测HIV序列及阈值参数;容器模块,用于存储参考HIV序列、待测HIV序列和用于HIV分子传播网络的生成子模块;计算集群模块,通过调用容器模块中子模块,获得参考HIV序列和待测HIV序列的最佳遗传距离阈值,并根据最佳遗传距离阈值建立最优HIV分子传播网络;分子传播网络分析模块,用于对最优HIV分子传播网络的属性信息进行分析;分子传播网络展示模块,用于对HIV分子传播网络的分析结果进行可视化展示,并输出HIV分子传播网络的矢量图。
进一步,容器模块包括网页服务器、套接字客户端和子模块,网页服务器用于从用户输入模块提取输入待测HIV序列及阈值参数,并将其传输至套接字客户端,套接字客户端用于连接计算集群模块,计算集群模块调取子模块用于进行HIV分子传播网络计算。
进一步,容器模块的子模块,包括:最佳遗传距离阈值子模块和HIV分子传播网络子模块,最佳遗传距离阈值子模块,用于根据HIV基因序列计算每两个HIV基因样本间的遗传距离,得到最佳遗传距离阈值;HIV分子传播网络子模块,用于根据最佳遗传距离阈值建立最优HIV分子传播网络。
进一步,最佳遗传距离阈值的确定方法为:将待测序列与参考序列对齐,评估待测序列的相对位置是否一致,通过TN93模型(Tamura-Nei,93,一种核苷酸替代模型) 计算待测序列数据集中任意两个序列间的遗传距离,并计算预定遗传距离阈值范围内,各遗传距离阈值生成传播簇的数目,传播簇的数目最大时对应的遗传距离阈值为最佳遗传距离阈值。
进一步,HIV分子传播网络的建立方法为:将序列间的遗传距离小于最佳遗传距离阈值的个体用边连接起来,形成传播网络,传播网络的顶点代表来自不同感染者的序列,连接两个顶点的边代表两个序列的遗传距离。
进一步,计算集群模块包括套接字服务端、宿主机和计算子模块,套接字服务端连接套接字客户端,套接字服务端将容器模块的数据调入宿主机,宿主机连接计算子模块,用于对计算子模块中作业进展进行控制,计算子模块用于调取容器模块的子模块。
进一步,宿主机中作业控制方法为:套接字服务端将待处理作业传输至宿主机,宿主机指定计算子模块中的一个或多个计算节点完成待处理作业,同时宿主机根据待处理作业内容确定需要调用的容器模块的子模块,并向指定的计算节点发送调用命令,计算节点根据调用命令在容器模块中调用对应的子模块,计算节点将作业处理状况实时反馈至宿主机,宿主机根据反馈的内容对计算节点和调用的容器模块的子模块进行调整。
进一步,若需要对作业处理状况进行显示,则将作业处理状况传送至套接字服务端,套接字服务端将作业处理状况传输至套接字客户端,套接字客户端连接作业查询页面,作业处理状况在作业查询页面中显示。
进一步,分子传播网络分析模块对HIV分子传播网络进行分析,根据各个顶点之间是否连接将HIV分子传播网络分成若干分子簇,使得每个分子簇内任意两个顶点之间至少有一条通路互相连接,对于处于不同分子簇的任意两个顶点,不存在任何通路;通过neighbors算法获取各个顶点的相邻顶点,并保存所有相邻顶点的名称和相邻顶点总数,遍历所有的顶点,生成与各顶点对应的数据文件。
本发明还公开了一种HIV分子传播网络可视化展示方法,采用上述任一项的HIV分子传播网络可视化展示系统,包括以下步骤:根据HIV基因序列计算每两个HIV 基因样本间的遗传距离,得到最佳遗传距离阈值;根据最佳遗传距离阈值建立最优HIV 分子传播网络;对最优HIV分子传播网络的属性信息进行分析;对HIV分子传播网络的分析结果进行可视化展示,并输出HIV分子传播网络的矢量图。
本发明由于采取以上技术方案,其具有以下优点:
1、本发明能够自动计算在指定遗传距离范围内生成分子簇数目,获得最佳遗传距离阈值,并生成最优HIV分子传播网络,可解析HIV分子传播网络的多种属性信息,并根据网络属性信息数据生成PDF及SVG格式的矢量网络图。
2、本发明除了可直观展示HIV分子传播网络,并可下载生成最优HIV分子传播网络的数据(两两相连的个体),方便非计算机专业背景的医学人士快速获取分析结果,进一步开展数据分析,展开精准干预。
3、本发明可以根据研究需要对网络中节点和连接赋予流行病学属性信息,方便HIV分子网络的拓展应用。
4、本发明可以根据研究需要替换参考序列,便于在其他传染性病原体研究中应用。
附图说明
图1是本发明一实施例中HIV分子传播网络可视化展示系统的结构示意图;
图2是本发明一实施例中用户交互界面的示意图;
图3是本发明一实施例中容器模块和计算集群模块双向调用示意图;
图4是本发明一实施例中最优HIV分子传播网络的示意图,其中各个顶点上的序号表示HIV基因序列的编号;
图5是本发明一实施例中宿主机中作业控制方法的示意图;
图6是本发明一实施例中HIV分子传播网络计算方法的示意图;
图7是本发明一实施例中HIV分子传播网络的数据流示意图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方向,通过具体实施例对本发明进行详细的描绘。然而应当理解,具体实施方式的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。在本发明的描述中,需要理解的是,所用到的术语仅仅是用于描述的目的,而不能理解为指示或暗示相对重要性。
本发明提出了一种HIV分子传播网络可视化展示系统和方法,其在自主选择的遗传距离范围内,自动计算构建最优分子传播网络的最佳遗传距离阈值;基于图论算法,详细解析HIV网络的多种属性信息,包括网络内分子簇数目,节点数,节点之间的连接方式等,并可直接生成数据文件;根据数据文件生成PDF及SVG格式的矢量网络图。其能够对HIV分子传播网络进行直观的显示,显示结果简洁易懂,可以方便非计算机专业背景的医学人士快速获得有用的信息,开展科学研究;而非医学专业人士也可使用。下面结合附图,通过两个实施例对本发明中方法进行详细说明。
实施例一
本实施例公开了一种HIV分子传播网络可视化展示系统,如图1所示,包括:用户输入模块、容器模块、计算集群模块、分子传播网络分析模块和分子传播网络展示模块,
用户输入模块,用于输入待测HIV序列及阈值参数,用户输入模块包括用户交互界面,用户交互界面如图2所示,其包括:上传FASTA格式的待测HIV序列,上传样本属性文件(流行病学信息),选择参考序列,污染序列过滤方式,遗传距离阈值范围,最小重叠区域长度,互连样本的过滤方式,混合碱基处理方式,混合碱基过滤比例,是否移除DRAM(HIV耐药相关突变),是否与其他参考序列集比较和簇内最少样本数。
容器模块,用于存储参考HIV序列、待测HIV序列和用于HIV分子传播网络的生成子模块,其通过Django web框架和Apache web服务器与前端页面连接;前端页面包括用户输入模块中的用户交互界面、作业查询页面、分子传播网络分析模块中的展示界面以及分子传播网络展示模块中的展示界面。容器模块检查用户输入模块上传的各个文件和输入的参数格式是否正确,若正确则将其传输至计算集群模块,如果不正确则提示用户文件或参数格式错误,请其重新输入格式正确的文件或参数。
计算集群模块,通过调用容器模块中子模块,获得参考HIV序列和待测HIV序列的最佳遗传距离阈值,并根据最佳遗传距离阈值建立最优HIV分子传播网络;
分子传播网络分析模块,用于对最优HIV分子传播网络的属性信息进行分析,分子传播网络分析模块对HIV分子传播网络进行分析,根据各个顶点之间的是否连接将 HIV分子传播网络分成若干分子簇,使得每个分子簇内任意两个顶点之间至少有一条通路互相连接,对于处于不同分子簇的任意两个顶点,不存在任何通路;通过neighbors 算法获取各个顶点的相邻顶点,并保存所有相邻顶点的名称和相邻顶点总数,遍历所有的顶点,生成与各顶点对应的数据文件。
分子传播网络展示模块,用于HIV分子传播网络的分析结果的可视化展示,并输出HIV分子传播网络的矢量图。
如图3所示,容器模块包括网页服务器、套接字客户端和子模块,网页服务器用于从用户输入模块提取输入待测HIV序列及基因阈值参数,并将其传输至套接字客户端,套接字客户端用于连接计算集群模块,计算集群模块调取子模块用于进行HIV分子传播网络计算。计算集群模块包括套接字服务端、宿主机和计算子模块,套接字服务端连接套接字客户端,套接字服务端将容器模块的数据调入宿主机,宿主机接计算子模块,用于对计算子模块中作业进展进行控制,计算子模块用于调取容器模块的子模块。
宿主机使用指定的本地端口开启套接字服务端的监听模式,等待套接字客户端发起的通信。位于容器模块内的套接字客户端通过相同的本地端口向套接字服务端发起计算任务请求,计算集群模块执行相关计算任务,而计算任务的执行又都是调用容器模块内的子模块进行计算。
容器模块的子模块,包括:最佳遗传距离阈值子模块和HIV分子传播网络子模块,最佳遗传距离阈值子模块,用于根据HIV基因序列计算任意两个待测HIV序列间的遗传距离,获取最佳遗传距离阈值,最佳遗传距离阈值的确定方法为:将待测序列与参考序列对齐,评估待测序列的相对位置是否一致,通过TN93模型计算待测序列数据集中任意两个序列间的遗传距离,并计算在预定遗传距离阈值范围内,生成传播簇的数目。当生成传播簇的数目最大时,对应的遗传距离阈值即为最佳遗传距离阈值;HIV 分子传播网络子模块,用于根据最佳遗传距离阈值建立最优HIV分子传播网络,HIV 分子传播网络的建立方法为:将任意两个序列间的遗传距离小于最佳遗传距离阈值的个体连接成传播网络,传播网络的顶点代表来自不同感染者的序列,连接两个顶点的边代表两个序列的遗传距离。最终建立的最优HIV分子传播网络如图4所示,其中各个顶点上的序号表示HIV基因序列的编号。容器模块的子模块可以是对应的计算模型或计算软件。
如图5所示,宿主机中作业控制方法为:套接字服务端将待处理作业传输至宿主机,宿主机指定计算子模块中的一个或多个计算节点完成待处理作业,同时宿主机根据待处理作业内容确定需要调用的容器模块的子模块,并向指定的计算节点发送调用命令,计算节点根据调用命令在容器模块中调用对应的子模块,计算节点将作业处理状况实时反馈至宿主机,宿主机根据反馈的内容对计算节点和调用的容器模块的子模块进行调整。若需要对作业处理状况进行显示,则将作业处理状况传送至套接字服务端,套接字服务端将作业处理状况传输至套接字客户端,套接字客户端连接前端页面,作业处理状况在前端页面中显示。
实施例二
基于相同的发明构思,本实施例公开了一种HIV分子传播网络可视化展示方法,如图6、7所示,采用上述任一项的HIV分子传播网络可视化展示系统,包括以下步骤:
1、根据HIV基因序列计算数据集中任意两个HIV基因序列间的遗传距离,得到最佳遗传距离阈值。
将待测HIV基因序列与本软件预先设置好的参考序列对齐,评估待分析HIV基因序列的相对位置是否一致,然后通过TN93模型计算数据集中任意两个HIV基因序列间的遗传距离,并计算在某一指定的遗传距离阈值下(通常在0.1-2.0%替代/位点范围),生成传播簇的数目。例如:经过计算任意两个HIV基因序列间的遗传距离后,可得出在0.1%替代/位点遗传距离阈值下,有30对序列之间的遗传距离低于这一阈值,则认为此30对序列两两之间可能有传播关系,即把这30对序列两两之间用边连接起来,这30对序列则会形成不多于30个分子簇;然后逐步放大阈值,计算在0.2%替代/位点遗传距离阈值下,可能会有40对序列形成不多于40个分子簇,以此类推直至计算至2.0%替代/位点。会形成一组遗传距离阈值下(0.1%-2.0%替代/位点)的一套分子簇数量的数据。这组数据的特征是随着遗传距离阈值的逐步增加,形成分子簇的数目通常会先增多后减少,形成一个左右对称的正态分布曲线。故如果在某一遗传距离阈值下,生成传播簇数目最多,则该遗传距离阈值为最佳遗传距离阈值。通常情况下,不同亚型病毒,在不同采样时间范围内,不同的地区,以及不同的采样深度,最佳遗传距离阈值并不相同,因此每次对一个新的HIV序列数据集进行分子网络分析前,都要进行最佳遗传距离阈值的计算以便生成最优分子网络。而该算法会直接计算出合理遗传距离阈值范围内产生传播簇的数目,研究者可根据传播簇数目,选取最佳遗传距离阈值构建分子网络。
2、根据最佳遗传距离阈值建立最优HIV分子传播网络。
通过HIV-TRACE模块建立最优HIV分子传播网络。
建立最优HIV分子传播网络的方法为:将病毒遗传距离小于最佳遗传距离阈值的个体连接成传播网络,传播网络的顶点代表来自不同感染者的HIV基因序列,连接两个顶点的边代表两个HIV基因序列的遗传距离。
3、对最优HIV分子传播网络的属性信息进行分析。
最优HIV分子传播网络的属性信息包括网络内分子簇数目、节点数和节点之间的连接方式,便于深入了解网络中的细节。
具体来说,对于整个网络,根据所有个体的连通关系(即是否有边连接两个个体)将网络分为若干个分子簇,使得:(1)对于每个分子簇内的任意两个个体,均存在至少一条通路连接这两个个体,(2)对于两个来自任意不同分子簇内的个体,均不存在任何通路连接;对于每个分子簇,通过igraph软件包中的neighbors算法获取该个体的相邻个体,并保存所有相邻个体的名称和相邻个体总数,同时根据该个体的名称查询所属于的分子簇。最后汇总所有个体的上述信息保存到文件。
4、对HIV分子传播网络的分析结果进行可视化展示,并输出HIV分子传播网络的矢量图。
将上述分子传播网络导入igraph软件包,根据需要可以对该网络进行修剪,即对于上述得到的分子簇,如果该簇内的个体数量小于指定值,则将整个该分子簇从分子传播网络中删除,重新生成只包含个体较多分子簇的分子传播网络,从而简化大型的传播网络。根据该传播网络以及用户提交的个体信息,使用Graphviz软件进行该网络的可视化,其中顶点代表个体,边代表传播关系。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用于说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。上述内容仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种HIV分子传播网络可视化展示系统,其特征在于,包括:用户输入模块、容器模块、计算集群模块、分子传播网络分析模块和分子传播网络展示模块,
所述用户输入模块,用于输入待测HIV序列及阈值参数;
所述容器模块,用于存储参考HIV序列、待测HIV序列和用于HIV分子传播网络的生成子模块;
所述计算集群模块,通过调用所述容器模块中所述子模块,获得参考HIV序列和待测HIV序列的最佳遗传距离阈值,并根据最佳遗传距离阈值建立最优HIV分子传播网络;
所述分子传播网络分析模块,用于对所述最优HIV分子传播网络的属性信息进行分析;
所述分子传播网络展示模块,用于对HIV分子传播网络的分析结果进行可视化展示,并输出所述HIV分子传播网络的矢量图。
2.如权利要求1所述的HIV分子传播网络可视化展示系统,其特征在于,所述容器模块包括网页服务器、套接字客户端和子模块,所述网页服务器用于从所述用户输入模块提取输入待测HIV序列及阈值参数,并将其传输至所述套接字客户端,所述套接字客户端用于连接所述计算集群模块,所述计算集群模块调取所述子模块用于进行HIV分子传播网络计算。
3.如权利要求2所述的HIV分子传播网络可视化展示系统,其特征在于,所述容器模块的子模块,包括:最佳遗传距离阈值子模块和HIV分子传播网络子模块,所述最佳遗传距离阈值子模块,用于根据HIV基因序列计算每两个HIV基因样本间的遗传距离,得到最佳遗传距离阈值;所述HIV分子传播网络子模块,用于根据所述最佳遗传距离阈值建立最优HIV分子传播网络。
4.如权利要求3所述的HIV分子传播网络可视化展示系统,其特征在于,所述最佳遗传距离阈值的确定方法为:将待测序列与参考序列对齐,评估待测序列的相对位置是否一致,通过TN93模型计算待测序列数据集中任意序列间的遗传距离,并计算预定遗传距离阈值范围内,各遗传距离阈值生成传播簇的数目,所述传播簇的数目最大时对应的遗传距离阈值为最佳遗传距离阈值。
5.如权利要求4所述的HIV分子传播网络可视化展示系统,其特征在于,所述HIV分子传播网络的建立方法为:将序列间的遗传距离小于最佳遗传距离阈值的个体连接成传播网络,传播网络的顶点代表来自不同感染者的序列,连接两个顶点的边代表两个序列的遗传距离。
6.如权利要求2所述的HIV分子传播网络可视化展示系统,其特征在于,所述计算集群模块包括套接字服务端、宿主机和计算子模块,所述套接字服务端连接套接字客户端,所述套接字服务端将所述容器模块的数据调入所述宿主机,所述宿主机连接计算子模块,用于对所述计算子模块中作业进展进行控制,所述计算子模块用于调取所述容器模块的子模块。
7.如权利要求6所述的HIV分子传播网络可视化展示系统,其特征在于,所述宿主机中作业控制方法为:套接字服务端将待处理作业传输至宿主机,宿主机指定计算子模块中的一个或多个计算节点完成待处理作业,同时所述宿主机根据待处理作业内容确定需要调用的所述容器模块的子模块,并向指定的计算节点发送调用命令,所述计算节点根据调用命令在所述容器模块中调用对应的子模块,所述计算节点将作业处理状况实时反馈至所述宿主机,所述宿主机根据反馈的内容对计算节点和调用的所述容器模块的子模块进行调整。
8.如权利要求7所述的HIV分子传播网络可视化展示系统,其特征在于,若需要对所述作业处理状况进行显示,则将所述作业处理状况传送至所述套接字服务端,所述套接字服务端将所述作业处理状况传输至套接字客户端,所述套接字客户端连接作业查询页面,所述作业处理状况在所述作业查询页面中显示。
9.如权利要求4所述的HIV分子传播网络可视化展示系统,其特征在于,所述分子传播网络分析模块对所述HIV分子传播网络进行分析,根据各个顶点之间的是否连接将所述HIV分子传播网络分成若干分子簇,使得每个分子簇内任意两个顶点之间至少有一条通路互相连接,对于处于不同分子簇的任意两个顶点,不存在任何通路;通过neighbors算法获取各个顶点的相邻顶点,并保存所有相邻顶点的名称和相邻顶点总数,遍历所有的顶点,生成与各顶点对应的数据文件。
10.一种HIV分子传播网络可视化展示方法,其特征在于,采用权利要求1-9任一项所述的HIV分子传播网络可视化展示系统,包括以下步骤:
计算上传的待测HIV基因序列集中每两个HIV基因序列间的遗传距离,得到最佳遗传距离阈值;
根据所述最佳遗传距离阈值建立最优HIV分子传播网络;
对所述最优HIV分子传播网络的属性信息进行分析;
对HIV分子传播网络的分析结果进行可视化展示,并输出所述HIV分子传播网络的矢量图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111501720.2A CN114220502A (zh) | 2021-12-09 | 2021-12-09 | 一种hiv分子传播网络可视化展示系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111501720.2A CN114220502A (zh) | 2021-12-09 | 2021-12-09 | 一种hiv分子传播网络可视化展示系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114220502A true CN114220502A (zh) | 2022-03-22 |
Family
ID=80700643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111501720.2A Pending CN114220502A (zh) | 2021-12-09 | 2021-12-09 | 一种hiv分子传播网络可视化展示系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114220502A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142064A (zh) * | 2011-04-21 | 2011-08-03 | 华东师范大学 | 生物分子网络展示分析系统及其分析方法 |
US20140278131A1 (en) * | 2013-03-15 | 2014-09-18 | International Business Machines Corporation | Combining RNAi Imaging Data With Genomic Data For Gene Interaction Network Construction |
CN105118010A (zh) * | 2015-09-30 | 2015-12-02 | 成都信汇聚源科技有限公司 | 一种具备实时数据处理、实时信息分享以及生活干预信息的慢性疾病管理方法 |
CN106384009A (zh) * | 2016-09-28 | 2017-02-08 | 湖南老码信息科技有限责任公司 | 一种基于增量式神经网络模型的hiv预测方法和预测系统 |
CN113517030A (zh) * | 2021-07-19 | 2021-10-19 | 中国人民解放军国防科技大学 | 基于病毒传播网络的基因序列表示学习方法 |
-
2021
- 2021-12-09 CN CN202111501720.2A patent/CN114220502A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142064A (zh) * | 2011-04-21 | 2011-08-03 | 华东师范大学 | 生物分子网络展示分析系统及其分析方法 |
US20140278131A1 (en) * | 2013-03-15 | 2014-09-18 | International Business Machines Corporation | Combining RNAi Imaging Data With Genomic Data For Gene Interaction Network Construction |
CN105118010A (zh) * | 2015-09-30 | 2015-12-02 | 成都信汇聚源科技有限公司 | 一种具备实时数据处理、实时信息分享以及生活干预信息的慢性疾病管理方法 |
CN106384009A (zh) * | 2016-09-28 | 2017-02-08 | 湖南老码信息科技有限责任公司 | 一种基于增量式神经网络模型的hiv预测方法和预测系统 |
CN113517030A (zh) * | 2021-07-19 | 2021-10-19 | 中国人民解放军国防科技大学 | 基于病毒传播网络的基因序列表示学习方法 |
Non-Patent Citations (2)
Title |
---|
赵帅;冯毅;辛若雷;李峥;郝明强;廖玲洁;阮玉华;卢红艳;邵一鸣;邢辉;: "应用分子传播网络研究北京男男性行为者HIV-1毒株的传播特征", 中国艾滋病性病, no. 03, 26 March 2018 (2018-03-26), pages 241 - 306 * |
黎裕雪云;冯毅;阮玉华;邢辉;梁浩;邵一鸣;: "HIV分子传播网络研究进展", 中国艾滋病性病, no. 11, 26 November 2016 (2016-11-26), pages 1 - 2 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103942197B (zh) | 数据监控处理方法及设备 | |
US7587685B2 (en) | Data exploration system | |
Paules IV et al. | APROS: Algorithmic development methodology for discrete-continuous optimization problems | |
CN107632845B (zh) | 一种转轮叶片多轴铣削加工的集成知识云服务方法和系统 | |
KR101773574B1 (ko) | 데이터 테이블의 차트 시각화 방법 | |
WO2021219080A1 (zh) | 基于联邦学习模型的视图显示方法、装置、设备及介质 | |
CN107590254A (zh) | 具有合并处理方法的大数据支撑平台 | |
Lin et al. | A MOEA/D-based multi-objective optimization algorithm for remote medical | |
Huson et al. | Autumn algorithm—computation of hybridization networks for realistic phylogenetic trees | |
Paler et al. | OpenSurgery for topological assemblies | |
WO2023123182A1 (zh) | 多源异构数据的处理方法、装置、计算机设备及存储介质 | |
Gunasekaran et al. | Finite-time stability analysis and control of stochastic SIR epidemic model: A study of COVID-19 | |
CN114185750A (zh) | 流程监控方法、装置、设备及存储介质 | |
CN114220502A (zh) | 一种hiv分子传播网络可视化展示系统和方法 | |
Thompson et al. | Deep learning and likelihood approaches for viral phylogeography converge on the same answers whether the inference model is right or wrong | |
KR20220081880A (ko) | 디지털트윈을 이용한 이산사건 시스템 실시간 분석 및 실시간 동작 가시화 장치 | |
CN111143967A (zh) | 一种改进的电网限额决策方法及系统 | |
KR101985491B1 (ko) | 다이어그램 방식의 시각화 수식 작성을 통한 결과 생성 및 모니터링 장치 | |
JP6268322B1 (ja) | 学習データ精度可視化システム、学習データ精度可視化方法、及びプログラム | |
US20200234797A1 (en) | Generation and use of simulated genomic data | |
KR101842681B1 (ko) | 대규모 생물학적 네트워크를 자동적으로 시각화하는 방법 및 장치 | |
Yakhchali et al. | A hybrid genetic algorithm for computing the float of an activity in networks with imprecise durations | |
WO2024000585A1 (zh) | 用于数据跟踪的数据处理方法、装置、系统以及电子设备 | |
Tye et al. | PyGOM-A Python Package for Simplifying Modelling with Systems of Ordinary Differential Equations | |
KR102679146B1 (ko) | 치아 투명 교정 장치 제작을 위한 데이터 관리 시스템 및 이를 이용한 데이터 관리 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |