发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一方面的目的在于提出一种辅助疾病诊疗的分析系统,该服务器能够通过临床信息进行临床辅助诊疗指导。
本发明的第二方面的目的在于提出一种辅助疾病诊疗的分析装置。
本发明的第三方面的目的在于提出一种辅助疾病诊疗的分析方法。
为达上述目的,根据本发明第一方面实施例提出了一种辅助疾病诊疗的分析系统,包括:客户端和服务器,其中,所述客户端用于接收待分析个体的标识信息,并所述将待分析个体的标识信息发送至所述服务器,并显示所述服务器返回的辅助诊疗信息;所述服务器用于接收所述待分析个体的标识信息,并根据所述待分析个体的标识信息查询临床信息数据库和生物信息数据库以分别获取所述待分析个体的临床信息和个体生物信息,以及根据所述生物信息数据库对所述待分析个体的个体生物信息进行分析,并根据分析结果获取相应的辅助诊疗信息。
在本发明的一个实施例中,所述生物信息数据库包括个体生物信息库以及表型相关的生物信息库,其中,所述个体生物信息库与所述临床信息数据库通过索引文件相关联。
在本发明的一个实施例中,所述服务器还用于通过以下一种或多种方式获取所述表型相关的生物信息库中的与表型信息相关的生物信息:将已确定的与表型信息相关的生物信息导入所述表型相关的生物信息库;根据所述生物信息数据库筛选出疾病生物标志物,并将筛选出的疾病生物标志物作为所述与表型信息相关的生物信息存储至所述表型相关的生物信息库。
在本发明的一个实施例中,所述根据所述生物信息数据库筛选疾病生物标志物包括:a.接收分析指令,其中,所述分析指令包括样本筛选条件和分析程序参数;b.根据所述样本筛选条件获取与所述样本筛选条件对应的待分析样本的临床信息,并根据所述待分析样本的临床信息获取相关联的生物信息;c.根据所述分析程序参数构建分析任务对所述待分析样本的临床信息和所述相关联的生物信息进行分析;d.对分析结果进行显著性检验;e.如果所述分析结果不显著,则重置样本筛选条件,并重复步骤b-d,直至所述分析结果显著。
在本发明的一个实施例中,其中,所述服务器通过核酸序列检索分析、蛋白质检索分析、代谢物检索分析、核酸序列比对分析,蛋白质空间结构信息检索分析、多维定标分析、预测算法分析以及分类算法分析中的一种或多种对所述待分析个体的个体生物信息进行分析。
本发明第二方面实施例提出了一种辅助疾病诊疗的分析装置,包括:接收模块,用于接收待分析个体的标识信息;获取模块,用于根据所述待分析个体的标识信息查询临床信息数据库和生物信息数据库以分别获取所述待分析个体的临床信息和个体生物信息;分析模块,用于根据所述生物信息数据库对所述待分析个体的个体生物信息进行分析,并根据分析结果获取相应的辅助诊疗信息。
在本发明的一个实施例中,所述生物信息数据库包括个体生物信息库以及表型相关的生物信息库,其中,所述个体生物信息库与所述临床信息数据库通过索引文件相关联。
在本发明的一个实施例中,还包括:导入模块,用于将已确定的与表型信息相关的生物信息导入所述表型相关的生物信息库;筛选模块,用于根据所述生物信息数据库筛选出疾病生物标志物,并将筛选出的疾病生物标志物作为所述与表型信息相关的生物信息存储至所述表型相关的生物信息库。
在本发明的一个实施例中,所述筛选模块包括:接收单元,用于接收分析指令,其中,所述分析指令包括样本筛选条件和分析程序参数;获取单元,用于根据所述样本筛选条件获取与所述样本筛选条件对应的待分析样本的临床信息,并根据所述待分析样本的临床信息获取相关联的生物信息;分析单元,用于根据所述分析程序参数构建分析任务对所述待分析样本的临床信息和所述相关联的生物信息进行分析;显著性检验单元,用于对分析结果进行显著性检验,并在所述分析结果不显著时,重置样本筛选条件,以再次分析,直至所述分析结果显著。
在本发明的一个实施例中,其中,所述分析模块通过核酸序列检索分析、蛋白质检索分析、代谢物检索分析、核酸序列比对分析,蛋白质空间结构信息检索分析、多维定标分析、预测算法分析以及分类算法分析中的一种或多种对所述待分析个体的个体生物信息进行分析。
本发明第三方面实施例提出了一种辅助疾病诊疗的分析方法,包括:接收待分析个体的标识信息;根据所述待分析个体的标识信息查询临床信息数据库和生物信息数据库以分别获取所述待分析个体的临床信息和个体生物信息;根据所述生物信息数据库对所述待分析个体的个体生物信息进行分析,并根据分析结果获取相应的辅助诊疗信息。
在本发明的一个实施例中,所述生物信息数据库包括个体生物信息库以及表型相关的生物信息库,其中,所述个体生物信息库与所述临床信息数据库通过索引文件相关联。
在本发明的一个实施例中,通过以下一种或多种方式获取所述表型相关的生物信息库中的与表型信息相关的生物信息:将已确定的与表型信息相关的生物信息导入所述表型相关的生物信息库;根据所述生物信息数据库筛选出疾病生物标志物,并将筛选出的疾病生物标志物作为所述与表型信息相关的生物信息存储至所述表型相关的生物信息库。
在本发明的一个实施例中,所述根据所述生物信息数据库筛选疾病生物标志物包括:a.接收分析指令,其中,所述分析指令包括样本筛选条件和分析程序参数;b.根据所述样本筛选条件获取与所述样本筛选条件对应的待分析样本的临床信息,并根据所述待分析样本的临床信息获取相关联的生物信息;c.根据所述分析程序参数构建分析任务对所述待分析样本的临床信息和所述相关联的生物信息进行分析;d.对分析结果进行显著性检验;e.如果所述分析结果不显著,则重置样本筛选条件,并重复步骤b-d,直至所述分析结果显著。
在本发明的一个实施例中,其中,通过核酸序列检索分析、蛋白质检索分析、代谢物检索分析、核酸序列比对分析,蛋白质空间结构信息检索分析、多维定标分析、预测算法分析以及分类算法分析中的一种或多种对所述待分析个体的个体生物信息进行分析。
本发明实施例的辅助疾病诊疗的分析系统、装置及方法,可根据待分析个体的标识信息获取相应的临床信息和个体生物信息,并根据生物信息数据库对个体生物信息进行分析获取相应的辅助诊疗结果返回至客户端,从分子水平探讨发病机制,辅助指导临床诊断及治疗,在准确、敏感地评价早期、低水平的损害方面有着独特的优势,并可提供早期基因风险预警,很大程度上为临床医生提供了辅助诊疗的依据。此外,还可移植应用到各种不同复杂疾病研究领域,应用范围广阔。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的辅助疾病诊疗的分析系统、装置及方法。
图1为根据本发明一个实施例的辅助疾病诊疗的分析系统的结构示意图。
如图1所示,根据本发明实施例的辅助疾病诊疗的分析系统包括:客户端100和服务器200。
具体地,客户端100用于接收待分析个体的标识信息,并将待分析个体的标识信息发送至服务器200,并显示服务器200返回的辅助诊疗信息。其中,待分析个体可为人、动物或者其他生物,例如医院的病人、参与研究的志愿者等。待分析个体的标识信息可为能够唯一标识待分析个体的信息,如个体ID(Identity,身份标识码)、身份证号码等。
在本发明的一个实施例中,客户端100可通过提供浏览器类界面(如web页面)接收待分析个体的标识信息,以及显示服务器200返回的辅助诊疗信息,其中,客户端100可为PC(personalcomputer,个人计算机)或移动终端,其中,移动终端可以是智能手机、平板电脑、个人数字助理、电子书等具有各种操作系统的硬件设备。
客户端100可通过B/S结构(Browser/Server,浏览器/服务器结构)与服务器进行通信,从而使客户端100不局限于个人电脑,其他具有通过B/S结构与服务器进行通信的终端也可使用本发明。
服务器200用于接收待分析个体的标识信息,并根据待分析个体的标识信息查询临床信息数据库和生物信息数据库以分别获取待分析个体的临床信息和个体生物信息,以及根据生物信息数据库对待分析个体的个体生物信息进行分析,并根据分析结果获取相应的辅助诊疗信息。
其中,临床信息为通过实验和临床观察得到的资料和数据,如人体正常值、心电图、脑电图、器官呈像、病理呈像、临床药物等,可存储在临床表型数据库中。
在本发明的实施例中,生物信息数据库包括个体生物信息库以及表型相关的生物信息库。其中,个体生物信息主要包括基因组信息、蛋白质组信息和代谢组学信息等。基因组信息可包括原始测序信息(碱基序列、碱基质量),比对结果(碱基序列比对到参考基因组上的位置,比对得分)等;蛋白质组信息和代谢组信息可包括通过质谱仪测得的蛋白质、小分子代谢物的数据信息等。表型相关的生物信息库中的与表型信息相关的生物信息可为疾病生物标志物,例如与疾病相关联的生物标志物信息、与用药相关联的基因信息等。其中,疾病生物标志物(biomarker)是一种生物状态的指示物,是指能够客观反映正常生物学进程、致病机制或对治疗干预的药理学改变的可测定或评估的特征性指标。生物标志物主要可包括易感基因、SNP位点、microRNA、蛋白质、小分子化合物等。其中,服务器200可通过以下一种或多种方式获取表型相关的生物信息库中的与表型信息相关的生物信息:服务器200可将客户端100上传的已确定与表型信息相关的生物信息(如公知的或经研究确认了的与表型信息相关的生物信息)导入表型相关的生物信息库;和/或服务器200根据生物信息数据库筛选出疾病生物标志物,并将筛选出的疾病生物标志物作为与表型信息相关的生物信息存储至表型相关的生物信息库。
在本发明的一个实施例中,个体生物信息库与临床信息数据库通过索引文件相关联。其中,个人生物信息库以临床信息数据库的分组信息(如病理呈像、个体的标识信息等)为索引文件,因而,可据此建立个体生物信息库与临床信息数据库的关联关系。从而服务器200可根据待分析个体的标识信息查询临床信息数据库与个体生物信息库以分别获取待分析样本的临床信息和个体生物信息。
在本发明的一个实施例中,临床信息数据库和生物信息数据库可采用分布式部署方案,可与HIS(HospitalInformationSystem,医院信息系统)相连,根据在各个部署节点的数据更新情况,实时更新。临床信息数据库和生物信息数据库还可与样本管理系统相连,从而可通过网络资源,云技术及终端设备访问,方便位于不同地点的生物学医学者研究和使用,其中,样本管理系统是一个对生物样本进行管理的WEB网页系统,该系统以医院的特定需求为前提进行开发。其中,在使用临床信息数据库和生物信息数据库的过程中,可根据每个使用用户的不同权限为该使用用户提供相应的部分数据,从而能够在共享资源的同时有效防止临床信息和生物信息被盗取和泄露,保证了临床信息和生物信息的隐私及安全。
服务器200可首先根据个体生物信息对生物信息数据库中的表型相关的生物信息库进行核酸检索、蛋白质检索和代谢物检索。如果未检索到相应的核酸、蛋白质和代谢物,则返回分析失败提示。如果在表型相关的生物信息库中检索到相应的核酸,则进一步进行核酸序列比对以确定其基因型、突变情况等;如果检索到相应的蛋白质,则进一步进行蛋白质空间结构信息检索,以确定蛋白质的结构与功能。从而根据上述分析结果确定相应的临床疾病诊断结果、用药方案、基因风险预警、生物标记物风险提示等辅助诊疗信息。如果通过核酸检索、蛋白质检索和代谢物检索后,检索到相应的多个核酸或多个蛋白质或多个代谢物,则可分别对相应的多个核酸或多个蛋白质或多个代谢物进行多维定标分析、预测算法分析或分类算法分析以确定该个体生物信息对应的辅助诊疗信息。
举例来说,如果根据病人A的临床资料可得知他是丙型肝炎病毒(HCV)感染者。即可根据丙型肝炎病毒(HCV)感染这一临床特征,通过生物信息数据库,找出与丙型肝炎的病程及治疗效果有关的白细胞介素28B(IL28B)基因,并确定该基因的基因型。然后根据表型相关的生物信息库对该个体的白细胞介素28B(IL28B)基因型进行序列比对,如果能够与表型相关的生物信息库中的基因型比对成功,则进而确定该个体的基因型对应的治疗方案;如果与其中多个基因的基因型比对成功,则可通过多维定标分析或分类算法分析确定该个体从属于某一类群,根据从属于的某一类群的划分,进而找到适合于该类群的治疗特征和方案,从而辅助指导该个体的疾病治疗。
本发明实施例的辅助疾病诊疗的分析系统,服务器可根据待分析个体的标识信息获取相应的临床信息和个体生物信息,并根据生物信息数据库对个体生物信息进行分析获取相应的诊疗结果返回至客户端,从分子水平探讨发病机制,辅助指导临床诊断及治疗,在准确、敏感地评价早期、低水平的损害方面有着独特的优势,并可提供早期基因风险预警,很大程度上为临床医生提供了辅助诊疗的依据。此外,还可移植应用到各种不同复杂疾病研究领域,应用范围广阔。
在本发明的实施例中,服务器还可针对临床信息和/或个体生物信息、对个体生物信息的分析结果、辅助诊疗信息进行统计分析,并将统计分析结果返回至客户端进行渲染显示。举例来说,可对分析结果、临床信息和/或生物信息分别进行统计分组、曲线拟合等分析,并将分析结果返回至客户端渲染生成相应的结果列表和/或统计图表。图2a-d为根据本发明实施例的统计图表的示意图。具体地,图2a为根据本发明一个实施例的疾病年龄分布示意图,如图2a所示,以10年为一个年龄段列出了1-100周岁中每个年龄段疾病患者的人数。图2b为根据本发明一个实施例的累积测序深度的碱基占总碱基数的百分比分布图,如图2b所示,其中,横坐标为测序深度值,纵坐标为大于某一测序深度的碱基数目总和占所有碱基数目的百分比。图2c为根据本发明一个实施例的一条染色体的平均测序深度、中间测序深度和覆盖度的统计示意图,其中,横坐标为染色体编号,左侧纵坐标为测序深度,右侧纵坐标为覆盖度百分比,Meandepth为平均测序深度数,即某一染色体上所有碱基测序深度的平均值,Mediandepth为中间测序深度,即某一染色体上碱基所有测序深度的中间值,Coverge为覆盖度,即测序获得的序列占整条染色体的比例。图2d为根据本发明一个实施例的测序深度的目标碱基数目占总碱基数目的百分比分布图,其中,横坐标为测序深度,纵坐标为该测序深度的目标碱基数目占所有碱基数目的百分比。
在本发明的一个实施例中,图3为根据本发明一个实施例的根据生物信息数据库筛选疾病生物标志物的方法流程图,如图3所示,根据生物信息数据库筛选疾病生物标志物的方法,包括:
S301,接收分析指令,其中,分析指令包括样本筛选条件和分析程序参数。
在本发明的一个实施例中,样本筛选条件为对临床性状进行描述的信息,疾病生物标志物的筛选分析平台可根据接收到的分析指令对应的疾病构建相应的样本筛选条件,例如,如果接收到对冠心病的分析指令,可构建样本筛选条件:“在2010年患冠心病,且急诊生化检验中血钾指标高于100的病人”。分析程序参数可为用于确定分析待分析样本所用到的分析算法标识、支持各个算法的分析程序(如SAS软件、R软件等)以及算法之间的接口参数。
S302,根据样本筛选条件获取与样本筛选条件对应的待分析样本的临床信息,并根据待分析样本的临床信息获取相关联的生物信息。
在本发明的实施例中,可通过根据样本筛选条件查询临床信息数据库。具体地,可首先根据样本筛选条件查询临床信息数据库,并获取待分析样本的临床信息。然后根据待分析样本的临床信息查询生物信息数据库中个体生物信息库的索引文件,并根据索引文件获取个体生物信息库中与待分析样本的临床信息对应的生物信息。
S303,根据分析程序参数构建分析任务对待分析样本的临床信息和相关联的生物信息进行分析。
在本发明的一个实施例中,服务器可根据分析程序参数中的分析算法标识调用相应的分析算法,并根据分析程序标识部署到相应的分析程序中,以及根据接口参数设置分析算法的输入输出接口,从而构建分析任务,对待分析样本的临床信息和相关联的生物信息进行分析。
S304,对分析结果进行显著性检验。
S305,如果分析结果不显著,则重置样本筛选条件,并重复步骤b-d,直至分析结果显著。
在根据临床信息对分析结果进行显著性检验中,如果分析结果显著(如显著性检验的P值<0.05或P值<0.01,本发明对具体的显著标准不做限定),则分析结果符合临床分组,得到了合理的科研结论;如分析结果不显著,则不符合临床分组信息,需要重新进行筛选分组并进行分析,例如加大样本容量等,进行循环比对,直到得到符合临床分组信息合理的分析结果,即可获得符合用户分析指令的与疾病相关联的疾病生物标志物、与用药相关联的基因信息等。由此通过大量的分析,获取各种与疾病相关联的疾病生物标志物、与用药相关联的基因信息等,并将这些信息作为与表型信息相关的生物信息进行存储,以不断更新表型相关的生物信息库。
在本发明的实施例中,服务器中具有封装了生物分析算法和程序的神经网络系统。神经网络系统的核心是相关算法和软件,包括相关分析、回归分析、协方差分析、主成分分析、关联分析、核酸序列检索分析、蛋白质检索分析、代谢物检索分析、核酸序列比对分析,蛋白质空间结构信息检索分析、多维定标分析、预测算法分析以及分类算法分析等。神经网络系统可根据分析任务的需要自动选择相应的分析算法构建分析任务。其中,相关分析研究两个变量之间相关的方向和相关的密切程度,主要用于描述变量之间相关性的强度。回归分析主要是通过建立一个变量间相互关系模型,在给定某个或某些变量值的条件下,用于估计或预测其他变量值,即分析变量间的相互依存关系。协方差分析是将直线回归分析与方差分析联合起来的一种统计方法,常用语消除混杂因素的影响,以提高分析结果的可靠性。主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析。关联分析是指如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预测。目的是为了挖掘隐藏在数据间的相互关系。如全基因组关联分析(GenomeWideAssociationStudies,GWAS)是一种检测特定物种中不同个体间的全部或大部分基因,从而了解不同个体间的基因变化有多大的一种方法。不同的变化带来不同的性状,如各种疾病的不同。
为了在分析任务的执行过程中能够及时发现存在的问题,并确定问题原因,服务器还可用于在执行过程中记录执行日志,并对执行状态进行监控,从而能够快速高效的发现并解决问题,保证分析效率和分析结果的准确性。具体地,在执行分析任务过程中,监控分析任务的执行状态,并实时记录执行日志。如果监控到异常状态,则发送异常提示和执行日志,以根据执行日志调整分析任务。
在本发明的实施例中,在执行分析任务的过程中,服务器还可用于输出过程中的中间结果至预设位置,以便于更准确的对分析结果进行全面的了解。
为了实现上述实施例,本发明还提出一种辅助疾病诊疗的分析装置。
图4为根据本发明一个实施例的辅助疾病诊疗的分析装置的结构示意图。
如图4所示,本发明实施例的辅助疾病诊疗的分析装置,包括:接收模块210、获取模块220和分析模块230。
具体地,接收模块210用于接收待分析个体的标识信息。具体地,接收模块210可接收客户端发送的个体的标识信息。其中,待分析个体可为人、动物或者其他生物,例如医院的病人、参与研究的志愿者等。待分析个体的标识信息可为能够唯一标识待分析个体的信息,如个体ID(Identity,身份标识码)、身份证号码等。
获取模块220用于根据待分析个体的标识信息查询临床信息数据库和生物信息数据库以分别获取待分析个体的临床信息和个体生物信息。在本发明的实施例中,生物信息数据库包括个体生物信息库以及表型相关的生物信息库。其中,个体生物信息主要包括基因组信息、蛋白质组信息和代谢组学信息等。基因组信息可包括原始测序信息(碱基序列、碱基质量),比对结果(碱基序列比对到参考基因组上的位置,比对得分)等;蛋白质组信息和代谢组信息可包括通过质谱仪测得的蛋白质、小分子代谢物的数据信息等。临床信息为通过实验和临床观察得到的资料和数据,如人体正常值、心电图、脑电图、器官呈像、病理呈像、临床药物等,可存储在临床表型数据库中。
在本发明的一个实施例中,个体生物信息库与临床信息数据库通过索引文件相关联。其中,个人生物信息库以临床信息数据库的分组信息(如病理呈像、个体的标识信息等)为索引文件,因而,可据此建立个体生物信息库与临床信息数据库的关联关系。从而服务器200可根据待分析个体的标识信息查询临床信息数据库与个体生物信息库以分别获取待分析样本的临床信息和个体生物信息。
在本发明的一个实施例中,临床信息数据库和生物信息数据库可采用分布式部署方案,可与HIS(HospitalInformationSystem,医院信息系统)相连,根据在各个部署节点的数据更新情况,实时更新。临床信息数据库和生物信息数据库还可与样本管理系统相连,从而可通过网络资源,云技术及终端设备访问,方便位于不同地点的生物学医学者研究和使用,其中,样本管理系统是一个对生物样本进行管理的WEB网页系统,该系统以医院的特定需求为前提进行开发。其中,在使用临床信息数据库和生物信息数据库的过程中,可根据每个使用用户的不同权限为该使用用户提供相应的部分数据,从而能够在共享资源的同时有效防止临床信息和生物信息被盗取和泄露,保证了临床信息和生物信息的隐私及安全。
分析模块230用于根据生物信息数据库对待分析个体的个体生物信息进行分析,并根据分析结果获取相应的辅助诊疗信息。在本发明的实施例中,表型相关的生物信息库中的与表型信息相关的生物信息可为疾病生物标志物,例如与疾病相关联的生物标志物信息、与用药相关联的基因信息等。其中,疾病生物标志物(biomarker)是一种生物状态的指示物,是指能够客观反映正常生物学进程、致病机制或对治疗干预的药理学改变的可测定或评估的特征性指标。生物标志物主要可包括易感基因、SNP位点、microRNA、蛋白质、小分子化合物等。
在本发明一个的实施例中,分析模块230可首先根据个体生物信息对生物信息数据库中的表型相关的生物信息库进行核酸检索、蛋白质检索和代谢物检索。如果未检索到相应的核酸、蛋白质和代谢物,则返回分析失败提示。如果在表型相关的生物信息库中检索到相应的核酸,则进一步进行核酸序列比对以确定其基因型、突变情况等;如果检索到相应的蛋白质,则进一步进行蛋白质空间结构信息检索,以确定蛋白质的结构与功能。从而根据上述分析结果确定相应的临床疾病诊断结果、用药方案、基因风险预警、生物标记物风险提示等辅助诊疗信息。如果通过核酸检索、蛋白质检索和代谢物检索后,检索到相应的多个核酸或多个蛋白质或多个代谢物,则可分别对相应的多个核酸或多个蛋白质或多个代谢物进行多维定标分析、预测算法分析或分类算法分析以确定该个体生物信息对应的辅助诊疗信息。
本发明实施例的辅助疾病诊疗的分析装置,可根据待分析个体的标识信息获取相应的临床信息和个体生物信息,并根据生物信息数据库对个体生物信息进行分析获取相应的辅助诊疗结果返回至客户端,从分子水平探讨发病机制,辅助指导临床诊断及治疗,在准确、敏感地评价早期、低水平的损害方面有着独特的优势,并可提供早期基因风险预警,很大程度上为临床医生提供了辅助诊疗的依据。此外,还可移植应用到各种不同复杂疾病研究领域,应用范围广阔。
图5为根据本发明另一个实施例的辅助疾病诊疗的分析装置的结构示意图。
如图5所示,本发明实施例的辅助疾病诊疗的分析装置包括:接收模块210、获取模块220、分析模块230、导入模块240和筛选模块250。
具体地,导入模块240用于将已确定的与表型信息相关的生物信息导入表型相关的生物信息库。在本发明的实施例中,导入模块240可将客户端上传的已确定与表型信息相关的生物信息(如公知的或经研究确认了的与表型信息相关的生物信息)导入表型相关的生物信息库。
筛选模块250用于根据生物信息数据库筛选出疾病生物标志物,并将筛选出的疾病生物标志物作为与表型信息相关的生物信息存储至表型相关的生物信息库。更具体地,图6为根据本发明一个具体实施例的辅助疾病诊疗的分析装置的结构示意图,如图6所示,筛选模块具体包括:接收单元251、获取单元252、分析单元253和显著性检验单元254,其中,
接收单元251用于接收分析指令,其中,分析指令包括样本筛选条件和分析程序参数。在本发明的一个实施例中,样本筛选条件为对临床性状进行描述的信息,疾病生物标志物的筛选分析平台可根据接收到的分析指令对应的疾病构建相应的样本筛选条件,例如,如果接收到对冠心病的分析指令,可构建样本筛选条件:“在2010年患冠心病,且急诊生化检验中血钾指标高于100的病人”。分析程序参数可为用于确定分析待分析样本所用到的分析算法标识、支持各个算法的分析程序(如SAS软件、R软件等)以及算法之间的接口参数。
获取单元252用于根据样本筛选条件获取与样本筛选条件对应的待分析样本的临床信息,并根据待分析样本的临床信息获取相关联的生物信息。在本发明的实施例中,获取单元252可通过根据样本筛选条件查询临床信息数据库。具体地,获取单元252可首先根据样本筛选条件查询临床信息数据库,并获取待分析样本的临床信息。然后根据待分析样本的临床信息查询生物信息数据库中个体生物信息库的索引文件,并根据索引文件获取个体生物信息库中与待分析样本的临床信息对应的生物信息。
分析单元253用于根据分析程序参数构建分析任务对待分析样本的临床信息和相关联的生物信息进行分析。在本发明的一个实施例中,分析单元253可根据分析程序参数中的分析算法标识调用相应的分析算法,并根据分析程序标识部署到相应的分析程序中,以及根据接口参数设置分析算法的输入输出接口,从而构建分析任务,对待分析样本的临床信息和相关联的生物信息进行分析。
显著性检验单元254用于对分析结果进行显著性检验,并在分析结果不显著时,重置样本筛选条件,以再次分析,直至分析结果显著。
在根据临床信息对分析结果进行显著性检验中,如果分析结果显著(如显著性检验的P值<0.05或P值<0.01,本发明对具体的显著标准不做限定),则分析结果符合临床分组,得到了合理的科研结论;如分析结果不显著,则不符合临床分组信息,需要重新进行筛选分组并进行分析,例如加大样本容量等,进行循环比对,直到得到符合临床分组信息合理的分析结果,即可获得符合用户分析指令的与疾病相关联的疾病生物标志物、与用药相关联的基因信息等。由此通过大量的分析,获取各种与疾病相关联的疾病生物标志物、与用药相关联的基因信息等,并将这些信息作为与表型信息相关的生物信息进行存储,以不断更新表型相关的生物信息库。
本发明实施例的辅助疾病诊疗的分析装置,可通过导入已确定的与表型信息相关的生物信息或者筛选疾病生物标志物两种方法获取表型相关的生物信息库中的至少一个与表型信息相关的生物信息,从而建立表型相关的生物信息库,为辅助疾病诊疗的分析提供有利的数据支持和依据。
为了实现上述实施例,本发明还提出一种辅助疾病诊疗的分析方法。
图7为根据本发明一个实施例的辅助疾病诊疗的分析方法的流程图。
如图7所示,根据本发明实施例的辅助疾病诊疗的分析方法,包括:
S701,接收待分析个体的标识信息。
在本发明的实施例中,待分析个体可为人、动物或者其他生物,例如医院的病人、参与研究的志愿者等。待分析个体的标识信息可为能够唯一标识待分析个体的信息,如个体ID(Identity,身份标识码)、身份证号码等。
S702,根据待分析个体的标识信息查询临床信息数据库和生物信息数据库以分别获取待分析个体的临床信息和个体生物信息。
在本发明的实施例中,生物信息数据库包括个体生物信息库以及表型相关的生物信息库。其中,个体生物信息主要包括基因组信息、蛋白质组信息和代谢组学信息等。基因组信息可包括原始测序信息(碱基序列、碱基质量),比对结果(碱基序列比对到参考基因组上的位置,比对得分)等;蛋白质组信息和代谢组信息可包括通过质谱仪测得的蛋白质、小分子代谢物的数据信息等。临床信息为通过实验和临床观察得到的资料和数据,如人体正常值、心电图、脑电图、器官呈像、病理呈像、临床药物等,可存储在临床表型数据库中。
在本发明的一个实施例中,个体生物信息库与临床信息数据库通过索引文件相关联。其中,个人生物信息库以临床信息数据库的分组信息(如病理呈像、个体的标识信息等)为索引文件,因而,可据此建立个体生物信息库与临床信息数据库的关联关系。从而服务器200可根据待分析个体的标识信息查询临床信息数据库与个体生物信息库以分别获取待分析样本的临床信息和个体生物信息。
在本发明的一个实施例中,临床信息数据库和生物信息数据库可采用分布式部署方案,可与HIS(HospitalInformationSystem,医院信息系统)相连,根据在各个部署节点的数据更新情况,实时更新。临床信息数据库和生物信息数据库还可与样本管理系统相连,从而可通过网络资源,云技术及终端设备访问,方便位于不同地点的生物学医学者研究和使用,其中,样本管理系统是一个对生物样本进行管理的WEB网页系统,该系统以医院的特定需求为前提进行开发。其中,在使用临床信息数据库和生物信息数据库的过程中,可根据每个使用用户的不同权限为该使用用户提供相应的部分数据,从而能够在共享资源的同时有效防止临床信息和生物信息被盗取和泄露,保证了临床信息和生物信息的隐私及安全。
S703,根据生物信息数据库对待分析个体的个体生物信息进行分析,并根据分析结果获取相应的辅助诊疗信息。
在本发明的实施例中,表型相关的生物信息库中的与表型信息相关的生物信息可为疾病生物标志物,例如与疾病相关联的生物标志物信息、与用药相关联的基因信息等。其中,疾病生物标志物(biomarker)是一种生物状态的指示物,是指能够客观反映正常生物学进程、致病机制或对治疗干预的药理学改变的可测定或评估的特征性指标。生物标志物主要可包括易感基因、SNP位点、microRNA、蛋白质、小分子化合物等。
在本发明一个的实施例中,可首先根据个体生物信息对生物信息数据库中的表型相关的生物信息库进行核酸检索、蛋白质检索和代谢物检索。如果未检索到相应的核酸、蛋白质和代谢物,则返回分析失败提示。如果在表型相关的生物信息库中检索到相应的核酸,则进一步进行核酸序列比对以确定其基因型、突变情况等;如果检索到相应的蛋白质,则进一步进行蛋白质空间结构信息检索,以确定蛋白质的结构与功能。从而根据上述分析结果确定相应的临床疾病诊断结果、用药方案、基因风险预警、生物标记物风险提示等辅助诊疗信息。如果通过核酸检索、蛋白质检索和代谢物检索后,检索到相应的多个核酸或多个蛋白质或多个代谢物,则可分别对相应的多个核酸或多个蛋白质或多个代谢物进行多维定标分析、预测算法分析或分类算法分析以确定该个体生物信息对应的辅助诊疗信息。
本发明实施例的辅助疾病诊疗的分析方法,可根据待分析个体的标识信息获取相应的临床表型信息和个体生物信息,并根据生物信息数据库对个体生物信息进行分析获取相应的诊疗结果返回至客户端,从分子水平探讨发病机制,辅助指导临床诊断及方案,在准确、敏感地评价早期、低水平的损害方面有着独特的优势,并可提供早期基因风险预警,很大程度上为临床医生提供了辅助诊疗的依据。此外,还可移植应用到各种不同复杂疾病研究领域,应用范围广阔。
在本发明的一个实施例中,在根据本发明实施例的辅助疾病诊疗的分析方法中,通过以下一种或多种方式获取表型相关的生物信息库中的与表型信息相关的生物信息:将客户端上传的已确定与表型信息相关的生物信息(如公知的或经研究确认了的与表型信息相关的生物信息)导入表型相关的生物信息库;和/或根据生物信息数据库筛选出疾病生物标志物,并将筛选出的疾病生物标志物作为与表型信息相关的生物信息存储至表型相关的生物信息库。其中,根据生物信息数据库筛选疾病生物标志物的方法可如图3所示。
在本发明的实施例中,临床信息数据库与个体生物信息库可通过索引信息相关联。图8为根据本发明一个实施例的数据库的关联方法的流程图。如图8所示,本发明实施例的数据库的关联方法,包括:
S801,实时采集多个样本的临床信息,并根据临床信息构建临床信息数据库。
在本发明的一个实施例中,临床信息数据库提供多个数据访问接口,其中,多个数据访问接口分别与多个操作系统相对应,每个数据访问接口用于接收具有相应的操作系统的客户端发送的临床信息。具体地,临床信息数据库可通过分布式部署与多个HIS系统或客户端相连,并分别为每个HIS系统或客户端提供适合的访问接口。进而通过WEB数据录入方式、或者数据库同步方式实时采集HIS系统中的临床信息,也可通过电子数据导入方式接收客户端提交的页面表单,以导入临床信息。
在本发明的一个实施例中,临床信息数据库同时涵盖WEB数据录入、数据录入表格的自动生成、电子数据导入、数据统计分析和报告输出、不良事件报告(在项目使用过程中会出现一些严重性或是一般性的错误,方便进行管理,通过此报告可以很方便的查看系统本身的问题并进行修正)、质量控制(项目管理中的用语,对项目本身来说是一套标准的控制管理流程)、标准化临床词汇的使用(对临床数据进行标准化、规范化,便于查询)、安全和隐私等方案,可适用于各种不同的临床领域,而不需要额外的编程工作。
在本发明的一个实施例中,为了能够建立一套可适配的数据库结构,以使辅助疾病诊疗的分析系统能够针对不同类型的疾病和生物分析需求,临床信息数据库的数据结构中将各个对象的属性在字典表中进行统一的描述,同时对属性可能得取值范围和类型进行了划分。由此,如果需要适应不同研究对象,只需维护这个字典表和字典属性表即可,不需要对表结构做其他调整。其中,字典表和字典属性为对需要查询的属性进行控制管理的可控数据,是属性的查询条件的依据,可通过字典表和字典属性对临床信息数据库进行增、删、改、查。
S802,获取多个样本的生物信息,根据生物信息建立个体生物信息库。
在本发明的一个实施例中,个体生物信息主要包括基因组信息、蛋白质组信息和代谢组学信息等。基因组信息可包括原始测序信息(碱基序列、碱基质量),比对结果(碱基序列比对到参考基因组上的位置,比对得分)等;蛋白质组信息和代谢组信息可包括通过质谱仪测得的蛋白质、小分子代谢物的数据信息等。
S803,获取临床信息数据库的分组信息,并根据临床数据库的分组信息建立个体生物信息的索引信息。
在本发明的一个实施例中,临床信息数据库的分组信息为根据临床信息数据库的数据结构进行分组整理获取的分组信息。例如,根据年龄将1-100之间的个体分为10个年龄组。索引信息为临床信息数据库的分组信息的描述信息,如血钾指标高于100、患冠心病等。
S804,将索引信息存储至生物信息数据库,并根据索引信息建立临床信息数据库与个体生物信息库的关联关系。
本发明实施例的数据库的关联方法,实现了个体生物信息库与临床信息数据库的共享与关联,为辅助疾病诊疗的分析和研究提供了数据支撑和决策支持,同时对临床复杂疾病的研究模式带来方法学上的革命性创新。
图9为根据本发明一个实施例的临床信息的收集与管理示意图。在本发明的一个实施例中,如图9所示,可通过辅助疾病诊疗的分析系统检索、浏览临床信息数据库中的临床信息及临床分组信息(如根据检查时间、检测项目、诊断结果、病例、病人基本信息等进行分组后的临床分组信息),还可对临床信息进行分组统计。临床信息数据库可通过调用webservice接口或者通过数据库同步直接从HIS系统中导入临床信息,也可由用户通过页面表单提交临床信息。
图10为根据本发明一个实施例的辅助疾病诊疗的分析系统的架构图,如图10所示,该辅助疾病诊疗的分析系统的包括用户层(代表用户)、应用服务互联网层(基本的网络环境)、基本的业务系统(存储服务的一些硬件设备)、和业务服务平台中的基本功能模块(平台包括的基本业务支撑功能)、再到外部系统(第三方或是其它的系统接口等)。
图11为根据本发明一个实施例的搜索引擎建立机制的示意图。如图11所示,该搜索引擎建立机制包括两部分:第一部分是基本的信息管理,数据库中存储大量的医院系统中可分析的数据,或是有一些文件存储方式,这些数据的来源有可能是人工录入,有可能是自动化生成的,该系统供用户方便的检索、查询,对于一些复杂的检索需要计算机程序进行高效的处理,得到的结果一并参与检索。第二部分是对于一些数据文件或是搜索结果的索引,在这两种方式之上建立一套标准的索引机制,对于后续的分析、统计、查询能方便快捷高效的进行。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。