CN104573404B - 一种心肌病基因数据处理方法及装置 - Google Patents

一种心肌病基因数据处理方法及装置 Download PDF

Info

Publication number
CN104573404B
CN104573404B CN201410827322.3A CN201410827322A CN104573404B CN 104573404 B CN104573404 B CN 104573404B CN 201410827322 A CN201410827322 A CN 201410827322A CN 104573404 B CN104573404 B CN 104573404B
Authority
CN
China
Prior art keywords
gene
data
cardiomyopathy
expression
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410827322.3A
Other languages
English (en)
Other versions
CN104573404A (zh
Inventor
周丰丰
孙国权
麦国琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201410827322.3A priority Critical patent/CN104573404B/zh
Publication of CN104573404A publication Critical patent/CN104573404A/zh
Application granted granted Critical
Publication of CN104573404B publication Critical patent/CN104573404B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明实施例公开了一种心肌病基因数据处理方法及装置,其中所述心肌病基因数据处理方法包括:获取样本基因表达谱;对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量;获取预先设定的筛选算法;通过筛选算法,在基因数据中筛选出共表达基因对数据;确定共表达基因对数据为心肌病生物标志物。采用本发明实施例,将共表达基因对数据确定为心肌病生物标志物,可以提高心肌病患者的识别精准度。

Description

一种心肌病基因数据处理方法及装置
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种心肌病基因数据处理方法及装置。
背景技术
心肌病是一组由于心脏下部分腔室(即心室)的结构改变和心肌壁功能受损导致心脏功能进行性障碍的病变,其发病机理至今尚未完全明确。缺血性心肌病(ischemiccardiomyopathy,ICM),是指由于冠状动脉粥样硬化引起长期心肌缺血,导致心肌局限性或弥漫性纤维化,产生与原发性扩张型心肌病类似的临床综合征,如心脏收缩或舒张功能受损、心脏扩大或僵硬、心绞痛、心力衰竭或心律失常等一系列临床表现。特发性心肌病(idiopathic cardiomyopathy),可分为扩张性心肌病、肥厚性心肌病以及缩窄性心肌病,主要是由于左心室扩张,心室舒张末期容量增加,导致心肌收缩功能障碍。该病的临床表现有心脏扩大,心力衰竭,常有心律失常及栓塞发生等。
目前,生物标志物对心肌病的诊断具有重要意义。人类心肌病转录组的研究表明,有一系列的基因与心脏衰竭有关。Hannenhalli等人研究表明,与正常人相比,有1020个基因在缺血性心肌病(ischemic cardiomyopathy)病人中差异表达,有1002个基因在特发性心肌病(idiopathic cardiomyopathies)病人中差异表达。但是已有生物标记物之间是独立的,没有考虑基因之间的相互联系。然而,生物体本身是一个完整的系统,各个基因之间是存在联系的。不考虑基因之间的联系,很难反映心肌病患者的真实情况。
发明内容
本发明实施例提供一种心肌病基因数据处理方法及装置,将共表达基因对数据确定为心肌病生物标志物,可以提高心肌病患者的识别精准度。
本发明实施例提供了一种心肌病基因数据处理方法,包括:
获取样本基因表达谱;
对所述样本基因表达谱进行分析,以获取对应的基因数据,各个所述基因数据包括若干基因的基因表达量;
获取预先设定的筛选算法;
通过所述筛选算法,在所述基因数据中筛选出共表达基因对数据;
确定所述共表达基因对数据为心肌病生物标志物。
相应地,本发明实施例还提供了一种心肌病基因数据处理装置,包括:
第一获取单元,用于获取样本基因表达谱;
分析单元,用于对所述样本基因表达谱进行分析,以获取对应的基因数据,各个所述基因数据包括若干基因的基因表达量;
第二获取单元,用于获取预先设定的筛选算法;
筛选单元,用于通过所述筛选算法,在所述基因数据中筛选出共表达基因对数据;
确定单元,用于确定所述共表达基因对数据为心肌病生物标志物。
实施本发明实施例,对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量,通过预先设定的筛选算法,在基因数据中筛选出共表达基因对数据,确定共表达基因对数据为心肌病生物标志物,可以提高心肌病患者的识别精准度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例中提供的一种心肌病基因数据处理方法的流程示意图;
图2是本发明第二实施例中提供的一种心肌病基因数据处理方法的流程示意图;
图3是本发明第三实施例中提供的一种心肌病基因数据处理方法的流程示意图;
图4是本发明第四实施例中提供的一种心肌病基因数据处理方法的流程示意图;
图5A是本发明实施例中提供的一种非心肌病患者对应的共表达基因对的效果示意图;
图5B是本发明实施例中提供的一种特发性心肌病患者对应的共表达基因对的效果示意图;
图6A是本发明实施例中提供的另一种非心肌病患者对应的共表达基因对的效果示意图;
图6B是本发明实施例中提供的另一种特发性心肌病患者对应的共表达基因对的效果示意图;
图7是本发明实施例中提供的一种心肌病基因数据处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种心肌病基因数据处理方法,对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量,通过预先设定的筛选算法,在基因数据中筛选出共表达基因对数据,确定共表达基因对数据为心肌病生物标志物,可以提高心肌病患者的识别精准度。
本发明实施例中的心肌病基因数据处理装置可以运行在PC(personal computer,个人计算机)、穿戴式智能设备或者医疗设备等电子设备中。
请参见图1,图1是本发明第一实施例中提供的一种心肌病基因数据处理方法的流程示意图,如图所示本发明实施例中的心肌病基因数据处理方法可以包括:
S101,获取样本基因表达谱。
心肌病基因数据处理装置可以获取样本基因表达谱。例如,可以通过平台GPL96,从GEO(gene expression omnibus,高通量基因表达)数据库中获取数据集GSE5406,数据集GSE5406可以包括样本基因表达谱。其中平台GPL96是人类基因芯片平台。又如,可以在本地的基因表达谱数据库中获取样本基因表达谱,其中基因表达谱数据库中存储了若干基因表达谱。
可选的,心肌病基因数据处理装置获取到的样本基因表达谱可以包括缺血性心肌病患者、特发性心肌病患者以及非心肌病患者的基因表达谱。示例性的,样本基因表达谱可以包括108个缺血性心肌病患者、86个特发性心肌病患者以及16个非心肌病患者的基因表达谱。
S102,对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量。
心肌病基因数据处理装置获取到样本基因表达谱之后,可以对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量。例如,心肌病基因数据处理装置可以对样本基因表达谱进行RMA(Robust Multichip Average,鲁棒的多芯片平均)标准化处理,以获取对应的基因数据。RMA标准化处理,即通过ExpressionConsole软件将样本基因表达谱经RMA算法预处理,转化成基因数据的过程。
例如,心肌病基因数据处理装置对108个缺血性心肌病患者、86个特发性心肌病患者以及16个非心肌病患者的基因表达谱进行分析,以获取各个基因表达谱对应的基因数据。
S103,获取预先设定的筛选算法。
心肌病基因数据处理装置可以获取预先设定的筛选算法。示例性的,筛选算法可以为:
max(T(i,j))-min(T(i,j))<δ;
其中,T(i,j)=X(i,k)/X(j,k),k=1,2…N,X(i,k)表示基因i的第k个样本的基因表达量,X(j,k)表示基因j的第k个样本的基因表达量,δ表示基因i和基因j的近似程度。
S104,通过筛选算法,在基因数据中筛选出共表达基因对数据。
心肌病基因数据处理装置可以通过筛选算法,在基因数据中筛选出共表达基因对数据。可选的,可以通过筛选算法,在包括非心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第一共表达基因对数据;通过筛选算法,在包括缺血性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第二共表达基因对数据;通过筛选算法,在包括特发性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第三共表达基因对数据。
例如,当δ=0.03时,心肌病基因数据处理装置可以在16个非心肌病患者的基因表达谱对应的基因数据中筛选出第一共表达基因对数据,其中第一共表达基因对数据包括85326个共表达基因对。心肌病基因数据处理装置可以在108个缺血性心肌病患者的基因表达谱对应的基因数据中筛选出第二共表达基因对数据,其中第二共表达基因对数据包括72个共表达基因对。心肌病基因数据处理装置可以在86个缺血性心肌病患者的基因表达谱对应的基因数据中筛选出第三共表达基因对数据,其中第三共表达基因对数据包括368个共表达基因对。
示例性的,心肌病基因数据处理装置获取到16个非心肌病患者的基因表达谱对应的基因数据之后,可以获取基因i的第k个样本的基因表达量,即X(i,k),获取基因j的第k个样本的基因表达量,即X(j,k),并获取第k个样本中基因i的基因表达量与基因j的基因表达量的比值,即T(i,j),其中k=1,2…16,进而获取数值最大的T(i,j),即max(T(i,j)),数值最小的T(i,j),即min(T(i,j)),若满足筛选算法max(T(i,j))-min(T(i,j))<δ,则基因对(i,j)为共表达基因对。优选的,δ=0.03。
S105,确定共表达基因对数据为心肌病生物标志物。
心肌病基因数据处理装置筛选出共表达基因对数据之后,可以确定共表达基因对数据为心肌病生物标志物。进一步的,心肌病基因数据处理装置可以将第二共表达基因对数据和第三共表达基因对数据确定为心肌病生物标志物。例如,16个非心肌病患者的基因表达谱对应的基因数据中,存在85326个共表达基因对;86个特发性心肌病患者的基因表达谱对应的基因数据中,存在368个心肌病生物标志物;108个缺血性心肌病患者的基因表达谱对应的基因数据中,存在72个心肌病生物标志物。由此可见,非心肌病患者、特发性心肌病患者以及缺血性心肌病患者体内的稳态显著不同,非心肌病患者的共表达基因对的个数大于缺血性心肌病患者的共表达基因对的个数,缺血性心肌病患者的共表达基因对的个数大于特发性心肌病患者的共表达基因对的个数,非心肌病患者的调节系统比心肌病患者的调节系统更加稳定。
在可选实施例中,心肌病基因数据处理装置可以在上述基因数据中获取关于心脏肌肉收缩和心肌病的基因数据,并在共表达基因对数据中,获取包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据。进一步可选的,还可以将包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据确定为心肌病生物标志物。
以图5A所示的非心肌病患者对应的共表达基因对的效果示意图为例,16个非心肌病患者对应的共表达基因对包括85326个,心肌病基因数据处理装置通过KEGG(京都基因与基因组百科全书)数据库和Cytoscape软件分析得到,85326个共表达基因对涉及的基因中关于心脏肌肉收缩和心肌病的基因有56个,例如ACTC1、CACNA1D、COX5A、COX5B、COX6C、COX7B、TPM1以及UQCRFS1等,关于心脏肌肉收缩和心肌病的基因与其他基因形成的共表达基因对有4574个。其中灰色的圆形部分表示56个关于心脏肌肉收缩和心肌病的基因,圆形部分之外的灰色部分表示关于心脏肌肉收缩和心肌病的基因与其他基因形成4574个共表达基因对。
以图5B所示的特发性心肌病患者对应的共表达基因对的效果示意图为例,86个特发性心肌病患者对应的共表达基因对包括368个,368个共表达基因对涉及的基因中关于心脏肌肉收缩和心肌病的基因有6个,包括TPM1、COX7C、COX7B、COX6C、UQCRFS1以及COX5B,关于心脏肌肉收缩和心肌病的基因与其他基因形成的共表达基因对有25个,心肌病基因数据处理装置可以将包括该25个共表达基因对的共表达基因对数据确定为心肌病生物标志物。其中灰色部分为6个关于心脏肌肉收缩和心肌病的基因,关于心脏肌肉收缩和心肌病的基因与其他基因形成25个共表达基因对。
例如,108个缺血性心肌病患者对应的共表达基因对包括72个,72个共表达基因对涉及的基因中不存在关于心脏肌肉收缩和心肌病的基因。由此可见,非心肌病患者、特发性心肌病患者以及缺血性心肌病患者体内的稳态显著不同,非心肌病患者中包括关于心脏肌肉收缩和心肌病的基因的共表达基因对的个数,大于特发性心肌病患者中包括关于心脏肌肉收缩和心肌病的基因的共表达基因对的个数,特发性心肌病患者中包括关于心脏肌肉收缩和心肌病的基因的共表达基因对的个数,大于缺血性心肌病患者中包括关于心脏肌肉收缩和心肌病的基因的共表达基因对的个数。非心肌病患者的心脏调节系统比特发性心肌病患者的心脏调节系统更加稳健,由此可以表明特发性心肌病患者的发病机理:特发性心肌病患者的心脏调节系统的稳健性低于非心肌病患者的心脏调节系统,这可能是导致特发性心肌病病人心脏扩大,心力衰竭,心律失常等临床症状的重要原因。缺血性心肌病患者的基因表达谱对应的基因数据中不存在关于心脏肌肉收缩和心肌病的基因数据,由此可以表明缺血性心肌病患者的发病机理:可能是由于冠状动脉粥样硬化长期心肌缺血,导致心肌功能受损,从而造成心肌相关基因表达的失调和紊乱。
在可选实施例中,心肌病基因数据处理装置可以在上述基因数据中获取关于生物代谢过程的基因数据,并在共表达基因对数据中,获取包括关于生物代谢过程的基因数据的共表达基因对数据。进一步可选的,还可以将包括关于生物代谢过程的基因数据的共表达基因对数据确定为心肌病生物标志物。
以图6A所示的非心肌病患者对应的共表达基因对的效果示意图为例,16个非心肌病患者对应的共表达基因对包括85326个,心肌病基因数据处理装置通过KEGG数据库和Cytoscape软件分析得到,85326个共表达基因对涉及的基因中关于生物代谢过程的基因有216个,关于生物代谢过程的基因与其他基因形成的共表达基因对有6841个。其中灰色的圆形部分表示216个关于生物代谢过程的基因,圆形部分之外的灰色部分表示关于生物代谢过程的基因与其他基因形成6841个共表达基因对。
例如,108个缺血性心肌病患者对应的共表达基因对包括72个,72个共表达基因对涉及的基因中关于生物代谢过程的基因有18个,关于生物代谢过程的基因与其他基因形成的共表达基因对有70个,心肌病基因数据处理装置可以将包括该70个共表达基因对的共表达基因对数据确定为心肌病生物标志物。
以图6B所示的特发性心肌病患者对应的共表达基因对的效果示意图为例,86个特发性心肌病患者对应的共表达基因对包括368个,368个共表达基因对涉及的基因中关于生物代谢过程的基因有2个,关于生物代谢过程的基因与其他基因形成的共表达基因对有5个,心肌病基因数据处理装置可以将包括该5个共表达基因对的共表达基因对数据确定为心肌病生物标志物。其中灰色部分为2个关于生物代谢过程的基因,关于生物代谢过程的基因与其他基因形成25个共表达基因对。
由此可见,非心肌病患者、特发性心肌病患者以及缺血性心肌病患者的生物代谢系统显著不同。
本发明实施例可以根据筛选得到的共表达基因对数据,进行生物功能及生物网络分析,以便于获取心肌病生物标志物,用于识别非心肌病患者、缺血性心肌病患者以及特发性心肌病患者,并研究缺血性心肌病患者和特发性心肌病患者的发病机理。
本发明实施例通过研究结果还可以表明:非心肌病患者、缺血性心肌病患者和特发性心肌病患者的基因表达谱对应的共表达基因对数据中,包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据有着显著区别,包括关于生物代谢过程的基因数据的共表达基因对数据有着显著区别,关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据可以作为识别非心肌病患者、缺血性心肌病患者和特发性心肌病患者的心肌病生物标志物,关于生物代谢过程的共表达基因对数据可以作为区分非心肌病患者、缺血性心肌病患者和特发性心肌病患者的心肌病生物标志物。
在图1所示的心肌病基因数据处理方法中,对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量,通过预先设定的筛选算法,在基因数据中筛选出共表达基因对数据,确定共表达基因对数据为心肌病生物标志物,可以提高心肌病患者的识别精准度。
请参见图2,图2是本发明第二实施例中提供的一种心肌病基因数据处理方法的流程示意图,如图所示本发明实施例中的心肌病基因数据处理方法可以包括:
S201,通过平台GPL96,从GEO数据库中获取数据集GSE5406。
心肌病基因数据处理装置可以通过平台GPL96,从GEO数据库中获取数据集GSE5406,数据集GSE5406可以包括样本基因表达谱。其中平台GPL96是人类基因芯片平台。
可选的,心肌病基因数据处理装置获取到的样本基因表达谱可以包括缺血性心肌病患者、特发性心肌病患者以及非心肌病患者的基因表达谱。示例性的,样本基因表达谱可以包括108个缺血性心肌病患者、86个特发性心肌病患者以及16个非心肌病患者的基因表达谱。
S202,对数据集中的样本基因表达谱,进行RMA标准化处理,以获取对应的基因数据。
心肌病基因数据处理装置可以对样本基因表达谱进行RMA标准化处理,以获取对应的基因数据。RMA标准化处理,即通过Expression Console软件将样本基因表达谱经RMA算法预处理,转化成基因数据的过程。例如,心肌病基因数据处理装置对108个缺血性心肌病患者、86个特发性心肌病患者以及16个非心肌病患者的基因表达谱进行分析,以获取各个基因表达谱对应的基因数据。
S203,获取预先设定的筛选算法。
心肌病基因数据处理装置可以获取预先设定的筛选算法。示例性的,筛选算法可以为:
max(T(i,j))-min(T(i,j))<δ;
其中,T(i,j)=X(i,k)/X(j,k),k=1,2…N,X(i,k)表示基因i的第k个样本的基因表达量,X(j,k)表示基因j的第k个样本的基因表达量,δ表示基因i和基因j的近似程度。δ可以是预先设定的数值,优选的,δ=0.03。
S204,通过筛选算法,在基因数据中筛选出共表达基因对数据。
心肌病基因数据处理装置可以通过筛选算法,在基因数据中筛选出共表达基因对数据。可选的,可以通过筛选算法,在包括非心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第一共表达基因对数据;通过筛选算法,在包括缺血性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第二共表达基因对数据;通过筛选算法,在包括特发性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第三共表达基因对数据。
例如,当δ=0.03时,心肌病基因数据处理装置可以在16个非心肌病患者的基因表达谱对应的基因数据中筛选出第一共表达基因对数据,其中第一共表达基因对数据包括85326个共表达基因对。心肌病基因数据处理装置可以在86个特发性心肌病患者的基因表达谱对应的基因数据中筛选出第三共表达基因对数据,其中第三共表达基因对数据包括368个共表达基因对。心肌病基因数据处理装置可以在108个缺血性心肌病患者的基因表达谱对应的基因数据中筛选出第二共表达基因对数据,其中第二共表达基因对数据包括72个共表达基因对。
示例性的,心肌病基因数据处理装置获取到16个非心肌病患者的基因表达谱对应的基因数据之后,可以获取基因i的第k个样本的基因表达量,即X(i,k),获取基因j的第k个样本的基因表达量,即X(j,k),并获取第k个样本中基因i的基因表达量与基因j的基因表达量的比值,即T(i,j),其中k=1,2…16,进而获取数值最大的T(i,j),即max(T(i,j)),数值最小的T(i,j),即min(T(i,j)),若满足筛选算法max(T(i,j))-min(T(i,j))<δ,则基因对(i,j)为共表达基因对。优选的,δ=0.03。
S205,确定共表达基因对数据为心肌病生物标志物。
心肌病基因数据处理装置筛选出共表达基因对数据之后,可以确定共表达基因对数据为心肌病生物标志物。进一步的,心肌病基因数据处理装置可以将第二共表达基因对数据和第三共表达基因对数据确定为心肌病生物标志物。例如,16个非心肌病患者的基因表达谱对应的基因数据中,存在85326个共表达基因对;86个特发性心肌病患者的基因表达谱对应的基因数据中,存在368个心肌病生物标志物;108个缺血性心肌病患者的基因表达谱对应的基因数据中,存在72个心肌病生物标志物。由此可见,非心肌病患者的共表达基因对的个数大于缺血性心肌病患者的共表达基因对的个数,缺血性心肌病患者的共表达基因对的个数大于特发性心肌病患者的共表达基因对的个数,心肌病生物标志物可以用于识别非心肌病患者、特发性心肌病患者以及缺血性心肌病患者,非心肌病患者、特发性心肌病患者以及缺血性心肌病患者体内的稳态显著不同,非心肌病患者的调节系统比心肌病患者的调节系统更加稳定。
在图2所示的心肌病基因数据处理方法中,通过平台GPL96,从GEO数据库中获取数据集GSE5406,对数据集中的样本基因表达谱,进行RMA标准化处理,以获取对应的基因数据,通过预先设定的筛选算法,在基因数据中筛选出共表达基因对数据,确定共表达基因对数据为心肌病生物标志物,可以提高心肌病患者的识别精准度。
请参见图3,图3是本发明第三实施例中提供的一种心肌病基因数据处理方法的流程示意图,如图所示本发明实施例中的心肌病基因数据处理方法可以包括:
S301,获取样本基因表达谱。
心肌病基因数据处理装置可以获取样本基因表达谱。例如,可以通过平台GPL96,从GEO(gene expression omnibus,高通量基因表达)数据库中获取数据集GSE5406,数据集GSE5406可以包括样本基因表达谱。其中平台GPL96是人类基因芯片平台。又如,可以在本地的基因表达谱数据库中获取样本基因表达谱,其中基因表达谱数据库中存储了若干基因表达谱。
可选的,心肌病基因数据处理装置获取到的样本基因表达谱可以包括缺血性心肌病患者、特发性心肌病患者以及非心肌病患者的基因表达谱。示例性的,样本基因表达谱可以包括108个缺血性心肌病患者、86个特发性心肌病患者以及16个非心肌病患者的基因表达谱。
S302,对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量。
心肌病基因数据处理装置获取到样本基因表达谱之后,可以对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量。例如,心肌病基因数据处理装置可以对样本基因表达谱进行RMA标准化处理,以获取对应的基因数据。RMA标准化处理,即通过Expression Console软件将样本基因表达谱经RMA算法预处理,转化成基因数据的过程。
例如,心肌病基因数据处理装置对108个缺血性心肌病患者、86个特发性心肌病患者以及16个非心肌病患者的基因表达谱进行分析,以获取各个基因表达谱对应的基因数据。
S303,获取预先设定的筛选算法。
心肌病基因数据处理装置可以获取预先设定的筛选算法。示例性的,筛选算法可以为:
max(T(i,j))-min(T(i,j))<δ;
其中,T(i,j)=X(i,k)/X(j,k),k=1,2…N,X(i,k)表示基因i的第k个样本的基因表达量,X(j,k)表示基因j的第k个样本的基因表达量,δ表示基因i和基因j的近似程度。
S304,通过筛选算法,在基因数据中筛选出共表达基因对数据。
心肌病基因数据处理装置可以通过筛选算法,在基因数据中筛选出共表达基因对数据。例如,心肌病基因数据处理装置可以在16个非心肌病患者的基因表达谱对应的基因数据中筛选出第一共表达基因对数据,其中第一共表达基因对数据包括85326个共表达基因对。心肌病基因数据处理装置可以在86个特发性心肌病患者的基因表达谱对应的基因数据中筛选出第三共表达基因对数据,其中第三共表达基因对数据包括368个共表达基因对。心肌病基因数据处理装置可以在108个缺血性心肌病患者的基因表达谱对应的基因数据中筛选出第二共表达基因对数据,其中第二共表达基因对数据包括72个共表达基因对。
S305,在基因数据中获取关于心脏肌肉收缩和心肌病的基因数据。
心肌病基因数据处理装置可以在上述基因数据中获取关于心脏肌肉收缩和心肌病的基因数据。例如,16个非心肌病患者对应的共表达基因对包括85326个,心肌病基因数据处理装置通过KEGG数据库和Cytoscape软件分析得到,85326个共表达基因对涉及的基因中关于心脏肌肉收缩和心肌病的基因有56个,例如ACTC1、CACNA1D、COX5A、COX5B、COX6C、COX7B、TPM1以及UQCRFS1等,心肌病基因数据处理装置获取到的基因数据包括上述56个基因。86个特发性心肌病患者对应的共表达基因对包括368个,368个共表达基因对涉及的基因中关于心脏肌肉收缩和心肌病的基因有6个,包括TPM1、COX7C、COX7B、COX6C、UQCRFS1以及COX5B,心肌病基因数据处理装置获取到的基因数据包括上述6个基因。108个缺血性心肌病患者对应的共表达基因对包括72个,72个共表达基因对涉及的基因中不存在关于心脏肌肉收缩和心肌病的基因。
S306,在共表达基因对数据中,获取包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据。
心肌病基因数据处理装置可以在共表达基因对数据中,获取包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据。
以图5A所示的非心肌病患者对应的共表达基因对的效果示意图为例,16个非心肌患者对应的85326个共表达基因对涉及的基因中,关于心脏肌肉收缩和心肌病的基因有56个,关于心脏肌肉收缩和心肌病的基因与其他基因形成的共表达基因对有4574个,心肌病基因数据处理装置可以在上述共表达基因对数据中获取包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据,其中包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据包括4574个共表达基因对。其中灰色的圆形部分表示56个关于心脏肌肉收缩和心肌病的基因,圆形部分之外的灰色部分表示关于心脏肌肉收缩和心肌病的基因与其他基因形成4574个共表达基因对。
以图5B所示的非心肌病患者对应的共表达基因对的效果示意图为例,86个特发性心肌病患者对应的368个共表达基因对涉及的基因中,关于心脏肌肉收缩和心肌病的基因有6个,关于心脏肌肉收缩和心肌病的基因与其他基因形成的共表达基因对有25个,心肌病基因数据处理装置可以在上述共表达基因对数据中获取包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据,其中包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据包括25个共表达基因对。其中灰色部分为6个关于心脏肌肉收缩和心肌病的基因,关于心脏肌肉收缩和心肌病的基因与其他基因形成25个共表达基因对。
例如,108个缺血性心肌病患者对应的72个共表达基因对涉及的基因中不存在关于心脏肌肉收缩和心肌病的基因。
S307,确定包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据为心肌病生物标志物。
心肌病基因数据处理装置可以确定包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据为心肌病生物标志物。例如,86个特发性心肌病患者对应的368个共表达基因对中,包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对有25个,心肌病基因数据处理装置可以确定包括该25个共表达基因对的共表达基因数据为心肌病生物标志物。
由此可知,非心肌病患者中包括关于心脏肌肉收缩和心肌病的基因的共表达基因对的个数,大于特发性心肌病患者中包括关于心脏肌肉收缩和心肌病的基因的共表达基因对的个数,特发性心肌病患者中包括关于心脏肌肉收缩和心肌病的基因的共表达基因对的个数,大于缺血性心肌病患者中包括关于心脏肌肉收缩和心肌病的基因的共表达基因对的个数。
非心肌病患者的心脏调节系统比特发性心肌病患者的心脏调节系统更加稳健,由此可以表明特发性心肌病患者的发病机理:特发性心肌病患者的心脏调节系统的稳健性低于非心肌病患者的心脏调节系统,这可能是导致特发性心肌病病人心脏扩大,心力衰竭,心律失常等临床症状的重要原因。
缺血性心肌病患者的基因表达谱对应的基因数据中不存在关于心脏肌肉收缩和心肌病的基因数据,由此可以表明缺血性心肌病患者的发病机理:可能是由于冠状动脉粥样硬化长期心肌缺血,导致心肌功能受损,从而造成心肌相关基因表达的失调和紊乱。
本发明实施例通过研究结果可以表明:非心肌病患者、缺血性心肌病患者和特发性心肌病患者的基因表达谱对应的共表达基因对数据中,包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据有着显著区别,关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据可以作为识别非心肌病患者、缺血性心肌病患者和特发性心肌病患者的心肌病生物标志物,并研究缺血性心肌病患者和特发性心肌病患者的发病机理。
在图3所示的心肌病基因数据处理方法中,对样本基因表达谱进行分析,以获取对应的基因数据,通过预先设定的筛选算法,在基因数据中筛选出共表达基因对数据,在基因数据中获取关于心脏肌肉收缩和心肌病的基因数据,在共表达基因对数据中,获取包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据,可以提高心肌病患者的识别精准度。
请参见图4,图4是本发明第四实施例中提供的一种心肌病基因数据处理方法的流程示意图,如图所示本发明实施例中的心肌病基因数据处理方法可以包括:
S401,获取样本基因表达谱。
S402,对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量。
S403,获取预先设定的筛选算法。
S404,通过筛选算法,在基因数据中筛选出共表达基因对数据。
S401~S404具体可以参考第三实施例中的S301~S304,具体不再赘述。
S405,在基因数据中获取关于生物代谢过程的基因数据。
心肌病基因数据处理装置可以在上述基因数据中获取关于生物代谢过程的基因数据。例如,16个非心肌病患者对应的共表达基因对包括85326个,心肌病基因数据处理装置通过KEGG数据库和Cytoscape软件分析得到,85326个共表达基因对涉及的基因中关于生物代谢过程的基因有216个,心肌病基因数据处理装置获取到的基因数据包括上述216个基因。108个缺血性心肌病患者对应的共表达基因对包括72个,72个共表达基因对涉及的基因中关于生物代谢过程的基因有18个,心肌病基因数据处理装置获取到的基因数据包括上述18个基因。86个特发性心肌病患者对应的共表达基因对包括368个,368个共表达基因对涉及的基因中关于生物代谢过程的基因有2个,心肌病基因数据处理装置获取到的基因数据包括上述2个基因。
S406,在共表达基因对数据中,获取包括关于生物代谢过程的基因数据的共表达基因对数据。
心肌病基因数据处理装置可以在共表达基因对数据中,获取包括关于生物代谢过程的基因数据的共表达基因对数据。
以图6A所示的非心肌病患者对应的共表达基因对的效果示意图为例,16个非心肌患者对应的85326个共表达基因对涉及的基因中,关于生物代谢过程的基因有216个,关于生物代谢过程的基因与其他基因形成的共表达基因对有6841个,心肌病基因数据处理装置可以在上述共表达基因对数据中获取包括关于生物代谢过程的基因数据的共表达基因对数据,其中包括关于生物代谢过程的基因数据的共表达基因对数据包括6841个共表达基因对。其中灰色的圆形部分表示216个关于生物代谢过程的基因,圆形部分之外的灰色部分表示关于生物代谢过程的基因与其他基因形成6841个共表达基因对。
例如,108个缺血性心肌病患者对应的72个共表达基因对涉及的基因中关于生物代谢过程的基因有18个,关于生物代谢过程的基因与其他基因形成的共表达基因对有70个,心肌病基因数据处理装置可以在上述共表达基因对数据中获取包括关于生物代谢过程的基因数据的共表达基因对数据,其中包括关于生物代谢过程的基因数据的共表达基因对数据包括70个共表达基因对。
以图6B所示的特发性心肌病患者对应的共表达基因对的效果示意图为例,86个特发性心肌病患者对应的368个共表达基因对涉及的基因中,关于生物代谢过程的基因有2个,关于生物代谢过程的基因与其他基因形成的共表达基因对有5个,心肌病基因数据处理装置可以在上述共表达基因对数据中获取包括关于生物代谢过程的基因数据的共表达基因对数据,其中包括关于生物代谢过程的基因数据的共表达基因对数据包括5个共表达基因对。其中灰色部分为2个关于生物代谢过程的基因,关于生物代谢过程的基因与其他基因形成25个共表达基因对。
S407,确定关于生物代谢过程的基因数据的共表达基因对数据为心肌病生物标志物。
心肌病基因数据处理装置可以确定包括关于生物代谢过程的基因数据的共表达基因对数据为心肌病生物标志物。例如,108个特发性心肌病患者对应的72个共表达基因对中,包括关于生物代谢过程的基因数据的共表达基因对有70个,心肌病基因数据处理装置可以确定包括该70个共表达基因对的共表达基因数据为心肌病生物标志物。86个特发性心肌病患者对应的368个共表达基因对中,包括关于生物代谢过程的基因数据的共表达基因对有5个,心肌病基因数据处理装置可以确定包括该5个共表达基因对的共表达基因数据为心肌病生物标志物。
由此可知,非心肌病患者中包括关于生物代谢过程的基因的共表达基因对的个数,大于特发性心肌病患者中包括关于生物代谢过程的基因的共表达基因对的个数,特发性心肌病患者中包括关于生物代谢过程的基因的共表达基因对的个数,大于缺血性心肌病患者中包括关于生物代谢过程的基因的共表达基因对的个数。
本发明实施例通过研究结果可以表明:非心肌病患者、缺血性心肌病患者和特发性心肌病患者的基因表达谱对应的共表达基因对数据中,包括关于生物代谢过程的基因数据的共表达基因对数据有着显著区别,关于生物代谢过程的基因数据的共表达基因对数据可以作为识别非心肌病患者、缺血性心肌病患者和特发性心肌病患者的心肌病生物标志物。
在图4所示的心肌病基因数据处理方法中,对样本基因表达谱进行分析,以获取对应的基因数据,通过预先设定的筛选算法,在基因数据中筛选出共表达基因对数据,在基因数据中获取关于生物代谢过程的基因数据,在共表达基因对数据中,获取包括关于生物代谢过程的基因数据的共表达基因对数据,确定共表达基因对数据为心肌病生物标志物,可以提高心肌病患者的识别精准度。
请参见图7,图7是本发明实施例中提供的一种心肌病基因数据处理装置的结构示意图,如图所示本发明实施例中的心肌病基因数据处理装置700至少可以包括第一获取单元701、分析单元702、第二获取单元703、筛选单元704以及确定单元705,其中:
第一获取单元701,用于获取样本基因表达谱。样本基因表达谱可以包括缺血性心肌病患者、特发性心肌病患者以及非心肌病患者的基因表达谱。示例性的,第一获取单元701可以获取108个缺血性心肌病患者、86个特发性心肌病患者以及16个非心肌病患者的基因表达谱。
分析单元702,用于对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量。
例如,分析单元702对108个缺血性心肌病患者、86个特发性心肌病患者以及16个非心肌病患者的基因表达谱进行分析,以获取各个基因表达谱对应的基因数据。
第二获取单元703,用于获取预先设定的筛选算法。
筛选单元704,用于通过筛选算法,在基因数据中筛选出共表达基因对数据。
示例性的,分析单元702获取到16个非心肌病患者的基因表达谱对应的基因数据之后,可以获取基因i的第k个样本的基因表达量,即X(i,k),获取基因j的第k个样本的基因表达量,即X(j,k),并获取第k个样本中基因i的基因表达量与基因j的基因表达量的比值,即T(i,j),其中k=1,2…16,进而获取数值最大的T(i,j),即max(T(i,j)),数值最小的T(i,j),即min(T(i,j)),若满足筛选算法max(T(i,j))-min(T(i,j))<δ,则筛选单元704筛选出基因对(i,j)为共表达基因对。优选的,δ=0.03。
确定单元705,用于确定共表达基因对数据为心肌病生物标志物。
作为一种可选的实施方式,第一获取单元701,用于通过平台GPL96,从GEO数据库中获取数据集GSE5406。其中平台GPL96是人类基因芯片平台。
分析单元702,用于对数据集中的样本基因表达谱,进行RMA标准化处理,以获取对应的基因数据。RMA标准化处理,即通过Expression Console软件将样本基因表达谱经RMA算法预处理,转化成基因数据的过程。
作为一种可选的实施方式,共表达基因对数据是通过以下筛选算法筛选得出的:
max(T(i,j))-min(T(i,j))<δ;
其中,T(i,j)=X(i,k)/X(j,k),k=1,2…N,X(i,k)表示基因i的第k个样本的基因表达量,X(j,k)表示基因j的第k个样本的基因表达量,δ表示基因i和基因j的近似程度。
作为一种可选的实施方式,筛选单元704,用于通过筛选算法,在包括非心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第一共表达基因对数据。例如,当δ=0.03时,筛选单元704可以在16个非心肌病患者的基因表达谱对应的基因数据中筛选出第一共表达基因对数据,其中第一共表达基因对数据包括85326个共表达基因对。
筛选单元704,还用于通过筛选算法,在包括缺血性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第二共表达基因对数据。例如,当δ=0.03时,筛选单元704可以在108个缺血性心肌病患者的基因表达谱对应的基因数据中筛选出第二共表达基因对数据,其中第二共表达基因对数据包括72个共表达基因对。
筛选单元704,还用于通过筛选算法,在包括特发性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第三共表达基因对数据。例如,当δ=0.03时,筛选单元704可以在86个缺血性心肌病患者的基因表达谱对应的基因数据中筛选出第三共表达基因对数据,其中第三共表达基因对数据包括368个共表达基因对。
确定单元705,用于确定第二共表达基因对数据和第三共表达基因对数据为心肌病生物标志物。
作为一种可选的实施方式,本发明实施例中的心肌病基因数据处理装置700还可以包括:
第三获取单元706,用于在基因数据中获取关于心脏肌肉收缩和心肌病的基因数据,在共表达基因对数据中,获取包括关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据。
以图5A所示的非心肌病患者对应的共表达基因对的效果示意图为例,16个非心肌病患者对应的共表达基因对包括85326个,第三获取单元706通过KEGG(京都基因与基因组百科全书)数据库和Cytoscape软件分析得到,85326个共表达基因对涉及的基因中关于心脏肌肉收缩和心肌病的基因有56个,关于心脏肌肉收缩和心肌病的基因与其他基因形成的共表达基因对有4574个。其中灰色的圆形部分表示56个关于心脏肌肉收缩和心肌病的基因,圆形部分之外的灰色部分表示关于心脏肌肉收缩和心肌病的基因与其他基因形成4574个共表达基因对。
以图5B所示的特发性心肌病患者对应的共表达基因对的效果示意图为例,86个特发性心肌病患者对应的共表达基因对包括368个,第三获取单元706获取到368个共表达基因对涉及的基因中关于心脏肌肉收缩和心肌病的基因有6个,关于心脏肌肉收缩和心肌病的基因与其他基因形成的共表达基因对有25个,确定单元705可以将包括该25个共表达基因对的共表达基因对数据确定为心肌病生物标志物。其中灰色部分为6个关于心脏肌肉收缩和心肌病的基因,关于心脏肌肉收缩和心肌病的基因与其他基因形成25个共表达基因对。
例如,108个缺血性心肌病患者对应的共表达基因对包括72个,72个共表达基因对涉及的基因中不存在关于心脏肌肉收缩和心肌病的基因。
由此可见,非心肌病患者、特发性心肌病患者以及缺血性心肌病患者体内的稳态显著不同,非心肌病患者的心脏调节系统比特发性心肌病患者的心脏调节系统更加稳健,由此可以表明特发性心肌病患者的发病机理:特发性心肌病患者的心脏调节系统的稳健性低于非心肌病患者的心脏调节系统,这可能是导致特发性心肌病病人心脏扩大,心力衰竭,心律失常等临床症状的重要原因。缺血性心肌病患者的基因表达谱对应的基因数据中不存在关于心脏肌肉收缩和心肌病的基因数据,由此可以表明缺血性心肌病患者的发病机理:可能是由于冠状动脉粥样硬化长期心肌缺血,导致心肌功能受损,从而造成心肌相关基因表达的失调和紊乱。
作为一种可选的实施方式,本发明实施例中的心肌病基因数据处理装置700还可以包括:
第三获取单元706,用于在基因数据中获取关于生物代谢过程的基因数据,在共表达基因对数据中,获取包括关于生物代谢过程的基因数据的共表达基因对数据。
以图6A所示的非心肌病患者对应的共表达基因对的效果示意图为例,16个非心肌病患者对应的共表达基因对包括85326个,第三获取单元706通过KEGG数据库和Cytoscape软件分析得到,85326个共表达基因对涉及的基因中关于生物代谢过程的基因有216个,关于生物代谢过程的基因与其他基因形成的共表达基因对有6841个。其中灰色的圆形部分表示216个关于生物代谢过程的基因,圆形部分之外的灰色部分表示关于生物代谢过程的基因与其他基因形成6841个共表达基因对。
例如,108个缺血性心肌病患者对应的共表达基因对包括72个,第三获取单元706获取到72个共表达基因对涉及的基因中关于生物代谢过程的基因有18个,关于生物代谢过程的基因与其他基因形成的共表达基因对有70个,确定单元705可以将包括该70个共表达基因对的共表达基因对数据确定为心肌病生物标志物。
以图6B所示的特发性心肌病患者对应的共表达基因对的效果示意图为例,86个特发性心肌病患者对应的共表达基因对包括368个,第三获取单元706获取到368个共表达基因对涉及的基因中关于生物代谢过程的基因有2个,关于生物代谢过程的基因与其他基因形成的共表达基因对有5个,确定单元705可以将包括该5个共表达基因对的共表达基因对数据确定为心肌病生物标志物。其中灰色部分为2个关于生物代谢过程的基因,关于生物代谢过程的基因与其他基因形成25个共表达基因对。
由此可见,非心肌病患者、特发性心肌病患者以及缺血性心肌病患者的生物代谢系统显著不同。
在图7所示的心肌病基因数据处理装置中,分析单元702对样本基因表达谱进行分析,以获取对应的基因数据,筛选单元704通过预先设定的筛选算法,在基因数据中筛选出共表达基因对数据,确定单元705确定共表达基因对数据为心肌病生物标志物,可提高心肌病患者的识别精准度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明实施例所必须的。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
本发明实施例中所述单元,可以通过通用集成电路,例如CPU(CentralProcessing Unit,中央处理器),或通过ASIC(Application Specific IntegratedCircuit,专用集成电路)来实现。
以上对本发明实施例所提供的心肌病基因数据处理方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种心肌病基因数据处理方法,其特征在于,包括:
获取样本基因表达谱,所述样本基因表达谱包括缺血性心肌病患者、特发性心肌病患者以及非心肌病患者的基因表达谱;
对所述样本基因表达谱进行分析,以获取对应的基因数据,各个所述基因数据包括若干基因的基因表达量;
获取预先设定的筛选算法;
通过所述筛选算法,在包括非心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第一共表达基因对数据;
通过所述筛选算法,在包括缺血性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第二共表达基因对数据;
通过所述筛选算法,在包括特发性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第三共表达基因对数据;
确定所述第二共表达基因对数据和第三共表达基因对数据为所述心肌病生物标志物;
所述获取样本基因表达谱包括:
通过平台GPL96,从高通量基因表达GEO数据库中获取数据集GSE5406;
所述对所述样本基因表达谱进行分析,以获取对应的基因数据包括:
对所述数据集中的样本基因表达谱,进行鲁棒的多芯片平均RMA标准化处理,以获取对应的基因数据。
2.如权利要求1所述的方法,其特征在于,所述共表达基因对数据是通过以下筛选算法筛选得出的:
max(T(i,j))-min(T(i,j))<δ;
其中,T(i,j)=X(i,k)/X(j,k),k=1,2…N,N表示所述样本基因表达谱中为缺血性心肌病患者、特发性心肌病患者或者非心肌病患者的基因表达谱的数量,X(i,k)表示基因i的第k个样本的基因表达量,X(j,k)表示基因j的第k个样本的基因表达量,δ表示基因i和基因j的近似程度。
3.如权利要求1所述的方法,其特征在于,还包括:
在所述基因数据中获取关于心脏肌肉收缩和心肌病的基因数据;
在所述共表达基因对数据中,获取包括所述关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据。
4.如权利要求1所述的方法,其特征在于,还包括:
在所述基因数据中获取关于生物代谢过程的基因数据;
在所述共表达基因对数据中,获取包括所述关于生物代谢过程的基因数据的共表达基因对数据。
5.一种心肌病基因数据处理装置,其特征在于,包括:
第一获取单元,用于获取样本基因表达谱,所述样本基因表达谱包括缺血性心肌病患者、特发性心肌病患者以及非心肌病患者的基因表达谱;
分析单元,用于对所述样本基因表达谱进行分析,以获取对应的基因数据,各个所述基因数据包括若干基因的基因表达量;
第二获取单元,用于获取预先设定的筛选算法;
筛选单元,用于通过所述筛选算法,在包括非心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第一共表达基因对数据;
所述筛选单元,还用于通过所述筛选算法,在包括缺血性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第二共表达基因对数据;
所述筛选单元,还用于通过所述筛选算法,在包括特发性心肌病患者的基因表达谱的样本基因表达谱对应的基因数据中筛选出第三共表达基因对数据;
确定单元,用于确定所述第二共表达基因对数据和第三共表达基因对数据为所述心肌病生物标志物;
所述第一获取单元,用于通过平台GPL96,从高通量基因表达GEO数据库中获取数据集GSE5406;
所述分析单元,用于对所述数据集中的样本基因表达谱,进行鲁棒的多芯片平均RMA标准化处理,以获取对应的基因数据。
6.如权利要求5所述的装置,其特征在于,所述共表达基因对数据是通过以下筛选算法筛选得出的:
max(T(i,j))-min(T(i,j))<δ;
其中,T(i,j)=X(i,k)/X(j,k),k=1,2…N,N表示所述样本基因表达谱中为缺血性心肌病患者、特发性心肌病患者或者非心肌病患者的基因表达谱的数量,X(i,k)表示基因i的第k个样本的基因表达量,X(j,k)表示基因j的第k个样本的基因表达量,δ表示基因i和基因j的近似程度。
7.如权利要求5所述的装置,其特征在于,还包括:
第三获取单元,用于在所述基因数据中获取关于心脏肌肉收缩和心肌病的基因数据,在所述共表达基因对数据中,获取包括所述关于心脏肌肉收缩和心肌病的基因数据的共表达基因对数据。
8.如权利要求5所述的装置,其特征在于,还包括:
第三获取单元,用于在所述基因数据中获取关于生物代谢过程的基因数据,在所述共表达基因对数据中,获取包括所述关于生物代谢过程的基因数据的共表达基因对数据。
CN201410827322.3A 2014-12-25 2014-12-25 一种心肌病基因数据处理方法及装置 Active CN104573404B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410827322.3A CN104573404B (zh) 2014-12-25 2014-12-25 一种心肌病基因数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410827322.3A CN104573404B (zh) 2014-12-25 2014-12-25 一种心肌病基因数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN104573404A CN104573404A (zh) 2015-04-29
CN104573404B true CN104573404B (zh) 2018-05-04

Family

ID=53089450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410827322.3A Active CN104573404B (zh) 2014-12-25 2014-12-25 一种心肌病基因数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN104573404B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709275A (zh) * 2017-02-04 2017-05-24 上海喆之信息科技有限公司 一种限制型心肌病基因数据处理装置
CN107766695B (zh) * 2017-10-20 2019-03-08 中国科学院北京基因组研究所 一种获取外周血基因模型训练数据的方法及装置
CN109486939A (zh) * 2018-12-24 2019-03-19 河北医科大学第三医院 基因标志物在缺血性心肌病诊断中的应用
CN109576361A (zh) * 2018-12-24 2019-04-05 河北医科大学第三医院 一种与缺血性心肌病发生发展相关的生物标志物

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714268A (zh) * 2013-12-12 2014-04-09 深圳先进技术研究院 一种筛选多发性硬化疾病生物标志物的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008069975A2 (en) * 2006-12-01 2008-06-12 New York University Methods of using f-spondin as a biomarker for cartilage degenerative conditions

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714268A (zh) * 2013-12-12 2014-04-09 深圳先进技术研究院 一种筛选多发性硬化疾病生物标志物的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"先天性心脏病永生性基因库的建立和相关基因研究";杨威等;《医学信息》;20140831;第27卷(第8期);第62-63页 *
"功能相关基因模块的共表达分析软件GeneHub";郭政等;《哈尔滨工业大学学报》;20050531;第37卷(第5期);第599-603页 *
"基于DNA微阵列数据的基因差异共表达分析研究";袁林;《中国优秀硕士学位论文全文数据库 基础科技辑》;20141115;第2014年卷(第11期);第A006-57页 *
"基于生物信号通路的复杂疾病标志物识别与研究";刘克钦;《中国博士学位论文全文数据库 医药卫生科技辑》;20140615;第2014年卷(第6期);第E080-1页 *

Also Published As

Publication number Publication date
CN104573404A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN104573404B (zh) 一种心肌病基因数据处理方法及装置
Sengupta et al. Cognitive machine-learning algorithm for cardiac imaging: a pilot study for differentiating constrictive pericarditis from restrictive cardiomyopathy
Smith et al. euHeart: personalized and integrated cardiac care using patient-specific cardiovascular modelling
Abbasi et al. Impact of cardiovascular magnetic resonance on management and clinical decision-making in heart failure patients
Niederer et al. Verification of cardiac tissue electrophysiology simulators using an N-version benchmark
Rodriguez et al. Human-based approaches to pharmacology and cardiology: an interdisciplinary and intersectorial workshop
Nishanth et al. Identifying important attributes for early detection of chronic kidney disease
US20140012558A1 (en) System and methods for integrated and predictive analysis of molecular, imaging, and clinical data for patient-specific management of diseases
CN108109692A (zh) 一种治疗方案的选择方法和系统
CN109585011A (zh) 胸痛患者的病症诊断方法及机器可读存储介质
Dössel et al. Computer modeling of the heart for ECG interpretation—a review
Makimoto et al. Adopting artificial intelligence in cardiovascular medicine: A scoping review
Ai et al. Ageing and Alzheimer’s disease: Application of artificial intelligence in mechanistic studies, diagnosis, and drug development
JPWO2018207925A1 (ja) バイオマーカー検出方法、疾病判断方法、バイオマーカー検出装置、及びバイオマーカー検出プログラム
Wosiak et al. On integrating clustering and statistical analysis for supporting cardiovascular disease diagnosis
US20190295702A1 (en) Patient filtering based on likelihood of side effects
CN113571179B (zh) 基于知识图谱的指标提取方法和装置
Ma et al. Predictive value of cardiac magnetic resonance for left ventricular remodeling of patients with acute anterior myocardial infarction
CN106709275A (zh) 一种限制型心肌病基因数据处理装置
CN108346471A (zh) 一种病理数据的分析方法及装置
US20190295701A1 (en) Drug administration timing
US20190295703A1 (en) Patient selection based on drug mechanism
Manzi et al. Contemporary Evidence and Practice on Right Heart Catheterization in Patients with Acute or Chronic Heart Failure
JP2014215727A (ja) 人間ドック総合保健指導支援システム
JP7385873B2 (ja) シミュレーションシステム及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant