CN109192316B - 一种基于基因网络分析的疾病亚型预测系统 - Google Patents

一种基于基因网络分析的疾病亚型预测系统 Download PDF

Info

Publication number
CN109192316B
CN109192316B CN201810737793.3A CN201810737793A CN109192316B CN 109192316 B CN109192316 B CN 109192316B CN 201810737793 A CN201810737793 A CN 201810737793A CN 109192316 B CN109192316 B CN 109192316B
Authority
CN
China
Prior art keywords
gene
disease
patient
node
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810737793.3A
Other languages
English (en)
Other versions
CN109192316A (zh
Inventor
刘闯
王朝
许帅帅
张子柯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Aiermo Cell Biotechnology Co ltd
Original Assignee
Hangzhou Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Normal University filed Critical Hangzhou Normal University
Priority to CN201810737793.3A priority Critical patent/CN109192316B/zh
Publication of CN109192316A publication Critical patent/CN109192316A/zh
Application granted granted Critical
Publication of CN109192316B publication Critical patent/CN109192316B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种基于基因网络分析的疾病亚型预测系统,分为以下三个模块:数据采集与预处理模块、病人分类和疾病亚型预测模块、结果展示模块,其中病人分类和疾病亚型预测模块包含基因网络中基因节点向量化子模块、疾病患者向量化子模块、疾病亚型预测子模块。

Description

一种基于基因网络分析的疾病亚型预测系统
技术领域
本发明涉及一种基于基因网络分析和机器学习方法的疾病亚型预测系统。
背景技术
卫生部曾对10个城市的上班族进行了调查,发现处于亚健康状态的人占48%,并且传统治疗方案显示,肿瘤的无效率高达75%,糖尿病无效率43%,抑郁症无效率也有38%。据统计显示,我国每年因疾病导致的经济损失高达14000多亿元,相当于每年消耗我国GDP总量的14%还多。因此,高效预测可能患有的疾病类型尤为重要,为及时治疗奠定基础。
随着大规模生物样本数据库、强大基因组学和医疗技术的发展,人们逐渐意识到大多数疾病的发生是自身遗传密码和外界环境共同作用的结果。因此,依据个体的基因、健康差异来制定个性化治疗和预防方案的新型治疗方法,即精准医疗引领了新的医学时代。其实质是通过基因组、蛋白质组等组学技术和医学前沿技术,对大样本人群与特定疾病类型进行生物标志物的分析与鉴定、验证与应用,从而精确寻找到疾病的原因和治疗的靶点,并对一种疾病不同状态和过程进行精确分类,最终实现对疾病和特定患者进行个性化精准治疗的目的,提高疾病诊疗与预防的效益。
近年来,大数据的蓬勃发展催生出一系列相关技术,使得用大数据的相关方法对疾病亚型进行预测成为可能。但目前尚未出现将基因网络与机器学习相结合来解决疾病亚型预测的方案,也未建立一种基于基因网络分析的疾病亚型预测系统。
发明内容
本发明要克服现有技术的缺点,提供一种基于基因网络分析的疾病亚型预测系统。
本发明利用基因网络数据和病人的基因测序数据,采用机器学习和网络分析的方法,建立一种对疾病亚型预测的系统,在技术上实现了对疾病患者进行细分类的问题,对疾病亚型进行预测,进而为临床决策提供支持。
一种基于基因网络分析的疾病亚型预测系统,其特征在于,包括:
数据采集与预处理模块,用于基因网络关系和疾病患者的变异基因序列数据的采集以及预处理,并向病人分类和疾病亚型预测模块输出数据;
病人分类和疾病亚型预测模块,接收来自数据采集与预处理模块的基因网络关系数据以及疾病患者的变异基因序列数据,用于实现疾病亚型预测,取得预测类别结果数据;
结果展示模块,接收来自病人分类和疾病亚型预测模块的预测类别结果数据,用于展示疾病亚型预测子模块中的预测结果,测试疾病亚型预测算法在不同类型肿瘤之间的有效性,并使用准确率P、召回率R、P和R的调和平均数F1三个指标的条形图展示算法在不同类型肿瘤之间的有效性。
所述数据采集与预处理模块,具体包括如下内容:
基因网络关系数据:基于PINA,InnateDB等数据库提取高质量的蛋白质相互作用关系,进而构建蛋白质所对应的编码基因之间的基因网络,即基因与基因之间的相互作用网络;网络中的节点代表单个基因,边代表两个基因所编码的蛋白之间具有相互作用关系;
疾病患者的变异基因序列:通过相应疾病患者的外显子组DNA测序数据,提取病人的体细胞突变基因。比如可以从ICGC,TCGA等数据库获取恶性肿瘤类疾病患者的变异基因序列;
基因网络关系数据输入基因网络中基因节点向量化子模块;疾病患者的变异基因序列输入疾病患者向量化子模块。
所述病人分类和疾病亚型预测模块包括依次连接的下列三个子模块:
基因网络中基因节点向量化子模块,用于将基因网络中的基因节点实现向量化,并使用node2vec方法实现;向疾病患者向量化子模块输出基因节点的向量表示和疾病患者的变异基因序列;
疾病患者向量化子模块,用于将疾病患者实现向量化,并向疾病亚型预测子模块输出疾病患者的向量表示;
疾病亚型预测子模块,用于将病人在向量化的基础上分成不同的类别,每一类可表征为一种亚型,进而针对不同类别进行临床决策;该分类过程使用softmax回归来实现;
所述结果展示模块,具体包括如下内容:
假设有d1、d2两种疾病类型,以疾病d1的预测结果为例,定义TP为正确预测为d1类型的数量;FP为误把d2类型预测为d1类型的数量;FN为误把d1类型预测为d2类型的数量;则:
Figure GDA0003081952780000031
Figure GDA0003081952780000032
Figure GDA0003081952780000033
所述基因网络中基因节点向量化子模块,包括:
随机游走random walk孙模块,在基因网络上通过随机游走的方式,产生一系列基因节点序列,并向word2vec孙模块输出,具体是:
采用一种有偏的游走策略,即从一个节点向下一个节点的游走概率是不同的,这个概率由参数p(return parameter)和参数q(in-out parameter)来控制。定义随机游走选择下一个节点的公式为:
Figure GDA0003081952780000041
即若图E中存在边(v,x),则以
Figure GDA0003081952780000042
的概率选择下一节点x,其中πvx是非归一化的v到x的转移概率,Z是归一化常数。其中:
πvx=αpq(t,x)·wvx (5)
Figure GDA0003081952780000043
即当下一个节点x与前一个节点t和当前节点v等距时,α=1;当下一个节点x是上一个节点时,
Figure GDA0003081952780000044
在其它情况下,
Figure GDA0003081952780000045
通过上述随机游走的方式,最终产生一系列的节点序列;
word2vec孙模块,计算生成节点向量表征;
word2vec是Google于2013年开源的一款将词表征为实数值向量的高效工具,其基本思想是通过训练将每个词映射成k维实数向量;
由上述randomwalk得到每个基因节点的游走序列,然后使用word2vec工具为每个基因节点生成一个特征向量,即实现基因节点向量化,并将向量化后的数据应用于疾病患者向量化子模块;
所述疾病患者向量化子模块,具体包括如下内容:
基于每个基因节点向量,对于每个疾病患者,可以由其突变基因组成一个多维向量来表征。由于每一个疾病患者突变的基因是不同的,数量也不尽相同。在对患者进行细分类的过程中,需要使每位患者的向量维度相同,因此在构造患者的向量之前,可以先为每一个基因分配一个权重值,以基因A为例,详述A的权重的计算过程:
假设数据中共有N个基因,M个疾病患者,涉及到m种疾病类型,并且每个患者只患有一种疾病。其中基因A在所有患者中突变的次数为nA,基因A在第i类疾病中突变的次数为nAi。则定义基因A的权重值为:
Figure GDA0003081952780000051
假设患者P的突变基因为{A,B},基因A的向量为αA,基因B的向量为αB,则定义患者P的向量βP为:
βP=wAαA+wBαB (8)
向量化后的疾病患者数据应用于疾病亚型预测子模块;
所述疾病亚型预测子模块,具体包括依次连接的训练回归模型孙模块、计算类别概率孙模块、亚型预测孙模块;
回归模型孙模块,建立训练生成回归模型,并应用于亚型预测孙模块,具体是:
(1)假设函数
类标签y可以取k个不同的值。因此,对于训练集{(x(1),y(2)),…,(x(m),y(m))},有y(i)∈{1,2,…,k}。
对于给定的输入x,用假设函数对每一个类别j估算出概率值p(y=j|x),即估计x的每一种分类结果出现的概率。因此,假设函数需要输出一个k维的向量(向量元素和为1)来表示这k个估计的概率值。假设函数hθ(x)形式如下:
Figure GDA0003081952780000052
其中,
Figure GDA0003081952780000053
对概率分布进行归一化,保证所有概率之和为1。
(2)代价函数
代价函数为:
Figure GDA0003081952780000061
其中,1{·}是示性函数,其取值规则为:1{值为真的表达式}=1;1{值为假的表达式}=0。
对于J(θ)的最小化问题,使用梯度下降法求解最优值,梯度公式如下:
Figure GDA0003081952780000062
计算类别概率孙模块,计算生成样本被分类为各个类别的概率,具体是:
将x分类为类别j的概率为:
Figure GDA0003081952780000063
亚型预测孙模块,生成样本被分类成的类别。
本发明的优点是:采用了基因网络分析与机器学习相结合的方法,从基因相互作用层面深入分析病理,给出了一种不同于传统医疗判别疾病类型的思路,在一定程度上促进解决疾病亚型预测的问题,对于临床决策具有重要的指导意义。
附图说明
图1是本发明系统结构示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
本发明实施例提供了一种基于基因网络分析的疾病亚型预测系统,实现对疾病亚型的分类和预测。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明的一部分实施例,而非全部实施例。基于本发明中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本发明保护的范围。
以下进行详细说明。
本发明一种基于基因网络分析的疾病亚型预测系统的一个实施例,可应用于临床决策,本发明提供的一种基于基因网络分析的疾病亚型预测系统,可以包括如下步骤一至步骤五所示的方法步骤:
步骤一、数据采集与预处理
在本发明实施例中,基于PINA,InnateDB等数据库提取高质量的蛋白质相互作用关系,进而构建蛋白质所对应的编码基因之间的基因网络,即基因与基因之间的相互作用网络。网络中的节点代表单个基因,边代表两个基因所编码的蛋白之间具有相互作用关系。通过相应疾病患者的外显子组DNA测序数据,提取病人的体细胞突变基因。比如可以从ICGC,TCGA等数据库获取恶性肿瘤类疾病患者的变异基因序列。
其中,基因网络关系数据应用于步骤二;疾病患者的变异基因序列应用于步骤三。
步骤二、基因网络中基因节点向量化
在本发明实施例中,使用node2vec方法实现基因节点向量化,步骤如下:
(1)random walk,在基因网络上通过随机游走的方式,产生一系列基因节点序列
与普通随机游走不同的是,本发明采用一种有偏的游走策略,即从一个节点向下一个节点的游走概率是不同的,这个概率由参数p(return parameter)和参数q(in-outparameter)来控制。定义随机游走选择下一个节点的公式为:
Figure GDA0003081952780000081
即若图E中存在边(v,x),则以
Figure GDA0003081952780000082
的概率选择下一节点x,其中πvx是非归一化的v到x的转移概率,Z是归一化常数。其中:
πvx=αpq(t,x)·wvx (5)
Figure GDA0003081952780000083
即当下一个节点x与前一个节点t和当前节点v等距时,α=1;当下一个节点x是上一个节点时,
Figure GDA0003081952780000084
在其它情况下,
Figure GDA0003081952780000085
通过上述随机游走的方式,最终产生一系列的节点序列。
(2)word2vec,计算节点向量表征
word2vec是Google于2013年开源的一款将词表征为实数值向量的高效工具,其基本思想是通过训练将每个词映射成k维实数向量。
由上述randomwalk得到每个基因节点的游走序列,然后使用word2vec工具为每个基因节点生成一个特征向量,即实现基因节点向量化。
基因网络中基因节点向量化的数据应用于步骤三。
步骤三、疾病患者向量化
在本发明实施例中,基于每个基因节点向量,对于每个疾病患者,可以由其突变基因组成一个多维向量来表征。由于每一个疾病患者突变的基因是不同的,数量也不尽相同。在对患者进行细分类的过程中,需要使每位患者的向量维度相同,因此在构造患者的向量之前,可以先为每一个基因分配一个权重值,以基因A为例,详述A的权重的计算过程:
假设数据中共有N个基因,M个疾病患者,涉及到m种疾病类型,并且每个患者只患有一种疾病。其中基因A在所有患者中突变的次数为nA,基因A在第i类疾病中突变的次数为nAi。则定义基因A的权重值为:
Figure GDA0003081952780000091
假设患者P的突变基因为{A,B},基因A的向量为αA,基因B的向量为αB,则定义患者P的向量βP为:
βP=wAαA+wBαB (8)
疾病患者向量化的数据应用于步骤四。
步骤四、疾病亚型预测
在本发明实施例中,将疾病亚型预测问题转化为多分类问题,即将病人在向量化的基础上分成不同的类别,每一类可表征为一种亚型,进而针对不同类别进行临床决策。该分类过程使用softmax回归来实现,模型详述如下:
(1)假设函数
类标签y可以取k个不同的值。因此,对于训练集{(x(1),y(2)),…,(x(m),y(m))},有y(i)∈{1,2,…,k}。
对于给定的输入x,用假设函数对每一个类别j估算出概率值p(y=j|x),即估计x的每一种分类结果出现的概率。因此,本发明的假设函数需要输出一个k维的向量(向量元素和为1)来表示这k个估计的概率值。假设函数hθ(x)形式如下:
Figure GDA0003081952780000092
其中,
Figure GDA0003081952780000093
对概率分布进行归一化,保证所有概率之和为1。
(2)代价函数
本发明的代价函数为:
Figure GDA0003081952780000101
其中,1{·}是示性函数,其取值规则为:1{值为真的表达式}=1;1{值为假的表达式}=0。将x分类为类别j的概率为:
Figure GDA0003081952780000102
对于J(θ)的最小化问题,使用梯度下降法求解最优值,梯度公式如下:
Figure GDA0003081952780000103
本发明将疾病患者数据划分成了两个部分:训练集和测试集。首先,使用训练集患者数据训练上述softmax回归模型,最终得到对疾病患者准确分类的模型;然后,用训练好的模型对测试集患者数据进行预测,预测结果的好坏通过结果展示模块展示;最终,将模型应用到实际中,解决疾病亚型预测的问题。
疾病亚型预测的分类结果应用于步骤五。
步骤五、展示疾病亚型预测子模块中预测结果的好坏,测试上述疾病亚型预测算法在不同类型肿瘤之间的有效性,并通过图示展示结果。
在本发明实施例中,使用准确率P、召回率R、P和R的调和平均数F1三个指标的条形图展示算法在不同类型肿瘤之间的有效性。
假设有d1、d2两种疾病类型,以疾病d1的预测结果为例,定义TP为正确预测为d1类型的数量;FP为误把d2类型预测为d1类型的数量;FN为误把d1类型预测为d2类型的数量。则:
Figure GDA0003081952780000104
Figure GDA0003081952780000105
Figure GDA0003081952780000106
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (1)

1.一种基于基因网络分析的疾病亚型预测系统,其特征在于,包括:
数据采集与预处理模块,用于基因网络关系和疾病患者的变异基因序列数据的采集以及预处理,并向病人分类和疾病亚型预测模块输出数据;
病人分类和疾病亚型预测模块,接收来自数据采集与预处理模块的基因网络关系数据以及疾病患者的变异基因序列数据,用于实现疾病亚型预测,取得预测类别结果数据;
结果展示模块,接收来自病人分类和疾病亚型预测模块的预测类别结果数据,用于展示疾病亚型预测子模块中的预测结果,测试疾病亚型预测算法在不同类型肿瘤之间的有效性,并使用准确率P、召回率R、P和R的调和平均数F1三个指标的条形图展示算法在不同类型肿瘤之间的有效性;
所述数据采集与预处理模块,具体包括如下内容:
基因网络关系数据:基于PINA,InnateDB数据库提取高质量的蛋白质相互作用关系,进而构建蛋白质所对应的编码基因之间的基因网络,即基因与基因之间的相互作用网络;网络中的节点代表单个基因,边代表两个基因所编码的蛋白之间具有相互作用关系;
疾病患者的变异基因序列:通过相应疾病患者的外显子组DNA测序数据,提取病人的体细胞突变基因;从ICGC,TCGA数据库获取恶性肿瘤类疾病患者的变异基因序列;
基因网络关系数据输入基因网络中基因节点向量化子模块;疾病患者的变异基因序列输入疾病患者向量化子模块;
所述病人分类和疾病亚型预测模块包括依次连接的下列三个子模块:
基因网络中基因节点向量化子模块,用于将基因网络中的基因节点实现向量化,并使用node2vec方法实现;向疾病患者向量化子模块输出基因节点的向量表示和疾病患者的变异基因序列;
疾病患者向量化子模块,用于将疾病患者实现向量化,并向疾病亚型预测子模块输出疾病患者的向量表示;
疾病亚型预测子模块,用于将病人在向量化的基础上分成不同的类别,每一类可表征为一种亚型,进而针对不同类别进行临床决策;该分类过程使用softmax回归来实现;
所述结果展示模块,具体包括如下内容:
设定d1、d2两种疾病类型,对疾病d1进行预测,定义TP为正确预测为d1类型的数量;FP为误把d2类型预测为d1类型的数量;FN为误把d1类型预测为d2类型的数量;则:
Figure FDA0003081952770000021
Figure FDA0003081952770000022
Figure FDA0003081952770000023
所述基因网络中基因节点向量化子模块,包括:
随机游走random walk孙模块,在基因网络上通过随机游走的方式,产生一系列基因节点序列,并向word2vec孙模块输出,具体是:
采用一种有偏的游走策略,即从一个节点向下一个节点的游走概率是不同的,这个概率由参数p,即return parameter,和参数q,即in-out parameter,来控制;定义随机游走选择下一个节点的公式为:
Figure FDA0003081952770000024
即若图E中存在边(v,x),则以
Figure FDA0003081952770000025
的概率选择下一节点x,其中πvx是非归一化的v到x的转移概率,Z是归一化常数;其中:
πvx=αpq(t,x).wvx (5)
Figure FDA0003081952770000031
当下一个节点x与前一个节点t和当前节点v等距时,即dtx=1时,α=1;当下一个节点x是上一个节点时,即dtx=0时,
Figure FDA0003081952770000032
在其它情况下,即dtx=2时,
Figure FDA0003081952770000033
通过上述随机游走的方式,最终产生一系列的节点序列;
word2vec孙模块,计算生成节点向量表征;
由上述randomwalk得到每个基因节点的游走序列,然后使用word2vec工具为每个基因节点生成一个特征向量,即实现基因节点向量化,并将向量化后的数据应用于疾病患者向量化子模块;
所述疾病患者向量化子模块,具体包括如下内容:
基于每个基因节点向量,对于每个疾病患者,由其突变基因组成一个多维向量来表征;由于每一个疾病患者突变的基因是不同的,数量也不尽相同;在对患者进行细分类的过程中,需要使每位患者的向量维度相同,因此在构造患者的向量之前,先为每一个基因分配一个权重值,基因A的权重的计算过程:
设定数据中共有N个基因,M个疾病患者,涉及到m种疾病类型,并且每个患者只患有一种疾病;其中基因A在所有患者中突变的次数为nA,基因A在第i类疾病中突变的次数为nAi;则定义基因A的权重值为:
Figure FDA0003081952770000034
设定患者P的突变基因为{A,B},基因A的向量为αA,基因B的向量为αB,则定义患者P的向量βP为:
βP=wAαA+wBαB (8)
向量化后的疾病患者数据应用于疾病亚型预测子模块;
所述疾病亚型预测子模块,具体包括依次连接的训练回归模型孙模块、计算类别概率孙模块、亚型预测孙模块;
回归模型孙模块,建立训练生成回归模型,并应用于亚型预测孙模块,具体是:
(1)假设函数
类标签y取k个不同的值;因此,对于训练集{(x(1),y(2)),...,(x(m),y(m))},有y(i)∈{1,2,...,k};
对于给定的输入x,用假设函数对每一个类别j估算出概率值p(y=j|x),即估计x的每一种分类结果出现的概率;因此,假设函数需要输出一个k维的向量来表示这k个估计的概率值,其中向量元素和为1;假设函数hθ(x)形式如下:
Figure FDA0003081952770000041
其中,
Figure FDA0003081952770000042
对概率分布进行归一化,保证所有概率之和为1;
(2)代价函数
代价函数为:
Figure FDA0003081952770000043
其中,1{·}是示性函数,其取值规则为:1{值为真的表达式}=1;1{值为假的表达式}=0;
对于J(θ)的最小化问题,使用梯度下降法求解最优值,梯度公式如下:
Figure FDA0003081952770000044
计算类别概率孙模块,计算生成样本被分类为各个类别的概率,具体是:
将x分类为类别j的概率为:
Figure FDA0003081952770000051
亚型预测孙模块,生成样本被分类成的类别。
CN201810737793.3A 2018-07-02 2018-07-02 一种基于基因网络分析的疾病亚型预测系统 Active CN109192316B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810737793.3A CN109192316B (zh) 2018-07-02 2018-07-02 一种基于基因网络分析的疾病亚型预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810737793.3A CN109192316B (zh) 2018-07-02 2018-07-02 一种基于基因网络分析的疾病亚型预测系统

Publications (2)

Publication Number Publication Date
CN109192316A CN109192316A (zh) 2019-01-11
CN109192316B true CN109192316B (zh) 2021-09-07

Family

ID=64936115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810737793.3A Active CN109192316B (zh) 2018-07-02 2018-07-02 一种基于基因网络分析的疾病亚型预测系统

Country Status (1)

Country Link
CN (1) CN109192316B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110246591B (zh) * 2019-07-15 2021-11-05 中国中医科学院西苑医院 一种中医药治疗人群的预后预测系统
US12100480B2 (en) 2019-08-27 2024-09-24 The Board Of Trustees Of The Leland Stanford Junior University Assessment of polygenic trait risk via trait components and applications thereof
US20220293213A1 (en) * 2019-09-02 2022-09-15 Phil Rivers Technology, Ltd. Method for acquiring intracellular deterministic events and electronic apparatus
CN112930573B (zh) * 2019-09-02 2024-06-21 北京哲源科技有限责任公司 疾病类型自动确定方法及电子设备
CN113270139A (zh) * 2021-05-28 2021-08-17 中南大学湘雅医院 基因型和临床表型相关性分析方法及相关装置
CN115019960B (zh) * 2022-08-01 2022-11-29 浙江大学 一种基于个性化状态空间进展模型的疾病辅助决策系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156503A (zh) * 2014-07-21 2014-11-19 金华市中心医院 一种基于基因芯片网络分析的疾病风险基因识别方法
CN104573410A (zh) * 2015-01-20 2015-04-29 合肥工业大学 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法
CN106126893A (zh) * 2016-06-17 2016-11-16 浙江大学 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法
CN106874706A (zh) * 2017-01-18 2017-06-20 湖南大学 一种基于功能模块的疾病关联因子识别方法及系统
CN107358062A (zh) * 2017-06-02 2017-11-17 西安电子科技大学 一种双层基因调控网络的构建方法
CN107506591A (zh) * 2017-08-28 2017-12-22 中南大学 一种基于多元信息融合和随机游走模型的药物重定位方法
CN108121896A (zh) * 2017-12-19 2018-06-05 深圳先进技术研究院 一种基于miRNA的疾病间关系分析方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10185803B2 (en) * 2015-06-15 2019-01-22 Deep Genomics Incorporated Systems and methods for classifying, prioritizing and interpreting genetic variants and therapies using a deep neural network

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156503A (zh) * 2014-07-21 2014-11-19 金华市中心医院 一种基于基因芯片网络分析的疾病风险基因识别方法
CN104573410A (zh) * 2015-01-20 2015-04-29 合肥工业大学 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法
CN106126893A (zh) * 2016-06-17 2016-11-16 浙江大学 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法
CN106874706A (zh) * 2017-01-18 2017-06-20 湖南大学 一种基于功能模块的疾病关联因子识别方法及系统
CN107358062A (zh) * 2017-06-02 2017-11-17 西安电子科技大学 一种双层基因调控网络的构建方法
CN107506591A (zh) * 2017-08-28 2017-12-22 中南大学 一种基于多元信息融合和随机游走模型的药物重定位方法
CN108121896A (zh) * 2017-12-19 2018-06-05 深圳先进技术研究院 一种基于miRNA的疾病间关系分析方法和装置

Also Published As

Publication number Publication date
CN109192316A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
CN109192316B (zh) 一种基于基因网络分析的疾病亚型预测系统
Pan et al. Penalized model-based clustering with application to variable selection.
AU2019272065C1 (en) Deep learning-based framework for identifying sequence patterns that cause sequence-specific errors (SSEs)
EP1328805A2 (en) System and process for validating, aligning and reordering one or more genetic sequence maps using at least one ordered restriction map
Vanunu et al. A propagation-based algorithm for inferring gene-disease associations
JP2018530815A (ja) 生体データにおけるパターン認識のマルチレベルアーキテクチャ
Ball et al. Ancestry DNA matching white paper
CN115280415A (zh) 致病性模型的应用和其训练
Moler et al. Integrating naive Bayes models and external knowledge to examine copper and iron homeostasis in S. cerevisiae
Long et al. From function to translation: Decoding genetic susceptibility to human diseases via artificial intelligence
Li et al. An empirical Bayes approach for multiple tissue eQTL analysis
CN117457065A (zh) 一种基于单细胞多组学数据识别表型相关细胞类型的方法和系统
Taraszka et al. Leveraging pleiotropy for joint analysis of genome-wide association studies with per trait interpretations
Abdollahi et al. A multi-objective based clustering for inferring BCR clonal lineages from high-throughput B cell repertoire data
Arani et al. Genetic variant effect prediction by supervised nonnegative matrix tri-factorization
Maghasbeh et al. Towards A Multi Agent System Based Data Mining for Proteins Prediction and Classification
Rozenberg et al. Prohlatype: a probabilistic framework for HLA typing
NL2021473B1 (en) DEEP LEARNING-BASED FRAMEWORK FOR IDENTIFYING SEQUENCE PATTERNS THAT CAUSE SEQUENCE-SPECIFIC ERRORS (SSEs)
Ottensmann Comparing the performance of the gene prioritization methods DEPICT and MAGMA on genome-wide association studies of schizophrenia using the Benchmarker framework
Yang et al. Sparse haplotype-based fine-scale local ancestry inference at scale reveals recent selection on immune responses
Ansbacher-Feldman et al. Family based HLA imputation and optimization of haplo-identical transplants
Ranasinghe Categorizing high dimensional unlabelled genomic data
Zhou et al. Exploring group-specific technical variation patterns of single-cell data
Althagafi Prioritizing Causative Genomic Variants by Integrating Molecular and Functional Annotations from Multiple Biomedical Ontologies
Costa Garrido An evaluation of automated methods for cell type annotation in scRNA-seq data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240108

Address after: Hangzhou Aimer Cell Biotechnology Co., Ltd., Southeast Area, Building 3, Zhejiang Overseas Students Entrepreneurship Park, No. 600 21st Street, Baiyang Street, Qiantang District, Hangzhou City, Zhejiang Province, 310020

Patentee after: Hangzhou Aiermo Cell Biotechnology Co.,Ltd.

Address before: Hangzhou Normal University, 2318 yuhangtang Road, Yuhang District, Hangzhou City, Zhejiang Province

Patentee before: Hangzhou Normal University