CN109192316B - 一种基于基因网络分析的疾病亚型预测系统 - Google Patents
一种基于基因网络分析的疾病亚型预测系统 Download PDFInfo
- Publication number
- CN109192316B CN109192316B CN201810737793.3A CN201810737793A CN109192316B CN 109192316 B CN109192316 B CN 109192316B CN 201810737793 A CN201810737793 A CN 201810737793A CN 109192316 B CN109192316 B CN 109192316B
- Authority
- CN
- China
- Prior art keywords
- gene
- disease
- patient
- node
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 140
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 119
- 201000010099 disease Diseases 0.000 title claims abstract description 116
- 238000003012 network analysis Methods 0.000 title claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 25
- 238000005295 random walk Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 230000035772 mutation Effects 0.000 claims description 8
- 206010028980 Neoplasm Diseases 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 102000004169 proteins and genes Human genes 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 206010069754 Acquired gene mutation Diseases 0.000 claims description 3
- 235000007119 Ananas comosus Nutrition 0.000 claims description 3
- 244000099147 Ananas comosus Species 0.000 claims description 3
- 238000001712 DNA sequencing Methods 0.000 claims description 3
- 201000011510 cancer Diseases 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000006916 protein interaction Effects 0.000 claims description 3
- 230000037439 somatic mutation Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 239000000956 alloy Substances 0.000 claims 1
- 229910045601 alloy Inorganic materials 0.000 claims 1
- 230000006870 function Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
一种基于基因网络分析的疾病亚型预测系统,分为以下三个模块:数据采集与预处理模块、病人分类和疾病亚型预测模块、结果展示模块,其中病人分类和疾病亚型预测模块包含基因网络中基因节点向量化子模块、疾病患者向量化子模块、疾病亚型预测子模块。
Description
技术领域
本发明涉及一种基于基因网络分析和机器学习方法的疾病亚型预测系统。
背景技术
卫生部曾对10个城市的上班族进行了调查,发现处于亚健康状态的人占48%,并且传统治疗方案显示,肿瘤的无效率高达75%,糖尿病无效率43%,抑郁症无效率也有38%。据统计显示,我国每年因疾病导致的经济损失高达14000多亿元,相当于每年消耗我国GDP总量的14%还多。因此,高效预测可能患有的疾病类型尤为重要,为及时治疗奠定基础。
随着大规模生物样本数据库、强大基因组学和医疗技术的发展,人们逐渐意识到大多数疾病的发生是自身遗传密码和外界环境共同作用的结果。因此,依据个体的基因、健康差异来制定个性化治疗和预防方案的新型治疗方法,即精准医疗引领了新的医学时代。其实质是通过基因组、蛋白质组等组学技术和医学前沿技术,对大样本人群与特定疾病类型进行生物标志物的分析与鉴定、验证与应用,从而精确寻找到疾病的原因和治疗的靶点,并对一种疾病不同状态和过程进行精确分类,最终实现对疾病和特定患者进行个性化精准治疗的目的,提高疾病诊疗与预防的效益。
近年来,大数据的蓬勃发展催生出一系列相关技术,使得用大数据的相关方法对疾病亚型进行预测成为可能。但目前尚未出现将基因网络与机器学习相结合来解决疾病亚型预测的方案,也未建立一种基于基因网络分析的疾病亚型预测系统。
发明内容
本发明要克服现有技术的缺点,提供一种基于基因网络分析的疾病亚型预测系统。
本发明利用基因网络数据和病人的基因测序数据,采用机器学习和网络分析的方法,建立一种对疾病亚型预测的系统,在技术上实现了对疾病患者进行细分类的问题,对疾病亚型进行预测,进而为临床决策提供支持。
一种基于基因网络分析的疾病亚型预测系统,其特征在于,包括:
数据采集与预处理模块,用于基因网络关系和疾病患者的变异基因序列数据的采集以及预处理,并向病人分类和疾病亚型预测模块输出数据;
病人分类和疾病亚型预测模块,接收来自数据采集与预处理模块的基因网络关系数据以及疾病患者的变异基因序列数据,用于实现疾病亚型预测,取得预测类别结果数据;
结果展示模块,接收来自病人分类和疾病亚型预测模块的预测类别结果数据,用于展示疾病亚型预测子模块中的预测结果,测试疾病亚型预测算法在不同类型肿瘤之间的有效性,并使用准确率P、召回率R、P和R的调和平均数F1三个指标的条形图展示算法在不同类型肿瘤之间的有效性。
所述数据采集与预处理模块,具体包括如下内容:
基因网络关系数据:基于PINA,InnateDB等数据库提取高质量的蛋白质相互作用关系,进而构建蛋白质所对应的编码基因之间的基因网络,即基因与基因之间的相互作用网络;网络中的节点代表单个基因,边代表两个基因所编码的蛋白之间具有相互作用关系;
疾病患者的变异基因序列:通过相应疾病患者的外显子组DNA测序数据,提取病人的体细胞突变基因。比如可以从ICGC,TCGA等数据库获取恶性肿瘤类疾病患者的变异基因序列;
基因网络关系数据输入基因网络中基因节点向量化子模块;疾病患者的变异基因序列输入疾病患者向量化子模块。
所述病人分类和疾病亚型预测模块包括依次连接的下列三个子模块:
基因网络中基因节点向量化子模块,用于将基因网络中的基因节点实现向量化,并使用node2vec方法实现;向疾病患者向量化子模块输出基因节点的向量表示和疾病患者的变异基因序列;
疾病患者向量化子模块,用于将疾病患者实现向量化,并向疾病亚型预测子模块输出疾病患者的向量表示;
疾病亚型预测子模块,用于将病人在向量化的基础上分成不同的类别,每一类可表征为一种亚型,进而针对不同类别进行临床决策;该分类过程使用softmax回归来实现;
所述结果展示模块,具体包括如下内容:
假设有d1、d2两种疾病类型,以疾病d1的预测结果为例,定义TP为正确预测为d1类型的数量;FP为误把d2类型预测为d1类型的数量;FN为误把d1类型预测为d2类型的数量;则:
所述基因网络中基因节点向量化子模块,包括:
随机游走random walk孙模块,在基因网络上通过随机游走的方式,产生一系列基因节点序列,并向word2vec孙模块输出,具体是:
采用一种有偏的游走策略,即从一个节点向下一个节点的游走概率是不同的,这个概率由参数p(return parameter)和参数q(in-out parameter)来控制。定义随机游走选择下一个节点的公式为:
πvx=αpq(t,x)·wvx (5)
通过上述随机游走的方式,最终产生一系列的节点序列;
word2vec孙模块,计算生成节点向量表征;
word2vec是Google于2013年开源的一款将词表征为实数值向量的高效工具,其基本思想是通过训练将每个词映射成k维实数向量;
由上述randomwalk得到每个基因节点的游走序列,然后使用word2vec工具为每个基因节点生成一个特征向量,即实现基因节点向量化,并将向量化后的数据应用于疾病患者向量化子模块;
所述疾病患者向量化子模块,具体包括如下内容:
基于每个基因节点向量,对于每个疾病患者,可以由其突变基因组成一个多维向量来表征。由于每一个疾病患者突变的基因是不同的,数量也不尽相同。在对患者进行细分类的过程中,需要使每位患者的向量维度相同,因此在构造患者的向量之前,可以先为每一个基因分配一个权重值,以基因A为例,详述A的权重的计算过程:
假设数据中共有N个基因,M个疾病患者,涉及到m种疾病类型,并且每个患者只患有一种疾病。其中基因A在所有患者中突变的次数为nA,基因A在第i类疾病中突变的次数为nAi。则定义基因A的权重值为:
假设患者P的突变基因为{A,B},基因A的向量为αA,基因B的向量为αB,则定义患者P的向量βP为:
βP=wAαA+wBαB (8)
向量化后的疾病患者数据应用于疾病亚型预测子模块;
所述疾病亚型预测子模块,具体包括依次连接的训练回归模型孙模块、计算类别概率孙模块、亚型预测孙模块;
回归模型孙模块,建立训练生成回归模型,并应用于亚型预测孙模块,具体是:
(1)假设函数
类标签y可以取k个不同的值。因此,对于训练集{(x(1),y(2)),…,(x(m),y(m))},有y(i)∈{1,2,…,k}。
对于给定的输入x,用假设函数对每一个类别j估算出概率值p(y=j|x),即估计x的每一种分类结果出现的概率。因此,假设函数需要输出一个k维的向量(向量元素和为1)来表示这k个估计的概率值。假设函数hθ(x)形式如下:
(2)代价函数
代价函数为:
其中,1{·}是示性函数,其取值规则为:1{值为真的表达式}=1;1{值为假的表达式}=0。
对于J(θ)的最小化问题,使用梯度下降法求解最优值,梯度公式如下:
计算类别概率孙模块,计算生成样本被分类为各个类别的概率,具体是:
将x分类为类别j的概率为:
亚型预测孙模块,生成样本被分类成的类别。
本发明的优点是:采用了基因网络分析与机器学习相结合的方法,从基因相互作用层面深入分析病理,给出了一种不同于传统医疗判别疾病类型的思路,在一定程度上促进解决疾病亚型预测的问题,对于临床决策具有重要的指导意义。
附图说明
图1是本发明系统结构示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
本发明实施例提供了一种基于基因网络分析的疾病亚型预测系统,实现对疾病亚型的分类和预测。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明的一部分实施例,而非全部实施例。基于本发明中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本发明保护的范围。
以下进行详细说明。
本发明一种基于基因网络分析的疾病亚型预测系统的一个实施例,可应用于临床决策,本发明提供的一种基于基因网络分析的疾病亚型预测系统,可以包括如下步骤一至步骤五所示的方法步骤:
步骤一、数据采集与预处理
在本发明实施例中,基于PINA,InnateDB等数据库提取高质量的蛋白质相互作用关系,进而构建蛋白质所对应的编码基因之间的基因网络,即基因与基因之间的相互作用网络。网络中的节点代表单个基因,边代表两个基因所编码的蛋白之间具有相互作用关系。通过相应疾病患者的外显子组DNA测序数据,提取病人的体细胞突变基因。比如可以从ICGC,TCGA等数据库获取恶性肿瘤类疾病患者的变异基因序列。
其中,基因网络关系数据应用于步骤二;疾病患者的变异基因序列应用于步骤三。
步骤二、基因网络中基因节点向量化
在本发明实施例中,使用node2vec方法实现基因节点向量化,步骤如下:
(1)random walk,在基因网络上通过随机游走的方式,产生一系列基因节点序列
与普通随机游走不同的是,本发明采用一种有偏的游走策略,即从一个节点向下一个节点的游走概率是不同的,这个概率由参数p(return parameter)和参数q(in-outparameter)来控制。定义随机游走选择下一个节点的公式为:
πvx=αpq(t,x)·wvx (5)
通过上述随机游走的方式,最终产生一系列的节点序列。
(2)word2vec,计算节点向量表征
word2vec是Google于2013年开源的一款将词表征为实数值向量的高效工具,其基本思想是通过训练将每个词映射成k维实数向量。
由上述randomwalk得到每个基因节点的游走序列,然后使用word2vec工具为每个基因节点生成一个特征向量,即实现基因节点向量化。
基因网络中基因节点向量化的数据应用于步骤三。
步骤三、疾病患者向量化
在本发明实施例中,基于每个基因节点向量,对于每个疾病患者,可以由其突变基因组成一个多维向量来表征。由于每一个疾病患者突变的基因是不同的,数量也不尽相同。在对患者进行细分类的过程中,需要使每位患者的向量维度相同,因此在构造患者的向量之前,可以先为每一个基因分配一个权重值,以基因A为例,详述A的权重的计算过程:
假设数据中共有N个基因,M个疾病患者,涉及到m种疾病类型,并且每个患者只患有一种疾病。其中基因A在所有患者中突变的次数为nA,基因A在第i类疾病中突变的次数为nAi。则定义基因A的权重值为:
假设患者P的突变基因为{A,B},基因A的向量为αA,基因B的向量为αB,则定义患者P的向量βP为:
βP=wAαA+wBαB (8)
疾病患者向量化的数据应用于步骤四。
步骤四、疾病亚型预测
在本发明实施例中,将疾病亚型预测问题转化为多分类问题,即将病人在向量化的基础上分成不同的类别,每一类可表征为一种亚型,进而针对不同类别进行临床决策。该分类过程使用softmax回归来实现,模型详述如下:
(1)假设函数
类标签y可以取k个不同的值。因此,对于训练集{(x(1),y(2)),…,(x(m),y(m))},有y(i)∈{1,2,…,k}。
对于给定的输入x,用假设函数对每一个类别j估算出概率值p(y=j|x),即估计x的每一种分类结果出现的概率。因此,本发明的假设函数需要输出一个k维的向量(向量元素和为1)来表示这k个估计的概率值。假设函数hθ(x)形式如下:
(2)代价函数
本发明的代价函数为:
其中,1{·}是示性函数,其取值规则为:1{值为真的表达式}=1;1{值为假的表达式}=0。将x分类为类别j的概率为:
对于J(θ)的最小化问题,使用梯度下降法求解最优值,梯度公式如下:
本发明将疾病患者数据划分成了两个部分:训练集和测试集。首先,使用训练集患者数据训练上述softmax回归模型,最终得到对疾病患者准确分类的模型;然后,用训练好的模型对测试集患者数据进行预测,预测结果的好坏通过结果展示模块展示;最终,将模型应用到实际中,解决疾病亚型预测的问题。
疾病亚型预测的分类结果应用于步骤五。
步骤五、展示疾病亚型预测子模块中预测结果的好坏,测试上述疾病亚型预测算法在不同类型肿瘤之间的有效性,并通过图示展示结果。
在本发明实施例中,使用准确率P、召回率R、P和R的调和平均数F1三个指标的条形图展示算法在不同类型肿瘤之间的有效性。
假设有d1、d2两种疾病类型,以疾病d1的预测结果为例,定义TP为正确预测为d1类型的数量;FP为误把d2类型预测为d1类型的数量;FN为误把d1类型预测为d2类型的数量。则:
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (1)
1.一种基于基因网络分析的疾病亚型预测系统,其特征在于,包括:
数据采集与预处理模块,用于基因网络关系和疾病患者的变异基因序列数据的采集以及预处理,并向病人分类和疾病亚型预测模块输出数据;
病人分类和疾病亚型预测模块,接收来自数据采集与预处理模块的基因网络关系数据以及疾病患者的变异基因序列数据,用于实现疾病亚型预测,取得预测类别结果数据;
结果展示模块,接收来自病人分类和疾病亚型预测模块的预测类别结果数据,用于展示疾病亚型预测子模块中的预测结果,测试疾病亚型预测算法在不同类型肿瘤之间的有效性,并使用准确率P、召回率R、P和R的调和平均数F1三个指标的条形图展示算法在不同类型肿瘤之间的有效性;
所述数据采集与预处理模块,具体包括如下内容:
基因网络关系数据:基于PINA,InnateDB数据库提取高质量的蛋白质相互作用关系,进而构建蛋白质所对应的编码基因之间的基因网络,即基因与基因之间的相互作用网络;网络中的节点代表单个基因,边代表两个基因所编码的蛋白之间具有相互作用关系;
疾病患者的变异基因序列:通过相应疾病患者的外显子组DNA测序数据,提取病人的体细胞突变基因;从ICGC,TCGA数据库获取恶性肿瘤类疾病患者的变异基因序列;
基因网络关系数据输入基因网络中基因节点向量化子模块;疾病患者的变异基因序列输入疾病患者向量化子模块;
所述病人分类和疾病亚型预测模块包括依次连接的下列三个子模块:
基因网络中基因节点向量化子模块,用于将基因网络中的基因节点实现向量化,并使用node2vec方法实现;向疾病患者向量化子模块输出基因节点的向量表示和疾病患者的变异基因序列;
疾病患者向量化子模块,用于将疾病患者实现向量化,并向疾病亚型预测子模块输出疾病患者的向量表示;
疾病亚型预测子模块,用于将病人在向量化的基础上分成不同的类别,每一类可表征为一种亚型,进而针对不同类别进行临床决策;该分类过程使用softmax回归来实现;
所述结果展示模块,具体包括如下内容:
设定d1、d2两种疾病类型,对疾病d1进行预测,定义TP为正确预测为d1类型的数量;FP为误把d2类型预测为d1类型的数量;FN为误把d1类型预测为d2类型的数量;则:
所述基因网络中基因节点向量化子模块,包括:
随机游走random walk孙模块,在基因网络上通过随机游走的方式,产生一系列基因节点序列,并向word2vec孙模块输出,具体是:
采用一种有偏的游走策略,即从一个节点向下一个节点的游走概率是不同的,这个概率由参数p,即return parameter,和参数q,即in-out parameter,来控制;定义随机游走选择下一个节点的公式为:
πvx=αpq(t,x).wvx (5)
通过上述随机游走的方式,最终产生一系列的节点序列;
word2vec孙模块,计算生成节点向量表征;
由上述randomwalk得到每个基因节点的游走序列,然后使用word2vec工具为每个基因节点生成一个特征向量,即实现基因节点向量化,并将向量化后的数据应用于疾病患者向量化子模块;
所述疾病患者向量化子模块,具体包括如下内容:
基于每个基因节点向量,对于每个疾病患者,由其突变基因组成一个多维向量来表征;由于每一个疾病患者突变的基因是不同的,数量也不尽相同;在对患者进行细分类的过程中,需要使每位患者的向量维度相同,因此在构造患者的向量之前,先为每一个基因分配一个权重值,基因A的权重的计算过程:
设定数据中共有N个基因,M个疾病患者,涉及到m种疾病类型,并且每个患者只患有一种疾病;其中基因A在所有患者中突变的次数为nA,基因A在第i类疾病中突变的次数为nAi;则定义基因A的权重值为:
设定患者P的突变基因为{A,B},基因A的向量为αA,基因B的向量为αB,则定义患者P的向量βP为:
βP=wAαA+wBαB (8)
向量化后的疾病患者数据应用于疾病亚型预测子模块;
所述疾病亚型预测子模块,具体包括依次连接的训练回归模型孙模块、计算类别概率孙模块、亚型预测孙模块;
回归模型孙模块,建立训练生成回归模型,并应用于亚型预测孙模块,具体是:
(1)假设函数
类标签y取k个不同的值;因此,对于训练集{(x(1),y(2)),...,(x(m),y(m))},有y(i)∈{1,2,...,k};
对于给定的输入x,用假设函数对每一个类别j估算出概率值p(y=j|x),即估计x的每一种分类结果出现的概率;因此,假设函数需要输出一个k维的向量来表示这k个估计的概率值,其中向量元素和为1;假设函数hθ(x)形式如下:
(2)代价函数
代价函数为:
其中,1{·}是示性函数,其取值规则为:1{值为真的表达式}=1;1{值为假的表达式}=0;
对于J(θ)的最小化问题,使用梯度下降法求解最优值,梯度公式如下:
计算类别概率孙模块,计算生成样本被分类为各个类别的概率,具体是:
将x分类为类别j的概率为:
亚型预测孙模块,生成样本被分类成的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810737793.3A CN109192316B (zh) | 2018-07-02 | 2018-07-02 | 一种基于基因网络分析的疾病亚型预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810737793.3A CN109192316B (zh) | 2018-07-02 | 2018-07-02 | 一种基于基因网络分析的疾病亚型预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109192316A CN109192316A (zh) | 2019-01-11 |
CN109192316B true CN109192316B (zh) | 2021-09-07 |
Family
ID=64936115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810737793.3A Active CN109192316B (zh) | 2018-07-02 | 2018-07-02 | 一种基于基因网络分析的疾病亚型预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109192316B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110246591B (zh) * | 2019-07-15 | 2021-11-05 | 中国中医科学院西苑医院 | 一种中医药治疗人群的预后预测系统 |
US12100480B2 (en) | 2019-08-27 | 2024-09-24 | The Board Of Trustees Of The Leland Stanford Junior University | Assessment of polygenic trait risk via trait components and applications thereof |
US20220293213A1 (en) * | 2019-09-02 | 2022-09-15 | Phil Rivers Technology, Ltd. | Method for acquiring intracellular deterministic events and electronic apparatus |
CN112930573B (zh) * | 2019-09-02 | 2024-06-21 | 北京哲源科技有限责任公司 | 疾病类型自动确定方法及电子设备 |
CN113270139A (zh) * | 2021-05-28 | 2021-08-17 | 中南大学湘雅医院 | 基因型和临床表型相关性分析方法及相关装置 |
CN115019960B (zh) * | 2022-08-01 | 2022-11-29 | 浙江大学 | 一种基于个性化状态空间进展模型的疾病辅助决策系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156503A (zh) * | 2014-07-21 | 2014-11-19 | 金华市中心医院 | 一种基于基因芯片网络分析的疾病风险基因识别方法 |
CN104573410A (zh) * | 2015-01-20 | 2015-04-29 | 合肥工业大学 | 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法 |
CN106126893A (zh) * | 2016-06-17 | 2016-11-16 | 浙江大学 | 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法 |
CN106874706A (zh) * | 2017-01-18 | 2017-06-20 | 湖南大学 | 一种基于功能模块的疾病关联因子识别方法及系统 |
CN107358062A (zh) * | 2017-06-02 | 2017-11-17 | 西安电子科技大学 | 一种双层基因调控网络的构建方法 |
CN107506591A (zh) * | 2017-08-28 | 2017-12-22 | 中南大学 | 一种基于多元信息融合和随机游走模型的药物重定位方法 |
CN108121896A (zh) * | 2017-12-19 | 2018-06-05 | 深圳先进技术研究院 | 一种基于miRNA的疾病间关系分析方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10185803B2 (en) * | 2015-06-15 | 2019-01-22 | Deep Genomics Incorporated | Systems and methods for classifying, prioritizing and interpreting genetic variants and therapies using a deep neural network |
-
2018
- 2018-07-02 CN CN201810737793.3A patent/CN109192316B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156503A (zh) * | 2014-07-21 | 2014-11-19 | 金华市中心医院 | 一种基于基因芯片网络分析的疾病风险基因识别方法 |
CN104573410A (zh) * | 2015-01-20 | 2015-04-29 | 合肥工业大学 | 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法 |
CN106126893A (zh) * | 2016-06-17 | 2016-11-16 | 浙江大学 | 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法 |
CN106874706A (zh) * | 2017-01-18 | 2017-06-20 | 湖南大学 | 一种基于功能模块的疾病关联因子识别方法及系统 |
CN107358062A (zh) * | 2017-06-02 | 2017-11-17 | 西安电子科技大学 | 一种双层基因调控网络的构建方法 |
CN107506591A (zh) * | 2017-08-28 | 2017-12-22 | 中南大学 | 一种基于多元信息融合和随机游走模型的药物重定位方法 |
CN108121896A (zh) * | 2017-12-19 | 2018-06-05 | 深圳先进技术研究院 | 一种基于miRNA的疾病间关系分析方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109192316A (zh) | 2019-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109192316B (zh) | 一种基于基因网络分析的疾病亚型预测系统 | |
Pan et al. | Penalized model-based clustering with application to variable selection. | |
AU2019272065C1 (en) | Deep learning-based framework for identifying sequence patterns that cause sequence-specific errors (SSEs) | |
EP1328805A2 (en) | System and process for validating, aligning and reordering one or more genetic sequence maps using at least one ordered restriction map | |
Vanunu et al. | A propagation-based algorithm for inferring gene-disease associations | |
JP2018530815A (ja) | 生体データにおけるパターン認識のマルチレベルアーキテクチャ | |
Ball et al. | Ancestry DNA matching white paper | |
CN115280415A (zh) | 致病性模型的应用和其训练 | |
Moler et al. | Integrating naive Bayes models and external knowledge to examine copper and iron homeostasis in S. cerevisiae | |
Long et al. | From function to translation: Decoding genetic susceptibility to human diseases via artificial intelligence | |
Li et al. | An empirical Bayes approach for multiple tissue eQTL analysis | |
CN117457065A (zh) | 一种基于单细胞多组学数据识别表型相关细胞类型的方法和系统 | |
Taraszka et al. | Leveraging pleiotropy for joint analysis of genome-wide association studies with per trait interpretations | |
Abdollahi et al. | A multi-objective based clustering for inferring BCR clonal lineages from high-throughput B cell repertoire data | |
Arani et al. | Genetic variant effect prediction by supervised nonnegative matrix tri-factorization | |
Maghasbeh et al. | Towards A Multi Agent System Based Data Mining for Proteins Prediction and Classification | |
Rozenberg et al. | Prohlatype: a probabilistic framework for HLA typing | |
NL2021473B1 (en) | DEEP LEARNING-BASED FRAMEWORK FOR IDENTIFYING SEQUENCE PATTERNS THAT CAUSE SEQUENCE-SPECIFIC ERRORS (SSEs) | |
Ottensmann | Comparing the performance of the gene prioritization methods DEPICT and MAGMA on genome-wide association studies of schizophrenia using the Benchmarker framework | |
Yang et al. | Sparse haplotype-based fine-scale local ancestry inference at scale reveals recent selection on immune responses | |
Ansbacher-Feldman et al. | Family based HLA imputation and optimization of haplo-identical transplants | |
Ranasinghe | Categorizing high dimensional unlabelled genomic data | |
Zhou et al. | Exploring group-specific technical variation patterns of single-cell data | |
Althagafi | Prioritizing Causative Genomic Variants by Integrating Molecular and Functional Annotations from Multiple Biomedical Ontologies | |
Costa Garrido | An evaluation of automated methods for cell type annotation in scRNA-seq data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240108 Address after: Hangzhou Aimer Cell Biotechnology Co., Ltd., Southeast Area, Building 3, Zhejiang Overseas Students Entrepreneurship Park, No. 600 21st Street, Baiyang Street, Qiantang District, Hangzhou City, Zhejiang Province, 310020 Patentee after: Hangzhou Aiermo Cell Biotechnology Co.,Ltd. Address before: Hangzhou Normal University, 2318 yuhangtang Road, Yuhang District, Hangzhou City, Zhejiang Province Patentee before: Hangzhou Normal University |