CN109599182A - 一种基因靶向治疗方案推荐系统及相关系统 - Google Patents
一种基因靶向治疗方案推荐系统及相关系统 Download PDFInfo
- Publication number
- CN109599182A CN109599182A CN201910119881.1A CN201910119881A CN109599182A CN 109599182 A CN109599182 A CN 109599182A CN 201910119881 A CN201910119881 A CN 201910119881A CN 109599182 A CN109599182 A CN 109599182A
- Authority
- CN
- China
- Prior art keywords
- case
- scheme
- data
- therapeutic scheme
- obtains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001225 therapeutic effect Effects 0.000 title claims abstract description 135
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 67
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000003012 network analysis Methods 0.000 claims abstract description 27
- 238000012216 screening Methods 0.000 claims abstract description 27
- 230000001537 neural effect Effects 0.000 claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims description 23
- 238000001914 filtration Methods 0.000 claims description 21
- 230000009467 reduction Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 35
- 230000008569 process Effects 0.000 description 16
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 206010009944 Colon cancer Diseases 0.000 description 2
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 2
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 2
- 230000000711 cancerogenic effect Effects 0.000 description 2
- 231100000315 carcinogenic Toxicity 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 2
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本申请公开了一种基因靶向治疗方案推荐系统,包括:病例数据聚类模块,用于根据分子生态学网络分析对多个病例数据进行分类,得到多个病例集合;其中,病例数据包括基因数据和病例特征数据;相似病例获取模块,用于根据当前病例与各病例集合之间的相似度进行病例筛选,得到相似病例集合;神经网络训练模块,用于根据相似病例集合和对应的治疗方案进行神经网络训练,得到方案推荐模型;治疗方案推荐模块,用于根据方案推荐模型对当前病例进行计算,得到目标治疗方案。通过筛选减少无用数据,提高了模型的准确率。本申请还公开了另一种基因靶向治疗方案推荐系统,具有以上有益效果。
Description
技术领域
本申请涉及医疗数据处理技术领域,特别涉及一种基因靶向治疗方案推荐系统、另一种基因靶向治疗方案推荐系统。
背景技术
随着医疗技术的不断发展,对于癌症出现了癌症基因疗法,简单来说就是通过基因判断诱发癌症的原因,也就是确定癌变基因,再使用治疗方法针对性进行治疗。目前,通常是专家个人进行治疗方案的决策,或采用凝结了专家经验的专家系统对治疗方案进行决策。
但是,目前已知诱发癌变的癌变基因是海量的,对海量信息直接进行分析很难得到准确的因果关系。并且,同一种癌症可能是由多种癌变基因导致的,例如结肠癌就有EGFR、KRNS、ARNS、BRAF等几种癌变基因组合导致。同时,针对每种癌变基因存在有不同的治疗方案,并且,每种治疗方案还有可能存在未被挖掘出来的治疗效果。
总的来说,在现有的治疗方案推荐系统中,由于病人的基因检测数据十分复杂,每个参数并非仅仅单向度的影响治疗方案的决策。因此,不仅是专家个人进行判断,还是采用专家系统进行决策判断,都无法达到确定最佳的治疗方案,使得治疗方案出现偏差。
因此,如何准确的推荐治疗方案是本领域技术人员关注的重点问题。
发明内容
本申请的目的是提供一种基因靶向治疗方案推荐系统、另一种基因靶向治疗方案推荐系统,通过分类和筛选得到与当前病例相似的病例,再进行神经网络训练得到方案推荐模型,减少了无用数据的干扰,提高了模型推荐的准确率。
为解决上述技术问题,本申请提供一种基因靶向治疗方案推荐系统,包括:
病例数据聚类模块,用于根据分子生态学网络分析对多个病例数据进行分类,得到多个病例集合;其中,所述病例数据包括基因数据和病例特征数据;
相似病例获取模块,用于根据当前病例与各病例集合之间的相似度进行病例筛选,得到相似病例集合;
神经网络训练模块,用于根据所述相似病例集合和对应的治疗方案进行神经网络训练,得到方案推荐模型;
治疗方案推荐模块,用于根据所述方案推荐模型对所述当前病例进行计算,得到目标治疗方案。
可选的,所述病例数据聚类模块,包括:
病例数据过滤单元,用于根据每个病例数据的病例特征数据进行过滤,得到过滤病例数据;
病例数据聚类单元,用于采用所述分子生态学网络分析对所述过滤病例数据进行计算,得到所述多个病例集合。
可选的,所述相似病例获取模块,包括:
病例集合预选单元,用于将当前病例与各病例集合分别计算相似度,将相似度最大的作为候选病例集合;
病例集合筛选单元,用于根据所述当前病例对所述候选病例集合进行筛选,得到所述相似病例集合。
可选的,所述病例集合预选单元,包括:
数据化子单元,用于对所述当前病例进行数据化处理,得到当前病例向量;
第一距离计算子单元,用于将所述当前病例向量分别与每个病例集合的奇异特征向量进行距离计算,得到多个第一距离;
候选集合确定单元,用于将第一距离最近的病例集合作为所述候选病例集合。
可选的,所述病例集合筛选单元,包括:
第二距离计算子单元,用于将所述候选病例集合中每个病例的向量与所述当前病例向量进行距离计算,得到多个第二距离;
相似病例获取子单元,用于将第二距离大于预设距离的病例加入到所述相似病例集合,得到所述相似病例集合。
可选的,所述神经网络训练模块,包括:
数据降维单元,用于对所述相似病例集合和对应的治疗方案进行数据降维处理,得到相似病例数据;
模型训练单元,用于根据所述相似病例数据进行神经网络训练,得到所述方案推荐模型。
可选的,所述治疗方案推荐模块,包括:
模型计算单元,用于根据所述方案推荐模型对所述当前病例进行计算,得到多个匹配治疗方案和对应的预计存活周期;
方案筛选单元,用于根据预设规则和对应的预计存活周期对所述多个匹配治疗方案进行筛选,得到目标治疗方案。
本申请还提供一种基因靶向治疗方案推荐系统,包括:
病例数据聚类模块,用于根据分子生态学网络分析对多个病例数据进行分类,得到多个病例集合;
病例集合训练模块,用于根据各病例集合和对应的治疗方案分别进行神经网络训练,得到多个方案推荐模型;
最佳模型匹配模块,用于将与当前病例最相似的病例集合对应的方案推荐模型作为相似方案推荐模型;
治疗方案推荐模块,用于根据所述相似方案推荐模型对所述当前病例进行计算,得到目标治疗方案。
可选的,所述病例数据聚类模块,包括:
病例数据过滤单元,用于根据每个病例数据的病例特征数据进行过滤,得到过滤病例数据;
病例数据聚类单元,用于采用所述分子生态学网络分析对所述过滤病例数据进行计算,得到所述多个病例集合。
可选的,所述治疗方案推荐模块,包括:
模型计算单元,用于根据所述相似方案推荐模型对所述当前病例进行计算,得到多个匹配治疗方案和对应的预计存活周期;
方案筛选单元,用于根据预设规则和对应的预计存活周期对所述多个匹配治疗方案进行筛选,得到目标治疗方案。
本申请所提供的一种基因靶向治疗方案推荐系统,包括:病例数据聚类模块,用于根据分子生态学网络分析对多个病例数据进行分类,得到多个病例集合;其中,所述病例数据包括基因数据和病例特征数据;相似病例获取模块,用于根据当前病例与各病例集合之间的相似度进行病例筛选,得到相似病例集合;神经网络训练模块,用于根据所述相似病例集合和对应的治疗方案进行神经网络训练,得到方案推荐模型;治疗方案推荐模块,用于根据所述方案推荐模型对所述当前病例进行计算,得到目标治疗方案。
通过分子生态学网络分析对病例数据进行分类,再筛选出与当前病例相似的病例集合进行神经网络的训练,也就是降低了神经网络进行训练的数据量,剔除了多余的无用数据,降低病例数据的复杂度,使得方案推荐模型的识别过程更加专精,提高了针对该种病例进行推荐的准确率,避免出现推荐偏差的情况,可以更好的辅助医疗人员进行治疗方案的决策,提高治疗效果。
本申请还提供另一种基因靶向治疗方案推荐系统,具有以上有益效果,在此不做赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种基因靶向治疗方案推荐系统的结构示意图;
图2为本申请实施例所提供的又一种基因靶向治疗方案推荐系统的结构示意图;
图3为本申请实施例所提供的还一种基因靶向治疗方案推荐系统的结构示意图。
具体实施方式
本申请的核心是提供一种基因靶向治疗方案推荐系统、另一种基因靶向治疗方案推荐系统,通过分类和筛选得到与当前病例相似的病例,再进行神经网络训练得到方案推荐模型,减少了无用数据的干扰,提高了模型推荐的准确率。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,在基因靶向治疗方案中,已知诱发癌变的癌变基因是海量的,对海量信息直接进行分析很难得到准确的因果关系。并且,同一种癌症可能是由多种癌变基因导致的,例如结肠癌就有EGFR、KRNS、ARNS、BRAF等几种癌变基因组合导致。同时,针对每种癌变基因存在有不同的治疗方案,并且,每种治疗方案还有可能存在未被挖掘出来的治疗效果。总的来说,在现有的治疗方案推荐系统中,由于病人的基因检测数据十分复杂,每个参数并非仅仅单向度的影响治疗方案的决策。因此,不仅是专家个人进行判断,还是采用专家系统进行决策判断,都无法达到确定最佳的治疗方案,使得治疗方案出现偏差,导致治疗效果降低。
简单的说,就是现有技术中进行基因靶向治疗方案的决策因素极为庞大,每个因素之间的影响关系又极为复杂。一些不必要的因素通常会对治疗方案决策造成重大影响,直接导致最后推荐偏差的治疗方案,有可能降低治疗效果。
因此,本申请提供一种基因靶向治疗方案推荐系统,通过分子生态学网络分析对病例数据进行分类,再筛选出与当前病例相似的病例集合进行神经网络的训练,也就是降低了神经网络进行训练的数据量,剔除了多余的无用数据,降低病例数据的复杂度,使得方案推荐模型的识别过程更加专精,提高了针对该种病例进行推荐的准确率,避免出现推荐偏差的情况,可以更好的辅助医疗人员进行治疗方案的决策,提高治疗效果。
请参考图1,图1为本申请实施例所提供的一种基因靶向治疗方案推荐系统的结构示意图。
本实施例所提供的基因靶向治疗方案推荐系统,主要是通过分子生态学网络分析可以对复杂的包含有基因数据的病例数据进行有效分类,最后的分组情况可以有效的区别出病例之间有关基因的关系,从而使得训练出的推荐模型可以根据当前病例的基因数据进行更加准确的方案推荐。
并且,基于基因的靶向治疗方案是根据病人的基因确定如何进行治疗,因此在对基因靶向治疗方案进行决策时,基因是重要的因素。而且基因之间的复杂度较高,一般的分类方法没有办法做到很好的分类效果,因此采用分子生态学网络分析对其进行分类。
具体的,本实施例中该系统可以包括:
病例数据聚类模块110,用于根据分子生态学网络分析对多个病例数据进行分类,得到多个病例集合;其中,病例数据包括基因数据和病例特征数据。
本模块的主要作用就是将病例数据进行分类,以便可以确定与当前病例相关的病例数据,使得神经网络训练的模型更加适合对该病例对应的情况进行治疗方案推荐。
其中,分子生态学网络分析又简写为MENA(Molecular ecological networkanalyses),主要是将网络分析方法应用于生态学研究中得到的分析方法,可以有效的分析对象之间的相互作用的关系。
可见,根据该网络分析进行分类过程,就是采用分子生态学网络分析进行分析的过程,对病例数据中各种特征之间相互作用关系进行分析,得到各个分类组。
其中,病例数据为已经记录在库的病人案例数据,一般每个病例数据都可以对应有治疗方案数据和治疗效果数据,以便医务人员根据病例数据获取临床治疗的知识。一般的病例数据包括基因数据和病例特征数据,其中基因数据为反应该病人基因情况的基因检测数据,病例特征数据为该病人的生理和物理特征数据,例如,该病人的性别、身高、出生地,年龄等特征数据。
相似病例获取模块120,用于根据当前病例与各病例集合之间的相似度进行病例筛选,得到相似病例集合。
本模块中,主要是根据当前病例与各病例之间的相似度进行病例筛选,得到相似病例集合。可见,本模块中将多余的不相干的病例数据进行排除,只留下与当前病例相似的病例数据,使得神经网络训练的过程可以更加专精,提高了方案推荐模型针对某一种病例情况进行模型推荐的准确率。
其中,将多余的不相干的病例数据进行排除,减少了病例之间一些不相干的联系,也就减少了影响病例推荐决策的因素,从而减少方案推荐的偏差情况,提高方案推荐的准确率。
可以想到的是,本模块中还可以包括相似度计算单元,其中采用的相似度计算方法可以采用现有技术提供的任意一种相似度计算方法,可以采用后续实施例提出的计算方法,在此不做具体限定。
其中,筛选的方法可以是选定最相似的病例集合作为该相似病例集合,还可以是从最相似的病例集合中继续筛选出达到一定相似度标准的病例数据,并集合为该相似病例集合。
神经网络训练模块130,用于根据相似病例集合和对应的治疗方案进行神经网络训练,得到方案推荐模型。
本模块主要是对相似病例集合和对应的治疗方案进行神经网络训练。
其中,本模块可以采用现有技术提供的任意一种神经网络训练方法,在此不做具体限定。
需要说明的是,本模块中进行训练的过程主要是采用相似病例集合和治疗方案,其中,治疗方案包括治疗方式和治疗效果。
治疗方案推荐模块140,用于根据方案推荐模型对当前病例进行计算,得到目标治疗方案。
本模块主要是采用训练出的方案推荐模型进行推荐,也就是进行相应的计算处理,得到目标治疗方案。
其中,计算后得到的结果可以想到的是各治疗方案,也就是治疗方式和对应的预计存活周期。因此,可以根据预计存活周期选出,存活周期最长的治疗方式作为目标治疗方案,也可以选出多个存活周期大于预设周期的治疗方式作为目标治疗方案,还可以选出预计存活周期最短的治疗方式,作为目标治疗方案,以帮助医务人员排除治疗效果最差的治疗方式。
综上,本实施例通过分子生态学网络分析对病例数据进行分类,再筛选出与当前病例相似的病例集合进行神经网络的训练,也就是降低了神经网络进行训练的数据量,剔除了多余的无用数据,降低病例数据的复杂度,使得方案推荐模型的识别过程更加专精,提高了针对该种病例进行推荐的准确率,避免出现推荐偏差的情况,可以更好的辅助医疗人员进行治疗方案的决策,提高治疗效果。
在上一实施例的基础上,本实施例又提供一种基因靶向治疗方案推荐系统。本实施例中主要是对上一实施例中的各个模块中的单元进行介绍,针对不同的模块内单元对该模块又具有更好的运行效果,在以下内容进行详述。
请参考图2,图2为本申请实施例所提供的又一种基因靶向治疗方案推荐系统的结构示意图。
本实施例中,该系统包括:
病例数据聚类模块110可以包括:
病例数据过滤单元111,用于根据每个病例数据的病例特征数据进行过滤,得到过滤病例数据;
病例数据聚类单元112,用于采用分子生态学网络分析对过滤病例数据进行计算,得到多个病例集合。
可见,本模块中先通过病例数据过滤单元,对病例数据进行过滤。其中,具体的过滤方式不做限定。可以是过滤掉特定地区的数据,还可以是过滤掉特定数据源的数据,也可以是过滤到特定年龄段的数据。可见,过滤的方式并不唯一在此不做具体限定,可以根据实际应用情况选择过滤的项目。
当病例数据过滤单元过滤完全后就可以采用分子生态学网络分析对数据进行计算,也就是实现分类。其中,具体的计算过程可以采用现有技术提供的任意一种计算方法,在此不做具体限定。
相似病例获取模块120可以包括:
病例集合预选单元121,用于将当前病例与各病例集合分别计算相似度,将相似度最大的作为候选病例集合;
病例集合筛选单元122,用于根据当前病例对候选病例集合进行筛选,得到相似病例集合。
本模块主要是通过病例集合预选单元和病例集合筛选单元进行详细病例获取。其中,主要是通过病例集合预选单元确定相似的候选病例集合,在通过病例集合筛选单元从候选病例集合中筛选出符合要求的病例组合成相似病例集合。提高了相似病例集合中的病例与当前病例的相似度,使得神经网络训练更加准确。
可选的,该病例集合预选单元121,可以包括:
数据化子单元,用于对当前病例进行数据化处理,得到当前病例向量;
第一距离计算子单元,用于将当前病例向量分别与每个病例集合的奇异特征向量进行距离计算,得到多个第一距离;
候选集合确定单元,用于将第一距离最近的病例集合作为候选病例集合。
本可选方案中,主要介绍了与集合的相似度判断的过程。其中,进行的距离计算可以是欧几里得距离计算。
可选的,该病例集合筛选单元122,可以包括:
第二距离计算子单元,用于将候选病例集合中每个病例的向量与当前病例向量进行距离计算,得到多个第二距离;
相似病例获取子单元,用于将第二距离大于预设距离的病例加入到相似病例集合,得到相似病例集合。
本可选方案中,主要介绍了当前病例与集合中病例之间的相似度判断的过程。其中,进行的距离计算可以是马哈拉诺比斯距离计算。
神经网络训练模块130可以包括:
数据降维单元131,用于对相似病例集合和对应的治疗方案进行数据降维处理,得到相似病例数据;
模型训练单元132,用于根据相似病例数据进行神经网络训练,得到方案推荐模型。
本模块中,首先通过数据降维单元对病例数据进行清洗,也就是对数据进行数据降维处理,再进行网络训练,提高了神经网络训练的效果,减少无效数据的干扰。
治疗方案推荐模块140可以包括:
模型计算单元141,用于根据方案推荐模型对当前病例进行计算,得到多个匹配治疗方案和对应的预计存活周期;
方案筛选单元142,用于根据预设规则和对应的预计存活周期对多个匹配治疗方案进行筛选,得到目标治疗方案。
本模块中,通过方案推荐模型进行计算后会得到多个匹配治疗方案和对应的预计存活周期。再根据该预计存活周期进行筛选,得到目标治疗方案,避免了医务人员还需要对结果进行判断的过程,提高了使用效率。
综上,本实施例通过分子生态学网络分析对病例数据进行分类,再筛选出与当前病例相似的病例集合进行神经网络的训练,也就是降低了神经网络进行训练的数据量,剔除了多余的无用数据,降低病例数据的复杂度,使得方案推荐模型的识别过程更加专精,提高了针对该种病例进行推荐的准确率,避免出现推荐偏差的情况,可以更好的辅助医疗人员进行治疗方案的决策,提高治疗效果。
在以上所有实施例的基础上,本实施例提供还一种基因靶向治疗方案推荐系统。本系统中先执行病例数据聚类模块,然后通过病例集合训练模块训练出多个方案推荐模块,再执行最佳模型匹配模块确定相似方案推荐模型,最后进行治疗方案推荐,得到目标治疗方案。同样,也使每一次的神经网络只针对一部分相似的病例数据进行训练,得到方案推荐模型针对该相似情况的病例进行方案推荐时,拥有更高的准确率,降低出现推荐偏差的可能,提高治疗效果。
请参考图3,图3为本申请实施例所提供的还一种基因靶向治疗方案推荐系统的结构示意图。
本实施例中,该系统可以包括:
病例数据聚类模块210,用于根据分子生态学网络分析对多个病例数据进行分类,得到多个病例集合;
病例集合训练模块220,用于根据各病例集合和对应的治疗方案分别进行神经网络训练,得到多个方案推荐模型
最佳模型匹配模块230,用于将与当前病例最相似的病例集合对应的方案推荐模型作为相似方案推荐模型;
治疗方案推荐模块240,用于根据相似方案推荐模型对当前病例进行计算,得到目标治疗方案。
可见,本方案中针对每种类型的病例数据均训练出对应的方案推荐模型,当使用该模型时,才进行相应的匹配操作,确定相似方案推荐模型,最后进行治疗方案推荐。提高了当出现当前病例,再到计算出治疗方案的效率。
可选的,该病例数据聚类模块210,可以包括:
病例数据过滤单元,用于根据每个病例数据的病例特征数据进行过滤,得到过滤病例数据;
病例数据聚类单元,用于采用分子生态学网络分析对过滤病例数据进行计算,得到多个病例集合。
可选的,该治疗方案推荐模块240,可以包括:
模型计算单元,用于根据相似方案推荐模型对当前病例进行计算,得到多个匹配治疗方案和对应的预计存活周期;
方案筛选单元,用于根据预设规则和对应的预计存活周期对多个匹配治疗方案进行筛选,得到目标治疗方案。
综上,本实施例通过先执行病例数据聚类模块,然后通过病例集合训练模块训练出多个方案推荐模块,再执行最佳模型匹配模块确定相似方案推荐模型,最后进行治疗方案推荐,得到目标治疗方案。同样,也使每一次的神经网络只针对一部分相似的病例数据进行训练,得到方案推荐模型针对该相似情况的病例进行方案推荐时,拥有更高的准确率,降低出现推荐偏差的可能,提高治疗效果。
在以上所有实施例的基础上,本实施例还提供一种应用在基因靶向治疗方案推荐系统的治疗方案推荐方法。通过该方法可以提高治疗方案推荐的准确率。
本实施例中,该方法可以包括:
步骤1,先通过定义过滤条件,比如地区,医疗机构数据来源等;将得到的病人数据放入MENA计算,得到多个分组,每个分组的中心点我们称之为奇异特征向量(single eigenvector,简称SEV);
步骤2,得到MENA算出来的网络之后,将要当前病人数据化,得到当前病例向量,然后与MENA网络中每个分组的SEV分别计算欧几里得距离(Euclidean distance),欧几里得距离最近的组中的所有病人都将被提取出来进入下一步计算;
步骤3,将上一步中得到的组内的所有病人提取出来(可以理解为计算圆心距离最近的一个圆内的所有点都被提取出来),和需要比对的病人一起计算马哈拉诺比斯距离(Mahalanobis distance),计算结果中高于设定阈值的病人将被认定为输入病人的相似病人组,这些病人将用于下一步深度神经网络计算,用以得到推荐治疗方案;
步骤4,深度神经网络训练过程:
步骤401,数据清洗,对相似病人组去除掉特征值残缺的病人数据,例如部分数据可能有生存期基因等信息,但是治疗方案数据缺失,这部分数据不可用;
步骤402,训练计算机深度神经网络模型,首先输入层用双曲正切函数(tanh)做病人向量矩阵拟合。中间层两层,继续用tanh做拟合,同时矩阵降维,最后一层用归一化指数函数(softmax)做数据激活,在大量数据训练之后,输出方案推荐模型;
步骤5,输入当前病人的特征值:年龄、性别、基因等,模型即可给出推荐的治疗方案。
此方法使用深度神经网络直接学习相似病历中医生给出的治疗方案,并且直接对比病人在各种治疗方案下的存活周期,能够给出针对当前病人定制的几种优选治疗方案,此方案最终再由医生选择使用或者做适量修改后,即可直接使用,极大的减少了医生的诊疗难度。
可见,本实施例通过分子生态学网络分析对病例数据进行分类,再筛选出与当前病例相似的病例集合进行神经网络的训练,也就是降低了神经网络进行训练的数据量,剔除了多余的无用数据,降低病例数据的复杂度,使得方案推荐模型的识别过程更加专精,提高了针对该种病例进行推荐的准确率,避免出现推荐偏差的情况,可以更好的辅助医疗人员进行治疗方案的决策,提高治疗效果。
在第一实施例和本实施例中治疗方案推荐方法的基础上,还可以提供一种更加具体的推荐过程。
本实施例中,该推荐过程可以包括:
步骤601,输入大量癌症病人数据,数据要求至少包含年龄、性别、癌变基因、癌变部位、历史用药记录、最终存活周期等数据;
步骤602,使用MENA网络计算得出病人分组数据;
步骤603,输入需要计算的病人得到其相似病人的MENA分组数据;
步骤604,将所有的相似病人数据输入到深度神经网络进行训练,得到方案推荐模型;
步骤605,使用该方案推荐模型计算得出病人的推荐治疗方案。
可见,本实施例通过分子生态学网络分析对病例数据进行分类,再筛选出与当前病例相似的病例集合进行神经网络的训练,也就是降低了神经网络进行训练的数据量,剔除了多余的无用数据,降低病例数据的复杂度,使得方案推荐模型的识别过程更加专精,提高了针对该种病例进行推荐的准确率,避免出现推荐偏差的情况,可以更好的辅助医疗人员进行治疗方案的决策,提高治疗效果。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种基因靶向治疗方案推荐系统、另一种基因靶向治疗方案推荐系统进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
Claims (10)
1.一种基因靶向治疗方案推荐系统,其特征在于,包括:
病例数据聚类模块,用于根据分子生态学网络分析对多个病例数据进行分类,得到多个病例集合;其中,所述病例数据包括基因数据和病例特征数据;
相似病例获取模块,用于根据当前病例与各病例集合之间的相似度进行病例筛选,得到相似病例集合;
神经网络训练模块,用于根据所述相似病例集合和对应的治疗方案进行神经网络训练,得到方案推荐模型;
治疗方案推荐模块,用于根据所述方案推荐模型对所述当前病例进行计算,得到目标治疗方案。
2.根据权利要求1所述的基因靶向治疗方案推荐系统,其特征在于,所述病例数据聚类模块,包括:
病例数据过滤单元,用于根据每个病例数据的病例特征数据进行过滤,得到过滤病例数据;
病例数据聚类单元,用于采用所述分子生态学网络分析对所述过滤病例数据进行计算,得到所述多个病例集合。
3.根据权利要求1所述的基因靶向治疗方案推荐系统,其特征在于,所述相似病例获取模块,包括:
病例集合预选单元,用于将当前病例与各病例集合分别计算相似度,将相似度最大的作为候选病例集合;
病例集合筛选单元,用于根据所述当前病例对所述候选病例集合进行筛选,得到所述相似病例集合。
4.根据权利要求3所述的基因靶向治疗方案推荐系统,其特征在于,所述病例集合预选单元,包括:
数据化子单元,用于对所述当前病例进行数据化处理,得到当前病例向量;
第一距离计算子单元,用于将所述当前病例向量分别与每个病例集合的奇异特征向量进行距离计算,得到多个第一距离;
候选集合确定单元,用于将第一距离最近的病例集合作为所述候选病例集合。
5.根据权利要求4所述的基因靶向治疗方案推荐系统,其特征在于,所述病例集合筛选单元,包括:
第二距离计算子单元,用于将所述候选病例集合中每个病例的向量与所述当前病例向量进行距离计算,得到多个第二距离;
相似病例获取子单元,用于将第二距离大于预设距离的病例加入到所述相似病例集合,得到所述相似病例集合。
6.根据权利要求1至5任一项所述的基因靶向治疗方案推荐系统,其特征在于,所述神经网络训练模块,包括:
数据降维单元,用于对所述相似病例集合和对应的治疗方案进行数据降维处理,得到相似病例数据;
模型训练单元,用于根据所述相似病例数据进行神经网络训练,得到所述方案推荐模型。
7.根据权利要求6所述的基因靶向治疗方案推荐系统,其特征在于,所述治疗方案推荐模块,包括:
模型计算单元,用于根据所述方案推荐模型对所述当前病例进行计算,得到多个匹配治疗方案和对应的预计存活周期;
方案筛选单元,用于根据预设规则和对应的预计存活周期对所述多个匹配治疗方案进行筛选,得到目标治疗方案。
8.一种基因靶向治疗方案推荐系统,其特征在于,包括:
病例数据聚类模块,用于根据分子生态学网络分析对多个病例数据进行分类,得到多个病例集合;
病例集合训练模块,用于根据各病例集合和对应的治疗方案分别进行神经网络训练,得到多个方案推荐模型;
最佳模型匹配模块,用于将与当前病例最相似的病例集合对应的方案推荐模型作为相似方案推荐模型;
治疗方案推荐模块,用于根据所述相似方案推荐模型对所述当前病例进行计算,得到目标治疗方案。
9.根据权利要求8所述的基因靶向治疗方案推荐系统,其特征在于,所述病例数据聚类模块,包括:
病例数据过滤单元,用于根据每个病例数据的病例特征数据进行过滤,得到过滤病例数据;
病例数据聚类单元,用于采用所述分子生态学网络分析对所述过滤病例数据进行计算,得到所述多个病例集合。
10.根据权利要求8或9所述的基因靶向治疗方案推荐系统,其特征在于,所述治疗方案推荐模块,包括:
模型计算单元,用于根据所述相似方案推荐模型对所述当前病例进行计算,得到多个匹配治疗方案和对应的预计存活周期;
方案筛选单元,用于根据预设规则和对应的预计存活周期对所述多个匹配治疗方案进行筛选,得到目标治疗方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910119881.1A CN109599182A (zh) | 2019-02-18 | 2019-02-18 | 一种基因靶向治疗方案推荐系统及相关系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910119881.1A CN109599182A (zh) | 2019-02-18 | 2019-02-18 | 一种基因靶向治疗方案推荐系统及相关系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109599182A true CN109599182A (zh) | 2019-04-09 |
Family
ID=65967453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910119881.1A Pending CN109599182A (zh) | 2019-02-18 | 2019-02-18 | 一种基因靶向治疗方案推荐系统及相关系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109599182A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110970109A (zh) * | 2019-11-14 | 2020-04-07 | 厦门中翎易优创科技有限公司 | 一种基于深度学习的骨科术后康复方案推荐方法 |
CN110993112A (zh) * | 2019-11-20 | 2020-04-10 | 泰康保险集团股份有限公司 | 基于区块链的肿瘤治疗案例管理方法、系统、介质及电子设备 |
CN112086130A (zh) * | 2020-08-13 | 2020-12-15 | 东南大学 | 一种基于测序和数据分析的肥胖风险预测装置及其预测方法 |
CN112870504A (zh) * | 2019-11-29 | 2021-06-01 | 深圳市大雅医疗技术有限公司 | 呼吸治疗方法、装置、呼吸机和服务器 |
CN113094497A (zh) * | 2021-06-07 | 2021-07-09 | 华中科技大学 | 一种电子健康记录推荐方法及共享边缘计算平台 |
CN113257431A (zh) * | 2021-06-18 | 2021-08-13 | 武汉泰乐奇信息科技有限公司 | 一种基于虚拟人虚拟病例的自然人病例生成方法和系统 |
CN116504354A (zh) * | 2023-06-28 | 2023-07-28 | 合肥工业大学 | 一种基于智慧医疗的智能化服务推荐方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915560A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法 |
CN105975794A (zh) * | 2016-05-23 | 2016-09-28 | 上海交通大学 | 基于加权knn的乳腺癌化疗方案推荐方法 |
CN108197664A (zh) * | 2018-01-24 | 2018-06-22 | 北京墨丘科技有限公司 | 模型获取方法、装置、电子设备及计算机可读存储介质 |
CN109215795A (zh) * | 2018-08-10 | 2019-01-15 | 上海交通大学 | 病例复杂度预测方法及系统 |
CN109273099A (zh) * | 2018-08-09 | 2019-01-25 | 上海交通大学 | 多源治疗方案推荐的结论合成方法及系统 |
-
2019
- 2019-02-18 CN CN201910119881.1A patent/CN109599182A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915560A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法 |
CN105975794A (zh) * | 2016-05-23 | 2016-09-28 | 上海交通大学 | 基于加权knn的乳腺癌化疗方案推荐方法 |
CN108197664A (zh) * | 2018-01-24 | 2018-06-22 | 北京墨丘科技有限公司 | 模型获取方法、装置、电子设备及计算机可读存储介质 |
CN109273099A (zh) * | 2018-08-09 | 2019-01-25 | 上海交通大学 | 多源治疗方案推荐的结论合成方法及系统 |
CN109215795A (zh) * | 2018-08-10 | 2019-01-15 | 上海交通大学 | 病例复杂度预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
林昊等: "简明生物信息学", 电子科技大学出版社 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110970109A (zh) * | 2019-11-14 | 2020-04-07 | 厦门中翎易优创科技有限公司 | 一种基于深度学习的骨科术后康复方案推荐方法 |
CN110993112A (zh) * | 2019-11-20 | 2020-04-10 | 泰康保险集团股份有限公司 | 基于区块链的肿瘤治疗案例管理方法、系统、介质及电子设备 |
CN110993112B (zh) * | 2019-11-20 | 2023-04-18 | 泰康保险集团股份有限公司 | 基于区块链的肿瘤治疗案例管理方法、系统、介质及电子设备 |
CN112870504A (zh) * | 2019-11-29 | 2021-06-01 | 深圳市大雅医疗技术有限公司 | 呼吸治疗方法、装置、呼吸机和服务器 |
CN112086130A (zh) * | 2020-08-13 | 2020-12-15 | 东南大学 | 一种基于测序和数据分析的肥胖风险预测装置及其预测方法 |
CN113094497A (zh) * | 2021-06-07 | 2021-07-09 | 华中科技大学 | 一种电子健康记录推荐方法及共享边缘计算平台 |
CN113094497B (zh) * | 2021-06-07 | 2021-09-14 | 华中科技大学 | 一种电子健康记录推荐方法及共享边缘计算平台 |
CN113257431A (zh) * | 2021-06-18 | 2021-08-13 | 武汉泰乐奇信息科技有限公司 | 一种基于虚拟人虚拟病例的自然人病例生成方法和系统 |
CN116504354A (zh) * | 2023-06-28 | 2023-07-28 | 合肥工业大学 | 一种基于智慧医疗的智能化服务推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109599182A (zh) | 一种基因靶向治疗方案推荐系统及相关系统 | |
US10872131B2 (en) | Progression analytics system | |
da Silva Lourenço et al. | Machine learning for detection of interictal epileptiform discharges | |
Nevado-Holgado et al. | Characterising the dynamics of EEG waveforms as the path through parameter space of a neural mass model: application to epilepsy seizure evolution | |
CN107358014B (zh) | 一种生理数据的临床前处理方法及系统 | |
US20180211727A1 (en) | Automated Evidence Based Identification of Medical Conditions and Evaluation of Health and Financial Benefits Of Health Management Intervention Programs | |
CN101911078A (zh) | 基于疾病概率向量检索类似患者病例 | |
CN104756117A (zh) | 用于临床决策支持的对血栓形成的临床风险因子与分子标记物的组合使用 | |
EP1534122A2 (en) | Medical decision support systems utilizing gene expression and clinical information and method for use | |
CN109325792A (zh) | 信用评估变量的分箱方法及分箱装置、设备和存储介质 | |
Steering Committee of the Cardiac Care Network of Ontario* et al. | Predicting mortality after coronary artery bypass surgery: what do artificial neural networks learn? | |
CN111602202A (zh) | 用于患者数据可用性分析的装置 | |
Panda et al. | A detailed systematic review on retinal image segmentation methods | |
Asaithambi et al. | Classification of respiratory abnormalities using adaptive neuro fuzzy inference system | |
Buza | Asterics: Projection-based classification of eeg with asymmetric loss linear regression and genetic algorithm | |
Hee | Is data quality enough for a clinical decision?: apply machine learning and avoid bias | |
CN115019960B (zh) | 一种基于个性化状态空间进展模型的疾病辅助决策系统 | |
Lu et al. | Channel Contribution in Deep Learning Based Automatic Sleep Scoring—How Many Channels Do We Need? | |
Amalarathinam et al. | A New Monotony Advanced Decision Tree Using Graft Algorithm to Predict the Diagnosis of Diabetes Mellitus | |
EP3891761A1 (en) | Integrated system and method for personalized stratification and prediction of neurodegenerative disease | |
CN115394448A (zh) | 冠心病运动反应性预测模型的建模方法、模型、设备 | |
Joshi et al. | A Review on Application of Machine Learning in Medical Diagnosis | |
CN111184948A (zh) | 基于血管靶向光动力疗法的鲜红斑痣处理方法及系统 | |
CN118136270B (zh) | 一种基于数据分析慢病健康监测与预警系统与方法 | |
Malik et al. | Heart Disease Prediction Using Artificial Intelligence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190409 |