CN110837859A - 一种融合多维度医疗数据的肿瘤精细分类系统及方法 - Google Patents
一种融合多维度医疗数据的肿瘤精细分类系统及方法 Download PDFInfo
- Publication number
- CN110837859A CN110837859A CN201911060228.9A CN201911060228A CN110837859A CN 110837859 A CN110837859 A CN 110837859A CN 201911060228 A CN201911060228 A CN 201911060228A CN 110837859 A CN110837859 A CN 110837859A
- Authority
- CN
- China
- Prior art keywords
- tumor
- data
- classification model
- module
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
- G06V2201/032—Recognition of patterns in medical or anatomical images of protuberances, polyps nodules, etc.
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种融合多维度医疗数据的肿瘤精细分类系统,包括多医疗数据源、多源数据采集器、目标配置管理、融合计算、肿瘤类目配置、肿瘤类别标注处理、肿瘤数据库、肿瘤分类模型和肿瘤分类结果输出模块,其中:融合计算模块:根据目标配置管理模块配置的融合目标,对采集的多源数据进行融合计算;所述肿瘤分类模型训练模块:基于深度学习框架,读取所述肿瘤数据库,进行肿瘤分类模型的训练;所述肿瘤分类模型:基于深度学习框架和肿瘤数据库的数据训练而成的分类模型,所述肿瘤分类模型写入到肿瘤数据库多肿瘤数据进行分类。本发明实现了肿瘤的分类准确率的自主优化,实现肿瘤的快速精准诊断,为临床专家提供有效决策支撑。
Description
技术领域
本发明涉及多维度医疗数据和融合分析领域,具体涉及一种融合多维度医疗数据的肿瘤精细分类系统及方法。
背景技术
癌症起源于上皮组织的恶性肿瘤,是恶性肿瘤中最常见的一类;根据GLOBOCAN数据, 2018年全球有1800万新增癌症病例以及960万癌症死亡病例,而我国有新发病例数380.4万例以及死亡病例229.6万例。肿瘤的及时精确诊断尤为重要,可以及早发现病情,并获得及时治疗;肿瘤诊断需要丰富的医疗数据支撑,同时还需要多年临床经验的资深肿瘤医生进行全方位的诊断,才能得到较为精确的肿瘤诊断结果。
“专家系统”(Expert System)是指具有相当于专家的知识和经验水平以及解决专门问题能力的计算机系统;自1968年由费根鲍姆主持研制完成的第一个专家系统DENDRAL(质谱数据分析、推断化学分子结构的系统)以来,已经在各行各业中研制了大量的专家系统。医学专家系统是一种专家系统,可以用于疾病诊断,到目前为止,医学专家系统主要采用总结大量专家知识,形成规则和推理系统的方式来构建;以斯坦福大学研发的MYCIN医学专家系统为例,MYCIN存放有大量传染病专家长期积累的知识,它们是肖特利夫与许多著名的传染病专家交谈,推理和总结得到的,他把这些知识归纳成200多条规则(后扩充至500多条)存放在计算机中,这些规则具有“如果…那么…”这种形式,称为产生式规则。然而,MYCIN建议的诊断结果和治疗方案的可接受度仅为69%,直接反映出其疾病诊断准确率不高。
深度学习是大数据时代的算法利器,成为近几年的研究热点。和传统的人工智能算法相比,深度学习技术有着两方面的优势。一是深度学习技术可随着数据规模的增加不断提升其性能,而传统人工智能算法(包括基于规则的专家系统)难以利用海量数据持续提升其性能。二是深度学习技术可以从数据中直接提取特征,削减了对每一个问题设计特征提取器的工作,而传统人工智能算法需要人工提取特征,例如传统的医学专家系统就需要基于数据进行专家规则的提取。深度学习技术所具有的优势在某些领域已经取得不错的进展,例如,基于深度卷积网络的图像分类技术已超过人眼的准确率,基于深度神经网络的语音识别技术已达到95%的准确率,基于深度神经网络的机器翻译技术已接近人类的平均翻译水平。
在肿瘤诊断方面,已经积累了丰富的大数据,包括肿瘤病人的生物样本库、临床诊断数据等;但是,不同检测标准获取的健康指标数据不均一,导致大规模肿瘤数据的搜集、存储、融合分析等尚未形成统一标准,无法有效整合利用及共享。而且,肿瘤类型与数据的映射关系没有规律可言,不同类型的肿瘤可有同样的生物组织和分子分型,而同一类型的肿瘤可有不同生物组织和分子分型,临床上专家也往往难以确诊肿瘤类型并决定何种治疗手段。
由于以上问题,深度学习技术目前在肿瘤诊断方面缺少成熟有效的系统,多源不规整的肿瘤诊断数据也未获得有效利用。
发明内容
为了解决上述技术问题,本发明的提供一种肿瘤的分类准确率高,肿瘤诊断快速精准的一种融合多维度医疗数据的肿瘤精细分类系统及方法。
为实现上述目的,本发明采取的技术方案如下:一种融合多维度医疗数据的肿瘤精细分类系统,其特征在于,包括多医疗数据源、多源数据采集器、目标配置管理、融合计算、肿瘤类目配置、肿瘤类别标注处理、肿瘤数据库、肿瘤分类模型和肿瘤分类结果输出模块,其中:
所述多医疗数据源是肿瘤医疗信息的来源;
所述多源数据采集器:对多医疗数据源的数据进行多源采集,所述多源数据为不规整的异构数据;
所述目标配置管理模块:用于对融合计算模块的融合计算进行配置管理,设定融合目标;
融合计算模块:根据目标配置管理模块配置的融合目标,对采集的多源数据进行融合计算;
所述肿瘤类目配置模块:用于对肿瘤的类目体系进行配置,所述类目体系为多级类目;
所述肿瘤类别标注处理模块:用于对融合计算后的多源医疗数据进行肿瘤类别标注处理;
所述肿瘤数据库:用于对融合计算模块的输出数据、肿瘤类目配置数据、肿瘤类别标注处理数据进行集中存储,为所述肿瘤分类模型训练模块和肿瘤分类模型提供数据支撑;
所述肿瘤分类模型训练模块:基于深度学习框架,读取所述肿瘤数据库,进行肿瘤分类模型的训练;
所述肿瘤分类模型:基于深度学习框架和肿瘤数据库的数据训练而成的分类模型,所述肿瘤分类模型写入到肿瘤数据库多肿瘤数据进行分类;
所述肿瘤分类结果输出模块:用于输出未标注数据的分类结果。
优选地,所述多医疗数据源的数据来源包括生物组织数据、数据标注、影像数据、诊断数据、治疗数据和康复数据。
优选地,所述多源数据采集器采集的方式包括但不限于数据源置入数据采集模块、数据接口接入和数据库导入的方式进行采集。
优选地,所述融合目标包括但不限于对采集到的多源数据进行新建、修改、删除或查询。
优选地,所述融合计算模块的融合计算包括但不限于数据筛选或数据的标准格式化处理。
优选地,肿瘤类别标注处理包括:源数据中已有标注的选择性抽样复核,未标注进行选择性新标注。
优选地,所述深度学习框架包括但不限于TensorFlow、Keras和Caffe。
一种融合多维度医疗数据的肿瘤精细分类方法,该方法包括以下步骤:
S201多源数据采集:从多个数据源获取与肿瘤相关的数据信息,获取到的数据为不规整的异构数据,用于肿瘤分类模型训练。
S202融合目标配置管理:对采集到的多源异构数据进行融合目标配置管;
S203多源数据融合计算:根据目标配置管理模块配置的融合目标,对数据进行融合计算:包括数据筛选和数据的标准格式化处理操作;
S204肿瘤类目配置:对肿瘤的类目体系进行配置;
S205肿瘤类别标注处理:对融合计算后的多源医疗数据进行肿瘤类别标注处理;
S206待训练数据写入肿瘤数据库:将待训练数据写入肿瘤数据库,供肿瘤分类模型训练模块和肿瘤分类模型使用,所述待训练数据包括融合计算模块的输出数据、肿瘤类目配置数据和肿瘤类别标注处理数据;
S207肿瘤分类模型训练:基于深度学习框架,读取肿瘤数据库,进行肿瘤分类模型的训练,形成训练好的肿瘤分类模型;
S208肿瘤分类模型写入数据库:将肿瘤分类模型写入肿瘤数据库对肿瘤数据库进行肿瘤的判别、分类及标注;
其中,所述步骤S202、S203可以和步骤S204、S205并行处理。
优选地,所述肿瘤分类模型进行肿瘤判别的流程如下:
S301待确诊病例多源数据采集:从多个数据源获取待确诊病例的多维度数据;
S302融合目标配置管理:对多源异构数据进行融合目标配置管理;
S303多源数据融合计算:根据目标配置管理模块配置的融合目标,对待确诊病例数据进行融合计算,包括数据筛选、数据的标准格式化处理等操作。
S304待确诊数据写入肿瘤数据库:将待确诊数据写入肿瘤数据库,待确诊数据主要为融合计算模块的输出数据;
S305待确诊病例肿瘤分类:肿瘤分类模型对待确诊数据进行分类,以实现肿瘤的自动精细诊断;
S306肿瘤分类结果输出:将病例的肿瘤确诊分类结果进行输出。
本发明有益的技术效果:
1)多维度医疗数据的有效利用:本发明可以有效利用肿瘤诊断方面已经积累的海量数据,通过多源数据融合计算模块融合多源不规整数据,使数据符合分类系统的格式要求,实现当前现有的多维度医疗数据的有效利用。
2)肿瘤的精准诊断:本发明系统打破肿瘤类型与数据映射关系的规律发现困局,提出了基于深度学习框架的肿瘤分类模型,可以基于灵活的肿瘤类目配置和增量的标注数据进行肿瘤分类模型的迭代优化,实现肿瘤的分类准确率的自主优化,实现肿瘤的快速精准诊断,为临床专家提供有效决策支撑。
附图说明
图1为本发明的一种融合多维度医疗数据的肿瘤精细分类系统的整体结构示意图。
图2为本发明的一种融合多维度医疗数据的肿瘤精细分类方法的步骤流程图。
图3为本发明肿瘤分类模型进行肿瘤判别的步骤流程图。
图4为一种融合多维度医疗数据的肿瘤精细分类系统实施例的结构示意图。
图5是本发明的一种融合多维度医疗数据的肿瘤精细分类方法实施例的步骤流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明,但本发明要求保护的范围并不局限于下述具体实施例。
如图1所示,一种融合多维度医疗数据的肿瘤精细分类系统,包括多医疗数据源、多源数据采集器、目标配置管理、融合计算、肿瘤类目配置、肿瘤类别标注处理、肿瘤数据库、肿瘤分类模型和肿瘤分类结果输出模块,其中:
所述多医疗数据源是肿瘤医疗信息的来源,提供本发明系统的数据源,数据来源包括影像数据、诊断数据、治疗数据、康复数据、生物组织数据和数据标注等,这里的数据源允许数据格式不一以及数据存储方式不同。
所述多源数据采集器:对多医疗数据源的数据进行多源采集,所述多源数据为不规整的异构数据;可以采用在数据源置入数据采集模块、数据接口接入、数据库导入等方式进行采集。
所述目标配置管理模块:用于对融合计算模块的融合计算进行配置管理,设定融合目标;配置包括对融合目标进行新建、修改、删除、查询等操作,可以采用JSON格式的方式定义融合目标,例如,对过大的文件舍弃进行约束的一种可选的融合目标格式为:{“约束”:“舍弃001”,“原因”:“fileSize>=100MB”,“描述”:“文件过大”“创建时间”:“2017-02-1307:34:19”}。
融合计算模块:根据目标配置管理模块配置的融合目标,对采集的多源数据进行融合计算,包括数据筛选、数据的标准格式化处理等操作,使数据符合深度学习模型的格式要求。
所述肿瘤类目配置模块:用于对肿瘤的类目体系进行配置,所述类目体系为多级类目;
例如,一级目录是良性肿瘤和恶性肿瘤;二级类目的恶性肿瘤又分为上皮组织肿瘤、非淋巴造血间叶组织肿瘤、造血淋巴组织肿瘤等;三级类目的上皮组织肿瘤又分为鳞状上皮肿瘤、腺上皮肿瘤、移行上皮肿瘤等。
所述肿瘤类别标注处理模块:用于对融合计算后的多源医疗数据进行肿瘤类别标注处理;源数据中已有标注的可以选择性抽样复核,未标注进行选择性新标注,选择性指本系统支持部分标注,即使数据没有完整标注,模型也是可以训练的。
所述肿瘤数据库:用于对融合计算模块的输出数据、肿瘤类目配置数据、肿瘤类别标注处理数据进行集中存储,为所述肿瘤分类模型训练模块和肿瘤分类模型提供数据支撑;
所述肿瘤分类模型训练模块:基于深度学习框架,读取所述肿瘤数据库,进行肿瘤分类模型的训练;可以选择的深度学习框架包括TensorFlow、Keras、Caffe等。
所述肿瘤分类模型:基于深度学习框架和肿瘤数据库的数据训练而成的分类模型,所述肿瘤分类模型写入到肿瘤数据库多肿瘤数据进行分类;模型本身在数据更新后,可以迭代训练,以适应数据源的增量更新;对未标注的新数据源,可以进行自动分类,以实现肿瘤的自动精细分类。
所述肿瘤分类结果输出模块:用于输出未标注数据的分类结果。输出格式可以是JSON 格式或XML格式。例如,一种可选的JSON输出格式为:
{“病例编号”:“med_case01990”,“判断时间”:“2018-01-22 13:12:23”,“可能的肿瘤类型”:[{“肿瘤名1”:“X”,“概率”:0.68},{“肿瘤名2”:“Y”,“概率”:0.12},], “数据源”:[{“数据编号”:“data_no098”,“数据时间”:“2017-12-23 09:22:33”}, {“数据编号”:“data_no103”,“数据时间”:“2017-12-24 10:12:22”},]}。
如图2所示,一种融合多维度医疗数据的肿瘤精细分类方法,该方法包括包括S201多源数据采集、S202融合目标配置管理、S203多源数据融合计算、S204肿瘤类目配置、S205肿瘤类别标注处理、S206数据写入肿瘤数据库、S207肿瘤分类模型训练等7个步骤,其中S202、S203可以和S204、S205并行,具体步骤如下:
S201多源数据采集:从多个数据源获取与肿瘤相关的数据信息,获取到的数据为不规整的异构数据,用于肿瘤分类模型训练。
S202融合目标配置管理:对采集到的多源异构数据进行融合目标配置管;
S203多源数据融合计算:根据目标配置管理模块配置的融合目标,对数据进行融合计算:包括数据筛选和数据的标准格式化处理操作;
S204肿瘤类目配置:对肿瘤的类目体系进行配置;
S205肿瘤类别标注处理:对融合计算后的多源医疗数据进行肿瘤类别标注处理;
S206待训练数据写入肿瘤数据库:将待训练数据写入肿瘤数据库,供肿瘤分类模型训练模块和肿瘤分类模型使用,所述待训练数据包括融合计算模块的输出数据、肿瘤类目配置数据和肿瘤类别标注处理数据;
S207肿瘤分类模型训练:基于深度学习框架,读取肿瘤数据库,进行肿瘤分类模型的训练,形成训练好的肿瘤分类模型;
S208肿瘤分类模型写入数据库:将肿瘤分类模型写入肿瘤数据库对肿瘤数据库进行肿瘤的判别、分类及标注;
参照图3,具体地,所述肿瘤分类模型进行肿瘤判别的方法包括301待确诊病例多源数据采集、S302融合目标配置管理、S303多源数据融合计算、S304待确诊数据写入肿瘤数据库、S305待确诊病例肿瘤分类、S306肿瘤分类结果输出等6个步骤,具体步骤如下:
S301待确诊病例多源数据采集:从多个数据源获取待确诊病例的多维度数据;
S302融合目标配置管理:对多源异构数据进行融合目标配置管理;
S303多源数据融合计算:根据目标配置管理模块配置的融合目标,对待确诊病例数据进行融合计算,包括数据筛选、数据的标准格式化处理等操作。
S304待确诊数据写入肿瘤数据库:将待确诊数据写入肿瘤数据库,待确诊数据主要为融合计算模块的输出数据;
S305待确诊病例肿瘤分类:肿瘤分类模型对待确诊数据进行分类,以实现肿瘤的自动精细诊断;
S306肿瘤分类结果输出:将病例的肿瘤确诊分类结果进行输出。
如图4所示,是一种融合多维度医疗数据的肿瘤精细分类系统部署的一个具体实施例,系统由多源数据采集服务器、目标配置管理服务器、融合计算服务器、肿瘤类目配置服务器、肿瘤类别标注处理服务器、肿瘤数据库服务器、肿瘤分类模型训练服务器、肿瘤分类模型服务器、肿瘤分类结果输出服务器组成,系统中的所有模块均采用解耦设计,各模块可独立部署,并可以分布式多节点方式部署,使系统实现高性能、高可靠、易扩展。
其中:
1)多源数据采集服务器上部署多源数据采集器,负责多源医疗数据的采集。
2)目标配置管理服务器上部署目标配置管理模块,负责融合目标的配置管理。
3)融合计算服务器上部署融合计算模块,负责数据的融合计算。
4)肿瘤类目配置服务器上部署肿瘤类目配置模块,负责肿瘤的类目体系配置,支持类目体系的增删改查操作。
5)肿瘤类别标注处理服务器上部署肿瘤类别标注处理模块,负责多源医疗数据的肿瘤类别标注处理。
6)肿瘤数据库服务器上部署肿瘤数据库,负责融合计算模块的输出数据、肿瘤类目配置数据、肿瘤类别标注处理数据、训练出来的肿瘤分类模型的集中存储。
7)肿瘤分类模型训练服务器上部署肿瘤分类模型训练模块,负责肿瘤分类模型的训练。
8)肿瘤分类模型服务器上部署肿瘤分类模型,负责肿瘤分类模型的迭代训练,并对未标注的新数据源进行自动分类,实现肿瘤的自动精细分类。
9)肿瘤分类结果输出服务器上部署肿瘤分类结果输出模块,负责数据的分类结果输出。
如图5所示,是一种融合多维度医疗数据的肿瘤精细分类方法应用于肿瘤自动确诊并将确诊结果推送到医生电脑的具体实施例,为肿瘤治疗方案提供诊断结果支持。
应用的具体流程如下:
1)多医疗数据源接入系统:系统运维人员将多医疗数据源接入肿瘤精细分类系统,可以采用在数据源置入数据采集模块、数据接口接入、数据库导入等方式。
2)数据融合目标配置管理和肿瘤类目配置:配置管理员对数据融合目标进行配置管理,并对肿瘤类目进行配置管理。
3)数据融合计算:系统对多源数据进行融合计算,包括数据筛选、数据的标准格式化处理等操作,使数据符合深度学习模型的格式要求。
4)肿瘤类别标注:数据标注人员对源数据中已有标注的可以选择性抽样复核,未标注进行选择性新标注。
5)肿瘤分类模型训练:系统基于深度学习框架,进行肿瘤分类模型的迭代训练,并形成逐步优化的肿瘤分类模型。
6)待确证病例肿瘤分类:系统对未标注的新数据源,基于肿瘤分类模型进行肿瘤的自动分类。
7)病例肿瘤确诊分类结果输出:系统将病例的肿瘤确诊分类结果输出到医生侧。
8)在医生电脑展示结果:病例的肿瘤确诊分类结果在医生电脑上展示,展示方式可以是台式或笔记本计算机的网页浏览器或客户端程序、平板电脑或移动智能手机的APP应用程序、等。
本发明的系统及方法:
1)提出了一种目标配置管理模块,支持对多源不规整数据进行融合计算处理的配置,可以采用JSON格式的方式定义融合目标,并支持融合目标的增删改查操作,实现目标配置管理的灵活性;进一步,通过融合计算模块,根据目标配置管理模块配置的融合目标,对数据进行融合计算,包括数据筛选、数据的标准格式化处理等操作,使数据符合深度学习模型的格式要求。
2)系统提出了肿瘤类目配置模块,可以对肿瘤的多级类目体系进行灵活配置;通过肿瘤类别标注处理模块,对融合计算后的多源医疗数据进行肿瘤类别标注处理;肿瘤分类模型训练模块不需要经过传统机器学习方法的特征抽取和规则提炼,而是采用了深度学习的技术机制,基于海量的标注数据,依托现在的分布式高速计算能力(例如GPU、AI芯片等),即可自动训练出肿瘤分类模型,并可以基于灵活的肿瘤类目配置和增量的标注数据进行肿瘤分类模型的迭代优化,实现肿瘤分类准确率的自主优化。
根据上述说明书的揭示和教导,本发明所属领域的技术人员还可以对上述实施方式进行变更和修改。因此,本发明并不局限于上面揭示和描述的具体实施方式,对发明的一些修改和变更也应当落入本发明的权利要求的保护范围内。此外,尽管本说明书中使用了一些特定的术语,但这些术语只是为了方便说明,并不对发明构成任何限制。
Claims (9)
1.一种融合多维度医疗数据的肿瘤精细分类系统,其特征在于,包括多医疗数据源、多源数据采集器、目标配置管理、融合计算、肿瘤类目配置、肿瘤类别标注处理、肿瘤数据库、肿瘤分类模型和肿瘤分类结果输出模块,其中:
所述多医疗数据源是肿瘤医疗信息的来源;
所述多源数据采集器:对多医疗数据源的数据进行多源采集,所述多源数据为不规整的异构数据;
所述目标配置管理模块:用于对融合计算模块的融合计算进行配置管理,设定融合目标;
融合计算模块:根据目标配置管理模块配置的融合目标,对采集的多源数据进行融合计算;
所述肿瘤类目配置模块:用于对肿瘤的类目体系进行配置,所述类目体系为多级类目;
所述肿瘤类别标注处理模块:用于对融合计算后的多源医疗数据进行肿瘤类别标注处理;
所述肿瘤数据库:用于对融合计算模块的输出数据、肿瘤类目配置数据、肿瘤类别标注处理数据进行集中存储,为所述肿瘤分类模型训练模块和肿瘤分类模型提供数据支撑;
所述肿瘤分类模型训练模块:基于深度学习框架,读取所述肿瘤数据库,进行肿瘤分类模型的训练;
所述肿瘤分类模型:基于深度学习框架和肿瘤数据库的数据训练而成的分类模型,所述肿瘤分类模型写入到肿瘤数据库多肿瘤数据进行分类;
所述肿瘤分类结果输出模块:用于输出未标注数据的分类结果。
2.如权利要求1所述的一种融合多维度医疗数据的肿瘤精细分类系统,其特征在于,所述多医疗数据源的数据来源包括生物组织数据、数据标注、影像数据、诊断数据、治疗数据和康复数据。
3.如权利要求1所述的一种融合多维度医疗数据的肿瘤精细分类系统,其特征在于,所述多源数据采集器采集的方式包括但不限于数据源置入数据采集模块、数据接口接入和数据库导入的方式进行采集。
4.如权利要求1所述的一种融合多维度医疗数据的肿瘤精细分类系统,其特征在于,所述融合目标包括但不限于对采集到的多源数据进行新建、修改、删除或查询。
5.如权利要求1所述的一种融合多维度医疗数据的肿瘤精细分类系统,其特征在于,所述融合计算模块的融合计算包括但不限于数据筛选或数据的标准格式化处理。
6.如权利要求1所述的一种融合多维度医疗数据的肿瘤精细分类系统,其特征在于,肿瘤类别标注处理包括:源数据中已有标注的选择性抽样复核,未标注进行选择性新标注。
7.如权利要求1所述的一种融合多维度医疗数据的肿瘤精细分类系统,其特征在于,所述深度学习框架包括但不限于TensorFlow、Keras和Caffe。
8.一种融合多维度医疗数据的肿瘤精细分类方法,其特征在于,该方法包括以下步骤:
S201多源数据采集:从多个数据源获取与肿瘤相关的数据信息,获取到的数据为不规整的异构数据,用于肿瘤分类模型训练。
S202融合目标配置管理:对采集到的多源异构数据进行融合目标配置管;
S203多源数据融合计算:根据目标配置管理模块配置的融合目标,对数据进行融合计算:包括数据筛选和数据的标准格式化处理操作;
S204肿瘤类目配置:对肿瘤的类目体系进行配置;
S205肿瘤类别标注处理:对融合计算后的多源医疗数据进行肿瘤类别标注处理;
S206待训练数据写入肿瘤数据库:将待训练数据写入肿瘤数据库,供肿瘤分类模型训练模块和肿瘤分类模型使用,所述待训练数据包括融合计算模块的输出数据、肿瘤类目配置数据和肿瘤类别标注处理数据;
S207肿瘤分类模型训练:基于深度学习框架,读取肿瘤数据库,进行肿瘤分类模型的训练,形成训练好的肿瘤分类模型;
S208肿瘤分类模型写入数据库:将肿瘤分类模型写入肿瘤数据库对肿瘤数据库进行肿瘤的判别、分类及标注;
其中,所述步骤S202、S203可以和步骤S204、S205并行处理。
9.如权利要求8所述的一种融合多维度医疗数据的肿瘤精细分类方法,其特征在于,所述肿瘤分类模型进行肿瘤判别的流程如下:
S301待确诊病例多源数据采集:从多个数据源获取待确诊病例的多维度数据;
S302融合目标配置管理:对多源异构数据进行融合目标配置管理;
S303多源数据融合计算:根据目标配置管理模块配置的融合目标,对待确诊病例数据进行融合计算,包括数据筛选、数据的标准格式化处理等操作。
S304待确诊数据写入肿瘤数据库:将待确诊数据写入肿瘤数据库,待确诊数据主要为融合计算模块的输出数据;
S305待确诊病例肿瘤分类:肿瘤分类模型对待确诊数据进行分类,以实现肿瘤的自动精细诊断;
S306肿瘤分类结果输出:将病例的肿瘤确诊分类结果进行输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911060228.9A CN110837859A (zh) | 2019-11-01 | 2019-11-01 | 一种融合多维度医疗数据的肿瘤精细分类系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911060228.9A CN110837859A (zh) | 2019-11-01 | 2019-11-01 | 一种融合多维度医疗数据的肿瘤精细分类系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110837859A true CN110837859A (zh) | 2020-02-25 |
Family
ID=69575865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911060228.9A Pending CN110837859A (zh) | 2019-11-01 | 2019-11-01 | 一种融合多维度医疗数据的肿瘤精细分类系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110837859A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2591177A (en) * | 2019-11-21 | 2021-07-21 | Hsiao Ching Nien | Method and apparatus of intelligent analysis for liver tumour |
CN113205504A (zh) * | 2021-05-12 | 2021-08-03 | 青岛大学附属医院 | 基于知识图谱的人工智能肾肿瘤预测系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102348979A (zh) * | 2009-03-09 | 2012-02-08 | 乔治亚大学研究基金公司 | 胃癌诊断用蛋白标记的鉴定 |
CN106295092A (zh) * | 2015-05-13 | 2017-01-04 | 仁智(苏州)医学研究有限公司 | 临床医疗的多维度数据分析方法和系统 |
CN110264462A (zh) * | 2019-06-25 | 2019-09-20 | 电子科技大学 | 一种基于深度学习的乳腺超声肿瘤识别方法 |
-
2019
- 2019-11-01 CN CN201911060228.9A patent/CN110837859A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102348979A (zh) * | 2009-03-09 | 2012-02-08 | 乔治亚大学研究基金公司 | 胃癌诊断用蛋白标记的鉴定 |
CN106295092A (zh) * | 2015-05-13 | 2017-01-04 | 仁智(苏州)医学研究有限公司 | 临床医疗的多维度数据分析方法和系统 |
CN110264462A (zh) * | 2019-06-25 | 2019-09-20 | 电子科技大学 | 一种基于深度学习的乳腺超声肿瘤识别方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2591177A (en) * | 2019-11-21 | 2021-07-21 | Hsiao Ching Nien | Method and apparatus of intelligent analysis for liver tumour |
CN113205504A (zh) * | 2021-05-12 | 2021-08-03 | 青岛大学附属医院 | 基于知识图谱的人工智能肾肿瘤预测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Junos et al. | An optimized YOLO‐based object detection model for crop harvesting system | |
CN110680326B (zh) | 基于深度卷积神经网络的尘肺病鉴别及分级判定方法 | |
CN110335647A (zh) | 一种临床数据标准化系统及标准化数据采集方法 | |
CN106682411A (zh) | 一种将体检诊断数据转化为疾病标签的方法 | |
CN105808712A (zh) | 将文本类医疗报告转换为结构化数据的智能系统及方法 | |
CN111222340A (zh) | 基于多标准主动学习的乳腺电子病历实体识别系统 | |
CN109727680A (zh) | 一种基于大数据技术的区域临床路径管理系统 | |
CN112349369A (zh) | 医疗影像大数据智能分析方法、系统及存储介质 | |
CN110837859A (zh) | 一种融合多维度医疗数据的肿瘤精细分类系统及方法 | |
CN105139430A (zh) | 一种基于图熵的医学图像聚类方法 | |
Guo et al. | DeepLN: an artificial intelligence-based automated system for lung cancer screening | |
CN114399634B (zh) | 基于弱监督学习的三维图像分类方法、系统、设备及介质 | |
Zhao et al. | Mammographic image classification system via active learning | |
Xu et al. | Identification of benign and malignant lung nodules in CT images based on ensemble learning method | |
CN112382355A (zh) | 一种智慧医疗数据管理方法、存储介质及系统 | |
CN114610748B (zh) | 基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用 | |
CN109034392A (zh) | 一种罗非鱼杂交配套系的选育方法及系统 | |
CN113705318B (zh) | 基于图像的识别方法、装置、设备及可读存储介质 | |
CN110010231A (zh) | 一种数据处理系统及计算机可读存储介质 | |
CN114064904A (zh) | 一种用于医疗文本的聚类方法、系统及装置 | |
CN110675927A (zh) | 一种基于大数据的病情检索方法 | |
Hong | [Retracted] Application of Data Mining in Network Information Dynamic Push Software | |
CN110415791A (zh) | 一种病种库建立系统及方法 | |
Ejaz et al. | Implementation of computer aided diagnosis system for lung cancer detection | |
Kumar et al. | Cervical Cancer Prediction Using Machine Learning Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |