CN111863237A - 一种基于深度学习的移动端疾病智能辅助诊断系统 - Google Patents

一种基于深度学习的移动端疾病智能辅助诊断系统 Download PDF

Info

Publication number
CN111863237A
CN111863237A CN202010473320.4A CN202010473320A CN111863237A CN 111863237 A CN111863237 A CN 111863237A CN 202010473320 A CN202010473320 A CN 202010473320A CN 111863237 A CN111863237 A CN 111863237A
Authority
CN
China
Prior art keywords
medical
disease
mobile
cloud server
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010473320.4A
Other languages
English (en)
Inventor
梁经伦
叶国良
陈立甲
吴佳鑫
黄冠淋
张木荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan University of Technology
Original Assignee
Dongguan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan University of Technology filed Critical Dongguan University of Technology
Priority to CN202010473320.4A priority Critical patent/CN111863237A/zh
Publication of CN111863237A publication Critical patent/CN111863237A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度学习的移动端疾病智能辅助诊断系统,具有移动医疗终端和移动医疗云服务器;移动医疗终端包括:语音识别模块、文字录入模块、移动医疗云服务器连接接口;移动医疗云服务器包括:图像处理模块、医疗知识库、知识推理模块;移动医疗云服务器中的知识推理模块接收文本主诉,并利用医疗知识库对文本主诉进行知识推理,得到疾病诊断结果和判定结果,并通过移动医疗云服务器连接接口反馈给移动医疗终端。本发明通过移动医疗终端输入病症并传送到移动医疗云服务器,利用云端存储技术,建立了集医学常识、临床指南、医疗知识库,用于模糊匹配,根据最优判定结果引导病人补充病症描述,从而提高了疾病诊断的效率和精确度。

Description

一种基于深度学习的移动端疾病智能辅助诊断系统
技术领域
本发明涉及移动医疗技术领域,具体地说是利用移动互联网来提供智能诊断辅助系统。
背景技术
目前,“人工智能+医疗”快速发展。医学是一门靠归纳逻辑、经验学习、循证运用的学科,人工智能在这个行业可以发挥重要作用。同时,我国医疗资源短缺,供给严重不足,人工智能在医疗行业的应用可以提升医生工作效率,变相提升医疗资源的供给。在政策推动和算法红利的促进下,“人工智能+医疗”快速发展,目前我国医学影像数据的年增长率约为30%,而放射科医师数量的年增长率为4.1%,其间的差距是25.9%,放射科医师的数量增长远不及影像数据的增长。以病理切片为例,据国家卫计委统计,我国病理注册医生在1万人左右,按照每百张床配备1—2名病理医生的标准计算,全国病理科医生缺口可能达3—4万人,目前,全国有近40%的手术未进行病理切片分析。所以通过AI的方式辅助影像科医师进行诊断将满足市场刚需,人工读片具备主观性高、重复性低、定量及信息利用度不足、耗时及劳动强度和知识经验的传承困难等问题。而人工智能读片的优势体现在高效率低成本。随着产品的成熟带动识别率的提升,人工智能读片的精准度也将形成比较优势。在此背景下,本申请人提出了一种基于深度学习的移动端疾病智能辅助诊断系统。
发明内容
本发明的目的在于提供一种基于深度学习的移动端疾病智能辅助诊断系统,利用“人工智能+医疗”,提升疾病诊断效率及准确性。
为达到上述目的,本发明采用如下技术方案:
一种基于深度学习的移动端疾病智能辅助诊断系统,其特征在于,该系统具有移动医疗终端和移动医疗云服务器;
所述移动医疗终端包括:语音识别模块、文字录入模块、移动医疗云服务器连接接口;
所述移动医疗云服务器包括:图像处理模块、医疗知识库、知识推理模块;其中,医疗知识库包含电子病历和医学影像数据;
所述移动医疗云服务器中的知识推理模块接收文本主诉,并利用所述医疗知识库对所述文本主诉进行知识推理,得到疾病诊断结果和判定结果,从而生成分析结果,并通过移动医疗云服务器连接接口反馈给所述移动医疗终端。
上述方案进一步是,所述医疗知识库搜索医院影像以及病理报告数据库获细胞癌图及病理结果搜索医院影像以及病理报告数据库获细胞癌图及病理结果,对样本进行数据标注并提取病灶区域,经过图像预处理,形成样本输入,移动终端采集的患者主诉数据集训练用于迁移学习的预训练模型,经过多次循环反馈,形成训练好的的迁移学习模型,与样本比较形成特征向量输出,利用LightGBM在决策树的基础上进行模型集成,观察是否符合预期,符号则保存模型,否则利用贝叶斯优化进行超参数调优形成新的超参数重复,模型拟合成功后,利用模型对细胞癌类进行预测。
上述方案进一步是,所述知识推理模块包括:医学文本分词处理器、医疗文本停止词词库、模糊匹配处理器、智能排序处理器、包含最优规则集的最优化判定处理器;
所述医学文本分词处理器对所述疾病信息表里的信息进行分词处理,得到分词后疾病信息表;
所述移动医疗云服务器基于医学文本停止词词库,对分词后的临床信息表和疾病信息表进行去除停止词处理,得到去除停止词的临床信息表和疾病信息表;
所述移动医疗云服务器基于医学文本停止词词库,对所述文本主诉进行去除停止词处理,从而得到文本主诉的关键字;
所述模糊匹配处理器利用模糊匹配算法和所述医疗数据索引对所述文本主诉的关键字与去除停止词的临床信息表和疾病信息表进行模糊匹配,得到初步疾病诊断结果;
所述智能排序处理器对所述初步疾病诊断结果进行相关度估计后,得到评分结果,并对所述评分结果进行智能化排序,得到排序结果;从所述排序结果中取出前N条数据,作为疾病诊断结果;
所述最优化判定处理器利用所述最优规则集对所述疾病诊断结果进行最优化判定,若所述疾病诊断结果满足所述最优规则集中的任意一条规则,则表示所述疾病诊断结果达到最优,令判定结果为“True”;否则,表示所述疾病诊断结果未达到最优,令判定结果为“False”。
上述方案进一步是,该系统用于肺小结节 CT 图像良恶性鉴别,首先,收集具有病理结果的肺部DICOM图像,解析DICOM图像,以单一模板获取文件灰度信息以及所包含的图像像素信息,将图像灰度值进行归一化处理,同时为了防止网络过拟合现象,需要增加训练图像数量,对图像进行随机的旋转、翻转、扭曲、调节对比度、亮度等增强及扰动数据预处理操作;其次,从底层的像素级信息提取肺结节多尺度视图下的二维特征,针对图像的大小,合理选择卷积核大小和网络深度,为了增强模型的性能以及减少参数量,引入 Residualblock、Inception、SoftMax 辅助分类器的结构,并采用批标准化的措施减少过深网络所带来的 Internal Covariate Shift 等问题;激励函数采用 Leaky ReLU 非饱和激励函数,既可减少梯度弥散问题,也可防止 ReLU 的神经元坏死导致无法训练的问题;结合Dropout、L2 正则化等概念减缓过拟合的现象;根据任务实际建立代价矩阵,样本标签经过one-hot 编码后使用交叉熵作为模型的损失函数;基于 TensorFlow 框架搭建分布式机器学习系统训练神经网络模型,利用贝叶斯优化对模型的超参数进行调优,进而得到训练准确率与验证准确率;最后对肺结节良恶性智能鉴别模型进行评测分析,研究去假阳性参数优化内在机理,得到敏感度、特异度和AUC为评价指标。
上述方案进一步是,该系统用于肺部肿瘤 CT 图像病理分析,首先,收集具有病理结果的肺部DICOM图像,解析肺部DICOM图像,以多模板获取文件灰度信息,并对病灶区域进行选取,确定图像序列号,为了减轻网络过拟合现象,需要增加训练图像数量,对图像进行旋转、镜像、增加白噪声等增强及扰动数据预处理操作;其次,为了解决训练样本图像因人为介入而数量较少而深度学习模型需要大量样本之间的矛盾,提出基于迁移学习网络模型对训练样本进行特征抽取,进而在尽量保留特征信息的前提下编码为低维度的特征向量并大量减小深度学习模型调优和训练的时间成本,再利用 LightGBM和 XGBoost 的基于梯度Boost 来集成决策树分类器的框架,把弱分类器进行集成为一个强分类器,进而保证在小样本集的情况下,达到一个理想的分类效果;然后基于 TensorFlow 分布式机器学习系统搭建和微调神经网络模型,并利用贝叶斯优化对 LightGBM 和 XGBoost 的超参数进行调优,得到训练准确率与验证准确率;最后,对非小细胞肺癌智能鉴别模型进行评测分析,得到敏感度,特异度和 AUC 为评价指标。
上述方案进一步是,所述的移动医疗终端包括手机、平板电脑及其它具有WiFi联网功能的嵌入式设备。
与现有技术相比,本发明有益效果体现在:
1、通过移动医疗终端,用于病人在陌生环境中输入自己的病症并传送到移动医疗云服务器,并且集成了语音输入功能,云端服务根据病人的病症描述分析病症并返回诊断结果和导医结果。
2、利用云端存储技术,建立了集医学常识、临床指南、医疗知识库,用于模糊匹配,能够使病人在移动互联网环境下不受地理限制的访问本系统。
3、知识推理模块运用了文本分词技术,文本去除停止词技术,模糊匹配方法和TF-IDF算法,可以快速有效地根据病人病情描述进行诊断,产生疾病诊断结果,同时根据最优规则集判断疾病诊断结果是否最优,并根据最优判定结果引导病人补充病症描述,从而提高了疾病诊断的效率和精确度。
4、数据管理模块运用数据库技术,可以很快地将疾病诊断结果抽取出来。
5、从个人移动终端设备上采集病人的文本主诉(如果是语音主诉则转换为文本主诉),利用接口将文本主诉传到移动医疗云服务器,移动医疗云服务器根据患者主诉自动给出诊断,并根据疾病诊断结果,如果疾病诊断结果不是最优,可以引导病人继续补充主诉,多次迭代后可以使疾病诊断结果更加精确。
附图说明:
附图1为本发明的总体框图;
附图2为本发明的移动医疗终端运行流程图;
附图3为本发明的自然语言处理示意图;
附图4为本发明的Watson确定最佳解答处理示意图。
具体实施方式:
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
参阅图1、2所示,本发明提出的一种基于深度学习的移动端疾病智能辅助诊断系统,该系统具有移动医疗终端和移动医疗云服务器。
移动医疗终端包括手机、平板电脑及其它具有WiFi联网功能的嵌入式设备,可移动使用,使用简便、快捷。所述移动医疗终端包括:语音识别模块、文字录入模块、移动医疗云服务器连接接口;所述移动医疗云服务器包括:图像处理模块、医疗知识库、知识推理模块;其中,医疗知识库包含电子病历和医学影像数据。移动医疗云服务器连接接口用于移动医疗终端通过网络与移动医疗云服务器相连,并达到移动医疗终端与移动医疗云服务器之间双向通讯。
所述移动医疗云服务器中的知识推理模块接收文本主诉,并利用所述医疗知识库对所述文本主诉进行知识推理,得到疾病诊断结果和判定结果,从而生成分析结果,并通过移动医疗云服务器连接接口反馈给所述移动医疗终端。
所述医疗知识库搜索医院影像以及病理报告数据库获细胞癌图及病理结果搜索医院影像以及病理报告数据库获细胞癌图及病理结果,对样本进行数据标注并提取病灶区域,经过图像预处理,形成样本输入,移动终端采集的患者主诉数据集训练用于迁移学习的预训练模型,经过多次循环反馈,形成训练好的的迁移学习模型,与样本比较形成特征向量输出,利用LightGBM在决策树的基础上进行模型集成,观察是否符合预期,符号则保存模型,否则利用贝叶斯优化进行超参数调优形成新的超参数重复,模型拟合成功后,利用模型对细胞癌类进行预测。
所述医疗知识库:
1. 诊前:可用于个体或群体性疾病的预测,并给出健康建议,可预防传染病的扩散。
2. 诊中:人工智能可以辅助诊断、辅助治疗,降低误诊率。
3. 诊后:能通过计算机视觉、图像识别和视频分析等渠道保证患者服药的真实性,辅助医生实现患者药物依从性的监督。
4. 其他环节:保险机构费用智能控制;人工智能参与到药物研发过程中,可以缩短时间、提高效率。
智能影像诊断是“人工智能+医疗”较快落地的应用领域:
1. 基于医学影像的智能识别;
2. 基于电子病历的辅助诊断,后者的典型案例是IBMWatson,目前已经落地WatsonforOncology的肿瘤辅助诊断治疗的AI产品。
Watson提炼洞察与深度QA工作原理:
在Watson分析问题并确定最佳解答的过程中,运用了先进的自然语言处理、信息检索、知识表达和推理和机器学习技术。Watson依靠核心的IBMDeepQA技术,来生成假设、收集大量证据、并进行分析和评估。Watson通过加载数以百万计的文件,包括字典、百科全书、网页主题分类、宗教典籍、小说、戏剧和其他资料,来构建它的知识体系。
搜索引擎的工作方式是,理解问题,并给出大量相关文档作为解答;与搜索引擎不同,用户可以用自然语言向Watson提出问题,Watson则能够反馈精确的答案。从解答的过程来看,Watson通过使用数以百计的算法,而非单一算法,来搜索问题的候选答案、并对每个答案进行评估打分,同时为每个候选答案收集其他支持材料,并使用复杂的自然语言处理技术深度评估搜集到的相关材料。当越来越多的算法运算的结果聚焦到某一个答案时,这个答案的可信度就会越高。Watson会衡量每个候选答案的支持证据,来确认最佳的选择及其可信度。当这个答案的可信度达到一定的水平时,Watson就会将它作为最佳答案呈现出来。
· Watson 如何提炼洞察
分析非结构化数据:采用自然语言处理技术理解语法和语境,如图3所示;
理解复杂问题:评估所有可能含义, 然后确定问题含义,如图4所示;
呈现答案和解决方案:根据找到的支持性证据和高质量信息作答。
Watson 如何回答问题:
Watson 需要先学习新主题,然后才能回答这个主题的相关问题
学习新主题
1.将所有相关材料加载到Watson 中,比如 Word 文档、PDF 和网页;
2.添加配对问题和答案,就该主题对Watson 进行训练;出现新的信息时,Watson 会自动更新回答问题;
Watson 会搜索数百万个文档,从中找出数千条可能答案,收集证据,然后使用评分算法评估证据的质量,根据对支持性证据的评分排列所有可能答案。
所述知识推理模块包括:医学文本分词处理器、医疗文本停止词词库、模糊匹配处理器、智能排序处理器、包含最优规则集的最优化判定处理器。所述医学文本分词处理器对所述疾病信息表里的信息进行分词处理,得到分词后疾病信息表;所述移动医疗云服务器基于医学文本停止词词库,对分词后的临床信息表和疾病信息表进行去除停止词处理,得到去除停止词的临床信息表和疾病信息表;所述移动医疗云服务器基于医学文本停止词词库,对所述文本主诉进行去除停止词处理,从而得到文本主诉的关键字;所述模糊匹配处理器利用模糊匹配算法和所述医疗数据索引对所述文本主诉的关键字与去除停止词的临床信息表和疾病信息表进行模糊匹配,得到初步疾病诊断结果;所述智能排序处理器对所述初步疾病诊断结果进行相关度估计后,得到评分结果,并对所述评分结果进行智能化排序,得到排序结果;从所述排序结果中取出前N条数据,作为疾病诊断结果;所述最优化判定处理器利用所述最优规则集对所述疾病诊断结果进行最优化判定,若所述疾病诊断结果满足所述最优规则集中的任意一条规则,则表示所述疾病诊断结果达到最优,令判定结果为“True”;否则,表示所述疾病诊断结果未达到最优,令判定结果为“False”。
知识推理模块是首先将临床信息表和疾病信息表进行预处理,然后获取患者主诉的关键词,最后将患者主诉的关键词和与处理后的疾病信息表进行模糊匹配,得到匹配结果并进行筛选,其具体方法如下:
在知识推理之前,首先,医学文本分词处理器对电子病历和疾病信息表里的疾病简介、临床表现、治疗方法进行分词处理,得到分词后的疾病信息表;然后,移动医疗云服务器基于医学文本停止词词库,对分词后的临床信息表的电子病历和疾病信息表里的疾病简介、临床表现、治疗方法进行去除停止词处理,得到去除停止词的疾病信息表;在移动医疗云服务器收到文本主诉之后,移动医疗云服务器基于医学文本停止词词库,对文本主诉进行去除停止词处理,从而得到文本主诉的关键字;模糊匹配处理器利用模糊匹配算法和医疗数据索引对文本主诉的关键字与去除停止词的临床信息表的电子病历和疾病信息表里的疾病简介、临床表现、治疗方法进行模糊匹配,得到初步疾病诊断结果;智能排序处理器对初步疾病诊断结果进行相关度评分后,相关度评分可以应用TF-IDF算法和BM25打分法,但不仅限于这些算法。得到评分结果,并对评分结果进行智能化排序,得到排序结果;从排序结果中取出前N条数据,作为疾病诊断结果;其应用TF-IDF算法的具体实施步骤如下:
1)、对患者文本主诉的关键字ti,它的词频(TF)为:
Figure DEST_PATH_IMAGE003
ni ,j是该词在诊断结果dj中的出现次数,而分母则是在诊断结果dj中所有字词的出现次数之和;
2)、对患者文本主诉的关键字ti,它的逆向文件频数(IDF)为:
Figure 273658DEST_PATH_IMAGE004
|D|表示临床信息表的电子病历和疾病信息表里的疾病的总数合,|j:ti∈dj|表示初步疾病诊断结果数,若疾病诊断结果数为0,则表示为1+|j:ti∈dj|;
3)、关键字ti对于诊断结果dj中的相关度为:tfidfi ,j=tfi ,j×idfi;
4)、对相关度评分结果进行降序排序,并去除前N条数据,作为疾病诊断结果。
最优化判定处理器利用最优规则集对疾病诊断结果进行最优化判定,若疾病诊断结果满足最优规则集中的任意一条规则,则表示疾病诊断结果达到最优,令判定结果为“True”;否则,表示疾病诊断结果未达到最优,令判定结果为“False”;最有规则集有:数目规则,评分规则,但不仅限于这些规则。其具体实现步骤如下:
1)数目规则:若疾病诊断结果只有一个,则认为诊断结果为最优,另最优判断结果为“True”;
2)评分规则:设定阈值α,令排序后的第一个诊断结果相关度评分为G1,排序后的第一个诊断结果相关度评分为G2,若G1-G2>α,则认为诊断结果为最优,另最优判断结果为“True”;
3)如果疾病诊断结果不满足最优规则集中的任意一条规则,表示疾病诊断结果未达到最优,令最优判断结果为“False”。
实施例1:
图1、2所示,该系统用于肺小结节 CT 图像良恶性鉴别,首先,收集具有病理结果的肺部DICOM图像,解析DICOM图像,以单一模板获取文件灰度信息以及所包含的图像像素信息,将图像灰度值进行归一化处理,同时为了防止网络过拟合现象,需要增加训练图像数量,对图像进行随机的旋转、翻转、扭曲、调节对比度、亮度等增强及扰动数据预处理操作;其次,从底层的像素级信息提取肺结节多尺度视图下的二维特征,针对图像的大小,合理选择卷积核大小和网络深度,为了增强模型的性能以及减少参数量,引入 Residual block、Inception、SoftMax 辅助分类器的结构,并采用批标准化的措施减少过深网络所带来的Internal Covariate Shift 等问题;激励函数采用 Leaky ReLU 非饱和激励函数,既可减少梯度弥散问题,也可防止 ReLU 的神经元坏死导致无法训练的问题;结合 Dropout、L2正则化等概念减缓过拟合的现象;根据任务实际建立代价矩阵,样本标签经过 one-hot 编码后使用交叉熵作为模型的损失函数;基于 TensorFlow 框架搭建分布式机器学习系统训练神经网络模型,利用贝叶斯优化对模型的超参数进行调优,进而得到训练准确率与验证准确率;最后对肺结节良恶性智能鉴别模型进行评测分析,研究去假阳性参数优化内在机理,得到敏感度、特异度和AUC为评价指标。
肺小结节 CT 图像良恶性鉴别使用 LUNA16 数据库和合作医院影像数据库,其中LUNA16 数据库来自于公开的 TheLung Image Database Consortium and ImageDatabase Resource Initiative (LIDC/IDRI),这是全球公开最大的肺结节研究的医学数据库。该数据库排除切片厚度大于 2.5 mm 的扫描图像,总共包括 888 套 CT 图像。
实施例2:
图1、2所示,该系统用于肺部肿瘤 CT 图像病理分析,首先,收集具有病理结果的肺部DICOM图像,解析肺部DICOM图像,以多模板获取文件灰度信息,并对病灶区域进行选取,确定图像序列号,为了减轻网络过拟合现象,需要增加训练图像数量,对图像进行旋转、镜像、增加白噪声等增强及扰动数据预处理操作;其次,为了解决训练样本图像因人为介入而数量较少而深度学习模型需要大量样本之间的矛盾,提出基于迁移学习(TransferLearning)网络模型对训练样本进行特征抽取,进而在尽量保留特征信息的前提下编码为低维度的特征向量并大量减小深度学习模型调优和训练的时间成本,再利用 LightGBM和XGBoost 的基于梯度 Boost 来集成决策树分类器的框架,把弱分类器进行集成为一个强分类器,进而保证在小样本集的情况下,达到一个理想的分类效果;然后基于 TensorFlow分布式机器学习系统搭建和微调神经网络模型,并利用贝叶斯优化对 LightGBM 和XGBoost 的超参数进行调优,得到训练准确率与验证准确率;最后,对非小细胞肺癌(鳞癌,腺癌和大细胞癌)智能鉴别模型进行评测分析,得到敏感度,特异度和 AUC 为评价指标。
基于深度学习的肺部肿瘤 CT 图像病理分析使用美国 TCIA 数据库和合作医院(东莞市人民医院)影像数据库,其中美国 NIH TCIA(The Cancer Imaging Archive)影像数据中心的数据,包括 380 例肺部非小细胞癌症患者的CT 影像数据。研究分析不同影像类型、不同数据来源的评价指标的差异性和共通性。通过不同的数据来源,优化图像提取算法及深度学习模型参数,提升算法的鲁棒性,减小过拟合现象。
通过对肺部医学影像进行预处理增强肺部病灶区域,并用3D建模实现肺部影像立体视觉效果,而影像的数据测量功能有助于辅助医生诊断更加精确,科学,全面;加快以智能化,数字化为中心的辅助诊断系统建设。系统可对DICOM,JPG,IMA,BMP格式的医学影像进行处理,分为5个功能模块:第一部分是肺部影像预处理,包括改进型均衡化,几何变换,滤波处理,形态学等功能的实现;第二部分是肺实质分割,包括滚球法分割,多阈值法分割,基于灰度级分层的伪彩色分割,手动分割,肺结节的提取功能;第三部分是肺部影像伪彩色处理功能的实现;第四部分是肺部影像3D建模可变视角观察;第五部分是对提取的病灶区域进行边界提取,踩点测距,面积及周长的计算功能。系统优化了功能类型,实现功能的多样化,专业化,智能化,并且实现了肺部立体式旋转观察,增强了影像细节部分的显示功能。
本发明有益效果体现在:
1、通过移动医疗终端,用于病人在陌生环境中输入自己的病症并传送到移动医疗云服务器,并且集成了语音输入功能,云端服务根据病人的病症描述分析病症并返回诊断结果和导医结果。
2、利用云端存储技术,建立了集医学常识、临床指南、医疗知识库,用于模糊匹配,能够使病人在移动互联网环境下不受地理限制的访问本系统。
3、知识推理模块运用了文本分词技术,文本去除停止词技术,模糊匹配方法和TF-IDF算法,可以快速有效地根据病人病情描述进行诊断,产生疾病诊断结果,同时根据最优规则集判断疾病诊断结果是否最优,并根据最优判定结果引导病人补充病症描述,从而提高了疾病诊断的效率和精确度。
4、数据管理模块运用数据库技术,可以很快地将疾病诊断结果抽取出来。
5、从个人移动终端设备上采集病人的文本主诉(如果是语音主诉则转换为文本主诉),利用接口将文本主诉传到移动医疗云服务器,移动医疗云服务器根据患者主诉自动给出诊断,并根据疾病诊断结果,如果疾病诊断结果不是最优,可以引导病人继续补充主诉,多次迭代后可以使疾病诊断结果更加精确。
以上虽然结合附图描述了本发明的较佳具体实施例,但本发明不应被限制于与以上的描述和附图完全相同的结构和操作,对本技术领域的技术人员来说,在不超出本发明构思和范围的情况下通过逻辑分析、推理或者有限的实验还可对上述实施例作出许多等效改进和变化,但这些改进和变化都应属于本发明要求保护的范围。

Claims (6)

1.一种基于深度学习的移动端疾病智能辅助诊断系统,其特征在于,该系统具有移动医疗终端和移动医疗云服务器;
所述移动医疗终端包括:语音识别模块、文字录入模块、移动医疗云服务器连接接口;
所述移动医疗云服务器包括:图像处理模块、医疗知识库、知识推理模块;其中,医疗知识库包含电子病历和医学影像数据;
所述移动医疗云服务器中的知识推理模块接收文本主诉,并利用所述医疗知识库对所述文本主诉进行知识推理,得到疾病诊断结果和判定结果,从而生成分析结果,并通过移动医疗云服务器连接接口反馈给所述移动医疗终端。
2.根据权利要求1所述的一种基于深度学习的移动端疾病智能辅助诊断系统,其特征在于,所述医疗知识库搜索医院影像以及病理报告数据库获细胞癌图及病理结果搜索医院影像以及病理报告数据库获细胞癌图及病理结果,对样本进行数据标注并提取病灶区域,经过图像预处理,形成样本输入,移动终端采集的患者主诉数据集训练用于迁移学习的预训练模型,经过多次循环反馈,形成训练好的的迁移学习模型,与样本比较形成特征向量输出,利用LightGBM在决策树的基础上进行模型集成,观察是否符合预期,符号则保存模型,否则利用贝叶斯优化进行超参数调优形成新的超参数重复,模型拟合成功后,利用模型对细胞癌类进行预测。
3.根据权利要求1所述的一种基于深度学习的移动端疾病智能辅助诊断系统,其特征在于,所述知识推理模块包括:医学文本分词处理器、医疗文本停止词词库、模糊匹配处理器、智能排序处理器、包含最优规则集的最优化判定处理器;
所述医学文本分词处理器对所述疾病信息表里的信息进行分词处理,得到分词后疾病信息表;
所述移动医疗云服务器基于医学文本停止词词库,对分词后的临床信息表和疾病信息表进行去除停止词处理,得到去除停止词的临床信息表和疾病信息表;
所述移动医疗云服务器基于医学文本停止词词库,对所述文本主诉进行去除停止词处理,从而得到文本主诉的关键字;
所述模糊匹配处理器利用模糊匹配算法和所述医疗数据索引对所述文本主诉的关键字与去除停止词的临床信息表和疾病信息表进行模糊匹配,得到初步疾病诊断结果;
所述智能排序处理器对所述初步疾病诊断结果进行相关度估计后,得到评分结果,并对所述评分结果进行智能化排序,得到排序结果;从所述排序结果中取出前N条数据,作为疾病诊断结果;
所述最优化判定处理器利用所述最优规则集对所述疾病诊断结果进行最优化判定,若所述疾病诊断结果满足所述最优规则集中的任意一条规则,则表示所述疾病诊断结果达到最优,令判定结果为“True”;否则,表示所述疾病诊断结果未达到最优,令判定结果为“False”。
4.根据权利要求1或2或3所述的一种基于深度学习的移动端疾病智能辅助诊断系统,其特征在于,该系统用于肺小结节 CT 图像良恶性鉴别,首先,收集具有病理结果的肺部DICOM图像,解析DICOM图像,以单一模板获取文件灰度信息以及所包含的图像像素信息,将图像灰度值进行归一化处理,同时为了防止网络过拟合现象,需要增加训练图像数量,对图像进行随机的旋转、翻转、扭曲、调节对比度、亮度等增强及扰动数据预处理操作;其次,从底层的像素级信息提取肺结节多尺度视图下的二维特征,针对图像的大小,合理选择卷积核大小和网络深度,为了增强模型的性能以及减少参数量,引入 Residual block、Inception、SoftMax 辅助分类器的结构,并采用批标准化的措施减少过深网络所带来的Internal Covariate Shift 等问题;激励函数采用 Leaky ReLU 非饱和激励函数,既可减少梯度弥散问题,也可防止 ReLU 的神经元坏死导致无法训练的问题;结合 Dropout、L2正则化等概念减缓过拟合的现象;根据任务实际建立代价矩阵,样本标签经过 one-hot 编码后使用交叉熵作为模型的损失函数;基于 TensorFlow 框架搭建分布式机器学习系统训练神经网络模型,利用贝叶斯优化对模型的超参数进行调优,进而得到训练准确率与验证准确率;最后对肺结节良恶性智能鉴别模型进行评测分析,研究去假阳性参数优化内在机理,得到敏感度、特异度和AUC为评价指标。
5.根据权利要求1或2或3所述的一种基于深度学习的移动端疾病智能辅助诊断系统,其特征在于,该系统用于肺部肿瘤 CT 图像病理分析,首先,收集具有病理结果的肺部DICOM图像,解析肺部DICOM图像,以多模板获取文件灰度信息,并对病灶区域进行选取,确定图像序列号,为了减轻网络过拟合现象,需要增加训练图像数量,对图像进行旋转、镜像、增加白噪声等增强及扰动数据预处理操作;其次,为了解决训练样本图像因人为介入而数量较少而深度学习模型需要大量样本之间的矛盾,提出基于迁移学习网络模型对训练样本进行特征抽取,进而在尽量保留特征信息的前提下编码为低维度的特征向量并大量减小深度学习模型调优和训练的时间成本,再利用 LightGBM和 XGBoost 的基于梯度 Boost 来集成决策树分类器的框架,把弱分类器进行集成为一个强分类器,进而保证在小样本集的情况下,达到一个理想的分类效果;然后基于 TensorFlow 分布式机器学习系统搭建和微调神经网络模型,并利用贝叶斯优化对 LightGBM 和 XGBoost 的超参数进行调优,得到训练准确率与验证准确率;最后,对非小细胞肺癌智能鉴别模型进行评测分析,得到敏感度,特异度和 AUC 为评价指标。
6.根据权利要求1所述的一种基于深度学习的移动端疾病智能辅助诊断系统,其特征在于,所述的移动医疗终端包括手机、平板电脑及其它具有WiFi联网功能的嵌入式设备。
CN202010473320.4A 2020-05-29 2020-05-29 一种基于深度学习的移动端疾病智能辅助诊断系统 Pending CN111863237A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010473320.4A CN111863237A (zh) 2020-05-29 2020-05-29 一种基于深度学习的移动端疾病智能辅助诊断系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010473320.4A CN111863237A (zh) 2020-05-29 2020-05-29 一种基于深度学习的移动端疾病智能辅助诊断系统

Publications (1)

Publication Number Publication Date
CN111863237A true CN111863237A (zh) 2020-10-30

Family

ID=72985902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010473320.4A Pending CN111863237A (zh) 2020-05-29 2020-05-29 一种基于深度学习的移动端疾病智能辅助诊断系统

Country Status (1)

Country Link
CN (1) CN111863237A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289467A (zh) * 2020-11-17 2021-01-29 中山大学 一种面向低资源场景可迁移的医疗问诊对话系统及方法
CN112599216A (zh) * 2020-12-31 2021-04-02 四川大学华西医院 脑肿瘤mri多模态标准化报告输出系统及方法
CN112700866A (zh) * 2021-01-07 2021-04-23 北京左医科技有限公司 基于transformer模型的智能交互方法及系统
CN112735569A (zh) * 2020-12-31 2021-04-30 四川大学华西医院 脑肿瘤多模态mri术前胶质瘤手术区结果输出系统及方法
CN113034489A (zh) * 2021-04-16 2021-06-25 南方医科大学第五附属医院 基于深度学习的人工智能鼻窦ct图像处理系统
CN113241184A (zh) * 2021-06-24 2021-08-10 华侨大学 一种儿童肺炎辅助诊断模型及其训练方法
CN113288110A (zh) * 2021-04-23 2021-08-24 四川省肿瘤医院 一种基于血小板参数预测肺小结节良恶性的模型及系统
CN113643825A (zh) * 2021-06-25 2021-11-12 合肥工业大学 基于临床关键特征信息的医疗案例知识库构建方法和系统
CN113658683A (zh) * 2021-08-05 2021-11-16 重庆金山医疗技术研究院有限公司 一种疾病诊断系统及数据推荐方法
CN113871003A (zh) * 2021-12-01 2021-12-31 浙江大学 一种基于含因果性医学知识图谱的疾病辅助鉴别诊断系统
CN114093505A (zh) * 2021-11-17 2022-02-25 山东省计算中心(国家超级计算济南中心) 一种基于云边端架构的病理检测系统及方法
CN115631386A (zh) * 2022-12-19 2023-01-20 天津医之本医疗科技有限公司 一种基于机器学习的病理图像分类方法和系统
CN116665865A (zh) * 2023-06-13 2023-08-29 爱汇葆力(广州)数据科技有限公司 基于大数据实现陪诊人员的信息智能管理方法及系统
CN117253576A (zh) * 2023-10-30 2023-12-19 来未来科技(浙江)有限公司 基于中文医疗大模型的门诊电子病历生成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557653A (zh) * 2016-11-15 2017-04-05 合肥工业大学 一种移动医疗智能导医系统及其方法
CN109192299A (zh) * 2018-08-13 2019-01-11 中国科学院计算技术研究所 一种基于卷积神经网络的医疗分析辅助系统
CN109635835A (zh) * 2018-11-08 2019-04-16 深圳蓝韵医学影像有限公司 一种基于深度学习与迁移学习的乳腺病变区域检测方法
CN109935336A (zh) * 2019-01-15 2019-06-25 北京思普科软件股份有限公司 一种儿童呼吸科疾病的智能辅助诊断方法及诊断系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557653A (zh) * 2016-11-15 2017-04-05 合肥工业大学 一种移动医疗智能导医系统及其方法
CN109192299A (zh) * 2018-08-13 2019-01-11 中国科学院计算技术研究所 一种基于卷积神经网络的医疗分析辅助系统
CN109635835A (zh) * 2018-11-08 2019-04-16 深圳蓝韵医学影像有限公司 一种基于深度学习与迁移学习的乳腺病变区域检测方法
CN109935336A (zh) * 2019-01-15 2019-06-25 北京思普科软件股份有限公司 一种儿童呼吸科疾病的智能辅助诊断方法及诊断系统

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289467B (zh) * 2020-11-17 2022-08-02 中山大学 一种面向低资源场景可迁移的医疗问诊对话系统及方法
CN112289467A (zh) * 2020-11-17 2021-01-29 中山大学 一种面向低资源场景可迁移的医疗问诊对话系统及方法
CN112599216A (zh) * 2020-12-31 2021-04-02 四川大学华西医院 脑肿瘤mri多模态标准化报告输出系统及方法
CN112735569A (zh) * 2020-12-31 2021-04-30 四川大学华西医院 脑肿瘤多模态mri术前胶质瘤手术区结果输出系统及方法
CN112735569B (zh) * 2020-12-31 2022-09-02 四川大学华西医院 脑肿瘤多模态mri术前胶质瘤手术区结果输出系统及方法
CN112700866A (zh) * 2021-01-07 2021-04-23 北京左医科技有限公司 基于transformer模型的智能交互方法及系统
CN113034489A (zh) * 2021-04-16 2021-06-25 南方医科大学第五附属医院 基于深度学习的人工智能鼻窦ct图像处理系统
CN113288110A (zh) * 2021-04-23 2021-08-24 四川省肿瘤医院 一种基于血小板参数预测肺小结节良恶性的模型及系统
CN113241184A (zh) * 2021-06-24 2021-08-10 华侨大学 一种儿童肺炎辅助诊断模型及其训练方法
CN113241184B (zh) * 2021-06-24 2022-07-29 华侨大学 一种儿童肺炎辅助诊断模型及其训练方法
CN113643825B (zh) * 2021-06-25 2023-08-01 合肥工业大学 基于临床关键特征信息的医疗案例知识库构建方法和系统
CN113643825A (zh) * 2021-06-25 2021-11-12 合肥工业大学 基于临床关键特征信息的医疗案例知识库构建方法和系统
CN113658683A (zh) * 2021-08-05 2021-11-16 重庆金山医疗技术研究院有限公司 一种疾病诊断系统及数据推荐方法
CN114093505B (zh) * 2021-11-17 2022-06-17 山东省计算中心(国家超级计算济南中心) 一种基于云边端架构的病理检测系统及方法
CN114093505A (zh) * 2021-11-17 2022-02-25 山东省计算中心(国家超级计算济南中心) 一种基于云边端架构的病理检测系统及方法
CN113871003A (zh) * 2021-12-01 2021-12-31 浙江大学 一种基于含因果性医学知识图谱的疾病辅助鉴别诊断系统
CN113871003B (zh) * 2021-12-01 2022-04-08 浙江大学 一种基于含因果性医学知识图谱的疾病辅助鉴别诊断系统
CN115631386A (zh) * 2022-12-19 2023-01-20 天津医之本医疗科技有限公司 一种基于机器学习的病理图像分类方法和系统
CN116665865A (zh) * 2023-06-13 2023-08-29 爱汇葆力(广州)数据科技有限公司 基于大数据实现陪诊人员的信息智能管理方法及系统
CN116665865B (zh) * 2023-06-13 2023-12-26 爱汇葆力(广州)数据科技有限公司 基于大数据实现陪诊人员的信息智能管理方法及系统
CN117253576A (zh) * 2023-10-30 2023-12-19 来未来科技(浙江)有限公司 基于中文医疗大模型的门诊电子病历生成方法
CN117253576B (zh) * 2023-10-30 2024-03-05 来未来科技(浙江)有限公司 基于中文医疗大模型的门诊电子病历生成方法

Similar Documents

Publication Publication Date Title
CN111863237A (zh) 一种基于深度学习的移动端疾病智能辅助诊断系统
Sadoughi et al. Artificial intelligence methods for the diagnosis of breast cancer by image processing: a review
Dai et al. Clinical report guided retinal microaneurysm detection with multi-sieving deep learning
CN108806792B (zh) 深度学习面诊系统
Alyas et al. Empirical method for thyroid disease classification using a machine learning approach
CN110689025B (zh) 图像识别方法、装置、系统及内窥镜图像识别方法、装置
WO2016192612A1 (zh) 基于深度学习对医疗数据进行分析的方法及其智能分析仪
CN110490242B (zh) 图像分类网络的训练方法、眼底图像分类方法及相关设备
Song et al. A deep fuzzy model for diagnosis of COVID-19 from CT images
Ashir et al. Diabetic Retinopathy Detection Using Local Extrema Quantized Haralick Features with Long Short‐Term Memory Network
CN113658683A (zh) 一种疾病诊断系统及数据推荐方法
Darweesh et al. Early breast cancer diagnostics based on hierarchical machine learning classification for mammography images
CN110136113B (zh) 一种基于卷积神经网络的阴道病理图像分类方法
CN117271804A (zh) 一种共病特征知识库生成方法、装置、设备及介质
Zhang et al. Computerized detection of leukocytes in microscopic leukorrhea images
Afriyie et al. Classification of blood cells using optimized Capsule networks
Wu et al. AGNet: Automatic generation network for skin imaging reports
CN110992309B (zh) 基于深层信息传递网络的眼底图像分割方法
Dittimi et al. Mobile phone based ensemble classification of deep learned feature for medical image analysis
Kotiyal et al. Diabetic Retinopathy Binary Image Classification Using Pyspark
Ahmed et al. Deepcovidnet: Deep convolutional neural network for covid-19 detection from chest radiographic images
Li et al. A dual attention-guided 3D convolution network for automatic segmentation of prostate and tumor
Bayram et al. Classification of skin lesion images with deep learning approaches
Booma et al. Max Pooling Technique to Detect and Classify Medical Image for Ovarian Cancer Diagnosis
Nugroho et al. Image dermoscopy skin lesion classification using deep learning method: systematic literature review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination