CN113076993B - 用于胸部x光片识别的信息处理方法、模型训练方法 - Google Patents

用于胸部x光片识别的信息处理方法、模型训练方法 Download PDF

Info

Publication number
CN113076993B
CN113076993B CN202110347279.0A CN202110347279A CN113076993B CN 113076993 B CN113076993 B CN 113076993B CN 202110347279 A CN202110347279 A CN 202110347279A CN 113076993 B CN113076993 B CN 113076993B
Authority
CN
China
Prior art keywords
chest
ray film
probability
threshold value
ray
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110347279.0A
Other languages
English (en)
Other versions
CN113076993A (zh
Inventor
罗立刚
荆怡
侯波林
罗祥凤
高光明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zero Krypton Smart Medical Technology Tianjin Co ltd
Original Assignee
Zero Krypton Smart Medical Technology Tianjin Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zero Krypton Smart Medical Technology Tianjin Co ltd filed Critical Zero Krypton Smart Medical Technology Tianjin Co ltd
Priority to CN202110347279.0A priority Critical patent/CN113076993B/zh
Publication of CN113076993A publication Critical patent/CN113076993A/zh
Application granted granted Critical
Publication of CN113076993B publication Critical patent/CN113076993B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本公开实施例公开了一种用于胸部X光片识别的信息处理方法、模型训练方法,其中用于胸部X光片识别的信息处理方法首先对原始胸部X光片图像进行预处理,得到待识别胸部X光片;而后将所述待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,得到所述待识别胸部X光片对应的胸部疾病类型的目标概率值;最后基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定目标概率值对应的分类结果。通过DenseNet神经网络模型对胸部X光片进行识别,可得到具体的肺部疾病类型,而后对识别得到胸部X光片进行三分类,提高了门诊X光片的识别速度和准确率,进而克服了现有技术识别速度慢、准确率低的技术问题。

Description

用于胸部X光片识别的信息处理方法、模型训练方法
技术领域
本公开涉及图像识别技术领域,具体涉及到一种用于胸部X光片识别的信息处理方法、模型训练方法。
背景技术
随着就医人数的增加,尤其是面对门诊的庞大的X光片数量,门诊医生逐一阅片的耗时时间长而效率比较低下。
发明内容
本公开的主要目的在于提供一种用于胸部X光片识别的信息处理方法、模型训练方法,以解决门诊胸部X光片阅片效率低的问题。
为了实现上述目的,根据本公开的第一方面,提供了一种用于胸部X光片识别的信息处理方法,包括:对原始胸部X光片图像进行预处理,得到待识别胸部X光片;将所述待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,得到所述待识别胸部X光片对应的胸部疾病类型的目标概率值;基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定所述目标概率值对应的分类结果。
可选地,训练DenseNet神经网络模型包括:对样本集中的胸部X光片进行预处理,得到待训练胸部X光片;将所述待训练胸部X光片对应的疾病类型作为标签;将所述待训练胸部X光片作为预建立的DensNet网络模型的输入,以所述标签为目标,对所述DensNet网络模型进行训练,得到所述待训练胸部X光片对应于标签匹配概率。
可选地,基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定所述目标概率值对应的三类结果:无异常胸片类别、疑似异常胸片类别和确认异常胸片类别。
可选地,预先设定的概率阈值包括:将测试集中的每一个胸部X光片测试样本输入至预先训练的DenseNet神经网络模型中,得到每一个测试样本的预测概率值、和预测胸部疾病类型;标定每一个测试样本的分类标签,其中,分类标签包括不患病类别和患病类别;设定测试概率阈值,并使测试概率阈值按照预设的步长进行变化,得到多个测试概率阈值;基于所述预测概率值、所述预测胸部疾病类型、所述每一个测试样本的分类标签和设定的每一个测试概率阈值,确定用于区分分类结果的概率阈值和概率范围。
根据本公开的第二方面,提供了一种用于胸部X光片识别模型的训练方法,包括:对样本集中的胸部X光片进行预处理,得到待训练胸部X光片;将所述待训练胸部X光片对应的疾病类型作为标签;将所述待训练胸部X光片作为预建立的DensNet网络模型的输入,以所述标签为目标,对所述DensNet网络模型进行训练,得到所述待训练胸部X光片对应于标签匹配概率。
可选地,方法还包括:将数据集划分为样本集和测试集;将测试集中的每一个胸部X光片测试样本输入至预先训练的DenseNet神经网络模型中,得到每一个测试样本的预测概率值、和预测胸部疾病类型;标定每一个测试样本的分类标签,其中,分类标签包括不患病类别和患病类别;设定测试概率阈值,并使测试概率阈值按照预设的步长进行变化,得到多个测试概率阈值;基于所述预测概率值、所述预测胸部疾病类型、所述每一个测试样本的分类标签和设定的每一个测试概率阈值,确定用于区分分类结果的概率阈值和概率范围。
根据本公开的第三方面,提供了一种用于胸部X光片识别的信息处理装置,包括预处理单元,被配置成对原始胸部X光片图像进行预处理,得到待识别胸部X光片;识别单元,被配置成将所述待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,得到所述待识别胸部X光片对应的胸部疾病类型的目标概率值;分类单元,被配置成基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定所述目标概率值对应的分类结果。
可选地,预先设定的概率阈值包括:将测试集中的每一个胸部X光片测试样本输入至预先训练的DenseNet神经网络模型中,得到每一个测试样本的预测概率值;标定每一个测试样本的分类结果;设定测试概率阈值,并使测试概率阈值按照预设的步长增大;基于所述预测概率值、所述每一个测试样本的分类结果和设定的每一个测试概率阈值,确定用于区分分类结果的概率阈值和概率范围。
根据本公开的第四方面,提供了一种计算机可读存储介质,存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面任意一项实施例所述的用于胸部X光片识别模型的训练方法。
根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项实施例所述的用于胸部X光片识别模型的训练方法。
在本公开实施例,首先对原始胸部X光片图像进行预处理,得到待识别胸部X光片;而后将所述待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,得到所述待识别胸部X光片对应的胸部疾病类型的目标概率值;最后基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定目标概率值对应的分类结果。通过DenseNet神经网络模型对胸部X光片进行识别,可得到具体的肺部疾病类型,而后对识别得到胸部X光片进行三分类,提高了门诊X光片的识别速度和准确率,进而克服了现有技术识别速度慢、准确率低的技术问题。
附图说明
为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本公开实施例的用于胸部X光片识别的信息处理方法的流程图;
图2是根据本公开实施例的用于胸部X光片识别的信息处理方法的一个应用场景图;
图3是根据本公开实施例的用于胸部X光片识别的信息处理方法的另一个应用场景图;
图4是根据本公开实施例的用于胸部X光片识别模型的训练方法的流程图。
图5是根据本公开实施例的用于胸部X光片识别的信息处理装置的结构图;
图6是根据本公开实施例的电子设备的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
根据本公开实施例,提供了一种用于胸部X光片识别的信息处理方法,如图1所示,该方法包括如下的步骤101至步骤103:
步骤101:对原始胸部X光片图像进行预处理,得到待识别胸部X光片。
在本实施中,对原始胸部X光片图像预处理的过程可以包括,对图像进行灰度转换,提高图像的对比度、并对胸部X光片图像进行归一化,使其大小变为512*512。通过本实施例预处理的过程可以将不同的类型的胸部X光片标准化,从而能够实现精确地对X光片的图像进行识别。
步骤102:将所述待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,得到所述待识别胸部X光片对应的胸部疾病类型的目标概率值。
在本实施例中,胸部X光片对应的胸部疾病可以类型可以包括14种类型,例如,肺气肿、肺不张,肺结节,肺积液等。
本实施例的DenseNet由多个DenseBlock组成,每个层从前面的所有层获得额外的输入,并将自己的特征映射传递到后续的所有层,每一层都在接受来自前几层的“集体知识”。因此网络可以更薄、更紧凑,即具有较高的计算效率和存储效率。相比选用ResNet拥有更少的参数数量;同时加强了特征的重用;缓解了梯度消失的问题。
通过将步骤1得到的待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,进行识别,可以得到待识别胸部X光片对应的胸部疾病类型的概率值。例如,肺气肿0.8;肺不张0.01........等,将识别得到的14种疾病的概率值中最大概率确定为目标概率值,例如,例如将肺气肿对应的0.8确定为目标概率值。
作为本实施例一种可选的实现方式,训练DenseNet神经网络模型包括:对样本集中的胸部X光片进行预处理,得到待训练胸部X光片;将所述待训练胸部X光片对应的疾病类型作为标签;将所述待训练胸部X光片作为建立的DensNet网络模型的输入,以所述标签为目标,对所述DensNet网络模型进行训练,得到所述待训练胸部X光片对应于标签匹配概率。
在本可选的实现方式中,可以首先对公开的数据集(例如,ChestX-ray14)进行预处理(灰度转换、提高对比度、归一化处理,处理为大小均为512*512的图像);而后将预处理后的数据集进行划分,可以划分为样本集、测试集和/或验证集,并确认数据分布一致;可以设定训练Densnet-121网络的参数;最后基于样本集和参数,以X光片对应的疾病类型(例如,肺积液、肺气肿等14中疾病类型)为目标对模型进行训练,得到疾病分类模型。
设定训练Densnet-121网络的参数的过程可以包括:将SGD作为优化器;为不同训练阶段设置学习率等。具体包括:1)选择SGD作为优化器;
2)关于学习率的设置,当正确率和损失值达到极限陷入震荡时,如果指数性的减少学习率,会使正确率立即大幅跳跃提升,因此初始学习率0.1,训练到一半时(约200epochs)学习率除10,再到剩下的一半时(约300epochs)再除10。3)由于数据集数据量较为充分,因此采用了随机初始值。4)又因为数据未做增强等操作,开0.2的dropout。
具体地,数据集的选取可以包括清晰度较高的图像,也可以包括清晰度并不高的图像,本实施例的DenseNet神经网络模型可以接收清晰度不高的图像输入,并对这些图像的图像特征进行学习。因此,基于DenseNet神经网络模型识别胸部X光片无需再依赖于X光片成像的清晰度,识别得到的结果更加精确。
本实施例公开的上述参数的设定数值,经实践证明,得到的模型识别准确度相比于其他数值下的识别准确度,可以大大提高,且疾病类型的准确度可达87%。
步骤103:基于预先设定的概率阈值、以及概率阈值确定的概率所对应的分类结果,确定所述目标概率值对应的分类结果。
在本实施例中,在确定目标概率值之后,需要确定目标概率值的分类结果,以区分X光胸片是否正常,分类结果包括三类:无异常胸片类别、疑似异常胸片类别和确认异常胸片类别。为了保证识别结果准确率,可以根据预设的策略设定三种分类结果的对应的概率阈值、及概率范围。
可以理解的是,划分不同概率阈值影响最终的分类结果,如果阈值划分不够准确,那么就会出现分类结果误判。因此本实施例在划分阈值时,需要保证分类结果的准确率在100%。该指标可以保证胸部X光片最终的识别结果中无异常胸片类别和确认异常胸片类别是完全准确的。
作为本实施例一种可选的实现方式,基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定所述目标概率值对应的三类结果:无异常胸片类别、疑似异常胸片类别和确认异常胸片类别。
本实施例可以实现对胸部X光片的三种分类结果,相关技术中,深度学习的X光片辅诊系统主要对X光片进行二分类,即将X光片直接分为’患病’与’不患病’两类,本实施例的不同之处在于,对X光片进行三分类,目的是保证分类模型在“患病”及“不患病”的两类X光片精确度极高的情况下对影像进行筛选,并对疑似的X光片交由医生做进一步诊断,有效防止了直接使用二分类问题中对异常的误判,极大的提高了辅助阅片系统的可靠性,保证了辅诊系统的合理性及准确性。
作为本实施例一种可选的实现方式,预先设定的概率阈值包括:将测试集中的每一个胸部X光片测试样本输入至预先训练的DenseNet神经网络模型中,得到每一个测试样本的预测概率值;标定每一个测试样本的分类标签,其中,分类标签包括确认无异常胸片类别和确认异常胸片类别;设定测试概率阈值,并使测试概率阈值按照预设的步长进行变化;基于所述预测概率值、所述每一个测试样本的分类标签和设定的每一个测试概率阈值,确定用于区分分类结果的概率阈值和概率范围。
在本可选的实现方式中,可以将测试集中的胸部X光片输入至训练完成的神经网络模型中,得到每一个测试样本对应的最大预测概率值及疾病类型,预测概率值越大,说明患有对应疾病类型的概率越大,那么最大预测概率值是多少才能准确区分胸部X光片是否存在异常、疑似异常。
可以采取如下方式:首先标定每一个测试样本的分类标签,例如,通过人工标定的方式,对胸部X光片进行患病标定、和不患病标定(患病和不患病是毫无疑义确定的)。而后在确定不患病胸部X光片时,可以在初始阈值的基础上按照预设的步长(例如,0.01)进行递减,在每一次递减后,需要判断满足当前概率阈值(与当前概率阈值相等)的测试样本其对应的分类标签是否包括“患病”,如果包括“患病”的测试样本,那么继续递减当前阈值;如果不包括“患病”的测试样本,将此时的目标阈值设定为“不患病”分类结果的阈值,将小于该目标阈值的概率范围确定为“无异常胸片类别”分类结果的概率范围。
同理,在确定患病胸部X光片时,可以在上述目标阈值的基础上按照预设的步长(例如,0.01)进行递增,在每一次递增后,需要判断满足当前概率阈值(与当前概率值相等)的测试样本其对应的分类标签是否包括“不患病”类别,如果包括“不患病”的测试样本,那么继续递增当前阈值;如果不包括“不患病”的测试样本,则判断每一个“患病”类别的测试样本的胸部疾病类型是否准确(例如,是否将肺气肿判断为肺纤维化),如果疾病类型有误,则继续递增当前阈值。直到达到目标阈值时,既不存在“不患病”的测试样本,同时每一个“患病”类别的测试样本的胸部疾病类型准确,将此时的阈值设定为“确认异常胸片类别”分类结果的阈值,将大于该目标阈值的概率范围确定为“确认异常胸片类别”分类结果的概率范围。
将大于“无异常胸片类别”的阈值、以及小于“确认异常胸片类别”的阈值确定的概率范围,作为“疑似异常胸片类别”的概率范围。
由于“无异常胸片类别”和“确认异常胸片类别”的准确率是100%,因此相较于二分类的方式,无异常胸片中不可能存在患病胸片,异常胸片中也不可能存在无异常的胸片,那么后续只需要对疑似异常的胸片进行医生阅片,从而大大提高了阅片效率。
本实施例下,当阈值为0.76时,不患病类别的准确率为100%,因此设置确定患病的阈值为0.76。即当某一类疾病的概率小于0.76时,该光片类型为确认无异常胸片类别。
当阈值设置为0.98时,患病类别准确率为100%,因此设置确定患病的阈值为0.98。即当某一类疾病的概率大于0.98时,该光片类型为确认异常胸片类别,最后的结果病理结果为此概率值对应的疾病类型,如,肺不张。
最后,将最高概率值处于0.76与0.98之间时,判别该光片类型为疑似异常胸片类别。
基于不同的分类结果,还可以为分类结果配置建议,例如,“疑似异常”的胸部X光片,建议交由医生进一步诊断;“确认异常”的胸部X光片,建议进一步进行其他检查;进一步,基于预训练模型,对“确认异常”的X光片向医生反馈具体的病理结果,包含但不限于常见的14种肺部疾病,如肺不张,肺结节,肺积液等;对于“无异常”的X光片,建议不需进一步检查。
参考图2和图3,图2示出了对胸部X光片识别的应用场景图,图3示出了DensNet网络模型对胸部X光片进行异常识别的应用场景图。在图2中,对门诊X光片影像首先进行预处理,而后将预处理后的图像输入至DensNet网络模型中,对网络胸部X光片的的肺部异常进行预测(识别),而后给出建议;针对异常的X光片还能识别出具体的疾病类型(肺部病理)。
从以上的描述中,可以看出,本公开实现了如下技术效果:基于传统图像处理与深度学习算法的筛选方法,对X光片进行初步筛选并进一步进行病理分类,从而减少医生的阅片工作量,提高了门诊中的X光片阅片的效率以及准确率。同时本实施在“患病”及“不患病”的两类X光片下对影像进行筛选,增加疑似胸部X光片的分类能力,针对分类得到的疑似胸部X光片交由医生做进一步诊断,有效防止了直接使用二分类问题中对异常的误判,极大的提高了辅助阅片系统的可靠性,保证了辅诊系统的合理性及准确性。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本公开实施例,还提供了一种用于胸部X光片识别模型的训练方法,参考图4,包括:
步骤401:对样本集中的胸部X光片进行预处理,得到待训练胸部X光片。
本步骤的实现方式与第一实施例中模型训练过程的实现方式相同,在此不再赘述。
步骤402:将所述待训练胸部X光片对应的疾病类型作为标签;
在本实施例中,可以通过人工打标或者自动打标的方式,为待训练胸部X光片进行标注。本步骤的实现方式与第一实施例中模型训练过程的实现方式相同,在此不再赘述。
步骤403:将所述待训练胸部X光片作为预建立的DensNet网络模型的输入,以所述标签为目标,对所述DensNet网络模型进行训练,得到所述待训练胸部X光片对应于标签匹配概率。
本步骤的实现方式与第一实施例中模型训练过程的实现方式相同,在此不再赘述。
作为本实施一种可选的实现方式,方法还包括:将数据集划分为样本集和测试集;将测试集中的每一个胸部X光片测试样本输入至预先训练的DenseNet神经网络模型中,得到每一个测试样本的预测概率值、和预测胸部疾病类型;标定每一个测试样本的分类标签,其中,分类标签包括不患病类别和患病类别;设定测试概率阈值,并使测试概率阈值按照预设的步长进行变化,得到多个测试概率阈值;基于所述预测概率值、所述预测胸部疾病类型、所述每一个测试样本的分类标签和设定的每一个测试概率阈值,确定用于区分分类结果的概率阈值和概率范围。
本可选方式的实现方式与第一实施例中模型训练过程的实现方式相同,在此不再赘述。
根据本公开实施例,还提供了一种用于实施上述用于胸部X光片识别的信息处理方法的装置,如图5所示,该装置包括:
预处理单元501,被配置成对原始胸部X光片图像进行预处理,得到待识别胸部X光片;识别单元502,被配置成将所述待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,得到所述待识别胸部X光片对应的胸部疾病类型的目标概率值;分类单元503,被配置成基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定所述目标概率值对应的分类结果。
本公开实施例通过包括预处理单元、识别单元和分类单元,能够快速、准确地对胸部X光片的异常进行识别,并能够识别出X光片对应的肺部疾病类型。
本公开实施例提供了一种电子设备,如图6所示,该电子设备包括一个或多个处理器61以及存储器62,图6中以一个处理器61为例。
该控制器还可以包括:输入装置63和输出装置64。
处理器61、存储器62、输入装置63和输出装置64可以通过总线或者其他方式连接,图6中以通过总线连接为例。
处理器61可以为中央处理器(CentralProcessingUnit,CPU)。处理器61还可以为其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器62作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本公开实施例中的控制方法对应的程序指令/模块。处理器61通过运行存储在存储器62中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的方法。
存储器62可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外,存储器62可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器62可选包括相对于处理器61远程设置的存储器,这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置63可接收输入的数字或字符信息,以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置64可包括显示屏等显示设备。
一个或者多个模块存储在存储器62中,当被一个或者多个处理器61执行时,执行如图1所示的用于胸部X光片识别的信息处理方法。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各电机控制方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(FlashMemory)、硬盘(HardDiskDrive,缩写:HDD)或固态硬盘(Solid-StateDrive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本公开的实施方式,但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (4)

1.一种用于胸部X光片识别的信息处理方法,其特征在于,包括:
对原始胸部X光片图像进行预处理,得到待识别胸部X光片;
将所述待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,得到所述待识别胸部X光片对应的胸部疾病类型的目标概率值;其中,胸部X光片对应的胸部疾病类型包括14种类型;并将识别得到14种疾病的概率值中最大概率确定为目标概率值;其中,训练DenseNet神经网络模型包括:对样本集中的胸部X光片进行预处理,得到待训练胸部X光片;将所述待训练胸部X光片对应的疾病类型作为标签;将所述待训练胸部X光片作为预建立的DensNet网络模型的输入,以所述标签为目标,对所述DensNet网络模型进行训练,得到所述待训练胸部X光片对应于标签匹配概率;
基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定所述目标概率值对应的分类结果;分类结果无异常胸片、疑似异常胸片和确认异常胸片;其中,对X光片进行三分类,保证分类模型在“患病”及“不患病”的两类X光片精确度极高的情况下对影像进行筛选;
其中,疑似异常胸片类别的概率范围包括:首先标定每一个测试样本的分类标签,包括通过人工标定的方式,对胸部X光片进行患病标定、和不患病标定;而后在确定不患病胸部X光片时,在初始阈值的基础上按照预设的步长进行递减,在每一次递减后,需要判断满足当前概率阈值的测试样本其对应的分类标签是否包括“患病”,如果包括“患病”的测试样本,那么继续递减当前阈值;如果不包括“患病”的测试样本,将此时的目标阈值设定为“不患病”分类结果的阈值,将小于该目标阈值的概率范围确定为“无异常胸片类别”分类结果的概率范围;
在确定患病胸部X光片时,在上述目标阈值的基础上按照预设的步长进行递增,在每一次递增后,需要判断满足当前概率阈值的测试样本其对应的分类标签是否包括“不患病”类别,如果包括“不患病”的测试样本,那么继续递增当前阈值;如果不包括“不患病”的测试样本,则判断每一个“患病”类别的测试样本的胸部疾病类型是否准确,如果疾病类型有误,则继续递增当前阈值,直到达到目标阈值时,既不存在“不患病”的测试样本,同时每一个“患病”类别的测试样本的胸部疾病类型准确,将此时的阈值设定为“确认异常胸片类别”分类结果的阈值,将大于该目标阈值的概率范围确定为“确认异常胸片类别”分类结果的概率范围;
将大于“无异常胸片类别”的阈值、以及小于“确认异常胸片类别”的阈值确定的概率范围,作为“疑似异常胸片类别”的概率范围。
2.一种用于胸部X光片识别的信息处理装置,其特征在于,包括:
预处理单元,被配置成对原始胸部X光片图像进行预处理,得到待识别胸部X光片;
识别单元,被配置成将所述待识别胸部X光片输入至预先训练的DenseNet神经网络模型中,得到所述待识别胸部X光片对应的胸部疾病类型的目标概率值;其中,胸部X光片对应的胸部疾病类型包括14种类型;并将识别得到14种疾病的概率值中最大概率确定为目标概率值;其中,训练DenseNet神经网络模型包括:对样本集中的胸部X光片进行预处理,得到待训练胸部X光片;将所述待训练胸部X光片对应的疾病类型作为标签;将所述待训练胸部X光片作为预建立的DensNet网络模型的输入,以所述标签为目标,对所述DensNet网络模型进行训练,得到所述待训练胸部X光片对应于标签匹配概率;
分类单元,被配置成基于预先设定的概率阈值、以及概率阈值确定的概率范围所对应的分类结果,确定所述目标概率值对应的分类结果;分类结果无异常胸片、疑似异常胸片和确认异常胸片;其中,对X光片进行三分类,保证分类模型在“患病”及“不患病”的两类X光片精确度极高的情况下对影像进行筛选;
其中,疑似异常胸片类别的概率范围包括:首先标定每一个测试样本的分类标签,包括通过人工标定的方式,对胸部X光片进行患病标定、和不患病标定;而后在确定不患病胸部X光片时,在初始阈值的基础上按照预设的步长进行递减,在每一次递减后,需要判断满足当前概率阈值的测试样本其对应的分类标签是否包括“患病”,如果包括“患病”的测试样本,那么继续递减当前阈值;如果不包括“患病”的测试样本,将此时的目标阈值设定为“不患病”分类结果的阈值,将小于该目标阈值的概率范围确定为“无异常胸片类别”分类结果的概率范围;
在确定患病胸部X光片时,在上述目标阈值的基础上按照预设的步长进行递增,在每一次递增后,需要判断满足当前概率阈值的测试样本其对应的分类标签是否包括“不患病”类别,如果包括“不患病”的测试样本,那么继续递增当前阈值;如果不包括“不患病”的测试样本,则判断每一个“患病”类别的测试样本的胸部疾病类型是否准确,如果疾病类型有误,则继续递增当前阈值,直到达到目标阈值时,既不存在“不患病”的测试样本,同时每一个“患病”类别的测试样本的胸部疾病类型准确,将此时的阈值设定为“确认异常胸片类别”分类结果的阈值,将大于该目标阈值的概率范围确定为“确认异常胸片类别”分类结果的概率范围;
将大于“无异常胸片类别”的阈值、以及小于“确认异常胸片类别”的阈值确定的概率范围,作为“疑似异常胸片类别”的概率范围。
3.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1任意一项所述的用于胸部X光片识别模型的训练方法。
4.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1任意一项所述的用于胸部X光片识别模型的训练方法。
CN202110347279.0A 2021-03-31 2021-03-31 用于胸部x光片识别的信息处理方法、模型训练方法 Active CN113076993B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110347279.0A CN113076993B (zh) 2021-03-31 2021-03-31 用于胸部x光片识别的信息处理方法、模型训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110347279.0A CN113076993B (zh) 2021-03-31 2021-03-31 用于胸部x光片识别的信息处理方法、模型训练方法

Publications (2)

Publication Number Publication Date
CN113076993A CN113076993A (zh) 2021-07-06
CN113076993B true CN113076993B (zh) 2023-04-18

Family

ID=76614026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110347279.0A Active CN113076993B (zh) 2021-03-31 2021-03-31 用于胸部x光片识别的信息处理方法、模型训练方法

Country Status (1)

Country Link
CN (1) CN113076993B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114445658A (zh) * 2022-01-20 2022-05-06 谛宝诚(上海)医学影像科技有限公司 基于深度学习的宠物x光片姿态分类方法及装置和设备
CN116452579B (zh) * 2023-06-01 2023-12-08 中国医学科学院阜外医院 一种基于胸片图像的肺动脉高压智能评估方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898595A (zh) * 2018-06-27 2018-11-27 慧影医疗科技(北京)有限公司 一种胸部疾病检测模型的构建方法及应用
CN109727238A (zh) * 2018-12-27 2019-05-07 贵阳朗玛信息技术股份有限公司 X光胸片的识别方法及装置
CN110738235A (zh) * 2019-09-16 2020-01-31 平安科技(深圳)有限公司 肺结核判定方法、装置、计算机设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665457B (zh) * 2018-05-16 2023-12-19 腾讯医疗健康(深圳)有限公司 图像识别方法、装置、存储介质及计算机设备
CN110321952B (zh) * 2019-07-02 2024-02-09 腾讯医疗健康(深圳)有限公司 一种图像分类模型的训练方法及相关设备
CN112241961A (zh) * 2020-09-22 2021-01-19 深圳视见医疗科技有限公司 基于深度卷积神经网络的胸部x光片辅助诊断方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898595A (zh) * 2018-06-27 2018-11-27 慧影医疗科技(北京)有限公司 一种胸部疾病检测模型的构建方法及应用
CN109727238A (zh) * 2018-12-27 2019-05-07 贵阳朗玛信息技术股份有限公司 X光胸片的识别方法及装置
CN110738235A (zh) * 2019-09-16 2020-01-31 平安科技(深圳)有限公司 肺结核判定方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN113076993A (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN107464250B (zh) 基于三维mri图像的乳腺肿瘤自动分割方法
TWI743544B (zh) 用於自動腫瘤偵測和分類的方法及系統
CN111512322B (zh) 使用神经网络
Oliveira et al. CAD systems for colorectal cancer from WSI are still not ready for clinical acceptance
CN109740689B (zh) 一种图像语义分割的错误标注数据筛选方法及系统
JP2015087903A (ja) 情報処理装置及び情報処理方法
CN113076993B (zh) 用于胸部x光片识别的信息处理方法、模型训练方法
CN115699208A (zh) 用于清洗数据以训练人工智能(ai)模型的ai方法
US20200372638A1 (en) Automated screening of histopathology tissue samples via classifier performance metrics
US11120297B2 (en) Segmentation of target areas in images
CN117015796A (zh) 处理组织图像的方法和用于处理组织图像的系统
US20220121902A1 (en) Method and apparatus for quality prediction
Zhang et al. Multiple sclerosis lesion segmentation-a survey of supervised CNN-based methods
CN116452851A (zh) 病症分类模型的训练方法、装置、终端及可读存储介质
CN115409804A (zh) 一种乳腺磁共振影像的病灶区域识别标注及疗效预测方法
CN113177554B (zh) 甲状腺结节识别与分割方法、系统、存储介质及设备
Hussein et al. Auto-detection of the coronavirus disease by using deep convolutional neural networks and X-ray photographs
CN114528913A (zh) 基于信任和一致性的模型迁移方法、装置、设备及介质
CN110059743B (zh) 确定预测的可靠性度量的方法、设备和存储介质
CN115187512A (zh) 肝细胞癌大血管侵犯风险预测方法、系统、装置及介质
US11580390B2 (en) Data processing apparatus and method
CN112183714B (zh) 基于人工神经网络的自动化数据切片
CN114004795A (zh) 一种乳腺结节的分割方法及相关装置
CN114140381A (zh) 一种基于MDP-net的玻璃体混浊分级筛查方法及装置
CN114445679A (zh) 模型训练方法及相关装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant