CN110033432B - 基于机器学习和能谱ct的泌尿结石成分分析方法及系统 - Google Patents

基于机器学习和能谱ct的泌尿结石成分分析方法及系统 Download PDF

Info

Publication number
CN110033432B
CN110033432B CN201910156319.6A CN201910156319A CN110033432B CN 110033432 B CN110033432 B CN 110033432B CN 201910156319 A CN201910156319 A CN 201910156319A CN 110033432 B CN110033432 B CN 110033432B
Authority
CN
China
Prior art keywords
calculus
image
energy
component analysis
urinary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910156319.6A
Other languages
English (en)
Other versions
CN110033432A (zh
Inventor
邓炜
黄炳升
叶裕丰
何卓南
陈显杰
陈汉威
袁程朗
乐美琰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Cardiovascular Disease Institute of Guangzhou Panyu Central Hospital
Original Assignee
Shenzhen University
Cardiovascular Disease Institute of Guangzhou Panyu Central Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University, Cardiovascular Disease Institute of Guangzhou Panyu Central Hospital filed Critical Shenzhen University
Priority to CN201910156319.6A priority Critical patent/CN110033432B/zh
Publication of CN110033432A publication Critical patent/CN110033432A/zh
Application granted granted Critical
Publication of CN110033432B publication Critical patent/CN110033432B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明公开了一种基于机器学习和能谱CT的泌尿结石成分分析方法及系统,方法包括:获取待分析的能谱CT图像;从获取的能谱CT图像中提取结石的感兴趣区域;根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析。本发明将能谱CT图像与机器学习技术相结合来应用于人体结石成分分析上,通过机器学习分析人体的能谱CT图像来对泌尿系结石的成分进行分析,更加高效、客观和准确,且结合了基于能谱CT图像的能谱CT多参数成像技术,能更加全面地反映泌尿系结石的各种成分,从而提供更加准确和全面的结石化学成分分析结果。本发明可广泛应用于医学图像处理领域。

Description

基于机器学习和能谱CT的泌尿结石成分分析方法及系统
技术领域
本发明涉及医学图像处理领域,尤其是一种基于机器学习和能谱CT的泌尿结石成分分析方法及系统。
背景技术
泌尿系结石,包括肾结石和输尿管结石,是泌尿系统之中最为常见疾病之一。患者会有不同程度腰部疼痛,病情严重的会影响其肾功能,从而影响到患者个人及其家庭的生活质量。
泌尿系结石最为常见的成分是尿酸、胱氨酸、膦酸镁氨、草酸钙和磷酸钙。临床上,为方便对泌尿系结石的诊断治疗,往往需要对结石的成分进行分析,其意义在于:
1)通过研究结石成分与代谢异常的关系来推断病因。
2)为临床治疗方法的选择提供参考。
3)研究结石形成因素及制定相关预防措施。
由上可知,结石的成分分析是制定合理治疗措施前一个不可缺少的环节。但当今判断结石化学成分的传统方法是根据病人的病史、尿结晶、尿pH值、尿素酶阳性菌指标及X线表现来人工进行分析的,大多属于临床回顾性研究方法(以现在为结果,回溯过去的研究方法),无法对未知的结石样本数据进行预测,适用于样本较小和结石种类较少的情况。对于医生来说,这种传统的方法费时费力,主观性强,而且准确性不高,已无法满足日益增长的临床需求。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种基于高效、准确和全面的机器学习和能谱CT的泌尿结石成分分析方法及系统。
本发明一方面所采取的技术方案是:
基于机器学习和能谱CT的泌尿结石成分分析方法,包括以下步骤:
获取待分析的能谱CT图像;
从获取的能谱CT图像中提取结石的感兴趣区域;
根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析。
进一步,所述从获取的能谱CT图像中提取结石的感兴趣区域这一步骤,具体包括:
对获取的能谱CT图像进行预处理,得到预处理后的能谱CT图像,所述预处理包括去噪和窗口调整;
根据预处理后的能谱CT图像采用三维的区域生长算法提取出结石的感兴趣区域。
进一步,所述根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析这一步骤,具体包括:
以肌肉区域的灰度值作为参考,对结石的感兴趣区域进行归一化;
根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型;
采用泌尿结石成分分析模型对待分析的样本进行分析,得到泌尿结石成分分析的结果。
进一步,所述根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型这一步骤,具体包括:
根据归一化的结果从训练样本提取模型训练的特征;
根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型。
进一步,所述根据归一化的结果从训练样本提取模型训练的特征这一步骤,具体包括:
根据归一化的结果从训练样本的第一图像提取第一特征,所述第一图像包括水图、碘图和单能量图,所述单能量图为从单能量40kev图至单能量140kev图中以5kev为能量间隔所取的21种图像,所述第一特征包括直方图上灰度0到0.4上频率最大的灰度值、直方图上灰度0.6到1上频率最大的灰度值、直方图上灰度0.4到0.6上平均灰度值、直方图上频率最大的灰度值、灰度从小到大排列时前四分之一的平均值、灰度从小到大排列时前四分之二到前四分之三的平均值、平均值和方差这8种特征;
根据归一化的结果从训练样本的图像提取第二特征,所述第二特征包括能谱曲线斜率、单能量40kev图平均值除以单能量140kev图平均值、单能量70kev图平均值除以单能量140kev图平均值、单能量70kev图平均值除以单能量120kev图平均值和碘水比值;
根据第一特征和第二特征得到模型训练的特征。
进一步,所述根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型这一步骤,具体包括:
根据提取的特征采用随机森林算法对训练样本进行第一次二分类,得到磷酸钙成分的样本以及非纯磷酸钙成分的样本;
采用随机森林算法对非纯磷酸钙成分的样本进行第二次二分类,得到草酸钙成分的样本以及第一混合成分的样本,其中,所述第一混合成分包括草酸钙成分和磷酸钙成分;
采用随机森林算法对草酸钙成分的样本进行第三次二分类,得到二水草酸钙成分的样本以及第二混合成分的样本,其中,所述第二混合成分包括一水草酸钙成分和二水草酸钙成分;
根据磷酸钙成分的样本、第一混合成分的样本、二水草酸钙成分的样本以及第二混合成分的样本得到泌尿结石成分分析模型。
本发明另一方面所采取的技术方案是:
基于机器学习和能谱CT的泌尿结石成分分析系统,包括:
获取模块,用于获取待分析的能谱CT图像;
感兴趣区域提取模块,用于从获取的能谱CT图像中提取结石的感兴趣区域;
成分分析模块,用于根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析。
进一步,所述成分分析模块包括:
归一化单元,用于以肌肉部分的灰度值作为参考,对结石的感兴趣区域进行归一化;
模型训练单元,用于根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型;
分析单元,用于采用泌尿结石成分分析模型对待分析的样本进行分析,得到泌尿结石的成分。
进一步,所述分析单元包括:
特征提取子单元,用于根据归一化的结果从训练样本提取模型训练的特征;
泌尿结石成分分析模型训练子单元,用于根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型。
本发明另一方面所采取的技术方案是:
基于机器学习和能谱CT的泌尿结石成分分析系统,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如本发明所述的基于机器学习和能谱CT的泌尿结石成分分析方法。
本发明的有益效果是:本发明基于机器学习和能谱CT的泌尿结石成分分析方法及系统,获取待分析的能谱CT图像来提取结石的感兴趣区域,并根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析,将能谱CT图像与机器学习技术相结合来应用于人体结石成分分析上,通过机器学习分析人体的能谱CT图像来对泌尿系结石的成分进行分析,更加高效、客观和准确,且结合了基于能谱CT图像的能谱CT多参数成像技术,能更加全面地反映泌尿系结石的各种成分,从而提供更加准确和全面的结石化学成分分析结果。
附图说明
图1为本发明实施例提供的基于机器学习和能谱CT的泌尿结石成分分析方法流程图;
图2为本发明具体实施例的结石成分分析方案的总体流程图;
图3为腹部能谱CT图像;
图4为图3经预处理后得到的图像;
图5为进行结石感兴趣区域提取前的原图像;
图6为从图5提取得到的结石感兴趣区域;
图7为三维区域生长法的实现原理流程图;
图8为归一化处理前的原图像;
图9为从图8提取的肌肉区域;
图10为结石成分分析流程图;
图11为用户图形界面示意图。
具体实施方式
参照图1,本发明实施例提供了一种基于机器学习和能谱CT的泌尿结石成分分析方法,包括以下步骤:
获取待分析的能谱CT图像;
从获取的能谱CT图像中提取结石的感兴趣区域;
根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析。
具体地,待分析的能谱CT图像一般为人体的腹部能谱CT图像。
传统CT检查在结石成分分析上,具有高敏感性和特异性,能区分尿酸结石和其它类型含钙结石,而能谱CT则改变了传统的CT扫描模式,将混合能量成像转变为单能量成像,提供了单能量图像、能谱曲线以及有效原子序数,碘、水基物质图等多种参数图像。
相较于常规CT,能谱CT不仅可以灵活选择不同图像进行组合分析,还具有成像清晰度高等优势,可大大提高结石诊断的敏感性和特异性,故本实施例通过结合能谱CT多参数成像来进行泌尿结石成分分析,可以更加全面反映其组织特性及其功能状态,能够提供更加准确、全面的诊断,为泌尿系结石的临床研究提供了有效的辅助和参考。
本实施例利用了机器学习这一智能图像处理技术的核心,通过计算机程序从预先得到(如通过临床记录得到)一些数据的特征和标签(即训练样本数据)中分析获得泌尿结石成分分析的规律和对应的分析模型,进而利用这些规律和对应的模型对新的泌尿结石未知数据进行客观的预测,能够实现较稳定和较有效率的诊断。机器学习的方法包括随机森林算法、支持向量机算法、深度学习算法等。
由上述内容可见,本实施例基于机器学习方法,分析结石的能谱CT图像,从而利用能谱CT图像区分不同的结石成分(如草酸钙结石、磷酸钙结石等),更加高效、准确和全面。
进一步作为优选的实施方式,所述从获取的能谱CT图像中提取结石的感兴趣区域这一步骤,具体包括:
对获取的能谱CT图像进行预处理,得到预处理后的能谱CT图像,所述预处理包括去噪和窗口调整;
根据预处理后的能谱CT图像采用三维的区域生长算法提取出结石的感兴趣区域。
具体地,去噪是为了减少噪声的干扰,采用的去噪手段包括平滑、均值滤波器、中值滤波器等。
窗口调整主要是调整窗宽或窗位,提高图像质量以便进行结石兴趣区的提取。
进一步作为优选的实施方式,所述根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析这一步骤,具体包括:
以肌肉区域的灰度值作为参考,对结石的感兴趣区域进行归一化;
根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型;
采用泌尿结石成分分析模型对待分析的样本进行分析,得到泌尿结石成分分析的结果。
具体地,不同患者、不同结石之间的CT值绝对值差异较大,如果不做归一化处理,由不同仪器或者操作者成像所得的数据分布会有所不同,故本实施例增设了归一化的过程。
归一化,就是把结石的CT值除以某一参考部位的CT值,得出一个可在不同病人之间比较的比较值。归一化处理能够归纳统一样本的统计分布性,达到更好的模型训练效果。
根据先验知识和临床经验,肌肉部分的灰度值比较稳定,因此本实施例对从能谱CT图像上提取出来的结石部分和肌肉部分的灰度值做归一化处理。
进一步作为优选的实施方式,所述根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型这一步骤,具体包括:
根据归一化的结果从训练样本提取模型训练的特征;
根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型。
具体地,随机森林是利用样本对多棵决策树进行训练并预测样本结果的一种分类器,决策树的训练过程采用的是自上而下的递归方法,其基本思想是以信息熵为度量构建一颗熵值下降最快的树,直到叶子节点的熵值为零,此时每个叶子节点的样本都属于同一类别。当输入新样本时,随机森林中各决策树分别判断投票,得票数最多的便作为最终的分类结果。随机森林通过决策树的集成学习与多数投票机制,拥有较好的抗噪声能力和不易过拟合,能够较好地对泌尿结石成分进行分类。
进一步作为优选的实施方式,所述根据归一化的结果从训练样本提取模型训练的特征这一步骤,具体包括:
根据归一化的结果从训练样本的第一图像提取第一特征,所述第一图像包括水图、碘图和单能量图,所述单能量图为从单能量40kev图至单能量140kev图中以5kev为能量间隔所取的21种图像,所述第一特征包括直方图上灰度0到0.4上频率最大的灰度值、直方图上灰度0.6到1上频率最大的灰度值、直方图上灰度0.4到0.6上平均灰度值、直方图上频率最大的灰度值、灰度从小到大排列时前四分之一的平均值、灰度从小到大排列时前四分之二到前四分之三的平均值、平均值和方差这8种特征;
根据归一化的结果从训练样本的图像提取第二特征,所述第二特征包括能谱曲线斜率、单能量40kev图平均值除以单能量140kev图平均值、单能量70kev图平均值除以单能量140kev图平均值、单能量70kev图平均值除以单能量120kev图平均值和碘水比值;
根据第一特征和第二特征得到模型训练的特征。
具体地,本实施例利用能谱CT图像的特性,在水图、碘图、单能量图上对结石部分图像提取相关特征来进行模型训练。第一特征为能谱CT的水图、碘图、单能量图对应的特征,共8种;而第二特征则是能谱CT图像的整体特征,共包括5大类特征。
单能量图包括从单能量40kev图至单能量140kev图中以5kev为能量间隔所取的21种图像,加上水图和碘图,共23种图像,这23种图像中的每种图像都提取对应的8种第一特征,故一共可提取23×8=184维特征。
第二特征是能谱CT图像的整体特征,故整体提取5维特征即可。
第一特征和第二特征共同组成了模型训练的特征,故可提取184+5=189维特征。
进一步作为优选的实施方式,所述根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型这一步骤,具体包括:
根据提取的特征采用随机森林算法对训练样本进行第一次二分类,得到磷酸钙成分的样本以及非纯磷酸钙成分的样本;
采用随机森林算法对非纯磷酸钙成分的样本进行第二次二分类,得到草酸钙成分的样本以及第一混合成分的样本,其中,所述第一混合成分包括草酸钙成分和磷酸钙成分;
采用随机森林算法对草酸钙成分的样本进行第三次二分类,得到二水草酸钙成分的样本以及第二混合成分的样本,其中,所述第二混合成分包括一水草酸钙成分和二水草酸钙成分;
根据磷酸钙成分的样本、第一混合成分的样本、二水草酸钙成分的样本以及第二混合成分的样本得到泌尿结石成分分析模型。
具体地,由于泌尿结石成分众多和复杂,本实施例采用随机森林算法对每一个样本进行3次二分类判断,以最终得到泌尿结石成分分析结果。本实施例所采用的模型训练方法除了适用于本实施例所提到的磷酸钙成分、第一混合成分、二水草酸钙成分和第二混合成分等常见的泌尿结石成分分析之外,还可以适用于其它种类的泌尿结石成分分析(训练方法类似,都采用随机森林算法对每一个样本进行若干次二分类判断来得到对应的泌尿结石成分分析结果)。
为更好地实现结石成分的精确分析,以精准指导泌尿系结石的临床诊断和治疗,本具体实施例基于能谱CT多参数成像技术和深度学习技术,提出了一种结石成分分析方案。如图2所示,该方案共分为以下四个部分:1)图像预处理;2)提取结石感兴趣区域;3)图像归一化;4)建立分析模型。下面对这四部分进行详细说明:
第一部分:图像预处理
本具体实施例需要先对腹部能谱CT图像进行降噪、调整窗宽窗位等预处理操作,提高图像质量,以便进行结石感兴趣区的提取。预处理前后的图像分别如图3和图4所示,可以看出预处理后的图像更清晰,质量更好。
第二部分:提取结石的感兴趣区域
本发明的目的是先提取图像结石区域,再从结石区域提取出高维特征,来对结石各种成分进行分析和鉴别,因此本具体实施例需要先提取结石的感兴趣区域(region ofinterest,ROI),以便后续操作的进行。
具体地,可通过一个三维的区域生长算法程序来提取以一个病人为单位的结石感兴趣区域。感兴趣区域即为病人的泌尿系结石部分。结石的感兴趣区域提取前后的图像分别如图5和图6所示。
区域生长是按照预先定义的生长准则将一个像素或者子区域逐步聚合成一个完整独立的连通区域过程。对于图像的感兴趣区域(即目标区域)来说,假设z为感兴趣区域上预先发现的种子点,按照规定的生长准则逐步将与种子点z一定邻域内符合相似性判据的像素合并成一个种子群以备下一阶段的生长,这样不断地进行循环生长直到满足生长停止条件为止,从而完成了对感兴趣区域由一个种子点生长为一个独立连通区域的过程。故区域生长法的流程主要包括:1)确定生长种子点;2)规定生长准则;3)确定生长停止条件,其具体流程如图7所示,相关说明如下:
生长种子点(即初始种子点)的确定:由用户在图像结石区域通过软件交互(如鼠标点击控件、触摸控件等)任意选取一点。
规定生长准则:由确定的种子点往X,Y,Z坐标轴3维区域进行生长,以该像素的灰度值作为相似性判据,如果相似性达到一定程度(即阈值),则将该像素合并成一种子群,以进行下一阶段的生长。
确定生长停止条件:本具体实施例可选取一个阈值作为种子点生长停止的条件,当该种子点与周围领域的像素点相似性没有超越该阈值,则不进行合并,停止生长。
第三部分:图像归一化
鉴于不同患者、不同结石之间的CT值绝对值差异较大,如果不做归一化处理,由不同仪器或者操作者成像所得的数据分布会有所不同,故本具体实施例还需要对图像进行归一化处理。归一化,就是把该结石的CT值除以某一参考部位的CT值,得出一个可在不同病人之间比较的比较值。归一化处理能够归纳统一样本的统计分布性,达到更好的模型训练效果。
通过临床观察和先验知识,可以得出肌肉部分的灰度值比较稳定的结论,因此本具体实施例对从能谱CT图像上提取出来的结石部分和肌肉部分的灰度值进行归一化处理。实际的测试表明,进行归一化数据处理的结石分类模型在各项性能指标上会高于没做归一化数据处理的分类模型。图8和图9分别给出了归一化处理前后的结石图像,其中,图9红色圆圈部分为所提取的肌肉部分。
第四部分:建立分析模型
能谱CT改变了传统的CT扫描模式,将混合能量成像转变为单能量成像,提供了单能量图像、能谱曲线以及有效原子序数,碘、水基物质图等多种参数图像。相较于常规CT,能谱CT不仅可以灵活选择不同图像进行组合分析,还具有成像清晰度高等优势,可大大提高结石诊断的敏感性和特异性。结合能谱CT多参数成像技术,可以更加全面反映结石的组织特性及其功能状态,从而能够提供更加准确、全面的诊断,为泌尿系结石的临床研究提供了更多的可能。
本具体实施例利用能谱CT图像的特性,在水图、碘图、单能量图上对结石部分图像提取相关特征。具体而言,对每一个病人,可提取单能量40kev至140kev图、碘图和水图共23种图像上的189维特征作为模型训练的特征,主要包括两大特征,
其中第一特征具体包括以下8种:
(1)直方图上灰度0到0.4上频率最大的灰度值;
(2)直方图上灰度0.6到1上频率最大的灰度值;
(3)直方图上灰度0.4到0.6上平均灰度值;
(4)直方图上频率最大的灰度值;
(5)灰度从小到大排列时前四分之一的平均值;
(6)灰度从小到大排列时前四分之二到前四分之三的平均值;
(7)平均值;
(8)方差。
而第二特征具体包括以下5类:
(1)能谱曲线斜率;
(2)单能量40kev图平均值除以单能量140kev图平均值;
(3)单能量70kev图平均值除以单能量140kev图平均值;
(4)单能量70kev图平均值除以单能量120kev图平均值;
(5)碘水比值。
单能量图包括从单能量40kev图至单能量140kev图中以5kev为能量间隔所取的21种图像,加上水图和碘图,共23种图像,这23种图像中的每种图像都需提取对应的8种第一特征,故一共可提取23×8=184维特征。
第二特征是能谱CT图像的整体特征,故整体提取5维特征即可。
第一特征和第二特征共同组成了模型训练的特征,故可提取184+5=189维特征。
结石成分复杂且不同成分之间区别较小,故为了区分各类结石成分之间的细微差别以作出有效分类,本具体实施例采用了基于随机森林的机器学习方法来作为训练的分类器。随机森林是利用样本对多棵决策树进行训练并预测样本结果的一种分类器。决策树的训练过程采用的是自上而下的递归方法,其基本思想是以信息熵为度量构建一颗熵值下降最快的树,直到叶子节点的熵值为零,此时每个叶子节点的样本都属于同一类别。决策树中分类属性的度量有如下3种:
Figure BDA0001983026710000091
Figure BDA0001983026710000092
Error=1-max{Pi|i∈[1,n]}   (3)
这里,n表示随机抽样样本的个数,Pi表示第i类样本占总样本的比例。上述3种度量均是值越小,表示分支下输出越纯,应当选取使度量最小的属性作为分裂属性来构建决策树。多次随机抽样,能构建出多个决策树,可组成随机森林。当输入新样本时,随机森林中各决策树分别判断投票,得票数最多的便作为最终的分类结果。通过决策树的集成学习与多数投票机制,使得随机森林拥有较好的抗噪声能力和不易过拟合,能够较好地对结石成分进行分类。
由于结石成分众多和复杂,因此本具体实施例按照图10所示的顺序,对每一个样本进行二分类判断,结石成分分析流程具体包括:
首先,从所有结石中,采用随机森林判断出其成分是磷酸钙成分还是非纯磷酸钙成分。
然后,从非纯磷酸钙结石中,采用随机森林判断出其成分是草酸钙成分还是草酸钙+磷酸钙成分。
最后,再从草酸钙成分结石中,判断出其成分是二水草酸钙还是一水+二水草酸钙成分。
图10的结石成分分析流程除了适用于前述的磷酸钙成分、草酸钙+磷酸钙成分、二水草酸钙成分和一水+二水草酸钙成分等常见的泌尿结石成分分析之外,还可以适用于其它种类的泌尿结石成分分析(分析流程类似,都采用随机森林算法对每一个样本进行若干次二分类判断来得到对应的泌尿结石成分分析结果)。
为了测试本具体实施例的结石成分分析流程的性能,以该结石体外检验分析的结果作为金标准,以灵敏度、特异度、准确率及AUC作为评价分类器的性能指标。首先对灵敏度、特异度、准确率的定义进行说明:
灵敏度Sensitivity=TP/(TP+FN)
特异度Specificity=TN/(TN+FP)
准确率Accuracy=(TP+TN)/(TP+TN+FP+FN)
AUC:定义为ROC曲线下的面积,能客观反映对正样本、负样本综合预测的能力的评价指标,范围从0到1,一般越大越好。
TP:真阳性。
TN:真阴性。
FP:假阳性。
FN:假阴性。
a.从含钙结石成分中,判断出是磷酸钙成分还是非纯磷酸钙成分时,以磷酸钙成分为正样本,以草酸钙成分和草酸钙+磷酸钙混合成分为负样本进行二分类,得到的分类器具体测试结果如下:
灵敏度=0.6875±0.0589
特异度=0.8400±0.1090
准确率=0.8105±0.0852
AUC=0.7275±0.0468
b.从非纯磷酸钙成分中,判断出是草酸钙成分还是草酸钙+磷酸钙成分时,以草酸钙成分为正样本,以草酸钙+磷酸钙混合成分为负样本进行二分类,得到的分类器具体测试结果如下:
灵敏度=0.7111±0.0824
特异度=0.7429±0.1298
准确率=0.7250±0.0513
AUC=0.7580±0.0482
c.从草酸钙成分中,判断出是二水草酸钙还是一水+二水草酸钙成分时,以一水+二水草酸钙成分为正样本,以二水草酸钙成分为负样本进行二分类,得到的分类器具体测试结果如下:
灵敏度=0.7976±0.0702
特异度=0.8542±0.0941
准确率=0.8182±0.0407
AUC=0.8844±0.0342
由上述各个二分类器的具体测试结果可知,本具体实施例的结石成分分析流程所采用的分类器灵敏度较高、特异度较高、准确率较高及AUC较大,具有良好的分类性能。
而本具体实施例对应的用户图形界面如图11所示(可采用MATLAB软件来开发)。
与图1的方法相对应,本发明实施例还提供了一种基于机器学习和能谱CT的泌尿结石成分分析系统,包括:
获取模块,用于获取待分析的能谱CT图像;
感兴趣区域提取模块,用于从获取的能谱CT图像中提取结石的感兴趣区域;
成分分析模块,用于根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析。
进一步作为优选的实施方式,所述成分分析模块包括:
归一化单元,用于以肌肉部分的灰度值作为参考,对结石的感兴趣区域进行归一化;
模型训练单元,用于根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型;
分析单元,用于采用泌尿结石成分分析模型对待分析的样本进行分析,得到泌尿结石的成分。
进一步作为优选的实施方式,所述分析单元包括:
特征提取子单元,用于根据归一化的结果从训练样本提取模型训练的特征;
泌尿结石成分分析模型训练子单元,用于根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
与图1的方法相对应,本发明实施例还提供了一种基于机器学习和能谱CT的泌尿结石成分分析系统,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如本发明所述的基于机器学习和能谱CT的泌尿结石成分分析方法。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
综上所述,本发明一种基于机器学习和能谱CT的泌尿结石成分分析方法及系统,首次采用基于机器学习的智能图像处理技术来分析结石的能谱CT图像,通过对泌尿系结石的成进行分析,建立了结石成分分析模型,实现了泌尿系结石成分的高效、精确、客观和全面的分析,能精准指导泌尿系结石的临床诊断和治疗。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (5)

1.基于机器学习和能谱CT的泌尿结石成分分析方法,其特征在于:包括以下步骤:
获取待分析的能谱CT图像;
从获取的能谱CT图像中提取结石的感兴趣区域;
根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析;
所述根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析这一步骤,具体包括:
以肌肉区域的灰度值作为参考,对结石的感兴趣区域进行归一化;
根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型;
采用泌尿结石成分分析模型对待分析的样本进行分析,得到泌尿结石成分分析的结果;
所述根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型这一步骤,具体包括:
根据归一化的结果从训练样本提取模型训练的特征;
根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型;
所述根据归一化的结果从训练样本提取模型训练的特征这一步骤,具体包括:
根据归一化的结果从训练样本的第一图像提取第一特征,所述第一图像包括水图、碘图和单能量图,所述单能量图为从单能量40kev图至单能量140kev图中以5kev为能量间隔所取的21种图像,所述第一特征包括直方图上灰度0到0.4上频率最大的灰度值、直方图上灰度0.6到1上频率最大的灰度值、直方图上灰度0.4到0.6上平均灰度值、直方图上频率最大的灰度值、灰度从小到大排列时前四分之一的平均值、灰度从小到大排列时前四分之二到前四分之三的平均值、平均值和方差这8种特征;
根据归一化的结果从训练样本的图像提取第二特征,所述第二特征包括能谱曲线斜率、单能量40kev图平均值除以单能量140kev图平均值、单能量70kev图平均值除以单能量140kev图平均值、单能量70kev图平均值除以单能量120kev图平均值和碘水比值;
根据第一特征和第二特征得到模型训练的特征。
2.根据权利要求1所述的基于机器学习和能谱CT的泌尿结石成分分析方法,其特征在于:所述从获取的能谱CT图像中提取结石的感兴趣区域这一步骤,具体包括:
对获取的能谱CT图像进行预处理,得到预处理后的能谱CT图像,所述预处理包括去噪和窗口调整;
根据预处理后的能谱CT图像采用三维的区域生长算法提取出结石的感兴趣区域。
3.根据权利要求1所述的基于机器学习和能谱CT的泌尿结石成分分析方法,其特征在于:所述根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型这一步骤,具体包括:
根据提取的特征采用随机森林算法对训练样本进行第一次二分类,得到磷酸钙成分的样本以及非纯磷酸钙成分的样本;
采用随机森林算法对非纯磷酸钙成分的样本进行第二次二分类,得到草酸钙成分的样本以及第一混合成分的样本,其中,所述第一混合成分包括草酸钙成分和磷酸钙成分;
采用随机森林算法对草酸钙成分的样本进行第三次二分类,得到二水草酸钙成分的样本以及第二混合成分的样本,其中,所述第二混合成分包括一水草酸钙成分和二水草酸钙成分;
根据磷酸钙成分的样本、第一混合成分的样本、二水草酸钙成分的样本以及第二混合成分的样本得到泌尿结石成分分析模型。
4.基于机器学习和能谱CT的泌尿结石成分分析系统,其特征在于:包括:
获取模块,用于获取待分析的能谱CT图像;
感兴趣区域提取模块,用于从获取的能谱CT图像中提取结石的感兴趣区域;
成分分析模块,用于根据结石的感兴趣区域采用机器学习的方法进行泌尿结石成分分析;
所述成分分析模块包括:
归一化单元,用于以肌肉部分的灰度值作为参考,对结石的感兴趣区域进行归一化;
模型训练单元,用于根据归一化的结果采用机器学习的方法进行模型训练,得到泌尿结石成分分析模型;
分析单元,用于采用泌尿结石成分分析模型对待分析的样本进行分析,得到泌尿结石的成分;
所述分析单元包括:
特征提取子单元,用于根据归一化的结果从训练样本提取模型训练的特征;
泌尿结石成分分析模型训练子单元,用于根据提取的特征和训练样本采用随机森林算法进行模型训练,得到泌尿结石成分分析模型;
所述根据归一化的结果从训练样本提取模型训练的特征,具体包括:
根据归一化的结果从训练样本的第一图像提取第一特征,所述第一图像包括水图、碘图和单能量图,所述单能量图为从单能量40kev图至单能量140kev图中以5kev为能量间隔所取的21种图像,所述第一特征包括直方图上灰度0到0.4上频率最大的灰度值、直方图上灰度0.6到1上频率最大的灰度值、直方图上灰度0.4到0.6上平均灰度值、直方图上频率最大的灰度值、灰度从小到大排列时前四分之一的平均值、灰度从小到大排列时前四分之二到前四分之三的平均值、平均值和方差这8种特征;
根据归一化的结果从训练样本的图像提取第二特征,所述第二特征包括能谱曲线斜率、单能量40kev图平均值除以单能量140kev图平均值、单能量70kev图平均值除以单能量140kev图平均值、单能量70kev图平均值除以单能量120kev图平均值和碘水比值;
根据第一特征和第二特征得到模型训练的特征。
5.基于机器学习和能谱CT的泌尿结石成分分析系统,其特征在于:包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-3任一项所述的基于机器学习和能谱CT的泌尿结石成分分析方法。
CN201910156319.6A 2019-03-01 2019-03-01 基于机器学习和能谱ct的泌尿结石成分分析方法及系统 Active CN110033432B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910156319.6A CN110033432B (zh) 2019-03-01 2019-03-01 基于机器学习和能谱ct的泌尿结石成分分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910156319.6A CN110033432B (zh) 2019-03-01 2019-03-01 基于机器学习和能谱ct的泌尿结石成分分析方法及系统

Publications (2)

Publication Number Publication Date
CN110033432A CN110033432A (zh) 2019-07-19
CN110033432B true CN110033432B (zh) 2023-04-18

Family

ID=67235745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910156319.6A Active CN110033432B (zh) 2019-03-01 2019-03-01 基于机器学习和能谱ct的泌尿结石成分分析方法及系统

Country Status (1)

Country Link
CN (1) CN110033432B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110507287A (zh) * 2019-08-29 2019-11-29 付现敏 一种泌尿外科用智能数字影像处理系统及方法
CN111340130B (zh) * 2020-03-09 2023-12-05 江西省人民医院 一种基于深度学习和影像组学的泌尿结石检测分类方法
KR102209086B1 (ko) * 2020-08-28 2021-01-28 주식회사 스타랩스 요로결석 정보제공 방법, 장치 및 컴퓨터 판독가능 매체
KR20230090741A (ko) * 2021-12-15 2023-06-22 주식회사 아이도트 요로결석 진단 시스템 및 그 방법
CN114240937B (zh) * 2022-02-24 2022-05-27 武汉烽火凯卓科技有限公司 一种基于ct切片的肾结石检测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810712A (zh) * 2014-03-05 2014-05-21 南方医科大学 一种能谱ct图像质量的评价方法
CN107358267A (zh) * 2017-07-20 2017-11-17 东北大学 一种基于互相关特征的乳腺超声图像多元分类系统及方法
CN107481242A (zh) * 2017-08-17 2017-12-15 重庆青信科技有限公司 一种能谱ct图像的分割方法及系统
CN108388841A (zh) * 2018-01-30 2018-08-10 浙江大学 基于多特征深度神经网络的宫颈活检区域识别方法及装置
CN108596209A (zh) * 2018-03-22 2018-09-28 重庆青信科技有限公司 一种能谱ct图像的处理方法及系统
CN109166105A (zh) * 2018-08-01 2019-01-08 中国人民解放军南京军区南京总医院 人工智能医学影像的肿瘤恶性风险分层辅助诊断系统
JP2019005557A (ja) * 2017-06-22 2019-01-17 キヤノンメディカルシステムズ株式会社 画像処理装置、磁気共鳴イメージング装置及び画像処理プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9230354B2 (en) * 2010-10-29 2016-01-05 Mayo Foundation For Medical Education And Research System and method for molecular breast imaging energy spectrum imaging and analysis

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810712A (zh) * 2014-03-05 2014-05-21 南方医科大学 一种能谱ct图像质量的评价方法
JP2019005557A (ja) * 2017-06-22 2019-01-17 キヤノンメディカルシステムズ株式会社 画像処理装置、磁気共鳴イメージング装置及び画像処理プログラム
CN107358267A (zh) * 2017-07-20 2017-11-17 东北大学 一种基于互相关特征的乳腺超声图像多元分类系统及方法
CN107481242A (zh) * 2017-08-17 2017-12-15 重庆青信科技有限公司 一种能谱ct图像的分割方法及系统
CN108388841A (zh) * 2018-01-30 2018-08-10 浙江大学 基于多特征深度神经网络的宫颈活检区域识别方法及装置
CN108596209A (zh) * 2018-03-22 2018-09-28 重庆青信科技有限公司 一种能谱ct图像的处理方法及系统
CN109166105A (zh) * 2018-08-01 2019-01-08 中国人民解放军南京军区南京总医院 人工智能医学影像的肿瘤恶性风险分层辅助诊断系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Abnormalities detection in kidney using multithreading technology;M. Edhayadharshini等;《2017 Fourth International Conference on Signal Processing, Communication and Networking (ICSCN)》;20170318;全文 *
CT能谱成像评价肾透明细胞癌核分级;赵娜等;《中国医学影像学杂志》;20140810;全文 *
Predicting prognosis of resected hepatocellular carcinoma by radiomics analysis with random survival forest;H.Akai等;《Diagnostic and Interventional Imaging》;20180614;全文 *
双能量能谱CT分析体内尿酸结石的诊断价值;张玉娇等;《安徽医科大学学报》;20170522;1091-1093页 *

Also Published As

Publication number Publication date
CN110033432A (zh) 2019-07-19

Similar Documents

Publication Publication Date Title
CN110033432B (zh) 基于机器学习和能谱ct的泌尿结石成分分析方法及系统
US11101033B2 (en) Medical image aided diagnosis method and system combining image recognition and report editing
CN111127466B (zh) 医学图像检测方法、装置、设备及存储介质
CN109727243A (zh) 乳腺超声图像识别分析方法及系统
AU670938B2 (en) Method for identifying normal biomedical specimens
CN112382392A (zh) 一种用于肺结节风险性评估的系统
CN110991536B (zh) 原发性肝癌的早期预警模型的训练方法
CN103249358A (zh) 医用图像处理装置
EP3287914A1 (de) Ermittlung von ergebnisdaten auf basis von medizinischen messdaten aus verschiedenen messungen
CN106023151A (zh) 一种开放环境下中医舌象目标检测方法
CN116188423B (zh) 基于病理切片高光谱图像的超像素稀疏解混检测方法
CN108695000A (zh) 基于超声图像的甲状腺弥漫性疾病智能诊断方法及系统
CN113164142A (zh) 相似度确定装置、方法及程序
CN112305006A (zh) 一种基于核磁共振信号的肿瘤组织标本的识别方法及系统
CN117218127B (zh) 超声内镜辅助监测系统及方法
CN112690815A (zh) 基于肺部图像报告辅助诊断病变等级的系统和方法
KR102033484B1 (ko) 적대적 인공지능 생성망 (gan)을 활용한 반려동물 검사의 정상범위 기준치 설정 방법 및 장치
CN111265234A (zh) 一种肺部纵膈淋巴结的性质判定方法及系统
CN114176602B (zh) 一种基于深度学习多目标检测同时定位心电p波、qrs波、t波位置的方法
Yilmaz et al. Deep Convolutional Neural Networks for Onychomycosis Detection
CN113255718B (zh) 一种基于深度学习级联网络方法的宫颈细胞辅助诊断方法
Li et al. A recognition method of urine cast based on deep learning
CN113344022A (zh) 一种基于深度学习的胸片检测方法
CN115064267B (zh) 一种胆道闭锁风险评估系统及其建立方法
CN117831757B (zh) 基于病理ct多模态先验知识引导的肺癌诊断方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant