CN102165454B - 用于提高计算机辅助诊断对图像处理不确定性的鲁棒性的方法 - Google Patents

用于提高计算机辅助诊断对图像处理不确定性的鲁棒性的方法 Download PDF

Info

Publication number
CN102165454B
CN102165454B CN200980137834.4A CN200980137834A CN102165454B CN 102165454 B CN102165454 B CN 102165454B CN 200980137834 A CN200980137834 A CN 200980137834A CN 102165454 B CN102165454 B CN 102165454B
Authority
CN
China
Prior art keywords
training
feature
training image
treated
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980137834.4A
Other languages
English (en)
Other versions
CN102165454A (zh
Inventor
M·C·李
L·博罗茨基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN102165454A publication Critical patent/CN102165454A/zh
Application granted granted Critical
Publication of CN102165454B publication Critical patent/CN102165454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • G06T2207/30064Lung nodule
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/031Recognition of patterns in medical or anatomical images of internal organs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

通过由特征矢量(F1 1、...、Fk m)构成的特征矩阵(18、18′)训练分类器(20)。利用多种(m)图像处理算法(121、...、12m)中的每种对多个(k)训练图像数据集中的每个进行操作以生成特征矢量,从而生成经处理的和经分割的图像。提取(14)经分割的区域的特征以生成特征矢量。通过这种方式,利用由各种图像处理算法生成的数据训练分类器。

Description

用于提高计算机辅助诊断对图像处理不确定性的鲁棒性的方法
技术领域
本申请涉及计算机辅助诊断(CADx)的领域。本申请尤其适于结合基于诊断图像的计算机辅助诊断的应用,并将具体参考其加以描述。然而,应当认识到,本申请还适用于可以包括或不包括图像的其他计算机辅助诊断系统。
背景技术
已经有人提出将计算机辅助诊断系统作为一种辅助精确表征诊断医学图像中发现的异常的方法。例如,可以将计算机辅助诊断用于探测CT扫描中的肺部结节。CADx系统分析CT图像或至少分析与探测到的结节相关联的部分,并估计给定结节是恶性或是良性的可能性。
通常,执行初始图像处理以准备要分析的图像。再次参考针对肺部结节的CADx的范例,使用初始分割步骤限定每个结节的边界。然后将这些边界充当CADx系统的输入。CADx系统执行特征提取,其量化描述结节的众多特征,例如100个或更多个特征。这些特征例如可以包括形状、纹理、对比度、尺寸等。经分割的边界允许对结节的内部特征和外部特征特性进行差异(differential)分析以及描述结节的形状和尺寸。应用模式分类算法以基于这组计算的特征对未知结节分类。将这种分类分成组,诸如良性或恶性。利用一组训练数据训练这样的分类算法或“分类器”。训练数据通常包括先前进行的分割或其他图像处理和特征提取,并且其已经知道例如诊断的正确分类。
由于与图像处理相关联的不确定性可能会出现问题。例如,考虑通过肺部结节的体积和对比度评估对肺部结节的诊断的简单分类器,对比度即结节内部的平均亮度除以其周围的平均亮度。如果使用两种分割算法进行预处理并生成两个不同的边界,这些边界可能导致不同的体积,即边界内包含的体积或面积以及不同的对比度值。结节的分割是主观的。亦即,对于什么是正确的边界没有绝对明确的答案。此外,可能两种不同分割例程可以导出不同的边界,而两者都是合理的。那么就出现问题了,即使用哪种分割来生成训练数据集并执行实际的计算机辅助诊断任务。
在一些训练流程中,首先选择分类中要使用的特征。在分类算法中使用过多的特征可能会有问题,特别是包括不相关特征的情况。过多的特征会导致过度拟合(over-fitting),其中,由于训练数据大小有限,噪声或不相关特征可能对分类决定生成不当影响。选择理想的特征子集的过程称为“特征选择”。特征选择可能受到图像处理步骤中的不确定性的影响。一些特征可能比其他特征更容易受到不确定性影响。例如,分割边界的表面面积可能比总体积更为敏感,尤其是因为许多分割算法被设计成生成一致(consistent)的体积测量,但因此可能生成在局部不同的形状。
通常执行除分割之外的其他类型的图像处理。然而,在开发临床可行的CADx系统的过程中,分割是特别大的挑战。其他图像处理步骤可以包含影响CADx结果的不确定性要素。例如,使用不同内核的内插法可能都生成视觉上可接受的结果,但均获得不同的特征集,以及因此潜在不同的分类。使用配准过程以将同一患者的多幅图像对准或将单位患者与参考图集对准。不同的配准算法可能再次生成视觉上类似的结果,但可能会生成不同的计算特征和不同的分类。由于对图像进行过滤或去噪声、诸如图像锐化的图像增强或重建算法,可能会观察到类似的不确定性效应。
已经采用了各种分割技术,例如距离变换和区域生长。在用于肺结节的示范性分割技术中,利用阈值化步骤对分割过程进行初始化。在确定被分割的结节的最终形状时,初始阈值至关重要。已经发现400 Hounsfield单位(HU)的阈值代表了一个合理的值,其对于若干分割算法在切片厚度的范围上生成相对一致的结节体积估计。然而,使用这种阈值不能令人满意地分割一些结节,并转而利用不同的阈值进行分割。
为了克服针对训练和测试两者而言的这一难题,可以针对每个结节手动改变分割阈值,直到获得视觉上可接受的分割为止。尽管这种方法获得了相当大成功,但用户的主观性问题仍旧带来了不确定性。由不同的临床医生对分割进行的手动选择导致在对图像进行诊断时难以保持一致性。用户主观性的影响往往会导致不同放射科医师之间的分割具有很大变化。如果允许用户利用计算机编辑工具修改分割结果,这种主观性会加剧。
CADx系统的关键难题是面对与图像处理步骤相关联的不确定性时的鲁棒性(robustness)。“鲁棒”意味着尽管存在不确定性,但使用任何合理图像处理例程的CADx输出诊断的精密性和精确度将保持仍然相对相同。要克服的问题包括训练对图像处理步骤中的不确定性有恢复力的分类器以及选择对图像处理步骤中的不确定性有恢复力的特征。
提出的解决上述问题的一种尝试是简单指定单个图像处理算法和针对要在所有诊断情况下使用的所述算法的参数。在肺结节CADx的范例中,这通常涉及指定分割例程和单个固定阈值。然而,如上所述,并非总能够找到在所有情况下都适用的通用算法、阈值或特征。
他人已经提出完全去除图像处理步骤,并基于原始图像数据进行分析和分类,无需提取特征。尽管这种提议已经相对成功,但在许多情况下,仍旧期望对结节进行分割。例如,通常对结节执行体积测量以便追踪进展或治疗功效。此外,分析原始数据在其他图像处理算法,例如配准、过滤和内插法中没有助益。
他人已经提出,在训练例程中使用数据之前向数据添加噪声,从而改善CADx系统的一般化性能。通常这是通过生成每个训练数据点的多个副本来进行的,但每次都向该数据点的位置添加了不同水平的随机噪声。一个缺点在于难以将人为噪声匹配到与图像处理算法相关联的实际不确定性。
发明内容
本申请想到了一种克服了上述问题和其他问题的新的经改进的训练技术。
根据一个方面,提供了一种分类器。该分类器包括已经由特征矢量F1 1、…、Fk m构成的特征矩阵训练的线性判别式处理器、支持矢量机、神经网络、贝叶斯(Bayesian)处理器、决策树或最邻近处理器中的至少一种。通过如下方式生成特征矩阵的特征矢量F1 1、…、Fk m:利用m种图像处理算法中的每种处理来自多位具有已知诊断的患者的k个训练图像数据集101、…10k中的每个,以生成经处理的训练图像,并且提取所述经处理的训练图像的特征,并且其中,所生成的特征矢量被组合成m x k行和n列或者m x n列和k行的特征矩阵,其中n为所提取的特征的数目,并且m、n、k为整数。
根据另一方面,提供了一种用于训练分类器的装置,包括:用于利用m种图像处理算法中的每种处理来自多位具有已知诊断的患者的k个训练图像数据集101、…10k中的每个,以生成经处理的训练图像的模块,并且用于提取所述经处理的训练图像的特征以生成特征矢量F1 1、…、Fk m的模块,其中,所生成的特征矢量被组合成m*k行和n列或者m*n列和k行的特征矩阵,其中n为所提取的特征的数目,并且m、n、k为整数,并且用于利用所述特征矩阵训练所述分类器以识别所述已知诊断的模块。
根据另一方面,提供了一种用于训练分类器的方法,所述分类器用于计算机辅助诊断(CADx)。利用m种图像处理算法中的每种处理来自多位具有已知诊断的患者的k个训练图像数据集101、…10k中的每个,以生成多个经处理和经分割的训练图像。提取经处理和经分割的图像的特征以生成特征矢量F1 1、…、Fk m,其中,所生成的特征矢量被组合成m x k行和n列或者m x n列和k行的特征矩阵,其中n为所提取的特征的数目,并且m、n、k为整数。利用所述特征矩阵训练分类器以识别已知诊断。
根据另一方面,提供了一种训练用于计算机辅助诊断系统的分类器的方法。从多位具有已知诊断的患者生成k个训练图像数据集101、…、10k。利用m种图像处理算法121、…、12m中的每种处理每个训练数据集以生成经处理和经分割的训练图像。提取经处理和经分割的图像的特征以生成特征矢量F1 1、…、Fk m,其中,所生成的特征矢量被组合成m x k行和n列或者m x n列和k行的特征矩阵,其中n为所提取的特征的数目,并且m、n、k为整数。利用所述特征矩阵训练所述分类器以识别所述已知诊断。
根据另一方面,提供了一种用于训练分类器的装置,包括:用于从每位都具有已知诊断的多位患者生成k个训练图像数据集101、…、10k的模块;用于利用m种图像处理算法121、…、12m中的每种处理每个训练图像数据集以生成经处理的训练图像的模块;用于从所述经处理的训练图像提取特征以生成特征矢量F1 1、…、Fk m的模块,其中,所生成的特征矢量被组合成m*k行和n列或者m*n列和k行的特征矩阵,其中n为所提取的特征的数目,并且m、n、k为整数;用于利用所述特征矩阵训练所述分类器以识别所述已知诊断的模块。
一个优点在于更为鲁棒的分类器。
另一优点在于在一定范围的图象处理技术中实现更有意义的计算机辅助诊断。
另一优点在于放射科医师个人能够选择更优选的图像处理技术而不会对计算机辅助诊断造成不利影响。
另一优点在于软件开发人员能够创建使用不同图像处理技术的新版本计算机辅助诊断软件而不会对计算机辅助诊断造成不利影响。
在阅读和理解下文的详细描述后,更多优点和益处对于本领域普通技术人员将变得显而易见。
附图说明
本发明可以具体化为不同的部件或部件布置,以及具体化为不同的步骤和步骤安排。附图仅用于图示说明优选实施例,而不应解释为是对本发明的限制。
图1是训练数据准备过程的示意图;
图2图示了训练数据矩阵的一个范例;
图3图示了训练数据矩阵的第二实施例;
图4是CADx系统中的分类器的示意性图示;
图5图示了使用选定阈值相对于所有阈值的相对精确度;
图6a、6b和6c图示了使用不同阈值的分割结果的差异;
图7是针对良性结节的分割阈值间恶性的CADx概率的图示;以及
图8是图示了分类器性能分布的表格。
具体实施方式
本申请涉及一种鲁棒的分类器以及一种将分类器训练成对与图像或其他处理步骤相关联的不确定性鲁棒的方法。通过对训练数据反复应用不同的图像处理算法和特征提取来训练本分类器,使得所得的特征反映图像处理算法范围的不确定性。本申请还涉及基于这种扩大的训练数据集构造的分类器。
参考图1,图像处理步骤121 1使用第一图像处理算法121对初始或原始图像数据101进行操作。一旦处理了图像,就对图像进行特征提取步骤14以提取特征,组合所述特征以生成具有特征矢量F1 1的特征矢量输出161 1。将该过程重复m次以针对m种图像处理算法121、…、12m中的每种使初始图像数据101进行图像处理步骤121 1、…、121 m。对经处理的图像中的每幅进行特征提取步骤14以生成对应的特征矢量输出161 1、…、161 m。通过这种方式,从初始图像数据101生成了m个特征矢量F1 1、…、F1 m
针对k个初始图像数据集101、…、10k中的每个重复这一操作,其中,k是复数值,在一些实施例中大于100。由此对k个初始图像数据集中的每个进行了图像处理步骤121 1、…、12k 1,其中,首先利用第一图像处理算法121处理该图像。对每幅经处理的图像进行特征提取步骤14以生成特征提取矢量F1 1、…、Fk 1的特征矢量输出161 1、…、16k 1。类似地,对k个初始图像数据集中的每个进行m个图像处理步骤121 1、…、12k m,并且因此执行m种图像处理算法中的每种;亦即,总共执行m×k种图像处理操作。对经处理的图像中的每幅进行特征提取步骤14以生成描绘特征矢量F1 1、…、Fk m中的一个的特征矢量输出161 1、…、16k m。图像处理包括不同的分割方法、不同的内插方法、不同的配准方法、不同的滤波器等。每个图像数据集和图像处理算法生成不同的经处理的图像,然后对经处理的图像进行特征提取。通过这种方式,单幅输入图像生成m个特征矢量,并且k幅输入图像生成m x k个特征矢量。应当认识到,可以在单个计算机或处理器上,或由多个处理器、ASIC或其他装置实施上述步骤。
如图2所示,将特征矢量组合成m x k行和n列的训练数据矩阵18,其中,n是提取的特征的数目。如图3所示,备选的训练数据矩阵18'具有包含m x n列的k行,表示利用不同处理算法提取的不同特征。如本文所使用的,将矩阵构造成包括张量和其他多重线性函数。
在特征选择和用于分类器或分类器群(ensembles)的训练中使用训练数据集和经处理的图像。更具体而言,使用图2或3的训练数据矩阵执行特征选择或分类器训练。这有效地扩大了训练算法中使用的训练点的数量或增加了训练空间的维度。通过对图2或3所示的训练数据执行特征选择和/或分类器训练构造分类器群。分类器包括一个或多个线性判别式、支持矢量机、神经网络、贝叶斯分类器、决策树、最邻近分类器等。特征选择包括遗传算法、逐步搜索、穷举搜索、主成分分析、判别式分析等的组合。应当认识到,可以在单个计算机或处理器上,或由多个处理器、ASIC或其他装置实施上述步骤。
更具体而言,如图4所示,通过为分类器20供应训练数据矩阵18或18'和先验的已知诊断22来训练分类器20。分类器使用线性判别式、支持矢量机、神经网络、贝叶斯分类器、决策树、最邻近分类器等根据对应于已知诊断22的训练数据矩阵18或18'确定训练数据中的模式。一旦已经训练了分类器,该训练通常在实验室位置处,安装分类器作为CADx系统的一部分。在此之后,在图像处理步骤中利用图像处理器26处理未知图像数据24,该图像处理步骤可以使用或不使用图像处理算法1、…、m。特征提取处理器或模块28在特征提取步骤中提取特征矢量F,特征矢量F可以包括或不包括与特征提取步骤14提取的相同的n个特征。在基于训练期间学习的模式分析特征矢量之后,分类器20生成指示所提出的诊断和诊断正确可能性的输出30。在评估肺节结的情况下,显示器可能指示结节是恶性的,概率或确定性为0.80或80%。也可以显示诸如一个或多个特征的其他信息。类似地,还可以显示每个结节的图像,所述结节有或没有图像处理算法的分割部分标志的边界。
在应用于肺部结节的CADx的一个范例中,总体目标是通过提供肺节结是恶性还是良性的辅助意见来辅助医生阅读CT或其他诊断图像。在本范例中,初始图像数据集包括针对125个肺部结节中的每个的初始图像数据,即k=125。在由图像处理器26执行的图像处理步骤期间,利用手动识别的种子点和6个不同的分割阈值分割数据集,即m=6。适当的分割阈值包括-800 HU、-700 HU、…、-300 HU的对比度。从这些分割提取的特征生成数据集T-800、T-700、…、T-300。由熟悉特征提取算法的研究人员针对每个结节进行手动选择“最佳”的分割,生成第一或手动训练数据集T手动。将全部6个阈值的结果与手动训练数据集组合以生成扩大的训练集T全部。以图2的数据矩阵18的方式构造这一训练矩阵T全部,行数等于k×m,并且列数等于n=215。在本范例中,矩阵T-800、T-700、…、T-300、T手动包括k=125行,n=215列。
通过包括500个线性判别式分类器的群的留下一个(leave-one-out)流程测试CADx系统的诊断性能。基于遗传算法的特征选择和分类器训练都是利用每次留下一个迭代来执行的,以减少偏差。在这种分析中,从训练中移除属于不同分割处的测试结节的所有点。如下执行两组计算试验:
1.对T手动训练,确认T手动、T-800、T-700、…、T-300;以及,
2.对T全部训练,确认T手动、T-800、T-700、…、T-300
用统计学方式分析结果。例如,考虑一个假想的用户,为该用户提供基于阈值-800 HU、-700 HU、…、-300 HU的6次分割并要求该用户在继续进行CADx计算之前使用分割。执行一组模拟以模拟随机选择分割的用户。例如,蒙特卡罗(Monte Carlo)方法能够针对125种情况中的每种执行随机选择5000次。对于每个模拟组的分割选择,计算指示精确度的接收器工作特性(ROC)曲线下方的面积。参见图5。这种迭代随机过程生成一大组的诊断概率值。这些值的分布描述CADx算法面对不确定分割时的性能。
此外,通过选择生成最佳CADx算法性能、第二佳CADx算法性能等的分割来计算最佳情况和最坏情况的情形。例如,最佳分割的恶性结节可以是产生恶性可能性或概率的最高CADx估计值的那一个。同样地,对于良性结节,最佳分割生成最低的恶性概率。
图6a-6c中图示了对分割参数选择的影响的范例。尽管使用了相同的图像数据,但针对不同的阈值设置观察到被分割结节轮廓的显著偏差。图6a图示了针对-800 HU阈值的分割结果;图6b图示了针对-600 HU阈值的分割结果;图6c图示了针对-400 HU阈值的分割结果。当要求不同用户选择“最佳”分割时,他们往往会选择图6a-6c中的不同的分割。类似地,如果进行手动分割,手动绘制的轮廓线可能不同于图6a-6c中所示的轮廓线,并且由不同放射科医师绘制的手动轮廓线可能彼此不同。在图7中示出了这种变化对本范例中CADx输出的影响。在本范例中,如果利用在手动选择的分割结果上训练的CADx系统对图6中给出的分割进行分类,那么系统将该结节分类为“恶性”的概率大约为0.53。在全部其他阈值时,该系统做出良性分类。本申请的目的是稳定CADx结果,从而使其与手动或阈值分割一致。
对于125种情况中的每种,通过从分割阈值数据集-800 HU、-700HU、…、-300 HU选择来计算可能的CADx输出的范围。每个CADx输出取的值从针对良性预测的0到针对恶性预测的1。预计在分割变化时鲁棒的分类器仅产生小范围的输出值。当在手动分割数据上进行训练时,观察到在125种情况下,输出值的范围具有为0.36的平均值,该平均值的标准偏差为+/-0.23。对于包含如在图2的训练数据矩阵18中表示的全部分割结果的矩阵T全部上训练的鲁棒系统,在所有125种情况下该范围下降为标准偏差为+/-0.21的平均值0.27。当在手动选择的数据上训练时,仅有56种情况,其中,恶性或良性的分类将会基于分割阈值改变。使用在全部分割结果上训练的本鲁棒系统,在本范例中仅有41种情况,其中,分类有改变的风险。
参考图8,提供了一表格,其图示了分类器性能的分布。该表格总结了当使用不同训练矩阵执行训练时CADx性能的变化。如第一行中,在选定的手动分割上测试CADx,代表了基于单组观察人员的判断在数据上获得的CADx性能。在第一行的两列之间未观察到显著差异,表示常规训练方法和本申请所述方法之间没有差异。
模拟的分布估计很宽范围观察人员之间的变化,每位观察人员对哪种分割是最佳的有着不同的判断。通过模拟平均值、标准偏差和百分比以及表格中给出的最佳情况和最坏情况情形和图5中实现的分布总结这种效果。从手动选定的训练数据改变为在所有数据结果上训练导致平均值性能从.809微变到.800,但使标准偏差从0.022减小到0.017,从而证实了提高鲁棒性的目标。
所描述的分类器和分类器训练技术应用于医疗护理,包括基于图像的临床决策支持系统。具体而言,可以与医学成像系统、成像工作站、患者监测系统和保健信息系统集成的计算机辅助诊断系统和治疗管理系统。基于图像的计算机辅助诊断系统包括,但不限于用于肺癌、乳腺癌、结肠癌、前列腺癌等的系统。图像数据可以源于CT、MRI、超声、PET、SPECT或其他成像器械。整体可以涉及使用放射医学工作站或图像归档和通信系统。
本公开引用了优选实施例。在阅读并理解了前述详细说明的情况下,他人可以想到修改和变型。意图是只要它们落在所附权利要求或与其等价的范围内,将本公开解释为包括所有这样的修改和变型。

Claims (9)

1.一种用于训练分类器(20)的装置,包括:
用于利用m种图像处理算法中的每种处理来自多位具有已知诊断的患者的k个训练图像数据集101、…10k中的每个,以生成经处理的训练图像的模块,并且
用于提取所述经处理的训练图像的特征以生成特征矢量F1 1、…、Fk m的模块,
其中,所生成的特征矢量被组合成m*k行和n列或者m*n列和k行的特征矩阵(18、18'),其中n为所提取的特征的数目,并且m、n、k为整数,并且
用于利用所述特征矩阵(18、18')训练所述分类器(20)以识别所述已知诊断的模块。
2.一种训练分类器(20)的方法,其用于计算机辅助诊断(CADx),所述方法包括:
利用m种图像处理算法中的每种处理来自多位具有已知诊断的患者的k个训练图像数据集101、…10k中的每个,以生成多个经处理的训练图像;
提取(14)所述经处理的训练图像的特征以生成特征矢量F1 1、…、Fk m,其中,所生成的特征矢量被组合成m*k行和n列或者m*n列和k行的特征矩阵(18、18'),其中n为所提取的特征的数目,并且m、n、k为整数;
利用所述特征矩阵(18、18')训练所述分类器(20)以识别所述已知诊断。
3.根据权利要求2所述的方法,其中,所述处理步骤包括分割。
4.一种训练分类器(20)的方法,其用于计算机辅助诊断(CADx)系统,所述方法包括:
从每位都具有已知诊断的多位患者生成k个训练图像数据集101、…、10k
利用m种图像处理算法121、…、12m中的每种处理每个训练图像数据集以生成经处理的训练图像;
从所述经处理的训练图像提取特征(14)以生成特征矢量F1 1、…、Fk m,其中,所生成的特征矢量被组合成m*k行和n列或者m*n列和k行的特征矩阵(18、18'),其中n为所提取的特征的数目,并且m、n、k为整数;
利用所述特征矩阵(18、18')训练所述分类器(20)以识别所述已知诊断。
5.根据权利要求4所述的方法,其中,所述训练图像数据集是利用分割算法、内插算法、过滤算法、配准算法和重建算法中的至少一种而被处理的。
6.根据权利要求4所述的方法,其中,所述处理包括利用具有分割标准的分割算法进行分割,所述分割标准包括根据多个对比度阈值中的每个进行的分割。
7.根据权利要求4所述的方法,其中,提取每幅经处理的图像的n个特征,使得所述特征矢量中的每个都指示所述经处理的图像或所述经处理的图像的一个或多个子区的n个所提取的特征。
8.根据权利要求7所述的方法,其中,所提取的特征包括纹理、对比度、形状和尺寸中的一个或多个。
9.一种用于训练分类器(20)的装置,包括:
用于从每位都具有已知诊断的多位患者生成k个训练图像数据集101、…、10k的模块;
用于利用m种图像处理算法121、…、12m中的每种处理每个训练图像数据集以生成经处理的训练图像的模块;
用于从所述经处理的训练图像提取特征(14)以生成特征矢量F1 1、…、Fk m的模块,其中,所生成的特征矢量被组合成m*k行和n列或者m*n列和k行的特征矩阵(18、18'),其中n为所提取的特征的数目,并且m、n、k为整数;
用于利用所述特征矩阵(18、18')训练所述分类器(20)以识别所述已知诊断的模块。
CN200980137834.4A 2008-09-29 2009-09-09 用于提高计算机辅助诊断对图像处理不确定性的鲁棒性的方法 Active CN102165454B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10086408P 2008-09-29 2008-09-29
US61/100,864 2008-09-29
PCT/IB2009/053952 WO2010035163A1 (en) 2008-09-29 2009-09-09 Method for increasing the robustness of computer-aided diagnosis to image processing uncertainties

Publications (2)

Publication Number Publication Date
CN102165454A CN102165454A (zh) 2011-08-24
CN102165454B true CN102165454B (zh) 2015-08-05

Family

ID=41314633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980137834.4A Active CN102165454B (zh) 2008-09-29 2009-09-09 用于提高计算机辅助诊断对图像处理不确定性的鲁棒性的方法

Country Status (3)

Country Link
US (1) US9123095B2 (zh)
CN (1) CN102165454B (zh)
WO (1) WO2010035163A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100014755A1 (en) * 2008-07-21 2010-01-21 Charles Lee Wilson System and method for grid-based image segmentation and matching
US8582871B2 (en) * 2009-10-06 2013-11-12 Wright State University Methods and logic for autonomous generation of ensemble classifiers, and systems incorporating ensemble classifiers
US9269024B2 (en) * 2010-02-01 2016-02-23 Qualcomm Incorporated Image recognition system based on cascaded over-complete dictionaries
EP2773777B1 (en) 2011-10-31 2020-05-13 University of Utah Research Foundation Genetic alterations in glioblastoma
JP5868231B2 (ja) 2012-03-16 2016-02-24 株式会社日立製作所 医用画像診断支援装置、医用画像診断支援方法ならびにコンピュータプログラム
US9122950B2 (en) * 2013-03-01 2015-09-01 Impac Medical Systems, Inc. Method and apparatus for learning-enhanced atlas-based auto-segmentation
EP2806374B1 (en) * 2013-05-24 2022-07-06 Tata Consultancy Services Limited Method and system for automatic selection of one or more image processing algorithm
DE102013216362A1 (de) 2013-08-19 2015-02-19 Siemens Healthcare Diagnostics Products Gmbh Analyseverfahren zur Klassifikationsunterstützung
CN104076813A (zh) * 2014-07-08 2014-10-01 中国航空无线电电子研究所 基于贝叶斯决策树的tcas系统故障综合诊断方法和系统
US9622698B2 (en) 2014-11-19 2017-04-18 Xerox Corporation System and method for detecting cancerous tissue from a thermal image
US10055542B2 (en) 2015-03-25 2018-08-21 Niramai Health Analytix Pvt Ltd Software interface tool for breast cancer screening
US9486146B2 (en) 2015-03-25 2016-11-08 Xerox Corporation Detecting tumorous breast tissue in a thermal image
US20180122507A1 (en) * 2015-04-14 2018-05-03 University Of Utah Research Foundation Genetic alterations in ovarian cancer
CN104933446B (zh) * 2015-07-15 2018-09-18 福州大学 一种用于计算机辅助诊断乳腺b超特征有效性验证的方法
US10307108B2 (en) 2015-10-13 2019-06-04 Elekta, Inc. Pseudo-CT generation from MR data using a feature regression model
CN106056595B (zh) * 2015-11-30 2019-09-17 浙江德尚韵兴医疗科技有限公司 基于深度卷积神经网络自动识别甲状腺结节良恶性的辅助诊断系统
US10163028B2 (en) * 2016-01-25 2018-12-25 Koninklijke Philips N.V. Image data pre-processing
US20180005136A1 (en) * 2016-07-01 2018-01-04 Yi Gai Machine learning in adversarial environments
US9965702B1 (en) 2016-12-27 2018-05-08 Cesar Angeletti Method for analysis and interpretation of flow cytometry data
US11062792B2 (en) 2017-07-18 2021-07-13 Analytics For Life Inc. Discovering genomes to use in machine learning techniques
US11139048B2 (en) * 2017-07-18 2021-10-05 Analytics For Life Inc. Discovering novel features to use in machine learning techniques, such as machine learning techniques for diagnosing medical conditions
CN107480684B (zh) * 2017-08-24 2020-06-05 成都澳海川科技有限公司 图像处理方法及装置
KR102565278B1 (ko) 2018-03-26 2023-08-09 삼성전자주식회사 영상 분할 방법, 영상 분할 장치, 및 영상 분할을 위한 학습 방법
CN108564044B (zh) * 2018-04-17 2021-04-27 杭州依图医疗技术有限公司 一种确定肺结节密度的方法及装置
CN108896972A (zh) * 2018-06-22 2018-11-27 西安飞机工业(集团)有限责任公司 一种基于图像识别的雷达图像仿真方法
EP3660741B1 (en) * 2018-11-29 2022-05-04 Koninklijke Philips N.V. Feature identification in medical imaging
CN110232678B (zh) * 2019-05-27 2023-04-07 腾讯科技(深圳)有限公司 一种图像不确定度预测方法、装置、设备及存储介质
JP7469858B2 (ja) 2019-08-06 2024-04-17 キヤノンメディカルシステムズ株式会社 医用画像処理装置、医用画像処理方法、および画像処理装置
CN112541564B (zh) * 2019-09-20 2024-02-20 腾讯科技(深圳)有限公司 降低贝叶斯深度神经网络计算复杂度的方法和装置
CN111242921B (zh) * 2020-01-12 2023-12-12 刘涛 一种医学超声图像辅助诊断系统自动更新的方法及系统
WO2023035072A1 (en) * 2021-09-08 2023-03-16 Brainware Ai, Inc. System and method for monitoring brain trauma exposure

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1930584A (zh) * 2004-01-08 2007-03-14 美国西门子医疗解决公司 对医学图像进行滤波的系统和方法
CN101061490A (zh) * 2004-11-19 2007-10-24 皇家飞利浦电子股份有限公司 利用支持向量机(svm)在计算机辅助检测(cad)中进行假阳性降低的系统和方法
CN101084511A (zh) * 2004-12-17 2007-12-05 皇家飞利浦电子股份有限公司 自动开发在医学诊断成像中产生医学有意义的描述符的高性能分类器的方法和装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7308126B2 (en) * 1997-08-28 2007-12-11 Icad, Inc. Use of computer-aided detection system outputs in clinical practice
US6996549B2 (en) 1998-05-01 2006-02-07 Health Discovery Corporation Computer-aided image analysis
WO2001078005A2 (en) * 2000-04-11 2001-10-18 Cornell Research Foundation, Inc. System and method for three-dimensional image rendering and analysis
AU2002243783B2 (en) 2001-01-23 2007-07-19 Health Discovery Corporation Computer-aided image analysis
CN1636210A (zh) * 2001-11-02 2005-07-06 美国西门子医疗解决公司 用于临床试验的病人数据挖掘
US7113636B2 (en) 2002-08-30 2006-09-26 Lockheed Martin Corporation Method and computer program product for generating training data for a new class in a pattern recognition classifier
WO2004025569A2 (en) * 2002-09-13 2004-03-25 Arcturus Bioscience, Inc. Tissue image analysis for cell classification and laser capture microdissection
US7711174B2 (en) * 2004-05-13 2010-05-04 The Charles Stark Draper Laboratory, Inc. Methods and systems for imaging cells
US20060111644A1 (en) * 2004-05-27 2006-05-25 Children's Medical Center Corporation Patient-specific seizure onset detection system
US20060018524A1 (en) * 2004-07-15 2006-01-26 Uc Tech Computerized scheme for distinction between benign and malignant nodules in thoracic low-dose CT
WO2006034366A1 (en) * 2004-09-21 2006-03-30 Siemens Medical Solutions Usa, Inc. Hierarchical medical image view determination
US8265355B2 (en) * 2004-11-19 2012-09-11 Koninklijke Philips Electronics N.V. System and method for automated detection and segmentation of tumor boundaries within medical imaging data
WO2006054271A2 (en) 2004-11-19 2006-05-26 Koninklijke Philips Electronics, N.V. False positive reduction in computer -assisted detection ( cad)
US7650321B2 (en) * 2005-02-16 2010-01-19 Siemens Medical Solutions Usa, Inc. Two classifier based system for classifying anomalous medical patient records
US20060210133A1 (en) * 2005-03-03 2006-09-21 Sriram Krishnan Performance adjustments in medical decision support systems
US7648460B2 (en) * 2005-08-31 2010-01-19 Siemens Medical Solutions Usa, Inc. Medical diagnostic imaging optimization based on anatomy recognition
US7876938B2 (en) * 2005-10-06 2011-01-25 Siemens Medical Solutions Usa, Inc. System and method for whole body landmark detection, segmentation and change quantification in digital images
EP1780651A1 (en) * 2005-10-25 2007-05-02 Bracco Imaging, S.P.A. Method and system for automatic processing and evaluation of images, particularly diagnostic images
US7756313B2 (en) * 2005-11-14 2010-07-13 Siemens Medical Solutions Usa, Inc. System and method for computer aided detection via asymmetric cascade of sparse linear classifiers
US20070140551A1 (en) * 2005-12-16 2007-06-21 Chao He Banknote validation
US7986827B2 (en) * 2006-02-07 2011-07-26 Siemens Medical Solutions Usa, Inc. System and method for multiple instance learning for computer aided detection
US8331637B2 (en) * 2006-03-03 2012-12-11 Medic Vision-Brain Technologies Ltd. System and method of automatic prioritization and analysis of medical images
US8073253B2 (en) * 2006-09-29 2011-12-06 General Electric Company Machine learning based triple region segmentation framework using level set on PACS
US8280488B2 (en) * 2006-11-24 2012-10-02 Huisman Henkjan J Processing and displaying dynamic contrast-enhanced magnetic resonance imaging information
US7903861B2 (en) * 2006-12-28 2011-03-08 Carestream Health, Inc. Method for classifying breast tissue density using computed image features
US7899764B2 (en) * 2007-02-16 2011-03-01 Siemens Aktiengesellschaft Medical ontologies for machine learning and decision support
US8340437B2 (en) * 2007-05-29 2012-12-25 University Of Iowa Research Foundation Methods and systems for determining optimal features for classifying patterns or objects in images
US7949181B2 (en) * 2007-06-28 2011-05-24 General Electric Company Segmentation of tissue images using color and texture
US8131039B2 (en) * 2007-09-26 2012-03-06 Siemens Medical Solutions Usa, Inc. System and method for multiple-instance learning for computer aided diagnosis
US8170330B2 (en) * 2007-10-30 2012-05-01 Siemens Aktiengesellschaft Machine learning for tissue labeling segmentation
US8139831B2 (en) * 2007-12-06 2012-03-20 Siemens Aktiengesellschaft System and method for unsupervised detection and gleason grading of prostate cancer whole mounts using NIR fluorscence
WO2009100410A2 (en) * 2008-02-08 2009-08-13 Health Discovery Corporation Method and system for analysis of flow cytometry data using support vector machines
US8798374B2 (en) * 2008-08-26 2014-08-05 The Regents Of The University Of California Automated facial action coding system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1930584A (zh) * 2004-01-08 2007-03-14 美国西门子医疗解决公司 对医学图像进行滤波的系统和方法
CN101061490A (zh) * 2004-11-19 2007-10-24 皇家飞利浦电子股份有限公司 利用支持向量机(svm)在计算机辅助检测(cad)中进行假阳性降低的系统和方法
CN101084511A (zh) * 2004-12-17 2007-12-05 皇家飞利浦电子股份有限公司 自动开发在医学诊断成像中产生医学有意义的描述符的高性能分类器的方法和装置

Also Published As

Publication number Publication date
US9123095B2 (en) 2015-09-01
WO2010035163A1 (en) 2010-04-01
CN102165454A (zh) 2011-08-24
US20110172514A1 (en) 2011-07-14

Similar Documents

Publication Publication Date Title
CN102165454B (zh) 用于提高计算机辅助诊断对图像处理不确定性的鲁棒性的方法
Ozdemir et al. A 3D probabilistic deep learning system for detection and diagnosis of lung cancer using low-dose CT scans
US10176408B2 (en) Systems and methods for analyzing pathologies utilizing quantitative imaging
Hariraj et al. Fuzzy multi-layer SVM classification of breast cancer mammogram images
Valcarcel et al. MIMoSA: an automated method for intermodal segmentation analysis of multiple sclerosis brain lesions
El-Baz et al. Three-dimensional shape analysis using spherical harmonics for early assessment of detected lung nodules
CN104751178A (zh) 基于形状模板匹配结合分类器的肺结节检测装置及方法
Albalawi et al. Classification of breast cancer mammogram images using convolution neural network
CN101517614A (zh) 肺结节的高级计算机辅助诊断
Henschke et al. Neural networks for the analysis of small pulmonary nodules
Shakibapour et al. An unsupervised metaheuristic search approach for segmentation and volume measurement of pulmonary nodules in lung CT scans
Alksas et al. A novel computer-aided diagnostic system for accurate detection and grading of liver tumors
Lippi et al. Texture analysis and multiple-instance learning for the classification of malignant lymphomas
Zhang et al. A review of breast tissue classification in mammograms
Paquerault et al. Radial gradient‐based segmentation of mammographic microcalcifications: Observer evaluation and effect on CAD performance
CN112819747A (zh) 一种基于肺部断层扫描图片自动诊断结节良恶性的方法
Rampun et al. Breast density classification in mammograms: An investigation of encoding techniques in binary-based local patterns
Das et al. A fast and automated segmentation method for detection of masses using folded kernel based fuzzy c-means clustering algorithm
Divyashree et al. Breast cancer mass detection in mammograms using gray difference weight and mser detector
Rodríguez et al. Computer aided detection and diagnosis in medical imaging: a review of clinical and educational applications
Nayan et al. A deep learning approach for brain tumor detection using magnetic resonance imaging
Kaur et al. State-of-the-art techniques using pre-operative brain MRI scans for survival prediction of glioblastoma multiforme patients and future research directions
Tiwari et al. Optimized Ensemble of Hybrid RNN-GAN Models for Accurate and Automated Lung Tumour Detection from CT Images
de Vente et al. Automated COVID-19 grading with convolutional neural networks in computed tomography scans: a systematic comparison
Oliver et al. Automatic diagnosis of masses by using level set segmentation and shape description

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant