CN107480702B - 面向hcc病理图像识别的特征选择与特征融合方法 - Google Patents

面向hcc病理图像识别的特征选择与特征融合方法 Download PDF

Info

Publication number
CN107480702B
CN107480702B CN201710594235.1A CN201710594235A CN107480702B CN 107480702 B CN107480702 B CN 107480702B CN 201710594235 A CN201710594235 A CN 201710594235A CN 107480702 B CN107480702 B CN 107480702B
Authority
CN
China
Prior art keywords
feature
training
image
combination
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710594235.1A
Other languages
English (en)
Other versions
CN107480702A (zh
Inventor
姜慧研
李忠宽
庞文博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201710594235.1A priority Critical patent/CN107480702B/zh
Publication of CN107480702A publication Critical patent/CN107480702A/zh
Application granted granted Critical
Publication of CN107480702B publication Critical patent/CN107480702B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/031Recognition of patterns in medical or anatomical images of internal organs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种面向HCC病理图像识别的特征选择与特征融合方法,通过将病理图像的训练图像的深度特征、编码特征和纹理特征与mRMR、KPCA和Relief三种特征选择方法进行组合,进而通过随机森林分类器输出病理图像中每一类图像识别分类准确率最高的最优组合函数,并使用病理图像的测试图像通过随机森林分类器对最优组合函数的识别分类准确率进行验证,输出最优组合函数针对病理图像的测试图像中每一类图像的识别分类准确率。使用本发明方法获得的最优组合函数对病理图像进行识别分类,对每一类病理图像均能够获得较高的识别分类准确率,进而避免误诊情况出现。

Description

面向HCC病理图像识别的特征选择与特征融合方法
技术领域
本发明涉及图像识别分类技术领域,尤其涉及一种面向HCC病理图像识别的特征选择与特征融合方法。
背景技术
随着计算机科技的迅猛发展,计算机辅助诊断技术也愈加成熟,计算机技术与医学交叉融合取得了革命性突破。在临床应用中,以肝癌作为例子,准确识别肝癌的发展阶段对医生诊断病情,选用适合的治疗方案对病人进行治疗具有重大意义。而人为通过HCC病理图像对肝癌的发展阶段进行判断容易出错,进而导致对病人的误诊,影响后续治疗。因此,将计算机技术引入到HCC病理图像识别领域并提高图像识别分类准确率,对医生准确诊断病人的病情,挽救病人的生命,具有重要意义。
现有技术中存在多种方法对图像进行识别分类,这些方法通常先对图像进行特征提取,然后利用分类器对不同的图像进行类别划分。随着技术进步和研究的不断深入,图像的识别分类准确率逐渐提高,但是现有技术中的方法在对个各类别的图像识别过程中的敏感度却参差不齐,即,一种图像识别方法只针对某一种类的图像具有较高的识别准确率,但针对其他图像的识别准确率却很低。以HCC病理图像为例,分为四个类别,分别是正常肝细胞病理图像、高分化肝细胞癌病理图像、中分化肝细胞癌病理图像和低分化肝细胞癌病理图像,现有技术中的图像识别方法的敏感度低时,能够以较高概率识别出高分化肝细胞癌病理图像,但识别正常肝细胞病理图像、中分化肝细胞癌病理图像和低分化肝细胞病理图像的识别准确率却很低。由于现有技术的缺陷,在将图像识别技术应用在HCC病理图像识别分类诊断过程中就会出现误诊的情况,无法辅助医生对病患的病情进行准确的诊断。
针对上述问题,亟需提供一种面向HCC病理图像识别的特征选择与特征融合方法,以获得识别准确率更高的图像识别分类方法。
发明内容
(一)要解决的技术问题
本发明的目的在于,提出一种面向HCC病理图像识别的特征选择与特征融合方法,以解决现有技术中的图像识别分类方法对不同类别的病理图像识别分类准确率低的问题。
(二)技术方案
为了达到上述目的,本发明采用以下技术方案:
一种面向HCC病理图像识别的特征选择与特征融合方法,包括以下步骤:
S1、将HCC病理图像分为训练图像和测试图像,训练图像包括多种图像类别;
S2、利用深度卷积神经网络按照第一预定次数训练所述训练图像,获得所述训练图像在深度卷积神经网络中的深度特征;
S3、利用堆栈式稀疏自编码器按照第二预定次数训练所述训练图像,获得所述训练图像在堆栈式稀疏自编码器中的编码特征;
S4、获得所述训练图像的纹理特征;
S5、对所述深度特征、编码特征和纹理特征进行分组,形成三个单一特征组合和深度-编码特征、深度-纹理特征、编码-纹理特征三个复合特征组合;
S6、利用预设的mRMR、KPCA和Relief算法分别对每一个单一特征组合和复合特征组合进行处理,获得多个单一特征-算法组合和复合特征-算法组合;
S7、基于所述训练图像,利用随机森林分类器对每一个所述单一特征-算法组合和复合特征-算法组合进行处理,获取每一个所述单一特征-算法组合和复合特征-算法组合识别所述训练图像中图像类别的识别准确率;
S8、将所述步骤S7中获得的识别分类准确率最高的所述单一特征-算法组合作为最优单一特征-算法组合,将所述步骤S7中获得的识别分类准确率最高的所述复合特征-算法组合作为最优复合特征-算法组合,将所述最优单一特征-算法组合与所述最优复合特征-算法组合相融合,将融合结果作为最优组合函数;
S9、在随机森林分类器中采用步骤S8中获得的最优组合函数对所述测试图像进行处理,获得所述最优组合函数识别所述测试图像中图像类别的识别分类准确率。
进一步,所述步骤S2中,在完成所述第一预定次数训练后,获得最优偏置参数和最优权重参数;
在深度卷积神经网络中,采用获得的最优偏置参数和最优权重参数,对所述训练图像进行一次训练,训练完成后获得所述训练图像在深度卷积神经网络中的深度特征。
进一步,所述步骤S3中,采用预设隐层节点数的堆栈式稀疏自编码器对所述训练图像进行第二预定次数的训练,训练完成后,获得训练过程中的最优迭代次数值;
在堆栈式稀疏自编码器中,利用最优迭代次数值和预设隐层节点数作为参数对所述训练图像进行一次训练,训练完成后获得所述训练图像在堆栈式稀疏自编码器中的编码特征。
进一步,所述步骤S4中,采用熵、均值、标准差、LPQ、灰度共生矩阵和Tamura的函数对所述训练图像进行处理,获得作为纹理特征的熵特征值、均值特征值、标准差特征值、LPQ特征值、灰度共生矩阵特征值和Tamura特征值。
进一步,所述步骤S5中,所述深度特征、编码特征、纹理特征中的任意两个采用矩阵拼接方式形成一个复合特征组合。
进一步,所述步骤S2中,所述第一预定次数为200—300次;
所述步骤S3中,所述第二预定次数为100—200次。
进一步,所述步骤S4中采用的熵函数的计算公式为:
Figure GDA0002734860590000041
其中,i=1、2、3…n。
进一步,所述步骤S6中,采用计算模型对所述单一特征-算法组合和复合特征-算法组合进行处理;
使用的计算模型为:
M={Eij|fi∈F,cj∈C},其中,
fi—特征,
F—特征集合,包括深度特征、编码特征、纹理特征、深度-编码特征、深度-纹理特征、编码-纹理特征,
cj—特征选择方法,
C—特征选择方法集合,包括:mRMR、KPCA和Relief三种算法,
Eij—为特征-算法组合,代表该组合是特征fi通过特征选择方法cj处理后得到的。
进一步,所述堆栈式稀疏自编码器具有两层,第一层隐层节点数为200至250,第二层隐层节点数为20至45。
进一步,所述步骤S8中,所述最优单一特征-算法组合与所述最优复合特征-算法组合相融合时,采用矩阵拼接方式进行组合。
(三)有益效果
本发明的有益效果是:本发明公开了一种面向HCC病理图像识别的特征选择与特征融合方法,该方法提取病理图像的深度特征、编码特征和纹理特征,将上述特征与mRMR、KPCA和Relief三种特征选择方法进行组合计算,获得最优组合函数。使用本发明方法获得的最优组合函数对病理图像进行识别分类,对每一阶段病理图像,即每一类病理图像均能够获得较高的识别分类准确率,因此,使用本发明中的最优组合函数对病理图像进行识别分类,能够使得诊断结果更加准确,避免误诊情况出现。
附图说明
图1是本发明实施例一公开的面向HCC病理图像识别的特征选择与特征融合方法的整体流程图。
具体实施方式
为了更好的解释本发明以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
实施例一
如图1所示,是本实施例公开的面向HCC病理图像识别的特征选择与特征融合方法的整体流程,下面对本实施例中的方法进行详细说明。
在本实施例中,将HCC样本病理图像分为训练图像和测试图像,训练图像和测试图像均包含多种图像类别。提取训练图像的纹理特征,并利用深度卷积神经网络、堆栈式稀疏自编码器分别提取训练图像的深度特征和编码特征,并将深度特征、编码特征和纹理特征保存,上述三个特征均以矩阵形式存在。
对深度特征、编码特征和纹理特征进行分组,获得三个单一特征组合和深度-编码特征、深度-纹理特征、编码-纹理特征。在进行复合特征组合时,采用矩阵拼接的方式进行处理,且进行复合特征组合时,以深度特征和编码特征组合为例,获得的深度-编码特征与编码-深度特征为同一个矩阵,即上述两者为同一个复合特征组合,因此在下面的叙述过程中不再进行区分。
利用预设的mRMR、KPCA和Relief三种算法分别对深度特征、纹理特征、编码特征、深度-编码特征、深度-纹理特征、编码-纹理特征分别进行处理,获得深度-mRMR组合、深度-KPCA组合、深度-Relief组合、编码-mRMR组合、编码-KPCA组合、编码-Relief组合、纹理-mRMR组合、纹理-KPCA组合、纹理-Relief、深度-编码-mRMR组合、深度-编码-KPCA组合、深度-编码-Relief组合、深度-纹理-mRMR组合、深度-纹理-KPCA组合、深度-纹理-Relief组合、编码-纹理-mRMR组合、编码-纹理-KPCA组合、编码-纹理-Relief组合。
基于训练图像,利用随机森林分类器对上述各个特征-算法组合进行处理,获得上述每一个组合识别训练图像中图像类别的识别分类准确率。
将识别分类准确率最高的单一特征-算法组合最为最优单一特征-算法组合,将识别分类准确率最高的复合特征-算法组合作为最优复合特征-算法组合,并将最优单一特征-算法组合与最优复合特征-算法组合相融合,将融合结果最为最优组合函数。
基于测试图像,在随机森林分类器中,采用最优组合函数对测试图像进行识别分类,获得利用最优组合函数识别测试图像中图像类别的分类识别准确率。
实施例二
根据肝病发展的不同阶段,HCC病理图像具体分为四个类别,分别是正常肝细胞病理图像、高分化肝癌病理图像、中分化肝癌病理图像、低分化肝癌病理图像,在对病人进行诊断时,通过对HCC病理图像进行识别分类能够辅助医生对病人的病情进行诊断,准确判断病人所处的肝病发展阶段,确定更好的治疗方案。
本发明中的方法应用在安装有matlab软件的计算机上,优选采用matlab2016软件,在实施过程中具体采用以下方案。
步骤1、将HCC样本病理图像分为训练图像和测试图像,训练图像和测试图像均包括四种图像类别,分别是正常肝细胞病理图像、高分化肝癌病理图像、中分化肝癌病理图像、低分化肝癌病理图像,将上述训练图像读入并存储至计算机中以备后续使用。
将HCC样本病理图像分为两部分,训练图像用于通过训练确定出最优组合函数。测试图像用作对最优组合函数的识别准确率进行测试使用,在确定出最优组合函数后,采用最优组合函数识别测试图像中HCC病理图像,并确定针对各个类别病理图像的识别分类准确率。
步骤2、调用matlab软件中的cnnmain.m文件、cnnbpm.m文件和cnnnumgradcheck.m文件,深度卷积神经网络调用训练图像,设置深度卷积神经网络对训练图像的训练次数为200次,并按照第一预定次数为200次持续对训练图像进行训练,在200次训练完成后,获得最优偏置参数和最优权重参数。
在实际训练过程中,每进行一次训练就获得一个偏置参数和一个权重参数,但在初期训练时,偏置参数和权重参数不是最优值,训练过程对上述两个参数不断进行优化,后一次训练完成后输出的偏置参数和权重参数会覆盖上一次训练完成输出的偏置参数和权重参数。在完成第200次训练之后,获得最终的偏置参数和权重参数,即最优偏置参数和最优权重参数。在利用深度卷积神经网络进行训练过程中,一般情况下,第一预定次数为200次—300次。
步骤3、调用matlab软件中的cnntrain.m文件,利用步骤2中获得的最优偏置参数和最优权重参数对训练图像再进行一次训练,该次训练完成之后,提取深度卷积神经网络的全连接层特征并将其保存,上述全连接层特征也就是训练图像在深度卷积神经网络中的深度特征,深度特征为一个矩阵。
本发明中采用的深度卷积神经网络可为当前现有技术中的深度卷积神经网络,该深度卷积神经网络具有抽取并组合局部特征的优点,适合处理高维度数据,是一种无监督学习网络,对图像的处理过程是自主完成,包括参数学习和特征提取。
步骤4、选择两层的堆栈式稀疏自编码器,优选的,自编码器的第一层隐层节点数为200至250,第二层隐层节点数为20至45,在本实施例中将自编码器的第一层隐层节点数h1设置为200,第二层隐层节点数h2设置为20,h1和h2即为堆栈式稀疏自编码器的第一层和第二层的特征维数。
步骤5、载入训练图像,依次调用堆栈式稀疏自编码器的ssaemain.m主函数和自编码器的损失函数sparseAutoencoderCost.m,对训练图像按照第二预定次数为200次进行训练。
调用options.maxIter函数对训练图像进行训练,每进行一次训练,在训练过程中会输出一次迭代次数值,在完成第200次训练后,提取200次训练过程中输出的迭代次数最优值,将该最优值作为最优迭代次数值。通常情况下,本领域中的技术人员能够凭经验判断出最优迭代次数值所处的范围,再根据迭代过程中产生的多个迭代次数值甄选出最优迭代次数值,在本实施例中,通过训练获得的最优迭代次数值为400。
步骤6、调用ssaemain.m主函数,并将最优迭代次数值400、第一层隐层节点数h1=200,第二层隐层节点数h2=20作为计算参数进行设置,并再次进行一次训练,完成该次训练后提取并保存堆栈式稀疏自编码器训练后的编码特征,即堆栈式稀疏自编码器的第一层特征,编码特征为一个矩阵。
堆栈式稀疏自编码器可以采用现有技术中已经存在的自编码器,是由若干稀疏自编码器结构单元组成的深度神经网,随着稀疏自编码器层数的增加,学习得到原始数据的特征表达更抽象。与深度卷积神经网络相同,堆栈式稀疏自编码器也是一种无监督学习网络,对图像的处理过程也是自主完成的。
步骤7、载入训练图像,调用featureExtraction.m文件,设置熵、均值、标准差、LPQ、灰度共生矩阵和Tamura作为需要提取的特征。
步骤8、调用entropyComputing.m文件,即熵函数文件,对训练图像进行处理,获得熵特征值。
其中,调用的熵函数的计算公式为:
Figure GDA0002734860590000091
其中,i=1、2、3…n。
步骤9、调用mean.m文件,对训练图像进行处理,获得均值特征值。
步骤10、调用std.m文件,对训练图像进行处理,获得标准差特征值。
步骤11、调用lpqFeature.m文件,对训练图像进行处理,获得LPQ特征值。
步骤12、调用glcmFeature.m文件,对训练图像进行处理,获得灰度共生矩阵特征值。
步骤13、调用TamuraFeature.m文件,对训练图像进行处理,获得Tamura特征值。
步骤14、将步骤9至步骤13中熵特征值、均值特征值、标准差特征值、LPQ特征值、灰度共生矩阵特征值和Tamura特征值,将获得的上述各个特征值存入一个矩阵中,作为纹理特征。
在提取纹理特征时,采用通过调用文件函数依次提取的方法进行提取,同时结合深度特征和编码特征,能够有效提高病理图像识别分类的准确率。
步骤15、对深度特征、编码特征和纹理特征进行分组,形成三个单一特征组合和三个复合特征组合,其中三个复合特征组合为深度-编码特征、深度-纹理特征、编码-纹理特征。
在此处需要注意的是,深度特征与编码特征组合时,采用两个特征融合的方式进行组合,此处的融合为采用矩阵拼接的方式形成一个复合特征组合,获得深度-编码特征,两个特征在融合过程中不分先后顺序,即深度-编码特征与编码-深度特征为同一个矩阵。同理,深度-纹理特征与纹理-深度特征为同一个矩阵,编码-纹理特征与纹理-编码特征为同一个矩阵。
步骤16、选择mRMR、KPCA和Relief三种算法作为特征选择方法,并利用上述三个算法,对每一个单一特征组合进行处理,即对深度特征、编码特征和纹理特征进行处理,获得单一特征算法组合。具体地,获得深度-mRMR组合、深度-KPCA组合、深度-Relief组合、编码-mRMR组合、编码-KPCA组合、编码-Relief组合、纹理-mRMR组合、纹理-KPCA组合、纹理-Relief组合共九个组合,且上述九个组合以矩阵形式存在。
其中,mRMR算法是基于信息理论的典型特征降维算法,主要思想是从特征空间中寻找与目标类别有最大相关性且相互之间具有最少冗余性的m个特征,利用互信息衡量子特征集中特征与类别之间、特征与特征之间的相关度。
Relief算法运行效率高,属于一种特征权重算法,算法会赋予分类能力强的特征较高的权重,但是由于其不考虑特征之间的相关性,故其不能去除冗余特征。
KPCA方法的基本思想是通过某种隐式的方式将输入空间映射到某个高维空间并且在特征空间中实现PCA。
上述三种特征选择方法是根据训练图像的大小、输入的特征向量的维数与特征向量之间的相互关系最终确定的。但是值得注意的是,本发明中采用的上述三种特征选择方法能够覆盖绝大多数的试验及日常使用过程,即使当因为某些因素导致选择的特征选择方法出现变化时,并不影响本发明整体方法,只是将其中的特征选择方法进行改变而已,仅改变特征选择方法的实施方式,应当认为是本发明技术手段的同等替换。
步骤17、调用RFClass.m文件函数,即利用随机森林分类器对上述九个单一特征-算法组合进行处理,获得上述九个单一特征-算法识别训练图像中图像类别的识别分类准确率,将识别分类准确率最高的组合作为最优单一特征-算法组合。
步骤18、利用预设的mRMR、KPCA和Relief算法分别对深度-编码特征、深度-纹理特征、编码-纹理特征三个复合特征-算法组合进行处理,获得多个复合特征算法组合。即深度-编码-mRMR组合、深度-编码-KPCA组合、深度-编码-Relief组合、深度-纹理-mRMR组合、深度-纹理-KPCA组合、深度-纹理-Relief组合、编码-纹理-mRMR组合、编码-纹理-KPCA组合、编码-纹理-Relief组合,上述各个复合特征-算法组合均以矩阵的形式存在。
步骤19、调用RFClass.m文件,将步骤18中获得的全部组合均放入随机森林分类器进行分类,输出各个组合识别训练图像中图像类别的识别分类准确率,将识别分类准确率最高的复合特征-算法组合作为最优复合特征-算法组合。
使用计算模型获取步骤16和步骤18中的单一特征-算法组合和复合特征-算法组合时,使用的计算模型为:
M={Eij|fi∈F,cj∈C},其中,
fi—特征,
F—特征集合,包括深度特征、编码特征、纹理特征、深度-编码特征、深度-纹理特征、编码-纹理特征,
cj—特征选择方法,
C—特征选择方法集合,包括:mRMR、KPCA和Relief三种算法,
Eij—为特征-算法组合,代表该组合是特征fi通过特征选择方法cj处理后得到的。
步骤20、将步骤18和步骤19中获得的最优单一特征-算法组合与最优复合特征-算法组合进行融合,融合时采用矩阵拼接的方式进行,从而获得最优组合函数。
步骤21、调用RFClass.m文件,将步骤20中获得的最优组合函数输入随机森林分类器中进行分类,输出最优组合函数针对HCC病理图像中每一类图像的识别分类准确率。
步骤22、计算机读入测试图像,调用RFClass.m文件,并将步骤21中获得的最优组合函数输入随机森林分类器中,获得测试图像中最优组合函数针对测试图像每一类图像的识别分类准确率并保存,验证步骤21中获得的最优组合函数是否是针对HCC病理图像中每一类图像识别分类率最高的函数。
经过验证可知,步骤21中获得的最优组合函数是针对HCC病理图像中每一类图像识别分类率最高的组合函数,使用步骤21中获得的最优组合函数对需要诊断的病理图像进行识别分类,能够更加准确的判断出该病理图片属于HCC病理图像中的哪一类,进而辅助医生对病患进行诊断,判断病患所处的病情发展阶段,帮助医生更好的确定治疗方案,防止误诊出现。
以上内容仅为本发明的较佳实施例,对于本领域的普通技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,包括以下步骤:
S1、将HCC病理图像分为训练图像和测试图像,训练图像包括多种图像类别;
S2、利用深度卷积神经网络按照第一预定次数训练所述训练图像,获得所述训练图像在深度卷积神经网络中的深度特征;
S3、利用堆栈式稀疏自编码器按照第二预定次数训练所述训练图像,获得所述训练图像在堆栈式稀疏自编码器中的编码特征;
S4、获取所述训练图像的纹理特征;
S5、对所述深度特征、编码特征和纹理特征进行分组,形成三个单一特征组合和深度-编码特征、深度-纹理特征、编码-纹理特征三个复合特征组合;
S6、利用预设的mRMR、KPCA和Relief算法分别对每一个单一特征组合和复合特征组合进行处理,获得多个单一特征-算法组合和复合特征-算法组合;
S7、基于所述训练图像,利用随机森林分类器对每一个所述单一特征-算法组合和复合特征-算法组合进行处理,获取每一个所述单一特征-算法组合和复合特征-算法组合识别所述训练图像中图像类别的识别分类准确率;
S8、将所述步骤S7中获得的识别分类准确率最高的所述单一特征-算法组合作为最优单一特征-算法组合,将所述步骤S7中获得的识别分类准确率最高的所述复合特征-算法组合作为最优复合特征-算法组合,将所述最优单一特征-算法组合与所述最优复合特征-算法组合相融合,识别分类将融合结果作为最优组合函数;
S9、在随机森林分类器中采用步骤S8中获得的最优组合函数对所述测试图像进行识别,获得所述最优组合函数识别所述测试图像中图像类别的识别分类准确率。
2.根据权利要求1所述的面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,
所述步骤S2中,在完成所述第一预定次数训练后,获得最优偏置参数和最优权重参数;
在深度卷积神经网络中,采用获得的最优偏置参数和最优权重参数,对所述训练图像进行一次训练,训练完成后获得所述训练图像在深度卷积神经网络中的深度特征。
3.根据权利要求1所述的面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,
所述步骤S3中,采用预设隐层节点数的堆栈式稀疏自编码器对所述训练图像进行第二预定次数的训练,训练完成后,获得训练过程中的最优迭代次数值;
在堆栈式稀疏自编码器中,利用最优迭代次数值和预设隐层节点数作为参数对所述训练图像进行一次训练,训练完成后获得所述训练图像在堆栈式稀疏自编码器中的编码特征。
4.根据权利要求1所述的面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,
所述步骤S4中,采用熵、均值、标准差、LPQ、灰度共生矩阵和Tamura的函数分别对所述训练图像进行处理,获得作为纹理特征的熵特征值、均值特征值、标准差特征值、LPQ特征值、灰度共生矩阵特征值和Tamura特征值。
5.根据权利要求1所述的面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,
所述步骤S5中,所述深度特征、编码特征、纹理特征中的任意两个采用矩阵拼接方式形成一个复合特征组合。
6.根据权利要求1所述的面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,
所述步骤S2中,所述第一预定次数为200—300次;
所述步骤S3中,所述第二预定次数为100—200次。
7.根据权利要求1所述的面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,
所述步骤S6中,采用计算模型对所述单一特征-算法组合和复合特征-算法组合进行处理;
使用的计算模型为:
M={Eij|fi∈F,cj∈C},其中,
fi—特征,
F—特征集合,包括深度特征、编码特征、纹理特征、深度-编码特征、深度-纹理特征、编码-纹理特征,
cj—特征选择方法,
C—特征选择方法集合,包括:mRMR、KPCA和Relief三种算法,
Eij—为特征-算法组合,代表该组合是特征fi通过特征选择方法cj处理后得到的。
8.根据权利要求3所述的面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,
所述堆栈式稀疏自编码器具有两层,第一层隐层节点数为200至250,第二层隐层节点数为20至45。
9.根据权利要求1所述的面向HCC病理图像识别的特征选择与特征融合方法,其特征在于,
所述步骤S8中,所述最优单一特征-算法组合与所述最优复合特征-算法组合相融合时,采用矩阵拼接方式进行组合。
CN201710594235.1A 2017-07-20 2017-07-20 面向hcc病理图像识别的特征选择与特征融合方法 Active CN107480702B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710594235.1A CN107480702B (zh) 2017-07-20 2017-07-20 面向hcc病理图像识别的特征选择与特征融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710594235.1A CN107480702B (zh) 2017-07-20 2017-07-20 面向hcc病理图像识别的特征选择与特征融合方法

Publications (2)

Publication Number Publication Date
CN107480702A CN107480702A (zh) 2017-12-15
CN107480702B true CN107480702B (zh) 2021-03-30

Family

ID=60596748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710594235.1A Active CN107480702B (zh) 2017-07-20 2017-07-20 面向hcc病理图像识别的特征选择与特征融合方法

Country Status (1)

Country Link
CN (1) CN107480702B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108288265A (zh) * 2018-01-09 2018-07-17 东北大学 一种面向hcc病理图像细胞核的分割与分类方法
CN108564116A (zh) * 2018-04-02 2018-09-21 深圳市安软慧视科技有限公司 一种摄像头场景图像的成分智能分析方法
CN108830370B (zh) * 2018-05-24 2020-11-10 东北大学 基于增强学习型菌群觅食算法的特征选择方法
CN108961215A (zh) * 2018-06-05 2018-12-07 上海大学 基于多模态医学影像的帕金森病辅助诊断系统和方法
CN109272443B (zh) * 2018-09-30 2020-07-28 东北大学 一种基于全卷积神经网络的pet与ct图像配准方法
CN109886922B (zh) * 2019-01-17 2023-08-18 丽水市中心医院 基于SE-DenseNet深度学习框架和增强MR图像的肝细胞癌自动分级方法
CN110084303B (zh) * 2019-04-28 2022-02-15 北京工业大学 一种基于cnn与rf的老年人平衡能力特征选择方法
CN111242174B (zh) * 2019-12-31 2022-09-23 浙江大学 一种基于影像组学的肝癌图像特征提取与病理分类方法
CN116522143B (zh) * 2023-05-08 2024-04-05 深圳市大数据研究院 模型训练方法、聚类方法、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366180A (zh) * 2013-06-14 2013-10-23 山东大学 一种基于自动特征学习的细胞图像分割方法
US20160063358A1 (en) * 2014-08-29 2016-03-03 Canon Kabushiki Kaisha Dynamic feature selection for joint probabilistic recognition
CN105931224A (zh) * 2016-04-14 2016-09-07 浙江大学 基于随机森林算法的肝脏平扫ct图像病变识别方法
CN106650830A (zh) * 2017-01-06 2017-05-10 西北工业大学 基于深层模型和浅层模型决策融合的肺结节ct图像自动分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366180A (zh) * 2013-06-14 2013-10-23 山东大学 一种基于自动特征学习的细胞图像分割方法
US20160063358A1 (en) * 2014-08-29 2016-03-03 Canon Kabushiki Kaisha Dynamic feature selection for joint probabilistic recognition
CN105931224A (zh) * 2016-04-14 2016-09-07 浙江大学 基于随机森林算法的肝脏平扫ct图像病变识别方法
CN106650830A (zh) * 2017-01-06 2017-05-10 西北工业大学 基于深层模型和浅层模型决策融合的肺结节ct图像自动分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Sparse Contribution Feature Selection and Classifiers Optimized by Concave-Convex Variation for HCC Image Recognition;Wenbo Pang et al.;《BioMed Research International》;20170717;第1-15页 *
The Hybrid Feature Selection Algorithm Based on Maximum Minimum Backward Selection Search Strategy for Liver Tissue Pathological Image Classification;Huiling Liu et al.;《Computational and Mathematical Methods in Medicine》;20161231;第1-9页 *
基于PCA多特征融合的肝脏B超临床医学图像识别研究与实现;张卫国等;《计算机应用与软件》;20140430;第31卷(第4期);第239-243页 *

Also Published As

Publication number Publication date
CN107480702A (zh) 2017-12-15

Similar Documents

Publication Publication Date Title
CN107480702B (zh) 面向hcc病理图像识别的特征选择与特征融合方法
Sun et al. Deep learning-based classification of liver cancer histopathology images using only global labels
Wang et al. A multi-view deep convolutional neural networks for lung nodule segmentation
CN112270666A (zh) 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法
WO2022127500A1 (zh) 基于多个神经网络的mri图像分割方法、装置及设备
Peng et al. Hybrid automatic lung segmentation on chest ct scans
WO2022100497A1 (zh) 表皮生长因子受体突变状态判断方法、介质及电子设备
CN112598086A (zh) 基于深度神经网络的常见结肠部疾病分类方法及辅助系统
CN114998247A (zh) 异常预测方法、装置、计算机设备、存储介质
Chan et al. Quasi-conformal statistical shape analysis of hippocampal surfaces for Alzheimer׳ s disease analysis
Wang et al. Extended ResNet and label feature vector based chromosome classification
CN114581698A (zh) 一种基于空间交叉注意力机制特征融合的目标分类方法
Sangeetha et al. Diagnosis of Pneumonia using Image Recognition Techniques
Zhang et al. Trustworthy learning with (un) sure annotation for lung nodule diagnosis with CT
CN112861881A (zh) 一种基于改进MobileNet模型的蜂窝肺识别方法
CN112508057A (zh) 一种肺结节分类方法、介质及电子设备
CN116797817A (zh) 基于自监督图卷积模型的自闭症疾病预测技术
Jehangir et al. Lung Cancer Detection using Ensemble of Machine Learning Models
CN116206160A (zh) 基于卷积神经网络模型的鼻咽癌病变组织的自动识别网络模型和自动勾画网络模型的搭建方法
CN116386803A (zh) 一种基于图的细胞病理报告生成方法
Khaniki et al. Enhancing Pneumonia Detection using Vision Transformer with Dynamic Mapping Re-Attention Mechanism
Sari et al. Best performance comparative analysis of architecture deep learning on ct images for lung nodules classification
CN111863248B (zh) 一种构建临床决策模型的有效方法
Ghosal et al. A deep adaptive convolutional network for brain tumor segmentation from multimodal MR images
CN114373096A (zh) 基于多特征融合的肺结节良恶性预测系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant