CN111860591A - 基于间隔自适应特征选择融合的宫颈细胞图像分类方法 - Google Patents
基于间隔自适应特征选择融合的宫颈细胞图像分类方法 Download PDFInfo
- Publication number
- CN111860591A CN111860591A CN202010546079.3A CN202010546079A CN111860591A CN 111860591 A CN111860591 A CN 111860591A CN 202010546079 A CN202010546079 A CN 202010546079A CN 111860591 A CN111860591 A CN 111860591A
- Authority
- CN
- China
- Prior art keywords
- cell
- sample
- cell image
- cervical
- interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/155—Segmentation; Edge detection involving morphological operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30024—Cell structures in vitro; Tissue sections in vitro
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种基于间隔自适应特征选择融合的宫颈细胞图像分类方法,包括如下步骤:(1)针对原始宫颈细胞图像中检测到的每个单细胞图像,进行去噪预处理后,采用分水岭分割算法提取出细胞核、细胞质区域;(2)提取宫颈细胞图像的纹理、形状、颜色特征;(3)基于间隔自适应方法进行细胞特征优化;(4)训练双层多示例超限学习机,确定训练误差最小化的MI‑ELM模型参数;(5)基于已训练的超限学习机模型,对检测到的未知单细胞图像进行分类识别。本发明利用先验概率信息增强新特征判别性,联合优化特征子类和分类策略的多示例超限学习模型,提高特征利用率进而提升对象分类准确率和效率,又可以优化组合不同特征子类再进行高效地细胞二分类。
Description
技术领域
本发明属于计算机视觉领域,具体涉及一种基于间隔自适应特征选择融合的宫颈细胞图像分类方法。
背景技术
进行妇科宫颈癌筛查时,医师读图的目的是从宫颈细胞图像中辨认出异常细胞和正常细胞,根据异常细胞的数目和病变情况来判断检查者患癌症的可能性,而随着宫颈细胞智能筛查系统研究的兴起,借助计算机辅助分析宫颈细胞图像,检测出图像中异常细胞是最终最重要的目标。对于宫颈细胞筛查系统而言,准确率和效率是异常细胞筛查系统的两个重要方面。
一方面,在宫颈细胞异分类系统中,需要根据宫颈细胞的不同特征来实现分类,而细胞本身有大量的特征,且其不同的特征对分类的贡献能力不同,所以如何选择并组合这些特征以更好地实现分类,对异常检测识别系统而言具有重要意义。特征选择融合是剔除对象冗余特征、提高特征利用率进而提升对象分类准确率和效率的一种优化组合技术。为更优组合特征模式以实现对异常宫颈细胞更准确地分类。在进行细胞图像分割和特征抽取后,特征选择融合是能够提升智能分析系统效率的一个关键环节,所以需要对宫颈细胞特征进行选择融合,以为后续的宫颈细胞分类识别奠定一个良好的基础。
另一方面,首先,在宫颈细胞分类识别系统中,正常细胞与异常细胞在特征上存在诸多差异性,这些差异就是我们进行异常细胞检测的基本依据,宫颈细胞的不同类别的特征在分类过程中的作用不同。一个宫颈细胞样本的不同特征子类作为多示例学习中样本对象的不同方面,将每个细胞样本的不同特征子类进行组合优化,就是对多示例学习的不同示例进行组合优化的过程。另外,分类算法是实现细胞分类的重要落脚点,算法的效率和精度直接影响宫颈细胞分类识别系统的性能。因此,从上述特征优化和分类算法两个方面来讲,宫颈细胞图像的识别精度和识别效率均有待于进一步提高。
发明内容
本发明要解决的技术问题是提供一种基于间隔自适应特征选择融合的宫颈细胞图像分类方法,利用先验概率信息增强新特征判别性,同时剔除对象冗余特征,最后设计一种联合优化特征子类和分类策略的多示例超限学习模型,能够提高特征利用率进而提升对象分类准确率和效率,又可以优化组合不同特征子类再进行高效地细胞二分类。
为解决上述技术问题,本发明的实施例提供一种基于间隔自适应特征选择融合的宫颈细胞图像分类方法,包括如下步骤:
(1)针对原始宫颈细胞图像中检测到的每个单细胞图像,进行去噪预处理后,采用分水岭分割算法提取出细胞核、细胞质区域;
(2)提取宫颈细胞图像的纹理、形状、颜色特征;
(3)基于间隔自适应方法进行细胞特征优化;
(4)训练双层多示例超限学习机,确定训练误差最小化的MI-ELM模型参数;
(5)基于已训练的超限学习机模型,对检测到的未知单细胞图像进行分类识别。
其中,步骤(2)的具体步骤为:
(2-1)提取宫颈细胞图像细胞核和细胞质HSV色彩空间的灰度共生矩阵(GLCM)纹理特征Pδ;
(2-2)提取宫颈细胞图像形状特征:包括细胞区域面积、细胞拟合椭圆短轴、细胞拟合椭圆长轴、细胞拟合椭圆伸长率、细胞区域圆度、细胞区域周长、细胞核区域面积、细胞核拟合椭圆短轴、细胞核拟合椭圆长轴、细胞核拟合椭圆伸长率、细胞核区域周长、细胞核区域圆度、细胞核与细胞质面积比、细胞核相对位置;
(2-3)提取宫颈细胞图像颜色特征:分别来自LAB三个通道,包括细胞核和细胞质区域的均值、方差、最大值和最小值。
其中,步骤(3)的具体步骤为:
(3-1)随机选出一个样本x,然后找出x的两个最近邻居样本,这两个样本分别来自x的同一类别和不同类别;
(3-2)计算样本x到两个邻居样本的两个距离值d(·);
(3-3)求两个距离之差的绝对值作为间隔
ρi=d(xi-NM(xi))-d(xi-NH(xi)),
其中,xi为随机选出的样本,NM(xi)表示样本xi最近的异类样本,NH(xi)表示样本xi最近的同类样本;
(3-5)根据间隔计算得到新权重
其中,步骤(4)的具体步骤为:
(4-1)基于KKT最优化定理,将原始目标函数转换为对偶形式:其中拉格朗日乘子αi对应于第i个训练样本的“bag”,β是网络权重,g(χi)表示的是相应于第i个包的隐层输出向量,ξi是松弛变量,C是正则化系数,ti是标签;
(4-2)计算对偶目标函数的KKT条件:
(4-3)整理上述KKT条件分别得:
αi=Cξi,
g(χi)β=ti-ξi;
本发明的上述技术方案的有益效果如下:本发明采用间隔自适应特征融合方法,在更大权向量空间内搜索多值特征选择权向量,引入训练数据的先验概率信息增强新特征的判别性,得到细胞各类特征优化组合模式,而后用训练好的多示例超限学习模型(MI-ELM)对单个细胞分类,确定测试细胞样本中的正常和异常细胞。本发明设计利用先验概率信息增强新特征判别性,同时剔除对象冗余特征,最后设计一种联合优化特征子类和分类策略的多示例超限学习模型,能够提高特征利用率进而提升对象分类准确率和效率,又可以优化组合不同特征子类再进行高效地细胞二分类。
附图说明
图1为本发明中间隔自适应特征选择融合示意图;
图2为本发明中MI-ELM神经网络结构示意图;
图3为本发明中细胞核相对位置特征示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明提供了一种间隔自适应特征选择融合的多示例超限学习机宫颈细胞图像分类方法,采用间隔自适应特征融合方法,在更大权向量空间内搜索多值特征选择权向量,引入训练数据的先验概率信息增强新特征的判别性,得到细胞各类特征优化组合模式。而后用训练好的多示例超限学习模型(MI-ELM)对单个细胞分类,确定测试细胞样本中的正常和异常细胞。本发明设计利用先验概率信息增强新特征判别性,同时剔除对象冗余特征。
基于上述理论,本发明提供一种基于间隔自适应特征选择融合的宫颈细胞图像分类方法,包括如下步骤:
(1)针对原始宫颈细胞图像中检测到的每个单细胞图像,进行去噪预处理后,采用分水岭分割算法提取出细胞核、细胞质区域;
(2)提取宫颈细胞图像的纹理、形状、颜色特征;具体步骤为:
(2-1)提取宫颈细胞图像细胞核和细胞质HSV色彩空间的灰度共生矩阵(GLCM)纹理特征Pδ;
(2-2)提取宫颈细胞图像形状特征:包括细胞区域面积、细胞拟合椭圆短轴、细胞拟合椭圆长轴、细胞拟合椭圆伸长率、细胞区域圆度、细胞区域周长、细胞核区域面积、细胞核拟合椭圆短轴、细胞核拟合椭圆长轴、细胞核拟合椭圆伸长率、细胞核区域周长、细胞核区域圆度、细胞核与细胞质面积比、细胞核相对位置;
(2-3)提取宫颈细胞图像颜色特征:分别来自LAB三个通道,包括细胞核和细胞质区域的均值、方差、最大值和最小值。
(3)基于间隔自适应方法进行细胞特征优化;具体步骤为:
(3-1)随机选出一个样本x,然后找出x的两个最近邻居样本,这两个样本分别来自x的同一类别和不同类别;
(3-2)计算样本x到两个邻居样本的两个距离值d(·);
(3-3)求两个距离之差的绝对值作为间隔
ρi=d(xi-NM(xi))-d(xi-NH(xi)),
其中,xi为随机选出的样本,NM(xi)表示样本xi最近的异类样本,NH(xi)表示样本xi最近的同类样本;
(3-5)根据间隔计算得到新权重
图1(a)所示为原始特征空间中样本分布示例;图1(b)所示为加权特征空间中样本分布示例。
(4)训练双层多示例超限学习机,确定训练误差最小化的MI-ELM模型参数;具体步骤为:
(4-1)基于KKT最优化定理,将原始目标函数转换为对偶形式:其中拉格朗日乘子αi对应于第i个训练样本的“bag”,β是网络权重,g(χi)表示的是相应于第i个包的隐层输出向量,ξi是松弛变量,C是正则化系数,ti是标签。
(4-2)计算对偶目标函数的KKT条件:
(4-3)整理上述KKT条件分别得:
αi=Cξi,
g(χi)β=ti-ξi。
(5)基于已训练的超限学习机模型,对检测到的未知单细胞图像进行分类识别。
图3所示为本发明中细胞核相对位置特征示意图。
发明人对本发明的技术方案进行了实验。实验采用Herlev数据集,该数据集917张单细胞宫颈细胞图像,其中,正常细胞242张,异常细胞675张。首先将整个数据集分成90%的训练集和10%的测试集,然后先用交叉验证法在训练集和验证集的基础上得到模型最佳参数,最后以最佳参数训练出最佳分类模型对测试样本分类。最终在测试集上细胞二分类准确率达到90%以上,较现有方法有较大提升。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种基于间隔自适应特征选择融合的宫颈细胞图像分类方法,其特征在于,包括如下步骤:
(1)针对原始宫颈细胞图像中检测到的每个单细胞图像,进行去噪预处理后,采用分水岭分割算法提取出细胞核、细胞质区域;
(2)提取宫颈细胞图像的纹理、形状、颜色特征;
(3)基于间隔自适应方法进行细胞特征优化;
(4)训练双层多示例超限学习机,确定训练误差最小化的MI-ELM模型参数;
(5)基于已训练的超限学习机模型,对检测到的未知单细胞图像进行分类识别。
2.根据权利要求1所述的基于间隔自适应特征选择融合的宫颈细胞图像分类方法,其特征在于,步骤(2)的具体步骤为:
(2-1)提取宫颈细胞图像细胞核和细胞质HSV色彩空间的灰度共生矩阵纹理特征Pδ;
(2-2)提取宫颈细胞图像形状特征:包括细胞区域面积、细胞拟合椭圆短轴、细胞拟合椭圆长轴、细胞拟合椭圆伸长率、细胞区域圆度、细胞区域周长、细胞核区域面积、细胞核拟合椭圆短轴、细胞核拟合椭圆长轴、细胞核拟合椭圆伸长率、细胞核区域周长、细胞核区域圆度、细胞核与细胞质面积比、细胞核相对位置;
(2-3)提取宫颈细胞图像颜色特征:分别来自LAB三个通道,包括细胞核和细胞质区域的均值、方差、最大值和最小值。
3.根据权利要求1所述的基于间隔自适应特征选择融合的宫颈细胞图像分类方法,其特征在于,步骤(3)的具体步骤为:
(3-1)随机选出一个样本xi,然后找出xi的两个最近邻居样本,这两个样本分别来自xi的同一类别和不同类别;
(3-2)计算样本x到两个邻居样本的两个距离值d(·);
(3-3)求两个距离之差的绝对值作为间隔
ρi=d(xi-NM(xi))-d(xi-NH(xi))
其中,xi为随机选出的样本,NM(xi)表示样本xi最近的异类样本,NH(xi)表示样本xi最近的同类样本;
(3-5)根据间隔计算得到新权重
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010546079.3A CN111860591A (zh) | 2020-06-16 | 2020-06-16 | 基于间隔自适应特征选择融合的宫颈细胞图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010546079.3A CN111860591A (zh) | 2020-06-16 | 2020-06-16 | 基于间隔自适应特征选择融合的宫颈细胞图像分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111860591A true CN111860591A (zh) | 2020-10-30 |
Family
ID=72987249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010546079.3A Pending CN111860591A (zh) | 2020-06-16 | 2020-06-16 | 基于间隔自适应特征选择融合的宫颈细胞图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860591A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034448A (zh) * | 2021-03-11 | 2021-06-25 | 电子科技大学 | 一种基于多示例学习的病理图像细胞识别方法 |
CN113255718A (zh) * | 2021-04-01 | 2021-08-13 | 透彻影像科技(南京)有限公司 | 一种基于深度学习级联网络方法的宫颈细胞辅助诊断方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108122004A (zh) * | 2017-12-19 | 2018-06-05 | 杭州电子科技大学 | 基于Fisher判别稀疏超限学习机的脑电分类方法 |
-
2020
- 2020-06-16 CN CN202010546079.3A patent/CN111860591A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108122004A (zh) * | 2017-12-19 | 2018-06-05 | 杭州电子科技大学 | 基于Fisher判别稀疏超限学习机的脑电分类方法 |
Non-Patent Citations (4)
Title |
---|
林宇鹏;谢智歌;徐凯;陈飞;刘利刚;: "基于超限学习机的快速癌症检测方法", 中国科学技术大学学报, no. 02 * |
肖海慧;廖定安;: "基于人工神经网络的肝部CT图像识别方法", 信息技术与信息化, no. 11 * |
赵理莉: ""宫颈细胞图像智能分析关键技术研究"", 《中国博士学位论文全文数据库信息科技辑》, pages 17 - 18 * |
雷一鸣;赵希梅;王国栋;于可歆;: "基于一种改进的LBP算法和超限学习机的肝硬化识别", 计算机科学, no. 10 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034448A (zh) * | 2021-03-11 | 2021-06-25 | 电子科技大学 | 一种基于多示例学习的病理图像细胞识别方法 |
CN113255718A (zh) * | 2021-04-01 | 2021-08-13 | 透彻影像科技(南京)有限公司 | 一种基于深度学习级联网络方法的宫颈细胞辅助诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108108657B (zh) | 基于多任务深度学习的修正局部敏感哈希车辆检索方法 | |
CN111126482B (zh) | 一种基于多分类器级联模型的遥感影像自动分类方法 | |
CN106803247B (zh) | 一种基于多级筛选卷积神经网络的微血管瘤图像识别方法 | |
Pękalska et al. | Prototype selection for dissimilarity-based classifiers | |
CN106295124B (zh) | 多种图像检测技术综合分析基因子图相似概率量的方法 | |
CN101140624A (zh) | 图像匹配方法 | |
Zhang et al. | Road recognition from remote sensing imagery using incremental learning | |
CN105260738A (zh) | 基于主动学习的高分辨率遥感影像变化检测方法及系统 | |
CN113408605A (zh) | 基于小样本学习的高光谱图像半监督分类方法 | |
Fang et al. | Confident learning-based domain adaptation for hyperspectral image classification | |
CN103955709B (zh) | 基于加权合成核与tmf的极化sar图像分类方法 | |
CN114048568A (zh) | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 | |
CN109858386A (zh) | 一种基于荧光显微图像的微藻细胞识别方法 | |
CN110264454A (zh) | 基于多隐藏层条件随机场的宫颈癌组织病理图像诊断方法 | |
CN111860591A (zh) | 基于间隔自适应特征选择融合的宫颈细胞图像分类方法 | |
CN113269647A (zh) | 基于图的交易异常关联用户检测方法 | |
CN108877947A (zh) | 基于迭代均值聚类的深度样本学习方法 | |
Yang et al. | Automatic classification of remote sensing images using multiple classifier systems | |
Huang et al. | Imbalanced data classification algorithm based on clustering and SVM | |
Chapaneri et al. | Plant disease detection: A comprehensive survey | |
CN113762151A (zh) | 一种故障数据处理方法、系统及故障预测方法 | |
Liu et al. | A novel deep framework for change detection of multi-source heterogeneous images | |
CN103093239B (zh) | 一种融合了点对和邻域信息的建图方法 | |
CN109191452B (zh) | 一种基于主动学习的腹腔ct图像腹膜转移自动标记方法 | |
Karlinsky et al. | RepMet: Representative-based metric learning for classification and one-shot object detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |