CN110533080B - 一种基于模糊规则集的乳腺癌细胞图像分类方法 - Google Patents

一种基于模糊规则集的乳腺癌细胞图像分类方法 Download PDF

Info

Publication number
CN110533080B
CN110533080B CN201910726634.8A CN201910726634A CN110533080B CN 110533080 B CN110533080 B CN 110533080B CN 201910726634 A CN201910726634 A CN 201910726634A CN 110533080 B CN110533080 B CN 110533080B
Authority
CN
China
Prior art keywords
breast cancer
rule base
cancer cell
variables
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910726634.8A
Other languages
English (en)
Other versions
CN110533080A (zh
Inventor
张潇
朱容波
卢珊珊
王宇帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South Central Minzu University
Original Assignee
South Central University for Nationalities
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South Central University for Nationalities filed Critical South Central University for Nationalities
Priority to CN201910726634.8A priority Critical patent/CN110533080B/zh
Publication of CN110533080A publication Critical patent/CN110533080A/zh
Application granted granted Critical
Publication of CN110533080B publication Critical patent/CN110533080B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Abstract

本发明公开了一种基于模糊规则集的乳腺癌细胞图像分类方法,该方法包括以下步骤:训练阶段:获取多幅良性的和恶性的乳腺癌细胞图像,将其作为训练数据,从训练数据中提取乳腺癌细胞图像的特征参数;将乳腺癌细胞图像的特征参数输入遗传优化串型分层模糊规则库系统中训练,通过建立层次结构模型,选择变量,利用隶属函数的横向调整并对规则库系统进行优化,训练完成后得到乳腺癌病灶辅助诊断的模型;测试阶段:获取待检测的乳腺细胞图像,对该图像进行特征参数提取,并将提取的图像特征参数数据输入乳腺癌病灶辅助诊断的模型中进行检测,得到检测结果完成对乳腺细胞图像的分类。本发明与传统结构相比减少了规则和模糊操作的数量,提高了分类性能。

Description

一种基于模糊规则集的乳腺癌细胞图像分类方法
技术领域
本发明涉及细胞图像处理技术领域,尤其涉及一种基于模糊规则集的乳腺癌细胞图像分类方法。
背景技术
近年来,基于人工智能和数据挖掘的分类器因为在医学诊断上具有较高的分类能力而备受关注,尤其是在利用该类决策系统诊断乳腺癌问题引起了大量专家和研究学者的关注,目前采取的分类器主要采用支持向量机、神经网络、遗传算法等策略。基于人工智能和数据挖掘的决策系统已成功用于分析乳腺癌图像,通过这些决策系统可将图像分为两组:无乳腺癌的良性组图像和有乳腺癌的恶性组图像,准确的分类有助于早期医学分析从而提高癌症患者的生存率。
但当前使用的分类器仍存在如下不足:支持向量机(Support Vector Machine,SVM)和神经网络(Neural Network,NN)训练过程过长,难以确定潜在输入变量的相对重要性并且在没有语言可解释的规则的情况下难以理解分类结果。因此它们在处理乳腺癌图像分析问题方面的适用性有限。Benítez和Casillas通过使用多目标进化算法研究可解释性和准确性之间的权衡,采用具有自然链接变量的层次模糊系统,虽然该模型可以减少规则的总数,但是可能会失去通过数学函数创建的新变量的准确性,且它无法量化输入变量的相对重要性。基于模糊规则的分类器简单且易于解释在医学领域广泛使用,模糊规则库系统用于乳腺癌细胞图像分析的决策系统前景广泛。然而,系统的输入数据集庞大且存在大量冗余特征,传统的模糊规则分类器处理大量的输入变量时,模糊规则的数量呈指数级增长且分类的结果并不十分准确或缺乏可解释性。
总体而言,现有的基于模糊规则集的乳腺癌图像分析系统存在具有大量的输入变量和模糊规则,且难以获得期望的诊断准确性和良好的可解释性的缺点。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于模糊规则集的乳腺癌细胞图像分类方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于模糊规则集的乳腺癌细胞图像分类方法,该方法包括以下步骤:
训练阶段:
获取多幅良性的和恶性的乳腺癌细胞图像,将其作为训练数据,从训练数据中提取乳腺癌细胞图像的特征参数;
将乳腺癌细胞图像的特征参数输入遗传优化串型分层模糊规则库系统中训练,通过建立层次结构模型,选择变量,利用隶属函数的横向调整并对规则库系统进行优化,训练完成后得到乳腺癌病灶辅助诊断的模型;
测试阶段:
获取待检测的乳腺细胞图像,对该图像进行特征参数提取,并将提取的图像特征参数数据输入乳腺癌病灶辅助诊断的模型中进行检测,得到检测结果完成对乳腺细胞图像的分类。
进一步地,本发明的该方法中提取乳腺癌细胞的特征参数的方法具体为:
步骤1、获取多幅乳腺癌细胞图像,提取图像中同一区域的细胞图像,提取多个图像属性得到数据集;数据集包括从乳腺癌细胞图像中提取的细胞的半径、分量像素中灰度强度的标准偏差、连续边界点之和、边界上像素和边界内部像素、平滑度、紧凑度、凹度、凹凸点、对称性和分形维数这10个属性各自的平均数、标准差和最差平均值,总共30个参数。
进一步地,本发明的该方法中对规则库进行优化训练的方法具体为:
步骤2、建立层次模糊规则库;
步骤3、对层次模糊规则库的隶属函数进行横向调整;
步骤4、根据横向调整的结果对层次模糊规则库进行优化;
步骤5、利用遗传算法(Genetic Algorithm,GA)算子对层次模糊规则库进行优化;
步骤6、定义输入变量对于分类的重要因子,根据重要因子的排序对变量进行重新选择;得到调整输入变量且优化后的规则库,即训练后的模型。
进一步地,本发明的步骤2的具体方法为:
设计三重编码结构C:
C={CH-CT-CR}
其中,CH用于编码串行分层结构,CT用于编码隶属函数调整,CR用于编码基于规则的结果;CH表达式为:
CH={h1,h2,…,hj,…,hN+1}
其中,h1…hN+1表示变量;用N+1-排列编码表示具有N个变量的系统的串行分层结构;数字j来表示数据集中的第j个属性,在第i个位置指定数量j表示在串行分层结构的第i个位置使用第j个属性;i等于0时为停止标志,代表在系统中不会选择0之后的属性。
进一步地,本发明的步骤3的具体方法为:
使用尺寸为I·M·N′的实矩阵来表达CT;其中,I是每个模块的输入变量数,M是用来编码每个输入变量的隶属函数的数量,N′是数据集中所选变量的数量,N′≤N;该部分对应于模糊系统中隶属函数的编码;则CT的具体表达式为:
CT={t(1,1,1),…,t(1,1,N′);…,t(I,M-1,N′)}
其中,t(p,q,k)用于调整系统的第q个模块中第p个输入变量的第k个隶属函数的值;对于每组隶属函数确定一个实际值来表示隶属函数的核心,该值在均匀分布的核心的预定范围内变化。
进一步地,本发明的步骤4的具体方法为:
对规则库进行优化,CR的表达式为:
Figure BDA0002159144310000031
其中,CR是用于规则基础结果的实矩阵编码,其中M表示每个变量的标签数量,N表示变量的总数,I表示层次结构的数量;r(i,j)∈[0,1]是串行分层结构中第j个模块的第i个规则的结果;规则库包含MI规则,此外设置I=2代表一个模块使用两个输入变量,三个MF用于一个输入变量,即M=3。
进一步地,本发明的步骤5的具体方法为:
利用GA算子对层次模糊规则库系统进行优化,GA算子由拟合函数指导;适应性评估函数为:
Figure BDA0002159144310000041
其中,平均绝对误差为MAE,fi和yi分别是第i个实例的预期输出和获得的输出,Nt表示训练实例的数量;
每个个体都用值{0,1,...N},即CH,I·M·N′的取值范围为[-1,1]实矩阵,即CT,以及MI·N的取值范围为[0,1]实矩阵,即CR的随机置换进行初始化;
采用轮盘赌轮方式选择个体对,每个个体占据与其适应性负相关的位置;有序的两点交叉作为CH的交叉算子;CT和CR采用BLX-α交叉和BGA突变作为实数编码的GA算子。
进一步地,本发明的步骤6的具体方法为:
定义输入变量对于分类问题的重要性因子;系统中变量被选择的频率越高,变量的重要性因子值越大或者在序列层次结构中变量排名越低,变量的重要性因子值越大;λ(k)定义为表示第k个属性对分类问题的重要性因子:
Figure BDA0002159144310000042
其中,Rki是N个执行结果中第i个执行结果中Vi的串行分层结构中第k个属性的排序数,|Vi|表示所选变量的数量;利用建立的模型完成对特征变量的排序及选择,建立系统的规则库。
本发明提供一种基于模糊规则集的乳腺癌细胞图像分类系统,该系统包括以下单元:
训练单元:
用于获取多幅良性的和恶性的乳腺癌细胞图像,将其作为训练数据,从训练数据中提取乳腺癌细胞图像的特征参数;
将乳腺癌细胞图像的特征参数输入遗传优化串型分层模糊规则库系统中训练,通过建立层次结构模型,选择变量,利用隶属函数的横向调整并对规则库系统进行优化,训练完成后得到乳腺癌病灶辅助诊断的模型;
测试单元:
用于获取待检测的乳腺细胞图像,对该图像进行特征参数提取,并将提取的图像特征参数数据输入乳腺癌病灶辅助诊断的模型中进行检测,得到检测结果完成对乳腺细胞图像的分类。
本发明产生的有益效果是:本发明的基于模糊规则集的乳腺癌细胞图像分类方法,该模糊规则库系统的层次结构与传统的结构相比有助于减少规则和模糊操作的数量,通过模糊规则库系统的遗传优化的串行分级结构对输入变量进行选择和排序,降低系统复杂性并识别出数据集中属性的重要性;再结合隶属函数的横向调整和规则库的优化提高分类准确性;通过该方法能够对乳腺癌细胞进行有效分类,准确的检测出乳腺癌细胞的种类。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例的两种交叉验证中OWBC数据集内属性的重要性;
图2是本发明实施例的方法流程图;
图3是本发明实施例的乳腺癌细胞图像。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例中,基于模糊规则集的乳腺癌细胞图像分类方法,可将乳腺癌细胞进行二分类从而辅助诊断。方法包括如下步骤:获取训练的乳腺细胞图像(包括良性和恶性),从该训练的乳腺细胞图像中提取出特征属性。将这些经过处理的图像数据输入遗传优化串型分层模糊分类器中训练,训练完成后得到一个乳腺癌病灶辅助诊断的模型。该阶段为训练阶段。随后获取待检测的乳腺细胞图像,对该乳腺细胞图像进行分析和特征提取,然后将提取的图像数据输入训练得到的乳腺癌病灶辅助诊断模型中进行检测,并得到检测结果完成对细胞图像的分析。
所有乳腺癌图像识别问题都涉及属性数量大及数据集庞大的问题,所以本发明侧重点在于如何对乳腺癌图像进行分析。在不规定属性内容和数量的情况下使得分析精确度到达理想程度的同时降低系统复杂性并区分数据集中属性的重要性。分析包括两个阶段:训练和测试。训练阶段的重点是对模糊规则库系统的遗传优化过程:获取训练数据,建立层次结构模型,选择出合适变量,最后利用隶属函数的横向调整并对规则库的优化。测试阶段是利用测试数据集对模糊规则库系统的验证,即利用优化后的系统识别测试集样本,完成对乳腺癌细胞图像的二分类,判断其是良性细胞还是恶性细胞。完整诊断流程如图2。具体步骤如下:
步骤1:被分类乳腺癌细胞特征参数xi的获取。首先获取多幅乳腺癌细胞图像,如下图3,提取图像中同一区域细胞图像,再根据具体情况提取图像属性,获取数据集。以WBCD数据库的数据集为例,数据集包含了从乳腺癌细胞图像中提取的细胞的半径、分量像素中灰度强度的标准偏差、连续边界点之和、边界上像素和边界内部像素、平滑度、紧凑度、凹度、凹凸点、对称性和分形维数这10个属性各自的平均数、标准差和最差平均值,总共30个参数。
步骤2:建立层次模糊规则库。首先设计三重编码结构:
C={CH-CT-CR}
CH用于编码串行分层结构,CT用于编码隶属函数调整,CR用于编码基于规则的结果。CH表达式为:
CH={h1,h2,…,hj,…,hN+1}
如等式所示用N+1-排列编码表示具有N个变量的系统的串行分层结构。数字j来表示数据集中的第j个属性,在第i个位置指定数量j意味着在串行分层结构的第i个位置使用第j个属性。i等于0时为停止标志,代表在系统中不会选择0之后的属性。
步骤3:隶属函数的横向调整。使用尺寸为I·M·N′的实矩阵来表达CT。I是每个模块的输入变量数,M是用来编码每个输入变量的隶属函数的数量,N′是数据集中所选变量的数量(N′≤N)。该部分对应于模糊系统中隶属函数的编码。则CT的具体表达式为:
CT={t(1,1,1),…,t(1,1,N′);…,t(I,M-1,N′)}
t(p,q,k)用于调整系统的第q个模块中第p个输入变量的第k个隶属函数的值。对于每组隶属函数确定一个实际值来表示隶属函数的核心,该值在均匀分布的核心的预定范围内变化。
步骤4:对规则库进行优化。CR的表达式为:
Figure BDA0002159144310000072
CR也是由用于规则基础结果的实矩阵编码,其中M表示每个变量的标签数量,N表示变量的总数,I表示层次结构的数量。r(i,j)∈[0,1]是串行分层结构中第j个模块的第i个规则的结果。为简化操作在此步骤不进行规则选择,因此规则库包含MI+个组合规则。此外设置I=2代表一个模块使用两个输入变量,三个MF用于一个输入变量(即M=3)。
步骤5:利用GA对层次模糊规则库系统进行优化。GA由拟合函数指导。适应性评估函数为:
Figure BDA0002159144310000071
即将广泛使用的平均绝对误差(MAE)用于适应性评估。其中fi和yi分别是第i个实例的预期输出和获得的输出,Nt表示训练实例的数量。每个个体都用值{0,1,...N}(即CH),I·M·N′的取值范围为[-1,1]实矩阵(即CT),以及MI·N的取值范围为[0,1]实矩阵(即CR)的随机置换进行初始化。采用轮盘赌轮方式选择个体对,每个个体占据与其适应性负相关的位置,这种方式可以选择出更好的个体。有序的两点交叉作为CH的交叉算子。微调的交换用于变异算子,该函数随机选择特定范围内的两个因子(相对较小的间隔)交换位置。CT和CR采用BLX-α交叉和BGA突变作为实数编码的GA算子。
步骤6:变量选择。定义输入变量对于分类问题的重要性因子。系统中变量被选择的频率越高,变量的重要性因子值越大或者在序列层次结构中变量排名越低,变量的重要性因子值越大。λ(k)定义为表示第k个属性对分类问题的重要性因子:
Figure BDA0002159144310000081
其中Rki是N个执行结果中第i个执行结果中Vi的串行分层结构中第k个属性的排序数。|Vi|表示所选变量的数量。利用建立的模型完成对特征变量的排序及选择,建立系统的知识库。
通过上述步骤,FRBS的遗传优化的串行分层结构对输入变量进行选择和排序,从而降低系统复杂性并区分数据集中属性的重要性并且结合隶属函数的横向调整和规则库的优化进一步提高分类精度。使得系统中的输入变量和模糊规则比现有系统所需的输入变量和模糊规则少;与现有系统相比,还对变量进行排序使得变量选择具有可解释性;在减小输入变量和规则库规模的同时,使得系统分类的准确率达到期望值,不低于现有系统的准确率。
GOSHFC是对现有模糊规则库系统(FRBS)的改进,该模糊规则库系统的层次结构与传统的结构相比有助于减少规则和模糊操作的数量。具体来说,分层FRBS中通过将整个FRBS分解为一组更简单的模糊子系统来减少模糊规则再以层次结构的方式联合起来。在这种分层结构中第一模糊子系统获得近似输出,然后由第二模糊子系统调谐,系统逐级重复此过程。在这种结构帮助下,系统可自动选择较少数量变量作为串行分层模块的集合。此外,在许多数据驱动的分类研究中大量变量可以在分类系统中提供丰富的信息,但是哪些变量更适用总存在争议。串行分层FRBS的另一个巨大优势是更好地解释数据集的可用性,选择出有用的变量并对其重要性进行排名。遗传算法作为一种全局搜索启发式算法,已被广泛用于优化模糊逻辑系统,遗传算法可由模糊自适应发现机制指导用来选择有用的规则并删除不必要的规则。所以利用GA优化串行分级的模糊规则库系统,通过模糊规则库系统的遗传优化的串行分级结构对输入变量进行选择和排序,降低系统复杂性并识别出数据集中属性的重要性;再结合隶属函数的横向调整和规则库的优化提高分类准确性。
在对乳腺癌图像进行分析和特征提取的基础上,本发明提出了一个新的模糊分类系统对乳腺癌进行辅助诊断,名为遗传优化串型分层模糊分类器(Genetic OptimizedSerial Hierarchical Fuzzy Classifier,GOSHFC)。通过遗传算法优化串行分级FRBS使得系统可对输入变量进行选择和排序,降低系统复杂性并区分数据集中属性的重要性;再并结合隶属函数的横向调整和规则库的优化以提高分类准确性。同时,本发明对两个典型的数据库进行了充分的实验和测试。具体来说,现有的分类系统中,利用分类技术结合模糊逻辑系统和进化算法生成的模糊系统在原始威斯康星州乳腺癌数据库(OWBC)的数据集上进行测试,系统分类精度为97.3%,但系统并未完全进行交叉验证的过程;结合特征选择的模糊系统仅通过选择三个输入变量在OWBC数据集上进行测试,平均最佳精确度为97.17%;FH-GBML在威斯康星州乳腺癌诊断数据库(WBCD)的数据集上进行测试,精度达95%左右。将GOSHFC与Fuzzy_AdaBoost、Fuzzy_LogitBoost、Fuzzy_Chi-RW和FH-GBML四个算法进行实验对比,分别计算采用5折交叉验证和10折交叉验证时系统的平均训练精确度
Figure BDA0002159144310000091
平均测试精确度
Figure BDA0002159144310000092
模糊规则平均数(#R)和选择输入变量(#V),结果如下表1,可以看出,GOSHFC在对具有大量属性的二元分类问题进行预测时可达到预期值;采用串行分层结构后使得模糊规则的数量减少;同时输入变量的数目比现有系统的输入变量数目都少,说明该系统可在减小输入变量和规则规模的同时可达到预期的诊断准确性。并且通过收集实验结果可对系统中输入变量自动选择和排序进而获取属性的重要性,结果如图1,与现有系统相比使得变量选择具有可解释性。
表1.各算法在OWBC数据集上的表现
Figure BDA0002159144310000093
Figure BDA0002159144310000101
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (4)

1.一种基于模糊规则集的乳腺癌细胞图像分类方法,其特征在于,该方法包括以下步骤:
训练阶段:
获取多幅良性的和恶性的乳腺癌细胞图像,将其作为训练数据,从训练数据中提取乳腺癌细胞图像的特征参数;提取乳腺癌细胞的特征参数的方法具体为:
步骤1、获取多幅乳腺癌细胞图像,提取图像中同一区域的细胞图像,提取多个图像属性得到数据集;数据集包括从乳腺癌细胞图像中提取的细胞的半径、分量像素中灰度强度的标准偏差、连续边界点之和、边界上像素和边界内部像素、平滑度、紧凑度、凹度、凹凸点、对称性和分形维数这10个属性各自的平均数、标准差和最差平均值,总共30个参数;
将乳腺癌细胞图像的特征参数输入遗传优化串型分层模糊规则库系统中训练,通过建立层次结构模型,选择变量,利用隶属函数的横向调整并对规则库系统进行优化,训练完成后得到乳腺癌病灶辅助诊断的模型;对规则库进行优化训练的方法具体为:
步骤2、建立层次模糊规则库;具体方法为:
设计三重编码结构C:
C={CH-CT-CR}
其中,CH用于编码串行分层结构,CT用于编码隶属函数调整,CR用于编码基于规则的结果;CH表达式为:
CH={h1,h2,…,hj,…,hN+1}
其中,h1…hN+1表示变量;用N+1-排列编码表示具有N个变量的系统的串行分层结构;数字j来表示数据集中的第j个属性,在第i个位置指定数量j表示在串行分层结构的第i个位置使用第j个属性;i等于0时为停止标志,代表在系统中不会选择0之后的属性;
步骤3、对层次模糊规则库的隶属函数进行横向调整;具体方法为:
使用尺寸为I·M·N′的实矩阵来表达CT;其中,I是每个模块的输入变量数,M是用来编码每个输入变量的隶属函数的数量,N′是数据集中所选变量的数量,N′≤N;该部分对应于模糊系统中隶属函数的编码;则CT的具体表达式为:
CT={t(1,1,1),…,t(1,1,N′);…,t(I,M-1,N′)}
其中,t(p,q,k)用于调整系统的第q个模块中第p个输入变量的第k个隶属函数的值;对于每组隶属函数确定一个实际值来表示隶属函数的核心,该值在均匀分布的核心的预定范围内变化;
步骤4、根据横向调整的结果对层次模糊规则库进行优化;
步骤5、利用遗传算法GA算子对层次模糊规则库进行优化;
步骤6、定义输入变量对于分类的重要因子,根据重要因子的排序对变量进行重新选择;得到调整输入变量且优化后的规则库,即训练后的模型;具体方法为:
定义输入变量对于分类问题的重要性因子;系统中变量被选择的频率越高,变量的重要性因子值越大或者在序列层次结构中变量排名越低,变量的重要性因子值越大;λ(k)定义为表示第k个属性对分类问题的重要性因子:
Figure FDA0002663977640000021
其中,Rki是N个执行结果中第i个执行结果中Vi的串行分层结构中第k个属性的排序数,|Vi|表示所选变量的数量;利用建立的模型完成对特征变量的排序及选择,建立系统的规则库;
测试阶段:
获取待检测的乳腺细胞图像,对该图像进行特征参数提取,并将提取的图像特征参数数据输入乳腺癌病灶辅助诊断的模型中进行检测,得到检测结果完成对乳腺细胞图像的分类。
2.根据权利要求1所述的基于模糊规则集的乳腺癌细胞图像分类方法,其特征在于,步骤4的具体方法为:
对规则库进行优化,CR的表达式为:
Figure FDA0002663977640000032
其中,CR是用于规则基础结果的实矩阵编码;r(i,j)∈[0,1]是串行分层结构中第j个模块的第i个规则的结果;规则库包含MI条规则,此外设置I=2代表一个模块使用两个输入变量,三个MF用于一个输入变量,即M=3。
3.根据权利要求1所述的基于模糊规则集的乳腺癌细胞图像分类方法,其特征在于,步骤5的具体方法为:
利用GA算子对层次模糊规则库系统进行优化,GA算子由拟合函数指导;适应性评估函数为:
Figure FDA0002663977640000031
其中,平均绝对误差为MAE,fi和yi分别是第i个实例的预期输出和获得的输出,Nt表示训练实例的数量;
每个个体都用值{0,1,...N},即CH,I·M·N′的取值范围为[-1,1]实矩阵,即CT,以及MI·N的取值范围为[0,1]实矩阵,即CR的随机置换进行初始化;
采用轮盘赌轮方式选择个体对,每个个体占据与其适应性负相关的位置;有序的两点交叉作为CH的交叉算子;CT和CR采用BLX-α交叉和BGA突变作为实数编码的GA算子。
4.一种基于模糊规则集的乳腺癌细胞图像分类系统,其特征在于,该系统包括以下单元:
训练单元:
用于获取多幅良性的和恶性的乳腺癌细胞图像,将其作为训练数据,从训练数据中提取乳腺癌细胞图像的特征参数;提取乳腺癌细胞的特征参数的方法具体为:
获取多幅乳腺癌细胞图像,提取图像中同一区域的细胞图像,提取多个图像属性得到数据集;数据集包括从乳腺癌细胞图像中提取的细胞的半径、分量像素中灰度强度的标准偏差、连续边界点之和、边界上像素和边界内部像素、平滑度、紧凑度、凹度、凹凸点、对称性和分形维数这10个属性各自的平均数、标准差和最差平均值,总共30个参数;
将乳腺癌细胞图像的特征参数输入遗传优化串型分层模糊规则库系统中训练,通过建立层次结构模型,选择变量,利用隶属函数的横向调整并对规则库系统进行优化,训练完成后得到乳腺癌病灶辅助诊断的模型;对规则库进行优化训练的方法具体为:
建立层次模糊规则库;具体方法为:
设计三重编码结构C:
C={CH-CT-CR}
其中,CH用于编码串行分层结构,CT用于编码隶属函数调整,CR用于编码基于规则的结果;CH表达式为:
CH={h1,h2,…,hj,…,hN+1}
其中,h1…hN+1表示变量;用N+1-排列编码表示具有N个变量的系统的串行分层结构;数字j来表示数据集中的第j个属性,在第i个位置指定数量j表示在串行分层结构的第i个位置使用第j个属性;i等于0时为停止标志,代表在系统中不会选择0之后的属性;
对层次模糊规则库的隶属函数进行横向调整;具体方法为:
使用尺寸为I·M·N′的实矩阵来表达CT;其中,I是每个模块的输入变量数,M是用来编码每个输入变量的隶属函数的数量,N′是数据集中所选变量的数量,N′≤N;该部分对应于模糊系统中隶属函数的编码;则CT的具体表达式为:
CT={t(1,1,1),…,t(1,1,N′);…,t(I,M-1,N′)}
其中,t(p,q,k)用于调整系统的第q个模块中第p个输入变量的第k个隶属函数的值;对于每组隶属函数确定一个实际值来表示隶属函数的核心,该值在均匀分布的核心的预定范围内变化;
根据横向调整的结果对层次模糊规则库进行优化;
利用遗传算法GA算子对层次模糊规则库进行优化;
定义输入变量对于分类的重要因子,根据重要因子的排序对变量进行重新选择;得到调整输入变量且优化后的规则库,即训练后的模型;具体方法为:
定义输入变量对于分类问题的重要性因子;系统中变量被选择的频率越高,变量的重要性因子值越大或者在序列层次结构中变量排名越低,变量的重要性因子值越大;λ(k)定义为表示第k个属性对分类问题的重要性因子:
Figure FDA0002663977640000051
其中,Rki是N个执行结果中第i个执行结果中Vi的串行分层结构中第k个属性的排序数,|Vi|表示所选变量的数量;利用建立的模型完成对特征变量的排序及选择,建立系统的规则库;
测试单元:
用于获取待检测的乳腺细胞图像,对该图像进行特征参数提取,并将提取的图像特征参数数据输入乳腺癌病灶辅助诊断的模型中进行检测,得到检测结果完成对乳腺细胞图像的分类。
CN201910726634.8A 2019-08-07 2019-08-07 一种基于模糊规则集的乳腺癌细胞图像分类方法 Active CN110533080B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910726634.8A CN110533080B (zh) 2019-08-07 2019-08-07 一种基于模糊规则集的乳腺癌细胞图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910726634.8A CN110533080B (zh) 2019-08-07 2019-08-07 一种基于模糊规则集的乳腺癌细胞图像分类方法

Publications (2)

Publication Number Publication Date
CN110533080A CN110533080A (zh) 2019-12-03
CN110533080B true CN110533080B (zh) 2020-11-24

Family

ID=68662167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910726634.8A Active CN110533080B (zh) 2019-08-07 2019-08-07 一种基于模糊规则集的乳腺癌细胞图像分类方法

Country Status (1)

Country Link
CN (1) CN110533080B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292299A (zh) * 2020-01-21 2020-06-16 长沙理工大学 一种乳腺肿瘤识别方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7298883B2 (en) * 2002-11-29 2007-11-20 University Of Chicago Automated method and system for advanced non-parametric classification of medical images and lesions
CN101226155A (zh) * 2007-12-21 2008-07-23 中国人民解放军第八一医院 智能化肺癌早期细胞病理图像识别处理方法
CN102411715A (zh) * 2010-09-21 2012-04-11 张云超 有监督学习功能的细胞图像自动分类方法和系统
CN104715259A (zh) * 2015-01-22 2015-06-17 苏州工业职业技术学院 X光乳腺图像的核自适应优化分类方法
CN105447569A (zh) * 2015-12-18 2016-03-30 北京柏惠维康科技有限公司 一种基于深度学习的乳腺癌细胞特征分析系统
CN109740669A (zh) * 2018-12-29 2019-05-10 大连大学 一种基于深度特征聚合的乳腺癌病理图像分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102322864B (zh) * 2011-07-29 2014-01-01 北京航空航天大学 一种机载光学鲁棒景像匹配导航定位方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7298883B2 (en) * 2002-11-29 2007-11-20 University Of Chicago Automated method and system for advanced non-parametric classification of medical images and lesions
CN101226155A (zh) * 2007-12-21 2008-07-23 中国人民解放军第八一医院 智能化肺癌早期细胞病理图像识别处理方法
CN102411715A (zh) * 2010-09-21 2012-04-11 张云超 有监督学习功能的细胞图像自动分类方法和系统
CN104715259A (zh) * 2015-01-22 2015-06-17 苏州工业职业技术学院 X光乳腺图像的核自适应优化分类方法
CN105447569A (zh) * 2015-12-18 2016-03-30 北京柏惠维康科技有限公司 一种基于深度学习的乳腺癌细胞特征分析系统
CN109740669A (zh) * 2018-12-29 2019-05-10 大连大学 一种基于深度特征聚合的乳腺癌病理图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Hierarchical Fuzzy Rule-Based System Optimized with Genetic Algorithms for Short Term Traffic Congestion Prediction;Xiao Zhang, and etc;《Preprint submitted to Transportation Research Part C: Emerging Technologies》;20140324;第1-16页 *
基于细胞核特征的宫颈癌细胞图像的识别与分类;宁梓淯等;《自动化与仪器仪表》;20161231(第10期);第197-199页 *

Also Published As

Publication number Publication date
CN110533080A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
CN108108657B (zh) 基于多任务深度学习的修正局部敏感哈希车辆检索方法
Badawi et al. A hybrid memetic algorithm (genetic algorithm and great deluge local search) with back-propagation classifier for fish recognition
CN111832608B (zh) 一种基于单阶段检测模型yolov3的铁谱图像多磨粒识别方法
Kang Rotation-invariant wafer map pattern classification with convolutional neural networks
CN113408605A (zh) 基于小样本学习的高光谱图像半监督分类方法
Buvana et al. Content-based image retrieval based on hybrid feature extraction and feature selection technique pigeon inspired based optimization
CN111524140B (zh) 基于cnn和随机森林法的医学图像语义分割方法
Rahman et al. Serial combination of multiple experts: A unified evaluation
CN112183237A (zh) 基于颜色空间自适应阈值分割的白细胞自动分类方法
WO2023143950A1 (en) Computer implemented method for the detection and classification of anomalies in an imaging dataset of a wafer, and systems making use of such methods
Akaramuthalvi et al. Comparison of Conventional and Automated Machine Learning approaches for Breast Cancer Prediction
CN110533080B (zh) 一种基于模糊规则集的乳腺癌细胞图像分类方法
Keyvanpour et al. WARM: a new breast masses classification method by weighting association rule mining
Muthukannan et al. A GA_FFNN algorithm applied for classification in diseased plant leaf system
CN114782761B (zh) 基于深度学习的智能仓储物料识别方法和系统
Matsui et al. Feature selection by genetic algorithm for MRI segmentation
Singh et al. Multiclass imbalanced big data classification utilizing spark cluster
Balamurugan et al. Brain tumor classification in MRI images using genetic algorithm appended CNN
CN108304546B (zh) 一种基于内容相似度和Softmax分类器的医学图像检索方法
Kate et al. A new approach to breast cancer analysis through histopathological images using MI, MD binary, and eight class classifying techniques
CN113065520A (zh) 一种面向多模态数据的遥感图像分类方法
Govinda et al. Fuzzy based uncertainty modeling of Cancer Diagnosis System
CN109886340A (zh) 一种遥感影像分类方法
Hadavi et al. Classification of normal and abnormal lung ct-scan images using cellular learning automata
CN114821206B (zh) 基于对抗互补特征的多模态图像融合分类方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant