CN106096571A - 一种基于emd特征提取和稀疏表示的细胞分类方法 - Google Patents

一种基于emd特征提取和稀疏表示的细胞分类方法 Download PDF

Info

Publication number
CN106096571A
CN106096571A CN201610461512.7A CN201610461512A CN106096571A CN 106096571 A CN106096571 A CN 106096571A CN 201610461512 A CN201610461512 A CN 201610461512A CN 106096571 A CN106096571 A CN 106096571A
Authority
CN
China
Prior art keywords
data
emd
imf
hemocyte
src
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610461512.7A
Other languages
English (en)
Other versions
CN106096571B (zh
Inventor
李伟
张秋实
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Chemical Technology
Original Assignee
Beijing University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Chemical Technology filed Critical Beijing University of Chemical Technology
Priority to CN201610461512.7A priority Critical patent/CN106096571B/zh
Publication of CN106096571A publication Critical patent/CN106096571A/zh
Application granted granted Critical
Publication of CN106096571B publication Critical patent/CN106096571B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • G06T2207/10036Multispectral image; Hyperspectral image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/513Sparse representations

Abstract

一种基于EMD特征提取和稀疏表示的细胞分类方法,本方法采用了一种基于EMD的细胞特征提取方法。首先利用正交子空间投影OSP方法对医学高光谱图像进行波段选择,降低维数,减少数据冗余。然后用二维EMD方法对降维后的数据进行特征提取,将数据分解为一系列频率由高到低排列的IMF分量。采用基于稀疏表示的分类器SRC对数据进行分类,通过比较残差来对样本分类,计算得到的残差越小,则将该样本归为到这一类中。基于EMD特征提取和稀疏表示的细胞分类方法中,EMD表现出来很好的时频特性,在高光谱数据特征提取上具有明显的潜力和优势。同时利用基于稀疏表示的分类器SRC,更大大的保证了分类的精度。

Description

一种基于EMD特征提取和稀疏表示的细胞分类方法
技术领域
本发明涉及一种基于EMD(经验模式分解)的细胞特征提取方法,并采用稀疏表示的分类方法对其进行分类识别,属于医学高光谱分类识别领域。
背景技术
传统的医学检测方法是一系列的化学分析法,对组织切片进行染色,实验过程复杂,周期长,速度慢,强度大,误差大,测量的可重复性差,通过人眼观察实现癌细胞识别,受实验者的主观影响很大,容易造成误诊。随着成像技术的发展,医学诊断也越来越依赖于成像技术。成像形式包括核磁共振成像(MRI),计算机断层扫描成像(CT),超声波扫描术,核成像技术等等。近年来,基于光学成像技术及模式识别的全自动、智能化组织切片中细胞分析和诊断研究引起不少学者的重视。高光谱成像技术的快速发展也使其迅速成为医学成像的一员。基于高光谱成像技术以及模式识别的发展,逐渐走入人们的视线,为实时医疗成像进行快速诊断提供了可能。相较传统的医疗诊断方法,能够摆脱繁琐的前期数据的处理,包括对细胞染色,对获得的样本进行离心操作获取分离其他成分等等操作,从而摆脱实验者的主观因素快速准确的对病情进行判断。近年来,高光谱成像技术与生物医学显微镜结合而成的高光谱显微技术成为最受人们关注的一种医学成像技术。它可近距离对生物医学切片进行成像,并同时获得观测对象的图像维信息和光谱维信息。传统的医学治疗都是通过医生用肉眼观察医学影像上的病变区域形态,而每天都会产生很多医学影像,既耗费时间而且精确度不高。
相比传统的纤维成像方式,高光谱成像技术可提供更丰富的信息进行病理分析,辅助医学研究人员从更加全面的角度对组织器官和细胞切片进行研究分析。本发明公开了一种快速识别匹配病变细胞的方法,通过对医学图像的特征提取来压缩信息,从而对血细胞进行分类找出病变细胞。移动医疗的快速发展要求能快速精确地进行血液检查,从而能有效实现疾病的早期发现和病因判断。本发明完成一套自动进行血细胞识别的方法,利用不同血细胞的透射和吸收光谱特性对其进行自动分类识别,能有效提高细胞识别速度和精度,并能迅速发现异常细胞,将能为临床的精确辅助诊断和快速病源发现提供良好的技术支持。
高光谱图像一个主要特点是波段数多,波段间具有很强的相关性,所以各波段图像所提供的信息常常有重叠。为了消除冗余信息、减少数据量和计算时间,需要对高光谱图像进行特征提取。EMD能将信号分解成有限个本征模函数(IMF)和一个残差信号。EMD表现出来很好的时频特性,在高光谱数据特征提取上具有明显的潜力和优势。
发明内容
本发明的目的在于是通过学习相关技术基础,完成一套医学显微图像的人体血细胞快速识别系统。移动医疗的快速发展要求能快速精确地进行血液检查,从而能有效实现疾病的早期发现和病因判断。要求完成一套自动进行血细胞识别的方法,利用不同血细胞的透射和吸收光谱特性对其进行自动分类识别,能有效提高细胞识别速度和精度,并能迅速发现异常细胞,将能为临床的精确辅助诊断和快速病源发现提供良好的技术支持。
高光谱成像在生物医学可视化方面是一种新技术,与生物医学显微镜相结合而产生的高光谱显微技术在国际上已经被成功的应用于医学领域。高光谱可以对被摄物体在紫外、可见光、近红外、甚至中红外波段等宽谱段范围进行成像,光谱分辨率能达到纳米级。细胞的病变会引起细胞组分如蛋白质、核酸、糖和水分等在含量、构型等方面的变化,由此引起光谱曲线在波形、峰强、波长等方面的改变。
医院每天要产生上千万甚至更多的医学影像,而高光谱图像存在着很大的空间相关性,产生很多冗余信息。为了节省运算时间和提高计算精度,因此先对医学血细胞高光谱图像进行波段选择来减少数据量,降维后再对其进行EMD特征提取,然后用稀疏表示的方法对血细胞进行分类。
本发明采用的技术方案为一种基于EMD特征提取和稀疏表示的细胞分类方法,该方法的实现过程如下:
S1对医学血细胞的高光谱数据用OSP(正交子空间投影)进行波段选择。从血细胞图像所有波段中选择起主要作用的波段子集,剔除部分高冗余的波段。不仅能大大降低医学血细胞图像的数据维数,而且能比较完整地保留有用的信息,提高分类精度。
S2采用EMD分解的方法提取血细胞高光谱图像特征。EMD能够自适应地从高频到低频提取信号的本质特征,EMD对血细胞的高光谱图像进行分解,通过多次的筛分过程,一方面消除信号中的骑波,另一方面平滑高低不平的振幅,得到一系列的从高频到低频的IMF,然后从IMF中提取合适的特征,进行分类。
S3利用SRC分类器进行分类。SRC用训练样本稀疏线性地表示测试样本,并根据类别线性重构误差最小化分类。
本发明的流程图如图1所示,实施步骤如下:
步骤1、血细胞的高光谱数据量大,但是各波段间往往具有相关性,这造成数据的冗余,也就是常说的维数灾难。为了提高运算精度和节省运算时间先对数据用OSP方法对血细胞数据进行波段选择。波段选择的原则是:信息含量多、相关性小、光谱差异大、可分性好的波段就是应该选择的最佳波段。
具体算法如下:定义B1和B2是血细胞光谱数据φ中的两个波段,每个波段有N个像素点。用B1和B2来估算第三个波段B。为了找到一个波段使它和B1和B2最不相似,一个关于B1和B2的正交子空间P被构造为:
P=I-Z(ZTZ)-1ZT
式中,I是一个N阶单位矩阵,Z是一个N×2矩阵,Z的第一列包含B1的所有像素,Z的第二列包含B2的所有像素。
计算出y0=PTy,y包含B的所有像素,y0是B1和B2的正交子空间中的B的分量。产生最大正交分量||y0||的波段被认为是与B1和B2最不像似的波段,被选为B3
步骤2、利用EMD方法进行特征描述,提取血细胞的特征。
EMD经验模式分解将复杂的信号分解为适宜于Hilbert变换的IMF函数分量,由于本征模函数IMF的本质是信号在不同频率范围内原信号的本质特征,原信号噪声的集合表示为残差形式,所以提取信号的本质特征通过保留每个IMF分量和丢弃残余量来实现,IMF必须满足下列基本条件:
1)整个信号长度上的极大值点数、极小值点数与过零点的数目相等或相差为1。
2)在任意时刻,由包络线定义的极大值和极小值的平均值为0。
第一个条件很明显,它和传统的窄带的稳定高斯过程的要求一样;第二个条件是必要的,以此保证瞬时频率不会出现不期望的波动而诱导不对称的波形。EMD分解实质是对一个时间序列信号进行平稳化的处理过程,它将信号分解为一系列频率由高到低排列的IMF分量和一个余量之和,IMF的获得是一个不断循环迭代的过程,最后筛选出满足条件的IMF。该过程不断的从大尺度信号中剔除均值包络线,直到满足停止条件,筛选结束。对一个信号S(t)进行EMD分解的具体步骤如下:
(1)外部初始化,令血细胞图像为
r0(m,n)=f(m,n),j=1
(2)提取第j个IMF函数:
a)内部初始化
hj,0(m,n)=rj-1(m,n),k=1;
b)利用形态学算法或8邻域像素,找出hj,k-1(m,n)中的局部极大值和局部极小值点集;
c)使用合适的二维曲面插值方法,分别对极大值点和极小值点进行包络拟合,插值计算出hj,k-1(m,n)的上包络面umax,k-1(m,n)和下包络面umin,k-1(m,n);
d)确定上下包络的均值:
meank-1(m,n)=[umax,k-1(m,n)+umin,k-1(m,n)]/2;
e)从图像中减去均值,得到:
hj,k(m,n)=hj,k-1(m,n)-meank-1(m,n)
f)计算终止条件,若满足IMF条件则有
cj(m,n)=hj,k(m,n)
否则令k=k+1,转到步骤b
(3)求残余量
rj(m,n)=rj-1(m,n)-cj(m,n)
若rj中仍有不少于两个的极值点或者分解所得的IMF数目未达到要求,则将rj看做新的数据,并继续从步骤2进行分解,j=j+1
(4)最后得到的二维EMD分解的结果是:
f ( m , n ) = Σ j = 1 n c j ( m , n ) + r n ( m , n )
二维EMD中IMF筛选停止的SD计算公式如下:
S D = Σ m = 1 M Σ n = 1 N [ | h j , k - 1 ( m , n ) - h j , k ( m , n ) | 2 h j , k - 1 2 ( m , n ) ]
二维EMD的标准偏差SD的阈值η的经验值通常设在0.1-0.3之间。
步骤3、将血细胞光谱数据贴好标签后,选取部分数据作为训练数据,所有数据作为测试数据,利用SRC分类器对细胞进行分类。SRC的算法如下:
SRC算法可用较少的数据捕获感兴趣目标的重要信息,即在样本数充足的情况下,每一类训练样本数据张成一个完备子空间,当该类样本中其他数据输入时,由该完备空间的数据线性表示出来。SRC对数据缺损不敏感,当所求系数足够稀疏时,特征空间的选取变得不再重要;这些优势使得SRC成为一种非常优秀的分类算法。
其主要思想是:对给定的训练样本集的每个字典原子进行归一化。其次求解最小l1-范数问题:α1=argαmin∣∣α∣∣1,其中α满足y=Aα或∣∣y-Aα∣∣2≤ε,ε>0是一个可选误差。然后对测试样本计算每一类的残差
r i ( y ) = | | y - Aδ i ( α 1 ) | | 2 2
i=1,2,3,……,c,c为对象类;式中δi1)s为特征函数,该特征函数的元素选择与α1中第i类相关的系数。最后对y进行分类:I(y)=argiminri(y),这里I(y)表示估计y的类别标签。
与现有技术相比,本发明具有如下优点:
1)高光谱显微成像能同时进行区域成像和光谱成像,为组织切片细胞识别提供了一种新的技术方法;
2)利用不同细胞的透射和吸收光谱特性对其进行自动分类识别,快速发现异常细胞,提高癌症确诊的准确性与特异性;
3)基于高光谱显微图像进行自动化高精度的细胞识别,将能为临床的精确辅助诊断和快速病源发现提供良好的技术支持,对提高人口健康水平及人民生活质量具有重要意义。
4)不同于传统的特征提取方法,EMD能将信号分解成有限个本征模函数(IMF)和一个残差信号。EMD表现出来很好的时频特性,在血细胞高光谱数据特征提取上具有明显的潜力和优势。本发明的具体创新点在于将EMD特征提取方法应用在医学高光谱图像上,利用不同血细胞的透射和吸收光谱特性对其进行自动分类识别,能有效提高细胞识别速度和精度,并能迅速发现异常细胞。同时利用基于稀疏表示的分类器SRC,更大大的保证了分类的精度。
附图说明
图1为本发明具体流程图
具体实施方式
本发明的基于EMD特征提取和稀疏表示进行细胞分类方法的基本流程如图1所示,具体包括以下步骤:
1)首先将血细胞数据进行归一化处理,然后存储数据和相应的标签。
2)由于血细胞光谱波段数众多,而且各波段间存在空间相关性,如果全部波段都利用会产生冗余信息,加大计算上的时间开销。为了减少EMD特征提取的数据量并且提高运算时间,先对血细胞数据进行波段选择。实验中选择的血细胞数据大小为462×451×33。所以从33个波段中选择5个波段,分别是第25、33、20、30和32波段。选择出来的波段具有信息含量多、相关性小、光谱差异大、可分性好等优点。
3)对这5个波段的血细胞数据进行EMD特征提取。找出图像数据中的局部极大值点和局部极小值点。每一个波段的血细胞数据都是一个二维图像信号,设它的中心像素灰度值为f(i,j),其邻域中任一像素灰度值为f(m,n),采用8邻域点与中心像素灰度值比较的方法,灰度值比相邻8像素点都高或低的点数就是图像的极大或极小值点。如果f(i,j)>f(m,n)都成立,并且m≠i,n≠j,则(i,j)位置处像素点为一个局部极大值点;如果f(i,j)<f(m,n)都成立,并且m≠i,n≠j,则(i,j)位置处像素点为一个局部极小值点;如果f(i,j)>f(m,n)对于某些邻域位置点成立,而f(i,j)<f(m,n)对于另一些邻域位置点成立,则(i,j)位置处像素点既不是极大值点也不是极小值点;此方法找到的二维血细胞图像极值点更为精确。再对得到的极大值和极小值点集做三次样条插值进行包络拟合,得到上下包络。确定上下包络均值,从原图像中减去均值,根据IMF条件判断是否符合条件,得到的第一个IMF分量代表原始血细胞数据序列中最高频的组成部分。将原始血细胞数据序列f(x,y)减去第一个分量c1(x,y),得到一个去掉高频组成成分的差值数据序列r1(x,y)。对rj(x,y)进行上述平稳化处理过程得到第二个IMF分量c2(x,y),如此重复下去直至最后一个差值序列不可再被分解或达到了要求的IMF个数。本发明中终止条件中的参数η选择为0.1。医学血细胞高光谱数据经过二维EMD分解得到5个IMF函数。将EMD分解后的数据存储起来。
4)经过波段选择后留下5个波段,每个波段分解5个IMF函数。对这25维数据用SRC分类器进行分类。生成一个1-N个整数随机分布的随机序列,将所有样本随机排列,取前100个样本作为训练样本,并且将所有样本都作为测试样本。计算当训练样本X足够稀疏时,求解 重构测试样本根据y与之间的最小逼近残差来对样本进行归类,并计算分类精确度。λ分别选取1e-6、1e-5、1e-4、1e-3、1e-2、1e-1和1。然后分别计算出各参数下分类的精度,选出具有最高精度的参数。
本发明能够准确的将细胞进行分类。

Claims (2)

1.一种基于EMD特征提取和稀疏表示的细胞分类方法,S1对医学血细胞的高光谱数据用OSP进行波段选择;从血细胞图像所有波段中选择起主要作用的波段子集,剔除部分高冗余的波段;不仅能大大降低医学血细胞图像的数据维数,而且能比较完整地保留有用的信息,提高分类精度;
S2采用EMD分解的方法提取血细胞高光谱图像特征;EMD能够自适应地从高频到低频提取信号的本质特征,EMD对血细胞的高光谱图像进行分解,通过多次的筛分过程,一方面消除信号中的骑波,另一方面平滑高低不平的振幅,得到一系列的从高频到低频的IMF,然后从IMF中提取合适的特征,进行分类;
S3利用SRC分类器进行分类;SRC用训练样本稀疏线性地表示测试样本,并根据类别线性重构误差最小化分类;
其特征在于:该方法的实施步骤如下,
步骤1、血细胞的高光谱数据量大,但是各波段间往往具有相关性,这造成数据的冗余,也就是常说的维数灾难;为了提高运算精度和节省运算时间先对数据用OSP方法对血细胞数据进行波段选择;波段选择的原则是:信息含量多、相关性小、光谱差异大、可分性好的波段就是应该选择的最佳波段;
具体算法如下:定义B1和B2是血细胞光谱数据φ中的两个波段,每个波段有N个像素点;用B1和B2来估算第三个波段B;为了找到一个波段使它和B1和B2最不相似,一个关于B1和B2的正交子空间P被构造为:
P=I-Z(ZTZ)-1ZT
式中,I是一个N阶单位矩阵,Z是一个N×2矩阵,Z的第一列包含B1的所有像素,Z的第二列包含B2的所有像素;
计算出y0=PTy,y包含B的所有像素,y0是B1和B2的正交子空间中的B的分量;产生最大正交分量‖y0‖的波段被认为是与B1和B2最不像似的波段,被选为B3
步骤2、利用EMD方法进行特征描述,提取血细胞的特征;
EMD经验模式分解将复杂的信号分解为适宜于Hilbert变换的IMF函数分量,由于本征模函数IMF的本质是信号在不同频率范围内原信号的本质特征,原信号噪声的集合表示为残差形式,所以提取信号的本质特征通过保留每个IMF分量和丢弃残余量来实现,IMF必须满足下列基本条件:
1)整个信号长度上的极大值点数、极小值点数与过零点的数目相等或相差为1;
2)在任意时刻,由包络线定义的极大值和极小值的平均值为0;
第一个条件很明显,它和传统的窄带的稳定高斯过程的要求一样;第二个条件是必要的,以此保证瞬时频率不会出现不期望的波动而诱导不对称的波形;EMD分解实质是对一个时间序列信号进行平稳化的处理过程,它将信号分解为一系列频率由高到低排列的IMF分量和一个余量之和,IMF的获得是一个不断循环迭代的过程,最后筛选出满足条件的IMF;该过程不断的从大尺度信号中剔除均值包络线,直到满足停止条件,筛选结束;对一个信号S(t)进行EMD分解的具体步骤如下:
(1)外部初始化,令血细胞图像为
r0(m,n)=f(m,n),j=1
(2)提取第j个IMF函数:
a)内部初始化
hj,0(m,n)=rj-1(m,n),k=1;
b)利用形态学算法或8邻域像素,找出hj,k-1(m,n)中的局部极大值和局部极小值点集;
c)使用合适的二维曲面插值方法,分别对极大值点和极小值点进行包络拟合,插值计算出hj,k-1(m,n)的上包络面umax,k-1(m,n)和下包络面umin,k-1(m,n);
d)确定上下包络的均值:
meank-1(m,n)=[umax,k-1(m,n)+umin,k-1(m,n)]/2;
e)从图像中减去均值,得到:
hj,k(m,n)=hj,k-1(m,n)-meank-1(m,n)
f)计算终止条件,若满足IMF条件则有
cj(m,n)=hj,k(m,n)
否则令k=k+1,转到步骤b
(3)求残余量
rj(m,n)=rj-1(m,n)-cj(m,n)
若rj中仍有不少于两个的极值点或者分解所得的IMF数目未达到要求,
则将rj看做新的数据,并继续从步骤2进行分解,j=j+1
(4)最后得到的二维EMD分解的结果是:
f ( m , n ) = &Sigma; j = 1 n c j ( m , n ) + r n ( m , n )
二维EMD中IMF筛选停止的SD计算公式如下:
S D = &Sigma; m = 1 M &Sigma; n = 1 N &lsqb; | h j , k - 1 ( m , n ) - h j , k ( m , n ) | 2 h j , k - 1 2 ( m , n ) &rsqb;
二维EMD的标准偏差SD的阈值η的经验值通常设在0.1-0.3之间;
步骤3、将血细胞光谱数据贴好标签后,选取部分数据作为训练数据,所有数据作为测试数据,利用SRC分类器对细胞进行分类;SRC的算法如下:
SRC算法可用较少的数据捕获感兴趣目标的重要信息,即在样本数充足的情况下,每一类训练样本数据张成一个完备子空间,当该类样本中其他数据输入时,由该完备空间的数据线性表示出来;SRC对数据缺损不敏感,当所求系数足够稀疏时,特征空间的选取变得不再重要;这些优势使得SRC成为一种非常优秀的分类算法;
其主要思想是:对给定的训练样本集的每个字典原子进行归一化;其次求解最小l1-范数问题:α1=argαmin∣∣α∣∣1,其中α满足y=Aα或∣∣y-Aα∣∣2≤ε,ε>0是一个可选误差;然后对测试样本计算每一类的残差
r i ( y ) = | | y - A&delta; i ( &alpha; 1 ) | | 2 2
i=1,2,3,……,c,c为对象类;式中δi1)s为特征函数,该特征函数的元素选择与α1中第i类相关的系数;最后对y进行分类:I(y)=argiminri(y),这里I(y)表示估计y的类别标签;
2.根据权利要求1所述的一种基于EMD特征提取和稀疏表示的细胞分类方法,其特征在于:
本方法具体包括以下步骤,
1)首先将血细胞数据进行归一化处理,然后存储数据和相应的标签;
2)由于血细胞光谱波段数众多,而且各波段间存在空间相关性,如果全部波段都利用会产生冗余信息,加大计算上的时间开销;为了减少EMD特征提取的数据量并且提高运算时间,先对血细胞数据进行波段选择;实验中选择的血细胞数据大小为462×451×33;所以从33个波段中选择5个波段,分别是第25、33、20、30和32波段;
3)对这5个波段的血细胞数据进行EMD特征提取;找出图像数据中的局部极大值点和局部极小值点;每一个波段的血细胞数据都是一个二维图像信号,设它的中心像素灰度值为f(i,j),其邻域中任一像素灰度值为f(m,n),采用8邻域点与中心像素灰度值比较的方法,灰度值比相邻8像素点都高或低的点数就是图像的极大或极小值点;如果f(i,j)>f(m,n)都成立,并且m≠i,n≠j,则(i,j)位置处像素点为一个局部极大值点;如果f(i,j)<f(m,n)都成立,并且m≠i,n≠j,则(i,j)位置处像素点为一个局部极小值点;如果f(i,j)>f(m,n)对于某些邻域位置点成立,而f(i,j)<f(m,n)对于另一些邻域位置点成立,则(i,j)位置处像素点既不是极大值点也不是极小值点;此方法找到的二维血细胞图像极值点更为精确;再对得到的极大值和极小值点集做三次样条插值进行包络拟合,得到上下包络;确定上下包络均值,从原图像中减去均值,根据IMF条件判断是否符合条件,得到的第一个IMF分量代表原始血细胞数据序列中最高频的组成部分;将原始血细胞数据序列f(x,y)减去第一个分量c1(x,y),得到一个去掉高频组成成分的差值数据序列r1(x,y);对rj(x,y)进行上述平稳化处理过程得到第二个IMF分量c2(x,y),如此重复下去直至最后一个差值序列不可再被分解或达到了要求的IMF个数;本发明中终止条件中的参数η选择为0.1;医学血细胞高光谱数据经过二维EMD分解得到5个IMF函数;将EMD分解后的数据存储起来;
4)经过波段选择后留下5个波段,每个波段分解5个IMF函数;对这25维数据用SRC分类器进行分类;生成一个1-N个整数随机分布的随机序列,将所有样本随机排列,取前100个样本作为训练样本,并且将所有样本都作为测试样本;计算当训练样本X足够稀疏时,求解 重构测试样本根据y与之间的最小逼近残差来对样本进行归类,并计算分类精确度;λ分别选取1e-6、1e-5、1e-4、1e-3、1e-2、1e-1和1;然后分别计算出各参数下分类的精度,选出具有最高精度的参数。
CN201610461512.7A 2016-06-22 2016-06-22 一种基于emd特征提取和稀疏表示的细胞分类方法 Active CN106096571B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610461512.7A CN106096571B (zh) 2016-06-22 2016-06-22 一种基于emd特征提取和稀疏表示的细胞分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610461512.7A CN106096571B (zh) 2016-06-22 2016-06-22 一种基于emd特征提取和稀疏表示的细胞分类方法

Publications (2)

Publication Number Publication Date
CN106096571A true CN106096571A (zh) 2016-11-09
CN106096571B CN106096571B (zh) 2018-11-16

Family

ID=57252103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610461512.7A Active CN106096571B (zh) 2016-06-22 2016-06-22 一种基于emd特征提取和稀疏表示的细胞分类方法

Country Status (1)

Country Link
CN (1) CN106096571B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106875335A (zh) * 2017-02-16 2017-06-20 南昌航空大学 一种改进的基于希尔伯特黄变换图像背景抑制方法
CN107944444A (zh) * 2017-11-21 2018-04-20 北京化工大学 一种瓶装液体异物检测方法及系统
CN109447009A (zh) * 2018-11-02 2019-03-08 南京审计大学 基于子空间核范数正则化回归模型的高光谱图像分类方法
CN110940524A (zh) * 2019-12-06 2020-03-31 西安交通大学 一种基于稀疏理论的轴承故障诊断方法
CN112183210A (zh) * 2020-08-28 2021-01-05 江苏康尚生物医疗科技有限公司 一种基于稀疏矩阵的粒子自动聚焦方法、系统及存储介质
CN116297530A (zh) * 2023-05-19 2023-06-23 广东正一包装股份有限公司 基于光学技术的阻隔膜表面质量检测方法
CN116935384A (zh) * 2023-09-18 2023-10-24 上海大学 一种细胞异常样本智能化检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408478A (zh) * 2014-11-14 2015-03-11 西安电子科技大学 一种基于分层稀疏判别特征学习的高光谱图像分类方法
CN105608433A (zh) * 2015-12-23 2016-05-25 北京化工大学 一种基于核协同表达的高光谱图像分类方法
WO2016177833A1 (en) * 2015-05-04 2016-11-10 Bionor Immuno As Dosage regimen for hiv vaccine

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408478A (zh) * 2014-11-14 2015-03-11 西安电子科技大学 一种基于分层稀疏判别特征学习的高光谱图像分类方法
WO2016177833A1 (en) * 2015-05-04 2016-11-10 Bionor Immuno As Dosage regimen for hiv vaccine
CN105608433A (zh) * 2015-12-23 2016-05-25 北京化工大学 一种基于核协同表达的高光谱图像分类方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106875335A (zh) * 2017-02-16 2017-06-20 南昌航空大学 一种改进的基于希尔伯特黄变换图像背景抑制方法
CN107944444A (zh) * 2017-11-21 2018-04-20 北京化工大学 一种瓶装液体异物检测方法及系统
CN107944444B (zh) * 2017-11-21 2020-07-28 北京化工大学 一种瓶装液体异物检测方法及系统
CN109447009A (zh) * 2018-11-02 2019-03-08 南京审计大学 基于子空间核范数正则化回归模型的高光谱图像分类方法
CN109447009B (zh) * 2018-11-02 2020-12-22 南京审计大学 基于子空间核范数正则化回归模型的高光谱图像分类方法
CN110940524A (zh) * 2019-12-06 2020-03-31 西安交通大学 一种基于稀疏理论的轴承故障诊断方法
CN110940524B (zh) * 2019-12-06 2021-07-06 西安交通大学 一种基于稀疏理论的轴承故障诊断方法
CN112183210A (zh) * 2020-08-28 2021-01-05 江苏康尚生物医疗科技有限公司 一种基于稀疏矩阵的粒子自动聚焦方法、系统及存储介质
CN116297530A (zh) * 2023-05-19 2023-06-23 广东正一包装股份有限公司 基于光学技术的阻隔膜表面质量检测方法
CN116297530B (zh) * 2023-05-19 2023-07-25 广东正一包装股份有限公司 基于光学技术的阻隔膜表面质量检测方法
CN116935384A (zh) * 2023-09-18 2023-10-24 上海大学 一种细胞异常样本智能化检测方法
CN116935384B (zh) * 2023-09-18 2023-12-08 上海大学 一种细胞异常样本智能化检测方法

Also Published As

Publication number Publication date
CN106096571B (zh) 2018-11-16

Similar Documents

Publication Publication Date Title
CN106096571B (zh) 一种基于emd特征提取和稀疏表示的细胞分类方法
Yang et al. EMS-Net: Ensemble of multiscale convolutional neural networks for classification of breast cancer histology images
Xue et al. An application of transfer learning and ensemble learning techniques for cervical histopathology image classification
Liang et al. CNN-based image analysis for malaria diagnosis
CN109035263B (zh) 基于卷积神经网络的脑肿瘤图像自动分割方法
Asif et al. Improving effectiveness of different deep transfer learning-based models for detecting brain tumors from MR images
Brunetti et al. Computer-assisted frameworks for classification of liver, breast and blood neoplasias via neural networks: A survey based on medical images
Hao et al. Fusing multiple deep models for in vivo human brain hyperspectral image classification to identify glioblastoma tumor
CN107016395A (zh) 基于稀疏表示体系的原发性脑部淋巴瘤和胶质母细胞瘤的鉴别方法
CN109770932A (zh) 多模态脑部神经影像特征的处理方法
CN101667289B (zh) 基于nsct特征提取和监督分类的视网膜图像分割方法
CN109614991A (zh) 一种基于Attention的多尺度扩张性心肌的分割分类方法
CN113177943B (zh) 一种脑卒中ct影像分割方法
CN110991536B (zh) 原发性肝癌的早期预警模型的训练方法
CN112784856A (zh) 胸部x射线图像的通道注意力特征提取方法和识别方法
CN104143087A (zh) 基于sd-oct的挫伤性视网膜内外节缺失检测方法
JP2022507112A (ja) 表面を識別する原子間力顕微鏡法
CN112651927A (zh) 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法
CN103345633A (zh) 一种用于阿尔兹海默病早期发现的结构性核磁共振影像处理方法
CN103268494A (zh) 基于稀疏表示的寄生虫虫卵识别方法
Solanki et al. Brain tumour detection and classification by using deep learning classifier
CN112184613A (zh) 基于人工智能的磁共振肺部影像识别装置及方法
CN110428392A (zh) 一种基于字典学习和低秩表示的医学图像融合方法
Gholami et al. A compressive sensing approach for glioma margin delineation using mass spectrometry
Zhang et al. Ultrasonic image fibrosis staging based on machine learning for chronic liver disease

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant