CN103778431A - 基于二维格子复杂性度量的医学图像特征提取和识别系统 - Google Patents
基于二维格子复杂性度量的医学图像特征提取和识别系统 Download PDFInfo
- Publication number
- CN103778431A CN103778431A CN201310753643.9A CN201310753643A CN103778431A CN 103778431 A CN103778431 A CN 103778431A CN 201310753643 A CN201310753643 A CN 201310753643A CN 103778431 A CN103778431 A CN 103778431A
- Authority
- CN
- China
- Prior art keywords
- image
- algorithm
- system based
- medical image
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明及一种基于二维格子复杂性度量的医学图像特征提取和识别系统,包括以下步骤:一、读取图像;二、对图像进行预处理,包括图像灰度化;三、对步骤二处理后的图像通过图像分割处理算法实现图像的二值化操作;四、将步骤三处理后的图片通过连贯搜索算法转换为一维序列,进行二维格子复杂性提取操作;五、通过向量机训练模型进行测试,采用格子复杂性结合适当的模式识别分类算法,可以在图像色彩精度低、尺寸精度低的情况下提高自动识别的准确率,达到商业化要求,格子复杂性的一项参数细粒化指数是可调的,对更复杂的医学图像识别场合提供了具有高度适应性的选择。
Description
技术领域
本发明属于医学图像的计算机自动特征提取和模式识别领域,医学图像包括但不限于细胞显微图像、骨关节X光影像等,识别的目标包括区分正常细胞和癌细胞,区分骨质疏松和正常骨密度状态,区分不同阶段的骨龄等。
背景技术
人体细胞或组织具有一定分形结构是一般共识,但其真实结构更复杂多变。利用计算机对医学图像自动进行特征提取和模式识别的关键困难是对图像的复杂结构特征提取不足,最常用的分形维数等指标特征不足以使模式识别的分类准确率达到商业化的要求。一些区分效果很明显的研究结果则对原始图像的精度要求过高,比如2011年的Physical Review Letters上的一篇文章[PRL107,028101(2011)]显示癌细胞的表面分形维数明白高于正常细胞,但要求图像像素的尺寸精度必须达到纳米级。
发明内容
针对原有技术的不足,本发明提供了一种基于一维时间序列数据的格子复杂性这一复杂性度量指标的二维格子复杂性度量指标用于医学图像的特征提取和识别系统。
本发明所采用的技术方案是:一种基于二维格子复杂性度量的医学图像特征提取和识别系统,其包括以下步骤:
一、读取图像;
二、对图像进行预处理,包括图像灰度化;
三、对步骤二处理后的图像通过图像分割处理算法实现图像的二值化操作;
四、将步骤三处理后的图片通过连贯搜索算法转换为一维序列,进行二维格子复杂性提取操作;
五、通过向量机训练模型进行测试。
当对癌细胞检测时,进行步骤四之前对图像进行细胞周长和细胞面积的提取。
所述连贯搜索算法包括希尔伯特曲线、回字形算法、弓字形算法及其变形组合。
通过希尔伯特曲线转换的一维序列计算格子复杂性,其包括以下步骤:
第一步:根据细胞的大小,选择希尔伯特曲线,得到希尔伯特矩阵Hilb;
第二步:提取细胞核灰度矩阵B,经过缩放得到一个新的灰度矩阵NewB;
第三步:用希尔伯特矩阵Hilb搜索灰度矩阵NewB,得到一维信号A;
第三步:以灰度矩阵的平均值为阈值,对一维信号A进行符号化;
第四步:对已符号化序列A,求格子复杂性。
所述步骤三中图像分割处理算法包括最佳阈值法、Otsu阈值分割法及HSI系统阈值分割法。
当步骤三采用HSI系统阈值分割法时,步骤二还包括RGB系统到HIS系统的转化操作。
所述最佳阈值法包括以下步骤:(1)选择步骤二中灰度化操作后的图像;
(2)选择图像灰度的中值作为初始阈值To;
(5)重复(3),(4),直到|Ti+1-Ti<1|。
所述步骤七包括以下步骤:①读取图像;②从读取的图像中分别获得训练图像和测速图像;③分别对训练图像和测试图像进行图像预处理和特征值提取操作;④将训练图像中提取的特征值通过SVM训练输入到训练模版;⑤将步骤④获得的训练模板与测试图像中获得的特征值进行测试,获得测试结果。
本发明的有益效果是:由于格子复杂性是一种通用的复杂性度量算法,可以有效的弥补分形维数这类指标非通用性的缺陷,结合适当的模式识别分类算法,可以在图像色彩精度很低、同时尺寸精度也较低的情况下大幅度提高自动识别的准确率,达到商业化要求。同时格子复杂性还有一项参数细粒化指数是可调的,而且还可以同时选择不同连贯搜索算法和不同参数下的二维格子复杂性作为不同特征,对更复杂的医学图像识别场合提供了具有高度适应性的选择。
附图说明
图1是希尔伯特曲线的示意图。
图2是弓字形算法曲线的示意图。
图3是回字形算法曲线的示意图。
图4是图像的格子复杂性特征提取逻辑示意图。
图5是Hilb图像搜索算法的逻辑示意图。
图6是图像分割处理的整体框图。
图7是最佳阈值法的逻辑示意图。
图8是HSI系统阈值分割法的逻辑示意图。
图9是本发明的逻辑示意框图。
图10是向量机训练模型的训练和测试流程图。
具体实施方式
下面结合附图对本发明实施例作进一步说明:
如图9所示,一种基于二维格子复杂性度量的医学图像特征提取和识别系统,其包括以下步骤:
一、读取图像;
二、对图像进行预处理,包括图像灰度化;
三、对步骤二处理后的图像通过图像分割处理算法实现图像的二值化操作;
四、将步骤三处理后的图片转换为一维序列,进行特征值提取操作,所述特征值提取包括二维格子复杂性的提取;
五、通过向量机训练模型进行测试。
本发明根据申请人本人提出的适用于一维时间序列数据的格子复杂性这一复杂性度量指标[物理学报54(2),0534(2005.2)],发展出了二维格子复杂性度量指标用于医学图像的特征提取和自动识别。由于格子复杂性是一种通用的复杂性度量算法,可以有效的弥补分形维数这类指标非通用性的缺陷,结合适当的模式识别分类算法(如支持向量机等),可以在图像色彩精度很低(最低可以是黑白双色)同时尺寸精度也较低的情况下大幅度提高自动识别的准确率,达到商业化要求。其中,对大小仅为40乘40左右像素的400张显微单细胞图片,采用细胞核面积、细胞核周长以及简化二维格子复杂性(简单搜索并取细粒化指数为1)三项特征,用于区分癌细胞和正常细胞的自动识别系统的准确率达到了98%,如果用回字形搜索并计算不同细粒化指数下的二维格子复杂性,准确率就提升到了100%;而对13到19周岁少年的140张手腕骨X射线图片的骨龄测试识别实验,采用盒维数,二维格子复杂性和格子复杂性的特例——兰帕尔-齐夫复杂性(LZ复杂性)三项特征准确率同样达到了100%。事实上,单独采用简化二维格子复杂性作为唯一特征的识别准确率就达到71.75%,另外的指标如分形维数(盒维数)、细胞核面积、细胞核周长作为单独特征指标都只有55%左右的准确率。而如果将分形维数加入到前三项特征指标中,用四种特征指标进行识别,结果对系统的准确率没有影响。这说明二维格子复杂性提取的特征信息已经覆盖分形维数信息。
格子复杂性具体的算法举例如下:
对于符号序列S=10110111010001,首先令Q=1,这时Q只有一个符号,认为处在混沌状态,不做任何操作。继续令Q=10,这时还是没有规律,继续赋值,Q=101,此时我们可以发现符号序列Q由混沌序列进入了周期性迭代序列,那么我们可以推想接着Q应该为1010(认为是周期为二的迭代序列),而此时却发现原有符号序列S的第四个符号为‘1’,而非预期的‘0’,说明周期序列结束。再观察符号‘1011’可否由前面出现过的符号简单复制得到,如上例‘1011’明显不能由出现过的符号复制得到,因此划分出一个格子。接着‘011’(由于可由前面符号复制得到,不划分出格子),继续搜索得到‘01110’划出一个格子,‘10001’(可以看成是周期为一的迭代序列,直到出现了不可预期的符号‘1’为止)划分出一个格子。
在这个算法中,不管最后一个格子是否完整的,都认为是一个格子。上例序列S的结果为S=1011√01110√10001√,即格子复杂性LC=3。
如果不考虑混沌或周期性迭代规律,只依序检查序列S的子列是否可以由之前的符号串复制,则格子复杂性变成了其特例兰帕尔-齐夫复杂性(LZC)。格子复杂性的重要参数是细粒化指数。当细粒化指数为2时,上述二进制序列S转化为四进制序列后再进行计算,当细粒化指数为3时,S转化为8进制序列后在进行计算。细粒化指数增大后,格子复杂性和兰帕尔-齐夫复杂性的差距变大。
格子复杂性算法是适用于一维符号时间序列的复杂性度量算法,二维格子复杂性算法作为格子复杂性算法的扩展首先要解决的问题是如何将二维信号转化为一维信号,其次对于静态的彩色或灰度图片还要解决如何将图像符号化(粗粒化)并保留足够有效信息的问题。
对于癌细胞这样有一定聚合形状的图像,往往通过简化搜索就可以取得不错的效果,即通过由左到右和由上到下依次搜索图像的每一行像素及每一列像素,将图像转变成一维序列。但需要注意的是,上述简化算法得到的一维序列实际上信息不连贯,不适合进一步的细粒化操作。而利用回字形或弓字形搜索算法将图像转变为一维序列,给出了图像的连贯信息,很适合计算出一系列不同细粒化指数下的格子复杂性,得到一系列特征,在不同场合的应用环境下都可以有效提高识别率。
而对于骨骼X光照片等具有一定纹理结构的图片,通常采用希尔伯特曲线搜索算法效果更佳,因此通过希尔伯特曲线法将图像转换为一维序列。这样得到的一维序列同样适合细粒化操作。
定义连贯搜索算法,即每步搜索都只搜索相邻像素,所有像素被搜索一次的算法。希尔伯特曲线,弓字形算法曲线(参见图2),回字形算法曲线(参见图3)以及所有连贯搜索算法得到的序列都适用格子复杂性的细粒化操作,通过连贯搜索算法得到的一维序列就可以调整格子复杂性算法中的细粒化指数这个参数,使二维格子复杂性度量适合实际应用场合的各种复杂情况,同时通过不同的连贯搜索算法也可以得到不同的特征,满足不同的需求。
希尔伯特曲线是德国数学家Hilbert于1891年提出的,一种以不间断地分形曲线,遍历一个正方形中的所有点。如图1中:图a所示是希尔伯特曲线遍历2×2的点阵,图b、图c和图d分别遍历4×4、16×16和32×32的点阵。
希尔伯特曲线具有以下特点:I.它可以填充整个平面,但它有一个致命的缺点是这个平面必须是边长为2n的正方形。II.曲线处处连续而且不可导,具有无限可分性,自相似性。
希尔伯特扫描对图像区域进行了详细的描述,传统上对图像的扫描通常是从水平或垂直单方向进行的,而希尔伯特曲线同时对水平和垂直两个方向上的相邻信息进行扫描,其结果相当于综合考虑了图像的颜色、颜色分布、纹理和形状,得到的一维信号涵盖了图像中许多重要的视觉特征,是一种有效的搜索方式。
希尔伯特曲线矩阵生成算法,如图5所示
设:
其中,E代表相应阶数的单位矩阵。
通过一维序列计算格子复杂性,如图4所示,其包括以下步骤:
第一步:根据细胞的一般大小,选择16×16的希尔伯特曲线,得到希尔伯特矩阵Hilb;
第二步:提取细胞核灰度矩阵B,经过缩放得到一个新的16×16的灰度矩阵NewB;
第三步:用希尔伯特矩阵Hilb搜索灰度矩阵NewB,得到一维信号A;
第三步:以灰度矩阵的平均值为阈值,对一维信号A进行符号化;
第四步:对已符号化序列A,求格子复杂性。
参见图9,所述特征值还包括细胞核周长、细胞核面积或细胞核分形维数。特征值提取算法中对于癌细胞显微图像实际上只需要二维格子复杂性、细胞核周长、细胞核面积三种特征;而对用于骨龄测试的手腕骨图片,只需要分形盒维数、二维格子复杂性,二维兰帕尔-齐夫复杂性(格子复杂性的特例)三项指标。
对于静态的彩色或灰度图片还要解决如何将图像符号化(粗粒化)并保留足够有效信息的问题,关键是选择恰当的阈值分割图像并实现图像的二值化,及将图像转化为黑白二色图片,图像分割处理算法包括最佳阈值法、Otsu阈值分割法及HSI系统阈值分割法,如图6所示选择最适合图像分割处理算法。
如图7所示,所述最佳阈值法包括以下步骤:(1)首先将彩色图像灰度化;
(2)选择图像灰度的中值作为初始阈值To;
(3)利用阈值To把图像分割成两个区域——R1和R2,用下面的式子计算区域R1和R2的灰度值υ1和υ2:
其中n表示灰度相同的像素个数,L是灰度总数其值为256;
(5)重复(3),(4),直到|Ti+1-Ti<1|。
如图8所示,所述HSI系统阈值分割法包括以下步骤:(1)选取彩色图像,建立一个二维零矩阵B,通过RGB系统到HIS系统的转化,获得彩色图像中各点的H(Hue)、S(Saturation)、I(Intensity)值;(2)选取彩色待操作区域B0,通过RGB系统到HIS系统的转化,获得彩色待操作区域中各点的x_h,x_s,x_i;(3)确定x_h,x_s,x_i的值在
x_h*0.8<Hue<x_h*1.2;
x_s*0.3<Saturation<x_s*1.7;
x_i*0.5<Intensity<x_i*1.5;
范围内,并将与二维零矩阵B相对应的值取1并显示。
对这3个参数范围要慎重选择。若选择不当,可能会引入很多背景噪声,或者或丢失了很多有用的信息。因此,这种HSI系统分割算法是一种对彩色图像的半自动阈值分割算法,它不像上述两种阈值分割算法那样,可以由计算机自动设置阈值,而是通过人为的,明智的选择阈值。
如图10所示,通过向量机训练模型进行测试包括以下步骤:①读取图像;②从读取的图像中分别获得训练图像和测速图像;③分别对训练图像和测试图像进行图像预处理和特征值提取操作;④将训练图像中提取的特征值通过SVM训练输入到训练模版;⑤将步骤④获得的训练模板与测试图像中获得的特征值进行测试,获得测试结果。在实际应用场合,选定适当算法和参数并获得训练模板之后,只需要执行测试流程。计算时间对于现代的计算机而言是微不足道的。
Claims (8)
1.一种基于二维格子复杂性度量的医学图像特征提取和识别系统,
其特征在于:其包括以下步骤:
一、读取图像;
二、对图像进行预处理,包括图像灰度化;
三、对步骤二处理后的图像通过图像分割处理算法实现图像的二值化操作;
四、将步骤三处理后的图片通过连贯搜索算法转换为一维序列,进行二维格子复杂性提取操作;
五、通过向量机训练模型进行测试。
2.根据权利要求1所述的基于二维格子复杂性度量的医学图像特征提取和识别系统,其特征在于:当对癌细胞检测时,进行步骤四之前对图像进行细胞周长和细胞面积的提取。
3.根据权利要求1所述的基于二维格子复杂性度量的医学图像特征提取和识别系统,其特征在于:所述连贯搜索算法包括希尔伯特曲线、回字形算法、弓字形算法及其变形组合。
4.根据权利要求3所述的基于二维格子复杂性度量的医学图像特征提取和识别系统,其特征在于:通过希尔伯特曲线转换的一维序列计算格子复杂性,其包括以下步骤:
第一步:根据细胞的大小,选择希尔伯特曲线,得到希尔伯特矩阵Hilb;
第二步:提取细胞核灰度矩阵B,经过缩放得到一个新的灰度矩阵NewB;
第三步:用希尔伯特矩阵Hilb搜索灰度矩阵NewB,得到一维信号A;
第三步:以灰度矩阵的平均值为阈值,对一维信号A进行符号化;
第四步:对已符号化序列A,求格子复杂性。
5.根据权利要求1所述的基于二维格子复杂性度量的医学图像特征提取和识别系统,其特征在于:所述步骤三中图像分割处理算法包括最佳阈值法、Otsu阈值分割法及HSI系统阈值分割法。
6.根据权利要求5所述的基于二维格子复杂性度量的医学图像特征提取和识别系统,其特征在于:当步骤三采用HSI系统阈值分割法时,步骤二还包括RGB系统到HIS系统的转化操作。
8.根据权利要求1所述的基于二维格子复杂性度量的医学图像特征提取和识别系统,其特征在于:所述步骤七包括以下步骤:①读取图像;②从读取的图像中分别获得训练图像和测速图像;③分别对训练图像和测试图像进行图像预处理和特征值提取操作;④将训练图像中提取的特征值通过SVM训练输入到训练模版;⑤将步骤④获得的训练模板与测试图像中获得的特征值进行测试,获得测试结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310753643.9A CN103778431B (zh) | 2013-12-30 | 2013-12-30 | 基于二维格子复杂性度量的医学图像特征提取和识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310753643.9A CN103778431B (zh) | 2013-12-30 | 2013-12-30 | 基于二维格子复杂性度量的医学图像特征提取和识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103778431A true CN103778431A (zh) | 2014-05-07 |
CN103778431B CN103778431B (zh) | 2017-01-11 |
Family
ID=50570644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310753643.9A Expired - Fee Related CN103778431B (zh) | 2013-12-30 | 2013-12-30 | 基于二维格子复杂性度量的医学图像特征提取和识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103778431B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104198355A (zh) * | 2014-07-16 | 2014-12-10 | 电子科技大学 | 一种粪便中红细胞自动检测方法 |
CN107358240A (zh) * | 2017-06-08 | 2017-11-17 | 厦门科拓通讯技术股份有限公司 | 一种通过特征模板构建特征池的物体检测方法和系统 |
CN112638238A (zh) * | 2018-09-04 | 2021-04-09 | 伯尼维斯公司 | 骨龄评估装置、方法以及用于记录程序的记录介质 |
CN115294342A (zh) * | 2022-09-26 | 2022-11-04 | 荣耀终端有限公司 | 图像处理方法及相关装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916443A (zh) * | 2010-08-19 | 2010-12-15 | 中国科学院深圳先进技术研究院 | Ct图像的处理方法及系统 |
US20120220875A1 (en) * | 2010-04-20 | 2012-08-30 | Suri Jasjit S | Mobile Architecture Using Cloud for Hashimoto's Thyroiditis Disease Classification |
-
2013
- 2013-12-30 CN CN201310753643.9A patent/CN103778431B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120220875A1 (en) * | 2010-04-20 | 2012-08-30 | Suri Jasjit S | Mobile Architecture Using Cloud for Hashimoto's Thyroiditis Disease Classification |
CN101916443A (zh) * | 2010-08-19 | 2010-12-15 | 中国科学院深圳先进技术研究院 | Ct图像的处理方法及系统 |
Non-Patent Citations (6)
Title |
---|
ABRAHAM LEMPEL ET AL.: "On the Complexity of Finite Sequences", 《IEEE TRANSACTIONS ON INFORMATION THEORY》 * |
刘伟: "图像检索中若干问题的研究", 《中国博士学位论文全文数据库 医药卫生科技辑》 * |
初秀民等: "高速公路场景图像的二值化及交通标志定位检测方法", 《中国公路学报》 * |
籍芳: "一种基于小波变换和希尔伯特曲线的图像检索方法", 《中国硕士学位论文全文数据库 信息科技辑》 * |
肖高超: "改进型粒子群优化算法及其在图像分割中的应用", 《中国硕士学位论文全文数据库 信息科技辑》 * |
蔡华民: "基于图像处理的心音图特征提取技术的研究", 《中国硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104198355A (zh) * | 2014-07-16 | 2014-12-10 | 电子科技大学 | 一种粪便中红细胞自动检测方法 |
CN107358240A (zh) * | 2017-06-08 | 2017-11-17 | 厦门科拓通讯技术股份有限公司 | 一种通过特征模板构建特征池的物体检测方法和系统 |
CN112638238A (zh) * | 2018-09-04 | 2021-04-09 | 伯尼维斯公司 | 骨龄评估装置、方法以及用于记录程序的记录介质 |
CN115294342A (zh) * | 2022-09-26 | 2022-11-04 | 荣耀终端有限公司 | 图像处理方法及相关装置 |
CN115294342B (zh) * | 2022-09-26 | 2023-02-28 | 荣耀终端有限公司 | 图像处理方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103778431B (zh) | 2017-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121991B (zh) | 一种基于边缘候选区域提取的深度学习舰船目标检测方法 | |
CN104346617B (zh) | 一种基于滑动窗口和深度结构提取特征的细胞检测方法 | |
CN106056155B (zh) | 基于边界信息融合的超像素分割方法 | |
CN103049763B (zh) | 一种基于上下文约束的目标识别方法 | |
CN103793702B (zh) | 基于协同尺度学习的行人重识别方法 | |
CN108564085B (zh) | 一种自动读取指针式仪表读数的方法 | |
CN108960245A (zh) | 轮胎模具字符的检测与识别方法、装置、设备及存储介质 | |
CN107346420A (zh) | 一种基于深度学习的自然场景下文字检测定位方法 | |
CN105893925A (zh) | 基于肤色的人手检测方法及装置 | |
CN105930815A (zh) | 一种水下生物检测方法和系统 | |
Casanova et al. | Texture analysis using fractal descriptors estimated by the mutual interference of color channels | |
CN105574527A (zh) | 一种基于局部特征学习的快速物体检测方法 | |
CN105095892A (zh) | 基于图像处理的学生文档管理系统 | |
CN104123554B (zh) | 基于mmtd的sift图像特征提取方法 | |
CN105809175A (zh) | 一种基于支持向量机算法的脑水肿分割方法及系统 | |
Sun et al. | Object-oriented land cover classification using HJ-1 remote sensing imagery | |
CN103778431B (zh) | 基于二维格子复杂性度量的医学图像特征提取和识别方法 | |
CN107066972A (zh) | 基于多通道极值区域的自然场景文本检测方法 | |
Kalkan et al. | Comparison of support vector machine and object based classification methods for coastline detection | |
CN102147867A (zh) | 一种基于主体的国画图像和书法图像的识别方法 | |
CN109165658A (zh) | 一种基于Faster-RCNN的强负样本水下目标检测方法 | |
CN108280469A (zh) | 一种基于稀疏表示的超市商品图像识别方法 | |
CN115861409B (zh) | 大豆叶面积测算方法、系统、计算机设备及存储介质 | |
CN111667491A (zh) | 基于深度对抗网络的带边界标注信息乳腺肿块图生成方法 | |
CN103903015B (zh) | 一种细胞有丝分裂检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170111 Termination date: 20211230 |