CN108710915A - 基于多核学习的多特征融合胃镜图像处理方法 - Google Patents

基于多核学习的多特征融合胃镜图像处理方法 Download PDF

Info

Publication number
CN108710915A
CN108710915A CN201810495273.6A CN201810495273A CN108710915A CN 108710915 A CN108710915 A CN 108710915A CN 201810495273 A CN201810495273 A CN 201810495273A CN 108710915 A CN108710915 A CN 108710915A
Authority
CN
China
Prior art keywords
pixel
value
operator
kernel function
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810495273.6A
Other languages
English (en)
Other versions
CN108710915B (zh
Inventor
范雯娟
刘竞男
丁帅
裴军
杨善林
刘同柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201810495273.6A priority Critical patent/CN108710915B/zh
Publication of CN108710915A publication Critical patent/CN108710915A/zh
Application granted granted Critical
Publication of CN108710915B publication Critical patent/CN108710915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于多核学习的多特征融合胃镜图像处理方法,上述方法综合胃镜图像的颜色特征、纹理特征和关键点特征建立图像分类核函数,能够更加准确、全面地描述胃镜图像特征。上述方法将混合核支持向量机算法运用于胃镜图像处理,将三种异构特征合理融合,提高胃镜图像处理的泛化能力和鲁棒性能。上述方法提取胃镜图像颜色特征时根据胃镜图像颜色分布特征将H、S、V分量进行非等间隔的量化,使提取特征能更准确地描述胃镜图像。本发明实施例的方法能够精确的对复杂图像进行分类,有利于提高了医务工作人员的诊疗效率。

Description

基于多核学习的多特征融合胃镜图像处理方法
技术领域
本发明涉及图像处理以及医用领域,具体涉及一种基于多核学习的多特征融合胃镜图像处理方法。
背景技术
内窥技术在医学中得到了广泛的应用,例如利用胃镜检查胃部疾病。当前的内窥技术大部分只能采集相应部位的图像,无法实现对图像的有效处理。例如,现有技术中提供了一种基于关键点监测的NBI胃镜图像处理方法,该方法对经过预处理后的胃镜图像提取关键点,然后提取部分NBI胃镜图像作为训练集,将训练集中所有关键点组成特征袋,并使用聚类算法生成视觉词典。之后根据得到的视觉词典对整幅NBI胃镜图像进行关键点归类统计,得到整幅NBI图像的全局特征。最后采用分类器对整幅NBI胃镜图像的全局特征进行识别,从而完成NBI胃镜图像的识别过程。上述图像的处理方法基于关键点对图像分类,存在分类特征单一的缺陷,造成图像全局特征的丢失。另外,上述图像处理方法由于泛化能力和鲁棒性不够,无法对复杂图像进行准确的分类。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于多核学习的多特征融合胃镜图像处理方法,克服了现有技术中无法对复杂图像进行精确分类的缺陷。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
提供了一种基于多核学习的多特征融合胃镜图像处理方法,所述方法包括如下步骤:
获取胃镜图像;
将所述胃镜图像中每个像素点的色调H、饱和度S和明度V进行量化,根据每个像素点量化后的H值、S值和V值确定每个像素点的颜色矢量,并根据每个像素点的颜色矢量建立颜色直方图,所述颜色直方图的横坐标为颜色矢量,纵坐标为每个颜色矢量对应的像素点的个数;
获取所述胃镜图像的每个像素点,得到多个中心像素点,以每个所述中心像素点为圆心,在预定半径的圆周上对称获取N个像素点,得到N个纹理算子像素点;计算每个所述纹理算子像素点的灰度值与对应的所述中心像素点的灰度值的差值,得到每个纹理算子像素点的中心灰度差值;根据所有纹理算子像素点的中心灰度差值确定对应的所述中心像素点的纹理描述算子,并根据所有中心像素点的纹理描述算子建立纹理特征直方图;所述纹理特征直方图的横坐标为纹理描述算子,纵坐标为每个纹理描述算子对应的像素点的个数;
将所述胃镜图像分割为多个预定大小的子图像,确定每个所述子图像的尺度不变特征算子,利用所述尺度不变特征算子进行聚类运算,得到预定数量的特征词汇,并将每个所述尺度不变特征算子分别映射到一个所述特征词汇上,根据所述特征词汇对应的尺度不变特征算子,建立尺度不变特征直方图,所述尺度不变特征直方图的横坐标为特征词汇,纵坐标为每个所述特征词汇对应的尺度不变特征算子的数量;
利用多项式核函数、高斯径向基核函数和直方图相交核核函数建立图像分类核函数;其中,所述图像分类核函数的参数包括多项式核函数的阶数、高斯径向基核宽度、多项式核函数的权重系数、高斯径向基核函数的权重系数、直方图相交核核函数的权重系数以及惩罚系数;
根据预定步长、所述多项式核函数的阶数的取值范围、高斯径向基核宽度的取值范围、多项式核函数的权重系数的取值范围、高斯径向基核函数的权重系数的取值范围、直方图相交核核函数的权重系数的取值范围以及惩罚系数的取值范围,确定多个参数取值组,每个所述参数取值组包括多项式核函数的阶数的取值、高斯径向基核宽度的取值、多项式核函数的权重系数的取值、高斯径向基核函数的权重系数的取值、直方图相交核核函数的权重系数的取值以及惩罚系数的取值;
将所述图像分类核函数的参数取任意一个所述参数取值组,将归一化处理后的颜色直方图、纹理特征直方图和尺度不变特征直方图作为所述图像分类核函数的训练数据,将分类标签作为所述图像分类核函数的分类标准,对测试样本进行分类;其中,所述分类标签包括特征参数以及特征参数对应的类别;
选取对所述测试样本分类结果最好的所述参数取值组作为所述图像分类核函数的参数的取值,得到图像分类核函数模型。
进一步地,所述方法还包括如下步骤:
获取待检测胃镜图像,并将所述待检测胃镜图像作为输入,利用所述图像分类核函数模型对所述待检测胃镜图像进行分类。
进一步地,所述将所述胃镜图像中每个像素点的色调H、饱和度S和明度V进行量化,具体包括如下步骤:
根据每个像素点的色调的值确定该像素点所属的预制色调范围,并根据所述预制色调范围确定该像素点的色调量化值,其中,所述预制色调范围是预先设定的,并且每个所述预制色调范围对应一个色调量化值;
根据每个像素点的饱和度的值确定该像素点所属的预制饱和度范围,并根据所述预制饱和度范围确定该像素点的饱和度量化值,其中,所述预制饱和度范围是预先设置的,并且每个所述预制饱和度范围对应一个饱和度量化值;
根据像素点的明度的值确定该像素点的所属的预制明度范围,并根据所述预制明度范围确定该像素点的明度量化值,其中,所述预制明度范围是预先设置的,并且每个所述预制明度范围对应一个明度量化值。
进一步地,所述根据每个像素点量化后的H值、S值和V值确定每个像素点的颜色矢量,具体包括如下步骤:
利用如下公式计算每个像素点的颜色矢量:
Q=16H+4S+V
式中,Q表示像素点的颜色矢量,H表示像素点的色调量化值,S表示像素点的饱和度量化值,V表示像素点的明度量化值。
进一步地,所述根据所有纹理算子像素点的中心灰度差值确定对应的所述中心像素点理描述算子,具体包括如下步骤:
利用如下公式确定所述纹理描述算子:
式中,LBP(C)表示中心像素点C的纹理描述算子,n表示纹理算子像素点的数量,gn表示第n个纹理算子像素点的中心灰度差值的量化值。
进一步地,所述根据所有纹理算子像素点的中心灰度差值确定对应的所述中心像素点的纹理描述算子,还包括如下步骤:
利用如下公式确定最终的所述纹理描述算子:
LBP(C)ri=min{ROR(LBP(C),i)1≤i≤N}.
式中,LBP(C)ri表示最终的所述纹理描述算子,ROR(LBP(C),i)表示将LBP(C)的二进制码向右圆周平移i位。
进一步地,所述利用所述尺度不变特征算子进行聚类运算,包括:
采用K-means聚类算法,将所述尺度不变特征算子进行聚类运算。
进一步地,所述图像分类核函数为:
k(xi,x)=p1kpoly(xi,x)+p2krbf(xi,x)+p3kinter(xi,x)
式中,k表示所述图像分类核函数,xi表示支持向量,x表示输入,p1表示多项式核函数的权重系数,p2表示高斯径向基核函数的权重系数,p3表示直方图相交核核函数的权重系数,kpoly表示多项式核函数,krbf表示高斯径向基核函数,kinter表示直方图相交核核函数。
进一步地,所述方法还包括如下步骤:
对所述颜色直方图、纹理特征直方图和尺度不变特征直方图进行归一化处理;
确定所述多项式核函数的阶数的取值范围、高斯径向基核宽度的取值范围、多项式核函数的权重系数的取值范围、高斯径向基核函数的权重系数的取值范围、直方图相交核核函数的权重系数的取值范围以及惩罚系数的取值范围。
进一步地,所述将每个所述尺度不变特征算子分别映射到一个所述特征词汇上,包括:
利用关键点描述子匹配算法,将每个所述尺度不变特征算子分别映射到一个所述特征词汇上。
(三)有益效果
本发明实施例提供了一种基于多核学习的多特征融合胃镜图像处理方法,具备以下有益效果:
本发明实施例综合胃镜图像的颜色特征、纹理特征和关键点特征建立图像分类核函数,能够更加准确、全面地描述胃镜图像特征。
本发明实施例将混合核支持向量机算法运用于胃镜图像处理,将三种异构特征合理融合,提高胃镜图像处理的泛化能力和鲁棒性能。
本发明实施例提取胃镜图像颜色特征时根据胃镜图像颜色分布特征将H、S、V分量进行非等间隔的量化,使提取特征能更准确地描述胃镜图像。
综上,本发明实施例的方法能够精确的对复杂图像进行分类,有利于提高了医务工作人员的诊疗效率,降低漏诊误诊的可能,有利于提高基层医务工作人员的行医质量,有利于提高基层诊疗水平。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例的基于多核学习的多特征融合胃镜图像处理方法的流程图;
图2是本发明再一实施例的基于多核学习的多特征融合胃镜图像处理方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当说明的是本发明实施例的配置人工智能芯片的医用内窥镜系统中的部件可以但不限于用于内窥镜,可以用于其他任何图像处置装置。本发明的以下实施例以采用内窥镜作为例进行说明。
如图1所示,在一个实施例中,基于多核学习的多特征融合胃镜图像处理方法包括如下步骤:
100、获取胃镜图像;
110、将所述胃镜图像中每个素点的色调H、饱和度S和明度V进行量化,根据每个像素点量化后的H值、S值和V值确定每个像素点的颜色矢量,并根据每个像素点的颜色矢量建立颜色直方图,所述颜色直方图的横坐标为颜色矢量,纵坐标为每个颜色矢量对应的像素点的个数;
此步骤中,将所述胃镜图像中每个像素点的色调H、饱和度S和明度V进行量化包括如下子步骤:
1101、根据像素点的色调的值确定该像素点所属的预制色调范围,并根据所述预制色调范围确定该像素点的色调量化值,其中,所述预制色调范围是预先设定的,并且每个所述预制色调范围对应一个色调量化值;
1102、根据像素点的饱和度的值确定该像素点所属的预制饱和度范围,并根据所述预制饱和度范围确定该像素点的饱和度量化值,其中,所述预制饱和度范围是预先设置的,并且每个所述预制饱和度范围对应一个饱和度量化值;
1103、根据像素点的明度的值确定该像素点所属的预制明度范围,并根据所述预制明度范围确定该像素点的明度量化值,其中,所述预制明度范围是预先设置的,并且每个所述预制明度范围对应一个明度量化值。
此步骤中,所述根据每个像素点量化后的H值、S值和V值确定每个像素点的颜色矢量,具体包括如下子步骤:
1104、利用如下公式计算每个像素点的颜色矢量:
Q=16H+4S+V
式中,Q表示像素点的颜色矢量,H表示像素点的色调量化值,S表示像素点的饱和度量化值,V表示像素点的明度量化值。
此步骤中,对于图像a,它的HSV颜色直方图特征可以表示为:Ha={y0,y1,y2,…y191},其中y0表示Q为0时对应的像素点的个数。
120、获取所述胃镜图像的每个像素点,得到多个中心像素点,以每个所述中心像素点为圆心,在预定半径的圆周上对称获取N个像素点,得到N个纹理算子像素点;计算每个所述纹理算子像素点的灰度值与对应的所述中心像素点的灰度值的差值,得到每个纹理算子像素点的中心灰度差值;根据所有纹理算子像素点的中心灰度差值确定对应的所述中心像素点的纹理描述算子,并根据所有中心像素点的纹理描述算子建立纹理特征直方图;所述纹理特征直方图的横坐标为纹理描述算子,纵坐标为每个纹理描述算子对应的像素点的个数;
此步骤中,N取值为自然数,并且是偶数。
此步骤中,利用如下公式计算每个纹理算子像素点的中心灰度差值:
gn=pn-p0(1≤n≤N)
式中,gn表示第n个纹理算子像素点的中心灰度差值,pn表示第n个纹理算子像素点的灰度值量化值,p0表示中心像素点的灰度值。在得到个纹理算子像素点的中心灰度差值之后,需要进行量化处理,具体地,若gn大于或等于零,则更新gn值为1,否则更新gn值为0;
此步骤中,所述根据所有纹理算子像素点的中心灰度差值确定对应的所述中心像素点的纹理描述算子,具体包括如下子步骤:
1201、利用如下公式确定所述纹理描述算子:
式中,LBP(C)表示中心像素点C的纹理描述算子,n表示纹理算子像素点的数量,gn表示第n个纹理算子像素点的中心灰度差值的量化值。
1202、利用如下公式确定最终的所述纹理描述算子:
LBP(C)ri=min{ROR(LBP(C),i)1≤i≤N}.
式中,LBP(C)ri表示最终的所述纹理描述算子,ROR(LBP(C),i)表示将LBP(C)的二进制码向右圆周平移i位。
130、将所述胃镜图像分割为多个预定大小的子图像,确定每个所述子图像的尺度不变特征算子,利用所述尺度不变特征算子进行聚类运算,得到预定数量的特征词汇,并将每个所述尺度不变特征算子分别映射到一个所述特征词汇上,根据所述特征词汇对应的尺度不变特征算子,建立尺度不变特征直方图,所述尺度不变特征直方图的横坐标为特征词汇,纵坐标为每个所述特征词汇对应的尺度不变特征算子的数量;
此步骤中,利用所述尺度不变特征算子进行聚类运算,具体包括采用K-means聚类算法,将所述尺度不变特征算子进行聚类运算。
140、利用多项式核函数、高斯径向基核函数和直方图相交核核函数建立图像分类核函数;其中,所述图像分类核函数的参数包括多项式核函数的阶数、高斯径向基核宽度、多项式核函数的权重系数、高斯径向基核函数的权重系数、直方图相交核核函数的权重系数以及惩罚系数;
此步骤中,所述图像分类核函数为:
k(xi,x)=p1kpoly(xi,x)+p2krbf(xi,x)+p3kinter(xi,x)
式中,k表示所述图像分类核函数,xi表示支持向量,x表示输入,p1表示多项式核函数的权重系数,p2表示高斯径向基核函数的权重系数,p3表示直方图相交核核函数的权重系数,kpoly表示多项式核函数,krbf表示高斯径向基核函数,kinter表示直方图相交核核函数。
150、根据预定步长、所述多项式核函数的阶数的取值范围、高斯径向基核宽度的取值范围、多项式核函数的权重系数的取值范围、高斯径向基核函数的权重系数的取值范围、直方图相交核核函数的权重系数的取值范围以及惩罚系数的取值范围,确定多个参数取值组,每个所述参数取值组包括多项式核函数的阶数的取值、高斯径向基核宽度的取值、多项式核函数的权重系数的取值、高斯径向基核函数的权重系数的取值、直方图相交核核函数的权重系数的取值以及惩罚系数的取值;
此步骤中,预定步长可以为-1、1、0.1、0.05等。
此步骤中,高斯径向基核宽度的取值范围可以为:2-10~2-15,惩罚系数的取值范围可以为:2-10~2-15,多项式核函数的权重系数的取值范围、高斯径向基核函数的权重系数的取值范围或直方图相交核核函数的权重系数的取值范围可以为0~1,多项式核函数的阶数的取值范围可以为:2~5。
160、将所述图像分类核函数的参数取任意一个所述参数取值组,将归一化处理后的颜色直方图、纹理特征直方图和尺度不变特征直方图作为所述图像分类核函数的训练数据,将分类标签作为所述图像分类核函数的分类标准,对测试样本进行分类;其中,所述分类标签包括特征参数以及特征参数对应的类别;
170、选取对所述测试样本分类结果最好的所述参数取值组作为所述图像分类核函数的参数的取值,得到图像分类核函数模型。
本实施例综合胃镜图像的颜色特征、纹理特征和关键点特征建立图像分类核函数,能够更加准确、全面地描述胃镜图像特征。本实施例将混合核支持向量机算法运用于胃镜图像处理,将三种异构特征合理融合,提高胃镜图像处理的泛化能力和鲁棒性能。本实施例提取胃镜图像颜色特征时根据胃镜图像颜色分布特征将H、S、V分量进行非等间隔的量化,使提取特征能更准确地描述胃镜图像。
综上,本实施例的方法能够精确的对复杂图像进行分类,有利于提高了医务工作人员的诊疗效率,降低漏诊误诊的可能,有利于提高基层医务工作人员的行医质量,有利于提高基层诊疗水平。
在一个实施例中,基于多核学习的多特征融合胃镜图像处理方法还包括如下步骤:
180、获取待检测胃镜图像,并将所述待检测胃镜图像作为输入,利用所述图像分类核函数模型对所述待检测胃镜图像进行分类。
在一个实施例中,基于多核学习的多特征融合胃镜图像处理方法还包括如下步骤,所述方法还包括如下步骤:
对所述颜色直方图、纹理特征直方图和尺度不变特征直方图进行归一化处理;
确定所述多项式核函数的阶数的取值范围、高斯径向基核宽度的取值范围、多项式核函数的权重系数的取值范围、高斯径向基核函数的权重系数的取值范围、直方图相交核核函数的权重系数的取值范围以及惩罚系数的取值范围。
在一个实施例中,如图2所示,基于多核学习的多特征融合胃镜图像处理方法还包括如下步骤:
步骤一、获取并载入胃镜图像;
步骤二、提取胃镜图像的颜色直方图特征、LBP特征(即纹理特征直方图特征)以及SIFT特征(即尺度不变特征直方图),具体包括如下步骤:
(1)、颜色直方图特征提取。将胃镜图像转化到HSV颜色空间,由于胃镜图像主要以红色为主,经过空间转化后,色调空间H主要分布在[0,60]和[320,360]之间,而饱和度空间S和亮度空间V分布相对均匀。根据上述胃镜图像颜色分布特征,采用如下公式将H、S、V 3个分量进行非等间隔的量化:
按照上述公式实现了对像素点的颜色的量化,之后利用如下公式计算每个像素点的颜色特征矢量:
Q=16H+4S+V
对于图像a,它的HSV颜色直方图特征可以表示为:
Ha={y0,y1,y2,…y191}
其中,yn表示表示HSV每一级别的值。
(2)LBP特征提取。以像素点PC为中心,在半径为3的圆周上对称位置取8个像素点pn(1≤n≤8)来计算中心像素点的LBP值,具体地,计算圆形区域其他八个像素点和中心像素点的灰度值之差:
gn=pn-p0(1≤n≤N)
若gn≥0,则令gn=1,否则为0。像素点的LBP值如下计算:
为获得旋转不变的LBP特征,进一步计算:
LBP(C)ri=min{ROR(LBP(C),i)1≤i≤N}.
其中,ROR(LBP(C),i)表示将LBP(C)的二进制码向右圆周平移i位,取最小值为最终的LBP值。通过上述方法,以半径为3的圆为模板,遍历整个胃镜图像,计算胃镜图像的纹理特征直方图,即不同的LBP值出现的频率,得到胃镜图像的LBP纹理特征向量。
(3)SIFT特征包提取。将胃镜图像分成若干个像素点为16*16的小块,每一小块得到sift特征描述子,然后采用K-means聚类算法将sift特征描述子聚类得到特征词典,该特征词典包括预定数量的特征词汇,例如聚类数目k=40,得到40个特征词汇。之后将图像中的每个小块通过关键点描述子匹配算法,映射到特征词典的每个视觉词汇中,统计直方图。每幅图像提取一个40维的SIFT特征向量。
步骤三、选取核函数。选取多项式核函数、高斯径向基核函数以及直方图相交核函数建立新的混合核函数(即图像分类核函数)。其中多项式核函数具有良好的泛化能力,但是其局部性较差,且多项式核函数的映射结果与阶数q有很大关系,q越大映射的维数越高,计算量越大,q过小会降低学习精度。高斯径向基核函数中学习能力较强,但是其全局性较差,不具有很好的泛化能力,其泛化能力随着核宽度σ的增大而减弱。直方图相交核函数的优点是能对直方图描述的图像正确分类且不用选定参数。
图像分类核函数构造如下:
k(xi,x)=p1kpoly(xi,x)+p2krbf(xi,x)+p3kinter(xi,x)
其中,k是融合后的核函数,即图像分类核函数,p1、p2、p3是融合权值,kpoly为多项式核函数,krbf是高斯径向基核函数,kinter是直方图相交核,该图像分类核函数需要考虑的参数有4种:多项式核函数的阶数q,高斯径向基核宽度σ,权重系数p,以及惩罚系数C。
步骤四、模型训练。
支持向量机的分类原理是寻找最大间隔的超平面来划分样本,这个问题可通过以下优化问题实现:
ξi≥0,i=1,2,…,N
其中,w定义了最优分类超平面,Φ(xi)为将原始特征向量映射到更高维空间的特征向量,b为位移向,表示超平面和原点之间的距离,ξi为正松弛变量。C为正则化常数,xi(1,2,…,N)是特征向量。将此优化问题对偶化,再利用KKT条件求解,得出分类决策函数为:
其中,xi(1,2,…,N)是原始特征向量,ai*(1,2,…,N)是最佳拉格朗日乘子,b*是最优位移向,K(xi,x)为核函数,yi(1,2,…,N)为类别标签。
用混合核函数(即图像分类核函数)来取代单核核函数构造支持向量机分类模型,此时分类决策函数为:
本发明中,若f(x)大于等于0,则表示胃镜图像为+1类,若f(x)小于0,则表示胃镜图像为-1类。
将训练集中归一化处理后的颜色直方图、纹理特征直方图和尺度不变特征直方图作为训练数据和对应的胃镜图像标签(即分类标签)一同输入svm分类器(即图像分类核函数模)进行训练,用训练模型对测试集进行分类,
以此确定混合核函数的具体形式,本阶段采用了交叉验证和网格搜索方法。具体地:
(1)设定参数σ,C,q和p值的范围和搜索步长,这里设置σ=2-10~2-15,步长为-1,C=2-10~2-15,步长为1,q=2~5,步长为0.1,p=0~1,步长为0.05。外部使用五层嵌套循环,依次使p1、p2、q、σ、C在各自的网格步进。其中,根据p1、p2,利用公式p1+p2+p3=1能够确定p3的值.
(2)将用于训练的胃镜图像数据划分成10个大小相同的子集,轮流选任意九个子集作为训练集,以当前的σ、C、q、p值进行模型训练,利用训练模型对剩下的一个子集进行预测,以十次结果的预测准确率的平均值作为当前参数组合下模型的评估值,最后得出不同参数任意取值组合下模型评估值最高的最终参数寻优结果及检测结果。
步骤五、胃镜图像分类
输入要分类的胃镜图像,通过训练得到的多核支持向量机模型(即图像分类核函数模型),进行胃镜图像分类。
应当说明的是,本发明以上实施例的图像处理方法不仅适用于处理胃镜图像,还可以用于其他任何图像的处理。在处理其它图像的过程中,可以利用其他图像建立图像分类核函数模型,之后利用建立的图像分类核函数模型对其他图像进行分类。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于多核学习的多特征融合胃镜图像处理方法,其特征在于,所述方法包括如下步骤:
获取胃镜图像;
将所述胃镜图像中每个像素点的色调H、饱和度S和明度V进行量化,根据每个像素点量化后的H值、S值和V值确定每个像素点的颜色矢量,并根据每个像素点的颜色矢量建立颜色直方图,所述颜色直方图的横坐标为颜色矢量,纵坐标为每个颜色矢量对应的像素点的个数;
获取所述胃镜图像的每个像素点,得到多个中心像素点,以每个所述中心像素点为圆心,在预定半径的圆周上对称获取N个像素点,得到N个纹理算子像素点;计算每个所述纹理算子像素点的灰度值与对应的所述中心像素点的灰度值的差值,得到每个纹理算子像素点的中心灰度差值;根据所有纹理算子像素点的中心灰度差值确定对应的所述中心像素点的纹理描述算子,并根据所有中心像素点的纹理描述算子建立纹理特征直方图;所述纹理特征直方图的横坐标为纹理描述算子,纵坐标为每个纹理描述算子对应的像素点的个数;
将所述胃镜图像分割为多个预定大小的子图像,确定每个所述子图像的尺度不变特征算子,利用所述尺度不变特征算子进行聚类运算,得到预定数量的特征词汇,并将每个所述尺度不变特征算子分别映射到一个所述特征词汇上,根据所述特征词汇对应的尺度不变特征算子,建立尺度不变特征直方图,所述尺度不变特征直方图的横坐标为特征词汇,纵坐标为每个所述特征词汇对应的尺度不变特征算子的数量;
利用多项式核函数、高斯径向基核函数和直方图相交核核函数建立图像分类核函数;其中,所述图像分类核函数的参数包括多项式核函数的阶数、高斯径向基核宽度、多项式核函数的权重系数、高斯径向基核函数的权重系数、直方图相交核核函数的权重系数以及惩罚系数;
根据预定步长、所述多项式核函数的阶数的取值范围、高斯径向基核宽度的取值范围、多项式核函数的权重系数的取值范围、高斯径向基核函数的权重系数的取值范围、直方图相交核核函数的权重系数的取值范围以及惩罚系数的取值范围,确定多个参数取值组,每个所述参数取值组包括多项式核函数的阶数的取值、高斯径向基核宽度的取值、多项式核函数的权重系数的取值、高斯径向基核函数的权重系数的取值、直方图相交核核函数的权重系数的取值以及惩罚系数的取值;
将所述图像分类核函数的参数取任意一个所述参数取值组,将归一化处理后的颜色直方图、纹理特征直方图和尺度不变特征直方图作为所述图像分类核函数的训练数据,将分类标签作为所述图像分类核函数的分类标准,对测试样本进行分类;其中,所述分类标签包括特征参数以及特征参数对应的类别;
选取对所述测试样本分类结果最好的所述参数取值组作为所述图像分类核函数的参数的取值,得到图像分类核函数模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括如下步骤:
获取待检测胃镜图像,并将所述待检测胃镜图像作为输入,利用所述图像分类核函数模型对所述待检测胃镜图像进行分类。
3.根据权利要求1所述的方法,其特征在于,所述将所述胃镜图像中每个像素点的色调H、饱和度S和明度V进行量化,具体包括如下步骤:
根据像素点的色调的值确定该像素点所属的预制色调范围,并根据所述预制色调范围确定该像素点的色调量化值,其中,所述预制色调范围是预先设定的,并且每个所述预制色调范围对应一个色调量化值;
根据像素点的饱和度的值确定该像素点所属的预制饱和度范围,并根据所述预制饱和度范围确定该像素点的饱和度量化值,其中,所述预制饱和度范围是预先设置的,并且每个所述预制饱和度范围对应一个饱和度量化值;
根据像素点的明度的值确定该像素点的所属的预制明度范围,并根据所述预制明度范围确定该像素点的明度量化值,其中,所述预制明度范围是预先设置的,并且每个所述预制明度范围对应一个明度量化值。
4.根据权利要求3所述的方法,其特征在于,所述根据每个像素点量化后的H值、S值和V值确定每个像素点的颜色矢量,具体包括如下步骤:
利用如下公式计算每个像素点的颜色矢量:
Q=16H+4S+V
式中,Q表示像素点的颜色矢量,H表示像素点的色调量化值,S表示像素点的饱和度量化值,V表示像素点的明度量化值。
5.根据权利要求1所述的方法,其特征在于,所述根据所有纹理算子像素点的中心灰度差值确定对应的所述中心像素点理描述算子,具体包括如下步骤:
利用如下公式确定所述纹理描述算子:
式中,LBP(C)表示中心像素点C的纹理描述算子,n表示纹理算子像素点的数量,gn表示第n个纹理算子像素点的中心灰度差值的量化值。
6.根据权利要求5所述的方法,其特征在于,所述根据所有纹理算子像素点的中心灰度差值确定对应的所述中心像素点的纹理描述算子,还包括如下步骤:
利用如下公式确定最终的所述纹理描述算子:
LBP(C)ri=min{ROR(LBP(C),i)1≤i≤N}
式中,LBP(C)ri表示最终的所述纹理描述算子,ROR(LBP(C),i)表示将LBP(C)的二进制码向右圆周平移i位。
7.根据权利要求1所述的方法,其特征在于,所述利用所述尺度不变特征算子进行聚类运算,包括:
采用K-means聚类算法,将所述尺度不变特征算子进行聚类运算。
8.根据权利要求1所述的方法,其特征在于,所述图像分类核函数为:
k(xi,x)=p1kpoly(xi,x)+p2krbf(xi,x)+p3kinter(xi,x)
式中,k表示所述图像分类核函数,xi表示支持向量,x表示输入,p1表示多项式核函数的权重系数,p2表示高斯径向基核函数的权重系数,p3表示直方图相交核核函数的权重系数,kpoly表示多项式核函数,krbf表示高斯径向基核函数,kinter表示直方图相交核核函数。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括如下步骤:
对所述颜色直方图、纹理特征直方图和尺度不变特征直方图进行归一化处理;
确定所述多项式核函数的阶数的取值范围、高斯径向基核宽度的取值范围、多项式核函数的权重系数的取值范围、高斯径向基核函数的权重系数的取值范围、直方图相交核核函数的权重系数的取值范围以及惩罚系数的取值范围。
10.根据权利要求1所述的方法,其特征在于,所述将每个所述尺度不变特征算子分别映射到一个所述特征词汇上,包括:
利用关键点描述子匹配算法,将每个所述尺度不变特征算子分别映射到一个所述特征词汇上。
CN201810495273.6A 2018-05-22 2018-05-22 基于多核学习的多特征融合胃镜图像处理方法 Active CN108710915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810495273.6A CN108710915B (zh) 2018-05-22 2018-05-22 基于多核学习的多特征融合胃镜图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810495273.6A CN108710915B (zh) 2018-05-22 2018-05-22 基于多核学习的多特征融合胃镜图像处理方法

Publications (2)

Publication Number Publication Date
CN108710915A true CN108710915A (zh) 2018-10-26
CN108710915B CN108710915B (zh) 2020-09-18

Family

ID=63868580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810495273.6A Active CN108710915B (zh) 2018-05-22 2018-05-22 基于多核学习的多特征融合胃镜图像处理方法

Country Status (1)

Country Link
CN (1) CN108710915B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116403270A (zh) * 2023-06-07 2023-07-07 南昌航空大学 一种基于多特征融合的人脸表情识别方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622607A (zh) * 2012-02-24 2012-08-01 河海大学 一种基于多特征融合的遥感图像分类方法
CN103336971A (zh) * 2013-07-08 2013-10-02 浙江工商大学 基于多特征融合与增量学习的多摄像机间的目标匹配方法
CN104361313A (zh) * 2014-10-16 2015-02-18 辽宁石油化工大学 一种基于多核学习异构特征融合的手势识别方法
CN104463182A (zh) * 2014-11-28 2015-03-25 深圳先进技术研究院 基于关键点检测的nbi胃镜图像处理方法
US20160314579A1 (en) * 2015-04-22 2016-10-27 King Fahd University Of Petroleum And Minerals Method, system and computer program product for breast density classification using parts-based local features
US20170132496A1 (en) * 2015-11-05 2017-05-11 Microsoft Technology Licensing, Llc Hardware-efficient deep convolutional neural networks
CN107564580A (zh) * 2017-09-11 2018-01-09 合肥工业大学 基于集成学习的胃镜图像辅助处理系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622607A (zh) * 2012-02-24 2012-08-01 河海大学 一种基于多特征融合的遥感图像分类方法
CN103336971A (zh) * 2013-07-08 2013-10-02 浙江工商大学 基于多特征融合与增量学习的多摄像机间的目标匹配方法
CN104361313A (zh) * 2014-10-16 2015-02-18 辽宁石油化工大学 一种基于多核学习异构特征融合的手势识别方法
CN104463182A (zh) * 2014-11-28 2015-03-25 深圳先进技术研究院 基于关键点检测的nbi胃镜图像处理方法
US20160314579A1 (en) * 2015-04-22 2016-10-27 King Fahd University Of Petroleum And Minerals Method, system and computer program product for breast density classification using parts-based local features
US20170132496A1 (en) * 2015-11-05 2017-05-11 Microsoft Technology Licensing, Llc Hardware-efficient deep convolutional neural networks
CN107564580A (zh) * 2017-09-11 2018-01-09 合肥工业大学 基于集成学习的胃镜图像辅助处理系统及方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ABHISHEK VERMA等: "SIFT Features in Multiple Color Spaces for Improved Image Classification", 《RECENT ADVANCES IN INTELLIGENT IMAGE SEARCH AND VIDEO RETRIEVAL》 *
XU ZHANG等: "Gastric precancerous diseases classification using CNN with a concise model", 《RESEARCHGATE》 *
刘盛清等: "基于多尺度特征融合Hessian稀疏编码的图像分类算法", 《计算机应用》 *
杨杰: "面向图像检索的海量图像自动聚类方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116403270A (zh) * 2023-06-07 2023-07-07 南昌航空大学 一种基于多特征融合的人脸表情识别方法及系统
CN116403270B (zh) * 2023-06-07 2023-09-05 南昌航空大学 一种基于多特征融合的人脸表情识别方法及系统

Also Published As

Publication number Publication date
CN108710915B (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
Nawaz et al. Multi-class breast cancer classification using deep learning convolutional neural network
Song et al. Accurate segmentation of cervical cytoplasm and nuclei based on multiscale convolutional network and graph partitioning
CN105488536B (zh) 一种基于多特征深度学习技术的农田害虫图像识别方法
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN105243139B (zh) 一种基于深度学习的三维模型检索方法及其检索装置
Fang et al. Crop leaf disease grade identification based on an improved convolutional neural network
CN104778457B (zh) 基于多示例学习的视频人脸识别方法
CN104881671B (zh) 一种基于2D‑Gabor的高分遥感影像局部特征提取方法
CN106960214A (zh) 基于图像的物体识别方法
CN108010045A (zh) 基于orb的视觉图像特征点误匹配提纯方法
CN107506761A (zh) 基于显著性学习卷积神经网络的脑部图像分割方法及系统
Deng et al. Brain tumor segmentation based on improved convolutional neural network in combination with non-quantifiable local texture feature
CN104392253B (zh) 一种草图数据集的交互式类别标注方法
CN108062543A (zh) 一种面部识别方法及装置
CN110263656A (zh) 一种癌细胞识别方法、装置和系统
CN108388874A (zh) 基于图像识别与级联分类器的对虾形态参数自动测量方法
CN106156798B (zh) 基于环形空间金字塔和多核学习的场景图像分类方法
CN103996018A (zh) 基于4dlbp的人脸识别方法
CN104156690B (zh) 一种基于图像空间金字塔特征包的手势识别方法
CN106778768A (zh) 基于多特征融合的图像场景分类方法
CN109753950A (zh) 动态人脸表情识别方法
CN110472479A (zh) 一种基于surf特征点提取和局部lbp编码的指静脉识别方法
CN107122712A (zh) 基于卷积神经网络和双向局部特征聚合描述向量的掌纹图像识别方法
CN106971158A (zh) 一种基于CoLBP共生特征与GSS特征的行人检测方法
Liu et al. A novel color-texture descriptor based on local histograms for image segmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant