CN113256548A

CN113256548A - 一种多尺度图形识别方法及系统

Info

Publication number: CN113256548A
Application number: CN202110634739.8A
Authority: CN
Inventors: 汪知礼
Original assignee: Individual
Current assignee: Individual
Priority date: 2021-06-08
Filing date: 2021-06-08
Publication date: 2021-08-13

Abstract

本发明涉及一种图形识别的技术领域，公开了一种多尺度图形识别方法，包括：获取待识别图形，将待识别图形转换为图形灰度图，并利用局部最大类间方差法对图形灰度图进行二值化处理，得到二值化图形；利用自适应图形增强算法对二值化图形进行细节增强处理；利用图形分解算法对细节增强后的图形进行分解处理，将图形的轮廓和纹理尺度信息分解到不同的图形；利用多尺度融合算法将不同尺度的图形进行融合处理，得到融合后的图形；将融合后的图形作为图形识别模型的输入，利用图形识别模型对融合后的图形进行图形识别。本发明还提供了一种多尺度图形识别系统。本发明实现了多尺度的图形识别。

Description

一种多尺度图形识别方法及系统

技术领域

本发明涉及图形识别的技术领域，尤其涉及一种多尺度图形识别方法及系统。

背景技术

视觉是人们感知外界环境的重要手段，对人们认知世界有着至关重要的作用，因此，人眼能直观感受的各类图像在人们生活和工作中随处可见。伴随着科学技术的发展，人们追求高清晰度视觉体验的需求更加迫切。

传统图像多尺度分割技术主要有以下三种：第一是基于阈值的分割，第二是基于区域的分割，第三是基于图论的分割。阈值法中噪声的影响较大，导致多尺度图像的图像边缘很难准确分割，影响分割的准确率；而基于区域的分割方法会由于图像上噪声和图局部不连续的原因会产生过度分割的问题；基于图论的分割方法需要提前选择分割块数，在时间和空间上都有着很高的复杂度。

鉴于此，如何提取图形的多尺度信息特征，实现多尺度地图形识别，成为本领域技术人员亟待解决的问题。

发明内容

本发明提供一种多尺度图形识别方法，利用自适应图形增强算法对图形进行细节增强处理，并利用图形分解算法将图形的轮廓和纹理尺度信息分解到不同尺度的图形，同时利用多尺度融合算法将不同尺度的图形进行融合处理，最终利用图形识别模型对融合后的图形进行图形识别。

为实现上述目的，本发明提供的一种多尺度图形识别方法，包括：

获取待识别图形，将待识别图形转换为图形灰度图，并利用局部最大类间方差法对图形灰度图进行二值化处理，得到二值化图形；

利用自适应图形增强算法对二值化图形进行细节增强处理；

利用图形分解算法对细节增强后的图形进行分解处理，将图形的轮廓和纹理尺度信息分解到不同的图形；

利用多尺度融合算法将不同尺度的图形进行融合处理，得到融合后的图形；

将融合后的图形作为图形识别模型的输入，利用图形识别模型对融合后的图形进行图形识别。

可选地，所述利用局部最大类间方差法对图形灰度图进行二值化处理，包括：

1)计算图形灰度图的平均灰度：

其中：

M×N像素为图形灰度图的大小；

k表示灰度图的灰度级；

ρ(k)为灰度级为k的像素出现的概率；

n(k)为灰度级为k的像素出现的个数；

2)以灰度级m为分割阈值，小于此阈值为背景，大于等于此阈值为前景，从而将图形灰度图分成前景和背景，则背景灰度值为：

背景数比例为：

前景灰度值为：

前景数比例为：

3)计算前景和背景的方差σ：

σ＝w_b×(μ_b-μ)²+w_f×(μ_f-μ)²

在本发明一个具体实施例中，本发明用不同的值对分割阈值m进行修改，使得前景和背景的方差达到最大，此时的分割阈值m′为最佳分割阈值；并以最佳分割阈值进行图形灰度图的二值化分割处理，得到二值化图形。

可选地，所述利用自适应图形增强算法对二值化图形进行细节增强，包括：

1)利用拉普拉斯金字塔对二值化图形进行分解处理：

其中：

ω(m，n)表示二维高斯滤波器；

表示像素

在第h-1层拉普拉斯金字塔的分解结果，在本发明一个具体实施例中，当h＝1时，

表示二值化图形中的像素

G_h(i，j)表示像素(i，j)在第h层拉普拉斯金字塔的分解结果；

2)对每层拉普拉斯金字塔分解得到的图像低频信息进行增强处理：

L′_h＝L_h*d(x，y)+β_h[L_h-(L_h*d(x，y))]

其中：

L_h表示第h层拉普拉斯金字塔分解得到的图形低频信息；

d(x，y)表示均值滤波；

β_h表示自适应增强因子；在图像的边缘或者其他细节变化剧烈的区域，局部均方差∈_h较大，β_h值较小，从而防止产生震铃效应；而在平滑的区域，局部均方差较小，其β_h值较大，易放大噪声，因此本发明设定0≤β_h≤2；

∈_h表示第h层拉普拉斯金字塔分解得到的图形的方差；

D表示图形像素平均值；

3)利用拉普拉斯重构法将增强后的分解信息进行图形重构，重构得到的图形即为细节增强后的图形。

可选地，所述利用图形分解算法对细节增强后的图形进行分解处理，包括：

1)将细节增强后的图形输入到滤波器中：

其中：

J(q)表示输入的图形像素值，J′(p)表示滤波器输入的像素值；

p，q表示像素索引；

G(p，q)表示高斯滤波器；

u(p)，u(q)分别表示图形中像素p和像素q的出现频率；

d(p，q)表示像素p和像素q之间的欧几里得距离；

表示参数，将其设置为

Q(p，q)表示滤波矩阵；

相较于传统算法，本发明所述滤波器在经典的双边滤波器的基础上用归一化的滤波矩阵代替了双边滤波器的范围高斯核，利用像素对共现信息和距离的度量进行滤波，达到保留边界同时平滑纹理区域内部的边缘的目的；

2)重复上述步骤，分解得到若干不同轮廓纹理尺度的平滑图形：

Xⁱ＝J(X^i-1)，i＝1，...，k

其中：

X^i-1表示第i-1级轮廓纹理尺度的平滑图形，当i＝0，其值为原始的输入图形；

J(X^i-1)表示将X^i-1输入到滤波器中的结果。

可选地，所述利用多尺度融合算法将不同尺度的图形进行融合处理，包括：

1)计算各尺度图形的对比度：

Aⁱ(x，y)＝h(x，y)*Iⁱ(x，y)

其中：

Aⁱ(x，y)表示尺度级为i的图形的对比度；

Iⁱ(x，y)表示尺度级为i的灰度图；

h(x，y)表示拉普拉斯滤波；

2)计算各尺度图形的曝光度：

其中：

分别为尺度级为i的图形在R，G，B颜色通道的值；

Bⁱ(x，y)表示尺度级为i的图形的曝光度；

3)计算各尺度图形的权重：

W_i(x，y)＝Bⁱ(x，y)×Aⁱ(x，y)

对权重进行归一化处理：

其中：

K表示图形尺度级的总数；

4)利用滤波方法对权重进行优化处理，所述滤波方法的目标函数为：

其中：

p为滤波处理后的图形权重；

g为输入的不同尺度的图形权重W′_i(x，y)；

λ为平衡参数，将其设置为1；

D为不同尺度的图形权重的差分矩阵；

当目标函数取最小值时：

p＝(h+λp^TD^TpD)^-1g

其中：

h为图形权重的矩阵表示；

将p作为滤波优化后的图形权重W^f，则

表示尺度为i的图形的图形权重；

5)利用高斯金字塔对各尺度图形进行融合：

其中：

R^h表示第h层高斯金字塔的融合图形；

表示尺度为i的图形在第h层高斯金字塔的分解图形；

表示尺度为i的图形在第h层高斯金字塔的权重。

可选地，所述利用图形识别模型对融合后的图形进行图形识别，包括：

将融合图形输入到图形识别模型，融合图形的起始位置为卷积层，在其后操作过程中通过4个三维残差网络模块进行处理，之后是最大池化层进行下采样，池化层的核尺寸为2×2×2像素，前向流程中的所有卷积核的核尺寸均为4×4×4像素，填充为1；在此操作过程中其中各转置卷积层步长全部设置为2，内核大小为2，并利用最邻近插值法填充卷积过程中的空白像素；其中的各残差网络组合单元将特征发向下一个残差网络；其中残差网络操作结束后，输出融合图形的特征图；

将图像特征图输入到全连接层，全连接层输出融合图形的分类识别信息，包括融合图形的形状、大小以及位置。

此外，为实现上述目的，本发明还提供一种多尺度图形识别系统，所述系统包括：

图形获取装置，用于获取待识别图形；

数据处理器，用于将待识别图形转换为图形灰度图，并利用局部最大类间方差法对图形灰度图进行二值化处理；利用自适应图形增强算法对二值化图形进行细节增强处理；利用图形分解算法对细节增强后的图形进行分解处理，将图形的轮廓和纹理尺度信息分解到不同的图形；

多尺度图形识别装置，用于利用多尺度融合算法将不同尺度的图形进行融合处理，得到融合后的图形；将融合后的图形作为图形识别模型的输入，利用图形识别模型对融合后的图形进行图形识别。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有多尺度图形识别程序指令，所述多尺度图形识别程序指令可被一个或者多个处理器执行，以实现如上所述的多尺度图形识别的实现方法的步骤。

本发明首先提出一种自适应图形增强算法对图形进行细节增强处理，通过利用拉普拉斯金字塔对二值化图形进行分解处理：

其中：ω(m，n)表示二维高斯滤波器；

表示像素

在第h-1层拉普拉斯金字塔的分解结果；G_h(i，j)表示像素(i，j)在第h层拉普拉斯金字塔的分解结果；对每层拉普拉斯金字塔分解得到的图像低频信息进行增强处理：

L′_h＝L_h*d(x，y)+β_h[L_h-(L_h*d(x，y))]

其中：L_h表示第h层拉普拉斯金字塔分解得到的图形低频信息；d(x，y)表示均值滤波；β_h表示自适应增强因子；在图像的边缘或者其他细节变化剧烈的区域，局部均方差∈_h较大，β_h值较小，从而防止产生震铃效应；而在平滑的区域，局部均方差较小，其β_h值较大，易放大噪声，因此本发明设定0≤β_h≤2；∈_h表示第h层拉普拉斯金字塔分解得到的图形的方差；D表示图形像素平均值；利用拉普拉斯重构法将增强后的分解信息进行图形重构，重构得到的图形即为细节增强后的图形。相较于传统技术，本发明首先利用拉普拉斯金字塔提取反映图形细节变化的细节信息，并设计自适应增强因子，所述自适应增强因子会根据图形的细节变化程度进行自适应调整，从而对图形的低频信息进行增强，提高了后续图形识别的准确率。

同时，本发明提出一种多尺度的图形分解算法，将图形的轮廓和纹理尺度信息分解到不同尺度的图形所述尺度分解的流程为：将细节增强后的图形输入到滤波器中：

其中：J(q)表示输入的图形像素值，J′(p)表示滤波器输入的像素值；p，q表示像素索引；G(p，q)表示高斯滤波器；u(p)，u(q)分别表示图形中像素p和像素q的出现频率；d(p，q)表示像素p和像素q之间的欧几里得距离；

表示参数，将其设置为

Q(p，q)表示滤波矩阵；相较于传统算法，本发明所述滤波器在经典的双边滤波器的基础上用归一化的滤波矩阵代替了双边滤波器的范围高斯核，利用像素对共现信息和距离的度量进行滤波，达到保留边界同时平滑纹理区域内部的边缘的目的；重复上述滤波分解步骤，分解得到若干不同轮廓纹理尺度的平滑图形：

Xⁱ＝J(X^i-1)，i＝1，...，k

其中：X^i-1表示第i-1级轮廓纹理尺度的平滑图形。

附图说明

图1为本发明一实施例提供的一种多尺度图形识别方法的流程示意图；

图2为本发明一实施例提供的一种多尺度图形识别系统的结构示意图；

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

利用自适应图形增强算法对图形进行细节增强处理，并利用图形分解算法将图形的轮廓和纹理尺度信息分解到不同尺度的图形，同时利用多尺度融合算法将不同尺度的图形进行融合处理，最终利用图形识别模型对融合后的图形进行图形识别。参照图1所示，为本发明一实施例提供的多尺度图形识别方法示意图。

在本实施例中，多尺度图形识别方法包括：

S1、获取待识别图形，将待识别图形转换为图形灰度图，并利用局部最大类间方差法对图形灰度图进行二值化处理，得到二值化图形。

首先，本发明获取待识别图形，在本发明一个具体实施例中，所述待识别图形为包含着图形的图像数据，图像数据格式为JPG、PNG等；

利用灰度图转换方法将待识别图形转换为图形灰度图，所述图形灰度图转换公式为：

Gray_(i，j)＝R_(i，j)×0.3+G_(i，j)×0.59+B_(i，j)×0.11

其中：

R_(i，j)，G_(i，j)，B_(i，j)为图形中像素(i，j)在R，G，B三个颜色分量中的像素值；

Gray_(i，j)为像素(i，j)的灰度值。

进一步地，本发明利用局部最大类间方差法对图形灰度图进行二值化处理，所述局部最大类间方差法流程为：

1)计算图形灰度图的平均灰度：

其中：

M×N像素为图形灰度图的大小；

k表示灰度图的灰度级；

ρ(k)为灰度级为k的像素出现的概率；

n(k)为灰度级为k的像素出现的个数；

背景数比例为：

前景灰度值为：

前景数比例为：

3)计算前景和背景的方差σ：

σ＝w_b×(μ_b-μ)²+w_f×(μ_f-μ)²

S2、利用自适应图形增强算法对二值化图形进行细节增强处理。

进一步地，本发明利用利用自适应图形增强算法对二值化图形进行细节增强处理，所述自适应图形增强算法流程为：

1)利用拉普拉斯金字塔对二值化图形进行分解处理：

其中：

ω(m，n)表示二维高斯滤波器；

表示像素

表示二值化图形中的像素

G_h(i，j)表示像素(i，j)在第h层拉普拉斯金字塔的分解结果；

L′_h＝L_h*d(x，y)+β_h[L_h-(L_h*d(x，y))]

其中：

L_h表示第h层拉普拉斯金字塔分解得到的图形低频信息；

d(x，y)表示均值滤波；

∈_h表示第h层拉普拉斯金字塔分解得到的图形的方差；

D表示图形像素平均值；

S3、利用图形分解算法对细节增强后的图形进行分解处理，将图形的轮廓和纹理尺度信息分解到不同尺度的图形。

进一步地，本发明利用图形分解算法对细节增强后的图形进行尺度分解处理，所述尺度分解的流程为：

1)将细节增强后的图形输入到滤波器中：

其中：

p，q表示像素索引；

G(p，q)表示高斯滤波器；

u(p)，u(q)分别表示图形中像素p和像素q的出现频率；

d(p，q)表示像素p和像素q之间的欧几里得距离；

表示参数，将其设置为

Q(p，q)表示滤波矩阵；

Xⁱ＝J(X^i-1)，i＝1，...，k

其中：

J(X^i-1)表示将X^i-1输入到滤波器中的结果。

S4、利用多尺度融合算法将不同尺度的图形进行融合处理，得到融合后的图形。

进一步地，本发明利用多尺度融合算法将不同尺度的图形进行融合处理，所述多尺度融合算法的流程为：

1)计算各尺度图形的对比度：

Aⁱ(x，y)＝h(x，y)*Iⁱ(x，y)

其中：

Aⁱ(x，y)表示尺度级为i的图形的对比度；

Iⁱ(x，y)表示尺度级为i的灰度图；

h(x，y)表示拉普拉斯滤波；

2)计算各尺度图形的曝光度：

其中：

分别为尺度级为i的图形在R，G，B颜色通道的值；

Bⁱ(x，y)表示尺度级为i的图形的曝光度；

3)计算各尺度图形的权重：

W_i(x，y)＝Bⁱ(x，y)×Aⁱ(x，y)

对权重进行归一化处理：

其中：

K表示图形尺度级的总数；

其中：

p为滤波处理后的图形权重；

g为输入的不同尺度的图形权重W′_i(x，y)；

λ为平衡参数，将其设置为1；

D为不同尺度的图形权重的差分矩阵；

当目标函数取最小值时：

p＝(h+λp^TD^TpD)^-1g

其中：

h为图形权重的矩阵表示；

将p作为滤波优化后的图形权重W^f，则

表示尺度为i的图形的图形权重；

5)利用高斯金字塔对各尺度图形进行融合：

其中：

R^h表示第h层高斯金字塔的融合图形；

表示尺度为i的图形在第h层高斯金字塔的分解图形；

表示尺度为i的图形在第h层高斯金字塔的权重。

S5、将融合后的图形作为图形识别模型的输入，利用图形识别模型对融合后的图形进行图形识别。

进一步地，本发明将融合后的图形作为图形识别模型的输入，利用图形识别模型对融合后的图形进行图形识别；

所述图形识别模型对融合图形进行识别的流程为：

下面通过一个算法实验来说明本发明的具体实施方式，并对发明的处理方法进行测试。本发明算法的硬件测试环境为：Inter(R)Core(TM)i7-6700K CPU，软件为Matlab2018b；对比方法为基于随机森林的多尺度图形识别方法以及基于CNN的多尺度图形识别方法。

在本发明所述算法实验中，数据集为10G的图形数据。本实验通过将图形数据输入到算法模型中，将图形识别的准确率作为算法可行性的评价指标，其中图形识别的准确率越高，则说明算法的有效性、可行性越高。

根据实验结果，基于随机森林的多尺度图形识别方法的多尺度图形识别准确率为82.31％，基于神经网络的多尺度图形识别方法的多尺度图形识别准确率为83.66％，本发明所述方法的多尺度图形识别准确率为89.18％，相较于对比算法，本发明所提出的多尺度图形识别方法能够实现更高的多尺度识别准确性。

发明还提供一种多尺度图形识别系统。参照图2所示，为本发明一实施例提供的多尺度图形识别系统的内部结构示意图。

在本实施例中，所述多尺度图形识别系统1至少包括图形获取装置11、数据处理器12、多尺度图形识别装置13，通信总线14，以及网络接口15。

其中，图形获取装置11可以是PC(Personal Computer，个人电脑)，或者是智能手机、平板电脑、便携计算机等终端设备，也可以是一种服务器等。

数据处理器12至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。数据处理器12在一些实施例中可以是多尺度图形识别系统1的内部存储单元，例如该多尺度图形识别系统1的硬盘。数据处理器12在另一些实施例中也可以是多尺度图形识别系统1的外部存储设备，例如多尺度图形识别系统1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，数据处理器12还可以既包括多尺度图形识别系统1的内部存储单元也包括外部存储设备。数据处理器12不仅可以用于存储安装于多尺度图形识别系统1的应用软件及各类数据，还可以用于暂时地存储已经输出或者将要输出的数据。

多尺度图形识别装置13在一些实施例中可以是一中央处理器(CentralProcessing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片，包括监控单元，用于运行数据处理器12中存储的程序代码或处理数据，例如多尺度图形识别程序指令16等。

通信总线14用于实现这些组件之间的连接通信。

网络接口15可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该系统1与其他电子设备之间建立通信连接。

可选地，多尺度图形识别系统1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在多尺度图形识别系统1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-15以及多尺度图形识别系统1，本领域技术人员可以理解的是，图1示出的结构并不构成对多尺度图形识别系统1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图2所示的多尺度图形识别系统1实施例中，数据处理器12中存储有多尺度图形识别程序指令16；多尺度图形识别装置13执行数据处理器12中存储的多尺度图形识别程序指令16的步骤，与多尺度图形识别方法的实现方法相同，在此不作类述。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有多尺度图形识别程序指令，所述多尺度图形识别程序指令可被一个或多个处理器执行，以实现如下操作：

利用自适应图形增强算法对二值化图形进行细节增强处理；

需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。