CN111932454B

CN111932454B - 基于改进的二元闭环神经网络的logo图案重建方法

Info

Publication number: CN111932454B
Application number: CN202010710204.XA
Authority: CN
Inventors: 雒鹏程; 胡更生
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2020-07-22
Filing date: 2020-07-22
Publication date: 2022-05-27
Anticipated expiration: 2040-07-22
Also published as: CN111932454A

Abstract

本发明公开基于改进的二元闭环神经网络的LOGO图案重建方法。本发明为解决LOGO图案作为一种必要元素在印刷与包装设计过程中由于不断复制传播造成的分辨率降低以及退化模型未知(可能的映射空间过多)的问题，而为了解决这一问题，本发明提出的方法将现存的一元映射网络(RCAN)改进为二元回归映射网络(BCLNN)，并将边缘检测的方法加入其中，使得模型能够对于LOGO图案进行更好的重建。

Description

基于改进的二元闭环神经网络的LOGO图案重建方法

技术领域

本发明涉及平面单图像重建领域，具体涉及一种基于改进的二元闭环网络的LOGO图案超分辨率重建方法。

背景技术

LOGO图案作为一种包装设计的必要素材在当今社会得到了广泛的应用。LOGO图案在为人们进行信息传播和产品推广的同时，由于在传播过程中的受到不可控因素的影响，其自身的质量水平会随之降低，进而影响到信息传播的完整性与美观度，特别随着印刷与包装设计技术的发展，LOGO图案经过不断的复制传播，其最初具有的分辨率与清晰度大幅降低，造成使用上的不便。对于部分具有较高价值的LOGO图案，由于分辨率与清晰程度的限制导致其无法再次使用，是非常可惜的，因此，在使用LOGO图案进行信息传播的同时，通过技术手段对LOGO图案进行重建，提升图案本身的分辨率与清晰度是及其必要的。

发明内容

本发明的目的是针对现有技术的不足，提供一种基于改进的二元闭环神经网络的LOGO图案超分辨率重建方法，旨在解决LOGO图案作为一种必要元素在印刷与包装设计过程中由于不断复制传播造成的分辨率降低以及退化模型未知(可能的映射空间过多)的问题，而为了解决这一问题，本发明提出的方法将现存的一元映射网络(RCAN)改进为二元回归映射网络(BCLNN)，并将边缘检测的方法加入其中，使得模型能够对于LOGO图案进行更好的重建。

本发明方法的技术方案分为基于改进的二元闭环神经网络的超分辨率模型构建训练以及LOGO图案的复原重建两个过程进行，具体内容如下：

步骤一、构建二元闭环神经网络的训练集

获取若干分辨率为W×H的原始高分辨率LOGO图案，进行两次图像缩放变换，得到尺寸为W×H的低分辨率图像，去噪后作为训练集的输入项；对应去噪后原始高分辨率LOGO图案作为训练集的输出项；

步骤二、构建二元闭环神经网络：

2-1构建二元闭环神经网络的原始映射：

原始映射依次由下采样层、卷积层、残差通道注意力模块、亚像素卷积重构层、转换色彩空间层、图像边缘计算层、图像感知损失计算层、图像边缘损失计算层构成；其中残差通道注意力块主要由池化层，上采样层，下采样层以及混合层构成；

2-2构建二元闭环神经网络的回归映射：

回归映射依次由下采样层、卷积层、残差通道注意力模块、亚像素卷积重构层、图像感知损失计算层构成；

步骤三、利用训练集进行BCLNN模型的训练

步骤四、LOGO图案的复原及重建

4-1将待重建LOGO图像使用DATALOADER函数导入PYTHON环境中；

4-2加载已经训练好的对应的BCLNN模型，将上述待重建LOGO图像作为输入图像输入模型中，复原重建得到重建图像。

本发明方法针对LOGO图像退化后的振铃现象与现实应用只有低分辨率LOGO图像的问题，结合边缘检测与深度学习回归网络的形式用基于二元闭环神经网络的超分辨率重建方法对低分辨率的LOGO图案进行高分辨率重建，解决了某些平面图案在传播过程中因分辨率不够而造成的使用困难的问题。该方法易于实现，具有较好的重建效果。

附图说明

图1为本发明的方法流程图。

图2为本发明的深度学习网络模型构建图；

图3为本发明的实施例的实施效果示例图；其中(a)为原图，(b)为RCAN模型重建后图像，(c)为本发明重建后图像。

具体实施方式

下面结合附图和具体实施例对本发明做进一步的分析说明。

基于改进的二元闭环神经网络的超分辨率模型构建训练以及LOGO图案的复原重建两个过程进行，如图1具体内容如下：

步骤一、模型训练的数据收集：

1.1收集n(n>350)张高分辨率LOGO图案，高分辨率尺寸为W×H，图片均为纯色背景，并标记为A组；

1.2将1.1中收集的这些图片进行图像缩放变换，得到分辨率为1/3*W×1/3H的低分辨率图像,并标记为B组；其中图像缩放变换采用双三次插值方法，采用双三次内插基函数作为基函数，双三次插值计算按公式(1)进行：

f(i+u,j+v)＝ABC (1)

其中，A、B、C均为矩阵，形式如下：

A＝[s(v+1) s(v) s(1-v) s(2-v)] (2)

(i,j):原图像的像素坐标，其中，i为横坐标值，j为纵坐标值，i、j均为非负整数；

f(i,j):原图像的像素灰度值；

(i+u,j+v):缩放变换后新图像的像素坐标；

f(i+u,j+v):缩放变换后新图像的像素灰度值；

u：沿横坐标方向，原图像像素坐标的横坐标i离新图像像素坐标(i+u,j+v)的距离；

v：沿纵坐标方向，原图像像素坐标的纵坐标j离新图像的像素坐标(i+u,j+v)的距离；

|x|：图像像素沿x方向离原点的距离；

s(x)：sin(π·x)/x的逼近多项式，为插值核；

步骤二.数据集的预处理，生成模型的训练集：

2.1将步骤1.2低分辨率图像进行二次图像缩放变换，得到尺寸为W×H的图像；其中图像缩放变换采用双三次插值方法，采用双三次内插基函数作为基函数，双三次插值计算按公式(1)进行：

2.2将步骤2.1二次缩放变换后B组图像作为训练集的输入集合(未处理)，步骤1.1A组图像作为训练集的输出集合(未处理)，输入集合与输出集合组成完整的训练集。

2.3将步骤2.2中得到的训练集中图像进行中值滤波处理，得到去噪图像。具体如下：

a)将图像的R,G,B三通道分离；

b)对每个通道中的每个像素，把其邻域中的像素按灰度级进行排序，选择该组的中间值作为这个像素的输出值，通常选择3×3窗口大小的邻域；

c)将计算中值后的三个通道整合，输出去噪后图像；

上述由matlab语言编写实现；

2.4将步骤2.3中得到的去噪后图像作为二元闭环神经网络的训练集。

步骤三.如图2构建二元闭环神经网络：

3.1构建二元闭环神经网络的原始映射：

3.1.1构建原始映射的第一层，对训练集中图像进行下采样，该操作按公式(6)进行：

公式(6)中，

Y:下采样后的图像；

F₁：下采样函数；

X_i：输入图像

i：当前图像的序号；

k：图像的总数量；

S：下采样的倍数；

3.1.2构建原始映射的第二层，将步骤3.1.1下采样后的图像进行公式(7)卷积操作，然后用公式(8)激活函数激活，提取图像的特征；

F₂(Y)＝MAX(0,w₂*F₁(Y)+B₂) (7)

公式(7)中，

F₂：卷积操作的处理函数；

Y：步骤3.1.1下采样后的图像；

w₂：大小为n1*f2*f2*n2的滤波器，其中f2是滤波器的空间大小，n1、n2是滤波器的数量；

B₂：n2维向量；

公式(8)中，

P：激活处理后的图像特征；

y_i,j：卷积操作后图像在(i，j)这一点的像素值；

a_i.j：(1，+∞)区间内的固定参数；

3.1.3构建原始映射的第三层：

将3.1.2处理后图像特征按通道赋予不同的权值，该过程通过残差通道注意力块实现；残差通道注意力块主要由池化层，上采样层，下采样层以及混合层构成，分别按照公式(9)-(12)进行；

公式(9)中，

P₁:池化层处理后的图像特征；

H_GP：池化层函数；

P(i,j)：3.1.2处理后图像；

H：3.1.2处理后图像的横坐标总像素值；

W：3.1.2处理后图像的纵坐标总像素值；

公式(10)中，

P₂：上采样处理后的图像特征；

UP：上采样函数；

P₁：池化层处理后图像特征；

W：尺寸为1*1的卷积核；

表示卷积操作；

公式(11)中，

P₃：下采样处理后的图像特征；

P₂：上采样层处理后图像特征；

DOWN：下采样函数；

W₁：尺寸为1*1的卷积核；

S＝f(W_U×W_D×H_GP(P₃)) (12)

公式(12)中，

P₃：下采样层处理后图像特征；

S：图像经过混合后的新特征；

f：混合函数；

W_U：上采样得到的图像特征的权重系数；

W_D：下采样得到的图像特征的权重系数；

H_GP：池化层函数；

3.1.4构建原始映射的第四层：

将步骤3.1.3中提取的图像新特征按像素洗牌的方式进行重构，该过程通过亚像素卷积的方式进行实现，按公式(13)进行：

Q^SR＝PS(W_L×f₁(S)+b_L) (13)

公式(13)中：

Q^SR：重建出的高分辨率图像；

S；步骤3.1.3中提取的图像新特征；

f₁(S)：亚像素卷积预处理函数；

PS：像素洗牌函数；

W_L：像素洗牌对应的卷积核；

b_L；函数相关的权重偏移值；

3.1.5构建原始映射的第五层：

将3.1.4中重建出的高分辨率图像以及2.4中训练集的A组图像从RGB色彩空间转化到YCbCr色彩空间，并将图像的Y通道保存，分别归为Y1与Y2，其中对图像从RGB色彩空间到YCbCr色彩空间的转化按公式(14)进行：

R＝1.164(Y-16)+1.793(CR-128)＝1.164Y+1.793CR-248.128；

G＝1.164(Y-16)-0.534(CR-128)-0.213(CB-128)＝1.164Y-0.213CB-0.534CR+76.992；

B＝1.164(Y-16)+2.115(CB-128)＝1.164Y+2.115CB-289.344；

(14)

公式(14)中，

R：图像中每个像素的红通道颜色值；

G：图像中每个像素的绿通道颜色值；

B：图像中每个像素的蓝通道颜色值；

Y：图像中每个像素的颜色明亮度和浓度；

Cb：图像中每个像素的颜色的蓝色浓度偏移量；

Cr：图像中每个像素的颜色的红色浓度偏移量；

3.1.6构建原始映射的第六层：

将3.1.5中得到的Y1与Y2分别通canny算子计算对应的边缘图像，归类为Y1-1与Y1-2，canny算子使用滤波器计算像素梯度按公式(15)进行：

公式(15)中，

G_X：x方向上的卷积阵列；

G_Y：y方向上的卷积阵列；

G：是图像对应像素的梯度幅值；

3.1.7构建原始映射的第七层：

3.1.4中重建出的高分辨率图像与2.4中训练集的A组中对应的图像经过VGG19网络计算得到原始映射中的图像感知损失L_P-1,L_P-1按照公式(16)进行：

公式(16)中，

Q^SR：步骤3.1.4重建出的高分辨率图像；

S：步骤2.4真实的高分辨率图像；

F:VGG19网络模型；

M：重建出的高分辨率图像的通道数；

W：重建出的高分辨率图像的宽度数；

H：重建出的高分辨率图像的高度数；

3.1.8构建原始映射的第八层：

3.1.6中得到的Y1-1与Y1-2经过VGG19网络计算得到原始映射中的图像边缘损失L_P-2，L_P-2按照公式(16)进行。

3.2构建二元闭环神经网络的回归映射：

3.2.1构建回归映射的第一层：

对3.1.4中重建出的高分辨率图像进行下采样，该操作按公式(6)进行；

3.2.2构建回归映射的第二层：

将3.2.1中得到的图像进行卷积操作，然后用激活函数激活，提取图像的特征，该操作按公式(7)与(8)进行；

3.2.3构建回归映射的第三层：

将3.2.2中提取的图像特征按通道赋予不同的权值，该过程通过残差通道注意力块实现，残差通道注意力块主要由池化层，上采样层，下采样层以及混合层构成，分别按照公式(9)-(12)进行；

3.2.4构建回归映射的第四层：

将3.1.3中提取的图像新特征按像素洗牌的方式进行重构，该过程通过亚像素卷积的方式进行实现，按公式(13)进行；

3.2.5构建回归映射的第五层：

将3.2.4中得到的重构低分辨率图像经过VGG19网络计算得到回归映射中的图像感知损失L_D,L_D按照公式(16)进行；

3.3构建整个二元回归网络的损失函数，按照公式(17)进行：

L＝L_P-1+L_P-2+L_D (17)

公式(17)中，

L_P-1:原始映射中的图像感知损失；

L_P-2：原始映射中的图像边缘损失；

L_D：回归映射中的图像感知损失；

步骤四：BCLNN模型的训练

4.1使用基于PYTHON 3.6.5的JPUYTER NOTEBOOK进行模型训练，并配置pytorch相关环境；

4.2将步骤二中模型的训练集通过ImageFolder函数进行封装，并通过DataLoader函数进行导入；

4.3按照步骤三的网络结构进行网络模型的初始化；

4.4设置训练的基本参数与损失函数以及优化器，其中基本参数为

num_epochs＝15、batch_size＝245、learning_rate＝0.001；

4.5加载网络模型，并通过循环迭代不断的更新模型的相关参数；

4.6通过torch.save函数保存训练好的模型为BCLNN.pt；

步骤五.LOGO图案的复原及重建

5.1将待重建LOGO图像使用DATALOADER函数导入PYTHON环境中；

5.2加载已经训练好的对应的BCLNN模型，将5.1中的待重建LOGO图像作为输入图像输入模型中进行复原重建得到重建图像。

重建结果如图3所示，(a)为原图像，(b)为用RCAN网络进行4倍重建得到的图像，(c)为用本发明的BCLNN网络进行4倍重建的图像，可以看到(c)相对于(a)在分辨率与清晰度上有了很大的提高，并且(c)相对于(b)在LOGO图像边缘的重建效果上了一定的提升。

上述实施例并非是对于本发明的限制，本发明也并非仅限于上述实施例，只要符合本发明要求，均属于本发明的保护范围。

Claims

1.基于改进的二元闭环神经网络的LOGO图案重建方法，其特征在于包括以下步骤：

步骤一、构建二元闭环神经网络的训练集

步骤二、构建二元闭环神经网络：

2-1构建二元闭环神经网络的原始映射：

2-2构建二元闭环神经网络的回归映射：

步骤三、利用训练集进行BCLNN模型的训练

步骤四、LOGO图案的复原及重建

4-1将待重建LOGO图像使用DATALOADER函数导入PYTHON环境中；

2.如权利要求1所述的方法，其特征在于步骤一具体如下：

步骤A、模型训练的数据收集：

1.1收集n张高分辨率LOGO图案，n>350，高分辨率尺寸为W×H，图片均为纯色背景，并标记为A组；

f(i+u,j+v)＝ABC (1)

其中，A、B、C均为矩阵，形式如下：

A＝[s(v+1) s(v) s(1-v) s(2-v)] (2)

f(i,j):原图像的像素灰度值；

(i+u,j+v):缩放变换后新图像的像素坐标；

f(i+u,j+v):缩放变换后新图像的像素灰度值；

|x|：图像像素沿x方向离原点的距离；

s(x)：sin(π·x)/x的逼近多项式，为插值核；

步骤B.数据集的预处理，生成模型的训练集：

2.2将步骤2.1二次缩放变换后B组图像作为训练集的输入集合，步骤1.1A组图像作为训练集的输出集合，输入集合与输出集合组成完整的训练集；

2.3将步骤2.2中得到的训练集中图像进行中值滤波处理，得到去噪图像，由matlab语言编写实现；具体如下：

a)将图像的R,G,B三通道分离；

c)将计算中值后的三个通道整合，输出去噪后图像；

3.如权利要求2所述的方法，其特征在于步骤二具体如下：

3.1构建二元闭环神经网络的原始映射：

公式(6)中，

Y:下采样后的图像；

F₁：下采样函数；

X_i：输入图像

i：当前图像的序号；

k：图像的总数量；

s：下采样的倍数；

F₂(Y)＝MAX(0,w₂*F₁(Y)+B₂) (7)

公式(7)中，

F₂：卷积操作的处理函数；

Y：步骤3.1.1下采样后的图像；

B₂：n2维向量；

公式(8)中，

P：激活处理后的图像特征；

y_i,j：卷积操作后图像在(i，j)这一点的像素值；

a_i.j：(1，+∞)区间内的固定参数；

3.1.3构建原始映射的第三层：

公式(9)中，

P₁:池化层处理后的图像特征；

H_GP：池化层函数；

P(i,j)：3.1.2处理后图像；

H：3.1.2处理后图像的横坐标总像素值；

W：3.1.2处理后图像的纵坐标总像素值；

公式(10)中，

P₂：上采样处理后的图像特征；

UP：上采样函数；

P₁：池化层处理后图像特征；

W：尺寸为1*1的卷积核；

表示卷积操作；

公式(11)中，

P₃：下采样处理后的图像特征；

P₂：上采样层处理后图像特征；

DOWN：下采样函数；

W₁：尺寸为1*1的卷积核；

S＝f(W_U×W_D×H_GP(P₃)) (12)

公式(12)中，

P₃：下采样层处理后图像特征；

S：图像经过混合后的新特征；

f：混合函数；

W_U：上采样得到的图像特征的权重系数；

W_D：下采样得到的图像特征的权重系数；

H_GP：池化层函数；

3.1.4构建原始映射的第四层：

Q^SR＝PS(W_L×f₁(S)+b_L) (13)

公式(13)中：

Q^SR：重建出的高分辨率图像；

S；步骤3.1.3中提取的图像新特征；

f₁(S)：亚像素卷积预处理函数；

PS：像素洗牌函数；

W_L：像素洗牌对应的卷积核；

b_L；函数相关的权重偏移值；

3.1.5构建原始映射的第五层：

R＝1.164(Y-16)+1.793(CR-128)＝1.164Y+1.793CR-248.128；

G＝1.164(Y-16)-0.534(CR-128)-0.213(CB-128)＝1.164Y-0.213CB-0.534CR+76.992；

B＝1.164(Y-16)+2.115(CB-128)＝1.164Y+2.115CB-289.344； (14)

公式(14)中，

R：图像中每个像素的红通道颜色值；

G：图像中每个像素的绿通道颜色值；

B：图像中每个像素的蓝通道颜色值；

Y：图像中每个像素的颜色明亮度和浓度；

Cb：图像中每个像素的颜色的蓝色浓度偏移量；

Cr：图像中每个像素的颜色的红色浓度偏移量；

3.1.6构建原始映射的第六层：

将3.1.5中得到的Y1与Y2分别通过canny算子计算对应的边缘图像，归类为Y1-1与Y1-2，canny算子使用滤波器计算像素梯度按公式(15)进行：

公式(15)中，

G_X：x方向上的卷积阵列；

G_Y：y方向上的卷积阵列；

G：是图像对应像素的梯度幅值；

3.1.7构建原始映射的第七层：

公式(16)中，

Q^SR：步骤3.1.4重建出的高分辨率图像；

S：步骤2.4真实的高分辨率图像；

F:VGG19网络模型；

M：重建出的高分辨率图像的通道数；

W：重建出的高分辨率图像的宽度数；

H：重建出的高分辨率图像的高度数；

3.1.8构建原始映射的第八层：

3.1.6中得到的Y1-1与Y1-2经过VGG19网络计算得到原始映射中的图像边缘损失L_P-2，L_P-2按照公式(16)进行；

3.2构建二元闭环神经网络的回归映射：

3.2.1构建回归映射的第一层：

3.2.2构建回归映射的第二层：

3.2.3构建回归映射的第三层：

3.2.4构建回归映射的第四层：

3.2.5构建回归映射的第五层：

3.3构建整个二元回归网络的损失函数，按照公式(17)进行：

L＝L_P-1+L_P-2+L_D (17)

公式(17)中，

L_P-1:原始映射中的图像感知损失；

L_P-2：原始映射中的图像边缘损失；

L_D：回归映射中的图像感知损失。

4.如权利要求3所述的方法，其特征在于步骤三具体如下：

4.3按照步骤三的网络结构进行网络模型的初始化；

num_epochs＝15、batch_size＝245、learning_rate＝0.001；

4.6通过torch.save函数保存训练好的模型为BCLNN.pt。