WO2021189321A1

WO2021189321A1 - 一种图像处理方法和装置

Info

Publication number: WO2021189321A1
Application number: PCT/CN2020/081191
Authority: WO
Inventors: 王叶斌; 赵杨; 皮志明; 黄枭; 陈迪; 迟显军
Original assignee: 华为技术有限公司
Priority date: 2020-03-25
Filing date: 2020-03-25
Publication date: 2021-09-30
Also published as: CN113728355A

Abstract

本申请提供了一种图像处理方法及装置，该装置包括：第一反光消除模块，用于对输入图像进行反光消除处理，获取第一图像；反光判断模块，用于根据所述第一图像和所述输入图像，获取所述输入图像是否有反光的判断结果；第二反光消除模块，用于根据所述反光判断模块的判断结果，获取输出图像。本申请实施例提供的图像处理装置，能够改善图像的反光消除效果。

Description

一种图像处理方法和装置

技术领域

本申请涉及图像处理技术领域，尤其涉及一种图像处理方法和装置。

背景技术

人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人，自然语言处理，计算机视觉，决策与推理，人机交互，推荐与搜索，AI基础理论等。

随着人工智能技术的快速发展，神经网络(例如，深度神经网络)近年来在图像、视频以及语音等多种媒体信号的处理与分析中取得了很大的成就。在日常的照片拍摄中，拍摄的图像中可能存在反光，为了满足用户对照片智能优化处理的需求，可以利用AI算法对图像进行反光消除操作，减小反光对画面效果的影响。

现有的反光消除技术主要通过生成对抗神经网络(generative adversarial networks，GAN)实现。该技术使用时将带反光原图输入训练好的反光消除生成网络，网络推理生成无反光图像。但是，GAN神经网络算法仅有反光消除手段，却无反光识别手段，对于无反光图像进行反光消除后，图像质量会有恶化。

发明内容

本申请提供一种图像处理方法和装置，能够改善图像的反光消除效果。

第一方面，提供了一种图像处理装置，包括：第一反光消除模块，用于对输入图像进行反光消除处理，获取第一图像；反光判断模块，用于根据第一图像和输入图像，获取该输入图像是否有反光的判断结果；第二反光消除模块，用于根据判断结果，获取输出图像。

上述技术方案中，图像处理装置可以根据初步反光消除的结果判断输入图像是否有反光，再对判断结果为有反光的原始图像进行反光消除处理，实现了对有反光图片的自动识别与反光消除。

可选地，该装置还可以包括预处理模块，用于对原始图像进行预处理，获取输入图像，该原始图像的尺寸大于输入图像的尺寸。

可选地，当原始图像的尺寸符合第一反光消除模块的输入尺寸要求时，可以将原始图像作为输入图像。

上述技术方案中，对原始图像进行预处理，可以实现对尺寸较大的原始图片的反光识别与消除。

在一种实现方式中，第二反光消除模块具体用于，在判断结果为输入图像没有反光时，获取原始图像作为输出图像。

当判断结果为输入图像无反光时，可以直接输出原始图像，不对原始图像做多余的处理，避免了对于无反光图像进行反光消除后，图像质量恶化的情况。

在一种实现方式中，当判断结果为输入图像有反光，并且输入图像是原始图像时，第二反光消除模块具体用于根据第一图像和输入图像生成反光层小图，并根据反光层小图和原始图像获取输出图像。

在一种实现方式中，当判断结果为输入图像有反光，并且输入图像时原始图像预处理后的图像时，第二反光消除模块具体用于根据第一图像和输入图像生成反光层小图，对反光层小图进行上采样以获取反光图层，并根据反光图层和原始图像获取输出图像。

上述技术方案中，对反光层小图上采样得到反光图层，再根据原始图像和反光图层得到输出图像，最终可以得到与原图尺寸、分辨率一致的消除反光的输出图像，提高了输出图像的质量。

可选地，反光判断模块包括反光判断模型，反光判断模型是以第一图像和输入图像作为输入的神经网络，该反光判断模型的输出表示输入图像有反光的置信度，或者输出为判断结果。

在一种实现方式中，反光判断模型是基于马尔科夫判别器的神经网络，并且是基于第一样本集训练得到的，其中第一样本集包括：原始图像样本、原始图像样本经过反光消除后的图像样本、原始图像样本是否有反光的标签。

可选地，反光判断模块包括反光层强度判断单元，该反光层强度判断单元用于根据输入图像和第一图像生成反光层小图；反光层强度判断单元还用于计算反光层小图包括的多个像素点的灰度值，并根据多个像素点的灰度值确定判断结果。

在一种实现方式中，该反光层强度判断单元根据如下信息中的至少一种或者多种的加权结果，确定判断结果：多个像素点的灰度值中的最大值、灰度值大于第一阈值的至少一个像素点的强度、灰度值大于第二阈值的至少一个像素点的面积；其中，所述灰度值大于第一阈值的至少一个像素点的强度为灰度值大于第一阈值的像素点的灰度值之和，或者，所述灰度值大于第一阈值的至少一个像素点的强度为灰度值大于第一阈值的像素点的灰度值的平均值；所述灰度值大于第二阈值的至少一个像素点的面积为灰度值大于第二阈值的像素点的个数。

可选地，反光判断模块包括反光判断模型、反光层强度判断单元和联合判断单元，该反光判断模型是以第一图像和输入图像作为输入的神经网络，反光判断模型的输出为表示输入图像是否有反光的第一判断值；该反光层强度判断单元计算所述输入图像和第一图像之差的灰度值，并根据灰度值输出表示所述输入图像是否有反光的第二判断值；该联合判断单元根据第一判断值和第二判断值，确定判断结果。

上述技术方案中，可以通过多种模型或者模块判断原始图像是否有反光，提高了判断结果的准确性。

第二方面，提供了一种图像处理方法，包括：对输入图像进行反光消除处理，获取第一图像；根据输入图像和第一图像，判断输入图像是否有反光；根据所述输入图像是否有反光，获取输出图像。

在一种实现方式中，可以对原始图像进行预处理，以获取输入图像，该原始图像的尺寸大于输入图像的尺寸。

可选地，根据所述输入图像是否有反光，获取输出图像包括：当输入图像没有反光时，输出图像为原始图像。

可选地，根据所述输入图像是否有反光，获取输出图像包括：当输入图像有反光，并且输入图像为原始图像时，该方法还包括：根据输入图像和第一图像生成反光层小图；根据反光层小图和原始图像获取所述输出图像。

可选地，根据所述输入图像是否有反光，获取输出图像包括：当输入图像有反光时，并且输入图像为原始图像预处理后的图像时，该方法还包括：根据输入图像和第一图像生成反光层小图；对反光层小图进行上采样，获取反光图层；根据反光图层和原始图像获取所述输出图像。

可选地，上述根据输入图像和第一图像，判断输入图像是否有反光包括：根据反光判断模型，判断输入图像是否有反光；该反光判断模型是以第一图像和输入图像作为输入的神经网络，反光判断模型的输出表示输入图像有反光的置信度，或者输出为所述输入图像是否有反光的判断结果。

可选地，上述根据输入图像和第一图像，判断输入图像是否有反光包括：根据反光层强度判断单元，判断输入图像是否有反光；该反光层强度判断单元用于根据输入图像和第一图像生成反光层小图；反光层强度判断单元还用于计算反光层小图包括的多个像素点的灰度值，并根据多个像素点的灰度值确定判断结果。

在一种实现方式中，反光层判断模块根据如下信息中的至少一种或者多种的加权结果，确定判断结果：多个像素点的灰度值中的最大值、灰度值大于第一阈值的至少一个像素点的强度、灰度值大于第二阈值的至少一个像素点的面积；其中，所述灰度值大于第一阈值的至少一个像素点的强度为灰度值大于第一阈值的像素点的灰度值之和，或者，所述灰度值大于第一阈值的至少一个像素点的强度为灰度值大于第一阈值的像素点的灰度值的平均值；所述灰度值大于第二阈值的至少一个像素点的面积为灰度值大于第二阈值的像素点的个数。

可选地，上述根据输入图像和第一图像，判断输入图像是否有反光包括：根据反光判断模型、反光层强度判断单元和联合判断单元，判断输入图像是否有反光；该反光判断模型是以第一图像和输入图像作为输入的神经网络，反光判断模型的输出为表示输入图像是否有反光的第一判断值；反光层强度判断单元计算输入图像和第一图像之差的灰度值，并根据灰度值输出表示所述输入图像是否有反光的第二判断值；该联合判断单元根据第一判断值和第二判断值，确定判断结果。

第三方面，提供一种计算机可读介质，该计算机可读介质存储用于设备执行的程序代码，该程序代码包括用于执行第二方面或者第二方面的任意一种实现方式中的图像处理方法。

第四方面，提供了一种计算机程序产品，该计算机程序产品包括：计算机程序代码，当所述计算机程序代码在计算机上运行时，使得计算机执行第二方面或者第二方面的任意一种实现方式中的图像处理方法。

第五方面，提供一种芯片，该芯片包括处理器与数据接口，处理器通过所述数据接口读取存储器上存储的指令，执行上述第二方面或第二方面中的任意一种实现方式中的图像处理方法。

可选地，作为一种实现方式，该芯片还可以包括存储器，存储器中存储有指令，处理器用于执行存储器上存储的指令，当指令被执行时，处理器用于执行第二方面或者第二方面中的任意一种实现方式中的图像处理方法。

第六方面，提供了一种装置，包括：处理器和存储器，存储器用于存储所述计算机程序代码，当所述计算机程序代码在所述处理器上运行时，使得该装置执行第二方面或者第二方面的任意一种实现方式中的图像处理方法。

附图说明

图1是本申请实施例提供的图像处理方法的应用场景示意图；

图2是本申请实施例提供的一种应用场景的示意图；

图3是本申请实施例提供的另一种应用场景的示意图；

图4是本申请实施例提供的系统架构示意图；

图5是本申请实施例提供的芯片硬件结构示意图；

图6是本申请实施例提供的反光检测与去除系统软件架构的示意图；

图7是本申请实施例提供的一种图像处理方法的流程示意图；

图8是本申请实施例提供的一种反光判断模型的结构示意图；

图9是本申请实施例提供的另一种图像处理方法的流程示意图；

图10是本申请实施例提供的一种反光强度判断模型的结构示意图；

图11是本申请实施例提供的另一种图像处理方法的流程示意图；

图12是本申请实施例提供的一种图像处理装置的硬件结构示意图；

图13是本申请实施例提供的另一种图像处理装置的硬件结构示意图；

图14是本申请实施例提供的另一种图像处理装置的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。可以理解的是，所描述的实施例是本申请一部分的实施例，而不是全部的实施例。

图1是本申请实施例提供的图像处理方法的应用场景示意图。

如图1所示，本申请实施的图像处理方法可以应用于智能终端，比如，可以对智能设备中的摄像头拍摄的原始图像进行图像处理，得到该原始图像去除画面中的反光后的高清大图，从而提高图像显示的质量。上述智能终端可以为移动的或固定的，例如，该智能终端可以是具有图像处理功能的移动电话、平板个人电脑(tablet personal computer，TPC)、媒体播放器、智能电视、笔记本电脑(laptop computer，LC)、个人数字助理(personal digital assistant，PDA)、个人计算机(personal computer，PC)、照相机、摄像机、智能手表、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)，可穿戴式设备(wearable device，WD)或者自动驾驶的车辆等，本申请实施例对此不作限定。

下面对本申请实施例的具体应用场景进行举例说明。

应用场景一：智能终端拍照领域

在一个实施例中，如图2所示，本申请实施例的图像处理方法可以应用于智能终端设备(例如，手机)的拍摄。在通过智能终端的摄像头对物体进行拍照时，在博物馆、商场等场景下，可能遇到拍摄玻璃、橱窗的画面中存在反光区域的情况。通过本申请实施例的图像方法，即去除反光的方法，可以获得画面质量较高的、对原始图像去除反光区域的输出图像。

示例性地，可以通过本申请实施例的图像处理方法在智能终端进行实时拍照时，对拍摄得到的原始图像进行下采样处理，将原始图像处理成较小的图像；将处理后的小的图像进行反光消除处理，将原始的小图和反光消除后的小图进行对比处理，判断原图像是否存在反光区域；若原图像存在反光区域，对原始小图和反光消除后的小图相减得到的反光层小图进行上采样，并在原始的图像中剥离上采样后的反光层小图，得到高质量的消除反光的图像，将输出图像显示在智能终端的屏幕上。

示例性地，可以通过本申请实施例的图像处理方法在智能终端进行实时拍照时，对拍摄得到的原始图像进行下采样处理，将原始图像处理成较小的图像；将处理后的小的图像进行反光消除处理，将原始的小图和反光消除后的小图进行对比处理，判断原图像是否存在反光区域；若原图像存在反光区域，对原始小图和反光消除后的小图相减得到的反光层小图进行上采样，并在原始的图像中剥离上采样后的反光层小图，得到高质量的消除反光的图像，将输出图像保存至智能终端的相册中。

应用场景二：自动驾驶领域

在一个实施例中，如图3所示，本申请实施例的图像处理方法可以应用于自动驾驶领域。例如，可以应用于自动驾驶车辆的导航系统中，通过本申请中的图像处理方法可以使得自动驾驶车辆在道路行驶的导航过程中，通过对获取的画面中存在玻璃反光区域的图像进行处理，消除图相中的反光区域，得到高质量的无反光图像，从而实现自动驾驶车辆的安全性。

示例性地，本申请提供了一种图像处理方法，包括：对拍摄得到的原始图像进行下采样处理，将原始图像处理成较小的图像；将处理后的小的图像进行反光消除处理，将原始的小图和反光消除后的小图进行对比处理，判断原图像是否存在反光区域；若原图像存在反光区域，对原始小图和反光消除后的小图相减得到的反光层小图进行上采样，并在原始的图像中剥离上采样后的反光层小图，得到高质量的消除反光的道路图像。

由于本申请实施例涉及大量神经网络的应用，为了便于理解，下面先对本申请实施例可能涉及的神经网络的相关术语和概念进行介绍。

(1)神经网络

神经网络可以是由神经单元组成的，神经单元可以是指以xs和截距1为输入的运算单元，该运算单元的输出可以为：

其中，s＝1、2、……n，n为大于1的自然数，Ws为xs的权重，b为神经单元的偏置。f为神经单元的激活函数(activation functions)，用于将非线性特性引入神经网络中，来将神经单元中的输入信号转换为输出信号。该激活函数的输出信号可以作为下一层卷积层的输入，激活函数可以是sigmoid函数。神经网络是将多个上述单一的神经单元联结在一起形成的网络，即一个神经单元的输出可以是另一个神经单元的输入。每个神经单元的输入可以与前一层的局部接受域相连，来提取局部接受域的特征，局部接受域可以是由若干个神经单元组成的区域。

(2)深度神经网络

深度神经网络(deep neural network，DNN)，也称多层神经网络，可以理解为具有多层隐含层的神经网络。按照不同层的位置对DNN进行划分，DNN内部的神经网络可以分为三类：输入层，隐含层，输出层。一般来说第一层是输入层，最后一层是输出层，中间的层数都是隐含层。层与层之间是全连接的，也就是说，第i层的任意一个神经元一定与第i+1层的任意一个神经元相连。

虽然DNN看起来很复杂，但是就每一层的工作来说，其实并不复杂，简单来说就是如下线性关系表达式：

其中，

是输入向量，

是输出向量，

是偏移向量，W是权重矩阵(也称系数)，α()是激活函数。每一层仅仅是对输入向量

经过如此简单的操作得到输出向量

由于DNN层数多，系数W和偏移向量

的数量也比较多。这些参数在DNN中的定义如下所述：以系数W为例：假设在一个三层的DNN中，第二层的第4个神经元到第三层的第2个神经元的线性系数定义为

上标3代表系数W所在的层数，而下标对应的是输出的第三层索引2和输入的第二层索引4。

综上，第L-1层的第k个神经元到第L层的第j个神经元的系数定义为

需要注意的是，输入层是没有W参数的。在深度神经网络中，更多的隐含层让网络更能够刻画现实世界中的复杂情形。理论上而言，参数越多的模型复杂度越高，“容量”也就越大，也就意味着它能完成更复杂的学习任务。训练深度神经网络的也就是学习权重矩阵的过程，其最终目的是得到训练好的深度神经网络的所有层的权重矩阵(由很多层的向量W形成的权重矩阵)。

(3)卷积神经网络

卷积神经网络(convolutional neuron network，CNN)是一种带有卷积结构的深度神经网络。卷积神经网络包含了一个由卷积层和子采样层构成的特征抽取器，该特征抽取器可以看作是滤波器。卷积层是指卷积神经网络中对输入信号进行卷积处理的神经元层。在卷积神经网络的卷积层中，一个神经元可以只与部分邻层神经元连接。一个卷积层中，通常包含若干个特征平面，每个特征平面可以由一些矩形排列的神经单元组成。同一特征平面的神经单元共享权重，这里共享的权重就是卷积核。共享权重可以理解为提取图像信息的方式与位置无关。卷积核可以以随机大小的矩阵的形式初始化，在卷积神经网络的训练过程中卷积核可以通过学习得到合理的权重。另外，共享权重带来的直接好处是减少卷积神经网络各层之间的连接，同时又降低了过拟合的风险。

(4)生成式对抗网络

生成式对抗网络(GAN,Generative Adversarial Networks)是一种深度学习模型。该模型中至少包括两个模块：一个模块是生成模型(Generative Model)，另一个模块是判别模型(Discriminative Model)，通过这两个模块互相博弈学习，从而产生更好的输出。生成模型和判别模型都可以是神经网络，具体可以是深度神经网络，或者卷积神经网络。GAN的基本原理如下：以生成图像的GAN为例，假设有两个网络，G(Generator)和D(Discriminator)，其中G是一个生成图像的网络，它接收一个随机的噪声z，通过这个噪声生成图像，记做G(z)；D是一个判别网络，用于判别一张图像是不是“真实的”。它的输入参数是x，x代表一张图像，输出D(x)代表x为真实图像的概率，如果为1，就代表100％是真实的图像，如果为0，就代表不可能是真实的图像。在对该生成式对抗网络进行训练的过程中，生成网络G的目标就是尽可能生成真实的图像去欺骗判别网络D，而判别网络D的目标就是尽量把G生成的图像和真实的图像区分开来。这样，G和D就构成了一个动态的“博弈”过程，也即“生成式对抗网络”中的“对抗”。最后博弈的结果，在理想的状态下，G可以生成足以“以假乱真”的图像G(z)，而D难以判定G生成的图像究竟是不是真实的，即D(G(z))＝0.5。这样就得到了一个优异的生成模型G，它可以用来生成图像。

(5)损失函数

在训练深度神经网络的过程中，因为希望深度神经网络的输出尽可能的接近真正想要预测的值，所以可以通过比较当前网络的预测值和真正想要的目标值，再根据两者之间的差异情况来更新每一层神经网络的权重向量(当然，在第一次更新之前通常会有初始化的过程，即为深度神经网络中的各层预先配置参数)，比如，如果网络的预测值高了，就调整权重向量让它预测低一些，不断地调整，直到深度神经网络能够预测出真正想要的目标值或与真正想要的目标值非常接近的值。因此，就需要预先定义“如何比较预测值和目标值之间的差异”，这便是损失函数(loss function)或目标函数(objective function)，它们是用于衡量预测值和目标值的差异的重要方程。其中，以损失函数举例，损失函数的输出值(loss)越高表示差异越大，那么深度神经网络的训练就变成了尽可能缩小这个loss的过程。

图4是本申请实施例提供的一种系统架构100。

在图4中，数据采集设备160用于采集训练数据。针对本申请实施例的图像处理方法来说，可以通过训练数据对图像处理模型进行进一步训练，即数据采集设备160采集的训练数据可以是训练图像。

示例性地，在本申请实施例中训练图像处理模型的训练数据可以包括原始图像、与原始图像对应的样本图像。训练数据还可以包括标签，例如表示原始图像是否有反光的标签。

例如，原始图像可以是指存在反光区域的图像；样本图像可以是指经过图像反光消除处理后的输出图像，比如，可以是指相对于原始图像而言反光区域得到部分或全部消除的图像。

在采集到训练数据之后，数据采集设备160将这些训练数据存入数据库130，训练设备120基于数据库130中维护的训练数据训练得到目标模型/规则101(即本申请实施例中的图像处理模型)。训练设备120将训练数据输入图像处理模型，直到训练图像处理模型输出的预测图像与样本图像之间的差值满足预设条件(例如，预测图像与样本图像差值小于一定阈值，或者预测图像与样本图像的差值保持不变或不再减少)，从而完成目标模型/规则101的训练。

示例性地，本申请实施例中用于执行图像处理方法的图像处理模型可以实现端到端的训练，比如，图像处理模型可以通过输入原始图像与输入原始图像对应的消除反光区域后的图像(例如，真值图像)实现端到端的训练。

在本申请提供的实施例中，该目标模型/规则101是通过训练图像处理模型得到的，即图像处理模型可以是反光判断和消除的模型。需要说明的是，在实际的应用中，所述数据库130中维护的训练数据不一定都来自于数据采集设备160的采集，也有可能是从其他设备接收得到的。

另外需要说明的是，训练设备120也不一定完全基于数据库130维护的训练数据进行目标模型/规则101的训练，也有可能从云端或其他地方获取训练数据进行模型训练，上述描述不应该作为对本申请实施例的限定。还需要说明的是，数据库130中维护的训练数据中的至少部分数据也可以用于执行设备110对待处理处理进行处理的过程。

根据训练设备120训练得到的目标模型/规则101可以应用于不同的系统或设备中，如应用于图4所示的执行设备110，所述执行设备110可以是终端，如手机终端，平板电脑，笔记本电脑，AR/VR，车载终端等，还可以是服务器或者云端等。

在图4中，执行设备110配置输入/输出(input/output，I/O)接口112，用于与外部设备进行数据交互，用户可以通过客户设备140向I/O接口112输入数据，所述输入数据在本申请实施例中可以包括：客户设备输入的待处理图像。

预处理模块113和预处理模块114用于根据I/O接口112接收到的输入数据(如待处理图像)进行预处理，在本申请实施例中，也可以没有预处理模块113和预处理模块114(也可以只有其中的一个预处理模块)，而直接采用计算模块111对输入数据进行处理。

在执行设备110对输入数据进行预处理，或者在执行设备110的计算模块111执行计算等相关的处理过程中，执行设备110可以调用数据存储系统150中的数据、代码等以用于相应的处理，也可以将相应处理得到的数据、指令等存入数据存储系统150中。

最后，I/O接口112将处理结果，如上述得到待处理原始图像的消除反光区域的图像，即将得到的输出图像返回给客户设备140，从而提供给用户。

值得说明的是，训练设备120可以针对不同的目标或称不同的任务，基于不同的训练数据生成相应的目标模型/规则101，该相应的目标模型/规则101即可以用于实现上述目标或完成上述任务，从而为用户提供所需的结果。

在图4中所示情况下，在一种情况下，用户可以手动给定输入数据，该手动给定可以通过I/O接口112提供的界面进行操作。

另一种情况下，客户设备140可以自动地向I/O接口112发送输入数据，如果要求客户设备140自动发送输入数据需要获得用户的授权，则用户可以在客户设备140中设置相应权限。用户可以在客户设备140查看执行设备110输出的结果，具体的呈现形式可以是显示、声音、动作等具体方式。客户设备140也可以作为数据采集端，采集如图所示输入I/O接口112的输入数据及输出I/O接口112的输出结果作为新的样本数据，并存入数据库130。当然，也可以不经过客户设备140进行采集，而是由I/O接口112直接将如图所示输入I/O接口112的输入数据及输出I/O接口112的输出结果，作为新的样本数据存入数据库130。

值得注意的是，图4仅是本申请实施例提供的一种系统架构的示意图，图中所示设备、器件、模块等之间的位置关系不构成任何限制。例如，在图4中，数据存储系统150相对执行设备110是外部存储器，在其它情况下，也可以将数据存储系统150置于执行设备110中。

如图4所示，根据训练设备120训练得到目标模型/规则101，该目标模型/规则101在本申请实施例中可以是图像处理模型，具体的，本申请实施例提供的图像处理模型可以是深度神经网络，卷积神经网络，或者，可以是深度卷积神经网络等。

图5是本申请实施例提供的一种芯片的硬件结构，该芯片包括神经网络处理器300(neural-network processing unit，NPU)。该芯片可以被设置在如图4所示的执行设备110中，用以完成计算模块111的计算工作。该芯片也可以被设置在如图4所示的训练设备120中，用以完成训练设备120的训练工作并输出目标模型/规则101。

NPU 300作为协处理器挂载到主中央处理器(central processing unit，CPU)上，由主CPU分配任务。NPU 300的核心部分为运算电路303，控制器304控制运算电路303提取存储器(权重存储器或输入存储器)中的数据并进行运算。

在一些实现中，运算电路303内部包括多个处理单元(process engine,PE)。在一些实现中，运算电路303是二维脉动阵列；运算电路303还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中，运算电路303是通用的矩阵处理器。

举例来说，假设有输入矩阵A，权重矩阵B，输出矩阵C；运算电路303从权重存储器302中取矩阵B相应的数据，并缓存在运算电路303中每一个PE上；运算电路303从输入存储器301中取矩阵A数据与矩阵B进行矩阵运算，得到的矩阵的部分结果或最终结果，保存在累加器308(accumulator)中。

向量计算单元307可以对运算电路303的输出做进一步处理，如向量乘，向量加，指数运算，对数运算，大小比较等等。例如，向量计算单元307可以用于神经网络中非卷积/非FC层的网络计算，如池化(pooling)，批归一化(batch normalization)，局部响应归一化(local response normalization)等。

在一些实现种，向量计算单元能307将经处理的输出的向量存储到统一存储器306。例如，向量计算单元307可以将非线性函数应用到运算电路303的输出，例如累加值的向量，用以生成激活值。在一些实现中，向量计算单元307生成归一化的值、合并值，或二者均有。

在一些实现中，处理过的输出的向量能够用作到运算电路303的激活输入，例如用于在神经网络中的后续层中的使用。

统一存储器306用于存放输入数据以及输出数据。权重数据直接通过存储单元访问控制器305(direct memory access controller，DMAC)将外部存储器中的输入数据存入到输入存储器301和/或统一存储器306、将外部存储器中的权重数据存入权重存储器302，以及将统一存储器306中的数据存入外部存储器。

总线接口单元310(bus interface unit，BIU)，用于通过总线实现主CPU、DMAC和取指存储器309之间进行交互。

与控制器304连接的取指存储器309(instruction fetch buffer)用于存储控制器304使用的指令；控制器304用于调用取指存储器309中缓存的指令，实现控制该运算加速器的工作过程。

一般地，统一存储器306，输入存储器301，权重存储器302以及取指存储器309均为片上(On-Chip)存储器，外部存储器为该NPU外部的存储器，该外部存储器可以为双倍数据率同步动态随机存储器(double data rate synchronous dynamic random access memory，DDR SDRAM)、高带宽存储器(high bandwidth memory，HBM)或其他可读可写的存储器。

上文中介绍的图4中的执行设备110能够执行本申请实施例的图像处理方法的各个步骤，图5所示的芯片也可以用于执行本申请实施例的图像处理方法的各个步骤。

本申请实施例提供的图像处理方法可部署在相关设备的计算节点上，通过软件算法能够有效的实现本申请实施例中的反光检测和去除的方法。下面结合图6对本申请实施例的系统架构进行详细描述。

如图6所示，本申请实施例的图像处理方法可以由图像反光检测与去除系统软件架构500实现，其中反光检测与去除系统软件架构可以包括：图像预处理模块510，网络推理模块520，图像后处理模块530和软件处理模块540。下面对各个模块进行详细说明。

图像预处理模块510，用于对原始图像进行预处理，例如将原始的高清大图处理成固定大小的小图。图像预处理模块510的输入为原始图像，输出为固定大小的小图，该小图可以作为网络推理模块520的输入图像，该输入图像的尺寸符和网络推理模块520的神经网络模型的输入尺寸。由于原始高清大图的往往具有较高的分辨率，例如4K分辨率，超出了图像反光检测与去除神经网络模型的输入尺寸，因此需要对原始图像进行预处理，使得处理后的图像能够适应图像反光检测与去除神经网络模型的输入。示例性地，可以用下采样，或者减均值，或者归一化等方式对原始图像进行预处理。示例性地，预处理后得到的输入图像为896×896像素的小图。应理解，预处理后得到的输入图像的尺寸还可以是其他符合图像反光检测与去除神经网络模型的输入要求的尺寸，本申请实施例对此不作限定。

图像预处理模块510是可选的模块。在一些实施例中，原始图像的尺寸符合网络推理模块520的神经网络模型的输入尺寸要求，在这种情况下，无需对原始图像进行预处理，输入网络推理模块520的输入图像为原始图像。

网络推理模块520，包括反光消除模型，用于对输入图像做初步反光消除处理。其中，反光消除模型的输入原始图像，或者输入原始图像经过图像预处理得到的输入图像，输出为对输入图像进行反光消除后的图像(例如，下文所述的第一图像)。

在一些实施例中，网络推理模块520还可以包括反光判断模型，用于判断输入图像是否有反光。其中，反光判断模块的输入为第一图像和输入图像，输出为初步反光判断结果。例如，该判断结果为：输入图像有反光；或者，输入图像无反光。

一些反光消除模型对于输入图像的尺寸有限制。换句话说，此类反光消除模型只能处理分辨率较低的图像，例如896×896像素。在此情况下，可以通过图像预处理模块510将高清大图的原始图像(例如4K分辨率)预处理为小图像输入反光模型中。本申请的这种处理方案，使得即使使用低分辨率的反光消除模型，也能处理高清大图的反光问题。

图像后处理模块530，用于判断输入图像是否有反光，并根据判断结果对原始图像进行处理，输出消除反光的图像。

在一些实施例中，网络推理模块520包括反光判断模型，图像后处理模块530用于根据反光判断模型的判断结果确定输入图像是否有反光。当确定输入图像有反光时，对原始图像进行处理，输出消除反光的图像；否则，输出原始图像。

在一些实施例中，图像后处理模块530包括反光层强度判断单元，该反光层强度判断单元的输入为第一图像和输入图像，输出为判断输入图像是否有反光的判断值。图像后处理模块530还用于根据反光层强度判断单元的判断结果，确定输入图像是否有反光。当确定输入图像有反光时，对原始图像进行处理，输出消除反光的图像；否则，输出原始图像。

在一些实施例中，网络推理模块520包括反光判断模型，图像后处理模块530包括反光层强度判断单元和联合判断单元。图像后处理模块530用于根据反光判断模型的判断结果和反光层强度判断单元的判断结果判断输入图像是否有反光。当确定输入图像有反光时，对原始图像进行处理，输出消除反光的图像；否则，输出原始图像。

在一些实施例中，输入图像是原始图像。在这种情况下，当网络推理模块520的结果为输入图像有反光时，图像后处理模块530用于将第一图像和输入图像相减，得到反光层小图，在原始图像中剥离该反光层小图，得到输出图像。该输出图像是原始图像消除反光后得到的图像。

当网络推理模块520的结果为输入图像无反光时，图像后处理模块530无须对原始图像进行处理，在这种情况下，输出原始图像作为图像后处理模块530的输出图像。

在另一些实施例中，输入图像是原始图像经过上述预处理后得到的图像。

在这种情况下，当网络推理模块520的结果为输入图像有反光时，图像后处理模块530用于将第一图像和输入图像相减，得到反光层小图。图像后处理模块530还用于对该反光层小图进行上采样，得到反光图层，其中该反光图层的尺寸为原始图像的尺寸。图像后处理模块530从原始图像中剥离反光图层，得到原始图像消除反光后的输出图像。

当网络推理模块520的结果为输入图像无反光时，图像后处理模块530无须对原始图像进行处理，在这种情况下，输出图像为原始图像。

应理解，网络推理模块520判断为无反光的图像，可能是完全没有反光的图像，也可能是反光成分非常低从而不会影响图像质量的图像(例如反光判断得到的反光置信度低于一定阈值的图像)。对于这样的图像进行传统的反光消除处理，可能反而会降低图像质量。本申请实施例可以直接将这些原始图像作为输出图像，改善反光消除效果。

软件处理模块540，用于接收图像后处理模块530的输出图像，并向用户呈现该输出图像。具体地，软件处理模块540主要起调度作用，控制设备从图库或者相机等处获取图像，控制启用图像预处理模块510、网络推理模块520、图像后处理模块530的运行，同时与用户交互，将有无反光结果和无反光图推荐给用户。

在一些实施例中，图像预处理模块510、图像后处理模块530以及软件处理模块540可以由图5所示的芯片的主CPU实现；网络推理模块520可以由图5所示的芯片的神经网络处理器300实现。

本申请的反光消除方案不是简单地对所有图像进行消除操作，而是会通过初步消除反光的图像进一步判断原图像中是否有反光，再根据判断结果提供最终输出图像。这样能够改善图像的反光处理效果。

例如，对于判断为无反光的图像或反光程度较低的图像，可以不须经过反光消除处理，以免引入更多的处理噪声反而降低图像质量。

另一方面，如果反光消除模型直接处理高清大图，模型的网络复杂度和设备的耗电量会显著增加，不适用于一些小型设备，例如移动终端。本申请实施例的反光消除模型可以保持较小的网络复杂度，并且通过网络推理模块的上采样等处理，使得高清大图(例如移动终端的摄像头拍摄得到的图片)的反光消除效果仍然较佳。

下面结合图7至图11详细描述本申请实施例的图像处理方法。

图7是本申请一实施例的图像处理方法700的示意图。该方法可以由图6所示的反光检测和去除系统软件架构实现。该方法还可以由能够进行图像处理的装置执行，例如，该方法可以由图4中的执行设备110执行。下面对该方法700中的步骤进行详细的描述。

S710，对原始图像进行预处理，获得符合反光消除模型输入尺寸的第一图像。步骤S710可以由图6所示的软件架构中的图像预处理模块510实现。具体来说，原始图像往往具有较大的尺寸或者较高的分辨率，例如4K分辨率。这样的原始图像的大小超出了反光消除模型的输入尺寸，因此需要对原始图像进行预处理。

示例性地，可以采用下采样的方式对原始图像进行处理，从高清原始图像采样生成输入图像。该输入图像可以是固定尺寸的小图，并且输入图像的尺寸符合反光消除模型的输入尺寸要求。例如，预处理后得到的输入图像的尺寸是896×896像素。应理解，预处理后得到的输入图像的尺寸还可以是其他符合反光消除模型的输入要求的尺寸，本申请实施例对此不作限定。

在一些实施例中，原始图像的尺寸符合反光消除模型的输入尺寸要求，因此可以不执行步骤S710中的图像预处理操作。在这种情况下，可以直接把原始图像作为输入图像，执行以下的步骤。

S720，将输入图像输入反光消除模型，获得反光消除后的第一图像。步骤S720可以由图6所示的软件架构中的网络推理模块520实现。在步骤720中，反光消除模型可以是通过生成对抗神经网络(generative adversarial networks，GAN)得到的生成网络，或者其他神经网络，本申请实施例对此不作限定。

S730，将第一图像和输入图像输入反光判断模型，获得反光判断模型的判断结果(例如，下文所述的第一判断值)。步骤S730可以由图6所示的软件架构中的网络推理模块520实现。在本申请的实施例中，反光判断神经网络模型可以是二分类神经网络模型，用来判断原始图像是否为有反光的图像。

示例性地，在一些实施例中，反光判断模型为基于马尔科夫判别器的二分类神经网络。图8是本申请一实施例的反光判断模型的示意图。

如图8所示，该反光判断模型由多个卷积层组成，卷积层可以扩大每个神经元的感受野。该马尔科夫判别器的输出为一个矩阵，矩阵中的每一个输出，代表着输入图片的一个感受野，对应了输入图片的一片(patch)。该反光判断模型的最后一个卷积层的输出为多个patch的预测结果。该反光判断模型的输入为第一图像和输入图像，输出为第一判断值。例如，第一判断值为输入图像有反光，或者第一判断值为输入图像无反光。

在一些实施例中，还可以在最后一个卷积层后增加一层全连接层，对多个patch的预测的结果进行非线性映射，得到一个反光置信系数。反光置信系数也可以称为反光置信度、反光系数等，用于表示图像存在反光成分的可能性，或者表示图像不存在反光成分的可能性。下面的实施例中，以反光置信系数表示图像存在反光成分的可能性为例进行说明。

在一些实施例中，可以根据反光置信系数的值确定第一判断值。例如，当反光置信系数的值大于特定阈值时，第一判断值为1，表示输入图像有反光；否则，第一判断值为0，表示输入图像无反光。或者，当置信系数的值小于特定阈值时，第一判断值为1，表示输入图像有反光；否则，第一判断值为0，表示输入图像无反光。第一判断值的具体取值和图像有无反光的对应关系不限于上述实例，可以根据需要进行各种合理的设置。

在另一些实施例中，可以将反光置信系数的值直接作为第一判断值。在此情况下，由反光判断模型的后续模块或单元根据该第一判断值，进一步确定图像中是否存在反光。

在一些实施例中，可以采用如下的方式对反光判断模型进行训练：

将成对的原始图像样本和原始图像样本消除反光后的结果，以及原始图像是否为反光图像的标签(label)输入反光判断模型进行训练。示例性的，如果原始图像为有反光图像，那么标签为1；如果原始图像为无反光图像，那么标签为0。反光判断模型本质上是一个二分类网络，用来区分样本的真伪，可以使用交叉熵来进行判别分布的相似性，损失(loss)函数为：

其中，N为样本数；

x _i表示第i对样本，即成对的原始图像和该图像消除反光后的结果；

y _i表示x _i的标签，正类为1，负类为0。示例性地，如上文所述，如果原始有反光，那么标签可以是1，如果原始图片无反光，标签可以是0；

D(x _i)表示对样本x _i预测的结果为上述“正类”的概率。

当loss函数的值小于阈值时，认为反光判断模型训练完成。

S740，根据第一判断值，对原始图像进行消除反光处理。步骤S740可以由图6所示的软件架构中的图像后处理模块530实现。在步骤S740中，输入为原始图像、第一图像、输入图像和步骤730得到的第一判断值；输出为原始图像消除反光后的图像。具体来说，根据反光判断结果(第一判断值)对原始图像进行消除反光处理可以分为以下几种情况：

情况1：输入图像有反光，并且输入图像为原始图像。

在这种情况下，可以将输入图像与第一图像相减，得到反光层小图。在一些实施例中，还可以对第一图像与输入图像相减的结果进行滤波，得到反光层小图。

例如，可以通过以下的计算方式得到反光层小图：

M _blend-M _{low_trans}＝M _{low_ref}

其中，M _blend为输入图像，M _{low_trans}为第一图像，M _{low_ref}为反光层小图。

示例性地，输入图像、第一图像都是三通道的RGB图，输入图像和第一图像的尺寸均为896×896像素，那么M _blend和M _{low_trans}均为896×896×3的矩阵。其中矩阵的每一个元素表示该图像的每一个像素点在红色(red，R)、绿色(green，G)、蓝色(blue，B)三个颜色通道的亮度值。

在这种情况下，输入图像和第一图像相减得到的M _{low_ref}也是一个896×896×3，其中矩阵中的每一个元素表示反光层小图的每一个像素点在RGB三个颜色通道的亮度值。

由于输入图像的尺寸为原始图像的尺寸，因此反光层小图也为原始图像的尺寸。从原始图像中将反光层小图剥离，可以得到输出图像，该输出图像为原始图像消除反光后的图像。

例如，可以通过以下的计算方式得到原始图像消除反光后的图像：

M _orig-M _ref＝M _trans

其中，M _orig为原始图像，M _ref为反光图层，M _trans为原始图像消除反光图层后的结果。

在情况1所述的实施例中，由于输入图像的尺寸为原始图像的尺寸，反光层小图也为原始图像的尺寸，因此反光图层M _ref与反光层小图M _{low_ref}相等。在该实施例中，M _orig和M _ref都是896×896×3的矩阵，因此，将原始图像和反光图层相减得到的原始图像去除反光后的图像M _trans也是一个896×896×3的矩阵，其中矩阵中的每一个元素表示原始图像消除反光后的图像中的每一个像素点在RGB三个颜色通道的亮度值。

情况2：输入图像有反光，并且输入图像为原始图像经过预处理后的图像。

例如，可以通过以下的计算方式得到反光层小图：

M _blend-M _{low_trans}＝M _{low_ref}

示例性地，输入图像、第一图像都是三通道的RGB图，输入图像和第一图像的尺寸均为896×896像素，那么M _blend和M _{low_trans}均为896×896×3的矩阵。其中矩阵的每一个元素表示图像的每一个像素点在RGB三个颜色通道的亮度值。

由于输入图像是原始图像经过预处理后的图像，因此反光层小图的尺寸小于原始图像的尺寸。在这种情况下，可以对该反光层小图进行上采样，得到反光图层，该反光图层的尺寸为原始图像的尺寸。在一些实施例中，可以采用插值的方式对第一反光层小图进行上采样。从原始图像中将反光图层剥离，可以得到输出图像，该输出图像为原始图像消除反光后的图像。

M _orig-M _ref＝M _trans

在情况2所述的实施例中，输入图像为原始图像经过预处理后的图像，因此反光层小图的尺寸小于原始图像的尺寸。

示例性地，原始图像的尺寸为4K(3000×4000像素)，M _orig是一个3000×4000×3的矩阵。在这种情况下对反光层小图M _{low_ref}采用差值的方式进行上采样，可以得到与原始图像尺寸一致的反光图层M _ref，M _ref也是一个3000×4000×3的矩阵，其中矩阵中的每一个元素表示反光图层的每一个像素点在RGB三个颜色通道的亮度值。

将原始图像M _orig和反光图层相减M _ref得到的原始图像消除反光后的图像M _trans也是一个3000×4000×3的矩阵，其中矩阵中的每一个元素表示原始图像消除反光后的图像中的每一个像素点在RGB三个颜色通道的亮度值。

情况3：输入图像无反光。

在这种情况下，由于输入图像无反光，无需对原始图像进行处理。因此输出的输出图像为原始图像。

根据反光层强度判断模型，可以判断出图像中是否有反光，从而根据判断结果选择合适的反光处理方式，能够改善图像的反光处理效果。

本申请实施例提供的图像处理方法，一方面，可以自动识别原始图像是否有反光，并对有反光的原始图像进行反光消除处理。另一方面，本申请实施例的图像处理方法，在原始图像尺寸较大时，先通过原图下采样以适应神经网络的输入规模，又对反光层小图进行上采样，并从原图中剥离上采样后的反光图层，实现了高分辨率图像的反光消除。

此外，本申请实施例的图像处理方法，通过反光判断模型和反光消除模型两个轻量级神经网络实现反光的识别和消除功能，克服了高清图像所需的反光消除网络过大的问题。

图9是本申请另一实施例的图像处理方法900的示意图。该方法可以由图6所示的反光检测和去除系统软件架构实现。该方法还可以由能够进行图像处理的装置执行，例如，该方法可以由图4中的执行设备110执行。下面对该方法900中的步骤进行详细的描述。

S910，对原始图像进行预处理，获得符合反光消除模型输入尺寸的输入图像。步骤S910可以由图6所示的软件架构中的图像预处理模块510实现。

S920，将输入图像输入反光消除模型，获得反光消除后的第一图像。步骤S920可以由图6所示的软件架构中的网络推理模块520实现。

在方法900中，步骤S910至步骤S920与图7所示的方法700中的步骤S710至步骤S720相似，不再赘述。

S930，第一图像和输入图像输入反光层强度判断单元，获得反光层强度判断单元的判断结果(例如，下文所述的第二判断值)。步骤S930可以由图6所示的软件架构中的图像后处理模块530实现。在一些实施例中，可以通过第一图像与输入图像差值的灰度，判断输入图像是否有反光。

图10是反光层强度判断单元的判断方法示意图。

如图10所示，反光层强度判断单元的输入为第一图像和输入图像，输出为第二判断值：输入图像有反光，或者输入图像无反光。

反光层强度判断单元计算输入图像与第一图像之差的灰度值，该灰度值可以表征图像的亮度。

示例性地，输入图像和第一图像的尺寸为896×896像素，如上述方法700中步骤S740中所述，输入图像和第一图像相减可以得到一个896×896×3的矩阵表示反光层小图。其中矩阵的每一个元素表示反光层小图的每一个像素点在RGB三个颜色通道的亮度值。

在一些实施例中，该灰度值可以根据如下公式计算得到：

Gray(i,j)＝0.299×R(i,j)+0.587×G(i,j)+0.144×B(i,j)

其中，Gray(i,j)表示反光层小图的每一个像素点的灰度值；

R(i,j)表示反光层小图每一个像素点的红色通道亮度值的绝对值，R(i,j)＝|M _{low_ref}(i,j,0)|；

G(i,j)表示反光层小图每一个像素点的绿色通道亮度值的绝对值，G(i,j)＝|M _{low_ref}(i,j,1)|；

B(i,j)表示反光层小图每一个像素点的蓝色通道亮度值的绝对值，B(i,j)＝|M _{low_ref}(i,j,2)|。

应理解，本申请实施例还可以根据其他方法计算灰度值，例如取每一个像素点的RGB三个颜色通道亮度值的平均值作为每个像素点的灰度值等，本申请实施例对此不做限定。

在一些实施例中，可以根据反光层小图各个像素点灰度值的最大值、灰度值大于阈值TH1的像素点强度、灰度值大于阈值TH2的像素点面积中的至少一项或者多项的加权结果确定第二判断值。

其中，灰度值大于阈值TH1的像素点强度可以是灰度值大于阈值TH1的像素点的灰度值之和，或者，可以是灰度值大于阈值TH1的像素点的灰度值的平均值，还可以是其他用于表征强度的数值，本申请实施例对此不做限定。

其中，灰度值大于阈值TH2的像素点面积表示灰度值大于阈值TH2的像素点的个数。

示例性地，可以根据灰度大于阈值TH1的像素点强度大于阈值TH3，确定输入图像有反光。

示例性地，可以根据灰度的最大值与灰度大于阈值TH2的像素点面积的加权结果大于阈值TH3，确定输入图像有反光。

示例性地，可以根据灰度图的最大值、灰度大于阈值TH1的像素点强度、灰度大于阈值TH2的像素点面积的加权结果大于阈值TH3，确定输入图像有反光。

S940，根据第二判断值，对原始图像进行消除反光处理。步骤S940可以由图6所示的软件架构中的图像后处理模块530实现。

例如，假设第二判断值为1，表示输入图像有反光；否则，第二判断值为0，表示输入图像无反光。第二判断值的具体取值和图像有无反光的对应关系不限于上述实例，可以根据需要进行各种合理的设置。

具体来说，根据反光判断结果(第二判断值)对原始图像进行消除反光处理可以分为以下几种情况：

情况1：输入图像有反光，并且输入图像为原始图像。

在这种情况下，可以将第一图像与输入图像相减，得到反光层小图。在一些实施例中，还可以对第一图像与输入图像相减的结果进行滤波，得到反光层小图。由于输入图像的尺寸为原始图像的尺寸，因此反光层小图也为原始图像的尺寸。从原始图像中将反光层小图剥离，可以得到输出图像，该输出图像为原始图像消除反光后的图像。

在这种情况下，反光层小图、消除反光的原始图像的计算方式与上述方法700中步骤 S740中的情况1所述的计算方式相似，在此不再赘述。

在这种情况下，可以将第一图像与输入图像相减，得到反光层小图。在一些实施例中，还可以对第一图像与输入图像相减的结果进行滤波，得到反光层小图。由于输入图像是原始图像经过预处理后的图像，因此反光层小图的尺寸小于原始图像的尺寸。在这种情况下，可以对该反光层小图进行上采样，得到反光图层，该反光图层的尺寸为原始图像的尺寸。在一些实施例中，可以采用插值的方式对第一反光层小图进行上采样。从原始图像中将反光图层剥离，可以得到输出图像，该输出图像为原始图像消除反光后的图像。

在这种情况下，反光层小图、反光图层、消除反光的原始图像的计算方式与上述方法700中步骤S740中的情况2所述的计算方式相似，在此不再赘述。

情况3：输入图像无反光。

根据反光层强度判断单元，可以判断出图像中是否有反光，从而根据判断结果选择合适的反光处理方式，能够改善图像的反光处理效果。

此外，本申请实施例的图像处理方法，通过反光层强度判断单元和轻量级的反光消除模型实现反光的识别和消除功能，克服了高清图像所需的反光消除网络过大的问题。

图11是本申请另一实施例的图像处理方法1100的示意图。该方法可以由图6所示的反光检测和去除系统软件架构实现。该方法还可以由能够进行图像处理的装置执行，例如，该方法可以由图4中的执行设备110执行。下面对该方法1100中的步骤进行详细的描述。

S1110，对原始图像进行预处理，获得符合反光消除模型输入尺寸的输入图像。步骤S1110可以由图6所示的软件架构中的图像预处理模块510实现。

S1120，将输入图像输入反光消除模型，获得反光消除后的第一图像。步骤S1120可以由图6所示的软件架构中的网络推理模块520实现。

在方法1100中，步骤S1110至步骤S1120与图7所示的方法700中的步骤S710至步骤S720相似，不再赘述。

S1130，第一图像和输入图像输入反光判断模型，获得第一判断值。步骤S1130可以由图6所示的软件架构中的网络推理模块520实现。

在方法1100中，步骤S1130与图7所示的方法700中的步骤S730相似，不再赘述。

S1140，第一图像和输入图像输入反光层强度判断单元，获得第二判断值。步骤S1140可以由图6所示的软件架构中的图像后处理模块530实现。

在方法1100中，步骤S1140与图9所示的方法900中的步骤S930相似，不再赘述。

S1150，根据第一判断值和第二判断值进行联合判断，获得反光判断结果。步骤S1150可以由图6所示的软件架构中的图像后处理模块530实现。

在一些实施例中，例如第一判断值可以表示输入图像是否有反光。此时，当第一判断值和第二判断值都为有反光时，反光判断结果为有反光；当第一判断值和第二判断值中至少有一个结果为无反光时，反光判断结果为无反光。或者作为另一种实现方式，当第一判断值和第二判断值中至少有一个结果为有反光时，反光判断结果为有反光；当第一判断值和第二判断值均为无反光时，反光判断结果为无反光。

在另一些实施例中，例如第一判断值可以表示输入图像是否有反光的置信度(即上述反光置信度或反光置信系数)。此时，当第一判断值大于或等于特定阈值且第二判断值表示有反光时，步骤S1150输出的反光判断结果为有反光；反之，当第一判断值小于特定阈值和/或第二判断值表示无反光时，步骤S1150输出的反光判断结果为无反光。或者作为另一种实现方式，当第一判断值大于或等于特定阈值和/或第二判断值表示有反光时，步骤S1150输出的反光判断结果为有反光；反之，当第一判断值小于特定阈值且第二判断值表示无反光时，步骤S1150输出的反光判断结果为无反光。

或者，还可以对第一判断值进行进一步的区间细化，例如，当第一判断值大于阈值A1且第二判断值表示无反光时，反光判断结果为有反光；当第一判断值小于阈值A1且大于阈值A2，且第二判断值表示有反光时，反光判断结果为有反光；其他情况下，反光判断结果为无反光，其中A1大于A2。可以根据需要设计合适的联合判断算法，这些变化均在本申请实施例的范围内。

S1160，根据反光判断结果，对原始图像进行消除反光处理。步骤S1160可以由图6所示的软件架构中的图像后处理模块530实现。

在方法1100中，步骤S1140与图7所示的方法700中的步骤S740相似，不再赘述。

使用多种判断模型和单元联合判断的方式，可以比单一模型更准确地判断图像的反光情况，改善图像的反光处理效果。应理解，如果有其他合适的判断模型和/或判断单元，同样可以结合到本申请的反光判断模块或联合判断模式中。

图12是本申请实施例的图像处理装置的结构示意图。如图12所示，本申请实施例的图像处理装置1200包括第一反光消除模块1210、反光判断模块1220和第二反光消除模块1230。

第一反光消除模块1210，用于对输入图像进行反光消除处理，以得到第一图像。在一些实施例中，第一反光消除模块1210可以用于实现图7所示的方法700中的步骤S720、或者图9所示的方法900中步骤S920、或者图11所示的方法1100中步骤S1120的功能。第一反光消除模块1210的具体功能和有益效果可以参见上述方法中的描述，为了简洁，在此不再赘述。

反光判断模块1220，用于根据所述第一图像和所述输入图像，判断所述输入图像是否有反光。

在一些实施例中，反光判断模块1220可以包括反光判断模型，用于实现图7所示的方法700中的步骤S730的功能。

在另一些实施例中，反光判断模块1220可以包括反光层强度判断模型，用于实现图9所示的方法900中步骤S930的功能。

在另一些实施例中，反光判断模块1220可以包括反光判断模型、反光层强度判断模型和联合判断单元，用于实现图11所示的方法1100中步骤S1130至步骤S1150的功能。

反光判断模块1220的具体功能和有益效果可以参见上述方法中的描述，为了简洁，在此不再赘述。

第二反光消除模块1230，用于根据所述反光判断模块的判断结果，获取输出图像。在一些实施例中，第二反光消除模块用于实现图7所示地方法700中步骤S740、或者图9所示的方法900中步骤S940、或者图11所示的方法1100中步骤S1160的功能。第二反光消除模块1230的具体功能和有益效果可以参见上述方法中的描述，为了简洁，在此不再赘述。

在一些实施例中，图像处理装置还可以包括预处理模块1240。预处理模块1240用于对原始图像进行预处理，生成符合第一反光输出模块1210的输入尺寸的输入图像。在一些实施例中，预处理模块1240用于实现图7所示的方法700中步骤S710、或者图9所示的方法900中步骤S910、或者图11所示的方法1100中步骤S1100的功能。预处理模块1240的具体功能和有益效果可以参见上述方法中的描述，为了简洁，在此不再赘述。

应理解，在一些实施例中，图12所示的图像处理装置可以由图5所示的芯片实现。其中，图5所示的芯片中的神经网络处理器300可以实现图12所示的图像处理装置的第一反光消除模块1210和反光判断模块1220中的反光判断模型的功能；图5所示的芯片中的主CPU可以实现反光判断模块1220中的反光层强度判断单元、联合判断单元以及第二反光消除模块1230的功能。在另一些实施例中，图5所示的芯片中的主CPU还可以实现预处理模块1240的功能。

在一些实施例中，图12所示的图像处理装置可以实现图6所示的软件架构的功能。其中，第一反光消除模块1210可以实现图6所示的软件架构的网络推理模块520中的反光消除模型的功能；反光判断模块1220中的反光判断模型可以实现图6所示的软件架构的网络推理模块中的反光判断模型的功能；反光判断模块1220中的反光层强度判断单元、联合判断单元以及第二反光消除模块1230可以实现图6所示的软件架构中的图像后处理模块530的功能。在另一些实施例中，预处理模块1240可以实现图6所示的软件架构的图像预处理模块的功能。

在一些实施例中，图12所示的图像处理装置可以部署在图4所示的执行设备110上，以实现各个模块的功能。

图13是本申请实施例的一种硬件结构示意图。应理解，本申请实施例的装置可以是一个或多个芯片，或者可以包括在终端或其他设备内。

如图13所示，本申请实施例的处理器系统1300包括中央处理器(central processing unit，CPU)1310、神经网络处理器(neutral processing unit，NPU)1320和图像信号处理器(image signal processing，ISP)1330。

上述方法中，图6所示的软件架构的图像预处理模块510、图像后处理模块530以及软件处理模块540可以应用于中央处理器1310，或者中央处理器1310实现。中央处理器1310还可以用于运行通用操作系统软件，并在通用操作系统软件的作用下控制神经网络处理器1320和图像信号处理器1330。上述方法中，图6所示的软件架构的网络推理模块520可以应用于神经网络处理器1320，或者由神经网络处理器1320实现。

图像信号处理器1330用于生成图像，该图像信号处理器可以匹配不同厂商的图像传感器，以用来对前端图像传感器输出的图像数据进行处理，根据图像数据生成对应的图像信号，例如上述的原始图片。在一些实施例中，图12所示的图像处理装置可以由图13所示的处理器系统实现。其中，中央处理器1310可以实现反光判断模块1220中反光层强度判断单元和/或联合判断单元、第二反光消除模块1230的功能；在另一些实施例中，中央处理器1310还可以实现预处理模块1240的功能。

其中，神经网络处理器1320可以实现图12所示的图像处理装置中第一反光消除模块1210和反光判断模块1220中的反光判断模型的功能。

应理解，图13所示的处理器系统可以包括一个或多个图5所示的芯片，图5所示的芯片中的主CPU可以实现图13所示的处理器系统的中央处理器1310的功能；图5所示的芯片中的神经网络处理器300可以实现图13所示的处理器系统中的神经网络处理器1320的功能。

应理解，图13所示的处理器系统还可以部署在图4所示的执行设备110上，本申请实施例对此不做限定。

图14是本申请实施例提供的另一种图像处理装置的硬件结构示意图。如图14所示的图像处理装置1400包括存储器1410、处理器1420、通信接口1430以及总线1440。其中，存储器1410、处理器1420、通信接口1430通过总线1440实现彼此之间的通信连接。

存储器1410可以是只读存储器(read only memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(random access memory，RAM)。存储器1410可以存储程序，当存储器1410中存储的程序被处理器1420执行时，处理器1420用于执行本申请实施例的图像处理方法的各个步骤，例如，执行图7至图11所示的各个步骤。

应理解，本申请实施例所示的图像处理装置可以是服务器，例如，可以是云端的服务器，或者，也可以是配置于云端的服务器中的芯片；或者，本申请实施例所示的图像处理装置可以是智能终端，也可以是配置于智能终端中的芯片。

上述本申请实施例揭示的图像处理方法可以应用于处理器1420中，或者由处理器1420实现。处理器1420可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述图像处理方法的各步骤可以通过处理器1420中的硬件的集成逻辑电路或者软件形式的指令完成。例如，处理器1420可以是包含图5所示的NPU的芯片。

上述的处理器1420可以是中央处理器(central processing unit，CPU)、图形处理器(graphics processing unit，GPU)、通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器(random access memory，RAM)、闪存、只读存储器(read-only memory，ROM)、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1410，处理器1420读取存储器1410中的指令，结合其硬件完成本申请实施中图6所示的的反光检测与消除系统软件架构或图12所示的图像处理装置中包括的模块所需执行的功能，或者，执行本申请方法实施例的图7至图11所示的图像处理方法的各个步骤。

通信接口1430使用例如但不限于收发器一类的收发装置，来实现装置1400与其他设备或通信网络之间的通信。

总线1440可包括在图像处理装置1400各个部件(例如，存储器1410、处理器1420、通信接口1430)之间传送信息的通路。

应注意，尽管上述图像处理装置1400仅仅示出了存储器、处理器、通信接口，但是在具体实现过程中，本领域的技术人员应当理解，图像处理装置1400还可以包括实现正常运行所必须的其他器件。同时，根据具体需要本领域的技术人员应当理解，上述图像处理装置1400还可包括实现其他附加功能的硬件器件。此外，本领域的技术人员应当理解，上述图像处理装置1400也可仅仅包括实现本申请实施例所必须的器件，而不必包括图14中所示的全部器件。

本申请实施例还提供了一种计算机可读介质，该计算机可读介质存储有计算机程序(也可以称为代码，或指令)当其在计算机上运行时，使得计算机执行上述任一方法实施例中的方法。

本申请实施例还提供了一种芯片系统，包括存储器和处理器，该存储器用于存储计算机程序，该处理器用于从存储器中调用并运行该计算机程序，使得安装有该芯片系统的图像处理装置执行上述任一方法实施例中的方法。

其中，该芯片系统可以包括用于发送信息或数据的输入电路或者接口，以及用于接收信息或数据的输出电路或者接口。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在存储介质中，或者从一个存储介质向另一个存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，高密度数字视频光盘(digital video disc，DVD))、或者半导体介质(例如，固态硬盘(solid state disk，SSD))等。

本申请中，“至少两种”或“多种”是指两种或两种以上。术语“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。

本申请中的预定义可以理解为定义、预先定义、存储、预存储、预协商、预配置、固化、或预烧制。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在本说明书中使用的术语“部件”、“模块”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如，部件可以是但不限于，在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。通过图示，在计算设备上运行的应用和计算设备都可以是部件。一个或多个部件可驻留在进程和/或执行线程中，部件可位于一个计算机上和/或分布在2个或更多个计算机之间。此外，这些部件可从在上面存储有各种数据结构的各种计算机可读介质执行。部件可例如根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一部件交互的二个部件的数据，例如通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。

本领域普通技术人员可以意识到，结合本文中所公开的实施例中描述的各方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各实施例的步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各种说明性逻辑块(illustrative logical block)和步骤(step)，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，可以理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种图像处理装置，其特征在于，包括：

第一反光消除模块，用于对输入图像进行反光消除处理，获取第一图像；

反光判断模块，用于根据所述第一图像和所述输入图像，获取所述输入图像是否有反光的判断结果；

第二反光消除模块，用于根据所述判断结果，获取输出图像。
根据权利要求1所述的装置，其特征在于，所述装置还包括：

预处理模块，用于对原始图像进行预处理，以获取所述输入图像，其中所述原始图像的尺寸大于所述输入图像的尺寸。
根据权利要求1或2所述的装置，其特征在于，所述第二反光消除模块具体用于在所述判断结果为所述输入图像没有反光时，获取原始图像作为所述输出图像。
根据权利要求2所述的装置，其特征在于，所述第二反光消除模块具体用于在所述判断结果为所述输入图像有反光时，根据所述第一图像和所述输入图像生成反光层小图，对所述反光层小图进行上采样以获取反光图层，并根据所述反光图层和所述原始图像获取所述输出图像。
根据权利要求1至4中任一项所述的装置，其特征在于，所述反光判断模块包括反光判断模型，所述反光判断模型是以所述第一图像和所述输入图像作为输入的神经网络，所述反光判断模型的输出表示所述输入图像有反光的置信度，或者所述输出为所述判断结果。
根据权利要求5所述的装置，其特征在于，所述反光判断模型是基于马尔科夫判别器的神经网络，并且是基于第一样本集训练得到的，其中所述第一样本集包括：原始图像样本、所述原始图像样本经过反光消除后的图像样本、所述原始图像样本是否有反光的标签。
根据权利要求1至4中任一项所述的装置，其特征在于，所述反光判断模块包括反光层强度判断单元，所述反光层强度判断单元用于根据所述输入图像和所述第一图像生成反光层小图；所述反光层强度判断单元还用于计算所述反光层小图包括的多个像素点的灰度值，并根据所述多个像素点的灰度值确定所述判断结果。
根据权利要求7所述的装置，其特征在于，所述反光层强度判断单元根据如下信息中的至少一种或者多种的加权结果，确定所述判断结果：

所述多个像素点的灰度值中的最大值、灰度值大于第一阈值的至少一个像素点的强度、灰度值大于第二阈值的至少一个像素点的面积；

其中，所述灰度值大于第一阈值的至少一个像素点的强度为灰度值大于第一阈值的像素点的灰度值之和，或者，

所述灰度值大于第一阈值的至少一个像素点的强度为灰度值大于第一阈值的像素点的灰度值的平均值；

所述灰度值大于第二阈值的至少一个像素点的面积为灰度值大于第二阈值的像素点的个数。
根据权利要求1至4中任一项所述的装置，其特征在于，所述反光判断模块包括反光判断模型、反光层强度判断单元和联合判断单元，

所述反光判断模型是以所述第一图像和所述输入图像作为输入的神经网络，所述反光判断模型的输出为表示所述输入图像是否有反光的第一判断值；

所述反光层强度判断单元计算所述输入图像和所述第一图像之差的灰度值，并根据所述灰度值输出表示所述输入图像是否有反光的第二判断值；

所述联合判断单元根据所述第一判断值和所述第二判断值，确定所述判断结果。
一种图像处理方法，其特征在于，包括：

对输入图像进行反光消除处理，获取第一图像；

根据所述输入图像和所述第一图像，判断所述输入图像是否有反光；

根据所述输入图像是否有反光，获取输出图像。
根据权利要求10所述的方法，其特征在于，所述方法还包括：

对原始图像进行预处理，以获取所述输入图像，所述原始图像的尺寸大于所述输入图像的尺寸。
根据权利要求10或11所述的方法，其特征在于，所述根据所述输入图像是否有反光，获取输出图像包括：当所述输入图像没有反光时，获取原始图像作为所述输出图像。
根据权利要求11所述的方法，其特征在于，所述根据所述输入图像是否有反光，获取输出图像包括：当所述输入图像有反光时，根据所述输入图像和所述第一图像生成反光层小图；

对所述反光层小图进行上采样，获取反光图层；

根据所述反光图层和所述原始图像获取所述输出图像。
根据权利要求10至13中任一项所述的方法，其特征在于，所述根据所述输入图像和所述第一图像，判断所述输入图像是否有反光包括：

根据反光判断模型，判断所述输入图像是否有反光；

所述反光判断模型是以所述第一图像和所述输入图像作为输入的神经网络，所述反光判断模型的输出表示所述输入图像有反光的置信度，或者所述输出为所述输入图像是否有反光的判断结果。
根据权利要求14所述的方法，其特征在于，所述反光判断模型是基于马尔科夫判别器的神经网络，并且是基于第一样本集训练得到的，其中所述第一样本集包括：原始图像样本、所述原始图像样本经过反光消除后的图像样本、所述原始图像样本是否有反光的标签。
根据权利要求10至13中任一项所述的方法，其特征在于，所述根据所述输入图像和所述第一图像，判断所述输入图像是否有反光包括：

根据反光层强度判断单元，判断所述输入图像是否有反光；

所述反光层强度判断单元用于计算根据所述输入图像和所述第一图像生成反光层小图；所述反光层强度判断单元还用于计算所述反光层小图包括的多个像素点的灰度值，并根据所述多个像素点的灰度值确定所述判断结果。
根据权利要求16所述的方法，其特征在于，所述反光层判断单元根据如下信息中的至少一种或者多种的加权结果，确定所述判断结果：

所述多个像素点的灰度值中的最大值、灰度值大于第一阈值的至少一个像素点的强度、灰度值大于第二阈值的至少一个像素点的面积；

其中，所述灰度值大于第一阈值的至少一个像素点的强度为灰度值大于第一阈值的像素点的灰度值之和，或者，

所述灰度值大于第一阈值的至少一个像素点的强度为灰度值大于第一阈值的像素点的灰度值的平均值；

其中，所述灰度值大于第二阈值的至少一个像素点的面积为灰度值大于第二阈值的像素点的个数。
根据权利要求10至13中任一项所述的方法，其特征在于，所述根据所述输入图像和所述第一图像，判断所述输入图像是否有反光包括：

根据反光判断模型、反光层强度判断单元和联合判断单元，判断所述输入图像是否有反光；

所述反光判断模型是以所述第一图像和所述输入图像作为输入的神经网络，所述反光判断模型的输出为表示所述输入图像是否有反光的第一判断值；

所述反光层强度判断单元计算所述输入图像和所述第一图像之差的灰度值，并根据所述灰度值输出表示所述输入图像是否有反光的第二判断值；

所述联合判断单元根据所述第一判断值和所述第二判断值，确定判断结果。