WO2020259603A1

WO2020259603A1 - 图像处理装置及图像处理方法

Info

Publication number: WO2020259603A1
Application number: PCT/CN2020/098169
Authority: WO
Inventors: 徳永将之
Original assignee: 海信视像科技股份有限公司; 东芝视频解决方案株式会社
Priority date: 2019-06-27
Filing date: 2020-06-24
Publication date: 2020-12-30
Also published as: JP2021005320A; CN112470165B; CN112470165A

Abstract

本申请的实施方式涉及图像处理装置及图像处理方法，进行基于机器学习的目标检测，并且利用颜色空间的信息，从而进行对于目标的有效的画质调节处理。根据实施方式，图像处理装置具备：缩小部，其将输入的图像进行缩小而输出缩小图像；目标检测部，其从上述缩小图像中检测预先确定的目标对象；区域判定部，其基于上述目标检测部的检测结果，对上述输入的图像中的包含上述目标对象在内的目标候选区域进行判定；颜色空间判定部，其基于与上述目标对象对应的颜色空间的信息，判定上述目标候选区域是否为与上述目标对象对应的区域；以及图像处理电路，其基于上述颜色空间判定部的判定结果，控制对于上述输入的图像的图像处理。

Description

图像处理装置及图像处理方法

本申请要求在2019年6月27日提交日本专利局、申请号为2019-120131、发明名称为“图像处理装置及图像处理方法”的日本专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请的实施方式涉及图像处理装置及图像处理方法。

背景技术

以往，例如利用超分辨率处理、锐化处理、降噪处理等各种图像处理技术来实现图像的画质提高。在进行这种画质提高处理的图像处理装置中，通过实施与图像中的目标对应的图像处理，从而实现更优异的画质提高。

例如，有时检测作为识别对象而重要的目标人物的面部，进行考虑检测出的面部区域的超分辨率处理、降噪处理等。此外，近年来，作为面部检测的方法，有时进行利用深度学习的处理。在该情况下，为了减少用于面部检测的运算量，还可以使用缩小图像进行面部区域的归纳处理。

然而，根据使用了缩小图像的面部区域的判定结果无法确定正确的面部区域，存在无法实现充分的改善画质的问题。

在先技术文献

专利文献

专利文献1：日本特开2019-40382号

发明内容

本申请实施方式的目的在于提供一种，通过进行基于机器学习的目标检测并且利用颜色空间的信息，从而能够进行对于目标的有效画质调节处理的图像处理装置及图像处理方法。

本申请实施方式所涉及的图像处理装置具备：缩小部，其将输入的图像进行缩小而输出缩小图像；目标检测部，其从上述缩小图像中检测预先确定的目标对象；区域判定部，其基于上述目标检测部的检测结果，对上述输入的图像中包含上述目标对象在内的目标候选区域进行判定；颜色空间判定部，其基于与上述目标对象对应的颜色空间的信息，判定上述目标候选区域是否为与上述目标对象对应的区域；以及图像处理电路，其基于上述颜色空间判定部的判定结果，控制对于上述输入的图像的图像处理。

附图说明

图1是表示本申请的一实施方式涉及的图像处理装置的框图；

图2是用于说明目标检测部4的处理的一例的说明图；

图3是用于说明目标检测部4的处理的一例的说明图；

图4是用于说明实施方式的动作的流程图。

附图标记说明

1…缩小电路，2…区域判定电路，3…画质改善处理电路，4…目标检测部，5…颜色空间判定部。

具体实施方式

下面，参照附图对本申请的实施方式详细地进行说明。

图1是表示本申请的一实施方式涉及的图像处理装置的框图。本实施方式通过检测器对动态图像中的目标进行判定，并且对检测出的目标区域进行颜色空间的判定，从而高精度地控制对于目标或其附近的画质改善处理的方法，所述检测器使用基于机器学习而得到的归纳模型。由此，能够使图像中的例如人的面部等目标的画质改善。

本实施方式的图像处理装置可以用于进行图像处理的各种装置。例如，可以将本实施方式的图像处理装置用于电视接收机、录像机等，使广播节目的图像中的各种目标画质改善，结果能够在图像整体上得到高画质的动态图像。此外，例如还可以将本实施方式的图像处理装置用于监控摄像头、车载摄像头等，使拍摄到的动态图像中的各种目标画质改善，结果还可以提高人等目标的识别精度。

在图1中，输入图像提供给缩小电路1、区域判定电路2、以及画质改善处理电路3。输入图像是基于规定的帧率、规定的分辨率、规定的标准的动态图像。例如，可以是基于通过电视接收机等接收的广播信号的动态图像，也可以是从规定的相机系统得到的动态图像。

作为缩小部的缩小电路1对输入图像进行缩小处理。例如，缩小电路1可以采用公知的双线性法(Bilinear)、双三次法(Bicubic)等各种缩小算法，算法没有特别限定。缩小电路1从输入图像获取缩小图像。需要说明的是，缩小倍率取决于输入图像尺寸、目标检测部4的运算速度。缩小电路1将以规定的帧率生成的缩小图像依次向目标检测部4进行输出。

目标检测部4使用机器学习技术进行从被输入的缩小图像中对检测对象的目标(以下称为目标对象)进行检测的处理。需要说明的是，目标对象还可以是事先确定的目标。在目标检测部4中，构建用于目标对象检测的推论模型的规定的网络由硬件或软件构成。

关于目标检测部4的推论模型，通过将表示缩小图像中的目标对象的范围的信息作为标签附加到缩小图像而制作出的大量的训练数据提供给规定的网络而学习，从而得到该推论模型。该归纳模型针对缩小图像的输入，将表示目标对象的范围的信息与其可靠性的信息一起输出。需要说明的是，作为规定的网络，还可以采用DNN(深度神经网络)。此外，作为机器学习的方法，目标检测部4还可以利用深度神经网络以外的方法、例如哈尔特征(Haar-Like)等方法。

图2和图3是用于说明目标检测部4的处理的一例的说明图。图2和图3表示目标对象为人的面部的情况下的检测处理的例子。

图2和图3的缩小图像Pin表示输入到目标检测部4中的缩小图像。该缩小图像Pin中包含有人物O1、O2的图像，圆形表示作为目标对象的面部部分的图像。在图2的例子中，目标检测部4通过归纳处理，如缩小图像Pout所示，将包含人物O1的面部部分在内的区域DR1和包含人物O2的面部部分在内的区域DR2作为目标对象的检测区域进行检测。例如，目标检测部4对面部部分进行检测，将以检测出的面部部分的中心的坐标为中心的规定尺寸的矩形区域作为检测区域。目标检测部4将关于区域DR1、DR2的信息作为目标对象的检测结果进行输出。

另一方面，图3表示按照通过网格对缩小图像Pin进行划分的小区域(以下称为判定小区域)来检测目标对象的范围的例子。在该情况下，关于构成目标检测部4的归纳模型，可以通过将按照每个判定小区域附加了表示是否为目标对象的标签的缩小图像作为训练数据的学习来获取该归纳模型。

因此，目标检测部4通过归纳处理，如缩小图像Pout所示，将区域DR3和区域DR4作为目标对象的检测区域进行检测，其中，所述区域DR3包括作为人物O1的面部部分而检测出的2个判定小区域，所述区域DR4包括作为人物O2的面部部分而检测出的4个判定小区域。目标检测部4将与区域DR3、DR4相关的信息作为目标对象的检测结果进行输出。

目标检测部4将与检测区域相关的信息输出到区域判定电路2。作为区域判定部的区域判定电路2在图2和图3的例子中的任一情况下，都将对缩小图像检测出的检测区域转换为与输入图像的尺寸相对应的位置和尺寸的区域(以下称为目标归纳区域)。

目标检测部4对该目标归纳区域的输入图像，求出认为构成目标对象的区域的候选(以下称为目标候选区域)。例如，目标检测部4对该目标归纳区域的输入图像，对于目标归纳区域内的每个像素，判定是否为目标候选区域内的像素、即构成目标对象的像素的候选(以下称为目标像素候选)。

例如，区域判定电路2还可以将检测区域的判定时的可靠性的得分作为用于判定目标归纳区域的各个像素是否为目标像素候选的得分(以下称为区域得分)。在该情况下，在图2的例子中，与区域DR1对应的目标归纳区域内的全部像素成为彼此相同区域得分，与区域DR2对应的目标归纳区域内的全部像素成为彼此相同区域得分。此外，在图3的例子中，在分别与区域DR3、DR4的各个判定小区域对应的每个目标归纳区域，目标归纳区域内的全部像素成为彼此相同区域得分。

需要说明的是，区域判定电路2不仅可以利用检测区域的判定时的可靠性的得分，还可以利用其它信息来确定区域得分。区域判定电路2还可以将区域得分超过规定阈值的像素作为目标像素候选。

在本实施方式中，为了求出构成目标对象的像素即目标像素，将目标像素候选提供给颜色空间判定部5。需要说明的是，目标像素是使用对于目标对象的处理参数进行图像处理的像素。

颜色空间判定部5基于目标像素候选的像素是否保持有相当于目标对象的颜色空间的信息来判定目标像素。例如，在目标对象为人的面部的情况下，在目标像素候选的像素的颜色信息表示人的肤色(面部颜色)的情况下，能够判定为该像素保持有相当于目标对象的颜色空间的信息。

例如，颜色空间判定部5还可以将输入图像中的目标像素候选的各个像素转换为规定的颜色空间的信息，从而判定其颜色。例如，颜色空间判定部5将输入图像中的目标像素候选的各个像素转换为HSV颜色空间，按照每个像素判定像素的颜色是否存在于与HSV颜色空间内的目标对象的颜色对应的规定的范围(以下称为目标颜色范围)内，从而判定目标像素。此外，还可以通过HSV颜色空间内的色调(H)、彩度(S)和亮度(V)中的至少一个是否存在于目标颜色范围内来判定目标像素。

此外，例如，颜色空间判定部5还可以通过将输入图像中的目标像素候选的各个像素转换为YCbCr颜色空间，按照每个像素判定像素的颜色是否存在于YCbCr颜色空间内的目标颜色范围内，从而判定目标像素。此外，即使在该情况下，也可以通过YCrCb颜色空间中的至少一个是否存在于目标颜色范围内来判定目标像素。

需要说明的是，作为颜色空间判定部5在判定中使用的颜色空间，并不限定于上述的HSV颜色空间、YCrCb颜色空间，可以采用RGB颜色空间等各种颜色空间。在将人的面部作为目标对象的情况下，根据人种等而目标颜色范围不同。因此，颜色空间判定部5在判定目标像素时还可以设定多个目标颜色范围。

此外，在上述说明中，说明了通过目标像素候选的各个像素的颜色是否存在于目标颜色范围内来判定是否为目标像素的例子。对此，颜色空间判定部5还可以在目标颜色范围内设置基准点，设定与从该基准点至各个像素的颜色的点为止的距离相对应的颜色得分，将颜色得分超过了规定阈值的像素作为目标像素。上述的通过是否存在于目标颜色范围内来判定是否为目标像素的例子，可以说是目标颜色范围内的颜色得分为最大值且目标颜色范围外的颜色得分为最小值的例子。

例如，在图3的例子中，根据区域得分的结果，将区域DR3、DR4中的圆形部分与输入图像的尺寸相对应地放大的区域的各个像素可以成为目标像素候选。但是，如上所述，在将区域判定电路2的检测区域的判定时的可靠性的得分用于区域得分的情况下，目标归纳区域内或判定小区域内的全部像素成为相同区域得分。其结果是，特别是在面部的轮廓部分，对于与除了面部部分以外(背景)对应的像素也成为目标像素候选。

在本实施方式中，对目标像素候选的各个像素求出颜色得分，关于目标像素候选的各个像素中除了面部部分以外的背景部分的像素，通过使用颜色得分，从而能够从目标像素中排除。

颜色空间判定部5按照目标像素候选的每个像素，向画质改善处理电路3输出是否为目标像素的判定结果、或者颜色得分的信息。需要说明的是，关于是否为目标像素的判定结果，如上所述，也可以作为颜色得分的信息而表现，因此在以下说明中，作为颜色得分的信息被供给到画质改善处理电路3的情况进行说明。

构成图像处理电路的画质改善处理电路3通过对输入图像进行规定的画质处理，从而实施画质改善处理。在本实施方式中，对于输入图像或输入图像中的目标像素候选，画质改善处理电路3也可以按照每个像素而基于颜色得分的信息来设定画质处理的处理参数。

例如，画质改善处理电路3可以将颜色得分高于规定阈值的像素作为目标像素，对目标像素设定适合锐化处理的处理参数，从而实施锐化处理。此外，画质改善处理电路3还可以对在输入图像中除了颜色得分高于规定阈值的像素以外的像素、或者在目标像素候选的各个像素中颜色得分为规定阈值以下的像素，设定适合降噪处理的处理参数，从而实施降噪处理。在有纹理的人的面部等目标与比较平滑的背景的边界部分，容易出现折叠噪声。画质改善处理电路3通过去除这种噪声或锐化处理，从而能够使目标对象的画质改善。

需要说明的是，画质改善处理电路3并不限定于锐化处理、降噪处理，还可以进行各种图像处理、例如超分辨率处理等。在超分辨率处理中，可以将每个像素的处理参数与颜色得分相对应地进行变更。另外，虽然说明了只与区域得分大于规定阈值的目标像素候选的各个像素的颜色得分相对应地设定处理参数的例子，但也可以根据区域得分及颜色得分的值而按照每个像素设定处理参数。此外，处理参数不仅是按照每个像素，还可以按照每个规定的区域进行变更。

接着，参照图4对如上述方式构成的实施方式的操作进行说明。图4是用于说明实施方式的操作的流程图。

动态图像等作为输入图像输入到缩小电路1、区域判定电路2和画质改善处理电路3中。图4的流程图表示被输入的动态图像的每个帧的处理，图1的各个电路对规定的帧执行图4的各个处理。

缩小电路1在图4的步骤S1中进行缩小处理。输入图像通过规定的缩小算法转换为缩小图像。该缩小图像被供给到目标检测部4中。

目标检测部4利用机器学习技术检测目标对象(步骤S2)。例如，目标检测部4求出矩形的检测区域作为目标对象的图像区域。目标检测部4的检测结果被供给到区域判定电路2中，区域判定电路2求出将检测区域放大为原始输入图像的位置和尺寸的目标归纳区域(步骤S3)。

区域判定电路2按照目标归纳区域内的每个像素，求出用于判定是否为构成目标对象的像素的候选的区域得分(步骤S4)。区域判定电路2将区域得分大于阈值的像素确定为目标像素候选(步骤S5)。

目标像素候选的信息被供给到颜色空间判定部5中。颜色空间判定部5对目标像素候选的各个像素求出颜色得分(步骤S6)。例如，颜色空间判定部5基于在规定的颜色空间中目标像素候选的像素的颜色与目标颜色范围之间的关系，求出颜色得分。即，例如颜色得分为越大的值，认为其像素的颜色在颜色空间上是越接近目标对象的颜色的颜色。因此，通过使用颜色得分，从而能够更高精度地进行目标像素候选的各个像素是否为目标对象的像素的判定。

颜色空间判定部5将目标像素候选的每个像素的颜色得分的信息输出到画质改善处理电路3中。画质改善处理电路3根据颜色得分而例如将针对输入图像的画质处理的处理参数设定于每个像素(步骤S7)，实施画质改善处理(步骤S8)。

例如，画质改善处理电路3对于颜色得分高于规定阈值的目标像素设定适合锐化处理的处理参数，对于除了目标像素以外的像素设定适合降噪处理的处理参数，实施画质改善处理。由此，能够使人物面部等目标对象的画质改善。

需要说明的是，在本实施方式中，在画质改善处理电路3中，通过对目标像素和目标像素以外的像素设定彼此不同的处理参数，使目标对象以外的像素部分低画质化，从而还能够使目标对象相对画质改善。例如，对于预先确定的目标对象，还可以使图像中的其它目标的画质低画质化，在该情况下，能够相对提高目标对象的可视性。

如此在本实施方式中，不仅通过检测器对动态图像中的目标对象进行判定，还对检测出的目标的区域进行颜色空间的判定，从而能够高精度地控制对于目标、其周围的画质改善处理的方法，其中，所述检测器使用基于机器学习而得到的归纳模型。由此，能够使图像中的例如人物面部等目标画质改善，能够提高动态图像中目标的可视性，并且还可以提高针对目标的识别精度。

需要说明的是，在上述实施方式中，虽然将人物面部作为目标对象为例进行了说明，但目标对象没有特别限定。例如，作为目标对象，还可以设定狗、猫等动物、汽车、球等。例如，在将高尔夫球设定为目标对象的情况下，在跟踪高尔夫球的动态图像中提高高尔夫球的画质，可以实现连凹痕都能清楚地显示等画质改善处理。

需要说明的是，在上述实施方式的各个电路(缩小电路1、区域判定电路2、画质改善处理电路3、目标检测部4及颜色空间判定部5)中，构成各个电路的各个部分可以作为各个电子电路而构成，或者还可以作为集成电路中的电路模块构成。此外，各个电路还可以具备1个以上的CPU而构成。此外，各个电路可以设置为从存储器等存储介质读取用于执行各个部分的功能的程序，并且进行与该读取的程序相对应的动作。

本申请并不限定于上述实施方式，在实施阶段中可以在不脱离其主旨的范围内进行各种各样的改变。此外，上述实施方式中包含各种阶段的发明，通过适当地组合被公开的多个构成要素来提取各种发明。例如，即使从实施方式中公开的全部构成要素中消除几个构成要素，只要能够解决发明所要解决的课题的栏中叙述的课题，能够得到发明的效果的栏中叙述的效果的情况下，该构成要素被消除的构成可以作为发明而提取。

Claims

一种图像处理装置，包括：

缩小部，用于将输入的图像进行缩小而输出缩小图像；

目标检测部，用于从所述缩小图像中检测预先确定的目标对象；

区域判定部，用于基于所述目标检测部的检测结果，对所述输入的图像中包含所述目标对象在内的目标候选区域进行判定；

颜色空间判定部，用于基于与所述目标对象对应的颜色空间的信息，判定所述目标候选区域是否为与所述目标对象对应的区域；以及

图像处理电路，用于基于所述颜色空间判定部的判定结果，控制对于所述输入的图像的图像处理。
根据权利要求1所述的图像处理装置，其中，

所述目标检测部，还使用基于神经网络的归纳处理，从所述缩小图像中检测所述目标对象。
根据权利要求1所述的图像处理装置，其中，

所述区域判定部，还用于按照所述输入的图像的每个像素来判定构成所述目标候选区域的目标像素候选。
根据权利要求3所述的图像处理装置，其中，

所述颜色空间判定部，还用于对于所述目标像素候选，按照每个像素判定是否为构成所述目标对象的目标像素。
根据权利要求4所述的图像处理装置，其中，

所述图像处理电路，还用于对所述目标像素和所述目标像素以外的像素实施使用不同处理参数的图像处理。
根据权利要求4所述的图像处理装置，其中，

所述图像处理电路，还用于设定处理参数，该处理参数用于对所述目标像素实施锐化处理，并且对所述目标像素以外的像素实施降噪处理。
一种图像处理方法，包括：

将输入的图像缩小而输出缩小图像，

从所述缩小图像中检测预先确定的目标对象，

基于所述目标对象的检测结果，对所述输入的图像中的包含所述目标对象在内的目标候选区域进行判定，

基于与所述目标对象对应的颜色空间的信息，判定所述目标候选区域是否为与所述目标对象对应的区域，以及

基于使用所述颜色空间的信息的判定结果，控制对于所述输入的图像的图像处理。