WO2022156248A1

WO2022156248A1 - 影像处理设备、影像处理设备的工作方法以及非易失性存储介质

Info

Publication number: WO2022156248A1
Application number: PCT/CN2021/118764
Authority: WO
Inventors: 柴田诚
Original assignee: 海信视像科技股份有限公司; 东芝视频解决方案株式会社
Priority date: 2021-01-20
Filing date: 2021-09-16
Publication date: 2022-07-28
Also published as: JP2022111459A; CN115398880A; JP7488002B2

Abstract

提供一种影像处理设备、影像处理设备的工作方法以及非易失性存储介质。影像处理设备具备：第一判断部(21)，通过第一AI运算来判断影像的变化等级；比较部(11)，将变化等级与规定值进行比较；第二判断部(22)，仅在变化等级超过规定值的情况下，通过第二AI运算来判断影像被分类为多个场景的哪个场景；设定部(12)，基于被判断出的场景来设定画质参数；和调整部(13)，使用画质参数来调整影像。

Description

影像处理设备、影像处理设备的工作方法以及非易失性存储介质

本申请要求在2021年01月20日提交日本专利局、申请号为2021-006896、发明名称为“影像处理设备、影像处理设备的工作方法以及影像处理程序”的日本专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及影像处理设备、影像处理设备的工作方法以及非易失性存储介质。

背景技术

开发一种具有将节目的影像自动地调整为与种类(Genre)相应的画质、音质的功能的电视接收机、智能手机等的影像显示设备。节目的种类从EPG节目表等的原始数据获取。

但是，一个节目中包含最适当的画质等不同的多个场景(场面)。例如，在种类是新闻的节目中，包含人物场景、屋内场景、风景场景以及运动场景等。

因此，在仅基于节目的种类的调整中，不能提供最适合于各个场景的影像。此外，也存在不能参照EPG节目表等的原始数据的影像。

近年来，影像处理中使用AI(人工智能)运算。AI运算的运算量较多，因此需要较大的资源(计算资源)。正在进行高效地进行AI运算的方法的开发。

但是，在电视接收机等的周边设备中，资源较小，因此不容易使用AI运算来进行适当的影像处理。

在先技术文献

专利文献

专利文献1：日本特开2008-28871号公报

专利文献2：国际公开第2018/067962号

发明内容

本公开的目的在于，提供一种输出与场景相应的最适当影像的影像处理设备、输出与场景相应的最适当影像的影像处理设备的工作方法以及存储有输出与场景相应的最适当影像的影像处理程序的非易失性存储介质。

本公开的影像处理设备具备：第一判断部，通过第一AI运算来判断影像的变化等级；比较部，将所述变化等级与规定值进行比较；第二判断部，仅在所述变化等级超过所述规定值的情况下，通过第二AI运算来判断影像被分类为多个场景的哪个场景；设定部，基于被判断出的场景来设定画质参数；和调整部，使用所述画质参数来调整影像。

本公开的影像处理设备的工作方法包括：通过第一AI运算来判断影像的变化等级；将所述变化等级与规定值进行比较；仅在所述变化等级超过所述规定值的情况下通过第二AI运算来判断影像被分类为多个场景的哪个场景；基于被判断出的场景来设定画质参数；和使用所述画质参数来调整影像。

本公开的非易失性存储介质储存有影像处理程序，所述影像处理程序使计算机执行以下步骤：通过第一AI运算来判断影像的变化等级；将所述变化等级与规定值进行比较；仅在所述变化等级超过所述规定值的情况下通过第二AI运算来判断影像被分类为多个场景的哪个场景；基于被判断出的场景来设定画质参数；和使用所述画质参数来调整影像。

附图说明

图1是包含实施方式的影像处理设备的电视接收机的结构图；

图2是第一实施方式的影像处理设备的工作方法的流程图；

图3是用于对第一实施方式的影像处理设备的工作方法进行说明的图；

图4是第二实施方式的影像处理设备的工作方法的流程图；

图5是用于对第二实施方式的影像处理设备的工作方法进行说明的图。

附图标记说明

1、1A-1C…影像处理设备

9…接收系统

11…比较部

12…设定部

13…调整部

20…神经网络

21…第一判断部

22…第二判断部

30…接收设备

31…调谐器

32…存储器

41…接收天线

42…显示器

43…扬声器

44…遥控器

45…录像机

46…网络线路

47…服务器。

具体实施方式

第一实施方式

如图1所示，本实施方式的影像处理设备1与调谐器31以及存储器32构成接收设备30，接收设备30与显示器42以及扬声器43构成接收系统9。接收设备30也可以是与显示器42以及扬声器43一体的电视接收设备。

显示器42是液晶、EL(电致发光)、等离子体显示器、SED(表面电场显示器)、视频投影仪、背投(背面投影型)、或者显像管(包含平面型) 等。用户操作接收设备30的终端即遥控器44可以是智能手机、平板终端、AI音箱等。

调谐器31例如通过从由接收天线41接收的地面数字电视广播以及卫星数字电视广播的多个频道之中选择一个频道而接收。调谐器31也可以经由网络线路46来接收从服务器47输入的因特网广播。录像机45中记录的节目影像也可以被输入到接收设备30。

影像处理设备1处理被输入的影像，输出图像信号和声音信号。图像信号被输出到显示器42，声音信号被输出到扬声器43，从而用户收看节目。

影像处理设备1具有：作为处理器的CPU10、作为神经网络的AI运算部20。

AI运算部20具有第一判断部21和第二判断部22。第一判断部21与第二判断部22共享AI运算部20的资源，因此不能同时进行运算处理。AI运算部20包含半导体，例如，读取存储器32中存储的程序并进行动作。

如后述那样，第一判断部21进行使用神经网络对影像的图像的变化等级D进行判断的第一AI运算(AI运算1)。第二判断部22进行使用神经网络对影像被分类为多个场景的哪个场景进行判断的第二AI运算(AI运算2)。

基于神经网络的AI运算使用基于深层学习算法的深层学习，执行影像的解析处理。深层学习算法是包含公知的卷积神经网络(CNN：Convolutional Neural Network)的方法、全连接层、输出层的算法。深层学习被称为深度学习。由于基于使用了深层学习的AI运算的图像解析处理是公知技术，因此省略具体的说明。

CPU10进行接收设备30的整体的控制。CPU10包含半导体，例如，读取存储器32中存储的程序并进行动作。CPU10包含比较部11、设定部12、调整部13。另外，CPU10执行的这些功能部的至少任一者也可以构成为与CPU10独立的专用电路。此外，也可以一个CPU单元具有CPU10和AI运算部20。但是，为了高速处理，优选AI运算在AI专用处理器中进行。

比较部11将第一判断部21判断出的影像的变化等级D与规定值K进行比较。第二判断部22仅在第一判断部21通过第一AI运算而判断出的变化等级D超过规定值K的情况下，进行场景的判断运算即第二AI运算。

例如，在规定值K为75％、影像变化的可能性即变化等级D为80％的情况下，由于变化等级D超过规定值K，因此进行第二AI运算。设定部12基于第二判断部22判断出的场景，设定画质参数。调整部13使用画质参数来调整影像。

在规定值K为75％、变化等级D为60％的情况下，由于变化等级D为规定值K以下，因此不进行第二AI运算。

在现有的AI运算中，是多个运算必须连续进行的流水线方式。即，与第一AI运算的输出无关地都进行第二AI运算。与此相对地，在影像处理设备1中，可能根据第一AI运算的输出，而不进行第二AI运算。因此，即使是资源较小的周边设备即影像处理设备，也输出与场景相应的最适当的影像。

影像处理设备的工作方法

按照图2的流程图，对影像处理设备1的工作方法进行说明。

＜步骤S10＞帧图像输入

如图3的上段所示，电视广播的影像例如在1秒期间具有30张帧图像(静止图像)。向第一判断部21输入帧图像(第一图像)和其下个帧图像(第二图像)。

＜步骤S20＞第一AI运算

第一判断部21进行在AI运算部20判断第一图像与第二图像的变化等级D的第一AI运算。例如，在第一AI运算中，进行二维的特征图的提取或者一维的特征向量的提取。

若基于影像的明亮度变化、每个像素的亮度的变化等来判断场景，则担心影像稍微放大或者相机转动的情况下，错误地判断为场景变化。但是，通过使用AI运算，能够准确地判断场景的变化。

＜步骤S30＞变化等级比较

比较部11对第一判断部21判断出的变化等级D与规定值K进行比较。在变化等级D大于规定值K的情况(是)下，进行步骤S40的处理。在变化等级D为规定值K以下的情况(否)下，进行步骤S10的处理。

另外，若规定值K过小，则担心频繁地进行画质调整并成为不自然的影像。因此，规定值K被设定为适当的值、例如超过70％。规定值K也可以能够通过用户的操作来变更。

＜步骤S40＞第二AI运算开始

第二判断部22进行在与第一判断部21共享的AI运算部20中判断第二图像是多个场景的哪个场景的第二AI运算。

场景例如是人物场景、风景场景、夜景场景、运动场景。

例如，在第二AI运算中，进行将二维的特征图作为输入的物体检测或分割、或者将一维的特征向量作为输入的图像分类处理。

＜步骤S50＞时间测量(经过TA)

如图3所示，在影像处理设备1中，反复进行的第一判断部21的处理间隔(时间)TA、即第一AI运算的间隔TA比第一AI运算的第一处理时间T1长。但是，间隔TA比第一AI运算的第一处理时间T1与第二AI运算的第二处理时间T2(T2A+T2B)的合计时间短。因此，在间隔TA的期间，第二AI运算未结束。

若成为处理间隔TA(是)，则影像处理设备1暂时中断第二AI运算，进行从步骤S60开始的处理。

＜步骤S60＞帧图像输入

与步骤S10同样地，向第一判断部21输入新的两张帧图像。

＜步骤S70＞第一AI运算

与步骤S20同样地，第一判断部21进行判断变化等级D的第一AI运算。

＜步骤S80＞变化等级比较

与步骤S30同样地，比较部11对第一判断部21判断出的变化等级D与规定值K进行比较。在步骤S80中，在变化等级D大于规定值K的情况(是)下，在步骤S40中进行新的第二AI运算。处理到中途的第二运算被强制结束。另外，也可以将已经处理结束的中途结果代替利用为第二AI运算结果。与此相对地，在变化等级D为规定值K以下的情况(否)下，重新开始进行到中途的第二AI运算A。

即，基于第二判断部22的第二AI运算在未进行基于第一判断部21的第一AI运算的期间被分割进行。在影像处理设备1中，第二AI运算被二分割为第二AI运算2A、2B而进行，但第二AI运算也可以被分割成三份以上。

另外，在影像处理设备1中，第一AI运算的处理间隔TA比帧间隔Tf(例如，1/30秒)长。但是，在AI运算速度较快的情况下，也可以对所有帧图像进行第一AI运算。

此外，也可以接着第二AI运算进行第3AI运算。例如，也可以在第二AI运算中判断为影像场景是“运动”之后，在第3AI运算中判断具体的比赛名称“足球”。

＜步骤S90＞第二AI运算结束

若第二AI运算结束(是)，则再次进行从步骤S10开始的一系列的处理，同时进行步骤S100的处理。继续直到第二AI运算结束(否)。

＜步骤S100＞

基于第二判断部22判断的场景，设定部12设定画质参数。调整部13使用画质参数来调整影像、即存在变化的帧图像以后的帧图像。

画质参数例如是明亮度、颜色浓淡、阴影、色温、锐度、降噪级别、对比度增强等级、细节增强等级。

例如，在风景场景的情况下，通过使明亮度等级、颜色浓淡以及阴影的各等级提高为超过标准参数，从而成为鲜明的影像。在人物场景的情况下，通过提高降噪级别以及细节增强等级并降低颜色浓淡等级，从而肌肤的质感变得自然。基于各个场景的画质参数例如预先存储于存储器32。

影像处理设备1是资源少的周边设备，但也能够输出与场景相应的最适当的影像。

如以上的说明那样，影像处理设备的工作方法具备：通过第一AI运算来判断影像的变化等级的步骤S20；将所述变化等级与规定值进行比较的步骤S30；仅在所述变化等级超过所述规定值的情况下通过第二AI运算来判断影像被分类为多个场景的哪个场景的步骤S40；基于被判断的场景来设定画质参数的步骤S100；和使用所述画质参数来调整影像的步骤S100。

影像处理程序使计算机执行以下步骤：通过第一AI运算来判断影像的变化等级的步骤S20、将所述变化等级与规定值进行比较的步骤S30；仅在所述变化等级超过所述规定值的情况下通过第二AI运算来判断影像被分类为多个场景的哪个场景的步骤S40；基于被判断的场景来设定画质参数的步骤S100；和使用所述画质参数来调整影像的步骤S100。

＜第一实施方式的变形例1＞

本变形例的影像处理设备1A与影像处理设备1类似，因此针对相同功能的结构要素赋予相同的符号并省略说明。

影像处理设备1A例如获取附加于电视节目的影像信号的节目数据(例如，EPG：Electronic Programming Guide)。EPG数据被存储于存储器32。节目数据除了节目名、出演者、节目概要等，还具有种类数据。种类例如是“新闻/报道”、“运动”、“信息/幻灯片放映”、“电视剧”、“音乐”、“综艺”、“电影”、“动态图像片/特摄”、“纪录片/文化”、“剧场/公演”、“趣味/教育”、“福利”。

影像处理设备1A的设定部12基于种类以及第二判断部22判断的场景来设定画质参数。

即，即使是相同的风景场景，在种类是新闻的影像的情况下，也相比于种类是电影的影像的情况，设定提高明亮度等级、颜色浓淡以及阴影的各等级的比例较小的画质参数。因此，在种类是新闻的影像中，例如即使从人物场景切换为风景场景影像也不会较大地变化。相反地，在种类是电影的影像中，输出比种类是新闻的影像更具有震慑力的风景场景的影像。

基于多个种类的各个多个场景的画质参数例如预先存储于存储器32。影像处理设备1A能够根据种类，更加适当地调整场景的影像。

＜第一实施方式的变形例2＞

由于本变形例的影像处理设备1B与影像处理设备1类似，因此对相同功能的结构要素赋予相同的符号并省略说明。

影像处理设备1B的设定部12基于场景，不仅设定画质参数，还设定音质参数。调整部13不仅调整影像的画质，还使用音质参数来调整影像的声音。

音质参数例如是基于高通滤波器以及低通滤波器的均衡器等级、降噪级别。

例如，在人物的嘴活动的会话场景中，为了更容易听到，均衡器等级被设定为平坦，降噪级别被设定为较大。

在影像处理设备1B中，影像不仅调整图像，也根据场景来适当地调整声音。

在影像处理设备1B中，当然也可以如影像处理设备1A那样，基于种类以及第二判断部22判断的场景来设定画质参数。

＜第二实施方式＞

本实施方式的影像处理设备1C与影像处理设备1等类似，因此对相同功能的结构要素赋予相同的符号并省略说明。

按照图4的流程图，对影像处理设备1C的工作方法进行说明。

＜步骤S10-S30＞

与图2中说明的影像处理设备1相同。

＜步骤S41＞

第二AI运算开始，并进行处理直到结束。在第二AI运算结束后，再次进行从步骤S10开始的一系列的处理，同时进行步骤S100的处理。

＜步骤S100＞

与图2中说明的影像处理设备1相同。

在影像处理设备1C中，与影像处理设备1同样地，被反复进行的第一判断部21的第一处理间隔(时间)TA比第一AI运算的第一处理时间T1与第二AI运算的第二处理时间T2(T2A+T2B)的合计时间短。

如图5所示，影像处理设备1C的第一判断部21不重新开始处理直到第二判断部22的处理结束。因此，进行了第二AI运算的情况下的第一判断部21的第二处理间隔TA2比未进行第二AI运算的情况下的第一处理间隔TA1长。

由于影像处理设备1C可能第一判断部21的处理间隔变长，因此在场景变化激烈的影像中担心不能适当地调整场景的影像。但是，在第一判断部21检测到影像的场景变化的情况下，能够比影像处理设备1更快地输出更加适当的画质的影像。

在影像处理设备1c中，当然也可以如影像处理设备1A那样基于种类以及第二判断部22判断的场景来进行画质调整，或者如影像处理设备1B那样基于场景来进行音质调整。

本公开还提供一种计算机可读的非易失性存储介质，所述存储介质存储有计算机指令，所述计算机指令被处理器执行时实现上述实施方式中的画质处理。

说明了本公开的几个实施方式，但这些实施方式作为示例而提示，并不意图限定本公开的范围。这些新的实施方式能够通过其它各种方式来实施，在不脱离本公开的主旨的范围内，能够进行各种省略、置换、变更。这些实施方式、其变形包含于本公开的范围、主旨，并且包含于权利要求书所述的本公开和其等同的范围。

Claims

一种影像处理设备，其中，具备：

第一判断部，通过第一AI运算，判断影像的变化等级；

比较部，将所述变化等级与规定值进行比较；

第二判断部，仅在所述变化等级超过所述规定值的情况下，通过第二AI运算来判断影像被分类为多个场景的哪个场景；

设定部，基于被判断出的场景，设定画质参数；和

调整部，使用所述画质参数来调整影像。
根据权利要求1所述的影像处理设备，其中，

所述第一判断部的处理间隔比所述第一判断部的第一处理时间长，所述第一判断部的处理间隔比所述第一处理时间与所述第二判断部的第二处理时间的合计时间短，

与所述第一判断部共享资源的所述第二判断部在不进行所述第一判断部的处理的期间分割来进行处理。
根据权利要求1所述的影像处理设备，其中，

所述第一判断部的第一处理间隔比所述第一判断部的第一处理时间长，所述第一判断部的第一处理间隔比所述第一处理时间与所述第二判断部的第二处理时间的合计时间短，

所述第一判断部不重新开始处理直到共享资源的所述第二判断部的处理结束为止。
根据权利要求1至3中的任一项所述的影像处理设备，其中，

所述影像处理设备与调谐器、显示器以及扬声器一起，构成电视接收设备。
根据权利要求1至4中的任一项所述的影像处理设备，其中，

所述影像是确定出种类的广播节目的影像，

所述设定部基于所述种类以及所述第二判断部判断出的所述场景来设定所述画质参数。
根据权利要求1至5中的任一项所述的影像处理设备，其中，

所述设定部基于所述场景来设定音质参数，

所述调整部使用所述音质参数来调整所述影像的声音。
一种影像处理设备的工作方法，其中，具备：

通过第一AI运算来判断影像的变化等级；

将所述变化等级与规定值进行比较；

仅在所述变化等级超过所述规定值的情况下，通过第二AI运算来判断影像被分类为多个场景的哪个场景；

基于被判断出的场景来设定画质参数；和

使用所述画质参数来调整影像。
一种计算机可读的非易失性存储介质，其存储有程序或计算机指令，该程序或计算机指令在计算机上被执行，其中，使计算机执行以下步骤：

通过第一AI运算来判断影像的变化等级；

将所述变化等级与规定值进行比较；

仅在所述变化等级超过所述规定值的情况下，通过第二AI运算来判断影像被分类为多个场景的哪个场景；

基于被判断出的场景来设定画质参数；和

使用所述画质参数来调整影像。