CN109685079A

CN109685079A - 一种特征图像类别信息的生成方法和装置

Info

Publication number: CN109685079A
Application number: CN201811603489.6A
Authority: CN
Inventors: 丛恒
Original assignee: Netease Hangzhou Network Co Ltd
Current assignee: Netease Hangzhou Network Co Ltd
Priority date: 2018-12-26
Filing date: 2018-12-26
Publication date: 2019-04-26
Anticipated expiration: 2038-12-26
Also published as: CN109685079B

Abstract

本发明实施例提供了一种特征图像类别信息的生成方法和装置，其中，所述方法包括：获取原始图像；从所述原始图像中查找出目标区域；获取所述原始图像的特征信息图像；在所述目标区域中提取所述特征信息图像的目标特征信息；根据所述目标特征信息生成所述目标区域的类别信息。采用上述方式，可以先确定出原始图像中用于展现目标图像的目标区域，再从该目标区域的特征信息图像中提取目标特征信息来生成对应的类别信息，从而提升了针对具有复杂背景的原始图像的特征图像类别信息的生成准确率，进而提升了对用户推送相关信息的准确率。

Description

一种特征图像类别信息的生成方法和装置

技术领域

本发明涉及特征图像类别信息的生成技术领域，特别是涉及一种特征图像类别信息的生成方法和一种特征图像类别信息的生成装置。

背景技术

随着科技的发展，计算机技术已经影响了人们生活的方方面面，例如，用户可以通过网络快速浏览时下热点新闻，或用户所关注的讯息。而在用户浏览讯息的过程中，通过对用户的浏览内容进行分析，并根据分析结果对用户制定个性化的信息推送，可以极大的节省用户搜寻信息所耗费的时间，从而提高了用户浏览信息的效率，例如，在用户通过网络浏览图片时，可以通过分析该图片中的元素，向用户推送与该元素相关信息。

在用户浏览图片的过程中，若图片中的元素为游戏内容时，则无法准确的向用户推送与该游戏内容相关的信息，这是因为在现有技术中，识别图像中的元素的方式为直接采用基于机器学习或深度学习的分类技术来对图片中的元素进行分类，而在实际应用中，游戏内容作为元素存在于图片中时，其并不一定是该图片所包含的唯一元素，除了游戏内容本身，还可能包含有较复杂背景，若采用上述方式则无法高准确识别出图片中的游戏内容，进而无法针对该游戏内容向用户推送相关信息。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种特征图像类别信息的生成方法和相应的一种特征图像类别信息的生成装置。

为了解决上述问题，本发明实施例公开了一种特征图像类别信息的生成方法，包括：

获取原始图像；

从所述原始图像中查找出目标区域；

获取所述原始图像的特征信息图像；

在所述目标区域中提取所述特征信息图像的目标特征信息；

根据所述目标特征信息生成所述目标区域的类别信息。

优选地，所述原始图像具有对应的原始图像平均像素值，和，多个待检测区域；所述多个待检测区域包括第一待检测区域，和，第二待检测区域；所述第一待检测区域具有对应的待检测区域平均像素值，所述从所述原始图像中查找出目标区域的步骤包括：

将所述原始图像平均像素值，和，所述待检测区域平均像素值分别平均分配到预设个数的区间中，生成针对所述原始图像的第一分布直方图，和，针对所述第一待检测区域的第二分布直方图；

判断所述第一分布直方图，和，所述第二分布直方对应的欧式距离是否大于预设阈值；

若是，则标记所述第一待检测区域的第一区域位置坐标；

统计所述第二待检测区域中相邻两个像素点之间的梯度变化频率；

判断所述梯度变化频率是否大于预设阈值；

若是，则标记所述第二待检测区域的第二区域位置坐标；

采用所述第一区域位置坐标和所述第二区域位置坐标，判断所述第一待检测区域与所述第二待检测区域是否具有重合区域；

若是，则采用与所述重合区域，以及，与所述重合区域相邻的区域生成目标区域。

优选地，在所述从所述原始图像中查找出目标区域的步骤之前，还包括：

对所述原始图像进行降噪处理，生成降噪图像。

优选地，所述方法应用于深度学习系统中，所述深度学习系统包括多层卷积神经网络，所述获取所述原始图像的特征信息图像的步骤包括：

采用所述多层卷积神经网络从所述原始图像中提取出特征信息图像；其中，所述多层卷积神经网络具有对应的层级，两个所述层级对应的卷积神经网络之间具有池化层和激活层。

优选地，所述多层卷积神经网络包括多个全连接层，所述根据所述目标特征信息生成所述目标区域的类别信息的步骤包括：

采用所述池化层和激活层以预设的尺寸值通过所述特征信息生成待分类图像；

将所述待分类图像输入所述多个全连接层中，并采用所述多个全连接层生成针对所述待分类图像所对应的类别信息。

为了解决上述问题，本发明实施例还公开了一种特征图像类别信息的生成装置，包括：

图像获取模块，用于获取原始图像；

目标区域查找模块，用于从所述原始图像中查找出目标区域；

特征信息图像获取模块，用于获取所述原始图像的特征信息图像；

目标特征信息提取模块，用于在所述目标区域中提取所述特征信息图像的目标特征信息；

类别信息生成模块，用于根据所述目标特征信息生成所述目标区域的类别信息。

优选地，所述原始图像具有对应的原始图像平均像素值，和，多个待检测区域；所述多个待检测区域包括第一待检测区域，和，第二待检测区域；所述第一待检测区域具有对应的待检测区域平均像素值，所述目标区域查找模块包括：

分布直方图生成子模块，用于将所述原始图像平均像素值，和，所述待检测区域平均像素值分别平均分配到预设个数的区间中，生成针对所述原始图像的第一分布直方图，和，针对所述第一待检测区域的第二分布直方图；

第一判断子模块，用于判断所述第一分布直方图，和，所述第二分布直方对应的欧式距离是否大于预设阈值；

若是，则调用第一坐标标记子模块；

第一坐标标记子模块，用于标记所述第一待检测区域的第一区域位置坐标；

变化频率统计子模块，用于统计所述第二待检测区域中相邻两个像素点之间的梯度变化频率；

第二判断子模块，用于判断所述梯度变化频率是否大于预设阈值；

若是，则调用第二坐标标记子模块；

第二坐标标记子模块，用于标记所述第二待检测区域的第二区域位置坐标；

第三判断子模块，用于采用所述第一区域位置坐标和所述第二区域位置坐标，判断所述第一待检测区域与所述第二待检测区域是否具有重合区域；

若是，则调用目标区域生成子模块；

目标区域生成子模块，用于采用与所述重合区域，以及，与所述重合区域相邻的区域生成目标区域。

优选地，还包括：

降噪图像生成模块，用于对所述原始图像进行降噪处理，生成降噪图像。

优选地，所述装置应用于深度学习系统中，所述深度学习系统包括多层卷积神经网络，所述特征信息图像获取模块包括：

特征信息图像获取子模块，用于采用所述多层卷积神经网络从所述原始图像中提取出特征信息图像；其中，所述多层卷积神经网络具有对应的层级，两个所述层级对应的卷积神经网络之间具有池化层和激活层。

优选地，所述多层卷积神经网络包括多个全连接层，所述类别信息生成模块包括：

待分类图像生成子模块，用于采用所述池化层和激活层以预设的尺寸值通过所述特征信息生成待分类图像；

类别信息生成子模块，用于将所述待分类图像输入所述多个全连接层中，并采用所述多个全连接层生成针对所述待分类图像所对应的类别信息。

本发明实施例包括以下优点：

在实际应用中运用本发明实施例，可以在获取到原始图像后，分别用显著性区域判断算法在原始图像中查找出目标区域，以及，使用CNN神经网络获取特征信息图像，再从目标区域中提取特征信息图像的目标特征信息，并根据目标特征信息生成所述目标区域的类别信息。采用上述方式，可以先确定出原始图像中用于展现目标图像的目标区域，再从该目标区域的特征信息图像中提取目标特征信息来生成对应的类别信息，从而提升了针对具有复杂背景的原始图像的特征图像类别信息的生成准确率，进而提升了对用户推送相关信息的准确率。

附图说明

图1是本发明的一种特征图像类别信息的生成方法实施例的步骤流程图；

图2是本发明的一种特征图像类别信息的生成装置实施例的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1，示出了本发明的一种特征图像类别信息的生成方法实施例的步骤流程图，具体可以包括如下步骤：

步骤101，获取原始图像；

在具体实现中，本发明实施例的原始图像可以为包含多个图像元素的图像，其中，图像元素可以包括电子游戏图像。

例如，原始图像可以为包括了房间、家具、电脑、手机、人、等图像元素，而电子游戏图像可以为原始图像中，人通过电脑或手机玩游戏时，电脑屏幕或手机屏幕中展现的电子游戏图像。

步骤102，从所述原始图像中查找出目标区域；

在实际应用中，因为在包含多个图像元素的原始图像中，用于展现电子游戏图像的区域相较于展现其他元素的区域，在RGB分布值(三原色分布值)，和，局部梯度变化频率的表现具有较为明显的差别，展现电子游戏图像的区域的RGB分布的离散性更强，使得其与整张原始图像的平均RGB分布的欧式距离较大，并且，展现电子游戏图像的区域内部的相邻两个像素点之间的梯度变化频率更高，所以，在本发明实施例中可以通过原始图像的平均RGB分布值、展现电子游戏图像的区域的RGB分布值，以及，区域内部的相邻两个像素点之间的梯度变化频率来初步确定出原始图像中用于展现电子游戏图像的区域。

在本发明的一个优选的实施例中，本发明实施例还可以在从原始图像中查找出目标区域的步骤之前，可以先对原始图像进行降噪处理，并生成降噪图像，然后再使用该降噪图像作为原始图像，来从中查找出目标区域。

在具体实现中，本发明实施例可以通过高斯滤波器对原始图像做平滑操作，去除高频噪声对原始图像的影响。

在本发明的另一个优选实施例中，还可以通过如下方式从所述原始图像中查找出目标区域：

将原始图像平均像素值，和，待检测区域平均像素值分别平均分配到预设个数的区间中，生成针对原始图像的第一分布直方图，和，针对第一待检测区域的第二分布直方图；判断第一分布直方图，和，第二分布直方对应的欧式距离是否大于预设阈值；若是，则标记第一待检测区域的第一区域位置坐标；统计第二待检测区域中相邻两个像素点之间的梯度变化频率；判断梯度变化频率是否大于预设阈值；若是，则标记第二待检测区域的第二区域位置坐标；采用第一区域位置坐标和第二区域位置坐标，判断第一待检测区域与第二待检测区域是否具有重合区域；若是，则采用与重合区域，以及，与重合区域相邻的区域生成目标区域。

在实际应用中，本发明实施例可以按照预设尺寸值生成用于扫描原始图像的窗口，再按照预设的移动距离扫描原始图像，该窗口每次扫描的区域可以对应原始图像的一个待检测区域。

原始图像可以具有对应的原始图像平均像素值，和，多个待检测区域。每个待检测区域可以具有与其对应的待检测区域平均像素值，本发明实施例可以在扫描窗口扫描一个待检测区域时，将原始图像平均像素值平均分配到预设个数的区间中，生成针对原始图像的第一分布直方图，将该待检测区域的待检测区域平均像素值平均分配到相同个数的区间中，生成针对该待检测区域的第二分布直方图，当第一分布直方图，和，第二分布直方图对应的欧式距离大于预设阈值时，标记该待检测区域的第一区域位置坐标。

本发明实施例还可以在扫描窗口扫描一个待检测区域时，统计该待检测区域中相邻两个像素点之间的梯度变化频率，若该待检测区域中相邻的两个像素点之间的梯度变化频率大于预设阈值，则标记该待检测区域的第二区域位置坐标。

本发明实施例还可以采用第一区域位置坐标和第二区域位置坐标判断出上述两个待检测区域是否具有重合部分，若是，则采用重合部分作为目标区域，或，将重合部分和与其相邻的区域进行拼接，并生成目标区域。

例如，将原始图像RGB三通道0-255像素值平均分到16个区间中(0～15，16～31，...，240～255)，计算图像像素值的分布直方图M_RGB，以同样方法，将待检测区域RGB三通道0-255像素值平均分到16个区间中(0～15，16～31，...，240～255)，计算窗口为22×22内RGB像素点在16个区间内的分布直方图W_RGB，计算W_RGB与M_RGB直方图的欧式距离，若欧式距离大于THRESHOLD1＝13.0则判定当前窗口图像为显著性区域，区域位置进入候选区域模块，否则以步长11移动滑动窗口，并重新获取新的待检测区域的待检测区域平均像素值，并生成针对该区域的第二分布直方图，直到窗口发现某一区域对应的第一分布直方图，和，第二分布直方图对应的欧式距离大于THRESHOLD1＝13.0时，结束针对第一待检测区域的扫描。统计滑动窗口为22×22内的待检测区域中相邻的两个像素点之间的梯度变化频率，其中定义相邻两个像素点间的梯度变化大于90度的记为梯度跳变一次，统计窗口内的梯度跳变总次数F，计算当前窗口内梯度跳数F是否大于THRESHOLD2＝200，若大于则判定当前区域为显著性区域，区域位置进入候选区域模块，否则为非显著性区域，以步长11移动滑动窗口，重新统计新的待检测区域中相邻的两个像素点之间的梯度变化频率，直到新的待检测区域中相邻的两个像素点之间的梯度变化频率大于THRESHOLD2＝200，结束针对第二待检测区域的扫描。融合第一待检测区域和第二待检测区域中重合的部分，并拼接相临的区域，输出得到的候选区域。

步骤103，获取所述原始图像的特征信息图像；

在具体实现中，本发明实施例可以应用于深度学习系统中，深度学习系统可以包括多层卷积神经网络，多层卷积神经网络可以具有对应的层级，两个层级对应的卷积神经网络之间具有池化层和激活层，本发明实施例可以采用多层卷积神经网络从所述原始图像中提取出以三维矩阵形式展现的特征信息图像feature map。

例如，本发明实施例可以在图片分类识别网络中使用8层卷积神经网络，每层卷积核为3，并且每两层之间使用一层池化层和一层激活层，作为原始图像的特征提取网络。

步骤104，在所述目标区域中提取所述特征信息图像的目标特征信息；

在实际应用中，本发明实施例的特征信息图像可以包括多个特征信息，所述目标区域可以针对于特征信息图像，本发明实施例可以根据目标区域和多个特征信息，获取特征信息中与目标区域对应的目标特征信息，即，在特征信息图的目标区域中，从特征信息图的多个特征信息中提取出目标特征信息，目标区域外的特征信息可以为不需要的特征信息。

步骤105，根据所述目标特征信息生成所述目标区域的类别信息。

在具体实现中，本发明实施例的多层卷积神经网络可以包括多个全连接层，本发明实施例可以采用池化层和激活层以预设的尺寸值通过特征信息生成待分类图像，并将待分类图像输入多个全连接层中，采用多个全连接层生成针对待分类图像所对应的类别信息。

例如，使用SPP特征归一化网络将输入的目标特征信息统一生成64×64的待分类图像，将所有待分类图像分别输入到三层全连接网络中，从而输出对应的类别信息。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图2，示出了本发明的一种特征图像类别信息的生成装置实施例的结构框图，具体可以包括如下模块：

图像获取模块201，用于获取原始图像；

目标区域查找模块202，用于从所述原始图像中查找出目标区域；

特征信息图像获取模块203，用于获取所述原始图像的特征信息图像；

目标特征信息提取模块204，用于在所述目标区域中提取所述特征信息图像的目标特征信息；

类别信息生成模块205，用于根据所述目标特征信息生成所述目标区域的类别信息。

在本发明的一个优选实施例中，所述原始图像具有对应的原始图像平均像素值，和，多个待检测区域；所述多个待检测区域包括第一待检测区域，和，第二待检测区域；所述第一待检测区域具有对应的待检测区域平均像素值，所述目标区域查找模块202还可以包括如下子模块：

若是，则调用第一坐标标记子模块；

若是，则调用第二坐标标记子模块；

若是，则调用目标区域生成子模块；

在本发明的一个优选实施例中，所述装置还可以包括如下模块：

在本发明的一个优选实施例中，所述装置应用于深度学习系统中，所述深度学习系统包括多层卷积神经网络，所述特征信息图像获取模块203还可以包括如下子模块：

在本发明的一个优选实施例中，所述多层卷积神经网络包括多个全连接层，所述类别信息生成模块205还可以包括如下子模块：

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种特征图像类别信息的生成方法和一种特征图像类别信息的生成装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种特征图像类别信息的生成方法，其特征在于，包括：

获取原始图像；

从所述原始图像中查找出目标区域；

获取所述原始图像的特征信息图像；

在所述目标区域中提取所述特征信息图像的目标特征信息；

根据所述目标特征信息生成所述目标区域的类别信息。

2.根据权利要求1所述的方法，其特征在于，所述原始图像具有对应的原始图像平均像素值，和，多个待检测区域；所述多个待检测区域包括第一待检测区域，和，第二待检测区域；所述第一待检测区域具有对应的待检测区域平均像素值，所述从所述原始图像中查找出目标区域的步骤包括：

若是，则标记所述第一待检测区域的第一区域位置坐标；

判断所述梯度变化频率是否大于预设阈值；

若是，则标记所述第二待检测区域的第二区域位置坐标；

3.根据权利要求1所述的方法，其特征在于，在所述从所述原始图像中查找出目标区域的步骤之前，还包括：

对所述原始图像进行降噪处理，生成降噪图像。

4.根据权利要求1所述的方法，其特征在于，所述方法应用于深度学习系统中，所述深度学习系统包括多层卷积神经网络，所述获取所述原始图像的特征信息图像的步骤包括：

5.根据权利要求4所述的方法，其特征在于，所述多层卷积神经网络包括多个全连接层，所述根据所述目标特征信息生成所述目标区域的类别信息的步骤包括：

6.一种特征图像类别信息的生成装置，其特征在于，包括：

图像获取模块，用于获取原始图像；

7.根据权利要求6所述的装置，其特征在于，所述原始图像具有对应的原始图像平均像素值，和，多个待检测区域；所述多个待检测区域包括第一待检测区域，和，第二待检测区域；所述第一待检测区域具有对应的待检测区域平均像素值，所述目标区域查找模块包括：

若是，则调用第一坐标标记子模块；

若是，则调用第二坐标标记子模块；

若是，则调用目标区域生成子模块；

8.根据权利要求6所述的装置，其特征在于，还包括：

9.根据权利要求6所述的装置，其特征在于，所述装置应用于深度学习系统中，所述深度学习系统包括多层卷积神经网络，所述特征信息图像获取模块包括：

10.根据权利要求9所述的装置，其特征在于，所述多层卷积神经网络包括多个全连接层，所述类别信息生成模块包括：