CN107590491A

CN107590491A - 一种图像处理方法及装置

Info

Publication number: CN107590491A
Application number: CN201610533632.3A
Authority: CN
Inventors: 金炫
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2016-07-07
Filing date: 2016-07-07
Publication date: 2018-01-16
Anticipated expiration: 2036-07-07
Also published as: CN107590491B

Abstract

本申请公开了一种图像处理方法及装置，所述方法包括：获取样本图片的标注信息、图像维度特征和文字维度特征；其中，所述标注信息至少包括所述图片的内容属性；所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联；利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征，建立图片识别模型；所述图片识别模型用于识别待处理图片的内容属性。本申请有效提高了图片识别的准确率。

Description

一种图像处理方法及装置

技术领域

本申请涉及数据处理技术领域，尤其涉及一种图像处理方法及装置。

背景技术

随着互联网的发展，用户可以使用互联网方便地传播、交流各种信息。用户在享受互联网传播、获取信息的便利的同时，也饱受垃圾信息的困扰。其中，图片形式的垃圾信息在各种电子商务平台、论坛社区中泛滥，例如广告图片、诈骗图片等。用户在浏览、搜索图片信息时，大量存在的垃圾图片，降低了用户获取有效信息的效率，严重影响了用户体验。因此，如何标识图片的可信性成为一个重要的问题。

现有技术中，在标识图片信息的可信性时，主要是通过检测垃圾图片例如广告图片的方式来标识非法图片。具体地，现有技术存在一种使用CNN深度学习模型进行分类的图片识别方法，利用深度学习自主提取图片特征以对图片进行分类，进而判断是否垃圾图片。然而，这种方式非常依赖于样本图片的标注数据，对区别于样本图片特征的其他图片无法进行准确识别，因此存在准确性较低、灵活性不强的缺陷。

发明内容

有鉴于此，本申请提供了一种图像处理方法及装置，用以解决现有技术对图像处理的准确性较低的技术问题。

为解决上述技术问题，本申请实施例的第一方面，提供了一种图像处理方法，包括：分别对样本图片和待处理图片进行特征提取处理，获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征，其中，所述样本图片和所述待处理图片均包括文本区域，所述图像维度特征与所述文本区域相关联；比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离，获得比较结果；根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。

可选的，所述图像维度特征通过以下方式得到：将所述图片划分为多个颜色通道，提取每个颜色通道对应的文字区域；对所述每个颜色通道对应的文字区域进行合并处理，获取文本行区域；基于获取的所述文本行区域提取所述图片的图像维度特征。

可选的，所述图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。

可选的，所述文字维度特征通过以下方式得到：对图片进行文字识别处理，获得文字识别结果；将所述文字识别结果与预先存储的关键词库中的关键词进行匹配，获得匹配结果；根据所述匹配结果获取所述图片的文字维度特征；其中，所述图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数，和/或，与所述文字识别结果匹配的关键词的置信度的和值。

为解决上述技术问题，本申请实施例的第二方面，提供了一种图像处理方法，包括：获取样本图片的标注信息、图像维度特征和文字维度特征；其中，所述标注信息至少包括所述图片的内容属性；所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联；利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征，建立图片识别模型；所述图片识别模型用于识别待处理图片的内容属性。

可选的，获取所述样本图片的图像维度特征包括：将所述样本图片划分为多个颜色通道，提取每个颜色通道对应的文字区域；对所述每个颜色通道对应的文字区域进行合并处理，获取文本行区域；基于获取的所述文本行区域提取所述样本图片的图像维度特征。

可选的，所述样本图片的图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。

可选的，获取所述样本图片的文字维度特征包括：对所述样本图片进行文字识别处理，获得文字识别结果；将所述文字识别结果与预先存储的关键词库中的关键词进行匹配，获得匹配结果；根据所述匹配结果获取所述样本图片的文字维度特征；其中，所述样本图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数，和/或，与所述文字识别结果匹配的关键词的置信度的和值。

可选的，所述方法还包括：获取与所述样本图片对应的用户行为特征和/或用户信用特征；所述利用所述样本图片的标注信息、图像维度特征和文字维度特征，建立图片识别模型包括：利用所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征建立图片识别模型。

可选的，所述利用所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征建立图片识别模型包括：将获取的所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征输入支持向量机SVM模型，训练得到图片识别模型。

可选的，所述方法还包括：建立样本图片、上传所述样本图片的用户的标识、用户行为特征/或用户信用特征的对应关系；所述获取与所述样本图片对应的用户行为特征和/或用户信用特征包括：利用所述样本图片、上传所述样本图片的用户的标识、用户行为特征和/或用户信用特征的对应关系，获取与所述样本图片对应的用户行为特征和/或用户信用特征。

根据本申请实施例的第三方面，提供了一种图像处理方法，包括：对待处理图片进行特征提取处理，获取所述待处理图片的图像维度特征和文字维度特征；其中，所述待处理图片的图像维度特征与所述待处理图片包含的文本区域相关联；利用预先建立的图片识别模型、所述图像维度特征和所述文字维度特征对所述待处理图片进行识别，获得识别结果；所述识别结果用于标识所述待处理图片的内容属性。

可选的，所述方法还包括：接收对所述待识别图片的识别结果的判定操作，根据所述判定操作更新所述待识别图片的标注信息；利用更新后的所述标注信息更新所述图片识别模型。

根据本申请实施例的第四方面，提供了一种图像处理装置，包括：特征获取单元，用于获取样本图片的标注信息、图像维度特征和文字维度特征；其中，所述标注信息至少包括所述图片的内容属性；所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联；模型建立单元，用于利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征，建立图片识别模型；所述图片识别模型用于识别待处理图片的内容属性。

可选的，所述特征获取单元包括图像特征提取单元和文字特征提取单元，其中，所述图像特征提取单元包括：文字区域提取单元，用于将所述样本图片划分为多个颜色通道，提取每个颜色通道对应的文字区域；合并单元，用于对所述每个颜色通道对应的文字区域进行合并处理，获取文本行区域；图像维度特征获取单元，用于基于获取的所述文本行区域提取所述样本图片的图像维度特征。

可选的，所述图像维度特征提取单元用于基于获取的所述文本行区域提取所述样本图片的图像维度特征包括：所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。

可选的，所述特征获取单元包括图像特征提取单元和文字特征提取单元，其中，所述文字特征提取单元包括：文字识别单元，用于对所述样本图片进行文字识别处理，获得文字识别结果；匹配单元，用于将所述文字识别结果与预先存储的关键词库中的关键词进行匹配，获得匹配结果；文字维度特征获取单元，用于根据所述匹配结果获取所述样本图片的文字维度特征；其中，所述样本图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数，和/或，与所述文字识别结果匹配的关键词的置信度的和值。

可选的，所述特征获取单元还包括：行为特征获取单元，用于获取与所述样本图片对应的用户行为特征；和/或，信用特征获取单元，用于获取与所述样本图片对应的用户信用为特征；所述模型建立单元具体用于：利用所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征建立图片识别模型。

可选的，所述装置还包括：建立单元，用于建立样本图片、上传所述样本图片的用户的标识、用户行为特征和/或用户信用特征的对应关系；所述行为特征获取单元具体用于：利用所述样本图片、上传所述样本图片的用户的标识、用户行为特征的对应关系，获取与所述样本图片对应的用户行为特征；所述信用特征获取单元具体用于：利用所述样本图片、上传所述样本图片的用户的标识、用户信用特征的对应关系，获取与所述样本图片对应的用户信用特征。

根据本申请实施例的第五方面，提供了一种图像处理装置，包括：特征提取单元，用于对待处理图片进行特征提取处理，获取所述待处理图片的图像维度特征和文字维度特征；其中，所述待处理图片的图像维度特征与所述待处理图片包含的文本区域相关联；识别单元，用于利用预先建立的图片识别模型、所述图像维度特征和所述文字维度特征对所述待处理图片进行识别，获得识别结果；所述识别结果用于标识所述待处理图片的内容属性。

可选的，所述装置还包括：第一更新单元，用于接收对所述待识别图片的识别结果的判定操作，根据所述判定操作更新所述待识别图片的标注信息；第二更新单元，用于利用所述标注信息更新所述图片识别模型。

根据本申请实施例的第五方面，提供了一种图像处理装置，包括：特征提取单元，用于分别对样本图片和待处理图片进行特征提取处理，获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征，其中，所述样本图片和所述待处理图片均包括文本区域，所述图像维度特征与所述文本区域相关联；比较单元，用于比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离，获得比较结果；确定单元，用于根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。

由上述方案可知，本申请实施例的一个方面的有益效果为：本申请可以通过获取样本图片的标注信息，提取样本图片的图像维度特征和文字维度特征，建立图片识别模型，用于识别待处理图片的内容属性。由于本申请提取了样本图片的图像维度特征和文字维度特征，利用多维度特征建立图片识别模型，相对于仅依赖样本图片标注信息的识别方法，有效提高了图片识别的准确率。此外，由于提取的图像维度特征与图片包含的文本区域相关联，因此，上述方法非常有利于识别包含文字的图片的内容属性，有效提高了图片识别的准确性。另外，本申请提取文字维度特征的方式可以避免将包含多文字的合法图片判定为非法图片，提高了识别图片内容属性的准确性。进一步地，由于本申请结合图片的图像维度特征和文字维度特征一起进行识别处理，对图片背景、文字信息的改变具有较好的适应性，增加了图片识别的灵活性和准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种图像处理方法的流程图；

图2为本申请实施例提供的图像维度特征提取流程示意图；

图3为本申请实施例提供的文字维度特征提取流程示意图；

图4为本申请实施例提供的图像处理方法的流程图；

图5为本申请实施例提供的一种图像处理方法的流程图；

图6为本申请实施例提供的一种图像处理装置的结构示意图；

图7为本申请实施例提供的一种图像处理装置的部分结构示意图；

图8为本申请示例性的应用场景示意图；

图9为本申请实施例提供的图像处理方法的流程图；

图10为本申请实施例提供的图像处理装置示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本文中，所涉及的术语包括：

“样本图片的标注信息”一般是指用于标注图片属性的信息，至少包括图片的内容属性。其中，图片的内容属性例如可以是所述图片的内容属性为广告图片、非广告图片，或者所述图片的内容属性为合法图片、非法图片等。本申请对于内容属性的类别不进行限制，只要是能够区分图片内容即可。需要说明的是，本申请涉及的技术术语“图片的内容属性”与一般理解的图片属性的内涵有所不同。一般地，图片属性一般是指图像的格式、大小、分辨率、协议类型、地址等，例如通过右键点击图片即可以查看图片的属性。本申请中的图片内容属性一般是指所述图片的内容显示出的图片的某种性质，例如是广告图片或者非广告图片等。

其中，所述涉及的技术术语“图像维度特征”一般是指对图片进行特征提取获得的与图像本身关联的特征，例如颜色、位深、色调、饱和度、亮度等。在本申请中，所述图像维度特征是与所述图片包含的文本区域相关联的特征。

其中，所涉及的技术术语“文字维度特征”一般是指对图片进行特征提取获得的与图片包含的文字关联的特征。

其中，所涉及的技术术语“图片识别模型”用于识别待处理图片的内容属性，例如识别待处理图片是广告图片或者非广告图片等，在此不进行限定。

其中，所涉及的技术术语“用户的标识”一般是指用于唯一标识用户的标识，例如可以是用户在电子商务平台、邮箱、即时通讯软件(IM)等应用所注册的用户账号。

其中，所涉及的技术术语“用户行为特征”一般是指与用户的行为相关联的特征。

其中，所涉及的技术术语“用户信用特征”一般是指表征用户信誉度的特征。

当然，上述术语的解释仅为方便理解而做出，而不具有任何限制含义。

参见图8，为本申请示例性的应用场景示意图。如图8所示，在本申请一个示例性应用场景中，待处理图片800包含若干文本行区域，例如文本行区域801、文本行区域802、文本行区域803、文本行区域804。所述图像处理装置用于提取所述待处理图片800的图像维度特征和文字维度特征，并利用预先处理的图片识别模型、提取的所述图片维度特征和文字维度特征对所述待处理图片进行识别，获得识别结果900。如图8所示，识别结果900例如可以是表明所述图片的内容属性为广告图片的概率是85％。当然，识别结果还可以是其他表现形式，例如是、否是广告图片等。当然，以上以图片内容属性为广告图片为例进行说明，本申请还可以应用于其他应用场景，在此不进行限制。

参考图1，为本申请实施例一提供的一种图像处理方法的流程图。

S101，获取样本图片的标注信息、图像维度特征和文字维度特征。

具体实现时，所示样本图片的标注信息至少包括图片的内容属性，例如可以是所述图片的内容属性为广告图片、非广告图片，或者所述图片的内容属性为合法图片、非法图片等。根据图片识别目的不同，可以为图片设置不同的内容属性，本申请对于内容属性的类别不进行限制，只要是能够区分图片内容即可。

在一些实施方式中，所述样本图片的标注信息还可以包括上传所述样本图片的用户标识信息。举例说明，在采集样本图片时，可以同时采集上传所述图片的用户ID以及用户行为数据。所述用户行为数据可以包括用户上传样本图片的时间、用户上传样本图片的次数等。在一些应用场景下，用户可能使用同一用户ID在多个不同平台登录，因此，可以利用同一用户标识将用户在不同平台的行为关联起来，并统一记录用户行为数据。

具体实现时，可以对所述样本图片进行特征提取处理，获取所述样本图片的图像维度特征和文字维度特征。其中，所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联。需要说明的是，所述图片的图像维度特征与包含的文本区域相关联，可以是与图片包含的整体文本区域的特征相关联，也可以是与图片包含的文本行区域的特征相关联。

如图2所示，在一些实施方式中，所述获取样本图片的图像维度特征可以包括如下步骤：

S201，将所述样本图片划分为多个颜色通道，提取每个颜色通道对应的文字区域。

举例说明，可以将样本图片划分为4个颜色通道，再对每个通道用MSER(MaximallyStable Extremal Regions，区域特征提取)方法进行文字区域提取，具体的：

利用如下公式进行颜色通道的提取：

其中，r、g、b为原始样本图片的三个颜色通道，而修正后的R、G、B、Y则是颜色通道的四个颜色基矩阵，分别代表红、绿、蓝、黄。由此四个基颜色矩阵生成颜色通道，其描述如下公式：

其中，RG、GR、BY、YB为选取的四个颜色通道，(x,y)表示矩阵的像素位置。而RG、GR、BY、YB四个彩色通道对应的MSER区域提取采用有序像素集合S_color＝{0,7,15,...,255}。按照像素集合中的像素对各个通道内图像进行分割，得到对应的联通区域，如下公式：

RG(R_l)＝(R_l，R_l+1,...,R_l+n) 公式(9)

GR(R₁)＝(R₁,R_l+1,...,R_1+n) 公式(10)

BY(R_l)＝(R_l,R_l+1,...,R_l+n) 公式(11)

YB(R_l)＝(R_l,R_l+1,...,R_l+n) 公式(12)

其中Rl代表对应的区域，区域变化程度描述如下公式：

其中|·|代表计算区域内的像素个数，R₁如果满足以下条件则为需要提取的MSER区域：

v(R_l)＜v(R_l-1)&v(R₁)＜v(R_l+1) 公式(14)

其中各个通道的MSER区域相互独立。

针对上述多个颜色通道的MSER提取结果，利用训练完成的字符分类器进行非字符区域的滤除，分类器输出结果高于阈值的为文字区域。

S202，对所述每个颜色通道对应的文字区域进行合并处理，获取文本行区域。

具体地，对每个颜色通道的文字区域，可以按照文字的颜色、位置、笔画宽度等信息进行关联，将相似度高的文字区域合成文本行区域。

下面进行详细地说明。

将获取的各个文字区域按照左上角点的坐标为准以行扫描的顺序进行排序，得到一维区域。以下以计算a、b两个区域的相似度为例进行说明，计算过程描述如下公式：

上式中，x、y代表着区域的左上角的横坐标和纵坐标，h、w表示区域的高度和宽度，s代表着区域的笔画宽度。

由此，在获取特征F₁、F₂、F₃、F₄、F₅、F₆后，即可以将上述特征输入特征模型进行预测，以获得预测结果即预测两个区域的相似性。本实施例中利用SVM分类器和标注数据进行训练以得到特征模型。进而利用训练完成的文本行分类器，对上述预测结果进分类，分类器输出结果低于阈值的区域被滤除；高于阈值的区域为文本行区域。

需要说明的是，这里的分类器除了可以为SVM分类器，也可以为BP神经网络或CNN深度学习神经网络分类器。

S203，基于获取的所述文本行区域提取所述样本图片的图像维度特征。

其中，所述样本图片的图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。

其中，所述文本行区域中心位置水平偏移方差的计算方式如下：计算每个文本行区域的中心位置的水平坐标(x轴坐标)，中心位置的水平偏移方差即为文本行区域的水平坐标方差。

其中，上述文本行区域中心位置竖直偏移方差的计算方式与特征3相似，区别在于计算文本行区域中心位置的竖直坐标(y轴坐标)。

如图3所示，在一些实施方式中，所述获取样本图片的文字维度特征可以包括如下步骤：

S301，对所述样本图片进行文字识别处理，获得文字识别结果。

具体实现时，可以利用OCR(Optical Character Recognition，光学字符识别)对样本图片中包含的文字进行识别，获得文字识别结果。可选地，选取置信度最高的前十个单字识别结果作为所述样本图片的文字识别结果。置信度是指对文字进行识别的可信度，具体计算方法可以参照现有技术进行。

S302，将所述文字识别结果与预先存储的关键词库中的关键词进行匹配，获得匹配结果。

在本申请具体实现时，预先建立了关键词库，用于匹配使用。所述关键词库可以是与具有某种内容属性的图片关联的关键词组成的词库。举例说明，可以对标注信息为广告图片的图片进行识别，获取与所述图片对应的关键词作为广告关键词，建立广告关键词库，以便识别包含所述关键词的图片是否广告图片。

S303，根据所述匹配结果获取所述样本图片的文字维度特征。

其中，所述样本图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数，和/或，与所述文字识别结果匹配的关键词的置信度的和值。

举例说明，若样本图片包括“招聘兼职人员”这六个字，对样本图片进行识别得到的单字识别结果为“招”、“聘”、“兼”、“职”、“人”、“员”这六个单字，其与预先建立的关键词库中的关键词“招聘”“兼职”匹配。则根据所述匹配结果获得的关键词个数为2。在计算与所述文字识别结果匹配的关键词的置信度的和值时，是计算“招”、“聘”、“兼”、“职”这4个字符的各自对应的置信度的和值。

在一些实施方式中，对样本图片进行特征提取时，还可以获取与所述样本图片对应的用户行为特征和/或用户信用特征。其中，所述“用户行为特征”一般是指与用户的行为相关联的特征。举例说明，所述用户行为特征可以包括：用户上传特定内容属性的图片与上传的所有图片的数量的比值、用户上传同一图片的次数、用户上传图片的总数中的一个或多个的组合。其中，用户上传特定内容属性的图片与上传的所有图片的数量的比值，例如可以是用户上传广告图片与上传的所有图片的数量的比值。用户上传同一图片的次数可以通过计算图片的MD5的方法来确定。

其中，所述“用户信用特征”一般是指表征用户信誉度的特征。例如可以包括用户被处罚次数、用户被具备次数或者举报他人的次数中的一个或多个的组合。当然，还可以采取其他特征来标注用户的信誉度，在此不进行限定。

具体实现时，可以在采集样本数据时，即以用户标识作为关联，建立样本图片、上传所述样本图片的用户的标识、用户行为特征/或用户信用特征的对应关系。在获取用户行为特征和/或用户信用特征时，即可以利用所述对应关系，获取与所述样本图片对应的用户行为特征，和/或，用户信用特征。其中，所述样本图片、上传所述样本图片的用户的标识、用户行为特征/或用户信用特征的对应关系具体可以是：样本图片、上传所述样本图片的用户的标识、用户行为特征的对应关系，或者，样本图片、上传所述样本图片的用户的标识、用户信用特征的对应关系，或者，样本图片、上传所述样本图片的用户的标识、用户行为特征、用户信用特征的对应关系。

S102，利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征，建立图片识别模型；所述图片识别模型用于识别待处理图片的内容属性。

具体实现时，可以将获取的所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征输入支持向量机(英文简称为SVM，英文全称为Support Vector Machine)分类器，训练得到图片识别模型。例如，可以利用所述样本图片的标注信息，所述图像维度特征中的任意一个或多个的组合、所述文字维度特征的任意一个或多个的组合，利用分类器，例如SVM分类器训练得到图片识别模型。其中，SVM是一个有监督的学习模型，通常用来进行模式识别、分类、以及回归分析等，本申请利用SVM来进行识别模型的建立。建立识别模型使用的分类器还可以是神经网络、随机森林分类器等，本申请对分类器的类型不进行限制。

在一些实施方式中，还可以利用述样本图片的标注信息，所述图像维度特征中的任意一个或多个的组合、所述文字维度特征的任意一个或多个的组合、所述用户行为特征的任意一个或多个的组合，训练得到图片识别模型。

在一些实施方式中，还可以利用述样本图片的标注信息，所述图像维度特征中的任意一个或多个的组合、所述文字维度特征的任意一个或多个的组合、所述用户信用特征的任意一个或多个的组合，训练得到图片识别模型。

在一些实施方式中，还可以利用述样本图片的标注信息，所述图像维度特征中的任意一个或多个的组合、所述文字维度特征的任意一个或多个的组合、所述用户行为特征的任意一个或多个的组合、所述用户信用特征的任意一个或多个的组合，训练得到图片识别模型。

参见图4，为本申请实施例提供的图像处理方法流程图。所述方法例如可以包括：

S401，对待处理图片进行特征提取处理，获取所述待处理图片的图像维度特征和文字维度特征。

具体实现时，在提取待处理图片的图像维度特征时与提取样本图片的图像维度特征的方法相同，具体请参见图2所示的方法步骤。需要说明的是，提取的图像维度特征的种类和内容是与建立识别模型时提取的图像维度特征的种类和内容对应的。其中，所述待处理图片的图像维度特征与所述待处理图片包含的文本区域相关联。

具体实现时，在提取待处理图片的文字维度特征时与提取样本图片的文字维度特征的方法相同，具体请参见图3所示的方法步骤。需要说明的是，提取的文字维度特征的种类和内容是与建立识别模型时提取的文字维度特征的种类和内容也是对应的。

S402，利用预先建立的图片识别模型、所述图像维度特征和所述文字维度特征对所述待处理图片进行识别，获得识别结果；所述识别结果用于标识所述待处理图片的内容属性。

具体实现时，将提取的所述图像维度特征和所述文字维度特征输入图片识别模型，即可以获得对待处理图片进行识别得到的识别结果，所述识别结果用于标识所述待处理图片的内容属性，例如是否为广告图片。当然，本申请提供的方法还可以应用到识别图片的其他内容属性，在此不进行限定。

在一些实施方式中，所述方法还可以包括：接收对所述待识别图片的识别结果的判定操作，根据所述判定操作更新所述待识别图片的标注信息；利用更新后的所述标注信息更新所述图片识别模型。举例说明，本实施例中可以将所述待处理图片通过所述识别模型之后的识别结果导入到审核平台，由人工通过登录该审核平台对所述待处理图片是否为特定内容属性的图片例如广告图片进行审核，并输入相应的判定操作，本实施例对该判定操作进行接收。利用本实施例中人工输入的判定操作，进一步确定所述目标图片是否为广告图片，提高准确性，降低识别风险。可选的，在接收对所述待识别图片的识别结果的判定操作，还可以根据所述判定操作更新所述待识别图片的标注信息，并利用更新后的所述标注信息更新所述图片识别模型。例如，为了适应用户的习惯以及图片形式的改变，本实施例中可以利用更新后的所述标注信息更新所述图片识别模型。例如，可以每隔一定时间，基于经过识别的目标图片更新一次识别模型，或者可以在只要识别模型输出识别结果时都基于经过识别的目标图片更新一次识别模型。具体的，本实施例中可以将所述待处理图片及其特征作为样本图片，达到更新样本图片数据的目的，进而基于这些样本图片数据重新进行识别模型的建立。这样处理可以提高识别模型的准确性，使之具有较好的适应性。

在本申请提供的方法中，由于提取了样本图片的多个维度特征，相对于单一维度特征，建立的识别模型更加可靠，从而提高了图片识别的准确性。此外，由于本申请结合图片的图像维度特征和文字维度特征一起进行识别处理，对图片背景、文字信息的改变具有较好的适应性，增加了图片识别的灵活性和准确性。此外，由于提取的图片的图像维度特征和文字维度特征与图片包含的文本区域相关联，非常有利于识别包含文字的图片的内容属性，有效提高了图片识别的准确性。另外，本申请提取文字维度特征的方式可以避免将包含多文字的合法图片判定为非法图片，提高了识别图片内容属性的准确性。进一步地，本申请还可以通过提取用户行为特征、用户信用特征结合图像维度特征和文字维度特征一起进行识别处理，进一步提高了识别结果的准确性。

为了便于本领域技术人员更清楚地理解本申请在具体场景下的实施方式，下面以一个具体示例对本申请实施方式进行介绍。需要说明的是，该具体示例仅为使得本领域技术人员更清楚地了解本申请，但本申请的实施方式不限于该具体示例。

参见图5，为本申请实施例提供的图像处理方法流程图。

S501，获取样本图片。

在采集样本图片时，还可以同时采集上传所述图片的用户ID以及用户行为数据，并基于用户的行为数据获得用户的行为特征和用户信用特征。进一步地，还可以基于用户标识建立用户标识、样本图片、用户行为特征、用户信用特征的对应关系。

S502，获取样本图片的标注信息。所述标注信息用于标识样本图片的内容属性，例如是否为广告图片。

S503，获取样本图片的图像维度特征。

S504，获取样本图片的文字维度特征。

S505，获取与样本图片对应的用户行为特征。

S506，获取与样本图片对应的用户信用特征。

S503至S506的实现可以参照前述实施例的方法，S502至S506的并没有必然的先后顺序，可以颠倒或者并行地执行。

S507，利用样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征、用户信用特征建立图片识别模型。

S508，提取待处理图片的图像维度特征、文字维度特征、用户行为特征、用户信用特征。

S509，利用所述待处理图片的图像维度特征、文字维度特征、用户行为特征、用户信用特征、图片识别模型获得识别结果。

S510，利用所述识别结果更新图片识别模型。

在本申请另一些实施方式中，替代建立识别模型的方式，本申请也可以通过以下方法获得待处理图片的内容属性，参见图9，所示方法例如可以包括：

S901，分别对样本图片和待处理图片进行特征提取处理，获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征，其中，所述样本图片和所述待处理图片均包括文本区域，所述图像维度特征与所述文本区域相关联。

具体实现时，提取样本图片的图像维度特征与待处理图片的图像维度特征的方式相同，提取的图像维度特征的类型也相同。在一些实施方式中，所述图像维度特征通过以下方式得到：将所述图片划分为多个颜色通道，提取每个颜色通道对应的文字区域；对所述每个颜色通道对应的文字区域进行合并处理，获取文本行区域；基于获取的所述文本行区域提取所述图片的图像维度特征。其中，所述图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。具体的实现可以与图2所示的实现方式相同，在此不再赘述。

S902，比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离，获得比较结果。

具体实现时，可以将图像维度特征转换为特征向量，计算待处理图片的图像维度特征向量与样本图片图像维度特征向量的欧式距离，以及，计算待处理图片的文字维度特征向量与样本图片文字维度特征向量的欧式距离。

需要说明的是，样本图片可以分为两个类别，例如广告类别与非广告类别，分别提取每一类别的图像维度特征与文字维度特征。而后，分别计算待处理图片与样本图片各特征向量的欧式距离，以获得待处理图片的分类。

S903，根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。

具体实现时，由于样本图片的内容属性是已知的，因此可以根据计算的样本图片与待处理图片的特征向量的距离，确定待处理图片的内容属性。以文字维度特征的提取举例说明，假设样本图片包括两个类别，其内容属性分别对应广告图片和非广告图片。在获取待处理图片的文字维度特征后，可以计算待处理图片的文字维度特征与广告图片的文字维度特征的距离以及待处理图片的文字维度特征与非广告图片的文字维度特征的距离，比较两个距离的大小，将待处理图片归为与其距离较小的特征对应的类别，由此即可以确定待处理图片的内容属性。当然，由于本申请提取了两个维度的特征，因此可以把由此计算的距离进行加权处理，从而获得样本图片与待处理图片的最终距离，进而根据距离确定待处理图片的内容属性。当然，本领域技术人员可以理解的是，样本图片也可以仅由一类图片构成，例如全部为广告图片，通过计算待处理图片与广告图片的距离，确定待处理图片的内容属性是广告图片或者非广告图片。

本领域技术人员可以理解的是，应用上述分类与预测的思想，替代S902和S903的实现方式，可以根据提取的样本图片的文字维度特征、图像维度特征以及样本图片的内容属性训练得到分类器(又可以称之为识别模型)，而后通过提取的待处理图片的文字维度特征、图像维度特征、所述分类器或者识别模型，预测得到待处理图片所述的类别，意即待处理图片的内容属性。

以上对本申请提供的图像处理方法进行了详细地介绍，下面介绍对应的图像处理装置。

如图6所示，为本申请实施例提供的图像处理装置示意图。

一种图像处理装置600，可以包括：

特征获取单元601，用于获取样本图片的标注信息、图像维度特征和文字维度特征；其中，所述标注信息至少包括所述图片的内容属性。所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联。

模型建立单元602，用于利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征，建立图片识别模型；所述图片识别模型用于识别待处理图片的内容属性。

可选的，所述特征获取单元601包括图像特征提取单元和文字特征提取单元，其中，所述图像特征提取单元包括：

文字区域提取单元，用于将所述样本图片划分为多个颜色通道，提取每个颜色通道对应的文字区域；

合并单元，用于对所述每个颜色通道对应的文字区域进行合并处理，获取文本行区域；

图像维度特征获取单元，用于基于获取的所述文本行区域提取所述样本图片的图像维度特征。

可选的，所述特征获取单元601包括图像特征提取单元和文字特征提取单元，其中，所述文字特征提取单元包括：

文字识别单元，用于对所述样本图片进行文字识别处理，获得文字识别结果；

匹配单元，用于将所述文字识别结果与预先存储的关键词库中的关键词进行匹配，获得匹配结果；

文字维度特征获取单元，用于根据所述匹配结果获取所述样本图片的文字维度特征；其中，所述样本图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数，和/或，与所述文字识别结果匹配的关键词的置信度的和值。

可选的，所述特征获取单元601还包括：

行为特征获取单元，用于获取与所述样本图片对应的用户行为特征；和/或，

信用特征获取单元，用于获取与所述样本图片对应的用户信用为特征。

其中，所述“用户行为特征”一般是指与用户的行为相关联的特征。举例说明，所述用户行为特征可以包括：用户上传特定内容属性的图片与上传的所有图片的数量的比值、用户上传同一图片的次数、用户上传图片的总数中的一个或多个的组合。其中，用户上传特定内容属性的图片与上传的所有图片的数量的比值，例如可以是用户上传广告图片与上传的所有图片的数量的比值。用户上传同一图片的次数可以通过计算图片的MD5的方法来确定。

可选的，所述装置还包括：

建立单元，用于建立样本图片、上传所述样本图片的用户的标识、用户行为特征和/或用户信用特征的对应关系；

所述行为特征获取单元具体用于：利用所述样本图片、上传所述样本图片的用户的标识、用户行为特征的对应关系，获取与所述样本图片对应的用户行为特征；所述信用特征获取单元具体用于：

利用所述样本图片、上传所述样本图片的用户的标识、用户信用特征的对应关系，获取与所述样本图片对应的用户信用特征。

在一些实施方式中，所述模型建立单元602具体用于：利用所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征建立图片识别模型。

在一些实施方式中，所述模型建立单元602具体用于：将获取的所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征输入支持向量机SVM分类器，训练得到图片识别模型。例如，可以利用述样本图片的标注信息，所述图像维度特征中的任意一个或多个的组合、所述文字维度特征的任意一个或多个的组合、所述用户行为特征的任意一个或多个的组合，训练得到图片识别模型。又如，还可以利用述样本图片的标注信息，所述图像维度特征中的任意一个或多个的组合、所述文字维度特征的任意一个或多个的组合、所述用户信用特征的任意一个或多个的组合，训练得到图片识别模型。再例如，还可以利用述样本图片的标注信息，所述图像维度特征中的任意一个或多个的组合、所述文字维度特征的任意一个或多个的组合、所述用户行为特征的任意一个或多个的组合、所述用户信用特征的任意一个或多个的组合，训练得到图片识别模型。

参见图7，为本申请一种图像处理装置示意图。

一种图像处理装置700，包括：

特征提取单元701，用于对待处理图片进行特征提取处理，获取所述待处理图片的图像维度特征和文字维度特征。其中，所述待处理图片的图像维度特征与所述待处理图片包含的文本区域相关联。

具体实现时，在提取待处理图片的图像维度特征时与提取样本图片的图像维度特征的方法相同。需要说明的是，提取的图像维度特征的种类和内容是与建立识别模型时提取的图像维度特征的种类和内容对应的。具体实现时，在提取待处理图片的文字维度特征时与提取样本图片的文字维度特征的方法相同。需要说明的是，提取的文字维度特征的种类和内容是与建立识别模型时提取的文字维度特征的种类和内容也是对应的。

识别单元702，用于利用预先建立的图片识别模型、所述图像维度特征和所述文字维度特征对所述待处理图片进行识别，获得识别结果；所述识别结果用于标识所述待处理图片的内容属性。

可选的，所述装置还包括：

第一更新单元，用于接收对所述待识别图片的识别结果的判定操作，根据所述判定操作更新所述待识别图片的标注信息；

第二更新单元，用于利用所述标注信息更新所述图片识别模型。

参见图10，为本申请一种图像处理装置示意图。

所述图像处理装置1000可以包括：

特征提取单元1001，用于分别对样本图片和待处理图片进行特征提取处理，获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征，其中，所述样本图片和所述待处理图片均包括文本区域，所述图像维度特征与所述文本区域相关联。

比较单元1002，用于比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离，获得比较结果。

确定单元1003，用于根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。

在一些实施方式中，所述特征提取单元1001具体用于将所述图片划分为多个颜色通道，提取每个颜色通道对应的文字区域；对所述每个颜色通道对应的文字区域进行合并处理，获取文本行区域；基于获取的所述文本行区域提取所述图片的图像维度特征。

在一些实施方式中，所述特征提取单元1001具体用于对图片进行文字识别处理，获得文字识别结果；将所述文字识别结果与预先存储的关键词库中的关键词进行匹配，获得匹配结果；根据所述匹配结果获取所述图片的文字维度特征；其中，所述图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数，和/或，与所述文字识别结果匹配的关键词的置信度的和值。、

对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种图像处理方法，其特征在于，包括：

分别对样本图片和待处理图片进行特征提取处理，获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征，其中，所述样本图片和所述待处理图片均包括文本区域，所述图像维度特征与所述文本区域相关联；

比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离，获得比较结果；

根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。

2.根据权利要求1所述的方法，其特征在于，所述图像维度特征通过以下方式得到：

将所述图片划分为多个颜色通道，提取每个颜色通道对应的文字区域；

对所述每个颜色通道对应的文字区域进行合并处理，获取文本行区域；

基于获取的所述文本行区域提取所述图片的图像维度特征。

3.根据权利要求2所述的方法，其特征在于，所述图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。

4.根据权利要求1所述的方法，其特征在于，所述文字维度特征通过以下方式得到：

对图片进行文字识别处理，获得文字识别结果；

将所述文字识别结果与预先存储的关键词库中的关键词进行匹配，获得匹配结果；

根据所述匹配结果获取所述图片的文字维度特征；其中，所述图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数，和/或，与所述文字识别结果匹配的关键词的置信度的和值。

5.一种图像处理方法，其特征在于，包括：

获取样本图片，其中，所述样本图片包括文本区域；

获取样本图片的标注信息、图像维度特征和文字维度特征，其中，所述标注信息包括所述图片的内容属性；所述样本图片的图像维度特征与所述文本区域相关联；

利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征，建立图片识别模型；所述图片识别模型用于识别待处理图片的内容属性。

6.根据权利要求1所述的方法，其特征在于，获取样本图片的图像维度特征包括：

将所述样本图片划分为多个颜色通道，提取每个颜色通道对应的文字区域；

基于获取的所述文本行区域提取所述样本图片的图像维度特征。

7.根据权利要求6所述的方法，其特征在于，所述样本图片的图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。

8.根据权利要求5所述的方法，其特征在于，获取样本图片的文字维度特征包括：

对所述样本图片进行文字识别处理，获得文字识别结果；

根据所述匹配结果获取所述样本图片的文字维度特征；其中，所述样本图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数，和/或，与所述文字识别结果匹配的关键词的置信度的和值。

9.根据权利要求5所述的方法，其特征在于，所述方法还包括：

获取与所述样本图片对应的用户行为特征和/或用户信用特征；

所述利用所述样本图片的标注信息、图像维度特征和文字维度特征，建立图片识别模型包括：

利用所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征建立图片识别模型。

10.根据权利要求9所述的方法，其特征在于，所述利用所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征建立图片识别模型包括：

将获取的所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征输入支持向量机SVM分类器，训练得到图片识别模型。

11.根据权利要求5所述的方法，其特征在于，所述方法还包括：

建立样本图片、上传所述样本图片的用户的标识、用户行为特征/或用户信用特征的对应关系；

所述获取与所述样本图片对应的用户行为特征和/或用户信用特征包括：

利用所述样本图片、上传所述样本图片的用户的标识、用户行为特征和/或用户信用特征的对应关系，获取与所述样本图片对应的用户行为特征和/或用户信用特征。

12.一种图像处理方法，其特征在于，包括：

对待处理图片进行特征提取处理，获取所述待处理图片的图像维度特征和文字维度特征；其中，所述待处理图片的图像维度特征与所述待处理图片包含的文本区域相关联；

利用预先建立的图片识别模型、所述图像维度特征和所述文字维度特征对所述待处理图片进行识别，获得识别结果；所述识别结果用于标识所述待处理图片的内容属性。

13.根据权利要求12所述的方法，其特征在于，所述方法还包括：

接收对所述待识别图片的识别结果的判定操作，根据所述判定操作更新所述待识别图片的标注信息；

利用更新后的所述标注信息更新所述图片识别模型。

14.一种图像处理装置，其特征在于，包括：

特征提取单元，用于分别对样本图片和待处理图片进行特征提取处理，获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征，其中，所述样本图片和所述待处理图片均包括文本区域，所述图像维度特征与所述文本区域相关联；

比较单元，用于比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离，获得比较结果；

确定单元，用于根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。

15.一种图像处理装置，其特征在于，包括：

特征获取单元，用于获取样本图片的标注信息、图像维度特征和文字维度特征；其中，所述标注信息至少包括所述图片的内容属性；所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联；

模型建立单元，用于利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征，建立图片识别模型；所述图片识别模型用于识别待处理图片的内容属性。

16.一种图像处理装置，其特征在于，包括：

特征提取单元，用于对待处理图片进行特征提取处理，获取所述待处理图片的图像维度特征和文字维度特征；其中，所述待处理图片的图像维度特征与所述待处理图片包含的文本区域相关联；

识别单元，用于利用预先建立的图片识别模型、所述图像维度特征和所述文字维度特征对所述待处理图片进行识别，获得识别结果；所述识别结果用于标识所述待处理图片的内容属性。