CN110147814A

CN110147814A - 一致性检测方法、装置、终端设备及计算机可读存储介质

Info

Publication number: CN110147814A
Application number: CN201910273244.XA
Authority: CN
Inventors: 郭晓锋; 姚晓宇; 谭颖
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2019-04-04
Filing date: 2019-04-04
Publication date: 2019-08-20

Abstract

本发明实施例提供了一种一致性检测方法、装置、终端设备及计算机可读存储介质，涉及数据处理领域。所述方法包括：提取所述文本中的关键词和所述图像中各物体对应的子图像；将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量；对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别；对所述物体类别与所述关键词进行一致性检测，获得一致性检测结果。重建后的子图像的比重建前的子图像清晰度高，进而得到图像中各物体对应的物体类别更为准确，进而可以提升一致性检测的准确性。

Description

一致性检测方法、装置、终端设备及计算机可读存储介质

技术领域

本发明涉及数据处理领域，特别是涉及一种一致性检测方法、装置、终端设备及计算机可读存储介质。

背景技术

在信息化时代，大量的信息涌入到网络上。相对于文本，图像通常能够提供更为详细的信息，更能博得关注度，因此，为了博得较高的关注度，很多信息中，文本和图像通常不一致。

现有技术中，检测图像与文本一致性的过程中，获取图像所包含的物体类别，获取文本对应的关键词，判断物体类别与关键词的一致性，进行一致性检测。

但是，现有技术的上述图像与文本一致性检测方法中，由于图像中可能会存在一些清晰度低的物体图像，导致获取图像所包含的物体类别不够准确，进而导致一致性检测不准确。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种一致性检测方法、装置、终端设备及计算机可读存储介质。

根据本发明的第一方面，提供了一种一致性检测方法，所述方法包括：

针对待检测的文本及对应的图像，提取所述文本中的关键词和所述图像中各物体对应的子图像；

将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量；

对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别；

对所述物体类别与所述关键词进行一致性检测，获得一致性检测结果。

可选的，所述提取所述文本中的关键词，包括：

对所述文本进行分词处理，以得到所述文本对应的各个分词；

对所述分词进行过滤，获取词性为名词的分词，以作为所述文本的关键词。

可选的，所述将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像，包括：

将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像。

可选的，所述将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像，包括：

将所述像素总数小于第一预设数量的子图像输入图像重建模型，进行像素特征提取，以及，获取所述像素特征对应的第一待插入像素特征，并在所述输入的子图像中插入所述第一待插入像素特征，以进行像素特征重建处理，得到重建后的物体图像。

可选的，所述将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像之前，还包括：

将所述像素总数小于第一预设数量的子图像进行放大处理；

所述将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像，包括：

将放大处理后的子图像输入所述图像重建模型，进行像素特征提取，以及，获取所述像素特征对应的第二待插入像素特征，并在所述放大处理后的子图像中插入所述第二待插入像素特征，以进行像素特征重建处理，得到重建后的物体图像。

可选的，所述获得一致性检测结果，包括：

响应于相匹配的物体类别和关键词的数目大于或等于第二预设数量，确定所述文本与所述图像一致；

或，

响应于相匹配的物体类别和关键词的数目小于所述第二预设数量，确定所述文本与所述图像不一致。

根据本发明的第二方面，提供了一种一致性检测装置，所述装置包括：

提取模块，用于针对待检测的文本及对应的图像，提取所述文本中的关键词和所述图像中各物体对应的子图像；

重建模块，用于将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量；

物体识别模块，用于对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别；

一致性检测模块，用于对所述物体类别与所述关键词进行一致性检测，获得一致性检测结果。

可选的，所述提取模块，包括：

分词子模块，用于对所述文本进行分词处理，以得到所述文本对应的各个分词；

关键词提取子模块，用于对所述分词进行过滤，获取词性为名词的分词，以作为所述文本的关键词。

可选的，所述重建模块，包括：

重建子模块，用于将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像。

可选的，所述重建子模块，具体用于：

可选的，所述装置，还包括：

放大处理模块，用于将所述像素总数小于第一预设数量的子图像进行放大处理；

所述重建子模块，具体用于：

可选的，所述一致性检测模块，具体用于：

或，

根据本发明的第三方面，提供了一种终端设备，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上任一所述的一致性检测方法。

根据本发明的第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如上任一所述的一致性检测方法。

本发明实施例包括以下优点：

本发明实施例针对待检测的文本及对应的图像，提取所述文本中的关键词和所述图像中各物体对应的子图像；将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量；对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别；对所述物体类别与所述关键词进行一致性检测，获得一致性检测结果。重建后的子图像的像素总数大于或者等于上述第一预设数量，也就是说，针对像素总数小于第一预设数量的子图像，重建后的子图像的比重建前的子图像清晰度高，对像素总数大于或等于上述第一预设数量的子图像以及重建后的子图像进行识别，进而得到图像中各物体对应的物体类别更为准确，进而可以提升一致性检测的准确性。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明实施例提供的一种一致性检测方法的步骤流程图；

图2是本发明实施例提供的一种待检测的文本及对应的图像的示意图；

图3是本发明实施例提供的提取得到图像中各物体对应的子图像的示意图；

图4是本发明实施例提供的对子图像重建，获得重建后的子图像的示意图；

图5是本发明实施例提供的另一种一致性检测方法的步骤流程图；

图6是本发明实施例提供的一种一致性检测装置的框图；

图7是本发明实施例提供的另一种一致性检测装置的框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

应当理解，此处所描述的具体实施例仅用以解释本发明，仅仅是本发明一部分实施例，而不是全部的实施例，并不用于限定本发明。

参照图1，图1是本发明实施例提供的一种一致性检测方法的步骤流程图，该方法可以包括：

步骤101：针对待检测的文本及对应的图像，提取所述文本中的关键词和所述图像中各物体对应的子图像。

本发明实施例中，待检测的文本及对应的图像可以组成待检测信息，该待检测信息可以为包含文本和图像的任意信息，该图像可以包括视频信息等，例如，该待检测信息可以为网页信息、文档信息等。如，该待检测信息可以为包括视频信息的网页信息等，或者，该待检测信息可以为包括图像的新闻等。在本发明实施例中，对此不作具体限定。

本发明实施例中，若待检测的图像包含视频，则可以从上述视频中获取所有帧的图像、或者，从上视频中获取部分帧的图像，将上述从视频中选取的帧图像作为该待检测的图像。在本发明实施例中，对此不作具体限定。

参照图2，图2是本发明实施例提供的一种待检测的文本及对应的图像的示意图。则待检测的文本可以为：“一群人在草地上踢足球”，待检测的图像可以为图2中一群人在草地上踢足球的示意图。

本发明实施例中，可以针对待检测的文本和对应的图像，提取文本中的关键词和图像中各物体对应的子图像。

具体的，可以通过文本复制等，提取待检测信息中的文本，通过图像检测模型等，提取待检测图像中各物体对应的子图像。在本发明实施例中，对此不作具体限定。

本发明实施例中，若该待检测文本包括标题，优选的，该文本还可以为标题。通常情况下，对于待检测文本，标题在整个文本中通常最为醒目，用户通常对标题的关注度更高，因此，该文本可以为标题，或者，该文本可以为包含标题的所有文本。在本发明实施例中，对此不作具体限定。

本发明实施例中，可以对文本进行分词等，获取到该文本所包括的所有分词，然后从所有分词中提取关键词，从所有分词中提取的关键词的数量可以为一个或多个。该关键词可以为上述文本包含的所有分词，或者，该关键词还可以为上述文本包含的部分分词。在本发明实施例中，对此不作具体限定。

例如，针对上述例子，对文本：“一群人在草地上踢足球”，先进行分词处理，得到的分词可以为：一群/人/在/草地/上/踢/足球。从上述分词中提取关键词，得到文本对应的关键词可以为：人、草地、足球。

现有技术中，需要获取文本的语义信息，再从文本的语义信息中获取关键词，相对于现有技术中，获取文本的语义信息过程中提取特征、特征转换等而言，本发明实施例分词、提取关键词的过程中没有进行特征转换等，关键词从更大程度上保留了文本的信息，进而上述关键词能够更为准确地反映文本，进而可以提升后续一致性检测的准确性。

在本发明实施例中，针对待检测的图像，提取图像中各物体对应的子图像。具体的，可以通过物体检测等，提取到待检测图像中各物体对应的子图像。在本发明实施例中，对此不作具体限定。

例如，参照图3，图3是本发明实施例提供的提取得到图像中各物体对应的子图像的示意图。具体的，针对图2所示的例子，针对待检测的图像，可以通过物体检测等方式，提取得到待检测图像中各个人对应的子图像、足球对应的子图像、草地对应的子图像等。

步骤102：将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量。

在本发明实施例中，可以获取各个子图像的像素总数，具体的，可以获取图像中单位面积的像素个数，或者，子图像中单位面积的像素个数，用子图像的长乘以子图像的宽，得到子图像的面积，用子图像的面积乘以单位面积的像素个数，进而得到该子图像的像素总数。以此类推，得到各个子图像的像素总数。在本发明实施例中，对此不作具体限定。

在本发明实施例中，可以提前设定第一预设数量，该第一预设数量可以为能够准确识别物体类别的情况下，子图像所需要的像素总数。该第一预设数量的设置可以根据实际需要进行设定，在本发明实施例中，对此不作具体限定。

在本发明实施例中，在获取到各个子图像的像素总数后，可以分别将各个子图像的像素总数与上述第一预设数量进行比较，得到各个子图像的像素总数与该第一预设数量的大小比较结果。针对像素总数小于第一预设数量的子图像，可以进行重建，得到重建后的子图像，上述重建后的子图像的像素总数大于或者等于上述第一预设数量。

具体的，可以在像素总数小于第一预设数量的子图像中，提取相应的像素特征，根据提取到的像素特征，对应得到待插入的像素特征，将上述待插入的像素特征，插入上述相应的像素总数小于第一预设数量的子图像中，进而可以得到重建后的子图像。或者，可以将像素总数小于第一预设数量的子图像进行放大处理，针对放大处理后的子图像提取相应的像素特征，根据提取到的像素特征，对应得到待插入的像素特征，将上述待插入的像素特征，插入上述放大后的子图像中，进而可以得到重建后的子图像在本发明实施例中，对此不作具体限定。

在本发明实施例中，重建后的子图像的像素总数大于或者等于上述第一预设数量，进而重建后的子图像的清晰度优于重建前的子图像。

参照图4所示，图4是本发明实施例提供的对子图像重建，获得重建后的子图像的示意图。重建后的子图像12的像素总数量大于或等于上述第一预设数量，而图3或图4中11对应的子图像的像素总数量小于上述第一预设数量，进而图4中重建后的子图像12的像素总数量大于图3或图4中11对应的子图像的像素总数量，也就是说，重建后的子图像的清晰度优于重建前的子图像的清晰度，进而使得后续利用重建后的子图像，进行物体分类，更为准确，有利于提升文本与图像一致性检测的准确性。

步骤103：对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别。

本发明实施例中，可以对像素总数大于或等于上述第一预设数量的子图像、以及上述重建后的子图像进行识别，得到上述图像中各物体对应的物体类别。

具体的，可以将上述像素总数大于或等于上述第一预设数量的子图像、以及上述重建后的子图像输入物体类别识别网络等，提取子图像中物体轮廓特征、纹理特征等，根据上述轮廓特征、纹理特征等，识别上述子图像中各物体对应的物体类别。例如，该物体类别识别网络可以为视觉几何组网络(Visual Geometry Group Network，VGG网络)等。在本发明实施例中，对此不作具体限定。

例如，针对上述例子，将上述像素总数大于或等于上述第一预设数量的子图像、以及上述重建后的子图像输入VGG网络，提取子图像中物体轮廓特征、纹理特征等，根据上述轮廓特征、纹理特征等，识别上述子图像中各物体对应的物体类别，识别得到上述图像中各物体对应的物体类别，得到上述图像对应的物体类别可以为：人、草地、足球。

步骤104：对所述物体类别与所述关键词进行一致性检测，获得一致性检测结果。

本发明实施例中，可以对上述物体类别与上述关键词进行一致性检测，获得一致性检测结果。

具体的，可以将上述各物体类别与上述关各关键词进行比对，响应于存在大于或等于第二预设数量的相匹配的物体类别和关键词，则可以确定文本与图像一致；响应于相匹配的物体类别和关键词的数目小于上述第二预设数量的，则可以确定文本与图像不一致。在本发明实施例中，对此不作具体限定。

具体应用中，可以提前设定该第二预设数量，该第二预设数量可以根据实际需要进行设定，对各物体类别与各关键词进行一一比对，如果相匹配的物体类别和关键词的数目，大于或等于该第二预设数量，则可以确定待检测信息中的文本与图像相一致。

在本发明实施例中，对该第二预设数量的大小不作具体限定，该第二预设数量可以为大于或等于1的自然数。例如，该第二预设数量可以为1，或者该第二预设数量可以为2等。

例如，针对上述例子，若该第二预设数量为2，上述文本对应的关键词若为：人、草地、足球。上述图像对应的物体类别为：人、草地、足球。对各物体类别与各关键词进行一一比对，相匹配的物体类别和关键词的数目为3，大于该第二预设数量2，则可以确定待检测的文本与图像相一致。

在本发明实施例中，可以根据关键词的数量，或物体类别的数量等，确定该第二预设数量。如，可以在关键词的数量和物体类别的数量中选取最小数量，该第二预设数量可以为大于或等于1且小于或等于该最小数量的任意值等。在本发明实施例中，对此不作具体限定。

在本发明实施例中，通过对各物体类别与各关键词进行比对，进而检测待检测的文本与图像是否一致，可以从很大程度上减少人为工作量，且重建后的子图像的像素总数大于或者等于上述第一预设数量，进而重建后的子图像的清晰度优于重建前的子图像，相对于现有技术中，直接针对各个子图像进行物体类别识别而言，本发明实施例中，针对像素总数小于上述第一预设数量的子图像，根据重建后的子图像进行物体类别识别，物体类别识别更为准确，进而可以提升一致性检测的准确性。

综上所述，本发明实施例针对待检测的文本及对应的图像，提取所述文本中的关键词和所述图像中各物体对应的子图像；将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量；对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别；对所述物体类别与所述关键词进行一致性检测，获得一致性检测结果。重建后的子图像的像素总数大于或者等于上述第一预设数量，也就是说，针对像素总数小于第一预设数量的子图像，重建后的子图像的比重建前的子图像清晰度高，对像素总数大于或等于上述第一预设数量的子图像以及重建后的子图像进行识别，进而得到图像中各物体对应的物体类别更为准确，进而可以提升一致性检测的准确性。

图5是本发明实施例提供的另一种一致性检测方法的步骤流程图，如图5所示，该方法可以包括：

步骤201：针对待检测的文本及对应的图像，对所述文本进行分词处理，以得到所述文本对应的各个分词。

本发明实施例中，可以通过基于字符串匹配的分词方式、基于理解的分词方式、基于统计的分词方式等，对上述文本进行分词处理，以得到文本对应的各个分词。

具体的，可以在预设的分词字典，查找上述文本所包括的各个分词，进而得到上述文本对应的各个分词。

例如，可以通过结巴分词、盘古分词等对应的分词字典等，对文本进行分词处理，以得到所述文本对应的各个分词。

如，针对上述例子，对文本：“一群人在草地上踢足球”，进行分词处理，得到文本对应的各个分词可以为：一群/人/在/草地/上/踢/足球。

步骤202：对所述分词进行过滤，获取词性为名词的分词，以作为所述文本的关键词。

在本发明实施例中，可以提前设定预设的分词词性字典，该分词词性字典中可以标注有各个分词的词性，可以在预设的分词词性字典中，查找上述各个分词的词性，上述分词词性字典的获取，可以通过对大量的分词样本在不同场景下对应的词性进行统计等确定。在本发明实施例中，对此不作具体限定。

在本发明实施例中，可选的，上述预设的分词字典中，同时可以包括各个分词的词性，在获取到上述文本包括的各个分词的过程中，也可以从上述预设的分词词典中确定各个分词的词性，在本发明实施例中，对此不作具体限定。

如，针对上述例子，文本对应的各个分词：一群/人/在/草地/上/踢/足球，通过上述预设的分词词性字典，查找得到“一群”的词性可以为量词词性，“人”的词性可以为名词词性，“在”的词性可以为介词词性，“草地”的词性可以为名词词性，“上”的词性可以为介词词性，“踢”的词性可以为动词词性，“足球”的词性可以为名词词性。

在本发明实施例中，可以提前设定预设词性，该预设词性可以为：名词词性、形容词词性等，在本发明实施例中，对此不作具体限定。

在本发明实施例中，物体类别通常为名词，因此，较佳的，该预设词性可以为名词词性。

例如，针对上述例子，则根据名词词性对上述各个分词：一群/人/在/草地/上/踢/足球，进行过滤，名词词性的分词：人/草地/足球，均可以作为文本的关键词，得到文本对应的关键词可以为：人、草地、足球。

在本发明实施例中，对文本进行分词处理，以得到文本对应的各个分词，该过程中，各个分词还是文本中的原始信息，相对于现有技术中，获取文本的语义信息过程中的特征提取和特征转换等，本发明实施例中，各个分词从更大程度上保留了文本的原始信息，进而上述各个分词能够更为准确地反映文本，进而可以提升一致性检测的准确性。根据上述分词进行过滤，将词性为名词的分词作为所述文本的关键词，通常物体类别为名词，进而有利于进行一致性比对，可以提升检测的准确性。

步骤203：针对待检测的文本及对应的图像，提取所述图像中各物体对应的子图像。

在本发明实施例中，通过物体的轮廓特征、纹理特征等，进行物体检测，得到图像中各物体对应的子图像。该轮廓特征可以为图像中，物体的边缘特征、边界特征等。

具体的，可以通过物体检测模型等，对图像进行物体检测，以得到图像中各物体对应的子图像。例如，可以通过单点检测模型(SingleShot MultiBox Detector，SSD)对图像进行物体检测，以得到图像中各物体对应的子图像。在本发明实施例中，对此不作具体限定。

步骤204：将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量。

在本发明实施例中，可以获取各个子图像的像素总数，将各个图像的像素总数与提前设定的第一预设数量进行比较，得到各个子图像的像素总数与上述第一预设数量的大小比较结果。该过程可以参照上述步骤102中相关部分的描述，为了避免重复，此处不再赘述。

在本发明实施例中，可以将上述像素总数小于第一预设数量的子图像输入图像重建模型，该图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像。

具体的，该图像重建模型对输入的子图像进行像素特征提取，根据提取的像素特征，得到待插入的像素特征，将上述待插入的像素特征插入对应的子图像中，以得到重建后的子图像。或者，将上述子图像进行放大处理，该图像重建模型，针对放大后的子图像，进行像素特征提取，根据提取的像素特征，得到待插入的像素特征，将上述待插入的像素特征插入对应的放大后的子图像中，以得到重建后的子图像。在本发明实施例中，对此不作具体限定。

在本发明实施例中，重建后的子图像的像素总数大于或者等于上述第一预设数量，该过程可以参照上述步骤102中相关部分的描述，为了避免重复，此处不再赘述。

例如，针对上述例子，若图3中，11对应的子图像的总像素小于上述第一预设数量，则可以将11对应的子图像进行放大处理，将放大处理后的子图像输入图像重建模型，该图像重建模型，针对放大后的子图像，进行像素特征提取，根据提取的像素特征，得到第二待插入的像素特征，将上述第二待插入的像素特征插入对应的放大后的子图像中，以得到重建后的子图像。参照图4所示，重建后的子图像12的像素总数大于或等于上述第一预设数量，即图4中重建后的子图像12的像素总数大于图3或图4中11对应的子图像的像素总数，也就是说，重建后的子图像的清晰度优于重建前的子图像的清晰度，进而使得后续利用重建后的子图像，进行物体分类，更为准确，有利于提升文本与图像一致性检测的准确性。

在本发明实施例中，可选的，所述将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像，可以包括：将所述像素总数小于第一预设数量的子图像输入图像重建模型，进行像素特征提取，以及，获取所述像素特征对应的第一待插入像素特征，并在所述输入的子图像中插入所述第一待插入像素特征，以进行像素特征重建处理，得到重建后的物体图像。

具体的，可以将上述像素总数小于第一预设数量的子图像输入图像重建模型，进行像素特征提取，该像素特征可以为该子图像中像素点处的颜色特征、形状特征等，在本发明实施例中，对此不作具体限定。获取上述像素特征对应的第一待插入像素特征，该第一待插入像素特征可以为与上述提取的像素特征相同的像素特征，或者，该第一待插入像素特征可以为在上述提取的像素特征的基础上，进行优化后的像素特征等，然后在上述输入的子图像中的相应位置插入上述第一待插入像素特征，以进行像素特征重建处理，得到重建后的物体图像。上述在上述输入的子图像中的相应位置插入上述第一待插入像素特征，可以为在上述输入的子图像的像素特征的预设区域内，插入相应的第一待插入像素特征。相对于重建前的子图像，该重建后的子图像具有更多的像素特征，因此，重建后的子图像的清晰度高于重建前的子图像的清晰度。

在本发明实施例中，可选的，所述将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像之前，还可以包括：将所述像素总数小于第一预设数量的子图像进行放大处理；所述将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像，包括：将放大处理后的子图像输入所述图像重建模型，进行像素特征提取，以及，获取所述像素特征对应的第二待插入像素特征，并在所述放大处理后的子图像中插入所述第二待插入像素特征，以进行像素特征重建处理，得到重建后的物体图像。

具体的，可以先将像素总数小于第一预设数量的子图像进行放大处理，如，将上述子图像放大为2倍或3倍等。可以将放大后的子图像输入图像重建模型，进行像素特征提取，该像素特征可以为该放大后的子图像中像素点处的颜色特征、形状特征等，在本发明实施例中，对此不作具体限定。获取上述像素特征对应的第二待插入像素特征，该第二待插入像素特征可以为与上述提取的像素特征相同的像素特征，或者，该第二待插入像素特征可以为在上述提取的像素特征的基础上，进行优化后的像素特征等，然后在上述放大后的子图像中的相应位置插入上述第二待插入像素特征，以进行像素特征重建处理，得到重建后的物体图像。上述在放大后的子图像中的相应位置插入上述第二待插入像素特征，可以为在上述放大后的子图像的像素特征的预设区域内，插入相应的第二待插入像素特征。相对于重建前的子图像，该重建后的子图像具有更多的像素特征，因此，重建后的子图像的清晰度高于重建前的子图像的清晰度。

在本发明实施例中，可选的，在将子图像输入上述图像重建模型之前，还可以包括：获取图像样本数据；基于所述图像样本数据，训练所述图像重建模型。

具体的，该图像样本数据可以为包括多种物体类别的图像数据等，将上述图像样本数据输入原始重建模型，提取该图像样本数据的像素特征，该图像样本数据的像素特征可以包括：该图像样本数据像素点处的轮廓特征、颜色特征等，不断调整该原始重建模型的参数，使得该原始重建模型输出的重建后的图像的总像素或清晰度，达到预设要求为止，将上述参数设置为该原始重建模型的对应参数，以得到该图像重建模型。在本发明实施例中，对此不作具体限定。

在本发明实施例中，可选的，该图像重建模型可以为神经网络等，例如，该图像重建模型可以包括：超分辨率卷积神经网络(Super-Resolution Convolutional NeuralNetwork，SRCNN)等。在本发明实施例中，对此不作具体限定。

在本发明实施例中，随着移动移动终端的普及，移动终端的屏幕大小会从一定程度上限制子图像的总像素，进而会使得待检测信息中容易存在总像素小于上述第一预设数量的子图像，对总像素小于上述第一预设数量的子图像进行重建，进而得到总像素较高的子图像，重建后的子图像的清晰度高于重建前的子图像的清晰度，有利于提升文本与图像一致性检测的准确性。

步骤205：对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别。

在本发明实施例中，步骤205可以参照上述步骤103的相关记载，为了避免重复，此处不再赘述。

步骤206：响应于相匹配的物体类别和关键词的数目大于或等于第二预设数量，确定所述文本与所述图像一致。

在本发明实施例中，可以提前设定该第二预设数量，该第二预设数量可以根据实际需要进行设定，对各物体类别与各关键词进行一一比对，如果相匹配的物体类别和关键词的数目，大于或等于该第二预设数量，则可以确定待检测信息中的文本与图像相一致。

在本发明实施例中，该步骤206可以参照上述步骤104的相关记载，为了避免重复，此处不再赘述。

步骤207：响应于相匹配的物体类别和关键词的数目小于所述第二预设数量，确定所述文本与所述图像不一致。

本发明实施例中，可以对各物体类别与各关键词进行一一比对，如果物体类别与关键词中相匹配的物体类别和关键词的数目小于上述第二预设数量，则可以确定待检测信息中的文本与图像不一致。

例如，若该第二预设数量为1，若对各物体类别与各关键词进行一一比对，如果相匹配的物体类别和关键词的数目为0，小于上述第二预设数量1，则可以确定待检测信息中的文本与图像不一致。

在本发明实施例中，上述步骤206、步骤207根据相匹配的物体类别和关键词的数目，可以择一执行。

图6是本发明实施例提供的一种一致性检测装置的框图，如图6所示，该装置600可以包括：

提取模块601，用于针对待检测的文本及对应的图像，提取所述文本中的关键词和所述图像中各物体对应的子图像；

重建模块603，用于将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量；

物体识别模块604，用于对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别；

一致性检测模块605，用于对所述物体类别与所述关键词进行一致性检测，获得一致性检测结果。

可选的，在上述图6的基础上，参照图7所示，所述提取模块601，可以包括：

分词子模块6011，用于对所述文本进行分词处理，以得到所述文本对应的各个分词；

关键词提取子模块6012，用于对所述分词进行过滤，获取词性为名词的分词，以作为所述文本的关键词。

可选的，所述重建模块603，可以包括：

重建子模块6031，用于将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像。

可选的，所述重建子模块6031，具体用于：

可选的，所述装置600，还包括：

放大处理模块602，用于将所述像素总数小于第一预设数量的子图像进行放大处理；

所述重建子模块6031，具体用于：

可选的，所述一致性检测模块605，具体用于：

或，

综上所述，本发明实施例，针对待检测的文本及对应的图像，提取所述文本中的关键词和所述图像中各物体对应的子图像；将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像；所述重建后的子图像的像素总数大于或者等于所述第一预设数量；对像素总数大于或等于所述第一预设数量的子图像、以及所述重建后的子图像进行识别，得到所述图像中各物体对应的物体类别；对所述物体类别与所述关键词进行一致性检测，获得一致性检测结果。重建后的子图像的像素总数大于或者等于上述第一预设数量，也就是说，针对像素总数小于第一预设数量的子图像，重建后的子图像的比重建前的子图像清晰度高，对像素总数大于或等于上述第一预设数量的子图像以及重建后的子图像进行识别，进而得到图像中各物体对应的物体类别更为准确，进而可以提升一致性检测的准确性。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

在一个典型的配置中，所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非持续性的电脑可读媒体(transitory media)，如调制的数据信号和载波。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程一致性检测终端设备的处理器以产生一个机器，使得通过计算机或其他可编程一致性检测终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程一致性检测终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程一致性检测终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种一致性检测方法、装置、终端设备及计算机可读存储介质，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种一致性检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述提取所述文本中的关键词，包括：

3.根据权利要求1所述的方法，其特征在于，所述将像素总数小于第一预设数量的子图像进行重建，得到重建后的子图像，包括：

4.根据权利要求3所述的方法，其特征在于，所述将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像，包括：

5.根据权利要求3所述的方法，其特征在于，所述将所述像素总数小于第一预设数量的子图像输入图像重建模型，所述图像重建模型对输入的子图像进行像素特征提取和像素特征重建处理，得到重建后的子图像之前，还包括：

将所述像素总数小于第一预设数量的子图像进行放大处理；

6.根据权利要求1所述的方法，其特征在于，所述获得一致性检测结果，包括：

或，

7.一种一致性检测装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述提取模块，包括：

9.根据权利要求7所述的装置，其特征在于，所述重建模块，包括：

10.根据权利要求9所述的装置，其特征在于，所述重建子模块，具体用于：

11.根据权利要求9所述的装置，其特征在于，还包括：

所述重建子模块，具体用于：

12.根据权利要求11所述的装置，其特征在于，所述一致性检测模块，具体用于：

或，

13.一种终端设备，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至6中任一所述的一致性检测方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一所述的一致性检测方法。