CN109543058B

CN109543058B - 用于检测图像的方法、电子设备和计算机可读介质

Info

Publication number: CN109543058B
Application number: CN201811408314.XA
Authority: CN
Inventors: 齐镗泉
Original assignee: Nanjing Shangwang Network Technology Co ltd
Current assignee: Nanjing Shangwang Network Technology Co.,Ltd.
Priority date: 2018-11-23
Filing date: 2018-11-23
Publication date: 2021-10-08
Anticipated expiration: 2038-11-23
Also published as: CN109543058A

Abstract

本申请实施例公开了用于检测图像的方法、电子设备和计算机可读介质。该方法的一具体实施方式包括：获取预先选取的、与目标文章匹配的候选配图；基于候选配图确定至少一个第一关键词；确定至少一个第一关键词与基于目标文章确定的至少一个第二关键词的相似度；若相似度大于或等于预设阈值，则将候选配图确定为目标文章的准确配图。该实施方式提高了文章与配图的匹配程度。

Description

用于检测图像的方法、电子设备和计算机可读介质

技术领域

本申请涉及计算机技术领域，具体涉及用于检测图像的方法、电子设备和计算机可读介质。

背景技术

互联网技术的快速发展与移动终端的普及改变了传统资讯(例如新闻)展示平台与内容展现形式。例如，出现了各种图文类新闻。与传统的纯文本资讯信息相比，图文并茂的资讯信息更能吸引读者的注意。

目前，相关技术中通过人工选取资讯信息的配图来实现图文并茂的资讯信息。然而，由于人工主观因素等原因，通过这种配图方式得到的资讯信息往往存在图文不一致的问题。

发明内容

本申请实施例提出了用于检测图像的方法、电子设备和计算机可读介质。

第一方面，本申请的一些实施例提供了一种用于检测图像的方法，该方法包括：获取预先选取的、与目标文章匹配的候选配图；基于候选配图确定至少一个第一关键词；确定至少一个第一关键词与基于目标文章确定的至少一个第二关键词的相似度；若相似度大于或等于预设阈值，则将候选配图确定为目标文章的准确配图。

第二方面，本申请的一些实施例提供了一种用于检测图像的装置，该装置包括：候选配图获取单元，被配置成获取预先选取的、与目标文章匹配的候选配图；关键词确定单元，被配置成基于候选配图确定至少一个第一关键词；相似度确定单元，被配置成确定至少一个第一关键词与基于目标文章确定的至少一个第二关键词的相似度；配图确定单元，被配置成若相似度大于或等于预设阈值，则将候选配图确定为目标文章的准确配图。

第三方面，本申请的一些实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如第一方面描述的方法。

第四方面，本申请的一些实施例提供了一种计算机可读介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面描述的方法。

本申请实施例提供的用于检测图像的方法、电子设备和计算机可读介质，通过确定预先选取的候选配图的关键词，之后确定候选配图的关键词与目标文章的关键词的相似度，最后在相似度大于或等于预设阈值时将候选配图确定为目标文章的准确配图，从而提高了文章与配图的匹配程度。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请一些实施例可以应用于其中的示例性系统架构图；

图2是根据本申请的用于检测图像的方法的一个实施例的流程图；

图3A和图3B是根据本申请的用于检测图像的方法的一个应用场景的示意图；

图4是根据本申请的用于检测图像的方法的另一个实施例的流程图；

图5是根据本申请的用于检测图像的装置的一个实施例的流程图；

图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

如图1所示，系统架构100可以包括终端设备101、102，网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型，例如有线、无线通信链路或者光线电缆等等。

用户可以使用终端设备101、102通过网络103与服务器104交互，以接收或发送消息等。终端设备101、102上可以安装有各种通讯客户端应用，例如图像检测类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102可以是硬件，也可以是软件。当终端设备101、102为硬件时，可以是具有显示屏并且支持图像检测的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器104可以是提供各种服务的服务器，例如，对终端设备101、102上的图像检测提供支持的后台服务器。后台服务器可以对接收到的候选配图等数据进行分析处理，并将处理结果(例如，准确配图)反馈给终端设备101、102。

需要说明的是，本申请实施例所提供的用于检测图像的方法一般由服务器104执行。

需要说明的是，服务器104可以是硬件，也可以是软件。当服务器104为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意合适数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的用于检测图像的方法的一个实施例的流程200。该用于检测图像的方法，可以包括以下步骤201～204。

步骤201，获取预先选取的、与目标文章匹配的候选配图。

在本实施例中，用于检测图像的方法的执行主体(例如图1的服务器104)可以获取预先选取的、与目标文章匹配的候选配图。其中，目标文章不包含配图。这里，目标文章可以包括标题和文本内容(也称为主体或正文)。例如，目标文章可以是新闻、博文等资讯信息。候选配图可以选自候选图像集合。例如，从候选图像集合中选取未被选取的候选图像作为候选配图。

在本实施例的一些可选的实现方式中，候选图像集合中的候选图像可以是人工选取的图像。例如，用户根据目标文章的内容选取的、与目标文章匹配的图像组成候选图像集合。

对应于该实现方式，候选图像集合通过如下步骤得到：

首先，从目标文章中提取至少一个第三关键字。

之后，从预先构建的图像数据库中选取与所提取的第三关键字匹配的图像(例如相似度大于等于预设阈值)。

最后，利用所选取的图像生成候选图像集合。

可选地，上述图像数据库可以通过如下步骤构建：

第一步，获取图像集合。其中，图像集合中的每个图像与至少一个第四关键词关联。这里，第四关键词可以是基于历史经验针对图像设置的关键词。

第二步，将图像集合中的每个图像以及与每个图像关联的第四关键词对应地存储到数据库中得到图像数据库。

步骤202，基于候选配图确定至少一个第一关键词。

在本实施例中，用于检测图像的方法的执行主体(例如图1的服务器104)可以对步骤201获取的候选配图进行分析处理以确定候选配图的至少一个第一关键词。其中，第一关键词可以是能够体现候选配图中包含的特征(例如，候选配图中的场景、显著性物体等)的关键词。

在本实施例的一些可选的实现方式中，步骤202具体可以包括：获取候选配图的描述信息，然后从获取的描述信息中提取至少一个第一关键词。候选配图的描述信息可以是对候选配图中包含的特征的文字表述。这里，可以利用分词技术从描述信息中提取第一关键词。

可选地，候选配图的描述信息可以是自然语言描述的句子。对应地，从描述信息中提取至少一个第一关键词可以包括：对上述自然语言描述的句子进行分词，得到该自然语言描述的句子所包含的名词和/或形容词，然后将上述名词和/或形容词提取为至少一个第一关键词。

在本实施例的一些可选的实现方式中，可以通过如下步骤获取候选配图的描述信息：对候选配图进行图像识别(例如通过图像识别模型)，然后根据图像识别结果生成候选配图的描述信息。作为示例，对于某候选配图，经过图像识别，可以确定该候选配图的场景为客厅以及候选配图中的显著性物体为一把椅子，则该候选配图的描述信息可以为“客厅中有一把椅子”。

在本实施例的一些可选的实现方式中，可以通过图像描述技术(Image CaptionTechnique)来获取候选配图的描述信息。例如，可以将候选配图输入到训练好的图像描述模型中，得到与输入图像对应的描述信息。这里，图像描述模型可以用于表征输入图像与描述信息之间的对应关系。该示例中，可以采用LSTM(Long Short-Term Memory，长短期记忆网络)单元的编码器框架作为图像描述模型。

可选地，上述图像描述模型可以通过如下步骤训练得到：

首先，获取训练样本集合。其中，训练样本可以包括图像以及与图像对应的描述信息。

然后，将每个训练样本中的图像作为输入，将与输入图像对应的描述信息作为输出，利用机器学习的方法对初始图像描述模型进行训练，得到图像描述模型。

步骤203，确定至少一个第一关键词与基于目标文章确定的至少一个第二关键词的相似度。

在本实施例中，用于检测图像的方法的执行主体(例如图1的服务器104)可以将步骤202确定的至少一个第一关键词与基于目标文章确定的至少一个第二关键词进行比较，确定两者之间的相似度。作为示例，可以采用夹角余弦、欧式距离等方式确定至少一个第一关键词与至少一个第二关键词之间的相似度。其中，第二关键词可以是能够体现目标文章主要内容或主题的关键词。

这里，第二关键词可以通过对目标文章进行分析处理得到。例如，通过语义分析从目标文章中提取至少一个第二关键词。

在本实施例的一些可选的实现方式中，上述至少一个第二关键词通过如下步骤确定：

首先，获取目标文章的标题和文本内容。

之后，利用分词技术从标题中提取关键词作为标题关键词。

然后，将文本内容输入到训练好的文本主题模型中，得到目标文章的内容主题。其中，内容主题可以包括主题关键词。这里，文本主题模型可以表征文本内容与内容主题之间的对应关系。

文本主题模型是对文字中隐含主题的一种建模方法。一般认为一篇文章的每个词都是通过“以一定概率选择了某个主题，并从这个主题中以一定概率选择某个词语”。文本主题模型训练方法可以包括LSA(Latent semantic analysis，隐性语义分析)、pLSA(Probabilistic latent semantic analysis，概率隐性语义分析)、LDA(LatentDirichlet allocation，隐狄利克雷分配)等。文本主题模型的训练是目前广泛研究和应用的公知技术，在此不再赘述。

最后，将得到标题关键词和内容主题确定为至少一个第二关键词。

步骤204，若相似度大于或等于预设阈值，则将候选配图确定为目标文章的准确配图。

在本实施例中，用于检测图像的方法的执行主体(例如图1的服务器104)可以判断步骤203确定的相似度与预设阈值的大小关系。若相似度大于或等于预设阈值，则可以将候选配图确定为目标文章的准确配图(即与目标文章内容准确匹配的配图)。这里，预设阈值可以是根据经验设置的值，例如80％。

在本实施例的一些可选的实现方式中，该用于检测图像的方法还可以包括：若相似度小于预设阈值，则可以将候选配图确定为目标文章的错误配图(即与目标文章的内容不匹配的配图)。

由于人为因素(例如疏忽)或人工经验的差异，采用人工配图时，经常会出现配图与文章内容不匹配的情形，相比之下，本实施例中提供的方法能够过滤掉与文章内容不匹配的配图，从而提高配图与文章内容的匹配程度，不受人为因素/主观因素的影响。

需要说明的是，当候选图像集合包括两个以上的候选图像时，可以选取未被选取的候选图像作为候选配图，继续执行上述步骤201～204。

在本实施例的一些可选的实现方式中，该用于检测图像的方法还可以包括：

步骤205，将确定的准确配图插入目标文章中，生成图文信息。

相对于人工配图得到的图文信息，该实现方式可以得到配图与文章内容更加匹配的资讯信息。

继续参考图3A和图3B，其示出了根据本申请的用于检测图像的方法的一个应用场景300。在图3A的应用场景300中，服务器301获取用户根据目标新闻303的内容(目标新闻的标题及文本内容参见图3B)选取的候选配图302。之后，将候选配图302输入到训练好的图像描述模型得到候选配图302的图像描述，并利用分词技术得到第一关键词“樱花”、“富士山”。然后，获取目标新闻303的标题“秋天到日本赏樱花？！”和文本内容“提到去日本旅游，很多人会想到春季赏樱花，然而没想到今年秋天也可以在日本看到樱花……”，通过对标题提取关键词以及将文本内容输入LDA主题模型获取内容主题，得到第二关键词“秋天”、“日本”、“樱花”、“旅游”。计算上述第一关键词与第二关键词之间的相似度为35.29％。若相似度阈值为60％(根据经验设置)，则可以确定候选配图302与目标新闻303的内容不匹配(即，候选配图302不适合用作目标新闻303的配图)。

本申请实施例提供的用于检测图像的方法，通过确定预先选取的候选配图的关键词，之后确定候选配图的关键词与目标文章的关键词的相似度，最后在相似度大于或等于预设阈值时将候选配图确定为目标文章的准确配图，从而提高了文章与配图的匹配程度。

继续参考图4，示出了根据本申请的用于检测图像的方法的另一个实施例的流程400。其中，图4所示的方法中，与图2所示方法相同或相似的内容，可以参考图2中的详细介绍，后续不再赘述。该用于检测图像的方法，可以包括以下步骤401～406。

步骤401，获取图文信息。

在本实施例中，用于检测图像的方法的执行主体(例如图1的服务器104)可以获取图文信息。其中，图文信息可以包括目标文章和候选配图。这里，目标文章可以是图文信息中的文本内容，例如，标题和正文。候选配图可以是图文信息中的配图。

步骤402，基于候选配图确定至少一个第一关键词。

在本实施例中，用于检测图像的方法的执行主体(例如图1的服务器104)可以对步骤401获取的候选配图进行分析处理以确定候选配图的至少一个第一关键词。其中，第一关键词可以是能够体现候选配图中包含的特征(例如，候选配图中的场景、显著性物体等)的关键词。

步骤403，确定至少一个第一关键词与基于目标文章确定的至少一个第二关键词的相似度。

在本实施例中，用于检测图像的方法的执行主体(例如图1的服务器104)可以将步骤402确定的至少一个第一关键词与基于目标文章确定的至少一个第二关键词进行比较，确定两者之间的相似度。作为示例，可以采用夹角余弦、欧式距离等方式确定至少一个第一关键词与至少一个第二关键词之间的相似度。其中，第二关键词可以是能够体现目标文章主要内容或主题的关键词。

步骤404，确定上述相似度是否大于或等于预设阈值。

在本实施例中，用于检测图像的方法的执行主体(例如图1的服务器104)可以判断步骤403确定的相似度与预设阈值的大小关系。若上述相似度大于或等于预设阈值，执行步骤405，反之则执行步骤406。这里，预设阈值可以是根据经验设置的值，例如80％。

步骤405，将候选配图确定为目标文章的准确配图。

在本实施例中，若相似度大于或等于预设阈值，则用于检测图像的方法的执行主体(例如图1的服务器104)可以将候选配图确定为目标文章的准确配图(即，与目标文章内容准确匹配的配图)，并将准确配图保留在图文信息中。

步骤406，将候选配图确定为目标文章的错误配图，以及将错误配图从图文信息中删除。

在本实施例中，若相似度小于预设阈值，则用于检测图像的方法的执行主体(例如图1的服务器104)可以将候选配图确定为目标文章的错误配图(即与目标文章的内容不匹配的配图)，然后将错误配图从上述图文信息中删除，从而使得图文信息中的文本内容与配图更加匹配。

本申请实施例提供的用于检测图像的方法，通过获取包含文本内容和候选配图的图文信息，之后确定候选配图的关键词，然后确定候选配图的关键词与目标文章的关键词的相似度，最后在相似度小于预设阈值时将候选配图从图文信息中删除，从而提高了图文信息中文本内容与配图的匹配程度。

进一步参考图5，作为对上述各图所示方法的实现，本申请提供了一种用于检测图像的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应。该装置具体可以应用于服务器中。

如图5所示，本实施例的用于检测图像的装置500可以包括：候选配图获取单元501、关键词确定单元502、相似度确定单元503和配图确定单元504。其中，候选配图获取单元501被配置成获取预先选取的、与目标文章匹配的候选配图；关键词确定单元502被配置成基于候选配图确定至少一个第一关键词；相似度确定单元503被配置成确定至少一个第一关键词与基于目标文章确定的至少一个第二关键词的相似度；而配图确定单元504被配置成若相似度大于或等于预设阈值，则将候选配图确定为目标文章的准确配图。

在本实施例中，用于检测图像的装置500的上述候选配图获取单元501可以获取预先选取的、与目标文章匹配的候选配图。其中，目标文章不包含配图。这里，目标文章可以包括标题和文本内容(也称为主体或正文)。例如，目标文章可以是新闻、博文等资讯信息。

在本实施例的一些可选的实现方式中，候选配图可以选自候选图像集合。例如，从候选图像集合中选取未被选取的候选图像作为候选配图。

对应于该实现方式，候选图像集合中的候选图像可以是人工选取的图像。例如，用户根据目标文章的内容选取的、与目标文章匹配的图像组成候选图像集合。

可选地，候选图像集合通过如下步骤得到：

首先，从目标文章中提取至少一个第三关键字。

最后，利用所选取的图像生成候选图像集合。

可选地，上述图像数据库可以通过如下步骤构建：

在本实施例中，上述关键词确定单元502可以对获取的候选配图进行分析处理以确定候选配图的至少一个第一关键词。其中，第一关键词可以是能够体现候选配图中包含的特征(例如，候选配图中的场景、显著性物体等)的关键词。

在本实施例的一些可选的实现方式中，上述关键词确定单元502可以包括：描述信息获取模块和关键词提取模块。其中，描述信息获取模块被配置成将候选配图输入预先训练的图像描述模型中，得到候选配图的描述信息，图像描述模型用于表征输入图像与描述信息之间的对应关系；关键词提取模块被配置成从候选配图的描述信息中提取至少一个第一关键词。

对应于该实现方式，上述图像描述模型可以通过如下步骤训练得到：

首先，获取训练样本集合。其中，训练样本可以包括图像以及图像对应的描述信息。

可选地，关键词提取模块具体可以被配置为：对上述自然语言描述的句子进行分词，得到该自然语言描述的句子所包含的名词和/或形容词，然后将上述名词和/或形容词提取为至少一个第一关键词。

在本实施例中，上述相似度确定单元503可以将确定的至少一个第一关键词与基于目标文章确定的至少一个第二关键词进行比较，确定两者之间的相似度。作为示例，可以采用夹角余弦、欧式距离等方式确定至少一个第一关键词与至少一个第二关键词之间的相似度。其中，第二关键词可以是能够体现目标文章主要内容或主题的关键词。

首先，获取目标文章的标题和文本内容。

之后，利用分词技术从标题中提取关键词作为标题关键词。

在本实施例中，上述配图确定单元504可以判断相似度与预设阈值的大小关系。若相似度大于或等于预设阈值，则可以将候选配图确定为目标文章的准确配图(即与目标文章内容准确匹配的配图)。这里，预设阈值可以是根据经验设置的值，例如，70％、80％、90％等。

由于人为因素(例如疏忽)或人工经验的差异，采用人工配图时，经常会出现配图与文章内容不匹配的情形，相比之下，本实施例中提供的装置能够过滤掉与文章内容不匹配的配图，从而提高配图与文章内容的匹配程度，不受人为因素/主观因素的影响。

在本实施例的一些可选的实现方式中，上述候选配图获取单元501具体可以配置为：获取图文信息。其中，图文信息可以包括上述目标文章(例如，图文信息中的文本内容)和上述候选配图(例如，图文信息中的配图)。也就是说，在该实现方式中，可以对图文信息中的配图进行图像检测，以确定图文信息中的配图是否与文本内容匹配。

对应于该实现方式，上述配图确定单元504还可以被配置成：若相似度小于预设阈值，则可以将候选配图确定为目标文章的错误配图(即与目标文章的内容不匹配的配图)，从而可以将错误配图从上述图文信息中删除，使得图文信息中的文本内容与配图更加匹配。

在本实施例的一些可选的实现方式中，该用于检测图像的装置500还可以包括图文信息生成单元505。其中，图文信息生成单元505被配置成将确定的准确配图插入目标文章中，生成图文信息。

本申请实施例提供的用于检测图像的装置，通过确定预先选取的候选配图的关键词，之后确定候选配图的关键词与目标文章的关键词的相似度，最后在相似度大于或等于预设阈值时将候选配图确定为目标文章的准确配图，从而提高了文章与配图的匹配程度。

下面参考图6，其示出了适于用来实现本申请实施例的电子设备(例如图1的服务器104)的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统600包括一个或多个中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括鼠标、键盘等的输入部分606；包括诸如有机发光二极管(OLED)显示器、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时，执行本申请的方法中限定的上述功能。

需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的服务器中所包含的；也可以是单独存在，而未装配入该服务器中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该服务器执行时，使得该服务器：获取预先选取的、与目标文章匹配的候选配图；基于候选配图确定至少一个第一关键词；确定至少一个第一关键词与基于目标文章确定的至少一个第二关键词的相似度；若相似度大于或等于预设阈值，则将候选配图确定为目标文章的准确配图。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种用于检测图像的方法，其特征在于，包括：

从候选图像集合中获取预先选取的、与目标文章匹配的候选配图，其中，所述候选图像集合中包括图像数据库中、与从所述目标文章中提取的第三关键字匹配的图像，所述候选图像集合中的每个图像与第四关键字对应存储于图像数据库中；

基于所述候选配图确定至少一个第一关键词；

确定所述至少一个第一关键词与基于所述目标文章确定的至少一个第二关键词的相似度；

若所述相似度大于或等于预设阈值，则将所述候选配图确定为所述目标文章的准确配图。

2.根据权利要求1所述的方法，其特征在于，所述基于所述候选配图确定至少一个第一关键词，包括：

将所述候选配图输入预先训练的图像描述模型中，得到所述候选配图的描述信息，其中，所述图像描述模型用于表征输入图像与描述信息之间的对应关系；

从所述候选配图的描述信息中提取至少一个第一关键词。

3.根据权利要求2所述的方法，其特征在于，所述候选配图的描述信息为自然语言描述的句子；所述从所述候选配图的描述信息中提取至少一个第一关键词，包括：

对所述自然语言描述的句子进行分词，得到所述自然语言描述的句子所包含的名词和/或形容词；

将所述名词和/或形容词提取为所述至少一个第一关键词。

4.根据权利要求2或3所述的方法，其特征在于，所述图像描述模型通过如下步骤训练得到：

获取训练样本集合，训练样本包括图像和图像对应的描述信息；

将训练样本中的图像作为输入，将与输入图像对应的描述信息作为输出，训练得到所述图像描述模型。

5.根据权利要求1所述的方法，其特征在于，所述至少一个第二关键词通过如下步骤确定：

获取所述目标文章的标题和文本内容；

从所述标题中提取标题关键词；

将所述文本内容输入到预先训练的文本主题模型中，得到所述目标文章的内容主题；

将所述标题关键字和所述内容主题确定为所述至少一个第二关键词。

6.根据权利要求1所述的方法，其特征在于，所述获取预先选取的、与目标文章匹配的候选配图，包括：

获取图文信息，所述图文信息包括所述目标文章和所述候选配图。

7.根据权利要求6所述的方法，其特征在于，所述方法进一步包括：

若所述相似度小于所述预设阈值，则将所述候选配图确定为所述目标文章的错误配图，以及将所述错误配图从所述图文信息中删除。

8.根据权利要求1所述的方法，其特征在于，所述候选配图选自候选图像集合，所述候选图像集合通过如下步骤得到：

从所述目标文章中提取至少一个第三关键字；

从预先构建的图像数据库中选取与所述至少一个第三关键字匹配的图像；

基于所选取的图像生成所述候选图像集合。

9.根据权利要求8所述的方法，其特征在于，所述图像数据库通过如下步骤构建：

获取图像集合，所述图像集合中的图像与至少一个第四关键词关联；

将所述图像集合中的图像以及与图像关联的第四关键词对应地存储到数据库中得到所述图像数据库。

10.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：

将确定的准确配图插入所述目标文章中，生成图文信息。

11.一种电子设备，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1至10中任一项所述的方法。

12.一种计算机可读介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现如权利要求1至10中任一项所述的方法。