CN109033261B

CN109033261B - 图像处理方法、装置、处理设备及其存储介质

Info

Publication number: CN109033261B
Application number: CN201810741616.2A
Authority: CN
Inventors: 顾泽琪
Original assignee: Beijing Kuangshi Technology Co Ltd
Current assignee: Beijing Kuangshi Technology Co Ltd
Priority date: 2018-07-06
Filing date: 2018-07-06
Publication date: 2021-06-22
Anticipated expiration: 2038-07-06
Also published as: CN109033261A

Abstract

本发明涉及图片搜索技术领域，尤其是涉及一种图像处理方法、装置、处理设备及其存储介质。该方法包括：接收图片搜索请求；根据图片搜索请求确定目标文本；在图片库中对目标文本进行搜索；其中图片库中存储有图片和图片包含的文本；根据目标文本的搜索结果，确定目标文本对应的目标图片并将目标图片输出。本发明实施例提供了一种图像处理方法、装置、处理设备及其存储介质，通过图片搜索请求确定目标文本，将该目标文本在预先存储有图片以及由该图片识别得到的文本的图片库中进行搜索，从而可以搜索出包含该目标文本的图片，提高了通过文本搜索图片的效果。

Description

图像处理方法、装置、处理设备及其存储介质

技术领域

本发明涉及图片搜索技术领域，尤其是涉及一种图像处理方法、装置、处理设备及其存储介质。

背景技术

目前各大搜索引擎均可以提供图片搜索功能，通过搜索程序向用户提供互联网上相关的图片资料。按搜索原理进行分类，主要包括以下方式：关键词搜索；以图(或图的URL)搜图；少量平台还支持以对图片的描述搜索。

关键词搜索，搜索得到的图片未必是用户想要的，原因在于搜索引擎只去查找图片的配字是否匹配关键词，可是图片的配字未必和图片本身内容有紧密联系；以图搜图，是以图片的相似度排序，因此结果会高度类似，经常只是分辨率和尺寸的差别，无法提供给用户相似但不相同的丰富内容；以描述搜图的功能技术尚未成熟，性能不理想，而且描述多指描述物体种类及位置关系，而非文字这种较为抽象的对象。

针对现有技术中，无法有效搜索包含目标文字的图片的问题，目前尚未提出有效的解决方案。

发明内容

有鉴于此，本发明的目的在于提供一种图像处理方法、装置、处理设备及其存储介质，可以有效搜索包含该目标文本的图片，提高搜索效果。

第一方面，本发明实施例提供了一种图像处理的方法，包括：接收图片搜索请求；根据所述图片搜索请求确定目标文本；在图片库中对所述目标文本进行搜索；其中所述图片库中存储有图片和所述图片包含的文本；根据所述目标文本的搜索结果，确定所述目标文本对应的目标图片并将所述目标图片输出。

进一步，所述方法还包括：将原始图片输入第一神经网络模型，以确定包含文字的第一图片；将所述第一图片输入第二神经网络模型，以识别所述原始图片中包含的文本；将所述第一图片和对应的所述文本存储至所述图片库。

进一步，所述方法还包括：将所述第一图片中包含的文本进行语义分割，得到至少一个文本段；将所述文本段的哈希值作为所述第一图片的图片编号；将所述第一图片与所述图片编号存储至所述图片库。

进一步，所述接收图片搜索请求的步骤，包括：接收输入的待搜索文本、正则表达式或者问题中的一种或多种；所述根据所述搜索请求确定目标文本的步骤，包括：将所述待搜索文本、所述待搜索文本的翻译文本、根据所述正则表达式确定的文本或将所述问题对应的回答文本中的一种或多种作为目标文本。

进一步，所述将所述目标图片输出的步骤，包括：计算任意两张所述图片之间的相似度；将所述相似度小于预设阈值的所述图片确定为重复图片；按照预设的删除比例随机删除所述重复图片；将剩余的所述图片作为所述目标图片输出。

进一步，所述方法还包括：接收输入的输出图片数量；判断所述目标文本对应的目标图片的数量是否大于或等于所述输出图片数量；如果是，停止在图片库中对所述目标文本进行搜索，并将所述目标图片输出。

进一步，在所述接收用户输入的输出图片数量的步骤之后，还包括：判断所述输出图片数量是否大于预设最大动态数量；如果是，输出图片数量设置不合理的提醒。

进一步，所述方法还包括：接收输入的最大检索时长；判断当前检索时长是否大于或等于所述最大检索时长；如果是，停止在图片库中对所述目标文本进行搜索，并将所述目标图片输出。

进一步，所述方法还包括：接收输入的神经网络模型；将所述神经网络模型作为所述第一神经网络模型或所述第二神经网络模型。

第二方面，本发明实施例提供了一种图像处理的装置，包括：接收模块，用于接收图片搜索请求；目标文本确定模块，用于根据所述图片搜索请求确定目标文本；搜索模块，用于在图片库中对所述目标文本进行搜索；其中所述图片库中存储有图片和所述图片包含的文本；图片输出模块，用于根据所述目标文本的搜索结果，确定所述目标文本对应的目标图片并将所述目标图片输出。

第三方面，本发明实施例提供了一种搜索含有目标文本图片的处理设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如第一方面任一项所述方法的步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述第一方面任一项所述的方法的步骤。

本发明实施例提供了一种图像处理方法、装置、处理设备及其存储介质，通过图片搜索请求确定目标文本，将该目标文本在预先存储有图片以及由该图片识别得到的文本的图片库中进行搜索，从而可以搜索出包含该目标文本的图片，提高了通过文本搜索图片的效果。

本发明的其他特征和优点将在随后的说明书中阐述，或者，部分特征和优点可以从说明书推知或毫无疑义地确定，或者通过实施本发明的上述技术即可得知。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本发明实施例所提供的一种电子设备的结构示意图；

图2示出了本发明实施例所提供的一种图像处理的方法流程图；

图3示出了本发明实施例所提供的一种识别图片中文本的方法流程图；

图4示出了本发明实施例所提供的一种搜索含有目标文本图片的流程示意图；

图5示出了本发明实施例所提供的一种搜索含有目标文本图片的装置的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

考虑到现有的图片搜索方法，无法对图片中的文本进行有效搜索，即无法搜索出包含该文本在图中的图片，为改善此问题，本发明实施例提供的一种图像处理方法、装置、处理设备及其存储介质，以下对本发明实施例进行详细介绍。

实施例一：

首先，参照图1来描述用于实现本发明实施例的电子设备100。电子设备100可用来实现本发明各实施例的图像处理的方法以及其他运算。

如图1所示，电子设备100包括一个或多个处理器102、一个或多个存储器104、输入装置106、输出装置108以及数据采集器110，这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以采用数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、ASIC(Application Specific Integrated Circuit)中的至少一种硬件形式来实现，所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储器104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如，用户)输出各种信息(例如，图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

所述数据采集器110用于进行数据采集，其中，数据采集器所采集的数据用于输入至所述神经网络中进行运算，例如，数据采集器可以采集待检索的图片，然后，将该图片输入至搜索模块进行搜索，数据采集器还可以将所采集的图片存储在所述存储器104中以供其它组件使用。

示例性地，用于实现根据本发明实施例的图像处理的方法的电子设备可以被实现为诸如计算机、智能手机、平板电脑等智能终端。

实施例二：

参见图2所示的一种图像处理的方法流程图，该方法可由前述实施例提供的电子设备执行，该方法具体包括如下步骤：

步骤S202，接收图片搜索请求。

在用户欲通过文本搜索图片时，可以通过以下方式输入搜索请求：输入待搜索文本、正则表达式或者问题，即用户欲搜索包含与上述搜索请求对应的文本的图片。

步骤S204，根据图片搜索请求确定目标文本。

对应于上述用户输入的待搜索文本、正则表达式或者问题，可以确定用户欲搜索的图片中包含的文本即目标文本，例如可以将待搜索文本作为目标文本，或将待搜索文本的翻译文本作为目标文本，或根据正则表达式确定目标文本，或将上述问题对应的回答文本作为目标文本。其中，正则表达式又称规则表达式，可以被用来检索、替换那些符合某个模式(规则)的文本。

对于用户输入的问题，可以将该问题对应的回答文本作为搜索的目标文本。在根据问题确定回答时，需要预先训练的神经网络能根据问题预测出回答的大致语义分布，从而确定用户欲搜索的文本作为目标文本，。

步骤S206，在图片库中对目标文本进行搜索。在上述图片库中存储有图片和图片包含的文本；其中图片包含的文本由图片进行识别得到。

在得到上述目标文本后，可以使用上述目标文本在图片库中进行搜索。该图片库中预先保存了图片和图片包含的文本，该文本可以是通过识别神经网络进行识别得到的。该识别神经网络可以使用现有的图片文字识别神经网络，在输入图片后可以将图片中包含的文本识别出来。其中，图片包含的文本可以是任意格式、颜色或者语言种类的文本。

步骤S208，根据目标文本的搜索结果，确定目标文本对应的目标图片并将目标图片输出。

对文本进行搜索的方式，可以采用现有的文本搜索方式，本实施例对此不做限制。在得到文本搜索结果后，即可确定文本对应的图片，即确定目标文本对应的目标图片。在确定目标图片后，即可以将该目标图片输出。在搜索并输出时可以按照用户设置的输出数量或者搜索时间，在达到输出数量或者超过搜索时间时进行命中图片的输出。

本发明实施例提供的上述图像处理的方法，通过图片搜索请求确定目标文本，将该目标文本在预先存储有图片以及由该图片识别得到的文本的图片库中进行搜索，从而可以搜索出包含该目标文本的图片，提高了通过文本搜索图片的效果。可以将上述图像处理的方法应用于日常生活的常见需求上，例如搜索街景中的文本信息或表情包等。

在使用图片库进行图片搜索之前，可以通过神经网络模型进行图片的识别以建立图片库，包括识别图片中是否有文字以及识别出该文字，上述方法还可以包括图片识别步骤，参见图3所示的一种识别图片中文本的方法流程图，该方法具体包括如下步骤：

步骤S302，将原始图片输入第一神经网络模型，以确定包含文字的第一图片。要建立图片库，上述电子设备需要部署两种神经网络：第一种负责检测图片中是否有文字，第二种负责从第一种神经网络筛选后的含有文字的图片中，识别出具体的文字。为了提高效率，二者应该同步进行，且第一个检测模型应持续在后台运行，在遍历完整个数据库前，不断检测图片并将正例存入缓存。上述第一神经网络模型可以与任意大型搜索引擎平台的图片数据库进行共享，使得检索更全面。

步骤S304，将上述第一图片输入第二神经网络模型，以识别第一图片中包含的文本。在接受用户的搜索请求时，第二神经网络模型运行，从第一神经网络模型的输出缓存中进行文本识别及图片确定。

步骤S306，将包含文字的第一图片和对应的文本存储至图片库。

在进行存储时，可以通过哈希表的方式进行。上述方法还可以包括以下步骤：

(1)将第一图片中包含的文本进行语义分割，得到至少一个文本段。其中，语义分割可以采用现有的分割方式，本实施例对此不作限定。

(2)将文本段的哈希值作为第一图片的图片编号。由于每张图片中的文本是不变的，且是有限长度的，因此可以建立哈希表，将提取出的文本分割为语义完整的小段，并以每个小段为键，将键所对应的值设置为对应图片的编号。图片提取的文本对应多个小段，对应多个哈希值，因此每张图片可以包括多个编号。

(3)将第一图片与图片编号存储至图片库。

将第一图片与第一图片对应的图片编号储存进缓存，在接收到用户的搜索请求时，可以比较哈希值，并直接返回哈希表中的图片编号对应的图片。

在确定命中的图片后，可以进行搜索结果的审查后再进行输出，例如可以进行相似度审查或数量审查。针对相似度审查，上述将命中的图片输出的步骤可以按照以下步骤执行：

(1)计算任意两张图片之间的相似度，将相似度小于预设阈值的图片确定为重复图片。为了能提供更加丰富的结果，在图片被返回前，搜索到的符合要求的图片将经过相似度审查，例如计算两张图片通过卷积神经网络得到的特征向量之间的欧式距离，如果该欧式距离小于阈值则认为太过相似(比如只有尺寸，分辨率不同)。

(2)按照预设的删除比例随机删除重复图片，将剩余的图片作为目标图片输出。其中，随机删除一定比例的重复图片(不全部删除是为了保留一些只是尺寸、分辨率等细节不同的图片)，直到搜索的图片在满足用户设置的相似度阈值后，达到指定数量从而被返回。该预设的删除比例，可以结合普通人的感知度来确定相似度大约多少会被人认为太过于相似，例如可以将该删除比例设置为一半。但是需要考虑数据库图片是否足够丰富，只有在足够丰富的情况下效果才会较好，否则图片的数量将急剧下降。通过上述步骤，可以选取可信度最高的一部分图片返回给用户，在返回时可以按相似度排序。

针对数量审查，上述方法还可以包括以下步骤：

(1)接收输入的输出图片数量。

用户除了对相似图片的出现比例有要求以外，还可以更改其他变量，如最多返回图片数量，以增加搜索的灵活性，对用户的需求选择性满足。但是如果用户想将最多返回图片数量动态设为非常大的一个值，考虑到搜索的返回速度考虑，需要警告或拒绝用户。例如，判断输出图片数量是否大于预设最大动态数量，如果大于，则输出图片数量设置不合理的提醒。

(2)判断目标文本对应的目标图片的数量是否大于或等于输出图片数量。

(3)如果是，停止在图片库中对目标文本进行搜索，并将目标图片输出。命中的图片数量达到用户的指定数量后返回图片。

用户除了对图片的相似程度和返回图片数量进行设置以外，还可以设置检索时长，满足用户的个性需求，上述方法还可以包括以下步骤：接收输入的最大检索时长，并判断当前检索时长是否大于或等于最大检索时长。如果是，停止在图片库中对目标文本进行搜索，并将目标图片输出。

如果用户想使用其自主训练的神经网络进行搜索，则可以通过上述电子设备的接口接收用户上传的模型，上述方法还可以包括以下步骤：接收用户输入的神经网络模型，并将神经网络模型作为上述第一神经网络模型或上述第二神经网络模型。

实施例三：

在执行上述实施例提供的方法之前，可以将包括上述第一神经网络模型或上述第二神经网络模型的系统部署至上述电子设备，例如服务器等。在接受到用户的搜索请求后，在图库中查找含有用户输入文本的图片，经过适当地删去重复后，按相似度排序并返回。

上述系统可以包括以下模块：模型推断模块、数据库模块、用户输入模块及结果返回模块。该模型推断模块用于存储上述已训练好的神经网络模型以及进行图片的预先文本识别；该数据库模块，用于存储模型推断模块识别得到的包含文本的图片和图片包含的文本；该用户输入模块，用于接收用户输入的搜索要求，即提供用户交互功能；该结果返回模块，用于搜索、审查重复性后返回命中图片。

参见图4所示的搜索含有目标文本图片的流程示意图，通过检测模型进行预先的图片文本识别，将识别后的结果存储至图片库；通过用户界面接收待搜索文本，该待搜索文本进入识别模型结合图片库进行搜索推断。在删除一定比例的相似图片后，判断是否达到用户设置的返回数量。如果达到该返回数量，则输出结果；如果未达到则继续进行搜索推断的过程。

对于实施例二中所提供的图像处理的方法，本发明实施例提供了一种图像处理的装置，参见图5所示的一种图像处理的装置的结构框图，包括：

接收模块502，用于接收图片搜索请求；

目标文本确定模块504，用于根据图片搜索请求确定目标文本；

搜索模块506，用于在图片库中对目标文本进行搜索；其中图片库中存储有图片和图片包含的文本；

图片输出模块508，用于根据目标文本的搜索结果，确定目标文本对应的目标图片并将目标图片输出。；

本发明实施例提供的上述图像处理的装置，通过图片搜索请求确定目标文本，将该目标文本在预先存储有图片以及由该图片识别得到的文本的图片库中进行搜索，从而可以搜索出包含该目标文本的图片，提高了通过文本搜索图片的效果。

在一种实施方式中，上述装置还包括图片预处理模块，用于将原始图片输入第一神经网络模型，以确定包含文字的第一图片；将第一图片输入第二神经网络模型，以识别第一图片中包含的文本；将第一图片和对应的文本存储至图片库。

在另一种实施方式中，上述装置还包括图片预存储模块，用于将第一图片中包含的文本进行语义分割，得到至少一个文本段；将文本段的哈希值作为第一图片的图片编号；将第一图片与图片编号存储至图片库。

在另一种实施方式中，接收模块还用于：接收输入的待搜索文本、正则表达式或者问题中的一种或多种；搜索模块还用于：将待搜索文本、待搜索文本的翻译文本、根据正则表达式确定的文本或将问题对应的回答文本中的一种或多种作为目标文本。

在另一种实施方式中，上述输出模块还用于计算任意两张图片之间的相似度；将相似度小于预设阈值的图片确定为重复图片；按照预设的删除比例随机删除重复图片；将剩余的图片作为目标图片输出。

在另一种实施方式中，上述装置还包括数量设置模块，用于接收输入的输出图片数量；判断目标文本对应的目标图片的数量是否大于或等于输出图片数量；如果是，停止在图片库中对目标文本进行搜索，并将目标图片输出。

在另一种实施方式中，上述装置数量设置模块，还用于判断输出图片数量是否大于预设最大动态数量；如果是，输出图片数量设置不合理的提醒。

在另一种实施方式中，上述装置还包括时长设置模块，用于接收输入的最大检索时长；判断当前检索时长是否大于或等于最大检索时长；如果是，停止在图片库中对目标文本进行搜索，并将目标图片输出。

在另一种实施方式中，上述装置还包括模型接收模块，用于接收输入的神经网络模型；将神经网络模型作为第一神经网络模型或第二神经网络模型。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统具体工作过程，可以参考前述实施例中的对应过程，在此不再赘述。

本实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，计算机程序被处理器运行时执行上述实施例二所提供的方法的步骤。

本发明实施例所提供的一种图像处理的方法、装置及系统的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种图像处理的方法，其特征在于，包括：

接收图片搜索请求；

根据所述图片搜索请求确定目标文本；

在图片库中对所述目标文本进行搜索；其中所述图片库中存储有图片和所述图片包含的文本；所述图片包含的文本由所述图片进行识别得到；

根据所述目标文本的搜索结果，确定所述目标文本对应的目标图片并将所述目标图片输出；

其中，所述目标图片中包括所述目标文本；所述图片搜索请求为搜索包括目标文本的图片的请求；

所述方法还包括：

将原始图片输入第一神经网络模型，以确定包含文字的第一图片；将所述第一图片输入第二神经网络模型，以识别所述第一图片中包含的文本；将所述第一图片和对应的所述文本存储至所述图片库；

将所述第一图片中包含的文本进行语义分割，得到至少一个文本段；将所述文本段的哈希值作为所述第一图片的图片编号；将所述第一图片与所述图片编号存储至所述图片库；

所述接收图片搜索请求的步骤，包括：接收输入的待搜索文本、正则表达式或者问题中的一种或多种；

所述根据所述搜索请求确定目标文本的步骤，包括：

将所述待搜索文本、所述待搜索文本的翻译文本、根据所述正则表达式确定的文本或将所述问题对应的回答文本中的一种或多种作为目标文本。

2.根据权利要求1所述的方法，其特征在于，所述将所述目标图片输出的步骤，包括：

计算任意两张所述图片之间的相似度；

将所述相似度小于预设阈值的所述图片确定为重复图片；

按照预设的删除比例随机删除所述重复图片；

将剩余的所述图片作为所述目标图片输出。

3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

接收输入的输出图片数量；

判断所述目标文本对应的目标图片的数量是否大于或等于所述输出图片数量；

如果是，停止在图片库中对所述目标文本进行搜索，并将所述目标图片输出。

4.根据权利要求3所述的方法，其特征在于，在所述接收用户输入的输出图片数量的步骤之后，还包括：

判断所述输出图片数量是否大于预设最大动态数量；

如果是，输出图片数量设置不合理的提醒。

5.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

接收输入的最大检索时长；

判断当前检索时长是否大于或等于所述最大检索时长；

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收输入的神经网络模型；

将所述神经网络模型作为所述第一神经网络模型或所述第二神经网络模型。

7.一种图像处理的装置，其特征在于，包括：

接收模块，用于接收图片搜索请求；

目标文本确定模块，用于根据所述图片搜索请求确定目标文本；

搜索模块，用于在图片库中对所述目标文本进行搜索；其中所述图片库中存储有图片和所述图片包含的文本；所述图片包含的文本由所述图片进行识别得到；

图片输出模块，用于根据所述目标文本的搜索结果，确定所述目标文本对应的目标图片并将所述目标图片输出；

所述装置还包括：

图片库确定模块，用于将原始图片输入第一神经网络模型，以确定包含文字的第一图片；将所述第一图片输入第二神经网络模型，以识别所述第一图片中包含的文本；将所述第一图片和对应的所述文本存储至所述图片库；

所述接收模块还用于：接收输入的待搜索文本、正则表达式或者问题中的一种或多种；

所述目标文本确定模块还用于：将所述待搜索文本、所述待搜索文本的翻译文本、根据所述正则表达式确定的文本或将所述问题对应的回答文本中的一种或多种作为目标文本。

8.一种搜索含有目标文本图片的处理设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

9.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行权利要求1至6任一项所述方法的步骤。