WO2022100338A1

WO2022100338A1 - 一种图片搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品

Info

Publication number: WO2022100338A1
Application number: PCT/CN2021/123256
Authority: WO
Inventors: 杜玮
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2020-11-10
Filing date: 2021-10-12
Publication date: 2022-05-19
Also published as: EP4184383A4; CN112347948A; US20230082638A1; EP4184383A1

Abstract

一种图片搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品，涉及人工智能技术领域。方法包括：响应于图片搜索请求，获取预设图片库中每一图片的OCR识别结果；遍历预设图片库中未完成低维OCR识别处理、且未完成高维OCR识别处理的图片，并对遍历到的每一图片进行基于OCR识别阈值的低维OCR识别处理，得到每一对应图片的低维OCR识别结果；根据每一图片的低维OCR识别结果和高维OCR识别结果中的至少一种，在预设图片库中确定与关键字符串匹配的目标图片；将目标图片确定为图片搜索请求的搜索结果，并显示搜索结果。

Description

一种图片搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品

相关申请的交叉引用

本申请基于申请号为202011248141.7、申请日为2020年11月10日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及互联网技术领域，涉及但不限于一种图片搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术

基于光学字符识别(OCR，Optical Character Recognition)的图片搜索是依靠OCR识别图片上的文字，再进行搜索。在图片数量很多时，用户可能需要等待OCR全量识别完成后才能得到搜索结果，时间成本上相对较高，导致图片搜索的效率较低。

发明内容

本申请实施例提供一种图片搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品，涉及人工智能技术领域，能够提高图片搜索效率。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种图片搜索方法，包括：

获取图片搜索请求，所述图片搜索请求中包括关键字符串；

响应于所述图片搜索请求，获取预设图片库中每一图片的OCR识别结果；其中，所述OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果，所述低维OCR识别处理的识别精度小于所述高维OCR识别处理的识别精度；

遍历所述预设图片库中未完成所述低维OCR识别处理、且未完成所述高维OCR识别处理的图片，并对遍历到的每一图片进行所述低维OCR识别处理，得到每一对应图片的低维OCR识别结果；

根据每一图片的所述低维OCR识别结果和所述高维OCR识别结果中的至少一种，在所述预设图片库中确定与所述关键字符串匹配的目标图片；

将所述目标图片确定为所述图片搜索请求的搜索结果，并显示所述搜索结果。

本申请实施例提供一种图片搜索装置，包括：

获取模块，配置为获取图片搜索请求，所述图片搜索请求中包括关键字符串；

响应模块，配置为响应于所述图片搜索请求，获取预设图片库中每一图片的OCR识别结果；其中，所述OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果，所述低维OCR识别处理的识别精度小于所述高维OCR识别处理的识别精度；

处理模块，配置为遍历所述预设图片库中未完成所述低维OCR识别处理、且未完成所述高维OCR识别处理的图片，并对遍历到的每一图片进行所述低维OCR识别处理，得到每一对应图片的低维OCR识别结果；

第一确定模块，配置为根据每一图片的所述低维OCR识别结果和所述高维OCR识别结果中的至少一种，在所述预设图片库中确定与所述关键字符串匹配的目标图片；

第二确定模块，配置为将所述目标图片确定为所述图片搜索请求的搜索结果，并显示所述搜索结果。

本申请实施例提供一种计算机程序产品，包括计算机程序或指令，所述计算机程序或指令被处理器执行时，实现本申请实施例提供的图片搜索方法。

本申请实施例提供一种图片搜索设备，包括：

存储器，用于存储可执行指令；处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的图片搜索方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于被处理器执行所述可执行指令时，实现本申请实施例提供的图片搜索方法。

本申请实施例具有以下有益效果：由于预设图片库中的部分图片已经包括对应的OCR识别结果，在预设图片库中进行图片搜索时，仅对预设图片库中除包括OCR识别结果的部分图片之外的剩余图片进行低维OCR识别处理，就能获得预设图片库中所有图片的OCR识别结果；因此，OCR识别结果获取速度较快；进而，基于预设图片库中所有图片的OCR识别结果在预设图片库中进行图片搜索时，能够提高图片搜索效率。

附图说明

图1A是图片搜索的过程示意图；

图1B是待搜索图片为笔记的搜索场景示意图；

图2是本申请实施例提供的图片搜索系统的一个可选的架构示意图；

图3是本申请实施例提供的电子设备的结构示意图；

图4是本申请实施例提供的图片搜索方法的一个可选的流程示意图一；

图5是本申请实施例提供的图片搜索方法的一个可选的流程示意图二；

图6是本申请实施例提供的图片搜索方法的一个可选的流程示意图三；

图7是本申请实施例提供的高维OCR识别处理的一个可选的流程示意图；

图8是本申请实施例提供的图片搜索方法的一个可选的流程示意图四；

图9是本申请实施例提供的图片搜索方法的流程示意图；

图10是本申请实施例提供的图片搜索方法的详细流程示意图；

图11是本申请实施例提供的简略识别流程的流程示意图；

图12是本申请实施例中简略识别流程的示意图；

图13是本申请实施例提供的深度识别策略的流程示意图；

图14A是本申请实施例提供的对图片进行等分并放大前的示意图；

图14B是本申请实施例提供的对图片进行等分并放大后的示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。除非另有定义，本申请实施例所使用的所有的技术和科学术语与属于本申请实施例的技术领域的技术人员通常理解的含义相同。本申请实施例所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

为了更好地理解本申请实施例中提供的图片搜索方法，首先对图片搜索方法进行说明。

在图片搜索时(例如进行表情包图片搜索)，可以通过图片上的一些关键字进行搜索，如图1A所示，是图片搜索的过程示意图，当用户想要搜索“锤头丧气”对应的表情包图片时，可以输入“锤头丧气”，系统会自动匹配到图片11并输出。

但是当用户想要搜索某些图片中拍摄到的细节文字信息时，通常的搜索方法是无法支持如此精细的识别的；例如，用户想要搜索一份笔记中的文字信息时，如图1B所示，是待搜索图片为笔记的搜索场景示意图，现有的搜索功能是无法支持的，因为在搜索时OCR识别的阈值会相对较低，会设置成优先识别更容易识别的内容，例如，优先识别大字体12等，这样能够保证搜索时候的识别耗时不会过高，所以用户是无法通过搜索功能来搜索到细节的文字信息的，比如文字信息13，所以有必要针对这种情况下的搜索功能进行优化。也就是说，如果需要对图片中更细节的文字信息进行搜索，比如对图片中的笔记信息和店铺店名的搜索，这时候原有的搜索功能并不能提供这种精细化的搜索。

另外，部分方案使用的是先将图片上传到服务器，由服务器进行OCR识别，当识别完成后再将结果同步到客户端，这种方案能够有比较高的准确度，但是服务器上传下载等请求会有一定失败的风险，对于大图片和长图片的上传会耗费较多的时间与流量，同时用户图片的隐私性也难以得到保障。

综上所述，图片搜索过程中至少存在以下问题：高精度识别耗时过高，无法应用到搜索场景；低精度识别导致搜索时无法查找到细节内容；云端识别会面临上传下载失败的风险、上传下载耗时、隐私泄漏的风险与离线不可用的问题。

为了解决的图片搜索方法所存在的上述至少一个问题，本申请实施例提出一种图片搜索方法，将快速识别与对图片进行二次加工的精准识别相结合，优化搜索过程中OCR识别对图片上的文字信息进行识别的效率与准确度，使识别结果更加快捷与准确。

本申请实施例提供的图片搜索方法，首先，获取图片搜索请求，图片搜索请求中包括关键字符串；然后响应于图片搜索请求，获取预设图片库中每一图片的OCR识别结果；其中，OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果，其中，低维OCR识别处理的识别精度小于高维OCR识别处理的识别精度；再然后，遍历预设图片库中未完成低维OCR识别处理和高维OCR识别处理的图片，并对遍历到的每一图片进行低维OCR识别处理，得到每一对应图片的低维OCR识别结果；根据每一图片的低维OCR识别结果和高维OCR识别结果中的至少一种，在预设图片库中确定与关键字符串匹配的目标图片；最后，将目标图片确定为图片搜索请求的搜索结果，并显示搜索结果。如此，由于结合了低维OCR识别处理和高维OCR识别处理的识别结果进行图片搜索，能够更准确的搜索图片中的文字信息，实现精细化的搜索，得到准确的搜索结果，并且能够提高搜索效率。

下面，说明本申请实施例的用于图片搜索的电子设备的示例性应用。在一种实现方式中，本申请实施例提供的用于图片搜索的电子设备可以实施为笔记本电脑，平板电脑，台式计算机，移动设备(例如，移动电话，便携式音乐播放器，个人数字助理，专用消息设备，便携式游戏设备)、智能机器人等任意的终端；在另一种实现方式中，本申请实施例提供的用于图片搜索的电子设备还可以实施为服务器。下面，将说明用于图片搜索的电子设备实施为终端时的示例性应用，可以采用终端上的客户端来进行图片搜索。

参见图2，图2是本申请实施例提供的图片搜索系统的一个可选的架构示意图。为实现对图片搜索请求进行准确的响应，以搜索得到准确的目标图片，本申请实施例提供的图片搜索系统10中包括终端100(即电子设备)、网络200和服务器10-1，其中，终端100上运行有图片搜索应用，图片搜索应用对应一预设图片库400，预设图片库400中存储有多张图片，用户可以通过终端100上运行的图片搜索应用的客户端输入关键字符串，以形成图片搜索请求，客户端对用户的图片搜索请求进行响应，以在预设图片库中匹配得到目标图片，其中，目标图片包括至少一张图片；本申请实施例中，客户端还可以对预设图片库400中的每一图片进行基于OCR识别阈值的低维OCR识别处理。服务器10-1作为后台服务器，用于在闲时对预设图片库400中的每一图片进行基于深度识别的高维OCR识别处理，得到高维OCR识别结果，并将高维OCR识别结果发送给终端100；其中，闲时是指终端的空闲时间，是指终端中的各运行指标(CPU占有率、内存占用率和显卡占用率等)低于阈值的时间段，比如，深夜，充电时，各功能应用未使用时，等等。

本申请实施例中，在获取到图片搜素请求时，终端100响应于图片搜索请求，通过网络200从服务器10-1获取预设图片库中每一图片的OCR识别结果；其中，OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果；通过网络200从服务器10-1获取预设图片库中完成低维OCR识别处理和高维OCR识别处理的图片，并遍历未预设图片库中完成低维OCR识别处理和高维OCR识别处理的图片，并对遍历到的每一图片进行低维OCR识别处理，得到每一对应图片的低维OCR识别结果；根据每一图片的低维OCR识别结果和高维OCR识别结果中的至少一种，在预设图片库中确定与关键字符串匹配的目标图片；将确定为图片搜索请求的搜索结果，并在终端100的当前界面100-1上显示搜索结果。

本申请实施例提供的图片搜索方法涉及人工智能技术领域，至少可以通过人工智能技术中的计算机视觉技术和机器学习技术来实现。其中，计算机视觉技术(CV，Computer Vision)是一门研究如何使机器“看”的科学，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维(3D，Three Dimensional)物体重建、三维技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

机器学习(ML，Machine Learning)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本申请实施例中，通过机器学习技术实现对对图片的OCR识别。

图3是本申请实施例提供的电子设备300的结构示意图，图3所示的电子设备300包括：至少一个处理器310、存储器350、至少一个网络接口320和用户接口330。电子设备300中的各个组件通过总线系统340耦合在一起。可理解，总线系统340用于实现这些组件之间的连接通信。总线系统340除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图3中将各种总线都标为总线系统340。

处理器310可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

用户接口330包括使得能够呈现媒体内容的一个或多个输出装置331，包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口330还包括一个或多个输入装置332，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。

存储器350可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器350可选地包括在物理位置上远离处理器310的一个或多个存储设备。存储器350包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本申请实施例描述的存储器350旨在包括任意适合类型的存储器。在一些实施例中，存储器350能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统351，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块352，用于经由一个或多个(有线或无线)网络接口320 到达其他计算设备，示例性的网络接口320包括：蓝牙、无线相容性认证(Wi-Fi)、和通用串行总线(USB，Universal Serial Bus)等；

输入处理模块353，用于对一个或多个来自一个或多个输入装置332之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本申请实施例提供的图片搜索装置可以采用软件方式实现，图3示出了存储在存储器350中的一种图片搜索装置354，该图片搜索装置354可以是电子设备300中的图片搜索装置，其可以是程序和插件等形式的软件，包括以下软件模块：获取模块3541、响应模块3542、处理模块3543、第一确定模块3544和第二确定模块3545，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。

在一些实施例中，本申请实施例提供的图片搜索装置可以采用硬件方式实现，作为示例，本申请实施例提供的图片搜索装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的图片搜索方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

下面将结合本申请实施例提供的电子设备300的示例性应用和实施，说明本申请实施例提供的图片搜索方法。参见图4，图4是本申请实施例提供的图片搜索方法的一个可选的流程示意图一，将结合图4示出的步骤进行说明。

S401，获取图片搜索请求，图片搜索请求中包括关键字符串。

这里，电子设备上运行有图片搜索应用，用户可以在图片搜索应用的客户端上输入关键字符串，则客户端基于用户的输入操作或者用户点击搜索的操作形成图片搜索请求，以请求客户端搜索与该关键字符串对应的图片。关键字符串可以是图片的类型、图片中的文字、图片中文字的摘要等等。

本申请实施例中，客户端在响应图片搜索请求进行图片搜索时，可以在在线状态下进行搜索，也可以在离线状态下进行搜索。

S402，响应于图片搜索请求，获取预设图片库中每一图片的OCR识别结果。

这里，OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果。其中，低维OCR识别处理是一种简略识别策略，高维OCR识别处理是一种深度识别策略；低维OCR识别处理对图片进行简单的识别，高维OCR识别处理对图片进行更加细致和精确的识别，低维OCR识别处理的识别精度小于高维OCR识别处理的识别精度；低维OCR识别处理的难度较低，识别的精度较低，识别的速率较高，资源损耗较低，高维OCR识别处理的难度较高，识别的精度较高，识别的速率较低，资源损耗较大。

需要说明的是，OCR识别阈值是识别的精确度与识别时间之间相对平衡的一个值，也就是说，当满足OCR识别阈值时，不仅识别的速度快，且识别的容错率较高。举例来说，OCR识别阈值可以包括与字体大小对应的阈值或者与识别的可信度对应的阈值，即当对某一字体大小的文字进行识别的时候，不仅能够保证识别的准确率，还能保证识别的效率，则该字体大小对应的字体大小值即可以是OCR识别阈值；或者，当对图片中的文字进行识别时，在达到某一可信度时，识别的准确率较高，且识别的效率也较高时，则可以将该可信度确定为OCR识别阈值。

本申请实施例中，低维OCR识别处理是基于OCR识别阈值来进行的，也就是说，在对图片进行低维OCR识别处理时，识别参数是满足OCR识别阈值的。举例来说，当OCR识别阈值包括字体大小阈值时，则在低维OCR识别处理时，仅对图片中字体大小大于该字体大小阈值的文字进行识别，对小于该字体大小阈值的文字则不进行识别。即，在对图片进行低维OCR识别处理时，如果图片是类似于笔记等具有较多细节文字的图片，是不会对图片中的全部文字进行OCR识别，仅对图片中容易识别的部分文字进行OCR识别，如此能够提高识别的效率。

深度识别是指对图片中的细节内容也进行识别的一种精准识别方式，在深度识别过程中，不仅对整体内容进行识别，还对图片中的细节文字进行识别。基于深度识别的高维OCR识别处理能够对图片中的每一个字进行识别处理，因此，高维OCR识别处理的识别准确度更高，同时识别更耗时。

在一些实施例中，在对图片进行低维OCR识别处理之后，得到低维OCR识别结果，在对图片进行高维OCR识别处理之后，得到高维OCR识别结果，在得到低维OCR识别结果或高维OCR识别结果之后，均将对应的低维OCR识别结果或高维OCR识别结果、以及低维OCR识别结果与图片之间的映射关系、高维OCR识别结果与图片之间的映射关系，存储至预设存储单元中；如此，电子设备能够从预设存储单元中获取到预设图片库中部分图片的OCR识别结果。

S403，遍历预设图片库中未完成低维OCR识别处理、且未完成高维OCR识别处理的图片，并对遍历到的每一图片进行低维OCR识别处理，得到每一对应图片的低维OCR识别结果。

这里，电子设备对预设图片库中每一图片进行判断，确定每一图片是否已经进行过低维OCR识别处理和高维OCR识别处理，并对预设图片库中的未进行过低维OCR识别处理和高维OCR识别处理的图片进行遍历。例如，电子设备可以通过在预设存储单元中查找是否存储有每一图片的低维OCR识别结果或高维OCR识别结果，来确定是否对每一图片已经进行过低维OCR识别处理或高维OCR识别处理。

本申请实施例中，对于在当前时刻仍然未进行低维OCR识别处理和高维OCR识别处理的图片，则对这些图片进行低维OCR识别处理，由于低维OCR识别处理的识别效率较高，因此在本次的图片搜索过程中，能够提高图片识别的效率，进而提高图片搜索的效率。

需要说明的是，在当前时刻对任一图片进行低维OCR识别处理之后，可以将该图片的低维OCR识别结果对应存储至预设存储单元中。

S404，根据每一图片的低维OCR识别结果和高维OCR识别结果中的至少一种，在预设图片库中确定与关键字符串匹配的目标图片。

本申请实施例中，在匹配目标图片时，电子设备不仅可以基于图片的低维OCR识别结果进行匹配，还可以基于图片的高维OCR识别结果进行匹配。当图片具有高维OCR识别结果，则优先选择基于高维OCR识别结果进行匹配，因为高维OCR识别结果比低维OCR识别结果的识别内容更多，识别准确度更高；当图片仅具有低维OCR识别结果时，则基于低维OCR识别结果进行匹配；另外，也可以基于低维OCR识别结果和高维OCR识别结果进行匹配。

在一些实施例中，在匹配目标图片时，可以是将关键字符串与低维OCR识别结果或与高维OCR识别结果中对应的文本内容进行匹配，确定低维OCR识别结果或高维OCR识别结果对应的文本内容与关键字符串之间的相似度，将具有最高相似度的图片确定为目标图片，或者，在确定出每一图片与关键字符串之间的相似度之后，按照相似度由大到小的顺序对图片进行排序，形成图片序列，然后在该图片序列中选择特定数量的图片作为目标图片。

在一些实施例中，在匹配目标图片时，还可以先根据低维OCR识别结果或高维OCR识别结果对应的文本内容确定每一图片对应的图片关键字符串，然后将图片搜索请求中的关键字符串与每一图片的图片关键字符串进行匹配，将与图片搜索请求中的关键字符串相同的图片关键字符串或者相近的图片关键字符串对应的图片确定为目标图片。

可以理解的是，预先存储了预设图片库中的部分图片的高维OCR识别结果和低维OCR识别结果中的至少一种，使得识别时可以对部分图片采用高维OCR识别结果进行搜索，对剩余图片采用低维OCR识别结果进行搜索；而低维OCR识别结果可以是预先存储的，也可以是实时获取的，但由于低维OCR识别结果的获取速度快，从而能够即保证图片搜索效率又保证图片搜索速度。

S405，将目标图片确定为图片搜索请求的搜索结果，并显示搜索结果。

本申请实施例中，当确定出的目标图片为一张时，在电子设备的当前界面上显示这一张图片，当确定出的目标图片为多张时，在电子设备的当前界面上同时显示多张图片，或者分页显示多张图片。

本申请实施例提供的图片搜索方法，采用基于OCR识别阈值的低维OCR识别处理和基于深度识别的高维OCR识别处理对预设图片库中的图片进行处理，对应得到低维OCR识别结果和高维OCR识别结果，并根据每一图片的低维OCR识别结果或高维OCR识别结果，匹配得到图片搜索请求的目标图片，如此，由于同时结合低维OCR识别处理和高维OCR识别处理的识别结果进行图片搜索，能够更准确的搜索图片中的文字信息，实现精细化的搜索，得到准确的搜索结果，并且能够提高搜索效率。

在一些实施例中，可以采用不同的方式进行低维OCR识别处理，图5是本申请实施例提供的图片搜索方法的一个可选的流程示意图二，将结合图5示出的步骤进行说明。

S501，获取图片搜索请求，图片搜索请求中包括关键字符串。

S502，响应于图片搜索请求，获取预设图片库中每一图片的OCR识别结果。

其中，OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果，低维OCR识别处理的识别精度小于高维OCR识别处理的识别精度。

S503，当确定出预设图片库中存在至少一张图片未完成低维OCR识别处理、且未完成高维OCR识别处理时，遍历未完成低维OCR识别处理和高维OCR识别处理的图片。

需要说明的是，S501至S503与上述S401至S403对应的实现过程的描述相同。

在一些实施例中，OCR识别阈值包括识别速度阈值，对应地，可以通过以下步骤进行低维OCR识别处理。

S504，确定针对于遍历到的图片中的每一文字的识别速度。

这里，每一文字的识别速度是指要识别出某段文字所需要的时长与要识别的这段文字的字数之间的比值。识别速度越高表明对应的文字的识别难度越低，越容易识别，识别速度越低表明对应的文字的识别难度越高，越难识别。

本申请实施例中，电子设备可以预先根据OCR识别的情况确定对每一类型的文字的识别速度，从而确定出合适的识别速度阈值。

S505，对识别速度大于识别速度阈值的文字进行OCR识别。

这里，识别速度大于识别速度阈值的文字是相对较容易识别的文字，电子设备可以仅对相对容易识别的文字进行OCR识别，以完成对图片的低维OCR识别处理。

在一些实施例中，OCR识别阈值包括字体大小阈值，对应地，可以通过以下步骤进行低维OCR识别处理。

S506，确定遍历到的图片中的每一文字的字体大小。

这里，字体越大的文字相对更加容易识别，从而识别的速度更高，字体越小的文字相对更难识别，从而识别的速度更低。

本申请实施例中，电子设备可以预先根据OCR识别的情况确定不同字体大小的文字进行识别的识别速度，从而确定出合适的字体大小阈值。

S507，对字体大小大于字体大小阈值的文字进行OCR识别。

在一些实施例中，图片中还可以包括异体字，对应地，可以通过以下步骤进行低维OCR识别处理。

S508，当遍历到的图片中包括异体字时，结束对异体字进行低维OCR识别处理的流程。

这里，由于电子设备无法准确的识别出异体字，因此，不对异体字进行识别。

S509，根据每一图片的低维OCR识别结果或高维OCR识别结果，在预设图片库中确定与关键字符串匹配的目标图片。

S510，将目标图片确定为图片搜索请求的搜索结果，并显示搜索结果。

本申请实施例中，在对图片进行低维OCR识别处理时，可以设置不同的OCR识别阈值，以不同的OCR识别阈值作为识别的参考条件进行文字识别，从而能够实现在保证识别准确度的同时，提高识别的速度，实现识别准确度与识别效率之间的平衡。

基于图4，图6是本申请实施例提供的图片搜索方法的一个可选的流程示意图三；在一些实施例中，低维OCR识别处理的识别精度小于高维OCR识别处理的识别精度，如图6所示，S404可以通过以下步骤实现。

S601，判断每一图片是否具有低维OCR识别结果。

如果判断结果为是，则执行S602，如果判断结果为否，则返回步骤S403继续对该图片进行低维OCR识别处理。

S602，判断每一图片是否具有高维OCR识别结果。

如果判断结果为是，则执行步骤S603，如果判断结果为否，则执行步骤S604。

S603，当图片同时具有低维OCR识别结果和高维OCR识别结果时，将高维OCR识别结果确定为图片的OCR识别结果。

S604，当图片仅具有低维OCR识别结果时，将低维OCR识别结果确定为图片的OCR识别结果。

S605，根据图片的OCR识别结果，在预设图片库中确定与关键字符串匹配的目标图片。

本申请实施例中，由于高维OCR识别结果的精准度高于低维OCR识别结果的精准度，因此当同时存在低维OCR识别结果和高维OCR识别结果时，则以精准度更高的高维OCR识别结果为依据进行目标图片的匹配；并且，当仅具有低维OCR识别结果时，为了保证本次图片搜索任务的时效性，提高本次图片搜索任务的搜索效率，则继续以该低维OCR识别结果为依据进行目标图片的匹配，此时由于低维OCR识别结果也是具有一定的可信度，且具有一定的识别准确度的，因此，在保证图片搜索效率的同时，在一定程度上也能够保证最终匹配结果的准确性。

图7是本申请实施例提供的高维OCR识别处理的一个可选的流程示意图，将结合图7示出的步骤进行说明。

S701，在获取图片搜索请求之前，或者，在完成对图片搜索请求的响应之后，或者，在搜索请求响应中断时，确定预设图片库中未完成高维OCR识别处理的图片为未处理图片。

本申请实施例中，可以在闲时实现高维OCR识别处理，也就是说，在电子设备不执行图片搜索任务时，可以在后台执行高维OCR识别处理。由于在获取图片搜索请求之前，或者，在完成对图片搜索请求的响应之后，或者，在搜索请求响应中断时，均没有执行图片搜索任务，因此可以在这些时间段内进行高维OCR识别处理，以实现对预设图片库中的每一图片完成高维OCR识别处理，使得在后续的图片搜索任务中，均能够基于精确度更高的高维OCR识别结果进行图片搜素。

需要说明的是，未处理图片是没有完成高维OCR识别处理的图片，即，未处理图片不仅包括未完成低维OCR识别处理且未完成高维OCR识别处理的图片，还包括已完成低维OCR识别处理且未完成高维OCR识别处理的图片。

S702，对每一未处理图片进行高维OCR识别处理，得到每一未处理图片的高维OCR识别结果。

在一些实施例中，电子设备在对遍历到的每一图片进行低维OCR识别处理，得到每一对应图片的低维OCR识别结果之后，将低维OCR识别结果存储至预设存储单元中；电子设备在采用高维OCR识别处理对每一未处理图片进行处理，得到每一未处理图片的高维OCR识别结果之后，将高维OCR识别结果存储至预设存储单元中，并删除对应未处理图片的低维OCR识别结果。

本申请实施例中，电子设备在每完成一次低维OCR识别处理或高维OCR识别处理之后，均将得到的低维OCR识别结果或高维OCR识别结果存储至预设存储单元中，如此，能够保证在后续执行图片搜索任务时，可以直接从预设存储单元中快速的获取到低维OCR识别结果或高维OCR识别结果，根据获取到的低维OCR识别结果或高维OCR识别结果进行快速的关键字符串匹配，而无需再对图片进行低维OCR识别处理或高维OCR识别处理，提高了图片搜索效率。

在一些实施例中，S702可以通过S7021和S7022实现，下面对各步骤分别进行说明。

S7021，对未处理图片进行文本清晰化处理，得到文本清晰化处理后的图片。

这里，文本清晰化处理包括以下步骤：首先，对未处理图片进行分割，形成至少两个子图片；然后，对每一子图片进行放大处理，得到放大后的子图片。

本申请实施例中，电子设备可以将未处理图片等分为至少两个子图片，也可以采用任意的分割方式，或基于一定的分割规则，将未处理图片分割为不规则或不相等的至少两个子图片。

当对未处理图片进行不规则或不等分割时，例如，未处理图片A的左侧三分之一是纯图片，没有任何文字，而右侧的三分之二是由文字形成的文字图片，则可以将未处理图片A划分为两部分，第一部分是左侧三分之一的纯图片形成的一个子图片，第二部分是右侧三分之二的文字图片形成的一个子图片。这样，由于第一部分是纯图片，因此无需进行OCR识别，而第二部分是文字图片，这样划分还不会影响第二部分文字的连续性，能够对第二部分文字进行更加准确的识别，且仅需对第二部分进行OCR识别，如此，不仅提高了识别的准确性，还能够有效的提高识别效率。

本申请实施例中，由于高维OCR识别结果需要对图片中的细节内容也进行识别，而图片中的细节内容，例如文字，通常会比较小，因此，为了提高识别的准确度，可以对分割后的子图片进行放大处理，以降低细节内容的识别难度。

S7022，对文本清晰化处理后的图片中的文字进行OCR识别，得到每一未处理图片的高维OCR识别结果。

这里，S7022中电子设备对文本清晰化处理后的图片中的文字进行OCR识别可以通过以下步骤实现：对放大后的子图片中的文字进行OCR识别，得到每一子图片对应的子识别结果。然后，对至少两个子图片中每一子图片的子识别结果进行融合，得到未处理图片的高维OCR识别结果。

这里，电子设备可以判断至少两个子图片对应的至少两个子识别结果之间是否包括重叠内容；当至少两个子识别结果之间包括重叠内容时，确定至少两个子识别结果中的非重叠内容和重叠内容；将非重叠内容与重叠内容进行融合，得到未处理图片的高维OCR识别结果。

需要说明的是，这里将非重叠内容与重叠内容进行融合，是指将重叠内容在高维OCR识别结果中的重复的部分删除。举例来说，当第一张子图片的子识别结果中包括A、B、C、D四个关键字，第二张子图片的子识别结果中包括C、D、E、F四个关键字时，此时，第一张子图片的子识别结果与第二张子图片的子识别结果的非重叠内容为：A、B、E、F，而重叠内容为C、D，因此，在将非重叠内容与重叠内容进行融合，得到未处理图片的高维OCR识别结果则应该是：A、B、C、D、E、F，而不应该是：A、B、C、D、C、D、E、F，即需要将重叠内容C、D在高维OCR识别结果中的重复的部分C、D删除。

当至少两个子识别结果之间不包括重叠内容时，对每一子图片进行再次分割、放大处理、OCR识别和子识别结果的融合，以得到每一子图片的识别结果；根据每一子图片的识别结果，确定未处理图片的高维OCR识别结果。

这里，当至少两个子识别结果之间不包括重叠内容时，为了进一步提高识别的准确度，电子设备可以再次对子图片进行分割、放大和识别，以及识别后的结果融合处理，从而得到子图片的更加准确的识别结果。

在一些实施例中，图片搜索方法可以由图片搜索系统中的客户端、与客户端对应的预设存储单元和服务器来实现，图8是本申请实施例提供的图片搜索方法的一个可选的流程示意图四，如图8所示，该图片搜索方法包括S801至S815，下面对各步骤分别进行说明。

S801，服务器采用基于深度识别的高维OCR识别处理对预设图片库中的每一图片进行处理，得到每一图片的高维OCR识别结果。

这里，服务器在闲时对预设图片库中的每一图片进行高维OCR识别处理，能够有效的利用资源，避免在进行图片搜索任务时进行高维OCR识别处理而降低搜索效率的问题。

S802，服务器将高维OCR识别结果存储至预设存储单元中。

本申请实施例中，服务器在每处理得到一张图片的高维OCR识别结果时，即将该高维OCR识别结果存储至预设存储单元中，这样能够保证在接下来的图片搜索任务中就能够及时的使用到该高维OCR识别结果。

S803，客户端获取图片搜索请求，图片搜索请求中包括关键字符串。

S804，客户端响应于图片搜索请求，从预设存储单元中获取预设图片库中每一图片的OCR识别结果。

S805，客户端遍历预设图片库中未完成低维OCR识别处理和高维OCR识别处理的图片，并对遍历到的每一图片进行低维OCR识别处理，得到每一对应图片的低维OCR识别结果。

S806，当预设图片库中增加新的图片时，客户端对新的图片进行低维OCR识别处理。

本申请实施例中，当预设图片库中新增图片时，还需要对新增图片进行低维OCR识别处理，以保证预设图片库中的每一图片均具有低维OCR识别结果。或者，当预设图片库中新增图片时，可以在下一次图片搜索任务中及时对该新增图片进行低维OCR识别处理。

S807，客户端确定每一图片的低维OCR识别结果对应的可信度。

本申请实施例中，可以采用特定的OCR识别模型进行OCR识别，在采用该OCR识别模型进行OCR识别时，不仅能够得到低维OCR识别结果，还能够得到本次低维OCR识别结果对应的可信度。

可信度的影响因素包括但不限于以下至少之一：图片的清晰度、图片的类型和识别出的字数等。例如，对于本身清晰度比较低，拍摄的比较模糊的图片，识别结果的可信度相对会较低；对于印刷体和手写体的文字的识别，可信度也存在差别，相对于印刷体，手写体文字的识别结果可信度较低；当对于同一张图片进行识别时，如果识别出来的文字的数量远小于实际的字数，则识别结果的可信度较低。

S808，客户端删除可信度低于阈值的低维OCR识别结果。

本申请实施例中，选取具有高可信度的低维OCR识别结果。

S809，客户端将每一对应图片的低维OCR识别结果存储至预设存储单元中。

S810，客户端根据每一图片的低维OCR识别结果和高维OCR识别结果中的至少一种，在预设图片库中确定与关键字符串匹配的目标图片。

S811，客户端将目标图片确定为图片搜索请求的搜索结果，并显示搜索结果。

S812，服务器继续采用基于深度识别的高维OCR识别处理对预设图片库中还未进行高维OCR识别处理的图片进行处理，得到图片的高维OCR识别结果。

这里，由于预设图片库中的图片还没有完全完成高维OCR识别处理，因此，在完成一次图片搜索任务之后的空闲时间内，后台服务器可以继续基于深度识别的高维OCR识别处理对预设图片库中还未进行高维OCR识别处理的图片进行处理。

S813，服务器将高维OCR识别结果存储至预设存储单元中。

S814，当预设图片库中增加新的图片时，服务器对新的图片进行高维OCR识别处理。

本申请实施例中，当预设图片库中新增图片时，还需要对新增图片进行高维OCR识别处理，以保证预设图片库中的每一图片均具有高维OCR识别结果。

S815，在采用高维OCR识别处理对每一图片进行处理，得到每一图片的高维OCR识别结果之后，服务器删除对应图片在预设存储单元中的低维OCR识别结果。

本申请实施例中，由于高维OCR识别结果的识别准确度高于低维OCR识别结果的识别准确度，因此，当任一图片同时具有低维OCR识别结果和高维OCR识别结果时，可以仅保留具有较高识别准确度的高维OCR识别结果，删除预设存储单元中存储的低维OCR识别结果。这样，不仅能够节省预设存储单元中的存储空间，还能够保证在进行后续图片搜索任务时，可以直接采用预设存储单元中存储的高维OCR识别结果进行关键字符串匹配，而无需从低维OCR识别结果和高维OCR识别结果中确定出识别准确度更高的高维OCR识别结果，即节省了一次判读和选择的步骤，进一步提高了搜索效率。

下面，将说明本申请实施例在一个实际的应用场景中的示例性应用。该示例性应用描述了预设图片库为相册时，基于获得的用户输入的搜索关键字，在相册中准确且快速查找出于搜索关键字匹配的目标图片的过程。

本申请实施例提供一种图片搜索方法，在实际产品应用上，用户只需要在图片搜索应用的输入界面输入与搜索关键字，图片搜索应用就可以自动搜索到与搜索关键字匹配的搜索结果，且搜索结果能够准确包括图片中存在的文字，本申请实施例的方法能够应用到所有搜索图片的场景中。

如图9所示，是本申请实施例提供的图片搜索方法的流程示意图，如图9所示，该图片搜索方法通过客户端实现，包括S901至S903，下面对各步骤分别进行说明。

S901，获取用户输入的搜索关键字(称为关键字符串)。

S902，对图片进行OCR识别，并确定OCR识别结果中是否包含搜索关键字，得到搜索结果(称为目标图片)。

S903，输出搜索结果。

由于OCR识别需要一定时间，所以在用户搜索时进行OCR识别的效率需要快，因此整体搜索流程将基于后台闲时识别与搜索时的快速识别相结合，在保证能够快速输出搜索结果的同时，确保了图片OCR识别的准确性与完整性。本申请实施例中，可以将简略识别策略与深度识别策略进行结合来实现图片搜索方法，其中，简略识别策略对应本申请实施例中的低维OCR识别处理，深度识别策略对应本申请实施例中的高维OCR识别处理。简略识别策略与深度识别策略的详细流程与它们之间的调度关系将在下文详细阐述。

图10是本申请实施例提供的图片搜索方法的详细流程示意图，如图10所示，该图片搜索方法包括S1001至S1013，下面对各步骤分别进行说明。

S1001，获取搜索关键字。

需要说明的是，客户端开始进行图片搜索时，响应于用户操作，获取搜索关键字。

S1002，判断图片是否全部扫描完成。

这里，如果对预设图片库已经进行了一次全量图片的简略识别(称为全部扫描完成)，则可以利用该识别结果进行查询；如果对预设图片库尚未完成全量图片的简略识别，则进入简略识别流程。也就是说，如果判断结果为是，则利用该识别结果进行查询，并执行S1003；如果判断结果为否，则执行S1004。

S1003，输出搜索结果。

本申请实施例中，当利用OCR识别内容进行搜索时，如果对预设图片库已经进行了一次全量的简略识别，则可以利用该搜索关键字对识别结果进行搜索，并同时输出包含了搜索关键字的搜索结果以结束。

S1004，使用简略识别策略(称为低维OCR识别处理)。

S1005，遍历预设图片库中的图片。

S1006，对图片中的文字进行OCR识别。

需要说明的是，这里的图片为未完成低维OCR识别处理、且未完成高维OCR识别处理的图片。

S1007，判断是否进行深度扫描(即是否采用深度识别策略进行后台闲时深度识别)。

如果判断结果为是，则进行深度扫描，执行S1009；如果判断结果为否，则执行S1008。

S1008，判断是否遍历完成。

如果判断结果为是，则返回继续执行S1003；如果判断结果为否，则返回继续执行S1005。

当确定使用深度识别策略进行处理时，深度识别策略包括S1009至S1013，下面对各步骤分别进行说明。

S1009，使用深度识别策略(称为高维OCR识别处理)。

S1010，图片4等分并放大。

S1011，对分割后的图片(称为子图片)进行OCR识别。

S1012，判断识别结果(称为子识别结果)是否与已有结果(称为子识别结果)重复。

这里，已有结果是指当前在对任一图片中的任一等分部分(称为子图片)进行识别时，历史过程中对该图片的其他等分部分识别到的结果。

本申请实施例中，判断当前对任一图片中的任一等分部分识别到的结果，与历史过程中对该图片的其他等分部分识别到的结果是否有重叠内容。如果判断结果为是，则执行S1013；如果判断结果为否，则返回继续执行S1010，继续进行分割并识别。

S1013，记录识别结果。

以下对简略识别流程进行详细说明：

图11是本申请实施例提供的简略识别流程的流程示意图，如图11所示，在简略识别流程中，利用OCR简单识别一张图片上的文字，如图12所示，是本申请实施例中简略识别流程的示意图，在简略识别流程中，对于大字、正体字，例如图12中的文字121，将会是主动识别的目标，而小字、异体字等，例如图12中的文字122，由于需要较多时间和资源进行识别，因此，对于这一类字体将会放弃识别，确保单张图片的识别时间能够控制在10毫秒内。

请继续参照图11，简略识别策略的流程包括S111至S117，下面对各步骤分别进行说明。

S111，遍历预设图片库中的图片。

当开始执行简略识别策略时，客户端遍历预设图片库中的图片，以获取未完成低维OCR识别处理、且未完成高维OCR识别处理的图片。

S112，对图片中的文字进行OCR识别。

S113，判断识别结果的可信度是否大于80％。

这里，选取可信度高的识别结果。在简略识别过程中，将对可信度低的结果进行排除，因为在简略识别触发的时机正是用户正在进行搜索，而深度识别尚未完成的时候，所以需要保持一定的识别的准确度，确保用户能够正常搜索，同时避免由于可信度低导致产出过多搜索干扰项。

本申请实施例中，可信度是在进行OCR识别的时候即可得到的一个值，即在对图片进行OCR识别时，不仅输出识别结果，还会输出该识别结果对应的可信度。

在S113中，如果判断结果为是，则执行S114，如果判断结果为否，则执行S116。

S114，保存识别结果。

本申请实施例中，当所有图片识别完成后，对应图片的OCR结果将会保存在数据库中。

S115，判断是否遍历完成。

如果判断结果为是，则结束流程；如果判断结果为否，则返回继续执行S111。

S116，丢弃识别结果。

S117，新增图片。

需要说明的是，当新增图片时，则继续执行S112对新增图片中的文字进行OCR识别。

本申请实施例中，当有新的图片增加时，不需要再进行全量识别，只需要对新增的图片进行一次识别，并将识别结果保存到数据库(称为预设存储单元)即可。

以下对深度识别策略进行详细说明。

图13是本申请实施例提供的深度识别策略的流程示意图，如图13所示，深度识别策略包括S131至S138，下面对各步骤分别进行说明。

S131，遍历预设图片库中的图片。

需要说明的是，本申请实施例中，深度识别将会在闲时(例如，深夜、充电中且应用程序未在使用时)进行。

S132，图片四等分并放大。

在深度识别中，将分割图片并放大，确保能够识别到更多的信息，例如，在深度识别时，可以对图片进行四等分，该处理的目的是为了在图片中识别更多的文字。图14A是本申请实施例提供的对图片进行等分并放大前的示意图，图14B是本申请实施例提供的对图片进行等分并放大后的示意图，如图14A和图14B所示，在对图片进行等分并放大前的原始图片区域141中，文字较小，很难识别，而在对图片进行等分并放大后的局部放大图片区域142中，文字被放大，容易识别；其中，图片区域142是图片区域141的放大结果。

本申请实施例中，分割后对图片进行识别，如果某一张分割后的图片中没有包含有任何文字信息，则将抛弃该分割图片，不再对该分割图片区域进行识别。

S133，对分割后的图片进行OCR识别。

S134，判断是否有OCR识别结果。

如果判断结果为是，则执行S135，如果判断结果为否，则结束对该图片的继续分割，并执行S136。

S135，判断识别结果的可信度是否低于阈值。

本申请实施例中，可以针对可信度低的结果进行再次分割识别。

在本申请实施例中，可能将图片四等分后仍然在图片中包含了过多的文字信息(如全景图片、长截图等)，这时候识别出来的结果可信度将会偏低，对于这部分的图片，将对分割后的图片再次进行分割，并对二次分割的图片同样进行识别，如果图片之前已经能够识别出可信度高(例如，可信度大于70％)的内容，或者图片中并未包含文字信息，则不需要进行再次分割。

在S135中，如果判断结果为是，则返回继续执行S132，对图片进行继续分割和识别；如果判断结果为否，则执行S136。

S136，跳过该分割图片。

S137，判断是否遍历完所有分割图片。

如果判断结果为是，则执行S138；如果判断结果为否，则继续遍历已分割图片，并返回继续执行S133。

S138，判断预设图片库中的图片是否遍历完成。

如果判断结果为是，则结束流程；如果判断结果为否，则返回S131继续遍历图片。

本申请实施例中，可以将识别结果保存到数据库中，如果数据库中已包含该图片的简略识别流程的结果，则将简略识别流程的结果替换为深度识别的结果。同样的，如果有新图片加入时，也可以直接对新图片进行增量识别，即对新图片进行深度识别。

本申请实施例提供的图片搜索方法，在搜索照片时，能够更准确地搜索照片中的文字信息，并提供更多维度的照片搜索，能够利用到更多的搜索场景，如：笔记搜索、聊天记录截图搜索等，且无需后台云端识别就有较高的准确率，并可以离线使用。

下面继续说明本申请实施例提供的图片搜索装置354实施为软件模块的示例性结构，在一些实施例中，如图3所示，存储在存储器350的图片搜索装置354，包括：

获取模块3541，配置为获取图片搜索请求，所述图片搜索请求中包括关键字符串；

响应模块3542，配置为响应于所述图片搜索请求，获取预设图片库中每一图片的OCR识别结果；其中，所述OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果，所述低维OCR识别处理的识别精度小于所述高维OCR识别处理的识别精度；

处理模块3543，配置为遍历所述预设图片库中未完成所述低维OCR识别处理、且未完成所述高维OCR识别处理的图片，并对遍历到的每一图片进行所述低维OCR识别处理，得到每一对应图片的低维OCR识别结果；

第一确定模块3544，配置为根据每一图片的所述低维OCR识别结果和所述高维OCR识别结果中的至少一种，在所述预设图片库中确定与所述关键字符串匹配的目标图片；

第二确定模块3545，配置为将所述目标图片确定为所述图片搜索请求的搜索结果，并显示所述搜索结果。

在一些实施例中，所述处理模块3543还配置为：当确定出所述预设图片库中包括至少一张图片未完成所述低维OCR识别处理、且未完成所述高维OCR识别处理时，遍历未完成所述低维OCR识别处理和所述高维OCR识别处理的图片，并对遍历到的每一图片进行所述低维OCR识别处理。

在一些实施例中，所述OCR识别阈值包括识别速度阈值，所述处理模块3543还配置为：确定针对于遍历到的所述图片中的每一文字的识别速度；对所述识别速度大于所述识别速度阈值的文字进行OCR识别，所述OCR识别用于对所述图片进行所述低维OCR识别处理。

在一些实施例中，所述OCR识别阈值包括字体大小阈值，所述处理模块3543还配置为：确定遍历到的所述图片中的每一文字的字体大小；对所述字体大小大于所述字体大小阈值的文字进行OCR识别，所述OCR识别用于对所述图片进行所述低维OCR识别处理。

在一些实施例中，所述处理模块3543还配置为：当遍历到的所述图片中包括异体字时，结束对所述异体字进行所述低维OCR识别处理的流程。

在一些实施例中，所述第一确定模块3544还配置为：当所述图片同时具有所述低维OCR识别结果和所述高维OCR识别结果时，将所述高维OCR识别结果确定为所述图片的所述OCR识别结果；当所述图片仅具有所述低维OCR识别结果时，将所述低维OCR识别结果确定为所述图片的所述OCR识别结果；根据所述图片的所述OCR识别结果，在所述预设图片库中确定与所述关键字符串匹配的所述目标图片。

在一些实施例中，所述图片搜索装置354还包括：第三确定模块，配置为在获取所述图片搜索请求之前，或者，在完成对所述图片搜索请求的响应之后，或者，在所述图片搜索请求响应中断时，确定所述预设图片库中未完成所述高维OCR识别处理的图片为未处理图片；对每一所述未处理图片进行所述高维OCR识别处理，得到每一所述未处理图片的所述高维OCR识别结果。

在一些实施例中，所述图片处理模块还配置为：对所述未处理图片进行文本清晰化处理，得到文本清晰化处理后的图片；对所述文本清晰化处理后的图片中的文字进行OCR识别，以得到每一所述未处理图片的所述高维OCR识别结果。

在一些实施例中，所述图片处理模块还配置为：对所述未处理图片进行分割，得到至少两个子图片；对每一所述子图片进行放大处理，得到放大后的子图片；对所述放大后的子图片中的文字进行OCR识别，以得到每一所述子图片对应的子识别结果；对所述至少两个子图片对应的至少两个所述子识别结果进行融合，得到所述未处理图片的所述高维OCR识别结果。

在一些实施例中，所述图片处理模块还配置为：当所述至少两个子图片对应的至少两个所述子识别结果之间包括重叠内容时，确定至少两个所述子识别结果中的非重叠内容和所述重叠内容；将所述非重叠内容与所述重叠内容进行融合，得到所述未处理图片的所述高维OCR识别结果；当所述至少两个子图片对应的至少两个所述子识别结果之间不包括所述重叠内容时，对每一所述子图片进行再次分割、所述放大处理、所述OCR识别和所述子识别结果的融合，以得到每一所述子图片的识别结果；根据每一所述子图片的所述识别结果，确定所述未处理图片的所述高维OCR识别结果。

在一些实施例中，所述图片搜索装置354还包括：存储模块，配置为在对遍历到的每一图片进行所述低维OCR识别处理，得到每一对应图片的低维OCR识别结果之后，将所述低维OCR识别结果存储至预设存储单元中；以及，在对每一所述未处理图片进行所述高维OCR识别处理，得到每一所述未处理图片的所述高维OCR识别结果之后，将所述高维OCR识别结果存储至所述预设存储单元中，并删除对应未处理图片的所述低维OCR识别结果。

在一些实施例中，所述图片搜索装置354还包括：第四确定模块，配置为确定每一所述图片的低维OCR识别结果对应的可信度；删除模块，配置为删除可信度低于阈值的低维OCR识别结果。

在一些实施例中，所述图片搜索装置354还包括：OCR识别处理模块，配置为当所述预设图片库中增加新的图片时，对所述新的图片进行所述低维OCR识别处理或所述高维OCR识别处理。

需要说明的是，本申请实施例提供的图片搜索装置的描述，与本申请实施例提供的图片搜索方法的描述是类似的，具有相似的有益效果。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备(用于图片搜索的电子设备)的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本申请实施例上述的图片搜索方法。

本申请实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本申请实施例提供的图片搜索方法，例如，如图4示出的图片搜索方法。

在一些实施例中，计算机可读存储介质，例如，铁电存储器(FRAM，Ferromagnetic Random Access Memory)、只读存储器(ROM，Read Only Memory)、可编程只读存储器(PROM，Programmable Read Only Memory)、可擦除可编程只读存储器(EPROM，Erasable Programmable Read Only Memory)、带电可擦可编程只读存储器(EEPROM，Electrically Erasable Programmable Read Only Memory)、闪存、磁表面存储器、光盘、或光盘只读存储器(CD-ROM，Compact Disk-Read Only Memory)等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper Text Markup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

Claims

一种图片搜索方法，所述方法由电子设备执行，包括：

获取图片搜索请求，所述图片搜索请求中包括关键字符串；

响应于所述图片搜索请求，获取预设图片库中每一图片的OCR识别结果；其中，所述OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果，所述低维OCR识别处理的识别精度小于所述高维OCR识别处理的识别精度；

遍历所述预设图片库中未完成所述低维OCR识别处理、且未完成所述高维OCR识别处理的图片，并对遍历到的每一图片进行所述低维OCR识别处理，得到每一对应图片的低维OCR识别结果；

根据每一图片的所述低维OCR识别结果和所述高维OCR识别结果中的至少一种，在所述预设图片库中确定与所述关键字符串匹配的目标图片；

将所述目标图片确定为所述图片搜索请求的搜索结果，并显示所述搜索结果。
根据权利要求1所述的方法，其中，所述遍历所述预设图片库中未完成所述低维OCR识别处理、且未完成所述高维OCR识别处理的图片，并对遍历到的每一图片进行所述低维OCR识别处理，包括：

当确定出所述预设图片库中包括至少一张图片未完成所述低维OCR识别处理、且未完成所述高维OCR识别处理时，遍历未完成所述低维OCR识别处理和所述高维OCR识别处理的图片，并对遍历到的每一图片进行所述低维OCR识别处理。
根据权利要求1所述的方法，其中，所述OCR识别阈值包括识别速度阈值，所述对遍历到的每一图片进行所述低维OCR识别处理，包括：

确定针对于遍历到的所述图片中的每一文字的识别速度；

对所述识别速度大于所述识别速度阈值的文字进行OCR识别，所述OCR识别用于对所述图片进行所述低维OCR识别处理。
根据权利要求1所述的方法，其中，所述OCR识别阈值包括字体大小阈值，所述对遍历到的每一图片进行所述低维OCR识别处理，包括：

确定遍历到的所述图片中的每一文字的字体大小；

对所述字体大小大于所述字体大小阈值的文字进行OCR识别，所述OCR识别用于对所述图片进行所述低维OCR识别处理。
根据权利要求1所述的方法，其中，所述对遍历到的每一图片进行所述低维OCR识别处理之前，所述方法还包括：

当遍历到的所述图片中包括异体字时，结束对所述异体字进行所述低维OCR识别处理的流程。
根据权利要求1所述的方法，其中，所述根据每一图片的所述低维OCR识别结果和所述高维OCR识别结果中的至少一种，在所述预设图片库中确定与所述关键字符串匹配的目标图片，包括：

当所述图片同时具有所述低维OCR识别结果和所述高维OCR识别结果时，将所述高维OCR识别结果确定为所述图片的所述OCR识别结果；

当所述图片仅具有所述低维OCR识别结果时，将所述低维OCR识别结果确定为所述图片的所述OCR识别结果；

根据所述图片的所述OCR识别结果，在所述预设图片库中确定与所述关键字符串匹配的所述目标图片。
根据权利要求1至6任一项所述的方法，其中，所述方法还包括：

在获取所述图片搜索请求之前，或者，在完成对所述图片搜索请求的响应之后，或者，在所述图片搜索请求响应中断时，确定所述预设图片库中未完成所述高维OCR识别处理的图片为未处理图片；

对每一所述未处理图片进行所述高维OCR识别处理，得到每一所述未处理图片的所述高维OCR识别结果。
根据权利要求7所述的方法，其中，所述对每一所述未处理图片进行所述高维OCR识别处理，得到每一所述未处理图片的所述高维OCR识别结果，包括：

对所述未处理图片进行文本清晰化处理，得到文本清晰化处理后的图片；

对所述文本清晰化处理后的图片中的文字进行OCR识别，得到每一所述未处理图片的所述高维OCR识别结果。
根据权利要求8所述的方法，其中，所述对所述未处理图片进行文本清晰化处理，得到文本清晰化处理后的图片，包括：

对所述未处理图片进行分割，得到至少两个子图片；

对每一所述子图片进行放大处理，得到放大后的子图片；

所述对所述文本清晰化处理后的图片中的文字进行OCR识别，得到每一所述未处理图片的所述高维OCR识别结果，包括：

对所述放大后的子图片中的文字进行OCR识别，得到每一所述子图片对应的子识别结果；

对所述至少两个子图片对应的至少两个所述子识别结果进行融合，得到所述未处理图片的所述高维OCR识别结果。
根据权利要求9所述的方法，其中，所述对所述至少两个子图片对应的至少两个所述子识别结果进行融合，得到所述未处理图片的所述高维OCR识别结果，包括：

当所述至少两个子图片对应的至少两个所述子识别结果之间包括重叠内容时，确定至少两个所述子识别结果中的非重叠内容和所述重叠内容；

将所述非重叠内容与所述重叠内容进行融合，得到所述未处理图片的所述高维OCR识别结果；

当所述至少两个子图片对应的至少两个所述子识别结果之间不包括所述重叠内容时，对每一所述子图片进行再次分割、所述放大处理、所述OCR识别和所述子识别结果的融合，得到每一所述子图片的识别结果；

根据每一所述子图片的所述识别结果，确定所述未处理图片的所述高维OCR识别结果。
根据权利要求7所述的方法，其中，所述方法还包括：

在对遍历到的每一图片进行所述低维OCR识别处理，得到每一对应图片的低维OCR识别结果之后，将所述低维OCR识别结果存储至预设存储单元中；

在对每一所述未处理图片进行所述高维OCR识别处理，得到每一所述未处理图片的所述高维OCR识别结果之后，将所述高维OCR识别结果存储至所述预设存储单元中，并删除对应未处理图片的所述低维OCR识别结果。
根据权利要求1至6任一项所述的方法，其中，所述方法还包括：

当所述预设图片库中增加新的图片时，对所述新的图片进行所述低维OCR识别处理或所述高维OCR识别处理。
一种图片搜索装置，包括：

获取模块，配置为获取图片搜索请求，所述图片搜索请求中包括关键字符串；

响应模块，配置为响应于所述图片搜索请求，获取预设图片库中每一图片的OCR识别结果；其中，所述OCR识别结果包括以下至少之一：采用基于OCR识别阈值的低维OCR识别处理所得到的低维OCR识别结果和基于深度识别的高维OCR识别处理所得到的高维OCR识别结果，所述低维OCR识别处理的识别精度小于所述高维OCR识别处理的识别精度；

处理模块，配置为遍历未所述预设图片库中完成所述低维OCR识别处理、且未完成所述高维OCR识别处理的图片，并对遍历到的每一图片进行所述低维OCR识别处理，得到每一对应图片的低维OCR识别结果；

第一确定模块，配置为根据每一图片的所述低维OCR识别结果和所述高维OCR识别结果中的至少一种，在所述预设图片库中确定与所述关键字符串匹配的目标图片；

第二确定模块，配置为将所述目标图片确定为所述图片搜索请求的搜索结果，并显示所述搜索结果。
一种用于图片搜索的电子设备，包括：

存储器，用于存储可执行指令；处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至12任一项所述的图片搜索方法。
一种计算机程序产品，包括计算机程序或指令，所述计算机程序或指令被处理器执行时，实现权利要求1至12任一项所述的图片搜索方法。
一种计算机可读存储介质，存储有可执行指令，用于被处理器执行所述可执行指令时，实现权利要求1至12任一项所述的图片搜索方法。