WO2016187888A1

WO2016187888A1 - 基于字符识别的关键词通知方法及设备、计算机程序产品

Info

Publication number: WO2016187888A1
Application number: PCT/CN2015/080127
Authority: WO
Inventors: 周舒畅; 周昕宇; 吴育昕; 姚聪
Original assignee: 北京旷视科技有限公司; 北京小孔科技有限公司
Priority date: 2015-05-28
Filing date: 2015-05-28
Publication date: 2016-12-01
Also published as: CN105518712A; CN105518712B

Abstract

一种基于字符识别的关键词通知方法及设备、以及计算机程序产品，属于信息发现与提示技术领域。所述基于字符识别的关键词通知方法包括：拍摄待识别图像；在所述待识别图像中进行字符识别；以及在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生并输出匹配通知消息。通过预先设定目标关键词，并且基于目标关键词来筛选字符识别结果，从而能够在字符识别结果与目标关键词匹配时向用户提示发现了目标关键词。

Description

基于字符识别的关键词通知方法及设备、计算机程序产品

技术领域

本公开涉及信息发现与提示技术领域，更具体地涉及一种基于字符识别的关键词通知方法及设备、以及计算机程序产品。

背景技术

通过采用光学字符识别(OCR)技术，可以从图像(包括图片和视频)中识别出该图像中包含的字符或文字。目前，OCR技术可以在移动终端上运行，所述移动终端可以包括智能手机、平板电脑、穿戴设备等。随着各种移动终端处理能力的大幅提升，在移动终端上已经能够实时地应用OCR技术，例如在移动终端上可以实现每秒完成一帧图像的光学字符识别(即每秒一帧的实时处理速度)。

通常，在用户发现感兴趣的字符时，该用户使用移动终端(诸如智能手机)拍摄包含该字符的待识别图像，并利用该移动终端上的OCR应用程序对该待识别图像进行光学字符识别。这样的光学字符识别过程显然依赖于用户首先发现目标识别字符，并且用户向该移动终端发出显式指令要求对目标识别字符进行光学字符识别，然而，这样的光学字符识别过程在用户尚未发现感兴趣的字符的情况下无法帮助用户发现感兴趣的字符内容。

因此，需要一种能够帮助用户进行字符发现的技术。

发明内容

鉴于上述问题而提出了本公开。本公开实施例提供了一种基于字符识别的关键词通知方法及设备、以及计算机程序产品，其通过预先设定目标关键词，并且基于目标关键词来筛选字符识别结果，从而能够在字符识别结果与目标关键词匹配时向用户提示发现了目标关键词。

根据本公开实施例的一个方面，提供了一种基于字符识别的关键词通知方法，包括：拍摄待识别图像；在所述待识别图像中进行字符识别；以及在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生并输出匹配通知消息。

根据本公开实施例的另一方面，提供了一种基于字符识别的关键词通知设备，包括：图像采集装置，用于拍摄待识别图像；通知装置，用于输出匹配通知消息；一个或多个处理器；一个或多个存储器；存储在所述存储器中的计算机程序指令，在所述计算机程序指令被所述处理器运行时执行以下步骤：在所述待识别图像中进行字符识别；以及在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生所述匹配通知消息。

根据本公开实施例的又一方面，提供了一种基于字符识别进行关键词通知的计算机程序产品，包括一个或多个计算机可读存储介质，所述计算机可读存储介质上存储了计算机程序指令，所述计算机程序指令在被计算机运行时执行以下步骤：在待识别图像中进行字符识别；以及在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生所述匹配通知消息。

根据本公开实施例的基于字符识别的关键词通知方法及设备、以及计算机程序产品，通过预先设定目标关键词，并且基于目标关键词来筛选字符识别结果，能够在字符识别结果与目标关键词匹配时向用户提示发现了目标关键词。由于在电子终端上可以以例如每秒一帧的实时处理速度对拍摄图像进行光学字符识别，因此在电子终端实时拍摄图像时，电子终端可以实时地对当前拍摄图像进行光学字符识别，并且在光学字符识别结果与目标关键词匹配时可以实时地向用户通知发现了目标关键词，从而将OCR技术有利地用于帮助用户进行字符发现。

本公开的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

通过结合附图对本公开实施例进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解，并且构成说明书的一部分，与本公开实施例一起用于解释本公开，并不构成对本公开的限制。在附图中，相同的参考标号通常代表相同装置或步骤。

图1是用于实现本公开实施例的基于字符识别的关键词通知方法和设备的示例性电子终端的示意性框图；

图2是根据本公开实施例的基于字符识别的关键词通知方法的示意性流程图；

图3是根据本公开实施例的待识别图像的示例；

图4A是根据本公开实施例的待识别图像的另一示例；

图4B是根据本公开实施例的在待识别图像上叠加视频提示的示意图；

图5A是根据本公开实施例的图像区域划分的示意图；

图5B是根据本公开实施例的图像的二维坐标系统的示意图；以及

图6是根据本公开实施例的基于字符识别的关键词通知设备的示意性框图。

具体实施方式

为了使得本公开的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本公开的示例实施例。显然，所描述的实施例仅仅是本公开的一部分实施例，而不是本公开的全部实施例，应理解，本公开不受这里描述的示例实施例的限制。基于本公开中描述的本公开实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本公开的保护范围之内。

首先，参照图1来描述用于实现本公开实施例的基于字符识别的关键词通知方法和设备的示例性电子终端100。

如图1所示，电子终端100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108、以及图像采集装置110，这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子终端100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子终端100也可以具有其他组件和结构。

所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子终端100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述图像采集装置110采集的图像数据、预设(目标)关键词等以及所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。所述指令例如是使用所述电子终端100进行目标关键词发现的指令，或者是使用所述图像采集装置110拍摄待识别图像的指令，或者是启动光学字符识别(OCR)应用程序的指令。

所述输出装置108可以向外部(例如用户)输出各种信息(例如图像、声音或振动)，并且可以包括显示器、扬声器、振动发生器等中的一个或多个。

所述图像采集装置110可以拍摄用户期望的图像(例如照片、视频等)，并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。

优选地，用于实现本公开实施例的基于字符识别的关键词通知方法和设备的示例性电子终端100可以为诸如智能手机、平板电脑、穿戴设备等移动终端。然而，本公开不限于此，电子终端100也可以是固定的电子终端，并且电子终端100中的图像采集装置110可以与处理器102安装在一起，或者可以与处理器102分别安装在距离较远的位置。在此情况下，电子终端100中的图像采集装置110例如可以是安装于广场、会场等场所内。

下面，将以移动设备为例来描述根据本公开实施例的基于字符识别的关键词通知方法及设备。所述移动设备可以包括智能手机、平板电脑、穿戴设备等。

图2是根据本公开实施例的基于字符识别的关键词通知方法的示意性流程图。

如图2所示，在步骤S210，拍摄待识别图像。具体地，可以利用如图1所示的用于实现本公开实施例的基于字符识别的关键词通知方法的电子终端100中的图像采集装置110或者独立于所述电子终端100的可以向所述电子终端100传送图像的其它图像采集装置，在用户所在的位置处拍摄用户选定场景的图像作为待识别图像。

所述待识别图像可以是照片，也可以是视频中的一帧。所述照片可以包括一幅或多幅单一场景的照片，也可以是全景照片。具体地，可以利用所述电子终端中的图像采集装置拍摄用户选定场景的一张照片，或拍摄用户选定场景的一段视频，或者以低于预定移动速度阈值的速度改变所述图像采集装置的拍摄方向或取景范围从而拍摄更大范围的用户选定场景的视频。所述待识别图像可以反应用户所处的环境，并且相应地可以包含用户所处环境中存在的字符，所述字符可以包括但不限于建筑物标识、店铺标识、街道标识、广告牌字符等。

图3示出了在用户所在的位置处拍摄的待识别图像的示例，在该示例中，所述图像是照片，用户位于红星洗衣店附近，该照片包含“红星洗衣店”字符串，并且还包括“理店”、“店”、“十三店”、“Midea”、“美的”等字符串。

图4A示出了在用户所在的位置处拍摄的照片的另一示例，在该示例中，所述图像是照片，用户站在机场的航班信息显示屏前希望找到他即将乘坐的航班CA3856的信息，该照片包含了“航班号”、“计划”、“终点站/经停站”、“柜台号”和“办理等级时间”等字段。

在步骤S220，在所述待识别图像中进行字符识别。在获得所拍摄的待识别图像之后，可以识别所述待识别图像中出现的字符。

可选地，在识别所述待识别图像中的字符之前，可以对所述待识别图像进行预处理，以利于所述字符识别。例如，在所述图像是照片的情况下，所述预处理可以包括对照片进行缩放，在所述图像是视频的情况下，所述预处理可以包括提取视频的关键帧。

根据本公开实施例，从所述待识别图像中识别出的字符可以包括至少一个字符，并且字符识别结果可以包括所述至少一个字符以及每个字符的位置。例如，在如图3所示的待识别图像中，从所述待识别图像可以识别出“红”、“星”、“洗”、“衣”、“店”、“理”、“店”、“十”、“三”、“店”、“M”、“i”、“d”、“e”、“a”、“美”、“的”等字符。

更进一步，对于所述字符识别结果中的所述至少一个字符，可以将其按照行或列的顺序组织为字符串。具体地，在对所述待识别图像进行字符识别时，可以按照所述至少一个字符中每个字符在所述待识别图像中的位置，将所述至少一个字符进行组合以形成至少一个字符串。例如，可以根据包含在所述字符识别结果中的所述至少一个字符中每个字符的位置，将所述至少一个字符排列成一行或多行，然后将所述字符按照行的顺序组织为至少一个字符串；或者，可以根据包含在所述字符识别结果中的所述至少一个字符中每个字符的位置，将所述至少一个字符排列成一列或多列，然后将所述字符按照列的顺序组织为至少一个字符串。在本公开实施例中，可以根据用户所在国家和/或地区的书写习惯，确定应当将所识别的至少一个字符排列成行还是列。在此情况下，根据本公开实施例，从所述待识别图像中识别出的字符串可以包括至少一个字符串，并且字符串识别结果可以包括所述至少一个字符串以及每个字符串的位置。仍针对如图3所示的待识别图像，可以识别出“红星洗衣店”、“理店”、“店”、“十三店”、“Midea”、“美的”等字符串。

具体地，可以使用光学字符识别(OCR)技术来识别所述待识别图像中的字符。可以扫描所述待识别图像以检测所述待识别图像中所有可能含有字符的字符框的位置，然后可以识别每个字符框中的字符并将每个字符框中的内容作为一个字符串，并且产生字符串识别结果。所述字符串识别结果可以包括所识别的字符串以及所述字符串的位置。

例如，可以将所述待识别图像划分为如图5A所示的9个块，并且可以采用数值1－9来表示所述字符串的位置，“1”表示所述字符串位于所述待识别图像的左上块中，“2”表示所述字符串位于所述待识别图像的中上块中，“3”表示所述字符串位于所述待识别图像的右上块中，依此类推。当然，根据实际需要，可以将所述待识别图像划分为更少或更多块，例如4块、16块等。

再例如，可以以所述待识别图像的中心点、左上顶点、左下顶点、右上顶点、右下顶点之一为原点建立二维坐标系，并且对于每个像素点而言，以该像素点与所述原点之间的像素点数量作为该像素点的二维坐标值。

光学字符识别(OCR)技术已经是本领域中公知的技术，在本公开中不对现有的OCR技术展开描述。此外，应了解，本公开实施例不限于采用现有的OCR技术进行字符识别，而且应涵盖采用将来开发的字符识别技术进行字符识别并继而进行关键词通知的任何应用。

可选地，还可以分析所述字符串识别结果中的每个字符串，以确定一个或多个具有具体含义的词语。具体地，可以使用本领域公知的方法对所述字符串进行分析，并且对所述字符串进行分词，从而将所述字符串划分为一个或多个具有具体含义的词语。对所述字符串进行分析和分词的方法是本领域公知的，在这里为了简单起见而省略其详细描述。在图3所示的示例中，通过上述分析和分词操作，例如可以将“红星洗衣店”字符串划分为以下词语“红星”、“洗衣”、“店”、“洗衣店”等子字符串。

在步骤S230，判断从所述待识别图像中识别出的字符与预设关键词是否匹配。所述预设关键词可以包括至少一个预设关键词。具体地，判断从所述待识别图像中识别出的字符串与所述至少一个预设关键词之一是否匹配。

具体地，可以预先设置匹配程度阈值，对于所述至少一个字符串中的每个字符串而言，确定该字符串与所述至少一个预设关键词之一的匹配程度，以及在所述匹配程度高于匹配程度阈值时确定该字符串与所述预设关键词匹配。例如，在该字符串完全包含某个预设关键词的情况下，可以确定该字符串与所述预设关键词完全匹配。

例如，一个预设关键词为“洗衣店”，在如图3所示的待识别图像中识别出的字符串包括“红星洗衣店”，因此识别出的字符串“红星洗衣店”完全包含预设关键词“洗衣店”，可以确定该字符串与该预设关键词匹配。在此情况下，可以将该字符串“红星洗衣店”在所述待识别图像中的位置作为向用户提示的字符串位置。

可选地，如上所述，在将如图3所示的待识别图像中识别出的字符串“红星洗衣店”划分为“红星”、“洗衣”、“洗衣店”子字符串的情况下，“洗衣店”子字符串与预设关键词“洗衣店”完全匹配。在此情况下，可以将该字符串“洗衣店”在所述待识别图像中的位置作为向用户提示的字符串位置。

再例如，一个预设关键词为“红星干洗店”，匹配程度阈值为60％，在如图3所示的待识别图像中识别出的字符串包括“红星洗衣店”，识别出的字符串“红星洗衣店”与预设关键词“红星干洗店”不能完全匹配，可以例如可以计算其匹配程度为70％或80％，该匹配程度高于所述匹配程度阈值60％，则可以确定该字符串与该预设关键词匹配。在此情况下，可以将该字符串“红星洗衣店”在所述待识别图像中的位置作为向用户提示的字符串位置。

再例如，一个预设关键词为“CA3856”。在如图4A所示的待识别图像中存在字符串“CA3856”。然而，由于字符识别算法的错误将所述待识别图像中的“CA3856”识别为字符串“CA5856”，所识别到的字符串“CA5856”与所述预设关键词“CA3856”没有完全匹配，例如根据预定的匹配程度计算算法确定所识别到的字符串“CA5856”与所述预设关键词“CA3856”之间的匹配程度为85％。在将匹配程度阈值设置为100％时，根据本公开实施例的基于字符识别的关键词通知方法确定所识别到的字符串与所述预设关键词不匹配；在将匹配程度设置为80％时，根据本公开实施例的基于字符识别的关键词通知方法可以确定所识别到的字符串与所述预设关键词匹配。

因此，可以权衡字符识别精度以及误报率来设置所述匹配程度阈值。所述匹配程度阈值越高，所要求的字符识别精度越高但误报率越低；所述匹配程度阈值越低，误报率越高但所要求的字符识别精度越低。例如，在如图4A所示的待识别图像中，一个预设关键词为“CA3856”，预设的匹配程度阈值为50％，图4A中的字符串“CA3856”和“CA3448”都可能被确定为与预设关键词匹配，这显然提高了误报率。

可选地，可以计算该字符串与所述至少一个预设关键词之一的编辑距离(edit distance)，以及在所述编辑距离低于预定编辑距离阈值时确定该字符串与所述预设关键词匹配。编辑距离可以表示由第一字符串转成第二字符串所需的最少编辑操作次数，许可的编辑操作例如可以包括将第一字符串中的一个字符替换成另一个字符，在第一字符串中插入一个字符，以及在第一字符串中删除一个字符。在此情况下，在该字符串与所述至少一个关键词之一的编辑距离为零时，匹配程度为完全匹配；而该字符串与所述至少一个关键词之一的编辑距离越大，匹配程度越小。

可以根据需要设置所述预定编辑距离阈值。例如，可以权衡字符识别精度以及误报率来设置所述预定编辑距离阈值。所述预定编辑距离阈值越高，所要求的字符识别精度越低但误报率越高；所述预定编辑距离阈值越低，误报率越低但所要求的字符识别精度越高。具体地，在将所述预定编辑距离阈值设置为0时，表示要求完全匹配，从而降低误报率，在此情况下，如果字符识别有误，则无法向用户发出提醒；在将所述预定编辑距离阈值设置为1时，表示该字符串与特定关键词可以有一个字符的区别，例如比特定关键词多一个字符、少一个字符或者有一个字符不同。

例如，一个预设关键词为“CA3856”。在如图4A所示的待识别图像中存在字符串“CA3856”。然而，由于字符识别算法的错误将字符串“CA3856”识别为“CA5856”，所识别到的字符串“CA5856”与所述预设关键词“CA3856”没有完全匹配。具体地，所识别到的字符串“CA5856”与所述预设关键词“CA3856”有一个字符不同并且例如根据预定的编辑距离计算算法计算得到其编辑距离为1。在所述预定编辑距离阈值被设置为0时，则确定所识别到的字符串“CA5856”与所述预设关键词“CA3856”不匹配；而在将所述预定编辑距离阈值设置为1或者大于1时，可以确定识别到的字符串“CA5856”与目标关键词“CA3856”匹配。

在步骤S240，在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生并输出匹配通知消息。可以以视觉信息、音频信息、触觉信息等来输出匹配通知消息。

所述匹配通知消息可以指示在所述待识别图像中发现了与所述预设关键词匹配的字符。例如，在所识别出的字符与预设关键词匹配的情况下，所述电子终端可以产生振动，用户感知振动，由此可以确定在当前拍摄图像中存在与预设关键词匹配的字符。替代地，在所识别出的字符与预设关键词匹配的情况下，所述电子终端可以输出音频，以向用户通知在当前拍摄图像中存在与预设关键词匹配的字符。替代地，在所识别出的字符与预设关键词匹配的情况下，所述电子终端可以在其显示屏幕上输出视频信息，例如图像闪烁、警报标识、警报标识闪烁等，以向用户通知在当前拍摄图像中存在与预设关键词匹配的字符。

可选地，所述匹配通知消息不仅可以指示在所述待识别图像中发现了与所述预设关键词匹配的字符，而且还更进一步指示所发现的与所述预设关键词匹配的字符在所述待识别图像中的位置。例如，在所识别出的字符与预设关键词匹配的情况下，所述电子终端可以输出音频，以向用户提示所发现的与所述预设关键词匹配的字符在所识别的图像中的位置。替代地，在所识别出的字符与预设关键词匹配的情况下，所述电子终端可以输出视频提示，以向用户提示所发现的与所述预设关键词匹配的字符在所述待识别图像中的位置。可选地，所述视频提示可以叠加在所识别的图像上显示。

如前所述，可以以图5A中的图像块的方式来指示所发现的与所述预设关键词匹配的字符串在所述待识别图像中的位置，或者可以以二维坐标方式确定所发现的与所述预设关键词匹配的字符串在所述待识别图像中的位置。

如图4B所示，所述视频指示可以为方框，该方框叠加在所述图像上以标识出所发现的与所述预设关键词匹配的字符在所述图像中的位置。

例如，在所述移动设备为智能手机和平板电脑的情况下，可以通过其内置的图像采集装置实时地拍摄所述待识别图像，并且可以实时地在所述移动设备的显示屏上在与所述预设关键词匹配的字符串在所述待识别图像中的位置处或附近将所述视频指示叠加在当前拍摄图像(即所述待识别图像)上显示；在所述移动设备为眼镜式穿戴设备的情况下，可以通过所述眼镜式穿戴设备中的图像采集装置实时地拍摄所述待识别图像，并且可以实时地在所述眼镜式穿戴设备的增强现实显示镜片上在与所述预设关键词匹配的字符串在所述待识别图像中的位置处或附近显示所述视频指示，从而通过增强现实技术来向用户进行关键词通知。

根据本公开实施例，通过实时地拍摄待识别图像，实时地对所述待识别图像进行字符识别，并且在所述待识别图像中发现了目标关键词的情况下实时地向用户进行通知。因此，根据本公开实施例的基于字符识别的关键词通知方法基于实时地拍摄的待识别图像，能够实时地进行目标关键词发现与通知。

返回图2，可选地，在步骤S250，可以接收对于所述匹配通知消息的用户反馈。所述用户反馈可以包括忽略所述匹配通知消息，减小匹配程度匹配阈值，增大匹配程度匹配阈值，增加预设关键词、修改某个预设关键词、删除某个预设关键词、或者过滤某个预设关键词。

然后，在步骤S260，根据所述用户反馈，可以实时地调节预设关键词以及/或者用于匹配判断的参数。其中，所述调节所述预设关键词可以包括改变预设关键词列表，并且所述改变预设关键词列表可以包括增加预设关键词、修改某个预设关键词、或者删除某个预设关键词。此外，所述调节所述预设关键词还可以包括实时地过滤在产生所述匹配通知消息时匹配判断所使用的预设关键词。所述用户匹配判断的参数可以包括所述匹配程度阈值、或者所述编辑距离阈值。

在图2中用虚线示出步骤S250和S260以便表示其与步骤S210－S240之间的区别，步骤S210－S240是根据本公开实施例的基于字符识别的关键词通知方法的必须步骤，而步骤S250和S260则是可选步骤。

下面，将参考图6描述根据本公开实施例的基于字符识别的关键词通知设备。该关键词通知设备可以是用户携带的移动设备，并且可以执行上述方法。由于该关键词通知设备执行的各个操作的细节与在上文中针对图2描述的方法基本相同，因此为了避免重复，在下文中仅对所述关键词通知设备进行简要的描述，而省略对相同细节的描述。

如图6所示，根据本公开实施例的基于字符识别的关键词通知设备600包括图像采集装置610、字符识别装置620、关键词匹配装置630、通知装置640、以及存储装置650。图像采集装置610可以由图1所示的图像采集装置110实现，所述字符识别装置620以及关键词匹配装置630可以由图1所示的处理器102实现，并且所述通知装置640的一部分也可以由图1所述处理器102实现，所述存储装置650可以由图1所示的存储装置104实现。

所述图像采集装置610可以拍摄待识别图像，具体地可以用于在用户所在的位置处拍摄用户选定场景的作为待识别图像。如上文所述，所述待识别图像可以是照片，也可以是视频中的一帧。所述照片可以包括一幅或多幅单一场景的照片，也可以是全景照片。具体地，所述图像采集装置510可以拍摄用户选定场景的一张照片，或拍摄用户选定场景的一段视频，或者以低于预定移动速度阈值的速度改变所述图像采集装置的拍摄方向或取景范围从而拍摄更大范围的用户选定场景的视频。所述待识别图像可以反应用户所处的环境，并且相应地可以包含用户所处环境中存在的字符，所述字符可以包括但不限于建筑物标识、店铺标识、街道标识、广告牌字符等。当然，也可以利用其它拍摄设备拍摄所述待识别图像，并且将拍摄的图像发送给所述关键词通知设备600，在此情况下，可以省略图像采集设备610。

字符识别装置620可以对所拍摄的待识别图像进行字符识别，以识别出所述待识别图像中的字符。可选地，所述字符识别装置520在对所述待识别图像进行字符识别之前，可以对所述待识别图像进行预处理，以利于所述字符识别。例如，在所述图像是照片的情况下，所述预处理可以包括对照片进行缩放，在所述图像是视频的情况下，所述预处理可以包括提取视频的关键帧。

根据本公开实施例，从所述待识别图像中识别出的字符可以包括至少一个字符，并且字符识别结果可以包括所述至少一个字符以及每个字符的位置。对于所述字符识别结果中的所述至少一个字符，可以将其按照行或列的顺序组织为字符串。具体地，在对所述待识别图像进行字符识别时，可以按照所述至少一个字符中每个字符在所述待识别图像中的位置，将所述至少一个字符进行组合以形成至少一个字符串。例如，可以根据包含在所述字符识别结果中的所述至少一个字符中每个字符的位置，将所述至少一个字符排列成一行或多行，然后将所述字符按照行的顺序组织为至少一个字符串；或者，可以根据包含在所述字符识别结果中的所述至少一个字符中每个字符的位置，将所述至少一个字符排列成一列或多列，然后将所述字符按照列的顺序组织为至少一个字符串。根据本公开实施例，从所述待识别图像中识别出的字符串可以包括至少一个字符串，并且字符串识别结果可以包括所述至少一个字符串以及每个字符串的位置。

具体地，在本公开实施例中，所述字符识别装置620可以使用光学字符识别(OCR)技术来识别所述待识别图像中的字符。具体地，所述字符识别装置620可以扫描所述待识别图像以检测所述待识别图像中所有可能含有字符的字符框的位置，然后可以识别每个字符框中的字符并将每个字符框中的内容作为一个字符串，并且产生字符串识别结果。如上文所述，所述字符串识别结果可以包括所识别的字符串以及所述字符串的位置。

可选地，所述字符识别装置620还可以分析所述字符串识别结果中的每个字符串，以确定一个或多个具有具体含义的词语。具体地，可以使用本领域公知的方法对所述字符串进行分析，并且对所述字符串进行分词，从而将所述字符串划分为一个或多个具有具体含义的词语。

所述关键词匹配装置630可以判断从所述待识别图像中识别出的字符与预设关键词是否匹配。所述预设关键词可以包括至少一个预设关键词。具体地，对于所述字符识别装置620识别出的至少一个字符串中的每个字符串，所述关键词匹配装置630可以判断该字符串是否与所述至少一个预设关键词之一匹配，并且在判断该字符串与所述至少一个预设关键词之一匹配的情况下，确定该字符串与所述预设关键词匹配。

可选地，可以预先设置匹配程度阈值，在一个字符串与一个预设关键词之间的匹配程度高于该匹配程度阈值时，确定该字符串与所述预设关键词匹配。具体地，对于所述字符识别装置620识别出的至少一个字符串中的每个字符串，所述关键词匹配装置630可以计算该字符串与所述至少一个预设关键词之一的匹配程度，并且在所述匹配程度高于所述匹配程度阈值的情况下，确定该字符串与所述预设关键词匹配。可以根据需要设置所述匹配程度阈值。例如，可以权衡字符识别精度以及误报率来设置所述匹配程度阈值。所述匹配程度阈值越高，所要求的字符识别精度越高但误报率越低；所述匹配程度阈值越低，误报率越高但所要求的字符识别精度越低。

可选地，可以预先设置编程距离阈值，可以计算该字符串与所述至少一个预设关键词之一的编辑距离，以及在所述编辑距离低于所述编辑距离阈值时确定该字符串与所述预设关键词匹配。可以根据需要设置所述预定编辑距离阈值。例如，可以权衡字符识别精度以及误报率来设置所述预定编辑距离阈值。所述预定编辑距离阈值越高，所要求的字符识别精度越低但误报率越高；所述预定编辑距离阈值越低，误报率越低但所要求的字符识别精度越高。

通知装置640用于在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生并输出匹配通知消息。可以以视觉信息、音频信息、触觉信息等来输出匹配通知消息。

所述匹配通知消息可以指示在所述待识别图像中发现了与所述预设关键词匹配的字符。例如，所述通知装置640可以为振动装置，其在所识别出的字符与预设关键词匹配的情况下可以产生振动，用户感知振动，由此可以确定在当前拍摄图像中存在与预设关键词匹配的字符。替代地，所述通知装置640可以为语音交互装置(包括音频输出装置)，其在所识别出的字符与预设关键词匹配的情况下可以输出音频，以向用户通知在当前拍摄图像中存在与预设关键词匹配的字符。替代地，所述通知装置640可以为显示装置，其在所识别出的字符与预设关键词匹配的情况下显示视频提示信息，例如在显示装置上显示的所述待识别图像闪烁、警报标识、警报标识闪烁等，以向用户通知在当前拍摄图像中存在与预设关键词匹配的字符。

可选地，所述匹配通知消息不仅可以指示在所述待识别图像中发现了与所述预设关键词匹配的字符，而且还更进一步指示所发现的与所述预设关键词匹配的字符在所述待识别图像中的位置。例如，所述通知装置540可以为音频输出装置，其在所识别出的字符与预设关键词匹配的情况下可以输出音频，以向用户提示所发现的与所述预设关键词匹配的字符在所识别的图像中的位置。替代地，所述通知装置640可以为显示装置，其在所识别出的字符与预设关键词匹配的情况下显示视频提示信息，以向用户提示所发现的与所述预设关键词匹配的字符在所述待识别图像中的位置。可选地，所述视频提示信息可以叠加在所识别的图像上显示。

根据本公开实施例，所述关键词通知设备为穿戴设备，所述图像采集装置实时地拍摄所述待识别图像；以及所述通知装置实时地输出所述匹配通知消息。

例如，在所述基于字符识别的关键词通知设备600为智能手机和平板电脑的情况下，可以通过其内置的图像采集装置实时地拍摄所述待识别图像，并且可以实时地在所述移动设备的显示屏上在与所述预设关键词匹配的字符串在所述待识别图像中的位置处或附近将所述视频指示叠加在当前拍摄图像(即所述待识别图像)上显示；在所述基于字符识别的关键词通知设备600为眼镜式穿戴设备的情况下，所述通知装置650可以为所述眼镜式穿戴设备中的增强现实显示镜片，可以通过所述眼镜式穿戴设备中的图像采集装置实时地拍摄所述待识别图像，并且可以实时地在所述眼镜式穿戴设备的增强现实显示镜片上在与所述预设关键词匹配的字符串在所述待识别图像中的位置处或附近显示所述视频指示，从而通过增强现实技术来向用户进行关键词通知。

所述存储装置650用于存储所述预设关键词以及所述待识别图像，并且还可以存储所述匹配程度阈值和/或所述编辑距离阈值。此外，所述存储装置650还用于存储用于实现根据本公开实施例的基于字符识别的关键词通知的方法的计算机程序代码。

此外，根据本公开实施例的基于字符识别的关键词通知设备600还可以包括反馈装置(未示出)，用于接收对于所述匹配通知消息的用户反馈。所述用户反馈可以包括忽略所述匹配通知消息，减小匹配程度匹配阈值，增大匹配程度匹配阈值，增加预设关键词、修改某个预设关键词、删除某个预设关键词、或者过滤某个预设关键词。所述反馈设备可以是触摸检测装置、语音检测装置等。所述语音检测装置和所述语音输出装置可以集成在一起并且通称为语音交互装置，所述触摸检测装置和所述显示装置也可以集成在一起并且通称为视频交互装置。

此外，根据本公开实施例的基于字符识别的关键词通知设备600还可以包括调节装置(未示出)，用于根据所述用户反馈，可以实时地调节所述预设关键词以及/或者用于匹配判断的参数。其中，所述调节所述预设关键词可以包括改变预设关键词列表，并且所述改变预设关键词列表可以包括增加预设关键词、修改某个预设关键词、或者删除某个预设关键词。此外，所述调节所述预设关键词还可以包括实时地过滤在产生所述匹配通知消息时匹配判断所使用的预设关键词。所述用户匹配判断的参数可以包括所述匹配程度阈值、或者所述编辑距离阈值。

此外，根据本公开实施例，还提供了一种计算机程序产品，其包括计算机可读存储介质，在所述计算机可读存储介质上存储了计算机程序指令。所述计算机程序指令在被计算机运行时可以实现根据本公开实施例的基于字符识别的关键词通知方法，并且/或者可以实现根据本公开实施例的基于字符识别的关键词通知设备中的字符识别装置、关键词匹配装置、通知装置、调节装置的全部或部分功能。

根据本公开实施例的基于字符识别的关键词通知方法及设备、以及计算机程序产品，通过预先设定目标关键词，并且基于目标关键词来筛选字符识别结果，能够在光学字符识别结果与目标关键词匹配时向用户提示发现了目标关键词。由于在电子终端上可以以例如每秒一帧的实时处理速度对拍摄图像进行光学字符识别，因此在电子终端实时拍摄图像时，电子终端可以实时地对当前拍摄图像进行光学字符识别，并且在光学字符识别结果与目标关键词匹配时可以实时地向用户通知发现了目标关键词，从而将OCR技术有利地用于帮助用户进行字符发现。

在上面详细描述的本公开的示例实施例仅仅是说明性的，而不是限制性的。本领域技术人员应该理解，在不脱离本公开的原理和精神的情况下，可对这些实施例进行各种修改，组合或子组合，并且这样的修改应落入本公开的范围内。

Claims

一种基于字符识别的关键词通知方法，包括：

拍摄待识别图像；

在所述待识别图像中进行字符识别；以及

在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生并输出匹配通知消息。
如权利要求1所述的关键词通知方法，其中，

通过穿戴设备中的图像采集装置实时地拍摄所述待识别图像；以及

通过穿戴设备中的通知装置实时地输出所述匹配通知消息。
如权利要求2所述的关键词通知方法，其中，从所述待识别图像中识别出的字符包括至少一个字符，

其中，在所述待识别图像中进行字符识别包括：按照所述至少一个字符中每个字符在所述待识别图像中的位置，将所述至少一个字符进行组合以形成至少一个字符串；以及

其中，在从所述待识别图像中识别出的字符与预设关键词匹配的情况下产生并输出匹配通知消息包括：对于所述至少一个字符串中的每个字符串，确定该字符串与所述预设关键词是否匹配，并且在该字符串与所述预设关键词匹配的情况下，产生并输出匹配通知消息。
如权利要求3所述的关键词通知方法，其中，所述预设关键词包括至少一个关键词，

其中，确定该字符串与所述预设关键词是否匹配包括：确定该字符串与所述至少一个关键词中之一的匹配程度，以及在所述匹配程度高于预定匹配程度阈值时确定该字符串与所述预设关键词匹配。
如权利要求4所述的关键词通知方法，其中，确定该字符串与所述至少一个关键词中之一的匹配程度，以及在所述匹配程度高于预定匹配程度阈值时确定该字符串与所述预设关键词匹配包括：

计算该字符串与所述至少一个关键词中之一的编辑距离；以及

在所述编辑距离低于预定编辑距离阈值时确定该字符串与所述预设关键词匹配，

其中，在该字符串与所述至少一个关键词之一的编辑距离为零时，匹配程度为完全匹配；而该字符串与所述至少一个关键词之一的编辑距离越大，匹配程度越小。
如权利要求5所述的关键词通知方法，其中，所述穿戴设备为眼镜式穿戴设备，并且所述通知装置为所述眼镜式穿戴设备中的增强现实显示镜片，

其中，通过所述增强现实显示镜片实时地输出所述匹配通知消息，所述匹配通知消息指示与所述预设关键词匹配的字符串在所述待识别图像中的位置。
如权利要求5所述的关键词通知方法，其中，所述匹配通知装置为所述穿戴设备中的语音交互装置，

其中，通过所述语音交互装置实时地输出所述匹配通知消息，所述匹配通知消息指示与所述预设关键词匹配的字符串在所述待识别图像中的位置。
如权利要求4所述的关键词通知方法，还包括：

接收对于所述匹配通知消息的用户反馈；以及

根据所述用户反馈，实时地调节所述预设关键词以及/或者用于匹配判断的参数。
一种基于光学字符识别的关键词通知设备，包括：

图像采集装置，用于拍摄待识别图像；

通知装置，用于输出匹配通知消息；

一个或多个处理器；

一个或多个存储器；以及

存储在所述存储器中的计算机程序指令，在所述计算机程序指令被所述处理器运行时执行以下步骤：

在所述待识别图像中进行字符识别；以及

在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生所述匹配通知消息。
如权利要求9所述的关键词通知设备，其中，所述关键词通知设备为穿戴设备，其中，

所述图像采集装置实时地拍摄所述待识别图像；以及

所述通知装置实时地输出所述匹配通知消息。
如权利要求10所述的关键词通知设备，其中，从所述待识别图像中识别出的字符包括至少一个字符，

其中，在所述待识别图像中进行字符识别包括：按照所述至少一个字符中每个字符在所述待识别图像中的位置，将所述至少一个字符进行组合以形成至少一个字符串；以及

其中，在从所述待识别图像中识别出的字符与预设关键词匹配的情况下产生匹配通知消息包括：对于所述至少一个字符串中的每个字符串，确定该字符串与所述预设关键词是否匹配，并且在该字符串与所述预设关键词匹配的情况下，产生匹配通知消息。
如权利要求11所述的关键词通知设备，其中，所述预设关键词包括至少一个关键词，

其中，确定该字符串与所述预设关键词是否匹配包括：确定该字符串与所述至少一个关键词中之一的匹配程度，以及在所述匹配程度高于预定匹配程度阈值时确定该字符串与所述预设关键词匹配。
如权利要求12所述的关键词通知设备，其中，确定该字符串与所述至少一个关键词中之一的匹配程度，以及在所述匹配程度高于预定匹配程度阈值时确定该字符串与所述预设关键词匹配包括：

计算该字符串与所述至少一个关键词中之一的编辑距离；以及

在所述编辑距离低于预定编辑距离阈值时确定该字符串与所述预设关键词匹配，

其中，在该字符串与所述至少一个关键词之一的编辑距离为零时，匹配程度为完全匹配；而该字符串与所述至少一个关键词之一的编辑距离越大，匹配程度越小。
如权利要求13所述的关键词通知设备，其中，所述穿戴设备为眼镜式穿戴设备，并且所述通知装置为所述眼镜式穿戴设备中的增强现实显示镜片，

其中，通过所述增强现实显示镜片实时地输出所述匹配通知消息，所述匹配通知消息指示与所述预设关键词匹配的字符串在所述待识别图像中的位置。
如权利要求13所述的关键词通知设备，其中，所述匹配通知装置为所述穿戴设备中的语音交互装置，

其中，通过所述语音交互装置实时地输出所述匹配通知消息，所述匹配通知消息指示与所述预设关键词匹配的字符串在所述待识别图像中的位置。
如权利要求12所述的关键词通知设备，还包括：

反馈装置，用于接收对于所述匹配通知消息的用户反馈；以及

调节装置，用于根据所述用户反馈，实时地调节所述预设关键词以及/或者用于匹配判断的参数。
一种用于基于字符识别进行关键词通知的计算机程序产品，包括一个或多个计算机可读存储介质，所述计算机可读存储介质上存储了计算机程序指令，所述计算机程序指令可由处理器执行以使得所述处理器：

在待识别图像中进行字符识别；以及

在从所述待识别图像中识别出的字符与预设关键词匹配的情况下，产生所述匹配通知消息。
如权利要求17所述的计算机程序产品，其中，所述待识别图像是由眼镜式穿戴设备的图像采集装置实时地拍摄的，所述匹配通知消息由眼镜式穿戴设备中的增强现实显示镜片实时地在与所述预设关键词匹配的字符串在所述待识别图像中的位置处或附近显示。
如权利要求17所述的计算机程序产品，其中，从所述待识别图像中识别出的字符包括至少一个字符，所述预设关键词包括至少一个关键词，

其中，在所述待识别图像中进行字符识别包括：按照所述至少一个字符中每个字符在所述待识别图像中的位置，将所述至少一个字符进行组合以形成至少一个字符串；以及

其中，在从所述待识别图像中识别出的字符与预设关键词匹配的情况下产生匹配通知消息包括：对于所述至少一个字符串中的每个字符串，确定该字符串与所述至少一个关键词中之一的匹配程度，以及在所述匹配程度高于预定匹配程度阈值时确定该字符串与所述预设关键词匹配，并且产生匹配通知消息。
如权利要求19所述的计算机程序产品，其中，所述计算机程序指令可由处理器执行还使得所述处理器：

从反馈装置接收对于所述匹配通知消息的用户反馈；以及

根据所述用户反馈，实时地调节所述预设关键词以及/或者用于匹配判断的参数。