CN108038427A

CN108038427A - 一种文字识别方法及移动终端

Info

Publication number: CN108038427A
Application number: CN201711228672.8A
Authority: CN
Inventors: 张哲楠; 何舒林
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2017-11-29
Filing date: 2017-11-29
Publication date: 2018-05-15
Anticipated expiration: 2037-11-29
Also published as: CN108038427B

Abstract

本发明提供一种文字识别方法及移动终端，该方法包括：提取第一图像的第一文字特征及第一地理位置信息；从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合，所述信息集合包括至少一个信息子集合，所述信息子集合包括文字特征及与所述文字特征对应的文本信息，所述第一信息子集合为所述至少一个信息子集合中的一个；从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。本发明提供的文字识别方法，能够根据图像的地理位置信息及文字特征，从信息集合中准确地匹配出图像中的文本信息，提高文字识别的准确度。

Description

一种文字识别方法及移动终端

技术领域

本发明涉及通信技术领域，尤其涉及一种文字识别方法及移动终端。

背景技术

现有的文字识别(Optical Character Recognition，OCR)技术主要包括以下步骤：电子设备获取图像文件，对获取的图像文件进行分析预处理，获取图像文件中的文字及版面信息。目前OCR技术虽然能够提供多种文字识别方式，但是由于文本的字体形式多种多样，并不都是方方正正的印刷字体，在很多情况下，不能准确识别出图像文件中文字信息。可见，现有文字识别技术中存在文字识别的准确度比较低的问题。

发明内容

本发明实施例提供一种文字识别方法及移动终端，以解决现有文字识别技术中存在文字识别的准确度比较低的问题。

为解决上述技术问题，本发明是这样实现的：

第一方面，本发明实施例提供了一种文字识别方法，包括：

提取第一图像的第一文字特征及第一地理位置信息；

从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合，所述信息集合包括至少一个信息子集合，所述信息子集合包括文字特征及与所述文字特征对应的文本信息，所述第一信息子集合为所述至少一个信息子集合中的一个；

从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。

第二方面，本发明实施例还提供一种移动终端，包括：

第一提取模块，用于提取第一图像的第一文字特征及第一地理位置信息；

第一确定模块，用于从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合，所述信息集合包括至少一信息子集合，所述信息子集合包括文字特征及与所述文字特征对应的文本信息，所述第一信息子集合为所述至少一个信息子集合中的一个；

第二确定模块，用于从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。

在本发明实施例中，提取第一图像的第一文字特征及第一地理位置信息；从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合，所述信息集合包括至少一个信息子集合，所述信息子集合包括文字特征及与所述文字特征对应的文本信息，所述第一信息子集合为所述至少一个信息子集合中的一个；从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。这样，移动终端能够根据图像的地理位置信息及文字特征，从信息集合中准确地匹配出图像中的文本信息，提高文字识别的准确度。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的文字识别方法的流程图之一；

图2是本发明实施例提供的文字识别方法的流程图之二；

图3是本发明实施例提供的移动终端的结构图之一；

图4是本发明实施例提供的移动终端的结构图之二；

图5是本发明实施例提供的移动终端的结构图之三；

图6是本发明实施例提供的移动终端的结构图之四；

图7是本发明实施例提供的移动终端的结构图之五；

图8是本发明实施例提供的移动终端中第六确定模块的结构图；

图9是本发明实施例提供的移动终端的结构图之六。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明实施例提供的文字识别方法的流程图，所述文字识别方法可以应用于移动终端，如图1所示，包括以下步骤：

步骤101、提取第一图像的第一文字特征及第一地理位置信息。

在本发明实施例中，所述第一图像可以为用户通过移动终端的摄像头拍摄的图像，也可以为用户从网络下载的图像。所述第一图像中的文字形式可以为标准形式的文字，也可以为非标准形式的文字，例如，第一图像中的文字为草书形式的汉字。所述第一文字特征为所述第一图像中的文字所具有的形状特征，举例来说，所述第一文字特征包括第一图像中文字所具有的笔画粗细、笔画顺序、文字轮廓中的至少一种。

在本发明实施例中，所述第一地理位置信息为拍摄所述第一图像的地点信息，举例来说，若第一图像中标注有拍摄地点信息，则可以提取第一图像中的拍摄地点信息作为所述第一地理位置信息，若第一图像中未标注拍摄地点，则可以提取第一图像中的景物图像特征，根据景物图像特征确定拍摄第一图像的拍摄地点信息，将确定的拍摄地点信息作为所述第一地理位置信息。

步骤102、从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合。

在本发明实施例中，所述信息集合包括至少一信息子集合，所述信息子集合和地理位置信息之间存在对应关系，根据所述信息子集合和地理位置信息之间的对应关系，可以确定与所述第一地理位置信息匹配的第一信息子集合，所述第一信息子集合为所述至少一个信息子集合中的一个。所述信息集合可以为文本信息集合，所述信息子集合可以为文本信息子集合。

举例来说，所述信息集合包括信息子集合A及信息子集合B，第一寺庙位置信息与信息子集合A对应，第一公园位置信息与信息子集合B对应，若第一地理位置信息为第一公园位置信息，则确定第一信息子集合为信息子集合B。

在本发明实施例中，所述信息子集合包括文字特征及与对所述文字特征标注的文本信息。例如，信息子集合A中的文字特征包括粗笔画、细笔画、汉字草书顺序等，在信息子集合A中包括对粗笔画的文字特征标注的文本信息“中国”，对细笔画的文字特征标注的文本信息“北京”，对汉字草书顺序的文字特征标注的文本信息“上海”。

步骤103、从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。

在本发明实施例中，所述第一信息子集合包括文字特征及与对所述文字特征标注的文本信息，根据文字特征与文本信息之间的对应关系，可以确定与第一文字特征匹配的第一文本信息。

举例来说，第一信息子集合包括粗笔画、细笔画、汉字草书顺序等文本特征，对粗笔画的文字特征标注的文本信息为“公园”，对细笔画的文字特征标注的文本信息为“寺庙”，对汉字草书顺序的文字特征标注的文本信息为“学校”，若第一文字特征为汉字草书顺序，则从第一信息子集合中，确定与第一文字特征匹配的第一文本信息为“学校”。

本发明实施例中，上述移动终端可以任何包括双摄像头的移动终端，例如：手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)、个人数字助理(personal digital assistant，简称PDA)、移动上网装置(Mobile Internet Device，MID)或可穿戴式设备(Wearable Device)等。

本发明实施例的文字识别方法，通过提取第一图像的第一文字特征及第一地理位置信息；从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合；从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。这样，移动终端能够根据图像的地理位置信息及文字特征，从信息集合中准确地匹配出图像中的文本信息，提高文字识别的准确度。

参见图2，图2是本发明实施例提供的文字识别方法的流程图，所述文字识别方法可以应用于移动终端。如图2所示，包括以下步骤：

步骤201、提取至少一张图像中的每一张图像的地理位置信息，及所述每一张图像中的至少一文字特征。

在本发明实施例中，可以从网络收集一张以上的图像，也可以通过摄像拍摄一张以上的图像。所述每一张图像包括文字，图像中的文字具有笔画粗细、笔画顺序及文字轮廓等至少一种文字特征，例如，至少一张图像包括图像C、图像D及图像F等，图像C中具有草书顺序文字特征的文字为“中国”，图像C中具有粗笔画文字特征的文字为“北京”，图像C中具有细笔画文字特征的文字为“上海”。可以根据图像中标注的拍摄地点提取对应的地理位置信息，例如，图像C中标注的拍摄地点为北京长城，则将北京长城作为图像C的地理位置信息；也可以根据图像中的景物特征确定图像的拍摄地点，例如，图像C中包括北京长城景点图像具有的景物特征，则确定图像C的拍摄地点为“北京长城”，将“北京长城”作为图像C的地理位置信息，类似的，可以提取图像D的地理位置信息及图像D的至少一文字特征，可以提取图像F的地理位置信息及图像F的至少一文字特征，在此不再赘述。

步骤202、对所述至少一文字特征标注对应的文本信息。

在本发明实施例中，对每一图像包括的文字特征均标注对应的文本信息。举例来说，若图像C中具有草书顺序文字特征的文字为“中国”，则将草书顺序文字特征标注为“中国”，若图像C中具有粗笔画文字特征的文字为“北京”，则将粗笔画文字特征标注为“北京”，若图像C中具有细笔画文字特征的文字为“上海”，则将细笔画文字特征标注为“上海”。

步骤203、针对所述至少一张图像中的每一张图像，按照所述地理位置信息，将所述至少一文字特征及对应标注的文本信息，划分为至少一个信息子集合。

举例来说，若至少一张图像中包括图像C及图像D，从图像C提取的地理位置信息为北京长城，图像C中具有草书顺序文字特征的文字为“中国”，若从图像D提取的地理位置信息为北京长城，图像D中具有粗笔画文字特征的文字为“北京”，图像D中具有细笔画文字特征的文字为“上海”，将草书顺序文字特征标注文字“中国”，将粗笔画文字特征标注文字“北京”，将细笔画文字特征标注文字“上海”。

由于图像C及图像D的地理位置信息均为北京长城，则按照将具有同一地理位置信息的图像包括的文字特征及标注的文字划分为一个信息子集合的规则，将草书顺序文字特征、粗笔画文字特征、细笔画文字特征以及分别标注的文字“中国”、“北京”及“上海”划分为信息子集合A，信息子集合A与地理位置信息“北京长城”进行关联。这样划分的信息子集合包括的多种文字特征及对文字特征对应标注的文本信息均属于同一地理位置信息所拍摄的图像，文字特征及标注的文本信息比较精确。

步骤204、提取第一图像的第一文字特征及第一地理位置信息。

此步骤的实现过程和有益效果可以参见步骤101中的描述，此处不再赘述。

步骤205、从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合。

此步骤的实现过程和有益效果可以参见步骤102中的描述，此处不再赘述。

步骤206、从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。

此步骤的实现过程和有益效果可以参见步骤103中的描述，此处不再赘述。

可选的，在步骤206之后，还可以包括以下步骤：

建立所述第一图像与所述第一文本信息之间的关联关系，存储所述关联关系；在所述第一图像上按照弹窗形式或者在所述第一图像的预设文字区域显示所述第一文本信息。这样，存储第一图像与第一文本信息之间的关联关系后，若再次对第一图像进行文字识别时，可以从第一图像与第一文本信息之间的关联关系，查找到与第一图像对应的第一文本信息，能够快速准确地识别图像中的文本信息，提高文本识别的速度。移动终端显示第一文本信息后，用户可以快速查看到第一图像中的第一文本信息，确保用户对图像的文本信息有正确的认识，从而提高用户的体验度。

在本实施例中，所述在所述第一图像上按照弹窗形式显示所述第一文本信息的步骤，可以包括以下步骤：在所述第一图像上按照滚动弹窗形式显示所述第一文本信息，或者，在所述第一图像上按照悬浮窗形式显示所述第一文本信息。所述在所述第一图像的预设文字区域显示所述第一文本信息的步骤，可以包括以下步骤：若在所述第一图像上的第一触控按钮检测到第一触控操作，则在所述第一图像上的文字区域显示所述第一文本信息。

通过在所述第一图像上按照弹窗形式或者在所述第一图像的预设文字区域显示所述第一文本信息，用户在查看第一图像时，可以便捷的查看对应的文本信息，提高用户了解文本信息的速度。

需要注意的是，该实施方式也可以应用于图对应的实施例，以及达到相同的有益效果，为避免重复，此处不再赘述。

可选的，步骤206之后，还可以包括以下步骤：

从预先获取的矫正信息集合中，确定与所述第一地理位置信息匹配的第一矫正信息子集合，所述矫正信息集合包括至少一矫正信息子集合，所述矫正信息子集合包括文本信息及与所述文本信息对应的矫正文本信息；从所述第一矫正信息子集合中，确定与所述第一文本信息匹配的第一矫正文本信息；在所述第一图像上按照弹窗形式或者在所述第一图像上的预设文字区域显示所述第一矫正文本信息。

在本发明实施例中，所述矫正信息集合包括至少一矫正信息子集合，所述矫正信息子集合包括文本信息及与所述文本信息对应的矫正文本信息，所述矫正文本信息可以为所述文本信息对应的释义信息，例如，文本信息“脖子痛”对应的矫正文本信息为“嗓子发炎、嗓子痛”。

所述矫正信息子集合与地理位置信息之间具有对应关系，可以根据矫正信息子集合与地理位置信息之间的对应关系，从预先获取的矫正信息集合中，确定与所述第一地理位置信息匹配的第一矫正信息子集合。可以根据所述第一矫正信息子集合中文本信息与矫正文本信息的对应关系，确定与第一文本信息匹配的第一矫正文本信息。

在本实施例中，所述在所述第一图像上按照弹窗形式显示所述第一矫正文本信息的步骤，可以包括以下步骤：在所述第一图像上按照滚动弹窗形式显示所述第一矫正文本信息，或者，在所述第一图像上按照悬浮窗形式显示所述第一矫正文本信息。所述在所述第一图像的预设文字区域显示所述第一矫正文本信息的步骤，可以包括以下步骤：若在所述第一图像上的第二触控按钮检测到第二触控操作，则在所述第一图像上的文字区域显示所述第一矫正文本信息。

这样，向用户显示第一矫正文本信息后，用户可以清楚的了解第一文本信息所具有的含义，例如，显示文本信息“脖子痛”的矫正文本信息“嗓子发炎、嗓子痛”后，用户可以直观了解“脖子痛”的具体含义，提高用户对文字信息的理解程度。

需要注意的是，该实施方式也可以应用于图1对应的实施例，以及达到相同的有益效果，为避免重复，此处不再赘述。

可选的，在所述显示所述第一矫正文本信息的步骤之后，还包括以下步骤：获取用户的语音信息，将所述用户的语音信息转换为第二文本信息；根据所述用户的语音信息，确定第二地理位置信息；根据所述第二地理位置信息，从所述矫正信息集合中确定与所述第二文本信息匹配的第二矫正文本信息；在目标显示界面上按照弹窗形式或者在所述目标显示界面上的预设文字区域显示所述第二矫正文本信息，所述目标显示界面为显示所述第二文本信息的界面。在本实施例中，所述用户的语音信息包括用户说的字、词及语句等，可以通过移动终端的麦克风接收用户的语音信息，也可以通过拾音器接收用户的语音信息等。

在本实施例中，所述在显示所述第二文本信息的界面上按照弹窗形式显示所述第二矫正文本信息的步骤，可以包括以下步骤：在所述第一图像上按照滚动弹窗形式显示所述第二矫正文本信息，或者，在所述第一图像上按照悬浮窗形式显示所述第二矫正文本信息。所述在显示所述第二文本信息的界面上的预设文字区域显示所述第二矫正文本信息的步骤，可以包括以下步骤：若显示所述第二文本信息的界面上的第三触控按钮检测到第三触控操作，则在所述显示所述第二文本信息的界面上的文字区域显示所述第二矫正文本信息。

可选的，所述根据所述第二地理位置信息，从所述矫正信息集合中确定与所述第二文本信息匹配的第二矫正文本信息的步骤，包括以下步骤：

从所述矫正信息集合中，确定与所述第二地理位置信息匹配的第二矫正信息子集合；从所述二矫正信息子集合中，确定与所述第二文本信息匹配的第二矫正文本信息。

可以根据矫正信息子集合与地理位置信息之间的对应关系，从矫正信息集合中，确定与所述第二地理位置信息匹配的第为矫正信息子集合。可以根据所述第而矫正信息子集合中文本信息与矫正文本信息的对应关系，确定与第二文本信息匹配的第二矫正文本信息。

这样，可以根据用户的语音信息确定的第二地理位置信息及第二文本信息，显示相应的矫正文本信息，方便用户与他人之间的交流沟通，提高不同用户之间的沟通效果。

本发明实施例的文字识别方法，通过提取至少一张图像中的每一张图像的地理位置信息，及所述每一张图像中的至少一文字特征；对所述至少一文字特征标注对应的文本信息；针对所述至少一张图像中的每一张图像，按照所述地理位置信息，将所述至少一文字特征及对应标注的文本信息，划分为至少一个信息子集合；提取第一图像的第一文字特征及第一地理位置信息；从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合，所述信息集合包括至少一个信息子集合，所述信息子集合包括文字特征及与所述文字特征对应的文本信息，所述第一信息子集合为所述至少一个信息子集合中的一个；从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。这样，信息集合中每一信息子集合所包括的文字特征及标注的文本信息比较精确，根据图像的地理位置信息及文字特征，从信息子集合中匹配的图像中的文本信息的准确度比较高，从而提高文字识别的准确度。

参见图3，图3是本发明实施例提供的移动终端的结构图，如图3所示，移动终端300包括第一提取模块301、第一确定模块302及第二确定模块303，第一提取模块301与第一确定模块302连接，第一确定模块302还与第二确定模块303连接，其中：

第一提取模块301，用于提取第一图像的第一文字特征及第一地理位置信息；

第一确定模块302，用于从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合，所述信息集合包括至少一信息子集合，所述信息子集合包括文字特征及与所述文字特征对应的文本信息，所述第一信息子集合为所述至少一个信息子集合中的一个；

第二确定模块303，用于从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。

可选的，如图4所示，所述移动终端300还包括：

第二提取模块304，用于提取至少一张图像中的每一张图像的地理位置信息，及所述每一张图像中的至少一文字特征；

标注模块305，用于对所述至少一文字特征标注对应的文本信息；

划分模块306，用于针对所述至少一张图像中的每一张图像，按照所述地理位置信息，将所述至少一文字特征及对应标注的文本信息，划分为至少一个信息子集合。

可选的，所述文字特征包括笔画粗细、笔画顺序、文字轮廓中的至少一种。

可选的，如图5所示，所述移动终端300还包括：

建立模块307，用于建立所述第一图像与所述第一文本信息之间的关联关系，存储所述关联关系；

第一显示模块308，用于在所述第一图像上按照弹窗形式或者在所述第一图像的预设文字区域显示所述第一文本信息。可选的，如图6所示，所述移动终端300还包括：

第三确定模块309，用于从预先获取的矫正信息集合中，确定与所述第一地理位置信息匹配的第一矫正信息子集合，所述矫正信息集合包括至少一矫正信息子集合，所述矫正信息子集合包括文本信息及与所述文本信息对应的矫正文本信息；

第四确定模块3010，用于从所述第一矫正信息子集合中，确定与所述第一文本信息匹配的第一矫正文本信息；

第二显示模块3011，在所述第一图像上按照弹窗形式或者在所述第一图像上的预设文字区域显示所述第一矫正文本信息。可选的，如图7所示，所述移动终端300还包括：

获取模块3012，用于获取用户的语音信息，将所述用户的语音信息转换为第二文本信息；

第五确定模块3013，用于根据所述用户的语音信息，确定第二地理位置信息；

第六确定模块3014，用于根据所述第二地理位置信息，从所述矫正信息集合中确定与所述第二文本信息匹配的第二矫正文本信息；

第三显示模块3015，用于在目标显示界面上按照弹窗形式或者在所述目标显示界面上的预设文字区域显示所述第二矫正文本信息，所述目标显示界面为显示所述第二文本信息的界面。

可选的，如图8所示，所述第六确定模块3014包括：

第一确定子模块30141，用于从所述矫正信息集合中，确定与所述第二地理位置信息匹配的第二矫正信息子集合；

第二确定子模块30142，用于从所述二矫正信息子集合中，确定与所述第二文本信息匹配的第二矫正文本信息。

移动终端300能够实现图1至图2的方法实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

本发明实施例提供的移动终端300，能够根据图像的地理位置信息及文字特征，从信息集合中准确地匹配出图像中的文本信息，提高文字识别的准确度。

图9为实现本发明各个实施例的一种移动终端的硬件结构示意图，该移动终端900包括但不限于：射频单元901、网络模块902、音频输出单元903、输入单元904、传感器905、显示单元906、用户输入单元907、接口单元908、存储器909、处理器910、以及电源911等部件。本领域技术人员可以理解，图9中示出的移动终端结构并不构成对移动终端的限定，移动终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中，处理器910用于，提取第一图像的第一文字特征及第一地理位置信息；从预先获取的信息集合中，确定与所述第一地理位置信息匹配的第一信息子集合，所述信息集合包括至少一个信息子集合，所述信息子集合包括文字特征及与所述文字特征对应的文本信息，所述第一信息子集合为所述至少一个信息子集合中的一个；从所述第一信息子集合中，确定与所述第一文字特征匹配的第一文本信息。

可选的，所述处理器910还用于，提取至少一张图像中的每一张图像的地理位置信息，及所述每一张图像中的至少一文字特征；对所述至少一文字特征标注对应的文本信息；针对所述至少一张图像中的每一张图像，按照所述地理位置信息，将所述至少一文字特征及对应标注的文本信息，划分为至少一个信息子集合。可选的，所述文字特征包括笔画粗细、笔画顺序、文字轮廓中的至少一种。

可选的，所述处理器910还用于，建立所述第一图像与所述第一文本信息之间的关联关系，存储所述关联关系；在所述第一图像上按照弹窗形式或者在所述第一图像的预设文字区域显示所述第一文本信息。

可选的，所述处理器910还用于，从预先获取的矫正信息集合中，确定与所述第一地理位置信息匹配的第一矫正信息子集合，所述矫正信息集合包括至少一矫正信息子集合，所述矫正信息子集合包括文本信息及与所述文本信息对应的矫正文本信息；从所述第一矫正信息子集合中，确定与所述第一文本信息匹配的第一矫正文本信息；在所述第一图像上按照弹窗形式或者在所述第一图像上的预设文字区域显示所述第一矫正文本信息。

可选的，所述处理器910还用于，获取用户的语音信息，将所述用户的语音信息转换为第二文本信息；根据所述用户的语音信息，确定第二地理位置信息；根据所述第二地理位置信息，从所述矫正信息集合中确定与所述第二文本信息匹配的第二矫正文本信息；在显示所述第二文本信息的界面上按照弹窗形式或者在显示所述第二文本信息的界面上的预设文字区域显示所述第二矫正文本信息。可选的，所述处理器910执行所述根据所述第二地理位置信息，从所述矫正信息集合中确定与所述第二文本信息匹配的第二矫正文本信息的步骤，包括：从所述矫正信息集合中，确定与所述第二地理位置信息匹配的第二矫正信息子集合；从所述二矫正信息子集合中，确定与所述第二文本信息匹配的第二矫正文本信息。

移动终端900能够实现前述实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

本发明实施例的移动终端900，移动终端能够根据图像的地理位置信息及文字特征，从信息集合中准确地匹配出图像中的文本信息，提高文字识别的准确度。

应理解的是，本发明实施例中，射频单元901可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器910处理；另外，将上行的数据发送给基站。通常，射频单元901包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元901还可以通过无线通信系统与网络和其他设备通信。

移动终端通过网络模块902为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元903可以将射频单元901或网络模块902接收的或者在存储器909中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元903还可以提供与移动终端900执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元903包括扬声器、蜂鸣器以及受话器等。

输入单元904用于接收音频或视频信号。输入单元904可以包括图形处理器(Graphics Processing Unit，GPU)9041和麦克风9042，图形处理器9041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元906上。经图形处理器9041处理后的图像帧可以存储在存储器909(或其它存储介质)中或者经由射频单元901或网络模块902进行发送。麦克风9042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元901发送到移动通信基站的格式输出。

移动终端900还包括至少一种传感器905，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板9061的亮度，接近传感器可在移动终端900移动到耳边时，关闭显示面板9061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器905还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元906用于显示由用户输入的信息或提供给用户的信息。显示单元906可包括显示面板9061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板9061。

用户输入单元907可用于接收输入的数字或字符信息，以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元907包括触控面板9071以及其他输入设备9072。触控面板9071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板9071上或在触控面板9071附近的操作)。触控面板9071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器910，接收处理器910发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板9071。除了触控面板9071，用户输入单元907还可以包括其他输入设备9072。具体地，其他输入设备9072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板9071可覆盖在显示面板9061上，当触控面板9071检测到在其上或附近的触摸操作后，传送给处理器910以确定触摸事件的类型，随后处理器910根据触摸事件的类型在显示面板9061上提供相应的视觉输出。虽然在图9中，触控面板9071与显示面板9061是作为两个独立的部件来实现移动终端的输入和输出功能，但是在某些实施例中，可以将触控面板9071与显示面板9061集成而实现移动终端的输入和输出功能，具体此处不做限定。

接口单元908为外部装置与移动终端900连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元908可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到移动终端900内的一个或多个元件或者可以用于在移动终端900和外部装置之间传输数据。

存储器909可用于存储软件程序以及各种数据。存储器909可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器909可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器910是移动终端的控制中心，利用各种接口和线路连接整个移动终端的各个部分，通过运行或执行存储在存储器909内的软件程序和/或模块，以及调用存储在存储器909内的数据，执行移动终端的各种功能和处理数据，从而对移动终端进行整体监控。处理器910可包括一个或多个处理单元；优选的，处理器910可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器910中。

移动终端900还可以包括给各个部件供电的电源911(比如电池)，优选的，电源911可以通过电源管理系统与处理器910逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，移动终端900包括一些未示出的功能模块，在此不再赘述。

优选的，本发明实施例还提供一种移动终端，包括处理器910，存储器909，存储在存储器909上并可在所述处理器910上运行的计算机程序，该计算机程序被处理器910执行时实现上述文字识别方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述文字识别方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

Claims

1.一种文字识别方法，其特征在于，包括：

提取第一图像的第一文字特征及第一地理位置信息；

2.根据权利要求1所述的方法，其特征在于，所述提取第一图像的第一文字特征及第一地理位置信息的步骤之前，所述方法还包括:

提取至少一张图像中的每一张图像的地理位置信息，及所述每一张图像中的至少一文字特征；

对所述至少一文字特征标注对应的文本信息；

针对所述至少一张图像中的每一张图像，按照所述地理位置信息，将所述至少一文字特征及对应标注的文本信息，划分为至少一个信息子集合。

3.根据权利要求2所述的方法，其特征在于，所述文字特征包括笔画粗细、笔画顺序、文字轮廓中的至少一种。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述确定与所述第一文字特征匹配的第一文本信息的步骤之后，所述方法还包括：

建立所述第一图像与所述第一文本信息之间的关联关系，存储所述关联关系；

在所述第一图像上按照弹窗形式或者在所述第一图像的预设文字区域显示所述第一文本信息。

5.根据权利要求1至3任一项所述的方法，其特征在于，所述确定与所述第一文字特征匹配的第一文本信息的步骤之后，所述方法还包括：

从预先获取的矫正信息集合中，确定与所述第一地理位置信息匹配的第一矫正信息子集合，所述矫正信息集合包括至少一矫正信息子集合，所述矫正信息子集合包括文本信息及与所述文本信息对应的矫正文本信息；

从所述第一矫正信息子集合中，确定与所述第一文本信息匹配的第一矫正文本信息；

在所述第一图像上按照弹窗形式或者在所述第一图像上的预设文字区域显示所述第一矫正文本信息。

6.根据权利要求5所述的方法，其特征在于，所述显示所述第一矫正文本信息的步骤之后，还包括：

获取用户的语音信息，将所述用户的语音信息转换为第二文本信息；

根据所述用户的语音信息，确定第二地理位置信息；

根据所述第二地理位置信息，从所述矫正信息集合中确定与所述第二文本信息匹配的第二矫正文本信息；

在目标显示界面上按照弹窗形式或者在所述目标显示界面上的预设文字区域显示所述第二矫正文本信息，所述目标显示界面为显示所述第二文本信息的界面。

7.根据权利要求6所述的方法，其特征在于，所述根据所述第二地理位置信息，从所述矫正信息集合中确定与所述第二文本信息匹配的第二矫正文本信息的步骤，包括：

从所述矫正信息集合中，确定与所述第二地理位置信息匹配的第二矫正信息子集合；

从所述二矫正信息子集合中，确定与所述第二文本信息匹配的第二矫正文本信息。

8.一种移动终端，其特征在于，包括：

9.根据权利要求8所述的移动终端，其特征在于，还包括:

第二提取模块，用于提取至少一张图像中的每一张图像的地理位置信息，及所述每一张图像中的至少一文字特征；

标注模块，用于对所述至少一文字特征标注对应的文本信息；

划分模块，用于针对所述至少一张图像中的每一张图像，按照所述地理位置信息，将所述至少一文字特征及对应标注的文本信息，划分为至少一个信息子集合。

10.根据权利要求9所述的移动终端，其特征在于，所述文字特征包括笔画粗细、笔画顺序、文字轮廓中的至少一种。

11.根据权利要求8至10任一项所述的移动终端，其特征在于，还包括：

建立模块，用于建立所述第一图像与所述第一文本信息之间的关联关系，存储所述关联关系；

第一显示模块，用于在所述第一图像上按照弹窗形式或者在所述第一图像的预设文字区域显示所述第一文本信息。

12.根据权利要求8至10任一项所述的移动终端，其特征在于，还包括：

第三确定模块，用于从预先获取的矫正信息集合中，确定与所述第一地理位置信息匹配的第一矫正信息子集合，所述矫正信息集合包括至少一矫正信息子集合，所述矫正信息子集合包括文本信息及与所述文本信息对应的矫正文本信息；

第四确定模块，用于从所述第一矫正信息子集合中，确定与所述第一文本信息匹配的第一矫正文本信息；

第二显示模块，在所述第一图像上按照弹窗形式或者在所述第一图像上的预设文字区域显示所述第一矫正文本信息。

13.根据权利要求12所述的移动终端，其特征在于，还包括：

获取模块，用于获取用户的语音信息，将所述用户的语音信息转换为第二文本信息；

第五确定模块，用于根据所述用户的语音信息，确定第二地理位置信息；

第六确定模块，用于根据所述第二地理位置信息，从所述矫正信息集合中确定与所述第二文本信息匹配的第二矫正文本信息；

第三显示模块，用于在目标显示界面上按照弹窗形式或者在所述目标显示界面上的预设文字区域显示所述第二矫正文本信息，所述目标显示界面为显示所述第二文本信息的界面。

14.根据权利要求13所述的移动终端，其特征在于，所述第六确定模块包括：

第一确定子模块，用于从所述矫正信息集合中，确定与所述第二地理位置信息匹配的第二矫正信息子集合；

第二确定子模块，用于从所述二矫正信息子集合中，确定与所述第二文本信息匹配的第二矫正文本信息。