CN111176540A

CN111176540A - 字符提取方法及装置

Info

Publication number: CN111176540A
Application number: CN201911181628.5A
Authority: CN
Inventors: 周海
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2019-11-27
Filing date: 2019-11-27
Publication date: 2020-05-19

Abstract

本发明是关于字符提取方法及装置。该方法包括：检测到多个手势；确定所述多个手势相对于图像文档的当前坐标；根据所述当前坐标，确定所述多个手势在所述图像文档中所指向的目标区域；基于所述目标文档，提取所述目标区域内的字符。通过本发明的技术方案，可利用不同手势快速选中目标区域内任意局部区域的字符，还可以选择任意一个较大的局部区域，然后对该较大的局部区域内的字符进行快速提取，以提高对图像文档中的字符的提取效率，进而有利于提高对图像文档中的字符的识别效率。

Description

字符提取方法及装置

技术领域

本发明涉及字符识别技术领域，尤其涉及字符提取方法及装置。

背景技术

目前，用户可以通过某个手指对图像文档进行触控，然后选中图像文档中的字符进行识别，但手指的指尖所选择的区域较小，无法对较长的文字快速地进行内容区域选择，即每次只能选择图像文档中的一小部分区域，进而影响了对图像文档中的字符的识别效率。例如用户无法快速地选择某一大段文字，而只能通过1个手指在一个图像文档上逐渐滑动来选择一大段文字。

发明内容

本发明实施例提供了字符提取方法及装置。所述技术方案如下：

根据本发明实施例的第一方面，提供一种字符提取方法，包括：

检测到多个手势；

确定所述多个手势相对于图像文档的当前坐标；

根据所述当前坐标，确定所述多个手势在所述图像文档中所指向的目标区域；

基于所述目标文档，提取所述目标区域内的字符。

在一个实施例中，所述方法还包括：

将所述目标区域内的字符进行识别，获得字符识别结果。

在一个实施例中，所述方法还包括：

将所述字符识别结果通过图像或语音方式进行反馈。

在一个实施例中，对实物文档进行拍摄，获得所述实体文档对应的所述图像文档；

确定所述图像文档的文档尺寸；

基于所述图像文档的文档尺寸，建立所述图像文档的坐标轴；

所述确定所述多个手势相对于图像文档的当前坐标，包括：

基于所述多个手势和所述坐标轴，确定所述当前坐标，所述当前坐标包括：字符起始坐标和字符结束坐标。

根据本发明实施例的第二方面，提供一种字符提取装置，包括：

检测模块，用于检测到多个手势；

第一确定模块，用于确定所述多个手势相对于图像文档的当前坐标；

第二确定模块，用于根据所述当前坐标，确定所述多个手势在所述图像文档中所指向的目标区域；

提取模块，用于基于所述目标文档，提取所述目标区域内的字符。

在一个实施例中，所述装置还包括：

识别模块，用于将所述目标区域内的字符进行识别，获得字符识别结果。

在一个实施例中，所述装置还包括：

反馈模块，用于将所述字符识别结果通过图像或语音方式进行反馈。

在一个实施例中，拍摄模块，用于对实物文档进行拍摄，获得所述实体文档对应的所述图像文档；

第三确定模块，用于确定所述图像文档的文档尺寸；

建立模块，用于基于所述图像文档的文档尺寸，建立所述图像文档的坐标轴；

所述第一确定模块包括：

确定子模块，用于基于所述多个手势和所述坐标轴，确定所述当前坐标，所述当前坐标包括：字符起始坐标和字符结束坐标。

本发明的实施例提供的技术方案可以包括以下有益效果：

在检测到多个手势后，可确定各手势相对于图像文档的当前坐标，然后根据该当前坐标，确定多个手势在图像文档中所指向的目标区域，进而基于目标文档自动提取目标区域内的字符，而由于手势比较灵活、坐标也就比较灵活，因而，通过本发明的技术方案可利用不同手势快速选中目标区域内任意局部区域的字符，还可以选择任意一个较大的局部区域，然后对该较大的局部区域内的字符进行快速提取，以提高对图像文档中的字符的提取效率，进而有利于提高对图像文档中的字符的识别效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种字符提取方法的流程图。

图2是根据一示例性实施例示出的一种字符提取装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

为了解决上述技术问题，本发明实施例提供了一种字符提取方法，该方法可用于字符提取程序、系统或装置中，且该方法对应的执行主体可以是终端或服务器，如图1所示，该方法包括步骤S101至步骤S104：

在步骤S101中，检测到多个手势；

在步骤S102中，确定所述多个手势相对于图像文档的当前坐标；

多个手势相对于图像文档的当前坐标即各手势相对于图像文档的坐标。

在步骤S103中，根据所述当前坐标，确定所述多个手势在所述图像文档中所指向的目标区域；

在步骤S104中，基于所述目标文档，提取所述目标区域内的字符。

在一个实施例中，所述方法还包括：

将所述目标区域内的字符进行识别，获得字符识别结果。

在提取出目标区域内的字符后，可对目标区域内的字符进行自动识别，从而自动获得字符识别结果，以提高对图像文档中的字符的识别效率。

在一个实施例中，所述方法还包括：

将所述字符识别结果通过图像或语音方式进行反馈。

在识别出字符识别结果后，可通过图像或语音方式对该字符识别结果进行自动反馈。

确定所述图像文档的文档尺寸；

文档尺寸即图像文档的长、宽。

所述确定所述多个手势相对于图像文档的当前坐标，包括：

在确定图像文档的文档尺寸后，可基于该文档尺寸，自动建立图像文档的坐标轴，如以图像文档的长边为x轴、以图像文档的短边为y轴，进而基于多个手势和坐标轴，自动确定当前坐标，如基于各手势相对于坐标轴的原点的距离，即可准确确定各手势相对于该坐标轴的坐标。

而在确定好各手势相对于该坐标轴的坐标后，将坐标进行比较后，即可确定出字符起始坐标和字符结束坐标，进而根据字符起始坐标和字符结束坐标即可快速确定通过多个手势选择了图像文档中的哪个区域，而由于手势比较灵活、坐标也就比较灵活，因而，通过本发明的技术方案可利用不同手势快速选中目标区域内任意局部区域的字符，还可以选择任意一个较大的局部区域，然后对该较大的局部区域内的字符进行快速提取，以提高对图像文档中的字符的提取效率，进而有利于提高对图像文档中的字符的识别效率。

最后，需要明确的是：本领域技术人员可根据实际需求，将上述多个实施例进行自由组合。

对应本发明实施例提供的上述字符提取方法，本发明实施例还提供一种字符提取装置，如图2所示，该装置包括：

检测模块201，用于检测到多个手势；

第一确定模块202，用于确定所述多个手势相对于图像文档的当前坐标；

第二确定模块203，用于根据所述当前坐标，确定所述多个手势在所述图像文档中所指向的目标区域；

提取模块204，用于基于所述目标文档，提取所述目标区域内的字符。

在一个实施例中，所述装置还包括：

第三确定模块，用于确定所述图像文档的文档尺寸；

所述第一确定模块包括：

本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种字符提取方法，其特征在于，包括：

检测到多个手势；

确定所述多个手势相对于图像文档的当前坐标；

基于所述目标文档，提取所述目标区域内的字符。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述目标区域内的字符进行识别，获得字符识别结果。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

将所述字符识别结果通过图像或语音方式进行反馈。

4.根据权利要求1至3中任一项所述的方法，其特征在于，

对实物文档进行拍摄，获得所述实体文档对应的所述图像文档；

确定所述图像文档的文档尺寸；

所述确定所述多个手势相对于图像文档的当前坐标，包括：

5.一种字符提取装置，其特征在于，包括：

检测模块，用于检测到多个手势；

6.根据权利要求5所述的装置，其特征在于，所述装置还包括：

7.根据权利要求5所述的装置，其特征在于，所述装置还包括：

8.根据权利要求5至7中任一项所述的装置，其特征在于，

拍摄模块，用于对实物文档进行拍摄，获得所述实体文档对应的所述图像文档；

第三确定模块，用于确定所述图像文档的文档尺寸；

所述第一确定模块包括：