CN111176540A - 字符提取方法及装置 - Google Patents

字符提取方法及装置 Download PDF

Info

Publication number
CN111176540A
CN111176540A CN201911181628.5A CN201911181628A CN111176540A CN 111176540 A CN111176540 A CN 111176540A CN 201911181628 A CN201911181628 A CN 201911181628A CN 111176540 A CN111176540 A CN 111176540A
Authority
CN
China
Prior art keywords
document
gestures
image document
image
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911181628.5A
Other languages
English (en)
Inventor
周海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN201911181628.5A priority Critical patent/CN111176540A/zh
Publication of CN111176540A publication Critical patent/CN111176540A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Abstract

本发明是关于字符提取方法及装置。该方法包括:检测到多个手势;确定所述多个手势相对于图像文档的当前坐标;根据所述当前坐标,确定所述多个手势在所述图像文档中所指向的目标区域;基于所述目标文档,提取所述目标区域内的字符。通过本发明的技术方案,可利用不同手势快速选中目标区域内任意局部区域的字符,还可以选择任意一个较大的局部区域,然后对该较大的局部区域内的字符进行快速提取,以提高对图像文档中的字符的提取效率,进而有利于提高对图像文档中的字符的识别效率。

Description

字符提取方法及装置
技术领域
本发明涉及字符识别技术领域,尤其涉及字符提取方法及装置。
背景技术
目前,用户可以通过某个手指对图像文档进行触控,然后选中图像文档中的字符进行识别,但手指的指尖所选择的区域较小,无法对较长的文字快速地进行内容区域选择,即每次只能选择图像文档中的一小部分区域,进而影响了对图像文档中的字符的识别效率。例如用户无法快速地选择某一大段文字,而只能通过1个手指在一个图像文档上逐渐滑动来选择一大段文字。
发明内容
本发明实施例提供了字符提取方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供一种字符提取方法,包括:
检测到多个手势;
确定所述多个手势相对于图像文档的当前坐标;
根据所述当前坐标,确定所述多个手势在所述图像文档中所指向的目标区域;
基于所述目标文档,提取所述目标区域内的字符。
在一个实施例中,所述方法还包括:
将所述目标区域内的字符进行识别,获得字符识别结果。
在一个实施例中,所述方法还包括:
将所述字符识别结果通过图像或语音方式进行反馈。
在一个实施例中,对实物文档进行拍摄,获得所述实体文档对应的所述图像文档;
确定所述图像文档的文档尺寸;
基于所述图像文档的文档尺寸,建立所述图像文档的坐标轴;
所述确定所述多个手势相对于图像文档的当前坐标,包括:
基于所述多个手势和所述坐标轴,确定所述当前坐标,所述当前坐标包括:字符起始坐标和字符结束坐标。
根据本发明实施例的第二方面,提供一种字符提取装置,包括:
检测模块,用于检测到多个手势;
第一确定模块,用于确定所述多个手势相对于图像文档的当前坐标;
第二确定模块,用于根据所述当前坐标,确定所述多个手势在所述图像文档中所指向的目标区域;
提取模块,用于基于所述目标文档,提取所述目标区域内的字符。
在一个实施例中,所述装置还包括:
识别模块,用于将所述目标区域内的字符进行识别,获得字符识别结果。
在一个实施例中,所述装置还包括:
反馈模块,用于将所述字符识别结果通过图像或语音方式进行反馈。
在一个实施例中,拍摄模块,用于对实物文档进行拍摄,获得所述实体文档对应的所述图像文档;
第三确定模块,用于确定所述图像文档的文档尺寸;
建立模块,用于基于所述图像文档的文档尺寸,建立所述图像文档的坐标轴;
所述第一确定模块包括:
确定子模块,用于基于所述多个手势和所述坐标轴,确定所述当前坐标,所述当前坐标包括:字符起始坐标和字符结束坐标。
本发明的实施例提供的技术方案可以包括以下有益效果:
在检测到多个手势后,可确定各手势相对于图像文档的当前坐标,然后根据该当前坐标,确定多个手势在图像文档中所指向的目标区域,进而基于目标文档自动提取目标区域内的字符,而由于手势比较灵活、坐标也就比较灵活,因而,通过本发明的技术方案可利用不同手势快速选中目标区域内任意局部区域的字符,还可以选择任意一个较大的局部区域,然后对该较大的局部区域内的字符进行快速提取,以提高对图像文档中的字符的提取效率,进而有利于提高对图像文档中的字符的识别效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种字符提取方法的流程图。
图2是根据一示例性实施例示出的一种字符提取装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
为了解决上述技术问题,本发明实施例提供了一种字符提取方法,该方法可用于字符提取程序、系统或装置中,且该方法对应的执行主体可以是终端或服务器,如图1所示,该方法包括步骤S101至步骤S104:
在步骤S101中,检测到多个手势;
在步骤S102中,确定所述多个手势相对于图像文档的当前坐标;
多个手势相对于图像文档的当前坐标即各手势相对于图像文档的坐标。
在步骤S103中,根据所述当前坐标,确定所述多个手势在所述图像文档中所指向的目标区域;
在步骤S104中,基于所述目标文档,提取所述目标区域内的字符。
在检测到多个手势后,可确定各手势相对于图像文档的当前坐标,然后根据该当前坐标,确定多个手势在图像文档中所指向的目标区域,进而基于目标文档自动提取目标区域内的字符,而由于手势比较灵活、坐标也就比较灵活,因而,通过本发明的技术方案可利用不同手势快速选中目标区域内任意局部区域的字符,还可以选择任意一个较大的局部区域,然后对该较大的局部区域内的字符进行快速提取,以提高对图像文档中的字符的提取效率,进而有利于提高对图像文档中的字符的识别效率。
在一个实施例中,所述方法还包括:
将所述目标区域内的字符进行识别,获得字符识别结果。
在提取出目标区域内的字符后,可对目标区域内的字符进行自动识别,从而自动获得字符识别结果,以提高对图像文档中的字符的识别效率。
在一个实施例中,所述方法还包括:
将所述字符识别结果通过图像或语音方式进行反馈。
在识别出字符识别结果后,可通过图像或语音方式对该字符识别结果进行自动反馈。
在一个实施例中,对实物文档进行拍摄,获得所述实体文档对应的所述图像文档;
确定所述图像文档的文档尺寸;
文档尺寸即图像文档的长、宽。
基于所述图像文档的文档尺寸,建立所述图像文档的坐标轴;
所述确定所述多个手势相对于图像文档的当前坐标,包括:
基于所述多个手势和所述坐标轴,确定所述当前坐标,所述当前坐标包括:字符起始坐标和字符结束坐标。
在确定图像文档的文档尺寸后,可基于该文档尺寸,自动建立图像文档的坐标轴,如以图像文档的长边为x轴、以图像文档的短边为y轴,进而基于多个手势和坐标轴,自动确定当前坐标,如基于各手势相对于坐标轴的原点的距离,即可准确确定各手势相对于该坐标轴的坐标。
而在确定好各手势相对于该坐标轴的坐标后,将坐标进行比较后,即可确定出字符起始坐标和字符结束坐标,进而根据字符起始坐标和字符结束坐标即可快速确定通过多个手势选择了图像文档中的哪个区域,而由于手势比较灵活、坐标也就比较灵活,因而,通过本发明的技术方案可利用不同手势快速选中目标区域内任意局部区域的字符,还可以选择任意一个较大的局部区域,然后对该较大的局部区域内的字符进行快速提取,以提高对图像文档中的字符的提取效率,进而有利于提高对图像文档中的字符的识别效率。
最后,需要明确的是:本领域技术人员可根据实际需求,将上述多个实施例进行自由组合。
对应本发明实施例提供的上述字符提取方法,本发明实施例还提供一种字符提取装置,如图2所示,该装置包括:
检测模块201,用于检测到多个手势;
第一确定模块202,用于确定所述多个手势相对于图像文档的当前坐标;
第二确定模块203,用于根据所述当前坐标,确定所述多个手势在所述图像文档中所指向的目标区域;
提取模块204,用于基于所述目标文档,提取所述目标区域内的字符。
在一个实施例中,所述装置还包括:
识别模块,用于将所述目标区域内的字符进行识别,获得字符识别结果。
在一个实施例中,所述装置还包括:
反馈模块,用于将所述字符识别结果通过图像或语音方式进行反馈。
在一个实施例中,拍摄模块,用于对实物文档进行拍摄,获得所述实体文档对应的所述图像文档;
第三确定模块,用于确定所述图像文档的文档尺寸;
建立模块,用于基于所述图像文档的文档尺寸,建立所述图像文档的坐标轴;
所述第一确定模块包括:
确定子模块,用于基于所述多个手势和所述坐标轴,确定所述当前坐标,所述当前坐标包括:字符起始坐标和字符结束坐标。
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (8)

1.一种字符提取方法,其特征在于,包括:
检测到多个手势;
确定所述多个手势相对于图像文档的当前坐标;
根据所述当前坐标,确定所述多个手势在所述图像文档中所指向的目标区域;
基于所述目标文档,提取所述目标区域内的字符。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述目标区域内的字符进行识别,获得字符识别结果。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述字符识别结果通过图像或语音方式进行反馈。
4.根据权利要求1至3中任一项所述的方法,其特征在于,
对实物文档进行拍摄,获得所述实体文档对应的所述图像文档;
确定所述图像文档的文档尺寸;
基于所述图像文档的文档尺寸,建立所述图像文档的坐标轴;
所述确定所述多个手势相对于图像文档的当前坐标,包括:
基于所述多个手势和所述坐标轴,确定所述当前坐标,所述当前坐标包括:字符起始坐标和字符结束坐标。
5.一种字符提取装置,其特征在于,包括:
检测模块,用于检测到多个手势;
第一确定模块,用于确定所述多个手势相对于图像文档的当前坐标;
第二确定模块,用于根据所述当前坐标,确定所述多个手势在所述图像文档中所指向的目标区域;
提取模块,用于基于所述目标文档,提取所述目标区域内的字符。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
识别模块,用于将所述目标区域内的字符进行识别,获得字符识别结果。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
反馈模块,用于将所述字符识别结果通过图像或语音方式进行反馈。
8.根据权利要求5至7中任一项所述的装置,其特征在于,
拍摄模块,用于对实物文档进行拍摄,获得所述实体文档对应的所述图像文档;
第三确定模块,用于确定所述图像文档的文档尺寸;
建立模块,用于基于所述图像文档的文档尺寸,建立所述图像文档的坐标轴;
所述第一确定模块包括:
确定子模块,用于基于所述多个手势和所述坐标轴,确定所述当前坐标,所述当前坐标包括:字符起始坐标和字符结束坐标。
CN201911181628.5A 2019-11-27 2019-11-27 字符提取方法及装置 Pending CN111176540A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911181628.5A CN111176540A (zh) 2019-11-27 2019-11-27 字符提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911181628.5A CN111176540A (zh) 2019-11-27 2019-11-27 字符提取方法及装置

Publications (1)

Publication Number Publication Date
CN111176540A true CN111176540A (zh) 2020-05-19

Family

ID=70650122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911181628.5A Pending CN111176540A (zh) 2019-11-27 2019-11-27 字符提取方法及装置

Country Status (1)

Country Link
CN (1) CN111176540A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113963355A (zh) * 2021-12-22 2022-01-21 北京亮亮视野科技有限公司 Ocr文字识别方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399629A (zh) * 2013-06-29 2013-11-20 华为技术有限公司 获取手势屏幕显示坐标的方法和装置
CN105791592A (zh) * 2016-04-29 2016-07-20 努比亚技术有限公司 一种信息提示的方法及移动终端
CN106527945A (zh) * 2016-11-09 2017-03-22 广东小天才科技有限公司 文本信息提取方法及装置
US20180284954A1 (en) * 2017-03-30 2018-10-04 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Identifying a target area to display a popup graphical element
CN109739416A (zh) * 2018-04-19 2019-05-10 北京字节跳动网络技术有限公司 一种文本提取方法和装置
CN110032324A (zh) * 2018-01-11 2019-07-19 华为终端有限公司 一种文本选中方法及终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399629A (zh) * 2013-06-29 2013-11-20 华为技术有限公司 获取手势屏幕显示坐标的方法和装置
CN105791592A (zh) * 2016-04-29 2016-07-20 努比亚技术有限公司 一种信息提示的方法及移动终端
CN106527945A (zh) * 2016-11-09 2017-03-22 广东小天才科技有限公司 文本信息提取方法及装置
US20180284954A1 (en) * 2017-03-30 2018-10-04 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Identifying a target area to display a popup graphical element
CN110032324A (zh) * 2018-01-11 2019-07-19 华为终端有限公司 一种文本选中方法及终端
CN109739416A (zh) * 2018-04-19 2019-05-10 北京字节跳动网络技术有限公司 一种文本提取方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113963355A (zh) * 2021-12-22 2022-01-21 北京亮亮视野科技有限公司 Ocr文字识别方法、装置、电子设备及存储介质
CN113963355B (zh) * 2021-12-22 2022-03-25 北京亮亮视野科技有限公司 Ocr文字识别方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US10049096B2 (en) System and method of template creation for a data extraction tool
US9239961B1 (en) Text recognition near an edge
CN108664364B (zh) 一种终端测试方法及装置
US10503960B2 (en) Segment-based handwritten signature authentication system and method
EP2444933A1 (en) Biometric authentication device, biometric authentication method and computer program for biometric authentication
EP2584495A2 (en) Image processing method and apparatus for detecting target
CN103488528A (zh) 一种基于移动终端的二维码处理方法及装置
CN109740040B (zh) 验证码识别方法、装置、存储介质和计算机设备
CN111143925B (zh) 图纸标注方法及相关产品
CN103927465A (zh) 一种基于图形的验证码生成和验证方法
CN108596079B (zh) 手势识别方法、装置及电子设备
CN110458145B (zh) 一种基于二维动态特征的离线笔迹个体识别系统及方法
CN111077996B (zh) 一种基于点读的信息推荐方法及学习设备
CN105630397A (zh) 一种弹出框的打开方法及终端设备
CN109726543A (zh) 一种应用程序的登录方法、装置、终端设备和存储介质
CN105183827A (zh) 基于手写输入的搜索方法及装置
CN106250755B (zh) 用于生成验证码的方法及装置
CN111176540A (zh) 字符提取方法及装置
CN107992872B (zh) 一种对图片进行文本识别的方法及移动终端
US20150138088A1 (en) Apparatus and Method for Recognizing Spatial Gesture
CN111124109B (zh) 一种交互方式的选择方法、智能终端、设备及存储介质
US9152876B1 (en) Methods and systems for efficient handwritten character segmentation
Mohamed et al. On the security and usability of dynamic cognitive game CAPTCHAs
CN111160097B (zh) 一种内容识别方法及装置
CN106293368B (zh) 一种数据处理方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200519