CN107729897B - 一种文本操作方法、装置及终端 - Google Patents

一种文本操作方法、装置及终端 Download PDF

Info

Publication number
CN107729897B
CN107729897B CN201711069907.3A CN201711069907A CN107729897B CN 107729897 B CN107729897 B CN 107729897B CN 201711069907 A CN201711069907 A CN 201711069907A CN 107729897 B CN107729897 B CN 107729897B
Authority
CN
China
Prior art keywords
target
terminal interface
target image
recognition
operation area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711069907.3A
Other languages
English (en)
Other versions
CN107729897A (zh
Inventor
李雨萌
靳晓冬
王武军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201711069907.3A priority Critical patent/CN107729897B/zh
Publication of CN107729897A publication Critical patent/CN107729897A/zh
Application granted granted Critical
Publication of CN107729897B publication Critical patent/CN107729897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种文本操作方法、装置及终端,方法包括:接收用户在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域;确定与所述操作位置相对应的目标操作区域;获取所述目标操作区域上的目标图像;对所述目标图像进行文字识别,得到识别结果。本申请中不需要用户自己去划分或选定图像区域,而是预先在终端界面上划分好操作区域后,基于用户的操作位置来选定图像区域,从而为具有视觉障碍的用户提供便利,满足具有视觉障碍的用户对文字识别的需求。

Description

一种文本操作方法、装置及终端
技术领域
本发明涉及信息处理技术领域,特别涉及一种文本操作方法、装置及终端。
背景技术
目前在触控终端上进行文字识别时,是通过获取外界在触控终端上的触控之后,根据触控中用户选定的文字图像区域对文字图像区域中的文字进识别。
而这一文字识别方案中,需要用户选定文字图像区域,而对于具有视觉障碍的用户来说,这是无法实现的。
因此,亟需一种能够满足具有视觉障碍的用户对文字识别的需求的技术方案。
发明内容
鉴于上述问题,本申请提供了一种文本操作方法、装置及系统,用以解决现有技术中无法满足具有视觉障碍的用户对文字识别需求的技术问题。
本申请提供了一种文本操作方法,包括:
接收用户在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域;
确定与所述操作位置相对应的目标操作区域;
获取所述目标操作区域上的目标图像;
对所述目标图像进行文字识别,得到识别结果。
上述方法,优选的,确定与所述操作位置相对应的目标操作区域,包括:
在所述终端界面上的操作区域中,确定区域位置范围包含所述操作位置的目标操作区域。
上述方法,优选的,确定与所述操作位置相对应的目标操作区域,包括:
在所述终端界面上的操作区域中,确定与所述操作位置具有预设的映射关系的目标操作区域;其中,所述映射关系包括:功能相关联的关系。
上述方法,优选的,对所述目标图像进行文字识别,得到识别结果,包括:
判断当前是否有网络连接,如果有网络连接,那么基于网络连接对所述目标图像进行文字识别,得到识别结果,否则,基于本地离线光学字符识别OCR对所述目标图像进行文字识别,得到识别结果。
上述方法,优选的,还包括:
以预设的输出方式输出所述识别结果。
上述方法,优选的,以预设的输出方式输出识别结果,包括:
在所述识别结果表明无文字信息时,输出表明未识别出文字的提示信息。
本申请还提供了一种文本操作装置,包括:
操作接收单元,用于接收用在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域;
目标确定单元,用于确定与所述操作位置相对应的目标操作区域;
图像获取单元,用于获取所述目标操作区域上的目标图像;
文字识别单元,用于对所述目标图像进行文字识别,得到识别结果。
上述装置,优选的,所述目标确定单元包括:
第一确定子单元,用于在所述终端界面上的操作区域中,确定区域位置范围包含所述操作位置的目标操作区域。
上述装置,优选的,所述目标确定单元包括:
第二确定子单元,用于在所述终端界面上的操作区域中,确定与所述操作位置具有预设的映射关系的目标操作区域;其中,所述映射关系包括:功能相关联的关系。
上述装置,优选的,所述文字识别单元包括:
网络判断子单元,用于判断当前是否有网络连接,如果有网络连接,触发第一识别子单元,否则,触发第二识别子单元;
第一识别子单元,用于基于网络连接对所述目标图像进行文字识别,得到识别结果;
第二识别子单元,用于基于本地离线OCR对所述目标图像进行文字识别,得到识别结果。
上述装置,优选的,还包括:
结果输出单元,用于以预设的输出方式输出所述识别结果。
上述装置,优选的,所述结果输出单元包括:
无文字输出子单元,用于在所述识别结果表明无文字信息时,输出表明未识别出文字的提示信息。
本申请还提供了一种终端,包括:
显示器,用于显示终端界面;
存储器,用于存储应用程序及应用程序运行所产生的数据;
处理器,用于接收用户在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域,确定与所述操作位置相互对应的目标操作区域,获取所述目标操作区域上的目标图像,对所述目标图像进行文字识别,得到识别结果。
上述终端,优选的,还包括:
输出设备,用于将所述识别结果进行输出。
借由上述技术方案,本申请提供的一种文本操作方法、装置及终端,预先在终端界面划分多个独立的操作区域,用户在终端界面上进行操作时,通过确定与操作位置相对应的目标操作区域,从而获取该目标操作区域的目标图像后,对该目标图像进行文字识别,得到识别结果。本申请中不需要用户自己去划分或选定图像区域,而是预先在终端界面上划分好操作区域后,基于用户的操作位置来选定图像区域,从而为具有视觉障碍的用户提供便利,满足具有视觉障碍的用户对文字识别的需求。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例一提供的一种文本操作方法的流程图;
图2、图3及图4分别为本申请实施例的应用示例图;
图5为本申请实施例一的另一流程图;
图6为本申请实施例的另一应用示例图;
图7为本申请实施例一的又一流程图;
图8为本申请实施例的又一应用示例图;
图9为本申请实施例一的部分流程图;
图10为本申请实施例二提供的一种文本操作装置的结构示意图;
图11、图12及图13分别为本申请实施例二的部分结构示意图;
图14为本申请实施例三提供的一种终端的结构示意图;
图15为本申请实施例三的应用示例图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参考图1,为本申请实施例一提供的一种文本操作方法的实现流程图,适用于如手机、pad或电脑等触控终端上,用于对终端界面上的图像进行文字识别,为具有视觉障碍的用户提供便利。
在本实施例中,该方法可以包括以下步骤:
步骤101:接收用户在终端界面上进行操作的操作数据。
如图2中所示,用户在终端界面上进行操作,该操作数据中包含有用户在终端界面上进行操作的操作位置。
需要说明的是,终端界面上预先被划分有多个相互独立的操作区域,如图3中所示,终端界面为购物应用的列表界面,该界面上包含有多个商品的显示区域,本实施例中基于当前界面上的显示内容布局特点,对界面进行区域划分,将每个商品的显示区域划分为一个操作区域,操作区域之间相互独立,互不重叠。或者,如图4中所示,终端界面为终端的系统桌面界面,该界面上包含多个应用的图标显示区域,本实施例中基于当前界面上的显示内容布局特点,对界面上进行区域划分,将每个应用的显示区域划分为一个操作区域,操作区域之间相互独立,互不重叠。
步骤102:确定与操作位置相对应的目标操作区域。
其中,本实施例中所确定的目标操作区域可以与用户在终端界面上进行操作的操作位置相对应,这里的操作位置与目标操作区域相对应可以是直接包含的对应,如目标操作区域包含该操作位置,或者也可以是应用上的对应,如目标操作区域为操作位置功能关联的区域,具体如下:
在一种实现方式中,本实施例在确定与操作位置相对应的目标操作区域时,可以通过以下步骤实现,如图5中所示:
步骤121:在终端界面上的操作区域中,确定区域位置范围包含操作位置的目标操作区域。
如图6中所示,用户对终端界面上进行点击操作,用户的操作位置在商品A所对应的操作区域中,那么本实施例中将该商品A所对应的操作区域确定为目标操作区域。
在另一种实现方式中,本实施例在确定与操作位置相对应的目标操作区域时,可以通过以下步骤实现,如图7中所示:
步骤122:在所述终端界面上的操作区域中,确定与操作位置具有预设的映射关系的目标操作区域。
其中,该映射关系包括有:功能相关联的关系。如图8中所示,用户在通讯录界面上点击通话操作区域,本实施例中将通话操作区域所对应的通讯号码区域确定为目标操作区域。
步骤103:获取目标操作区域上的目标图像。
其中,本实施例中可以通过屏幕截图的方式来获取整个终端界面的图像,再从终端界面的图像上截取目标操作区域上的目标图像。
步骤104:对目标图像进行文字识别,得到识别结果。
其中,本实施例中可以利用图像识别算法对目标图像中的文字进行识别,从而得到目标图像中的文本内容,即识别结果。
在一种实现方式中,本实施例可以通过以下步骤实现对目标图像的文字识别,如图9中所示:
步骤901:判断当前是否有网络连接,如果有网络连接,那么执行步骤902,否则,执行步骤903。
其中,本实施例中可以通过对网页进行测试等方式来判断当前终端是否有网络连接,如无线网络连接如WiFi网络等或者有线网络连接,如局域网等。
步骤902:基于网络连接对目标图像进行文字识别,得到识别结果。
其中,本实施例中可以基于网络连接获得网络上共享的各种图像识别算法或文字识别算法,以此来实现对目标图像的文字识别,得到识别结果。
步骤903:基于本地离线OCR对目标图像进行文字识别,得到识别结果。
其中,本地离线OCR(Optical Character Recognition)的文字识别方案是通过检测暗亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字,从而实现文字识别,得到识别结果。
步骤105:以预设的输出方式输出识别结果。
其中,该识别结果可以为在目标操作区域的目标图像中识别出的文字信息,这里的输出方式可以为:通过喇叭或者耳机以音频的方式输出识别结果。
在一种实现方式中,该识别结果可能表明目标图像中没有文字信息,那么,本实施例中还可以包括以下步骤:
步骤106:在识别结果表明无文字信息时,输出表明未识别出文字的提示信息。
在一种实现方式中,本实施例可以通过喇叭或者耳机以音频的方式输出″未识别出文字″的提示信息。
由上述技术方案,本申请实施例提供的一种文本操作方法,预先在终端界面划分多个独立的操作区域,用户在终端界面上进行操作时,通过确定与操作位置相对应的目标操作区域,从而获取该目标操作区域的目标图像后,对该目标图像进行文字识别,得到识别结果。本实施例中不需要用户自己去划分或选定图像区域,而是预先在终端界面上划分好操作区域后,基于用户的操作位置来选定图像区域,从而为具有视觉障碍的用户提供便利,满足具有视觉障碍的用户对文字识别的需求。
参考图10,为本申请实施例二提供的一种文本操作装置的结构示意图,该装置适用于如手机、pad或电脑等触控终端上,用于对终端界面上的图像进行文字识别,为具有视觉障碍的用户提供便利。
在本实施例中,该装置可以包括以下结构:
操作接收单元1001,用于接收用在终端界面上进行操作的操作数据。
其中,如图2中所示,用户在终端界面上进行操作,该操作数据中包含有用户在终端界面上进行操作的操作位置。
需要说明的是,终端界面上预先被划分有多个相互独立的操作区域,如图3中所示,终端界面为购物应用的列表界面,该界面上包含有多个商品的显示区域,本实施例中基于当前界面上的显示内容布局特点,对界面进行区域划分,将每个商品的显示区域划分为一个操作区域,操作区域之间相互独立,互不重叠。或者,如图4中所示,终端界面为终端的系统桌面界面,该界面上包含多个应用的图标显示区域,本实施例中基于当前界面上的显示内容布局特点,对界面上进行区域划分,将每个应用的显示区域划分为一个操作区域,操作区域之间相互独立,互不重叠。
目标确定单元1002,用于确定与所述操作位置相对应的目标操作区域。
其中,本实施例中所确定的目标操作区域可以与用户在终端界面上进行操作的操作位置相对应,这里的操作位置与目标操作区域相对应可以是直接包含的对应,如目标操作区域包含该操作位置,或者也可以是应用上的对应,如目标操作区域为操作位置功能关联的区域,具体如下:
在一种实现方式中,目标确定单元1002中可以包含以下结构,如图11中所示:
第一确定子单元1021,用于在所述终端界面上的操作区域中,确定区域位置范围包含所述操作位置的目标操作区域。
如图6中所示,用户对终端界面上进行点击操作,用户的操作位置在商品A所对应的操作区域中,那么本实施例中,目标确定单元1002通过第一确定子单元1021将该商品A所对应的操作区域确定为目标操作区域。
第二确定子单元1022,用于在所述终端界面上的操作区域中,确定与所述操作位置具有预设的映射关系的目标操作区域。
其中,该映射关系包括有:功能相关联的关系。如图8中所示,用户在通讯录界面上点击通话操作区域,本实施例中,目标确定单元1002通过第二确定子单元1022将通话操作区域所对应的通讯号码区域确定为目标操作区域。
图像获取单元1003,用于获取所述目标操作区域上的目标图像。
其中,本实施例中可以通过屏幕截图的方式来获取整个终端界面的图像,再从终端界面的图像上截取目标操作区域上的目标图像。
文字识别单元1004,用于对所述目标图像进行文字识别,得到识别结果。
其中,本实施例中可以利用图像识别算法对目标图像中的文字进行识别,从而得到目标图像中的文本内容,即识别结果。
在一种实现方式中,文字识别单元1004可以通过以下结构实现对目标图像的文字识别,如图12中所示:
网络判断子单元1201,用于判断当前是否有网络连接,如果有网络连接,触发第一识别子单元1202,否则,触发第二识别子单元1203。
其中,本实施例中可以通过对网页进行测试等方式来判断当前终端是否有网络连接,如无线网络连接如WiFi网络等或者有线网络连接,如局域网等。
第一识别子单元1202,用于基于网络连接对所述目标图像进行文字识别,得到识别结果。
其中,本实施例中可以基于网络连接获得网络上共享的各种图像识别算法或文字识别算法,以此来实现对目标图像的文字识别,得到识别结果。
第二识别子单元1203,用于基于本地离线OCR对所述目标图像进行文字识别,得到识别结果。
其中,本地离线OCR(Optical Character Recognition)的文字识别方案是通过检测暗亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字,从而实现文字识别,得到识别结果。
结果输出单元1005,用于以预设的输出方式输出所述识别结果。
在一种实现方式中,识别结果中可能包含识别出的文字,也可能表明目标图像中没有文字信息,那么本实施例中结果输出单元1005可以通过以下结构实现,如图13中所示:
有文字输出子单元1301,用于将识别结果中的文字信息进行输出。
其中,该识别结果可以为在目标操作区域的目标图像中识别出的文字信息,这里的输出方式可以为:通过喇叭或者耳机以音频的方式输出识别结果。
无文字输出子单元1302,用于在所述识别结果表明无文字信息时,输出表明未识别出文字的提示信息。
在一种实现方式中,本实施例可以通过喇叭或者耳机以音频的方式输出″未识别出文字″的提示信息。
由上述技术方案,本申请实施例提供的一种文本操作装置,预先在终端界面划分多个独立的操作区域,用户在终端界面上进行操作时,通过确定与操作位置相对应的目标操作区域,从而获取该目标操作区域的目标图像后,对该目标图像进行文字识别,得到识别结果。本实施例中不需要用户自己去划分或选定图像区域,而是预先在终端界面上划分好操作区域后,基于用户的操作位置来选定图像区域,从而为具有视觉障碍的用户提供便利,满足具有视觉障碍的用户对文字识别的需求。
参考图14,为本申请实施例三提供的一种终端的结构示意图,该终端可以为手机、pad或电脑等触控终端,该终端可以为具有视觉障碍的用户提供便利。
在本实施例中,该终端可以包括以下结构:
显示器1401,用于显示终端界面。
如图2中所示,用户可以在终端界面上进行操作。
存储器1402,用于存储应用程序及应用程序运行所产生的数据。
其中,存储器1402可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
处理器1403,用于接收用户在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域,确定与所述操作位置相互对应的目标操作区域,获取所述目标操作区域上的目标图像,对所述目标图像进行文字识别,得到识别结果。
输出设备1404,用于将所述识别结果进行输出。
其中,该输出设备1404可以为喇叭或者耳机等音频输出设备,用以将识别结果进行输出,例如,将识别结果中识别出的文字信息进行音频输出,或者在识别结果表明未识别出文字时,以音频的方式输出″未识别出文字″的提示信息。
以终端为手机为例,对本实施例进行举例说明:
具有视觉障碍的用户在使用手机时,通过操作手机上的硬件如侧边控件开启手机的talkback功能,默认开启文字识别功能。具有视觉障碍的用户在手机触控屏上进行单机、双击或长按等操作,而基于上述本实施例的实现方案,在手机开启文字识别功能之后,会预先将手机的显示界面按照其当前显示应用或显示内容进行划分,划分为若干个独立的操作区域,如图15中所示,按照购物应用的商品列表将显示界面划分为多个商品操作区域,之后,手机根据用户的操作位置来自动截取手机显示界面的屏幕图像,再将其裁剪至操作位置所对应的操作区域的大小,对剪裁出来的操作区域大小的图像进行文字识别,在识别出文字时,直接语音播放出识别出的文字,如果没有文字识别出,那么语音提示″未识别出文字″。
需要说明的是,在有网络连接时,可以适用网络资源对图像进行文字识别,而没有网络时,改用本地的离线OCR进行文字识别。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述文本操作方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述文本操作方法。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:接收用户在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域;确定与所述操作位置相对应的目标操作区域;获取所述目标操作区域上的目标图像;对所述目标图像进行文字识别,得到识别结果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语″包括″、″包含″或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句″包括一个......″限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种文本操作方法,其特征在于,包括:
接收用户在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域,所述操作区域是在终端界面上预先被划分的;
确定与所述操作位置相对应的目标操作区域;
获取所述目标操作区域上的目标图像;
对所述目标图像进行文字识别,得到识别结果;
其中,所述确定与所述操作位置相对应的目标操作区域,包括,在所述终端界面上的所述操作区域中,确定与所述操作位置具有预设的映射关系的目标操作区域,所述映射关系指功能相关联的关系。
2.根据权利要求1所述的方法,其特征在于,对所述目标图像进行文字识别,得到识别结果,包括:
判断当前是否有网络连接,如果有网络连接,那么基于网络连接对所述目标图像进行文字识别,得到识别结果,否则,基于本地离线光学字符识别OCR对所述目标图像进行文字识别,得到识别结果。
3.根据权利要求1所述的方法,其特征在于,还包括:
以预设的输出方式输出所述识别结果。
4.根据权利要求1所述的方法,其特征在于,以预设的输出方式输出识别结果,包括:
在所述识别结果表明无文字信息时,输出表明未识别出文字的提示信息。
5.一种文本操作装置,其特征在于,包括:
操作接收单元,用于接收用在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域,所述操作区域是在终端界面上预先被划分的;
目标确定单元,用于确定与所述操作位置相对应的目标操作区域;
图像获取单元,用于获取所述目标操作区域上的目标图像;
文字识别单元,用于对所述目标图像进行文字识别,得到识别结果;
其中,所述确定与所述操作位置相对应的目标操作区域,包括,在所述终端界面上的所述操作区域中,确定与所述操作位置具有预设的映射关系的目标操作区域,所述映射关系指功能相关联的关系。
6.根据权利要求5所述的装置,其特征在于,所述文字识别单元包括:
网络判断子单元,用于判断当前是否有网络连接,如果有网络连接,触发第一识别子单元,否则,触发第二识别子单元;
第一识别子单元,用于基于网络连接对所述目标图像进行文字识别,得到识别结果;
第二识别子单元,用于基于本地离线OCR对所述目标图像进行文字识别,得到识别结果。
7.根据权利要求5所述的装置,其特征在于,还包括:
结果输出单元,用于以预设的输出方式输出所述识别结果。
8.根据权利要求7所述的装置,其特征在于,所述结果输出单元包括:
无文字输出子单元,用于在所述识别结果表明无文字信息时,输出表明未识别出文字的提示信息。
9.一种终端,其特征在于,包括:
显示器,用于显示终端界面;
存储器,用于存储应用程序及应用程序运行所产生的数据;
处理器,用于接收用户在终端界面上进行操作的操作数据,所述操作数据包含用户在所述终端界面上进行操作的操作位置,且所述终端界面上包含多个相互独立的操作区域,所述操作区域是在终端界面上预先被划分的,确定与所述操作位置相互对应的目标操作区域,获取所述目标操作区域上的目标图像,对所述目标图像进行文字识别,得到识别结果;
其中,所述确定与所述操作位置相对应的目标操作区域,包括,在所述终端界面上的所述操作区域中,确定与所述操作位置具有预设的映射关系的目标操作区域,所述映射关系指功能相关联的关系。
10.根据权利要求9所述的终端,其特征在于,还包括:
输出设备,用于将所述识别结果进行输出。
CN201711069907.3A 2017-11-03 2017-11-03 一种文本操作方法、装置及终端 Active CN107729897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711069907.3A CN107729897B (zh) 2017-11-03 2017-11-03 一种文本操作方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711069907.3A CN107729897B (zh) 2017-11-03 2017-11-03 一种文本操作方法、装置及终端

Publications (2)

Publication Number Publication Date
CN107729897A CN107729897A (zh) 2018-02-23
CN107729897B true CN107729897B (zh) 2020-09-15

Family

ID=61222419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711069907.3A Active CN107729897B (zh) 2017-11-03 2017-11-03 一种文本操作方法、装置及终端

Country Status (1)

Country Link
CN (1) CN107729897B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427962B (zh) * 2018-03-01 2021-05-25 创新先进技术有限公司 一种识别的方法、装置及设备
CN109803050B (zh) * 2019-01-14 2020-09-25 南京点明软件科技有限公司 一种适用于盲人操作手机的全屏引导点击方法
CN110275667B (zh) * 2019-06-25 2021-12-17 努比亚技术有限公司 内容显示方法、移动终端及计算机可读存储介质
CN111338540B (zh) * 2020-02-11 2022-02-18 Oppo广东移动通信有限公司 图片文本处理方法、装置、电子设备和存储介质
CN113190697A (zh) * 2021-06-02 2021-07-30 口碑(上海)信息技术有限公司 一种图像信息播放方法及装置
CN113485592A (zh) * 2021-06-18 2021-10-08 浪潮卓数大数据产业发展有限公司 一种基于移动端的无障碍服务方法、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2704014A1 (en) * 2011-04-28 2014-03-05 Rakuten, Inc. Server, server control method, program and recording medium
CN106484266A (zh) * 2016-10-18 2017-03-08 北京锤子数码科技有限公司 一种文本处理方法及装置
CN106527945A (zh) * 2016-11-09 2017-03-22 广东小天才科技有限公司 文本信息提取方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2704014A1 (en) * 2011-04-28 2014-03-05 Rakuten, Inc. Server, server control method, program and recording medium
CN106484266A (zh) * 2016-10-18 2017-03-08 北京锤子数码科技有限公司 一种文本处理方法及装置
CN106527945A (zh) * 2016-11-09 2017-03-22 广东小天才科技有限公司 文本信息提取方法及装置

Also Published As

Publication number Publication date
CN107729897A (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
CN107729897B (zh) 一种文本操作方法、装置及终端
JP5956725B2 (ja) コンテキスト認識型ヘルプ・コンテンツを提供する方法、デバイス、及びコンピュータ・プログラム製品
US20170324859A1 (en) Information processing method, terminal, and computer-readable storage medium
US9304608B2 (en) Stylus device
US20160085404A1 (en) Mobile Application Configuration
TWI683251B (zh) 界面展示方法及裝置
CN108463799B (zh) 电子设备的柔性显示器及其操作方法
US20190130647A1 (en) Display control method and system, and virtual reality device
JP6239783B2 (ja) 情報選択方法及び装置
JP2020107347A (ja) ファイルパスを記憶し、ローカルファイルにアクセスする方法及び装置
US20210150053A1 (en) Method, device, and storage medium for image desensitization
CN109857964B (zh) 一种页面操作的热力图绘制方法、装置、存储介质及处理器
CN111294459A (zh) 检测安卓手机隐私的方法及设备
CN112068911A (zh) 电子表单的生成方法、装置、系统、设备以及介质
CN112149179A (zh) 基于隐私保护的风险识别方法及装置
CN111314445A (zh) 手机控制回收机开门方法及装置
CN110868347A (zh) 消息提示方法、装置和系统
CN107122236B (zh) 一种控制应用程序前台运行的方法与装置
KR102186455B1 (ko) 사용자 맞춤 기능 추천 방법 및 이를 실행하기 위한 모바일 디바이스
CN106648913B (zh) 数据采集软件标识方法及装置
JP6797293B2 (ja) アプリケーションにおいてアクセシビリティ機能を実施するための方法及び装置
CN111142990A (zh) 一种微信小程序页面展示方法、装置、及存储介质
CN110875975A (zh) 一种信息处理方法及设备
CN111198830B (zh) 移动存储设备的识别方法、装置、电子设备以及存储介质
CN109582191B (zh) 一种菜单内容显示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190118

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: BEIJING ZIJIE TIAODONG NETWORK TECHNOLOGY CO., LTD.

Address before: 610051 Longtan Industrial Park, Second Section of East Ring Road, Chenghua District, Chengdu City, Sichuan Province

Applicant before: Chengdu - Digital Technology Co. Ltd.

GR01 Patent grant
GR01 Patent grant