CN111381751A

CN111381751A - 一种文本处理方法及装置

Info

Publication number: CN111381751A
Application number: CN202010066531.6A
Authority: CN
Inventors: 罗永浩; 田作辉
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2016-10-18
Filing date: 2016-10-18
Publication date: 2020-07-07
Also published as: US10489047B2; CN106484266B; US20180107359A1; CN106484266A

Abstract

本发明实施例提供了一种文本处理方法，触控终端具有在不同位置上的用于显示不同内容的多个显示区域，多个显示区域分别由一视图控件所显示并由各自的区域位置信息进行划分，区域位置信息分别为一坐标范围，所述文本处理方法包括：在触控终端上显示文字区域，其中，文字区域为所述多个显示区域之中的包含文字的区域；当外界触控的坐标落在文字区域的坐标范围之内时，识别文字区域中的文字，得到待处理文本；对待处理文本中的文字进行分词；以及显示分词结果。本发明实施例提供的文本处理方法，能够高效快捷的得到外界触控所指示的区域中的词，方便用户直接选择文本中的关键词，无需用户在后续操作时另外输入关键词，提高了操作的效率。

Description

一种文本处理方法及装置

本申请是发明名称为“一种文本处理方法及装置”、申请日为2016年10月18 日、申请号为201610908977.2的中国专利申请的分案申请。

技术领域

本发明涉及人机交互技术领域，尤其涉及一种文本处理方法及装置。

背景技术

目前，人们每天都会在手机或平板电脑等触控终端上收到大量的文字信息，例如短信和即时通讯类软件等各大应用的消息推送等。当触控终端的用户想要对文字信息中的感兴趣的关键词进行操作(例如搜索文字信息中的关键词或分享文字信息中的关键词)时，需进行多步操作，操作耗时长、不便捷。

因此，本领域技术人员需要提供一种文本处理方法及装置，能够方便用户对文本中的关键词进行操作。

发明内容

为了解决现有技术问题，本发明提供了一种文本处理方法及装置，能够方便用户对文本中的关键词进行操作。

本发明实施例提供了一种文本处理方法，包括：

响应于触控终端感应到的外界触控，获取所述外界触控的位置信息；

根据所述外界触控的位置信息，获取文字图像；

识别所述文字图像中的文字，得到第一文本；

对所述第一文本中的文字进行分词，得到分词结果；

显示所述分词结果。

优选地，所述根据所述外界触控的位置信息，获取文字图像，具体包括：

根据所述外界触控的位置信息，获取分词区域；

对所述分词区域进行截图，得到所述文字图像。

优选地，所述根据所述外界触控的位置信息，获取分词区域，具体包括：

获取所述触控终端上每个显示区域的区域位置信息；

根据所述外界触控的位置信息和所述触控终端上每个显示区域的区域位置信息，逐一检测所述外界触控与所述触控终端上每个显示区域的位置关系；

当所述外界触控落在第一显示区域内时，则确定所述第一显示区域为所述分词区域，所述第一显示区域为所述触控终端上一显示区域。

优选地，所述显示所述分词结果，具体包括：

生成分词显示界面和至少一个视图控件；

将所述分词结果中的每个词分别添加至一个视图控件中；

在所述分词显示界面上显示全部视图控件。

优选地，所述对所述第一文本中的文字进行分词，得到分词结果，具体包括：

判断所述第一文本的字符数量是否大于预设值；

如果否，则对所述第一文本中全部文字进行分词，得到所述分词结果；

如果是，则根据所述外界触控的位置信息，确定第二文本，并对所述第二文本中全部文字进行分词，得到所述分词结果，所述第一文本包括所述第二文本中的全部文字，且所述第二文本中字符的数量等于所述预设值。

优选地，所述显示所述分词结果，之后还包括：

接收用户触发的关键词选择指令，所述关键词选择指令是根据所述分词结果发出的；

根据所述关键词选择指令，从所述分词结果中获取所述用户选择的关键词；

显示所述关键词；

接收所述用户触发的关键词操作指令，所述关键词操作指令携带有操作类型，所述操作类型包括搜索和分享；

根据所述操作类型，对所述关键词进行操作。

本发明实施例还提供了一种文本处理方法，包括：

在触摸屏上显示文字区域；

响应于对所述文字区域的外界触控，对所述文字区域进行截图，得到文字图像；

识别所述文字图像中的文字，得到待处理文本；

对所述待处理文本中的文字进行分词；

显示所述分词结果。

优选地，所述显示所述分词结果，具体包括：

生成分词显示界面，所述分词显示界面包括至少一个子视图；

分别在每个子视图中显示所述分词结果中的一个词。

本发明实施例还提供了一种文本处理装置，包括：位置获取模块、图像获取模块、文字识别模块、分词处理模块和分词显示模块；

所述位置获取模块，用于响应于触控终端感应到的外界触控，获取所述外界触控的位置信息；

所述图像获取模块，用于根据所述外界触控的位置信息，获取文字图像；

所述文字识别模块，用于识别所述文字图像中的文字，得到第一文本；

所述分词处理模块，用于对所述第一文本中的文字进行分词，得到分词结果；

所述分词显示模块，用于显示所述分词结果。

优选地，所述图像获取模块，具体包括：获取子模块和截图子模块；

所述获取子模块，用于根据所述外界触控的位置信息，获取分词区域；

所述截图子模块，用于对所述分词区域进行截图，得到所述文字图像。

优选地，所述获取子模块，具体包括：位置信息获取子模块、位置关系确定子模块和分词区域确定子模块；

所述位置信息获取子模块，用于获取所述触控终端上每个显示区域的区域位置信息；

所述位置关系确定子模块，用于根据所述外界触控的位置信息和所述触控终端上每个显示区域的区域位置信息，逐一检测所述外界触控与所述触控终端上每个显示区域的位置关系；

所述分词区域确定子模块，用于当所述外界触控落在第一显示区域内时，则确定所述第一显示区域为所述分词区域，所述第一显示区域为所述触控终端上一显示区域。

优选地，所述分词显示模块，具体包括：生成子模块、添加子模块和显示子模块；

所述生成子模块，用于生成分词显示界面和至少一个视图控件；

所述添加子模块，用于将所述分词结果中的每个词分别添加至一个视图控件中；

所述显示子模块，用于在所述分词显示界面上显示全部视图控件。

优选地，述分词处理模块，具体包括：判断子模块、分词子模块和确定子模块；

所述判断子模块，用于判断所述第一文本的字符数量是否大于预设值；

所述分词子模块，用于当所述判断子模块判断所述第一文本的字符数量不大于预设值时，对所述第一文本中全部文字进行分词，得到所述分词结果；

所述确定子模块，用于当所述判断子模块判断所述第一文本的字符数量大于预设值时，根据所述外界触控的位置信息，确定第二文本所述第一文本包括所述第二文本中的全部文字，且所述第二文本中字符的数量等于所述预设值；

所述分词子模块，还用于当所述判断子模块判断所述第一文本的字符数量大于预设值时，对所述第二文本中全部文字进行分词，得到所述分词结果。

优选地，还包括：指令接收模块、关键词获取模块、关键词显示模块和关键词操作模块；

所述指令接收模块，用于接收用户触发的关键词选择指令，所述关键词选择指令是根据所述分词结果发出的；

所述关键词获取模块，用于根据所述关键词选择指令，从所述分词结果中获取所述用户选择的关键词；

所述关键词显示模块，用于显示所述关键词；

所述指令接收模块，还用于接收所述用户触发的关键词操作指令，所述关键词操作指令携带有操作类型，所述操作类型包括搜索和分享；

所述关键词操作模块，用于根据所述操作类型，对所述关键词进行操作。

本发明实施例还提供了一种文本处理装置，包括：显示模块、截图模块、识别模块和分词模块；

所述显示模块，用于在触摸屏上显示文字区域；

所述截图模块，用于响应于对所述文字区域的外界触控，对所述文字区域进行截图，得到文字图像；

所述识别模块，用于识别所述文字图像中的文字，得到待处理文本；

所述分词模块，用于对所述待处理文本中的文字进行分词；

所述显示模块，还用于显示所述分词结果。

优选地，所述显示模块，具体包括：生成子模块和显示子模块；

所述生成子模块，用于生成分词显示界面，所述分词显示界面包括至少一个子视图；

所述显示子模块，用于分别在每个子视图中显示所述分词结果中的一个词。

与现有技术相比，本发明至少具有以下优点：

本发明实施例提供的文本处理方法，在触控终端感应到的外界触控后，获取外界触控的位置信息。根据外界触控的位置信息，确定分词区域，并根据文字区域，得到包括待分词文本的文字图像。该文字图像为用户需进一步操作的关键词所属的区域。之后，识别文字图像中的文字，得到第一文本后，再对第一文本进行分词，得到分词结果。而后，将分词结果显示，以便用户从分词结果中选择一个或多个关键词后进行下一步操作。这样，本发明实施例提供的文本处理方法，将触控感应、图像识别以及分词技术相结合，能够在各种不同的系统情况下，高效快捷的得到外界触控所指示的区域中的字、词语和命名实体等，方便用户直接选择文本中的关键词，无需用户在后续操作时另外输入关键词，提高了操作的效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本发明提供的文本处理方法实施例一的流程示意图；

图2a为本发明实施例提供的文本处理方法中外界触控区域和分词区域的示意图；

图2b为图2a中所示文本的分词结果的示意图；

图3a-图3c为本发明实施例提供的文本处理方法中分词显示界面的示意图；

图4a和图4b为本发明实施例提供的文本处理方法中对分词结果中的关键词进行一种操作时的示意图；

图5a-图5c为本发明实施例提供的文本处理方法中对分词结果中的关键词进行另一种操作时的示意图；

图6为本发明提供的文本处理方法实施例二的流程示意图；

图7为本发明提供的文本处理装置实施例一的结构示意图；

图8为本发明提供的文本处理装置实施例二的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明的具体实施方式做详细的说明。

在介绍本发明的具体实施方式之前，首先介绍与本发明具体实施方式相关的多个技术术语。

压力触控：当触控终端如触屏手机感受到外界压力后，系统可以捕获到压力信息。

分词：指的是将一个文字序列切分成一个一个单独的字、词语或命名实体等。分词过程就是按照一定的规范，将连续的文字序列重新组合成单独的字、词语或命名实体序列的过程。

命名实体：指人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的实体还包括数字、日期、货币、地址等。

关键词：一段完整语句中用户所感兴趣的文字片段。

还需要说明的是，本发明实施例提供的文本处理方法及装置在触控终端运行任何应用程序的情况下均可实现。所述应用程序包括但不限于短信、网页浏览、实时通讯和其他具有文字显示功能的程序等。

方法实施例一：

参见图1，该图为本发明提供的文本处理方法实施例一的流程示意图。

本实施例提供的文本处理方法，包括：

S101：响应于触控终端感应到的外界触控，获取所述外界触控的位置信息；

可以理解的是，触控终端可以为任意一种具有触摸感应功能的设备，包括但不限于手机、平板电脑和穿戴设备等。其感应到的外界触控包括但不限于单点或多点按压、单点或多点滑动操作、单点或多点触摸、单点或多点压力触控和触摸面积感应等。当外界操作满足相应的感应阈值时，触控终端即可感应到相应的外界触控。

当触控终端感应到外界触控时，会获取到外界触控在触控终端上的位置信息，如外界触控的坐标等。外界触控的坐标为该外界触控在触控终端上的坐标(一般用X 轴坐标和Y轴坐标来描述)。此时，系统可识别出外界触控施加的位置，以便对触控区域进行各种后续操作。

S102：根据所述外界触控的位置信息，获取文字图像；

在本实施例的一些可能的实施方式中，根据所述外界触控的位置信息，获取文字图像包括：根据所述外界触控的位置信息，获取分词区域；对所述分词区域进行截图，得到所述文字图像。

作为一个示例，所述外界触控可落在所述分词区域内。

需要说明的是，由于不同的系统之间可能存在不兼容的情况，造成无法直接获取触控终端上显示的文字。此时，为了对触控终端上显示的文字进行处理，可通过对触控终端的显示区域进行截屏，获得显示有该文字的文字图像。再应用图像识别技术识别文字图像中的文字。之后，即可对识别出的文字进行处理。这样，就能够实现在无法直接获取到触控终端上显示的文字的情况下，对触控终端上显示的文字进行操作。

本领域技术人员可采用光学字符识别(Optical Character Recognition,OCR)技术对图像中的文字进行识别。

具体实现时，所述根据所述外界触控的位置信息，获取分词区域，至少有两种可能的实现方式，下面分别进行详细描述。

第一种可能的实现方式，分词区域可根据触控终端当前显示视图以及外界触控的位置信息确定。此时，根据所述外界触控的位置信息，获取分词区域包括：

S1021：获取所述触控终端上每个显示区域的区域位置信息；

可以理解的是，触控终端上各显示区域的位置可根据操作变化。因此，为保证正确获取用户感兴趣的区域中的图像，应以感应到外界触控时触控终端上每个显示区域的位置来确定文字图像。

S1022：根据所述外界触控的位置信息和所述触控终端上每个显示区域的区域位置信息，逐一检测所述外界触控与所述触控终端上每个显示区域的位置关系；

S1023：当所述外界触控落在第一显示区域内时，则确定所述第一显示区域为所述分词区域，所述第一显示区域为所述触控终端上一显示区域。

一般，触控终端的不同位置上显示有各种不同内容的显示区域，如显示文字的区域和显示图像的区域。各显示区域间均由区域坐标进行划分。而系统中一般会保存有触控终端上各显示区域的位置坐标。当获取到外界触控的位置信息后，能够以触控终端上各显示区域的位置坐标和外界触控的位置信息为依据，识别出外界触控位于哪个显示区域。然后，即可将该显示区域确定为分词区域。

以坐标为例，触控终端上各显示区域的区域位置信息为一坐标范围区域。当获取到外界触控的坐标后，可判断出外界触控落在触控终端上的哪一显示区域的坐标范围中。外界触控所属的区域即为分词区域。

在一些可能的情况中，外界触控可能落在显示图像的显示区域上。当获取到外界触控的位置信息后，该显示区域的范围即为分词区域，该区域所显示的图像即为文字图像，无需对分词区域进行截图处理。

此外，当在触控终端系统上运行一全屏显示应用，如网页、阅读器等时，触控终端上各显示区域并无实际显示的线条区分。此时，屏幕显示的区域也是分为图片显示区域和文字显示区域，各区域分别由不同的视图控件所显示，并由位置信息进行划分。当外界触控处于显示文字的显示区域中时，触控终端上整个显示文字的区域即为分词区域。

图2a举例示出了该可能的实现方式中所述的获取分词区域的方法。可以理解的是，以下仅为示例性说明，并不对本发明做任何限定。

如图2a所示，外界触控落在触控终端上手指处圆形所围的区域。此时，系统可获取到出外界触控的位置信息，并根据外界触控的位置信息以及各视图控件的位置，确定分词区域为手指所在的短信文本框所划分的区域。

这里还需要说明的是，图2a所示仅是以单指按压激活外界触控为例来说明如何确定分词区域，本发明不对如何激活外界触控进行限制，本领域技术人员可根据实际情况具体设定，具体实施方式与上述类似，在此不再一一赘述。

第二种可能的实现方式，分词区域可根据预设的分词范围确定。

具体的，在获取到外界触控的位置信息后，根据预设的分词范围，划分出一包含有外界触控的区域，该区域即为分词区域。例如，可将外界触控上方100个像素点、外界触控下方100个像素点以及触控终端显示宽度以内的区域划分为分词区域。

这里需要说明的是，在采用区域划分的方法时，该区域中可能会包括不完整的字。这时，在截图后对文字图像进行文字识别时，不完整的字会影响到文字识别的精度。因此，当在获取到分词区域后，可相应的缩小或放大该分词区域，使之不包括不完整的字。也可以在截图得到文字图像后，应用图像识别技术，识别出文字图像中不完整的字，将不完整的字从文字图像中去除。

S103：识别所述文字图像中的文字，得到第一文本；

本领域技术人员可采用光学字符识别(Optical Character Recognition,OCR)技术对文字图像中的文字进行识别，具体的文字识别方法和过程这里不再赘述。

S104：对所述第一文本中的文字进行分词，得到分词结果；

作为一个例子，本领域技术人员可采用自然语言算法根据第一文本中文字的具体语义对第一文本进行分词，具体分词方法及过程这里不再赘述。

由于分词区域中包括的文字数量可能过多。实际操作时，将第一文本中的所有文字均进行分词操作，会得到过多的分词结果，不方便用户从中选择关键词。因此，为了提高分词效率，方便用户从分词结果中选择关键词，本实施例提供的文本处理方法还可根据实际情况，对文字图像中的一部分文字进行分词，使用户从该一部分文字的分词结果中选择关键词，提高用户的交互体验。

在本实施例的一个优选的实施方案中，对所述第一文本中的文字进行分词，得到分词结果包括：判断所述第一文本的字符数量是否大于预设值；如果否，则对所述第一文本中全部文字进行分词，得到所述分词结果；如果是，则根据所述外界触控的位置信息，确定第二文本，并对所述第二文本中全部文字进行分词，得到所述分词结果，所述第一文本包括所述第二文本中的全部文字，且所述第二文本中字符的数量等于所述预设值。

需要说明的是，当得到外界触控的位置信息时，可得知外界触控处于第一文本中的哪个字符附近。此时，可根据预设规则，获取外界触控附近数量等于预设值的字符，生成第二文本，并对第二文本进行分词，得到分词结果。例如，取压力感应区域附近的50或100个字生成第二文本。这50或100个字，可以从外界触控处向前取一半数量的字，并从外界触控处向后取一半数量的字。本领域技术人员还可以根据实际情况，具体设定得到第二文本的方式，在此不再一一列举。

S105：显示所述分词结果。

对第一文本进行分词后，得到多个词语、字、短语和命名实体等，即分词结果。图2b示出了图2a所示的分词区域中文本的分词结果。

将文字图像中显示的文本分词后，显示分词结果。这样，用户即可从分词结果中直接选择需要进一步操作的关键词，便于用户直接对文本中的关键词进行操作。

可以理解的是，上述实施例中得到的分词结果可在窗口中将其显示给用户。并且，用户可选择关闭该关键词选择窗口来终止关键词选择过程。

在本实施例的一些可能的实现方式中，所述显示所述分词结果包括：生成分词显示界面和至少一个视图控件；将所述分词结果中的每个词分别添加至一个视图控件中；在所述分词显示界面上显示全部视图控件。

图3a-图3c示出了一种分词显示界面的具体实现形式。分词显示界面中每个长方形块为显示出的一个视图控件，每个视图控件用于显示分词结果中的一个词 (字、词语或命名实体)。每个视图控件的显示大小、显示位置等可根据实际情况具体设定。例如，可将每个视图控件分散显示在分词显示界面中，以方便用户从中选择关键词。同时，本领域技术人员还可根据需求，使用不同的颜色、字体或大小等显示分词结果中的字、词语或命名实体，如使用不同显示效果显示分词结果中的数字或用户选择概率高的词。当用户从分词结果中选择关键字时，可直接点击分词显示界面中相应的视图控件。分词结果中各个字、词语或命名实体之间可如图3a- 图3c所示的之间存在间距，也可不存在间距仅由线分开。当分词结果过多，无法在完全显示分词结果的情况下保证用户能分辨出显示内容时，可一次显示但滑动展示给用户，也可分次显示给用户。另外，分词显示界面或窗口中包括一关闭键，如图3c中左下角所示的“×”键，用户通过点击该关闭键关闭分词显示界面或窗口。

此外，显分词显示界面的形式可如图3a-图3c所示，还可为其他显示方式，如在外界触控区域附近创建窗口显示等。本领域技术人员可根据实际情况具体设定显示分词结果的方式及显示分词结果时每个词的排列顺序，如将使用频率高的词或数字显示在前面或突出显示。

在本实施例的一些可能的实现方式中，显示所述分词结果，之后还包括：

首先，接收用户触发的关键词选择指令，所述关键词选择指令是根据所述分词结果发出的；

需要说明的是，如图3a-图3c所示，用户可从分词结果中选择一个或多个字、词语或命名实体，还可选择连续或不连续的字、词语或命名实体。

其次，根据所述关键词选择指令，从所述分词结果中获取所述用户选择的关键词；而后，显示所述关键词；

如图4a和图4b所示，用户通过点击分词结果中的词语或命名实体，触发关键词选择指令。在接收到关键词选择指令后，将用户所选择的关键此突出显示(例如，高亮显示、改变该视图控件或词的颜色、改变字体等)，以便用户对该关键词进行后续操作。

再次，接收所述用户触发的关键词操作指令，所述关键词操作指令携带有操作类型，所述操作类型包括搜索和分享；

最后，根据所述操作类型，对所述关键词进行操作。

在用户选择某一个或多个视图控件后，在相应位置生成与各种操作类型相对应的操作按键。而后，用户通过点击关键词附近的操作按键，触发相应的针对该关键词的关键词操作指令，不同的操作按键代表不同的操作类型。之后，可根据该操作类型，对用户选择的关键词进行操作。该操作包括但不限于搜索和分享等。图4a- 图4b为对关键词进行搜索操作的一种示例，图5a-图5c为对关键词进行分享操作的一种示例。包括对分词结果中的单个字、词语或命名实体及多个字、词语或命名实体进行操作。

本实施例提供的文本处理方法，在触控终端感应到的外界触控后，获取外界触控的位置信息。根据外界触控的位置信息，确定分词区域，并根据文字区域，得到包括待分词文本的文字图像。该文字图像为用户需进一步操作的关键词所属的区域。之后，识别文字图像中的文字，得到第一文本后，再对第一文本进行分词，得到分词结果。而后，将分词结果显示，以便用户从分词结果中选择一个或多个关键词后进行下一步操作。这样，本实施例提供的文本处理方法，将触控感应、图像识别以及分词技术相结合，能够在各种不同的系统情况下，高效快捷的得到外界触控所指示的区域中的字、词语和命名实体等，方便用户直接选择文本中的关键词，无需用户在后续操作时另外输入关键词，提高了操作的效率。

方法实施例二：

参见图6，该图为本发明提供的文本处理方法实施例二的流程示意图。

需要说明的是，本实施例提供的文本处理方法可以应用于客户端，该客户端为任意一种具有触摸感应功能的设备，包括但不限于手机和平板电脑等。

本实施例提供的文本处理方法，包括：

S601：在触摸屏上显示文字区域；

可以理解的是，触摸屏为客户端上的显示设备，例如手机的显示屏即为触摸屏。客户端在触摸屏上分区域显示不同类型的内容，可包括一个或多个显示文字的区域以及一个或多个显示图像的区域等。

上述文字区域为一包括文字的区域，可为触摸屏上显示文字的区域也可以为触摸屏上显示图像的区域，该图像上显示有文字。

需要说明的是，由于不同的系统之间可能存在不兼容的情况，造成在触摸屏所述的系统上文字以图像的形式显示，系统无法直接获取实际的文字。

此时，为了对触控终端上显示的文字进行处理，可通过对触控终端的显示区域进行截屏，获得显示有该文字的文字图像。再应用图像识别技术识别文字图像中的文字。之后，即可对识别出的文字进行处理。这样，就能够保证在不同的系统条件下，均能对触摸屏上显示的文字进行操作。

S602：响应于对所述文字区域的外界触控，对所述文字区域进行截图，得到文字图像；

在一些可能的情况中，文字区域为显示图像的区域。响应于对所述文字区域的外界触控，即可直接获取该区域所显示的图像(即文字图像)，无需对分词区域进行截图处理。

S603：识别所述文字图像中的文字，得到待处理文本；

通过感应用户对相应文字图像的外界触控，可确定需对触摸屏上哪部分显示区域中的内容进行操作。外界触控包括且不限于单点或多点按压、单点或多点滑动操作、单点或多点触摸、单点或多点压力触控和触摸面积感应等。当外界操作满足相应的感应阈值时，客户端即可感应到相应的外界触控。对文本区域中的文字进行分词后，得到多个词语、字、短语和命名实体等，即分词结果。可使用文字识别技术获取文本区域中的文字。

本领域技术人员可采用光学字符识别(Optical Character Recognition,OCR)技术对文字图像中的文字进行识别。

S604：对所述待处理文本中的文字进行分词；

S605：显示所述分词结果。

将文字图像的文本分词后，将分词结果显示。这样，用户就可从分词结果中直接选择需要进一步操作的关键词，便于用户直接对文本中的关键词进行操作。

图2b示出了图2a所示的文字图像中文本的分词结果。

在本实施例的一些可能的实现方式中，显示所述分词结果，具体包括：生成分词显示界面，所述分词显示界面包括至少一个子视图；分别在每个子视图中显示所述分词结果中的一个词。

图3a-图3c示出了一种分词显示界面的具体实现形式。分词显示界面中每个长方形块为显示出的一个视图控件，每个视图控件用于显示分词结果中的一个词(字、词语或命名实体)。每个视图控件的显示大小、显示位置等可根据实际情况具体设定。例如，可将每个视图控件分散显示在分词显示界面中，以方便用户从中选择关键词。同时，本领域技术人员还可根据需求，使用不同的颜色、字体或大小等显示分词结果中的字、词语或命名实体，如使用不同显示效果显示分词结果中的数字或用户选择概率高的词。当用户从分词结果中选择关键字时，可直接点击分词显示界面中相应的视图控件。分词结果中各个字、词语或命名实体之间可存在间距，也可不存在间距仅由线分开。当分词结果过多，无法在完全显示分词结果的情况下保证用户能分辨出显示内容时，可一次显示但滑动展示给用户，也可分次显示给用户。另外，分词显示界面或窗口中包括一关闭键，如图3c中左下角所示的“×”键，用户通过点击该关闭键关闭分词显示界面或窗口。

最后，根据所述操作类型，对所述关键词进行操作。

本实施例提供的文本处理方法，在触摸屏上显示文字图像后，当感应到对所述文字图像的外界触控后，识别文字图像中的文字，并对识别出的文字进行分词。之后，将分词结果显示，以便用户从分词结果中选择一个或多个关键词后进行下一步操作。本实施例提供的文本处理方法，将触控感应、图像识别以及分词技术相结合，在各种不同的系统条件下，均能高效快捷的得到外界触控所指示的区域中的字、词语和命名实体等，方便用户直接选择文本中的关键词，无需用户在后续操作时另外输入关键词，提高了操作的效率。

基于上述实施例提供的文本处理方法，本发明实施例还提供了一种文本处理装置。

装置实施例一：

参见图7，该图为本发明提供的文本处理装置实施例一的结构示意图。

本实施例提供的文本处理装置，包括：位置获取模块100、图像获取模块200、文字识别模块300、分词处理模块400和分词显示模块500；

所述位置获取模块100，用于响应于触控终端感应到的外界触控，获取所述外界触控的位置信息；

所述图像获取模块200，用于根据所述外界触控的位置信息，获取文字图像；

在一个例子中，所述图像获取模块200，具体包括：获取子模块和截图子模块(均未在图中示出)；

作为一个示例，所述获取子模块，具体包括：位置信息获取子模块、位置关系确定子模块和分词区域确定子模块(均未在图中示出)；

所述文字识别模块300，用于识别所述文字图像中的文字，得到第一文本；

所述分词处理模块400，用于对所述第一文本中的文字进行分词，得到分词结果；

在一个例子中，所述分词处理模块400，具体包括：判断子模块、分词子模块和确定子模块(均未在图中示出)；

所述分词显示模块500，用于显示所述分词结果。

在一个例子中，所述分词显示模块500，具体包括：生成子模块、添加子模块和显示子模块(均未在图中示出)；

在的一些可能的实现方式中，本实施例提供的文本处理装置，还包括：指令接收模块、关键词获取模块、关键词显示模块和关键词操作模块(均未在图中示出)；

所述关键词显示模块，用于显示所述关键词；

本实施例提供的文本处理装置，在触控终端感应到的外界触控后，位置获取模块获取外界触控的位置信息。图像获取模块根据外界触控的位置信息，确定分词区域，并根据文字区域，得到包括待分词文本的文字图像。该文字图像为用户需进一步操作的关键词所属的区域。之后，文字识别模块识别文字图像中的文字，得到第一文本后，分词处理模块再对第一文本进行分词，得到分词结果。而后，分词显示模块将分词结果显示，以便用户从分词结果中选择一个或多个关键词后进行下一步操作。这样，本实施例提供的文本处理装置，将触控感应、图像识别以及分词技术相结合，能够在各种不同的系统情况下，高效快捷的得到外界触控所指示的区域中的字、词语和命名实体等，方便用户直接选择文本中的关键词，无需用户在后续操作时另外输入关键词，提高了操作的效率。

装置实施例二：

参见图8，该图为本发明提供的文本处理装置实施例二的结构示意图。

本实施例提供的文本处理装置，包括：显示模块10、截图模块20、识别模块30 和分词模块40；

所述显示模块10，用于在触摸屏上显示文字区域；

所述截图模块20，用于响应于对所述文字图像的外界触控，对所述文字区域进行截图，得到文字图像；

所述识别模块30，用于识别所述文字图像中的文字，得到待处理文本；

所述分词模块40，用于对所述待处理文本中的文字进行分词；

所述显示模块10，还用于显示所述分词结果。

在一个例子中，所述显示模块10，具体包括：生成子模块和显示子模块(均未在图中示出)；

本实施例提供的文本处理装置，显示模块在触摸屏上显示文字图像后，识别模块当感应到对所述文字图像的外界触控后，识别文字图像中的文字，分词模块对识别出的文字进行分词。之后，显示模块将分词结果显示，以便用户从分词结果中选择一个或多个关键词后进行下一步操作。本实施例提供的文本处理装置，将触控感应、图像识别以及分词技术相结合，在各种不同的系统条件下，均能高效快捷的得到外界触控所指示的区域中的字、词语和命名实体等，方便用户直接选择文本中的关键词，无需用户在后续操作时另外输入关键词，提高了操作的效率。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明。任何熟悉本领域的技术人员，在不脱离本发明技术方案范围情况下，都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰，或修改为等同变化的等效实施例。因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均仍属于本发明技术方案保护的范围内。

Claims

1.一种文本处理方法，其特征在于，触控终端具有在不同位置上的用于显示不同内容的多个显示区域，所述多个显示区域分别由一视图控件所显示并由各自的区域位置信息进行划分，所述区域位置信息分别为一坐标范围，所述文本处理方法包括：

在所述触控终端上显示文字区域，其中，所述文字区域为所述多个显示区域之中的包含文字的区域；

当外界触控的坐标落在所述文字区域的坐标范围之内时，识别所述文字区域中的文字，得到待处理文本；

对所述待处理文本中的文字进行分词；以及

显示分词结果。

2.根据权利要求1所述的文本处理方法，其特征在于，

所述识别所述文字区域中的文字包括：

对所述文字区域进行截图，得到文字图像；以及

识别所述文字图像中的文字；所述显示分词结果包括：

生成分词显示界面和至少一个视图控件；

将所述分词结果中的词添加至所述至少一个视图控件中；以及

在所述分词显示界面上显示所述至少一个视图控件；

其中，

使用不同显示效果显示所述分词结果中的词，或者

所述分词结果中的各个词之间存在间距或不存在间距地仅由线分开，或者

将所述分词结果一次或分次显示给用户。

3.根据权利要求1或2所述的文本处理方法，其特征在于，所述方法还包括，在窗口中显示所述分词结果，并且用户能够选择关闭所述窗口来终止从所述分词结果中选择关键词的过程。

4.根据权利要求1所述的文本处理方法，其特征在于，所述显示分词结果包括：

生成分词显示界面和至少一个视图控件；

在所述分词显示界面上显示所述至少一个视图控件。

5.根据权利要求4所述的文本处理方法，其特征在于，将所述分词结果中的词添加至所述至少一个视图控件中包括：

将所述分词结果中的每个词分别添加至一个视图控件中。

6.根据权利要求4所述的文本处理方法，其特征在于，将所述至少一个视图控件中的每个视图控件分散显示在分词显示界面中。

7.根据权利要求4所述的文本处理方法，其特征在于，在所述外界触控的附近创建窗口，显示所述分词显示界面。

8.根据权利要求1所述的文本处理方法，其特征在于，使用不同显示效果显示分词结果中的词。

9.根据权利要求8所述的文本处理方法，其特征在于，使用不同显示效果显示分词结果中的数字或用户选择概率高的词。

10.根据权利要求1所述的文本处理方法，其特征在于，分词结果中的各个词之间存在间距，或者不存在间距地仅由线分开。

11.根据权利要求1所述的文本处理方法，其特征在于，将所述分词结果一次或分次显示给用户。

12.根据权利要求11所述的文本处理方法，其特征在于，将所述分词结果一次显示但滑动展示给用户。

13.根据权利要求1所述的文本处理方法，其特征在于，所述显示分词结果，之后还包括：

接收用户触发的关键词选择指令，其中，所述关键词选择指令是根据所述分词结果发出的；

显示所述关键词。

14.根据权利要求13所述的文本处理方法，其特征在于，用户通过点击所述分词结果中的字、词语或命名实体，触发所述关键词选择指令。

15.根据权利要求13所述的文本处理方法，其特征在于，在接收到用户触发的关键词选择指令后，将用户所选择的关键词突出显示。

16.根据权利要求13至15中任一项所述的文本处理方法，其特征在于，用户从所述分词结果中选择一个或多个字、词语或命名实体。

17.根据权利要求16所述的文本处理方法，其特征在于，用户从所述分词结果中选择多个字、词语或命名实体，所述多个字、词语或命名实体形成一个关键词，用于后续的关键词操作。

18.根据权利要求13至15中任一项所述的文本处理方法，其特征在于，用户从所述分词结果中选择连续的字、词语或命名实体或不连续的字、词语或命名实体。

19.根据权利要求13所述的文本处理方法，其特征在于，所述显示所述关键词，之后还包括：

接收所述用户触发的关键词操作指令，所述关键词操作指令携带有操作类型；以及

根据所述操作类型，对所述关键词进行操作。

20.根据权利要求19所述的文本处理方法，其特征在于，在用户选择所述关键词后，生成与操作类型相对应的操作按键，用户通过操作所述操作按键，触发相应的针对所述关键词的关键词操作指令。

21.根据权利要求1所述的文本处理方法，其特征在于，根据预设的范围，划分出一包含所述外界触控的区域作为分词区域。

22.根据权利要求21所述的文本处理方法，其特征在于，缩小或放大所述分词区域，使之不包括不完整的字。

23.根据权利要求21所述的文本处理方法，其特征在于，对所述分词区域进行截图，得到文字图像；识别出文字图像中不完整的字，将不完整的字从文字图像中去除。

24.根据权利要求21所述的文本处理方法，其特征在于，将所述外界触控上方第一预设像素值、所述外界触控下方第二预设像素值、以及所述触控终端的显示宽度以内的区域划分为所述分词区域。

25.一种文本处理装置，其特征在于，包括：

用于执行根据权利要求1-24中任一项所述的方法的装置。

26.一种存储程序的计算机可读存储介质，所述程序包括指令，所述指令在由电子设备的处理器执行时，致使所述电子设备执行根据权利要求1-24中任一项所述的方法。