CN111381751A - 一种文本处理方法及装置 - Google Patents

一种文本处理方法及装置 Download PDF

Info

Publication number
CN111381751A
CN111381751A CN202010066531.6A CN202010066531A CN111381751A CN 111381751 A CN111381751 A CN 111381751A CN 202010066531 A CN202010066531 A CN 202010066531A CN 111381751 A CN111381751 A CN 111381751A
Authority
CN
China
Prior art keywords
word segmentation
text
area
segmentation result
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010066531.6A
Other languages
English (en)
Inventor
罗永浩
田作辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010066531.6A priority Critical patent/CN111381751A/zh
Publication of CN111381751A publication Critical patent/CN111381751A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Input (AREA)

Abstract

本发明实施例提供了一种文本处理方法,触控终端具有在不同位置上的用于显示不同内容的多个显示区域,多个显示区域分别由一视图控件所显示并由各自的区域位置信息进行划分,区域位置信息分别为一坐标范围,所述文本处理方法包括:在触控终端上显示文字区域,其中,文字区域为所述多个显示区域之中的包含文字的区域;当外界触控的坐标落在文字区域的坐标范围之内时,识别文字区域中的文字,得到待处理文本;对待处理文本中的文字进行分词;以及显示分词结果。本发明实施例提供的文本处理方法,能够高效快捷的得到外界触控所指示的区域中的词,方便用户直接选择文本中的关键词,无需用户在后续操作时另外输入关键词,提高了操作的效率。

Description

一种文本处理方法及装置
本申请是发明名称为“一种文本处理方法及装置”、申请日为2016年10月18 日、申请号为201610908977.2的中国专利申请的分案申请。
技术领域
本发明涉及人机交互技术领域,尤其涉及一种文本处理方法及装置。
背景技术
目前,人们每天都会在手机或平板电脑等触控终端上收到大量的文字信息,例 如短信和即时通讯类软件等各大应用的消息推送等。当触控终端的用户想要对文字 信息中的感兴趣的关键词进行操作(例如搜索文字信息中的关键词或分享文字信息 中的关键词)时,需进行多步操作,操作耗时长、不便捷。
因此,本领域技术人员需要提供一种文本处理方法及装置,能够方便用户对文 本中的关键词进行操作。
发明内容
为了解决现有技术问题,本发明提供了一种文本处理方法及装置,能够方便用 户对文本中的关键词进行操作。
本发明实施例提供了一种文本处理方法,包括:
响应于触控终端感应到的外界触控,获取所述外界触控的位置信息;
根据所述外界触控的位置信息,获取文字图像;
识别所述文字图像中的文字,得到第一文本;
对所述第一文本中的文字进行分词,得到分词结果;
显示所述分词结果。
优选地,所述根据所述外界触控的位置信息,获取文字图像,具体包括:
根据所述外界触控的位置信息,获取分词区域;
对所述分词区域进行截图,得到所述文字图像。
优选地,所述根据所述外界触控的位置信息,获取分词区域,具体包括:
获取所述触控终端上每个显示区域的区域位置信息;
根据所述外界触控的位置信息和所述触控终端上每个显示区域的区域位置信息,逐一检测所述外界触控与所述触控终端上每个显示区域的位置关系;
当所述外界触控落在第一显示区域内时,则确定所述第一显示区域为所述分词区域,所述第一显示区域为所述触控终端上一显示区域。
优选地,所述显示所述分词结果,具体包括:
生成分词显示界面和至少一个视图控件;
将所述分词结果中的每个词分别添加至一个视图控件中;
在所述分词显示界面上显示全部视图控件。
优选地,所述对所述第一文本中的文字进行分词,得到分词结果,具体包括:
判断所述第一文本的字符数量是否大于预设值;
如果否,则对所述第一文本中全部文字进行分词,得到所述分词结果;
如果是,则根据所述外界触控的位置信息,确定第二文本,并对所述第二文本 中全部文字进行分词,得到所述分词结果,所述第一文本包括所述第二文本中的全 部文字,且所述第二文本中字符的数量等于所述预设值。
优选地,所述显示所述分词结果,之后还包括:
接收用户触发的关键词选择指令,所述关键词选择指令是根据所述分词结果发出的;
根据所述关键词选择指令,从所述分词结果中获取所述用户选择的关键词;
显示所述关键词;
接收所述用户触发的关键词操作指令,所述关键词操作指令携带有操作类型, 所述操作类型包括搜索和分享;
根据所述操作类型,对所述关键词进行操作。
本发明实施例还提供了一种文本处理方法,包括:
在触摸屏上显示文字区域;
响应于对所述文字区域的外界触控,对所述文字区域进行截图,得到文字图像;
识别所述文字图像中的文字,得到待处理文本;
对所述待处理文本中的文字进行分词;
显示所述分词结果。
优选地,所述显示所述分词结果,具体包括:
生成分词显示界面,所述分词显示界面包括至少一个子视图;
分别在每个子视图中显示所述分词结果中的一个词。
本发明实施例还提供了一种文本处理装置,包括:位置获取模块、图像获取模 块、文字识别模块、分词处理模块和分词显示模块;
所述位置获取模块,用于响应于触控终端感应到的外界触控,获取所述外界触 控的位置信息;
所述图像获取模块,用于根据所述外界触控的位置信息,获取文字图像;
所述文字识别模块,用于识别所述文字图像中的文字,得到第一文本;
所述分词处理模块,用于对所述第一文本中的文字进行分词,得到分词结果;
所述分词显示模块,用于显示所述分词结果。
优选地,所述图像获取模块,具体包括:获取子模块和截图子模块;
所述获取子模块,用于根据所述外界触控的位置信息,获取分词区域;
所述截图子模块,用于对所述分词区域进行截图,得到所述文字图像。
优选地,所述获取子模块,具体包括:位置信息获取子模块、位置关系确定子 模块和分词区域确定子模块;
所述位置信息获取子模块,用于获取所述触控终端上每个显示区域的区域位置信息;
所述位置关系确定子模块,用于根据所述外界触控的位置信息和所述触控终端上每个显示区域的区域位置信息,逐一检测所述外界触控与所述触控终端上每个显 示区域的位置关系;
所述分词区域确定子模块,用于当所述外界触控落在第一显示区域内时,则确 定所述第一显示区域为所述分词区域,所述第一显示区域为所述触控终端上一显示 区域。
优选地,所述分词显示模块,具体包括:生成子模块、添加子模块和显示子模 块;
所述生成子模块,用于生成分词显示界面和至少一个视图控件;
所述添加子模块,用于将所述分词结果中的每个词分别添加至一个视图控件中;
所述显示子模块,用于在所述分词显示界面上显示全部视图控件。
优选地,述分词处理模块,具体包括:判断子模块、分词子模块和确定子模块;
所述判断子模块,用于判断所述第一文本的字符数量是否大于预设值;
所述分词子模块,用于当所述判断子模块判断所述第一文本的字符数量不大于预设值时,对所述第一文本中全部文字进行分词,得到所述分词结果;
所述确定子模块,用于当所述判断子模块判断所述第一文本的字符数量大于预设值时,根据所述外界触控的位置信息,确定第二文本所述第一文本包括所述第二 文本中的全部文字,且所述第二文本中字符的数量等于所述预设值;
所述分词子模块,还用于当所述判断子模块判断所述第一文本的字符数量大于预设值时,对所述第二文本中全部文字进行分词,得到所述分词结果。
优选地,还包括:指令接收模块、关键词获取模块、关键词显示模块和关键词 操作模块;
所述指令接收模块,用于接收用户触发的关键词选择指令,所述关键词选择指 令是根据所述分词结果发出的;
所述关键词获取模块,用于根据所述关键词选择指令,从所述分词结果中获取 所述用户选择的关键词;
所述关键词显示模块,用于显示所述关键词;
所述指令接收模块,还用于接收所述用户触发的关键词操作指令,所述关键词 操作指令携带有操作类型,所述操作类型包括搜索和分享;
所述关键词操作模块,用于根据所述操作类型,对所述关键词进行操作。
本发明实施例还提供了一种文本处理装置,包括:显示模块、截图模块、识别 模块和分词模块;
所述显示模块,用于在触摸屏上显示文字区域;
所述截图模块,用于响应于对所述文字区域的外界触控,对所述文字区域进行 截图,得到文字图像;
所述识别模块,用于识别所述文字图像中的文字,得到待处理文本;
所述分词模块,用于对所述待处理文本中的文字进行分词;
所述显示模块,还用于显示所述分词结果。
优选地,所述显示模块,具体包括:生成子模块和显示子模块;
所述生成子模块,用于生成分词显示界面,所述分词显示界面包括至少一个子 视图;
所述显示子模块,用于分别在每个子视图中显示所述分词结果中的一个词。
与现有技术相比,本发明至少具有以下优点:
本发明实施例提供的文本处理方法,在触控终端感应到的外界触控后,获取外 界触控的位置信息。根据外界触控的位置信息,确定分词区域,并根据文字区域, 得到包括待分词文本的文字图像。该文字图像为用户需进一步操作的关键词所属的 区域。之后,识别文字图像中的文字,得到第一文本后,再对第一文本进行分词, 得到分词结果。而后,将分词结果显示,以便用户从分词结果中选择一个或多个关 键词后进行下一步操作。这样,本发明实施例提供的文本处理方法,将触控感应、 图像识别以及分词技术相结合,能够在各种不同的系统情况下,高效快捷的得到外 界触控所指示的区域中的字、词语和命名实体等,方便用户直接选择文本中的关键 词,无需用户在后续操作时另外输入关键词,提高了操作的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图 仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造 性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明提供的文本处理方法实施例一的流程示意图;
图2a为本发明实施例提供的文本处理方法中外界触控区域和分词区域的示意图;
图2b为图2a中所示文本的分词结果的示意图;
图3a-图3c为本发明实施例提供的文本处理方法中分词显示界面的示意图;
图4a和图4b为本发明实施例提供的文本处理方法中对分词结果中的关键词进 行一种操作时的示意图;
图5a-图5c为本发明实施例提供的文本处理方法中对分词结果中的关键词进行另一种操作时的示意图;
图6为本发明提供的文本处理方法实施例二的流程示意图;
图7为本发明提供的文本处理装置实施例一的结构示意图;
图8为本发明提供的文本处理装置实施例二的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实 施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本 领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于 本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发 明的具体实施方式做详细的说明。
在介绍本发明的具体实施方式之前,首先介绍与本发明具体实施方式相关的多个技术术语。
压力触控:当触控终端如触屏手机感受到外界压力后,系统可以捕获到压力信息。
分词:指的是将一个文字序列切分成一个一个单独的字、词语或命名实体等。 分词过程就是按照一定的规范,将连续的文字序列重新组合成单独的字、词语或命 名实体序列的过程。
命名实体:指人名、机构名、地名以及其他所有以名称为标识的实体。更广泛 的实体还包括数字、日期、货币、地址等。
关键词:一段完整语句中用户所感兴趣的文字片段。
还需要说明的是,本发明实施例提供的文本处理方法及装置在触控终端运行任何应用程序的情况下均可实现。所述应用程序包括但不限于短信、网页浏览、实时 通讯和其他具有文字显示功能的程序等。
方法实施例一:
参见图1,该图为本发明提供的文本处理方法实施例一的流程示意图。
本实施例提供的文本处理方法,包括:
S101:响应于触控终端感应到的外界触控,获取所述外界触控的位置信息;
可以理解的是,触控终端可以为任意一种具有触摸感应功能的设备,包括但不 限于手机、平板电脑和穿戴设备等。其感应到的外界触控包括但不限于单点或多点 按压、单点或多点滑动操作、单点或多点触摸、单点或多点压力触控和触摸面积感 应等。当外界操作满足相应的感应阈值时,触控终端即可感应到相应的外界触控。
当触控终端感应到外界触控时,会获取到外界触控在触控终端上的位置信息, 如外界触控的坐标等。外界触控的坐标为该外界触控在触控终端上的坐标(一般用X 轴坐标和Y轴坐标来描述)。此时,系统可识别出外界触控施加的位置,以便对触控 区域进行各种后续操作。
S102:根据所述外界触控的位置信息,获取文字图像;
在本实施例的一些可能的实施方式中,根据所述外界触控的位置信息,获取文 字图像包括:根据所述外界触控的位置信息,获取分词区域;对所述分词区域进行 截图,得到所述文字图像。
作为一个示例,所述外界触控可落在所述分词区域内。
需要说明的是,由于不同的系统之间可能存在不兼容的情况,造成无法直接获 取触控终端上显示的文字。此时,为了对触控终端上显示的文字进行处理,可通过 对触控终端的显示区域进行截屏,获得显示有该文字的文字图像。再应用图像识别 技术识别文字图像中的文字。之后,即可对识别出的文字进行处理。这样,就能够 实现在无法直接获取到触控终端上显示的文字的情况下,对触控终端上显示的文字 进行操作。
本领域技术人员可采用光学字符识别(Optical Character Recognition,OCR)技术对图像中的文字进行识别。
具体实现时,所述根据所述外界触控的位置信息,获取分词区域,至少有两种 可能的实现方式,下面分别进行详细描述。
第一种可能的实现方式,分词区域可根据触控终端当前显示视图以及外界触控的位置信息确定。此时,根据所述外界触控的位置信息,获取分词区域包括:
S1021:获取所述触控终端上每个显示区域的区域位置信息;
可以理解的是,触控终端上各显示区域的位置可根据操作变化。因此,为保证 正确获取用户感兴趣的区域中的图像,应以感应到外界触控时触控终端上每个显示 区域的位置来确定文字图像。
S1022:根据所述外界触控的位置信息和所述触控终端上每个显示区域的区域位置信息,逐一检测所述外界触控与所述触控终端上每个显示区域的位置关系;
S1023:当所述外界触控落在第一显示区域内时,则确定所述第一显示区域为所述分词区域,所述第一显示区域为所述触控终端上一显示区域。
一般,触控终端的不同位置上显示有各种不同内容的显示区域,如显示文字的 区域和显示图像的区域。各显示区域间均由区域坐标进行划分。而系统中一般会保 存有触控终端上各显示区域的位置坐标。当获取到外界触控的位置信息后,能够以 触控终端上各显示区域的位置坐标和外界触控的位置信息为依据,识别出外界触控 位于哪个显示区域。然后,即可将该显示区域确定为分词区域。
以坐标为例,触控终端上各显示区域的区域位置信息为一坐标范围区域。当获 取到外界触控的坐标后,可判断出外界触控落在触控终端上的哪一显示区域的坐标 范围中。外界触控所属的区域即为分词区域。
在一些可能的情况中,外界触控可能落在显示图像的显示区域上。当获取到外 界触控的位置信息后,该显示区域的范围即为分词区域,该区域所显示的图像即为 文字图像,无需对分词区域进行截图处理。
此外,当在触控终端系统上运行一全屏显示应用,如网页、阅读器等时,触控 终端上各显示区域并无实际显示的线条区分。此时,屏幕显示的区域也是分为图片 显示区域和文字显示区域,各区域分别由不同的视图控件所显示,并由位置信息进 行划分。当外界触控处于显示文字的显示区域中时,触控终端上整个显示文字的区 域即为分词区域。
图2a举例示出了该可能的实现方式中所述的获取分词区域的方法。可以理解的是,以下仅为示例性说明,并不对本发明做任何限定。
如图2a所示,外界触控落在触控终端上手指处圆形所围的区域。此时,系统可 获取到出外界触控的位置信息,并根据外界触控的位置信息以及各视图控件的位置, 确定分词区域为手指所在的短信文本框所划分的区域。
这里还需要说明的是,图2a所示仅是以单指按压激活外界触控为例来说明如何确定分词区域,本发明不对如何激活外界触控进行限制,本领域技术人员可根据实 际情况具体设定,具体实施方式与上述类似,在此不再一一赘述。
第二种可能的实现方式,分词区域可根据预设的分词范围确定。
具体的,在获取到外界触控的位置信息后,根据预设的分词范围,划分出一包 含有外界触控的区域,该区域即为分词区域。例如,可将外界触控上方100个像素 点、外界触控下方100个像素点以及触控终端显示宽度以内的区域划分为分词区域。
这里需要说明的是,在采用区域划分的方法时,该区域中可能会包括不完整的字。这时,在截图后对文字图像进行文字识别时,不完整的字会影响到文字识别的 精度。因此,当在获取到分词区域后,可相应的缩小或放大该分词区域,使之不包 括不完整的字。也可以在截图得到文字图像后,应用图像识别技术,识别出文字图 像中不完整的字,将不完整的字从文字图像中去除。
S103:识别所述文字图像中的文字,得到第一文本;
本领域技术人员可采用光学字符识别(Optical Character Recognition,OCR)技术对文字图像中的文字进行识别,具体的文字识别方法和过程这里不再赘述。
S104:对所述第一文本中的文字进行分词,得到分词结果;
作为一个例子,本领域技术人员可采用自然语言算法根据第一文本中文字的具体语义对第一文本进行分词,具体分词方法及过程这里不再赘述。
由于分词区域中包括的文字数量可能过多。实际操作时,将第一文本中的所有 文字均进行分词操作,会得到过多的分词结果,不方便用户从中选择关键词。因此, 为了提高分词效率,方便用户从分词结果中选择关键词,本实施例提供的文本处理 方法还可根据实际情况,对文字图像中的一部分文字进行分词,使用户从该一部分 文字的分词结果中选择关键词,提高用户的交互体验。
在本实施例的一个优选的实施方案中,对所述第一文本中的文字进行分词,得 到分词结果包括:判断所述第一文本的字符数量是否大于预设值;如果否,则对所 述第一文本中全部文字进行分词,得到所述分词结果;如果是,则根据所述外界触 控的位置信息,确定第二文本,并对所述第二文本中全部文字进行分词,得到所述 分词结果,所述第一文本包括所述第二文本中的全部文字,且所述第二文本中字符 的数量等于所述预设值。
需要说明的是,当得到外界触控的位置信息时,可得知外界触控处于第一文本 中的哪个字符附近。此时,可根据预设规则,获取外界触控附近数量等于预设值的 字符,生成第二文本,并对第二文本进行分词,得到分词结果。例如,取压力感应 区域附近的50或100个字生成第二文本。这50或100个字,可以从外界触控处向 前取一半数量的字,并从外界触控处向后取一半数量的字。本领域技术人员还可以 根据实际情况,具体设定得到第二文本的方式,在此不再一一列举。
S105:显示所述分词结果。
对第一文本进行分词后,得到多个词语、字、短语和命名实体等,即分词结果。 图2b示出了图2a所示的分词区域中文本的分词结果。
将文字图像中显示的文本分词后,显示分词结果。这样,用户即可从分词结果 中直接选择需要进一步操作的关键词,便于用户直接对文本中的关键词进行操作。
可以理解的是,上述实施例中得到的分词结果可在窗口中将其显示给用户。并且,用户可选择关闭该关键词选择窗口来终止关键词选择过程。
在本实施例的一些可能的实现方式中,所述显示所述分词结果包括:生成分词 显示界面和至少一个视图控件;将所述分词结果中的每个词分别添加至一个视图控 件中;在所述分词显示界面上显示全部视图控件。
图3a-图3c示出了一种分词显示界面的具体实现形式。分词显示界面中每个长 方形块为显示出的一个视图控件,每个视图控件用于显示分词结果中的一个词 (字、词语或命名实体)。每个视图控件的显示大小、显示位置等可根据实际情况 具体设定。例如,可将每个视图控件分散显示在分词显示界面中,以方便用户从中 选择关键词。同时,本领域技术人员还可根据需求,使用不同的颜色、字体或大小 等显示分词结果中的字、词语或命名实体,如使用不同显示效果显示分词结果中的 数字或用户选择概率高的词。当用户从分词结果中选择关键字时,可直接点击分词 显示界面中相应的视图控件。分词结果中各个字、词语或命名实体之间可如图3a- 图3c所示的之间存在间距,也可不存在间距仅由线分开。当分词结果过多,无法 在完全显示分词结果的情况下保证用户能分辨出显示内容时,可一次显示但滑动展 示给用户,也可分次显示给用户。另外,分词显示界面或窗口中包括一关闭键,如 图3c中左下角所示的“×”键,用户通过点击该关闭键关闭分词显示界面或窗口。
此外,显分词显示界面的形式可如图3a-图3c所示,还可为其他显示方式,如 在外界触控区域附近创建窗口显示等。本领域技术人员可根据实际情况具体设定显 示分词结果的方式及显示分词结果时每个词的排列顺序,如将使用频率高的词或数 字显示在前面或突出显示。
在本实施例的一些可能的实现方式中,显示所述分词结果,之后还包括:
首先,接收用户触发的关键词选择指令,所述关键词选择指令是根据所述分词 结果发出的;
需要说明的是,如图3a-图3c所示,用户可从分词结果中选择一个或多个字、 词语或命名实体,还可选择连续或不连续的字、词语或命名实体。
其次,根据所述关键词选择指令,从所述分词结果中获取所述用户选择的关键词;而后,显示所述关键词;
如图4a和图4b所示,用户通过点击分词结果中的词语或命名实体,触发关键 词选择指令。在接收到关键词选择指令后,将用户所选择的关键此突出显示(例如, 高亮显示、改变该视图控件或词的颜色、改变字体等),以便用户对该关键词进行后 续操作。
再次,接收所述用户触发的关键词操作指令,所述关键词操作指令携带有操作 类型,所述操作类型包括搜索和分享;
最后,根据所述操作类型,对所述关键词进行操作。
在用户选择某一个或多个视图控件后,在相应位置生成与各种操作类型相对应的操作按键。而后,用户通过点击关键词附近的操作按键,触发相应的针对该关键 词的关键词操作指令,不同的操作按键代表不同的操作类型。之后,可根据该操作 类型,对用户选择的关键词进行操作。该操作包括但不限于搜索和分享等。图4a- 图4b为对关键词进行搜索操作的一种示例,图5a-图5c为对关键词进行分享操作的 一种示例。包括对分词结果中的单个字、词语或命名实体及多个字、词语或命名实 体进行操作。
本实施例提供的文本处理方法,在触控终端感应到的外界触控后,获取外界触 控的位置信息。根据外界触控的位置信息,确定分词区域,并根据文字区域,得到 包括待分词文本的文字图像。该文字图像为用户需进一步操作的关键词所属的区域。 之后,识别文字图像中的文字,得到第一文本后,再对第一文本进行分词,得到分 词结果。而后,将分词结果显示,以便用户从分词结果中选择一个或多个关键词后 进行下一步操作。这样,本实施例提供的文本处理方法,将触控感应、图像识别以 及分词技术相结合,能够在各种不同的系统情况下,高效快捷的得到外界触控所指 示的区域中的字、词语和命名实体等,方便用户直接选择文本中的关键词,无需用 户在后续操作时另外输入关键词,提高了操作的效率。
方法实施例二:
参见图6,该图为本发明提供的文本处理方法实施例二的流程示意图。
需要说明的是,本实施例提供的文本处理方法可以应用于客户端,该客户端为 任意一种具有触摸感应功能的设备,包括但不限于手机和平板电脑等。
本实施例提供的文本处理方法,包括:
S601:在触摸屏上显示文字区域;
可以理解的是,触摸屏为客户端上的显示设备,例如手机的显示屏即为触摸屏。客户端在触摸屏上分区域显示不同类型的内容,可包括一个或多个显示文字的区域 以及一个或多个显示图像的区域等。
上述文字区域为一包括文字的区域,可为触摸屏上显示文字的区域也可以为触摸屏上显示图像的区域,该图像上显示有文字。
需要说明的是,由于不同的系统之间可能存在不兼容的情况,造成在触摸屏所 述的系统上文字以图像的形式显示,系统无法直接获取实际的文字。
此时,为了对触控终端上显示的文字进行处理,可通过对触控终端的显示区域 进行截屏,获得显示有该文字的文字图像。再应用图像识别技术识别文字图像中的 文字。之后,即可对识别出的文字进行处理。这样,就能够保证在不同的系统条件 下,均能对触摸屏上显示的文字进行操作。
S602:响应于对所述文字区域的外界触控,对所述文字区域进行截图,得到文 字图像;
需要说明的是,由于不同的系统之间可能存在不兼容的情况,造成无法直接获 取触控终端上显示的文字。此时,为了对触控终端上显示的文字进行处理,可通过 对触控终端的显示区域进行截屏,获得显示有该文字的文字图像。再应用图像识别 技术识别文字图像中的文字。之后,即可对识别出的文字进行处理。这样,就能够 实现在无法直接获取到触控终端上显示的文字的情况下,对触控终端上显示的文字 进行操作。
在一些可能的情况中,文字区域为显示图像的区域。响应于对所述文字区域的 外界触控,即可直接获取该区域所显示的图像(即文字图像),无需对分词区域进行 截图处理。
S603:识别所述文字图像中的文字,得到待处理文本;
通过感应用户对相应文字图像的外界触控,可确定需对触摸屏上哪部分显示区域中的内容进行操作。外界触控包括且不限于单点或多点按压、单点或多点滑动操 作、单点或多点触摸、单点或多点压力触控和触摸面积感应等。当外界操作满足相 应的感应阈值时,客户端即可感应到相应的外界触控。对文本区域中的文字进行分 词后,得到多个词语、字、短语和命名实体等,即分词结果。可使用文字识别技术 获取文本区域中的文字。
本领域技术人员可采用光学字符识别(Optical Character Recognition,OCR)技术对文字图像中的文字进行识别。
S604:对所述待处理文本中的文字进行分词;
作为一个例子,本领域技术人员可采用自然语言算法根据第一文本中文字的具体语义对第一文本进行分词,具体分词方法及过程这里不再赘述。
S605:显示所述分词结果。
将文字图像的文本分词后,将分词结果显示。这样,用户就可从分词结果中直 接选择需要进一步操作的关键词,便于用户直接对文本中的关键词进行操作。
图2b示出了图2a所示的文字图像中文本的分词结果。
将文字图像中显示的文本分词后,显示分词结果。这样,用户即可从分词结果 中直接选择需要进一步操作的关键词,便于用户直接对文本中的关键词进行操作。
可以理解的是,上述实施例中得到的分词结果可在窗口中将其显示给用户。并且,用户可选择关闭该关键词选择窗口来终止关键词选择过程。
在本实施例的一些可能的实现方式中,显示所述分词结果,具体包括:生成分 词显示界面,所述分词显示界面包括至少一个子视图;分别在每个子视图中显示所 述分词结果中的一个词。
图3a-图3c示出了一种分词显示界面的具体实现形式。分词显示界面中每个长 方形块为显示出的一个视图控件,每个视图控件用于显示分词结果中的一个词(字、 词语或命名实体)。每个视图控件的显示大小、显示位置等可根据实际情况具体设定。 例如,可将每个视图控件分散显示在分词显示界面中,以方便用户从中选择关键词。 同时,本领域技术人员还可根据需求,使用不同的颜色、字体或大小等显示分词结 果中的字、词语或命名实体,如使用不同显示效果显示分词结果中的数字或用户选 择概率高的词。当用户从分词结果中选择关键字时,可直接点击分词显示界面中相 应的视图控件。分词结果中各个字、词语或命名实体之间可存在间距,也可不存在 间距仅由线分开。当分词结果过多,无法在完全显示分词结果的情况下保证用户能 分辨出显示内容时,可一次显示但滑动展示给用户,也可分次显示给用户。另外, 分词显示界面或窗口中包括一关闭键,如图3c中左下角所示的“×”键,用户通过 点击该关闭键关闭分词显示界面或窗口。
此外,显分词显示界面的形式可如图3a-图3c所示,还可为其他显示方式,如 在外界触控区域附近创建窗口显示等。本领域技术人员可根据实际情况具体设定显 示分词结果的方式及显示分词结果时每个词的排列顺序,如将使用频率高的词或数 字显示在前面或突出显示。
在本实施例的一些可能的实现方式中,显示所述分词结果,之后还包括:
首先,接收用户触发的关键词选择指令,所述关键词选择指令是根据所述分词 结果发出的;
需要说明的是,如图3a-图3c所示,用户可从分词结果中选择一个或多个字、 词语或命名实体,还可选择连续或不连续的字、词语或命名实体。
其次,根据所述关键词选择指令,从所述分词结果中获取所述用户选择的关键词;而后,显示所述关键词;
如图4a和图4b所示,用户通过点击分词结果中的词语或命名实体,触发关键 词选择指令。在接收到关键词选择指令后,将用户所选择的关键此突出显示(例如, 高亮显示、改变该视图控件或词的颜色、改变字体等),以便用户对该关键词进行后 续操作。
再次,接收所述用户触发的关键词操作指令,所述关键词操作指令携带有操作 类型,所述操作类型包括搜索和分享;
最后,根据所述操作类型,对所述关键词进行操作。
在用户选择某一个或多个视图控件后,在相应位置生成与各种操作类型相对应的操作按键。而后,用户通过点击关键词附近的操作按键,触发相应的针对该关键 词的关键词操作指令,不同的操作按键代表不同的操作类型。之后,可根据该操作 类型,对用户选择的关键词进行操作。该操作包括但不限于搜索和分享等。图4a- 图4b为对关键词进行搜索操作的一种示例,图5a-图5c为对关键词进行分享操作的 一种示例。包括对分词结果中的单个字、词语或命名实体及多个字、词语或命名实 体进行操作。
本实施例提供的文本处理方法,在触摸屏上显示文字图像后,当感应到对所述 文字图像的外界触控后,识别文字图像中的文字,并对识别出的文字进行分词。之 后,将分词结果显示,以便用户从分词结果中选择一个或多个关键词后进行下一步 操作。本实施例提供的文本处理方法,将触控感应、图像识别以及分词技术相结合, 在各种不同的系统条件下,均能高效快捷的得到外界触控所指示的区域中的字、词 语和命名实体等,方便用户直接选择文本中的关键词,无需用户在后续操作时另外 输入关键词,提高了操作的效率。
基于上述实施例提供的文本处理方法,本发明实施例还提供了一种文本处理装置。
装置实施例一:
参见图7,该图为本发明提供的文本处理装置实施例一的结构示意图。
本实施例提供的文本处理装置,包括:位置获取模块100、图像获取模块200、 文字识别模块300、分词处理模块400和分词显示模块500;
所述位置获取模块100,用于响应于触控终端感应到的外界触控,获取所述外界触控的位置信息;
所述图像获取模块200,用于根据所述外界触控的位置信息,获取文字图像;
在一个例子中,所述图像获取模块200,具体包括:获取子模块和截图子模块(均未在图中示出);
所述获取子模块,用于根据所述外界触控的位置信息,获取分词区域;
作为一个示例,所述获取子模块,具体包括:位置信息获取子模块、位置关系 确定子模块和分词区域确定子模块(均未在图中示出);
所述位置信息获取子模块,用于获取所述触控终端上每个显示区域的区域位置信息;
所述位置关系确定子模块,用于根据所述外界触控的位置信息和所述触控终端上每个显示区域的区域位置信息,逐一检测所述外界触控与所述触控终端上每个显 示区域的位置关系;
所述分词区域确定子模块,用于当所述外界触控落在第一显示区域内时,则确 定所述第一显示区域为所述分词区域,所述第一显示区域为所述触控终端上一显示 区域。
所述截图子模块,用于对所述分词区域进行截图,得到所述文字图像。
所述文字识别模块300,用于识别所述文字图像中的文字,得到第一文本;
所述分词处理模块400,用于对所述第一文本中的文字进行分词,得到分词结果;
在一个例子中,所述分词处理模块400,具体包括:判断子模块、分词子模块和 确定子模块(均未在图中示出);
所述判断子模块,用于判断所述第一文本的字符数量是否大于预设值;
所述分词子模块,用于当所述判断子模块判断所述第一文本的字符数量不大于预设值时,对所述第一文本中全部文字进行分词,得到所述分词结果;
所述确定子模块,用于当所述判断子模块判断所述第一文本的字符数量大于预设值时,根据所述外界触控的位置信息,确定第二文本所述第一文本包括所述第二 文本中的全部文字,且所述第二文本中字符的数量等于所述预设值;
所述分词子模块,还用于当所述判断子模块判断所述第一文本的字符数量大于预设值时,对所述第二文本中全部文字进行分词,得到所述分词结果。
所述分词显示模块500,用于显示所述分词结果。
在一个例子中,所述分词显示模块500,具体包括:生成子模块、添加子模块和 显示子模块(均未在图中示出);
所述生成子模块,用于生成分词显示界面和至少一个视图控件;
所述添加子模块,用于将所述分词结果中的每个词分别添加至一个视图控件中;
所述显示子模块,用于在所述分词显示界面上显示全部视图控件。
在的一些可能的实现方式中,本实施例提供的文本处理装置,还包括:指令接 收模块、关键词获取模块、关键词显示模块和关键词操作模块(均未在图中示出);
所述指令接收模块,用于接收用户触发的关键词选择指令,所述关键词选择指 令是根据所述分词结果发出的;
所述关键词获取模块,用于根据所述关键词选择指令,从所述分词结果中获取 所述用户选择的关键词;
所述关键词显示模块,用于显示所述关键词;
所述指令接收模块,还用于接收所述用户触发的关键词操作指令,所述关键词 操作指令携带有操作类型,所述操作类型包括搜索和分享;
所述关键词操作模块,用于根据所述操作类型,对所述关键词进行操作。
本实施例提供的文本处理装置,在触控终端感应到的外界触控后,位置获取模 块获取外界触控的位置信息。图像获取模块根据外界触控的位置信息,确定分词区 域,并根据文字区域,得到包括待分词文本的文字图像。该文字图像为用户需进一 步操作的关键词所属的区域。之后,文字识别模块识别文字图像中的文字,得到第 一文本后,分词处理模块再对第一文本进行分词,得到分词结果。而后,分词显示 模块将分词结果显示,以便用户从分词结果中选择一个或多个关键词后进行下一步 操作。这样,本实施例提供的文本处理装置,将触控感应、图像识别以及分词技术 相结合,能够在各种不同的系统情况下,高效快捷的得到外界触控所指示的区域中 的字、词语和命名实体等,方便用户直接选择文本中的关键词,无需用户在后续操 作时另外输入关键词,提高了操作的效率。
装置实施例二:
参见图8,该图为本发明提供的文本处理装置实施例二的结构示意图。
本实施例提供的文本处理装置,包括:显示模块10、截图模块20、识别模块30 和分词模块40;
所述显示模块10,用于在触摸屏上显示文字区域;
所述截图模块20,用于响应于对所述文字图像的外界触控,对所述文字区域进 行截图,得到文字图像;
所述识别模块30,用于识别所述文字图像中的文字,得到待处理文本;
所述分词模块40,用于对所述待处理文本中的文字进行分词;
所述显示模块10,还用于显示所述分词结果。
在一个例子中,所述显示模块10,具体包括:生成子模块和显示子模块(均未 在图中示出);
所述生成子模块,用于生成分词显示界面,所述分词显示界面包括至少一个子 视图;
所述显示子模块,用于分别在每个子视图中显示所述分词结果中的一个词。
本实施例提供的文本处理装置,显示模块在触摸屏上显示文字图像后,识别模 块当感应到对所述文字图像的外界触控后,识别文字图像中的文字,分词模块对识 别出的文字进行分词。之后,显示模块将分词结果显示,以便用户从分词结果中选 择一个或多个关键词后进行下一步操作。本实施例提供的文本处理装置,将触控感 应、图像识别以及分词技术相结合,在各种不同的系统条件下,均能高效快捷的得 到外界触控所指示的区域中的字、词语和命名实体等,方便用户直接选择文本中的 关键词,无需用户在后续操作时另外输入关键词,提高了操作的效率。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点 说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。 对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较 简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一 个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或 操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者 其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、 物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还 包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下, 由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物 品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、 内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可 移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域 的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技 术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实 施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实 施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围 内。

Claims (26)

1.一种文本处理方法,其特征在于,触控终端具有在不同位置上的用于显示不同内容的多个显示区域,所述多个显示区域分别由一视图控件所显示并由各自的区域位置信息进行划分,所述区域位置信息分别为一坐标范围,所述文本处理方法包括:
在所述触控终端上显示文字区域,其中,所述文字区域为所述多个显示区域之中的包含文字的区域;
当外界触控的坐标落在所述文字区域的坐标范围之内时,识别所述文字区域中的文字,得到待处理文本;
对所述待处理文本中的文字进行分词;以及
显示分词结果。
2.根据权利要求1所述的文本处理方法,其特征在于,
所述识别所述文字区域中的文字包括:
对所述文字区域进行截图,得到文字图像;以及
识别所述文字图像中的文字;所述显示分词结果包括:
生成分词显示界面和至少一个视图控件;
将所述分词结果中的词添加至所述至少一个视图控件中;以及
在所述分词显示界面上显示所述至少一个视图控件;
其中,
使用不同显示效果显示所述分词结果中的词,或者
所述分词结果中的各个词之间存在间距或不存在间距地仅由线分开,或者
将所述分词结果一次或分次显示给用户。
3.根据权利要求1或2所述的文本处理方法,其特征在于,所述方法还包括,在窗口中显示所述分词结果,并且用户能够选择关闭所述窗口来终止从所述分词结果中选择关键词的过程。
4.根据权利要求1所述的文本处理方法,其特征在于,所述显示分词结果包括:
生成分词显示界面和至少一个视图控件;
将所述分词结果中的词添加至所述至少一个视图控件中;以及
在所述分词显示界面上显示所述至少一个视图控件。
5.根据权利要求4所述的文本处理方法,其特征在于,将所述分词结果中的词添加至所述至少一个视图控件中包括:
将所述分词结果中的每个词分别添加至一个视图控件中。
6.根据权利要求4所述的文本处理方法,其特征在于,将所述至少一个视图控件中的每个视图控件分散显示在分词显示界面中。
7.根据权利要求4所述的文本处理方法,其特征在于,在所述外界触控的附近创建窗口,显示所述分词显示界面。
8.根据权利要求1所述的文本处理方法,其特征在于,使用不同显示效果显示分词结果中的词。
9.根据权利要求8所述的文本处理方法,其特征在于,使用不同显示效果显示分词结果中的数字或用户选择概率高的词。
10.根据权利要求1所述的文本处理方法,其特征在于,分词结果中的各个词之间存在间距,或者不存在间距地仅由线分开。
11.根据权利要求1所述的文本处理方法,其特征在于,将所述分词结果一次或分次显示给用户。
12.根据权利要求11所述的文本处理方法,其特征在于,将所述分词结果一次显示但滑动展示给用户。
13.根据权利要求1所述的文本处理方法,其特征在于,所述显示分词结果,之后还包括:
接收用户触发的关键词选择指令,其中,所述关键词选择指令是根据所述分词结果发出的;
根据所述关键词选择指令,从所述分词结果中获取所述用户选择的关键词;
显示所述关键词。
14.根据权利要求13所述的文本处理方法,其特征在于,用户通过点击所述分词结果中的字、词语或命名实体,触发所述关键词选择指令。
15.根据权利要求13所述的文本处理方法,其特征在于,在接收到用户触发的关键词选择指令后,将用户所选择的关键词突出显示。
16.根据权利要求13至15中任一项所述的文本处理方法,其特征在于,用户从所述分词结果中选择一个或多个字、词语或命名实体。
17.根据权利要求16所述的文本处理方法,其特征在于,用户从所述分词结果中选择多个字、词语或命名实体,所述多个字、词语或命名实体形成一个关键词,用于后续的关键词操作。
18.根据权利要求13至15中任一项所述的文本处理方法,其特征在于,用户从所述分词结果中选择连续的字、词语或命名实体或不连续的字、词语或命名实体。
19.根据权利要求13所述的文本处理方法,其特征在于,所述显示所述关键词,之后还包括:
接收所述用户触发的关键词操作指令,所述关键词操作指令携带有操作类型;以及
根据所述操作类型,对所述关键词进行操作。
20.根据权利要求19所述的文本处理方法,其特征在于,在用户选择所述关键词后,生成与操作类型相对应的操作按键,用户通过操作所述操作按键,触发相应的针对所述关键词的关键词操作指令。
21.根据权利要求1所述的文本处理方法,其特征在于,根据预设的范围,划分出一包含所述外界触控的区域作为分词区域。
22.根据权利要求21所述的文本处理方法,其特征在于,缩小或放大所述分词区域,使之不包括不完整的字。
23.根据权利要求21所述的文本处理方法,其特征在于,对所述分词区域进行截图,得到文字图像;识别出文字图像中不完整的字,将不完整的字从文字图像中去除。
24.根据权利要求21所述的文本处理方法,其特征在于,将所述外界触控上方第一预设像素值、所述外界触控下方第二预设像素值、以及所述触控终端的显示宽度以内的区域划分为所述分词区域。
25.一种文本处理装置,其特征在于,包括:
用于执行根据权利要求1-24中任一项所述的方法的装置。
26.一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据权利要求1-24中任一项所述的方法。
CN202010066531.6A 2016-10-18 2016-10-18 一种文本处理方法及装置 Pending CN111381751A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010066531.6A CN111381751A (zh) 2016-10-18 2016-10-18 一种文本处理方法及装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010066531.6A CN111381751A (zh) 2016-10-18 2016-10-18 一种文本处理方法及装置
CN201610908977.2A CN106484266B (zh) 2016-10-18 2016-10-18 一种文本处理方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201610908977.2A Division CN106484266B (zh) 2016-10-18 2016-10-18 一种文本处理方法及装置

Publications (1)

Publication Number Publication Date
CN111381751A true CN111381751A (zh) 2020-07-07

Family

ID=58269583

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610908977.2A Active CN106484266B (zh) 2016-10-18 2016-10-18 一种文本处理方法及装置
CN202010066531.6A Pending CN111381751A (zh) 2016-10-18 2016-10-18 一种文本处理方法及装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201610908977.2A Active CN106484266B (zh) 2016-10-18 2016-10-18 一种文本处理方法及装置

Country Status (2)

Country Link
US (1) US10489047B2 (zh)
CN (2) CN106484266B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378566A (zh) * 2021-05-31 2021-09-10 安徽淘云科技股份有限公司 信息内容显示方法、装置和设备

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933809A (zh) * 2017-03-27 2017-07-07 三角兽(北京)科技有限公司 信息处理装置及信息处理方法
CN107169049B (zh) * 2017-04-25 2023-04-28 腾讯科技(深圳)有限公司 应用的标签信息生成方法及装置
CN106970899B (zh) * 2017-05-09 2020-03-27 北京字节跳动网络技术有限公司 一种文本处理方法及装置
CN107229403B (zh) * 2017-05-27 2020-09-15 北京小米移动软件有限公司 一种信息内容选择方法及装置
CN109426662A (zh) * 2017-08-25 2019-03-05 阿里巴巴集团控股有限公司 交互方法及设备
CN107608957A (zh) * 2017-09-06 2018-01-19 百度在线网络技术(北京)有限公司 基于语音信息的文本修改方法、装置及其设备
CN107632773A (zh) * 2017-10-17 2018-01-26 北京百度网讯科技有限公司 用于获取信息的方法及装置
CN107729897B (zh) * 2017-11-03 2020-09-15 北京字节跳动网络技术有限公司 一种文本操作方法、装置及终端
CN108763193A (zh) * 2018-04-18 2018-11-06 Oppo广东移动通信有限公司 文字处理方法、装置、移动终端及存储介质
CN110163192B (zh) * 2018-05-28 2023-09-19 腾讯科技(深圳)有限公司 字符识别方法、装置及可读介质
CN109002759A (zh) * 2018-06-07 2018-12-14 Oppo广东移动通信有限公司 文本识别方法、装置、移动终端以及存储介质
CN108958576B (zh) * 2018-06-08 2021-02-02 Oppo广东移动通信有限公司 内容识别方法、装置及移动终端
CN109085982B (zh) * 2018-06-08 2020-12-08 Oppo广东移动通信有限公司 内容识别方法、装置及移动终端
CN108959248A (zh) * 2018-06-21 2018-12-07 北京明略软件系统有限公司 一种实体标注方法和装置、计算机可读存储介质
CN110866796A (zh) * 2018-08-28 2020-03-06 阿里巴巴集团控股有限公司 信息显示、信息获取方法、系统及设备
CN109800784B (zh) * 2018-12-11 2024-03-19 平安科技(深圳)有限公司 基于神经网络的合同核对方法及装置
CN110166621B (zh) * 2019-04-17 2020-09-15 维沃移动通信有限公司 一种文字处理方法及终端设备
CN111176525B (zh) * 2019-12-25 2022-05-31 联想(北京)有限公司 一种操作区域提示方法、电子设备及存储介质
CN113920286A (zh) * 2020-06-22 2022-01-11 北京字节跳动网络技术有限公司 字符定位方法和装置
CN112364625A (zh) * 2020-11-19 2021-02-12 深圳壹账通智能科技有限公司 文本筛选方法、装置、设备及存储介质
CN114564141A (zh) * 2020-11-27 2022-05-31 华为技术有限公司 文本提取方法及装置
CN112596656A (zh) * 2020-12-28 2021-04-02 北京小米移动软件有限公司 内容识别方法、装置及存储介质
CN112882678B (zh) * 2021-03-15 2024-04-09 百度在线网络技术(北京)有限公司 图文处理方法和展示方法、装置、设备和存储介质
CN115033148B (zh) * 2022-06-13 2024-04-19 北京字跳网络技术有限公司 文档的显示方法、装置、电子设备和存储介质
CN116137077B (zh) * 2023-04-13 2023-08-08 宁波为昕科技有限公司 电子元器件库的建立方法、装置、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609208A (zh) * 2012-02-13 2012-07-25 广州市动景计算机科技有限公司 在触屏设备上进行屏幕取词的方法、系统及触屏设备
CN102929924A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的取词搜索结果生成方法及装置
CN103019578A (zh) * 2011-09-27 2013-04-03 中国移动通信集团公司 文本选择方法和装置以及图片截取方法和装置
US20140173457A1 (en) * 2012-12-14 2014-06-19 Microsoft Corporation Browsing electronic messages displayed as tiles
CN104156145A (zh) * 2014-08-13 2014-11-19 天津三星通信技术研究有限公司 基于手写笔的文本内容选定方法及便携式终端
CN104281394A (zh) * 2013-07-05 2015-01-14 腾讯科技(深圳)有限公司 智能选词的方法和装置
CN104731797A (zh) * 2013-12-19 2015-06-24 北京新媒传信科技有限公司 一种提取关键词的方法及装置
CN105573624A (zh) * 2016-01-29 2016-05-11 深圳天珑无线科技有限公司 通过压力触控技术快速完成文字编辑的方法及系统
CN105631393A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 信息识别方法及装置
CN105824552A (zh) * 2015-07-29 2016-08-03 维沃移动通信有限公司 一种文本信息的识别方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101261623A (zh) * 2007-03-07 2008-09-10 国际商业机器公司 基于搜索的无词边界标记语言的分词方法以及装置
KR101462932B1 (ko) * 2008-05-28 2014-12-04 엘지전자 주식회사 이동 단말기 및 그의 텍스트 수정방법
US20100241958A1 (en) * 2009-03-23 2010-09-23 Ram David Adva Fish Method and system to manage and prioritize windows based on touch strip inputs
US8988375B2 (en) * 2012-10-09 2015-03-24 Sony Corporation Device and method for extracting data on a touch screen
US20160266769A1 (en) * 2013-03-14 2016-09-15 Motorola Mobility Llc Text display and selection system
JP2016517139A (ja) * 2013-03-15 2016-06-09 アプライド マテリアルズ インコーポレイテッドApplied Materials,Incorporated バッテリ活物質生産用途向けの高固体割合スラリの材料スプレー堆積のための装置
US9329692B2 (en) * 2013-09-27 2016-05-03 Microsoft Technology Licensing, Llc Actionable content displayed on a touch screen
US20150170243A1 (en) * 2013-12-13 2015-06-18 International Business Machines Corporation Creating a house of quality for product design
CN103823849A (zh) * 2014-02-11 2014-05-28 百度在线网络技术(北京)有限公司 词条的获取方法及装置
CN104636326A (zh) * 2014-12-30 2015-05-20 小米科技有限责任公司 一种文字信息的翻译方法及装置
US9384409B1 (en) * 2015-01-29 2016-07-05 Konica Minolta Laboratory U.S.A., Inc. Word segmentation for document image using recursive segmentation
CN107291683A (zh) * 2016-04-11 2017-10-24 珠海金山办公软件有限公司 一种拼写检查方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103019578A (zh) * 2011-09-27 2013-04-03 中国移动通信集团公司 文本选择方法和装置以及图片截取方法和装置
CN102609208A (zh) * 2012-02-13 2012-07-25 广州市动景计算机科技有限公司 在触屏设备上进行屏幕取词的方法、系统及触屏设备
CN102929924A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的取词搜索结果生成方法及装置
US20140173457A1 (en) * 2012-12-14 2014-06-19 Microsoft Corporation Browsing electronic messages displayed as tiles
CN104281394A (zh) * 2013-07-05 2015-01-14 腾讯科技(深圳)有限公司 智能选词的方法和装置
CN104731797A (zh) * 2013-12-19 2015-06-24 北京新媒传信科技有限公司 一种提取关键词的方法及装置
CN104156145A (zh) * 2014-08-13 2014-11-19 天津三星通信技术研究有限公司 基于手写笔的文本内容选定方法及便携式终端
CN105631393A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 信息识别方法及装置
CN105824552A (zh) * 2015-07-29 2016-08-03 维沃移动通信有限公司 一种文本信息的识别方法和装置
CN105573624A (zh) * 2016-01-29 2016-05-11 深圳天珑无线科技有限公司 通过压力触控技术快速完成文字编辑的方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378566A (zh) * 2021-05-31 2021-09-10 安徽淘云科技股份有限公司 信息内容显示方法、装置和设备

Also Published As

Publication number Publication date
US10489047B2 (en) 2019-11-26
CN106484266B (zh) 2020-02-21
US20180107359A1 (en) 2018-04-19
CN106484266A (zh) 2017-03-08

Similar Documents

Publication Publication Date Title
CN106484266B (zh) 一种文本处理方法及装置
CN106325688B (zh) 一种文本处理方法及装置
CN104462437B (zh) 基于终端界面多次触控操作进行识别搜索的方法及系统
US20150161246A1 (en) Letter inputting method, system and device
CN105868385B (zh) 基于终端界面触控操作进行搜索的方法及系统
CN107861932B (zh) 一种文本编辑方法、装置和系统以及一种终端设备
CN111338540B (zh) 图片文本处理方法、装置、电子设备和存储介质
CN105893613B (zh) 一种图像标识信息搜索方法及装置
CN104571866A (zh) 一种截屏方法
CN107977155B (zh) 一种手写识别方法、装置、设备和存储介质
CN104778195A (zh) 终端和基于触摸操作的搜索方法
CN114067797A (zh) 一种语音控制方法、装置、设备以及计算机存储介质
CN106970899B (zh) 一种文本处理方法及装置
CN113037925B (zh) 信息处理方法、信息处理装置、电子设备和可读存储介质
CN113869063A (zh) 数据推荐方法、装置、电子设备及存储介质
CN112764606A (zh) 标识显示方法、装置和电子设备
CN112183149B (zh) 图形码处理方法及装置
CN111796736B (zh) 应用程序的分享方法、装置和电子设备
CN111090382B (zh) 一种文字内容的输入方法及终端设备
CN112287131A (zh) 信息交互方法、信息交互装置
CN113807058A (zh) 文本显示方法和文本显示装置
CN113010072A (zh) 搜索方法、装置、电子设备及可读存储介质
KR20120133149A (ko) 데이터 태깅 장치, 그의 데이터 태깅 방법 및 데이터 검색 방법
CN112764551A (zh) 词汇显示方法、装置和电子设备
CN113436297A (zh) 图片处理方法和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: Tiktok vision (Beijing) Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.