CN114757180A - 一种选择文本的方法、电子设备及计算机可读存储介质 - Google Patents

一种选择文本的方法、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN114757180A
CN114757180A CN202011570649.9A CN202011570649A CN114757180A CN 114757180 A CN114757180 A CN 114757180A CN 202011570649 A CN202011570649 A CN 202011570649A CN 114757180 A CN114757180 A CN 114757180A
Authority
CN
China
Prior art keywords
text
segmentation
word
participle
target text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011570649.9A
Other languages
English (en)
Inventor
缪丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202011570649.9A priority Critical patent/CN114757180A/zh
Priority to PCT/CN2021/139261 priority patent/WO2022135302A1/zh
Publication of CN114757180A publication Critical patent/CN114757180A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种选择文本的方法及装置,应用于人工智能(Artificial Intelligence,AI)领域中的智能交互领域。该方法包括:获取触摸操作对应的第一文本;选取包含第一文本的第二文本;基于第二文本,确认所述第一文本中起始点字符对应的第一分词;基于所述第一分词对所述第一文本进行处理,得到目标文本并显示。该技术方案可以基于触摸操作对应的文本,智能分析用户实际想选择的文本,提高用户选择文本的准确性和便利性。

Description

一种选择文本的方法、电子设备及计算机可读存储介质
技术领域
本申请涉及电子设备交互技术领域,特别涉及一种选择文本的方法、电子设备及计算机可读存储介质。
背景技术
目前,对文本的操作是用户常用的操作,而选择文本是对文本进行操作的基础操作。例如,用户阅读网页内容时,发现感兴趣的信息,想复制保存下来;或者,用户想给好友发送消息时,发现需要发送的消息内容与之前已有的消息内容部分重叠,想将已有的内容复制过来直接使用。上述这些操作都需要用户先针对性选择目标文本,再对目标文本进行复制或其他操作。
但由于用户手指接触触摸屏时,用户目测的手指接触点和电子设备实际检测到的触摸点有不可避免的人为偏差,尤其是屏幕较小或文本字体较小时,这会使得用户很难选取理想的文本,降低了用户选择文本的准确度和操作体验。
发明内容
本申请实施例提供了一种选择文本的方法、电子设备及计算机可读存储介质,能基于检测到的用户触摸的文本内容,准确预测用户实际想要选取的文本内容,提高了用户选择文本的准确度,从而提升用户选择文本的速度,提高用户体验。
第一方面,本申请实施例提供了一种选择文本的方法,具体包括:获取触摸操作对应的第一文本;选取包含第一文本的第二文本;基于第二文本,确认所述第一文本中起始点字符对应的第一分词;基于所述第一分词对所述第一文本进行处理,得到目标文本;显示所述目标文本。
上述第一方面提供的技术方案,可以基于检测到的用户触摸操作对应的文本的起始点字符来进一步判断用户实际想要选择的文本,提升用户选择文本的准确性。该方案对于容易引起误操作的电子设备,例如屏幕较小或文本字体较小的电子设备,尤为便捷。
在一种可能的实现方式中,所述基于所述第一分词对所述第一文本进行处理,得到目标文本,具体包括:判断所述第一分词是否是预设的有意义的词;如果是预设的有意义的词,则选取所述第一分词与第一文本进行整合,得到目标文本;如果不是预设的有意义的词,则舍弃所述第一分词,在第一文本中去除所述第一分词对应的所述起始点字符,得到目标文本。
起始点字符对应的分词如果是有意义的词,那么用户实际想选取的概率是很大的,而且用户多半是想整个词都选择(一个词包含多个字符时),而不是选择词的一部分。而如果起始点字符对应的是无意义的词,那么被误选的概率很大。因此,基于对起始点字符是否是预设的有意义的词进行判断,来对第一文本进行处理,得到目标文本,更贴合用户选择文本的习惯,大大提升了用户选择文本的准确性。
在一种可能的实现方式中,所述方法还包括:基于所述第二文本,确认所述第一文本中结束点字符对应的第二分词;所述基于所述第一分词对所述第一文本进行处理,得到目标文本,具体包括:基于所述第一分词和所述第二分词,对所述第一文本进行处理,得到目标文本。
除了考虑第一文本的起始点字符对应的分词的情况,还同步考虑结束点字符对应的分词的情况来对第一文本进行处理,进一步贴近用户实际想选择的文本内容。
在一种可能的实现方式中,所述基于所述第一分词和所述第二分词,对所述第一文本进行处理,得到目标文本,具体包括:分别判断所述第一分词和所述第二分词是否是预设的有意义的词;如果所述第一分词和所述第二分词是预设的有意义的词,则选取所述第一分词和所述第二分词,并与所述第一文本进行整合,得到目标文本;或如果所述第一分词不是预设的有意义的词,所述第二分词是预设的有意义的词,则在所述第一文本中去除所述第一分词对应的所述起始点字符,并与所述第二分词进行整合,得到目标文本;或如果所述第一分词是预设的有意义的词,所述第二分词不是预设的有意义的词,则将所述第一文本与所述第一分词进行整合,并去除所述第二分词对应的所述结束点字符,得到目标文本。
同步考虑起始点字符和结束点字符对应的分词是否是有意义的词,来对第一文本进行处理,提高用户实际想选择文本的准确性。
在一种可能的实现方式中,所述预设的有意义的词是预置的词库的词,或者预先规定的词性的词。预设的有意义的词可以是用户预设的词库中的词,词库可以动态更新。词库中的词可以包含通用词,还可以包含网络用语、热门词、自造词等。针对不同的语言还可以有不同的词库。
在一种可能的实现方式中,所述预先规定的词性的词是实体词。而相反,非实体词可能属于无意义的词。
在一种可能的实现方式中,所述目标文本包含的所有的实体词都是完整的。这样就不会出现,一个实体词被选择了一部分,而另一部分没有被选择的情况。
在一种可能的实现方式中,在所述显示目标文本后,所述方法还包括:对所述目标文本对应的选择框进行操作,得到第三文本。用户还可以继续对目标文本的选择框进行操作,以选择更多或更少的文字,方便用户灵活调整。
在一种可能的实现方式中,在所述显示目标文本后,所述方法还包括:对所述目标文本进行其他操作。例如,用户可以对选择的文本进行复制、剪切等操作。
在一种可能的实现方式中,所述触摸操作是手指触摸操作,或触控笔的触摸操作。本方案的触摸操作不限于用户的手指触摸,触控笔的触摸操作也同样适用。
第二方面,本申请实施例提供了一种终端设备,该终端设备可以执行上述第一方面或者第一方面的多种可能的实现方式中的一种或几种的文本提取方法。
第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述第一方面或者第一方面的多种可能的实现方式中的一种或几种的文本提取方法。
第四方面,本申请实施例提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述第一方面或者第一方面的多种可能的实现方式中的一种或几种的文本提取方法。
在本发明公开的各个实施例的方案中,通过检测用户的触摸操作,获取触摸操作对应的第一文本,并通过有限扩大文本范围来获取第一文本的起始点字符/结束点字符对应的分词情况,处理第一文本得到目标文本。这样,本方案可以基于用户触摸操作粗定位的文本范围,进一步判断用户实际想要选择的文本内容,提升了用户选择文本的准确性。
附图说明
图1为本申请实施例的一种应用界面的用户操作示例性示意图;
图2为本申请实施例的一种电子设备200的结构示意图;
图3为本申请实施例的一种文本选择方法的方法示意图;
图4为本申请实施例的一种应用界面的文本选择结果的示例性示意图;
图5为本申请实施例的另一种文本选择方法的方法示意图;
图6为本申请实施例的另一种应用界面的用户操作示例性示意图;
图7为本申请实施例的另一种应用界面的文本选择结果的示例性示意图;
图8为本申请实施例的另一电子设备800的结构示意图。
具体实施方式
应理解,本申请实施例中“至少一个”是指一个或者多个。“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的三种情况。其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一(项)个”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a、b或c中的至少一项(个),可以表示:a,b,c,a和b,a和c,b和c,或a、b和c七种情况。其中a、b、c中的每一个本身可以是元素,也可以是包含一个或多个元素的集合。
在本申请中,“示例的”、“在一些实施例中”、“在另一些实施例中”等用于表示作例子、例证或说明。本申请中被描述为“示例”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用示例的一词旨在以具体方式呈现概念。
需要指出的是,本申请实施例中涉及的“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
选择文本的操作是电子设备中针对显示文本的常见操作,例如选择一段文字,然后复制,粘贴。对具有触摸屏的电子设备,用户通常可以通过单指或多指触摸操作来一次性选择一段相关的文字。但由于用户手指触摸时,用户瞄准的手指接触点和电子设备识别到的手指的实际触摸点不可避免存在误差,会导致电子设备识别到的实际触摸点对应的文字不同于用户真实想要选择的文字。
如图1所示,用户与好友1的聊天中说到“我今天和朋友一起去看了复仇者联盟5”。在这段文字中,用户想选择“复仇者联盟5”。由于电子设备识别到的实际触摸点相关的文字为“了复仇者联”,不同于“复仇者联盟5”。通常用户需要放弃之前的选择而重新选择,或者,用户调整之前触摸操作触发的选择框,以调整选择的文字为想要选择的文字。这些都需要用户更多的额外操作,甚至反复操作,才能使得用户选择到想要选择的文本。
本发明实施例提供了一种文本选择的方法,可以基于电子设备识别到的实际触摸点对应的文字,来进一步预测用户真实想要选择的文字,智能提高文本选择的准确性,从而进一步提高用户选择文本的速度和体验。
示例性的,本发明实施例涉及的电子设备可以是具有触摸屏的任意终端设备,包括而不限于手机、平板电脑、笔记本电脑、电视机、膝上计算机、台式计算机、移动电话、多媒体播放器、电子阅读器、智能车载设备、智能家电、人工智能设备、可穿戴电子设备(如智能手表等)、物联网设备、虚拟现实/增强现实/混合现实设备等。
图2示出了本申请实施例提供的一种电子设备200的硬件结构示意图。终端设备200可以包括处理器210,外部存储器接口220,内部存储器221,USB接口230,充电管理模块240,电源管理模块241,电池242,天线1,天线2,移动通信模块251,无线通信模块252,音频模块270,扬声器270A,受话器270B,麦克风270C,耳机接口270D,传感器模块280,按键290,马达291,指示器292,摄像头293,显示屏294,以及SIM卡接口295等。其中传感器模块280可以包括触摸传感器280K,(当然,终端设备200还可以包括其它传感器,比如陀螺仪传感器、加速度传感器、压力传感器、接近光传感器、指纹传感器、温度传感器、距离传感器、磁传感器、环境光传感器、气压传感器、或骨传导传感器等,图中未示出)。
处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(Neural-network Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。其中,控制器可以是终端设备200的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器210中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器210中的存储器为高速缓冲存储器。该存储器可以保存处理器210刚用过或循环使用的指令或数据。如果处理器210需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器210的等待时间,因而提高了系统的效率。
处理器210可以运行本发明实施例提供的文本选择方法,以便于准确预测和定位用户想选择的文本。处理器210可以包括不同的器件,比如集成CPU和NPU(AI芯片)时,CPU和NPU可以配合执行本公开实施例提供的文本选择方法,比如文本选择方法中部分算法由CPU执行,另一部分算法由NPU执行,以得到较快的处理效率。
显示屏294用于显示图像,视频等。显示屏294包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,终端设备200可以包括1个或N个显示屏294,N为大于1的正整数。显示屏294可用于显示由用户输入的信息或提供给用户的信息以及各种图形用户界面(graphical user interface,GUI)。例如,显示器294可以显示照片、视频、网页、或者文件等。显示屏294可以显示文本信息。当处理器210检测到用户的手指(或触控笔等)在显示屏294上针对显示的文字的触摸事件后,响应于该触摸事件,检测触摸事件对应的触摸区域的文字,并基于检测的触摸区域的文字进行预测,得到选择的目标文本,在显示器294上显示。
在本公开实施例中,显示屏294可以是一个一体的柔性显示屏,也可以采用两个刚性屏以及位于两个刚性屏之间的一个柔性屏组成的拼接显示屏等,本发明实施例不做限定。
当处理器210运行本公开实施例提供的文本选择方法后,终端设备200可以控制显示屏294显示相应的文本信息,以及响应用户的触摸操作后,显示用户选择的目标文本。例如图4或图7所示。
摄像头293(前置摄像头或者后置摄像头,或者一个摄像头既可作为前置摄像头,也可作为后置摄像头)用于捕获静态图像或视频。通常,摄像头293可以包括感光元件比如镜头组和图像传感器,其中,镜头组包括多个透镜(凸透镜或凹透镜),用于采集待拍摄物体反射的光信号,并将采集的光信号传递给图像传感器。图像传感器根据所述光信号生成待拍摄物体的原始图像。
内部存储器221可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器210通过运行存储在内部存储器221的指令,从而执行终端设备200的各种功能应用以及数据处理。内部存储器221可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,应用程序(比如相机应用,浏览器应用,社交应用等)的代码等。存储数据区可存储终端设备200使用过程中所创建的数据(比如相机应用采集的图像、视频等)等。
内部存储器221还可以存储本公开实施例提供的文本选择方法对应的一个或多个计算机程序1310。该一个或多个计算机程序1304被存储在上述存储器221中并被配置为被该一个或多个处理器210执行,该一个或多个计算机程序1310包括指令,上述指令可以用于执行如图3或图5相应实施例中的各个步骤。当内部存储器221中存储的文本选择方法的代码被处理器210运行时,处理器210可以在检测到用户针对文本的触摸操作后,控制显示屏显示图3或图5实施例中的目标文本。
此外,内部存储器221可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。
当然,本公开实施例提供的文本选择方法的代码还可以存储在外部存储器中。这种情况下,处理器210可以通过外部存储器接口220运行存储在外部存储器中的文本选择方法的代码。
下面介绍传感器模块280中的触摸传感器280K的功能。
触摸传感器280K,也称“触控面板”。触摸传感器280K可以设置于显示屏294,由触摸传感器280K与显示屏294组成触摸屏,也称“触控屏”。触摸传感器280K用于检测作用于其上或附近的触控操作。触摸传感器可以将检测到的触控操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏294提供与触控操作相关的视觉输出。在本公开实施例中,用户可以在触摸屏上执行图1和图6所示的触摸操作,处理器依据这些触摸操作可以获取到触摸区域。
示例性的,终端设备200的显示屏294显示主界面,主界面中包括多个应用(比如即时通信应用、浏览器应用等)的图标。用户通过触摸传感器280K点击主界面中即时通信应用的图标,触发处理器210启动即时通信应用。显示屏294显示即使通信应用的界面,例如登录界面或者聊天界面等。
终端设备200的无线通信功能可以通过天线1,天线2,移动通信模块251,无线通信模块252,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。终端设备200中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块251可以提供应用在终端设备200上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块251可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块251可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块251还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块251的至少部分功能模块可以被设置于处理器210中。在一些实施例中,移动通信模块251的至少部分功能模块可以与处理器210的至少部分模块被设置在同一个器件中。在本公开实施例中,移动通信模块251还可以用于与其它终端设备进行信息交互。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器270A,受话器270B等)输出声音信号,或通过显示屏294显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器210,与移动通信模块251或其他功能模块设置在同一个器件中。
无线通信模块252可以提供应用在终端设备200上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块252可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块252经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器210。无线通信模块252还可以从处理器210接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。本公开实施例中,无线通信模块252,用于在处理器210的控制下与其他终端设备之间传输数据,比如,处理器210运行本公开实施例提供的文本选取方法时,处理器可以控制无线通信模块252向其他终端设备发送服务请求,还可以接收其他终端设备基于上述服务请求提供的服务结果。例如,向其他终端设备发送网页访问请求,接收其他终端设备提供的网页内容,或向其他终端发送即时消息,接收其他终端通过网络发送过来的即时消息等。
另外,终端设备200可以通过音频模块270,扬声器270A,受话器270B,麦克风270C,耳机接口270D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
应理解,在实际应用中,终端设备200可以包括比图2所示的更多或更少的部件,本公开实施例不作限定。图示终端设备200仅是一个范例,并且终端设备200可以具有比图中所示出的更多的或者更少的部件,可以组合两个或更多的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
以下将结合附图,对本申请实施例提供的文本选择方法做具体介绍。
如图3所示,本发明实施例1提供了一种文本选择的方法300,具体包括:
S302,获取触摸操作对应的第一文本。
电子设备可以检测用户的触摸操作。当检测到用户的触摸操作时,电子设备会获取触摸操作对应的坐标,并根据获取到的坐标,匹配与实际触摸点对应的文本,即第一文本。该触摸操作可以是用户手指的触摸操作,也可以是用户通过触控笔(或叫手写笔)等作用的触摸操作。触摸操作对应的坐标可以是起始点坐标和结束点坐标,也可以是从起始点到结束点之间的多个坐标或者坐标区间。本发明实施例对此不做具体限定。
以图1中对应的文本选取为例,在“我今天和朋友一起去看了复仇者联盟5”中,用户想选择“复仇者联盟5”,而电子设备识别到的实际触摸点的坐标对应的相关文本为“了复仇者联”。即第一文本为“了复仇者联”。
S304,选取包含第一文本外的更多内容的第二文本。
一种可选的实现方式中,在检测到文本选择的触摸操作后,电子设备可以选取一段连续的长文本。该长文本不仅包含起始点和结束点之间的文本内容,还包含了起始点符号和结束点符号对应的分词。该长文本为第二文本。
在上面的实例中,起始点字符为“了”,结束点字符为“联”。第二文本可以是“我今天和朋友一起去看了复仇者联盟5”。
S306,基于第二文本,查找第一文本中起始点和结束点字符对应的分词。
电子设备获取第二文本后,可以对第二文本的内容进行处理,得到第二文本对应的所有分词。然后在所有的分词中查找起始点字符和结束点字符对应的分词。
在一种可实现方式中,电子设备可以通过自然语言处理(Natural LanguageProcessing,NLP)模块来处理第二文本,得到第二文本对应的所有分词。其中,分词是将句子、段落分解成的字词单位。将句子、段落分解成字词单位是NLP的基础功能。如何通过NLP实现分词是AI领域的现有技术,本发明实施例对此不做详细说明和具体限定。
上述实例中,第二文本“我今天和朋友一起去看了复仇者联盟5”对应的分词分别为“我”、“今天”、“和”、“朋友”、“一起”、“去”、“看”、“了”、“复仇者联盟5”。
如果起始点字符对应的分词,是预设的有意义的词,如实体词,则选取该分词。而如果起始点字符对应的分词是预设的无意义的词,例如非实体词,则舍弃该起始点字符。结束点字符也根据类似的方法进行处理。
电子设备可以通过预置的词库来判定是否是预设的有意义的词或者无意义的词。具体的,电子设备可以有预先设置的有意义的词对应的词库。例如,电子设备可以预置一个词库A。如果分词对应的是词库A中的词,则认为是有意义的词,进而选取该分词,而如果不是词库A中的词,则认为是无意义的词,进而舍弃该分词。
词库A包含的词可以配置。例如词库A中可以包含各实体词,如名词、动词、代词、形容词等。词库A中的词也可以包含网络用语、热门自造词等,甚至可以提供向词库A中添加词的接口给用户。词库A中的词可以实时更新,例如实体词词库可以实时添加新的人名、电影名、歌曲名、网络用语等。
可选的,电子设备还可以预置一个词库B,对应无意义的词。电子设备也可以判断如果分词是词库B中的词,则舍弃该分词,否则选取该分词。词库B中可以包含非实体词,如助词、副词、介词、符号等。词库B也可以包含一些非实体词外的词,或者用户添加的词,等。
在一种可实现的方式中,电子设备也可以通过简单判定分词是否是实体词来选取或舍弃。不过该方式可能没有预置词库判断准,也不好实时更新。
可选的,电子设备也可以对起始点字符或结束点字符是符号的情况有进一步的判断,例如如果是起始点字符是符号,则舍弃,而如果是结束点字符是符号,则选取。
S308,根据起始点字符和结束点字符对应的分词对第一文本进行处理,得到目标文本并显示。
如果选取了起始点字符对应的分词,电子设备将选取的起始点分词与第一文本进行整合。如将起始点分词与第一文本进行拼接并去重。
而如果没有选取起始点字符对应的分词,电子设备将起始点字符,如文字或标点符号,从第一文本中去除。
结束点字符也像起始点字符一样做类似的处理。如果选取了结束点字符对应的分词,电子设备将选取的结束点分词与第一文本进行整合。如将结束点分词与第一文本进行拼接并去重。而如果没有选取起始点字符对应的分词,电子设备将结束点字符,如文字或标点符号,从第一文本中去除。
将第一文本的起始点字符和结束点字符进行上述处理后,得到目标文本。
图1实例中,起始点字符“了”对应的分词是“了”,属于无意义的词,则舍弃。而结束点字符“联”对应的分词是“复仇者联盟5”,属于有意义的分词,则选取。整合后,得到的目标文本为“复仇者联盟5”,如图4所示。
不同的电子设备显示选择文本的方式不同。得到目标文本后,目标文本以触摸操作对应的显示方式显示,例如高亮、或加阴影等凸显出来,图4只是简单的示例,具体显示方式本发明实施例不做具体限定。
在一种可选的实现方式中,如果一段文本中,某些字符可以有多种分词方式,例如“复”可以对应“复仇”“复仇者”“复仇者联盟”“复仇者联盟5”,NLP在分词时,可根据这些分词的情况选择一个作为本段文本的分词,例如选择“复仇者联盟5”。例如某一分词相对其他分词来说,是多数用户选择更多的词,或是当前的热词,或是最新加入的有意义的词,等,电子设备在在分词时可能会更大概率选择该分词。
可选的,在显示目标文本后,用户还可以对目标文本对应的选择框进行调整,以选择更多或更少的内容。例如,对图4所示的虚线框的边框进行拖动,以选择更多或更少的内容。
在显示目标文本后,用户还可以基于目标文本进行其他常用的文本操作,例如复制/剪切文本等。
本发明实施例的上述方法不限于中文文本的选择,也可适用于其他语言的文本。例如文本“I went to see the Avengers 5with my friends today.”对应的分词序列可以为:“I”“went to”“the Avengers 5”“with”“my friends”“today”“.”。检测到用户的触摸操作,电子设备实际检测的触摸操作对应的文本为“Avengers 5with my”。由于“Avengers”对应的分词为“the Avengers 5”,是预设的有意义的词,“my”对应的分词为“myfriends”,也是预设的有意义的词。那么根据本发明实施例的方法,基于检测到触摸操作对应的文本处理后,得到的目标文本为“the Avengers 5with my friends”。
本发明实施例提供的文本选择方法,在检测到实际触摸点对应的第一文本后,电子设备通过主动获取更多内容的第二文本,以便于对第一文本的起始点和结束点对应的分词进行判断是否是有意义的分词,并基于起始点和结束点的分词的情况来调整选择的文本,得到目标文本。该文本选择方法能基于电子设备实际检测到的触摸操作粗定位的文本,来智能预测用户实际想选择的文本内容,弥补了触摸操作带来的选择误差,提高了用户选择文本的准确性,从而提高了用户选择文本的速度和用户体验。
基于上述实施例1,图5示出了本发明具体实现方式的实施例2。上述实施例1中的内容均适用于实施例2。
下述以双指触摸选择文本为例。
S502,检测双指触摸操作对应的文本区间。
图6中所示的触摸区域为电子设备实际检测到的双指触摸操作对应的触摸区域。手机在检测到手指的双指触摸操作后,分别识别两个手指的触摸位置对应的显示屏的坐标,根据识别到的坐标的相对位置关系,判断触摸位置对应的起始点和结束点,并根据起始点和结束点确定出本次双指触摸操作对应的文本区间。
可以理解的是,该触摸操作也可以不限于双指触摸操作,还可以是多指触摸操作。电子设备可以先分别识别出多指触摸的多个触摸点的坐标,然后根据多个坐标的相对位置关系以及文本的排布方式,确定出起始点和结束点,进而根据起始点和结束点确定出多指触摸对应的文本区间。
S504,提取包含上述触摸操作对应的文本外的足够的长文本。
长文本可以有多种获取方法,本发明实施例不限定具体获取长文本的方法。
例如,长文本除了包含起始点字符和结束点字符之间的文本(第一文本),还包括从起始点字符开始向前多取一行的文本,以及从结束点字符开始向后多取一行的文本。如果起始点字符前面没有更多一行,则取起始点字符所在的整行。或者,如果结束点字符后面没有更多一行,则取结束点字符所在的整行。
或者,第二文本可以通过识别起始点字符和结束点字符附近的特定的标点符号来获取。特定的标点符号可以是逗号、句号、分号等。例如,第二文本除了包含第一文本,还包括起始点到前一个标点符号之间的所有文本,以及结束点往后一个标点符号之间的所有文本。
或者,电子设备也可以通过识别起始点字符和结束点字符所在的整个段落作为长文本。
电子设备也可以根据算法的优化而动态调整不同的长文本获取的方法。
图6所示的示例中,长文本可以为“在肖特看来,封锁的目的是使疫情增长速度趋于平缓,同时研发治疗方法”,或者长文本可以为“封锁的目的是使疫情增长速度趋于平缓”。
S506,处理长文本,按照原文出现顺序获得分词列表与字符列表,并获得他们的映射关系。
电子设备可以通过NLP来处理该长文本,按顺序获取所有的分词列表和字符列表。
图6所示的示例中,以长文本内容为“在肖特看来,封锁的目的是使疫情增长速度趋于平缓,同时研发治疗方法。”为例,该长文本对应的分词列表为:“在”“肖特”“看来”“,”“封锁”“的”“目的”“是”“使”“疫情”“增长”“速度”“趋于”“平缓”“,”“同时”“研发”“治疗”“方法”“。”。
可选的,电子装置也可以记录该长文本对应的字符列表,并记录字符列表和分词列表的映射关系。这样可以方便标识具体是哪个字符对应到哪个分词。
例如,上述长文本对应的字符列表为:“在”“肖”“特”“看”“来”“,”“封”“锁”“的”“目”“的”“是”“使”“疫”“情”“增”“长”“速”“度”“趋”“于”“平”“缓”“,”“同”“时”“研”“发”“治”“疗”“方”“法”“。”。
上述分词列表和字符列表中,字符“封”对应分词“封锁”,第一个字符“的”对应分词“的”,第二个字符“的”对应分词“目的”,等。
S508,查找起始点与结束点字符对应的分词。
起始点和结束点的分词如果是有意义的词,则选取该分词。而如果是无意义的词,则舍弃。
图6所示的示例中,起始点字符“的”对应的分词是“的”,不属于有意义的词,则舍弃。结束点“平”对应的分词是“平缓”,属于有意义的词,则选取。怎么判定分词是否是有意义的词,还是无意义的词,可以参考S306中的判定方法,例如可以通过预置的词库来定义,也可以通过判定分词内容的词性(例如是否是实体词等)来判定,等,此处不再赘述。
S510,选取起始点与结束点以内的分词序列。
在对起始点字符对应的分词和结束点字符对应的分词进行判断后,选取起始点字符与结束点字符以内的所有分词序列。例如如图5所示的示例中,起始点与结束点以内的分词序列为:“目的”“是”“使”“疫情”“增长”“速度”“趋于”。
S512,将选取的分词按原文显示序列合成,得到目标文本,并在触摸屏上以与选中操作对应的显示方式显示。
将上述得到的分词按原文顺序合成,得到目标文本。如有重合文本,则先去重后合成。
图6所示的示例中,本次触摸操作选择的分词分别为“目的”“是”“使”“疫情”“增长”“速度”“趋于”“平缓”。合成后的目标文本为“目的是使疫情增长速度趋于平缓”,如图7所示。
目标文本在触摸屏上以与选中操作对应的显示方式显示。不同的电子设备可能会有不同的显示方式,图7所示的显示只是示意,并不构成任何限定。
可选的,在显示的目标文本的基础上,用户还可以继续对文本选择进行调整操作,如拖动目标文本的选择框的边框继续选择更多的文本,或者调整选择框选择更少的文本。
本发明实施例的上述方法也不限于中文文本的选择,可适用于其他语言的文本。
基于上述实施例1和实施例2的相同的构思,本申请实施例还提供了一种电子设备800,如图8所示,包括显示模块801、检测模块802、处理模块803和存储模块804。
电子设备800是可用于实现上述实施例1和实施例2所示的文本选择方法的电子设备。
显示模块801,用于显示文本信息,例如实施例1和实施例2所示的各类文本信息。显示模块801还能在用户选择文本后,以特定的方式呈现用户选择的文本。
检测模块802可用于检测用户的触摸操作,例如可以检测手指的触摸操作,包括单指触摸、双指触摸或多指触摸等,也可以检测例如触摸笔/手写笔的触摸操作等。可选的,检测模块802还可以在显示模块显示目标文本后,继续检测用户的各种操作,例如用户调整选择的文本的操作,或者用户输入的对目标文本进行复制/剪切的操作,等。
处理模块803可用于在检测模块802检测到用户的触摸操作后,执行图3中S302-S308的方法,或图4中S402-S412的文本选择方法。
电子设备800还可以包括存储模块804。存储模块804可用于存储计算机程序和/或数据。存储模块804存储实施例1和实施例2中涉及的预置的词库,例如词库A和词库B。
具体的,在本申请实施例中,显示模块801可以包含前述图2所示实施例中的显示屏294。检测模块802可以包含前述图2所示实施例中的触摸传感器280K。或者,检测模块802还可以包含处理器210的一部分,用于配合实现触摸操作的检测。处理模块803可以包含前述图2所示实施例中的处理器210。存储模块804可以包含前述图2所示实施例中的内部存储器221。
关于电子设备800实现文本选择的具体执行过程,可参见上方法实施例1和实施例2中的详细描述,此处不再赘述。本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本申请各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
上述实施例中所用,根据上下文,术语“当…时”可以被解释为意思是“如果…”或“在…后”或“响应于确定…”或“响应于检测到…”。类似地,根据上下文,短语“在确定…时”或“如果检测到(所陈述的条件或事件)”可以被解释为意思是“如果确定…”或“响应于确定…”或“在检测到(所陈述的条件或事件)时”或“响应于检测到(所陈述的条件或事件)”。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘)等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (12)

1.一种文本选择方法,其特征在于,所述方法包括:
获取触摸操作对应的第一文本;
选取包含第一文本的第二文本;
基于第二文本,确认所述第一文本中起始点字符对应的第一分词;
基于所述第一分词对所述第一文本进行处理,得到目标文本;
显示所述目标文本。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一分词对所述第一文本进行处理,得到目标文本,具体包括:
判断所述第一分词是否是预设的有意义的词;
如果所述第一分词是预设的有意义的词,则选取所述第一分词与第一文本进行整合,得到目标文本;或者
如果所述第一分词不是预设的有意义的词,则舍弃所述第一分词,在第一文本中去除所述第一分词对应的所述起始点字符,得到目标文本。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
基于所述第二文本,确认所述第一文本中结束点字符对应的第二分词;
所述基于所述第一分词对所述第一文本进行处理,得到目标文本,具体包括:
基于所述第一分词和所述第二分词,对所述第一文本进行处理,得到目标文本。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一分词和所述第二分词,对所述第一文本进行处理,得到目标文本,具体包括:
分别判断所述第一分词和所述第二分词是否是预设的有意义的词;
如果所述第一分词和所述第二分词是预设的有意义的词,则选取所述第一分词和所述第二分词,并与所述第一文本进行整合,得到目标文本;或
如果所述第一分词不是预设的有意义的词,所述第二分词是预设的有意义的词,则在所述第一文本中去除所述第一分词对应的所述起始点字符,并与所述第二分词进行整合,得到目标文本;或
如果所述第一分词是预设的有意义的词,所述第二分词不是预设的有意义的词,则将所述第一文本与所述第一分词进行整合,并去除所述第二分词对应的所述结束点字符,得到目标文本。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述预设的有意义的词是预置的词库的词,或者预先规定的词性的词。
6.根据权利要求5所述的方法,其特征在于,所述预先规定的词性的词是实体词。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述目标文本包含的所有的实体词都是完整的。
8.根据权利要求1-7任一项所述的方法,其特征在于,在所述显示目标文本后,所述方法还包括:
对所述目标文本对应的选择框进行操作,得到第三文本。
9.根据权利要求1-8任一项所述的方法,其特征在于,在所述显示目标文本后,所述方法还包括:
对所述目标文本进行其他操作。
10.根据权利要求1-9任一项所述的方法,其特征在于,所述触摸操作是手指触摸操作,或触控笔的触摸操作。
11.一种电子设备,其特征在于,包括处理器,用于存储处理器可执行指令的存储器,以及用于显示文本并接收用户触摸操作的触摸屏,所述处理器调用所述可执行指令时以使得终端实现如权1-10任意一项所述的文本选择方法。
12.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1-10中任意一项所述的方法。
CN202011570649.9A 2020-12-26 2020-12-26 一种选择文本的方法、电子设备及计算机可读存储介质 Pending CN114757180A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011570649.9A CN114757180A (zh) 2020-12-26 2020-12-26 一种选择文本的方法、电子设备及计算机可读存储介质
PCT/CN2021/139261 WO2022135302A1 (zh) 2020-12-26 2021-12-17 一种选择文本的方法、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011570649.9A CN114757180A (zh) 2020-12-26 2020-12-26 一种选择文本的方法、电子设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114757180A true CN114757180A (zh) 2022-07-15

Family

ID=82157365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011570649.9A Pending CN114757180A (zh) 2020-12-26 2020-12-26 一种选择文本的方法、电子设备及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN114757180A (zh)
WO (1) WO2022135302A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8786556B2 (en) * 2009-03-12 2014-07-22 Nokia Corporation Method and apparatus for selecting text information
CN102937864B (zh) * 2012-10-31 2015-11-25 百度在线网络技术(北京)有限公司 一种用于在触摸终端上确定所选文本的方法与设备
CN104750661B (zh) * 2013-12-30 2018-09-28 腾讯科技(深圳)有限公司 一种对文本进行选定词句的方法和装置
CN110032324B (zh) * 2018-01-11 2024-03-05 荣耀终端有限公司 一种文本选中方法及终端
CN111414122B (zh) * 2019-12-26 2021-06-11 腾讯科技(深圳)有限公司 一种智能文本处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2022135302A1 (zh) 2022-06-30

Similar Documents

Publication Publication Date Title
RU2616536C2 (ru) Способ, устройство и терминальное устройство для отображения сообщений
CN108763582B (zh) 文件搜索方法、装置、终端及存储介质
CN107102746B (zh) 候选词生成方法、装置以及用于候选词生成的装置
CN109189879B (zh) 电子书籍显示方法及装置
US20120239673A1 (en) Electronic device and method of controlling the same
US20200394356A1 (en) Text information processing method, device and terminal
CN112068762B (zh) 应用程序的界面显示方法、装置、设备及介质
US11749273B2 (en) Speech control method, terminal device, and storage medium
CN108932102B (zh) 数据处理方法、装置以及移动终端
CN107688399B (zh) 一种输入方法和装置、一种用于输入的装置
JP7181375B2 (ja) 目標対象の動作認識方法、装置及び電子機器
CN110414232B (zh) 恶意程序预警方法、装置、计算机设备及存储介质
CN112269853B (zh) 检索处理方法、装置及存储介质
CN111209377B (zh) 基于深度学习的文本处理方法、装置、设备及介质
CN109165292A (zh) 数据处理方法、装置以及移动终端
CN109753202B (zh) 一种截屏方法和移动终端
CN109917988B (zh) 选中内容显示方法、装置、终端及计算机可读存储介质
US20220236837A1 (en) View Display Method and Electronic Device
CN111459363A (zh) 信息展示方法、装置、设备及存储介质
CN110688497A (zh) 资源信息搜索方法、装置、终端设备及存储介质
CN111273827B (zh) 一种文本处理方法及电子设备
CN115131789A (zh) 文字识别方法、设备及存储介质
CN110266875B (zh) 一种提示信息的显示方法及电子设备
CN112764600A (zh) 资源处理方法、装置、存储介质及计算机设备
CN110932964A (zh) 一种信息的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination