CN112001153B - 文本处理方法、装置、计算机设备和存储介质 - Google Patents

文本处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112001153B
CN112001153B CN202010806205.4A CN202010806205A CN112001153B CN 112001153 B CN112001153 B CN 112001153B CN 202010806205 A CN202010806205 A CN 202010806205A CN 112001153 B CN112001153 B CN 112001153B
Authority
CN
China
Prior art keywords
text
tag
label
target
editor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010806205.4A
Other languages
English (en)
Other versions
CN112001153A (zh
Inventor
刘阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010806205.4A priority Critical patent/CN112001153B/zh
Publication of CN112001153A publication Critical patent/CN112001153A/zh
Application granted granted Critical
Publication of CN112001153B publication Critical patent/CN112001153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开了一种文本处理方法、装置、计算机设备和存储介质,该方法包括:在检测到文本编辑器的编辑区内存在粘贴事件,获得待粘贴的目标内容;如目标内容为富文本,确定富文本的至少一个标签,标签包括标签类别以及文本内容;针对富文本中每个标签,按照标记语言的语法及标签的标签类别所表征的格式特征,将标签内的文本内容转换为采用标记语言描述的目标文本;将至少一个标签对应的目标文本返回文本编辑器,以在文本编辑器的编辑区粘贴至少一个标签对应的目标文本。本申请的方案可以在保留富文本具有的格式特征的前提下,向文本编辑器的编辑区粘贴文本,以提高利用文本编辑器编辑文档的效率。

Description

文本处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种文本处理方法、装置、计算机设备和存储介质。
背景技术
采用标记语言的文本编辑器通过简单的标记语法可以使普通文本内容具有一定的格式。用户可以在该种文本编辑器内使用易读易写的纯文本格式编写文档,然后该种文本编辑器可以将用户编写的纯文本转换为具有文字效果或者文字链接等格式的富文本。
在利用采用标记语言的文本编辑器编辑文档的过程中,用户经常会向该文本编辑器的编辑区内粘贴文本内容。然而,由于采用标记语言的文本编辑器的编辑区只能支持纯文本的编写,因此,如果用户向该文本编辑器的编辑区粘贴富文本,则最终只能将富文本中的纯文本内容粘贴到该编辑区,从而导致富文本内的格式无法保留,无法实现较为高效的文档编写。
发明内容
有鉴于此,本申请提供了一种文本处理方法、装置、计算机设备和存储介质,以实现在保留富文本具有的格式特征的前提下,向文本编辑器的编辑区粘贴文本,提高利用文本编辑器编辑文档的效率。
为实现上述目的,本申请提供了如下技术方案:
一方面,本申请提供了一种文本处理方法,包括:
在检测到文本编辑器的编辑区内存在粘贴事件,获得所述粘贴事件请求粘贴的目标内容;
如所述目标内容为富文本,确定所述富文本的至少一个标签,所述标签包括标签类别以及文本内容,所述标签类别用于表征标签中文本内容的格式特征;
针对所述富文本中每个标签,按照所述标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,其中,所述目标文本表示具有所述标签的标签类别表征的格式特征的所述文本内容;
将所述至少一个标签对应的目标文本返回所述文本编辑器,以在所述文本编辑器的编辑区粘贴所述至少一个标签对应的目标文本。
在一种可能的实现方式中,所述针对所述富文本中每个标签,按照所述标记语言的语法以及所述标签的标签类别所表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,包括:
针对每个标签,如所述标签为多层嵌套标签,则确定所述标签内各层级标签以及各层级标签之间的嵌套关系;
按照所述嵌套关系,递归遍历各层级的标签,并针对每个层级的标签,按照所述标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本。
在又一种可能的实现方式中,所述按照所述标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,包括:
按照所述标签的标签类别表征的格式特征,确定所述标记语言中用于表示所述格式特征的标记符号;
按照所述标记语言的语法,基于所述标记符号和所述标签内的文本内容构建采用所述标记语言描述的目标文本。
又一方面,本申请还提供了一种文本处理装置,包括:
事件处理单元,用于在检测到文本编辑器的编辑区内存在粘贴事件,获得所述粘贴事件请求粘贴的目标内容;
文本分析单元,用于如所述目标内容为富文本,确定所述富文本的至少一个标签,所述标签包括标签类别以及文本内容,所述标签类别用于表征标签中文本内容的格式特征;
标签处理单元,用于针对所述富文本中每个标签,按照所述标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,其中,所述目标文本表示具有所述标签的标签类别表征的格式特征的所述文本内容;
文本返回单元,用于将所述至少一个标签对应的目标文本返回所述文本编辑器,以在所述文本编辑器的编辑区粘贴所述至少一个标签对应的目标文本。
又一方面,本申请还提供了一种计算机设备,包括存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如上任意一项所述的文本处理方法。
又一方面,本申请还提供了一种存储介质,用于存储程序,所述程序被执行时,用于实现如上任一项所述的文本处理方法。
由以上内容可知,在本申请中如果存在待向文本编辑器的编辑区内粘贴的富文本,针对富文本中每个标签,会按照该标签内的标签类别表征的格式特征及该文本编辑器所采用的标记语言对应的语法,将标签内的文本内容转换为采用标记语言描述的目标文本,使得目标文本既可以表示出该文本内容又可以表示出该文本内容对应的该格式特征,因此,将目标文本粘贴到该文本编辑器的编辑区,便可以实现将富文本中文本内容的格式特征也保留到该文本编辑器的编辑区,从而无需用户在重复编辑文本内容的格式,进而可以提高利用文本编辑器编辑文档的编辑效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本申请所适用的一种场景的组成架构示意图;
图2示出了本申请提供的文本处理方法一个实施例的流程示意图;
图3示出了本申请提供的文本处理方法又一个实施例的流程示意图;
图4示出了本申请提供的文本处理方法又一个实施例的流程示意图;
图5示出了粘贴事件请求粘贴的富文本的一种示意图;
图6示出了文本编辑器的一种界面示意图;
图7示出了文本编辑器的又一种界面示意图;
图8示出了本申请的文本处理方法应用于一种应用场景的具体流程示意图;
图9示出了本申请提供的文本处理装置的一种组成结构示意图;
图10示出了本申请提供的计算机设备的一种组成架构示意图。
具体实施方式
本申请的文本处理方法适用于对待向文本编辑器的编辑区内粘贴的富文本的处理。其中,该文本编辑器为支持标记语言,且用于将编辑区内的纯文本转换为富文本的文本编辑器。其中,标记语言是一种使用标记标识将文本及文本相关的格式等其他信息结合起来的编码语言。
在本申请中,对于文本编辑器所支持的标记语言可以为任意能够实现标记出纯文本的格式特征的标记语言,对于标记语言具体为哪种并不限定。如,文本编辑器可以为支持markdown的文本编辑器,即markdown编辑器。
其中,该文本编辑器可以位于用户的计算机设备内,如,在计算机设备上安装有文本编辑器或者具有文本编辑器的应用,以使得用户可以基于计算机设备中的文本编辑器实现文档编写。
该文本编辑器也可以是位于服务器或者云平台等网络侧的服务系统内,在此基础上,用户可以利用终端访问文本编辑器所在的服务器或者云平台,以基于服务器或者云平台提供的在线文本编辑器实现文档编辑。
为了便于理解,下面以云平台安装有支持标记语言的文本编辑器为例,以本申请的方案所适用的一种场景进行说明,如图1所示。
由图1可以看出,该场景包括:云平台10,云平台可以包括多个云服务器101。
其中,云平台也称为云计算平台,其基于云技术构建出的网络平台。其中,云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术(Cloud technology)是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。技术网络系统的后台服务需要大量的计算、存储资源,如图像存储以及编码等等。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
其中,云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
如图1所示,在本申请中该云平台上运行有支持标记语言的文本编辑器。
在图1中场景中还包括至少一个终端20,终端可以通过浏览器访问云平台,以基于云平台的文本编辑器实现文档编辑。在此基础上,终端的浏览器可以加载包含该文本编辑器的编辑区的界面,以使得用户可以利用标记语言在该文本编辑器的编辑区编写符合该标记语言的语法的纯文本。
可以理解的是,图1是基于云平台的文本编辑器来实现文档编辑为例。但是基于服务器或者服务器集群上的文本编辑器来实现文档编辑的过程也类似,在此不再赘述。
当然,在实际应用中,用户如果利用个人计算机等计算机设备上的文本编辑器实现文档编辑,则只需打开该文本编辑器或者具备文本编辑器的应用,便可以呈现出包含该文本编辑器的编辑区的界面,并在该编辑区进行文档编写。
结合以上内容,下面结合流程图对本申请的文本处理方法进行介绍。
如图2,其示出了本申请一种文本处理方法又一个实施例的流程示意图,本实施例的方法可以应用于个人计算机以及笔记本等用户个人的计算机设备,也可以应用于服务器或者云平台中的服务器等计算机设备。该计算机设备中运行有文本编辑器。
本实施例的方法可以包括:
S201,在检测到文本编辑器的编辑区内存在粘贴事件,获得粘贴事件请求粘贴的目标内容。
如前面所述,本申请实施例中,文本编辑器用于将编辑区内采用设定的标记语言编写的纯文本转换为富文本。如,该文本编辑器可以为markdown编辑器,其中,Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。
其中,该粘贴事件为该文本编辑器的编辑区内存在的粘贴请求所触发的事件。如,在光标处于文本编辑器的编辑区的前提下,用户通过点击鼠标右键触发计算机设备在该编辑区显示出菜单,并点击该菜单上的“粘贴”,则会触发计算机设备生成向该编辑区内粘贴已复制内容的粘贴事件。
在本申请实施例中,检测到该文本编辑器的编辑区内的粘贴事件时,并不会直接响应粘贴事件并文本编辑器返回待粘贴的内容,而实际上是会拦截该粘贴事件,以便获得该粘贴事件请求粘贴的目标内容并进行后续处理。
其中,为了便于区分和描述,本申请将待粘贴的内容称为目标内容。
可以理解的是,计算机设备中已复制的内容都会缓存到指定存储区,因此,本申请可以从指定缓存区获取最近缓存的内容,得到该粘贴事件请求粘贴的目标内容。如。计算机设备一般通过剪切板缓存已复制的内容,在此基础上,可以从剪切板获取该粘贴事件请求粘贴的目标内容。
S202,如目标内容为富文本,确定富文本的至少一个标签。
其中,标签包括标签类别以及文本内容。
其中,富文本支持丰富的格式,富文本中除了支持纯文本之外,还支持文字效果、文本字体、链接以及图文混排等。
在本申请实施例中富文本中可以包括至少一个标签。当然,该富文本还可以包括纯文本。其中,标签类别用于定义标签中文本内容的格式特征,不同标签类别的标签所表征的格式特征不同。如,标签类别可以分为定义文本内容的文字字体、文字颜色以及定义文本内容的文本类别(如,定义文本内容为标题)等多种格式类别的标签类别。
相应的,标签内文本内容对应的格式由文本内容对应的标签类别决定,文本内容对应的标签类别也就是标记该文本内容的标签类别。如,标记文本内容的标签类别为标题,则该文本内容应该作为标题;又如,标记该文本内容的标签类别为红色字体,则表示文本内容的字体为红色。
在一种可能实现方式中,标签中可能会通过标签名来表示不同的标签类别,因此,标签类别可以为标签名。如,标签名为表征粗体的标签名,则说明需要定义该标签名对应的文本内容的字体为粗体。例如,以富文本为HTML文本为例,则该HTML文本中包括至少一个HTML标签,每个HTML标签包括标签名和文本内容,如,标签名可以为<b>,则说明该标签用于定义字体粗体。
可以理解的是,标签中除了标签类别和标签类别定义的文本内容之外,还会包括标签的属性信息,该属性信息表征文本内容的行间距、高度等等信息,具体可以根据需要设定,对此不加限制。
S203,针对富文本中每个标签,按照标记语言的语法以及该标签的标签类别所表征的格式特征,将标签内的文本内容转换为采用标记语言描述的目标文本。
其中,该目标文本表示具有该标签的标签类别所表征的格式特征的文本内容。
可以理解的是,标记语言的语法中定义了采用标记语言定义各种格式特征的方式,因此,按照该标记语言的语法可以确定采用该标记语言如何定义文本所具有的格式特征。如,以标记语言为markdown语言为例,在markdown语言中,#表示一级标题,因此,如果文本前面存在#,则说明该文本为一级标题;通过文本两端的*可以定位文本为斜体,例如,*123*表示“123“的字体为斜体。
基于此可知,在富文本的标签内的文本内容以及该文本内容所具有的格式特征确定的情况下,按照该标记语言的语法,可以采用标记语言构建出表示该文本内容具有该格式特征的目标文本。由此,便可以实现将富文本中的标签转换为采用标记语言描述的目标文本,既符合文本编辑器对于编辑区内仅编写纯文本的要求,又能通过采用该标记语言描述的目标文本保留该富文本的标签内定义的文本内容的格式特征,避免了用户再重新为该文本内容添加符合标记语言语法的特征标记。
在一种可选方式中,针对每个标签,可以按照该标签的标签类别所表征的格式特征,确定该标记语言中用于表示该格式特征的标记符号。然后,按照该标记语言的语法,基于该标记符号和该标签内的文本内容构建采用标记语言描述的目标文本。
其中,标记语言中定义不同格式特征采用不同的标记符号。其中,该标记符号可以为一个字符,也可以为多个字符的组合。
其中,标记语言的语法中会包括不同标记符号标记文本的具体方式,基于此,可以基于确定出的标记符号以及待标记的该文本内容,可以构建出包含该标记符号和该文本内容的目标文本。
如,仍以markdown语言为例,在markdown语言中,在标签内“报告“的格式特征为一级标题时,则确定该markdown语法中,表示一级标题的标记符号为#,基于markdown语法可知将该标记符号与文本内容之间有空格,便可以表示该标记符合之后的文本内容为一级标题。基于此,可构建出目标文本为:#报告。可见,该目标文本表示“报告”这一文本为一级标题,这与富文本中包含的文本“报告”以及“报告”的格式特征为一级标题一致。
可以理解的是,富文本中有些标签为多层嵌套标签,即,一个标签内还嵌套有其他标签,在此基础上,每个标签内实际上包括多个标签类别(如标签名)以及各个标签类别定义的文本内容。
如,标签的最外层为标签1,标签1的标签名为标签名1,该标签名1定义的文本内容为标签2和标签3。其中,标签2的标签名为标签名2且其文本内容为文本1,而标签3的标签名为标签3且其文本内容为文本2。可见,标签为在标签1内嵌套有标签2和标签3的一个标签。其中,标签1的标签名用于定义文本1和文本2的格式,而标签2的标签名用于定义文本1的格式,而标签3的标签名用于定义文本3的格式。
在标签为多层嵌套标签的情况下,为了能够最终将该标签转换为采用标记语言描述的目标文本,则需要确定该标签内各层级标签以及各层级标签之间的嵌套关系。相应的,可以按照该嵌套关系,递归遍历各层级的标签,并针对遍历到的每个层级的标签,按照该标记语言的语法以及该标签的标签类别所表征的格式特征,将该标签内的文本内容转换为采用该标记语言描述的目标文本。可以理解的是,基于该标签内各层级标签的嵌套关系,依次递归遍历出各个层级标签并依次转换出各个层级标签的目标文本之后,最终便可以得到该标签对应的目标文本。
其中,针对每个层级的标签转换出该层级的标签对应的目标文本的过程可以与前面转换出各个标签的目标文本的过程相似,具体可以参见前面相关介绍,在此不再赘述。
为了便于理解递归遍历转换各层级标签的过程,结合例子说明:
仍以前面例子中标签为标签1内嵌套有标签2和标签3的例子说明,为了便于理解仍以标记语言为markdown语言为例,并假设标签1的标签名1为表示格式特征为一级标题,标签2的标签名2表示格式特征为斜体,而标签3的标签名表示格式特征为加粗。标签名2定义的文本内容为“123“,而标签名3定义的文本内容为”456“。
在递归遍历时可以从外向内逐层递归遍历该标签的各个层级标签,也可以是由内向外逐层递归该标签。以由内向外递归标签可知,最内层为标签2和标签3,而标签2表示文本内容“123“为斜体,则基于markdown语法可知,构建出定义“123”为斜体的目标文本为:*123*,类似的,可以将标签3转换为目标文本:**456**。在此基础上,向外层递归可以得到标签1的标签名表示一级标题,而markdown语法中通过”#“这一标记符号来表示一级标题,而一级标题定义的是标签2和标签3对应的目标文本,因此,最终可以得到该标签转换出的目标文本为:#*123***456**。
S204,将至少一个标签对应的目标文本返回文本编辑器,以在文本编辑器的编辑区粘贴至少一个标签对应的目标文本。
可以理解的是,在将富文本转换为符合该标记语言的目标文本并粘贴到该文本编辑器的编辑区之后,由于该文本编辑器可以识别该目标文本中利用标记语言标记的格式特征,因此,通过文本编辑器将编码区内的至少一个标签对应的目标文本转换为富文本,使得转换出的富文本与粘贴事件所请求粘贴的富文本一致,无需用户单独在编辑区进行格式编写。
为了使得文本编辑器基于编辑区的目标文本转换出的富文本中与粘贴事件所请求粘贴的富文本中各对象内容的顺序一致,本申请可以按照该至少一个标签的标签顺序,将该至少一个标签对应的目标文本组成目标文本组;然后,再将该目标文本组返回给该文本编辑器。
可以理解的是,在本申请中可以通过在该文本编辑器中添加文本转换程序以实现拦截待粘贴的富文本并转换为符合相应标记语言的目标文本,也可以是通过文本编辑器之外的文本转换程序来执行富文本拦截以及转换等操作,对此不加限制。
在本申请中如果存在待向文本编辑器的编辑区内粘贴的富文本,针对富文本中每个标签,会按照该标签内的标签类别所表征的格式特征及该文本编辑器所采用的标记语言对应的语法,将标签内的文本内容转换为采用标记语言描述的目标文本,使得目标文本既可以表示出该文本内容又可以表示出该文本内容对应的该格式特征,因此,将目标文本粘贴到该文本编辑器的编辑区,便可以实现将富文本中文本内容的格式特征也保留到该文本编辑器的编辑区,从而无需用户在重复编辑文本内容的格式,进而可以提高利用文本编辑器编辑文档的编辑效率。
可以理解的是,由于标签可能是嵌套标签,为了能够更为便捷的分析出嵌套标签内各个标签之间的关系,本申请还可以将标签解析为采用解释型或即时编译型的编辑语言的对象,如,JS(JavaScript)对象。当然,对于不存在嵌套的标签也可以转换出类似JS对象等编程语言对象。
如,参见图3,其示出了本申请一种文本处理方法又一个实施例的流程示意图,本实施例的方法可以包括:
S301,在检测到文本编辑器的编辑区内存在粘贴事件,获得粘贴事件请求粘贴的目标内容。
S302,如目标内容为富文本,确定富文本的至少一个标签。
S303,针对每个标签,将该标签解析为具有至少一个对象节点的树形对象。
如,可以设置不同标签对应的正则表达式,进而解析出标签中包含的至少一个层级的标签。根据该至少一个层级的标签的关联关系,构建树形对象。其中,树形对象中包括多个对象节点,每个对象节点代表一个标签。如,对象节点的名称可以为标签的标签类别,例如标签名。相应的,树形对象中对象节点之间的父子关系反映出的就是对象节点所表征的标签之间的嵌套关系。
如,可以将标签解析为对象节点为JS对象的树形对象。
其中,如果标签为单个独立标签不存在嵌套关系,则该标签解析出的树形对象就是实际上就包含一个JS对象,该JS对象的名称可以为该标签的标签类别(如,标签名),JS对象的对应的标签内容为该标签中用该标签类别标记的文本内容,如,JS对象的值可以为该JS对象对应的标签类别标记的文本内容。
如果标签为多层嵌套标签,则将标签解析为具有多个对象节点的属性对象,该树形对象中每个对象节点表示该标签内一个层级的标签,树形对象中各个对象节点之间的关系表征所述标签内各层级标签之间的嵌套关系。
S304,针对每个标签对应的树形对象,递归遍历树形对象中各个对象节点,并针对遍历出的每个层级的标签,按照该标记语言的语法以及该标签的标签类别所表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,得到该树形对象表征的标签的目标文本。
可以理解的是,通过遍历树形对象的各个节点,可以得到各对象节点表示的相应层级的标签,而每遍历出一个对象节点对应的层级标签,则可以将该层级标签转换出目标文本。依此递归遍历,便可以最终完成整个标签内各个层级标签的转换,最终得到该标签对应的完整的目标文本。
其中,对于每个层级的标签,转换出该层级的标签对应的目标文本的过程可以与前面将标签转换为目标文本的过程相同,在此不再赘述。
S305,将至少一个标签对应的目标文本返回文本编辑器,以在文本编辑器的编辑区粘贴至少一个标签对应的目标文本。
该步骤S305可以参见前面实施例的相关介绍,在此不再赘述。
可以理解的是,本申请可以在获得富文本中的标签之后,将标签解析为包括至少一个对象节点(如JS对象)的树形对象,由于树形对象能够反映出标签中的嵌套关系,并能够适用于计算机较为快速的进行递归遍历,从而有利于提高将标签转换为符合标记语言语法的目标文本的效率。
可以理解的是,在实际应用中,用户在向文本编辑器的编辑区粘贴富文本时,也可能仅仅希望向该编辑区粘贴该富文本中包含的纯文本。为了使得用户可以灵活选择向编辑区粘贴符合标记语言语法的文本或者选择粘贴富文本中的纯文本内容,本申请在检测到粘贴事件后,还可以在文本编辑器的编辑区展现用于选择粘贴富文本中纯文本内容的文本选择项,如果用户点击该文本选择项,则会执行向文本编辑器的编辑区粘贴富文本中的纯文本;否则,会默认在该编辑区粘贴转换后的符合标记语言语法的文本。
如,参见图4,其示出了本申请一种文本处理方法又一个实施例的流程示意图,本实施例的方法可以包括:
S401,在检测到文本编辑器的编辑区内存在粘贴事件,获得粘贴事件请求粘贴的目标内容。
S402,如目标内容为富文本,确定富文本的至少一个标签。
其中,标签包括标签类别以及文本内容。
S403,针对富文本中每个标签,按照标记语言的语法以及标签的标签类别所表征的格式特征,将标签内的文本内容转换为采用标记语言描述的目标文本。
S404,将至少一个标签对应的目标文本返回文本编辑器,以在文本编辑器的编辑区粘贴至少一个标签对应的目标文本。
以上步骤S404可以参见前面实施例的相关介绍,在此不再赘述。
S405,在文本编辑器的编辑区内显示纯文本选择项。
其中,该纯文本选择项为用于选择向编辑区内粘贴未采用标记语言描述的纯文本。
S406,在检测到针对纯文本选择项的确认指示时,获得富文本中包含的纯文本格式的文本数据。
如,针对该纯文本选择项的确认指示是指该纯文本选择项的触发事件,例如,检测到纯文本选择项被触按或者点击等,则确认检测到该确认指示。
相应的,检测到针对纯文本选择项的确认指示则说明用户希望在编辑区显示待粘贴的富文本中的纯文本,而并不希望粘贴符合标记语言语法的文本。
其中,该富文本中包含的纯文本格式的文本数据可以通过对富文本中的数据进行格式分析等得到,具体通过何种方式从该富文本中获得纯文本格式的文本数据,本申请不加限制。
S407,向文本编辑器的编辑区返回文本数据,以将文本编辑器的编辑区内目标文本切换为该文本数据。
如,在文本编辑器中包含相应实现该文本处理方法的处理程序的前提下,则文本编辑器通过该处理程序可以利用该获得纯文本格式的文本数据覆盖该文本编辑器的编辑区中待粘贴的富文本转换出的目标文本。
又如,如果在文本编辑器之外配置了实现该文本处理方法的处理程序的前提下,则可以通过该处理程序向文本编辑器发送文本切换指示,并指示文本编辑器将编辑区中目标文本转换为该文本数据。
举例说明,如图5示出了HTML网页的一种示意图。图6示出了文本编辑器的一种界面示意图。在图6以文本编辑器为markdown编辑器为例,该文本编辑器的界面包括编辑区601和预览区602。
假设用户希望将图5所示的网页对应的富文本粘贴到图6所示的文本编辑器的编辑区,并希望能够利用该文本编辑器转换出的富文本与图5所示的富文本所呈现的格式形式一致。
在此基础上,如果用户选择复制的HTML格式的富文本所呈现出的格式如图5所示,那么计算机设备在剪切板内缓存的是HTML格式的富文本。
相应的,用户在该文本编辑器的编辑区601输入粘贴指令之后,计算机设备会检测到粘贴事件并从剪切板获得待粘贴的该富文本。同时,会按照本申请的方案将富文本转换为采用markdown语言的目标文本,并粘贴到该编辑区601。对比图5和图6中编辑区601可以看出,富文本中“字体样式”为一级标题,则编辑区中会采用markdown语言表示为“##字体样式”。相应的,通过该markdown编辑器将“##字体样式”转换的富文本为“字体样式”为一级标题,如文本编辑器的预览区602第一行所示。对于编辑区内的其他文本也类似,在此不再赘述。
由图6可以看出,在将待粘贴的富文本转换为符合markdown语法的文本并粘贴到该文本编辑器的编辑区后,在该编辑区会显示有纯文本选择项603。如果用户点击该纯文本选择项603,则计算机会将该编辑区内采用markdown语言描述的文本切换为用户复制的该富文本中包含的纯文本数据,如图7所示。由图7可以看出,该文本编辑器的编辑区为普通纯文本,而并未包含采用采用markdown语言各种用于标记文本格式的标记符号。
作为一种可选方式,本实施例中,在文本编辑器的编辑区内显示纯文本选择项的同时,还包括:在该文本编辑器的编辑区显示标记语言选项。该标记语言选项用于触发在文本编辑器的编辑区显示由待粘贴的富文本转换出的符合标记语言语法的文本。如图6中该编辑区601中还可以有标记语言选项604。
相应的,在将将标签内的文本内容转换为采用标记语言描述的目标文本之后,本申请还可以缓存该富文本中至少一个标签对应的目标文本。在此基础上,如果用户由于误操作而点击了纯文本选择项,或者希望仍切换为采用标记语言标记格式特征的文本,则可以点击该富文本转换项。相应的,在编辑区显示有富文本中的纯文本数据之后,如果检测到针对标记语言选项的确认指示时,则可以获得缓存的至少一个标签对应的目标文本并返回给该文本编辑器,以将文本编辑器的编辑区内的文本数据切换为该至少一个标签对应的目标文本。
举例说明:如果在图7所示的编辑区内点击该标记语言选项,则会触发计算机设备将该编辑区内的纯文本切换为由待粘贴的富文本转换出的标记有格式的文本,相应的,文本编辑区的界面会从图7切换到图6所示。
需要说明的是,本实施例是以检测到粘贴事件对应的待粘贴内容为富文本的情况下,默认向该文本编辑器的编辑区粘贴转换出的采用标记语言描述的文本。但是可以理解的是,在实际应用中,也可以是在检测到粘贴事件后,显示标记语言选项和纯文本选择项,相应的,用户可以根据需要选择相应的选项,以实现在该文本编辑区粘贴该选项对应的文本。
可以理解的是,在本申请以上任意一个实施例中,如果粘贴事件请求粘贴的内容为纯文本,则可以直接将该纯文本返回给文本编辑器,以在文本编辑器内粘贴该纯文本。
为了便于理解本申请的方案,下面以文本编辑器为markdown编辑器,且待粘贴的富文本为HTML文本为例进行说明。如图8所示,其示出了本申请文本处理方法在一种应用场景下的实现流程示意图。
本实施例的方法包括:
S801,在检测到markdown编辑器的编辑区内存在粘贴事件,从剪切板获得粘贴事件请求粘贴的目标内容。
S802,如目标内容为HTML文本,确定该HTML文本的至少一个HTML标签。
其中,HTML标签包括标签名以及文本内容。当然,该HTML标签还可以包括包括标签属性。
S803,针对HTML文本中每个HTML标签,按照标记语言的语法以及HTML标签的标签名所表征的格式特征,将HTML标签内的文本内容转换为采用markdown语言描述的目标文本。
S804,将该至少一个HTML标签对应的目标文本组成为目标文本组。
S805,将该目标文本组返回markdown编辑器,以在markdown编辑器的编辑区粘贴至少一个HTML标签对应的目标文本。
如结合图5和图6所示,在计算机设备的剪切板中缓存了用于呈现出如图5示出了HTML网页对应该HTML文本的前提下,响应于粘贴指令,从剪切板获得HTML文本,本申请会将该HTML文本中各个标签分别转换为采用markdown语言描述的文本,那么将这些文本粘贴到markdown编辑器的编辑区,则会得到图6编辑区所示的文本。而markdown编辑器将该编辑区的文本转换为富文本的结果就如图6中markdown编辑器的预览区602所示。对比图6的预览区与图5可知,通过本申请的方式向markdown编辑器内粘贴文本,可以保留使得markdown编辑器基于粘贴的文本所转换出的富文本与用户所希望呈现的图5所示的富文本的格式效果一致,从而保留了需要粘贴的富文本的格式,避免了用户在手动进行格式相关的编写。
对应本申请的一种文本处理方法,本申请还提供了一种文本处理装置。如图9所示,其示出了本申请一种文本处理装置一个实施例的组成结构示意图,本实施例的装置可以包括:
事件处理单元901,用于在检测到文本编辑器的编辑区内存在粘贴事件,获得粘贴事件请求粘贴的目标内容;
文本分析单元902,用于如目标内容为富文本,确定该富文本的至少一个标签,标签包括标签类别以及文本内容,标签类别用于表征标签中文本内容的格式特征;
标签处理单元903,用于针对该富文本中每个标签,按照标记语言的语法以及标签的标签类别表征的格式特征,将标签内的文本内容转换为采用标记语言描述的目标文本,其中,目标文本表示具有标签的标签类别表征的格式特征的文本内容;
文本返回单元904,用于将至少一个标签对应的目标文本返回文本编辑器,以在文本编辑器的编辑区粘贴至少一个标签对应的目标文本。
可选的,该文本返回单元,包括:
文本组合单元,用于按照至少一个标签的标签顺序,将至少一个标签对应的目标文本组成目标文本组;
文本组返回单元,用于将目标文本组返回给文本编辑器。
在一种可能的实现方式中,标签处理单元,包括:
关系确定单元,用于针对每个标签,如标签为多层嵌套标签,则确定标签内各层级标签以及各层级标签之间的嵌套关系;
嵌套标签处理单元,用于按照嵌套关系,递归遍历各层级的标签,并针对每个层级的标签,按照标记语言的语法以及标签的标签类别表征的格式特征,将标签内的文本内容转换为采用标记语言描述的目标文本。
作为一种可选方式,关系确定单元,包括:
标签解析单元,用于针对每个标签,如标签为多层嵌套标签,将标签解析为具有多个对象节点的树形对象,树形对象中每个对象节点表示标签内一个层级的标签,树形对象中各个对象节点之间的关系表征标签内各层级标签之间的嵌套关系;
该嵌套标签处理单元在按照嵌套关系,递归遍历各层级的标签时,具体为:递归遍历树形对象中各个对象节点,以得到各对象节点表示的相应层级的标签。
在又一种可能的实现方式中,以上装置实施例中,标签处理单元或者嵌套标签处理单元在按照标记语言的语法以及标签的标签类别表征的格式特征,将标签内的文本内容转换为采用标记语言描述的目标文本时,具体为:按照标签的标签类别所表征的格式特征,确定标记语言中用于表示格式特征的标记符号;按照标记语言的语法,基于标记符号和标签内的文本内容构建采用标记语言描述的目标文本。
在以上装置的实施例中,该装置可以包括:
选项显示单元,用于在文本返回单元将至少一个标签对应的目标文本返回文本编辑器之后,在文本编辑器的编辑区内显示纯文本选择项;
纯文本获得单元,用于在检测到针对纯文本选择项的确认指示时,获得富文本中包含的纯文本格式的文本数据;
纯文本返回单元,用于向文本编辑器的编辑区返回文本数据,以将文本编辑器的编辑区内目标文本切换为文本数据。
可选的,文本缓存单元,用于在文本返回单元将至少一个标签对应的目标文本返回文本编辑器的同时,缓存至少一个标签对应的目标文本;
该纯文本获得单元,还用于在文本编辑器的编辑区内显示纯文本选择项的同时,在文本编辑器的编辑区显示标记语言选项;
该装置还包括:
格式文本获取单元,用于在该纯文本单元向文本编辑器的编辑区返回文本数据之后,如检测到针对标记语言选项的确认指示,获得缓存的至少一个标签对应的目标文本并返回给文本编辑器,以将文本编辑器的编辑区内的文本数据切换为至少一个标签对应的目标文本。
又一方面,本申请还提供了一种计算机设备,该计算机设备可以为个人计算机,也可以为独立的服务器、服务器集群中的服务器或者云平台中的节点等等。如图10,其示出了本申请提供的计算机设备的一种组成架构示意图。在图8中,该计算机设备1000可以包括:处理器1001和存储器1002。
可选的,该计算机设备还可以包括:通信接口1003、输入单元1004和显示器1005和通信总线1006。
其中,处理器1001、存储器1002、通信接口1003、输入单元1004和显示器1005均通过通信总线1006完成相互间的通信。
在本申请实施例中,该处理器1001,可以为中央处理器,特定应用集成电路等。
该处理器可以调用存储器1002中存储的程序,具体的,处理器可以执行以上实施例中计算机设备所执行的操作。
存储器1002中用于存放一个或者一个以上程序,程序可以包括程序代码,所述程序代码包括计算机操作指令,在本申请实施例中,该存储器中至少存储有用于实现以上任意一个实施例中的文本处理方法的程序。
在一种可能的实现方式中,该存储器1002可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、以上所提到的程序,以及图像播放等功能所需的应用程序等;存储数据区可存储根据计算机设备的使用过程中所创建的数据。
该通信接口1003可以为通信模块的接口。
本申请还可以包括输入单元1004,该输入单元可以包括触摸感应单元、键盘等等。
该显示器1005包括显示面板,如触摸显示面板等。
当然,图10所示的计算机设备结构并不构成对本申请实施例中计算机设备的限定,在实际应用中计算机设备可以包括比图10所示的更多或更少的部件,或者组合某些部件。
另一方面,本申请还提供了一种存储介质,该存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上任意一个实施例中的文本处理方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (16)

1.一种文本处理方法,其特征在于,包括:
在检测到文本编辑器的编辑区内存在粘贴事件,获得所述粘贴事件请求粘贴的目标内容;
如所述目标内容为富文本,确定所述富文本的至少一个标签,所述标签包括标签类别以及文本内容,所述标签类别用于表征标签中文本内容的格式特征;
针对所述富文本中每个标签,按照标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,其中,所述目标文本表示具有所述标签的标签类别表征的格式特征的所述文本内容;
将所述至少一个标签对应的目标文本返回所述文本编辑器,以在所述文本编辑器的编辑区粘贴所述至少一个标签对应的目标文本。
2.根据权利要求1所述的方法,其特征在于,所述针对所述富文本中每个标签,按照标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,包括:
针对每个标签,如所述标签为多层嵌套标签,确定所述标签内各层级标签以及各层级标签之间的嵌套关系;
按照所述嵌套关系,递归遍历各层级的标签,并针对每个层级的标签,按照所述标记语言的语法以及所述标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本。
3.根据权利要求1或2所述的方法,其特征在于,所述按照标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,包括:
按照所述标签的标签类别所表征的格式特征,确定所述标记语言中用于表示所述格式特征的标记符号;
按照所述标记语言的语法,基于所述标记符号和所述标签内的文本内容构建采用所述标记语言描述的目标文本。
4.根据权利要求2所述的方法,其特征在于,所述如所述标签为多层嵌套标签,确定所述标签内各层级标签以及各层级标签之间的嵌套关系,包括:
如所述标签为多层嵌套标签,将所述标签解析为具有多个对象节点的树形对象,所述树形对象中每个对象节点表示所述标签内一个层级的标签,所述树形对象中各个对象节点之间的关系表征所述标签内各层级标签之间的嵌套关系;
所述按照所述嵌套关系,递归遍历各层级的标签,包括:
递归遍历所述树形对象中各个对象节点,以得到各对象节点表示的相应层级的标签。
5.根据权利要求1所述的方法,其特征在于,在所述将所述至少一个标签对应的目标文本返回所述文本编辑器之后,还包括:
在所述文本编辑器的编辑区内显示纯文本选择项;
在检测到针对所述纯文本选择项的确认指示时,获得所述富文本中包含的纯文本格式的文本数据;
向所述文本编辑器的编辑区返回所述文本数据,以将所述文本编辑器的编辑区内的所述目标文本切换为所述文本数据。
6.根据权利要求5所述的方法,其特征在于,在所述获得所述富文本中包含的纯文本格式的文本数据之后,还包括:缓存所述至少一个标签对应的目标文本;
在所述文本编辑器的编辑区内显示纯文本选择项的同时,还包括:在所述文本编辑器的编辑区显示标记语言选项;
在向所述文本编辑器的编辑区返回所述文本数据之后,还包括:
如检测到针对所述标记语言选项的确认指示,获得缓存的所述至少一个标签对应的目标文本并返回给所述文本编辑器,以将所述文本编辑器的编辑区内的文本数据切换为所述至少一个标签对应的目标文本。
7.根据权利要求1所述的方法,其特征在于,所述将所述至少一个标签对应的目标文本返回所述文本编辑器,包括:
按照所述至少一个标签的标签顺序,将所述至少一个标签对应的目标文本组成目标文本组;
将所述目标文本组返回给所述文本编辑器。
8.一种文本处理装置,其特征在于,包括:
事件处理单元,用于在检测到文本编辑器的编辑区内存在粘贴事件,获得所述粘贴事件请求粘贴的目标内容;
文本分析单元,用于如所述目标内容为富文本,确定所述富文本的至少一个标签,所述标签包括标签类别以及文本内容,所述标签类别用于表征标签中文本内容的格式特征;
标签处理单元,用于针对所述富文本中每个标签,按照标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本,其中,所述目标文本表示具有所述标签的标签类别表征的格式特征的所述文本内容;
文本返回单元,用于将所述至少一个标签对应的目标文本返回所述文本编辑器,以在所述文本编辑器的编辑区粘贴所述至少一个标签对应的目标文本。
9.根据权利要求8所述的装置,其特征在于,所述标签处理单元,包括:
关系确定单元,用于针对每个标签,如所述标签为多层嵌套标签,确定所述标签内各层级标签以及各层级标签之间的嵌套关系;
嵌套标签处理单元,用于按照所述嵌套关系,递归遍历各层级的标签,并针对每个层级的标签,按照所述标记语言的语法以及所述标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本。
10.根据权利要求9所述的装置,其特征在于,所述标签处理单元或者所述嵌套标签处理单元在按照标记语言的语法以及所述标签的标签类别表征的格式特征,将所述标签内的文本内容转换为采用所述标记语言描述的目标文本时,具体为:按照所述标签的标签类别所表征的格式特征,确定所述标记语言中用于表示所述格式特征的标记符号;
按照所述标记语言的语法,基于所述标记符号和所述标签内的文本内容构建采用所述标记语言描述的目标文本。
11.根据权利要求10所述的装置,其特征在于,所述关系确定单元,包括:
标签解析单元,用于针对每个标签,如所述标签为多层嵌套标签,将所述标签解析为具有多个对象节点的树形对象,所述树形对象中每个对象节点表示所述标签内一个层级的标签,所述树形对象中各个对象节点之间的关系表征所述标签内各层级标签之间的嵌套关系;
所述嵌套标签处理单元在按照所述嵌套关系,递归遍历各层级的标签时,具体为:递归遍历所述树形对象中各个对象节点,以得到各对象节点表示的相应层级的标签。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
选项显示单元,用于在文本返回单元将至少一个标签对应的目标文本返回文本编辑器之后,在文本编辑器的编辑区内显示纯文本选择项;
纯文本获得单元,用于在检测到针对纯文本选择项的确认指示时,获得富文本中包含的纯文本格式的文本数据;
纯文本返回单元,用于向文本编辑器的编辑区返回文本数据,以将文本编辑器的编辑区内目标文本切换为文本数据。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括文本缓存单元,所述文本缓存单元,用于在文本返回单元将至少一个标签对应的目标文本返回文本编辑器的同时,缓存至少一个标签对应的目标文本;
所述纯文本获得单元,还用于在所述文本编辑器的编辑区内显示纯文本选择项的同时,在所述文本编辑器的编辑区显示标记语言选项;
所述装置还包括:
格式文本获取单元,用于在所述纯文本返回单元向文本编辑器的编辑区返回所述文本数据之后,如检测到针对所述标记语言选项的确认指示,获得缓存的所述至少一个标签对应的目标文本并返回给所述文本编辑器,以将所述文本编辑器的编辑区内的文本数据切换为所述至少一个标签对应的目标文本。
14.根据权利要求8所述的装置,其特征在于,所述文本返回单元,包括:
文本组合单元,用于按照所述至少一个标签的标签顺序,将所述至少一个标签对应的目标文本组成目标文本组;
文本组返回单元,用于将所述目标文本组返回给所述文本编辑器。
15.一种计算机设备,其特征在于,包括存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如权利要求1至7任意一项所述的文本处理方法。
16.一种存储介质,其特征在于,用于存储程序,所述程序被执行时,用于实现如权利要求1至7任意一项所述的文本处理方法。
CN202010806205.4A 2020-08-12 2020-08-12 文本处理方法、装置、计算机设备和存储介质 Active CN112001153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010806205.4A CN112001153B (zh) 2020-08-12 2020-08-12 文本处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010806205.4A CN112001153B (zh) 2020-08-12 2020-08-12 文本处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112001153A CN112001153A (zh) 2020-11-27
CN112001153B true CN112001153B (zh) 2024-05-17

Family

ID=73463928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010806205.4A Active CN112001153B (zh) 2020-08-12 2020-08-12 文本处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112001153B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114997118A (zh) * 2021-03-02 2022-09-02 北京字跳网络技术有限公司 一种文档处理方法、装置、设备和介质
CN115577683B (zh) * 2022-11-23 2023-04-28 中国人民解放军国防科技大学 一种html富文本内容转换方法、装置、设备和介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7231598B1 (en) * 2003-09-18 2007-06-12 Microsoft Corporation User interface for editing documents containing markup language
CN103034622A (zh) * 2012-12-05 2013-04-10 北京奇虎科技有限公司 富文本内容的处理方法和服务器
CN108595389A (zh) * 2018-04-25 2018-09-28 华中科技大学 一种将Word文档转换为txt纯文本文档的方法
CN108959392A (zh) * 2018-05-31 2018-12-07 阿里巴巴集团控股有限公司 在3d模型上展示富文本的方法、装置及设备
CN109726379A (zh) * 2018-12-28 2019-05-07 腾讯科技(深圳)有限公司 内容项编辑方法、装置、电子设备及存储介质
CN111259644A (zh) * 2018-11-30 2020-06-09 阿里巴巴集团控股有限公司 富文本处理方法与编辑器、设备及存储介质
CN111274760A (zh) * 2020-01-09 2020-06-12 北京字节跳动网络技术有限公司 富文本数据处理方法、装置、电子设备及计算机存储介质
CN111507073A (zh) * 2020-04-10 2020-08-07 甯航 一种基于web富文本的论文编辑与智能排版方法及平台
CN111523065A (zh) * 2019-02-02 2020-08-11 阿里巴巴集团控股有限公司 富文本数据处理方法、装置、电子设备及计算机存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662921B (zh) * 2012-03-29 2016-02-03 华为技术有限公司 一种文档处理方法、装置和编辑器
EP3559820A4 (en) * 2016-12-21 2020-08-26 Open Text Corporation SYSTEMS AND METHODS FOR CONVERTING WEB CONTENT INTO REUSABLE TEMPLATES AND COMPONENTS
US11188710B2 (en) * 2016-12-30 2021-11-30 Dropbox, Inc. Inline content item editor commands

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7231598B1 (en) * 2003-09-18 2007-06-12 Microsoft Corporation User interface for editing documents containing markup language
CN103034622A (zh) * 2012-12-05 2013-04-10 北京奇虎科技有限公司 富文本内容的处理方法和服务器
CN108595389A (zh) * 2018-04-25 2018-09-28 华中科技大学 一种将Word文档转换为txt纯文本文档的方法
CN108959392A (zh) * 2018-05-31 2018-12-07 阿里巴巴集团控股有限公司 在3d模型上展示富文本的方法、装置及设备
CN111259644A (zh) * 2018-11-30 2020-06-09 阿里巴巴集团控股有限公司 富文本处理方法与编辑器、设备及存储介质
CN109726379A (zh) * 2018-12-28 2019-05-07 腾讯科技(深圳)有限公司 内容项编辑方法、装置、电子设备及存储介质
CN111523065A (zh) * 2019-02-02 2020-08-11 阿里巴巴集团控股有限公司 富文本数据处理方法、装置、电子设备及计算机存储介质
CN111274760A (zh) * 2020-01-09 2020-06-12 北京字节跳动网络技术有限公司 富文本数据处理方法、装置、电子设备及计算机存储介质
CN111507073A (zh) * 2020-04-10 2020-08-07 甯航 一种基于web富文本的论文编辑与智能排版方法及平台

Also Published As

Publication number Publication date
CN112001153A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
US10706091B2 (en) User driven computerized selection, categorization, and layout of live content components
CN110362370B (zh) 一种网页语言的切换方法、装置及终端设备
JP4339554B2 (ja) 階層データを表示するユーザインタフェースを作成し表示するためのシステムおよび方法
JP4814575B2 (ja) 小型スクリーンコンピューティング装置にコンテンツを表示するシステムと方法
CN106682219B (zh) 关联文档获取方法及装置
US7856601B2 (en) Dynamic service presentation
EP3607460A1 (en) Smarter copy/paste
US20040001099A1 (en) Method and system for associating actions with semantic labels in electronic documents
US20090019386A1 (en) Extraction and reapplication of design information to existing websites
US20070245232A1 (en) Apparatus for Processing Documents That Use a Mark Up Language
US8117531B1 (en) Interpreted language translation system and method
JPH10124413A (ja) 埋め込みウェブオブジェクトの優先順位づけダウンローディングの方法と装置
CN113126990B (zh) 一种页面开发方法、装置、设备及存储介质
US20080133563A1 (en) Data Processing Device And Data Processing Method
CN112001153B (zh) 文本处理方法、装置、计算机设备和存储介质
US20090021767A1 (en) Document processing device
CN110020279B (zh) 页面数据处理方法、装置及存储介质
US20100058164A1 (en) Property dependency visualization
CN113419711A (zh) 页面引导方法、装置、电子设备及存储介质
US20080195950A1 (en) Document Processing Device and Document Processing Method
US20090137202A1 (en) Information distribution system
US20080010388A1 (en) Method and apparatus for server wiring model
US8719416B1 (en) Multiple subparts of a uniform resource locator
CN114637499B (zh) 可视化组件处理方法、装置、设备及介质
US20070057965A1 (en) Positioning screen elements

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant