CN111274772A - 删除空行的方法、装置、终端设备及计算机存储介质 - Google Patents

删除空行的方法、装置、终端设备及计算机存储介质 Download PDF

Info

Publication number
CN111274772A
CN111274772A CN201811468043.7A CN201811468043A CN111274772A CN 111274772 A CN111274772 A CN 111274772A CN 201811468043 A CN201811468043 A CN 201811468043A CN 111274772 A CN111274772 A CN 111274772A
Authority
CN
China
Prior art keywords
target object
label
tag
paragraph
deleting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811468043.7A
Other languages
English (en)
Inventor
郑俊鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811468043.7A priority Critical patent/CN111274772A/zh
Publication of CN111274772A publication Critical patent/CN111274772A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明实施例提供了一种删除空行的方法、装置、终端设备及计算机存储介质。其中,删除空行的方法包括:获取富文本编辑器中目标对象的文本结构数据;根据文本结构数据,确定目标对象包括的至少一个标签和各标签对应的内容值;若至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从目标对象中将段落标签及其对应的内容值删除。本实施例提供的方案,通过确定富文本编辑器中目标对象的包括的至少一个标签和各标签对应的内容值;然后将标签为段落标签,且对应的内容值为空的部分删除,从而可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率。

Description

删除空行的方法、装置、终端设备及计算机存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种删除空行的方法、装置、终端设备及计算机存储介质。
背景技术
随着互联网的发展,用户越来越习惯通过浏览器浏览页面来获取信息,用户大多通过富文本编辑器来将需要发布到互联网的内容编辑为与浏览器匹配的页面。在使用富文本编辑器时,有时编辑的内容中会包括多个空行。例如,通过爬虫爬取得到的文章会存在多个空行,在编辑文章的过程中手动增加了多个空行等。空行较多时,会使得对应的展示界面中有较大的空白内容,使得展示效果较差。
但是,现有的富文本编辑器中的清除格式的功能,仅能清除背景色、加粗、斜体等格式,无法实现删除空行的功能,导致用户的编辑效率较低。
发明内容
有鉴于此,本发明实施例提供一种删除空行的方法、装置、终端设备及计算机存储介质,以解决上述问题。
根据本发明实施例的第一方面,提供了一种删除空行的方法,其包括:获取富文本编辑器中目标对象的文本结构数据;根据所述文本结构数据,确定所述目标对象包括的至少一个标签和各标签对应的内容值;若所述至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从所述目标对象中将所述段落标签及其对应的内容值删除。
根据本发明实施例的第二方面,提供了一种删除空行的装置,其包括:获取模块,用于获取富文本编辑器中目标对象的文本结构数据;确定模块,用于根据所述文本结构数据,确定所述目标对象包括的至少一个标签和各标签对应的内容值;删除模块,用于若所述至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从所述目标对象中将所述段落标签及其对应的内容值删除。
根据本发明实施例的第三方面,提供了一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的删除空行的方法对应的操作。
根据本发明实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的删除空行的方法。
根据本发明实施例提供的删除空行的方案,通过确定富文本编辑器中目标对象的包括的至少一个标签和各标签对应的内容值;然后将标签为段落标签,且对应的内容值为空的部分删除,从而可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例一的一种删除空行的方法的步骤流程图;
图2为本发明实施例二的一种删除空行的方法的步骤流程图
图3为本发明实施例三的一种删除空行的装置的结构框图;
图4为本发明实施例四的一种删除空行的装置的结构框图;
图5为本发明实施例五的一种终端设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
实施例一
参照图1,示出了根据本发明实施例一的一种删除空行的方法的步骤流程图。
本实施例的删除空行的方法包括以下步骤:
S102、获取富文本编辑器中目标对象的文本结构数据。
本实施例提供的方案适用于删除富文本编辑器(Rich Text Editor,RTE)中的空行使用场景,富文本编辑器为可以内嵌入浏览器的编辑器,其用于编辑适用于浏览器的页面(下面统称为web界面)。
本实施例中,由于富文本编辑器的作用是编辑web界面,则富文本编辑器存储的是适用于web界面的文本结构数据,文本结构数据可以包括多种。例如,其可以包括但不限于:HTML语言编写的web界面对应的DOM结构数据、可以内嵌于web页面的JavaScript(js)中的对象结构数据等。
本实施例中,目标对象可以为整个富文本编辑器的编辑对象,也可以仅为富文本编辑器中编辑对象的一部分。例如,富文本编辑器中的编辑对象为一整篇文章,也可以是一整篇文章中的一部分。
S104、根据所述文本结构数据,确定所述目标对象包括的至少一个标签和各标签对应的内容值。
本实施例中,文本结构数据中可以包括标签和对应的内容值,通过浏览器展示目标对象时,浏览器可以通过读取文本结构数据中的内容值确定要展示的内容,然后可以通过读取文本结构数据中的标签可以确定该标签对应的内容的展示方式。例如,通过读取内容值可以确定要展示的文字,通过读取内容值对应的标签,可以确定文字的展示方式包括但不限于加粗、倾斜、分段、增加背景色、展示为一个段落等。
本实施例中,根据上述步骤可知,文本结构数据可以包括多种,不同的文本结构数据包括的标签和内容值可能不同,获取标签和内容值的方式也可能不同。
例如,文本结构数据为DOM结构数据,文本结构数据可以包括“<p>元素1</p>”,则可以确定“<p>”作为标签,“<p>”和“</p>”之间的内容“元素1”即为该标签“<p>”对应的内容值。
又例如,文本结构数据为object对象的数据,文本结构数据可以包括:
{
nodeType:'Text',
tag:'span',
format:{},
content:'下面是空行',
index:0,
},
其中,“tag:'span'”可以表示标签为“span”,“content:'下面是空行'”可以表示标签“span”对应的内容值为“下面是空行”。
S106、若所述至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从所述目标对象中将所述段落标签及其对应的内容值删除。
本实施例中,目标对象包括的标签可能不止一种,例如,目标对象中可以包括段落标签、显示效果标签、项目标签等。其中,若标签为段落标签,则该标签对应的内容会展示为一个完整的段落,若内容值为空,则该内容值不对应任何展示内容,或者对应的展示内容为空格。也即,若段落标签对应的内容值为空,则展示为空行。
本实施例中,在确定段落内容为空行后,从目标对象中将空行对应的标签和内容值删除,从而删除目标对象中的空行。
本实施例提供的删除空行的方案,通过确定富文本编辑器中目标对象的包括的至少一个标签和各标签对应的内容值;然后将标签为段落标签,且对应的内容值为空的部分删除,从而可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率。
本实施例的删除空行的方法可以由任意适当的具有数据处理能力的终端设备执行,包括但不限于:移动终端(如平板电脑、手机等)和PC机。
实施例二
参照图2,示出了根据本发明实施例二的一种删除空行的方法的步骤流程图。
本实施例的删除空行的方法包括以下步骤:
S202、获取针对所述富文本编辑器的选中操作、输入操作或者输出操作,确定所述选中操作、所述输入操作或者所述输出操作对应的内容为所述目标对象。
具体地,确定选中操作对应的内容为目标对象时,用户可以从富文本编辑器中选择部分内容作为目标对象,从而可以仅针对选中的部分内容执行删除空行的操作,提高了删除空行操作的灵活性;确定输入操作或输出操作对应的内容为目标对象时,可以实现在富文本编辑器自动输入或者输出时自动删除空行,无需用户主动触发,减轻了用户操作负担。
S204、获取富文本编辑器中目标对象的文本结构数据。
本实施例中,富文本编辑器维护数据的方式不同,存储的数据结构也不同。
例如,目标对象可以为HTML内容,也可以为内嵌于HTML内容的js中的object对象。存储HTML内容时,可以存储为DOM结构;存储object对象时,可以存储为数组结构也可以存储为object对象标签对应的结构。
若目标对象为object对象,则步骤S204可以包括:对所述富文本编辑器中的所述目标对象中的设定标签进行检测,根据检测结果获取所述目标对象的文本结构数据,其中,所述设定标签包括数组标签和/或object对象标签。
通过对目标对象中的设定标签进行检测,可以根据检测结果确定目标对象存储的结构,进而根据存储的结构获取目标对象的文本结构数据。
具体地,文本结构数据为object对象标签对应的数据,则检测结果表示文本结构数据中包括object对象标签,例如,文本结构数据可以为:
Figure BDA0001890295560000061
通过对目标对象中的设定标签进行检测,可以确定其中标签为object对象标签“tag:'span'”,其中,tag为用于指示标签的字段,则可以通过获取object对象的方式获取文本结构数据。
类似的,若检测设定标签后确定目标对象中包括的标签为数组标签,则可以通过获取数组的方式获取文本结构数据,本实施例在此不再赘述。
另外,若目标对象为HTML内容,则步骤S204还可以实现为:获取所述富文本编辑器中的所述目标对象对应的DOM结构,根据所述DOM结构获取所述目标对象的文本结构数据。具体地,若目标对象为HTML数据,则可以直接获取目标对象的DOM结构,DOM结构中包括多个节点,例如元素节点、属性节点、文本节点,然后读取DOM结构中各个节点中的数据,从而确定目标对象的文本结构数据。
S206、根据所述文本结构数据,确定所述目标对象包括的至少一个标签和各标签对应的内容值。
本实施例中,可以通过遍历文本结构数据,确定目标对象包括的至少一个标签和各标签对应的内容值。
若文本结构数据中包括object对象标签,则确定其包括的标签时,可以遍历文本结构数据,确定object对象中包括的多个节点,节点具体可以通过object对象的数据中包括的大括号“{”、“}”进行划分,即一组大括号可以作为一个节点。Object对象的数据中会包括多个大括号的嵌套,则可以根据嵌套结构确定父节点以及子节点。
例如,object对象的数据可以为:
Figure BDA0001890295560000071
Figure BDA0001890295560000081
遍历上述文本结构数据可知,上述object对象的数据可以为一个父节点,父节点的标签为“p”,父节点对应的内容值为“children:[…]”;父节点还可以包括三个子节点,下面分别表示为子节点1、子节点2、子节点3,子节点1的标签为“span”,内容值为“元素1”;子节点2的标签为“span”,内容值为“元素2”;子节点3的标签为“span”,内容值为“元素3”。
若文本结构数据中包括与HTML对应的DOM结构的数据,则确定其包括的标签时,可以遍历文本结构数据,确定HTML内容中包括的多个节点。
例如,HTML内容可以为:
<p><span>元素1</span><span>元素2</span><span>元素3</span></p>
遍历上述文本结构数据可知,上述HTML内容可以为一个父节点,父节点的标签为“p”,父节点对应的内容值为“<p>”和“</p>”之间的内容;父节点还可以包括三个子节点,下面分别表示为子节点1、子节点2、子节点3,子节点1的标签为“span”,内容值为“<span>”和“</span>”之间的“元素1”;子节点2的标签为“span”,内容值为“<span>”和“</span>”之间的“元素2”;子节点3的标签为“span”,内容值为“<span>”和“</span>”之间的“元素3”。
S208、若所述至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从所述目标对象中将所述段落标签及其对应的内容值删除。
可选地,本实施例中,所述段落标签包括用于指示段落起止的标签和/或用于指示块内容起止的标签。具体地,指示段落起止的标签可以为“p”标签,指示块内容起止的标签可以为“div”标签。当然,段落标签也可以包括其他标签,只要能够表示其对应的内容值显示为一个段落即可,例如,段落标签还可以为article,h1,h2,h3,h4,h5,h6,section等标签,本实施例在此不进行限定。
本实施例中,确定内容值为空值时,所述空值包括用于指示空格的值或者用于指示空字符串的值。例如,若目标对象为object对象,则内容值为空可以为content:″,或者为content:″,其中,content为用于指示内容值的字段。
本实施例中,上述步骤S206中,在确定标签及其内容值时,还确定了标签和内容值所在的节点,则从目标对象中删除段落标签及其对应的内容值时,可以直接将其所在的节点删除,从而删除目标对象中的空行。
本实施例提供的删除空行的方案,可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率。
可选地,本实施例中,步骤S208之后,还包括:
S210、以Element对象形式或者字符串形式返回删除后确定的所述目标对象至所述富文本编辑器中,并使用返回的所述目标对象替换原始目标对象。
本实施例中,富文本编辑器的架构可以分为多种,其中,最常用的一种为MVC(Model View Controller)模式,其中,Model(模型)是富文本编辑器中用于处理富文本编辑器的数据逻辑的部分。View(视图)是富文本编辑器中处理数据展示的部分,通常View是依据Model的数据创建的;Controller(控制器)是富文本编辑器中处理用户交互的部分,通常Controller负责从Model读取数据,控制用户输入,以及向Model发送数据。
本实施例中,上述步骤S202-S208可以由富文本编辑器的Controller执行,即Controller接收到用户触发的删除目标对象中空行的操作后,可以从Model中获取目标对象的文本结构数据,然后删除目标对象中的空行,删除完成后,Controller将删除后确定的所述目标对象返回至富文本编辑器的Model中,可以以Element对象形式或者字符串形式返回,并替换Model中的原始目标对象,View可以根据Model中替换后的目标对象进行展示,使得View将删除空行后的目标对象展示给用户。
当然,上述仅以MVC架构进行示例性说明,在本申请实施例的其他实现方式中,富文本编辑器也可以采用其他架构,本实施例对此不进行限定。
本实施例提供的删除空行的方案,通过确定富文本编辑器中目标对象的包括的至少一个标签和各标签对应的内容值;然后将标签为段落标签,且对应的内容值为空的部分删除,从而可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率;然后,通过以Element对象形式或者字符串形式返回删除后确定的所述目标对象至所述富文本编辑器中,并使用返回的所述目标对象替换原始目标对象,可以直接向用户展示删除空格后的目标对象。
与现有的删除空行的方案相比,如,现有的部分安装在本地的编辑程序,例如word、WPS等,可以通过“替换”命令删除空行,在删除时,大多是将两个段落标记“^p”替换为一个,从而实现删除空行的目的。这种方法的实质是将两个相邻的段落标签替换为一个,在使用时,这种方式不能删除连续存在的三个或四个空行,仅能将连续存在的三个或四个空行的数量减少;这种方式也不能删除存在空格的空行。可见,上述现有方案均不适用于富文本编辑器的编辑操作。而通过本实施例提供的方案,根据目标对象的文本结构数据,可以直接确定出目标对象中包括的空行,从而可以准确地将其删除,在具体实现时,即使有多个空行连续存在,或者空行中存在空格等情况,有可以通过本实施例提供的方案删除目标对象中包括的所有空行,本实施例提供的方案提高了编辑效率。
本实施例的删除空行的方法可以由任意适当的具有数据处理能力的终端设备执行,包括但不限于:移动终端(如平板电脑、手机等)和PC机。
实施例三
参照图3,示出了根据本发明实施例三的一种删除空行的装置的结构框图。
如图3所示,删除空行的装置包括:获取模块302、确定模块304、删除模块306。
获取模块302,用于获取富文本编辑器中目标对象的文本结构数据。
确定模块304,用于根据所述文本结构数据,确定所述目标对象包括的至少一个标签和各标签对应的内容值。
删除模块306,用于若所述至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从所述目标对象中将所述段落标签及其对应的内容值删除。
本实施例提供的删除空行的方案,通过确定富文本编辑器中目标对象的包括的至少一个标签和各标签对应的内容值;然后将标签为段落标签,且对应的内容值为空的部分删除,从而可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率。
实施例四
参照图4,示出了根据本发明实施例四的一种删除空行的装置的结构框图。
如图4所示,删除空行的装置包括:目标对象确定模块402、获取模块404、确定模块406、删除模块408、替换模块410。
目标对象确定模块402,用于获取针对所述富文本编辑器的选中操作、输入操作或者输出操作,确定所述选中操作、所述输入操作或者所述输出操作对应的内容为所述目标对象。
获取模块404,用于获取富文本编辑器中目标对象的文本结构数据。
在一种可选的实施方式中,所述获取模块404,包括:
检测获取模块,用于对所述富文本编辑器中的所述目标对象中的设定标签进行检测,根据检测结果获取所述目标对象的文本结构数据,其中,所述设定标签包括数组标签和/或object对象标签;
或者,
DOM获取模块,用于获取所述富文本编辑器中的所述目标对象对应的DOM结构,根据所述DOM结构获取所述目标对象的文本结构数据。
确定模块406,用于根据所述文本结构数据,确定所述目标对象包括的至少一个标签和各标签对应的内容值。
删除模块408,用于若所述至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从所述目标对象中将所述段落标签及其对应的内容值删除。
在一种可选的实施方式中,所述段落标签包括用于指示段落起止的标签和/或用于指示块内容起止的标签。
替换模块410,用于以Element对象形式或者字符串形式返回删除后确定的所述目标对象至所述富文本编辑器中,并使用返回的所述目标对象替换原始目标对象。
本实施例提供的删除空行的方案,通过确定富文本编辑器中目标对象的包括的至少一个标签和各标签对应的内容值;然后将标签为段落标签,且对应的内容值为空的部分删除,从而可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率;然后,通过替换模块使用返回的所述目标对象替换原始目标对象,可以直接向用户展示删除空格后的目标对象。
实施例五
一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的删除空行的方法对应的操作。
具体地,参照图5,示出了根据本发明实施例五的一种终端设备的结构示意图,本发明具体实施例并不对终端设备的具体实现做限定。
如图5所示,该终端设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:
处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它终端设备或服务器进行通信。
处理器502,用于执行程序510,具体可以执行上述删除空行的方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。终端设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:获取目标对象的收藏数据,其中,所述收藏数据包括用户针对所述目标对象的行为数据;
根据所述收藏数据确定所述目标对象的收录参数数据;根据所述收录参数数据,确定将所述目标对象的标识移入或移出所述用户的收藏夹。
在一种可选的实施方式中,所述获取富文本编辑器中目标对象的文本结构数据,包括:对所述富文本编辑器中的所述目标对象中的设定标签进行检测,根据检测结果获取所述目标对象的文本结构数据,其中,所述设定标签包括数组标签和/或object对象标签;或者,获取所述富文本编辑器中的所述目标对象对应的DOM结构,根据所述DOM结构获取所述目标对象的文本结构数据。
在一种可选的实施方式中,所述获取富文本编辑器中目标对象的文本结构数据之前,还包括:获取针对所述富文本编辑器的选中操作、输入操作或者输出操作,确定所述选中操作、所述输入操作或者所述输出操作对应的内容为所述目标对象。
在一种可选的实施方式中,所述从所述目标对象中将所述段落标签及其对应的内容值删除之后,还包括:以Element对象形式或者字符串形式返回删除后确定的所述目标对象至所述富文本编辑器中,并使用返回的所述目标对象替换原始目标对象。
在一种可选的实施方式中,所述段落标签包括用于指示段落起止的标签和/或用于指示块内容起止的标签。
程序510中各步骤的具体实现可以参见上述删除空行的方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
本实施例的终端设备,通过确定富文本编辑器中目标对象的包括的至少一个标签和各标签对应的内容值;然后将标签为段落标签,且对应的内容值为空的部分删除,从而可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率。
实施例六
本申请实施例提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的删除空行的方法
本实施例的计算机存储介质,通过确定富文本编辑器中目标对象的包括的至少一个标签和各标签对应的内容值;然后将标签为段落标签,且对应的内容值为空的部分删除,从而可以方便地将富文本编辑器中的目标对象的空行删除,提高了编辑效率。
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的删除空行的方法。此外,当通用计算机访问用于实现在此示出的删除空行的方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的删除空行的方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。

Claims (12)

1.一种删除空行的方法,其特征在于,包括:
获取富文本编辑器中目标对象的文本结构数据;
根据所述文本结构数据,确定所述目标对象包括的至少一个标签和各标签对应的内容值;
若所述至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从所述目标对象中将所述段落标签及其对应的内容值删除。
2.根据权利要求1所述的方法,其特征在于,所述获取富文本编辑器中目标对象的文本结构数据,包括:
对所述富文本编辑器中的所述目标对象中的设定标签进行检测,根据检测结果获取所述目标对象的文本结构数据,其中,所述设定标签包括数组标签和/或object对象标签;
或者,
获取所述富文本编辑器中的所述目标对象对应的DOM结构,根据所述DOM结构获取所述目标对象的文本结构数据。
3.根据权利要求1所述的方法,其特征在于,所述获取富文本编辑器中目标对象的文本结构数据之前,还包括:
获取针对所述富文本编辑器的选中操作、输入操作或者输出操作,确定所述选中操作、所述输入操作或者所述输出操作对应的内容为所述目标对象。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述从所述目标对象中将所述段落标签及其对应的内容值删除之后,还包括:
以Element对象形式或者字符串形式返回删除后确定的所述目标对象至所述富文本编辑器中,并使用返回的所述目标对象替换原始目标对象。
5.根据权利要求1-3任一项所述的方法,其特征在于,
所述段落标签包括用于指示段落起止的标签和/或用于指示块内容起止的标签。
6.一种删除空行的装置,其特征在于,包括:
获取模块,用于获取富文本编辑器中目标对象的文本结构数据;
确定模块,用于根据所述文本结构数据,确定所述目标对象包括的至少一个标签和各标签对应的内容值;
删除模块,用于若所述至少一个标签中存在段落标签,且该段落标签对应的内容值为空,则从所述目标对象中将所述段落标签及其对应的内容值删除。
7.根据权利要求6所述的装置,其特征在于,所述获取模块,包括:
检测获取模块,用于对所述富文本编辑器中的所述目标对象中的设定标签进行检测,根据检测结果获取所述目标对象的文本结构数据,其中,所述设定标签包括数组标签和/或object对象标签;
或者,
DOM获取模块,用于获取所述富文本编辑器中的所述目标对象对应的DOM结构,根据所述DOM结构获取所述目标对象的文本结构数据。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
目标对象确定模块,用于获取针对所述富文本编辑器的选中操作、输入操作或者输出操作,确定所述选中操作、所述输入操作或者所述输出操作对应的内容为所述目标对象。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述装置还包括:
替换模块,用于以Element对象形式或者字符串形式返回删除后确定的所述目标对象至所述富文本编辑器中,并使用返回的所述目标对象替换原始目标对象。
10.根据权利要求6-8任一项所述的装置,其特征在于,
所述段落标签包括用于指示段落起止的标签和/或用于指示块内容起止的标签。
11.一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-5任一项所述的删除空行的方法对应的操作。
12.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-5中任一所述的删除空行的方法。
CN201811468043.7A 2018-12-03 2018-12-03 删除空行的方法、装置、终端设备及计算机存储介质 Pending CN111274772A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811468043.7A CN111274772A (zh) 2018-12-03 2018-12-03 删除空行的方法、装置、终端设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811468043.7A CN111274772A (zh) 2018-12-03 2018-12-03 删除空行的方法、装置、终端设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN111274772A true CN111274772A (zh) 2020-06-12

Family

ID=70996602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811468043.7A Pending CN111274772A (zh) 2018-12-03 2018-12-03 删除空行的方法、装置、终端设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111274772A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201022961A (en) * 2008-12-01 2010-06-16 Esobi Inc Method of transferring hyper text markup language document into plain text document
CN103034622A (zh) * 2012-12-05 2013-04-10 北京奇虎科技有限公司 富文本内容的处理方法和服务器
CN105183706A (zh) * 2014-05-27 2015-12-23 腾讯科技(北京)有限公司 富文本处理方法和装置
CN105224564A (zh) * 2014-06-25 2016-01-06 广州市动景计算机科技有限公司 一种网页适应屏幕排版方法及装置
CN105373526A (zh) * 2015-10-23 2016-03-02 北大方正集团有限公司 一种电子文档中的空白区域处理方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201022961A (en) * 2008-12-01 2010-06-16 Esobi Inc Method of transferring hyper text markup language document into plain text document
CN103034622A (zh) * 2012-12-05 2013-04-10 北京奇虎科技有限公司 富文本内容的处理方法和服务器
CN105183706A (zh) * 2014-05-27 2015-12-23 腾讯科技(北京)有限公司 富文本处理方法和装置
CN105224564A (zh) * 2014-06-25 2016-01-06 广州市动景计算机科技有限公司 一种网页适应屏幕排版方法及装置
CN105373526A (zh) * 2015-10-23 2016-03-02 北大方正集团有限公司 一种电子文档中的空白区域处理方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张暑军: "《基于HTML5的APP开发教程》", pages: 6 *
钟旭东: "网页分类中的标签权重自动优化研究", 《中国优秀硕士论文全文数据库》, pages 3 *

Similar Documents

Publication Publication Date Title
CN107729475B (zh) 网页元素采集方法、装置、终端与计算机可读存储介质
CN108334508B (zh) 网页信息的提取方法和装置
US11256912B2 (en) Electronic form identification using spatial information
CN109492177B (zh) 一种基于网页语义结构的网页分块方法
CN113190781B (zh) 页面布局方法、装置、设备及存储介质
CN111125598A (zh) 数据智能查询方法、装置、设备及存储介质
US10146749B2 (en) Tracking JavaScript actions
CN103425765A (zh) 网页正文的提取方法和装置、网页预览方法和系统
WO2019075968A1 (zh) 表格信息跨页识别方法、电子设备及计算机可读存储介质
CN104239545A (zh) 一种多标签页的预览方法以及装置
CN109815243B (zh) 一种文档界面化修改时的结构化存储方法和装置
CN113360106B (zh) 一种网页打印方法和装置
CN104899203B (zh) 一种网页页面的生成方法、装置及终端设备
CN103020179A (zh) 一种网页内容的提取方法、装置和设备
CN111143732A (zh) 网页渲染方法及装置
CN111460765B (zh) 电子书籍标注处理方法、电子设备及存储介质
CN112784529B (zh) 基于BetterScroll的移动端排序表格及其构建方法
CN111460764B (zh) 电子书籍标注方法、电子设备及存储介质
CN112861481A (zh) 分页处理的方法、装置、电子设备及计算机可读存储介质
CN113177391B (zh) 在流式界面中操作光标重定向方法、计算设备及存储介质
CN111274772A (zh) 删除空行的方法、装置、终端设备及计算机存储介质
JP2006065467A (ja) データ抽出定義情報生成装置およびデータ抽出定義情報生成方法
JP2006065467A5 (zh)
CN113177392B (zh) 校对界面中行段信息同步方法、计算设备及存储介质
CN110908570B (zh) 图像处理方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination