CN109614592B - 文本的处理方法、装置、存储介质和电子设备 - Google Patents

文本的处理方法、装置、存储介质和电子设备 Download PDF

Info

Publication number
CN109614592B
CN109614592B CN201811644380.7A CN201811644380A CN109614592B CN 109614592 B CN109614592 B CN 109614592B CN 201811644380 A CN201811644380 A CN 201811644380A CN 109614592 B CN109614592 B CN 109614592B
Authority
CN
China
Prior art keywords
data
format
target
text
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811644380.7A
Other languages
English (en)
Other versions
CN109614592A (zh
Inventor
耿国胜
马帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201811644380.7A priority Critical patent/CN109614592B/zh
Publication of CN109614592A publication Critical patent/CN109614592A/zh
Application granted granted Critical
Publication of CN109614592B publication Critical patent/CN109614592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本公开涉及一种文本的处理方法、装置、存储介质和电子设备,涉及信息处理领域,应用于服务器,该方法包括:接收客户端发送的第一目标数据,第一目标数据中包括文本数据和目标格式数据,目标格式数据中包括N个识别码,按照预设的映射关系,将目标格式数据中的N个识别码转换为对应的N组格式标签,以获取原始格式数据,映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,将包含所述原始格式数据和文本数据的原始数据发送至浏览器,以通过浏览器将原始数据按照第一格式进行显示。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。

Description

文本的处理方法、装置、存储介质和电子设备
技术领域
本公开涉及信息处理领域,具体地,涉及一种文本的处理方法、装置、存储介质和电子设备。
背景技术
随着信息技术的迅猛发展,相应带来的数据量也呈现爆发式的增长。大量的文本数据要能够在多种平台上进行显示和编辑,通常会选择RTF(英文:Rich Text Format,中文:富文本格式)或者HTML(英文:Hyper Text Markup Language,中文:超级文本标记语言)进行传输和存储。由于文本数据中通常包含有格式信息,例如:字体、颜色、大小等,需要用多组格式标签来记录文本数据中包含的格式信息,相应的也会产生大量的格式数据,占用网络的传输资源,降低了文本数据的传输速度。
发明内容
本公开的目的是提供一种文本的处理方法、装置、存储介质和电子设备,用以解决现有技术中格式数据占用网络传输资源,降低文本传输速度的问题。
为了实现上述目的,根据本公开实施例的第一方面,提供一种文本的处理方法,应用于服务器,所述方法包括:
接收客户端发送的第一目标数据,所述第一目标数据中包括文本数据和目标格式数据,所述目标格式数据中包括N个识别码;
按照预设的映射关系,将所述目标格式数据中的所述N个识别码转换为对应的N组格式标签,以获取原始格式数据,所述映射关系包括多种格式标签,以及所述多种格式标签中的每种格式标签对应的识别码;
将所述包含所述原始格式数据和所述文本数据的原始数据发送至浏览器,以通过所述浏览器将所述原始数据按照第一格式进行显示。
可选的,在所述按照预设的映射关系,将所述目标格式数据中的所述N个识别码转换为对应的N组格式标签,以获取原始格式数据之后,所述方法还包括:
确定所述原始格式数据中的所述N组格式标签对应的N个导出应用程序编程接口API;
根据所述N个导出API和所述文本数据,将所述原始数据转换为第二格式的导出数据;
输出所述导出数据。
可选的,所述第一目标数据还包括:文本标签和识别码标签,所述文本标签用于标识所述文本数据在所述第一目标数据中的位置,所述识别码标签用于标识所述目标格式数据在所述第一目标数据中的位置;
在所述接收客户端发送的第一目标数据之后,所述方法还包括:
将所述第一目标数据存入所述服务器的数据库;
当获取到包含查询文本的查询请求时,根据所述数据库中的每个目标数据的文本标签确定所述每个目标数据的文本数据;
在所述每个目标数据的文本数据中,查找包括所述查询文本的目标文本数据;
在查找到所述目标文本数据后,将所述目标文本数据所属的第二目标数据作为查询结果进行输出。
根据本公开实施例的第二方面,提供一种文本的处理方法,应用于客户端,所述方法包括:
获取第一格式的原始数据,所述原始数据包括文本数据和原始格式数据,所述原始格式数据包括N组格式标签;
按照预设的映射关系,将所述N组格式标签转换为对应的N个识别码,以获取目标格式数据,所述映射关系包括多种格式标签,以及所述多种格式标签中的每种格式标签对应的识别码;
生成包含所述目标格式数据和所述文本数据的第一目标数据;
将所述第一目标数据发送至服务器,所述服务器能够根据所述映射关系将所述第一目标数据还原为所述原始数据。
可选的,所述生成包含所述目标格式数据和所述文本数据的第一目标数据,包括:
根据所述目标格式数据生成识别码标签;
根据所述文本数据生成文本标签;
生成包含所述目标格式数据、所述识别码标签、所述文本数据和所述文本标签的所述目标数据,所述文本标签能够标识所述文本数据在所述目标数据中的位置,所述识别码标签能够标识所述目标格式数据在所述目标数据中的位置。
根据本公开实施例的第三方面,提供一种文本的处理装置,应用于服务器,所述装置包括:
接收模块,用于接收客户端发送的第一目标数据,所述第一目标数据中包括文本数据和目标格式数据,所述目标格式数据中包括N个识别码;
第一转换模块,用于按照预设的映射关系,将所述目标格式数据中的所述N个识别码转换为对应的N组格式标签,以获取原始格式数据,所述映射关系包括多种格式标签,以及所述多种格式标签中的每种格式标签对应的识别码;
显示模块,用于将所述包含所述原始格式数据和所述文本数据的原始数据发送至浏览器,以通过所述浏览器将所述原始数据按照第一格式进行显示。
可选的,所述装置还包括:
接口确定模块,用于在所述按照预设的映射关系,将所述目标格式数据中的所述N个识别码转换为对应的N组格式标签,以获取原始格式数据之后,确定所述原始格式数据中的所述N组格式标签对应的N个导出应用程序编程接口API;
第二转换模块,用于根据所述N个导出API和所述文本数据,将所述原始数据转换为第二格式的导出数据;
导出模块,用于输出所述导出数据。
可选的,所述第一目标数据还包括:文本标签和识别码标签,所述文本标签用于标识所述文本数据在所述第一目标数据中的位置,所述识别码标签用于标识所述目标格式数据在所述第一目标数据中的位置;
所述装置还包括:
存储模块,用于在所述接收客户端发送的第一目标数据之后,将所述第一目标数据存入所述服务器的数据库;
文本确定模块,用于当获取到包含查询文本的查询请求时,根据所述数据库中的每个目标数据的文本标签确定所述每个目标数据的文本数据;
查询模块,用于在所述每个目标数据的文本数据中,查找包括所述查询文本的目标文本数据;
输出模块,用于在查找到所述目标文本数据后,将所述目标文本数据所属的第二目标数据作为查询结果进行输出。
根据本公开实施例的第四方面,提供一种文本的处理装置,应用于客户端,所述装置包括:
获取模块,用于获取第一格式的原始数据,所述原始数据包括文本数据和原始格式数据,所述原始格式数据包括N组格式标签;
转换模块,用于按照预设的映射关系,将所述N组格式标签转换为对应的N个识别码,以获取目标格式数据,所述映射关系包括多种格式标签,以及所述多种格式标签中的每种格式标签对应的识别码;
生成模块,用于生成包含所述目标格式数据和所述文本数据的第一目标数据;
发送模块,用于将所述第一目标数据发送至服务器,所述服务器能够根据所述映射关系将所述第一目标数据还原为所述原始数据。
可选的,所述生成模块包括:
第一生成子模块,用于根据所述目标格式数据生成识别码标签;
第二生成子模块,用于根据所述文本数据生成文本标签;
第三生成子模块,用于生成包含所述目标格式数据、所述识别码标签、所述文本数据和所述文本标签的所述目标数据,所述文本标签能够标识所述文本数据在所述目标数据中的位置,所述识别码标签能够标识所述目标格式数据在所述目标数据中的位置。
根据本公开实施例的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面提供的文本的处理方法的步骤。
根据本公开实施例的第六方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第二方面提供的文本的处理方法的步骤。
根据本公开实施例的第七方面,提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现第一方面提供的文本的处理方法的步骤。
根据本公开实施例的第八方面,提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现第二方面提供的文本的处理方法的步骤。
通过上述技术方案,本公开中客户端在获取到第一格式的,包括了文本数据和原始格式数据的原始数据后,首先按照预设的映射关系,将原始格式数据中的N组格式标签转换为对应的N个识别码,以得到目标格式数据,其中映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,再生成包含目标格式数据和文本数据的第一目标数据,最后将第一目标数据发送至服务器。服务器首先接收第一目标数据,再按照映射关系将第一目标数据中的目标格式数据中的N个识别码转换为对应的N组格式标签,以得到原始格式数据,最后将包含了原始格式数据和文本数据的原始数据发送至浏览器,以使浏览器将原始数据按照第一格式进行显示。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据一示例性实施例示出的一种文本的处理方法的流程图;
图2是根据一示例性实施例示出的另一种文本的处理方法的流程图;
图3是根据一示例性实施例示出的另一种文本的处理方法的流程图;
图4是根据一示例性实施例示出的一种文本的处理方法的流程图;
图5是根据一示例性实施例示出的另一种文本的处理方法的流程图;
图6是根据一示例性实施例示出的一种文本的处理装置的框图;
图7是根据一示例性实施例示出的另一种文本的处理装置的框图;
图8是根据一示例性实施例示出的另一种文本的处理装置的框图;
图9是根据一示例性实施例示出的一种文本的处理装置的框图;
图10是根据一示例性实施例示出的另一种文本的处理装置的框图;
图11是根据一示例性实施例示出的一种电子设备的框图;
图12是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在介绍本公开提供的文本的处理方法、装置、存储介质和电子设备之前,首先对本公开中各个实施例所涉及的应用场景进行介绍,该应用场景中包括客户端、服务器和web(英文:网络)端(可以理解为浏览器)。客户端和web端之间能够通过网络与服务器进行通信,服务器能够为客户端和web端提供数据服务。其中,服务器可以是本地服务器,也可以是云端服务器。客户端可以是任一种终端,例如可以是智能手机、平板电脑、智能电视、智能手表、PDA(英文:Personal Digital Assistant,中文:个人数字助理)、便携计算机等移动终端,也可以是台式计算机等固定终端。
图1是根据一示例性实施例示出的一种文本的处理方法的流程图,如图1所示,该方法应用于服务器,包括:
步骤101,接收客户端发送的第一目标数据,第一目标数据中包括文本数据和目标格式数据,目标格式数据中包括N个识别码。
举例来说,用户可以通过客户端录入文本数据,并设置文本数据对应的格式(例如字体、颜色、大小、下划线、斜体、加粗等),客户端将用户设置的格式以多组格式标签的形式记录为原始格式数据,并将文本数据和原始格式数据组成第一格式的原始数据,原始数据存储在客户端上,以便用户能够在客户端上浏览原始数据,或者对原始数据进行二次编辑。其中,第一格式例如可以是HTML格式或RTF格式。之后客户端再按照与服务器之间预先约定好的映射关系将原始格式数据转换为目标格式数据,并将文本数据和目标格式数据组成第一目标数据,发送给服务器。目标格式数据中包括了N个识别码。
步骤102,按照预设的映射关系,将目标格式数据中的N个识别码转换为对应的N组格式标签,以获取原始格式数据,映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码。
步骤103,将包含原始格式数据和文本数据的原始数据发送至浏览器,以通过浏览器将原始数据按照第一格式进行显示。
示例的,当浏览器需要对第一目标数据进行显示时(例如浏览器向服务器发送数据请求),服务器先将接收到的第一目标数据中的目标格式数据按照映射关系进行转换,依次将目标格式数据中的N个识别码的每个识别码转换为对应的格式标签,以得到N组格式标签,由N组标签组成原始格式数据。此时,原始格式数据即对应客户端上原始格式数据(即HTML格式或RTF格式中包括的格式标签)。最后服务器将包含原始格式数据和文本数据的原始数据发送至浏览器,使浏览器能够将原始数据按照第一格式进行显示,原始数据在浏览器上显示出的内容与原始数据在客户端上显示出的内容一致。
其中,映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,识别码可以用多位数字(例如4位二进制码)或者多位字母来表示,每种格式标签对应的识别码能够唯一标识该种格式标签。映射关系可以是客户端与服务器之间预先约定好的,以预设的形式分别存储在客户端和服务器上的。映射关系可以按照表格或者链表的形式进行存储。以表1所示的映射关系来举例,存储映射关系的表格中包括多行,每一行都包括两个元素:格式标签和格式标签对应的识别码。例如:格式标签<em></em>(即文本数据以斜体显示),对应的识别码为“AA”,格式标签<strong></strong>(即文本数据以加粗显示),对应的识别码为“BA”,格式标签<spanstyle="text-decoration:underline;font-family:微软雅黑,'MicrosoftYaHei';"></span>(即文本数据以加下划线的微软雅黑字体显示),对应的识别码为“AD”。标识码能够在指明文本数据对应的格式的前提下,减少格式数据占用的存储空间,从而在客户端将第一目标数据发送至服务器时,节省网络传输资源,提高文本的传输速度。
表1
综上所述,本公开中服务器首先接收由客户端发送的包括了文本数据和目标格式数据的第一目标数据,再按照预设映射关系将第一目标数据中的目标格式数据中的N个识别码转换为对应的N组格式标签,以得到原始格式数据,其中映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,最后将包含了原始格式数据和文本数据的原始数据发送至浏览器,以使浏览器将原始数据按照第一格式进行显示。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。
图2是根据一示例性实施例示出的另一种文本的处理方法的流程图,如图2所示,在步骤102之后,该方法还包括以下步骤:
步骤104,确定原始格式数据中的N组格式标签对应的N个导出应用程序编程接口API。
步骤105,根据N个导出API和文本数据,将原始数据转换为第二格式的导出数据。
步骤106,输出导出数据。
举例来说,服务器通常会提供数据导出的功能,以将服务器上存储的数据导出为多种格式的数据。HTML格式或RTF格式的数据,只支持一部分固定格式、固定标签的数据导出方案,例如HTML格式的数据导出为xls(Office电子表格格式)、doc(Office电子文档格式)或pdf(英文:Portable Document Format,中文:便携式文档格式)的数据时,只能识别固定的格式标签,对复杂格式标签或者新类型的格式标签无法识别,导致数据导出不成功,或者丢失一部分格式标签所指示的格式。本实施例中,在步骤102获取到原始格式数据之后,服务器可以通过原始格式数据中的N组格式标签,依次查找到预先设置的对应的N个导出API(英文:Application Programming Interface,中文:应用程序编程接口),可以理解为每种格式标签都预先设置一个导出API用于将该种格式标签指示的格式转换为多种格式的数据。之后服务器根据文本数据,依次调用N个导出API,以将原始数据转换为第二格式的导出数据,并输出导出数据。由于导出API是开源、独立的,可以根据具体需求灵活地扩展和维护,因此能够支持复杂格式标签或者新类型的格式标签的导出,其中,第二格式可以是导出API支持的任一种格式。
图3是根据一示例性实施例示出的另一种文本的处理方法的流程图,如图3所示,第一目标数据还包括:文本标签和识别码标签,文本标签用于标识文本数据在第一目标数据中的位置,识别码标签用于标识目标格式数据在第一目标数据中的位置。
示例的,客户端发送的第一目标数据中还可以包括:文本标签和识别码标签,文本标签用于标识文本数据在第一目标数据中的位置,识别码标签用于标识目标格式数据在第一目标数据中的位置。文本标签例如可以是<content></content>,识别码标签例如可以是<styleID></styleID>,第一目标数据可以为:<styleID>AABAAD</styleID><content>提供图形化、零编码、易学易用的报表设计器,用户通过拖拽的方式即可将数据绑定到相应的单元格上,高效的定义复杂报表。</content>。其中,文本标签<content></content>内包括的“提供图形化、零编码、易学易用的报表设计器,用户通过拖拽的方式即可将数据绑定到相应的单元格上,高效的定义复杂报表。”为第一目标数据中的文本数据,标识码标签<styleID></styleID>内包括的“AABAAD”为第一目标数据中的目标格式数据,以表1中所示的映射关系为例,“AABAAD”表示文本数据以斜体(“AA”)、加粗(“BA”)、加下划线的微软雅黑字体(“AD”)的格式显示。进一步的,还可以设置位置标签,以标识第一目标数据的开头和结尾,例如以<richtext>标签为开头,以</richtext>标签为结尾。
在步骤101之后,该方法还包括:
步骤107,将第一目标数据存入服务器的数据库。
步骤108,当获取到包含查询文本的查询请求时,根据数据库中的每个目标数据的文本标签确定每个目标数据的文本数据。
步骤109,在每个目标数据的文本数据中,查找包括查询文本的目标文本数据。
步骤110,在查找到目标文本数据后,将目标文本数据所属的第二目标数据作为查询结果进行输出。
举例来说,服务器还可以提供数据查询服务,在进行数据查询时,通常只需要查找包含有指定文本的数据,而不关心指定文本的格式。服务器在接收到第一目标数据后,将第一目标数据存入数据库中,数据库中包括了多个目标数据。当获取到包含查询文本的查询请求时,首先根据数据库中的每个目标数据的文本标签确定每个目标数据的文本数据,之后在每个目标数据的文本数据中查找包括查询文本对目标文本数据,最后将目标文本数据所属的第二目标数据作为查询结果进行输出。在查找的过程中,直接查找每个目标数据的文本数据,而不需要查找目标数据的目标格式数据,从而能够提高数据查询的速度。
综上所述,本公开中服务器首先接收由客户端发送的包括了文本数据和目标格式数据的第一目标数据,再按照预设映射关系将第一目标数据中的目标格式数据中的N个识别码转换为对应的N组格式标签,以得到原始格式数据,其中映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,最后将包含了原始格式数据和文本数据的原始数据发送至浏览器,以使浏览器将原始数据按照第一格式进行显示。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。
图4是根据一示例性实施例示出的一种文本的处理方法的流程图,如图4所示,该方法应用于客户端,包括以下步骤:
步骤201,获取第一格式的原始数据,原始数据包括文本数据和原始格式数据,原始格式数据包括N组格式标签。
举例来说,用户可以通过客户端录入文本数据,并设置文本数据对应的格式(例如字体、颜色、大小、下划线、斜体、加粗等),客户端对将用户设置的格式以N组格式标签的形式记录为原始格式数据,并将文本数据和原始格式数据组成第一格式的原始数据,原始数据存储在客户端上,以便用户能够在客户端上浏览原始数据,或者对原始数据进行二次编辑。其中,第一格式例如可以是HTML格式或RTF格式。
步骤202,按照预设的映射关系,将N组格式标签转换为对应的N个识别码,以获取目标格式数据,映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码。
步骤203,生成包含目标格式数据和文本数据的第一目标数据。
步骤204,将第一目标数据发送至服务器,服务器能够根据映射关系将第一目标数据还原为原始数据。
示例的,客户端按照与服务器之间预先约定好的映射关系将原始格式数据转换为目标格式数据,并将文本数据和目标格式数据组成第一目标数据,发送给服务器。目标格式数据中包括了N组格式标签对应的N个识别码。服务器能够在接收到第一目标数据后,按照映射关系将第一目标数据中的目标格式还原为原始格式数据,以获得包含有文本数据和原始格式数据的原始数据。其中,映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,识别码可以用多位数字或者多位字母来表示,每种格式标签对应的识别码能够唯一标识该种格式标签。映射关系可以是客户端与服务器之间预先约定好的,以预设的形式分别存储在客户端和服务器上的。
图5是根据一示例性实施例示出的另一种文本的处理方法的流程图,如图2所示,步骤203可以通过以下步骤来实现:
步骤2031,根据目标格式数据生成识别码标签。
步骤2032,根据文本数据生成文本标签。
步骤2033,生成包含目标格式数据、识别码标签、文本数据和文本标签的目标数据,文本标签能够标识文本数据在目标数据中的位置,识别码标签能够标识目标格式数据在目标数据中的位置。
举例来说,在生成第一目标数据的过程中,可以根据目标格式数据和文本数据生成识别码标签和文本标签,文本标签能够标识文本数据在目标数据中的位置,识别码标签能够标识目标格式数据在目标数据中的位置。其中,文本标签例如可以是<content></content>,识别码标签例如可以是<styleID></styleID>,以文本数据为“提供图形化、零编码、易学易用的报表设计器,用户通过拖拽的方式即可将数据绑定到相应的单元格上,高效的定义复杂报表。”,目标格式数据为“AABAAD”来举例,可以将文本数据包含在文本标签内,将目标格式数据包含在识别码标签内,即可得到第一目标数据:<styleID>AABAAD</styleID><content>提供图形化、零编码、易学易用的报表设计器,用户通过拖拽的方式即可将数据绑定到相应的单元格上,高效的定义复杂报表。</content>。进一步的,还可以设置位置标签,以标识第一目标数据的开头和结尾,例如以<richtext>标签为开头,以</richtext>标签为结尾,那么第一目标数据可以为:<richtext><styleID>AABAAD</styleID><content>提供图形化、零编码、易学易用的报表设计器,用户通过拖拽的方式即可将数据绑定到相应的单元格上,高效的定义复杂报表。</content></richtext>。
以第一格式为HTML格式,原始数据为<sup><span style="text-decoration:underline;font-family:微软雅黑,'Microsoft YaHei';"><em><strong><spanstyle="text-decoration:underline;font-size:14px;color:rgb(255,0,0);">UniEAP Report</span></strong></em></span></sup>为例。其中,文本数据为:“UniEAP Report”,原始格式数据中包含了5组格式数据:<sup></sup>(即文本数据以上标显示)、<span style="text-decoration:underline;font-family:微软雅黑,'Microsoft YaHei';"></span>(即文本数据以加下划线的微软雅黑字体显示)、<em></em>(即文本数据以斜体显示)、<strong></strong>(即文本数据以加粗显示)、<span style="text-decoration:underline;font-size:14px;color:rgb(255,0,0);"></span>(即文本数据以加下划线的、14px大小的红色显示)。客户端在获取到原始数据后,首先按照映射关系将5组格式标签转换为对应的5个识别码,以得到目标格式数据:“DEADAABACI”。再生成包含目标格式数据和文本数据的第一目标数据:<richtext><styleID>DEADAABACI</styleID><content>UniEAP Report</content></richtext>。最后将第一目标数据发送至服务器。第一目标数据相比于原始数据,减少了占用的存储空间,从而在客户端将第一目标数据发送至服务器时,节省网络传输资源,提高第一目标数据的传输速度。服务器在接收第一目标数据后,再按照映射关系将第一目标数据中的目标格式数据中的5个识别码转换为对应的5组格式标签,以得到原始格式数据,最后服务器将包含了原始格式数据和文本数据的原始数据发送至浏览器,以使浏览器将原始数据按照HTML格式进行显示。
综上所述,本公开中客户端在获取到第一格式的,包括了文本数据和原始格式数据的原始数据后,首先按照预设的映射关系,将原始格式数据中的N组格式标签转换为对应的N个识别码,以得到目标格式数据,其中映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,再生成包含目标格式数据和文本数据的第一目标数据,最后将第一目标数据发送至服务器,使得服务器能够根据映射关系将第一目标数据还原为原始数据。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。
图6是根据一示例性实施例示出的一种文本的处理装置的框图,如图6所示,该装置300应用于服务器,包括以下模块:
接收模块301,用于接收客户端发送的第一目标数据,第一目标数据中包括文本数据和目标格式数据,目标格式数据中包括N个识别码。
第一转换模块302,用于按照预设的映射关系,将目标格式数据中的N个识别码转换为对应的N组格式标签,以获取原始格式数据,映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码。
显示模块303,用于将包含原始格式数据和文本数据的原始数据发送至浏览器,以通过浏览器将原始数据按照第一格式进行显示。
图7是根据一示例性实施例示出的另一种文本的处理装置的框图,如图7所示,该装置300还包括:
接口确定模块304,用于在按照预设的映射关系,将目标格式数据中的N个识别码转换为对应的N组格式标签,以获取原始格式数据之后,确定原始格式数据中的N组格式标签对应的N个导出应用程序编程接口API。
第二转换模块305,用于根据N个导出API和文本数据,将原始数据转换为第二格式的导出数据。
导出模块306,用于输出导出数据。
图8是根据一示例性实施例示出的另一种文本的处理装置的框图,如图8所示,第一目标数据还包括:文本标签和识别码标签,文本标签用于标识文本数据在第一目标数据中的位置,识别码标签用于标识目标格式数据在第一目标数据中的位置。该装置300还包括:
存储模块307,用于在接收客户端发送的第一目标数据之后,将第一目标数据存入服务器的数据库。
文本确定模块308,用于当获取到包含查询文本的查询请求时,根据数据库中的每个目标数据的文本标签确定每个目标数据的文本数据。
查询模块309,用于在每个目标数据的文本数据中,查找包括查询文本的目标文本数据。
输出模块310,用于在查找到目标文本数据后,将目标文本数据所属的第二目标数据作为查询结果进行输出。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
综上所述,本公开中服务器首先接收由客户端发送的包括了文本数据和目标格式数据的第一目标数据,再按照预设映射关系将第一目标数据中的目标格式数据中的N个识别码转换为对应的N组格式标签,以得到原始格式数据,其中映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,最后将包含了原始格式数据和文本数据的原始数据发送至浏览器,以使浏览器将原始数据按照第一格式进行显示。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。
图9是根据一示例性实施例示出的一种文本的处理装置的框图,如图9所示,该装置400应用于客户端,包括以下模块:
获取模块401,用于获取第一格式的原始数据,原始数据包括文本数据和原始格式数据,原始格式数据包括N组格式标签。
转换模块402,用于按照预设的映射关系,将N组格式标签转换为对应的N个识别码,以获取目标格式数据,映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码。
生成模块403,用于生成包含目标格式数据和文本数据的第一目标数据。
发送模块404,用于将第一目标数据发送至服务器,服务器能够根据映射关系将第一目标数据还原为原始数据。
图10是根据一示例性实施例示出的另一种文本的处理装置的框图,如图10所示,生成模块403可以包括:
第一生成子模块4031,用于根据目标格式数据生成识别码标签。
第二生成子模块4032,用于根据文本数据生成文本标签。
第三生成子模块4033,用于生成包含目标格式数据、识别码标签、文本数据和文本标签的目标数据,文本标签能够标识文本数据在目标数据中的位置,识别码标签能够标识目标格式数据在目标数据中的位置。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
综上所述,本公开中客户端在获取到第一格式的,包括了文本数据和原始格式数据的原始数据后,首先按照预设的映射关系,将原始格式数据中的N组格式标签转换为对应的N个识别码,以得到目标格式数据,其中映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,再生成包含目标格式数据和文本数据的第一目标数据,最后将第一目标数据发送至服务器,使得服务器能够根据映射关系将第一目标数据还原为原始数据。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。
图11是根据一示例性实施例示出的一种电子设备500的框图。如图11所示,该电子设备500可以包括:处理器501,存储器502。该电子设备500还可以包括多媒体组件503,输入/输出(I/O)接口504,以及通信组件505中的一者或多者。
其中,处理器501用于控制该电子设备500的整体操作,以完成上述的图4或图5所示的文本的处理方法中的全部或部分步骤。存储器502用于存储各种类型的数据以支持在该电子设备500的操作,这些数据例如可以包括用于在该电子设备500上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器502可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件503可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器502或通过通信组件505发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口504为处理器501和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件505用于该电子设备500与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件505可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,电子设备500可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的图4或图5所示的文本的处理方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的图4或图5所示文本的处理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器502,上述程序指令可由电子设备500的处理器501执行以完成上述的图4或图5所示的文本的处理方法。
综上所述,本公开中客户端在获取到第一格式的,包括了文本数据和原始格式数据的原始数据后,首先按照预设的映射关系,将原始格式数据中的N组格式标签转换为对应的N个识别码,以得到目标格式数据,其中映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,再生成包含目标格式数据和文本数据的第一目标数据,最后将第一目标数据发送至服务器,使得服务器能够根据映射关系将第一目标数据还原为原始数据。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。
图12是根据一示例性实施例示出的一种电子设备600的框图。例如,电子设备600可以被提供为一服务器。参照图12,电子设备600包括处理器622,其数量可以为一个或多个,以及存储器632,用于存储可由处理器622执行的计算机程序。存储器632中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器622可以被配置为执行该计算机程序,以执行上述的图1至图3所示的文本的处理方法。
另外,电子设备600还可以包括电源组件626和通信组件650,该电源组件626可以被配置为执行电子设备600的电源管理,该通信组件650可以被配置为实现电子设备600的通信,例如,有线或无线通信。此外,该电子设备600还可以包括输入/输出(I/O)接口658。电子设备600可以操作基于存储在存储器632的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM等等。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的图1至图3所示的文本的处理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器632,上述程序指令可由电子设备600的处理器622执行以完成上述的图1至图3所示的文本的处理方法。
综上所述,本公开中服务器首先接收由客户端发送的包括了文本数据和目标格式数据的第一目标数据,再按照预设映射关系将第一目标数据中的目标格式数据中的N个识别码转换为对应的N组格式标签,以得到原始格式数据,其中映射关系包括多种格式标签,以及多种格式标签中的每种格式标签对应的识别码,最后将包含了原始格式数据和文本数据的原始数据发送至浏览器,以使浏览器将原始数据按照第一格式进行显示。能够在传输文本的过程中,节省网络传输资源,提高文本的传输速度。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,本领域技术人员在考虑说明书及实践本公开后,容易想到本公开的其它实施方案,均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。同时本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。本公开并不局限于上面已经描述出的精确结构,本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种文本的处理方法,其特征在于,应用于服务器,所述方法包括:
接收客户端发送的第一目标数据,所述第一目标数据中包括文本数据和目标格式数据,所述目标格式数据中包括N个识别码,所述第一目标数据还包括:位置标签、文本标签和识别码标签,所述文本标签用于标识所述文本数据在所述第一目标数据中的位置,所述识别码标签用于标识所述目标格式数据在所述第一目标数据中的位置,所述位置标签用于标识所述第一目标数据的开头和结尾;
按照预设的映射关系,将所述目标格式数据中的所述N个识别码转换为对应的N组格式标签,以获取原始格式数据,所述映射关系包括多种格式标签,以及所述多种格式标签中的每种格式标签对应的识别码;
将包含所述原始格式数据和所述文本数据的原始数据发送至浏览器,以通过所述浏览器将所述原始数据按照第一格式进行显示;
在获取原始格式数据之后,所述方法还包括:
确定原始格式数据中的N组格式标签对应的N个导出应用程序编程接口API;
根据N个导出API和文本数据,将原始数据转换为第二格式的导出数据后,输出所述导出数据。
2.根据权利要求1所述的方法,其特征在于,在所述接收客户端发送的第一目标数据之后,所述方法还包括:
将所述第一目标数据存入所述服务器的数据库;
当获取到包含查询文本的查询请求时,根据所述数据库中的每个目标数据的文本标签确定所述每个目标数据的文本数据;
在所述每个目标数据的文本数据中,查找包括所述查询文本的目标文本数据;
在查找到所述目标文本数据后,将所述目标文本数据所属的第二目标数据作为查询结果进行输出。
3.一种文本的处理方法,其特征在于,应用于客户端,所述方法包括:
获取第一格式的原始数据,所述原始数据包括文本数据和原始格式数据,所述原始格式数据包括N组格式标签;
按照预设的映射关系,将所述N组格式标签转换为对应的N个识别码,以获取目标格式数据,所述映射关系包括多种格式标签,以及所述多种格式标签中的每种格式标签对应的识别码;
生成包含所述目标格式数据和所述文本数据的第一目标数据,所述第一目标数据还包括:位置标签、文本标签和识别码标签,所述文本标签用于标识所述文本数据在所述第一目标数据中的位置,所述识别码标签用于标识所述目标格式数据在所述第一目标数据中的位置,所述位置标签用于标识所述第一目标数据的开头和结尾;
将所述第一目标数据发送至服务器,所述服务器能够根据所述映射关系将所述第一目标数据还原为所述原始数据;所述服务器按照预设的映射关系,将所述目标格式数据中的所述N个识别码转换为对应的N组格式标签,以获取原始格式数据,并在获取到所述原始格式数据之后,确定原始格式数据中的N组格式标签对应的N个导出应用程序编程接口API;根据N个导出API和文本数据,将原始数据转换为第二格式的导出数据后,输出所述导出数据。
4.根据权利要求3所述的方法,其特征在于,所述生成包含所述目标格式数据和所述文本数据的第一目标数据,包括:
根据所述目标格式数据生成识别码标签;
根据所述文本数据生成文本标签;
生成包含所述目标格式数据、所述识别码标签、所述文本数据和所述文本标签的所述第一目标数据,所述文本标签能够标识所述文本数据在所述第一目标数据中的位置,所述识别码标签能够标识所述目标格式数据在所述第一目标数据中的位置。
5.一种文本的处理装置,其特征在于,应用于服务器,所述装置包括:
接收模块,用于接收客户端发送的第一目标数据,所述第一目标数据中包括文本数据和目标格式数据,所述目标格式数据中包括N个识别码,所述第一目标数据还包括:位置标签、文本标签和识别码标签,所述文本标签用于标识所述文本数据在所述第一目标数据中的位置,所述识别码标签用于标识所述目标格式数据在所述第一目标数据中的位置,所述位置标签用于标识所述第一目标数据的开头和结尾;
第一转换模块,用于按照预设的映射关系,将所述目标格式数据中的所述N个识别码转换为对应的N组格式标签,以获取原始格式数据,所述映射关系包括多种格式标签,以及所述多种格式标签中的每种格式标签对应的识别码;
显示模块,用于将包含所述原始格式数据和所述文本数据的原始数据发送至浏览器,以通过所述浏览器将所述原始数据按照第一格式进行显示;
所述装置还包括:接口确定模块,用于在按照预设的映射关系,将目标格式数据中的N个识别码转换为对应的N组格式标签,以获取原始格式数据之后,确定原始格式数据中的N组格式标签对应的N个导出应用程序编程接口API;
第二转换模块,用于根据N个导出API和文本数据,将原始数据转换为第二格式的导出数据;
导出模块,用于输出导出数据。
6.一种文本的处理装置,其特征在于,应用于客户端,所述装置包括:
获取模块,用于获取第一格式的原始数据,所述原始数据包括文本数据和原始格式数据,所述原始格式数据包括N组格式标签;
转换模块,用于按照预设的映射关系,将所述N组格式标签转换为对应的N个识别码,以获取目标格式数据,所述映射关系包括多种格式标签,以及所述多种格式标签中的每种格式标签对应的识别码;
生成模块,用于生成包含所述目标格式数据和所述文本数据的第一目标数据,所述第一目标数据还包括:位置标签、文本标签和识别码标签,所述文本标签用于标识所述文本数据在所述第一目标数据中的位置,所述识别码标签用于标识所述目标格式数据在所述第一目标数据中的位置,所述位置标签用于标识所述第一目标数据的开头和结尾;
发送模块,用于将所述第一目标数据发送至服务器,所述服务器能够根据所述映射关系将所述第一目标数据还原为所述原始数据,所述服务器按照预设的映射关系,将所述目标格式数据中的所述N个识别码转换为对应的N组格式标签,以获取原始格式数据,并在获取到所述原始格式数据之后,确定原始格式数据中的N组格式标签对应的N个导出应用程序编程接口API;根据N个导出API和文本数据,将原始数据转换为第二格式的导出数据后,输出所述导出数据。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1或2所述方法的步骤。
8.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1或2所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求3或4所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求3或4所述方法的步骤。
CN201811644380.7A 2018-12-29 2018-12-29 文本的处理方法、装置、存储介质和电子设备 Active CN109614592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811644380.7A CN109614592B (zh) 2018-12-29 2018-12-29 文本的处理方法、装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811644380.7A CN109614592B (zh) 2018-12-29 2018-12-29 文本的处理方法、装置、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN109614592A CN109614592A (zh) 2019-04-12
CN109614592B true CN109614592B (zh) 2023-10-10

Family

ID=66016367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811644380.7A Active CN109614592B (zh) 2018-12-29 2018-12-29 文本的处理方法、装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN109614592B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112463919B (zh) * 2020-10-14 2021-10-29 北京百度网讯科技有限公司 文本标签的查询方法、装置、电子设备和存储介质
CN113486636A (zh) * 2021-07-07 2021-10-08 建信金融科技有限责任公司 一种文本标注方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106383840A (zh) * 2016-08-30 2017-02-08 广东小天才科技有限公司 一种小样文件到Office文件的转换方法及装置
CN107124407A (zh) * 2017-04-21 2017-09-01 东软集团股份有限公司 数据传输方法、装置、可读存储介质、电子设备及系统
CN107608947A (zh) * 2017-09-22 2018-01-19 阿里巴巴集团控股有限公司 Html文件处理方法及装置、电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106383840A (zh) * 2016-08-30 2017-02-08 广东小天才科技有限公司 一种小样文件到Office文件的转换方法及装置
CN107124407A (zh) * 2017-04-21 2017-09-01 东软集团股份有限公司 数据传输方法、装置、可读存储介质、电子设备及系统
CN107608947A (zh) * 2017-09-22 2018-01-19 阿里巴巴集团控股有限公司 Html文件处理方法及装置、电子设备

Also Published As

Publication number Publication date
CN109614592A (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
CN111274760B (zh) 富文本数据处理方法、装置、电子设备及计算机存储介质
US20200322570A1 (en) Method and apparatus for aligning paragraph and video
US20210272342A1 (en) Method for translating words in a picture, electronic device, and storage medium
CN112073307B (zh) 邮件处理方法、装置、电子设备及计算机可读介质
CN113382083B (zh) 一种网页截图方法和装置
CN103678704A (zh) 一种基于图片信息的识图方法、系统、设备及装置
KR20220127334A (ko) 문서 내 테이블 브라우징 방법, 장치, 전자기기 및 저장매체
CN111381913B (zh) 前端多语言加载适配方法、装置、计算机设备及存储介质
CN109543154B (zh) 表格数据的类型转换方法、装置、存储介质及电子设备
CN109614592B (zh) 文本的处理方法、装置、存储介质和电子设备
CN111597107B (zh) 信息输出方法、装置和电子设备
CN113190152A (zh) 切换应用程序主题的方法和装置
CN103678706A (zh) 一种基于截图信息的识图方法、系统、设备及装置
CN108062401B (zh) 应用推荐方法、装置及存储介质
CN107330087B (zh) 页面文件生成方法和装置
CN113590985B (zh) 页面跳转配置方法、装置、电子设备和计算机可读介质
EP4195011A1 (en) Character display method and apparatus, and electronic device and computer-readable storage medium
CN114239501A (zh) 合同生成方法、装置、设备及介质
CN114626332A (zh) 内容展示方法、装置和电子设备
CN114995690A (zh) 一种文档创建方法、装置、设备及存储介质
CN110780898A (zh) 页面数据的升级方法、装置和电子设备
CN112579080A (zh) 一种生成用户界面代码的方法和装置
CN115982358B (zh) 文档拆分方法、装置、终端设备和计算机可读存储介质
CN113722642B (zh) 网页页面的转换方法、装置、电子设备以及存储介质
EP4311200A1 (en) Interaction method and apparatus, and electronic device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant