CN102546577A - 一种版式数据的压缩和解压缩方法及系统 - Google Patents

一种版式数据的压缩和解压缩方法及系统 Download PDF

Info

Publication number
CN102546577A
CN102546577A CN2010106222905A CN201010622290A CN102546577A CN 102546577 A CN102546577 A CN 102546577A CN 2010106222905 A CN2010106222905 A CN 2010106222905A CN 201010622290 A CN201010622290 A CN 201010622290A CN 102546577 A CN102546577 A CN 102546577A
Authority
CN
China
Prior art keywords
format data
data
compression
client
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010106222905A
Other languages
English (en)
Inventor
李平立
魏玺
李悦
刘畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Founder International Beijing Co Ltd
Original Assignee
Peking University
Founder International Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Founder International Beijing Co Ltd filed Critical Peking University
Priority to CN2010106222905A priority Critical patent/CN102546577A/zh
Publication of CN102546577A publication Critical patent/CN102546577A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及了一种版式数据的压缩和解压缩方法及系统,属于数据压缩技术领域。本发明首先由客户端向服务器端请求版式数据;服务器端响应客户端的请求,压缩客户端请求的版式数据,将所述版式数据中的字符压缩成流式数据和排版属性信息,生成压缩后的版式数据;所述排版属性信息包括版式数据每页中的排版区域定位信息及排版区域中的排版数据区段;服务器端将压缩后的版式数据传输给客户端;最后客户端解压接收到的压缩后的版式数据,依据流式数据和排版属性信息对压缩后的版式数据进行恢复排版。本发明大大地减小版式数据的数据量,加快了版式数据的网络传输速度。

Description

一种版式数据的压缩和解压缩方法及系统
技术领域
本发明涉及一种版式数据压缩与解压缩方法及系统,属于压缩技术领域。
背景技术
目前的电子书存在两种主要的数据格式:版式数据(以PDF为代表)与流式数据(以TXT,ePub格式为代表)。版式数据是指将具体内容表达在版面上所形成的数据,包含每个字符的位置信息等。流式数据是指只包含文本的字符信息,不包含位置信息等的版面数据。版式数据和流式数据各自存在以下优缺点:
版式数据的优点为:1)字符位置信息已经确定,无需重新排版;2)排版精美,显示速度快。其缺点为:数据量大,不利于网络传输,即使采用现有压缩软件压缩,数据量仍然很大。
流式数据的优点为:1)数据量小,网络传输时间短;2)不包含位置信息,在客户端重新排版,适应多种规格的版面大小。其缺点为:1)需要在客户端重新排版,造成显示速度慢;2)限于客户端运算能力的限制,不可能有复杂的排版效果。
发明内容
针对现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种版式数据的压缩和解压缩方法及系统,该方法及系统能够减小版式数据的数据量,加快版式数据的网络传输速度。
为解决上述技术问题,本发明采用的技术方案如下:
一种版式数据的压缩和解压缩方法,包括以下步骤:
(1)客户端向服务器端发送版式数据请求;
(2)服务器端响应客户端的请求,压缩客户端请求的版式数据,将所述版式数据中的字符压缩成流式数据和排版属性信息,生成压缩后的版式数据;所述排版属性信息包括版式数据每页中的排版区域定位信息及排版区域中的排版数据区段;
(3)服务器端将压缩后的版式数据传输给客户端;
(4)客户端解压接收到的压缩后的版式数据,依据流式数据和排版属性信息对压缩后的版式数据进行恢复排版。
如上所述的版式数据的压缩和解压缩方法,步骤(1)中所述版式数据请求中包含客户端显示屏的分辨率;步骤(2)中,如果服务器端不存在客户端请求的版式数据,则服务器端根据客户端显示屏的分辨率按照设定的排版规则排版出能够展示的版式数据。
如上所述的版式数据的压缩和解压缩方法,步骤(2)中,如果服务器端存在客户端请求的第三方版式数据文件,则从第三方版式数据文件提取出版式数据。
如上所述的版式数据的压缩和解压缩方法,步骤(2)中,如果版式数据中包含图片,则先对版式数据中的字符和图片进行分区处理,将版式数据划分为只包含字符和只包含图片的区块,用包含该图片的最小矩形表示该图片区块的大小;然后对每个区块进行压缩处理。
为实现上述方法,本发明还提供了一种版式数据的压缩和解压缩系统,包括客户端和服务器端,所述客户端包括用于向服务器端发起版式数据请求的请求装置;所述服务器端包括用于响应客户端发起的请求的响应装置;其特征在于:所述服务器端还包括用于将版式数据中字符压缩成流式数据和排版属性信息的压缩装置;以及用于将压缩后的版式数据传输给客户端的传输模块;所述排版属性信息包括版式数据每页中的排版区域定位信息及排版区域中的排版数据区段;
所述客户端还包括用于接收服务器端传输的压缩后的版式数据的接收装置;以及用于依据流式数据和排版属性信息对压缩后的版式数据进行恢复排版的解压缩装置。
如上所述的版式数据的压缩和解压缩系统,其中,客户端向服务器端发起的版式数据请求中包含客户端显示屏的分比率;服务器端还包括用于根据客户端显示屏的分比率按照设定的排版规则排版出能够展示的版式数据的排版装置。
如上所述的版式数据的压缩和解压缩方法,其中,服务器端还包括用于从第三方版式数据文件提取出版式数据的过滤装置。
本发明所述方法及系统,通过在服务器端对版式数据进行压缩,客户端从服务器下载压缩后的版式数据后,依据压缩规则进行解压缩,恢复完整的版式数据在客户端上进行显示,从而大大减小了版式数据的数据量,加快了版式数据在网络中的传输速度,并且在客户端能够显示排版效果较好的版式数据。
附图说明
图1是具体实施方式中版式数据的压缩和解压缩系统中的客户端和服务器端的连接关系示意图;
图2是具体实施方式中版式数据的压缩和解压缩系统中的客户端和服务器端的结构框图;
图3是具体实施方式中版式数据的压缩和解压缩方法的流程图;
图4是实施例1中压缩前的版式数据示意图;
图5是实施例2中压缩前的版式数据分区示意图。
具体实施方式
下面结合具体实施方式和说明书附图对本发明进行详细描述。
图1和图2示出了本实施方式中版式数据的压缩和解压缩系统的结构框图。如图1和图2所示,该系统包括服务器端1和客户端2,一个服务器端1可以通过有线或无线网络与多个客户端2连接。客户端2包括请求装置21、接收装置22和解压缩装置23。服务器端1包括响应装置11、压缩装置12、传输装置13、排版装置14和过滤装置15。
请求装置21用于向服务器端1发起版式数据请求,所述版式数据请求中包含客户端2显示屏的分辨率。
响应装置11用于响应请求装置21发起的版式数据请求。
压缩装置12用于将版式数据中字符压缩成流式数据和排版属性信息。所述排版属性信息包括版式数据每页中的排版区域定位信息及排版区域中的排版数据区段。
传输装置13用于将压缩后的版式数据传输给接收装置22。
接收装置22用于接收传输装置13传输的压缩后的版式数据。
解压缩装置23用于依据流式数据和排版属性信息对压缩后的版式数据进行恢复排版。
排版装置14用于根据客户端2显示屏的分辨率按照设定的排版规则排版出能够展示的版式数据。
过滤装置15用于从第三方版式数据文件中提取出版式数据。
图3示出了基于图2所示系统的版式数据的压缩和解压缩方法流程。如图3所示,该方法包括以下步骤:
(1)客户端2向服务器端1请求版式数据。
客户端2中的请求装置21向服务器端1发送版式数据的请求,所述版式数据请求包括客户端2显示屏的分辨率。
(2)服务器端1响应请求。
服务器端1中的响应装置11响应客户端2中的请求装置21发起的版式数据请求。
(3)服务器端1压缩客户端2请求的版式数据,将版式数据中的字符压缩成流式数据和排版属性信息,生成压缩后的版式数据。所述排版属性信息包括版式数据每页中的排版区域定位信息及排版区域中的排版数据区段。
如果服务器端1存在客户端2请求的版式数据,则直接由压缩装置12对该版式数据进行压缩。如果不存在客户端2请求的版式数据,则服务器端1中的排版装置14先根据客户端显示屏的分辨率按照设定的排版规则排版出能够展示的版式数据,再由压缩装置12对该版式数据进行压缩。如果服务器端1存在客户端2请求的第三方版式数据文件,则先由过滤装置15从第三方版式数据文件中提取出版式数据。
(3)服务器端1将压缩后的版式数据传输给客户端2。
服务器端1中的传输装置13将压缩后的版式数据传输给客户端2中的接收装置22,接收装置22接收压缩后的版式数据。
(4)客户端2解压接收到的压缩后的版式数据,依据流式数据和排版属性信息对压缩后的版式数据进行恢复排版。
客户端2中的解压缩装置23对压缩后的版式数据进行解压缩,即依据排版属性信息对流式数据进行恢复排版。
下面通过具体的实施例对上述实施方式进行举例说明。
实施例1
本实施例中的版式数据如图4所示,客户端2为手机,手机用户需要从网络服务器中获取图4中所示的版式数据。如果服务器直接将版式数据发送到手机,由于版式数据文件的数据量较大,势必导致网络传输的时间较长。
首先利用手机向服务器发送图4所示版式数据的获取请求,服务器端接收并响应该请求,对请求的版式数据进行如下压缩:将版式数据中的字符压缩成流式数据和排版属性信息,其中排版属性信息包括版式数据的排版区域定位信息及排版区域中的排版数据区段。在版式数据压缩过程中,不描述每个字符的位置信息,而只是描述必要的定位信息,如各段的位置或者特殊行的位置等,这样便可以大大地减少数据量。
图4所示的版式数据,共包括4段。首先确定每一段的排版位置,每一段中排版的字符区段,以及字体、字号、字间距、行间距等排版信息。然后将版式数据中的字符压缩成流式数据。压缩后服务器将流式数据和排版属性信息发送到手机。手机接收后,根据排版属性信息重新排版流式数据,排版后的效果与该版式数据在服务器中的效果基本相同,从而使得在手机上也能展示排版效果较好的版式数据。由于有排版属性信息,因此手机无需较强的运算能力即可快速完成恢复排版。
实施例2
本实施例中的版式数据如图5所示,与实施例1不同的是,该版式数据不仅包括字符信息,而且还包括图片。服务器端在进行压缩之前,首先对版式数据中的字符信息与图片信息进行分区处理,将版式数据中的信息划分为只包含字符信息和只包含图片信息的区块,用包含该图片的最小矩形表示该图片区块的大小。如图5所示,将数据划分成了5个矩形区块,中间区块为图片区块。在完成分区后,再采用实施例1中所述方法对只包含字符的区块进行压缩和解压缩。对于图片区块,可采用现有方法对该图片进行压缩,并确定该图片的排版位置。客户端采用与压缩方法相对应的解压缩方法对图片进行解压缩后,根据该图片的排版位置进行恢复排版。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种版式数据的压缩和解压缩方法,包括以下步骤:
(1)客户端向服务器端发送版式数据请求;
(2)服务器端响应客户端的请求,压缩客户端请求的版式数据,将所述版式数据中的字符压缩成流式数据和排版属性信息,生成压缩后的版式数据;所述排版属性信息包括版式数据每页中的排版区域定位信息及排版区域中的排版数据区段;
(3)服务器端将压缩后的版式数据传输给客户端;
(4)客户端解压接收到的压缩后的版式数据,依据流式数据和排版属性信息对压缩后的版式数据进行恢复排版。
2.如权利要求1所述的版式数据的压缩和解压缩方法,其特征在于:步骤(1)中所述版式数据请求中包含客户端显示屏的分辨率;步骤(2)中,如果服务器端不存在客户端请求的版式数据,则服务器端根据客户端显示屏的分辨率按照设定的排版规则排版出能够展示的版式数据。
3.如权利要求1所述的版式数据的压缩和解压缩方法,其特征在于:步骤(2)中,如果服务器端存在客户端请求的第三方版式数据文件,则从第三方版式数据文件中提取出版式数据。
4.如权利要求1~3中任一项所述的版式数据的压缩和解压缩方法,其特征在于:步骤(2)中,如果版式数据中包含图片,则先对版式数据中的字符和图片进行分区处理,将版式数据划分为只包含字符和只包含图片的区块,用包含该图片的最小矩形表示该图片区块的大小;然后对每个区块进行压缩处理。
5.一种版式数据的压缩和解压缩系统,包括客户端(2)和服务器端(1),所述客户端(2)包括用于向服务器端(1)发起版式数据请求的请求装置(21);所述服务器端(1)包括用于响应客户端(2)发起的请求的响应装置(11);其特征在于:所述服务器端(1)还包括用于将版式数据中字符压缩成流式数据和排版属性信息的压缩装置(12);以及用于将压缩后的版式数据传输给客户端(2)的传输模块(13);所述排版属性信息包括版式数据每页中的排版区域定位信息及排版区域中的排版数据区段;
所述客户端(2)还包括用于接收服务器端(1)传输的压缩后的版式数据的接收装置(22);以及用于依据流式数据和排版属性信息对压缩后的版式数据进行恢复排版的解压缩装置(23)。
6.如权利要求5所述的版式数据的压缩和解压缩系统,其特征在于:所述客户端(2)向服务器端(1)发起的版式数据请求中包括客户端(2)显示屏的分比率;所述服务器端(1)还包括用于根据客户端(2)显示屏的分比率按照设定的排版规则排版出能够展示的版式数据的排版装置(14)。
7.如权利要求5所述的版式数据的压缩和解压缩系统,其特征在于:所述服务器端(1)还包括用于从第三方版式数据文件提取出版式数据的过滤装置(15)。
CN2010106222905A 2010-12-27 2010-12-27 一种版式数据的压缩和解压缩方法及系统 Pending CN102546577A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010106222905A CN102546577A (zh) 2010-12-27 2010-12-27 一种版式数据的压缩和解压缩方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010106222905A CN102546577A (zh) 2010-12-27 2010-12-27 一种版式数据的压缩和解压缩方法及系统

Publications (1)

Publication Number Publication Date
CN102546577A true CN102546577A (zh) 2012-07-04

Family

ID=46352546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010106222905A Pending CN102546577A (zh) 2010-12-27 2010-12-27 一种版式数据的压缩和解压缩方法及系统

Country Status (1)

Country Link
CN (1) CN102546577A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279254A (zh) * 2015-10-12 2016-01-27 江苏中威科技软件系统有限公司 版式数据流文件系统及其操作装置和其操作装置的实现方法
CN106599113A (zh) * 2016-11-30 2017-04-26 武汉虹信通信技术有限责任公司 用于网管系统海量性能数据的数据库读写方法
CN110602093A (zh) * 2019-09-12 2019-12-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置以及计算机可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4803643A (en) * 1987-08-10 1989-02-07 Oclc Online Computer Library Center Incorporated System and method for creating memory-retained, formatted pages of text, tabulation, and graphic data
WO2002076058A2 (en) * 2001-03-21 2002-09-26 Research In Motion Limited Method and apparatus for providing content to media devices
JP2004538576A (ja) * 2001-08-03 2004-12-24 富士通株式会社 書式付き文書から情報を抽出する装置および方法
CN101150803A (zh) * 2007-10-24 2008-03-26 优视动景(北京)技术服务有限公司 微浏览器处理网络数据的方法、微浏览器及其服务器
US20100211866A1 (en) * 2009-02-13 2010-08-19 Language Technologies, Inc System and method for converting the digital typesetting documents used in publishing to a device-specfic format for electronic publishing
CN101860533A (zh) * 2010-05-26 2010-10-13 卓望数码技术(深圳)有限公司 一种基于c/s架构浏览器的数据传输方法及服务器
CN101876967A (zh) * 2010-03-25 2010-11-03 深圳市万兴软件有限公司 一种pdf文本段落生成的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4803643A (en) * 1987-08-10 1989-02-07 Oclc Online Computer Library Center Incorporated System and method for creating memory-retained, formatted pages of text, tabulation, and graphic data
WO2002076058A2 (en) * 2001-03-21 2002-09-26 Research In Motion Limited Method and apparatus for providing content to media devices
JP2004538576A (ja) * 2001-08-03 2004-12-24 富士通株式会社 書式付き文書から情報を抽出する装置および方法
CN101150803A (zh) * 2007-10-24 2008-03-26 优视动景(北京)技术服务有限公司 微浏览器处理网络数据的方法、微浏览器及其服务器
US20100211866A1 (en) * 2009-02-13 2010-08-19 Language Technologies, Inc System and method for converting the digital typesetting documents used in publishing to a device-specfic format for electronic publishing
CN101876967A (zh) * 2010-03-25 2010-11-03 深圳市万兴软件有限公司 一种pdf文本段落生成的方法
CN101860533A (zh) * 2010-05-26 2010-10-13 卓望数码技术(深圳)有限公司 一种基于c/s架构浏览器的数据传输方法及服务器

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279254A (zh) * 2015-10-12 2016-01-27 江苏中威科技软件系统有限公司 版式数据流文件系统及其操作装置和其操作装置的实现方法
CN105279254B (zh) * 2015-10-12 2018-10-23 江苏中威科技软件系统有限公司 版式数据流文件系统及其操作装置和其操作装置的实现方法
CN106599113A (zh) * 2016-11-30 2017-04-26 武汉虹信通信技术有限责任公司 用于网管系统海量性能数据的数据库读写方法
CN106599113B (zh) * 2016-11-30 2019-12-10 武汉虹信通信技术有限责任公司 用于网管系统海量性能数据的数据库读写方法
CN110602093A (zh) * 2019-09-12 2019-12-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置以及计算机可读存储介质
CN110602093B (zh) * 2019-09-12 2021-04-30 腾讯科技(深圳)有限公司 一种数据处理方法、装置以及计算机可读存储介质

Similar Documents

Publication Publication Date Title
US8648858B1 (en) Hybrid text and image based encoding
CN101178716B (zh) 微浏览器处理JavaScript信息的方法及其装置
CN106776677B (zh) 文件转换方法、装置及文件传输系统
CN103514241A (zh) 图片加载方法及系统
CN101127819A (zh) 一种图像传输的方法和设备
KR101568947B1 (ko) 폰트 파일을 다운로드하는 방법 및 시스템
CN103152573A (zh) 一种移动终端与智能电视间图像帧传输的方法及系统
CN104426985A (zh) 显示网页的方法、装置及系统
CN106713922B (zh) 图像处理方法和电子设备
CN112487763A (zh) 基于svg的ofd文件在线显示方法、服务器端及系统
CN102546577A (zh) 一种版式数据的压缩和解压缩方法及系统
CN111625211A (zh) 一种屏幕投屏方法、装置、安卓设备及显示设备
CN112637598A (zh) 视频的压缩与解压缩方法、装置、设备及可读存储介质
CN104243459A (zh) 一种虚拟桌面实现方法、装置、终端和系统
CN114297544A (zh) 一种远程浏览方法、装置、设备及存储介质
CN113839998A (zh) 图像数据传输方法、装置、设备、存储介质及程序产品
CN105704215B (zh) 文件共享系统及相应的文件发送方法及装置
CN109710783B (zh) 一种图片加载方法、装置、存储介质及服务器
CN101309259B (zh) 一种分布式图像显示方法
CN114928754B (zh) 用于实景三维数据的数据处理方法及电子设备
CN105610979B (zh) 一种基于虚拟化技术的网络资源传输系统及其方法
KR20100018965A (ko) 이동통신단말기의 웹 페이지 제공 시스템 및 그 방법
KR101012206B1 (ko) 웹뷰어의 이미지 전송량 관리 시스템 및 그 방법
CN108156134A (zh) 一种基于FPGA的Spice协议解析系统
KR100866746B1 (ko) 무선 통신망을 통한 고속 웹브라우징 서비스 시스템 및 그방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120704