CN111460348B - 文件处理的方法和装置 - Google Patents

文件处理的方法和装置 Download PDF

Info

Publication number
CN111460348B
CN111460348B CN202010244887.4A CN202010244887A CN111460348B CN 111460348 B CN111460348 B CN 111460348B CN 202010244887 A CN202010244887 A CN 202010244887A CN 111460348 B CN111460348 B CN 111460348B
Authority
CN
China
Prior art keywords
page number
content file
page
file
file corresponding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010244887.4A
Other languages
English (en)
Other versions
CN111460348A (zh
Inventor
梁澄宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202010244887.4A priority Critical patent/CN111460348B/zh
Publication of CN111460348A publication Critical patent/CN111460348A/zh
Application granted granted Critical
Publication of CN111460348B publication Critical patent/CN111460348B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6209Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself

Abstract

本发明公开了一种文件处理的方法和装置。该方法包括:响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,目标文档包括PDF文档;向服务器发送获取页码对应的内容文件和附件资源文件的请求,以使得服务器根据请求获取页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回页码对应的内容文件和附件资源文件;接收服务器返回的页码对应的内容文件和附件资源文件;对页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面。通过本发明,达到了灵活在网页中阅读部分PDF文件无需全文下载的效果。

Description

文件处理的方法和装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种文件处理的方法和装置。
背景技术
PDF是目前主流的文档格式之一,对于仅有阅读需求而无需编辑的文档(如图书、技术文档等),PDF对比office的doc、ppt等格式具有显著优势,文件体积小,无需安装office等文本处理软件,且可以兼容各种设备。而对于很多web端上传的很多PDF文档,大部分用户只是想浏览文档中的关键信息,没有将文件下载到本地的意愿,直接在网页中浏览文档可以带来更好的用户的体验。
目前大部分的在线文档预览方案的原理是将全部PDF数据下载到浏览器中,这样相当于暴露了文档的下载地址,对于一些有安全性需求的场景,需要仅提供预览功能而不希望用户可以轻易地获取整个文件,这类方案难以满足需求。
例如,目前大部分主流的浏览器都提供了直接打开PDF的功能,如chrome浏览器有内置的PDF阅读器,可以直接打开在线或本地的PDF文档;firefox浏览器基于pdf.js实现了PDF文档的在线预览并开源了整个框架,开发者可以借助PDF.js框架进行二次开发定制自己的阅读器,pdf.js借助HTTP Range请求参数实现分段加载,不需要加载完全部数据即可渲染部分可视页面;另外还有flexpaper的方案,该方案将PDF文档转换为分页的swf文件,在网页中使用flash技术进行展示。浏览器直接预览的方案,主要问题在于直接提供了PDF文档的下载按钮,用户可以轻易地直接下载整个文件,文档安全性难以保证,且在文档很大的时候需要较长的加载时间。
基于pdf.js的方案可以自行定制阅读器,分段加载也可以提升渲染速度,但是需要一定的浏览器和web server支持,对于页数多、分辨率高的文档也会占用较高的内存。更主要的问题在于虽然可以通过技术手段隐藏下载按钮但下载地址仍然会暴露在网络请求中,了解浏览器调试原理的用户还是可以轻易下载整个文件。
Flexpaper方案基于flash实现,安全性非常高,暴露给用户的只有分页的swf数据,几乎无法获取整个文件内容,因为也采用了分页加载,渲染速度也不错。问题主要在于flash的兼容性较差,移动端基本难以支持,而且chrome也宣布2020年之后不再支持flash。
针对相关技术中在网页中阅读PDF文件时要下载整个文件的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种文件处理的方法和装置,以解决网页中阅读PDF文件时要下载整个文件的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种文件处理的方法,该方法包括:响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,所述目标文档包括PDF文档;向服务器发送获取所述页码对应的内容文件和附件资源文件的请求,以使得所述服务器根据所述请求获取所述页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回所述页码对应的内容文件和附件资源文件;接收所述服务器返回的所述页码对应的内容文件和附件资源文件;对所述页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面。
进一步地,所述请求中包括请求用户对应的权限参数,所述权限参数用于服务器判断所述请求用户是否具有查阅所述页码对应的内容文件的资格。
进一步地,对所述页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面,包括:对所述页码对应的内容文件进行格式转换,得到html格式的内容文件;基于所述html格式的内容文件和所述附件资源文件进行页面渲染,得到目标页面。
进一步地,所述接收所述服务器返回的所述页码对应的内容文件和附件资源文件后,所述方法还包括:将所述页码对应的内容文件和附件资源文件保存于内存中。
进一步地,所述方法还包括:响应于针对所述可视区域中当前显示页码的切换操作,将所述当前显示页码对应的内容文件和附件资源文件从内存中清除。
为了实现上述目的,根据本发明的一个方面,还提供了一种文件处理的方法,该方法包括:响应于客户端发送的获取目标文档的目标页码对应的内容文件和附件资源文件的请求,根据所述请求查询所述目标页码对应的内容文件的存储路径和附件资源文件的存储路径;根据所述目标页码对应的内容文件的存储路径获取所述页码对应的内容文件,根据所述页码对应的附件资源文件的路径获取所述页码对应的附件资源文件;将获取的所述目标页码对应的内容文件和附件资源文件发送至所述客户端。
进一步地,所述根据所述请求查询所述目标页码对应的内容文件的存储路径和附件资源文件的存储路径之前,所述方法还包括:获取所述目标文档;将所述目文档转换成html格式的内容文件和html格式的附件资源文件;将所述html格式的内容文件转换成json格式的内容文件;将所述json格式的内容文件和所述html格式的所述附件资源文件分别保存到至服务器的预定资源存储路径中。
进一步地,在将获取的所述目标页面对应的内容文件和附件资源文件发送至所述客户端之前,所述方法还包括:根据所述请求获取所述客户端对应的请求用户的权限参数;根据所述权限参数确定所述请求用户具有所述目标文档的内容文件的查阅权限。
为了实现上述目的,根据本发明的另一方面,还提供了一种文件处理的装置,该装置包括:确定单元,用于响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,所述目标文档包括PDF文档;第一发送单元,用于向服务器发送获取所述页码对应的内容文件和附件资源文件的请求,以使得所述服务器根据所述请求获取所述页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回所述页码对应的内容文件和附件资源文件;接收单元,用于接收所述服务器返回的所述页码对应的内容文件和附件资源文件;渲染单元,用于对所述页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面。
为了实现上述目的,根据本发明的另一方面,还提供了一种文件处理装置文件处理的装置,该装置包括:查询单元,用于响应于客户端发送的获取目标文档的目标页码对应的内容文件和附件资源文件的请求,根据所述请求查询所述目标页码对应的内容文件的存储路径和附件资源文件的存储路径;获取单元,用于根据所述目标页码对应的内容文件的存储路径获取所述页码对应的内容文件,根据所述页码对应的附件资源文件的路径获取所述页码对应的附件资源文件;第二发送单元,用于将获取的所述目标页码对应的内容文件和附件资源文件发送至所述客户端。
为了实现上述目的,根据本发明的另一方面,还提供了一种存储介质,包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行本发明所述的文件处理的方法。
为了实现上述目的,根据本发明的另一方面,还提供了一种设备,至少包括一个处理器,以及与所述处理器连接的至少一个存储器、总线,其中,所述处理器、所述存储器通过所述总线完成相互间的通信,所述处理器用于调用所述存储器中的程序指令,以执行本发明所述的文件处理的方法。
本发明通过响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,目标文档包括PDF文档;向服务器发送获取页码对应的内容文件和附件资源文件的请求,以使得服务器根据请求获取页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回页码对应的内容文件和附件资源文件;接收服务器返回的页码对应的内容文件和附件资源文件;对页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面,解决了在网页中阅读PDF文件时要下载整个文件的问题,进而达到了灵活在网页中阅读PDF文件无需全文下载的效果,保证了文档的安全性,且具有较好的兼容性。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明第一实施例的文件处理的方法的流程图;
图2是根据本发明第二实施例的文件处理的方法的流程图;
图3是根据本发明第一实施例的文件处理的装置的示意图;以及
图4是根据本发明第二实施例的文件处理的装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种文件处理的方法。
图1是根据本发明第一实施例的文件处理的方法的流程图,如图1所示,该方法包括以下步骤:
步骤S101:响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,目标文档包括PDF文档;
步骤S102:向服务器发送获取页码对应的内容文件和附件资源文件的请求,以使得服务器根据请求获取页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回页码对应的内容文件和附件资源文件;
步骤S103:接收服务器返回的页码对应的内容文件和附件资源文件;
步骤S104:对页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面。
该实施例采用响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,目标文档包括PDF文档;向服务器发送获取页码对应的内容文件和附件资源文件的请求,以使得服务器根据请求获取页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回页码对应的内容文件和附件资源文件;接收服务器返回的页码对应的内容文件和附件资源文件;对页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面,解决了在网页中阅读PDF文件时要下载整个文件的问题,进而达到了灵活在网页中阅读部分PDF文件无需全文下载的效果。
在本实施例中,目标文档的查阅操作可以是用户通过点击网页上的文档图标发出的操作,也可以是点击查询按钮等发出的,用户在点击了查询按钮之后还可能通过鼠标或页面上的滚动条滚动页面,这样当前要显示的页码是文档中的任何一页,目标文档可以是PDF类型的文档,假设当前在可视区域中的页码为第5页,则向服务器发送请求,请求获取该页码对应的内容文件和附件资源文件,服务器根据请求获取该页码对应的内容文件和附件资源文件的存储路径,并根据存储路径返回对应的文件,客户端接收对应的文件之后,对页面进行渲染,得到目标页面,这样,可以仅查看文档中的一页,而无需获取整个文档的内容,无需下载整个文件,相比于相关技术中阅读PDF文件要全文下载的方式,要更灵活方便。
可选地,请求中包括请求用户对应的权限参数,权限参数用于服务器判断请求用户是否具有查阅页码对应的内容文件的资格。
在向服务器发送获取页码对应的内容文件和附件资源文件的请求中,携带有用户的权限参数,服务器根据权限参数可以判断出该用户是否具有查阅该页码对应的内容文件的资格,如果具有,则服务器根据请求获取页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回页码对应的内容文件和附件资源文件,如果不具有,则可以返回提示信息,提示当前用户不具有查阅资格。
可选地,对页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面,包括:对页码对应的内容文件进行格式转换,得到html格式的内容文件;基于html格式的内容文件和附件资源文件进行页面渲染,得到目标页面。
内容文件可以是以另一种格式存储的文件,在页面渲染时,通过对内容文件进行格式转换,即可得到html格式的文件,这样可以进行页面渲染,内容文件在存储时转换格式的目的是为了控制权限,只在用户具有查阅资格时才能够得到文件并转换格式后显示。
可选地,接收服务器返回的页码对应的内容文件和附件资源文件后,将页码对应的内容文件和附件资源文件保存于内存中。
在用户查阅了某一页之后,可以将该页码对应内容文件和附件资源文件保存在内存中。
可选地,响应于针对可视区域中当前显示页码的切换操作,将当前显示页码对应的内容文件和附件资源文件从内存中清除。
如果用户切换页码,则重新获取新的页码对应的内容文件和附件资源文件显示,并将原来的页码对应的内容文件和附件资源文件从内存中删掉,以节约内存。
可选地,样式文件包括css样式文件,对json格式的对应页面的内容文件进行格式转换,得到html格式的内容文件。除了json格式以外,也可以是其他类型的无法被浏览器直接识别的格式。
图2是根据本发明第二实施例的文件处理的方法的流程图,如图2所示,该方法包括以下步骤:
步骤S202:响应于客户端发送的获取目标文档的目标页码对应的内容文件和附件资源文件的请求,根据请求查询目标页码对应的内容文件的存储路径和附件资源文件的存储路径;
步骤S204:根据目标页码对应的内容文件的存储路径获取页码对应的内容文件,根据页码对应的附件资源文件的路径获取页码对应的附件资源文件;
步骤S206:将获取的目标页码对应的内容文件和附件资源文件发送至客户端。
本实施例的技术方案中,服务器接收客户端发送的请求,根据请求查询目标页码对应的内容文件的存储路径和附件资源文件的存储路径,根据路径查找到对应的内容文件和附件资源文件后将文件发送给客户端,由于仅发送对应于目标页码的文件,无需将这个文档的内容全部发送到客户端,解决了在网页中阅读PDF文件时要下载整个文件的问题,进而达到了灵活在网页中阅读部分PDF文件而无需全文下载的效果。
可选地,根据请求查询目标页码对应的内容文件的存储路径和附件资源文件的存储路径之前,获取目标文档;将所述目标文档转换成html格式的内容文件和html格式的附件资源文件;将所述html格式的内容文件转换成json格式的内容文件;将所述json格式的内容文件和所述html格式的所述附件资源文件分别保存到至服务器的预定资源存储路径中。
本实施例是由服务器端执行的,服务器可以预先将PDF文件转换成html格式的内容文件和附件资源文件,再将html格式的内容文件转换成json格式的内容文件,将json格式的内容文件和附件资源文件分别保存到服务器中的预定资源路径中,这样,客户端在进行数据请求时可以通过资源路径准确找到对应的数据并返回给客户端进行页面渲染。
可选地,在将获取的目标页面对应的内容文件和附件资源文件发送至客户端之前,根据请求获取客户端对应的请求用户的权限参数;根据权限参数确定请求用户具有目标文档的内容文件的查阅权限。服务器根据客户端用户的权限参数,根据权限参数对用户的查阅权限进行判断,在有权限的情况下返回相应数据,如果用户没有查阅权限则不返回相应数据,可以返回提示信息以提示用户不具有该查阅权限。
本发明实施例还提供了一种具体实施方式。
本实施例的技术方案是通过:在服务端将PDF文档转成分页的html内容,再进一步转换成json格式,数据获取添加权限参数校验。在web端实现一个阅读器组件,获取当前在可视区域的页面数据,将服务端返回的json数据重新转成html,并填充在对应的页面中,从而实现在线预览。
因为服务端返回的仅是json数据,且添加了权限校验,用户获取数据的难度较高,即使获取到数据也仅仅是一些分块的json内容,很难拼接成完整的文档。客户端仅渲染可视区域的页面,即使用户在浏览完全部页面后通过打印页面或保存网页的方式将网页数据存到本地也只能保存可视区域的小部分页面的内容。
另外因为文档被转成html格式,只要有浏览器就可以查看,app内也可以直接通过webview预览,兼容性也比较好。
服务端:
通过pdf2htmlEX工具将PDF文档转换成包含主要内容的html以及附加的css样式文件和字体文件,再将html文件转换成json文件,将内容文件和附件资源文件分别保存在文件服务器中。
客户端阅读器:
首先获取文档基础信息,包括页数、资源路径、请求参数、校验参数等。根据资源路径和请求参数拼接出样式文件的请求地址,并动态插入到网页中;根据页数渲染对应数量的空白页面。拼接的过程可以是简单的字符串拼接,预先跟服务端协商好规则。比如资源路径是http://xxx,请求参数是文件的id(比如12),就可以按照定好的规则拼出css的路径http://xxx/res/12/style.css。
获取当前在可视区域中的页面,根据页码、请求参数和校验参数加载对应页面的数据,数据为json格式,将其转换成html内容并填充在对应的空白页面中,渲染出文档内容。
当用户滚动视窗继续阅读其他页面时,根据滚动距离重新计算当前可视页面的索引,根据接口请求对应的页面数据,并填充空白页面;对于已经请求成功的页面数据,将数据保存在浏览器内存中,不用再多次加载;对于滚动之后由可见变为不可见的页面,清空页面内容。在该过程中同时在可视页面中找到可视区域最大的页面,以它的页码作为当前页码。
阅读器还提供了一些交互按钮以提升用户体验,例如,切换页码,找到页码对应的页面,计算距离顶部的距离,然后滚动页面到相应位置实现页码定位。页面缩放,根据缩放比例,调整所有空白页面的宽高属性,对于可视页面,通过css的transform属个性设置页面内节点的scale参数。
本实施例利用PDF转html技术,将PDF文档转换成浏览器可识别的html格式,确保了良好的兼容性。
服务端通过将html内容转换成json格式并添加权限校验,用户无法方便获取html内容自行渲染网页,提升了安全性。
服务端通过将数据内容(也即html内容文件)和资源文件(附件资源文件)分开,资源文件无需鉴权且可通过cdn加速,提升了加载速度。
客户端通过分页加载数据,优先请求当前可视区域的数据,提升了渲染速度。
客户端在用户阅读过程中始终只渲染可视区域内的页面,并清空可视区域外的页面数据,使得用户无法直接保存大量页面数据,提升了安全性。
客户端合理缓存加载完的页面数据,减少了服务器的负载。
客户端提供了页码切换、页面缩放等交互按钮,提升了用户体验。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例提供了一种文件处理的装置,该装置可以用于执行本发明实施例的文件处理的方法。
图3是根据本发明第一实施例的文件处理的装置的示意图,如图3所示,该装置包括:
确定单元10,用于响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,目标文档包括PDF文档;
第一发送单元20,用于向服务器发送获取页码对应的内容文件和附件资源文件的请求,以使得服务器根据请求获取页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回页码对应的内容文件和附件资源文件;
接收单元30,用于接收服务器返回的页码对应的内容文件和附件资源文件;
渲染单元40,用于对页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面。
该装置解决了在网页中阅读PDF文件时要下载整个文件的问题,进而达到了灵活在网页中阅读部分PDF文件无需全文下载的效果。
图4是根据本发明第二实施例的文件处理的装置的示意图,如图4所示,该装置包括:
查询单元110,用于响应于客户端发送的获取目标文档的目标页码对应的内容文件和附件资源文件的请求,根据所述请求查询所述目标页码对应的内容文件的存储路径和附件资源文件的存储路径;
获取单元120,用于根据所述目标页码对应的内容文件的存储路径获取所述页码对应的内容文件,根据所述页码对应的附件资源文件的路径获取所述页码对应的附件资源文件;
第二发送单元130,用于将获取的所述目标页码对应的内容文件和附件资源文件发送至所述客户端。
该装置解决了在网页中阅读PDF文件时要下载整个文件的问题,进而达到了灵活在网页中阅读部分PDF文件无需全文下载的效果。
文件处理的装置包括处理器和存储器,上述确定单元、第一发送单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来灵活在网页中阅读PDF文件。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现文件处理的方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行文件处理的方法。
本发明实施例提供了一种设备,设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,处理器、存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,以执行上述的文件处理的方法。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,目标文档包括PDF文档;向服务器发送获取页码对应的内容文件和附件资源文件的请求,以使得服务器根据请求获取页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回页码对应的内容文件和附件资源文件;接收服务器返回的页码对应的内容文件和附件资源文件;对页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:响应于客户端发送的获取目标文档的目标页码对应的内容文件和附件资源文件的请求,根据请求查询目标页码对应的内容文件的存储路径和附件资源文件的存储路径;根据目标页码对应的内容文件的存储路径获取页码对应的内容文件,根据页码对应的附件资源文件的路径获取页码对应的附件资源文件;将获取的目标页码对应的内容文件和附件资源文件发送至客户端。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (9)

1.一种文件处理的方法,其特征在于,包括:
响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,所述目标文档包括PDF文档,所述页码为所述目标文档中的任何一页;
向服务器发送获取所述页码对应的内容文件和附件资源文件的请求,以使得所述服务器根据所述请求获取所述页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回所述页码对应的内容文件和附件资源文件,其中,所述请求中包括请求用户对应的权限参数,所述权限参数用于所述服务器判断所述请求用户是否具有查阅所述页码对应的内容文件的资格;
接收所述服务器返回的所述页码对应的内容文件和附件资源文件;
对所述页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面;
其中,对所述页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面,包括:对所述页码对应的内容文件进行格式转换,得到html格式的内容文件;基于所述html格式的内容文件和所述附件资源文件进行页面渲染,得到所述目标页面,所述页码对应的内容文件为以不同于所述html格式的另一种格式存储的文件。
2.根据权利要求1所述的方法,其特征在于,所述接收所述服务器返回的所述页码对应的内容文件和附件资源文件后,所述方法还包括:
将所述页码对应的内容文件和附件资源文件保存于内存中。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应于针对所述可视区域中当前显示页码的切换操作,将所述当前显示页码对应的内容文件和附件资源文件从内存中清除。
4.一种文件处理的方法,其特征在于,包括:
响应于客户端发送的获取目标文档的目标页码对应的内容文件和附件资源文件的请求,根据所述请求查询所述目标页码对应的内容文件的存储路径和附件资源文件的存储路径,其中,所述请求中包括所述客户端对应的请求用户对应的权限参数,所述权限参数用于判断所述请求用户是否具有查阅所述页码对应的内容文件的资格;
根据所述目标页码对应的内容文件的存储路径获取所述页码对应的内容文件,根据所述页码对应的附件资源文件的路径获取所述页码对应的附件资源文件;
将获取的所述目标页码对应的内容文件和附件资源文件发送至所述客户端,其中,所述目标页码对应的内容文件是通过对html格式的内容文件和所述附件资源文件进行页面渲染得到的,所述html格式的内容文件是通过对所述目标页码对应的内容文件进行格式转换得到的;
所述根据所述请求查询所述目标页码对应的内容文件的存储路径和附件资源文件的存储路径之前,所述方法还包括:获取所述目标文档;将所述目标文档转换成html格式的内容文件和html格式的附件资源文件;将所述html格式的内容文件转换成json格式的内容文件;将所述json格式的内容文件和所述html格式的附件资源文件分别保存至服务器的预定存储路径中。
5.根据权利要求4所述的方法,其特征在于,在将获取的所述目标页码对应的内容文件和附件资源文件发送至所述客户端之前,所述方法还包括:
根据所述请求获取所述客户端对应的请求用户的权限参数;
根据所述权限参数确定所述请求用户具有所述目标文档的内容文件的查阅权限。
6.一种文件处理的装置,其特征在于,包括:
确定单元,用于响应于针对目标文档的查阅操作,确定在网页的可视区域中待显示的页码,其中,所述目标文档包括PDF文档,所述页码为所述目标文档中的任何一页;
第一发送单元,用于向服务器发送获取所述页码对应的内容文件和附件资源文件的请求,以使得所述服务器根据所述请求获取所述页码对应的内容文件的存储路径和附件资源文件的存储路径,并根据获取的路径返回所述页码对应的内容文件和附件资源文件,其中,所述请求中包括请求用户对应的权限参数,所述权限参数用于所述服务器判断所述请求用户是否具有查阅所述页码对应的内容文件的资格;
接收单元,用于接收所述服务器返回的所述页码对应的内容文件和附件资源文件;
渲染单元,用于对所述页码对应的内容文件和附件资源文件进行页面渲染,得到目标页面;
渲染单元,还用于对所述页码对应的内容文件进行格式转换,得到html格式的内容文件;基于所述html格式的内容文件和所述附件资源文件进行页面渲染,得到所述目标页面,所述页码对应的内容文件为以不同于所述html格式的另一种格式存储的文件。
7.一种文件处理的装置,其特征在于,包括:
查询单元,用于响应于客户端发送的获取目标文档的目标页码对应的内容文件和附件资源文件的请求,根据所述请求查询所述目标页码对应的内容文件的存储路径和附件资源文件的存储路径,其中,所述请求中包括所述客户端对应的请求用户对应的权限参数,所述权限参数用于判断所述请求用户是否具有查阅所述页码对应的内容文件的资格;
获取单元,用于根据所述目标页码对应的内容文件的存储路径获取所述页码对应的内容文件,根据所述页码对应的附件资源文件的路径获取所述页码对应的附件资源文件;
第二发送单元,用于将获取的所述目标页码对应的内容文件和附件资源文件发送至所述客户端,其中,所述目标页码对应的内容文件是通过对html格式的内容文件和所述附件资源文件进行页面渲染得到的,所述html格式的内容文件是通过对所述目标页码对应的内容文件进行格式转换得到的;
查询单元,还用于获取所述目标文档;将所述目标文档转换成html格式的内容文件和html格式的附件资源文件;将所述html格式的内容文件转换成json格式的内容文件;将所述json格式的内容文件和所述html格式的附件资源文件分别保存至服务器的预定存储路径中。
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至5中任意一项所述的文件处理的方法。
9.一种计算设备,其特征在于,所述设备至少包括一个处理器,以及与所述处理器连接的至少一个存储器、总线,其中,所述处理器、所述存储器通过所述总线完成相互间的通信,所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至5中任意一项所述的文件处理的方法。
CN202010244887.4A 2020-03-31 2020-03-31 文件处理的方法和装置 Active CN111460348B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010244887.4A CN111460348B (zh) 2020-03-31 2020-03-31 文件处理的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010244887.4A CN111460348B (zh) 2020-03-31 2020-03-31 文件处理的方法和装置

Publications (2)

Publication Number Publication Date
CN111460348A CN111460348A (zh) 2020-07-28
CN111460348B true CN111460348B (zh) 2024-04-19

Family

ID=71683474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010244887.4A Active CN111460348B (zh) 2020-03-31 2020-03-31 文件处理的方法和装置

Country Status (1)

Country Link
CN (1) CN111460348B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818273A (zh) * 2021-02-05 2021-05-18 深圳市世强元件网络有限公司 Pdf文件转换为html内嵌图片的方法及计算机设备
CN112818274B (zh) * 2021-02-05 2024-03-19 深圳市世强元件网络有限公司 Pdf文件转换为分页html文件的方法及计算机设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110055314A1 (en) * 2009-09-02 2011-03-03 Facebook Inc. Page rendering for dynamic web pages
CN108509504A (zh) * 2018-03-02 2018-09-07 广州视源电子科技股份有限公司 文档在线预览方法、装置、设备、客户端及存储介质
CN109446823A (zh) * 2018-09-30 2019-03-08 天津字节跳动科技有限公司 预览文件方法、装置、电子设备和可读存储介质
CN109783752A (zh) * 2018-12-14 2019-05-21 深圳壹账通智能科技有限公司 页面加载方法及装置、电子设备和计算机可读存储介质
CN110222516A (zh) * 2019-04-26 2019-09-10 中国软件与技术服务股份有限公司 一种基于服务端编码的安全阅读方法和系统
CN110598189A (zh) * 2019-08-14 2019-12-20 中国平安财产保险股份有限公司 文档处理方法、装置、设备及可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110055314A1 (en) * 2009-09-02 2011-03-03 Facebook Inc. Page rendering for dynamic web pages
CN108509504A (zh) * 2018-03-02 2018-09-07 广州视源电子科技股份有限公司 文档在线预览方法、装置、设备、客户端及存储介质
CN109446823A (zh) * 2018-09-30 2019-03-08 天津字节跳动科技有限公司 预览文件方法、装置、电子设备和可读存储介质
CN109783752A (zh) * 2018-12-14 2019-05-21 深圳壹账通智能科技有限公司 页面加载方法及装置、电子设备和计算机可读存储介质
CN110222516A (zh) * 2019-04-26 2019-09-10 中国软件与技术服务股份有限公司 一种基于服务端编码的安全阅读方法和系统
CN110598189A (zh) * 2019-08-14 2019-12-20 中国平安财产保险股份有限公司 文档处理方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN111460348A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN106598972B (zh) 一种信息显示方法、装置及智能终端
CN110688595B (zh) 一种文件在线预览方法、装置、设备和存储介质
CN102567516B (zh) 脚本加载方法及装置
CN108717435B (zh) 网页加载方法、信息处理方法、计算机设备及存储介质
JP2019520624A (ja) ページコンポーネント動的レイアウト
EP3213192A1 (en) Page processing for mobile app
CN108717437B (zh) 搜索结果展示方法、装置及存储介质
CN104049991A (zh) 用于将网络应用转换为移动应用的方法和系统
CN106533926B (zh) 一种网页信息传播方法以及装置
CN111460348B (zh) 文件处理的方法和装置
US20120236004A1 (en) Information output apparatus and information output method and recording medium
CN112650714B (zh) 文档展示方法、装置、设备及计算机可读介质
EP4198773A1 (en) Image processing method and apparatus, and computer readable storage medium
CN113382083B (zh) 一种网页截图方法和装置
CN110941428B (zh) 一种网站创建方法和装置
CN110895481A (zh) 桌面应用的渲染方法、装置和系统
CN115495417A (zh) 内容加载方法、装置、设备、介质和程序产品
US10567472B2 (en) Manipulation of PDF files using HTML authoring tools
CN113360106B (zh) 一种网页打印方法和装置
CN108664191B (zh) 系统访问方法及装置
CN110020343B (zh) 网页编码格式的确定方法和装置
CN114756228A (zh) 页面处理方法、装置、设备及存储介质
CN115659087B (zh) 页面渲染方法、设备及存储介质
CN114595413A (zh) 网页布局方法、系统及计算机设备
CN106487861B (zh) 网络数据提供方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant