CN103064835A - 一种Pdf在线分页实时浏览方法 - Google Patents

一种Pdf在线分页实时浏览方法 Download PDF

Info

Publication number
CN103064835A
CN103064835A CN2011103189914A CN201110318991A CN103064835A CN 103064835 A CN103064835 A CN 103064835A CN 2011103189914 A CN2011103189914 A CN 2011103189914A CN 201110318991 A CN201110318991 A CN 201110318991A CN 103064835 A CN103064835 A CN 103064835A
Authority
CN
China
Prior art keywords
books
pdf
pdf form
browser
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011103189914A
Other languages
English (en)
Inventor
姜波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING CHINESEALL DIGITAL PUBLISHING Co Ltd
Original Assignee
BEIJING CHINESEALL DIGITAL PUBLISHING Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING CHINESEALL DIGITAL PUBLISHING Co Ltd filed Critical BEIJING CHINESEALL DIGITAL PUBLISHING Co Ltd
Priority to CN2011103189914A priority Critical patent/CN103064835A/zh
Publication of CN103064835A publication Critical patent/CN103064835A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种Pdf在线分页实时浏览方法,包括:建立Pdf格式的图书的数据库;对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分及解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息;将浏览器能够识别的Pdf格式的图书的每一页内容的数据信息传输到浏览器端,获得浏览器能够识别的图书的数据库;在浏览器能够识别的图书的数据库搜索所需阅读的Pdf格式图书的阅读页,获得所需阅读的Pdf格式图书的阅读页;调用浏览器端的阅读器空间,下载所需阅读的Pdf格式图书的阅读页并在浏览器的页面上显示出Pdf格式的图书的阅读页的页面信息;该方法可以提高图书在线浏览的加载速度,从而实现针对Pdf格式的图书实时进行分页在线浏览。

Description

一种Pdf在线分页实时浏览方法
技术领域
本发明涉及检索技术领域,特别是涉及一种Pdf在线分页实时浏览方法。
背景技术
对于从作者和出版社取得授权的图书,大多数为pdf电子文档,而大部分的pdf图书的文件大小最小的都有好几MB,甚至有的书达到上百MB,对于这些书要提供在线浏览,对于图书的加载速度就存在很大的问题,从互联网打开一本书pdf电子书,几乎要好几分钟到几个小时的时间,用户是不可能有这么长的耐心来等待的,因此对pdf进行在线浏览的运营几乎就不可能。
因而,目前需要本领域技术人员迫切解决的一个技术问题就是:如何找到一种新型的Pdf在线浏览方法,可以提高图书在线浏览的加载速度,从而实现针对Pdf格式的图书实时进行分页在线浏览。
发明内容
本发明所要解决的一个技术问题是提供一种Pdf在线分页实时浏览方法,该方法可以提高图书在线浏览的加载速度,从而实现针对Pdf格式的图书实时进行分页在线浏览。
为了解决上述问题,本发明公开了一种Pdf在线分页实时浏览方法,包括:
建立Pdf格式的图书的数据库;
对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分及解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息;
将浏览器能够识别的Pdf格式的图书的每一页内容的数据信息传输到浏览器端,获得浏览器能够识别的图书的数据库;
在浏览器能够识别的图书的数据库搜索所需阅读的Pdf格式图书的阅读页,获得所需阅读的Pdf格式图书的阅读页;
调用浏览器端的阅读器空间,下载所需阅读的Pdf格式图书的阅读页并在浏览器的页面上显示出Pdf格式的图书的阅读页的页面信息。
优选的,所述对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分及解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息的步骤,包括:
采用Pdf拆分工具,对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分,获得Pdf格式的图书的每一页内容的数据信息;
采用Pdf内容解析工具,Pdf格式的图书的每一页内容的数据信息进行解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息。
优选的,所述在浏览器能够识别的图书的数据库搜索所需阅读的Pdf格式图书的阅读页,获得所需阅读的Pdf格式图书的阅读页的步骤,包括:
客户端发送阅读所需阅读的Pdf格式图书的阅读页的阅读请求;
服务器端接收阅读所需阅读的Pdf格式图书的阅读页的阅读请求;
依据所需阅读的Pdf格式图书的阅读页的索引关键字搜索浏览器能够识别的图书的数据库,获得所需阅读的Pdf格式图书的阅读页。
优选的,所述索引关键字为时间范围、信息关键字、信息分类关键字及信息有效期。
与现有技术相比,本发明具有以下优点:
对Pdf格式的图书进行分页在线浏览,提高了Pdf格式的图书在线浏览的加载速度,从而实现针对Pdf格式的图书实时进行分页在线浏览。
总之,本发明提供了一种Pdf在线分页实时浏览方法,该方法可以提高图书在线浏览的加载速度,从而实现针对Pdf格式的图书实时进行分页在线浏览。
附图说明
图1是本发明一种Pdf在线分页实时浏览方法实施例的步骤流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明的核心思想之一是提供了Pdf(Portable Document Format,译为可移植文档格式,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一性能使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。Adobe公司于2009年7月13日宣布,作为电子文档长期保存格式的PDF/Archive经中国国家国家标准化管理委员会批准已成为正式的中国国家标准,并已于2009年9月1日起正式实施。PDF格式文件目前已成为数字化信息事实上的一个下业标准)在线分页实时浏览方法,包括:建立Pdf格式的图书的数据库;对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分及解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息;将浏览器能够识别的Pdf格式的图书的每一页内容的数据信息传输到浏览器端,获得浏览器能够识别的图书的数据库;在浏览器能够识别的图书的数据库搜索所需阅读的Pdf格式图书的阅读页,获得所需阅读的Pdf格式图书的阅读页;调用浏览器端的阅读器空间,下载所需阅读的Pdf格式图书的阅读页并在浏览器的页面上显示出Pdf格式的图书的阅读页的页面信息;该方法可以提高图书在线浏览的加载速度,从而实现针对Pdf格式的图书实时进行分页在线浏览。
参照图1,示出了本发明一种Pdf在线分页实时浏览方法实施例的步骤流程图,具体可以包括:
步骤101、建立Pdf格式的图书的数据库。
步骤102、对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分及解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息。
其中,所述步骤102具体可以包括:
子步骤A1、采用Pdf拆分工具,对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分,获得Pdf格式的图书的每一页内容的数据信息。
子步骤A2、采用Pdf内容解析工具,Pdf格式的图书的每一页内容的数据信息进行解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息。
步骤103、将浏览器能够识别的Pdf格式的图书的每一页内容的数据信息传输到浏览器端,获得浏览器能够识别的图书的数据库。
步骤104、在浏览器能够识别的图书的数据库搜索所需阅读的Pdf格式图书的阅读页,获得所需阅读的Pdf格式图书的阅读页。
其中,所述步骤104具体可以包括:
子步骤B1、客户端发送阅读所需阅读的Pdf格式图书的阅读页的阅读请求。
子步骤B2、服务器端接收阅读所需阅读的Pdf格式图书的阅读页的阅读请求。
子步骤B3、依据所需阅读的Pdf格式图书的阅读页的索引关键字搜索浏览器能够识别的图书的数据库,获得所需阅读的Pdf格式图书的阅读页。
其中,所述索引关键字为时间范围、信息关键字、信息分类关键字及信息有效期。
步骤105、调用浏览器端的阅读器空间,下载所需阅读的Pdf格式图书的阅读页并在浏览器的页面上显示出Pdf格式的图书的阅读页的页面信息。
总之,本发明提供了一种Pdf在线分页实时浏览方法,该方法可以提高图书在线浏览的加载速度,从而实现针对Pdf格式的图书实时进行分页在线浏览。
以上对本发明所提供的一种Pdf在线分页实时浏览方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种Pdf在线分页实时浏览方法,其特征在于,包括:
建立Pdf格式的图书的数据库;
对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分及解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息;
将浏览器能够识别的Pdf格式的图书的每一页内容的数据信息传输到浏览器端,获得浏览器能够识别的图书的数据库;
在浏览器能够识别的图书的数据库搜索所需阅读的Pdf格式图书的阅读页,获得所需阅读的Pdf格式图书的阅读页;
调用浏览器端的阅读器空间,下载所需阅读的Pdf格式图书的阅读页并在浏览器的页面上显示出Pdf格式的图书的阅读页的页面信息。
2.根据权利要求1所述的方法,其特征在于,所述对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分及解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息的步骤,包括:
采用Pdf拆分工具,对Pdf格式的图书的数据库中的Pdf格式的图书进行拆分,获得Pdf格式的图书的每一页内容的数据信息;
采用Pdf内容解析工具,Pdf格式的图书的每一页内容的数据信息进行解析,获得浏览器能够识别的Pdf格式的图书的每一页内容的数据信息。
3.根据权利要求1所述的方法,其特征在于,所述在浏览器能够识别的图书的数据库搜索所需阅读的Pdf格式图书的阅读页,获得所需阅读的Pdf格式图书的阅读页的步骤,包括:
客户端发送阅读所需阅读的Pdf格式图书的阅读页的阅读请求;
服务器端接收阅读所需阅读的Pdf格式图书的阅读页的阅读请求;
依据所需阅读的Pdf格式图书的阅读页的索引关键字搜索浏览器能够识别的图书的数据库,获得所需阅读的Pdf格式图书的阅读页。
4.根据权利要求1所述的方法,其特征在于:
所述索引关键字为时间范围、信息关键字、信息分类关键字及信息有效期。
CN2011103189914A 2011-10-19 2011-10-19 一种Pdf在线分页实时浏览方法 Pending CN103064835A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103189914A CN103064835A (zh) 2011-10-19 2011-10-19 一种Pdf在线分页实时浏览方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103189914A CN103064835A (zh) 2011-10-19 2011-10-19 一种Pdf在线分页实时浏览方法

Publications (1)

Publication Number Publication Date
CN103064835A true CN103064835A (zh) 2013-04-24

Family

ID=48107465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103189914A Pending CN103064835A (zh) 2011-10-19 2011-10-19 一种Pdf在线分页实时浏览方法

Country Status (1)

Country Link
CN (1) CN103064835A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678698A (zh) * 2013-12-27 2014-03-26 福建福昕软件开发股份有限公司北京分公司 一种提高pdf文档在线浏览加载速度的方法及其装置
CN107741839A (zh) * 2016-10-13 2018-02-27 腾讯科技(深圳)有限公司 一种基于文本阅读器的文本显示方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101375268A (zh) * 2006-01-27 2009-02-25 Unz.Org有限责任公司 在网络上呈现数字化内容
CN101425089A (zh) * 2008-11-13 2009-05-06 北京中文在线教育科技发展有限公司 用于在线电子图书的加载方法和检索方法
CN101996194A (zh) * 2009-08-14 2011-03-30 北京大学 电子文件在线浏览方法和系统
CN102012894A (zh) * 2010-11-19 2011-04-13 百度在线网络技术(北京)有限公司 一种终端文档显示方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101375268A (zh) * 2006-01-27 2009-02-25 Unz.Org有限责任公司 在网络上呈现数字化内容
CN101425089A (zh) * 2008-11-13 2009-05-06 北京中文在线教育科技发展有限公司 用于在线电子图书的加载方法和检索方法
CN101996194A (zh) * 2009-08-14 2011-03-30 北京大学 电子文件在线浏览方法和系统
CN102012894A (zh) * 2010-11-19 2011-04-13 百度在线网络技术(北京)有限公司 一种终端文档显示方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678698A (zh) * 2013-12-27 2014-03-26 福建福昕软件开发股份有限公司北京分公司 一种提高pdf文档在线浏览加载速度的方法及其装置
WO2015096188A1 (zh) * 2013-12-27 2015-07-02 福建福昕软件开发股份有限公司北京分公司 一种提高pdf文档在线浏览加载速度的方法及其装置
CN107741839A (zh) * 2016-10-13 2018-02-27 腾讯科技(深圳)有限公司 一种基于文本阅读器的文本显示方法和装置
CN107741839B (zh) * 2016-10-13 2019-07-19 腾讯科技(深圳)有限公司 一种基于文本阅读器的文本显示方法和装置

Similar Documents

Publication Publication Date Title
WO2020253389A1 (zh) 页面转译方法、装置、介质及电子设备
US9336202B2 (en) Method and system relating to salient content extraction for electronic content
CN103389969B (zh) 一种用于移动终端预览pdf文件的方法、装置和系统
US11599591B2 (en) System and method for updating a search index
CN108021598B (zh) 页面抽取模板匹配方法、装置及服务器
WO2016000507A1 (zh) 省流量模式搜索服务的方法、服务器、客户端和系统
CN108572990A (zh) 信息推送方法和装置
WO2015081848A1 (zh) 社交化扩展搜索方法及相应的装置、系统
CN101477527A (zh) 一种检索多媒体资源的方法及装置
US20200204688A1 (en) Picture book sharing method and apparatus and system using the same
CN103064839A (zh) 一种Pdf全文在线检索方法
CN105095236A (zh) 广告过滤方法和装置
CN106649585A (zh) 一种检索的方法及装置
US20140129490A1 (en) Image url-based junk detection
US9984161B2 (en) Accounting for authorship in a web log search engine
CN103064835A (zh) 一种Pdf在线分页实时浏览方法
CN104978325A (zh) 一种网页处理方法、装置及用户终端
US20090182759A1 (en) Extracting entities from a web page
CN105095450A (zh) 一种用于确定用户移动互联网访问兴趣点的方法
JP5963310B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
CN102664959B (zh) 一种移动平台无线中间件
CN104978338A (zh) 一种针对视频格式的网络爬虫提取url并索引及与关键帧映射的框架
CN107220362A (zh) 一种针对网络文档的网络爬虫提取url并索引及与关键词映射的框架
CN104598482A (zh) 基于深度优先搜索策略更新图书信息的方法
CN102402763A (zh) 用于文档服务网站的广告投放方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130424