CN101425089A - 用于在线电子图书的加载方法和检索方法 - Google Patents

用于在线电子图书的加载方法和检索方法 Download PDF

Info

Publication number
CN101425089A
CN101425089A CNA2008102265213A CN200810226521A CN101425089A CN 101425089 A CN101425089 A CN 101425089A CN A2008102265213 A CNA2008102265213 A CN A2008102265213A CN 200810226521 A CN200810226521 A CN 200810226521A CN 101425089 A CN101425089 A CN 101425089A
Authority
CN
China
Prior art keywords
books
file
page
pages
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008102265213A
Other languages
English (en)
Inventor
王大刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING CHINESEALL EDUCATION TECHNOLOGY DEVELOPMENT Co Ltd
Original Assignee
BEIJING CHINESEALL EDUCATION TECHNOLOGY DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING CHINESEALL EDUCATION TECHNOLOGY DEVELOPMENT Co Ltd filed Critical BEIJING CHINESEALL EDUCATION TECHNOLOGY DEVELOPMENT Co Ltd
Priority to CNA2008102265213A priority Critical patent/CN101425089A/zh
Publication of CN101425089A publication Critical patent/CN101425089A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种在线电子图书加载方法,包括:在线提供关于图书的链接,以接收用户对图书的选择;向用户提供对应于图书的起始页的一个电子文件,并提供关联到图书的特定页的链接;接收用户通过链接对特定页的选择;向用户提供对应于所选特定页的一个电子文件,并提供关联到图书的特定页的链接;其中,每个电子文件分别对应于图书的一页。本发明还提供了一种在线电子图书检索方法,包括:接收用户输入的关键词;利用关键词对电子书库的索引文件进行检索,其中,索引文件的索引针对电子书库的所有图书的所有电子文件所建立,每个电子文件分别对应于图书的一页;向用户提供检索结果,检索结果链接到关键词对应的图书中的页面所对应的电子文件。

Description

用于在线电子图书的加载方法和检索方法
技术领域
本发明涉及互联网领域,具体而言,涉及一种用于在线电子图书的加载方法和检索方法。
背景技术
互联网上提供的从作者和出版社取得授权的图书,通常为PDF(Portable Document Format,便携式文件格式)文件。一本图书的电子文件通常为一个包括该图书所有页面的PDF文件,如果图书的内容比较丰富,则这类PDF文件的文件大小最小的都有好几MB,甚至有的图书的PDF文件达到上百MB。因此,从互联网加载一个例如PDF格式的PDF文件,通常要几分钟到几个小时的时间。
在实现本发明过程中,发明人发现对于这些图书要提供在线浏览,则其PDF文件的加载速度就存在很大的问题,因为用户很难有足够的耐心等待几分钟到几个小时的时间来加载一个PDF文件。因此,目前对图书的PDF文件进行在线浏览的运营面临严重困难。
发明内容
本发明旨在提供一种用于在线电子图书的加载方法和检索方法,以解决现有技术对图书的电子文件进行在线浏览时需要较长的加载时间的问题。
在本发明的实施例中,提供了一种在线电子图书加载方法,包括以下步骤:在线提供关于图书的链接,以接收用户对图书的选择;向用户提供对应于图书的起始页的一个电子文件,并提供关联到图书的特定页的链接;接收用户通过链接对特定页的选择;向用户提供对应于所选特定页的一个电子文件,并提供关联到图书的特定页的链接;其中,每个电子文件分别对应于图书的一页。
在本发明的实施例中,还提供了一种在线电子图书检索方法,包括以下步骤:接收用户输入的关键词;利用关键词对电子书库的索引文件进行检索,其中,索引文件的索引针对电子书库的所有图书的所有电子文件所建立,每个电子文件分别对应于图书的一页;向用户提供检索结果,检索结果链接到关键词对应的图书中的页面所对应的电子文件。
该在线电子图书加载方法通过采用分页浏览,即不用一次下载完一本书的内容,而是只下载一页的内容,这样下载的内容较少,下载的速度大大提高,使得用户不用等待很长的时间就可以看到图书的内容,解决了对图书的电子文件进行在线浏览时需要较长的加载时间的问题。另外,采用本检索方法可以大大减少用户检索所要等待的时间,并准确定位到所要浏览内容的所在页。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明的一个实施例的在线电子图书加载方法的流程图;
图2示出了根据本发明的一个实施例的PDF文件在线加载的效果图;
图3示出了根据本发明的一个实施例的在线电子图书检索方法的流程图;
图4示出了根据本发明的一个实施例的PDF文件在线检索的效果图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
图1示出了根据本发明的一个实施例的在线电子图书加载方法的流程图,包括以下步骤:
步骤S102,在线提供关于图书的链接,以接收用户对图书的选择;
步骤S104,向用户提供对应于图书的起始页的一个电子文件,并提供关联到图书的特定页的链接;
步骤S106,接收用户通过链接对特定页的选择;
步骤S108,向用户提供对应于所选特定页的一个电子文件,并提供关联到图书的特定页的链接;
其中,每个电子文件分别对应于图书的一页。
本实施例通过采用分页浏览,即不用一次下载完一本书的内容,而是只下载一页的内容,这样下载的内容较少,下载的速度大大提高,使得用户不用等待很长的时间就可以看到图书的内容,解决了对图书的电子文件进行在线浏览时需要较长的加载时间的问题。
可选的,在上述的加载方法中,还包括:预先将图书的每一页保存为一个电子文件。通过预先将图书的每一页保存为一个电子文件,使得每个电子文件分别对应于图书的一页。例如可以每扫描一页图书,就生成一个电子文件。
可选的,在上述的加载方法中,还包括:预先将包括图书的多个页的电子文件拆分成多个电子文件,拆分后的每个电子文件分别对应于图书的一页。通过预先将包括图书的多个页的电子文件拆分成多个电子文件,使得每个电子文件分别对应于图书的一页。电子书库中已有的电子文件是对应于图书的所有页面,则该方法只需针对这些电子文件进行拆分处理,节省了重新扫描生成每页电子文件的工作。
可选的,在上述的加载方法中,电子文件是PDF格式的电子文件。互联网上提供的从作者和出版社取得授权的图书,通常为PDF文件,通过将在线电子图书的加载方法应用于PDF文件,从而显著提高了该实施例的应用范围。
图2示出了根据本发明的一个实施例的PDF文件在线加载的效果图,通过按照页数把PDF文件拆分成一个一个小的PDF文件,即每页是一个PDF文件,用户可以通过点击上面导航栏的“上一页”、“下一页”来翻页浏览。通过测试,每页的加载速度都在10秒之内,因此,在线阅读加载速度在可接受的范围内。
上述实施例将一本书进行拆分,按照页数拆分成一个一个小的PDF文件,即每页是一个PDF文件,每次下载的时候只下载一页的内容,然后在该页面上端解析这本书有多少页,记录用户读到多少页,再通过与服务器进行交互,就可以让用户一页一页地浏览,解决了加载速度较慢的问题。
可选的,在上述的加载方法中,预先将包括图书的多个页的电子文件拆分成多个电子文件具体包括:使用iText工具(为开源工具,可以从网址http://www.lowagie.com/iText/下载)将包括图书的多个页的电子文件拆分成多个电子文件。iText工具是开源的,该工具可以很容易地免费获得,且可以由电子图书提供商进行二次开发,所以很适合应用于本实施例。
图3示出了根据本发明的一个实施例的在线电子图书检索方法的流程图,包括以下步骤:
步骤S202,接收用户输入的关键词;
步骤S204,利用关键词对电子书库的索引文件进行检索,其中,索引文件的索引针对电子书库的所有图书的所有电子文件所建立,每个电子文件分别对应于图书的一页;
步骤S206,向用户提供检索结果,检索结果链接到关键词对应的图书中的页面所对应的电子文件。
用户在线浏览时,常常需要根据所要浏览的内容进行检索,以快速定位所要浏览的内容在图书中的页码。然而,由于PDF的技术保护,在线检索很难深入到PDF文件内部进行,即使可以检索,其效率也不高,不能准确定位所要检索的内容在PDF文件的哪一页。而用户采用本检索方法对在线电子图书进行检索时,因为所以文件是针对每一页电子文件建立的,可以快速地确定所要查找的内容在图书的哪一页,解决了电子文件的全文在线检索效果不理想的问题,进而使用户可以直接打开检索到的页码进行浏览,因此,采用本检索方法可以大大减少用户检索所要等待的时间,并准确定位到所要浏览内容的所在页。
可选的,在上述的检索方法中,还包括:预先将图书的每一页保存为一个电子文件,通过预先将图书的每一页保存为一个电子文件,使得每个电子文件分别对应于图书的一页。例如可以每扫描一页图书,就生成一个电子文件。
可选的,在上述的检索方法中,还包括:预先将包括图书的多个页的电子文件拆分成多个电子文件,拆分后的每个电子文件分别对应于图书的一页。通过预先将包括图书的多个页的电子文件拆分成多个电子文件,使得每个电子文件分别对应于图书的一页。电子书库中已有的电子文件是对应于图书的所有页面,则该方法只需针对这些电子文件进行拆分处理,节省了重新扫描生成每页电子文件的工作。
可选的,在上述的检索方法中,电子文件是PDF格式的电子文件,互联网上提供的从作者和出版社取得授权的图书,通常为PDF文件,通过将在线电子图书的加载方法应用于PDF文件,从而显著提高了该实施例的应用范围;使用lucence工具(为开源工具,可以从网址http://download.csdn.net/sort/tag/lucence下载)针对电子文件建立索引文件,lucence工具是开源的,该工具可以很容易地免费获得,且可以由电子图书提供商进行二次开发,所以很适合应用于本实施例。
图4示出了根据本发明的一个实施例的PDF文件在线检索的效果图。通过预先将包括图书的多个页的PDF文件拆分成多个电子文件,使得每个电子文件分别对应于图书的一页。图中,检索的关键词是“教育”,检索结果:第一列是检索内容在PDF文件中所处的页数,第二列是检索内容附近前后的文字参考内容。根据检索得到结果,可以直接定位到该文字内容的所在页,然后点击该页的链接,就能够直接打开该页的PDF文件进行阅读,大大减少了用户检索所要浏览内容的时间。
可选的,在上述的检索方法中,预先将包括图书的多个页的电子文件拆分成多个电子文件具体包括:使用iText工具将包括图书的多个页的电子文件拆分成多个电子文件。iText工具是开源的,该工具可以很容易地免费获得,且可以由电子图书提供商进行二次开发,所以很适合应用于本实施例。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于在线电子图书的加载方法,其特征在于,包括以下步骤:
在线提供关于图书的链接,以接收用户对所述图书的选择;
向用户提供对应于所述图书的起始页的一个电子文件,
并提供关联到所述图书的特定页的链接;
接收用户通过所述链接对所述特定页的选择;
向用户提供对应于所选特定页的一个电子文件,并提供关联到所述图书的特定页的链接;
其中,每个电子文件分别对应于所述图书的一页。
2.根据权利要求1所述的加载方法,其特征在于,还包括:
预先将所述图书的每一页保存为一个电子文件。
3.根据权利要求1所述的加载方法,其特征在于,还包括:
预先将包括所述图书的多个页的电子文件拆分成多个电子文件,拆分后的每个电子文件分别对应于所述图书的一页。
4.根据权利要求1至3任一项所述的加载方法,其特征在于,所述电子文件是PDF格式的电子文件。
5.根据权利要求4所述的加载方法,其特征在于,预先将包括所述图书的多个页的电子文件拆分成多个电子文件具体包括:
使用iText工具将包括所述图书的多个页的电子文件拆分成多个电子文件。
6.一种用于在线电子图书的检索方法,其特征在于,包括以下步骤:
接收用户输入的关键词;
利用所述关键词对电子书库的索引文件进行检索,其中,所述索引文件的索引针对所述电子书库的所有图书的所有电子文件所建立,每个电子文件分别对应于图书的一页;
向用户提供检索结果,所述检索结果链接到关键词对应的图书中的页面所对应的电子文件。
7.根据权利要求6所述的检索方法,其特征在于,还包括:
预先将所述图书的每一页保存为一个电子文件。
8.根据权利要求6所述的检索方法,其特征在于,还包括:
预先将包括所述图书的多个页的电子文件拆分成多个电子文件,拆分后的每个电子文件分别对应于所述图书的一页。
9.根据权利要求6至8任一项所述的检索方法,其特征在于,所述电子文件是PDF格式的电子文件,使用lucence工具针对电子文件建立所述索引文件。
10.根据权利要求9所述的检索方法,其特征在于,预先将包括所述图书的多个页的电子文件拆分成多个电子文件具体包括:
使用iText工具将包括所述图书的多个页的电子文件拆分成多个电子文件。
CNA2008102265213A 2008-11-13 2008-11-13 用于在线电子图书的加载方法和检索方法 Pending CN101425089A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2008102265213A CN101425089A (zh) 2008-11-13 2008-11-13 用于在线电子图书的加载方法和检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008102265213A CN101425089A (zh) 2008-11-13 2008-11-13 用于在线电子图书的加载方法和检索方法

Publications (1)

Publication Number Publication Date
CN101425089A true CN101425089A (zh) 2009-05-06

Family

ID=40615702

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008102265213A Pending CN101425089A (zh) 2008-11-13 2008-11-13 用于在线电子图书的加载方法和检索方法

Country Status (1)

Country Link
CN (1) CN101425089A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045388A (zh) * 2010-11-25 2011-05-04 汉王科技股份有限公司 在线阅读装置及在线阅读方法
CN103064835A (zh) * 2011-10-19 2013-04-24 北京中文在线数字出版股份有限公司 一种Pdf在线分页实时浏览方法
CN103064839A (zh) * 2011-10-19 2013-04-24 北京中文在线数字出版股份有限公司 一种Pdf全文在线检索方法
CN104798026A (zh) * 2012-11-21 2015-07-22 微软公司 用于电子书的加书签
CN105721340A (zh) * 2014-12-05 2016-06-29 北大方正集团有限公司 一种在线阅读预加载量计算方法和装置
CN106649229A (zh) * 2015-11-04 2017-05-10 北京广联达正源兴邦科技有限公司 Pdf文件的拆分方法、pdf文件的拆分系统和终端
US9672292B2 (en) 2012-11-21 2017-06-06 Microsoft Technology Licensing, Llc Affinity-based page navigation
CN109710569A (zh) * 2018-12-26 2019-05-03 上海百事通信息技术股份有限公司 一种文件在线浏览方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045388A (zh) * 2010-11-25 2011-05-04 汉王科技股份有限公司 在线阅读装置及在线阅读方法
CN102045388B (zh) * 2010-11-25 2013-05-29 汉王科技股份有限公司 在线阅读装置及在线阅读方法
CN103064835A (zh) * 2011-10-19 2013-04-24 北京中文在线数字出版股份有限公司 一种Pdf在线分页实时浏览方法
CN103064839A (zh) * 2011-10-19 2013-04-24 北京中文在线数字出版股份有限公司 一种Pdf全文在线检索方法
CN104798026A (zh) * 2012-11-21 2015-07-22 微软公司 用于电子书的加书签
US9672292B2 (en) 2012-11-21 2017-06-06 Microsoft Technology Licensing, Llc Affinity-based page navigation
CN105721340A (zh) * 2014-12-05 2016-06-29 北大方正集团有限公司 一种在线阅读预加载量计算方法和装置
CN105721340B (zh) * 2014-12-05 2019-06-04 北大方正集团有限公司 一种在线阅读预加载量计算方法和装置
CN106649229A (zh) * 2015-11-04 2017-05-10 北京广联达正源兴邦科技有限公司 Pdf文件的拆分方法、pdf文件的拆分系统和终端
CN109710569A (zh) * 2018-12-26 2019-05-03 上海百事通信息技术股份有限公司 一种文件在线浏览方法

Similar Documents

Publication Publication Date Title
CN101425089A (zh) 用于在线电子图书的加载方法和检索方法
KR101273126B1 (ko) 검색 결과들의 재배열을 위한 시스템, 방법 및/또는 장치
CN109614504B (zh) 一种互联网电子书的管理系统及方法
US20120246139A1 (en) System and method for resume, yearbook and report generation based on webcrawling and specialized data collection
Yeung et al. Usability evaluation of Hong Kong hotel websites.
CN102831186A (zh) 一种存储及查找网页的方法及装置
JP4430598B2 (ja) 情報共有システムおよび情報共有方法
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
CN101393551B (zh) 专利全文检索的索引建立系统及方法
Trinoskey et al. Zotero: A product review
EP2181385A1 (en) Processing digitally hosted volumes
Menalled et al. Plant-provided food for carnivorous insects: a protective mutualism and its applications
CN101840401A (zh) 词典辅助查询系统及其方法
Todorov Practical aspects of journal indexing in scientific databases
KR101054830B1 (ko) 다양한 방식의 피드 사용을 지원하는 피드 사용 서비스 제공자와의 연계를 위한 피드 검색 서비스 방법 및 그 장치
Singhal et al. Computational transformation from web to Ebook archiving
Roughgarden et al. Ecological economic theory for managing ecosystem services.
Hamouda et al. Improving the Performance of Arabic Information Retrieval Systems: The Issue of Resolving Word Sense Disambiguation
Bömeke The Engineering Subject Gateway (ViFaTec) and Biotech: virtual developments in biotechnology
EP1415243B1 (en) Dynamic content based assisted information browsing
Krumland Communication of forest restoration by newspapers an Austrian case study.
Fagan Search Engines for Tomorrow's Scholars, Part Two
Jayasuriya HIV law and law reform in Asia and the Pacific.
Joshi et al. Scanning electron microscopical features of experimental canine parvoviral enteritis.
Curran Get Organized! Part 1: Where is that URL?

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20090506