CN106021307A - 一种针对电子文档进行定位的系统、设备、装置及方法 - Google Patents

一种针对电子文档进行定位的系统、设备、装置及方法 Download PDF

Info

Publication number
CN106021307A
CN106021307A CN201610292109.6A CN201610292109A CN106021307A CN 106021307 A CN106021307 A CN 106021307A CN 201610292109 A CN201610292109 A CN 201610292109A CN 106021307 A CN106021307 A CN 106021307A
Authority
CN
China
Prior art keywords
positioning
set position
content
electronic document
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610292109.6A
Other languages
English (en)
Other versions
CN106021307B (zh
Inventor
李赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Alibaba Literature Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Alibaba Literature Information Technology Co Ltd filed Critical Guangzhou Alibaba Literature Information Technology Co Ltd
Priority to CN201610292109.6A priority Critical patent/CN106021307B/zh
Publication of CN106021307A publication Critical patent/CN106021307A/zh
Application granted granted Critical
Publication of CN106021307B publication Critical patent/CN106021307B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开一种针对电子文档进行定位的系统、设备、装置及方法。该系统包括:服务器设备,用于响应于客户端设备的携带设定位置内容的电子文档标识的查询请求,获取根据设定位置内容的电子文档标识查找到的设定位置内容的定位预处理信息,并发送给客户端设备;客户端设备,用于接收服务器设备返回的设定位置内容的定位预处理信息,根据设定位置内容的电子文档参数标识从定位预处理信息中查找得到设定位置内容的局部定位信息,根据设定位置内容的局部定位信息及设定位置内容在其所属内容部分的相对定位参数,确定设定位置内容在电子文档中的定位结果。本发明提供的方案,能比较方便和准确地对电子文档的内容进行定位。

Description

一种针对电子文档进行定位的系统、设备、装置及方法
技术领域
本发明涉及移动互联网技术领域,具体涉及一种针对电子文档进行定位的系统、设备、装置及方法。
背景技术
目前,在一些电子文档应用中,存在一些与位置定位相关的需求,例如需记录或显示当前阅读位置占整个文档的百分比或当前阅读位置的页码,又例如需要通过指定百分比或页码跳转到文档中新的阅读位置等。处理上述需求时,需考虑不同类型的电子文档在版面文档格式方面的不同特点。例如,以PDF(Portable Document Format,便携式文档格式)为代表的固定版面电子文档,按照预定义版面分页存储,使得内容以版式页为单位相互独立,即展示任意一个页时通常只需要对当前页的内容描述进行解析和展示,没有必要按照先后顺序逐页处理。以ePub(Electronic Publication,电子出版)为代表的非固定版面电子文档,支持使用多个Xhtml(Extensible HyperText MarkupLanguage,可扩展超文本标记语言)文件表示文档内容的不同内容部分,并通过包文件及目录索引等确定各内容部分展示的先后顺序及目录树。一般情况下,可以将不同的章节内容制作为各自独立的Xhtml文件,各文件的解析、排版、展现过程可以相互独立。
因此,对于包含多个内容部分的非固定版面电子文档而言,没有解析过的内容部分对于占整个文档的百分比或页码是未知状态,如果要记录或显示当前阅读位置占整个文档的百分比或当前阅读位置在整个文档的页码则会存在一些困难。目前,在未解析全部内容部分的情况下,通常的做法是对不同内容部分进行估算,例如因为不知道章节大小,假定n个内容部分,那么每个内容部分通常只能视为各占1/n,但此类方法在章节内容大小、内容类型差别较大时准确程度较差。
因此,现有技术处理针对包含多个内容部分的非固定版面电子文档的定位需求的方法仍有待改进。
发明内容
为解决上述技术问题,本发明提供一种针对电子文档进行定位的系统、设备、装置及方法,能比较方便和准确地对电子文档的内容进行定位。
根据本发明的一个方面,提供一种针对电子文档进行定位的系统,包括:
服务器设备,用于响应于客户端设备的携带设定位置内容的电子文档标识的查询请求,获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,将所述设定位置内容的定位预处理信息发送给所述客户端设备,其中所述电子文档为非固定版面格式电子文档;
客户端设备,用于向服务器设备发送携带设定位置内容的电子文档标识的查询请求,接收所述服务器设备返回的所述设定位置内容的定位预处理信息,根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
根据本发明的另一个方面,提供一种客户端设备,包括:存储器、触摸式显示屏和处理器,
所述存储器中存储电子文档,所述电子文档为非固定版面格式电子文档;
所述触摸式显示屏显示所述存储器中存储的所述电子文档,及显示设定位置内容在所述电子文档中的定位结果;
所述处理器,获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果并发送给所述触摸式显示屏显示,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
可选的,所述处理器在根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
根据本发明的另一个方面,提供一种服务器设备,包括:存储器和处理器,
所述存储器存储电子文档的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
所述处理器响应于客户端的携带设定位置内容的电子文档标识的查询请求,获取根据设定位置内容的电子文档标识在所述存储器查找到的所述设定位置内容的定位预处理信息,将所述设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
可选的,所述处理器在根据设定位置内容的电子文档标识查找不到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务使得由服务器设备、客户端或模拟客户端创建所述电子文档各内容部分的定位预处理信息。
根据本发明的另一个方面,提供一种针对电子文档进行定位的装置,包括:
获取模块,用于获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
查找模块,用于根据设定位置内容的电子文档参数标识从所述获取模块获取的定位预处理信息中查找得到所述设定位置内容的局部定位信息,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息;
定位模块,用于根据所述查找模块查找到的设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果。
可选的,所述装置还包括:
存储模块,用于在向服务器发送设定位置内容的电子文档标识后,接收由所述服务器根据所述电子文档标识从定位预处理信息库中查找到的定位预处理信息并存储;或者,在本地缓存所述定位预处理信息;
所述获取模块从所述存储模块获取所述定位预处理信息。
可选的,所述查找模块包括:
第一查找子模块,用于根据设定位置内容的解析参数标识从所述定位预处理信息中查找得到所述解析参数标识对应的设定位置内容的逻辑位置信息;和/或,
第二查找子模块,用于根据设定位置内容的排版参数标识从所述定位预处理信息中查找得到所述排版参数标识对应的设定位置内容的版面信息。
可选的,所述定位模块包括:
第一定位子模块,用于根据所述设定位置内容的逻辑位置信息和所述设定位置内容在其所属内容部分的相对位置偏移,确定所述设定位置内容在所述电子文档中的位置或百分比;和/或,
第二定位子模块,用于根据所述设定位置内容的版面信息和所述设定位置内容在其所属内容部分的相对页码,确定所述设定位置内容在所述电子文档中的页码。
可选的,所述装置还包括:创建模块,用于在所述查找模块根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
可选的,所述装置还包括:上传模块,用于将所述创建模块创建的所述电子文档各内容部分的定位预处理信息上传到服务器。
根据本发明的另一个方面,提供一种针对电子文档进行定位的装置,包括:
查找模块,用于响应于客户端的携带设定位置内容的电子文档标识的查询请求,根据设定位置内容的电子文档标识查找所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
下发模块,用于将所述查找模块查找的设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
可选的,所述装置还包括:存储模块,用于通过定位预处理信息库存储定位预处理信息,其中所述定位预处理信息库中的定位预处理信息由服务器本地创建存储、接收所述客户端上传后存储或服务器指定模拟客户端创建后存储;所述查找模块根据所述电子文档标识从所述存储模块的定位预处理信息库中查找所述设定位置内容的定位预处理信息。
可选的,所述装置还包括:检查及更新模块,用于接收上传的定位预处理信息进行检查,按照预定义策略进行更新合并,再存储到所述存储模块。
可选的,所述装置还包括:创建模块,用于在根据设定位置内容的电子文档标识查找不到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务使得由服务器、客户端或模拟客户端创建所述电子文档各内容部分的定位预处理信息。
根据本发明的另一个方面,提供一种针对电子文档进行定位的方法,包括:
获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息;
根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果。
可选的,所述获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息包括:
在向服务器发送设定位置内容的电子文档标识后,接收由所述服务器发送的根据所述电子文档标识从定位预处理信息库中查找到的定位预处理信息;或者,
在本地获取根据所述电子文档标识从本地缓存的定位预处理信息库中查找到的定位预处理信息。
可选的,所述根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息包括:
根据设定位置内容的解析参数标识从所述定位预处理信息中查找得到所述解析参数标识对应的设定位置内容的逻辑位置信息;和/或,
根据设定位置内容的排版参数标识从所述定位预处理信息中查找得到所述排版参数标识对应的设定位置内容的版面信息。
可选的,所述根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果包括:
根据所述设定位置内容的逻辑位置信息和所述设定位置内容在其所属内容部分的相对位置偏移,确定所述设定位置内容在所述电子文档中的位置或百分比;和/或,
根据所述设定位置内容的版面信息和所述设定位置内容在其所属内容部分的相对页码,确定所述设定位置内容在所述电子文档中的页码。
可选的,所述逻辑位置信息包括以下至少一项:所述电子文档的每个内容部分各自的逻辑位置及百分比起止值、整个电子文档的最大逻辑位置;
所述版面信息包括以下至少一项:所述电子文档的每个内容部分各自的起始页码及结束页码、各页的逻辑位置及百分比。
可选的,所述方法还包括:在根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
可选的,所述通过发起创建任务创建所述电子文档各内容部分的定位预处理信息之后还包括:向服务器上传或在本地缓存所述定位预处理信息。
可选的,所述通过发起创建任务创建所述电子文档各内容部分的定位预处理信息包括:
在遍历整个电子文档每个内容部分的过程中,记录每个内容部分各自的逻辑位置及百分比起止值、整个电子文档的最大逻辑位置;和/或,
在遍历整个电子文档每个内容部分的过程中,分别对每个内容部分进行预排版分页,记录排版分页后的总页数、每个内容部分各自的起始页码及结束页码、各页的逻辑位置及百分比。
根据本发明的另一个方面,提供一种针对电子文档进行定位的方法,包括:
响应于客户端的携带设定位置内容的电子文档标识的查询请求,根据设定位置内容的电子文档标识查找所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
将所述设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
可选的,所述根据设定位置内容的电子文档标识查找所述设定位置内容的定位预处理信息包括:根据设定位置内容的电子文档标识在定位预处理信息库存查找所述设定位置内容的定位预处理信息,其中所述定位预处理信息库中的定位预处理信息由服务器本地创建存储、接收所述客户端上传后存储或服务器指定模拟客户端创建后存储。
可选的,所述接收所述客户端上传后存储包括:直接存储所述上传的定位预处理信息,或者,将所述上传的定位预处理信息进行检查并按照预定义策略进行更新合并后存储。
可选的,所述方法还包括:在根据设定位置内容的电子文档标识查找不到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务使得由服务器、客户端或模拟客户端创建所述电子文档各内容部分的定位预处理信息。
可以发现,本发明实施例的技术方案,预先存储了电子文档的定位预处理信息,可以通过电子文档标识查找到设定位置内容例如当前阅读位置内容的定位预处理信息,再根据电子文档参数标识可以从定位预处理信息中查找到设定位置内容的局部定位信息,将这些局部定位信息结合设定位置内容在其所属内容部分的相对定位参数,就可以确定设定位置内容在整个电子文档中的定位结果,例如在整个电子文档的位置、百分比或在整个电子文档的页码等。
进一步的,本发明实施例客户端设备获取的定位预处理信息,可以是在向服务器发送设定位置内容的电子文档标识后,接收由所述服务器发送的根据所述电子文档标识从定位预处理信息库中查找到的定位预处理信息;或者,是在本地获取根据所述电子文档标识从本地缓存的定位预处理信息库中查找到的定位预处理信息。
进一步的,本发明实施例的电子文档参数标识可以包括解析参数标识和排版参数标识,那么可以根据设定位置内容的解析参数标识从所述定位预处理信息中查找得到所述解析参数标识对应的设定位置内容的逻辑位置信息;可以根据设定位置内容的排版参数标识从所述定位预处理信息中查找得到所述排版参数标识对应的设定位置内容的版面信息。
进一步的,本发明实施例可以在根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过服务器设备或客户端设备发起创建任务创建所述电子文档各内容部分的定位预处理信息。
进一步的,本发明实施例可以指定模拟客户端创建电子文档的定位预处理信息,以充分利用资源。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1是根据本发明的一个实施例的一种针对电子文档进行定位的系统的示意性方框图;
图2是根据本发明的一个实施例的一种客户端设备的示意性方框图;
图3是根据本发明的一个实施例的一种服务器设备的示意性方框图;
图4是根据本发明的一个实施例的一种针对电子文档进行定位的装置的一示意性方框图;
图5是根据本发明的一个实施例的一种针对电子文档进行定位的装置的另一示意性方框图;
图6是根据本发明的一个实施例的一种针对电子文档进行定位的装置的一示意性方框图;
图7是根据本发明的一个实施例的一种针对电子文档进行定位的装置的另一示意性方框图;
图8是根据本发明的一个实施例的一种针对电子文档进行定位的方法的示意性流程图;
图9是根据本发明的一个实施例的一种针对电子文档进行定位的方法的另一示意性流程图;
图10是根据本发明的一个实施例的一种针对电子文档进行定位的方法的另一示意性流程图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本发明提供一种针对电子文档进行定位的系统,能比较方便和准确地对电子文档的内容进行定位。
本发明技术方案针对包含多个内容部分的非固定版面格式电子文档,可以解决在电子文档客户端(例如电子书阅读软件TReader客户端)的呈现应用中,确定设定阅读位置在整个电子文档中的百分比、页码等问题,以显示电子文档的阅读进度和位置等。本发明技术方案所涉及的系统,可以包括服务器设备和客户端设备,服务器设备可以提供在线服务,支持以文档为单位存储定位预处理信息,定位预处理信息可以涉及电子文档的内容部分总数、各内容部分逻辑位置信息(例如逻辑位置、百分比起止值等),以及排版参数对应的各内容部分的版面信息(例如页码起止值、各页逻辑位置及百分比等)。对于客户端设备,例如经过认证的互联网终端存在相关定位需求时,可以通过电子文档标识从服务器设备提供的在线服务中,查询并获取所述电子文档的定位预处理信息。如果获取到定位预处理信息,则可以使用该信息中当前内容部分的逻辑位置信息确定在整个电子文档中的百分比,或者通过版面信息确定在整个电子文档中的页码;如果无法获取所述定位预处理信息,则可以进一步创建任务在后台生成所述定位预处理信息。
以下结合附图详细描述本发明技术方案。
图1是根据本发明的一个实施例的一种针对电子文档进行定位的系统的示意性方框图。
如图1所示,在一种针对电子文档进行定位的系统中,可以包括:服务器设备11和客户端设备12。
服务器设备11,用于响应于客户端设备12的携带设定位置内容的电子文档标识的查询请求,获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,将所述设定位置内容的定位预处理信息发送给所述客户端设备12,其中所述电子文档为非固定版面格式电子文档;
客户端设备12,用于向服务器设备11发送携带设定位置内容的电子文档标识的查询请求,接收所述服务器设备11返回的所述设定位置内容的定位预处理信息,根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
以下进一步对上述系统中的服务器设备和客户端设备分别进行详细介绍。
图2是根据本发明的一个实施例的一种客户端设备的示意性方框图。
如图2所示,在一种客户端设备20中,包括:存储器21、触摸式显示屏22和处理器23。
所述存储器21中存储电子文档,所述电子文档为非固定版面格式电子文档。
所述触摸式显示屏22显示所述存储器21中存储的所述电子文档,及显示设定位置内容在所述电子文档中的定位结果。
所述处理器23,获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果并发送给所述触摸式显示屏22显示,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
其中,所述处理器23在根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
图3是根据本发明的一个实施例的一种服务器设备的示意性方框图。
如图3所示,在一种服务器设备30中包括:存储器31和处理器32,
所述存储器31存储电子文档的定位预处理信息,其中所述电子文档为非固定版面格式电子文档。
所述处理器32响应于客户端的携带设定位置内容的电子文档标识的查询请求,获取根据设定位置内容的电子文档标识在所述存储器31查找到的所述设定位置内容的定位预处理信息,将所述设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
其中,所述处理器33在根据设定位置内容的电子文档标识查找不到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务使得由服务器设备、客户端或模拟客户端创建所述电子文档各内容部分的定位预处理信息。
需说明的是,上述客户端设备中的处理器,可以作为一个独立的装置结构,该独立的装置结构可以称为针对电子文档进行定位的装置,该装置可以包括多个子模块,下文中将结合图4和图5将对该装置结构进行详细说明。
还需说明的是,服务器设备中的处理器,也可以作为一个独立的装置结构,该独立的装置结构可以称为针对电子文档进行定位的装置,该装置可以包括多个子模块,下文中将结合图6和图7对该装置结构进行详细说明。
图4是根据本发明的一个实施例的一种针对电子文档进行定位的装置的一示意性方框图。
如图4所示,在一种针对电子文档进行定位的装置40中,包括:获取模块41、查找模块42、定位模块43。该针对电子文档进行定位的装置40可以位于客户端设备中。
获取模块41,用于获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档。
查找模块42,用于根据设定位置内容的电子文档参数标识从所述获取模块41获取的定位预处理信息中查找得到所述设定位置内容的局部定位信息,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
定位模块43,用于根据所述查找模块42查找到的设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果。
图5是根据本发明的一个实施例的一种针对电子文档进行定位的装置的另一示意性方框图。图5相对于图4更详细描述了该装置的结构。
如图5所示,在一种针对电子文档进行定位的装置40中,包括:获取模块41、查找模块42、定位模块43、存储模块44、创建模块45和上传模块46。
获取模块41、查找模块42、定位模块43的功能参见图4所示,此处不再赘述。
存储模块44,用于在向服务器发送设定位置内容的电子文档标识后,接收由所述服务器发送的根据所述电子文档标识从定位预处理信息库中查找到的定位预处理信息并存储;或者,在本地缓存所述定位预处理信息;所述获取模块41从所述存储模块44获取所述定位预处理信息。
其中,所述查找模块42可以包括:第一查找子模块421和/或第二查找子模块422。
第一查找子模块421,用于根据设定位置内容的解析参数标识从所述定位预处理信息中查找得到所述解析参数标识对应的设定位置内容的逻辑位置信息。
第二查找子模块422,用于根据设定位置内容的排版参数标识从所述定位预处理信息中查找得到所述排版参数标识对应的设定位置内容的版面信息。
其中,所述定位模块43可以包括:第一定位子模块431和/或第二定位子模块432。
第一定位子模块431,用于根据所述设定位置内容的逻辑位置信息和所述设定位置内容在其所属内容部分的相对位置偏移,确定所述设定位置内容在所述电子文档中的位置或百分比。
第二定位子模块432,用于根据所述设定位置内容的版面信息和所述设定位置内容在其所属内容部分的相对页码,确定所述设定位置内容在所述电子文档中的页码。
创建模块45,用于在所述查找模块42根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
上传模块46,用于将所述创建模块45创建的所述电子文档各内容部分的定位预处理信息上传到服务器。
图6是根据本发明的一个实施例的一种针对电子文档进行定位的装置的一示意性方框图。
如图6所示,在一种针对电子文档进行定位的装置60中包括:查找模块61、下发模块62。该针对电子文档进行定位的装置60可以位于服务器设备中。
查找模块61,用于响应于客户端的携带设定位置内容的电子文档标识的查询请求,根据设定位置内容的电子文档标识查找所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档。
下发模块62,用于将所述查找模块61查找的设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
图7是根据本发明的一个实施例的一种针对电子文档进行定位的装置的另一示意性方框图。图7相对于图6更详细描述了该装置的结构。
如图7所示,在一种针对电子文档进行定位的装置60中包括:查找模块61、下发模块62、存储模块63、检查及更新模块64、创建模块65。
查找模块61、下发模块62的功能参见图6所示,此处不再赘述。
存储模块63,用于通过定位预处理信息库存储定位预处理信息,其中所述定位预处理信息库中的定位预处理信息由服务器本地创建存储、接收所述客户端上传后存储或服务器指定模拟客户端创建后存储;
所述查找模块61根据所述电子文档标识从所述存储模块63的定位预处理信息库中查找所述设定位置内容的定位预处理信息。
检查及更新模块64,用于接收上传的定位预处理信息进行检查,按照预定义策略进行更新合并,再存储到所述存储模块63。
创建模块65,用于在根据设定位置内容的电子文档标识查找不到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务使得由服务器、客户端或模拟客户端创建所述电子文档各内容部分的定位预处理信息。
上述详细描述了本发明的一种针对电子文档进行定位的系统、设备及装置,以下相应介绍针对电子文档进行定位的方法。
图8是根据本发明的一个实施例的一种针对电子文档进行定位的方法的示意性流程图。图8主要是从客户端侧描述针对电子文档进行定位的方法。
如图8所示,在一种针对电子文档进行定位的方法中包括:
在步骤801中,获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档。
所说的设定位置内容,例如可以是当前阅读位置的内容,即电子文档在屏幕中当前显示的内容,如当前显示的是电子文档某章节的内容。
该步骤中,可以在客户端设备向服务器发送设定位置内容的电子文档标识后,接收由所述服务器发送的根据所述电子文档标识从定位预处理信息库中查找到的定位预处理信息;或者,
在本地获取根据所述电子文档标识从本地缓存的定位预处理信息库中查找到的定位预处理信息。
在步骤802中,根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息。
所说的设定位置内容的局部定位信息,可以是指例如设定位置内容的逻辑位置信息或设定位置内容的版面信息。因为定位预处理信息中存储的只是电子文档的每个内容部分各自的逻辑位置信息或各自的版面信息,因此这些信息只能用于局部定位,从而可以称其为局部定位信息。因此,所述局部定位信息可以指示出所述电子文档每个内容部分各自的定位信息。
该步骤中,客户端设备可以根据设定位置内容的解析参数标识从所述定位预处理信息中查找得到所述解析参数标识对应的设定位置内容的逻辑位置信息;和/或,
根据设定位置内容的排版参数标识从所述定位预处理信息中查找得到所述排版参数标识对应的设定位置内容的版面信息。
在步骤803中,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果。
所说的相对定位参数,例如可以是相对位置偏移或相对页码。
该步骤中,客户端设备可以根据所述设定位置内容的逻辑位置信息和所述设定位置内容在其所属内容部分的相对位置偏移,确定所述设定位置内容在所述电子文档中的位置或百分比;和/或,
根据所述设定位置内容的版面信息和所述设定位置内容在其所属内容部分的相对页码,确定所述设定位置内容在所述电子文档中的页码。
也就是说,电子文档设定位置在章节内的相对偏移+章节本身在全局电子文档中的起始偏移=总的偏移,其中章节内的相对偏移在阅读的时候是可以实时计算的,而章节本身在全局电子文档中的起始偏移即每一章的起始位置在整个文档中的偏移,是可以预先计算并共享在定位预处理信息中。
其中,所述逻辑位置信息包括以下至少一项:所述电子文档的每个内容部分各自的逻辑位置及百分比起止值、整个电子文档的最大逻辑位置;
所述版面信息包括以下至少一项:所述电子文档的每个内容部分各自的起始页码及结束页码、各页的逻辑位置及百分比。
从该实施例可以发现,本发明预先存储了电子文档的定位预处理信息,可以通过电子文档标识查找到设定位置内容例如当前阅读位置内容的定位预处理信息,再根据电子文档参数标识可以从定位预处理信息中查找到设定位置内容的局部定位信息,将这些局部定位信息结合设定位置内容在其所属内容部分的相对定位参数,就可以确定设定位置内容在整个电子文档中的定位结果,例如在整个电子文档的位置、百分比或在整个电子文档的页码等。
图9是根据本发明的一个实施例的一种针对电子文档进行定位的方法的另一示意性流程图;图9主要是从服务器侧描述针对电子文档进行定位的方法。
如图9所示,在一种针对电子文档进行定位的方法中,包括:
在步骤901中,响应于客户端的携带设定位置内容的电子文档标识的查询请求,根据设定位置内容的电子文档标识查找所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档。
该步骤中,服务器设备可以根据设定位置内容的电子文档标识在定位预处理信息库存查找所述设定位置内容的定位预处理信息,其中所述定位预处理信息库中的定位预处理信息由服务器本地创建存储、接收所述客户端上传后存储或服务器指定模拟客户端创建后存储。
其中,接收所述客户端上传后存储可以包括:直接存储所述上传的定位预处理信息,或者,将所述上传的定位预处理信息进行检查并按照预定义策略进行更新合并后存储。
在步骤902中,将所述设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果。
其中,所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
该步骤可由服务器设备执行,由服务器设备将所述设定位置内容的定位预处理信息发送给所述客户端。
图10是根据本发明的一个实施例的一种针对电子文档进行定位的方法的另一示意性流程图。图10相对于图8和图9更详细描述了本发明的技术方案,图10是描述了客户端设备与服务器设备交互的过程。本发明实施例的电子文档一般是指非固定版面格式电子文档。
图10是以客户端设备向服务器设备请求并获取服务器设备在线服务所返回的电子文档定位预处理信息举例说明但不局限于此,如果客户端设备之前已经缓存由服务器设备下发的电子文档定位预处理信息,则客户端设备也可以直接在本地查询获取定预处理信息。
如图10所示,在一种针对电子文档进行定位的方法中包括:
在步骤1001中,客户端设备向服务器设备发送携带设定位置内容的电子文档ID的查询请求。
本发明实施例的客户端设备,在用户阅读电子文档时,分别获取当前电子文档ID、电子文档解析参数ID(下文简称解析参数ID)、电子文档排版参数ID(下文简称排版参数ID)。当在客户端阅读电子文档需要显示当前阅读位置在整个电子文档中的位置或百分比,或者显示当前阅读位置在整个电子文档中的页码时,可以向服务器设备查询获取电子文档的定位预设信息。此时,客户端设备向服务器设备发送携带设定位置内容的电子文档ID的查询请求。需说明的是,此处是以携带电子文档ID用于查询举例说明但不局限于此,也可以同时携带电子文档ID、解析参数ID和排版参数ID。通过电子文档ID、解析参数ID和排版参数ID一起用于查询,可以更准确获取到对应的定位预处理信息。
其中,所述解析参数包括但不限于解析算法版本号等。因为不同解析算法针对同样内容在逻辑位置及百分比的计算方法上可能存在差异,因此需区分对待。其中,所述排版参数包括但不限于解析算法版本号、排版算法版本号等,因为不同解析算法及排版算法对内容解析及排版分页结果可能存在差异,因此也需区分对待。当同一电子文档,如果因为解析和排版有所不同,可能生成不同的定位预处理信息并分别存储,此时除了电子文档ID可以识别外,可以进一步通过解析参数ID和排版参数ID进行区分。
关于解析算法,例如是如何将HTML(Hyper Text MarkupLanguage,超文本标记语言)解析为文字等的算法。在不同的解析算法下,计算逻辑位置、显示效果等的方法都不一样。例如以前的解析算法不支持图片或不支持公式,而新解析算法支持,那么不同解析算法计算出来的逻辑位置等都不一样。使用解析算法版本号主要是为了区分是不是用同样算法,如果使用不同算法则分开存储。
还需说明的是,排版是依赖于解析结果的,因此如果解析算法不同,排版出来的内容也可能不同。例如原先排版算法不支持公式而现在的排版算法支持,那么原来排版排5页现在可能变排6页。但是,如果解析算法和排版算法的版本号都相同,排版参数设置也一样,那么在相同大小的设备上一般是相同的排版结果。
需说明的是,所述排版参数还可以进一步包括但不限于排版区域宽度(像素)、排版区域高度(像素)、排版方向、行间距档位、段间距档位、字号档位、字体ID等,上述参数不同时则排版分页结果可能不同。
本发明实施例的电子文档ID、解析参数ID、排版参数ID,可以是在获取所述电子文档、解析参数、排版参数后,由客户端设备按照与提供在线服务或离线服务的服务器设备所约定的生成规则,分别生成电子文档ID、解析参数ID、排版参数ID。通过这些标识符ID,可以区分不同电子文档或同一电子文档不同排版版本所对应的不同定位预处理信息,从而可以针对当前解析参数、排版参数获取到正确对应定位预处理信息。
需说明的是,所述约定的生成规则在不同客户端设备及服务器设备之间是保持一致。约定统一的生成规则主要是为了避免重复,否则两个客户端设备对不同的电子文档生成了相同的电子文档ID,就会造成混乱。以电子文档为电子书为例说明但不局限于此,例如如果不同的电子书生成了相同的电子书ID,同步就会错乱。所约定的生成规则例如可以是,生成电子书ID时可以约定用书名、作者、出版社、出版日期等一起计算MD5(Message Digest Algorithm MD5,消息摘要算法第五版)串,这样相同的书计算出来的电子书ID都相同。排版参数也是类似原理,用字体名称、字号、页面大小等一起计算MD5串,这样相同的算法计算出来的ID肯定相同。
为了提高效率,客户端设备可以缓存电子文档ID、解析参数ID、排版参数ID。但是,在解析参数、排版参数、当前电子文档变更时需要重新生成相应的ID并更新缓存。
在步骤1002中,服务器设备响应于客户端设备的查询请求,获取根据设定位置内容的电子文档ID查找到的所述设定位置内容的定位预处理信息,发送给客户端设备。
该步骤中,服务器设备可以根据设定位置内容的电子文档ID在定位预处理信息库存查找所述设定位置内容的定位预处理信息,其中所述定位预处理信息库中的定位预处理信息可以由服务器本地创建存储、接收所述客户端上传后存储或服务器指定模拟客户端创建后存储。
关于指定模拟客户端创建,是指如果服务器设备有空闲,可以模拟出一些常用的客户端(通过Android或Ios模拟器)去执行一些常用机型、常用排版参数的处理,就相当于制造一些机器人程序来阅读电子书,然后生成关于这些电子书的各内容部分的定位预处理信息,这样用户实际阅读电子书的时候,服务器设备上已经存储机器人程序阅读过并缓存的定位预处理信息,则可以直接供客户端设备使用。
本发明实施例的服务器设备可以提供在线服务,在线服务支持以单个电子文档为单位存储定预处理信息;支持客户端设备例如经过认证的互联网终端对所述定位预处理信息进行查询、创建或更新。其中,所述在线服务的服务器设备或客户端设备至少一方支持为一个电子文档生成可识别及去重的标识符ID,并且双方均支持获取并使用所述电子文档ID。其中,所述电子文档为非固定版面格式,包含多个独立的内容部分,即各内容部分在逻辑上具有先后关系,但对各内容部分的排版、解析、呈现不依赖其他内容部分。其中,所述定位预处理信息包括但不限于电子文档ID、内容部分总数、设定解析参数ID对应的逻辑位置信息(包括每个内容部分各自的逻辑位置及百分比起止值、整个电子文档的最大逻辑位置等)、设定排版参数ID对应的版面信息(每个内容部分各自的起始页码及结束页码,各页逻辑位置及百分比等)等。其中,设定解析参数ID对应的逻辑位置信息和设定排版参数ID对应的版面信息可以称为局部定位信息。
在步骤1003中,客户端设备接收服务器设备发送的设定位置内容的定位预处理信息,根据设定位置内容的解析参数ID和/或排版参数ID从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息。
该实施例中的电子文档参数ID,可以是解析参数ID或排版参数ID,因此该步骤根据设定位置内容的解析参数ID和/或排版参数ID从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,例如逻辑位置信息或版面信息等。
该步骤可以根据设定位置内容的解析参数ID从所述定位预处理信息中查找得到所述解析参数ID对应的设定位置内容的逻辑位置信息;
该步骤可以根据设定位置内容的排版参数ID从所述定位预处理信息中查找得到所述排版参数ID对应的设定位置内容的版面信息。
其中,所述逻辑位置信息可以包括以下至少一项:所述电子文档的每个内容部分各自的逻辑位置及百分比起止值、整个电子文档的最大逻辑位置;
所述版面信息可以包括以下至少一项:所述电子文档的每个内容部分各自的起始页码及结束页码、各页的逻辑位置及百分比。
也就是说,该步骤在当前定位预处理信息中查找当前解析参数ID对应的逻辑位置信息,查找当前排版ID对应的版面信息。
关于逻辑位置,在本发明实施例中可以简单理解为从整个电子文档例如整个电子书开头到某个阅读位置的总字数,通过它可以在全书中唯一确定一个位置,并且确定的百分比也是准确的。这个逻辑位置的计算方法是按照阅读内容的顺序计算累加。另外,对于图文混排的电子文档,可以为图片确定一个计算逻辑位置的规则,例如设定尺寸大的图片等效于设定个字等。或者说,针对不同类型的内容,可以定义一种规则分配逻辑单元权重,例如标题文字可以分配一个字占2个逻辑位置,正文可以分配一个字占1个逻辑位置,图片可以根据大小分配1-5个逻辑位置等,当然为了简便也可以所有图都分配一个固定的值例如5个逻辑位置。通过逻辑位置可以进行定位、计算位置等。另外,当前阅读位置内容占内容部分的百分比=当前逻辑位置/整个电子文档的总逻辑位置。
在步骤1004中,客户端设备根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果。
该步骤中,可根据所述设定位置内容的逻辑位置信息和所述设定位置内容在其所属内容部分的相对位置偏移,确定所述设定位置内容在所述电子文档中的位置或百分比;和/或,
根据所述设定位置内容的版面信息和所述设定位置内容在其所属内容部分的相对页码,确定所述设定位置内容在所述电子文档中的页码。
也就是说,在需要获取设定内容部分中设定位置在整个电子文档范围内的逻辑位置、百分比时,如果所述逻辑位置信息已被查找到则可以直接使用。然后,通过获取设定位置所在内容部分的逻辑位置、百分比的起止值,结合设定位置在内容部分中的相对位置偏移,可以确定在整个电子文档范围内的逻辑位置、百分比等;
在需要获取设定内容部分中设定位置在整个电子文档范围内的页码时,如果所述版面信息已被查找到,则通过获取设定位置所在的内容部分对应的全局起始页码,结合设定位置在所属内容部分内的相对页码,可以确定在整个电子文档范围内的页码。
在步骤1005中,客户端设备在根据设定位置内容的电子文档ID未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
该步骤中,如果所述逻辑位置信息或版面信息在使用时未被查找到,则按照客户端设备默认逻辑限制相应的功能,并可以由客户端设备后台发起创建定位预处理信息的任务。还需说明的是,所述创建任务可以由发起该任务的客户端利用后台计算资源执行,也可以申请由在线服务的服务器设备指派其它客户端、计算终端或服务执行,并在执行成功后对结果进行在线缓存。
该步骤创建定位预处理信息的具体过程可以包括:
1)分别获取当前电子文档ID、解析参数ID、排版参数ID。
2)遍历整个电子文档,分别解析每个内容部分,统计内容部分内的最大逻辑位置。
其中,对单个内容部分的解析方法可以包括:获取内容流、样式及其它依赖资源;按照内容流的先后顺序,确定可显示内容单元并分配逻辑位置权重,从0开始依次累加所述位置权重得到当前内容单元最大逻辑位置。所述可显示内容单元可以包括但不限于文字、图片、多媒体对象、路径组合、复合图元等;另外在排版呈现过程中被视为一个不可拆分整体的内容也应当视作一个内容单元。
其中,不同内容单元的界定及权重分配由所使用解析参数ID对应的的解析算法确定。例如文字按UTF16编码是每字占用一个逻辑位置的权重;不可拆分的组合数学公式可以作为一个内容单元,其逻辑位置权重需要结合字符数、公式类型等计算得出;图片可综合像素宽高、显示样式等计算逻辑位置权重;段落首尾空格、一些装饰性图元等不计算逻辑位置权重等。
3)按照先后顺序遍历每个内容部分,记录每个内容部分的逻辑位置信息,包括每个内容部分各自的逻辑位置及百分比起止值、整个电子文档的逻辑位置总和(即整个电子文档的最大逻辑位置)等。
其中,所述设定内容部分逻辑位置的起始值为所述内容部分之前所有内容部分最大逻辑位置之和,结束值为所述起始值加上所述内容部分最大逻辑位置的值;
所述整个电子文档最后一个内容部分的逻辑位置的结束值,作为整个电子文档的逻辑位置总和;
所述设定内容部分百分比的起始值及结束值,分别为所述内容部分逻辑位置起始值与结束值,分别除以所述整个电子文档逻辑位置总和。
4)遍历整个电子文档,分别对每个内容部分进行预排版分页,记录排版分页后的总页数、各页的逻辑位置等。
其中,所述对设定内容部分进行预排版分页的具体操作可以包括:根据排版参数中指定的排版区域宽高(像素)创建版式页;根据对内容流及样式、相关资源的解析结果创建可显示内容单元(包括但不限于文字、图片、多媒体对象、路径组合、复合图元等);根据排版参数(排版方向、行间距、段间距、字号、字体等)并基于排版算法依次计算每个可显示内容单元在版式页内的位置及大小;如果后续可显示内容单元位置经过可行调整均超出当前版式页允许的排版区域时,执行换页操作;换页操作包括创建新的版式页,根据排版算法分页逻辑确定换页位置,将换页位置后的可显示内容单元放置在新的页面并重新计算位置及大小,继续后续可显示内容单元的排版操作。
需说明的是,所述预排版分页操作与内容展示前执行的排版分页操作相比较,可以在不影响排版位置及大小计算结果的前提下省略与内容展示相关的操作,以加快处理速度。
还需说明的是,上述2)、3)和4的遍历过程,可以是一次遍历过程中同时执行上述不同操作,也可以各自执行一次遍历过程,本发明不加以限定。
在步骤1006中,客户端设备上传创建的电子文档的定位预处理信息。
客户端设备将所述电子文档ID、内容部分总数、解析参数ID及逻辑位置信息、排版参数ID及版面信息等上传给服务器设备。
在步骤1007中,服务器设备根据上传结果,创建、更新或合并所述上传的定位预处理信息。
需说明的是,提供在线服务或离线服务的服务器设备,可以提供错误检测、更新合并、缓存淘汰等策略,保证在线提供的定位预处理信息的正确性与稳定性。
服务器设备可以直接存储所述上传的定位预处理信息,或者,将所述上传的定位预处理信息进行检查并按照预定义策略进行更新合并后存储。其中,服务器设备可对上传的预处理信息进行校验和错误处理,并与存储的相关信息进行比对,按照预定义更新合并策略合并处理并保存。
还需说明的是,所述定位预处理信息包含但不限于逻辑信息及版面信息。如用户只需获取定内容部分中设定位置在整个电子文档范围内的逻辑位置、百分比而不需要获取在整个电子文档范围内的页码相关信息,则无需获取或创建所述版面信息。同样,如果只需获取设定内容部分中设定位置在整个电子文档范围内的页码信息而不需要计算逻辑位置、百分比等,则无需获取或创建所述逻辑信息。
上述是以客户端设备发起创建任务为例但不局限因此,服务器设备也可以发起创建任务,可通过指定电子文档ID,或者同时指定电子文档ID、解析参数ID及排版参数ID,手动或自动发起单个或批量创建所述定位预处理信息的任务,除了正常使用客户端设备,还可以使用模拟器例如模拟客户端等空闲计算资源预先生成并缓存所述定位预处理信息,从而可以减少客户端设备在初次使用时获取定位预处理信息失败的几率。
以下进一步介绍一个应用实施例,以电子书阅读软件TReader和在线服务Tservice服务器使用本发明方案为例进行说明,电子文档以电子书举例说明。
电子书阅读软件TReader作为客户端,支持对TXT(文本文件)、ePub、CHM(Compiled HTML,一种帮助文档格式的文件)等非固定版面格式电子文档的解析、排版及呈现。在Treader阅读页中,通过本发明技术方案,可以展示全书的总页数及当前正在阅读的页码信息,并且允许通过指定页码进行页面跳转等。
在线服务Tservice服务器作为服务器侧的服务提供商,可以提供在线电子书检索、下载服务。客户端的电子书阅读软件Treader可以通过访问Tservice书城将设定ID对应的电子书添加到阅读器书架,并且获取书籍目录列表。Tservice服务器对于一本电子书按照逻辑章节划分为多个TXT存储文件,分别提供不同的网络下载地址,所述网络下载地址在书籍目录列表中可以获取到。Tservice服务器还可以使用本发明方案提供关于定位预处理信息的相关在线服务,Treader可以通过Tservice服务器的在线服务查询及获取设定书籍、设定解析参数及设定排版参数所对应的定位预处理信息。
Treader客户端和Tservice服务器使用本发明方案的过程如下描述:
在设定的电子书ID的书籍加入阅读器书架后,Treader可以提前触发对该书籍的定位预处理信息的获取或生成任务,具体步骤可以如下:
(1)使用电子书ID作为参数,访问Tservice的在线服务获取定位预处理信息。
需说明的是,也可以根据当前解析参数及排版参数生成解析参数ID、排版参数ID,并同时使用解析参数ID、排版参数ID和电子书ID一起作为参数,访问Tservice的在线服务获取定位预处理信息。
(2)如果Tservice查询到定位预处理信息不存在,则Treader可以创建生成电子书定位预处理信息的任务,后台执行任务的时机可以根据客户端设备空闲程度、性能及当前正在阅读的电子书确定,也可以请求在线服务的服务器设备指派其它客户端完成。
以用户点击书架上设定的电子书ID对应的电子书为例,Treader的执行过程可以如下:
(1)Treader根据用户的阅读记录确定电子书当前正在阅读的章节、章节内的逻辑位置等;
(2)获取目标章节的内容,执行解析、排版操作,记录排版后各页起始的逻辑位置;
(3)根据阅读记录中章节内的逻辑位置查找到起始页码,渲染目标页码对应的页面;
(4)获取定位预处理信息中的版面信息,根据当前章节在全书中的起始页码,计算出当前内容在全书中的页码并正确显示。
另外,在通过界面唤起操作界面时,可以显示全局阅读百分比的滑动条。该滑动条的位置为当前阅读位置在全书中的百分比,也允许用户通过拖动滑动条跳转到新的位置。在显示上述滑动条过程中,获取定位预处理信息中的逻辑位置信息。如获取到上述信息,则可以根据当前章节在全书中的起始百分比和结束百分比,并结合当前阅读位置在章节内部的位置,计算出当前阅读位置在全书的百分比或在全书的位置。根据显示的当前阅读位置在全书的百分比或位置,可以控制滑动条游标显示到所需的新的位置。
Treader客户端利用后台任务创建的定位预处理信息也可以通过网络上传到Tservice服务器。Tservice服务器在接收到上传数据后,可以按照电子书ID、解析参数ID及排版参数ID对应存储并建立索引,也可以是只按电子书ID对应存储并建立索引。
一般而言,对于同一电子书ID在一台设备创建并生成的定位预处理信息,其他客户端可直接获取并使用。当书籍章节内容发生变更或解析算法升级后,则会生成新的定位预处理信息用于更新。因此,对于相同屏幕尺寸及其他相同排版参数,对于同一电子书ID一次创建并上传的版面信息也可以被其他参数相同的客户端直接获取并使用。通常对于主流机型在默认排版参数下的版面信息,通过在线服务直接命中的概率最大。
需说明的是,为了进一步提高效率,在服务器设备新增书籍时,可以批量触发一次定位预处理信息的任务操作,利用空闲的模拟客户端执行创建任务,针对主要解析参数ID、主流机型默认及常用配置对应的排版参数ID,预先生成定位预处理信息并缓存,这样就进一步提升客户端直接命中的概率。
可发现,通过使用发明方案,可以通过预处理方式生成电子文档的定位预处理信息,例如生成并记录电子文档的不同内容部分的逻辑位置、百分比、页码等,充分利用空余的计算资源和时间;另外对于同一文档、相同解析参数及排版参数的情况,对阅读位置及进度相关信息可以实现一次生成、多设备多次共享、在线同步的效果,可以大大减少不同客户端重复后台解析、排版分页等的开销。
上文中已经参考附图详细描述了根据本发明的技术方案。
此外,根据本发明的方法还可以实现为一种计算机程序,该计算机程序包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。或者,根据本发明的方法还可以实现为一种计算机程序产品,该计算机程序产品包括计算机可读介质,在该计算机可读介质上存储有用于执行本发明的上述方法中限定的上述功能的计算机程序。本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (27)

1.一种针对电子文档进行定位的系统,其特征在于,包括:
服务器设备,用于响应于客户端设备的携带设定位置内容的电子文档标识的查询请求,获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,将所述设定位置内容的定位预处理信息发送给所述客户端设备,其中所述电子文档为非固定版面格式电子文档;
客户端设备,用于向服务器设备发送携带设定位置内容的电子文档标识的查询请求,接收所述服务器设备返回的所述设定位置内容的定位预处理信息,根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
2.一种客户端设备,其特征在于,包括:存储器、触摸式显示屏和处理器,
所述存储器中存储电子文档,所述电子文档为非固定版面格式电子文档;
所述触摸式显示屏显示所述存储器中存储的所述电子文档,及显示设定位置内容在所述电子文档中的定位结果;
所述处理器,获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果并发送给所述触摸式显示屏显示,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
3.根据权利要求2所述的客户端设备,其特征在于:
所述处理器在根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
4.一种服务器设备,其特征在于,包括:存储器和处理器,
所述存储器存储电子文档的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
所述处理器响应于客户端的携带设定位置内容的电子文档标识的查询请求,获取根据设定位置内容的电子文档标识在所述存储器查找到的所述设定位置内容的定位预处理信息,将所述设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
5.根据权利要求4所述的服务器设备,其特征在于:
所述处理器在根据设定位置内容的电子文档标识查找不到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务使得由服务器设备、客户端或模拟客户端创建所述电子文档各内容部分的定位预处理信息。
6.一种针对电子文档进行定位的装置,其特征在于,包括:
获取模块,用于获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
查找模块,用于根据设定位置内容的电子文档参数标识从所述获取模块获取的定位预处理信息中查找得到所述设定位置内容的局部定位信息,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息;
定位模块,用于根据所述查找模块查找到的设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
存储模块,用于在向服务器发送设定位置内容的电子文档标识后,接收由所述服务器根据所述电子文档标识从定位预处理信息库中查找到的定位预处理信息并存储;或者,在本地缓存所述定位预处理信息;
所述获取模块从所述存储模块获取所述定位预处理信息。
8.根据权利要求6所述的装置,其特征在于,所述查找模块包括:
第一查找子模块,用于根据设定位置内容的解析参数标识从所述定位预处理信息中查找得到所述解析参数标识对应的设定位置内容的逻辑位置信息;和/或,
第二查找子模块,用于根据设定位置内容的排版参数标识从所述定位预处理信息中查找得到所述排版参数标识对应的设定位置内容的版面信息。
9.根据权利要求6所述的装置,其特征在于,所述定位模块包括:
第一定位子模块,用于根据所述设定位置内容的逻辑位置信息和所述设定位置内容在其所属内容部分的相对位置偏移,确定所述设定位置内容在所述电子文档中的位置或百分比;和/或,
第二定位子模块,用于根据所述设定位置内容的版面信息和所述设定位置内容在其所属内容部分的相对页码,确定所述设定位置内容在所述电子文档中的页码。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
创建模块,用于在所述查找模块根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
11.根据权利要求11所述的装置,其特征在于,所述装置还包括:
上传模块,用于将所述创建模块创建的所述电子文档各内容部分的定位预处理信息上传到服务器。
12.一种针对电子文档进行定位的装置,其特征在于,包括:
查找模块,用于响应于客户端的携带设定位置内容的电子文档标识的查询请求,根据设定位置内容的电子文档标识查找所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
下发模块,用于将所述查找模块查找的设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
存储模块,用于通过定位预处理信息库存储定位预处理信息,其中所述定位预处理信息库中的定位预处理信息由服务器本地创建存储、接收所述客户端上传后存储或服务器指定模拟客户端创建后存储;
所述查找模块根据所述电子文档标识从所述存储模块的定位预处理信息库中查找所述设定位置内容的定位预处理信息。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
检查及更新模块,用于接收上传的定位预处理信息进行检查,按照预定义策略进行更新合并,再存储到所述存储模块。
15.根据权利要求12所述的装置,其特征在于,所述装置还包括:
创建模块,用于在根据设定位置内容的电子文档标识查找不到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务使得由服务器、客户端或模拟客户端创建所述电子文档各内容部分的定位预处理信息。
16.一种针对电子文档进行定位的方法,其特征在于,包括:
获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息;
根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果。
17.根据权利要求16所述的方法,其特征在于,所述获取根据设定位置内容的电子文档标识查找到的所述设定位置内容的定位预处理信息包括:
在向服务器发送设定位置内容的电子文档标识后,接收由所述服务器发送的根据所述电子文档标识从定位预处理信息库中查找到的定位预处理信息;或者,
在本地获取根据所述电子文档标识从本地缓存的定位预处理信息库中查找到的定位预处理信息。
18.根据权利要求16所述的方法,其特征在于,所述根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息包括:
根据设定位置内容的解析参数标识从所述定位预处理信息中查找得到所述解析参数标识对应的设定位置内容的逻辑位置信息;和/或,
根据设定位置内容的排版参数标识从所述定位预处理信息中查找得到所述排版参数标识对应的设定位置内容的版面信息。
19.根据权利要求18所述的方法,其特征在于,所述根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果包括:
根据所述设定位置内容的逻辑位置信息和所述设定位置内容在其所属内容部分的相对位置偏移,确定所述设定位置内容在所述电子文档中的位置或百分比;和/或,
根据所述设定位置内容的版面信息和所述设定位置内容在其所属内容部分的相对页码,确定所述设定位置内容在所述电子文档中的页码。
20.根据权利要求19所述的方法,其特征在于:
所述逻辑位置信息包括以下至少一项:所述电子文档的每个内容部分各自的逻辑位置及百分比起止值、整个电子文档的最大逻辑位置;
所述版面信息包括以下至少一项:所述电子文档的每个内容部分各自的起始页码及结束页码、各页的逻辑位置及百分比。
21.根据权利要求16所述的方法,其特征在于,所述方法还包括:
在根据设定位置内容的电子文档标识未查找到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务创建所述电子文档各内容部分的定位预处理信息。
22.根据权利要求21所述的方法,其特征在于,所述通过发起创建任务创建所述电子文档各内容部分的定位预处理信息之后还包括:
向服务器上传或在本地缓存所述定位预处理信息。
23.根据权利要求21所述的方法,其特征在于,所述通过发起创建任务创建所述电子文档各内容部分的定位预处理信息包括:
在遍历整个电子文档每个内容部分的过程中,记录每个内容部分各自的逻辑位置及百分比起止值、整个电子文档的最大逻辑位置;和/或,
在遍历整个电子文档每个内容部分的过程中,分别对每个内容部分进行预排版分页,记录排版分页后的总页数、每个内容部分各自的起始页码及结束页码、各页的逻辑位置及百分比。
24.一种针对电子文档进行定位的方法,其特征在于,包括:
响应于客户端的携带设定位置内容的电子文档标识的查询请求,根据设定位置内容的电子文档标识查找所述设定位置内容的定位预处理信息,其中所述电子文档为非固定版面格式电子文档;
将所述设定位置内容的定位预处理信息发送给所述客户端以使所述客户端根据设定位置内容的电子文档参数标识从所述定位预处理信息中查找得到所述设定位置内容的局部定位信息,根据所述设定位置内容的局部定位信息及所述设定位置内容在其所属内容部分的相对定位参数,确定所述设定位置内容在所述电子文档中的定位结果,其中所述局部定位信息指示出所述电子文档每个内容部分各自的定位信息。
25.根据权利要求24所述的方法,其特征在于,所述根据设定位置内容的电子文档标识查找所述设定位置内容的定位预处理信息包括:
根据设定位置内容的电子文档标识在定位预处理信息库存查找所述设定位置内容的定位预处理信息,其中所述定位预处理信息库中的定位预处理信息由服务器本地创建存储、接收所述客户端上传后存储或服务器指定模拟客户端创建后存储。
26.根据权利要求25所述的方法,其特征在于,所述接收所述客户端上传后存储包括:
直接存储所述上传的定位预处理信息,或者,将所述上传的定位预处理信息进行检查并按照预定义策略进行更新合并后存储。
27.根据权利要求24所述的方法,其特征在于,所述方法还包括:
在根据设定位置内容的电子文档标识查找不到所述设定位置内容的定位预处理信息的情况下,通过发起创建任务使得由服务器、客户端或模拟客户端创建所述电子文档各内容部分的定位预处理信息。
CN201610292109.6A 2016-05-05 2016-05-05 一种针对电子文档进行定位的系统、设备、装置及方法 Active CN106021307B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610292109.6A CN106021307B (zh) 2016-05-05 2016-05-05 一种针对电子文档进行定位的系统、设备、装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610292109.6A CN106021307B (zh) 2016-05-05 2016-05-05 一种针对电子文档进行定位的系统、设备、装置及方法

Publications (2)

Publication Number Publication Date
CN106021307A true CN106021307A (zh) 2016-10-12
CN106021307B CN106021307B (zh) 2019-03-29

Family

ID=57082069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610292109.6A Active CN106021307B (zh) 2016-05-05 2016-05-05 一种针对电子文档进行定位的系统、设备、装置及方法

Country Status (1)

Country Link
CN (1) CN106021307B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189879A (zh) * 2018-09-14 2019-01-11 腾讯科技(深圳)有限公司 电子书籍显示方法及装置
CN114692577A (zh) * 2022-03-18 2022-07-01 达而观信息科技(上海)有限公司 一种用于文本文档自动化编辑的内容定位方法、系统及流程自动化机器人

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110087955A1 (en) * 2009-10-14 2011-04-14 Chi Fai Ho Computer-aided methods and systems for e-books
CN103136175A (zh) * 2011-11-25 2013-06-05 上海盛轩网络科技有限公司 Epub格式读物的分页方法及系统
CN104424160A (zh) * 2013-09-11 2015-03-18 北大方正集团有限公司 文档跳转的处理系统和处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110087955A1 (en) * 2009-10-14 2011-04-14 Chi Fai Ho Computer-aided methods and systems for e-books
CN103136175A (zh) * 2011-11-25 2013-06-05 上海盛轩网络科技有限公司 Epub格式读物的分页方法及系统
CN104424160A (zh) * 2013-09-11 2015-03-18 北大方正集团有限公司 文档跳转的处理系统和处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189879A (zh) * 2018-09-14 2019-01-11 腾讯科技(深圳)有限公司 电子书籍显示方法及装置
CN114692577A (zh) * 2022-03-18 2022-07-01 达而观信息科技(上海)有限公司 一种用于文本文档自动化编辑的内容定位方法、系统及流程自动化机器人

Also Published As

Publication number Publication date
CN106021307B (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
JP6040293B2 (ja) ウェブページコンテンツの注釈
RU2659481C1 (ru) Оптимизированная для пакетной обработки архитектура визуализации и выборки
US8887089B2 (en) System and method for generating a file peek ahead user interface
US10284623B2 (en) Optimized browser rendering service
US8244755B2 (en) Search engine optimization using page anchors
US20130219255A1 (en) Authorized Syndicated Descriptions of Linked Web Content Displayed With Links in User-Generated Content
JP6606304B2 (ja) プレビューにおけるネイティブ・ドキュメントのコメントの修正
WO2016101754A1 (zh) web页面的切换方法和装置及综合页面提供装置
JP2003085087A (ja) トランスコーディングシステム、コンテンツ変換方法、アノテーションデータを格納した記録媒体及びアノテーション管理装置
US20130173655A1 (en) Selective fetching of search results
US8140471B2 (en) Framework for metadata-driven dynamic reporting systems and methods
US9141867B1 (en) Determining word segment boundaries
US20140195888A1 (en) Tagging autofill field entries
CN106021307B (zh) 一种针对电子文档进行定位的系统、设备、装置及方法
CN107451163B (zh) 一种动画显示方法和装置
CN111597102A (zh) 一种页面性能的测试方法、终端及存储介质
WO2020013724A1 (ru) Способ управления данными веб-сайта
US9258311B2 (en) Virtual federation of remote portals
JP2018160264A (ja) バッチ最適化レンダリング及びフェッチアーキテクチャ
US10140278B2 (en) Computer-implemented methods and systems for associating files with cells of a collaborative spreadsheet
US10545630B2 (en) Rule builder for data processing
US9256644B1 (en) System for identifying and investigating shared and derived content
US10380167B1 (en) Multi-volume content mapping
US11354379B2 (en) Display control method and display control apparatus
US20140258835A1 (en) System and method to download images from a website

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200710

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping radio square B tower 13 floor 03 unit self

Patentee before: GUANGZHOU ALIBABA LITERATURE INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right