CN116186438B

CN116186438B - 版式文档浏览方法及系统

Info

Publication number: CN116186438B
Application number: CN202310071850.XA
Authority: CN
Inventors: 赵岳; 刘明; 应志红; 刘文彬
Original assignee: Beijing Thunisoft Information Technology Co ltd
Current assignee: Beijing Thunisoft Information Technology Co ltd
Priority date: 2023-01-13
Filing date: 2023-01-13
Publication date: 2023-09-05
Anticipated expiration: 2043-01-13
Also published as: CN116186438A

Abstract

本申请公开了一种版式文档浏览方法及系统，用以解决连续浏览多个版式文档对存储资源造成浪费的技术问题。其中，一种版式文档浏览方案，通过在线加载多个版式文档以减轻存储资源造成的浪费。通过根据浏览对象的浏览权限，提供匹配的多个版式文档，以便不同浏览权限的浏览对象进行浏览，提高了访问的安全性。通过对版式文档进行分组加载，提高了加载效率。

Description

版式文档浏览方法及系统

技术领域

本申请涉及数字文本技术领域，尤其涉及一种版式文档浏览方法及系统。

背景技术

版式文档是版面呈现效果固定的电子文件。版式文档的呈现与设备无关，在各种设备上阅读、打印或印刷时，其版面的呈现结果都是一致的。与流式文档不同，版式文档格式是版面呈现效果固定的电子文档格式，它采用一种绝对描述方式，在版式文档中明确标识了每个页面每个元素的显示位置、尺寸、样式等信息。它以坐标的方式对每一行的内容进行定义，而没有流式文档中所谓的段落、标题、表格等排版特性。

在实现现有技术的过程中，发明人发现：

在多个版式文档连续浏览的情况下，通常将多个版式文档合并为一个文档，再对该合并文档进行浏览。在多个不同浏览权限的浏览对象进行连续浏览的情况下，则需要针对不同浏览权限的浏览对象进行版式文档合并，这将生成多个不同浏览权限对应的合并文档，保存在本地副本中，对存储资源造成了严重浪费。

因此，需要提供一种新的版式文档浏览方案，用以解决连续浏览多个版式文档对存储资源造成浪费的技术问题。

发明内容

本申请实施例提供一种新的版式文档浏览方案，用以解决连续浏览多个版式文档对存储资源造成浪费的技术问题。

具体的，一种版式文档浏览方法，包括以下步骤：

获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表；

当浏览对象发起浏览请求，获取浏览对象的浏览权限；

在文档表中，确定匹配浏览对象浏览权限的第二数量版式文档，生成包括版式文档预设排列顺序、下载地址的待浏览文档表；

根据待浏览文档表中的下载地址，获取对应浏览请求的第一版式文档；

解析第一版式文档的页结构信息；

根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组；

获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档；

当浏览区域超过第一版式文档的页结构信息，确定待浏览文档表中顺位排列的第二版式文档；

根据待浏览文档表中的下载地址，获取第二版式文档；

解析第二版式文档的页结构信息；

根据第二版式文档的页结构信息，对第二版式文档进行分组，生成元素为文档页的若干文档页组；

根据浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档。

进一步的，所述第一版式文档具有浏览历史标识；

在解析第一版式文档的页结构信息之前，所述方法还包括：

获取第一版式文档的浏览历史标识；

根据浏览历史标识，在预设缓存库中进行检索，生成检索结果；

当检索结果为未缓存，解析第一版式文档的页结构信息；

对第一版式文档的页结构信息进行缓存，并更新预设缓存库中对应第一版式文档的浏览历史标识；

当检索结果为已缓存，获取已缓存的第一版式文档的页结构信息。

进一步的，所述获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档，具体包括：

获取浏览区域的浏览位置、区域尺寸；

根据浏览区域的浏览位置、区域尺寸与第一版式文档的页结构信息的映射关系，确定第一文档页组；

加载所述第一文档页组的文档信息，以展示第一版式文档。

进一步的，所述第一文档页组具有加载历史标识；

在加载所述第一文档页组的文档信息之前，所述方法还包括：

获取所述第一文档页组的加载历史标识；

根据加载历史标识，在预设缓存库中进行检索，生成检索结果；

当检索结果为未加载，加载所述第一文档页组的文档信息；

对所述第一文档页组的文档信息进行缓存，并更新预设缓存库中对应所述文档页的加载历史标识；

当检索结果为已缓存，获取已缓存的所述第一文档页组的文档信息。

进一步的，所述预设缓存库部署于本地浏览器或远端服务器。

进一步的，所述方法还包括：

在浏览区域进行文本复制时，记录复制起始相对坐标、复制结束相对坐标，构成复制区域；

当复制区域超过浏览区域，记录当前浏览页为复制起始浏览页或复制结束浏览页；

确定对应复制起始浏览页、复制结束浏览页的复制页组；

根据对应复制起始浏览页、复制结束浏览页的复制页组，确定对应复制区域的文本；

根据对应复制区域的文本，生成文本DIV标签。

进一步的，所述版式文档为OFD版式文档，所述第一数量不小于2，所述方法应用于多OFD版式文档浏览。

本申请实施例还提供一种版式文档浏览系统。

具体的，一种版式文档浏览系统，包括：

远端服务器，用于获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表；还用于当本地浏览器发起浏览请求，获取本地浏览器的浏览权限；还用于在文档表中，确定匹配本地浏览器浏览权限的第二数量版式文档，生成包括版式文档预设排列顺序、下载地址的待浏览文档表；

本地浏览器，用于根据待浏览文档表中的下载地址，获取对应浏览请求的第一版式文档；还用于解析第一版式文档的页结构信息；还用于根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组；还用于获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档；还用于当浏览区域超过第一版式文档的页结构信息，确定待浏览文档表中顺位排列的第二版式文档；还用于根据待浏览文档表中的下载地址，获取第二版式文档；还用于解析第二版式文档的页结构信息；还用于根据第二版式文档的页结构信息，对第二版式文档进行分组，生成元素为文档页的若干文档页组；还用于根据浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档。

进一步的，所述第一版式文档具有浏览历史标识；

在本地浏览器解析第一版式文档的页结构信息之前，所述本地浏览器还用于：

获取第一版式文档的浏览历史标识；

当检索结果为未缓存，解析第一版式文档的页结构信息；

进一步的，所述本地浏览器获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档，具体包括：

获取浏览区域的浏览位置、区域尺寸；

加载所述第一文档页组的文档信息，以展示第一版式文档。

本申请实施例提供的技术方案，至少具有如下有益效果：

通过在线加载多个版式文档以减轻存储资源造成的浪费。通过根据浏览对象的浏览权限，提供匹配的多个版式文档，以便不同浏览权限的浏览对象进行浏览，提高了访问的安全性。通过对版式文档进行分组加载，提高了加载效率。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例提供的一种版式文档浏览方法的流程框图；

图2为本申请实施例提供的一种版式文档浏览系统的结构示意图。

图中附图标记表示为：

100 版式文档浏览系统

11 远端服务器

12 本地浏览器

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参照图1，为解决连续浏览多个版式文档对存储资源造成浪费的技术问题，本申请提供一种版式文档浏览方法，包括以下步骤：

S110：获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表。

S120：当浏览对象发起浏览请求，获取浏览对象的浏览权限。

S130：在文档表中，确定匹配浏览对象浏览权限的第二数量版式文档，生成包括版式文档预设排列顺序、下载地址的待浏览文档表。

可以理解的是，在本申请提供的一种具体实施方式中，所述版式文档为OFD(OpenFixed-layoutDocuments)版式文档，所述第一数量不小于2，所述方法应用于多OFD版式文档浏览。

进一步的，在该实施方式中，所述版式文档存储于远端服务器。浏览对象以本地浏览器，对多个OFD版式文档进行连续浏览，从而减轻对本地存储资源造成的浪费。

具体的，多个版式文档具有预设排列顺序、下载地址，以方便浏览对象根据不同的浏览需求，选择对应浏览需求的版式文档进行在线浏览。

当然，多个版式文档均具有预设浏览权限，以便于不同浏览权限的浏览对象进行浏览。例如，存在版式文档a、b、c，浏览对象u1、u2。浏览对象u1的浏览权限与版式文档a、b的浏览权限匹配，则浏览对象u1可浏览版式文档a、b，不可浏览版式文档c。浏览对象u2的浏览权限与版式文档b、c的浏览权限匹配，则浏览对象u2可浏览版式文档b、c，不可浏览版式文档a。

远端服务器获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表，以便根据不同浏览权限的浏览对象进行组合。

当浏览对象选择初始浏览文档后，本地浏览器会向服务器发起包括初始浏览文档、浏览对象的浏览权限等信息的浏览请求。

远端服务器根据浏览对象的浏览权限，在文档表中筛选出匹配浏览对象浏览权限的第二数量版式文档，并根据版式文档预设排列顺序重新组合，生成包括版式文档预设排列顺序、下载地址的待浏览文档表，以校验浏览对象选择的初始浏览文档是否位于待浏览文档表中。

S140：根据待浏览文档表中的下载地址，获取对应浏览请求的第一版式文档。

可以理解的是，当浏览对象选择的初始浏览文档位于待浏览文档表中，则浏览对象可以使用本地浏览器，在待浏览文档表中确定对应初始浏览文档的下载地址。浏览对象以本地浏览器根据待浏览文档表中的下载地址，获取对应浏览请求的初始浏览文档，作为第一版式文档。

S150：解析第一版式文档的页结构信息。

可以理解的是，在本申请所提供的方法应用于多OFD版式文档浏览的情况下，所述第一文档表现为OFD文档格式的版式文档。具体的，OFD版式文档采用可扩展标记语言XML(ExtensibleMarkupLanguage)来描述数据和结构。

因此，本申请采用可扩展标记语言XML对第一版式文档进行解析，可以确定第一版式文档的页结构信息。

进一步的，所述第一版式文档的页结构信息至少包括：第一版式文档的页数、第一版式文档中每一页的尺寸、第一版式文档的文档ID、第一版式文档的页索引。

进一步的，考虑到不同浏览权限的浏览对象在进行连续浏览时，可能存在相同的浏览文档。也即视对应不同浏览权限浏览对象的待浏览文档表为集合，该集合中的元素为版式文档。则对应不同浏览权限浏览对象的版式文档集合，可能存在交集。为提高解析效率，所述第一版式文档具有浏览历史标识；

在解析第一版式文档的页结构信息之前，所述方法还包括：

获取第一版式文档的浏览历史标识；

当检索结果为未缓存，解析第一版式文档的页结构信息；

这样，浏览对象以本地浏览器可根据浏览历史标识，辨别已解析过的版式文档，从而调用预设缓存库中缓存的页结构信息，提高了解析效率。

进一步的，所述预设缓存库可以部署于本地浏览器或远端服务器。

当预设缓存库部署于本地浏览器，预设缓存库主要是针对单个本地浏览器的历史浏览数据缓存。当预设缓存库部署于远端服务器，预设缓存库可以与多个本地浏览器实现分布式的数据交互。比如本地浏览器A产生文档D的缓存，同步到了位于远端服务器的预设缓存库中，那么本地浏览器B在浏览文档D的时候，就不用解析文件了，可以直接在预设缓存库中获取到文档D的页结构信息。

S160：根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组。

S170：获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档。

可以理解的是，在本申请的具体应用场景中，浏览对象的连续浏览行为基于本地浏览器执行在线解析、在线加载。一旦一次性下载多个OFD版式文档，且对多个OFD版式文档进行解析、加载，这无疑会加重本地浏览器的运行负载，容易出现翻页卡顿、网页打开慢的问题。为此，本申请对第一版式文档进行分组加载。

具体的，本申请根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组。其中，所述文档页组可视为元素为文档页的集合，预设的页数范围定义所述文档页组内的页数。

根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组，在具体的应用场景中可以表现为：

从第一版式文档的第一页开始，根据预设的页数范围，对第一版式文档进行分组，生成元素为文档页的若干文档页组。

将第一版式文档分组为若干文档页组，可以有效的简化OFD版式文档结构，减轻本地浏览器的运行负载，从而解决翻页卡顿、网页打开慢的问题。举例来说，当OFD版式文档具有1000页，本申请将以10页为页数范围。从OFD版式文档的第一页开始，将OFD版式文档分为10组文档页组，生成对应文档页组的HTML标签。

之后获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档。

获取浏览区域的浏览位置、区域尺寸；

加载所述第一文档页组的文档信息，以展示第一版式文档。

可以理解的是，所述文档页记载文档信息。所述文档信息至少包括文本或图像。为减轻本地浏览器的运行负载，需要确定浏览区域对应的文档页组。此处将浏览区域对应的文档页组简称为第一文档页组。

下面介绍确定第一文档页组的实施过程：

在所述第一版式文档的页结构信息包括：第一版式文档的页数、第一版式文档中每一页的尺寸的基础上，可以计算得到第一版式文档的尺寸长度、第一版式文档中各文档页组的累计尺寸长度。

所述浏览区域包括浏览位置、区域尺寸。所述浏览区域还设置滚动条，以表征浏览区域的区域尺寸与第一版式文档的尺寸长度的比例关系。进一步的，滚动条的累计长度可以表征浏览区域相对第一版式文档的浏览位置。具体来说，所述浏览区域的浏览位置是指在第一版式文档中的第几文档页。

可以根据滚动条当前的累计滚动长度，和第一版式文档中每一页的尺寸累加进行比较，快速确定浏览区域对应的页数。

之后确定该页数对应的文档页组，即确定第一文档页组。

进而加载第一文档页组的文档信息，以展示第一版式文档。

进一步的，考虑到不同浏览权限的浏览对象在进行连续浏览时，可能存在相同的浏览文档。为提高加载效率，所述第一文档页组具有加载历史标识；

获取所述第一文档页组的加载历史标识；

当检索结果为未加载，加载所述第一文档页组的文档信息；

这样，浏览对象以本地浏览器可根据加载历史标识，辨别已加载过的文档页组，从而调用预设缓存库中缓存的文档页组，提高了加载效率。

S180：当浏览区域超过第一版式文档的页结构信息，确定待浏览文档表中顺位排列的第二版式文档。

可以理解的是，在浏览对象连续浏览多个版式文档的情况下，一旦浏览区域超过第一版式文档的页结构信息，可视为浏览对象需要浏览下个版式文档或上个版式文档。此时，需要根据浏览区域的浏览位置、区域尺寸，确定浏览对象的浏览意向。

具体的，当浏览区域的滚动条当前的累计滚动长度递减至小于第一版式文档中第一页页的尺寸，则需要在待浏览文档表中确定位于第一版式文档上一位的版式文档，作为第二版式文档。

当浏览区域的滚动条当前的累计滚动长度递增至大于第一版式文档的尺寸长度，则需要在待浏览文档表中确定位于第一版式文档下一位的版式文档，作为第二版式文档。

S190：根据待浏览文档表中的下载地址，获取第二版式文档。

S200：解析第二版式文档的页结构信息。

S210：根据第二版式文档的页结构信息，对第二版式文档进行分组，生成元素为文档页的若干文档页组。

S220：根据浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档。

同理，浏览对象以本地浏览器根据待浏览文档表中的下载地址，获取第二版式文档。

在本申请所提供的方法应用于多OFD版式文档浏览的情况下，所述第二文档表现为OFD文档格式的版式文档。可采用可扩展标记语言XML对第二版式文档进行解析，可以确定第二版式文档的页结构信息。

进一步的，所述第二版式文档的页结构信息至少包括：第二版式文档的页数、第二版式文档中每一页的尺寸、第二版式文档的文档ID、第二版式文档的页索引。

进一步的，为提高解析效率，所述第二版式文档具有浏览历史标识；

在解析第二版式文档的页结构信息之前，所述方法还包括：

获取第二版式文档的浏览历史标识；

当检索结果为未缓存，解析第二版式文档的页结构信息；

对第二版式文档的页结构信息进行缓存，并更新预设缓存库中对应第二版式文档的浏览历史标识；

当检索结果为已缓存，获取已缓存的第二版式文档的页结构信息。

进一步的，根据第二版式文档的页结构信息，对第二版式文档进行分组，生成元素为文档页的若干文档页组，在具体的应用场景中可以表现为：

从第二版式文档的第一页开始，根据预设的页数范围，对第二版式文档进行分组，生成元素为文档页的若干文档页组。

将第二版式文档分组为若干文档页组，可以有效的简化OFD版式文档结构，减轻本地浏览器的运行负载，从而解决翻页卡顿、网页打开慢的问题。

进一步的，所述获取浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档，具体包括：

获取浏览区域的浏览位置、区域尺寸；

根据浏览区域的浏览位置、区域尺寸与第二版式文档的页结构信息的映射关系，确定第二文档页组；

加载所述第二文档页组的文档信息，以展示第二版式文档。

下面介绍确定第二文档页组的实施过程：

根据滚动条当前的累计滚动长度，和第二版式文档中每一页的尺寸累加进行比较，快速确定浏览区域对应的页数。

之后确定该页数对应的文档页组，即确定第二文档页组。

进而加载第二文档页组的文档信息，以展示第二版式文档。

进一步的，为提高加载效率，所述第二文档页组具有加载历史标识；

在加载所述第二文档页组的文档信息之前，所述方法还包括：

获取所述第二文档页组的加载历史标识；

当检索结果为未加载，加载所述第二文档页组的文档信息；

对所述第二文档页组的文档信息进行缓存，并更新预设缓存库中对应所述文档页的加载历史标识；

当检索结果为已缓存，获取已缓存的所述第二文档页组的文档信息。

下面介绍，在浏览对象连续浏览多个版式文档的应用场景中，本申请所提供的版式文档浏览方法的具体实施过程：

浏览对象通过本地浏览器在线浏览多个版式文档。远端服务器获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表，以便根据不同浏览权限的浏览对象进行组合。

服务器根据浏览对象的浏览权限，在文档表中筛选出匹配浏览对象浏览权限的第二数量版式文档，并根据版式文档预设排列顺序重新组合，生成包括版式文档预设排列顺序、下载地址的待浏览文档表，以校验浏览对象选择的初始浏览文档是否位于待浏览文档表中。

当浏览对象选择的初始浏览文档位于待浏览文档表中，则浏览对象可以使用本地浏览器，在待浏览文档表中确定对应初始浏览文档的下载地址。浏览对象以本地浏览器根据待浏览文档表中的下载地址，获取对应浏览请求的初始浏览文档，作为第一版式文档。

本地浏览器解析第一版式文档的页结构信息，得到第一版式文档的页数、第一版式文档中每一页的尺寸、第一版式文档的文档ID、第一版式文档的页索引，记录到PAGES。

本地浏览器根据第一版式文档的页结构信息，对PAGES以固定的分组大小进行分组，生成若干HTML标签，以若干HTML标签对应若干文档页组。

之后动态计算文档浏览区域的高度，计算该区域内可以容纳显示的页，计算区域外前后各一页。对计算出的页，判断每一页是否命中浏览器缓存，即PAGES中是否已经包含该页详细信息。如果没有命中缓存，异步并发向服务器请求页详细信息。将解析结果中每页的图像、文字等信息，记录到PAGES中对应的页结构上。最后渲染页面，加载背景图，并初始化文字信息等。

当浏览区域超过第一版式文档的页结构信息，确定待浏览文档表中顺位排列的第二版式文档。

异步加载第二版式文档，向服务器请求第二版式文档的结构信息。将解析结果中每页的尺寸、文档ID、文档页索引记录到TEMPPAGES。

如果第二版式文档为第一版式文档的上一文档，则将TEMPPAGES整体插入到PAGES头部。

如果第二版式文档为第一版式文档的下一文档，则将TEMPPAGES整体插入到PAGES尾部。

重新对PAGES分组并生成HTML标签，并更新当前文档的分组索引。

之后重复上述步骤，以展示第二版式文档。

进一步的，考虑到在浏览对象连续浏览多个版式文档的情况下，存在浏览对象连续复制多个版式文档中文本的情况，而现有技术中如果对多个版式文档进行合并后再复制，容易产生本地副本，对存储资源造成了严重浪费。如果不对多个版式文档进行合并，而是在线编辑，由于存在多人编辑的情况，复制操作容易受他人编辑不同步影响，造成复制失败的情况。例如在法院电子卷宗的应用场景，庭审材料都是按页进行存储，且随案生成。在办案过程中会不断产生新的文件，也会对文件进行删除，因此不能频繁进行合并和修改。频繁变化可能存在多人浏览不同步以及并发合并删除同步的问题。

为解决连续复制多个版式文档失败率高的技术问题，所述方法还包括：

确定对应复制起始浏览页、复制结束浏览页的复制页组；

根据对应复制区域的文本，生成文本DIV标签。

具体的，在浏览区域开始复制文字时，记录复制起始相对坐标(sx，sy)，复制结束相对坐标(x,y)，构成复制区域。

如果不存在跨页或文档的情况，则记录当前页page。

根据当前页page的页结构信息、文档信息，确定处于复制区域的文字。

创建空白DIV标签，记录所述文本，并设置文本选中样式。

如果存在跨页/文档的情况，则将浏览区域覆盖的文本范围设置为当前页page的右下角坐标，记录为一组复制起始相对坐标(sx，sy)，复制结束相对坐标(x,y)。

重置复制起始相对坐标(sx,sy)为下一页的左上角的坐标，更新当前页page为下一页。

重复上述步骤，直至记录完对应复制复制区域的复制页组。

根据复制页组的页结构信息、文档信息，确定处于复制区域的文本，生成相应的文本DIV标签。

在完成复制操作后，清除文字选中状态，销毁全部文字DIV标签。

综上所述，本申请提供的版式文档浏览方法，通过在线加载多个版式文档以减轻存储资源造成的浪费。通过根据浏览对象的浏览权限，提供匹配的多个版式文档，以便不同浏览权限的浏览对象进行浏览，提高了访问的安全性。通过对版式文档进行分组加载，提高了加载效率。

请参照图2，为支持版式文档浏览方法，本申请还提供一种版式文档浏览系统100，包括：

远端服务器11，用于获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表；还用于当本地浏览器发起浏览请求，获取本地浏览器的浏览权限；还用于在文档表中，确定匹配本地浏览器浏览权限的第二数量版式文档，生成包括版式文档预设排列顺序、下载地址的待浏览文档表；

本地浏览器12，用于根据待浏览文档表中的下载地址，获取对应浏览请求的第一版式文档；还用于解析第一版式文档的页结构信息；还用于根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组；还用于获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档；还用于当浏览区域超过第一版式文档的页结构信息，确定待浏览文档表中顺位排列的第二版式文档；还用于根据待浏览文档表中的下载地址，获取第二版式文档；还用于解析第二版式文档的页结构信息；还用于根据第二版式文档的页结构信息，对第二版式文档进行分组，生成元素为文档页的若干文档页组；还用于根据浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档。

具体的，远端服务器11获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表。

当本地浏览器12发起浏览请求，远端服务器11获取本地浏览器12的浏览权限。

在文档表中，远端服务器11确定匹配本地浏览器12浏览权限的第二数量版式文档，生成包括版式文档预设排列顺序、下载地址的待浏览文档表。

可以理解的是，在本申请提供的一种具体实施方式中，所述版式文档为OFD版式文档，所述第一数量不小于2，所述版式文档浏览系统100应用于多OFD版式文档浏览。

进一步的，在该实施方式中，所述版式文档存储于远端服务器11，由本地浏览器12在线对多个OFD版式文档进行连续浏览，从而减轻对本地存储资源造成的浪费。

具体的，多个版式文档具有预设排列顺序、下载地址，以方便本地浏览器12根据不同的浏览需求，选择对应浏览需求的版式文档进行在线浏览。

当然，多个版式文档均具有预设浏览权限，以便于不同浏览权限的本地浏览器12进行浏览。例如，存在版式文档a、b、c，本地浏览器u1、u2。本地浏览器u1的浏览权限与版式文档a、b的浏览权限匹配，则本地浏览器u1可浏览版式文档a、b，不可浏览版式文档c。本地浏览器u2的浏览权限与版式文档b、c的浏览权限匹配，则本地浏览器u2可浏览版式文档b、c，不可浏览版式文档a。

远端服务器11获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表，以便根据不同浏览权限的本地浏览器12进行组合。

当本地浏览器12选择初始浏览文档后，会向远端服务器11发起包括初始浏览文档、本地浏览器12的浏览权限等信息的浏览请求。

远端服务器11根据本地浏览器12的浏览权限，在文档表中筛选出匹配本地浏览器12浏览权限的第二数量版式文档，并根据版式文档预设排列顺序重新组合，生成包括版式文档预设排列顺序、下载地址的待浏览文档表，以校验本地浏览器12选择的初始浏览文档是否位于待浏览文档表中。

本地浏览器12根据待浏览文档表中的下载地址，获取对应浏览请求的第一版式文档。

可以理解的是，当本地浏览器12选择的初始浏览文档位于待浏览文档表中，则本地浏览器12可以在待浏览文档表中确定对应初始浏览文档的下载地址。本地浏览器12根据待浏览文档表中的下载地址，获取对应浏览请求的初始浏览文档，作为第一版式文档。

本地浏览器12解析第一版式文档的页结构信息。

可以理解的是，在本申请所提供的系统100应用于多OFD版式文档浏览的情况下，所述第一文档表现为OFD文档格式的版式文档。具体的，OFD版式文档采用可扩展标记语言XML来描述数据和结构。

因此，本地浏览器12采用可扩展标记语言XML对第一版式文档进行解析，可以确定第一版式文档的页结构信息。

进一步的，考虑到不同浏览权限的本地浏览器12在进行连续浏览时，可能存在相同的浏览文档。也即视对应不同浏览权限本地浏览器12的待浏览文档表为集合，该集合中的元素为版式文档。则对应不同浏览权限本地浏览器12的版式文档集合，可能存在交集。为提高解析效率，所述第一版式文档具有浏览历史标识；

在解析第一版式文档的页结构信息之前，所述本地浏览器12还用于：

获取第一版式文档的浏览历史标识；

当检索结果为未缓存，解析第一版式文档的页结构信息；

这样，本地浏览器12可根据浏览历史标识，辨别已解析过的版式文档，从而调用预设缓存库中缓存的页结构信息，提高了解析效率。

当然，所述预设缓存库可以部署于本地浏览器12或远端服务器11。

当预设缓存库部署于本地浏览器12，预设缓存库主要是针对单个本地浏览器12的历史浏览数据缓存。当预设缓存库部署于远端服务器11，预设缓存库可以与多个本地浏览器12实现分布式的数据交互。比如本地浏览器A产生文档D的缓存，同步到了位于远端服务器11的预设缓存库中，那么本地浏览器B在浏览文档D的时候，就不用解析文件了，可以直接在预设缓存库中获取到文档D的页结构信息。

本地浏览器12根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组。本地浏览器12获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档。

可以理解的是，在本申请的具体应用场景中，本地浏览器12执行在线解析、在线加载。一旦一次性下载多个OFD版式文档，且对多个OFD版式文档进行解析、加载，这无疑会加重本地浏览器12的运行负载，容易出现翻页卡顿、网页打开慢的问题。为此，本地浏览器12对第一版式文档进行分组加载。

具体的，本地浏览器12根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组。其中，所述文档页组可视为元素为文档页的集合，预设的页数范围定义所述文档页组内的页数。

本地浏览器12根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组，在具体的应用场景中可以表现为：

本地浏览器12将第一版式文档分组为若干文档页组，可以有效的简化OFD版式文档结构，减轻本地浏览器12的运行负载，从而解决翻页卡顿、网页打开慢的问题。举例来说，当OFD版式文档具有1000页，本地浏览器12将以10页为页数范围。从OFD版式文档的第一页开始，本地浏览器12将OFD版式文档分为10组文档页组，生成对应文档页组的HTML标签。

之后本地浏览器12获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档。

进一步的，本地浏览器12获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档，具体包括：

获取浏览区域的浏览位置、区域尺寸；

加载所述第一文档页组的文档信息，以展示第一版式文档。

可以理解的是，所述文档页记载文档信息。所述文档信息至少包括文本或图像。为减轻本地浏览器12的运行负载，需要确定浏览区域对应的文档页组。此处将浏览区域对应的文档页组简称为第一文档页组。

下面介绍本地浏览器12确定第一文档页组的实施过程：

本地浏览器12可以根据滚动条当前的累计滚动长度，和第一版式文档中每一页的尺寸累加进行比较，快速确定浏览区域对应的页数。

之后本地浏览器12确定该页数对应的文档页组，即确定第一文档页组。

进而加载第一文档页组的文档信息，以展示第一版式文档。

进一步的，考虑到不同浏览权限的本地浏览器12在进行连续浏览时，可能存在相同的浏览文档。为提高加载效率，所述第一文档页组具有加载历史标识；

在加载所述第一文档页组的文档信息之前，所述本地浏览器12还用于：

获取所述第一文档页组的加载历史标识；

当检索结果为未加载，加载所述第一文档页组的文档信息；

这样，本地浏览器12可根据加载历史标识，辨别已加载过的文档页组，从而调用预设缓存库中缓存的文档页组，提高了加载效率。

当浏览区域超过第一版式文档的页结构信息，本地浏览器12确定待浏览文档表中顺位排列的第二版式文档。

可以理解的是，在本地浏览器12连续浏览多个版式文档的情况下，一旦浏览区域超过第一版式文档的页结构信息，可视为本地浏览器12需要浏览下个版式文档或上个版式文档。此时，需要根据浏览区域的浏览位置、区域尺寸，确定本地浏览器12的浏览意向。

本地浏览器12根据待浏览文档表中的下载地址，获取第二版式文档。本地浏览器12解析第二版式文档的页结构信息。本地浏览器12根据第二版式文档的页结构信息，对第二版式文档进行分组，生成元素为文档页的若干文档页组。本地浏览器12根据浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档。

同理，本地浏览器12根据待浏览文档表中的下载地址，获取第二版式文档。

在本申请所提供的系统100应用于多OFD版式文档浏览的情况下，所述第二文档表现为OFD文档格式的版式文档。本地浏览器12可采用可扩展标记语言XML对第二版式文档进行解析，可以确定第二版式文档的页结构信息。

在解析第二版式文档的页结构信息之前，所述本地浏览器12还用于：

获取第二版式文档的浏览历史标识；

当检索结果为未缓存，解析第二版式文档的页结构信息；

进一步的，本地浏览器12根据第二版式文档的页结构信息，对第二版式文档进行分组，生成元素为文档页的若干文档页组，在具体的应用场景中可以表现为：

本地浏览器12将第二版式文档分组为若干文档页组，可以有效的简化OFD版式文档结构，减轻本地浏览器12的运行负载，从而解决翻页卡顿、网页打开慢的问题。

进一步的，所述本地浏览器12获取浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档，具体包括：

获取浏览区域的浏览位置、区域尺寸；

加载所述第二文档页组的文档信息，以展示第二版式文档。

下面介绍本地浏览器12确定第二文档页组的实施过程：

之后本地浏览器12确定该页数对应的文档页组，即确定第二文档页组。

进而加载第二文档页组的文档信息，以展示第二版式文档。

在加载所述第二文档页组的文档信息之前，所述本地浏览器12还用于：

获取所述第二文档页组的加载历史标识；

当检索结果为未加载，加载所述第二文档页组的文档信息；

下面介绍，在本地浏览器12连续浏览多个版式文档的应用场景中，本申请所提供的版式文档浏览系统100的具体实施过程：

本地浏览器12在线浏览多个版式文档。远端服务器11获取第一数量的版式文档，生成包括版式文档预设排列顺序、预设浏览权限、下载地址的文档表，以便根据不同浏览权限的本地浏览器12进行组合。

当本地浏览器12选择初始浏览文档后，会向服务器11发起包括初始浏览文档、本地浏览器12的浏览权限等信息的浏览请求。

服务器11根据本地浏览器12的浏览权限，在文档表中筛选出匹配本地浏览器12浏览权限的第二数量版式文档，并根据版式文档预设排列顺序重新组合，生成包括版式文档预设排列顺序、下载地址的待浏览文档表，以校验本地浏览器12选择的初始浏览文档是否位于待浏览文档表中。

当本地浏览器12选择的初始浏览文档位于待浏览文档表中，则本地浏览器12可以在待浏览文档表中确定对应初始浏览文档的下载地址。本地浏览器12根据待浏览文档表中的下载地址，获取对应浏览请求的初始浏览文档，作为第一版式文档。

本地浏览器12解析第一版式文档的页结构信息，得到第一版式文档的页数、第一版式文档中每一页的尺寸、第一版式文档的文档ID、第一版式文档的页索引，记录到PAGES。

本地浏览器12根据第一版式文档的页结构信息，对PAGES以固定的分组大小进行分组，生成若干HTML标签，以若干HTML标签对应若干文档页组。

之后动态计算文档浏览区域的高度，计算该区域内可以容纳显示的页，计算区域外前后各一页。对计算出的页，判断每一页是否命中浏览器12缓存，即PAGES中是否已经包含该页详细信息。如果没有命中缓存，异步并发向服务器11请求页详细信息。将解析结果中每页的图像、文字等信息，记录到PAGES中对应的页结构上。最后渲染页面，加载背景图，并初始化文字信息等。

异步加载第二版式文档，向服务器11请求第二版式文档的结构信息。将解析结果中每页的尺寸、文档ID、文档页索引记录到TEMPPAGES。

之后本地浏览器12重复上述步骤，以展示第二版式文档。

进一步的，考虑到在本地浏览器12连续浏览多个版式文档的情况下，存在本地浏览器12连续复制多个版式文档中文本的情况，而现有技术中如果对多个版式文档进行合并后再复制，容易产生本地副本，对存储资源造成了严重浪费。如果不对多个版式文档进行合并，而是在线编辑，由于存在多人编辑的情况，复制操作容易受他人编辑不同步影响，造成复制失败的情况。例如在法院电子卷宗的应用场景，庭审材料都是按页进行存储，且随案生成。在办案过程中会不断产生新的文件，也会对文件进行删除，因此不能频繁进行合并和修改。频繁变化可能存在多人浏览不同步以及并发合并删除同步的问题。

为解决连续复制多个版式文档失败率高的技术问题，所述本地浏览器12还用于：

确定对应复制起始浏览页、复制结束浏览页的复制页组；

根据对应复制区域的文本，生成文本DIV标签。

如果不存在跨页或文档的情况，则记录当前页page。

创建空白DIV标签，记录所述文本，并设置文本选中样式。

重复上述步骤，直至记录完对应复制复制区域的复制页组。

综上所述，本申请提供的版式文档浏览系统100，通过在线加载多个版式文档以减轻存储资源造成的浪费。通过根据本地浏览器12的浏览权限，提供匹配的多个版式文档，以便不同浏览权限的本地浏览器12进行浏览，提高了访问的安全性。通过对版式文档进行分组加载，提高了加载效率。

需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，有语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种版式文档浏览方法，其特征在于，包括以下步骤：

当浏览对象发起浏览请求，获取浏览对象的浏览权限；

解析第一版式文档的页结构信息；

根据待浏览文档表中的下载地址，获取第二版式文档；

解析第二版式文档的页结构信息；

根据浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档；

确定对应复制起始浏览页、复制结束浏览页的复制页组；

根据对应复制区域的文本，生成文本DIV标签。

2.如权利要求1所述的版式文档浏览方法，其特征在于，所述第一版式文档具有浏览历史标识；

在解析第一版式文档的页结构信息之前，所述方法还包括：

获取第一版式文档的浏览历史标识；

当检索结果为未缓存，解析第一版式文档的页结构信息；

3.如权利要求2所述的版式文档浏览方法，其特征在于，所述获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档，具体包括：

获取浏览区域的浏览位置、区域尺寸；

加载所述第一文档页组的文档信息，以展示第一版式文档。

4.如权利要求3所述的版式文档浏览方法，其特征在于，所述第一文档页组具有加载历史标识；

获取所述第一文档页组的加载历史标识；

当检索结果为未加载，加载所述第一文档页组的文档信息；

5.如权利要求4所述的版式文档浏览方法，其特征在于，所述预设缓存库部署于本地浏览器或远端服务器。

6.如权利要求1所述的版式文档浏览方法，其特征在于，所述版式文档为OFD版式文档，所述第一数量不小于2，所述方法应用于多OFD版式文档浏览。

7.一种版式文档浏览系统，其特征在于，包括：

本地浏览器，用于根据待浏览文档表中的下载地址，获取对应浏览请求的第一版式文档；还用于解析第一版式文档的页结构信息；还用于根据第一版式文档的页结构信息，对第一版式文档进行分组，生成元素为文档页的若干文档页组；还用于获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档；还用于当浏览区域超过第一版式文档的页结构信息，确定待浏览文档表中顺位排列的第二版式文档；还用于根据待浏览文档表中的下载地址，获取第二版式文档；还用于解析第二版式文档的页结构信息；还用于根据第二版式文档的页结构信息，对第二版式文档进行分组，生成元素为文档页的若干文档页组；还用于根据浏览区域，加载浏览区域对应的第二文档页组，以展示第二版式文档；

所述本地浏览器还用于：

确定对应复制起始浏览页、复制结束浏览页的复制页组；

根据对应复制区域的文本，生成文本DIV标签。

8.如权利要求7所述的版式文档浏览系统，其特征在于，所述第一版式文档具有浏览历史标识；

获取第一版式文档的浏览历史标识；

当检索结果为未缓存，解析第一版式文档的页结构信息；

9.如权利要求8所述的版式文档浏览系统，其特征在于，所述本地浏览器获取浏览区域，加载浏览区域对应的第一文档页组，以展示第一版式文档，具体包括：

获取浏览区域的浏览位置、区域尺寸；

加载所述第一文档页组的文档信息，以展示第一版式文档。