CN109857302B - 电子书信息的修复方法、电子设备及计算机存储介质 - Google Patents
电子书信息的修复方法、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN109857302B CN109857302B CN201910086626.1A CN201910086626A CN109857302B CN 109857302 B CN109857302 B CN 109857302B CN 201910086626 A CN201910086626 A CN 201910086626A CN 109857302 B CN109857302 B CN 109857302B
- Authority
- CN
- China
- Prior art keywords
- page
- electronic book
- information
- file
- book information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种电子书信息的修复方法、电子设备及计算机存储介质,该方法包括:确定电子书信息中包含的页面顺序文件所记录的页面元素的数量;判断页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容是否匹配;若否,获取与电子书信息相对应的目录文件;将目录文件与页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。本发明能够自动修复电子书信息中包含的页面顺序文件,以确保电子书中的各个页面能够依序展示并正常阅读,避免了因电子书信息中部分内容缺失而导致电子书无法上线的情况。
Description
技术领域
本发明涉及计算机领域,具体涉及一种电子书信息的修复方法、电子设备及计算机存储介质。
背景技术
随着阅读意识的提高以及移动设备的普及,电子书的数量越来越多,用户通过移动设备能够随时随地阅读电子书。通常情况下,为了展示电子书,需要预先生成电子书信息,该电子书信息中包含电子书的全部页面所对应的数据,并且,该电子书信息中还定义有各个页面之间的展示顺序,以确保各个页面能够依序展示。
但是,在实现本发明的过程中,发明人发现现有技术中的上述方案至少存在下述缺陷:实际情况中,由于人工疏忽或网络异常等多种因素的影响,导致现有的电子书信息中经常会缺失一些内容。例如,一些页面之间的展示顺序缺失,或目录文件缺失,从而导致电子书无法正常展示。目前,有大量的电子书因为缺失内容等瑕疵而无法正常提供服务。由此可见,现有技术中亟需一种能够针对电子书信息进行修复的方法。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的电子书信息的修复方法、电子设备及计算机存储介质。
根据本发明的一个方面,提供了一种电子书信息的修复方法,包括:
确定所述电子书信息中包含的页面顺序文件所记录的页面元素的数量;
判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配;
若否,获取与所述电子书信息相对应的目录文件;
将所述目录文件与所述页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。
根据本发明的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
确定所述电子书信息中包含的页面顺序文件所记录的页面元素的数量;
判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配;
若否,获取与所述电子书信息相对应的目录文件;
将所述目录文件与所述页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。
根据本发明的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
确定所述电子书信息中包含的页面顺序文件所记录的页面元素的数量;
判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配;
若否,获取与所述电子书信息相对应的目录文件;
将所述目录文件与所述页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。
在本发明提供的电子书信息的修复方法、电子设备及计算机存储介质中,能够确定电子书信息中包含的页面顺序文件所记录的页面元素的数量,并在判断出页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容不匹配时,通过与电子书信息相对应的目录文件修复页面顺序文件。该方式能够自动修复电子书信息中包含的页面顺序文件,以确保电子书中的各个页面能够依序展示并正常阅读,避免了因电子书信息中部分内容缺失而导致电子书无法上线的情况。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明一个实施例提供的电子书信息的修复方法的流程图;
图2示出了本发明另一个实施例提供的电子书信息的修复方法的流程图;
图3示出了根据本发明另一个实施例的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1示出了本发明一个实施例提供的电子书信息的修复方法的流程图。如图1所示,该方法包括以下步骤:
步骤S110:确定电子书信息中包含的页面顺序文件所记录的页面元素的数量。
其中,电子书信息包括电子书所对应的各类相关信息,用于实现电子书的正常展示。通常一本电子书对应于一个EPUB(Electronic Publication,电子出版)文件压缩包,该文件压缩包即为电子书信息。
由于书籍中的各个页面之间具有展示顺序,在纸质书籍中,为了确保各个页面依序翻阅,需要将纸质书籍中的各个页面按照页码顺序进行装订。同理,在电子书展示过程中,也需要确定电子书中包含的各个电子书页面之间的展示顺序,以确保电子书的正常阅读。相应地,电子书信息中需要包含页面顺序文件,该页面顺序文件用于记录与各个电子书页面相对应的各个页面元素以及各个页面元素之间的线性阅读顺序。例如,假设电子书共包含100个电子书页面,每个页面元素分别对应于一个完整的电子书页面,则该电子书的页面顺序文件中共包含100个页面元素以及各个页面元素之间的线性阅读顺序。
步骤S120:判断该页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容是否匹配。
其中,页面顺序文件所记录的页面元素的数量取决于与电子书信息相对应的书籍内容:当与电子书信息相对应的书籍内容越多时,页面顺序文件所记录的页面元素的数量也越多;当与电子书信息相对应的书籍内容越少时,则页面顺序文件所记录的页面元素的数量也越少。相应地,若页面顺序文件未缺失内容,则该页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容应该是相互匹配的。
具体地,在判断二者是否匹配时,首先,获取与电子书信息相对应的书籍内容,该书籍内容可通过多种方式呈现,例如,可以为电子书信息中包含的页面数据文件,本发明不限定与电子书信息相对应的书籍内容的具体呈现方式,只要能够用于确定电子书内容即可。然后,根据书籍内容确定电子书的页码信息,从而计算页面顺序文件中应当包含的页面元素的数量。最后,将计算出的页面顺序文件中应当包含的页面元素的数量与页面顺序文件中实际记录的页面元素的数量进行比对,若一致,则说明页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容匹配;若不一致,则说明页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容不匹配。
步骤S130:若否,获取与电子书信息相对应的目录文件。
当页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容不匹配时,说明页面顺序文件中缺失了部分内容,相应地,需要获取与电子书信息相对应的目录文件,以便根据目录文件对页面顺序文件进行修复。
其中,与电子书信息相对应的目录文件可以是电子书信息中包含的原始目录文件。另外,由于原始目录文件可能会因各种原因而损毁或缺失,因此,还可以通过多种方式获取与电子书信息相对应的修正目录,并将修正目录确定为与电子书信息相对应的目录文件。本发明不限定目录文件的具体获取方式。
步骤S140:将目录文件与页面顺序文件所记录的页面元素进行比对,根据比对结果修复页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容匹配。
具体地,将目录文件与页面顺序文件所记录的页面元素进行比对时,需要提取目录文件中包含的各个章节目录项,并逐一确定各个章节目录项在页面顺序文件中所对应的各个页面元素,从而根据章节目录项补全页面顺序文件所记录的页面元素,从而修复页面顺序文件。本发明不限定具体的修复方式,只要能够使页面顺序文件与书籍内容匹配即可。
在本发明提供的电子书信息的修复方法中,能够确定电子书信息中包含的页面顺序文件所记录的页面元素的数量,并在判断出页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容不匹配时,通过与电子书信息相对应的目录文件修复页面顺序文件。该方式能够自动修复电子书信息中包含的页面顺序文件,以确保电子书中的各个页面能够依序展示并正常阅读,避免了因电子书信息中部分内容缺失而导致电子书无法上线的情况。
实施例二
图2示出了本发明另一个实施例提供的电子书信息的修复方法的流程图。如图2所示,该方法包括以下步骤:
步骤S210:确定电子书信息中包含的页面顺序文件所记录的页面元素的数量。
其中,页面顺序文件用于记录与各个电子书页面相对应的各个页面元素以及各个页面元素之间的线性阅读顺序。在本实施例中,电子书信息为EPUB文件压缩包,每本电子书对应于一个EPUB文件压缩包。相应地,在EPUB文件压缩包中,包含后缀名为.opf的文件,简称opf文件。本实施例中的页面顺序文件主要是指与opf文件相关的文件。
具体地,opf文件通常包括以下子文件:metadata子文件、manifest子文件以及spine子文件。其中,metadata子文件用于记录EPUB的元数据,如title(标题)、language(语言)、identifier(标识符)、cover(封面)等。manifest子文件能够列出目录中所包含的所有文件。spine子文件(也叫书脊子文件)用于存储所有文档的线性阅读顺序。通俗的说,可以将spine理解为书中“页面”的顺序,解析时按照文档顺序从上到下依次读取spine中的内容即可。在本实施例中,页面顺序文件主要是指opf文件和/或opf文件中包含的spine子文件。
页面顺序文件中所记录的页面元素与电子书页面相对应,可以是一个电子书页面对应于一个页面元素,此时,页面顺序文件中所记录的页面元素的数量与电子书总页码数量一致;也可以是一个电子书页面对应于多个页面元素,本发明对具体细节不做限定。总之,页面顺序文件通过记录与各个电子书页面相对应的各个页面元素以及各个页面元素之间的线性阅读顺序,能够确保各个电子书页面依序展示。具体地,页面顺序文件可以通过链接索引的形式,建立各个电子书页面所对应的页面元素之间的链接索引关系,从而将第N个电子书页面所对应的页面元素与第N+1个电子书页面所对应的页面元素链接起来,从而在第N个电子书页面展示完毕后,自动跳转到第N+1个电子书页面进行展示。其中,N为自然数。
在本实施例中,通过读取opf文件和/或opf文件中包含的spine子文件的文件内容,即可确定页面顺序文件所记录的页面元素的数量。
步骤S220:判断该页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容是否匹配。
具体地,在本实施例中,与电子书信息相对应的书籍内容通过页面数据文件确定,相应地,在本步骤中,获取电子书信息中包含的页面数据文件,根据该页面数据文件所对应的页面数量,判断上述页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容是否匹配。
其中,页面数据文件用于存储每个电子书页面的具体页面内容信息。例如,每个电子书页面的页面内容可通过HTML页面存储,具体需存储以下内容:电子书页面的章节名称、正文段落以及段落内容、页面中包含的图片、页码等信息。也就是说,页面顺序文件所记录的页面元素用于关联到对应的电子书页面的页面标识,以便根据阅读进度以及页面间的顺序确定当前需要加载的电子书页面所对应的页码等标识信息,在具体加载一个电子书页面时,需要根据页码等标识信息读取该电子书页面在页面数据文件中所对应的内容进行加载。
相应地,根据页面数据文件,能够确定电子书所对应的页面数量,将该页面数量与页面顺序文件所记录的页面元素的数量进行比较,即可确定二者是否匹配。若二者匹配,则说明页面顺序文件未缺失内容,无需修复;若二者不匹配,则说明页面顺序文件缺失内容,需要通过后续步骤进行修复。
步骤S230:若否,获取电子书信息中包含的原始目录文件,判断该原始目录文件与电子书信息相对应的书籍内容是否匹配。若是,执行步骤S240;若否,执行步骤S250。
其中,电子书信息中包含的原始目录文件是指EPUB文件压缩包中包含的用于记录目录信息的文件。原始目录文件通常为后续为.ncx的文件,简称ncx文件。ncx文件用于定义数字图书的目录表。例如,在章节较多的电子书中,目录表通常采用层次结构,包括嵌套的内容、章和节。比如,ncx文件的<head>标记中包含以下几个meta元素:Uid元素:数字图书的唯一ID。该元素和OPF文件中的identifier元素相对应。Depth元素:反映目录表中层次的深度。docTitle/text元素的内容是图书的标题,和opf文件中的title元素相匹配。navMap元素定义了图书的目录,是ncx文件中最重要的部分。navMap元素包含一个或多个navPoint元素,每个navPoint元素进一步包含用于表明文档阅读顺序的信息,该表明文档阅读顺序的信息与opf文件的spine子文件中的顺序信息一致。
由于原始目录文件可能会由于各种原因而缺失部分内容,因此,为了避免因原始目录文件缺损而导致的异常问题,在本实施例中,需要判断该原始目录文件与电子书信息相对应的书籍内容是否匹配。具体判断时,需要根据与电子书信息相对应的书籍内容确定该电子书所包含的章节总数,进而确定电子书目录中理论上应包含的章节目录项的数量,若理论上应包含的章节目录项的数量与原始目录文件中包含的章节目录项的数量相同,则说明二者匹配。另外,除了仅匹配章节目录项的数量之外,还可以根据与电子书信息相对应的书籍内容确定该电子书的各个章节名称,从而进一步匹配各个章节目录项的名称内容是否相同,从而提升结果的准确性。
步骤S240:若是,将原始目录文件确定为与电子书信息相对应的目录文件。
当原始目录文件与电子书信息相对应的书籍内容匹配时,说明原始目录文件未缺损,因此,可以将原始目录文件确定为与电子书信息相对应的目录文件,进而根据原始目录文件修复页面顺序文件。
步骤S250:若否,获取与电子书信息相对应的修正目录,将修正目录确定为与电子书信息相对应的目录文件。
当原始目录文件与电子书信息相对应的书籍内容不匹配时,说明原始目录文件存在缺损,因此,需要获取与电子书信息相对应的修正目录,以替换原始目录文件,从而达到对原始目录文件进行修复的目的。具体地,获取与电子书信息相对应的修正目录时,可以通过以下两种方式中的至少一种实现:
第一种实现方式为:确定与电子书信息相对应的书籍属性信息;根据书籍属性信息获取与电子书信息相对应的网络目录文件;根据网络目录文件确定与电子书信息相对应的修正目录。该方式的核心在于:基于第三方网络平台中记录的与该电子书对应的目录进行修正。由于电子书通常会在多个网络平台中出版,因此,当本平台的电子书信息出现问题时,可以从其他网络平台获取与该电子书相关的目录信息,以修正目录文件。其中,书籍属性信息包括:国际标准书号(ISBN)、作者、书名、出版时间和/或出版社。书籍属性信息设置得越全面,越能够准确定位到电子书,从而避免因书籍同名等现象导致的错误。具体实施时,可以通过网络爬虫从各类第三方平台爬取与该电子书相关的目录信息,得到网络目录文件。然后,根据网络目录文件确定与电子书信息相对应的修正目录,具体确定时,可以按照ncx文件的生成规范,生成与网络目录文件相对应的ncx文件,从而利用生成的ncx文件替换原有的ncx文件,从而修正目录文件。
第二种实现方式为:获取电子书信息中包含的页面数据文件中的各个电子书页面的页面内容信息;根据各个电子书页面的页面内容信息,确定各个电子书页面的标题信息与页码信息之间的对应关系;根据该对应关系获取与电子书信息相对应的修正目录。该方式的核心在于:基于电子书中的各个页面的具体内容来修复目录文件。具体地,由于页面数据文件中记录了各个电子书页面的页面内容信息,因此,通过识别页面内容信息能够还原各个章节标题,并根据页码信息确定各个章节标题所对应的页码,从而基于页面数据文件重构电子书目录,以修正电子书信息中包含的原始目录文件。
步骤S260:将目录文件与页面顺序文件所记录的页面元素进行比对,根据比对结果修复页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容匹配。
其中,目录文件既可以是上文提到的原始目录文件,也可以是修正目录,具体取决于原始目录文件是否缺损。
具体地,将目录文件与页面顺序文件所记录的页面元素进行比对时,需要提取目录文件中包含的各个章节目录项,并逐一确定各个章节目录项在页面顺序文件中所对应的各个页面元素,从而根据章节目录项补全页面顺序文件所记录的页面元素,从而修复页面顺序文件,以使页面顺序文件中记录完整的页面顺序信息。
本实施例中的上述方式可应用于多种场景中:例如,可以用于电子书的制作场景,从而快速制作出能够上线的电子书。传统方式中,若电子书信息存在微小瑕疵,则不得不与书籍提供方再次沟通,以获取准确版本,而沟通过程势必耗时耗力,降低书籍制作效率。采用本发明中的方式后,能够快速高效地修正具有瑕疵的电子书信息,从而大幅提升了电子书制作效率以及电子书上线率。又如,还可以用于EPUB阅读器的开发场景,从而使EPUB阅读器能够自动优化电子书资源,从而顺利打开具有瑕疵的电子书,降低阅读器打开电子书过程中的报错率。
综上可知,通过本实施例中的方式,能够对具有瑕疵的电子书信息进行自动修复,主要能够修复页面顺序文件,以确保电子书中的各个页面能够依序正常展示,防止展示过程中丢页面的情况发生。另外,该方式还能够针对目录文件进行修复,防止目录缺损的情况发生。
实施例三
本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的电子书信息的修复方法。
可执行指令具体可以用于使得处理器执行以下操作:
确定所述电子书信息中包含的页面顺序文件所记录的页面元素的数量;
判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配;
若否,获取与所述电子书信息相对应的目录文件;
将所述目录文件与所述页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的原始目录文件;
判断所述原始目录文件与所述电子书信息相对应的书籍内容是否匹配;
若是,将所述原始目录文件确定为与所述电子书信息相对应的目录文件。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
若否,获取与所述电子书信息相对应的修正目录,将所述修正目录确定为与所述电子书信息相对应的目录文件。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
确定与所述电子书信息相对应的书籍属性信息;
根据所述书籍属性信息获取与所述电子书信息相对应的网络目录文件;
根据所述网络目录文件确定与所述电子书信息相对应的修正目录。
在一种可选的方式中,所述书籍属性信息包括:国际标准书号、作者、书名、出版时间和/或出版社。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的页面数据文件中的各个电子书页面的页面内容信息;
根据所述各个电子书页面的页面内容信息,确定各个电子书页面的标题信息与页码信息之间的对应关系;
根据所述对应关系获取与所述电子书信息相对应的修正目录。
在一种可选的方式中,所述页面顺序文件用于记录与各个电子书页面相对应的各个页面元素以及各个页面元素之间的线性阅读顺序。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的页面数据文件,根据所述页面数据文件所对应的页面数量,判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配。
实施例四
图3示出了根据本发明另一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图3所示,该电子设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。处理器302,用于执行程序310,具体可以执行上述电子书信息的修复方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以用于使得处理器302执行以下操作:
确定所述电子书信息中包含的页面顺序文件所记录的页面元素的数量;
判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配;
若否,获取与所述电子书信息相对应的目录文件;
将所述目录文件与所述页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的原始目录文件;
判断所述原始目录文件与所述电子书信息相对应的书籍内容是否匹配;
若是,将所述原始目录文件确定为与所述电子书信息相对应的目录文件。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
若否,获取与所述电子书信息相对应的修正目录,将所述修正目录确定为与所述电子书信息相对应的目录文件。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
确定与所述电子书信息相对应的书籍属性信息;
根据所述书籍属性信息获取与所述电子书信息相对应的网络目录文件;
根据所述网络目录文件确定与所述电子书信息相对应的修正目录。
在一种可选的方式中,所述书籍属性信息包括:国际标准书号、作者、书名、出版时间和/或出版社。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的页面数据文件中的各个电子书页面的页面内容信息;
根据所述各个电子书页面的页面内容信息,确定各个电子书页面的标题信息与页码信息之间的对应关系;
根据所述对应关系获取与所述电子书信息相对应的修正目录。
在一种可选的方式中,所述页面顺序文件用于记录与各个电子书页面相对应的各个页面元素以及各个页面元素之间的线性阅读顺序。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的页面数据文件,根据所述页面数据文件所对应的页面数量,判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (21)
1.一种电子书信息的修复方法,包括:
确定所述电子书信息中包含的页面顺序文件所记录的页面元素的数量;
判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配;其中,所述页面顺序文件用于记录与各个电子书页面相对应的各个页面元素以及各个页面元素之间的线性阅读顺序;
若否,获取与所述电子书信息相对应的目录文件;
将所述目录文件与所述页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。
2.根据权利要求1所述的方法,其中,所述获取与所述电子书信息相对应的目录文件包括:
获取所述电子书信息中包含的原始目录文件;
判断所述原始目录文件与所述电子书信息相对应的书籍内容是否匹配;
若是,将所述原始目录文件确定为与所述电子书信息相对应的目录文件。
3.根据权利要求2所述的方法,其中,所述判断所述原始目录文件与所述电子书信息相对应的书籍内容是否匹配之后,进一步包括:
若否,获取与所述电子书信息相对应的修正目录,将所述修正目录确定为与所述电子书信息相对应的目录文件。
4.根据权利要求3所述的方法,其中,所述获取与所述电子书信息相对应的修正目录包括:
确定与所述电子书信息相对应的书籍属性信息;
根据所述书籍属性信息获取与所述电子书信息相对应的网络目录文件;
根据所述网络目录文件确定与所述电子书信息相对应的修正目录。
5.根据权利要求4所述的方法,其中,所述书籍属性信息包括:国际标准书号、作者、书名、出版时间和/或出版社。
6.根据权利要求3-5任一所述的方法,其中,所述获取与所述电子书信息相对应的修正目录包括:
获取所述电子书信息中包含的页面数据文件中的各个电子书页面的页面内容信息;
根据所述各个电子书页面的页面内容信息,确定各个电子书页面的标题信息与页码信息之间的对应关系;
根据所述对应关系获取与所述电子书信息相对应的修正目录。
7.根据权利要求1-5任一所述的方法,其中,所述判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配包括:
获取所述电子书信息中包含的页面数据文件,根据所述页面数据文件所对应的页面数量,判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配。
8.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
确定电子书信息中包含的页面顺序文件所记录的页面元素的数量;
判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配;其中,所述页面顺序文件用于记录与各个电子书页面相对应的各个页面元素以及各个页面元素之间的线性阅读顺序;
若否,获取与所述电子书信息相对应的目录文件;
将所述目录文件与所述页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。
9.根据权利要求8所述的电子设备,其中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的原始目录文件;
判断所述原始目录文件与所述电子书信息相对应的书籍内容是否匹配;
若是,将所述原始目录文件确定为与所述电子书信息相对应的目录文件。
10.根据权利要求9所述的电子设备,其中,所述可执行指令使所述处理器执行以下操作:
若否,获取与所述电子书信息相对应的修正目录,将所述修正目录确定为与所述电子书信息相对应的目录文件。
11.根据权利要求10所述的电子设备,其中,所述可执行指令使所述处理器执行以下操作:
确定与所述电子书信息相对应的书籍属性信息;
根据所述书籍属性信息获取与所述电子书信息相对应的网络目录文件;
根据所述网络目录文件确定与所述电子书信息相对应的修正目录。
12.根据权利要求11所述的电子设备,其中,所述书籍属性信息包括:国际标准书号、作者、书名、出版时间和/或出版社。
13.根据权利要求9-12任一所述的电子设备,其中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的页面数据文件中的各个电子书页面的页面内容信息;
根据所述各个电子书页面的页面内容信息,确定各个电子书页面的标题信息与页码信息之间的对应关系;
根据所述对应关系获取与所述电子书信息相对应的修正目录。
14.根据权利要求9-12任一所述的电子设备,其中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的页面数据文件,根据所述页面数据文件所对应的页面数量,判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配。
15.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行以下操作:
确定电子书信息中包含的页面顺序文件所记录的页面元素的数量;
判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配;其中,所述页面顺序文件用于记录与各个电子书页面相对应的各个页面元素以及各个页面元素之间的线性阅读顺序;
若否,获取与所述电子书信息相对应的目录文件;
将所述目录文件与所述页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。
16.根据权利要求15所述的计算机存储介质,其中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的原始目录文件;
判断所述原始目录文件与所述电子书信息相对应的书籍内容是否匹配;
若是,将所述原始目录文件确定为与所述电子书信息相对应的目录文件。
17.根据权利要求16所述的计算机存储介质,其中,所述可执行指令使所述处理器执行以下操作:
若否,获取与所述电子书信息相对应的修正目录,将所述修正目录确定为与所述电子书信息相对应的目录文件。
18.根据权利要求17所述的计算机存储介质,其中,所述可执行指令使所述处理器执行以下操作:
确定与所述电子书信息相对应的书籍属性信息;
根据所述书籍属性信息获取与所述电子书信息相对应的网络目录文件;
根据所述网络目录文件确定与所述电子书信息相对应的修正目录。
19.根据权利要求18所述的计算机存储介质,其中,所述书籍属性信息包括:国际标准书号、作者、书名、出版时间和/或出版社。
20.根据权利要求17-19任一所述的计算机存储介质,其中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的页面数据文件中的各个电子书页面的页面内容信息;
根据所述各个电子书页面的页面内容信息,确定各个电子书页面的标题信息与页码信息之间的对应关系;
根据所述对应关系获取与所述电子书信息相对应的修正目录。
21.根据权利要求15-19任一所述的计算机存储介质,其中,所述可执行指令使所述处理器执行以下操作:
获取所述电子书信息中包含的页面数据文件,根据所述页面数据文件所对应的页面数量,判断所述页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容是否匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910086626.1A CN109857302B (zh) | 2019-01-29 | 2019-01-29 | 电子书信息的修复方法、电子设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910086626.1A CN109857302B (zh) | 2019-01-29 | 2019-01-29 | 电子书信息的修复方法、电子设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109857302A CN109857302A (zh) | 2019-06-07 |
CN109857302B true CN109857302B (zh) | 2020-01-21 |
Family
ID=66896742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910086626.1A Active CN109857302B (zh) | 2019-01-29 | 2019-01-29 | 电子书信息的修复方法、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109857302B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102053953A (zh) * | 2009-10-29 | 2011-05-11 | 英华达(上海)电子有限公司 | 电子书印刷页码查找方法 |
CN105408851A (zh) * | 2013-07-31 | 2016-03-16 | 索尼公司 | 信息处理设备,信息处理方法和程序 |
CN108268196A (zh) * | 2017-08-29 | 2018-07-10 | 广州市动景计算机科技有限公司 | 连续阅读方法、装置和终端 |
CN109145176A (zh) * | 2018-07-27 | 2019-01-04 | 四川曜诚鑫科技有限公司 | 电子文档管理系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7769719B2 (en) * | 2006-01-05 | 2010-08-03 | International Business Machines Corporation | File system dump/restore by node numbering |
JP5833956B2 (ja) * | 2012-03-06 | 2015-12-16 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 文書を校正する情報処理装置、方法およびプログラム |
JP2014197341A (ja) * | 2013-03-29 | 2014-10-16 | 富士フイルム株式会社 | 電子書籍制作装置、電子書籍システム、電子書籍制作方法及びプログラム |
US10140310B1 (en) * | 2015-06-30 | 2018-11-27 | Amazon Technologies, Inc. | Identifying and utilizing synchronized content |
JP2017167575A (ja) * | 2016-03-14 | 2017-09-21 | 富士通株式会社 | 電子記録情報表示装置、電子記録情報表示プログラム、及び電子記録情報表示方法 |
CN106681969A (zh) * | 2016-12-30 | 2017-05-17 | 珠海市彦安科技有限公司 | 一种修复损坏文档的方法 |
-
2019
- 2019-01-29 CN CN201910086626.1A patent/CN109857302B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102053953A (zh) * | 2009-10-29 | 2011-05-11 | 英华达(上海)电子有限公司 | 电子书印刷页码查找方法 |
CN105408851A (zh) * | 2013-07-31 | 2016-03-16 | 索尼公司 | 信息处理设备,信息处理方法和程序 |
CN108268196A (zh) * | 2017-08-29 | 2018-07-10 | 广州市动景计算机科技有限公司 | 连续阅读方法、装置和终端 |
CN109145176A (zh) * | 2018-07-27 | 2019-01-04 | 四川曜诚鑫科技有限公司 | 电子文档管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109857302A (zh) | 2019-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753500B (zh) | 版式化后的电子表单与ofd合并展现及目录生成的方法 | |
CN103473067B (zh) | 嵌入式Linux分区与数据还原方法、系统及系统开发方法 | |
CN102326179B (zh) | 用于查看web上的文档的字体处理 | |
US7720814B2 (en) | Repopulating a database with document content | |
US20130174024A1 (en) | Method and device for converting document format | |
JP4215786B2 (ja) | ウェブコンテンツ転送方法、コンピュータ及びプログラム | |
US20170139813A1 (en) | Method and device for checking influence of deleting cache file, and mobile terminal | |
US20100325539A1 (en) | Web based spell check | |
CN113553010B (zh) | 一种光盘文件校验方法、光盘刻录方法及计算设备 | |
CN109783558A (zh) | Excel数据的导入方法、装置、计算机设备和存储介质 | |
WO2020233023A1 (zh) | 基于分层技术实现的psd文件编辑方法、电子设备 | |
CN111460345B (zh) | 电子书籍加载展示方法、电子设备及存储介质 | |
CN106445815A (zh) | 一种自动化测试方法及装置 | |
JP2006178964A (ja) | 電子文書を検査し保存するための方法およびコンピュータ読取り可能記録媒体 | |
CN103593406A (zh) | 一种静态资源标识处理方法及装置 | |
CN112417899A (zh) | 文字翻译方法、装置、计算机设备和存储介质 | |
US9158748B2 (en) | Correction of quotations copied from electronic documents | |
US20050246310A1 (en) | File conversion method and system | |
CN109857302B (zh) | 电子书信息的修复方法、电子设备及计算机存储介质 | |
CN111460765B (zh) | 电子书籍标注处理方法、电子设备及存储介质 | |
CN111241096A (zh) | 一种excel文档的文本提取方法、系统、终端及存储介质 | |
Vernica et al. | AERO: An extensible framework for adaptive web layout synthesis | |
CN109522277A (zh) | 一种多格式文件阅读的方法和装置 | |
CN102254155B (zh) | 准确的字体激活 | |
CN111222065B (zh) | 一种信息展示方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |