CN114625996A - 网页内容的分页方法、装置、电子设备及可读存储介质 - Google Patents

网页内容的分页方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN114625996A
CN114625996A CN202210251247.5A CN202210251247A CN114625996A CN 114625996 A CN114625996 A CN 114625996A CN 202210251247 A CN202210251247 A CN 202210251247A CN 114625996 A CN114625996 A CN 114625996A
Authority
CN
China
Prior art keywords
file
display
reading
analysis
paragraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210251247.5A
Other languages
English (en)
Inventor
贾来宾
江河
郭琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202210251247.5A priority Critical patent/CN114625996A/zh
Publication of CN114625996A publication Critical patent/CN114625996A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种网页内容的分页方法、装置、电子设备及可读存储介质,涉及互联网技术领域,通过网页阅读器在网页中根据显示请求获取目标文件及其文件格式,并通过解析配置文件根据文件格式对目标文件进行语义化解析获得Json格式的解析文件;再获取网页的阅读显示区域及阅读显示参数,并根据解析文件的目录结构对其进行遍历,根据显示内容、阅读显示参数在阅读显示区域中进行分页适配显示。其中,解析配置文件可以实现不同文件格式对应的语义化解析,适应多种解析需求,并均转化为统一的、不同平台可适配的Json格式,实现多平台显示的复用,适配效果统一,且无需对不同文件格式分别开发解析、适配方法、逻辑、插件等,降低了开发成本。

Description

网页内容的分页方法、装置、电子设备及可读存储介质
技术领域
本发明涉及互联网技术领域,特别是涉及一种网页内容的分页方法、装置、电子设备及可读存储介质。
背景技术
Web APP(Web Application,网络应用程序)基于其跨平台、高复用率、小体积等优点,得到了广泛的开发和应用。相比于Native APP(Native Application,原生应用程序)基于本地操作系统开发运行,从而需要针对不同平台进行开发、安装后才能运行,WebAPP基于标准的W3C页面开发,用户无需安装,即可通过浏览器或webview运行。
但是,以阅读界面为例,在Web APP的界面显示中,不同平台针对不同格式的文件解析逻辑不同,如对txt文本可以通过CSS的columns属性实现文档自动分页、排版等或对txt文本遍历字符铺满页面,对epub文本可以通过调用第三方js类库epub.js对epub文件进行解析后,再基于epub文本的结构进行分页、样式调用等。因此,目前平台中不同的文件格式对应不同的解析逻辑,可能使得部分平台无法解析部分格式的文件,或部分格式的文件在不同平台的解析方式不同,在应用时需要在每一平台设置对应多种格式的文件解析、分页、排版方案,以至于开发成本高,导致Web APP的跨平台性能差,文件解析效率低,还可能导致不同平台界面上文本的适配效果不一。
发明内容
本发明实施的目的在于提供一种网页内容的分页方法、装置、电子设备及可读存储介质,以降低开发成本,提高网页内容分页中文件解析的效率,并实现不同平台界面上的统一适配效果。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种网页内容的分页方法,该方法应用于网页阅读器,该方法可以包括:
在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式;
通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序;
获取所述网页的阅读显示区域,以及阅读显示参数;
按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
在本发明实施的第二方面,还提供了一种网页内容的分页装置,该装置应用于网页阅读器,该装置可以包括:
文件获取模块,用于在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式;
文件解析模块,用于通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序;
参数获取模块,用于获取所述网页的阅读显示区域,以及阅读显示参数;
文件适配模块,用于按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
在本发明实施的第三方面,还提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线实现相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的所述计算机程序时,实现上述任一所述的网页内容的分页方法。
在本发明实施的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的网页内容的分页方法。
在本发明实施的第五方面,还提供了一种包含指令的计算机程序,该计算机程序在计算机上运行时,使得计算机执行上述任一所述的网页内容的分页方法。
在本发明实施中,在网页阅读器中,在网页中接收到对目标文件的显示请求时,获取目标文件以及目标文件的文件格式,此时,可以通过解析配置文件对目标文件进行文件格式对应的语义化解析,获得Json格式的解析文件;再获取网页的阅读显示区域,以及阅读显示参数,从而根据解析文件的目录结构对显示内容进行遍历,在遍历过程中根据显示内容、阅读显示参数在阅读显示区域中进行对应的分页适配显示。其中,解析配置文件可以实现至少两种文件格式分别对应的语义化解析,适应不同文件格式的解析需求,并将不同文件格式的目标文件转化为统一的、不同平台可适配的Json格式,能够适应不同平台的分页适配需求,保证了不同平台显示的复用,适配效果统一,且无需对不同文件格式的文件分别开发解析、适配的方法、逻辑、插件等,降低了开发成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1是本发明实施例提供的一种网页内容的分页方法的步骤流程图之一;
图2是本发明实施例提供的一种网页内容的分页方法的步骤流程图之二;
图3是本发明实施例提供的一种网页阅读器的界面示意图;
图4是本发明实施例提供的一种网页阅读器中标题文本的界面示意图;
图5是本发明实施例提供的一种网页阅读器中段落文本的界面示意图之一;
图6是本发明实施例提供的一种网页阅读器中段落文本的界面示意图之二;
图7是本发明实施例提供的一种网页阅读器中段落文本的界面示意图之三;
图8是本发明实施例提供的一种网页内容的分页方法的步骤流程图之三;
图9是本发明实施例提供的一种阅读显示区域中仿真翻页的界面示意图;
图10是本发明实施例提供的一种网页内容的分页方法的步骤流程图之四;
图11是本发明实施例提供的一种网页内容的分页装置的结构框图;
图12是本发明实施例提供的一种电子设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
本发明实施例提供的网页内容的分页方法可以应用于网页(web)阅读器,不同于原生(Native)应用程序,web阅读器通常基于浏览器实现,侧重于实现浏览、展示等功能,交互性较弱。而由于web阅读器基于浏览器实现,因此可能在多平台应用,如PC(PersonalComputer,个人计算机)、小程序、公众号、H5(HTML5,HyperText Markup Language 5,超文本标记语言5)等,在本发明实施中,可以对不同格式的目标文件转换成统一的、各平台可适配的格式,从而提高目标文件在不同平台的解析效率,降低开发成本,且具有统一、良好的适配效果,具体如下所示:
图1是本发明实施例提供的一种网页内容的分页方法的步骤流程图之一,该方法可以应用于网页阅读器,如图1所示,该方法可以包括:
步骤101、在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式。
本发明实施例中,应用于可以通过网页阅读器解析、适配、显示的电子书文件,网页阅读器可以通过浏览器实现,在网页中进行显示、交互。目标文件可以是不同电子书文件中该网页阅读器待显示的电子书文件,可以通过在网页中接收对待显示的电子书文件的显示请求,以将该电子书文件确定为目标文件,可选地,可以在网页中展示不同电子书文件对应的链接、图标、名称等,并通过在网页中接收对该电子书文件的选择操作作为对该电子书文件的显示请求,或者,也可以将在网页中对电子书文件的上传操作作为对该电子书文件的显示请求,本发明实施例对此不作具体限制。
本发明实施例中,电子书文件可以包括不同文件格式,在网页中接收到目标文件的显示请求的情况下,可以获取目标文件以及确定目标文件对应的文件格式,可选地,电子书的文件格式可以包括TXT(文本文档)、HTML、EPUB(Electronic Publication,电子出版)等。
步骤102、通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序。
本发明实施例中,语义化指对电子书文件中数据、信息的处理方式,通过语义化可以明确描述电子书文件中显示内容之间的关联、属性等,使得电子书文件结构清晰、规整,以使电子书文件在不同平台统一页面显示效果。在本发明实施中,通过解析配置文件可以对目标文件进行文件格式对应的语义化解析,从而将目标文件转化为根据目录结构排序的Json格式文件,Json(JavaScript Object Notation,JS对象简谱)格式是一种轻量级的数据交换数据格式,易于机器解析和生成,如可以是根据文件格式对目标文件的文本、插图等显示内容进行处理,使得目标文件中显示内容基于目录结构的属性与顺序通过统一的规则定义描述并转化为Json格式,其中,目录结构的属性可以用于区分章节、标题、段落、插图等不同显示内容,目录结构的顺序可以用于区分章节、标题、段落、插图等不同显示内容之间的关联。
本发明实施例中,解析配置文件可以实现至少两种文件格式分别对应的语义化解析,从而能够对不同格式的电子书文件兼容处理,适应更多样化的阅读场景,可选地,可以动态调整解析配置文件可实现语义化解析的文件格式,在需要解析该文件格式时在解析配置文件中配置该解析文件格式的语义化解析逻辑,在不需要解析该文件格式时可以在解析配置文件中去除解析该文件格式的语义化解析逻辑,从而对不同文件格式的电子书文件可以根据实际应用的需求解析,实现文件格式解析功能的扩展,进而更进一步地灵活适应不同平台、不同文件的解析需求。
步骤103、获取所述网页的阅读显示区域,以及阅读显示参数。
本发明实施例中,阅读显示区域指电子设备的屏幕区域中用于网页阅读器展示显示内容的区域,根据电子设备屏幕尺寸的不同、网页布局的不同等,阅读显示区域的形状、尺寸可能不同,如阅读显示区域可能是方形、矩形、圆形等;阅读显示参数指网页中对目标文件进行显示时的参数设置,可选地,参数可以包括颜色、亮度、背景、字体、字号、行间距、段间距、页边距等。网页的阅读显示区域、阅读显示参数可以是默认设置,也可以动态接收对阅读显示区域、阅读显示参数的设置操作,本发明实施例对此不作具体限制。
步骤104、按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
本发明实施例中,可以按照目录结构对解析文件中的显示内容进行遍历,如根据章节顺序依次遍历每一章、每一节的文本、插图等;在遍历过程中,根据阅读显示参数对显示内容进行调整,并根据阅读显示区域的形状、尺寸进行分页、适配。在本发明实施中,可以根据目录结构顺序、阅读显示参数等在网页的阅读显示区域内铺满解析文件的显示内容,并在溢出的位置截断分页,再从截断的位置进一步根据目录结构顺序、阅读显示参数等在网页的阅读显示区域内铺满解析文件的显示内容,并在溢出的位置再次截断分页,根据目录结构对显示内容依次遍历,在阅读显示区域内进行铺满、截断分页至显示内容在阅读显示区域中全部铺满,从而实现分页,并适配显示。
在本发明实施中,在网页阅读器中,在网页中接收到对目标文件的显示请求时,获取目标文件以及目标文件的文件格式,此时,可以通过解析配置文件对目标文件进行文件格式对应的语义化解析,获得Json格式的解析文件;再获取网页的阅读显示区域,以及阅读显示参数,从而根据解析文件的目录结构对显示内容进行遍历,在遍历过程中根据显示内容、阅读显示参数在阅读显示区域中进行对应的分页适配显示。其中,解析配置文件可以实现至少两种文件格式分别对应的语义化解析,适应不同文件格式的解析需求,并将不同文件格式的目标文件转化为统一的、不同平台可适配的Json格式,能够适应不同平台的分页适配需求,保证了不同平台显示的复用,适配效果统一,且无需对不同文件格式的文件分别开发解析、适配的方法、逻辑、插件等,降低了开发成本。
图2是本发明实施例提供的一种网页内容的分页方法的步骤流程图之二,该方法可以应用于网页阅读器,如图2所示,该方法可以包括:
步骤201、在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式。
本发明实施例中,步骤201可对应参照前述步骤101的相关描述,为避免重复,在此不再赘述。
步骤202、通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序。
本发明实施例中,步骤202可对应参照前述步骤101的相关描述,为避免重复,在此不再赘述。
可选地,所述解析配置文件在所述网页阅读器中采用插拔式配置。
本发明实施例中,插拔式配置指解析配置文件在网页阅读器中可以根据实际应用需求启用、关闭等,如在目标文件的文件格式为Json格式文件,且其显示内容已经按照目录结构排序的的情况下,解析配置文件无需对目标文件进行统一的格式转换,此时可以不触发解析配置文件对目标文件进行解析或卸载解析配置文件,直接根据目标文件进行后续网页内容的分页过程;或者在网页阅读器仅显示一种文件格式的目标文件,从而无需对多种文件格式进行统一转换适配的场景中,可以不触发或卸载解析配置文件,从而通过对解析配置文件进行插拔式配置能够对网页阅读器不同场景中的应用需求灵活适应。
可选地,所述文件格式为EPUB,所述步骤202包括:
步骤S11、通过解析配置文件获取所述目标文件的目录结构,并从所述目标文件中基于语义化标签抽取不同章节的显示内容,所述显示内容为所述Json格式。
步骤S12、将不同章节的所述显示内容根据所述目录结构的顺序进行重组,获得Json格式的所述解析文件。
本发明实施例中,以文件格式为EPUB的目标文件为例,EPUB的目标文件中通常包括说明该文件格式的mimtype文件,用于存储电子出版物元数据、xhtml文档资源加载顺序等的content.opf文件,以及基于电子出版物目录结构的导航文件nav.xhtml文件,目录结构中可以包括章、节等的线性顺序、嵌套顺序等,还可以包括表格顺序、插图顺序等,是解析以及显示电子出版物的主要信息来源,在txt文件夹中则存储不同章、节对应的html文档,文档中可以定义对应章、节的显示内容。因此,对目标文件进行解析确定文件格式为EPUB格式的情况下,可以根据content.opf文件确定xhtml文档的资源加载顺序,从而读取nav.xhtml文件获取目标文件的目录结构;再从text文件夹中获取各章、节对应的html文档,并对该html文档进行语义化处理获取显示内容,如根据html文档中的语义化标签抽取文档中对应的文本、插图等,再将抽取出不同章、节对应的文本、插图等分别重组成Json结构,在Json结构中文本、插图等按html文档中语义化标签的定义顺序排列;进一步的,根据nav.xhtml文件定义的目录结构对不同章、节对应的显示内容按照顺序重组,获得Json格式的所述解析文件。
本发明实施例中,语义化标签指文档中具有语义的标签,例如html文档的语义化标签可以包括<hn>表示分级标题,<section>表示文档的不同部分如可以是不同章、节等,<body>表示文档内容,<p>表示段落,<figure>表示与文档有关的图例,<figcaption>表示与图例有关的说明···,根据语义化标签可以在各章节的html文档中抽取对应的文本、插图等并重组为Json结构。可选地,上述对EPUB文件格式的解析过程仅用于示例,不同EPUB文件格式的规范可能不同,如也可以采用toc.ncx定义电子出版物的目录结构,针对不同文件格式的规范,可以采用不同的解析方式获取目录结构以及显示内容等,本发明实施例对此不作具体限制。
可选地,所述文件格式为TXT,所述步骤202包括:
步骤S21、通过解析配置文件获取所述目标文件的目录结构,并从所述目标文件中获取不同章节中至少一种所述显示内容;
步骤S22、将每一章节中至少一种所述显示内容转化为所述Json格式;
步骤S23、将不同章节的所述显示内容根据所述目录结构的顺序进行重组,获得Json格式的所述解析文件。
本发明实施例中,由于文件格式为TXT的目标文件内容均为文本,且段落之间以/n分割,可以直接获取每一章、节的标题、正文等显示内容,并根据TXT文件中章、节等的排列顺序确定目录结构;再分别对每一章、节的显示内容进行重组转化为区分标题、正文类型的Json格式,并根据目录结构的章、节顺序对Json格式的显示内容进行重组,以获得Json格式的解析文件。
本发明实施例中,上述EPUB、TXT等文件格式仅用于举例,对其他需求的文件格式,本领域技术人员可以适应性调整解析过程,在目标文件中按章、节等提取Json格式的显示内容,并将显示内容按照目标文件的目录结构进行排序重组,以获得解析文件,从而可以将不同文件格式转换为语义化的、统一的Json格式解析文件,且解析文件中显示内容按照目录结构的顺序排列,便于网页阅读器在多平台的适配显示。
步骤203、获取所述网页的阅读显示区域,以及阅读显示参数。
本发明实施例中,步骤203可对应参照前述步骤103的相关描述,为避免重复,在此不再赘述。
可选地,所述阅读显示区域包括阅读区域宽度和阅读区域高度。
本发明实施例中,以阅读显示区域为方形为例,可以通过确定阅读区域宽度、阅读区域高度确定阅读显示区域的范围,根据电子设备的屏幕区域,以及网页阅读器的布局信息不同,阅读显示区域可以不同,其中,电子设备的屏幕区域为最大显示范围,在该最大显示范围下不同网页阅读器的布局信息可以包括阅读显示区域的位置、形状、边距等,如布局信息可以包括阅读显示区域每条边与屏幕区域对应边的角度、距离关系,也可以包括阅读显示区域每一顶点与屏幕区域中心点的方向、距离关系等。
图3是本发明实施例提供的一种网页阅读器的界面示意图,如图3所示,在电子设备的屏幕区域301中,屏幕区域301的高度为screenH=docuemnt.body.offsetHeight、宽度为screenW=document.body.offsetWidth,网页阅读器的布局信息中高页边距为conPaddigH、宽页边距conPaddingW,则阅读显示区域302的阅读区域宽度为conWidth=screenW-2conPaddingW、阅读区域高度为conHeight=screenH-2conPaddigH。
步骤204、按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述解析文件的显示内容、所述阅读区域宽度、所述阅读区域高度,以及所述阅读显示参数确定所述阅读显示区域中的分页参数,所述分页参数包括文本行数、文本列数。
本发明实施例中,分页参数用于表示阅读显示区域中每一分页可容纳显示内容的容量,在显示内容包括文本的情况下,分页参数可以包括文本行数、文本列数等。在适配显示解析文件时,可以按照解析文件的目录结构对显示内容进行遍历,如可以按照章、节顺序对每一章、节的显示内容逐字、逐句或逐段遍历,在此过程中,可以根据阅读区域宽度、阅读区域高度、阅读显示参数等确定阅读显示区域中每页可容纳的文本行数、文本列数等,从而确定分页参数,如可以将符合阅读显示参数的字符在阅读显示区域中横向排列,在字符的累加长度大于或等于阅读区域宽度的情况下,将字符横向排列的数量作为文本列数,文本行数可由此类推。可选地,显示内容可以包括标题文本、段落文本、插图等,根据不同的显示内容,可以采取不同的方式进行分页适配。
可选地,所述显示内容包括标题文本,所述阅读显示参数包括所述标题文本的标题字体和标题字号,所述步骤204包括:
步骤S31、根据所述标题字体和所述标题字号以及所述阅读区域宽度确定所述标题文本的所述文本列数,所述标题文本的所述文本列数小于或等于在所述标题字体和所述标题字号下所述阅读区域宽度横向容纳的最大字符个数;
步骤S32、根据所述标题文本的字符个数与所述标题文本的所述文本列数,确定标题文本的所述文本行数。
本发明实施例中,显示内容可以是标题文本,则阅读显示参数可以包括标题文本的标题字体、标题字号等,其中,标题字体可以用于设置标题文本的字形,标题字号可以用于设置标题文本的大小,标题字体、标题字号可以采用默认模板,也可以支持动态调整。在标题字体、标题字号的基础上,阅读显示区域宽度可横向容纳标题文本的最大字符个数可以是标题文本的文本列数;进一步的,由于标题文本的字符个数通常较少不会铺满整个阅读显示区域,因此,可以根据标题文本的字符个数、文本列数确定标题文本的文本行数,如将标题文本的字符个数除以标题文本的文本列数,并对计算结果取整获得标题文本的文本行数。
图4是本发明实施例提供的一种网页阅读器中标题文本的界面示意图,如图4所示,显示内容包括标题文本“第一千二百三十三章XXXXX”共15个字符,在标题字体、标题字号的基础上,阅读区域宽度可横向容纳标题文本的最大字符个数为14个,则标题文本的文本列数为14,文本行数为2。
可选地,所述步骤S32之后,还包括:
步骤S33、根据所述标题文本的所述文本行数、所述文本列数、所述标题字体和所述标题字号确定标题区域高度以及标题区域宽度,所述标题区域高度在所述标题字体、所述标题字号下纵向容纳的最大字符个数大于或等于所述标题文本的所述文本行数,所述标题区域宽度在所述标题字体、所述标题字号下横向容纳的最大字符个数大于或等于所述标题文本的所述文本列数;
步骤S34、根据所述标题区域宽度与所述标题区域高度,在所述阅读显示区域中划分标题显示区域。
本发明实施例中,基于网页阅读器的布局信息,还可以在阅读显示区域中划分标题显示区域用于显示标题文本。可选地,根据标题字体、标题字号可以确定标题文本的行高、列宽等,进而根据标题文本的文本行数、行高可以确定标题区域高度,根据标题文本的文本列数、列宽可以确定标题区域宽度,使得标题区域高度在标题字体、标题字号下纵向容纳的最大字符个数大于或等于标题文本的文本行数,标题区域宽度在标题字体、标题字号下横向容纳的最大字符个数大于或等于标题文本的文本列数;进一步的,网页阅读器的布局信息还可以包括标题的边距信息,用于设置标题文本与标题显示区域边界的距离,在此基础上,标题区域宽度、标题区域高度可以进一步累加该边距信息,从而使得划分得到的标题显示区域符合网页阅读器的布局要求。
如图4所示,在阅读显示区域401中根据标题文本划分出了标题显示区域402,其中,标题显示区域的标题区域高度在标题字体、标题字号下纵向容纳的最大字符个数大于标题文本的文本行数,标题区域宽度在标题字体、标题字号下横向容纳的最大字符个数大于或等于标题文本的文本列数,从而适应标题文本以及网页阅读器的布局要求。
本发明实施例中,根据网页阅读器的布局信息,在阅读显示区域内划分标题显示区域后,可以将标题文本显示在标题显示区域中,并在阅读显示区域的其他部分铺满其他文本、插图等显示内容再进行分页;或者也可以将标题文本显示在标题显示区域中并直接分页,再在下一分页继续铺满其他文本、插图等显示内容,从而在当前分页仅显示标题文本,本发明实施例对此不作具体限制。
可选地,所述显示内容包括至少一个段落文本,所述阅读显示参数包括所述段落文本的段落字体和段落字号,所述步骤204包括:
步骤S41、依次遍历每一所述段落文本,根据所述段落字体和所述段落字号以及所述阅读区域宽度确定段落文本的所述文本列数,所述段落文本的所述文本列数小于或等于在所述段落字体和所述段落字号下所述阅读区域宽度横向容纳的最大字符个数;
本发明实施例中,在显示内容可以包括段落文本,则阅读显示参数可以包括段落文本的段落字体、段落字号等,段落文本的文本列数小于或等于在段落字体和段落字号下阅读区域宽度横向容纳的最大字符个数,其中,步骤S41可对应参照前述步骤S31中对标题文本、标题字体、标题字号的相关描述,为避免重复,在此不再赘述。
步骤S42、根据所述段落文本的字符个数、所述段落文本的所述文本列数、所述段落字体、所述段落字号以及所述阅读区域高度,确定所述阅读显示区域中所述段落文本的所述文本行数。
本发明实施例中,由于段落文本通常较多,因此,可以将段落文本铺满整个阅读显示区域并在溢出位置截断分页,在根据步骤S41确定阅读显示区域中段落文本的段落列数后,可以根据段落文本的字符个数、段落列数,以及段落字体、段落字号、阅读区域高度确定段落文本的段落行数。通常来说,在段落文本溢出的情况下,段落文本的段落行数小于或等于阅读区域高度在段落字体、段落字号下可纵向容纳的最大字符个数。
可选地,所述步骤S42包括:
步骤S421、根据所述段落文本的字符个数与所述段落文本的所述文本列数确定所述段落文本的总段落行数。
本发明实施例中,在显示内容包括段落文本的情况下,可以对段落文本逐段遍历,在获得段落列数的情况下,根据该段落列数以及每一段落文本的字符个数确定每一段落文本的总段落行数,如段落列数为20,段落文本1的字符个数为300则段落文本1的总段落行数为15,段落文本2的字符个数为330则段落文本2的总段落行数为17,以此类推。
步骤S422、根据所述段落字体和所述段落字号确定所述段落文本每一行的段落行高,以及根据所述总段落行数与每一行的所述段落行高确定所述段落文本的总段落高度。
本发明实施例中,在确定每一段落文本的总段落行数基础上,可以进一步根据段落行高确定每一段落文本的总段落高度,段落行高可以根据段落字体、段落字号确定段落文本每一行的纵向高度得到,如段落行高为2mm,则段落文本1的总段落高度为30mm,段落文本2的总段落高度为34mm。
步骤S423、在累计至少一个所述段落文本的所述总段落高度等于所述阅读区域高度的情况下,对所述总段落行数进行累计,确定所述阅读显示区域中的所述段落文本的所述文本行数。
本发明实施例中,可以先逐段遍历段落文本,根据段落文本的顺序依次累计段落文本的总段落高度,在累计的总段落高度等于阅读区域高度的情况下,可以确定再进一步累计下一段落文本在阅读显示区域中会发生溢出,因此,可以将已累计的段落文本记为当前分页的段落文本,此时,可以将已累计的段落文本的总段落行数作为阅读显示区域中段落文本的文本行数。如,当阅读显示区域的阅读区域高度为30mm的情况下,先累计段落文本1的总段落高度30mm,此时,已累计的总段落高度等于阅读区域高度,因此,可以将段落文本1的总段落行数15作为当前分页段落文本的文本行数15;当阅读显示区域的阅读区域高度为64mm的情况下,先累计段落文本1的总段落高度30mm,此时已累计的总段落高度小于阅读区域高度,再累计段落文本2的总段落高度34mm,此时已累计的总段落高度等于阅读区域高度,因此,可以累计段落文本1的总段落行数15以及段落文本2的总段落行数17作为当前分页段落文本的文本行数32。另外,在阅读显示区域中包括标题显示区域的情况下,在遍历段落文本时阅读区域高度应去除标题区域高度。
图5是本发明实施例提供的一种网页阅读器中段落文本的界面示意图之一,如图5所示,阅读显示区域501包括标题显示区域502,则在阅读显示区域501中去除标题显示区域502所占的标题区域高度进行段落文本的总段落高度累计,段落文本1、段落文本2已累计的总段落高度等于去除标题区域高度后的阅读区域高度,则将段落文本1、段落文本2的总段落行数累计确定为当前分页段落文本的文本行数。进而可以继续逐段遍历段落文本3、段落文本4···以计算下一分页。
步骤S424、在累计至少一个所述段落文本的所述总段落高度大于所述阅读区域高度的情况下,在所述段落文本中确定跨页段落文本与非跨页段落文本。
本发明实施例中,已累计的段落文本的总段落高度大于阅读区域高度,可以是指在已累计的段落文本中,最后一个段落文本的总段落高度累计前,已累计的总段落高度小于阅读区域高度;而最后一个段落文本的总段落高度累计后已累计的总段落高度大于阅读区域高度,即已累计的最后一个段落文本在阅读显示区域中溢出,部分可在当前分页显示,部分可在下一分页显示。因此,可以在已累计的段落文本中确定非跨页段落文本与跨页段落文本,其中非跨页段落文本为阅读显示区域中可完整显示在当前分页的段落文本,跨页段落文本为阅读显示区域中部分显示在当前分页,部分显示在下一分页的段落文本。
步骤S425、对所述跨页段落文本进行字符遍历,在所述非跨页段落文本的所述总段落高度基础上,依次累计所述跨页段落文本中每一行的所述段落行高。
步骤S426、在所述非跨页段落文本的所述总段落高度基础上,依次累计所述跨页段落文本中每一行的所述段落行高等于所述阅读区域高度的情况下,根据所述非跨页段落文本以及所述跨页段落文本中每一行的累计行数确定所述阅读显示区域中所述段落文本的所述文本行数。
本发明实施例中,可以确定在已累计的段落文本中跨页段落文本需要进行截断分页,可以对跨页段落文本进行逐个字符遍历,从而在非跨页段落文本的总段落高度基础上,逐行累计跨页段落文本中每一行的段落行高,在已累计的非跨页段落文本的总段落高度以及跨页段落文本的段落行高等于阅读区域高度的情况下,可以确定已累计的非跨页段落文本以及跨页段落文本中的段落行数铺满阅读显示区域的当前分页,因此,可以在已累计的跨页段落文本中的段落行数处截断跨页段落文本,将已累计的非跨页段落文本以及跨页段落文本中的段落行数作为阅读显示区域当前分页段落文本的段落行数。
图6是本发明实施例提供的一种网页阅读器中段落文本的界面示意图之二,如图6所示,阅读显示区域601中,段落文本3、段落文本4和段落文本5的总段落高度累计超过阅读区域高度,此时,段落文本3、段落文本4为非跨页段落文本,段落文本5为跨页段落文本,则对段落文本5进行逐个字符遍历,依次累计每一行的段落行高,在累计到段落文本5第二行的情况下,已累计的段落文本3和段落文本4的总段落高度以及段落文本5的两行段落行高等于阅读显示区域高度,则在段落文本5的第二行截断段落文本5,并将段落文本3、段落文本4以及两行段落文本5的段落行数作为当前分页段落文本的段落行数。
可选地,所述步骤S426之后,还包括:
步骤S427、在所述阅读显示区域中所述段落文本的所述文本行数处截断所述跨页段落文本,并对截断之后的所述跨页段落文本继续遍历,依次累计所述跨页段落文本每一行的所述段落行高。
步骤S428、在累计所述跨页段落文本每一行的所述段落行高的基础上,继续根据所述段落文本的所述段落行高、所述总段落高度以及所述阅读区域高度,在所述阅读显示区域的下一分页中确定所述段落文本的所述文本行数。
本发明实施例中,截断跨页段落文本后,可以将截断位置之后的跨页段落文本铺至下一分页,此时,可以先依次累计跨页段落文本截断位置之后的段落行高,并在已累计跨页段落文本的段落行高基础上,逐段落遍历之后每一段落文本的总段落行高,执行步骤S41~步骤S42计算分页。可选地,可以在段落文本中对跨页段落本进行标识,以区分跨页段落文本与非跨页段落文本,并指示在下一分页截断位置之后的跨页段落文本无需首行缩进。
图7是本发明实施例提供的一种网页阅读器中段落文本的界面示意图之三,如图7所示,在图6的基础上,从第二行截断段落文本5后,在下一分页将段落文本5从第三行以后铺满阅读显示区域601,并在此基础上,根据阅读区域高度继续铺满段落文本6、段落文本7、段落文本8。
可选地,所述显示内容还包括插图,所述分页参数还包括插图位置,所述步骤204包括:
步骤S51、将所述插图的插图宽度适配所述阅读区域宽度,使所述插图宽度小于或等于所述阅读区域宽度。
步骤S52、根据所述阅读区域高度、所述显示文本的字符个数、所述文本列数、所述文本字体、所述文本字号以及所述插图的插图高度,确定所述阅读显示区域中的所述文本行数和所述插图位置。
本发明实施例中,插图可以是示例图、表情图片、艺术字图片等,在显示内容中包括插图的情况下,可以将插图的插图宽度适配阅读区域宽度,如可以放大、缩小、拉伸插图使得插图宽度等于阅读区域宽度,或可以根据网页阅读器的布局信息使得插图宽度小于阅读区域宽度,在适配插图宽度的过程中可以适应性调整插图高度,以避免插图变形。对插图宽度适配后,可以根据插图的插图高度确定插图位置,如在阅读显示区域中未累计段落文本,且插图高度小于或等于阅读区域高度的情况下,可以将插图插入当前分页;在阅读显示区域中未累计段落文本,且插图高度大于阅读区域高度的情况下,可以进一步调整插图高度使其小于阅读区域高度再插入当前分页;在阅读显示区域已累计段落文本的情况下,可以在阅读区域高度中去除已累计段落文本的高度后,再根据插图高度与阅读区域高度确定插图的插图位置,在插图插入当前分页后,在阅读显示区域未被铺满的情况下,可以继续遍历段落文本,或适配下一张插图。
本发明实施例中,插图位于段落文本中的情况下,可以先将段落文本中的插图替换为占位字符,并对包括占位字符的段落文本先进行遍历、分页适配,再将段落文本中的占位字符替换为对应的插图,在替换的过程中参照步骤S51~S52对插图进行的分页适配。
步骤205、根据所述分页参数对所述解析文件的显示内容进行对应的分页适配显示。
本发明实施例中,在确定显示内容基于阅读显示参数、阅读显示区域的分页参数后,可以对解析文件的显示内容进行分页适配显示,如根据当前分页的分页参数在阅读显示区域中对段落文本横向排列文本列数对应的字符数,并纵向排列文本行数对应的字符数,在插图位置插入对应插图等,从而在阅读显示区域中适配显示该解析文件的显示内容。
在本发明实施中,在网页阅读器中,在网页中接收到对目标文件的显示请求时,获取目标文件以及目标文件的文件格式,此时,可以通过解析配置文件对目标文件进行文件格式对应的语义化解析,获得Json格式的解析文件;再获取网页的阅读显示区域,以及阅读显示参数,从而根据解析文件的目录结构对显示内容进行遍历,在遍历过程中根据显示内容、阅读显示参数在阅读显示区域中进行对应的分页适配显示。其中,解析配置文件可以实现至少两种文件格式分别对应的语义化解析,适应不同文件格式的解析需求,并将不同文件格式的目标文件转化为统一的、不同平台可适配的Json格式,能够适应不同平台的分页适配需求,保证了不同平台显示的复用,适配效果统一,且无需对不同文件格式的文件分别开发解析、适配的方法、逻辑、插件等,降低了开发成本。
图8是本发明实施例提供的一种网页内容的分页方法的步骤流程图之三,该方法可以应用于网页阅读器,如图8所示,该方法可以包括:
步骤701、在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式。
步骤702、通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序。
步骤703、获取所述网页的阅读显示区域,以及阅读显示参数。
本发明实施例中,步骤701-步骤703可对应参照前述步骤101-步骤103,或步骤201-步骤203的相关内容,为避免重复,在此不再赘述。
步骤704、按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页。
本发明实施例中,步骤704可参照前述步骤104,或步骤204中分页的相关内容,为避免重复,在此不再赘述。
本发明实施例中,对语义化的Json格式解析文件进行分页,使得不同文件格式的目标文件可以转换为易被解读的Json格式分页结构,便于不同类型的浏览器、小程序、应用程序等平台解析,能够实现多平台复用功能,其中,Json格式的分页结构可以如下所示:
Figure BDA0003546761880000141
Figure BDA0003546761880000151
上述结构通过在Json格式的解析文件中区分标题、文本、插图等类型的内容能够更好的指示机器解读,在此基础上,通过标识章节、页码实现了对解析文件的分页。
可选地,所述阅读显示参数包括翻页方式。
步骤705、根据所述翻页方式对所述分页进行适配显示。
本发明实施例中,翻页方式指阅读显示区域从当前分页切换到下一分页的方式,翻页方式不同时分页的组合、拼接方式可能不同,从而可以根据翻页方式对分页进行适配显示,可选地,翻页方式可以包括平滑翻页、仿真翻页等。
可选地,所述翻页方式为平滑翻页,所述步骤705包括:
步骤S61、根据所述平滑翻页的翻页方向对所述分页进行拼接,并对所述分页进行适配显示。
本发明实施例中,平滑翻页指阅读显示区域通过翻页方向的滑动从当前分页切换到下一分页,在平滑翻页过程中当前分页逐渐滑出阅读显示区域,下一分页逐渐滑入阅读显示区域,当前分页与下一分页之间不重叠。此时,可以根据翻页方向对分页进行拼接,如在翻页方向为左右翻页时按照分页的顺序对分页进行左右拼接,在翻页方向为上下时按照分页的顺序对分页进行上下拼接,在阅读显示区域接收到翻页指示时,可以根据翻页方向将当前分页从左边界滑出阅读显示区域,并同时将与当前分页左右拼接的下一分页从右边界滑入阅读显示区域;或将当前分页从上边界滑出阅读显示区域,并同时将与当前分页上下拼接的下一分页从下边界滑入阅读显示区域。
可选地,所述翻页方式为仿真翻页,所述步骤705包括:
步骤S71、根据所述分页的顺序构建所述仿真翻页对应的图层,并对所述分页进行适配显示。
本发明实施例中,仿真翻页指阅读显示区域中通过当前分页翻起显露下一分页的翻页方式,仿真翻页通常是模拟纸质书在翻页过程中的效果,在仿真翻页过程中阅读显示区域通常包括当前分页显示区域,当前分页翻起区域,以及下一分页显示区域,通过当前分页翻起区域模拟纸张卷曲的效果,并通过当前分页显示区域逐渐缩小,下一分页显示区域逐渐扩大至下一分页铺满整个阅读显示区域完成翻页,其中,实现仿真翻页是可以根据分页的顺序依次构建每一分页的图层,在仿真翻页过程中可以确定阅读显示区域中当前分页显示区域,当前分页翻起区域,以及下一分页显示区域,并对当前分页与下一分页的图层进行翻转、旋转、裁剪等操作绘制当前分页显示区域、当前分页翻起区域以及下一分页显示区域中的显示内容。
图9是本发明实施例提供的一种阅读显示区域中仿真翻页的界面示意图,如图9所示,点A为阅读显示区域801接收翻页指示的触摸点,点F为触摸点对应的边缘顶点,直线EH为直线AF的垂直平分线,点G是直线AF的中点,AB、AK、DI是直线,以点C为起点、点E为控制点、点B为终点绘制贝塞尔曲线CDB,以点K为起点、点H为控制点、点J为终点绘制贝塞尔曲线KIJ,从而在阅读显示区域801中划分得到当前分页显示区域8011,当前分页翻起区域8012,以及下一分页显示区域8013,此时,可以对当前分页的图层进行翻转、裁剪、旋转等绘制到当前分页显示区域8011,当前分页翻起区域8012,对下一分页的图层进行裁剪绘制到下一分页显示区域8013,以实现仿真翻页。
可选地,所述步骤704之后,还包括:
步骤706、根据所述分页的顺序为每一所述分页生成对应的页码。
本发明实施例中,对显示内容进行分页后,还可以对每一分页生成对应的页码,可选地,可以在所有显示内容均完成分页后对每一分页顺序生成页码,也可以在完成每一分页时依次生成对应页码,如在阅读显示区域中铺满段落文本后,生成“key为`${当前章节}_${当前页码}`”的段落结构数据,指示当前分页的章节以及页码。
在本发明实施中,在网页阅读器中,在网页中接收到对目标文件的显示请求时,获取目标文件以及目标文件的文件格式,此时,可以通过解析配置文件对目标文件进行文件格式对应的语义化解析,获得Json格式的解析文件;再获取网页的阅读显示区域,以及阅读显示参数,从而根据解析文件的目录结构对显示内容进行遍历,在遍历过程中根据显示内容、阅读显示参数在阅读显示区域中进行对应的分页适配显示。其中,解析配置文件可以实现至少两种文件格式分别对应的语义化解析,适应不同文件格式的解析需求,并将不同文件格式的目标文件转化为统一的、不同平台可适配的Json格式,能够适应不同平台的分页适配需求,保证了不同平台显示的复用,适配效果统一,且无需对不同文件格式的文件分别开发解析、适配的方法、逻辑、插件等,降低了开发成本。
图10是本发明实施例提供的一种网页内容的分页方法的步骤流程图之四,该方法可以应用于网页阅读器,如图10所示,该方法可以包括:
步骤901、在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式。
步骤902、通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序。
步骤903、获取所述网页的阅读显示区域,以及阅读显示参数。
步骤904、按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
本发明实施例中,步骤901-步骤904可对应参照前述步骤101-步骤104,或步骤201-步骤204的相关内容,为避免重复,在此不再赘述。
步骤905、在所述网页中接收对所述阅读显示区域、所述阅读显示参数中至少一个的变更操作。
本发明实施例中,变更操作可以是对阅读显示区域、阅读显示参数等影响显示内容排版的变更,如可以变更阅读显示区域的形状、阅读区域高度、阅读区域宽度等,也可以变更阅读显示参数中文本的字体、字号等,也可以变更插图的插图高度、插图宽度、插图位置等,也可以改变网页阅读器的布局信息等,本发明实施例对此不作具体限制。
步骤906、响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
本发明实施例中,在阅读显示区域、阅读显示参数根据变更操作发生变化的情况下,可以重新按照目录结构对解析文件的显示内容进行遍历,采用变更后的阅读显示参数、阅读显示区域等对显示内容进行分页适配显示,具体适配过程可参照前述步骤101-步骤104,或步骤201-步骤204的相关内容,为避免重复,在此不再赘述。
可选地,所述步骤906之前,还包括:
步骤S81、获取所述阅读显示区域中所述显示内容的显示进度。
本发明实施例中,显示进度可以是目标文件的显示内容在阅读显示区域中已显示的部分在全部显示内容中的占比,可选地,显示进度可以采用百分比、页码、章节、字数等表示,可以实时获取阅读显示区域中显示内容的显示进度,也可以周期性获取显示内容的显示进度。
则所述步骤906具体包括:
响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页,并根据所述显示进度在所述阅读显示区域中适配显示。
本发明实施例中,响应于变更操作重新按照目录结构对解析文件的显示内容进行遍历,采用变更后的阅读显示参数、阅读显示区域等对显示内容进行分页后,还可以根据接收变更操作前的显示进度重新定位响应变更操作后阅读显示区域中该显示进度对应的显示内容,并适配显示,如接收变更操作前解析文件的显示内容共分20页,并且阅读显示区域中显示内容的显示进度为第10页,响应于变更操作调小段落文本的字号重新遍历分为18页,则根据20页中第10页的显示进度定位到18页中第9页,在阅读显示区域中显示重新分页后18页中第9页的显示内容。
在本发明实施中,在网页阅读器中,在网页中接收到对目标文件的显示请求时,获取目标文件以及目标文件的文件格式,此时,可以通过解析配置文件对目标文件进行文件格式对应的语义化解析,获得Json格式的解析文件;再获取网页的阅读显示区域,以及阅读显示参数,从而根据解析文件的目录结构对显示内容进行遍历,在遍历过程中根据显示内容、阅读显示参数在阅读显示区域中进行对应的分页适配显示。其中,解析配置文件可以实现至少两种文件格式分别对应的语义化解析,适应不同文件格式的解析需求,并将不同文件格式的目标文件转化为统一的、不同平台可适配的Json格式,能够适应不同平台的分页适配需求,保证了不同平台显示的复用,适配效果统一,且无需对不同文件格式的文件分别开发解析、适配的方法、逻辑、插件等,降低了开发成本。
图11是本发明实施例提供的一种网页内容的分页装置1000的结构框图,如图11所示,该装置可以包括:
文件获取模块1001,用于在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式;
文件解析模块1002,用于通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序;
参数获取模块1003,用于获取所述网页的阅读显示区域,以及阅读显示参数;
文件适配模块1004,用于按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
可选地,所述阅读显示区域包括阅读区域宽度和阅读区域高度,所述文件适配模块1004,包括:
分页参数子模块,用于在遍历过程中根据所述解析文件的显示内容、所述阅读区域宽度、所述阅读区域高度,以及所述阅读显示参数确定所述阅读显示区域中的分页参数,所述分页参数包括文本行数、文本列数;
文件分页子模块,用于根据所述分页参数对所述解析文件的显示内容进行对应的分页适配显示。
可选地,所述阅读显示参数包括翻页方式,所述文件适配模块1004,包括:
所述文件分页子模块,还用于按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页;
翻页适配子模块,用于根据所述翻页方式对所述分页进行适配显示。
可选地,所述装置还包括:
页码生成模块,用于根据所述分页的顺序为每一所述分页生成对应的页码。
可选地,所述装置还包括:
变更模块,用于在所述网页中接收对所述阅读显示区域、所述阅读显示参数中至少一个的变更操作;
所述文件适配模块1004,还用于响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
可选地,所述装置还包括:
进度获取模块,用于获取所述阅读显示区域中所述显示内容的显示进度。
所述文件适配模块1004,具体用于响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页,并根据所述显示进度在所述阅读显示区域中适配显示。
可选地,解析配置文件在所述网页阅读器中采用插拔式配置。
在本发明实施中,在网页阅读器中,在网页中接收到对目标文件的显示请求时,获取目标文件以及目标文件的文件格式,此时,可以通过解析配置文件对目标文件进行文件格式对应的语义化解析,获得Json格式的解析文件;再获取网页的阅读显示区域,以及阅读显示参数,从而根据解析文件的目录结构对显示内容进行遍历,在遍历过程中根据显示内容、阅读显示参数在阅读显示区域中进行对应的分页适配显示。其中,解析配置文件可以实现至少两种文件格式分别对应的语义化解析,适应不同文件格式的解析需求,并将不同文件格式的目标文件转化为统一的、不同平台可适配的Json格式,能够适应不同平台的分页适配需求,保证了不同平台显示的复用,适配效果统一,且无需对不同文件格式的文件分别开发解析、适配的方法、逻辑、插件等,降低了开发成本。
本发明实施例还提供了一种电子设备,如图12所示,包括处理器1101、通信接口1102、存储器1103和通信总线1104,其中,处理器1101,通信接口1102,存储器1103通过通信总线1104完成相互间的通信,
存储器1103,用于存放计算机程序;
处理器1101,用于执行存储器1103上所存放的程序时,实现如下步骤:
在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式;
通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序;
获取所述网页的阅读显示区域,以及阅读显示参数;
按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
可选地,所述阅读显示区域包括阅读区域宽度和阅读区域高度,所述在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示,包括:
在遍历过程中根据所述解析文件的显示内容、所述阅读区域宽度、所述阅读区域高度,以及所述阅读显示参数确定所述阅读显示区域中的分页参数,所述分页参数包括文本行数、文本列数;
根据所述分页参数对所述解析文件的显示内容进行对应的分页适配显示。
可选地,所述阅读显示参数包括翻页方式,所述按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示,包括:
按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页;
根据所述翻页方式对所述分页进行适配显示。
可选地,所述按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页之后,还包括:
根据所述分页的顺序为每一所述分页生成对应的页码。
可选地,所述按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示之后,还包括:
在所述网页中接收对所述阅读显示区域、所述阅读显示参数中至少一个的变更操作;
响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
可选地,所述响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示之前,还包括:
获取所述阅读显示区域中所述显示内容的显示进度;
所述响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示,包括:
响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页,并根据所述显示进度在所述阅读显示区域中适配显示。
可选地,所述解析配置文件在所述网页阅读器中采用插拔式配置。
在本发明实施中,在网页阅读器中,在网页中接收到对目标文件的显示请求时,获取目标文件以及目标文件的文件格式,此时,可以通过解析配置文件对目标文件进行文件格式对应的语义化解析,获得Json格式的解析文件;再获取网页的阅读显示区域,以及阅读显示参数,从而根据解析文件的目录结构对显示内容进行遍历,在遍历过程中根据显示内容、阅读显示参数在阅读显示区域中进行对应的分页适配显示。其中,解析配置文件可以实现至少两种文件格式分别对应的语义化解析,适应不同文件格式的解析需求,并将不同文件格式的目标文件转化为统一的、不同平台可适配的Json格式,能够适应不同平台的分页适配需求,保证了不同平台显示的复用,适配效果统一,且无需对不同文件格式的文件分别开发解析、适配的方法、逻辑、插件等,降低了开发成本。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的网页内容的分页方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的网页内容的分页方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种网页内容的分页方法,其特征在于,所述方法应用于网页端阅读器,所述方法包括:
在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式;
通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序;
获取所述网页的阅读显示区域,以及阅读显示参数;
按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
2.根据权利要求1所述的方法,其特征在于,所述阅读显示区域包括阅读区域宽度和阅读区域高度,所述在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示,包括:
在遍历过程中根据所述解析文件的显示内容、所述阅读区域宽度、所述阅读区域高度,以及所述阅读显示参数确定所述阅读显示区域中的分页参数,所述分页参数包括文本行数、文本列数;
根据所述分页参数对所述解析文件的显示内容进行对应的分页适配显示。
3.根据权利要求1所述的方法,其特征在于,所述阅读显示参数包括翻页方式,所述按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示,包括:
按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页;
根据所述翻页方式对所述分页进行适配显示。
4.根据权利要求3所述的方法,其特征在于,所述按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页之后,还包括:
根据所述分页的顺序为每一所述分页生成对应的页码。
5.根据权利要求1所述的方法,其特征在于,所述按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示之后,还包括:
在所述网页中接收对所述阅读显示区域、所述阅读显示参数中至少一个的变更操作;
响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
6.根据权利要求5所述的方法,其特征在于,所述响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示之前,还包括:
获取所述阅读显示区域中所述显示内容的显示进度;
所述响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示,包括:
响应于所述变更操作,重新按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页,并根据所述显示进度在所述阅读显示区域中适配显示。
7.根据权利要求1所述的方法,其特征在于,所述解析配置文件在所述网页阅读器中采用插拔式配置。
8.一种网页内容的分页装置,其特征在于,所述装置应用于网页阅读器,所述装置包括:
文件获取模块,用于在网页中接收对目标文件的显示请求,获取目标文件以及所述目标文件对应的文件格式;
文件解析模块,用于通过解析配置文件对目标文件进行所述文件格式对应的语义化解析,获得Json格式的解析文件,所述解析配置文件用于实现至少两种所述文件格式分别对应的语义化解析,所述解析文件的显示内容根据目录结构排序;
参数获取模块,用于获取所述网页的阅读显示区域,以及阅读显示参数;
文件适配模块,用于按照所述目录结构对所述解析文件的显示内容进行遍历,在遍历过程中根据所述阅读显示参数,以及所述解析文件的显示内容在所述阅读显示区域中进行对应的分页适配显示。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线实现相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的所述计算机程序时,实现权利要求1-7任一所述的网页内容的分页方法。
10.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的网页内容的分页方法。
CN202210251247.5A 2022-03-14 2022-03-14 网页内容的分页方法、装置、电子设备及可读存储介质 Pending CN114625996A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210251247.5A CN114625996A (zh) 2022-03-14 2022-03-14 网页内容的分页方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210251247.5A CN114625996A (zh) 2022-03-14 2022-03-14 网页内容的分页方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN114625996A true CN114625996A (zh) 2022-06-14

Family

ID=81901108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210251247.5A Pending CN114625996A (zh) 2022-03-14 2022-03-14 网页内容的分页方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114625996A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114297695A (zh) * 2021-12-30 2022-04-08 北京奇艺世纪科技有限公司 文本加密方法、文本解密方法及装置
CN115759000A (zh) * 2023-01-10 2023-03-07 深圳市英唐数码科技有限公司 一种基于单引擎的多格式阅读器的处理方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114297695A (zh) * 2021-12-30 2022-04-08 北京奇艺世纪科技有限公司 文本加密方法、文本解密方法及装置
CN114297695B (zh) * 2021-12-30 2024-05-31 北京奇艺世纪科技有限公司 文本加密方法、文本解密方法及装置
CN115759000A (zh) * 2023-01-10 2023-03-07 深圳市英唐数码科技有限公司 一种基于单引擎的多格式阅读器的处理方法和装置
CN115759000B (zh) * 2023-01-10 2023-05-12 深圳市英唐数码科技有限公司 一种基于单引擎的多格式阅读器的处理方法和装置

Similar Documents

Publication Publication Date Title
CN101361059B (zh) 支持在便携设备上显示内容的系统和方法
KR101121070B1 (ko) 큰 오브젝트를 작은 디스플레이 위에 표현
US8539342B1 (en) Read-order inference via content sorting
US6336124B1 (en) Conversion data representing a document to other formats for manipulation and display
CN103500118B (zh) 一种级联样式表优化方法和装置
EP2291010A1 (en) Structure processing method and apparatus for layout file
CN114625996A (zh) 网页内容的分页方法、装置、电子设备及可读存储介质
US20150220490A1 (en) Processing of page-image based document to generate a re-targeted document for different display devices which support different types of user input methods
JP2009510650A (ja) 動的に集約された文書のための調和構成を備えたマルチフォームデザイン
JP2005522771A (ja) 文書を表示するための方法、システム、コンピュータプログラムおよび記憶装置
CN105069060B (zh) 一种html文档分页排版方法
CN113515928B (zh) 电子文本生成方法、装置、设备及介质
CN103166981A (zh) 一种无线网页转码方法及装置
Ahmadi et al. User-centric adaptation of Web information for small screens
CN114118011A (zh) 文档处理方法、电子设备及存储介质
CN103365877B (zh) 对网页进行转码后建立目录的方法以及服务器
CN103942211A (zh) 一种正文页的识别方法及装置
CN106446139A (zh) 一种提取网页内容的方法及装置
CN114791988A (zh) 一种基于浏览器的pdf文件解析方法、系统、存储介质
CN112433995A (zh) 文件格式转换方法、系统、计算机设备及存储介质
WO2018179002A1 (en) Transformation of marked-up content into a file format that enables automated browser based pagination
CN111143749A (zh) 一种网页展示方法、装置、设备及存储介质
CN112434487B (zh) 一种图文排版方法、装置及电子设备
US7461341B2 (en) Structured document display processor, method for processing display of structured document, and program for displaying structured document
CN114637505A (zh) 一种页面内容提取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination