发明内容
本发明实施例提供一种期刊目录展示方法、装置及设备,以提高期刊目录生成的效率和准确率。
第一方面,本发明实施例提供一种期刊目录展示方法,包括:
获取至少一篇期刊的内容数据;
根据预设的提取路径从所述期刊的内容数据中提取数据,得到所述期刊的总目录数据;
根据预设的展示类型从所述总目录数据中确定所述期刊的排序关键词;
根据所述排序关键词从所述总目录数据中提取数据,得到层级目录数据;
将所述层级目录数据进行排版,得到所述期刊的目录,并将所述目录发送至显示终端显示。
可选的,所述根据预设的提取路径从所述期刊的内容数据中提取数据,得到所述期刊的总目录数据,包括:
根据预设的提取路径遍历所述期刊的内容数据,得到至少一个平级条目,其中,一个所述平级条目对应一篇期刊的内容数据;
根据所述平级条目确定所述期刊的总目录数据。
可选的,所述根据预设的展示类型从所述总目录数据中确定所述期刊的排序关键词,包括:
确定每个所述平级条目中均包括的关键词,得到关键词集合;
根据所述关键词集合在每个所述平级条目中创建关键词节点,其中,所述关键词节点为期号、栏目名和稿件起始页码;
根据预设的展示类型从所述关键词节点中确定排序关键词,其中,所述展示类型为按期号展示型、按栏目名展示型或汇编型展示。
可选的,所述展示类型为所述汇编型展示,所述根据所述排序关键词从所述总目录数据中提取数据,得到层级目录数据,包括:
根据所述关键字从所述总目录数据中提取目录数据;
提取所述目录数据对应的概要信息数据;
根据所述目录数据和所述概要信息数据得到层级目录数据。
可选的,在所述根据所述排序关键词从所述总目录数据中提取数据,得到层级目录数据之后,还包括:
根据交叉引用关系更新所述层级目录数据中数据对应的页码。
第二方面,本发明实施例提供一种期刊目录展示装置,包括:
获取模块,用于获取至少一篇期刊的内容数据;
第一提取模块,用于根据预设的提取路径从所述期刊的内容数据中提取数据,得到所述期刊的总目录数据;
确定模块,用于根据预设的展示类型从所述总目录数据中确定所述期刊的排序关键词;
第二提取模块,用于根据所述排序关键词从所述总目录数据中提取数据,得到层级目录数据;
发送模块,用于将所述层级目录数据进行排版,得到所述期刊的目录,并将所述目录发送至显示终端显示。
可选的,所述第一提取模块,还用于:
根据预设的提取路径遍历所述期刊的内容数据,得到至少一个平级条目,其中,一个所述平级条目对应一篇期刊的内容数据;
根据所述平级条目确定所述期刊的总目录数据。
可选的,所述确定模块,还用于:
确定每个所述平级条目中均包括的关键词,得到关键词集合;
根据所述关键词集合在每个所述平级条目中创建关键词节点,其中,所述关键词节点为期号、栏目名和稿件起始页码;
根据预设的展示类型从所述关键词节点中确定排序关键词,其中,所述展示类型为按期号展示型、按栏目名展示型或汇编型展示。
第三方面,本发明实施例提供一种期刊目录展示设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的期刊目录展示方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的期刊目录展示方法。
本发明实施例提供的一种期刊目录展示方法、装置及设备,采用上述方案后,能够根据预先设置好的展示类型从至少一篇期刊的内容数据中获取期刊的排序关键词,然后再根据排序关键词提取对应的目录内容,最后再对提取到的目录内容进行排版,生成期刊的目录,并在显示终端显示出来,提高了期刊目录生成的效率与准确率。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明实施例提供的期刊目录展示方法的架构示意图,如图1所示,如图1所示,包括服务器101和显示终端102。所述服务器101用于至少一篇期刊的内容数据,并根据获取的期刊的内容数据进行处理,确定期刊的内容数据对应的大纲。然后,再将期刊的内容数据对应的大纲发送至显示终端102显示,使得用户可以直接查看期刊对应的大纲,并根据大纲查找想要查阅的内容。此外,还可以采用客户端获取服务器中的期刊的内容数据,然后再根据获取的期刊的内容数据进行处理,得到期刊的内容数据对应的大纲,再将期刊的内容数据对应的大纲在客户端的显示界面中直接显示出来。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本发明实施例提供的期刊目录展示方法的流程示意图,本实施例的方法可以由服务器101执行。如图2所示,本实施例的方法,可以包括:
S201:获取至少一篇期刊的内容数据。
具体的,在生成期刊的大纲之前,需要先确定生成大纲的对象,即期刊的内容数据。期刊的内容数据可以对应一篇期刊,也可以对应多篇期刊。其中,期刊大多是按期进行印刷并出版的。在一年度发行完成后,一般会对本年度的各期刊物进行汇总,行程期刊大纲。期刊大纲也是用户对本刊物进行快速了解和回顾的关键入口。
此外,按照组织方式,期刊大纲可分为按期汇总型,按栏目汇总型和汇编型。其中,汇编型总目录是一种较为复杂的情况,既可以包括按期或者按栏目汇总的总目录内容,也可以包含各篇稿件的概要信息。
为了能实现期刊大纲的自动提取,且可以更好地适应当前科技期刊移动端阅读、数字出版以及大数据发掘等需求,在各期稿件签发时,已形成了各篇稿件较为规范的XML(eXtensible Markup Language,可扩展标记语言)数据。XML格式是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握和使用。
S202:根据预设的提取路径从所述期刊的内容数据中提取数据,得到所述期刊的总目录数据。
具体的,在得到XML格式的期刊内容数据之后,可以根据预先存储好的模板中确定内容获取路径,即XPath。然后根据XPath从XML格式的期刊内容数据中依次抽取对应的数据内容,得到期刊的总目录数据。其中,得到的期刊的总目录数据是扁平的XML总目录内容文件,还可以称为普适性XML。
S203:根据预设的展示类型从所述总目录数据中确定所述期刊的排序关键词。
具体的,在得到期刊的总目录数据之后,其实是期刊的所有必要的数据内容,内容比较多而且繁杂。为了提高期刊查阅的效率,可以从总目录数据中确定排序关键词。然后根据排序关键词对应生成期刊的大纲。
S204:根据所述排序关键词从所述总目录数据中提取数据,得到层级目录数据。
具体的,在得到排序关键词之后,可以根据排序关键词直接从总目录数据中提取数据,然后将提取得到的数据形成层级目录数据。其中,可以依据模板章节主页分析出预期的排序层级,根据用户设定的具体排序内容,将普适性XML,形成和模板章节主页匹配的具有排序层级的层级目录数据。层级目录数据可以为树形总目录XML,也可以称为上版XML。
此外,在得到排序关键词之后,可以先根据排序关键词对总目录数据中的内容进行位置调整。例如,若排序关键词为期刊号,可以按照期刊号的顺序调整总目录数据中的内容。即可以按照期刊号为1,2,3,4...的顺序排列总目录数据中的内容,而总目录数据中具体的文字信息不会更改。调整完总目录数据中的内容之后,再根据调整完成的总目录数据形成层级目录数据。
S205:将所述层级目录数据进行排版,得到所述期刊的目录,并将所述目录发送至显示终端显示。
具体的,可以根据预存的模板对层级目录数据进行排版,也还可以根据用户触发的模板对层级目录数据进行排版。或者根据用户自行编辑的样式对层级目录数据进行排版,得到期刊的目录。其中,预存的模板可以包含多个章节,每个章节中包含一个章首主页(仅应用一次)和正文主页(可重复应用),总目录章节用于描述希望排出的总目录版式效果,概要信息章节用于描述希望排出的概要信息版式效果。
此外,生成大纲之后,为了方便用户查阅期刊,可以直接将大纲发送至显示终端显示。即用户可以在显示终端查看资源信息对应的大纲。然后用户可以再根据大纲的具体内容对应查阅想要查看的期刊。
采用上述方案后,能够根据预先设置好的展示类型从至少一篇期刊的内容数据中获取期刊的排序关键词,然后再根据排序关键词提取对应的目录内容,最后再对提取到的目录内容进行排版,生成期刊的目录,并在显示终端显示出来,提高了期刊目录生成的效率与准确率。此外本方案通过分析汇编型总目录本质,提出了条目排版思想,依据条目排版思想提出了条目XML定义,并通过和模板相结合的方式,提高了期刊大纲排版的效率。
基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
此外,在一个具体实施方式中,所述根据预设的提取路径从所述期刊的内容数据中提取数据,得到所述期刊的总目录数据,可以包括:
根据预设的提取路径遍历所述期刊的内容数据,得到至少一个平级条目,其中,一个所述平级条目对应一篇期刊的内容数据。
根据所述平级条目确定所述期刊的总目录数据。
具体的,一个所述平级条目可以对应一篇期刊的内容数据,有多少篇期刊就对应有多少个平级条目。一篇期刊的内容数据中对应包含一篇稿件的必要信息,如标题、作者、摘要、稿件起始截止等,放置在稿件的内容数据对应的平级条目中。所有的条目构成了期刊的总目录数据。
此外,在一个具体实施方式中,所述根据预设的展示类型从所述总目录数据中确定所述期刊的排序关键词,可以包括:
确定每个所述平级条目中均包括的关键词,得到关键词集合。
根据所述关键词集合在每个所述平级条目中创建关键词节点,其中,所述关键词节点为期号、栏目名和稿件起始页码。
根据预设的展示类型从所述关键词节点中确定排序关键词,其中,所述展示类型为按期号展示型、按栏目名展示型或汇编型展示。
其中,如图3所示,为本发明实施例提供的关键词样式示意图,EntryRoot为根节点,可包含多个平级的Entry条目。每个Entry对应一篇稿件的必要信息,如标题、作者、摘要、稿件起始截止等,放置在EntryContent中,为便于后续进行重组排序,本文提出了在此先记录排序词的方法。分析总目录规律后,可归纳出3个排序词:期号,栏目名、稿件起始页码。可以根据这三个排序词创建关键词节点。即EntrySortKeyWord节点。
如图4所示,为本发明实施例提供的按期号展示型的样式示意图,图中大纲按照第1期、第2期、第3期等期号顺序进行展示。
如图5所示,为本发明实施例提供的按栏目名展示型的样式示意图,图中大纲按照特稿、经济与管理研究等栏目名顺序进行展示。
如图6所示,为本发明实施例提供的汇编型展示的样式示意图,图中大纲按照汇编型总目录除了按照期号展示了期刊内容之外,还展示第三期中的两篇文章的概要信息。
此外,在一个具体实施方式中,所述展示类型为所述汇编型展示,所述根据所述排序关键词从所述总目录数据中提取数据,得到层级目录数据,包括:
根据所述关键字从所述总目录数据中提取目录数据。
提取所述目录数据对应的概要信息数据。
根据所述目录数据和所述概要信息数据得到层级目录数据。
具体的,如图7所示,为本发明实施例提供的层级目录示意图,层级目录数据具有了良好的层次结果,如图所示为按照“栏目名->期号->稿件起始页码”三级排序的按栏目汇总型XML结构。如果希望达成其他分类效果,如按期汇总型,可以依据普适性XML更换排序词重组即可。Role可以有两种取值,分别为Toc和article。为Toc类型时,表示为总目录条目部分的上版XML内容,为article类型时,表示为概要信息部分的上版XML内容。
此外,在一个具体实施方式中,在所述根据所述排序关键词从所述总目录数据中提取数据,得到层级目录数据之后,还可以包括:
根据交叉引用关系更新所述层级目录数据中数据对应的页码。
具体的,汇编型总目录条目所展示的页码较为特殊,并不来自原来签发的稿件,而是根据稿件概要信息形成的正文重新计算的标题所在页码。对于页码部分,可以在概要信息的标题内容节点上,记录唯一的身份ID,在层级目录数据页码的内容节点上,使用RefID指向此唯一身份ID,通过这对引用关系,将找到的概要信息中标题所在的页码,更新到层级目录数据中的页码位置。然后再对更新之后的层级目录数据进行排版处理,得到期刊的目录。
在一个具体实施方式中,将层级目录数据进行排版时,可以根据总目录条目的上版XML和总目录章节进行自动排版形成总目录部分的排版文件,概要信息的上版XML和概要信息章节进行自动排版形成总目录部分的排版文件,将两个排版文件整合到一起,得到期刊的目录。
如图8所示,为本发明另一实施例提供的期刊目录展示方法的流程示意图,具体可以包括构造普适性xml(期刊的总目录数据)的过程、构造上版xml(层级目录数据)的过程和最终得到期刊的目录的过程。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置,如图9所示,为本发明实施例提供的期刊目录展示装置的结构示意图,可以包括:
获取模块901,用于获取至少一篇期刊的内容数据。
第一提取模块902,用于根据预设的提取路径从所述期刊的内容数据中提取数据,得到所述期刊的总目录数据。
确定模块903,用于根据预设的展示类型从所述总目录数据中确定所述期刊的排序关键词。
第二提取模块904,用于根据所述排序关键词从所述总目录数据中提取数据,得到层级目录数据。
发送模块905,用于将所述层级目录数据进行排版,得到所述期刊的目录,并将所述目录发送至显示终端显示。
此外,在一个具体实施方式中,所述第一提取模块,还可以用于:
根据预设的提取路径遍历所述期刊的内容数据,得到至少一个平级条目,其中,一个所述平级条目对应一篇期刊的内容数据。
根据所述平级条目确定所述期刊的总目录数据。
此外,在一个具体实施方式中,所述确定模块,还可以用于:
确定每个所述平级条目中均包括的关键词,得到关键词集合。
根据所述关键词集合在每个所述平级条目中创建关键词节点,其中,所述关键词节点为期号、栏目名和稿件起始页码。
根据预设的展示类型从所述关键词节点中确定排序关键词,其中,所述展示类型为按期号展示型、按栏目名展示型或汇编型展示。
此外,在一个具体实施方式中,所述展示类型为所述汇编型展示,所述确定模块,还可以用于:
根据所述关键字从所述总目录数据中提取目录数据。
提取所述目录数据对应的概要信息数据。
根据所述目录数据和所述概要信息数据得到层级目录数据。
此外,在一个具体实施方式中,在所述第二提取模块之后,还包括更新模块,所述更新模块可以用于:
根据交叉引用关系更新所述层级目录数据中数据对应的页码。
本发明实施例提供的装置,可以实现上述如图2所示的实施例的方法,其实现原理和技术效果类似,此处不再赘述。
图10为本发明实施例提供的期刊目录展示设备的硬件结构示意图。如图10所示,本实施例提供的设备1000包括:至少一个处理器1001和存储器1002。其中,处理器1001、存储器1002通过总线1003连接。
在具体实现过程中,至少一个处理器1001执行所述存储器1002存储的计算机执行指令,使得至少一个处理器1001可以执行:
获取至少一篇期刊的内容数据。
根据预设的提取路径从所述期刊的内容数据中提取数据,得到所述期刊的总目录数据。
根据预设的展示类型从所述总目录数据中确定所述期刊的排序关键词。
根据排序关键词从所述总目录数据中提取数据,得到层级目录数据。
将层级目录数据进行排版,得到所述期刊的目录,并将目录发送至显示终端显示。
根据预设的提取路径从所述期刊的内容数据中提取数据,得到所述期刊的总目录数据,包括:
根据预设的提取路径遍历所述期刊的内容数据,得到至少一个平级条目,其中,一个平级条目对应一篇期刊的内容数据。
根据平级条目确定所述期刊的总目录数据。
根据预设的展示类型从所述总目录数据中确定所述期刊的排序关键词,包括:
确定所述平级条目中均包括的关键词,得到关键词集合。
根据所述关键词集合在每个所述平级条目中创建关键词节点,其中,所述关键词节点为期号、栏目名和稿件起始页码。
根据预设的展示类型从所述关键词节点中确定排序关键词,其中,展示类型为按期号展示型、按栏目名展示型或汇编型展示。
展示类型为所述汇编型展示,所述根据排序关键词从所述总目录数据中提取数据,得到层级目录数据,包括:
根据关键字从所述总目录数据中提取目录数据。
提取目录数据对应的概要信息数据。
根据所述目录数据和所述概要信息数据得到层级目录数据。
在根据排序关键词从所述总目录数据中提取数据,得到层级目录数据之后,还包括:
根据交叉引用关系更新层级目录数据中数据对应的页码。
处理器1001的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图10所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现上述方法实施例的期刊目录展示方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。