CN103729412A - 适用于大规模文献集群移动数字出版的系统和方法 - Google Patents

适用于大规模文献集群移动数字出版的系统和方法 Download PDF

Info

Publication number
CN103729412A
CN103729412A CN201310676645.2A CN201310676645A CN103729412A CN 103729412 A CN103729412 A CN 103729412A CN 201310676645 A CN201310676645 A CN 201310676645A CN 103729412 A CN103729412 A CN 103729412A
Authority
CN
China
Prior art keywords
metadata
content
intelligent terminal
periodical
author
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310676645.2A
Other languages
English (en)
Inventor
郑继承
杨蕾
童菲
段家喜
邓迎
汤超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINESE LASER PRESS Co Ltd
Original Assignee
CHINESE LASER PRESS Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHINESE LASER PRESS Co Ltd filed Critical CHINESE LASER PRESS Co Ltd
Priority to CN201310676645.2A priority Critical patent/CN103729412A/zh
Publication of CN103729412A publication Critical patent/CN103729412A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种适用于大规模文献集群移动数字出版的系统,包括装置:期刊元数据分析结构化处理模块,用于将期刊内容转换为指定格式的元数据数字内容,并将元数据数字内容发送给资源数据库以及文件服务器;资源数据库;文件服务器,用于根据应用服务器的请求将元数据数字内容生成发布文件;软件应用接口,用于为远程智能终端提调用服务;应用服务器,用于将发布文件发送给远程智能终端。本发明还提供了相应的方法。本发明能够将期刊出版单位的期刊文献内容和相关信息快速部署和分发到内容服务器,并使得智能终端能够在在线和离线环境下顺利浏览和阅读这些内容,结合触摸屏技术实现科研合作关系图谱功能,具有显著的社会和经济效益。

Description

适用于大规模文献集群移动数字出版的系统和方法
技术领域
本发明属于计算机、多媒体、图形图像、数据库、网络及智能触屏技术在期刊移动数字出版领域的应用解决方案,提供了一整套适合大规模期刊集群快速进行移动数字出版的方法及配套装置系统,具体涉及适用于大规模期刊集群移动数字出版的方法及装置。
背景技术
现有技术中的数字出版方案通常为电子书技术、单期电子期刊应用(APP)、传统网络数字出版、含期刊内容的移动类应用程序等。
(1)电子书技术:目前的电子书都以某一种格式存储图书文献的元数据,并将所有的内容直接打包成为一个文件或若干个关联文件,用户使用时需下载整个电子书压缩文件(包);本发明中也会将文献元数据通过一定结构进行存储,但最终用户只在需要阅读的时才下载指定的内容而无需下载全部文件。
(2)单期电子期刊应用(APP):该技术是利用不同的技术将期刊单独一期的内容制作成一款可以在各类智能操作系统运行的应用程序,且这些应用程序一般放在大型应用商店中由用户自行下载使用,是与本发明最为接近但又相互区别的一项技术。
(3)传统网络数字出版:传统的网络数字出版主要指通过传统计算机网络、数据库、多媒体技术相结合通过服务器/浏览器模式(即:B/S模式)向个人电脑用户提供数字内容服务的技术,与本发明也有着密切的联系和显著的区别。
发明内容
针对现有技术中的缺陷,本发明提供一种适用于大规模期刊集群移动数字出版的方法及装置,其目的在于解决大规模期刊集群出版者在利用手机、平板电脑等各型智能终端进行移动数字出版时所面临的普遍问题,包含大规模期刊集群文献数据的元数据结构标准、文献元数据在服务器端的存储形态、期刊联系出版过程中的元数据即时上传和更新、服务器端向智能客户端实时推送文献数据、元数据中的文献关联实时图谱生成和拓扑等技术问题。
根据本发明提供的适用于大规模文献集群移动数字出版的系统,包括如下装置:
期刊元数据分析结构化处理模块,用于将期刊内容转换为指定格式的元数据数字内容,并将元数据数字内容发送给资源数据库以及文件服务器;
资源数据库,用于以结构化方式存储元数据数字内容;
文件服务器,用于根据应用服务器的请求将元数据数字内容生成发布文件;
软件应用接口,用于为远程智能终端提调用服务;
应用服务器,用于将发布文件通过软件应用接口发送给远程智能终端。
优选地,所述期刊元数据分析结构化处理模块在转换格式前先将期刊内容数据进行颗粒化操作。
优选地,所述元数据数字内容包括如下任一种或任多种信息:
论文标题、作者、摘要、知识元、参考文献、全文链接、出版时间、上线时间、加密数据。
优选地,所述软件应用接口包括:文献信息数据接口;
所述文献信息数据接口根据远程智能终端的调用指令中的参数名称,将资源数据库中相应参数的参数信息返回给远程智能终端。
优选地,所述软件应用接口包括:全文内容获取接口;
所述全文内容获取接口根据远程智能终端的调用指令中的文献识别编号,将资源数据库中相应的文献返回给远程智能终端。
优选地,所述软件应用接口包括:作者科研关系合作图谱后端数据接口;
所述作者科研关系合作图谱后端数据接口根据远程智能终端的调用指令中的作者姓名信息,将资源数据库中相应的科研关系合作图谱信息返回给远程智能终端。
优选地,所述科研关系合作图谱信息采用格式化XML数据结构,该格式化XML数据结构含一个作者根节点,作者根节点包含若干个作者节点和其相关联的作者节点;每个节点接收到远程智能终端的触摸指令后能够继续调用所述作者科研关系合作图谱后端数据接口形成另一个拓扑图,从而一层一层进行拓扑,完成了作者的关联。
根据本发明提供的适用于大规模文献集群移动数字出版的方法,包括如下步骤:
-利用期刊元数据分析结构化处理模块将期刊内容转换为指定格式的元数据数字内容,并将元数据数字内容发送给资源数据库以及文件服务器;
-利用资源数据库以结构化方式存储元数据数字内容;
-利用文件服务器根据应用服务器的请求将元数据数字内容生成发布文件;
-利用软件应用接口为远程智能终端提调用服务;
-利用应用服务器将发布文件通过软件应用接口发送给远程智能终端。
与现有技术相比,本发明具有如下的有益效果:
(1)利用本发明进行大规模期刊集群移动数字出版,可以将期刊出版单位的期刊文献内容和相关信息快速部署和分发到内容服务器,并使得智能终端能够在在线和离线环境下顺利浏览和阅读这些内容。
(2)本发明可以大批量地将传统期刊文献信息资源迅速转换为数字化内容并以结构化方式存储在数据服务器中,通过中间应用服务器的软件服务接口,以可靠的控制方式将内容分发、传播到智能终端,特别适合基于苹果iOS和谷歌Android的智能手机进行浏览、下载、阅读和使用,结合这些设备的触摸屏技术,实现文献作者、知识元的科研合作关系图谱等功能。
(3)本发明经过实际的测试应用,能够同时支持300种以上的大规模期刊集群同时实现移动数字出版,具有显著的社会和经济效益,能够实现移动数字出版,提供苹果iOS系统下的期刊内容和资讯的出版和传播。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明装置系统示意图。
图2为发明装置界面示意图。
图中:
①表示单期或多期的期刊内容转换为带有一定格式的元数据数字内容;
②表示资源数据库;
③表示文件服务器;
④表示适合远程智能终端调用的软件应用接口;
⑤表示应用服务器;
⑥表示计算机网络/移动网络;
⑦表示各种类型的移动终端;
⑧表示期刊数字出版服务;
⑨表示文献数字出版服务;
⑩表示科研合作关系图谱。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
利用如图1所示的装置系统,本发明实现了通过苹果iOS、谷歌Android、微软windows等智能操作系统在线获取远程服务器上的期刊文献、信息资源;期刊出版者可以实现在线的、连续地移动数字出版,方便地将期刊内容、资讯分发、传播至移动终端。该方案实现了:
(1)、本发明创造性地将期刊出版者所生产的期刊(单期或多期)内容转换为带有一定格式的元数据数字内容,如图1中的①所示,该元数据数字内容格式包含论文标题、作者、摘要、知识元、参考文献、全文链接、出版时间、上线时间、加密数据等精细化要素,可以通过图1中示出的“期刊元数据分析结构化处理工具”将文献数据适当颗粒化并转换为适合xml和图1中②所示资源数据库及图1中③所示文件服务器存储需要的结构化内容和全文文件,从而实现了期刊文献内容的结构化、数字化处理。并将这些结构化内容存储在远程服务器中,使得智能终端在获取内容的时候能按需下载,无须像电子书一样要下载整期或整本电子书内容。
(2)、本发明提供了一系列适合远程智能终端调用的软件应用接口,通过这些接口可以将数据库资源和文件服务器上的期刊全文内容通过图1中④所示的应用服务器对外提供服务,这些接口涉及:期刊集群浏览、期刊卷期导览、单期文献列表、单篇文献摘要、单篇文献在线和离线全文阅读和下载、关联文献列表、热门资讯列表、单篇资讯阅读、文献作者科研合作关系、文献学科主题交叉关系等接口。这些接口分为三大类:
A、期刊论文列表、论文摘要,消息列表、消息详细xml格式数据接口
该接口调用方式为:http://www.XXXXXXXXXX.net/getAppXML.axd?type=数据类型&sn=asn【+相关参数】
参数说明:
其中sn=asn为某个随机会话编码,防止未经授权访问;相关参数根据type参数的不同,需要提供不同个数和不同名称的参数,见下述说明:
type数据类型参数目前支持以下13个关键词videolist、newslist、newsrlist、news、artlist、artrlist、issuelist、last12list、art、artfull、reviewcount、reviewlist、review。每个参数根据功能的不同返回不同XML数据,如当类型为artlist时返回如下格式的xml内容:
Figure BDA0000435627370000051
Figure BDA0000435627370000061
B、单篇论文全文PDF内容获取接口
该接口调用方式为:http://www.XXXXXXXXXX.net/viewfull4app.htm?aid=论文编号&sn=asn
参数说明:aid为单篇论文的唯一识别编号ID,sn为防止恶意下载的安全码程序中随机编码。此调用返回该指定编号的论文PDF文件。
C、作者科研关系合作图谱后端数据接口
该接口调用方式为:http://www.XXXXXXXXXX.net/GetRelatedAuthor2.htm?au=作者名
参数说明:其总au参数为要查询其合作关系的作者姓名,调用时au参数需要进行html编码,此调用返回如下数据结构:
Figure BDA0000435627370000062
Figure BDA0000435627370000071
通过这些改进和软件接口以及在服务器端的数据分析服务和客户端的应用逻辑,其已适合向各种移动终端随时随地提供无缝服务,并且不是单一款单期和单个期刊移动应用所能媲美的。
(3)、本发明充分利用了智能终端的智能操作系统在线和离线存储功能,开发出适合苹果iOS、谷歌Android、微软windows等操作系统进行移动出版的核心程序集。智能终端用户通过如图1中⑦所示的各型终端通过图1中⑥所示的计算机和移动网络可以从图1中⑤所示的应用服务器获取各类服务,如:浏览期刊集群中的期刊、浏览期刊单期的文献、查阅新闻资讯,在线阅读下载全文、本地存储、离线阅读文献等功能,如图2中⑧、⑨所示。通过这些改进,本发明实现了传统出版与移动出版即时、无缝的衔接,只要出版者的内容结构化数字化处理完毕,即可从移动终端随时访问。
(4)、本发明充分利用了智能终端的硬件功能,优化了触控展示效果,提供了可无限拓扑的科研合作关系图谱,如图2中⑩所示,终端用户只要点击文献或资讯的作者或知识元,软件就会自动获取远程服务器接口提供的作者科研合作关系或文献学科主题交叉关系,随即弹出该可视化科研关系图谱,可以点击和拖动其中的每个节点,点击这些节点可以进入下一次拓扑,也可以采用两次点击(double tap)获取该节点的关联文献、资讯信息。该技术的要点是:通过上述接口C的适当参数调用,客户端应用将获取一个返回的格式化XML数据结构,该结构含一个authors根节点,其下包含若干个作者(author)和其相关联的作者(rauthor)节点。author节点表示与调用的作者(au)有合作关系的作者,name为该合作者姓名,字符串型;count为次数,整数型,第一个count为10000的为作者本人。rauthor节点为与上述author节点作者合作的信息,name为第一圈的作者,name2为二级合作的作者,count为name和name2合作的次数。这个数据结构通过客户端应用逻辑实时生成合作图谱的内外2层数据模型,author为与调用参数(au)相关的那些作者间的合作关系,rauthor是外圈与第一圈的作者之间的合作关系。通过图谱响应智能终端的拖曳、触屏事件,当tap某个节点作者时,继续调用该数据接口形成另一个拓扑图,从而一层一层进行拓扑,完成了作者的关联。文献的主题知识元关联也采用了类似的方法和技术。
本发明在国内外期刊移动数字出版目前属首创,非常适合展现科研合作关系和未来学科交叉关系。本发明是较为新颖的原创发明,是目前市场上各类期刊移动应用所未具备的拓展功能,具有较大发展空间。
本发明经过实际的应用,能够同时支持300种以上的大规模期刊集群同时实现移动数字出版,并能够提供苹果iOS系统下的期刊内容和资讯的出版和传播,具有显著的社会和经济效益。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (8)

1.一种适用于大规模文献集群移动数字出版的系统,其特征在于,包括如下装置:
期刊元数据分析结构化处理模块,用于将期刊内容转换为指定格式的元数据数字内容,并将元数据数字内容发送给资源数据库以及文件服务器;
资源数据库,用于以结构化方式存储元数据数字内容;
文件服务器,用于根据应用服务器的请求将元数据数字内容生成发布文件;
软件应用接口,用于为远程智能终端提调用服务;
应用服务器,用于将发布文件通过软件应用接口发送给远程智能终端。
2.根据权利要求1所述的适用于大规模文献集群移动数字出版的系统,其特征在于,所述期刊元数据分析结构化处理模块在转换格式前先将期刊内容数据进行颗粒化操作。
3.根据权利要求1所述的适用于大规模文献集群移动数字出版的系统,其特征在于,所述元数据数字内容包括如下任一种或任多种信息:
论文标题、作者、摘要、知识元、参考文献、全文链接、出版时间、上线时间、加密数据。
4.根据权利要求1所述的适用于大规模文献集群移动数字出版的系统,其特征在于,所述软件应用接口包括:文献信息数据接口;
所述文献信息数据接口根据远程智能终端的调用指令中的参数名称,将资源数据库中相应参数的参数信息返回给远程智能终端。
5.根据权利要求1所述的适用于大规模文献集群移动数字出版的系统,其特征在于,所述软件应用接口包括:全文内容获取接口;
所述全文内容获取接口根据远程智能终端的调用指令中的文献识别编号,将资源数据库中相应的文献返回给远程智能终端。
6.根据权利要求1所述的适用于大规模文献集群移动数字出版的系统,其特征在于,所述软件应用接口包括:作者科研关系合作图谱后端数据接口;
所述作者科研关系合作图谱后端数据接口根据远程智能终端的调用指令中的作者姓名信息,将资源数据库中相应的科研关系合作图谱信息返回给远程智能终端。
7.根据权利要求6所述的适用于大规模文献集群移动数字出版的系统,其特征在于,所述科研关系合作图谱信息采用格式化XML数据结构,该格式化XML数据结构含一个作者根节点,作者根节点包含若干个作者节点和其相关联的作者节点;每个节点接收到远程智能终端的触摸指令后能够继续调用所述作者科研关系合作图谱后端数据接口形成另一个拓扑图,从而一层一层进行拓扑,完成了作者的关联。
8.一种适用于大规模文献集群移动数字出版的方法,其特征在于,包括如下步骤:
-利用期刊元数据分析结构化处理模块将期刊内容转换为指定格式的元数据数字内容,并将元数据数字内容发送给资源数据库以及文件服务器;
-利用资源数据库以结构化方式存储元数据数字内容;
-利用文件服务器根据应用服务器的请求将元数据数字内容生成发布文件;
-利用软件应用接口为远程智能终端提调用服务;
-利用应用服务器将发布文件通过软件应用接口发送给远程智能终端。
CN201310676645.2A 2013-12-11 2013-12-11 适用于大规模文献集群移动数字出版的系统和方法 Pending CN103729412A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310676645.2A CN103729412A (zh) 2013-12-11 2013-12-11 适用于大规模文献集群移动数字出版的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310676645.2A CN103729412A (zh) 2013-12-11 2013-12-11 适用于大规模文献集群移动数字出版的系统和方法

Publications (1)

Publication Number Publication Date
CN103729412A true CN103729412A (zh) 2014-04-16

Family

ID=50453486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310676645.2A Pending CN103729412A (zh) 2013-12-11 2013-12-11 适用于大规模文献集群移动数字出版的系统和方法

Country Status (1)

Country Link
CN (1) CN103729412A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893604A (zh) * 2016-04-21 2016-08-24 成都数联铭品科技有限公司 一种海量关联信息处理及可视化实现方法
CN105930461A (zh) * 2016-04-21 2016-09-07 成都数联铭品科技有限公司 实现关联信息节点可视化追踪的数据处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783906A (zh) * 2010-03-23 2010-07-21 烽火通信科技股份有限公司 一种iptv产品中epg的实现方法
CN101833730A (zh) * 2010-04-30 2010-09-15 浙江大学 个性化数字出版系统及其方法
CN102855295A (zh) * 2012-08-14 2013-01-02 周宇 一种基于个人能力发展需求描述的出版标签表达系统
CN102904751A (zh) * 2012-09-25 2013-01-30 华为软件技术有限公司 网络拓扑视图的生成方法和装置
CN102982028A (zh) * 2011-09-02 2013-03-20 北大方正集团有限公司 用于提取文档结构的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783906A (zh) * 2010-03-23 2010-07-21 烽火通信科技股份有限公司 一种iptv产品中epg的实现方法
CN101833730A (zh) * 2010-04-30 2010-09-15 浙江大学 个性化数字出版系统及其方法
CN102982028A (zh) * 2011-09-02 2013-03-20 北大方正集团有限公司 用于提取文档结构的方法和装置
CN102855295A (zh) * 2012-08-14 2013-01-02 周宇 一种基于个人能力发展需求描述的出版标签表达系统
CN102904751A (zh) * 2012-09-25 2013-01-30 华为软件技术有限公司 网络拓扑视图的生成方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
侯剑华等: "CiteSpace软件应用研究的回顾与展望", 《现代情报》 *
黄孝章等: "《数字出版实用教程》", 28 February 2013 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893604A (zh) * 2016-04-21 2016-08-24 成都数联铭品科技有限公司 一种海量关联信息处理及可视化实现方法
CN105930461A (zh) * 2016-04-21 2016-09-07 成都数联铭品科技有限公司 实现关联信息节点可视化追踪的数据处理方法

Similar Documents

Publication Publication Date Title
Das et al. Big data analytics: A framework for unstructured data analysis
JP2020194567A (ja) ウェブコンテンツ生成方法およびシステム
CN101122921B (zh) 基于ajax与html标记形成树形显示结构的方法
CN105760397B (zh) 物联网本体模型处理方法及装置
CN102939579A (zh) 绑定用户接口元素和粒度反映处理的方法和装置
CN104484216A (zh) 服务接口文档和在线测试工具生成方法、装置
CN103618774A (zh) 一种基于网络行为的资源推荐方法及装置、系统
CN106412034B (zh) 业务处理方法及装置
CN101883084A (zh) 用于对网络服务通信进行适配的方法、适配器和适配器系统
CN105007314B (zh) 面向海量读者阅读数据的大数据处理系统
CN101819584A (zh) 轻量级智能网页内容解析方法
Nadee et al. Towards data extraction of dynamic content from JavaScript Web applications
CN102325143B (zh) 一种基于云平台的信息收集存储和加密检索系统
CN104021124A (zh) 用于处理网页数据的方法、装置和系统
CN103034655A (zh) 一种用户行为信息的收集方法、系统及相关设备
CN111797297B (zh) 页面数据处理方法、装置、计算机设备及存储介质
CN103729412A (zh) 适用于大规模文献集群移动数字出版的系统和方法
CN107844517A (zh) 一种用于大规模文献集群移动的数字出版系统及方法
Xie et al. An artificial intelligence based news feature mining system based on the Internet of Things and multi-sensor fusion
CN109561146A (zh) 文件下载方法、装置、终端设备
CN113918142B (zh) 数据采集任务代码生成方法、装置、计算机设备
CN103235787A (zh) 一种用于提供关于目标对象的目标信息的方法与设备
Pandit et al. Implementation of Nutrition based REST APIs for Health Management Applications and Testing with Automation
Oh et al. A Design and Implementation of the CoAP Adaptor for Communication Between DDS-Based Adaptors and External Devices
CN110825760A (zh) 一种基于移动终端的情报知识管理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140416