CN105320697A - 一种实现杂志数据的存储规范的方法 - Google Patents

一种实现杂志数据的存储规范的方法 Download PDF

Info

Publication number
CN105320697A
CN105320697A CN201410377387.2A CN201410377387A CN105320697A CN 105320697 A CN105320697 A CN 105320697A CN 201410377387 A CN201410377387 A CN 201410377387A CN 105320697 A CN105320697 A CN 105320697A
Authority
CN
China
Prior art keywords
data
label
represent
magazine
periodical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410377387.2A
Other languages
English (en)
Inventor
汤潮
汤杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Longyuan Innovation Information Technology Co Ltd
Original Assignee
Beijing Longyuan Innovation Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Longyuan Innovation Information Technology Co Ltd filed Critical Beijing Longyuan Innovation Information Technology Co Ltd
Priority to CN201410377387.2A priority Critical patent/CN105320697A/zh
Publication of CN105320697A publication Critical patent/CN105320697A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种实现杂志数据的存储规范的方法,涉及杂志数据处理领域。该方法包括如下步骤:S1,设定数据标签,所述标签用于表示所述数据信息;S2,根据所述标签制定XML数据处理格式;S3,按照所述XML数据处理格式进行数据存取。本发明通过建立XML数据存储规范,对杂志进行数据存储和读取时,使用规范的、统一的数据标签名称,从而实现各杂志数据存储、读取的兼容,不会在存储和读取XML数据时出现查找不到内容的问题,进而不需要花费大量的时间对数据内容进行校对和维护。

Description

一种实现杂志数据的存储规范的方法
技术领域
本发明涉及杂志数据处理领域,尤其涉及一种实现杂志数据的存储规范的方法。
背景技术
目前,基于XML的跨平台协议,使用XML在Web上传输、共享信息在期刊杂志行业得到了广泛的使用。
但是,由于杂志的数据格式,数据的标签名称不同,因此,当各杂志数据内容使用XML在同一个平台上共享信息时,就会出现一些查找不到内容问题,在存储和/或读取数据时出现错误,进而需要花费大量的时间对数据内容进行校对和维护。
发明内容
本发明的目的在于提供一种实现杂志数据的存储规范的方法,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种实现杂志数据的存储规范的方法,包括如下步骤:
S1,设定数据标签,所述标签用于表示所述数据信息;
S2,根据所述标签制定XML数据处理格式;
S3,按照所述XML数据处理格式进行数据存取。
具体地,步骤S3包括:
S31,查找数据;
S32,依据所述XML数据处理格式,对所述数据进行存取。
进一步地,步骤S31之后,S32之前还包括:将所述数据与所述XML数据处理格式进行比对,检查所述数据是否有缺少字段,如果不缺少字段,执行步骤S32;如果缺少字段,执行步骤S31,直到不缺少字段。
具体地,步骤S31为:使用ADO.NET链接数据库查找数据。
具体地,步骤S31为:使用文件流代码读取本地磁盘的流文件。
具体地,所述标签包括:能够表示期刊或杂志的基本信息的标签、能够表示作者信息的标签、能够表示标题信息的标签和能够表示文章信息的标签中的至少一种。
更具体地,所述能够表示期刊或杂志的基本信息的标签包括:期刊名称、期刊ID、期刊年份、期刊期号、期刊排序、期刊编号和栏目名称中的至少一种
更具体地,所述能够表示作者信息的标签包括:作者名字和作者来源中的至少一种。
更具体地,所述能够表示标题信息的标签包括:标题ID、标题名称和副标题中的至少一种。
更具体地,所述能够表示文章信息的标签包括:页数、PDF页数、开始页码、结束页码、数据大小、摘要、文本内容、级别、内容插图列表、关键字列表、关联文章、前一篇文章、后一篇文章、创建时间、源开始页面和有无摘要中的至少一种。
本发明的有益效果是:本发明通过建立XML数据存储规范,对杂志在进行数据存储和读取时,使用规范的、统一的数据标签名称,从而实现各杂志数据存储、读取的兼容,不会在存储和读取XML数据时出现查找不到内容的问题,进而不需要花费大量的时间对数据内容进行校对和维护。
附图说明
图1是本发明实施例提供的方法流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
在杂志和期刊行业,由于各杂志的数据格式,数据的标签名称不同,因此,当各杂志数据内容使用XML在同一个平台上共享信息时,就会在存储和/或读取数据时出现查找不到内容的问题。
本发明为了解决上述各期刊社、杂志社存储和/或读取XML数据兼容的问题,本发明实施例提供了一种实现各方XML数据存取兼容的方法,包括如下步骤:
S1,设定数据标签,所述标签用于表示所述数据信息;
S2,根据所述标签制定XML数据处理格式;
S3,按照所述XML数据处理格式进行数据存取。
在本发明的一个实施例中,步骤S3包括:
S31,查找数据;可以使用ADO.NET链接数据库查找数据;也可以使用文件流代码读取本地磁盘的流文件,其中,文件流代码为:
FileStreamaFile=newFileStream("文件名",FileMode.OpenOrCreate);
StreamReadersw=newStreamReader(aFile);
strLine=sr.ReadLine()。
S32,依据所述XML数据处理格式,对所述数据进行存取。在本发明实施例中,可以使用.NETXMLDocument类下面的XMLNode类中的AppendChild()方法将查找出的杂志数据序列化存储到XML中。
在本发明的一个实施例中,步骤S31之后,S32之前还包括:将所述数据与所述XML数据处理格式进行比对,检查所述数据是否有缺少字段,如果不缺少字段,执行步骤S32;如果缺少字段,执行步骤S31,直到不缺少字段。通过这种检查手段,能够正确的对数据进行存取,进一步极大的降低数据存取的错误率,甚至不会出现错误,较好的将杂志的内容展示给客户,从而进一步降低了对数据进行校对和调整的工作量。
本发明的一个实施例中,所述标签包括:能够表示期刊或杂志的基本信息的标签、能够表示作者信息的标签、能够表示标题信息的标签和能够表示文章信息的标签中的至少一种,如本领域技术人员可以理解的,还可以包括其他的能够表示数据信息的标签。在本实施例中,上述标签几乎能够准确的显示期刊或杂志等数据的信息,保证在进行数据存取时,能够得到完整的、准确的信息,不会出现数据存取的错误。
本发明的一个实施例中,所述能够表示期刊或杂志的基本信息的标签包括:期刊名称(MagazineName)、期刊ID(MagazineGuid)、期刊年份(MagazineYear)、期刊期号(Issue)、期刊排序(Sequence)、期刊编号(Issn)和栏目名称(Columns)中的至少一种。如本领域技术人员可以理解的,还可以包括其他的能够表示期刊或杂志的基本信息的标签。在本实施例中,上述标签几乎能够准确的显示期刊或杂志的基本信息,从而保证在进行数据存取时,能够得到完整的、准确的期刊或杂志的基本信息,不会出现期刊或杂志的基本信息存取的错误。
本发明的一个实施例中,所述能够表示作者信息的标签包括:作者名字(Author)和作者来源(AuthorFrom)中的至少一种。如本领域技术人员可以理解的,还可以包括其他的能够表示作者信息的标签。在本实施例中,上述标签几乎能够准确的显示期刊或杂志中作者的信息,从而保证在进行作者信息的数据存取时,能够得到完整的、准确的作者信息,不会出现作者信息存取的错误。
本发明的一个实施例中,所述能够表示标题信息的标签包括:标题ID(TitleID)、标题名称(Title)和副标题(SubTitle)中的至少一种。如本领域技术人员可以理解的,还可以包括其他的能够表示标题信息的标签。在本实施例中,上述标签几乎能够准确的显示期刊或杂志中标题信息,从而保证在进行标题信息的数据存取时,能够得到完整的、准确的标题信息,不会出现标题信息存取的错误。
本发明的一个实施例中,所述能够表示文章信息的标签包括:页数(PageCount)、PDF页数(PdfPageNo)、开始页码(PageStart)、结束页码(PageEnd)、数据大小(WordSize)、摘要(Summary)、文本内容(Content)、级别(Level)、内容插图列表(ImgList)、关键字列表(KeyWordList)、关联文章(RelevantArticleList)、前一篇文章(PreviousArticle)、后一篇文章(NextArticle)、创建时间(CreateDate)、源开始页面(OriginalPageStart)和有无摘要(HasSummary)中的至少一种。如本领域技术人员可以理解的,还可以包括其他的能够表示文章信息的标签。在本实施例中,上述标签几乎能够准确的显示文章信息,从而保证在进行文章信息的数据存取时,能够得到完整的、准确的文章信息,不会出现文章信息存取的错误。
本发明的一个实施例中,XML数据处理格式为:
<MagazineArticleID>0</MagazineArticleID>
<TitleID>...</TitleID>
<Title>...</Title>
<SubTitle/>
<Author>...</Author>
<AuthorFrom/>
<MagazineName>...</MagazineName>
<MagazineGuid>...</MagazineGuid>
<Year></Year>
<Issue></Issue>
<Sequence>...</Sequence>
<Volume/>
<PageCount></PageCount>
<PdfPageNo/>
<Columns>...</Columns>
<IsCover></IsCover>
<PageStart></PageStart>
<PageEnd></PageEnd>
<Price></Price>
<WordSize></WordSize>
<Introduction></Introduction>
<Summary></Summary>
<Content></Content>
<Level></Level>
<ImgList></ImgList>
<ImgListX/>
<KeyWordList></KeyWordList>
通过采用本发明公开的上述技术方案,得到了如下有益的效果:本发明通过建立XML数据存储规范,对杂志在进行数据存储和读取时,使用规范的、统一的数据标签名称,从而实现各杂志数据存储、读取的兼容,不会在存储和读取XML数据时出现查找不到内容的问题,进而不需要花费大量的时间对数据内容进行校对和维护
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (10)

1.一种实现杂志数据的存储规范的方法,其特征在于,包括如下步骤:
S1,设定数据标签,所述标签用于表示所述数据信息;
S2,根据所述标签制定XML数据处理格式;
S3,按照所述XML数据处理格式进行数据存取。
2.根据权利要求1所述的方法,其特征在于,步骤S3包括:
S31,查找数据;
S32,依据所述XML数据处理格式,对所述数据进行存取。
3.根据权利要求2所述的方法,其特征在于,步骤S31之后,S32之前还包括:将所述数据与所述XML数据处理格式进行比对,检查所述数据是否有缺少字段,如果不缺少字段,执行步骤S32;如果缺少字段,执行步骤S31,直到不缺少字段。
4.根据权利要求2所述的方法,其特征在于,步骤S31为:使用ADO.NET链接数据库查找数据。
5.根据权利要求2所述的方法,其特征在于,步骤S31为:使用文件流代码读取本地磁盘的流文件。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述标签包括:能够表示期刊或杂志的基本信息的标签、能够表示作者信息的标签、能够表示标题信息的标签和能够表示文章信息的标签中的至少一种。
7.根据权利要求6所述的方法,其特征在于,所述能够表示期刊或杂志的基本信息的标签包括:期刊名称、期刊ID、期刊年份、期刊期号、期刊排序、期刊编号和栏目名称中的至少一种。
8.根据权利要求6所述的方法,其特征在于,所述能够表示作者信息的标签包括:作者名字和作者来源中的至少一种。
9.根据权利要求6所述的方法,其特征在于,所述能够表示标题信息的标签包括:标题ID、标题名称和副标题中的至少一种。
10.根据权利要求6所述的方法,其特征在于,所述能够表示文章信息的标签包括:页数、PDF页数、开始页码、结束页码、数据大小、摘要、文本内容、级别、内容插图列表、关键字列表、关联文章、前一篇文章、后一篇文章、创建时间、源开始页面和有无摘要中的至少一种。
CN201410377387.2A 2014-08-01 2014-08-01 一种实现杂志数据的存储规范的方法 Pending CN105320697A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410377387.2A CN105320697A (zh) 2014-08-01 2014-08-01 一种实现杂志数据的存储规范的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410377387.2A CN105320697A (zh) 2014-08-01 2014-08-01 一种实现杂志数据的存储规范的方法

Publications (1)

Publication Number Publication Date
CN105320697A true CN105320697A (zh) 2016-02-10

Family

ID=55248097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410377387.2A Pending CN105320697A (zh) 2014-08-01 2014-08-01 一种实现杂志数据的存储规范的方法

Country Status (1)

Country Link
CN (1) CN105320697A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197085A (zh) * 2017-12-29 2018-06-22 北京仁和汇智信息技术有限公司 一种投稿审稿方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058545A (ja) * 2001-08-09 2003-02-28 Sony Corp 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
JP2006092462A (ja) * 2004-09-27 2006-04-06 Data Place Inc 電子ブックコンテンツ向け自動変換システムと電子ブック共通データベースの構築
CN101334775A (zh) * 2007-06-29 2008-12-31 高等教育出版社 基于xml的图书内容结构的形式化表示方法
CN102479248A (zh) * 2011-05-30 2012-05-30 北京中科希望软件股份有限公司 一种电子文档结构化处理的方法和系统
CN102646125A (zh) * 2012-02-28 2012-08-22 中国标准化研究院 一种结构化数字内容析取与重组方法
CN102841890A (zh) * 2011-06-20 2012-12-26 汉王科技股份有限公司 一种用于文档构建的数据加工方法和装置
CN103116592A (zh) * 2012-01-13 2013-05-22 昆山麦克斯泰科技有限公司 一种网页内容的格式化输出方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058545A (ja) * 2001-08-09 2003-02-28 Sony Corp 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
JP2006092462A (ja) * 2004-09-27 2006-04-06 Data Place Inc 電子ブックコンテンツ向け自動変換システムと電子ブック共通データベースの構築
CN101334775A (zh) * 2007-06-29 2008-12-31 高等教育出版社 基于xml的图书内容结构的形式化表示方法
CN102479248A (zh) * 2011-05-30 2012-05-30 北京中科希望软件股份有限公司 一种电子文档结构化处理的方法和系统
CN102841890A (zh) * 2011-06-20 2012-12-26 汉王科技股份有限公司 一种用于文档构建的数据加工方法和装置
CN103116592A (zh) * 2012-01-13 2013-05-22 昆山麦克斯泰科技有限公司 一种网页内容的格式化输出方法
CN102646125A (zh) * 2012-02-28 2012-08-22 中国标准化研究院 一种结构化数字内容析取与重组方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197085A (zh) * 2017-12-29 2018-06-22 北京仁和汇智信息技术有限公司 一种投稿审稿方法和装置

Similar Documents

Publication Publication Date Title
US10318614B2 (en) Transformation of marked-up content into a file format that enables automated browser based pagination
AU2010216343B2 (en) Font handling for viewing documents on the web
US20130174024A1 (en) Method and device for converting document format
CN110083805A (zh) 一种将Word文件转换为EPUB文件的方法及系统
CN104699714B (zh) 将书版格式文件转换为epub格式文件的方法及装置
CN103761277A (zh) 一种ePub电子书的加载方法和系统
RU2018128787A (ru) Поисковые результаты для нативных приложений
CN103309879B (zh) 一种管理word文档中的标记的方法及装置
WO2019075968A1 (zh) 表格信息跨页识别方法、电子设备及计算机可读存储介质
CN104572744B (zh) 结构化文档生成方法和装置
US10063738B2 (en) Digital content access using a machine-readable link
US20120109638A1 (en) Electronic device and method for extracting component names using the same
US20150129653A1 (en) Method and apparatus for providing interoperability between flat and interactive digital forms using machine-readable codes
CN105320697A (zh) 一种实现杂志数据的存储规范的方法
WO2018179002A1 (en) Transformation of marked-up content into a file format that enables automated browser based pagination
US10157238B2 (en) Transformation of marked-up content to a reversible file format for automated browser based pagination
Shelly et al. HTML, XHTML, and CSS: Complete
Klindt PDF/A considered harmful for digital preservation.
CN107423271B (zh) 文档生成方法和装置
Brown et al. IGCSE information and communication technology
Zámborský International Business and Global Strategy-eBooks and textbooks from bookboon. com
CN106484380B (zh) 一种产品文档的生成方法和装置
EP2891989A1 (en) System and method for converting an electronic document from a paginated format to a non-paginated format
Loeper et al. Implementing an EAD-XML compliant workflow at UMBC
Islam et al. Determining The Best Agile SDLC for Bangladesh’s Software Industry

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160210