CN105320697A - 一种实现杂志数据的存储规范的方法 - Google Patents
一种实现杂志数据的存储规范的方法 Download PDFInfo
- Publication number
- CN105320697A CN105320697A CN201410377387.2A CN201410377387A CN105320697A CN 105320697 A CN105320697 A CN 105320697A CN 201410377387 A CN201410377387 A CN 201410377387A CN 105320697 A CN105320697 A CN 105320697A
- Authority
- CN
- China
- Prior art keywords
- data
- label
- represent
- magazine
- periodical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明公开了一种实现杂志数据的存储规范的方法,涉及杂志数据处理领域。该方法包括如下步骤:S1,设定数据标签,所述标签用于表示所述数据信息;S2,根据所述标签制定XML数据处理格式;S3,按照所述XML数据处理格式进行数据存取。本发明通过建立XML数据存储规范,对杂志进行数据存储和读取时,使用规范的、统一的数据标签名称,从而实现各杂志数据存储、读取的兼容,不会在存储和读取XML数据时出现查找不到内容的问题,进而不需要花费大量的时间对数据内容进行校对和维护。
Description
技术领域
本发明涉及杂志数据处理领域,尤其涉及一种实现杂志数据的存储规范的方法。
背景技术
目前,基于XML的跨平台协议,使用XML在Web上传输、共享信息在期刊杂志行业得到了广泛的使用。
但是,由于杂志的数据格式,数据的标签名称不同,因此,当各杂志数据内容使用XML在同一个平台上共享信息时,就会出现一些查找不到内容问题,在存储和/或读取数据时出现错误,进而需要花费大量的时间对数据内容进行校对和维护。
发明内容
本发明的目的在于提供一种实现杂志数据的存储规范的方法,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种实现杂志数据的存储规范的方法,包括如下步骤:
S1,设定数据标签,所述标签用于表示所述数据信息;
S2,根据所述标签制定XML数据处理格式;
S3,按照所述XML数据处理格式进行数据存取。
具体地,步骤S3包括:
S31,查找数据;
S32,依据所述XML数据处理格式,对所述数据进行存取。
进一步地,步骤S31之后,S32之前还包括:将所述数据与所述XML数据处理格式进行比对,检查所述数据是否有缺少字段,如果不缺少字段,执行步骤S32;如果缺少字段,执行步骤S31,直到不缺少字段。
具体地,步骤S31为:使用ADO.NET链接数据库查找数据。
具体地,步骤S31为:使用文件流代码读取本地磁盘的流文件。
具体地,所述标签包括:能够表示期刊或杂志的基本信息的标签、能够表示作者信息的标签、能够表示标题信息的标签和能够表示文章信息的标签中的至少一种。
更具体地,所述能够表示期刊或杂志的基本信息的标签包括:期刊名称、期刊ID、期刊年份、期刊期号、期刊排序、期刊编号和栏目名称中的至少一种
更具体地,所述能够表示作者信息的标签包括:作者名字和作者来源中的至少一种。
更具体地,所述能够表示标题信息的标签包括:标题ID、标题名称和副标题中的至少一种。
更具体地,所述能够表示文章信息的标签包括:页数、PDF页数、开始页码、结束页码、数据大小、摘要、文本内容、级别、内容插图列表、关键字列表、关联文章、前一篇文章、后一篇文章、创建时间、源开始页面和有无摘要中的至少一种。
本发明的有益效果是:本发明通过建立XML数据存储规范,对杂志在进行数据存储和读取时,使用规范的、统一的数据标签名称,从而实现各杂志数据存储、读取的兼容,不会在存储和读取XML数据时出现查找不到内容的问题,进而不需要花费大量的时间对数据内容进行校对和维护。
附图说明
图1是本发明实施例提供的方法流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
在杂志和期刊行业,由于各杂志的数据格式,数据的标签名称不同,因此,当各杂志数据内容使用XML在同一个平台上共享信息时,就会在存储和/或读取数据时出现查找不到内容的问题。
本发明为了解决上述各期刊社、杂志社存储和/或读取XML数据兼容的问题,本发明实施例提供了一种实现各方XML数据存取兼容的方法,包括如下步骤:
S1,设定数据标签,所述标签用于表示所述数据信息;
S2,根据所述标签制定XML数据处理格式;
S3,按照所述XML数据处理格式进行数据存取。
在本发明的一个实施例中,步骤S3包括:
S31,查找数据;可以使用ADO.NET链接数据库查找数据;也可以使用文件流代码读取本地磁盘的流文件,其中,文件流代码为:
FileStreamaFile=newFileStream("文件名",FileMode.OpenOrCreate);
StreamReadersw=newStreamReader(aFile);
strLine=sr.ReadLine()。
S32,依据所述XML数据处理格式,对所述数据进行存取。在本发明实施例中,可以使用.NETXMLDocument类下面的XMLNode类中的AppendChild()方法将查找出的杂志数据序列化存储到XML中。
在本发明的一个实施例中,步骤S31之后,S32之前还包括:将所述数据与所述XML数据处理格式进行比对,检查所述数据是否有缺少字段,如果不缺少字段,执行步骤S32;如果缺少字段,执行步骤S31,直到不缺少字段。通过这种检查手段,能够正确的对数据进行存取,进一步极大的降低数据存取的错误率,甚至不会出现错误,较好的将杂志的内容展示给客户,从而进一步降低了对数据进行校对和调整的工作量。
本发明的一个实施例中,所述标签包括:能够表示期刊或杂志的基本信息的标签、能够表示作者信息的标签、能够表示标题信息的标签和能够表示文章信息的标签中的至少一种,如本领域技术人员可以理解的,还可以包括其他的能够表示数据信息的标签。在本实施例中,上述标签几乎能够准确的显示期刊或杂志等数据的信息,保证在进行数据存取时,能够得到完整的、准确的信息,不会出现数据存取的错误。
本发明的一个实施例中,所述能够表示期刊或杂志的基本信息的标签包括:期刊名称(MagazineName)、期刊ID(MagazineGuid)、期刊年份(MagazineYear)、期刊期号(Issue)、期刊排序(Sequence)、期刊编号(Issn)和栏目名称(Columns)中的至少一种。如本领域技术人员可以理解的,还可以包括其他的能够表示期刊或杂志的基本信息的标签。在本实施例中,上述标签几乎能够准确的显示期刊或杂志的基本信息,从而保证在进行数据存取时,能够得到完整的、准确的期刊或杂志的基本信息,不会出现期刊或杂志的基本信息存取的错误。
本发明的一个实施例中,所述能够表示作者信息的标签包括:作者名字(Author)和作者来源(AuthorFrom)中的至少一种。如本领域技术人员可以理解的,还可以包括其他的能够表示作者信息的标签。在本实施例中,上述标签几乎能够准确的显示期刊或杂志中作者的信息,从而保证在进行作者信息的数据存取时,能够得到完整的、准确的作者信息,不会出现作者信息存取的错误。
本发明的一个实施例中,所述能够表示标题信息的标签包括:标题ID(TitleID)、标题名称(Title)和副标题(SubTitle)中的至少一种。如本领域技术人员可以理解的,还可以包括其他的能够表示标题信息的标签。在本实施例中,上述标签几乎能够准确的显示期刊或杂志中标题信息,从而保证在进行标题信息的数据存取时,能够得到完整的、准确的标题信息,不会出现标题信息存取的错误。
本发明的一个实施例中,所述能够表示文章信息的标签包括:页数(PageCount)、PDF页数(PdfPageNo)、开始页码(PageStart)、结束页码(PageEnd)、数据大小(WordSize)、摘要(Summary)、文本内容(Content)、级别(Level)、内容插图列表(ImgList)、关键字列表(KeyWordList)、关联文章(RelevantArticleList)、前一篇文章(PreviousArticle)、后一篇文章(NextArticle)、创建时间(CreateDate)、源开始页面(OriginalPageStart)和有无摘要(HasSummary)中的至少一种。如本领域技术人员可以理解的,还可以包括其他的能够表示文章信息的标签。在本实施例中,上述标签几乎能够准确的显示文章信息,从而保证在进行文章信息的数据存取时,能够得到完整的、准确的文章信息,不会出现文章信息存取的错误。
本发明的一个实施例中,XML数据处理格式为:
<MagazineArticleID>0</MagazineArticleID>
<TitleID>...</TitleID>
<Title>...</Title>
<SubTitle/>
<Author>...</Author>
<AuthorFrom/>
<MagazineName>...</MagazineName>
<MagazineGuid>...</MagazineGuid>
<Year></Year>
<Issue></Issue>
<Sequence>...</Sequence>
<Volume/>
<PageCount></PageCount>
<PdfPageNo/>
<Columns>...</Columns>
<IsCover></IsCover>
<PageStart></PageStart>
<PageEnd></PageEnd>
<Price></Price>
<WordSize></WordSize>
<Introduction></Introduction>
<Summary></Summary>
<Content></Content>
<Level></Level>
<ImgList></ImgList>
<ImgListX/>
<KeyWordList></KeyWordList>
通过采用本发明公开的上述技术方案,得到了如下有益的效果:本发明通过建立XML数据存储规范,对杂志在进行数据存储和读取时,使用规范的、统一的数据标签名称,从而实现各杂志数据存储、读取的兼容,不会在存储和读取XML数据时出现查找不到内容的问题,进而不需要花费大量的时间对数据内容进行校对和维护
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
Claims (10)
1.一种实现杂志数据的存储规范的方法,其特征在于,包括如下步骤:
S1,设定数据标签,所述标签用于表示所述数据信息;
S2,根据所述标签制定XML数据处理格式;
S3,按照所述XML数据处理格式进行数据存取。
2.根据权利要求1所述的方法,其特征在于,步骤S3包括:
S31,查找数据;
S32,依据所述XML数据处理格式,对所述数据进行存取。
3.根据权利要求2所述的方法,其特征在于,步骤S31之后,S32之前还包括:将所述数据与所述XML数据处理格式进行比对,检查所述数据是否有缺少字段,如果不缺少字段,执行步骤S32;如果缺少字段,执行步骤S31,直到不缺少字段。
4.根据权利要求2所述的方法,其特征在于,步骤S31为:使用ADO.NET链接数据库查找数据。
5.根据权利要求2所述的方法,其特征在于,步骤S31为:使用文件流代码读取本地磁盘的流文件。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述标签包括:能够表示期刊或杂志的基本信息的标签、能够表示作者信息的标签、能够表示标题信息的标签和能够表示文章信息的标签中的至少一种。
7.根据权利要求6所述的方法,其特征在于,所述能够表示期刊或杂志的基本信息的标签包括:期刊名称、期刊ID、期刊年份、期刊期号、期刊排序、期刊编号和栏目名称中的至少一种。
8.根据权利要求6所述的方法,其特征在于,所述能够表示作者信息的标签包括:作者名字和作者来源中的至少一种。
9.根据权利要求6所述的方法,其特征在于,所述能够表示标题信息的标签包括:标题ID、标题名称和副标题中的至少一种。
10.根据权利要求6所述的方法,其特征在于,所述能够表示文章信息的标签包括:页数、PDF页数、开始页码、结束页码、数据大小、摘要、文本内容、级别、内容插图列表、关键字列表、关联文章、前一篇文章、后一篇文章、创建时间、源开始页面和有无摘要中的至少一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410377387.2A CN105320697A (zh) | 2014-08-01 | 2014-08-01 | 一种实现杂志数据的存储规范的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410377387.2A CN105320697A (zh) | 2014-08-01 | 2014-08-01 | 一种实现杂志数据的存储规范的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105320697A true CN105320697A (zh) | 2016-02-10 |
Family
ID=55248097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410377387.2A Pending CN105320697A (zh) | 2014-08-01 | 2014-08-01 | 一种实现杂志数据的存储规范的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105320697A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197085A (zh) * | 2017-12-29 | 2018-06-22 | 北京仁和汇智信息技术有限公司 | 一种投稿审稿方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058545A (ja) * | 2001-08-09 | 2003-02-28 | Sony Corp | 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム |
JP2006092462A (ja) * | 2004-09-27 | 2006-04-06 | Data Place Inc | 電子ブックコンテンツ向け自動変換システムと電子ブック共通データベースの構築 |
CN101334775A (zh) * | 2007-06-29 | 2008-12-31 | 高等教育出版社 | 基于xml的图书内容结构的形式化表示方法 |
CN102479248A (zh) * | 2011-05-30 | 2012-05-30 | 北京中科希望软件股份有限公司 | 一种电子文档结构化处理的方法和系统 |
CN102646125A (zh) * | 2012-02-28 | 2012-08-22 | 中国标准化研究院 | 一种结构化数字内容析取与重组方法 |
CN102841890A (zh) * | 2011-06-20 | 2012-12-26 | 汉王科技股份有限公司 | 一种用于文档构建的数据加工方法和装置 |
CN103116592A (zh) * | 2012-01-13 | 2013-05-22 | 昆山麦克斯泰科技有限公司 | 一种网页内容的格式化输出方法 |
-
2014
- 2014-08-01 CN CN201410377387.2A patent/CN105320697A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058545A (ja) * | 2001-08-09 | 2003-02-28 | Sony Corp | 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム |
JP2006092462A (ja) * | 2004-09-27 | 2006-04-06 | Data Place Inc | 電子ブックコンテンツ向け自動変換システムと電子ブック共通データベースの構築 |
CN101334775A (zh) * | 2007-06-29 | 2008-12-31 | 高等教育出版社 | 基于xml的图书内容结构的形式化表示方法 |
CN102479248A (zh) * | 2011-05-30 | 2012-05-30 | 北京中科希望软件股份有限公司 | 一种电子文档结构化处理的方法和系统 |
CN102841890A (zh) * | 2011-06-20 | 2012-12-26 | 汉王科技股份有限公司 | 一种用于文档构建的数据加工方法和装置 |
CN103116592A (zh) * | 2012-01-13 | 2013-05-22 | 昆山麦克斯泰科技有限公司 | 一种网页内容的格式化输出方法 |
CN102646125A (zh) * | 2012-02-28 | 2012-08-22 | 中国标准化研究院 | 一种结构化数字内容析取与重组方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197085A (zh) * | 2017-12-29 | 2018-06-22 | 北京仁和汇智信息技术有限公司 | 一种投稿审稿方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10318614B2 (en) | Transformation of marked-up content into a file format that enables automated browser based pagination | |
AU2010216343B2 (en) | Font handling for viewing documents on the web | |
US20130174024A1 (en) | Method and device for converting document format | |
CN110083805A (zh) | 一种将Word文件转换为EPUB文件的方法及系统 | |
CN104699714B (zh) | 将书版格式文件转换为epub格式文件的方法及装置 | |
CN103761277A (zh) | 一种ePub电子书的加载方法和系统 | |
RU2018128787A (ru) | Поисковые результаты для нативных приложений | |
CN103309879B (zh) | 一种管理word文档中的标记的方法及装置 | |
WO2019075968A1 (zh) | 表格信息跨页识别方法、电子设备及计算机可读存储介质 | |
CN104572744B (zh) | 结构化文档生成方法和装置 | |
US10063738B2 (en) | Digital content access using a machine-readable link | |
US20120109638A1 (en) | Electronic device and method for extracting component names using the same | |
US20150129653A1 (en) | Method and apparatus for providing interoperability between flat and interactive digital forms using machine-readable codes | |
CN105320697A (zh) | 一种实现杂志数据的存储规范的方法 | |
WO2018179002A1 (en) | Transformation of marked-up content into a file format that enables automated browser based pagination | |
US10157238B2 (en) | Transformation of marked-up content to a reversible file format for automated browser based pagination | |
Shelly et al. | HTML, XHTML, and CSS: Complete | |
Klindt | PDF/A considered harmful for digital preservation. | |
CN107423271B (zh) | 文档生成方法和装置 | |
Brown et al. | IGCSE information and communication technology | |
Zámborský | International Business and Global Strategy-eBooks and textbooks from bookboon. com | |
CN106484380B (zh) | 一种产品文档的生成方法和装置 | |
EP2891989A1 (en) | System and method for converting an electronic document from a paginated format to a non-paginated format | |
Loeper et al. | Implementing an EAD-XML compliant workflow at UMBC | |
Islam et al. | Determining The Best Agile SDLC for Bangladesh’s Software Industry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160210 |