CN111045661B - 基于语义和特征码的XML Schema生成方法 - Google Patents

基于语义和特征码的XML Schema生成方法 Download PDF

Info

Publication number
CN111045661B
CN111045661B CN201911227557.8A CN201911227557A CN111045661B CN 111045661 B CN111045661 B CN 111045661B CN 201911227557 A CN201911227557 A CN 201911227557A CN 111045661 B CN111045661 B CN 111045661B
Authority
CN
China
Prior art keywords
data
xml
xml schema
code set
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911227557.8A
Other languages
English (en)
Other versions
CN111045661A (zh
Inventor
孙涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dinglan Huimin Information Technology Xi'an Co ltd
Original Assignee
Dinglan Huimin Information Technology Xi'an Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dinglan Huimin Information Technology Xi'an Co ltd filed Critical Dinglan Huimin Information Technology Xi'an Co ltd
Priority to CN201911227557.8A priority Critical patent/CN111045661B/zh
Publication of CN111045661A publication Critical patent/CN111045661A/zh
Application granted granted Critical
Publication of CN111045661B publication Critical patent/CN111045661B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/31Programming languages or programming paradigms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开的基于语义和特征码的XML Schema生成方法,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XML Schema集合成总体的XML Schema,从而生成XML Schema。本发明基于语义和特征码的XML Schema生成方法,不需要考虑更新和维护,利用数据元和代码集的特性,只是改变了XML Schema生成的流程,却极大的优化了XML Schema生成的效率,减少了工作量,也不再需要专人维护XML Schema。

Description

基于语义和特征码的XML Schema生成方法
技术领域
本发明属于电子政务平台数据交换技术领域,具体涉及一种基于语义和特征码的XML Schema生成方法。
背景技术
无论是用于交换的数据元还是代码集,最终都是要在数据交换XML中被使用,电子政务XML文档是以目前国内外通用的XML语言来描述数据交换的信息,它使用自定义的标签和树形结构,能够根据实际需要进行扩展;同时逻辑性也很强,对于人机都有很好的可读性。为了解决“信息孤岛”,各异构子系统能够无缝对接处理信息数据,XML交换文档中的内容必须有一定的约束。XML Schema主要用于验证XML语言的描述从及属性,验证的条件来自于数据元和代码集,数据交换最重要的就是提出高效的XML Sc hema生成方法。
在传统的XML Schema生成方式中,首先需要生成一套通用的XML S chema,然后根据传输的内容人工对XML Schema进行调整,所有将要交换的数据必须有定义,否则XMLSchema无法对其描述。送种方式生成的X ML Schema需要工作量大且效率很低,而且一旦成型后轻易不能更改,拓展性极差,一旦交换数据有了变化,XML Schema需要重新制定。
发明内容
本发明的目的在于提供一种基于语义和特征码的XML Schema生成方法,能够大幅优化XML Schema的生成效率。
本发明所采用的技术方案是:基于语义和特征码的XML Schema生成方法,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XML Schema集合成总体的XML Schema,从而生成XML Schema。
本发明的特点还在于,
具体包括以下步骤:
步骤1:确定将要进行交换的XML数据,同时在数据元和代码集中查询关于该XML数据的规定和解释;
步骤2:查询数据元中是否存在该数据的定义,如果存在则将定义抽取出来后跳转至步骤3,不存在则直接跳转至步骤3;
步骤3:查询代码集中是否存在该数据的编码,如果存在则将定义编码抽取出来后跳转至步骤4,不存在则直接跳转至步骤4;
步骤4:查看该XML是否至少存在定义或者编码中的某一种约束条件,如果结果为真,则跳转至步骤6,若果结果为假,则跳转至步骤5;
步骤5:XML数据在数据元和代码集中均不存在,则需要在数据元或者代码集中视情况添加相应的信息,然后跳转至步骤1;
步骤6:将抽取到约束条件按照规则生成XML Schema;
步骤7:利用XML Schema实现对该数据的验证。
数据元的数据类型为表1所示。
表1数据元类型
Figure SMS_1
Figure SMS_2
数据元包括性别数据元,为表2所示。
表2性别数据元
中文名称:姓名
数据类型:string
数据长度:50
值域:
备注:
代码集包括性别代码集,为表3所示。
表3性别代码集
Figure SMS_3
本发明的有益效果是:本发明基于语义和特征码的XML Schema生成方法,不需要考虑更新和维护,因为每一次数据传输都是生成新的XML Schema,只要能够在XML数据和数据元、代码集中建立关联,就能够生成任意的XML Schema。这种方法利用数据元和代码集的特性,只是改变了XML Schema 生成的流程,却极大的优化了XML Schema生成的效率,减少了工作量,也不再需要专人维护XML Schema。
具体实施方式
下面结合具体实施方式对本发明进行详细说明。
本发明提供了一种基于语义和特征码的XML Schema生成方法,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XML Schema集合成总体的XML Schema,从而生成XML Schema。
通过上述方式,本发明一种基于语义和特征码的XML Schema生成方法不需要考虑更新和维护,因为每一次数据传输都是生成新的XML Schema,只要能够在XML数据和数据元、代码集中建立关联,就能够生成任意的XML Schema。这种方法利用数据元和代码集的特性,只是改变了XML Schema 生成的流程,却极大的优化了XML Schema生成的效率,减少了工作量,也不再需要专人维护XML Schema。
本发明具体包括以下步骤:
步骤1:确定将要进行交换的XML数据,同时在数据元和代码集中查询关于该XML数据的规定和解释;
步骤2:查询数据元中是否存在该数据的定义,如果存在则将定义抽取出来后跳转至步骤3,不存在则直接跳转至步骤3;
步骤3:查询代码集中是否存在该数据的编码,如果存在则将定义编码抽取出来后跳转至步骤4,不存在则直接跳转至步骤4;
步骤4:查看该XML是否至少存在定义或者编码中的某一种约束条件,如果结果为真,则跳转至步骤6,若果结果为假,则跳转至步骤5;
步骤5:XML数据在数据元和代码集中均不存在,则需要在数据元或者代码集中视情况添加相应的信息,然后跳转至步骤1;
步骤6:将抽取到约束条件按照规则生成XML Schema;
步骤7:利用XML Schema实现对该数据的验证。
数据元是数据交换中最基本的交换内容,所有在交换中出现的内容都会在数据元中被描述,制定统一标准的数据元是解决异构电子政务平台最基础的措施。数据元是对所有内容的名、型、值属性进行了描述和约束,有了统一标准的数据元之后,所有的数据就不会因为数据格式的问题而无法交换,数据元一般由对象类词、特性类词和表示三部分组成。数据元的数据类型如表1所示。
表1数据元类型
Figure SMS_4
数据元的制定必须遵守统一规划的原则,并将这些原则在数据交换的标准中体现出来。数据元的属性如果在国标中己经有涉及需要遵守国标的规定,否则会影响标准么间的兼容性和复用性。此外,制定数据元的标准还需参考行业内其他标准,尽量保持一致。为了在数据交换中不引起理解上的偏差,必须有唯一的标识,类似于数据库中的唯一索引,这样才能确保数据元的唯一性,在该电子政务系统中,唯一的标识就是数据元的英文名称,姓名这一数据元的示例如表2所示。
表2性别数据元
中文名称:姓名
数据类型:string
数据长度:50
值域:
备注:
数据元只是对数据交换中出现的数据有了统一的描述,有些内容虽然能够用数据元描述,比如性别,但是性别的类别则需要代码集来表示。电子政务代码集主要用于描述在电子政务数据交换过程中使用到的代码,它是对应数据元值域范围的集合,通过代码集能够统一和规范电子政务信息共享中的数踞编码,提高数据交换的效率。
表3性别代码集
Figure SMS_5
代码集与数据元一样,在制定的过程中同样要参考国家标准和行业标准,尽量与国标和行标保持一致,在此基础上进行进一步开发,保证与其他标准的兼容性。制定代码集的规范同样需要在标准中有所体现。按照标准中的定义,性别代码集的示例如表3所示。

Claims (1)

1.基于语义和特征码的XML Schema生成方法,其特征在于,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XML Schema集合成总体的XML Schema,从而生成XML Schema;具体包括以下步骤:
步骤1:确定将要进行交换的XML数据,同时在数据元和代码集中查询关于该XML数据的规定和解释;
步骤2:查询数据元中是否存在该数据的定义,如果存在则将定义抽取出来后跳转至步骤3,不存在则直接跳转至步骤3;
步骤3:查询代码集中是否存在该数据的编码,如果存在则将定义编码抽取出来后跳转至步骤4,不存在则直接跳转至步骤4;
步骤4:查看该XML是否至少存在定义或者编码中的某一种约束条件,如果结果为真,则跳转至步骤6,若果结果为假,则跳转至步骤5;
步骤5:XML数据在数据元和代码集中均不存在,则需要在数据元或者代码集中视情况添加相应的信息,然后跳转至步骤1;
步骤6:将抽取到约束条件按照规则生成XML Schema;
步骤7:利用XML Schema实现对该数据的验证;
所述数据元的数据类型为表1所示:
表1数据元类型
Figure FDA0004161755740000011
Figure FDA0004161755740000021
所述数据元包括性别数据元,为表2所示:
表2性别数据元
中文名称:姓名 数据类型:string 数据长度:50 值域: 备注:
所述代码集包括性别代码集,为表3所示。
表3性别代码集
Figure FDA0004161755740000022
CN201911227557.8A 2019-12-04 2019-12-04 基于语义和特征码的XML Schema生成方法 Active CN111045661B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911227557.8A CN111045661B (zh) 2019-12-04 2019-12-04 基于语义和特征码的XML Schema生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911227557.8A CN111045661B (zh) 2019-12-04 2019-12-04 基于语义和特征码的XML Schema生成方法

Publications (2)

Publication Number Publication Date
CN111045661A CN111045661A (zh) 2020-04-21
CN111045661B true CN111045661B (zh) 2023-07-04

Family

ID=70234617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911227557.8A Active CN111045661B (zh) 2019-12-04 2019-12-04 基于语义和特征码的XML Schema生成方法

Country Status (1)

Country Link
CN (1) CN111045661B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005111824A2 (en) * 2004-05-19 2005-11-24 Silverkite Inc. Method and system for processing of text content
CN1719407A (zh) * 2004-07-09 2006-01-11 中国电子技术标准化研究所 不同语种xml文档转换的方法
CN101526898A (zh) * 2009-04-17 2009-09-09 武汉大学 面向语义Web服务程序设计的语义数据表示和处理方法
CN103902269A (zh) * 2012-12-27 2014-07-02 中国科学院声学研究所 一种通过xml文件生成mib文件的系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020049790A1 (en) * 2000-08-08 2002-04-25 Ricker Jeffrey M Data interchange format transformation method and data dictionary used therefor
US7043487B2 (en) * 2002-12-28 2006-05-09 International Business Machines Corporation Method for storing XML documents in a relational database system while exploiting XML schema

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005111824A2 (en) * 2004-05-19 2005-11-24 Silverkite Inc. Method and system for processing of text content
CN1719407A (zh) * 2004-07-09 2006-01-11 中国电子技术标准化研究所 不同语种xml文档转换的方法
CN101526898A (zh) * 2009-04-17 2009-09-09 武汉大学 面向语义Web服务程序设计的语义数据表示和处理方法
CN103902269A (zh) * 2012-12-27 2014-07-02 中国科学院声学研究所 一种通过xml文件生成mib文件的系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
潘峰 ; 刘丹红 ; 杨鹏 ; 徐勇勇 ; .国家卫生数据字典XML Schem的构建.第四军医大学学报.2009,(第10期),全文. *
潘峰 ; 刘丹红 ; 杨鹏 ; 徐勇勇 ; .构建基于语义的医疗服务调查数据集XML Schema.第四军医大学学报.2009,(第21期),全文. *
胡业发 ; 陈娟 ; 陶飞 ; 杨朝阳 ; .基于XML的电子病历数据模式研究.计算机工程与设计.2007,(第04期),全文. *

Also Published As

Publication number Publication date
CN111045661A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
US7440954B2 (en) Index maintenance for operations involving indexed XML data
Arenas et al. A direct mapping of relational data to RDF
US20070219959A1 (en) Computer product, database integration reference method, and database integration reference apparatus
US7366735B2 (en) Efficient extraction of XML content stored in a LOB
CN111680029B (zh) 基于数据标准系统落标的优化管理方法
US20020123993A1 (en) XML document processing
CN106202292B (zh) 一种基于结构化数据模型的标准信息分析方法
CN110096620A (zh) 数据库表和xml报文的映射方法及其系统
CN109408043A (zh) 一种程序生成方法及装置
CN104182911A (zh) 一种实现配电网系统cim模型一致性的校验方法
EP2352269A1 (en) Service access method and system
CN101710336A (zh) 一种利用关系中间件加速数据处理的方法
CN101216824B (zh) 一种将树型结构数据库发布为分布式xml数据库的方法
AU2007275507B2 (en) Semantic aware processing of XML documents
CN111045661B (zh) 基于语义和特征码的XML Schema生成方法
CN107609151A (zh) 基于Redis实现XBRL实例文档缓存的方法
CN104636265A (zh) 一种cimxml文档的高效内存模型组织的访问方法
CN102902565B (zh) 内存对象加载装置和内存对象加载方法
CN110955736B (zh) 一种基础数据的管理模型建模方法
CN105160590A (zh) 一种基于可扩展标记语言的高速模型智能配用电领域的信息互操作校验方法
CN116167710A (zh) 一种平台企业数据共享的方法及系统
CN104077340A (zh) 一种数据库的建立方法及服务器
Zhang et al. An object oriented data model for web and its algebra
CN114357515A (zh) 一种用户权限优化方法及装置
Legg RFC 4912: Abstract Syntax Notation X (ASN. X)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 710075 room S510, innovation building, No. 25, Gaoxin 1st Road, high tech Zone, Xi'an, Shaanxi Province

Applicant after: Dinglan Huimin information technology (Xi'an) Co.,Ltd.

Address before: 710075 room S510, innovation building, No. 25, Gaoxin 1st Road, high tech Zone, Xi'an, Shaanxi Province

Applicant before: XI'AN DINGLAN COMMUNICATION TECHNOLOGY CO.,LTD.

GR01 Patent grant
GR01 Patent grant