CN113536041B - 一种铁路工程地理信息元数据批量快速采集方法 - Google Patents

一种铁路工程地理信息元数据批量快速采集方法 Download PDF

Info

Publication number
CN113536041B
CN113536041B CN202110639035.XA CN202110639035A CN113536041B CN 113536041 B CN113536041 B CN 113536041B CN 202110639035 A CN202110639035 A CN 202110639035A CN 113536041 B CN113536041 B CN 113536041B
Authority
CN
China
Prior art keywords
metadata
data
view
code table
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110639035.XA
Other languages
English (en)
Other versions
CN113536041A (zh
Inventor
范登科
张恒
王长进
韩祖杰
赵文
王�华
宁新稳
黄漪
王娇
刘小龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway Design Corp
Original Assignee
China Railway Design Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway Design Corp filed Critical China Railway Design Corp
Priority to CN202110639035.XA priority Critical patent/CN113536041B/zh
Publication of CN113536041A publication Critical patent/CN113536041A/zh
Application granted granted Critical
Publication of CN113536041B publication Critical patent/CN113536041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • G06F16/835Query processing
    • G06F16/8373Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种铁路工程地理信息元数据批量快速采集方法,包括元数据数据类型定义与对象解析、元数据数据字典组织关系重构和元数据信息交互视图构建,该方法采用树列表结构,创建用户视图来表达上述数据字典的数据结构,形成按照视图结构表达的、统一的、多态可控的组织形式,其采用列表结构创建列表结构子视图,表达各代码表及所含代码表枚举项的全部特征信息,最终关联上述树列表结构视图和列表结构子视图,将多个元数据实例文件中的数据同时显示到视图中,实现批量快速采集。该方法实现了快速、批量、完整地采集基于XML模式的元数据实例数据,提高了铁路工程地理信息元数据处理的可交互水平和效率。

Description

一种铁路工程地理信息元数据批量快速采集方法
技术领域
本发明属于数据交互与处理技术领域,具体涉及一种铁路工程地理信息元数据批量快速采集方法。
背景技术
在地理信息数据分析、处理、交换和服务发布过程中,元数据提供了统一的数据描述规则和方法,以便于用户理解和解译数据内容。国家标准《地理信息 元数据》(GB/T19710- 2005)通过规范元数据的组成单元、特征和数据字典有效规范了元数据的内容和形式。在国家技术性指导文件《地理信息 元数据XML模式实现》(GB/Z 24357-2009)中,提出了基于XML语言的元数据模式实现方式。在XML模式文件的约束下,当需要对一个或一组地理信息数据进行描述时,借助先验知识或解析该数据获取的元数据实例信息以“子集-实体-元素”的组织方式、按照既定的语法规则被存储在一个XML文件中。然而,当前地理信息数据常常呈现出时空海量、多源异构的特点,由此带来的问题是,受限于手工逐个文件编辑处理,元数据的生产、管理和交互变得效率低下、内容繁杂,元数据技术的推广应用受到限制。
现有的元数据采集方法包括以下三类:第一类是事先根据数据字典设计好数据库表结构,通过表之间的关系反映元数据实体和元数据元素间的逻辑关系,而后将每一项元数据元素值作为数据库表中的一行记录执行录入操作,从而实现元数据的采集。从可交互水平上看,这种方法通常仅限于数据库管理软件提供的数据查询、编辑和分析功能。此外,元数据数据字典描述的组成单元间的各种关系被隐含在数据库表关系中无法表达给用户,信息被分割得支离破碎,难以形成系统性和逻辑性。当交换或迁移海量地理信息数据中的一部分时,还需要执行大量数据库查询和修改操作,以保证元数据与所描述数据统一一致;第二类是将XML模式的数据字典转为RDF、DTD或其他模式,虽然增强了各类软件对元数据处理的支持,但是批处理能力和交互能力受限于软件功能,还增加了转换过程中数据字典信息错漏的风险;第三类是采用描述元数据语言,如XML、TXT、Json等固定的语法和结构直接写入信息批量生产实例文件,这种方法仅能处理通用、固定的元数据内容,缺少模式的约束,难以保证元数据信息的完整性以及与数据字典描述的一致性。同时由于需要人为筛选输出结构和内容,或者在数据字典扩展和改变后需要软件开发者进行维护和更改,可扩展性和灵活性较低。
具体到铁路工程领域的应用,由于铁路工程地理信息元数据是在国家标准的基础上对元数据数据字典内容进行扩展,例如新增了里程、工点、线路性质等铁路工程特有的信息内容,而现有地理信息元数据采集和处理软件,如国家基础地理信息中心的MetaGear、商业软件ArcGIS等,仅支持对基础地理信息元数据的编辑,缺少对扩展XML模式的支持,导致铁路工程地理信息元数据的采集和处理难以顺利开展和实施,缺失的信息还需要手工编辑录入,进一步降低了处理效率。
发明内容
为了解决基于XML模式的地理信息元数据逐个文件编辑处理效率低、内容繁杂、可交互性差的问题,本发明公开一种铁路工程地理信息元数据批量快速采集方法。
为此,本发明的技术方案如下:
一种铁路工程地理信息元数据批量快速采集方法,包括以下步骤:
S1,元数据数据类型定义和对象解析:首先根据地理信息元数据的XML模式实现规则,采用计算机语言定义元数据的数据类型,而后从元数据XML模式文件和代码表文件中,提取其中记录的元数据实体、元素和代码表及代码表枚举项信息,解析为数据类型的实体对象、元素对象和代码表对象及代码表枚举项对象;
S2,元数据数据字典组织关系重构:通过扩展定义步骤S1元数据的数据类型中实体类和要素类的属性并为其赋值,用计算机语言描述元数据数据字典中记录的包含关系、引用关系、泛化关系和特化关系,并与步骤S1解析获得的实体对象和元素对象组织在一起,形成数据字典的数据结构;
S3,元数据信息交互视图构建:采用树列表结构,创建树列表结构视图以表达步骤S2获取的数据字典的数据结构,包括步骤S1中解析得到的元数据实体和元数据元素的部分特征信息,以及步骤S2中重构的四种关系,形成按照视图结构表达的、统一的、多态可控的组织形式;采用列表结构,创建树列表结构子视图,表达步骤S1中解析得到的各代码表对象及所含代码表枚举项对象的全部特征信息;最终关联上述树列表结构视图和列表结构子视图,将多个元数据实例文件中的数据同时显示到树列表结构视图中,从而实现批量快速采集。
上述步骤S1中,根据地理信息元数据的XML模式实现规则,采用计算机语言定义元数据的数据类型,包括以下步骤:
S11,采用计算机语言分别定义元数据实体类、元数据元素类、元数据代码表类和元数据代码表枚举项类,根据《地理信息 元数据》(GB/T 19710-2005)要求,将元数据实体和元数据元素的“中文名称/角色”、“英文名称/角色”、“缩写名”三个特征定义为对应类的字符串型属性,将元数据实体和元数据代码表中的“定义”特征定义为类的字符串型属性;将元数据元素的“约束/条件”、“最大出现次数”特征分别定义为布尔型和整数型属性,将元数据元素的“数据类型”特征定义为字符型和类型声明型的联合属性。将元数据代码表和元数据代码表枚举项的“中文名称”、“英文名称”、“域代码”和“说明”四个特征定义为对应类的字符串型属性。
S12,使用XML文件访问和数据解析接口,根据《地理信息 元数据XML模式实现》(GB/Z 24357-2009)确定的语法,将xsd格式的模式文件中记录的各项元数据实体和元数据元素以及xml格式的代码表文件中记录的各项元数据代码表类型和元数据代码表枚举项,实例化为所述元数据实体类、元数据元素类、元数据代码表类和元数据代码表枚举项类的对象,并解析各自的特征信息,直接记录或转义为类对象的属性值。
上述步骤S2中,通过扩展定义步骤S1元数据的数据类型中实体类和要素类的属性并为其赋值,用计算机语言描述元数据数据字典中记录的包含关系和引用关系,包括以下步骤:
S21,首先在步骤S1中取得的元数据实体类中扩展定义名称为Elements、数据类型为元数据元素类集合型的属性,其次根据地理信息元数据数据字典的定义,某元数据实体对象O 1 与一组元数据元素对象e 1 , e 2 e n 构成包含关系,则将该组元数据元素类型对象的集合作为O 1 的Elements属性值,实现O 1 e 1 , e 2 e n 之间包含关系的计算机语言描述。
S22,使用步骤S1中为元数据元素的“数据类型”特征定义的联合属性,其中数据类型为字符串的属性名称为DictType,数据类型为类型声明型的属性名称为DataType,根据地理信息元数据数据字典的定义,某项元数据元素对象e i 的数据类型为另一元数据实体对象O 2 ,则e i O 2 间构成引用关系,将O 2 的“英文名称/角色”特征值作为e i 的DictType属性值,将元数据实体类型声明作为e i 的DataType属性值,实现e i O 2 之间引用关系的计算机语言描述。
采用上述步骤S21和S22对元数据数据字典中所有包含关系和引用关系进行描述,最终形成由计算机语言描述的、从顶层元数据根实体出发的、至底层由简单数据类型的元素终止的数据字典多层次结构。
上述步骤S2中,通过扩展定义步骤S1元数据的数据类型中实体类和要素类的属性并为其赋值,用计算机语言描述元数据数据字典中记录的泛化关系和特化关系,包括以下步骤:
S23,对泛化关系,首先在步骤S1中取得的元数据实体类中扩展定义名称为SuperEntity、数据类型为元数据实体类的属性,根据地理信息元数据数据字典的定义,某元数据实体对象O 3 是元数据实体对象O 4 的泛化型,则O 3 O 4 间构成泛化关系,将O 3 作为O 4 的SuperEntity属性值,实现O 3 O 4 间泛化关系的计算机语言描述。
S24,对特化关系,首先在步骤S1中取得的元数据实体类中扩展定义名称为SubEntities、数据类型为元数据实体类集合型的属性,根据地理信息元数据数据字典的定义,某元数据实体对象O 5 和另一元数据实体对象O 6 是元数据实体对象O 4 的特化型,则O 4 O 5 O 6 间构成特化关系,将O 5 O 6 组成的集合作为O 4 的SubEntities属性值,实现O 4 O 5 O 6 间特化关系的计算机语言描述。
采用上述步骤S23和S24对元数据数据字典中所有特化关系和泛化关系进行描述,最终形成由计算机语言描述的、元数据实体类型对象间具有继承关系的数据字典多态结构。
上述步骤S3中,采用树列表结构,创建用户视图表达步骤S2获取的数据字典的数据结构,包括步骤S1中解析得到的元数据实体和元数据元素的部分特征信息,以及步骤S2中重构的四种关系,形成按照视图结构表达的、统一的、多态可控的组织形式,包括以下步骤:
S31,创建树列表结构视图,所述树列表结构中纵向为树结构,横向为列表结构,列表中的一行表达为树结构中的一个节点,将步骤S2解析所得元数据数据字典的数据结构中的一个元数据元素对象表达为视图中的一个节点,将该对象中与“中文名称/角色”、“数据类型”特征相对应的属性值分别表达为视图中节点的首列和第二列数据值,将该对象中与“约束/条件”特征相对应的属性值表达为视图中节点的图标,用差异化的图标样式表达该属性的不同值。
S32,基于步骤S31创建的树列表结构视图,将步骤S21解析所得元数据数据字典的数据结构中元数据元素对象与元数据实体对象间的引用关系,表达为视图中非叶子节点首列与第二列数据值的对应关系;将步骤S22解析所得元数据数据字典的数据结构中元数据实体对象与元数据元素对象间的包含关系,表达为视图中以第二列数据值确定的、树结构下节点与其子节点间的包含关系。上述方法实现了数据字典多层次结构的表达。
S33,采用步骤S31所述树列表结构,创建树列表结构子视图,将步骤S2解析所得元数据数据字典的数据结构中元数据实体对象间的泛化关系和特化关系,表达为树列表结构子视图中树结构下节点与其子节点间的包含关系,其中节点与包含它的父节点表达泛化关系,节点与它包含的子节点表达特化关系,将元数据实体对象中与“中文名称/角色”、“英文名称/角色”特征相对应的属性值分别表达为树列表结构子视图中节点的首列和第二列数据值。当某元数据实体具有泛化关系或特化关系时,将该子视图与所述树列表结构视图中以该元数据实体对象O i 为数据类型的元数据元素对象e对应节点N的第二列数据相关联,需要改变e的数据类型为其他元数据实体对象O j 时,展示该子视图并选择其中与O j 相对应的节点,步骤S31所创建树列表结构视图中节点N包含的子节点变为由O j 包含的元数据元素对象创建的节点。上述方法实现了数据字典多态结构的表达。
上述步骤S3中,采用列表结构,创建列表结构子视图,表达步骤S1中解析得到的各代码表及所含代码表枚举项的全部特征信息,具体操作方法是:
S34,对每一个由步骤S1解析获得的代码表及所含代码表枚举项,创建与之唯一对应的列表结构子视图,将每一个代码表枚举项表达为列表结构的一行,将代码表枚举项对象中与“域代码”、“中文名称”、“英文名称”、“说明”特征相对应的属性值分别表达为列表结构中各列的数据值,并以代码表对象的“英文名称”特征为子视图建立索引。
上述步骤S3中,关联树列表结构视图和列表结构子视图,将多个元数据实例文件中的数据同时显示到视图中,从而实现批量快速采集,具体操作方法是:
S35,新建一个元数据实例采集或访问一个元数据实例文件时,在步骤S31创建的树列表结构视图中新建一列表达该元数据的内容,在该列下,将对应非叶子节点的单元项设置为只读状态,对应叶子节点的单元项则根据节点对应的元数据元素对象的“数据类型”特征确定子视图样式。当“数据类型”特征值的数据类型为代码表类型时,按特征值索引步骤S34所述列表结构子视图,并响应采集操作进行展示,实现步骤S34中所述列表结构子视图与步骤S31树列表结构视图的关联。
采集或访问多个元数据实例时,在步骤S31所述树列表结构视图中树列表结构下新建多个与元数据实例一一对应的列,根据信息表达的需要,以数据字典中元数据元素对象的“最大出现次数”特征值为约束,动态增加视图中的节点,保证元数据实例信息表达的一致性和完整性,实现元数据实例批量交互式展示和编辑。
本发明的路工程地理信息元数据批量快速采集方法分解为三个环节:(1)采用计算机语言定义地理信息元数据实体类、要素类和代码表类,借助数据接口解析元数据XML模式文件和相关代码表文件,以类的对象及其属性描述其中记录的元数据实体、要素和代码表枚举项值;(2)根据元数据数据字典确定的实体间的、实体和元素间的关系,采用实体类、实体类集合、元素类集合、字符和类型声明等数据类型的属性,将第(1)步获得的对象化数据结构关联起来,形成数据字典层次结构和元数据实体多态形式;(3)利用树列表控件提供的层次结构组织和可视化样式设计功能,将第(2)步获得的元数据特征、元数据组成单元逻辑关系、元数据实体多态等多维信息综合展示到系统前台视图中。将元数据数据字典层次表达为控件中以节点组成的树型结构,元数据组成单元表达为控件中的节点;将元数据组成单元名称和数据类型表达为控件中的前两列数据内容;将元数据实例数据表达为控件中除前两列以外的列数据,最终实现对地理信息元数据的批量快速采集。
本发明具有以下有益效果:
(1)本发明的方法不仅支持铁路工程地理信息元数据的处理,同样适用于根据国家标准以XML模式扩展而来的元数据,从根本上解决了现有软件和方法难以应用于扩展元数据的问题。在确保铁路工程领域描述地理信息数据与国家标准相一致的基础上,增强了扩展元数据内容与通用地理信息元数据之间的联系性和系统性,拓展了地理信息元数据XML模式实现的应用领域。
(2)本发明的方法将元数据的数据结构由XML模式的实现方式转变为计算机语言描述的实现方式,解决了数据库管理方法中,元数据在XML模式约束下因各组成单元间逻辑关系松散表达、数据结构分离存储而造成的实例数据解析过程复杂的问题。通过计算机语言构建的抽象化描述方式保证了元数据数据字典内容的完整性和一致性,结构的严密性和紧凑性,使元数据组成单元的上下层次逻辑关系更为直观和清晰,为铁路工程地理信息元数据的批量快速采集提供了数据结构框架和基础,降低了模式转换方法或直接写入信息生成元数据实例方法可能带来的元数据结构和内容错漏的风险。
(3)本发明的方法通过定义对象类的属性描述了元数据数据字典的多层次结构和多态结构,确保了采用计算机语言描述的数据结构与原始XML模式的描述内容保持一致。与仅提取固定信息的元数据采集方法相比,增强了不同地理信息数据类型驱动下元数据数据字典结构的灵活性和可控性,实现了元数据数据字典单独树型结构的构建,为元数据组成单元间逻辑关系的可视化表达提供了背景数据支撑;
(4)本发明的方法实现了对元数据组成单元的可视化调整和修改,以及对元数据实例数据的批量交互编辑,将现有无法交互的、无约束的机械化采集方式变革为视图可控的、基于XML模式约束的可视化采集方式,不仅创建了与地理信息元数据数据字典结构相统一一致的树列表结构视图,而且创新了地理信息元数据实体多态的可视化操作方式,解决了现有软件无法一次采集多个地理信息元数据的问题,为地理信息元数据生产、编辑和管理提供了快速高效的方法,与文本直接编辑方法相比,时间节约达60.5%。
附图说明
图1是本发明的铁路工程地理信息元数据批量快速采集方法的流程简图;
图2 是本发明中XML模式的元数据实体和元素的解析过程示意图;
图3 是本发明中XML模式的元数据代码表及其枚举项的解析过程示意图;
图4 是本发明中树列表结构视图表达元数据元素对象部分特征信息的过程示意图;
图5 是本发明中树列表结构视图表达包含关系和引用关系的过程示意图;
图6是本发明中树列表结构子视图表达元数据数据字典多态结构的示意图;
图7 是本发明中批量元数据实例文件内容以列数据在树列表控件中表达的示意图;
图8是采用本发明方法采集一组铁路工程地理信息元数据文件的视图展示效果图;
图9是采用MetaGear软件采集地理信息数据时的视图展示效果图。
具体实施方式
以下结合附图和实施例对本发明的方法进行详细说明。
参见图1,本发明的实现铁路工程地理信息元数据批量快速采集方法包括以下步骤:
S1,元数据数据类型定义和对象解析:首先根据地理信息元数据的XML模式实现规则,采用计算机语言定义元数据的数据类型,而后从元数据XML模式文件和代码表文件中,提取其中记录的元数据实体、元素和代码表及代码表枚举项信息,解析为数据类型的对象;
S2,元数据数据字典组织关系重构:通过扩展定义步骤S1元数据的数据类型中实体类和要素类的属性并为其赋值,用计算机语言描述元数据数据字典中记录的包含关系、引用关系、泛化关系和特化关系,并与步骤S1解析获得的实体对象和元素对象组织在一起,形成数据字典的数据结构;
S3,元数据信息交互视图构建:采用树列表结构,创建树列表结构视图表达步骤S2获取的数据字典的数据结构,包括步骤S1中解析得到的元数据实体和元数据元素的部分特征信息,以及步骤S2中重构的四种关系,形成按照视图结构表达的、统一的、多态可控的组织形式;采用列表结构,创建列表结构子视图,表达步骤S1中解析得到的各代码表及所含代码表枚举项的全部特征信息;最终关联上述树列表结构视图和列表结构子视图,将多个元数据实例文件中的数据同时显示到树列表结构视图中,从而实现批量快速采集
以下对上述各步骤进行详细说明。
,元数据数据类型定义和对象解析:
包括以下步骤:
S11,《地理信息 元数据》(GB/T 19710-2005)规定了描述元数据组成单元的八个特征,它们分别是:中文名称/角色、英文名称/角色、缩写名、定义、约束/条件、最大出现次数、数据类型和域。依照元数据的XML模式实现规则,以计算机语言分别定义元数据实体类MetadataEntity和元素类MetadataElement,两个类中分别包含三个字符串型属性,分别代表“中文名称/角色”、“英文名称/角色”、“缩写名”三个特征。实体类MetadataEntity与后者不同的是:还包含一个字符串型属性,代表“定义”特征。元素类MetadataElement与前者有所不同的是:包含一个布尔型属性,代表“约束/条件”特征;包含一个整数型属性,代表“最大出现次数”特征;包含一个由字符串型属性和类型声明型属性组成的联合属性,代表“数据类型”特征。元数据实体类和元素类的伪码定义如下:
类 MetadataEntity
{
属性 DspName : 字符串 //中文名称/角色
属性 Name : 字符串 //英文名称/角色
属性 DictName : 字符串 //缩写名
属性 Description : 字符串 //定义
}
类 MetadataElement
{
属性 DspName : 字符串 //中文名称/角色
属性 Name : 字符串 //英文名称/角色
属性 DictName : 字符串 //缩写名
属性 IsMandatory : 布尔型 //约束/条件
属性 MaxOccur : 整型 //最大出现次数
联合{ //数据类型
属性 DictType : 字符串 //类型名称
属性 DataType : 类型声明 //类型相对应的计算机语言同义类型
}
}
依照元数据的XML模式实现规则扩展部分,以计算机语言定义元数据代码表类MetadataCodeList和代码表枚举项类MetadataCodeListItem,两个类中分别包含四个字符串型属性,分别代表“中文名称”、“英文名称”、“域代码”和“说明”四个特征。二者的差异在于:前者包含一个代码表枚举项集合型属性,记录该代码表类型中包含的枚举项信息;还包含一个字符串型属性,记录存储该代码表类型的xml文件路径;前者“域代码”表示“英文名称”的缩写,后者“域代码”以三位顺序编号的整数值代表枚举项对应的序数值。元数据代码表类和代码表枚举项类的伪码定义如下:
类 MetadataCodeList
{
属性 DspName : 字符串 //中文名称
属性 Name : 字符串 //英文名称
属性 Id : 字符串 //域代码
属性 Dscp : 字符串 //说明
属性 Items : MetadataCodeListItem集合型 //所含枚举项
属性 XmlFilePath : 字符串 //所属XML文档路径
}
类 MetadataCodeListItem
{
属性 DspName : 字符串 //中文名称
属性 Name : 字符串 //英文名称
属性 Dscp : 字符串 //说明
属性 OrderCode : 字符串 //域代码
}
S12,在xsd格式的元数据模式文件中,以《地理信息 元数据XML模式实现》(GB/Z24357-2009)中确定的语法规则记录了元数据数据字典的组成单元——实体和元素的全部信息。依照XML模式的描述规则,获取元数据实体和元素具有的特征值,作为步骤S11中实体类MetadataEntity和元素类MetadataElement对象的相应属性值。如图2所示,以名为“CRCI_Contact”的元数据实体及其包含的元素为例,从XML模式转换为实体类MetadataEntity的对象和元素类MetadataElement的对象的过程是:
1)当模式文件中同时存在以“CRCI_Contact”加“_Type”为name属性值的<xs:complexType>节点、以“CRCI_Contact”为name属性值的<xs:element>节点和“CRCI_Contact”加“_PropertyType”为name属性值的<xs: complexType >节点以时,判断为一个有效的元数据实体,开始解析;
2)初始化一个实体类MetadataEntity的对象O,代表以计算机语言描述的名为“CRCI_Contact”的实体,其Name、DictName和DspName属性分别取自1)中所述<xs:element>节点的name属性值、name属性值带后缀“_PropertyType”的<xs: complexType >节点的id属性值,以及该节点下路径为<xs:annotation>→<xs:document>的子节点的值;其Description属性则取自1)中所述name属性值带后缀“_Type”的<xs: complexType >节点下路径为<xs:annotation>→<xs:document>的子节点的值;
3)在1)中所述name属性值带后缀“_Type”的<xs: complexType >节点下,按路径<xs:complexContent>→<xs:extension>→<xs:sequence>查找到子节点,遍历其中的<xs:element>子节点,为每一个<xs:element>节点初始化一个元素类MetadataElement的对象e i ,其中i∈[1, 4];该对象的Name、DictName和DictType属性分别取自当前节点的name、id和type属性值;其IsMandatory属性值由当前节点的minOccurs属性值转义而来,即当minOccurs取值为0时IsMandatory为假,否则为真;其MaxOccur属性值由当前节点的maxOccurs属性值转义而来,即当minOccurs取值为unbounded时为-1,否则与其整数型值一致;其DspName属性值取自当前节点下路径为<xs:annotation>→<xs:document>的子节点的值;其DataType属性值则根据DictName值进行判断,取值为所采用计算机语言中的基本数据类型声明。
由上述步骤,可以实例化出一个名为“CRCI_Contact”的实体类对象,以及四个由该实体包含的名称分别为“phone”、“address”、“electronicMailAddress”和“facsimile”的元素类对象。对所有的元数据实体及元素执行上述实体类MetadataEntity和元素类MetadataElement的对象实例化操作。
在xml格式的元数据代码表文件中,以《地理信息 元数据XML模式实现》(GB/Z24357-2009)中确定的语法规则记录了元数据代码表数据类型及其值域的枚举项信息。依照XML模式的描述规则,将这些信息读取出来,为步骤S11中代码表类MetadataCodeList和代码表枚举项类MetadataCodeListItem的实例化对象赋以对应的属性值。如图3所示,以名为“CRMD_CellGeometryCode”的元数据代码表类型及其枚举项为例,从XML模式转换为代码表类MetadataCodeList和代码表枚举项类MetadataCodeListItem的对象的过程是:
1)当代码表文件中存在名为<codelistItem>的节点时,查找其名为<CodeListDictionarty>的子节点,以及路径为<CodeListDictionarty>→<codeEntry>的子节点,此时,判定为一个有效的元数据代码表,开始解析;
2)初始化一个代码表类MetadataCodeList的对象C,代表以计算机语言描述的名为“CRMD_CellGeometryCode”的代码表类型,其Name属性取自1)中所述<CodeListDictionarty>节点下名为的gml:id的属性值;其Dscp 、Id和DspName属性分别取自<CodeListDictionarty>下子节点<gml:description>、<gml:identifier>和<gml:name>的值;其XmlFilePath属性的值为当前xml代码表文件的路径。
3)遍历1)中所述<CodeListDictionarty>节点下的名为<codeEntry>的子节点,为每一个<codeEntry >节点初始化一个代码表枚举项类MetadataCodeListItem的对象d i ,其中i∈[1, 2];该对象的Name属性取自当前节点<codeEntry>下子节点<CodeDefinition>中名为gml:id的属性值;该对象的Dscp、Id和DspName属性分别取自节点<CodeDefinition>下下子节点<gml:description>、<gml:identifier>和<gml:name>的值;该对象的OrderCode属性取由三位整数表示的枚举项的自然序数。
4)将3)中实例化的所有对象d i 记录到2)中对象C的属性 Items中,表达代码类型与其枚举项间的包含关系。
对所有的元数据代码表及其枚举项执行上述代码表类MetadataCodeList和代码表枚举项类MetadataCodeListItem的对象实例化操作。
,元数据数据字典组织关系重构
在地理信息元数据数据字典结构中,元数据实体与元数据元素之间构成以下两种关系:
1)包含关系:某实体O 1 与其组成元素e 1 , e 2 e n 之间的关系;
2)引用关系 :若某项元素e i 的数据类型为实体对象O 2 ,则e i O 2 间构成引用关系。
根据上述描述,S2包括以下步骤:
S21,在S11所述元数据实体类MetadataEntity中扩展定义数据类型为要素类MetadataElement集合型的属性Elements,扩展定义后的实体类MetadataEntity用伪码表示为:
类 MetadataEntity
{
属性 DspName : 字符串 //中文名称/角色
属性 Name : 字符串 //英文名称/角色
属性 DictName : 字符串 //缩写名
属性 Description : 字符串 //定义
属性 Elements : MetadataElement集合型 //包含的元数据元素
}
以S12所述元数据实体“CRCI_Contact”为例,将计算机语言描述的该实体的所有组成单元——元数据元素类MetadataElement的对象e i 记录到实体对象O的属性Elements中,用伪码表示为:
O.Elements = Array{e 1 , e 2 , e 3 , e 4 };
对所有的元数据实体及其所含元数据要素执行上述操作,完成包含关系的计算机语言描述。
S22,如步骤S12所述,在元数据元素对象e的属性赋值过程中,当其数据类型为元数据实体类对象O时,eO构成引用关系。将对象e的DictName属性值赋为对象O的Name属性值;将其DataType属性值赋为元数据实体类MetadataEntity的类型声明,用伪码表示为:
e.DictName = O.Name;
e.DataType = typeof(MetadataEntity);
对所有数据类型为元数据实体对象的元数据要素执行上述操作,完成引用关系的计算机语言描述。至此,完整的数据字典多层次结构通过计算机语言重构完成。
在地理信息元数据数据字典结构中,假如元数据实体O 3 包含的所有元数据元素是元数据实体O 4 包含元数据元素的子集,则实体O 3 是实体O 4 的泛化型,实体O 4 是实体O 3 的特化型,某元数据元素可在实体O 3 和实体O 4 中选择任意一类作为其数据类型的情况称为实体多态。
S23,在S21所述元数据实体类MetadataEntity中扩展定义数据类型为实体类MetadataEntity型的属性SuperEntity,以及数据类型为实体类MetadataEntity集合型的属性SubEntities,扩展定义后的实体类MetadataEntity用伪码表示为:
类 MetadataEntity
{
属性 DspName : 字符串 //中文名称/角色
属性 Name : 字符串 //英文名称/角色
属性 DictName : 字符串 //缩写名
属性 Description : 字符串 //定义
属性 Elements : MetadataElement集合型 //包含的元数据元素
属性 SuperEntity : MetadataEntity型 //当前实体的泛化型实体
属性 SubEntities : MetadataEntity集合型 //当前实体的特化型实体
}
在XML模式文件中,实体间的泛化关系由步骤S12的1)中所述<xs:element>节点的substitutionGroup属性唯一确定,该属性值为当前实体的泛化型实体的Name属性值。
以名为“CRMD_Georectified”的元数据实体为例,通过步骤S12解析,假设其实体类对象为O 4 ,同时可以得知其泛化型实体为“CRMD_GridSpatialRepresentation”,对应的实体类对象为O 3 ,对O 4 的SuperEntity属性赋值,用伪码表示为:
O 4 .SuperEntity = O 3 ;
S24,在步骤S23执行的同时,修改泛化型实体对象的SubEntities属性值,在其数据集合中插入特化型实体对象。仍以步骤S23中名为“CRMD_Georectified”的元数据实体为例,在O 3 的属性SubEntities集合中添加O 4 ,用伪码表示为:
Add O 4 into O 3 .SubEntities;
对所有拥有泛化型实体的元数据实体对象执行上述操作,完成特化关系和泛化关系的计算机语言描述。至此,以地理信息数据类型为驱动的实体多态通过计算机语言重构完成。
,元数据信息交互视图构建
S31,创建树列表结构视图,将步骤S2解析所得元数据数据字典的数据结构中的一个元数据元素对象表达为视图中的一个节点,将该对象的DspName和DictType属性值分别表达为视图中节点的首列和第二列数据值,在节点前采用差异化的图标样式表达该对象的IsMandatory属性的不同值,即当该属性值为false时,该对象为可选元素,使用表达可选元素的图标样式;否则使用表达必选元素的图标样式。以Name属性值为“date”和“edition”的两个元数据元素对象为例,上述步骤如图4所示。
S32,基于步骤S31创建的树列表结构视图,将步骤S21解析所得元数据数据字典的数据结构中元数据元素对象与元数据实体对象间的引用关系,表达为视图中非叶子节点首列与第二列数据值的对应关系;将步骤S22解析所得元数据数据字典的数据结构中元数据实体对象与元数据元素对象间的包含关系,表达为视图中以第二列数据值确定的、树结构下节点与其子节点间的包含关系。上述方法实现了数据字典多层次结构的表达。以元数据实体对象“CRMD_Keywords”及其包含的元数据元素对象,以及其中元数据元素对象“thesaurusName”引用的元数据实体对象“CRCI_Citation”为例,上述步骤示意如图5所示。
S33,采用步骤S31所述树列表结构,创建树列表结构子视图,将步骤S2解析所得元数据数据字典的数据结构中元数据实体对象间的泛化关系和特化关系,表达为树列表结构子视图中树结构下节点与其子节点间的包含关系,其中节点与包含它的父节点表达泛化关系,节点与它包含的子节点表达特化关系,将元数据实体对象中与“英文名称/角色”、“中文名称/角色”特征相对应的属性值分别表达为树列表结构子视图中节点的首列和第二列数据值。当某元数据实体具有泛化关系或特化关系时,将该子视图与所述树列表结构视图中以该元数据实体对象O i 为数据类型的元数据元素对象e对应节点N的第二列数据相关联,需要改变e的数据类型为其他元数据实体对象O j 时,展示该子视图并选择其中与O j 相对应的节点,步骤S31所创建视图中节点N包含的子节点变为由O j 包含的元数据元素对象创建的节点。上述方法实现了数据字典多态结构的表达。以元数据实体对象“CRMD_SpatialRepresentation”及其所有特化型实体对象为例,上述步骤示意如图6所示,同时示意了引用该类型实体的元素分别选择“CRMD_GridSpatialRepresentation”和“CRMD_VectorSpatialRepresentation”类型时视图中子节点的变化情况。
上述步骤S3中,采用列表结构,创建列表结构子视图,表达步骤S1中解析得到的各代码表及所含代码表枚举项的全部特征信息,具体操作方法是:
S34,对每一个由步骤S1解析获得的代码表及所含代码表枚举项,创建与之唯一对应的列表结构子视图,将每一个代码表枚举项表达为列表结构的一行,将代码表枚举项对象中与“域代码”、“中文名称”、“英文名称”、“说明”特征相对应的属性值分别表达为列表结构中各列的数据值,并以代码表对象的“英文名称”特征为列表结构子视图建立索引。
上述步骤S3中,关联树列表结构视图和列表结构子视图,将多个元数据实例文件中的数据同时显示到树列表结构视图中,从而实现批量快速采集,具体操作方法是:
S35,新建一个元数据实例采集或访问一个元数据实例文件时,在步骤S31创建的视图中树列表结构下新建一列表达该元数据的内容,在该列下,将对应非叶子节点的单元项设置为只读状态,对应叶子节点的单元项则根据节点对应的元数据元素对象的“数据类型”特征确定子视图样式。当“数据类型”特征值的数据类型为代码表类型时,按特征值索引步骤S34所述子视图,并响应采集操作进行展示,实现步骤S34中所述列表结构子视图与步骤S31树列表结构视图的关联。
采集或访问多个元数据实例时,在步骤S31所述视图中树列表结构下新建多个与元数据实例一一对应的列。如图7所示,采用 XML文件访问和数据解析接口,对应于视图各层次节点,解析元数据实例文件中的信息给列赋值。同时根据信息表达的需要,以数据字典中元数据元素对象的“最大出现次数”特征值为约束,动态增加视图中的节点,保证元数据实例信息表达的一致性和完整性。实现元数据实例批量交互式展示和编辑。
实施例一
为验证本发明的方法,以某行业领域地理信息元数据XML模式文件和实例文件为例进行试验。该元数据命名空间由10个xsd格式的模式文件和1个xml格式的代码表文件构成。经本发明步骤S1解析,获得45个元数据实体类对象、102个元数据元素类对象、15个代码表类对象和72个代码表枚举项类对象。经本发明步骤S2关系重构,确定102项包含关系,29项引用关系和19项泛化关系。经本发明步骤S3信息表达与交互,在树列表控件中表达出完整的数据字典层次结构、实体多态以及主要的特征信息。
采用本发明方法,访问和编辑一组包含数据集、矢量、栅格和模型等应用类型在内的地理信息元数据文件,树列表控件视图的展示效果如图8所示,在矢量、栅格和模型三种不同类型的地理信息数据驱动下,视图中元数据“空间信息”元素表达为不同状态的多个节点。另一方面,由于视图中多个实例文件由不同列数据同时展示,可批量交互采集数据集和数据的元数据实例。
与MetaGear软件采集地理信息元数据方式的对比
MetaGear软件是有国家基础地理信息中心研发的一款地理信息元数据采集软件,图9展示了该软件采集界面与采用本发明方法所设计软件的采集界面对比情况,虽然前者能够个性化地采集生产不同区域的XML元数据,但是与本发明方法相比,其不足在于一次仅能采集一个元数据实例,且需要在采集前指定地理信息数据所对应的数据类型模板,在整个采集过程中元数据数据字典结构固定,不具有灵活可变的特性。本发明方法解决了MetaGear软件无法一次采集多个元数据实例的问题,支持多种数据类型的元数据实例同时展示,并在采集过程中可以灵活调整元数据数据字典组织内容和结构,可以有效应对当前如FileGDB、KMZ等混合数据类型的地理信息数据的采集。
与文本编辑方式的地理信息元数据采集效率对比
采用本发明方法与文本直接编辑方式的元数据采集进行效率对比实验,分别从新建实例数据和修改实例数据两方面作比较,前者根据需求创建20个不同地理信息数据类型的元数据文件,分别记录无地理信息数据类型先验知识和有地理信息数据类型先验知识两种情况下两种方法的处理时间。后者根据需求修改20个既有不同地理信息数据类型的元数据文件,分别记录无增删元数据元素和有增删元数据元素情况下两种方法的处理时间。最终四种情况等权计算平均水平。两种方法在多环境下元数据处理时间的统计结果见表1。
表1 两种元数据处理方法效率对比
单位:分钟
Figure DEST_PATH_IMAGE002
分析上述实验结果可知,本文方法在各种情况下均优于文本编辑方法,由于后者在处理过程中不仅需要编辑大量的XML节点,而且还需要充分考虑元数据数据字典层次关系的正确描述,对数据处理人员熟悉地理信息元数据XML模式的程度有很高要求。反观本发明方法的实验结果,特别是在有先验知识的新建实例数据和有增删元素的修改实例数据情况下,能显著提升处理效率,平均时间节约达60.5%。
本发明的铁路工程元数据批量快速采集方法解决了现有方法存在的处理效率低、信息不完整、交互能力弱、灵活性差等问题。面向铁路工程地理信息元数据数据字典的数据解析与重构以及元数据信息交互视图构建是本发明实现的技术基础。在数据解析与重构方面,本发明采用计算机语言描述了由XML模式定义的地理信息元数据实体、元素、代码表及代码表枚举项的各类特征和关系,以自上而下、统一继承的组织形式重构了元数据数据字典的多层次和多态数据结构。在元数据信息交互视图构建方面,本发明综合树结构和列表视图的优势,直观、完整地反映元数据数据字典的全部内容,动态、灵活地表现其多层次和多态结构,为批量快速采集铁路工程地理信息元数据实例提供了高效的、可扩展的解决方法。

Claims (8)

1.一种铁路工程地理信息元数据批量快速采集方法,包括以下步骤:
S1,元数据数据类型定义和对象解析:首先根据地理信息元数据的XML模式实现规则,采用计算机语言定义元数据的数据类型,然后从元数据XML模式文件和代码表文件中提取其中记录的元数据实体、元素和代码表及代码表枚举项信息,解析为数据类型的实体对象、元素对象和代码表对象及代码表枚举项对象;
S2,元数据数据字典组织关系重构:通过扩展定义步骤S1元数据的数据类型中实体类和要素类的属性并为其赋值,用计算机语言描述元数据数据字典中记录的包含关系、引用关系、泛化关系和特化关系,并与步骤S1解析获得的实体对象和元素对象组织在一起,形成数据字典的数据结构;
S3,元数据信息交互视图构建:采用树列表结构,创建树列表结构视图以表达步骤S2获取的数据字典的数据结构,包括步骤S1中解析得到的元数据实体和元数据元素的部分特征信息,以及步骤S2中重构的四种关系,形成按照视图结构表达的、统一的、多态可控的组织形式;采用列表结构,创建列表结构子视图,表达步骤S1中解析得到的各代码表对象及所含代码表枚举项对象的全部特征信息;最终关联上述树列表结构视图和树列表结构子视图,将多个元数据实例文件中的数据同时显示到树列表结构视图中,实现批量快速采集;
其中,关联所述树列表结构视图和列表结构子视图,将多个元数据实例文件中的数据同时显示到视图中,实现批量快速采集的具体操作方法是:
新建一个元数据实例采集或访问一个元数据实例文件时,在所述树列表结构视图中树列表结构下新建一列表达该元数据的内容,在该列下,将对应非叶子节点的单元项设置为只读状态,对应叶子节点的单元项则根据节点对应的元数据元素对象的“数据类型”特征确定子视图样式;当“数据类型”特征值的数据类型为代码表类型时,按特征值索引所述列表结构子视图,并响应采集操作进行展示,实现所述列表结构子视图与所述树列表结构视图的关联;
采集或访问多个元数据实例时,在所述树列表结构视图中树列表结构下新建多个与元数据实例一一对应的列,根据信息表达的需要,以数据字典中元数据元素对象的“最大出现次数”特征值为约束,动态增加视图中的节点,保证元数据实例信息表达的一致性和完整性,实现元数据实例批量交互式展示和编辑。
2.根据权利要求1所述的铁路工程地理信息元数据批量快速采集方法,其特征在于:步骤S1中,根据地理信息元数据的XML模式实现规则,采用计算机语言定义元数据的数据类型包括以下步骤:
采用计算机语言分别定义元数据实体类、元数据元素类、元数据代码表类和元数据代码表枚举项类,根据《地理信息 元数据》标准的要求,将元数据实体和元数据元素的“中文名称/角色”、“英文名称/角色”、“缩写名”三个特征定义为对应类的字符串型属性,将元数据实体和元数据代码表中的“定义”特征定义为类的字符串型属性;将元数据元素的“约束/条件”、“最大出现次数”特征分别定义为布尔型和整数型属性,将元数据元素的“数据类型”特征定义为字符型和类型声明型的联合属性;
同样根据《地理信息 元数据》标准的要求,将元数据代码表和元数据代码表枚举项的“中文名称”、“英文名称”、“域代码”和“说明”四个特征定义为对应类的字符串型属性。
3.根据权利要求2所述的铁路工程地理信息元数据批量快速采集方法,其特征在于:步骤S1中,从元数据XML模式文件和代码表文件中提取其中记录的元数据实体、元素和代码表及代码表枚举项信息,解析为数据类型的实体对象、元素对象和代码表对象及代码表枚举项对象的具体操作方法是:
使用XML文件访问和数据解析接口,根据《地理信息 元数据XML模式实现》标准确定的语法,将xsd格式的模式文件中记录的各项元数据实体和元数据元素以及xml格式的代码表文件中记录的各项元数据代码表类型和元数据代码表枚举项,实例化为所述元数据实体类、元数据元素类、元数据代码表类和元数据代码表枚举项类的对象,并解析各自的特征信息,直接记录或转义为类对象的属性值。
4.根据权利要求1所述的铁路工程地理信息元数据批量快速采集方法,其特征在于:步骤S2中,通过扩展定义步骤S1元数据的数据类型中实体类和要素类的属性并为其赋值,用计算机语言描述元数据数据字典中记录的包含关系和引用关系,具体操作方法是:
首先在步骤S1中取得的元数据实体类中扩展定义名称为Elements、数据类型为元数据元素类集合型的属性,其次根据地理信息元数据数据字典的定义,某元数据实体对象O 1 与一组元数据元素对象e 1 , e 2 e n 构成包含关系,则将该组元数据元素类型对象的集合作为O 1 的Elements属性值,实现O 1 e 1 , e 2 e n 之间包含关系的计算机语言描述;
使用步骤S1中为元数据元素的“数据类型”特征定义的联合属性,其中数据类型为字符串的属性名称为DictType,数据类型为类型声明型的属性名称为DataType,根据地理信息元数据数据字典的定义,某项元数据元素对象e i 的数据类型为另一元数据实体对象O 2 ,则e i O 2 间构成引用关系,将O 2 的“英文名称/角色”特征值作为e i 的DictType属性值,将元数据实体类型声明作为e i 的DataType属性值,实现e i O 2 之间引用关系的计算机语言描述;
采用上述方法对元数据数据字典中所有包含关系和引用关系进行描述,最终形成由计算机语言描述的、从顶层元数据根实体出发的、至底层由简单数据类型的元素终止的数据字典多层次结构。
5.根据权利要求1所述的铁路工程地理信息元数据批量快速采集方法,其特征在于:步骤S2中,通过扩展定义步骤S1元数据的数据类型中实体类和要素类的属性并为其赋值,用计算机语言描述元数据数据字典中记录的泛化关系和特化关系,具体操作方法是:
对泛化关系,首先在步骤S1中取得的元数据实体类中扩展定义名称为SuperEntity、数据类型为元数据实体类的属性,根据地理信息元数据数据字典的定义,某元数据实体对象O 3 是元数据实体对象O 4 的泛化型,则O 3 O 4 间构成泛化关系,将O 3 作为O 4 的SuperEntity属性值,实现O 3 O 4 间泛化关系的计算机语言描述;
对特化关系,首先在步骤S1中取得的元数据实体类中扩展定义名称为SubEntities、数据类型为元数据实体类集合型的属性,根据地理信息元数据数据字典的定义,某元数据实体对象O 5 和另一元数据实体对象O 6 是元数据实体对象O 4 的特化型,则O 4 O 5 O 6 间构成特化关系,将O 5 O 6 组成的集合作为O 4 的SubEntities属性值,实现O 4 O 5 O 6 间特化关系的计算机语言描述;
采用上述方法对元数据数据字典中所有特化关系和泛化关系进行描述,最终形成由计算机语言描述的、元数据实体类型对象间具有继承关系的数据字典多态结构。
6.根据权利要求1所述的铁路工程地理信息元数据批量快速采集方法,其特征在于:步骤S3中,采用树列表结构,创建树列表结构视图以表达步骤S2获取的数据字典的数据结构,包括步骤S1中解析得到的元数据实体和元数据元素的部分特征信息,具体操作方法是:
创建树列表结构视图,所述树列表结构中纵向为树结构,横向为列表结构,列表中的一行表达为树结构中的一个节点,将步骤S2解析所得元数据数据字典的数据结构中的一个元数据元素对象表达为视图中的一个节点,将该对象中与“中文名称/角色”、“数据类型”特征相对应的属性值分别表达为视图中节点的首列和第二列数据值,将该对象中与“约束/条件”特征相对应的属性值表达为视图中节点的图标,用差异化的图标样式表达该属性的不同值。
7.根据权利要求6所述的铁路工程地理信息元数据批量快速采集方法,其特征在于:步骤S3中,采用树列表结构,创建用户视图表达步骤S2获取的数据字典的数据结构,包括步骤S2中重构的四种关系,具体操作方法是:
基于所述树列表结构视图,将步骤S2解析所得元数据数据字典的数据结构中元数据元素对象与元数据实体对象间的引用关系,表达为视图中非叶子节点首列与第二列数据值的对应关系;将步骤S2解析所得元数据数据字典的数据结构中元数据实体对象与元数据元素对象间的包含关系,表达为视图中以第二列数据值确定的、树结构下节点与其子节点间的包含关系,上述方法实现了数据字典多层次结构的表达;
采用所述树列表结构,创建树列表子视图,将步骤S2解析所得元数据数据字典的数据结构中元数据实体对象间的泛化关系和特化关系,表达为子视图中树结构下节点与其子节点间的包含关系,其中节点与包含它的父节点表达泛化关系,节点与它包含的子节点表达特化关系,将元数据实体对象中与“中文名称/角色”、“英文名称/角色”特征相对应的属性值分别表达为子视图中节点的首列和第二列数据值;当某元数据实体具有泛化关系或特化关系时,将该子视图与所述树列表结构视图中以该元数据实体对象O i 为数据类型的元数据元素对象e对应节点N的第二列数据相关联,需要改变e的数据类型为其他元数据实体对象O j 时,展示该子视图并选择其中与O j 相对应的节点,所述树列表结构视图中节点N包含的子节点变为由O j 包含的元数据元素对象创建的节点;上述方法实现了数据字典多态结构的表达。
8.根据权利要求1所述的铁路工程地理信息元数据批量快速采集方法,其特征在于:步骤S3中,采用列表结构,创建列表结构子视图,表达步骤S1中解析得到的各代码表及所含代码表枚举项的全部特征信息,具体操作方法是:
对每一个由步骤S1解析获得的代码表及所含代码表枚举项,创建与之唯一对应的列表结构子视图,将每一个代码表枚举项表达为列表结构的一行,将代码表枚举项对象中与“域代码”、“中文名称”、“英文名称”、“说明”特征相对应的属性值分别表达为列表结构中各列的数据值,并以代码表对象的“英文名称”特征为列表结构子视图建立索引。
CN202110639035.XA 2021-06-08 2021-06-08 一种铁路工程地理信息元数据批量快速采集方法 Active CN113536041B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110639035.XA CN113536041B (zh) 2021-06-08 2021-06-08 一种铁路工程地理信息元数据批量快速采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110639035.XA CN113536041B (zh) 2021-06-08 2021-06-08 一种铁路工程地理信息元数据批量快速采集方法

Publications (2)

Publication Number Publication Date
CN113536041A CN113536041A (zh) 2021-10-22
CN113536041B true CN113536041B (zh) 2022-07-12

Family

ID=78124706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110639035.XA Active CN113536041B (zh) 2021-06-08 2021-06-08 一种铁路工程地理信息元数据批量快速采集方法

Country Status (1)

Country Link
CN (1) CN113536041B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417638B (zh) * 2022-03-28 2022-06-17 湖南高至科技有限公司 一种图形化概念建模方法、装置及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045869A (zh) * 2015-07-14 2015-11-11 国家信息中心 基于多数据中心的自然资源地理空间数据组织方法和系统
CN107315771A (zh) * 2017-05-23 2017-11-03 中国科学院计算机网络信息中心 一种基于扩展库表数据字典的数据汇交系统定制化方法
CN108351768A (zh) * 2015-09-30 2018-07-31 伊恩杰里索芙特公司 用标记语言编写文档的方法
CN108509470A (zh) * 2017-05-18 2018-09-07 苏州纯青智能科技有限公司 一种图片元数据快速批处理模块及批处理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693917B2 (en) * 2001-11-30 2010-04-06 Intelligent Medical Objects, Inc. Method for adaptive data management
US8073863B2 (en) * 2007-02-12 2011-12-06 Bsp Software Llc Batch management of metadata in a business intelligence architecture
GB0906409D0 (en) * 2009-04-15 2009-05-20 Ipv Ltd Metadata browse
CA2668306A1 (en) * 2009-06-08 2010-12-08 Stephen R. Germann Method and system for applying metadata to data sets of file objects
US9922089B2 (en) * 2012-07-18 2018-03-20 Software Ag Usa, Inc. Systems and/or methods for caching XML information sets with delayed node instantiation
CN111190900B (zh) * 2019-12-10 2022-06-10 优网云计算有限公司 一种云计算模式下json数据可视化优化方法
CN111639075B (zh) * 2020-05-09 2023-05-12 武汉大学 一种基于扁平化r树的非关系数据库矢量数据管理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045869A (zh) * 2015-07-14 2015-11-11 国家信息中心 基于多数据中心的自然资源地理空间数据组织方法和系统
CN108351768A (zh) * 2015-09-30 2018-07-31 伊恩杰里索芙特公司 用标记语言编写文档的方法
CN108509470A (zh) * 2017-05-18 2018-09-07 苏州纯青智能科技有限公司 一种图片元数据快速批处理模块及批处理方法
CN107315771A (zh) * 2017-05-23 2017-11-03 中国科学院计算机网络信息中心 一种基于扩展库表数据字典的数据汇交系统定制化方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Q/CR9157—2020《铁路三维地理信息数据技术规范》内容解析;范登科;《铁道标准设计》;20210430;第65卷(第4期);全文 *
元数据在土地利用现状管理信息系统中的设计实现;徐财江等;《浙江大学学报(理学版)》;20061225(第06期);全文 *
元数据在空间信息网上发布中的实现方法与应用;李晓霞;《计算机时代》;20060425(第04期);全文 *
铁路地理信息分类与编码研究;潘佩芬;《铁道标准设计》;20181231;第62卷(第12期);全文 *
面向 GIS 应用的铁路工程三维信息模型数据交换方法;李浩;《西南交通大学学报》;20180228;第53卷(第1期);全文 *

Also Published As

Publication number Publication date
CN113536041A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN108038222B (zh) 用于信息系统建模和数据访问的实体-属性框架的系统
Fahrner et al. A survey of database design transformations based on the entity-relationship model
US5806066A (en) Method of integrating schemas of distributed heterogeneous databases
US5937409A (en) Integrating relational databases in an object oriented environment
US11893046B2 (en) Method and apparatus for implementing a set of integrated data systems
Isakowitz et al. The extended RMM methodology for web publishing
Aslan et al. Semantic heterogeneity resolution in federated databases by metadata implantation and stepwise evolution
US20060271885A1 (en) Automatic database entry and data format modification
KR20090028758A (ko) 정보 재사용 방법, 정보 제공 방법, 편집 가능한 문서, 및 문서 편집 시스템
US20070088731A1 (en) Method and apparatus for improved processing and analysis of complex hierarchic data
Varga et al. QB2OLAP: enabling OLAP on statistical linked open data
CN113536041B (zh) 一种铁路工程地理信息元数据批量快速采集方法
Di Battista et al. Design of statistical databases: a methodology for the conceptual step
CN116991923A (zh) 一种基于浏览器的拖拽式数据模型可视化建模系统及方法
CN116450110A (zh) 基于自定义属性的数据库的访问代码自动生成方法及系统
CN110347878A (zh) 一种规则引擎驱动的数据融合方法
Raper et al. UGIX: A layer based model for a GIS user interface
CN114880483A (zh) 一种元数据知识图谱构建方法、存储介质及系统
Liu et al. Database schema evolution using EVER diagrams
Razoqi Data modeling and design implementation for CouchDB database
CN113342325A (zh) 可视化建模方法、系统、电子设备及存储介质
Markowitz et al. An overview of the Lawrence Berkeley Laboratory extended entity-relationship database tools
CN115630086B (zh) 一种将Access应用转化为Web应用程序的方法
Hu et al. Research and application of semi-automatic construction of structured knowledge graph
Eklund et al. Virtual museums and web-based digital ecosystems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant