CN113377740A - 铁路元数据管理方法、应用方法及装置 - Google Patents

铁路元数据管理方法、应用方法及装置 Download PDF

Info

Publication number
CN113377740A
CN113377740A CN202110593723.7A CN202110593723A CN113377740A CN 113377740 A CN113377740 A CN 113377740A CN 202110593723 A CN202110593723 A CN 202110593723A CN 113377740 A CN113377740 A CN 113377740A
Authority
CN
China
Prior art keywords
metadata
information
added
railway
directory tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110593723.7A
Other languages
English (en)
Inventor
王同军
王万齐
刘北胜
吕向茹
解亚龙
卢文龙
尹逊霄
李慧
魏新元
王佳琦
郝蕊
石志军
张敬涵
乔方博
秦岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Railway Sciences Corp Ltd CARS
Institute of Computing Technologies of CARS
Beijing Jingwei Information Technology Co Ltd
Original Assignee
China Academy of Railway Sciences Corp Ltd CARS
Institute of Computing Technologies of CARS
Beijing Jingwei Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Railway Sciences Corp Ltd CARS, Institute of Computing Technologies of CARS, Beijing Jingwei Information Technology Co Ltd filed Critical China Academy of Railway Sciences Corp Ltd CARS
Priority to CN202110593723.7A priority Critical patent/CN113377740A/zh
Publication of CN113377740A publication Critical patent/CN113377740A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种铁路元数据管理方法、应用方法及装置,所述铁路元数据管理方法基于用户端发起对元数据的新增,在与铁路工程元数据目录树现有元数据进行定义比对查重的基础上,通过由多用户、审核端对象进行协同校审,实现新增元数据的高效审核和入库存储。进一步地,通过建立JSON Schema表单存储铁路工程元数据目录树中元数据之间的关联关系,铁路元数据应用方法中实现填报界面的自动生成以及可视化呈现。

Description

铁路元数据管理方法、应用方法及装置
技术领域
本发明涉及元数据管理技术领域,尤其涉及一种铁路元数据管理方法、应用方法及装置。
背景技术
数据是企业的核心资产,近年来,数据的爆发式增长以及复杂性为数据资源的利用带来挑战。元数据被定义为数据的数据,主要用来描述信息的背景、结构、内容和整个管理过程。元数据为信息化时代各行各业的数据治理提供新的解决思路。
随着技术的发展,铁路工程施工过程中的数据管理逐渐转为电子化,不同项目、路段和专业领域的数据需要复杂的元数据体系进行管理。由于铁路工程设计施工涉及到多种专业和多方主体,铁路工程建设领域数据呈现关系复杂、变更频繁的状况,传统的企业内容管理方式不能满足铁路工程数据管理的要求,亟需一种铁路元数据管理方法、应用方法及装置。
发明内容
本发明实施例提供了一种铁路元数据管理方法、应用方法及装置,以消除或改善现有技术中存在的一个或更多个缺陷,以适应铁路工程元数据管理过程中对多专业、多主体、复杂关系和频繁变更的管理需求。
本发明的技术方案如下:
一方面,本发明提供一种铁路元数据管理方法,包括:
获取用户端发送的第一待添加元数据信息,所述第一待添加元数据信息至少包括:第一名称、第一定义信息和第一分类标签;
根据所述定义信息判断铁路工程元数据目录树中是否存与所述第一待添加元数据信息定义相同或相近的标准元数据,若存在,则向所述用户端发送第一修改请求,并接收所述用户端返回的修改后的第二待添加元数据信息,所述第二待添加元数据信息至少包括:第二名称、第二定义信息和第二分类标签;
将所述第二待添加元数据信息发送至审核端;
接收所述审核端返回的确认通过信息,将所述第二待添加元数据信息按照所述第二分类标签的添加并公布在所述铁路工程元数据目录树中。
在一些实施例中,根据所述定义信息判断铁路工程元数据目录树中是否存与所述第一待添加元数据信息定义相同或相近的标准元数据之后,还包括:
若不存在,则将所述第一待添加元数据信息发送至所述审核端;
接收所述审核端返回的确认通过信息,将所述第一待添加元数据信息按照所述第一分类标签的添加并公布在所述铁路工程元数据目录树中。
在一些实施例中,将所述第二待添加元数据信息发送至审核端之后,还包括:
接受所述审核端返回的审核不通过信息,根据所述审核不通过信息向所述用户端发送第二修改请求,并接收所述用户端返回的修改后的第三待添加元数据信息,所述第三待添加元数据信息至少包括:第三名称、第三定义信息和第三分类标签;
将所述第三待添加元数据信息发送至所述审核端;
接收所述审核端返回的确认通过信息,将所述第三待添加元数据信息按照所述第三分类标签的添加并公布在所述铁路工程元数据目录树中。
在一些实施例中,所述第一待添加元数据信息还包括对应元数据的类型信息、约束信息、取值范围信息、附加信息、关系信息以及IFD编码;其中,所述类型信息为简单型、容器型和复合型中的一种;所述约束信息为必选、可选和条件选中的一种;所述附加信息至少包括计量单位信息、元数据来源信息以及表示方式信息;IFD编码为按照预定规则产生的唯一标识编码信息。
所述铁路工程元数据目录树至少包括项目类、组织机构类、人员类、文档类和公共元数据类,其中,所述项目类至少包括项目、线路、专业和设计单元。
在一些实施例中,获取用户端发送的第一待添加元数据信息之前,还包括:构建铁路工程标准元数据分类结构树,并添加标准元数据形成初始的铁路工程元数据目录树。
在一些实施例中,根据所述定义信息判断铁路工程元数据目录树中是否存与所述第一待添加元数据信息定义相同或相近的标准元数据,包括:
采用统计算法或深度学习算法计算所述第一定义信息与所述铁路工程元数据目录树中各标准元数据之间的定义信息相似度,若存在至少一个标准元数据与所述第一待添加元数据的定义信息相似度高于设定值,则存在与所述第一待添加元数据信息定义相同或相近的标准元数据,否则不存在;其中,所述统计算法为TextRank算法,所述深度学习算法为Word2Vec算法或DSSM算法。
在一些实施例中,接收所述审核端返回的确认通过信息,将所述第二待添加元数据信息按照所述第二分类标签的添加并公布在所述铁路工程元数据目录树中之后,还包括:
根据所述铁路工程元数据目录树将各元数据进行关联,建立元数据JSON Schema表单;
将所述铁路工程元数据目录树中的各元数据以及各JSON Schema表单分别存储为JSON格式文件,每个元数据和每个JSON Schema表单分别添加MD5校验值。
另一方面,本发明还包括一种铁路工程元数据应用方法,包括:
接收用户端发送的第一触发信息,并根据所述第一触发信息在预设专业类别下创建表单;
接收用户端发送的第二触发信息,所述第二触发信息包括构建所述表单所需的目标元数据,所述目标元数据是在权利要求1至7所述铁路元数据管理方法中构建的铁路工程元数据目录树中选取的;
获取所述铁路工程元数据目录树中记载的元数据JSON Schema表单,根据各元数据JSON Schema表单中记载的各目标元数据之间的关联关系以及各目标元数据包含的子元素生成填报界面,并进行可视化呈现;
接收用户端发送的填报信息,并生成物理表。
在一些实施例中,接收填报信息之后,还包括:根据所述铁路工程元数据目录树中记载的各目标元数据对应的取值范围信息对所述填报信息进行校验,若存在至少一个目标元数据对应的取值范围与所述填报信息不一致,则生成报警提示并重新接收填报信息。
另一方面,本发还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。
本发明的有益效果至少是:
所述铁路元数据管理方法、应用方法及装置中,所述铁路元数据管理方法基于用户端发起对元数据的新增,在与铁路工程元数据目录树现有元数据进行定义比对查重的基础上,通过由多用户、审核端对象进行协同校审,实现新增元数据的高效审核和入库存储。
进一步地,通过建立JSON Schema表单存储铁路工程元数据目录树中元数据之间的关联关系,铁路元数据应用方法中实现填报界面的自动生成以及可视化呈现。
本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在书面说明及其权利要求书以及附图中具体指出的结构实现到并获得。
本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1为本发明一实施例所述铁路元数据管理方法的流程示意图;
图2为本发明一实施例所述铁路工程元数据应用方法的流程示意图;
图3为本发明另一实施例所述铁路工程元数据应用方法的逻辑示意图;
图4为本发明另一实施例所述铁路工程元数据应用方法的逻辑示意图;
图5为本发明一实施例所述铁路工程元数据应用方法中填报数据校验过程的逻辑示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本发明做进一步详细说明。在此,本发明的示意性实施方式及其说明用于解释本发明,但并不作为对本发明的限定。
在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
随着互联网信息技术的发展,铁路工程建设过程中,大量的数据需要进行管理、汇总和分析,铁路工程数据的管理需要大量运用到与铁路工程技术相关的元数据。铁路工程元数据呈现涉及专业众多、数据关系复杂并且变换频繁的状态,以往的操作方法由单一主体通过人工进行元数据新增和变换,但是单一主体处理速度慢、校审权限过于集中,对元数据的处理不足以适应实际场景中多个用户对元数据快速的变更需求。在电子化的初级阶段,特别是在跨地域、多项目、多专业协同工作的过程中,面对日新月异的数据管理需求,传统的元数据管理方法已经无法解决当下应用场景下的问题。
需要预先说明的是,本发明实施例所述铁路元数据管理方法和应用方法的管理运行平台,包括用于元数据调用和管理的管理端服务器,以及设置在各设计院、施工企业事业单位和管理部门的用户端服务器。各用户端服务器连接管理端服务器,用于调用管理端服务器存储和统一管理的铁路工程元数据目录树中的元数据。管理端服务器和用户端服务器可以采用单片机、微型计算机或其他可以存储和运行计算机程序的电子设备。
具体的,本发明提供一种铁路元数据管理方法,用于在管理端服务器上运行,如图1所示,包括步骤S101~S104:
步骤S101:获取用户端发送的第一待添加元数据信息,第一待添加元数据信息至少包括:第一名称、第一定义信息和第一分类标签。
步骤S102:根据定义信息判断铁路工程元数据目录树中是否存与第一待添加元数据信息定义相同或相近的标准元数据,若存在,则向用户端发送第一修改请求,并接收用户端返回的修改后的第二待添加元数据信息,第二待添加元数据信息至少包括:第二名称、第二定义信息和第二分类标签。
步骤S103:将第二待添加元数据信息发送至审核端。
步骤S104:接收审核端返回的确认通过信息,将第二待添加元数据信息按照第二分类标签的添加并公布在铁路工程元数据目录树中。
在步骤S101中,用户端是在各设计院、施工企业事业单位和管理部门端装载并运行的用户端服务器,用户端基于实际工作过程中的数据需求,查询现有的铁路工程元数据目录树,寻找所需的元数据。当铁路工程元数据目录树中缺少所需元数据时,则可以由用户端发起新增元数据。具体的,用户端基于需要新增的元数据的特征生成第一待添加元数据信息,第一待添加元数据信息至少包括用于标记元数据的第一名称、按照设定规则对元数据概念进行描述的第一定义信息,以及由用户端认定的元数据在铁路工程元数据目录树中所述位置的第一分类标签。
对元数据进行在线修改的过程中,可编辑元数据元素之间的父子关系信息以及元数据元素的描述信息。可添加新的元数据元素,当新添加的元素名称与既有元数据元素相同时,系统自动审核和调取既有元数据元素信息,进行报警提示,以保证元素的唯一性,避免重复定义。
在一些实施例中,第一待添加元数据信息还包括对应元数据的类型信息、约束信息、取值范围信息、附加信息、关系信息以及IFD编码。
其中,类型信息为简单型、容器型和复合型中的一种;简单型元数据是具有单一定义,描述单一数据特征,不再包含子元素的元数据,如“年龄、日期”。容器型元数据是指包含或关联多个简单型元数据的类型,如“身份信息”,而“身份信息”包含“姓名、年龄、籍贯等”。复合型是指包含或关联多个简单型元数据并且本身具有特定的数值标记的元数据,如“图书分类号、档案编号”。
约束信息为必选、可选和条件选中的一种。必选是指在多个选项中的一个是必须选择的。可选是指多个选项中可以任意选择其中一个或多个。条件选是指条件满足时,至少存在一个元数据元素是必选的。
附加信息至少包括计量单位信息、元数据来源信息以及表示方式信息。其中,计量单位信息指该元数据的量纲。元数据来源信息是指请求添加该元数据的用户端身份信息。标识方式为记录该元数据的形式格式。
关系信息为各元数据之间的关联关系,如从属关系。
IFD编码为按照预定规则产生的唯一标识编码信息。IFD(交换标准)编码用于按照设定规则生成与某一元数据唯一对应的标识码。
铁路工程元数据目录树至少包括项目类、组织机构类、人员类、文档类和公共元数据类,其中,所述项目类至少包括项目、线路、专业和设计单元。在另一些实施例中,可以根据需要进一步划分分支。
在一些实施例中,步骤S101之前,获取用户端发送的第一待添加元数据信息之前,还包括:构建铁路工程标准元数据分类结构树,并添加标准元数据形成初始的铁路工程元数据目录树。
在步骤S102中,管理端服务器将第一待添加元数据信息中的第一定义信息与现有的铁路工程元数据目录树中各元数据的定义信息进行对比,判断现有元数据中是否存在与第一待添加元数据相同或近似的。具体的,可以采用语义识别的方式计算定义信息相似度,以判断定义之间是否相同或者近似。
在一些实施例中,根据定义信息判断铁路工程元数据目录树中是否存与第一待添加元数据信息定义相同或相近的标准元数据,包括:采用统计算法或深度学习算法计算第一定义信息与铁路工程元数据目录树中各标准元数据之间的定义信息相似度,若存在至少一个标准元数据与第一待添加元数据的定义信息相似度高于设定值,则存在与第一待添加元数据信息定义相同或相近的标准元数据,否则不存在;其中,统计算法可以为TextRank算法,深度学习算法可以为Word2Vec算法或DSSM算法。
本实施例中,基于自然语言处理的方式,计算各新增元数据信息间的定义信息相似度。其中,将文本中的每个句子分别看做一个节点,如果两个句子有相似性,那么认为这两个句子对应的节点之间存在一条无向有权边。句子相似度的计算方法为如下计算式:
Figure BDA0003090182610000071
公式中,Si、Sj分别表示两个句子词的个数总数,Wk表示句子中的词,那么分子部分的意思是同时出现在两个句子中的同一个词的个数,分母是对句子中词的个数求对数之和。分母这样设计可以遏制较长的句子在相似度计算上的优势。
Word2Vec算法的计算方式是,首先对句子分词,使用基于Gensim的Word2Vec训练词向量,获取每个词对应的词向量,然后将所有的词向量相加求平均,得到句子向量,最后计算两个句子向量的余弦值(余弦相似度)。具体的,用向量空间中的两个向量夹角的余弦值作为衡量两个个体间差异大小的度量,值越接近1,就说明夹角角度越接近0°,也就是两个向量越相似。
DSSM算法(Deep Structured Semantic Models,基于深度网络的语义模型)的原理是,通过搜索引擎里查询请求(Query)和文档(Doc)的海量的点击曝光日志,用神经网络把Query和Doc表达为低纬语义向量,并通过余弦距离来计算两个语义向量的距离,最终训练出语义相似度模型。该模型既可以用来预测两个句子的语义相似度,又可以获得某句子的低纬语义向量表达。其中,低纬度语义向量是把一句文本通过一定的方式转换到一个固定维度的空间上,这样就可以对不同句子间计算相似度。
进一步的,当现有的铁路工程元数据目录树中存在与第一待添加元数据信息定义相同或相似的元数据时,由管理端服务器向相应的用户端发送第一修改请求,以提示发起新增元数据的用户端对第一待添加元数据进行修改。第一修改请求可以包含铁路工程元数据目录树中与第一待添加元数据信息近似或相同的元数据信息,也可以直接记载该近似或相同的元数据的IFD编码。由用户端根据第一修改请求进行修改。
进一步的,管理端服务器接收用户端返回的修改后的第二待添加元数据信息,第二待添加元数据信息至少包括:第二名称、第二定义信息和第二分类标签。第二待添加元数据信息的形式,参照前文对第一待添加元数据信息说明。在另一些实施例中,用户端也可以基于实际情况决定不做更改,直接以第一待添加元数据信息作为第二待添加元数据信息。
在步骤S103中,为了进行多端校审,管理端服务器还将第二待添加元数据信息发送至审核端进行审核。具体的,审核端可以是单独设置的审核主体所在端口,也可以设置在多个用户端进行交叉校审。具体的审核过程可以根据不同审核主体的要求分别设置,也可以进行统一规范。审核结果由各审核主体在相应的标准下确定,最终决定是否通过审核,符合标准则生成确认通过信息,否则生成不通过信息。
在步骤S104中,基于审核端发送的确认通过信息,将第二待添加元数据信息按照第二标签的分类添加至铁路工程元数据目录树。
元数据在使用过程中会根据实际需求进行持续更新,从而保证元数据的高可用性。当对元数据的更新积累到一定数量时会对当前的所有元数据元素重新整体发布。在元数据发布时会同时提供元数据版本号、新版本元数据的开始使用时间以及版本描述信息。元数据以数据包的形式提供,可直接下载或通过数据接口同步到其他应用系统。每个数据包对应一个唯一的MD5值,元数据的使用者可通过对比MD5值验证数据包文件的真实性。
在一些实施例中,步骤S102之后,即根据定义信息判断铁路工程元数据目录树中是否存与第一待添加元数据信息定义相同或相近的标准元数据之后,还包括步骤S105~S106:
步骤S105:若不存在,则将第一待添加元数据信息发送至审核端。
步骤S106:接收审核端返回的确认通过信息,将第一待添加元数据信息按照第一分类标签的添加并公布在铁路工程元数据目录树中。
具体的,步骤S105~S106中,如果铁路工程元数据目录树中没有与第一待添加元数据信息定义相同或近似的元数据,则直接发送审核端进行校审。具体的校审过程,可以彩照步骤S103的说明。
在一些实施例中,步骤S103之后,即将所述第二待添加元数据信息发送至审核端之后,还包括步骤S107~S109:
步骤S107:接受审核端返回的审核不通过信息,根据审核不通过信息向用户端发送第二修改请求,并接收用户端返回的修改后的第三待添加元数据信息,第三待添加元数据信息至少包括:第三名称、第三定义信息和第三分类标签。
步骤S108:将第三待添加元数据信息发送至审核端。
步骤S109:接收审核端返回的确认通过信息,将第三待添加元数据信息按照第三分类标签的添加并公布在铁路工程元数据目录树中。
在步骤S107~S109中,基于审核端的审核,在不通过的基础上,由管理端服务器向用户端发送第二修改请求,并基于用户端修改并返回的第三待添加元数据信息,重新发送审端进行审核,若通过则进行发布。若依旧审核不通过,则可以生成并返回新增失败信息。
在一些实施例中,步骤S104之后,即接收审核端返回的确认通过信息,将第二待添加元数据信息按照第二分类标签的添加并公布在铁路工程元数据目录树中之后,还包括步骤S1041~S1042:
步骤S1041:根据铁路工程元数据目录树将各元数据进行关联,建立元数据JSONSchema表单。
步骤S1042:将铁路工程元数据目录树中的各元数据以及各JSON Schema表单分别存储为JSON格式文件,每个元数据和每个JSON Schema表单分别添加MD5校验值。
JSON格式,即JavaScript Object Notation,是一种轻量级的数据交换格式。JSONSchema表单是遵循JSON规范的JSON格式字符串,用于记载元数据关联关系的数据结构。用户端在实际应用过程中,在调用元数据时,可以基于JSON Schema表单中的数据结构关联关系,自动生成相应的报表。在一些实施例中,每个JSON格式文件都添加信息摘要,用于在应用导入过程中进行安全认证。在一些实施例中,信息摘要基于MD5信息摘要算法生成。使用MD5算法可以为文件(不管其大小、格式、数量)产生一个独一无二的“数字指纹”,借助这个“数字指纹”,通过检查文件前后MD5值是否发生了改变,就可以知道源文件是否被改动。
另一方面,本发明还包括一种铁路工程元数据应用方法,用于在管理端服务器上运行,如图2所示,包括步骤S201~S204:
步骤S201:接收用户端发送的第一触发信息,并根据第一触发信息在预设专业类别下创建表单。
步骤S202:接收用户端发送的第二触发信息,第二触发信息包括构建表单所需的目标元数据,目标元数据是在步骤S101~S109所述铁路元数据管理方法中构建的铁路工程元数据目录树中选取的。
步骤S203:获取铁路工程元数据目录树中记载的元数据JSON Schema表单,根据各元数据JSON Schema表单中记载的各目标元数据之间的关联关系以及各目标元数据包含的子元素生成填报界面,并进行可视化呈现。
步骤S204:接收用户端发送的填报信息,并生成物理表。
在步骤S201中,用户端发送第一触发信息,以基于特定项目、专业下建立用于上报数据的表单。具体的,可以按照铁路工程元数据目录树的分类,按照项目、线路、专业和设计单元四级确定表单内容信息范围。
在步骤S202和S203中,基于第二触发信息中选取的铁路工程元数据目录树中的元数据,可视化构建和生成填报界面。铁路工程元数据目录树中的内容是以JSON格式文件存储的,JSON Schema表单中记载的各目标元数据之间的关联关系,基于这种与存储的关系,可以自动生成可视化的填报界面。基于JSON Schema表单,可视化填报界面中,可以自动显示各元数据所包含的子元素,以及相关联的元素。对元数据之间的选择关系等进行自动化的限定。
在步骤S204中,接收用户端发送的填报信息,也即各元数据对应的数值和量纲,最终生成确定的物理表格。在JSON Schema表单确定的关联关系下,选择特定元数据所形成的物理表的元数据内容和格式是一致的。
在一些实施例中,步骤S204中,接收填报信息之后,还包括:根据铁路工程元数据目录树中记载的各目标元数据对应的取值范围信息对填报信息进行校验,若存在至少一个目标元数据对应的取值范围与填报信息不一致,则生成报警提示并重新接收填报信息。
具体的,在本实施例中,根据铁路工程元数据目录树中记载的各元数据的约束信息和附加信息,对各元数据值之间的关系、值域限制、量纲和表示形式进行验证,以保证形式和内容符合规范。
下面给出一个铁路工程元数据应用方法的示例:
在铁路工程元数据管理系统中可进行表单的可视化拼装,参照图3,具体过程为:首先在一个专业类别下创建一个新的表单,之后在元数据库中选取适合的元数据元素作为表单的数据项,当选择的元数据元素包含子元素时,这些子元素会同时加入到表单的数据项当中。选择完成后系统根据选取的元数据元素信息自动生成JSON形式的表单,即填报界面。
在一些实施例中,参照图4,生成填报界面之后,还可以继续添加元数据,以重新生成填报界面。通过触发确认添加元数据,跳转至元数据添加界面,选择新增的元数据后确认,重新生成填报界面。进一步的,用户基于最终的填报界面填报表单信息,对填报信息确认后,基于各元数据的约束规则对填报的数据进行校验。如果有误则重新填报,如果正确无误,则可以生成最终的物理表。
具体的,参照图5,对填报数据的验证过程中,在数据填报后,确定填写的元数据并获取各元数据的约束信息,基于约束信息对输入的元数据值进行校验,校验内容包括但不限于数据类型、数据长度和允许值范围,若校验不通过则重新填报,若校验通过则将数据导入并生成物理表,完成数据上报。
另一方面,本发还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。
综上所述,所述铁路元数据管理方法、应用方法及装置中,所述铁路元数据管理方法基于用户端发起对元数据的新增,在与铁路工程元数据目录树现有元数据进行定义比对查重的基础上,通过由多用户、审核端对象进行协同校审,实现新增元数据的高效审核和入库存储。
进一步地,通过建立JSON Schema表单存储铁路工程元数据目录树中元数据之间的关联关系,铁路元数据应用方法中实现填报界面的自动生成以及可视化呈现。
本领域普通技术人员应该可以明白,结合本文中所公开的实施方式描述的各示例性的组成部分、系统和方法,能够以硬件、软件或者二者的结合来实现。具体究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
本发明中,针对一个实施方式描述和/或例示的特征,可以在一个或更多个其它实施方式中以相同方式或以类似方式使用,和/或与其他实施方式的特征相结合或代替其他实施方式的特征。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种铁路元数据管理方法,其特征在于,包括:
获取用户端发送的第一待添加元数据信息,所述第一待添加元数据信息至少包括:第一名称、第一定义信息和第一分类标签;
根据所述定义信息判断铁路工程元数据目录树中是否存与所述第一待添加元数据信息定义相同或相近的标准元数据,若存在,则向所述用户端发送第一修改请求,并接收所述用户端返回的修改后的第二待添加元数据信息,所述第二待添加元数据信息至少包括:第二名称、第二定义信息和第二分类标签;
将所述第二待添加元数据信息发送至审核端;
接收所述审核端返回的确认通过信息,将所述第二待添加元数据信息按照所述第二分类标签的添加并公布在所述铁路工程元数据目录树中。
2.根据权利要求1所述的铁路元数据管理方法,其特征在于,根据所述定义信息判断铁路工程元数据目录树中是否存与所述第一待添加元数据信息定义相同或相近的标准元数据之后,还包括:
若不存在,则将所述第一待添加元数据信息发送至所述审核端;
接收所述审核端返回的确认通过信息,将所述第一待添加元数据信息按照所述第一分类标签的添加并公布在所述铁路工程元数据目录树中。
3.根据权利要求1所述的铁路元数据管理方法,其特征在于,将所述第二待添加元数据信息发送至审核端之后,还包括:
接受所述审核端返回的审核不通过信息,根据所述审核不通过信息向所述用户端发送第二修改请求,并接收所述用户端返回的修改后的第三待添加元数据信息,所述第三待添加元数据信息至少包括:第三名称、第三定义信息和第三分类标签;
将所述第三待添加元数据信息发送至所述审核端;
接收所述审核端返回的确认通过信息,将所述第三待添加元数据信息按照所述第三分类标签的添加并公布在所述铁路工程元数据目录树中。
4.根据权利要求1所述的铁路元数据管理方法,其特征在于,所述第一待添加元数据信息还包括对应元数据的类型信息、约束信息、取值范围信息、附加信息、关系信息以及IFD编码;
其中,所述类型信息为简单型、容器型和复合型中的一种;
所述约束信息为必选、可选和条件选中的一种;
所述附加信息至少包括计量单位信息、元数据来源信息以及表示方式信息;
IFD编码为按照预定规则产生的唯一标识编码信息;
所述铁路工程元数据目录树至少包括项目类、组织机构类、人员类、文档类和公共元数据类,其中,所述项目类至少包括项目、线路、专业和设计单元。
5.根据权利要求1所述的铁路元数据管理方法,其特征在于,获取用户端发送的第一待添加元数据信息之前,还包括:
构建铁路工程标准元数据分类结构树,并添加标准元数据形成初始的铁路工程元数据目录树。
6.根据权利要求1所述的铁路元数据管理方法,其特征在于,根据所述定义信息判断铁路工程元数据目录树中是否存与所述第一待添加元数据信息定义相同或相近的标准元数据,包括:
采用统计算法或深度学习算法计算所述第一定义信息与所述铁路工程元数据目录树中各标准元数据之间的定义信息相似度,若存在至少一个标准元数据与所述第一待添加元数据的定义信息相似度高于设定值,则存在与所述第一待添加元数据信息定义相同或相近的标准元数据,否则不存在;其中,所述统计算法为TextRank算法,所述深度学习算法为Word2Vec算法或DSSM算法。
7.根据权利要求1所述的铁路元数据管理方法,其特征在于,接收所述审核端返回的确认通过信息,将所述第二待添加元数据信息按照所述第二分类标签的添加并公布在所述铁路工程元数据目录树中之后,还包括:
根据所述铁路工程元数据目录树将各元数据进行关联,建立元数据JSON Schema表单;
将所述铁路工程元数据目录树中的各元数据以及各JSON Schema表单分别存储为JSON格式文件,每个元数据和每个JSON Schema表单分别添加MD5校验值。
8.一种铁路工程元数据应用方法,其特征在于,包括:
接收用户端发送的第一触发信息,并根据所述第一触发信息在预设专业类别下创建表单;
接收用户端发送的第二触发信息,所述第二触发信息包括构建所述表单所需的目标元数据,所述目标元数据是在权利要求1至7所述铁路元数据管理方法中构建的铁路工程元数据目录树中选取的;
获取所述铁路工程元数据目录树中记载的元数据JSON Schema表单,根据各元数据JSON Schema表单中记载的各目标元数据之间的关联关系以及各目标元数据包含的子元素生成填报界面,并进行可视化呈现;
接收用户端发送的填报信息,并生成物理表。
9.根据权利要求8所述的铁路工程元数据应用方法,其特征在于,接收填报信息之后,还包括:
根据所述铁路工程元数据目录树中记载的各目标元数据对应的取值范围信息对所述填报信息进行校验,若存在至少一个目标元数据对应的取值范围与所述填报信息不一致,则生成报警提示并重新接收填报信息。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至9任一项所述方法的步骤。
CN202110593723.7A 2021-05-28 2021-05-28 铁路元数据管理方法、应用方法及装置 Pending CN113377740A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110593723.7A CN113377740A (zh) 2021-05-28 2021-05-28 铁路元数据管理方法、应用方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110593723.7A CN113377740A (zh) 2021-05-28 2021-05-28 铁路元数据管理方法、应用方法及装置

Publications (1)

Publication Number Publication Date
CN113377740A true CN113377740A (zh) 2021-09-10

Family

ID=77574897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110593723.7A Pending CN113377740A (zh) 2021-05-28 2021-05-28 铁路元数据管理方法、应用方法及装置

Country Status (1)

Country Link
CN (1) CN113377740A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114185869A (zh) * 2021-12-03 2022-03-15 四川新网银行股份有限公司 一种基于数据标准的数据模型稽核的方法
CN114416714A (zh) * 2022-01-18 2022-04-29 军事科学院系统工程研究院后勤科学与技术研究所 数据治理系统
CN114997808A (zh) * 2021-12-19 2022-09-02 中国铁道科学研究院集团有限公司电子计算技术研究所 铁路施工调度简报生成方法和系统
CN116737113A (zh) * 2023-04-23 2023-09-12 中国科学院高能物理研究所 面向海量科学数据的元数据目录管理系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111068328A (zh) * 2019-11-19 2020-04-28 深圳市其乐游戏科技有限公司 游戏广告配置表格的生成方法、终端设备及介质
CN111581918A (zh) * 2020-04-24 2020-08-25 中国铁道科学研究院集团有限公司电子计算技术研究所 铁路工程数据交付方法及装置
CN112732703A (zh) * 2021-03-23 2021-04-30 中国信息通信研究院 元数据处理方法、元数据处理装置及可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111068328A (zh) * 2019-11-19 2020-04-28 深圳市其乐游戏科技有限公司 游戏广告配置表格的生成方法、终端设备及介质
CN111581918A (zh) * 2020-04-24 2020-08-25 中国铁道科学研究院集团有限公司电子计算技术研究所 铁路工程数据交付方法及装置
CN112732703A (zh) * 2021-03-23 2021-04-30 中国信息通信研究院 元数据处理方法、元数据处理装置及可读存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114185869A (zh) * 2021-12-03 2022-03-15 四川新网银行股份有限公司 一种基于数据标准的数据模型稽核的方法
CN114997808A (zh) * 2021-12-19 2022-09-02 中国铁道科学研究院集团有限公司电子计算技术研究所 铁路施工调度简报生成方法和系统
CN114416714A (zh) * 2022-01-18 2022-04-29 军事科学院系统工程研究院后勤科学与技术研究所 数据治理系统
CN114416714B (zh) * 2022-01-18 2022-09-02 军事科学院系统工程研究院后勤科学与技术研究所 数据治理系统
CN116737113A (zh) * 2023-04-23 2023-09-12 中国科学院高能物理研究所 面向海量科学数据的元数据目录管理系统及方法
CN116737113B (zh) * 2023-04-23 2024-01-02 中国科学院高能物理研究所 面向海量科学数据的元数据目录管理系统及方法

Similar Documents

Publication Publication Date Title
CN113377740A (zh) 铁路元数据管理方法、应用方法及装置
US8949166B2 (en) Creating and processing a data rule for data quality
KR101755365B1 (ko) 레코드 포맷 정보의 관리
US11769003B2 (en) Web element rediscovery system and method
US7426525B2 (en) Method and apparatus for identifying an object using an object description language
CN110362542B (zh) 核电站文件编码方法、装置、计算机设备和存储介质
CN114528008A (zh) 基于分布式版本控制系统的代码管控方法、设备及介质
CN111475700A (zh) 一种数据提取方法及相关设备
CN112307747A (zh) 车辆配件检索方法、装置、计算机设备及可读存储介质
US8862609B2 (en) Expanding high level queries
CN112364022B (zh) 信息推导管理方法、装置、计算机设备及可读存储介质
CN112765136B (zh) 医学编码词典的存储方法、升级方法和装置
CN107451179B (zh) 针对增加区块的整体勘误的区块链的查询方法及系统
CN112685389B (zh) 数据管理方法、数据管理装置、电子设备及存储介质
CN112035616B (zh) 基于bert模型和规则的医保数据对码方法、装置及设备
CN114254617A (zh) 一种修订条款的方法、装置、计算设备及存储介质
CN113434734A (zh) 一种生成文件、读取文件的方法、装置、设备及存储介质
KR20120036523A (ko) 데이터 인증 방법 및 시스템
CN118051889B (zh) 基于llm的sca许可证风险分析方法、装置及设备
Case et al. The intersection of algorithmically random closed sets and effective dimension
CN113377741A (zh) 铁路工程设计元数据管理方法及装置
CN116737870A (zh) 上报信息存储方法、装置、电子设备和计算机可读介质
CN118312531A (zh) 查询语言生成方法、系统、电子设备及存储介质
CN117453661A (zh) 资源配置方法、装置、计算机设备、存储介质
CN115643177A (zh) 一种报文处理方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210910