CN112699160B - 元数据模板升级方法、装置及可读存储介质 - Google Patents

元数据模板升级方法、装置及可读存储介质 Download PDF

Info

Publication number
CN112699160B
CN112699160B CN202110304714.1A CN202110304714A CN112699160B CN 112699160 B CN112699160 B CN 112699160B CN 202110304714 A CN202110304714 A CN 202110304714A CN 112699160 B CN112699160 B CN 112699160B
Authority
CN
China
Prior art keywords
metadata
enterprise
item
template
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110304714.1A
Other languages
English (en)
Other versions
CN112699160A (zh
Inventor
刘阳
谢滨
田娟
朱斯语
陈文曲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Information and Communications Technology CAICT
Original Assignee
China Academy of Information and Communications Technology CAICT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Information and Communications Technology CAICT filed Critical China Academy of Information and Communications Technology CAICT
Priority to CN202110304714.1A priority Critical patent/CN112699160B/zh
Publication of CN112699160A publication Critical patent/CN112699160A/zh
Application granted granted Critical
Publication of CN112699160B publication Critical patent/CN112699160B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种元数据模板升级方法、元数据模板升级装置及可读存储介质,元数据系统中维护了不同行业的元数据模板,在接收到企业上传的企业元数据模板情况下,将企业元数据模板中的每个企业元数据项与该企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,针对匹配成功的企业元数据项,增加与该元数据项匹配的备选元数据项的标记值,针对匹配失败的企业元数据项,将该企业元数据项作为备选元数据项以及设定对应的标记值为初始值。进而,可以基于每个备选元数据项的标记值,对该企业的准元数据模板中的标准元数据项进行更新,能够更好适配行业所属企业的需求。

Description

元数据模板升级方法、装置及可读存储介质
技术领域
本申请涉及工业互联网的数据处理领域,尤其涉及一种元数据模板升级方法、装置及可读存储介质。
背景技术
工业互联网是新一代信息通信技术与工业经济融合的全新工业生态、关键基础设施的新型应用模式,通过人、机、物的全面互联,实现全要素、全产业链、价值链的全面连接,推动企业智能化发展。
用户依托工业互联网标识解析系统来访问保存机器、原材料、零部件及产品等物件相关信息的服务器,并通过工业互联网标识实现异主、异地、异构信息的智能关联,为信息共享以及产品全生命周期管理提供支撑。工业互联网数据平台建立统一的元数据模板,但现有技术中存在模板不适用的问题。
发明内容
本申请实施例中提供了一种元数据模板升级方法、元数据模板升级装置及可读存储介质,用于解决工业互联网系统中元数据模板不适用的问题。
本申请第一方面实施例提供一种元数据模板升级方法,应用于元数据系统,包括:
接收企业上传的企业元数据模板,其中,所述企业元数据模板中包括所述企业配置的至少一个企业元数据项;
将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,其中,所述备选元数据项包括所述第一行业对应的第一标准元数据模板中的所有标准元数据项,所述匹配结果包括匹配成功的第一企业元数据项和匹配失败的第二企业元数据项;
基于所述匹配结果,增加与所述第一企业元数据项匹配的备选元数据项的标记值,将所述第二企业元数据项作为备选元数据项以及设定对应的标记值为初始值;
基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新。
本申请第二方面实施例提供一种元数据模板升级装置,应用于元数据系统,包括:
接收模块,用于接收企业上传的企业元数据模板,其中,所述企业元数据模板中包括所述企业配置的至少一个企业元数据项;
匹配模块,用于将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,其中,所述备选元数据项包括所述第一行业对应的第一标准元数据模板中的所有标准元数据项,所述匹配结果包括匹配成功的第一企业元数据项和匹配失败的第二企业元数据项;
处理模块,用于基于所述匹配结果,增加与所述第一企业元数据项匹配的备选元数据项的标记值,将所述第二企业元数据项作为备选元数据项以及设定对应的标记值为初始值;
更新模块,用于基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新。
本申请第三方面实施例提供一种元数据模板升级装置,应用于元数据系统,所述元数据模板升级装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前述第一方面所述的元数据模板升级方法的步骤。
本申请第四方面实施例提供了一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述第一方面实施例中所述的元数据模板升级方法的步骤。
本申请实施例提供的技术方案中,元数据系统中维护了不同行业的元数据模板,在接收到企业上传的企业元数据模板情况下,将企业元数据模板中的每个企业元数据项与该企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,针对匹配成功的企业元数据项,增加与该元数据项匹配的备选元数据项的标记值,针对匹配失败的企业元数据项,将该企业元数据项作为备选元数据项以及设定对应的标记值为初始值。进而,可以基于每个备选元数据项的标记值,对该企业的准元数据模板中的标准元数据项进行更新。系统维护的行业对应的标准元数据模板根据所属企业的企业元数据模板动态更新,能够更好地适配行业所属企业的需求。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请第一实施例提供的一种元数据模板升级方法的流程图;
图2为本申请第一实施例提供的工业互联网标识解析系统的示意图;
图3为本申请第一实施例提供的标准元数据模板数据项集合的示意图;
图4为本申请第一实施例提供的对企业元数据模板中的企业元数据项和备选元数据项进行相似度匹配的流程图;
图5为本申请第一实施例提供的元数据系统建立高频元数据项的映射关系库示意图;
图6为本申请第一实施例提供的工业互联网标识解析系统进行标识查询时的流程图;
图7为本申请第一实施例提供的工业互联网标识解析系统构成区块链网络进行标准元数据模板更新的示意图;
图8为本申请第二实施例提供的一种元数据处理装置的结构示意图;
图9为本申请第三实施例提供的另一种元数据处理装置的结构示意图。
具体实施方式
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
实施例
请参考图1,本发明第一实施例提供一种元数据模板升级方法,应用于元数据系统,该方法包括如下步骤:
S101:接收企业上传的企业元数据模板,其中,所述企业元数据模板中包括所述企业配置的至少一个企业元数据项;
S102:将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,其中,所述备选元数据项包括所述第一行业对应的第一标准元数据模板中的所有标准元数据项,所述匹配结果包括匹配成功的第一企业元数据项和匹配失败的第二企业元数据项;
S103:基于所述匹配结果,增加与所述第一企业元数据项匹配的备选元数据项的标记值,将所述第二企业元数据项作为备选元数据项以及设定对应的标记值为初始值;
S104:基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新。
具体的,本实施例提供的元数据模板升级方法,主要应用于元数据系统,该元数据系统应用于工业互联网标识解析系统中的国际根节点、递归节点、国家顶级节点、二级节点和企业节点中的任意一个或多个组合,工业互联网标识解析系统的递归节点、国家顶级节点、二级节点和企业节点均为区块链节点。
具体的,请参见图2,工业互联网标识解析系统包括国际根节点、国家顶级节点、二级节点、企业节点以及递归节点。其中,国际根节点是标识体系的最高层级服务节点,面向全球范围的根区数据管理和根解析服务。国家顶级节点是指面向一个国家的提供标识编码注册和标识解析服务的节点。二级节点是指一个行业或者区域内部的标识解析公共服务节点,能够面向行业或区域提供标识编码注册和标识解析服务,以及完成相关的标识业务管理、标识应用对接等。二级节点包含一个或多个服务器。企业节点是指一个企业内部的标识解析服务节点,能够面向特定企业提供标识编码注册和标识解析服务。企业节点也包括一个或多个标识解析服务器,企业数据存储在企业节点的内部。递归节点是指标识解析体系的关键性入口设施,负责路由功能,将解析请求路由至对应的节点,并能够通过缓存等技术手段提升整体服务性能。节点部署引入区块链架构,企业节点、二级节点、国家顶级节点都在区块链中,标识数据服务是在区块链节点上,也即,每个节点均能提供相应的标识解析服务。
各节点的承建方负责本节点标识域里的标识的注册和所注册的标识的信息的录入。例如,二级标识解析节点的承建方负责关于行业的标识的注册和所注册的标识的信息的录入,这样,已注册的标识的信息就存储于二级标识解析节点所对应的标识解析服务器中。
工业互联网异主、异地、异构数据的交换中会涉及元数据模板。元数据模板中包含了各元数据项,元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。例如:有一条学生信息记录,其中包括字段姓名(name)、年龄(age)、性别(male)、班级(class)等,那么name、age、male、class就是元数据。通过它们的描述,一条关于学生信息的数据记录就产生。工业互联网涉及的企业众多,各个企业均有自己的元数据模板,并且,由于动态化的需求,自己的企业元数据模板会变化。举例来说,企业在一段时间关注元数据项A,但随着产品更新或者需求更新,元数据项A变更为元数据项B。这样,企业元数据模板会进行更新,当行业内较多企业的元数据模板中的元数据项A更新为元数据项B情况下,系统需要根据行业内企业元数据模板的变更情况,动态更新系统维护的该行业对应的标准元数据模板,以适配企业的需求。
进而,企业会上传自己的企业元数据模板至元数据系统,元数据系统通过步骤S101接收到该企业元数据模板后,会确定与所述企业所属的第一行业对应的备选元数据项。备选元数据项包括该第一行业对应的第一标准元数据模板中的所有标准元数据项,还包括统计周期内新增的元数据项。
具体的,在本实施例中,工业互联网标识解析中,涉及通过标识解析获得的在工业互联网生产和供应链中产生的数据。分为属性数据和事件数据。属性数据是指描述对象固有的、区别于其他实体的属性特征的数据,事件数据是指用于描述工业产品在生产、流通、使用过程中记录的由位置、状态、所有权、管理权等变化所产生的数据。元数据系统维护通用统一的元数据模板,涵盖范围广、行业全,规定了工业互联网标识解析核心元数据的描述方法、元数据模型、标识解析核心元数据描述及核心元数据扩展原则和方法。
举例来说,系统维护的典型的标准元数据模板如图3所示。由图3可见,系统维护了的标准元数据模板包括不同类型的数据项,包括事件类型和属性类型,属性类型又包括了人员类型、产品类型、机器类型、物料类型、方法类型和环境类型等,不同类型下还设置了更细类型的数据项,比如:产品类型下设置有主体数据项、位置数据项和对象数据项,主体数据项中包括了生产企业、流通企业、使用单位/机构/企业,对应的生产企业项中又包括了生产企业名称、生产企业统一代码、生产企业注册地址、生产企业联系信息等。以此类推,其他类型元数据项以及下属元数据项也可通过这样的形式展开配置,在此,本实施例不做赘述。当然,在具体实施过程中还可根据实际需要配置更多类型的数据项,在此,本实施例不做限制。需要说明的是,图3仅是一种标准元数据模板的示意,并不构成对标准元数据模板的限定,在具体实施过程中,标准元数据模板还可以包括比图示更多或更少的元数据项。
进一步,图3中展示了不同类型的数据项有对应的标识,并且标准元数据模板中的标准元数据项也配置有唯一的标识和对应的描述信息,由图3所示,标准元数据模板中包括对象数据项的标识为2.2。对应的描述信息中包含了该元数据项的相关定义,比如:数据类型、数据格式、权限信息等,在具体实施过程中,描述信息可根据实际需要进行配置,在此,本实施例不做限制。
为了能够根据企业上传的企业元数据模板来更新系统维护的行业对应的第一标准元数据模板,系统会确定与之做相似度匹配的所属企业的备选元数据项,确定的方式可通过但不限于如下方式:
第一种:企业主动选定方式。将所述企业的选定行业作为所述第一行业。
具体的,在本实施例中,企业在上传自己的企业元数据模板时,可以选定其所属行业,比如:生产电视的企业上传自己的企业元数据模板时,可以选定所属行业为电视行业,进而,系统将根据电视行业的备选元数据项来对企业元数据模板进行相似性匹配。
第二种:系统自动确定方式。基于所述企业的属性信息确定所述第一行业。
具体的,在本实施例中,企业在上传自己的企业元数据模板时,系统中记录有企业相关的属性信息,如企业代码或企业名称,基于这些信息可以通过网络查询该企业的相关信息,比如:生产经营的相关信息,所属行业等。进而,根据企业的相关信息可以确定出该企业所属的第一行业。举例来说,钢铁企业A上传自己的企业元数据模板时,系统通过其企业名称或代码查询到钢铁企业A属于钢铁行业,进而,系统将根据钢铁行业的备选元数据项来对企业元数据模板进行相似性匹配。
第三种:系统自动确定方式。确定所述企业元数据模板的文本信息与每个类型的标准元数据模板的文本信息间的相似性,将相似性最大的标准元数据模板所属的行业作为所述第一行业。
具体的,在本实施例中,系统维护了不同行业的标准元数据模板,各个标准元数据模板的标准元数据项均配置有描述信息,描述信息以文本方式设置,所以,可以整合得到每个标准元数据模板的文本信息。同理,针对企业上传的企业元数据模板,也可整合得到对应的文本信息。进而可通过语义分析的方式得到文本信息间的相似性,将相似度最高的标准元数据模板所属的行业作为第一行业。
进一步,在本实施例中,前述3种方式可以有执行的先后顺序,即:如果企业选定了第一行业,按企业选定的第一行业确定对应的备选元数据项,如果企业未选定所属行业,就可以采用第二种方式,通过企业注册在元数据系统时的企业基本信息进行搜索查询,可以是内部的检索,也可以是通过网络进行外部检索,得到该企业所属的第一行业。如果系统未查询到企业的基本信息,或者未查询到该企业所属的行业,可以采用第三种方式,基于相似度的方式自动分析得到其所属的行业。当然,在具体实施过程中,也可以三种方式并行,或者按需进行配置,在此,本实施例不做限制。
进一步,在本实施例中,还可以针对不同的方式配置对应的标记值权重。具体的,在采用第一种企业中选定方式时,由于其选定的方式是一种确定的方式,较为精准,可以设置对应的标记值权重为W1。而针对第二种自动确定方式,其依托于检索分析,其准确性低于第一种方式,可将其对应的标记值权重设置为W2。同理,针对第三种自动确定方式,其依托于相似性分析,其准确性低于第一种方式,可将其对应的标记值权重设置为W3。在本实施例中,W1大于W2,W1大于W3,W2和W3的大小关系可根据准确度校验的结果来设定,准确度越高,标记值权重越高,在具体实施过程中,W1、W2、W3可根据实际需要进行设定,在此,本实施例不做限制。
同理,在本实施例中,还可以针对不同的方式配置对应的相似度阈值权重。具体的,在采用第一种企业中选定方式时,由于其选定的方式是一种确定的方式,较为精准,可以设置对应的阈值权重为Q1。而针对第二种自动确定方式,其依托于检索分析,其准确性低于第一种方式,可将其对应阈值权重设置为Q2。同理,针对第三种自动确定方式,其依托于相似性分析,其准确性低于第一种方式,可将其对应的阈值权重设置为Q3。在本实施例中,Q1小于Q2,Q1小于Q3,Q2和Q3的大小关系可根据准确度校验的结果来设定,准确度越高,阈值权重越小,在具体实施过程中,Q1、Q2、Q3可根据实际需要进行设定,在此,本实施例不做限制。
同理,在本实施例中,还可以针对不同的方式配置对应的更新周期。具体的,在采用第一种企业中选定方式时,由于其选定的方式是一种确定的方式,较为精准,可以设置对应的更新周期为T1。而针对第二种自动确定方式,其依托于检索分析,其准确性低于第一种方式,可将其对应更新周期设置为T2。同理,针对第三种自动确定方式,其依托于相似性分析,其准确性低于第一种方式,可将其对应的更新周期设置为T3。在本实施例中,T1小于T2,T1小于T3,T2和T3的大小关系可根据准确度校验的结果来设定,准确度越高,阈值权重越小,在具体实施过程中,T1、T2、T3可根据实际需要进行设定,在此,本实施例不做限制。
进而,确定出第一行业后,执行步骤S102,将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果。请参考图4,具体的,步骤S102可通过如下步骤实现:
基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量;
基于每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量,确定每个所述企业元数据项与每个所述备选元数据项间的相似度;
如果企业元数据项与备选元数据项间的相似度满足阈值条件,所述匹配结果为匹配成功,如果企业元数据项与备选元数据项间的相似度不满足所述阈值条件,所述匹配结果为匹配失败。
具体的,在本实施例中,针对企业上传的企业元数据模板中的每个企业元数据项的名称、描述信息等进行语义分析后形成特征向量。而针对每个备选元数据项,系统中也配置了对应的标识、描述信息,描述信息中包括了该标准元数据项的相关说明和定义。同理,基于语义分析算法也可确定出每个备选元数据项的特征向量。这样,就可以计算得到每个企业元数据项与每个备选元数据项的特征向量间的相似性。
进而,根据每个企业元数据项与每个备选元数据项的特征向量间的相似性,如果相似度满足阈值条件,则确定匹配结果为匹配成功,将其作为匹配成功的第一企业元数据项。剩余的企业元数据项,确定匹配结果为匹配失败,将其作为匹配失败的第二企业元数据项。其中,阈值条件可以是大于预设阈值,预设阈值可根据实际需要设定为90%、95%等数值,在具体实施过程中,预设阈值可根据实际需要进行设定,在此,本实施例不做限制。
举例来说,假设A企业上传的企业元数据模板中包括:制造企业名称、制造企业统一代码、制造企业注册地址、制造企业联系信息和制造企业国别。
元数据系统维护的与A企业上传的企业元数据模板对应的产品类的第一标准元数据模板包括:生产企业名称、生产企业统一代码、生产企业注册地址和生产企业联系信息。
假设第一标准元数据模板为图3所示,由图3可确定第一标准元数据模板中各标准元数据项的标识信息包括:生产企业名称为2.1.1.1,生产企业统一代码为2.1.1.2,生产企业注册地址为2.1.1.3,生产企业联系信息为2.1.1.4。
进而,根据步骤S102确定出企业元数据模板中的制造企业名称与生产企业名称间的相似度大于预设阈值,假设预设阈值为95%,则确定企业元数据模板中的“制造企业名称”与备选元数据项中的“生产企业名称”的相似度大于95%,相似度匹配成功。为其分配与备选元数据项中的“生产企业名称”对应的标识2.1.1.1。并且,反馈信息中也包括了关于 “生产企业名称”的描述信息,描述信息中包括了正确的标准元数据项的名称以及相关的数据定义等。进而,通过步骤S103,将“生产企业名称”的标记值加1同理,针对“制造企业统一代码”采用同样的方式确定出其标识为2.1.1.2。针对“制造企业注册地址”采用同样的方式确定出其在第一标准元数据模板中的标识为2.1.1.3。将“生产企业名称”的标记值加1。针对“制造企业联系信息”采用同样的方式确定出其标识为2.1.1.4。将“制造企业联系信息”的标记值加1。当然,还可以设置其他数值作为标记的增量,在此,本实施例不做限制。
进一步,由前述实施例可知,针对第一企业不同的选定方式,其对应的标记值权重不同,假设标记值增量为P,如果本次上传的企业元数据模板所属的第一行业由前述第一种方式确定,则匹配成功时增加的标记值为W1*P。同理,如果本次上传的企业元数据模板所属的第一行业由前述第二种方式确定,则匹配成功时增加的标记值为W2*P。如果本次上传的企业元数据模板所属的第一行业由前述第三种方式确定,则匹配成功时增加的标记值为W3*P。
进一步,由前述实施例可知,针对第一企业不同的选定方式,其对应的阈值权重不同,假设预设阈值为R,如果本次上传的企业元数据模板所属的第一行业由前述第一种方式确定,则匹配时采用的相似度阈值为Q1*R。同理,如果本次上传的企业元数据模板所属的第一行业由前述第二种方式确定,则匹配时采用的相似度阈值为Q2*R。如果本次上传的企业元数据模板所属的第一行业由前述第三种方式确定,则匹配时采用的相似度阈值为Q2*R。
而针对“制造企业国别”,原有的备选元数据项中没有与之匹配的,可将其添加至备选元数据项中,并为其配置新标识为2.1.1.5以及新描述信息,将其对应的标识值设置为初始值,初始值设为1,或者其他数值,在此,本实施例不做限制。反馈信息中也会包含该元数据项的标识和描述信息,并将其标注为新的元数据项,包括:制造企业名称为2.1.1.1,制造企业统一代码为2.1.1.2,制造企业注册地址为2.1.1.3,制造企业联系信息为2.1.1.4,制造企业国别(新)为2.1.1.5(新)。
由于反馈信息中包括了针对企业元数据模板中的各企业元数据项的相关匹配信息,包括与之匹配成功的正确的标准元数据项的标识和描述信息,描述信息中包括了正确的名称和数据定义,所以,企业可以基于反馈信息对虽匹配成功,但相似度没有达到100%,存在不一致的企业元数据项进行修正,与系统对应的标准元数据项保持一致,下次上传时相似度就是100%。并且,根据修正后的企业元数据模板中的各元数据项,确定与之关联的本地数据。这样,当元数据系统向企业请求标准元数据项的主数据时,企业能够准确响应,并将系统请求的数据上传至系统,以提高企业间数据的流通性,提高数据的利用率,实现相关对象的数据全生命周期的管理和监控。
进一步,本实施例还针对高频元数据项预先建立对应的映射关系库,这样,针对备选元数据项中的高频元数据项,就可以直接通过其映射关系库进行快速匹配标记,不用进行分词的语义分析,提高标记效率。
本实施例中,采用跨行业统计方式来确定高频元数据项,进而建立对应的映射关系库。针对高频元数据项建立映射关系库可通过如下步骤实现:
统计至少一个目标行业中每个目标行业对应的备选元数据项的标记值;
将重复的备选元数据项的标记值进行相加合并后按标记值从大到小进行排序;
针对前N个备选元数据项,建立与之对应的映射关系库,其中,N为大于0的整数。
具体的,请参见图5,在本实施例中,统计至少一个目标行业中每个目标行业对应的备选元数据项的标记值,目标行业可以包括第一行业,还包括与第一行业关联的行业,举例来说如果第一行业是汽车行业,目标行业可以是提供原料的钢铁行业、汽车零部件行业,也可以是相关的车联网行业等等,在具体实施过程中,目标行业可根据实际需要进行设置,在此本实施例不做限制。
由前述实施例可知,系统维护有每个行业的标准元数据模板,为了动态对其进行更新,需要监控周期内包括标准元数据模板中元数据项在内的备选元数据项的标记值,进而,通过统计各个目标行业对应的备选元数据项的标记值,就可以将重复的元数据项进行标记值的合并,然后按照标记值从大到小进行排序,进而,选择前N个备选元数据项作为高频元数据项,表明这N个高频元数据项经常会出现在各个目标行业的企业元数据模板中,是较为通用的元数据项,针对其建立对应的映射关系库。在具体实施过程中,N为系统设定的值,可根据实际需要进行配置,在此,本实施例不做限制。
进一步,本实施例中的方法,还可以基于高频的备选元数据项建立跨行业的通用元数据模板。具体的,将前N个备选元数据项作为跨行业的通用元数据模板。该模板可反馈至关联企业的查询用户,以便用户或者相关企业的元数据项的详细信息,进而进行数据分析。
具体的,在建立高频元数据项的映射关系库时,如果企业在上传自己的企业元数据模板中的企业元数据项与高频元数据项间的匹配度大于预设阈值且小于1,则表明该企业元数据项虽然记录在元数据系统中,但和系统记录的标准元数据项不同,所以,可将其添加至高频元数据项的映射关系库中。由图5可知,高效高频备选元数据项A,其建立的映射关系库中包括了A1~AN的元数据项。针对与之相似度大于预设阈值且小于1的Ai,将其加入映射关系库中。同理,高效高频备选元数据项B,其建立的映射关系库中包括了B1~BM的元数据项。针对与之相似度大于预设阈值且小于1的Bj,将其加入映射关系库中。
举例来说,假设系统中通过跨行业统计出的高频备选元数据项为“生产企业名称”,企业A元数据模板中的“制造企业名称”和企业B元数据模板中的“生产企业ID”的相似度与“生产企业名称”均大于95%且小于1,这样,“生产企业名称”对应的映射关系库中包括“制造企业名称”和“生产企业ID”。
这样,由于系统中针对高频的备选元数据项建立有与之对应的映射关系库,在对企业元数据模板中企业元数据项进行相似度匹配可通过如下步骤实现:
将每个所述企业元数据项与第一备选元数据项的第一映射关系库中的关联元数据项进行匹配,如果匹配成功,确定该企业元数据项与所述第一备选元数据项的所述匹配结果为匹配成功,其中,所述第一备选元数据项为所述第一行业的备选元数据项中存在映射关系库的元数据项;
对于匹配失败的每个所述企业元数据项,基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量。
具体的,请参照图4,由前述实施例可知,由于系统中针对高频的备选元数据项建立有与之对应的映射关系库,如果该第一行业对应的备选元数据中存在设置有映射关系库的备选元数据项,则在针对该备选元数据项进行相似度匹配时,将企业元数据项与该备选元数据项的映射关系库中的关联元数据项进行匹配,如果匹配成功,确定该企业元数据项与该备选元数据项的匹配结果为匹配成功,将标记值加1,而针对其余的备选元数据项,按前述的语义分析算法得到对应的特征向量进而进行相似度匹配的方式。针对备选元数据项中的高频元数据项,就可以直接通过其映射关系库进行快速匹配标记,不用进行分词的语义分析,提高标记效率,并减少不必要的更新。
最后,通过步骤S104,基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新,具体可通过如下步骤实现:
按标记值从大到小排序后选择前M个备选元数据项作为所述第一标准元数据模板中的标准元数据项,其中,M为大于0的整数;和/或
统计在当前周期内每个备选元数据项的标记值得增值,将增值从大到小排序后选择前K个备选元数据项作为所述第一标准元数据模板中的标准元数据项,其中,K为大于0的整数。
具体的,在本实施例中,针对备选元数据项,可以按标记值从大到小排序后选择前M个备选元数据项作为第一标准元数据模板中的标准元数据项,这样,实现对第一标准元数据模板的更新。在具体实施过程中,M为系统设定的值,可根据实际需要进行配置,在此,本实施例不做限制。
本实施例中还设置了更新周期,按周期统计每个备选元数据项的标记值得增值,将增值从大到小排序后选择前K个备选元数据项作为第一标准元数据模板中的标准元数据项,实现对第一标准元数据模板的更新。在具体实施过程中,K为系统设定的值,可根据实际需要进行配置,在此,本实施例不做限制。
进一步,在本实施例中,可设置行业分级,针对不同的行业,可设置不同的更新周期,针对技术产品更新变化较快的行业,可将更新周期设置较短,而针对较为稳定的传统类行业,可将更新周期设置较长。
进一步,由前述实施例可知,针对第一企业不同的选定方式,其对应的更新周期不同,如果企业元数据模板所属的第一行业由前述第一种方式确定,则更新周期为T1。同理,如果企业元数据模板所属的第一行业由前述第二种方式确定,则更新周期为T2,如果企业元数据模板所属的第一行业由前述第三种方式确定,则更新周期为T3。
在本实施例中,针对工业领域,应用于产品追溯的数据,主要包括产品的属性数据(从工业软件中获取的数据,比如产品品牌)、产品的成品数据(rfid等现场采集到的数据)。为了能够实现数据可追溯,元数据系统按前述方式统一系统中的元数据模板,实现数据清洗,数据清洗后。明确了数据字段,数据定义,不同字段的映射方式,从而产业链上下游不同企业内数据能够互通。
具体的,在前述实施例中介绍了系统维护了不同类型的标准元数据模板,其中,包括了事件类型和属性类型,也即动态类型和静态类型。在工业互联网中,一个产品对象可能关联多个企业,比如生产企业对应的是属性类型的元数据模板,而运输企业和运营企业针对该产品对象的是事件类型的元数据模板。
这样,如果系统获得权限得到企业基于反馈信息上传的与第一标准元数据模板对应的第一主数据,就可以基于第一主数据,确定与第一标准元数据模板关联的第二标准元数据模板,建立第一标准模板与第二标准模板的映射关系。举例来说,钢铁生产企业、钢铁流通企业、钢铁使用企业,按各自对应的标准元数据模板上传主数据,钢铁生产企业基于第一标准元数据模板上传的主数据中包括了钢铁的标识或者生产企业名称、代码等,如果钢铁流通企业基于第二标准元数据模板上传了同样的钢铁的标识或者生产企业名称、代码等,建立第一标准元数据模板与第二标准元数据模板间的映射关系。这样,当权限用户通过钢铁的标识进行查询时,可将第一标准元数据模板和第二标准元数据模板均作为查询结果反馈至该权限用户。同时,如果权限用户具备访问企业本地数据的权限,第一标准元数据模板对应的企业和第二标准元数据对应的企业还会各自反馈对应的数据作为查询结果。这样,就可以将企业间的数据关联起来,实现对象数据全生命周期的管理。
进一步,在本实施例中,系统还可以预先建立起不同类型标准元数据模板间的映射关系,比如针对电视类的标准元数据模板和电视屏幕的标准元数据模板间的映射关系。或者,矿物原料的标准元数据模板和带钢的标准元数据模板间的映射关系等,在具体实施过程中,均可根据实际需要进行设置 ,在此,本实施例不做限制。
本实施例中的元数据系统主要应用于工业互联网标识解析系统中的递归节点、国家顶级节点、二级节点中,每个节点均可提供解析查询的入口,查询的方式可通过如下步骤实现:
接收查询请求,所述查询请求中包括待查询标识;
将所述查询请求发送至所述递归节点,以使得所述递归节点分别向所述国家顶级节点和所述二级节点发出解析请求,以使得所述国家顶级节点和/或所述二级节点解析出与所述待查询标识对应的目标元数据项和所述目标元数据项所在的目标企业节点;
接收所述目标企业节点反馈的与所述目标元数据项对应的目标主数据;
将所述目标元数据项和所述目标主数据反馈至所述查询请求的请求端。
具体的,在本实施例中,接入系统的各个企业节点维护自己的数据,每个二级节点、国家顶级节点、以及企业节点中均设置有标识数据服务,可以供用户进行数据查询。本实施例中的标识可指物品/设备/机器的工业互联网标识,也可指其他用途的标识,例如用户标识、产品类型标识等,在具体实施过程中,可根据实际需要进行设置,在此,本实施例不做限制。标识包括标识编码和标识值列表,标识编码相当于“身份证”,具有唯一性。也可说,一个标识编码表征一个标识,或表征标识背后的物品、设备、机器、管理员等。具体的,标识编码包括前缀和后缀,前缀与后缀之间用“/”分开,举例来讲,标识编码88.100.1/xxx中,“88.100.1”是前缀,“xxx”是后缀。可将产品类型标识之外的、表征物品/设备/机器/用户的其他标识统称为“元数据标识”,同一品类的多个元数据标识与同一产品类型标识相关联。
进而,请参考图6,通过节点的标识数据服务接收查询请求,该查询请求中包括了待查询标识,该将所述查询请求发送至递归节点,递归节点配置有路由功能,将该解析请求先发送至对应的二级节点,二级节点的标识解析功能主要是为其分配的标识提供公共解析服务。对于由二级节点自身分配的标识编码,二级节点在其标识解析功能中配置该分配标识相应的路由信息。当收到标识解析请求时,如果二级节点保存有标识编码对应路由等信息,则直接回复该标识编码对应的企业节点通信地址以及对应的目标元数据项等信息,如果二级节点没有该标识相应的路由等信息,该二级节点返回信息为空。
如果二级节点返回信息为空,则将解析请求发送至国家顶级节点进行解析,进而通过国家顶级节点定位至目标二级节点,再由目标二级节点回复该标识编码对应的企业节点通信地址以及对应的目标元数据项等信息,再根据地址访问企业节点,如果请求方具备访问权限,企业节点将目标元数据项和对应的目标主数据反馈至系统,系统将目标元数据项以及对应的目标主数据反馈给请求方。同时,可将该待查询标识涉及的标准元数据模板也作为查询结果反馈至请求端。在具体实施过程中,查询结果可根据实际需要进行配置,在此,本实施例不做限制。
进一步,在本实施例中,节点部署引入区块链架构,企业节点、二级节点、国家顶级节点都在区块链中,标识数据服务是在区块链节点上。基于区块链系统的特点,每个节点分配标识不容易被篡改,以确保数据的安全性。并且,可将查询记录存储在对应的节点中,以实现信息追溯,并且,基于区块链技术,还可以对上传数据端和查询数据端进行有效的身份认证,确保数据的安全。进而,在对第一标准元数据模板进行更新时,可依托于区块链的投票机制进行,具体可通过如下步骤实现:
生成针对所述第一标准元数据模板的升级请求,并依据所述升级请求发起投票事件;
在所述目标区块链系统中传输所述投票事件,以使所述目标区块链中的节点响应所述投票事件进行投票;
若投票通过,对所述第一标准元数据模板中的标准元数据项进行更新。
具体的,请参照图7,在本实施例中,节点部署引入区块链架构,企业节点、二级节点、国家顶级节点都在区块链中,标识数据服务是在区块链节点上。基于区块链系统的特点,每个节点分配标识不容易被篡改,以确保数据的安全性。并且,可将查询记录存储在对应的节点中,以实现信息追溯,并且,基于区块链技术,还可以对上传数据端和查询数据端进行有效的身份认证,确保数据的安全。
如果基于前述标记值确定出新的标准元数据项和第一标准元数据模板中原有的元数据项不同,需要更新为新的标准元数据项,此时,系统向目标区块链中的各个节点发起投票事件,该投票事件中包括了原有版本的第一标准元数据模板和新版本的第一标准元数据模板的元数据项。以及该第一标准元数据模板所属的第一行业。以使目标区块链中的节点响应该投票事件进行投票。如果投票通过,则进行更新,并将更新记录保存至相关的区块链节点,使得更新记录可追溯。基于区块链的投票机制进行第一标准元数据模板的更新,投票结果反映了区块链中大部分节点的更新意愿,可以确保更新的公平合理,升级更新更优化更精确。各节点中标准元数据模板的加密、数据的权限管理等均可以通过区块链网络中的共识机制进行投票来确定,以确保数据的安全性。
请参见图8,本发明的第二实施例提供了一种元数据模板升级装置,应用于元数据系统,包括:
接收模块801,用于接收企业上传的企业元数据模板,其中,所述企业元数据模板中包括所述企业配置的至少一个企业元数据项;
匹配模块802,用于将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,其中,所述备选元数据项包括所述第一行业对应的第一标准元数据模板中的所有标准元数据项,所述匹配结果包括匹配成功的第一企业元数据项和匹配失败的第二企业元数据项;
处理模块803,用于基于所述匹配结果,增加与所述第一企业元数据项匹配的备选元数据项的标记值,将所述第二企业元数据项作为备选元数据项以及设定对应的标记值为初始值;
更新模块804,用于基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新。
在一种可选实现方式中,所述匹配模块具体用于:
基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量;
基于每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量,确定每个所述企业元数据项与每个所述备选元数据项间的相似度;
如果企业元数据项与备选元数据项间的相似度满足阈值条件,所述匹配结果为匹配成功,如果企业元数据项与备选元数据项间的相似度不满足所述阈值条件,所述匹配结果为匹配失败。
在一种可选实现方式中,所述匹配模块具体用于:
将每个所述企业元数据项与第一备选元数据项的第一映射关系库中的关联元数据项进行匹配,如果匹配成功,确定该企业元数据项与所述第一备选元数据项的所述匹配结果为匹配成功,其中,所述第一备选元数据项为所述第一行业的备选元数据项中存在映射关系库的元数据项;
对于匹配失败的每个所述企业元数据项,基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量。
在一种可选实现方式中,所述元数据模板升级装置还包括建立模块,所述建立模块具体用于:
统计至少一个目标行业中每个目标行业对应的备选元数据项的标记值;
将重复的备选元数据项的标记值进行相加合并后按标记值从大到小进行排序;
针对前N个备选元数据项,建立与之对应的映射关系库,其中,N为大于0的整数。
在一种可选实现方式中,所述确定模块具体用于:
在将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果之前,将所述企业的选定行业作为所述第一行业;或
基于所述企业的属性信息确定所述第一行业;或
确定所述企业元数据模板的文本信息与每个类型的标准元数据模板的文本信息间的相似性,将相似性最大的标准元数据模板所属的行业作为所述第一行业。
在一种可选实现方式中,所述更新模块具体用于:
按标记值从大到小排序后选择前M个备选元数据项作为所述第一标准元数据模板中的标准元数据项,其中,M为大于0的整数;和/或
统计在当前周期内每个备选元数据项的标记值得增值,将增值从大到小排序后选择前K个备选元数据项作为所述第一标准元数据模板中的标准元数据项,其中,K为大于0的整数。
在一种可选实现方式中,所述元数据系统应用于工业互联网标识解析系统中的递归节点、国家顶级节点、二级节点中的任意一个或多个组合,所述工业互联网标识解析系统的递归节点、国家顶级节点、二级节点和企业节点均为目标区块链系统的节点,所述更新模块具体用于:
生成针对所述第一标准元数据模板的升级请求,并依据所述升级请求发起投票事件;
在所述目标区块链系统中传输所述投票事件,以使所述目标区块链中的节点响应所述投票事件进行投票;
若投票通过,对所述第一标准元数据模板中的标准元数据项进行更新。
本实施例中的元数据模板升级装置进行数据处理的详细过程已在前述第一实施例中详细阐述,可参见第一实施例中的内容,在此,本实施例不再赘述。
请参见图9,本发明的第三实施例提供了一种元数据模板升级装置,该实施例的装置包括:处理器901、存储器902以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如第一实施例中元数据模板升级方法对应的程序。所述处理器执行所述计算机程序时实现上述第一实施例中各元数据模板升级方法中的步骤。或者,所述处理器执行所述计算机程序时实现上述第二实施例的装置中各模块/单元的功能。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述计算机装置中的执行过程。
所述元数据模板升级装置可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述示意图9仅仅是计算机装置的示例,并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述元数据模板升级装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器901可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器902可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
进一步,该元数据模板升级装置所包括的处理器901还具有以下功能:
接收企业上传的企业元数据模板,其中,所述企业元数据模板中包括所述企业配置的至少一个企业元数据项;
将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,其中,所述备选元数据项包括所述第一行业对应的第一标准元数据模板中的所有标准元数据项,所述匹配结果包括匹配成功的第一企业元数据项和匹配失败的第二企业元数据项;
基于所述匹配结果,增加与所述第一企业元数据项匹配的备选元数据项的标记值,将所述第二企业元数据项作为备选元数据项以及设定对应的标记值为初始值;
基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新。
进一步,该元数据模板升级装置所包括的处理器901还具有以下功能:
基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量;
基于每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量,确定每个所述企业元数据项与每个所述备选元数据项间的相似度;
如果企业元数据项与备选元数据项间的相似度满足阈值条件,所述匹配结果为匹配成功,如果企业元数据项与备选元数据项间的相似度不满足所述阈值条件,所述匹配结果为匹配失败。
进一步,该元数据模板升级装置所包括的处理器901还具有以下功能:
在所述将所述企业元数据模板中每个企业元数据项与第一标准元数据模板中的标准元数据项进行相似度匹配之前,确定所述企业元数据模板所属的目标类型,其中,所述元数据系统中包括事件类型和属性类型对应的标准元数据模板,所述属性类型包括人员类型、产品类型、机器类型、物料类型、方法类型和环境类型中的任意一种或多种组合;
确定与所述目标类型对应的第一标准元数据模板。
进一步,该元数据模板升级装置所包括的处理器901还具有以下功能:
将每个所述企业元数据项与第一备选元数据项的第一映射关系库中的关联元数据项进行匹配,如果匹配成功,确定该企业元数据项与所述第一备选元数据项的所述匹配结果为匹配成功,其中,所述第一备选元数据项为所述第一行业的备选元数据项中存在映射关系库的元数据项;
对于匹配失败的每个所述企业元数据项,基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量。
进一步,该元数据模板升级装置所包括的处理器901还具有以下功能:
统计至少一个目标行业中每个目标行业对应的备选元数据项的标记值;
将重复的备选元数据项的标记值进行相加合并后按标记值从大到小进行排序;
针对前N个备选元数据项,建立与之对应的映射关系库,其中,N为大于0的整数。
进一步,该元数据模板升级装置所包括的处理器901还具有以下功能:
在将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果之前,将所述企业的选定行业作为所述第一行业;或
基于所述企业的属性信息确定所述第一行业;或
确定所述企业元数据模板的文本信息与每个类型的标准元数据模板的文本信息间的相似性,将相似性最大的标准元数据模板所属的行业作为所述第一行业。
进一步,该元数据模板升级装置所包括的处理器901还具有以下功能:
按标记值从大到小排序后选择前M个备选元数据项作为所述第一标准元数据模板中的标准元数据项,其中,M为大于0的整数;和/或
统计在当前周期内每个备选元数据项的标记值得增值,将增值从大到小排序后选择前K个备选元数据项作为所述第一标准元数据模板中的标准元数据项,其中,K为大于0的整数。
进一步,所述元数据系统应用于工业互联网标识解析系统中的递归节点、国家顶级节点、二级节点中的任意一个或多个组合,所述工业互联网标识解析系统的递归节点、国家顶级节点、二级节点和企业节点均为目标区块链系统的节点,该元数据模板升级装置所包括的处理器901还具有以下功能:
生成针对所述第一标准元数据模板的升级请求,并依据所述升级请求发起投票事件;
在所述目标区块链系统中传输所述投票事件,以使所述目标区块链中的节点响应所述投票事件进行投票;
若投票通过,对所述第一标准元数据模板中的标准元数据项进行更新。
本发明第四实施例提供了一种计算机可读存储介质,其上存储有计算机程序,本发明第二实施例中的所述元数据模板升级装置集成的功能单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述第一实施例的元数据模板升级方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种元数据模板升级方法,应用于元数据系统,其特征在于,包括:
接收企业上传的企业元数据模板,其中,所述企业元数据模板中包括所述企业配置的至少一个企业元数据项;
将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,包括:基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量;基于每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量,确定每个所述企业元数据项与每个所述备选元数据项间的相似度;如果企业元数据项与备选元数据项间的相似度满足阈值条件,所述匹配结果为匹配成功,如果企业元数据项与备选元数据项间的相似度不满足所述阈值条件,所述匹配结果为匹配失败;其中,所述基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量,包括:将每个所述企业元数据项与第一备选元数据项的第一映射关系库中的关联元数据项进行匹配,如果匹配成功,确定该企业元数据项与所述第一备选元数据项的所述匹配结果为匹配成功,其中,所述第一备选元数据项为所述第一行业的备选元数据项中存在映射关系库的元数据项;对于匹配失败的每个所述企业元数据项,基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量;其中,所述备选元数据项包括所述第一行业对应的第一标准元数据模板中的所有标准元数据项,所述匹配结果包括匹配成功的第一企业元数据项和匹配失败的第二企业元数据项;
基于所述匹配结果,增加与所述第一企业元数据项匹配的备选元数据项的标记值,将所述第二企业元数据项作为备选元数据项以及设定对应的标记值为初始值;
其中,所述元数据系统应用于工业互联网标识解析系统中的递归节点、国家顶级节点、二级节点中的任意一个或多个组合,所述工业互联网标识解析系统的递归节点、国家顶级节点、二级节点和企业节点均为目标区块链系统的节点,基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新,包括:生成针对所述第一标准元数据模板的升级请求,并依据所述升级请求发起投票事件;在所述目标区块链系统中传输所述投票事件,以使所述目标区块链中的节点响应所述投票事件进行投票;若投票通过,对所述第一标准元数据模板中的标准元数据项进行更新。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
统计至少一个目标行业中每个目标行业对应的备选元数据项的标记值;
将重复的备选元数据项的标记值进行相加合并后按标记值从大到小进行排序;
针对前N个备选元数据项,建立与之对应的映射关系库,其中,N为大于0的整数。
3.根据权利要求1所述的方法,其特征在于,在将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果之前,所述方法还包括:
将所述企业的选定行业作为所述第一行业;或
基于所述企业的属性信息确定所述第一行业;或
确定所述企业元数据模板的文本信息与每个类型的标准元数据模板的文本信息间的相似性,将相似性最大的标准元数据模板所属的行业作为所述第一行业。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新,包括:
按标记值从大到小排序后选择前M个备选元数据项作为所述第一标准元数据模板中的标准元数据项,其中,M为大于0的整数;和/或
统计在当前周期内每个备选元数据项的标记值得增值,将增值从大到小排序后选择前K个备选元数据项作为所述第一标准元数据模板中的标准元数据项,其中,K为大于0的整数。
5.一种元数据模板升级装置,应用于元数据系统,其特征在于,包括:
接收模块,用于接收企业上传的企业元数据模板,其中,所述企业元数据模板中包括所述企业配置的至少一个企业元数据项;
匹配模块,用于将所述企业元数据模板中的每个企业元数据项与所述企业所属的第一行业对应的备选元数据项进行相似度匹配,获得匹配结果,包括:基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量;基于每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量,确定每个所述企业元数据项与每个所述备选元数据项间的相似度;如果企业元数据项与备选元数据项间的相似度满足阈值条件,所述匹配结果为匹配成功,如果企业元数据项与备选元数据项间的相似度不满足所述阈值条件,所述匹配结果为匹配失败;其中,所述基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量,包括:将每个所述企业元数据项与第一备选元数据项的第一映射关系库中的关联元数据项进行匹配,如果匹配成功,确定该企业元数据项与所述第一备选元数据项的所述匹配结果为匹配成功,其中,所述第一备选元数据项为所述第一行业的备选元数据项中存在映射关系库的元数据项;对于匹配失败的每个所述企业元数据项,基于语义分析算法确定每个所述企业元数据项的特征向量和每个所述备选元数据项的特征向量;其中,所述备选元数据项包括所述第一行业对应的第一标准元数据模板中的所有标准元数据项,所述匹配结果包括匹配成功的第一企业元数据项和匹配失败的第二企业元数据项;
处理模块,用于基于所述匹配结果,增加与所述第一企业元数据项匹配的备选元数据项的标记值,将所述第二企业元数据项作为备选元数据项以及设定对应的标记值为初始值;
其中,所述元数据系统应用于工业互联网标识解析系统中的递归节点、国家顶级节点、二级节点中的任意一个或多个组合,所述工业互联网标识解析系统的递归节点、国家顶级节点、二级节点和企业节点均为目标区块链系统的节点;
更新模块,用于基于所述第一行业对应的每个备选元数据项的标记值,对所述第一标准元数据模板中的标准元数据项进行更新,包括:生成针对所述第一标准元数据模板的升级请求,并依据所述升级请求发起投票事件;在所述目标区块链系统中传输所述投票事件,以使所述目标区块链中的节点响应所述投票事件进行投票;若投票通过,对所述第一标准元数据模板中的标准元数据项进行更新。
6.一种元数据模板升级装置,应用于元数据系统,其特征在于,所述元数据模板升级装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-4中任一项所述的元数据模板升级方法的步骤。
7.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的元数据模板升级方法的步骤。
CN202110304714.1A 2021-03-23 2021-03-23 元数据模板升级方法、装置及可读存储介质 Active CN112699160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110304714.1A CN112699160B (zh) 2021-03-23 2021-03-23 元数据模板升级方法、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110304714.1A CN112699160B (zh) 2021-03-23 2021-03-23 元数据模板升级方法、装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN112699160A CN112699160A (zh) 2021-04-23
CN112699160B true CN112699160B (zh) 2022-04-26

Family

ID=75515378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110304714.1A Active CN112699160B (zh) 2021-03-23 2021-03-23 元数据模板升级方法、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN112699160B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310763B (zh) * 2023-05-10 2023-07-21 合肥英特灵达信息技术有限公司 一种模板图像生成方法、装置、电子设备及存储介质
CN117312350B (zh) * 2023-11-28 2024-02-27 本溪钢铁(集团)信息自动化有限责任公司 钢铁行业碳排放数据管理方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160379139A1 (en) * 2015-06-29 2016-12-29 Secure Islands Technologies Ltd. Adaptive classification of data items
CN109670091B (zh) * 2018-12-24 2020-11-10 成都四方伟业软件股份有限公司 一种基于数据标准的元数据智能维护方法和装置
CN109710591A (zh) * 2018-12-27 2019-05-03 福建南威软件有限公司 元数据版本自动管理方法
CN109871382A (zh) * 2019-02-13 2019-06-11 北京明略软件系统有限公司 一种数据表接入标准库的实现方法和装置
CN110008193B (zh) * 2019-04-16 2021-06-18 成都四方伟业软件股份有限公司 数据标准化方法及装置
CN111767484B (zh) * 2020-08-31 2020-12-04 中国信息通信研究院 工业互联网标识解析方法及相关装置

Also Published As

Publication number Publication date
CN112699160A (zh) 2021-04-23

Similar Documents

Publication Publication Date Title
CN112732703B (zh) 元数据处理方法、元数据处理装置及可读存储介质
CN112016015B (zh) 基于分布式标识解析的数据处理方法及装置
CN111459985B (zh) 标识信息处理方法及装置
US8918507B2 (en) Dynamic grouping of enterprise assets
CN112699160B (zh) 元数据模板升级方法、装置及可读存储介质
CN109413040B (zh) 消息鉴权方法、设备、系统及计算机可读存储介质
CN112422709B (zh) 标识管理方法、终端设备、标识解析二级节点及介质
US10382387B2 (en) OID configuration, resolution method, client, node, database and storage medium
US20120110647A1 (en) Managing uniquely tagged items using the internet
CN111190970B (zh) 数据映射方法、装置以及计算机可读存储介质
CN110599275A (zh) 一种基于区块链网络的数据处理方法、装置及存储介质
CN112989313B (zh) 一种标识注册方法、装置、电子设备及存储介质
CN105162894A (zh) 设备标识获取方法及装置
CN109542894B (zh) 用户数据集中存储方法、装置、介质和计算机设备
CN112579898A (zh) 企业信息的管理方法、装置及服务器
CN112699089A (zh) 数据共享系统、数据共享方法及装置
CN107277188B (zh) 一种确定ip地址归属信息的方法、客户端、服务器及业务系统
CN113672692B (zh) 数据处理方法、装置、计算机设备和存储介质
US20230334609A1 (en) Information management method and non-transitory, computer readable, tangible storage medium storing information management program
US20110088101A1 (en) Information exchange/share system, method and program thereof
CN110427538B (zh) 一种数据查询方法、存储方法、装置及电子设备
CN113901284B (zh) 标识及其关联信息的查询方法、装置和服务器
CN116719817A (zh) 一种面向科技资源的数字对象关系溯源方法及系统
CN108763303B (zh) 平台验证方法、装置、计算机设备和存储介质
CN106649678B (zh) 一种数据处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant