CN110704630A - 一种标识化关联图谱自优化机制 - Google Patents

一种标识化关联图谱自优化机制 Download PDF

Info

Publication number
CN110704630A
CN110704630A CN201910303395.5A CN201910303395A CN110704630A CN 110704630 A CN110704630 A CN 110704630A CN 201910303395 A CN201910303395 A CN 201910303395A CN 110704630 A CN110704630 A CN 110704630A
Authority
CN
China
Prior art keywords
data
map
deep learning
self
carried out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910303395.5A
Other languages
English (en)
Inventor
赵宏伟
张卫山
张瑞聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201910303395.5A priority Critical patent/CN110704630A/zh
Publication of CN110704630A publication Critical patent/CN110704630A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于深度学习的标识化关联图谱自优化机制,该机制结合知识图谱技术与深度学习技术,对于不断采集的数据经过深度学习模型进行标识化处理后加入关联图谱。在关联图谱中通过多个分布式数据存储节点和分布式计算节点进行数据处理,以块同步并行计算模型为基础,通过局部计算、通讯单元和栅栏同步三部分进行一系列全局迭代。根据系统的资源利用率、处理性能和数据的局部性实现计算资源的自适应动态最优分配。对于已经加入关联图谱的数据进行不断地消歧分析和聚类计算进行不断地精简和校正,实现关联图谱的持续自优化。

Description

一种标识化关联图谱自优化机制
技术领域
本发明涉及海量数据分布式存储、标识化、知识图谱和深度学习领域,具体涉及到一种基于深度学习的标识化关联图谱自优化机制。
背景技术
一种基于深度学习的标识化关联图谱自优化机制,以知识图谱技术为主体,综合采用标识化技术与深度学习,保证关联图谱的自我扩充和自我优化。最接近本发明的技术有:
(1)、知识图谱:知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。但是由于知识图谱系统过于庞大,更新或者修正就变得十分困难。
(2)、深度学习:深度学习提出了一种让计算机自动学习出模式特征的方法,并将特征学习融入到了建立模型的过程中,从而减少了人为设计特征造成的不完备性。而目前以深度学习为核心的某些机器学习应用,在满足特定条件的应用场景下,已经达到了超越现有算法的识别或分类性能。但是在提供有限数据量的应用场景下,深度学习算法不能够对数据的规律进行无偏差的估计。为了达到很好的精度,需要大数据支撑。
为充分利用知识图谱和深度学习的优势,弥补知识图谱更新困难和深度学习训练数据欠缺的问题,将其结合创新设计基于深度学习的标识化关联图谱自优化机制。本机制保证了知识图谱的自我更新和实时自我优化,实现了系统的主动更新。
发明内容
为解决现有技术中的缺点和不足,本发明提出了一种基于深度学习的标识化关联图谱自优化机制,结合知识图谱技术与深度学习,对于不断采集的数据经过深度学习模型进行标识化处理后加入关联图谱,对于已经加入关联图谱的数据进行不断地消歧分析和聚类计算进行不断地精简和校正,实现关联图谱的持续自优化。
本发明的技术方案为:
步骤(1)、通过基于微服务的智能可重构物联网开放服务运行支撑系统进行不断的信息抽取作为即将加入关联图谱的新增数据;
步骤(2)、对于各个微服务中的对象通过深度学习标识化模型进行标识化编码,实现知识图谱的迭代扩增,在一个资源描述框架下对所有的实体进行统一描述,通过本体词汇描述各种实体之间的联系,并在此基础上进行逻辑推理和验证配合多终端并行服务机制,实现请求合理资源分配;
步骤(3)、在关联图谱内部通过多个分布式数据存储节点和分布式计算节点进行数据处理,以块同步并行计算模型为基础,计算过程包括一系列全局迭代,每个迭代主要包括局部计算、通讯单元和栅栏同步三部分组成。同时根据系统的资源利用率、处理性能和数据的局部性实现计算资源的自适应动态最优分配;
步骤(4)、通过聚类分析计算出关联图谱中的离群点,将其判断为错误标识并予以校正;
步骤(5)、通过消歧分析计算出关联图谱中的冗余数据并将其合并。
本发明的有益效果:
(1)本方法利用深度学习标识化模型,实现从基于微服务的智能可重构物联网物联网开放服务运行支撑系统中不断抽取信息并主动对关联图谱进行扩充;
(2)配合消歧分析和关联分析,消除关联图谱中的冗余数据并对错误标识数据进行自动校正。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于深度学习的标识化关联图谱自由化机制的模型简图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,基于深度学习的标识化关联图谱自优化机制的模型简图,将知识图谱中数据和数据之间的联系抽象为图,结合图数据半结构化的特征,采用以图顶点为中心、基于消息传递批处理的自适应并行化图计算引擎进行运算优化,引入深度学习方案,通过深度学习模型和技术代替人工来进行知识图谱的扩充和优化。
下面对基于深度学习的标识化关联图谱自由化机制的具体流程进行详细说明:
步骤(1)、通过基于微服务的智能可重构物联网开放服务运行支撑系统进行不断的信息抽取作为即将加入关联图谱的新增数据;
步骤(2)、对于各个微服务中的对象通过深度学习标识化模型进行标识化编码,实现知识图谱的迭代扩增,在一个资源描述框架下对所有的实体进行统一描述,通过本体词汇描述各种实体之间的联系,并在此基础上进行逻辑推理和验证配合多终端并行服务机制,实现请求合理资源分配;
步骤(3)、在关联图谱内部通过多个分布式数据存储节点和分布式计算节点进行数据处理,通过栅栏同步实现在系统内部数据的协调统一;
步骤(4)、通过聚类分析计算出关联图谱中的离群点,将其判断为错误标识并予以校正;
步骤(5)、通过消歧分析计算出关联图谱中的冗余数据并将其合并。
本发明的基于深度学习的标识化关联图谱自优化机制,结合知识图谱技术与深度学习技术,对于不断采集的数据经过深度学习模型进行标识化处理后加入关联图谱,对于已经加入关联图谱的数据进行不断地消歧分析和聚类计算进行不断地精简和校正,实现关联图谱的持续自优化。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于深度学习的标识化关联图谱自优化机制,结合知识图谱技术与深度学习技术,对于不断采集的数据经过深度学习模型进行标识化处理后加入关联图谱,对于已经加入关联图谱的数据进行不断地消歧分析和聚类计算进行不断地精简和校正,实现关联图谱的持续自优化,包括以下步骤:
步骤(1)、通过基于微服务的智能可重构物联网物联网开放服务运行支撑系统进行不断的信息抽取作为即将加入关联图谱的新增数据;
步骤(2)、对于各个微服务中的对象通过深度学习标识化模型进行标识化编码,实现知识图谱的迭代扩增,在一个资源描述框架下对所有的实体进行统一描述,通过本体词汇描述各种实体之间的联系,并在此基础上进行逻辑推理和验证配合多终端并行服务机制,实现请求合理资源分配;
步骤(3)、在关联图谱内部通过多个分布式数据存储节点和分布式计算节点进行数据处理,以块同步并行计算模型为基础,计算过程包括一系列全局迭代,每个迭代主要包括局部计算、通讯单元和栅栏同步三部分组成。同时根据系统的资源利用率、处理性能和数据的局部性实现计算资源的自适应动态最优分配;
步骤(4)、通过聚类分析计算出关联图谱中的离群点,将其判断为错误标识并予以校正;
步骤(5)、通过消歧分析计算出关联图谱中的冗余数据并将其合并。
CN201910303395.5A 2019-04-15 2019-04-15 一种标识化关联图谱自优化机制 Pending CN110704630A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910303395.5A CN110704630A (zh) 2019-04-15 2019-04-15 一种标识化关联图谱自优化机制

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910303395.5A CN110704630A (zh) 2019-04-15 2019-04-15 一种标识化关联图谱自优化机制

Publications (1)

Publication Number Publication Date
CN110704630A true CN110704630A (zh) 2020-01-17

Family

ID=69193041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910303395.5A Pending CN110704630A (zh) 2019-04-15 2019-04-15 一种标识化关联图谱自优化机制

Country Status (1)

Country Link
CN (1) CN110704630A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753997A (zh) * 2020-06-28 2020-10-09 北京百度网讯科技有限公司 分布式训练方法、系统、设备及存储介质
CN111930730A (zh) * 2020-07-28 2020-11-13 薛杨杨 基于人工智能和大数据的数据解析方法及区块链服务平台
CN112637263A (zh) * 2020-11-23 2021-04-09 国网电力科学研究院有限公司 一种多数据中心资源优化提升方法、系统和存储介质
CN113127491A (zh) * 2021-04-28 2021-07-16 深圳市邦盛实时智能技术有限公司 一种基于关联特征的流图划分系统
CN116089748A (zh) * 2022-11-11 2023-05-09 之江实验室 一种药物深度知识图谱渲染与更新方法、系统及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914556A (zh) * 2014-04-15 2014-07-09 西北工业大学 大规模图数据处理方法
CN105956016A (zh) * 2016-04-21 2016-09-21 成都数联铭品科技有限公司 关联信息可视化处理系统
CN106933983A (zh) * 2017-02-20 2017-07-07 广东省中医院 一种中医药知识图谱的构建方法
CN107346346A (zh) * 2017-08-26 2017-11-14 海南大学 基于数据图谱、信息图谱和知识图谱的学习者能力建模与学习过程优化管理系统
CN108664615A (zh) * 2017-05-12 2018-10-16 华中师范大学 一种面向学科教育资源的知识图谱构建方法
CN109271530A (zh) * 2018-10-17 2019-01-25 长沙瀚云信息科技有限公司 一种疾病知识图谱构建方法和平台系统、设备、存储介质
CN109597855A (zh) * 2018-11-29 2019-04-09 北京邮电大学 基于大数据驱动的领域知识图谱构建方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914556A (zh) * 2014-04-15 2014-07-09 西北工业大学 大规模图数据处理方法
CN105956016A (zh) * 2016-04-21 2016-09-21 成都数联铭品科技有限公司 关联信息可视化处理系统
CN106933983A (zh) * 2017-02-20 2017-07-07 广东省中医院 一种中医药知识图谱的构建方法
CN108664615A (zh) * 2017-05-12 2018-10-16 华中师范大学 一种面向学科教育资源的知识图谱构建方法
CN107346346A (zh) * 2017-08-26 2017-11-14 海南大学 基于数据图谱、信息图谱和知识图谱的学习者能力建模与学习过程优化管理系统
CN109271530A (zh) * 2018-10-17 2019-01-25 长沙瀚云信息科技有限公司 一种疾病知识图谱构建方法和平台系统、设备、存储介质
CN109597855A (zh) * 2018-11-29 2019-04-09 北京邮电大学 基于大数据驱动的领域知识图谱构建方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753997A (zh) * 2020-06-28 2020-10-09 北京百度网讯科技有限公司 分布式训练方法、系统、设备及存储介质
CN111753997B (zh) * 2020-06-28 2021-08-27 北京百度网讯科技有限公司 分布式训练方法、系统、设备及存储介质
CN111930730A (zh) * 2020-07-28 2020-11-13 薛杨杨 基于人工智能和大数据的数据解析方法及区块链服务平台
CN112637263A (zh) * 2020-11-23 2021-04-09 国网电力科学研究院有限公司 一种多数据中心资源优化提升方法、系统和存储介质
CN112637263B (zh) * 2020-11-23 2022-11-11 国网电力科学研究院有限公司 一种多数据中心资源优化提升方法、系统和存储介质
CN113127491A (zh) * 2021-04-28 2021-07-16 深圳市邦盛实时智能技术有限公司 一种基于关联特征的流图划分系统
CN113127491B (zh) * 2021-04-28 2022-03-22 深圳市邦盛实时智能技术有限公司 一种基于关联特征的流图划分系统
CN116089748A (zh) * 2022-11-11 2023-05-09 之江实验室 一种药物深度知识图谱渲染与更新方法、系统及装置
CN116089748B (zh) * 2022-11-11 2023-08-08 之江实验室 一种药物深度知识图谱渲染与更新方法、系统及装置

Similar Documents

Publication Publication Date Title
CN110704630A (zh) 一种标识化关联图谱自优化机制
EP3913545A2 (en) Method and apparatus for updating parameter of multi-task model, and electronic device
CN111914644A (zh) 一种基于双模态协同的弱监督时序动作定位方法及系统
CN112949281B (zh) 一种图神经网络的增量社交事件检测方法
CN106874478A (zh) 基于Spark的并行化随机标签子集多标签文本分类方法
CN111209410B (zh) 一种基于锚点的动态知识图谱表示学习方法及系统
CN111488467A (zh) 地理知识图谱的构建方法、装置、存储介质及计算机设备
CN105677857B (zh) 一种关键词与营销落地页的精准匹配方法和装置
CN111091247A (zh) 基于深度神经网络模型融合的电力负荷预测方法、装置
CN112199532A (zh) 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置
CN108846000A (zh) 一种基于超节点的常识语义图谱构建方法和装置以及基于连接预测的常识补全方法
CN117473053A (zh) 基于大语言模型的自然语言问答方法、装置、介质及设备
CN111241301A (zh) 一种面向知识图谱表示学习的分布式框架构建方法
CN109740039A (zh) 基于栈式自编码器的动态网络社团结构识别方法
CN113159287A (zh) 一种基于梯度稀疏的分布式深度学习方法
CN110457325B (zh) 用于输出信息的方法和装置
CN114782752A (zh) 基于自训练的小样本图像集成分类方法及装置
CN116993043A (zh) 一种电力设备故障溯源方法及装置
CN103942779A (zh) 一种基于图论和半监督学习相结合的图像分割方法
CN114841341B (zh) 图像处理模型训练及图像处理方法、装置、设备和介质
CN112765489B (zh) 一种社交网络链路预测方法及系统
CN116304691A (zh) 一种基于平均教师的多视图对比学习的网络分析方法
CN114842301A (zh) 一种图像注释模型的半监督训练方法
CN114548229A (zh) 训练数据增广方法、装置、设备和存储介质
CN103500219B (zh) 一种标签自适应精准匹配的控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200117