CN109697233B - 一种知识图谱体系搭建方法 - Google Patents

一种知识图谱体系搭建方法 Download PDF

Info

Publication number
CN109697233B
CN109697233B CN201811466407.8A CN201811466407A CN109697233B CN 109697233 B CN109697233 B CN 109697233B CN 201811466407 A CN201811466407 A CN 201811466407A CN 109697233 B CN109697233 B CN 109697233B
Authority
CN
China
Prior art keywords
data
knowledge graph
association
mode
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811466407.8A
Other languages
English (en)
Other versions
CN109697233A (zh
Inventor
印忠文
罗燎
宋荣伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC Big Data Research Institute Co Ltd
Original Assignee
CETC Big Data Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC Big Data Research Institute Co Ltd filed Critical CETC Big Data Research Institute Co Ltd
Priority to CN201811466407.8A priority Critical patent/CN109697233B/zh
Publication of CN109697233A publication Critical patent/CN109697233A/zh
Application granted granted Critical
Publication of CN109697233B publication Critical patent/CN109697233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种知识图谱体系搭建方法,包括以下步骤:数据采集‑提取特征‑表征特征‑特征保存‑获取知识图谱基础‑构建知识图谱。本发明能够将多媒体数据关联起来构建知识图谱、进行多媒体数据统一管理和使用、解决训练数据不足的问题、提升知识图谱关键信息抽取准确度、提升知识图谱构建效率,并通过实体属性特征关联以及键值对存储的方式,将知识图谱和底层多模态数据关联起来,利用数据拆解定位算法进行快速检索,再通过闭环式的体系,实现整个体系的快速迭代进化和完善,从而为后期的各项应用提供有力的支撑。

Description

一种知识图谱体系搭建方法
技术领域
本发明涉及一种知识图谱体系搭建方法,属于跨模态知识图谱构建和数据存储管理利用技术领域,具体涉及一种跨模态知识图谱构建和多模态数据管理。
背景技术
知识图谱能把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
目前知识图谱的构建和数据管理工作都是基于单一数据格式进行分析,对于语音、视频、文本、图像等多模态数据的利用率和管理存储方式的研究存在明显不足。由于互联网技术和信息技术的高速发展,数据以一种多元化多模态的方式呈现出来,如何利用这些多模态的数据构建更加完善的知识图谱并进行多模态数据的合理管理利用,具有非常高的研究意义。
随着计算机技术的不断发展,深度学习在多模态数据处理领域取得了非常显著的成果。在数据存储方面,从关系型数据库、分布式数据库再到基于键值对的NoSQL(Not OnlySQL)数据库,逐步实现了多模态多格式数据的有效存储和管理。
因此通过结合传统逻辑规则、统计学习、深度学习技术,以及键值对存储方式,通过跨模态数据分析的方式构建统一的跨模态知识图谱,并将知识图谱和底层多模态数据关联起来,对获得更高质量的知识图谱、提升知识图谱效果、提升数据利用率、推进计算机技术发展等具有重要意义。
发明内容
为解决上述技术问题,本发明提供了一种知识图谱体系搭建方法,该知识图谱体系搭建方法通过输入多种格式的多模态数据,输出拓展后的多模态数据、多模态数据存储方式、知识图谱和多模态数据关联,构建统一表示的知识图谱,并实现多模态数据快速拆解和定位检索算法。
本发明通过以下技术方案得以实现。
本发明提供的一种知识图谱体系搭建方法,包括以下步骤:
①数据采集:通过接口、爬虫获取多模态数据;
②提取特征:提取多模态数据的特征;
③表征特征:将提取的特征进行统一表示、关联分析、共性选择和粗分类,获取表征特征;
④特征保存:搭建数据库,将表征特征存入数据库中;
⑤获取知识图谱基础:从多模态数据中抽取实体、属性和关联关系,并以各个粗分类类别为基准,获取构建知识图谱的基础;
⑥构建知识图谱:根据知识图谱基础,构建跨模态数据的统一表征的知识图谱。
所述步骤①分为以下步骤:
(1.1)通过接口、爬虫获取目标领域相关的多模态数据,包括常规数值数据、文本数据、图像数据、视频数据、语音数据;
(1.2)对获取的多模态数据进行初步的数据清洗、数据处理,并按照数据格式选择合理的方式进行分类储存。
所述步骤②分为以下步骤:
(2.1)通过大规模数据,结合统计学习、逻辑规则方法,进行多模态数据特征提取的训练,获取深度学习神经网络模型,分别为图像特征提取神经网络模型、视频特征提取神经网络模型、语音特征提取神经网络模型、文本特征提取神经网络模型;
(2.2)通过统计方法获得用于提取多模态数据的特征算法模型;
(2.3)根据步骤(2.1)~(2.2)中的模型,分别提取常规数值数据、文本数据、图像数据、视频数据、语音数据的特征;
(2.4)将提取的特征作为对应数据,进行表示。
所述步骤(2.1)中,通过图像特征提取神经网络模型获取图像数据特征,通过视频特征提取神经网络模型获取视频数据特征,通过语音特征提取神经网络模型获取语音数据特征,通过文本特征提取神经网络模型获取文本数据特征,通过逻辑规则获取常规数值数据特征。
所述步骤③分为以下步骤:
(3.1)将提取到的多模态数据的特征利用深度学习技术进行统一表示;
(3.2)利用聚类算法、关联算法、距离算法对表示的各个数据的特征进行分析、分类;
(3.3)从分类中获取各个类别的多模态混合数据特征,并通过统计学习方法、逻辑规则、深度学习方法获取可以粗糙表示的各个类别的共性特征,即表征特征。
所述步骤④分为以下步骤:
(4.1)搭建基于NoSQL的数据库;
(4.2)通过多模态数据的特征算法模型,获取各个类别的表征特征作为索引Key,类别包含的多模态数据作为对应的值Value,存入数据库中。
所述步骤⑤分为以下步骤:
(5.1)通过统计学习方法、逻辑规则方法、深度学习方法,分别对各个类别中的图像数据、语音数据、文本数据、视频数据进行常规实体抽取、属性抽取、关系抽取分析,获取实体、属性和关联关系;
(5.2)以各个粗分类类别为基准,分别对属于各个类别实体、属性、关联关系进行跨模态的关联分析、交叉验证,去除错误信息,获取置信度高的实体、属性、关联关系信息,作为构建知识图谱的基础。
所述步骤⑥分为以下步骤:
(6.1)根据置信度高的实体、属性和关联关系,构建知识图谱,并对知识图谱进行统一表征;
(6.2)对构建的知识图谱进行知识推理研究,建立实体间隐藏的关系图,得到拓展后的知识图谱。
还包括步骤⑦数据拆解定位算法:通过知识图谱和多模态数据的关联,实现数据拆解定位算法;
具体分为以下步骤:
(7.1)通过建立实体、属性和数据特征、表征特征、索引Key之间的关系,将知识图谱和NoSQL数据库中的多模态数据关联进行关联;
(7.2)根据数据特有格式、结合逻辑规则和统计学习、深度学习方法,实现基于数据格式的数据拆解算法,以及数据的快速定位检索算法;
(7.3)结合数据拆解定位算法以及知识图谱和多模态数据的关联关系,建立统一表征知识图谱和底层多模态数据的强关联关系。
本发明的有益效果在于:能够将多媒体数据关联起来构建知识图谱、进行多媒体数据统一管理和使用、解决训练数据不足的问题、提升知识图谱关键信息抽取准确度、提升知识图谱构建效率,并通过实体属性特征关联以及键值对存储的方式,将知识图谱和底层多模态数据关联起来,利用数据拆解定位算法进行快速检索,再通过闭环式的体系,实现整个体系的快速迭代进化和完善,从而为后期的各项应用提供有力的支撑。
附图说明
图1是本发明的结构图。
具体实施方式
下面进一步描述本发明的技术方案,但要求保护的范围并不局限于所述。
如图1所示,一种知识图谱体系搭建方法,包括以下步骤:
①数据采集:通过接口、爬虫获取多模态数据;
具体分为以下步骤:
(1.1)通过接口、爬虫获取目标领域相关的多模态数据,包括常规数值数据、文本数据、图像数据、视频数据、语音数据;
(1.2)对获取的多模态数据进行初步的数据清洗、数据处理,并按照数据格式选择合理的方式进行分类储存。
②提取特征:提取多模态数据的特征;
具体分为以下步骤:
(2.1)通过大规模数据,结合统计学习、逻辑规则方法,进行多模态数据特征提取的训练,获取深度学习神经网络模型,分别为图像特征提取神经网络模型、视频特征提取神经网络模型、语音特征提取神经网络模型、文本特征提取神经网络模型;
优选的,选用通用数据、通用神经网络进行特征提取,可以解决训练数量不足的问题;
进一步地,通过图像特征提取神经网络模型获取图像数据特征,通过视频特征提取神经网络模型获取视频数据特征,通过语音特征提取神经网络模型获取语音数据特征,通过文本特征提取神经网络模型获取文本数据特征,通过逻辑规则获取常规数值数据特征。
(2.2)通过统计方法获得用于提取多模态数据的特征算法模型;
(2.3)根据步骤(2.1)~(2.2)中的模型,分别提取常规数值数据、文本数据、图像数据、视频数据、语音数据的特征;
(2.4)将提取的特征作为对应数据,进行表示。
③表征特征:将提取的特征进行统一表示、关联分析、共性选择和粗分类,获取表征特征;
具体分为以下步骤:
(3.1)将提取到的多模态数据的特征利用深度学习技术进行统一表示;
(3.2)利用聚类算法、关联算法、距离算法对表示的各个数据的特征进行分析、分类;
优选的,通过特征统一表示、特征选择、特征关联分析、共性特征选择和特征表征的方式,将多模态数据关联起来,并进行分类;
优选的,通过对多模态数据进行特征表征以及分类,实现以通用表征特征对包含多模态数据(比如图像、语音、视频、文本数据等)各个类别数据进行分类管理;
(3.3)从分类中获取各个类别的多模态混合数据特征,并通过统计学习方法、逻辑规则、深度学习方法获取可以粗糙表示的各个类别的共性特征,即表征特征。
④特征保存:搭建数据库,将表征特征存入数据库中;
具体分为以下步骤:
(4.1)搭建基于NoSQL的数据库,使用NoSQL(Not Only SQL)数据库进行多模态数据的存储和管理;利用NoSQL基于对键值的存储方式,可以对多模态数据进行合理存储;
优选的,多模态数据的管理是利用数据特征作为数据标签、利用表征特征作为类别标签进行标记和管理;
(4.2)通过多模态数据的特征算法模型,获取各个类别的表征特征作为索引Key,类别包含的多模态数据(比如图像、文本、语音等格式的数据)作为对应的值Value,存入数据库中;利用算法生成的特征信息作为索引,用分类之后的数据作为值,可以有效管理和使用数据。
⑤获取知识图谱基础:从多模态数据中抽取实体、属性和关联关系,并以各个粗分类类别为基准,获取构建知识图谱的基础;
具体分为以下步骤:
(5.1)通过统计学习方法、逻辑规则方法、深度学习方法,分别对各个类别中的图像数据、语音数据、文本数据、视频数据进行常规实体抽取、属性抽取、关系抽取分析,获取实体、属性和关联关系,可以有效降低构建知识图谱的工作量;即对同一类别不同数据使用常规统计学习方法、逻辑规则方法、深度学习方法提取知识图谱实体、属性和关联关系信息,并进行信息之间的关联分析以及交叉验证,并对跨类别的信息进行交叉关联分析获取新的实体、属性和关联关系;
(5.2)以各个粗分类类别为基准,分别对属于各个类别实体、属性、关联关系进行跨模态的关联分析、交叉验证,去除错误信息,获取置信度高的实体、属性、关联关系信息,作为构建知识图谱的基础,可以提升知识图谱核心元素的可信度。
⑥构建知识图谱:根据知识图谱基础,构建跨模态数据的统一表征的知识图谱,可以大幅度提升数据的逻辑性;
具体分为以下步骤:
(6.1)根据置信度高的实体、属性和关联关系,构建知识图谱,采用常规的表示方法,对知识图谱进行统一表征;
(6.2)基于常规知识图谱构建技术,对构建的知识图谱进行知识推理研究,建立实体间隐藏的关系图,得到拓展后的知识图谱。
还包括步骤⑦数据拆解定位算法:通过知识图谱和多模态数据的关联,实现数据拆解定位算法;即通过利用数据特有格式、结合逻辑规则统计学习深度学习技术,实现基于数据格式的数据拆解算法以及数据的快速定位检索算法;
具体分为以下步骤:
(7.1)通过建立实体、属性和数据特征、表征特征、索引Key之间的关系,将知识图谱和NoSQL数据库中的多模态数据关联进行关联;
(7.2)根据数据特有格式、结合逻辑规则和统计学习、深度学习方法,实现基于数据格式的数据拆解算法,以及数据的快速定位检索算法;
(7.3)结合数据拆解定位算法以及知识图谱和多模态数据的关联关系,建立统一表征知识图谱和底层多模态数据的强关联关系;
进一步地,通过统一表示的知识图谱将多模态数据(图像、文本、语音、视频等数据)关联起来,并通过实体、属性、数据特征、表征特征、数据格式、定位检索、键值对存储的方式建立知识图谱和底层数据的强关联关系;
本发明是一种基于NoSQL数据库的多模态数据融合统一知识图谱体系搭建方法,通过获取图像、视频、音频等多种格式的混合数据;利用大规模通用数据分别训练通用图像、文本、音频、视频数据特征提取神经网络,然后分别对图像、文本、音频、视频数据进行特征抽取、特征统一表征、特征关联分析和共性特征选择,建立多模态数据弱关联关系,利用共性特征进行多模态数据分类,并将共性特征作为类别的表征特征以及索引(key)、表征特征对应的多模态数据作为值(value)存入NoSQL(Not Only SQL)数据库中;从各个类别中分别对图像数据、音频数据、文本数据等多模态数据利用逻辑规则、统计学习方法、深度学习方法提取知识图谱实体、属性和关联关系,然后对属于同一类别的不同格式数据提取到的知识图谱实体、属性和关联关系进行交叉再验证,选出置信度较高的实体、属性、关联关系构建统一表示的知识图谱。
实施例
如上所述,本发明的实施过程如下:
1)获取图像、语音、视频、文本等多模态数据,进行数据初步清洗和处理;
2)训练多模态数据特征提取的神经网络算法模型、建立逻辑规则算法模型;
3)分别对各个格式的多模态数据进行特征抽取;
4)对得到的特征进行统一表示、特征关联分析、特征选择、共性特征选择和数据表征特征的确定,并依据特征分析结果对多模态数据进行初步分类;
5)将表征特征作为索引(Key),对应类别的多模态混合数据作为值(Value)存入NoSQL数据库中;
6)利用逻辑规则方法、统计学习方法和深度学习方法,分别对每个类别中的多模态数据进行实体抽取、属性抽取和关联关系抽取,获取实体、属性和关联关系信息;
7)对从多模态数据中获得的实体、属性和关联关系进行关联分析、交叉验证,获取置信度较高的信息,去掉错误提取的信息或者本身存在错误的信息;
8)基于常规知识图谱构建和统一表示方法,利用置信度较高的实体、属性和关联关系信息搭建多模态数据的统一表示的知识图谱;
9)利用知识推理技术,从已获得的知识图谱中进行知识推理,建立更深层次的实体属性信息以及关联关系,得到拓展后的知识图谱;
10)通过数据特征、表征特征、键值对建立知识图谱和底层数据的对应关系;
11)通过实现基于数据格式的数据拆解和快速检索定位算法,建立知识图谱和底层数据的强关联关系。
综上所述,本发明是一套闭环式完整体系,任意环节的修改均可以通过整体关联响应变化的方式进行迭代升级,适用于多媒体跨媒体数据管理体系、检索体系的搭建实现,高质量跨媒体知识图谱的生成与管理利用和建立多媒体跨媒体数据关联关系以及统一表示方法。

Claims (5)

1.一种知识图谱体系搭建方法,其特征在于:包括以下步骤:
①数据采集:通过接口、爬虫获取多模态数据;
②提取特征:提取多模态数据的特征;
③表征特征:将提取的特征进行统一表示、关联分析、共性选择和粗分类,获取表征特征;
④特征保存:搭建数据库,将表征特征存入数据库中;
⑤获取知识图谱基础:从多模态数据中抽取实体、属性和关联关系,并以各个粗分类类别为基准,获取构建知识图谱的基础;
⑥构建知识图谱:根据知识图谱基础,构建跨模态数据的统一表征的知识图谱;
所述步骤①分为以下步骤:
(1.1)通过接口、爬虫获取目标领域相关的多模态数据,包括常规数值数据、文本数据、图像数据、视频数据、语音数据;
(1.2)对获取的多模态数据进行初步的数据清洗、数据处理,并按照数据格式选择合理的方式进行分类储存;
所述步骤③分为以下步骤:
(3.1)将提取到的多模态数据的特征利用深度学习技术进行统一表示;
(3.2)利用聚类算法、关联算法、距离算法对表示的各个数据的特征进行分析、分类;
(3.3)从分类中获取各个类别的多模态混合数据特征,并通过统计学习方法、逻辑规则、深度学习方法获取可以粗糙表示的各个类别的共性特征,即表征特征;
所述步骤⑤分为以下步骤:
(5.1)通过统计学习方法、逻辑规则方法、深度学习方法,分别对各个类别中的图像数据、语音数据、文本数据、视频数据进行常规实体抽取、属性抽取、关系抽取分析,获取实体、属性和关联关系;
(5.2)以各个粗分类类别为基准,分别对属于各个类别实体、属性、关联关系进行跨模态的关联分析、交叉验证,去除错误信息,获取置信度高的实体、属性、关联关系信息,作为构建知识图谱的基础;
还包括步骤⑦数据拆解定位算法:通过知识图谱和多模态数据的关联,实现数据拆解定位算法;
所述步骤⑦分为以下步骤:
(7.1)通过建立实体、属性和数据特征、表征特征、索引Key之间的关系,将知识图谱和NoSQL数据库中的多模态数据关联进行关联;
(7.2)根据数据特有格式、结合逻辑规则和统计学习、深度学习方法,实现基于数据格式的数据拆解算法,利用数据拆解定位算法进行快速检索;
(7.3)结合数据拆解定位算法以及知识图谱和多模态数据的关联关系,建立统一表征知识图谱和底层多模态数据的强关联关系。
2.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤②分为以下步骤:
(2.1)通过大规模通用数据,结合统计学习、逻辑规则方法,进行多模态数据特征提取的训练,获取深度学习神经网络模型,分别为图像特征提取神经网络模型、视频特征提取神经网络模型、语音特征提取神经网络模型、文本特征提取神经网络模型;
(2.2)通过统计方法获得用于提取多模态数据的特征算法模型;
(2.3)根据步骤(2.1)~(2.2)中的模型,分别提取常规数值数据、文本数据、图像数据、视频数据、语音数据的特征;
(2.4)将提取的特征作为对应数据,进行表示。
3.如权利要求2所述的知识图谱体系搭建方法,其特征在于:所述步骤(2.1)中,通过图像特征提取神经网络模型获取图像数据特征,通过视频特征提取神经网络模型获取视频数据特征,通过语音特征提取神经网络模型获取语音数据特征,通过文本特征提取神经网络模型获取文本数据特征,通过逻辑规则获取常规数值数据特征。
4.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤④分为以下步骤:
(4.1)搭建基于NoSQL的数据库;
(4.2)通过多模态数据的特征算法模型,获取各个类别的表征特征作为索引Key,类别包含的多模态数据作为对应的值Value,存入数据库中。
5.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤⑥分为以下步骤:
(6.1)根据置信度高的实体、属性和关联关系,构建知识图谱,并对知识图谱进行统一表征;
(6.2)对构建的知识图谱进行知识推理研究,建立实体间隐藏的关系图,得到拓展后的知识图谱。
CN201811466407.8A 2018-12-03 2018-12-03 一种知识图谱体系搭建方法 Active CN109697233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811466407.8A CN109697233B (zh) 2018-12-03 2018-12-03 一种知识图谱体系搭建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811466407.8A CN109697233B (zh) 2018-12-03 2018-12-03 一种知识图谱体系搭建方法

Publications (2)

Publication Number Publication Date
CN109697233A CN109697233A (zh) 2019-04-30
CN109697233B true CN109697233B (zh) 2023-06-20

Family

ID=66230287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811466407.8A Active CN109697233B (zh) 2018-12-03 2018-12-03 一种知识图谱体系搭建方法

Country Status (1)

Country Link
CN (1) CN109697233B (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399497A (zh) * 2019-07-02 2019-11-01 厦门美域中央信息科技有限公司 一种基于深度学习技术的知识图谱自适应构建方法
CN110879843B (zh) * 2019-08-06 2020-08-04 上海孚典智能科技有限公司 基于机器学习的构建自适应知识图谱技术的方法
CN110532404B (zh) * 2019-09-03 2023-08-04 北京百度网讯科技有限公司 一种源多媒体确定方法、装置、设备及存储介质
CN110674312B (zh) * 2019-09-18 2022-05-17 泰康保险集团股份有限公司 构建知识图谱方法、装置、介质及电子设备
CN110569372B (zh) * 2019-09-20 2022-08-30 四川大学 一种心脏病大数据知识图谱系统的构建方法
CN110738982B (zh) * 2019-10-22 2022-01-28 珠海格力电器股份有限公司 一种请求处理方法、装置及电子设备
CN111046112A (zh) * 2019-11-22 2020-04-21 精硕科技(北京)股份有限公司 品类知识图谱展示方法、装置和电子设备
CN111026894B (zh) * 2019-12-12 2021-11-26 清华大学 基于可信度自适应匹配网络的跨模态图像文本检索方法
CN111221984B (zh) * 2020-01-15 2024-03-01 北京百度网讯科技有限公司 多模态内容处理方法、装置、设备及存储介质
CN111291194A (zh) * 2020-01-20 2020-06-16 深圳供电局有限公司 自动化存储以及知识图谱生成方法及装置
CN111309925B (zh) * 2020-02-10 2023-06-30 同方知网数字出版技术股份有限公司 一种军事装备的知识图谱构建方法
CN111400428B (zh) * 2020-02-17 2023-08-25 河南新世纪拓普电子技术有限公司 一种知识图谱体系搭建方法
CN111462841B (zh) * 2020-03-12 2023-06-20 华南理工大学 一种基于知识图谱的抑郁症智能诊断装置及系统
CN113392312A (zh) * 2020-03-12 2021-09-14 阿里巴巴集团控股有限公司 信息处理方法、系统及电子设备
CN111414959B (zh) * 2020-03-18 2024-02-02 南京星火技术有限公司 图像识别方法、装置、计算机可读介质和电子设备
CN111401259B (zh) * 2020-03-18 2024-02-02 南京星火技术有限公司 模型训练方法、系统、计算机可读介质和电子设备
CN112668384B (zh) * 2020-08-07 2024-05-31 深圳市唯特视科技有限公司 一种知识图谱构建方法、系统、电子设备及存储介质
CN112069326B (zh) * 2020-09-03 2024-08-06 Oppo广东移动通信有限公司 知识图谱的构建方法、装置、电子设备及存储介质
CN112288091B (zh) * 2020-10-30 2023-03-21 西南电子技术研究所(中国电子科技集团公司第十研究所) 基于多模态知识图谱的知识推理方法
CN112287122A (zh) * 2020-11-11 2021-01-29 济南浪潮高新科技投资发展有限公司 一种基于多模态的跨媒体知识抽取方法
CN112527915B (zh) * 2020-11-17 2021-08-27 北京科技大学 线性文化遗产知识图谱构建方法、系统、计算设备和介质
CN112559758A (zh) * 2020-11-30 2021-03-26 北京百度网讯科技有限公司 构建知识图谱的方法、装置、设备和计算机可读存储介质
CN112712056A (zh) * 2021-01-14 2021-04-27 珠海格力电器股份有限公司 视频语义分析方法、装置、存储介质及电子设备
CN112967225A (zh) * 2021-01-29 2021-06-15 绍兴隆芙力智能科技发展有限公司 一种基于人工智能的自动检测系统、方法、设备及介质
CN112967226A (zh) * 2021-01-29 2021-06-15 绍兴隆芙力智能科技发展有限公司 一种基于人工智能的高反光制品检测系统、方法及介质
CN112948508B (zh) * 2021-04-15 2024-04-30 平安科技(深圳)有限公司 基于多层关联知识图谱的信息预测方法、装置、设备及介质
CN113918732A (zh) * 2021-11-19 2022-01-11 北京明略软件系统有限公司 多模态知识图谱构建方法、系统、存储介质及电子设备
CN114092859B (zh) * 2021-11-25 2024-08-02 扬州大学 一种面向视频流的奶牛知识图谱构建方法
CN114781642B (zh) * 2022-06-17 2022-09-23 之江实验室 一种跨媒体对应知识的生成方法和装置
CN115115126A (zh) * 2022-07-14 2022-09-27 复旦大学 基于知识图谱的农作物灾害损失及产量预测系统及方法
CN115292513A (zh) * 2022-07-22 2022-11-04 山东浪潮科学研究院有限公司 基于多视图学习的教学知识图谱构建及检索方法及系统
CN115409075A (zh) * 2022-11-03 2022-11-29 成都中科合迅科技有限公司 一种基于无线信号分析的特征分析系统
CN116701643B (zh) * 2022-12-15 2024-07-02 重庆交通大学 基于社会传感数据的人群出行行为解析方法及存储介质
CN117371533B (zh) * 2023-11-01 2024-05-24 深圳市马博士网络科技有限公司 一种生成数据标签规则的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136249A (zh) * 2011-11-30 2013-06-05 北京航天长峰科技工业集团有限公司 多模态异构数据整合系统及方法
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索系统
WO2017176100A1 (en) * 2016-04-08 2017-10-12 Samsung Electronics Co., Ltd. Method and device for translating object information and acquiring derivative information
CN107679110A (zh) * 2017-09-15 2018-02-09 广州唯品会研究院有限公司 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN107808145A (zh) * 2017-11-13 2018-03-16 河南大学 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统
CN108875051A (zh) * 2018-06-28 2018-11-23 中译语通科技股份有限公司 面向海量非结构化文本的知识图谱自动构建方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136249A (zh) * 2011-11-30 2013-06-05 北京航天长峰科技工业集团有限公司 多模态异构数据整合系统及方法
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索系统
WO2017176100A1 (en) * 2016-04-08 2017-10-12 Samsung Electronics Co., Ltd. Method and device for translating object information and acquiring derivative information
CN107679110A (zh) * 2017-09-15 2018-02-09 广州唯品会研究院有限公司 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN107808145A (zh) * 2017-11-13 2018-03-16 河南大学 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统
CN108875051A (zh) * 2018-06-28 2018-11-23 中译语通科技股份有限公司 面向海量非结构化文本的知识图谱自动构建方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
知识图谱发展与构建的研究进展;朱木易洁等;《南京信息工程大学学报(自然科学版)》;20171128(第06期);全文 *
知识图谱技术研究综述;欧艳鹏;《电子世界》;20180708(第13期);全文 *

Also Published As

Publication number Publication date
CN109697233A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN109697233B (zh) 一种知识图谱体系搭建方法
CN109669934B (zh) 一种切合电力客服业务的数据仓库系统及其构建方法
US9971967B2 (en) Generating a superset of question/answer action paths based on dynamically generated type sets
CN107180045B (zh) 一种互联网文本蕴含地理实体关系的抽取方法
CN107609052A (zh) 一种基于语义三角的领域知识图谱的生成方法及装置
CN112463980A (zh) 一种基于知识图谱的预案智能推荐方法
CN111627552B (zh) 一种医疗流式数据血缘关系分析、存储方法及装置
US10089390B2 (en) System and method to extract models from semi-structured documents
CN110866123A (zh) 基于数据模型构建数据图谱的方法及构建数据图谱的系统
CN111008253A (zh) 数据模型生成方法和数据仓库生成方法、装置及电子设备
CN113239159B (zh) 基于关系推理网络的视频和文本的跨模态检索方法
Miao et al. A dynamic financial knowledge graph based on reinforcement learning and transfer learning
CN118093632B (zh) 基于大语言模型和图结构的图数据库查询方法和装置
CN114443855A (zh) 一种基于图表示学习的知识图谱跨语言对齐方法
CN115422155A (zh) 一种数据湖元数据模型的建模方法
CN117851609A (zh) 一种基于多源异构数据融合的非遗知识图谱构建方法
Yu et al. Intelligent analysis system of college students' employment and entrepreneurship situation: Big data and artificial intelligence-driven approach
CN115203337A (zh) 一种数据库元数据关系知识图谱生成方法
CN110196849A (zh) 基于大数据治理技术实现用户画像构建处理的系统及其方法
CN112363996B (zh) 用于建立电网知识图谱的物理模型的方法及系统和介质
CN117993772A (zh) 一种基于知识图谱的众包数据采集方法、系统及电子设备
CN117931852A (zh) 一种基于自然语言处理的智能查询和可视化方法
CN111008285B (zh) 一种基于论文关键属性网络的作者消歧方法
KR20220079026A (ko) 일반 문서 기반의 멀티미디어 영상 콘텐츠 제작 서비스 제공 장치
CN114372148A (zh) 一种基于知识图谱技术的数据处理方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant