CN109697233A - 一种知识图谱体系搭建方法 - Google Patents

一种知识图谱体系搭建方法 Download PDF

Info

Publication number
CN109697233A
CN109697233A CN201811466407.8A CN201811466407A CN109697233A CN 109697233 A CN109697233 A CN 109697233A CN 201811466407 A CN201811466407 A CN 201811466407A CN 109697233 A CN109697233 A CN 109697233A
Authority
CN
China
Prior art keywords
data
knowledge mapping
feature
modal
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811466407.8A
Other languages
English (en)
Other versions
CN109697233B (zh
Inventor
印忠文
罗燎
宋荣伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC Big Data Research Institute Co Ltd
Original Assignee
CETC Big Data Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC Big Data Research Institute Co Ltd filed Critical CETC Big Data Research Institute Co Ltd
Priority to CN201811466407.8A priority Critical patent/CN109697233B/zh
Publication of CN109697233A publication Critical patent/CN109697233A/zh
Application granted granted Critical
Publication of CN109697233B publication Critical patent/CN109697233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供了一种知识图谱体系搭建方法,包括以下步骤:数据采集‑提取特征‑表征特征‑特征保存‑获取知识图谱基础‑构建知识图谱。本发明能够将多媒体数据关联起来构建知识图谱、进行多媒体数据统一管理和使用、解决训练数据不足的问题、提升知识图谱关键信息抽取准确度、提升知识图谱构建效率,并通过实体属性特征关联以及键值对存储的方式,将知识图谱和底层多模态数据关联起来,利用数据拆解定位算法进行快速检索,再通过闭环式的体系,实现整个体系的快速迭代进化和完善,从而为后期的各项应用提供有力的支撑。

Description

一种知识图谱体系搭建方法
技术领域
本发明涉及一种知识图谱体系搭建方法,属于跨模态知识图谱构建和数据存储管理利用技术领域,具体涉及一种跨模态知识图谱构建和多模态数据管理。
背景技术
知识图谱能把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
目前知识图谱的构建和数据管理工作都是基于单一数据格式进行分析,对于语音、视频、文本、图像等多模态数据的利用率和管理存储方式的研究存在明显不足。由于互联网技术和信息技术的高速发展,数据以一种多元化多模态的方式呈现出来,如何利用这些多模态的数据构建更加完善的知识图谱并进行多模态数据的合理管理利用,具有非常高的研究意义。
随着计算机技术的不断发展,深度学习在多模态数据处理领域取得了非常显著的成果。在数据存储方面,从关系型数据库、分布式数据库再到基于键值对的NoSQL(Not OnlySQL)数据库,逐步实现了多模态多格式数据的有效存储和管理。
因此通过结合传统逻辑规则、统计学习、深度学习技术,以及键值对存储方式,通过跨模态数据分析的方式构建统一的跨模态知识图谱,并将知识图谱和底层多模态数据关联起来,对获得更高质量的知识图谱、提升知识图谱效果、提升数据利用率、推进计算机技术发展等具有重要意义。
发明内容
为解决上述技术问题,本发明提供了一种知识图谱体系搭建方法,该知识图谱体系搭建方法通过输入多种格式的多模态数据,输出拓展后的多模态数据、多模态数据存储方式、知识图谱和多模态数据关联,构建统一表示的知识图谱,并实现多模态数据快速拆解和定位检索算法。
本发明通过以下技术方案得以实现。
本发明提供的一种知识图谱体系搭建方法,包括以下步骤:
①数据采集:通过接口、爬虫获取多模态数据;
②提取特征:提取多模态数据的特征;
③表征特征:将提取的特征进行统一表示、关联分析、共性选择和粗分类,获取表征特征;
④特征保存:搭建数据库,将表征特征存入数据库中;
⑤获取知识图谱基础:从多模态数据中抽取实体、属性和关联关系,并以各个粗分类类别为基准,获取构建知识图谱的基础;
⑥构建知识图谱:根据知识图谱基础,构建跨模态数据的统一表征的知识图谱。
所述步骤①分为以下步骤:
(1.1)通过接口、爬虫获取目标领域相关的多模态数据,包括常规数值数据、文本数据、图像数据、视频数据、语音数据;
(1.2)对获取的多模态数据进行初步的数据清洗、数据处理,并按照数据格式选择合理的方式进行分类储存。
所述步骤②分为以下步骤:
(2.1)通过大规模数据,结合统计学习、逻辑规则方法,进行多模态数据特征提取的训练,获取深度学习神经网络模型,分别为图像特征提取神经网络模型、视频特征提取神经网络模型、语音特征提取神经网络模型、文本特征提取神经网络模型;
(2.2)通过统计方法获得用于提取多模态数据的特征算法模型;
(2.3)根据步骤(2.1)~(2.2)中的模型,分别提取常规数值数据、文本数据、图像数据、视频数据、语音数据的特征;
(2.4)将提取的特征作为对应数据,进行表示。
所述步骤(2.1)中,通过图像特征提取神经网络模型获取图像数据特征,通过视频特征提取神经网络模型获取视频数据特征,通过语音特征提取神经网络模型获取语音数据特征,通过文本特征提取神经网络模型获取文本数据特征,通过逻辑规则获取常规数值数据特征。
所述步骤③分为以下步骤:
(3.1)将提取到的多模态数据的特征利用深度学习技术进行统一表示;
(3.2)利用聚类算法、关联算法、距离算法对表示的各个数据的特征进行分析、分类;
(3.3)从分类中获取各个类别的多模态混合数据特征,并通过统计学习方法、逻辑规则、深度学习方法获取可以粗糙表示的各个类别的共性特征,即表征特征。
所述步骤④分为以下步骤:
(4.1)搭建基于NoSQL的数据库;
(4.2)通过多模态数据的特征算法模型,获取各个类别的表征特征作为索引Key,类别包含的多模态数据作为对应的值Value,存入数据库中。
所述步骤⑤分为以下步骤:
(5.1)通过统计学习方法、逻辑规则方法、深度学习方法,分别对各个类别中的图像数据、语音数据、文本数据、视频数据进行常规实体抽取、属性抽取、关系抽取分析,获取实体、属性和关联关系;
(5.2)以各个粗分类类别为基准,分别对属于各个类别实体、属性、关联关系进行跨模态的关联分析、交叉验证,去除错误信息,获取置信度高的实体、属性、关联关系信息,作为构建知识图谱的基础。
所述步骤⑥分为以下步骤:
(6.1)根据置信度高的实体、属性和关联关系,构建知识图谱,并对知识图谱进行统一表征;
(6.2)对构建的知识图谱进行知识推理研究,建立实体间隐藏的关系图,得到拓展后的知识图谱。
还包括步骤⑦数据拆解定位算法:通过知识图谱和多模态数据的关联,实现数据拆解定位算法;
具体分为以下步骤:
(7.1)通过建立实体、属性和数据特征、表征特征、索引Key之间的关系,将知识图谱和NoSQL数据库中的多模态数据关联进行关联;
(7.2)根据数据特有格式、结合逻辑规则和统计学习、深度学习方法,实现基于数据格式的数据拆解算法,以及数据的快速定位检索算法;
(7.3)结合数据拆解定位算法以及知识图谱和多模态数据的关联关系,建立统一表征知识图谱和底层多模态数据的强关联关系。
本发明的有益效果在于:能够将多媒体数据关联起来构建知识图谱、进行多媒体数据统一管理和使用、解决训练数据不足的问题、提升知识图谱关键信息抽取准确度、提升知识图谱构建效率,并通过实体属性特征关联以及键值对存储的方式,将知识图谱和底层多模态数据关联起来,利用数据拆解定位算法进行快速检索,再通过闭环式的体系,实现整个体系的快速迭代进化和完善,从而为后期的各项应用提供有力的支撑。
附图说明
图1是本发明的结构图。
具体实施方式
下面进一步描述本发明的技术方案,但要求保护的范围并不局限于所述。
如图1所示,一种知识图谱体系搭建方法,包括以下步骤:
①数据采集:通过接口、爬虫获取多模态数据;
具体分为以下步骤:
(1.1)通过接口、爬虫获取目标领域相关的多模态数据,包括常规数值数据、文本数据、图像数据、视频数据、语音数据;
(1.2)对获取的多模态数据进行初步的数据清洗、数据处理,并按照数据格式选择合理的方式进行分类储存。
②提取特征:提取多模态数据的特征;
具体分为以下步骤:
(2.1)通过大规模数据,结合统计学习、逻辑规则方法,进行多模态数据特征提取的训练,获取深度学习神经网络模型,分别为图像特征提取神经网络模型、视频特征提取神经网络模型、语音特征提取神经网络模型、文本特征提取神经网络模型;
优选的,选用通用数据、通用神经网络进行特征提取,可以解决训练数量不足的问题;
进一步地,通过图像特征提取神经网络模型获取图像数据特征,通过视频特征提取神经网络模型获取视频数据特征,通过语音特征提取神经网络模型获取语音数据特征,通过文本特征提取神经网络模型获取文本数据特征,通过逻辑规则获取常规数值数据特征。
(2.2)通过统计方法获得用于提取多模态数据的特征算法模型;
(2.3)根据步骤(2.1)~(2.2)中的模型,分别提取常规数值数据、文本数据、图像数据、视频数据、语音数据的特征;
(2.4)将提取的特征作为对应数据,进行表示。
③表征特征:将提取的特征进行统一表示、关联分析、共性选择和粗分类,获取表征特征;
具体分为以下步骤:
(3.1)将提取到的多模态数据的特征利用深度学习技术进行统一表示;
(3.2)利用聚类算法、关联算法、距离算法对表示的各个数据的特征进行分析、分类;
优选的,通过特征统一表示、特征选择、特征关联分析、共性特征选择和特征表征的方式,将多模态数据关联起来,并进行分类;
优选的,通过对多模态数据进行特征表征以及分类,实现以通用表征特征对包含多模态数据(比如图像、语音、视频、文本数据等)各个类别数据进行分类管理;
(3.3)从分类中获取各个类别的多模态混合数据特征,并通过统计学习方法、逻辑规则、深度学习方法获取可以粗糙表示的各个类别的共性特征,即表征特征。
④特征保存:搭建数据库,将表征特征存入数据库中;
具体分为以下步骤:
(4.1)搭建基于NoSQL的数据库,使用NoSQL(Not Only SQL)数据库进行多模态数据的存储和管理;利用NoSQL基于对键值的存储方式,可以对多模态数据进行合理存储;
优选的,多模态数据的管理是利用数据特征作为数据标签、利用表征特征作为类别标签进行标记和管理;
(4.2)通过多模态数据的特征算法模型,获取各个类别的表征特征作为索引Key,类别包含的多模态数据(比如图像、文本、语音等格式的数据)作为对应的值Value,存入数据库中;利用算法生成的特征信息作为索引,用分类之后的数据作为值,可以有效管理和使用数据。
⑤获取知识图谱基础:从多模态数据中抽取实体、属性和关联关系,并以各个粗分类类别为基准,获取构建知识图谱的基础;
具体分为以下步骤:
(5.1)通过统计学习方法、逻辑规则方法、深度学习方法,分别对各个类别中的图像数据、语音数据、文本数据、视频数据进行常规实体抽取、属性抽取、关系抽取分析,获取实体、属性和关联关系,可以有效降低构建知识图谱的工作量;即对同一类别不同数据使用常规统计学习方法、逻辑规则方法、深度学习方法提取知识图谱实体、属性和关联关系信息,并进行信息之间的关联分析以及交叉验证,并对跨类别的信息进行交叉关联分析获取新的实体、属性和关联关系;
(5.2)以各个粗分类类别为基准,分别对属于各个类别实体、属性、关联关系进行跨模态的关联分析、交叉验证,去除错误信息,获取置信度高的实体、属性、关联关系信息,作为构建知识图谱的基础,可以提升知识图谱核心元素的可信度。
⑥构建知识图谱:根据知识图谱基础,构建跨模态数据的统一表征的知识图谱,可以大幅度提升数据的逻辑性;
具体分为以下步骤:
(6.1)根据置信度高的实体、属性和关联关系,构建知识图谱,采用常规的表示方法,对知识图谱进行统一表征;
(6.2)基于常规知识图谱构建技术,对构建的知识图谱进行知识推理研究,建立实体间隐藏的关系图,得到拓展后的知识图谱。
还包括步骤⑦数据拆解定位算法:通过知识图谱和多模态数据的关联,实现数据拆解定位算法;即通过利用数据特有格式、结合逻辑规则统计学习深度学习技术,实现基于数据格式的数据拆解算法以及数据的快速定位检索算法;
具体分为以下步骤:
(7.1)通过建立实体、属性和数据特征、表征特征、索引Key之间的关系,将知识图谱和NoSQL数据库中的多模态数据关联进行关联;
(7.2)根据数据特有格式、结合逻辑规则和统计学习、深度学习方法,实现基于数据格式的数据拆解算法,以及数据的快速定位检索算法;
(7.3)结合数据拆解定位算法以及知识图谱和多模态数据的关联关系,建立统一表征知识图谱和底层多模态数据的强关联关系;
进一步地,通过统一表示的知识图谱将多模态数据(图像、文本、语音、视频等数据)关联起来,并通过实体、属性、数据特征、表征特征、数据格式、定位检索、键值对存储的方式建立知识图谱和底层数据的强关联关系;
本发明是一种基于NoSQL数据库的多模态数据融合统一知识图谱体系搭建方法,通过获取图像、视频、音频等多种格式的混合数据;利用大规模通用数据分别训练通用图像、文本、音频、视频数据特征提取神经网络,然后分别对图像、文本、音频、视频数据进行特征抽取、特征统一表征、特征关联分析和共性特征选择,建立多模态数据弱关联关系,利用共性特征进行多模态数据分类,并将共性特征作为类别的表征特征以及索引(key)、表征特征对应的多模态数据作为值(value)存入NoSQL(Not Only SQL)数据库中;从各个类别中分别对图像数据、音频数据、文本数据等多模态数据利用逻辑规则、统计学习方法、深度学习方法提取知识图谱实体、属性和关联关系,然后对属于同一类别的不同格式数据提取到的知识图谱实体、属性和关联关系进行交叉再验证,选出置信度较高的实体、属性、关联关系构建统一表示的知识图谱。
实施例
如上所述,本发明的实施过程如下:
1)获取图像、语音、视频、文本等多模态数据,进行数据初步清洗和处理;
2)训练多模态数据特征提取的神经网络算法模型、建立逻辑规则算法模型;
3)分别对各个格式的多模态数据进行特征抽取;
4)对得到的特征进行统一表示、特征关联分析、特征选择、共性特征选择和数据表征特征的确定,并依据特征分析结果对多模态数据进行初步分类;
5)将表征特征作为索引(Key),对应类别的多模态混合数据作为值(Value)存入NoSQL数据库中;
6)利用逻辑规则方法、统计学习方法和深度学习方法,分别对每个类别中的多模态数据进行实体抽取、属性抽取和关联关系抽取,获取实体、属性和关联关系信息;
7)对从多模态数据中获得的实体、属性和关联关系进行关联分析、交叉验证,获取置信度较高的信息,去掉错误提取的信息或者本身存在错误的信息;
8)基于常规知识图谱构建和统一表示方法,利用置信度较高的实体、属性和关联关系信息搭建多模态数据的统一表示的知识图谱;
9)利用知识推理技术,从已获得的知识图谱中进行知识推理,建立更深层次的实体属性信息以及关联关系,得到拓展后的知识图谱;
10)通过数据特征、表征特征、键值对建立知识图谱和底层数据的对应关系;
11)通过实现基于数据格式的数据拆解和快速检索定位算法,建立知识图谱和底层数据的强关联关系。
综上所述,本发明是一套闭环式完整体系,任意环节的修改均可以通过整体关联响应变化的方式进行迭代升级,适用于多媒体跨媒体数据管理体系、检索体系的搭建实现,高质量跨媒体知识图谱的生成与管理利用和建立多媒体跨媒体数据关联关系以及统一表示方法。

Claims (10)

1.一种知识图谱体系搭建方法,其特征在于:包括以下步骤:
①数据采集:通过接口、爬虫获取多模态数据;
②提取特征:提取多模态数据的特征;
③表征特征:将提取的特征进行统一表示、关联分析、共性选择和粗分类,获取表征特征;
④特征保存:搭建数据库,将表征特征存入数据库中;
⑤获取知识图谱基础:从多模态数据中抽取实体、属性和关联关系,并以各个粗分类类别为基准,获取构建知识图谱的基础;
⑥构建知识图谱:根据知识图谱基础,构建跨模态数据的统一表征的知识图谱。
2.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤①分为以下步骤:
(1.1)通过接口、爬虫获取目标领域相关的多模态数据,包括常规数值数据、文本数据、图像数据、视频数据、语音数据;
(1.2)对获取的多模态数据进行初步的数据清洗、数据处理,并按照数据格式选择合理的方式进行分类储存。
3.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤②分为以下步骤:
(2.1)通过大规模通用数据,结合统计学习、逻辑规则方法,进行多模态数据特征提取的训练,获取深度学习神经网络模型,分别为图像特征提取神经网络模型、视频特征提取神经网络模型、语音特征提取神经网络模型、文本特征提取神经网络模型;
(2.2)通过统计方法获得用于提取多模态数据的特征算法模型;
(2.3)根据步骤(2.1)~(2.2)中的模型,分别提取常规数值数据、文本数据、图像数据、视频数据、语音数据的特征;
(2.4)将提取的特征作为对应数据,进行表示。
4.如权利要求3所述的知识图谱体系搭建方法,其特征在于:所述步骤(2.1)中,通过图像特征提取神经网络模型获取图像数据特征,通过视频特征提取神经网络模型获取视频数据特征,通过语音特征提取神经网络模型获取语音数据特征,通过文本特征提取神经网络模型获取文本数据特征,通过逻辑规则获取常规数值数据特征。
5.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤③分为以下步骤:
(3.1)将提取到的多模态数据的特征利用深度学习技术进行统一表示;
(3.2)利用聚类算法、关联算法、距离算法对表示的各个数据的特征进行分析、分类;
(3.3)从分类中获取各个类别的多模态混合数据特征,并通过统计学习方法、逻辑规则、深度学习方法获取可以粗糙表示的各个类别的共性特征,即表征特征。
6.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤④分为以下步骤:
(4.1)搭建基于NoSQL的数据库;
(4.2)通过多模态数据的特征算法模型,获取各个类别的表征特征作为索引Key,类别包含的多模态数据作为对应的值Value,存入数据库中。
7.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤⑤分为以下步骤:
(5.1)通过统计学习方法、逻辑规则方法、深度学习方法,分别对各个类别中的图像数据、语音数据、文本数据、视频数据进行常规实体抽取、属性抽取、关系抽取分析,获取实体、属性和关联关系;
(5.2)以各个粗分类类别为基准,分别对属于各个类别实体、属性、关联关系进行跨模态的关联分析、交叉验证,去除错误信息,获取置信度高的实体、属性、关联关系信息,作为构建知识图谱的基础。
8.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤⑥分为以下步骤:
(6.1)根据置信度高的实体、属性和关联关系,构建知识图谱,并对知识图谱进行统一表征;
(6.2)对构建的知识图谱进行知识推理研究,建立实体间隐藏的关系图,得到拓展后的知识图谱。
9.如权利要求1所述的知识图谱体系搭建方法,其特征在于:还包括步骤⑦数据拆解定位算法:通过知识图谱和多模态数据的关联,实现数据拆解定位算法。
10.如权利要求1所述的知识图谱体系搭建方法,其特征在于:所述步骤⑦分为以下步骤:
(7.1)通过建立实体、属性和数据特征、表征特征、索引Key之间的关系,将知识图谱和NoSQL数据库中的多模态数据关联进行关联;
(7.2)根据数据特有格式、结合逻辑规则和统计学习、深度学习方法,实现基于数据格式的数据拆解算法,以及数据的快速定位检索算法;
(7.3)结合数据拆解定位算法以及知识图谱和多模态数据的关联关系,建立统一表征知识图谱和底层多模态数据的强关联关系。
CN201811466407.8A 2018-12-03 2018-12-03 一种知识图谱体系搭建方法 Active CN109697233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811466407.8A CN109697233B (zh) 2018-12-03 2018-12-03 一种知识图谱体系搭建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811466407.8A CN109697233B (zh) 2018-12-03 2018-12-03 一种知识图谱体系搭建方法

Publications (2)

Publication Number Publication Date
CN109697233A true CN109697233A (zh) 2019-04-30
CN109697233B CN109697233B (zh) 2023-06-20

Family

ID=66230287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811466407.8A Active CN109697233B (zh) 2018-12-03 2018-12-03 一种知识图谱体系搭建方法

Country Status (1)

Country Link
CN (1) CN109697233B (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399497A (zh) * 2019-07-02 2019-11-01 厦门美域中央信息科技有限公司 一种基于深度学习技术的知识图谱自适应构建方法
CN110532404A (zh) * 2019-09-03 2019-12-03 北京百度网讯科技有限公司 一种源多媒体确定方法、装置、设备及存储介质
CN110569372A (zh) * 2019-09-20 2019-12-13 四川大学 一种心脏病大数据知识图谱系统的构建方法
CN110674312A (zh) * 2019-09-18 2020-01-10 泰康保险集团股份有限公司 构建知识图谱方法、装置、介质及电子设备
CN110738982A (zh) * 2019-10-22 2020-01-31 珠海格力电器股份有限公司 一种请求处理方法、装置及电子设备
CN110879843A (zh) * 2019-08-06 2020-03-13 上海孚典智能科技有限公司 基于机器学习的自适应知识图谱技术
CN111026894A (zh) * 2019-12-12 2020-04-17 清华大学 基于可信度自适应匹配网络的跨模态图像文本检索方法
CN111046112A (zh) * 2019-11-22 2020-04-21 精硕科技(北京)股份有限公司 品类知识图谱展示方法、装置和电子设备
CN111221984A (zh) * 2020-01-15 2020-06-02 北京百度网讯科技有限公司 多模态内容处理方法、装置、设备及存储介质
CN111291194A (zh) * 2020-01-20 2020-06-16 深圳供电局有限公司 自动化存储以及知识图谱生成方法及装置
CN111309925A (zh) * 2020-02-10 2020-06-19 同方知网(北京)技术有限公司 一种军事装备的知识图谱构建方法
CN111401259A (zh) * 2020-03-18 2020-07-10 南京星火技术有限公司 模型训练方法、系统、计算机可读介质和电子设备
CN111400428A (zh) * 2020-02-17 2020-07-10 浙江创课网络科技有限公司 一种知识图谱体系搭建方法
CN111414959A (zh) * 2020-03-18 2020-07-14 南京星火技术有限公司 图像识别方法、装置、计算机可读介质和电子设备
CN111462841A (zh) * 2020-03-12 2020-07-28 华南理工大学 一种基于知识图谱的抑郁症智能诊断装置及系统
CN112069326A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 知识图谱的构建方法、装置、电子设备及存储介质
CN112288091A (zh) * 2020-10-30 2021-01-29 西南电子技术研究所(中国电子科技集团公司第十研究所) 基于多模态知识图谱的知识推理方法
CN112287122A (zh) * 2020-11-11 2021-01-29 济南浪潮高新科技投资发展有限公司 一种基于多模态的跨媒体知识抽取方法
CN112527915A (zh) * 2020-11-17 2021-03-19 北京科技大学 线性文化遗产知识图谱构建方法、系统、计算设备和介质
CN112559758A (zh) * 2020-11-30 2021-03-26 北京百度网讯科技有限公司 构建知识图谱的方法、装置、设备和计算机可读存储介质
CN112712056A (zh) * 2021-01-14 2021-04-27 珠海格力电器股份有限公司 视频语义分析方法、装置、存储介质及电子设备
CN112948508A (zh) * 2021-04-15 2021-06-11 平安科技(深圳)有限公司 基于多层关联知识图谱的信息预测方法、装置、设备及介质
CN112967226A (zh) * 2021-01-29 2021-06-15 绍兴隆芙力智能科技发展有限公司 一种基于人工智能的高反光制品检测系统、方法及介质
CN112967225A (zh) * 2021-01-29 2021-06-15 绍兴隆芙力智能科技发展有限公司 一种基于人工智能的自动检测系统、方法、设备及介质
CN114781642A (zh) * 2022-06-17 2022-07-22 之江实验室 一种跨媒体对应知识的生成方法和装置
CN115409075A (zh) * 2022-11-03 2022-11-29 成都中科合迅科技有限公司 一种基于无线信号分析的特征分析系统
CN116701643A (zh) * 2022-12-15 2023-09-05 重庆交通大学 基于社会传感数据的人群出行行为解析方法及存储介质
CN117371533A (zh) * 2023-11-01 2024-01-09 深圳市马博士网络科技有限公司 一种生成数据标签规则的方法及装置
WO2024016695A1 (zh) * 2022-07-22 2024-01-25 山东浪潮科学研究院有限公司 基于多视图学习的教学知识图谱构建及检索方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136249A (zh) * 2011-11-30 2013-06-05 北京航天长峰科技工业集团有限公司 多模态异构数据整合系统及方法
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索系统
WO2017176100A1 (en) * 2016-04-08 2017-10-12 Samsung Electronics Co., Ltd. Method and device for translating object information and acquiring derivative information
CN107679110A (zh) * 2017-09-15 2018-02-09 广州唯品会研究院有限公司 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN107808145A (zh) * 2017-11-13 2018-03-16 河南大学 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统
CN108875051A (zh) * 2018-06-28 2018-11-23 中译语通科技股份有限公司 面向海量非结构化文本的知识图谱自动构建方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136249A (zh) * 2011-11-30 2013-06-05 北京航天长峰科技工业集团有限公司 多模态异构数据整合系统及方法
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索系统
WO2017176100A1 (en) * 2016-04-08 2017-10-12 Samsung Electronics Co., Ltd. Method and device for translating object information and acquiring derivative information
CN107679110A (zh) * 2017-09-15 2018-02-09 广州唯品会研究院有限公司 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN107808145A (zh) * 2017-11-13 2018-03-16 河南大学 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统
CN108875051A (zh) * 2018-06-28 2018-11-23 中译语通科技股份有限公司 面向海量非结构化文本的知识图谱自动构建方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱木易洁等: "知识图谱发展与构建的研究进展", 《南京信息工程大学学报(自然科学版)》 *
欧艳鹏: "知识图谱技术研究综述", 《电子世界》 *

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399497A (zh) * 2019-07-02 2019-11-01 厦门美域中央信息科技有限公司 一种基于深度学习技术的知识图谱自适应构建方法
CN110879843A (zh) * 2019-08-06 2020-03-13 上海孚典智能科技有限公司 基于机器学习的自适应知识图谱技术
CN110532404A (zh) * 2019-09-03 2019-12-03 北京百度网讯科技有限公司 一种源多媒体确定方法、装置、设备及存储介质
CN110532404B (zh) * 2019-09-03 2023-08-04 北京百度网讯科技有限公司 一种源多媒体确定方法、装置、设备及存储介质
CN110674312B (zh) * 2019-09-18 2022-05-17 泰康保险集团股份有限公司 构建知识图谱方法、装置、介质及电子设备
CN110674312A (zh) * 2019-09-18 2020-01-10 泰康保险集团股份有限公司 构建知识图谱方法、装置、介质及电子设备
CN110569372A (zh) * 2019-09-20 2019-12-13 四川大学 一种心脏病大数据知识图谱系统的构建方法
CN110738982A (zh) * 2019-10-22 2020-01-31 珠海格力电器股份有限公司 一种请求处理方法、装置及电子设备
CN111046112A (zh) * 2019-11-22 2020-04-21 精硕科技(北京)股份有限公司 品类知识图谱展示方法、装置和电子设备
CN111026894B (zh) * 2019-12-12 2021-11-26 清华大学 基于可信度自适应匹配网络的跨模态图像文本检索方法
CN111026894A (zh) * 2019-12-12 2020-04-17 清华大学 基于可信度自适应匹配网络的跨模态图像文本检索方法
CN111221984B (zh) * 2020-01-15 2024-03-01 北京百度网讯科技有限公司 多模态内容处理方法、装置、设备及存储介质
CN111221984A (zh) * 2020-01-15 2020-06-02 北京百度网讯科技有限公司 多模态内容处理方法、装置、设备及存储介质
CN111291194A (zh) * 2020-01-20 2020-06-16 深圳供电局有限公司 自动化存储以及知识图谱生成方法及装置
CN111309925A (zh) * 2020-02-10 2020-06-19 同方知网(北京)技术有限公司 一种军事装备的知识图谱构建方法
CN111309925B (zh) * 2020-02-10 2023-06-30 同方知网数字出版技术股份有限公司 一种军事装备的知识图谱构建方法
CN111400428A (zh) * 2020-02-17 2020-07-10 浙江创课网络科技有限公司 一种知识图谱体系搭建方法
CN111400428B (zh) * 2020-02-17 2023-08-25 河南新世纪拓普电子技术有限公司 一种知识图谱体系搭建方法
CN111462841A (zh) * 2020-03-12 2020-07-28 华南理工大学 一种基于知识图谱的抑郁症智能诊断装置及系统
CN111414959B (zh) * 2020-03-18 2024-02-02 南京星火技术有限公司 图像识别方法、装置、计算机可读介质和电子设备
CN111401259B (zh) * 2020-03-18 2024-02-02 南京星火技术有限公司 模型训练方法、系统、计算机可读介质和电子设备
CN111414959A (zh) * 2020-03-18 2020-07-14 南京星火技术有限公司 图像识别方法、装置、计算机可读介质和电子设备
CN111401259A (zh) * 2020-03-18 2020-07-10 南京星火技术有限公司 模型训练方法、系统、计算机可读介质和电子设备
CN112069326A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 知识图谱的构建方法、装置、电子设备及存储介质
CN112288091B (zh) * 2020-10-30 2023-03-21 西南电子技术研究所(中国电子科技集团公司第十研究所) 基于多模态知识图谱的知识推理方法
CN112288091A (zh) * 2020-10-30 2021-01-29 西南电子技术研究所(中国电子科技集团公司第十研究所) 基于多模态知识图谱的知识推理方法
CN112287122A (zh) * 2020-11-11 2021-01-29 济南浪潮高新科技投资发展有限公司 一种基于多模态的跨媒体知识抽取方法
CN112527915B (zh) * 2020-11-17 2021-08-27 北京科技大学 线性文化遗产知识图谱构建方法、系统、计算设备和介质
CN112527915A (zh) * 2020-11-17 2021-03-19 北京科技大学 线性文化遗产知识图谱构建方法、系统、计算设备和介质
CN112559758A (zh) * 2020-11-30 2021-03-26 北京百度网讯科技有限公司 构建知识图谱的方法、装置、设备和计算机可读存储介质
CN112712056A (zh) * 2021-01-14 2021-04-27 珠海格力电器股份有限公司 视频语义分析方法、装置、存储介质及电子设备
CN112967226A (zh) * 2021-01-29 2021-06-15 绍兴隆芙力智能科技发展有限公司 一种基于人工智能的高反光制品检测系统、方法及介质
CN112967225A (zh) * 2021-01-29 2021-06-15 绍兴隆芙力智能科技发展有限公司 一种基于人工智能的自动检测系统、方法、设备及介质
CN112948508A (zh) * 2021-04-15 2021-06-11 平安科技(深圳)有限公司 基于多层关联知识图谱的信息预测方法、装置、设备及介质
CN112948508B (zh) * 2021-04-15 2024-04-30 平安科技(深圳)有限公司 基于多层关联知识图谱的信息预测方法、装置、设备及介质
CN114781642B (zh) * 2022-06-17 2022-09-23 之江实验室 一种跨媒体对应知识的生成方法和装置
CN114781642A (zh) * 2022-06-17 2022-07-22 之江实验室 一种跨媒体对应知识的生成方法和装置
WO2024016695A1 (zh) * 2022-07-22 2024-01-25 山东浪潮科学研究院有限公司 基于多视图学习的教学知识图谱构建及检索方法及系统
CN115409075A (zh) * 2022-11-03 2022-11-29 成都中科合迅科技有限公司 一种基于无线信号分析的特征分析系统
CN116701643A (zh) * 2022-12-15 2023-09-05 重庆交通大学 基于社会传感数据的人群出行行为解析方法及存储介质
CN117371533A (zh) * 2023-11-01 2024-01-09 深圳市马博士网络科技有限公司 一种生成数据标签规则的方法及装置

Also Published As

Publication number Publication date
CN109697233B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
CN109697233A (zh) 一种知识图谱体系搭建方法
CN110825882B (zh) 一种基于知识图谱的信息系统管理方法
CN107766371B (zh) 一种文本信息分类方法及其装置
CN104182517B (zh) 数据处理的方法及装置
CN102662930B (zh) 一种语料标注方法及装置
CN109658271A (zh) 一种基于保险专业场景的智能客服系统及方法
CN107273295B (zh) 一种基于文本混乱度的软件问题报告分类方法
CN108763212A (zh) 一种地址信息提取方法及装置
CN106022708A (zh) 一种预测员工离职的方法
CN107193962A (zh) 一种互联网推广信息的智能配图方法及装置
CN111191099B (zh) 一种基于社交媒体的用户活动类型识别方法
CN112069327B (zh) 一种在线教育课堂教学资源的知识图谱构建方法及系统
CN110321549B (zh) 基于序列化学习、关系挖掘、时序分析的新概念挖掘方法
CN107357785A (zh) 主题特征词抽取方法及系统、情感极性判断方法及系统
CN105550375A (zh) 一种异构数据的整合方法及系统
CN107247739A (zh) 一种基于因子图的金融公报文本知识提取方法
CN108829810A (zh) 面向健康舆情的文本分类方法
CN113190593A (zh) 一种基于数字人文知识图谱的搜索推荐方法
CN103473308B (zh) 基于最大间隔张量学习的高维多媒体数据分类方法
CN110377752A (zh) 一种应用于政务大厅运营的知识库系统
Li et al. Event extraction for criminal legal text
CN112582073B (zh) 医疗信息获取方法、装置、电子设备和介质
CN116881430B (zh) 一种产业链识别方法、装置、电子设备及可读存储介质
CN112363996B (zh) 用于建立电网知识图谱的物理模型的方法及系统和介质
CN116402166B (zh) 一种预测模型的训练方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant