CN111813974A - 一种基于图像语义分析的自适应实践系统 - Google Patents

一种基于图像语义分析的自适应实践系统 Download PDF

Info

Publication number
CN111813974A
CN111813974A CN202010653520.8A CN202010653520A CN111813974A CN 111813974 A CN111813974 A CN 111813974A CN 202010653520 A CN202010653520 A CN 202010653520A CN 111813974 A CN111813974 A CN 111813974A
Authority
CN
China
Prior art keywords
knowledge
image
semantic
image semantic
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010653520.8A
Other languages
English (en)
Inventor
於玲玲
王银玲
伍银河
何波
吕州
张璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Duomi Education Technology Co ltd
Original Assignee
Guangzhou Duomi Education Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Duomi Education Technology Co ltd filed Critical Guangzhou Duomi Education Technology Co ltd
Priority to CN202010653520.8A priority Critical patent/CN111813974A/zh
Publication of CN111813974A publication Critical patent/CN111813974A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及图像技术领域,尤其为一种基于图像语义分析的自适应实践系统,包括基于知识图谱的图像语义分析流程、基于深度表达模型的图像结构化语义信息抽取技术,所述基于知识图谱的图像语义分析流程包括数据获取、信息抽取、知识融合加工、知识储存、知识应用和可视化结果,所述基于深度表达模型的图像结构化语义信息抽取技术包括图像语义层次描述、实体抽取、关系和属性抽取,所述图像语义知识融合和加工技术包括知识合并、本体构建、知识演化推理,所述图像知识图谱包括语义检索、语义关联分析、知识可视化,基于知识图谱技术实现的图像语义分析可以使人们更便捷、准确地获取到自己所需要的图像语义信息并增强对图像的理解。

Description

一种基于图像语义分析的自适应实践系统
技术领域
本发明涉及图像技术领域,具体为一种基于图像语义分析的自适应实践系统。
背景技术
图像作为一种内容丰富、表现直观的媒体信息,越来越受到人们的青睐,如何有效地描述和检索这些图像信息成为研究者们所关心的热点问题。尤其是随着近几年深度学习技术的日趋完善,传统的计算机视觉任务得到了前所未有的发展,提升了图像信息提取的能力。然而图像语义理解和语义分析等研究领域还停留在传统的图像信息抽取和图像标注技术上。
由于知识是对信息的进一步组织和抽象,符合人类活动的语义和逻辑。知识图谱技术在增进信息的组织、管理和理解领域具有巨大的应用潜力,是对图像视觉语义理解的一个行之有效的途径。相对于信息,知识能更直接地指导人的决策和行动,因此提出一种基于图像语义分析的自适应实践系统。
发明内容
本发明的目的在于提供一种基于图像语义分析的自适应实践系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于图像语义分析的自适应实践系统,包括基于知识图谱的图像语义分析流程、基于深度表达模型的图像结构化语义信息抽取技术、图像语义知识融合和加工技术、图像知识图谱,所述基于知识图谱的图像语义分析流程包括数据获取、信息抽取、知识融合加工、知识储存、知识应用和可视化结果,所述基于深度表达模型的图像结构化语义信息抽取技术包括图像语义层次描述、实体抽取、关系和属性抽取,所述图像语义知识融合和加工技术包括知识合并、本体构建、知识演化推理,所述图像知识图谱包括语义检索、语义关联分析、知识可视化。
优选的,所述图像语义层次描述包括四个层次,第一层关注整体感官信息;第二层从整体转移至局部;第三层聚焦于实体的关系和属性;第四层是整体语义的回归。
优选的,所述图像语义层次描述采用融合结构化语义的深度表达模型,即CNN-RNN的混合神经网络图像语义表达,该网络包含了2个相互连接的神经网络结构,底层是深度卷积神经网络(CNN),上层是递归神经网络(RNN)。
优选的,所述关系和属性抽取采用基于词法模式的原理根据语句构成成分之间的语义关系来预测语句整体的意义或共现分析方法。
优选的,所述知识合并采用自动抽取同义关系的机器学习算法。
优选的,所述语义检索包含两类核心任务:一是利用相关性在知识库中找到相应的实体;二是在此基础上根据实体的类别、关系及相关性等信息找到关联的实体。
优选的,所述知识可视化采用可视化软件Citespace。
与现有技术相比,本发明的有益效果是:
本发明中,通过可视化软件Citespace为知识图谱研究提供了极大的便利,CNN模型能够生成具有判别能力的图像特征表达,被广泛地应用于图像分类与物体识别任务中,因此将其用作物体类别的表达学习;RNN模型则被一系列工作证明能够对图像或者自然语言中的结构化组合关系进行预测,基于知识图谱技术实现的图像语义分析可以使人们更便捷、准确地获取到自己所需要的图像语义信息并增强对图像的理解。
附图说明
图1为本发明基于知识图谱的图像语义分析流程图;
图2为本发明图像语义层次框架图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供一种技术方案:
一种基于图像语义分析的自适应实践系统,包括基于知识图谱的图像语义分析流程、基于深度表达模型的图像结构化语义信息抽取技术、图像语义知识融合和加工技术、图像知识图谱,基于知识图谱的图像语义分析流程包括数据获取、信息抽取、知识融合加工、知识储存、知识应用和可视化结果,基于深度表达模型的图像结构化语义信息抽取技术包括图像语义层次描述、实体抽取、关系和属性抽取,图像语义知识融合和加工技术包括知识合并、本体构建、知识演化推理,图像知识图谱包括语义检索、语义关联分析、知识可视化。
图像语义层次描述包括四个层次,第一层关注整体感官信息;第二层从整体转移至局部;第三层聚焦于实体的关系和属性;第四层是整体语义的回归。
图像语义层次描述采用融合结构化语义的深度表达模型,即CNN-RNN的混合神经网络图像语义表达,该网络包含了2个相互连接的神经网络结构,底层是深度卷积神经网络(CNN),上层是递归神经网络(RNN)。
关系和属性抽取采用基于词法模式的原理根据语句构成成分之间的语义关系来预测语句整体的意义或共现分析方法。
知识合并采用自动抽取同义关系的机器学习算法。
语义检索包含两类核心任务:一是利用相关性在知识库中找到相应的实体;二是在此基础上根据实体的类别、关系及相关性等信息找到关联的实体。
实施例:基于知识图谱的图像语义分析流程包括数据获取、信息抽取、知识融合加工、知识储存、知识应用和可视化结果,图像数据获取是采集原始的图像数据,即可以包含结构化数据,如标注文本等信息,也可以包含半结构化和非结构化的图像特征信息等;图像的信息抽取是将图像数据进行抽象归纳为更具有语义特点的单元,例如实体抽取、实体之间的关系抽取以及实体的属性抽取等,为后续的知识提取做铺垫;图像的知识融合和加工是在图像信息抽取的基础上将信息升级为知识,例如具有相同表达但不同信息的实体消岐、具有相同意思但不同表达的知识合并、对知识进行概念归纳的本体构建以及丰富语义内涵的知识推理;图像的知识存储是利用知识图谱的三元组表达方式,结合前面两步获取的知识,将其存储在数据库中并进行知识更新;可视化结果则是利用知识图谱的可视化工具将图像的知识图像语义分析记过以网状可视化方式直观的展现出图像知识组成;
基于深度表达模型的图像结构化语义信息抽取技术包括图像语义层次描述、实体抽取、关系和属性抽取,
图像信息抽取是通过一定的方法将图像中的每个像素分为不同的语义类别,最终得到不同的实体、关系、属性等信息。
(1)图像语义层次描述:该框架主要包括四个层次,第一层关注整体感官信息,着重描述图像中整体的基础特征。例如,图像的纹理、色彩、形状、空间分布;第二层从整体转移至局部,开始关注图像中的实体与场景。实体的判断主要包括人物、动物、物体等。场景的信息抽取是交代图像整体的语义背景,同时提供依赖情境,是增加图像纵向关联不可缺少的基础数据,第三层聚焦于实体的关系和属性上,主要是识别其与其他实体之间的交互位置关系,交互位置是立足于实体相对位置的描述,判断实体关系及实体交互位置关系是图像语义关联中的重要组成部分,实体的属性是描述实体包含的具体参数,例如种类、大小、颜色等信息,识别在该情境下各个实体的内涵,最后建立在属性与交互位置关系之上的行为交互语义。充分挖掘实体之间的横向关联和纵向关联;第四层是一种整体语义的回归,是判断完所有局部和聚焦信息后的语义概括,是全部对象行为的语义整合。
)图像语义层次描述采用融合结构化语义的深度表达模型,即CNN-RNN的混合神经网络图像语义表达,该模型把一系列带有结构的语法知识融入到深度表达学习中,借助递归神经网络的特性对图像中的物体、物体间的关系等进行结构化的组合与表达,最终模型实现图像的深度层次化语义解析,该网络包含了2个相互连接的神经网络结构,底层是深度卷积神经网络(CNN),上层是递归神经网络(RNN),在CNN-RNN混合模型中、CNN模型和RNN模型将协同工作。
(3)关系和属性抽取:在CNN-RNN混合模型中,RNN模型将利用CNN模型所输出的每个语义类别的特征表达来生成图像的解析树,从而对图像进行内容上的分层表达,同时预测语义实体之间的交互关系。这里的RNN模型包含5个子网络,分别是中间转换网络、节点合并网络、语义解释网络、关系分类网络和合并分数网络。
图像语义知识融合和加工技术包括知识合并、本体构建、知识演化推理;
(1)知识合并:采用自动抽取同义关系的机器学习算法进行进行实体对齐与消歧;
(2)本体构建:采用形式概念分析和Word2vec神经网络工具,结合结构化和非结构化资源,利用结构化资源概念层次明确、非结构化资源语义丰富以及容易获取的特点;
(3)知识演化推理:知识推理包含对实体属性的推理和对实体关系的推理。实体属性的推理主要是对会发生变化的实体属性值进行实时发现、推理、更新或者为实体创建新的属性;实体之间关系的推理是对实体之间潜在的关系进行推断和扩充。知识的推理方法可以分为基于逻辑的推理和基于图的推理。基于逻辑的推理主要包括一阶谓词逻辑、描述逻辑以及基于规则的推理,推理规则包含针对实体属性的规则和针对实体关系的规则;基于图的推理方法主要有基于神经网络模型或路径规划算法。
图像知识图谱包括语义检索、语义关联分析、知识可视化
(1)语义检索包含两类核心任务:一是利用相关性在知识库中找到相应的实体;二是在此基础上根据实体的类别、关系及相关性等信息找到关联的实体;
(2)语义关联分析的基本任务是根据主题、形式、自然属性、社会属性等,链接具有相似语义信息的图像等视觉媒体。在各种跨媒体关联类型中最关键的是关联数据模型。传统的数据模型着重解决的是数据个体的存储组织与管理问题,而关联数据模型不仅要能够存储组织和管理非结构化媒体数据,还要能够存储组织和管理媒体数据之间的逻辑关联,能够存储组织和管理每个媒体数据的多维属性以及每个关联的多维属性,能够反映跨媒体数据及其关联的时空属性、语义涵义、权重、概率等特性。知识图谱为基础构建数据模型,能够更好地实现传统数据模型所不能支持的多种智能分析,时空关联分析、逻辑关联分析、语义相似性搜索、数据世系管理与分析、数据溯源与核查等,提升多媒体信息之间关联分析能力。
(3)知识可视化采用可视化软件Citespace,知识图谱可视化将知识库中的信息转化为更方便用户理解的方式进行呈现,用户可以一目了然地了解到他需要的知识;同时提供了更加丰富的文本信息,增加了更多的用户交互元素,提升用户体验,引导用户在短时间内获取到更多的知识。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (7)

1.一种基于图像语义分析的自适应实践系统,包括基于知识图谱的图像语义分析流程、基于深度表达模型的图像结构化语义信息抽取技术、图像语义知识融合和加工技术、图像知识图谱,其特征在于:所述基于知识图谱的图像语义分析流程包括数据获取、信息抽取、知识融合加工、知识储存、知识应用和可视化结果,所述基于深度表达模型的图像结构化语义信息抽取技术包括图像语义层次描述、实体抽取、关系和属性抽取,所述图像语义知识融合和加工技术包括知识合并、本体构建、知识演化推理,所述图像知识图谱包括语义检索、语义关联分析、知识可视化。
2.根据权利要求1所述的一种基于图像语义分析的自适应实践系统,其特征在于:所述图像语义层次描述包括四个层次,第一层关注整体感官信息;第二层从整体转移至局部;第三层聚焦于实体的关系和属性;第四层是整体语义的回归。
3.根据权利要求1所述的一种基于图像语义分析的自适应实践系统,其特征在于:所述图像语义层次描述采用融合结构化语义的深度表达模型,即CNN-RNN的混合神经网络图像语义表达,该网络包含了2个相互连接的神经网络结构,底层是深度卷积神经网络(CNN),上层是递归神经网络(RNN)。
4.根据权利要求1所述的一种基于图像语义分析的自适应实践系统,其特征在于:所述关系和属性抽取采用基于词法模式的原理根据语句构成成分之间的语义关系来预测语句整体的意义或共现分析方法。
5.根据权利要求1所述的一种基于图像语义分析的自适应实践系统,其特征在于:所述知识合并采用自动抽取同义关系的机器学习算法。
6.根据权利要求1所述的一种基于图像语义分析的自适应实践系统,其特征在于:所述语义检索包含两类核心任务:一是利用相关性在知识库中找到相应的实体;二是在此基础上根据实体的类别、关系及相关性等信息找到关联的实体。
7.根据权利要求1所述的一种基于图像语义分析的自适应实践系统,其特征在于:所述知识可视化采用可视化软件Citespace。
CN202010653520.8A 2020-07-08 2020-07-08 一种基于图像语义分析的自适应实践系统 Withdrawn CN111813974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010653520.8A CN111813974A (zh) 2020-07-08 2020-07-08 一种基于图像语义分析的自适应实践系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010653520.8A CN111813974A (zh) 2020-07-08 2020-07-08 一种基于图像语义分析的自适应实践系统

Publications (1)

Publication Number Publication Date
CN111813974A true CN111813974A (zh) 2020-10-23

Family

ID=72843447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010653520.8A Withdrawn CN111813974A (zh) 2020-07-08 2020-07-08 一种基于图像语义分析的自适应实践系统

Country Status (1)

Country Link
CN (1) CN111813974A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215441A (zh) * 2020-11-17 2021-01-12 北京明略软件系统有限公司 预测模型训练方法及系统
CN112732969A (zh) * 2021-01-14 2021-04-30 珠海格力电器股份有限公司 图像语义分析方法、装置、存储介质及电子设备
CN113129419A (zh) * 2021-04-27 2021-07-16 南昌虚拟现实研究院股份有限公司 基于语义的智能视觉交互方法及系统
CN113315972A (zh) * 2021-05-19 2021-08-27 西安电子科技大学 基于层级知识表达的视频语义通信方法及系统
CN114548408A (zh) * 2022-01-11 2022-05-27 北京航天动力研究所 一种氢氧发动机知识推理方法
CN115168650A (zh) * 2022-09-07 2022-10-11 杭州笔声智能科技有限公司 一种会议视频检索方法、装置及存储介质
CN116701357A (zh) * 2023-06-15 2023-09-05 深圳市象无形信息科技有限公司 基于语义网络的ifc数据管理方法及装置
CN117011814A (zh) * 2023-10-07 2023-11-07 山东铁路投资控股集团有限公司 一种铁路站场线路结构数据提取方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215441A (zh) * 2020-11-17 2021-01-12 北京明略软件系统有限公司 预测模型训练方法及系统
CN112732969A (zh) * 2021-01-14 2021-04-30 珠海格力电器股份有限公司 图像语义分析方法、装置、存储介质及电子设备
CN113129419A (zh) * 2021-04-27 2021-07-16 南昌虚拟现实研究院股份有限公司 基于语义的智能视觉交互方法及系统
CN113129419B (zh) * 2021-04-27 2023-06-20 南昌虚拟现实研究院股份有限公司 基于语义的智能视觉交互方法及系统
CN113315972A (zh) * 2021-05-19 2021-08-27 西安电子科技大学 基于层级知识表达的视频语义通信方法及系统
CN113315972B (zh) * 2021-05-19 2022-04-19 西安电子科技大学 基于层级知识表达的视频语义通信方法及系统
CN114548408A (zh) * 2022-01-11 2022-05-27 北京航天动力研究所 一种氢氧发动机知识推理方法
CN115168650A (zh) * 2022-09-07 2022-10-11 杭州笔声智能科技有限公司 一种会议视频检索方法、装置及存储介质
CN116701357A (zh) * 2023-06-15 2023-09-05 深圳市象无形信息科技有限公司 基于语义网络的ifc数据管理方法及装置
CN117011814A (zh) * 2023-10-07 2023-11-07 山东铁路投资控股集团有限公司 一种铁路站场线路结构数据提取方法及系统
CN117011814B (zh) * 2023-10-07 2023-12-15 山东铁路投资控股集团有限公司 一种铁路站场线路结构数据提取方法及系统

Similar Documents

Publication Publication Date Title
CN111813974A (zh) 一种基于图像语义分析的自适应实践系统
CN111428053A (zh) 一种面向税务领域知识图谱的构建方法
RU2662688C1 (ru) Извлечение информации из смысловых блоков документов с использованием микромоделей на базе онтологии
WO2019137033A1 (zh) 面向软件缺陷的领域知识图谱自动化构建方法
Rahwan et al. Representing and classifying arguments on the semantic web
CN106919689A (zh) 基于术语释义知识单元的专业领域知识图谱动态构建方法
Guo et al. LD-MAN: Layout-driven multimodal attention network for online news sentiment recognition
CN113673943B (zh) 一种基于履历大数据的人员任免辅助决策方法及系统
CN109145168A (zh) 一种专家服务机器人云平台
CN110427478A (zh) 一种基于知识图谱的问答搜索方法及系统
Wątróbski Ontology learning methods from text-an extensive knowledge-based approach
CN108305306B (zh) 一种基于草图交互的动画数据组织方法
Hao et al. Semantic patterns for user‐interactive question answering
Balasubramaniam Hybrid fuzzy-ontology design using FCA based clustering for information retrieval in semantic web
CN114911893A (zh) 基于知识图谱的自动化构建知识库的方法及系统
CN117473054A (zh) 基于知识图谱的通用智能问答方法及装置
Goyal et al. A Review on Different Content Based Image Retrieval Techniques Using High Level Semantic Feature
Santosh et al. PROO ontology development for learning feature specific sentiment relationship rules on reviews categorisation: a semantic data mining approach
Varnaseri et al. A Knowledge Map of Knowledge Engineering Scientific Products from 2011 to 2021 on Web of Science: Scientometrics
Jiang et al. Personalized recommendation method of E-commerce based on fusion technology of smart ontology and big data mining
CN110543468A (zh) 一种用于公共安全领域大数据知识库的自动化构建方法
Liu et al. PinterNet: A thematic label curation tool for large image datasets
Hu et al. Construction of domain knowledge graph based on open source intelligence
Chen et al. Ontology-driven extraction of enterprise competitive intelligence in the Internet
Faber et al. From specialized knowledge frames to linguistically based ontologies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201023