CN109408646A - 富媒体知识本体构建方法、装置及电子设备 - Google Patents

富媒体知识本体构建方法、装置及电子设备 Download PDF

Info

Publication number
CN109408646A
CN109408646A CN201811192045.8A CN201811192045A CN109408646A CN 109408646 A CN109408646 A CN 109408646A CN 201811192045 A CN201811192045 A CN 201811192045A CN 109408646 A CN109408646 A CN 109408646A
Authority
CN
China
Prior art keywords
rich media
resource
module
element information
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811192045.8A
Other languages
English (en)
Inventor
王力
姚长青
张运良
李琳娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INSTITUTE OF SCIENCE AND TECHNOLOGY INFORMATION OF CHINA
Original Assignee
INSTITUTE OF SCIENCE AND TECHNOLOGY INFORMATION OF CHINA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INSTITUTE OF SCIENCE AND TECHNOLOGY INFORMATION OF CHINA filed Critical INSTITUTE OF SCIENCE AND TECHNOLOGY INFORMATION OF CHINA
Priority to CN201811192045.8A priority Critical patent/CN109408646A/zh
Publication of CN109408646A publication Critical patent/CN109408646A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及多媒体处理技术领域,公开了一种富媒体知识本体构建方法、装置、电子设备及计算机可读存储介质,其中,富媒体知识本体构建方法包括:对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息;接着确定富媒体元素信息是否满足预定条件;接着如果满足预定条件,则基于富媒体资源构建富媒体知识本体。本申请实施例的方法,构建出能够让计算机理解和处理的富媒体知识本体,而且在构建过程中设置的阈值判断环节,具有对富媒体资源进行筛选的作用,可为每个领域的富媒体资源实现知识本体构建,满足了多领域构建的社会需求,相对于传统的人工构建方法,可以很大程度上节省人力、物力和财力。

Description

富媒体知识本体构建方法、装置及电子设备
技术领域
本申请涉及多媒体处理技术领域,具体而言,本申请涉及一种富媒体知识本体构建方法、装置及电子设备。
背景技术
本体是特定领域范围的一个概念诠释,它使得该领域的术语形成了一个知识体系,能表达相应的语义逻辑并可用于推理。同时它作为一套大多数人认同的,关于概念体系的明确的、形式化的规范说明,具有良好的概念层次结构和对逻辑推理的支持,在结构化描述和知识检索中有着广泛应用。任何一个本体结构至少包含三部分内容:概念、概念的属性以及关系。本体解决了资源集合的相互关系问题。用本体来描述富媒体,也是增加机器对富媒体的可读性,自动地抽取和聚合不局限于文本类数据的语义信息。抽取的语义元数据可用于富媒体内容的分类、索引和检索,为更有效的富媒体资源发现、交换、自动集成、重用和共享铺平道路。
在本体构建方法研究上,目前主要有两种:一种是依靠本体专家手工构建,包括骨架法、TOVE法、IDEF-5法以及Methontology法;另一种是在机器学习方法的帮助下采用自动或半自动的方法进行构建,主要包括七步法、五步循环法以及循环获取法。
现有的本体构建方法较为传统和局限,同时具有或纯定性或纯定量的两极化特点,并不适用于具有交叉学科特征的知识资源领域。其中,富媒体主要应用在传媒和出版行业,这是一个包含人文科学和自然科学两个要素的交叉领域,单一地依靠专家经验或采用智能算法的方法构建该领域本体,并不具备科学性,达不到实用要求。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特提出以下技术方案:
第一方面,提供了一种富媒体知识本体构建方法,包括:
对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息;
确定富媒体元素信息是否满足预定条件;
如果满足预定条件,则基于富媒体资源构建富媒体知识本体。
具体地,对获取到的富媒体资源进行相应的元素信息提取,包括:
通过移动设备模块对富媒体资源进行提取,得到相应的移动设备元素信息;
通过传感器模块对富媒体资源进行提取,提取相应的传感器元素信息;
通过大数据平台模块对富媒体资源进行提取,提取相应的大数据平台元素信息;
通过全球定位系统GPS模块对富媒体资源进行提取,提取相应的GPS元素信息;
通过社交媒体模块对富媒体资源进行提取,提取相应的社交媒体元素信息。
进一步地,移动设备元素信息包括移动设备概念、移动设备属性及移动设备关系信息;
传感器元素信息包括传感器概念、传感器属性及传感器关系信息;
大数据平台元素信息包括大数据平台概念、大数据平台属性及大数据平台关系信息;
GPS元素信息包括GPS概念、GPS属性及GPS关系信息。
进一步地,确定富媒体元素信息是否满足预定条件,包括:
检测富媒体元素信息是否包括移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息;
如果包括,则确定富媒体元素信息满足预定条件。
进一步地,在基于富媒体资源构建富媒体知识本体之前,还包括:
根据移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息,构建场景模块。
进一步地,基于富媒体资源构建富媒体知识本体,包括:
通过对富媒体资源进行内容模块的构建,得到相应的等级关系和/或非等级关系;
通过对富媒体资源进行内容管理模块的构建,得到富媒体资源的管理信息本体;
通过对富媒体资源在概念上进行内容结构化模块的构建,来对富媒体资源片段化或内容特征进行属性提取;
通过对富媒体资源在语义关系上进行本体构建,以提取富媒体资源中相应的对象、事件以及语义层面上的时间信息与空间信息。
第二方面,提供了一种富媒体知识本体构建装置,包括:
提取模块,用于对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息;
确定模块,用于确定富媒体元素信息是否满足预定条件;
构建模块,用于当富媒体元素信息满足预定条件时,基于富媒体资源构建富媒体知识本体。
具体地,提取模块包括第一元素提取子模块、第二元素提取子模块、第三元素提取子模块、第四元素提取子模块与第五元素提取子模块;
第一元素提取子模块,用于通过移动设备模块对富媒体资源进行提取,得到相应的移动设备元素信息;
第二元素提取子模块,用于通过传感器模块对富媒体资源进行提取,提取相应的传感器元素信息;
第三元素提取子模块,用于通过大数据平台模块对富媒体资源进行提取,提取相应的大数据平台元素信息;
第四元素提取子模块,用于通过全球定位系统GPS模块对富媒体资源进行提取,提取相应的GPS元素信息;
第五元素提取子模块,用于通过社交媒体模块对富媒体资源进行提取,提取相应的社交媒体元素信息。
进一步地,移动设备元素信息包括移动设备概念、移动设备属性及移动设备关系信息;
传感器元素信息包括传感器概念、传感器属性及传感器关系信息;
大数据平台元素信息包括大数据平台概念、大数据平台属性及大数据平台关系信息;
GPS元素信息包括GPS概念、GPS属性及GPS关系信息。
进一步地,确定模块具体用于检测富媒体元素信息是否包括移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息;以及当包括时,确定富媒体元素信息满足预定条件。
进一步地,还包括第二构建模块;
第二构建模块,用于根据移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息,构建场景模块。
进一步地,第一构建模块具体用于通过对富媒体资源进行内容模块的构建,得到相应的等级关系和/或非等级关系;以及,通过对富媒体资源进行内容管理模块的构建,得到富媒体资源的管理信息本体;以及通过对富媒体资源在概念上进行内容结构化模块的构建,来对富媒体资源片段化或内容特征进行属性提取;以及通过对富媒体资源在语义关系上进行本体构建,以提取富媒体资源中相应的对象、事件以及语义层面上的时间信息与空间信息。
第三方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现上述的富媒体知识本体构建方法。
第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的富媒体知识本体构建方法。
本申请实施例提供的富媒体知识本体构建方法,通过对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息,接着确定得到的富媒体元素信息是否满足预定条件,当且仅当满足预定条件时,则基于该富媒体资源构建出能够让计算机理解和处理的富媒体知识本体。此外,本申请在构建过程中设置的阈值判断环节,该环节具有对富媒体资源进行筛选的作用,可为每个领域的富媒体资源实现知识本体构建,满足了多领域构建的社会需求,填补了目前在富媒体知识本体构建上的空白。相对于传统的人工构建方法,本申请可以很大程度上节省人力、物力和财力。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的富媒体知识本体构建方法的流程示意图;
图2为本申请实施例的富媒体知识本体构建过程中五种元素的逻辑顺序示意图;
图3为本申请实施例的富媒体知识本体构建的过程示意图;
图4为本申请实施例的富媒体知识本体构建装置的基本结构示意图;
图5为本申请实施例的富媒体知识本体构建装置的详细结构示意图;
图6为本申请实施例的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
科学技术的发展催生了大量的数字化信息,富媒体数据是数据类型升级过程中逐渐成熟的产物,它是在传统多媒体数据的基础上添加交互和融合元素而形成的媒体数据,同时也是人们的思维方式和信息获取方式发生巨大转变的结果,适应了时代发展所带来的人们从多种媒体渠道获取信息的需求。构建富媒体知识本体是实现知识管理、富媒体信息检索以及信息整合的良好途径。场景概念是由记者罗伯特斯考伯和作家谢尔伊斯雷尔最早提出来的,他们预见性地断言互联网发展将要进入场景时代。因此,富媒体也是多媒体在场景时代下发展而来的。目前在富媒体知识本体及其构建方法上还没有相应的研究。本申请引入场景概念中的五要素,提出一种基于场景概念的富媒体知识本体构建方法。
本申请提供的富媒体知识本体构建方法、装置及电子设备,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种富媒体知识本体构建方法,如图1所示,包括:步骤S110,对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息;步骤S120,确定富媒体元素信息是否满足预定条件;步骤S130,如果满足预定条件,则基于富媒体资源构建富媒体知识本体。
本申请实施例提供的富媒体知识本体构建方法,与现有技术相比,通过对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息,接着确定得到的富媒体元素信息是否满足预定条件,并当满足预定条件时,基于富媒体资源构建富媒体知识本体,从而构建出能够让计算机理解和处理的富媒体知识本体,而且在构建过程中设置的阈值判断环节,具有对富媒体资源进行筛选的作用,可为每个领域的富媒体资源实现知识本体构建,满足了多领域构建的社会需求,填充了目前在富媒体知识本体构建上的空白,另外,相对于传统的人工构建方法,可以很大程度上节省人力、物力和财力。
本申请实施例提供了另一种可能的实现方式,其中,
步骤S110包括步骤S1101(图中未标注)、步骤S1102(图中未标注)、步骤S1103(图中未标注)、步骤S1104(图中未标注)及步骤S1105(图中未标注),其中,
步骤S1101:通过移动设备模块对所述富媒体资源进行提取,得到相应的移动设备元素信息;
步骤S1102:通过传感器模块对所述富媒体资源进行提取,提取相应的传感器元素信息;
步骤S1103:通过大数据平台模块对所述富媒体资源进行提取,提取相应的大数据平台元素信息;
步骤S1104:通过全球定位系统GPS模块对所述富媒体资源进行提取,提取相应的GPS元素信息;
步骤S1105:通过社交媒体模块对所述富媒体资源进行提取,提取相应的社交媒体元素信息。
另外,移动设备元素信息包括移动设备概念、移动设备属性及移动设备关系信息;
传感器元素信息包括传感器概念、传感器属性及传感器关系信息;
大数据平台元素信息包括大数据平台概念、大数据平台属性及大数据平台关系信息;
GPS元素信息包括GPS概念、GPS属性及GPS关系信息。
另外,确定富媒体元素信息是否满足预定条件,包括:
检测富媒体元素信息是否包括移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息;
如果包括,则确定富媒体元素信息满足预定条件。
另外,在步骤S130之前还包括步骤S140(图中未标注):根据移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息,构建场景模块。
另外,基于富媒体资源构建富媒体知识本体,包括:
通过对富媒体资源进行内容模块的构建,得到相应的等级关系和/或非等级关系;
通过对富媒体资源进行内容管理模块的构建,得到富媒体资源的管理信息本体;
通过对富媒体资源在概念上进行内容结构化模块的构建,来对富媒体资源片段化或内容特征进行属性提取;
通过对富媒体资源在语义关系上进行本体构建,以提取富媒体资源中相应的对象、事件以及语义层面上的时间信息与空间信息。
具体地,本申请主要通过移动设备模块、传感器模块、GPS模块、大数据平台模块、社交媒体模块、场景模块、富媒体内容模块、富媒体内容管理模块、内容结构化模块以及语义关系化模块,实现富媒体知识本体方法构建。
进一步地,可以根据移动设备模块的要求,提取获取到的富媒体资源的移动设备概念、移动设备属性及移动设备关系信息,其中,移动设备概念、移动设备属性及移动设备关系信息可以概括为移动设备元素信息。具体的提取方法可以借鉴现有包含移动设备信息的本体模型,也可以根据相应的移动设备元数据标准进行定义,再者可以应用自然语言处理技术自动从文本中获取。接着,可以通过传感器模块对获取到的富媒体资源进行处理,提取相应的传感器概念、传感器属性及传感器关系信息,具体提取方法同上述移动设备模块,其中,传感器概念、传感器属性及传感器关系信息可以概括为传感器元素信息。再接着,将依次经过移动设备模块及传感器模块的富媒体资源输入至大数据技术平台模块,并对该富媒体资源包含的大数据技术平台概念、大数据技术平台属性及大数据技术平台关系信息进行提取,具体提取方法同上述移动设备模块,其中,大数据技术平台概念、大数据技术平台属性及大数据技术平台关系信息可以概括为大数据技术平台元素信息。再接着,通过GPS模块对该富媒体资源进行GPS概念、GPS属性及GPS关系信息的提取,具体提取方法同上述移动设备模块,PS概念、GPS属性及GPS关系信息可以概括为GPS元素信息。再接着,通过社交媒体信息模块对对该富媒体资源包含的社交媒体信息进行提取,提取出社交媒体信息(即社交媒体元素信息),具体提取方法可以借鉴现有包含移动设备信息的本体模型,或者应用自然语言处理技术自动从文本中获取。
进一步地,为更好地说明该本体构建系统思路,图2给出了本系统场景概念元素的逻辑结构图,本方法参考构建良好场景营销模式的角度,对场景概念中的五种元素进行逻辑串联。
进一步地,判断该富媒体资源是否具有以上五种元素信息,即判断该富媒体资源是否具有移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息,如果具有该五种元素,则进入场景模块本体构建,即确定富媒体元素信息满足预定条件,可以基于富媒体资源构建富媒体知识本体,如果没有该五种元素,例如只有其中的四种、三种等,则不认为该资源属于本申请的富媒体知识本体构建范围。
进一步地,在确定富媒体资源具有以上五种元素信息(即确定富媒体元素信息满足预定条件)后,可以根据移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息,构建场景模块,并在构建场景模块之后,再基于富媒体资源构建富媒体知识本体。
进一步地,在基于富媒体资源构建富媒体知识本体的过程中,首先,可以对该富媒体资源进行内容模块构建,在该富媒体内容模块中,若只包含一种子类,则仅有等级关系,若包含两种或两种以上的子类,则可能包含非等级关联关系,即通过对富媒体资源进行内容模块的构建,得到相应的等级关系和/或非等级关系。接着,可以对该富媒体资源进行内容管理模块构建,该内容管理模块主要是针对富媒体资源的管理信息本体构建,主要包括:人、机构等,具体取值可根据用户需求进行实际定义,即通过对富媒体资源进行内容管理模块的构建,得到富媒体资源的管理信息本体。接着,可以对该富媒体资源在概念上进行本体构建,具体可以是内容结构化模块的构建,该内容结构化模块主要针对该富媒体资源片段化或内容特征上进行属性提取,即通过对富媒体资源在概念上进行内容结构化模块的构建,来对富媒体资源片段化或内容特征进行属性提取。接着,在该富媒体资源的语义关系化上进行本体构建,主要是提取该富媒体资源中涉及到的对象、事件以及语义层面上的时间信息和空间信息,即通过对富媒体资源在语义关系上进行本体构建,以提取富媒体资源中相应的对象、事件以及语义层面上的时间信息与空间信息。最后输出通过该本体构建方法所构建的富媒体知识本体。
进一步地,对本系统进行构建的构建流程如图3所示。值得指出的是,在社交媒体模块完成后,本系统对所获取的富媒体资源进行判断,当且仅当该富媒体资源具备场景概念中的五种元素信息时,才认可该资源为富媒体资源,否则不认为它是本系统需要的富媒体资源。
进一步地,图3中的移动设备模块针对的是富媒体资源所具有的移动设备信息概念、移动设备属性及移动设备关系信息。这里提到的移动设备包括以智能手机、平板电脑、电子阅读器等为代表的手持终端,也涵盖以智能手表为代表的可穿戴设备,它们是移动互联网时代的主要传播主体。对于该移动设备模块的信息提取,可以套用其他已构建好的本体模型,或是基于相关元数据标准进行分类及属性关系提取,另外,也可以利用自然语言处理技术自动从文本中获取,该方法依赖于所选用的试验文本,需要大量的原始语料。其中,该移动设备模块是场景概念中的要素之一。主要用于描述应用该富媒体本体的移动设备自身属性。本申请示例的移动设备模块概念、概念的属性以及关系的提取,可以参考国家标准《信息技术电子书第三部分:元数据》,将父类定义为“interactiondevice”,包含子类“interactiondevicetype”、“interationdevicename”、“interactiondevicedescription”。子类的对应关系包含等级关系“subclassof”以及非等级关系“isclassifiedby\hasname\isdescribeby”。
进一步地,传感器模块中的传感器是链接虚拟世界和现实世界的桥梁,在移动互联时代,就是人的感官延伸,能够更加真实、准确地掌握用户的情感变化。该传感器模块不仅可以感知用户的所处环境,也是为应用富媒体内容的实时调节和个性化定制提供了可靠的依据,该传感器模块类和属性的抽取方式同移动设备模块。其中,传感器模块是场景概念中的要素之一,主要用于描述应用该富媒体本体的传感器设备自身属性。本申请示例的传感器模块参考扩展后的SSNP ontology,将传感器模块父类定义为“sensor”,包含子类“sensortype”、“sensorID”、“sensoroperation”、“sensorresolution”。子类的对应关系包含等级关系“subclassof”以及非等级关系“hastype\hasID\hasoperationmode\hasresolution”。
进一步地,在大数据平台模块中,大数据技术的核心领域就是对以人与人之间连接为纽带的社会网络的识别、发掘和应用,其广泛嵌入社会生活的特性以及快捷、自动、规模处理信息的特点,使得大数据技术成为场景应用提供个性化服务的重要工具和技术支撑,其主要技术特点是通过收集、持续分析用户的行为大数据来洞察用户的行为变化趋势,从而实现个性化阅读场景精准营销的目标,该大数据平台模块的类和属性的抽取方式同移动设备模块。其中,该大数据平台模块是场景概念中的要素之一,主要用于描述应用该富媒体本体的大数据平台自身属性。本申请示例参考扩展后的SSNP ontology将大数据技术模块父类定义为“bigdataplatform”,包含子类“platformID”、“platformname”。子类的对应关系包含等级关系“subclassof”以及非等级关系“hasID”和“hasname”。
进一步地,GPS模块主要采用的是富媒体资源可以实时跟踪场景传播的地理位置信息,目的是为基于地理位置的服务提供了路径,地理位置的改变决定了场景环境的差异,导致用户需求也跟着发生改变,该GPS模块的类和属性的抽取方式同移动设备模块。其中,该GPS模块是场景概念中的要素之一,主要用于描述应用该富媒体本体的时间信息和空间信息属性。本申请基于GPS系统组成定义,将GPS模块父类定义为“GPS”,包含子类“spacesegment”、“controlsegment”和“usersegment”,子类的对应关系包含等级关系“subclassof”。
进一步地,人们通过社交媒体进行在线沟通、互动行为,进一步来明确自己的喜好、标注自己的位置,并表达自己的需求。对于社交媒体模块的概念及属性关系提取,可以借鉴其他已构建好的本体模型或采取爬虫或自然语言处理技术,进行类和属性关系抽取。其中,该社交媒体模块是场景概念中的要素之一,主要用于描述应用该富媒体本体的社交媒体自身属性。本申请参考前者已构建好的社交媒体本体,在此基础上进行筛选和拓展。将社交媒体模块父类定义为“socialmedia”,包含子类“socialmediaperson”“socialmediafunction”、“socialmediaword”。子类的对应关系包含等级关系“subclassof”以及非等级关系“hasname”“hasfunction”和“hastool”。
进一步地,场景模块是系统判断后构建的第一个模块,其设立的意义在于,在判断该富媒体资源具有场景概念中的五要素后,在五要素的基础上增加父类“context”,同时增加关系属性“subclassof”,从而引入场景概念丰富本体的构建方法。场景概念的五大构成要素包括移动设备、传感设备、大数据技术、GPS技术以及社交媒体。场景模块的父类为“context”,子类包括“interactiondevice”、“sensor”、“bigdataplatform”、“GPS”以及“socialmedia”,该模块的关系属性仅有等级关系“subclassof”。
进一步地,为更好地表达富媒体内容模块构建过程,本申请以现有的MPEG-7本体为例对其进行说明。MPEG-7本体是基于MPEG-7标准,引入本体论构建的本体模型。本申请在其基础上进行延用,同时结合富媒体资源的特点以及场景概念的五要素也对其属性进行扩展。其中,本申请将其父类名称定义为“richmediacontent”,子类包括“image”、“video”、“audio”、“audio-visual”以及“multimedia”。关系属性包括沿用的等级关系“subclassof”以及扩展的非等级关系“associatedmediawith”。
进一步地,富媒体内容管理模块是从富媒体内容管理元数据角度进行类的划分,本申请以现有的MPEG-7本体为例,在此基础上进行筛选和扩展。其中,父类名称为“contentmanagement”,子类包括“agent”、“role”、“person”、“organization”和“persongroup”,关系属性包括等级关系“subclassof”和非等级关系“unionof”。
进一步地,内容结构化模块是从内容结构的角度对富媒体本体进行构建,以MPEG-7本体为例,在此基础上进行筛选和扩展。其中,内容结构化模块包括父类“contentstructure”,子类“stillregion\stillregion3D\videosegment\movingsegment\audiosegment\audio visualsegment\audiovisualregionsegment\multimediasegment\imagetext\mosai c\editedvideosegment\videotext”。这些子类对应的关系包含等级关系“subclassof”以及扩展的非等级关系,包括“withinmedia\unionof\embeddedsegmentof\istimeof\isspaceof\isspacetimeof”。
进一步地,语义关系化模块是从语义关系角度出发进行类的划分,以MPEG-7本体为例,在此基础上进行筛选和扩展。该模块包括父类“contentsemantic”,包含子类“Object”、“event”、“semanticplace”、“semantictime”,这些子类对应的关系包含等级关系“subclassof”以及非等级关系“timeof”、“locationof”以及“statechangeof”。
本申请实施例,结合传播学中提出的场景概念五要素之间的逻辑关系,构建出能够让计算出理解和处理的富媒体知识本体,而且在构建过程中也具有对富媒体资源进行筛选的作用。
另外,基于场景概念的富媒体知识本体构建方法主要应用于数字出版界所涉及到的富媒体资源。从知识组织的角度对这些资源进行有效的知识管理。本申请实施例具有如下优势:
(1)学科交叉性强
传统的本体构建方法思路较单一。本申请实施例引入传播学中的场景概念五要素,综合了传播学、情报学、计算机科学等学科特点,形成符合富媒体资源特点的本体构建方法。
(2)实用性好
本方法在构建过程中设置阈值判断环节,在构建本体的同时也达到了对富媒体资源的筛选。可以为每个领域的富媒体资源实现知识本体构建,满足了多领域构建的社会需求。
(3)节省人力、物力和财力
相对于人工构建的方法来说,这种本体构建方法可以很大程度上节省人力、物力和财力。
(4)比较客观
该本体构建方法中对于概念、属性及关系抽取是参考已有本体、已出版的国家标准或自然语言处理技术进行定义的,和传统本体构建方法相比是一种较客观的方法。
(5)可拓展性好
本申请实施例的移动设备模块、传感器模块、大数据技术模块、GPS模块以及社交媒体模块可根据用户需求进行多领域本体关联。
实施例二
图4为本申请实施例提供的一种富媒体知识本体构建装置的结构示意图,如图4所示,该装置40可以包括提取模块41、确定模块42及第一构建模块43,其中,
提取模块41用于对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息;
确定模块42用于确定富媒体元素信息是否满足预定条件;
第一构建模块43用于当富媒体元素信息满足预定条件时,基于富媒体资源构建富媒体知识本体。
具体地,提取模块41包括第一元素提取子模块411、第二元素提取子模块412、第三元素提取子模块413、第四元素提取子模块414与第五元素提取子模块415,如图5所示,其中,
第一元素提取子模块411用于通过移动设备模块对富媒体资源进行提取,得到相应的移动设备元素信息;
第二元素提取子模块412用于通过传感器模块对富媒体资源进行提取,提取相应的传感器元素信息;
第三元素提取子模块413用于通过大数据平台模块对富媒体资源进行提取,提取相应的大数据平台元素信息;
第四元素提取子模块414用于通过全球定位系统GPS模块对富媒体资源进行提取,提取相应的GPS元素信息;
第五元素提取子模块415用于通过社交媒体模块对富媒体资源进行提取,提取相应的社交媒体元素信息。
进一步地,移动设备元素信息包括移动设备概念、移动设备属性及移动设备关系信息;
传感器元素信息包括传感器概念、传感器属性及传感器关系信息;
大数据平台元素信息包括大数据平台概念、大数据平台属性及大数据平台关系信息;
GPS元素信息包括GPS概念、GPS属性及GPS关系信息。
进一步地,确定模块42具体用于检测富媒体元素信息是否包括移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息;以及当包括时,确定富媒体元素信息满足预定条件。
进一步地,第一构建模块43具体用于通过对富媒体资源进行内容模块的构建,得到相应的等级关系和/或非等级关系;以及,通过对富媒体资源进行内容管理模块的构建,得到富媒体资源的管理信息本体;以及通过对富媒体资源在概念上进行内容结构化模块的构建,来对富媒体资源片段化或内容特征进行属性提取;以及通过对富媒体资源在语义关系上进行本体构建,以提取富媒体资源中相应的对象、事件以及语义层面上的时间信息与空间信息。
进一步地,还包括第二构建模块44,如图5所示,其中,第二构建模块44用于根据移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息,构建场景模块。
本申请实施例提供的装置,与现有技术相比,通过对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息,接着确定得到的富媒体元素信息是否满足预定条件,当且仅当满足预定条件时,则基于该富媒体资源构建出能够让计算机理解和处理的富媒体知识本体。此外,本申请在构建过程中设置的阈值判断环节,该环节具有对富媒体资源进行筛选的作用,可为每个领域的富媒体资源实现知识本体构建,满足了多领域构建的社会需求,填补了目前在富媒体知识本体构建上的空白。相对于传统的人工构建方法,本申请可以很大程度上节省人力、物力和财力。
实施例三
本申请实施例提供了一种电子设备,如图6所示,图6所示的电子设备600包括:处理器601和存储器603。其中,处理器601和存储器603相连,如通过总线602相连。进一步地,电子设备600还可以包括收发器604。需要说明的是,实际应用中收发器604不限于一个,该电子设备600的结构并不构成对本申请实施例的限定。
其中,处理器601应用于本申请实施例中,用于实现图4或图5所示的提取模块、确定模块及第一构建模块的功能,以及图5所示的第二构建模块的功能。
处理器601可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器601也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线602可包括一通路,在上述组件之间传送信息。总线602可以是PCI总线或EISA总线等。总线602可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器603可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器603用于存储执行本申请方案的应用程序代码,并由处理器601来控制执行。处理器601用于执行存储器603中存储的应用程序代码,以实现图4或图5所示实施例提供的富媒体知识本体构建装置的动作。
本申请实施例提供的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,与现有技术相比,可实现:通过对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息,接着确定得到的富媒体元素信息是否满足预定条件,并当满足预定条件时,基于富媒体资源构建富媒体知识本体,从而构建出能够让计算机理解和处理的富媒体知识本体,而且在构建过程中设置的阈值判断环节,具有对富媒体资源进行筛选的作用,可为每个领域的富媒体资源实现知识本体构建,满足了多领域构建的社会需求,填补了目前在富媒体知识本体构建上的空白,另外,相对于传统的人工构建方法,可以很大程度上节省人力、物力和财力。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现实施例一所示的方法。与现有技术相比,
通过对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息,接着确定得到的富媒体元素信息是否满足预定条件,当且仅当满足预定条件时,则基于该富媒体资源构建出能够让计算机理解和处理的富媒体知识本体。此外,本申请在构建过程中设置的阈值判断环节,该环节具有对富媒体资源进行筛选的作用,可为每个领域的富媒体资源实现知识本体构建,满足了多领域构建的社会需求,填补了目前在富媒体知识本体构建上的空白。相对于传统的人工构建方法,本申请可以很大程度上节省人力、物力和财力。
本申请实施例提供的计算机可读存储介质适用于上述方法的任一实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种富媒体知识本体构建方法,其特征在于,包括:
对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息;
确定所述富媒体元素信息是否满足预定条件;
如果满足预定条件,则基于所述富媒体资源构建富媒体知识本体。
2.根据权利要求1所述的方法,其特征在于,对获取到的富媒体资源进行相应的元素信息提取,包括:
通过移动设备模块对所述富媒体资源进行提取,得到相应的移动设备元素信息;
通过传感器模块对所述富媒体资源进行提取,提取相应的传感器元素信息;
通过大数据平台模块对所述富媒体资源进行提取,提取相应的大数据平台元素信息;
通过全球定位系统GPS模块对所述富媒体资源进行提取,提取相应的GPS元素信息;
通过社交媒体模块对所述富媒体资源进行提取,提取相应的社交媒体元素信息。
3.根据权利要求2所述的方法,其特征在于,所述移动设备元素信息包括移动设备概念、移动设备属性及移动设备关系信息;
所述传感器元素信息包括传感器概念、传感器属性及传感器关系信息;
所述大数据平台元素信息包括大数据平台概念、大数据平台属性及大数据平台关系信息;
所述GPS元素信息包括GPS概念、GPS属性及GPS关系信息。
4.根据权利要求2或3所述的方法,其特征在于,确定所述富媒体元素信息是否满足预定条件,包括:
检测所述富媒体元素信息是否包括移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息;
如果包括,则确定所述富媒体元素信息满足预定条件。
5.根据权利要求2或3所述的方法,其特征在于,在基于所述富媒体资源构建富媒体知识本体之前,还包括:
根据移动设备元素信息、传感器元素信息、大数据平台元素信息、GPS元素信息以及社交媒体元素信息,构建场景模块。
6.根据权利要求5所述的方法,其特征在于,基于所述富媒体资源构建富媒体知识本体,包括:
通过对所述富媒体资源进行内容模块的构建,得到相应的等级关系和/或非等级关系;
通过对所述富媒体资源进行内容管理模块的构建,得到富媒体资源的管理信息本体;
通过对所述富媒体资源在概念上进行内容结构化模块的构建,来对富媒体资源片段化或内容特征进行属性提取;
通过对所述富媒体资源在语义关系上进行本体构建,以提取所述富媒体资源中相应的对象、事件以及语义层面上的时间信息与空间信息。
7.一种富媒体知识本体构建装置,其特征在于,包括:
提取模块,用于对获取到的富媒体资源进行相应的元素信息提取,得到富媒体元素信息;
确定模块,用于确定所述富媒体元素信息是否满足预定条件;
构建模块,用于当富媒体元素信息满足预定条件时,基于所述富媒体资源构建富媒体知识本体。
8.根据权利要求7所述的装置,其特征在于,所述提取模块包括第一元素提取子模块、第二元素提取子模块、第三元素提取子模块、第四元素提取子模块与第五元素提取子模块;
所述第一元素提取子模块,用于通过移动设备模块对所述富媒体资源进行提取,得到相应的移动设备元素信息;
所述第二元素提取子模块,用于通过传感器模块对所述富媒体资源进行提取,提取相应的传感器元素信息;
所述第三元素提取子模块,用于通过大数据平台模块对所述富媒体资源进行提取,提取相应的大数据平台元素信息;
所述第四元素提取子模块,用于通过全球定位系统GPS模块对所述富媒体资源进行提取,提取相应的GPS元素信息;
所述第五元素提取子模块,用于通过社交媒体模块对所述富媒体资源进行提取,提取相应的社交媒体元素信息。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-6任一项所述的富媒体知识本体构建方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现权利要求1-6任一项所述的富媒体知识本体构建方法。
CN201811192045.8A 2018-10-12 2018-10-12 富媒体知识本体构建方法、装置及电子设备 Pending CN109408646A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811192045.8A CN109408646A (zh) 2018-10-12 2018-10-12 富媒体知识本体构建方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811192045.8A CN109408646A (zh) 2018-10-12 2018-10-12 富媒体知识本体构建方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN109408646A true CN109408646A (zh) 2019-03-01

Family

ID=65467169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811192045.8A Pending CN109408646A (zh) 2018-10-12 2018-10-12 富媒体知识本体构建方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN109408646A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918516A (zh) * 2019-03-13 2019-06-21 百度在线网络技术(北京)有限公司 一种数据处理方法、装置及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145163A (zh) * 2007-10-30 2008-03-19 金蝶软件(中国)有限公司 从多个数据源获取数据的方法及系统
CN105550336A (zh) * 2015-12-22 2016-05-04 北京搜狗科技发展有限公司 单一实体实例的挖掘方法和装置
CN105786897A (zh) * 2014-08-29 2016-07-20 韩国地质资源研究院 用于提供基于情境感知的用户关注信息的情境感知本体构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145163A (zh) * 2007-10-30 2008-03-19 金蝶软件(中国)有限公司 从多个数据源获取数据的方法及系统
CN105786897A (zh) * 2014-08-29 2016-07-20 韩国地质资源研究院 用于提供基于情境感知的用户关注信息的情境感知本体构建方法
CN105550336A (zh) * 2015-12-22 2016-05-04 北京搜狗科技发展有限公司 单一实体实例的挖掘方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
梁韵基: ""多源健康数据的语义分析方法研究"", 《中国博士学位论文全文数据库 信息科技辑》 *
肖健: ""军事医学本体构建的理论与方法研究"", 《中国博士学位论文全文数据库 医药卫生科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918516A (zh) * 2019-03-13 2019-06-21 百度在线网络技术(北京)有限公司 一种数据处理方法、装置及终端

Similar Documents

Publication Publication Date Title
Feilmayr et al. An analysis of ontologies and their success factors for application to business
Blasch et al. Wide-area motion imagery (WAMI) exploitation tools for enhanced situation awareness
Gao et al. An asymmetric modeling for action assessment
CN107526718A (zh) 用于生成文本的方法和装置
Dai Application of regional culture in landscape architecture design under the background of data fusion
CN115374781A (zh) 文本数据信息挖掘方法、装置、设备
CN116975615A (zh) 基于视频多模态信息的任务预测方法和装置
CN115188067A (zh) 一种视频行为识别方法、装置、电子设备及存储介质
CN113158051B (zh) 一种基于信息传播和多层上下文信息建模的标签排序方法
Patel et al. An NLP-guided ontology development and refinement approach to represent and query visual information
CN113610626A (zh) 银行信贷风险识别知识图谱构建方法、装置、计算机设备及计算机可读存储介质
CN109408646A (zh) 富媒体知识本体构建方法、装置及电子设备
CN116977701A (zh) 视频分类模型训练的方法、视频分类的方法和装置
CN114840771B (zh) 基于新闻环境信息建模的虚假新闻检测方法
CN115659060A (zh) 一种基于动态图神经网络的信息推荐方法及系统
CN116955707A (zh) 内容标签的确定方法、装置、设备、介质及程序产品
CN112818212B (zh) 语料数据采集方法、装置、计算机设备和存储介质
CN115168609A (zh) 一种文本匹配方法、装置、计算机设备和存储介质
Laudy Semantic knowledge representations for soft data fusion
Lu Design of visual communication based on deep learning approaches
Moalla et al. Integration of a multidimensional schema from different social media to analyze customers' opinions
Haav Linked Data Connections with Emerging Information Technologies: A Survey.
Halpin et al. Discovering meaning on the go in large heterogenous data
Ishikawa et al. Generalized difference method for generating integrated hypotheses in social big data
Yu Application Model Construction of Intangible Cultural Heritage Dissemination in Film and Television Art Creation in Postepidemic Era

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190301