CN109710776B

CN109710776B - 相册的知识图谱的构建方法

Info

Publication number: CN109710776B
Application number: CN201811637485.XA
Authority: CN
Inventors: 李向阳; 张兰; 郑达人; 韩风
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2018-12-29
Filing date: 2018-12-29
Publication date: 2022-10-28
Anticipated expiration: 2038-12-29
Also published as: CN109710776A

Abstract

本发明公开了一种相册的知识图谱的构建方法，包括：步骤1，获取相册内各图片标签：自动为相册中各图片产生关键词标签；步骤2，构建每张图片的知识图谱：将所构建图片的图片节点和关键词标签节点加入图谱中，并在关键词标签节点中两两添加一条边表示它们的关联关系；然后向语义知识网络查询，获取从关键词标签到根结点关键词的所有上下位关系路径，将所有关系路径合并公共节点和公共边后加入图谱；步骤3，合并所有图片的知识图谱：对步骤2创建的每张图片的知识图谱合并在一起，合并所有公共节点和公共边，更新公共节点和公共边属性值，得到整个相册的知识图谱。能将相册中所有图片标签的语义关系用知识图谱表达，能提升对图片操作的快捷性。

Description

相册的知识图谱的构建方法

技术领域

本发明涉及人工智能的图片管理领域，尤其涉及一种对用户相册的知识图谱的构建方法。

背景技术

随着智能移动设备(如智能手机、平板电脑等)的发展，越来越多的图片由用户的移动设备所拍摄，用户图片数量增多相册(指)大小也随之增大。这些图片中含有大量内容信息，例如一群人在湖边或者一只猫在喝水等。目前，图片内容信息可以通过人工添加标签注释的方式提取，但这样的劳动开销巨大，对用户非常不友好；对图片内容信息也可自动提取，是通过提取图片特征对图片分类或标记注释，但仅仅是对单个图片提取出标记注释信息，但并未构建出这些图片的不同注释信息之间的语义关系。这使得用户无法有效利用图片的不同注释信息之间的语义关系，对相册中图片实现高效操作。

发明内容

基于现有技术所存在的问题，本发明的目的是提供一种相册知识图谱的构建方法，能为相册中的所有图片构建知识图谱，以知识图谱对相册进行表达，解决现有相册的图片标签因无关联，无法实现对图片进行高效操作的问题。

本发明的目的是通过以下技术方案实现的：

本发明实施方式提供一种相册的知识图谱的构建方法，包括：

步骤1，获取相册内各图片的标签：通过识别相册中各图片内容自动为各图片产生对应的关键词标签；

步骤2，构建相册的每一张图片的知识图谱形成总知识图谱：以所构建的图片作为图片节点，所构建的图片对应的关键词标签作为词节点，将所述图片节点和所述词节点用一条边连接起来形成该图片的知识图谱；然后通过语义知识网络，将该图片的知识图谱中的所有关键词标签添加到语义网络的语义根节点的上下位关系路径上，其中的每一个节点为一个关键词标签；当构建完所有图片的知识图谱形成总知识图谱；

步骤3，合并所有图片的知识图谱：将所述步骤2创建的总知识图谱中的所有公共节点和公共边合并，并更新所有公共节点和公共边的属性值，最后得到整个相册的知识图谱。

由上述本发明提供的技术方案可以看出，本发明实施例提供的相册的知识图谱的构建方法，其有益效果为：

通过将相册中的所有图片的标签信息以及不同类型标签的语义关系通过知识图谱进行表达，使对相册的灵活、多层次的语义搜索与浏览成为可能。通过知识图谱不仅可以得知图片中识别出来的对应的标签，而且可以得知标签之间的语义上下位关系，还可以获得不同标签之间的关联度，所有的这些关系跟标签组成一个完整的相册知识图谱。该方法构建的知识图谱不仅对相册内容有更完整更系统的表达，还提供一定程度的隐私保护；图谱构建时间快且存储空间小，可广泛应用于各类相册应用，为这些应用提供可靠的知识来源和信息基础。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1为本发明实施例提供的相册的知识图谱的构建方法的流程。

具体实施方式

下面结合本发明的具体内容，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。本发明实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

如图1所示，本发明实施例提供一种相册的知识图谱的构建方法，能将相册中的所有图片的标签信息以及不同类型标签的语义关系通过知识图谱进行表达，包括：

步骤2，构建相册的每一张图片的知识图谱形成总知识图谱：以所构建的图片作为图片节点，所构建的图片对应的关键词标签作为词节点，将所述图片节点和所述词节点用一条边连接起来形成该图片的知识图谱；然后通过语义知识网络，将该图片的知识图谱中的所有关键词标签添加到语义网络的语义根节点的上下位关系路径上，其中路径上的每一个节点为一个词节点；当构建完所有图片的知识图谱形成总知识图谱；

上述方法中，知识图谱是指由图片节点，词节点和节点之间的边构成的图。

上述方法中，图片识别采用现有图片识别方法，如深度学习模型等。

上述方法还包括：标记沉默节点：将所述步骤3得到的整个相册的知识图谱中不属于图片的关键词标签且只有一个直接下位词节点的标签节点标记为沉默节点

上述方法还包括：用下位词扩展知识图谱：对于所述步骤1得到的所有图片的关键词标签，向语义知识网络查询获取对应标签的全部下位词，利用词频统计过滤掉不常用的下位词，将过滤后得到的常用下位词作为标签节点加入总知识图谱，并与对应的关键词标签节点以直接上下位关系边连接。

上述构建相册的知识图谱中，关键词标签的关键词为：物体、动作、颜色各词性词语中的任一种。上述关键词标签的关键词为：各词性词语中的任一种。优选的，所述各词性词语包括：物体、动作、颜色、地点、环境、天气、动物和人。但不限于上述各词性词语，其他可用的均可作为关键词标签；只要能描述图片的词，无论是名词，动词，还是形容词都可以作为关键词，如物体、动作、颜色、地点、环境、天气、动物和人等。

本发明的方法，利用图片识别技术和语义知识网络，对整个相册的图片进行了完整的语义表达，为各类相册应用提供可靠的知识来源和信息基础，使对相册的灵活、多层次的语义搜索与浏览成为可能。通过知识图谱不仅可以得知图片中识别出来的对应的标签，而且可以得知标签之间的语义上下位关系，例如猫-食肉动物-动物等层次关系，还可以获得不同标签之间的关联度，所有的这些关系跟标签组成一个完整的相册知识图谱。该构建方法的优势在于所提出的知识图谱不仅对相册内容有更完整更系统的表达，还提供一定程度的隐私保护；图谱构建时间快且存储空间小；该方法能广泛应用于各类智能终端的相册应用中，为这些应用提供可靠的知识来源和信息基础，应用前景广阔。

下面对本发明实施例具体作进一步地详细描述。

本发明实施例提供一种对用户相册的知识图谱构建方法，该方法包括以下步骤：

步骤1，获取用户图片标签：通过模型自动对相册中所有图片产生关键词标签，关键词标签可以包括物体，动作，颜色等各词性词语；

步骤2，对每张图片构建知识图谱：对一张图片和由步骤1得到的对应关键词标签，首先把图片节点和标签节点加入图谱中，并在这些标签节点中两两添加一条边表示它们的关联关系；然后向语义知识网络查询询问从这些关键词标签到语义根结点的所有上下位关系路径，并把这些路径(包括路径里的标签和直接上下位关系)经过合并公共节点和公共边之后形成总知识图谱；

步骤3，合并所有图片的知识图谱：把步骤2创建每张图片的知识图谱形成的总知识图谱进行合并，对其中的所有公共节点和公共边进行合并，同时更新公共节点和公共边的属性值，最后得到整个相册的知识图谱。

进一步的，该方法还包括：标记沉默节点：把步骤3得到的相册知识图谱中不属于图片关键词标签且只有一个直接下位词节点的标签节点标记为沉默节点。

进一步的，该方法还包括：用下位词扩展知识图谱：对于步骤1得到的所有图片的关键词标签，向语义知识网络查询询问这些对应标签的全部下位词，利用词频统计过滤这些下位词，将过滤后的下位词作为标签节点加入图谱并跟对应的关键词标签节点以直接上下位关系边连接。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.一种相册的知识图谱的构建方法，其特征在于，包括：

2.根据权利要求1所述的相册的知识图谱的构建方法，其特征在于，所述方法还包括：

标记沉默节点：将所述步骤3得到的整个相册的知识图谱中不属于图片的关键词标签且只有一个直接下位词节点的标签节点标记为沉默节点。

3.根据权利要求1或2所述的相册的知识图谱的构建方法，其特征在于，所述方法还包括：

用下位词扩展知识图谱：对于所述步骤1得到的所有图片的关键词标签，向语义知识网络查询获取对应标签的全部下位词，利用词频统计过滤掉不常用的下位词，将过滤后得到的常用下位词作为标签节点加入总知识图谱，并与对应的关键词标签节点以直接上下位关系边连接。

4.根据权利要求1或2所述的相册的知识图谱的构建方法，其特征在于，所述关键词标签的关键词为：各词性词语中的任一种。

5.根据权利要求4所述的相册的知识图谱的构建方法，其特征在于，所述各词性词语包括：

物体、动作、颜色、地点、环境、天气、动物和人。