CN114996482A

CN114996482A - 知识图谱构建、视频搜索方法、装置及电子设备

Info

Publication number: CN114996482A
Application number: CN202210928494.4A
Authority: CN
Inventors: 潘浩杰; 张裕舟; 梅立军; 李月雷; 付瑞吉
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2022-08-03
Filing date: 2022-08-03
Publication date: 2022-09-02
Anticipated expiration: 2042-08-03
Also published as: CN114996482B

Abstract

本公开关于一种知识图谱构建、视频搜索方法、装置及电子设备，该方法包括获取目标知识类视频、目标搜索信息和预设知识库中的第一数量个预设文本对，目标搜索信息为具有搜索知识类视频意图的搜索信息，从目标搜索信息中，提取第二数量个搜索文本对，对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到包括多个分支的初始知识图谱；多个分支以词条和知识点为节点，以词条和知识点间的搜索关联关系，以及知识点间的上下位关系为边；基于每一分支上的词条和知识点，从目标知识类视频中，筛选出挂载视频；基于初始知识图谱和挂载视频，构建目标知识图谱。利用本公开实施例可以提升知识图谱对搜索信息的表征精准性和有效性。

Description

知识图谱构建、视频搜索方法、装置及电子设备

技术领域

本公开涉及互联网技术领域，尤其涉及一种知识图谱构建、视频搜索方法、装置及电子设备。

背景技术

随着互联网技术的快速发展，涌现了大量线上的百科产品，帮助用户从海量数据中搜索需求的知识信息。

相关技术中，信息搜索需要依赖知识图谱，基于知识图谱中关键词与搜索信息间的匹配程度，来为用户搜索相关知识信息；但相关技术中百科产品搜索的信息往往主要以文字形式展示，虽然会配以图文或简单的视频罗列，但知识图谱的构建仅仅是从可搜索信息中提取关键词，导致相关技术中的知识图谱无法有效表征可搜索信息，进而也带来搜索精准性较差和搜索应用的局限性较大等问题。

发明内容

本公开提供一种知识图谱构建、视频搜索方法、装置及电子设备，以至少解决相关技术中知识图谱无法有效表征可搜索信息，进而也带来搜索精准性较差和搜索应用的局限性较大等问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种知识图谱构建方法，包括：

获取目标知识类视频、目标搜索信息和预设知识库中的第一数量个预设文本对，所述目标搜索信息为具有搜索知识类视频意图的搜索信息，任一所述预设文本对包括存在搜索关联关系的知识点和词条；

从所述目标搜索信息中，提取第二数量个搜索文本对，任一所述搜索文本对包括存在所述搜索关联关系的知识点和词条；

对所述第二数量个搜索文本对和所述第一数量个预设文本对进行融合处理，得到初始知识图谱；所述初始知识图谱包括多个分支，所述多个分支以目标词条和目标知识点为节点，以所述目标词条和所述目标知识点间的所述搜索关联关系，以及所述目标知识点间的上下位关系为边；所述目标词条为所述第二数量个搜索文本对和所述第一数量个预设文本对中的词条；所述目标知识点为所述第二数量个搜索文本对和所述第一数量个预设文本对中的知识点；

基于所述初始知识图谱中每一分支上的词条和知识点，从所述目标知识类视频中，筛选出所述每一分支对应的挂载视频；

基于所述初始知识图谱和所述每一分支对应的挂载视频，构建目标知识图谱。

在一个可选的实施例中，所述对所述第二数量个搜索文本对和所述第一数量个预设文本对进行融合处理，得到初始知识图谱包括：

对所述第二数量个搜索文本对和所述第一数量个预设文本对进行去重处理，得到第三数量个目标文本对；

对所述第三数量个目标文本对中同一词条对应的知识点进行聚类处理，得到所述第三数量个目标文本对中每一词条对应的初始聚类知识点；

基于所述初始聚类知识点对所述第三数量个目标文本对进行知识点去重处理，得到第四数量个目标文本对；

基于上下位识别网络，对所述第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，所述上下位识别结果表征所述两两知识点间是否存在所述上下位关系；

以所述第四数量个目标文本对中的词条和知识点为节点，以所述第四数量个目标文本对中的词条和知识点间的所述搜索关联关系，以及所述两两知识点间的所述上下位关系为边，构建所述初始知识图谱。

在一个可选的实施例中，所述对所述第三数量个目标文本对中同一词条对应的知识点进行聚类处理，得到所述第三数量个目标文本对中每一词条对应的初始聚类知识点包括：

获取所述第三数量个目标文本对各自对应的文本对特征信息；

对所述第三数量个目标文本对中同一词条对应的文本对特征信息进行聚类处理，得到所述第三数量个目标文本对中每一词条对应的聚类特征中心；

确定所述同一词条对应的文本对特征信息中每一文本特征信息与对应的聚类特征中心间的相似度；

确定所述同一词条对应的文本对特征信息中对应的相似度最大的目标文本对特征信息；

将所述目标文本对特征信息对应的目标文本对中的知识点，作为所述初始聚类知识点。

在一个可选的实施例中，在所述基于上下位识别网络，对所述第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，所述上下位识别结果表征所述两两知识点间是否存在所述上下位关系之前，所述方法还包括：

将所述第四数量个目标文本对输入知识点识别网络进行知识点识别，得到所述第四数量个目标文本对对应的知识点识别结果，所述知识点识别结果表征所述第四数量个目标文本对中是否包括知识点；

将所述第四数量个目标文本对中，对应知识点识别结果指示未包括知识点的目标文本对进行过滤，得到第五数量个目标文本对；

所述基于上下位识别网络，对所述第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，所述上下位识别结果表征所述两两知识点间是否存在所述上下位关系包括：

基于上下位识别网络，对所述第五数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，所述上下位识别结果表征所述两两知识点间是否存在所述上下位关系；

所述以所述第四数量个目标文本对中的词条和知识点为节点，以所述第四数量个目标文本对中的词条和知识点间的所述搜索关联关系，以及所述两两知识点间的所述上下位关系为边，构建所述初始知识图谱包括：

以所述第五数量个目标文本对中的词条和知识点为节点，以所述第五数量个目标文本对中的词条和知识点间的所述搜索关联关系，以及所述两两知识点间的所述上下位关系为边，构建所述初始知识图谱。

在一个可选的实施例中，在所述对所述第二数量个搜索文本对和所述第一数量个预设文本对进行融合处理，得到初始知识图谱之前，所述方法还包括：

对所述第二数量个搜索文本对进行聚合处理，得到第六数量个搜索文本对组，每个搜索文本对组包括至少一个相同的搜索文本对；

确定所述每个搜索文本对组中文本对数量；

将所述第六数量个搜索文本对组中所述文本对数量不大于预设数量阈值的搜索文本对组进行过滤，得到第七数量个搜索文本对组；

所述对所述第二数量个搜索文本对和所述第一数量个预设文本对进行融合处理，得到初始知识图谱包括：

对所述第七数量个搜索文本对组中的搜索文本对和所述第一数量个预设文本对进行融合处理，得到所述初始知识图谱。

在一个可选的实施例中，在所述对所述第七数量个搜索文本对组中的搜索文本对和所述第一数量个预设文本对进行融合处理，得到所述初始知识图谱之前，所述方法还包括：

从所述第七数量个搜索文本对组中分别抽取一个搜索文本对，得到所述第七数量个搜索文本对；

确定所述第七数量个搜索文本对中词条在对应的目标搜索信息中的位置信息；

将所述位置信息和所述目标搜索信息输入实体识别网络进行实体识别，得到所述第七数量个搜索文本对中词条对应的实体识别结果；

基于所述实体识别结果，对所述第七数量个搜索文本对进行实体链接，得到所述第七数量个目标搜索文本对；

所述对所述第七数量个搜索文本对组中的搜索文本对和所述第一数量个预设文本对进行融合处理，得到所述初始知识图谱包括：

对所述第七数量个目标搜索文本对和所述第一数量个预设文本对进行融合处理，得到所述初始知识图谱。

在一个可选的实施例中，所述目标搜索信息采用下述方式获取：

获取历史搜索信息和所述历史搜索信息对应的搜索操作信息，所述搜索操作信息为基于所述历史搜索信息进行搜索处理过程中，针对知识类视频的操作信息；

从所述历史搜索信息中，筛选出所述搜索操作信息满足预设条件的所述目标搜索信息。

在一个可选的实施例中，所述基于所述初始知识图谱中每一分支上的词条和知识点，从所述目标知识类视频中，筛选出所述每一分支对应的挂载视频包括：

对所述每一分支上的词条和知识点进行特征提取处理，得到所述每一分支对应的分支特征信息；

获取所述目标知识类视频的视频特征信息；

确定所述分支特征信息与所述视频特征信息间的关联信息；

基于所述关联信息，从所述目标知识类视频中，确定所述每一分支对应的挂载视频。

在一个可选的实施例中，所述基于所述初始知识图谱和所述每一分支对应的挂载视频，构建目标知识图谱包括：

确定所述每一分支对应的挂载视频的视频数量；

去除所述初始知识图谱中所述视频数量不大于预设阈值的分支，得到中间知识图谱；

将所述中间知识图谱中每一分支对应的挂载视频挂载到所述中间知识图谱中，得到所述目标知识图谱。

根据本公开实施例的第二方面，提供一种视频搜索方法，包括：

响应于搜索指令，获取所述搜索指令对应的搜索信息；

基于所述搜索信息和目标知识图谱，从所述目标知识图谱对应的挂载视频中，确定目标搜索视频；

其中，所述目标知识图谱为根据第一方面提供的任一所述的知识图谱构建方法构建得到的。

根据本公开实施例的第三方面，提供一种知识图谱构建装置，包括：

信息获取模块，被配置为执行获取目标知识类视频、目标搜索信息和预设知识库中的第一数量个预设文本对，所述目标搜索信息为具有搜索知识类视频意图的搜索信息，任一所述预设文本对包括存在搜索关联关系的知识点和词条；

搜索文本对提取模块，被配置为执行从所述目标搜索信息中，提取第二数量个搜索文本对，任一所述搜索文本对包括存在所述搜索关联关系的知识点和词条；

融合处理模块，被配置为执行对所述第二数量个搜索文本对和所述第一数量个预设文本对进行融合处理，得到初始知识图谱；所述初始知识图谱包括多个分支，所述多个分支以目标词条和目标知识点为节点，以所述目标词条和所述目标知识点间的所述搜索关联关系，以及所述目标知识点间的上下位关系为边；所述目标词条为所述第二数量个搜索文本对和所述第一数量个预设文本对中的词条；所述目标知识点为所述第二数量个搜索文本对和所述第一数量个预设文本对中的知识点；

挂载视频筛选模块，被配置为执行基于所述初始知识图谱中每一分支上的词条和知识点，从所述目标知识类视频中，筛选出所述每一分支对应的挂载视频；

目标知识图谱构建模块，被配置为执行基于所述初始知识图谱和所述每一分支对应的挂载视频，构建目标知识图谱。

在一个可选的实施例中，所述融合处理模块包括：

去重处理单元，被配置为执行对所述第二数量个搜索文本对和所述第一数量个预设文本对进行去重处理，得到第三数量个目标文本对；

聚类处理单元，被配置为执行对所述第三数量个目标文本对中同一词条对应的知识点进行聚类处理，得到所述第三数量个目标文本对中每一词条对应的初始聚类知识点；

知识点去重处理单元，被配置为执行基于所述初始聚类知识点对所述第三数量个目标文本对进行知识点去重处理，得到第四数量个目标文本对；

上下位识别单元，被配置为执行基于上下位识别网络，对所述第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，所述上下位识别结果表征所述两两知识点间是否存在所述上下位关系；

初始知识图谱构建单元，被配置为执行以所述第四数量个目标文本对中的词条和知识点为节点，以所述第四数量个目标文本对中的词条和知识点间的所述搜索关联关系，以及所述两两知识点间的所述上下位关系为边，构建所述初始知识图谱。

在一个可选的实施例中，所述聚类处理模块包括：

特征匹配处理单元，被配置为执行获取所述第三数量个目标文本对各自对应的文本对特征信息；

聚类处理子单元，被配置为执行对所述第三数量个目标文本对中同一词条对应的文本对特征信息进行聚类处理，得到所述第三数量个目标文本对中每一词条对应的聚类特征中心；

相似度确定单元，被配置为执行确定所述同一词条对应的文本对特征信息中每一文本特征信息与对应的聚类特征中心间的相似度；

目标文本对特征信息确定单元，被配置为执行确定所述同一词条对应的文本对特征信息中对应的相似度最大的目标文本对特征信息；

聚类知识点确定单元，被配置为执行将所述目标文本对特征信息对应的目标文本对中的知识点，作为所述初始聚类知识点。

在一个可选的实施例中，所述融合处理模块还包括：

知识点识别单元，被配置为执行将所述第四数量个目标文本对输入知识点识别网络进行知识点识别，得到所述第四数量个目标文本对对应的知识点识别结果，所述知识点识别结果表征所述第四数量个目标文本对中是否包括知识点；

文本对过滤单元，被配置为执行将所述第四数量个目标文本对中，对应知识点识别结果指示未包括知识点的目标文本对进行过滤，得到第五数量个目标文本对；

所述上下位识别单元还被配置为执行基于上下位识别网络，对所述第五数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，所述上下位识别结果表征所述两两知识点间是否存在所述上下位关系；

所述初始知识图谱构建单元还被配置为执行：以所述第五数量个目标文本对中的词条和知识点为节点，以所述第五数量个目标文本对中的词条和知识点间的所述搜索关联关系，以及所述两两知识点间的所述上下位关系为边，构建所述初始知识图谱。

在一个可选的实施例中，所述装置还包括：

聚合处理模块，被配置为执行在所述对所述第二数量个搜索文本对和所述第一数量个预设文本对进行融合处理，得到初始知识图谱之前，对所述第二数量个搜索文本对进行聚合处理，得到第六数量个搜索文本对组，每个搜索文本对组包括至少一个相同的搜索文本对；

文本对数量确定模块，被配置为执行确定所述每个搜索文本对组中文本对数量；

搜索文本对组过滤模块，被配置为执行将所述第六数量个搜索文本对组中所述文本对数量不大于预设数量阈值的搜索文本对组进行过滤，得到第七数量个搜索文本对组；

所述融合处理模块还被配置为执行对所述第七数量个搜索文本对组中的搜索文本对和所述第一数量个预设文本对进行融合处理，得到所述初始知识图谱。

在一个可选的实施例中，所述装置还包括：

搜索文本对抽取模块，被配置为执行在所述对所述第七数量个搜索文本对组中的搜索文本对和所述第一数量个预设文本对进行融合处理，得到所述初始知识图谱之前，从所述第七数量个搜索文本对组中分别抽取一个搜索文本对，得到所述第七数量个搜索文本对；

位置信息确定模块，被配置为执行确定所述第七数量个搜索文本对中词条在对应的目标搜索信息中的位置信息；

实体识别模块，被配置为执行将所述位置信息和所述目标搜索信息输入实体识别网络进行实体识别，得到所述第七数量个搜索文本对中词条对应的实体识别结果；

实体链接模块，被配置为执行基于所述实体识别结果，对所述第七数量个搜索文本对进行实体链接，得到所述第七数量个目标搜索文本对；

所述融合处理模块还被配置为执行对所述第七数量个目标搜索文本对和所述第一数量个预设文本对进行融合处理，得到所述初始知识图谱。

在一个可选的实施例中，所述信息获取模块包括：

信息获取单元，被配置为执行获取历史搜索信息和所述历史搜索信息对应的搜索操作信息，所述搜索操作信息为基于所述历史搜索信息进行搜索处理过程中，针对知识类视频的操作信息；

目标搜索信息筛选单元，被配置为执行从所述历史搜索信息中，筛选出所述搜索操作信息满足预设条件的所述目标搜索信息。

在一个可选的实施例中，所述挂载视频筛选模块包括：

特征提取处理单元，被配置为执行对所述每一分支上的词条和知识点进行特征提取处理，得到所述每一分支对应的分支特征信息；

文本特征信息获取单元，被配置为执行获取所述目标知识类视频的视频特征信息；

关联信息确定单元，被配置为执行确定所述分支特征信息与所述视频特征信息间的关联信息；

挂载视频确定单元，被配置为执行基于所述关联信息，从所述目标知识类视频中，确定所述每一分支对应的挂载视频。

在一个可选的实施例中，所述目标知识图谱构建模块包括：

视频数量确定单元，被配置为执行确定所述每一分支对应的挂载视频的视频数量；

分支单元，被配置为执行去除所述初始知识图谱中所述视频数量不大于预设阈值的分支，得到中间知识图谱；

视频挂载单元，被配置为执行将所述中间知识图谱中每一分支对应的挂载视频挂载到所述中间知识图谱中，得到所述目标知识图谱。

根据本公开实施例的第四方面，提供一种视频搜索装置，包括：

搜索信息获取模块，被配置为执行响应于搜索指令，获取所述搜索指令对应的搜索信息；

目标搜索视频确定模块，被配置为执行基于所述搜索信息和目标知识图谱，从所述目标知识图谱对应的挂载视频中，确定目标搜索视频；

其中，所述目标知识图谱为根据第一方面任一所述的知识图谱构建方法构建得到的。

根据本公开实施例的第五方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如上述第一方面或第二方面中任一项所述的方法。

根据本公开实施例的第六方面，提供一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行本公开实施例的第一方面或第二方面中任一项所述方法。

根据本公开实施例的第七方面，提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例的第一方面或第二方面中任一项所述方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

在构建目标知识图谱的过程中，从具有搜索知识类视频意图的目标搜索信息中提取包括词条和知识点的搜索文本对，并将搜索文本对和预设知识库中的预设文本对进行融合，构建出包括以词条和知识点为节点，以词条和知识点间的搜索关联关系，以及知识点间的上下位关系为边的多个分支的初始知识图谱，并在初始知识图谱中挂载每一分支对应的目标知识类视频，可以实现基于目标知识图谱的视频搜索，在大大提升搜索应用的全面性的基础上，可以大大提升目标知识图谱对搜索信息的表征精准性和有效性，进而也可以优化视频内容生态，鼓励创作者发表一些知识类的视频以及提升后续搜索的精准性和有效性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种应用环境的示意图；

图2是根据一示例性实施例示出的一种知识图谱构建方法的流程图；

图3是根据一示例性实施例示出的一种对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱的流程图；

图4是根据一示例性实施例示出的一种对第三数量个目标文本对中同一词条对应的知识点进行聚类处理，得到第三数量个目标文本对中每一词条对应的初始聚类知识点的流程图；

图5是根据一示例性实施例示出的一种基于初始知识图谱和每一分支对应的挂载视频，构建目标知识图谱的流程图；

图6是根据一示例性实施例提供的一种目标知识图谱的示意图；

图7是根据一示例性实施例示出的一种视频搜索方法的流程图；

图8是根据一示例性实施例示出的一种知识图谱构建装置框图；

图9是根据一示例性实施例示出的一种视频搜索装置框图；

图10是根据一示例性实施例示出的一种用于知识图谱构建的电子设备的框图；

图11是根据一示例性实施例示出的一种用于知识图谱构建的电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

需要说明的是，本公开所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于展示的数据、分析的数据等），均为经用户授权或者经过各方充分授权的信息和数据。

请参阅图1，图1是根据一示例性实施例示出的一种应用环境的示意图，该应用环境可以包括终端100和服务器200。

在一个可选的实施例中，终端100可以用于面向任一用户提供搜索服务。具体的，终端100可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、智能可穿戴设备等类型的电子设备，也可以为运行于上述电子设备的软体，例如应用程序等。可选的，电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。

在一个可选的实施例中，服务器200可以为预先构建目标知识图谱，并结合目标知识图谱为终端100的搜索服务提供后台支持。具体的，服务器200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。

此外，需要说明的是，图1所示的仅仅是本公开提供的一种应用环境，在实际应用中，还可以包括其他应用环境，例如目标知识图谱的构建也可以在终端执行。

本说明书实施例中，上述终端100以及服务器200可以通过有线或无线通信方式进行直接或间接地连接，本公开在此不做限制。

图2是根据一示例性实施例示出的一种知识图谱构建方法的流程图，如图2所示，该知识图谱构建方法用于终端、或服务器等电子设备中，包括以下步骤。

在步骤S201中，获取目标知识类视频、目标搜索信息和预设知识库中的第一数量个预设文本对。

在一个具体的实施例中，预设知识库可以为预先创建好的百科信息库。具体的，预设知识库中可以包括大量词条的知识信息；可选的，每一词条的知识信息中除了词条和知识点以外，往往还有目录等信息，可以过滤掉除词条和知识点以外的信息，得到上述第一数量个预设文本对。相应的，第一数量可以为预设文本对的数量。具体的，上述任一预设文本对可以包括存在搜索关联关系的知识点和词条；存在搜索关联关系的知识点和词条可以为出现在同一搜索信息中知识点和词条。具体的，词条可以为搜索对象，知识点可以为描述搜索对象的外延性属性（即非搜索对象本身的属性）的信息。例如搜索对象为柴犬、知识点可以为简介。

在一个具体的实施例中，目标知识类视频可以为搜索平台内的知识类视频；可选的，知识类视频可以包括科普知识视频和教程知识视频。其中，科普知识视频可以为用于描述事物的具体内容（例如背景知识，未来趋势），或者描述人物经历（例如自传）或者表达具体观点（例如影评、乐评）的视频。教程知识视频可以为用于描述具体操作步骤或方法的视频。

在一个可选的实施例中，上述获取目标知识类视频可以包括以下步骤：

获取原始视频；对原始视频进行知识视频识别，得到原始视频对应的知识识别结果；基于知识识别结果，对原始视频进行过滤，得到目标知识类视频。

在一个具体的实施例中，原始视频可以为搜索平台内的视频，具体的，原始视频可以包括多个视频。

在一个可选的实施例中，可以结合预先训练好的知识视频识别网络，对原始视频进行知识视频识别，得到原始视频对应的知识识别结果。具体的，上述知识识别结果可以表征原始视频是否属于知识类视频。可选的，以知识类视频包括科普知识视频和教程知识视频为例，知识识别结果可以包括原始视频是否属于科普知识视频的概率以及原始视频是否属于教程知识视频的概率。可选的，知识视频识别网络可以为预先基于具有知识标签的训练视频对第一预设深度学习网络进行训练得到。可选的，训练视频中教程知识视频的知识标签可以包括（0，1），其中，0标识该教程知识视频属于科普知识视频的概率为0以及该教程知识视频属属于教程知识视频的概率为1。

在一个可选的实施例中，第一预设深度学习网络可以为BERT网络、TextCNN等深度学习网络。

在一个具体的实施例中，上述基于知识识别结果，对原始视频进行过滤，得到目标知识类视频可以包括：将原始视频中对应的知识识别结果表征属于知识类视频的视频作为目标知识类视频。具体的，以知识类视频包括科普知识视频和教程知识视频为例；若某一视频对应的知识识别结果中该视频属于任一知识类视频对应的概率大于预设概率的视频，可以确定该视频属于知识类视频。

上述实施例中，通过对原始视频的知识视频识别，可以快速准确的筛选出属于知识类视频的目标知识类视频，进而可以为后续构建用于搜索知识类视频的知识图谱提供数据支持。

在一个可选的实施例中，上述目标搜索信息可以为具有搜索知识类视频意图的搜索信息。可选的，上述目标搜索信息可以采用下述方式获取：

获取历史搜索信息和历史搜索信息对应的搜索操作信息；

从历史搜索信息中，筛选出搜索操作信息满足预设条件的目标搜索信息。

在一个具体的实施例中，历史搜索信息可以为预设历史时间段内搜索平台中的搜索信息。预设历史时间段可以结合实际应用进行设置，例如一个月。搜索操作信息为基于历史搜索信息进行搜索处理过程中，针对知识类视频的操作信息；可选的，预设条件可以为预先设置的能够表征搜索信息具有搜索知识类视频意图的条件。可选的，历史搜索信息可以包括多个搜索信息，某一搜索信息对应的搜索操作信息满足预设条件可以为基于该搜索信息搜索到知识类视频后，点击并播放知识类视频，且该知识类视频的历史点击率大于等于预设点击率阈值。历史点击率可以为知识类视频被推送给用户后被点击的概率。预设点击率阈值可以结合实际应用进行设置，例如0.5等。

上述实施例中，从历史搜索信息中，结合历史搜索信息对应的搜索操作信息，筛选出搜索操作信息满足预设条件的搜索信息为目标搜索信息，可以有效保证筛选出的目标搜索信息对应的知识类视频视频搜索意图，进而可以提升构建的知识图谱的有效性。

在步骤S203中，从目标搜索信息中，提取第二数量个搜索文本对。

在一个具体的实施例中，任一搜索文本对可以包括存在搜索关联关系的知识点和词条。在一个可选的实施例中，上述从目标搜索信息中，提取第二数量个搜索文本对可以包括：

将目标搜索信息输入词条知识点识别网络进行词条知识点识别，得到第二数量个搜索文本对。

在一个具体的实施例中，目标搜索信息可以包括多个搜索信息，可选的，每一搜索信息可以对应一个搜索文本对；相应的，上述第二数量可以为搜索文本对的数量，也可以为目标搜索信息中搜索信息的数量。

在一个具体的实施例中，上述词条知识点识别网络可以为预先基于具有搜索文本对标签的训练搜索信息对应第二预设深度学习网络进行训练得到的。可选的，以训练搜索信息“AA怎么打野比较快”（假设AA为某一游戏中的虚拟人物）；可选的，搜索文本对标签可以包括词条“AA”和知识点“打野”。

在一个可选的实施例中，第二预设深度学习网络可以为BERT网络、TextCNN等深度学习网络。

上述实施例中，结合词条知识点识别网络进行词条知识点识别，可以快速精准的确定出目标搜索信息中的搜索文本对象。

在步骤S205中，对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱。

在一个具体的实施例中，上述初始知识图谱可以包括多个分支，多个分支以目标词条和目标知识点为节点，以目标词条和目标知识点间的搜索关联关系，以及目标知识点间的上下位关系为边；目标词条为第二数量个搜索文本对和第一数量个预设文本对中的词条；目标知识点为第二数量个搜索文本对和第一数量个预设文本对中的知识点。

在一个可选的实施例中，可以对第二数量个搜索文本对和第一数量个预设文本对进行去重后，以去重后文本对中的词条和知识点为节点，词条和知识点间的搜索关联关系，以及知识点间的上下位关系为边，构建上述初始知识图谱。

在另一个可选的实施例中，如图3所示，上述对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱可以包括：

在步骤S301中，对第二数量个搜索文本对和第一数量个预设文本对进行去重处理，得到第三数量个目标文本对；

在步骤S303中，对第三数量个目标文本对中同一词条对应的知识点进行聚类处理，得到第三数量个目标文本对中每一词条对应的初始聚类知识点；

在步骤S305中，基于初始聚类知识点对第三数量个目标文本对进行知识点去重处理，得到第四数量个目标文本对；

在步骤S307中，基于上下位识别网络，对第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果；

在步骤S309中，以第四数量个目标文本对中的词条和知识点为节点，以第四数量个目标文本对中的词条和知识点间的搜索关联关系，以及两两知识点间的上下位关系为边，构建初始知识图谱。

在一个具体的实施例中，对第二数量个搜索文本对和第一数量个预设文本对进行去重处理，得到第三数量个目标文本对可以包括删除第二数量个搜索文本对和第一数量个预设文本对中相同的文本对。相应的，第三数量可以为目标文本对的数量。

在一个可选的实施例中，如图4，上述对第三数量个目标文本对中同一词条对应的知识点进行聚类处理，得到第三数量个目标文本对中每一词条对应的初始聚类知识点可以包括以下步骤：

在步骤S401中，获取第三数量个目标文本对各自对应的文本对特征信息；

在步骤S403中，对第三数量个目标文本对中同一词条对应的文本对特征信息进行聚类处理，得到第三数量个目标文本对中每一词条对应的聚类特征中心；

在步骤S405中，确定同一词条对应的文本对特征信息中每一文本特征信息与对应的聚类特征中心间的相似度；

在步骤S407中，确定同一词条对应的文本对特征信息中对应的相似度最大的目标文本对特征信息；

在步骤S409中，将目标文本对特征信息对应的目标文本对中的知识点，作为初始聚类知识点。

在一个具体的实施例中，可以结合预设特征提取网络来获取每一目标文本对对应的文本对特征信息。可选的，预设特征提取网络可以为预先结合相似搜索信息对第三预设深度学习网络进行特征提取训练得到的。相似搜索信息可以为对应相同搜索目标的搜索信息。

在一个可选的实施例中，第三预设深度学习网络可以为BERT网络、深度（双向）循环神经网络、卷积神经网络等深度学习网络。

在一个可选的实施例中，可以每一词条对应的聚类特征中心可以包括一个或多个聚类特征信息，可选的，可以结合层级聚类、DBSCAN(Density-Based Spatial Clusteringof Applications with Noise、基于密度的聚类算法)等聚类算法进行聚类处理；可选的，文本特征信息与对应的聚类特征中心间的相似度可以包括但不限于文本特征信息与对应的聚类特征中心间的欧氏距离、余弦距离等。

上述实施例中，通过对第三数量个目标文本对中同一词条对应的文本对特征信息进行聚类处理，并结合每一词条对应的聚类特征中心和该词条对应的文本对特征信息间的相似度，筛选出相似度最大的目标文本对特征信息对应的目标文本对中的知识点，作为该词条的初始聚类知识点，可以实现知识点的去重，进而可以更好的提升后续知识图谱的有效性。

在一个具体的实施例中；可以基于每一词条对应的初始聚类知识点替换第三数量个目标文本对中该词条对应的知识点；并对替换知识点后的文本对进行去重处理，得到上述第四数量个目标文本对；第四数量可以为进行知识点去重处理后的目标文本对数量。

在一个具体的实施例中，上述上下位识别结果可以表征两两知识点间是否存在上下位关系；例如词条“柴犬”对应的知识点可以包括“养护”和“适合人群”，其中，知识点“养护”和知识点“适合人群”间具有上下位关系，且知识点“养护”为知识点“适合人群”的上位知识点；相应的，知识点为“适合人群”知识点“养护”的下位知识点。

在一个具体的实施例中，上述上下位识别网络可以为预先基于具有上下位关系标签的知识点对对第五预设深度学习模型进行上下位识别训练得到的。

在一个可选的实施例中，第五预设深度学习网络可以为BERT网络、TextCNN等深度学习网络。

上述实施例中，先对第二数量个搜索文本对和第一数量个预设文本对进行去重处理，结合通过对去重后的第三数量个目标文本对中同一词条对应的知识点进行聚类处理，可以结合每一词条对应的初始聚类知识点，对第三数量个目标文本对进行知识点去重处理，并对知识点去重处理后的第四数量个目标文本对进行知识点识别，可以更好的保证用于构建知识图谱的第五数量个目标文本对中知识点的有效性，且集合第五数量个目标文本对中两两知识点间的上下位关系，进行初始知识图谱的构建，可以保证知识图谱中知识点之间的层次关系，更好的提升了知识图谱的有效性，进而可以提升后续基于知识图谱进行搜索处理的精准性。

在一个可选的实施例中，在基于上下位识别网络，对第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，上下位识别结果表征两两知识点间是否存在上下位关系之前，上述方法还可以包括：

将第四数量个目标文本对输入知识点识别网络进行知识点识别，得到第四数量个目标文本对对应的知识点识别结果；

将第四数量个目标文本对中，对应知识点识别结果指示未包括知识点的目标文本对进行过滤，得到第五数量个目标文本对；

相应的，上述基于上下位识别网络，对第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，上下位识别结果表征两两知识点间是否存在上下位关系可以包括：

基于上下位识别网络，对第五数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，上下位识别结果表征两两知识点间是否存在上下位关系；

相应的，上述以第四数量个目标文本对中的词条和知识点为节点，以第四数量个目标文本对中的词条和知识点间的搜索关联关系，以及两两知识点间的上下位关系为边，构建初始知识图谱可以包括：

以第五数量个目标文本对中的词条和知识点为节点，以第五数量个目标文本对中的词条和知识点间的搜索关联关系，以及两两知识点间的上下位关系为边，构建初始知识图谱。

在一个具体的实施例中，上述知识点识别结果可以表征第四数量个目标文本对中是否包括知识点；具体的，知识点识别结果可以为目标文本对中包括知识点的概率。可选的，若某一目标文本对对应的知识点识别结果表征该目标文本对中不包括知识点，可以过滤掉该目标文本对。相应的，第五数量可以为基于知识点识别结果进行文本对过滤后的目标文本对的数量。

在一个具体的实施例中，上述知识点识别网络可以为预先基于具有知识点标签的训练文本对第四预设深度学习网络进行知识点识别训练得到的；可选的，具有知识点的训练文本对对应的知识点标签可以为1，反之为0；

在一个可选的实施例中，第四预设深度学习网络可以为BERT网络、TextCNN等深度学习网络。

上述实施例中，在对用于构建初始知识图谱的文本对象进行上下位识别之前，将第四数量个目标文本对输入知识点识别网络进行知识点识别，得到第四数量个目标文本对对应的知识点识别结果；并将第四数量个目标文本对中，对应知识点识别结果指示未包括知识点的目标文本对进行过滤，可以更好的提升构建知识图谱的知识点词条的有效性。

在一个可选的实施例中，在对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱之前，上述方法还可以包括：

对第二数量个搜索文本对进行聚合处理，得到第六数量个搜索文本对组；

确定每个搜索文本对组中文本对数量；

将第六数量个搜索文本对组中文本对数量不大于预设数量阈值的搜索文本对组进行过滤，得到第七数量个搜索文本对组；

相应的，上述对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱包括：

对第七数量个搜索文本对组中的搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱。

在一个具体的实施例中，每个搜索文本对组包括至少一个相同的搜索文本对；上述对第二数量个搜索文本对进行聚合处理，得到第六数量个搜索文本对组可以包括将相同搜索文本对聚合到同一组中。相应的，第六数量可以为搜索文本对组的数量。可选的，可以过滤掉文本对数量不大于预设数量阈值的搜索文本对组。

在一个具体的实施例中，上述对第七数量个搜索文本对组中的搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱的具体细化，可以参见上述对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱的相关细化步骤，在此不再赘述。

上述实施例中，在进行搜索文本对和预设文本对融合之前，先过滤掉搜索量较少的搜索文本对，进而可以更好的提升后续构建知识图谱的知识点词条的有效性。

在一个可选的实施例中，在对第七数量个搜索文本对组中的搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱之前，上述方法还可以包括：

从第七数量个搜索文本对组中分别抽取一个搜索文本对，得到第七数量个搜索文本对；

确定第七数量个搜索文本对中词条在对应的目标搜索信息中的位置信息；

将位置信息和目标搜索信息输入实体识别网络进行实体识别，得到第七数量个搜索文本对中词条对应的实体识别结果；

基于实体识别结果，对第七数量个搜索文本对进行实体链接，得到第七数量个目标搜索文本对；

相应的，上述对第七数量个搜索文本对组中的搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱可以包括：

对第七数量个目标搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱。

在一个具体的实施例中，实体识别结果可以表征搜索文本对中词条的对应的实体；可选的，以词条“AA”为例，实体“AA”可以包括歌手AA和游戏中的虚拟人物AA；可选的，通过实体识别结合可以确定搜索文本对中词条“AA”是歌手AA还是虚拟人物AA；可选的，假设搜索文本对中词条“AA”为虚拟人物AA；可以将实体“虚拟人物AA”对应的实体标识信息作为搜索文本对中词条“AA”的标识信息，进而实现实体的链接。

在一个具体的实施例中，实体识别网络可以为预先基于具有实体标签的训练搜索信息和训练搜索信息中实体词条的位置信息对第六预设深度学习网络进行训练得到的。

在一个可选的实施例中，第六预设深度学习网络可以为BERT网络、TextCNN等深度学习网络。

在一个具体的实施例中，上述对第七数量个目标搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱的具体细化，可以参见上述对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱的相关细化步骤，在此不再赘述。

上述实施例中，结合实体识别网络对第七数量个搜索文本对中词条进行实体识别，并结合实体识别结果对第七数量个搜索文本对中词条进行实体链接，可以有效避免词条的歧义，进而可以更好提升后续构建知识图谱的词条的有效性。

在步骤S207中，基于初始知识图谱中每一分支上的词条和知识点，从目标知识类视频中，筛选出每一分支对应的挂载视频；

在一个可选的实施例中，上述基于初始知识图谱中每一分支上的词条和知识点，从目标知识类视频中，筛选出每一分支对应的挂载视频可以包括：

对每一分支上的词条和知识点进行特征提取处理，得到每一分支对应的分支特征信息；获取目标知识类视频的视频特征信息；确定分支特征信息与视频特征信息间的关联信息；基于关联信息，从目标知识类视频中，确定每一分支对应的挂载视频。

在一个具体的实施例中，可以将同一分支上述的词条和知识点进行拼接后，结合特征提取网络进行特征提取处理，得到每一分支对应的分支特征信息。

在一个可选的实施例中，可以通过获取目标知识类视频的文本描述信息（例如标题等），并结合文本描述信息，提取视频特征信息；可选的，也可以获取目标知识类视频的多模态信息（文本信息、图像信息、音频信息等），并结合多模态信息，提取视频特征信息。

在一个可选的实施例中，分支特征信息与视频特征信息间的关联信息可以为表征分支特征信息与视频特征信息间关联程度的数值，也可以为表征分支特征信息与视频特征信息间关联程度的字符化表征，例如中、高、低等；可选的，可以通过计算分支特征信息与视频特征信息间的距离，来确定关联信息，例如欧式距离，余弦距离等。

在一个可选的实施例中，以关联信息为数值为例，可以将目标知识类视频中对应的关联信息大于等于预设关联阈值的知识视频作为每一分支对应的挂载视频。

上述实施例中，结合初始知识图谱中每一分支对应的分支特征信息和目标知识类视频的视频特征信息间的关联信息，可以快速精准的筛选出每一分支对应的挂载视频。

在步骤S209中，基于初始知识图谱和每一分支对应的挂载视频，构建目标知识图谱。

在一个可选的实施例中，可以直接将每一分支对应的挂载视频挂载到初始知识图谱中每一分支的末尾节点上，以得到目标知识图谱。

在另一个可选的实施例中，如图5所示，上述基于初始知识图谱和每一分支对应的挂载视频，构建目标知识图谱可以包括以下步骤：

在步骤S2091中，确定每一分支对应的挂载视频的视频数量；

在步骤S2093中，去除初始知识图谱中视频数量不大于预设阈值的分支，得到中间知识图谱；

在步骤S2095中，将中间知识图谱中每一分支对应的挂载视频挂载到中间知识图谱中，得到目标知识图谱。

在一个具体的实施例中，预设阈值可以结合实际应用预先设置。将中间知识图谱中每一分支对应的挂载视频挂载到中间知识图谱中，得到目标知识图谱可以包括将中间知识图谱中每一分支对应的挂载视频挂载到中间知识图谱中每一分支的末尾节点上，得到目标知识图谱。

上述实施例中，结合初始知识图谱中每一分支对应的挂载视频的视频数量，去除挂载视频较少的分支，可以有效保证知识图谱中每一词条知识点的有效性，进而可以提升基于目标知识图谱进行搜索处理的精准性和有效性，帮助用户搜索到需要了解的知识内容。

在一个具体的实施例中，如图6所示，图6是根据一示例性实施例提供的一种目标知识图谱的示意图。可选的，在实际应用中，还可以将现有的多层级的词条知识图谱与上述目标知识图谱进行合并，以更好的提升后续的搜索结果。

由以上本说明书实施例提供的技术方案可见，本说明书中在构建目标知识图谱的过程中，从具有搜索知识类视频意图的目标搜索信息中提取包括词条和知识点的搜索文本对，并将搜索文本对和预设知识库中的预设文本对进行融合，构建出包括以词条和知识点为节点，以词条和知识点间的搜索关联关系，以及知识点间的上下位关系为边的多个分支的初始知识图谱，并在初始知识图谱中挂载每一分支对应的目标知识类视频，可以实现基于目标知识图谱的视频搜索，在大大提升搜索应用的全面性的基础上，可以大大提升目标知识图谱对搜索信息的表征精准性和有效性，进而也可以优化视频内容生态，鼓励创作者发表一些知识类的视频以及提升后续搜索的精准性和有效性。

基于上述的知识图谱构建方法得到的目标知识图谱，以下介绍本公开提供的一种视频搜索方法，如图7所示，图7是根据一示例性实施例示出的一种视频搜索方法的流程图，该视频搜索方法用于终端、或服务器等电子设备中，包括以下步骤。

在步骤S701中，响应于搜索指令，获取搜索指令对应的搜索信息；

在步骤S703中，基于搜索信息和目标知识图谱，从目标知识图谱对应的挂载视频中，确定目标搜索视频；

在一个具体的实施例中，搜索指令对应的搜索信息可以为用户输入的搜索信息。可选的，可以提取搜索信息对应的搜索特征信息，以及目标知识图谱中每一分支对应的分支特征信息；并结合搜索特征信息和分支特征信息间的关联程度，将关联程度大于预设关联程度阈值的分支所挂载的视频（挂载视频）作为目标搜索视频。具体的，每一分支对应的分支特征信息可以结合该分支上的词条、知识点和视频描述信息进行特征提取得到。

在实际应用中，也可以结合目标知识图谱中每一分支对应的知识点和词条，搜索与该知识点词条关联的文本信息等。

由以上本说明书实施例提供的技术方案可见，本说明书中结合目标知识图谱进行视频搜索处理，可以在提升搜索的精准性和有效性的基础上，优化视频内容生态，鼓励创作者发表一些知识类的视频。

图8是根据一示例性实施例示出的一种知识图谱构建装置框图。参照图8，该装置包括：

信息获取模块810，被配置为执行获取目标知识类视频、目标搜索信息和预设知识库中的第一数量个预设文本对，目标搜索信息为具有搜索知识类视频意图的搜索信息，任一预设文本对包括存在搜索关联关系的知识点和词条；

搜索文本对提取模块820，被配置为执行从目标搜索信息中，提取第二数量个搜索文本对，任一搜索文本对包括存在搜索关联关系的知识点和词条；

融合处理模块830，被配置为执行对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱；初始知识图谱包括多个分支，多个分支以目标词条和目标知识点为节点，以目标词条和目标知识点间的搜索关联关系，以及目标知识点间的上下位关系为边；目标词条为第二数量个搜索文本对和第一数量个预设文本对中的词条；目标知识点为第二数量个搜索文本对和第一数量个预设文本对中的知识点；

挂载视频筛选模块840，被配置为执行基于初始知识图谱中每一分支上的词条和知识点，从目标知识类视频中，筛选出每一分支对应的挂载视频；

目标知识图谱构建模块850，被配置为执行基于初始知识图谱和每一分支对应的挂载视频，构建目标知识图谱。

在一个可选的实施例中，融合处理模块830包括：

去重处理单元，被配置为执行对第二数量个搜索文本对和第一数量个预设文本对进行去重处理，得到第三数量个目标文本对；

聚类处理单元，被配置为执行对第三数量个目标文本对中同一词条对应的知识点进行聚类处理，得到第三数量个目标文本对中每一词条对应的初始聚类知识点；

知识点去重处理单元，被配置为执行基于初始聚类知识点对第三数量个目标文本对进行知识点去重处理，得到第四数量个目标文本对；

知识点识别单元，被配置为执行基于知识点识别网络，对第四数量个目标文本对进行知识点识别，确定第五数量个目标文本对；

上下位识别单元，被配置为执行基于上下位识别网络，对第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，上下位识别结果表征两两知识点间是否存在上下位关系；

初始知识图谱构建单元，被配置为执行以第四数量个目标文本对中的词条和知识点为节点，以第四数量个目标文本对中的词条和知识点间的搜索关联关系，以及两两知识点间的上下位关系为边，构建初始知识图谱。

在一个可选的实施例中，聚类处理模块包括：

特征匹配处理单元，被配置为执行获取第三数量个目标文本对各自对应的文本对特征信息；

聚类处理子单元，被配置为执行对第三数量个目标文本对中同一词条对应的文本对特征信息进行聚类处理，得到第三数量个目标文本对中每一词条对应的聚类特征中心；

相似度确定单元，被配置为执行确定同一词条对应的文本对特征信息中每一文本特征信息与对应的聚类特征中心间的相似度；

目标文本对特征信息确定单元，被配置为执行确定同一词条对应的文本对特征信息中对应的相似度最大的目标文本对特征信息；

聚类知识点确定单元，被配置为执行将目标文本对特征信息对应的目标文本对中的知识点，作为初始聚类知识点。

在一个可选的实施例中，融合处理模块830还包括：

知识点识别单元，被配置为执行将第四数量个目标文本对输入知识点识别网络进行知识点识别，得到第四数量个目标文本对对应的知识点识别结果，知识点识别结果表征第四数量个目标文本对中是否包括知识点；

文本对过滤单元，被配置为执行将第四数量个目标文本对中，对应知识点识别结果指示未包括知识点的目标文本对进行过滤，得到第五数量个目标文本对；

上下位识别单元还被配置为执行基于上下位识别网络，对第五数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，上下位识别结果表征两两知识点间是否存在上下位关系；

初始知识图谱构建单元还被配置为执行：以第五数量个目标文本对中的词条和知识点为节点，以第五数量个目标文本对中的词条和知识点间的搜索关联关系，以及两两知识点间的上下位关系为边，构建初始知识图谱。

在一个可选的实施例中，上述装置还包括：

聚合处理模块，被配置为执行在对第二数量个搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱之前，对第二数量个搜索文本对进行聚合处理，得到第六数量个搜索文本对组，每个搜索文本对组包括至少一个相同的搜索文本对；

文本对数量确定模块，被配置为执行确定每个搜索文本对组中文本对数量；

搜索文本对组过滤模块，被配置为执行将第六数量个搜索文本对组中文本对数量不大于预设数量阈值的搜索文本对组进行过滤，得到第七数量个搜索文本对组；

融合处理模块830还被配置为执行对第七数量个搜索文本对组中的搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱。

在一个可选的实施例中，上述装置还包括：

搜索文本对抽取模块，被配置为执行在对第七数量个搜索文本对组中的搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱之前，从第七数量个搜索文本对组中分别抽取一个搜索文本对，得到第七数量个搜索文本对；

位置信息确定模块，被配置为执行确定第七数量个搜索文本对中词条在对应的目标搜索信息中的位置信息；

实体识别模块，被配置为执行将位置信息和目标搜索信息输入实体识别网络进行实体识别，得到第七数量个搜索文本对中词条对应的实体识别结果；

实体链接模块，被配置为执行基于实体识别结果，对第七数量个搜索文本对进行实体链接，得到第七数量个目标搜索文本对；

融合处理模块830还被配置为执行对第七数量个目标搜索文本对和第一数量个预设文本对进行融合处理，得到初始知识图谱。

在一个可选的实施例中，信息获取模块810包括：

信息获取单元，被配置为执行获取历史搜索信息和历史搜索信息对应的搜索操作信息，搜索操作信息为基于历史搜索信息进行搜索处理过程中，针对知识类视频的操作信息；

目标搜索信息筛选单元，被配置为执行从历史搜索信息中，筛选出搜索操作信息满足预设条件的目标搜索信息。

在一个可选的实施例中，挂载视频筛选模块840包括：

特征提取处理单元，被配置为执行对每一分支上的词条和知识点进行特征提取处理，得到每一分支对应的分支特征信息；

文本特征信息获取单元，被配置为执行获取目标知识类视频的视频特征信息；

关联信息确定单元，被配置为执行确定分支特征信息与视频特征信息间的关联信息；

挂载视频确定单元，被配置为执行基于关联信息，从目标知识类视频中，确定每一分支对应的挂载视频。

在一个可选的实施例中，目标知识图谱构建模块850包括：

视频数量确定单元，被配置为执行确定每一分支对应的挂载视频的视频数量；

分支单元，被配置为执行去除初始知识图谱中视频数量不大于预设阈值的分支，得到中间知识图谱；

视频挂载单元，被配置为执行将中间知识图谱中每一分支对应的挂载视频挂载到中间知识图谱中，得到目标知识图谱。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图9是根据一示例性实施例示出的一种视频搜索装置框图。参照图9，该装置包括：

搜索信息获取模块910，被配置为执行响应于搜索指令，获取搜索指令对应的搜索信息；

目标搜索视频确定模块920，被配置为执行基于搜索信息和目标知识图谱，从目标知识图谱对应的挂载视频中，确定目标搜索视频；

其中，目标知识图谱为根据上述知识图谱构建方法构建得到的。

图10是根据一示例性实施例示出的一种用于知识图谱构建或视频搜索的电子设备的框图，该电子设备可以是终端，其内部结构图可以如图10所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种知识图谱构建或视频搜索方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该电子设备的输入装置可以是显示屏上覆盖的触摸层，也可以是电子设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

图11是根据一示例性实施例示出的一种用于知识图谱构建或视频搜索的电子设备的框图，该电子设备可以是服务器，其内部结构图可以如图11所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种知识图谱构建或视频搜索方法。

本领域技术人员可以理解，图10或图11中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在示例性实施例中，还提供了一种电子设备，包括：处理器；用于存储该处理器可执行指令的存储器；其中，该处理器被配置为执行该指令，以实现如本公开实施例中的知识图谱构建方法。

在示例性实施例中，还提供了一种计算机可读存储介质，当该存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例中的知识图谱构建方法。

在示例性实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例中的知识图谱构建方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种知识图谱构建方法，其特征在于，包括：

2.根据权利要求1所述的知识图谱构建方法，其特征在于，所述对所述第二数量个搜索文本对和所述第一数量个预设文本对进行融合处理，得到初始知识图谱包括：

3.根据权利要求2所述的知识图谱构建方法，其特征在于，所述对所述第三数量个目标文本对中同一词条对应的知识点进行聚类处理，得到所述第三数量个目标文本对中每一词条对应的初始聚类知识点包括：

4.根据权利要求2所述的知识图谱构建方法，其特征在于，在所述基于上下位识别网络，对所述第四数量个目标文本对中两两知识点进行上下位识别，得到上下位识别结果，所述上下位识别结果表征所述两两知识点间是否存在所述上下位关系之前，所述方法还包括：

5.根据权利要求1至4任一所述的知识图谱构建方法，其特征在于，在所述对所述第二数量个搜索文本对和所述第一数量个预设文本对进行融合处理，得到初始知识图谱之前，所述方法还包括：

确定所述每个搜索文本对组中文本对数量；

6.根据权利要求5所述的知识图谱构建方法，其特征在于，在所述对所述第七数量个搜索文本对组中的搜索文本对和所述第一数量个预设文本对进行融合处理，得到所述初始知识图谱之前，所述方法还包括：

7.根据权利要求1至4任一所述的知识图谱构建方法，其特征在于，所述目标搜索信息采用下述方式获取：

8.根据权利要求1至4任一所述的知识图谱构建方法，其特征在于，所述基于所述初始知识图谱中每一分支上的词条和知识点，从所述目标知识类视频中，筛选出所述每一分支对应的挂载视频包括：

获取所述目标知识类视频的视频特征信息；

确定所述分支特征信息与所述视频特征信息间的关联信息；

9.根据权利要求1至4任一所述的知识图谱构建方法，其特征在于，所述基于所述初始知识图谱和所述每一分支对应的挂载视频，构建目标知识图谱包括：

确定所述每一分支对应的挂载视频的视频数量；

10.一种视频搜索方法，其特征在于，包括：

响应于搜索指令，获取所述搜索指令对应的搜索信息；

其中，所述目标知识图谱为根据权利要求1至9任一所述的知识图谱构建方法构建得到的。

11.一种知识图谱构建装置，其特征在于，包括：

12.一种视频搜索装置，其特征在于，包括：

13.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至9中任一项所述的知识图谱构建方法或如权利要求10所述的视频搜索方法。

14.一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至9中任一项所述的知识图谱构建方法或如权利要求10所述的视频搜索方法。