CN112784062A

CN112784062A - 一种成语知识图谱构建方法及装置

Info

Publication number: CN112784062A
Application number: CN202110116579.8A
Authority: CN
Inventors: 李长亮; 汪美玲; 郭昱; 唐剑波
Original assignee: Chengdu Kingsoft Interactive Entertainment Technology Co ltd; Beijing Kingsoft Software Co Ltd
Current assignee: Chengdu Kingsoft Interactive Entertainment Technology Co ltd; Beijing Kingsoft Software Co Ltd
Priority date: 2019-03-15
Filing date: 2019-03-15
Publication date: 2021-05-11
Anticipated expiration: 2039-03-15
Also published as: CN109977233A; CN112784063A; CN112784062B; CN109977233B; CN112784063B

Abstract

本发明实施例提供了一种成语知识图谱构建方法，该方法包括：获取多个待处理成语及每个待处理成语的描述信息；针对每个待处理成语，对该待处理成语的描述信息进行分析，确定该待处理成语对应的标签；基于所述多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建所述多个待处理成语的知识图谱。这样，可以基于描述信息为每个待处理成语确定对应的标签，并基于标签与待处理成语之间的关联关系构建知识图谱，当用户进行成语查询时，可以根据某一标签确定多个对应的成语，相比于根据特定成语或特定关键词搜索成语的方法，有助于用户从更多侧面获取成语信息，满足用户的成语使用需求。

Description

一种成语知识图谱构建方法及装置

技术领域

本发明涉及信息存储技术领域，特别是涉及一种成语知识图谱构建方法及装置。

背景技术

现有的网络成语词典中，存储着大量成语的信息，包括每个成语的读音、释义、出处、近义词、反义词等，从而可以为用户提供成语相关的服务。

相关技术中，通常采用关系型数据库存储成语信息，这样，用户可以通过搜索特定成语，查询该特定成语的相关信息，或者，通过搜索成语释义中的特定关键词，查询与该特定关键词相关的成语及其相关信息。

但是，在关系型数据库中，用户很难从更多侧面获取成语信息，例如，虽然“古稀之年”和“耄耋之年”都是关于年龄的成语，但是，用户通过搜索“年龄”，难以同时获得这两个成语的信息，因此，相关技术难以满足用户的成语使用需求。

发明内容

本发明实施例的目的在于提供一种成语知识图谱构建方法及装置，以实现从更多侧面获取成语信息，满足用户的成语使用需求。具体技术方案如下：

本发明实施例提供了一种成语知识图谱构建方法，所述方法包括：

获取多个待处理成语及每个待处理成语的描述信息；

针对每个待处理成语，对该待处理成语的描述信息进行分析，确定该待处理成语对应的标签；

基于所述多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建所述多个待处理成语的知识图谱。

可选的，所述针对每个待处理成语，对该待处理成语的描述信息进行分析，确定该待处理成语对应的标签，包括：

对所述描述信息进行分词处理，得到所述待处理成语对应的词语列表；

从所述词语列表中，筛选与所述待处理成语的语义相似度满足预设条件的词语，作为所述待处理成语对应的标签。

可选的，所述对所述描述信息进行分词处理，得到所述待处理成语对应的词语列表，包括：

过滤所述描述信息中的停用词及符号，得到过滤信息；

对所述过滤信息进行分词处理，得到所述待处理成语对应的词语列表。

可选的，在所述从所述词语列表中，筛选与所述待处理成语的语义相似度满足预设条件的词语，作为所述待处理成语对应的标签之前，所述方法还包括：

获取所述词语列表中每个词语的关联词，将所述关联词添加至所述词语列表中；

判断所述词语列表中的词语数量是否发生变化，若是，则返回所述获取所述词语列表中每个词语的关联词，将所述关联词添加至所述词语列表中的步骤，若否，则执行所述从所述词语列表中，筛选与所述待处理成语的语义相似度满足预设条件的词语，作为所述待处理成语对应的标签的步骤。

可选的，所述基于所述多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建所述多个待处理成语的知识图谱，包括：

分别生成所述多个待处理成语对应的成语实体及每个待处理成语对应的标签对应的标签实体；

基于所述多个待处理成语及每个待处理成语对应的标签之间的关联关系，建立每个成语实体及每个标签实体之间的关联关系，得到所述多个待处理成语的知识图谱。

可选的，所述描述信息中包括：所述待处理成语的读音、释义及出处。

可选的，在所述对所述知识图谱进行存储之后，所述方法还包括：

获取待查询词语；

在所述知识图谱中，查询与所述待查询词语相匹配的标签，作为目标标签；

输出与所述目标标签对应的待处理成语。

本发明实施例还提供了一种成语知识图谱构建装置，所述装置包括：

获取模块，用于获取多个待处理成语及每个待处理成语的描述信息；

确定模块，用于针对每个待处理成语，对该待处理成语的描述信息进行分析，确定该待处理成语对应的标签；

构建模块，用于基于所述多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建所述多个待处理成语的知识图谱。

可选的，所述确定模块，具体用于：

过滤所述描述信息中的停用词及符号，得到过滤信息；

可选的，所述确定模块，还用于：

判断所述词语列表中的词语数量是否发生变化，若是，则返回所述获取所述词语列表中每个词语的关联词，将所述关联词添加至所述词语列表中的步骤，若否，则执行所述从所述词语列表中，筛选与所述待处理成语语义相似度满足预设条件的词语，作为所述待处理成语对应的标签的步骤。

可选的，所述构建模块，具体用于：

可选的，所述装置还包括：

查询模块，用于获取待查询词语；在所述知识图谱中，查询与所述待查询词语相匹配的标签，作为目标标签；输出与所述目标标签对应的待处理成语。

本发明实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一所述的成语知识图谱构建方法。

本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的成语知识图谱构建方法。

本发明实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的成语知识图谱构建方法。

本发明实施例提供的成语知识图谱构建方法及装置，首先，获取多个待处理成语及每个待处理成语的描述信息，针对每个待处理成语，对该待处理成语的描述信息进行分析，确定该待处理成语对应的标签，然后，基于多个待处理成语及每个待处理成语对应的标签，构建多个待处理成语的知识图谱。这样，可以基于描述信息为每个待处理成语确定对应的标签，并基于标签与待处理成语之间的关联关系构建知识图谱，当用户进行成语查询时，可以根据某一标签确定多个对应的成语，相比于根据特定成语或特定关键词搜索成语的方法，有助于用户从更多侧面获取成语信息，满足用户的成语使用需求。当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种成语知识图谱构建方法的流程示意图；

图2为本发明实施例提供的另一种成语知识图谱构建方法的流程示意图；

图3为本发明实施例提供的一种成语知识图谱构建装置的结构示意图；

图4为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

相比于现有技术，本发明实施例提供了一种成语知识图谱构建方法，计算机、服务器或其他电子设备可以利用该方法构建成语知识图谱。

下面从总体上对本发明实施例提供的成语知识图谱构建方法进行说明。

获取多个待处理成语及每个待处理成语的描述信息；

基于多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建多个待处理成语的知识图谱。

由以上可见，本发明实施例提供的成语知识图谱构建方法及装置，可以基于描述信息为每个待处理成语确定对应的标签，并基于标签与待处理成语之间的关联关系构建知识图谱，当用户进行成语查询时，可以根据某一标签确定多个对应的成语，相比于根据特定成语或特定关键词搜索成语的方法，有助于用户从更多侧面获取成语信息，满足用户的成语使用需求。

下面将通过具体的实施例，对本发明实施例提供的成语知识图谱构建方法进行详细描述。

如图1所示，为本发明实施例提供的一种成语知识图谱构建方法的流程示意图，包括如下步骤：

S101：获取多个待处理成语及每个待处理成语的描述信息。

一些场景中，本电子设备(执行主体)会获取一些待处理成语，并对这些待处理成语进行存储，以便于用户对这些待处理成语进行查询、浏览等操作。而对待处理成语的不同存储方式对应着对其的不同的查询方式。

在本步骤中，待处理成语可以为任意字数的成语，每个待处理成语都具有其对应的描述信息，这些描述信息可以对待处理成语进行描述，以将其与其他的成语进行区分。其中，描述信息中可以包括待处理成语的读音、释义及出处等信息中的一种或多种，具体不做限定。

S102：针对每个待处理成语，对该待处理成语的描述信息进行分析，确定该待处理成语对应的标签。

在获取多个待处理成语及每个待处理成语的描述信息之后，可以对每个待处理成语的描述信息进行分析，分别确定每个待处理成语对应的标签，其中，每个待处理成语可以对应唯一的一个标签，也可以对应多个标签，不同的成语可能对应同一标签，也可能对应不同的标签，具体不做限定。

一种实现方式中，对每个待处理成语的描述信息进行分析，确定待处理成语对应的标签的方式，可以为：首先，对描述信息进行分词处理，得到待处理成语对应的词语列表，然后，从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，作为待处理成语对应的标签。

举例而言，可以采用最短路径算法对描述信息进行分词处理：首先，对描述信息进行切分处理，将描述信息切分为多个词串数据，根据词串数据之间的关联关系，构建词串数据之间的关联图。然后，利用预设的词频概率算法，对关联图进行计算，得到词串数据的每个关联词的词频概率。针对每个词串数据，根据该词串数据的每个关联词的词频概率，消除在对描述信息进行切分时产生的歧义，从而更准确的识别出原始文本数据中的词语。或者，也可以采用n元语法模型方法、最大匹配算法、交叉歧义算法等方式，本发明实施例对此不作限定。

另外，可以采用杰卡德相似系数算法或余弦相似度算法计算每个词语与待处理成语的语义相似度，进而从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，或者，也可以由工作人员对词语列表中的词语和待处理成语进行人工审核，从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，其中，预设条件可以为语义相似度最高的词语，也可以是语义相似度达到预设阈值的词语，具体不做限定。

其中，对描述信息进行分词处理，得到待处理成语对应的词语列表时，可以先过滤描述信息中的停用词及符号，得到过滤信息，然后，对过滤信息进行分词处理，得到待处理成语对应的词语列表。

这样，可以过滤描述信息中重复或无用的信息，得到更有效的词语列表，从而进一步提高标签提取的效率和准确度。

另外，在从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，作为待处理成语对应的标签之前，还可以对词语列表中的词语进行关联概括处理，具体的，首先，可以获取词语列表中每个词语的关联词，将关联词添加至词语列表中，然后，判断词语列表中的词语数量是否发生变化，若发生变化，则继续对词语列表中的词语进行关联概括处理，直至词语列表中的词语数量不发生变化，再从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，作为待处理成语对应的标签。

其中，每个词语的关联词可以是该词语的近义词、同义词，比如，若该词语为“年龄”，那么，关联词可以为“年纪”，或者，关联词也可以是该词语的上位词，比如，若该词语为“五十岁”，那么，关联词可以为“年龄”，等等。获取每个词语的关联词时，可以在预设的语义词典中进行查询，或者，也可以将该词语输入至预先训练得到的算法模型中进行计算，得到该词语的关联词，具体不做限定。

这样，可以使得词语列表中的词语可以更加丰富，更具有概括性，从而也进一步提高标签提取的效率和准确度。

举例而言，“古稀之年”的描述信息为“人能活到七十岁，自古以来很稀少”，“耄耋之年”的描述信息为“年纪十分大的时候”，在获取到这两个待处理成语及其描述信息之后，可以对描述信息进行分词处理，得到待处理成语对应的词语列表，其中，“古稀之年”的词语列表可以为“人\七十岁\稀少”，“耄耋之年”的词语列表可以为“年纪\大”，然后，可以对词语列表中的词语进行上位概括，比如，“七十岁”的关联词为“年龄”，“年纪”的关联词也为“年龄”，进而，可以从词语列表中，筛选与待处理成语相似度最高的词语，作为待处理成语对应的标签，这样，“古稀之年”和“耄耋之年”对应的标签可以均为“年龄”。

S103：基于多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建多个待处理成语的知识图谱。

其中，知识图谱又称为科学知识图谱，是一种知识域可视化映射地图，可以利用可视化技术描述知识资源及其载体。也就是说，基于多个待处理成语及每个待处理成语对应的标签之间的关联关系，可以构建多个待处理成语的知识图谱，从而可视化地对这些待处理成语进行描述，从而有助于用户挖掘、分析、构建、绘制和显示这些成语及它们之间的相互联系。

举例而言，基于多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建多个待处理成语的知识图谱的方式，可以为：首先，分别生成多个待处理成语对应的成语实体及每个待处理成语对应的标签对应的标签实体，然后，基于多个待处理成语及每个待处理成语对应的标签之间的关联关系，建立每个成语实体及每个标签实体之间的关联关系，得到多个待处理成语的知识图谱。

一种实现方式中，在构建多个待处理成语的知识图谱之后，用户可以利用知识图谱进行成语查询。

举例而言，用户可以输入任一待查询词语，电子设备(本执行主体)在获取待查询词语之后，可以在知识图谱中，查询与待查询词语相匹配的标签，作为目标标签，然后，输出与目标标签对应的待处理成语。这样，用户就可以查询到与待查询词语有关的所有成语。

比如，当用户输入“年龄”，电子设备(本执行主体)可以在知识图谱中，查询与“年龄”相匹配的标签，然后，输出与目标标签对应的待处理成语，如“古稀之年”和“耄耋之年”，这样，可以进一步满足用户的成语使用需求。

由以上可见，本发明实施例提供的成语知识图谱构建方法，可以为每个待处理成语确定对应的标签，并基于标签与待处理成语之间的关联关系构建知识图谱，对知识图谱进行存储，使得所存储得成语更有条理，以便于用户根据标签对成语进行查询，相比于根据特定成语或特定关键词搜索成语的方法，有助于用户从更多侧面获取成语信息，满足用户的成语使用需求。

如图2所示，为本发明实施例提供的另一种成语知识图谱构建方法的流程示意图，包括如下步骤：

S201：获取多个待处理成语及每个待处理成语的描述信息。

S202：过滤描述信息中的停用词及符号，得到过滤信息。

可以先过滤描述信息中的停用词及符号，得到过滤信息，然后，对过滤信息进行分词处理，得到待处理成语对应的词语列表。

S203：对过滤信息进行分词处理，得到待处理成语对应的词语列表。

举例而言，可以采用最短路径算法对描述信息进行分词处理：首先，对描述信息进行切分处理，将描述信息切分为多个词串数据，根据词串数据之间的关联关系，构建词串数据之间的关联图。然后，利用预设的词频概率算法，对关联图进行计算，得到词串数据的每个关联词的词频概率。针对每个词串数据，根据该词串数据的每个关联词的词频概率，消除在对描述信息进行切分时产生的歧义，从而更准确的识别出原始文本数据中的词语。

或者，也可以采用n元语法模型方法、最大匹配算法、交叉歧义算法等方式，本发明实施例对此不作限定。

S204：获取词语列表中每个词语的关联词，将关联词添加至词语列表中。

S205：判断词语列表中的词语数量是否发生变化，若是，则返回S204，若否，则执行S206。

举例而言，首先，可以获取词语列表中每个词语的关联词，将关联词添加至词语列表中，然后，判断词语列表中的词语数量是否发生变化，若发生变化，则继续对词语列表中的词语进行上位概括，直至词语列表中的词语数量不发生变化，再从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，作为待处理成语对应的标签。

S206：从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，作为待处理成语对应的标签。

举例而言，可以采用杰卡德相似系数算法或余弦相似度算法计算每个词语与待处理成语的语义相似度，进而从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，或者，也可以由工作人员对词语列表中的词语和待处理成语进行人工审核，从词语列表中，筛选与待处理成语的语义相似度满足预设条件的词语，其中，预设条件可以为语义相似度最高的词语，也可以是语义相似度达到预设阈值的词语，具体不做限定。

其中，每个待处理成语可以对应唯一的一个标签，也可以对应多个标签，不同的成语可能对应同一标签，也可能对应不同的标签，具体不做限定。

S207：基于多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建多个待处理成语的知识图谱。

本发明实施例还提供了一种成语知识图谱构建装置，如图3所示，为本发明实施例提供的一种成语知识图谱构建装置的结构示意图，该装置包括：

获取模块301，用于获取多个待处理成语及每个待处理成语的描述信息；

确定模块302，用于针对每个待处理成语，对该待处理成语的描述信息进行分析，确定该待处理成语对应的标签；

构建模块303，用于基于所述多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建所述多个待处理成语的知识图谱。

一种实现方式中，所述确定模块302，具体用于：

过滤所述描述信息中的停用词及符号，得到过滤信息；

一种实现方式中，所述确定模块302，还用于：

一种实现方式中，所述构建模块303，具体用于：

一种实现方式中，所述描述信息中包括：所述待处理成语的读音、释义及出处。

一种实现方式中，所述装置还包括：

查询模块304，用于获取待查询词语；在所述知识图谱中，查询与所述待查询词语相匹配的标签，作为目标标签；输出与所述目标标签对应的待处理成语。

由以上可见，本发明实施例提供的成语知识图谱构建装置，可以为每个待处理成语确定对应的标签，并基于标签与待处理成语之间的关联关系构建知识图谱，对知识图谱进行存储，使得所存储得成语更有条理，以便于用户根据标签对成语进行查询，相比于根据特定成语或特定关键词搜索成语的方法，有助于用户从更多侧面获取成语信息，满足用户的成语使用需求。

本发明实施例还提供了一种电子设备，如图4所示，包括处理器401、通信接口402、存储器403和通信总线404，其中，处理器401，通信接口402，存储器403通过通信总线404完成相互间的通信，

存储器403，用于存放计算机程序；

处理器401，用于执行存储器403上所存放的程序时，实现如下步骤：

获取多个待处理成语及每个待处理成语的描述信息；

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

由以上可见，本发明实施例提供的成语知识图谱构建方法及装置，可以为每个待处理成语确定对应的标签，并基于标签与待处理成语之间的关联关系构建知识图谱，对知识图谱进行存储，使得所存储得成语更有条理，以便于用户根据标签对成语进行查询，相比于根据特定成语或特定关键词搜索成语的方法，有助于用户从更多侧面获取成语信息，满足用户的成语使用需求。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的成语知识图谱构建方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的成语知识图谱构建方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例、电子设备实施例和存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种成语知识图谱构建方法，其特征在于，所述方法包括：

获取多个待处理成语及每个待处理成语的描述信息；

过滤所述描述信息中的目标信息，得到过滤信息；其中，所述目标信息包括重复信息或指定的无用信息；

对所述过滤信息进行分词处理，得到所述待处理成语对应的词语列表；

从所述词语列表中，筛选与所述待处理成语的语义相似度满足预设条件的词语，作为所述待处理成语对应的标签；

2.根据权利要求1所述的方法，其特征在于，所述基于所述多个待处理成语及每个待处理成语对应的标签之间的关联关系，构建所述多个待处理成语的知识图谱，包括：

3.根据权利要求1所述的方法，其特征在于，所述描述信息中包括：所述待处理成语的读音、释义及出处。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在对所述知识图谱进行存储之后，获取待查询词语；

输出与所述目标标签对应的待处理成语。

5.根据权利要求1所述的方法，其特征在于，所述对所述过滤信息进行分词处理，得到所述待处理成语对应的词语列表，包括：

采用最短路径算法对所述过滤信息进行分词处理，得到所述待处理成语对应的词语列表。

6.根据权利要求5所述的方法，其特征在于，所述采用最短路径算法对所述过滤信息进行分词处理，得到所述待处理成语对应的词语列表，包括：

对所述过滤信息进行切分处理，得到多个词串数据；

根据所述词串数据之间的关联关系，构建所述词串数据之间的关联图；

利用预设的词频概率算法，对所述关联图进行计算，得到所述词串数据的每个关联词的词频概率；

针对每个词串数据，根据该词串数据的每个关联词的词频概率，得到所述待处理成语对应的词语列表。

7.根据权利要求1所述的方法，其特征在于，在所述从所述词语列表中，筛选与所述待处理成语的语义相似度满足预设条件的词语，作为所述待处理成语对应的标签之前，所述方法还包括：

基于预设相似度算法，计算所述词语列表中的每个词语与所述待处理成语的语义相似度；其中，所述预设相似度算法为杰卡德相似系数算法或余弦相似度算法。

8.一种成语知识图谱构建装置，其特征在于，所述装置包括：

确定模块，用于过滤所述描述信息中的目标信息，得到过滤信息；其中，所述目标信息包括重复信息或指定的无用信息；对所述过滤信息进行分词处理，得到所述待处理成语对应的词语列表；从所述词语列表中，筛选与所述待处理成语的语义相似度满足预设条件的词语，作为所述待处理成语对应的标签；

9.根据权利要求8所述的装置，其特征在于，所述构建模块，具体用于：

10.根据权利要求8所述的装置，其特征在于，所述描述信息中包括：所述待处理成语的读音、释义及出处。

11.根据权利要求8所述的装置，其特征在于，所述装置还包括：

12.根据权利要求7所述的装置，其特征在于，所述确定模块，具体用于采用最短路径算法对所述过滤信息进行分词处理，得到所述待处理成语对应的词语列表。

13.根据权利要求12所述的装置，其特征在于，所述确定模块，具体用于对所述过滤信息进行切分处理，得到多个词串数据；

14.根据权利要求8所述的装置，其特征在于，所述装置还包括：

语义相似度计算模块，用于在从所述词语列表中，筛选与所述待处理成语的语义相似度满足预设条件的词语，作为所述待处理成语对应的标签之前，基于预设相似度算法，计算所述词语列表中的每个词语与所述待处理成语的语义相似度；其中，所述预设相似度算法为杰卡德相似系数算法或余弦相似度算法。

15.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-7任一所述的方法。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法。