CN114328961A

CN114328961A - 客服领域知识图谱构建方法、装置、计算机设备及介质

Info

Publication number: CN114328961A
Application number: CN202111629923.XA
Authority: CN
Inventors: 张雪冰
Original assignee: Agricultural Bank of China
Current assignee: Agricultural Bank of China
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2022-04-12

Abstract

本发明公开了一种客服领域知识图谱构建方法、装置、计算机设备及介质。所述方法包括：基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本；基于所述第一文本确定多个第一标签关键词，所述第一标签关键词为具有词性含义的关键词；基于所述多个第一标签关键词构建客服领域知识图谱。利用该方法，能够通过用户已授权的通话语音中的第一语音在线构建客服领域知识图谱，实现知识图谱构建精简化和智能化。

Description

客服领域知识图谱构建方法、装置、计算机设备及介质

技术领域

本发明实施例涉及智能客服技术领域，尤其涉及一种客服领域知识图谱构建方法、装置、计算机设备及介质。

背景技术

人工智能与大数据时代的到来为坐席客服提供了一种新的解决思路。部分服务行业搭建智能客服系统，用于客户咨询服务，提高工作效率，释放人力资源。

智能客服系统基于知识图谱构建，目前银行领域的知识图谱基于历史数据或存量数据进行离线构建，无法保证数据源的时效性，需要定期对知识图谱进行优化更新，对知识图谱进行优化更新的过程需要耗费大量的人力物力。

发明内容

本发明实施例提供了一种客服领域知识图谱构建方法、装置、计算机设备及介质，能够通过第一通话语音在线构建客服领域知识图谱，实现知识图谱构建精简化和智能化。

第一方面，本发明实施例提供了一种客服领域知识图谱构建方法，包括：

基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本；

基于所述第一文本确定多个第一标签关键词，所述第一标签关键词为具有词性含义的关键词；

基于所述多个第一标签关键词构建客服领域知识图谱。

第二方面，本发明实施例还提供了一种客服领域知识图谱构建装置，包括：

第一确定模块，用于基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本；

第二确定模块，用于基于所述第一文本确定多个第一标签关键词，所述第一标签关键词为具有词类含义的关键词；

构建模块，用于基于所述多个第一标签关键词构建客服领域知识图谱。

第三方面，本发明实施例还提供了一种计算机设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器用于实现本发明任意实施例中所述的客服领域知识图谱构建方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例所提供的客服领域知识图谱构建方法。

本发明实施例提供了一种客服领域知识图谱构建方法、装置、计算机设备及介质，首先基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本；然后基于所述第一文本确定多个第一标签关键词，所述第一标签关键词为具有词性含义的关键词；之后基于所述多个第一标签关键词构建客服领域知识图谱。利用上述技术方案，能够通过用户已授权的通话语音中的第一语音在线构建客服领域知识图谱，实现知识图谱构建精简化和智能化。

附图说明

图1为本发明实施例一所提供的一种客服领域知识图谱构建方法的流程示意图；

图2为本发明实施例二所提供的一种客服领域知识图谱构建方法的流程示意图；

图3为本发明示例实施例所提供的一种客服领域知识图谱构建方法的示例流程图；

图4为本发明实施例三所提供的一种客服领域知识图谱构建装置的结构示意图；

图5为本发明实施例四所提供的一种计算机设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的实施例。虽然附图中显示了本发明的某些实施例，然而应当理解的是，本发明可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是，本发明的附图及实施例仅用于示例性作用，并非用于限制本发明的保护范围。

应当理解，本发明的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本发明的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本发明实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

现有银行的传统客服服务存在通讯费、培训费、人力资源等成本，并且会受到时间和场地等条件的限制。随着客户量的增长，庞大的咨询需求往往会让人工客服团队不堪重负，因此，在企业现代化、信息化、智能化发展的浪潮下，以银行数据在线构建客服领域知识图谱为基础的智能客服系统应运而生，逐渐应用于在线智能客服领域。

实施例一

图1为本发明实施例一所提供的一种客服领域知识图谱构建方法的流程示意图，该方法可适用于用户使用在线智能客服的情况，该方法可以由客服领域知识图谱构建装置来执行，其中该装置可由软件和/或硬件实现，并一般集成在计算机备上。

如图1所示，本发明实施例一提供的一种客服领域知识图谱构建方法，包括如下步骤：

S110、基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本。

其中，通话语音可以为用户已授权的通话语音，通话语音可以从人工客服系统获取，当用户通话结束时可以从人工客服服务系统获取用户已授权的通话记录，通话记录包括用户的通话语音。

其中，第一语音可以理解为用户已授权的通话语音中的一段语音，优选的，第一语音可以为用户已授权的通话语音中的生成时间最早的一段语音。

可以理解的是，由于用户的发音模式、说话的清晰度、语义上下文以及噪音干扰均会对通话语音的识别造成干扰，因此，需要对第一通话语音进行预处理，用于降低语音识别处理过程的复杂度降低干扰，提高第一语音识别的准确率。

在本实施例中，得到第一语音对应的第一文本的方式可以为：对第一语音进行预处理，对预处理后的通话语音进行语音识别得到第一文本。

其中，语音识别技术可以通过识别和解析过程将语音信号转换为对应的文本内容。

具体的，所述基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本，包括：对用户已授权的通话语音中的第一语音进行预处理得到语音信号，所述预处理包括静音切除、噪音处理以及语音增强；将所述语音信号进行特征提取得到声学特征向量；通过语音识别模型对所述声学特征向量进行识别，得到对应的第一文本。

其中，通过语言预处理技术可以对第一语音进行静音切除、噪声处理以及语音增强等处理，得到语音信号。

其中，语音识别模型可以为任意一种能够对语音进行识别的模型，示例性的，语音识别模型可以为隐马尔可夫模型。隐马尔可夫模型为语音信号处理中的一种传统模型，由于该模型的模式库是通过反复训练形成的，与训练输出信号吻合概率最大的最佳模型参数而不是预先存储好的模式样本，且其识别过程中运用待识别语音序列与隐马尔可夫模型参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出，因此是一种较理想的语音识别模型。

在本实施例中，将语音信号转变为文本的过程可以包括特征提取、模式匹配以及模型训练。该过程可以采用基于倒谱的MFCC特征提取算法将声音波形转换为可供计算的声学特征向量，运用隐马尔可夫模型进行模式匹配。

其中，MFCC特征提取算法可以通过模数转换、预加重、分帧加窗进行前期处理，使能量集中于声波高频部分，增加声学模型对高频共振峰的利用率，从而提高语音识别准确率。前期处理后的语音信号可以经过离散傅里叶变换和滤波器将分布在不同能量分布频域上的信号特征转换为相对人耳听觉敏感度较高的具有特性的声学特征向量，经过DCT离线余弦倒谱变换处理声学特征向量提高识别性能。

S120、基于所述第一文本确定多个第一标签关键词。

其中，所述第一标签关键词为具有词性含义的关键词。第一标签关键词可以为第一文本中对文本特征具有贡献的最小单位粒度的词语。

在本实施例中，可以使用自然语言处理技术对第一文本进行分词操作，得到文本中的第一标签关键词。

其中，自然语言处理是人工智能技术的一个重要子领域，包括语音合成、语音识别、中文分词以及词性标注等内容，此处重点应用自然语言处理中的分词处理以及词性标注。

具体的，所述基于所述第一文本确定多个第一标签关键词，包括：对所述第一文本进行预设处理得到多个关键词；将所述多个关键词添加词类标签得到多个第一标签关键词。

其中，一个关键词可以具有多个词类标签，通过对词类标签进行索引可以加速在知识图谱中查找节点。

其中，预设处理可以包括预料清洗、分词操作、词性标注、剔除停用词、实体识别。

其中，将第一文本经过语料清洗去除噪音数据后，可以通过分词操作将短文本和长文本处理为最小单位粒度的词语，并剔除对文本特征没有任何贡献的子词，最后通过为每个词语达词类标签，可以为对象层级建立融入更多有用的语音信息。

其中，将关键词添加词类标签后才能进行语义分析，进而得到语义信息。

示例性的，若第一文本中包括“你好，能告诉我网点的具体地址吗”，得到多个关键词可以包括“网点”、“地址”，将关键词“网点”打上场景类标签，将关键词“地址”打上地址类标签。

S130、基于所述多个第一标签关键词构建客服领域知识图谱。

其中，知识图谱可以使用资源描述框架(Reource Description FrameWork，RDF)描述资源的特征或资源-资源之间的一种关系，并以资源-属性-属性值的三元组形成存储。领域知识图谱包括对象、条件、属性、参数、关系，对象即该图谱的实体，条件是对象的修饰语用于实例具体化对象，属性是对象的不同特征，属性可逐级展开，参数即实例化对象的属性的修饰语，不同对象通过图谱的“边”即“关系”进行关联。领域知识图谱是将某一领域的专业词汇，实体和简称融合到知识图谱中。

在本实施例中，构建客服领域知识图谱的过程可以为：根据分词结果即多个第一标签关键词，按照语义组合对象属性生成对象的树状结构，深度遍历以构建知识图谱，生成的所有的叶子节点将作为最终的知识检索结果。

具体的，所述基于所述多个第一标签关键词构建客服领域知识图谱，包括：将所述多个第一标签关键词进行语义分析，确定每个第一标签关键词的语义信息；根据所述语义信息确定各第一标签关键词之间的属性路径；从所述多个标签关键词中确定出对象，所述对象为所述多个第一标签关键词中的实体词；基于所述对象、所述多个第一标签关键词以及所述各第一标签关键词之间的属性路径生成所述对象对应的树状结构；对所述树状结构进行深度遍历得到客服领域知识图谱；其中，所述树状结构包括所述对象的子节点、下级子节点以及叶子节点，所述叶子节点为所述对象及所述属性路径对应的知识检索结果。

其中，可以利用语言识别技术确定文本中的对象，一个文本可以包括至少一个对象。属性路径可以表示各第一标签关键词之间的对应关系。

其中，所述树状结构包括所述对象的子节点、下级子节点以及叶子节点，所述叶子节点即所述对象对应的知识检索结果。

表1为本发明实施例一所提供的一种客服领域知识图谱构建方法中的一种树状结构关系表，表1中将网点作为对象，体现了网点的树状结构关系。

表1本发明实施例一提供的一种树状结构关系表

示例性的，将网点作为对象，该对象的子节点可以包括“大堂经理”以及“业务”，其中，“大堂经理”的下级子节点可以包括“联系方式”和“家庭住址”，其中，联系方式对应的下级子节点可以包括“微信”和“手机号”；“家庭住址”的下级子节点可以包括“现住地址”和“籍贯”；其中，“业务”的下级子节点可以包括“储蓄”和“贷款”，其中，“储蓄”的下级子节点可以包括“活期”和“定期”；“贷款”的下级子节点可以包括“资质”和“材料”。示例性的，表1中的知识检索结果可以包括：网点的大堂经理的微信号。

在本实施例中，对树状结构进行深度遍历后可以确定对象、条件、属性、参数以及关系，基于对象、条件、属性、参数以及关系构建客服领域知识图谱，此处对构建的具体过程不做赘述。

需要进一步说明的是，根据客服领域知识图谱确定出用户提问的最终结果后，可以在智能座席中，针对用户的提问结果返回应答语句给用户。

本发明实施例一提供的一种客服领域知识图谱构建方法，首先基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本；然后基于所述第一文本确定多个第一标签关键词；之后基于所述多个第一标签关键词构建客服领域知识图谱。上述方法通过用户已授权的通话语音中的第一语音生成对象的树状结构，在线构建客服领域知识图谱，实现知识实时入库，从而可以保证客服知识图谱的时效性。

实施例二

图2为本发明实施例二所提供的一种客服领域知识图谱构建方法的流程示意图，本实施例二在上述各实施例的基础上进行优化。本实施例尚未详尽的内容请参考实施例一。

如图2所示，本发明实施例二提供的一种客服领域知识图谱构建方法，包括如下步骤：

S210、基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本。

S220、基于所述第一文本确定多个第一标签关键词。

S230、基于所述多个第一标签关键词构建客服领域知识图谱。

S240、获取用户已授权的通话语音中的第二语音。

其中，第二语音为用户已授权的通话语音中的一段语音，第二语音的生成时间晚于第一语音的生成时间，第二通话语音的内容与第一通话语音的内容不同。

S250、基于所述第二语音对所述客服领域知识图谱进行更新。

在本实施例中，基于第二语音对客服领域知识图谱进行更新可以包括：基于所述第二语音得到所述第二语音对应的第二文本；基于所述第二文本确定多个第二标签关键词；基于所述多个第二标签关键词对所述客服领域知识图谱进行更新。

其中，基于通话语音得到第二文本的过程与基于第一语音得到第一文本的过程相同，此处不做重复说明。其中，基于第二文本确定多个第二标签关键词的过程与得到第一关键词的过程相同，此处不做赘述。

其中，基于第二标签关键词对客服领域知识图谱进行更新可以包括：从第二标签关键词中提取询问对象，在客服领域知识图谱中进行询问对象检索以及所述询问对象的属性路径检索，根据检索结果对所述客服领域知识图谱进行更新。

具体的，所述基于所述多个第二标签关键词对所述客服领域知识图谱进行更新，包括：从所述多个第二标签关键词中选取出询问对象；检索所述知识图谱中是否存在所述询问对象；若否，则将所述询问对象对应的树状结构添加至所述知识图谱；若是，则检索所述客服领域知识图谱中是否存在所述询问对象对应的属性路径。

示例性的，若询问对象为“网点”，询问条件为“xx支行”，首先检索客服领域知识图谱中是否存在xx支行网点，若不存在，则可以创建该询问对象，并生成询问对象的树状化结构，将询问对象的树状化结构添加到客服领域知识图谱中；若存在，则检索客服领域知识图谱中是否存在询问对象对应的属性路径。

进一步的，所述基于所述多个第二标签关键词对所述客服领域知识图谱进行更新，还包括：若不存在，则将所述询问对象对应的属性路径添加至所述客服领域知识图谱；生成所述询问对象对应的叶子节点，以扩充所述客服领域知识图谱的属性路径；若存在，则结合所述客服领域知识图谱，深度遍历所述询问对象对应的树状结构，缩小所述客服领域知识图谱中的属性路径检索范围，更新所述属性路径，直至缩小至叶子节点。

其中，深度遍历询问对象对应的树状结构包括深度遍历询问对象的当前节点、各级子节点以及进行节点回溯。节点回溯可以理解为遍历相邻节点以及相邻节点的各级子节点，直到得到知识检索结果。于此，可以将询问对象对应的所有节点进行遍历，即客服领域知识图谱更新完成。

需要进行一步说明的是，本方案更新后的客服领域知识图谱可以用于后续智能回答。

本发明实施例二提供的一种客服领域知识图谱构建方法，具体化了对客服领域知识图谱进行更新的过程。该方法从第二语音中实时提取关键词，通过扩充知识图谱的实体属性的方式，能够动态更新客服领域知识图谱。

本发明实施例在上述各实施例的技术方案的基础上，提供了一种具体的实施方式。

图3为本发明示例实施例所提供的一种客服领域知识图谱构建方法的示例流程图，如图3所示，该方法可以包括如下过程：

从第一语音中获取分词结果即第一标签关键词，基于分词结果得到对象的树状化结构构建客服领域知识图谱，从第二语音中确定出对象即询问对象，检索客服领域知识图谱中是否存在该对象，若不存在，则进行全量扩展即将询问对象对应的树状化结构全部添加到客服领域知识图谱中，进行知识建立或更新，判断路径是否检索完毕，若否则继续进行节点回溯，直到所有节点遍历完成。

若客服领域知识图谱中存在该对象，则对该对象的树状结构进行深度遍历，确定是否存在路径即询问对象对应的属性路径，若存在，则继续判断路径检索是否完毕，若否，则继续进行节点回溯，直到所有节点遍历完成。

若不存在路径，则进行增量扩展，即建立询问对象的属性路径，知识建立或更新后，判断路径是否检索完毕，若否，则进行节点回溯，直到所有节点遍历完成。

本发明示例实施例提供的一种客服领域知识图谱构建方法，在智能客服语音通话的过程中，利用语音识别技术，将语音转换为文本，再通过自然语言处理从文本中提取关键词，基于这些关键词生成树状结构，深度遍历并回溯，以构建或优化客服领域知识图谱，实现实时更新客服领域知识图谱的目的。

实施例三

图4为本发明实施例三所提供的一种客服领域知识图谱构建装置的结构示意图，该装置可适用于用户使用在线智能客服的情况，其中该装置可由软件和/或硬件实现，并一般集成在计算机设备上。

如图4所示，该装置包括：第一确定模块110、第二确定模块120以及构建模块130。

第一确定模块110，用于基于用户已授权的通话语音中的第一语音得到所述第一通话语音对应的第一文本；

第二确定模块120，用于基于所述第一文本确定多个第一标签关键词，所述第一标签关键词为具有词类含义的关键词；

构建模块130，用于基于所述多个第一标签关键词构建客服领域知识图谱。

在本实施例中，该装置首先通过第一确定模块110基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本；然后通过第二确定模块120基于所述第一文本确定多个第一标签关键词，所述第一标签关键词为具有词性含义的关键词；最后通过构建模块130基于所述多个第一标签关键词构建客服领域知识图谱。

本实施例提供了一种客服领域知识图谱构建装置，能够通过第一语音在线构建客服领域知识图谱，实现知识图谱构建精简化和智能化。

进一步的，第一确定模块110具体用于：对所述用户已授权的通话语音中的第一语音进行预处理得到语音信号，所述预处理包括静音切除、噪音处理以及语音增强；将所述语音信号进行特征提取得到声学特征向量；通过语音识别模型对所述声学特征向量进行识别，得到对应的第一文本。

在上述优化的基础上，第二确定模块120具体用于：对所述第一文本进行预设处理得到多个关键词；将所述多个关键词添加词类标签得到多个第一标签关键词。

基于上述技术方案，构建模块130具体用于：将所述多个第一标签关键词进行语义分析，确定每个第一标签关键词的语义信息；根据所述语义信息确定各第一标签关键词之间的属性路径；从所述多个标签关键词中确定出对象，所述对象为所述多个第一标签关键词中的实体词；基于所述对象、所述多个第一标签关键词以及所述各第一标签关键词之间的属性路径生成所述对象对应的树状结构；对所述树状结构进行深度遍历得到客服领域知识图谱；其中，所述树状结构包括所述对象的子节点、下级子节点以及叶子节点，所述叶子节点为所述对象以及所述属性路径对应的知识检索结果。

进一步的，所述装置还包括获取模块，用于获取用户已授权的通话语音中的第二语音，所述第二语音的生成时间晚于所述第一语音的生成时间。

进一步的，所述装置还包括更新模块，用于基于所述第二通话语音对所述客服领域知识图谱进行更新。

进一步的，更新模块具体用于：基于所述第二语音得到所述第二语音对应的第二文本；基于所述第二文本确定多个第二标签关键词；基于所述多个第二标签关键词对所述客服领域知识图谱进行更新。

进一步的，所述基于所述多个第二标签关键词对所述客服领域知识图谱进行更新，包括：从所述多个第二标签关键词中选取出询问对象；检索所述客服领域知识图谱中是否存在所述询问对象；若否，则将所述询问对象对应的树状结构添加至所述客服领域知识图谱；若是，则检索所述客服领域知识图谱中是否存在所述询问对象对应的属性路径。

进一步的，所述基于所述多个第二标签关键词对所述客服领域知识图谱进行更新，还包括：若不存在，则将所述询问对象对应的属性路径添加至所述知识图谱；生成所述询问对象对应的叶子节点，以扩充所述客服领域知识图谱的属性路径；若存在，则结合所述客服领域知识图谱，深度遍历所述询问对象对应的树状结构，更新所述属性路径，直至缩小至叶子节点。

上述客服领域知识图谱构建装置可执行本发明任意实施例所提供的客服领域知识图谱构建方法，具备执行方法相应的功能模块和有益效果。

实施例四

图5为本发明实施例四所提供的一种计算机设备的结构示意图。如图5所示，本发明实施例四提供的计算机设备包括：一个或多个处理器41和存储装置42；该计算机设备中的处理器41可以是一个或多个，图5中以一个处理器41为例；存储装置42用于存储一个或多个程序；所述一个或多个程序被所述一个或多个处理器41执行，使得所述一个或多个处理器41实现如本发明实施例中任一项所述的客服领域知识图谱构建方法。

所述计算机设备还可以包括：输入装置43和输出装置44。

计算机设备中的处理器41、存储装置42、输入装置43和输出装置44可以通过总线或其他方式连接，图5中以通过总线连接为例。

该计算机设备中的存储装置42作为一种计算机可读存储介质，可用于存储一个或多个程序，所述程序可以是软件程序、计算机可执行程序以及模块，如本发明实施例一或二所提供的客服领域知识图谱构建方法对应的程序指令/模块(例如，附图4所示的客服领域知识图谱构建装置中的模块，包括：第一确定模块110、第二确定模块120以及构建模块130)。处理器41通过运行存储在存储装置42中的软件程序、指令以及模块，从而执行计算机设备的各种功能应用以及数据处理，即实现上述方法实施例中的客服领域知识图谱构建方法。

存储装置42可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储装置42可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置42可进一步包括相对于处理器41远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置43可用于接收输入的数字或字符信息，以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置44可包括显示屏等显示设备。

并且，当上述计算机设备所包括一个或者多个程序被所述一个或者多个处理器41执行时，程序进行如下操作：

基于所述多个第一标签关键词构建客服领域知识图谱。

实施例五

本发明实施例五提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时用于执行客服领域知识图谱构建方法，该方法包括：

基于所述多个第一标签关键词构建客服领域知识图谱。

可选的，该程序被处理器执行时还可以用于执行本发明任意实施例所提供的客服领域知识图谱构建方法。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是，但不限于，电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory，RAM)、只读存储器(Read Only Memory，ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory，EPROM)、闪存、光纤、便携式CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于：电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、无线电频率(Radio Frequency，RF)等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种客服领域知识图谱构建方法，其特征在于，所述方法包括：

基于所述多个第一标签关键词构建客服领域知识图谱。

2.根据权利要求1所述的方法，其特征在于，所述基于用户已授权的通话语音中的第一语音得到所述第一语音对应的第一文本，包括：

对用户已授权的通话语音中的第一语音进行预处理得到语音信号，所述预处理包括静音切除、噪音处理以及语音增强；

将所述语音信号进行特征提取得到声学特征向量；

通过语音识别模型对所述声学特征向量进行识别，得到对应的第一文本。

3.根据权利要求1所述的方法，其特征在于，所述基于所述第一文本确定多个第一标签关键词，包括：

对所述第一文本进行预设处理得到多个关键词；

将所述多个关键词添加词类标签得到多个第一标签关键词。

4.根据权利要求1所述的方法，其特征在于，所述基于所述多个第一标签关键词构建客服领域知识图谱，包括：

将所述多个第一标签关键词进行语义分析，确定每个第一标签关键词的语义信息；

根据所述语义信息确定各第一标签关键词之间的属性路径；

从所述多个标签关键词中确定出对象，所述对象为所述多个第一标签关键词中的实体词；

基于所述对象、所述多个第一标签关键词以及所述各第一标签关键词之间的属性路径生成所述对象对应的树状结构；

对所述树状结构进行深度遍历得到客服领域知识图谱；

其中，所述树状结构包括所述对象的子节点、下级子节点以及叶子节点，所述叶子节点为所述对象以及所述属性路径对应的知识检索结果。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述用户已授权的通话语音中的第二语音，所述第二语音的生成时间晚于所述第一语音的生成时间；

基于所述第二语音得到所述第二语音对应的第二文本；

基于所述第二文本确定多个第二标签关键词；

基于所述多个第二标签关键词对所述客服领域知识图谱进行更新。

6.根据权利要求5所述的方法，其特征在于，所述基于所述多个第二标签关键词对所述客服领域知识图谱进行更新，包括：

从所述多个第二标签关键词中选取出询问对象；

检索所述客服领域知识图谱中是否存在所述询问对象；

若否，则将所述询问对象对应的树状结构添加至所述客服领域知识图谱；

若是，则检索所述客服领域知识图谱中是否存在所述询问对象对应的属性路径。

7.根据权利要求6所述的方法，其特征在于，所述基于所述多个第二标签关键词对所述客服领域知识图谱进行更新，还包括：

若不存在，则将所述询问对象对应的属性路径添加至所述客服领域知识图谱；

生成所述询问对象对应的叶子节点，以扩充所述客服领域知识图谱的属性路径；

若存在，则结合所述客服领域知识图谱，深度遍历所述询问对象对应的树状结构，缩小所述客服领域知识图谱中的属性路径检索范围，更新所述属性路径，直至缩小至叶子节点。

8.一种客服领域知识图谱构建装置，其特征在于，所述装置包括：

第二确定模块，用于基于所述第一文本确定多个第一标签关键词，所述第一标签关键词为具有词性含义的关键词；

9.一种计算机设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器用于执行权利要求1-7任一项所述的客服领域知识图谱构建方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7任一项所述的客服领域知识图谱构建方法。