CN112331201A

CN112331201A - 语音的交互方法和装置、存储介质、电子装置

Info

Publication number: CN112331201A
Application number: CN202011209302.1A
Authority: CN
Inventors: 李立辉; 宋德超; 贾巨涛; 吴伟; 黄姿荣
Original assignee: Gree Electric Appliances Inc of Zhuhai; Zhuhai Lianyun Technology Co Ltd
Current assignee: Gree Electric Appliances Inc of Zhuhai; Zhuhai Lianyun Technology Co Ltd
Priority date: 2020-11-03
Filing date: 2020-11-03
Publication date: 2021-02-05

Abstract

本申请公开了一种语音的交互方法和装置、存储介质、电子装置。其中，该方法包括：确定目标用户的知识图谱，其中，所述目标用户的知识图谱是使用所述目标用户的历史对话数据构建得到的；在与所述目标用户进行对话的过程中，使用所述目标用户的知识图谱生成对话语句。本申请解决了相关技术中语音助手不能为用户提供个性化服务的技术问题。

Description

语音的交互方法和装置、存储介质、电子装置

技术领域

本申请涉及语音助手领域，具体而言，涉及一种语音的交互方法和装置、存储介质、电子装置。

背景技术

随着技术的进步和科技的发展，语音助手一直是一个热点，ASR和TTS已经愈发的成熟，但是在NLU方面却有着很大的欠缺。语音助手已经在我们的生活中随处可见了，但是因为其欠缺的地方导致很少人使用，例如，不能为用户提供个性化的需求。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种语音的交互方法和装置、存储介质、电子装置，以至少解决相关技术中语音助手不能为用户提供个性化服务的技术问题。

根据本申请实施例的一个方面，提供了一种语音的交互方法，包括：确定目标用户的知识图谱，其中，所述目标用户的知识图谱是使用所述目标用户的历史对话数据构建得到的；在与所述目标用户进行对话的过程中，使用所述目标用户的知识图谱生成对话语句。

可选地，在确定目标用户的知识图谱之前，获取与所述目标用户之间的历史对话数据；对所述历史对话数据进行自然语言处理、知识抽取以及知识融合，得到所述目标用户的知识图谱。

可选地，在对所述历史对话数据进行自然语言处理、知识抽取以及知识融合，得到所述目标用户的知识图谱时，对所述历史对话数据进行实体提取、句法分析以及句式分析，得到自然语言处理的处理结果；对自然语言处理的处理结果进行实体抽取、关系抽取以及属性抽取，得到知识抽取的抽取结果；对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到所述目标用户的知识图谱。

可选地，在对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到所述目标用户的知识图谱时，对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到知识融合结果；利用所述知识融合结果得到所述目标用户的个人知识图谱；将所述目标用户的个人知识图谱与通用知识图谱结合，得到所述目标用户的知识图谱。

可选地，在获取与所述目标用户之间的历史对话数据时，获取第一历史对话数据，其中，所述第一历史对话数据为根据制定好的提问场景进行提问得到的对话数据；获取第二历史对话数据，其中，所述第二历史对话数据为从与所述目标用户之间的对话数据中筛选出来的部分对话数据。

可选地，在确定目标用户的知识图谱之前，采集所述目标用户的声纹信息，建立所述目标用户的声纹信息与所述目标用户的知识图谱之间的关联；确定目标用户的知识图谱包括：获取所述目标用户的声纹信息；将声纹信息与所述目标用户的声纹信息匹配的知识图谱作为所述目标用户的知识图谱。

可选地，在使用所述目标用户的知识图谱生成对话语句时，根据目标用户的提问语句在所述目标用户的知识图谱中进行知识检索；根据知识检索的结果生成对话语句。

根据本申请实施例的另一方面，还提供了一种语音的交互装置，包括：确定单元，用于确定目标用户的知识图谱，其中，所述目标用户的知识图谱是使用所述目标用户的历史对话数据构建得到的；交互单元，用于在与所述目标用户进行对话的过程中，使用所述目标用户的知识图谱生成对话语句。

可选地，本申请的装置还包括：预处理单元，用于在确定目标用户的知识图谱之前，获取与所述目标用户之间的历史对话数据；对所述历史对话数据进行自然语言处理、知识抽取以及知识融合，得到所述目标用户的知识图谱。

可选地，预处理单元还用于在对所述历史对话数据进行自然语言处理、知识抽取以及知识融合，得到所述目标用户的知识图谱时，对所述历史对话数据进行实体提取、句法分析以及句式分析，得到自然语言处理的处理结果；对自然语言处理的处理结果进行实体抽取、关系抽取以及属性抽取，得到知识抽取的抽取结果；对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到所述目标用户的知识图谱。

可选地，预处理单元还用于在对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到所述目标用户的知识图谱时，对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到知识融合结果；利用所述知识融合结果得到所述目标用户的个人知识图谱；将所述目标用户的个人知识图谱与通用知识图谱结合，得到所述目标用户的知识图谱。

可选地，预处理单元还用于在获取与所述目标用户之间的历史对话数据时，获取第一历史对话数据，其中，所述第一历史对话数据为根据制定好的提问场景进行提问得到的对话数据；获取第二历史对话数据，其中，所述第二历史对话数据为从与所述目标用户之间的对话数据中筛选出来的部分对话数据。

可选地，预处理单元还用于在确定目标用户的知识图谱之前，采集所述目标用户的声纹信息，建立所述目标用户的声纹信息与所述目标用户的知识图谱之间的关联；确定单元还用于确定目标用户的知识图谱时，获取所述目标用户的声纹信息；将声纹信息与所述目标用户的声纹信息匹配的知识图谱作为所述目标用户的知识图谱。

可选地，交互单元还用于在使用所述目标用户的知识图谱生成对话语句时，根据目标用户的提问语句在所述目标用户的知识图谱中进行知识检索；根据知识检索的结果生成对话语句。

根据本申请实施例的另一方面，还提供了一种存储介质，该存储介质包括存储的程序，程序运行时执行上述的方法。

根据本申请实施例的另一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器通过计算机程序执行上述的方法。

在本申请实施例中，用户在使用语音助手的时候，采用知识图谱的技术，从语音交互对话的过程中抽取出信息丰富的知识图谱，个性化的知识图谱让语音助手更加的人性化，结合从用户身长获得的信息进行语音交互，可以解决相关技术中语音助手不能为用户提供个性化服务的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种可选的语音的交互方法的流程图；

图2是根据本申请实施例的一种可选的语音的交互方案的示意图；

图3是根据本申请实施例的一种可选的语音的交互装置的示意图；

以及

图4是根据本申请实施例的一种终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

大多数的语音助手都是面向大众，缺少定制化和个性化，根据本申请实施例的一方面，提供了一种语音的交互方法的方法实施例，针对这一问题提出一种基于知识图谱的个人语音助手，让语音助手个人化，语音助手从对话中学习并且构建个人的一个知识图谱，根据学习到的知识图谱进行决策。图1是根据本申请实施例的一种可选的语音的交互方法的流程图，如图1所示，该方法可以包括以下步骤：

步骤S1，确定目标用户的知识图谱，所述目标用户的知识图谱是使用所述目标用户的历史对话数据构建得到的。语音助手从与用户的对话中学习，并且构建知识图谱，提升语义理解的能力。

步骤S2，在与所述目标用户进行对话的过程中，使用所述目标用户的知识图谱生成对话语句。

通过上述步骤，用户在使用语音助手的时候，采用知识图谱的技术，从语音交互对话的过程中抽取出信息丰富的知识图谱，个性化的知识图谱让语音助手更加的人性化，结合从用户身长获得的信息进行语音交互，可以解决相关技术中语音助手不能为用户提供个性化服务的技术问题。

作为一种可选的实施例，如图2所示，下文结合具体的实施方式进一步详述本申请的技术方案。

目前语音助手多数都是通用型的，面向的是大众用户所需要的功能，本方案提出了一种基于知识图谱的个人语音助手，在通用的基础上加上一些个性化，通常用户与语音助手进行闲聊的时候，往往语音助手都是被动式的聊天。设计提问的场景，引导用户对问题进行回答，以此来丰富个人知识图谱。

1、分为主动提问和被动筛选，主动提问：预先设计好提问场景，有针对性的获取对话。被动筛选，被动的获取用户的对话，即对所有进行闲聊的对话都进行匹配，进而提取出有用的信息来丰富完善这样一个个人知识图谱。

2、实体提取、句法分析、句式分析：例如我们的提问场景，“你喜欢看什么类型的电影？”，“我喜欢喜剧”。实体提取出“喜剧”，句法分析依存关系：主谓关系，(我<--喜欢)；动宾关系，(喜欢-->喜剧)。

3、实体抽取，“我”、“喜剧”；关系抽取：“喜欢”；属性抽取：“电影类型”。

4、将抽取到的三元组进行数据融合，并与用户的声纹数据在个人知识图谱中存储。采集声纹数据是为了确认用户身份，进而对个人知识图谱进行丰富。

5、经过这样一个流程，我们就逐步丰富了用户的个人知识图谱。丰富个人知识图谱需要进行场景的设计，避免误将一些信息丰富进个人知识图谱。根据需要进行个人知识图谱的丰富。

6、个人知识图谱有了一定量的数据知识就可以进行应用了，可以进行一些决策，或者在语义理解中起到一定作用，让语义理解更加的准确。还可以根据用户的喜好进行个性化推荐等。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

根据本申请实施例的另一个方面，还提供了一种用于实施上述语音的交互方法的语音的交互装置。图3是根据本申请实施例的一种可选的语音的交互装置的示意图，如图3所示，该装置可以包括：

确定单元31，用于确定目标用户的知识图谱，其中，所述目标用户的知识图谱是使用所述目标用户的历史对话数据构建得到的；交互单元33，用于在与所述目标用户进行对话的过程中，使用所述目标用户的知识图谱生成对话语句。

需要说明的是，该实施例中的确定单元31可以用于执行本申请实施例中的步骤S1，该实施例中的交互单元33可以用于执行本申请实施例中的步骤S2。

通过上述模块，用户在使用语音助手的时候，采用知识图谱的技术，从语音交互对话的过程中抽取出信息丰富的知识图谱，个性化的知识图谱让语音助手更加的人性化，结合从用户身长获得的信息进行语音交互，可以解决相关技术中语音助手不能为用户提供个性化服务的技术问题。

此处需要说明的是，上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在相应的硬件环境中，可以通过软件实现，也可以通过硬件实现，其中，硬件环境包括网络环境。

根据本申请实施例的另一个方面，还提供了一种用于实施上述语音的交互方法的服务器或终端。

图4是根据本申请实施例的一种终端的结构框图，如图4所示，该终端可以包括：一个或多个(仅示出一个)处理器201、存储器203、以及传输装置205，如图4所示，该终端还可以包括输入输出设备207。

其中，存储器203可用于存储软件程序以及模块，如本申请实施例中的语音的交互方法和装置对应的程序指令/模块，处理器201通过运行存储在存储器203内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的语音的交互方法。存储器203可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器203可进一步包括相对于处理器201远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置205用于经由一个网络接收或者发送数据，还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置205包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置205为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

其中，具体地，存储器203用于存储应用程序。

处理器201可以通过传输装置205调用存储器203存储的应用程序，以执行下述步骤：

确定目标用户的知识图谱，其中，所述目标用户的知识图谱是使用所述目标用户的历史对话数据构建得到的；

在与所述目标用户进行对话的过程中，使用所述目标用户的知识图谱生成对话语句。

处理器201还用于执行下述步骤：

对所述历史对话数据进行实体提取、句法分析以及句式分析，得到自然语言处理的处理结果；

对自然语言处理的处理结果进行实体抽取、关系抽取以及属性抽取，得到知识抽取的抽取结果；

对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到所述目标用户的知识图谱。

可选地，本实施例中的具体示例可以参考上述实施例中所描述的示例，本实施例在此不再赘述。

本领域普通技术人员可以理解，图4所示的结构仅为示意，终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices，MID)、PAD等终端设备。图4其并不对上述电子装置的结构造成限定。例如，终端还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图4所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(RandomAccess Memory，RAM)、磁盘或光盘等。

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于执行语音的交互方法的程序代码。

可选地，在本实施例中，上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种语音的交互方法，其特征在于，应用于个人语音助手，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在确定目标用户的知识图谱之前，所述方法还包括：

获取与所述目标用户之间的历史对话数据；

对所述历史对话数据进行自然语言处理、知识抽取以及知识融合，得到所述目标用户的知识图谱。

3.根据权利要求2所述的方法，其特征在于，对所述历史对话数据进行自然语言处理、知识抽取以及知识融合，得到所述目标用户的知识图谱包括：

4.根据权利要求3所述的方法，其特征在于，对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到所述目标用户的知识图谱包括：

对知识抽取的抽取结果进行数据整合、实体对齐以及知识推理，得到知识融合结果；

利用所述知识融合结果得到所述目标用户的个人知识图谱；

将所述目标用户的个人知识图谱与通用知识图谱结合，得到所述目标用户的知识图谱。

5.根据权利要求2所述的方法，其特征在于，获取与所述目标用户之间的历史对话数据包括：

获取第一历史对话数据，其中，所述第一历史对话数据为根据制定好的提问场景进行提问得到的对话数据；

获取第二历史对话数据，其中，所述第二历史对话数据为从与所述目标用户之间的对话数据中筛选出来的部分对话数据。

6.根据权利要求1所述的方法，其特征在于，

在确定目标用户的知识图谱之前，所述方法还包括：采集所述目标用户的声纹信息，建立所述目标用户的声纹信息与所述目标用户的知识图谱之间的关联；

确定目标用户的知识图谱包括：获取所述目标用户的声纹信息；将声纹信息与所述目标用户的声纹信息匹配的知识图谱作为所述目标用户的知识图谱。

7.根据权利要求1所述的方法，其特征在于，使用所述目标用户的知识图谱生成对话语句包括：

根据目标用户的提问语句在所述目标用户的知识图谱中进行知识检索；

根据知识检索的结果生成对话语句。

8.一种语音的交互装置，其特征在于，应用于个人语音助手，所述装置包括：

确定单元，用于确定目标用户的知识图谱，其中，所述目标用户的知识图谱是使用所述目标用户的历史对话数据构建得到的；

交互单元，用于在与所述目标用户进行对话的过程中，使用所述目标用户的知识图谱生成对话语句。

9.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，所述程序运行时执行上述权利要求1至7任一项中所述的方法。

10.一种电子装置，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器通过所述计算机程序执行上述权利要求1至7任一项中所述的方法。