WO2022262366A1

WO2022262366A1 - 跨设备的对话业务接续方法、系统、电子设备和存储介质

Info

Publication number: WO2022262366A1
Application number: PCT/CN2022/084544
Authority: WO
Inventors: 王翃宇
Original assignee: 华为技术有限公司
Priority date: 2021-06-18
Filing date: 2022-03-31
Publication date: 2022-12-22
Also published as: EP4343756A1; CN115497470A

Abstract

一种跨设备的对话业务接续方法、系统、电子设备和存储介质，用于实现跨设备的对话业务接续。首先，第一电子设备（62）在采集第一用户语音后，若确定第一用户语音包含用于指示向第二电子设备（64）发送指令的信息，则向第二电子设备（64）发送第一信息和第一执行指令，第一信息包括用于描述第一用户语音的意图的信息，第一执行指令为第一用户语音对应的执行指令；然后，第二电子设备（64）在接收到第一执行指令之后，采集第二用户语音，再执行第二用户语音对应的第二执行指令，第二执行指令为根据第一信息和第二用户语音生成的指令。

Description

跨设备的对话业务接续方法、系统、电子设备和存储介质

本申请要求于2021年06月18日提交国家知识产权局、申请号为202110681520.3、申请名称为“跨设备的对话业务接续方法、系统、电子设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及自然语言处理(Natural Language Processing，NLP)领域，尤其涉及一种跨设备的对话业务接续方法、系统、电子设备和计算机可读存储介质。

背景技术

随着人工智能(Artificial Intelligence，AI)技术的不断发展，作为AI分支的NLP的应用也越来越广泛。

目前，电子设备可以基于NLP的对话系统与用户进行人机交互，实现相应的语音业务。例如，在唤醒手机的语音助手之后，用户向手机输入语音“播放歌曲A”；手机基于对话系统对用户的输入语音进行处理，得到播放歌曲A的执行指令，并响应于该执行指令，自动播放歌曲A。

现阶段，电子设备还不能实现跨设备的对话业务接续。

发明内容

本申请实施例提供一种跨设备的对话业务接续方法、系统、电子设备和计算机可读存储介质，可以实现跨设备的对话业务接续。

第一方面，本申请实施例提供一种跨设备的对话业务接续系统，该系统包括第一电子设备和至少一个第二电子设备。

其中，第一电子设备用于：采集第一用户语音；若确定第一用户语音包含用于指示向第二电子设备发送指令的信息，则向第二电子设备发送第一信息和第一执行指令，第一信息包括用于描述第一用户语音的意图的信息，第一执行指令为第一用户语音对应的执行指令；

第二电子设备用于：在接收到第一执行指令之后，采集第二用户语音；执行第二用户语音对应的第二执行指令，第二执行指令为根据第一信息和第二用户语音生成的指令。

基于上述技术方案，第一电子设备在向第二电子设备发送第一执行指令的时候，还向第二电子设备发送第一信息，即还发送用于描述第一用户语音的意图的信息，也即将第一信息随着业务流传递给第二电子设备。这样，第二电子设备可以根据来自第一电子设备的用于描述第一用户语音的意图的信息，对新采集的第二用户语音进行语义理解，以确定出第二用户语音的意图，从而实现了跨设备的对话业务接续。

示例性地，第一电子设备为手机，第二电子设备为大屏设备，第一用户语音为“推荐一首歌曲给大屏设备”，该用户语音的意图为推荐音乐；第二用户语音为“换一个”。手机向大屏设备发送第一执行指令和推荐音乐的意图，大屏设备在采集到“换一个”的时候，根据推荐音乐的意图识别出“换一个”的意图为推荐音乐，并响应于“换一个”，给用户推荐另一首歌曲。

在第一方面的一种可能的实现方式中，用于描述第一用户语音的意图的信息包括第一用户语音的第一文本和/或第一用户语音的第一意图。

示例性地，第一用户语音为“推荐一首歌曲给大屏设备”，第一文本为文本“推荐一首歌曲给大屏设备”，第一意图为推荐音乐。

在第一方面的一种可能的实现方式中，第一信息包括N轮对话的文本和/或意图，N为大于1的正整数；

N轮对话的文本包括第一用户语音的第一文本，N轮对话的意图包括第一用户语音的第一意图；其中，N轮对话为第一电子设备采集的用户对话。

在该实现方式中，第一电子设备将N轮对话的意图等信息传递给第二电子设备，可以让第二电子设备可以更加准确地识别新采集的用户语音的意图，实现更加开放的跨设备对话业务接续。该N轮对话可以包括第一用户语音。

示例性，第一电子设备可以将最近发生的N轮对话的相关信息传递给第二电子设备。例如，N＝3。

在第一方面的一种可能的实现方式中，第一执行指令包括用于表征第一用户语音的槽位的信息。这样，让第二电子设备可以更加准确地识别出新采集的用户语音，实现更加开放的跨设备对话业务接续。

例如，第一用户语音为“推荐歌曲A给大屏设备”，第一电子设备不仅将该用户语音的意图信息等传递给第二电子设备，还将从该用户语音中提取的歌曲槽位一并传递给第二电子设备。

在第一方面的一种可能的实现方式中，第一电子设备具体用于：对第一用户语音进行语音识别，得到第一文本；对第一文本进行语义理解，得到第一用户语音的第一意图和第一槽位；若第一槽位包括目标设备槽位，且目标设备槽位的实体为第二电子设备，则确定第一用户语音包含用于指示向第二电子设备发送指令的信息；根据第一意图和第一槽位，生成第一用户语音对应的第一执行指令。

在第一方面的一种可能的实现方式中，该系统还包括与第一电子设备通信连接的第三电子设备；第一电子设备具体用于：向第三电子设备发送第一用户语音；接收来自第三电子设备的第一槽位、第一意图和第一执行指令，第一槽位和第一意图为第三电子设备从第一用户语音中提取的，第一执行指令为第三电子设备根据第一槽位和第一意图生成的第一用户语音对应的执行指令；若第一槽位包括目标设备槽位，且目标设备槽位的实体为第二电子设备，则确定第一用户语音包含用于指示向第二电子设备发送指令的信息。

在该实现方式中，第一电子设备可以使用第三电子设备的语音业务能力，对第一用户语音进行解析和识别，这样，第一电子设备可以是不具备部署语音业务系统的能力的设备，从而使得跨设备对话业务接续的应用范围更加广泛。

示例性地，第一电子设备也可以为智能手表、智能耳机以及智能音箱等设备。即使这些设备不具备部署语音识别、语义理解和对话管理等模块的能力，仍然可以实现跨设备对话业务接续。

在第一方面的一种可能的实现方式中，第二电子设备具体用于：对第二用户语音进行语音识别，得到第二文本；根据第一信息，对第二文本进行语义理解，得到第二用户语音的语义信息；根据第二用户语音的语义信息，生成第二用户语音对应的第二执行指令。

在第一方面的一种可能的实现方式中，第二电子设备具体用于：将第一信息作为语义理解模块的最新上下文，第二电子设备包括语义理解模块；将第二文本输入语义理解模块，获得语义理解模块输出的第二用户语音的语义信息，其中，语义理解模块采用最新上下文对第二文本进行语义理解。

在第一方面的一种可能的实现方式中，该系统还包括与第二电子设备通信连接的第四电子设备；第二电子设备具体用于：向第四电子设备发送第二用户语音和第一信息；接收来自第四电子设备的第二用户语音的语义信息和第二执行指令；

其中，第二用户语音的语义信息为第四电子设备根据第一信息对第二用户语音进行语义理解得到的信息，第二执行指令为第四电子设备根据第二用户语音的语义信息生成的第二用户语音对应的执行指令。

在该实现方式中，第二电子设备可以使用第四电子设备的语音业务能力，对第二用户语音进行解析和识别，这样，第二电子设备可以是不具备部署语音业务系统的能力的设备，从而使得跨设备对话业务接续的应用范围更加广泛。

在第一方面的一种可能的实现方式中，第一电子设备具体用于：确定第一电子设备的用户账号和第二电子设备的用户账号是否为同一个用户；若是，向第二电子设备发送第一执行指令和第一信息，并向第二电子设备发送第二信息，第二信息包括第一用户信息、场景信息和第一应用状态信息中的任意一种或任意组合；

其中，第一用户信息为用于描述第一电子设备的用户的信息，第一应用状态信息为用于表征第一电子设备上的第一目标应用的信息，场景信息为用于描述用户场景的信息；

第二电子设备具体用于：根据第一信息、第二用户语音和第二信息，生成第二执行指令。

在该实现方式中，第一电子设备自动识别两个设备的用户是否为同一个用户，如果是同一个用户，第一电子设备除了将第一执行指令和第一信息传递给第二电子设备之外，还将第二信息发送给第二电子设备。这样，第二电子设备则可以根据第二信息，给用户提供更加个性化和精准化的服务，以提高跨设备对话业务接续下的用户体验。

示例性地，第一用户信息为用户A的信息，通过用户A的信息可以得知用户偏好歌曲类型为流行歌曲。通过场景信息可以得知用户处于行走状态，即处于运动场景。第一目标应用为手机上安装的华为音乐，第一应用状态信息包括华为音乐上的歌曲历史播放记录。

此时，第一用户语音为“推荐一首歌曲给大屏设备”，第二用户语音为“换一个”。手机将这些信息发送给大屏设备之后，大屏设备在生成第二执行指令时，根据用户处于运动场景、用户偏好歌曲类型为流行音乐，确定出要推荐运动场景下的流行音乐歌曲。进一步地，基于歌曲历史播放记录，筛选出播放次数最多，且属于运动场景下的流行音乐歌曲作为推荐歌曲。这样，使得推荐出的歌曲更加符合用户喜好。

另外，第二信息还可以用于第二电子设备的语义理解，使得第二电子设备可以更加准确地理解新采集的用户语音的意图，实现更加开放的跨设备对话业务接续。例如，第一电子设备将历史播放歌曲信息传递给第二电子设备，历史播放歌曲信息包括歌曲名称。当第二电子设备采集到“换XXX”时，可以根据歌曲名称识别“XXX”为歌曲名称，进而识别出新采集的用户语音的意图为播放歌曲XXX。

在第一方面的一种可能的实现方式中，第一电子设备具体用于：若第一电子设备的用户账号和第二电子设备的用户账号不是同一个用户，向第二电子设备发送第一执行指令和第一信息；

第二电子设备具体用于：根据第一信息、第二用户语音和第三信息，生成第二执行指令，第三信息包括第二用户信息和/或第二应用状态信息；其中，第二用户信息为用于描述第二电子设备的用户的信息，第二应用状态信息为用于表征第二电子设备上的第二目标应用的信息。

在该实现方式中，第一电子设备自动识别两个设备的账号是否是同一个用户，如果不是，则可以不用发送第一电子设备上的用户信息。此时，第二电子设备可以根据本设备的相关信息，给用户提供更加个性化和精准的服务。示例性地，第二目标应用可以为第二电子设备上安装的华为音乐应用程序。

在第一方面的一种可能的实现方式中，若存在至少两个第二电子设备，且至少两个第二电子设备与第一电子设备的连接方式不同，第一电子设备具体用于：

确定与至少两个第二电子设备之间的通信连接的类型；

根据通信连接的类型，通过不同的通信连接分别向至少第二电子设备发送第一信息和第一执行指令。

在该实现方式中，如果需要向至少两个第二电子设备分发第一执行指令和第一信息，第一电子设备自动识别通信连接类型，并根据通信连接类型向对应的第二电子设备发送对应的信息。

通过一个语音命令同时向两个第二电子设备分发对应的信息，以将对话业务接续至至少两个第二电子设备，便捷性更高，用户体验更佳。

在第一方面的一种可能的实现方式中，第二电子设备具体用于：在执行第一执行指令时，或提示用户是否执行第一执行指令时，采集第二用户语音。通过提示用户是否执行第一执行指令，可以使得跨设备对话业务的接续更加人性化。

在第一方面的一种可能的实现方式中，第二电子设备还用于：在接收第一执行指令后，唤醒语音助手，第二电子设备包括语音助手。

在该实现方式中，第二电子设备自动唤醒语音助手，不用用户通过特定唤醒词唤醒第二点设备上的语音助手，使得跨设备对话业务接续更加流畅，用户体验更佳。

在第一方面的一种可能的实现方式中，第一执行指令为推荐音乐的指令，第二执行指令为用于推荐另一首歌曲的指令。

第二方面，本申请实施例提供一种跨设备的对话业务接续方法，应用于第一电子设备，该方法包括：采集第一用户语音；确定第一用户语音包含用于指示向第二电子设备发送指令的信息后，向第二电子设备发送第一信息和第一执行指令；其中，第一信息包括用于描述第一用户语音的意图的信息，第一执行指令为第一用户语音对应的执行指令。

在第二方面的一种可能的实现方式中，用于描述第一用户语音的意图的信息包括第一用户语音的第一文本和/或第一用户语音的第一意图。

在第二方面的一种可能的实现方式中，第一信息包括N轮对话的文本和/或意图，N为大于1的正整数；

在第二方面的一种可能的实现方式中，第一执行指令包括用于表征第一用户语音的槽位的信息。

在第二方面的一种可能的实现方式中，确定第一用户语音包含用于指示第二电子设备的信息后，向第二电子设备发送第一信息和第一执行指令，包括：

对第一用户语音进行语音识别，得到第一文本；

对第一文本进行语义理解，得到第一用户语音的第一意图和第一槽位；

若第一槽位包括目标设备槽位，且目标设备槽位的实体为第二电子设备，则确定第一用户语音包含用于指示向第二电子设备发送指令的信息；

根据第一意图和第一槽位，生成第一用户语音对应的第一执行指令；

向第二电子设备发送第一信息和第一执行指令，第一信息包括第一意图和/或第一文本。

向第三电子设备发送第一用户语音；

接收来自第三电子设备的第一槽位、第一意图和第一执行指令，第一槽位和第一意图为第三电子设备从第一用户语音中提取的，第一执行指令为第三电子设备根据第一槽位和第一意图生成的第一用户语音对应的执行指令；

向第二电子设备发送第一信息和第一执行指令，第一信息包括第一意图和/或第一用户语音的第一文本。

在第二方面的一种可能的实现方式中，在向第二电子设备发送第一信息和第一执行指令之前，方法还包括：

确定第一电子设备的用户账号和第二电子设备的用户账号是否为同一个用户；

若是，进入向第二电子设备发送第一执行指令和第一信息的步骤，并向第二电子设备发送第二信息，第二信息包括第一用户信息、场景信息和第一应用状态信息中的任意一种或任意组合；

其中，第一用户信息为用于描述第一电子设备的用户的信息，场景信息为用于描述用户场景的信息，第一应用状态信息为用于表征第一电子设备上的第一目标应用的信息。

在第二方面的一种可能的实现方式中，若存在至少两个第二电子设备，向第二电子设备发送第一信息和第一执行指令，包括：

确定与至少两个第二电子设备之间的通信连接的类型；

在第二方面的一种可能的实现方式中，第一执行指令为推荐音乐的指令。

第三方面，本申请实施例提供一种跨设备的对话业务接续方法，应用于第二电子设备，该方法包括：

接收来自第一电子设备的第一执行指令和第一信息，第一信息包括用于描述第一用户语音的意图的信息，第一执行指令为第一用户语音对应的执行指令，第一用户语音为第一电子设备采集的，且包含用于指示向第二电子设备发送指令的信息的语音；

采集第二用户语音；执行第二用户语音对应的第二执行指令，第二执行指令为根据第一信息和第二用户语音生成的指令。

在第三方面的一种可能的实现方式中，用于描述第一用户语音的意图的信息包括第一用户语音的第一文本和/或第一用户语音的第一意图。

在第三方面的一种可能的实现方式中，第一信息包括N轮对话的文本和/或意图，N为大于1的正整数；

在第三方面的一种可能的实现方式中，第一执行指令包括用于表征第一用户语音的槽位的信息。

在第三方面的一种可能的实现方式中，执行第二用户语音对应的第二执行指令，包括：

对第二用户语音进行语音识别，得到第二文本；

根据第一信息，对第二文本进行语义理解，得到第二用户语音的语义信息；

根据第二用户语音的语义信息，生成第二用户语音对应的第二执行指令；

执行第二执行指令。

在第三方面的一种可能的实现方式中，根据第一信息，对第二文本进行语义理解，得到第二用户语音的语义信息，包括：

将第一信息作为语义理解模块的最新上下文，第二电子设备包括语义理解模块；

将第二文本输入语义理解模块，获得语义理解模块输出的第二用户语音的语义信息，其中，语义理解模块采用最新上下文对第二文本进行语义理解。

在第三方面的一种可能的实现方式中，若第一电子设备的用户账号和第二电子设备的用户账号是同一个用户，方法还包括：

接收来自第一电子设备的第二信息，第二信息包括第一用户信息、场景信息和第一应用状态信息中的任意一种或任意组合；

根据第二用户语音的语义信息，生成第二用户语音对应的第二执行指令，包括：

根据语义信息和第二信息，生成第二执行指令；

在第三方面的一种可能的实现方式中，若第一电子设备的用户账号和第二电子设备的用户账号不是同一个用户，根据第二用户语音的语义信息，生成第二用户语音对应的第二执行指令，包括：

根据语义信息和第三信息，生成第二执行指令；

第三信息包括第二用户信息和/或第二应用状态信息，第二用户信息为用于描述第二电子设备的用户的信息，第二应用状态信息为用于表征第二电子设备上的第二目标应用的信息。

向第四电子设备发送第二用户语音和第一信息；

接收来自第四电子设备的第二用户语音的语义信息和第二执行指令；

其中，第二用户语音的语义信息为第四电子设备根据第一信息对第二用户语音进行语义理解得到的信息，第二执行指令为第四电子设备根据第二用户语音的语义信息生成的第二用户语音对应的执行指令；

执行第二执行指令。

在第三方面的一种可能的实现方式中，采集第二用户语音，包括：在执行第一执行指令时，或提示用户是否执行第一执行指令时，采集第二用户语音。

在第三方面的一种可能的实现方式中，在采集第二用户语音之前，该方法还包括：在接收第一执行指令后，唤醒语音助手，第二电子设备包括语音助手。

在第三方面的一种可能的实现方式中，第二执行指令为用于推荐另一首歌曲的指令。

第四方面，本申请实施例提供一种电子设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如上述第二方面或第三方面任一项的方法。

第五方面，本申请实施例提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现如上述第二方面或第三方面任一项的方法。

第六方面，本申请实施例提供一种芯片系统，该芯片系统包括处理器，处理器与存储器耦合，处理器执行存储器中存储的计算机程序，以实现如上述第二方面或第三方面任一项所述的方法。该芯片系统可以为单个芯片，或者多个芯片组成的芯片模组。

第七方面，本申请实施例提供一种计算机程序产品，当计算机程序产品在电子设备上运行时，使得电子设备执行上述第二方面或第三方面任一项所述的方法。

可以理解的是，上述第二方面至第七方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

附图说明

图1为本申请实施例提供的语音业务系统示意图；

图2为本申请实施例提供的语音控制手机播放音乐的场景示意图；

图3为本申请实施例提供的手机给大屏设备推荐音乐的场景示意图；

图4为本申请实施例提供的跨设备的对话业务接续系统的一种示意图；

图5为本申请实施例提供的跨设备的对话业务接续系统的另一种示意图；

图6A～图6B为本申请实施例提供的手机给大屏设备推荐音乐的场景示意图；

图7为本申请实施例提供的手机给大屏设备推荐音乐的流程示意图；

图8A～图8C为本申请实施例提供的导航场景示意图；

图8D为本申请实施例提供的视频推荐场景示意图；

图9为本申请实施例提供的跨设备的对话业务接续系统的另一种示意图；

图10为本申请实施例提供的跨设备的对话业务接续方法的另一种流程示意图；

图11为本申请实施例提供的耳机转接音乐至音箱播放的场景示意图；

图12为本申请实施例提供的跨设备的对话业务接续系统的又一种示意图；

图13为本申请实施例提供的跨设备的对话业务接续方法的又一种流程示意图；

图14为本申请实施例提供的手机给智能音箱推荐音乐的场景示意图；

图15为本申请实施例提供的电子设备硬件结构示意图。

具体实施方式

下面示例性介绍本申请实施例可能涉及的相关内容。

(1)语音业务系统，或称对话业务系统。参见图1，示出了本申请实施例提供的语音业务系统示意图。如图1所示，该语音系统可以包括语音识别(Automatic Speech Recognition，ASR)模块11、语义理解(Natural Language Understanding，NLU)模块12、对话管理(Dialogue Management，DM)模块13以及语音合成(Text To Speech，TTS)模块14。

其中，语音识别模块11用于将用户15输入的语音信息转化成文本信息。

语义理解模块12用于根据语音识别模块11输出的文本信息进行语义理解，得到语义信息，该语义信息通常包括意图和槽位值。

对话管理模块13用于根据语义理解模块12输出的语义信息以及对话状态，更新系统状态，并输出下一步的系统动作。

对话管理模块13中包括对话状态追踪(Dialog State Tracking，DST)子模块和对话决策(Dialog Policy，DP)子模块。对话状态追踪子模块用于维护和更新对话状态，对话决策子模块用于根据对话状态和语义信息等，产生系统行为，以决定下一步的动作。

电子设备可以根据对话管理模块13输出的指令，执行对应的操作。如果对话管理模块13输出的指令为用于指示输出语音的指令。此时，语音合成模块14可以根据对话管理模块13输出的指令，生成语音信息，得到输出语音。例如，用户15输入的语音信息为“播放一首歌曲”，对话管理模型13输出用于指示输出语音的指令，语音合成模块14根据用于指示输出语音的指令，生成输出语音“你要播放什么歌曲？”。

如果对话管理模块13输出的指令是其他类型的指令，电子设备则响应于该指令，执行对应的操作。示例性地，本申请实施例中，对话管理模块13的输出可以具体表现为执行指令，该执行指令用于指示下一步的动作。例如，用户15的输入语音信息为“播放歌曲A”，对话管理模块13输出播放歌曲A的执行指令，电子设备响应于该执行指令，自动播放歌曲A。

可以理解的是，在其他语音业务系统中，除了可以包括图1示出的模块之外，还可以包括自然语言生成(Natural Language Generation，NLG)模块。自然语言生成模块用于将对话管理模块13输出的系统动作进行文本化，得到自然语言文本。而自然语言生成模块输出的自然语言文本，可以作为语音合成模块14的输入；语音合成模块14将输入的自然语音文本转化为语音信息，得到输出语音。

(2)意图、槽位和槽位值。

意图可以是指用户语音中表达的用户目的。例如，用户语音为“深圳今天的天气怎么样”，该语音的意图为“查询天气”。又例如，用户语音为“播放一首歌曲”，该语音的意图为“播放音乐”。

每个意图下可以配置有一个或多个槽位。槽位是指系统需要从用户语音中收集的关键信息。例如，针对查询天气这一意图，配置的槽位可以包括地点槽位和时间槽位。地点槽位用于确定需要查询哪个地点的天气，时间槽位用于确定需要查询什么时候的天气。

槽位包括槽位值等属性，槽位值是指槽位的具体参数，又可称为槽位的实体。例如，用户语音为“今天深圳的天气怎么样”，从该语音中可以提取出地点槽位和时间槽位，地点槽位的实体为“北京”，时间槽位的实体为“今天”。

具体应用中，可以预先设置意图类别，以及每个意图类别下所配置的槽位。示例性地，在本申请实施例中，推荐音乐意图下配置的槽位包括但不限于目标设备槽位，该目标设备槽位用于指示接续对话业务的目标设备。例如，手机需要将对话业务接续至大屏设备，此时，源设备为手机，目标设备为大屏设备。

电子设备可以基于上述语音业务系统，与用户进行一轮或多轮的人机对话，以实现相应的语音业务。

示例性地，参见图2，示出了本申请实施例提供的语音控制手机播放音乐的场景示意图。如图2所示，手机21的主界面22上包括应用商城、时钟、备忘录、图库以及音乐等应用程序。

用户通过唤醒词“小艺小艺”唤醒手机21的语音助手小艺之后，手机21采集到用户语音“小艺小艺，推荐一首歌曲”；然后，手机21的语音助手通过上述图1示出的语音业务系统，对用户语音进行语音识别、语义理解等过程，确定出用户意图为推荐音乐，并得到推荐音乐的执行指令。此时，由于从用户语音中提取不出歌曲名称槽位的实体，手机21可以根据预设推荐规则，确定出推荐歌曲。例如，手机21可以根据用户的历史播放记录，将最近7天内播放最多的歌曲作为推荐歌曲。

手机21响应于推荐音乐的执行指令，自动播放歌曲A，并显示语音助手界面23。语音助手界面23包括用户语音的文本24，语音助手针对用户语音的回答语句文本25，以及音乐控件26。此时，音乐控件26内显示正在播放的歌曲为歌曲A。

手机21在响应于用户语音“小艺小艺，推荐一首歌曲”，自动播放歌曲A之后，用户想换一首歌，则向手机21输入用户语音“换一个”。手机21采集到用户语音“换一个”之后，通过语音识别模块，将用户语音转化成文本信息，并在语音助手界面23内显示用户输入语音的文本信息27。

手机21将“换一个”的文本信息输入语义理解模块，语义理解模块根据历史意图和输入的文本信息等信息，确定出用户意图为换歌单，并得到播放另一首歌曲的执行指令。此时，历史意图是推荐音乐，其是根据用户语音“小艺小艺，推荐一首歌曲” 确定出来的意图。

手机21响应于播放另一首歌曲的执行指令，自动播放歌曲B，并显示语言助手界面28。语音助手界面28包括用户语音的文本29以及音乐控件26，此时，音乐控件26内显示正在播放的歌曲为歌曲B。

在图2示出的场景中，用户和手机21的语音助手小艺之间的整个对话交互过程可以如下：

用户：小艺小艺。

小艺：在的。

用户：小艺小艺，推荐一首歌曲。

小艺：好的。

用户：换一个。

小艺：好的。

在该对话过程中，用户语音“换一个”并没有明确用户意图，但手机21仍然可以根据历史意图和对话语料等上下文信息，准确地识别出用户意图。此时，对话语料可以包括“小艺小艺，推荐一首歌曲”。这是因为整个对话交互过程均发生在手机21一侧，手机21上存储有对话过程的相关信息。

但是，在一些情况下，例如，跨设备的对话业务接续，上述对话过程的一部分发生在第一电子设备，另一部分发生在第二电子设备，第二电子设备上没有整个对话过程的相关信息，可能导致第二电子设备不能识别用户意图，进而不能实现跨设备的对话业务接续。

示例性地，参见图3，示出了本申请实施例提供的手机给大屏设备推荐音乐的场景示意图。此时，第一电子设备为手机，第二电子设备为大屏设备。手机和大屏设备内均设置有语音助手，并部署有图1的语音业务系统。

如图3所示，用户31向手机32输入用户语音“推荐一首歌曲给大屏设备”。手机32采集到用户语音“推荐一首歌曲给大屏设备”之后，手机32内的语音助手使用图1示出的语音业务系统，确定用户语音“推荐一首歌曲给大屏设备”的意图为推荐音乐，并且能提取出目标设备槽位，目标设备槽位的实体为大屏设备；然后，手机32生成推荐音乐的执行指令，并显示语音助手界面33，输出针对用户语音的回答语音“好的”；最后，向大屏设备34发送推荐音乐的执行指令。该推荐音乐的执行指令包括但不限于歌曲名称信息，用于指示大屏设备34播放歌曲。

大屏设备34接收到来自手机33的执行指令之后，响应于该执行指令，弹出窗口35。窗口35内显示有提示信息，用于询问用户是否播放手机推荐的歌曲A。用户可以通过点击窗口35上的“播放”按钮，以让大屏设备34播放歌曲A；也可以通过点击窗口上的“取消”按钮，以让大屏设备34取消播放歌曲A。

用户也可以通过向大屏设备34输入语音“播放”或“取消”，以向大屏设备34表明按钮选择意图。当用户输入语音为“播放”时，大屏设备34则选择“播放”按钮，当用户输入语音为“取消”时，大屏设备34则选择“取消”按钮。

在大屏设备34显示窗口35之后，如果用户31想要换一首歌曲，则可以向大屏设备34输入用户语音“换一个”。大屏设备34内的语音助手采集到用户语音“换一个” 之后，在进行意图识别时，将文本信息“换一个”输入至语义理解模块。此时，大屏设备34本地没有对话过程的历史意图“推荐音乐”、目标设备槽位的实体以及“换一个”的历史语料“推荐一首歌曲给大屏设备”等上下文信息，使得语义理解模块无法识别该用户语音的意图，进而使得大屏设备34无法响应于该用户语音，播放另一首歌曲。

由上可见，手机32转接业务给大屏设备34之后，大屏设备34只能选择播放或取消，无法识别与之前的对话关联的其他用户语音，无法实现跨设备的对话业务接续。

发明人在研究过程中发现，可以将用于描述用户语音意图的相关信息，随着业务流一并传输给目标设备，以实现跨设备的对话业务接续。

本申请实施例提供一种跨设备的对话业务接续方案。在一些实施例中，第一电子设备转接业务给第二电子设备时，可以将最近N轮对话的意图和槽位等上下文信息传输给第二电子设备。也即，第一电子设备将最近N轮对话的意图和槽位等上下文信息随着业务流传输至第二电子设备。这样，第二电子设备在进行意图识别时，可以根据接收到的意图和槽位等上下文信息，准确识别出用户语音的意图，以实现跨设备的对话业务接续。其中，N为大于或等于1的正整数。

下面将结合附图，对本申请实施例提供的跨设备的对话业务接续方案进行详细阐述。以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。

参见图4，示出了本申请实施例提供的跨设备的对话业务接续系统的一种示意图，该系统可以包括第一电子设备41和第二电子设备42。第一电子设备41和第二电子设备42可以通过通信连接进行信息交互，该通信连接可以示例性为蓝牙连接或Wi-Fi点对点连接等。

第一电子设备41和第二电子设备42可以包括语音助手应用程序，也可以包括集成有语音助手功能的应用程序。

本申请实施例中，跨设备的对话业务接续系统可以包括一个或至少两个第二电子设备42。也就是说，第一电子设备41可以同时将业务流转至一个或至少两个第二电子设备42，并在业务流转的时候，将意图和槽位等信息传输至第二电子设备42。

第一电子设备41和第二电子设备42可以是登陆同一个用户账号的设备。例如，第一电子设备41为手机，第二电子设备42为大屏设备，手机和大屏设备均登陆同一个华为用户账号。

当然，第一电子设备41和第二电子设备42也可以是登录不同用户账号的设备，例如，第一电子设备41登陆的账号为用户A，第二电子设备42登陆的账号为用户B。此时，第一电子设备41和第二电子设备42可以同属于一个群组，例如，同属于一个家庭群组。或者，第一电子设备41和第二电子设备42可以是已建立可信连接的设备，例如，第一电子设备41为手机，第二电子设备42为大屏设备，手机和大屏设备通过“一碰连”，建立可信连接。

在一些实施例中，第一电子设备41和第二电子设备42均可以包括图1对应的语音业务系统，或者该语音业务系统内的部分模块。

此时，第一电子设备41和第二电子设备42通常是富设备。富设备是指：资源丰富的设备，该资源丰富的设备可以是指存储空间充裕的电子设备，和/或处理性能充裕的电子设备等。一般情况下，处理性能充裕，内存充裕，以及存储空间充裕的电子设备，可以称为富设备或胖设备。例如，富设备可以包括手机、电脑、服务器以及平板等。

与富设备相对的瘦设备是指：资源受限的设备，该资源受限的设备可以是指存储空间受限的电子设备，和/或处理性能受限的电子设备等。一般情况下，处理性能低，内存少，存储空间少的电子设备，可以称为瘦设备。例如，瘦设备可以包括耳机、音箱以及手表等。

示例性地，参见图5，示出了本申请实施例提供的跨设备的对话业务接续系统的另一种示意图，第一电子设备51包括第一应用程序511、第一语音识别模块512、第一语义理解模块513、第一对话管理模块514以及第一指令交互服务515；第二电子设备52包括第二应用程序521、第二语音识别模块522、第二语义理解模块523、第二对话管理模块524以及第二指令交互服务525。

需要说明的是，第一电子设备51和第二电子设备52可以包括NLG模块和TTS模块，也可以不包括NLG模块和TTS模块。

第一应用程序511可以为语音助手，也可以为集成有语音助手功能的应用程序。同理，第二应用程序521可以为语音助手，也可以为集成有语音助手功能的应用程序。

第一指令交互服务515和第二指令交互服务525用于电子设备之间的指令交互。在其他实施例中，也可以通过其他方式实现设备间的指令交互。

如图5所示，第一电子设备51采集到用户语音之后，第一应用程序511将用户语音输入至第一语音识别模块512，得到第一语音识别模块512输出的文本信息；然后，将第一语音识别模块512输出的文本信息，输入至第一语义理解模块513，得到第一语义理解模块513输出的用户语音的语义信息，该语义信息包括从用户语音提取的意图以及该意图对应的槽位等；再将语义信息输入至第一对话管理模块514，得到执行指令。

第一应用程序511获取到第一对话管理模块514输出的执行指令之后，将该执行指令、历史意图和历史意图对应的槽位等信息通过第一指令交互服务515传输至第二电子设备52。历史意图可以包括最近发生的N轮对话对应的意图。

需要说明的是，第一电子设备51可以根据用户语音，确定是否需要向第二电子设备52发送执行指令、历史意图和对应槽位等信息，即确定是否需要转接业务，也即，确定是否需要向第二电子设备52发送指令，并在发送指令的时候，携带历史意图和对应槽位等上下文信息。

例如，第一电子设备51如果可以从用户语音中提取出目标设备槽位，且目标设备槽位的实体不是本设备，则可以确定需要转接业务，并将目标设备槽位的实体作为转接业务的目标设备。也即，第一电子设备51确定需要向第二电子设备52(即目标设备)发送执行指令、历史意图和对应槽位等信息。例如，在图3的场景中，手机32从用户语音“推荐一首歌曲给大屏设备”中可以提取出目标设备槽位，且目标设备槽位的实体为大屏设备，则确定需要转接业务，且转接业务的目标设备是大屏设备。

进一步地，如果第一电子设备51可以从用户语音中提取出至少两个目标设备槽位，且这至少两个目标设备槽位的实体均不是本设备，第一电子设备51则可以确定需要向这至少两个目标设备槽位对应的目标设备发送执行指令、历史意图和对应槽位等信息。此时，第一电子设备51可以将执行指令、历史意图和对应槽位等信息，同时分发至这至少两个目标设备槽位对应的目标设备。

第一电子设备51在将执行指令、历史意图和对应槽位等信息分发给至少两个第二电子设备52(即目标设备)的过程中，可以先判断与至少两个第二电子设备52之间是否已建立通信连接。

如果已建立通信连接，第一电子设备51可以进一步判断与至少两个第二电子设备52之间的通信连接是否相同。具体地，第一电子设备51根据通信连接的类型，将发送给同一个第二电子设备52的执行指令、历史意图和对应槽位等信息进行关联后，再将关联后的执行指令、历史意图和对应槽位等信息发送至对应的第二电子设备52。

例如，第一电子设备51为手机，第二电子设备52包括大屏设备和平板。手机接收到的用户语音为“推荐一首歌曲给大屏设备和平板”，手机从该用户语音中可以提取出两个目标设备槽位，这两个目标设备槽位的实体分别为“大屏设备”和“平板”，即第二电子设备包括大屏设备和平板。手机则可以确定需要将业务转接至大屏设备和平板，即需要分别向大屏设备和平板发送执行指令、历史意图和对应槽位等信息。

此时，手机检测出与大屏设备和平板均已建立通信连接，且与大屏设备之间的通信连接的类型为Wi-Fi点对点连接，与平板的通信连接的类型为蓝牙连接。手机根据Wi-Fi点对点协议，将执行指令、历史意图和对应槽位等信息进行打包后，将数据包通过Wi-Fi点对点连接发送给大屏设备，以将执行指令、历史意图和对应槽位等信息发送至大屏设备。同理，手机根据蓝牙协议，将执行指令、历史意图和对应槽位等信息进行打包后，将数据包通过蓝牙连接发送给平板。

第一电子设备51和第二电子设备52之间如果没有建立通信连接，第一电子设备51可以判断是否已经与第二电子设备52配对，如果已配对，则可以根据本地存储的第二电子设备52的相关信息，向第二电子设备52发送建立连接的请求，以建立与第二电子设备52之间的通信连接。建立通信连接之后，第一电子设备51再根据通信连接的类型，将执行指令、历史意图和对应槽位等信息发送至第二电子设备52。其中，第二电子设备52的相关信息可以示例性包括设备标识和IP地址等。

例如，手机检测到与大屏设备之间没有建立连接，但本地上存储有大屏设备的相关信息，则根据大屏设备的IP地址和设备标识等信息，向大屏设备发送用于建立Wi-Fi点对点连接的请求。大屏设备在接收到用于建立Wi-Fi点对点连接的请求之后，可以响应于该请求，与手机建立Wi-Fi点对点连接。

第一电子设备51和第二电子设备52之间如果没有建立通信连接，也没有配对，第一电子设备51可以提示用户找不到对应的设备。

例如，手机检测到与大屏设备之间没有建立连接，也没有配对，手机可以通过提示窗口或者提示语音，提示用户找不到大屏设备，请建立与大屏设备之间的连接。

当然，第一电子设备51即使没有和第二电子设备52配对，但可以获取到第二电子设备52的相关信息，也可以根据第二电子设备52的相关信息，向第二电子设备52发起用于建立通信连接的请求。

另外，第一电子设备51如果可以从用户语音提取出至少两个设备槽位，且这两个设备槽位中有一个槽位的实体是本设备，其它槽位的实体不是本设备，则确定需要向对应的第二电子设备52(即其它槽位对应的设备)发送执行指令、历史意图和对应槽位等信息。此时，第一电子设备51在得到执行指令之后，可以在本设备执行第一执行指令。

例如，手机采集到的用户语音为“播放歌曲A，并将该歌曲A推荐给大屏设备”。手机从该用户语音中可以提取出两个设备槽位，一个设备槽位的实体是“本设备”，另一个设备槽位的实体是“大屏设备”。此时，由于用户语音中包括目标设备槽位，且目标设备槽位的实体不是本设备，则确定需要将执行指令、历史意图和对应槽位等信息发送至大屏设备。

手机根据用户语音“播放歌曲A，并将该歌曲A推荐给大屏设备”可以获得播放歌曲A的执行指令，推荐歌曲A的执行指令。在获得播放歌曲A的执行指令之后，手机可以自动播放歌曲A。同时，手机还将推荐歌曲A的执行指令、历史意图和对应槽位等信息发送至大屏设备。

可以看出，本申请实施例中，第一电子设备51可以根据用户语音，确定是否需要向一个或多个第二电子设备52发送执行指令、历史意图和对应槽位等信息。

相较而言，第一电子设备通过一个用户语音，分别向至少两个第二电子设备发送执行指令、历史意图和对应槽位等信息，以将对话业务接续至多个第二电子设备，这样可以提高业务转接的便捷性，提高用户体验。

示例性地，用户A想将歌曲A同时推荐用户B和用户C。用户A的设备为手机，用户B的设备为大屏设备A，用户C的设备为大屏设备B。手机、大屏设备A和手机B均属于同一个群组(例如，家庭群组或好友群组)。

用户A向手机输入用户语音“向大屏设备A和大屏设备B推荐歌曲A”。手机从该用户语音中可以提取出两个目标设备槽位，且这两个目标设备槽位的实体分别为“大屏设备A”和“大屏设备B”，则可以确定需要分别向大屏设备A和大屏设备B发送执行指令、历史意图和对应槽位等信息。然后，手机则将用户语音“向大屏设备A和大屏设备B推荐歌曲A”对应的执行指令、历史意图和对应槽位等信息分别发送至大屏设备A和大屏设备B。此时，历史意图包括从用户语音“向大屏设备A和大屏设备B推荐歌曲A”提取出的推荐音乐意图，对应槽位包括从用户语音“向大屏设备A和大屏设备B推荐歌曲A”提取出的歌曲名称槽位，且歌曲名称槽位的实体为歌曲A。

大屏设备A接收到来自手机的执行指令、历史意图和对应槽位等信息，则向用户B推荐歌曲A。同理，大屏设备B向用户C推荐歌曲A。这样，相较于用户通过两个语音命令分别给两个用户推荐歌曲，用户A通过一个语音命令，即可将歌曲同时推荐给大屏设备A和大屏设备B，便捷性较高，用户体验较好。

如果第一电子设备51从用户语音中提取不到目标设备槽位，则可以确定不需要向第二电子设备发送执行指令、历史意图和对应槽位等信息。此时，第一电子设备51在获得第一对话管理模块514输出的执行指令之后，则执行该执行指令，得到对应的执行结果。

例如，在图2的场景中，手机21从用户语音“小艺小艺，推荐一首歌曲”提取不出目标设备槽位，则确定不需要向第二电子设备52发送执行指令、历史意图和对应槽位等信息。因此，在获得播放歌曲的执行指令之后，手机21则响应于该执行指令，自动播放歌曲相应的歌曲。

当第一电子设备51确定需要向第二电子设备52发送执行指令、历史意图和对应槽位等信息时，第一电子设备51除了将执行指令传输至第二电子设备52(即目标设备)之外，还将历史意图和对应的槽位等上下文信息传输至第二电子设备52。通常情况下，第一电子设备51可以将最近N轮对话的意图和对应槽位传输至第二电子设备52。N的值可以根据实际需要进行设定，示例性地，N＝1，或N＝3，或其他。即第一电子设备51可以将最近3轮对话的意图和对应槽位传输至第二电子设备52。

其中，最近N轮对话可以是指对话发生时间距离当前时间点最近的N轮对话，即最近发生的N轮对话。

例如，用户和手机上的语音助手小艺之间的部分对话可以如下表1所示。

表1

假设当前时间点为2021年6月7日20时30分，手机采集到“推荐歌曲B给大屏设备”之后，从该用户语音中提取出目标设备槽位，且目标设备槽位的实体为“大屏设备”，则确定需要向大屏设备发送执行指令和最近N轮对话的意图等信息。

此时，如果N＝1，则根据对话发生时间，确定出距离当前时间点最近的1轮对话为“推荐歌曲B给大屏设备”。即手机将推荐歌曲B的执行指令和“推荐歌曲B给大屏设备”的意图信息(即推荐音乐)传输至大屏设备。进一步地，还可以将从用户语音提取出的歌曲名称槽位一并传输至大屏设备。

如果N＝2，根据对话发生时间，确定出距离当前时间点最近的2轮对话分别为“推荐歌曲B给大屏设备”和“播放歌曲B”。手机将这两轮对话的意图和推荐歌曲B的执行指令传输至大屏设备。此时，手机传输给大屏设备的历史意图可以包括播放音乐和推荐音乐。

如果N＝3，根据对话发生时间，确定出距离当前时间点最近的3轮对话分别为“推荐歌曲B给大屏设备”、“播放歌曲B”以及“小艺小艺，播放一首歌曲A”。手机可以将这3轮对话的意图和推荐歌曲B的执行指令传输至大屏设备。此时，手机传输给大屏设备的历史意图包括播放音乐和推荐音乐。

同理，如果N＝4或者其他值，手机可以根据对话发生时间，确定出距离当前时间点最近的N轮对话，将这N轮对话中每轮对话的意图和推荐歌曲B的执行指令传输至大屏设备。

可以理解的是，当历史对话的轮数小于N时，第一电子设备51可以将所有历史对话的意图和对应槽位均传输至第二电子设备52。例如，当N＝3时，但历史对话的轮数只有2轮，即用户和设备之间只发生了两轮对话，则将这两轮对话的意图均传输至对端设备。

在另一些实施例中，第一电子设备51也可以将对话发生时间位于目标时间点之后的对话的意图均传输至第二电子设备52。目标时间点可以是当前时间点和预设时间阈值之间的差值。预设时间阈值可以根据需要设定，例如，预设时间阈值为24小时、12小时、6小时或者1小时等。

例如，以上表1示出的对话数据为例，预设时间阈值为24小时，当前时间点为2021年6月7日20时30分。根据预设时间阈值和当前时间点，则可以确定出目标时间点为2021年6月6日20时30分。

此时，由于表1中对话的发生时间均位于2021年6月6日20时30分之后，手机将播放歌曲B的执行指令和表1中所有对话的意图均传输至大屏设备。

又例如，如果预设时间阈值为1小时，目标时间点则为2021年6月7日19时30分。此时，对话发生时间位于2021年6月7日19时30分之后的对话包括“推荐歌曲B给大屏设备”、“播放歌曲B”以及“小艺小艺，播放一首歌曲A”。手机可以将播放歌曲B的执行指令和这3轮对话的意图均传输至大屏设备。

当然，在又一些实施例中，第一电子设备51可以将所有的历史对话均传输至大屏设备。但是，如果历史对话轮数较多，传输的时候可能需要占用较大的带宽，使得传输时延增大，影响用户体验。

相较而言，第一电子设备51根据对话发生时间，将距离当前时间点最近的N轮对话的意图等信息传输至第二电子设备52，不仅可以使得第二电子设备52可以根据传输过去的意图等信息，准确识别新采集的用户语音的意图，还可以使得传输时延位于合理区域，用户体验较高。

当然，在某些情况下，如果第一电子设备51和第二电子设备52之间的带宽很大，第一电子设备51可以将所有的历史对话的意图等信息传输给第二电子设备52。

在又一些实施例中，第一电子设备51也可以将最近一轮对话的意图以及关联意图一并传输至第二电子设备51。其中，关联意图是指与最近一轮对话的意图关联的意图。例如，最近一轮对话为“推荐一首歌曲给大屏设备”，其意图为推荐音乐。与推荐音乐关联的意图包括播放音乐、搜索音乐等。

进一步地，除了可以将关联意图传输给第二电子设备51，还可以将关联意图对应的相关信息一并传输给第二电子设备51。例如，关联意图为播放音乐，关联意图对应的相关信息可以包括播放音乐这一意图对应的歌曲名称和歌手信息等。

需要说明的是，第一电子设备51除了将执行指令传输给第二电子设备52之外，还将用于描述用户语音意图的信息传输给第二电子设备52。

上述用于描述用户语音意图的信息可以具体为意图。第一电子设备51从用户语音中提取出意图，并将执行指令和意图一并传输给第二电子设备52。具体应用中，第一电子设备51可以将最近N轮对话的意图传输给第二电子设备52。

此时，第二电子设备52在采集到用户语音之后，第二语义理解模块523可以根据第一电子设备51发送的意图，以及第二语音识别模块输出的用户语音的文本信息，识别出用户语音的意图。

上述用于描述用户语音意图的信息可以为语料。第一电子设备51不将从用户语音中提取出的意图传输给第二电子设备52，而是将对话语料传输给第二电子设备52。其中，对话语料是指用户语音的文本。第一电子设备51在采集到用户语音之后，通过语音识别模块将用户语音转化成文本，得到对话语料。具体应用中，第一电子设备51可以将最近N轮对话的对话语料传输给第二电子设备52。例如，以表1的对话数据为例，N＝3，第一电子设备51传输给第二电子设备52的对话语料包括：“推荐歌曲B给大屏设备”的文本、“播放歌曲B”的文本以及“小艺小艺，播放一首歌曲A”的文本。

此时，第二电子设备52在采集到用户语音之后，第二语义理解模块523可以根据第一电子设备51发送的语料，以及第二语音识别模块输出的用户语音的文本信息，识别出用户语音的意图。

例如，第一电子设备51发送给第二电子设备52的对话语料包括“推荐一首歌曲给大屏设备”，第二电子设备52新采集到的用户语音为“换一个”。第二语义理解模块523根据输入的对话语料“推荐一首歌曲给大屏设备”，以及用户语音的文本“换一个”，输出用户语音“换一个”的意图。用户语音“换一个”的意图为推荐音乐，该意图包括换歌单的槽位。

或者，第二电子设备52的第二语义理解模块523也可以先从第一电子设备51发送的语料中提取出意图，然后再根据新采集的用户语音和从对话语料中提取出的意图，识别出用户语音的意图。

例如，第一电子设备51发送给第二电子设备52的对话语料为“推荐一首歌曲给大屏设备”，第二电子设备52新采集到的用户语音为“换一个”。第二语义理解模块523可以先从“推荐一首歌曲给大屏设备”这一对话语料中，提取出“推荐音乐”的意图。然后第二语义理解模块523根据输入的意图“推荐音乐”，以及用户语音的文本“换一个”，输出用户语音“换一个”的意图。

上述用于描述用户语音意图的信息也可以同时包括意图和对话语料，即第一电子设备51在传输执行指令的时候，将最近N轮对话的对话意图和对话语料一并传输给第二电子设备52。

此时，第二电子设备52的第二语义理解模块523可以根据需要，选择第一电子设备51发送的意图或者对话语料进行意图识别。

进一步地，为了提高第二电子设备52意图识别的准确性，实现更开放的跨设备对话接续，第一电子设备51向第二电子设备52发送执行指令的时候，除了将用于描述用户语音意图的信息一并传输给第二电子设备52之外，还可以将目标信息一并传输给第二电子设备52。

该目标信息可以根据需要设定。示例性地，该目标信息可以包括槽位。该槽位可以包括意图对应的槽位。第一电子设备51可以从用户语音中提取出意图以及意图对应的槽位。例如，从用户语音“推荐歌曲A给大屏设备”中可以提取出意图“推荐音乐”以及歌曲名称槽位，歌曲名称槽位的实体为歌曲A。

该槽位除了可以包括意图对应的槽位，还可以包括目标设备槽位。也即，第一电子设备51除了可以将意图对应的槽位传输给第二电子设备52之外，还可以将目标设备槽位一并传输给第二电子设备52。例如，针对用户语音“推荐歌曲A给大屏设备”，其包括“推荐音乐”对应的槽位为歌曲名称槽位，还包括目标设备槽位，此时将歌曲名称槽位和目标设备槽位一并传输至第二电子设备52。

可以理解的是，如果第一电子设备51可以从用户语音中提取出至少两个目标设备槽位，在传输目标设备槽位时，第一电子设备51可以将对应的目标设备槽位传输给对应的第二电子设备52。

例如，手机从用户语音“推荐一首歌曲给大屏设备和平板”中提取出两个目标设备槽位，手机可以大屏设备对应的目标设备槽位传输给大屏设备，将平板的目标设备槽位传输给大屏设备。

当然，第一电子设备51如果将对话语料一并传输给第二电子设备52，第二电子设备52可以直接从对话语料中提取出意图对应的槽位和/或目标设备槽位，这样第一电子设备51可以不用将槽位传输至第二电子设备52。

该目标信息可以包括用户画像信息、用户实时位置信息等用户信息。用户画像信息示例性包括用户性别、用户喜好信息以及用户职业等信息。第一电子设备51可以根据收集的用户信息，生成用户画像。

第二电子设备52可以根据第一电子设备51发送的用户信息，确定出用户喜好、职业等个人相关的信息，根据个人相关的信息，可以给用户提供更加个性化的服务。例如，如果第一电子设备51和第二电子设备52是同一个用户账号，第二电子设备52可以根据第一电子设备51传输的用户信息，给用户推荐符合用户偏好、符合用户职业的歌曲。该目标信息也可以包括场景信息，该场景信息用于描述用户当前所处场景。第二电子设备52通过用户所处场景的信息，可以得知用户当前场景。例如，当前所处位置，当前所处场景等。并且，第二电子设备52可以根据场景信息，给用户提供更加个性化、更加准确的服务，以实现更加开放的跨设备的对话业务接续。

例如，第一电子设备51通过自身集成的加速度传感器采集到的加速度信息，确定出用户处于行走状态，将表征用户当前处于行走状态的信息传输至第二电子设备52，第二电子设备52可以得知用户当前正在行走，即确定出用户处于运动场景；然后，在给用户推荐歌曲的时候，可以给用户推荐运动场景下的歌曲。

又例如，第一电子设备51和第二电子设备52如果登陆的是同一个用户账号。在推荐歌曲场景，第二电子设备52根据用户实时位置信息，确定出用户当前处于家中，然后给用户推荐符合用户喜好的歌曲。该目标信息也可以包括应用状态信息。应用状态信息是指目标应用的相关信息，该目标应用通常是前台运行的应用程序。例如，手机正在播放音乐，目标应用则为音乐应用程序。当然，目标应用也可以不是前台运行的应用程序。

目标应用的相关信息可以根据实际应用场景设定。例如，在播放音乐场景，目标应用为音乐应用程序，目标应用的相关信息则可以包括用户播放记录，该用户播放记录包括歌曲名称和播放时间等信息。第一电子设备51通过将歌曲名称等信息传输给第二电子设备52，第二电子设备52在采集到用户语音之后，可以根据歌曲名称等信息，识别出用户语音中的歌曲名称。又例如，在导航场景，目标应用包括日程应用程序和导航应用程序，目标应用的相关信息则可以包括用户日程信息以及用户导航历史记录信息等。第一电子设备51通过将用户日程和导航历史记录等信息传输给第二电子设备52，第二电子设备52在采集到用户语音之后，可以根据这些信息，识别出用户语音中的地点信息。

由上可见，第二电子设备52可以根据应用状态信息，更准确地识别新采集的用户语音，实现更加开放的跨设备对话业务接续。此外，在一些情况下，第二电子设备52还可以根据应用状态信息，给用户提供更个性化、更精准的服务。例如，应用状态信息包括歌曲的历史播放信息，第二电子设备52可以根据歌曲的历史播放信息，给用户推荐更符合用户偏好的歌曲。

第一电子设备51传输给第二电子设备52的应用状态信息可以是与最近一轮对话的意图关联的信息。例如，最近一轮对话的意图为推荐音乐，手机上安装有至少两个音乐应用程序，与推荐音乐关联的应用状态信息包括这至少两个音乐应用程序的相关信息。这至少两个音乐应用程序可以同时处于运行状态，也可以不处于运行状态。

目标应用的相关信息还可以包括前台应用或正在运行的应用程序标识。第二电子设备52根据该应用程序标识，判断本地是否有相同的应用程序，如果有，则使用与相同的应用程序执行第一执行指令；如果没有，则使用类似的应用程序执行执行指令。

示例性地，在推荐音乐场景，手机和大屏设备均包括多个播放音乐的音乐应用程序，此时，手机上安装的音乐应用程序包括华为音乐、应用1和应用2。

某个时刻，手机正在使用华为音乐播放歌曲。手机采集到用户语音“推荐一首歌曲给大屏设备”，则生成该用户语音对应的推荐音乐的执行指令，并将推荐音乐的执行指令、历史意图、对应槽位和应用状态信息传输给大屏设备。应用状态信息包括华为音乐的应用程序标识。应用状态信息包括华为音乐、应用1和应用2这3个音乐应用程序的相关信息，例如，播放记录、歌曲名称和用户喜好歌曲等。

大屏设备在接收到应用状态信息之后，先根据华为音乐的应用程序标识，确定本地是否安装有华为音乐。如果有，则大屏设备的语音助手则响应于推荐音乐的执行指令，使用本地的华为音乐播放相应的歌曲。如果本地没有安装有华为音乐，大屏设备则可以使用其他的音乐应用程序播放相应的歌曲。

相较而言，第一电子设备51将应用状态信息传输至第二电子设备52，第二电子设备52可以根据应用状态信息，优先与目标应用相同的应用程序执行第一执行指令，使得业务流转更加自然，不突兀，用户体验更佳。

需要说明的是，目标信息可以包括槽位、用户信息、场景信息和应用状态信息中的任意一个或任意组合。

也就是说，在一些实施例中，第一电子设备51在将业务转接给第二电子设备52时，为了让第二电子设备52可以准确识别用户语音，实现跨设备的对话业务接续，可以将执行指令和用于描述用户语音意图的信息传输给第二电子设备52。在另一些实施例中，进一步地，为了让第二电子设备52的意图识别准确率更高，实现更加开放的跨设备对话业务接续，第一电子设备51可以将执行指令、用于描述用户语音意图的信息、以及目标信息一并传输给第二电子设备52。图5中示例性示出了第一电子设备51向第二电子设备52发送的信息包括执行指令、历史意图和对应槽位等。

具体应用中，第一电子设备51在向第二电子设备52发送执行指令的时候，携带的信息越多，所占用的带宽可能就越高。而第一电子设备51和第二电子设备52之间的带宽不可能无限制地大，所以如果携带的信息过多，可能会增加传输时延，影响用户体验。基于此，可以需要选择发送执行指令的时候所携带的信息。第二电子设备52通过第二指令交互服务525接收来自第一电子设备51的信息，该信息示例性包括执行指令、历史意图和对应槽位等信息；然后，第二电子设备52将该执行指令传递至第二应用程序521，第二应用程序512可以响应于该执行指令。另外，第二电子设备52还将接收到的历史意图和对应槽位等信息存储在本地。

在一些实施例中，第二电子设备52在接收到来自第一电子设备51的执行指令之后，可以自动唤醒本设备的语音助手，这样，用户可以不用通过唤醒词唤醒第二电子设备上的语音助手，用户可以直接向第二电子设备52输入对应的用户语音，从而使得跨设备的对话业务接续更加流畅，用户体验更高。

当然，在另一些实施例中，第二电子设备52在接收到第二电子设备51的执行指令之后，也可以不自动唤醒本设备的语音助手，而是采集到用户输入的特定唤醒词后再唤醒本设备的语音助手。

需要说明的是，第二电子设备52在接收到来自第一电子设备的历史意图和对应槽位等上下文信息之后，第二语义理解模块523可以将第一电子设备51发送的上下文信息放到自身的历史上下文中，并将第一电子设备51发送的上下文信息作为最新的上下文。这样，第二电子设备52在采集到新的用户语音时，可以根据最新的上下文信息，识别新采集的用户语音的意图。

示例性地，上下文信息可以包括历史意图、对应槽位和对话语料，可以包括历史意图和对应槽位，也可以包括历史意图和对话语料。

或者，第二电子设备52在接收到来自第一电子设备51的上下文信息之后，也可以根据接收到的上下文信息，创建一个新的会话。该新的会话内包括第一电子设备51发送的历史意图、对应槽位和对话语料等信息。这样，第二电子设备52在采集到新的用户语音，第二语义理解模块523可以根据会话创建时间，使用最新创建的会话包含的信息，准确识别新采集的用户语音的意图。

或者，第二电子设备52也可以将接收到的上下文信息的优先级设置为最高优先级。这样，第二电子设备52在采集到新的用户语音，第二语义理解模块523可以根据最高优先级的上下文信息，准确识别新采集的用户语音的意图。

还需要说明的是，第二电子设备52在接收第一电子设备51发送的执行指令之后，可以先判断当前是否有正在进行的任务，如果当前没有正在进行的任务，第二电子设备52可以执行第一电子设备51发送的执行指令；如果当前有正在进行的任务，可以等待当前任务执行完成后，再执行第一电子设备51发送的执行指令，也可以进一步判断当前任务的剩余时间，如果剩余时间小于一定阈值，则可以等待当前任务执行完毕后再执行第一电子设备51发送的执行指令，反之，可以中断当前任务，执行第一电子设备51发送的执行指令。这样，可以让对话业务接续更及时，用户体验更佳。

第二应用程序521响应于该执行指令，得到对应的执行结果之后，对话业务则从第一电子设备51流转至第二电子设备52。之后，第二电子设备52采集到用户语音之后，可以将根据第一电子设备51传输的历史意图和槽位等信息，准确识别用户语音的意图。

第二电子设备52采集到用户语音之后，第二应用程序521将该用户语音输入至第二语音识别模块522，获得第二语音识别模块522输出的文本信息；然后，将第二语音识别模块522输出的文本信息输入至第二语义理解模块523，第二语义理解模块523根据第二语音识别模块522输出的文本信息、第一电子设备51传输的历史意图和槽位等信息，提取出用户语音的意图和槽位；最后，将第二语义理解模块523输出的语义信息输入至第二对话管理模块524，获得执行指令。第二应用程序521获得第二对话管理模块524输出的执行指令之后，响应于该执行指令，得到该执行指令对应的执行结果。其中，第二对话管理模块52可以根据需要，选择所需要的信息生成对应的执行指令。

例如，在推荐音乐场景下，第二对话管理模块524输出推荐歌曲的执行指令。此时，第二对话管理模块524的输入可以包括语义信息等。音乐应用程序接收到推荐歌曲的执行指令之后，可以根据来自第一电子设备51的用户信息和应用状态信息等，确定出推荐歌曲为歌曲A。

也就是说，第二对话管理模块524输出的执行指令不包括推荐歌曲的信息，而是由音乐应用程序确定推荐歌曲的。

在另一些实施例中，第二对话管理模块524可以输出推荐歌曲A的执行指令。此时，第二对话管理模块524的输入可以包括语义信息和推荐歌曲的名称。该推荐歌曲的名称可以是系统根据来自第一电子设备51的用户信息和应用状态信息等确定出来的。音乐应用程序在接收到推荐歌曲A的执行指令之后，不用执行推荐操作，自动推荐歌曲A。

也就是说，第二对话管理模块524输出的执行指令包括推荐歌曲的信息。

同理，第一电子设备51一侧的第一对话管理模块514输出的执行指令，可以包括推荐歌曲的信息，也可以不包括推荐歌曲的信息。

如果第一电子设备51传输给第二电子设备52的信息中包括目标信息，第二电子设备52可以根据目标信息给用户提供更加个性化、更精准的服务，实现更加开放的跨设备对话业务接续，提高用户体验。

例如，在推荐歌曲场景，第二电子设备52根据用户信息中的用户职业信息和用户实时位置信息，给用户推荐更符合用户身份和当前位置的歌曲。具体地，第二电子设备52根据用户职业信息，确定出用户职业为教室；根据用户实时位置信息，确定用户当前所在位置为学校。基于用户职业和用户当前所处位置，第二电子设备52则给用户推荐儿童歌曲。此时，第一电子设备51和第二电子设备52的用户账号不是同一个用户。

或者，如果第二电子设备52根据用户实时位置信息，确定用户当前所在位置位家中。基于用户当前所处位置，第二电子设备52则给用户推荐符合用户喜欢的歌曲。此时，第一电子设备51和第二电子设备52的用户账号是同一个用户。由上可见，当业务需要从第一电子设备51转接至第二电子设备52时，第一电子设备51将执行指令、历史意图和槽位等信息传递给第二电子设备52，以便于第二电子设备52可以根据第一电子设备51传递的历史意图和槽位等信息，识别用户语音的意图，实现跨设备的对话业务接续。

示例性地，下面结合图6A、图6B和图7，对手机给大屏设备推荐音乐的场景进行介绍说明。图6A和图6B为本申请实施例提供的手机给大屏设备推荐音乐的场景示意图，图7为本申请实施例提供的手机给大屏设备推荐音乐的流程示意图。

如图6A和图6B所示，第一电子设备为手机62，第二电子设备为大屏设备64。手机62和大屏设备64上均安装有语音助手，并部署有图1对应的语音业务系统。

如图7所示，该流程可以包括以下步骤：

步骤S701、手机62采集用户61的第一用户语音。

此时，第一用户语音具体为“推荐一首歌曲给大屏设备”。

示例性地，用户61通过特定的唤醒词，唤醒手机62的语音助手，然后，用户61跟手机62的语音助手说“推荐一首歌曲给大屏设备”，手机62通过麦克风等声音采集装置，采集到语音数据“推荐一首歌曲给大屏设备”。

步骤S702、手机62将第一用户语音转化成第一文本。

可以理解的是，手机62内部署有图1对应的语音业务系统，或者该语音业务系统的部分模块。

以图5为例，手机62包括第一语音识别模块512、第一语义理解模块513和第一对话管理模块514。手机62采集到第一用户语音“推荐一首歌曲给大屏设备”之后，手机62的语音助手将该第一用户语音输入至第一语音识别模块512，第一语音识别模块512将第一用户语音转化成第一文本“推荐一首歌曲给大屏设备”。

步骤S703、手机62从第一文本提取出第一意图和第一槽位。

其中，第一槽位为第一意图所配置的槽位。

示例性地，第一语音识别模块512获得第一文本“推荐一首歌曲给大屏设备”之后，将第一文本“推荐一首歌曲给大屏设备”输入至第一语义理解模块513。第一语义理解模块513对第一文本进行语义理解，输出第一意图和第一槽位。此时，第一意图为推荐音乐，第一槽位包括目标设备槽位，此时，目标设备槽位的实体为大屏设备64。当然，第一槽位除了可以目标设备槽位，还可以包括其他槽位，例如，如果用户语音中包含歌曲名称，则第一槽位则包括歌曲名称槽位。

如图6A所示，手机62在识别出第一用户语音的意图之后，可以显示语音助手界面63。语音助手界面63上显示有第一文本“推荐一首歌曲给大屏设备”，以及针对第一用户语音的回答文本“好的”。

当第一槽位包括目标设备槽位，且目标设备槽位的实体不是手机62，手机62则确定需要向大屏设备64发送执行指令、历史意图和对应槽位等信息。

步骤S704、手机62根据第一意图和第一槽位，生成第一用户语音对应的第一执行指令。

示例性地，第一语义理解模块513获得第一意图和第一槽位之后，将第一意图和第一槽位等信息输入至第一对话管理模块514。第一对话管理模块514根据第一意图和第一槽位等信息，输出第一执行指令。此时，第一执行指令为用于推荐音乐的指令。

步骤S705、手机62向大屏设备64发送第一执行指令、历史意图和对应槽位等信息。该历史意图包括第一意图，对应槽位是指历史意图对应的槽位，其包括第一槽位。第一槽位可以包括目标设备槽位，也可以不包括目标设备槽位。

需要说明的是，如果除了第一用户语音之外，还包括其他的历史对话，则该历史意图则包括其他的历史对话对应的意图。例如，历史意图包括最近3轮对话的意图，每轮对话均有其对应的意图。此时，手机62和用户61之间只进行了一轮对话，则历史意图可以只包括第一意图。相对应地，对应槽位则包括第一意图对应的第一槽位。

除了第一执行指令、历史意图和对应槽位之外，手机62还可以将对话语料、用户信息、场景信息和应用状态信息等一并传递给大屏设备64。示例性地，手机62传递给大屏设备64的信息可以如表2所示。

表2

更具体地，手机62给大屏设备63传递的信息可以如下：

其中，nluResult是指意图识别结果，此时具体为手机62一侧的意图识别结果，该意图识别结果包括意图和槽位。intentNumber是指意图序号，intentName是指意图名称，此时，意图名称为推荐音乐。slots是指槽位，此时，槽位的名称为设备名称，槽位的具体参数是设备B，设备B此时具体为大屏设备64。

orgAsrText是指语音识别模块输出的文本信息，此处具体为手机62一侧的语音识别结果，该文本信息具体为“推荐一首歌给大屏设备”。

也就是说，手机62发送给大屏设备64的信息可以包括第一执行指令、历史意图、历史意图对应的槽位、对话语料信息、用户信息、场景信息和应用状态信息等。此处，对话语料包括语料“推荐一首歌曲给大屏设备”。手机62此时前台运行的应用程序为音乐应用程序，应用状态信息则可以包括用户播放记录等信息，用户信息可以包括用户画像和用户实时位置等信息，场景信息可以包括用于表征用户行走的信息。

手机62向大屏设备64转接业务的时候，将历史意图和对应槽位等信息同步至大屏设备64，这样大屏设备64在后续的对话中，可以根据手机62同步的历史意图和槽位等信息，识别出新输入的用户语音的意图，实现跨设备的对话接续。

步骤S706、大屏设备64执行第一执行指令。

示例性地，大屏设备64在接收到第一执行指令之后，将该第一执行指令传递至大屏设备64的语音助手，大屏设备64的语音助手响应于该第一执行指令，得到对应的执行结果。如图6A所示，大屏设备62执行第一执行指令，在界面上显示窗口65，窗口65上显示有提示信息，用于提示用户是否播放手机推荐的歌曲A。并且，窗口65上还显示有“播放”和“取消”两个选项按钮。

步骤S707、大屏设备64采集用户61的第二用户语音。

如图6B所示，大屏设备64在显示窗口65之后，用户61向大屏设备64输入第二用户语音。此时，第二用户语音具体为“换一个”。

此时，大屏设备64在接收到第一执行指令之后，可以自动唤醒本设备的语音助手，这样，用户可以直接向大屏设备输入第二用户语音，不用通过特定唤醒词唤醒大屏设备64的语音助手。

步骤S708、大屏设备64将第二用户语音转化成第二文本。

可以理解的是，大屏设备64内部署有图1对应的语音业务系统，或者该语音业务系统的部分模块。

以图5为例，大屏设备64包括第二语音识别模块522、第二语义理解模块523和第二对话管理模块524。大屏设备64采集到第二用户语音“换一个”之后，大屏设备64的语音助手将该第二用户语音输入至第二语音识别模块522，第二语音识别模块522将第二用户语音转化成第二文本“换一个”。

步骤S709、大屏设备64根据历史意图和对应槽位等信息，从第二文本中提取第二意图和第二槽位。

示例性地，第二语音识别模块522获得第二文本“换一个”之后，将第二文本“换一个”输入至第二语义理解模块523。第二语义理解模块523根据第二文本“换一个”和历史意图“推荐音乐”等信息进行语义识别，得到第二意图和第二槽位。此时，第二意图为推荐音乐，第二槽位可以包括设备槽位和换歌单槽位，此时，设备槽位的实体为大屏设备64。其中，由于“换一个”中不包含目标设备，设备槽位的实体默认为本设备。或者，第二槽位也可以不包括设备槽位，此时则默认在本设备执行第二执行指令。

大屏设备64根据来自手机62的历史意图“推荐音乐”等信息，可以识别出“换一个”的意图为“推荐音乐”，即“换一个”的意图继承了历史意图“推荐音乐”。

需要说明的是，如果第二用户语音中包括了明确的意图，大屏设备64可以不用根据来自手机的历史意图等信息，识别第二用户语音的意图。例如，第二用户语音为“播放歌曲A”，该用户语音中明确了“播放音乐”的意图，大屏设备64不用根据来自手机62的历史意图“推荐音乐”，即可识别出“播放歌曲A”的意图为“播放音乐”。

如果第二用户语音中没有包括明确的意图，并且，大屏设备64根据来自手机62的历史意图“推荐音乐”仍然不能识别该用户语音的意图，大屏设备64则可以向用户发出交互语音“我不能理解您的意思，请给我多一些时间学习您的习惯”。

其中，大屏设备64在对第二文本进行语义理解时，可以根据需要选择对应的信息，例如，大屏设备64可以只根据历史意图对第二文本进行语义理解，也可以根据历史意图和对应槽位，对第二文本进行语义理解。当然，如果手机62还将用户信息、应用状态信息、对话语料和场景信息中一种或多种一并传输给大屏设备64。大屏设备64也可以根据这些信息进行语义理解。例如，大屏设备64可以根据历史意图、对话语料、对应槽位和应用状态信息中的歌曲名称信息，对第二文本进行语义理解。

步骤S710、大屏设备64根据第二意图和第二槽位，生成第二用户语音对应的第二执行指令。

示例性地，第二语义理解模块523得到第二意图和第二槽位之后，将第二意图和第二槽位输入至第二对话管理模块524。第二对话管理模块524根据第二意图和第二槽位，生成第二执行指令。此时，第二执行指令为推荐音乐的指令。

步骤S711、大屏设备64执行第二执行指令。

示例性地，大屏设备64的语音助手获取到第二对话管理模块524输出的第二执行指令之后，响应于该第二执行指令，得到相应的执行结果。

如图6B所示，大屏设备64执行第二执行指令，显示窗口66，窗口66中显示有提示信息，用于询问用户是否播放歌曲B。歌曲B是大屏设备64根据推荐规则，确定出的推荐歌曲。

当然，在另一些实施例中，大屏设备也可以在播放歌曲B之前，通过语音提示用户即将要播放歌曲B。示例性地，语音提示信息为“好的，即将为您播放歌曲B”。

或者，大屏设备在确定出需要播放歌曲B之后，也可以直接播放歌曲B，不用提示用户。

相较而言，本申请实施例给出执行第二执行指令的提示信息(例如，提示窗口、提示语音等)，可以让跨设备的对话业务接续不突兀，更具人性化，用户体验更佳。

需要说明的是，手机62传递给大屏设备64的信息除了历史意图和对应槽位之外，还可以包括其他信息，根据这些信息，大屏设备64可以更准确地识别出用户语音的意图，实现更开放的跨设备对话接续，还可以根据用户提供更加个性化、更精确的服务，以提高用户体验。

例如，用户61不喜欢大屏设备64推荐的歌曲B，则再次向大屏设备64输入第三用户语音“换xxxx”，“xxxx”是歌曲名称。大屏设备64在接收第三用户语音之后，可以根据手机62发送的音乐应用程序的历史播放记录，识别出“xxxx”是歌曲名称，进而准确识别出第三用户语音的意图为推荐音乐。历史播放记录包括歌曲名称等信息。

需要说明的是，用户61想要播放的歌曲可能是新出的歌曲，大屏设备64上还没有该歌曲的信息。如果不将手机62上的音乐应用程序的历史播放记录传递给大屏设备64，大屏设备64可能识别不出“xxxx”是歌曲名称，进而无法识别第三用户语音的意图。

如果第一电子设备和第二电子设备登陆的账号是同一个用户账号，第二电子设备可以根据第一电子设备传输过来的用户信息和应用状态信息等，给用户提供服务。

例如，在图6A～图6B的场景中，手机62和大屏设备64登录的是同一个华为用户账号。手机62传输给大屏设备64的信息包括第一执行指令、历史意图、对应槽位、用户信息、场景信息和应用状态信息。其中，用户信息包括用户画像信息和用户实时位置信息。应用状态信息包括手机62上音乐应用程序的相关信息。场景信息包括用于表征用户行走的信息。

大屏设备64在接收到用户语音“换一个”之后，根据手机62发送的历史意图等信息，识别用户语音“换一个”的意图为“推荐音乐”，并基于“推荐音乐”的意图、用户信息、场景信息和应用状态信息等，生成用于推荐音乐的第二执行指令。

大屏设备64根据手机62发送的用户信息和应用状态信息，确定出推荐歌曲为歌曲B，生成用于推荐歌曲B的第二执行指令。

具体地，大屏设备64根据用户信息中的用户画像信息，可以得知手机62和大屏设备64的用户是一名教师，用户偏好的歌曲类型为流行音乐；根据用户信息中的实时位置信息，可以得知该用户当前所在位置为家里；另外，还根据用户信息中的场景信息可以确定出用户当前在处于行走状态，即用户当前所处场景为运动场景。此时，由于用户处于运动场景，则给用户推荐运动场景的歌曲。并且，由于用户正在家里，则给用户推荐符合用户偏好的歌曲。也即，给用户推荐歌曲时，需要考虑运动场景，且符合用户偏好的歌曲。进一步地，大屏设备64还根据应用状态信息中的用户历史播放记录等信息，确定出用户最近7天播放次数大于预设次数阈值的待选歌曲集合。最后，大屏设备64从待选歌曲集合中，筛选出一首或多首运动场景的流行歌曲作为推荐歌曲。此时，确定出歌曲B作为推荐歌曲。可选的，如果第二电子设备和第二电子设备登陆的账号不是同一个用户账号，第一电子设备可以不用发送用户信息和场景信息给第二电子设备。例如，第一电子设备在向第二电子设备分发第一执行指令、历史意图和对应槽位等信息时，判断第二电子设备与第一电子设备不是同一用户的电子设备，则不发送本设备记录的用户信息和场景信息等个人相关的信息。此时，第二电子设备可以根据本设备记录的用户信息和场景信息，给用户提供服务。

例如，还以图6A～图6B的场为例，手机62和大屏设备64登录的不是同一个华为用户账号，此时，手机62登录的账号是用户A的账号，大屏设备64登录的账号为用户B的账号。

手机62传输给大屏设备64的信息包括第一执行指令、历史意图以及对应槽位。大屏设备64在接收到用户语音“换一个”之后，根据手机62发送的历史意图等信息，识别用户语音“换一个”的意图为“推荐音乐”，并基于“推荐音乐”的意图、本设备的应用状态信息和用户信息等，生成用于推荐音乐的第二执行指令。

大屏设备64响应于用于推荐歌曲E的第二执行指令，根据本设备的用户信息和本设备的场景信息，确定出推荐歌曲为歌曲E。

具体地，大屏设备64根据本设备场景信息中的定位信息，确定出当前所处位置为学校。并且，根据本设备的用户信息，确定大屏设备64的用户是一名教师或者是学校。基于此，大屏设备64在推荐歌曲的时候，推荐更加符合学生身份和学生偏好的歌曲，例如，推荐儿童歌曲。

当然，第一电子设备51在判断出第二电子设备登陆的用户账号与本设备不是同一个用户时，也可以将本设备的应用状态信息和用户信息传输至第二电子设备。第二电子设备52在给用户提供服务的时候，可以只将来自第一电子设备51的其中一部分的应用状态信息或用户信息，作为提供服务的依据信息。通过对比可知，手机62通过将应用信息和用户信息等一并传输给大屏设备64，使得大屏设备64可以基于手机62发送的应用信息和用户信息，给用户推荐最佳的歌曲(即在家里时推荐歌曲B，在学校时推荐歌曲E)，以给用户提供更加个性化、精确化的服务，提高用户体验。

由上可见，手机62将历史意图和对应槽位等信息同步至大屏设备64，大屏设备64根据手机62同步的信息，准确识别出新采集的用户语音的意图，实现跨设备的对话业务接续。

需要说明的是，在图6A、图6B和图7示出的场景中，当用户语音中缺少一些关键信息，手机62可以与用户61进行一轮或多轮对话，以收集所需的信息。例如，大屏设备有两个，一个是客厅的大屏设备，另一个是卧室的大屏设备。此时，手机62在采集到第一用户语音“推荐一首歌曲给大屏设备”之后，手机62不确定用户说的大屏设备是哪一个大屏设备，因此可以输出语音“是推荐给客厅的大屏设备，还是卧室的大屏设备”。用户61可以针对手机62的输出语音，向手机62输入对应的语音。比如，用户61针对手机62输出的语音“是推荐给客厅的大屏设备，还是卧室的大屏设备呢？”，向手机62输入语音“客厅的大屏设备”。这样，手机62明确了用户是想向客厅的大屏设备推荐歌曲。

当然，手机62也可以在界面上显示文字提示信息，例如，该文字提示信息包括“客厅的大屏设备”和“卧室的大屏设备”两个选项，用户61可以根据需要选择其中一个选项。

本申请实施例提供的跨设备的对话业务接续方案除了可以应用于上文示出的音乐推荐场景，还可以应用于其他场景。

例如，参见图8A～图8C，示出了本申请实施例提供的导航场景示意图。如图8A所示，在车辆行驶过程中，用户通过手机81进行导航，通过车机82播放音乐。此时，手机81显示导航页面811，车机82显示音乐播放界面821。此时，第一电子设备具体为手机81，第二电子设备为车机82，手机81和车机82上均部署有图1对应的语音业务系统，并且设置有语音助手。

具体应用中，用户可以通过唤醒词“小艺小艺”，唤醒手机81的语音助手，然后，向手机81输入用户语音“导航到地点A”。手机81基于图1对应的语音业务系统，确定出用户语音的意图为导航，目标地点槽位的实体为地点A，并且生成对应的执行指令；手机81响应于该执行指令，打开导航应用，得到出一条从用户当前位置至地点A的路线，并显示导航界面811。

在某个时刻(例如，手机81的电量快用完了)，用户想要将导航任务从手机81接续至车机82，即使用车机82进行导航。用户可以向手机81输入用户语音“将当前导航任务流转至车机”。手机81基于图1对应的语音业务系统，确定用户语音“将当前导航任务接续至车机”的意图为导航任务接续，且确定目标设备槽位的实体是车机，生成对应的执行指令。另外，由于从用户语音“将当前导航任务接续至车机”中可以提取出目标设备槽位，且目标设备槽位的实体为车机，则可以确认需要转接业务。

手机81将用户语音“将当前导航任务接续至车机”对应的执行指令、历史意图和对应槽位等信息传输至车机82，此时，历史意图包括用户语音“导航到地点A”对应的意图，以及用户语音“将当前导航任务接续至车机”的意图。相对应地，历史意图的对应槽位包括从用户语音“导航到地点A”提取出的槽位，以及从用户语音“将当前导航任务接续至车机”中提取出的槽位。此时，执行指令包括导航路线信息。

当然，手机81还可以将对话语料，以及导航应用状态信息和日程应用状态信息等一并传输至车机82，此时，对话语料包括语料“导航到地点A”以及语料“将当前导航任务接续至车机”。导航应用状态信息包括用户的历史导航目标地点以及历史导航路线等，日程应用状态信息包括用户日程事项信息。

车机82接收到来自手机81的执行指令、历史意图和对应槽位等信息之后，响应于该执行指令，显示如图8B所示的导航界面822，并将历史意图和对应槽位等信息存储在本地，并将历史意图、对应槽位和对话语料等信息作为本地的语义理解模块的最新上下文。此时，手机81将导航任务接续至车机82之后，可以退出导航界面，显示如图8B所示的主界面812，或者也可以处于息屏状态。

用户使用车机82进行导航的过程中，可能由于某种原因(例如，当前导航路线堵车了)，需要重新规划路线。此时，用户可以向车机82输入用户语音“重新规划”。车机82采集到用户语音“重新规划”之后，先通过语音识别模块将该语音转换成文本，再将文本输入至语义理解模块。语义理解模块根据最新的上下文信息，即用户语音“导航到地点A”的意图、语料“导航到地点A”，以及用户语音“重新规划”的文本，确定出用户语音“重新规划”的意图为规划当前位置至地点A的导航路线，起点槽位的实体为当前位置，终点槽位的实体为地点A。语义理解模块将识别出的意图和槽位等信息输入至对话管理模块，对话管理模块根据意图和槽位等信息，输出执行指令。

车机82响应于用户语音“重新规划”的执行指令，重新规划出一条从当前位置至地点A的导航路线，并显示如8C所示的导航界面823。

由上可见，车机导航场景下，用户可以通过语音，控制手机81将导航任务转接至车机82，并且在转接业务的时候，将最近多轮对话的意图、语料和槽位等信息，一并传输至车机82。这样，车机82可以根据最近多轮对话的意图、语料和槽位等信息，准确识别出用户语音的意图，实现了手机81和车机82之间的跨设备对话业务接续。

又例如，参见图8D示出的本申请实施例提供的视频推荐场景示意图，如图8D所示，手机84显示视频播放界面841，视频播放界面841上显示当前正在播放的是视频1。此时，用户83想要将视频1推荐给大屏设备85，即想要将视频播放任务接续至大屏设备85，使用大屏设备85播放视频1，故对手机84说“推荐视频1给大屏设备”。

手机84采集到用户语音“推荐视频1给大屏设备”之后，基于图1对应的语音业务系统对用户语音“推荐视频1给大屏设备”进行处理，确定出用户语音“推荐视频1给大屏设备”的意图和槽位，并生成对应的执行指令。此时，用户语音“推荐视频1给大屏设备”的意图为推荐视频，目标设备槽位为大屏设备85，视频名称槽位的实体为视频1。对应的执行指令为播放视频的指令。

由于从用户语音中可以提取出目标设备槽位，且目标设备槽位的实体还不是本设备，手机84确定出需要转接业务至大屏设备85。手机84确定需要将视频播放任务流转至大屏设备85，则向大屏设备85发送用户语音“推荐视频1给大屏设备”的意图、槽位、对应的执行指令和语料“推荐视频1给大屏设备”。

此时，大屏设备85显示界面851，界面851上显示大屏设备85正在播放另一个视频。大屏设备85接收到来自手机84的信息之后，执行用户语音“推荐视频1给大屏设备”对应的执行指令，在界面851上弹出窗口852。窗口852上显示有提示信息，用于询问用户是否播放来自手机的视频1。用户可以通过选择窗口852上的“播放”选项，以让大屏设备85播放视频1，也可以选择窗口852上的“取消”选项，以让大屏设备85不播放视频1。

另外，大屏设备85还将接收到的用户语音“推荐视频1给大屏设备”的意图、槽位和语料等信息作为本地语义理解模块的最新上下文。

用户83不想播放视频1，则对大屏设备85说“别理它”。大屏设备85采集到用户语音“别理它”之后，通过语音识别模块将该用户语音转换成文本，再通过语音理解模块，根据文本“别理它”、以及最新的上下文，即用户语音“推荐视频1给大屏设备”的意图和槽位等信息，确定出用户语音“别理它”的意图为取消播放，设备槽位的实体为大屏设备，并通过对话管理模块生成对应的执行指令。

大屏设备85获取到用户语音“别理它”的执行指令之后，响应于该执行指令，不播放视频1，在界面851上去除窗口852。

由上可见，本实施例中，用户可以通过语音“推荐视频1给大屏设备”，将视频播放任务从手机转接至大屏设备，并在转接业务的时候，手机将最近多轮对话的意图和槽位等信息，随着执行指令一并传输至大屏设备，这样大屏设备即可根据手机发送的历史意图和槽位等信息，准确识别用户语音的意图，实现手机和大屏设备之间的跨设备对话业务接续。

在另一些实施例中，第一电子设备41和第二电子设备42也可以不包括图1对应的语音业务系统，或者该语音业务系统的部分模块，而是将语音业务系统部署第一电子设备41和第二电子设备42之外的设备。

此时，第一电子设备41和第二电子设备42通常是瘦设备，即第一电子设备41和第二电子设备42由于处理资源和内存资源等十分有限，无法部署语音业务系统中的语音识别引擎、语义理解引擎以及对话管理引擎等。

当然，第一电子设备41和第二电子设备42也可以是富设备，此时，虽然第一电子设备41和第二电子设备42上具备部署语音业务系统的条件，但实际上是将语音业务系统部署在第一电子设备41和第二电子设备42之外的设备。

示例性地，参见图9示出的本申请实施例提供的跨设备的对话业务接续系统的另一种示意图，第一电子设备91包括第一应用程序911和第一指令交互服务912，第二电子设备92包括第二应用程序921和第二指令交互服务922，第三电子设备93包括第一语音识别模块931、第一语义理解模块932以及第一对话管理模块933，第四电子设备94包括第二语音识别模块941、第二语义理解模块942以及第二对话管理模块943。

第一电子设备91和第三电子设备93通信连接，第二电子设备92和第四电子设备94通信连接。

第三电子设备92和第四电子设备94可以是云端服务器，其可以还包括NLG模块和TTS模块。当然，第三电子设备92和第四电子设备94也可以是手机、电脑等终端设备。

需要说明的是，图5和图9的相似或相同之处，可以参见上文图5的介绍，在此不再赘述。下面结合图10对图9的系统流程进行介绍说明。

另外，第一电子设备91本地上存储有用户信息和/或应用状态信息，在向第二电子设备92发送第一执行指令、历史意图和对应槽位等信息时，可以一并将用户信息和/或应用状态信息发送至第二电子设备92。关于用户信息和应用状态信息等相关描述，可以参见上文对应内容，在此不再赘述。

参见图10示出的本申请实施例提供的跨设备的对话业务接续方法的另一种流程示意图，该方法可以包括以下步骤：

步骤S1001、第一电子设备91采集第一用户语音。

示例性地，参见图11示出的本申请实施例提供的耳机转接音乐至音箱播放的场景示意图，用户111可以向智能耳机112输入第一用户语音“将音乐转接至音箱播放”。具体地，用户111在回家途中使用智能耳机112播放音乐，且播放的音乐是存储在智能耳机112本地的音乐；回到家中之后，用户111想要将智能耳机112正在播放的音乐转接至智能音箱113播放，故对智能耳机112说“将音乐转接至音箱播放”。智能耳机112通过声音采集装置采集到第一用户语音“将音乐转接至音箱播放”。

其中，在该场景下，第一电子设备91为智能耳机112，第二电子设备92为智能音箱113，第三电子设备93为云端服务器115，第四电子设备94为云端服务器114。

智能耳机112包括处理器和存储器等，本地存储有多首歌曲，可以连接无线Wi-Fi，安装有语音助手应用程序。智能音箱113包括处理器和存储器等，可以连接无线Wi-Fi，安装有语音助手应用程序。

步骤S1002、第一电子设备91向第四电子设备94发送第一用户语音。

以图11的场景为例，智能耳机112在回到家中后，自动与家里的无线路由器连接，并在采集到第一用户语音“将音乐转接至音箱播放”之后，智能耳机112内的语音助手将第一用户语音“将音乐转接至音箱播放”通过无线Wi-Fi上传至云端服务器114。

步骤S1003、第四电子设备94将第一用户语音转化成第一文本。

示例性地，如图9所示，第四电子设备94接收到第一用户语音之后，将第一用户语音输入至第一语音识别模块941，第一语音识别模块941将第一用户语音转化成第一文本。

步骤S1004、第四电子设备94从第一文本中提取出第一意图和第一槽位。

如图9所示，第一语音识别模块941将得到第一文本输入至第一语义理解模块942。第一语义理解模块942对第一文本进行意图识别，得到第一意图和第一槽位。

以图11的场景为例，第一文本为“将音乐转接至音箱播放”，从该第一文本中可以确定出第一意图为音乐转接播放，第一槽位包括目标设备槽位，且目标设备槽位的实体为音箱。

步骤S1005、第四电子设备94根据第一意图和第一槽位，生成第一用户语音对应的第一执行指令。

如图9所示，第一语义理解模块942得到第一意图和第一槽位之后，将第一意图和第一槽位输入至第一对话管理模块943。第一对话管理模块943则根据第一意图和第一槽位，生成第一执行指令。

以图11的场景为例，第一意图为音乐转接播放，第一槽位包括目标设备槽位，第一执行指令则为播放音乐的执行指令。

步骤S1006、第四电子设备94向第一电子设备91发送第一执行指令、第一意图和第一槽位。

需要说明的是，第四电子设备94还可以将第一文本传输至第一电子设备91。例如，图11的场景中，云端服务器114可以将第一用户语音“将音乐转接至音箱播放”的文本传输给智能耳机112。步骤S1007、第一电子设备91向第二电子设备92发送第一执行指令、历史意图和对应槽位等信息，历史意图包括第一意图，对应槽位包括第一槽位。

需要说明的是，历史意图可以包括最近N轮对话的意图。除了可以将第一执行指令、历史意图、对应槽位传输至第二电子设备92之外，还可以将上下文信息和应用状态信息传输至第二电子设备。

最近N轮对话的意图、槽位以及语料等相关信息可以存储在第一电子设备91本地，也可以存储在第四电子设备94，此时，当第四电子设备94确定出需要向第二电子设备92发送执行指令、意图和槽位等信息之后，则将最近N轮对话的意图、槽位以及语料等相关信息一并传输给第一电子设备91。

在图11的场景中，智能耳机112在接收到云端服务器114发送的第一执行指令、第一意图和第一槽位之后，可以将当前正在播放的歌曲的相关信息、第一执行指令、历史意图和对应槽位等信息传输至智能音箱113。当前正在播放的歌曲的相关信息可以包括歌曲名称信息、歌手信息以及播放进度信息等。

智能耳机112和智能音箱113之间的连接可以是通过蓝牙连接、WiFi点对点连接，或者智能耳机112和智能音箱113连接至同一个无线路由器。

步骤S1008、第二电子设备92执行第一执行指令。

在图11的场景中，智能音箱113在接收到智能耳机112传输的信息之后，可以根据当前正在播放的歌曲的相关信息，得知歌曲名称和播放进度等信息，此时，歌曲名称为歌曲A；智能音箱113响应于第一执行指令，向用户111发出提示语音“来自耳机的歌曲A，是否播放？”。用户111不想播放歌曲A，则对智能音箱113说“换一个”。

当然，智能音箱113在响应于第一执行指令时，也可以直接播放对应的歌曲，不发出对应的提示语音。此时，用户111在智能音箱113播放歌曲A之后，可以对智能音箱113说“换一个”，以换一首歌曲播放。

步骤S1009、第二电子设备92采集第二用户语音。

在图11的场景中，第二用户语音为“换一个”。

步骤S1010、第二电子设备92向第三电子设备93发送第二用户语音、历史意图和对应槽位等信息。

步骤S1011、第三电子设备93将第二用户语音转化成第二文本。

如图9所示，第三电子设备93接收到第二用户语音、历史意图和对应槽位等信息之后，第三电子设备93可以将第二用户语音输入至第二语音识别模块931。第二语音识别模块931将第二用户语音转化成第二文本。

在图11的场景中，云端服务器115将第二用户语音“换一个”转化成第二文本“换一个”。

步骤S1012、第三电子设备93根据历史意图和对应槽位等信息，从第二文本中提取出第二意图和第二槽位。

如图9所示，第二语音识别模块931将第二文本输入至第二语义理解模块932。第二语义理解模块932根据第二文本、目标意图和第一槽位等信息，确定出第二用户语音的第二意图和第二槽位。

在图11的场景中，目标意图为音乐转接播放，目标设备槽位的实体为智能音箱113，第二文本为“换一个”，云端服务器115上的语义理解模块则可以确定出第二意图为播放音乐，第二槽位包括设备槽位，设备槽位的实体为智能音箱113。

步骤S1013、第三电子设备93根据第二意图和第二槽位，生成第二用户语音对应的第二执行指令。

如图9所示，第二语义理解模块932将得到的第二意图和第二槽位等信息输入至第二对话管理模块933，第二对话管理模块933输入第二执行指令。

步骤S1014、第三电子设备93向第二电子设备92发送第二执行指令。

步骤S1015、第二电子设备92执行第二执行指令。

以图11的场景为例，智能音箱113接收到云端服务器115发送的第二执行指令后，则响应于第二执行指令，自动播放歌曲B。

在又一些实施例中，第一电子设备41和第二电子设备42中的其中一个不包括图1对应的语音业务系统，或该语音业务系统的部分模块，而另一个则部署有图1对应的语音业务系统或者该语音业务系统的部分模块。

示例性地，参见图12示出的本申请实施例提供的跨设备的对话业务接续系统的又一种示意图，该系统可以包括第一电子设备121、第二电子设备122以及第三电子设备123。

第一电子设备121包括第一应用程序1211、第一语音识别模块1212、第一语义理解模块1213、第一对话管理模块1214以及第一指令交互服务1215。

第二电子设备122包括第二应用程序1221和第二指令交互服务1222。

第三电子设备123包括第二语音识别模块1231、第二语义理解模块1232以及第二对话管理模块1233。

另外，第一电子设备121本地上存储有用户信息和/或应用状态信息，在向第二电子设备122发送第一执行指令、历史意图和对应槽位等信息时，可以一并将用户信息和/或应用状态信息发送至第二电子设备122。关于用户信息和应用状态信息等相关描述，可以参见上文对应内容，在此不再赘述。

参见图13示出的本申请实施例提供的跨设备的对话业务接续方法的又一种流程示意图，该方法可以包括以下步骤：

步骤S1301、第一电子设备121采集第一用户语音。

步骤S1302、第一电子设备121将第一用户语音转化成第一文本。

如图12所示，第一电子设备121采集到第一用户语音之后，第一应用程序1211将第一用户语音输入至第一语音识别模块1212。第一语音识别模块1212将第一用户语音转化成第一文本。

以图14的场景为例，第一电子设备121为手机142，第二电子设备为智能音箱143，第三电子设备123为云端服务器144。图14为本申请实施例提供的手机给智能音箱推荐音乐的场景示意图。

如图14所示，手机142显示播放界面1421，播放界面1421上显示手机142正在播放歌曲C。此时，用户141对手机142说“推荐一首歌曲给音箱”，手机142采集到第一用户语音“推荐一首歌曲给音箱”，并通过语音识别模块将第一用户语音“推荐一首歌曲给音箱”转化成第一文本“推荐一首歌曲给音箱”。

步骤S1303、第一电子设备121从第一文本中提取出第一意图和第一槽位。

如图12所示，第一语音识别模块1212将第一用户语音转化成第一文本之后，将第一文本输入至第一语义理解模块1213，以通过第一语义理解模块1213提取出第一意图和第一槽位。

在图14的场景中，第一文本为“推荐一首歌曲给音箱”，第一意图为推荐歌曲，第一槽位包括目标设备槽位，目标设备槽位的实体为音箱。

步骤S1304、第一电子设备12根据第一意图和第一槽位，生成第一用户语音对应的第一执行指令。

如图12所示，第一语义理解模块1213得到第一意图和第一槽位之后，将第一意图和第一槽位输入至第一对话管理模块1214，获得第二对话管理模块1214输出的第一执行指令。

在图14的场景中，第一执行指令为播放歌曲的指令。

如图14所示，手机142在采集到第一用户语音“推荐一首歌曲给音箱”之后，基于语音业务系统对第一用户语音进行处理，并显示界面1422，在界面1422上显示有第一文本，以及手机142针对第一用户语音的回答文本“好的”。

步骤S1305、第一电子设备121向第二电子设备122发送第一执行指令、历史意图和对应槽位等信息，历史意图包括第一意图，对应槽位包括第一槽位。

步骤S1306、第二电子设备122执行第一执行指令。

在图14的场景中，智能音箱143响应于第一执行指令，向用户141发出提示语音“来自手机的歌曲A，是否播放？”，以询问用户是否播放。当然，智能音箱143也可以响应于第一执行指令，自动播放歌曲A，不用询问用户是否播放。

步骤S1307、第二电子设备122采集第二用户语音。

如图14所示，智能音箱143在发出提示语音“来自手机的歌曲A，是否播放？”，用户141对智能音箱143说“换一个”，智能音箱143则采集到第二用户语音“换一个”。

步骤S1308、第二电子设备122向第三电子设备123发送第二用户语音、历史意图和对应槽位等信息。

步骤S1309、第三电子设备123将第二用户语音转化成第二文本。

如图12所示，第二电子设备122的第二应用程序1221将第二用户语音、历史意图和对应槽位等信息传输至第三电子设备123。第三电子设备123将第二用户语音输入至第二语音识别模块1231，获得第二语音识别模块1231输出的第二文本。

步骤S1310、第三电子设备123根据历史意图和对应槽位等信息，从第二文本中提取出第二意图和第二槽位。

如图12所示，第三电子设备123获得第二语音识别模块1231输出的第二文本之后，将第二文本输入至第二语义理解模块1232。第二语义理解模块1232根据第二文本、历史意图和对于槽位等信息，输出第二意图和第二槽位。

在图14的场景中，第二文本为“换一个”，历史意图包括推荐歌曲，对应槽位包括目标设备槽位，该目标设备槽位的实体为智能音箱143，第二意图为播放歌曲，第二槽位包括设备槽位，该设备槽位的实体为智能音箱143。

步骤S1311、第三电子设备123根据第二意图和第二槽位，生成第二用户语音对应的第二执行指令。

如图12所示，第二语义理解模块1232将第二意图和第二槽位输入至第二对话管理模块1233，获得第二对话管理模块1233输出的第二执行指令。

步骤S1312、第三电子设备123向第二电子设备122发送第二执行指令。

步骤S1313、第二电子设备122执行第二执行指令。

在图14的场景中，智能音箱143接收到第二执行指令之后，响应于第二执行指令，自动播放歌曲B。

本申请实施例涉及的电子设备的类型可以是任意的。示例性地，第一电子设备可以为但不限于手机、平板电脑、智能音箱、智慧大屏(也可称为智能电视)或者可穿戴式设备等。同理，第二电子设备也可以为但不限于手机、平板电脑、智能音箱、智慧大屏(也可称为智能电视)或者可穿戴式设备等。

作为示例而非限定，第一电子设备或第二电子设备的具体结构可以如图15所示。图15为本申请实施例提供的电子设备硬件结构示意图。

如图15所示，电子设备1500可以包括处理器1510、内部存储器1520、通信模块 1530、音频模块1540、扬声器1541、麦克风1542以及天线。

可以理解的是，本申请实施例示意的结构并不构成对电子设备1500的具体限定。在本申请另一些实施例中，电子设备1500可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件，软件或软件和硬件的组合实现。

例如，当电子设备1500为手机时，电子设备1500还可以包括外部存储器接口，通用串行总线(universal serial bus，USB)接口，充电管理模块，电源管理模块，电池，受话器，耳机接口，传感器模块，按键，马达，指示器，摄像头，显示屏，以及用户标识模块(subscriber identification module，SIM)卡接口等。其中传感器模块可以包括压力传感器，陀螺仪传感器，气压传感器，磁传感器，加速度传感器，距离传感器，接近光传感器，指纹传感器，温度传感器，触摸传感器，环境光传感器，骨传导传感器等。

其中，处理器1510可以包括一个或多个处理单元，例如：处理器1510可以包括应用处理器(application processor，AP)，调制解调处理器，控制器，存储器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

其中，控制器可以是电子设备1500的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号，产生操作控制信号，完成取指令和执行指令的控制。处理器1510中还可以设置存储器，用于存储指令和数据。

在一些实施例中，处理器1510可以包括一个或多个接口。接口可以包括集成电路内置音频(inter-integrated circuit sound，I2S)接口，脉冲编码调制(pulse code modulation，PCM)接口，通用输入输出(general-purpose input/output，GPIO)接口等。

I2S接口可以用于音频通信。在一些实施例中，处理器1510可以包含多组I2S总线。处理器1510可以通过I2S总线与音频模块1540耦合，实现处理器1510与音频模块1540之间的通信。

PCM接口也可以用于音频通信，将模拟信号抽样，量化和编码。在一些实施例中，音频模块1540与通信模块1530中无线通信模块1可以通过PCM总线接口耦合。I2S接口和PCM接口都可以用于音频通信。

GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号，也可被配置为数据信号。在一些实施例中，GPIO接口可以用于连接处理器1510与音频模块1540等。GPIO接口还可以被配置为I2S接口等。

可以理解的是，本申请实施例示意的各模块间的接口连接关系，只是示意性说明，并不构成对电子设备1500的结构限定。在本申请另一些实施例中，电子设备1500也可以采用上述实施例中不同的接口连接方式，或多种接口连接方式的组合。

通信模块1530可以包括移动通信模块和/或无线通信模块。

电子设备1500的无线通信功能可以通过天线、移动通信模块、无线通信模块、调制解调处理器以及基带处理器等实现。

天线用于发射和接收电磁波信号。移动通信模块可以提供应用在电子设备1500 上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块可以包括至少一个滤波器，开关，功率放大器，低噪声放大器(low noise amplifier，LNA)等。移动通信模块可以由天线接收电磁波，并对接收的电磁波进行滤波，放大等处理，传送至调制解调处理器进行解调。移动通信模块还可以对经调制解调处理器调制后的信号放大，经天线1转为电磁波辐射出去。在一些实施例中，移动通信模块的至少部分功能模块可以被设置于处理器1510中。在一些实施例中，移动通信模块的至少部分功能模块可以与处理器1510的至少部分模块被设置在同一个器件中。

调制解调处理器可以包括调制器和解调器。其中，调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后，被传递给应用处理器。应用处理器通过音频设备(不限于扬声器等)输出声音信号。

无线通信模块可以提供应用在电子设备1500上的包括无线局域网(wireless local area networks，WLAN)(如无线保真(wireless fidelity，Wi-Fi)网络)，蓝牙(bluetooth，BT)，全球导航卫星系统(global navigation satellite system，GNSS)，调频(frequency modulation，FM)，近距离无线通信技术(near field communication，NFC)，红外技术(infrared，IR)等无线通信的解决方案。无线通信模块可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块经由天线接收电磁波，将电磁波信号调频以及滤波处理，将处理后的信号发送到处理器1510。无线通信模块还可以从处理器1510接收待发送的信号，对其进行调频，放大，经天线转为电磁波辐射出去。

例如，手机通过Wi-Fi点对点连接，将执行指令、历史意图和槽位等信息传输至大屏设备。

NPU为神经网络(neural-network，NN)计算处理器，通过借鉴生物神经网络结构，例如借鉴人脑神经元之间传递模式，对输入信息快速处理，还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用，例如：图像识别，人脸识别，语音识别，文本理解等。例如，手机通过NPU实现对输入的用户语音进行识别，得到用户语音的文本信息；以及实现对用户语音的文本信息进行语义理解，提取出用户语音的槽位和意图等。

内部存储器1520可以用于存储计算机可执行程序代码，所述可执行程序代码包括指令。处理器1510通过运行存储在内部存储器1520的指令，从而执行电子设备1500的各种功能应用以及数据处理。内部存储器1520可以包括存储程序区和存储数据区。其中，存储程序区可存储操作系统，至少一个功能所需的应用程序(比如声音播放功能)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据等)等。此外，内部存储器121可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件，闪存器件，通用闪存存储器(universal flash storage，UFS)等。

本申请实施例中，内部存储器1520中存储有语音助手应用程序或者集成有语音助手功能的应用程序。

电子设备1500可以通过音频模块1540，扬声器1541，麦克风1542以及应用处理器等实现音频功能。例如音乐播放，录音等。

音频模块1540用于将数字音频信息转换成模拟音频信号输出，也用于将模拟音频输入转换为数字音频信号。音频模块1540还可以用于对音频信号编码和解码。在一些实施例中，音频模块1540可以设置于处理器1510中，或将音频模块1540的部分功能模块设置于处理器1510中。

扬声器1541，也称“喇叭”，用于将音频电信号转换为声音信号。电子设备1500可以通过扬声器170A收听音乐，或收听免提通话。

麦克风1542，也称“话筒”，“传声器”，用于将声音信号转换为电信号。当用户和电子设备的语音助手对话时，用户可以通过人嘴靠近麦克风1542发声，将声音信号输入到麦克风1542。电子设备1500可以设置至少一个麦克风1542。在另一些实施例中，电子设备1500可以设置两个麦克风1542，除了采集声音信号，还可以实现降噪功能。在另一些实施例中，电子设备1500还可以设置三个，四个或更多麦克风1542，实现采集声音信号，降噪，还可以识别声音来源，实现定向录音功能等。

本申请实施例中，电子设备1510可以通过麦克风1542以及音频模块1540采集用户语音，通过扬声器1541以及音频模块1540输出语音，以实现人机对话。

电子设备1500的软件系统可以采用分层架构，事件驱动架构，微核架构，微服务架构，或云架构。

在介绍完电子设备的硬件架构之后，下面将对该电子设备的软件系统架构进行介绍。

电子设备1500的软件系统可以采用分层架构，事件驱动架构，微核架构，微服务架构，或云架构。本申请实施例以分层架构为例，示例性说明电子设备1500的软件结构。

分层架构将软件分成若干个层，每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中，将Android系统分为四层，从上至下分别为应用程序层，应用程序框架层，安卓运行时(Android runtime)和系统库，以及内核层。

应用程序层可以包括一些应用程序包，例如，应用程序包可以包括语音助手、相机，图库，日历，通话，地图，导航，WLAN，蓝牙，音乐，视频，短信息等应用程序。

应用程序框架层为应用程序层的应用程序提供应用编程接口(application programming interface，API)和编程框架。应用程序框架层包括一些预先定义的函数。示例性地，应用程序框架层可以包括窗口管理器，内容提供器，视图系统，电话管理器，资源管理器，通知管理器等。

窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小，判断是否有状态栏，锁定屏幕，截取屏幕等。内容提供器用来存放和获取数据，并使这些数据可以被应用程序访问。所述数据可以包括视频，图像，音频，拨打和接听的电话，浏览历史和书签，电话簿等。视图系统包括可视控件，例如显示文字的控件，显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如，包括短信通知图标的显示界面，可以包括显示文字的视图以及显示图片的视图。电话管理器用于提供电子设备1500的通信功能。例如通话状态的管理(包括接通，挂断等)。资源管理器为应用程序提供各种资源，比如本地化字符串，图标，图片，布局文件，视频文件等等。

通知管理器使应用程序可以在状态栏中显示通知信息，可以用于传达告知类型的消息，可以短暂停留后自动消失，无需用户交互。比如通知管理器被用于告知下载完成，消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知，例如后台运行的应用程序的通知，还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息，发出提示音，电子设备振动，指示灯闪烁等。

Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。

核心库包含两部分：一部分是java语言需要调用的功能函数，另一部分是安卓的核心库。

应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理，堆栈管理，线程管理，安全和异常的管理，以及垃圾回收等功能。

内核层是硬件和软件之间的层。内核层至少包含显示驱动，摄像头驱动，音频驱动，传感器驱动。

本申请实施例提供的电子设备，可以包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如上述方法实施例中任一项的方法。

本申请实施例还提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在电子设备上运行时，使得电子设备执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例还提供一种芯片系统，所述芯片系统包括处理器，所述处理器与存储器耦合，所述处理器执行存储器中存储的计算机程序，以实现如上述各个方法实施例所述的方法。所述芯片系统可以为单个芯片，或者多个芯片组成的芯片模组。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。此外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。

最后应说明的是：以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何在本申请揭露的技术范围内的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种跨设备的对话业务接续系统，其特征在于，包括第一电子设备和至少一个第二电子设备：

所述第一电子设备用于采集第一用户语音；若确定所述第一用户语音包含用于指示向所述第二电子设备发送指令的信息，则向所述第二电子设备发送第一信息和第一执行指令，所述第一信息包括用于描述所述第一用户语音的意图的信息，所述第一执行指令为所述第一用户语音对应的执行指令；

所述第二电子设备用于在接收到所述第一执行指令之后，采集第二用户语音；执行所述第二用户语音对应的第二执行指令，所述第二执行指令为根据所述第一信息和所述第二用户语音生成的指令。
根据权利要求1所述的系统，其特征在于，所述用于描述所述第一用户语音的意图的信息包括所述第一用户语音的第一文本和/或所述第一用户语音的第一意图。
根据权利要求2所述的系统，其特征在于，所述第一信息包括N轮对话的文本和/或意图，N为大于1的正整数；

所述N轮对话的文本包括所述第一用户语音的第一文本，所述N轮对话的意图包括所述第一用户语音的第一意图；

其中，所述N轮对话为所述第一电子设备采集的用户对话。
根据权利要求1所述的系统，其特征在于，所述第一执行指令包括用于表征所述第一用户语音的槽位的信息。
根据权利要求1至4任一项所述的系统，其特征在于，所述第一电子设备具体用于：

对所述第一用户语音进行语音识别，得到第一文本；

对所述第一文本进行语义理解，得到所述第一用户语音的第一意图和第一槽位；

若所述第一槽位包括目标设备槽位，且所述目标设备槽位的实体为所述第二电子设备，则确定所述第一用户语音包含用于指示向所述第二电子设备发送指令的信息；

根据所述第一意图和所述第一槽位，生成所述第一用户语音对应的所述第一执行指令。
根据权利要求1至4任一项所述的系统，其特征在于，所述系统还包括与所述第一电子设备通信连接的第三电子设备；所述第一电子设备具体用于：

向所述第三电子设备发送所述第一用户语音；

接收来自所述第三电子设备的第一槽位、第一意图和第一执行指令，所述第一槽位和所述第一意图为所述第三电子设备从所述第一用户语音中提取的，所述第一执行指令为所述第三电子设备根据所述第一槽位和所述第一意图生成的所述第一用户语音对应的执行指令；

若所述第一槽位包括目标设备槽位，且所述目标设备槽位的实体为所述第二电子设备，则确定所述第一用户语音包含用于指示向所述第二电子设备发送指令的信息。
根据权利要求1至6任一项所述的系统，其特征在于，所述第二电子设备具体用于：

对所述第二用户语音进行语音识别，得到第二文本；

根据所述第一信息，对所述第二文本进行语义理解，得到所述第二用户语音的语义信息；

根据所述第二用户语音的语义信息，生成所述第二用户语音对应的第二执行指令。
根据权利要求7所述的系统，其特征在于，所述第二电子设备具体用于：

将所述第一信息作为语义理解模块的最新上下文，所述第二电子设备包括所述语义理解模块；

将所述第二文本输入所述语义理解模块，获得所述语义理解模块输出的所述第二用户语音的语义信息，其中，所述语义理解模块采用所述最新上下文对所述第二文本进行语义理解。
根据权利要求1至6任一项所述的系统，其特征在于，所述系统还包括与所述第二电子设备通信连接的第四电子设备；

所述第二电子设备具体用于：

向所述第四电子设备发送所述第二用户语音和所述第一信息；

接收来自所述第四电子设备的第二用户语音的语义信息和第二执行指令；

其中，所述第二用户语音的语义信息为所述第四电子设备根据所述第一信息对所述第二用户语音进行语义理解得到的信息，所述第二执行指令为所述第四电子设备根据所述第二用户语音的语义信息生成的所述第二用户语音对应的执行指令。
根据权利要求7所述的系统，其特征在于，所述第一电子设备具体用于：

确定所述第一电子设备的用户账号和所述第二电子设备的用户账号是否为同一个用户；

若是，向所述第二电子设备发送所述第一执行指令和所述第一信息，并向所述第二电子设备发送第二信息，所述第二信息包括第一用户信息、场景信息和第一应用状态信息中的任意一种或任意组合；

其中，所述第一用户信息为用于描述所述第一电子设备的用户的信息，所述第一应用状态信息为用于表征所述第一电子设备上的第一目标应用的信息，所述场景信息为用于描述用户场景的信息；

所述第二电子设备具体用于：

根据第一信息、所述第二用户语音和所述第二信息，生成所述第二执行指令。
根据权利要求10所述的系统，其特征在于，所述第一电子设备具体用于：

若所述第一电子设备的用户账号和所述第二电子设备的用户账号不是同一个用户，向所述第二电子设备发送所述第一执行指令和所述第一信息；

所述第二电子设备具体用于：

根据所述第一信息、所述第二用户语音和第三信息，生成所述第二执行指令，所述第三信息包括第二用户信息和/或第二应用状态信息；

其中，所述第二用户信息为用于描述所述第二电子设备的用户的信息，所述第二应用状态信息为用于表征所述第二电子设备上的第二目标应用的信息。
根据权利要求1所述的系统，其特征在于，若存在至少两个所述第二电子设备，且所述至少两个第二电子设备与所述第一电子设备的连接方式不同，所述第一电子设备具体用于：

确定与所述至少两个第二电子设备之间的通信连接的类型；

根据所述通信连接的类型，通过不同的所述通信连接分别向所述至少第二电子设备发送所述第一信息和所述第一执行指令。
根据权利要求1所述的系统，其特征在于，所述第二电子设备具体用于：

在执行所述第一执行指令时，或提示用户是否执行所述第一执行指令时，采集所述第二用户语音。
根据权利要求1所述的系统，其特征在于，所述第二电子设备还用于：

在接收所述第一执行指令后，唤醒语音助手，所述第二电子设备包括所述语音助手。
根据权利要求1所述的系统，其特征在于，所述第一执行指令为推荐音乐的指令，第二执行指令为用于推荐另一首歌曲的指令。
一种跨设备的对话业务接续方法，其特征在于，应用于第一电子设备，所述方法包括：

采集第一用户语音；

确定所述第一用户语音包含用于指示向第二电子设备发送指令的信息后，向所述第二电子设备发送第一信息和第一执行指令；

其中，所述第一信息包括用于描述所述第一用户语音的意图的信息，所述第一执行指令为所述第一用户语音对应的执行指令。
根据权利要求16所述的方法，其特征在于，所述用于描述所述第一用户语音的意图的信息包括所述第一用户语音的第一文本和/或所述第一用户语音的第一意图。
根据权利要求17所述的方法，其特征在于，所述第一信息包括N轮对话的文本和/或意图，N为大于1的正整数；

所述N轮对话的文本包括所述第一用户语音的第一文本，所述N轮对话的意图包括所述第一用户语音的第一意图；

其中，所述N轮对话为所述第一电子设备采集的用户对话。
根据权利要求16所述的方法，其特征在于，所述第一执行指令包括用于表征所述第一用户语音的槽位的信息。
根据权利要求16至19任一项所述的方法，其特征在于，确定所述第一用户语音包含用于指示所述第二电子设备的信息后，向所述第二电子设备发送第一信息和第一执行指令，包括：

对所述第一用户语音进行语音识别，得到第一文本；

对所述第一文本进行语义理解，得到所述第一用户语音的第一意图和第一槽位；

若所述第一槽位包括目标设备槽位，且所述目标设备槽位的实体为所述第二电子设备，则确定所述第一用户语音包含用于指示向所述第二电子设备发送指令的信息；

根据所述第一意图和所述第一槽位，生成所述第一用户语音对应的所述第一执行指令；

向所述第二电子设备发送所述第一信息和所述第一执行指令，所述第一信息包括所述第一意图和/或所述第一文本。
根据权利要求16至19任一项所述的方法，其特征在于，确定所述第一用户语音包含用于指示所述第二电子设备的信息后，向所述第二电子设备发送第一信息和第一执行指令，包括：

向第三电子设备发送所述第一用户语音；

接收来自所述第三电子设备的第一槽位、第一意图和第一执行指令，所述第一槽位和所述第一意图为所述第三电子设备从所述第一用户语音中提取的，所述第一执行指令为所述第三电子设备根据所述第一槽位和所述第一意图生成的所述第一用户语音对应的执行指令；

若所述第一槽位包括目标设备槽位，且所述目标设备槽位的实体为所述第二电子设备，则确定所述第一用户语音包含用于指示向所述第二电子设备发送指令的信息；

向所述第二电子设备发送所述第一信息和所述第一执行指令，所述第一信息包括所述第一意图和/或所述第一用户语音的第一文本。
根据权利要求16所述的方法，其特征在于，在向所述第二电子设备发送所述第一信息和所述第一执行指令之前，所述方法还包括：

确定所述第一电子设备的用户账号和所述第二电子设备的用户账号是否为同一个用户；

若是，进入向所述第二电子设备发送所述第一执行指令和所述第一信息的步骤，并向所述第二电子设备发送第二信息，所述第二信息包括第一用户信息、场景信息和第一应用状态信息中的任意一种或任意组合；

其中，所述第一用户信息为用于描述所述第一电子设备的用户的信息，所述场景信息为用于描述用户场景的信息，所述第一应用状态信息为用于表征所述第一电子设备上的第一目标应用的信息。
根据权利要求16所述的方法，其特征在于，若存在至少两个所述第二电子设备，向所述第二电子设备发送所述第一信息和所述第一执行指令，包括：

确定与所述至少两个第二电子设备之间的通信连接的类型；

根据所述通信连接的类型，通过不同的所述通信连接分别向所述至少第二电子设备发送所述第一信息和所述第一执行指令。
根据权利要求16所述的方法，其特征在于，所述第一执行指令为推荐音乐的指令。
一种跨设备的对话业务接续方法，其特征在于，应用于第二电子设备，所述方法包括：

接收来自第一电子设备的第一执行指令和第一信息，所述第一信息包括用于描述第一用户语音的意图的信息，所述第一执行指令为所述第一用户语音对应的执行指令，所述第一用户语音为所述第一电子设备采集的，且包含用于指示向所述第二电子设备发送指令的信息的语音；

采集第二用户语音；

执行所述第二用户语音对应的第二执行指令，所述第二执行指令为根据所述第一信息和所述第二用户语音生成的指令。
根据权利要求25所述的方法，其特征在于，所述用于描述所述第一用户语音的意图的信息包括所述第一用户语音的第一文本和/或所述第一用户语音的第一意图。
根据权利要求26所述的方法，其特征在于，所述第一信息包括N轮对话的文本和/或意图，N为大于1的正整数；

所述N轮对话的文本包括所述第一用户语音的第一文本，所述N轮对话的意图包括所述第一用户语音的第一意图；

其中，所述N轮对话为所述第一电子设备采集的用户对话。
根据权利要求25所述的方法，其特征在于，所述第一执行指令包括用于表征所述第一用户语音的槽位的信息。
根据权利要求25至28任一项所述的方法，其特征在于，执行所述第二用户语音对应的第二执行指令，包括：

对所述第二用户语音进行语音识别，得到第二文本；

根据所述第一信息，对所述第二文本进行语义理解，得到所述第二用户语音的语义信息；

根据所述第二用户语音的语义信息，生成所述第二用户语音对应的第二执行指令；

执行所述第二执行指令。
根据权利要求29所述的方法，其特征在于，根据所述第一信息，对所述第二文本进行语义理解，得到所述第二用户语音的语义信息，包括：

将所述第一信息作为语义理解模块的最新上下文，所述第二电子设备包括所述语义理解模块；

将所述第二文本输入所述语义理解模块，获得所述语义理解模块输出的所述第二用户语音的语义信息，其中，所述语义理解模块采用所述最新上下文对所述第二文本进行语义理解。
根据权利要求29所述的方法，其特征在于，若所述第一电子设备的用户账号和所述第二电子设备的用户账号是同一个用户，所述方法还包括：

接收来自所述第一电子设备的第二信息，所述第二信息包括第一用户信息、场景信息和第一应用状态信息中的任意一种或任意组合；

根据所述第二用户语音的语义信息，生成所述第二用户语音对应的第二执行指令，包括：

根据所述语义信息和所述第二信息，生成所述第二执行指令；

其中，所述第一用户信息为用于描述所述第一电子设备的用户的信息，所述场景信息为用于描述用户场景的信息，所述第一应用状态信息为用于表征所述第一电子设备上的第一目标应用的信息。
根据权利要求29所述的方法，其特征在于，若所述第一电子设备的用户账号和所述第二电子设备的用户账号不是同一个用户，根据所述第二用户语音的语义信息，生成所述第二用户语音对应的第二执行指令，包括：

根据所述语义信息和第三信息，生成所述第二执行指令；

所述第三信息包括第二用户信息和/或第二应用状态信息，所述第二用户信息为用于描述所述第二电子设备的用户的信息，所述第二应用状态信息为用于表征所述第二电子设备上的第二目标应用的信息。
根据权利要求25至28任一项所述的方法，其特征在于，执行所述第二用户语音对应的第二执行指令，包括：

向第四电子设备发送所述第二用户语音和所述第一信息；

接收来自所述第四电子设备的第二用户语音的语义信息和所述第二执行指令；

其中，所述第二用户语音的语义信息为所述第四电子设备根据所述第一信息对所述第二用户语音进行语义理解得到的信息，所述第二执行指令为所述第四电子设备根据所述第二用户语音的语义信息生成的所述第二用户语音对应的执行指令；

执行所述第二执行指令。
根据权利要求25所述的方法，其特征在于，采集第二用户语音，包括：

在执行所述第一执行指令时，或提示用户是否执行所述第一执行指令时，采集所述第二用户语音。
根据权利要求25所述的方法，其特征在于，在采集所述第二用户语音之前，所述方法还包括：

在接收所述第一执行指令后，唤醒语音助手，所述第二电子设备包括所述语音助手。
根据权利要求25所述的方法，其特征在于，所述第二执行指令为用于推荐另一首歌曲的指令。
一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求16至24或25至36任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求16至24或25至36任一项所述的方法。