CN113905123B

CN113905123B - 一种通话方法、装置和电子设备

Info

Publication number: CN113905123B
Application number: CN202010575593.XA
Authority: CN
Inventors: 蔡双林
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2022-09-23
Anticipated expiration: 2040-06-22
Also published as: CN113905123A

Abstract

本申请实施例提供一种通话方法、装置、系统和电子设备。方法包括：当存在呼叫被呼叫设备的通话时，使用设备组网中的一台或多台设备输出呼叫提示，所述呼叫提示用于提示用户接听或挂断所述通话；使用所述设备组网中的一台或多台设备采集所述用户针对所述呼叫提示的输入操作；使用所述交互主设备或所述被呼叫设备解析所述用户针对所述呼叫提示的输入操作，判断所述用户是否接听所述通话；当所述用户接听所述通话时，使用所述设备组网中的一台或多台设备实现所述通话。根据本申请实施例的方法，可以避免多个设备的麦克风以及喇叭被同时启用时由设备间干扰影响正常通话。

Description

一种通话方法、装置和电子设备

技术领域

本申请涉及智能终端技术领域，特别涉及一种通话方法、装置和电子设备。

背景技术

在现有技术的应用场景中，智能设备越来越普及，在众多应用场景中，往往存在多个智能设备并存的情况。例如，在家庭智能设备应用场景中，用户往往同时拥有智能手机、智能音箱、平板电脑、智慧屏设备等多个智能设备。

一般的，智能设备中通常集成由麦克风以及喇叭以实现音频数据采集以及音频播放，这就使得在多个智能设备并存的应用场景中，存在分属多个不同智能设备的多个麦克风以及多个喇叭被同时启用的情况。而分属多个不同智能设备的多个麦克风以及多个喇叭同时被启用，很容易导致音频数据采集混乱以及音频播放混乱。

具体的，在实际应用场景中，很多智能设备具备通话功能，在通话过程中，用于通话的智能设备需要同时启用麦克风以及喇叭。在通话的过程中，如果其他智能设备也启用了麦克风进行音频数据采集以及启用了喇叭进行音频播放，则很容易干扰到通话的正常进行。

发明内容

针对现有技术中多智能设备应用场景下通话被干扰的问题，本申请提供了一种通话方法、装置和电子设备，本申请还提供一种计算机可读存储介质。

本申请实施例采用下述技术方案：

第一方面，本申请提供一种通话方法，包括：

当存在呼叫被呼叫设备的通话时，使用设备组网中的一台或多台设备输出呼叫提示，其中，所述设备组网由包括所述被呼叫设备的多台设备而组建，所述设备组网中的一台设备被设置为处理智能交互进程的交互主设备，所述呼叫提示用于提示用户接听或挂断所述通话；

使用所述设备组网中的一台或多台设备采集所述用户针对所述呼叫提示的输入操作；

使用所述交互主设备或所述被呼叫设备解析所述用户针对所述呼叫提示的输入操作，判断所述用户是否接听所述通话；

当所述用户接听所述通话时，使用所述设备组网中的一台或多台设备实现所述通话，包括：

使用所述被呼叫设备进行通话进程处理；

启用所述设备组网中的一台或多台设备的麦克风采集所述用户的应答语音；

启用所述设备组网中的一台或多台设备的喇叭播放呼入语音。

在上述第一方面的一种可行的实现方式中，所述呼叫提示包括音频提示，所述使用设备组网中的一台或多台设备输出呼叫提示，包括：

启用所述交互主设备和/或所述被呼叫设备的喇叭播放所述音频提示；

或者，

启用所述设备组网中距离所述用户最近的喇叭播放所述音频提示；

或者，

启用所述设备组网中的多台设备的喇叭同时播放所述音频提示。

在上述第一方面的一种可行的实现方式中，所述呼叫提示包括图像提示，所述使用设备组网中的一台或多台设备输出呼叫提示，包括：

当所述交互主设备包含显示屏时，启用所述交互主设备的显示屏显示所述图像提示；

和/或，

当所述被呼叫设备包含显示屏时，启用所述被呼叫设备的显示屏显示所述图像提示；

和/或，

启用所述设备组网中距离所述用户最近的显示屏显示所述图像提示。

在上述第一方面的一种可行的实现方式中，所述用户针对所述呼叫提示的输入操作包括语音输入，所述使用所述设备组网中的一台设备采集所述用户针对所述呼叫提示的输入操作，包括：

使用所述交互主设备的麦克风采集所述语音输入；

或者，

使用所述设备组网中距离所述用户最近的麦克风采集所述语音输入并将所述语音输入转发到所述主交互设备；

或者，

使用所述设备组网中多台设备的麦克风采集所述语音输入并将所述语音输入转发到所述主交互设备。

在上述第一方面的一种可行的实现方式中，所述使用所述交互主设备或所述被呼叫设备解析所述用户针对所述呼叫提示的输入操作，包括：

使用所述交互主设备解析所述语音输入，判断所述用户是否接听所述通话，将判断结果由所述交互主设备发送到所述被呼叫设备。

在上述第一方面的一种可行的实现方式中，所述用户针对所述呼叫提示的输入操作包括触控输入和/或接听按键输入，所述采集所述用户针对所述呼叫提示的输入操作，包括：

使用所述设备组网中的具备触控输入模块和/或接听按键输入模块的设备采集所述触控输入和/或接听按键输入。

在上述第一方面的一种可行的实现方式中，所述启用所述设备组网中的一台或多台设备的麦克风采集所述用户的应答语音，包括：

启用所述主交互设备的麦克风采集所述用户的应答语音；

或者，

启用所述设备组网中距离所述用户最近的麦克风采集所述用户的应答语音；

或者，

启用所述设备组网中多台设备的麦克风采集所述用户的应答语音。

在上述第一方面的一种可行的实现方式中，所述启用所述设备组网中的一台或多台设备的喇叭播放呼入语音，包括：

启用所述主交互设备的喇叭播放所述呼入语音；

或者，

启用所述设备组网中距离所述用户最近的喇叭播放所述呼入语音；

或者，

启用所述设备组网中多台设备的喇叭同时播放所述呼入语音。

在上述第一方面的一种可行的实现方式中，当所述通话为视频通话时，所述使用所述设备组网中的一台或多台设备实现所述通话，还包括：

当所述主交互设备具备摄像头时，启用所述主交互设备的摄像头采集用于视频通话的视频画面；

或者，

使用所述设备组网中的所有摄像头进行人像检测，启用拍摄范围内包含所述用户的一个或多个摄像头采集用于视频通话的视频画面；

或者，

启用所述设备组网中所述用户指定的摄像头采集用于视频通话的视频画面；

或者，

启用所述设备组网中距离所述用户最近的摄像头采集用于视频通话的视频画面。

在上述第一方面的一种可行的实现方式中，所述使用所述被呼叫设备进行通话进程处理，其中，当存在多台被呼叫设备时，使用所述多台被呼叫设备中的一台设备进行通话进程处理。

在上述第一方面的一种可行的实现方式中，所述启用所述设备组网中的一台或多台设备的麦克风采集所述用户的应答语音，包括，根据所述用户的设备选定操作和/或所述用户的通话位置变化切换启用不同设备的麦克风采集所述应答语音。

在上述第一方面的一种可行的实现方式中，所述启用所述设备组网中的一台或多台设备的喇叭播放呼入语音，包括，根据所述用户的设备选定操作和/或所述用户的通话位置变化切换启用不同设备的喇叭播放所述呼入语音。

第二方面，本申请一实施例提供一种通话控制装置，包括：

呼叫提示输出模块，其用于当存在呼叫被呼叫设备的通话时，输出相应指令，使得设备组网中的一台或多台设备输出呼叫提示，其中，所述设备组网由包括所述被呼叫设备的多台设备而组建，所述设备组网中的一台设备被设置为处理智能交互进程的交互主设备，所述呼叫提示用于提示用户接听或挂断所述通话；

输入操作采集模块，其用于输出相应指令，使得所述设备组网中的一台或多台设备采集所述用户针对所述呼叫提示的输入操作；

输入操作解析模块，其用于输出相应指令，使得所述交互主设备或所述被呼叫设备解析所述用户针对所述呼叫提示的输入操作，判断所述用户是否接听所述通话；

通话模块，其用于当所述用户接听所述通话时，基于所述设备组网中的一台或多台设备实现所述通话，包括：

使用所述被呼叫设备进行通话进程处理；

第三方面，本申请一实施例提供一种通话系统，所述系统包括由多台设备而组建的设备组网，所述设备组网中的一台设备被设置为处理智能交互进程的交互主设备，所述系统执行下述步骤以实现通话：

当存在呼叫被呼叫设备的通话时，使用所述设备组网中的一台或多台设备输出呼叫提示，其中，所述被呼叫设备为所述设备组网中的设备，所述呼叫提示用于提示用户接听或挂断所述通话；

使用所述被呼叫设备进行通话进程处理；

第四方面，本申请提供了一种电子设备，所述电子设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发所述电子设备执行如本申请实施例所述的方法步骤。

第五方面，本申请提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行本申请实施例的方法。

根据本申请实施例所提出的上述技术方案，至少可以实现下述技术效果：根据本申请实施例的方法，可以在多设备应用场景下实现通话，避免多个设备的麦克风以及喇叭被同时启用时由于不同设备分别进行音频数据采集以及音频输出而导致的设备间干扰影响正常通话。

附图说明

图1所示为根据本申请一实施例的通话方法流程图；

图2为根据本申请一实施例的应用场景的示意图；

图3为根据本申请一实施例的应用场景的示意图；

图4为根据本申请一实施例的方法执行时序图；

图5为根据本申请一实施例的方法执行部分时序图；

图6所示为根据本申请一实施例的装置示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释，而非旨在限定本申请。

针对现有技术中多智能设备应用场景下通话被干扰的问题，本申请提供了一种通话方法，为了提出本申请实施例的方法，发明人首先分析在多智能设备应用场景下进行通话的场景细节。

在实际应用场景中，多智能设备应用场景下通话被干扰的主要原因是通话设备的音频数据采集以及音频播放被其他设备所干扰。

例如，在通话确认阶段，呼叫方呼叫被呼叫设备，被呼叫设备需要输出呼叫提示(例如，通话铃音)提醒用户接听或挂断通话。当被呼叫设备启用喇叭播放铃音时，如果其他设备也同时启用喇叭播放音频(例如，播放音乐)，那么，铃音很容易被其他设备所播放的音频所掩盖，从而影响用户接听通话。

又例如，在通话实现阶段，被呼叫设备启用喇叭播放呼叫方的呼入语音。如果其他设备也同时启用喇叭播放音频，例如，播放音乐；那么，呼入语音很容易被其他设备所播放的音乐所掩盖，从而影响用户通话。或者，如果其他设备也同时启用麦克风采集音频数据，例如，启用智能语音交互，那么，呼入语音就可能被识别为智能语音交互的操控指令，从而导致误触发智能语音交互，进而干扰用户通话。

因此，为了避免不同设备的音频数据采集以及音频播放互相间发生干扰，在本申请一实施例中，将处于同一应用场景中的多个设备虚拟为“一台”设备，从而对应用场景中各个设备的运行进程进行统一安排，以及，对应用场景中的所有麦克风以及喇叭进行统一控制。

具体的，在本申请一实施例中，多台设备基于设备间的分布式通信组成设备组网，设备组网中的一台设备被设置为处理智能交互进程的交互主设备，从而实现将多台设备虚拟为“一台”设备。这样，在通话呼叫设备组网中的一台设备时，就相当于通话呼叫由设备组网所虚拟的这“一台设备”，设备组网可以根据通话需求统一控制设备组网中所有设备的麦克风以及喇叭，从而避免不同设备间的麦克风音频数据采集以及喇叭音频输出互相干扰而影响正常通话。

进一步的，在实际应用场景中，多台设备组网时，这些设备之间喇叭的发声规则以及语音的交互规则发生了变化，在整体上用户将组成立体声网络的所有设备看成一个虚拟设备，组成网络的智能设备的喇叭需要协同发声，对应的智能设备协同与用户交互。这些规则发生变化后，在这些设备上的音视频通话的呼叫交互也发生了变化。当用户呼叫这个虚拟网组网中的智能设备时，需要这个虚拟的网络中的设备协同完成呼叫，不然，会影响用户体验。然而，设备组网中的主交互设备并不一定为被呼叫设备。在主交互设备不为被呼叫设备时，在实现通话的过程中，如果依然使用主交互设备处理所有交互进程，那么就需要将通话进程迁移到主交互设备上执行，这势必会增加大量数据处理操作。因此，在本申请一实施例中，在实现通话的过程中，依然使用被呼叫设备处理通话进程。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1所示为根据本申请一实施例的通话方法流程图。在本申请一实施例中，如图1所示，在通话方法的实现过程中执行下述步骤：

步骤100，监控是否存在呼叫被呼叫设备的通话，其中，被呼叫设备为由多台设备所组建的设备组网中的设备，即，设备组网由包括被呼叫设备的多台设备而组建，并且，设备组网中的一台设备被设置为处理智能交互进程的交互主设备；

当不存在呼叫被呼叫设备的通话时，返回步骤100；

当存在呼叫被呼叫设备的通话时，执行步骤110；

步骤110，使用设备组网中的一台或多台设备输出呼叫提示，其中，呼叫提示用于提示用户接听或挂断通话；

步骤120，使用设备组网中的一台或多台设备采集用户针对呼叫提示的输入操作；

步骤121，使用交互主设备或被呼叫设备解析用户针对呼叫提示的输入操作；

步骤122，判断用户是否接听通话；

当判断用户不接听通话时，执行步骤140，挂断通话；

当用户接听通话时，执行步骤130；

步骤130，使用设备组网中的一台或多台设备实现通话，包括：

步骤131，使用被呼叫设备进行通话进程处理；

步骤132，启用设备组网中的一台或多台设备的麦克风采集用户的应答语音；

步骤133，启用设备组网中的一台或多台设备的喇叭播放呼入语音。

这里需要说明的是，在本申请实施例中，主交互设备可以是被呼叫设备，主交互设备也可以不是被呼叫设备。

根据本申请实施例的方法，可以在多设备应用场景下实现通话，避免多个设备的麦克风以及喇叭被同时启用时由于不同设备分别进行音频数据采集以及音频输出而导致的设备间干扰影响正常通话。

进一步的，在本申请一实施例中，设备组网中的各个设备之间通过分布式通信协议同步设备之间的状态，实现跨设备之间的控制指令转发，实现跨设备间的音视频流的转发，以实现跨设备间的通话控制和接听。

具体的，在本申请一实施例中，设备组网中的一台设备被设置为处理智能交互进程的交互主设备，其他设备是从设备。设备组网中的多台设备的喇叭需要协同出声规则，分成前后左右声道等，对应的设备之间的智能语音交互能力也会协同。例如，只允许设备组网中的一台或者某几台设备支持智能语音交互的输入采集(麦克风拾音功能开启，可接收用户语音指令)，其他智能设备的麦克风功能关闭。

在实际应用场景中，图1所示实施例的各个步骤可以具备多种不同的具体实现方式。

在本申请一实施例中，步骤110中输出的呼叫提示包括音频提示，例如，呼叫提示铃音。

在步骤110的一种实现方式中，启用设备组网中的多台设备的喇叭同时播放音频提示。例如，启用设备组网中的多台设备的喇叭构成立体声组网，利用立体声方式播放音频提示。

进一步的，考虑到大部分应用场景中的音频提示并不复杂，立体声模式播放音频提示并不会带来更加的用户体验，因此，在步骤110的一种实现方式中，启用被呼叫设备的喇叭播放音频提示，或者，启用交互主设备的喇叭播放音频提示，或者，启用交互主设备以及被呼叫设备的喇叭播放音频提示。

进一步的，在一应用场景中，为便于用户根据自身需求选择提示方式，设备组网中的各个设备被设置有呼叫提示开关(可以是物理按键开关，也可以是软件设置开关)，在步骤110的一种实现方式中，为达到最佳的提示效果，启用设备组网中呼叫提示开关被打开的设备的喇叭播放音频提示。

在本申请一实施例中，步骤110中输出的呼叫提示包括图像提示，例如，呼叫方头像图像。因此，在步骤110的一种实现方式中，启用设备组网中一台或多台设备的显示屏显示图像提示。

具体的，在步骤110的一种实现方式中，当交互主设备包含显示屏时，启用交互主设备的显示屏显示图像提示。在步骤110的一种实现方式中，当被呼叫设备包含显示屏时，启用被呼叫设备的显示屏显示图像提示。

考虑到不同于声音，用户在同一时刻通常只会关注一台设备所显示的图像，因此，在步骤110的一种实现方式中，启用设备组网中的一个显示屏显示图像提示。

在本申请一实施例中，步骤120中所采集的用户针对呼叫提示的输入操作包括语音输入，在步骤120的一种实施方式中，使用设备组网中的一台设备采集用户针对呼叫提示的语音输入。

具体的，在步骤120的一种实现方式中，使用交互主设备的麦克风采集用户针对呼叫提示的语音输入。

这里需要说明的是，在本申请实施例中，距离用户最近的麦克风可以是主交互设备的麦克风，也可以是被呼叫设备的麦克风，还可以是除主交互设备以及被呼叫设备以外的其他设备的麦克风。

进一步的，在步骤120的一种实现方式中，使用设备组网中的多台设备的麦克风采集用户针对呼叫提示的语音输入并将语音输入转发到主交互设备。具体的，将多台设备的麦克风采集到的语音输入转发到主交互设备做合并处理。这样可以增加针对语音输入的采集能力和采集范围。

进一步的，在步骤121的一种实现方式中，使用交互主设备解析用户针对呼叫提示的语音输入，判断用户是否接听通话，将判断结果由交互主设备发送到被呼叫设备。

在本申请一实施例中，步骤120中所采集的用户针对呼叫提示的输入操作包括触控输入和/或接听按键输入，在步骤120的一种实施方式中，使用设备组网中的一台设备采集用户针对呼叫提示的触控输入和/或接听按键输入。

具体的，在步骤120的一种实现方式中，使用设备组网中的具备触控输入模块和/或接听按键输入模块的设备采集触控输入和/或接听按键输入。

这里需要说明的是，在本申请实施例中，具备触控输入模块和/或接听按键输入模块的设备可以是主交互设备，也可以是被呼叫设备，还可以是除主交互设备以及被呼叫设备以外的其他设备。

进一步的，在步骤121的一种实现方式中，使用采集触控输入和/或接听按键输入的设备解析用户针对呼叫提示的触控输入和/或接听按键输入，判断用户是否接听通话，将判断结果发送到被呼叫设备。

进一步的，在本申请一实施例中，被呼叫设备可以为一台设备。例如，拨打一个电话号码，当该电话号码的手机在设备组网中时，通话呼叫的被呼叫设备即为设备组网中的手机。又例如，当呼叫某一用户时，主叫方可以查阅该用户使用的所有设备，从而选中其中一台设备进行呼叫。

例如，在一应用场景中，用户A所拥有的具备通话能力的设备在用户B的手机等智能设备上按照品类展现，用户B可以看到用户A所拥有的具备通话能力的设备类型(例如，智能手机、智慧屏)，用户B可以选择呼叫用户A某一类设备(例如，根据不同品类设备是支持语音还是视频通话，选择不同品类的设备)。

进一步的，在本申请一实施例中，被呼叫设备可以为多台设备。例如，呼叫用户的账号，当该用户账号在设备组网中的多台具备通话能力的设备上登录时，通话呼叫的被呼叫设备即为该多台设备。

在步骤110的一种实现方式中，可以使用多台被呼叫设备同时输出呼叫提示，也可以使用多台被呼叫设备中的一台或某几台输出呼叫提示。

例如，在一应用场景中，用户管理同品类的设备之间的呼叫提示同步输出。例如，用户可以设置两台智慧屏之间同振，或者两台智能音箱设备之间同振。

在步骤131的一种实现方式中，当存在多台被呼叫设备时，使用多台被呼叫设备中的一台设备进行通话进程处理。

具体的，在步骤131的一种实现方式中，当存在多台被呼叫设备时，根据用户的接听操作所选定的设备，使用该设备进行通话进程处理。例如，在一应用场景中，设备组网中的手机以及平板电脑均登陆了用户的聊天账号，当针对用户的聊天账号发起通话时，用户选定手机接听，则使用手机进行通话进程处理。

具体的，在步骤131的一种实现方式中，当存在多台被呼叫设备时，根据预设的处理优先级选用被呼叫设备中处理优先级最高的一台设备进行通话进程处理。例如，在一应用场景中，设备组网中的手机以及台式电脑均登陆了用户的聊天账号，由于台式电脑处理性能优于手机，因此预设台式电脑的处理优先级高于手机。当针对用户的聊天账号发起通话时，用户选择接听，但并未选定使用哪一台设备接听，则使用台式电脑进行通话进程处理。

进一步的，在步骤132的一种实现方式中，启用设备组网中多台设备的麦克风采集用户的应答语音。具体的，将多台设备的麦克风采集到的语音输入转发到被呼叫设备做合并处理。这样可以增加针对应答语音的采集能力和采集范围。

进一步的，在实际应用场景中，为避免音频数据采集错误，设备组网中通常设置仅仅主交互设备的麦克风处于开启状态。因此，在本申请一实施例中，在步骤132的一种实现方式中，启用主交互设备的麦克风采集用户的应答语音。

进一步的，在步骤132的一种实现方式中，启用设备组网中多台设备的麦克风采集用户的应答语音，对多台设备的麦克分所采集到的应答语音进行综合计算，从而实现对应答语音的降噪处理。

进一步的，在步骤132的一种实现方式中，根据用户的设备选定操作和/或用户的通话位置变化切换启用不同设备的麦克风采集应答语音。

在步骤133的一种实现方式中，启用设备组网中多台设备的喇叭同时播放呼入语音.例如，启用设备组网中的多台设备的喇叭构成立体声组网，利用立体声方式播放呼入语音。

进一步的，考虑到大部分应用场景中的呼入语音并不适合立体声模式播放，因此，在步骤133的一种实现方式中，启用被呼叫设备的喇叭播放呼入语音，或者，启用交互主设备的喇叭播放呼入语音，或者，启用交互主设备以及被呼叫设备的喇叭播放呼入语音。

进一步的，在一应用场景中，为便于用户根据自身需求选择呼入语音播放方式，设备组网中的各个设备被设置有呼入语音播放开关(可以是物理按键开关，也可以是软件设置开关)，在步骤133的一种实现方式中，启用设备组网中呼入语音播放开关被打开的设备的喇叭播放呼入语音。

图2为根据本申请一实施例的应用场景的示意图。假设在家中用户A拥有如图2所示的智慧屏201、智能音箱202以及智能音箱203。如图2所示，智慧屏201、智能音箱202以及智能音箱203组成一个设备组网(立体声网络)，该设备组网中的设备组成一个整体的虚拟立体声“设备”。在智能语音交互以及立体声播放模式下，智慧屏201和智能音箱203的麦克风关闭，关闭智慧屏201和智能音箱203的AI语音交互能力，只保留智能音箱202的AI语音交互能力；智慧屏201的摄像头功能正常工作，支持视频通话；智慧屏201、智能音箱202以及智能音箱203的喇叭均正常工作，协同进行立体声播放。

假设智慧屏201、智能音箱202以及智能音箱203都支持通话呼叫，呼入方可能会给智慧屏201拨打视频通话，也有可能会给智能音箱202或智能音箱203拨打语音通话。例如，当呼入方给智慧屏201拨打视频通话时，智慧屏201处理通话进程，智慧屏201以及智能音箱203的喇叭由启用转为关闭，智能音箱202播放通话铃声，用户通过向智能音箱202输入语音指令来接听通话，通话接听指令由智能音箱202发送到智慧屏201。

在通话过程中智慧屏201启用摄像头以及显示屏进行视频通话的图像采集以及图像显示，智能音箱202通过自身的麦克风采集用户的应答语音并将应答语音转发给智慧屏201；智慧屏201将呼入方的呼入语音转发给智能音箱202，由智能音箱202的喇叭播放呼入语音。

图3为根据本申请一实施例的应用场景的示意图。假设在家中用户A拥有如图3所示的智慧屏304、智慧屏301、智能音箱302以及智能音箱303。如图3所示，智慧屏304、智慧屏301、智能音箱302以及智能音箱303构成设备组网，设备组网的多个设备之间通过分布式通信协议同步设备之间的状态，实现跨设备之间的控制指令转发，实现跨设备间的音视频流的转发，以实现跨设备间的通话控制和接听。

在一应用场景中，图3所示的设备组网中智能音箱302被设定为主交互设备，智能音箱302的麦克风被启用以进行智能语音交互，智慧屏304、智慧屏301以及智能音箱303的麦克风被关闭。用户A可以按照品类设置响铃的设备，例如，如设置智能音箱303响铃，智能音箱302不响铃。

当智能音箱303被呼叫时，智能音箱303响铃。由于智能音箱303的麦克风被关闭，因此使用智能音箱302的麦克风采集用户语音。智能音箱302将用户下发的接听或者挂断等语音指令识别成接通或挂断的控制指令，通过分布式通信，转发给智能音箱303，完成通话的接通或挂断。

在接通通话后，使用智能音箱302的麦克风采集用户的应答语音，继续利用分布式通信的能力，将应答语音转发给智能音箱303。并且，使用智能音箱302的喇叭播放用户B的呼入语音。但是通话的通话进程处理(例如，通信能力)仍保留在智能音箱303。

或者，在一应用场景中，在接通通话后，开启智能音箱303被关闭的麦克风，用户利用智能音箱303上的麦克风和喇叭完成通话的交互。

图4为根据本申请一实施例的方法执行时序图。在根据图3所示的一应用场景中，智能音箱302为设备组网的交互主设备。如图4所示：

用户B通过智能手机给用户A的智能音箱303拨打语音通话(步骤410，用户B的智能手机呼叫用户A的智能音箱303)；

用户A的智能音箱303开始振铃(步骤411，智能音箱303振铃)，智能音箱302未设置畅连通话响铃，因此不振铃；

在智能音箱303振铃后，用户A下发接听的语音指令(步骤420，用户下发语音指令“接听电话”)；

智能音箱302采集到用户A下发的语音指令“接听电话”，将用户A下发的语音指令转化为接听通话的控制指令(步骤421，将语音指令转化为通话的控制指令)；

智能音箱302将接听通话的控制指令转发到智能音箱303(步骤422，转发控制指令)；

智能音箱303接收到接听通话的控制指令后，接听通话，智能音箱303进行通话进程的处理，并且使用自身的麦克风以及喇叭实现通话(步骤430，接听通话，开启麦克风)。

具体的：

步骤431，用户A发出通话语音；

步骤432，智能音箱303基于自身的麦克风采集到用户A的通话语音后，将用户A的通话语音发送到用户B的智能手机；

步骤432，用户B的智能手机基于自身的麦克风采集到用户B的通话语音后，将用户B的通话语音发送到智能音箱303；

步骤433，智能音箱303使用自身的喇叭播放用户B的通话语音。

进一步的，在步骤411中，如果是两台智能音箱都开启了通话响铃，则来电时两台音箱同时振铃，用户A通过智能音箱302(主音箱)语音控制挂断时，在挂断来电后，智能音箱302通过分布式通信，通知智能音箱303(从音箱)自动停止振铃，挂断来电。

进一步的，在步骤420中，用户A也可以在智能音箱302上通过按键(控制接听/挂断通话的按键)，控制智能音箱303接听或挂断来电。

或者，在另一应用场景中，用户A通过智能音箱302控制智能音箱303接听通话后，在通话过程中：

开启智能音箱302的麦克风以采集用户A的通话语音；

智能音箱302将采集到的用户A的通话语音转发到智能音箱303，智能音箱303将用户A的通话语音发送到用户B的智能手机；

用户B的智能手机基于自身的麦克风采集到用户B的通话语音后，将用户B的通话语音发送到智能音箱303，智能音箱303使用自身的喇叭播放用户B的通话语音。

开启智能音箱303的麦克风以采集用户A的通话语音，智能音箱303将用户A的通话语音发送到用户B的智能手机；

用户B的智能手机基于自身的麦克风采集到用户B的通话语音后，将用户B的通话语音发送到智能音箱303；

智能音箱303将用户B的通话语音转发到智能音箱302，开启智能音箱302的喇叭播放用户B的通话语音。

开启智能音箱302的麦克风以采集用户A的通话语音；

进一步的，在本申请一实施例中，在进行数据采集和/或数据输出时采用就近原则。即，启用离用户最近的麦克风采集语音、和/或启用离用户最近的喇叭播放语音、和/或启用离用户最近的显示屏显示图像。

具体的，在步骤110的一种实现方式中，启用设备组网中距离用户最近的喇叭播放音频提示。这里需要说明的是，在本申请实施例中，距离用户最近的喇叭可以是主交互设备的喇叭，也可以是被呼叫设备的喇叭，还可以是除主交互设备以及被呼叫设备以外的其他设备的喇叭。

具体的，在步骤110的一种实现方式中，启用设备组网中距离用户最近的显示屏显示图像提示。进一步的，在步骤110的一种实现方式中，也可以选用交互主设备显示屏、被呼叫设备的显示屏以及距离用户最近的显示屏中任意两类显示屏或者全部显示屏进行图像提示显示。这里需要说明的是，在本申请实施例中，距离用户最近的显示屏可以是主交互设备的显示屏，也可以是被呼叫设备的显示屏，还可以是除主交互设备以及被呼叫设备以外的其他设备的显示屏。

具体的，在步骤120的一种实现方式中，使用设备组网中距离用户最近的麦克风采集用户针对呼叫提示的语音输入并将采集到的语音输入转发到主交互设备。具体的，在步骤133的一种实现方式中，根据用户的设备选定操作和/或用户的通话位置变化切换启用不同设备的喇叭播放呼入语音和/或麦克风采集用户的应答语音。具体的，在步骤133的一种实现方式中，为达到最佳的呼入语音播放效果，启用设备组网中距离用户最近的喇叭播放呼入语音。具体的，为确保采集到清晰的应答语音，在步骤132的一种实现方式中，启用设备组网中距离用户最近的麦克风采集用户的应答语音。

例如，在根据图3所示的一应用场景中，用户B呼叫到智能音箱303上时，当用户A离智能音箱302较近时，用户A可以就近与智能音箱302交互，给智能音箱302下发接听/挂断通话等指令，智能音箱302将用户的语音指令转换成最终通话模块可识别的接通/挂断的通话指令，转发给智能音箱303，智能音箱303完成对通话的接听/挂断的控制。在接通通话后的过程中，智能设备可以采取就近原则，利用离用户最近的智能音箱或者智慧屏采集用户A的语音，通过分布式通信能力发送至智能音箱303，智能音箱303通过通话模块发送至通话的对端用户B。智能设备之间也可以利用分布式通信能力完成判断，当用户离智能音箱302较近时，可以将智能音箱303上的通话转移到智能音箱302上，用户在智能音箱302上完成通话，即根据判断用户和各个智能设备之间的距离，将通话自动转移到对应的离用户最近的设备上。

例如，在根据图3所示的一应用场景中，用户在呼叫智能音箱303时，智能音箱303振铃，用户此时离智能音箱302较近，在智能音箱302上通过语音控制接听来电，智能音箱302将接听的语音指令转发给智能音箱303，控制智能音箱303接听来电，智能音箱303和用户B的手机之间建立通话连接。

在通话接通后，当用户靠近智能音箱302时，通过智能音箱302的麦克风采集用户语音，并通过分布式通信能力将语音转发给智能音箱303，由智能音箱303发送给用户B的智能手机；同时智能音箱303收到用户B的语音后，转发给智能音箱302播放。

相应的，当用户离智能音箱302较远，离智能音箱303较近时，自动切换到使用智能音箱303上的声音播放和语音采集能力，声随人动，让用户获得较好的体验。

例如，在根据图3所示的一应用场景中，当用户离智能音箱302较近时，可以将智能音箱303上的通话连接直接转移到智能音箱302上，由智能音箱302和用户B的手机建立通话连接，用户A在智能音箱302上和用户B通话；当用户离智慧屏304较近时，智能音箱302自动将通话转移到智慧屏304上，由智慧屏304和用户B的手机建立通话连接，用户A在智慧屏304上和用户B通话。即根据判断用户和各个智能设备之间的距离，将通话自动转移到对应的离用户最近的设备上。

图5为根据本申请一实施例的方法执行部分时序图。在根据图3所示的一应用场景中，智能音箱302为设备组网的交互主设备。用户B通过智能手机呼叫用户A的智能音箱303。智能音箱303接收到接听通话的控制指令后，接听通话，智能音箱303进行通话进程的处理以实现通话的过程如图5所示：

步骤510，用户A发出第一通话语音，由于此时智能音箱302距离用户A最近，因此，智能音箱302开启自身的麦克风采集用户A发出的第一通话语音；

步骤511，智能音箱302基于自身的麦克风采集到用户A的第一通话语音后，将用户A的第一通话语音转发到智能音箱303；

步骤512，智能音箱303将用户A的第一通话语音转发到用户B的智能手机；

步骤513，用户B的智能手机向用户B播放用户A的第一通话语音；

步骤520，用户B的智能手机基于自身的麦克风采集到用户B的第二通话语音后，将用户B的第二通话语音发送到智能音箱303；

步骤521，由于此时智能音箱302距离用户A最近，因此，智能音箱303将用户B的第二通话语音转发到智能音箱302；

步骤522，智能音箱302使用自身的喇叭播放用户B的第二通话语音；

步骤530，用户A发出第三通话语音，由于此时智慧屏301距离用户A最近，因此，智慧屏301开启自身的麦克风采集用户A发出的第三通话语音；

步骤531，智慧屏301基于自身的麦克风采集到用户A的第三通话语音后，将用户A的第三通话语音转发到智能音箱303；

步骤532，智能音箱303将用户A的第三通话语音转发到用户B的智能手机；

步骤533，用户B的智能手机向用户B播放用户A的第三通话语音；

步骤540，用户B的智能手机基于自身的麦克风采集到用户B的第四通话语音后，将用户B的第四通话语音发送到智能音箱303；

步骤541，由于此时智慧屏301距离用户A最近，因此，智能音箱303将用户B的第四通话语音转发到智慧屏301；

步骤542，智慧屏301使用自身的喇叭播放用户B的第四通话语音。

进一步的，在本申请一实施例中，当通话为视频通话时，在实现通话的过程中还需要启用摄像头采集用户的视频通话图像并启用显示屏显示呼入方的视频通话图像。

具体的，在步骤130的一种实现方式中，步骤130还包括图像采集以及图像显示步骤。

具体的，在步骤130的一种实现方式中，在图像显示步骤中，当主交互设备具备摄像头时，启用主交互设备的摄像头采集用于视频通话的视频画面。

具体的，在步骤130的一种实现方式中，在图像采集步骤中，使用设备组网中的所有摄像头进行人像检测，启用拍摄范围内包含用户的一个或多个摄像头采集用于视频通话的视频画面。例如，启用拍摄范围内包含用户正面图像的一个摄像头采集用于视频通话的视频画面。又例如，启用拍摄范围内包含用户的多个摄像头同时采集用于视频通话的视频画面。利用多设备的摄像头，同时在不同的角度采集用户的视频通话的画面，从而形成立体和三维的画面。

具体的，在步骤130的一种实现方式中，在图像采集步骤中，启用设备组网中用户指定的摄像头采集用于视频通话的视频画面；

具体的，在步骤130的一种实现方式中，在图像采集步骤中，启用设备组网中距离用户最近的摄像头采集用于视频通话的视频画面。

具体的，在步骤130的一种实现方式中，在图像显示步骤中，当交互主设备包含显示屏时，启用交互主设备的显示屏显示图像提示。

具体的，在步骤130的一种实现方式中，在图像显示步骤中，当被呼叫设备包含显示屏时，启用被呼叫设备的显示屏显示图像提示。

具体的，在步骤130的一种实现方式中，在图像显示步骤中，启用设备组网中距离用户最近的显示屏显示图像提示。

进一步的，在步骤130的一种实现方式中，在图像显示步骤中，也可以选用交互主设备显示屏、被呼叫设备的显示屏以及距离用户最近的显示屏中任意两类显示屏或者全部显示屏进行图像提示显示。

例如，在根据图3所示的一应用场景中，在用户B给用户A的智慧屏304拨打视频通话的场景中，智慧屏304的AI语音交互能力(麦克风)被关闭，用户A此时可通过智能音箱302的AI语音交互能力，下发接听/挂断的语音指令。智能音箱302将接听/挂断的语音指令转发给智慧屏304，控制接听/挂断通话。在接通通话后，可以将智慧屏304上的麦克风自动开启，用户A利用智慧屏304上的麦克风和喇叭完成和用户B的视频通话；同时，也可利用智能音箱302上的麦克风采集用户A的语音，并将语音通过分布式通信协议转发给智慧屏304，同时利用智能音箱302上的喇叭播放用户B通话的语音，智慧屏304将用户B通话的语音通过分布式通信协议转发给智能音箱302播放，但是，视频显示和视频摄像仍保留在智慧屏304上，智能音箱302没有视频采集和显示能力。

例如，在根据图3所示的一应用场景中，用户B在呼叫用户A智慧屏301时，用户A离智慧屏301较近时，可通过智慧屏201的智慧语音能力控制智慧屏301接听来电；同时，用户离智能音箱302或者智能音箱303较近时，通过智能音箱302或者智能音箱303上的智慧语音能力下发语音指令控制智慧屏301接听来电。用户离智能音箱较近时，智慧屏将通话的声音通过分布式通信协议转发到智能音箱上播放，同时本地语音的采集也通过智能音箱上的麦克风采集后，通过分布式协议转发给智慧屏，发送给用户B；但是，视频通话的视频部分仍保留在智慧屏上，智能音箱没有视频显示的能力。

相应的，当用户A离智能音箱302较近时，也可以将智能音箱302呼入到当前的通话中，建立通话会议群组，智能音箱302上麦克风和喇叭负责采集用户A的声音和播放用户B的语音，智慧屏上的麦克风和喇叭关闭。

进一步的，在一应用场景中，在通话功能的呈现上，可以采取对家庭设备全部收纳，即如图3所示的用户A的多个智能音箱和智慧屏设备在用户B的手机上按照家庭设备的品类呈现，用户B只需要选择是给用户A的设备是拨打音频通话，还是视频通话。

进一步的，在一应用场景中，用户A可以设置设备组网中智能设备之间的振铃关系。如图3所示，用户可以设置智能音箱303和智慧屏301和智慧屏304同时振铃，则用户B对用户A发起语音呼叫时，用户A的智能音箱303和智慧屏301和智慧屏304同时振铃。此时，如果用户离智能音箱302最近，可以通过智能音箱302控制接听来电，在接听来电后，通话可以转移到智能音箱302上，用户通过智能音箱202和用户B的手机建立通话连接，进行通话；同时，也可以通过智能音箱302控制智能音箱302接听通话，智慧屏自动停止振铃，通过分布式通信能力，将智能音箱302上的语音转发到智能音箱303，智能音箱303将用户B的语音转发到智能音箱202播放。进一步的，如果用户B对用户A发起视频呼叫，则只有智慧屏301和智慧屏304响铃，但是用户可以通过智能音箱或者智慧屏控制接听/挂断来电，在接听来电后，沿用前述方案，可以利用音箱的拾音和喇叭放音能力，就近给采集用户语音或者播放通话声音，智慧屏上显示视频；或者完全由智慧屏完成视频通话，语音采集和播放。

进一步的，在一应用场景中，用户将多台智能设备组建成立体声网络，对外呈现一个立体声网络设备。组建成立体声网络后，网络内的设备统一出声规则。

例如，如图3所示，智能音箱303和智慧屏301和智慧屏304关闭麦克风，只有智能音箱302可以开启麦克风远场拾音，支持和用户的AI语音交互。或者其他场景，如用户手动将智能音箱303和智慧屏301和智慧屏304的麦克风关闭等，均适用于该场景。

当用户B给用户A的智慧屏304拨打视频电话时，智慧屏响铃，用户通过智能音箱302下发语音指令控制接听/挂断电话，或者通过智能音箱302上的按键下发接听/挂断的指令，智能音箱302将控制指令转发至智慧屏304，智慧屏304接通通话。

在接通通话后：

1)开启智慧屏304的麦克风，用户通过智慧屏304的麦克风拾音，和用户B进行通话；

2)当然，用户A在离智能音箱302较近时，也可以通过分布式通信的方式，通过智能音箱302的麦克风采集用户语音转发至智慧屏304，智慧屏304接收的对方语音转发至智能音箱302播放。

3)用户A在离智能音箱302较近时，通过分布式通信协商，让智能音箱302接入到智慧屏304和用户B手机的通话群组，智能音箱202以语音通话接入，用户A可以通过智能音箱302的麦克风和喇叭与用户B完成语音通话，对应的智慧屏304上的视频通话部分保留，但是智慧屏304上自动静音，即关闭麦克风拾音和喇叭放音。由此，实现声随人动，利用离用户最近的设备给用户提供语音服务。

可以理解的是，上述实施例中的部分或全部步骤骤或操作仅是示例，本申请实施例还可以执行其它操作或者各种操作的变形。此外，各个步骤可以按照上述实施例呈现的不同的顺序来执行，并且有可能并非要执行上述实施例中的全部操作。

进一步的，基于本申请一实施例中提出的通话方法，本申请一实施例还提出了一种通话控制装置。

图6所示为根据本申请一实施例的装置示意图。如图6所示，在本申请一实施例中，通话控制装置600包括：

呼叫提示输出模块610，其用于当存在呼叫被呼叫设备的通话时，输出相应指令，使得设备组网中的一台或多台设备输出呼叫提示，其中，设备组网由包括被呼叫设备的多台设备而组建，设备组网中的一台设备被设置为处理智能交互进程的交互主设备，呼叫提示用于提示用户接听或挂断通话；

输入操作采集模块620，其用于输出相应指令，使得设备组网中的一台或多台设备采集用户针对呼叫提示的输入操作；

输入操作解析模块630，其用于输出相应指令，使得交互主设备或被呼叫设备解析用户针对呼叫提示的输入操作，判断用户是否接听通话；

通话模块640，其用于当用户接听通话时，基于设备组网中的一台或多台设备实现通话，包括：

使用被呼叫设备进行通话进程处理；

启用设备组网中的一台或多台设备的麦克风采集用户的应答语音；

启用设备组网中的一台或多台设备的喇叭播放呼入语音。

进一步的，基于本申请一实施例中提出的通话方法，本申请一实施例还提出了一种通话系统。通话系统包括由多台设备而组建的设备组网，设备组网中的一台设备被设置为处理智能交互进程的交互主设备，系统执行下述步骤以实现通话：

当存在呼叫被呼叫设备的通话时，使用设备组网中的一台或多台设备输出呼叫提示，其中，被呼叫设备为设备组网中的设备，呼叫提示用于提示用户接听或挂断通话；

使用设备组网中的一台设备采集用户针对呼叫提示的输入操作；

使用交互主设备或被呼叫设备解析用户针对呼叫提示的输入操作，判断用户是否接听通话；

当用户接听通话时，使用设备组网中的一台或多台设备实现通话，包括：

使用被呼叫设备进行通话进程处理；

启用设备组网中的一台或多台设备的喇叭播放呼入语音。

进一步的，在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(FieldProgrammable Gate Array，FPGA))就是这样一种集成电路，其逻辑功能由访问方对器件编程来确定。由设计人员自行编程来把一个数字装置“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera HardwareDescription Language)、Confluence、CUPL(Cornell University ProgrammingLanguage)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等，目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

在本申请实施例的描述中，为了描述的方便，描述装置时以功能分为各种模块/单元分别描述，各个模块/单元的划分仅仅是一种逻辑功能的划分，在实施本申请实施例时可以把各模块/单元的功能在同一个或多个软件和/或硬件中实现。

具体的，本申请实施例所提出的装置在实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块以软件通过处理元件调用的形式实现，部分模块通过硬件的形式实现。例如，检测模块可以为单独设立的处理元件，也可以集成在电子设备的某一个芯片中实现。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，ASIC)，或，一个或多个数字信号处理器(Digital Singnal Processor，DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，FPGA)等。再如，这些模块可以集成在一起，以片上装置(System-On-a-Chip，SOC)的形式实现。

本领域普通技术人员可以意识到，本申请实施例中描述的各单元及算法步骤，能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置、模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本申请一实施例还提出了一种电子设备，电子设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发电子设备执行如本申请实施例所述的方法步骤。

具体的，在本申请一实施例中，上述一个或多个计算机程序被存储在上述存储器中，上述一个或多个计算机程序包括指令，当上述指令被上述设备执行时，使得上述设备执行本申请实施例所述的方法步骤。

具体的，在本申请一实施例中，电子设备的处理器可以是片上装置SOC，该处理器中可以包括中央处理器(Central Processing Unit，CPU)，还可以进一步包括其他类型的处理器。具体的，在本申请一实施例中，电子设备的处理器可以是PWM控制芯片。

具体的，在本申请一实施例中，涉及的处理器可以例如包括CPU、DSP、微控制器或数字信号处理器，还可包括GPU、嵌入式神经网络处理器(Neural-network Process Units，NPU)和图像信号处理器(Image Signal Processing，ISP)，该处理器还可包括必要的硬件加速器或逻辑处理硬件电路，如ASIC，或一个或多个用于控制本申请技术方案程序执行的集成电路等。此外，处理器可以具有操作一个或多个软件程序的功能，软件程序可以存储在存储介质中。

具体的，在本申请一实施例中，电子设备的存储器可以是只读存储器(read-onlymemory，ROM)、可存储静态信息和指令的其它类型的静态存储设备、随机存取存储器(random access memory，RAM)或可存储信息和指令的其它类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备，或者还可以是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何计算机可读介质。

具体的，在本申请一实施例中，处理器可以和存储器可以合成一个处理装置，更常见的是彼此独立的部件，处理器用于执行存储器中存储的程序代码来实现本申请实施例所述方法。具体实现时，该存储器也可以集成在处理器中，或者，独立于处理器。

进一步的，本申请实施例阐明的设备、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。

本领域内的技术人员应明白，本申请实施例可提供为方法、装置、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。

在本申请所提供的几个实施例中，任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

具体的，本申请一实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行本申请实施例提供的方法。

本申请一实施例还提供一种计算机程序产品，该计算机程序产品包括计算机程序，当其在计算机上运行时，使得计算机执行本申请实施例提供的方法。

本申请中的实施例描述是参照根据本申请实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

还需要说明的是，本申请实施例中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达，是指的这些项中的任意组合，包括单项或复数项的任意组合。例如，a，b和c中的至少一项可以表示：a，b，c，a和b，a和c，b和c或a和b和c，其中a，b，c可以是单个，也可以是多个。

本申请实施例中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述，仅为本申请的具体实施方式，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种通话方法，其特征在于，包括：

当存在呼叫被呼叫设备的通话时，使用设备组网中的一台或多台设备输出呼叫提示，其中，所述设备组网由包括所述被呼叫设备的多台设备而组建，所述设备组网中的一台设备被设置为处理智能交互进程的交互主设备，所述呼叫提示用于提示用户接听或挂断所述通话；所述多台设备包含一台或多台具备通话能力的设备，所述被呼叫设备为所述多台设备中的一台或多台具备通话能力的设备；所述被呼叫设备为所述交互主设备，或者，所述被呼叫设备不为所述交互主设备；

使用所述被呼叫设备进行通话进程处理，其中，当存在多台所述被呼叫设备时，使用多台所述被呼叫设备中的一台设备进行通话进程处理；

2.根据权利要求1所述的方法，其特征在于，所述呼叫提示包括音频提示，所述使用设备组网中的一台或多台设备输出呼叫提示，包括：

或者，

3.根据权利要求1所述的方法，其特征在于，所述呼叫提示包括图像提示，所述使用设备组网中的一台或多台设备输出呼叫提示，包括：

和/或，

4.根据权利要求1～3中任一项所述的方法，其特征在于，所述用户针对所述呼叫提示的输入操作包括语音输入，所述使用所述设备组网中的一台设备采集所述用户针对所述呼叫提示的输入操作，包括：

使用所述交互主设备的麦克风采集所述语音输入；

或者，

使用所述设备组网中距离所述用户最近的麦克风采集所述语音输入并将所述语音输入转发到所述交互主设备；

或者，

使用所述设备组网中多台设备的麦克风采集所述语音输入并将所述语音输入转发到所述交互主设备。

5.根据权利要求4所述的方法，其特征在于，所述使用所述交互主设备或所述被呼叫设备解析所述用户针对所述呼叫提示的输入操作，包括：

6.根据权利要求1～5中任一项所述的方法，其特征在于，所述用户针对所述呼叫提示的输入操作包括触控输入和/或接听按键输入，所述采集所述用户针对所述呼叫提示的输入操作，包括：

7.根据权利要求1～5中任一项所述的方法，其特征在于，所述启用所述设备组网中的一台或多台设备的麦克风采集所述用户的应答语音，包括：

启用所述交互主设备的麦克风采集所述用户的应答语音；

或者，

8.根据权利要求1～5中任一项所述的方法，其特征在于，所述启用所述设备组网中的一台或多台设备的喇叭播放呼入语音，包括：

启用所述交互主设备的喇叭播放所述呼入语音；

或者，

9.根据权利要求1～5中任一项所述的方法，其特征在于，当所述通话为视频通话时，所述使用所述设备组网中的一台或多台设备实现所述通话，还包括：

当所述交互主设备具备摄像头时，启用所述交互主设备的摄像头采集用于视频通话的视频画面；

或者，

10.根据权利要求1～5中任一项所述的方法，其特征在于，所述使用所述被呼叫设备进行通话进程处理，其中，当存在多台被呼叫设备时，使用所述多台被呼叫设备中的一台设备进行通话进程处理。

11.根据权利要求1～5中任一项所述的方法，其特征在于，所述启用所述设备组网中的一台或多台设备的麦克风采集所述用户的应答语音，包括，根据所述用户的设备选定操作和/或所述用户的通话位置变化切换启用不同设备的麦克风采集所述应答语音。

12.根据权利要求1～5中任一项所述的方法，其特征在于，所述启用所述设备组网中的一台或多台设备的喇叭播放呼入语音，包括，根据所述用户的设备选定操作和/或所述用户的通话位置变化切换启用不同设备的喇叭播放所述呼入语音。

13.一种通话控制装置，其特征在于，包括：

呼叫提示输出模块，其用于当存在呼叫被呼叫设备的通话时，输出相应指令，使得设备组网中的一台或多台设备输出呼叫提示，其中，所述设备组网由包括所述被呼叫设备的多台设备而组建，所述设备组网中的一台设备被设置为处理智能交互进程的交互主设备，所述呼叫提示用于提示用户接听或挂断所述通话；所述多台设备包含一台或多台具备通话能力的设备，所述被呼叫设备为所述多台设备中的一台或多台具备通话能力的设备；所述被呼叫设备为所述交互主设备，或者，所述被呼叫设备不为所述交互主设备；

14.一种通话系统，其特征在于，所述系统包括由多台设备而组建的设备组网，所述设备组网中的一台设备被设置为处理智能交互进程的交互主设备，所述系统执行下述步骤以实现通话：

当存在呼叫被呼叫设备的通话时，使用所述设备组网中的一台或多台设备输出呼叫提示，其中，所述被呼叫设备为所述设备组网中的设备，所述呼叫提示用于提示用户接听或挂断所述通话；所述多台设备包含一台或多台具备通话能力的设备，所述被呼叫设备为所述多台设备中的一台或多台具备通话能力的设备；所述被呼叫设备为所述交互主设备，或者，所述被呼叫设备不为所述交互主设备；

15.一种电子设备，其特征在于，所述电子设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发所述电子设备执行如权利要求1～12中任一项所述的方法步骤。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行如权利要求1-12中任一项所述的方法。