WO2021098708A1

WO2021098708A1 - 通话方法及终端设备

Info

Publication number: WO2021098708A1
Application number: PCT/CN2020/129662
Authority: WO
Inventors: 张世杰
Original assignee: 维沃移动通信有限公司
Priority date: 2019-11-22
Filing date: 2020-11-18
Publication date: 2021-05-27
Also published as: CN110913070B; CN110913070A

Abstract

本发明实施例提供一种通话方法及终端设备。所述终端设备为第一通话端，所述第一通话端包括语音助手；所述方法包括：在所述语音助手开启的情况下，通过所述语音助手获取目标通话端的第一信息；通过所述语音助手将所述第一信息转化为第二信息；输出所述第二信息；其中，在所述目标通话端为所述第一通话端的情况下，所述第一信息为文本信息，所述第二信息为语音信息；和/或，在所述目标通话端为与所述第一通话端通话的第二通话端的情况下，所述第一信息为语音信息，所述第二信息为文本信息。

Description

通话方法及终端设备

相关申请的交叉引用

本申请主张在2019年11月22日在中国提交的中国专利申请号No.201911155039.X的优先权，其全部内容通过引用包含于此。

技术领域

本发明实施例涉及通信技术领域，尤其涉及一种通话方法及终端设备。

背景技术

用户在通话时，若通话环境的噪声较大，将导致通话质量较差。为提高通话质量，目前通常采用的方式是：调高通话音量或转移到噪声较小的地方。然而，在通话音量调到最高用户仍不能清楚听清对端的声音，或，无法转移到噪声较小的地方的情况下，用户采用上述方式后通话质量仍得不到保证。

发明内容

本发明实施例提供一种通话方法及终端设备，以解决现有因通话环境的噪声较大，导致通话质量较差的问题。

为解决上述问题，本发明是这样实现的：

第一方面，本发明实施例提供了一种通话方法，应用于第一通话端，所述第一通话端包括语音助手；所述方法包括：

在所述语音助手开启的情况下，通过所述语音助手获取目标通话端的第一信息；

通过所述语音助手将所述第一信息转化为第二信息；

输出所述第二信息；

其中，在所述目标通话端为所述第一通话端的情况下，所述第一信息为文本信息，所述第二信息为语音信息；在所述目标通话端为与所述第一通话端通话的第二通话端的情况下，所述第一信息为语音信息，所述第二信息为文本信息。

第二方面，本发明实施例还提供一种终端设备，所述终端设备为第一通话端，所述终端设备包括语音助手；所述终端设备包括：

获取模块，用于在所述语音助手开启的情况下，通过所述语音助手获取目标通话端的第一信息；

转化模块，用于通过所述语音助手将所述第一信息转化为第二信息；

输出模块，用于输出所述第二信息；

第三方面，本发明实施例还提供一种终端设备，所述终端设备为第一通话端，该终端设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的通话方法的步骤。

第四方面，本发明实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的通话方法的步骤。

在本发明实施例中，第一通话端可以通过语音助手将第二通话端的语音信息转化为文本信息，使得第一通信终端的用户可以通过查看文本信息获取第二通话端的用户的表达内容，丰富了第一通话端的用户获取第二通话端的用户的表达内容的方式；第一通话端可以接收用户输入的文本信息，并通过语音助手将该文本信息转化为语音信息，以将该语音信息传输至第二通话端，这样，即使在第一通话端的用户不方便发声的情况下，也可以与第二通话端的用户通话。可见，本发明实施例可以提高通话质量。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的通话方法的流程图之一；

图2是本发明实施例的通话页面的示意图；

图3是本发明实施例提供的通话方法的流程图之二；

图4是本发明实施例提供的通话方法的流程图之三；

图5是本发明实施例提供的终端设备的结构图之一；

图6是本发明实施例提供的终端设备的结构图之二。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外，本发明中使用“和/或”表示所连接对象的至少其中之一，例如A和/或B和/或C，表示包含单独A，单独B，单独C，以及A和B都存在，B和C都存在，A和C都存在，以及A、B和C都存在的7种情况。

本发明实施例的通话方法可以应用于第一通话端。第一通话端可以与其他第二通话端进建立通话。具体地，通话的表现形式可以包括电话通话、语音通话、视频通话等。在实际应用中，通话端可以是手机、平板电脑(Tablet Personal Computer)、可穿戴式设备(Wearable Device)等。

本发明实施例的第一通话端可以包括但不仅限于语音助手。语音助手具有语音识别(Automatic Speech Recognition，ASR)功能和/或语音合成(Text-To-Speech，TTS)功能。具体地，在开启语音识别功能的情况下，语音助手可以将语音信息转化为文本信息；在开启语音合成功能的情况下，语音助手可以将文本信息转化为语音信息。

参见图1，图1是本发明实施例提供的通话方法的流程图之一。如图1所示，通话方法可以包括以下步骤：

步骤101、在所述语音助手开启的情况下，通过所述语音助手获取目标通话端的第一信息。

具体实现时，第一通话端可以在满足以下任一条件的情况下，开启所述语音助手：

第一条件：接收到对辅助通话控件的输入；

第二条件：接收到对实体人工智能(Artificial Intelligence，AI)键的输入。

在实际应用中，对于上述第一条件，所述辅助通话控件可以显示于来电页面和/或通话页面。如图2所示，辅助通话控件21显示于通话页面22上。

在本发明实施例中，目标通话端可以是：第一通话端；或，与所述第一通话端通话的第二通话端。第一信息的表现形式与目标通话端的表现形式相关。

具体地，在目标通话端为第一通话端的情况下，第一信息为文本信息。在该情况下，用户在第一通话端的屏幕上输入文本信息。

在目标通话端为第二通话端的情况下，第一信息为语音信息。在该情况下，语音助手可以通过以下两种方式获取第二通话端的语音信息。

方式一、语音助手可以通过听筒获取第二通话端的语音信息，在该实现方式中，语音助手从听筒直接获取的是语音信息的电信号。

方式二、语音助手可以通过话筒获取目第二通话端的语音信息，在该实现方式中，语音助手从话筒直接获取的是声音信号。

步骤102、通过所述语音助手将所述第一信息转化为第二信息。

具体实现时，在第一信息为文本信息的情况下，第二信息为语音信息。在该情况下，语音助手通过语音合成功能完成文本信息到语音信息的转化。

在第一信息为语音信息的情况下，第二信息为文本信息。在该情况下，语音助手通过语音识别功能完成语音信息到文本信息的转化。

步骤103、输出所述第二信息；在所述目标通话端为所述第一通话端的情况下，所述第一信息为文本信息，所述第二信息为语音信息；和/或，在所述目标通话端为与所述第一通话端通话的第二通话端的情况下，所述第一信息为语音信息，所述第二信息为文本信息。

由上述内容可知，在不同的情况下，第二信息的表现形式不同。可以理解的是，对于不同的第二信息，其输出方式也不同，分别说明如下。

第一情况、所述第二信息为语音信息。

所述输出所述第二信息，包括：通过目标话筒输出所述第二信息；其中，所述目标话筒可以是本发明实施例的第一话筒，也可以是所述第一通话端的其他话筒。

对于第一情况，第一通话端可以接收用户输入的文本信息，并通过语音助手将该文本信息转化为语音信息，以将该语音信息传输至第二通话端，这样，即使在第一通话端的用户不方便发声的情况下，也可以与第二通话端的用户通话，从而可以提高通话质量。

第二情况、所述第二信息为文本信息。

所述输出所述第二信息包括：在所述第一通话端的屏幕显示所述第二信息。

具体实现时，所述屏幕用于显示所述第二信息的区域可以是屏幕的全部区域，也可以是屏幕的部分区域，具体可根据实际需要确定。应理解的是，本发明并不限制所述屏幕用于显示所述第二信息的区域的大小和位置。

对于第二情况，第一通话端可以通过语音助手将第二通话端的语音信息转化为文字信息，并在屏幕上显示该文字信息，这样，第一通话端的用户可以通过查看文字信息获取第二通话端的用户的表达内容，丰富了第一通话端的用户获取第二通话端的用户的表达内容的方式，从而可以提高通话质量。

需要说明的是，在实际应用中，本发明实施例可以应用于以下三种场景。

第一场景、第一通话端仅开启语音助手的语音识别功能。

在第一场景中，第一通话端的用户可以有两种获取第二通话端的用户的表达内容的途径：一、听取通过第一通话端的听筒输出的第二通话端的语音信息；二、查看第一通话端的屏幕中显示的由第二通话端的语音信息转化的文本信息。

第一通话端通过采集语音信息获取第一通话端的用户的表达内容。

因此，对于第一场景，具体实现时，第一通话端的通话流程可以包括：

通过所述语音助手获取第二通话端的第一语音信息；通过所述语音助手将所述第一语音信息转化为第一文本信息；输出所述第一文本信息；

通过所述第一话筒采集第一通话端的第二语音信息，并发送所述第二语音信息。

第二场景、第一通话端仅开启语音助手的语音合成功能。

在第二场景中，第一通话端的用户通过听取第一通话端的听筒输出的第二通话端的语音信息，获取第二通话端的用户的表达内容。

第一通话端通过获取用户输入的文本信息，获取第一通话端的用户的表达内容。且第一通话端通过语音助手将用户输入的文本信息转化为语音信息，以将该语音信息传输至第二通话端。

可见，对于第一场景和第二场景，在第二通话端的用户通过听取语音信息获取第一通话端的用户的表达内容时，实质上该语音信息的发声对象不同。具体地，对于第一场景，该语音信息的发声对象是第一通话端的用户，而对于第二场景，该语音信息的发声对象是第一通话端。

因此，对于第二场景，具体实现时，第一通话端的通话流程可以包括：

通过所述语音助手获取第一通话端的第二文本信息；通过所述语音助手将所述第二文本信息为第三语音信息；输出所述第三语音信息；

输出从第二通话端接收到的第四语音信息。

第三场景、第一通话端开启语音助手的语音识别功能和语音合成功能。

在第三场景中，第一通话端的用户可以有两种获取第二通话端的用户的表达内容的途径：一、听取通过第一通话端的听筒输出的第二通话端的语音信息；二、查看第一通话端的屏幕中显示的由第二通话端的语音信息转化的文本信息。

因此，对于第三场景，具体实现时，第一通话端的通话流程可以包括：

本实施例的通话方法，第一通话端可以通过语音助手将第二通话端的语音信息转化为文本信息，使得第一通信终端的用户可以通过查看文本信息获取第二通话端的用户的表达内容，丰富了第一通话端的用户获取第二通话端的用户的表达内容的方式；第一通话端可以接收用户输入的文本信息，并通过语音助手将该文本信息转化为语音信息，以将该语音信息传输至第二通话端，这样，即使在第一通话端的用户不方便发声的情况下，也可以与第二通话端的用户通话。可见，本发明实施例可以提高通话质量。

在本发明实施例中，可选的，所述第二信息为文本信息；

所述输出所述第二信息，包括：

在屏幕上显示所述第二信息；

所述输出所述第二信息之后，所述方法还包括：

在接收到第一输入的情况下，保存所述屏幕上显示的文本信息。

具体实现时，对于上述第一场景，所述屏幕上显示的文本信息可以包括：由第二通话端的语音信息转化的文本信息。

对于上述第三场景，所述屏幕上显示的文本信息可以包括：由第二通话端的语音信息转化的文本信息，以及第一通话端的用户输入的文本信息。

进一步地，所述在屏幕上显示所述第二信息，包括：

在所述屏幕上分屏显示通话页面和文本页面，所述文本页面用于显示所述第二信息。

这样，在分屏显示模式下，屏幕可以同时显示通话页面和文本页面，从而可以在不妨碍通话页面操作的情况下，丰富用户获取第二通话端的用户的表达内容，从而可以进一步提高通话质量。

另外，在实施时，第一通话端可以在开启语音助手后，触发屏幕进入分屏显示模式；也可以在转化得到文本信息后，才触发屏幕进入分屏显示模式，但不仅限于此。

在本发明实施例的其他实施方式中，第一通话端也可以全屏显示所述第二信息。

在本发明实施例中，可选的，所述第一通话端还包括：

容纳腔，所述容纳腔由隔音材料制成；

第一听筒，设于所述容纳腔外，用于输出所述第二通话端的语音信息；

第一话筒，设于所述容纳腔外，用于采集所述第一通话端的通话环境的语音信息；

第二听筒，设于所述容纳腔内，用于输出所述第二通话端的语音信息；

第二话筒，设于所述容纳腔内，与所述语音助手电连接，用于获取所述第二听筒输出的语音信息，并将所述语音信息传输至所述语音助手。

在本实施方式中，第一听筒和第二听筒均可以输出接收到的第二通话端的语音信息。具体地，第一听筒输出的语音信息供用户通过听取该语音信息，获取第二通话端的用户的表达内容；第二听筒输出的语音信息可以通过第二话筒传输至语音助手，以使语音助手将该语音信息转化为文本信息，进而供用户通过查看该文本信息获取第二通话端的用户的表达内容。

第一话筒和第二话筒均用于采集语音信息，但第一话筒采集的是第一通话端的外部所处环境的语音信息，即第一话筒采集的是第一通话端的通话环境的语音信息；第二话筒采集的是第二听筒输出的语音信息。

由于第二听筒和第二话筒设于由隔音材料制成的容纳腔内，因此，可以提高语音助手获取语音信息的质量，进而可以提高通话质量。

在本发明实施例中，可选的，所述第二信息为文本信息；所述方法还包括以下至少一项：

在目标参数值大于阈值的情况下，控制所述第一话筒处于关闭状态；

在所述目标参数值小于或等于所述阈值的情况下，控制所述第一话筒处于开启状态；

其中，所述目标参数值用于表征所述第一通话端的通话环境的优劣程度。

应理解的是，上述步骤可以应用于第一通话端通过所述语音助手获取目标通话端的第一信息的过程中，即第一通话端可以在通过语音助手获取语音信息的情况下，根据目标参数值与阈值的比较结果，控制第一话筒的工作状态。

在目标参数值大于阈值的情况下，说明所述第一通话端的通话环境劣，噪声大。因此，为了降低外部噪声对第二话筒的影响，可以关闭第一话筒。

在目标参数值小于或等于阈值的情况下，说明所述第一通话端的通话环境优，噪声小。因此，可以开启第一话筒。由于第一话筒还需要用于采集第一通话端的外部所处环境的语音信息，从而在目标参数值小于或等于阈值的情况下控制所述第一话筒处于开启状态，可以降低第一话筒开关的切换频次。

具体实现时，考虑到第二通话端的用户的发声音量大小受第一通话端的通话环境影响。具体地，第一通话端的通话环境越差，则第二通话端的用户的发声音量越大。因此，可选的，所述目标参数值包括所述第一听筒输出的音量值。

需要说明的是，本发明实施例中介绍的多种可选的实施方式，在彼此不冲突的情况下可以相互结合实现，也可以单独实现，对此本发明实施例不作限定。

为方便理解，示例说明如下：

实施例一

本实施例可以在通话端的内部用隔音材料制成一个隔层，隔层内放置微型专用通话扬声器和AI专用话筒。

本实施例可以包括以下步骤：

步骤301、在检测到来电的情况下，在来电被叫界面显示辅助通话控件。

若检测到对辅助通话控件的触控操作，则使用辅助功能接听；若未检测到对辅助通话控件的触控操作，则未使用辅助功能接听。

步骤302、检测是否启用辅助功能接听。

若使用辅助功能接听，则执行步骤304，反之则执行步骤303。

步骤303、进入正常的通话接听界面。

进一步地，可以在通话接听界面显示辅助通话控件。若检测到对辅助通话控件的触控操作，则使用辅助功能接听，执行步骤304。

步骤304、启动语音助手，并控制屏幕上下分屏，在上半屏为通话页面的同比缩放，继续保留手机接听过程的所有按钮，下半屏为语音助手唤醒界面的同比缩放，将打开通话端内部的AI专用扬声器和话筒，将ASR识别出的文本显示在下半屏内。

用户可以根据下半屏文字内容辅助本次通话。

在实施过程中，为了防止外置话筒对内部话筒的噪音影响，开启辅助通话后，当听筒音量大于阈值时，外部话筒应关闭。当听筒音量小于阈值时，外部话筒重新打开。

步骤305、在通话结束的情况下，通话页面自动关闭，AI专用扬声器和收音孔关闭，下半屏手机语音助手界面扩大到全屏；通话内容用户可选择性保存。

实施例二

步骤401、系统检测到有来电。

步骤402、在来电被接听的情况下，进入正常的通话接听界面。

在接听过程中，用户可以通过手机实体AI键唤醒AI辅助通话。

步骤403、在启用AI辅助手机通话的情况下，并控制屏幕上下分屏，在上半屏为通话页面的同比缩放，继续保留手机接听过程的所有按钮，下半屏为语音助手唤醒界面的同比缩放，将打开通话端内部的AI专用扬声器和话筒，将ASR识别出的文本显示在下半屏内。

用户可以根据下半屏文字内容辅助本次通话。

步骤404、在通话结束的情况下，通话页面自动关闭，AI专用扬声器和收音孔关闭，下半屏手机语音助手界面扩大到全屏；通话内容用户可选择性保存。

参见图5，图5是本发明实施例提供的终端设备的结构图之一。终端设备500为本发明方法实施例中的第一通话端，终端设备500包括语音助手；如图5所示，终端设备500包括：

获取模块501，用于在所述语音助手开启的情况下，通过所述语音助手获取目标通话端的第一信息；

转化模块502，用于通过所述语音助手将所述第一信息转化为第二信息；

输出模块503，用于输出所述第二信息；

其中，在所述目标通话端为所述第一通话端的情况下，所述第一信息为文本信息，所述第二信息为语音信息；和/或，在所述目标通话端为与所述第一通话端通话的第二通话端的情况下，所述第一信息为语音信息，所述第二信息为文本信息。

可选的，所述第二信息为文本信息；

所述输出模块503，具体用于：

在屏幕上显示所述第二信息；

所述终端设备500还包括：

保存模块，用于在所述输出模块输出所述第二信息之后，在接收到第一输入的情况下，保存所述屏幕上显示的文本信息。

可选的，所述输出模块503，具体用于：

可选的，所述终端设备500还包括：

容纳腔，所述容纳腔由隔音材料制成；

可选的，所述第二信息为文本信息；所述终端设备还包括控制模块，用于执行以下至少一项：

可选的，所述目标参数值包括所述第一听筒输出的音量值。

终端设备500能够实现本发明方法实施例中第一通话端能够实现的各个过程，以及达到相同的有益效果，为避免重复，这里不再赘述。

请参考图6，图6是本发明实施例提供的终端设备的结构图之二，可以为实现本发明各个实施例的一种第一通话端的硬件结构示意图。终端设备600为本发明方法实施例中的第一通话端，终端设备600包括语音助手。如图6所示，终端设备600包括但不限于：射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元 607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解，图6中示出的终端设备结构并不构成对第一通话端的限定，第一通话端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，终端设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中，处理器610，用于：

通过所述语音助手将所述第一信息转化为第二信息；

输出所述第二信息；

可选的，所述第二信息为文本信息；处理器610，还用于：

通过显示单元606在屏幕上显示所述第二信息；

在通过用户输入单元607接收到第一输入的情况下，保存所述屏幕上显示的文本信息。

可选的，处理器610，还用于：

通过显示单元606在所述屏幕上分屏显示通话页面和文本页面，所述文本页面用于显示所述第二信息。

可选的，所述终端设备600还包括：

容纳腔，所述容纳腔由隔音材料制成；

可选的，所述第二信息为文本信息；处理器610，还用于：

可选的，所述目标参数值包括所述第一听筒输出的音量值。

需要说明的是，本实施例中上述终端设备600可以实现本发明实施例中方法实施例中的各个过程，以及达到相同的有益效果，为避免重复，此处不再赘述。

应理解的是，本发明实施例中，射频单元601可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器610处理；另外，将上行的数据发送给基站。通常，射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元601还可以通过无线通信系统与网络和其他设备通信。

终端设备通过网络模块602为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元603还可以提供与终端设备600执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。

输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(Graphics Processing Unit，GPU)6041和麦克风6042，图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。

终端设备600还包括至少一种传感器605，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度，接近传感器可在终端设备600移动到耳边时，关闭显示面板6061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别终端设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板6061。

用户输入单元607可用于接收输入的数字或字符信息，以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器610，接收处理器610发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071，用户输入单元607还可以包括其他输入设备6072。具体地，其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板6071可覆盖在显示面板6061上，当触控面板6071检测到在其上或附近的触摸操作后，传送给处理器610以确定触摸事件的类型，随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。虽然在图6中，触控面板6071与显示面板6061是作为两个独立的部件来实现终端设备的输入和输出功能，但是在某些实施例中，可以将触控面板6071与显示面板6061集成而实现终端设备的输入和输出功能，具体此处不做限定。

接口单元608为外部装置与终端设备600连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(Input/Output，I/O)端口、视频I/O端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到终端设备600内的一个或多个元件或者可以用于在终端设备600和外部装置之间传输数据。

存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器609可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器610是终端设备的控制中心，利用各种接口和线路连接整个终端设备的各个部分，通过运行或执行存储在存储器609内的软件程序和/或模块，以及调用存储在存储器609内的数据，执行终端设备的各种功能和处理数据，从而对终端设备进行整体监控。处理器610可包括一个或多个处理单元；优选的，处理器610可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器610中。

终端设备600还可以包括给各个部件供电的电源611(比如电池)，优选的，电源611可以通过电源管理系统与处理器610逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，终端设备600包括一些未示出的功能模块，在此不再赘述。

优选的，本发明实施例还提供一种终端设备，所述终端设备为第一通话端，所述终端设备包括处理器610，存储器609，存储在存储器609上并可在所述处理器610上运行的计算机程序，该计算机程序被处理器610执行时实现上述通话方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述通话方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来控制相关的硬件来完成，所述的程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储器(Read-Only Memory，ROM)或随机存取存储器(Random Access Memory，RAM)等。

可以理解的是，本公开实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，模块、单元、子单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processor，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本公开所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本公开实施例所述功能的模块(例如过程、函数等)来实现本公开实施例所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

Claims

一种通话方法，应用于第一通话端，其特征在于，所述第一通话端包括语音助手；所述方法包括：

在所述语音助手开启的情况下，通过所述语音助手获取目标通话端的第一信息；

通过所述语音助手将所述第一信息转化为第二信息；

输出所述第二信息；

其中，在所述目标通话端为所述第一通话端的情况下，所述第一信息为文本信息，所述第二信息为语音信息；和/或，在所述目标通话端为与所述第一通话端通话的第二通话端的情况下，所述第一信息为语音信息，所述第二信息为文本信息。
根据权利要求1所述的方法，其特征在于，所述第二信息为文本信息；

所述输出所述第二信息，包括：

在屏幕上显示所述第二信息；

所述输出所述第二信息之后，所述方法还包括：

在接收到第一输入的情况下，保存所述屏幕上显示的文本信息。
根据权利要求2所述的方法，其特征在于，所述在屏幕上显示所述第二信息，包括：

在所述屏幕上分屏显示通话页面和文本页面，所述文本页面用于显示所述第二信息。
根据权利要求1至3中任一项所述的方法，其特征在于，所述第一通话端还包括：

容纳腔，所述容纳腔由隔音材料制成；

第一听筒，设于所述容纳腔外，用于输出所述第二通话端的语音信息；

第一话筒，设于所述容纳腔外，用于采集所述第一通话端的通话环境的语音信息；

第二听筒，设于所述容纳腔内，用于输出所述第二通话端的语音信息；

第二话筒，设于所述容纳腔内，与所述语音助手电连接，用于获取所述第二听筒输出的语音信息，并将所述语音信息传输至所述语音助手。
根据权利要求4所述的方法，其特征在于，所述第二信息为文本信息；所述方法还包括以下至少一项：

在目标参数值大于阈值的情况下，控制所述第一话筒处于关闭状态；

在所述目标参数值小于或等于所述阈值的情况下，控制所述第一话筒处于开启状态；

其中，所述目标参数值用于表征所述第一通话端的通话环境的优劣程度。
根据权利要求5所述的方法，其特征在于，所述目标参数值包括所述第一听筒输出的音量值。
一种终端设备，所述终端设备为第一通话端，其特征在于，所述终端设备包括语音助手；所述终端设备包括：

获取模块，用于在所述语音助手开启的情况下，通过所述语音助手获取目标通话端的第一信息；

转化模块，用于通过所述语音助手将所述第一信息转化为第二信息；

输出模块，用于输出所述第二信息；

其中，在所述目标通话端为所述第一通话端的情况下，所述第一信息为文本信息，所述第二信息为语音信息；和/或，在所述目标通话端为与所述第一通话端通话的第二通话端的情况下，所述第一信息为语音信息，所述第二信息为文本信息。
根据权利要求7所述的终端设备，其特征在于，所述第二信息为文本信息；

所述输出模块，具体用于：

在屏幕上显示所述第二信息；

所述终端设备还包括：

保存模块，用于在所述输出模块输出所述第二信息之后，在接收到第一输入的情况下，保存所述屏幕上显示的文本信息。
根据权利要求8所述的终端设备，其特征在于，所述输出模块，具体用于：

在所述屏幕上分屏显示通话页面和文本页面，所述文本页面用于显示所述第二信息。
根据权利要求7至9中任一项所述的终端设备，其特征在于，所述终端设备还包括：

容纳腔，所述容纳腔由隔音材料制成；

第一听筒，设于所述容纳腔外，用于输出所述第二通话端的语音信息；

第一话筒，设于所述容纳腔外，用于采集所述第一通话端的通话环境的语音信息；

第二听筒，设于所述容纳腔内，用于输出所述第二通话端的语音信息；

第二话筒，设于所述容纳腔内，与所述语音助手电连接，用于获取所述第二听筒输出的语音信息，并将所述语音信息传输至所述语音助手。
根据权利要求10所述的终端设备，其特征在于，所述第二信息为文本信息；所述终端设备还包括控制模块，用于执行以下至少一项：

在目标参数值大于阈值的情况下，控制所述第一话筒处于关闭状态；

在所述目标参数值小于或等于所述阈值的情况下，控制所述第一话筒处于开启状态；

其中，所述目标参数值用于表征所述第一通话端的通话环境的优劣程度。
根据权利要求11所述的终端设备，其特征在于，所述目标参数值包括所述第一听筒输出的音量值。
一种终端设备，所述终端设备为第一通话端，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的通话方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的通话方法的步骤。