CN103686050A

CN103686050A - 一种模拟通话场景的方法及电子设备

Info

Publication number: CN103686050A
Application number: CN201210348075.XA
Authority: CN
Inventors: 杨丰华
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2012-09-18
Filing date: 2012-09-18
Publication date: 2014-03-26

Abstract

本发明实施例提供一种模拟通话场景的方法及电子设备，其中方法包括：根据预置的用户通话信息与远程通话类型的对应关系，从原始通话信息中提取出与当前远程通话类型对应的用户通话信息；将提取出的用户通话信息与预置的通话场景信息相融合，向通话对方发送融合后的信息，所述预置的通话场景信息与当前远程通话类型相对应。本发明解决了现有技术所模拟的通话场景仅是静态的场景，模拟的通话场景比较单一，且目前还没有针对语音通话的通话场景模拟的问题；实现了动态场景的模拟，丰富了所模拟的通话场景，实现了针对语音通话的通话场景模拟。

Description

一种模拟通话场景的方法及电子设备

技术领域

本发明涉及通信技术领域，更具体地说，涉及一种模拟通话场景的方法及电子设备。

背景技术

随着互联网技术的发展，用户除了使用传统的通信网络，如移动通信网络、局域网络等进行远程通话外，还可通过互联网实现远程通话，用户实现远程通话的方式变得多样性；目前只要能够联网且带有通话基础模块的电子设备均可实现用户间的远程通话，该类型的电子设备如语音通话手机，可视电话手机，可进行语音通话、视频通话的计算机、掌上电脑等。

远程通话的类型主要分为语音通话和视频通话，在用户进行远程通话时，电子设备将获取原始通话信息，将获取的原始通话信息通过通话基础模块传送给通话对方。当用户进行语音通话时，电子设备获取的原始通话信息包括原始语音信息（电子设备话筒获取的原始语音），电子设备将原始语音信息通过通话基础模块传送给通话对方；当用户进行视频通话时，电子设备获取的原始通话信息包括原始语音信息和原始影像信息（电子设备摄像头获取的原始影像），电子设备将获取的原始影像信息和原始语音信息通过通话基础模块传送给通话对方。上述远程通话方式在传输与用户相关的通话信息的同时，也会将与通话场景相关的信息传输给通话对方，这就无法满足用户对某些特殊通话场景的保密需求，如用户正在开个重要的会议，用户对该会议信息附有保密义务，如果用户使用上述远程通话方式进行语音或视频通话，则通话对方很可能通过语音或视频通话获知该会议内容，使得会议信息存在泄漏的隐患。

基于此，目前出现了一种模拟通话场景的技术，该技术可采用虚拟的通话场景替换用户真实的通话场景，从而达到对用户的通话场景进行模拟的效果。发明人在实现本发明的过程中发现现有模拟通话场景的技术存在如下缺点：目前的模拟通话场景的技术仅是针对用户所进行的视频通话，且仅是将所要传输的原始影像替换为一个静态的图片（如大头贴图像）从而达到对用户真实通话场景进行保密的目的；这就使得所模拟的通话场景仅是静态的场景，模拟的通话场景比较单一，且目前还没有针对语音通话的通话场景模拟。

发明内容

有鉴于此，本发明实施例提供一种模拟通话场景的方法及电子设备，以解决现有技术所模拟的通话场景仅是静态的场景，模拟的通话场景比较单一，且目前还没有针对语音通话的通话场景模拟的问题。

为实现上述目的，本发明实施例提供如下技术方案：

一种模拟通话场景的方法，应用于能够进行远程通话的电子设备，所述方法包括：

根据预置的用户通话信息与远程通话类型的对应关系，从原始通话信息中提取出与当前远程通话类型对应的用户通话信息；

将提取出的用户通话信息与预置的通话场景信息相融合，向通话对方发送融合后的信息，所述预置的通话场景信息与当前远程通话类型相对应。

可选的，在当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息；

所述从原始通话信息中提取出与当前远程通话类型对应的用户通话信息包括：

对原始语音信息进行基础滤波降噪，得到基础原生语音信息；

将所述基础原生语音信息确定为用户通话语音信息。

可选的，当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息；

对所述基础原生语音信息中的噪音波形进行采样，得到噪声样本；

将所述基础原生语音信息带入预置的样本滤波器，从所述基础原生语音信息中去除所述噪声样本，得到用户通话语音信息。

可选的，所述预置的通话场景信息为预置的通话背景音信息；

所述将提取出的用户通话信息与预置的通话场景信息相融合包括：

将用户通话语音信息与预置的通话背景音信息进行波形融合，合成新的通话语音信息。

可选的，所述将用户通话语音信息与预置的通话背景音信息进行波形融合包括：

获取预置的通话背景音信息；

对所述通话背景音信息进行音频数字解码，获取对应的采样波形参数；

将所述采样波形参数叠加到所述用户通话语音信息上。

可选的，在当前远程通话类型为视频通话时，对应的用户通话信息为用户影像信息；

所述从获取的原始通话信息中提取出与当前远程通话类型对应的用户通话信息包括：

通过人像识别技术从原始通话信息的原始影像信息中提取出初步的用户影像信息；

对所述初步的用户影像信息进行人像轮廓分割，从所述初步的用户影像信息中提取出用户影像信息。

可选的，所述预置的通话场景信息为预置的图片信息或视频影像信息；

将所述用户影像信息与预置的图片信息或视频信息进行人像场景融合，合成新的影像信息。

可选的，所述将所述用户影像信息与预置的图片信息或视频信息进行人像场景融合包括：

将所述用户影像按照设定的位置在预置的图片或视频中进行影像编码重叠；

对重叠的边缘部分进行像素灰化和半透过度，实现人像场景融合。

可选的，所述方法还包括：

从原始通话信息的原始语音信息中提取出用户通话语音信息；

将用户通话语音信息与预置通话背景音信息相融合，向通话对方发送融合后的信息。

本发明实施例还提供一种电子设备，所述电子设备能够进行远程通话，所述电子设备包括：第一提取模块，第一合成模块，通话基础模块；

第一提取模块，用于根据预置的用户通话信息与远程通话类型的对应关系，从原始通话信息中提取出与当前远程通话类型对应的用户通话信息，将提取出的用户通话信息传送给所述第一合成模块；

所述第一合成模块，用于接收所述第一提取模块所提取出的用户通话信息，将提取出的用户通话信息与预置的通话场景信息相融合，将融合后的信息传送给所述通话基础模块；

所述通话基础模块，用于接收所述融合后的信息，向通话对方发送所述融合后的信息。

所述第一提取模块包括：

第一降噪单元，用于在当前远程通话类型为语音通话时，将原始语音信息进行基础滤波降噪，得到基础原生语音信息；

确定单元，用于将所述第一降噪单元所得到的基础原生语音信息，确定为用户通话语音信息。

所述第一提取模块包括：第一降噪单元，采样单元和第二降噪单元

所述第一降噪单元，用于在当前远程通话类型为语音通话时，将原始语音信息进行基础滤波降噪，得到基础原生语音信息，将所述基础原生语音信息传送给所述采样单元和所述第二降噪单元；

所述采样单元，用于对所述基础原生语音信息中的噪音波形进行采样，得到噪声样本，将所述噪声样本传送给所述第二降噪单元；

所述第二降噪单元，用于将所述基础原生语音信息带入预置的样本滤波器，从所述基础原生语音信息中去除所述噪声样本，得到用户通话语音信息。

所述第一合成模块包括：

波形融合单元，用于将所述用户通话语音信息与预置的通话背景音信息进行波形融合，合成新的通话语音信息。

所述第一提取模块包括：

第一影像提取单元，用于在当前远程通话类型为视频通话时，通过人像识别技术从原始影像信息中提取出初步的用户影像信息；

第二影像提取单元，用于对所述初步的用户影像信息进行人像轮廓分割，从所述初步的用户影像信息提取出用户影像信息。

可选的，所述第一合成模块包括：

场景融合单元，用于将所述用户影像信息与预置的图片信息或视频信息进行人像场景融合，合成新的影像信息。

可选的，还包括：

第二提取模块，用于从原始通话信息的原始语音信息中提取出用户通话语音信息；

第二合成模块，用于将用户通话语音信息与预置通话背景音信息相融合，将融合后的信息发送给所述通话基础模块，以便所述通话基础模块发送该融合后的信息。

基于上述技术方案，本发明实施例提供的模拟通话场景的方法，根据预置的用户通话信息与远程通话类型的对应关系，和预置的通话场景信息与当前远程通话类型的对应关系，将提取出的用户通话信息与预置的通话场景信息相融合，当提取出的用户通话信息为用户影象信息时，可实现用户动态影像与预置的图片信息或视频影像信息的融合，实现了动态场景的模拟，丰富了所模拟的通话场景；当提取出的用户通话信息为用户通话语音信息时，本发明实施例提供的模拟通话场景的方法可实现提取出的用户通话语音信息与预置的通话背景音信息的融合，实现了针对语音通话的通话场景模拟。本发明解决了现有技术所模拟的通话场景仅是静态的场景，模拟的通话场景比较单一，且目前还没有针对语音通话的通话场景模拟的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的模拟通话场景的方法的流程图；

图2为本发明实施例提供的模拟通话场景的方法的另一流程图；

图3为本发明实施例提供的模拟通话场景的方法的又一流程图；

图4为本发明实施例提供的将用户通话语音信息与预置的通话背景音信息进行波形融合的方法流程图；

图5为本发明实施例提供的模拟通话场景的方法的再一流程图；

图6为本发明实施例提供的将提取出的用户影像信息与预置的通话场景信息相融合的方法流程图；

图7为本发明实施例提供的模拟通话场景的方法的再又一流程图；

图8为本发明实施例提供的电子设备的结构框图；

图9为本发明实施例提供的第一提取模块的结构框图；

图10为本发明实施例提供的第一提取模块的另一结构框图；

图11为本发明实施例提供的第一合成模块的结构框图；

图12为本发明实施例提供的第一提取模块的再一结构框图；

图13为本发明实施例提供的第一合成模块的另一结构框图；

图14为本发明实施例提供的电子设备的另一结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的模拟通话场景的方法的流程图，参照图1，该方法可以包括：

步骤S100、根据预置的用户通话信息与远程通话类型的对应关系，从原始通话信息中提取出与当前远程通话类型对应的用户通话信息；

其中，可按照电子设备所能够进行的远程通话方式，预置用户通话信息与远程通话类型的对应关系，如对于只能够进行语音通话的电子设备，可预置用户通话信息与远程通话类型的对应关系为，用户通话语音信息与语音通话的对应关系，用户通话语音信息是指用户的个人语音，是原始语音信息中排除背景音等噪音后所保留的属于用户所发出的语音的信息；对于只能够进行视频通话的电子设备，可预置用户通话信息与远程通话类型的对应关系为，用户影像信息与视频通话的对应关系，用户影像信息是指原始影像信息中排除背景画面等后所保留的用户个人影像；对于即能够进行语音通话和视频通话的电子设备，则所预置的用户通话信息与远程通话类型的对应关系可以包括：用户通话语音信息与语音通话的对应关系，和用户影像信息与视频通话的对应关系。

值得注意的是，上述按照电子设备所能够进行的远程通话方式，预置用户通话信息与远程通话类型的对应关系的方式仅为可选方式，还可通过用户设定的方式预置用户通话信息与远程通话类型的对应关系，如在即能够进行语音通话和视频通话的电子设备上，设定预置的用户通话信息与远程通话类型的对应关系为用户通话语音信息与语音通话的对应关系只为一种，即用户通话语音信息与语音通话的对应关系，或用户影像信息与视频通话的对应关系。

在预置了用户通话信息与远程通话类型的对应关系后，可依据当前远程通话的类型，从对应的原始通话信息中提取出对应的用户通话信息。如预置的用户通话信息与远程通话类型的对应关系为，用户通话语音信息与语音通话的对应关系，则在当前远程通话类型为语音通话时，可从原始语音信息中提取出用户通话语音信息；又如预置的用户通话信息与远程通话类型的对应关系包括：用户通话语音信息与语音通话的对应关系，和用户影像信息与视频通话的对应关系时，可在确定了当前远程通话类型为语音通话或视频通话后，对应的从原始通话信息中提取出用户通话语音信息或用户影像信息。

步骤S110、将提取出的用户通话信息与预置的通话场景信息相融合，向通话对方发送融合后的信息。

其中，所述预置的通话场景信息与当前远程通话类型相对应。

在步骤S100提取出与当前远程通话类型对应的用户通话信息后，可通过当前远程通话类型与通话场景信息的对应关系，确定与用户通话信息所要融合的预置的通话场景信息。本发明实施例中，当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息，预置的通话场景信息为通话背景音信息，通话背景音是指语音通话中除用户个人语音外的背景音，该通话背景音信息与用户通话语音信息融合后，将产生一个指示用户在该通话背景音下所发出的语音的信息，实现针对语音通话的通话场景模拟；当前远程通话类型为视频通话时，对应的用户通话信息为用户影像信息，预置的通话场景信息为图片信息或视频影像信息，该图片或视频影像与用户影像融合后，将产生一个指示用户在该图片或视频影像中所进行的活动的信息，实现针对视频通话的动态场景的模拟。

本发明实施例提供的模拟通话场景的方法，根据预置的用户通话信息与远程通话类型的对应关系，和预置的通话场景信息与当前远程通话类型的对应关系，将提取出的用户通话信息与预置的通话场景信息相融合，当提取出的用户通话信息为用户的影象信息时，可实现用户动态影像与预置的图片信息或视频影像信息的融合，实现了动态场景的模拟，丰富了所模拟的通话场景；当提取出的用户通话信息为用户通话语音信息时，本发明实施例提供的模拟通话场景的方法可实现提取出的用户通话语音信息与预置的通话背景音信息的融合，实现了针对语音通话的通话场景模拟。本发明解决了现有技术所模拟的通话场景仅是静态的场景，模拟的通话场景比较单一，且目前还没有针对语音通话的通话场景模拟的问题。

下面对当前远程通话类型为语音通话下的通话场景的模拟进行说明。

图2为本发明实施例提供的模拟通话场景的方法的另一流程图，参照图2，该方法可以包括：

步骤S200、确定当前远程通话类型为用户语音通话，对应的用户通话信息为用户通话语音信息；

步骤S210、对原始语音信息进行基础滤波降噪，得到基础原生语音信息，将所述基础原生语音信息确定为用户通话语音信息；

因为人声只占声音频率范围的一小部分（大致是80Hz~12kHz），所以可将在此范围外的频率波形进行滤波，则可得到一个背景音很小的基础原生语音波形，即基础原生语音信息，由于所得到的基础原生语音信息中的背景音很小，因此忽略其影响，将基础原生语音信息确定为用户通话语音信息。

步骤S220、将用户通话语音信息与预置的通话背景音信息进行波形融合，合成新的通话语音信息。

可以看出，图2所示步骤S210示出了图1所示步骤S100中“从原始通话信息中提取出与当前远程通话类型对应的用户通话信息”的具体实现方式，图2所示步骤S220示出了图1所示步骤S110中“将提取出的用户通话信息与预置的通话场景信息相融合”的具体实现方式。

图3为本发明实施例提供的模拟通话场景的方法的又一流程图，参照图3，该方法可以包括：

步骤S300、确定当前远程通话类型为用户语音通话，对应的用户通话信息为用户通话语音信息；

步骤S310、对原始语音信息进行基础滤波降噪，得到基础原生语音信息，对所述基础原生语音信息中的噪音波形进行采样，得到噪声样本，将所述基础原生语音信息带入预置的样本滤波器，从所述基础原生语音信息中去除所述噪声样本，得到用户通话语音信息；

步骤S320、将用户通话语音信息与预置的通话背景音信息进行波形融合，合成新的通话语音信息。

可以看出，图3所示步骤S310示出了图1所示步骤S100中“从原始通话信息中提取出与当前远程通话类型对应的用户通话信息”的具体实现方式，图3所示步骤S320示出了图1所示步骤S110中“将提取出的用户通话信息与预置的通话场景信息相融合”的具体实现方式。与图2所示方法相比，图3所示方法在得到基础原生语音信息的基础上，采用样本滤波器对基础原生语音信息中的很小的背景音又做了进一步的降噪处理，使得得到的用户通话语音信息更为接近用户的个人语音，提高了所模拟的通话场景的真实性。

可选的，图2和图3所示方法在确定了用户通话语音信息后，将用户通话语音信息与预置的通话背景音信息进行波形融合的具体实现方式可以如图4所示包括：

步骤S400、获取预置的通话背景音信息；

步骤S410、对所述通话背景音信息进行音频数字解码，获取对应的采样波形参数；

步骤S420、将所述采样波形参数叠加到所述用户通话语音信息上。

通过本发明实施例所描述的针对语音通话的通话场景模拟的具体实现方式，本领域人员完全可以实现本发明所描述的针对语音通话的通话场景模拟，本领域人员还可以变换得出其他的针对语音通话的通话场景模拟的实现方式，所变换得出的不脱离本发明发明原理的实现方式皆在本发明的保护范围内。

下面对当前远程通话类型为视频通话下的通话场景的模拟进行说明。

图5为本发明实施例提供的模拟通话场景的方法的再一流程图，该方法可以包括：

步骤S500、确定当前远程通话类型为视频通话，对应的用户通话信息为用户影像信息；

步骤S510、通过人像识别技术从原始通话信息的原始影像信息中提取出初步的用户影像信息，对所述初步的用户影像信息进行人像轮廓分割，从所述初步的用户影像信息中提取出用户影像信息；

具体的，可首先识别原始影像中的人脸，具有面部的眼镜，鼻子等特征进行识别。确定人面的位置后，根据面部特征的方向，角度和间距确认人体轮廓的大致范围，从而对人像轮廓进行分割，提取出用户影像信息。

步骤S520、将所述用户影像信息与预置的图片信息或视频信息进行人像场景融合，合成新的影像信息。

在当前远程通话类型为视频通话时，对应的原始通话信息包括原始语音信息和原始影像信息，由于与视频通话对应的用户通话信息为用户影像信息，因此只需从原始通话信息中的原始影像信息中提取用户影像信息即可。

图5所示步骤S510示出了图1所示步骤S100中“从获取的原始通话信息中提取出与当前远程通话类型对应的用户通话信息”的具体实现方式，图5所示步骤S520示出了图1所示步骤S110中“将提取出的用户通话信息与预置的通话场景信息相融合”的具体实现方式。

可选的，图5所示步骤S520的具体实现方式可以如图6所示，包括：

步骤S600、将所述用户影像按照设定的位置在预置的图片或视频中进行影像编码重叠；

步骤S610、对重叠的边缘部分进行像素灰化和半透过度，实现人像场景融合。

由于远程通话类型为视频通话时，传送给通话对方的原始通话信息包括了原始语音信息和原始影像信息，因此在将用户影像信息与预置图片信息或视频影像信息融合的同时，还可针对原始语音信息进行场景融合，实现动态场景模拟下的语音通话场景的模拟。

图7为本发明实施例提供的模拟通话场景的方法的再又一流程图，该方法可以包括：

步骤S700、确定当前远程通话类型为视频通话，对应的用户通话信息为用户影像信息；

步骤S710、通过人像识别技术从原始通话信息的原始影像信息中提取出初步的用户影像信息，对所述初步的用户影像信息进行人像轮廓分割，从所述初步的用户影像信息中提取出用户影像信息；

步骤S720、将所述用户影像信息与预置的图片信息或视频信息进行人像场景融合，合成新的影像信息；

步骤S730、从原始通话信息的原始语音信息中提取出用户通话语音信息；

步骤S740、将用户通话语音信息与预置通话背景音信息相融合；

步骤S750、向通话对方发送融合后的信息。

其中，步骤S710和步骤S720，与，步骤S730和步骤S740为针对原始影像信息和原始语音信息所做出的不同处理过程，这两组步骤之间可以没有先后的顺序；

步骤S750中向通话对方发送的融合后的信息包括了融合后形成的新的影像信息，和用户通话语音信息与预置通话背景音信息融合后的信息，具体的发送方式可参照现有技术中将原始影像信息和原始语音信息发送给通话对方的方式，此处不再赘述。

通过本发明实施例所描述的针对视频通话的通话场景模拟的具体实现方式，本领域人员完全可以实现本发明所描述的针对视频通话的通话场景模拟，本领域人员还可以变换得出其他的针对视频通话的通话场景模拟的实现方式，所变换得出的不脱离本发明发明原理的实现方式皆在本发明的保护范围内。

下面对能够进行本发明实施例提供的模拟通话场景功能的电子设备进行描述，所描述的电子设备与上文描述的模拟通话场景的方法相对应，两者可相互参照。

图8为本发明实施例提供的电子设备的结构框图，参照图8，该电子设备可以包括：第一提取模块100，第一合成模块200和通话基础模块300；其中，第一提取模块100与第一合成模块200相连，第一合成模块200与通话基础模块300相连；

第一提取模块100，用于根据预置的用户通话信息与远程通话类型的对应关系，从原始通话信息中提取出与当前远程通话类型对应的用户通话信息，将提取出的用户通话信息传送给第一合成模块200；

第一合成模块200，用于接收第一提取模块100所提取出的用户通话信息，将提取出的用户通话信息与预置的通话场景信息相融合，将融合后的信息传送给通话基础模块300；

通话基础模块300，用于接收所述融合后的信息，向通话对方发送所述融合后的信息。

其中，在当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息；在该情况下，第一提取模块100的结构可如图9所示，包括：第一降噪单元110和确定单元111，第一降噪单元110与确定单元111相连；

第一降噪单元110，用于在当前远程通话类型为语音通话时，将原始语音信息进行基础滤波降噪，得到基础原生语音信息；

确定单元111，用于将第一降噪单元110所得到的基础原生语音信息，确定为用户通话语音信息。

在当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息；在该情况下，第一提取模块100除如图9所示结构外，其结构还可如图10所示，包括：第一降噪单元120，采样单元121和第二降噪单元122；其中，第一降噪单元120分别与采样单元121和第二降噪单元122相连，采样单元121与第二降噪单元122相连；

第一降噪单元120，用于在当前远程通话类型为语音通话时，将原始语音信息进行基础滤波降噪，得到基础原生语音信息，将所述基础原生语音信息传送给采样单元121和第二降噪单元122；

采样单元121，用于对所述基础原生语音信息中的噪音波形进行采样，得到噪声样本，将所述噪声样本传送给第二降噪单元122；

第二降噪单元122，用于将所述基础原生语音信息带入预置的样本滤波器，从所述基础原生语音信息中去除所述噪声样本，得到用户通话语音信息。

在当前远程通话类型为语音通话时，第一合成模块200的结构可如图11所示，包括：

波形融合单元210，用于将所述用户通话语音信息与预置的通话背景音信息进行波形融合，合成新的通话语音信息。

在当前远程通话类型为视频通话时，对应的用户通话信息为用户影像信息；在该情况下，第一提取模块100的结构可如图12所示，包括：第一影像提取单元130和第二影像提取单元131，其中第一影像提取单元130与第二影像提取单元131相连，

第一影像提取单元130，用于在当前远程通话类型为视频通话时，通过人像识别技术从原始影像信息中提取出初步的用户影像信息；

第二影像提取单元131，用于对所述初步的用户影像信息进行人像轮廓分割，从所述初步的用户影像信息提取出用户影像信息。

在当前远程通话类型为视频通话时，第一合成模块200的结构可如图13所示，包括：

场景融合单元220，用于将所述用户影像信息与预置的图片信息或视频信息进行人像场景融合，合成新的影像信息。

在第一提取模块100的结构如图12所示，和第一合成模块200的结构如图13所示的电子设备的基础上，本发明实施例所提供的电子设备的结构还可如图14所示，结合图8和图14所示，该电子设备还可以包括：

第二提取模块400，用于从原始通话信息的原始语音信息中提取出用户通话语音信息；

第二合成模块500，用于将用户通话语音信息与预置通话背景音信息相融合，将融合后的信息发送给通话基础模块300，以便通话基础模块300发送该融合后信息。

本发明实施例提供的模拟通话场景的方法及电子设备实现了动态场景的模拟，丰富了所模拟的通话场景，实现了针对语音通话的通话场景模拟。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器（RAM）、内存、只读存储器（ROM）、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种模拟通话场景的方法，其特征在于，应用于能够进行远程通话的电子设备，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息；

将所述基础原生语音信息确定为用户通话语音信息。

3.根据权利要求1所述的方法，其特征在于，当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息；

4.根据权利要求2或3所述的方法，其特征在于，所述预置的通话场景信息为预置的通话背景音信息；

5.根据权利要求4所述的方法，其特征在于，所述将用户通话语音信息与预置的通话背景音信息进行波形融合包括：

获取预置的通话背景音信息；

将所述采样波形参数叠加到所述用户通话语音信息上。

6.根据权利要求1所述的方法，其特征在于，在当前远程通话类型为视频通话时，对应的用户通话信息为用户影像信息；

7.根据权利要求6所述的方法，其特征在于，所述预置的通话场景信息为预置的图片信息或视频影像信息；

8.根据权利要求7所述的方法，其特征在于，所述将所述用户影像信息与预置的图片信息或视频信息进行人像场景融合包括：

9.根据权利要求6至8任一项所述的方法，其特征在于，还包括：

10.一种电子设备，其特征在于，所述电子设备能够进行远程通话，所述电子设备包括：第一提取模块，第一合成模块，通话基础模块；

所述第一合成模块，用于接收所述第一提取模块所提取出的用户通话信息，将提取出的用户通话信息与预置的通话场景信息相融合，所述预置的通话场景信息与当前远程通话类型相对应，将融合后的信息传送给所述通话基础模块；

11.根据权利要求10所述的电子设备，其特征在于，在当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息；

所述第一提取模块包括：

12.根据权利要求10所述的电子设备，其特征在于，在当前远程通话类型为语音通话时，对应的用户通话信息为用户通话语音信息；

13.根据权利要求11或12所述的电子设备，其特征在于，所述预置的通话场景信息为预置的通话背景音信息；

所述第一合成模块包括：

14.根据权利要求10所述的电子设备，其特征在于，在当前远程通话类型为视频通话时，对应的用户通话信息为用户影像信息；

所述第一提取模块包括：

15.根据权利要求14所述的电子设备，其特征在于，所述第一合成模块包括：

16.根据权利要求15所述的电子设备，其特征在于，还包括：