CN102810316B

CN102810316B - 通话中加入背景音的方法及通信终端

Info

Publication number: CN102810316B
Application number: CN201210222426.2A
Authority: CN
Inventors: 李长宁; 陈维山
Original assignee: Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Current assignee: Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority date: 2012-06-29
Filing date: 2012-06-29
Publication date: 2014-09-24
Anticipated expiration: 2032-06-29
Also published as: CN102810316A

Abstract

本发明适用于通信技术领域，提供了一种通话中加入背景音的方法，包括步骤有：检测是否收到预定的背景音调取指令；若收到所述背景音调取指令，则对通话语音进行去噪处理；根据所述背景音调取指令调取对应的背景音；将所述背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。相应地，本发明还提供一种通信终端。借此，本发明避免了环境噪音对背景音的不利干扰，使得叠加后的语音信号更加清晰，从而大大改善了背景音应用中的通话效果。更好的是，本发明可以通过语音口令来操控背景音功能，不仅能更方便地启用背景音应用，而且用户可以在通话过程中，随时说出不同的语音口令去调用不同的背景音，即可便捷地切换各种所需的通话氛围。

Description

通话中加入背景音的方法及通信终端

技术领域

本发明涉及通信技术领域，尤其涉及一种通话中加入背景音的方法及通信终端。

背景技术

在使用手机等通信终端进行通话时，通话氛围常常随通话者所处环境变化而随时变化，用户常常希望能刻意制造一个通话氛围给通话对端，以达到虚拟出一个惬意的通话情景或向通话对端隐瞒自己的通话位置的目的。为达到此目的，常采用的技术就是在通话过程中将一段自己所期望的背景音与自己的通话语音叠加后再传到通话对端。现有相关技术方案包括：

中国发明专利CN200410088445.6公开了一种在移动通信电话通话时加入背景音的方法及实现该方法的通信系统，该方案在主叫方和被叫方之间建立通话链路时，根据主叫方和被叫方的签约信息，在建立通话链路时将背景音加入到通话中。所述系统是在现有移动通信系统中增加一个背景音乐服务系统。并且根据该方案，中国移动公司已经提供了相应的背景音业务。但所述CN200410088445.6方案需要得到电信运营商的支持，此技术所需要的背景音都存于服务器上，而作为电信运营商提供的增值服务来看，目前其提供的背景数据库资源有限，而且缺乏个性化，不能满足所有用户的需求，而且用户还需为此支付相应的增值服务费用。

中国实用新型专利CN201020514109.4公开了一种通话时播放背景音的手机，该方案在手机通话时，在自己手机的背景音数据库中选择一种背景音叠加到通话语音中发送到通话对端，以增加手机通信乐趣。但所述CN201020514109.4方案需要对通信终端做改进，增加硬件模块，这种方式增加了通信终端的成本，而且通信终端厂商也不会为了该功能而在终端硬件上增加成本。实际上，如今智能通信终端的硬件已经得到很大的提升，完全可以基于通信终端平台开发相应的软件达到同样的目的。

中国发明专利申请CN201010537170.5公开了一种在手机通话中添加背景场景的方法，该方案提出让电信运营商建立一个通话背景场景服务中心，用来提供通话背景场景服务，在用户通话的过程中，根据其需要选择服务中心的背景音加入到自己的语音信号中，发送到通话对端，以达到隐藏自己通话位置的目的。所述CN201010537170.5方案也需要得到电信运营商的支持。

另外，目前已存在针对智能通信终端系统的通话环境虚拟软件或通话位置隐藏软件，这些软件通过让用户在通话过程中选择不同的背景音，叠加到语音中发送到通话对端的方式，模拟不同的通话环境。

但到目前为止背景音应用尚没有得到大量用户的接受，很多人只是将其作为一款有意思的应用或服务，而没有将其看做一必要的应用或服务，这也说明现有技术还不能给用户带来更多的方便和更好的体验，让用户发现它的作用。

以上CN201020514109.4、CN200410088445.6与CN201010537170.5三种方案，以及现有通话环境虚拟软件或通话位置隐藏软件还存在一些固有的缺陷：

首先，现有技术的实施过程中都缺少噪音去除这个重要步骤，目前市面上虽然出现了一些去噪功能较好的通信终端，但大多数通信终端的去噪效果不佳，对于一个身处噪音环境中的用户，假如不首先去除通话过程中的环境噪音，就叠加上另一个虚拟的背景音，那么真实环境噪音和虚拟背景音加到一起，可能会使这个虚拟背景音变得很模糊，达不到用户所需要的效果，而且很有可能会淹没掉通话语音，影响到通话质量和用户体验，从而阻碍了这一技术的发展。

另外，现有技术都需要在通话过程中，人为手动选择用户所需要背景音来虚拟通话环境，如果可选择的背景音很多的话，用户需要在通话的同时，在背景音数据库中花一些时间去选择他所需要的那一个背景音，这一个过程本身就会影响通话双方的交流，而且也不是一种快捷的方式，因为当用户选择所需背景音以后，通信终端后台还需要几秒钟时间启动这个服务，所以使得整个过程延缓了，达不到这一技术希望达到的目的。

综上可知，现有背景音应用技术在实际使用上显然存在不便与缺陷，所以有必要加以改进。

发明内容

针对上述的缺陷，本发明的目的在于提供一种通话中加入背景音的方法及通信终端，其避免了环境噪音对背景音的不利干扰，使得叠加后的语音信号更加清晰，从而大大改善了背景音应用中的通话效果。

为了实现上述目的，本发明提供一种通话中加入背景音的方法，包括步骤有：

检测是否收到预定的背景音调取指令；

若收到所述背景音调取指令，则对通话语音进行去噪处理；

根据所述背景音调取指令调取对应的背景音；

将所述背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。

根据本发明所述的方法，所述背景音调取指令为背景音调取口令；所述检测是否收到预定的背景音调取指令的步骤之前还包括：

预存若干所述背景音和若干所述背景音调取口令，且每一个所述背景音调取口令对应一个或一组所述背景音。

根据本发明所述的方法，所述背景音调取口令由背景音启动口令、背景音标识口令和输入结束口令组成，且每一个所述背景音标识口令对应一个或一组所述背景音；

所述检测是否收到预定的背景音调取指令的步骤之后还包括：

若收到所述背景音启动口令，则启动录音功能；

若收到所述背景音标识口令，则对所述背景音标识口令进行录音；

若收到所述输入结束口令，则停止所述录音功能；

对录制的所述背景音标识口令进行去噪处理；

所述根据背景音调取指令调取对应的背景音的步骤包括：

根据去噪处理后的所述背景音标识口令调取对应的所述背景音。

根据本发明所述的方法，所述将背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端的步骤之后还包括：

检测是否收到预定的另一背景音调取指令；

若收到所述另一背景音调取指令，则停止将所述背景音与去噪处理后的所述通话语音进行叠加；

根据所述另一背景音调取指令调取对应的另一背景音；

将所述另一背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。

检测是否收到预定的背景音终止指令；

若收到预定的背景音终止指令，则停止将所述背景音与去噪处理后的所述通话语音进行叠加，仅将所述通话语音发送给所述通话对端。

本发明还提供一种通信终端，包括有：

检测模块，用于检测是否收到预定的背景音调取指令；

去噪模块，用于若收到所述背景音调取指令，则对通话语音进行去噪处理；

调取模块，用于根据所述背景音调取指令调取对应的背景音；

叠加处理模块，用于将所述背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。

根据本发明所述的通信终端，所述背景音调取指令为背景音调取口令；所述通信终端还包括：

存储模块，用于预存若干所述背景音和若干所述背景音调取口令，且每一个所述背景音调取口令对应一个或一组所述背景音。

根据本发明所述的通信终端，所述背景音调取口令由背景音启动口令、背景音标识口令和输入结束口令组成，且每一个所述背景音标识口令对应一个或一组所述背景音；所述通信终端还包括录音模块；

所述录音模块进一步包括：

启动子模块，用于收到所述背景音启动口令时，启动录音功能；

录音子模块，用于收到所述背景音标识口令时，对所述背景音标识口令进行录音；

停止子模块，用于收到所述输入结束口令时，停止所述录音功能；

所述去噪模块，还用于对录制的所述背景音标识口令进行去噪处理；

所述调取模块，还用于根据去噪处理后的所述背景音标识口令调取对应的所述背景音。

根据本发明所述的通信终端，所述检测模块，还用于检测是否收到预定的另一背景音调取指令；

所述调取模块，还用于收到所述另一背景音调取指令时，根据所述另一背景音调取指令调取对应的另一背景音；

所述叠加处理模块，还用于收到所述另一背景音调取指令时，停止将所述背景音与去噪处理后的所述通话语音进行叠加；以及用于将所述调取模块调取的所述另一背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。

根据本发明所述的通信终端，所述检测模块，还用于检测是否收到预定的背景音终止指令；

所述叠加处理模块，还用于收到预定的背景音终止指令时，停止将所述背景音与去噪处理后的所述通话语音进行叠加，仅将所述通话语音发送给所述通话对端。

本发明基于通信终端提供了一种在通话中加入背景音的技术方案，当背景音功能被触发后，先将通话时的通话语音进行去噪处理以消除当前所处环境的环境噪音，再将背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端，其不仅可达到营造虚拟通话环境的目的，而且避免了环境噪音对背景音的干扰，使得叠加后的语音信号更加清晰，从而大大改善了背景音应用中的通话效果。此外，本发明可以直接利用通信终端的软件来实现，无需增加通信终端的硬件配置，从而降低了方案实现成本，而且不受电信运营商的限制。更好的是，本发明可以通过语音口令来操控背景音功能，不仅能更方便地启用背景音应用，而且用户可以在通话过程中，随时说出不同的语音口令去调用不同的背景音，即可便捷地切换各种所需的通话氛围，从而进一步提升了用户体验。

附图说明

图1是本发明通信终端的结构示意图；

图2是本发明优选通信终端的结构示意图；

图3是本发明通话中加入背景音的方法流程图；

图4是本发明第一实施例中通话中加入背景音的方法流程图；以及

图5是本发明第二实施例中通话中加入背景音的方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1是本发明通信终端的结构示意图，所述通信终端100可以是手机、PDA(Personal Digital Assistant，个人数字助理)、平板电脑等，并且通信终端100包括有检测模块10、去噪模块20、调取模块30以及叠加处理模块40，其中：

所述检测模块10，用于检测是否收到预定的背景音调取指令，所述背景音调取指令优选为背景音调取口令，也就是用户可以基于语音来操控背景音应用，当然所述背景音调取指令也可以是触屏手势指令、菜单选项触发指令等。

所述去噪模块20，用于若收到所述背景音调取指令，则对通话语音进行去噪处理，以消除通话语音中的环境噪音。

所述调取模块30，用于根据所述背景音调取指令调取对应的背景音。优选的是，通信终端100的本地数据库中存储有若干背景音和若干背景音调取指令，所述背景音调取指令对应有至少一个或一组所述背景音，调取模块30通过所述背景音调取指令在本地数据库中调取对应的背景音。

所述叠加处理模块40，用于将调取模块30调取的背景音与去噪处理后的通话语音进行叠加后发送给通话对端。所述通话对端是指本次通话中通话对方的通信终端，其可以是手机、PDA、平板电脑、固定电话、台式电脑等。

本发明是针对智能通信终端系统提出的，可在现有通信终端的硬件系统上，直接通过软件来实现。考虑到背景音若与实际通话的环境噪音叠加在一起，会给听话方带来不好的或错误的虚拟通话环境，让本服务达不到所需要的效果。因此对输入的信号去噪是非常重要的一步。本发明在进行通话环境模拟之前，首先需要对麦克风获取的通话语音进行去噪操作，以消除环境噪音对背景音的干扰，使得叠加后的背景音和通话语音仍是清晰的语音信号。

图2是本发明优选通信终端的结构示意图，本实施例中，所述背景音调取指令优选为背景音调取口令，并且所述通信终端100可包括有检测模块10、去噪模块20、调取模块30、叠加处理模块40、存储模块50和/或录音模块60，其中：

所述存储模块50，用于预存若干背景音和若干背景音调取口令，且每一个背景音调取口令对应一个或一组背景音。所述存储模块50优选以数据库形式存在。为使得本发明中基于语音操控的背景音应用在通信终端100上取得较好的用户体验，优选在通信终端100中建立一个背景音数据库，这个数据库存储大量用户所需要的背景音音频文件，这些音频文件可以是用户喜欢的音乐文件，自己录制或网络下载的关于各种人为制造或自然的有关环境的音频文件，包括风声，雨声，海浪声，闹市区嘈杂声，饭店吵闹声，车站人声鼎沸声，鸡尾酒会声等等；对于一些有特殊需要的用户，可能还需要自行录制一些特殊的音频文件，例如用户希望自己背景音是有人在吵架，就必须录制一段吵架的音频背景放入数据库，又如希望自己的背景音是厨房炒菜的声音，就可以在厨房炒菜时录制一段音频。这些音频文件可以是mp3，wma等格式，即只要是通信终端100的播放器所支持格式即可。

所述检测模块10，用于检测是否收到预定的背景音调取口令。

所述去噪模块20，用于若收到背景音调取口令，则对通话语音进行去噪处理。

所述调取模块30，用于根据背景音调取口令，从所述存储模块50调取与所述背景音调取口令对应的背景音的音频文件。

所述叠加处理模块40，用于将所述背景音与去噪处理后的通话语音进行叠加后发送给通话对端。

更好的是，所述背景音调取口令由背景音启动口令、背景音标识口令和输入结束口令组成，且每一个背景音标识口令对应一个或一组背景音，所述背景音标识口令中包含背景音的标识信息，例如背景音的名称、编号等。

所述录音模块60进一步包括：

启动子模块61，用于收到背景音启动口令时，启动录音功能。

录音子模块62，用于收到背景音标识口令时，对背景音标识口令进行录音。

停止子模块63，用于收到输入结束口令时，停止录音功能。

所述去噪模块20，还用于对录制的背景音标识口令进行去噪处理。由于用户实际可能处于非常嘈杂的通话环境中，所以当用户通过背景音启动口令来启动背景音以后，调取模块30不能正确的调用背景音文件，从而导致这一应用的失败，所以需要对用户所输入的背景音标识口令进行去噪操作，然后再进行口令控制过程。当然这里的去噪操作也直接影响到最后添加了背景音以后，实际的通话环境虚拟效果，假如没有经过去噪步骤，通过背景音调取口令控制也可能加入了正确的背景音。

所述调取模块30，还用于根据去噪处理后的背景音标识口令调取对应的背景音。

由于本实施例是基于语音控制的通话背景虚拟方法，所以在建立了背景音数据库以后，还需要给每一个背景音建立一个唯一的语音口令，用来在通话过程中通过这个口令调用相应的背景音文件。因为背景音数据库是用户自己建立的，所以，默认用户对数据库所包含的各种背景音很熟悉，他们在通话中应该知道数据库中是否有他所需要的背景音。但是数据库可能包含很多背景音，所以为了用户能方便地使用语音来调用它们，可以直接将背景音文件名作为背景音调取口令，例如用户希望在通话中加入“茉莉花”这个曲子，就可直接说出“茉莉花”这个词，这个词就作为口令，在被通信终端100的程序识别以后就可直接调用背景音乐“茉莉花”，并叠加到语音中传入通话对端中。但是如果只通过文件名作为语音口令肯定会在通话中发生错误调用的情况，例如用户在电话中说“今天我买了一盆茉莉花”，这句话中也包含了“茉莉花”这个词，但用户并不是要告诉通信终端100他想调用这个曲子，而是在和听话方说一句话，而通信终端100却会自动调用该曲目作为背景音。因此不合适直接将文件名作为语音口令。

有鉴于此，应该在背景音文件名前面加入一些背景音启动标示符，这里将其定义为“背景音启动口令”，其用途是用来提示通信终端100的软件现在需要启动某一个背景音，背景音的名称就是启动口令之后的几个字，以作为“背景音标识口令”；同时，因为不同背景音名称的字数不同，为了让通信终端100中的语音识别系统能正确而迅速地识别出要调用的背景音文件，还可以在背景音文件名后面再加上一个背景音名称输入结束标示符，即“输入结束口令，”例如可以将语音口令设置为“我要播放歌曲+歌曲名+啊”，在这个口令中，“我要播放歌曲“就是背景音启动口令，“歌曲名”是希望调用的背景音标识口令，“啊”是输入结束口令，当完成整个输入时，才会开始调用希望加入的背景音；如果播放背景音只是为了增加通话气氛，而且通话双方都对此有所了解，那么这种明显的语音调用口令是合适的，但如果是出于隐藏自己通话位置的目的，那么就要采用其他语音口令标示来启动背景音，例如可将语音口令设置为“我在+地铁里+呢”，其中“我在”是背景音启动口令，“地铁里”是需要调用的背景音标识口令，“呢”是输入结束口令。这里“地铁里”就是一个在背景音数据库中存在的背景音文件名，实际上，用户就可以像这样将很多背景音音频文件直接用地点来命名，如“地铁里”，“酒店里”，“雨中”，“大海边”，“超市里”，“机场”等等。因此当用户希望隐藏自己所处地理位置，而给听话方伪造某个位置时，就可以直接对对方说“我在...呢”，那么这句话既是要告诉对方这个信息，也是作为一个语音口令，告诉通信终端100现在要启动这样一个背景音。当然，用户在说话中可能常常说到“我在...呢”，但是如果说出的那个位置没有被定义，那么这就只是一句话，而不会被当做语音口令被通信终端100执行，例如用户说“我在北京呢”，但是背景音数据库中没有“北京”这个音频文件，所以虽然通过“我在”这个背景音启动口令启动了服务，但是却不能真正添加相应的背景音。总之，象这样一种定义语音口令的方式是具备较高的可靠性的，不会发生语音输入的错误，而且用户可以根据自己的需要自定义多个语音口令开始和结束的标示，以方便启动背景音，而且随便用任意一个包含背景音名称的语音口令标示符，都能调用背景音。同时，应该在该背景音虚拟程序中定义一些背景音终止指令，用于在特殊情况下能及时终止该服务，如定义口令“请终止背景虚拟服务”，当通信终端100接收到这个口令时，就会马上终止背景音与通话语音的叠加。

为了给背景音数据库中每一个背景音音频文件建立唯一一个背景音调取口令，可以通过以下两种实例方式来实现：

1)一种方法是在建立背景音数据库的同时，建立一个语音口令数据库，而这两个数据库之间保持一一映射的关系，那么在每一次向背景音数据库中添加一个背景音音频文件时，同时要在语音口令数据库中建立相应的背景音名称口令，这个口令是用户自己说出并录制下来的音频文件，其内容是对应背景音的文件名。在完成了语音口令库的建立以后，每次启动背景音文件的过程实际上是：用户首先说出需要虚拟的背景音的背景音调取口令，然后通信终端100的程序在语音口令数据库中搜索这一背景音调取口令，完成口令匹配，并通过背景音数据库和语音口令数据库之间的映射关系，在背景音数据库中找到对应的背景音文件，最后启动此文件执行背景音应用。

2)另一种方法不需要建立语音口令数据库，而是利用语音输入系统进行语音识别先将用户说出的文件名转化为文字，然后在背景音数据库中按照输入的文字搜索对应的背景音文件，同时启动此文件执行背景音应用，这种方法可以借用现有的语音输入法来完成。

优选的是，检测模块10，还用于检测是否收到预定的另一背景音调取指令。

调取模块30，还用于收到另一背景音调取指令时，根据另一背景音调取指令调取对应的另一背景音。

叠加处理模块40，还用于收到另一背景音调取指令时，停止将先前的背景音与去噪处理后的通话语音进行叠加。叠加处理模块40还用于将调取模块30调取的另一背景音与去噪处理后的通话语音进行叠加后发送给通话对端。

这样，用户就可以在通话过程中，随时说出不同的语音口令去调用不同的背景音，即可便捷地切换各种所需的通话氛围，从而进一步提升了用户体验。

更好的是，所述检测模块10，还用于检测是否收到预定的背景音终止指令，例如预定义的口令--“请终止背景虚拟服务”。

叠加处理模块40，还用于收到预定的背景音终止指令时，停止将背景音与去噪处理后的通话语音进行叠加，仅将通话语音发送给通话对端。

本发明对现有通话环境虚拟技术方案做了大改善，最重要的是将其实现方法从手动操作提升为语音操控方式，这不但方便了用户的操作，而且能让用户拥有更多通话环境选择方案，还能在通话过程中随意切换虚拟的通话情景；而且由于增加了对语音信号的去噪环节，使得这一应用变得更加有效及可靠。另外，本发明将虚拟的背景音数据库建在本地通信终端100上，所以用户可以根据自己的需要随心录制或者下载背景音，使得能拥有更多个性化的背景场景音，本发明既不需要给电信运营商缴纳增值业务费，还能使用户得到更好的用户体验。总之，本发明的实现能够使得基于语音操控的通话环境虚拟技术真正变为一项普及的用户服务，而且根据用户自身的需求，为其提供良好的用户体验，使得用户逐渐喜欢上这一服务。

图3是本发明通话中加入背景音的方法流程图，其可以通过如图1或图2所示的通信终端100实现，包括步骤有：

步骤S301，检测是否收到预定的背景音调取指令。本步骤可以在通话之前或之中执行，并且所述背景音调取指令优选为背景音调取口令，也就是用户可以基于语音来操控背景音应用，当然所述背景音调取指令也可以是触屏手势指令、菜单选项触发指令等。

步骤S302，若收到背景音调取指令，则对通话语音进行去噪处理，以消除通话语音中的环境噪音。

步骤S303，根据背景音调取指令调取对应的背景音。优选的是，通信终端100的本地数据库中存储有若干背景音和若干背景音调取指令，所述背景音调取指令对应有至少一个或一组所述背景音，本步骤通过所述背景音调取指令在本地数据库中调取对应的背景音。

步骤S304，将所述背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。

图4是本发明第一实施例中通话中加入背景音的方法流程图，其可以通过如图2所示的通信终端100实现，所述背景音调取指令优选为背景音调取口令，所述方法包括步骤有：

步骤S401，预存若干背景音和若干背景音调取口令，且每一个背景音调取口令对应一个或一组背景音。

步骤S402，在通话之前或之中，检测是否收到预定的背景音调取口令，若是则执行步骤S403，否则继续执行本步骤。

步骤S403，若收到背景音调取口令，则对通话语音进行去噪处理。

步骤S404，根据背景音调取口令调取对应的背景音。

步骤S405，将所述背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。

步骤S406，检测是否收到预定的另一背景音调取口令，若是则执行步骤S407，否则返回步骤S405。

步骤S407，若收到另一背景音调取口令，则停止将背景音与去噪处理后的通话语音进行叠加。

步骤S408，根据另一背景音调取口令调取对应的另一背景音。

步骤S409，将另一背景音与去噪处理后的通话语音进行叠加后发送给通话对端。

步骤S410，检测是否收到预定的背景音终止口令，若是则执行步骤S411，否则返回步骤S405。

步骤S411，若收到预定的背景音终止口令，则停止将背景音与去噪处理后的通话语音进行叠加，仅将通话语音发送给通话对端。

如此循环，直至本次通话结束。

图5是本发明第二实施例中通话中加入背景音的方法流程图，其可以通过如图2所示的通信终端100实现，背景音调取指令为背景音调取口令，所述方法包括步骤有：

步骤S501，预存若干背景音和若干背景音调取口令，所述背景音调取口令由背景音启动口令、背景音标识口令和输入结束口令组成，且每一个背景音标识口令对应一个或一组背景音。所述背景音标识口令中包含背景音的标识信息，例如背景音的名称、编号等。

步骤S502，在通话之前或之中，检测是否收到预定的背景音调取口令，若是则分别执行步骤S503，否则继续执行本步骤。

步骤S503，收到背景音启动口令，则对通话语音进行去噪处理。

步骤S504，收到背景音启动口令，启动录音功能。

步骤S505，收到背景音标识口令，对背景音标识口令进行录音。若未收到背景音标识口令则可以返回到步骤S502。

步骤S506，收到输入结束口令，停止录音功能。若未收到背景音标识口令则可以返回到步骤S502。

步骤S507，对录制的背景音标识口令进行去噪处理。

步骤S508，根据去噪处理后的背景音标识口令调取对应的背景音。

步骤S509，判断是否能找到匹配的背景音，若是则执行步骤S510，否则执行步骤S511。

步骤S510，将所述背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。

步骤S511，提示用户并不存在此背景音。

如此循环，直至本次通话结束。

下面以以虚拟“地铁”环境噪音为例，描述整个基于语音操控的背景音应用的实现过程如下：

1、用户开始拨通电话时，基于语音操控的背景音应用自动启动，并处于语音监测状态。

2、当用户开始通话，并说出“我在”这个背景音启动口令时，通信终端100开始启动语音录制功能。

3、通信终端100录制用户输入的背景音名称等语音信息，直到用户说出“呢”这个输入结束口令时，通信终端100停止录音。

4、通信终端100自动将录制的语音信息作为背景音标识口令。

5、将录制的背景音标识口令进行去噪操作，获得增强的语音信号。

6、利用去噪的背景音标识口令去调用背景音数据库中对应的音频文件，可以通过两种方式中的任何一种来完成，一种方案是直接用背景音标识口令与口令数据库中的各个语音口令进行匹配，获取匹配的语音口令，然后到背景音数据库中找出对应的背景音音频文件，如果没有与其匹配的语音口令，就提示用户数据库中没有这个背景音；另一种方案是利用语音输入系统将输入的语音口令转换为文字，同时在背景音数据库中搜索对应的背景音音频文件，如果没找到，就提示用户数据库中没有这个背景音。

7、在获得正确的背景音文件后，马上启动这个音频文件，将其叠加到用户的通话语音中。

8、将叠加的语音信号发送到通话对端中，完成背景音虚拟过程。

9、通信终端100时刻处于对用户通话话语进行检测的状态，如果用户发出另一背景音调取指令，则通信终端100根据另一背景音调取指令调取对应的另一背景音与通话语音叠加，以便切换不同的背景音；而如果用户发出背景音终止口令--“请终止背景虚拟服务”，那么通信终端100马上停止背景音应用，此时仅向通信对端发送通话语音。

综上所述，本发明基于通信终端提供了一种在通话中加入背景音的技术方案，当背景音功能被触发后，先将通话时的通话语音进行去噪处理以消除当前所处环境的环境噪音，再将背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端，其不仅可达到营造虚拟通话环境的目的，而且避免了环境噪音对背景音的干扰，使得叠加后的语音信号更加清晰，从而大大改善了背景音应用中的通话效果。此外，本发明可以直接利用通信终端的软件来实现，无需增加通信终端的硬件配置，从而降低了方案实现成本，而且不受电信运营商的限制。更好的是，本发明可以通过语音口令来操控背景音功能，不仅能更方便地启用背景音应用，而且用户可以在通话过程中，随时说出不同的语音口令去调用不同的背景音，即可便捷地切换各种所需的通话氛围，从而进一步提升了用户体验。

当然，本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

1.一种通话中加入背景音的方法，其特征在于，包括步骤有：

预存若干背景音和若干背景音调取口令，且每一个所述背景音调取口令对应一个或一组所述背景音；

检测是否收到预定的所述背景音调取口令；

若收到所述背景音调取口令，则对通话语音进行去噪处理；

根据所述背景音调取口令调取对应的背景音；

将所述背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端；

检测是否收到预定的另一背景音调取口令；

若收到所述另一背景音调取口令，则停止将所述背景音与去噪处理后的所述通话语音进行叠加；

根据所述另一背景音调取口令调取对应的另一背景音；

2.根据权利要求1所述的方法，其特征在于，所述背景音调取口令由背景音启动口令、背景音标识口令和输入结束口令组成，且每一个所述背景音标识口令对应一个或一组所述背景音；

所述检测是否收到预定的背景音调取口令的步骤之后还包括：

若收到所述背景音启动口令，则启动录音功能；

若收到所述输入结束口令，则停止所述录音功能；

对录制的所述背景音标识口令进行去噪处理；

所述根据背景音调取口令调取对应的背景音的步骤包括：

3.根据权利要求1或2所述的方法，其特征在于，所述将所述另一背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端的步骤之后还包括：

检测是否收到预定的背景音终止指令；

4.一种通信终端，其特征在于，包括有：

存储模块，用于预存若干背景音和若干背景音调取口令，且每一个所述背景音调取口令对应一个或一组所述背景音；

检测模块，用于检测是否收到预定的所述背景音调取口令；

去噪模块，用于若收到所述背景音调取口令，则对通话语音进行去噪处理；

调取模块，用于根据所述背景音调取口令调取对应的背景音；

叠加处理模块，用于将所述背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端；

所述检测模块，还用于检测是否收到预定的另一背景音调取口令；

所述调取模块，还用于收到所述另一背景音调取口令时，根据所述另一背景音调取口令调取对应的另一背景音；

所述叠加处理模块，还用于收到所述另一背景音调取口令时，停止将所述背景音与去噪处理后的所述通话语音进行叠加；以及用于将所述调取模块调取的所述另一背景音与去噪处理后的所述通话语音进行叠加后发送给通话对端。

5.根据权利要求4所述的通信终端，其特征在于，所述背景音调取口令由背景音启动口令、背景音标识口令和输入结束口令组成，且每一个所述背景音标识口令对应一个或一组所述背景音；所述通信终端还包括录音模块；

所述录音模块进一步包括：

6.根据权利要求4或5所述的通信终端，其特征在于，所述检测模块，还用于检测是否收到预定的背景音终止指令；