CN110502207B

CN110502207B - 背景声的静音方法、系统、设备及存储介质

Info

Publication number: CN110502207B
Application number: CN201910762718.7A
Authority: CN
Inventors: 付星; 张帆; 孙思凯
Original assignee: Shenzhen Skyworth RGB Electronics Co Ltd
Current assignee: Shenzhen Skyworth RGB Electronics Co Ltd
Priority date: 2019-08-14
Filing date: 2019-08-14
Publication date: 2023-07-18
Anticipated expiration: 2039-08-14
Also published as: CN110502207A

Abstract

本发明公开了一种背景声的静音方法、系统、设备及存储介质。本发明通过接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从第二声音数据中识别出待播报语音及非待播报语音，并将非待播报语音及第一声音数据定义为背景声；将背景声静音；通过将智能终端中背景声全部静音，从而使得播放声音中只有待播报语音，避免了语音播报中带有背景声，大大提高了用户的语音操控体验。

Description

背景声的静音方法、系统、设备及存储介质

技术领域

本发明涉及电子信息技术领域，尤其涉及一种背景声的静音方法、系统、设备及存储介质。

背景技术

随着智能电视的普及，越来越多的智能电视厂家都推出了自己的语音操控以替代传统的遥控器操控，很多其他消费内电子产品也都增加了语音操控功能，极大的提高用户操作体验。

由于Android智能终端声音场景的多样性和芯片底层音频框架的复杂性，一般带有语音功能的智能终端在语音播报时，播放出来的声音是有背景声的，比如Android智能电视的TV通道下说讲个笑话，那么电视喇叭出来的声音是由TV节目和语音播报的一个随机笑话两个声音叠加而成，这会导致用户听不清楚语音播报，也会影响用户对语音功能的体验。

发明内容

本发明的主要目的在于提供一种背景声的静音方法、系统、设备及存储介质，旨在解决现有技术中Android智能终端各种有背景声的场景下语音播报时背景声和播报语音会叠加输出的技术问题。

为实现上述目的，本发明提供一种背景声的静音方法，所述方法包括以下步骤：

接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；

从所述第二声音数据中识别出待播报语音及非待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声；

将所述背景声静音。

优选地，所述将所述背景声静音的步骤，包括：

通过音频策略管理器调用中间件的第一预设接口将所述第一声音数据静音；

通过音频策略执行器将所述第二声音数据中的非待播报语音静音。

优选地，所述从所述第二声音数据中识别出待播报语音及非待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声的步骤，包括：

从所述第二声音数据中识别出音频流类型为非通知流的非待播报语音；

从所述第二声音数据中识别出音频流类型为通知流的待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声。

优选地，所述通过音频策略管理器调用中间件的第一预设接口将所述第一声音数据静音的步骤，包括：

通过音频策略管理器调用中间件的第二预设接口将所述第一声音数据中的各音轨分别静音，所述第二预设接口有多个，且与所述各音轨一一对应；

或，

通过音频策略管理器调用中间件的第三预设接口将所述第一声音数据中的所有音轨同时静音。

优选地，所述通过音频策略执行器将所述第二声音数据中的非待播报语音静音的步骤之前，所述方法还包括：

通过所述音频策略管理器向所述音频策略执行器发送开启语音播报状态指令，以使所述音频策略执行器将所述第二声音数据中的非待播报语音静音。

优选地，所述通过音频策略执行器将所述第二声音数据中的非待播报语音静音的步骤之后，所述方法还包括：

在接收到所述语音应用程序安装包发送的解除静音指令时，通过所述音频策略管理器调用中间件的第四预设接口将所述第一声音数据解除静音；

通过所述音频策略执行器将所述第二声音数据中的非待播报语音解除静音。

此外，为实现上述目的，本发明还提供一种背景声的静音系统，所述背景声的静音系统包括语音应用程序安装包及框架层；其中，

所述语音程序安装包，用于向所述框架层发送开启静音指令；

所述框架层，用于接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从所述第二声音数据中识别出待播报语音及非待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声；将所述背景声静音。

优选地，所述框架层包括音频策略管理器及音频策略执行器，所述背景声的静音系统还包括中间件；其中，

所述框架层，还用于通过所述音频策略管理器调用中间件的第一预设接口将所述第一声音数据静音；通过所述音频策略执行器将所述第二声音数据中的非待播报语音静音；

所述中间件，用于存储所述第一预设接口。

此外，为实现上述目的，本发明还提供一种背景声的静音设备，所述背景声的静音设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的背景声的静音程序，所述背景声的静音程序配置为实现所述的背景声的静音方法的步骤。

此外，为实现上述目的，本发明还提供一种存储介质，所述存储介质上存储有背景声的静音程序，所述背景声的静音程序被处理器执行时实现所述的背景声的静音方法的步骤。

本发明通过接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从第二声音数据中识别出待播报语音及非待播报语音，并将非待播报语音及第一声音数据定义为背景声；将背景声静音；通过将智能终端中背景声全部静音，从而使得播放声音中只有待播报语音，避免了语音播报中带有背景声，大大提高了用户的语音操控体验。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的背景声的静音设备结构示意图；

图2为本发明背景声的静音方法第一实施例的流程示意图；

图3为本发明背景声的静音方法第二实施例的流程示意图；

图4为本发明背景声的静音系统第一实施例的功能模块图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的背景声的静音设备结构示意图。

如图1所示，该背景声的静音设备可以包括：处理器1001，例如CPU，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对背景声的静音设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及背景声的静音程序。

在图1所示的背景声的静音设备中，网络接口1004主要用于与外部网络进行数据通信；用户接口1003主要用于接收用户的输入指令；所述背景声的静音设备通过处理器1001调用存储器1005中存储的背景声的静音程序，并执行以下操作：

将所述背景声静音。

进一步地，处理器1001可以调用存储器1005中存储的背景声的静音程序，还执行以下操作：

或，

本实施例通过上述方案，通过接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从第二声音数据中识别出待播报语音及非待播报语音，并将非待播报语音及第一声音数据定义为背景声；将背景声静音；通过将智能终端中背景声全部静音，从而使得播放声音中只有待播报语音，避免了语音播报中带有背景声，大大提高了用户的语音操控体验。

基于上述硬件结构，提出本发明背景声的静音方法实施例。

参照图2，图2为本发明背景声的静音方法第一实施例的流程示意图。

在第一实施例中，所述背景声的静音方法包括以下步骤：

S10：接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；

需要说明的是，对于目前大部分的智能终端，语音播报时的背景声来源主要有以下两类：一、本地媒体播放和TV通道的背景声；二、在线媒体播放的背景声；第一声音数据中包括上述背景声以及待播报语音。

在具体实现中，语音应用程序安装包(以下简称语音APK)在启动语音播报时，会向框架层发送开启静音指令，框架层接收到该指令后根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据。

应当理解的是，Android平台中在线媒体播放的背景声及待播放语音一般是走ALSA(Advanced Linux Sound Architecture，高级Linux声音体系结构)音轨(Track)输出，本地媒体播放和TV通道的背景声一般是走非ALSA Track输出，因此，可以根据声音数据是否走ALSA Track输出识别出非ALSA Track输出的本地媒体播放和TV通道的背景声(定义本地媒体播放和TV通道的背景声为第一声音数据)和ALSA Track输出的在线媒体播放的背景声及待播放语音(定义在线媒体播放的背景声及待播放语音为第二声音数据)，并对背景声进行静音。

S20：从所述第二声音数据中识别出待播报语音及非待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声；

具体地，从所述第二声音数据中识别出音频流类型为非通知流的非待播报语音；从所述第二声音数据中识别出音频流类型为通知流的待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声。

应当理解的是，因为在线媒体播放和语音播报在Android平台上默认都是走ALSATrack输出，而Android智能终端产品对待播报语音播报构造的流类型都是通知流，因此可以通过流类型是否为通知流区分语音播报和在线音视频的背景声，从而在语音播报时针对非通知流的在线音视频的背景声进行静音。

S30：将所述背景声静音。

具体地，通过音频策略管理器(以下称AudioPolicyManager)调用中间件的第一预设接口将所述第一声音数据静音；通过音频策略执行器(以下称AudioFlinger)将所述第二声音数据中的非待播报语音静音。

应当理解的是，框架层识别出本地媒体播放和TV通道的背景声、在线媒体播放的背景声后，通过AudioPolicyManager调用底层中间件的第一预设接口(如setTrackMuteExceptAlsa(on))的方式将本地媒体播放和TV通道的背景声进行静音，通过AudioFlinger对在线媒体播放的背景声进行静音，从而使播放声音中只有待播报语音。

此外，为了不影响在不进行语音播报时其他声音的正常播放，框架层在接收到所述语音APK发送的解除静音指令时，通过AudioPolicyManager调用中间件的第四预设接口(如setTrackMuteExceptAlsa(off))将所述第一声音数据解除静音；通过AudioFlinger将所述第二声音数据中的非待播报语音解除静音。

本实施例通过接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从第二声音数据中识别出待播报语音及非待播报语音，并将非待播报语音及第一声音数据定义为背景声；将背景声静音；通过将智能终端中背景声全部静音，只对播报语音进行播放，避免了语音播报中带有背景声，大大提高了用户的语音操控体验。

进一步地，如图3所示，基于第一实施例提出本发明背景声的静音方法第二实施例，在本实施例中，步骤S30具体包括以下步骤：

S31：通过音频策略管理器调用中间件的第一预设接口将所述第一声音数据静音；

具体地，通过音频策略管理器调用中间件的第二预设接口将所述第一声音数据中的各音轨分别静音，所述第二预设接口有多个，且与所述各音轨一一对应；或，通过音频策略管理器调用中间件的第三预设接口将所述第一声音数据中的所有音轨同时静音。

应当理解的是，第一声音数据包括来自多个音轨的声音源，在中间件软件上可以增加多个接口，对各路音轨的声音源单独静音或解除静音，也可以增加一个接口如setTrackMuteExceptAlsa(on/off)来对第一声音数据中所有音轨的声音源整体静音或解除静音，同时将这个接口暴露到框架层的AudioPolicyManager。对于TV通道和本地媒体的背景声静音，语音播放启动时调用到以上的setTrackMuteExceptAlsa(on)接口即可静音当前背景声，语音播放完毕再调用setTrackMuteExceptAlsa(off)解除当前背景声。

在具体实现中，当第一数据静音完成后，框架层通过所述音频策略管理器向所述音频策略执行器发送开启语音播报状态指令，以使所述音频策略执行器将所述非待播报语音静音。

S32：通过音频策略执行器将所述第二声音数据中的非待播报语音静音。

应当理解的是，AudioFlinger在接收到开启语音播报状态指令后，根据语音播报状态属性静音其他非通知流的背景音。

背景声的静音软件实现步骤如下：

1、语音APK在启动语音播报时，创建StreamType为AUDIO_STREAM_NOTIFICATION的AudioTrack(音轨)对象；

2、语音APK同时调用框架层AudioManager标准的setParameters接口,参数setskyvoicetts＝start代表语音播报开启，setskyvoicetts＝stop代表语音播报停止；

3、通过AudioSystem::setParameters()匹配键值对setskyvoicetts字符串转到AudioPolicyManager::setParameters2Sky()新增接口；

3-1、调用AudioPolicyManager已binder好的中间件的client对象的setTrackMuteExceptAlsa(on/off)接口，on代表静音(mute)，off代表解除静音(unmute)；

3-2、设置代表语音播报开启或停止的属性third.get.skyvoice.tts(start/stop)，以通知AudioFlinger模块；

4、中间件根据setTrackMuteExceptAlsa参数静音或解除静音非ALSA Track(TV通道和本地媒体)的背景声；

5、AudioFlinger根据当前是否在语音播报状态，静音(start状态)或解除静音(stop状态)ALSA Track中的非NOTIFICATION(通知)流类型的背景声(如MUSIC流的在线音视频)。

本实施例通过基于各Android智能终端产品各自的底层音频架构抽象出一套setTrackMuteExceptAlsa的接口，静音TV各通道或本地媒体的背景声，基于Android标准ALSA Track音频流，剥离语音播报(NOTIFICATION流)和在线音视频(MUSIC流)的流类型，以到达静音在线音视频等的背景声，通过采用上层APK+构架层+底层中间件相互协调配合，完成既有需求但接口分离，具有逻辑清晰、不影响系统底层功能等特点。

本发明进一步提供一种背景声的静音系统。

参照图4，图4为本发明背景声的静音系统第一实施例的功能模块图。

本实施例中，所述背景声的静音系统包括语音应用程序安装包10及框架层20；其中，所述语音程序安装包10，用于向所述框架层20发送开启静音指令；所述框架层20，用于接收语音应用程序安装包10发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从所述第二声音数据中识别出待播报语音及非待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声；将所述背景声静音。

进一步地，所述框架层10包括音频策略管理器及音频策略执行器，所述背景声的静音系统还包括中间件30；其中，所述框架层10，还用于通过所述音频策略管理器调用中间件的第一预设接口将所述第一声音数据静音；通过所述音频策略执行器将所述第二声音数据中的非待播报语音静音；所述中间件30，用于存储所述第一预设接口。

背景声的静音软件实现步骤如下：

本实施例通过接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从第二声音数据中识别出待播报语音及非待播报语音，并将非待播报语音及第一声音数据定义为背景声；将背景声静音；通过将智能终端中背景声全部静音，从而使得播放声音中只有待播报语音，避免了语音播报中带有背景声，大大提高了用户的语音操控体验；通过基于各Android智能终端产品各自的底层音频架构抽象出一套setTrackMuteExceptAlsa的接口，静音TV各通道或本地媒体的背景声，基于Android标准ALSA Track音频流，剥离语音播报(NOTIFICATION流)和在线音视频(MUSIC流)的流类型，以到达静音在线音视频等的背景声，通过采用上层APK+构架层+底层中间件相互协调配合，完成既有需求但接口分离，具有逻辑清晰、不影响系统底层功能等特点。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有背景声的静音程序，所述背景声的静音程序被处理器执行时实现如下操作：

将所述背景声静音。

进一步地，所述背景声的静音程序被处理器执行时还实现如下操作：

或，

本实施例通过接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从第二声音数据中识别出待播报语音及非待播报语音，并将非待播报语音及第一声音数据定义为背景声；将背景声静音；通过将智能终端中背景声全部静音，从而使得播放声音中只有待播报语音，避免了语音播报中带有背景声，大大提高了用户的语音操控体验。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种背景声的静音方法，其特征在于，所述背景声的静音方法包括以下步骤：

将所述背景声静音；

所述从所述第二声音数据中识别出待播报语音及非待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声的步骤，包括：

2.如权利要求1所述的背景声的静音方法，其特征在于，所述将所述背景声静音的步骤，包括：

3.如权利要求2所述的背景声的静音方法，其特征在于，所述通过音频策略管理器调用中间件的第一预设接口将所述第一声音数据静音的步骤，包括：

或，

4.如权利要求2所述的背景声的静音方法，其特征在于，所述通过音频策略执行器将所述第二声音数据中的非待播报语音静音的步骤之前，所述方法还包括：

通过所述音频策略管理器向音频策略执行器发送开启语音播报状态指令，以使所述音频策略执行器将所述第二声音数据中的非待播报语音静音。

5.如权利要求2所述的背景声的静音方法，其特征在于，所述通过音频策略执行器将所述第二声音数据中的非待播报语音静音的步骤之后，所述方法还包括：

6.一种背景声的静音系统，其特征在于，所述背景声的静音的系统包括语音应用程序安装包及框架层；其中，

所述语音应用程序安装包，用于向所述框架层发送开启静音指令；

所述框架层，用于接收语音应用程序安装包发送的开启静音指令，根据当前系统音频架构及音频应用场景识别出基于非ALSA架构的第一声音数据及基于ALSA架构的第二声音数据；从所述第二声音数据中识别出待播报语音及非待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声；将所述背景声静音；

所述框架层，具体用于从所述第二声音数据中识别出音频流类型为非通知流的非待播报语音；从所述第二声音数据中识别出音频流类型为通知流的待播报语音，并将所述非待播报语音及所述第一声音数据定义为背景声。

7.如权利要求6所述的背景声的静音系统，其特征在于，所述框架层包括音频策略管理器及音频策略执行器，所述背景声的静音系统还包括中间件；其中，

所述中间件，用于存储所述第一预设接口。

8.一种背景声的静音设备，其特征在于，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的背景声的静音程序，所述背景声的静音程序配置为实现如权利要求1至5中任一项所述的背景声的静音方法的步骤。

9.一种存储介质，其特征在于，所述存储介质上存储有背景声的静音程序，所述背景声的静音程序被处理器执行时实现如权利要求1至5中任一项所述的背景声的静音方法的步骤。