WO2020207132A1

WO2020207132A1 - 应用程序的音频数据的输出方法及显示设备

Info

Publication number: WO2020207132A1
Application number: PCT/CN2020/076488
Authority: WO
Inventors: 孙永瑞
Original assignee: 海信视像科技股份有限公司
Priority date: 2019-04-09
Filing date: 2020-02-24
Publication date: 2020-10-15
Also published as: CN110032357B; CN110032357A

Abstract

本公开实施例公开了一种应用程序的音频数据的输出方法及显示设备。该方法包括：在显示设备通过其音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；响应于所述第一输入指令，控制所述第一音频数据的输出音量被静音，并控制所述第二音频数据的输出音量保留；通过所述音频输出接口，输出被静音后的所述第一音频数据与保留输出音量后的所述第二音频数据的叠加数据。

Description

应用程序的音频数据的输出方法及显示设备

相关申请的交叉引用

本申请要求在2019年04月09日提交中国专利局、申请号为201910281617.8、申请名称为“应用程序的音频数据的输出方法及显示设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及音频技术领域，尤其涉及一种应用程序的音频数据的输出方法及显示设备。

背景技术

为了满足用户个性化需求，显示设备不仅可以为用户提供通过广播信号接收发送的各种传统直播节目内容，而且可以为用户提供由内容服务商提供的诸如视频点播、网络游戏、视频聊天等各种应用和服务内容。

在提供上述各种内容的同时，显示设备可以基于用户对诸如遥控器、移动终端等控制装置上的物理硬键或虚拟键的操作而被控制执行与上述各种内容关联的功能，也可以通过自身的麦克风或控制装置上的麦克风接收的用户输入的语音而被控制执行上述各种内容关联的功能。

发明内容

本公开实施例提供一种应用程序的音频数据的输出方法及显示设备，用以实现显示设备中同一时刻仅播放一个应用程序的音频数据，以提高用户听感体验。

第一方面，本公开实施例提供了一种显示设备中应用程序的音频数据的输出方法。

该方法包括：在显示设备通过所述显示设备的音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；响应于所述第一输入指令，控制所述第一音频数据的输出音量被静音，并控制所述第二音频数据的输出音量保留；通过所述音频输出接口，输出被静音后的所述第一音频数据与保留输出音量后的所述第二音频数据的叠加数据。

在一些实施例中，所述方法还包括：在接收到所述第一输入指令之后，确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点；响应于所述第二应用程序需要获取所述音频焦点，修改所述第二音频数据对应的音频流类型。

在一些实施例中，所述确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点，包括：确定所述第二应用程序的包名；判断预存的需要获取所述音频焦点的应用程序的白名单中，是否存在所述第二应用程序的包名；若所述白名单中存在所述第二应用程序的包名，确定所述第二应用程序需要获取所述音频焦点。

在一些实施例中，所述第二应用程序包括语音助手应用程序。

在一些实施例中，所述方法还包括：在接收到所述第一输入指令之后，确定是否存在第三音频数据对应的音频流类型被修改的第三应用程序；响应于存在所述第三应用程序，保留所述第三应用程序的所述第三音频数据对应的音频流类型的音量，静音除所述第三应用程序之外的其它应用程序的音频数据对应的音频流类型的音量。

在一些实施例中，所述第三应用程序为所述第二应用程序。

在一些实施例中，所述方法还包括：接收用于停止播放所述第二音频数据的第二输入指令；响应于所述第二输入指令，控制所述第一音频数据的输出音量，由静音恢复至接收用于播放所述第二音频数据的第一输入指令之前的音量；通过所述音频输出接口，输出恢复输出音量后的所述第一音频数据。

第二方面，本公开实施例提供了一种显示设备中应用程序的音频数据的输出方法。

该方法包括：在显示设备通过所述显示设备的音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；响应于所述第一输入指令，通过所述音频输出接口，输出所述第二音频数据，不输出所述第一音频数据。

在一些实施例中，所述方法还包括：在接收所述第一输入指令之后，确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点；响应于所述第二应用程序需要获取所述音频焦点，将所述操作系统的音频焦点标记为被所述第二应用程序占用。

在一些实施例中，所述方法还包括：在接收所述第一输入指令之后，确定当前所述显示设备中的操作系统的音频焦点是否被其他应用程序占用；响应于所述音频焦点被所述其他应用程序占用，不向所述音频输出接口输出所述第二音频数据；响应于所述音频焦点没有被所述其他应用程序占用，向所述音频输出接口输出所述第二音频数据。

在一些实施例中，所述方法还包括：接收用于停止播放所述第二音频数据的第二输入指令；响应于所述第二输入指令，通过所述音频输出接口，控制恢复输出所述第一音频数据。

第三方面，本公开实施例提供一种显示设备。该显示设备包括用户接口、音频输出接口、存储器，以及控制器。

所述存储器，与所述用户接口和所述音频输出接口通信，被配置为存储计算机程序、所述用户接口关联的指令，以及所述音频输出接口关联的音频数据。

所述控制器，与所述用户接口、所述音频输出接口以及所述存储器通信，被配置为运行所述计算机程序和/或所述指令使得所述显示设备：在显示设备通过所述显示设备的音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；响应于所述第一输入指令，控制所述第一音频数据的输出音量被静音，并控制所述第二音频数据的输出音量保留；通过所述音频输出接口，输出被静音后的所述第一音频数据与保留输出音量后的所述第二音频数据的叠加数据。

在一些实施例中，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：在接收到所述第一输入指令之后，确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点；响应于所述第二应用程序需要获取所述音频焦点，修改所述第二音频数据对应的音频流类型。

在一些实施例中，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：确定所述第二应用程序的包名；判断预存的需要获取所述音频焦点的应用程序的白名单中，是否存在所述第二应用程序的包名；若所述白名单中存在所述第二应用程序的包名，确定所述第二应用程序需要获取所述音频焦点。

在一些实施例中，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：在接收到所述第一输入指令之后，确定是否存在第三音频数据对应的音频流类型被修改的第三应用程序；响应于存在所述第三应用程序，保留所述第三应用程序的所述第三音频数据对应的音频流类型的音量，静音除所述第三应用程序之外的其它应用程序的音频数据对应的音频流类型的音量。

在一些实施例中，所述第三应用程序为所述第二应用程序。

在一些实施例中，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：接收用于停止播放所述第二音频数据的第二输入指令；响应于所述第二输入指令，控制所述第一音频数据的输出音量，由静音恢复至接收用于播放所述第二音频数据的第一输入指令之前的音量；通过所述音频输出接口，输出恢复输出音量后的所述第一音频数据。

第四方面，本公开实施例提供了一种显示设备。该显示设备包括用户接口、音频输出接口、存储器，以及控制器。

所述存储器，与所述用户接口和所述音频输出接口通信，被配置为存储有计算机程序、所述用户接口关联的指令，以及所述音频输出接口关联的音频数据。

所述控制器，与所述用户接口、所述音频输出接口以及所述存储器通信，被配置为运行所述计算机程序和/或所述指令使得所述显示设备：在显示设备通过所述显示设备的音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；响应于所述第一输入指令，通过所述音频输出接口，输出所述第二音频数据，不输出所述第一音频数据。

在一些实施例中，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：在接收所述第一输入指令之后，确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点；响应于所述第二应用程序需要获取所述音频焦点，将所述操作系统的音频焦点标记为被所述第二应用程序占用。

在一些实施例中，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：在接收所述第一输入指令之后，确定当前所述显示设备中的操作系统的音频焦点是否被其他应用程序占用；响应于所述音频焦点被所述其他应用程序占用，不向所述音频输出接口输出所述第二音频数据；响应于所述音频焦点没有被所述其他应用程序占用，向所述音频输出接口输出所述第二音频数据。

在一些实施例中，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：接收用于停止播放所述第二音频数据的第二输入指令；响应于所述第二输入指令，通过所述音频输出接口，控制恢复输出所述第一音频数据。

第五方面，本公开实施例提供了一种非易失性计算机可读的存储介质，所述存储介质上存储有计算机程序，所述计算机程序被显示设备的处理器执行时实现如第一方面或第二方面所述的方法。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1A示例性示出了显示设备200与控制装置100之间操作场景的示意图；

图1B示例性示出了图1A中控制装置100的配置框图；

图1C示例性示出了图1A中显示设备200的配置框图；

图1D示例性示出了显示设备200存储器中操作系统的架构配置框图；

图2示出了显示设备中各应用程序的音频数据输出的架构示意图；

图3A示出了第一种显示设备中应用程序的音频数据的输出控制方法流程图；

图3B示出了第二种显示设备中应用程序的音频数据的输出控制方法的流程图；

图4A示出了第三种显示设备中应用程序的音频数据的输出控制方法的流程图；

图4B示出了第四种显示设备中应用程序的音频数据的输出控制方法的流程图。

具体实施方式

为了使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开作进一步地详细描述。显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。

基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本公开保护的范围。此外，虽然本公开中公开内容按照示范性一个或几个实例来介绍，但应理解，可以就这些公开内容的各个方面也可以单独构成一个完整技术方案。

应当理解，本公开中使用的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的那些组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

本公开中使用的术语“模块”，是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

本公开中使用的术语“手势”，是指用户通过一种手型的变化或手部运动等动作，用于表达预定想法、动作、目的和/或结果的用户行为。

图1A示例性示出了显示设备200与控制装置100之间操作场景的示意图。如图1A所示，控制装置100和显示设备200之间可以有线或无线方式进行通信。

控制装置100被配置为控制显示设备200。控制装置100可接收用户输入的操作指令，并将该操作指令转换为显示设备200可识别和响应的指令，起着实现用户与显示设备200之间信息交互的中介作用。

在一些实施例中，用户通过操作控制装置100上的频道增加或频道减少键，来向显示设备200发出控制频道加减的指令，而显示设备200接收并响应该指令，执行频道加减的操作。

控制装置100可以是遥控器100A。遥控器100A可以实现红外协议通信，蓝牙协议通信，或其他短距离通信等通信方式。遥控器100A通过无线或其他有线方式来控制显示设备200。用户可以通过遥控器100A上的物理或者虚拟按键、语音接口、控制面板接口等，输入用户指令，来控制显示设备200。

一些实施例中，用户可以通过遥控器100A上的音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等物理或虚拟按键，输入相应的控制指令，来控制显示设备200。

控制装置100也可以是智能设备，如移动终端100B、平板电脑、计算机、笔记本电脑等。例如，用户可以通过智能设备上运行的应用程序，来控制显示设备200。用户可以对该应用程序进行配置。配置后的应用程序可以被投射到与智能设备相关联的屏幕上，使得用户可以通过直观的用户界面(UI)，控制显示设备200。

在一些实施例中，移动终端100B与显示设备200安装相同和/或相关联的软件应用，使得两者可以通过网络通信协议实现通信，进而达到一对一控制操作和数据通信的目的。

在一些实施例中，移动终端100B与显示设备200之间可以建立控制指令协议。用户通过操作移动终端100B的用户界面的各种物理或虚拟按键，来实现相应功能。例如，用户操作遥控器100A上布置的物理按键，实现与该物理按键对应的的功能；或者，移动终端100B上显示的音视频内容能够传输到显示设备200中，从而实现同步显示功能。

显示设备200可提供广播接收功能，计算机支持功能等网络电视功能。显示设备200可以实施为数字电视、网络电视、互联网协议电视(IPTV)等。

显示设备200可以是液晶显示器、有机发光显示器、投影设备。具体显示设备类型、尺寸大小和分辨率等，本申请实施例中不作限定。

显示设备200与服务器300通过多种通信方式进行数据通信。在一些实施例中，显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。

服务器300向显示设备200提供各种内容和互动。

在一些实施例中，显示设备200可以发送和接收信息。

例如，显示设备200接收电子节目指南(Electronic Program Guide，EPG)数据、软件程序更新等，或访问远程储存的数字媒体库。

服务器300可以一组，也可以多组，可以一类或多类服务器。通过服务器300提供视频点播和广告服务等网络服务内容。

图1B中示例性示出了控制装置100的配置框图。如图1B所示，控制装置100包括控制器110、存储器120、通信器130、用户输入接口140、输出接口150、供电电源160。

控制器110包括随机存取存储器(Random Access Memory，RAM)111、只读存储器(Read-Only Memory，ROM)112、处理器113、通信接口(未示出)以及通信总线(未示出)。

控制器110用于控制控制装置100的运行和操作，以及内部各部件之间的通信协作、外部和内部的数据处理。

在一些实施例中，当检测到用户按压在遥控器100A上布置的按键的交互，或触摸在遥控器100A上布置的触摸面板的交互时，控制器110可产生与检测到的交互相应的控制信号，并将该控制信号发送到显示设备200。

存储器120，用于在控制器110的控制下，存储驱动和控制控制装置100的各种运行程序、数据和应用。

存储器120，可以存储用户输入的各类控制信号指令。

通信器130在控制器110的控制下，实现与显示设备200之间控制信号和数据信号的通信。

在一些实施例中，控制装置100通过通信器130向显示设备200发送触摸信号，按钮信号等控制信号。控制装置100通过通信器130接收由显示设备200发出的信号。

通信器130包括红外信号接口131和射频信号接口132。

在一些实施例中，当通信器130包括红外信号接口时，通信器130需要将用户输入指令，按照红外控制协议转化为红外控制信号，然后经红外发送电路发送至显示设备200。

在一些实施例中，当通信器130包括射频信号接口时，通信器130需将用户输入指令转化为数字信号，然后按照射频控制信号调制协议进行调制后，由射频发送端子发送至显示设备200。

用户输入接口140包括麦克风141、触摸板142、传感器143、按键144等中至少一者，从而用户可以通过语音、触摸、手势、按压等操作，将控制显示设备200的用户指令，输入到控制装置100。

输出接口150，通过将用户输入接口140接收的用户指令输出至显示设备200，或者，输出由显示设备200接收的图像或语音信号。

输出接口150包括LED接口151、产生振动的振动接口152、输出声音的声音输出接口153，和输出图像的显示器154等。

例如，遥控器100A可从输出接口150接收音频、视频或数据等输出信号，并且将该输出信号在显示器154上显示为图像形式，在声音输出接口153输出为音频形式，或在振动接口152输出为振动形式。

供电电源160，用于在控制器110的控制下为控制装置100内的各元件提供运行电力支持。供电电源160被配置为电池及相关控制电路。

图1C中示例性示出了显示设备200的硬件配置框图。如图1C所示，显示设备200中可以包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、存储器260、用户接口265、视频处理器270、显示器275、音频处理器280、音频输入接口285、供电电源290。

调谐解调器210，通过有线或无线方式接收广播电视信号，可以进行放大、混频和谐振等调制解调处理，用于从多个无线或有线广播电视信号中解调出用户所选择的电视频道的频率中所携带的音视频信号，以及附加信息(例如EPG数据)。

调谐解调器210，可根据用户选择，以及由控制器250控制，响应用户选择的电视频道的频率以及该频率所携带的电视信号。

调谐解调器210，根据电视信号的广播制式不同，可以接收信号的途径有很多种，诸如：地面广播、有线广播、卫星广播或互联网广播等；以及根据调制类型不同，可以数字调制方式或模拟调制方式；以及根据接收电视信号的种类不同，可以解调模拟信号和数字信号。

在其他一些示例性实施例中，调谐解调器210也可在外部设备中，如外部机顶盒等。这样，机顶盒通过调制解调后输出电视信号，经过外部装置接口240输入至显示设备200中。

通信器220，是用于根据各种通信协议与外部设备，如外部服务器等，进行通信的组件。

例如显示设备200可将内容数据发送至经由通信器220连接的外部设备，或者，从经由通信器220连接的外部设备浏览和下载内容数据。

通信器220包括WIFI模块221、蓝牙通信协议模块222、有线以太网通信协议模块223等网络通信协议模块或近场通信协议模块，从而通信器220可根据控制器250的控制，接收控制装置100的控制信号，并将控制信号实现为WIFI信号、蓝牙信号、射频信号等。

检测器230，是显示设备200用于采集外部环境或与外部交互的信号的组件。检测器230可以包括声音采集器231，如麦克风。检测器230用于接收用户声音对应的语音信号，如用户控制显示设备200的控制指令对应的语音信号；或者，检测器230可以采集用于识别环境场景类型的环境声音，实现显示设备200可以自适应环境噪声。

在一些实施例中，检测器230，包括图像采集器232，如相机、摄像头等。检测器230用于采集外部环境场景，以自适应变化显示设备200的显示参数；以及用于采集用户的属性，或与用户进行手势交互，以实现显示设备与用户之间互动的功能。

在一些实施例中，检测器230，包括光接收器，用于采集环境光线强度，以自适应显示设备200的显示参数变化等。

在一些实施例中，检测器230，包括温度传感器，如通过感测环境温度，显示设备200可自适应调整图像的显示色温。

在一些实施例中，在温度偏高的环境中，可调整显示设备200显示图像色温偏冷色调；在温度偏低的环境中，可以调整显示设备200显示图像色温偏暖色调。

外部装置接口240，是提供控制器210，控制显示设备200与外部设备间数据传输的组件。

外部装置接口240可按照有线/无线方式，与诸如机顶盒、游戏装置、笔记本电脑等外部设备连接，可接收外部设备的诸如视频信号(例如运动图像)、音频信号(例如音乐)、附加信息(例如EPG)等数据。

其中，外部装置接口240包括：高清多媒体接口(High Definition Multimedia Interface，HDMI)端子241、复合视频消隐同步(Composite Video Broadcast Signal，CVBS)端子242、模拟或数字分量端子243、通用串行总线(USB)端子244、组件(Component)端子(未示出)、红绿蓝(RGB)端子(未示出)等中的任一个或多个。

控制器250，通过运行存储在存储器260上的各种软件控制程序(如操作系统和各种应用程序)，来控制显示设备200的工作和响应用户的操作。

如图1C所示，控制器250包括RAM251、ROM252、图形处理器253、中央处理器(Central Processing Unit，CPU)处理器254、通信接口255、以及通信总线256。

其中，RAM251、ROM252以及图形处理器253、CPU处理器254通信接口255通过通信总线256相连接。

ROM252，用于存储各种系统启动指令。如在接收到开机信号时，显示设备200的电源开始启动，CPU处理器254运行ROM252中的系统启动指令，将存储在存储器260的操作系统拷贝至RAM251中，以开始运行启动操作系统。当操作系统启动完成后，CPU处理器254再将存储器260中各种应用程序拷贝至RAM251中，然后，开始运行启动各种应用程序。

图形处理器253，用于产生各种图形对象，如图标、操作菜单、以及用户输入指令显示图形等。图形处理器253可以包括运算器，用于通过接收用户输入各种交互指令进行运算，进而根据显示属性显示各种对象；以及包括渲染器，用于产生基于运算器得到的各种对象，将进行渲染的结果显示在显示器275上。

CPU处理器254，用于执行存储在存储器260中的操作系统和应用程序指令。以及根据接收的用户输入指令，来执行各种应用程序、数据和内容的处理，以便最终显示和播放各种音视频内容。

在一些示例性实施例中，CPU处理器254，可以包括多个处理器。多个处理器可包括一个主处理器以及多个或一个子处理器。主处理器，用于在显示设备预加载模式中执行显示设备200的一些初始化操作，和/或，在正常模式下显示画面的操作。多个或一个子处理器，用于执行在显示设备待机模式等状态下的一种操作。

通信接口255，可包括第一接口到第n接口。这些接口可以是经由网络被连接到外部设备的网络接口。

控制器250可以控制显示设备200的整体操作。例如：响应于接收到用于选择在显示器275上显示的图形用户界面(Graphical User Interface，GUI)对象的用户输入命令，控制器250便可以执行与由用户输入命令选择的对象有关的操作。

其中，该对象可以是可选对象中的任何一个，例如超链接或图标。该与所选择的对象有关的操作，例如显示连接到超链接页面、文档、图像等操作，或者执行与对象相对应的程序的操作。该用于选择GUI对象的用户输入命令，可以是通过连接到显示设备200的各种输入装置，输入命令或者与由用户说出语音相对应的语音命令。例如，输入装置可以是鼠标、键盘、触摸板等。

存储器260，用于存储驱动和控制显示设备200运行的各种类型的数据、软件程序或应用程序。存储器260可以包括易失性和/或非易失性可读存储器。而术语“存储器”包括存储器260、控制器250的RAM251和ROM252、或显示设备200中的存储卡。

在一些实施例中，存储器260具体用于存储驱动显示设备200中控制器250的运行程序；存储显示设备200内置的和用户从外部设备下载的各种应用程序；存储用于配置由显示器275提供的各种GUI、与GUI相关的各种对象及用于选择GUI对象的选择器的视觉效果图像等数据。

在一些实施例中，存储器260具体用于存储调谐解调器210、通信器220、检测器230、外部装置接口240、视频处理器270、显示器275、音频处理器280等的驱动程序和相关数据，从外部装置接口接收的外部数据(例如音视频数据)或用户接口接收的用户数据(例如按键信息、语音信息、触摸信息等)。

在一些实施例中，存储器260具体存储用于表示操作系统(OS)的软件和/或程序，这些软件和/或程序可包括，例如：内核、中间件、应用编程接口(API)和/或应用程序。示例性的，内核可控制或管理系统资源，以及其它程序所实施的功能(如所述中间件、API或应用程序)；同时，内核可以提供接口，以允许中间件、API或应用程序访问控制器，以实现控制或管理系统资源。

图1D中示例性示出了显示设备200存储器中操作系统的架构配置框图。该操作系统架构从上到下依次是应用层、框架层和内核层。

应用层，系统内置的应用程序以及非系统级的应用程序都是属于应用层。负责与用户进行直接交互。应用层可包括多个应用程序，如直播电视应用程序、视频点播应用程序、媒体中心应用程序、截图应用程序等。

直播电视应用程序，可以通过不同的信号源提供直播电视。例如，直播电视应用程可以使用来自有线电视、无线广播、卫星服务或其他类型的直播电视服务的输入提供电视信号。以及，直播电视应用程序可在显示设备200上显示直播电视信号的视频。

视频点播应用程序，可以提供来自不同存储源的视频。不同于直播电视应用程序，视频点播提供来自某些存储源的视频显示。例如，视频点播可以来自云存储的服务器端、来自包含已存视频节目的本地硬盘储存器。

媒体中心应用程序，可以提供各种多媒体内容播放的应用程序。例如，媒体中心，可以为不同于直播电视或视频点播，用户可通过媒体中心应用程序访问存储器内存储的各种图像或音视频。

截图应用程序，可以对显示器上当前显示画面进行截图，并对画面截图图像中包含的识别物(如人物、频道台标、建筑等)进行诸如标识识别框、名称等的标注，以为用户提供显示画面中包含的各种识别物信息的展示功能。当前显示画面，可以是文字、图像、视频中的至少一个。

框架层，负责提供应用层所需要的API。例如，直播电视应用程序、视频点播应用程序、媒体中心应用程序可通过框架层提供的接口调用解码器进行音视频解码。又如，截图应用程序可通过框架层提供的接口调用已截取的当前显示画面的截图图像。

内核层，提供核心系统服务，例如：文件管理、内存管理、进程管理、网络管理、系统安全权限管理等服务。内核层可以被实现为基于各种操作系统的内核，例如，基于安卓操作系统的内核。

内核也同时提供系统软件和硬件之间的通信，为各种硬件提供设备驱动服务，例如：为显示器提供显示驱动程序、为摄像头提供摄像头驱动程序、为遥控器提供按键驱动程序、为WIFI模块提供WiFi驱动程序、为音频输出接口提供音频驱动程序、为电源管理(PM)模块提供电源管理驱动等。

用户接口265，接收各种用户交互。具体的，用于将用户的输入信号发送给控制器250，或者，将从控制器250的输出信号传送给用户。示例性的，遥控器100A可将用户输入的诸如电源开关信号、频道选择信号、音量调节信号等输入信号发送至用户接口265，再由用户接口265转送至控制器250；或者，遥控器100A可接收经控制器250处理从用户接口265输出的音频、视频或数据等输出信号，并且显示接收的输出信号或将接收的输出信号输出为音频或振动形式。

在一些实施例中，用户可在显示器275上显示的GUI输入用户命令，则用户接口265通过GUI接收用户输入命令。确切的说，用户接口265可接收用于控制选择器在GUI中的位置以选择不同的对象或项目的用户输入命令。

或者，用户可通过输入特定的声音或手势进行输入用户命令，则用户接口265通过传感器识别出声音或手势，来接收用户输入命令。视频处理器270，用于接收外部的视频信号，根据输入信号的标准编解码协议，进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频数据处理，可得到直接在显示器275上显示或播放的视频信号。

示例的，视频处理器270，包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等。

其中，解复用模块，用于对输入音视频数据流进行解复用处理，如输入MPEG-2流(基于数字存储媒体运动图像和语音的压缩标准),则解复用模块将其进行解复用成视频信号和音频信号等。

视频解码模块，用于对解复用后的视频信号进行处理，包括解码和缩放处理等。

图像合成模块，如图像合成器，其用于将图形生成器根据用户输入或自身生成的GUI信号，与缩放处理后视频图像进行叠加混合处理，以生成可供显示的图像信号。

帧率转换模块，用于对输入视频的帧率进行转换，如将输入的60Hz视频的帧率转换为120Hz或240Hz的帧率，通常的格式采用如插帧方式实现。

显示格式化模块，用于将帧率转换模块输出的信号，改变为符合诸如显示器显示格式的信号，如将帧率转换模块输出的信号进行格式转换以输出RGB数据信号。

显示器275，用于接收源自视频处理器270输入的图像信号，进行显示视频内容、图像以及菜单操控界面。显示视频内容，可以来自调谐解调器210接收的广播信号中的视频内容，也可以来自通信器220或外部装置接口240输入的视频内容。显示器275，同时显示显示设备200中产生且用于控制显示设备200的用户操控界面UI。

以及，显示器275可以包括用于呈现画面的显示屏组件以及驱动图像显示的驱动组件。或者，倘若显示器275为一种投影显示器，还可以包括一种投影装置和投影屏幕。

音频处理器280，用于接收外部的音频信号，根据输入信号的标准编解码协议，进行解压缩和解码，以及降噪、数模转换、和放大处理等音频数据处理，得到可以在扬声器286中播放的音频信号。

示例性的，音频处理器280可以支持各种音频格式。例如MPEG-2、MPEG-4、高级音频编码(AAC)、高效AAC(HE-AAC)等格式。

音频输出接口285，用于在控制器250的控制下接收音频处理器280输出的音频信号，音频输出接口285可包括扬声器286，或输出至外接设备的发生装置的外接音响输出端子287，如耳机输出端子。

在一些实施例中，视频处理器270可以包括一个或多个芯片组成。音频处理器280，也可以包括一个或多个芯片组成。

以及，在其他一些示例性实施例中，视频处理器270和音频处理器280，可以为单独的芯片，也可以与控制器250一起集成在一个或多个芯片中。

供电电源290，用于在控制器250的控制下，将外部电源输入的电力为显示设备200提供电源供电支持。供电电源290可以是安装在显示设备200内部的内置电源电路，也可以是安装在显示设备200外部的电源。需要说明的是，在上述图1A-1D的基础上，显示设备可以通过自身的声音采集器231(可实现为麦克风)或控制装置上的麦克风141接收用户输入的语音，而被控制执行其提供的各种内容所需的功能。

其中，显示设备内可设置语音助手应用程序，用于提供显示设备和用户之间的语音交互，从而实现用户通过语音控制显示设备执行各种功能。

例如，用户通过按压控制装置上的语音键的同时发出“查询某地天气预报”的语音，控制装置上的麦克风接收并识别该语音后传送至显示设备，显示设备可以响应于该语音指令，启动语音助手应用程序，并通过语音助手应用程序向服务器查询某地天气预报信息，进而在显示器上展示查询的天气预报信息，以及在音频输出接口播报查询的天气预报信息。

又如，用户发出“我要看某明星的电影”的语音，显示设备上的麦克风接收并识别该语音后，可以响应于该语音指令，启动语音助手应用程序，并通过语音助手应用程序向服务器查询某明星饰演的电影信息，进而在显示器上展示查询的电影信息，以及在音频输出接口播报查询的电影信息。

然而，例如，在显示设备正在播放一视频点播应用程序提供的音视频内容的过程中，用户需要对显示设备执行上述语音控制功能，此时，音频输出接口通常同时输出通过视频点播应用程序提供的音视频内容的声音、以及用户与显示设备之间通过语音助手应用程序进行交互而产生的声音，这样，实际上用户此时更关注与显示设备的语音交互，而非观看音视频内容，从而使得用户不易区分出语音助手应用程序输出的声音，不符合用户当前执行操作的用户意图。同时，由于麦克风不仅仅采集到用户输入语音，也可以采集到音视频内容的声音，一定程度上影响语音识别的准确率和效率。

因此，本实施例提供一种显示设备中应用程序的音频数据的输出控制方法，旨在上述示例中控制音频输出接口仅播放语音助手应用程序的音频数据，而不播放视频点播应用程序的音频数据，从而符合用户操作意图，提高用户听感体验。

本实施例中以图1D中存储器中的操作系统是安卓操作系统为例，对显示设备中各应用程序的音频数据的输出控制方法进行描述。

图2示出了显示设备中各应用程序的音频数据输出的架构示意图。

下面首先对本实施中涉及的安卓操作系统中的相关术语进行解释。

App：应用程序，指需要将音频数据输出到音频输出接口(如扬声器)的应用程序。

Audiotrack：回放通路，指应用程序向显示设备申请的传输音频数据的通路。这里，每个应用程序需要申请自身对应的传输音频数据的通路。

AudioMixer：混音单元，用于将各应用程序通过相应的AudioTrack传输的音频数据进行叠加处理。

StreamType：流类型，用于表示AudioTrack中传输的音频数据对应的音频流类型。例如音乐类型(Stream_music)、通知类型(Stream_notification)。

Volume：音量，具体为音频流类型的音量；这里，可以调用setStreamVolume()方法来直接设置音频流类型的音量大小。

Db：分贝(decibel)，用于度量音频强度的计量单位。

还需说明的是，安卓操作系统中，在显示设备播放一App的音频数据时，也即该App使用诸如AudioMixer、音频输出接口等音频资源时，需要先向显示设备的操作系统申请音频焦点(AudioFocus)，在该App获得音频焦点之后才可以使用音频资源。

如图2所示，需要播放音频数据的App1～AppN，首先向显示设备的操作系统申请传输各自音频数据的AudioTrack1～AudioTrackN。之后通过申请的 AudioTrack将各自音频数据传输至AudioMixer进行混音；在混音过程中，AudioMixer依据各AudioTrack传输的音频数据的分贝值(Db)与音频流类型(StreamType)的音量(Volume)进行叠加处理(该叠加处理可以简述为Db*Volume算法)。最后，AudioMixer将混音后的音频数据通过音频驱动程序从音频输出接口(如扬声器)输出。

图3A-3B示出了显示设备中应用程序的音频数据的输出控制方法流程图。

结合图3A-3B来说，该方法包括以下步骤：

步骤S41：在播放App1和App2的过程中，接收到App3的播放指令。

步骤S42：App3向操作系统申请传输其音频数据的AudioTrack。

步骤S43：判断App3是否需要获取音频焦点；若是，则执行步骤S44；否则，结束流程。

步骤S44：修改操作系统为App3创建的AudioTrack3中传输的音频数据的StreamType3。

具体的，App3向操作系统申请AudioTrack时，框架层获取当前向操作系统申请AudioTrack进程的进程号，进而查询到该进程号对应的App3的包名。显示设备内可以预存需要获取音频焦点的应用程序至白名单中，例如将语音助手应用程序的包名设置在白名单中；且该白名单中的应用程序可以动态调整。这样，框架层通过将白名单中预存的应用程序的包名与申请AudioTrack进程对应的App3的包名进行比较，从而判断App3是否需要获取音频焦点。

例如，白名单中预存语音助手应用程序的包名。那么，框架层判断当前申请AudioTrack进程对应的App3的包名是语音助手应用程序时，确定App3需要获取音频焦点，进而修改为App3创建的AudioTrack3中传输的音频数据的StreamType3，如从Stream_music修改为Stream_special。

在一些实施例中，操作系统为App1到App3创建的AudioTrack中传输的音频数据的StreamType可以均为相同类型，如均为Stream_music。这样，将为App3创建的AudioTrack3中传输的音频数据的StreamType3由Stream_music 修改为Stream_special，可以便于后续在AudioMixer中混音时对该StreamType被修改的AudioTrack进行识别，从而作出相应处理。

框架层判断当前申请AudioTrack进程对应的App3的包名不是语音助手应用程序时，确定App3不需要获取音频焦点，则可不执行修改为App3创建的AudioTrack3中传输的音频数据的StreamType3的步骤。

步骤S45：判断参与混音的各AudioTrack中是否存在为App3创建的StreamType3被修改的AudioTrack3；若是，则执行步骤S46后再执行步骤S47；否则，直接执行步骤S47。

步骤S46：将除StreamType3被修改的AudioTrack3之外的其它AudioTrack中StreamType的音量静音。

步骤S47：将参与混音的各AudioTrack中的音频数据在AudioMixer中进行叠加。

步骤S48：将混音后的音频数据输出至音频输出接口。

具体的，在AudioMixer中进行混音时，参与混音的AudioTrack1～AudioTrack3中，框架层判断存在音频数据的StreamType3被修改的为App3创建的AudioTrack3、同时该AudioTrack3处于激活状态时，将AudioTrack1中音频数据的StreamType1和AudioTrack2中音频数据的StreamType2的音量(Volume)进行静音(即分别调用setStreamVolume()方法将StreamType1和StreamType2的音量设置为0)，将AudioTrack3中音频数据的StreamType3的音量进行保留，这样在将参与混音的AudioTrack1～AudioTrack3中的音频数据按照Db*Volume算法进行叠加处理时，得出一混音数据(包括静音后的App1～AudioTrack2的音频数据和未作静音的App3的音频数据)，从而用户从音频输出接口仅能听到App3的音频数据，符合用户当前的操作意图，提高了用户的听感体验。

框架层判断不存在音频数据的StreamType3被修改的为App3创建的AudioTrack3时，直接将参与混音的AudioTrack1～AudioTrack3中的音频数据按照Db*Volume算法进行叠加处理，这样得出多个应用程序的音频数据，从而用户从音频输出接口听到多个应用程序的音频数据。

这里，框架层判断AudioTrack是否处于激活状态，具体指框架层判断App是否向其申请的AudioTrack传输音频数据。若App向其申请的AudioTrack传输音频数据，则该AudioTrack处于激活状态；否则，该AudioTrack处于非激活状态。

此外，在步骤S45中，框架层判断为App3创建的StreamType3被修改的AudioTrack3切换为非激活状态或者已销毁(如显示设备接收到停止播放App3的指令时执行退出App3的步骤后)，则框架层将步骤S46中其它AudioTrack中StreamType的音量进行解静音，也即将其它AudioTrack中StreamType的音量恢复为静音之前的级别(即分别调用setStreamVolume()方法将StreamType1和StreamType2的音量恢复之前)，并且将参与混音的各AudioTrack中的音频数据进行叠加后，再输出至音频输出接口。

如上面实施例所述，应用层中各应用程序正常向其申请的AudioTrack中传输各自的音频数据，框架层在AudioMixer中，通过控制需要获取音频焦点的目标应用程序的音频数据的输出音量被保留、以及通过控制其他应用程序的音频数据的输出音量被静音，之后将各应用程序的音频数据进行混音处理后输出至音频输出接口，这样用户从音频输出接口收听到的仅有保留输出音量的目标应用程序的音频数据，以符合用户当前的操作意图。图4A和图4B示出了显示设备中另一应用程序的音频数据的输出控制方法的流程图。结合图4A和图4B来说，该方法包括以下步骤。

步骤S51：在播放App1～App2的过程中，接收到App3的播放指令。

步骤S52：App3向操作系统申请传输其音频数据的AudioTrack。

步骤S53：判断App3是否需要获取音频焦点；若是，则执行步骤S54；否则，结束流程。

步骤S54：将用于指示当前获取音频焦点的标志focus flag修改成为App3创建的AudioTrack3的进程号。

例如，白名单中预存语音助手应用程序的包名。那么，框架层判断当前申请AudioTrack进程对应的App3的包名是语音助手应用程序时，确定App3需要获取音频焦点，进而将用于指示当前获取操作系统的音频焦点的标志focus flag修改成为App3创建的AudioTrack3的进程号，也即当前操作系统的音频焦点的focus flag被App3申请的AudioTrack3所激活，以表明当前是App3占用操作系统的音频焦点。

框架层判断当前申请AudioTrack进程对应的App3的包名不是语音助手应用程序时，确定App3不需要获取音频焦点，则可不执行修改用于指示当前获取音频焦点的标志focus flag的步骤。

步骤S55：判断用于指示当前获取音频焦点的标志focus flag是否被其他AudioTrack激活；若是，则执行步骤S56；否则，执行步骤S57。

步骤S56：向AudioMixer中传输空的音频数据。

步骤S57：向AudioMixer中传输真实的音频数据。

步骤S58：将参与混音的各AudioTrack中的音频数据在AudioMixer中进行叠加。

步骤S59：将混音后的音频数据输出至音频输出接口。

具体的，各AudioTrack在向AudioMixer传输音频数据时，框架层判断用于指示当前获取操作系统的音频焦点的标志focus flag是否被其他AudioTrack激活，从而判断是否向AudioMixer中传输真实的音频数据。

例如，App3(如语音助手应用程序)向操作系统申请AudioTrack后，操作系统为其创建AudioTrack3，并将用于指示当前获取操作系统的音频焦点的标志focus flag修改成AudioTrack3的进程号，以标记App3占用操作系统的音频焦点。

那么，App1申请的AudioTrack1向AudioMixer传输其音频数据时，框架层判断用于指示当前获取操作系统的音频焦点的标志focus flag被AudioTrack3激活，表明App1当前失去操作系统的音频焦点，则向AudioMixer中传输空的音频数据，具体可向AudioMixer中写入0x0数据。

同理，App2申请的AudioTrack2向AudioMixer传输其音频数据时，框架层判断用于指示当前获取操作系统的音频焦点的标志focus flag被AudioTrack3激活，表明App2当前失去操作系统的音频焦点，则向AudioMixer中传输空的音频数据，具体可向AudioMixer中写入0x0数据。

然而，App3申请的AudioTrack3向AudioMixer传输其音频数据时，框架层判断用于指示当前获取操作系统的音频焦点的标志focus flag被AudioTrack3占用，也即未被其他AudioTrack激活，表明App3当前占用操作系统的音频焦点，则向AudioMixer中传输由App3送至AudioTrack3的真实的音频数据。

这样，在将参与混音的AudioTrack1～AudioTrack3中的音频数据在AudioMixer中进行叠加时，由于App1申请的AudioTrack1和App2申请的AudioTrack2均将空的音频数据传输至AudioMixer，仅App3申请的AudioTrack3将真实的音频数据传输至AudioMixer，所以，混音后仅得出App3的音频数据，从而用户从音频输出接口仅能听到App3的音频数据，符合当前用户的操作意图，提高了用户的听感体验。

此外，在步骤S53中，框架层判断App3不再使用音频焦点(如显示设备接收到停止播放App 3的指令时执行退出App3的步骤后)时，则将用于指示当前获取音频焦点的标志focus flag去激活，也即将用于指示当前获取音频焦点的标志focus flag恢复为App3使用音频焦点之前，并且将参与混音的各AudioTrack中的音频数据进行叠加后，再输出至音频输出接口。

如上面实施例所述，应用层中各应用程序正常向其申请的AudioTrack中传输各自的音频数据，框架层中AudioTrack向AudioMixer传输音频数据过程中，通过控制向AudioMixer传输需要获取音频焦点的目标应用程序的音频数据、以及通过控制向AudioMixer不传输其他应用程序的音频数据，之后将目标应用程序的音频数据进行混音处理后输出至音频输出接口，这样用户从音频输出接口收听到的仅有保留的真实的目标应用程序的音频数据，以符合用户当前的操作意图。

在上述实施例中，显示设备通过控制音频输出接口仅输出目标应用程序的音频数据，不输出其他应用程序的音频数据，从而用户通过音频输出接口听到的仅有目标应用程序的音频数据，提高用户的听感体验。

在上述各实施例的基础上，本公开实施例还提供了一种计算机可读的非易失性存储介质，所述存储介质内存储有可由计算机执行的计算机程序，当所述程序在所述计算机上运行时，使得所述计算机执行时实现上述实施例中的任一一种方法。

上述计算机可读非易失性存储介质可以是服务器中的处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如光盘(CD)、数字通用光盘(DVD)、蓝光光盘(BD)、高清通用光盘(HVD)等、以及半导体存储器如ROM、可擦除可编程只读存储器(EPROM)、带电可擦除可编程只读存储器(EEPROM)、非易失性存储器(NAND FLASH)、固态硬盘(SSD)等。

对于系统/装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者一个操作与另一个实体或者另一个操作区分开来，而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全应用实施例、或结合应用和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本公开的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。

显然，本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样，倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包括这些改动和变型在内。

Claims

一种显示设备中应用程序的音频数据的输出方法，其特征在于，所述方法包括：

在显示设备通过所述显示设备的音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；

响应于所述第一输入指令，控制所述第一音频数据的输出音量被静音，并控制所述第二音频数据的输出音量保留；

通过所述音频输出接口，输出被静音后的所述第一音频数据与保留输出音量后的所述第二音频数据的叠加数据。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在接收到所述第一输入指令之后，确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点；

响应于所述第二应用程序需要获取所述音频焦点，修改所述第二音频数据对应的音频流类型。
根据权利要求2所述的方法，其特征在于，所述确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点，包括：

确定所述第二应用程序的包名；

判断预存的需要获取所述音频焦点的应用程序的白名单中，是否存在所述第二应用程序的包名；

若所述白名单中存在所述第二应用程序的包名，确定所述第二应用程序需要获取所述音频焦点。
根据权利要求3所述的方法，其特征在于，所述第二应用程序包括语音助手应用程序。
根据权利要求3所述的方法，其特征在于，所述方法还包括：

在接收到所述第一输入指令之后，确定是否存在第三音频数据对应的音频流类型被修改的第三应用程序；

响应于存在所述第三应用程序，保留所述第三应用程序的所述第三音频数据对应的音频流类型的音量，静音除所述第三应用程序之外的其它应用程序的音频数据对应的音频流类型的音量。
根据权利要求5所述的方法，其特征在于，所述第三应用程序为所述第二应用程序。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收用于停止播放所述第二音频数据的第二输入指令；

响应于所述第二输入指令，控制所述第一音频数据的输出音量，由静音恢复至接收用于播放所述第二音频数据的第一输入指令之前的音量；

通过所述音频输出接口，输出恢复输出音量后的所述第一音频数据。
一种显示设备中应用程序的音频数据的输出方法，其特征在于，所述方法包括：

在显示设备通过所述显示设备的音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；

响应于所述第一输入指令，通过所述音频输出接口，输出所述第二音频数据，不输出所述第一音频数据。
根据权利要求8所述的方法，其特征在于，所述方法还包括：

在接收所述第一输入指令之后，确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点；

响应于所述第二应用程序需要获取所述音频焦点，将所述操作系统的音频焦点标记为被所述第二应用程序占用。
根据权利要求8所述的方法，其特征在于，所述方法还包括：

在接收所述第一输入指令之后，确定当前所述显示设备中的操作系统的音频焦点是否被其他应用程序占用；

响应于所述音频焦点被所述其他应用程序占用，不向所述音频输出接口输出所述第二音频数据；

响应于所述音频焦点没有被所述其他应用程序占用，向所述音频输出接口输出所述第二音频数据。
根据权利要求8所述的方法，其特征在于，所述方法还包括：

接收用于停止播放所述第二音频数据的第二输入指令；

响应于所述第二输入指令，通过所述音频输出接口，控制恢复输出所述第一音频数据。
一种显示设备，其特征在于，包括用户接口、音频输出接口、存储器，以及控制器，其中，

所述存储器，与所述用户接口和所述音频输出接口通信，被配置为存储计算机程序、所述用户接口关联的指令，以及所述音频输出接口关联的音频数据；

所述控制器，与所述用户接口、所述音频输出接口以及所述存储器通信，被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

在显示设备通过所述显示设备的音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；

响应于所述第一输入指令，控制所述第一音频数据的输出音量被静音，并控制所述第二音频数据的输出音量保留；

通过所述音频输出接口，输出被静音后的所述第一音频数据与保留输出音量后的所述第二音频数据的叠加数据。
根据权利要求12所述的显示设备，其特征在于，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

在接收到所述第一输入指令之后，确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点；

响应于所述第二应用程序需要获取所述音频焦点，修改所述第二音频数据对应的音频流类型。
根据权利要求13所述的显示设备，其特征在于，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

确定所述第二应用程序的包名；

判断预存的需要获取所述音频焦点的应用程序的白名单中，是否存在所述第二应用程序的包名；

若所述白名单中存在所述第二应用程序的包名，确定所述第二应用程序需要获取所述音频焦点。
根据权利要求14所述的显示设备，其特征在于，所述第二应用程序包括语音助手应用程序。
根据权利要求14所述的显示设备，其特征在于，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

在接收到所述第一输入指令之后，确定是否存在第三音频数据对应的音频流类型被修改的第三应用程序；

响应于存在所述第三应用程序，保留所述第三应用程序的所述第三音频数据对应的音频流类型的音量，静音除所述第三应用程序之外的其它应用程序的音频数据对应的音频流类型的音量。
根据权利要求16所述的显示设备，其特征在于，所述第三应用程序为所述第二应用程序。
根据权利要求12所述的显示设备，其特征在于，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

接收用于停止播放所述第二音频数据的第二输入指令；

响应于所述第二输入指令，控制所述第一音频数据的输出音量，由静音恢复至接收用于播放所述第二音频数据的第一输入指令之前的音量；

通过所述音频输出接口，输出恢复输出音量后的所述第一音频数据。
一种显示设备，其特征在于，包括用户接口、音频输出接口、存储器，以及控制器，其中，

所述存储器，与所述用户接口和所述音频输出接口通信，被配置为存储有计算机程序、所述用户接口关联的指令，以及所述音频输出接口关联的音频数据；

所述控制器，与所述用户接口、所述音频输出接口以及所述存储器通信，被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

在显示设备通过所述显示设备的音频输出接口，播放一个或多个第一应用程序的第一音频数据的过程中，接收用于播放第二应用程序的第二音频数据的第一输入指令；

响应于所述第一输入指令，通过所述音频输出接口，输出所述第二音频数据，不输出所述第一音频数据。
根据权利要求19所述的显示设备，其特征在于，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

在接收所述第一输入指令之后，确定所述第二应用程序是否需要获取所述显示设备中的操作系统的音频焦点；

响应于所述第二应用程序需要获取所述音频焦点，将所述操作系统的音频焦点标记为被所述第二应用程序占用。
根据权利要求19所述的显示设备，其特征在于，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

在接收所述第一输入指令之后，确定当前所述显示设备中的操作系统的音频焦点是否被其他应用程序占用；

响应于所述音频焦点被所述其他应用程序占用，不向所述音频输出接口输出所述第二音频数据；

响应于所述音频焦点没有被所述其他应用程序占用，向所述音频输出接口输出所述第二音频数据。
根据权利要求19所述的显示设备，其特征在于，所述控制器还被配置为运行所述计算机程序和/或所述指令使得所述显示设备：

接收用于停止播放所述第二音频数据的第二输入指令；

响应于所述第二输入指令，通过所述音频输出接口，控制恢复输出所述第一音频数据。
一种非易失性计算机可读的存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被显示设备的处理器执行时实现如权利要求1-11中任一项所述的方法。