CN111383634B

CN111383634B - 根据基于声音的机制停用智能显示设备的显示器的方法及系统

Info

Publication number: CN111383634B
Application number: CN201910406053.6A
Authority: CN
Inventors: 姚旭晨
Original assignee: Baidu USA LLC
Current assignee: Baidu USA LLC
Priority date: 2018-12-28
Filing date: 2019-05-16
Publication date: 2024-04-02
Anticipated expiration: 2039-05-16
Also published as: CN111383634A; JP7190982B2; JP2020109608A; US20200210139A1; KR20200083154A; KR102223268B1; US10817246B2

Abstract

提供了根据基于声音的机制停用智能显示设备的显示器的方法及系统。从声音捕获设备接收与所述智能显示设备相关联的声音所对应的信号。机器学习模型分析从所述声音捕获设备接收的所述信号的特征，以确定是否停用所述智能显示设备的显示器。响应于根据所述分析确定停用所述智能显示设备的所述显示器，停用所述智能显示设备的所述显示器。

Description

根据基于声音的机制停用智能显示设备的显示器的方法及系统

技术领域

本发明的实施例大体上涉及智能显示设备。更具体地，本发明的实施例涉及根据基于声音的机制停用智能显示设备的显示器。

背景技术

智能显示设备(如谷歌家居(Google Home)智能显示器或亚马逊回声显示(AmazonEcho Show)等)可以是语音助手智能音箱，该音箱包括集成的显示器或触摸屏显示器以向用户呈现信息。通过来自智能显示设备的用户的语音命令或者通过经由触摸屏显示器的、命令的物理输入，向智能设备提供命令和指令。然后，基于接收到的命令，智能显示设备的显示器可以经由显示器向用户呈现信息。

发明内容

根据本发明的实施例，提供了一种基于特征控制智能显示设备的计算机实施的方法，所述方法包括：从声音捕获设备接收与所述智能显示设备相关联的声音所对应的信号；由执行机器学习模型的处理设备分析从所述声音捕获设备接收的所述信号的多个特征，以确定是否停用所述智能显示设备的显示器；以及响应于根据所述分析确定停用所述智能显示设备的所述显示器，停用所述智能显示设备的所述显示器。

根据本发明的另一实施例，提供了一种非暂时性机器可读介质，所述非暂时性机器可读介质中存储有指令，所述指令在由处理器执行时使得所述处理器执行操作，所述操作包括：从声音捕获设备接收与智能显示设备相关联的声音所对应的信号；由机器学习模型分析从所述声音捕获设备接收的所述信号的多个特征，以确定是否停用所述智能显示设备的显示器；以及响应于根据所述分析确定停用所述智能显示设备的所述显示器，停用所述智能显示设备的所述显示器。

根据本发明的另一实施例，提供了一种系统，所述系统包括：处理器；以及存储器，所述存储器联接至所述处理器并且用于存储指令，所述指令在由所述处理器执行时使得所述处理器执行操作，所述操作包括：从声音捕获设备接收与智能显示设备相关联的声音所对应的信号；由执行机器学习模型的处理设备分析从所述声音捕获设备接收的所述信号的多个特征，以确定是否停用所述智能显示设备的显示器；以及响应于根据所述分析确定停用所述智能显示设备的所述显示器，停用所述智能显示设备的所述显示器。

附图说明

本发明的实施例在附图的各图中以举例而非限制的方式示出，附图中的相似的附图标记指示相似的元件。

图1是示出根据一个实施例的智能显示设备的显示器控制器的示例的框图。

图2是示出根据一个实施例的网络配置的框图。

图3是根据实施例的提供给算法控制模块以确定是否停用智能显示设备的显示器的特征的示例的图示。

图4是示出根据一个实施例的显示器关闭时间平滑化的过程的流程图。

图5是根据实施例的利用多个声音来源的声音角度来确定是否停用智能显示设备的显示器的示例的图示。

图6是示出根据一个实施例的基于与传入的声音相关联的信号的特征确定停用智能显示设备的显示器的过程的流程图。

图7是示出根据一个实施例的数据处理系统的框图。

具体实施方式

将参考以下所讨论的细节来描述本发明的各种实施例和方面，附图将示出所述各种实施例。下列描述和附图是对本发明的说明，而不应当解释为限制本发明。描述了许多特定细节以提供对本发明各种实施例的全面理解。然而，在某些情况下，并未描述众所周知的或常规的细节以提供对本发明的实施例的简洁讨论。

本说明书中对“一个实施例”或“实施例”的提及意味着结合该实施例所描述的特定特征、结构或特性可以包括在本发明的至少一个实施例中。短语“在一个实施例中”在本说明书中各个地方的出现不必全部指同一实施例。

因此，本发明的实施例提供了根据基于声音的机制停用智能显示设备的显示器的智能显示设备。正常情况下，只要开启了智能显示设备，智能显示设备就不会停用其显示器。无论用户是否在场，智能显示设备通常都会连续不断地在显示器上显示信息。然而，在一些情况下，智能显示设备的用户可能希望智能显示设备的显示器被停用(例如关闭)。例如，用户可能希望通过关闭显示器减少智能显示设备的耗电量。在另一示例中，当用户离开房屋或睡着时，用户可能希望关闭显示器。因此，设备的用户可以提供如“关闭屏幕”等语音命令，或者经由智能显示设备的触摸屏提供使显示器停用的输入。这些停用智能显示设备的显示器的方法较为繁琐和低效，并且在某些情况下可能无效。

本发明系统和方法的实施例通过根据基于声音的机制确定是否停用智能显示设备的显示器，提供了该任务的解决方案。智能显示设备可以包括声音捕获设备(如麦克风)，声音捕获设备可以捕获来自智能显示设备周围环境的、传入的声音，并生成与所捕获的声音对应的信号。声音捕获设备将与传入的声音对应的信号提供给智能显示设备的显示器控制器。

显示器控制器使用机器学习模型分析信号的特征，以确定是否停用智能显示设备的显示器。可以由显示器控制器分析的特征的示例包括(但不限于)声压、声压的变化、声音来源相对于智能显示设备的角度和任何包括在信号中的语音活动。特征可以用作机器学习模型的输入，以确定是否停用智能显示设备的显示器。如果机器学习模型基于特征的分析确定停用显示器，则显示器控制器可以停用智能显示设备的显示器。例如，显示器控制器可以向显示器发送使得显示器停用的信号。

因此，通过在机器学习模型中使用与声音捕获设备捕获的声音对应的信号的特征，智能显示设备的显示器控制器可以智能地确定何时停用智能显示设备的显示器，从而减少智能显示设备的耗电量。此外，通过智能地确定何时停用智能显示设备的显示器，可以不再要求用户提供停用显示器的语音命令或物理输入，从而提高了智能显示设备的用户体验。

图1是示出根据一个实施例的智能显示设备100的显示器控制器的示例的框图。参考图1，智能显示设备100包括(但不限于)可操作地联接至声音捕获设备105和显示器150的显示器控制器110。显示器控制器110可以以软件、硬件或其组合实施。例如，显示器控制器110的至少一些部件可以加载至存储器(例如，如动态RAM(DRAM)等的随机存取存储器(RAM))，并由智能显示设备100(未示出)的一个或多个处理器(例如，如中央处理单元(CPU)或通用处理单元(GPU)等的微处理器)的处理逻辑执行。显示器150可以是任意类型的显示器(如触摸屏显示器)，该显示器150配置为从显示器控制器110接收启用和停用的信号。

声音捕获设备105可以配置为捕获传入的声音，基于所捕获的声音生成信号，并将该信号发送至显示器控制器110。在实施例中，声音捕获设备105可以是可操作地联接至显示器控制器110的麦克风。在实施例中，声音捕获设备105可以是单个麦克风。在一些实施例中，声音捕获设备105可以是多个麦克风。例如，声音捕获设备105可以是麦克风阵列，该麦克风阵列包括以线形、三角形、方形或圆形布局排列的2到8个麦克风。

显示器控制器110可以包括声压确定模块115。声压确定模块115可以配置为利用发送的信号确定由声音捕获设备105接收的声音的声压。在实施例中，声压确定模块115可以确定多个时间段的声压。在实施例中，声压确定模块115可以确定与确定的多个时间段的声压相关联的分布统计。例如，声压确定模块115可以确定多个时间段的声压值的平均值和/或标准偏差。

显示器控制器110可以包括声压差模块120。声压差模块120可以配置为确定由声音捕获设备105接收的当前的声压级与先前确定的声压级之间的差值。在实施例中，声压差模块120可以确定当前的声压级与先前由声压确定模块115确定的声压级之间的差值。例如，声压差模块120可以确定当前的声压级与如前所述由声压确定模块115确定的、一时间段内的声压的平均值之间的差值。

显示器控制器110还可以包括声音角度确定模块125。声音角度确定模块125可以配置为确定由声音捕获设备105接收的声音的来源相对于声音捕获设备105的角度。例如，在实施例中，声音捕获设备105可以包括多个麦克风。可以将与来自多个麦克风的声音相对应的接收信号相互比较，以确定声音的来源相对于多个麦克风的角度。

显示器控制器110可以包括语音活动模块130。语音活动模块130可以配置为基于接收的信号确定传入的声音是否包括语音活动。例如，语音活动模块130可以确定接收的信号是否包括用于智能显示设备100的语音命令。在实施例中，语音活动模块130可以确定与接收的信号包括语音活动的可能性相对应的置信分数。例如，语音活动模块130可以确定从0.0到1.0的置信分数，该置信分数与接收信号包括语音活动的可能性相对应，其中0.0可以表示接收信号包括语音活动的最低可能性，而1.0可以表示接收信号包括语音活动的最高可能性。

在一些实施例中，语音活动模块130可以配置为识别与传入的声音相关联的一组用户中的特定用户。该组用户中的每个用户都可以提供一个或多个语音样本，以供语音活动模块130使用，随后识别来自每个用户的语音命令。例如，当用户A向智能显示设备100提供后续的语音命令时，语音活动模块130可以使用语音样本来识别语音命令，并且可以确定语音命令是由用户A提供的。

在实施例中，声压确定模块115、声压差模块120、声音角度确定模块125和/或语音活动模块130可以并行操作。在一些实施例中，声压确定模块115、声压差模块120、声音角度确定模块125和/或语音活动模块130可以按顺序操作。例如，声压差模块120可以向声音角度确定模块125提供数据，而声音角度确定模块125可以向语音活动模块130提供数据。

显示器控制器110可以包括屏幕状态模块140。屏幕状态模块140可以配置为提供指示是否启用(例如打开)或停用(例如关闭)显示器150的输出。显示器控制器110还可以包括关闭时间平滑化模块145。关闭时间平滑化模块145可以配置为确定启用和/或停用显示器150的频率。

显示器控制器110还可以包括算法控制模块135。算法控制模块135可以从声压确定模块115、声压差模块120、声音角度确定模块125和/或语音活动模块130接收数据。算法控制模块135可以配置为基于所接收的数据确定是否要启用或停用智能显示设备100的显示器150。在实施例中，算法控制模块135可以利用机器学习模型来确定是要启用还是要停用显示器150并确定置信分数。如将在图2进一步详细讨论的，在实施例中，可以从远程服务器接收机器学习模型。算法控制模块135可以使用的机器学习模型的示例包括(但不限于)线性模型、非线性模型、浅层模型和深层模型。在算法控制模块135确定显示器150将被启用/停用时，显示器控制器110可以通过向显示器150发送信号基于上述确定来停用显示器150。

图2是示出根据一个实施例的网络配置200的框图。参考图2，网络配置200包括智能显示设备210，该设备通过网络240通信地联接至服务器220。智能显示设备210可以对应于智能显示设备100，如先前在图1所描述的。服务器220可以是任意服务器，并且可以包括一个或多个处理设备(未示出)。服务器220可以可操作地联接至数据存储器230。数据存储器230可以是能够存储数据的永久性存储器。永久性存储器可以是本地存储单元或远程存储单元。永久性存储器可以是磁存储单元、光存储单元、固态存储单元、电子存储单元(主存储器)或类似的存储单元。永久性存储器也可以是单片式/单个的设备或分布式设备集。在实施例中，服务器220和数据存储器230可以是基于云的平台的组件。

网络240可以是公用网络(例如互联网)、专用网络(例如局域网(LAN)或广域网(WAN))或其组合。在一个实施例中，网络240可以包括有线或无线基础设施，基础设施可以由一个或多个无线通信系统提供，例如与网络240连接的无线保真(WiFi)热点和/或可以使用各种数据处理装置、通信塔(例如信号发射塔)等实现的无线载波系统。

服务器220的处理设备的处理逻辑可以配置为训练将由智能显示设备210的算法控制模块(例如图1的算法控制模块135)使用的机器学习模型。与智能显示设备不关联的样本数据(例如，先前从一个或多个不同的智能显示设备获取的数据)可以用作机器学习模型的训练集合。服务器220的处理逻辑可以使用样本数据执行机器学习模型。可以分析机器学习模型的输出以确定机器学习模型是否正常运行。在由处理逻辑训练机器学习模型之后，可以经由网络240将机器学习模型提供给智能显示设备210。

在一些实施例中，在接收到机器学习模型后，智能显示设备210的算法控制模块可以利用机器学习模型和与声音捕获设备发送的信号相关联的特征来确定是否要启用/停用智能显示设备的显示器。应当注意，在实施例中，在不经由网络240向服务器220提供与图像相关联的特征的情况下，由智能显示设备210的处理逻辑进行确定，以保护智能显示设备210的用户的隐私。

图3是根据实施例的提供给算法控制模块以确定是否停用智能显示设备的显示器的特征的示例的图示300。如前所述，可以将与从声音捕获设备接收的一个或多个信号相关联的特征提供给算法控制模块135。算法控制模块135可以将特征用作机器学习模型的输入，机器学习模型可以确定是否停用智能显示设备的显示器150。每个特征都可以影响机器学习模型对是否停用显示器150进行的确定。

在框305，显示器控制器可以确定接收的信号的声压，如前所述。算法控制模块135可以利用信号的声压来确定是否停用显示器150。例如，如果声压超过指示智能显示设备周围的活动的阈值量，则算法控制模块135确定停用显示器150的概率可能降低。在实施例中，显示器控制器可以确定一定时间段内的接收的信号的分布统计(例如平均值和标准偏差)。例如，显示器控制器可以确定：在前一天夜里平均声压为50分贝(dB)而标准偏差为3dB，在前一天白天平均声压为70dB而标准偏差为6dB，在前10分钟内平均声压为65dB而标准偏差为4dB，在前一小时内平均声压为65dB而标准偏差为5dB。在一些实施例中，显示器控制器可以利用分布统计来确定是否停用智能显示设备的显示器150。例如，如果当前的声压超过所确定的相对于平均值的标准偏差，则显示器控制器确定停用显示器150的概率可能降低。

在框310，显示器控制器可以确定来自声音捕获设备的接收的信号的声压级和先前信号的声压级之间的声压差。算法控制模块135可利用声压级的差来确定是否停用显示器150。例如，如果当前声压级与先前声压级之间的差值超过阈值，则算法控制模块135确定停用显示器150的概率可能降低。然而，如果当前的声压级与先前的声压级之间的差值低于阈值，则算法控制模块135确定停用显示器150的概率可能增加。

在框315，显示器控制器可以确定声音捕获设备的接收的信号的声音角度。声音角度可以与声音来源相对于声音捕获设备或智能显示设备的角度相对应。算法控制模块135可以利用声音角度来确定是否停用显示器150。例如，如果声音角度指示声音来源在智能显示设备的前方，则算法控制模块135确定停用显示器150的概率可能降低。然而，如果声音角度指示声音来源在智能显示设备的后方，则算法控制模块135确定停用显示器150的概率可能增加。将在下面的图5对关于利用声音角度确定是否停用显示器150的进一步的细节进行描述。

在框320，显示器控制器可以识别接收的信号中的语音活动。算法控制模块135可以利用信号中的语音活动来确定是否停用显示器150。例如，如果接收的信号包括语音活动，则算法控制模块135确定停用显示器150的概率可能降低。然而，如果接收的信号不包括语音活动，则算法控制模块135确定停用显示器150的概率可能增加。

应当注意，尽管图示300包括用于确定是否停用显示器150的、在框305、框310、框315和框320的特征，但是在实施例中可以利用更多或更少的特征来确定是否停用显示器150。

图4是示出根据一个实施例的显示器关闭时间平滑化的过程400的流程图。过程400可以由处理逻辑执行，处理逻辑可以包括软件、硬件或其组合。例如，过程400的一个或多个操作可以由图1的显示器控制器110的关闭时间平滑化模块145执行。

参考图4，在操作401中，基于与传入的声音相对应的接收的信号的特征，处理逻辑确定停用智能显示设备的显示器，如前所述。在操作402中，处理逻辑停用智能显示设备的显示器。

在操作403中，处理逻辑确定显示器是否已在操作402处的显示器停用的阈值量的时间内被启用。例如，处理逻辑可以确定显示器是否已经由用户在自显示器在操作402停用后的5分钟的阈值量的时间内启用。在阈值量的时间内启用显示器的用户可以指示处理逻辑在不适当的时间确定了停用显示器。因此，为了防止在不适当的时间停用显示器，在操作404中，如果显示器已经在阈值量的时间内被启用，则处理逻辑确定随后不停用显示器。在实施例中，处理逻辑可以确定随后在一段时间内不停用显示器。例如，处理逻辑可以确定随后一小时内不停用显示器。

如果显示器并未在阈值量的时间内启用，则在操作405中，处理逻辑确定随后停用显示器。在一些实施例中，可以将与先前在过程400中描述的确定相关联的数据提供给算法控制模块135。该数据可以由机器学习模型利用，以确定是否停用智能显示设备的显示器，如前所述。

图5是根据实施例的利用多个声音来源的声音角度来确定是否停用智能显示设备的显示器的示例的图示500。如前所述，与一个或多个声音来源相关联的声音角度可以由声音角度确定模块125确定，并且可以提供给算法控制模块135。算法控制模块135可以将声音角度用作机器学习模型的输入，机器学习模型可以确定是否停用智能显示设备的显示器150。

图示500包括智能显示设备510，智能显示设备510可以对应于图1的智能显示设备100。智能显示设备510包括具有朝向图5顶部的显示方向的显示器(未示出)。显示器可以具有可视角度520，可视角度520与可看见智能显示设备510的显示器的角度范围相对应。在实施例中，如果确定对于特定声音来源所确定的声音角度处于可视角度520内，则智能显示设备510的显示器控制器(未示出)确定停用显示器的概率可能降低。

图示500还可以包括声音来源515、静态声音来源525和语音活动来源530。声音来源515、静态声音来源525和语音活动来源530中的每一个都可以生成由声音捕获设备接收的声音，如前所述。

参考图5，智能显示设备510可以从声音来源515接收传入的声音，并确定与声音来源515相关联的声音角度。在图5中，声音来源515位于可视角度520之外。由于声音来源515位于可视角度520之外，因此智能显示设备510的显示器控制器确定停用显示器的概率可能增加。

智能显示设备510可以从静态声音来源525接收传入的声音，并确定与静态声音来源525相关联的声音角度。在图5中，静态声音来源525位于可视角度520内。由于静态声音来源525位于可视角度520内，因此智能显示设备510的显示器控制器确定停用显示器的概率可能降低。然而，显示器控制器可以确定在一段时间内静态声音来源525的声音角度可以保持相对稳定。静态声音来源525的声音角度保持稳定可以指示静态声音来源525产生的声音可能不对应于用户活动，而可以是一些其他物体(例如，电视、收音机或其他类似设备等)的结果。因此，在一些实施例中，在识别静态声音来源525的声音角度在一段时间内保持相对稳定后，当确定是否停用智能显示设备510的显示器时，显示器控制器可能倾向于忽视来自静态声音来源525的传入的声音。

智能显示设备510可以从语音活动来源530接收传入的声音。在图5中，语音活动来源530位于可视角度520内。由于语音活动来源530位于可视角度520内，其指示语音活动来源530可能正在使用智能显示设备510，因此智能显示设备510的显示器控制器确定停用显示器的概率可能降低。在实施例中，可以利用置信度。例如，如果语音活动来源530具有0.1的相关置信度(例如，较低的语音活动的可能性)，则与具有较高的置信度(例如，较高的语音活动的可能性)的语音活动来源相比，智能显示设备510的显示器控制器确定停用显示器的概率可能增加。在一些实施例中，在可视角度520内的语音活动来源530的位置也可以由显示器控制器确定。例如，如果语音活动来源530正好位于智能显示设备510的前面，则显示器控制器确定停用显示器的概率可能降低。然而，如果语音活动来源530位于可视角度520的外围，则显示器控制器确定停用显示器的概率可能增加。

图6是示出根据一个实施例的基于与传入的声音相关联的信号的特征确定停用智能显示设备的显示器的过程600的流程图。过程600可以由处理逻辑执行，处理逻辑可以包括软件、硬件或其组合。例如，过程600可以由图1的显示器控制器110执行。参考图6，在操作601中，处理逻辑从声音捕获设备接收与智能显示设备相关联的声音所对应的信号。在操作602中，执行机器学习模型的处理逻辑分析从声音捕获设备接收的信号的特征，以确定是否停用智能设备的显示器。在操作603中，响应于根据上述分析确定停用显示器，处理逻辑停用智能显示设备的显示器。

图7是示出是示出可以与本发明的一个实施例一起使用的数据处理系统的示例的框图。例如，系统1500可以表示以上所述的执行上述过程或方法中的任何一个的任意数据处理系统(例如，以上所述的客户端设备或服务器，或以上所述的图1中的智能显示设备100等)。

系统1500可以包括许多不同的部件。这些部件可以实施为集成电路(IC)、集成电路的部分、分立电子设备或适用于电路板(如计算机系统的主板或插入卡)的其它模块，或者实施为以其它方式并入计算机系统的机架内的部件。

还应注意，系统1500旨在示出计算机系统的许多部件的高阶视图。然而，应当理解的是，某些实施方式中可以具有附加的部件，此外，其它实施方式中可以具有所示部件的不同布置。系统1500可以表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(PDA)、智能手表、个人通信器、游戏设备、网络路由器或集线器、无线接入点(AP)或中继器、机顶盒或其组合。此外，虽然仅示出了单个机器或系统，但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。

在一个实施例中，系统1500包括通过总线或互连件1510连接的处理器1501、存储器1503以及设备1505至1508。处理器1501可以表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1501可以表示一个或多个通用处理器(如微处理器、中央处理单元(CPU)等)。更具体地，处理器1501可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其它指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器，诸如，专用集成电路(ASIC)、蜂窝或基带处理器、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器、图形处理器、网络处理器、通信处理器、加密处理器、协处理器、嵌入式处理器、或者能够处理指令的任何其它类型的逻辑。

处理器1501(其可以是低功率多核处理器套接口，诸如超低电压处理器)可以充当用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可以实施为片上系统(SoC)。处理器1501配置为执行用于执行本文所讨论的操作和步骤的指令。系统1500还可以包括与可选的图形子系统1504通信的图形接口，图形子系统1504可以包括显示器控制器、图形处理器和/或显示设备。

处理器1501可以与存储器1503通信，存储器1503在一个实施例中可以经由多个存储器设备实施以提供给定量的系统存储。存储器1503可以包括一个或多个易失性存储(或存储器)设备，诸如，随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)或者其它类型的存储设备。存储器1503可以存储包括由处理器1501或任何其它设备执行的指令序列的信息。例如，各种操作系统、设备驱动程序、固件(例如，输入输出基本系统或BIOS)和/或应用的可执行代码和/或数据可以加载到存储器1503中并由处理器1501执行。操作系统可以是任何类型的操作系统，例如，来自公司的/>操作系统、来自苹果公司的Mac/>来自/>公司的/>LINUX、UNIX，或者其它实时或嵌入式操作系统(如VxWorks)。

系统1500还可以包括I/O设备，诸如设备1505至1508，包括网络接口设备1505、可选的输入设备1506，以及其它可选的I/O设备1507。网络接口设备1505可以包括无线收发器和/或网络接口卡(NIC)。所述无线收发器可以是WiFi收发器、红外收发器、蓝牙收发器、WiMax收发器、无线蜂窝电话收发器、卫星收发器(例如，全球定位系统(GPS)收发器)或其它射频(RF)收发器或者它们的组合。NIC可以是以太网卡。

输入设备1506可以包括鼠标、触摸板、触敏屏幕(其可以与显示设备1504集成在一起)、指针设备(如手写笔)和/或键盘(例如，物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如，输入设备1506可以包括联接至触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种，以及其它接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其它元件来检测其接触和移动或间断。

I/O设备1507可以包括音频设备。音频设备可以包括扬声器和/或麦克风，以促进支持语音的功能，诸如语音识别、语音复制、数字记录和/或电话功能。其它I/O设备1507还可以包括通用串行总线(USB)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如PCI-PCI桥)、传感器(例如，诸如加速度计、陀螺仪、磁强计、光传感器、罗盘、接近传感器等的运动传感器)或者它们的组合。设备1507还可以包括成像处理子系统(例如相机)，成像处理子系统可以包括用于促进相机功能(如记录照片和视频片段)的光学传感器，诸如电荷耦合器件(CCD)或互补金属氧化物半导体(CMOS)光学传感器。某些传感器可以经由传感器集线器(未示出)联接至互连件1510，而如键盘或热传感器的其它设备可以根据系统1500的具体配置或设计由嵌入式控制器(未示出)控制。

为了提供对如数据、应用、一个或多个操作系统等信息的永久性存储，大容量存储器(未示出)也可以联接至处理器1501。在各种实施例中，为了实现更薄且更轻的系统设计并且改进系统响应性，这种大容量存储器可以经由固态设备(SSD)来实施。然而，在其它实施例中，大容量存储器可以主要使用硬盘驱动器(HDD)来实施，其中较小量的SSD存储器充当SSD高速缓存以在断电事件期间实现上下文状态以及其它此类信息的非易失性存储，从而使得在系统活动重新启用时能够实现快速通电。另外，闪存设备可以例如经由串行外围接口(SPI)联接至处理器1501。这种闪存设备可以提供系统软件的非易失性存储，系统软件包括系统的基本输入/输出软件(BIOS)以及其它固件。

存储设备1508可以包括计算机可访问的存储介质1509(也被称为机器可读存储介质或计算机可读介质)，其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如，模块、单元和/或逻辑1528)。处理模块/单元/逻辑1528可以表示上述部件中的任何一个(例如，以上描述的显示器控制器110)。处理模块/单元/逻辑1528还可以在其由数据处理系统1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内，数据处理系统1500、存储器1503和处理器1501也构成机器可访问的存储介质。处理模块/单元/逻辑1528还可以通过网络经由网络接口设备1505进行传输或接收。

计算机可读存储介质1509也可以用来永久性地存储以上描述的一些软件功能。虽然在示例性实施例中示出计算机可读存储介质1509为单个介质，但是术语“计算机可读存储介质”应当被认为包括存储一个或多个指令集的单个介质或多个介质(例如，集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质，指令集用于由机器执行并且使得机器执行本发明的任何一种或多种方法。因此，术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质，或者任何其它非暂时性机器可读介质。

本文所述的处理模块/单元/逻辑1528、部件以及其它特征可以实施为分立硬件部件或集成在硬件部件(如ASICS、FPGA、DSP或类似设备)的功能中。此外，处理模块/单元/逻辑1528可以实施为硬件设备内的固件或功能电路。此外，处理模块/单元/逻辑1528可以以硬件设备和软件部件的任何组合来实施。

应注意，虽然系统1500被示出为具有数据处理系统的各种部件，但是并不旨在表示使部件互连的任何特定架构或方式，因为此类细节和本发明的实施例没有密切关系。还应当认识到，具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其它数据处理系统也可以与本发明的实施例一起使用。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式，以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中，算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而，应当牢记，所有这些和类似的术语均旨在与适当的物理量关联，并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出，否则应当了解，在整个说明书中，利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算设备的动作和处理，计算机系统或电子计算设备操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据，并将数据变换成计算机系统存储器或寄存器或者其它此类信息存储、传输或显示设备内类似地表示为物理量的其它数据。

图中所示的技术可以使用在一个或多个电子设备上存储和执行的代码和数据来实施。此类电子设备使用计算机可读介质(例如，非暂时性计算机可读存储介质(如磁盘、光盘、随机存取存储器、只读存储器、快闪存储器设备、相变存储器)和暂时性计算机可读传输介质(如电子、光学、声学或其他形式的传播信号，诸如载波、红外信号、数字信号))存储和传达(在内部地和/或通过网络与其他电子设备)代码和数据。

前述图中所描绘的过程或方法可以由处理逻辑来执行，处理逻辑包括硬件(例如，电路、专用逻辑等)、固件、软件(例如，体现在非暂时性计算机可读介质上)或其组合。尽管过程或方法在上文是依据一些顺序操作来描述的，但是应当了解，所描述的操作中的一些可以按不同的顺序执行。此外，一些操作可以并行地执行而不是顺序地执行。

在以上的说明书中，已经参考本发明的具体示例性实施例对本发明的实施例进行了描述。将显而易见的是，在不脱离所附权利要求书中阐述的本发明的更宽泛精神和范围的情况下，可以对本发明作出各种修改。因此，应当在说明性意义而不是限制性意义上来理解本说明书和附图。

Claims

1.一种基于特征控制智能显示设备的计算机实施的方法，所述方法包括：

从声音捕获设备接收与所述智能显示设备相关联的声音所对应的信号；

在所述智能显示设备的显示器为打开状态的情况下，由执行机器学习模型的处理设备分析从所述声音捕获设备接收的所述信号的多个特征，以确定是否停用所述智能显示设备的所述显示器；以及

响应于根据所述分析确定停用所述智能显示设备的所述显示器，使所述智能显示设备的所述显示器从所述打开状态停用，

其中，所述多个特征包括与所述信号相关联的声压；以及

分析从所述声音捕获设备接收的所述信号的多个特征，以确定是否停用所述智能显示设备的显示器包括确定与所述信号相关联的所述声压和与所述智能显示设备相关联的先前的声压之间的差值，以确定是否停用所述智能显示设备的显示器。

2.根据权利要求1所述的方法，其中，使用与所述智能显示设备不关联的辅助数据在远程服务器处训练所述机器学习模型。

3.根据权利要求1所述的方法，其中，所述多个特征还包括与所述信号相关联的声音角度和与所述信号相关联的语音活动中的至少一者。

4.根据权利要求3所述的方法，其中，分析从所述声音捕获设备接收的所述信号的所述多个特征以确定是否停用所述智能显示设备的所述显示器包括：

确定与所述声压相关联的平均值和标准偏差。

5.根据权利要求3所述的方法，其中，分析从所述声音捕获设备接收的所述信号的所述多个特征以确定是否停用所述智能显示设备的所述显示器包括：

确定所述声音的来源相对于所述智能显示设备的角度。

6.根据权利要求1所述的方法，所述方法还包括：

基于所接收的信号，从多个用户中识别与所述声音相关联的用户。

7.一种非暂时性机器可读介质，所述非暂时性机器可读介质中存储有指令，所述指令在由处理器执行时使得所述处理器执行操作，所述操作包括：

从声音捕获设备接收与智能显示设备相关联的声音所对应的信号；

在所述智能显示设备的显示器为打开状态的情况下，由机器学习模型分析从所述声音捕获设备接收的所述信号的多个特征，以确定是否停用所述智能显示设备的所述显示器；以及

所述多个特征包括与所述信号相关联的声压；以及

8.根据权利要求7所述的非暂时性机器可读介质，其中，使用与所述智能显示设备不关联的辅助数据在远程服务器处训练所述机器学习模型。

9.根据权利要求7所述的非暂时性机器可读介质，其中，所述多个特征还包括与所述信号相关联的声音角度和与所述信号相关联的语音活动中的至少一者。

10.根据权利要求9所述的非暂时性机器可读介质，其中，分析从所述声音捕获设备接收的所述信号的所述多个特征以确定是否停用所述智能显示设备的所述显示器包括：

确定与所述声压相关联的平均值和标准偏差。

11.根据权利要求9所述的非暂时性机器可读介质，其中，分析从所述声音捕获设备接收的所述信号的所述多个特征以确定是否停用所述智能显示设备的所述显示器包括：

确定所述声音的来源相对于所述智能显示设备的角度。

12.根据权利要求7所述的非暂时性机器可读介质，所述操作还包括：

13.一种系统，包括：

处理器；以及

存储器，所述存储器联接至所述处理器并且用于存储指令，所述指令在由所述处理器执行时使得所述处理器执行操作，所述操作包括：

其中，所述多个特征包括与所述信号相关联的声压；以及

14.根据权利要求13所述的系统，其中，使用与所述智能显示设备不关联的辅助数据在远程服务器处训练所述机器学习模型。

15.根据权利要求13所述的系统，其中，所述多个特征还包括与所述信号相关联的声音角度和与所述信号相关联的语音活动中的至少一者。

16.根据权利要求15所述的系统，其中，分析从所述声音捕获设备接收的所述信号的所述多个特征以确定是否停用所述智能显示设备的所述显示器包括：

确定与所述声压相关联的平均值和标准偏差。

17.根据权利要求15所述的系统，其中，分析从所述声音捕获设备接收的所述信号的所述多个特征以确定是否停用所述智能显示设备的所述显示器包括：

确定所述声音的来源相对于所述智能显示设备的角度。