CN108605001B - 语音控制灯开关 - Google Patents
语音控制灯开关 Download PDFInfo
- Publication number
- CN108605001B CN108605001B CN201680070020.3A CN201680070020A CN108605001B CN 108605001 B CN108605001 B CN 108605001B CN 201680070020 A CN201680070020 A CN 201680070020A CN 108605001 B CN108605001 B CN 108605001B
- Authority
- CN
- China
- Prior art keywords
- microphone
- audio signal
- switch
- panel
- electrical load
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 236
- 238000000034 method Methods 0.000 claims description 61
- 230000004044 response Effects 0.000 claims description 14
- 230000008878 coupling Effects 0.000 claims description 8
- 238000010168 coupling process Methods 0.000 claims description 8
- 238000005859 coupling reaction Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 4
- 238000005406 washing Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 33
- 230000000875 corresponding effect Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 102100029272 5-demethoxyubiquinone hydroxylase, mitochondrial Human genes 0.000 description 1
- 101000770593 Homo sapiens 5-demethoxyubiquinone hydroxylase, mitochondrial Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2823—Reporting information sensed by appliance or service execution status of appliance services in a home automation network
- H04L12/2825—Reporting to a device located outside the home and the home network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/028—Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H05—ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
- H05B—ELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
- H05B47/00—Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
- H05B47/10—Controlling the light source
- H05B47/105—Controlling the light source in response to determined parameters
- H05B47/115—Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings
- H05B47/12—Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings by detecting audible sound
-
- H—ELECTRICITY
- H05—ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
- H05B—ELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
- H05B47/00—Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
- H05B47/10—Controlling the light source
- H05B47/175—Controlling the light source by remote control
- H05B47/19—Controlling the light source by remote control via wireless transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/02—Details casings, cabinets or mounting therein for transducers covered by H04R1/02 but not provided for in any of its subgroups
- H04R2201/021—Transducers or their casings adapted for mounting in or to a wall or ceiling
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Automation & Control Theory (AREA)
- Computational Linguistics (AREA)
- Otolaryngology (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Selective Calling Equipment (AREA)
Abstract
本公开部分地描述充当语音控制端点的语音控制灯开关,用户可在所述端点处提供语音命令。这些灯开关可物理地联接到电源以及一个或更多个电器。所述灯开关可包括物理开关以便以二进制方式(开或关)或沿着一系列位置选择性地向所述电器提供电力。在任一实例中,联接到所述灯开关的所述电器可包括灯、电源插座、家用电器(例如,洗碗机、洗衣机等)、工厂机械或接收电力的任何其他装置。
Description
相关申请的交叉引用
本申请要求2015年12月28日提交的美国专利申请号14/980,392的优先权。所述申请的全部内容特此以引用的方式并入本文。
背景
随着计算装置(诸如台式计算机、平板计算机、娱乐系统和便携式通信装置)的激增,家庭正变得更加互连互通。随着计算装置的发展,已经提出了许多不同的方式来允许用户与这些装置交互,诸如通过机械器件(例如键盘、鼠标等)、触摸屏、动作和手势。与计算装置交互的另一种方式是通过言语。
附图简述
参考附图来描述详细描述。在图中,附图标号最左侧的数字标识所述附图标号首次出现的图。相同附图标号在不同图中的使用指示类似或相同的部件或特征。
图1示出设置在家庭环境中的说明性语音交互计算架构。所述架构包括至少一个语音控制灯开关以及在物理上位于家里的语音控制装置,连同用户。在此实例中,所述灯开关包括用于生成音频信号的一个或更多个麦克风,所述音频信号可包括用户的命令,诸如打开所示房间中的灯的命令。
图2示出示例性语音控制灯开关,其包括在灯开关的开关(或“拨杆”)的远端上的一个麦克风以及在灯开关的面板上的多个麦克风。在一些实例中,灯开关可包括确定开关是处于第一位置(例如,向上位置)还是第二位置(例如,向下位置)并可基于此位置选择音频信号来进行处理的功能。例如,如果开关处于第一位置,那么灯开关可选择由开关上的麦克风和面板的顶部部分上的麦克风中的一个或更多个生成的音频信号以用于进行处理,这可允许进行更准确的言语处理,如下文所述。
图3示出语音控制灯开关的另一种示例性构型。此处,灯开关呈翘板开关的形式,并且包括在开关(或“翘板”)上的两个麦克风以及在面板的顶部和底部上的多个麦克风。
图4示出语音控制灯开关的另一种示例性配置。此处,灯开关呈滑动调光器开关的形式,并且包括在开关(或“滑动旋钮”)上的两个麦克风以及在面板的左侧和右侧上的多个麦克风,所述开关被配置来移动到调光器开关的不同位置。
图5示出语音控制灯开关的另一种示例性配置。此处,灯开关呈可旋转旋钮调光器开关的形式,并且包括在开关(或“可旋转旋钮”)上的一个麦克风以及跨调光器开关的面板分布的多个麦克风,所述开关被配置来径向地移动到不同位置。
图6示出用于基于语音控制灯开关中的开关的位置选择哪些音频信号来进行处理的示例性过程的流程图。处理信号可包括:将这些信号发送到远程服务以用于进行进一步处理,诸如对信号执行波束成形以生成经处理音频信号并对经处理音频信号执行言语识别。另外地或可替代地,处理这些信号可包括:在开关处本地或在环境中的另一装置处执行波束成形、噪音消除(noise-cancelation)等,和/或在开关处本地或在环境中的另一装置处执行言语识别。
图7示出用于基于开关的位置并且基于环境内的音频源(例如,正在讲话的用户)的位置选择音频信号以用于进行处理的示例性过程的流程图。
图8示出在图1的语音控制灯开关中实现的选定功能部件的框图。。
详细描述
本公开部分地描述充当语音控制端点的语音控制灯开关,用户可在所述端点处提供语音命令。这些灯开关可物理地联接到电源以及一个或更多个电力负载,诸如电器(例如灯、插座、家用电器等)。这些灯开关可包括物理开关以便以二进制方式(开或关)或沿着一系列位置选择性地向所述电力负载提供电力。在任一实例中,联接到灯开关的电力负载可包括灯、电源插座、家用电器(例如,洗碗机、洗衣机、烟雾探测器、安全报警器、自动门锁、自动窗帘、恒温器等)、工厂机械、医疗保健装置(例如,胰岛素泵、CPAP机等)、清洁装置(例如,自主机器人真空吸尘器等)、或接收电力的任何其他装置。
除这些传统灯开关部件之外,本文所述的语音控制灯开关还包括用于生成音频信号的一个或更多个麦克风,从所述音频信号,可标识一个或更多个语音命令。例如,灯开关可包括在物理开关、面板和/或类似物上的麦克风,此麦克风基于在灯开关的环境内探测到的声音生成音频信号。灯开关可对所生成音频信号执行言语识别以标识语音命令,或者灯开关可包括网络接口以用于向另一装置或可执行言语处理的远程服务发送音频信号。灯开关的电源可包括持续电源,诸如连接到家庭或其他建筑物的主交流(AC)电力供应源。如此,除灯开关所联接到的电力负载之外,此电源也可用于给灯开关的麦克风和其他部件供电。此外,虽然灯开关可联接到AC电力供应源,但是在其他实例中,灯开关可联接到任何其他类型的电源,诸如电池、电容器、太阳板等。
在一些实例中,语音控制灯开关包括语音识别引擎,所述语音识别引擎被配置来从所生成音频信号标识预定义话语(例如,预定义声音或预定义字词或短语),并且在标识出此话语时,可开始向远程服务提供所生成音频信号以用于执行语音识别。因此,用户可通过讲出预定义话语(例如,“醒来(wake up)”)确定何时发送音频信号及何时将标识语音命令。语音命令可用于一系列活动,诸如打开用户环境中的灯、对信息的请求(例如,“外面的温度是多少?(what is the temperature outside?)”)、对执行任务的请求(“提醒我下午4点去接约翰尼(remind me to pick up Johnny at 4pm)”)、或任何其他类型的请求。
在一些实例中,语音控制灯开关包括多个麦克风,每个麦克风被配置来生成相应音频信号。这些多个音频信号可一起被处理来生成经处理音频信号,所述经处理音频信号具有与音频信号中的任一单个信号的信噪(SNR)比相比更大的SNR比。例如,灯开关或远程服务可使用波束成形技术、噪音消除技术等利用多个音频信号来生成经处理音频信号。语音控制灯开关、远程服务或另一装置随后可对具有增大的SNR的经处理音频信号执行言语识别,从而增加言语识别的准确度和功效。
在一些实例中,语音控制灯开关至少包括在灯开关的开关上的第一麦克风。也就是说,第一麦克风可驻留在物理控件上,所述物理控件用于致使联接到灯开关的电力负载联接到电源并因此接收电力,并且可用于使电力负载与电源断开电联接,以使得电力负载不从电源接收电力。音频控制灯开关可包括拨杆灯开关、翘板灯开关、滑动调光器灯开关、可旋转旋钮灯开关或任何其他类型的开关。除驻留在开关上的第一麦克风之外,灯开关还可包括位于灯开关的面板或者灯开关上或邻近灯开关的任何其他位置上的一个或更多个麦克风。例如,当灯开关包括被配置来驻留在向上位置和向下位置中的拨杆灯开关时,灯开关可包括在面板的顶部部分上的第二麦克风以及位于面板的底部部分上的第三麦克风。在一些实例中,第二麦克风和第三麦克风与第一麦克风在水平方向上基本上对齐。例如,当开关(和驻留在其上的第一麦克风)基本上驻留在灯开关的总体结构的水平中间处时,第二麦克风和第三麦克风也可驻留在水平中间处。
在以上实例中,灯开关可包括被配置来确定开关何时驻留在向上位置中和开关何时驻留在向下位置中的操作逻辑。响应于确定开关驻留在向上位置中,灯开关可选择由第一麦克风生成的第一音频信号和由第二麦克风(在面板的顶部部分上)生成的第二音频信号以用于进行处理。此处理可包括:在本地对信号执行波束成形或其他处理,或者将信号发送到远程服务以用于对其执行波束成形或其他处理技术。鉴于第一麦克风和第二麦克风的位置,当开关处于向上位置中时,这些麦克风可基本上在竖直方向上彼此对齐。此外,鉴于墙壁上的灯开关的常用高度和用户的平均高度范围,这些麦克风也可以与正在讲话的用户的嘴部基本上竖直地对齐。当对此配置中的麦克风生成的音频信号执行波束成形以生成具有相对高SNR的经处理音频信号时,使用这些音频信号是特别有用的。如此,当开关驻留在向上位置中时选择第一音频信号和第二音频信号以用于进行处理可产生特别准确的言语识别。换言之,因为第一麦克风和第二麦克风在基本上相同水平面中(即,与地面相距基本上相同竖直高度),所以当用户在房间中朝向墙壁/灯开关讲话时,用户的音频可到达第一麦克风并随后到达与第一麦克风基本上竖直地对齐的第二麦克风。此配置可导致有效的波束成形或其他信号处理。
相反地,当开关驻留在向下位置中时,操作逻辑可选择第一音频信号(由开关上的第一麦克风生成)和由面板的底部部分上的第三麦克风生成的第三音频信号以用于进行处理。同样,鉴于当开关处于向下位置中时这些麦克风在竖直方向上基本上彼此对齐(并且与正在讲话的用户的嘴部基本上竖直地对齐),这些音频信号表示以下事项的优异候选者:对其执行波束成形以生成具有相对高SNR的经处理音频信号。
此外,语音控制灯开关可包括在面板上与第二麦克风水平地对准的一个或更多个另外的麦克风,以及在面板上与第三麦克风水平地对准的一个或更多个另外的麦克风。例如,灯开关可包括在第二麦克风左侧的第四麦克风以及在第二麦克风右侧的第五麦克风。在这些实例中,当开关处于向上位置中时,灯开关的操作逻辑可确定是否选择以下音频信号对中的一个或更多个:(1)第一音频信号和由第四麦克风生成的第四音频信号;(2)第一音频信号和第二音频信号;和/或(3)由第五麦克风生成的第五音频信号。在一些实例中,操作逻辑可确定环境中的音频源(例如,正在讲话的用户)的位置以确定选择哪一对或更多对音频信号以用于进行处理。例如,操作逻辑可尝试确定这些麦克风对中的哪一对与正在讲话的用户最对齐。在其他实例中,操作逻辑可选择这些对的混合。
例如,操作逻辑可基于第四麦克风的位置和第一麦克风的位置限定第一线,基于第二麦克风的位置和第一麦克风的位置限定第二线,并且基于第五麦克风的位置和第一麦克风的位置限定第三线。操作逻辑随后可确定哪条线最接近地指向用户的估计方向。在一些实例中,操作逻辑利用到达时差(TDOA)技术来估计环境内的用户的位置。
虽然以上实例描述了包括多个麦克风并且将电源联接到电力负载的灯开关,但是在其他实例中,本文所述的技术可涵盖不将电源联接到电力负载的设备。替代地,所述设备可只包括具有多个麦克风的物理开关(例如,可旋转旋钮),所述多个麦克风可基于开关的位置来选择用于处理。
虽然以下实例描述了语音控制灯开关的若干示例性配置,但是其他实现方式可利用位于一系列位置处的任何其他数目的麦克风。此外,这些语音控制灯开关可包括一系列其他部件,诸如输出装置(例如,扬声器、显示器等)、不同类型的网络接口(例如,有线网络接口、BLE接口、紫蜂接口、WiFi接口等)及类似物。
图1示出设置在家庭环境102中的说明性语音交互计算架构100,其包括用户104、语音控制灯开关108和用户装置110。如图所示,用户发出语音命令106(“醒来……请打开灯(Wake up…please turn on the lights)”)。在一些实例中,语音控制灯开关108可包括一个或更多个麦克风112,所述一个或更多个麦克风112可生成一个或更多个音频信号以用于标识语音命令并执行对应动作,诸如打开环境102内的灯114。
在一些实例中,语音控制灯开关108可标识预定义字词或短语(“醒来”),并且此后可开始将一个或更多个音频信号流式传输到另一装置以用于进行处理,诸如传输到包括一个或更多个远程装置(或“计算资源”)的远程服务116。这些远程计算资源可形成网络可访问计算平台的一部分,所述网络可访问计算平台被实现为通过网络(诸如,互联网)维持并可访问的处理器、存储装置、软件、数据存取等等的计算基础设施。远程计算资源不需要最终用户知道递送服务的系统的物理位置和配置。用于这些远程计算装置的相关联常用表达包括“按需计算”、“软件即服务(SaaS)”、“平台计算”、“网络可访问平台”、“云服务”、“数据中心”等等。此外,虽然图1将远程服务示出为可通过网络访问,但是在其他实例中,远程服务/装置可包括位于语音控制灯开关108的环境内的本地集线器。
远程服务116可对这些音频信号执行处理(例如,波束成形、声学回音消除等)以及言语识别,以标识一个或更多个语音命令,诸如打开灯的命令106。在标识语音命令之后,远程服务116可向语音控制灯开关108或另一装置(在环境102中或其他地方)发送执行对应动作的指令。在此实例中,远程服务116可向灯开关108发送打开灯114的指令。响应于接收到此指令,语音控制灯开关108可执行指令并打开灯114。也就是说,灯开关内部的开关可致使灯开关的电路向连接到开关的灯提供电力,而无需拨杆开关移动位置(如在用户手动地拨动拨杆开关的情况下)。替代地,内部开关或其他功能可使一根或更多根电线彼此联接或断开联接,以致使电力流到所连接的灯。相反地,内部开关可阻断或扼扼电流以有效地使这些电线断开联接,使得不向所连接的灯或其他电力负载提供电流。
在以上所述的实例中,语音控制灯开关108可通过一个或更多个网络118与远程服务116通信,所述一个或更多个网络118可包括有线技术(例如,电线、USB、纤维光缆等)、无线技术(例如,WiFi、RF、蜂窝、卫星、蓝牙等)或其他连接技术。网络118表示任何类型的通信网络、包括数据和/或语音网络,并且可使用有线基础设施(例如,缆线、CAT5、纤维光缆等)、无线基础设施(例如,RF、蜂窝、微波、卫星、蓝牙等)和/或其他连接技术来实现。在一些实例中,语音控制灯开关108还可通过近程无线通信协议(例如,蓝牙、紫蜂等)与用户装置(诸如,用户装置110)通信。例如,语音控制灯开关108可向用户装置110或其他用户装置提供音频信号,所述用户装置110或其他用户装置进而向远程服务116发送音频信号或者可自身执行处理(例如,波束成形)和/或言语识别。在再其他实例中,语音控制灯开关108可与本地用户装置通信以向这些装置发送指令。例如,如果用户104陈述“打开我的厨房电视机(turnon my kitchen television)”的命令,那么语音控制灯开关108可使用厨房电视所使用的适当协议来向电视发送这样做的指令。
如图所示,语音控制灯开关108可包括:麦克风112;电路120,所述电路120用于将灯开关联接到电源和灯114;物理开关122(例如,拨杆开关、翘板开关、滑块、旋钮等);一个或更多个网络接口124;处理器126;一个或更多个扬声器128;以及存储器130。如图所示,存储器130可存储言语识别引擎132和麦克风选择模块134。如上所述,言语识别引擎132可起作用以对由麦克风112生成的音频信号执行言语识别,以标识预定义字词或短语,诸如“醒来”。在标识出此字词或短语之后,灯开关108可开始使用网络接口124中的一者来向远程服务116发送音频信号中的一个或更多个。然而,在这样做之前,麦克风选择模块134可基于开关的当前位置和/或音频源(诸如,环境内正在讲话的用户)的当前位置来确定选择哪些麦克风和对应音频信号。在一些实例中,语音控制灯开关108可包括用于确定物理开关122的位置的传感器。
例如,如果语音控制开关108当前处于向上位置中,那么麦克风选择模块134可确定向远程服务116发送由开关上的麦克风生成的音频信号以及由面板的顶部部分上的麦克风生成的音频信号。此外,如果面板包括多个麦克风,那么相对于面板的顶部部分上的其他麦克风,麦克风选择模块134可选择对应于与用户104和开关上的麦克风最对齐的麦克风的音频信号。为此,麦克风选择模块134可首先使用TDOA技术、使用用于标识环境内的用户的图像传感器、或以其他方式来确定环境中的用户104的位置。
此外,如果开关当前处于向下位置中,那么麦克风选择模块134可选择对应于面板的底部部分上的麦克风的音频信号。同样地,当底部部分包括多个麦克风时,模块134可选择与用户104的位置和开关上的麦克风最对齐的麦克风。
如图所示,远程服务116包括处理器136和存储器138,所述存储器138可访问信号处理引擎140、言语识别引擎142和命令处理引擎144。在一些实例中,如下文所述,鉴于远程服务116所具有的计算能力可远超语音控制灯开关108的计算能力,那么语音控制灯开关108或环境102内的其他客户端装置可向远程服务116上传音频数据以用于进行处理。因此,在从语音控制灯开关108接收到如由麦克风选择模块134选择的多个音频信号时,信号处理引擎140可对信号执行一种或更多种相对复杂的处理技术以生成一个或更多个经处理音频信号。例如,信号处理引擎140可执行波束成形、声学回音消除、背景噪音减少或其他技术以生成与预处理音频信号相比具有更高SNR的一个或更多个经处理音频信号。此外,如以上所论述且如图8所示,语音控制灯开关108另外地或可替代地可包括信号处理引擎140以用于执行波束成形、声学回音消除、背景噪音减少或其他技术,之后向远程服务116上传经处理音频信号。
此后,言语识别引擎142可对经处理音频信号执行言语识别以标识其中所表示的一个或更多个语音命令,诸如示例性语音命令106。之后,命令处理引擎132可响应于标识出语音命令而致使执行一个或更多个动作。例如,在所示实例中,命令处理引擎132可向语音控制灯开关108发送打开灯114的指令。
鉴于上述情况,在一些实例中,语音控制灯开关108从“睡眠”状态转变为“苏醒”状态,在所述睡眠状态中,本地言语识别引擎132执行ASR以标识预定义话语,在所述醒来状态中,语音控制灯开关108向远程服务116提供音频信号以用于对其进行处理并执行ASR。与此同时,在其他实例中,语音控制灯开关108可包括可选择物理按钮或软按钮,所述可选择物理按钮或软按钮响应于用户选择按钮而致使语音控制灯开关108从“睡眠”状态转变为“苏醒”状态。
此外,不管言语识别是在本地发生还是在环境102远处发生,语音控制灯开关108都可接收来自用户104的口头输入,并且语音控制灯开关108和/或远程服务116可执行言语识别以解释用户的操作请求或命令。请求可以是针对实质上任何类型的操作,诸如打开或关闭电器、调整电器设置、认证、数据库询问、请求和消费娱乐(例如,游戏、查找和播放音乐、电影或其他内容等)、个人信息管理(例如,日程指定、做笔记等)、在线购物、金融交易等等。
图2示出语音控制灯开关108的示例性配置。如图所示,语音控制灯开关108包括在灯开关108的开关122(或“拨杆”)的远端上的第一麦克风112(1)。因为麦克风112(1)驻留在开关122的端部上,所以第一麦克风112(1)可更靠近灯开关108的面板202的顶部(当开关122处于向上位置中时)或更靠近面板202的底部(当开关122处于向下位置中时)驻留。
此外,语音控制灯开关108可包括更靠近面板202的顶部边缘定位的第二麦克风112(2)以及更靠近面板202的底部边缘定位的第三麦克风112(3)。如此,麦克风112(1)在开关122处于向上位置中时可更靠近麦克风112(2),而在开关122处于向下位置中时可更靠近麦克风112(3)。也就是说,当开关122处于向上位置中时,麦克风112(1)与麦克风112(2)之间的距离可短于麦克风112(1)与麦克风112(3)之间的距离。并且,当开关122处于向下位置中时,麦克风112(1)与麦克风112(3)之间的距离可短于麦克风112(1)与麦克风112(2)之间的距离。此外,当开关122处于向上位置中时,麦克风112(1)和麦克风112(2)可在基本上相同水平面中(即,距离地面可具有基本上相同的竖直高度)。此外,当开关122处于向下位置中时,麦克风112(1)与麦克风112(3)可在基本上相同水平面中(即,距离地面可具有基本上相同的竖直高度)。
如上所述,语音控制灯开关108可包括用于确定开关何时处于向上位置中和开关何时处于向下位置中的操作逻辑。在一些实例中,响应于本地言语识别引擎132标识出预定义字词或短语,麦克风选择引擎可确定开关122是处于向上位置中还是处于向下位置中,并且可基于此确定向远程服务116发送一个或更多个音频信号。例如,响应于确定开关处于向上位置中,麦克风选择模块134可向远程服务发送由第一麦克风112(1)和第二麦克风112(2)生成的音频信号。在另一实例中,响应于确定开关处于向上位置中,麦克风选择模块134可选择由第一麦克风112(1)和第二麦克风112(2)生成的音频信号以用于进行处理。例如,灯开关108可对这些信号执行波束成形以生成一个或更多个经处理音频信号,并且随后可向远程服务116发送这一个或更多个经处理音频信号。在一些实例中,当开关处于向上位置中时,灯开关108可使用由第三麦克风112(3)生成的音频信号来标识背景噪音,并且此后,从由第一麦克风和第二麦克风生成的音频信号移除背景噪音中的至少一些。
类似地,响应于确定开关处于向下位置中,麦克风选择模块134可选择由第一麦克风112(1)和由第三麦克风112(3)生成的音频信号以用于进行处理。例如,灯开关108可对这些信号执行波束成形以生成一个或更多个经处理音频信号,并且随后可向远程服务116发送这一个或更多个经处理音频信号。在一些实例中,当开关处于向下位置中时,灯开关108可使用由第二麦克风112(2)生成的音频信号来标识背景噪音,并且此后,从由第一麦克风和第三麦克风生成的音频信号移除背景噪音中的至少一些。
如上所述,并且如通过灯开关108的侧面的图解所示,因为这些麦克风可基本上彼此竖直地对齐,所以这些信号成为以下事项的良好候选者:对其执行波束成形以生成与信号自身相比具有相对高SNR的经处理音频信号。此外,在其中麦克风选择模块134确定开关处于向下位置中的实例中,麦克风选择模块134可向远程服务发送由第一麦克风112(1)和由第三麦克风112(3)生成的音频信号。
再者,并且如图所示,在一些实例中,语音控制灯开关108可包括第四麦克风112(4)以及第五麦克风112(5),所述第四麦克风112(4)与第二麦克风112(2)基本上水平地对齐、但在其左侧,所述第五麦克风112(5)与第二麦克风112(2)基本上水平地对齐、但在其右侧。类似地,语音控制灯开关108可包括第六麦克风112(6)以及第七麦克风112(7),所述第六麦克风112(6)与第三麦克风112(3)基本上水平地对齐、但在其左侧,所述第七麦克风112(7)与第三麦克风112(3)基本上水平地对齐、但在其右侧。
在这些实例中,除了在选择音频信号以用于进行处理之前确定开关122是处于向上位置还是向下位置中之外,麦克风选择模块134还可将环境内的音频源(诸如,正在讲话的用户)的位置考虑在内。为此,麦克风选择模块可利用TDOA技术、由相机捕获的图像等。例如,鉴于麦克风112(1)-112(7)中的每一个可在不同时间探测到命令声音,麦克风选择模块134可将这些不同时间进行比较以估计用户相对于语音控制灯开关108的方向。一旦已估计出用户(或其他音频源)的方向,麦克风选择模块134就可确定面板202上的哪个麦克风(或哪个麦克风组合)来向远程服务116发送。在一个实例中,麦克风选择引擎在面板202的适当半部上的每个麦克风(例如,如果开关122处于向上位置中,则是顶部上的麦克风中的每一个)与开关122上的第一麦克风112(1)之间限定相应线。麦克风选择模块134随后可确定哪条线或哪些线与用户的方向最紧密对应。在一些实例中,麦克风选择模块134随后选择此麦克风对,并向远程服务116发送由此对麦克风生成的音频信号。为了说明,如果用户相对地站在语音控制灯开关108的正前方并且开关处于向上位置中,那么麦克风选择模块134可选择第二麦克风112(2)连同麦克风112(1)。然而,如果用户在看着语音控制灯开关108时位于灯开关108的右侧,那么语音控制模块134可选择第四麦克风112(4)。可是,如果用户在看着语音控制灯开关108时位于灯开关108的左侧,那么麦克风选择模块134可选择第五麦克风112(5)连同第一麦克风112(1)。与此同时,在其他实例中,麦克风选择引擎可向远程服务116发送超过两个音频信号以获得增大的准确度。例如,如果用户相对于语音控制灯开关108站在中心偏左侧,那么麦克风选择模块134可发送对应于第一麦克风112(1)、第二麦克风112(2)和第五麦克风112(5)的音频信号。此外,应注意,虽然图2和后续图示出示例性麦克风阵列,但是应了解,其他实现方式可利用更多麦克风、更少麦克风和/或不同麦克风配置。
图3示出语音控制灯开关108的另一种示例性配置。此处,灯开关108呈翘板开关的形式,并且包括在开关122(或“翘板”)上的两个麦克风以及在面板的顶部和底部上的多个麦克风。也就是说,开关122包括在翘板开关122的顶部部分上的第一麦克风112(1)以及在开关122的底部部分上的第八麦克风112(8)。此外,语音控制灯开关108的面板202的顶部部分同样包括三个麦克风112(4)、112(2)和112(5),而面板202的底部部分包括三个麦克风112(6)、112(3)和112(7)。
如同图2的实例,麦克风选择模块134可确定开关122是处于向上位置还是向下位置中,并且可选择由对应于向上位置或向下位置的麦克风生成的音频信号以用于进行处理。在此情况下,例如,如果开关122处于向上位置中,那么麦克风选择模块134可选择由第八麦克风112(8)以及三个麦克风112(6)、112(3)和112(7)中的一个或更多个生成的音频信号以用于进行处理。也就是说,鉴于当翘板开关122处于向上位置中时,第一麦克风112(1)与面板202几乎齐平,而第八麦克风112(8)进一步突出远离面板202,并且鉴于麦克风之间的此分离允许更好的波束成形,当开关122处于向上位置中时,麦克风选择引擎可选择底部麦克风。类似地,当确定翘板开关122处于向下位置中时,那么麦克风选择模块134可选择对应于灯开关108的顶部的麦克风,即第一麦克风112(1)以及三个麦克风112(4)、112(2)和112(5)中的一个或更多个。
图4示出图1的语音控制灯开关108的又另一种示例性配置。此处,灯开关呈包括滑动开关122的滑动调光器灯开关的形式,所述滑动开关122自身包括在开关122的左侧上的第一麦克风112(1)以及在开关122的右侧上的第二麦克风112(2)。此外,示例性灯开关108包括在面板202的左侧上的三个麦克风以及在面板202的右侧上的三个麦克风。在一些实例中,麦克风选择模块134可基于滑动开关122的位置、可能地连同用户104的位置来选择一对或更多对麦克风来使用。例如,如果滑动开关122一直位于其范围的顶部,那么麦克风选择信号可选择对应于麦克风112(5)和112(1)的音频信号或对应于麦克风112(7)和112(2)的音频信号以用于进行处理。类似地,如果滑动开关122位于沿着其范围的约一半处,如图所示,那么麦克风选择模块134可选择对应于麦克风112(3)和112(1)的音频信号或对应于麦克风112(4)和112(2)的音频信号以用于进行处理。此外,如果滑动开关122一直位于其范围的底部,那么麦克风选择模块134可选择对应于麦克风112(6)和112(1)的音频信号或对应于麦克风112(8)和112(2)的音频信号以用于进行处理。
图5示出图1的语音控制灯开关108的又另一种示例性配置。此处,灯开关108呈类似于上文参考图4所论述的调光器灯开关的可旋转旋钮调光器开关的形式,所述可旋转旋钮调光器开关包括用户能够径向旋转以调整施加到电力负载的功率量的可旋转开关122。在此实例中,可旋转开关122可包括第一麦克风112(1)。此外,灯开关108的面板202可包括可能围绕可旋转开关122径向地均匀分布的一个或更多个麦克风。例如,在此实例中,灯开关108包括麦克风112(2)、112(3)、……、112(9)。当语音控制灯开关108接收到处理一个或更多个音频信号的指令时,麦克风选择模块134可选择对应于一对或更多对麦克风的音频信号。例如,麦克风选择模块134可确定麦克风112(2)-112(9)中的哪一个最接近麦克风112(1)的当前位置,并且可向远程服务116发送对应于此麦克风和第一麦克风112(1)的音频信号。例如,如图所示,麦克风选择模块134可选择对应于麦克风112(4)的音频信号,并且因此可向远程服务116发送对应于第一麦克风112(1)和第四麦克风112(4)的音频信号。此外,虽然图5示出第一麦克风112(1)连同面板上的另外的麦克风,但是在其他实例中,可旋转旋钮122可包括在旋钮的面上的第一麦克风以及更靠近面板定位且与第一麦克风竖直地对齐的第二麦克风。如此,无论旋钮的位置如何,由这些麦克风生成的音频信号都可用于使用波束成形或其他处理技术来增大信号的SNR。
此外,尽管图描述了将电源联接到电力负载的灯开关,但是在一些实例中,设备可具有与图5的设备相同的形状因数,但不联接到电源。替代地,此设备可只是包括可旋转旋钮(know)或其他类型的开关,其包括第一麦克风112(1)以及在面板上和/或在旋钮上更接近面板的第二位置上的一个或更多个另外的麦克风。虽然此设备可能不联接到电源,但是此设备可包括用于确定旋钮的位置并基于此位置选择一个或更多个音频信号以用于进行处理的相同功能。
图6示出用于基于语音控制灯开关中的开关的位置选择哪些音频信号来进行处理的示例性过程600的流程图。处理信号可包括:将这些信号发送到远程服务以用于进行进一步处理,诸如对信号执行波束成形以生成经处理音频信号并对经处理音频信号执行言语识别。另外地或可替代地,处理这些信号可包括:在开关处本地或在环境中的另一装置处执行波束成形、噪音消除(noise-cancelation)等,和/或在开关处本地或在环境中的另一装置处执行言语识别。
过程600(和本文所述的每个过程)作为逻辑流程图示出,其每个操作表示可在硬件、软件或其组合中实施的操作序列。在一些实例中,由语音控制灯开关(诸如上文所述的灯开关108)的部件执行操作中的一些或全部。在软件的背景下,操作表示存储于一个或更多个计算机可读介质上的计算机可执行指令,所述计算机可执行指令在由一个或更多个处理器来执行时执行所列举操作。总体上,计算机可执行指令包括执行特定功能或实施特定抽象数据类型的例程、程序、对象、部件、数据结构等。
计算机可读介质可包括非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质可包括:硬盘驱动器、软盘、光盘、CD-ROM、DVD、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、闪存器、磁卡或光卡、固态存储器装置或适用于存储电子指令的其他类型的存储介质。此外,在一些实施方案中,计算机可读介质可包括暂时性计算机可读信号(呈压缩或未压缩的形式)。计算机可读信号(无论是否使用载波调制)的实例包括但不限于托管或运行计算机程序的计算机系统可被配置来访问的信号,包括通过互联网或其他网络下载的信号。最后,并不旨在将描述操作的次序解释为限制性的,并且任何数目的所描述操作可以任何次序和/或并行地组合来实施所述过程。
在602处,过程600生成一个或更多个音频信号。比如,如果语音控制灯开关包括多个麦克风,那么这些麦克风中的一个或更多个可基于在灯开关的环境内探测到的声音而生成对应音频信号。在604处,过程600对这些所生成音频信号中的一个或更多个执行言语识别。比如,在灯开关上操作的言语识别模块134可对信号中的一个或更多个执行言语识别以标识预定义字词或短语。在606处,过程600查询是否已基于言语识别的执行而标识出预定义字词或短语。如果没有,那么过程600返回到操作604以继续针对预定义字词或短语监测音频信号。
然而,如果过程600标识出预定义字词或短语,那么在608处,过程600确定开关是处于第一位置还是第二位置中。虽然示例性过程600描述确定开关处于两个位置中的哪一个中,但是在其他实现方式中,可利用任何其他数目的位置。在任何情况下,如果确定开关处于第一位置中,那么在610处,过程610(1)选择对应于用于处理的第一位置的音频信号以用于进行处理。如上所述,这些信号也可基于其他标准来选择,诸如灯开关的环境内的用户的位置。此外且如图所示,“处理”这些音频信号可包括但不限于:向远程服务发送音频信号以用于进行进一步处理(诸如对其执行波束成形和言语识别)(操作610(1))、在灯开关处本地执行言语识别(操作610(2))和/或在灯开关处本地对音频信号执行波束成形、噪音消除、声学回音消除等(操作610(3))。类似地,如果过程600确定开关处于第二位置中,那么在612处,过程600可选择对应于第二位置的音频信号以用于进行处理。同样地,这些信号的处理可包括:向远程服务发送信号(操作612(1))、本地对信号执行言语识别(操作612(2))和/或本地对信号执行波束成形或类似处理(612(3))。
图7示出用于基于开关的位置并且基于环境内的音频源(例如,正在讲话的用户)的位置来选择音频信号以用于进行处理的示例性过程700的流程图。在702处,过程700确定开关处于第n位置(表示任何可用位置)中。在704处,过程700确定由灯开关的开关上的麦克风和面板上对应于第n位置的第一麦克风限定的第一线。在706处,过程700确定由开关上的麦克风和面板上对应于第n位置的第二麦克风限定的第二线。在708处,过程700确定由开关上的麦克风和面板上对应于第n位置的第三麦克风限定的第三线。在710处,过程700使用TDOA技术、相机或类似技术来估计环境内的音频源(例如,正在讲话的用户)的方向。随后,在712处,过程700查询是第一线、第二线还是第三线最接近音频源的估计方向。如果过程700确定第一线最接近,那么在714(1)处,过程700选择对应于开关上的麦克风和面板上的第一麦克风的音频信号以用于进行处理。然而,如果过程700确定第二线最接近,那么在714(2)处,过程700选择对应于开关上的麦克风和面板上的第二麦克风的音频信号以用于进行处理。最后,如果过程700确定第三线最接近,那么在714(3)处,过程700选择对应于开关上的麦克风和面板上的第三麦克风的音频信号以用于进行处理。此外,虽然描述三个示例性面板麦克风,但是应了解,其他实现方式可利用面板上的任何其他数目的麦克风。
图8示出在图1的语音控制灯开关108中实现的选定功能部件的框图。虽然此图示出一个示例性灯开关108,但是应了解,任何其他类型的客户端或服务器计算装置均可实施本文所描述的技术。此外,应了解,灯开关108可包括上文参考远程服务116所描述的部件中的一些或全部。
在所示实现方式中,语音控制灯开关108包括处理器126和存储器130。存储器130可包括计算机可读存储介质(“CRSM”),所述计算机可读存储介质可以是可由处理器126访问以执行存储在存储器上的指令的任何可用物理介质。在一种基本的实现方式中,CRSM可包括随机存取存储器(“RAM”)和闪存器。在其他实现方式中,CRSM可包括但不限于:只读存储器(“ROM”)、电可擦可编程只读存储器(“EEPROM”)或可用于存储所需信息且可由处理器126访问的任何其他介质。
语音控制灯开关108包括用于接收音频输入(诸如,用户语音输入)的麦克风112。灯开关108还可包括用于输出音频声音的扬声器128。一个或更多个编解码器802联接到麦克风和扬声器,以便对音频信号进行编码和/或解码。编解码器可在模拟格式与数字格式之间转换音频数据。用户可通过对着灯开关108讲话来与其交互,并且麦克风112捕获声音并生成包括用户言语的音频信号。编解码器802对用户言语进行编码并将那个音频数据传输给其他部件。
在所示实例中,语音控制灯开关108包括一个或更多个网络接口124,其可联接到一根或更多根天线804以促进与网络的无线连接。无线接口124可实施各种无线技术中的一种或更多种,诸如WiFi、蓝牙、RF等等。
一个或更多个装置接口806(例如,USB、宽带连接等)可进一步设置为灯开关108的一部分以促进与网络的或与跟其他无线网络通信的插入式网络装置的有线连接。一个或更多个电力单元808可进一步设置来向灯开关108上的各种部件分配电力。与此同时,在一些实例中,灯开关联接到持久性电源,诸如主AC电力供应源。
若干模块(诸如,指令、数据存储等等)可存储于存储器130内并且被配置来在处理器126上执行。操作系统模块810被配置来管理其内的硬件和服务(例如,无线单元、编解码器等)并且联接到灯开关108以利于其他模块。此外,除其他模块外,存储器130还可包括以上所描述的言语识别引擎132、麦克风选择模块134和/或信号处理引擎140。这些模块、数据存储和部件中的一些或全部可另外地或可替代地驻留于远程服务116处。
此外,灯开关108可包括用于将灯开关联接到电源和电力负载(诸如灯、电源插座等)的电路120。电路至少可包括用于进行与持久性电源的这种连接的一根或更多根电线。最后,灯开关可包括物理开关122,所述物理开关122可选择来向电力负载提供电力以及停止向电力负载提供电力。在一些实例中,并且如以上所论述,开关122可能够调整来向所连接电力负载提供不同水平的电力,而在其他实例中,开关122可包括两个位置:开和关。此外,电路120还可包括内部开关,所述内部开关致使一根或更多根电线联接在一起以致使电源向所联接电力负载提供电力。在一些实例中,电路120的此内部开关可响应于用户拨动物理开关122或响应于对基于用户发出语音命令而接收的指令的执行而以此方式联接电线。
上述内容也可根据以下条款来理解:
1.一种灯开关,其包括:
一根或更多根电线,所述一根或更多根电线用于将所述灯开关联接到电源和至少一个灯;
开关,所述开关被配置来至少在打开位置与关闭位置之间切换,所述一根或更多根电线在所述开关处于所述打开位置中时从所述电源向所述至少一个灯提供电力,并且在所述开关处于所述关闭位置中时不从所述电源向所述至少一个灯提供电力;
面板;
第一麦克风,所述第一麦克风位于所述开关的远端上;
第二麦克风,所述第二麦克风位于所述面板的第一位置处,当所述开关处于所述打开位置中时,所述第一位置靠近所述开关的所述远端;
第三麦克风,所述第三麦克风位于所述面板的第二位置处,当所述开关处于所述关闭位置中时,所述第二位置靠近所述开关的所述远端;
无线网络接口;
一个或更多个处理器;
一个或更多个计算机可读介质,所述一个或更多个计算机可读介质存储计算机可执行指令,所述计算机可执行指令在被执行时致使所述一个或更多个处理器执行动作,所述动作包括:
接收由所述第一麦克风、所述第二麦克风或所述第三麦克风中的至少一个生成的第一音频信号;
对所述第一音频信号执行言语识别;
确定所述第一音频信号包括表示至少一个预定义字词的数据;
确定所述开关处于所述关闭位置中;
对由所述第一麦克风生成的第二音频信号和由所述第三麦克风生成的第三音频信号执行波束成形以生成一个或更多个经处理音频信号;以及
向远程装置并且通过所述无线网络接口发送所述一个或更多个经处理音频信号。
2.如条款错误!参考源未找到.所述的灯开关,所述动作还包括:
从所述远程装置接收打开所述至少一个灯的指令;以及
联接所述一根或更多根电线以致使所述一根或更多根电线在所述开关保持处于所述关闭位置中的同时从所述电源向所述至少一个灯提供电力。
3.如条款错误!参考源未找到.或2所述的灯开关,其中所述第一位置位于所述面板的水平尺寸的约中间处,并且所述第二位置位于所述面板的所述水平尺寸的约所述中间处,并且所述开关还包括:
第四麦克风,所述第四麦克风与所述第二麦克风基本上水平对齐地并且朝向所述面板的左侧定位;
第五麦克风,所述第五麦克风与所述第二麦克风基本上水平对齐地并且朝向所述面板的右侧定位;
第六麦克风,所述第六麦克风与所述第三麦克风基本上水平对齐地并且朝向所述面板的所述左侧定位;以及
第七麦克风,所述第七麦克风与所述第三麦克风基本上水平对齐地并且朝向所述面板的所述右侧定位。
4.如条款1、2或3中所述的灯开关,其还包括:在所述发送之前,确定由所述第三麦克风和所述第一麦克风限定的第一线与由所述第六麦克风和所述第一麦克风限定的第二线以及由所述第七麦克风和所述第一麦克风限定的第三线相比与陈述所述至少一个预定义字词的用户更加一致。
5.一种设备,其包括:
一根或更多根电线,所述一根或更多根电线用于将所述设备联接到电源和至少一个电力负载;
开关,所述开关被配置来从至少第一位置移动到第二位置,当所述开关处于所述第一位置中时,所述电源电联接到所述至少一个电力负载,而当所述开关处于所述第二位置中时,所述电源与所述至少一个电力负载断开联接;
面板;
第一麦克风,所述第一麦克风位于所述开关上,所述第一麦克风被配置来生成第一音频信号;以及
第二麦克风,所述第二麦克风位于所述面板上,所述第二麦克风被配置来生成第二音频信号。
6.如条款5所述的设备,其还包括:
无线网络接口;
一个或更多个处理器;
一个或更多个计算机可读介质,所述一个或更多个计算机可读介质存储计算机可执行指令,所述计算机可执行指令在被执行时致使所述一个或更多个处理器执行动作,所述动作包括:
对所述第一音频信号和所述第二音频信号执行波束成形以生成一个或更多个经处理音频信号;以及
使用所述无线网络接口向远程装置发送所述一个或更多个经处理音频信号,所述远程装置被配置来对所述一个或更多个经处理音频信号执行言语识别。
7.如条款5所述的设备,其还包括:
一个或更多个处理器;以及
一个或更多个计算机可读介质,所述一个或更多个计算机可读介质存储计算机可执行指令,所述计算机可执行指令在被执行时致使所述一个或更多个处理器执行动作,所述动作包括:
对所述第一音频信号或所述第二音频信号中的至少一个执行言语识别,以进行以下项中的至少一项:识别表示预定义话语的数据,或识别表示与所述至少一个电力负载或另一电力负载有关的语音命令的数据。
8.如条款5所述的设备,其还包括:
无线网络接口;
一个或更多个处理器;以及
一个或更多个计算机可读介质,所述一个或更多个计算机可读介质存储计算机可执行指令,所述计算机可执行指令在被执行时致使所述一个或更多个处理器执行动作,所述动作包括:
对所述第一音频信号或所述第二音频信号中的至少一个执行言语识别;
从所述第一音频信号或所述第二音频信号中的所述至少一个标识表示预定义话语的数据;
对所述第一音频信号和所述第二音频信号执行波束成形以生成一个或更多个经处理音频信号;以及
向远程装置并且通过所述无线网络接口发送所述一个或更多个经处理音频信号。
9.如条款5所述的设备,其中所述第二麦克风位于所述面板上在所述开关处于所述第一位置中时更靠近所述开关的第三位置处,并且所述设备还包括:
第三麦克风,所述第三麦克风位于所述面板上的第四位置处,所述第三麦克风被配置来生成第三音频信号,所述第四位置在所述开关处于所述第一第二位置中时更靠近所述开关;
一个或更多个处理器;以及
一个或更多个计算机可读介质,所述一个或更多个计算机可读介质存储计算机可执行指令,所述计算机可执行指令在被执行时致使所述一个或更多个处理器执行动作,所述动作包括:
确定所述开关处于所述第一位置中;
至少部分地响应于确定所述开关处于所述第一位置中,选择由所述第二麦克风生成的所述第二音频信号以用于进行处理或发送中的至少一项;
确定所述开关处于所述第二位置中;以及
至少部分地响应于确定所述开关处于所述第二位置中,选择由所述第三麦克风生成的所述第三音频信号以用于进行处理或发送中的至少一项。
10.如条款5所述的设备,其还包括:
第三麦克风,所述第三麦克风在所述面板上与所述第二麦克风基本上水平地对齐地定位并且在所述第二麦克风的左侧;以及
第四麦克风,所述第四麦克风在所述面板上与所述第二麦克风基本上水平地对齐地定位并且在所述第二麦克风的右侧。
11.如条款5所述的设备,其还包括按钮,所述按钮可选择来引起以下项中的至少一项:所述第一麦克风生成所述第一音频信号,或所述第二麦克风生成所述第二音频信号。
12.如条款5所述的设备,其中所述开关包括拨杆开关、翘板开关、调光器开关或时间延迟开关。
13.如条款5所述的设备,其中所述至少一个电力负载包括灯、电源插座或家用电器。
14.一种方法,其包括:
接收由驻留在物理开关上的第一麦克风生成的第一音频信号;
接收由第二麦克风生成的第二音频信号;
接收由第三麦克风生成的第三音频信号;
确定所述物理开关驻留在第一位置中;以及
至少部分地基于所述物理开关驻留在所述第一位置中,选择至少所述第一音频信号和所述第二音频信号以用于进行处理。
15.如条款14所述的方法,其中所述选择所述第一音频信号和所述第二音频信号以用于进行处理包括:向远程装置发送所述第一音频信号和所述第二音频信号而不向所述远程装置发送所述第三音频信号。
16.如条款14所述的方法,其中所述选择所述第一音频信号和所述第二音频信号以用于进行处理包括:对所述第一音频信号和所述第二音频信号执行波束成形以生成一个或更多个经处理音频信号,并且所述方法还包括以下项中的至少一项:向远程装置发送所述一个或更多个经处理音频信号,或对所述一个或更多个经处理音频信号执行言语识别。
17.如条款14所述的方法,其还包括:
对所述第一音频信号、所述第二音频信号或所述第三音频信号中的至少一个执行言语识别;以及
确定所述第一音频信号、所述第二音频信号或所述第三音频信号中的所述至少一个包括表示预定义话语的数据;
并且其中所述选择所述第一音频信号和所述第二音频信号以用于进行处理进一步至少部分地基于确定所述第一音频信号、所述第二音频信号或所述第三音频信号中的所述至少一个包括表示所述预定义话语的所述数据。
18.如条款14所述的方法,其还包括:
确定所述物理开关驻留在第二位置中;以及
至少部分地响应于确定所述物理开关驻留在所述第二位置中,选择至少所述第一音频信号和所述第三音频信号以用于进行处理。
19.如条款14所述的方法,其还包括:
接收由第四麦克风生成的第四音频信号,所述第四麦克风与所述第二麦克风基本上水平对齐地驻留;
确定由所述第二麦克风和所述第一麦克风限定的第一线比由所述第四麦克风和所述第一麦克风限定的第二线更接近地指向音频源;
并且其中所述选择所述第一音频信号和所述第二音频信号以用于进行处理进一步至少部分地基于确定所述第一线比所述第二线更接近地指向所述音频源。
20.如条款14所述的方法,其中:
所述接收所述第一音频信号包括:接收由驻留在灯开关的物理开关上的所述第一麦克风生成的所述第一音频信号;
所述接收所述第二音频信号包括:接收由驻留在所述灯开关的面板的顶部部分上的所述第二麦克风生成的所述第二音频信号;并且
所述接收所述第三音频信号包括:接收由驻留在所述灯开关的所述面板的底部部分上的所述第三麦克风生成的所述第三音频信号。
虽然已用特定于结构特征的语言描述了主题,但是应理解,所附权利要求中限定的主题不必限于所描述的具体特征。相反,具体特征作为实施权利要求的说明性形式来公开。
Claims (21)
1.一种用于通过言语与计算设备交互的设备,其包括:
一根或更多根电线,所述一根或更多根电线用于将所述设备联接到位于建筑物内的交流(AC)电源以及至少一个电力负载;
开关,所述开关被配置为从至少第一位置移动到第二位置,当所述开关处于所述第一位置时,所述AC电源电联接到所述至少一个电力负载,而当所述开关处于所述第二位置时,所述AC电源与所述至少一个电力负载断开联接;
面板;以及
第一麦克风,所述第一麦克风靠近所述面板,并且所述第一麦克风被配置为生成第一音频信号;
第二麦克风,所述第二麦克风靠近所述面板,并且所述第二麦克风被配置为生成第二音频信号;
一个或更多个处理器;
一个或更多个计算机可读介质,所述一个或更多个计算机可读介质存储计算机可执行指令,所述计算机可执行指令在被执行时使所述一个或更多个处理器执行动作,所述动作包括:
确定所述开关处于所述第一位置;
部分地基于确定所述开关处于所述第一位置,选择所述第一音频信号或所述第二音频信号中的一个,用于处理或发送至远程装置。
2.如权利要求1所述的设备,还包括:无线网络接口;其中所述一个或更多个计算机可读介质还存储计算机可执行指令,所述计算机可执行指令在被执行时使所述一个或更多个处理器执行动作,所述动作包括:
对所述第一音频信号和所述第二音频信号执行波束成形以生成一个或更多个经处理的音频信号;以及
使用所述无线网络接口向远程装置发送所述一个或更多个经处理的音频信号,所述远程装置被配置为使用所述一个或更多个经处理的音频信号来执行言语识别。
3.如权利要求1或2所述的设备,其中所述一个或更多个计算机可读介质还存储计算机可执行指令,所述计算机可执行指令在被执行时使所述一个或更多个处理器执行动作,所述动作包括:
使用所述第一音频信号来执行言语识别以进行以下项中的至少一项:标识表示预定义话语的数据,或标识表示与设备有关的语音命令的数据。
4.如权利要求1或2所述的设备,其中所述第二麦克风靠近所述开关;并且其中所述一个或更多个计算机可读介质还存储计算机可执行指令,所述计算机可执行指令在被执行时使所述一个或更多个处理器执行动作,所述动作包括:
使用所述第一音频信号或所述第二音频信号中的至少一个来执行言语识别;
标识表示预定义话语的数据;
对所述第一音频信号和所述第二音频信号执行波束成形以生成一个或更多个经处理的音频信号;以及
向远程装置并且发送所述一个或更多个经处理的音频信号。
5.如权利要求1所述的设备,其中所述第一麦克风位于所述面板上的第三位置处并且所述第二麦克风位于所述开关上,所述设备还包括:
第三麦克风,所述第三麦克风位于所述面板上的第四位置处,所述第三麦克风被配置为生成第三音频信号,当所述开关处于所述第一位置时,所述第二麦克风更靠近所述第三位置,并且在所述开关处于所述第二位置时,所述第二麦克风更靠近所述第四位置;其中所述一个或更多个计算机可读介质还存储计算机可执行指令,所述计算机可执行指令在被执行时致使所述一个或更多个处理器执行动作,所述动作包括:
确定所述开关处于所述第一位置中;
部分地基于确定所述开关处于所述第一位置中,选择所述第一音频信号以用于进行处理或发送至所述远程装置中的至少一项;
确定所述开关处于所述第二位置中;以及
部分地基于确定所述开关处于所述第二位置中,选择所述第三音频信号以用于进行处理或发送至所述远程装置中的至少一项。
6.如权利要求1所述的设备,其中所述第二麦克风位于所述开关上,并且所述设备还包括:
第三麦克风,所述第三麦克风靠近所述面板并且与所述第一麦克风基本上水平对齐地定位并且所述第三麦克风在所述第一麦克风的第一侧上;以及
第四麦克风,所述第四麦克风靠近所述面板并且与所述第一麦克风基本上水平地对齐地定位并且所述第三麦克风和所述第四麦克风在所述第一麦克风的第二侧上。
7.如权利要求1所述的设备,其还包括按钮,所述按钮可选择来致使所述第一麦克风生成所述第一音频信号。
8.如权利要求1所述的设备,其中所述开关包括拨杆开关、翘板开关、调光器开关或时间延迟开关。
9.如权利要求1所述的设备,其中所述至少一个电力负载包括灯、电源插座或家用电器。
10.一种用于通过言语与计算设备交互的方法,其包括:
接收由位于靠近所述计算设备的面板的第一麦克风生成的第一音频信号;
接收由靠近所述面板的第二麦克风生成的第二音频信号;确定所述计算设备的开关驻留在相对于所述面板的第一位置中,所述开关在至少所述第一位置和相对于所述面板的第二位置之间可移动;以及
至少部分地基于确定所述开关驻留在所述第一位置中,选择所述第一音频信号和所述第二音频信号中的一个以用于进行处理或发送至远程装置。
11.如权利要求10所述的方法,还包括:
接收由靠近所述面板的第三麦克风生成的第三音频信号,
其中所述选择所述第一音频信号和所述第二音频信号以用于进行处理包括:向远程装置发送所述第一音频信号和所述第二音频信号而不向所述远程装置发送所述第三音频信号。
12.如权利要求10所述的方法,还包括:
对所述第一音频信号和所述第二音频信号执行波束成形以生成一个或更多个经处理音频信号,并且
向所述远程装置发送所述一个或更多个经处理音频信号,或使用所述一个或更多个经处理音频信号来执行言语识别。
13.如权利要求10所述的方法,其还包括:
接收由靠近所述面板的第三麦克风生成的第三音频信号,
使用所述第一音频信号、所述第二音频信号或所述第三音频信号中的至少一个来执行言语识别;以及
确定所述第一音频信号、所述第二音频信号或所述第三音频信号中的所述至少一个包括表示预定义话语的数据;
并且其中所述选择所述第一音频信号或所述第二音频信号以用于进行处理进一步至少部分地基于确定所述第一音频信号或所述第二音频信号中的所述至少一个包括表示所述预定义话语的所述数据。
14.如权利要求10所述的方法,其还包括:
接收由靠近所述面板的第三麦克风生成的第三音频信号,
确定所述开关处于所述第二位置中;以及
至少部分地响应于确定所述开关处于所述第二位置中,选择所述第一音频信号和所述第三音频信号以用于进行处理。
15.如权利要求10所述的方法,还包括:
接收由靠近所述面板的第三麦克风生成的第三音频信号;
所述第二麦克风靠近所述面板的顶部;并且
所述第三麦克风靠近所述面板的底部。
16.一种用于通过言语与计算设备交互的设备,包括:
外壳,被配置为附接至包括电源的建筑物的一部分;
电路,联接至所述外壳并被配置为将所述设备联接至所述电源以及电力负载;
开关,被配置为从至少第一位置移动到第二位置,在所述第一位置中,所述电源被联接至所述电力负载,在所述第二位置中,所述电源被从所述电力负载断开联接;
第一麦克风;
第二麦克风
网络接口;
一个或更多个处理器;以及
一个或更多个计算机可读介质,所述一个或更多个计算机可读介质存储计算机可执行的指令,当所述计算机可执行指令被执行时,使得所述一个或更多个处理器执行动作,所述动作包括:
基于由所述第一麦克风生成的第一音频信号或由所述第二麦克风生成的第二音频信号,标识预定义话语;以及
一旦标识了所述预定义话语并且基于所述开关的位置,利用所述网络接口,将所述第一音频信号或所述第二音频信号发送至远程装置。
17.如权利要求16所述的设备,还包括面板,其中,所述第一麦克风布置在所述面板上,并且所述第二麦克风布置在所述面板上。
18.如权利要求16所述的设备,还包括面板,其中,所述第一麦克风布置在所述面板上,并且所述第二麦克风布置在所述开关上。
19.如权利要求16所述的设备,其中所述第一音频信号或所述第二音频信号表示用以打开所述电力负载的语音命令,并且所述动作还包括:
从所述远程装置接收用以打开所述电力负载的指令;以及
将所述电源联接至所述电力负载,以打开所述电力负载。
20.如权利要求16所述的设备,其中所述第一音频信号或所述第二音频信号表示用以关闭所述电力负载的语音命令,并且所述动作还包括:
从所述远程装置接收用以关闭所述电力负载的指令;以及
将所述电源从所述电力负载断开联接,以关闭所述电力负载。
21.如权利要求16所述的设备,还包括按钮,所述按钮可选择来引起所述第一麦克风或所述第二麦克风捕获声音,所述第一音频信号或所述第二音频信号从所述声音生成。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/980,392 | 2015-12-28 | ||
US14/980,392 US9826599B2 (en) | 2015-12-28 | 2015-12-28 | Voice-controlled light switches |
PCT/US2016/068758 WO2017117149A1 (en) | 2015-12-28 | 2016-12-27 | Voice-controlled light switches |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108605001A CN108605001A (zh) | 2018-09-28 |
CN108605001B true CN108605001B (zh) | 2021-10-22 |
Family
ID=58018197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680070020.3A Active CN108605001B (zh) | 2015-12-28 | 2016-12-27 | 语音控制灯开关 |
Country Status (4)
Country | Link |
---|---|
US (2) | US9826599B2 (zh) |
EP (1) | EP3398298B1 (zh) |
CN (1) | CN108605001B (zh) |
WO (1) | WO2017117149A1 (zh) |
Families Citing this family (93)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11592723B2 (en) | 2009-12-22 | 2023-02-28 | View, Inc. | Automated commissioning of controllers in a window network |
US11054792B2 (en) | 2012-04-13 | 2021-07-06 | View, Inc. | Monitoring sites containing switchable optical devices and controllers |
US10964320B2 (en) * | 2012-04-13 | 2021-03-30 | View, Inc. | Controlling optically-switchable devices |
US20240046928A1 (en) * | 2012-04-13 | 2024-02-08 | View, Inc. | Controlling optically-switchable devices |
US9351060B2 (en) | 2014-02-14 | 2016-05-24 | Sonic Blocks, Inc. | Modular quick-connect A/V system and methods thereof |
RU2019109013A (ru) | 2014-03-05 | 2019-05-06 | Вью, Инк. | Мониторинг объектов, содержащих переключаемые оптические устройства и контроллеры |
US9826599B2 (en) | 2015-12-28 | 2017-11-21 | Amazon Technologies, Inc. | Voice-controlled light switches |
WO2017138934A1 (en) * | 2016-02-10 | 2017-08-17 | Nuance Communications, Inc. | Techniques for spatially selective wake-up word recognition and related systems and methods |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9820039B2 (en) | 2016-02-22 | 2017-11-14 | Sonos, Inc. | Default playback devices |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10880284B1 (en) * | 2016-08-19 | 2020-12-29 | Amazon Technologies, Inc. | Repurposing limited functionality devices as authentication factors |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
CN106898348B (zh) * | 2016-12-29 | 2020-02-07 | 北京小鸟听听科技有限公司 | 一种出声设备的去混响控制方法和装置 |
CN106782585B (zh) * | 2017-01-26 | 2020-03-20 | 芋头科技(杭州)有限公司 | 一种基于麦克风阵列的拾音方法及系统 |
US11489691B2 (en) | 2017-07-12 | 2022-11-01 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US10930276B2 (en) | 2017-07-12 | 2021-02-23 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US9949344B1 (en) * | 2017-07-31 | 2018-04-17 | Amazon Technologies, Inc. | Computing-device lighting schemas |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
US10847174B2 (en) * | 2017-12-20 | 2020-11-24 | Hubbell Incorporated | Voice responsive in-wall device |
US20190199545A1 (en) | 2017-12-27 | 2019-06-27 | Leviton Manufacturing Co., Inc. | Wireless enabled load control device with voice controller |
CA3088887C (en) | 2018-01-09 | 2022-11-29 | Lutron Technology Company Llc | Device for powering a modular assembly |
CN108347813B (zh) * | 2018-01-29 | 2019-11-05 | 安徽建筑大学 | 一种智能建筑领域楼宇照明控制系统 |
WO2019152722A1 (en) | 2018-01-31 | 2019-08-08 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
EP3777485B1 (en) * | 2018-04-02 | 2022-11-16 | Signify Holding B.V. | System and methods for augmenting voice commands using connected lighting systems |
CN108594777B (zh) * | 2018-04-20 | 2020-03-13 | 百度在线网络技术(北京)有限公司 | 智能家居控制方法、装置、设备、系统及存储介质 |
US11237796B2 (en) * | 2018-05-07 | 2022-02-01 | Google Llc | Methods, systems, and apparatus for providing composite graphical assistant interfaces for controlling connected devices |
KR102550415B1 (ko) | 2018-05-09 | 2023-07-05 | 삼성전자주식회사 | Led 장치 및 이를 이용한 led 램프 |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
EP3573031B1 (en) * | 2018-05-24 | 2022-05-11 | Infineon Technologies AG | System and method for surveillance |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
WO2020018536A1 (en) | 2018-07-17 | 2020-01-23 | iT SpeeX LLC | Method, system, and computer program product for communication with an intelligent industrial assistant and industrial machine |
US11514178B2 (en) | 2018-07-17 | 2022-11-29 | iT SpeeX LLC | Method, system, and computer program product for role- and skill-based privileges for an intelligent industrial assistant |
US11232262B2 (en) | 2018-07-17 | 2022-01-25 | iT SpeeX LLC | Method, system, and computer program product for an intelligent industrial assistant |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) * | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
WO2020163861A1 (en) | 2019-02-08 | 2020-08-13 | iT SpeeX LLC | Method, system, and computer program product for developing dialogue templates for an intelligent industrial assistant |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
CN109991675B (zh) * | 2019-03-26 | 2020-11-10 | 中国石油化工股份有限公司 | 利用原油中萜烷绝对含量确定原油成熟度的方法 |
US11892810B1 (en) * | 2019-04-23 | 2024-02-06 | Josh.Ai, Inc. | Contextual home automation toggle |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
CN110234043B (zh) * | 2019-05-31 | 2020-08-25 | 歌尔科技有限公司 | 基于麦克风阵列的声音信号处理方法、装置及设备 |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
JP7367963B2 (ja) * | 2019-09-05 | 2023-10-24 | 学校法人上智学院 | 音声の検出のための補助装置 |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
USD928729S1 (en) * | 2020-02-28 | 2021-08-24 | Enerlites, Inc. | Duplex paddle switch with changeable LED module |
USD928730S1 (en) * | 2020-02-28 | 2021-08-24 | Enerlites, Inc. | Triple paddle switch with changeable LED module |
USD931238S1 (en) * | 2020-03-30 | 2021-09-21 | Wenzhou Mtlc Electric Appliances Co., Ltd. | Butterfly dimmer |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
CN111833874B (zh) * | 2020-07-10 | 2023-12-05 | 上海茂声智能科技有限公司 | 一种基于标识符的人机交互方法、系统、设备和存储介质 |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7418392B1 (en) * | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
CN101262728A (zh) * | 2007-03-07 | 2008-09-10 | 最优创新公司 | 用作通信设备的灯开关 |
CN104488025A (zh) * | 2012-03-16 | 2015-04-01 | 纽昂斯通讯公司 | 用户专用的自动语音识别 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4090032A (en) * | 1976-05-05 | 1978-05-16 | Wm. A. Holmin Corporation | Control system for audio amplifying system having multiple microphones |
US5914826A (en) | 1996-07-24 | 1999-06-22 | Logic Laboratories, Inc. | Light switch cover plate with audio recording and playback feature |
US6188986B1 (en) | 1998-01-02 | 2001-02-13 | Vos Systems, Inc. | Voice activated switch method and apparatus |
US20120105740A1 (en) * | 2000-06-02 | 2012-05-03 | Oakley, Inc. | Eyewear with detachable adjustable electronics module |
US20030179894A1 (en) * | 2002-03-21 | 2003-09-25 | Siemens Hearing Instruments, Inc. | Directional microphone hearing aid system |
US8882288B2 (en) * | 2009-09-15 | 2014-11-11 | Strabo Pro Productions, Inc. | Purselight with EL and LED light sources |
CN102118661A (zh) * | 2009-12-30 | 2011-07-06 | 富准精密工业(深圳)有限公司 | 麦克风模组 |
KR101067387B1 (ko) * | 2011-04-15 | 2011-09-23 | (주)알고코리아 | 무선 광통신을 이용한 보청 시스템 |
DE102011083209B3 (de) * | 2011-09-22 | 2013-01-17 | Siemens Medical Instruments Pte. Ltd. | IDO-Hörinstrument mit Programmierbuchse |
US9060224B1 (en) | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
US9871974B2 (en) * | 2014-12-05 | 2018-01-16 | Amx, Llc | Computing device camera view controller and shutter |
US9826599B2 (en) | 2015-12-28 | 2017-11-21 | Amazon Technologies, Inc. | Voice-controlled light switches |
-
2015
- 2015-12-28 US US14/980,392 patent/US9826599B2/en active Active
-
2016
- 2016-12-27 CN CN201680070020.3A patent/CN108605001B/zh active Active
- 2016-12-27 WO PCT/US2016/068758 patent/WO2017117149A1/en unknown
- 2016-12-27 EP EP16836191.3A patent/EP3398298B1/en active Active
-
2017
- 2017-11-20 US US15/818,524 patent/US10251244B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7418392B1 (en) * | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
CN101262728A (zh) * | 2007-03-07 | 2008-09-10 | 最优创新公司 | 用作通信设备的灯开关 |
CN104488025A (zh) * | 2012-03-16 | 2015-04-01 | 纽昂斯通讯公司 | 用户专用的自动语音识别 |
Also Published As
Publication number | Publication date |
---|---|
EP3398298A1 (en) | 2018-11-07 |
US10251244B1 (en) | 2019-04-02 |
WO2017117149A1 (en) | 2017-07-06 |
CN108605001A (zh) | 2018-09-28 |
US9826599B2 (en) | 2017-11-21 |
US20170188437A1 (en) | 2017-06-29 |
EP3398298B1 (en) | 2022-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108605001B (zh) | 语音控制灯开关 | |
US11902707B1 (en) | Location based device grouping with voice control | |
US11455994B1 (en) | Identifying a location of a voice-input device | |
US11429345B2 (en) | Remote execution of secondary-device drivers | |
US9729821B1 (en) | Sensor fusion for location based device grouping | |
US11900930B2 (en) | Method and apparatus for managing voice-based interaction in Internet of things network system | |
US10354649B2 (en) | Altering audio to improve automatic speech recognition | |
US10755706B2 (en) | Voice-based user interface with dynamically switchable endpoints | |
US10672387B2 (en) | Systems and methods for recognizing user speech | |
US10726835B2 (en) | Voice activated modular controller | |
KR102551715B1 (ko) | Iot 기반 알림을 생성 및 클라이언트 디바이스(들)의 자동화된 어시스턴트 클라이언트(들)에 의해 iot 기반 알림을 자동 렌더링하게 하는 명령(들)의 제공 | |
US11722985B2 (en) | Object tracking and authentication using modular wall units | |
US20200301378A1 (en) | Deducing floor plans using modular wall units | |
US9973732B1 (en) | Device selection for video based communications | |
US20180270576A1 (en) | Voice activated modular controller | |
US10284695B1 (en) | Voice-enabled modular devices | |
US10874011B1 (en) | Communication interface for front panel and power module | |
WO2019183257A1 (en) | Modular wall unit system | |
CN111630413B (zh) | 基于置信度的应用特定的用户交互 | |
CN114175145A (zh) | 多模态智能音频设备系统注意力表达 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |