CN107077316A - 基于功率和感测的分布式语音输入处理 - Google Patents
基于功率和感测的分布式语音输入处理 Download PDFInfo
- Publication number
- CN107077316A CN107077316A CN201580038555.8A CN201580038555A CN107077316A CN 107077316 A CN107077316 A CN 107077316A CN 201580038555 A CN201580038555 A CN 201580038555A CN 107077316 A CN107077316 A CN 107077316A
- Authority
- CN
- China
- Prior art keywords
- audio
- auxiliary equipment
- audio frequency
- input
- telegon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/1613—Constructional details or arrangements for portable computers
- G06F1/163—Wearable computers, e.g. on a belt
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3209—Monitoring remote activity, e.g. over telephone lines or network connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3215—Monitoring of peripheral devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/0346—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of the device orientation or free movement in a 3D space, e.g. 3D mice, 6-DOF [six degrees of freedom] pointers using gyroscopes, accelerometers or tilt-sensors
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Hardware Design (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
描述了在分布式音频处理系统中协调音频处理的技术。供电优先计算设备包括音频处理协调器以通过在网络中的该供电优先设备和辅助计算设备协调音频信号的捕获和处理。该网络可以是个域网。该音频处理协调器可基于确定该供电优先设备不足以捕获或处理该音频的结果而唤醒辅助设备以捕获或处理音频。
Description
背景技术
现代服装和其它可穿戴配件可纳入计算或其它先进的电子技术。可因为各种功能性的原因或纯粹的审美原因而纳入这些计算和/或先进电子技术。这些服装和其它可穿戴配件一般被称为“可穿戴技术”或“可穿戴计算设备”。
应理解,可穿戴技术的能耗是首要关注的问题。就这一点而言,一些可穿戴技术包括能量收集功能。例如,压电设备、太阳能电池设备、动力学设备等等可被用作能量收集和为电子组件供电或为可穿戴技术内包括的电源充电。
由于各种因素,适于与能量收集设备一起使用的可穿戴技术的类型会是有限的。例如,鞋是理想的可穿戴物件,以由于走路和跑步所涉及的力而将能量收集设备纳入。然而,对于某些其它的电子技术,鞋不是理想的位置。例如,鞋的正常使用可导致对音频捕获或处理技术的干扰。
因此,为支持期望的功能而纳入某些电子技术,并在相同的可穿戴设备中提供能量收集,可能会是成问题的。本发明正是关于上面的问题而提供的。
附图简述
图1示出了音频处理系统的实施例。
图2-3示出了图1的音频处理系统的部分的示例。
图4-5示出了根据实施例的逻辑流示例。
图6示出了根据实施例的存储介质。
图7示出了根据实施例的处理架构。
具体实施方式
各种实施例总体上涉及一种系统,其中在该系统中的一个设备被指定为供电优先(power preferred)设备。该系统可由组织在例如个域网(PAN)的网络中的多个设备组成。大体上,供电优先设备监听音频输入(如音频信号、语音命令等等)。一旦接收或检测到音频输入,供电优先设备可(i)自己处理音频或(ii)指示系统中的另一个设备处理音频。例如,供电优先设备在检测到音频信号时可以不仅捕获音频信号,而且唤醒辅助设备也捕获音频。然后依赖于供电优先设备捕获的音频的质量,供电优先设备可处理音频或可指示辅助设备处理音频。
应理解,这只是本公开的一个示例,并且本文也描述了其它示例。就这一点而言,上面的大体描述并不意在限制。
现在参考附图,其中自始至终类似的参考数字用于指代类似元件。在接下来的描述中,为了解释的目的,阐述了各种特定的细节以提供对其的全面理解。然而显而易见的是可实施新的实施例而不需要这些特定细节。在其它实例中,以框图的形式显示周知的结构和设备以便于对其的描述。意图覆盖权利要求书范围内的所有变形、等同和替换。
图1是将供电优先计算设备100和数个辅助计算设备200-a包括在内的音频处理系统1000的实施例的框图,其中a是正整数。如图所示,示出了两个辅助计算设备200-1和200-2。应理解,以数量显示辅助计算设备200-a的数字是为了便于理解并且并不意在限制。尤其是,系统1000可利用比描述的更多或更少的辅助计算设备实现。进一步要注意,重要的是,虽然供电优先计算设备100被描述为与辅助设备200-1和200-2不同(如包括至少一个不同的组件),但是在一些示例中,设备100、200-1以及200-2也可能相同。在这样的示例中,如下面将要详细描述的那样,系统中的设备之一可选择成为或被指定为“供电优先计算设备”的角色。如本文所用,“供电优先计算设备”意指如本文描述的协调音频处理的设备。
大体上,描述了供电优先计算设备100被配置为在系统1000内检测音频信号并且协调音频信号的处理。尤其是,供电优先计算设备100被配置为协调音频信号的处理,以使得辅助计算设备200-1、200-2间的电力消耗最小化。尤其是,供电优先计算设备100的音频捕获组件或特征可以是活动的(active),而辅助设备200-1和200-2的音频捕获组件或特征是非活动的(inactive)。一旦检测到音频信号400,供电优先计算设备100可“唤醒”辅助设备200-1和200-2中的一个或多个以处理音频信号400。
在各种实施例中,供电优先计算设备100纳入了处理器组件110、存储120、音频输入设备130、电源140、能量收集设备150、接口160和传感器170中的一个或多个。存储120存储以下一个或多个:控制例程121、音频输入122、传感器读取123、上下文特性124、辅助设备列表125、辅助设备指令126、以及处理过的音频127。
在各种实施例中,每一个辅助计算设备200-1和200-2包括处理器组件210、存储220、音频输入设备230、电源240和接口260中的一个或多个。每一个存储220存储控制例程221、音频输入222、处理过的音频223、以及辅助设备指令126的一个或多个。
如图所描述的,供电优先计算设备100和辅助计算设备200-1和200-2可操作地通过网络300连接。尤其是,计算设备100、200-1和200-2可通过网络300交换传递信息(如唤醒信息、音频处理指令等等)的信号。此外,计算设备100、200-1和200-2可通过网络300交换与音频处理完全无关的其他数据。计算设备100、200-1和200-2可将包括音频处理信息的信号通过网络300彼此交换以及与其它计算设备(未示出)交换。
在各种实施例中,网络300可以是很可能限于在单个建筑物或其它相对有限区域内扩展的单个网络、很可能扩展到相当远的距离的连接的网络组合、和/或可包括互联网。因此,网络300可基于通过其可交换信号的通信技术的任意种类(或组合),包括但不限于:采用电导线缆和/或光导线缆的有线技术和采用红外、射频或其它形式的无线传输的无线技术。而且,虽然网络300被示出为无线网络,但是在一些示例中,它也可以是有线网络。
在一些示例中,网络300可对应于PAN。例如,网络300可以是根据一个或多个标准和/或技术实现的无线PAN。尤其是,网络300可根据IrDA、无线USB、蓝牙、Z-波、或紫蜂(ZigBee)技术实现。
在供电优先计算设备100中,控制例程121包括在处理器组件110上操作的指令序列,处理器组件110扮演主处理器组件的角色以实现执行各种功能的逻辑。当执行控制例程121时,处理器组件110(如通过音频输入设备130)接收音频输入122。音频输入122可包括对应于音频信号400的指示。尤其是,当执行控制例程121时,处理器组件110激活音频输入设备130以监听音频信号400。
传感器读取(sensor reading)123可对应于从传感器180接收的一个或多个信号、读数(reading)、指示或信息。在一些示例中,传感器180可包括加速度计。当执行控制例程121时,处理组件110可接收来自加速度计的输出,并将输出存储为传感器读取123。上下文特性124可对应于与音频输入有关的上下文特性。例如,如果传感器读取123对应于来自于加速度计的指示,上下文特性124可包括活动水平指示(如在不动(not moving)和跑动(running)间的范围,等等)。作为另一个示例,上下文特性可包括对应于音频输入122的音频质量(如噪音水平等等)。
辅助设备列表125包括网络300中的辅助设备200-1和200-2的列表。在一些示例中,如将在下面详细描述的那样,列表125也可包括涉及以下的信息:设备125相对于供电优先计算设备100的位置、用户身体的位置(例如嘴,等等)、可用功率的量,等等。
辅助设备指令126包括由辅助设备200-1和200-2中的一个或多个执行的动作的指示。尤其是,辅助设备指令126包括“唤醒”辅助设备200-1和/或200-2的各个不同组件的命令。例如,指令126可包括唤醒主无线电设备(main radio)(如,被通信到无源或低功率无线电设备等等)的指令。例如,指令126可包括唤醒音频输入设备230并且从音频信号400捕获音频输入222的指令、处理音频输入222的指令、处理音频输入222的至少一部分的指令、使得音频输入设备230去激活(deactivate)的指令等等。
当执行控制例程121时,处理器组件110确定是否(i)捕获音频输入122、(ii)从音频输入122生成处理过的音频127、和/或(iii)指示辅助计算设备200-1和200-2中的一个或多个醒来、捕获音频输入222、和/或从音频输入222生成处理过的音频223。
值得注意的是辅助设备指令126可指向辅助计算设备200-1和200-2中的一个或多个。尤其是,辅助设备指令126可基于辅助计算设备列表125指向辅助计算设备200-1和200-2中的一个或多个。例如,指令126可指向辅助计算设备200-1或200-2中的一个,其被指示为相较于供电优先计算设备100更加优化地放置(如相对于音频信号400等等)。
在每一个辅助计算设备200-1和200-2中,控制例程221包括在处理器组件210上操作的指令序列,处理器组件210扮演主处理器组件的角色以实现执行各种功能的逻辑。当执行控制例程221时,处理器组件210接收辅助设备指令126。如上所述,辅助指令126可包括如下指令:其唤醒(或激活)音频输入设备230以从音频信号400捕获音频输入222和/或从音频输入222生成处理过的音频223。
在一些示例中,供电优先计算设备100和辅助计算设备200-1和200-2可以是各种类型的设备中任一种,包括但不限于台式计算机系统、数据输入终端、笔记本电脑、上网本、平板电脑、手持个人数字助理、智能手机、数码照相机、并入服装或可穿戴配件(如鞋、眼镜、手表、项链、衬衫、耳机、帽子等)中的可穿戴计算设备、集成在交通工具(如汽车、自行车、轮椅等)中的计算设备、服务器、服务器集群、服务器农场、工作站、无线工作站、用户装备、如此等等。
在各种实施例中,处理器组件110和/或处理器组件210可包括任意的各种各样的商用处理器。而且,这些处理器组件中的一个或多个可包括多个处理器、多线程处理器、多核处理器(多个核共存在相同或分离的晶片上)、和/或一些其它种类的多处理器架构,通过其多个物理上分离的处理器在某种程度上链接。
在各种实施例中,存储120和/或存储220可基于任意的各种各样的信息存储技术,很可能包括要求不中断电力供应的易失性技术、以及很可能包括需要利用可移除的或不可移除的机器可读存储介质的技术。因而,这些存储中的每一个可包括任意的各个类型(或类型组合)的存储设备,包括但不限于:只读存储器(ROM)、随机存取存储器(RAM)、动态RAM(DRAM)、双数据速率DRAM(DDR-DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)、可编程ROM(PROM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、闪存、聚合物存储器(如铁电聚合物存储器)、奥氏存储器、相变或铁电存储器、硅-氧化物-氮化物-氧化物-硅(SONOS)存储器、磁卡或光卡、一个或多个单个铁磁盘驱动器、或组织成一个或多个阵列的数个存储设备(如被组织成独立磁盘阵列冗余阵列的多个铁磁盘驱动器,或RAID阵列)。应当注意的是,虽然这些存储中的每一个都被描述为单个框,但是这些存储中的一个或多个可包括可以基于不同存储技术的多个存储设备。而且,例如这些描述的存储的每一个的一个或多个可代表光驱动器或闪存卡读取器的组合,其中通过光驱动器或闪存卡读取器可在机器可读存储介质的某些形式上存储并传输程序和/或数据,通过铁磁盘驱动器以在相当长的时间内本地存储程序和/或数据,以及一个或多个易失性固态存储器设备能够相当快的访问程序和/或数据(如SRAM或DRAM)。也应该注意的是,这些存储的每一个可基于相同的存储技术由多个存储组件组成,但是其可被分别维护作为专门用途的结果(如一些DRAM设备用作主存,而其他DRAM设备用作图形控制器的独特的帧缓冲器)。
在各种实施例中,音频输入设备130和/或音频输入设备230可为麦克风。在各种实施例中,电源140和/或电源240可为任意的各种类型的电源(例如可充电电池,或类似物)。
在各种实施例中,能量收集器150可以是任意种类的能量收集设备(如动能捕获设备、压电能量捕获设备、太阳能电池等等)。
在各种实施例中,接口160和/或接口260可采用任意的各种各样的信号技术,其使得计算设备可像已经描述的那样耦合到其它设备。这些接口的每一个可包括提供至少一些必要功能以使能这样的耦合的电路。然而,这些接口的每一个也可以是至少部分地用由对应的处理器组件的一些执行的指令序列实现(如用以执行协议栈或其它功能)。在采用电导和/或光导线缆的情形中,这些接口可采用符合任意种类的工业标准的信号和/或协议,包括但不限于,RS-232C、RS-422、USB、以太网(IEEE-802.3)或IEEE-1394。在需要使用无线信号传输的情形中,这些接口可采用符合任意种类的工业标准的信号和/或协议,包括但不限于,IEEE 802.11a、802.11b、802.11g、802.11n、802.16、802.20(一般被称作“移动宽带无线接入”);蓝牙;紫蜂(ZigBee);或蜂窝式无绳电话服务,如具有通用分组无线服务的GSM(GSM/GPRS)、CDMA/1xRTT、增强的全局演进数据速率(EDGE)、仅数据演进/优化(EV-DO)、数据和语音演进(EV-DV)、高速下行链路分组接入(HSDPA)、高速上行链路分组接入(HSUPA)、4G LTE等。
在一些示例中,接口160和260可包括能被无源唤醒的低功率无线电设备(lowpower radio)。例如,接口160和260可包括射频识别(RFID)无线电设备,其被配置为操作在低功率状态直到被激活,就像例如被配置为遵守无线ID和传感平台(WISP)TM而操作的无线电设备。如上所述,这些无线电设备可以被配置为根据任意不同种类的无线技术(如蓝牙、ANT等等)来操作。
图2-3是图1的音频处理系统1000的实施例的部分的框图。大体上,图2-3示出了系统1000的操作的方方面面。尤其是,图2示出了供电优先计算设备100的实施例,其被配置为协调音频信号400的捕获和/或处理,而图3示出了辅助计算设备200-1的实施例,其被配置为被供电优先计算设备100所指示的那样捕获和/或处理音频信号400。
在各种实施例中,控制例程121和/或控制例程221包括以下一个或多个:操作系统、设备驱动器和/或应用级的例程(如所谓的在磁盘介质上提供的“软件套件”、从远程服务器上获得的“小程序(applet)”等)。在包括操作系统的情形中,操作系统可以是任意类型的可用的操作系统,适于对应于处理器组件110和/或210的任意一个。在包括一个或多个设备驱动器的情形中,这些设备驱动器可以为计算机系统100和/或200的任意类型的其它组件提供支持,无论是硬件或软件组件。
转向更详细的图2,控制例程121包括音频检测器1211、音频记录器1212、音频处理器1214、音频处理协调器1215、以及上下文引擎1216。
大体上,控制例程121检测音频信号400以及协调音频信号400的捕获和处理以维持由系统1000消耗的功率。尤其是,控制例程121利用一个或多个功率敏感设备(如辅助计算设备200-1和200-2)协调音频信号的捕获(如音频信号的录制)和处理,其中功率敏感设备可具有更高保真度或更优化放置的音频输入设备,但是比供电优先计算设备100具有更大的功率限制。
音频检测器1211检测音频信号400。音频检测器操作在音频输入设备130上以检测音频信号400。在一些示例中,音频检测器1211检测所有的听得见的信号400。音频记录器1212捕获音频信号400作为音频输入122。大体上,音频记录器1212将音频输入122保存在存储120中,如此音频输入122包括音频信号400的指示。在各种实施例中,音频输入可以是任意种类的文件类型或可以用各种不同的音频编码方案编码(如MP3、WAV、PSM等等)。音频处理器。音频处理器1213处理音频输入122以生成处理过的音频127。大体上,音频处理器1213可在音频输入122上执行多种的音频处理中任一种。例如,音频处理器1213可执行语音识别处理、噪音过滤、音频质量提高等等。
上下文引擎1215生成上下文特性124。在一些实施例中,上下文引擎1215可操作地连接到传感器170以接收与对于供电优先计算设备的条件有关的输入(如传感器输出)。例如,在一些实施例情形中,传感器170是加速度计。据此,上下文引擎1215可接收加速度计输出以及确定对应于供电优先计算设备的活动水平。在特定的示例中,供电优先计算设备可被实现在可穿戴计算设备中,比方说例如鞋子。如此,上下文引擎1215可确定鞋是否被穿着,鞋子是否正被穿着走路,鞋子是否正被穿着慢跑等等。上下文引擎1215可生成包括这个活动水平的指示的上下文特性。
在一些示例中,上下文特性对应于音频输入的音频质量。尤其是,上下文引擎1215可被操作地耦合到音频检测器1211、音频记录器1212和/或音频处理器1213以接收音频输入122内的噪音指示、音频输入122是否能被音频处理器1213处理、音频输入122的部分是否能被处理等等。例如,对于包括在1到10间的周期的音频输入,上下文特性可包括音频处理器1213不能处理周期3到5的指示。作为另一个示例,上下文特性可包括由音频检测器1211检测到的噪音(如环境噪音、白噪音等)的水平的指示。
大体上,音频处理协调器1214确定是否唤醒辅助设备200-1或200-2之一、是否在供电优先计算设备(如通过音频处理器1213)上处理音频输入122、以及还确定是否指示辅助设备之一处理音频(如参考图3)。
音频处理协调器1214被配置为确定是否唤醒辅助设备以及基于上下文特性124和设备列表125确定唤醒哪一个辅助设备。大体上,可由音频处理协调器生成设备列表125。可基于系统1000内的条件改变在操作期间动态更新它。例如,设备列表125可列出活动设备(如供电优先设备100、辅助设备200等等)。设备列表125也可包括与每个设备有关的度量的指示。例如,设备列表125可包括每个设备可用功率电平、每个设备的音频输入保真度、每个设备的音频源头(如用户的嘴,等等)的接近度的指示。
在一些示例中,如上所示,上下文特性124包括对应于音频输入122的音频质量的指示。音频处理协调器1214可确定音频质量(如在上下文特性124中所反映的)是否超过音频质量阈值。而且,音频质量处理协调器1214可基于确定音频质量没超过音频质量阈值来确定唤醒辅助设备(如辅助设备200-1和/或200-2)。音频处理协调器1214可基于确定音频质量超过音频质量阈值来确定不唤醒辅助设备(如辅助设备200-1和/或200-2)。
当音频处理协调器1214唤醒了辅助计算设备,音频处理协调器1214生成一个或多个辅助设备指令126。辅助设备指令可包括对处理器组件110的指示以在网络接口上操作和传送唤醒信号到对应于要被唤醒的辅助设备的网络接口。
在一些示例中,正如提醒注意的那样,网络接口(如160和/或260)可以是无源无线电设备(如RFID无线电设备、蓝牙无线电设备、ANT无线电设备等等)。而且,在一些示例中,网络接口可包括无源无线电设备和网络无线电设备两者。例如,网络接口可包括RFID无线电设备和Wi-Fi无线电设备。据此,辅助设备指令可包括传送给无源无线电设备以唤醒网络无线电设备的指示。
在一些示例中,辅助设备指令126包括对辅助设备打开它的音频输入设备和捕获音频信号的辅助拷贝的指示(参考图3)。
在一些示例中,辅助设备指令126包括辅助设备处理至少一部分辅助音频输入的指示。例如,如上所示,上下文特性124可包括部分音频输入未能被处理或部分音频输入的音频质量未超过音频质量阈值的指示。如此,辅助设备指令126可包括处理与这部分音频输入相对应的部分辅助音频输入的指示。
音频处理协调器可通过选择具有最大可用电力的辅助设备、具有最高保真度音频的设备、相对于音频信号具有最优放置(most optimally placed with respect to theaudio signal)的设备等等来确定唤醒哪一个辅助设备。在一些示例中,音频处理协调器1214可通过对每一个具有每一个辅助设备的可用电力的辅助设备平衡音频输入设备的保真度来确定唤醒哪一个辅助设备。例如,可选择具有高可用电力但是低音频输入保真度的设备,在由上下文特性指示的音频质量没有低到足以阻止这个特定的辅助设备被使用的情形中。
此外,音频处理器2212可从辅助计算设备200接收处理过的音频(如处理过的音频223)。在一些示例中,处理过的音频223可与处理过的音频127组合。例如,如果处理过的音频127对应于音频输入122的一部分,而处理过的音频223对应于音频输入222的不同的一部分,可与处理过的音频相组合以形成对应于音频信号400的处理过的音频的更加完整的重建。
在一些示例中,系统1000可包括数个设备,其被配置为供电优先设备100。更具体的,系统1000可包括多个包括控制例程121的计算设备。在这个示例中,音频处理协调器1214可被选择成为供电优先设备。作为另一个示例,音频处理协调器1214可指定系统1000内的另一个设备成为供电优先设备。例如,如上所示,设备列表125可包括:系统1000内的可用设备,以及它们的可用电力的列表。此外,设备列表可包括可用设备的特征指示(如设备是否包括能量收集组件,等等)。具有最大功率量的设备和/或具有意欲特征(如能量收集)的设备,可被选择成为或可被指定为供电优先设备。
更加具体的转向图3,控制例程221包括音频记录器2211和音频处理器2212。大体上,控制例程221从供电优先设备100接收辅助设备指令126。如上所述,可通过无源无线电设备由辅助设备上的电力传送辅助设备指令126。一旦给一个开始供电,辅助设备指令126可使得设备200-a记录音频信号400。尤其是,辅助设备指令可包括对于音频控制器2211的指令以从音频信号400记录音频输入222。本文可将音频输入222称作辅助音频输入。辅助设备指令126也可包括对于音频处理器2212的指令以处理音频输入222的至少一部分,其结果是处理过的音频223。而且,辅助设备指令126可包括传送处理过的音频223到供电优先计算设备100的指令。
图4-5示出了由系统1000内的组件执行的逻辑流的示例实施例。所示的逻辑流可以表示由本文描述的一个或多个实施例执行的一些或所有操作。更具体的,逻辑流可示出由处理器组件110在执行至少控制例程121的过程中执行的操作。虽然参考附图1-3描述了逻辑流,但是示例并不限于这个上下文中。
更加具体的转向图4,描述了逻辑流500。逻辑流500可始于方框510。在方框510,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的供电优先计算设备100的处理器组件110)由音频检测器的执行引起以检测音频信号。例如,控制例程121的音频检测器1211可检测音频信号400。
继续到框520,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的计算设备100的处理器组件110)由音频记录器的执行引起以从音频信号捕获音频输入。例如,控制例程121的音频记录器1212可通过捕获音频信号400生成音频输入122。
继续到框530,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的计算设备100的处理器组件110)由音频处理协调器1214的执行引起以确定是否通过网络唤醒可用的辅助设备。例如,控制例程121的音频处理协调器1214可确定是否唤醒辅助计算设备200-1或200-2的其中一个。
更加具体的转向图5,逻辑流600可始于方框610。在方框610,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的计算设备100的处理器组件110)由音频检测器的执行引起以检测音频信号。例如,控制例程121的音频检测器1211可检测音频信号400。
继续到方框620,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的计算设备100的处理器组件110)由上下文引擎的执行引起以确定对应于供电优先计算设备的活动水平。例如,上下文引擎1215可基于传感器读取123确定上下文特性124。尤其是,上下文特性124可以是活动水平指示。
继续到方框630,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的计算设备100的处理器组件110)由音频处理协调器的执行引起以确定活动水平是否超过活动水平阈值。例如,控制例程121的音频处理协调器1214可确定在上下文特性124中所示的活动水平是否超过活动水平阈值。
继续到方框640,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的计算设备100的处理器组件110)由音频记录器的执行引起以基于确定活动水平没有超过活动水平阈值而尝试所检测的音频信号的音频处理。例如,音频处理协调器1214可使得音频处理器1215试图处理音频输入122(如试图应用语音识别等等)以及生成所处理的音频127。
继续到方框650,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的计算设备100的处理器组件110)由音频处理协调器的执行引起以确定音频输入的音频处理是否充分。例如,控制例程121的音频处理协调器1214可确定所处理的音频127是否充分。在一些实施例中,如果应用到音频输入122的语音识别是成功的,则处理过的音频127是充分的。
继续到方框660,音频处理协调系统的供电优先计算设备的处理器组件(如系统1000的计算设备100的处理器组件110)由音频处理协调器的执行引起以基于确定活动水平超过活动水平阈值或基于确定音频处理不充分而唤醒辅助设备来捕获音频信号和/或在音频信号上执行音频处理。例如,控制例程121的音频处理协调器1214可生成辅助设备指令126,指令126包括唤醒、捕获音频信号和/或处理音频输入的指令。
图6示出了存储介质700的实施例。存储介质700可包括制品。在一些示例中,存储介质700可包括任意非瞬时性的计算机可读介质或机器可读媒介,如光、磁或半导体存储。存储介质700可存储各种类型的计算机可执行指令,如执行逻辑流500、和/或600的指令。计算机可读或机器可读存储介质的示例可包括任意的有形的能够存储电子数据的介质,包括易失性存储器或非易失性存储器、可移除或非可移除存储器、可擦除或非可擦除存储器、可写或可重写存储器等等。计算机可执行指令的示例可包括任意适当类型的代码,如源代码、编译的代码、解释的代码、可执行的代码、静态代码、动态代码、面向对象的代码、可视代码等等。示例并不限于本上下文中。
图7示出了适于实现先前描述的各种实施例的示范性处理架构3000的实施例。尤其是,处理架构3000(或其各种变形)可被实现为计算设备100和/或200-a的部分。
处理架构3000可包括在数字处理中通常采用的各种元件,包括但不限于,一个或多个处理器、多核处理器、协处理器、存储单元、芯片组、控制器、外设、接口、振荡器、定时设备、视频卡、音频卡、多媒体输入/输出(I/O)组件、电源等。如在本申请中所用,术语“系统”和“组件”意在指代计算设备实体,其中实现了数字处理,其具体为硬件、硬件和软件的组合、软件、或执行中的软件,通过这里描述的示范性的处理架构提供它们的示例。例如,组件可以是,但是不限于,在处理器组件运行的处理、处理器组件本身、采用光和/或磁存储介质的存储设备(如硬盘驱动器、阵列中的多个存储驱动器等)、软件对象、可执行的指令序列、执行线程、程序、和/或整个计算设备(如整个计算机)。通过示例的方式,在服务器上运行的应用和服务器两者都可以是组件。一个或多个组件驻留在执行进程和/或线程中,以及组件可被本地化在一个计算设备上和/或分布在两个或多个计算设备之间。而且,通过各种类型的通信介质组件彼此可通信的耦合以协调操作。这种协调可涉及单向或双向信息交换。例如,组件可以在通信介质上通信的信号的形式传递信息。信息可被实现为分配给一个或多个信号线上的信号。消息(包括命令、状态、地址或数据消息)可以是这些信号的一个,或可以是多个这些信号,以及通过任意种类的连接和/或接口被串行或基本上并行传送。
如所描述的,在实现处理架构3000中,计算设备可包括至少一个处理器组件950、存储960、到其它设备的接口990、以及耦合955。如将会被解释的那样,依赖于实现处理架构3000的计算设备的各个方面,包括它的预期用途和/或使用条件,这样的计算设备可进一步包括另外的组件,例如但不限于,显示接口985。
耦合955可包括一个或多个总线、点到点互联、收发器、缓冲器、交点开关、和/或其它导体和/或逻辑,其通信的耦合至少处理器组件950到存储960。耦合955可进一步耦合处理器组件950到接口990、音频子系统970和显示接口985(依赖于这些中哪一个和/或其它组件也被呈现)的一个或多个。当通过耦合955耦合处理器组件950时,处理器组件950能够执行上面的详细描述的各个不同任务,对于无论哪一个,前面描述的各个计算设备实现处理架构3000。耦合955可利用任意种类的技术或技术组合实现,其中通过各种技术,信号可以光和/或电传输。而且,至少耦合955的部分可采用遵守任意各种各样的工业标准的定时和/或协议,包括但不限于,加速图形端口(AGP)、卡片式总线、扩展工业标准架构(E-ISA)、微通道结构(MCA)、网络用户总线(NuBus)、外部设备互联(扩展)(PCI-X)、外部设备高速互联(PCI-E)、个人计算机存储卡国际协会(PCMCIA)总线、超传输(HyperTransportTM)、快速路径(QuickPath)等等。
如前所述,处理器组件950(对应于处理器组件110和/或210)可包括任意各种各样的商用处理器,其采用任意的各种各样的技术以及利用以任意数量的方式物理组合的一个或多个核实现。
如前所述,存储960(对应于存储130和/或230)可由一个或多个基于任意的各种各样的技术或技术组合的独特的存储设备组成。更具体的,如所描述的那样,存储960可包括易失性存储961(如基于一个或多个RAM形式的技术的固态存储)、非易失性存储962(如固态、铁磁或其它的不需要持续供电以保持它们的内容的存储)、以及可移除媒体存储963(如可移除磁盘或固态存储卡存储,通过其信息可在计算设备间传输)的一个或多个。存储960被描述为很可能包括多个独特类型的存储,承认在计算设备中常规使用多于一种类型的存储设备,以及在计算设备中一种类型提供相对快速的读和写能力使得通过处理器组件950更快操纵数据(但是可能使用要求持续供电的“易失性”技术),而另一种类型提供相对高的非易失性存储密度(但是很可能提供相对慢的读和写能力)。
鉴于采用不同技术的不同存储设备的经常的不同特性,通过不同存储控制器,这些不同的存储设备将被耦合到计算设备的其它部分,这也是常识,其中不同的存储控制器通过不同接口耦合到它们的不同存储设备。通过举例的方式,在呈现易失性存储961和易失性存储961基于RAM技术的情形中,易失性存储961可通过存储控制器965a通信地耦合到耦合955,其提供适当的接口到可能采用行和列寻址的易失性存储961,以及其中存储控制器965a可执行行刷新和/或其它维护任务以辅助保存存储在易失性存储961内的信息。通过另一个示例的方式,其中非易失性存储962被呈现并包括一个或多个铁磁和/或固态盘驱动器,非易失性存储962可通过存储控制器965b通信的耦合到耦合955,其提供适当的接口给可能采用信息块寻址和/或柱面和扇区寻址的非易失性存储962。仍然通过另一个举例的方式,在呈现可移除媒体存储963和存储963包括采用一片或多片机器可读存储介质969的一个或多个光和/或固态磁盘驱动器的情形中,可移除媒体存储963可通过存储控制器965c通信的耦合到耦合955,其提供适当的接口给可能采用信息块寻址的可移除媒体存储963,以及其中存储控制器965c可以特定的扩展机器可读存储介质969的寿命的方式协调读、擦除和写操作。
一个或其它易失性存储961或非易失性存储962可包括以机器可读存储介质的形式的制品,在机器可读存储介质上可存储包括可由处理器组件950执行的指令序列以实现各种实施例的例程,这依赖于每一个所基于的技术。通过举例的方式,在非易失性存储962包括基于铁磁的磁盘驱动器(如所谓的“硬盘驱动器”)的情形中,每一个这样的磁盘驱动器典型的采用一个或多个旋转盘片,在其上沉积有一层磁响应颗粒以及磁响应颗粒层以各种图案磁性取向以类似于如软盘的存储介质的方式存储信息,如指令序列。以另一个示例的方式,非易失性存储962可由固态存储设备库组成以类似于压缩闪卡的方式存储信息,如指令序列。而且,在计算设备中在不同时机采用不同类型的存储设备存储可执行的例程和/或数据是常识。因而,包括将由处理器组件950执行以实现各种实施例的指令序列的例程可初始存储在机器可读存储介质969上,以及可移除媒体存储963随后用于拷贝那个例程到非易失性存储962以长期存储而不需要持续维持机器可读存储介质969和/或当执行例程时易失性存储961使得可由处理器组件950更快速的存取。
如先前所讨论的那样,接口990(对应于接口160和/或260)可采用对应于任意种类的通信技术的任意种类的信号技术,可采用通信技术通信的耦合计算设备到一个或多个其它设备。再者,可采用各种形式的有线或无线信号之一或两者使得处理器组件950可能通过网络或互联的网络组与输入/输出设备(如所描述的示例键盘920或打印机925)、和/或其它计算设备交互。既然承认由任意一个计算设备通常支持的多种类型的信号和/或协议的通常的巨大不同特性,接口990被描述为包括多个不同接口控制器995a、995b和995c。接口控制器995a可采用任意各种类型的有线数字串行接口或射频无线接口以从用户输入设备接收串行传输的消息,输入设备如所描述的键盘920。接口控制器995b可采用任意种类的基于线缆的或无线的信号、定时和/或协议以通过所描述的网络300(可能是由一个或多个链接组成的网络、更小的网络、或可能是互联网)访问其它计算设备。接口995c可采用任意种类的能够使用或者串行或并行信号传输的导电线缆以将数据传输到所描述的打印机925。可通过一个或多个接口990的接口控制器通信的耦合的设备的其它示例包括,但不限于,麦克风、远程控制、铁电笔、读卡器、指纹读取器、虚拟现实交互手套、图形输入平板电脑、游戏杆、其它键盘、视网膜扫描仪、触摸屏的触摸输入组件、追踪球、各种传感器、监视人的运动以接受由这些人经由姿势和/或面部表情发送的命令和/或数据的摄像机或摄像机阵列、声音、激光打印机、喷墨打印机、机械机器人、铣床等。
在计算设备被通信的耦合到(或可能,实际上包括)显示器(如所描述的示例显示器980,对应于显示器150和/或250)的情形中,实现处理架构3000的这样一计算设备也可包括显示接口985。虽然在通信的耦合到显示器中可采用更多通用类型的接口,但是在显示器上可视显示各种形式的内容经常需要一些专门的额外处理,同时所用的基于线缆的接口的一些特定性质也经常需要提供特定的显示接口。在通信耦合显示器980中由显示接口985所采用的有线和/或无线信号技术可利用遵守任意种类的工业标准的信号和/或协议,工业标准包括但不限于,任意种类的模拟视频接口、数字视频接口(DVI)、显示端口等。
更一般的,本文所描述和描绘的计算设备的各种元件可包括各种硬件元件、软件元件,或两者的组合。硬件元件的示例可包括设备、逻辑设备、组件、处理器、微处理器、电路、处理器组件、电路元件(如晶体管、电阻、电容、电感等等)、集成电路、专用集成电路(ASIC)、可编程逻辑设备(PLD)、数字信号处理器(DSP)、场可编程门阵列(FPGA)、存储器单元、逻辑门、寄存器、半导体设备、芯片、微芯片、芯片组等等。软件元件的示例可包括软件组件、程序、应用、计算机程序、应用程序、系统程序、软件开发程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、功能、方法、过程、软件接口、应用程序接口(API)、指令集、计算码、计算机码、码片段、计算机码片段、字、值、符号、或它们的任意组合。然而,确定实施例是否利用硬件元件和/或软件元件实现可根据任意数目的因素改变,如预期计算速率、功率电平、耐热性、处理周期预算、输入数据速率、输出数据速率、存储器资源、数据总线速度以及其它设计或性能约束,如给定实现所预期的。
可利用表述“一种实施例”或者“一实施例”及其派生词一起描述一些实施例。这些术语意思是与实施例一起描述的特定特征、结构或特性被包括在至少一个实施例中。在说明书的各个地方出现的用语“在一种实施例”并不必要总是指代同一个实施例。而且可利用表述“耦合”和“连接”与其派生词一起描述一些实施例。这些术语并不一定意味着彼此是同义词。例如,利用术语“连接”和/或“耦合”描述的一些实施例指代两个或多个元件是彼此直接物理或电接触。然而术语“耦合”也可意味着两个或多个元件彼此不直接接触,但是也依然可彼此互操作或交互。而且,可组合来自不同实施例的方方面面和元件。
需要强调的是提供本公开的摘要以允许读者快速确定技术公开的本质。摘要是基于如下理解而提交的:它并不会被用于解释或限制权利要求的意思和范围。此外,在前面的具体实施方式中,可以看到各种特征被一起组合在单个实施例中以为了流畅的公开的目的。这个公开的方法并不被解释为反映所要求保护的实施例要求比在每一个权利要求中明确列举更多特征的意向。而且,如下面权利要求所反映的,创造性主题在于比单个所公开的实施例的所有特征少的特征。因而,接下来的权利要求据此纳入具体实施方式中,其中每个权利要求代表它的本身作为单独的实施例。
在附加的权利要求中,术语“包括”和“在其中”分别被用作各个术语“包含”和“其中”的简明英语同义词。而且,术语“第一”、“第二”、
“第三”等等仅仅被用于标签,而不是意在它们的对象上的强制次序性要求。
上面已经描述的内容包括所公开的架构的实施例。当然,不能够描述每一个可以想到的组件和/或方法论的组合,但是本领域技术人员可认识到更多进一步的组合和替换是可能的。据此,新颖的架构意在包围落在附加的权利要求书的范围和精神内的所有的这些替换、改变和变形。现在详细的公开转向提供属于进一步的实施例的示例。下面所提供的示例并不意在限制。
示例1:用于供电优先计算设备的装置,该装置包括:音频输入设备;可操作地耦合到该音频输入设备的音频检测器,该音频检测器用于检测由该音频输入设备接收的音频信号;音频记录器,用于从该音频信号捕获音频输入;网络接口;可操作地耦合到该网络接口的音频处理协调器,该音频处理协调器确定是否经由该网络接口唤醒可用的辅助设备以及确定是否利用该音频记录器捕获该音频输入。
示例2:示例1的装置,进一步包括配置为处理该音频输入的音频处理器,其中该音频处理协调器进一步确定是否利用该音频处理器处理该音频输入的至少一部分。
示例3:示例2的装置,进一步包括上下文引擎以确定对应于该音频信号的上下文特性。
示例4:示例3的装置,其中该上下文特性包括从该音频信号捕获的该音频输入的质量的指示。
示例5:示例4的装置,其中该音频处理协调器进一步确定该音频质量是否超过音频质量阈值。
示例6:示例5的装置,其中该音频处理协调器基于确定该音频质量未超过该音频质量阈值而确定唤醒该辅助设备。
示例7:示例5的装置,其中该音频处理协调器基于确定该音频质量超过该音频质量阈值而确定不唤醒该辅助设备。
示例8:示例2的装置,其中该音频处理协调器基于该音频检测器检测该音频信号确定唤醒该辅助设备,其中唤醒该辅助设备包括指示该辅助设备从该音频信号捕获辅助音频输入。
示例9:示例8的装置,其中该音频处理协调器进一步确定该音频输入的至少一部分是否能被该音频处理器处理。
示例10:示例9的装置,其中该音频处理协调器基于确定该音频输入的至少一部分不能被处理而进一步指示该辅助设备处理该辅助音频输入的至少一部分,其中该辅助音频输入的该部分对应于该音频输入的该部分。
示例11:示例2的装置,进一步包括传感器,其中该上下文特性对应于来自传感器的输出。
示例12:示例11的装置,其中该传感器是加速度计以及该上下文特性是对应于该供电优先设备的活动水平。
示例13:示例12的装置,该音频处理协调器进一步确定该活动水平是否超过活动水平阈值。
示例14:示例13的装置,其中该音频处理协调器基于确定活动水平超过活动水平阈值而确定唤醒该辅助设备。
示例15:示例14的装置,其中该音频处理协调器基于该音频检测器检测该音频信号确定唤醒该辅助设备,其中唤醒该辅助设备包括指示该辅助设备从该音频信号捕获辅助音频输入。
示例16:示例15的装置,其中该音频处理协调器基于确定该活动水平超过活动水平阈值而进一步指示该辅助设备以处理该辅助音频输入的至少一部分。
示例17:示例1到16任一个的装置,其中该网络接口是个域网无线电设备。
示例18:示例1到16任一个的装置,进一步包括电源以及可操作地耦合到电源的能量收集设备。
示例19:示例18的装置,其中该电源是可充电的,以及该能量收集设备给该电源充电。
示例20:示例4的装置,其中该供电优先计算设备是可穿戴计算设备。
示例21:示例20的装置,其中该供电优先计算设备是鞋、帽子、项链、手表、衬衫、夹克、或眼镜。
示例22:任意示例1到16的装置,其中该网络接口是蓝牙无线电设备、紫蜂无线电设备、ANT无线电设备、或RFID无线电设备。
示例23:示例1到16的任意一个的装置,其中该供电优先计算设备是非可穿戴设备。
示例24:由供电优先计算设备执行的方法,该方法包含检测音频信号;从该音频信号捕获音频输入;以及确定是否经由网络唤醒可用的辅助设备。
示例25:示例24的该方法,进一步包含接收来自传感器的输出;以及基于从该传感器的输出确定对应于该音频信号的上下文特性,其中确定是否唤醒该辅助设备是基于该上下文特性的。
示例26:示例25的该方法,其中该传感器是加速度计以及该上下文特性是活动水平,该方法进一步包含确定该活动水平是否超过活动水平阈值,其中确定唤醒该辅助设备包括基于确定该活动水平超过该活动水平阈值而唤醒该辅助设备。
示例27:示例26的该方法,其中唤醒该辅助设备包括指示该辅助设备从该音频信号捕获辅助音频输入。
示例28:示例24的该方法,进一步包括确定从该音频信号捕获的该音频输入的质量;以及确定该音频质量是否超过音频质量阈值。
示例29:示例28的该方法,其中确定唤醒该辅助设备包括基于确定该音频质量未超过该音频质量阈值而唤醒该辅助设备。
示例30:示例28的该方法,其中确定唤醒该辅助设备包括基于确定该音频质量超过该音频质量阈值而不唤醒该辅助设备。
示例31:示例24的该方法,其中确定唤醒该辅助设备包括基于检测该音频信号而唤醒该辅助设备,其中唤醒该辅助设备包括指示该辅助设备从该音频信号捕获辅助音频输入。
示例32:示例31的该方法,进一步包括处理该音频输入;以及确定该音频输入的至少一部分是否能被处理。
示例33:示例33的该方法,进一步包括基于确定该音频输入的至少一部分不能被处理而指示该辅助设备处理该辅助音频输入的至少一部分,其中该辅助音频输入的该部分对应于该音频输入的该部分。
示例34:示例24至33的任意一个的该方法,其中该辅助设备是第一辅助设备,以及其中确定是否唤醒该第一辅助设备包括确定是否经由网络唤醒该第一辅助设备或是否唤醒可用的第二辅助设备。
示例35:示例24至33的任意一个的该方法,其中唤醒该辅助设备包括传送信号到对应于该辅助设备的无源无线电设备。
示例36:示例35的该方法,其中该无源无线电设备是蓝牙无线电设备、紫蜂(ZigBee)无线电设备、ANT无线电设备、或RFID无线电设备。
示例37:一种装置,包括执行示例24至36中任一项所述的方法的单元。
示例38:至少一个机器可读介质,其包括多个指令,指令响应于在供电优先计算设备上执行引起该供电优先计算设备执行示例24至36的任意方法。
示例39:用于个域网的装置,包括处理器;可操作地连接到该处理器的无线电设备;一个或多个天线,可操作地连接到无线电设备以传送或接收无线信号;音频输入设备,可操作地连接到该处理器以捕获和接收音频信号;以及存储器,包括多个指令,指令响应于由处理器执行引起处理器、无线电设备或音频输入设备执行示例24至36的任意的方法。
Claims (25)
1.一种用于供电优先计算设备的装置,包括:
音频输入设备;
音频检测器,能操作地耦合到所述音频输入设备,所述音频检测器用于检测由所述音频输入设备接收的音频信号;
音频记录器,用于从所述音频信号捕获音频输入;以及
音频处理器,被配置为处理所述音频输入;
网络接口;以及
音频处理协调器,能操作地耦合到所述网络接口,所述音频处理协调器用于基于所述音频输入来确定是否经由所述网络接口唤醒能用的辅助设备。
2.根据权利要求1所述的装置,进一步包括:
上下文引擎,用于确定对应于所述音频信号的上下文特性,
其中,所述上下文特性包括对从所述音频信号捕获的所述音频输入的音频质量的指示;以及
其中,所述的确定是否唤醒所述辅助设备至少部分地基于所述上下文特性。
3.根据权利要求2所述的装置,其中,所述音频处理协调器进一步确定所述音频质量是否超过音频质量阈值。
4.根据权利要求3所述的装置,其中,所述音频处理协调器基于确定所述音频质量未超过所述音频质量阈值而确定唤醒所述辅助设备。
5.根据权利要求3所述的装置,其中,所述音频处理协调器基于确定所述音频质量超过所述音频质量阈值而确定不唤醒所述辅助设备。
6.根据权利要求1所述的装置,其中,所述音频处理协调器基于所述音频检测器检测所述音频信号确定唤醒所述辅助设备,其中,唤醒所述辅助设备包括指示所述辅助设备从所述音频信号捕获辅助音频输入。
7.根据权利要求6所述的装置,其中,所述音频处理协调器进一步确定所述音频输入的至少一部分是否能被所述音频处理器处理。
8.根据权利要求7所述的装置,其中,所述音频处理协调器基于确定所述音频输入的至少一部分不能被处理,进一步指示所述辅助设备处理所述辅助音频输入的至少一部分,其中,所述辅助音频输入的所述部分对应于所述音频输入的所述部分。
9.一种用于供电优先计算设备的装置,其包括:
音频输入设备;
音频检测器,能操作地耦合到所述音频输入设备,所述音频检测器用于检测由所述音频输入设备接收的音频信号;
音频记录器,用于从所述音频信号捕获音频输入;
音频处理器,被配置为处理所述音频输入;
传感器;
上下文引擎,能操作地耦合到所述传感器,所述上下文引擎基于来自于所述传感器的输出确定对应于所述音频信号的上下文特性;
网络接口;以及
音频处理协调器,能操作地耦合到所述网络接口,所述音频处理协调器用于基于所述上下文特性确定是否经由所述网络接口唤醒能用的辅助设备。
10.根据权利要求9所述的装置,其中,所述传感器是加速度计,以及其中,所述上下文特性是对应于所述供电优先设备的活动水平,所述音频处理协调器进一步确定所述活动水平是否超过活动水平阈值。
11.根据权利要求10所述的装置,其中,所述音频处理协调器基于确定所述活动水平超过所述活动水平阈值而确定唤醒所述辅助设备。
12.根据权利要求10所述的装置,其中,所述音频处理协调器基于所述音频检测器检测所述音频信号确定唤醒所述辅助设备,其中,唤醒所述辅助设备包括指示所述辅助设备从所述音频信号捕获辅助音频输入。
13.根据权利要求12所述的装置,其中,所述音频处理协调器进一步基于确定所述活动水平超过所述活动水平阈值而指示所述辅助设备处理所述辅助音频输入的至少一部分。
14.根据权利要求9所述的装置,进一步包括:
电源;以及
能操作地耦合到所述电源的能量收集设备。
15.根据权利要求14所述的装置,其中,所述电源是能够充电的,以及所述能量收集设备给所述电源充电。
16.根据权利要求9所述的装置,其中,所述供电优先计算设备是可穿戴计算设备。
17.根据权利要求16所述的装置,其中,所述供电优先计算设备是鞋、帽子、项链、手表、衬衫、夹克、或眼镜。
18.根据权利要求9所述的装置,其中,所述网络接口是个域网无线电设备。
19.根据权利要求9所述的装置,其中,所述网络接口是蓝牙无线电设备、紫蜂无线电设备、ANT无线电设备、或RFID无线电设备。
20.一种由供电优先计算设备执行的方法,所述方法包括:
检测音频信号;
从所述音频信号捕获音频输入;以及
确定是否经由网络唤醒能用的辅助设备。
21.根据权利要求20所述的方法,进一步包括:
接收来自传感器的输出;以及
基于来自所述传感器的所述输出确定对应于所述音频信号的上下文特性,
其中,确定是否唤醒所述辅助设备是基于所述上下文特性的。
22.根据权利要求21所述的方法,其中,所述传感器是加速度计以及所述上下文特性是活动水平,所述方法进一步包括确定所述活动水平是否超过活动水平阈值,其中,确定唤醒所述辅助设备包括基于确定所述活动水平超过所述活动水平阈值而唤醒所述辅助设备。
23.根据权利要求22所述的方法,其中,唤醒所述辅助设备包括指示所述辅助设备从所述音频信号捕获辅助音频输入。
24.根据权利要求20所述的方法,进一步包括:
确定从所述音频信号捕获的所述音频输入的质量;以及
确定所述音频质量是否超过音频质量阈值。
25.根据权利要求24所述的方法,其中,确定唤醒所述辅助设备包括基于确定所述音频质量未超过所述音频质量阈值而唤醒所述辅助设备。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/459,117 | 2014-08-13 | ||
US14/459,117 US20160049147A1 (en) | 2014-08-13 | 2014-08-13 | Distributed voice input processing based on power and sensing |
PCT/US2015/037572 WO2016025085A1 (en) | 2014-08-13 | 2015-06-25 | Distributed voice input processing based on power and sensing |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107077316A true CN107077316A (zh) | 2017-08-18 |
Family
ID=55302620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580038555.8A Pending CN107077316A (zh) | 2014-08-13 | 2015-06-25 | 基于功率和感测的分布式语音输入处理 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20160049147A1 (zh) |
EP (1) | EP3180689A4 (zh) |
JP (1) | JP6396579B2 (zh) |
KR (1) | KR102237416B1 (zh) |
CN (1) | CN107077316A (zh) |
WO (1) | WO2016025085A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724780A (zh) * | 2020-06-12 | 2020-09-29 | 北京小米松果电子有限公司 | 设备的唤醒方法及装置、电子设备、存储介质 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10044798B2 (en) * | 2016-02-05 | 2018-08-07 | International Business Machines Corporation | Context-aware task offloading among multiple devices |
US10484484B2 (en) | 2016-02-05 | 2019-11-19 | International Business Machines Corporation | Context-aware task processing for multiple devices |
CN108076476B (zh) * | 2016-11-18 | 2020-11-06 | 华为技术有限公司 | 用于传输数据的方法和装置 |
WO2019112625A1 (en) * | 2017-12-08 | 2019-06-13 | Google Llc | Signal processing coordination among digital voice assistant computing devices |
US10971173B2 (en) | 2017-12-08 | 2021-04-06 | Google Llc | Signal processing coordination among digital voice assistant computing devices |
CN112382294B (zh) * | 2020-11-05 | 2023-10-20 | 北京百度网讯科技有限公司 | 语音识别方法、装置、电子设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1454445A (zh) * | 2000-06-12 | 2003-11-05 | 皇家菲利浦电子有限公司 | 便携式音频设备 |
JP2007086281A (ja) * | 2005-09-21 | 2007-04-05 | Sharp Corp | 省電型携帯情報処理装置 |
US20110050436A1 (en) * | 2009-09-03 | 2011-03-03 | Tritan Technology Inc. | Wakeup Device Detecting Voltage Variation in Standby Mode |
JP2011066544A (ja) * | 2009-09-15 | 2011-03-31 | Nippon Telegr & Teleph Corp <Ntt> | ネットワーク・スピーカシステム、送信装置、再生制御方法、およびネットワーク・スピーカプログラム |
US20130290762A1 (en) * | 2011-11-28 | 2013-10-31 | Sagar C. Pawar | Methods and apparatuses to wake computer systems from sleep states |
CN103595869A (zh) * | 2013-11-15 | 2014-02-19 | 华为终端有限公司 | 一种终端语音控制方法、装置及终端 |
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
US20140163978A1 (en) * | 2012-12-11 | 2014-06-12 | Amazon Technologies, Inc. | Speech recognition power management |
US20140195247A1 (en) * | 2013-01-04 | 2014-07-10 | Kopin Corporation | Bifurcated Speech Recognition |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
JP2002078072A (ja) * | 2000-08-23 | 2002-03-15 | Toshiba Corp | 携帯型コンピュータ |
US6801140B2 (en) * | 2001-01-02 | 2004-10-05 | Nokia Corporation | System and method for smart clothing and wearable electronic devices |
US20030158609A1 (en) * | 2002-02-19 | 2003-08-21 | Koninklijke Philips Electronics N.V. | Power saving management for portable devices |
JPWO2007052625A1 (ja) * | 2005-10-31 | 2009-04-30 | パナソニック株式会社 | 映像音声視聴システム |
JP4569842B2 (ja) * | 2007-11-12 | 2010-10-27 | ソニー株式会社 | オーディオ装置およびこのオーディオ装置に用いられる外部アダプタ |
JP2009224911A (ja) * | 2008-03-13 | 2009-10-01 | Onkyo Corp | ヘッドホン |
US8796888B2 (en) * | 2010-07-07 | 2014-08-05 | Adaptive Materials, Inc. | Wearable power management system |
US20120161721A1 (en) * | 2010-12-24 | 2012-06-28 | Antony Kalugumalai Neethimanickam | Power harvesting systems |
KR101679487B1 (ko) * | 2012-01-25 | 2016-11-24 | 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 | 사용자 생성 데이터 센터 전력 절감 |
US8407502B1 (en) * | 2012-07-12 | 2013-03-26 | Google Inc. | Power saving techniques for battery-powered computing devices |
CN103830841B (zh) * | 2012-11-26 | 2018-04-06 | 赛威医疗公司 | 可穿戴的经皮肤的电刺激设备及其使用方法 |
US20150170249A1 (en) * | 2013-12-13 | 2015-06-18 | Ebay Inc. | Item search and refinement using wearable device |
-
2014
- 2014-08-13 US US14/459,117 patent/US20160049147A1/en not_active Abandoned
-
2015
- 2015-06-25 JP JP2017507789A patent/JP6396579B2/ja active Active
- 2015-06-25 EP EP15831739.6A patent/EP3180689A4/en not_active Withdrawn
- 2015-06-25 KR KR1020177001088A patent/KR102237416B1/ko active IP Right Grant
- 2015-06-25 CN CN201580038555.8A patent/CN107077316A/zh active Pending
- 2015-06-25 WO PCT/US2015/037572 patent/WO2016025085A1/en active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1454445A (zh) * | 2000-06-12 | 2003-11-05 | 皇家菲利浦电子有限公司 | 便携式音频设备 |
JP2007086281A (ja) * | 2005-09-21 | 2007-04-05 | Sharp Corp | 省電型携帯情報処理装置 |
US20110050436A1 (en) * | 2009-09-03 | 2011-03-03 | Tritan Technology Inc. | Wakeup Device Detecting Voltage Variation in Standby Mode |
JP2011066544A (ja) * | 2009-09-15 | 2011-03-31 | Nippon Telegr & Teleph Corp <Ntt> | ネットワーク・スピーカシステム、送信装置、再生制御方法、およびネットワーク・スピーカプログラム |
US20130290762A1 (en) * | 2011-11-28 | 2013-10-31 | Sagar C. Pawar | Methods and apparatuses to wake computer systems from sleep states |
US20140163978A1 (en) * | 2012-12-11 | 2014-06-12 | Amazon Technologies, Inc. | Speech recognition power management |
US20140195247A1 (en) * | 2013-01-04 | 2014-07-10 | Kopin Corporation | Bifurcated Speech Recognition |
CN103595869A (zh) * | 2013-11-15 | 2014-02-19 | 华为终端有限公司 | 一种终端语音控制方法、装置及终端 |
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724780A (zh) * | 2020-06-12 | 2020-09-29 | 北京小米松果电子有限公司 | 设备的唤醒方法及装置、电子设备、存储介质 |
US11665644B2 (en) | 2020-06-12 | 2023-05-30 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Device wakeup method and apparatus, electronic device, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
US20160049147A1 (en) | 2016-02-18 |
KR102237416B1 (ko) | 2021-04-07 |
KR20170020862A (ko) | 2017-02-24 |
JP6396579B2 (ja) | 2018-09-26 |
WO2016025085A1 (en) | 2016-02-18 |
JP2017526961A (ja) | 2017-09-14 |
EP3180689A1 (en) | 2017-06-21 |
EP3180689A4 (en) | 2018-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107077316A (zh) | 基于功率和感测的分布式语音输入处理 | |
EP2661917B1 (en) | Quantifying frustration via a user interface | |
US20150185838A1 (en) | Wrist based wearable virtual keyboard | |
CN106030440A (zh) | 智能循环音频缓冲器 | |
CN104423576A (zh) | 虚拟助理操作项目的管理 | |
US20170090583A1 (en) | Activity detection for gesture recognition | |
WO2014130577A1 (en) | Systems and methods for activity recognition training | |
WO2014074268A1 (en) | Selecting feature types to extract based on pre-classification of sensor measurements | |
US10951754B2 (en) | Method for responding to incoming call by means of fingerprint recognition, storage medium, and mobile terminal | |
CN108541300A (zh) | 自适应深度感测系统 | |
WO2019033576A1 (zh) | 人脸姿态检测方法、装置及存储介质 | |
US20160246368A1 (en) | Piezoelectric sensor assembly for wrist based wearable virtual keyboard | |
CN106200878A (zh) | 指纹控制方法、装置及移动终端 | |
CN102867190A (zh) | 一种利用移动设备内置传感器进行行为识别的方法 | |
CN104123072A (zh) | 一种用于提供移动设备中的虚拟键盘的方法和设备 | |
CN109460044A (zh) | 一种基于二维码的机器人归位方法、装置及机器人 | |
CN106791346A (zh) | 一种图像预测的方法及装置 | |
CN107256334A (zh) | 食谱搭配方法及相关产品 | |
CN106775305A (zh) | 一种终端快速调用装置和方法 | |
US9544736B2 (en) | Techniques for improving location accuracy for virtual maps | |
JP2013004001A5 (zh) | ||
WO2022095983A1 (zh) | 一种防止手势误识别的方法及电子设备 | |
CN106095306B (zh) | 一种移动终端的传感器控制方法、装置及移动终端 | |
CN107835300A (zh) | 一种终端控制方法、终端及计算机可读存储介质 | |
CN106598449A (zh) | 一种终端分屏显示控制装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170818 |