CN106062661A - 用于常开常听的语音识别系统的位置感知功率管理方案 - Google Patents
用于常开常听的语音识别系统的位置感知功率管理方案 Download PDFInfo
- Publication number
- CN106062661A CN106062661A CN201480076634.3A CN201480076634A CN106062661A CN 106062661 A CN106062661 A CN 106062661A CN 201480076634 A CN201480076634 A CN 201480076634A CN 106062661 A CN106062661 A CN 106062661A
- Authority
- CN
- China
- Prior art keywords
- environment noise
- processor
- audio process
- state
- described position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 93
- 238000001514 detection method Methods 0.000 claims abstract description 43
- 238000004458 analytical method Methods 0.000 claims abstract description 31
- 230000004044 response Effects 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims description 56
- 230000000737 periodic effect Effects 0.000 claims description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 2
- 230000001960 triggered effect Effects 0.000 claims description 2
- 230000004048 modification Effects 0.000 abstract 1
- 238000012986 modification Methods 0.000 abstract 1
- 230000004913 activation Effects 0.000 description 10
- 238000004806 packaging method and process Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 101150116940 AGPS gene Proteins 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004801 process automation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3293—Power saving characterised by the action undertaken by switching to a less power-consuming processor, e.g. sub-CPU
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
- H04W52/0209—Power saving arrangements in terminal devices
- H04W52/0251—Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity
- H04W52/0254—Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity detecting a user operation or a tactile contact or a motion of the device
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72457—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to geographic location
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Telephone Function (AREA)
- Power Sources (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
描述了涉及用于常开常听的语音识别系统的位置感知功率管理方案的方法和装置。在实施例中,逻辑单元对一位置执行环境噪声触发水平分析并基于环境噪声触发水平分析来引起对该位置的环境噪声触发水平阈值的存储。此外,逻辑单元响应于在该位置处对音频处理器的检测以及对在该位置处所检测到的声音水平与所存储的环境噪声触发水平阈值的比较,来确定是否引起对音频处理器的状态的修改。
Description
技术领域
本公开内容总体上涉及电子的技术领域。更具体来说,实施例涉及用于常开常听的语音识别系统的位置感知功率管理方案。
背景技术
便携式计算设备正得到普及,至少是因为它们降低的价格和增加的性能。它们日益普及的另一个原因可能是由于一些便携式计算设备可以在许多位置进行操作(例如,通过依赖于电池电量)的事实。然而,随着更多的功能被集成到便携式计算设备中,对减小功耗的需求变得日益重要,例如,以在延长的时间段内保持电池电量。
附图说明
参考附图提供了具体实施方式。在附图中,附图标记最左边的(多个)数字标示附图标记最先出现在其中的附图。在不同的附图中使用相同的附图标记指示类似的或相同的项。
图1和图4-5示出了计算系统的实施例的框图,其可以用于实现本文中所讨论的各个实施例。
图2-3示出了根据一些实施例的流程图。
图6示出了根据实施例的SOC(片上系统)封装件的框图。
具体实施方式
在以下描述中,阐述了许多具体细节,以便于提供对各个实施例的透彻理解。然而,可以在没有这些具体细节的情况下实施各个实施例。在其它实例中,并未详细描述公知的方法、过程、部件、以及电路,以便于不会使特定实施例难以理解。此外,可以使用各种模块(例如,集成半导体电路(“硬件”)、被组织到一个或多个程序中的计算机可读指令(“软件”)、或者硬件和软件的一些组合)来执行实施例的各个方面。为了本公开内容的目的,对“逻辑单元”的引用应当表示硬件、软件、固件、或它们的一些组合。
如以上所讨论的,有效的功耗管理对移动计算设备是极其重要的。出现在移动设备中的对功耗可能具有显著影响的一种类型的部件是音频。错误触发常开常听的语音识别系统将影响移动设备中的系统电池寿命。例如,基于DSP(数字信号处理器)的常开常听(或WoV-语音唤醒)系统可以在激活的“关键短语检测”状态中消耗4mW(与在空闲和“语音命令检测”状态中仅几uW相比)。
为此,一些实施例为常开常听(或WoV)语音识别系统提供了位置感知功率管理方案。实施例降低了DSP在激活的“关键短语检测”状态(其中,由于错误触发WoV系统的“语音命令检测”状态而导致可以进入激活的“关键短语检测”状态)中的频率。该方法进而减小了总体系统功耗。一些实施例还可以通过至少部分地基于正在使用的系统的位置来使针对“语音命令检测”状态的环境噪声触发配置文件(例如,其将造成进入激活的和“关键短语检测”状态)的设置自动化来提供更好的UX(用户体验)。
一些实施方式可以通过用户在正在使用的系统的每个位置手动地设置针对“语音命令检测”状态的环境噪声触发阈值来减小错误触发率。例如,系统可以包括针对各个位置(例如,在办公室、实验室、等等)的噪声触发阈值。系统随后可以允许用户根据正在使用的系统的位置来针对“语音命令检测”状态“手动地”选择阈值。相比之下,实施例利用了一个或多个传感器来使该过程自动化,以设置环境噪声触发水平并使得对常开常听语音识别系统中的“关键短语检测”状态的错误触发最小化。这进而减小了整体系统功耗并还可以向端用户提供更好的UX。
一些实施例可以应用在包括一个或多个处理器(例如,具有一个或多个处理器核)的计算系统中,例如参考图1-6所讨论的那些,包括例如诸如智能电话、平板设备、UMPC(超移动个人计算机)、膝上型计算机、超级本TM计算设备、智能手表、智能眼镜、可穿戴式设备等等之类的移动计算设备。更具体来说,图1示出了根据实施例的计算系统100的框图。系统100可以包括一个或多个处理器102-1到102-N(在本文中通常被称为“多个处理器102”或“处理器102”)。在各个实施例中,处理器102可以是通用CPU(中央处理单元)和/或GPU(图形处理单元)。处理器102可以经由互连件或总线104进行通信。每个处理器都可以包括各个部件,为了清楚起见,参考处理器102-1仅讨论了这些部件中的一些部件。因此,剩余的处理器102-2到102-N中的每个处理器都可以包括参考处理器102-1所讨论的相同或类似部件。
在实施例中,处理器102-1可以包括一个或多个处理器核106-1到106-M(在本文中被称为“多个核106”、或“核106”)、缓存108、和/或路由器110。处理器核106可以在单个集成电路(IC)芯片上实现。此外,芯片可以包括一个或多个共享的和/或私有的缓存(例如,缓存108)、总线或互连件(例如,总线或互连件112)、图形和/或存储器控制器(例如参考图2-6所讨论的那些)、或其它部件。
在一个实施例中,路由器110可以用于在处理器102-1和/或系统100的各个部件之间进行通信。此外,处理器102-1可以包括多于一个的路由器110。此外,多数路由器110可以进行通信,以实现在处理器102-1内部或外部的各个部件之间的数据路由。
缓存108可以存储由处理器102-1的一个或多个部件(例如,核106)利用的数据(例如,包括指令)。例如,缓存108可以本地缓存存储在存储器114中的数据,以便于由处理器102的部件更快地访问(例如,由核106更快地访问)。如图1中所示出的,存储器114可以经由互连件104与处理器102进行通信。在实施例中,缓存108(可以共享)可以是中间级缓存(MLC)、末级缓存(LLC)等等。另外,核106中的每个核都可以包括第1级(L1)缓存(116-1)(在本文中通常被称为“L1缓存116”)或其它级的缓存,例如,第2级(L2)缓存。此外,处理器102-1中的各个部件可以通过总线(例如,总线112)、和/或存储器控制器或中心直接与缓存108进行通信。
如示出的,系统100还可以包括逻辑单元140、一个或多个传感器150、以及音频处理器160(例如,DSP等等)。(多个)传感器150提供传感器数据(例如,经由全球定位系统(GPS)传感器(包括例如高级GPS(aGPS)、全球导航卫星系统(GNSS)、无线保真(WiFi)、蓝牙等、(多个)传感器、(多个)环境音频传感器、加速度计、罗盘、陀螺仪、磁力计接收到的位置数据、压力、环境光线、温度等)以针对大量应用(例如音频设置、电话设置、游戏等等)提高用户体验(例如,当使用计算设备时,计算设备包括例如诸如智能手机、平板设备、UMPC(超级移动个人计算机)、膝上型计算机、超级本TM计算设备、智能手表、智能眼镜、可穿戴式设备、等等之类的移动计算设备)。(多个)传感器150可以支持包括常开感测(例如,常开常听的语音识别系统)、基于运动的手势、用户活动状态、计步器的各种特征以实现不同种类的应用。
在实施例中,逻辑单元140例如基于由(多个)传感器150检测到的信息来减小音频处理器160在激活的“关键短语检测”状态中的频率。这种方法减小了整体系统功耗。逻辑单元140还可以通过至少部分地基于正在使用的系统的位置(例如,如由(多个)传感器150所检测的)使环境噪声触发配置文件的设置自动化来提供更好的UX。此外,可以在系统100中的各个位置中(例如,所示出的那些位置或其它位置)提供逻辑单元140。因此,逻辑单元140通信地耦合至音频处理器160和/或(多个)传感器150以提供参考各个实施例所讨论的特征。另外,在一些实施例中,逻辑单元140可以包括音频处理器160。
图2示出了根据实施例的用于常开常听的语音识别系统的环境噪声阈值的位置感知设置的流程图。如示出的,一个或多个传感器(例如,(多个)传感器150)可以用于确定正在使用的计算设备的位置并且针对“语音命令检测”状态相应地设置环境噪声触发等级。参考图2所讨论的各个操作可以由图1中的一个或多个部件(例如,包括以下部件中的一个或多个部件:(多个)处理器核106、逻辑单元140、(多个)传感器150、和/或音频处理器160)来执行。
参考图1-2,在操作202,针对一个或多个位置(例如,基于来自例如所示出的(室外、室内、车内等等)和参考图1所讨论的各个位置的传感器数据)来运行(例如,由核106和/或逻辑单元140)(多个)环境噪声阈值校准(例如,在本文中也可交换地被称为分析)操作。在实施例中,可以根据一天的时间(例如,与其它时间相比在早餐、午餐、或晚餐前后的咖啡馆可能更吵闹)来设置不同的环境噪声阈值等级/值(在本文中也被称为触发等级/值)。所确定的阈值存储在存储器中(例如,本文中所讨论的存储设备中的任何存储设备)以用于由设备在将来进行存取(或者在耦合至相同WiFi/WWAN网络的设备中共享)。另外,触发信息可以在网站上是可用的,并且位置感知逻辑单元识别设备的位置并获得音频触发设置(例如,与我们针对特定城市所获得温度/天气信息的方式类似)。因此,操作202基于移动计算设备的位置来使针对常开常听的子系统的环境噪声触发阈值配置文件的设置(例如,从数据库获取)自动化。
在移动设备上的常开常听的语音识别的实施方式可以包括两个或更多个阶段:第一阶段,语音命令检测(例如,在操作204)使用低功率音频处理器(例如,音频处理器160)来监控环境噪声。该音频处理器的功耗可以在几微瓦的范围内,并且低功率音频处理器可以是一直开启的。如果该低功率音频处理器检测到超过环境噪声水平的声音水平(例如,在206),则其将触发第二阶段——关键短语检测(例如,在操作208),其开启较高性能的音频处理器(例如,DSP和/或处理核106中的一个或多个处理核)以分析所采集的声音是否是命令(例如,语音命令或关键短语)。如果所采集的声音被确定为是命令或关键短语(例如,通过将所采集的声音与可允许的语音声音或关键短语的列表/表格进行比较),则较高性能的音频处理器随后将执行对应的命令;否则,如果其不是命令;则语音识别子系统(例如,逻辑单元140和/或声音处理器160)将返回到空闲状态,或者返回到低功率状态。根据实施方式,该较高性能的音频处理器(或者该DSP的功能可以由中央处理单元(CPU)或处理器102/核106来替代)可以消耗4mW或更多。
此外,如果系统继续接收“关键短语检测”状态中的错误触发,则系统可能浪费额外的功率来处理这些错误触发。对于移动设备,从一个位置移动到另一个位置趋向于修改环境噪声水平。如果根据用户设备所处于的位置来设置环境噪声水平,则可以减小错误触发的频率。为此,实施例使针对不同位置(例如,在实验室、在汽车中、在办公室等等)所校准(在本文中也可被互换地称为分析)的环境噪声触发水平的设置自动化。
一些实施例利用以下技术来校准/分析并设置环境噪声水平:
1.对于室内:
(a)使用基于WiFi位置的工具来确定用户设备的位置。用户使用校准逻辑单元(例如,逻辑单元140)来设置该特定位置处的环境噪声地面值/最小值;
(b)使用罗盘和加速度计来确定用户设备的位置(也被称为航位推测技术)。
2.对于室外:使用GPS(例如,aGPS、GNSS、等等)来确定用户是否在闹市、在树林中徒步等等。用户可以利用校准逻辑单元来校准在各个地方的环境噪声地面值/最小值。
3.在车内:利用车内无线设备(例如免持BT(蓝牙))来确定用户设备是否在车内。“汽车娱乐系统”也可以使用BT来向校准逻辑单元(例如,在移动设备上运行)提供车辆驾驶员已经打开车内的音频设备(例如,来听收音机)的信息,并且音量设置信息可以与校准逻辑单元相关,其可以提供对常开常听的低功率音频处理器(在“语音命令检测”状态中操作)的环境噪声触发水平的更准确的估计。
可以在给定的位置处针对一天的不同时间校准/分析环境噪声触发/阈值水平。在实施例中,可以基于环境噪声和交谈水平两者来调整环境噪声触发水平。例如,用户可以在早上7:30到达咖啡馆喝一杯咖啡(基于位置和时间,阶段1(语音命令检测状态)音频触发可以被设置在73dB)。之后,在早上8点,用户可以走过门廊(基于位置和时间,阶段1音频触发可以被设置在70dB,例如在那个时间交谈水平和/或环境噪声水平可能在门廊中较低)。一旦在早上8点之后用户回到他/她的办公室(基于位置和时间),阶段1音频触发可以被设置在70dB。随后,在早上10点,用户回到咖啡馆进行一对一会议(基于位置和时间,阶段1音频触发可以被设置在84dB,例如,由于一对一会议可能具有比咖啡馆或门廊高的声音水平(由于在该会议的交谈))。
在实施例中,针对特定位置生成音频触发配置文件。已经指出,人们会将他们的交谈语音水平(“SPL”或声音压力水平)大体上调整为环境声音水平以上几dB。因此,如果我们可以创建环境噪声水平,并在该水平以上增加大约3-5dB,则其可以是针对“常开常听”语音识别逻辑单元的第一阶段(语音命令检测状态)的触发水平的设置。在一些实施例中,可以使用以下过程来限定和使用环境噪声水平:
(A)在特定位置处昼夜不停地或者在选择的时间段采集环境噪声和交谈。这可以手动地完成,或者通过编写应用并在记录设备(例如,超级本计算设备)上运行该应用来完成以有助于采集/采样任务。在实施例中,可以使用一分钟/样本。此外,可以存储采样的时间。
(B)针对所采集的数据创建查找表。
(C)无论何时语音识别逻辑单元是开启/激活的:逻辑单元(例如,逻辑单元140)通过位置追踪逻辑单元、e罗盘、加速度计等等来定位设备。一旦位置和时间是已知的,则识别逻辑单元检查查找表并选择对应的触发设置(例如,可以是环境噪声水平+3dB)。位置追踪逻辑单元、传感器等等将保持馈送位置信息,因为用户可能改变位置(例如,如参考图3所讨论的)。时间间隔可以是每30秒或每分钟(其可以是可用户配置的)以保留功率。
在实施例中,如果系统处于连接的待机状态(例如,其中用户设备处于较低功耗状态而不是激活状态,而仍然保持激活的网络连接,并且系统还可选地周期性地唤醒以执行所需要的任务),则对位置改变的检测将与系统的周期性唤醒状态一致,以便使系统功率耗用(例如,由于错误触发)最小化。由于系统的位置改变将比系统在连接的待机状态中的周期性唤醒慢,所以对位置改变的检测可以与系统唤醒状态一致(但不那么频繁,因为位置改变相对慢,例如,可以每30秒一次)。传感器输入可以提供对“位置固定”频率的最佳确定),以使得系统功率耗用(例如,由于错误触发)最小化。
在实施例中,位置改变检测频率被优化以减小功耗。传感器中心(未示出,其可以耦合到(多个)传感器150和/或并入到逻辑单元140中)管理传感器输入(例如,来自(多个)传感器150)以优化电池寿命。位置检测频率可以被进一步减小并且这可以基于进一步的UX研究。例如,位置改变可以由加速度计/运动传感器、陀螺仪、GNSS/WWAN固定点、其它“新的”无线设备(例如,车中的蓝牙设备(免持蓝牙))的检测等来检测。
因此,一些实施例利用以下技术中的一项或多项技术(例如,而不是依赖于用户对噪声触发阈值的手动设置):
1.使用传感器和/或混合技术,例如aGPS/GNSS、WWAN、BT、Wifi、等来针对不同的位置设置环境噪声阈值触发配置文件。
2.获取正确的配置文件(移动设备的每个位置)以针对低功率音频处理器(例如,作为常开常听的子系统的部分)设置/编程噪声触发水平。
3.该操作是自动化的。其还提供了对噪声触发阈值的更加UX取向的和更准确的(例如,涉及最小人为误差)设置以使得对语音识别系统的错误触发最小化。
图3示出了根据实施例的用于自适应噪声触发设置调整以优化系统功耗的流程图。这允许语音识别系统自适应地设置语音触发阈值。本文中所讨论的一个或多个部件(例如,参考图1和图3-6)可以用于执行参考图3所讨论的一个或多个操作。例如,如本文中所讨论的,方法300中的一个或多个操作可以由逻辑单元140(或者其参考图1-2所讨论的部件)和/或(多个)传感器150来执行。
参考图1-3,在操作302,例如基于传感器信息(例如,来自一个或多个传感器150)来识别(通过逻辑单元140)用户设备的位置。在操作304,监控环境噪声(例如,通过逻辑单元140对来自(多个)传感器150的每个传感器输入进行监控)。例如,触发阈值可以被设置为环境噪声水平以上几dB(例如,3dB)。操作306(例如,由逻辑单元140来执行)等待语音触发(例如参考图2所讨论的)。在308的操作(例如,由逻辑单元140执行)确定对操作306的触发是错误触发还是并非是命令(例如参考图2所讨论的)。如果这样,操作310(例如,由逻辑单元140来执行)可以将触发阈值水平修改一些数量的dB(例如,高1dB)。方法300随后返回到操作306。
否则,如果操作308确定对操作306的语音触发不是错误的,则操作312(例如,由逻辑单元140执行)确定语音触发设置是正确的并且操作314(例如,由逻辑单元140来执行,例如基于来自(多个)传感器150的输入)将确定设备的位置是否已经改变。如果位置已经改变,则方法300在操作304继续;否则,方法300在操作306继续。
图4示出了根据实施例的计算系统400的框图。计算系统400可以包括经由互连网络(或总线)404进行通信的一个或多个中央处理单元(CPU)402或处理器。处理器402可以包括通用处理器、网络处理器(其对通过计算网络403传输的数据进行处理)、或其它类型的处理器(包括精简指令集计算机(RISC)处理器或复杂指令集计算机(CISC))。
此外,处理器402可以具有单核或多核设计。具有多核设计的处理器402可以在相同的集成电路(IC)管芯上集成不同类型的处理器核。另外,具有多核设计的处理器402可以被实现为对称的或非对称的多处理器。在实施例中,处理器402中的一个或多个处理器可以与图1中的处理器102相同或类似。此外,系统400的一个或多个部件可以包括耦合至参考图1-3(包括但不限于图4中所示的那些位置)所讨论的(多个)传感器150(在图4中未示出)的逻辑单元140。另外,参考图1-3所讨论的操作可以由系统400的一个或多个部件来执行。
芯片组406还可以与互连网络404进行通信。芯片组406可以包括图形存储器控制中心(GMCH)408,其位于系统400中的各个部件(例如,如图4中所示出的那些部件)中。GMCH408可以包括与存储器412(其可以与图1的存储器114相同或类似)进行通信的存储器控制器410。存储器412可以存储数据,数据包括指令序列,指令序列可以由CPU 402或者包括在计算系统400中的任何其它设备来执行。在一个实施例中,存储器412可以包括一个或多个易失性储存(或存储)设备,例如随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)、或其它类型的存储设备。还可以利用非易失性存储器,例如硬盘驱动器。额外的设备可以经由互连网络404进行通信,例如多个CPU和/或多个系统存储器。
GMCH 408还可以包括与显示设备450进行通信的图形接口414。在一个实施例中,图形接口414可以经由加速图形端口(AGP)或外设部件互连(PCI)(或PCI快速(PCIe)接口)与显示设备450进行通信。在实施例中,显示器(例如,平板显示器)可以通过例如信号转换器与图形接口414进行通信,信号转换器将存储在存储设备(例如,视频存储器或系统存储器)中的对图像的数字表示转化成由显示器设备进行解释和显示的显示信号。所产生的显示信号可以在被显示设备450解释并随后显示在显示设备450上之前经过各个控制设备。
中心接口418可以允许GMCH 408和输入/输出控制中心(ICH)420进行通信。ICH420可以向与计算系统400进行通信的(多个)I/O设备提供接口。ICH 420可以通过外设桥(或控制器)424(例如,外设部件互连(PCI)桥、通用串行总线(USB)控制器、或其它类型的外设桥或控制器)与总线422进行通信。桥424可以在CPU 402与外设设备之间提供数据通路。可以利用其它类型的拓扑结构。另外,多条总线可以例如通过多个桥或控制器与ICH 420进行通信。此外,在各个实施例中,与ICH 420进行通信的其它外设可以包括集成驱动电子设备(IDE)或(多个)小型计算机系统接口(SCSI)硬盘驱动、(多个)USB端口、键盘、鼠标、(多个)平行端口、(多个)串行总线、(多个)软盘驱动器、数字输出支持(例如,数字视频接口(DVI))、或其它设备。
总线422可以与音频设备426、一个或多个磁盘驱动器428、以及网络接口设备430(其与计算机网络403进行通信)进行通信。其它设备可以经由总线422进行通信。另外,在一些实施例中,各个部件(例如,网络接口设备430)可以与GMCH 408进行通信。另外,可以组合处理器402和GMCH 408以形成单个芯片。此外,在其它实施例中,图形加速度计可以被包括在GMCH 408内。
此外,计算系统400可以包括易失性和/或非易失性存储器(或储存器)。例如,非易失性存储器可以包括以下各项中的一个或多个:只读存储器(ROM)、可编程ROM(PROM)、可擦除PROM(EPROM)、电EPROM(EEPROM)、磁盘驱动器(例如,428)、软盘、压缩盘ROM(CD-ROM)、数字多功能盘(DVD)、闪速存储器、磁光盘、或能够存储电子数据(例如,包括指令)的其它类型的非易失性机器可读介质。
图5示出了根据实施例的以点到点(PtP)构造进行布置的计算系统500。具体来说,图5示出了处理器、存储器、和输入/输出设备通过多个点到点接口进行互连的系统。参考图1-4所讨论的操作可以由系统500中的一个或多个其它部件来执行。
如图5中所示的,系统500可以包括几个处理器,为了清楚起见,仅示出了其中的两个——处理器502和504。处理器502和504均可以包括本地存储器控制器中心(MCH)506和508以实现与存储器510和512的通信。存储器510和/或512可以存储诸如参考图4的存储器412所讨论的那些数据之类的各种数据。
在实施例中,处理器502和504可以是参考图4所讨论的处理器402中的一个处理器。处理器502和504可以分别使用点到点(PtP)接口电路516和518、经由PtP接口514来交换数据。另外,处理器502和504均可以使用点到点接口电路526、528、530、和532经由个体的PtP接口522和524与芯片组520交换数据。芯片组520还可以例如使用PtP接口电路537、经由图形接口536与图形电路534交换数据。
可以在处理器502和504内提供至少一个实施例。此外,系统500的一个或多个部件可以包括耦合至参考图1-4(包括但不限于图5中所示的那些位置)所讨论的(多个)传感器150(在图5中未示出)的逻辑单元140。然而,其它实施例可以存在于图5的系统500内的其它电路、逻辑单元、或者设备中。此外,其它实施例可以遍布在图5中所示的若干电路、逻辑单元、或设备中。
芯片组520可以使用PtP接口电路541与总线540进行通信。总线540可以与诸如总线桥542和I/O设备543之类的一个或多个设备进行通信。经由总线544,总线桥542可以与诸如键盘/鼠标545、通信设备546(例如调制解调器、网络接口设备、或者可以与计算机网络403进行通信的其它通信设备)、音频I/O设备547、和/或数据存储设备548之类的其它设备进行通信。数据存储设备548可以存储代码549,该代码549可以由处理器502和/或504来执行。
在一些实施例中,本文中所讨论的部件中的一个或多个部件可以被体现为片上系统(SOC)设备。图6示出了根据实施例的SOC封装件的框图。如图6中所示的,SOC 602包括一个或多个中央处理单元(CPU)核620、一个或多个图形处理单元(GPU)核630、输入/输出(I/O)接口640、以及存储器控制器642。SOC封装件602的各个部件可以耦合至诸如本文中参考其它附图所讨论的互连件或总线之类的互连件或总线。另外,SOC封装件602可以包括更多或更少的部件,例如本文中参考其它附图所讨论的那些部件。此外,SOC封装件620中的每个部件都可以包括一个或多个其它部件,例如,如参考本文中其它附图所讨论的。在一个实施例中,在一个或多个集成电路(IC)管芯(例如,被封装到单个半导体器件中)上提供SOC封装件602(及其部件)。
如图6中所示的,SOC封装件602经由存储器控制器642耦合至存储器660(其可以与本文中所讨论的存储器类似或相同)。在实施例中,存储器660(或其部分)可以集成在SOC封装件602上。
I/O接口640可以例如经由诸如本文中参考其它附图所讨论的互连件和/或总线之类的互连件和/或总线耦合至一个或多个I/O设备670。(多个)I/O设备670可以包括键盘、鼠标、触摸板、显示设备、图像/视频采集设备(例如摄像头或摄影机/视频录像机)、触摸屏、扬声器、等等中的一个或多个。此外,在实施例中,SOC封装件602可以包括/集成逻辑电路140。替代地,可以在SOC封装件602外部提供逻辑单元140(即,作为分立的逻辑单元)。
此外,本文中所讨论的场景、图像、或帧(例如,在各个实施例中,其可以由图形逻辑单元进行处理)可以由图像采集设备(例如,数码相机(其可以嵌入在诸如智能电话、平板设备、膝上型计算机、独立照相机等之类的另一个设备中)或者其采集的图像随后被转换为数字形式的模拟设备)来采集。此外,在一些实施例中,图像采集设备能够采集多个帧。此外,在一些实施例中,在计算机上设计/生成场景中的一个或多个帧。另外,场景中的一个或多个帧可以经由显示器(例如,参考图4和/或图5所讨论的显示器,包括例如平板显示设备等等)来呈现。
以下示例属于另外的实施例。示例1包括一种装置,其包括:逻辑单元,所述逻辑单元至少部分地包括硬件逻辑单元,以执行对一位置的环境噪声触发水平分析并基于所述环境噪声触发水平分析来引起对所述位置的环境噪声触发水平阈值的存储,其中,逻辑单元响应于在所述位置处对音频处理器的检测以及在所述位置处所检测到的声音水平与所存储的环境噪声触发水平阈值的比较,来确定是否引起对所述音频处理器的状态的修改。示例2包括示例1的装置,其中,用于对所述位置执行环境噪声触发水平分析的逻辑单元引起对所述环境噪声触发水平阈值和对所述位置的所述分析的时间的存储。示例3包括示例1的装置,其中,用于引起对所述音频处理器的所述状态的修改的逻辑单元引起所述音频处理器或另一个处理器进入高性能状态或高功耗状态以检测语音命令。示例4包括示例1的装置,其中,用于引起对所述音频处理器的所述状态的修改的逻辑单元响应于未检测到语音命令而引起所述音频处理器或另一个处理器停留在低功耗状态或低性能状态。示例5包括示例1的装置,其中,一个或多个传感器检测指示所述音频处理器的所述位置的数据。示例6包括示例1的装置,其中,所述位置的所存储的环境噪声触发水平阈值在多个计算设备中被共享。示例7包括示例6的装置,其中,所述多个计算设备耦合至相同的计算机网络。示例8包括示例1的装置,其中,在所述位置处对所述音频处理器的检测与周期性唤醒状态一致。示例9包括示例1的装置,其中,在所述位置处对所述音频处理器的检测的发生频率被动态地调节。示例10包括示例1的装置,还包括:用于基于在对所述位置执行所述环境噪声触发水平分析之后发生的错误触发来调节所述位置的所述环境噪声触发水平阈值的逻辑单元。示例11包括示例1的装置,其中,具有一个或多个处理器核的处理器包括用于执行所述分析的逻辑单元。示例12包括示例1至示例11中任何示例的装置,其中,用于执行所述分析的所述逻辑单元、一个或多个处理器核、以及存储器中的一个或多个位于单个集成电路管芯上。
示例13包括一种方法,所述方法包括:执行对一位置的环境噪声触发水平分析并基于所述环境噪声触发水平分析来引起对所述位置的环境噪声触发水平阈值的存储;以及响应于在所述位置处对音频处理器的检测以及在所述位置处所检测到的声音水平与所存储的环境噪声触发水平阈值的比较,来确定是否引起对所述音频处理器的状态的修改。示例14包括示例13的方法,还包括:引起对所述环境噪声触发水平阈值和对所述位置的所述分析的时间的存储。示例15包括示例13的方法,还包括:引起所述音频处理器或另一个处理器进入高性能状态或高功耗状态以检测语音命令。示例16包括示例13的方法,还包括:响应于未检测到语音命令而使得所述音频处理器或另一个处理器停留在低性能状态或低功耗状态。示例17包括示例13的方法,还包括:引起一个或多个传感器检测指示所述音频处理器的所述位置的数据。示例18包括示例13的方法,还包括:在多个计算设备中共享所述位置的所存储的环境噪声触发水平阈值。示例19包括示例18的方法,还包括:引起所述多个计算设备耦合至相同的计算机网络。示例20包括示例13的方法,还包括:引起在所述位置处对所述音频处理器的检测与周期性唤醒状态一致。示例21包括示例13的方法,还包括:动态地调节在所述位置处对所述音频处理器的所述检测的发生频率。示例22包括示例13的方法,还包括:基于在对所述位置执行所述环境噪声触发水平分析之后发生的错误触发来调节所述位置的所述环境噪声触发水平阈值。
示例23包括一种计算机可读介质,所述计算机可读介质包括一条或多条指令,当在处理器上执行时,所述一条或多条指令将所述处理器配置为执行示例13至22中任何示例的一个或多个操作。
示例24包括一种装置,所述装置包括用于执行如示例13至22中的任何示例中所阐述的方法的模块。
示例25包括一种系统,所述系统包括:存储器,所述存储器用于存储一条或多条指令;音频处理器,所述音频处理器用于执行所述一条或多条指令;逻辑单元,所述逻辑单元至少部分地包括硬件逻辑单元,以对一位置执行环境噪声触发水平分析并基于所述环境噪声触发水平分析来引起对环境噪声触发水平阈值的存储,其中,逻辑单元响应于在所述位置处对音频处理器的检测以及在所述位置处所检测到的声音水平与所存储的环境噪声触发水平阈值的比较,来确定是否引起对所述音频处理器的状态的修改。示例26包括示例25的系统,其中,用于对所述位置执行环境噪声触发水平分析的逻辑单元引起对所述环境噪声触发水平阈值和对所述位置的所述分析的时间的存储。示例27包括示例25的系统,其中,引起对所述音频处理器的所述状态的修改的逻辑单元引起所述音频处理器或另一个处理器进入高性能状态或高功耗状态以检测语音命令。示例28包括示例25的系统,其中,用于引起对所述音频处理器的所述状态的修改的逻辑单元响应于未检测到语音命令而引起所述音频处理器或另一个处理器停留在低功耗状态或低性能状态。示例29包括示例25的系统,其中,一个或多个传感器检测指示所述音频处理器的所述位置的数据。示例30包括示例25的系统,其中,所述位置的所存储的环境噪声触发水平阈值在多个计算设备中被共享。示例31包括示例30的系统,其中,所述多个计算设备耦合至相同的计算机网络。示例32包括示例25的系统,其中,在所述位置处对所述音频处理器的检测与周期性唤醒状态一致。示例33包括示例25的系统,其中,在所述位置处对所述音频处理器的检测的发生频率被动态地调节。示例34包括示例25的系统,还包括:用于基于在对所述位置执行所述环境噪声触发水平分析之后发生的错误触发来调节所述位置的所述环境噪声触发水平阈值的逻辑单元。示例35包括示例25的系统,其中,具有一个或多个处理器核的处理器包括用于执行所述分析的逻辑单元。示例36包括示例25至示例35中任何示例的系统,其中,用于执行所述分析的所述逻辑单元、一个或多个处理器核、以及存储器中的一个或多个位于单个集成电路管芯上。
示37包括一种装置,所述装置包括用于执行如任何先前示例中所阐述的方法的模块。
示例38包括一种机器可读存储器,所述机器可读存储器包括机器可读指令,当被执行时,所述机器可读指令执行方法或实现如任何先前示例中所阐述的装置。
在各个实施例中,本文中例如参考图1-6所讨论的操作可以被实现为硬件(例如,逻辑电路)、软件、固件、或者它们的组合,它们可以被提供为计算机程序产品,例如包括在上面存储有用于对计算机进行编程以执行本文中所讨论的过程的指令(或软件程序)的有形(例如,非暂时性)机器可读或计算机可读介质。机器可读介质可以包括诸如参考图1-6所讨论的那些存储设备之类的存储设备。
另外,这些计算机可读介质可以被下载为计算机程序产品,其中,程序可以借助载波或其它传播介质中所提供的数据信号、经由通信链路(例如,总线、调制解调器、或网络连接)从远程计算机(例如,服务器)传送到请求计算机(例如,客户端)。
在说明书中对“一个实施例”或“实施例”的引用表示结合实施例所描述的特定特征、结构、和/或特性可以包括在至少一个实施方式中。在说明书中的各个地方中出现的短语“在一个实施例中”可以指代或可以不全都指代相同的实施例。
另外,在说明书和权利要求书中,可以使用术语“耦合”和“连接”及其它们的派生词。在一些实施例中,“连接”可以用于指示两个或更多个元件彼此直接物理接触或电接触。“耦合”可以表示两个或更多个元件直接物理接触或电接触。然而,“耦合”还可以表示两个或更多个元件可以彼此不直接接触,但仍然可以彼此协作或交互。
因此,尽管已经采用结构特征和/或方法动作专有的语言描述了实施例,但应当理解,所要求保护的主题可以不限于所描述的特定特征或动作。相反,特定特征和动作被公开为实现所要求保护的主题的简单形式。
Claims (24)
1.一种装置,包括:
逻辑单元,所述逻辑单元至少部分地包括硬件逻辑单元,以执行对一位置的环境噪声触发水平分析并且基于所述环境噪声触发水平分析来引起对所述位置的环境噪声触发水平阈值的存储,
其中,逻辑单元响应于在所述位置处对音频处理器的检测以及在所述位置处所检测到的声音水平与所存储的环境噪声触发水平阈值的比较来确定是否引起对所述音频处理器的状态的修改。
2.根据权利要求1所述的装置,其中,用于对所述位置执行环境噪声触发水平分析的逻辑单元引起对所述环境噪声触发水平阈值和对所述位置的所述分析的时间的存储。
3.根据权利要求1所述的装置,其中,用于引起对所述音频处理器的所述状态的修改的逻辑单元引起所述音频处理器或另一个处理器进入高性能状态或高功耗状态以检测语音命令。
4.根据权利要求1所述的装置,其中,用于引起对所述音频处理器的所述状态的修改的逻辑单元响应于未检测到语音命令而引起所述音频处理器或另一个处理器停留在低功耗状态或低性能状态。
5.根据权利要求1所述的装置,其中,一个或多个传感器检测指示所述音频处理器的所述位置的数据。
6.根据权利要求1所述的装置,其中,所述位置的所存储的环境噪声触发水平阈值在多个计算设备中被共享。
7.根据权利要求6所述的装置,其中,所述多个计算设备耦合至相同的计算机网络。
8.根据权利要求1所述的装置,其中,在所述位置处对所述音频处理器的检测与周期性唤醒状态一致。
9.根据权利要求1所述的装置,其中,在所述位置处对所述音频处理器的所述检测的发生频率被动态地调节。
10.根据权利要求1所述的装置,还包括:用于基于在对所述位置执行所述环境噪声触发水平分析之后发生的错误触发来调节所述位置的所述环境噪声触发水平阈值的逻辑单元。
11.根据权利要求1所述的装置,其中,具有一个或多个处理器核的处理器包括用于执行所述分析的逻辑单元。
12.根据权利要求1至11中任一项所述的装置,其中,用于执行所述分析的所述逻辑单元、一个或多个处理器核以及存储器中的一者或多者位于单个集成电路管芯上。
13.一种方法,包括:
执行对一位置的环境噪声触发水平分析并且基于所述环境噪声触发水平分析来引起对所述位置的环境噪声触发水平阈值的存储;以及
响应于在所述位置处对音频处理器的检测以及在所述位置处所检测到的声音水平与所存储的环境噪声触发水平阈值的比较来确定是否引起对所述音频处理器的状态的修改。
14.根据权利要求13所述的方法,还包括:引起对所述环境噪声触发水平阈值和所述位置的所述分析的时间的存储。
15.根据权利要求13所述的方法,还包括:引起所述音频处理器或另一个处理器进入高性能状态或高功耗状态以检测语音命令。
16.根据权利要求13所述的方法,还包括:响应于未检测到语音命令而引起所述音频处理器或另一个处理器停留在低性能状态或低功耗状态。
17.根据权利要求13所述的方法,还包括:引起一个或多个传感器检测指示所述音频处理器的所述位置的数据。
18.根据权利要求13所述的方法,还包括:在多个计算设备中共享所述位置的所存储的环境噪声触发水平阈值。
19.根据权利要求18所述的方法,还包括:引起所述多个计算设备耦合至相同的计算机网络。
20.根据权利要求13所述的方法,还包括:使在所述位置处对所述音频处理器的检测与周期性唤醒状态一致。
21.根据权利要求13所述的方法,还包括:动态地调节在所述位置处对所述音频处理器的所述检测的发生频率。
22.根据权利要求13所述的方法,还包括:基于在对所述位置执行所述环境噪声触发水平分析之后发生的错误触发来调节所述位置的所述环境噪声触发水平阈值。
23.一种计算机可读介质,所述计算机可读介质包括一条或多条指令,当在处理器上执行时,所述一条或多条指令将所述处理器配置为执行根据权利要求13至22中任一项所述的一个或多个操作。
24.一种装置,所述装置包括用于执行如权利要求13至22中的任一项中所要求保护的方法的模块。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2014/074363 WO2015149216A1 (en) | 2014-03-31 | 2014-03-31 | Location aware power management scheme for always-on- always-listen voice recognition system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106062661A true CN106062661A (zh) | 2016-10-26 |
CN106062661B CN106062661B (zh) | 2021-09-07 |
Family
ID=54239210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480076634.3A Active CN106062661B (zh) | 2014-03-31 | 2014-03-31 | 用于常开常听的语音识别系统的位置感知功率管理方案 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10133332B2 (zh) |
EP (1) | EP3126929B1 (zh) |
KR (1) | KR102018152B1 (zh) |
CN (1) | CN106062661B (zh) |
WO (1) | WO2015149216A1 (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018149285A1 (zh) * | 2017-02-16 | 2018-08-23 | 腾讯科技(深圳)有限公司 | 语音唤醒方法、装置、电子设备及存储介质 |
CN108536413A (zh) * | 2017-03-06 | 2018-09-14 | 北京君正集成电路股份有限公司 | 一种音频数据采集方法及设备 |
CN108536412A (zh) * | 2017-03-06 | 2018-09-14 | 北京君正集成电路股份有限公司 | 一种音频数据采集方法及设备 |
US10133332B2 (en) | 2014-03-31 | 2018-11-20 | Intel Corporation | Location aware power management scheme for always-on-always-listen voice recognition system |
CN109218899A (zh) * | 2018-08-29 | 2019-01-15 | 出门问问信息科技有限公司 | 一种语音交互场景的识别方法、装置及智能音箱 |
CN109243447A (zh) * | 2018-10-12 | 2019-01-18 | 西安蜂语信息科技有限公司 | 语音发送触发方法及装置 |
CN109671426A (zh) * | 2018-12-06 | 2019-04-23 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN110083218A (zh) * | 2018-01-25 | 2019-08-02 | 三星电子株式会社 | 应用处理器、电子装置以及操作应用处理器的方法 |
CN110086923A (zh) * | 2018-01-25 | 2019-08-02 | 三星电子株式会社 | 应用处理器和包括其的电子装置 |
CN111028831A (zh) * | 2019-11-11 | 2020-04-17 | 云知声智能科技股份有限公司 | 一种语音唤醒方法及装置 |
CN111343331A (zh) * | 2018-12-18 | 2020-06-26 | 亚玛芬体育数字服务公司 | 嵌入式计算设备管理 |
CN111837179A (zh) * | 2018-03-12 | 2020-10-27 | 赛普拉斯半导体公司 | 捕获噪声用于模式识别处理的系统和方法 |
US11137820B2 (en) | 2015-12-01 | 2021-10-05 | Amer Sports Digital Services Oy | Apparatus and method for presenting thematic maps |
US11145272B2 (en) | 2016-10-17 | 2021-10-12 | Amer Sports Digital Services Oy | Embedded computing device |
US11144107B2 (en) | 2015-12-01 | 2021-10-12 | Amer Sports Digital Services Oy | Apparatus and method for presenting thematic maps |
US11210299B2 (en) | 2015-12-01 | 2021-12-28 | Amer Sports Digital Services Oy | Apparatus and method for presenting thematic maps |
US11215457B2 (en) | 2015-12-01 | 2022-01-04 | Amer Sports Digital Services Oy | Thematic map based route optimization |
US11284807B2 (en) | 2015-12-21 | 2022-03-29 | Amer Sports Digital Services Oy | Engaging exercising devices with a mobile device |
US11541280B2 (en) | 2015-12-21 | 2023-01-03 | Suunto Oy | Apparatus and exercising device |
US11587484B2 (en) | 2015-12-21 | 2023-02-21 | Suunto Oy | Method for controlling a display |
US11607144B2 (en) | 2015-12-21 | 2023-03-21 | Suunto Oy | Sensor based context management |
US11703938B2 (en) | 2016-10-17 | 2023-07-18 | Suunto Oy | Embedded computing device |
US11838990B2 (en) | 2015-12-21 | 2023-12-05 | Suunto Oy | Communicating sensor data in wireless communication systems |
US11874716B2 (en) | 2015-08-05 | 2024-01-16 | Suunto Oy | Embedded computing device management |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9516165B1 (en) * | 2014-03-26 | 2016-12-06 | West Corporation | IVR engagements and upfront background noise |
JP6636644B2 (ja) * | 2016-04-11 | 2020-01-29 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | 周囲ノイズに基づくコンピューティング装置のスリープ解除 |
US10880833B2 (en) * | 2016-04-25 | 2020-12-29 | Sensory, Incorporated | Smart listening modes supporting quasi always-on listening |
US20180025731A1 (en) * | 2016-07-21 | 2018-01-25 | Andrew Lovitt | Cascading Specialized Recognition Engines Based on a Recognition Policy |
WO2018118744A1 (en) * | 2016-12-19 | 2018-06-28 | Knowles Electronics, Llc | Methods and systems for reducing false alarms in keyword detection |
US10403279B2 (en) * | 2016-12-21 | 2019-09-03 | Avnera Corporation | Low-power, always-listening, voice command detection and capture |
US10748531B2 (en) * | 2017-04-13 | 2020-08-18 | Harman International Industries, Incorporated | Management layer for multiple intelligent personal assistant services |
US10930276B2 (en) | 2017-07-12 | 2021-02-23 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US11489691B2 (en) | 2017-07-12 | 2022-11-01 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US10171054B1 (en) * | 2017-08-24 | 2019-01-01 | International Business Machines Corporation | Audio adjustment based on dynamic and static rules |
JP7374099B2 (ja) * | 2018-01-03 | 2023-11-06 | ユニバーサル エレクトロニクス インコーポレイテッド | 制御デバイスにおいて音声入力を指示する装置、システム及び方法 |
KR102459920B1 (ko) * | 2018-01-25 | 2022-10-27 | 삼성전자주식회사 | 저전력 에코 제거를 지원하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 |
KR102629385B1 (ko) * | 2018-01-25 | 2024-01-25 | 삼성전자주식회사 | 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 |
US11232788B2 (en) * | 2018-12-10 | 2022-01-25 | Amazon Technologies, Inc. | Wakeword detection |
US11012780B2 (en) * | 2019-05-14 | 2021-05-18 | Bose Corporation | Speaker system with customized audio experiences |
US20210005181A1 (en) * | 2019-06-10 | 2021-01-07 | Knowles Electronics, Llc | Audible keyword detection and method |
KR20220151504A (ko) * | 2021-05-06 | 2022-11-15 | 삼성전자주식회사 | 오호출을 식별하는 서버 및 이의 제어 방법 |
US11967322B2 (en) | 2021-05-06 | 2024-04-23 | Samsung Electronics Co., Ltd. | Server for identifying false wakeup and method for controlling the same |
WO2024053762A1 (ko) * | 2022-09-08 | 2024-03-14 | 엘지전자 주식회사 | 음성 인식 장치 및 그의 동작 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102859592A (zh) * | 2010-06-04 | 2013-01-02 | 苹果公司 | 用于语音质量改进的用户特定的噪声抑制 |
US20130223635A1 (en) * | 2012-02-27 | 2013-08-29 | Cambridge Silicon Radio Limited | Low power audio detection |
CN103282957A (zh) * | 2010-08-06 | 2013-09-04 | 谷歌公司 | 基于上下文自动监测话音输入 |
CN103310785A (zh) * | 2012-03-15 | 2013-09-18 | 三星电子株式会社 | 使用语音识别控制电源的电子装置和方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7343395B2 (en) | 2002-03-29 | 2008-03-11 | Intel Corporation | Facilitating resource access using prioritized multicast responses to a discovery request |
JP2004212641A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 音声入力システム及び音声入力システムを備えた端末装置 |
CN101127540B (zh) * | 2006-08-15 | 2011-03-16 | 大唐移动通信设备有限公司 | 一种功率控制方法及装置 |
JP5879150B2 (ja) | 2012-02-21 | 2016-03-08 | 日本放送協会 | フレーズ検出装置およびそのプログラム |
US9142215B2 (en) * | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
CN104620642A (zh) * | 2012-07-17 | 2015-05-13 | 英特托拉斯技术公司 | 便携式资源管理系统和方法 |
US9063731B2 (en) * | 2012-08-27 | 2015-06-23 | Samsung Electronics Co., Ltd. | Ultra low power apparatus and method to wake up a main processor |
US20140122078A1 (en) * | 2012-11-01 | 2014-05-01 | 3iLogic-Designs Private Limited | Low Power Mechanism for Keyword Based Hands-Free Wake Up in Always ON-Domain |
US9240182B2 (en) * | 2013-09-17 | 2016-01-19 | Qualcomm Incorporated | Method and apparatus for adjusting detection threshold for activating voice assistant function |
EP3126929B1 (en) | 2014-03-31 | 2020-11-18 | Intel Corporation | Location aware power management scheme for always-on- always-listen voice recognition system |
-
2014
- 2014-03-31 EP EP14887894.5A patent/EP3126929B1/en active Active
- 2014-03-31 CN CN201480076634.3A patent/CN106062661B/zh active Active
- 2014-03-31 WO PCT/CN2014/074363 patent/WO2015149216A1/en active Application Filing
- 2014-03-31 KR KR1020167023360A patent/KR102018152B1/ko active IP Right Grant
- 2014-03-31 US US15/113,780 patent/US10133332B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102859592A (zh) * | 2010-06-04 | 2013-01-02 | 苹果公司 | 用于语音质量改进的用户特定的噪声抑制 |
CN103282957A (zh) * | 2010-08-06 | 2013-09-04 | 谷歌公司 | 基于上下文自动监测话音输入 |
US20130223635A1 (en) * | 2012-02-27 | 2013-08-29 | Cambridge Silicon Radio Limited | Low power audio detection |
CN103310785A (zh) * | 2012-03-15 | 2013-09-18 | 三星电子株式会社 | 使用语音识别控制电源的电子装置和方法 |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10133332B2 (en) | 2014-03-31 | 2018-11-20 | Intel Corporation | Location aware power management scheme for always-on-always-listen voice recognition system |
US11874716B2 (en) | 2015-08-05 | 2024-01-16 | Suunto Oy | Embedded computing device management |
US11215457B2 (en) | 2015-12-01 | 2022-01-04 | Amer Sports Digital Services Oy | Thematic map based route optimization |
US11210299B2 (en) | 2015-12-01 | 2021-12-28 | Amer Sports Digital Services Oy | Apparatus and method for presenting thematic maps |
US11144107B2 (en) | 2015-12-01 | 2021-10-12 | Amer Sports Digital Services Oy | Apparatus and method for presenting thematic maps |
US11137820B2 (en) | 2015-12-01 | 2021-10-05 | Amer Sports Digital Services Oy | Apparatus and method for presenting thematic maps |
US11607144B2 (en) | 2015-12-21 | 2023-03-21 | Suunto Oy | Sensor based context management |
US11587484B2 (en) | 2015-12-21 | 2023-02-21 | Suunto Oy | Method for controlling a display |
US11541280B2 (en) | 2015-12-21 | 2023-01-03 | Suunto Oy | Apparatus and exercising device |
US11284807B2 (en) | 2015-12-21 | 2022-03-29 | Amer Sports Digital Services Oy | Engaging exercising devices with a mobile device |
US11838990B2 (en) | 2015-12-21 | 2023-12-05 | Suunto Oy | Communicating sensor data in wireless communication systems |
US11703938B2 (en) | 2016-10-17 | 2023-07-18 | Suunto Oy | Embedded computing device |
US11145272B2 (en) | 2016-10-17 | 2021-10-12 | Amer Sports Digital Services Oy | Embedded computing device |
WO2018149285A1 (zh) * | 2017-02-16 | 2018-08-23 | 腾讯科技(深圳)有限公司 | 语音唤醒方法、装置、电子设备及存储介质 |
US11069343B2 (en) | 2017-02-16 | 2021-07-20 | Tencent Technology (Shenzhen) Company Limited | Voice activation method, apparatus, electronic device, and storage medium |
CN108536412B (zh) * | 2017-03-06 | 2021-01-08 | 北京君正集成电路股份有限公司 | 一种音频数据采集方法及设备 |
CN108536412A (zh) * | 2017-03-06 | 2018-09-14 | 北京君正集成电路股份有限公司 | 一种音频数据采集方法及设备 |
CN108536413A (zh) * | 2017-03-06 | 2018-09-14 | 北京君正集成电路股份有限公司 | 一种音频数据采集方法及设备 |
CN110083218A (zh) * | 2018-01-25 | 2019-08-02 | 三星电子株式会社 | 应用处理器、电子装置以及操作应用处理器的方法 |
US11216399B2 (en) | 2018-01-25 | 2022-01-04 | Samsung Electronics Co., Ltd. | Application processor for low power operation, electronic device including the same and method of operating the same |
CN110086923A (zh) * | 2018-01-25 | 2019-08-02 | 三星电子株式会社 | 应用处理器和包括其的电子装置 |
CN110086923B (zh) * | 2018-01-25 | 2023-10-13 | 三星电子株式会社 | 应用处理器和包括其的电子装置 |
CN111837179A (zh) * | 2018-03-12 | 2020-10-27 | 赛普拉斯半导体公司 | 捕获噪声用于模式识别处理的系统和方法 |
CN109218899A (zh) * | 2018-08-29 | 2019-01-15 | 出门问问信息科技有限公司 | 一种语音交互场景的识别方法、装置及智能音箱 |
CN109243447A (zh) * | 2018-10-12 | 2019-01-18 | 西安蜂语信息科技有限公司 | 语音发送触发方法及装置 |
CN109671426A (zh) * | 2018-12-06 | 2019-04-23 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN111343331B (zh) * | 2018-12-18 | 2022-02-22 | 亚玛芬体育数字服务公司 | 嵌入式计算设备管理 |
CN111343331A (zh) * | 2018-12-18 | 2020-06-26 | 亚玛芬体育数字服务公司 | 嵌入式计算设备管理 |
CN111028831B (zh) * | 2019-11-11 | 2022-02-18 | 云知声智能科技股份有限公司 | 一种语音唤醒方法及装置 |
CN111028831A (zh) * | 2019-11-11 | 2020-04-17 | 云知声智能科技股份有限公司 | 一种语音唤醒方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US10133332B2 (en) | 2018-11-20 |
EP3126929B1 (en) | 2020-11-18 |
KR20160113255A (ko) | 2016-09-28 |
EP3126929A1 (en) | 2017-02-08 |
KR102018152B1 (ko) | 2019-09-04 |
WO2015149216A1 (en) | 2015-10-08 |
EP3126929A4 (en) | 2017-11-22 |
US20170031420A1 (en) | 2017-02-02 |
CN106062661B (zh) | 2021-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106062661A (zh) | 用于常开常听的语音识别系统的位置感知功率管理方案 | |
US11094246B2 (en) | Operating module for display and operating method, and electronic device supporting the same | |
US10127051B2 (en) | Multi-processor device | |
US10579528B2 (en) | Electronic device and method for controlling shareable cache memory thereof | |
JP5350356B2 (ja) | セキュリティイベントを管理する方法及び装置 | |
US10248086B2 (en) | Electronic device for controlling air condition based on location information and method of operating the same | |
US20220346020A1 (en) | Method for reducing power consumption of terminal, and terminal | |
KR20170018704A (ko) | 지오펜스 관리 방법 및 그 전자 장치 | |
CN106255937A (zh) | 具有始终通电的处理器的片上系统 | |
CN106415296A (zh) | 自适应电池寿命延长 | |
CN109582105A (zh) | 应用处理器、相应移动装置和选择时钟信号的方法 | |
CN103548374A (zh) | 远程地执行使用移动设备的地理位置数据的应用的服务器 | |
CN103544244B (zh) | 信息处理方法、装置及移动终端 | |
KR20170075327A (ko) | 전력을 관리하는 전자 장치 및 그 제어 방법 | |
CN109144232A (zh) | 进程处理方法和装置、电子设备、计算机可读存储介质 | |
CN111328020A (zh) | 基于室内定位系统的业务处理方法和装置 | |
US11125891B2 (en) | Method for calculating location information and electronic device therefor | |
CN103959199A (zh) | 用于先进先出(fifo)存储器的功率节约方法和装置 | |
KR20180108192A (ko) | 위치 결정 방법, 전자 장치 및 저장 매체 | |
CN108958447A (zh) | 唤醒对齐时间间隔计算方法及装置 | |
JP2022008797A (ja) | 端末の電力消費を低減するための方法、および端末 | |
KR20170054876A (ko) | 스케줄 정보를 관리하기 위한 방법 및 그 전자 장치 | |
CN109992360A (zh) | 进程处理方法和装置、电子设备、计算机可读存储介质 | |
TWI587126B (zh) | 用於通用串列匯流排(usb)操作之性能最佳化的系統及方法 | |
US20230141749A1 (en) | Failure prediction method and device for a storage device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |