CN109753862B - 声音辨识装置及用于控制电子装置的方法 - Google Patents
声音辨识装置及用于控制电子装置的方法 Download PDFInfo
- Publication number
- CN109753862B CN109753862B CN201810174156.XA CN201810174156A CN109753862B CN 109753862 B CN109753862 B CN 109753862B CN 201810174156 A CN201810174156 A CN 201810174156A CN 109753862 B CN109753862 B CN 109753862B
- Authority
- CN
- China
- Prior art keywords
- voice recognition
- microphone
- microphones
- digital audio
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000005236 sound signal Effects 0.000 claims abstract description 71
- 230000033001 locomotion Effects 0.000 claims description 27
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 2
- 238000009429 electrical wiring Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005057 finger movement Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/23—Direction finding using a sum-delay beam-former
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供一种声音辨识装置及用于控制电子装置的方法,该声音辨识装置包括:一麦克风阵列,包括多个麦克风,设置在安装于该声音辨识装置的一外壳上的一麦克风模块之中,其中各麦克风接收在该麦克风模块的表面上操作的一手势动作所造成的一音频信号,并将所接收的该音频信号转换为一数字音频信号;以及一处理单元,用以接收来自各麦克风的该数字音频信号,并对来自各麦克风的该数字音频信号进行一声音辨识处理以产生带有该手势动作的信息的一声音辨识结果,其中该处理单元依据该声音辨识结果以控制由该处理单元执行的至少一应用程序。
Description
技术领域
本发明涉及音频处理,特别涉及一种声音辨识装置及用于控制电子装置的方法。
背景技术
在例如是一移动装置、平板计算机、或笔记型计算机的电子装置中,会具有周边装置可经由用户接口以控制一些应用程序。传统的周边装置包括触控屏幕及一或多个实体按钮(例如音量增加/减少按钮)。然而,这些周边装置在某些情况下并未被启动,例如当电子装置处于睡眠模式或屏幕保护模式时。此外,这些电子装置会配备有一或多个麦克风设置于或安装于电子装置之外壳上,且这些麦克风可以轻易地被用户所触及。
因此,需要一种声音辨识装置及用于控制电子装置的方法以增进用户体验。
发明内容
本发明提供一种声音辨识装置,包括:一麦克风阵列,包括多个麦克风,设置在安装于该声音辨识装置的一外壳上的一麦克风模块之中,其中各麦克风接收在该麦克风模块的表面上操作的一手势动作所造成的一音频信号,并将所接收的该音频信号转换为一数字音频信号;以及一处理单元,用以接收来自各麦克风的该数字音频信号,并对来自各麦克风的该数字音频信号进行一声音辨识处理以产生带有该手势动作的信息的一声音辨识结果,其中该处理单元依据该声音辨识结果以控制由该处理单元执行的至少一应用程序。
在本发明的一实施例中,在该麦克风阵列中的两个相邻的麦克风之间的距离介于2毫米至15毫米。
在本发明的一实施例中,该处理单元套用一高通滤波器至来自各麦克风的该数字音频信号,并由各麦克风的过滤后的该数字音频信号检测出一脉冲信号,且该处理单元还计算来自各麦克风的该过滤后的数字音频信号的时间差以决定在该手势动作中的各移动的速度。该处理单元还计算在该手势动作中的各移动的该速度的一加权总和以产生该声音辨识结果,其中该声音辨识结果的正负号表示该手势动作的方向,且该声音辨识结果的绝对值表示该手势动作的速度。
在本发明的一实施例中,其中该至少一应用程序包括画面卷动、音量控制、快转或快速回放、画面放大或缩小及解锁屏幕。
本发明还提供一种用于控制电子装置的方法,其中该电子装置包括一麦克风阵列,具有多个麦克风,设置在安装于该电子装置的一外壳上的一麦克风模块之中,该方法包括:利用各麦克风接收在该麦克风模块的表面上操作的一手势动作所造成的一音频信号,并将所接收的该音频信号转换为一数字音频信号;对来自各麦克风的该数字音频信号进行一声音辨识处理以产生带有该手势动作的信息的一声音辨识结果;以及依据该声音辨识结果以控制由该电子装置所执行的至少一应用程序。
附图说明
图1是显示依据本发明一实施例的声音辨识装置的功能方块图。
图2A及2B是显示依据本发明一实施例中在麦克风阵列上进行的手势动作的示意图。
图3是显示依据本发明一实施例中的声音辨识处理的示意图。
图4是显示依据本发明一实施例中的用于控制电子装置的方法的流程图。
【符号说明】
100~声音辨识装置;
110~麦克风阵列;
111~麦克风;
115~麦克风模块;
120~处理单元;
140~外壳;
210~指尖;
211-212~声音孔;
111A、111B~麦克风;
310~前处理阶段;
320~方向辨识阶段;
330~速度估计阶段;
301~第一数字音频信号;
302~第二数字音频信号;
311、312~高通滤波器;
313~过滤后的第一数字音频信号;
314~过滤后的第二数字音频信号;
315、316~脉冲检测器;
317、318~时间信息;
321~延迟估计器;
331~速度估计器;
Sf~最终速度;
S410-S430~步骤。
具体实施方式
为使本发明的上述目的、特征和优点能更明显易懂,下文特举一优选实施例,并配合附图,作详细说明如下。
图1是显示依据本发明一实施例的声音辨识装置的功能方块图。在一实施例中,声音辨识装置100可为一电子装置或是可设置于一电子装置中,例如是一智能手机、平板计算机、一笔记型计算机、或是无线耳机,但本发明并不限于此。如图1所示,声音辨识装置100包括一麦克风阵列110及一处理单元120。
在一实施例中,麦克风阵列110包括至少两个麦克风111,用以接收声音辨识装置100的一环境声音信号(ambient sound signal)。举例来说,所接收的环境声音信号为一模拟音频信号,且各麦克风111包括一模拟数字转换器(analog-to-digital converter,ADC)(未绘示),用以利用脉冲编码调制(pulse-code modulation,PCM)将所接收的环境声音信号进行数字化(digitize),并输出具有PCM格式的数字音频信号。举例来说,麦克风111的采样频率(sampling rate)可为8000Hz或更高的频率,但本发明并不限于此。
麦克风111可利用工业标准而组装于一隔音罩(acoustic enclosure)中。麦克风111可在空间上分布于一线、一二维阵列、或一三维阵列上,且在麦克风111之间可具有均匀或非均匀的间隔。
详细而言,在此实施例中,麦克风阵列110可设置于安装在声音辨识装置100的外壳140上的一麦克风模块115、或是设置于声音辨识装置100的一部分的基板上。在麦克风阵列110中的麦克风111彼此之间会相隔一预定距离,且会利用外壳140中的个别腔室(chamber)以彼此音频隔离并防止声音传递。此外,各麦克风111的腔室在麦克风模块115的表面会具有一声音孔(sound hole),且各麦克风111经由各自的声音孔以接收音频信号。
举例来说,在麦克风阵列110中的两个相邻麦克风111之间的距离可由2毫米(mm)至15毫米,或是在指尖可轻易覆盖的范围内,但本发明并不限于此。
处理单元120可为数字信号处理器(digital signal processor,DSP)、或一般用途处理器(general-purpose processor),但本发明并不限于此。处理单元120用以接收来自麦克风阵列110中的各麦克风111的数字音频信号,并执行一声音辨识处理以辨识在麦克风阵列110上所进行的手势动作(gesture)以产生带有手势动作的信息的声音辨识结果。
图2A及2B是显示依据本发明一实施例中在麦克风阵列上进行的手势动作的示意图。为了便于说明,假设麦克风阵列110具有两个麦克风111。
在一实施例中,用户可利用其指尖210以接触具有声音孔211及212的麦克风模块115的表面,并由其中一个声音孔滑动至另一个声音孔。举例来说,当指尖210由声音孔212移动至声音孔211时,这表示为一往上的动作,如图2A所示。当指尖210由声音孔211移动至声音孔212时,这表示为一往下的动作,如图2B所示。需注意的是,当使用更多具有声音孔的麦克风时,可进行更复杂的手势动作。
有了这样在声音孔211及212上的手指动作,麦克风111会由指尖所操作的手势动作(例如:触摸并滑动)的麦克风模块115的表面接收音频信号。详细而言,当指尖210在麦克风模块115的表面上进行手势动作时,其会造成一音频信号,可被设置于麦克风模块115中的麦克风111所接收。换句话说,声音辨识处理的声音来源可来自被指尖210正在接触的表面。接着,由在麦克风模块115的表面上操作的手势动作所造成的音频信号会被转换为数字音频信号,其可传送至处理单元120以进行后续的声音辨识处理。
图3是显示依据本发明一实施例中的声音辨识处理的示意图。
在一实施例中,由处理单元120所执行的声音辨识处理可包括下列阶段:前处理阶段310、方向辨识阶段320及速度估计阶段330。在前处理阶段310中,处理单元120可套用线性或非线性的滤波器至来自麦克风111的数字音频信号以降低干扰信号,这可能包括环境噪声(ambient noise)或人声(human voices)。
在方向辨识阶段320中,处理单元120辨识手势动作的方向,例如是指尖210在麦克风阵列110上的滑动方向。在速度估计阶段330,处理单元估计手势动作(例如指尖的滑动动作)的速度。
在一实施例中,麦克风阵列110包括麦克风111A及111B。如图3所示,麦克风111A及111B均会接收到来自麦克风模块115的表面的一音频信号,且由麦克风111A及111B所接收的音频信号会分别被转换为一第一数字音频信号301及一第二数字音频信号302。来自麦克风111A的第一数字音频信号301会被传送至一高通滤波器311,且来自麦克风111B的第二数字音频信号302会被传送至一高通滤波器312。
举例来说,高通滤波器311及312彼此类似,且可分别套用至第一数字音频信号301及第二数字音频信号302以降低环境噪声例如风声噪声、车辆噪声、或主要在低频范围中的其他类型的噪声。高通滤波器311与高通滤波器312的截止频率(cut-off frequency)可介于1000Hz及2000Hz之间,但本发明并不限于此。
过滤后的第一数字音频信号313及过滤后的第二数字音频信号314分别传送至脉冲检测器315及脉冲检测器316。脉冲检测器315及脉冲检测器316彼此类似。举例来说,由在麦克风模块115的表面上操作的手势动作所造成的音频信号的波形在时域(time domain)中可能为一脉冲(pulse)或是短促(shortburst)信号。脉冲检测器315及脉冲检测器316可决定麦克风触控信号的候选信号。
详细而言,脉冲检测器315可设定一阈值用以辨识具有振幅(amplitude)大于该阈值的过滤后的第一数字音频信号313。若过滤后的第一数字音频信号313的振幅大于该阈值,脉冲检测器315会计算过滤后的第一数字音频信号313的振幅在该阈值以上的时间。
当脉冲检测器315所计算的时间短于一预定时间,脉冲检测器315会由过滤后的第一数字音频信号313中检测出一第一脉冲信号,并接着标示与第一脉冲信号相关的时间信息317。时间信息317被传送至延迟估计器321。
类似地,当脉冲检测器316所计算的时间短于一预定时间,脉冲检测器316会由过滤后的第二数字音频信号314中检测出一第二脉冲信号,并接着标示与第二脉冲信号相关的时间信息318。时间信息318被传送至延迟估计器321。需注意的是,高通滤波器311及312、以及脉冲检测器315及316包含于前处理阶段310中。
方向辨识阶段320包括延迟估计器321,用以估计来自脉冲检测器315及316的第一脉冲信号及第二脉冲信号的时间差。举例来说,若用户的指尖在麦克风模块115的表面上滑动,各麦克风111的脉冲检测器所检测到的脉冲信号会发生在不同时间。因此,由脉冲检测器315及316所检测的第一脉冲信号及第二脉冲信号之间的时间差(即时间延迟)可用以估计滑动操作的方向及速度。
详细而言,若时间差在一预定范围内,延迟估计器321可决定在麦克风模块115的表面上的滑动操作为一有效滑动事件(valid sliding event)。上述时间差可为正数或负数,分别表示滑动操作的方向。举例来说,正的时间差表示往上的方向,且负的时间差表示向下的方向。选择性地,正的时间差可表示由左至右的方向,且负的时间差可表示由右往左的方向。需注意的是,上述实施例中的方向仅用于说明,实际的方向视麦克风阵列110中的麦克风111的排列方式而定。
举例来说,滑动操作的速度可用下列公式所表示:
S1=D/T(1)
其中D表示相邻的麦克风之间的距离;T表示所估计的时间差(即时间延迟);且S1表示滑动操作的速度。如上所述,估计的时间差可为正数或负数,分别表示滑动操作的不同方向。
速度估计阶段330包括速度估计器331,用以估计整体滑动事件的最终速度。举例来说,由延迟估计器321所估计的速度表示单一移动(例如滑动操作)的速度。然而,整体的手势动作可包括一或多个移动。速度估计器331可藉由考虑后续移动而调整最终速度。最终速度Sf可用下列公式表示:
Sf=S1+W2*S2+…+WN*SN(2)
其中N为一正整数;W2、W3、…、WN为介于0至1之间的权重值;且S1、S2、…、SN分别为第一、第二、…、第N个滑动操作的估计速度。详细而言,在一预定的时间窗(time window)中,若仅有一个滑动操作,最终速度Sf等于与第一滑动操作有关的估计速度S1。除此之外,最终速度Sf为在手势动作中的多个移动的估计速度的加权总和。
在计算出最终速度Sf后,处理单元120会产生表示该手势操作的方向及速度的声音辨识结果。
在图2A及图2B的实施例中,声音辨识结果的输出信号可用一有号数X表示,且X为一整数或实数,其定义显示于表1。
表1
X的数值可用于控制在一电子装置中在不同应用的一应用程序或装置驱动程序(device driver)。上述应用可包括但不限于在一网页浏览器(web browser)或一文件编辑器中卷动画面(scroll screen)、在一媒体播放器中进行音量控制(volume control)、在一媒体播放器中进行快转(fast forward)或快速回放(fast rewind)、在相机拍摄时进行放大(zoom in)或缩小(zoom out)、在屏幕保护模式(screensaver mode)下解锁画面及在无线耳机中的扬声器的音量控制。上述应用中的操作如表2所示。
表2
图4是显示依据本发明一实施例中的用于控制电子装置的方法的流程图。
在步骤S410,利用在麦克风阵列110中的各麦克风111以接收由在麦克风模块115的表面上操作的手势动作(例如:接触并滑动)所造成的音频信号,并将所接收的音频信号转换为一数字音频信号。举例来说,在麦克风模块115的表面上操作的手势动作可为声音来源以产生该音频信号,并可由各麦克风111所接收。
在步骤S420,对来自各麦克风111的数字音频信号进行一声音辨识处理以产生带有该手势动作的信息的声音辨识结果。举例来说,声音辨识处理可包括前处理阶段310、方向辨识阶段320及速度估计阶段330,如图3的实施例所述。
在步骤S430,依据声音辨识结果以控制由电子装置(例如可为声音辨识装置100)所执行的至少一应用程序。举例来说,声音辨识结果带有关于该手势动作的方向(例如声音辨识结果的正负号)及速度(例如声音辨识结果的绝对值)的信息。
综上所述,本发明提供一种声音辨识装置及用于控制电子装置的方法。本发明的声音辨识装置及用于控制电子装置的方法可利用麦克风阵列以控制一电子装置。在对来自麦克风阵列中的各麦克风的数字音频信号进行声音辨识处理,可估计出在麦克风模块的表面上操作的手势动作的方向及速度。因此,可利用声音辨识处理的声音辨识结果以控制由电子装置所执行的一或多个应用程序,而不必使用传统的周边装置,例如是触控屏幕或实体按钮。因为包含有麦克风阵列的麦克风模块可轻易地被用户所触及,故可增进控制电子装置的用户体验。
本发明的方法,或特定形态或其部分,可以以程序代码的形态包含于物理介质,如软盘、光盘、硬盘、或是任何其他机器可读取(如计算机可读取)存储介质,其中,当程序代码被机器,如计算机载入且执行时,此机器变成用以参与本发明的装置或系统。本发明的方法、系统与装置也可以以程序代码形态通过一些传送介质,如电线或电缆、光纤、或是任何传输形态进行传送,其中,当程序代码被机器,如计算机接收、载入且执行时,此机器变成用以参与本发明的装置或系统。当在一般用途处理器实作时,程序代码结合处理器提供一操作类似于应用特定逻辑电路的独特装置。
本发明虽以优选实施例公开如上,然其并非用以限定本发明的范围,本领域技术人员在不脱离本发明的精神和范围内,当可做些许的更动与润饰,因此本发明的保护范围当视所附权利要求书界定范围为准。
Claims (8)
1.一种声音辨识装置,包括:
麦克风阵列,包括多个麦克风,设置在安装于该声音辨识装置的外壳上的麦克风模块之中,其中,各麦克风分别位于彼此音频隔离并且防止声音传递的腔室中,各麦克风的腔室在该麦克风模块的表面上各自具有一声音孔,各麦克风经由各自的声音孔接收在该麦克风模块的表面上操作的滑动动作所造成的音频信号,并将所接收的该音频信号转换为数字音频信号;以及
处理单元,用以接收来自各麦克风的该数字音频信号,并对来自各麦克风的该数字音频信号进行声音辨识处理以产生带有该滑动动作的信息的声音辨识结果,
其中该处理单元套用高通滤波器至来自各麦克风的该数字音频信号,并辨识各麦克风的过滤后的该数字音频信号,以将具有振幅大于预定阈值并且振幅大于预定阈值的时间小于预定时间的数字音频信号检测为由手势动作造成的脉冲信号,以及计算来自各麦克风的检测出的脉冲信号的时间差以决定在该手势动作中的各移动的速度,
其中该处理单元依据该声音辨识结果以控制由该处理单元执行的至少一应用程序。
2.如权利要求1所述的声音辨识装置,其中在该麦克风阵列中的两个相邻的麦克风之间的距离介于2毫米至15毫米。
3.如权利要求1所述的声音辨识装置,其中该处理单元还计算在该手势动作中的各移动的该速度的加权总和以产生该声音辨识结果,其中该声音辨识结果的正负号表示该手势动作的方向,且该声音辨识结果的绝对值表示该手势动作的速度。
4.如权利要求1所述的声音辨识装置,其中该至少一应用程序包括画面卷动、音量控制、快转或快速回放、画面放大或缩小及解锁屏幕。
5.一种用于控制电子装置的方法,其中该电子装置包括麦克风阵列,具有多个麦克风,设置在安装于该电子装置的外壳上的麦克风模块之中,其中各麦克风分别位于彼此音频隔离并且防止声音传递的腔室中,各麦克风的腔室在该麦克风模块的表面上各自具有一声音孔,该方法包括:
利用各麦克风经由各自的声音孔接收在该麦克风模块的表面上操作的滑动动作所造成的音频信号,并将所接收的该音频信号转换为数字音频信号;
套用高通滤波器至来自各麦克风的该数字音频信号;
辨识各麦克风的过滤后的该数字音频信号,以将具有振幅大于预定阈值并且振幅大于预定阈值的时间小于预定时间的数字音频信号检测为由手势动作造成的脉冲信号;
计算来自各麦克风的检测出的脉冲信号的时间差以决定在该手势动作中的各移动的速度;
对来自各麦克风的该数字音频信号进行声音辨识处理以产生带有该手势动作的信息的声音辨识结果;以及
依据该声音辨识结果以控制由该电子装置所执行的至少一应用程序。
6.如权利要求5所述的方法,其中在该麦克风阵列中的两个相邻的麦克风之间的距离介于2毫米至15毫米。
7.如权利要求5所述的方法,还包括:
计算在该手势动作中的各移动的该速度的加权总和以产生该声音辨识结果,
其中该声音辨识结果的正负号表示该手势动作的方向,且该声音辨识结果的绝对值表示该手势动作的速度。
8.如权利要求5所述的方法,其中该至少一应用程序包括画面卷动、音量控制、快转或快速回放、画面放大或缩小及解锁屏幕。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762582358P | 2017-11-07 | 2017-11-07 | |
US62/582,358 | 2017-11-07 | ||
US15/886,980 | 2018-02-02 | ||
US15/886,980 US10157628B1 (en) | 2017-11-07 | 2018-02-02 | Sound identification device with microphone array |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109753862A CN109753862A (zh) | 2019-05-14 |
CN109753862B true CN109753862B (zh) | 2023-07-07 |
Family
ID=64604909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810174156.XA Active CN109753862B (zh) | 2017-11-07 | 2018-03-02 | 声音辨识装置及用于控制电子装置的方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10157628B1 (zh) |
CN (1) | CN109753862B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3106460B1 (fr) * | 2020-01-20 | 2021-12-24 | Sagemcom Broadband Sas | Bouton virtuel utilisant un signal sonore |
US11291910B2 (en) * | 2020-02-14 | 2022-04-05 | Mediatek Inc. | Apparatuses and methods for providing a virtual input key |
US20240192808A1 (en) * | 2022-12-07 | 2024-06-13 | Google Llc | Assistant control via detecting tactile modulation of ultrasonic signal |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890557A (zh) * | 2011-07-19 | 2013-01-23 | 杜比实验室特许公司 | 用于响应于麦克风输出的触摸手势检测的方法和系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6351222B1 (en) * | 1998-10-30 | 2002-02-26 | Ati International Srl | Method and apparatus for receiving an input by an entertainment device |
JP2001166025A (ja) * | 1999-12-14 | 2001-06-22 | Matsushita Electric Ind Co Ltd | 音源の方向推定方法および収音方法およびその装置 |
US8913758B2 (en) * | 2010-10-18 | 2014-12-16 | Avaya Inc. | System and method for spatial noise suppression based on phase information |
CN103680501B (zh) * | 2013-12-23 | 2016-09-14 | 惠州Tcl移动通信有限公司 | 根据声音变化规律进行手势识别的方法、系统及手机 |
US20160091308A1 (en) * | 2014-09-30 | 2016-03-31 | Invensense, Inc. | Microelectromechanical systems (mems) acoustic sensor-based gesture recognition |
JP6738342B2 (ja) * | 2015-02-13 | 2020-08-12 | ヌープル, インコーポレーテッドNoopl, Inc. | 聴力を改善するためのシステムおよび方法 |
-
2018
- 2018-02-02 US US15/886,980 patent/US10157628B1/en active Active
- 2018-03-02 CN CN201810174156.XA patent/CN109753862B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890557A (zh) * | 2011-07-19 | 2013-01-23 | 杜比实验室特许公司 | 用于响应于麦克风输出的触摸手势检测的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
US10157628B1 (en) | 2018-12-18 |
CN109753862A (zh) | 2019-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10395488B2 (en) | Systems and methods for generating haptic effects associated with an envelope in audio signals | |
US10276004B2 (en) | Systems and methods for generating haptic effects associated with transitions in audio signals | |
US9723119B2 (en) | Reduction of haptic noise feedback in system | |
CN106708254B (zh) | 检测器 | |
US11175698B2 (en) | Methods and systems for processing touch inputs based on touch type and touch intensity | |
CN109753862B (zh) | 声音辨识装置及用于控制电子装置的方法 | |
US10452188B2 (en) | Predictive compensation for a latency of an input device | |
US9632586B2 (en) | Audio driver user interface | |
CN111883091A (zh) | 音频降噪方法和音频降噪模型的训练方法 | |
KR20140107287A (ko) | 사용자 제어 제스처 검출 기법 | |
KR20150028724A (ko) | 오디오 신호와 연관된 햅틱 효과를 생성하는 시스템 및 방법 | |
CN109756818B (zh) | 双麦克风降噪方法、装置、存储介质及电子设备 | |
CN108028982A (zh) | 电子设备及其音频处理方法 | |
CN103765919A (zh) | 用于控制与骨传导传感器的用户接合的系统和设备 | |
WO2016138966A1 (en) | Method of controlling a mobile device | |
CN113608661A (zh) | 一种人机交互方法及其交互平板、存储介质 | |
CN114077325B (zh) | 一种设备的传感装置、触碰检测方法和系统 | |
US20230186929A1 (en) | Input device activation noise suppression | |
JP2014099073A (ja) | 電子機器、その制御方法及びプログラム | |
CN113377225B (zh) | 一种触发动作识别方法、识别系统和存储介质 | |
JP2023143105A (ja) | ノイズ除去装置、ノイズ除去プログラム、及びノイズ除去方法 | |
GB2627023A (en) | Cancellation of ultrasonic signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |