CN109389981A - 声控装置及相关的声音信号处理方法 - Google Patents
声控装置及相关的声音信号处理方法 Download PDFInfo
- Publication number
- CN109389981A CN109389981A CN201810118558.8A CN201810118558A CN109389981A CN 109389981 A CN109389981 A CN 109389981A CN 201810118558 A CN201810118558 A CN 201810118558A CN 109389981 A CN109389981 A CN 109389981A
- Authority
- CN
- China
- Prior art keywords
- sound
- memory
- circuit
- read
- controlled apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003672 processing method Methods 0.000 title claims description 24
- 230000005236 sound signal Effects 0.000 title claims description 24
- 230000015654 memory Effects 0.000 claims abstract description 127
- 238000013500 data storage Methods 0.000 claims abstract description 15
- 241001269238 Data Species 0.000 claims 1
- 230000005059 dormancy Effects 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000029058 respiratory gaseous exchange Effects 0.000 description 5
- 230000005611 electricity Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/14—Protection against unauthorised use of memory or access to memory
- G06F12/1458—Protection against unauthorised use of memory or access to memory by checking the subject access rights
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/285—Memory allocation or algorithm optimisation to reduce hardware requirements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Telephone Function (AREA)
- Power Sources (AREA)
- Circuits Of Receivers In General (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明揭露了一种声控装置,其包含有一接收电路、一声音处理电路、一存储器控制电路以及一主要处理电路,其中该接收电路是用以依序接收一第一声音数据以及一第二声音数据,并储存在一第一存储器中;该声音处理电路是用以自该第一存储器中读取该第一声音数据,以及当该第一声音数据包含一特定命令时产生一控制信号;该存储器控制电路是用以根据该控制信号以自该第一存储器中读取该第二声音数据,并将该第二声音数据储存至一第二存储器中;以及该主要处理电路是用以根据该控制信号以自该第二存储器中读取该第二声音数据以进行语音识别。
Description
技术领域
本发明是有关于声控装置,尤指一种设置在电视或是电视机顶盒中的声控装置。
背景技术
在目前的声控装置中,为了随时可以辨识语音信息,声控装置中的处理器、存储器及相关电路必须一直处于使能状态而无法进入休眠模式,因而造成声控装置在不需要使用的情形下仍然有较高的功率消耗。
发明内容
因此,本发明揭露了一种声控装置及相关的声音信号处理方法,其可以允许声控装置中有部分电路进入休眠状态以达到省电的效果,但声控装置仍可以由用户的一特定语音命令唤醒,并开始进行语音识别,以解决先前技术的问题。
在本发明的一个实施例中,揭露了一种声控装置,其包含有一接收电路、一声音处理电路、一存储器控制电路以及一主要处理电路。在该声控装置的操作中,该接收电路是用以依序接收一第一声音数据以及一第二声音数据,并储存在一第一存储器中;该声音处理电路是用以自该第一存储器中读取该第一声音数据,以及当该第一声音数据包含一特定命令时产生一控制信号;该存储器控制电路是用以根据该控制信号以自该第一存储器中读取该第二声音数据,并将所读取的该第二声音数据储存至一第二存储器中;以及该主要处理电路是用以根据该控制信号以自该第二存储器中读取该第二声音数据以进行语音识别。
在本发明的另一个实施例中,揭露了一种声音信号处理方法,其包含有以下步骤:依序接收一第一声音信号以及一第二声音数据,并储存在一第一存储器中;自该第一存储器中读取该第一声音数据,以及当该第一声音数据包含一特定命令时产生一控制信号;根据该控制信号以自该第一存储器中读取该第二声音数据,并将所读取的该第二声音数据储存至一第二存储器中;以及根据该控制信号以自该第二存储器中读取该第二声音数据以进行语音识别。
附图说明
图1为根据本发明一实施例的声控装置的方块图。
图2为根据本发明一实施例的声控装置接收声音数据以及部份元件的时序图。
图3为根据本发明一实施例的一种声音信号处理方法的流程图。
图4为根据本发明另一实施例的声控装置的方块图。
符号说明
100、400 声控装置
110、410 接收电路
120、420 第一存储器
130、430 声音处理电路
140、440 存储器控制器
150、450 第二存储器
160、460 主要处理电路
300~308 步骤
470 安全性控制电路
具体实施方式
图1为根据本发明一实施例的声控装置100的方块图。如图1所示,声控装置100包含了一接收电路110、一第一存储器120、一声音处理电路130、一存储器控制器140、一第二存储器150以及一主要处理电路160。在本实施例中,第一存储器110以及第二存储器150可以分别是静态随机存取存储器以及动态随机存取存储器,且除了第二存储器150以外的其他元件可以设置在一芯片中。此外,声控装置100是设置在一电视或是一电视机顶盒中,用以接收声音数据后进行语音识别,并据以控制电视的操作。
在一些实施例中,接收电路110可以包含一数字麦克风以及一转换电路,其中该数字麦克风是用以将所接收的声音信号转换为一脉冲密度调变(Pulse DensityModulation,PDM)信号,且该转换将该脉冲密度调变编码为一脉冲编码调变(Pulse-codemodulation,PCM)信号;接收电路110也可以包含一模拟麦克风以及一转换电路,其中该模拟麦克风是用以接收声音信号,且该转换电路将该声音信号转换/编码为一脉冲编码调变信号,其中该转换电路可以是一模拟数字转换电路、一模拟数字转换至芯片间传输(ADC toI2S)信号、或是一模拟数字转换至芯片间传输时分复用(ADC to I2S TDM)信号。
在本发明所揭露的声控装置100中,接收电路110、第一存储器120以及声音处理电路130是永远处于使能状态以随时侦测是否有需要进行语音识别的事件发生,而存储器控制器140、第二存储器150以及主要处理电路160是可以允许在空闲的时候进入休眠状态以节省电力消耗(例如,第二存储器150可以是一待机模式(suspend to RAM(STR))。具体来说,当声控装置于一段时间内没有接收到任何有效的声音信息之后,存储器控制器140、第二存储器150以及主要处理电路160便可以进入休眠状态(例如,断电或者仅供给很低的电力)以节省电力;而接收电路110、第一存储器120以及声音处理电路130接收到具有一特定命令的声音数据之后,会据以产生一唤醒信号来重新使能存储器控制器140、第二存储器150以及主要处理电路160,并产生一控制信号至存储器控制器140与主要处理电路160以对后续的声音数据进行语音识别。在本实施例中,该控制信号与该唤醒信号是为同一个信号,且在以下的说明中是以控制信号来作为说明。
详细来说,请同时参考图1、2,其中图2为根据本发明一实施例的声控装置100接收声音数据时部分元件的时序图。首先,假设在时间t0时存储器控制器140、第二存储器150以及主要处理电路160是处于休眠状态,此时用户想要询问目前的天气状况,因此说出了"哈啰晨星,天气如何?"的句子,其中"哈啰晨星"是作为用来启动声控装置100的语音识别功能的一特定命令。在用户说出"哈啰晨星"的过程中,接收电路110会依序将所接收到的声音数据储存至第一存储器120中,而声音处理电路130会根据一读取触发机制以自第一存储器120中读取声音数据,其中该读取触发机制可以是第一存储器120中的有效数据储存量已到达一邻界值、每隔一段特定时间、或是第一存储器120接收到完整的一笔封包数据后...等等。请注意,“有效数据”是指尚未被处理而不可被删除的声音数据,而非实际上仍储存于存储器120中未被删除的数据。在图2中,可以看到第一存储器120中有效数据储存量的变化。第一存储器120不断地被存写入声音数据(有效数据储存量增加),并不断地被声音处理电路130读出声音数据(有效数据储存量降低),因此有效数据储存量维持在一较低的水位。
接着,在时间t1的时候,假设用户所说出的句子"哈啰晨星"已经依序被储存至第一存储器120中,而声音处理电路130自第一存储器120中读取声音数据,并在时间t2判断出第一存储器120先前所储存的声音数据包含了用来启动声控装置100的语音识别功能的特定命令"哈啰晨星"。因此,声音处理电路130产生该控制信号以唤醒存储器控制器140以及主要处理电路160。
在时间点t2,存储器控制器140以及主要处理电路160开始进行正常操作前的一前置作业,而声音处理电路130则不再继续自第一存储器120中读取声音数据。然而第一存储器120仍持续被写入接收电路110所接收到的声音数据,例如本实施例中的"天气如何",因此,在图2中,可以看到时间点t2开始,第一存储器120中有效数据储存量持续增加至一较高的水位。
当存储器控制器140以及主要处理电路160完成前置作业之后(如图示的时间点t3),声音处理电路130便会控制存储器控制器140自第一存储器120中读取暂存的有效数据(例如,声音数据"天气如何"),并储存至使能状态的第二存储器150中,且主要处理电路160接着自第二存储器150读取前述的暂存的有效数据””以进行语音识别。由于前述的暂存的有效数据由存储器控制器140自第一存储器120转存至第二存储器150,因此,在图2中,可以看到时间点t2开始,第一存储器120中有效数据储存量回复到该较低的水位。
在图1、2所示的实施例中,由于声控装置100在闲置状态下只有接收电路110、第一存储器120以及声音处理电路130需要处于使能状态,再加上声音处理电路130在设计上只需要能够辨识具有特定命令"哈啰晨星"的声音数据即可,因此这些需要长期使能的元件仅需要很小的功率消耗。相对来说,具有较多耗电量的元件,例如主要处理电路160,则可以在闲置时进入休眠状态,故可以大幅降低耗电量。
在第一存储器120中暂存的有效数据被转存至第二存储器150之后,由于声控装置100中的语音识别已交由主要处理电路160进行,声音处理电路130不再继续自第一存储器120中读取声音数据,因此在第1、2图所示的实施例中,声音处理电路130可以被切换至休眠状态(例如,断电或者仅供给很低的电力)以进一步节省电力,直到主要处理电路160再次进入休眠才被重新唤醒。在另一实施例中,由于声音处理电路130为低功率消耗元件,因此亦可以选择持续使能状态。
此外,在图1、2所示的实施例中,在第一存储器120中暂存的有效数据被转存至第二存储器150之后,接收电路110是持续将声音数据存入第一存储器120,以及存储器控制器140是持续将声音数据自第一存储器120转存至第二存储器150。然而在另一实施例中,在第一存储器120中暂存的有效数据被转存至第二存储器150之后,接收电路110可切换为直接将后续接收的声音数据存入第二存储器150。
在一实施例中,上述的“哈啰晨星”可以视为一第一特定命令,而声音处理电路130另外可以根据声音数据是否包含一第二特定命令来决定主要处理电路160是要使用哪一个数据库来对后续的声音信号进行辨识。具体来说,若是声音信号中另外包含了“OK,Google”,则声音处理电路130会产生控制信号至主要处理电路160以透过网络使用Google数据库来进行语音识别;而若是声音信号中另外包含了“OK,Alexa”,则声音处理电路130会产生控制信号至主要处理电路160以透过网络使用Amazon数据库来进行语音识别。另外,主要处理电路160中使用不同数据库来进行语音识别的元件可以是相同的硬件或是不同的硬件。
图3为根据本发明一实施例的一种声音信号处理方法的流程图。同时参考以上图1、2的实施例所揭露的内容,图3的流程如下所述:
步骤300:流程开始。
步骤302:依序接收一第一声音信号以及一第二声音数据,并储存在一第一存储器中。
步骤304:自该第一存储器中读取该第一声音数据,以及当该第一声音数据包含一特定命令时产生一控制信号。
步骤306:根据该控制信号以自该第一存储器中读取该第二声音数据,并将所读取的该第二声音数据储存至一第二存储器中。
步骤308:根据该控制信号以自该第二存储器中读取该第二声音数据以进行语音识别。
图4为根据本发明另一实施例的声控装置400的方块图。如图4所示,声控装置400包含了一接收电路410、一第一存储器420、一声音处理电路430、一存储器控制器440、一第二存储器450、一主要处理电路460以及一安全性控制电路470。图4实施例与图1所示的声控装置100的差异在于多了安全性控制电路470,因此以下仅针对安全性控制电路470来作说明。
在声控装置400中,安全性控制电路470是用来设定第一存储器420及/或是第二存储器450的访问权限,以避免储存在第一存储器420或是第二存储器450中的声音数据被窃取。具体来说,安全性控制电路470可以将第一存储器420的一部分设定为一安全保护区域,而接收电路410是将所接收到的声音数据储存至该安全保护区域中,且该安全保护区域只允许声音处理电路430以及存储器控制器440进行读取操作;类似地,安全性控制电路470亦可以将第二存储器450的一部分设定为一安全保护区域,而存储器控制器440是将来自第一存储器420的声音数据储存至该安全保护区域中,且该安全保护区域只允许主要处理电路460进行读取操作。由于接收电路410是持续运作,因此会不断地将周遭的声音接收并存入第一存储器420及/或第二存储器450中,透过安全性控制电路470,则可以避免第一存储器420或是第二存储器450中的声音数据被窃取,免除了声控装置成为有心人士进行窃听的管道。
简要归纳本发明,在本发明的声控装置及相关的种声音信号处理方法中,由于声控装置在休眠状态下可以关闭具有较高功耗的元件,而仅有部分需要很小功耗的元件维持开启以判断声音数据中是否包含有特定命令,因此,声控装置可在节省功耗的情形下根据用户的一特定语音命令以唤醒声控装置并开始进行语音识别,兼顾了环保及用户的便利性。
以上所述仅为本发明的较佳实施例,凡依本发明权利要求书所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (18)
1.一种声控装置,包含有:
一接收电路,用以依序接收一第一声音数据以及一第二声音数据,并储存在一第一存储器中;
一声音处理电路,用以自该第一存储器中读取该第一声音数据,以及当该第一声音数据包含一特定命令时产生一控制信号;
一存储器控制电路,用以根据该控制信号以自该第一存储器中读取该第二声音数据,并将所读取的该第二声音数据储存至一第二存储器中;以及
一主要处理电路,用以根据该控制信号以自该第二存储器中读取该第二声音数据以进行语音识别。
2.如权利要求1所述的声控装置,其特征在于,该声控装置是设置在一电视或是一电视机顶盒中。
3.如权利要求1所述的声控装置,其特征在于,该特定命令为一第一特定命令,该控制信号为一第一控制信号,且当该第一声音数据包含一第二特定命令时,该声音处理电路产生一第二控制信号至该存储器控制电路及主要处理电路。
4.如权利要求1所述的声控装置,其特征在于,当该声控装置处于闲置状态时,该存储器控制电路以及该主要处理电路是处于休眠状态,以及该接收电路以及该声音处理电路是处于使能状态;其中该当该声控装置处于闲置状态且该声音处理电路判断该第一声音数据包含该特定命令时,该声音处理电路产生一唤醒信号以唤醒该存储器控制电路以及该主要处理电路。
5.如权利要求4所述的声控装置,其特征在于,当该声音处理电路产生该唤醒信号以唤醒该存储器控制电路以及该主要处理电路后,该声音处理电路不会自该第一存储器中读取该第二声音数据。
6.如权利要求4所述的声控装置,其特征在于,当该声音处理电路产生该唤醒信号以唤醒该存储器控制电路以及该主要处理电路后,该声音处理电路是用以产生该控制信号以控制该存储器处理电路将该第一存储器中的该第二声音数据搬移至该第二存储器中。
7.如权利要求1所述的声控装置,其特征在于,另包含有:
一安全性控制电路,用以设定该第一存储器与该第二存储器至少其中之一的访问权限。
8.如权利要求7所述的声控装置,其特征在于,该安全性控制电路将该第一存储器的一部分区域设定为一安全区域,该接收电路是将该第一声音数据以及该第二声音数据储存至该安全区域中,且该安全区域只允许该声音处理电路以及该存储器控制器进行读取操作。
9.如权利要求7所述的声控装置,其特征在于,该安全性控制电路将该第二存储器的一部分区域设定为一安全区域,且该安全区域只允许该主要处理电路进行读取操作。
10.一种声音信号处理方法,包含有:
依序接收一第一声音信号以及一第二声音数据,并储存在一第一存储器中;
自该第一存储器中读取该第一声音数据,以及当该第一声音数据包含一特定命令时产生一控制信号;
根据该控制信号以自该第一存储器中读取该第二声音数据,并将所读取的该第二声音数据储存至一第二存储器中;以及
根据该控制信号以自该第二存储器中读取该第二声音数据以进行语音识别。
11.如权利要求10所述的声音信号处理方法,其特征在于,该声音信号处理方法是由设置在一电视或是一电视机顶盒中的一声控装置所执行。
12.如权利要求10所述的声音信号处理方法,其特征在于,该特定命令为一第一特定命令,该控制信号为一第一控制信号,且该声音信号处理方法另包含有:
当该第一声音数据包含一第二特定命令时,该声音处理电路产生一第二控制信号至该存储器控制电路及主要处理电路。
13.如权利要求10所述的声音信号处理方法,其特征在于,该声音信号处理方法是由一声控装置所执行,根据该控制信号以自该第一存储器中读取该第二声音数据并将所读取的该第二声音数据储存至一第二存储器中的步骤是由一存储器控制器所执行,根据该控制信号以自该第二存储器中读取该第二声音数据以进行语音识别的步骤是由一主要处理电路所执行,以及该声音信号处理方法另包含有:
当该声控装置处于闲置状态时,控制该存储器控制电路以及该主要处理电路是处于休眠状态;以及
当该第一声音数据包含该特定命令时,产生一唤醒信号以唤醒该存储器控制电路以及该主要处理电路。
14.如权利要求13所述的声音信号处理方法,其特征在于,自该第一存储器中读取该第一声音数据,以及当该第一声音数据包含该特定命令时产生该唤醒信号的步骤是由一声音处理电路所执行,以及该声音信号处理方法包含有:
当该声音处理电路产生该唤醒信号以唤醒该存储器控制电路以及该主要处理电路后,该声音处理电路不会自该第一存储器中读取该第二声音数据。
15.如权利要求13所述的声音信号处理方法,其特征在于,自该第一存储器中读取该第一声音数据,以及当该第一声音数据包含该特定命令时产生该唤醒信号的步骤是由一声音处理电路所执行,以及该声音信号处理方法另包含有:
当该声音处理电路产生该唤醒信号以唤醒该存储器控制电路以及该主要处理电路后,使用该声音处理电路产生该控制信号以控制该存储器处理电路将该第一存储器中的该第二声音数据搬移至该第二存储器中。
16.如权利要求10所述的声音信号处理方法,其特征在于,另包含有:
设定该第一存储器与该第二存储器至少其中之一的访问权限。
17.如权利要求16所述的声音信号处理方法,其特征在于,该声音信号处理方法是由一声控装置所执行,以及设定该第一存储器或是该第二存储器的访问权限的步骤包含有:
将该第一存储器的一部分区域设定为一安全区域,该接收电路是将该第一声音数据以及该第二声音数据储存至该安全区域中,且该安全区域只允许该声控装置中的元件进行读取操作。
18.如权利要求16所述的声音信号处理方法,其特征在于,该声音信号处理方法是由一声控装置所执行,以及设定该第一存储器或是该第二存储器的访问权限的步骤包含有:
将该第二存储器的一部分区域设定为一安全区域,且该安全区域只允许该声控装置中的元件进行读取操作。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762540584P | 2017-08-03 | 2017-08-03 | |
US62/540,584 | 2017-08-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109389981A true CN109389981A (zh) | 2019-02-26 |
Family
ID=65229724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810118558.8A Withdrawn CN109389981A (zh) | 2017-08-03 | 2018-02-06 | 声控装置及相关的声音信号处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20190043499A1 (zh) |
CN (1) | CN109389981A (zh) |
TW (1) | TWI655624B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110310635A (zh) * | 2019-06-24 | 2019-10-08 | Oppo广东移动通信有限公司 | 语音处理电路及电子设备 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175016A (zh) * | 2019-05-29 | 2019-08-27 | 英业达科技有限公司 | 启动语音助理的方法及具有语音助理的电子装置 |
KR20210122348A (ko) * | 2020-03-30 | 2021-10-12 | 삼성전자주식회사 | 음성 인식을 위한 디지털 마이크로폰 인터페이스 회로 및 이를 포함하는 전자 장치 |
WO2022151651A1 (zh) * | 2021-01-13 | 2022-07-21 | 神盾股份有限公司 | 语音助理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198831A (zh) * | 2013-04-10 | 2013-07-10 | 威盛电子股份有限公司 | 语音操控方法与移动终端装置 |
CN104538030A (zh) * | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制系统与方法 |
CN104620314A (zh) * | 2012-04-26 | 2015-05-13 | 纽昂斯通讯公司 | 用于具有用户可定义约束的小型语音识别的构造的嵌入式系统 |
CN104866274A (zh) * | 2014-12-01 | 2015-08-26 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
US20160171975A1 (en) * | 2014-12-11 | 2016-06-16 | Mediatek Inc. | Voice wakeup detecting device and method |
CN106775569A (zh) * | 2017-01-12 | 2017-05-31 | 环旭电子股份有限公司 | 装置位置提示系统与方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200930003A (en) * | 2007-12-31 | 2009-07-01 | Htc Corp | Portable apparatus and voice recognition method thereof |
US9922639B1 (en) * | 2013-01-11 | 2018-03-20 | Amazon Technologies, Inc. | User feedback for speech interactions |
CN104110770B (zh) * | 2013-06-28 | 2016-12-28 | 广东美的制冷设备有限公司 | 空调及其声控遥控器和声控遥控器的语音控制与提示方法 |
TW201514855A (zh) * | 2013-10-11 | 2015-04-16 | Acer Inc | 具遠端喚醒功能的電子裝置 |
CN104580699B (zh) * | 2014-12-15 | 2017-06-30 | 广东欧珀移动通信有限公司 | 一种待机时声控智能终端方法及装置 |
EP3067884B1 (en) * | 2015-03-13 | 2019-05-08 | Samsung Electronics Co., Ltd. | Speech recognition system and speech recognition method thereof |
US10373630B2 (en) * | 2017-03-31 | 2019-08-06 | Intel Corporation | Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices |
KR102348758B1 (ko) * | 2017-04-27 | 2022-01-07 | 삼성전자주식회사 | 음성 인식 서비스 운용 방법 및 이를 지원하는 전자 장치 |
US11189273B2 (en) * | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
-
2018
- 2018-01-08 TW TW107100644A patent/TWI655624B/zh active
- 2018-02-06 CN CN201810118558.8A patent/CN109389981A/zh not_active Withdrawn
- 2018-06-01 US US15/995,601 patent/US20190043499A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104620314A (zh) * | 2012-04-26 | 2015-05-13 | 纽昂斯通讯公司 | 用于具有用户可定义约束的小型语音识别的构造的嵌入式系统 |
CN103198831A (zh) * | 2013-04-10 | 2013-07-10 | 威盛电子股份有限公司 | 语音操控方法与移动终端装置 |
CN104866274A (zh) * | 2014-12-01 | 2015-08-26 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
CN104538030A (zh) * | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制系统与方法 |
US20160171975A1 (en) * | 2014-12-11 | 2016-06-16 | Mediatek Inc. | Voice wakeup detecting device and method |
CN106775569A (zh) * | 2017-01-12 | 2017-05-31 | 环旭电子股份有限公司 | 装置位置提示系统与方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110310635A (zh) * | 2019-06-24 | 2019-10-08 | Oppo广东移动通信有限公司 | 语音处理电路及电子设备 |
CN110310635B (zh) * | 2019-06-24 | 2022-03-22 | Oppo广东移动通信有限公司 | 语音处理电路及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
TWI655624B (zh) | 2019-04-01 |
US20190043499A1 (en) | 2019-02-07 |
TW201911291A (zh) | 2019-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109389981A (zh) | 声控装置及相关的声音信号处理方法 | |
KR101770932B1 (ko) | 모바일 디바이스용 상시 연결형 오디오 제어 | |
CN109584860B (zh) | 一种语音唤醒词定义方法和系统 | |
KR101994569B1 (ko) | 상시-온 컴포넌트에서의 클록 스위칭 | |
US8346549B2 (en) | System and method for supplemental speech recognition by identified idle resources | |
CN110223691A (zh) | 语音唤醒识别的切换控制方法和装置 | |
US20110066433A1 (en) | System and method for personalization of acoustic models for automatic speech recognition | |
CN109192208A (zh) | 一种电器设备的控制方法、系统、装置、设备及介质 | |
CN105976808B (zh) | 一种智能语音识别系统及方法 | |
CN110364153A (zh) | 一种分布式语音控制方法、系统、计算机设备及存储介质 | |
CN110232760A (zh) | 智能音箱、智能门锁、服务器、开锁系统及其开锁方法 | |
CN110634468B (zh) | 语音唤醒方法、装置、设备及计算机可读存储介质 | |
US20200265843A1 (en) | Speech broadcast method, device and terminal | |
CN102831892A (zh) | 基于互联网语音交互的玩具控制方法及系统 | |
CN109979474A (zh) | 语音设备及其用户语速修正方法、装置和存储介质 | |
CN100522300C (zh) | 移动通信终端游戏存储方法及采用该方法的移动通信终端 | |
TWI633425B (zh) | 麥克風裝置 | |
US7349844B2 (en) | Minimizing resource consumption for speech recognition processing with dual access buffering | |
CN110503962A (zh) | 语音识别和设定方法、装置、计算机设备和存储介质 | |
CN111429901A (zh) | 一种面向IoT芯片的多级语音智能唤醒方法及系统 | |
CN111192590B (zh) | 语音唤醒方法、装置、设备及存储介质 | |
CN108093350B (zh) | 麦克风的控制方法和麦克风 | |
CN112669818B (zh) | 语音唤醒方法及装置、可读存储介质、电子设备 | |
CN100524170C (zh) | 一种控制存储器进入低功耗模式的控制器及控制方法 | |
CN111508481B (zh) | 语音唤醒模型的训练方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191225 Address after: No.1, Duhang 1st Road, Hsinchu City, Hsinchu Science Park, Taiwan, China Applicant after: MediaTek.Inc Address before: 1/2, 4th floor, 26 Taiyuan Street, Zhubei City, Hsinchu County, Taiwan, China Applicant before: MStar Semiconductor Co., Ltd. |
|
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190226 |