CN103543814B - 信号处理装置以及信号处理方法 - Google Patents
信号处理装置以及信号处理方法 Download PDFInfo
- Publication number
- CN103543814B CN103543814B CN201210245435.3A CN201210245435A CN103543814B CN 103543814 B CN103543814 B CN 103543814B CN 201210245435 A CN201210245435 A CN 201210245435A CN 103543814 B CN103543814 B CN 103543814B
- Authority
- CN
- China
- Prior art keywords
- voice
- signal
- acoustical signal
- identification system
- acoustical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Telephonic Communication Services (AREA)
- Power Sources (AREA)
Abstract
本发明公开了一种信号处理装置以及信号处理方法,该装置包含有一语音辨识系统以及一语音侦测单元。该语音侦测单元耦接于该语音辨识系统,用以侦测一声音信号是否为一语音信号,并输出一语音侦测结果至该语音辨识系统来控制该语音辨识系统是否对该声音信号进行语音辨识。
Description
技术领域
本发明涉及一种信号处理装置以及信号处理方法,且特别涉及一种通过一语音侦测单元来控制一语音辨识系统是否对一声音信号进行语音辨识的信号处理装置以及相关的信号处理方法。
背景技术
于语音指令功能中,核心工作是先将录制的声音信号进行语音辨识,接着于辨识出指令之后,基于所辨识的指令来决定系统(例如电脑系统)应执行的相对应动作。例如,当系统通过语音辨识后获得一开启网页浏览器的指令,则系统便开启网页浏览器。又例如系统处于省电模式(例如休眠状态)下,通过语音辨识后获得一唤醒系统的指令,则系统便脱离省电模式(休眠状态)而回到正常模式(正常操作状态)。
为了使进行系统语音辨识时没有遗漏关键的语音信号,系统可能以麦克风持续不断地收音,并且将收录并数字化的信号持续进行语音辨识。然而,此收音过程往往使得录制的待辨识的信号包含过多非语音的期间。
此语音辨识的工作一般是以软件程序执行,若持续将所有麦克风收音的信号送与此语音辨识系统进行运算,但收音期间内的信号中却未曾出现过关键的语音信号,将会造成无谓的电能耗费而无法顺应节能/省电潮流,若语音辨识系统是设置于移到装置中,则会降低移到装置的电池续航能力。
传统上为了避免持续进行语音辨识的额外功率消耗,或是节省语音辨识前所需的暂存空间,可能会要求使用者在使用语音辨识之前以手动方式(例如按压按键)来发送/触发一语音起始指令,使用者并在语音输入完毕之后,以手动方式(例如按压按键)来发送一语音结束指令。因此,语音辨识系统只需要针对语音起始指令和语音结束指令的期间进行声音信号的语音辨识即可。
然而,由于使用者需要手动地控制语音辨识的启用与关闭,因此,必须在使用者本身得以触及系统的按键的情形下才能顺利控制语音辨识的启用与关闭,所以,这样的语音辨识控制机制对于使用者而言并非十分便利,再者,当上述的语音辨识控制机制应用于语音唤醒系统的功能时,则可能由于使用者无法直接触及系统的按键,故无法以语音起始指令及语音结束指令来达成节电效果,因此只能以持续收音、录制,并持续进行语音辨识的方式,才能提供语音唤醒功能。
发明内容
本发明目的之一在于提供一种通过一语音侦测单元来控制一语音辨识系统是否对一声音信号进行语音辨识的信号处理装置以及相关的信号处理方法,以解决上述问题。
依据本发明的实施例,其揭露一种信号处理装置。该信号处理装置包含有一语音辨识系统以及一语音侦测单元。该语音侦测单元耦接于该语音辨识系统,用以侦测一声音信号是否为一语音信号,并输出一语音侦测结果至该语音辨识系统来控制该语音辨识系统是否对该声音信号进行语音辨识。
依据本发明的实施例,其另揭露一种信号处理方法。该信号处理方法包含有:侦测一声音信号是否为一语音信号,并产生一语音侦测结果;以及依据该语音侦测结果来控制一语音辨识系统是否对该声音信号进行语音辨识。
本发明是通过运用语音侦测单元作为先期判断,以筛选出不可能为语音信号的部分,此部份已判定为非语音信号的期间,故系统可以不进行语音辨识;而当语音侦测单元表示可能为语音信号的期间,则需要进一步通过语音辨识系统来进行语音辨识,以决定系统的后续动作。因此,当本发明的语音辨识控制机制应用于语音唤醒系统的功能时,则可以于系统处于省电模式(休眠状态)下致能语音侦测单元来侦测所收录的声音信号是否为语音信号,若语音侦测单元判断所收录的声音信号并非语音信号,则系统会继续处于省电模式(休眠状态)下,另一方面,若语音侦测单元判断所收录的声音信号为语音信号,则语音辨识系统会被致能来判断所收录的声音信号中是否存在一系统唤醒指令。因语音侦测单元可以简单架构实现,即使全时开启运作也不影响全系统的节能效益,而因语音侦测单元可以筛选排除不可能为语音信号的期间,故可避免语音辨识系统无谓的电能耗费,进而达成节能功效。此外,因为不需由使用者以手动方式来标示语音起始及语音结束的期间,故即使使用者无法直接触及系统按键,也可通过语音侦测单元的辅助而达成语音唤醒的目。
附图说明
图1是本发明信号处理装置的一实施例的功能方块示意图。
图2是图1所示的信号处理装置于第一种应用(例如语音唤醒功能)中的范例操作的流程图。
图3是图1所示的信号处理装置于第二种应用中的范例操作的流程图。
图4为图1所示的语音侦测单元决定语音侦测结果的一第一实施例的流程图。
图5为图1所示的语音侦测单元决定语音侦测结果的一第二实施例的流程图。
图6为图1所示的语音侦测单元决定语音侦测结果的一第三实施例的流程图。
图7为图1所示的语音侦测单元决定语音侦测结果的一第四实施例的流程图。
其中,附图标记说明如下:
100:信号处理装置
102:信号收集单元
104:语音辨识系统
106:语音侦测单元
202~218、302~312、402~418、502~506、602~610、702~710:步骤
具体实施方式
本发明的主要概念在于结合语音侦测(voice activity detection)与语音辨识(speech recognition),因此,一语音侦测单元会依据收录的声音特性,经过连续的运算与判断来推估该收录的声音信号是否可能为语音信号。另外,语音辨识系统会依据语音侦测单元的判断结果,决定是否对收录的声音信号进行语音辨识的工作,由于语音侦测可以筛选排除不可能为语音信号的期间,故使得语音辨识系统无谓的电能耗费,进而达成节能功效。进一步的细节将于下详述。
请参照图1,图1是本发明信号处理装置的一实施例的功能方块示意图。信号处理装置100包含一信号收集(signal collection)单元102、一语音辨识系统104以及一语音侦测单元106,其中语音侦测单元106耦接于信号收集单元102与语音辨识系统104,以及信号收集单元102耦接于语音辨识系统104。于一实作方式中,信号收集单元102、语音辨识系统104以及语音侦测单元106均是由硬件来加以实作,因此信号收集单元102、语音辨识系统104以及语音侦测单元106可个别地控制操作状态,故可达到较佳的节电功效,然而,此仅作为范例说明,而非本发明的限制条件,举例来说,只要是采用本发明所揭示的通过语音侦测来辅助语音辨识的运作,均落入本发明的范畴。
于本发明的第一种应用(例如语音唤醒功能)中,只有当信号收集单元102与语音辨识系统104均处于一省电模式(例如休眠状态)时,语音侦测单元106才会被致能。假若信号收集单元102与语音辨识系统104因为关机或休眠的指令而由一正常模式进入一省电模式,则语音侦测单元106此时会被致能来开始执行语音侦测的操作。一声音信号(audio signal)S_IN会输入至语音侦测单元106,而语音侦测单元106便会即时地侦测声音信号S_IN是否为一语音信号(voice signal),并输出一语音侦测结果VAD至语音辨识系统104。语音侦测结果VAD可作为语音辨识系统104的一致能信号,举例来说,当语音侦测单元106判断声音信号S_IN并非为语音信号时,VAD=0,因此语音辨识系统104仍持续处于省电模式,而当语音侦测单元106判断声音信号S_IN为语音信号时,则VAD=1,因此语音辨识系统104便会离开省电模式并回到正常模式。此外,信号收集单元102也可由语音侦测结果VAD来控制是否离开省电模式并回到正常模式。通过语音侦测结果VAD的辅助,只有在语音侦测单元106判断声音信号S_IN为语音信号时,语音辨识系统104才会对信号收集单元102所收录的声音信号S_IN进行语音辨识的处理,由于语音辨识系统104于省电模式中会关闭大部分的内部电路,因此可达到节电的目的。
另一方面,当语音辨识系统104对声音信号S_IN进行语音辨识的处理而判断声音信号S_IN挟带一预定指令信息CMD(例如一系统唤醒指令),则语音辨识系统104会输出预定指令信息CMD(例如系统唤醒指令)至后端的系统,举例来说,信号处理装置100为一应用装置的一部份,则语音辨识系统104可输出预定指令信息CMD(例如系统唤醒指令)至该应用装置的一控制器(例如处理器),因此,该应用装置的该控制器便会基于所接收到的预定指令信息CMD(例如系统唤醒指令)来执行相对应的操作(例如让该应用装置开机或全速运行)。另一方面,若语音辨识系统104判断声音信号S_IN并未挟带任何预定指令信息CMD(例如系统唤醒指令),则表示目前的声音信号S_IN可能被语音侦测单元106误判为语音信号,或者目前的声音信号S_IN虽然是语音信号,但是并非是跟系统唤醒有关的语音指令,故信号收集单元102与语音辨识系统104会再次进入省电模式以有效地节电。
请一并参照图1与图2,图2是图1所示的信号处理装置100于第一种应用(例如语音唤醒功能)中的范例操作的流程图。假若可以获得大致上相同的结果,则步骤不一定要遵照图2所示的顺序来执行。图1所示的信号处理装置100所采用的信号处理方法可简单归纳如下。
步骤202:使用信号处理装置100的应用装置会全速运行。此时,信号收集单元102与语音辨识系统104均处于正常模式,而语音侦测单元106此时并没有被致能。
步骤204:信号收集单元102与语音辨识系统104处于省电模式。
步骤206:语音侦测单元106会致能,并侦测声音信号S_IN是否为语音信号来产生语音侦测结果VAD。
步骤208:语音侦测结果VAD是否指示声音信号S_IN为语音信号(也即VAD=1)?若是,则执行步骤210;否则,回到步骤204,故信号收集单元102与语音辨识系统104仍继续处于省电模式(步骤204),且语音侦测单元106仍继续侦测声音信号S_IN是否为语音信号(步骤206)。
步骤210:语音侦测单元106无需致能而被关闭。
步骤212:信号收集单元102与语音辨识系统104会被唤醒而由省电模式回到正常模式。
步骤214:信号收集单元102开始将声音信号S_IN记录至一储存装置(例如存储器),例如可通过直接存储器存取(direct memory access,DMA)的技术来将所接收的声音信号S_IN写入至储存装置,以及语音辨识系统104开始对信号收集单元102所收录的声音信号S_IN进行语音辨识,来判断声音信号S_IN中是否挟带预定指令信息CMD(例如系统唤醒指令)。
步骤216:声音信号S_IN中是否挟带预定指令信息CMD(例如系统唤醒指令)?若是,则执行步骤218;否则,回到步骤204,故信号收集单元102与语音辨识系统104会再次进入省电模式(步骤204),且语音侦测单元106会再次致能来侦测声音信号S_IN是否为语音信号(步骤206)。
步骤218:该应用装置基于预定指令信息CMD(例如系统唤醒指令)而全速运行。
由于熟悉技术者基于上述的相关说明即可轻易地了解各个步骤的操作细节,故进一步的说明便在此省略以求简洁。
于本发明的第二种应用中,当信号收集单元102与语音辨识系统104均处于一正常模式(例如正常操作状态)时,语音侦测单元106一并会被致能。声音信号S_IN会分别输入至语音侦测单元106与信号收集单元102,因此,信号收集单元102会储存声音信号S_IN以供语音辨识系统104进行语音辨识之用,同时,语音侦测单元106会一并侦测声音信号S_IN是否为语音信号,并输出语音侦测结果VAD至语音辨识系统104。语音侦测结果VAD可作为语音辨识系统104是否执行语音辨识操作的控制信号,举例来说,当语音侦测单元106判断声音信号S_IN并非为语音信号时,VAD=0,因此语音辨识系统104并不会对声音信号S_IN进行语音辨识的处理,虽然语音辨识系统104操作于正常模式而不会关闭内部电路,不过,由于语音辨识系统104没有对声音信号S_IN进行语音辨识的处理,故语音辨识系统104此时仅会有最低功耗,故仍可达到节电的目的,另一方面,当语音侦测单元106判断声音信号S_IN为语音信号时,则VAD=1,因此语音辨识系统104便会对声音信号S_IN进行语音辨识的处理。简而言之,通过语音侦测结果VAD的辅助,只有在语音侦测单元106判断声音信号S_IN为语音信号时,处于正常模式中的语音辨识系统104才会对信号收集单元102所收录的声音信号S_IN进行语音辨识的处理,并判断声音信号S_IN中是否挟带预定指令信息CMD(例如开启网页浏览器指令或其它应用程序的控制指令),因此也可达到节电的目的。
请一并参照图1与图3,图3是图1所示的信号处理装置100于第二种应用中的范例操作的流程图。假若可以获得大致上相同的结果,则步骤不一定要遵照图3所示的顺序来执行。图1所示的信号处理装置100所采用的信号处理方法可简单归纳如下。
步骤302:使用信号处理装置100的应用装置会全速运行。此时,信号收集单元102与语音辨识系统104均处于正常模式,且语音侦测单元106此时会被致能。
步骤304:信号收集单元102将声音信号S_IN记录至一储存装置(例如存储器),例如可通过直接存储器存取的技术来将所接收的声音信号S_IN写入至储存装置,以及语音侦测单元106侦测声音信号S_IN是否为语音信号来产生语音侦测结果VAD。
步骤306:语音侦测结果VAD是否指示声音信号S_IN为语音信号(也即VAD=1)?若是,则执行步骤308;否则,回到步骤304。
步骤308:语音辨识系统104对信号收集单元102所收录的声音信号S_IN进行语音辨识,来判断声音信号S_IN中是否挟带预定指令信息CMD(例如开启网页浏览器指令)。
步骤310:声音信号S_IN中是否挟带预定指令信息CMD(例如开启网页浏览器指令或其它应用程序的控制指令)?若是,则执行步骤312;否则,回到步骤304。
步骤312:该应用装置基于预定指令信息CMD(例如开启网页浏览器指令或其它应用程序的控制指令)而执行相对应的操作。
由于熟悉技术者基于上述的相关说明即可轻易地了解各个步骤的操作细节,故进一步的说明便在此省略以求简洁。
如上所述,语音侦测单元106是用来侦测声音信号是否为语音信号,而评估的声音特性可能有单位帧时间内的过零率、单位帧时间内的平均能量、频率范围内的单位帧时间内的峰值振幅,或是以线性预估(LP)分析频谱取得的频谱包络线等等。于本实施例中,语音侦测单元106可利用一个或多个判断条件来决定语音侦测结果VAD。举例来说,语音侦测单元106可采用以下所述的多种判断条件的各种组合来决定语音侦测结果VAD为1或0:
判断条件(1):声音信号S_IN包含有一目前声音帧,以及语音侦测单元106会比较该目前声音帧的平均能量EV_C与一临界值TH1;
判断条件(2):声音信号S_IN包含有至少一先前声音帧与一目前声音帧,以及语音侦测单元106会依据该至少一先前声音帧的平均能量来决定一信号能量趋势值EV_T,计算该目前声音帧的平均能量EV_C与信号能量趋势值EV_T的一差值D1(也即D1=|EV_C-EV_T|),并比较差值D1与一临界值TH2;
判断条件(3):声音信号S_IN包含有多个声音帧,以及语音侦测单元106会比较该多个声音帧中被判断为不包含语音信号的连续声音帧的个数N与一临界值TH3;以及
判断条件(4):声音信号S_IN包含有一先前声音帧与一目前声音帧,以及语音侦测单元106会计算该目前声音帧的平均能量EV_C与该先前声音帧的平均能量EV_P的一差值D2(也即D2=|EV_C-EV_P|),并比较差值D2与一临界值TH4。
请参阅图4,图4为图1所示的语音侦测单元106决定语音侦测结果VAD的一第一实施例的流程图。假若可以获得大致上相同的结果,则步骤不一定要遵照图4所示的顺序来执行。语音侦测单元106决定语音侦测结果VAD的操作可简单归纳如下。
步骤402:检查判断条件(1)来判断目前声音帧的平均能量EV_C是否小于临界值TH1(也即EV_C<TH1)以侦测声音能量是否过低。若是,则执行步骤404;否则执行步骤406;
步骤404:由于声音能量过低,因此判定该目前声音帧不可能是语音信号,故设定VAD=0。
步骤406:检查判断条件(2)来判断差值D1是否小于临界值TH2(也即D1<TH2)以侦测平均能量相较于短时间的能量趋势是否变动很大。若是,则执行步骤410;否则执行步骤408;
步骤408:由于该目前声音帧的平均能量EV_C与短时间内的信号能量趋势无明显差异,因此判定该目前声音帧不可能是语音信号,故设定VAD=0。
步骤410:检查判断条件(3)来判断个数N是否大于临界值TH3(也即N>TH3)以侦测先前是否已持续维持无声达一段很长时间。若是,则执行步骤414;否则执行步骤412。
步骤412:由于先前尚未持续维持无声达一段很长时间,因此判定目前声音帧是语音信号,故设定VAD=1。
步骤414:检查判断条件(4)来判断差值D2是否大于临界值TH4(也即D2>TH4)以侦测两连续声音帧的平均能量变化是否很大。若是,则执行步骤418;否则执行步骤416。
步骤416:由于两连续声音帧的平均能量变化并非很大,因此判定目前声音帧不可能是语音信号,故设定VAD=0。
步骤418:由于两连续声音帧的平均能量变化很大,因此判定目前声音帧是语音信号,故设定VAD=1。
请注意,图4所示流程中检查判断条件(1)~(4)的顺序仅作为范例说明的用,并非本发明的限制条件,于其它设计变化中,也可采用不同的顺序来检查判断条件(1)~(4)。此外,并不一定要采用所有的判断条件(1)~(4)来设计语音侦测结果VAD的判断流程,换言之,只要采用了判断条件(1)~(4)中的任一判断条件,即落入本发明的范畴。
图5为图1所示的语音侦测单元106决定语音侦测结果VAD的一第二实施例的流程图。若声音能量过低,便设定VAD=0(步骤502、504),否则的话,便设定VAD=1(步骤502、506)。图6为图1所示的语音侦测单元106决定语音侦测结果VAD的一第三实施例的流程图。若声音能量过低,便设定VAD=0(步骤602、604);若声音能量够高,但平均能量的变动没有很大,则设定VAD=0(步骤602、606、608);若声音能量够高,且平均能量的变动很大,则设定VAD=1(步骤602、606、610)。图7为图1所示的语音侦测单元106决定语音侦测结果VAD的一第四实施例的流程图。若声音能量过低,便设定VAD=0(步骤702、704);若声音能量够高,但两连续声音帧的平均能量变化没有很大,则设定VAD=0(步骤702、706、708);若声音能量够高,且两连续声音帧的平均能量变化很大,则设定VAD=1(步骤702、706、710)。
由于熟悉技术者基于上述有关图4的流程的相关说明即可轻易地了解图5~7中各个步骤的操作细节,故进一步的说明便在此省略以求简洁。
以上所述仅为本发明的实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (26)
1.一种信号处理装置,包含有:
一语音辨识系统;以及
一语音侦测单元,耦接于该语音辨识系统,用以侦测一声音信号是否为一语音信号,并输出一语音侦测结果至该语音辨识系统来控制该语音辨识系统是否对该声音信号进行语音辨识;
其中,该声音信号包含有一目前声音帧,以及该语音侦测单元会比较该目前声音帧的平均能量与一临界值,并根据比较结果侦测该声音信号是否为该语音信号;
当该语音侦测单元侦测到该声音信号为该语音信号时,该语音辨识系统会对该声音信号进行语音辨识,以及当该语音侦测单元侦测到该声音信号并非为该语音信号时,该语音辨识系统不会对该声音信号进行语音辨识。
2.一种信号处理装置,包含有:
一语音辨识系统;以及
一语音侦测单元,耦接于该语音辨识系统,用以侦测一声音信号是否为一语音信号,并输出一语音侦测结果至该语音辨识系统来控制该语音辨识系统是否对该声音信号进行语音辨识;
其中,该声音信号包含有至少一先前声音帧与一目前声音帧,以及该语音侦测单元会依据该至少一先前声音帧的平均能量来决定一信号能量趋势值,计算该目前声音帧的平均能量与该信号能量趋势值的一差值,并比较该差值与一临界值,并根据比较结果侦测该声音信号是否为该语音信号;
当该语音侦测单元侦测到该声音信号为该语音信号时,该语音辨识系统会对该声音信号进行语音辨识,以及当该语音侦测单元侦测到该声音信号并非为该语音信号时,该语音辨识系统不会对该声音信号进行语音辨识。
3.一种信号处理装置,包含有:
一语音辨识系统;以及
一语音侦测单元,耦接于该语音辨识系统,用以侦测一声音信号是否为一语音信号,并输出一语音侦测结果至该语音辨识系统来控制该语音辨识系统是否对该声音信号进行语音辨识;
其中该声音信号包含有多个声音帧,以及该语音侦测单元会比较该多个声音帧中被判断为不包含该语音信号的连续声音帧的个数与一临界值,并根据比较结果侦测该声音信号是否为该语音信号;
当该语音侦测单元侦测到该声音信号为该语音信号时,该语音辨识系统会对该声音信号进行语音辨识,以及当该语音侦测单元侦测到该声音信号并非为该语音信号时,该语音辨识系统不会对该声音信号进行语音辨识。
4.一种信号处理装置,包含有:
一语音辨识系统;以及
一语音侦测单元,耦接于该语音辨识系统,用以侦测一声音信号是否为一语音信号,并输出一语音侦测结果至该语音辨识系统来控制该语音辨识系统是否对该声音信号进行语音辨识;
其中该声音信号包含有一先前声音帧与一目前声音帧,以及该语音侦测单元会计算该目前声音帧的平均能量与该先前声音帧的平均能量的一差值,并比较该差值与一临界值,并根据比较结果侦测该声音信号是否为该语音信号;
当该语音侦测单元侦测到该声音信号为该语音信号时,该语音辨识系统会对该声音信号进行语音辨识,以及当该语音侦测单元侦测到该声音信号并非为该语音信号时,该语音辨识系统不会对该声音信号进行语音辨识。
5.如权利要求1-4任一项所述的信号处理装置,其中当该语音辨识系统由一正常模式进入一省电模式时,该语音侦测单元才会被致能。
6.如权利要求5所述的信号处理装置,其中当该语音侦测单元侦测到该声音信号为该语音信号时,该语音辨识系统会离开该省电模式而进入该正常模式来对该声音信号进行语音辨识。
7.如权利要求6所述的信号处理装置,其中该语音辨识系统会对该声音信号进行语音辨识来判断该声音信号是否包含一预定指令信息,以及当该语音辨识系统判断该声音信号不包含该预定指令信息时,该语音辨识系统会离开该正常模式并进入该省电模式。
8.如权利要求1-4任一项所述的信号处理装置,其中还包含:
一信号收集单元,耦接于该语音辨识系统以及该语音侦测单元;
该语音侦测单元还用以输出该语音侦测结果至该信号收集单元来控制该信号收集单元是否对该声音信号进行收集。
9.如权利要求8所述的信号处理装置,其中当该语音侦测单元侦测到该声音信号为该语音信号时,该信号收集单元会对该声音信号进行收集,该语音辨识系统会对该声音信号进行语音辨识;以及当该语音侦测单元侦测到该声音信号并非为该语音信号时,该信号收集单元会不对该声音信号进行收集,该语音辨识系统不会对该声音信号进行语音辨识。
10.如权利要求8所述的信号处理装置,其中当该信号收集单元以及该语音辨识系统均由一正常模式进入一省电模式时,该语音侦测单元才会被致能。
11.如权利要求10所述的信号处理装置,其中当该语音侦测单元侦测到该声音信号为该语音信号时,该信号收集单元会离开该省电模式而进入该正常模式来对该声音信号进行收集以及该语音辨识系统会离开该省电模式而进入该正常模式来对该声音信号进行语音辨识。
12.如权利要求11所述的信号处理装置,其中该语音辨识系统会对该声音信号进行语音辨识来判断该声音信号是否包含一预定指令信息,以及当该语音辨识系统判断该声音信号不包含该预定指令信息时,该信号收集单元以及该语音辨识系统会离开该正常模式并进入该省电模式。
13.如权利要求7或12所述的信号处理装置,其中该指令信息为一系统唤醒指令。
14.一种信号处理方法,包含有:
侦测一声音信号是否为一语音信号,并产生一语音侦测结果;以及
依据该语音侦测结果来控制一语音辨识系统是否对该声音信号进行语音辨识;
其中该声音信号包含有一目前声音帧,以及侦测该声音信号是否为该语音信号的步骤包含:
比较该目前声音帧的平均能量与一临界值,并根据比较结果侦测该声音信号是否为该语音信号;
其中依据该语音侦测结果来控制该语音辨识系统是否对该声音信号进行语音辨识的步骤包含:
当侦测到该声音信号为该语音信号时,使用该语音辨识系统来对该声音信号进行语音辨识;以及
当侦测到该声音信号并非为该语音信号时,不使用该语音辨识系统来对该声音信号进行语音辨识。
15.一种信号处理方法,包含有:
侦测一声音信号是否为一语音信号,并产生一语音侦测结果;以及
依据该语音侦测结果来控制一语音辨识系统是否对该声音信号进行语音辨识;
其中该声音信号包含有至少一先前声音帧与一目前声音帧,以及侦测该声音信号是否为该语音信号的步骤包含:
依据该至少一先前声音帧的平均能量来决定一信号能量趋势值;
计算该目前声音帧的平均能量与该信号能量趋势值的一差值;以及
比较该差值与一临界值,并根据比较结果侦测该声音信号是否为该语音信号;
其中依据该语音侦测结果来控制该语音辨识系统是否对该声音信号进行语音辨识的步骤包含:
当侦测到该声音信号为该语音信号时,使用该语音辨识系统来对该声音信号进行语音辨识;以及
当侦测到该声音信号并非为该语音信号时,不使用该语音辨识系统来对该声音信号进行语音辨识。
16.一种信号处理方法,包含有:
侦测一声音信号是否为一语音信号,并产生一语音侦测结果;以及
依据该语音侦测结果来控制一语音辨识系统是否对该声音信号进行语音辨识;
其中该声音信号包含有多个声音帧,以及侦测该声音信号是否为该语音信号的步骤包含:
比较该多个声音帧中被判断为不包含该语音信号的连续声音帧的个数与一临界值,并根据比较结果侦测该声音信号是否为该语音信号;
其中依据该语音侦测结果来控制该语音辨识系统是否对该声音信号进行语音辨识的步骤包含:
当侦测到该声音信号为该语音信号时,使用该语音辨识系统来对该声音信号进行语音辨识;以及
当侦测到该声音信号并非为该语音信号时,不使用该语音辨识系统来对该声音信号进行语音辨识。
17.一种信号处理方法,包含有:
侦测一声音信号是否为一语音信号,并产生一语音侦测结果;以及
依据该语音侦测结果来控制一语音辨识系统是否对该声音信号进行语音辨识;
其中该声音信号包含有一先前声音帧与一目前声音帧,以及侦测该声音信号是否为该语音信号的步骤包含:
计算该目前声音帧的平均能量与该先前声音帧的平均能量的一差值;以及
比较该差值与一临界值,并根据比较结果侦测该声音信号是否为该语音信号;
其中依据该语音侦测结果来控制该语音辨识系统是否对该声音信号进行语音辨识的步骤包含:
当侦测到该声音信号为该语音信号时,使用该语音辨识系统来对该声音信号进行语音辨识;以及
当侦测到该声音信号并非为该语音信号时,不使用该语音辨识系统来对该声音信号进行语音辨识。
18.如权利要求14-17任一项所述的信号处理方法,其中侦测该声音信号是否为该语音信号的步骤于该语音辨识系统由一正常模式进入一省电模式时才会被执行。
19.如权利要求18所述的信号处理方法,其中依据该语音侦测结果来控制该语音辨识系统是否对该声音信号进行语音辨识的步骤包含:
当侦测到该声音信号为该语音信号时,控制该语音辨识系统离开该省电模式而进入该正常模式来对该声音信号进行语音辨识。
20.如权利要求19所述的信号处理方法,其中该语音辨识系统会对该声音信号进行语音辨识来判断该声音信号是否包含一预定指令信息,以及该信号处理方法还包含:
当该语音辨识系统判断该声音信号不包含该预定指令信息时,控制该语音辨识系统离开该正常模式并进入该省电模式。
21.如权利要求14-17任一项所述的信号处理方法,其中还包含:
依据该语音侦测结果来控制一信号收集单元是否对该声音信号进行收集。
22.如权利要求21所述的信号处理方法,依据该语音侦测结果来控制信号收集单元是否对该声音信号进行收集的步骤包含:
当侦测到该声音信号为该语音信号时,使用该信号收集单元来对该声音信号进行收集;以及
当侦测到该声音信号并非为该语音信号时,不使用该信号收集单元来对该声音信号进行收集。
23.如权利要求21所述的信号处理方法,其中侦测该声音信号是否为该语音信号的步骤于该信号收集单元以及语音辨识系统均由一正常模式进入一省电模式时才会被执行。
24.如权利要求23所述的信号处理方法,其中依据该语音侦测结果来控制该信号收集单元是否对该声音信号进行收集的步骤包含:
当侦测到该声音信号为该语音信号时,控制该信号收集单元离开该省电模式而进入该正常模式来对该声音信号进行收集。
25.如权利要求24所述的信号处理方法,其中该语音辨识系统会对该声音信号进行语音辨识来判断该声音信号是否包含一预定指令信息,以及该信号处理方法还包含:
当该语音辨识系统判断该声音信号不包含该预定指令信息时,控制该信号收集单元以及该语音辨识系统离开该正常模式并进入该省电模式。
26.如权利要求20或25所述的信号处理方法,其中该指令信息为一系统唤醒指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210245435.3A CN103543814B (zh) | 2012-07-16 | 2012-07-16 | 信号处理装置以及信号处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210245435.3A CN103543814B (zh) | 2012-07-16 | 2012-07-16 | 信号处理装置以及信号处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103543814A CN103543814A (zh) | 2014-01-29 |
CN103543814B true CN103543814B (zh) | 2016-12-07 |
Family
ID=49967355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210245435.3A Active CN103543814B (zh) | 2012-07-16 | 2012-07-16 | 信号处理装置以及信号处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103543814B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105280180A (zh) * | 2014-06-11 | 2016-01-27 | 中兴通讯股份有限公司 | 一种终端控制方法、装置、语音控制装置及终端 |
WO2016051519A1 (ja) * | 2014-09-30 | 2016-04-07 | 三菱電機株式会社 | 音声認識システム |
US9775113B2 (en) * | 2014-12-11 | 2017-09-26 | Mediatek Inc. | Voice wakeup detecting device with digital microphone and associated method |
US9779725B2 (en) * | 2014-12-11 | 2017-10-03 | Mediatek Inc. | Voice wakeup detecting device and method |
CN104598192B (zh) * | 2014-12-29 | 2018-08-07 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
CN104851424A (zh) * | 2015-04-06 | 2015-08-19 | 何涛 | 一种语音辨识照顾护理的方法及其系统 |
CN108663942B (zh) * | 2017-04-01 | 2021-12-07 | 青岛有屋科技有限公司 | 一种语音识别设备控制方法、语音识别设备和中控服务器 |
CN109360585A (zh) * | 2018-12-19 | 2019-02-19 | 晶晨半导体(上海)股份有限公司 | 一种语音激活检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5103481A (en) * | 1989-04-10 | 1992-04-07 | Fujitsu Limited | Voice detection apparatus |
US5983186A (en) * | 1995-08-21 | 1999-11-09 | Seiko Epson Corporation | Voice-activated interactive speech recognition device and method |
CN101083809A (zh) * | 2006-06-01 | 2007-12-05 | 三星电子株式会社 | 使用语音识别来改变操作模式的移动终端及方法 |
WO2009009522A1 (en) * | 2007-07-10 | 2009-01-15 | Motorola, Inc. | Voice activity detector and a method of operation |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070057798A1 (en) * | 2005-09-09 | 2007-03-15 | Li Joy Y | Vocalife line: a voice-operated device and system for saving lives in medical emergency |
US20070198251A1 (en) * | 2006-02-07 | 2007-08-23 | Jaber Associates, L.L.C. | Voice activity detection method and apparatus for voiced/unvoiced decision and pitch estimation in a noisy speech feature extraction |
JP5505896B2 (ja) * | 2008-02-29 | 2014-05-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 発話区間検出システム、方法及びプログラム |
-
2012
- 2012-07-16 CN CN201210245435.3A patent/CN103543814B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5103481A (en) * | 1989-04-10 | 1992-04-07 | Fujitsu Limited | Voice detection apparatus |
US5983186A (en) * | 1995-08-21 | 1999-11-09 | Seiko Epson Corporation | Voice-activated interactive speech recognition device and method |
CN101083809A (zh) * | 2006-06-01 | 2007-12-05 | 三星电子株式会社 | 使用语音识别来改变操作模式的移动终端及方法 |
WO2009009522A1 (en) * | 2007-07-10 | 2009-01-15 | Motorola, Inc. | Voice activity detector and a method of operation |
Also Published As
Publication number | Publication date |
---|---|
CN103543814A (zh) | 2014-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103543814B (zh) | 信号处理装置以及信号处理方法 | |
TWI474317B (zh) | 訊號處理裝置以及訊號處理方法 | |
CN103811003B (zh) | 一种语音识别方法以及电子设备 | |
EP3522153B1 (en) | Voice control system, wakeup method and wakeup apparatus therefor, electrical appliance and co-processor | |
CN105704300B (zh) | 具数字麦克风的声音唤醒侦测装置及相关方法 | |
CN109979438A (zh) | 语音唤醒方法及电子设备 | |
CN110428810B (zh) | 一种语音唤醒的识别方法、装置及电子设备 | |
CN105261368B (zh) | 一种语音唤醒方法及装置 | |
CN105869655B (zh) | 音频装置以及语音检测方法 | |
CN105009204B (zh) | 语音识别功率管理 | |
CN105051812B (zh) | 用于非接触式用户接口的混合输入设备 | |
WO2021139327A1 (zh) | 一种音频信号处理方法、模型训练方法以及相关装置 | |
CN110570873B (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
CN106981290A (zh) | 语音控制装置和语音控制方法 | |
CN205051764U (zh) | 电子设备 | |
CN110223687B (zh) | 指令执行方法、装置、存储介质及电子设备 | |
CN109272991B (zh) | 语音交互的方法、装置、设备和计算机可读存储介质 | |
CN106653010A (zh) | 电子装置及其透过语音辨识唤醒的方法 | |
CN106161755A (zh) | 一种关键词语音唤醒系统及唤醒方法及移动终端 | |
WO2021098153A1 (zh) | 目标用户改变的检测方法、系统、电子设备和存储介质 | |
CN106612367A (zh) | 一种基于麦克风的语音唤醒方法及移动终端 | |
WO2021169711A1 (zh) | 指令执行方法、装置、存储介质及电子设备 | |
TWI684912B (zh) | 語音喚醒裝置及方法 | |
CN111599352A (zh) | 语音唤醒方法、装置、计算机设备和存储介质 | |
CN111754989B (zh) | 一种语音误唤醒的规避方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |