CN111045641A - 一种电子终端及语音识别方法 - Google Patents
一种电子终端及语音识别方法 Download PDFInfo
- Publication number
- CN111045641A CN111045641A CN201911285333.2A CN201911285333A CN111045641A CN 111045641 A CN111045641 A CN 111045641A CN 201911285333 A CN201911285333 A CN 201911285333A CN 111045641 A CN111045641 A CN 111045641A
- Authority
- CN
- China
- Prior art keywords
- electronic terminal
- voice recognition
- voice
- switch
- stationary contact
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims description 16
- 230000009467 reduction Effects 0.000 claims description 13
- 230000006855 networking Effects 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004377 microelectronic Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Telephone Function (AREA)
Abstract
本申请公开提供一种电子终端及语音识别方法,所述电子终端包括:语音识别模块,其配置为基于所采集的语音信号进行语音识别分析,并与嵌入式控制器进行通信;第一开关,其具有第一动触头、第一不动触头和第二不动触头;以及第二开关,其具有第二动触头和第三不动触头,第三不动触头连接到第二不动触头和语音识别模块;其中,第二开关配置为:在语音识别分析没有检测到唤醒关键词且电子终端联网的情况下,断开,否则基于耳机接口的接入情况而接通或断开;第一开关配置为:在语音识别分析没有检测到唤醒关键词且电子终端联网的情况下,接入第一不动触头,否则接入第二不动触头;通过本公开的电子终端能够实现在断开网络状态下识别语音的有益效果。
Description
技术领域
本发明涉及电子技术领域,特别涉及一种电子终端及语音识别方法。
背景技术
目前,电脑进行语音识别主要是在线语音识别引擎(WIN10自带),但电脑在不联网的情况下,无法进行语音识别。对于语音识别来说,电脑使用者的使用频率并没有那么高,究其原因在于,语音识别的准确率、语音识别的局限性和语音识别的依赖网络性,及网络延时都有关系,也就是说语音识别的功能还需要进一步的完善,来提高用户的体验感受度。
由于微软自带的语音识别是在操作系统应用层下的软件,能做到的是调取应用程序,上网搜内容等,且占用CPU进程,其功能局限性还有很多,当CPU在加载做某个工作时,电脑自带的语音识别是无法使用的,或者识别延时会很严重。对于电脑自身出现的问题,比如说CPU过热,风扇转速,和电脑的内部控制,操作系统没有办法进行正常工作,且由于操作系统都是统一的,暂时还没有定制开发。另外,语音识别引擎作为操作系统自带的一部分,是系统需要处理的多进程之一,时刻会受到CPU处理速度的影响,例如CPU在处理某一事件而出现卡顿时,无法响应语音识别引擎的唤醒和操作。
目前电脑上的语音识别有两种,微软的小娜和亚马逊Alexa为代表,国内的科大讯飞。上述方案只关注于语音识别的准确率,而没有对于各种应用场景(比如用耳机还是扬声器播放音频、播放电脑的音频还是待识别的语音信号、电脑是否联网)的开发。
对于本地识别的芯片,己经可以完成多达几千的词条,关键词识别,但由于和PC系统的声音单元相互独立。无法实现直接在PC上应用而取代目前的声卡,且在与声卡在各种应用场景下的兼容和配合上没有进一步研究。可见,现有技术中识别内容主要集中在应用层面,由于系统的差异,做到底层的识别和控制,软件需要差异化。另外,ODM厂商(原始设计制造商)基本上没有可发挥的空间。
发明内容
鉴于现有技术中存在的上述问题,本发明提供了本公开以解决现有技术中存在的以上技术问题。
本公开旨在提供一种电子终端及语音识别方法,可以有效利用电子终端中现有的硬件配置,经由简单的线路改造,兼顾包括断网情况下的本地语音识别、耳机播放本地音频和扬声器播放本地音频的各种应用场景下的需求,并响应应用场景的变化而灵活自动切换音频播放线路。
根据第一方面,本公开的实施例提供一种电子终端,所述电子终端包括处理器、嵌入式控制器、声卡、耳机接口、麦克风和扬声器,所述麦克风被配置为采集语音信号,所述电子终端还包括:语音识别模块,其配置为基于所采集的语音信号进行语音识别分析,并与所述嵌入式控制器进行通信;第一开关,所述第一开关具有第一动触头、第一不动触头和第二不动触头,所述第一不动触头连接到所述声卡的输出端,且所述第一动触头连接到所述扬声器;以及第二开关,所述第二开关具有第二动触头和第三不动触头,所述第三不动触头连接到所述第二不动触头和所述语音识别模块,所述第二动触头经由音频输入通道接入到所述声卡,其中,所述第二开关配置为:在语音识别分析没有检测到唤醒关键词且所述电子终端联网的情况下,断开,否则基于所述耳机接口的接入情况而接通或断开;所述第一开关配置为:在语音识别分析没有检测到唤醒关键词且所述电子终端联网的情况下,接入所述第一不动触头,否则接入所述第二不动触头。
在本公开的一些实施例中,所述电子终端还包括远场识别模块,其配置为:对所采集的语音信号进行远场识别降噪处理,且将降噪处理后的语音信号馈送到所述语音识别模块。
在本公开的一些实施例中,所述语音识别模块经由集成电路间总线与所述嵌入式控制器彼此通信,且配置为:在检测到唤醒关键词的情况下,经由所述嵌入式控制器唤醒所述电子终端的操作系统中的语音引擎。
在本公开的一些实施例中,所述第一开关和第二开关均为音频开关。
在本公开的一些实施例中,所述嵌入式控制器通过低引脚数总线与所述处理器连接;其中,所述处理器通过高保真音频(HDA)总线电连接所述声卡,所述声卡连接有麦克风,所述声卡还通过所述耳机接口与耳机连接,并顺次通过所述第一开关、放大器与所述扬声器连接;所述语音识别模块与所述远场识别模块、麦克风顺序连接,所述语音识别模块还连接有数字转换器,其中,所述数字转换器通过所述第二开关电及所述第一开关在接入所述第一不动触头后与所述声卡连接,或所述数字转换器通过所述第一开关在接入所述第二不动触头后与所述放大器连接。
在本公开的一些实施例中,所述语音识别模块经由通用输入输出(GPIO)控制所述第一开关的切换和所述第二开关的接通及断开。
根据第二方面,本公开的实施例提供一种语音识别方法,其应用于电子终端中,所述电子终端包括处理器、嵌入式控制器、声卡、耳机接口、麦克风和扬声器,所述语音识别方法包括:经由所述麦克风采集语音信号;基于所采集的语音信号进行语音识别分析,以确定是否包含唤醒关键词;确定所述电子终端的联网状况;在不包含唤醒关键词并且所述电子终端联网的情况下,利用所述声卡和扬声器播放音频;在包含唤醒关键词并且所述电子终端不联网的情况下,基于所述耳机接口的接入情况,对语音识别分析后的语音信号进行播放。
在本公开的一些实施例中,基于所采集的语音信号进行语音识别分析还包括:对所采集的语音信号进行降噪处理;对降噪处理后的语音信号进行语音识别分析。
在本公开的一些实施例中,所述语音识别方法还包括:在所述电子终端内置语音识别模块,其配置为进行所述语音识别分析。
在本公开的一些实施例中,在包含唤醒关键词并所述电子终端未联网的情况下,基于所述耳机接口的接入情况,对语音识别分析后的语音信号进行播放包括:在所述耳机接口接入耳机的情况下,经由所述耳机接口将语音识别分析后的语音信号传输到所述耳机;在所述耳机接口未接入耳机的情况下,将所述语音识别分析后的语音信号传输到所述扬声器。
在本公开的一些实施例中,所述语音识别方法还包括:在包含唤醒关键词的情况下,唤醒所述电子终端的操作系统中的语音引擎。
与现有技术相比较,本发明的有益效果在于:
根据本公开的各种实施例的电子终端和语音识别方法,能够有效改善语音识别的局限性及在语音识别过程中对网络的依赖性,特别是,在电子终端未接入网络的情况下,还能够完成语音识别,进而带来提高用户的体验感受度的有益效果。本公开的电子终端和语音识别方法,可以有效利用电子终端中现有的硬件配置,经由简单的线路改造,兼顾包括断网情况下的本地语音识别、耳机播放本地音频和扬声器播放本地音频的各种应用场景下的需求,并响应应用场景的变化而灵活自动切换音频播放线路。
本公开的语音识别对应的接口是嵌入式控制器,并且该语音识别与CPU加载(loading)没有关系,从电子终端的角度来看,电子终端自身不知道有语音识别,其收到的是己经转化好的数据。
本公开是在电脑无法联网时,或者电脑在运行中,针对云端识别不容易调出的有效补充。例如,在游戏竞技时,除键盘外,我们可以通过语音进行某此宏指令和快捷键的输入。
应当理解,前面的一般描述和以下详细描述都仅是示例性和说明性的,而不是用于限制本公开。
本节提供本公开中描述的技术的各种实现或示例的概述,并不是所公开技术的全部范围或所有特征的全面公开。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
图1为本发明实施例的一种电子终端的电路结构的示意图;
图2为本发明实施例的一种电子终端的电路结构的示意图;
图3为本发明实施例的一种语音识别方法的流程图。
附图标记说明
1-第一不动触头 2-第二不动触头 3-第一动触头
4-第二动触头 5-第三不动触头
具体实施方式
为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
根据第一方面,本公开的实施例提供一种电子终端,具体参见图1,所述电子终端包括处理器、嵌入式控制器100、声卡104、耳机接口105、麦克风107和扬声器106。所述麦克风107被配置为采集语音信号,注意,图1中以声卡104连接的麦克风107为例,也可以在电子终端上设有其他麦克风,例如但不限于外接麦克风(图中未示出),用于采集语音信号。
所述电子终端还包括:语音识别模块102,其配置为基于所采集的语音信号进行语音识别分析,并与所述嵌入式控制器100进行通信;第一开关110,所述第一开关110具有第一动触头3、第一不动触头1和第二不动触头2,所述第一不动触头1连接到所述声卡104的输出端,且所述第一动触头3连接到所述扬声器106;以及第二开关111,所述第二开关111具有第二动触头4和第三不动触头5,所述第三不动触头5连接到所述第二不动触头2和所述语音识别模块102,所述第二动触头4经由音频输入通道接入到所述声卡104。其中,所述第二开关111配置为:在语音识别分析没有检测到唤醒关键词且所述电子终端联网的情况下,断开,否则基于所述耳机接口105的接入情况而接通或断开;所述第一开关110配置为:在语音识别分析没有检测到唤醒关键词且所述电子终端联网的情况下,接入所述第一不动触头1,否则接入所述第二不动触头2。
在本发明实施例的上述技术方案中,嵌入式控制器100是包括电脑等的电子终端中固有的控制装置,其用于执行指定独立控制功能并具有复杂方式处理数据能力。其可以由嵌入式微电子技术芯片,例如,包括微处理器芯片、定时器、序列发生器或控制器等一系列微电子器件,来控制电子设备或装置,并能够完成监视、控制等各种自动化处理任务。处理器作为本发明电子终端的运算和控制核心,用于信息处理、程序运行的执行单元,具体结构在此不做赘述。
在一些实施例中,语音识别模块102配置为基于所采集的语音信号进行语音识别分析,可用于将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列,具体结构在此不做赘述。
在本发明实施例的上述技术方案中,基于在语音识别分析过程中是否检测到唤醒关键词及所述电子终端是否联网的情况下,操控第一开关110和第二开关111进行相应的接入切换,以改善语音识别的局限性及在语音识别过程中对网络的依赖性,特别是,在电子终端未接入网络的情况下,还能够高效准确完成语音识别,进而带来提高用户的体验感受度。具体说来,可以将是否检测到关键词以及所述电子终端是否联网的判定结果以高低电平的方式输出,并经由例如数字逻辑元件或者嵌入式控制器100等,来控制所述第一开关110和第二开关111的动触头的接入切换。
另外,由于本发明实施例中的语音识别模块102对应的接口是嵌入式控制器100,并且由于语音识别模块102与CPU加载没有关系,电子终端收到的是己经转化好的数据,也就是说,在语音识别过程中不会增加处理器的负载。本公开是在电脑无法联网的情况下,或者电脑在运行过程中,针对云端识别不容易调出的有效补充。
在本公开的一些实施例中,所述电子终端还包括远场识别模块108,其配置为:对所采集的语音信号进行远场识别降噪处理,且将降噪处理后的语音信号馈送到所述语音识别模块102。语音信号经过降噪处理后,有效提高语音识别的准确率,有效克服语音识别只能在较近距离完成的局限性。
在本公开的一些实施例中,所述语音识别模块102经由集成电路间总线115(I2C)与所述嵌入式控制器100彼此通信,且配置为:在检测到唤醒关键词的情况下,经由所述嵌入式控制器100唤醒所述电子终端的操作系统中的语音引擎。在本实施例中,语音识别模块102支持多条识别指令。可以把识别后的内容做出预想的动作,如通过集成电路间总线115与嵌入式控制器100沟通,当然,还可以接入嵌入式控制器的指令,进行预存语音的输出,具体设置在此不做限定,可根据具体应用进行相应的调整。
在本公开的一些实施例中,参见图1和图2,所述第一开关110和第二开关111均为音频开关;通过操控第一开关110和第二开关111的接入状态之间的转换,进而实现音频信号的以不同方式输出,例如,通过耳机或者通过扬声器106输出。
在本公开的一些实施例中,结合上述技术方案,具体参见图2,所述嵌入式控制器100通过低引脚数总线113与所述处理器连接;其中,所述处理器通过高保真音频总线114电连接所述声卡104,所述声卡104连接有麦克风107,所述声卡104还通过所述耳机接口105与耳机连接,并顺次通过所述第一开关110、放大器112与所述扬声器106连接;所述语音识别模块102与所述远场识别模块108、麦克风107顺序连接,所述语音识别模块102还连接有数字转换器109,其中,所述数字转换器109通过所述第二开关111电及所述第一开关110在接入所述第一不动触头1后与所述声卡104连接,或所述数字转换器109通过所述第一开关110在接入所述第二不动触头2后与所述放大器112连接。通过上述方式,能够实现电子终端在不同联网状态以及不同的音频播放状态(也就是不同的应用场景)下,以不同的输出方式输出语音。
在本公开的一些实施例中,由于使用的声音输出方案己经固化,高保真音频总线和本地的语音识别方案需要与音频解码器(图中未示出)配合,并在不同的应用场景下,所述语音识别模块102经由通用输入输出控制所述第一开关110的接入切换和所述第二开关111的接通/断开,以实现在语音识别过程中智能切换的效果。
具体参见图2,例如,在电子终端联网的状态下,电脑可以正常播放音频,在该状态下,第二开关111断开,第一开关110接入到第一不动触头1,且电子终端基于所述耳机接口105的接入情况做不同操作。例如,耳机接口105接入耳机,声音从音频解码器经第一开关110,此时,第一开关110接通第一不动触头1,声音从耳机输出;反之,当耳机接口105未接入耳机的状态下,由于声音输出方案己经固化,电子终端将自动实施切换,此时,第一开关110接通第二不动触头2,声音从音频解码器经第一开关110,将输出声音的信号继续通过放大器112由扬声器106输出,相关具体的切换过程在此不做赘述。
相应地,在电子终端未联网的状态下,第一开关110和第二开关111基于所述耳机接口105的接入情况进行接入切换的操作,例如,当有语音包括关键唤醒词,需进行声音输出时,且耳机接口105已经接入耳机,此时,语音识别模块102经通用输入输出控制第一开关110切换到第二不动触头2,第二开关111断开,此时语音识别模块102输出声音的信号经放大器112放大后通过扬声器106输出。反之,耳机接口105未接入耳机,此时,语音识别模块102经通用输入输出控制第一开关110切换到第一不动触头1,并且,第二开关111接通,此时语音识别模块102输出声音的信号直接通过线路输入通道经耳机输出。
根据第二方面,本公开的实施例提供一种语音识别方法,所述语音识别方法可应用于电子终端中,所述电子终端包括处理器101、嵌入式控制器100、声卡104、耳机接口105、麦克风107和扬声器106。所述电子终端可以采用各种配置,包括但不限于如图1和图2所示的配置。
该语音识别方法始于步骤S11,经由所述麦克风107采集语音信号。在步骤S12,基于所采集的语音信号进行语音识别分析。在步骤S13判定所采集的语音信号中是否包含唤醒关键词。在步骤S14和步骤S15,均在步骤S13的基础上,进一步确定所述电子终端是否联网,不根据不同的判断结构实施不同的操作。
其中,在步骤S16,在不包含唤醒关键词并且所述电子终端联网的情况下,利用所述声卡104和扬声器106播放音频;在步骤S17,在包含唤醒关键词并且所述电子终端不联网的情况下,基于所述耳机接口105的接入情况,对语音识别分析后的语音信号进行播放。在本实施例中,不包含唤醒关键词但所述电子终端未联网的情况与步骤S15一样,由于使用的声音输出方案己经固化,在所采集的语音信号中不包含唤醒关键词的情况下,无论电子终端是否联网,电子终端均对耳机接口105是否接入耳机进行判断,并根据判断结果选择一种输出方式播放音频,也就是说,耳机与扬声器之间切换的过程是透明且自动完成的,最终声音信号将利用所述声卡104和扬声器106播放音频,对此,关于该过程不做进一步赘述。
关于步骤S13与步骤S14、步骤S15之间执行顺序不做特定的要求,为此在本实施例中不做限定,可以根据电子终端的具体应用场景做相应的调整,也就是说,先执行步骤S13或先执行步骤S14、步骤S15均符合本申请实施例的要求,具体不做进一步赘述。
通过上述语音识别方法能够在包含唤醒关键词并且所述电子终端不联网的情况下,完成语音识别,进而带来提高用户的体验感受度,以及,通过上述语音识别方法还能够实现,电脑在运行中针对云端识别不容易调出的有效补充。
在本公开的一些实施例中,在步骤S12中,基于所采集的语音信号进行语音识别分析还包括:对所采集的语音信号进行降噪处理;对降噪处理后的语音信号进行语音识别分析。语音信号经过降噪处理后,有效提高语音识别的准确率,有效克服语音识别只能在较近距离完成的局限性。
在本公开的一些实施例中,所述语音识别方法还包括:在所述电子终端内置语音识别模块102,其配置为进行所述语音识别分析。通过对外部输入语音的识别,以使电子终端执行相应的操作。
在本公开的一些实施例中,在包含唤醒关键词并所述电子终端未联网的情况下,基于所述耳机接口105的接入情况,对语音识别分析后的语音信号进行播放包括:在所述耳机接口105接入耳机的情况下,经由所述耳机接口105将语音识别分析后的语音信号传输到所述耳机;在所述耳机接口105未接入耳机的情况下,将所述语音识别分析后的语音信号传输到所述扬声器106。由此实现在电子终端未联网的情况下,将识别后的声音信号以不同的输出方式进行输出,最终完成声音信号本地识别,降低电子终端的处理器101运行负荷的有益效果。
在本公开的一些实施例中,所述语音识别方法还包括:在包含唤醒关键词的情况下,唤醒所述电子终端的操作系统中的语音引擎。在本实施例中,当需要唤醒操作系统下的语音引擎时,通过嵌入式控制器100进行唤醒,由此减低操作系统中的处理器101的运行负载,提高用户使用过程中的体验。
在本申请实施例中,语音引擎能够对连续语音进行自动识别,实现了语音数据的实时内容识别,精准唤醒关键词比对,语义理解提示分析,关键段落快速定位检索,编辑文本摘录和语音交互等功能。语音引擎能够对音频文件能够段落精准复核定位,关键词自定义词联网大数据比对检索反馈,方便使用人员迅速办理各种业务工作,在此不赘述。
在本申请实施例中,关于低引脚数总线113、高保真音频总线114的具体构建不做赘述。
为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。
此外,尽管在此描述了说明性的实施例,但是范围包括具有基于本公开的等效要素、修改、省略、组合(例如,跨各种实施例的方案的组合)、调整或变更的任何和所有实施例。权利要求中的要素将基于权利要求中使用的语言进行宽泛地解释,而不限于本说明书中或在本申请的存续期间描述的示例。此外,所公开的方法的步骤可以以任何方式进行修改,包括通过重新排序步骤或插入或删除步骤。因此,意图仅仅将描述视为例子,真正的范围由以下权利要求及其全部等同范围表示。
以上描述旨在是说明性的而非限制性的。例如,上述示例(或其一个或多个方面)可以彼此组合使用。在阅读以上描述之后,例如本领域普通技术人员可以使用其他实施例。而且,在以上详细描述中,可以将各种特征组合在一起以简化本公开。这不应被解释为意图未请求保护的公开特征对于任何权利要求是必不可少的。因此,以下权利要求作为示例或实施例结合到具体实施方式中,其中每个权利要求自身作为单独的实施例,并且可以预期这些实施例可以以各种组合或置换彼此组合。应参考所附权利要求以及这些权利要求所赋予的等同物的全部范围来确定本发明的范围。
Claims (11)
1.一种电子终端,所述电子终端包括处理器、嵌入式控制器、声卡、耳机接口、麦克风和扬声器,所述麦克风被配置为采集语音信号,其特征在于,所述电子终端还包括:
语音识别模块,其配置为基于所采集的语音信号进行语音识别分析,并与所述嵌入式控制器进行通信;
第一开关,所述第一开关具有第一动触头、第一不动触头和第二不动触头,所述第一不动触头连接到所述声卡的输出端,且所述第一动触头连接到所述扬声器;以及
第二开关,所述第二开关具有第二动触头和第三不动触头,所述第三不动触头连接到所述第二不动触头和所述语音识别模块,所述第二动触头经由音频输入通道接入到所述声卡,
其中,所述第二开关配置为:在语音识别分析没有检测到唤醒关键词且所述电子终端联网的情况下,断开,否则基于所述耳机接口的接入情况而接通或断开;
所述第一开关配置为:在语音识别分析没有检测到唤醒关键词且所述电子终端联网的情况下,接入所述第一不动触头,否则接入所述第二不动触头。
2.根据权利要求1所述的电子终端,其特征在于,所述电子终端还包括远场识别模块,其配置为:对所采集的语音信号进行远场识别降噪处理,且将降噪处理后的语音信号馈送到所述语音识别模块。
3.根据权利要求1或2所述的电子终端,其特征在于,所述语音识别模块经由集成电路间总线与所述嵌入式控制器彼此通信,且配置为:在检测到唤醒关键词的情况下,经由所述嵌入式控制器唤醒所述电子终端的操作系统中的语音引擎。
4.根据权利要求3所述的电子终端,其特征在于,所述第一开关和所述第二开关均为音频开关。
5.根据权利要求4所述的电子终端,其特征在于,所述嵌入式控制器通过低引脚数总线与所述处理器连接;其中,
所述处理器通过高清晰度音频总线电连接所述声卡,所述声卡连接有麦克风,所述声卡还通过所述耳机接口与耳机连接,并顺次通过所述第一开关、放大器与所述扬声器连接;
所述语音识别模块与所述远场识别模块、麦克风顺序连接,所述语音识别模块还连接有数字转换器,其中,所述数字转换器通过所述第二开关电及所述第一开关在接入所述第一不动触头后与所述声卡连接,或所述数字转换器通过所述第一开关在接入所述第二不动触头后与所述放大器连接。
6.根据权利要求1或2所述的电子终端,其特征在于,所述语音识别模块经由通用输入输出控制所述第一开关的切换和所述第二开关的接通及断开。
7.一种语音识别方法,应用于电子终端中,所述电子终端包括处理器、嵌入式控制器、声卡、耳机接口、麦克风和扬声器,其特征在于,所述语音识别方法包括:
经由所述麦克风采集语音信号;
基于所采集的语音信号进行语音识别分析,以确定是否包含唤醒关键词;
确定所述电子终端的联网状况;
在不包含唤醒关键词并且所述电子终端联网的情况下,利用所述声卡和扬声器播放音频;在包含唤醒关键词并且所述电子终端不联网的情况下,基于所述耳机接口的接入情况,对语音识别分析后的语音信号进行播放。
8.根据权利要求7所述的语音识别方法,其特征在于,基于所采集的语音信号进行语音识别分析还包括:
对所采集的语音信号进行降噪处理;
对降噪处理后的语音信号进行语音识别分析。
9.根据权利要求7或8所述的语音识别方法,其特征在于,所述语音识别方法还包括:利用所述电子终端内置的语音识别模块进行所述语音识别分析。
10.根据权利要求9所述的语音识别方法,其特征在于,在包含唤醒关键词并所述电子终端未联网的情况下,基于所述耳机接口的接入情况,对语音识别分析后的语音信号进行播放包括:
在所述耳机接口接入耳机的情况下,经由所述耳机接口将语音识别分析后的语音信号传输到所述耳机;
在所述耳机接口未接入耳机的情况下,将所述语音识别分析后的语音信号传输到所述扬声器。
11.根据权利要求7或8所述的语音识别方法,其特征在于,还包括:在包含唤醒关键词的情况下,唤醒所述电子终端的操作系统中的语音引擎。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911285333.2A CN111045641B (zh) | 2019-12-13 | 2019-12-13 | 一种电子终端及语音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911285333.2A CN111045641B (zh) | 2019-12-13 | 2019-12-13 | 一种电子终端及语音识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111045641A true CN111045641A (zh) | 2020-04-21 |
CN111045641B CN111045641B (zh) | 2022-03-25 |
Family
ID=70236301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911285333.2A Active CN111045641B (zh) | 2019-12-13 | 2019-12-13 | 一种电子终端及语音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111045641B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112870034A (zh) * | 2021-03-23 | 2021-06-01 | 广西南宁叶公好龙科技有限公司 | 一种通过声音进行多维定位的导盲装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006071793A (ja) * | 2004-08-31 | 2006-03-16 | Fuji Heavy Ind Ltd | 車両の情報通信システム |
US20070297394A1 (en) * | 1999-05-05 | 2007-12-27 | William Allan | Telephony and data network services at a telephone |
US20090074157A1 (en) * | 1992-04-13 | 2009-03-19 | Nuance Communications, Inc. | Speech Recognition System for Electronic Switches In A Non-Wireline Communications Network |
CN203554531U (zh) * | 2013-10-31 | 2014-04-16 | 南京正泽科技有限公司 | 全双工自组网语音通信单元 |
CN106154860A (zh) * | 2016-08-26 | 2016-11-23 | 深圳市新国都支付技术有限公司 | 一种智能开关及应用该智能开关的智能家居系统 |
CN107959405A (zh) * | 2017-12-04 | 2018-04-24 | 合肥联宝信息技术有限公司 | 一种电子设备和电力供应方法 |
CN208724101U (zh) * | 2018-10-30 | 2019-04-09 | 中用科技有限公司 | 一种语音控制的监控对讲机 |
-
2019
- 2019-12-13 CN CN201911285333.2A patent/CN111045641B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090074157A1 (en) * | 1992-04-13 | 2009-03-19 | Nuance Communications, Inc. | Speech Recognition System for Electronic Switches In A Non-Wireline Communications Network |
US20070297394A1 (en) * | 1999-05-05 | 2007-12-27 | William Allan | Telephony and data network services at a telephone |
JP2006071793A (ja) * | 2004-08-31 | 2006-03-16 | Fuji Heavy Ind Ltd | 車両の情報通信システム |
CN203554531U (zh) * | 2013-10-31 | 2014-04-16 | 南京正泽科技有限公司 | 全双工自组网语音通信单元 |
CN106154860A (zh) * | 2016-08-26 | 2016-11-23 | 深圳市新国都支付技术有限公司 | 一种智能开关及应用该智能开关的智能家居系统 |
CN107959405A (zh) * | 2017-12-04 | 2018-04-24 | 合肥联宝信息技术有限公司 | 一种电子设备和电力供应方法 |
CN208724101U (zh) * | 2018-10-30 | 2019-04-09 | 中用科技有限公司 | 一种语音控制的监控对讲机 |
Non-Patent Citations (2)
Title |
---|
杜丹等: "基于语音识别和红外无线通信的智能开关控制系统设计", 《新型工业化》 * |
王荣桂: "体验手机的语音功能", 《电脑知识与技术(经验技巧)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112870034A (zh) * | 2021-03-23 | 2021-06-01 | 广西南宁叶公好龙科技有限公司 | 一种通过声音进行多维定位的导盲装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111045641B (zh) | 2022-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6811758B2 (ja) | 音声対話方法、装置、デバイス及び記憶媒体 | |
US10074365B2 (en) | Voice control method, mobile terminal device, and voice control system | |
CN108108142A (zh) | 语音信息处理方法、装置、终端设备及存储介质 | |
KR20200027554A (ko) | 음성 인식 방법 및 장치, 그리고 저장 매체 | |
CN112201246B (zh) | 基于语音的智能控制方法、装置、电子设备及存储介质 | |
CN106528545B (zh) | 一种语音信息的处理方法及装置 | |
CN108509176A (zh) | 一种播放音频数据的方法、装置、存储介质及智能终端 | |
JP7017598B2 (ja) | スマートデバイスのデータ処理方法、装置、機器及び記憶媒体 | |
JP7051799B2 (ja) | 音声認識制御方法、装置、電子デバイス及び読み取り可能な記憶媒体 | |
CN111696553B (zh) | 一种语音处理方法、装置及可读介质 | |
CN109240107A (zh) | 一种电器设备的控制方法、装置、电器设备和介质 | |
CN110097895B (zh) | 一种纯音乐检测方法、装置及存储介质 | |
CN112230877A (zh) | 一种语音操作方法、装置、存储介质及电子设备 | |
CN108600559B (zh) | 静音模式的控制方法、装置、存储介质及电子设备 | |
CN107040661A (zh) | 移动终端播放音量的控制方法、装置及移动终端 | |
CN109712623A (zh) | 语音控制方法、装置及计算机可读存储介质 | |
CN112233676A (zh) | 智能设备唤醒方法、装置、电子设备及存储介质 | |
WO2017215615A1 (zh) | 一种音效处理方法及移动终端 | |
CN111045641B (zh) | 一种电子终端及语音识别方法 | |
CN111897916B (zh) | 语音指令识别方法、装置、终端设备及存储介质 | |
CN113157240A (zh) | 语音处理方法、装置、设备、存储介质及计算机程序产品 | |
CN115150501A (zh) | 一种语音交互方法及电子设备 | |
CN110691016B (zh) | 一种基于音频设备实现的交互方法及音频设备 | |
CN112259076A (zh) | 语音交互方法、装置、电子设备及计算机可读存储介质 | |
CN111599360B (zh) | 唤醒控制方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |