CN108417008A - 基于语音识别的红外控制方法及系统 - Google Patents
基于语音识别的红外控制方法及系统 Download PDFInfo
- Publication number
- CN108417008A CN108417008A CN201710071698.XA CN201710071698A CN108417008A CN 108417008 A CN108417008 A CN 108417008A CN 201710071698 A CN201710071698 A CN 201710071698A CN 108417008 A CN108417008 A CN 108417008A
- Authority
- CN
- China
- Prior art keywords
- infrared
- control
- electric appliance
- controlled electric
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000015654 memory Effects 0.000 claims abstract description 31
- 238000004891 communication Methods 0.000 claims abstract description 29
- 230000001755 vocal effect Effects 0.000 claims description 28
- 238000001514 detection method Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 6
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 238000012790 confirmation Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008054 signal transmission Effects 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 238000004378 air conditioning Methods 0.000 description 7
- 230000005611 electricity Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000001737 promoting effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C23/00—Non-electrical signal transmission systems, e.g. optical systems
- G08C23/04—Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明公开了一种基于语音识别的红外控制方法和系统,将红外控制电器对应的名称和控制指令组成的控制词列表按照名称分别存储到MCU的闪存中;对来自语音接收单元的用户语音进行识别;若包含所述某一红外控制电器控制列表中的名称和控制指令,则生成红外控制命令,若识别出用户语音只包含控制指令,则生成当前控制电器名称和控制指令的红外控制命令;若包含所述红外控制电器名称,则生成唤醒该红外控制电器处于待命中的红外控制命令;若否,请求用户重新给出语音控制指令;发送已经生成的红外控制命令;系统包括红外遥控装置、电源、通信单元、云服务器以及红外控制电器;实施本发明,使身体不便的人可通过语音控制家用电器,提供了极大便利。
Description
技术领域
本发明涉及家庭用遥控器技术领域,特别涉及一种家庭使用的基于语音识别的多路智能红外控制方法及系统。
背景技术
一般的红外遥控系统是由红外遥控信号发射器、红外遥控信号接收器和微控制器及其外围电路等三部分构成的,遥控信号发射器用来产生遥控编码脉冲,驱动红外发射管输出红外遥控信号,遥控接收头完成对遥控信号的放大、检波、整形、解调出遥控编码脉冲。遥控编码脉冲是一组串行二进制码,对于一般的红外遥控系统,此串行码输入到微控制器,由其内部自动识别单元完成对遥控指令解码,并执行相应的遥控功能。
在红外遥控系统中,解码的核心是自动识别单元,它接收解调出的串行二进制码,在内部根据本系统的遥控信号编码格式将串行码对应成遥控器上的按键。显然,这种在自动识别单元内部解码出的遥控指令是不便我们利用的,而且我们也不需要获取它,我们只需要利用一般红外遥控系统中的遥控发射器、遥控接收头,自行设计解码电路直接对遥控接收头调解出的遥控编码脉冲进行解码,就可以得到原始的按键信息。
现有的智能遥控器一般与智能手机配合使用,在智能手机上安装特定的智能遥控器APP,安装完成后,还需要对APP进行简单的设置。智能遥控器APP的控制界面上会显示不同的家用电器名称,例如空调、电视、有线电视机顶盒、DVD播放机、功放等红外家电,这样通过智能手机就可以对家用电器进行控制。智能手机中的智能遥控器APP的控制界面与物理遥控器基本一致,显示的控件一般有电源键,播放进度的前进后退控制,声音的上下调节,用户利用智能手机就可以实现对家用电器的控制了。
这种与智能手机配合使用的智能遥控器,在家居中能够无死角遥控,超远距离遥控,遥控距离超过20米,而且更重要的实现了远程控制。在家中的遥控器没有电的时候就可以使用智能遥控器来控制家用电器,用户在上班时就可以通过手机APP上控制界面来操作家用电器,天热的时候提前开空调,通过红外摄像头和报警器还可以实现对家居环境进行监控。
但是这种智能遥控器的缺点是用户必须熟悉智能手机操作,能够熟练操作手机APP,这就限制了一部分用户,例如年纪较大,不能熟练操作智能手机系统的用户;文化程度不高或者身体行动不便的用户,而这部分用户又经常在家,若采用智能遥控器,将对这部分人的生活造成很大的不便。
发明内容
针对现有的家用电器的遥控器繁多、放置不方便以及智能遥控器不易操作的问题,提出一种家庭使用的基于语音识别的红外控制方法及系统,通过在MCU的闪存中将控制红外控制电器的控制指令和对应的名称按照电器类别分别存储成一控制词列表,用户通过自动识别单元进行识别以及多路红外发射单元将控制指令发送到红外控制电器的红外接收单元,红外接收单元响应控制指令,红外控制电器运行相应的功能。本发明中的基于语音识别的红外控制方法及系统,使一部分对智能手机不能熟练操作的人或身体不便的人顺利地控制家用电器,为他们的生活提供了极大的便利,具有广泛的推广价值。
一种基于语音识别的红外控制方法,采用与红外控制电器红外通信连接的红外遥控装置、与所述红外遥控装置连接用于连接云服务器或智能终端的通信单元,所述红外遥控装置包括语音接收单元、语音输出单元、MCU以及红外发射单元;所述红外控制方法包括以下步骤:
将红外控制电器对应的名称和控制指令组成的控制词列表按照名称分别存储到MCU的闪存中,并通过通信单元连接智能终端或远程云服务器对所述控制词列表进行实时更新;
对来自语音接收单元的用户语音进行识别;
若识别出用户语音同时包含所述某一红外控制电器控制列表中的名称和控制指令,则生成红外控制命令,
若识别出用户语音只包含控制指令,如控制词适合当前红外控制电器,则生成当前控制电器名称和控制指令的红外控制命令;
若识别出用户语音只包含所述红外控制电器名称,如所对应红外控制电器处于休息中则生成唤醒该红外控制电器处于待命中的红外控制命令;
若否,则通过语音输出单元告知用户语音识别失败,请求用户重新给出语音控制指令;
由所述红外发射单元发送已经生成的红外控制命令。
根据本发明所述的一种基于语音识别的红外控制方法,所述对来自语音接收单元的用户语音进行识别,包括:
所述自动识别单元接收到用户语音信号后,利用将短时能量和过零率分别确定为上下门限的双门限端点检测方法,对所述语音信号进行检测;
对所述语音信号进行噪声消除和特征提取;
对所述语音信号进行声纹识别;
所述自动识别单元根据从所述语音信号提出的语音特征、语音识别资源库以及声纹识别特征识别出所述语音信号中的红外控制电器名称;
根据所述红外控制电器名称调出对应的红外控制电器的控制指令。
根据本发明所述的一种基于语音识别的红外控制方法,所述端点检测方法为利用过零率检测清音,用短时能量检测浊音,两者配合的语音检测方法。
根据本发明所述的一种基于语音识别的红外控制方法,对所述语音信号进行声纹识别,包括:
通过对家居中家庭成员的声纹特征进行注册,获取所有家庭成员的声纹模型;
接收到所述语音信号后,利用双门限端点检测法对所述语音信号的声纹特征进行检测;
消除声纹噪声,对提取到的所述语音信号的声纹特征进行声纹确认和声纹鉴别;
根据声纹模型对所述声纹特征内容进行声纹匹配,并对匹配结果进行置信评分,并根据评分结果确定最终的声纹识别结果。
一种基于语音识别的红外控制系统,包括:
红外遥控装置:与红外控制电器通过红外控制方式通信连接,用于识别用户发出的语音信号,并对语音信号进行识别判断,识别失败后请求用户重新发出语音信号,发出红外控制指令到红外控制电器;
通信单元:与所述红外遥控装置连接,用于连接云服务器或智能终端,实时更新红外控制电器控制指令列表;
电源:通过电源线与所述红外遥控装置连接,用于对所述红外遥控装置供电;
红外控制电器:与所述红外遥控装置通过红外技术进行通信连接,用于接收红外遥控装置的控制指令,响应所述控制指令,运行相应的功能。
根据本发明所述的一种基于语音识别的红外控制系统,所述红外遥控装置包括:
语音接收单元:与MCU连接,用于接收用户语音信号,并将所述语音信号转换成电信号传输到所述MCU中进行识别;
语音输出单元:与所述MCU连接,用于输出语音信号识别判断结果,告知用户是否重新发出语音信号;
MCU:用于根据识别算法以及语音检测算法对用户语音信号进行识别,并对各种红外控制电器的控制词列表进行存储;
多路红外发射单元:与所述MCU连接,用于发出控制指令到相应的红外控制电器。
根据本发明所述的一种基于语音识别的红外控制系统,所述MCU包括:
自动识别单元:与闪存连接,用于对接收到的语音信号进行识别判断,从所述语音信号中识别出红外控制电器名称,并根据所述红外控制电器名称从所述闪存的控制词列表中获取相应红外控制电器的控制指令;
闪存:与所述自动识别单元连接,用于存储各种红外控制电器控制指令列表。
根据本发明所述的一种基于语音识别的红外控制系统,所述红外控制电器包括:
红外接收单元:通过红外通信技术与所述红外发射单元通信连接,用于接收控制指令,并驱动红外控制电器响应控制指令,运行相应的功能。
根据本发明所述的一种基于语音识别的红外控制系统,所述红外控制系统还包括:
云服务器:与所述通信单元通信连接,用于对所述闪存中的控制指令列表进行实时更新。
针对现有的家用电器的遥控器繁多、放置不方便以及智能遥控器不易操作的问题,提出一种家庭使用的基于语音识别的红外控制方法及系统,通过在MCU的闪存中将控制红外控制电器的控制指令和对应的名称按照电器类别分别存储成一控制词列表,用户通过发出语音控制指令到语音接收单元,语音接收单元对用户的语音进行转换后发送到自动识别单元进行识别,自动识别单元首先对接收到的用户语音进行识别判断,判断红外控制电器状态,获取到控制词列表中的红外控制电器名称控制指令后,通过多路红外发射单元将控制指令发送到红外控制电器的红外接收单元,红外接收单元响应控制指令,红外控制电器运行相应的功能。红外遥控装置中的通信单元还可以连接智能终端或通过互联网连接远程云服务器,对存储在MCU闪存中的控制词列表进行实时更新,这样即使红外控制电器更新后,仍能通过红外遥控装置对红外控制电器进行有效控制,本发明中的基于语音识别的红外控制方法及系统,使一部分对智能手机不能熟练操作的人或身体不便的人顺利地控制家用电器,为他们的生活提供了极大的便利,具有广泛的推广价值。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明中一种基于语音识别的红外控制方法中的语音识别实施例的流程示意图;
图2是本发明中一种基于语音识别的红外控制方法实施例中步骤S2的子步骤流程示意图;
图3是本发明中一种基于语音识别的红外控制方法实施例中步骤S23的子步骤流程示意图;
图4是本发明中一种基于语音识别的红外控制系统实施例逻辑连接流程示意图;
图5是本发明中一种基于语音识别的红外控制系统中红外遥控装置510实施例的逻辑连接示意图;
图6是本发明中一种基于语音识别的红外控制系统中控制指令传输实施例示意图。
具体实施方式
现有的与智能手机配合使用的智能遥控器,在家居中能够无死角遥控,超远距离遥控,遥控距离超过20米,而且更重要的实现了远程控制。在家中的遥控器没有电的时候就可以使用智能遥控器来控制家用电器,用户在上班时就可以通过手机APP上控制界面来操作家用电器,天热的时候提前开空调,通过红外摄像头和报警器还可以实现对家居环境进行监控,但是这种智能遥控器要求用户必须熟悉智能手机操作,能够熟练操作手机APP,这就限制了一部分用户,例如年纪较大,不能熟练操作智能手机系统的用户;文化程度不高或者身体行动不便的用户,而这部分用户又经常在家,若采用这种智能遥控器,将对这部分人的生活造成很大的不便。
针对现有的家用电器的遥控器繁多、放置不方便以及智能遥控器不易操作的问题,提出一种家庭使用的基于语音识别的红外控制方法及系统,系统包括红外遥控装置510、红外控制电器520、智能终端550或云服务器540、电源560以及通信单元530;红外遥控装置510通过红外射频技术向红外控制电器520传输控制指令,红外遥控装置510通过通信单元530连接智能终端550或远程云服务器540,红外遥控装置510采用自动语音识别,用户发出语音,红外遥控装置510中接收后,首先根据语音识别算法对用户语音进行识别,并对红外控制电器520的状态进行判断,根据识别出来的控制指令判断是对红外控制电器520进行唤醒或驱动红外控制电器520运行相应的功能;控制指令由多路红外发射单元514发出,不同的电器对应不同的发射频率。用户输出语音就可以实现对家用电器的有效控制。红外遥控装置510中的通信单元530还可以连接智能终端550或通过互联网连接远程云服务器540,对存储在MCU513闪存5132中的控制词列表进行实时更新,这样即使红外控制电器520更新后,仍能通过红外遥控装置510对红外控制电器520进行有效控制,本发明中的基于语音识别的红外控制方法及系统,使一部分对智能手机不能熟练操作的人或身体不便的人顺利地控制家用电器,为他们的生活提供了极大的便利,具有广泛的推广价值。
下面将结合附图对本发明进行详细说明。
一、方法实施例
图1是本发明中一种基于语音识别的红外控制方法中的语音识别实施例的流程示意图,请参考图1,一种基于语音识别的红外控制方法,包括:
S1、将红外控制电器520对应的名称和控制指令组成的控制词列表按照名称分别存储到MCU513的闪存5132中,并通过通信单元530连接智能终端550或远程云服务器540对控制词列表进行实时更新。
闪存5132(Flash Memory)是一种长寿命的非易失性(在断电情况下仍能保持所存储的数据信息)的存储器,数据删除不是以单个的字节为单位而是以固定的区块为单位(注意:NOR Flash为字节存储。),区块大小一般为256KB到20MB。由于其断电时仍能保存数据,闪存5132512通常被用来保存设置信息。闪存5132以列表的形式分别存储各个红外控制电器520存储控制指令,那么在调用的时候以列表的形式调用该电器的控制指令,用户家居中包括很多红外家用电器,例如电风扇、照明灯、加湿器、电视机、空调、窗帘以及电暖器等,这些红外控制电器520的遥控指令的编码方式不一样,控制指令的内容也不一样,例如空调的控制指令可能包括“打开”,“关闭”,温度的控制以及风的控制功能,而照明灯的控制指令相对比较简单,因此不同的红外控制电器520的控制指令内容不同,本发明中将红外控制电器520的这些控制指令以块的形式存储在闪存5132中,并且与相应的红外控制电器520名称相关联,例如空调的控制指令列表包括空调的名称、控制指令参数以及信号序列等内容,这些指令内容以列表的形式存储在闪存5132中,因为同一类型红外控制电器520的控制指令是相同的,例如空调的控制指令相同,而空调与电视的控制指令不同;同一类型的控制词列表只存储一个列表在闪存5132中,不同类型的红外控制电器520控制指令分别以列表的形式存储。通过预先在闪存5132中存储控制指令,有利于在对语音识别时以列表的形式调用某一红外控制电器520的控制指令,控制指令列表包括了控制该电器的所有与语音控制词对应的控制指令,有利于有效控制红外控制电器520。
红外遥控装置510通过通信单元530与智能终端550或远程服务器连接,实现对控制列表的实时在线更新。
通信单元530可以无线通信技术中的WiFi、蓝牙中的一种,通过无线通信技术与智能终端550连接,通过智能终端550对控制指令列表进行更新;通信单元530也可以为有线通信技术中的双绞网线通过水晶头连接交换机或网卡端口,连接远程云服务器540,通过云服务器540对红外控制电器520的控制指令列表进行在线更新。
智能终端550可以为普通手机、iPad或其他联网智能设备。
S2、对来自语音接收单元511的用户语音进行识别:若识别出用户语音同时包含某一红外控制电器520控制列表中的名称和控制指令,则生成红外控制命令;
若识别出用户语音只包含控制指令,如控制词适合当前红外控制电器520,则生成当前控制电器名称和控制指令的红外控制命令;
若识别出用户语音只包含红外控制电器520名称,如所对应红外控制电器520处于休息中则生成唤醒该红外控制电器520处于待命中的红外控制命令;
若否,则通过语音输出单元512告知用户语音识别失败,请求用户重新给出语音控制指令;
图2是本发明中一种基于语音识别的红外控制方法实施例中步骤S2的子步骤流程示意图,请参考图2,步骤S2包括S21、自动识别单元5131接收到语音信号后,利用双门限端点检测方法,对语音信号进行检测;S22、对语音信号进行噪声消除和特征提取;S23、对语音信号进行声纹识别;S24、自动识别单元5131根据从语音信号提出的语音特征、语音识别资源库以及声纹识别特征识别出语音信号中的红外控制电器520名称。
双门限端点检测是语音识别中非常重要的一步,所谓语音端点检测,就是从一段给定的语音信号中找出语音的起始点和结束点,在语音识别系统中,正确、有效的进行端点检测不仅可以减少计算量和缩短处理时间,而且能排除无声段的噪声干扰、提高语音识别的正确率。研究表明,即使是在安静的环境下,语音识别系统一半以上的错误可能主要来源于端点检测。除此之外,在语音合成、编码等系统中,高效的端点检测也直接影响甚至决定着系统的主要性能。双门限端点检测利用过零率检测清音,用短时能量检测浊音,两者配合。首先为短时能量和过零率分别确定两个门限,一个是较低的门限数值较小,对信号的变化比较敏感,很容易超过;另一个是比较高的门限,数值较大。低门限被超过未必是语音的开始,有可能是很短的噪声引起的,高门限被超过并且接下来的自定义时间段内的语音超过低门限,意味着信号开始。双门限结合了短时能量和短时过零率的优点,具有较高的精确度和较低的误检率。自动识别单元5131511的识别资料库中,预先存储有家庭中每个成员的声纹特征,由于受到环境因素的影响,识别语音或用户的声纹特征前需要进行噪声消除处理。声纹特征识别用于识别出家庭成员中的某个人,因为每个人的声纹特征不一样,那么他发出的语音控制指令的声音特征也会与其他的家庭成员不同,因此需要确认每个家庭成员才能更准确识别出控制指令或关键词指令。
图3是本发明中一种基于语音识别的红外控制方法实施例中步骤S23的子步骤流程示意图,请参考图3,S231、通过对家居中家庭成员的声纹特征进行注册,获取所有家庭成员的声纹模型。S232、接收到语音信号后,利用双门限端点检测法对语音信号的声纹特征进行检测。S233、消除声纹噪声,对提取到的语音信号的声纹特征进行声纹确认和声纹鉴别。S234、根据声纹模型对声纹特征内容进行声纹匹配,并对匹配结果进行置信评分,并根据评分结果确定声纹特征属于某一家庭成员。获取声纹特征有助于自动识别单元5131获取家庭成员的身份信息以及语音特点,可以提高语音识别精度,降低误识别率。
自动识别单元5131根据语音识别算法对应用户的语音进行识别,通过识别出该红外控制电器520的名称,并该红外控制电器520的状态进行判断,例如该红外控制电器520是否在线,若在线,则发送控制指令到红外控制电器520,若不在线,则需要首先发送唤醒指令到红外控制电器520,使其处于在线的状态,还有一种情况时,自动识别单元5131识别用户语音失败,则需要通过红外遥控装置510的语音输出单元512告知用户,语音识别失败,请求用户重新输出语音进行识别。
S3、发送已经生成的红外控制命令。
红外遥控装置510中的多路红外发射单元514,接收MCU513传输过来的控制指令,并根据红外控制电器520的名称选择相应的频率,按照该频率发射红外控制指令到红外控制电器520,红外控制电器520中设有红外接收单元,红外接收单元相应控制指令驱动红外控制电器520运行相应的功能。
二、装置实施例
图4是本发明中一种基于语音识别的红外控制系统实施例逻辑连接流程示意图,请参考图4,一种基于语音识别的红外控制系统,包括:
红外遥控装置510:与红外控制电器520通过红外控制方式通信连接,用于识别用户发出的语音信号,并对语音信号进行识别判断,识别失败后请求用户重新发出语音信号,发出红外控制指令到红外控制电器520。
通信单元530:与红外遥控装置510连接,用于连接云服务器540或智能终端550,实时更新红外控制电器520控制指令列表。
电源560:通过电源560线与红外遥控装置510连接,用于对红外遥控装置510供电。
红外控制电器520:与红外遥控装置510通过红外技术进行通信连接,用于接收红外遥控装置510的控制指令,响应控制指令,运行相应的功能。
图5是本发明中一种基于语音识别的红外控制系统中红外遥控装置510实施例的逻辑连接示意图,请参考图5,红外遥控装置510包括:
语音接收单元511:与MCU513连接,用于接收用户语音信号,并将语音信号转换成电信号传输到MCU513中进行识别;
语音输出单元512:与MCU513连接,用于输出语音信号识别判断结果,告知用户是否重新发出语音信号;
MCU513:用于根据识别算法以及语音检测算法对用户语音信号进行识别,并对各种红外控制电器520的控制词列表进行存储;
多路红外发射单元514:与MCU513连接,用于发出控制指令到相应的红外控制电器520。
图6是本发明中一种基于语音识别的红外控制系统中控制指令传输实施例示意图,请参考图6,MCU513包括:
自动识别单元5131:与闪存5132连接,用于对接收到的语音信号进行识别判断,从语音信号中识别出红外控制电器520名称,并根据红外控制电器520名称从闪存5132的控制词列表中获取相应红外控制电器520的控制指令;
闪存5132:与自动识别单元5131连接,用于存储各种红外控制电器520控制指令列表。
根据本发明的一种基于语音识别的红外控制系统,红外控制电器520包括:
红外接收单元:通过红外通信技术与红外发射单元通信连接,用于接收控制指令,并驱动红外控制电器520响应控制指令,运行相应的功能。
根据本发明的一种基于语音识别的红外控制系统,红外控制系统还包括:
云服务器540:与通信单元530通信连接,用于对闪存5132中的控制指令列表进行实时更新。
针对现有的家用电器的遥控器繁多、放置不方便以及智能遥控器不易操作的问题,提出一种家庭使用的基于语音识别的红外控制方法及系统,系统包括红外遥控装置510、红外控制电器520、智能终端550或云服务器540、电源560以及通信单元530;红外遥控装置510通过红外射频技术向红外控制电器520传输控制指令,红外遥控装置510通过通信单元530连接智能终端550或远程云服务器540,红外遥控装置510采用自动语音识别,用户发出语音,红外遥控装置510中接收后,首先根据语音识别算法对用户语音进行识别,并对红外控制电器520的状态进行判断,根据识别出来的控制指令判断是对红外控制电器520进行唤醒或驱动红外控制电器520运行相应的功能;控制指令由多路红外发射单元514发出,不同的电器对应不同的发射频率。用户输出语音就可以实现对家用电器的有效控制。红外遥控装置510中的通信单元530还可以连接智能终端550或通过互联网连接远程云服务器540,对存储在MCU513闪存5132中的控制词列表进行实时更新,这样即使红外控制电器520更新后,仍能通过红外遥控装置510对红外控制电器520进行有效控制,本发明中的基于语音识别的红外控制方法及系统,使一部分对智能手机不能熟练操作的人或身体不便的人顺利地控制家用电器,为他们的生活提供了极大的便利,具有广泛的推广价值。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于语音识别的红外控制方法,其特征在于,采用与红外控制电器(520)红外通信连接的红外遥控装置(510)、与所述红外遥控装置(510)连接用于连接云服务器(540)或智能终端(550)的通信单元(530),所述红外遥控装置(510)包括语音接收单元(511)、语音输出单元(512)、MCU(513)以及多路红外发射单元(514);
所述红外控制方法包括以下步骤:
将红外控制电器(520)对应的名称和控制指令组成的控制词列表按照名称分别存储到MCU(513)的闪存中,并通过通信单元(530)连接智能终端(550)或云服务器(540)对所述控制词列表进行实时更新;
对来自语音接收单元(511)的用户语音进行识别;
若识别出用户语音同时包含所述某一红外控制电器(520)控制列表中的名称和控制指令,则生成红外控制命令,
若识别出用户语音只包含控制指令,如控制词适合当前红外控制电器(520),则生成当前控制电器名称和控制指令的红外控制命令;
若识别出用户语音只包含所述红外控制电器(520)名称,如所对应红外控制电器(520)处于休息中则生成唤醒该红外控制电器(520)处于待命中的红外控制命令;
若否,则通过语音输出单元(512)告知用户语音识别失败,请求用户重新给出语音控制指令;
由所述红外发射单元(514)发送已经生成的红外控制命令。
2.根据权利要求1所述的一种基于语音识别的红外控制方法,其特征在于,所述对来自语音接收单元(511)的用户语音进行识别,包括:
所述自动识别单元(5131)接收到用户语音信号后,利用将短时能量和过零率分别确定为上下门限的双门限端点检测方法,对所述语音信号进行检测;
对所述语音信号进行噪声消除和特征提取;
对所述语音信号进行声纹识别;
所述自动识别单元(5131)根据从所述语音信号提出的语音特征、语音识别资源库以及声纹识别特征识别出所述语音信号中的红外控制电器(520)名称;
根据所述红外控制电器(520)名称调出对应的红外控制电器(520)的控制指令。
3.根据权利要求2所述的一种基于语音识别的红外控制方法,其特征在于,所述端点检测方法为利用过零率检测清音,用短时能量检测浊音,两者配合的语音检测方法。
4.根据权利要求2所述的一种基于语音识别的红外控制方法,其特征在于,对所述语音信号进行声纹识别,包括:
通过对家居中家庭成员的声纹特征进行注册,获取所有家庭成员的声纹模型;
接收到所述语音信号后,利用双门限端点检测法对所述语音信号的声纹特征进行检测;
消除声纹噪声,对提取到的所述语音信号的声纹特征进行声纹确认和声纹鉴别;
根据声纹模型对所述声纹特征内容进行声纹匹配,并对匹配结果进行置信评分,并根据评分结果确定最终的声纹识别结果。
5.一种基于语音识别的红外控制系统,其特征在于,包括:
红外遥控装置(510):与红外控制电器(520)通过红外控制方式通信连接,用于识别用户发出的语音信号,并对语音信号进行识别判断,识别失败后请求用户重新发出语音信号,发出红外控制指令到红外控制电器(520);
通信单元(530):与所述红外遥控装置(510)连接,用于连接云服务器(540)或智能终端(550),通过所述云服务器(540)或智能终端(550)实时在线更新红外控制电器(520)控制指令列表;
电源(560):通过电源(560)线与所述红外遥控装置(510)连接,用于对所述红外遥控装置(510)供电;
红外控制电器(520):与所述红外遥控装置(510)通过红外技术进行通信连接,用于接收红外遥控装置(510)的控制指令,响应所述控制指令,运行相应的功能。
6.根据权利要求5所述的一种基于语音识别的红外控制系统,其特征在于,所述红外遥控装置(510)包括:
语音接收单元(511):与MCU(513)连接,用于接收用户语音信号,并将所述语音信号转换成电信号传输到所述MCU(513)中进行识别;
语音输出单元(512):与所述MCU(513)连接,用于输出语音信号识别判断结果,告知用户是否重新发出语音信号;
MCU(513):用于根据识别算法以及语音检测算法对用户语音信号进行识别,并对各种红外控制电器(520)的控制词列表进行存储;
多路红外发射单元(514):与所述MCU(513)连接,用于发出控制指令到相应的红外控制电器(520)。
7.根据权利要求6所述的一种基于语音识别的红外控制系统,其特征在于,所述MCU(513)包括:
自动识别单元(5131):与闪存(5132)连接,用于对接收到的语音信号进行识别判断,从所述语音信号中识别出红外控制电器(520)名称,并根据所述红外控制电器(520)名称从所述闪存(5132)的控制词列表中获取相应红外控制电器(520)的控制指令;
闪存(5132):与所述自动识别单元(5131)连接,用于存储各种红外控制电器(520)控制指令列表。
8.根据权利要求5所述的一种基于语音识别的红外控制系统,其特征在于,所述红外控制电器(520)包括:
红外接收单元:通过红外通信技术与所述红外发射单元通信连接,用于接收控制指令,并驱动红外控制电器(520)响应控制指令,运行相应的功能。
9.根据权利要求5所述的一种基于语音识别的红外控制系统,其特征在于,所述红外控制系统还包括:
云服务器(540):与所述通信单元(530)通信连接,用于对所述闪存(5132)中的控制指令列表进行实时更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710071698.XA CN108417008A (zh) | 2017-02-09 | 2017-02-09 | 基于语音识别的红外控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710071698.XA CN108417008A (zh) | 2017-02-09 | 2017-02-09 | 基于语音识别的红外控制方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108417008A true CN108417008A (zh) | 2018-08-17 |
Family
ID=63125076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710071698.XA Withdrawn CN108417008A (zh) | 2017-02-09 | 2017-02-09 | 基于语音识别的红外控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108417008A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109410560A (zh) * | 2018-12-24 | 2019-03-01 | 西藏大学 | 一种多家用电器语音遥控系统及其遥控方法 |
CN110070863A (zh) * | 2019-03-11 | 2019-07-30 | 华为技术有限公司 | 一种语音控制方法及装置 |
CN110827834A (zh) * | 2019-11-11 | 2020-02-21 | 广州国音智能科技有限公司 | 声纹注册方法、系统及计算机可读存储介质 |
CN117253492A (zh) * | 2023-11-17 | 2023-12-19 | 深圳超然科技股份有限公司 | 基于声纹识别的遥控方法、装置、智能电器系统、介质 |
-
2017
- 2017-02-09 CN CN201710071698.XA patent/CN108417008A/zh not_active Withdrawn
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109410560A (zh) * | 2018-12-24 | 2019-03-01 | 西藏大学 | 一种多家用电器语音遥控系统及其遥控方法 |
CN110070863A (zh) * | 2019-03-11 | 2019-07-30 | 华为技术有限公司 | 一种语音控制方法及装置 |
CN110827834A (zh) * | 2019-11-11 | 2020-02-21 | 广州国音智能科技有限公司 | 声纹注册方法、系统及计算机可读存储介质 |
CN110827834B (zh) * | 2019-11-11 | 2022-07-12 | 广州国音智能科技有限公司 | 声纹注册方法、系统及计算机可读存储介质 |
CN117253492A (zh) * | 2023-11-17 | 2023-12-19 | 深圳超然科技股份有限公司 | 基于声纹识别的遥控方法、装置、智能电器系统、介质 |
CN117253492B (zh) * | 2023-11-17 | 2024-04-02 | 深圳超然科技股份有限公司 | 基于声纹识别的遥控方法、装置、智能电器系统、介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN206097455U (zh) | 一种语音识别控制设备 | |
EP2956837B1 (en) | Waking other devices for additional data | |
CN108417008A (zh) | 基于语音识别的红外控制方法及系统 | |
CN107339786B (zh) | 一种空调、调控空调扬声器播报音量的系统及方法 | |
CN106249614A (zh) | 智能终端、智能家居系统、语音识别方法及下单方法 | |
CN105185378A (zh) | 声控方法、声控系统及能够进行声控的空调 | |
CN105892324A (zh) | 控制设备、方法及电器系统 | |
CN105407020A (zh) | 一种基于无线远程控制技术的智能家居系统 | |
CN108592349A (zh) | 一种空调控制系统 | |
CN109360558A (zh) | 一种语音应答的方法和设备 | |
CN112735403B (zh) | 一种基于智能音响的智能家居控制系统 | |
CN107942690A (zh) | 一种控制家电的智能系统及基于该系统的控制方法 | |
CN106228989A (zh) | 一种语音交互识别控制方法 | |
CN113506420A (zh) | 一种智能家居人工智能控制系统 | |
CN112837526A (zh) | 通用集成遥控方法、控制装置及通用集成遥控装置 | |
CN206057845U (zh) | 智能终端、智能家居系统 | |
CN113674738A (zh) | 一种全屋分布式语音的系统和方法 | |
WO2018023515A1 (zh) | 一种手势及情感识别家居控制系统 | |
CN113012694A (zh) | 一种轻生活语音识别控制系统 | |
WO2018023514A1 (zh) | 一种家居背景音乐控制系统 | |
CN106297783A (zh) | 一种语音交互识别智能终端 | |
CN210323805U (zh) | 一种智能家居管家系统 | |
WO2018023518A1 (zh) | 一种语音交互识别智能终端 | |
CN106251866A (zh) | 一种语音控制音乐网络播放装置 | |
JP2973311B1 (ja) | リモコン装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180817 |
|
WW01 | Invention patent application withdrawn after publication |