CN110164449A - 语音识别的空调机控制方法及装置 - Google Patents

语音识别的空调机控制方法及装置 Download PDF

Info

Publication number
CN110164449A
CN110164449A CN201910342835.8A CN201910342835A CN110164449A CN 110164449 A CN110164449 A CN 110164449A CN 201910342835 A CN201910342835 A CN 201910342835A CN 110164449 A CN110164449 A CN 110164449A
Authority
CN
China
Prior art keywords
voice messaging
speech recognition
air conditioner
segment
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910342835.8A
Other languages
English (en)
Other versions
CN110164449B (zh
Inventor
吴立智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Bo Bo Intelligent Technology Co Ltd
Anhui Meibo Intelligent Technology Co Ltd
Original Assignee
Anhui Bo Bo Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Bo Bo Intelligent Technology Co Ltd filed Critical Anhui Bo Bo Intelligent Technology Co Ltd
Priority to CN201910342835.8A priority Critical patent/CN110164449B/zh
Publication of CN110164449A publication Critical patent/CN110164449A/zh
Application granted granted Critical
Publication of CN110164449B publication Critical patent/CN110164449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • F24F11/63Electronic processing
    • F24F11/64Electronic processing using pre-stored data
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/88Electrical aspects, e.g. circuits
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/89Arrangement or mounting of control or safety devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明涉及语音识别的空调机控制方法及系统,包括以下步骤:101、获取采集的语音信息;102、将所述语音信息进行预处理;103、将预处理后的所述语音信息转化为文本文档;104、将所述文本文档进行断句,分成名词片段和动词片段的组合形式,将所述名词片段在特定数据库进行查表匹配;105、将匹配后的新名词片段进行组合,获得组合语音信息,通过所述组合语音信息确定组合语意信息;106、将所述组合语意信息作为语音识别结果调用相应的控制程序进行控制操作,之后回到步骤101;若无相应的控制程序可调用,则直接回到步骤101。本方案略去多余的动词片段,采用特定数据库进行查表匹配,使语音识别的精确度较大的提高,能够真正使人们在使用空调时感受到便利。

Description

语音识别的空调机控制方法及装置
技术领域
本发明涉及语音识别领域,尤其涉及语音识别的空调机控制方法及装置。
背景技术
随着社会的进步,人们的生活水平提高,人们对于生活质量的追求也越来越高,在炎热的夏天,空调无疑给人们的生活带来了舒适。
现有空调通常是遥控控制,这种方式控制起来比较麻烦,而且对于一些行动不便的人,去获取遥控器可能也是一件难事;也有少数一些企业采用语音识别的方式进行空调控制,但语音识别的精度不够高,这样一来能够适用的人群就比较少,推广起来也就相对困难,无法让人们完全体验到语音识别的便利。
当今市场急需一种识别精度较高的语音识别的空调机及相应的控制方法,能够较高精度地对空调进行语音控制,给人们的生活带来便利。
发明内容
本发明的目的是解决现有技术的不足,提供语音识别的空调机控制方法及装置,能够较高精度地对空调进行语音控制,给人们带来便利。
为了实现上述目的,本发明采用以下的技术方案:提出语音识别的空调机控制方法,包括以下步骤:
101、获取采集的语音信息;
102、将所述语音信息进行预处理;
103、将预处理后的所述语音信息转化为文本文档;
104、将所述文本文档进行断句,分成名词片段和动词片段的组合形式,将所述名词片段在特定数据库进行查表匹配;
105、将匹配后的新名词片段进行组合,获得组合语音信息,通过所述组合语音信息确定组合语意信息;
106、将所述组合语意信息作为语音识别结果调用相应的控制程序进行控制操作,之后回到步骤101;若无相应的控制程序可调用,则直接回到步骤101。
进一步地,所述的预处理包括以下步骤:
201、采用带通滤波器对所述语音信息进行滤波处理;
202、将滤波处理后的所述语音信息进行A/D转换;
203、将A/D转换后的所述语音信息进行预加重处理;
204、将预加重处理后的所述语音信息进行分帧加窗处理。
进一步地,将预处理后的所述语音信息转化为文本文档包括以下步骤
301、将分帧加窗处理后的所述语音信息进行离散傅里叶变换,之后进行Mel滤波;
302、将Mel滤波后的所述语音信息进行离散余弦变换,之后进行能量与差分处理获得所述语音信息的MFCC参数向量;
303、根据所述语音信息的MFCC参数向量提取特征并形成相应的文本文档。
进一步地,所述特定数据库包括重点部分以及普通部分,所述重点部分为空调产品对应的所有遥控器上的按键所包含的名词信息,所述普通部分为除所述重点部分外的其他名词信息的词典。
进一步地,在进行所述查表匹配操作时,优先进行将所述名词片段与所述重点部分的匹配,接着进行将所述名词片段中未识别的片段与所述普通部分的匹配。
进一步地,在步骤101中的获取语音信息的预设时长为30s-40s。
语音识别的空调机控制装置,所述语音识别的空调机控制装置包括:安装于空调机上的语音接收模块、存储模块、语音识别模块、处理模块;
所述语音接收模块用于接收用户的语音信息;
所述存储模块用于所述特定数据库的信息、采集到的语音信息、语音信息转化后的文本文档以及控制程序;
所述语音识别模块用于进行对采集到的语音信息进行语音识别;
所述处理模块用于控制整个装置的运行。
进一步地,所述语音识别的空调机控制装置还包括返回模块,用于在确定了组合语音信息却无相应的控制程序可调用时返回步骤101。
本发明的有益效果为:本发明首先将采集到的语音信息进过一系列的预处理后生成文本文档,之后对生成的文本文档进行断句,因为空调的语音调用,往往仅仅需要识别名词,所以将生成的文本文档中的名词片段提取出来,在特定数据库进行查表匹配,最后对匹配的结果进行控制程序的调用。通过在声音采集的时候就进行精确度的把控,并略去多余的动词片段,还采用特定数据库进行查表匹配,使整个过程使语音识别的精确度得到较大的提高,能够真正使人们在使用空调时感受到便利。
附图说明
图1所示为语音识别的空调机控制方法流程图;
图2所示为语音识别的空调机的预处理过程流程图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。附图中各处使用的相同的附图标记指示相同或相似的部分。
图1所示为语音识别的空调机控制方法。包括以下步骤:
101、获取采集的语音信息;
语音信号采集是语音信号处理的前提。语音通常通过话筒输入计算机。话筒将声波转换为电压信号,然后通过A/D装置(如声卡)进行采样,从而将连续的电压信号转换为计算机能够处理的数字信号。
目前多媒体计算机已经非常普及,声卡、音箱、话筒等已是个人计算机的基本设备。其中声卡是计算机对语音信进行加工的重要部件,它具有对信号滤波、放大、A/D和D/A转换等功能。而且,现代操作系统都附带录音软件,通过它可以驱动声卡采集语音信号并保存为语音文件。
对于现场环境不好,或者空间受到限制,特别是对于许多专用设备,目前广泛采用基于单片机、DSP芯片的语音信号采集与处理系统。
102、将所述语音信息进行预处理;
103、将预处理后的所述语音信息转化为文本文档;
104、将所述文本文档进行断句,分成名词片段和动词片段的组合形式,将所述名词片段在特定数据库进行查表匹配;
105、将匹配后的新名词片段进行组合,获得组合语音信息,通过所述组合语音信息确定组合语意信息;
106、将所述组合语意信息作为语音识别结果调用相应的控制程序进行控制操作,之后回到步骤101;若无相应的控制程序可调用,则直接回到步骤101。
进一步地,结合图2所述的预处理包括以下步骤:
201、采用带通滤波器对所述语音信息进行滤波处理;滤波的目的有两个:一是抑制输入信号中频率超出A/2的所有分量(A:为采样频率),以防止混叠干扰;二是抑制50Hz的电源工频干扰。因此,滤波器应该是一个带通滤波器。
202、将滤波处理后的所述语音信息进行A/D转换;
203、将A/D转换后的所述语音信息进行预加重处理;根据预加重的性质,可以通过一个一阶的高通滤波器来实现,在时域输入信号x[n]并且给定一个b值0.85≤b≤1.0,则相应的滤波器为y[n]=x[n]-bx[n-1];在频域则表示为H(z)=1-a*z-1
204、将预加重处理后的所述语音信息进行分帧加窗处理。
日常生活中的声音一般是非平稳信号,其统计特性不是固定不变的,但在一段相当短的时间内,可以认为信号时平稳的,这就是加窗。窗由三个参数来描述:窗长(单位毫秒)、偏移和形状。每一个加窗的声音信号叫做一帧,每一帧的毫秒数叫做帧长,相邻两帧左边界的距离叫帧移。
从信号s[n]中提取一帧的过程可表示为y[n]=w[n]s[n],如果w[n]是矩形窗,则信号会在边界处切断,这些不连续会对傅里叶分析造成影响。因此本方案采用边缘平滑降到0的汉明窗,表达式如下:
进一步地,将预处理后的所述语音信息转化为文本文档包括以下步骤
301、将分帧加窗处理后的所述语音信息进行离散傅里叶变换,之后进行Mel滤波;
302、将Mel滤波后的所述语音信息进行离散余弦变换,之后进行能量与差分处理获得所述语音信息的MFCC参数向量;
303、根据所述语音信息的MFCC参数向量提取特征并形成相应的文本文档。通过采用现有成熟的Mel滤波、倒谱、能量与差分的方式来获取声音信息的MFCC参数向量,进而提取特征形成文本文档的形式,在一定程度上提升了生成文本文档的准确度。
进一步地,所述特定数据库包括重点部分以及普通部分,所述重点部分为空调产品对应的所有遥控器上的按键所包含的名词信息,所述普通部分为除所述重点部分外的其他名词信息的词典。
进一步地,在进行所述查表匹配操作时,优先进行将所述名词片段与所述重点部分的匹配,接着进行将所述名词片段中未识别的片段与所述普通部分的匹配。
结合生活中那些文化程度不高的人群,他们一般学习东西的方式都是通过眼睛看到的然后去询问他人,或是从他人时常说的话来进行相应的学习,因为刚买了一个东西的话尤其是语音控制的空调这样的“大件”,往往好奇心较重,一般会去研究机械遥控器,然后才会向他人学习如何使用智能语音功能,这样一来教他们的人也可以通过遥控器这样一个眼睛能够看到的实体并结合从前使用遥控器的经验来告诉他们如何进行语音控制,这样一来二去,人们就会对遥控器上的名词信息十分熟悉,每次控制的时候也就会自觉的以遥控器上的名词作为标准,这样一来遥控器上的名词出现识别的频率就会非常高,如果将遥控器上的名字作为重点识别对象的话也会收到非常好的效果。
进一步地,在步骤101中的获取语音信息的预设时长为30s-40s。通过设置一定时间的获取语音信息的过程,防止人们话没说完就开始识别了,在一定程度上增加用户良好体验。
语音识别的空调机控制装置,所述语音识别的空调机控制装置包括:安装于空调机上的语音接收模块、存储模块、语音识别模块、处理模块;
所述语音接收模块用于接收用户的语音信息;
所述存储模块用于所述特定数据库的信息、采集到的语音信息、语音信息转化后的文本文档以及控制程序;
所述语音识别模块用于进行对采集到的语音信息进行语音识别;
所述处理模块用于控制整个装置的运行。
进一步地,所述语音识别的空调机控制装置还包括返回模块,用于在确定了组合语音信息却无相应的控制程序可调用时返回步骤101。
尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。

Claims (8)

1.语音识别的空调机控制方法,其特征在于,包括以下步骤:
101、获取采集的语音信息;
102、将所述语音信息进行预处理;
103、将预处理后的所述语音信息转化为文本文档;
104、将所述文本文档进行断句,分成名词片段和动词片段的组合形式,将所述名词片段在特定数据库进行查表匹配;
105、将匹配后的新名词片段进行组合,获得组合语音信息,通过所述组合语音信息确定组合语意信息;
106、将所述组合语意信息作为语音识别结果调用相应的控制程序进行控制操作,之后回到步骤101;若无相应的控制程序可调用,则直接回到步骤101。
2.根据权利要求1所述的语音识别的空调机控制方法,其特征在于,所述的预处理包括以下步骤:
201、采用带通滤波器对所述语音信息进行滤波处理;
202、将滤波处理后的所述语音信息进行A/D转换;
203、将A/D转换后的所述语音信息进行预加重处理;
204、将预加重处理后的所述语音信息进行分帧加窗处理。
3.根据权利要求2所述的语音识别的空调机控制方法,其特征在于,将预处理后的所述语音信息转化为文本文档包括以下步骤
301、将分帧加窗处理后的所述语音信息进行离散傅里叶变换,之后进行Mel滤波;
302、将Mel滤波后的所述语音信息进行离散余弦变换,之后进行能量与差分处理获得所述语音信息的MFCC参数向量;
303、根据所述语音信息的MFCC参数向量提取特征并形成相应的文本文档。
4.根据权利要求1所述的语音识别的空调机控制方法,其特征在于,所述特定数据库包括重点部分以及普通部分,所述重点部分为空调产品对应的所有遥控器上的按键所包含的名词信息,所述普通部分为除所述重点部分外的其他名词信息的词典。
5.根据权利要求4所述的语音识别的空调机控制方法,其特征在于,在进行所述查表匹配操作时,优先进行将所述名词片段与所述重点部分的匹配,接着进行将所述名词片段中未识别的片段与所述普通部分的匹配。
6.根据权利要求1所述的语音识别的空调机控制方法,其特征在于,在步骤101中的获取语音信息的预设时长为30s-40s。
7.语音识别的空调机控制装置,其特征在于,所述语音识别的空调机控制装置包括:安装于空调机上的语音接收模块、存储模块、语音识别模块、处理模块;
所述语音接收模块用于接收用户的语音信息;
所述存储模块用于所述特定数据库的信息、采集到的语音信息、语音信息转化后的文本文档以及控制程序;
所述语音识别模块用于进行对采集到的语音信息进行语音识别;
所述处理模块用于控制整个装置的运行。
8.根据权利要求1所述的语音识别的空调机控制装置,其特征在于,所述语音识别的空调机控制装置还包括返回模块,用于在确定了组合语音信息却无相应的控制程序可调用时返回步骤101。
CN201910342835.8A 2019-04-26 2019-04-26 语音识别的空调机控制方法及装置 Active CN110164449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910342835.8A CN110164449B (zh) 2019-04-26 2019-04-26 语音识别的空调机控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910342835.8A CN110164449B (zh) 2019-04-26 2019-04-26 语音识别的空调机控制方法及装置

Publications (2)

Publication Number Publication Date
CN110164449A true CN110164449A (zh) 2019-08-23
CN110164449B CN110164449B (zh) 2021-09-24

Family

ID=67640241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910342835.8A Active CN110164449B (zh) 2019-04-26 2019-04-26 语音识别的空调机控制方法及装置

Country Status (1)

Country Link
CN (1) CN110164449B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112927687A (zh) * 2021-01-25 2021-06-08 珠海格力电器股份有限公司 设备的功能控制方法、装置、系统和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1666254A (zh) * 2002-06-28 2005-09-07 T-移动网德国有限公司 基于生成转换/短语结构语法的自然语音识别方法
JP4412504B2 (ja) * 2007-04-17 2010-02-10 本田技研工業株式会社 音声認識装置、音声認識方法、及び音声認識用プログラム
CN102708205A (zh) * 2012-05-21 2012-10-03 徐文和 一种供机器运用语言规律识别语言信息的方法
CN105827504A (zh) * 2015-11-30 2016-08-03 维沃移动通信有限公司 一种语音信息的传输方法、移动终端和系统
CN106205606A (zh) * 2016-08-15 2016-12-07 南京邮电大学 一种基于语音识别的动态定位监控方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1666254A (zh) * 2002-06-28 2005-09-07 T-移动网德国有限公司 基于生成转换/短语结构语法的自然语音识别方法
JP4412504B2 (ja) * 2007-04-17 2010-02-10 本田技研工業株式会社 音声認識装置、音声認識方法、及び音声認識用プログラム
CN102708205A (zh) * 2012-05-21 2012-10-03 徐文和 一种供机器运用语言规律识别语言信息的方法
CN105827504A (zh) * 2015-11-30 2016-08-03 维沃移动通信有限公司 一种语音信息的传输方法、移动终端和系统
CN106205606A (zh) * 2016-08-15 2016-12-07 南京邮电大学 一种基于语音识别的动态定位监控方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112927687A (zh) * 2021-01-25 2021-06-08 珠海格力电器股份有限公司 设备的功能控制方法、装置、系统和存储介质

Also Published As

Publication number Publication date
CN110164449B (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN107945790B (zh) 一种情感识别方法和情感识别系统
CN102543073B (zh) 一种沪语语音识别信息处理方法
CN109215665A (zh) 一种基于3d卷积神经网络的声纹识别方法
CN104575504A (zh) 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN105679312B (zh) 一种噪声环境下声纹识别的语音特征处理方法
CN109256150A (zh) 基于机器学习的语音情感识别系统及方法
CN102005070A (zh) 一种语音识别门禁系统
CN108198545B (zh) 一种基于小波变换的语音识别方法
CN105225672B (zh) 融合基频信息的双麦克风定向噪音抑制的系统及方法
CN109036437A (zh) 口音识别方法、装置、计算机装置及计算机可读存储介质
CN103943104A (zh) 一种语音信息识别的方法及终端设备
CN108564965B (zh) 一种抗噪语音识别系统
CN108597505A (zh) 语音识别方法、装置及终端设备
Mittal et al. Study of characteristics of aperiodicity in Noh voices
CN111326178A (zh) 基于卷积神经网络的多模态语音情感识别系统及方法
CN101930733B (zh) 一种用于语音情感识别的语音情感特征提取方法
CN107785028A (zh) 基于信号自相关的语音降噪方法及装置
CN106024010A (zh) 一种基于共振峰曲线的语音信号动态特征提取方法
CN110428853A (zh) 语音活性检测方法、语音活性检测装置以及电子设备
WO2019119279A1 (en) Method and apparatus for emotion recognition from speech
CN111554302A (zh) 基于声纹识别的策略调整方法、装置、终端及存储介质
CN106782609A (zh) 一种口语比对方法
Waghmare et al. Emotion recognition system from artificial marathi speech using MFCC and LDA techniques
CN110689887A (zh) 音频校验方法、装置、存储介质及电子设备
CN110164449A (zh) 语音识别的空调机控制方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant