CN117784632B - 一种基于离线语音识别的智能家居控制系统 - Google Patents
一种基于离线语音识别的智能家居控制系统 Download PDFInfo
- Publication number
- CN117784632B CN117784632B CN202410216744.0A CN202410216744A CN117784632B CN 117784632 B CN117784632 B CN 117784632B CN 202410216744 A CN202410216744 A CN 202410216744A CN 117784632 B CN117784632 B CN 117784632B
- Authority
- CN
- China
- Prior art keywords
- control
- module
- sub
- intelligent
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 claims abstract description 122
- 230000007613 environmental effect Effects 0.000 claims abstract description 30
- 230000005540 biological transmission Effects 0.000 claims abstract description 8
- 238000011156 evaluation Methods 0.000 claims description 65
- 238000006243 chemical reaction Methods 0.000 claims description 40
- 238000010586 diagram Methods 0.000 claims description 34
- 238000000605 extraction Methods 0.000 claims description 23
- 238000012216 screening Methods 0.000 claims description 20
- 230000011218 segmentation Effects 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 4
- QVFWZNCVPCJQOP-UHFFFAOYSA-N chloralodol Chemical compound CC(O)(C)CC(C)OC(O)C(Cl)(Cl)Cl QVFWZNCVPCJQOP-UHFFFAOYSA-N 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 19
- 230000009286 beneficial effect Effects 0.000 description 15
- 238000000034 method Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Selective Calling Equipment (AREA)
Abstract
本发明涉及语音识别技术领域,并具体公开了一种基于离线语音识别的智能家居控制系统,属于语音识别技术领域,包括:离线语音识别模块,用于在离线状态下获取预设分贝值范围内的环境音录音数据,并对环境音录音数据进行指令识别,获得用户发出的场景控制指令;互联互控传输模块,用于基于接收到场景控制指令的智能控制面板中的低频窄带通信模组,将场景控制指令转发至处于当前互联互通状态中的剩余智能控制面板,获得指令互联互通结果;家居互联控制模块,用于基于指令互联互通结果中所有智能控制面板最新接收到的场景控制指令,控制所有智能家居,获得智能家居控制结果;用以实现去中心化的离线语音识别控制全屋智能家居设备。
Description
技术领域
本发明涉及语音识别技术领域,特别涉及一种基于离线语音识别的智能家居控制系统。
背景技术
目前,基于语音输入指令控制智能家居已经在智能家居领域大有普及,为了适应智能家居控制的多种场景和提高用户体验,基于离线语音识别的智能家居控制技术也逐渐实现,且随着无线通信技术的发展,设备之间的互联互通技术也有所进步,现有的基于离线语音识别的智能家居控制技术多通过触控输入方式或语音输入方式在智能面板中输入控制指令,进而实现对智能家居设备的远程无线控制。
但是,现有的基于离线语音识别的智能家居控制系统多通过在单个智能面板中分别输入控制指令,进而实现一对一或一对多的智能家居控制,然而由于单个智能家居设备中搭载的通信模组或通信协议有限,因此,只能通过支持对应智能家居设备的通信模组或通信协议的智能面板对其进行控制。且由于单个智能面板仅仅通过现有的远程控制协议,其控制距离有限,难以基于单个面板实现对别墅或包含多个房间的控制场景中的所有智能家居设备的有效控制,进而导致现有的智能家居控制系统存在控制过度中心化、控制距离有限等问题。
因此,本发明提出了一种基于离线语音识别的智能家居控制系统。
发明内容
本发明提供一种基于离线语音识别的智能家居控制系统,用以采用都带有离线语音识别模块对环境音中的离线语音指令进行获取,即在智能控制面板本地进行语音识别和处理,无需依赖云端服务,并基于智能家居面板中搭载的低频窄带通信模组,实现智能控制面板之间的点对点通信(即互联互通),用户可以在对别墅或包含多个房间的控制场景中任意一个智能控制面板中输入语音控制指令,智能控制面板即可同步获取该语音控制指令,进而使得每个控制面板可以对在其控制范围内或可支持对应通信方式或通信协议的智能家居设备进行控制,即实现去中心化的离线语音识别控制全屋智能设备。
本发明提供一种基于离线语音识别的智能家居控制系统,包括:
离线语音识别模块,用于在离线状态下获取预设分贝值范围内的环境音录音数据,并对环境音录音数据进行指令识别,获得用户发出的场景控制指令;
互联互控传输模块,用于基于接收到场景控制指令的智能控制面板中的低频窄带通信模组,将场景控制指令转发至处于当前互联互通状态中的剩余智能控制面板,获得指令互联互通结果;
家居互联控制模块,用于基于指令互联互通结果中所有智能控制面板最新接收到的场景控制指令,控制所有智能家居,获得智能家居控制结果;
其中,离线语音识别模块内置于处于当前互联互通状态的所有智能控制面板中。
优选的,离线语音识别模块,包括:
语音提取模块,用于获取预设分贝值范围内的环境音录音数据,并对环境音录音数据进行语音提取,获得提取语音;
正确率预测模块,用于基于提取语音的声纹特征,预测出提取语音的离线识别正确率;
习惯分析模块,用于当离线识别正确率不小于预测正确率阈值时,则基于预设的自定义语义指令和大量历史语音控制指令分析出用户控制习惯;
文本提取模块,用于基于用户控制习惯对提取语音进行语义识别,获得场景控制指令。
优选的,语音提取模块,包括:
噪音频段确定子模块,用于获取预设分贝值范围内的环境音录音数据中声音信号的波形图,在波形图中识别出当前基础环境噪音的频段范围;
第一筛选子模块,用于将环境音录音数据中包含的当前基础环境噪音的频段范围内的部分声音数据删除,获得去噪环境音数据;
第二筛选子模块,用于将去噪环境音数据中包含的预设的人类语音频段范围内的部分声音数据,当作提取语音。
优选的,噪音频段确定子模块,包括:
相似判定单元,用于识别出波形图中的骤变幅值,基于骤变幅值将波形图划分为多个子波形,计算出所有子波形中任意两两子波形之间的相似度,并将相似度不小于相似度阈值的子波形组合为互为相似波形组;
波形整理单元,用于将包含相同波形的互为相似波形组进行去重汇总,获得至少一个相似波形组,并基于所有子波形在波形图中的时序,对相似波形组中包含的所有子波形进行排序,获得至少一个子波形序列;
规律程度计算单元,用于基于子波形序列中相邻子波形之间的时间间隔,计算出子波形序列的第一规律程度,并基于子波形序列中所有两两子波形之间的相似度,计算出子波形序列的第二规律程度;
噪音频段范围确定单元,用于将第一规律程度和第二规律程度中的最大值不小于规律程度阈值的子波形序列中包含的所有子波形构成的总频段范围,当作当前基础环境噪音的频段范围。
优选的,正确率预测模块,包括:
倒谱分析子模块,用于生成提取语音的梅尔倒谱系数特征图,基于梅尔倒谱系数特征图确定出多个梅尔倒谱系数变化向量;
特征提取子模块,用于将所有梅尔倒谱系数变化向量和所有短时能量和短时平均幅度差,作为提取语音的声纹特征;
模型运行子模块,用于将声纹特征输入至预设的识别正确率预测模型,获得提取语音的离线识别正确率。
优选的,家居互联控制模块,包括:
设备和指令确定子模块,用于基于指令互联互通结果中所有智能控制面板最新接收到的场景控制指令,确定出目标控制家居设备和每个目标控制家居设备的目标控制指令;
可控制面板确定子模块,用于基于每个目标控制家居设备和智能控制面板之间的专属控制通信方式,确定出可控制每个目标控制家居设备的智能控制面板,作为每个目标控制家居设备的可控制面板;
家居控制子模块,用于控制每个目标控制家居设备的可控制面板,执行对应目标控制家居设备的目标控制指令,获得智能家居控制结果。
优选的,可控制面板确定子模块,包括:
第一确定单元,用于将包含红外码模块和红外发射管的智能控制面板,当作控制专属通信方式为红外遥控通信方式的目标控制家居设备的可控制面板;
第二确定单元,用于将包含RF通信模组的智能控制面板,当作控制专属通信方式为基于RF通信模组的控制通信方式的目标控制家居设备的可控制面板;
其中,基于RF通信模组的控制通信方式的目标控制家居设备为包含RF通信模组的目标控制家居设备。
优选的,控制面板中的低频窄带通信模组为都基于LoRa 或 NB-IoT的低频窄带通信模组;
低频窄带通信模组中至少包含微控制器、存储器、通信接口。
优选的,文本提取模块,包括:
文本转换子模块,用于基于当前语音模式对提取语音进行文本转换,获得多个初始转换文本;
分词处理子模块,用于对初始转换文本进行分词处理,获得初始转换文本的词序列;
语法判断子模块,用于基于初始转换文本的词序列中每个词的词性,判断出初始转换文本中是否包含语法结构满足多种预设语法构造中的一种的语句,若是,则将初始转换文本中的对应语句判定为语法合格语句;
语义识别子模块,用于基于用户控制习惯,对所有初始转换文本中包含的语法合格语句进行语义识别,获得场景控制指令。
优选的,语义识别子模块,包括:
位置筛选单元,用于筛选出初始转换文本中相同语句位置的语法合格语句不止一个的语句位置,作为待判断语句位置;
词序对齐单元,用于将待判断语句位置的所有语法合格语句进行词序对齐,获得待判断语句位置的所有词序的多个待判断词;
词评价单元,用于基于待判断词在用户控制习惯中的控制指令词频列表中的词频,当作待判断词的可能性值,基于待判断语句位置的相同词序的所有待判断词的可能性值,计算出待判断语句位置的相同时序的每个待判断词的词评价值;
词频评价单元,用于将待判断语句位置的每个语法合格语句中所有待判断词的词评价值的均值,当作对应语法合格语句的词频评价值;
相邻共现评价单元,用于基于待判断语句位置的每个语法合格语句和用户控制习惯中的控制指令相邻共现列表,计算出对应语法合格语句的相邻共现评价值;
文本提取单元,用于基于待判断语句位置的每个语法合格语句的词频评价值和相邻共现评价值,在待判断语句位置的所有语法合格语句中提取出最终语义文本;
指令确定单元,用于基于最终语义文本对应的文本语义和初始转换文本中相同语句位置的语法合格语句只有一个的语句位置的文本语义,确定出场景控制指令。
本发明区别于现有技术的有益效果为:采用都带有离线语音识别模块对环境音中的离线语音指令进行获取,即在智能控制面板本地进行语音识别和处理,无需依赖云端服务,并基于智能家居面板中搭载的低频窄带通信模组,实现智能控制面板之间的点对点通信(即互联互通),用户可以在对别墅或包含多个房间的控制场景中任意一个智能控制面板中输入语音控制指令,智能控制面板即可同步获取该语音控制指令,进而使得每个控制面板可以对在其控制范围内或可支持对应通信方式或通信协议的智能家居设备进行控制,即实现去中心化的离线语音识别控制全屋智能设备。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在本申请文件中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中的一种基于离线语音识别的智能家居控制系统的内部功能模块示意图;
图2为本发明实施例中的家居互联控制模块的内部功能子模块示意图;
图3为本发明实施例中的可控制面板确定子模块的内部功能单元示意图;
图4为本发明实施例中的梅尔倒谱系数特征图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本发明提供了一种基于离线语音识别的智能家居控制系统,参考图1,包括:
离线语音识别模块,用于在离线状态下获取预设分贝值范围内的环境音录音数据,并对环境音录音数据进行指令识别,获得用户发出的场景控制指令;
互联互控传输模块,用于基于接收到场景控制指令的智能控制面板中的低频窄带通信模组,将场景控制指令转发至处于当前互联互通状态中的剩余智能控制面板,获得指令互联互通结果;
家居互联控制模块,用于基于指令互联互通结果中所有智能控制面板最新接收到的场景控制指令,控制所有智能家居,获得智能家居控制结果;
其中,离线语音识别模块内置于处于当前互联互通状态的所有智能控制面板中。
该实施例中的基于离线语音识别的智能家居控制系统是一个适合用于住宅、酒店、学校、商场、行政机构写字楼等场所,对日常灯光、空调、电器、办公设备进行便捷开关控制的系统;
这套系统是在传统的86开关基础上,加上可一对多、多对一互联互控的低频窄带通信模组,成为可互联互控的智能开关面板;所述可互联互控的智能开关面板既可灵活配对,按使用场景需要实现免布线的多功能互联互控,又能穿墙通信(最多可穿6堵墙,直线通信距离超过1.5公里);
由于使用可对码点对点无线通信的低频窄带通信技术,首次使用时可通过简单的设置配对,设置各种用户所需的场景模式,如“回家模式”(玄关灯点亮、客厅灯点亮、客厅空调打开、客厅窗帘打开、咖啡机启动等)、“离家模式”(所有照明灯具延时熄灯、空调关闭、窗帘关闭、咖啡机、茶吧机关闭等);也可设置“一楼教室全部关灯”、“二楼教室全部开灯”、“六年级空调全部打开”等场景模式,跟语音控制遥控器对码,实现便捷的控制;
由于低频窄带通信信号具有穿墙功能,可满足别墅或复式住宅的多点互控,如果距离遥远,还能通过中继器增强信号,实现全屋或全校控制;
在每个单一空间内,可用一个带有离线语音识别控制系统和低频窄带通信模组的语音控制器,实现人机对话和控制,所述语音控制器能通过低频窄带通信模组与所述可互联互控的智能开关面板进行点对点通信,即可通过语音对本空间内的电子电器产品进行控制,也可通过所述可互联互控的智能开关面板对其他空间内的所述可互联互控的智能开关面板进行控制;
由于所有已关联的所述可互联互控的智能开关面板的当前状态都会在所可互联互控的智能开关面板上同步显示出来,因此在每个已关联的所述可互联互控的智能开关面板上,都可以实现智能控制,因此本系统是真正的去中心化智能控制;
在所述带有离线语音识别控制系统和低频窄带通信模组的语音控制器上,加上带有红外遥控空调的红外码模块和红外发射管,即可通过离线语音识别方式控制本空间区域内的空调器的各种功能;
在所述带有离线语音识别控制系统和低频窄带通信模组的语音控制器上,加上RF通信模组,与同样带有RF通信模组的智能遥控窗帘对码后建立射频信号互联,即可通过离线语音识别方式控制该智能遥控窗帘的开关停功能;
在多个独立空间内对码使用所述带有离线语音识别控制系统和低频窄带通信模组的语音控制器,即可实现去中心化的离线语音识别控制全屋智能设备;
由于可通过场景化设置,将复杂的各种终端设备各种状态按照用户的需求在初次使用时设置好,以后用户在实际应用时,只需要说出应用场景的语音指令,如“晚餐模式”或“观影模式”,即可在瞬间完成复杂的设置。
由于所述的这套系统毋需借助互联网,全部在本地完成,而且具有各终端设备的互联互控功能,故称之为“微物联”。微物联具有稳定性、安全性等特征。
该实施例中,离线状态下表示离线语音识别模块无需依赖云端,可在本地完成离线语音的获取和指令识别过程。
该实施例中,场景控制指令为基于该实施例中的基于离线语义识别的智能家居控制系统对提取语音进行语义识别后确定出的用于对智能家居实现控制的指令。
该实施例中,环境音录音数据为录音设备和智能家居所在环境内的环境音的录音数据。
该实施例中,预设分贝值范围为预设的录音设备可以获取并录制到的声音的分贝值范围。
该实施例中,指令互联互通结果为:利用所有智能控制面板中的低频窄带通信模组,先接收到离线语音指令的智能控制面板将场景控制指令传输至剩余的智能控制面板中这一结果。
该实施例中,每个场景控制指令对应一种场景模式(一种场景模式可以包含对多种智能家居的多个控制指令,例如“会客模式”即为包含控制客厅主灯开启和控制走廊中控两路开关开启),控制所有智能家居(智能家居可以包含家居灯具或者其他家用电器,例如空调、换气扇、电动窗帘等;
在包含多个房间的控制场景中,其场景控制指令的场景模式可以为将二楼所有房间的灯关闭。
以上技术的有益效果为:采用都带有离线语音识别模块对环境音中的离线语音指令进行获取,即在智能控制面板本地进行语音识别和处理,无需依赖云端服务,并基于智能家居面板中搭载的低频窄带通信模组,实现智能控制面板之间的点对点通信(即互联互通),用户可以在对别墅或包含多个房间的控制场景中任意一个智能控制面板中输入语音控制指令,智能控制面板即可同步获取该语音控制指令,进而使得每个控制面板可以对在其控制范围内或可支持对应通信方式或通信协议的智能家居设备进行控制,即实现去中心化的离线语音识别控制全屋智能设备。
实施例2:
在实施例1的基础上,离线语音识别模块,包括:
语音提取模块,用于获取预设分贝值范围内的环境音录音数据,并对环境音录音数据进行语音提取,获得提取语音;
正确率预测模块,用于基于提取语音的声纹特征,预测出提取语音的离线识别正确率;
习惯分析模块,用于当离线识别正确率不小于预测正确率阈值时,则基于预设的自定义语义指令和大量历史语音控制指令分析出用户控制习惯;
文本提取模块,用于基于用户控制习惯对提取语音进行语义识别,获得场景控制指令。
该实施例中,提取语音为环境音录音数据中包含的人发出的语音数据。
该实施例中,声纹特征为提取语音声纹属性上的特征,例如有提取语音的所有梅尔倒谱系数变化向量和所有短时能量和短时平均幅度差。
该实施例中,提取语音的离线识别正确率为基于提取语音的声纹特征预测出的对该提取语音进行语义离线识别时的识别正确率。
该实施例中,预测正确率阈值为预设的判断是否可以对提取语音进行语义识别时参考的离线识别正确率的判断阈值。
该实施例中,自定义语义指令为用户输入的自定义的语义指令,例如,发出“hi”即为启动离线语音识别功能。
该实施例中,历史语音控制指令为用户之前输入至本实施例中的基于离线语音识别的智能家居控制系统的语音控制指令,此处的语音控制指令即为以语音方式输入的用于对智能家居实现控制的指令。
该实施例中,用户控制习惯为包含控制指令词频列表和控制指令相邻共现列表的信息。
该实施例中,场景控制指令为基于用户控制习惯可以对提取语音进行语义识别时可能存在的语义歧义进行选择,进而提高确定出的场景控制指令的准确度。
以上技术的有益效果为:基于声纹特征判断出语音的离线识别正确率,且只有在离线识别正确率不小于预测正确率阈值时才进一步地利用基于预设的自定义语义指令和大量历史语音控制指令分析出的用户控制习惯,对提取语音进行有侧重地识别,提高了语义识别出的控制指令的准确度,也提高了基于离线语音识别的智能家居控制准确度。
实施例3:
在实施例2的基础上,语音提取模块,包括:
噪音频段确定子模块,用于获取预设分贝值范围内的环境音录音数据中声音信号的波形图,在波形图中识别出当前基础环境噪音的频段范围;
第一筛选子模块,用于将环境音录音数据中包含的当前基础环境噪音的频段范围内的部分声音数据删除,获得去噪环境音数据;
第二筛选子模块,用于将去噪环境音数据中包含的预设的人类语音频段范围内的部分声音数据,当作提取语音。
该实施例中,声音信号的波形图又称振幅图,是音频的振幅(或能量)这个维度的图形表达。波形图的横坐标一般为时间,纵坐标一般为dB(即分贝)来表示。
该实施例中,当前基础环境噪音为环境中除了人发出的语音以外的声音数据。
该实施例中,频段范围为智能家居和录音设备当前所在环境内的基础噪音的频段范围,频段的单位为Hz。
该实施例中,去噪环境音数据为去除环境音录音数据中包含的当前基础环境音的频段范围内的部分声音数据后剩余的部分声音数据。
该实施例中,预设的人类语音频段范围为预设的人类语音的频段范围,例如250Hz~ 4KHz。
以上技术的有益效果为:实现了对直接获取的环境音录音数据中的当前基础环境噪音的删除以及在预设人类语音频段范围内的声音数据的提取,经过双重提取步骤初步获得经过去除环境音步骤后获得的用户输入的语音数据。
实施例4:
在实施例3的基础上,噪音频段确定子模块,包括:
相似判定单元,用于识别出波形图中的骤变幅值,基于骤变幅值将波形图划分为多个子波形,计算出所有子波形中任意两两子波形之间的相似度,并将相似度不小于相似度阈值的子波形组合为互为相似波形组;
波形整理单元,用于将包含相同波形的互为相似波形组进行去重汇总,获得至少一个相似波形组,并基于所有子波形在波形图中的时序,对相似波形组中包含的所有子波形进行排序,获得至少一个子波形序列;
规律程度计算单元,用于基于子波形序列中相邻子波形之间的时间间隔,计算出子波形序列的第一规律程度,并基于子波形序列中所有两两子波形之间的相似度,计算出子波形序列的第二规律程度;
噪音频段范围确定单元,用于将第一规律程度和第二规律程度中的最大值不小于规律程度阈值的子波形序列中包含的所有子波形构成的总频段范围,当作当前基础环境噪音的频段范围。
该实施例中,骤变幅值为波形图中的波形的纵坐标值骤变的点的纵坐标值(即为分贝值),如何判断其为骤变幅值通过如下方式:
对波形图从左到右识别,当当前还未出现骤变幅值时,则确定出波形图中当前出现的所有相邻幅值(即纵坐标值)之间的差值;
当波形图中存在一个点与相邻前一点之间的幅值差值不小于之前所有相邻幅值之间的差值中的最大值的n倍时,则将该点的幅值当作骤变幅值,当作当前已经出现过骤变幅值时,则确定出波形图中从上一个骤变幅值之后的所有相邻幅值之间的差值;
当波形图中从上一骤变幅值之后存在一个点与相邻前一点之间的幅值差值不小于波形图中从上一个骤变幅值之后的所有相邻幅值之间的差值中的最大值的n倍时,则将该点当作骤变幅值,其中,n为可以根据系统设计者设定,要尽量保证波形图中的骤变幅值的总数不小于波形图中所有幅值的总数的百分之一。
该实施例中,骤变幅值为波形图中相邻子波形之间的划分界限,其中,子波形即为波形图中包含的部分波形。
该实施例中,计算两两子波形之间的相似度的方法包括:
将两两子波形的横坐标进行对齐,并计算出对齐后的两个子波形中相同横坐标值的幅值之间的差值与均值之间的比值k,并将两个子波形所有横坐标值的比值k的均值当作两个子波形之间的偏差度,将1与两个子波形之间的偏差度的差值当作两个子波形之间的相似度。
该实施例中,相似度阈值为用于筛选出互为相似波形组时参考的两个波形之间的相似度的筛选阈值,其中相似度阈值为判定时需要满足的最小相似度。
该实施例中,互为相似波形组为包含相似度不小于相似度阈值的两个子波形的组合。
该实施例中,将包含相同波形的互为相似波形组进行去重汇总,获得至少一个相似波形组,例如互为相似波形组有:[a1,a2],[a2,a3],[a3,a4],则对着三个互为相似波形组去重汇总的结果为[a1,a2,a3,a4],其中a1,a2,a3,a4分别代表一个子波形。
该实施例中,子波形序列为包含相似波形组中的所有子波形并按照时序排序后获得的序列。
该实施例中,第一规律程度的具体计算方式为:
计算出子波形序列中所有相邻子波形之间的时间间隔的均值,并确定出所有时间间隔和均值之间的差值中的最大值,确定出最大值和时间间隔的均值之间的比值,将1与比值之间的差值当作子波形序列的第一规律程度,第一规律程度即为基于子波形序列中子波形之间的时间间隔分析出的表征子波形序列中的波形之间的规律程度的数值。
该实施例中,第二规律程度的具体计算方式为:
将子波形序列中所有两两子波形之间的相似度的均值当作子波形序列的第二规律程度,其中第二规律程度即为基于子波形序列中包含的子波形的幅值变化之间的相似程度分析出的表征子波形序列中的波形之间的规律程度的数值。
该实施例中,规律程度阈值为预设的用于在子波形序列中筛选出最终用于确定出当前基础环境噪音的频段范围的子波形时参考的规律程度的筛选阈值,规律程度阈值是在子波形被筛选出时需要满足的最小值。
该实施例中,总频段范围为将第一规律程度和第二规律程度中的最大值不小于规律程度阈值中包含的所有子波形的频段范围进行求并集后对应的频段范围。
以上技术的有益效果为:通过骤变幅值对波形图进行划分,并对基于相似度在划分后的子波形中筛选出相似波形组,并基于相似波形组筛选出疑似规律发出的声音数据的子波形序列,并通过时间间隔和幅值变化两个角度计算出的两种规律程度对子波形序列进行判断,进而最终筛选出规律程度较高的子波形序列作为疑似规律发出的声音(即当前基础环境噪音)对应的声音波形段,对确定出的疑似规律发出的声音(即当前基础环境噪音)对应的声音波形段的频段范围进行求并集最终确定出当前基础环境噪音的准确的频段范围。
实施例5:
在实施例2的基础上,正确率预测模块,参考图4,包括:
倒谱分析子模块,用于生成提取语音的梅尔倒谱系数特征图,基于梅尔倒谱系数特征图确定出多个梅尔倒谱系数变化向量;
特征提取子模块,用于将所有梅尔倒谱系数变化向量和所有短时能量和短时平均幅度差,作为提取语音的声纹特征;
模型运行子模块,用于将声纹特征输入至预设的识别正确率预测模型,获得提取语音的离线识别正确率。
该实施例中,梅尔倒谱系数特征图为对提取语音的线性声谱图应用mel滤波器后,取log,得到log梅尔声谱图,然后对log滤波能量(log梅尔声谱)做DCT离散余弦变换(傅里叶变换的一种),然后保留第2到第13个系数,得到的包含这12个系数的图像即为梅尔倒谱系数特征图,图4中每个数值点即为一个梅尔倒谱系数。
该实施例中,梅尔倒谱系数变化向量为将梅尔倒谱系数特征图中每个梅尔倒谱系数指向相邻后一梅尔倒谱系数的向量当作梅尔倒谱系数变化向量;
该实施例中,短时能量为提取语音时域上的波形中包含的所有样点值的加权平方值。
该实施例中,短时平均幅度差为提取语音时域上的波形中包含的所有样点值与间隔为k的样点值之间的幅值差的均值,其中k为提取语音的周期。
该实施例中,预设的识别正确率预测模型为预先利用大量声纹特征和对应的离线识别正确率作为样本训练出的模型,该模型可以基于输入的声纹特征判断出对应语音段的离线识别正确率。
以上技术的有益效果为:将提取语音的梅尔倒谱系数特征图中的所有梅尔倒谱系数变化向量和提取语音的所有短时能量和短时平均幅度差当作声纹特征,输入至预设的识别正确率预测模型,实现对提取语音的离线识别正确率的准确确定。
实施例6:
在实施例1的基础上,家居互联控制模块,参考图2,包括:
设备和指令确定子模块,用于基于指令互联互通结果中所有智能控制面板最新接收到的场景控制指令,确定出目标控制家居设备和每个目标控制家居设备的目标控制指令;
可控制面板确定子模块,用于基于每个目标控制家居设备和智能控制面板之间的专属控制通信方式,确定出可控制每个目标控制家居设备的智能控制面板,作为每个目标控制家居设备的可控制面板;
家居控制子模块,用于控制每个目标控制家居设备的可控制面板,执行对应目标控制家居设备的目标控制指令,获得智能家居控制结果。
该实施例中,目标控制家居设备为场景控制指令中涉及的需要进行控制的智能家居设备,例如照明灯或者空调等。
该实施例中,目标控制家居设备的目标控制指令,为:场景控制指令标识的需要对目标控制家居设备发出的控制指令,例如控制照明灯关闭等。
该实施例中,专属控制通信方式为:基于目标控制家居设备和单个智能家居控制面板中搭载的通信模组或通信协议,使得只可通过搭载有与对应目标控制家居设备相同的通信模组或通信协议的智能控制面板,控制对应智能家居设备。
该实施例中,可控制面板为搭载有与对应目标控制家居设备相同的通信模组或通信协议的智能控制面板,也是可以无线控制对应智能家居设备的智能控制面板。
以上技术的有益效果为:基于所有智能控制面板接收到的场景控制指令,以及基于每个目标控制家居设备和智能控制面板之间的专属控制通信方式确定出的每个目标控制家居设备的可控制面板,实现对覆盖大范围和远距离的控制场景下的所有智能家居设备的同步高效控制。
实施例7:
在实施例6的基础上,可控制面板确定子模块,参考图3,包括:
第一确定单元,用于将包含红外码模块和红外发射管的智能控制面板,当作控制专属通信方式为红外遥控通信方式的目标控制家居设备的可控制面板;
第二确定单元,用于将包含RF通信模组的智能控制面板,当作控制专属通信方式为基于RF通信模组的控制通信方式的目标控制家居设备的可控制面板;
其中,基于RF通信模组的控制通信方式的目标控制家居设备为包含RF通信模组的目标控制家居设备。
该实施例中, 红外码模块和红外发射管是一种配合使用的红外线红外发射和接收装置。它通常用于红外远程控制系统中,可以实现设备之间的非接触式通信和控制;
其中,红外码模块通常是一个集成有二维码编码的模块,它包含了编码和解码的功能,可以将一个特定的二维码编码信息通过红外线发射出去,并在一定距离内被接收并被解码。红外发射管则是用来发出红外线的装置,一般由红外光源和光学镜片组成,可以将光线聚焦成一股平行光束发射出去;
当红外码模块和红外发射管配合使用时,通常会将待发送的信息编码成一个特定的二维码图案,然后由红外发射管发射出去。在这个过程中,红外发射管会向接收端发射出一条包含信息的红外光束,这条光束会被接收并被解码,从而实现了设备之间的非接触式通信和控制。
该实施例中, RF(Radio Frequency)通信模组是一种广泛应用于物联网领域的无线通信模块,可以在不需要视觉接触的情况下实现设备间的通信和控制。它通常由天线、处理器、存储器、电源等部分组成,可以支持多种通信协议和频率范围,并且可以在恶劣的环境条件下长时间稳定工作;
RF通信模组通常具有以下特点:
无需可视线缆连接,可以直接安装在设备上,易于集成到现有的设备系统中;
可以实现远距离、高效率的数据传输,传输速率较快,抗干扰性强;
可以在不需要可见光的环境下工作,适用于暗处、遮挡等情况;
电池寿命长,能够在较长时间的使用过程中保持稳定的工作状态;
可以方便地进行软件升级和优化,以适应不断变化的应用需求;
RF通信模组在物联网领域有着广泛的应用,例如智能家居、工业自动化、智能交通、医疗健康等领域,可以为这些领域提供高效、可靠的无线通信解决方案。
以上技术的有益效果为:提供了智能控制面板和智能家居设备之间的两种具体的控制专属通信方式。
实施例8:
在实施例1的基础上,可智能控制面板中的低频窄带通信模组为都基于LoRa 或NB-IoT的低频窄带通信模组;
低频窄带通信模组中至少包含微控制器、存储器、通信接口。
该实施例中, 低频窄带通信模组中的微控制器是指一种专门用于处理低频窄带通信任务的微控制器。这种微控制器通常用于运行低频窄带通信协议和算法,并将处理结果转换为控制信号输出给其他器件,例如传感器、驱动电路等;
相较于传统的微控制器,低频窄带通信模组中的微控制器具有以下特点:
1. 专为低频窄带通信任务而优化,可以更有效地处理低频信号,并减少信号干扰的影响;
2. 集成了大量的通信协议和算法,简化了系统的开发难度;
3. 具有较低的功耗和较小的尺寸,可以更好地适应于电池供电的设备中;
4. 支持多种接口和外设,例如UART、SPI、I2C等,方便与其他器件进行通信;
5. 具有较高的可靠性和稳定性,可以更好地应对各种环境条件下的使用;
因此,低频窄带通信模组中的微控制器对于实现低频窄带通信系统的智能化和自动化具有重要意义,可以帮助实现更加高效、安全和可靠的通信和控制。
该实施例中,低频窄带通信模组中的存储器为 低频窄带通信模组中的存储器通常是专门用于存储系统软件和用户配置文件的,这些存储器可以为系统提供固件升级、故障诊断和恢复等功能,同时也可以存储用户定义的场景模式、定时任务和其他用户配置文件;
除了主存储器之外,有些低频窄带通信模组还配备了非易失性存储器(NVM),这是一种可以长期保存数据的只读存储器,NVM通常用于存储系统设置、用户定义的场景模式和定时任务等,可以防止数据在断电或系统重启时丢失;
为了保证存储器的数据安全性和可靠性,通常会在系统中加入错误检测和纠正机制,例如循环冗余校验(CRC)码或校验和等。这些机制可以检测到数据传输过程中的错误,并及时地进行更正,从而避免因为错误数据导致的系统异常或故障。
该实施例中,低频窄带通信模组中的通信接口的常见的通信接口类型:
1. UART(通用异步收发传输):UART是一种串行通信接口,可以在不同的工作电压和频率范围内工作,具有较高的兼容性和较低的成本。在低频窄带通信模组中,UART接口可以实现模组与中央控制系统或其他支持UART接口的外设之间的数据通信;
2. SPI(串行外设接口):SPI是一种高速串行通信协议,主要用于高性能和高速度的应用场合。SPI接口可以提高数据传输速率,并具有较强的抗干扰性能。在低频窄带通信模组中,SPI接口可用于实现模组与其他高速接口器件之间的通信;
3. I2C(集成电路总线):I2C是一种低成本的串行通信总线,广泛应用于各种电子产品中。I2C接口可以实现多路复用和多主控的总线通信,因此在低频窄带通信模组中有较好的应用前景。
以上技术的有益效果为:提供了低频窄带通信模组中包含的部分部件。
实施例9:
在实施例2的基础上,习惯分析模块,包括:
分词单元,用于当离线识别正确率不小于预测正确率阈值时,则对预设的自定义语义指令和大量历史语音控制指令进行分词处理,获得用户的控制指令习惯词群;
词频统计单元,用于统计出控制指令习惯词群中每个词在控制指令习惯词群中的词频,基于控制指令习惯词群中的所有词以及对应词在控制指令习惯词群中的词频,生成控制指令词频列表;
相邻共现统计单元,用于预设的自定义语义指令和大量历史语音控制指令中的所有相邻词,并统计出所有相邻词在预设的自定义语义指令和所有历史语音控制指令中的出现频率,基于所有相邻词以及对应相邻词在预设的自定义语义指令和所有历史语音控制指令中的出现频率,生成控制指令相邻共现列表;
用户习惯确定单元,用于将控制指令词频列表和控制指令相邻共现列表当作用户控制习惯。
该实施例中,分词处理采用的分词工具可以通过Jieba, SnowNLP, PkuSeg,THULAC, HanLP等现有的分词工具实现。
该实施例中,控制指令习惯词群为包含预设的自定义语义指令和大量历史语音控制指令中包含的所有分词结果的集群,其由大量词语构成,可能存在重复的词语。
该实施例中,词频为词在控制指令习惯词群中出现的次数。
该实施例中,控制指令词频列表为包含控制指令习惯词群中的所有词以及对应词在控制指令习惯词群中的词频的列表。
该实施例中,相邻词为在预设的自定义语义指令或历史语音控制指令中位置相邻的词语。
该实施例中,出现频率为该两个词在预设的自定义语义指令和所有历史语音控制指令中以相邻位置出现的总次数。
该实施例中,控制指令相邻共现列表为包含预设的自定义语义指令和大量历史语音控制指令中的所有相邻词以及对应相邻词在预设的自定义语义指令和所有历史语音控制指令中的出现频率的列表。
以上技术的有益效果为:通过对预设的自定义指令和大量历史语音控制指令中每个词的出现频率和每组相邻词的出现频率进行统计分析,获得控制指令词频列表和控制指令相邻共现列表作为用户控制习惯,实现从语音中的词的词频角度对用户发出的语音控制习惯的准确分析。
实施例10:
在实施例2的基础上,文本提取模块,包括:
文本转换子模块,用于基于当前语音模式对提取语音进行文本转换,获得多个初始转换文本;
分词处理子模块,用于对初始转换文本进行分词处理,获得初始转换文本的词序列;
语法判断子模块,用于基于初始转换文本的词序列中每个词的词性,判断出初始转换文本中是否包含语法结构满足多种预设语法构造中的一种的语句,若是,则将初始转换文本中的对应语句判定为语法合格语句;
语义识别子模块,用于基于用户控制习惯,对所有初始转换文本中包含的语法合格语句进行语义识别,获得场景控制指令。
该实施例中,当前语音模式,例如方言模式,根据用户所选的输入方言模式,例如四川方言模式。
该实施例中,初始转换文本为相似的多个拼音对应的不同的文字内容。
该实施例中,初始转换文本的词序列为依次包含初始转换文本中所有词的序列。
该实施例中,词性包含动词名词副词形容词等多种。
该实施例中,预设语法构造为指令语句中可能包含多种预设的词的词性顺序,例如:谓语+宾语。
该实施例中,语法合格语句为初始转换文本中包含的语法结构满足多种预设语法构造的语句。
以上技术的有益效果为:实现了基于设定语音模式对提取语音的语音模式侧重的文本转换,并实现对转换出的文本的分词处理和语法构造的判断,进而筛选出语法合格语句,实现对提取语音的精准文本转换和有效文本的进一步提取。
实施例11:
在实施例10的基础上,语义识别子模块,包括:
位置筛选单元,用于筛选出初始转换文本中相同语句位置的语法合格语句不止一个的语句位置,作为待判断语句位置;
词序对齐单元,用于将待判断语句位置的所有语法合格语句进行词序对齐,获得待判断语句位置的所有词序的多个待判断词;
词评价单元,用于基于待判断词在用户控制习惯中的控制指令词频列表中的词频,当作待判断词的可能性值,基于待判断语句位置的相同词序的所有待判断词的可能性值,计算出待判断语句位置的相同时序的每个待判断词的词评价值;
词频评价单元,用于将待判断语句位置的每个语法合格语句中所有待判断词的词评价值的均值,当作对应语法合格语句的词频评价值;
相邻共现评价单元,用于基于待判断语句位置的每个语法合格语句和用户控制习惯中的控制指令相邻共现列表,计算出对应语法合格语句的相邻共现评价值;
文本提取单元,用于基于待判断语句位置的每个语法合格语句的词频评价值和相邻共现评价值,在待判断语句位置的所有语法合格语句中提取出最终语义文本;
指令确定单元,用于基于最终语义文本对应的文本语义和初始转换文本中相同语句位置的语法合格语句只有一个的语句位置的文本语义,确定出场景控制指令。
该实施例中,将待判断语句位置的所有语法合格语句进行词序对齐为:将待判断语句位置的所有语法合格语句中的所有第一个词对齐、所有第二个词对齐,以此类推。
该实施例中,待判断词为相同词序的多个待判断词,且相同词序的待判断词总数与对应待判断语句位置的所有语法合格语句总数一致,待判断词属于对应待判断语句位置的语法合格语句中。
该实施例中,待判断词的可能性值为表征待判断词被当作最终语义文本中的词的可能性的数值。
该实施例中,待判断词的词评价值为将待判断语句位置的相同时序的每个待判断词的可能性值与该待判断语句位置的相同时序的所有待判断词的可能性值的均值之比,当作词评价值,词评价值即为用于与待判断语句位置的相同时序的其他待判断词相比,该待判断词被当作最终语义文本中的词的相对可能性的数值。
该实施例中,词频评价值是以词频角度对语法合格语句被当作最终语义文本中的语句的可能性进行评价后获得的数值。
该实施例中,语法合格语句的相邻共现评价值为以相邻词共同出现的频率对语法合格语句被当作最终语义文本中的语句的可能性进行评价后获得的数值。
该实施例中,最终语义文本为在待判断语句位置的所有语法合格语句中提取出的用于最终精准确定出场景控制指令的部分文本。
以上技术的有益效果为:通过对初始转换文本中相同语句位置的语法合格语句不止一个的语句位置的多个文本进行词序对齐、词评价、词频评价,进而实现以词频角度对语法合格语句被当作最终语义文本中的语句的可能性进行评价后获得的词频评价值,并结合以相邻词共同出现的频率对语法合格语句被当作最终语义文本中的语句的可能性进行评价后获得的相邻共现评价值,确定出相同语句位置的语法合格语句不止一个的语句位置的最终语义文本,并结合相同语句位置的语法合格语句只有一个的语句位置的文本语义,实现对场景控制指令的更精准确定。
实施例12:
在实施例11的基础上,相邻共现评价单元,包括:
出现频次确定子单元,用于确定出待判断语句位置的每个语法合格语句中所有相邻词在用户控制习惯中的控制指令相邻共现列表中对应的出现频次;
相邻词评价子单元,用于将语法合格语句中相邻词的出现频次与控制指令相邻共现列表中包含的所有出现频次的总和之比,当作语法合格语句中的相邻词的相邻词评价值;
相邻共现评价子单元,用于将待判断语句位置的每个语法合格语句中所有相邻词的相邻词评价值的均值,当作对应语法合格语句的相邻共现评价值。
该实施例中,相邻词评价值为用于与待判断语句位置的所有语法合格语句中的其他相邻词相比,该相邻词被当作最终语义文本中的词的相对可能性的数值。
以上技术的有益效果为:实现了基于待判断语句位置的每个语法合格语句中所有相邻词在用户控制习惯中的控制指令相邻共现列表中对应的出现频次,确定出语法合格语句中的相邻词的相邻词评价值,并通过对语法合格语句中的所有相邻词的相邻词评价值进行求平均,获得表征以相邻词共同出现的频率对语法合格语句被当作最终语义文本中的语句的可能性进行评价获得的相邻共现评价值。
实施例13:
在实施例12的基础上,文本提取单元,包括:
第一评价子单元,用于将词频评价值和对应的第一权重的乘积当作待判断语句位置的对应语法合格语句的第一评价值;
第二评价子单元,用于将相邻共现评价值和对应的第二权重的乘积当作待判断语句位置的对应语法合格语句的第二评价值;
总评价子单元,用于将第一评价值和第二评价值之和当作对应语法合格语句的总评;
语句筛选子单元,用于将待判断语句位置的所有语法合格语句中最大总评价值对应的语法合格语句当作最终语义文本。
该实施例中,第一权重为预设的表征词频评价值在语法合格语句的总评价值中的占比权重。
该实施例中,第一评价值是考虑到第一权重的情况下以词频角度对语法合格语句被当作最终语义文本中的语句的可能性进行评价后获得的数值。
该实施例中,第二权重为预设的表征相邻共现评价值在语法合格语句的总评价值中的占比权重。
该实施例中,第二评价值为考虑到第二权重的情况下以相邻词共同出现的频率对语法合格语句被当作最终语义文本中的语句的可能性进行评价后获得的数值。
该实施例中,总评价值为综合词频角度和相邻词共同出现的频率两个角度对语法合格语句被当作最终语义文本中的语句的可能性进行评价后获得的数值。
以上技术的有益效果为:在词频评价值和相邻共现评价值的基础上,结合第一权重和第二权重,准确计算出语法合格语句的总评价值,并将最大总评价值对应的语法合格语句当作最终语义文本,实现了综合词频角度和相邻词共同出现的频率两个角度在语法合格语句中筛选出相同语句位置的语法合格语句不止一个的语句位置的最终语义文本,更进一步地保证了最终确定出的场景控制指令的准确度。
实施例14:
在实施例11的基础上,指令确定单元,包括:
文本排序组合子单元,用于按照语法合格语句的语句顺序,对最终语义文本和初始转换文本中相同语句位置的语法合格语句只有一个的语句位置的语法合格语句进行排序组合,获得总语义文本(即为用于最终确定出场景控制指令的最精简文本);
指令提取子单元,用于基于总语义文本的语义确定出场景控制指令。
该实施例中,总语义文本为用于最终确定出场景控制指令的最精简文本。
以上技术的有益效果为:获得用于最终确定出场景控制指令的最精简文本(即总语义文本),通过对总语义文本的语义进行指令解析,确定出场景控制指令。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (7)
1.一种基于离线语音识别的智能家居控制系统,其特征在于,包括:
离线语音识别模块,用于在离线状态下获取预设分贝值范围内的环境音录音数据,并对环境音录音数据进行指令识别,获得用户发出的场景控制指令;
互联互控传输模块,用于基于接收到场景控制指令的智能控制面板中的低频窄带通信模组,将场景控制指令转发至处于当前互联互通状态中的剩余智能控制面板,获得指令互联互通结果;
家居互联控制模块,用于基于指令互联互通结果中所有智能控制面板最新接收到的场景控制指令,控制所有智能家居,获得智能家居控制结果;
其中,离线语音识别模块内置于处于当前互联互通状态的所有智能控制面板中;
其中,离线语音识别模块,包括:
语音提取模块,用于获取预设分贝值范围内的环境音录音数据,并对环境音录音数据进行语音提取,获得提取语音;
正确率预测模块,用于基于提取语音的声纹特征,预测出提取语音的离线识别正确率;
习惯分析模块,用于当离线识别正确率不小于预测正确率阈值时,则基于预设的自定义语义指令和大量历史语音控制指令分析出用户控制习惯;
文本提取模块,用于基于用户控制习惯对提取语音进行语义识别,获得场景控制指令;
其中,语音提取模块,包括:
噪音频段确定子模块,用于获取预设分贝值范围内的环境音录音数据中声音信号的波形图,在波形图中识别出当前基础环境噪音的频段范围;
第一筛选子模块,用于将环境音录音数据中包含的当前基础环境噪音的频段范围内的部分声音数据删除,获得去噪环境音数据;
第二筛选子模块,用于将去噪环境音数据中包含的预设的人类语音频段范围内的部分声音数据,当作提取语音;
其中,噪音频段确定子模块,包括:
相似判定单元,用于识别出波形图中的骤变幅值,基于骤变幅值将波形图划分为多个子波形,计算出所有子波形中任意两两子波形之间的相似度,并将相似度不小于相似度阈值的子波形组合为互为相似波形组;
波形整理单元,用于将包含相同波形的互为相似波形组进行去重汇总,获得至少一个相似波形组,并基于所有子波形在波形图中的时序,对相似波形组中包含的所有子波形进行排序,获得至少一个子波形序列;
规律程度计算单元,用于基于子波形序列中相邻子波形之间的时间间隔,计算出子波形序列的第一规律程度,并基于子波形序列中所有两两子波形之间的相似度,计算出子波形序列的第二规律程度;
噪音频段范围确定单元,用于将第一规律程度和第二规律程度中的最大值不小于规律程度阈值的子波形序列中包含的所有子波形构成的总频段范围,当作当前基础环境噪音的频段范围。
2.根据权利要求1所述的基于离线语音识别的智能家居控制系统,其特征在于,正确率预测模块,包括:
倒谱分析子模块,用于生成提取语音的梅尔倒谱系数特征图,基于梅尔倒谱系数特征图确定出多个梅尔倒谱系数变化向量;
特征提取子模块,用于将所有梅尔倒谱系数变化向量和所有短时能量和短时平均幅度差,作为提取语音的声纹特征;
模型运行子模块,用于将声纹特征输入至预设的识别正确率预测模型,获得提取语音的离线识别正确率。
3.根据权利要求1所述的基于离线语音识别的智能家居控制系统,其特征在于,家居互联控制模块,包括:
设备和指令确定子模块,用于基于指令互联互通结果中所有智能控制面板最新接收到的场景控制指令,确定出目标控制家居设备和每个目标控制家居设备的目标控制指令;
可控制面板确定子模块,用于基于每个目标控制家居设备和智能控制面板之间的专属控制通信方式,确定出可控制每个目标控制家居设备的智能控制面板,作为每个目标控制家居设备的可控制面板;
家居控制子模块,用于控制每个目标控制家居设备的可控制面板,执行对应目标控制家居设备的目标控制指令,获得智能家居控制结果。
4.根据权利要求3所述的基于离线语音识别的智能家居控制系统,其特征在于,可控制面板确定子模块,包括:
第一确定单元,用于将包含红外码模块和红外发射管的智能控制面板,当作控制专属通信方式为红外遥控通信方式的目标控制家居设备的可控制面板;
第二确定单元,用于将包含RF通信模组的智能控制面板,当作控制专属通信方式为基于RF通信模组的控制通信方式的目标控制家居设备的可控制面板;
其中,基于RF通信模组的控制通信方式的目标控制家居设备为包含RF通信模组的目标控制家居设备。
5.根据权利要求1所述的基于离线语音识别的智能家居控制系统,其特征在于,智能控制面板中的低频窄带通信模组为都基于LoRa 或 NB-IoT的低频窄带通信模组;
低频窄带通信模组中至少包含微控制器、存储器、通信接口。
6.根据权利要求1所述的基于离线语音识别的智能家居控制系统,其特征在于,文本提取模块,包括:
文本转换子模块,用于基于当前语音模式对提取语音进行文本转换,获得多个初始转换文本;
分词处理子模块,用于对初始转换文本进行分词处理,获得初始转换文本的词序列;
语法判断子模块,用于基于初始转换文本的词序列中每个词的词性,判断出初始转换文本中是否包含语法结构满足多种预设语法构造中的一种的语句,若是,则将初始转换文本中的对应语句判定为语法合格语句;
语义识别子模块,用于基于用户控制习惯,对所有初始转换文本中包含的语法合格语句进行语义识别,获得场景控制指令。
7.根据权利要求4所述的基于离线语音识别的智能家居控制系统,其特征在于,语义识别子模块,包括:
位置筛选单元,用于筛选出初始转换文本中相同语句位置的语法合格语句不止一个的语句位置,作为待判断语句位置;
词序对齐单元,用于将待判断语句位置的所有语法合格语句进行词序对齐,获得待判断语句位置的所有词序的多个待判断词;
词评价单元,用于基于待判断词在用户控制习惯中的控制指令词频列表中的词频,当作待判断词的可能性值,基于待判断语句位置的相同词序的所有待判断词的可能性值,计算出待判断语句位置的相同时序的每个待判断词的词评价值;
词频评价单元,用于将待判断语句位置的每个语法合格语句中所有待判断词的词评价值的均值,当作对应语法合格语句的词频评价值;
相邻共现评价单元,用于基于待判断语句位置的每个语法合格语句和用户控制习惯中的控制指令相邻共现列表,计算出对应语法合格语句的相邻共现评价值;
文本提取单元,用于基于待判断语句位置的每个语法合格语句的词频评价值和相邻共现评价值,在待判断语句位置的所有语法合格语句中提取出最终语义文本;
指令确定单元,用于基于最终语义文本对应的文本语义和初始转换文本中相同语句位置的语法合格语句只有一个的语句位置的文本语义,确定出场景控制指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410216744.0A CN117784632B (zh) | 2024-02-28 | 2024-02-28 | 一种基于离线语音识别的智能家居控制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410216744.0A CN117784632B (zh) | 2024-02-28 | 2024-02-28 | 一种基于离线语音识别的智能家居控制系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117784632A CN117784632A (zh) | 2024-03-29 |
CN117784632B true CN117784632B (zh) | 2024-05-14 |
Family
ID=90380173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410216744.0A Active CN117784632B (zh) | 2024-02-28 | 2024-02-28 | 一种基于离线语音识别的智能家居控制系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117784632B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118053426B (zh) * | 2024-04-16 | 2024-07-05 | 深圳市轻生活科技有限公司 | 一种互联互控的智能无线开关及其离线语音控制系统 |
CN118430541B (zh) * | 2024-07-04 | 2024-09-10 | 青岛海尔乐信云科技有限公司 | 智能语音机器人系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN206833179U (zh) * | 2017-05-31 | 2018-01-02 | 浙江利尔达客思智能科技有限公司 | 一种集中式智能家居控制面板 |
CN108039171A (zh) * | 2018-01-08 | 2018-05-15 | 珠海格力电器股份有限公司 | 语音控制方法及装置 |
CN108320733A (zh) * | 2017-12-18 | 2018-07-24 | 上海科大讯飞信息科技有限公司 | 语音数据处理方法及装置、存储介质、电子设备 |
CN111161731A (zh) * | 2019-12-30 | 2020-05-15 | 四川虹美智能科技有限公司 | 智能家电离线语音控制装置 |
CN111273594A (zh) * | 2020-04-03 | 2020-06-12 | 福州大学 | 一种具有语音交互和场景控制的家用智能配电箱控制系统 |
CN113129867A (zh) * | 2019-12-28 | 2021-07-16 | 中移(上海)信息通信科技有限公司 | 语音识别模型的训练方法、语音识别方法、装置和设备 |
CN113223898A (zh) * | 2021-06-09 | 2021-08-06 | 黄浩宇 | 一种86型多功能智能开关 |
CN113960930A (zh) * | 2021-10-26 | 2022-01-21 | 珠海格力电器股份有限公司 | 智能家居控制面板间的通信方法、装置和设备 |
CN115331670A (zh) * | 2022-08-09 | 2022-11-11 | 深圳市麦驰信息技术有限公司 | 一种家用电器用离线语音遥控器 |
CN115766311A (zh) * | 2022-10-24 | 2023-03-07 | 深圳市欧瑞博科技股份有限公司 | 智能家居的控制方法、系统、计算机设备和存储介质 |
-
2024
- 2024-02-28 CN CN202410216744.0A patent/CN117784632B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN206833179U (zh) * | 2017-05-31 | 2018-01-02 | 浙江利尔达客思智能科技有限公司 | 一种集中式智能家居控制面板 |
CN108320733A (zh) * | 2017-12-18 | 2018-07-24 | 上海科大讯飞信息科技有限公司 | 语音数据处理方法及装置、存储介质、电子设备 |
CN108039171A (zh) * | 2018-01-08 | 2018-05-15 | 珠海格力电器股份有限公司 | 语音控制方法及装置 |
CN113129867A (zh) * | 2019-12-28 | 2021-07-16 | 中移(上海)信息通信科技有限公司 | 语音识别模型的训练方法、语音识别方法、装置和设备 |
CN111161731A (zh) * | 2019-12-30 | 2020-05-15 | 四川虹美智能科技有限公司 | 智能家电离线语音控制装置 |
CN111273594A (zh) * | 2020-04-03 | 2020-06-12 | 福州大学 | 一种具有语音交互和场景控制的家用智能配电箱控制系统 |
CN113223898A (zh) * | 2021-06-09 | 2021-08-06 | 黄浩宇 | 一种86型多功能智能开关 |
CN113960930A (zh) * | 2021-10-26 | 2022-01-21 | 珠海格力电器股份有限公司 | 智能家居控制面板间的通信方法、装置和设备 |
CN115331670A (zh) * | 2022-08-09 | 2022-11-11 | 深圳市麦驰信息技术有限公司 | 一种家用电器用离线语音遥控器 |
CN115766311A (zh) * | 2022-10-24 | 2023-03-07 | 深圳市欧瑞博科技股份有限公司 | 智能家居的控制方法、系统、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117784632A (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117784632B (zh) | 一种基于离线语音识别的智能家居控制系统 | |
US9842489B2 (en) | Waking other devices for additional data | |
US7444001B2 (en) | Gesture activated home appliance | |
EP3716266B1 (en) | Artificial intelligence device and method of operating artificial intelligence device | |
CN112489413B (zh) | 遥控器的控制方法及系统、存储介质、电子设备 | |
CN103745722A (zh) | 一种语音交互智能家居系统及语音交互方法 | |
CN203232565U (zh) | 一种多功能远程网络遥控器 | |
CN109377995B (zh) | 一种控制设备的方法与装置 | |
CN105700359A (zh) | 一种语音识别智能家居控制方法及系统 | |
CN110914897B (zh) | 语音识别系统和语音识别装置 | |
CN108320740B (zh) | 一种语音识别方法、装置、电子设备及存储介质 | |
Malavasi et al. | An innovative speech-based user interface for smarthomes and IoT solutions to help people with speech and motor disabilities | |
Hasan et al. | Implementation of speech recognition home control system using Arduino | |
CN113077812B (zh) | 语音信号生成模型训练方法、回声消除方法和装置及设备 | |
CN106297783A (zh) | 一种语音交互识别智能终端 | |
Fezari et al. | New speech processor and ultrasonic sensors based embedded system to improve the control of a motorised wheelchair | |
CN101256769B (zh) | 语音识别装置及其方法 | |
CN110970019A (zh) | 智能家居系统的控制方法和装置 | |
US20220036879A1 (en) | Method and apparatus for mining feature information, and electronic device | |
KR102395760B1 (ko) | 다중 디바이스의 음성인식 제어를 위한 다채널 보이스 트리거 시스템 및 그 제어 방법 | |
WO2018023518A1 (zh) | 一种语音交互识别智能终端 | |
CN116415590A (zh) | 基于多轮次问询的意图识别方法及装置 | |
KR20130041421A (ko) | 터치기반 음성인식 멀티모달리티 시스템 | |
Chand et al. | Wireless Home Automation System with Acoustic Controlling | |
ALBERT | VOICE CONTROLLED LIGHTING SYSTEM FOR THE ELDERLY AND PERSONS WITH SPECIAL NEEDS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |