CN107733762B - 一种智能家居的语音控制方法及装置、系统 - Google Patents
一种智能家居的语音控制方法及装置、系统 Download PDFInfo
- Publication number
- CN107733762B CN107733762B CN201711154103.3A CN201711154103A CN107733762B CN 107733762 B CN107733762 B CN 107733762B CN 201711154103 A CN201711154103 A CN 201711154103A CN 107733762 B CN107733762 B CN 107733762B
- Authority
- CN
- China
- Prior art keywords
- voice input
- voice
- input method
- input
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 282
- 230000008030 elimination Effects 0.000 claims abstract description 21
- 238000012905 input function Methods 0.000 claims description 36
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000013215 result calculation Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 13
- 238000012217 deletion Methods 0.000 abstract description 5
- 230000037430 deletion Effects 0.000 abstract description 5
- 238000012549 training Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Automation & Control Theory (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Machine Translation (AREA)
- Stored Programmes (AREA)
Abstract
本发明提供一种智能家居的语音控制方法及装置、系统,同时基于多种不同的输入法对用户输入的语音信息进行识别,并对识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,提高了语音识别的准确性;此外,为每个语音输入模块设置权重系数,并根据识别结果的横向比较调整该权重系统,在所述权重系统达到输入法应用程序淘汰权重阈值后删除对应的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被删除的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性。
Description
技术领域
本申请涉及智能终端控制的技术领域,尤其涉及一种智能家居的语音控制方法及装置、系统。
背景技术
经过多年的技术发展,语音输入作为一种重要的非键盘输入方法已经在平 板电脑、智能手机等设备上得到了广泛的应用。采用语音进行信息数据输入,语音输入质量的高低对语音识别的准确性具有决定性作用,而语音识别的准确性又在很大程度上影响了用户体验的好坏。
此外,智能家居系统经过多年的发展,至今已形成了种类齐全、稳定可靠的电气设备。但家用电气设备的种类繁多且生产厂家各不相同,这些不同的设备厂家又各自遵循不同的标准化接口协议进行产品研发和推广,目前市场上普及较多的如:EIB/KNX协议、MODBUS协议、BacNet协议、Lonworks协议、RTSP协议、HomeKit框架协议、AllJoyn框架协议、OIC框架协议等。这些协议或通讯框架适用于不同的硬件设备,在整体的家居自动化控制系统中,往往需要搭建多种多样的硬件设备进行功能实现。
针对现有技术中存在的问题,文献CN106847281A提供一种基于语音模糊识别技术的智能家居语音控制系统及方法,该控制系统及方法应用于智能化家居系统的用户交互层,通过语音模糊识别技术,实现智能家居系统自学习功能,支持用户的自定义语音指令;解决跨语音、方言、口音识别问题;利用语音的特征向量提取实现声纹采集,识别说话人身份,提高系统安全性。
然而,上述方法虽然实现了语音识别的自学习,但仍然存在很多缺陷。首先,为了提高语音识别的准确性,上述方法需要采集大量的训练样本,这些训练样本无疑会占用大量的存储空间,从而降低了存储空间的有效利用率;其次,上述方法需要事先对用户的语音指令进行采集与训练,在用户使用初期或者样本训练期间会严重影响用户的使用体验,如果增加新的语音控制人员,则需要重新进行样本训练,这这会大大影响用户的使用体验;最后,上述方法只是将用户的语音指令与一个样本集中的语音指令进行比对,受该样本集容量和训练误差的影响,比对的准确性和可靠性较低,从而增加了比对失败或误判的可能性,进一步影响了用户的使用体验。
发明内容
针对上述问题,本发明提供一种智能家居的语音控制方法,所述方法包括如下步骤:
S1,检测用户是否启用所述智能家居终端的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;
S2,为所述智能家居终端配置多个入法应用程序及其音输入插件,并配置多个所述音输入插件的初始权重系数,多个所述初始权重系数的值相同,且所有所述初始权重系数的值的和为一;
S3,所述智能家居终端接收所述用户的语音输入信息,开启所述智能家居终端的多个入法应用程序的音输入插件,多个所述语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能家居终端获取所有所述输入法应用程序的识别结果;
S4,所述智能家居终端为每个所述识别结果计算权重积分,所述识别结果的权重积分的计算方法为:所有与所述识别结果相同的识别结果对应的所述权重系数的和,并将所述识别结果的权重积分最高的识别结果推荐作为所述语音指令的识别结果,基于所述识别结果对智能家居执行控制操作;
S5,为所述推荐的识别结果对应的权重系数增加权重值,同时为没有被推荐的识别结果对应的权重系数减小权重值,维持所有所述权重系数的值的和为一;
S6,所述智能家居终端获取所有所述权重系数,并与输入法应用程序淘汰权重阈值进行比较,如果所述输入法应用程序的权重系数小于等于所述输入法应用程序淘汰权重阈值,则将所述输入法应用程序的语音输入插件进行删除。
作为一种优选的实施方式,所述步骤S6还包括:
为用户推荐未安装的输入法应用程序及其语音输入插件;如果所述用户接收推荐所述未安装的输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述输入法应用程序及其语音输入插件取代已被删除的语音输入插件对应的输入法应用程序。
作为一种优选的实施方式,所述为用户推荐未安装的输入法应用程序及其语音输入插件,还包括:
根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除已经设置权重系数的输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。
本发明提供一种移动终端的语音输入方法,同时基于多种不同的输入法对用户输入的语音信息进行识别,并对识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,为每个语音输入模块设置权重系数,并根据识别结果的横向比较调整该权重系统,在所述权重系统达到输入法应用程序淘汰权重阈值后删除对应的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被删除的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。
此外,发明提供一种智能家居的语音控制装置,所述装置包括如下模块:
语音输入功能启动检测模块,用于检测用户是否启用所述智能家居终端的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;
权重系数配置模块,用于为所述智能家居终端配置多个入法应用程序及其音输入插件,并配置多个所述音输入插件的初始权重系数,多个所述初始权重系数的值相同,且所有所述初始权重系数的值的和为一;
语音识别模块,用于所述智能家居终端接收所述用户的语音输入信息,开启所述智能家居终端的多个入法应用程序的音输入插件,多个所述语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能家居终端获取所有所述输入法应用程序的识别结果;
识别结果计算模块,用于所述智能家居终端为每个所述识别结果计算权重积分,所述识别结果的权重积分的计算方法为:所有与所述识别结果相同的识别结果对应的所述权重系数的和,并将所述识别结果的权重积分最高的识别结果推荐作为所述语音指令的识别结果,基于所述识别结果对智能家居执行控制操作;
权重系数调整模块,用于为所述推荐的识别结果对应的权重系数增加权重值,同时为没有被推荐的识别结果对应的权重系数减小权重值,维持所有所述权重系数的值的和为一;
输入法更新模块,用于所述智能家居终端获取所有所述权重系数,并与输入法应用程序淘汰权重阈值进行比较,如果所述输入法应用程序的权重系数小于等于所述输入法应用程序淘汰权重阈值,则将所述输入法应用程序的语音输入插件进行删除。
作为一种优选的实施方式,所述输入法更新模块还包括:
为用户推荐未安装的输入法应用程序及其语音输入插件;如果所述用户接收推荐所述未安装的输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述输入法应用程序及其语音输入插件取代已被删除的语音输入插件对应的输入法应用程序。
作为一种优选的实施方式,所述为用户推荐未安装的输入法应用程序及其语音输入插件,还包括:
根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除已经设置权重系数的输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。
本发明提供一种智能家居终端的语音输入装置,同时基于多种不同的输入法对用户输入的语音信息进行识别,并对识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,为每个语音输入模块设置权重系数,并根据识别结果的横向比较调整该权重系统,在所述权重系统达到输入法应用程序淘汰权重阈值后删除对应的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被删除的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。
附图说明
图1是本发明的一种智能家居终端的语音输入装置示意图。
具体实施方式
以下结合附图进一步说明本发明的实施例。
实施例一:
本发明提供种智能家居的语音控制方法,所述方法包括如下步骤:
S1,检测用户是否启用所述智能家居终端的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;需要说明的是,用户通过与智能终端的交互,通过其上的语音采集装置输入语音输入信息,如通过智能家居终端的麦克风输入语音输入信息;上述语音输入功能通过输入法应用程序中的插件实现,用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。
S2,为所述智能家居终端配置多个输入法应用程序及其语音输入插件,并配置多个所述音输入插件的初始权重系数,多个所述初始权重系数的值相同,且所有所述初始权重系数的值的和为一;示例性的,上述输入法应用程序及其语音输入插件、初始权重系数可以为:搜狗输入法的语音输入插件的初始权重系数w1=0.25,讯飞输入法的语音输入插件的初始权重系数w2=0.25,五笔输入法的语音输入插件的初始权重系数w3=0.25,微软输入法的语音输入插件的初始权重系数w4=0.25;此时,w1=w2=w3=w4=0.25,且w1+w2+w3+w4=1。
S3,所述智能家居终端接收所述用户的语音输入信息,开启所述智能家居终端的多个入法应用程序的音输入插件,多个所述语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能家居终端获取所有所述输入法应用程序的识别结果;需要说明的是,上述搜狗输入法的语音输入插件基于该输入法提供的数据库进行语音识别,上述讯飞输入法的语音输入插件基于该输入法提供的数据库进行语音识别,上述五笔输入法的语音输入插件基于该输入法提供的数据库进行语音识别,上述微软输入法的语音输入插件基于该输入法提供的数据库进行语音识别,四个输入法的语音识别是分别独立进行的,互相不受影响,此时,由于四个不同输入法程序开发公司的技术优势不同,四个输入法的语音识别独立进行可以有效避免“系统误差”,充分发挥各自的技术优势,从而提高匹配效率。
S4,所述智能家居终端为每个所述识别结果计算权重积分,所述识别结果的权重积分的计算方法为:所有与所述识别结果相同的识别结果对应的所述权重系数的和,并将所述识别结果的权重积分最高的识别结果推荐作为所述语音指令的识别结果,基于所述识别结果对智能家居执行控制操作;示例性的,如果用户输入了语音指令“打开客厅窗帘”,每个输入法的语音输入模块的识别结果为:搜狗输入法“打开客厅窗帘”,讯飞输入法“打开客厅窗帘”,五笔输入法“打开窗帘”,微软输入法“打开厅窗帘”;此时,识别结果“打开客厅窗帘”对应的权重积分为wa=w1+w2=0.5,“打开窗帘”对应的权重积分为wb=w3=0.25,“打开厅窗帘”对应的权重积分为wc=w4=0.25;由于识别结果“打开客厅窗帘”的权重积分最高,为0.5,则将该识别结果推荐作为所述语音指令的识别结果,基于所述识别结果“打开客厅窗帘”对智能家居执行打开客厅窗帘的控制操作。
S5,为所述推荐的识别结果对应的权重系数增加权重值,同时为没有被推荐的识别结果对应的权重系数减小权重值,维持所有所述权重系数的值的和为一;继续上面的实施例,由于讯飞输入法和搜狗输入法正确识别了语音指令,则为其权重系数增加权重值,假设每次增加权重值为0.5,则调整后的权重系数依次为:搜狗输入法的语音输入插件的权重系数w11=0.25+0.1=0.35,讯飞输入法的语音输入插件的权重系数w21=0.25+0.1=0.35,五笔输入法的语音输入插件的权重系数w31=0.25-0.1=0.15,微软输入法的语音输入插件的权重系数w41=0.25-0.1=0.15;此时,w1+w2+w3+w4=1。
S6,所述智能家居终端获取所有所述权重系数,并与输入法应用程序淘汰权重阈值进行比较,如果所述输入法应用程序的权重系数小于等于所述输入法应用程序淘汰权重阈值,则将所述输入法应用程序的语音输入插件进行删除。继续上面的实施例,假设输入法应用程序淘汰权重阈值为0.1,则经过两次语音识别后,微软输入法的语音输入插件的权重系数w42=0.15-0.1=0.05,此时,w42<0.1,则将微软输入法应用程序的语音输入插件进行删除。这里基于识别结果对四种输入法进行权重系数调整,并在权重系数小于等于输入法应用程序淘汰权重阈值时淘汰删除权重系数低的输入法的语音识别模块,实现了基于输入法单个模块即语音输入模块的保留与删除;由此增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率。
作为一种优选的实施方式,所述步骤S6还包括:
为用户推荐未安装的输入法应用程序及其语音输入插件;如果所述用户接收推荐所述未安装的输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述输入法应用程序及其语音输入插件取代已被删除的语音输入插件对应的输入法应用程序。需要说明的是,由于上述进行比较的四种输入法程序中的微软输入法的语音输入模块已经被删除,此时则无法实现四个语音输入功能的比较,因此,这里可以增加一种新的语音输入法来作为比较的对象;例如,为用户推荐QQ输入法及其语音输入插件,在用户对该QQ输入法及其语音输入插件进行正确安装后,在所述用户启用所述语音输入功能时,用QQ输入法应用程序及其语音输入插件取代微软输入法的输入法应用程序,进而执行上述四个输入法程序的语音识别过程中的比较操作,此时,实现了在语音输入过程中的QQ输入法取代微软输入法,在此不做赘述。此外,需要将原来保留的三个输入法的权重系数重新置位,即0.25,以实现四个输入法在后续语音输入过程中的公平比较;此外,如果用户未接受对上述QQ输入法程序的推荐安装,则可以仅仅依据剩余的三个输入法程序执行语音输入的比较操作,此时,调整每个输入法程序的初始权重系数为1/3,具体实现方法参考上述四个语音识别输入法程序的操作,在此不做赘述。
作为一种优选的实施方式,所述为用户推荐未安装的输入法应用程序及其语音输入插件,还包括:
根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除已经设置权重系数的输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。需要说明的是,由于输入法应用程序的下载数量越多,则其多数用户的使用体验越好,因此,优先推荐下载数量较多的输入法应用程序供用户进行使用。
本发明提供一种智能家居终端的语音输入方法,同时基于多种不同的输入法对用户输入的语音信息进行识别,并对识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,为每个语音输入模块设置权重系数,并根据识别结果的横向比较调整该权重系统,在所述权重系统达到输入法应用程序淘汰权重阈值后删除对应的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被删除的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。
实施例二:
如图1所示,发明提供一种智能家居的语音控制装置,所述装置包括如下模块:
语音输入功能启动检测模块,用于检测用户是否启用所述智能家居终端的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;需要说明的是,用户通过与智能终端的交互,通过其上的语音采集装置输入语音输入信息,如通过智能家居终端的麦克风输入语音输入信息;上述语音输入功能通过输入法应用程序中的插件实现,用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。
权重系数配置模块,用于为所述智能家居终端配置多个入法应用程序及其音输入插件,并配置多个所述音输入插件的初始权重系数,多个所述初始权重系数的值相同,且所有所述初始权重系数的值的和为一;示例性的,上述输入法应用程序及其语音输入插件、初始权重系数可以为:搜狗输入法的语音输入插件的初始权重系数w1=0.25,讯飞输入法的语音输入插件的初始权重系数w2=0.25,五笔输入法的语音输入插件的初始权重系数w3=0.25,微软输入法的语音输入插件的初始权重系数w4=0.25;此时,w1=w2=w3=w4=0.25,且w1+w2+w3+w4=1。
语音识别模块,用于所述智能家居终端接收所述用户的语音输入信息,开启所述智能家居终端的多个入法应用程序的音输入插件,多个所述语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能家居终端获取所有所述输入法应用程序的识别结果;需要说明的是,上述搜狗输入法的语音输入插件基于该输入法提供的数据库进行语音识别,上述讯飞输入法的语音输入插件基于该输入法提供的数据库进行语音识别,上述五笔输入法的语音输入插件基于该输入法提供的数据库进行语音识别,上述微软输入法的语音输入插件基于该输入法提供的数据库进行语音识别,四个输入法的语音识别是分别独立进行的,互相不受影响,此时,由于四个不同输入法程序开发公司的技术优势不同,四个输入法的语音识别独立进行可以有效避免“系统误差”,充分发挥各自的技术优势,从而提高匹配效率。
识别结果计算模块,用于所述智能家居终端为每个所述识别结果计算权重积分,所述识别结果的权重积分的计算方法为:所有与所述识别结果相同的识别结果对应的所述权重系数的和,并将所述识别结果的权重积分最高的识别结果推荐作为所述语音指令的识别结果,基于所述识别结果对智能家居执行控制操作;示例性的,如果用户输入了语音指令“打开客厅窗帘”,每个输入法的语音输入模块的识别结果为:搜狗输入法“打开客厅窗帘”,讯飞输入法“打开客厅窗帘”,五笔输入法“打开窗帘”,微软输入法“打开厅窗帘”;此时,识别结果“打开客厅窗帘”对应的权重积分为wa=w1+w2=0.5,“打开窗帘”对应的权重积分为wb=w3=0.25,“打开厅窗帘”对应的权重积分为wc=w4=0.25;由于识别结果“打开客厅窗帘”的权重积分最高,为0.5,则将该识别结果推荐作为所述语音指令的识别结果,基于所述识别结果“打开客厅窗帘”对智能家居执行打开客厅窗帘的控制操作。
权重系数调整模块,用于为所述推荐的识别结果对应的权重系数增加权重值,同时为没有被推荐的识别结果对应的权重系数减小权重值,维持所有所述权重系数的值的和为一;继续上面的实施例,由于讯飞输入法和搜狗输入法正确识别了语音指令,则为其权重系数增加权重值,假设每次增加权重值为0.5,则调整后的权重系数依次为:搜狗输入法的语音输入插件的权重系数w11=0.25+0.1=0.35,讯飞输入法的语音输入插件的权重系数w21=0.25+0.1=0.35,五笔输入法的语音输入插件的权重系数w31=0.25-0.1=0.15,微软输入法的语音输入插件的权重系数w41=0.25-0.1=0.15;此时,w1+w2+w3+w4=1。
输入法更新模块,用于所述智能家居终端获取所有所述权重系数,并与输入法应用程序淘汰权重阈值进行比较,如果所述输入法应用程序的权重系数小于等于所述输入法应用程序淘汰权重阈值,则将所述输入法应用程序的语音输入插件进行删除。继续上面的实施例,假设输入法应用程序淘汰权重阈值为0.1,则经过两次语音识别后,微软输入法的语音输入插件的权重系数w42=0.15-0.1=0.05,此时,w42<0.1,则将微软输入法应用程序的语音输入插件进行删除。这里基于识别结果对四种输入法进行权重系数调整,并在权重系数小于等于输入法应用程序淘汰权重阈值时淘汰删除权重系数低的输入法的语音识别模块,实现了基于输入法单个模块即语音输入模块的保留与删除;由此增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率。
作为一种优选的实施方式,所述输入法更新模块还包括:
为用户推荐未安装的输入法应用程序及其语音输入插件;如果所述用户接收推荐所述未安装的输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述输入法应用程序及其语音输入插件取代已被删除的语音输入插件对应的输入法应用程序。需要说明的是,由于上述进行比较的四种输入法程序中的微软输入法的语音输入模块已经被删除,此时则无法实现四个语音输入功能的比较,因此,这里可以增加一种新的语音输入法来作为比较的对象;例如,为用户推荐QQ输入法及其语音输入插件,在用户对该QQ输入法及其语音输入插件进行正确安装后,在所述用户启用所述语音输入功能时,用QQ输入法应用程序及其语音输入插件取代微软输入法的输入法应用程序,进而执行上述四个输入法程序的语音识别过程中的比较操作,此时,实现了在语音输入过程中的QQ输入法取代微软输入法,在此不做赘述。此外,需要将原来保留的三个输入法的权重系数重新置位,即0.25,以实现四个输入法在后续语音输入过程中的公平比较;此外,如果用户未接受对上述QQ输入法程序的推荐安装,则可以仅仅依据剩余的三个输入法程序执行语音输入的比较操作,此时,调整每个输入法程序的初始权重系数为1/3,具体实现方法参考上述四个语音识别输入法程序的操作,在此不做赘述。
作为一种优选的实施方式,所述为用户推荐未安装的输入法应用程序及其语音输入插件,还包括:
根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除已经设置权重系数的输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。需要说明的是,由于输入法应用程序的下载数量越多,则其多数用户的使用体验越好,因此,优先推荐下载数量较多的输入法应用程序供用户进行使用。
本发明提供一种智能家居终端的语音输入装置,同时基于多种不同的输入法对用户输入的语音信息进行识别,并对识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,为每个语音输入模块设置权重系数,并根据识别结果的横向比较调整该权重系统,在所述权重系统达到输入法应用程序淘汰权重阈值后删除对应的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被删除的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。
实施例三:
本发明还提供一种智能家居的语音输入系统,所述语音输入系统执行上述智能家居的语音输入方法。本领域技术人员应当能够理解,上述实施例的方法或者装置实现的语音输入功能均可通过对应的方式在该智能家居终端的语音输入系统中实现,在此不做赘述。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来生成机器,从而通过计算机或其他可编程数据处理方法的处理器来执行的指令创建了用于实现结构图和/或框图和/或流图的框或多个框中指定的方法。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.一种智能家居的语音控制方法,其特征在于,所述方法包括如下步骤:
S1,检测用户是否启用智能家居终端的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;
S2,为所述智能家居终端配置多个输入法应用程序及其语音输入插件,并配置多个所述语音输入插件的初始权重系数,多个所述初始权重系数的值相同,且所有所述初始权重系数的值的和为一;
S3,所述智能家居终端接收所述用户的语音输入信息,开启所述智能家居终端的多个输入法应用程序的语音输入插件,多个所述语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能家居终端获取所有所述输入法应用程序的识别结果;
S4,所述智能家居终端为每个所述识别结果对应的语音输入插件计算权重积分,所述权重积分的计算方法为:所有与所述识别结果相同的识别结果对应的语音输入插件的所述权重系数的和,并将所述识别结果对应的语音输入插件的权重积分最高的识别结果推荐作为所述语音输入信息的识别结果,基于所述识别结果对智能家居执行控制操作;
S5,为推荐的识别结果对应的语音输入插件的权重系数增加权重值,同时为没有被推荐的识别结果对应的语音输入插件的权重系数减小权重值,维持所有所述权重系数的值的和为一;
S6,所述智能家居终端获取所有所述权重系数,并与输入法应用程序淘汰权重阈值进行比较,如果所述输入法应用程序的权重系数小于等于所述输入法应用程序淘汰权重阈值,则将所述输入法应用程序的语音输入插件进行删除。
2.根据权利要求1所述的方法,其特征在于,所述步骤S6还包括:
为用户推荐未安装的输入法应用程序及其语音输入插件;如果所述用户接收推荐所述未安装的输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述输入法应用程序及其语音输入插件取代已被删除的语音输入插件对应的输入法应用程序。
3.根据权利要求2所述的方法,其特征在于,所述为用户推荐未安装的输入法应用程序及其语音输入插件,还包括:
根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除已经设置权重系数的输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。
4.一种智能家居的语音控制装置,其特征在于,所述装置包括如下模块:
语音输入功能启动检测模块,用于检测用户是否启用智能家居终端的语音输入功能;如果启用所述语音输入功能,则执行权重系数配置模块;如果未启用所述语音输入功能,则不做任何操作;
权重系数配置模块,用于为所述智能家居终端配置多个输入法应用程序及其语音输入插件,并配置多个所述语音输入插件的初始权重系数,多个所述初始权重系数的值相同,且所有所述初始权重系数的值的和为一;
语音识别模块,用于所述智能家居终端接收所述用户的语音输入信息,开启所述智能家居终端的多个输入法应用程序的语音输入插件,多个所述语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能家居终端获取所有所述输入法应用程序的识别结果;
识别结果计算模块,用于所述智能家居终端为每个所述识别结果对应的语音输入插件计算权重积分,所述权重积分的计算方法为:所有与所述识别结果相同的识别结果对应的语音输入插件的所述权重系数的和,并将所述识别结果对应的语音输入插件的权重积分最高的识别结果推荐作为所述语音输入信息的识别结果,基于所述识别结果对智能家居执行控制操作;
权重系数调整模块,用于为推荐的识别结果对应的语音输入插件的权重系数增加权重值,同时为没有被推荐的识别结果对应的语音输入插件的权重系数减小权重值,维持所有所述权重系数的值的和为一;
输入法更新模块,用于所述智能家居终端获取所有所述权重系数,并与输入法应用程序淘汰权重阈值进行比较,如果所述输入法应用程序的权重系数小于等于所述输入法应用程序淘汰权重阈值,则将所述输入法应用程序的语音输入插件进行删除。
5.根据权利要求4所述的装置,其特征在于,所述输入法更新模块还包括:
为用户推荐未安装的输入法应用程序及其语音输入插件;如果所述用户接收推荐所述未安装的输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述输入法应用程序及其语音输入插件取代已被删除的语音输入插件对应的输入法应用程序。
6.根据权利要求5所述的装置,其特征在于,所述为用户推荐未安装的输入法应用程序及其语音输入插件,还包括:
根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除已经设置权重系数的输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。
7.一种智能家居的语音控制系统,其特征在于,所述语音控制系统执行权利要求1-3的所述智能家居终端的语音输入方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711154103.3A CN107733762B (zh) | 2017-11-20 | 2017-11-20 | 一种智能家居的语音控制方法及装置、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711154103.3A CN107733762B (zh) | 2017-11-20 | 2017-11-20 | 一种智能家居的语音控制方法及装置、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107733762A CN107733762A (zh) | 2018-02-23 |
CN107733762B true CN107733762B (zh) | 2020-07-24 |
Family
ID=61217373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711154103.3A Active CN107733762B (zh) | 2017-11-20 | 2017-11-20 | 一种智能家居的语音控制方法及装置、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107733762B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108831453A (zh) * | 2018-05-02 | 2018-11-16 | 四川斐讯信息技术有限公司 | 基于智能语音设备的智能终端全兼容控制的方法及系统 |
CN108594668A (zh) * | 2018-05-04 | 2018-09-28 | 哈尔滨理工大学 | 智能家居控制系统及其控制方法 |
CN109283849B (zh) * | 2018-09-10 | 2021-12-31 | 缙云县科耳沃自动化科技有限公司 | 一种房屋智能化系统 |
CN111768789B (zh) * | 2020-08-03 | 2024-02-23 | 上海依图信息技术有限公司 | 电子设备及其语音发出者身份确定方法、装置和介质 |
CN116206613B (zh) * | 2023-05-06 | 2023-07-04 | 北京惠朗时代科技有限公司 | 基于智能家居场景的声纹识别管理系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103677729A (zh) * | 2013-12-18 | 2014-03-26 | 北京搜狗科技发展有限公司 | 一种语音输入方法和系统 |
CN105575386A (zh) * | 2015-12-18 | 2016-05-11 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105872687A (zh) * | 2016-03-31 | 2016-08-17 | 乐视控股(北京)有限公司 | 一种通过语音控制智能设备的方法及装置 |
CN106128462A (zh) * | 2016-06-21 | 2016-11-16 | 东莞酷派软件技术有限公司 | 语音识别方法及系统 |
CN106340297A (zh) * | 2016-09-21 | 2017-01-18 | 广东工业大学 | 一种基于云计算与置信度计算的语音识别方法与系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101736109B1 (ko) * | 2015-08-20 | 2017-05-16 | 현대자동차주식회사 | 음성인식 장치, 이를 포함하는 차량, 및 그 제어방법 |
-
2017
- 2017-11-20 CN CN201711154103.3A patent/CN107733762B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103677729A (zh) * | 2013-12-18 | 2014-03-26 | 北京搜狗科技发展有限公司 | 一种语音输入方法和系统 |
CN105575386A (zh) * | 2015-12-18 | 2016-05-11 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105872687A (zh) * | 2016-03-31 | 2016-08-17 | 乐视控股(北京)有限公司 | 一种通过语音控制智能设备的方法及装置 |
CN106128462A (zh) * | 2016-06-21 | 2016-11-16 | 东莞酷派软件技术有限公司 | 语音识别方法及系统 |
CN106340297A (zh) * | 2016-09-21 | 2017-01-18 | 广东工业大学 | 一种基于云计算与置信度计算的语音识别方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107733762A (zh) | 2018-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107733762B (zh) | 一种智能家居的语音控制方法及装置、系统 | |
US10515627B2 (en) | Method and apparatus of building acoustic feature extracting model, and acoustic feature extracting method and apparatus | |
JP6393730B2 (ja) | 音声識別方法および装置 | |
JP6099556B2 (ja) | 音声識別方法および装置 | |
CN108831469B (zh) | 语音命令定制方法、装置和设备及计算机存储介质 | |
CN106098063B (zh) | 一种语音控制方法、终端设备和服务器 | |
CN109743311B (zh) | 一种WebShell检测方法、装置及存储介质 | |
CN110060677A (zh) | 语音遥控器控制方法、装置及计算机可读存储介质 | |
AU2017404119A1 (en) | Random forest model training method, electronic apparatus and storage medium | |
CN107544272A (zh) | 终端控制方法、装置及存储介质 | |
CN105825848A (zh) | 一种语音识别方法、装置及终端 | |
CN110992937B (zh) | 语言离线识别方法、终端及可读存储介质 | |
CN108897517B (zh) | 一种信息处理方法及电子设备 | |
CN108932947B (zh) | 语音控制方法及家电设备 | |
CN111222044A (zh) | 基于情绪感知的信息推荐方法、设备及存储介质 | |
CN107894882B (zh) | 一种移动终端的语音输入方法 | |
CN111816170A (zh) | 一种音频分类模型的训练和垃圾音频识别方法和装置 | |
CN111933135A (zh) | 终端控制方法、装置、智能终端及计算机可读存储介质 | |
CN106205610B (zh) | 一种语音信息识别方法和设备 | |
CN108231074A (zh) | 一种数据处理方法、语音助手设备及计算机可读存储介质 | |
CN110458383B (zh) | 需求处理服务化的实现方法、装置及计算机设备、存储介质 | |
CN113593531B (zh) | 语音识别模型训练方法及系统 | |
CN112489644B (zh) | 用于电子设备的语音识别方法及装置 | |
CN115910062A (zh) | 音频识别方法、装置、设备及存储介质 | |
CN114067792B (zh) | 一种智能设备的控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200628 Address after: 2 / F, building 1, No. 428, Dongqing Road, hi tech Zone, Ningbo City, Zhejiang Province, 315000 Applicant after: NINGBO HOPE INTELLIGENT TECHNOLOGY Co.,Ltd. Address before: 333000 No. 588 North Square Road, village street, Zhujiang mountain, Jiangxi, Jingdezhen Applicant before: Ma Bo |
|
GR01 | Patent grant | ||
GR01 | Patent grant |