CN113992468A - 一种智能家居语音控制方法 - Google Patents

一种智能家居语音控制方法 Download PDF

Info

Publication number
CN113992468A
CN113992468A CN202111261606.7A CN202111261606A CN113992468A CN 113992468 A CN113992468 A CN 113992468A CN 202111261606 A CN202111261606 A CN 202111261606A CN 113992468 A CN113992468 A CN 113992468A
Authority
CN
China
Prior art keywords
voice
user
module
intention
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111261606.7A
Other languages
English (en)
Inventor
付金刚
冉翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hansa Intelligent Technology Co ltd
Original Assignee
Shanghai Hansa Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hansa Intelligent Technology Co ltd filed Critical Shanghai Hansa Intelligent Technology Co ltd
Priority to CN202111261606.7A priority Critical patent/CN113992468A/zh
Publication of CN113992468A publication Critical patent/CN113992468A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种智能家居语音控制方法,用户启动用户随身终端,对着用户随身终端说出唤醒词,唤醒识别模块如作出唤醒成功的应答,则用户说出想要控制的设备或场景;语音识别模块对用户说出想要控制的设备或场景的语音信息进行识别,如识别成功则转化成文本文字信息;意图识别模块通过将上述转化的文本文字信息与内定义意图的多种话术模板进行比较,如匹配出对应的内定义意图则向指令控制模块发送信息;指令控制模块接收信息后生成控制指令,发送给相应的智能家居设备,如果智能家居设备实现对应的控制效果则整个过程结束。本申请提供一种智能家居语音控制方法,能够实现智能家居远程控制,并降低受外音干扰影响的程度。

Description

一种智能家居语音控制方法
技术领域
本发明涉及智能家居技术,具体涉及一种智能家居语音控制方法。
背景技术
对于智能家居设备来说,唤醒就是语音交互的第一入口,唤醒质量的好坏直接影响到用户的第一体验。语音唤醒目前的应用范围比较窄,主要是应用在语音交互的设备上面,用来解决不方便触摸,但是又需要交互的场景。
生活中最常见的应该是智能音箱了,每个品牌的智能音箱都有自己的名字,我们通过音箱的名字唤醒她,和她进行交互,控制家电。还有一些服务类型的机器人,也会用到语音唤醒。但是上述设备都存在易受到外音干扰或无法远距离获取语音的问题。
发明内容
为了解决上述现有技术中存在的问题,本申请提供一种智能家居语音控制方法,能够实现智能家居远程控制,并降低受外音干扰影响的程度。
为了实现上述技术效果,本发明的具体技术方案如下:
一种智能家居语音控制方法,包括一随用户移动的用户随身终端、一固定放置于场景中的智能家居控制终端;
其中,用户随身终端内置语音接收模块、唤醒识别模块、语音发送模块;
语音接收模块用于接收用户的语音;
唤醒识别模块用于识别用户语音中的唤醒词并作出是否唤醒成功的应答反馈;
语音发送模块用于向智能家居控制终端通过无线传输的方式传输唤醒成功后的用户语音;
其中,智能家居控制终端内置语音接收模块、语音识别模块、意图识别模块、指令控制模块、反馈模块;
语音接收模块用于接收唤醒成功后的用户语音并传输给语音识别模块;
语音识别模块用于识别唤醒成功后的用户语音并转化成文本文字信息;由于存在生僻字、文字发音、周围噪音环境、说话人声音响度以及说话距离等原因,都有可能影响到识别情况。
意图识别模块用于将上述文本文字信息与存储的内定义意图匹配,识别出唤醒成功后的用户语音的意图;其中,每种内定义意图都有多种话术模板;
指令控制模块用于根据上述识别出的用户语音的意图生成控制指令,并发送给相应的智能家居设备以实现控制效果,同时接收智能家居设备是否控制生效的反馈;
反馈模块用于向用户随身终端反馈语音识别模块是否识别成功、意图识别模块是否识别成功、指令控制模块是否控制成功的信息;
其中,本发明的语音控制方法具体内容为:用户启动用户随身终端,并对着该用户随身终端说出唤醒词,唤醒识别模块如作出唤醒成功的应答,则用户说出想要控制的设备或场景,如作出唤醒失败的应答则用户继续说出唤醒词直至唤醒成功为止;语音识别模块对用户说出想要控制的设备或场景的语音信息进行识别,如识别成功则转化成文本文字信息,如识别失败则通过反馈模块向用户随身终端反馈识别失败的信息,用户重新说想要控制的设备或场景;意图识别模块通过将上述转化的文本文字信息与内定义意图的多种话术模板进行比较,如匹配出对应的内定义意图则向指令控制模块发送信息,如未匹配成功则用户需重新说想要控制的设备或场景;指令控制模块接收信息后生成控制指令,发送给相应的智能家居设备,如果智能家居设备实现对应的控制效果则整个过程结束,如果智能家居设备未控制生效则用户仍需重新说想要控制的设备或场景。
进一步地,所述用户随身终端内还设置一唤醒词迭代模块,用于补充、更新唤醒词,其具体方法为:依据注册语音或者模板语音进行特征提取,构建唤醒模板,通过特征提取生成特征序列,计算特征序列和模板序列的距离,基于此判断是否成为唤醒词。
进一步地,所述智能家居控制终端内还设置一意图迭代模块,用于补充、更新内定义意图,其具体方法为:定期通过大数据分析所有用户的话语描述,依此增加话术模板。
进一步地,意图识别模块的内定义意图包括设备控制意图、设备状态查询意图、设备配置意图、房间配置意图、场景配置意图、设备配置到场景意图。
进一步地,所述用户随身终端采用智能移动手机或智能平板电脑。
依据上述技术方案,本发明通过设计用户随身终端及其内置模块,基于日常生活中其使用的便利性与随身携带的特殊性,先天性地解决了外音干扰和无法远距离获取语音所带来的问题,并通过与智能家居控制终端的配合,用户喊出唤醒词,再说出需要执行的命令,经系统解析为文本文字,从而进行语句意图识别处理,然后通过下发处理后的指令来控制智能家居设备,全程无需靠近具体设备,无需辨别设备位置及状态,减少了控制操作的繁琐性、不确定性,极大地增强了用户对智能家居设备的掌控力度,提高了用户日常生活的体验和便捷性,充分增强了用户的体验感,加强了人工智能设备的友好性。
附图说明
下面通过具体实施方式结合附图对本申请作进一步详细说明。
图1为本发明的方法流程图;
图2为本发明中的一功能框架图;
其中,1、用户随身终端;11、语音接收模块;12、唤醒识别模块;13、语音发送模块;14、唤醒词迭代模块;2、智能家居控制终端;21、语音接收模块;22、语音识别模块;23、意图识别模块;24、指令控制模块;25、反馈模块;26、意图迭代模块。
具体实施方式
为使本实施方式的目的、技术方案和优点更加清楚,下面将结合本实施方式中的附图,对本实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本申请一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。
在本发明中,除非另有明确的规定和限定,术语“安装”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
实施例
参考图2,一种智能家居语音控制方法,包括一随用户移动的用户随身终端1、一固定放置于场景中的智能家居控制终端2;
其中,用户随身终端1内置语音接收模块11、唤醒识别模块12、语音发送模块13;
语音接收模块用于接收用户的语音;
唤醒识别模块用于识别用户语音中的唤醒词并作出是否唤醒成功的应答反馈;
语音发送模块用于向智能家居控制终端通过无线传输的方式传输唤醒成功后的用户语音;
其中,智能家居控制终端2内置语音接收模块21、语音识别模块22、意图识别模块23、指令控制模块24、反馈模块25;
语音接收模块用于接收唤醒成功后的用户语音并传输给语音识别模块;
语音识别模块用于识别唤醒成功后的用户语音并转化成文本文字信息;由于存在生僻字、文字发音、周围噪音环境、说话人声音响度以及说话距离等原因,都有可能影响到识别情况。
意图识别模块用于将上述文本文字信息与存储的内定义意图匹配,识别出唤醒成功后的用户语音的意图;其中,每种内定义意图都有多种话术模板;
指令控制模块用于根据上述识别出的用户语音的意图生成控制指令,并发送给相应的智能家居设备以实现控制效果,同时接收智能家居设备是否控制生效的反馈;
反馈模块用于向用户随身终端反馈语音识别模块是否识别成功、意图识别模块是否识别成功、指令控制模块是否控制成功的信息;
其中,所述用户随身终端1内还设置一唤醒词迭代模块14,用于补充、更新唤醒词,其方法即为对唤醒词的训练及测试,具体内容为:训练就是依据注册语音或者说模板语音进行特征提取,构建唤醒模板;一般而言,唤醒模块是一个小型语音识别引擎。由于目标单一(检测出指定的唤醒词),唤醒只需要较小的声学模型和语言模型(只需要区分出有无唤醒词出现)。测试时,通过特征提取生成特征序列,计算测试的特征序列和模板序列的距离,基于此判断是否成为唤醒词。
其中,所述智能家居控制终端2内还设置一意图迭代模块26,用于补充、更新内定义意图,其具体方法为:定期通过大数据分析所有用户的话语描述,依此增加话术模板。
其中,意图识别模块的内定义意图包括设备控制意图、设备状态查询意图、设备配置意图、房间配置意图、场景配置意图、设备配置到场景意图。
其中,用户随身终端采用智能移动手机或智能平板电脑。
参考图1,本发明的语音控制方法具体内容为:用户启动用户随身终端,并对着该用户随身终端说出唤醒词,唤醒识别模块如作出唤醒成功的应答,则用户说出想要控制的设备或场景,如作出唤醒失败的应答则用户继续说出唤醒词直至唤醒成功为止;语音识别模块对用户说出想要控制的设备或场景的语音信息进行识别,如识别成功则转化成文本文字信息,如识别失败则通过反馈模块向用户随身终端反馈识别失败的信息,用户重新说想要控制的设备或场景;意图识别模块通过将上述转化的文本文字信息与内定义意图的多种话术模板进行比较,如匹配出对应的内定义意图则向指令控制模块发送信息,如未匹配成功则用户需重新说想要控制的设备或场景;指令控制模块接收信息后生成控制指令,发送给相应的智能家居设备,如果智能家居设备实现对应的控制效果则整个过程结束,如果智能家居设备未控制生效则用户仍需重新说想要控制的设备或场景。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (5)

1.一种智能家居语音控制方法,其特征在于,包括一随用户移动的用户随身终端、一固定放置于场景中的智能家居控制终端;
其中,用户随身终端内置语音接收模块、唤醒识别模块、语音发送模块;
语音接收模块用于接收用户的语音;
唤醒识别模块用于识别用户语音中的唤醒词并作出是否唤醒成功的应答反馈;
语音发送模块用于向智能家居控制终端通过无线传输的方式传输唤醒成功后的用户语音;
其中,智能家居控制终端内置语音接收模块、语音识别模块、意图识别模块、指令控制模块、反馈模块;
语音接收模块用于接收唤醒成功后的用户语音并传输给语音识别模块;
语音识别模块用于识别唤醒成功后的用户语音并转化成文本文字信息;
意图识别模块用于将上述文本文字信息与存储的内定义意图匹配,识别出唤醒成功后的用户语音的意图;其中,每种内定义意图都有多种话术模板;
指令控制模块用于根据上述识别出的用户语音的意图生成控制指令,并发送给相应的智能家居设备以实现控制效果,同时接收智能家居设备是否控制生效的反馈;
反馈模块用于向用户随身终端反馈语音识别模块是否识别成功、意图识别模块是否识别成功、指令控制模块是否控制成功的信息;
其中,本发明的语音控制方法具体内容为:用户启动用户随身终端,并对着该用户随身终端说出唤醒词,唤醒识别模块如作出唤醒成功的应答,则用户说出想要控制的设备或场景,如作出唤醒失败的应答则用户继续说出唤醒词直至唤醒成功为止;语音识别模块对用户说出想要控制的设备或场景的语音信息进行识别,如识别成功则转化成文本文字信息,如识别失败则通过反馈模块向用户随身终端反馈识别失败的信息,用户重新说想要控制的设备或场景;意图识别模块通过将上述转化的文本文字信息与内定义意图的多种话术模板进行比较,如匹配出对应的内定义意图则向指令控制模块发送信息,如未匹配成功则用户需重新说想要控制的设备或场景;指令控制模块接收信息后生成控制指令,发送给相应的智能家居设备,如果智能家居设备实现对应的控制效果则整个过程结束,如果智能家居设备未控制生效则用户仍需重新说想要控制的设备或场景。
2.如权利要求1所述的一种智能家居语音控制方法,其特征在于,所述用户随身终端内还设置一唤醒词迭代模块,用于补充、更新唤醒词,其具体方法为:依据注册语音或者模板语音进行特征提取,构建唤醒模板,通过特征提取生成特征序列,计算特征序列和模板序列的距离,基于此判断是否成为唤醒词。
3.如权利要求1所述的一种智能家居语音控制方法,其特征在于,所述智能家居控制终端内还设置一意图迭代模块,用于补充、更新内定义意图,其具体方法为:定期通过大数据分析所有用户的话语描述,依此增加话术模板。
4.如权利要求1所述的一种智能家居语音控制方法,其特征在于,意图识别模块的内定义意图包括设备控制意图、设备状态查询意图、设备配置意图、房间配置意图、场景配置意图、设备配置到场景意图。
5.如权利要求1所述的一种智能家居语音控制方法,其特征在于,所述用户随身终端采用智能移动手机或智能平板电脑。
CN202111261606.7A 2021-10-28 2021-10-28 一种智能家居语音控制方法 Pending CN113992468A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111261606.7A CN113992468A (zh) 2021-10-28 2021-10-28 一种智能家居语音控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111261606.7A CN113992468A (zh) 2021-10-28 2021-10-28 一种智能家居语音控制方法

Publications (1)

Publication Number Publication Date
CN113992468A true CN113992468A (zh) 2022-01-28

Family

ID=79743210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111261606.7A Pending CN113992468A (zh) 2021-10-28 2021-10-28 一种智能家居语音控制方法

Country Status (1)

Country Link
CN (1) CN113992468A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115175415A (zh) * 2022-05-30 2022-10-11 青岛海尔科技有限公司 数字孪生光线调整方法、装置和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106054644A (zh) * 2016-06-30 2016-10-26 慧锐通智能科技股份有限公司 一种智能家居控制方法及系统
WO2016173189A1 (zh) * 2015-04-29 2016-11-03 中兴通讯股份有限公司 智能家居控制方法、装置及系统
CN106448664A (zh) * 2016-10-28 2017-02-22 魏朝正 一种通过语音控制智能家居设备的系统及方法
CN206388060U (zh) * 2017-01-13 2017-08-08 孙健 通过语音控制的穿戴式智能家居控制系统
CN108306797A (zh) * 2018-01-30 2018-07-20 百度在线网络技术(北京)有限公司 声控智能家居设备方法、系统、终端以及存储介质
CN110738994A (zh) * 2019-09-25 2020-01-31 北京爱接力科技发展有限公司 一种智能家居的控制方法、装置、机器人及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016173189A1 (zh) * 2015-04-29 2016-11-03 中兴通讯股份有限公司 智能家居控制方法、装置及系统
CN106054644A (zh) * 2016-06-30 2016-10-26 慧锐通智能科技股份有限公司 一种智能家居控制方法及系统
CN106448664A (zh) * 2016-10-28 2017-02-22 魏朝正 一种通过语音控制智能家居设备的系统及方法
CN206388060U (zh) * 2017-01-13 2017-08-08 孙健 通过语音控制的穿戴式智能家居控制系统
CN108306797A (zh) * 2018-01-30 2018-07-20 百度在线网络技术(北京)有限公司 声控智能家居设备方法、系统、终端以及存储介质
CN110738994A (zh) * 2019-09-25 2020-01-31 北京爱接力科技发展有限公司 一种智能家居的控制方法、装置、机器人及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115175415A (zh) * 2022-05-30 2022-10-11 青岛海尔科技有限公司 数字孪生光线调整方法、装置和系统

Similar Documents

Publication Publication Date Title
CN107342076B (zh) 一种兼容非常态语音的智能家居控制系统及方法
CN108766441A (zh) 一种基于离线声纹识别和语音识别的语音控制方法及装置
CN111341325A (zh) 声纹识别方法、装置、存储介质、电子装置
KR20170033722A (ko) 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치
CN101794126A (zh) 一种无线智能家电语音控制系统
WO2020238045A1 (zh) 智能语音识别方法、装置及计算机可读存储介质
EP3422344B1 (en) Electronic device for performing operation corresponding to voice input
CN105788596A (zh) 一种语音识别电视控制方法及系统
WO2014173325A1 (zh) 喉音识别方法及装置
CN109272991A (zh) 语音交互的方法、装置、设备和计算机可读存储介质
CN105700359A (zh) 一种语音识别智能家居控制方法及系统
CN114944153A (zh) 一种物联网终端增强唤醒方法、装置及存储介质
CN113992468A (zh) 一种智能家居语音控制方法
CN103426429A (zh) 语音控制方法和装置
CN111192586A (zh) 语音识别方法及装置、电子设备、存储介质
CN110718225A (zh) 一种语音控制方法、终端以及存储介质
KR20210001082A (ko) 사용자 발화를 처리하는 전자 장치와 그 동작 방법
CN112309396A (zh) 一种ai虚拟机器人状态动态设置系统
CN114999496A (zh) 音频传输方法、控制设备及终端设备
CN111128127A (zh) 一种语音识别处理方法及装置
US11967322B2 (en) Server for identifying false wakeup and method for controlling the same
CN115691478A (zh) 语音唤醒方法、装置、人机交互设备和存储介质
CN115841814A (zh) 语音交互方法及电子设备
CN112885341A (zh) 一种语音唤醒方法、装置、电子设备和存储介质
CN111933139A (zh) 一种离在线语音识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220128