CN110428815A - 一种基于语音识别技术的智能家居语音交互系统及方法 - Google Patents

一种基于语音识别技术的智能家居语音交互系统及方法 Download PDF

Info

Publication number
CN110428815A
CN110428815A CN201910706095.1A CN201910706095A CN110428815A CN 110428815 A CN110428815 A CN 110428815A CN 201910706095 A CN201910706095 A CN 201910706095A CN 110428815 A CN110428815 A CN 110428815A
Authority
CN
China
Prior art keywords
voice command
voice
user
computer system
board computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910706095.1A
Other languages
English (en)
Inventor
陆成湘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ge Yin Intelligent Technology (shanghai) Co Ltd
Original Assignee
Ge Yin Intelligent Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ge Yin Intelligent Technology (shanghai) Co Ltd filed Critical Ge Yin Intelligent Technology (shanghai) Co Ltd
Priority to CN201910706095.1A priority Critical patent/CN110428815A/zh
Publication of CN110428815A publication Critical patent/CN110428815A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C23/00Non-electrical signal transmission systems, e.g. optical systems
    • G08C23/04Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种基于语音识别技术的智能家居语音交互系统及方法,包括单板机系统、红外信号接收器、红外信号发射器、麦克风、操作界面和云服务器,该系统允许用户定义和创建自己喜欢的语音命令和相对应的系统响应。无需对系统做任何设置和调整,用户可以用任何语种、地方方言或自己的习惯用语作为语音命令来训练系统。对语音命令的用词、语序没有任何要求,完全由用户按自己的爱好,自由定义。系统对每一个用户的语音命令仅需从该用户收集一个他的语音样本,来完成语音模型训练。从而该系统能够让个人或小人数群体的每个用户用自定义的语音命令,来执行命令功能。

Description

一种基于语音识别技术的智能家居语音交互系统及方法
技术领域
本发明涉及智能家居领域,特别涉及一种基于语音识别技术的智能家居语音交互系统及方法。
背景技术
大部分70岁以上的老人家认为,自己上了年纪,接受新事物很困难,家电最好是一键式的,功能也不必多。许多“智能化”家电产品,操作复杂、功能繁多,往往让许老年人无从下手。现在的智能家电市场竞争激烈,多数大品牌的家电企业都在研发上大手笔投入,目的就是拿出更多的新产品来满足市场需求,这些新产品几乎无一例外都倾向于高端化、智能化。而老年消费群体在智能家电方面的消费需求有其特殊性,操作程序简洁,功能划分简单的产品或许更能契合他们的需求。
老人比年轻人更需要智能家居产品。一方面,年轻人大多忙于工作,在家的时间要远远少于老人;另一方面,老年人由于记忆力和运动力下降,更需要智能设备的帮助。据奥维咨询预测,仅在城镇空巢老年人家庭,每年产生的老年家电需求规模就超过了600个亿。因此企业在研制高端智能家电的同时,也应兼顾简单实用的老年人实用产品类型,就像当年相机中的“傻瓜机”,以及现在手机中的“老人机”一样。毕竟,消费者的需求,才是生产者的指南针。
随着智能家庭技术的推进,已有部分的智能设备可以实现语音操控,只需要下达口令,就可以实现遥控器的部分功能。语音下达和实现“打开电视机”“调至某个电视频道”“增加、减少音量”等功能,根据不同智能音箱的各自设置功能,还可以链接灯光、空调、电扇等设备。
针对老年和儿童用户,现有的智能语音系统有以下几个缺点:
1.需要记住语音命令的使用方法,语言要符合语法,不能随心所欲地完全按照自己的语言习惯。比如询问播报天气,遥控冰箱和洗衣机等家用电器。需要学习和适应系统设定好的使用方法,记住系统可以准确识别的词句。
2.需要准确记住语音命令涉及的相关内容,比如电视剧名、歌曲名等等。
3.语音命令中混有外语或方言时,常常无法获得正确的结果。普通话发音精准度要求高。比如普通话中混入上海方言,系统可能就识别不出来。
4.大多数语音遥控器只能用于自家品牌和搜索特定服务提供商的线视频资源。不能同样用于其它品牌的家用电器。
5.在设定用声音控制家里的其他电器时,为实现模拟红外遥控器操作红外遥控电器,比如:电视、空调、电视机顶盒、风扇、音响等等,步骤复杂。
6.方言识别时,只能选择一种,不能同时应对几种方言。
7.需要联网使用。在网络连接出状况时,无法使用。
以上这些问题,对老年和年幼儿童用户会造成很大的负担。
发明内容
为了解决上述问题,本发明提供一种基于语音识别技术的智能家居语音交互系统及方法,是一种为家庭或其他小人数群体用户提供由用户定义及训练的有限语音响应的语音识别系统,该系统允许单个或多个用户定义和创建自己喜欢的语音命令和相对应的系统响应,无需对系统做任何设置和调整,用户可以用任何语种、地方方言或自己的习惯用语作为语音命令来训练系统,对语音命令的用词、语序没有任何要求,完全由用户按自己的爱好,自由定义。系统对每一个用户的语音命令仅需从该用户收集一个他的语音样本,来完成语音模型训练。从而该系统对特定小人数群体的每个用户自定义的语音命令,来执行命令功能。
本发明中的一种基于语音识别技术的智能家居语音交互系统,包括单板机系统、红外信号接收器、红外信号发射器、麦克风、操作界面和云服务器,所述红外信号接收器与单板机系统连接,所述红外信号发射器与单板机系统连接,所述单板机系统与云服务器连接,所述麦克风与单板机系统连接,所述操作界面与单板机系统连接,所述操作界面上设有录音键和接收信号键。
上述方案中,一种基于语音识别技术的智能家居语音交互系统的方法包括以下步骤:
步骤S1:红外遥控命令学习:按接收信号键,通过红外信号接收器,录取红外信号串,并将录制好的红外信号串编码转换为文本格式保存至单板机系统;
步骤S2:语音命令学习:在操作界面上按录音键,对着麦克风用户用英文、日语、中文、方言、习惯用语或其它语言,生成语音命令,并保存在单板机系统中;
步骤S3:声学模型训练:将用户收集的语音命令样本,传送至云服务器,训练声学模型,训练好的声学模型保存在单板机系统中;
步骤S4:语音遥控操作:在操作界面上按录音键,使系统处于等待用户的语音输入状态,用户说出语音命令,红外信号发射器发出对应的红外信号串遥控家用电器。
上述方案中,所述步骤S1中红外信号录取时,可记录红外信号本身和每个红外遥控操作动作间的间隔时长。
上述方案中,所述步骤S1中的红外信号串与步骤S2中的语音命令相互对应。
上述方案中,所述步骤S2中每个语音命令只需录制一次。
本发明的优点和有益效果在于:本发明提供一种基于语音识别技术的智能家居语音交互系统及方法,通过收集用户自己定义的语音命令,训练声学模型,记录相匹配的单个或多个遥控器发出的红外信号串,或其他功能,实现用户以自己定义的语音命令,对家用电器进行单或多步骤的遥控操作,或其他服务,避免了用户使用多个遥控器的手动操作。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的系统框图。
图2为本发明的流程图。
图中:1、单板机系统 2、红外信号接收器 3、红外信号发射器 4、麦克风 5、操作界面 6、云服务器
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,本发明是一种基于语音识别技术的智能家居语音交互系统,包括单板机系统1、红外信号接收器2、红外信号发射器3、麦克风4、操作界面5和云服务器6,红外信号接收器2与单板机系统1连接,红外信号发射器3与单板机系统1连接,单板机系统1与云服务器6连接,麦克风4与单板机系统1连接,操作界面5与单板机系统1连接,操作界面5上设有录音键和接收信号键。
如图2所示,一种基于语音识别技术的智能家居语音交互系统的方法,包括以下步骤:
步骤S1:红外遥控命令学习:按接收信号键,通过红外信号接收器2,录取红外信号串,此信号串可来自于一个或多个不同种类的红外遥控器,并将录制好的红外信号串编码转换为文本格式保存至单板机系统1;红外信号的录取是在用遥控器对家用电器进行实际操作时进行的。比如,语音命令“打开空调和电视”,对应的红外信号录取操作如下:
1、按空调遥控器的“开/关”健,并确认空调启动;
2、按电视遥控的“Power”健,确认电视开机;
3、操作机顶盒遥控器,确认想看的电视频道出现为止。
红外命令录取时,不但记录红外信号本身,也记录每个红外遥控操作动作间的间隔时长。这是为了适应电视频道调整时,由于各种额外因素(比如开屏广告等),需要等足够长的时间才能做下一步的红外遥控操作。
步骤S2:语音命令学习:在操作界面上按录音键,对着麦克风4用户用自己的语言,如英文、日语、中文、方言、习惯用语或其它语言,命令可以是任意发音的组合,无需遵循文字语法标准,生成一个或者多个语音命令,并保存在单板机系统1中,每个语音命令只需录制一次,同一个系统可以支持一个或多个用户。根据需要,每个用户可以学习一个或多个语音命令;其中,每个语音命令对应一组红外信号,可以一对一、多对一、多对多和一对多;
S3:声学模型训练:将用户收集的语音命令样本,每一个语音命令收集一个语音样本,传送至云服务器6,训练声学模型,训练好的声学模型保存在单板机系统1中,保证系统在用户使用这些语音命令时达到很高的精准度;完成以上三个“命令学习”步骤以后,用户就可以用系统进行语音遥控操作了;
S4:语音遥控操作:在操作界面5上按录音键,使系统处于等待用户的语音输入状态,用户说出语音命令,红外信号发射器3发出对应的红外信号串遥控家用电器。比如:语音命令“打开空调和电视”,就可以用来打开空调和电视,并调到在“学习”时定好的电视频道。声学模型足够鲁棒,在用户发出的语音命令时,即使语速和音量与训练样本不同,也不会影响语音识别的精度。
本发明的优点:基于个性化的声学模型,可以为用户解决现有智能家居语音交互的问题,为用户带来以下便利:
1、无需记住别人定义的语音命令和语法习惯,可以完全按照自己的语言习惯来定义的语音命令。如电视剧《爵迹临界天下》,用户只记住了剧里有“灵术师”而记不住剧名,老年或幼年用户就可以用自己记得住的语音命令,比如“看灵术师”等等,而不是难记的“爵迹临界天下”;
2、一个语音命令中可以混有外语或方言发音,如用语音命令“看RomeEmpire”,不会对识别精度有任何影响;
3、拥有用户个性化语音命令学习功能和红外遥控命令的学习功能。只要是红外遥控器,不分品牌和服务提供商,都能学会,无需担心软硬件是否匹配,也无需预装任何遥控器配置文件,就能实现对不同品牌遥控器的学习和使用。
4、除语音命令的声学模型训练,系统无需联网使用,操作更便捷,不会因为网络线路存在问题的时候影响实时使用。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于语音识别技术的智能家居语音交互系统,其特征在于,包括单板机系统、红外信号接收器、红外信号发射器、麦克风、操作界面和云服务器,所述红外信号接收器与单板机系统连接,所述红外信号发射器与单板机系统连接,所述单板机系统与云服务器连接,所述麦克风与单板机系统连接,所述操作界面与单板机系统连接,所述操作界面上设有录音键和接收信号键。
2.根据权利要求1所述的一种基于语音识别技术的智能家居语音交互系统的方法,其特征在于,包括以下步骤:
步骤S1:红外遥控命令学习:按接收信号键,通过红外信号接收器,录取红外信号串,并将录制好的红外信号串编码转换为文本格式保存至单板机系统;
步骤S2:语音命令学习:在操作界面上按录音键,对着麦克风用户用英文、日语、中文、方言、习惯用语或其它语言,生成语音命令,并保存在单板机系统中;
步骤S3:声学模型训练:将用户收集的语音命令样本,传送至云服务器,训练声学模型,训练好的声学模型保存在单板机系统中;
步骤S4:语音遥控操作:在操作界面上按录音键,使系统处于等待用户的语音输入状态,用户说出语音命令,红外信号发射器发出对应的红外信号串遥控家用电器。
3.根据权利要求2所述的一种基于语音识别技术的智能家居语音交互方法,其特征在于,所述步骤S1中红外信号录取时,记录红外信号本身以及每个红外遥控操作动作间的间隔时长。
4.根据权利要求2所述的一种基于语音识别技术的智能家居语音交互方法,其特征在于,所述步骤S1中的红外信号串与步骤S2中的语音命令相互对应。
5.根据权利要求2所述的一种基于语音识别技术的智能家居语音交互方法,其特征在于,所述步骤S2中每个语音命令只需录制一次。
CN201910706095.1A 2019-08-01 2019-08-01 一种基于语音识别技术的智能家居语音交互系统及方法 Pending CN110428815A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910706095.1A CN110428815A (zh) 2019-08-01 2019-08-01 一种基于语音识别技术的智能家居语音交互系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910706095.1A CN110428815A (zh) 2019-08-01 2019-08-01 一种基于语音识别技术的智能家居语音交互系统及方法

Publications (1)

Publication Number Publication Date
CN110428815A true CN110428815A (zh) 2019-11-08

Family

ID=68411985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910706095.1A Pending CN110428815A (zh) 2019-08-01 2019-08-01 一种基于语音识别技术的智能家居语音交互系统及方法

Country Status (1)

Country Link
CN (1) CN110428815A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179572A (zh) * 2019-12-31 2020-05-19 四川声达创新科技有限公司 一种引导式智能语音系统
CN112399222A (zh) * 2020-11-10 2021-02-23 深圳创维-Rgb电子有限公司 智能电视的语音指令学习方法、装置、智能电视及介质
CN117008493A (zh) * 2023-09-26 2023-11-07 广州科宗智能科技有限公司 基于智慧声控的无网关家居控制调节系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106023995A (zh) * 2015-08-20 2016-10-12 漳州凯邦电子有限公司 一种语音识别方法及运用该方法的穿戴式语音控制设备
CN107168082A (zh) * 2017-06-20 2017-09-15 王付源 一种利用语音技术针对传统家居的智能控制系统
CN109785832A (zh) * 2018-12-20 2019-05-21 安徽声讯信息技术有限公司 一种适用于重口音的老人机顶盒智能语音识别方法
CN109949808A (zh) * 2019-03-15 2019-06-28 上海华镇电子科技有限公司 兼容普通话和方言的语音识别家电控制系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106023995A (zh) * 2015-08-20 2016-10-12 漳州凯邦电子有限公司 一种语音识别方法及运用该方法的穿戴式语音控制设备
CN107168082A (zh) * 2017-06-20 2017-09-15 王付源 一种利用语音技术针对传统家居的智能控制系统
CN109785832A (zh) * 2018-12-20 2019-05-21 安徽声讯信息技术有限公司 一种适用于重口音的老人机顶盒智能语音识别方法
CN109949808A (zh) * 2019-03-15 2019-06-28 上海华镇电子科技有限公司 兼容普通话和方言的语音识别家电控制系统和方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179572A (zh) * 2019-12-31 2020-05-19 四川声达创新科技有限公司 一种引导式智能语音系统
CN112399222A (zh) * 2020-11-10 2021-02-23 深圳创维-Rgb电子有限公司 智能电视的语音指令学习方法、装置、智能电视及介质
CN117008493A (zh) * 2023-09-26 2023-11-07 广州科宗智能科技有限公司 基于智慧声控的无网关家居控制调节系统

Similar Documents

Publication Publication Date Title
CN110428815A (zh) 一种基于语音识别技术的智能家居语音交互系统及方法
CN102196207B (zh) 语音控制电视机的方法、装置和系统
JP6482911B2 (ja) 機器制御方法および電気機器
EP3480817A1 (en) Voice interactive device and method for controlling voice interactive device
WO2013128999A1 (ja) 機器操作システム、機器操作装置、サーバ、機器操作方法およびプログラム
EP0911808B1 (en) Speech interface in a home network environment
CN102819969B (zh) 多媒体教育平台的实现方法及多媒体教育平台系统
US20150331665A1 (en) Information provision method using voice recognition function and control method for device
CN106056996A (zh) 一种多媒体交互教学系统及方法
CN105126355A (zh) 儿童陪伴机器人与儿童陪伴系统
CN102439661A (zh) 用于车辆内自动交互的面向服务语音识别
CN105122177A (zh) 用户监控和目的确定的系统和方法
CN202547006U (zh) 万能空调声控遥控器
CN103546790A (zh) 基于移动终端与互动电视语言交互的方法及系统
CN103731711A (zh) 智能电视对于操作的执行方法和系统
Jimenez et al. Alexa-based voice assistant for smart home applications
CN114464180A (zh) 一种智能设备及智能语音交互方法
JP5020593B2 (ja) 外国語学習通信システム
CN109271503A (zh) 智能问答方法、装置、设备及存储介质
CN202190331U (zh) 语音控制电视机的系统和装置
CN106340214B (zh) 基于交互式投影的智能客厅儿童学习系统及方法
CN109272983A (zh) 用于亲子教育的双语切换装置
CN114299939A (zh) 一种智能设备、智能家居的语音控制设备及控制方法
CN113608449B (zh) 一种智慧家庭场景下语音设备定位系统及自动定位方法
CN111552794B (zh) 提示语生成方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191108

RJ01 Rejection of invention patent application after publication