CN106972990B - 基于声纹识别的智能家居设备 - Google Patents

基于声纹识别的智能家居设备 Download PDF

Info

Publication number
CN106972990B
CN106972990B CN201610025189.9A CN201610025189A CN106972990B CN 106972990 B CN106972990 B CN 106972990B CN 201610025189 A CN201610025189 A CN 201610025189A CN 106972990 B CN106972990 B CN 106972990B
Authority
CN
China
Prior art keywords
speaker
control unit
voiceprint recognition
unit
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610025189.9A
Other languages
English (en)
Other versions
CN106972990A (zh
Inventor
祝铭明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yutou Technology Hangzhou Co Ltd
Original Assignee
Yutou Technology Hangzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yutou Technology Hangzhou Co Ltd filed Critical Yutou Technology Hangzhou Co Ltd
Priority to CN201610025189.9A priority Critical patent/CN106972990B/zh
Publication of CN106972990A publication Critical patent/CN106972990A/zh
Application granted granted Critical
Publication of CN106972990B publication Critical patent/CN106972990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Projection Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)
  • Overhead Projectors And Projection Screens (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明属于智能设备技术领域,尤其涉及一种智能家居设备。基于声纹识别的智能家居设备,包括底座和设置于底座上的活动部,活动部上沿竖直方向设置一曲面显示屏,还包括:声纹识别单元,用于捕获声音信息,并依据声音信息确定说话人身份;说话人追踪单元,与控制单元连接,依据说话人身份追踪说话人以确定说话人方位;控制单元,与声纹识别单元和说话人追踪单元连接,依据说话人方位产生相应的控制信号;投射模组,与控制单元连接,于控制信号的作用下于一设定角度内可旋转地投射图像至曲面显示屏。以上技术方案可以对说话人进行准确识别和定位,并且显示界面可以始终朝向说话人,提高人机交互体验。

Description

基于声纹识别的智能家居设备
技术领域
本发明属于智能设备技术领域,尤其涉及一种智能家居设备。
背景技术
家用智能设备的一个重要特征是能够进行语音对话、语音互动。然而,在家庭实际应用环境中,由于室内环境中其它说话人的声音干扰及室内环境的墙壁、地面对声音的反射使得家用智能设备无法准确实现声源定位,及无法实现良好的互动,影响用户体验。
发明内容
为解决以上技术问题,本发明提供一种基于声纹识别的智能家居设备。
具体技术方案如下:
基于声纹识别的智能家居设备,其中,包括底座和设置于所述底座上的活动部,所述活动部上沿竖直方向设置一曲面显示屏,还包括:
声纹识别单元,用于捕获声音信息,并依据所述声音信息确定说话人身份;
说话人追踪单元,与所述控制单元连接,依据所述说话人身份追踪说话人以确定说话人方位;
控制单元,与所述声纹识别单元和所述说话人追踪单元连接,依据所述说话人方位产生相应的控制信号;
投射模组,与所述控制单元连接,于所述控制信号的作用下于一设定角度内可旋转地投射图像至所述曲面显示屏。
上述的基于声纹识别的智能家居设备,所述活动部沿竖直方向内置一旋转轴,所述旋转轴于一驱动单元的作用下旋转以带动所述活动部的曲面显示屏朝向所述说话人方位。
上述的基于声纹识别的智能家居设备,
所述驱动单元包括伺服电机,位于所述底座内;所述伺服电机的控制端与所述控制信号连接,所述伺服电机设有驱动轴,所述旋转轴连接于所述伺服电机的驱动轴上,于所述控制信号的作用下旋转。
上述的基于声纹识别的智能家居设备,
还包括第一LED灯组,设置于所述底座上,包括多个沿所述底座的顶部圆周方向均匀设置的LED灯,所述第一LED灯组的控制端连接所述控制单元,所述控制单元依据产生控制信号以点亮位于说话人方位方向的LED灯。
上述的基于声纹识别的智能家居设备,
所述活动部包括,
安装定位板,垂直于所述底座,与所述曲面显示屏配合设置,所述曲面显示屏的凹面朝向所述安装定位板;
第二LED灯组,设置于所述安装定位板上,包括多个围绕所述投射模组设置的LED灯,所述第二LED灯组的控制端与所述控制单元连接,于所述控制单元的作用下组合点亮。
上述的基于声纹识别的智能家居设备,所述声纹识别单元包括:
语音输入部,用于捕获语音信号;
预处理部,与所述语音输入部连接,用于对所述语音信号进行预处理;
特征提取部,与所述预处理部连接,用于获取所述语音信号中的第一特征参数和第二特征参数;
训练部,与所述特征提取部连接,用于建立每个家庭成员的语音模板;
模式匹配部,与所述训练部连接,依据所述声学模型对待测语音信号进行模式匹配,确认说话人身份。
上述的基于声纹识别的智能家居设备,所述说话人追踪单元包括,
图像捕获部,用于捕获房间内的用户人脸图像;
存储部,用于存储有家庭成员的声纹信息及相匹配的人脸图像特征信息;
特征匹配部,与所述图像捕获部和所述存储部连接,依据确定的说话人身份信息判断与所述说话人身份信息相匹配的用户人脸图像,以确定说话人方位。
上述的基于声纹识别的智能家居设备,还包括光线传感器,设置于所述活动部内,用于感受室内光线的强弱,所述光线传感器的信号输出端与所述控制单元连接,所述控制单元依据室内光线的强弱产生相应的控制信号以控制外部设备的开启或关闭;
和/或,
还包括温度传感器,设置于所述活动部内,用于感受室内温度,所述温度传感器的信号输出端与所述控制单元连接,所述控制单元依据室内温度的高低以产生相应的控制信号以控制一外部温度调节装置的开启或关闭。
上述的基于声纹识别的智能家居设备,所述控制单元设有一云端网络接口,通过所述云端网络接口与云端网络连接。
上述的基于声纹识别的智能家居设备,所述投射模组采用基于数字光处理器的投影装置。
有益效果:以上技术方案可以对说话人进行准确识别和定位,并且显示界面可以始终朝向说话人,提高人机交互体验。
附图说明
图1为本发明的电路结构示意图;
图2为本发明的结构示意图;
图3为本发明的活动部的结构示意图;
图4为本发明的声纹识别单元的电路结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
参照图1、图2、图3,基于声纹识别的智能家居设备,其中,包括底座1和设置于底座1上的活动部2,活动部2上沿竖直方向设置一曲面显示屏22,还包括:
声纹识别单元34,用于捕获声音信息,并依据声音信息确定说话人身份;
说话人追踪单元31,与控制单元连接,依据说话人身份追踪说话人以确定说话人方位;
控制单元32,与声纹识别单元34和说话人追踪单元31连接,依据说话人方位产生相应的控制信号;
投射模组,与控制单元32连接,于控制信号的作用下于一设定角度内可旋转地投射图像至曲面显示屏。
上述的基于声纹识别的智能家居设备,活动部2沿竖直方向内置一旋转轴,旋转轴于一驱动单元的作用下旋转以带动活动部2的曲面显示屏朝向说话人方位。
上述的基于声纹识别的智能家居设备,
驱动单元包括伺服电机11,位于底座1内;伺服电机11的控制端与控制信号连接,伺服电机11设有驱动轴,旋转轴连接于伺服电机11的驱动轴上,于控制信号的作用下旋转。
上述的基于声纹识别的智能家居设备,
还包括第一LED灯组37,设置于底座1上,包括多个沿底座1的顶部圆周方向均匀设置的LED灯,第一LED灯组的控制端连接控制单元32,控制单元32依据产生控制信号以点亮位于说话人方位方向的LED灯。
上述的基于声纹识别的智能家居设备,
活动部2包括,
安装定位板21,垂直于底座1,与曲面显示屏22配合设置,曲面显示屏22的凹面朝向安装定位板21;
第二LED灯组38,设置于安装定位板上21,包括多个围绕投射模组23设置的LED灯24,第二LED灯组38的控制端与控制单元32连接,于控制单元32的作用下组合点亮。
上述的基于声纹识别的智能家居设备,参照图4,声纹识别单元34可以包括:
语音输入部341,用于捕获语音信号;
预处理部342,与语音输入部341连接,用于对语音信号进行预处理;
特征提取部343,与预处理部342连接,用于获取语音信号中的第一特征参数和第二特征参数;
训练部344,与特征提取部343连接,用于建立每个家庭成员的语音模板;
模式匹配部345,与训练部344连接,依据声学模型对待测语音信号进行模式匹配,确认说话人身份。
上述的基于声纹识别的智能家居设备,说话人追踪单元31包括,
图像捕获部,用于捕获房间内的用户人脸图像;
存储部,用于存储有家庭成员的声纹信息及相匹配的人脸图像特征信息;
特征匹配部,与图像捕获部和存储部连接,依据确定的说话人身份信息判断与说话人身份信息相匹配的用户人脸图像,以确定说话人方位。
上述的基于声纹识别的智能家居设备,还包括光线传感器35,设置于活动部2内,用于感受室内光线的强弱,光线传感器35的信号输出端与控制单元32连接,控制单元32依据室内光线的强弱产生相应的控制信号以控制外部设备的开启或关闭;
和/或,
还包括温度传感器36,设置于活动部2内,用于感受室内温度,温度传感器36的信号输出端与控制单元32连接,控制单元32依据室内温度的高低以产生相应的控制信号以控制一外部温度调节装置的开启或关闭。
上述的基于声纹识别的智能家居设备,控制单元32设有一云端网络接口,通过云端网络接口与云端网络连接。
上述的基于声纹识别的智能家居设备,投射模组23可以采用基于数字光处理器的投影装置。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (7)

1.基于声纹识别的智能家居设备,其特征在于,包括底座和设置于所述底座上的活动部,所述活动部上沿竖直方向设置一曲面显示屏,还包括:
声纹识别单元,用于捕获声音信息,并依据所述声音信息确定说话人身份;
说话人追踪单元,与所述声纹识别单元连接,依据所述说话人身份追踪说话人以确定说话人方位;
控制单元,与所述声纹识别单元和所述说话人追踪单元连接,依据所述说话人方位产生相应的控制信号;
投射模组,与所述控制单元连接,于所述控制信号的作用下于一设定角度内可旋转地投射图像至所述曲面显示屏;
安装定位板,垂直于所述底座,与所述曲面显示屏配合设置,所述曲面显示屏的凹面朝向所述安装定位板;
第二LED灯组,设置于所述安装定位板上,包括多个围绕所述投射模组设置的LED灯,所述第二LED灯组的控制端与所述控制单元连接,于所述控制单元的作用下组合点亮;
还包括第一LED灯组,设置于所述底座上,包括多个沿所述底座的顶部圆周方向均匀设置的LED灯,所述第一LED灯组的控制端连接所述控制单元,所述控制单元依据产生控制信号以点亮位于说话人方位方向的LED灯;
所述说话人追踪单元包括,
图像捕获部,用于捕获房间内的用户人脸图像;
存储部,用于存储有家庭成员的声纹信息及相匹配的人脸图像特征信息;
特征匹配部,与所述图像捕获部和所述存储部连接,依据确定的说话人身份信息判断与所述说话人身份信息相匹配的用户人脸图像,以确定说话人方位。
2.根据权利要求1所述的基于声纹识别的智能家居设备,其特征在于,
所述活动部沿竖直方向内置一旋转轴,所述旋转轴于一驱动单元的作用下旋转以带动所述活动部的曲面显示屏朝向所述说话人方位。
3.根据权利要求2所述的基于声纹识别的智能家居设备,其特征在于,
所述驱动单元包括伺服电机,位于所述底座内;所述伺服电机的控制端与所述控制单元连接,所述伺服电机设有驱动轴,所述旋转轴连接于所述伺服电机的驱动轴上,于所述控制信号的作用下旋转。
4.根据权利要求1所述的基于声纹识别的智能家居设备,其特征在于,所述声纹识别单元包括:
语音输入部,用于捕获语音信号;
预处理部,与所述语音输入部连接,用于对所述语音信号进行预处理;
特征提取部,与所述预处理部连接,用于获取所述语音信号中的第一特征参数和第二特征参数;
训练部,与所述特征提取部连接,用于建立每个家庭成员的语音模板;
模式匹配部,与所述训练部连接,依据一声学模型对待测语音信号进行模式匹配,确认说话人身份。
5.根据权利要求1所述的基于声纹识别的智能家居设备,其特征在于,还包括光线传感器,设置于所述活动部内,用于感受室内光线的强弱,所述光线传感器的信号输出端与所述控制单元连接,所述控制单元依据室内光线的强弱产生相应的控制信号以控制外部设备的开启或关闭;
和/或,
还包括温度传感器,设置于所述活动部内,用于感受室内温度,所述温度传感器的信号输出端与所述控制单元连接,所述控制单元依据室内温度的高低以产生相应的控制信号以控制一外部温度调节装置的开启或关闭。
6.根据权利要求1所述的基于声纹识别的智能家居设备,其特征在于,所述控制单元设有一云端网络接口,通过所述云端网络接口与云端网络连接。
7.根据权利要求1所述的基于声纹识别的智能家居设备,其特征在于,所述投射模组采用基于数字光处理器的投影装置。
CN201610025189.9A 2016-01-14 2016-01-14 基于声纹识别的智能家居设备 Active CN106972990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610025189.9A CN106972990B (zh) 2016-01-14 2016-01-14 基于声纹识别的智能家居设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610025189.9A CN106972990B (zh) 2016-01-14 2016-01-14 基于声纹识别的智能家居设备

Publications (2)

Publication Number Publication Date
CN106972990A CN106972990A (zh) 2017-07-21
CN106972990B true CN106972990B (zh) 2020-06-02

Family

ID=59335229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610025189.9A Active CN106972990B (zh) 2016-01-14 2016-01-14 基于声纹识别的智能家居设备

Country Status (1)

Country Link
CN (1) CN106972990B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107643886A (zh) * 2017-09-29 2018-01-30 联想(北京)有限公司 一种多媒体设备及控制方法
CN108111538A (zh) * 2018-01-25 2018-06-01 芜湖应天光电科技有限责任公司 基于声纹识别技术的智能投影仪语音控制系统及其方法
CN108908377B (zh) * 2018-07-06 2020-06-23 达闼科技(北京)有限公司 说话人识别方法、装置和机器人
CN109379259B (zh) * 2018-09-27 2020-12-15 四川长虹电器股份有限公司 一种根据声音设置智能家居设备局域网地址的方法
CN110808048B (zh) * 2019-11-13 2022-10-25 联想(北京)有限公司 语音处理方法、装置、系统及存储介质
CN111147897A (zh) * 2019-11-20 2020-05-12 恒大智慧科技有限公司 智慧旅游景区内全身照的自动生成方法、设备及存储介质
CN111614928B (zh) * 2020-04-28 2021-09-28 深圳市鸿合创新信息技术有限责任公司 定位方法、终端设备及会议系统
CN113284490B (zh) * 2021-04-23 2022-09-09 歌尔股份有限公司 电子设备的控制方法、装置、设备及可读存储介质
CN113764094B (zh) * 2021-10-09 2023-07-07 哈尔滨思哲睿智能医疗设备股份有限公司 医疗设备的控制方法、计算设备、医疗设备及存储介质
CN115494961B (zh) * 2022-11-17 2023-03-24 南京熊大巨幕智能科技有限公司 基于人脸识别的新型交互式环绕智能显示设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270451A (zh) * 2011-08-18 2011-12-07 安徽科大讯飞信息科技股份有限公司 说话人识别方法及系统
CN104951077A (zh) * 2015-06-24 2015-09-30 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法、装置和终端设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6241046B2 (ja) * 2013-03-11 2017-12-06 株式会社リコー 通信管理システム、プログラム及び再生制御方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270451A (zh) * 2011-08-18 2011-12-07 安徽科大讯飞信息科技股份有限公司 说话人识别方法及系统
CN104951077A (zh) * 2015-06-24 2015-09-30 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法、装置和终端设备

Also Published As

Publication number Publication date
CN106972990A (zh) 2017-07-21

Similar Documents

Publication Publication Date Title
CN106972990B (zh) 基于声纹识别的智能家居设备
CN106346487B (zh) 交互式vr沙盘展示机器人
KR101972545B1 (ko) 음성 명령을 통한 위치 기반 음성 인식 시스템
CN110199254B (zh) 用于控制多个光源的控制器
US11118779B2 (en) Luminaire with an integrated speaker
US20180232571A1 (en) Intelligent assistant device communicating non-verbal cues
US20170048611A1 (en) Automatically controlled directional speaker, and lamp thereof
KR20180062746A (ko) 음성 신호를 입력 또는 출력하는 램프 장치 및 상기 램프 장치의 구동 방법
TW201805744A (zh) 控制系統、控制處理方法及裝置
JP6759445B2 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
CN206555794U (zh) 一种智能翻译台灯
US10838677B1 (en) Device-layout determinations
US10586555B1 (en) Visual indication of an operational state
CN106970698A (zh) 家用智能设备
CN106775572A (zh) 具有麦克风阵列的电子设备及其控制方法
CN203801112U (zh) 智能led照明系统
CN105225371A (zh) 敲门声音识别门铃唤醒系统
CN206212383U (zh) 语音控制照明系统
US20210392433A1 (en) Loudspeaker device, method, apparatus and device for adjusting sound effect thereof, and medium
CN106340214B (zh) 基于交互式投影的智能客厅儿童学习系统及方法
US20220270601A1 (en) Multi-modal smart audio device system attentiveness expression
CA2776856A1 (en) Voice recognition motion sensing touch free toilet seat raising and lowering assembly
WO2018006362A1 (zh) 虚拟机器人的音频输入装置和虚拟机器人设备
CN111903194B (zh) 使用连接的照明系统来增强语音命令的系统和方法
US10062394B2 (en) Voice band detection and implementation

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant