CN112700773A - 一种基于语音控制展厅的方法及控制系统 - Google Patents

一种基于语音控制展厅的方法及控制系统 Download PDF

Info

Publication number
CN112700773A
CN112700773A CN202011543435.2A CN202011543435A CN112700773A CN 112700773 A CN112700773 A CN 112700773A CN 202011543435 A CN202011543435 A CN 202011543435A CN 112700773 A CN112700773 A CN 112700773A
Authority
CN
China
Prior art keywords
voice
face
staff
coordinates
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011543435.2A
Other languages
English (en)
Inventor
钟生
彭鹏
汪刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Jinren Technology Co ltd
Original Assignee
Hefei Jinren Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Jinren Technology Co ltd filed Critical Hefei Jinren Technology Co ltd
Priority to CN202011543435.2A priority Critical patent/CN112700773A/zh
Publication of CN112700773A publication Critical patent/CN112700773A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明一种基于语音控制展厅的方法,包括门禁单元确认人员是否为工作人员,如果是则进入步骤二;确认为访客后,则进入步骤三;步骤二:门禁解除,此时为普通模式,工作人员进入展厅内;步骤三:此时为会客模式,展厅内的灯光和空调自动开启,语音交互系统管理主机自动唤醒;步骤四:工作人员通过语音控制智能设备;步骤五:工作人员通过语音交互系统管理主机对访客进行解说;步骤六:工作人员发出播放指令,显示屏播放介绍的内容;步骤七:访客参观结束后,工作人员同样语音控制设备关闭。通过语音对展厅的智能设备进行控制,能够免去人工操作各种设备的麻烦,可远距离控制相关的设备,能够实现人与设备的自由沟通,增强人们参观体验的感受。

Description

一种基于语音控制展厅的方法及控制系统
技术领域
本发明涉及展厅控制技术领域,具体来说是一种基于语音控制的展厅系统及方法。
背景技术
随着经济的发展,各种展示人文、历史、企业形象等展厅越来越多。但是,现有的展厅大多都是通过人工讲解和手动操作去演示,一方面会花费讲解人员较多的时间,另一方面容易产生操作失误,给参观者带来的体验感较差,同时展厅的整体科技感也不强,互动交流较少。
如申请号为202010576960.8公开的一种智慧展厅智能控制系统,针对现有技术中存在的技术问题,提供一种智慧展厅智能控制系统,所述中控模块与人工智能模块、数据库模块、电器元件部分和展示终端模块分别通信连接,所述人工智能模块与数据库模块、展示终端模块分别通信连接,所述展示终端模块和数据库模块通信连接。针对这种交互不方便性,引入了人工智能的图形识别和语音识别技术,使得管理员和体验者不需要再附带任何控制设备,只通过人脸和语音就能对整个展厅进行权限管理和控制交互。该系统虽然一定程度上能够实现语音控制,但是展厅无法识别工作人员和访客,无法根据工作人员和访客做出对应的反馈。
发明内容
本发明所要解决的技术问题在于提供一种根据进入展厅的是工作人员或是访客提供不同展厅模式。
本发明通过以下技术手段实现解决上述技术问题的:
一种基于语音控制展厅的方法,包括以下步骤:
步骤一:门禁单元采集人脸信息数据,确认人员是否为工作人员,如果是则进入步骤二;如果不是工作人员,确认为访客后,则进入步骤三;
步骤二:确认为工作人员后,门禁解除,此时为普通模式,工作人员进入展厅内;
步骤三:此时为会客模式,展厅内的灯光和空调自动开启,语音交互系统管理主机自动唤醒,智能语音主机播报致欢迎词和序言介绍,播报环境探测器监测到的数据;
步骤四:需要调整展厅的灯光、空调等智能设备,工作人员对智能语音主机说出意图,语音交互系统管理主机理解意图并响应,并发出控制指令给ZigBee网关,进而控制相对应的智能设备;工作人员还可以对移动终端,比如手机、对讲机说出控制指令,通过无线AP也能够语音控制各个设备的运行;
步骤五:工作人员走到相应的展示区内,通过话筒进行提问,语音交互系统管理主机进行处理,对访客进行解说;
步骤六:工作人员需要在显示屏上展示介绍信息时,发出播放指令,显示屏播放介绍的内容,工作人员可以通过语音控制播放过程中的音量大小、暂停、切换等功能;
步骤七:访客参观结束后,工作人员对智能语音主机说出关闭智能设备的指令,智能语音主机响应,语音交互系统管理主机控制相应的设备关闭。
通过语音对展厅的智能设备进行控制,能够免去人工操作各种设备的麻烦,可远距离控制相关的设备,能够实现人与设备的自由沟通,增强人们参观体验的感受。
进一步的,语音交互的具体过程为:
1)首先对接收到的声音信号预加重,并进行分帧操作;具体的是在声音信号的频域乘以系数K,系数K跟频率成正相关;
s’n=sn-k*sn-1
对预加重后的声音信号乘以凯泽窗函数进行分帧,形成多个波形段;
Figure BDA0002853368430000022
其中,I0是第一类零阶贝塞尔函数,M为窗的个数,n窗的长度,w(n)为频谱函数,β是用来调整窗函数性能的参数,此处β选8.5;
2)对多个波形段进行快速傅里叶变换得到对应的频谱,将上面的频谱通过Mel滤波器组得到Mel频谱;在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC,生成每帧的MFCC特征向量;
3)预先构建声学模型和语言模型,通过大量标注的语音数据训练声学模型,通过大量标注的文本数据训练语言模型;声学模型用于把语音输入转换层声学表示的输入,在声学模型给出发音序列之后,从候选的文字序列中找出概率最大的字符串序列;
4)对声音信号对应的指令转化为可识别的语言,包括:确定指令的领域,理解指令的意图、定位词槽;
5)处理用户的真实的意图,做出相应的回答反馈。
进一步的,门禁单元的工作过程为:
1)预先获取人脸图像;
2)对获取到的人脸图像进行烧苗检测,生成于候选区域对应的人脸坐标;
3)根据人脸坐标生成双眼的坐标,在候选区域内通过人脸坐标和双眼的坐标生成人脸面部特征向量(其中需要对候选区域进行平移、旋转和缩放,形成具有预定大小的标准化图像,其中双眼的坐标链接到预定位置,对人脸图像进行归一化处理),保存在服务器内,形成人脸数据库;
4)将待验证的人脸采集图像与人脸数据库中的特征向量进行比较,计算距离值,比较距离值与相似性阈值,确定人员的身份,完成识别的过程。
本发明还提供一种基于语音控制展厅的系统,包括语音交互系统管理主机、智能语音主机、物联控制主机、环境探测器、门禁单元、ZigBee网关、无线AP、智能设备;
所述语音交互系统管理主机、智能语音主机、环境探测器、门禁单元、无线AP、智能设备通过ZigBee网关与物联控制主机通信连接。
进一步的,语音交互的具体过程为:
1)首先对接收到的声音信号预加重,并进行分帧操作;具体的是在声音信号的频域乘以系数K,系数K跟频率成正相关;
s’n=sn-k*sn-1
对预加重后的声音信号乘以凯泽窗函数进行分帧,形成多个波形段;
Figure BDA0002853368430000032
其中,I0是第一类零阶贝塞尔函数,M为窗的个数,n窗的长度,w(n)为频谱函数,β是用来调整窗函数性能的参数,此处β选8.5;
2)对多个波形段进行快速傅里叶变换得到对应的频谱,将上面的频谱通过Mel滤波器组得到Mel频谱;在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC,生成每帧的MFCC特征向量;
3)预先构建声学模型和语言模型,通过大量标注的语音数据训练声学模型,通过大量标注的文本数据训练语言模型;声学模型用于把语音输入转换层声学表示的输入,在声学模型给出发音序列之后,从候选的文字序列中找出概率最大的字符串序列;
4)对声音信号对应的指令转化为可识别的语言,包括:确定指令的领域,理解指令的意图、定位词槽;
5)处理用户的真实的意图,做出相应的回答反馈。
进一步的,门禁单元的工作过程为:
1)预先获取人脸图像;
2)对获取到的人脸图像进行烧苗检测,生成于候选区域对应的人脸坐标;
3)根据人脸坐标生成双眼的坐标,在候选区域内通过人脸坐标和双眼的坐标生成人脸面部特征向量(其中需要对候选区域进行平移、旋转和缩放,形成具有预定大小的标准化图像,其中双眼的坐标链接到预定位置,对人脸图像进行归一化处理),保存在服务器内,形成人脸数据库;
4)将待验证的人脸采集图像与人脸数据库中的特征向量进行比较,计算距离值,比较距离值与相似性阈值,确定人员的身份,完成识别的过程。
本发明的优点在于:
通过语音对展厅的智能设备进行控制,能够免去人工操作各种设备的麻烦,可远距离控制相关的设备,能够实现人与设备的自由沟通,增强人们参观体验的感受。
附图说明
图1为本发明实施例中语音控制的展厅的方法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于语音控制的展厅系统,包括:语音交互系统管理主机、智能语音主机、物联控制主机、环境探测器、门禁单元、ZigBee网关、无线AP、智能设备
语音交互系统管理主机用于实现人与智能设备的语音交流,其由语音控制系统、语音查询系统、语音播报系统构成;
智能语音主机作为人机交流的载体,其能够接受和识别语音、识别和理解语义内容、合成智能对话,基于语音交互技术;
语音交互的步骤:
1)首先对接收到的声音信号预加重,并进行分帧操作;具体的是在声音信号的频域乘以系数K,系数K跟频率成正相关;
s’n=sn-k*sn-1
对预加重后的声音信号乘以凯泽窗函数进行分帧,形成多个波形段;
Figure BDA0002853368430000052
其中,I0是第一类零阶贝塞尔函数,M为窗的个数,n窗的长度,w(n)为频谱函数,β是用来调整窗函数性能的参数,此处β选8.5;
2)对多个波形段进行快速傅里叶变换得到对应的频谱,将上面的频谱通过Mel滤波器组得到Mel频谱;在Mel频谱上面进行倒谱分析(取对数,做逆变换),获得Mel 频率倒谱系数MFCC,生成每帧的MFCC特征向量;
3)预先构建声学模型和语言模型,通过大量标注的语音数据训练声学模型,通过大量标注的文本数据训练语言模型;声学模型用于把语音输入转换层声学表示的输入,在声学模型给出发音序列之后,从候选的文字序列中找出概率最大的字符串序列;
4)对声音信号对应的指令转化为可识别的语言,包括:确定指令的领域,理解指令的意图、定位词槽;
5)处理用户的真实的意图,做出相应的回答反馈。
环境探测器安装在展厅内,与无线AP连接通信,其可精准的将周围的光线、温度、湿度以及噪声的状况传送到语音交互系统管理主机,语音交互系统管理主机根据用户的问询回答展厅内的状况,通过音箱等设备播报出来;
门禁单元安装在展厅的入口,用于采集人脸和声纹信息进行人员的识别和确认,通过人脸声纹认证后进行联动开门;
面部识别的过程:
1)预先获取人脸图像;
2)对获取到的人脸图像进行烧苗检测,生成于候选区域对应的人脸坐标;
3)根据人脸坐标生成双眼的坐标,在候选区域内通过人脸坐标和双眼的坐标生成人脸面部特征向量(其中需要对候选区域进行平移、旋转和缩放,形成具有预定大小的标准化图像,其中双眼的坐标链接到预定位置,对人脸图像进行归一化处理),保存在服务器内,形成人脸数据库;
4)将待验证的人脸采集图像与人脸数据库中的特征向量进行比较,计算距离值,比较距离值与相似性阈值,确定人员的身份,完成识别的过程;
ZigBee网关用于对智能设备进行信息的采集、信息输入、信息输出、集中控制、远程控制、联动控制,智能设备例如智能开关、智能窗帘、红外宝、显示屏、网络摄像机等;网络摄像机用于实现对展厅进行区域入侵侦测、越界侦测、徘徊侦测;在展厅的中心位置吊顶上增加无线RF接收器,以满足展厅、会议室无线话筒、无线耳机等通过无线方式接入实现音频输入;
物联控制主机可对展厅内智能设备的运作情况等开展收集、处理、监测、预警、控制操作;
无线AP用于实现移动终端和语音交互系统管理主机、物联控制主机的连接。
本实施例还提供一种基于语音控制的展厅的方法:
步骤一:门禁单元采集人脸信息数据,确认人员是否为工作人员,如果是则进入步骤二;如果不是工作人员,确认为访客后,则进入步骤三;
步骤二:确认为工作人员后,门禁解除,此时为普通模式,工作人员进入展厅内;
步骤三:此时为会客模式,展厅内的灯光和空调自动开启,语音交互系统管理主机自动唤醒,智能语音主机播报致欢迎词和序言介绍,播报环境探测器监测到的数据,如温湿度、PM2.5等;
步骤四:需要调整展厅的灯光、空调等智能设备,工作人员对智能语音主机说出意图,语音交互系统管理主机理解意图并响应,并发出控制指令给ZigBee网关,进而控制相对应的智能设备;工作人员还可以对移动终端,比如手机、对讲机说出控制指令,通过无线AP也能够语音控制各个设备的运行;
步骤五:工作人员走到相应的展示区内,通过话筒进行提问,语音交互系统管理主机进行处理,对访客进行解说;
步骤六:工作人员需要在显示屏上展示介绍信息时,说出“播放***”,显示屏播放介绍的内容,工作人员可以通过语音控制播放过程中的音量大小、暂停、切换等功能;
步骤七:访客参观结束后,工作人员对智能语音主机说出“关闭灯光/空调/电视”等指令,智能语音主机响应,语音交互系统管理主机控制相应的设备关闭。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种基于语音控制展厅的方法,其特征在于,包括以下步骤:
步骤一:门禁单元采集人脸信息数据,确认人员是否为工作人员,如果是则进入步骤二;如果不是工作人员,确认为访客后,则进入步骤三;
步骤二:确认为工作人员后,门禁解除,此时为普通模式,工作人员进入展厅内;
步骤三:此时为会客模式,展厅内的灯光和空调自动开启,语音交互系统管理主机自动唤醒,智能语音主机播报致欢迎词和序言介绍,播报环境探测器监测到的数据;
步骤四:需要调整展厅的灯光、空调等智能设备,工作人员对智能语音主机说出意图,语音交互系统管理主机理解意图并响应,并发出控制指令给ZigBee网关,进而控制相对应的智能设备;工作人员还可以对移动终端,比如手机、对讲机说出控制指令,通过无线AP也能够语音控制各个设备的运行;
步骤五:工作人员走到相应的展示区内,通过话筒进行提问,语音交互系统管理主机进行处理,对访客进行解说;
步骤六:工作人员需要在显示屏上展示介绍信息时,发出播放指令,显示屏播放介绍的内容,工作人员可以通过语音控制播放过程中的音量大小、暂停、切换等功能;
步骤七:访客参观结束后,工作人员对智能语音主机说出关闭智能设备的指令,智能语音主机响应,语音交互系统管理主机控制相应的设备关闭。
2.根据权利要求1所述的一种基于语音控制展厅的方法,其特征在于,语音交互的具体过程为:
1)首先对接收到的声音信号预加重,并进行分帧操作;具体的是在声音信号的频域乘以系数K,系数K跟频率成正相关;
s’n=sn-k*sn-1
对预加重后的声音信号乘以凯泽窗函数进行分帧,形成多个波形段;
Figure FDA0002853368420000011
其中,I0是第一类零阶贝塞尔函数,M为窗的个数,n窗的长度,w(n)为频谱函数,β是用来调整窗函数性能的参数,此处β选8.5;
2)对多个波形段进行快速傅里叶变换得到对应的频谱,将上面的频谱通过Mel滤波器组得到Mel频谱;在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC,生成每帧的MFCC特征向量;
3)预先构建声学模型和语言模型,通过大量标注的语音数据训练声学模型,通过大量标注的文本数据训练语言模型;声学模型用于把语音输入转换层声学表示的输入,在声学模型给出发音序列之后,从候选的文字序列中找出概率最大的字符串序列;
4)对声音信号对应的指令转化为可识别的语言,包括:确定指令的领域,理解指令的意图、定位词槽;
5)处理用户的真实的意图,做出相应的回答反馈。
3.根据权利要求1所述的一种基于语音控制展厅的方法,其特征在于,门禁单元的工作过程为:
1)预先获取人脸图像;
2)对获取到的人脸图像进行烧苗检测,生成于候选区域对应的人脸坐标;
3)根据人脸坐标生成双眼的坐标,在候选区域内通过人脸坐标和双眼的坐标生成人脸面部特征向量(其中需要对候选区域进行平移、旋转和缩放,形成具有预定大小的标准化图像,其中双眼的坐标链接到预定位置,对人脸图像进行归一化处理),保存在服务器内,形成人脸数据库;
4)将待验证的人脸采集图像与人脸数据库中的特征向量进行比较,计算距离值,比较距离值与相似性阈值,确定人员的身份,完成识别的过程。
4.一种基于语音控制的展厅控制系统,其特征在于:包括语音交互系统管理主机、智能语音主机、物联控制主机、环境探测器、门禁单元、ZigBee网关、无线AP、智能设备;
所述语音交互系统管理主机、智能语音主机、环境探测器、门禁单元、无线AP、智能设备通过ZigBee网关与物联控制主机通信连接。
5.根据权利要求4所述的一种基于语音控制的展厅控制系统,其特征在于:语音交互的具体过程为:
1)首先对接收到的声音信号预加重,并进行分帧操作;具体的是在声音信号的频域乘以系数K,系数K跟频率成正相关;
s’n=sn-k*sn-1
对预加重后的声音信号乘以凯泽窗函数进行分帧,形成多个波形段;
Figure FDA0002853368420000031
其中,I0是第一类零阶贝塞尔函数,M为窗的个数,n窗的长度,w(n)为频谱函数,β是用来调整窗函数性能的参数,此处β选8.5;
2)对多个波形段进行快速傅里叶变换得到对应的频谱,将上面的频谱通过Mel滤波器组得到Mel频谱;在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC,生成每帧的MFCC特征向量;
3)预先构建声学模型和语言模型,通过大量标注的语音数据训练声学模型,通过大量标注的文本数据训练语言模型;声学模型用于把语音输入转换层声学表示的输入,在声学模型给出发音序列之后,从候选的文字序列中找出概率最大的字符串序列;
4)对声音信号对应的指令转化为可识别的语言,包括:确定指令的领域,理解指令的意图、定位词槽;
5)处理用户的真实的意图,做出相应的回答反馈。
6.根据权利要求4所述的一种基于语音控制的展厅控制系统,其特征在于,门禁单元的工作过程为:
1)预先获取人脸图像;
2)对获取到的人脸图像进行烧苗检测,生成于候选区域对应的人脸坐标;
3)根据人脸坐标生成双眼的坐标,在候选区域内通过人脸坐标和双眼的坐标生成人脸面部特征向量(其中需要对候选区域进行平移、旋转和缩放,形成具有预定大小的标准化图像,其中双眼的坐标链接到预定位置,对人脸图像进行归一化处理),保存在服务器内,形成人脸数据库;
4)将待验证的人脸采集图像与人脸数据库中的特征向量进行比较,计算距离值,比较距离值与相似性阈值,确定人员的身份,完成识别的过程。
CN202011543435.2A 2020-12-23 2020-12-23 一种基于语音控制展厅的方法及控制系统 Withdrawn CN112700773A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011543435.2A CN112700773A (zh) 2020-12-23 2020-12-23 一种基于语音控制展厅的方法及控制系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011543435.2A CN112700773A (zh) 2020-12-23 2020-12-23 一种基于语音控制展厅的方法及控制系统

Publications (1)

Publication Number Publication Date
CN112700773A true CN112700773A (zh) 2021-04-23

Family

ID=75509568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011543435.2A Withdrawn CN112700773A (zh) 2020-12-23 2020-12-23 一种基于语音控制展厅的方法及控制系统

Country Status (1)

Country Link
CN (1) CN112700773A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113488053A (zh) * 2021-08-10 2021-10-08 合肥美菱物联科技有限公司 一种茶吧机的语音模块唤醒控制方法
CN113888846A (zh) * 2021-09-27 2022-01-04 深圳市研色科技有限公司 一种预提醒行车的方法以及装置
CN114360105A (zh) * 2021-12-15 2022-04-15 中用科技有限公司 智慧访客管控平台
CN114520003A (zh) * 2022-02-28 2022-05-20 安徽淘云科技股份有限公司 语音交互方法、装置、电子设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113488053A (zh) * 2021-08-10 2021-10-08 合肥美菱物联科技有限公司 一种茶吧机的语音模块唤醒控制方法
CN113888846A (zh) * 2021-09-27 2022-01-04 深圳市研色科技有限公司 一种预提醒行车的方法以及装置
CN114360105A (zh) * 2021-12-15 2022-04-15 中用科技有限公司 智慧访客管控平台
CN114520003A (zh) * 2022-02-28 2022-05-20 安徽淘云科技股份有限公司 语音交互方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN112700773A (zh) 一种基于语音控制展厅的方法及控制系统
CN111989741B (zh) 具有动态可切换端点的基于语音的用户接口
CN106251874B (zh) 一种语音门禁和安静环境监控方法及系统
CN109410952B (zh) 一种语音唤醒方法、装置及系统
CN110223690A (zh) 基于图像与语音融合的人机交互方法及装置
US9401058B2 (en) Zone based presence determination via voiceprint location awareness
CN106847281A (zh) 基于语音模糊识别技术的智能家居语音控制系统及方法
CN102610015B (zh) 一种多媒体可视化门禁系统
Sehili et al. Sound environment analysis in smart home
CN109298642A (zh) 采用智能音箱进行监控的方法及装置
JP2004032685A (ja) コンピュータテレホニーによる保護資源アクセスシステムおよび保護資源アクセス方法
CN110956965A (zh) 一种基于声纹识别的个性化智能家居安全控制系统及方法
CN105068722A (zh) 一种面向智能家居环境的人机交互控制方法
CN110164436A (zh) 便携式多点智能语音控制家居的系统及方法
Adami et al. A speaker identification system using a model of artificial neural networks for an elevator application
CN111951809A (zh) 多人声纹辨别方法及系统
CN111489733A (zh) 一种基于智能可视对讲门禁的语音交互系统及装置
CN113946127B (zh) 一种基于边缘计算技术的智能家居系统
CN112735409A (zh) 一种工业园区智能语音管理的系统及方法
WO2023112668A1 (ja) 音響分析装置、音響分析方法、および記録媒体
TWI675305B (zh) 智能語音控制管理系統及其方法
CN112820291B (zh) 智能家居控制方法、系统和存储介质
AU2021103949A4 (en) Artificial intelligence based smart door system and method thereof
WO2024053915A1 (en) System and method for detecting a wakeup command for a voice assistant
KR20190053633A (ko) 상황 판단을 위한 거치형 사운드장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210423

WW01 Invention patent application withdrawn after publication