CN114644276A - 一种混合场景条件下的智能电梯控制方法 - Google Patents
一种混合场景条件下的智能电梯控制方法 Download PDFInfo
- Publication number
- CN114644276A CN114644276A CN202210375728.7A CN202210375728A CN114644276A CN 114644276 A CN114644276 A CN 114644276A CN 202210375728 A CN202210375728 A CN 202210375728A CN 114644276 A CN114644276 A CN 114644276A
- Authority
- CN
- China
- Prior art keywords
- elevator
- image
- user
- voice command
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B5/00—Applications of checking, fault-correcting, or safety devices in elevators
- B66B5/0006—Monitoring devices or performance analysers
- B66B5/0012—Devices monitoring the users of the elevator system
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B1/00—Control systems of elevators in general
- B66B1/02—Control systems without regulation, i.e. without retroactive action
- B66B1/06—Control systems without regulation, i.e. without retroactive action electric
- B66B1/14—Control systems without regulation, i.e. without retroactive action electric with devices, e.g. push-buttons, for indirect control of movements
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B1/00—Control systems of elevators in general
- B66B1/34—Details, e.g. call counting devices, data transmission from car to control system, devices giving information to the control system
- B66B1/3415—Control system configuration and the data transmission or communication within the control system
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B1/00—Control systems of elevators in general
- B66B1/34—Details, e.g. call counting devices, data transmission from car to control system, devices giving information to the control system
- B66B1/46—Adaptations of switches or switchgear
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B5/00—Applications of checking, fault-correcting, or safety devices in elevators
- B66B5/02—Applications of checking, fault-correcting, or safety devices in elevators responsive to abnormal operating conditions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B2201/00—Aspects of control systems of elevators
- B66B2201/40—Details of the change of control mode
- B66B2201/46—Switches or switchgear
- B66B2201/4607—Call registering systems
- B66B2201/4638—Wherein the call is registered without making physical contact with the elevator system
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B2201/00—Aspects of control systems of elevators
- B66B2201/40—Details of the change of control mode
- B66B2201/46—Switches or switchgear
- B66B2201/4607—Call registering systems
- B66B2201/4638—Wherein the call is registered without making physical contact with the elevator system
- B66B2201/4646—Wherein the call is registered without making physical contact with the elevator system using voice recognition
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B2201/00—Aspects of control systems of elevators
- B66B2201/40—Details of the change of control mode
- B66B2201/46—Switches or switchgear
- B66B2201/4607—Call registering systems
- B66B2201/4676—Call registering systems for checking authorization of the passengers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02B—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
- Y02B50/00—Energy efficient technologies in elevators, escalators and moving walkways, e.g. energy saving or recuperation technologies
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Indicating And Signalling Devices For Elevators (AREA)
Abstract
本发明涉及电梯智能控制的技术领域,公开了一种混合场景条件下的智能电梯控制方法,包括:获取电梯内部乘客图像,采用基于感受野的目标检测算法从图像中提取特征,并对特征信息进行优化,从而检测图像中的人物目标;对检测到的人物目标进行精准人脸识别;获取电梯用户的语音指令,利用改进的盲源分离算法将用户的语音指令进行信号分离;对分离后的电梯用户语音指令进行声纹提取判断是否为合法用户,提取合法用户想要达到的楼层信息;将提取到的楼层信息添加到电梯调度控制中进行协同处理。本发明所述方法实现电梯内乘客是否合法用户的判断,并实现对电梯内混合场景下混合语音指令信号进行分离处理,得到电梯内不同用户的语音指令。
Description
技术领域
本发明涉及电梯智能控制的技术领域,尤其涉及一种混合场景条件下的智能电梯控制方法。
背景技术
近年来随着疫情的不断发展,减少电梯接触成为减少传染性疾病传播的重要途径,通常条件下的电梯内部混杂,通过语音和图像等方法精准识别用户并提取用户命令控制成为智能电梯控制所必须解决的重要问题。
发明内容
本发明提供一种混合场景条件下的智能电梯控制方法,目的在于(1)实现电梯内乘客是否合法用户的判断;(2)对电梯内混合场景下混合语音指令信号进行分离处理,得到电梯内不同用户的语音指令,从而依据不同用户的语音指令进行指令识别,根据指令识别结果控制电梯运行。
实现上述目的,本发明提供的一种混合场景条件下的智能电梯控制方法,包括以下步骤:
S1:利用电梯内的摄像头获取电梯内部乘客图像,由于人脸在监控图像中占比过小,容易被检测器忽视,采用基于感受野的目标检测算法从电梯内部乘客图像中提取特征,并对提取的特征信息进行参数优化,检测图像中的所有人物目标;
S2:对检测到的人物目标进行精准人脸识别,判断是否均为合法用户,若存在不合法用户则进行发出警报提醒物业,否则进入后续步骤;
S3:利用声音探测设备获取电梯用户的语音指令,并利用改进的盲源分离算法将用户的语音指令进行信号分离,获取电梯内不同用户的语音指令;
S4:对分离后的电梯用户语音指令进行声纹提取判断是否为合法用户,如果是则进行语音指令中的指令识别,提取合法用户想要达到的楼层信息,否则发出警报提醒物业;
S5:将提取到的楼层信息添加到电梯调度控制中进行协同处理,控制电梯运行。
作为本发明的进一步改进方法:
所述S1步骤中利用电梯内的摄像头获取电梯内部乘客图像,包括:
在电梯内部安装摄像头,当电梯关闭时,电梯内的摄像头拍摄得到电梯内部乘客图像,摄像头内部处理器对电梯内部乘客图像进行预处理,所述图像预处理流程为:
将电梯内部乘客图像像素值转换为灰度值,所述灰度值的转换公式为:
其中:
R(i,j),B(i,j),G(i,j)表示像素(i,j)在RBG颜色通道的值;
gray(i,j)表示像素(i,j)的灰度值;
对电梯内部乘客图像中的所有像素进行灰度值转换,得到电梯内部乘客图像的灰度图,将灰度图作为电梯内部乘客图像的预处理结果,并将电梯内部乘客图像的灰度图发送到电梯控制中心。
所述S1步骤中采用基于感受野的目标检测算法从电梯内部乘客图像中提取特征信息,包括:
电梯控制中心对电梯内部乘客图像的灰度图进行提取图像特征信息,所述图像特征的提取方法为基于感受野的目标检测算法,所述目标检测算法包括感受野模块以及特征提取模块;
所述基于感受野的目标检测算法流程为:
将电梯内部乘客图像的灰度图输入到目标检测算法中,目标检测算法中的感受野模块对灰度图进行多层卷积,所述感受野模块存在两个分支独立进行卷积,所述分支为f1和f2,分支f1的结构包括一个1*1卷积核大小的卷积层、一个3*1卷积核大小的卷积层以及一个3*3卷积核大小的卷积层,分支f2的结构包括一个1*1卷积核大小的卷积层、一个1*3卷积核大小的卷积层以及一个3*3卷积核大小的卷积层,两个分支分别接收灰度图,并分别对灰度图进行多层卷积处理,得到不同大小的感受野,所述感受野大小的计算公式为:
其中:
ri表示第i层卷积层的感受野大小,r0=1;
stridei表示第i层卷积层的卷积步长大小,stride0=1;
si表示第i层卷积层的卷积核大小,
将分支的卷积结果进行拼接处理,并利用1*1卷积核大小的卷积层对拼接结果进行卷积,得到电梯内部乘客图像的特征图;
利用特征提取模块对特征图进行特征提取,所述特征提取模块的结构包括可扩张的卷积层,池化层,归一化层,并在归一化层输出目标检测的图像特征,所述图像特征信息为电梯内部乘客图像中的人脸图像特征信息,所述可扩张的卷积层结构为:
其中:
Dep表示卷积层的深度,d表示卷积层的初始深度;
Wid表示卷积层的宽度,w表示卷积层的初始宽度。
所述S1步骤中对提取的特征信息进行参数优化,检测图像中的所有人物目标,包括:
电梯控制中心在电梯内部图像中利用目标框对检测到的人脸图像特征信息进行标定;对于电梯内部乘客图像中所标定的若干目标框区域,利用参数优化模型对人脸图像特征信息进行优化,检测得到人脸图像特征信息中的五官特征信息,并在目标框区域内对检测到的五官特征信息进行标定,检测得到人脸图像目标,所述参数优化模型的训练流程为:
所述参数优化模型为卷积神经网络模型,获取大量清晰的人脸五官图像用于参数优化模型的训练,直到模型的损失函数达到最小,此时的参数优化模型为最优的模型,利用该模型对提取的特征信息进行参数优化,所述参数优化模型训练的损失函数为:
其中:
ωie表示第i个样本中五官e的位置,pos表示五官集合;
所述S2步骤中对检测到的人物目标进行精准人脸识别,判断是否均为合法用户,包括:
预先采集合法用户的人脸图像,电梯控制中心将电梯内部检测到的人脸图像目标与合法用户人脸图像的五官位置进行匹配,若均成功匹配,则说明电梯内的乘客均为合法用户,并进入后续步骤,若存在不匹配的乘客,则发出警报提醒物业。
所述S3步骤中利用声音探测设备获取电梯用户的语音指令,并利用改进的盲源分离算法将用户的语音指令进行信号分离,包括:
在电梯内部设置声音探测设备,当电梯门关闭时,声音探测设备采集获取电梯内用户的语音指令,则所采集到的语音指令信号为x(t)=F{[x1(t),x2(t),…,xN(t)]T},其中t表示时域信息,N表示电梯内用户的数目,xN(t)表示第N名用户的语音指令信号,F{·}表示信号混合函数,表示将电梯内所有用户的语音指令信号进行混合,声音探测设备所接收到的语音指令为混合处理后的信号;
利用改进的盲源分离算法对采集到的混合信号x(t)进行分离处理,所述分离结果为:
Y(t)=WTx(t)
其中:
WT表示信号分离矩阵;
Y(t)表示分离后的语音指令信号矩阵,矩阵中的每一行信号表示一位用户的语音指令信号;
所述盲源分离算法流程为:
建立盲源分离算法的目标函数:
其中:
U(·)表示任意非线性函数,E(·)表示期望计算函数;
v表示一个具有零均值和单位方差的高斯向量;
r(t)表示参考信号;
所述目标函数的约束条件为:
E{(Y(t)-r(t))2}≤δ
E{[Y(t)2]}-1=0
其中:
δ表示阈值因子,即分离信号和参考信号的信息差要小于阈值因子;
通过引入松弛算子,将不等式约束条件E{(Y(t)-r(t))2}≤δ转换为等式E{(Y(t)-r(t))2-δ+z2=0;引入用于约束E(Y(t)-r(t))2-δ的拉格朗日乘子μ以及用于约束E{[Y(t)2]}-1=0的拉格朗日乘子λ,将目标函数优化求解问题转换为拉格朗日函数求解问题,则转换后的拉格朗日函数为:
其中:
ε表示惩罚因子;
利用拟牛顿算法对拉格朗日函数进行迭代求解,迭代后稳定的信号分离矩阵即为求解结果,则信号分离矩阵的迭代更新公式为:
其中:
η为学习率,将其设置为0.1;
Cov为混合信号x(t)的协方差矩阵;
L′表示拉格朗日函数对W的一阶导数,L″表示拉格朗日函数对W的二阶倒数;
利用迭代后的信号分析矩阵W对混合信号进行分离处理,得到分离后的语音指令信号矩阵。
所述S4步骤中对分离后的电梯用户语音指令进行声纹提取判断是否为合法用户,并提取合法用户想要达到的楼层信息,包括:
预先采集合法用户的声纹信息,对语音指令信号矩阵中的每一行语音指令信号进行声纹信息匹配,若匹配成功则判断该指令信号为合法用户的语音信号,并提取该语音指令信号的楼层信息,所述楼层信息为语音指令信号中的楼层数字,若未匹配成功,则发出警报提醒物业。
所述S5步骤中将提取到的楼层信息添加到电梯调度控制中进行协同处理,包括:
电梯控制中心将提取到的楼层信息添加到电梯调度控制中,电梯调度控制将电梯内的语音指令信息以及电梯外的乘坐信息进行协同处理,所述协同处理规则为:对提取到的楼层信息进行实时排序处理,排序结果为{Lo1,Lo2,…,Lop},其中Lo1为语音指令中的最低层,Lop为语音指令中的最高层,电梯按照先向上运行的规则向排序结果中高于当前电梯所处楼层的楼层运行,直到达到语音指令中的最高层,进而向下运行;在电梯向上运行过程中,若检测到上方楼层存在用户需要乘坐电梯向上,电梯则在该楼层开门;在电梯向下运行过程中,若检测到下方楼层存在用户需要乘坐电梯向下,电梯则在该楼层开门。在本发明一个具体实施例中,在每层电梯门口分别设置向上乘坐和向下乘坐的按键。
相对于现有技术,本发明提出一种混合场景条件下的智能电梯控制方法,该技术具有以下优势:
首先,本方案提出一种电梯内部乘客是否为合法用户的判断方法,电梯控制中心对电梯内部乘客图像的灰度图进行提取图像特征信息,所述图像特征的提取方法为基于感受野的目标检测算法,通过将电梯内部乘客图像的灰度图输入到目标检测算法中,目标检测算法中的感受野模块对灰度图进行多层卷积,所述感受野模块存在两个分支独立进行卷积,所述分支为f1和f2,分支f1的结构包括一个1*1卷积核大小的卷积层、一个3*1卷积核大小的卷积层以及一个3*3卷积核大小的卷积层,分支f2的结构包括一个1*1卷积核大小的卷积层、一个1*3卷积核大小的卷积层以及一个3*3卷积核大小的卷积层,两个分支分别接收灰度图,并分别对灰度图进行多层卷积处理,得到不同大小的感受野,所述感受野大小的计算公式为:
其中:ri表示第i层卷积层的感受野大小,r0=1;stridei表示第i层卷积层的卷积步长大小,stride0=1;si表示第i层卷积层的卷积核大小,将分支的卷积结果进行拼接处理,并利用1*1卷积核大小的卷积层对拼接结果进行卷积,得到电梯内部乘客图像的特征图;相较于传统方案,所述感受野模块通过多层卷积获得不同卷积层的感受野,而感受野大的特征表示其所能感知的原始图像大,意味着可能蕴含的特征更为全局、语义层次更高,而感受野小的特征表示蕴含的特征趋于局部和细节,因此使得特征提取模块能够提取到语义层次不同的特征信息;并利用特征提取模块对特征图进行特征提取,所述特征提取模块的结构包括可扩张的卷积层,池化层,归一化层,并在归一化层输出目标检测的图像特征,所述图像特征信息为电梯内部乘客图像中的人脸图像特征信息,所述可扩张的卷积层结构为:
其中:表示混合扩张系数,通过利用一个系数的变化去造成卷积层深度、宽度的扩张缩放,从而减少整个扩张缩放搜索空间的大小;Dep表示卷积层的深度,d表示卷积层的初始深度;Wid表示卷积层的宽度,w表示卷积层的初始宽度。电梯控制中心在电梯内部图像中利用目标框对检测到的人脸图像特征信息进行标定;对于电梯内部乘客图像中所标定的若干目标框区域,利用参数优化模型对人脸图像特征信息进行优化,检测得到人脸图像特征信息中的五官特征信息,并在目标框区域内对检测到的五官特征信息进行标定,检测得到人脸图像目标,本方案通过预先采集合法用户的人脸图像,电梯控制中心将电梯内部检测到的人脸图像目标与合法用户人脸图像的五官位置进行匹配,若均成功匹配,则说明电梯内的乘客均为合法用户,并进入后续步骤,若存在不匹配的乘客,则发出警报提醒物业。同时本方案提出一种基于语音的合法用户判断方法,预先采集合法用户的声纹信息,对语音指令信号矩阵中的每一行语音指令信号进行声纹信息匹配,若匹配成功则判断该指令信号为合法用户的语音信号,并提取该语音指令信号的楼层信息,所述楼层信息为语音指令信号中的楼层数字,若未匹配成功,则发出警报提醒物业。
最后,本方案提出一种混合场景下语音信号的分离方法,所述电梯内的声音探测设备采集获取电梯内用户的语音指令,则所采集到的语音指令信号为x(t)=F{[x1(t),x2(t),…,xN(t)]T},其中t表示时域信息,N表示电梯内用户的数目,xN(t)表示第N名用户的语音指令信号,F{·}表示信号混合函数,表示将电梯内所有用户的语音指令信号进行混合,声音探测设备所接收到的语音指令为混合处理后的信号,本方案利用改进的盲源分离算法对采集到的混合信号x(t)进行分离处理,所述分离结果为:
Y(t)=WTx(t)
其中:WT表示信号分离矩阵;Y(t)表示分离后的语音指令信号矩阵,矩阵中的每一行信号表示一位用户的语音指令信号;所述盲源分离算法流程为:建立盲源分离算法的目标函数:
其中:U(·)表示任意非线性函数,E(·)表示期望计算函数;v表示一个具有零均值和单位方差的高斯向量;r(t)表示参考信号;所述目标函数的约束条件为:
E{(Y(t)-r(t))2}≤δ
E{[Y(t)2]}-1=0
其中:δ表示阈值因子,即分离信号和参考信号的信息差要小于阈值因子;通过引入松弛算子,将不等式约束条件E{(Y(t)-r(t))2}≤δ转换为等式E{(Y(t)-r(t))2}-δ+z2=0;引入用于约束E{(Y(t)-r(t))2}-δ的拉格朗日乘子μ以及用于约束E{[Y(t)2]}-1=0的拉格朗日乘子λ,将目标函数优化求解问题转换为拉格朗日函数求解问题,则转换后的拉格朗日函数为:
其中:ε表示惩罚因子;利用拟牛顿算法对拉格朗日函数进行迭代求解,迭代后稳定的信号分离矩阵即为求解结果,则信号分离矩阵的迭代更新公式为:
其中:η为学习率,将其设置为0.1;Cov为混合信号x(t)的协方差矩阵;L′表示拉格朗日函数对W的一阶导数,L″表示拉格朗日函数对W的二阶倒数;利用迭代后的信号分析矩阵W对混合信号进行分离处理,得到分离后的语音指令信号矩阵,实现混合场景下混合语音信号的分离处理。
附图说明
图1为本发明一实施例提供的一种混合场景条件下的智能电梯控制方法的流程示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
S1:用电梯内的摄像头获取电梯内部乘客图像,由于人脸在监控图像中占比过小,容易被检测器忽视,采用基于感受野的目标检测算法从电梯内部乘客图像中提取特征,并对提取的特征信息进行参数优化,检测图像中的所有人物目标。
所述S1步骤中利用电梯内的摄像头获取电梯内部乘客图像,包括:
在电梯内部安装摄像头,当电梯关闭时,电梯内的摄像头拍摄得到电梯内部乘客图像,摄像头内部处理器对电梯内部乘客图像进行预处理,所述图像预处理流程为:
将电梯内部乘客图像像素值转换为灰度值,所述灰度值的转换公式为:
其中:
R(i,j),B(i,j),G(i,j)表示像素(i,j)在RBG颜色通道的值;
gray(i,j)表示像素(i,j)的灰度值;
对电梯内部乘客图像中的所有像素进行灰度值转换,得到电梯内部乘客图像的灰度图,将灰度图作为电梯内部乘客图像的预处理结果,并将电梯内部乘客图像的灰度图发送到电梯控制中心。
所述S1步骤中采用基于感受野的目标检测算法从电梯内部乘客图像中提取特征信息,包括:
电梯控制中心对电梯内部乘客图像的灰度图中提取图像特征信息,所述图像特征的提取方法为基于感受野的目标检测算法,所述目标检测算法包括感受野模块以及特征提取模块;
所述基于感受野的目标检测算法流程为:
将电梯内部乘客图像的灰度图输入到目标检测算法中,目标检测算法中的感受野模块对灰度图进行多层卷积,所述感受野模块存在两个分支独立进行卷积,所述分支为f1和f2,分支f1的结构包括一个1*1卷积核大小的卷积层、一个3*1卷积核大小的卷积层以及一个3*3卷积核大小的卷积层,分支f2的结构包括一个1*1卷积核大小的卷积层、一个1*3卷积核大小的卷积层以及一个3*3卷积核大小的卷积层,两个分支分别接收灰度图,并分别对灰度图进行多层卷积处理,得到不同大小的感受野,所述感受野大小的计算公式为:
其中:
ri表示第i层卷积层的感受野大小,r0=1;
stridei表示第i层卷积层的卷积步长大小,stride0=1;
si表示第i层卷积层的卷积核大小,
将分支的卷积结果进行拼接处理,并利用1*1卷积核大小的卷积层对拼接结果进行卷积,得到电梯内部乘客图像的特征图;
利用特征提取模块对特征图进行特征提取,所述特征提取模块的结构包括可扩张的卷积层,池化层,归一化层,并在归一化层输出目标检测的图像特征,所述图像特征信息为电梯内部乘客图像中的人脸图像特征信息,所述可扩张的卷积层结构为:
其中:
Dep表示卷积层的深度,d表示卷积层的初始深度;
Wid表示卷积层的宽度,w表示卷积层的初始宽度。
所述S1步骤中对提取的特征信息进行参数优化,检测图像中的所有人物目标,包括:
电梯控制中心在电梯内部图像中利用目标框对检测到的人脸图像特征信息进行标定;对于电梯内部乘客图像中所标定的若干目标框区域,利用参数优化模型对人脸图像特征信息进行优化,检测得到人脸图像特征信息中的五官特征信息,并在目标框区域内对检测到的五官特征信息进行标定,检测得到人脸图像目标,所述参数优化模型的训练流程为:
所述参数优化模型为卷积神经网络模型,获取大量清晰的人脸五官图像用于参数优化模型的训练,直到模型的损失函数达到最小,此时的参数优化模型为最优的模型,利用该模型对提取的特征信息进行参数优化,所述参数优化模型训练的损失函数为:
其中:
ωie表示第i个样本中五官e的位置,pos表示五官集合;
S2:对检测到的人物目标进行精准人脸识别,判断是否均为合法用户,若存在不合法用户则进行发出警报提醒物业,否则进入后续步骤。
所述S2步骤中对检测到的人物目标进行精准人脸识别,判断是否均为合法用户,包括:
预先采集合法用户的人脸图像,电梯控制中心将电梯内部检测到的人脸图像目标与合法用户人脸图像的五官位置进行匹配,若均成功匹配,则说明电梯内的乘客均为合法用户,并进入后续步骤,若存在不匹配的乘客,则发出警报提醒物业。
S3:利用声音探测设备获取电梯用户的语音指令,并利用改进的盲源分离算法将用户的语音指令进行信号分离,获取电梯内不同用户的语音指令。
所述S3步骤中利用声音探测设备获取电梯用户的语音指令,并利用改进的盲源分离算法将用户的语音指令进行信号分离,包括:
在电梯内部设置声音探测设备,当电梯门关闭时,声音探测设备采集获取电梯内用户的语音指令,则所采集到的语音指令信号为x(t)=F{[x1(t),x2(t),…,xN(t)]T},其中t表示时域信息,N表示电梯内用户的数目,xN(t)表示第N名用户的语音指令信号,F{·}表示信号混合函数,表示将电梯内所有用户的语音指令信号进行混合,声音探测设备所接收到的语音指令为混合处理后的信号;
利用改进的盲源分离算法对采集到的混合信号x(t)进行分离处理,所述分离结果为:
Y(t)=WTx(t)
其中:
WT表示信号分离矩阵;
Y(t)表示分离后的语音指令信号矩阵,矩阵中的每一行信号表示一位用户的语音指令信号;
所述盲源分离算法流程为:
建立盲源分离算法的目标函数:
其中:
U(·)表示任意非线性函数,E(·)表示期望计算函数;
v表示一个具有零均值和单位方差的高斯向量;
r(t)表示参考信号;
所述目标函数的约束条件为:
E{(Y(t)-r(t))2}≤δ
E{[Y(t)2]}-1=0
其中:
δ表示阈值因子,即分离信号和参考信号的信息差要小于阈值因子;
通过引入松弛算子,将不等式约束条件E{(Y(t)-r(t))2}≤δ转换为等式E{(Y(t)-r(t))2-δ+z2=0;引入用于约束E(Y(t)-r(t))2-δ的拉格朗日乘子μ以及用于约束E{[Y(t)2]}-1=0的拉格朗日乘子λ,将目标函数优化求解问题转换为拉格朗日函数求解问题,则转换后的拉格朗日函数为:
其中:
ε表示惩罚因子;
利用拟牛顿算法对拉格朗日函数进行迭代求解,迭代后稳定的信号分离矩阵即为求解结果,则信号分离矩阵的迭代更新公式为:
其中:
η为学习率,将其设置为0.1;
Cov为混合信号x(t)的协方差矩阵;
L′表示拉格朗日函数对W的一阶导数,L″表示拉格朗日函数对W的二阶倒数;
利用迭代后的信号分析矩阵W对混合信号进行分离处理,得到分离后的语音指令信号矩阵。
S4:对分离后的电梯用户语音指令进行声纹提取判断是否为合法用户,如果是则进行语音指令中的指令识别,提取合法用户想要达到的楼层信息,否则发出警报提醒物业。
所述S4步骤中对分离后的电梯用户语音指令进行声纹提取判断是否为合法用户,并提取合法用户想要达到的楼层信息,包括:
预先采集合法用户的声纹信息,对语音指令信号矩阵中的每一行语音指令信号进行声纹信息匹配,若匹配成功则判断该指令信号为合法用户的语音信号,并提取该语音指令信号的楼层信息,所述楼层信息为语音指令信号中的楼层数字,若未匹配成功,则发出警报提醒物业。
S5:将提取到的楼层信息添加到电梯调度控制中进行协同处理,控制电梯运行。
所述S5步骤中将提取到的楼层信息添加到电梯调度控制中进行协同处理,包括:
电梯控制中心将提取到的楼层信息添加到电梯调度控制中,电梯调度控制将电梯内的语音指令信息以及电梯外的乘坐信息进行协同处理,所述协同处理规则为:对提取到的楼层信息进行实时排序处理,排序结果为{Lo1,Lo2,…,Lop},其中Lo1为语音指令中的最低层,Lop为语音指令中的最高层,电梯按照先向上运行的规则向排序结果中高于当前电梯所处楼层的楼层运行,直到达到语音指令中的最高层,进而向下运行;在电梯向上运行过程中,若检测到上方楼层存在用户需要乘坐电梯向上,电梯则在该楼层开门;在电梯向下运行过程中,若检测到下方楼层存在用户需要乘坐电梯向下,电梯则在该楼层开门。在本发明一个具体实施例中,在每层电梯门口分别设置向上乘坐和向下乘坐的按键。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种混合场景条件下的智能电梯控制方法,其特征在于,所述方法包括:
S1:利用电梯内的摄像头获取电梯内部乘客图像,采用基于感受野的目标检测算法从电梯内部乘客图像中提取特征,并对提取的特征信息进行参数优化,检测图像中的所有人物目标;
S2:对检测到的人物目标进行精准人脸识别,判断是否均为合法用户,若存在不合法用户则进行发出警报提醒物业,否则进入后续步骤;
S3:利用声音探测设备获取电梯用户的语音指令,并利用改进的盲源分离算法将用户的语音指令进行信号分离,获取电梯内不同用户的语音指令,其中所述盲源分离算法流程为:
建立盲源分离算法的目标函数:
其中:
U(·)表示任意非线性函数,E(·)表示期望计算函数;
v表示一个具有零均值和单位方差的高斯向量;
r(t)表示参考信号;
所述目标函数的约束条件为:
E{(Y(t)-r(t))2}≤δ
E{[Y(t)2]}-1=0
其中:
δ表示阈值因子;
通过引入松弛算子,将不等式约束条件E{(Y(t)-r(t))2}≤δ转换为等式E{(Y(t)-r(t))2-δ+z2=0;引入用于约束E(Y(t)-r(t))2-δ的拉格朗日乘子μ以及用于约束E{[Y(t)2]}-1=0的拉格朗日乘子λ,将目标函数优化求解问题转换为拉格朗日函数求解问题,则转换后的拉格朗日函数为:
其中:
ε表示惩罚因子;
利用拟牛顿算法对拉格朗日函数进行迭代求解,迭代后稳定的信号分离矩阵即为求解结果,则信号分离矩阵的迭代更新公式为:
其中:
η为学习率,将其设置为0.1;
Cov为混合信号x(t)的协方差矩阵;
L′表示拉格朗日函数对W的一阶导数,L″表示拉格朗日函数对W的二阶倒数;
利用迭代后的信号分析矩阵W对混合信号进行分离处理,得到分离后的语音指令信号矩阵;
S4:对分离后的电梯用户语音指令进行声纹提取判断是否为合法用户,如果是则进行语音指令中的指令识别,提取合法用户想要达到的楼层信息,否则发出警报提醒物业;
S5:将提取到的楼层信息添加到电梯调度控制中进行协同处理,控制电梯运行。
2.如权利要求1所述的一种混合场景条件下的智能电梯控制方法,其特征在于,所述S1步骤中利用电梯内的摄像头获取电梯内部乘客图像,包括:
在电梯内部安装摄像头,当电梯关闭时,电梯内的摄像头拍摄得到电梯内部乘客图像,摄像头内部处理器对电梯内部乘客图像进行预处理,所述图像预处理流程为:
将电梯内部乘客图像像素值转换为灰度值,所述灰度值的转换公式为:
其中:
R(i,j),B(i,j),G(i,j)表示像素(i,j)在RBG颜色通道的值;
gray(i,j)表示像素(i,j)的灰度值;
对电梯内部乘客图像中的所有像素进行灰度值转换,得到电梯内部乘客图像的灰度图,将灰度图作为电梯内部乘客图像的预处理结果,并将电梯内部乘客图像的灰度图发送到电梯控制中心。
3.如权利要求1所述的一种混合场景条件下的智能电梯控制方法,其特征在于,所述S1步骤中采用基于感受野的目标检测算法从电梯内部乘客图像中提取特征信息,包括:
电梯控制中心对电梯内部乘客图像的灰度图进行提取图像特征信息,所述图像特征的提取方法为基于感受野的目标检测算法,所述目标检测算法包括感受野模块以及特征提取模块;
所述基于感受野的目标检测算法流程为:
将电梯内部乘客图像的灰度图输入到目标检测算法中,目标检测算法中的感受野模块对灰度图进行多层卷积,所述感受野模块存在两个分支独立进行卷积,所述分支为f1和f2,分支f1的结构包括一个1*1卷积核大小的卷积层、一个3*1卷积核大小的卷积层以及一个3*3卷积核大小的卷积层,分支f2的结构包括一个1*1卷积核大小的卷积层、一个1*3卷积核大小的卷积层以及一个3*3卷积核大小的卷积层,两个分支分别接收灰度图,并分别对灰度图进行多层卷积处理,得到不同大小的感受野,所述感受野大小的计算公式为:
其中:
ri表示第i层卷积层的感受野大小,r0=1;
stridei表示第i层卷积层的卷积步长大小,stride0=1;
si表示第i层卷积层的卷积核大小,
将分支的卷积结果进行拼接处理,并利用1*1卷积核大小的卷积层对拼接结果进行卷积,得到电梯内部乘客图像的特征图;
利用特征提取模块对特征图进行特征提取,所述特征提取模块的结构包括可扩张的卷积层,池化层,归一化层,并在归一化层输出目标检测的图像特征,所述图像特征信息为电梯内部乘客图像中的人脸图像特征信息,所述可扩张的卷积层结构为:
其中:
Dep表示卷积层的深度,d表示卷积层的初始深度;
Wid表示卷积层的宽度,w表示卷积层的初始宽度。
4.如权利要求3所述的一种混合场景条件下的智能电梯控制方法,其特征在于,所述S1步骤中对提取的特征信息进行参数优化,检测图像中的所有人物目标,包括:
电梯控制中心在电梯内部图像中利用目标框对检测到的人脸图像特征信息进行标定;对于电梯内部乘客图像中所标定的若干目标框区域,利用参数优化模型对人脸图像特征信息进行优化,检测得到人脸图像特征信息中的五官特征信息,并在目标框区域内对检测到的五官特征信息进行标定,检测得到人脸图像目标,所述参数优化模型的训练流程为:
所述参数优化模型为卷积神经网络模型,获取大量清晰的人脸五官图像用于参数优化模型的训练,直到模型的损失函数达到最小,此时的参数优化模型为最优的模型,利用该模型对提取的特征信息进行参数优化,所述参数优化模型训练的损失函数为:
其中:
ωie表示第i个样本中五官e的位置,pos表示五官集合;
5.如权利要求1所述的一种混合场景条件下的智能电梯控制方法,其特征在于,所述S2步骤中对检测到的人物目标进行精准人脸识别,判断是否均为合法用户,包括:
预先采集合法用户的人脸图像,电梯控制中心将电梯内部检测到的人脸图像目标与合法用户人脸图像的五官位置进行匹配,若均成功匹配,则说明电梯内的乘客均为合法用户,并进入后续步骤,若存在不匹配的乘客,则发出警报提醒物业。
6.如权利要求1所述的一种混合场景条件下的智能电梯控制方法,其特征在于,所述S3步骤中利用声音探测设备获取电梯用户的语音指令,并利用改进的盲源分离算法将用户的语音指令进行信号分离,包括:
在电梯内部设置声音探测设备,当电梯门关闭时,声音探测设备采集获取电梯内用户的语音指令,则所采集到的语音指令信号为x(t)=F{[x1(t),x2(t),...,xN(t)]T},其中t表示时域信息,N表示电梯内用户的数目,xN(t)表示第N名用户的语音指令信号,F{·}表示信号混合函数,表示将电梯内所有用户的语音指令信号进行混合,声音探测设备所接收到的语音指令为混合处理后的信号;
利用改进的盲源分离算法对采集到的混合信号x(t)进行分离处理,所述分离结果为:
Y(t)=WTx(t)
其中:
WT表示信号分离矩阵;
Y(t)表示分离后的语音指令信号矩阵,矩阵中的每一行信号表示一位用户的语音指令信号。
7.如权利要求1所述的一种混合场景条件下的智能电梯控制方法,其特征在于,所述S4步骤中对分离后的电梯用户语音指令进行声纹提取判断是否为合法用户,并提取合法用户想要达到的楼层信息,包括:
预先采集合法用户的声纹信息,对语音指令信号矩阵中的每一行语音指令信号进行声纹信息匹配,若匹配成功则判断该指令信号为合法用户的语音信号,并提取该语音指令信号的楼层信息,所述楼层信息为语音指令信号中的楼层数字,若未匹配成功,则发出警报提醒物业。
8.如权利要求7所述的一种混合场景条件下的智能电梯控制方法,其特征在于,所述S5步骤中将提取到的楼层信息添加到电梯调度控制中进行协同处理,包括:
电梯控制中心将提取到的楼层信息添加到电梯调度控制中,电梯调度控制将电梯内的语音指令信息以及电梯外的乘坐信息进行协同处理,所述协同处理规则为:对提取到的楼层信息进行实时排序处理,排序结果为{Lo1,Lo2,...,Lop},其中Lo1为语音指令中的最低层,Lop为语音指令中的最高层,电梯按照先向上运行的规则向排序结果中高于当前电梯所处楼层的楼层运行,直到达到语音指令中的最高层,进而向下运行;在电梯向上运行过程中,若检测到上方楼层存在用户需要乘坐电梯向上,电梯则在该楼层开门;在电梯向下运行过程中,若检测到下方楼层存在用户需要乘坐电梯向下,电梯则在该楼层开门。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210375728.7A CN114644276B (zh) | 2022-04-11 | 2022-04-11 | 一种混合场景条件下的智能电梯控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210375728.7A CN114644276B (zh) | 2022-04-11 | 2022-04-11 | 一种混合场景条件下的智能电梯控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114644276A true CN114644276A (zh) | 2022-06-21 |
CN114644276B CN114644276B (zh) | 2022-12-02 |
Family
ID=81996556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210375728.7A Active CN114644276B (zh) | 2022-04-11 | 2022-04-11 | 一种混合场景条件下的智能电梯控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114644276B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115795278A (zh) * | 2022-12-02 | 2023-03-14 | 广东元一科技实业有限公司 | 一种智能铺布机控制方法、装置及电子设备 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6435337B1 (en) * | 2000-11-17 | 2002-08-20 | Vibro Industries, Inc. | Rotary drive for vibratory conveyors |
JP4411371B1 (ja) * | 2009-03-30 | 2010-02-10 | エヌ・ティ・ティジーピー・エコ株式会社 | エレベータ昇降路内の位置情報取得装置とそのガイド装置 |
CN101667425A (zh) * | 2009-09-22 | 2010-03-10 | 山东大学 | 一种对卷积混叠语音信号进行盲源分离的方法 |
CN106485230A (zh) * | 2016-10-18 | 2017-03-08 | 中国科学院重庆绿色智能技术研究院 | 基于神经网络的人脸检测模型的训练、人脸检测方法及系统 |
CN109099964A (zh) * | 2018-07-11 | 2018-12-28 | 西南交通大学 | 机械密封端面状态监测方法 |
CN110069959A (zh) * | 2018-01-22 | 2019-07-30 | 中国移动通信有限公司研究院 | 一种人脸检测方法、装置及用户设备 |
CN111039112A (zh) * | 2020-03-05 | 2020-04-21 | 王新跃 | 电梯免触摸按键操纵装置 |
CN111178579A (zh) * | 2019-11-26 | 2020-05-19 | 恒大智慧科技有限公司 | 智慧社区内自动导航方法、计算机设备及可读存储介质 |
CN111242005A (zh) * | 2020-01-10 | 2020-06-05 | 西华大学 | 一种基于改进狼群算法优化支持向量机的心音分类方法 |
CN111348499A (zh) * | 2020-03-02 | 2020-06-30 | 北京声智科技有限公司 | 电梯控制方法、装置、电子设备及计算机可读存储介质 |
CN111792464A (zh) * | 2020-07-21 | 2020-10-20 | 睿住科技有限公司 | 电梯的控制方法、电梯及存储介质 |
CN112560701A (zh) * | 2020-12-17 | 2021-03-26 | 成都新潮传媒集团有限公司 | 一种人脸图像提取方法、装置及计算机存储介质 |
CN113128308A (zh) * | 2020-01-10 | 2021-07-16 | 中南大学 | 一种港口场景下的行人检测方法、装置、设备及介质 |
CN113647954A (zh) * | 2021-07-07 | 2021-11-16 | 吉林大学 | 双通道混合网络模型的心血管疾病识别方法、装置及介质 |
-
2022
- 2022-04-11 CN CN202210375728.7A patent/CN114644276B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6435337B1 (en) * | 2000-11-17 | 2002-08-20 | Vibro Industries, Inc. | Rotary drive for vibratory conveyors |
JP4411371B1 (ja) * | 2009-03-30 | 2010-02-10 | エヌ・ティ・ティジーピー・エコ株式会社 | エレベータ昇降路内の位置情報取得装置とそのガイド装置 |
CN101667425A (zh) * | 2009-09-22 | 2010-03-10 | 山东大学 | 一种对卷积混叠语音信号进行盲源分离的方法 |
CN106485230A (zh) * | 2016-10-18 | 2017-03-08 | 中国科学院重庆绿色智能技术研究院 | 基于神经网络的人脸检测模型的训练、人脸检测方法及系统 |
CN110069959A (zh) * | 2018-01-22 | 2019-07-30 | 中国移动通信有限公司研究院 | 一种人脸检测方法、装置及用户设备 |
CN109099964A (zh) * | 2018-07-11 | 2018-12-28 | 西南交通大学 | 机械密封端面状态监测方法 |
CN111178579A (zh) * | 2019-11-26 | 2020-05-19 | 恒大智慧科技有限公司 | 智慧社区内自动导航方法、计算机设备及可读存储介质 |
CN113128308A (zh) * | 2020-01-10 | 2021-07-16 | 中南大学 | 一种港口场景下的行人检测方法、装置、设备及介质 |
CN111242005A (zh) * | 2020-01-10 | 2020-06-05 | 西华大学 | 一种基于改进狼群算法优化支持向量机的心音分类方法 |
CN111348499A (zh) * | 2020-03-02 | 2020-06-30 | 北京声智科技有限公司 | 电梯控制方法、装置、电子设备及计算机可读存储介质 |
CN111039112A (zh) * | 2020-03-05 | 2020-04-21 | 王新跃 | 电梯免触摸按键操纵装置 |
CN111792464A (zh) * | 2020-07-21 | 2020-10-20 | 睿住科技有限公司 | 电梯的控制方法、电梯及存储介质 |
CN112560701A (zh) * | 2020-12-17 | 2021-03-26 | 成都新潮传媒集团有限公司 | 一种人脸图像提取方法、装置及计算机存储介质 |
CN113647954A (zh) * | 2021-07-07 | 2021-11-16 | 吉林大学 | 双通道混合网络模型的心血管疾病识别方法、装置及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115795278A (zh) * | 2022-12-02 | 2023-03-14 | 广东元一科技实业有限公司 | 一种智能铺布机控制方法、装置及电子设备 |
CN115795278B (zh) * | 2022-12-02 | 2023-08-04 | 广东元一科技实业有限公司 | 一种智能铺布机控制方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114644276B (zh) | 2022-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348319B (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
CN108121984B (zh) | 一种字符识别方法及装置 | |
CN109882019B (zh) | 一种基于目标检测和动作识别的汽车电动尾门开启方法 | |
CN108154102B (zh) | 一种道路交通标志识别方法 | |
CN109766936B (zh) | 基于信息传递和注意力机制的图像变化检测方法 | |
CN113011357B (zh) | 基于时空融合的深度伪造人脸视频定位方法 | |
CN107909005A (zh) | 基于深度学习的监控场景下人物姿态识别方法 | |
CN110728216A (zh) | 一种基于行人属性自适应学习的无监督行人再识别方法 | |
CN112149616B (zh) | 基于动态信息的人物交互行为识别方法 | |
CN111539351B (zh) | 一种多任务级联的人脸选帧比对方法 | |
CN110245620B (zh) | 一种基于注意力的非最大化抑制方法 | |
CN110084198B (zh) | 基于Fisher特征分析的CNN机场室内场景识别方法 | |
Morade et al. | A novel lip reading algorithm by using localized ACM and HMM: Tested for digit recognition | |
CN114644276B (zh) | 一种混合场景条件下的智能电梯控制方法 | |
US9378406B2 (en) | System for estimating gender from fingerprints | |
CN114067444A (zh) | 基于元伪标签和光照不变特征的人脸欺骗检测方法和系统 | |
CN109117723B (zh) | 基于颜色模式分析与语义分割的盲道检测方法 | |
CN109325472B (zh) | 一种基于深度信息的人脸活体检测方法 | |
CN110135309B (zh) | 基于深度共享表示的sar图像变化检测方法 | |
KR101077312B1 (ko) | 하라이크 특징점을 이용한 사람 검출 장치 및 그 방법 | |
CN116994295B (zh) | 基于灰度样本自适应选择门的野生动物类别识别方法 | |
CN117173677A (zh) | 手势识别方法、装置、设备及存储介质 | |
CN114360058B (zh) | 一种基于行走视角预测的跨视角步态识别方法 | |
CN112633264B (zh) | 一种车辆属性识别方法、装置、电子设备及存储介质 | |
CN107563452B (zh) | 一种基于判别测度学习的交叉域地基云图分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |