CN114049897A - 一种电器设备的控制方法、装置、电子设备和存储介质 - Google Patents
一种电器设备的控制方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114049897A CN114049897A CN202111204407.2A CN202111204407A CN114049897A CN 114049897 A CN114049897 A CN 114049897A CN 202111204407 A CN202111204407 A CN 202111204407A CN 114049897 A CN114049897 A CN 114049897A
- Authority
- CN
- China
- Prior art keywords
- voice information
- personnel
- electrical equipment
- room
- mahalanobis distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 19
- 238000001228 spectrum Methods 0.000 claims description 18
- 238000001914 filtration Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000007621 cluster analysis Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000004378 air conditioning Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 238000004134 energy conservation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003749 cleanliness Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Air Conditioning Control Device (AREA)
Abstract
本发明实施例提供了一种电器设备的控制方法、装置、电子设备和存储介质,方法包括:通过拾音设备采集室内的语音信息,根据语音信息确定在室内的人员数量,根据人员数量,控制电器设备的运行,应用本发明实施例,通过拾音设备采集室内的语音信息,根据语音信息确定室内的人员数量,可以保护室内人员的隐私安全,以解决通过机器视觉判别室内人员数量,导致的隐私性差,成本高等问题。
Description
技术领域
本发明涉及人工智能技术领域,特别是涉及一种电器设备的控制方法、一种电器设备的控制装置、电子设备和存储介质。
背景技术
在会议室或场馆等人员密集区域时,为保证区域人员的舒适度,时常需要根据工作人员进行电器功效的调整,例如对空调的温度调整、湿度调整、空气流动速度调整和空气洁净度调整等。
目前,通常采用机器视觉识别人脸的方式,来判断区域内的人员数量,然而,此类方式成本高且人员信息易泄露,保密性和隐私性较差。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种电器设备的控制方法和相应的一种电器设备的控制装置、电子设备、存储介质。
为了解决上述问题,本发明实施例公开了一种电器设备的控制方法,所述电器设备应用于室内,在所述室内均匀布设有若干拾音设备,所述方法包括:
通过所述拾音设备采集室内的语音信息;
根据所述语音信息确定在所述室内的人员数量;
根据所述人员数量,控制所述电器设备的运行。
可选地,所述根据所述语音信息确定在所述室内的人员数量,包括:
对所述语音信息进行短时傅里叶变换处理,得到所述语音信息对应的频谱信息;
对所述频谱信息进行特征提取,得到所述语音信息对应的声纹特征;
对所述声纹特征进行聚类分析处理,确定出在所述室内的人员数量。
可选地,在所述对所述语音信息进行短时傅里叶变换处理之前,还包括:
对所述语音信息进行维纳滤波,得到增强后的语音信号。
可选地,所述对所述声纹特征进行聚类分析处理,确定出在所述室内的人员数量,包括:
对所述声纹特征进行z-score标准化处理,得到统一度量的声纹特征;
计算所述统一度量的声纹特征之间的马氏距离,生成邻近度矩阵;
判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值;
当所述最小的马氏距离小于所述预设阈值,将所述最小的马氏距离对应的两类合并为一类,更新所述邻近度矩阵,并返回执行所述判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值步骤;
当所述最小的马氏距离大于或等于所述预设阈值,输出当前类的数量作为所述人员数量。
可选地,若干所述拾音设备在所述室内按照阵列布设,还包括:
确定出所述拾音设备接收到所述语音信息的时间;
根据所述时间计算所述拾音设备之间接收到所述语音信息的时间差;
根据所述时间差,确定出所述语音信息对应的人员在所述室内的位置;
根据所述人员在所述室内的位置,或根据所述人员数量和所述人员在所述室内的位置,控制所述电器设备的运行。
可选地,所述电器设备至少包括空调、音响、麦克风、新风、灯光设备中的一种。
本发明实施例公开了一种电器设备的控制装置,所述电器设备应用于室内,在所述室内均匀布设有若干拾音设备,所述装置包括:
语音采集模块,用于通过所述拾音设备采集室内的语音信息;
数量确定模块,用于根据所述语音信息确定在所述室内的人员数量;
运行控制模块,用于根据所述人员数量,控制所述电器设备的运行。
可选地,所述数量确定模块,包括:
信息变换子模块,用于对所述语音信息进行短时傅里叶变换处理,得到所述语音信息对应的频谱信息;
特征提取子模块,用于对所述频谱信息进行特征提取,得到所述语音信息对应的声纹特征;
特征聚类子模块,用于对所述声纹特征进行聚类分析处理,确定出在所述室内的人员数量。
可选地,还包括:
语音滤波子模块,用于对所述语音信息进行维纳滤波,得到增强后的语音信号。
可选地,所述特征聚类子模块,包括:
特征标准化单元,用于对所述声纹特征进行z-score标准化处理,得到统一度量的声纹特征;
距离计算子单元,用于计算所述统一度量的声纹特征之间的马氏距离,生成邻近度矩阵;
距离判断子单元,用于判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值;
类合并子单元,用于当所述最小的马氏距离小于所述预设阈值,将所述最小的马氏距离对应的两类合并为一类,更新所述邻近度矩阵,并返回执行所述判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值步骤;
数量输出子单元,用于当所述最小的马氏距离大于或等于所述预设阈值,输出当前类的数量作为所述人员数量。
可选地,若干所述拾音设备在所述室内按照阵列布设,所述装置还包括:
时间确定模块,用于确定出所述拾音设备接收到所述语音信息的时间;
时间差确定模块,用于根据所述时间计算所述拾音设备之间接收到所述语音信息的时间差;
位置确定模块,用于根据所述时间差,确定出所述语音信息对应的人员在所述室内的位置;
运行控制模块,还用于根据所述人员在所述室内的位置,或根据所述人员数量和所述人员在所述室内的位置,控制所述电器设备的运行。
可选地,所述电器设备至少包括空调、音响、麦克风、新风、灯光设备中的一种。
本发明实施例公开了一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的电器设备的控制方法的步骤。
本发明实施例公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的电器设备的控制方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,通过拾音设备采集室内的语音信息,根据语音信息确定在室内的人员数量,根据人员数量,控制电器设备的运行,应用本发明实施例,通过拾音设备采集室内的语音信息,根据语音信息确定室内的人员数量,可以保护室内人员的隐私安全,以解决通过机器视觉判别室内人员数量,导致的隐私性差,成本高等问题。
另外,通过确定出室内的人员数量,智能控制电器设备的运行,实现自动选择电器设备最优的运行方式,以达到经济、节能且舒适的目的。
附图说明
图1是本发明的一种电器设备的控制方法实施例的步骤流程图;
图2是本发明的另一种电器设备的控制方法实施例的步骤流程图;
图3是本发明的一种拾音设备阵列实施例的示意图;
图4是本发明的一种电器设备控制方法实施例的结构框图;
图5是本发明的一种聚类分析实施例的步骤流程图;
图6是本发明的一种电器设备的控制装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种电器设备的控制方法实施例的步骤流程图,本发明实施例具体可以包括如下步骤:
步骤101,通过所述拾音设备采集室内的语音信息。
其中,室内可以为会议室、剧场、体育馆等人员密集区域,在室内各个方向均匀布设有若干拾音设备,以便采集室内人员的语音信息。
具体地,在室内人员进行交流时,通过多点布置在室内的拾音设备,实时采集得到室内人员的语音信息。
本发明实施例中,通过室内各个方向均匀布设有若干拾音设备,可以全面地采集室内人员的语音信息,解决声音采集设备采集声音不全面的问题。
步骤102,根据所述语音信息确定在所述室内的人员数量。
具体地,通过语音信息可以判断出室内说话的人员,进而确定出室内的人员数量,并且根据实时采集得到室内人员的语音信息,可以检测室内的人员数量的变化情况,以便于对室内的电器进行控制。
步骤103,根据所述人员数量,控制所述电器设备的运行。
其中,室内的电器设备包括空调、音响、麦克风、新风、灯光设备等。
具体的,在通过语音信息确定出室内的人员数量,可以根据室内人员的数量实时对室内的电器设备进行控制调整,在室内人员数量变多时,增加电器设备的功效,在室内人员数量少时,减小电器设备的功效,具体如对空调的温度调整、湿度调整、空气流动速度调整和空气洁净度调整、对音响的音量调整,灯光设备的明亮调整等。
本发明实施例中,通过拾音设备采集室内的语音信息,根据语音信息确定室内的人员数量,可以保护室内人员的隐私安全,以解决通过机器视觉判别室内人员数量,导致的隐私性差,成本高等问题。
另外,通过确定出室内的人员数量,智能控制电器设备的运行,实现自动选择电器设备最优的运行方式,以达到经济、节能且舒适的目的。
参照图2,示出了本发明的另一种电器设备的控制方法实施例的步骤流程图,本发明实施例具体可以包括如下步骤:
步骤201,通过所述拾音设备采集室内的语音信息。
步骤202,对所述语音信息进行短时傅里叶变换处理,得到所述语音信息对应的频谱信息。
具体地,在对语音信息进行短时傅里叶变换(Short-Time Fourier Transform,STFT)处理时,对语音信息进行分帧和加窗处理,得到多个加窗数据帧,再对每个加窗数据帧进行傅里叶变换处理,得到语音信息的频谱信息。
在本发明一实施例中,在所述步骤202之前,还包括:对所述语音信息进行维纳滤波,得到增强后的语音信号。
具体地,对语音信号进行维纳滤波,以进行语音增强,以最小平方误差为最优推测的线性滤波器,平方误差的均值E(e2)如下:
其中,Rs是原始信号s(t)的自相关函数,Rx是估计信号x(t)的自相关函数,Rxs是x(t)和s(t)的互相关函数,g(t)是维纳滤波器。
步骤203,对所述频谱信息进行特征提取,得到所述语音信息对应的声纹特征。
具体地,在得到语音信息对应的频谱信息,可以对频谱信息进行特征提取,得到语音信息对应的声纹特征,比如通过基于深度卷积神经网络(ResNet网络)的特征提取模型,对有语音信息的频谱信息进行特征提取,得到语音信息对应的声纹特征向量(声纹特征)。
步骤204,对所述声纹特征进行聚类分析处理,确定出在所述室内的人员数量。
在本发明一实施例中,所述步骤204包括:对所述声纹特征进行z-score标准化处理,得到统一度量的声纹特征;计算所述统一度量的声纹特征之间的马氏距离,生成邻近度矩阵;判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值;当所述最小的马氏距离小于所述预设阈值,将所述最小的马氏距离对应的两类合并为一类,更新所述邻近度矩阵,并返回执行所述判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值步骤;当所述最小的马氏距离大于或等于所述预设阈值,输出当前类的数量作为所述人员数量。
具体地,在对频谱信息进行特征提取,得到语音信息对应的声纹特征之后,由于各声纹特征的量级相差过大,所以先对得到的声纹特征进行z-score标准化处理,对各声纹特征进行统一度量,具体采用下述公式:
其中,x是个体的观测值,μ是总体的均值,δ是总体数据的标准差。
然后,计算统一度量的声纹特征之间的马氏距离(Mahalanobis distance),马氏距离d(X,Y)具体如下:
其中,X,Y指的是两个类(对应两个声纹特征),w指的是权重向量。从而求得各声纹特征(类)之间的马氏距离。
创建一个邻近度矩阵记录相近两类(声纹特征)的马氏距离,判断邻近度矩阵中最小的马氏距离是否小于预设阈值;当最小的马氏距离小于预设阈值,将最小的马氏距离对应的两类(两个声纹特征)合并为一类(同一类声纹特征),更新邻近度矩阵。并返回执行判断邻近度矩阵中最小的马氏距离是否小于预设阈值步骤,重复上述操作。
知道当邻近度矩阵中最小的马氏距离大于或等于预设阈值,输出当前类(声纹特征)的数量作为人员数量。
步骤205,根据所述人员数量,控制所述电器设备的运行。
在本发明一实施例中,若干所述拾音设备在所述室内按照阵列布设,还包括:确定出所述拾音设备接收到所述语音信息的时间;根据所述时间计算所述拾音设备之间接收到所述语音信息的时间差;根据所述时间差,确定出所述语音信息对应的人员在所述室内的位置;根据所述人员在所述室内的位置,或根据所述人员数量和所述人员在所述室内的位置,控制所述电器设备的运行。
参照图3,示出了本发明的一种拾音设备阵列实施例的示意图,如图可知,若干拾音设备在室内按照阵列布设,通过拾音设备阵列接收语音信息,并估计出语音信息到达不同拾音设备的时间差,利用时间差以及拾音设备阵列计算得到语音信息的声源的位置作为语音信息对应的人员在室内的位置。在确定出语音信息对应的人员在室内的位置之后,可以根据人员在室内的位置制电器设备的运行,例如控制灯光设备的明亮,无人的位置调暗灯光或关闭;或根据人员数量和人员在室内的位置,一起控制电器设备的运行。
本发明实施例中,通过拾音设备采集室内的语音信息,根据语音信息确定室内的人员数量,可以保护室内人员的隐私安全,以解决通过机器视觉判别室内人员数量,导致的隐私性差,成本高等问题。另外,通过确定出室内的人员数量或和人员在室内的位置,智能控制电器设备的运行,实现自动选择电器设备最优的运行方式,以达到经济、节能且舒适的目的。
为了更好地理解本发明中的实施例,以下对电器设备的控制方法加以示例性说明,但应当理解的是,本申请实施例并不限于此。
参照图4,示出了本发明的一种电器设备控制方法实施例的结构框图,包括拾音模块、声纹模块、控制模块、聚类模块、控制模块。
拾音模块,如麦克风阵列,多个拾音装备对场景区域进行多点布置,获取场景内人员的语音信息。此外,采集语音信息后对语音信息进行语音增强预处理。
声纹模块,对增强后的语音信号进行分析,提取在场人员的声纹特征,即携带语音信息的声波频谱,并将该特征输送至聚类模块。
聚类模块,对声纹特征进行聚类分析,判断场景中的人员数量。
控制模块,用于根据聚类模块的判别的人员数量下达输出模块的控制命令。
输出模块,指场景中联动的电器设备,如空调、新风、麦克风、音箱、灯光设备等。
参照图5,示出了本发明的一种聚类分析实施例的步骤流程图,如图可知,拾音设备获取语音信息后,对语音信息进行维纳滤波,以进行语音增强;
然后对增强后的语音信号,进行短时傅里叶变换处理后提取声纹特征;
对度量不一样的声纹特征进行Z-score标准化,得到统一度量的声纹特征向量(声纹特征);
将每个声纹特征视为一个类,计算各类之间的马氏距离,并创建一个邻近度矩阵记录相近两类的距离,判断最近的距离是否小于预设阈值,若小于预设阈值合并最近的两类,重复上述操作。当判断最近的距离是大于或等于预设阈值时,输出当前类的数量,即人员数量。
若室内人员数量增加,控制电器设备的功效增加,否则控制电器设备的功效降低。例如空调的风量随着人员的增减而增大,音箱、麦克风的音量随着人员的增减而增大或减小。
本发明实施例中,通过拾音设备采集室内的语音信息,根据语音信息确定室内的人员数量,可以保护室内人员的隐私安全,以解决通过机器视觉判别室内人员数量,导致的隐私性差,成本高等问题。
另外,通过确定出室内的人员数量,智能控制电器设备的运行,实现自动选择电器设备最优的运行方式,以达到经济、节能且舒适的目的。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图6,示出了本发明的一种电器设备的控制装置实施例的结构框图,所述电器设备应用于室内,在所述室内均匀布设有若干拾音设备,本发明实施例具体可以包括如下模块:
语音采集模块601,用于通过所述拾音设备采集室内的语音信息;
数量确定模块602,用于根据所述语音信息确定在所述室内的人员数量;
运行控制模块603,用于根据所述人员数量,控制所述电器设备的运行。
在本发明一实施例中,所述数量确定模块602,包括:
信息变换子模块,用于对所述语音信息进行短时傅里叶变换处理,得到所述语音信息对应的频谱信息;
特征提取子模块,用于对所述频谱信息进行特征提取,得到所述语音信息对应的声纹特征;
特征聚类子模块,用于对所述声纹特征进行聚类分析处理,确定出在所述室内的人员数量。
在本发明一实施例中,还包括:
语音滤波子模块,用于对所述语音信息进行维纳滤波,得到增强后的语音信号。
在本发明一实施例中,所述特征聚类子模块,包括:
特征标准化单元,用于对所述声纹特征进行z-score标准化处理,得到统一度量的声纹特征;
距离计算子单元,用于计算所述统一度量的声纹特征之间的马氏距离,生成邻近度矩阵;
距离判断子单元,用于判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值;
类合并子单元,用于当所述最小的马氏距离小于所述预设阈值,将所述最小的马氏距离对应的两类合并为一类,更新所述邻近度矩阵,并返回执行所述判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值步骤;
数量输出子单元,用于当所述最小的马氏距离大于或等于所述预设阈值,输出当前类的数量作为所述人员数量。
在本发明一实施例中,若干所述拾音设备在所述室内按照阵列布设,所述装置还包括:
时间确定模块,用于确定出所述拾音设备接收到所述语音信息的时间;
时间差确定模块,用于根据所述时间计算所述拾音设备之间接收到所述语音信息的时间差;
位置确定模块,用于根据所述时间差,确定出所述语音信息对应的人员在所述室内的位置;
运行控制模块,还用于根据所述人员在所述室内的位置,或根据所述人员数量和所述人员在所述室内的位置,控制所述电器设备的运行。
在本发明一实施例中,所述电器设备至少包括空调、音响、麦克风、新风、灯光设备中的一种。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例公开了一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上电器设备的控制方法实施例所述的步骤。
本发明实施例公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上电器设备的控制方法实施例所述的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种电器设备的控制方法、一种电器设备的控制装置、电子设备和存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种电器设备的控制方法,其特征在于,所述电器设备应用于室内,在所述室内均匀布设有若干拾音设备,所述方法包括:
通过所述拾音设备采集室内的语音信息;
根据所述语音信息确定在所述室内的人员数量;
根据所述人员数量,控制所述电器设备的运行。
2.根据权利要求1所述的方法,其特征在于,所述根据所述语音信息确定在所述室内的人员数量,包括:
对所述语音信息进行短时傅里叶变换处理,得到所述语音信息对应的频谱信息;
对所述频谱信息进行特征提取,得到所述语音信息对应的声纹特征;
对所述声纹特征进行聚类分析处理,确定出在所述室内的人员数量。
3.根据权利要求2所述的方法,其特征在于,在所述对所述语音信息进行短时傅里叶变换处理之前,还包括:
对所述语音信息进行维纳滤波,得到增强后的语音信号。
4.根据权利要求2所述的方法,其特征在于,所述对所述声纹特征进行聚类分析处理,确定出在所述室内的人员数量,包括:
对所述声纹特征进行z-score标准化处理,得到统一度量的声纹特征;
计算所述统一度量的声纹特征之间的马氏距离,生成邻近度矩阵;
判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值;
当所述最小的马氏距离小于所述预设阈值,将所述最小的马氏距离对应的两类合并为一类,更新所述邻近度矩阵,并返回执行所述判断所述邻近度矩阵中最小的马氏距离是否小于预设阈值步骤;
当所述最小的马氏距离大于或等于所述预设阈值,输出当前类的数量作为所述人员数量。
5.根据权利要求1所述的方法,其特征在于,若干所述拾音设备在所述室内按照阵列布设,还包括:
确定出所述拾音设备接收到所述语音信息的时间;
根据所述时间计算所述拾音设备之间接收到所述语音信息的时间差;
根据所述时间差,确定出所述语音信息对应的人员在所述室内的位置;
根据所述人员在所述室内的位置,或根据所述人员数量和所述人员在所述室内的位置,控制所述电器设备的运行。
6.根据权利要求1所述的方法,其特征在于,所述电器设备至少包括空调、音响、麦克风、新风、灯光设备中的一种。
7.一种电器设备的控制装置,其特征在于,所述电器设备应用于室内,在所述室内均匀布设有若干拾音设备,所述装置包括:
语音采集模块,用于通过所述拾音设备采集室内的语音信息;
数量确定模块,用于根据所述语音信息确定在所述室内的人员数量;
运行控制模块,用于根据所述人员数量,控制所述电器设备的运行。
8.根据权利要求7所述的装置,其特征在于,所述数量确定模块,包括:
信息变换子模块,用于对所述语音信息进行短时傅里叶变换处理,得到所述语音信息对应的频谱信息;
特征提取子模块,用于对所述频谱信息进行特征提取,得到所述语音信息对应的声纹特征;
特征聚类子模块,用于对所述声纹特征进行聚类分析处理,确定出在所述室内的人员数量。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的电器设备控制方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的电器设备控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111204407.2A CN114049897A (zh) | 2021-10-15 | 2021-10-15 | 一种电器设备的控制方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111204407.2A CN114049897A (zh) | 2021-10-15 | 2021-10-15 | 一种电器设备的控制方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114049897A true CN114049897A (zh) | 2022-02-15 |
Family
ID=80205221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111204407.2A Pending CN114049897A (zh) | 2021-10-15 | 2021-10-15 | 一种电器设备的控制方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114049897A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117290670A (zh) * | 2023-11-27 | 2023-12-26 | 南京中鑫智电科技有限公司 | 一种基于增强滤波器算法的变压器套管绝缘状态估计方法 |
-
2021
- 2021-10-15 CN CN202111204407.2A patent/CN114049897A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117290670A (zh) * | 2023-11-27 | 2023-12-26 | 南京中鑫智电科技有限公司 | 一种基于增强滤波器算法的变压器套管绝缘状态估计方法 |
CN117290670B (zh) * | 2023-11-27 | 2024-01-26 | 南京中鑫智电科技有限公司 | 一种基于增强滤波器算法的变压器套管绝缘状态估计方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108198562A (zh) | 一种用于实时定位辨识动物舍内异常声音的方法及系统 | |
Goetze et al. | Acoustic monitoring and localization for social care | |
Huang et al. | Occupancy estimation in smart buildings using audio-processing techniques | |
Jia et al. | SoundLoc: Accurate room-level indoor localization using acoustic signatures | |
JP2010112994A (ja) | 音声処理装置、音声処理方法およびプログラム | |
CN107202559B (zh) | 基于室内声学信道扰动分析的物体识别方法 | |
US11631394B2 (en) | System and method for determining occupancy | |
CN109671430B (zh) | 一种语音处理方法及装置 | |
CN109595757B (zh) | 空调器的控制方法、装置及具有其的空调器 | |
CN112820291A (zh) | 智能家居控制方法、系统和存储介质 | |
CN109997186B (zh) | 一种用于分类声环境的设备和方法 | |
CN107690034A (zh) | 基于环境背景声音的智能情景模式切换系统及方法 | |
CN114049897A (zh) | 一种电器设备的控制方法、装置、电子设备和存储介质 | |
Srinivasan et al. | Preventive maintenance of centralized HVAC systems: use of acoustic sensors, feature extraction, and unsupervised learning | |
CN113077812B (zh) | 语音信号生成模型训练方法、回声消除方法和装置及设备 | |
Chavdar et al. | Scarrie: A real-time system for sound event detection for assisted living | |
US20230062634A1 (en) | Voice trigger based on acoustic space | |
CN114743562B (zh) | 一种飞机声纹识别方法、系统、电子设备及存储介质 | |
CN109031202A (zh) | 基于听觉场景分析的室内环境区域定位系统及方法 | |
ÇATALBAŞ et al. | 3D moving sound source localization via conventional microphones | |
CN110941189A (zh) | 智能家居系统及其控制方法、可读存储介质 | |
WO2020183845A1 (ja) | 音響処理方法 | |
Jia et al. | Soundloc: Acoustic method for indoor localization without infrastructure | |
Zhao et al. | A model of co-saliency based audio attention | |
CN113326788B (zh) | 基于室内声场扰动识别的室内人群密度估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |