CN116863957B - 工业设备运行状态的识别方法、装置、设备及存储介质 - Google Patents
工业设备运行状态的识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116863957B CN116863957B CN202311132923.8A CN202311132923A CN116863957B CN 116863957 B CN116863957 B CN 116863957B CN 202311132923 A CN202311132923 A CN 202311132923A CN 116863957 B CN116863957 B CN 116863957B
- Authority
- CN
- China
- Prior art keywords
- sample
- spectrogram
- sample set
- dimensional
- dimensional spectrogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 230000005236 sound signal Effects 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 238000005259 measurement Methods 0.000 claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 238000010183 spectrum analysis Methods 0.000 claims abstract description 13
- 230000006835 compression Effects 0.000 claims description 38
- 238000007906 compression Methods 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 abstract description 9
- 230000000694 effects Effects 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明提供了一种工业设备运行状态的识别方法、装置、设备及存储介质,可以先通过获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号,接着,基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量;最后,根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的运行状态分类结果。其无需训练、参数和GPU资源,即可实现良好的效果,为进一步的自动化运行监测提供了有力支持。
Description
技术领域
本发明涉及声音识别领域,特别涉及一种工业设备运行状态的识别方法、装置、设备及存储介质。
背景技术
在工业设备音频识别领域,准确识别设备的运行状态具有重要意义,可以帮助监测设备的健康状态,预测故障,进行智能维护。但是工业场景下的音频信号往往很复杂,包含大量噪声,给识别带来挑战。
传统的音频识别方法大多依赖人工提取音频特征和标签样本进行监督训练,需要大量标注样本和运算资源。近年来深度学习技术为音频识别带来重大进展,但训练深度模型同样需要大量标注数据和运算资源。
有鉴于此,提出本申请。
发明内容
本发明公开了一种工业设备运行状态的识别方法、装置、设备及存储介质,旨在基于工业设备的运行声音高效的识别出工业设备的运行状态。
本发明第一实施例提供了一种工业设备运行状态的识别方法,包括:
获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号;
基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量;
根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的分类结果,其中,所述分类结果用于确定工业设备的当前运行状态。
优选地,所述基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量,具体为:
将每一段所述二维频谱图与样本集的每一样本在时间维度拼接,以生成拼接频谱图;
调用图像压缩算法分别计算每一段所述二维频谱图、样本集的每一样本、以及拼接频谱图的归一化压缩长度;
根据归一化压缩长度建立每一段所述二维频谱图与样本集的每一样本之间的特征度量。
优选地,所述特征度量的表达式为:
其中,为拼接频谱图的归一化压缩长度,/>为二维频谱图的归一化压缩长度,/>为样本集样本的归一化压缩长度,/>为样本集样本,/>二维频谱图,/>为拼接频谱图,/>为二维频谱图与样本集样本之间的特征度量。
优选地,所述梅尔频谱的参数为:跳跃长度为320,窗口长度为1024,窗口类型为汉宁窗,梅尔滤波器个数为48。
本发明第二实施例提供了一种工业设备运行状态的识别装置 ,包括:
音频信号生成单元,用于获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号;
特征度量计算单元,用于基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量;
分类结果生成单元,用于根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的分类结果,其中,所述分类结果用于确定工业设备的当前运行状态。
优选地,所述特征度量计算单元,具体用于:
将每一段所述二维频谱图与样本集的每一样本在时间维度拼接,以生成拼接频谱图;
调用图像压缩算法分别计算每一段所述二维频谱图、样本集的每一样本、以及拼接频谱图的归一化压缩长度;
根据归一化压缩长度建立每一段所述二维频谱图与样本集的每一样本之间的特征度量。
优选地,所述特征度量的表达式为:
其中,为拼接频谱图的归一化压缩长度,/>为二维频谱图的归一化压缩长度,/>为样本集样本的归一化压缩长度,/>为样本集样本,/>二维频谱图,/>为拼接频谱图,/>为二维频谱图与样本集样本之间的特征度量。
优选地,所述梅尔频谱的参数为:跳跃长度为320,窗口长度为1024,窗口类型为汉宁窗,梅尔滤波器个数为48。
本发明第三实施例提供了一种工业设备的运行状态的识别设备,其特征在于,包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如上任意一项所述的一种工业设备运行状态的识别方法。
本发明第四实施例提供了一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被所述计算机可读存储介质所在设备的处理器执行,以实现如上任意一项所述的一种工业设备运行状态的识别方法。
基于本发明提供的一种工业设备运行状态的识别方法、装置、设备及存储介质,可以先通过获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号,接着,基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量;最后,根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的运行状态分类结果。其无需训练、参数和GPU资源,即可实现良好的效果,为进一步的自动化运行监测提供了有力支持。
附图说明
图1是本发明第一实施例提供的一种工业设备运行状态的识别方法的流程示意图;
图2是本发明第二实施例提供的一种工业设备运行状态的识别装置的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
实施例中提及的“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
以下结合附图对本发明的具体实施例做详细说明。
本发明公开了一种工业设备运行状态的识别方法、装置、设备及存储介质,旨在基于工业设备的运行声音高效的识别出工业设备的运行状态。
请参阅图1,本发明第一实施例提供了一种工业设备运行状态的识别方法,其可由工业设备运行状态的识别设备(以下简称识别设备)来执行,特别的,由所述识别设备内的一个或者多个处理器来执行,以至少实现如下步骤:
S101,获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号;
在本实施例中,所述识别设备可为台式电脑、笔记本电脑、服务器、工作站等具有数据处理分析能力的终端,其中,所述识别设备内可安装有相应的操作系统以及应用软件,并通过操作系统以及应用软件的结合来实现本实施例所需的功能。
需要说明的是,所述声音采集器可以是配置识别设备上的麦克风,用来采集工业设备运行时的声音,其可以通过有线或者无线的方式向所述识别设备提供声音信息。
在本实施例中,通过将连续的运行音频分割成短音频片段后,每段音频包含了更为精细的运行状态特征。这使得在每段音频上进行特征分析和分类更加准确,有助于捕捉设备不同运行状态下的微小变化。
进一步地,长时间的连续音频数据可能包含大量冗余信息,分割后的短音频片段则能够削减不必要的计算复杂性。在短音频片段上进行特征提取和距离计算,能够加速运算过程,实现更高效的设备运行状态识别。
更进一步地,将音频分割成短片段使得系统能够更及时地响应设备状态的变化。这对于实时性要求较高的工业生产环境非常重要,能够提前发现设备异常情况并及时采取措施。同时,也为系统的灵活性提供了基础,因为分割后的片段能够更灵活地用于不同的特征提取和分析方法。
S102,基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量,其中,所述集样本可以包括停机状态、空载运转状态、负载运转状态三种状态,以及在负载运行状态下的正常状态和异常状态;
在本实施例中,梅尔频谱分析是通过spectrogram与若干个梅尔滤波器点乘得到,y轴转换为对数刻度,像素值转换为分贝,能够强化对高频段变化的敏感性。在本实施例中,用梅尔频谱分析将一维轧机音频信号转化为二维频谱图,梅尔频谱参数如下,跳跃长度为320,窗口长度为1024,窗口类型为汉宁窗,梅尔滤波器个数为48,最后过滤2维频谱中空值的行;
具体地,在本实施例中,可以将每一段所述二维频谱图与样本集的每一样本在时间维度拼接,以生成拼接频谱图;
调用图像压缩算法分别计算每一段所述二维频谱图、样本集的每一样本、以及拼接频谱图的归一化压缩长度;
根据归一化压缩长度建立每一段所述二维频谱图与样本集的每一样本之间的特征度量。
所述特征度量的表达式为:
其中,为拼接频谱图的归一化压缩长度,/>为二维频谱图的归一化压缩长度,/>为样本集样本的归一化压缩长度,/>为样本集样本,/>二维频谱图,/>为拼接频谱图,/>为二维频谱图与样本集样本之间的特征度量。
需要说明的是,利用梅尔频谱分析法将音频信号转换为二维频谱图,能够将声音信息以图像的形式呈现。这种图像表示方式更便于特征提取,有助于捕捉不同运行状态下的声音特征。这提供了更丰富的信息基础,从而提高了运行状态识别的准确性。将每一段二维频谱图与样本集的每一样本在时间维度进行拼接,生成拼接频谱图后,利用图像压缩算法计算归一化压缩长度。通过这种方式,能够综合考虑不同时间段的频谱特征,构建更全面的特征度量。这有助于提高对设备运行状态的判别力和鲁棒性。基于图像压缩算法计算的归一化压缩长度,能够有效地度量不同频谱图之间的相似性。这为运行状态分类提供了可靠的指标,使得设备不同状态之间的特征差异能够被量化地衡量。尽管进行了多次的图像压缩算法计算,但由于压缩算法的高效性,整体计算复杂性仍然相对较低(在本实施例中,压缩算法选择JPEG2000,但不仅限于此)。这有助于实现高效的设备运行状态识别,特别是在需要实时性的工业生产环境中。通过将每段二维频谱图与样本集样本拼接,并根据归一化压缩长度建立特征度量,该方法具有一定的适应性和普适性。它可以适用于不同类型的工业设备音频数据,从而具备更广泛的应用潜力。
S103,根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的分类结果,其中,所述分类结果用于确定工业设备的当前运行状态。
需要说明的是,基于特征度量,构建的距离矩阵能够反映不同二维频谱图之间的相似性。这有助于将具有相似特征的频谱图聚类在一起,从而形成更为准确的设备运行状态分类。
kNN算法作为一种非参、惰性的算法,不需要对数据做任何假设或进行模型训练。这有助于减少模型的复杂性和训练时间,使得运行状态分类方法更加轻量级和高效。kNN算法基于距离度量,通过选择距离最近的k个样本进行分类。这使得预测结果能够充分利用与待识别频谱图最相似的近邻样本的信息,从而提高了分类的可靠性和准确性。由于kNN算法无需进行模型训练,因此无需预训练数据集和模型参数调优。这使得方法的实施更加简化,同时在实际应用中也能够更快地响应新的设备运行状态。
在本实施例中,k值取5即可实现较优的效果,但k值的选择可以根据实际情况进行调整。这使得方法在不同情境下都具备适应性,能够灵活应用于不同类型的工业设备运行状态识别。
请参阅图2,本发明第二实施例提供了一种工业设备运行状态的识别装置 ,包括:
音频信号生成单201,用于获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号;
特征度量计算单元202,用于基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量;
分类结果生成单元203,用于根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的分类结果,其中,所述分类结果用于确定工业设备的当前运行状态。
优选地,所述特征度量计算单元,具体用于:
将每一段所述二维频谱图与样本集的每一样本在时间维度拼接,以生成拼接频谱图;
调用图像压缩算法分别计算每一段所述二维频谱图、样本集的每一样本、以及拼接频谱图的归一化压缩长度;
根据归一化压缩长度建立每一段所述二维频谱图与样本集的每一样本之间的特征度量。
优选地,所述特征度量的表达式为:
其中,为拼接频谱图的归一化压缩长度,/>为二维频谱图的归一化压缩长度,/>为样本集样本的归一化压缩长度,/>为样本集样本,/>二维频谱图,/>为拼接频谱图,/>为二维频谱图与样本集样本之间的特征度量。
优选地,所述梅尔频谱的参数为:跳跃长度为320,窗口长度为1024,窗口类型为汉宁窗,梅尔滤波器个数为48。
本发明第三实施例提供了一种工业设备的运行状态的识别设备,其特征在于,包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如上任意一项所述的一种工业设备运行状态的识别方法。
本发明第四实施例提供了一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被所述计算机可读存储介质所在设备的处理器执行,以实现如上任意一项所述的一种工业设备运行状态的识别方法。
基于本发明提供的一种工业设备运行状态的识别方法、装置、设备及存储介质,可以先通过获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号,接着,基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量;最后,根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的运行状态分类结果。其无需训练、参数和GPU资源,即可实现良好的效果,为进一步的自动化运行监测提供了有力支持。
示例性地,本发明第三实施例和第四实施例中所述的计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述实现一种工业设备的运行状态的识别设备中的执行过程。例如,本发明第二实施例中所述的装置。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种工业设备运行状态的识别方法的控制中心,利用各种接口和线路连接整个所述实现对一种工业设备运行状态的识别方法的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现一种工业设备运行状态的识别方法的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(SecureDigital, SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述实现的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (6)
1.一种工业设备运行状态的识别方法,其特征在于,包括:
获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号;
基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量,具体为:将每一段所述二维频谱图与样本集的每一样本在时间维度拼接,以生成拼接频谱图;调用图像压缩算法分别计算每一段所述二维频谱图、样本集的每一样本、以及拼接频谱图的归一化压缩长度;根据归一化压缩长度建立每一段所述二维频谱图与样本集的每一样本之间的特征度量,其中,所述特征度量的表达式为:
其中,为拼接频谱图的归一化压缩长度,/>为二维频谱图的归一化压缩长度,/>为样本集样本的归一化压缩长度,/>为样本集样本,/>为二维频谱图,/>为拼接频谱图,/>为二维频谱图与样本集样本之间的特征度量;
根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的分类结果,其中,所述分类结果用于确定工业设备的当前运行状态。
2.根据权利要求1所述的一种工业设备运行状态的识别方法,其特征在于,所述梅尔频谱的参数为:跳跃长度为320,窗口长度为1024,窗口类型为汉宁窗,梅尔滤波器个数为48。
3.一种工业设备运行状态的识别装置,其特征在于,包括:
音频信号生成单元,用于获取由声音采集器采集到的工业设备运行音频,并对所述工业设备运行音频进行逐秒分割,以生成多段音频信号;
特征度量计算单元,用于基于梅尔频谱分析法将多段所述音频信号转换为多段二维频谱图,计算每一段所述二维频谱图与样本集的每一样本之间的特征度量,具体用于:将每一段所述二维频谱图与样本集的每一样本在时间维度拼接,以生成拼接频谱图;调用图像压缩算法分别计算每一段所述二维频谱图、样本集的每一样本、以及拼接频谱图的归一化压缩长度;根据归一化压缩长度建立每一段所述二维频谱图与样本集的每一样本之间的特征度量,其中,所述特征度量的表达式为:
其中, 为拼接频谱图的归一化压缩长度,/>为二维频谱图的归一化压缩长度,/>为样本集样本的归一化压缩长度,/>为样本集样本,/>为二维频谱图,/>为拼接频谱图,/>为二维频谱图与样本集样本之间的特征度量;
分类结果生成单元,用于根据所述特征度量建立距离矩阵,调用KNN算法对所述距离矩阵进行运算,以生成每一段二维频谱图的分类结果,其中,所述分类结果用于确定工业设备的当前运行状态。
4.根据权利要求3所述的一种工业设备运行状态的识别装置,其特征在于,所述梅尔频谱的参数为:跳跃长度为320,窗口长度为1024,窗口类型为汉宁窗,梅尔滤波器个数为48。
5.一种工业设备运行状态的识别设备,其特征在于,包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如权利要求1至2任意一项所述的一种工业设备运行状态的识别方法。
6.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被所述计算机可读存储介质所在设备的处理器执行,以实现如权利要求1至2任意一项所述的一种工业设备运行状态的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311132923.8A CN116863957B (zh) | 2023-09-05 | 2023-09-05 | 工业设备运行状态的识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311132923.8A CN116863957B (zh) | 2023-09-05 | 2023-09-05 | 工业设备运行状态的识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116863957A CN116863957A (zh) | 2023-10-10 |
CN116863957B true CN116863957B (zh) | 2023-12-12 |
Family
ID=88225358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311132923.8A Active CN116863957B (zh) | 2023-09-05 | 2023-09-05 | 工业设备运行状态的识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116863957B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111754988A (zh) * | 2020-06-23 | 2020-10-09 | 南京工程学院 | 基于注意力机制和双路径深度残差网络的声场景分类方法 |
CN112489690A (zh) * | 2020-12-23 | 2021-03-12 | 沈阳新松机器人自动化股份有限公司 | 语音情绪识别方法及系统 |
CN112992190A (zh) * | 2021-02-02 | 2021-06-18 | 北京字跳网络技术有限公司 | 音频信号的处理方法、装置、电子设备和存储介质 |
CN113470695A (zh) * | 2021-06-30 | 2021-10-01 | 平安科技(深圳)有限公司 | 声音异常检测方法、装置、计算机设备及存储介质 |
CN115713945A (zh) * | 2022-11-10 | 2023-02-24 | 杭州爱华仪器有限公司 | 一种音频数据处理方法和预测方法 |
CN116030800A (zh) * | 2023-03-30 | 2023-04-28 | 南昌航天广信科技有限责任公司 | 一种音频分类识别方法、系统、计算机及可读存储介质 |
CN116502174A (zh) * | 2023-02-13 | 2023-07-28 | 珠海高凌信息科技股份有限公司 | 一种基于多模态深度学习的环境识别方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11715487B2 (en) * | 2021-03-31 | 2023-08-01 | Accenture Global Solutions Limited | Utilizing machine learning models to provide cognitive speaker fractionalization with empathy recognition |
-
2023
- 2023-09-05 CN CN202311132923.8A patent/CN116863957B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111754988A (zh) * | 2020-06-23 | 2020-10-09 | 南京工程学院 | 基于注意力机制和双路径深度残差网络的声场景分类方法 |
CN112489690A (zh) * | 2020-12-23 | 2021-03-12 | 沈阳新松机器人自动化股份有限公司 | 语音情绪识别方法及系统 |
CN112992190A (zh) * | 2021-02-02 | 2021-06-18 | 北京字跳网络技术有限公司 | 音频信号的处理方法、装置、电子设备和存储介质 |
CN113470695A (zh) * | 2021-06-30 | 2021-10-01 | 平安科技(深圳)有限公司 | 声音异常检测方法、装置、计算机设备及存储介质 |
CN115713945A (zh) * | 2022-11-10 | 2023-02-24 | 杭州爱华仪器有限公司 | 一种音频数据处理方法和预测方法 |
CN116502174A (zh) * | 2023-02-13 | 2023-07-28 | 珠海高凌信息科技股份有限公司 | 一种基于多模态深度学习的环境识别方法及装置 |
CN116030800A (zh) * | 2023-03-30 | 2023-04-28 | 南昌航天广信科技有限责任公司 | 一种音频分类识别方法、系统、计算机及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
基于Stacking分类融合的海洋哺乳动物声学识别研究;赵彪 等;《杭州电子科技大学学报》;第43卷(第4期);7-13 * |
Also Published As
Publication number | Publication date |
---|---|
CN116863957A (zh) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11355138B2 (en) | Audio scene recognition using time series analysis | |
CN110672323B (zh) | 一种基于神经网络的轴承健康状态评估方法及装置 | |
CN110797031A (zh) | 语音变音检测方法、系统、移动终端及存储介质 | |
CN111868823A (zh) | 一种声源分离方法、装置及设备 | |
CN113077821A (zh) | 音频质量检测方法、装置、电子设备及存储介质 | |
CN114764774A (zh) | 瑕疵检测方法、装置、电子设备及计算机可读存储介质 | |
CN116705059B (zh) | 一种音频半监督自动聚类方法、装置、设备及介质 | |
CN111024147A (zh) | 基于CNNs的元件安装检测方法、装置、电子设备及存储介质 | |
WO2024099359A1 (zh) | 语音检测的方法和装置、电子设备和存储介质 | |
CN114067829A (zh) | 一种电抗器故障诊断方法、装置、计算机设备及存储介质 | |
CN116863957B (zh) | 工业设备运行状态的识别方法、装置、设备及存储介质 | |
CN116886225A (zh) | 应急广播终端工作状态的判定方法、装置、设备和介质 | |
CN116386669A (zh) | 基于分组自动编码器的机器运行声学状态监测方法和系统 | |
CN114863943B (zh) | 一种基于波束成形的环境噪声源自适应定位方法及装置 | |
CN115295016A (zh) | 一种设备运行状态监控方法、装置、设备及存储介质 | |
CN114510965A (zh) | 一种异常声音检测方法、装置、设备及介质 | |
CN113723521A (zh) | 一种电机异响识别方法和识别系统 | |
US20220277761A1 (en) | Impression estimation apparatus, learning apparatus, methods and programs for the same | |
CN112860527A (zh) | 应用服务器的故障监测方法及装置 | |
CN112735436A (zh) | 声纹识别方法及声纹识别系统 | |
CN111782860A (zh) | 一种音频检测方法及装置、存储介质 | |
CN111310697A (zh) | 设备运转周期检测及健康度分析方法、装置及存储介质 | |
CN116665138B (zh) | 一种汽车配件冲压加工视觉检测方法及系统 | |
CN113192529B (zh) | 音源数据修复方法、装置、终端及存储介质 | |
CN108417221B (zh) | 基于信号二维重组融合滤波的数字对讲机声码类型检测法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |