CN111599377B - 基于音频识别的设备状态检测方法、系统及移动终端 - Google Patents

基于音频识别的设备状态检测方法、系统及移动终端 Download PDF

Info

Publication number
CN111599377B
CN111599377B CN202010257510.2A CN202010257510A CN111599377B CN 111599377 B CN111599377 B CN 111599377B CN 202010257510 A CN202010257510 A CN 202010257510A CN 111599377 B CN111599377 B CN 111599377B
Authority
CN
China
Prior art keywords
audio
target
current
spectrogram
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010257510.2A
Other languages
English (en)
Other versions
CN111599377A (zh
Inventor
肖龙源
李稀敏
刘晓葳
谭玉坤
叶志坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Kuaishangtong Technology Co Ltd
Original Assignee
Xiamen Kuaishangtong Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Kuaishangtong Technology Co Ltd filed Critical Xiamen Kuaishangtong Technology Co Ltd
Priority to CN202010257510.2A priority Critical patent/CN111599377B/zh
Publication of CN111599377A publication Critical patent/CN111599377A/zh
Application granted granted Critical
Publication of CN111599377B publication Critical patent/CN111599377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供了一种基于音频识别的设备状态检测方法、系统及移动终端,该方法包括:对目标设备进行音频采集,得到当前音频,获取目标设备中每个发声源的运行状态;根据运行状态查询对应发声源的标准音频,将查询到的标准音频进行音频叠加,得到目标音频;分别对当前音频和目标音频进行特征提取,得到当前语谱图和目标语谱图,将当前语谱图和目标语谱图进行相似度比对,得到相似度比对值;若是,判定目标设备当前运行正常;若否,针对目标设备发出报警提示。本发明将当前音频和目标音频进行比对分析的设计,以采用音频识别的方式对目标设备进行状态检测,以判定目标设备的当前运行状态是否出现故障,提高了设备状态检测的检测效率。

Description

基于音频识别的设备状态检测方法、系统及移动终端
技术领域
本发明属于设备检测技术领域,尤其涉及一种基于音频识别的设备状态检测方法、系统及移动终端。
背景技术
随着生活水平的提高,越来越多的设备开始走进人们的生活,例如:交通设备、生产设备、家用设备等。现在大多数的设备在后期的运维非常重要,因为这决定着设备的使用寿命,设备在其运行的过程中,需要实时获取其运行参数、了解其运行状况,以便于及时阻止其出现异常情况,因此,为保障设备的使用寿命和对设备的日常维护,针对设备的检测方法越来越受人们所重视。
现有的设备检测过程中,均是通过采用人工检测的方式进行设备各个参数的查看,并基于参数查看结果以达到对设备运行状态检测的效果,但由于采用传人工检测的方式使得检测效率低下,且人力成本较高。
发明内容
本发明实施例的目的在于提供一种基于音频识别的设备状态检测方法、系统及移动终端,旨在解决现有的设备检测过程中,由于采用人工检测所导致的检测效率低下的问题。
本发明实施例是这样实现的,一种基于音频识别的设备状态检测方法,所述方法包括:
对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态;
根据所述运行状态查询对应所述发声源的标准音频,并将查询到的所述标准音频进行音频叠加,得到目标音频;
分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图,并将所述当前语谱图和所述目标语谱图进行相似度比对,得到相似度比对值;
若所述相似度比对值大于或等于相似度阈值,则判定所述目标设备当前运行正常;
若所述相似度比对值未大于所述相似度阈值,则针对所述目标设备发出报警提示。
更进一步的,所述根据所述运行状态查询对应所述发声源的标准音频的步骤包括:
获取所述运行状态中所述发声源的运行参数,并获取所述运行参数的参数值,所述运行参数为电压参数、电流参数或输出功率参数;
将所述参数值与本地预存储的音频数据库进行匹配,以得到所述标准音频。
更进一步的,所述对目标设备进行音频采集的步骤之前,所述方法还包括:
根据本地预存储的状态运行指令,依序控制所述发声源进行工作,并对所述发声源工作时产生的音频数据进行采集,得到音频样本;
根据所述音频样本进行深度学习,得到所述音频数据库。
更进一步的,所述将所述当前语谱图和所述目标语谱图进行相似度比对的步骤包括:
将所述当前语谱图和所述目标语谱图中的音素频率进行相似度比对,得到第一比对值;
将所述当前语谱图和所述目标语谱图中的共振峰数量进行相似度比对,得到第二比对值;
将所述当前语谱图和所述目标语谱图中的共振峰走势进行相似度比对,得到第三比对值;
计算所述第一比对值、所述第二比对值和所述第三比对值之间的和,得到所述相似度比对值。
更进一步的,所述若所述相似度比对值未大于所述相似度阈值的步骤之后,所述方法还包括:
根据所述标准音频对所述当前音频进行音频分离,得到多个分离音频;
分别提取所述分离音频和对应所述标准音频中的FBank特征,得到分离特征和标准特征;
计算所述分离特征和所述标准特征之间的特征差,并当判断到所述特征差满足提示条件时,针对所述分离音频对应的所述发声源进行提示报警。
更进一步的,所述根据所述标准音频对所述当前音频进行音频分离的步骤包括:
在所有所述标准音频中选定一个音频设置为样本音频;
根据除去所述样本音频后的所有所述标准音频对所述当前音频进行音频过滤,得到所述分离音频。
更进一步的,所述分别对所述当前音频和所述目标音频进行特征提取的步骤之前,所述方法还包括:
获取所述目标设备的运行环境和环境温度;
根据所述运行环境和所述环境温度查询噪声音频,并根据所述噪声音频对所述当前音频进行去噪处理。
本发明实施例的另一目的在于提供一种设备状态检测系统,所述系统包括:
音频采集模块,用于对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态;
音频叠加模块,用于根据所述运行状态查询对应所述发声源的标准音频,并将查询到的所述标准音频进行音频叠加,得到目标音频;
特征比对模块,用于分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图,并将所述当前语谱图和所述目标语谱图进行相似度比对,得到相似度比对值;
检测判断模块,用于若所述相似度比对值大于或等于相似度阈值,则判定所述目标设备当前运行正常;若所述相似度比对值未大于所述相似度阈值,则针对所述目标设备发出报警提示。
更进一步的,所述音频叠加模块还用于:
获取所述运行状态中所述发声源的运行参数,并获取所述运行参数的参数值,所述运行参数为电压参数、电流参数或输出功率参数;
将所述参数值与本地预存储的音频数据库进行匹配,以得到所述标准音频。
本发明实施例的另一目的在于提供一种移动终端,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端执行上述的基于音频识别的设备状态检测方法。
本发明实施例,通过对目标设备进行音频采集和对目标音频进行比对分析的设计,以采用音频识别的方式对目标设备进行状态检测,以判定目标设备的当前运行状态是否出现故障,进而提高了设备状态检测的检测效率,降低了人力成本。
附图说明
图1是本发明第一实施例提供的基于音频识别的设备状态检测方法的流程图;
图2是本发明第二实施例提供的基于音频识别的设备状态检测方法的流程图;
图3是本发明第三实施例提供的基于音频识别的设备状态检测方法的流程图;
图4是本发明第四实施例提供的设备状态检测系统的结构示意图;
图5是本发明第五实施例提供的移动终端的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一
请参阅图1,是本发明第一实施例提供的基于音频识别的设备状态检测方法的流程图,包括步骤:
步骤S10,对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态;
其中,该目标设备可以为任意电子设备,例如机器人、电压器、舵机,该电子设备中至少设有一个发声源,该发声源为处于工作状态下会发出声音的装置,该发声源可以为舵机、变压器或发电机等装置;
优选的,本实施例中,可以采用拾音器的方式进行该目标设备的音频采集,该拾音器可以设置在该目标设备的外壁上,用于当接收到采集信号时,根据预先设置的采集时间对该目标设备进行音频采集,并将采集到的音频发送至本地进行存储,以得到该当前音频;
具体的,本实施例中,可以通过获取各个发声源的档位信息或输出功率等参数以进行该运行状态的获取;
步骤S20,根据所述运行状态查询对应所述发声源的标准音频,并将查询到的所述标准音频进行音频叠加,得到目标音频;
其中,本地存储有音频数据库,该音频数据库中存储有不同发声源对应的运行状态与标准音频之间的对应关系,该标准音频为发声源在对应正常的运行状态下发出的音频;
优选的,该步骤中,通过将查询到的所述标准音频进行音频叠加的设计,以获取到正常状态下,该目标设备中的发声源处于对应运行状态下所发出的音频,进而保障了与当前音频的音频比对;
此外,本实施例中,通过基于相同时间点的方式以进行该标准音频之间的音频叠加,进而提高了该目标音频的准确性,提高了对该目标设备状态检测的准确性;
步骤S30,分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图;
其中,通过提取该当前语谱图和目标语谱图的设计,有效的提高了后续相似度比对的准确性;
步骤S40,将所述当前语谱图和所述目标语谱图进行相似度比对,得到相似度比对值;
其中,通过分别获取该当前语谱图和目标语谱图中的声纹特征,并基于该声纹特征的获取以进行语谱图之间的相似度比对,进而提高了当前语谱图与标语谱图之间相似度比对的准确性;
优选的,该声纹特征包括音素频率、共振峰数量、共振峰走势等特征中的至少一种,具体需由本领域技术人员根据实际情况作出相应的设定。上述将所述当前语谱图和所述目标语谱图进行相似度比对,即将所述当前语谱图和所述目标语谱图中的声纹信息进行相似度比对;
步骤S50,判断所述似度比对值是否大于或等于相似度阈值;
其中,该相似度阈值可以根据需求进行数值设置;
当判断所述相似度比对值大于或等于相似度阈值,则执行步骤S60;
步骤S60,判定所述目标设备当前运行正常;
其中,当判断所述相似度比对值大于或等于相似度阈值时,则判定该目标设备的运行状态处于正常状态;
当判断到所述相似度比对值未大于所述相似度阈值,则执行步骤S70;
步骤S70,针对所述目标设备发出报警提示;
其中,当判断到所述相似度比对值未大于所述相似度阈值时,则判定该目标设备所发出的音频不正常,即判定该目标设备处于故障状态,因此,通过采用发出报警提示的方式,以提示对应工作人员针对该目标设备进行查看、维修或更换,防止安全隐患的发生;
本实施例,通过对目标设备进行音频采集和对目标音频进行比对分析的设计,以采用音频识别的方式对目标设备进行状态检测,以判定目标设备的当前运行状态是否出现故障,进而提高了设备状态检测的检测效率,降低了人力成本。
实施例二
请参阅图2,是本发明第二实施例提供的基于音频识别的设备状态检测方法的流程图,包括步骤:
步骤S11,对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态;
优选的,本实施例中,所述对目标设备进行音频采集的步骤之前,所述方法还包括:
根据本地预存储的状态运行指令,依序控制所述发声源进行工作,并对所述发声源工作时产生的音频数据进行采集,得到音频样本;
根据所述音频样本进行深度学习,得到所述音频数据库,以使该音频数据库中存储有不同发声源对应的运行状态与标准音频之间的对应关系,该标准音频为发声源在对应正常的运行状态下发出的音频;
步骤S21,获取所述运行状态中所述发声源的运行参数,并获取所述运行参数的参数值;
其中,所述运行参数为电压参数、电流参数或输出功率参数;
步骤S31,将所述参数值与本地预存储的音频数据库进行匹配,以得到所述标准音频,并将查询到的所有所述标准音频进行音频叠加,得到目标音频;
其中,通过将查询到的所述标准音频进行音频叠加的设计,以获取到正常状态下,该目标设备中的发声源处于对应运行状态下所发出的音频,进而保障了与当前音频的音频比对;
此外,本实施例中,通过基于相同时间点的方式以进行该标准音频之间的音频叠加,进而提高了该目标音频的准确性,提高了对该目标设备状态检测的准确性;
步骤S41,分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图;
其中,通过提取该当前语谱图和目标语谱图的设计,有效的提高了后续相似度比对的准确性;
步骤S51,将所述当前语谱图和所述目标语谱图中的音素频率进行相似度比对,得到第一比对值;
其中,通过分别获取该当前语谱图和目标语谱图中的音素频率,以得到当前音素频率和目标音素频率,并通过计算该当前音素频率与目标音素频率之间的比值,以得到第一比对值;
步骤S61,将所述当前语谱图和所述目标语谱图中的共振峰数量进行相似度比对,得到第二比对值;
其中,通过分别获取该当前语谱图和目标语谱图中的共振峰数量,以得到当前数量值和目标数量值,并通过计算该当前数量值和目标数量值之间的比值,以得到第二比对值;
步骤S71,将所述当前语谱图和所述目标语谱图中的共振峰走势进行相似度比对,得到第三比对值;
其中,通过分别获取该当前语谱图和目标语谱图中的共振峰走势轨迹,以得到当前走势轨迹和目标走势轨迹,并通过计算该当前走势轨迹和目标走势轨迹之间的坡度相似度,以得到第三比对值;
步骤S81,计算所述第一比对值、所述第二比对值和所述第三比对值之间的和,得到所述相似度比对值;
步骤S91,判断所述似度比对值是否大于或等于相似度阈值;
当判断所述相似度比对值大于或等于相似度阈值,则执行步骤S101;
步骤S101,判定所述目标设备当前运行正常;
当判断到所述相似度比对值未大于所述相似度阈值,则执行步骤S111;
步骤S111,针对所述目标设备发出报警提示;
其中,该报警提示可以采用语音提示、灯光提示、短信提示或基于预设通信地址的方式进行报警,以达到及时提醒工作人员针对该目标设备进行查看或维修的效果;
本实施例,通过对目标设备进行音频采集和对目标音频进行比对分析的设计,以采用音频识别的方式对目标设备进行状态检测,以判定目标设备的当前运行状态是否出现故障,进而提高了设备状态检测的检测效率,降低了人力成本。
实施例三
请参阅图3,是本发明第三实施例提供的基于音频识别的设备状态检测方法的流程图,包括步骤:
步骤S12,对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态;
步骤S22,根据所述运行状态查询对应所述发声源的标准音频,并将查询到的所述标准音频进行音频叠加,得到目标音频;
步骤S32,获取所述目标设备的运行环境和环境温度,并根据所述运行环境和所述环境温度查询噪声音频;
其中,可以通过摄像头对该运行环境进行拍摄,以得到环境图像,并基于该环境图像和环境温度进行该噪声音频的查询;
具体的,本地预存储有噪声数据库,该噪声数据库中存储有不同环境图像和环境温度于对应噪声音频之间的对应关系;
步骤S42,根据所述噪声音频对所述当前音频进行去噪处理,并分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图;
其中,通过根据所述噪声音频对所述当前音频进行去噪处理的设计,有效的降低了环境噪声对当前音频的干扰,提高了对该目标设备状态检测的准确性,且通过基于该环境温度的获取,降低了温度音素对音频采集的干扰,进一步提高了对该目标设备状态检测的准确性;
步骤S52,将所述当前语谱图和所述目标语谱图进行相似度比对,得到相似度比对值;
步骤S62,判断所述似度比对值是否大于或等于相似度阈值;
当判断到所述相似度比对值未大于所述相似度阈值,则执行步骤S72;
步骤S72,根据所述标准音频对所述当前音频进行音频分离,得到多个分离音频;
其中,通过对该当前音频进行音频分离的设计,有效的方便了后续针对每个分离音频是否处于正常状态的判断,当判断到该分离音频处于不正常状态时,则判定该分离音频对应的运行状态的发声源处于故障状态;
具体的,该步骤中,所述根据所述标准音频对所述当前音频进行音频分离的步骤包括:
在所有所述标准音频中选定一个音频设置为样本音频;
根据除去所述样本音频后的所有所述标准音频对所述当前音频进行音频过滤,得到所述分离音频。
步骤S82,分别提取所述分离音频和对应所述标准音频中的FBank特征,得到分离特征和标准特征;
其中,通过提取所述分离音频和对应所述标准音频中的FBank特征的设计,以使基于该FBank特征判断该分离音频是否正常;
步骤S92,计算所述分离特征和所述标准特征之间的特征差,并当判断到所述特征差满足提示条件时,针对所述分离音频对应的所述发声源进行提示报警;
其中,该提示条件中的条件参数可以根据需求进行设置,例如该条件参数可以为判断该特征差是否小于特征阈值差,或判断该特征差是否小于预设差值范围内;
具体的,该步骤中,当判断到所述特征差满足提示条件,则判定该分离音频对应运行状态的发声源处于故障状态,因此,通过针对该发声源进行提示报警,有效的方便了工作人员能针对性的进行维修或更换,提高了对设备状态检测的准确性;
本实施例中,通过对目标设备进行音频采集和对目标音频进行比对分析的设计,以采用音频识别的方式对目标设备进行状态检测,以判定目标设备的当前运行状态是否出现故障,进而提高了设备状态检测的检测效率,降低了人力成本。
实施例四
请参阅图4,是本发明第四实施例提供的设备状态检测系统100的结构示意图,包括:音频采集模块10、音频叠加模块11、特征比对模块12和检测判断模块13,其中:
音频采集模块10,用于对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态。
音频叠加模块11,用于根据所述运行状态查询对应所述发声源的标准音频,并将查询到的所述标准音频进行音频叠加,得到目标音频。
其中,所述音频叠加模块11还用于:获取所述运行状态中所述发声源的运行参数,并获取所述运行参数的参数值,所述运行参数为电压参数、电流参数或输出功率参数;
将所述参数值与本地预存储的音频数据库进行匹配,以得到所述标准音频。
特征比对模块12,用于分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图,并将所述当前语谱图和所述目标语谱图进行相似度比对,得到相似度比对值。
其中,所述特征比对模块12还用于:将所述当前语谱图和所述目标语谱图中的音素频率进行相似度比对,得到第一比对值;
将所述当前语谱图和所述目标语谱图中的共振峰数量进行相似度比对,得到第二比对值;
将所述当前语谱图和所述目标语谱图中的共振峰走势进行相似度比对,得到第三比对值;
计算所述第一比对值、所述第二比对值和所述第三比对值之间的和,得到所述相似度比对值。
检测判断模块13,用于若所述相似度比对值大于或等于相似度阈值,则判定所述目标设备当前运行正常;若所述相似度比对值未大于所述相似度阈值,则针对所述目标设备发出报警提示。
其中,所述检测判断模块13还用于:根据所述标准音频对所述当前音频进行音频分离,得到多个分离音频;
分别提取所述分离音频和对应所述标准音频中的FBank特征,得到分离特征和标准特征;
计算所述分离特征和所述标准特征之间的特征差,并当判断到所述特征差满足提示条件时,针对所述分离音频对应的所述发声源进行提示报警。
优选的,所述检测判断模块13还用于:在所有所述标准音频中选定一个音频设置为样本音频;
根据除去所述样本音频后的所有所述标准音频对所述当前音频进行音频过滤,得到所述分离音频。
此外,所述设备状态检测系统100还包括:
数据库存储模块14,用于根据本地预存储的状态运行指令,依序控制所述发声源进行工作,并对所述发声源工作时产生的音频数据进行采集,得到音频样本;根据所述音频样本进行深度学习,得到所述音频数据库。
音频去噪模块15,用于获取所述目标设备的运行环境和环境温度;
根据所述运行环境和所述环境温度查询噪声音频,并根据所述噪声音频对所述当前音频进行去噪处理。
本实施例,通过对目标设备进行音频采集和对目标音频进行比对分析的设计,以采用音频识别的方式对目标设备进行状态检测,以判定目标设备的当前运行状态是否出现故障,进而提高了设备状态检测的检测效率,降低了人力成本。
实施例五
请参阅图5,是本发明第四实施例提供的移动终端101,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端101执行上述的基于音频识别的设备状态检测方法。
本实施例还提供了一种存储介质,其上存储有上述移动终端101中所使用的计算机程序,该程序在执行时,包括如下步骤:
对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态;
根据所述运行状态查询对应所述发声源的标准音频,并将查询到的所述标准音频进行音频叠加,得到目标音频;
分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图,并将所述当前语谱图和所述目标语谱图进行相似度比对,得到相似度比对值;
若所述相似度比对值大于或等于相似度阈值,则判定所述目标设备当前运行正常;
若所述相似度比对值未大于所述相似度阈值,则针对所述目标设备发出报警提示。所述的存储介质,如:ROM/RAM、磁碟、光盘等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元或模块完成,即将存储装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施方式中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。
本领域技术人员可以理解,图4中示出的组成结构并不构成对本发明的设备状态检测系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,而图1-3中的基于音频识别的设备状态检测方法亦采用图4中所示的更多或更少的部件,或者组合某些部件,或者不同的部件布置来实现。本发明所称的单元、模块等是指一种能够被所述目标设备状态检测系统中的处理器(图未示)所执行并功能够完成特定功能的一系列计算机程序,其均可存储于所述目标设备状态检测系统的存储设备(图未示)内。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于音频识别的设备状态检测方法,其特征在于,所述方法包括:
对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态;
根据所述运行状态查询对应所述发声源的标准音频,并将查询到的所述标准音频进行音频叠加,得到目标音频;
获取所述目标设备的运行环境和环境温度,根据所述运行环境和所述环境温度查询噪声音频,并根据所述噪声音频对所述当前音频进行去噪处理;
分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图,并将所述当前语谱图和所述目标语谱图进行相似度比对,得到相似度比对值;
若所述相似度比对值大于或等于相似度阈值,则判定所述目标设备当前运行正常;
若所述相似度比对值未大于所述相似度阈值,则针对所述目标设备发出报警提示。
2.如权利要求1所述的基于音频识别的设备状态检测方法,其特征在于,所述根据所述运行状态查询对应所述发声源的标准音频的步骤包括:
获取所述运行状态中所述发声源的运行参数,并获取所述运行参数的参数值,所述运行参数为电压参数、电流参数或输出功率参数;
将所述参数值与本地预存储的音频数据库进行匹配,以得到所述标准音频。
3.如权利要求2所述的基于音频识别的设备状态检测方法,其特征在于,所述对目标设备进行音频采集的步骤之前,所述方法还包括:
根据本地预存储的状态运行指令,依序控制所述发声源进行工作,并对所述发声源工作时产生的音频数据进行采集,得到音频样本;
根据所述音频样本进行深度学习,得到所述音频数据库。
4.如权利要求1所述的基于音频识别的设备状态检测方法,其特征在于,所述将所述当前语谱图和所述目标语谱图进行相似度比对的步骤包括:
将所述当前语谱图和所述目标语谱图中的音素频率进行相似度比对,得到第一比对值;
将所述当前语谱图和所述目标语谱图中的共振峰数量进行相似度比对,得到第二比对值;
将所述当前语谱图和所述目标语谱图中的共振峰走势进行相似度比对,得到第三比对值;
计算所述第一比对值、所述第二比对值和所述第三比对值之间的和,得到所述相似度比对值。
5.如权利要求1所述的基于音频识别的设备状态检测方法,其特征在于,所述若所述相似度比对值未大于所述相似度阈值的步骤之后,所述方法还包括:
根据所述标准音频对所述当前音频进行音频分离,得到多个分离音频;
分别提取所述分离音频和对应所述标准音频中的FBank特征,得到分离特征和标准特征;
计算所述分离特征和所述标准特征之间的特征差,并当判断到所述特征差满足提示条件时,针对所述分离音频对应的所述发声源进行提示报警。
6.如权利要求5所述的基于音频识别的设备状态检测方法,其特征在于,所述根据所述标准音频对所述当前音频进行音频分离的步骤包括:
在所有所述标准音频中选定一个音频设置为样本音频;
根据除去所述样本音频后的所有所述标准音频对所述当前音频进行音频过滤,得到所述分离音频。
7.一种设备状态检测系统,其特征在于,所述系统包括:
音频采集模块,用于对目标设备进行音频采集,得到当前音频,并获取所述目标设备中每个发声源的运行状态;
音频叠加模块,用于根据所述运行状态查询对应所述发声源的标准音频,并将查询到的所述标准音频进行音频叠加,得到目标音频;
获取所述目标设备的运行环境和环境温度,根据所述运行环境和所述环境温度查询噪声音频,并根据所述噪声音频对所述当前音频进行去噪处理;
特征比对模块,用于分别对所述当前音频和所述目标音频进行特征提取,得到当前语谱图和目标语谱图,并将所述当前语谱图和所述目标语谱图进行相似度比对,得到相似度比对值;
检测判断模块,用于若所述相似度比对值大于或等于相似度阈值,则判定所述目标设备当前运行正常;若所述相似度比对值未大于所述相似度阈值,则针对所述目标设备发出报警提示。
8.如权利要求7所述的设备状态检测系统,其特征在于,所述音频叠加模块还用于:
获取所述运行状态中所述发声源的运行参数,并获取所述运行参数的参数值,所述运行参数为电压参数、电流参数或输出功率参数;
将所述参数值与本地预存储的音频数据库进行匹配,以得到所述标准音频。
9.一种移动终端,其特征在于,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端执行根据权利要求1至6任一项所述的基于音频识别的设备状态检测方法。
CN202010257510.2A 2020-04-03 2020-04-03 基于音频识别的设备状态检测方法、系统及移动终端 Active CN111599377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010257510.2A CN111599377B (zh) 2020-04-03 2020-04-03 基于音频识别的设备状态检测方法、系统及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010257510.2A CN111599377B (zh) 2020-04-03 2020-04-03 基于音频识别的设备状态检测方法、系统及移动终端

Publications (2)

Publication Number Publication Date
CN111599377A CN111599377A (zh) 2020-08-28
CN111599377B true CN111599377B (zh) 2023-03-31

Family

ID=72191996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010257510.2A Active CN111599377B (zh) 2020-04-03 2020-04-03 基于音频识别的设备状态检测方法、系统及移动终端

Country Status (1)

Country Link
CN (1) CN111599377B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114822589B (zh) * 2022-04-02 2023-07-04 中科猷声(苏州)科技有限公司 室内声学参数测定方法、模型构建方法、装置及电子设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002323899A (ja) * 2001-04-25 2002-11-08 Ricoh Co Ltd 音声認識装置、プログラムおよび記録媒体
FR2833103B1 (fr) * 2001-12-05 2004-07-09 France Telecom Systeme de detection de parole dans le bruit
CN103901298A (zh) * 2014-03-13 2014-07-02 广东电网公司电力科学研究院 变电站设备运行状态的检测方法与系统
CN104167207B (zh) * 2014-06-20 2017-12-12 国家电网公司 一种基于变电站巡检机器人的设备声音识别方法
CN106683333B (zh) * 2017-01-18 2020-03-17 东软集团股份有限公司 设备安全检测方法及装置
CN110299142B (zh) * 2018-05-14 2021-11-19 桂林远望智能通信科技有限公司 一种基于网络融合的声纹识别方法及装置
CN108831485B (zh) * 2018-06-11 2021-04-23 东北师范大学 基于语谱图统计特征的说话人识别方法
CN110858072B (zh) * 2018-08-24 2023-05-09 阿里巴巴集团控股有限公司 设备运行状态的确定方法及装置
CN109448733A (zh) * 2019-01-07 2019-03-08 广州势必可赢网络科技有限公司 一种语谱图生成方法、系统及相关装置
CN110534118B (zh) * 2019-07-29 2021-10-08 安徽继远软件有限公司 基于声纹识别和神经网络的变压器/电抗器故障诊断方法
CN110634490B (zh) * 2019-10-17 2022-03-11 广州国音智能科技有限公司 一种声纹鉴定方法、装置和设备
CN110930986B (zh) * 2019-12-06 2022-05-17 北京明略软件系统有限公司 语音处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111599377A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN107293309B (zh) 一种基于客户情绪分析提升舆情监控效率的方法
CN110208022A (zh) 基于机器学习的电力设备多特征音频指纹故障诊断方法及系统
CN107958669B (zh) 一种声纹识别的方法及装置
CN111145510B (zh) 接警处理方法、装置及设备
CN113670434B (zh) 变电站设备声音异常识别方法、装置和计算机设备
CN113707173B (zh) 基于音频切分的语音分离方法、装置、设备及存储介质
CN111081223B (zh) 一种语音识别方法、装置、设备和存储介质
CN111599377B (zh) 基于音频识别的设备状态检测方法、系统及移动终端
US20200394600A1 (en) Fire protection inspection method, fire protection inspection device, and remote device
CN116778964A (zh) 一种基于声纹识别的变电设备故障监测系统及方法
CN115742954A (zh) 一种车辆故障提醒方法、装置、设备及存储介质
CN114151293B (zh) 风机变桨系统的故障预警方法、系统、设备及存储介质
JP2014048534A (ja) 話者認識装置、話者認識方法及び話者認識プログラム
US20230143027A1 (en) System for real-time recognition and identification of sound sources
CN111613223B (zh) 语音识别方法、系统、移动终端及存储介质
CN115828906B (zh) 一种基于nlp的网络异常言论分析监测方法
CN111370000A (zh) 声纹识别算法评估方法、系统、移动终端及存储介质
CN113241063B (zh) 语音识别系统中的算法参数更新方法、装置、终端及介质
CN113140212A (zh) 一种车辆安全监控方法、装置及安全监控设备
CN116434368A (zh) 一种多功能手持巡检仪及巡检方法
CN114839960A (zh) 一种基于人工智能算法进行车辆故障检测方法及系统
CN114510703A (zh) 一种物联网设备的身份标识认证方法及通信系统
CN114171057A (zh) 基于声纹的变压器事件检测方法及系统
CN111190922A (zh) 电力状态的检测方法、装置、设备及存储介质
CN112792849B (zh) 碰撞检测方法、机器人、移动终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant