CN111782861A - 一种杂音检测方法及装置、存储介质 - Google Patents
一种杂音检测方法及装置、存储介质 Download PDFInfo
- Publication number
- CN111782861A CN111782861A CN202010535924.7A CN202010535924A CN111782861A CN 111782861 A CN111782861 A CN 111782861A CN 202010535924 A CN202010535924 A CN 202010535924A CN 111782861 A CN111782861 A CN 111782861A
- Authority
- CN
- China
- Prior art keywords
- noise
- data
- segment
- detected
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 164
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 230000011218 segmentation Effects 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 28
- 230000015654 memory Effects 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 17
- 238000012360 testing method Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/65—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Quality & Reliability (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明实施例公开了一种杂音检测方法及装置、存储介质,包括:从待测设备接收待检测音频数据;对待检测音频数据进行分段处理,得到多个分段数据,并确定多个分段数据对应的多个分段特征;根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段和目标杂音数据段对应的目标杂音类型。
Description
技术领域
本发明涉及音频测试技术领域,尤其涉及一种杂音检测方法及装置、存储介质。
背景技术
音频设备主要是对音频输入输出设备的总称,音频设备包括多种产品,如功放机、播放器、录音器、话筒、声卡、耳机等等,在这些音频设备正式投入市场之前,通常需要对音频设备进行检测,如杂音检测。
在现有技术中,利用杂音检测装置比较发出去的音频测试波形和接收到的音频测试波形之间的相似度,从而确定出该音频设备发出的音频测试波形中是否存在杂音,使得杂音检测装置无法获取到该杂音对应的其他信息,降低了杂音检测装置检测杂音时的智能性。
发明内容
为解决上述技术问题,本发明实施例期望提供一种杂音检测方法及装置、存储介质,能够提高杂音检测装置检测杂音时的智能性。
本发明的技术方案是这样实现的:
本申请实施例提供一种杂音检测方法,所述方法包括:
从待测设备接收待检测音频数据;
对所述待检测音频数据进行分段处理,得到多个分段数据,并确定所述多个分段数据对应的多个分段特征;
根据样本杂音特征和杂音类型对应关系以及所述多个分段特征,从所述多个分段数据中确定目标杂音数据段和所述目标杂音数据段对应的目标杂音类型。
本申请实施例提供了一种杂音检测装置,所述装置包括:
接收单元,用于从待测设备接收待检测音频数据;
分段单元,用于对所述待检测音频数据进行分段处理,得到多个分段数据,并确定所述多个分段数据对应的多个分段特征;
确定单元,用于根据样本杂音特征和杂音类型对应关系以及所述多个分段特征,从所述多个分段数据中确定目标杂音数据段和所述目标杂音数据段对应的目标杂音类型。
本申请实施例提供一种杂音检测装置,所述装置包括:
存储器、处理器和通信总线,所述存储器通过所述通信总线与所述处理器进行通信,所述存储器存储所述处理器可执行的杂音检测的程序,当所述杂音检测程序被执行时,通过所述处理器执行上述所述的方法。
本申请实施例提供了一种存储介质,其上存储有计算机程序,应用于杂音检测装置,其特征在于,该计算机程序被处理器执行时实现上述所述的方法。
本发明实施例提供了一种杂音检测方法及装置、存储介质,包括:从待测设备接收待检测音频数据;对待检测音频数据进行分段处理,得到多个分段数据,并确定多个分段数据对应的多个分段特征;根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段和目标杂音数据段对应的目标杂音类型。采用上述方法实现方案,杂音检测装置通过对接收到的待检测音频数据进行分段,得到多个分段数据,杂音检测装置利用样本杂音特征和杂音类型对应关系以及多个分段特征,就可以从多个分段数据中确定出目标杂音数据段和目标杂音类型,使得杂音检测装置可以检测出待检测音频数据中目标杂音数据段以及该目标杂音数据段对应的目标杂音类型,提高了杂音检测装置检测杂音时的智能性。
附图说明
图1为本申请实施例提供的一种杂音检测方法流程图;
图2为本申请实施例提供的一种示例性的杂音检测装置获取待检测音频数据时的结构示意图一;
图3为本申请实施例提供的一种示例性的杂音检测装置获取待检测音频数据时的结构示意图二;
图4为本申请实施例提供的一种示例性的利用LPCC处理待检测音频数据时的框图;
图5为本申请实施例提供的一种示例性的利用MFCC处理多个分段数据时的框图;
图6为本申请实施例提供的一种示例性的杂音检测装置的结构示意图一;
图7为本申请实施例提供的一种示例性的杂音检测装置的结构示意图二;
图8为本申请实施例提供的一种杂音检测装置的组成结构示意图一;
图9为本申请实施例提供的一种杂音检测装置的组成结构示意图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
南京邮电大学发表了名称为“一种音频设备测试方法”的专利,该专利是通过音频测试设备比较发送出去的音频测试波形与接收到音频测试波形之间的相似度,利用数字化音频的测试模型得到该音频设备的音频测试结果,由于此方案在不同的测试需求下,需要操作人员可以配置与调整相关测试参数,如此,降低了音频设备测试发送出去的音频测试波形时的智能性。
对于现有技术中存在的问题,具体可通过以下实施例中的方法进行解决。
实施例一
本申请实施例提供了一种杂音检测方法,图1为本申请实施例提供的一种杂音检测方法流程图,如图1所示,杂音检测方法可以包括:
S101、从待测设备接收待检测音频数据。
本申请实施例提供的杂音检测方法适用于杂音检测装置对接收到的待检测音频数据进行杂音检测的场景下。
在本申请实施例中,待测设备可以为音频设备,如,该音频设备具体可以为功放机、播放器、录音器、话筒、声卡、耳机等等。
在本申请实施例中,待检测音频数据可以为待测设备对原始音频数据进行处理后,得到的音频数据。示例性的,杂音检测装置可以获取功放机对原始音频数据处理后的待检测音频数据;杂音检测装置也可以获取播放器对原始音频数据处理后的待检测音频数据;杂音检测装置还可以获取话筒对原始音频数据处理后的待检测音频数据等,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
需要说明的是,杂音检测装置可以在接收到杂音检测指令时,杂音检测装置就从待测设备中获取待检测音频数据,杂音检测装置也可以一直检测待检测音频数据,当杂音检测装置检测到待检测音频数据时,杂音检测装置就获取该待检测音频数据,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
需要说明的是,原始音频数据可以为待测设备接收到的没有杂音的音频数据,也可以为待测设备中存储的没有杂音的音频数据,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,杂音可以为白噪声对应的音频数据,还可以为卡顿对应的音频数据,还可以为其他的音频数据,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,待测设备对原始音频数据进行处理的方式可以为待测设备对原始音频数据进行降噪处理,也可以为待测设备对原始音频数据进行声信号放大处理,还可以为其他的处理方式,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,杂音检测装置还会从待测设备中接收待检测音频数据对应的第一时间,以在杂音检测装置根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段之后,杂音检测装置利用该第一时间确定目标杂音数据段在待检测音频数据中的定位信息。
在本申请实施例中,杂音检测装置可以在获取待检测音频数据时,就获取该第一时间,杂音检测装置也可以在获取待检测音频数据之后,再获取该第一时间,杂音检测装置还可以在对待检测音频数据进行分段处理,得到多个分段数据,并确定多个分段数据对应的多个分段特征之后,获取该第一时间,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
需要说明的是,第一时间为待测设备接收原始音频数据的起始时间,也可以为待测设备发送待检测音频数据的起始时间,或者第一时间可以为待测设备播放待检测音频数据的起始时间,第一时间也可以为杂音检测装置接收到待检测音频数据的起始时间,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
示例性的,如图2所示,将待测设备1和扬声器2设置于静音箱3中,利用扬声器播放原始音频数据,当待测设备接收到该原始音频数据时,待测设备就利用音频下行通路对该原始音频数据进行处理,从而得到了待检测音频数据,杂音检测装置4在待测设备处获取待检测音频数据和第一时间,其中,该第一时间具体为待测设备接收到该原始音频数据的时间。当杂音检测装置获取到待检测音频数据和第一时间后,杂音检测装置就对待检测音频数据进行分段处理,得到多个分段数据,并确定多个分段数据对应的多个分段特征,杂音检测装置得到多个分段特征之后,杂音检测装置就根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段和目标杂音数据段对应的目标杂音类型,根据第一时间,确定目标杂音数据段在待检测音频数据中的定位信息。
在本申请实施例中,扬声器可以为杂音检测装置中设置的扬声器,扬声器也可以不是杂音检测装置中设置的扬声器,即,该扬声器为外部设置的扬声器,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
示例性的,如图3所示,将待测设备1和录音麦5设置于静音箱3中,待测设备中存储有原始音频数据,当待测设备利用音频下行通路对该原始音频数据进行处理后,就得到了待检测音频数据,待测设备播放该待检测音频数据之后,杂音检测装置4就利用录音麦对该待检测音频数据进行录音,从而得到了待检测音频数据,杂音检测装置确定待检测音频数据的音频特征值并获取第一时间,具体的,该第一时间为音频设备播放原始音频数据的时间。当杂音检测装置获取到待检测音频数据和第一时间后,杂音检测装置就对待检测音频数据进行分段处理,得到多个分段数据,并确定多个分段数据对应的多个分段特征,杂音检测装置得到多个分段特征之后,杂音检测装置就根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段和目标杂音数据段对应的目标杂音类型,根据第一时间,确定目标杂音数据段在待检测音频数据中的定位信息。
在本申请实施例中,录音麦可以为杂音检测装置中设置的录音麦,录音麦也可以不是杂音检测装置中设置的录音麦,即,该录音麦为外部设置的录音麦,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
S102、待检测音频数据进行分段处理,得到多个分段数据,并确定多个分段数据对应的多个分段特征。
在本申请实施例中,当杂音检测装置从待测设备中接收到待检测音频数据之后,杂音检测装置就可以按照预设数据长度对待检测音频数据进行分段处理,得到多个分段数据,并确定多个分段数据对应的多个分段特征了。
在本申请实施例中,杂音检测装置可以按照预设数据长度对待检测音频数据进行分段处理,得到多个分段数据。
在本申请实施例中,杂音检测装置中包括预设数据长度,其中,预设数据长度可以为杂音检测装置中预设的数据长度,也可以为杂音检测装置根据接收到的数据指令,获取到的数据长度,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,杂音检测装置确定多个分段数据对应的多个分段特征的方式,可以为杂音检测装置将该多个分段数据输入线性预测倒普系数(Linear PredictiveCepstral Coefficients,LPCC)计算模型中,从而得到多个分段特征,也可以为杂音检测装置将该多个分段数据输入梅尔频率倒普系数(Mel Frequency Cepstrum Coefficient,MFCC)计算模型中,从而得到多个分段特征,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
示例性的,如图4所示,当杂音检测装置得到待检测音频数据之后,杂音检测装置就利用分段模块按照预设数据长度对该待检测音频数据进行分段处理,得到多个分段数据。当杂音检测装置得到多个分段数据之后,杂音检测装置可以将多个分段数据输入LPCC计算模型中,通过LPCC计算模型中的窗口化模块、自相关分析模块、线性预测编码(LinearPredictive Coding,LPC)分析模块和LPC参数转换模块对多个分段数据进行处理,杂音检测装置就得到了多个分段数据对应的多个分段特征。
在本申请实施例中,杂音检测装置可以通过计算第一分段特征值与样本杂音特征之间的余弦距离,来确定出第一分段特征值与样本杂音特征之间的相似度;杂音检测装置还可以通过计算第一分段特征值与样本杂音特征之间的欧式距离,来确定出第一分段特征值与样本杂音特征之间的相似度;杂音检测装置还可以通过计算第一分段特征值与样本杂音特征之间的其他距离,来确定出第一分段特征值与样本杂音特征之间的相似度;具体的可根据实际情况进行确定,本申请实施例对此不作限定。
需要说明的是,余弦距离越小,确定出第一分段特征值与样本杂音特征之间的相似度就越高;欧式距离越小,确定出第一分段特征值与样本杂音特征之间的相似度就越高。
示例性的,如公式(1)所示,杂音检测装置可以计算余弦距离,即通过公式(1)确定出多个分段数据中的每一个分段数据对应的每一个分段特征。
需要说明的是,xi为多个分段数据中任意一个分段数据,即第一分段数据对应的第一分段特征;yi为多个样本杂音数据中任一个样本杂音数据对应的样本杂音特征,ρ为第一分段特征与样本杂音特征之间的相似度,n为第一分段特征的特征向量维度。
示例性的,如图5所示,当杂音检测装置得到待检测音频数据进行分段之后,杂音检测装置就得到了多个分段数据,杂音检测装置可以将多个分段数据输入MFCC计算模型中,MFCC计算模型包括预加重模块、汉明窗、快速傅里叶变换(Fast Fourier transform,FFT)模块、梅尔频率滤波器组、Log对数能量模块和离散余弦变换(Discrete CosineTransform,DCT)求倒普模块,杂音检测装置利用MFCC计算模型中的预加重模块对多个分段数据中的每一个分段数据,即第一分段数据进行预加重处理,得到第一分段数据中的高频数据部分,再通过汉明窗和FFT模块对该高频数据部分进行处理,得到在频谱上的能量分布,通过梅尔频率滤波器组对得到的频谱进行平滑处理,并消除谐波的作用,再经过Log对数能量模块和DCT求倒普模块,从而得到了多个分段数据对应的多个分段特征。
示例性的,如公式(2)所示,杂音检测装置可以计算欧式距离,即通过公式(2)确定出多个分段数据中的每一个分段数据对应的每一个分段特征。
需要说明的是,xi为多个分段数据中任意一个分段数据,即第一分段数据对应的第一分段特征;yi为多个样本杂音数据中任一个样本杂音数据对应的样本杂音特征,ρ为第一分段特征与样本杂音特征之间的相似度,n为第一分段特征的特征向量维度,示例性的,n可以为12。
S103、根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段和目标杂音数据段对应的目标杂音类型。
在本申请实施例中,杂音检测装置在确定出多个分段数据对应的多个分段特征之后,杂音检测装置就可以根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段和目标杂音数据段对应的目标杂音类型了。
需要说明的是,目标杂音类型可以为白噪声;目标杂音类型也可以为卡顿,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,杂音检测装置中设置有样本杂音特征和杂音类型对应关系,该样本杂音特征和杂音类型对应关系可以存储于杂音检测装置的模板库中,也可以存储于杂音检测装置的其他地方,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,杂音检测装置根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段和目标杂音数据段对应的目标杂音类型的方式,可以为杂音检测装置分别确定多个分段特征中第一分段特征与样本杂音特征之间的多个相似度;当杂音检测装置确定了多个分段特征中第一分段特征值与样本杂音特征之间的多个相似度之后,杂音检测装置就分别在从多个相似度中确定出相似度最高、且满足预设相似度阈值的第一相似度的情况下,杂音检测装置将第一分段特征对应的第一分段数据确定为目标杂音数据段;当杂音检测装置确定出目标杂音数据段之后,杂音检测装置就可以从样本杂音特征和杂音类型对应关系中,获取第一相似度对应的第一样本杂音特征和第一样本杂音特征对应的第一样本杂音类型;当杂音检测装置获取第一相似度对应的第一样本杂音特征和第一样本杂音特征对应的第一样本杂音类型之后,杂音检测装置就将第一样本杂音类型确定为目标杂音类型。
需要说明的是,第一分段特征为多个分段特征中的任一个分段特征,样本杂音特征为样本杂音特征和杂音类型对应关系中的杂音特征,样本杂音特征对应的样本杂音数据的数据长度为预设数据长度。
在本申请实施例中,杂音检测装置分别确定多个分段特征中第一个分段特征与样本杂音特征之间的多个相似度,则杂音检测装置可得到多个分段特征中的每一个分段特征对应的多个相似度,其中,一个分段特征对应多个相似度。
在本申请实施例中,对于每一个分段特征对应的多个相似度,杂音检测装置按照对第一分段特征的处理方式进行处理,即杂音检测装置将在从每一个分段特征对应的多个相似度中确定出相似度最高、且满足预设相似度阈值的第二相似度的情况下,将第二分段特征对应的第二分段数据添加至目标杂音数据段中。
需要说明的是,第二分段特征为多个分段特征中除第一分段特征外,从每一个分段特征对应的多个相似度中确定出相似度最高、且满足预设相似度阈值时的分段特征;第二分段数据为第二分段特征对应的分段数据。
在本申请实施例中,杂音检测装置可以从样本杂音特征和杂音类型对应关系中,获取第二相似度对应的第二样本杂音特征和该第二样本杂音对应的第二样本杂音类型,并将该第二样本杂音类型作为目标杂音类型。
在本申请实施例中,模板库中还存储有样本杂音数据。
需要说明的是,杂音检测装置在分别确定多个分段特征中第一分段特征值与样本杂音特征之间的多个相似度之前,杂音检测装置先获取样本杂音数据,并根据样本杂音数据确定样本杂音特征,标记样本杂音特征对应的杂音类型,从而得到样本杂音特征和杂音类型对应关系。
还需要说明的是,该样本杂音特征可以为根据LPCC计算模型得到的样本杂音特征,该样本杂音特征可以为根据MFCC计算模型得到的样本杂音特征,还可以根据频谱图计算模型得到的样本杂音特征,具体的可根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,样本杂音数据可以为杂音检测装置在从待测设备处接收到待检测音频数据之前,杂音检测装置利用多个待测设备分别对原始音频数据处理后,得到的待检测音频数据中存在的杂音数据,其中,此处的多个待测设备可以为功放机、播放器、录音器、话筒、声卡、耳机等等中的至少两个。
示例性的,当杂音检测装置确定出第一样本杂音类型为白噪声时,杂音检测装置就将白噪声作为目标杂音类型,即目标杂音类型为白噪声;当杂音检测装置确定出第一样本杂音类型为卡顿时,杂音检测装置就将卡顿作为目标杂音类型,即目标杂音类型为卡顿。
在本申请实施例中,杂音检测装置根据样本杂音特征和杂音类型对应关系以及多个分段特征,从多个分段数据中确定目标杂音数据段之后,杂音检测装置就可以根据第一时间,确定目标杂音数据段在待检测音频数据中的定位信息。
需要说明的是,该定位信息可以为目标杂音数据段对应的时间信息,该时间信息可以为年月日时分秒格式的时间信息,如该时间可以为2020年06月05日12点35分26秒。
可以理解的是,当杂音检测装置确定出目标杂音数据段的定位信息后,杂音检测装置就可以根据该定位信息在待测设备中查找该定位信息对应的日志信息,根据该日志信息确定出现目标杂音数据段的原因。
在本申请实施例中,当杂音检测装置按照预设数据长度对待检测音频数据进行分段处理,得到多个分段数据之后,杂音检测装置就标记多个分段数据对应的多个索引信息。
需要说明的是,杂音检测装置可以按照待检测音频数据的采集顺序,对待检测音频数据进行分段得到多个分段数据,杂音检测装置同时按照该采集顺序标记多个分段数据索引信息,从而得到多个分段数据对应的多个索引信息。其中,一个分段数据对应一个索引信息。
还需要说明的是,杂音检测装置根据该多个索引信息对多个分段数据进行组合,得到待检测音频数据。
在本申请实施例中,杂音检测装置根据第一时间,确定目标杂音数据段在待检测音频数据中的定位信息的过程,包括:杂音检测装置在多个索引信息中,确定目标杂音数据段对应的第一索引信息;当杂音检测装置确定了目标杂音数据段对应的第一索引信息之后,杂音检测装置就根据第一索引信息和预设数据长度,确定目标杂音数据段的相对时间;当杂音检测装置根据第一索引信息和预设数据长度,确定目标杂音数据段的相对时间之后,杂音检测装置就根据相对时间和第一时间,确定目标杂音数据段的绝对时间;当杂音检测装置根据相对时间和第一时间,确定目标杂音数据段的绝对时间之后,杂音检测装置就将绝对时间作为定位信息,以根据定位信息查找目标杂音数据段对应的异常原因。
示例性的,杂音检测装置可以通过公式(3)确定出相对时间点。
需要说明的是,n为目标杂音数据段的索引信息,len为预设数据长度,fs为杂音检测装置采集待检测音频数据时的采样率,t1为异常数据的相对时间。
示例性的,杂音检测装置可以通过公式(4)确定出绝对时间。
t2=t0+t1 (4)
需要说明的是,t2为目标杂音数据段的绝对时间点,t0为第一时间。
示例性的,如图6所示,当杂音检测装置得到待检测音频数据时,杂音检测装置就对该待检测音频数据进行加窗分段处理,从而得到了多个分段数据,杂音检测装置利用特征提取模块从多个分段数据中,确定出多个分段数据对应的多个分段特征,杂音检测装置利用相似度对比模块分别确定多个分段特征中第一分段特征值与样本杂音特征之间的多个相似度,从而得到检测结果,即目标杂音类型。其中,杂音检测装置利用相似度对比模块分别确定多个分段特征中第一分段特征值与样本杂音特征之间的多个相似度之前,杂音检测装置还会利用特征提取模块从样本杂音数据中,确定出样本杂音特征,并确定样本杂音特征和杂音类型对应关系,将该样本杂音特征和杂音类型对应关系存储至模板库中,杂音检测装置可以直接从模板库中获取样本杂音特征。
示例性的,如图7所示,当杂音检测装置得到待检测音频数据时,杂音检测装置就按照预设数据长度对待检测音频数据进行分段,得到了多个分段数据,如,待检测音频数据可以分成4段,从而杂音检测装置就得到了4个分段数据,杂音检测装置分别确定多个分段特征中第一分段特征值与样本杂音特征之间的多个相似度,在从多个相似度中确定出相似度最高、且满足预设相似度阈值的第一相似度的情况下,将第一分段特征对应的第一分段数据确定为目标杂音数据段,并将第一样本杂音类型确定为目标杂音类型。
可以理解的是,杂音检测装置通过对接收到的待检测音频数据进行分段,得到多个分段数据,杂音检测装置利用样本杂音特征和杂音类型对应关系以及多个分段特征,就可以从多个分段数据中确定出目标杂音数据段和目标杂音类型,使得杂音检测装置可以检测出待检测音频数据中目标杂音数据段以及该目标杂音数据段对应的目标杂音类型,提高了杂音检测装置检测杂音时的智能性。
实施例二
基于实施例一同一发明构思,本申请实施例提供了一种杂音检测装置4,对应于一种杂音检测方法;图8为本申请实施例提供的一种杂音检测装置的组成结构示意图一,该杂音检测装置4可以包括:
接收单元11,用于从待测设备接收待检测音频数据;
分段单元12,用于对所述待检测音频数据进行分段处理,得到多个分段数据,并确定所述多个分段数据对应的多个分段特征;
确定单元13,用于根据样本杂音特征和杂音类型对应关系以及所述多个分段特征,从所述多个分段数据中确定目标杂音数据段和所述目标杂音数据段对应的目标杂音类型。
在本申请的一些实施例中,所述分段单元12,具体用于按照预设数据长度对所述待检测音频数据进行分段处理,得到多个分段数据。
在本申请的一些实施例中,所述装置还包括获取单元;
所述确定单元,具体用于分别确定所述多个分段特征中第一分段特征与样本杂音特征之间的多个相似度,所述第一分段特征为所述多个分段特征中的任一个分段特征,所述样本杂音特征为所述样本杂音特征和杂音类型对应关系中的杂音特征,所述样本杂音特征对应的样本杂音数据的数据长度为所述预设数据长度;在从所述多个相似度中确定出相似度最高、且满足预设相似度阈值的第一相似度的情况下,将所述第一分段特征对应的第一分段数据确定为所述目标杂音数据段;将第一样本杂音类型确定为所述目标杂音类型;
所述获取单元,用于从所述样本杂音特征和杂音类型对应关系中,获取所述第一相似度对应的第一样本杂音特征和所述第一样本杂音特征对应的所述第一样本杂音类型。
在本申请的一些实施例中,所述接收单元,还用于从待测设备接收所述待检测音频数据对应的第一时间;
相应的,所述确定单元,还用于根据所述第一时间,确定所述目标杂音数据段在所述待检测音频数据中的定位信息。
在本申请的一些实施例中,所述装置还包括标记单元;
所述标记单元,用于标记所述多个分段数据对应的多个索引信息;
相应的,所述确定单元,具体用于在多个索引信息中,确定所述目标杂音数据段对应的第一索引信息;根据所述第一索引信息和所述预设数据长度,确定所述目标杂音数据段的相对时间;根据所述相对时间和所述第一时间,确定所述目标杂音数据段的绝对时间;将所述绝对时间作为所述定位信息,以根据所述定位信息查找所述目标杂音数据段对应的异常原因。
在本申请的一些实施例中,所述装置还包括输入单元;
所述输入单元,用于将所述多个分段数据输入线性预测倒谱系数LPCC计算模型中,得到所述多个分段特征;或,将所述多个分段数据输入梅尔频率倒谱系数MFCC计算模型中,得到所述多个分段特征。
需要说明的是,在实际应用中,上述接收单元11、分段单元12和确定单元13可由杂音检测装置4上的处理器14实现,具体为CPU(Central Processing Unit,中央处理器)、MPU(Microprocessor Unit,微处理器)、DSP(Digital Signal Processing,数字信号处理器)或现场可编程门阵列(FPGA,Field Programmable Gate Array)等实现;上述数据存储可由杂音检测装置4上的存储器15实现。
本发明实施例还提供了一种杂音检测装置4,如图9所示,所述杂音检测装置4包括:处理器14、存储器15和通信总线16,所述存储器15通过所述通信总线16与所述处理器14进行通信,所述存储器15存储所述处理器14可执行的程序,当所述程序被执行时,通过所述处理器14执行如上述所述的杂音检测方法。
在实际应用中,上述存储器15可以是易失性存储器(volatile memory),例如随机存取存储器(Random-Access Memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(flash memory),硬盘(Hard DiskDrive,HDD)或固态硬盘(Solid-State Drive,SSD);或者上述种类的存储器的组合,并向处理器14提供指令和数据。
本发明实施例提供了一种计算机可读存储介质,其上有计算机程序,所述程序被处理器14执行时实现如上述所述的杂音检测方法。
可以理解的是,杂音检测装置通过对接收到的待检测音频数据进行分段,得到多个分段数据,杂音检测装置利用样本杂音特征和杂音类型对应关系以及多个分段特征,就可以从多个分段数据中确定出目标杂音数据段和目标杂音类型,使得杂音检测装置可以检测出待检测音频数据中目标杂音数据段以及该目标杂音数据段对应的目标杂音类型,提高了杂音检测装置检测杂音时的智能性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (10)
1.一种杂音检测方法,其特征在于,所述方法包括:
从待测设备接收待检测音频数据;
对所述待检测音频数据进行分段处理,得到多个分段数据,并确定所述多个分段数据对应的多个分段特征;
根据样本杂音特征和杂音类型对应关系以及所述多个分段特征,从所述多个分段数据中确定目标杂音数据段和所述目标杂音数据段对应的目标杂音类型。
2.根据权利要求1所述的方法,其特征在于,所述对所述待检测音频数据进行分段处理,得到多个分段数据,包括:
按照预设数据长度对所述待检测音频数据进行分段处理,得到多个分段数据。
3.根据权利要求2所述的方法,其特征在于,所述根据样本杂音特征和杂音类型对应关系以及所述多个分段特征,从所述多个分段数据中确定目标杂音数据段和所述目标杂音数据段对应的目标杂音类型,包括:
分别确定所述多个分段特征中第一分段特征与样本杂音特征之间的多个相似度,所述第一分段特征为所述多个分段特征中的任一个分段特征,所述样本杂音特征为所述样本杂音特征和杂音类型对应关系中的杂音特征,所述样本杂音特征对应的样本杂音数据的数据长度为所述预设数据长度;
在从所述多个相似度中确定出相似度最高、且满足预设相似度阈值的第一相似度的情况下,将所述第一分段特征对应的第一分段数据确定为所述目标杂音数据段;
从所述样本杂音特征和杂音类型对应关系中,获取所述第一相似度对应的第一样本杂音特征和所述第一样本杂音特征对应的第一样本杂音类型;
将所述第一样本杂音类型确定为所述目标杂音类型。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
从待测设备接收所述待检测音频数据对应的第一时间;
相应的,所述根据样本杂音特征和杂音类型对应关系以及所述多个分段特征,从所述多个分段数据中确定目标杂音数据段之后,所述方法还包括:
根据所述第一时间,确定所述目标杂音数据段在所述待检测音频数据中的定位信息。
5.根据权利要求4所述的方法,其特征在于,所述对所述待检测音频数据进行分段处理,得到多个分段数据之后,所述方法还包括:
标记所述多个分段数据对应的多个索引信息;
相应的,所述根据所述第一时间,确定所述目标杂音数据段在所述待检测音频数据中的定位信息,包括:
在多个索引信息中,确定所述目标杂音数据段对应的第一索引信息;
根据所述第一索引信息和所述预设数据长度,确定所述目标杂音数据段的相对时间;
根据所述相对时间和所述第一时间,确定所述目标杂音数据段的绝对时间;
将所述绝对时间作为所述定位信息,以根据所述定位信息查找所述目标杂音数据段对应的异常原因。
6.根据权利要求1所述的方法,其特征在于,所述确定所述多个分段数据对应的多个分段特征,包括:
将所述多个分段数据输入线性预测倒谱系数LPCC计算模型中,得到所述多个分段特征;
或,将所述多个分段数据输入梅尔频率倒谱系数MFCC计算模型中,得到所述多个分段特征。
7.一种杂音检测装置,其特征在于,所述装置包括:
接收单元,用于从待测设备接收待检测音频数据;
分段单元,用于对所述待检测音频数据进行分段处理,得到多个分段数据,并确定所述多个分段数据对应的多个分段特征;
确定单元,用于根据样本杂音特征和杂音类型对应关系以及所述多个分段特征,从所述多个分段数据中确定目标杂音数据段和所述目标杂音数据段对应的目标杂音类型。
8.根据权利要求7所述的装置,其特征在于;
所述分段单元,具体用于按照预设数据长度对所述待检测音频数据进行分段处理,得到多个分段数据。
9.一种杂音检测装置,其特征在于,所述装置包括:
存储器、处理器和通信总线,所述存储器通过所述通信总线与所述处理器进行通信,所述存储器存储所述处理器可执行的杂音检测的程序,当所述杂音检测程序被执行时,通过所述处理器执行如权利要求1至6任一项所述的方法。
10.一种存储介质,其上存储有计算机程序,应用于杂音检测装置,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010535924.7A CN111782861A (zh) | 2020-06-12 | 2020-06-12 | 一种杂音检测方法及装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010535924.7A CN111782861A (zh) | 2020-06-12 | 2020-06-12 | 一种杂音检测方法及装置、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111782861A true CN111782861A (zh) | 2020-10-16 |
Family
ID=72756355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010535924.7A Withdrawn CN111782861A (zh) | 2020-06-12 | 2020-06-12 | 一种杂音检测方法及装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782861A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112700790A (zh) * | 2020-12-11 | 2021-04-23 | 广州市申迪计算机系统有限公司 | 一种idc机房声音处理方法、系统、设备及计算机存储介质 |
CN112908347A (zh) * | 2021-02-25 | 2021-06-04 | 益阳市信维声学科技有限公司 | 一种杂音检测方法及终端 |
CN114019236A (zh) * | 2021-10-12 | 2022-02-08 | 中国科学院空天信息创新研究院 | 一种电网谐波单通道混叠目标信号检测方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102695206A (zh) * | 2012-05-28 | 2012-09-26 | 大唐移动通信设备有限公司 | 一种语音业务杂音检测方法及装置 |
CN103337248A (zh) * | 2013-05-17 | 2013-10-02 | 南京航空航天大学 | 一种基于时间序列核聚类的机场噪声事件识别方法 |
CN110634497A (zh) * | 2019-10-28 | 2019-12-31 | 普联技术有限公司 | 降噪方法、装置、终端设备及存储介质 |
-
2020
- 2020-06-12 CN CN202010535924.7A patent/CN111782861A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102695206A (zh) * | 2012-05-28 | 2012-09-26 | 大唐移动通信设备有限公司 | 一种语音业务杂音检测方法及装置 |
CN103337248A (zh) * | 2013-05-17 | 2013-10-02 | 南京航空航天大学 | 一种基于时间序列核聚类的机场噪声事件识别方法 |
CN110634497A (zh) * | 2019-10-28 | 2019-12-31 | 普联技术有限公司 | 降噪方法、装置、终端设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112700790A (zh) * | 2020-12-11 | 2021-04-23 | 广州市申迪计算机系统有限公司 | 一种idc机房声音处理方法、系统、设备及计算机存储介质 |
CN112908347A (zh) * | 2021-02-25 | 2021-06-04 | 益阳市信维声学科技有限公司 | 一种杂音检测方法及终端 |
CN114019236A (zh) * | 2021-10-12 | 2022-02-08 | 中国科学院空天信息创新研究院 | 一种电网谐波单通道混叠目标信号检测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109147796B (zh) | 语音识别方法、装置、计算机设备及计算机可读存储介质 | |
CN111782861A (zh) | 一种杂音检测方法及装置、存储介质 | |
US9111526B2 (en) | Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal | |
CN112201255B (zh) | 语音信号频谱特征和深度学习的语音欺骗攻击检测方法 | |
EP2633523B1 (en) | Decomposition of audio signals using basis functions with time-evolution information | |
US20050143997A1 (en) | Method and apparatus using spectral addition for speaker recognition | |
US8489404B2 (en) | Method for detecting audio signal transient and time-scale modification based on same | |
KR20180050652A (ko) | 음향 신호를 사운드 객체들로 분해하는 방법 및 시스템, 사운드 객체 및 그 사용 | |
CN110189757A (zh) | 一种大熊猫个体识别方法、设备及计算机可读存储介质 | |
CN102394062A (zh) | 一种自动录音设备源识别的方法和系统 | |
CN111640411B (zh) | 音频合成方法、装置及计算机可读存储介质 | |
CN108847253B (zh) | 车辆型号识别方法、装置、计算机设备及存储介质 | |
US20130266147A1 (en) | System and method for identification of highly-variable vocalizations | |
CN112382300A (zh) | 声纹鉴定方法、模型训练方法、装置、设备及存储介质 | |
CN112542174A (zh) | 基于vad的多维特征参数声纹识别方法 | |
CN107527624B (zh) | 一种声纹识别方法及装置 | |
KR101808810B1 (ko) | 음성/무음성 구간 검출 방법 및 장치 | |
CN105869656B (zh) | 一种语音信号清晰度的确定方法及装置 | |
KR101382356B1 (ko) | 오디오파일의 위변조 검출장치 | |
Peng et al. | Effective Phase Encoding for End-To-End Speaker Verification. | |
CN107919136B (zh) | 一种基于高斯混合模型的数字语音采样频率估计方法 | |
CN112581975B (zh) | 基于信号混叠和双声道相关性的超声波语音指令防御方法 | |
Verma et al. | Cell-phone identification from recompressed audio recordings | |
Liu et al. | Identification of fake stereo audio | |
Lin et al. | A robust method for speech replay attack detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201016 |