CN116576956A - 基于分布式光纤声波传感的多源振动信号分离方法 - Google Patents
基于分布式光纤声波传感的多源振动信号分离方法 Download PDFInfo
- Publication number
- CN116576956A CN116576956A CN202310408385.4A CN202310408385A CN116576956A CN 116576956 A CN116576956 A CN 116576956A CN 202310408385 A CN202310408385 A CN 202310408385A CN 116576956 A CN116576956 A CN 116576956A
- Authority
- CN
- China
- Prior art keywords
- signal
- source
- mixed
- noise
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 81
- 239000013307 optical fiber Substances 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 239000012634 fragment Substances 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 10
- 238000002156 mixing Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 85
- 230000009466 transformation Effects 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 11
- 238000013135 deep learning Methods 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 239000000835 fiber Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000010339 dilation Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000000253 optical time-domain reflectometry Methods 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H9/00—Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by using radiation-sensitive means, e.g. optical means
- G01H9/004—Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by using radiation-sensitive means, e.g. optical means using fibre optic sensors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Abstract
基于分布式光纤声波传感的多源振动信号分离方法,包括:利用DAS采集不同类型的单源振动信号然后进行线性混合,构建不同混合源数的混合信号数据集;读取混合信号数据集中的数据,对信号进行去噪和切片处理,提取有效的事件片段;构建Conv‑TasNet网络模型,使用不同混合源数的混合信号离线训练,得到针对不同混合源数混合信号的分离模型;使用源数估计算法,估计数据集中混合信号的混合源数;根据估计的混合源数,选择对应源数的分离模型来分离混合信号。本发明将传统盲源分离中的源数估计算法与深度学习方法相结合,有效解决实际环境种多源混叠的情况,在源数未知的情况下分离复杂环境下的多源振动信号,并取得良好的源信号分离效果。
Description
技术领域
本发明涉及分布式光纤传感应用领域,具体涉及一种基于分布式光纤声波传感的多源振动信号分离方法。
背景技术
光纤分布式声波传感技术(DAS)利用大范围铺设的光纤对周围环境的各种振动源进行高灵敏感知和精确定位,相较于传统的电子传感器阵列具有无源、抗干扰能力强等优点,在复杂环境下的安全监测上有广阔的应用前景。
近几年,深度学习技术发展突飞猛进,在图像编解码、图像分类任务、语音识别都取得了突破性进展。基于深度学习的DAS信号智能识别成为了研究的热点,并取得了不错的效果。但在复杂环境下DAS的智能识别能力还无法满足实际应用的需求,特别是在地面存在多种不同源的干扰条件下,例如城市种地面存在各种交通:地铁、高铁、公交车辆等、工厂生产、人为活动等引起的振动,多种振动源从地面到地下光纤传播过程中相互叠加,为DAS传感目标信号的精准检测识别带来巨大的挑战,单源监测和识别方法会在该多源干扰环境中可能会失败,而不确定多源干扰则是DAS识别的一大挑战。
目前基于DAS的多源振动信号分离研究较少,而语音分离任务研究较早,应用技术丰富。文献[1]:Luo Y,Mesgarani N.TasNet:time-domain audio separation networkfor real-time,single-channel speech separation[C],2018:696-700)提出一种时域单通道的语音分离模型TasNet,以Bi-LSTM作为主体,取得了13.2dB SI-SDR的分离效果。
文献[2]:Luo Y,Mesgarani N.Conv-TasNet:Surpassing Ideal Time–FrequencyMagni tude Masking for Speech Separation[J].IEEE/ACM Transactions on Audio,Speech,and Language Processing,2019,PP(99):1-1)提出了基于卷积的Conv-TasNet,使用由一维膨胀卷积块组成的时域卷积网络计算掩码,使网络可以对语音信号的长期依赖性进行建模,同时保持较小的参数量和更快的分离速度,取得了15.3dB SI-SDR的分离效果。DAS多源振动信号分离任务可以借鉴语音分离任务的研究成果,现有研究表明使用深度学习技术进行源分离能取得不错的分离效果。而且由于DAS灵敏度高、稳定性强、布设范围广、采集数据量大等特点,能为以数据驱动的深度学习语音分离方法提供大量数据。但目前现有的深度学习源分离技术是基于已知且固定混合源数的模型训练,而实际DAS采集的多源振动信号源数未知且不固定,因此需要设计一种未知源数估计算法,为源分离提供先验信息,辅助信号分离。DAS光纤阵列具有多个传感段能同时获取多个观测信号,为实现多源信号的源数估计提供了便利。
发明内容
本发明提供一种基于分布式光纤声波传感的多源振动信号分离方法,将传统盲源分离中的源数估计算法与深度学习方法相结合,有效解决实际环境种多源混叠的情况,在源数未知的情况下分离复杂环境下的多源振动信号,并取得良好的源信号分离效果。为DAS系统在复杂环境下的目标信号精确检测识别提供了有价值的解决方案。
本发明采取的技术方案为:
基于分布式光纤声波传感的多源振动信号分离方法,包括以下步骤:
步骤1:数据准备:利用DAS采集不同类型的单源振动信号然后进行线性混合,构建不同混合源数的混合信号数据集;
步骤2:信号预处理:读取混合信号数据集中的数据,使用PSD-RMS算法对信号进行去噪和切片处理,提取有效的事件片段;
步骤3:训练分离网络:构建Conv-TasNet网络模型,使用不同混合源数的混合信号离线训练,得到针对不同混合源数混合信号的分离模型;
步骤4:源数估计:使用源数估计算法,估计数据集中混合信号的混合源数;
步骤5:多源信号分离:根据步骤4中估计的混合源数,选择步骤3中对应源数的分离模型来分离混合信号。
所述步骤1包括如下步骤:
步骤1.1:利用分布式光纤声波传感系统解调模块,分别采集多个光纤传感器接收到的多种不同事件的传感信号;
步骤1.2:使用Matlab将步骤1.1采集的传感信号转为wav格式的音频文件,使用Python脚本将不同事件的音频文件进行线性混合,得到混合音频数据集。
具体的,步骤1.2中提到的混合方式为随机混合,例如:有四种类型的音频,A={a1,a2,a3,a4,...an},B={b1,b2,b3,b4,...bn},C={c1,c2,c3,c4,...cn},D={d1,d2,d3,d4,...dn},将四种类型的音频进行随机种类以及随机源数的混合,得到混合音频类似于Mix={a5_d6,b3_c7_d2,a3_b1_c4_d8,...}的二源、三源、四源的混合音频,得到混合音频数据集。
所述步骤2包括如下步骤:
步骤2.1:读取步骤1.2中的音频文件得到带噪信号,将带噪信号进行快速傅里叶变换,得到带噪信号幅度值矩阵mag_noisy,以及带噪信号相位值矩阵phase_noisy(与幅值矩阵形状相同),将幅度值矩阵mag_noisy的元素进行平方运算,即可得到带噪信号能量值矩阵power_noisy(矩阵形状不变);
步骤2.2:取带噪音频中的前30帧静音片段作为原始信号的噪声,然后经过短时傅里叶变换,得到噪声信号幅度值矩阵mag_noise,将噪声信号幅度值矩阵mag_noise的元素进行平方运算,即可得到噪声信号能量值矩阵power_noise,取噪声信号能量值矩阵power_noise中能量的均值作为噪声能量noise,然后将步骤2.1中的带噪信号的能量值矩阵power_noisy中的每个元素都减去噪声能量noise,即可得到增强信号的能量值矩阵power_enhenc,将增强信号的能量值矩阵power_enhenc开二次方,得到增强信号幅度值矩阵mag_enhenc;
步骤2.3:根据步骤2.2得到的增强信号的能量值矩阵power_enhenc,计算增强信号的功率谱密度的均方根矩阵PSD-RMS_Matirx,获取增强信号的功率谱密度的均方根矩阵PSD-RMS_Matirx的最大值和最小值,并取均值作为PSD-RMSd的阈值,当PSD-RMS大于阈值时,认为是有效声音片段,当PSD-RMS小于阈值时,认为是静音片段,使用一个数组记录下有效声音片段和静音片段的分割点;
步骤2.4:根据增强信号幅度值矩阵mag_enhenc,和带噪信号相位值矩阵phase_noisy,使用傅里叶反变换还原出增强信号的时域信号,然后根据步骤2.3得到的分割点,对时域信号进行分割,提取出事件片段。
所述步骤3中,所述Conv-TasNet网络模型包括:
音频编码模块、语音分离网络、音频解码模块;音频编码模块与音频解码模块连接,音频编码模块与语音分离网络连接,语音分离网络与音频解码模块连接;
音频编码模块包括一维卷积层;
语音分离网络包括多个归一化层、多个一维卷积层、依次级联的多组时间卷积模块TCN、PReLU层;
音频解码模块包括一维反卷积层。
所述步骤3中,使用不同源数的混合信号通过分离网络进行离线训练,采用Adam优化器,损失函数使用SI-SDR,得到针对两源、三源、四源的分离模型。
SI-SDR是一种评估语音分离和音频源分离算法性能的指标,其全称为"Scale-Invariant Source-to-Distortion Ratio"。SI-SDR的计算公式如下:
上式中,为分离后的目标说话人音频数据;S表示纯净音频数据、Starget为/>平行于S的分量,/>表示两个向量乘积之和、enoise为噪声分量。
所述步骤4中,源数估计算法是盲源分离(BSS)问题中的一个重要研究分支,常用的源数估计方法包括基于信息论准则和基于盖尔圆这两种源数估计方法,本发明采用基于盖尔圆的源数估计方法,该方法综合利用观测信号矩阵的协方差矩阵的特征向量和特征值信息,使得方法不受信号模型的限制。
所述步骤4包括以下步骤:
步骤4.1:计算观测信号的协方差矩阵R。
步骤4.2:去除协方差矩阵R的最后一行与最后一列得到矩阵R'。
步骤4.3:对矩阵R'进行奇异值分解,得到特征值,并对特征值从大到小排列。
步骤4.4:对协方差进行酉变换,使得变换后协方差矩阵对应于观测信号的盖尔圆半径远大于噪声盖尔圆半径。
步骤4.5:两个盖尔圆相互远离,这样可以根据大半径的盖尔圆数目判断出源数目。
本发明一种基于分布式光纤声波传感的多源振动信号分离方法,技术效果如下:
1)信号预处理简单:本发明的预处理包含两个部分分别是信号增强以及端点检测,本发明提出的PSD-RMS算法,将信号增强算法和端点检测算法进行融合,可以在降噪的同时进行端点监测,避免重复计算相同过程,提高了信号预处理的效率。
2)本发明首次将Conv-TasNet网络应用于分布式光纤声波传感系统的多源信号的分离任务,相较于传统的盲源分离算法,能自动提取更多深层的特征,取得更好的分离效果。
3)本发明结合源数估计算法,先对未知信号的混合源数进行估计,然后根据估计源数进行分离,能有效实现实际环境下未知混合源数的信号分离,具有现实意义。
4)本发明提出一种信号预处理方法能同时实现信号去噪和事件信号提取,同时提出源数估计算法与深度神经网络的语音分离模型结合,实现对未知混合源数的混合信号进行分离。该方法发挥了BSS和深度神经网络分离的优势,可以更精确实现多源分离效果,为DAS系统在复杂环境下的目标信号精确检测识别提供了有价值的解决方案。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为本发明使用的DAS解调模块原理图。
图2为本发明信号预处理流程图。
图3为本音频分离网络模型结构图。
图4为本发明所提基于分布式光纤声波传感的多源振动信号分离方法整体示意图。
具体实施方式
下面结合实施例对本发明的特征和性能作进一步的详细描述:
步骤一、数据准备:
利用基于相敏光时域反射仪的分布式光纤声波/振动传感系统(DAS)硬件,振动光纤对声音信号不敏感,在实验室中采集使用音箱播放的汽车发动机、火车行驶、挖掘、敲击桌面等四种振动信号,采集信号的采样率为10KHz。
采集数据的硬件,是基于相位解调的相敏光时域反射(Φ-OTDR)技术的分布式光纤声波传感系统,系统结构及其工作原理如图1所示。系统硬件由三个部分组成,超弱光纤光栅阵列、DAS解调模块、信号处理主机。超弱光纤光栅阵列由多个光栅间隔为5m的超弱光纤光栅传感器组成。
DAS解调模块是采集并解调信号的核心设备,其内部组成器件主要包括光学器件和电学器件两类。窄带激光器发射的连续光经半导体放大器(Semiconductor OpticalAmplifiers,SOA)调制后,通过掺铒光纤放大器(Erbium-doped Optical FiberAmplifier,EDFA)提升脉冲功率,再耦合进入UW-FBGs阵列。不同位置的UW-FBG反射的光脉冲到达光电探测器的时间不同,通过时间-强度分析可以确定每个光栅的位置。相邻两个光栅的反射脉冲经过非平衡迈克尔逊干涉仪(臂长差为L,与相邻两个光栅间距相等)后,在3×3耦合器中干涉,形成三路相位差为120°的干涉光信号,经过光电转换后由3路高速A/D同步采集,与此同时,嵌入式电路实时完成反正切、数字滤波、相位反卷计算,再通过Ethernet输出显示。在非平衡迈克尔逊干涉仪的两个法拉第旋镜用于补偿偏振衰落。嵌入式电路采用赛灵思Zynq7035芯片为核心构建,集成处理器(Advanced RISC Machines,ARM)和现场可编程门阵列(Field Programmable Gate Array,FPGA),对系统中的SOA、EDFA、采集电路进行时序控制和算法解析。信号处理主机为普通商用笔记本电脑,用于DAS解调模块采集信号转换为音频文件和信号预处理。
步骤二、信号预处理:
如图2所示,对采集到的各种振动信号使用语音增强算法进行去噪,同时使用信号端点检测算法(VAD)对去噪后的信号进行切片,提取有用的事件信号片段。然后将不同类别的事件信号片段使用Python脚本进行线性混合得到混合信号,根据混合源信号的数目可以分为两源混合、三源混合、四源混合音频各200条,得到混合音频数据集,其中数据集标签形式如下表1所示,
表1数据集标签结构表
表1中,每一条数据存储的是混合信号路径以及其多个源信号路径。数据集中70%作为训练集,30%作为测试集。
本发明中使用的语音增强算法为改进的谱减法,谱减法是一种有效的语音增强技术,是先对噪声的频谱进行估计,通过“谱相减”去除噪声段的技术,其计算复杂度低,实时性强。改进的谱减法相较于普通谱减法引入α为过减因子,β为增益补偿因子能有效降低普通谱减法中残留的“音乐噪声”。
本发明中使用的信号端点检测算法为PSD-RMS算法,算法流程如图2所示,设定检测的频率范围,对去噪后的信号的频谱图进行功率谱计算,然后计算均方根误差,提取PSD-RMS特征,然后设定特征的阈值,根据阈值对信号进行切片,由于改进谱减法也需要计算频谱图,因此将改进谱减法与PSD-RMS算法进行融合,实现去噪的同时对信号进行端点检测。
具体步骤如下:
S1:读取DAS录制的音频文件得到带噪信号,将带噪信号进行快速傅里叶变换,得到带噪信号幅度值矩阵mag_noisy,以及带噪信号相位值矩阵phase_noisy(与幅值矩阵形状相同),将幅度值矩阵mag_noisy的元素进行平方运算,即可得到带噪信号能量值矩阵power_noisy(矩阵形状不变);
S2:取带噪音频中的前30帧静音片段作为原始信号的噪声,然后经过短时傅里叶变换,得到噪声信号幅度值矩阵mag_noise,将噪声信号幅度值矩阵mag_noise的元素进行平方运算,即可得到噪声信号能量值矩阵power_noise,取power_noise矩阵中能量的均值作为噪声能量noise,然后将S1中的带噪信号的能量值矩阵power_noisy中的每个元素都减去噪声能量noise,即可得到增强信号的能量值矩阵power_enhenc,将增强信号的能量值矩阵power_enhenc开二次方,得到增强信号幅度值矩阵mag_enhenc;
S3:根据S2得到的增强信号的能量值矩阵power_enhenc,计算增强信号的功率谱密度的均方根矩阵PSD-RMS_Matirx,获取增强信号的功率谱密度的均方根矩阵PSD-RMS_Matirx的最大值和最小值,并取均值作为PSD-RMS阈值,当PSD-RMS大于阈值时,认为是有效声音片段,当PSD-RMS小于阈值时,认为是静音片段,使用一个数组记录下有效声音片段和静音片段的分割点;
S4:根据增强信号幅度值矩阵mag_enhenc,和带噪信号相位值矩阵phase_noisy,使用傅里叶反变换还原出增强信号的时域信号,然后根据S3得到的分割点,对时域信号进行分割,提取出事件片段。
步骤三、构建Conv-TasNet模型的语音分离模型,如图4所示。
Conv-TasNet模型包括音频编码模块、音频分离网络和音频解码模块;音频编码模块与音频解码模块连接,音频编码模块与语音分离网络连接,语音分离网络与音频解码模块连接;音频编码模块包括一维卷积层;音频分离网络包括多个归一化层、多个一维卷积层、依次级联的多组时间卷积模块TCN、PReLU层;音频解码模块包括一维反卷积层。
语音分离网络包括第一归一化层、第一一维卷积层、第一TCN组、第二TCN组、第三TCN组、PReLU层、第二一维卷积层和第二归一化层,其中每组TCN包括八个依次级联的TCN,每个TCN的具体结构为:一维卷积层、ReLU层、归一化层、深度可分离卷积层、ReLU层、归一化层和一维卷积层,且输入与输出间进行残差连接;每个TCN具有各自的膨胀卷积结构,其中卷积过程的扩张因子即卷积核的步长从1开始以指数2逐渐增大,即1、2、4、…,且每组TCN的第一个TCN的扩张因子重置为1。
本发明中采用的TCN模块是Shaojie Bai等人在2018年提出的一种新型的可以用来解决时间序列预测的算法;由于RNN网络一次只读取、解析输入文本中的一个单词或字符,深度神经网络必须等前一个单词处理完,才能进行下一个单词的处理,这意味着RNN不能像卷积神经网络那样进行大规模并行处理,耗时较长,因此相比于RNN网络,TCN模块在使用时序数据的预测任务中的表现更为出色,在分离模型中使用基于TCN模块的Conv-TasNet模型可以提高分离效率和分离出音频的信号失真比。
步骤四:使用不同源数的混合信号通过分离网络进行离线训练,采用Adam优化器,损失函数使用SI-SDR,得到针对两源、三源、四源的分离模型。
SI-SDR是一种评估语音分离和音频源分离算法性能的指标,其全称为"Scale-Invariant Source-to-Distortion Ratio",SI-SDR的计算公式如下:
其中:为分离后的目标说话人音频数据;S表示纯净音频数据、Starget为/>平行于S的分量,/>表示两个向量乘积之和;enoise为噪声分量;本发明采用的性能评价指标SI-SDR将生成向量投影到真实向量的垂直方向,相较于信噪比SNR更能反映分离后音频与纯净音频之间的相似性,从而能训练出效果更好的分离模型。
步骤五:针对未知源数的混合信号的分离,使用基于盖尔圆估计的源数目估计算法,估计混合信号的源数,然后选择对应源数的分离模型分离混合信号,算法介绍如下:
设矩阵G是n x n的矩阵,gij为其元素,盖尔圆半径定义为:
复平面上,以gij为圆心,以ri为半径的圆,称为盖尔圆。
根据盖尔圆定理,矩阵G的所有特征值均位于它的所有盖尔圆的并集之中,如果存在k个盖尔圆与其它的盖尔圆相互隔离,则矩阵G有k个特征值位于这k个盖尔圆的并集之中。观测信号的协反差矩阵的各个盖尔圆半径较大,且圆心较为接近,需要对协方差进行酉变换,使得变换后协方差矩阵对应于观测信号的盖尔圆半径远大于噪声盖尔圆半径,且两个盖尔圆相互远离,这样可以根据大半径的盖尔圆数目判断出源数目。
计算出观测信号的协方差矩阵后,分块表示如下:
分块后R1为Rx中前n-1行、前n-1列组成的方阵,r=[r1nr2n…r(n-1)n]T由Rx最后一列的前n(n-1)行组成。对R1进行特征分解,得到:
其中Q1=[q1q2…q(n-1)]为R1n-1个特征向量组成的(n-1)x(n-1)的酉矩阵。
A1=diag(γ1γ2…γn)对应每个特征向量的特征值,特征值之间满足以下关系:
λ1≥γ1≥λ2≥γ2≥…≥λn-1≥γn-1≥λn
令对Rx进行酉转换,得到新的酉变换矩阵R2:
R2的前n-1个盖尔圆分成以γi为圆心,半径不为0的盖尔圆数目便等于源数目的估计值。因此基于盖尔圆的源数目估计公式定义如下:
其中,D(L)是与快拍数L有关的减函数,是GDE的调整因子,取值[0,1]。对k从1开始代入上式,首次取得负值时,得到的值K0减去1等于估计出来的源数目S:
S=K0-1。
通过以上实施方式,实现了未知混合源数的DAS多源振动信号分离,能有效解决实际环境种多源混叠的情况,分离复杂环境下的多源振动信号,为DAS系统在复杂环境下的目标信号精确检测识别提供了有价值的解决方案。
Claims (7)
1.基于分布式光纤声波传感的多源振动信号分离方法,其特征在于包括以下步骤:
步骤1:利用DAS采集不同类型的单源振动信号然后进行线性混合,构建不同混合源数的混合信号数据集;
步骤2:读取混合信号数据集中的数据,使用PSD-RMS算法对信号进行去噪和切片处理,提取有效的事件片段;
步骤3:构建Conv-TasNet网络模型,使用不同混合源数的混合信号离线训练,得到针对不同混合源数混合信号的分离模型;
步骤4:使用源数估计算法,估计数据集中混合信号的混合源数;
步骤5:根据步骤4中估计的混合源数,选择步骤3中对应源数的分离模型来分离混合信号。
2.根据权利要求1所述基于分布式光纤声波传感的多源振动信号分离方法,其特征在于:所述步骤1包括如下步骤:
步骤1.1:利用分布式光纤声波传感系统解调模块,分别采集多个光纤传感器接收到的多种不同事件的传感信号;
步骤1.2:使用Matlab将步骤1.1采集的传感信号转为wav格式的音频文件,使用Python脚本将不同事件的音频文件进行线性混合,得到混合音频数据集。
3.根据权利要求1所述基于分布式光纤声波传感的多源振动信号分离方法,其特征在于:所述步骤2包括如下步骤:
步骤2.1:读取步骤1.2中的音频文件得到带噪信号,将带噪信号进行快速傅里叶变换,得到带噪信号幅度值矩阵mag_noisy,以及带噪信号相位值矩阵phase_noisy,将幅度值矩阵mag_noisy的元素进行平方运算,即可得到带噪信号能量值矩阵power_noisy;
步骤2.2:取带噪音频中的前30帧静音片段作为原始信号的噪声,然后经过短时傅里叶变换,得到噪声信号幅度值矩阵mag_noise,将噪声信号幅度值矩阵mag_noise的元素进行平方运算,即可得到噪声信号能量值矩阵power_noise,取噪声信号能量值矩阵power_noise中能量的均值作为噪声能量noise,然后将步骤2.1中的带噪信号的能量值矩阵power_noisy中的每个元素都减去噪声能量noise,即可得到增强信号的能量值矩阵power_enhenc,将增强信号的能量值矩阵power_enhenc开二次方,得到增强信号幅度值矩阵mag_enhenc;
步骤2.3:根据步骤2.2得到的增强信号的能量值矩阵power_enhenc,计算增强信号的功率谱密度的均方根矩阵PSD-RMS_Matirx,获取增强信号的功率谱密度的均方根矩阵PSD-RMS_Matirx的最大值和最小值,并取均值作为PSD-RMSd的阈值,当PSD-RMS大于阈值时,认为是有效声音片段,当PSD-RMS小于阈值时,认为是静音片段,使用一个数组记录下有效声音片段和静音片段的分割点;
步骤2.4:根据增强信号幅度值矩阵mag_enhenc,和带噪信号相位值矩阵phase_noisy,使用傅里叶反变换还原出增强信号的时域信号,然后根据步骤2.3得到的分割点,对时域信号进行分割,提取出事件片段。
4.根据权利要求1所述基于分布式光纤声波传感的多源振动信号分离方法,其特征在于:所述步骤3中,所述Conv-TasNet网络模型包括:
音频编码模块、语音分离网络、音频解码模块;音频编码模块与音频解码模块连接,音频编码模块与语音分离网络连接,语音分离网络与音频解码模块连接;
音频编码模块包括一维卷积层;
语音分离网络包括多个归一化层、多个一维卷积层、依次级联的多组时间卷积模块TCN、PReLU层;
音频解码模块包括一维反卷积层。
5.根据权利要求4所述基于分布式光纤声波传感的多源振动信号分离方法,其特征在于:所述步骤3中,使用不同源数的混合信号通过分离网络进行离线训练,采用Adam优化器,损失函数使用SI-SDR,得到针对两源、三源、四源的分离模型;
SI-SDR的计算公式如下:
上式中,为分离后的目标说话人音频数据;表示纯净音频数据、为/>平行于S的分量,表示两个向量乘积之和、为噪声分量。
6.根据权利要求1所述基于分布式光纤声波传感的多源振动信号分离方法,其特征在于:所述步骤4包括以下步骤:
步骤4.1:计算观测信号的协方差矩阵R;
步骤4.2:去除协方差矩阵R的最后一行与最后一列得到矩阵R';
步骤4.3:对矩阵R'进行奇异值分解,得到特征值,并对特征值从大到小排列;
步骤4.4:对协方差进行酉变换,使得变换后协方差矩阵对应于观测信号的盖尔圆半径远大于噪声盖尔圆半径;
步骤4.5:两个盖尔圆相互远离,这样可以根据大半径的盖尔圆数目判断出源数目。
7.根据权利要求1所述基于分布式光纤声波传感的多源振动信号分离方法,其特征在于:
针对未知源数的混合信号的分离,使用基于盖尔圆估计的源数目估计算法,估计混合信号的源数,然后选择对应源数的分离模型分离混合信号,具体如下:
设矩阵G是n x n的矩阵,j为其元素,盖尔圆半径定义为:
复平面上,以j为圆心,以ri为半径的圆,称为盖尔圆;
根据盖尔圆定理,矩阵G的所有特征值均位于它的所有盖尔圆的并集之中,如果存在k个盖尔圆与其它的盖尔圆相互隔离,则矩阵G有k个特征值位于这k个盖尔圆的并集之中;观测信号的协反差矩阵的各个盖尔圆半径较大,且圆心较为接近,需要对协方差进行酉变换,使得变换后协方差矩阵对应于观测信号的盖尔圆半径远大于噪声盖尔圆半径,且两个盖尔圆相互远离,这样能够根据大半径的盖尔圆数目判断出源数目;
计算出观测信号的协方差矩阵后,分块表示如下:
分块后为(中前n-1行、前n-1列组成的方阵,r=[rr…r(-)]T由x最后一列的前n(n-1)行组成;对进行特征分解,得到:
其中:Q=[qq…q(-)]为n-1个特征向量组成的(n-1)x(n-1)的酉矩阵;
A=diag(γ1γ…γ)对应每个特征向量的特征值,特征值之间满足以下关系:
λ1≥γ1≥λ2≥γ2≥…≥λn-1≥γn-1≥λn
令对Rx进行酉转换,得到新的酉变换矩阵R2:
R2的前n-1个盖尔圆分成以γi为圆心,半径不为0的盖尔圆数目便等于源数目的估计值;因此基于盖尔圆的源数目估计公式定义如下:
其中,D(L)是与快拍数L有关的减函数,是GDE的调整因子;对k从1开始代入上式,首次取得负值时,得到的值K0减去1等于估计出来的源数目S:
S=K0-1;
通过以上方式,实现了未知混合源数的DAS多源振动信号分离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310408385.4A CN116576956A (zh) | 2023-04-17 | 2023-04-17 | 基于分布式光纤声波传感的多源振动信号分离方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310408385.4A CN116576956A (zh) | 2023-04-17 | 2023-04-17 | 基于分布式光纤声波传感的多源振动信号分离方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116576956A true CN116576956A (zh) | 2023-08-11 |
Family
ID=87542296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310408385.4A Pending CN116576956A (zh) | 2023-04-17 | 2023-04-17 | 基于分布式光纤声波传感的多源振动信号分离方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116576956A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117030000A (zh) * | 2023-10-10 | 2023-11-10 | 之江实验室 | 一种分布式声波传感偏振控制系统及偏振衰落抑制方法 |
CN117708506A (zh) * | 2024-02-05 | 2024-03-15 | 山东省科学院激光研究所 | 分布式声波传感相干衰落引起的恶化效应消除方法及系统 |
-
2023
- 2023-04-17 CN CN202310408385.4A patent/CN116576956A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117030000A (zh) * | 2023-10-10 | 2023-11-10 | 之江实验室 | 一种分布式声波传感偏振控制系统及偏振衰落抑制方法 |
CN117030000B (zh) * | 2023-10-10 | 2024-01-12 | 之江实验室 | 一种分布式声波传感偏振控制系统及偏振衰落抑制方法 |
CN117708506A (zh) * | 2024-02-05 | 2024-03-15 | 山东省科学院激光研究所 | 分布式声波传感相干衰落引起的恶化效应消除方法及系统 |
CN117708506B (zh) * | 2024-02-05 | 2024-04-26 | 山东省科学院激光研究所 | 分布式声波传感相干衰落引起的恶化效应消除方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110454687B (zh) | 一种基于改进vmd的管道多点泄漏定位方法 | |
CN116576956A (zh) | 基于分布式光纤声波传感的多源振动信号分离方法 | |
CN106846803B (zh) | 基于音频的交通事件检测装置及方法 | |
CN111044814B (zh) | 一种对变压器直流偏磁异常进行辨识的方法及系统 | |
CN112735473B (zh) | 基于声音识别无人机的方法及系统 | |
CN111724770B (zh) | 一种基于深度卷积生成对抗网络的音频关键词识别方法 | |
CN115188387A (zh) | 一种有效的海洋哺乳动物声音自动检测和分类方法 | |
Pan et al. | Time attention analysis method for vibration pattern recognition of distributed optic fiber sensor | |
CN112052712A (zh) | 一种电力设备状态监测与故障识别方法及系统 | |
Conru et al. | Time-frequency detection using Gabor filter bank and Viterbi based grouping algorithm | |
CN111694053A (zh) | 初至拾取方法及装置 | |
CN114842280A (zh) | 一种基于卷积神经网络的自动识别微地震信号算法 | |
CN111025100A (zh) | 变压器特高频局部放电信号模式识别方法与装置 | |
CN113095113A (zh) | 一种用于水下目标识别的小波线谱特征提取方法及系统 | |
Lin et al. | Research on microseismic denoising method based on CBDNet | |
Park et al. | Pretrained network-based sound event recognition for audio surveillance applications | |
CN117313001B (zh) | 用于分布式光纤声波传感系统的混合事件分解及识别方法 | |
Chen et al. | Coal mine microseismic identification and first-arrival picking based on Conv-LSTM-Unet | |
CN115114953B (zh) | 一种基于循环神经网络的情绪脑信号识别方法 | |
CN116299713B (zh) | 用于三分量地震背景噪声的时频双域p波提取及映射成像方法 | |
CN116222997B (zh) | 基于波束形成及时空网络的托辊故障声源距离估计方法 | |
Fang et al. | A generalized denoising method with an optimized loss function for automated bird sound recognition | |
CN117972372A (zh) | 一种智能化das及其混叠信号定向目标分离方法 | |
CN117688422A (zh) | 基于改进稀疏分量分析的欠定模态参数识别方法、计算机设备及存储介质 | |
CN106878618A (zh) | 一种基于fpga的图像处理系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |