CN114842864A - 一种基于神经网络的短波信道信号分集合并方法 - Google Patents
一种基于神经网络的短波信道信号分集合并方法 Download PDFInfo
- Publication number
- CN114842864A CN114842864A CN202210409128.8A CN202210409128A CN114842864A CN 114842864 A CN114842864 A CN 114842864A CN 202210409128 A CN202210409128 A CN 202210409128A CN 114842864 A CN114842864 A CN 114842864A
- Authority
- CN
- China
- Prior art keywords
- voice
- signal
- amplitude spectrum
- path
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 10
- 230000007246 mechanism Effects 0.000 claims abstract description 8
- 238000001228 spectrum Methods 0.000 claims description 45
- 238000012549 training Methods 0.000 claims description 18
- 238000005562 fading Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 5
- 239000000654 additive Substances 0.000 claims description 5
- 238000003062 neural network model Methods 0.000 claims description 5
- 230000000996 additive effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 abstract description 8
- 230000008569 process Effects 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 12
- 238000012360 testing method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 239000005433 ionosphere Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Radio Transmission System (AREA)
Abstract
该发明公开了一种基于神经网络的短波信道信号分集合并方法,属于信号处理领域。本发明提出将卷积神经网络和注意力机制应用于短波语音信号分集合并方法中,通过卷积神经网络对信息进行压缩和提取,再使用注意力机制对卷积神经网络输出的信息进行逐帧处理,得到每帧对应的权重,使得合并权重能够根据输入信号的特征信息进行动态分配,不需要使用复杂的信噪比估计算法,从而避免了估计信噪比过程中产生的误差;同时本发明能够应用于各种短波分集合并场景,无需对合并方法进行选择,所取得的效果优于传统的分集合并方法。
Description
技术领域
本发明属于通信领域,涉及一种基于神经网络的短波信道信号分集合并方法。
背景技术
无线短波信道通信是一种常见的通信手段,在紧急通信、军事通信以及无线电通信中广泛使用。通过电离层短波信道可以以较低的成本进行长距离的无线通信,因此短波通信具有低成本和高灵活性的特点。但由于短波信道带宽较低,信号经过调制以及上变频后以模拟信号的方式发送,而短波信道具有快速变化、频率选择性的特点,经过长距离的传输后接收到的短波信号质量往往较差,严重影响信号的特征信息。因此,可以利用多路分集接收技术来提高通信系统的接收质量和性能。
多路分集接收技术是两个或两个以上的接收端采用相同或不同的接收方法对同一信号进行接收,利用多路衰落独立的接收信号,对其进行处理,用以提高通信的抗衰落能力。传统的分集合并方式主要包括等增益合并,选择合并和最大比合并这三种方法,等增益合并性能较好且易于实现,但当各支路接收信号之间的质量相差较大时,性能明显下降;选择合并只利用其中一路信号的信息,舍弃了其它支路的有效信息,对信息的利用率较低;最大比合并性能最好但复杂度较高,需要先估计出较为准确的信噪比,这在无先验信息的短波接收语音信号中存在不可避免的误差,且无法确保当前段在每一个时间点均符合此段计算出的信噪比,故合并性能仍有提升空间。
近年来,随着深度学习的快速发展和广泛应用,基于深度学习的信号增强方法成为主要研究方向。目前,信号增强技术通常关注单路接收信号的增强处理,对于多路接收信号的分集合并方法研究较少,因此对多路接收信号的改善有限。
发明内容
本发明针对背景技术的缺陷,创造性地提出了一种基于卷积神经网络和注意力机制的分集合并方法,用于辅助信号增强,引入深度学习完成多路接收信号的分集合并,提高多路短波信号的合并性能。
首先确定发明所适用的多路短波信号通信模型。以短波语音信号为例,发射端获得语音信号样本后,会使用现有的语音增强技术消除背景环境噪声,然后进行SSB调制,并上变频到短波频段发射,发射信号通过短波信道到达远端的接收机,接收机收到多路独立的短波语音信号,对多路信号分别进行下变频和SSB解调后,执行接收信号语音增强,再通过合并网络进行分集合并处理,从而实现本发明的发明目的。
本发明技术方案为一种基于神经网络的短波信道信号分集合并方法,该方法包括神经网络训练阶段和语音合并阶段;
所述神经网络训练阶段方法为:
其中,表示第j路独立的衰落短波信道,*表示卷积,表示第j路独立指定信噪比的加性噪声;将得到的短波语音数据集和纯净语音数据集xtrain分别经过短时傅里叶变换进行特征提取,获得各路短波语音信号的幅度谱数据集和纯净语音的幅度谱数据集|Xtrain|;将各路幅度谱数据集作为合并网络的输入信号,|Xtrain|作为目标,进行合并网络训练,最终获得具有分集合并功能的神经网络模型,由此完成训练;
所述语音合并阶段方法为:
步骤3:将步骤2中的幅度谱按照通道维度进行拼接,作为步骤1中分集合并模型的输入,实现利用更多的语音信息,以此移除信道衰落的部分影响;此外,使用注意力机制结构来计算第j路幅度谱的权重wj,首先对各路幅度谱按照通道维度进行拼接,得到输入Y,对Y的频率维度取均值得到YGAP,再连续使用两个1×1卷积对YGAP进行处理,最终得到各路语音信号对应的合并权重上述两个1×1卷积分别表示为和其中σ是取值范围为(0,1)区间内的常数;
其中,T为总帧数,H为频点维度,t表示第t帧,Ci表示输入通道总数,h表示第h个频点,b表示第b个批次,φ表示线性整流激活函数;最后根据第j路幅度谱拼接前的通道维度大小,来获得各路语音信号对应的合并权重
步骤5:根据步骤3中获得的各路语音信号的合并权重进行逐帧比较,保留当前帧权重wjf最大的语音信号相位谱wjf表示第j路语音信号的第f帧的权重,再将分集合并后的语音幅度谱对应帧的幅度谱与相位谱相乘,从而获得最终的合并语音由此完成两路短波语音信号分集合并。
进一步地,上述使用的神经网络模型包括5层卷积层和2层全连接层,使用每路语音信号的幅度谱作为输入层的输入特征图,使用对应纯净语音的幅度谱作为目标;所述5层卷积层的参数表示为{卷积核大小,卷积层输入通道数,卷积层输出通道数,(卷积横向步长,卷积纵向步长)},第1层参数具体表示为{(5×1),2,64,(2,1)},第2层和第4层参数具体表示为{(3×1),64,64,(2,1)},第5层参数具体表示为{(3×1),64,192,(2,1)};卷积层的输出特征图表示为{特征图尺寸×特征图数量×训练批次大小},五层卷积层依次具体表示为{65×64×200},{33×64×200},{17×64×200},{9×64×200},{5×192×200};所述全连接层的参数表示为{输入特征数,输出特征数},则第1层参数具体表示为{960,192},第2层参数具体表示为{192,129},两个全连接层之间使用PReLU作为激活函数。
本发明的主要特点在于:提出将卷积神经网络和注意力机制应用于短波语音信号分集合并方法中,通过卷积神经网络对信息进行压缩和提取,再使用注意力机制对卷积神经网络输出的信息进行逐帧处理,得到每帧对应的权重,使得合并权重能够根据输入信号的特征信息进行动态分配,不需要使用复杂的信噪比估计算法,从而避免了估计信噪比过程中产生的误差;同时本发明能够应用于各种短波分集合并场景,无需对合并方法进行选择,所取得的效果优于传统的分集合并方法。
附图说明
图1为本发明适用的短波语音通信模型的简化框图;
图2为本发明在接收端的分集合并网络处理流程图;
图3为本发明所用分集合并神经网络结构框架。
具体实施方式
下面结合附图和实施例,详述本发明的技术方案。但不应将此理解为本发明上述主体的范围仅限于以下实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
数据集和仿真参数设置如下:
本发明实施例采用TIMIT数据集对分集合并网络进行训练和测试,该数据集包含了由630名发音人员构成的6300条音频(70%为男性)。选择其中的4620条音频作为训练数据xtrain,另外1680条作为测试数据xtest。
训练数据xtrain添加的噪声类型为短波噪声,指定噪声SNR为-5dB,-4dB,-3dB,-1dB和0dB,每个SNR下的音频数目为1500,即总共9000条音频用于训练。
测试数据xtest所选噪声类型为短波噪声,指定噪声SNR为0dB。
所有音频数据采样率为8kHz,使用汉明窗进行加窗分帧操作,帧长为256样本,帧移为128样本。
卷积神经网络使用adam优化器以1e-3的初始学习率对模型进行训练,每一个小批次(mini-batch)的大小为8,每10个训练周期(epoch)减小一半学习率。
评价指标:语音质量感知指标(Perceptual evaluation of speech quality,PESQ),该指标的量化区间为-0.5~4.5,分数越高,表示语音质量越好。短时客观可懂度(Short-Time Objective Intelligibility,STOI),该指标的量化区间为0~1,可使用百分比的形式表示,分数越高代表语音质量越好。
具体实施例包括以下步骤:
其中,和分别表示两路独立的衰落短波信道,*表示卷积,和表示两路独立指定信噪比的加性噪声。从而获得9000条总时长约为10小时的含有信道衰落的短波语音和以及纯净语音xtrain,将得到的短波语音数据集和和纯净语音数据集xtrain分别经过短时傅里叶变换进行特征提取,获得两路短波语音信号的幅度谱数据集和和纯净语音的幅度谱数据集|Xtrain|;将和作为合并网络的输入信号,|Xtrain|作为目标,进行合并网络训练,最终获得具有分集合并功能的神经网络模型,由此完成训练;
步骤3:将步骤1所获得的分集合并网络模型处理步骤2所获得的待增强短波语音信息幅度谱和作为输入信号,实现利用更多的语音信息,以此移除信道衰落的部分影响;此外,使用注意力机制结构来计算权重w,首先对幅度谱和按照第2个维度进行拼接,得到输入Y,对Y的每个频率维度取均值得到YGAP∈RB×C×1×T,再连续使用两个1×1卷积对YGAP进行处理,最终得到通道分支参数z(CH)∈RB×C×1×T,所述的两个卷积分别表示为和其中σ是取值范围为(0,1)区间内的常数。
其中,T为总帧数,H为频点维度,t表示第t帧,h表示第h个频点,b表示第b个批次,φ表示线性整流激活函数,将z(CH)沿着第2个维度复制H次,规整后的形式为最后根据幅度谱和拼接前的第2个维度的大小,来获得两路语音信号对应的合并权重w1和w2;
步骤5:根据步骤3中获得的两路语音信号的每帧的合并权重w1和w2,进行逐帧比较,保留当前帧权重w最大的语音信号相位谱再将分集合并后的语音幅度谱对应帧的幅度谱与相位谱相乘,从而获得最终的合并语音由此完成两路短波语音信号分集合并。
与本发明的方法对比的有:。
表1
实验对比结果表示,本发明相比等增益分集合并算法,语音质量有着较为明显的提升。
Claims (2)
1.一种基于神经网络的短波信道信号分集合并方法,该方法包括神经网络训练阶段和语音合并阶段;
所述神经网络训练阶段方法为:
其中,表示第j路独立的衰落短波信道,*表示卷积,表示第j路独立指定信噪比的加性噪声;将得到的短波语音数据集和纯净语音数据集xtrain分别经过短时傅里叶变换进行特征提取,获得各路短波语音信号的幅度谱数据集和纯净语音的幅度谱数据集|Xtrain|;将各路幅度谱数据集作为合并网络的输入信号,|Xtrain|作为目标,进行合并网络训练,最终获得具有分集合并功能的神经网络模型,由此完成训练;
所述语音合并阶段方法为:
步骤3:将步骤2中的幅度谱按照通道维度进行拼接,作为步骤1中分集合并模型的输入,实现利用更多的语音信息,以此移除信道衰落的部分影响;此外,使用注意力机制结构来计算第j路幅度谱的权重wj,首先对各路幅度谱按照通道维度进行拼接,得到输入Y,对Y的频率维度取均值得到YGAP,再连续使用两个1×1卷积对YGAP进行处理,最终得到各路语音信号对应的合并权重上述两个1×1卷积分别表示为和其中σ是取值范围为(0,1)区间内的常数;
其中,T为总帧数,H为频点维度,t表示第t帧,Ci表示输入通道总数,h表示第h个频点,b表示第b个批次,φ表示线性整流激活函数;最后根据第j路幅度谱拼接前的通道维度大小,来获得各路语音信号对应的合并权重
2.如权利要求1所述的一种基于神经网络的短波信道信号分集合并方法,其特征在于,所述神经网络模型包括5层卷积层和2层全连接层,使用每路语音信号的幅度谱作为输入层的输入特征图,使用对应纯净语音的幅度谱作为目标;所述5层卷积层的参数表示为{卷积核大小,卷积层输入通道数,卷积层输出通道数,(卷积横向步长,卷积纵向步长)},第1层参数具体表示为{(5×1),2,64,(2,1)},第2层和第4层参数具体表示为{(3×1),64,64,(2,1)},第5层参数具体表示为{(3×1),64,192,(2,1)};卷积层的输出特征图表示为{特征图尺寸×特征图数量×训练批次大小},五层卷积层依次具体表示为{65×64×200},{33×64×200},{17×64×200},{9×64×200},{5×192×200};所述全连接层的参数表示为{输入特征数,输出特征数},则第1层参数具体表示为{960,192},第2层参数具体表示为{192,129},两个全连接层之间使用PReLU作为激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210409128.8A CN114842864B (zh) | 2022-04-19 | 2022-04-19 | 一种基于神经网络的短波信道信号分集合并方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210409128.8A CN114842864B (zh) | 2022-04-19 | 2022-04-19 | 一种基于神经网络的短波信道信号分集合并方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114842864A true CN114842864A (zh) | 2022-08-02 |
CN114842864B CN114842864B (zh) | 2023-05-23 |
Family
ID=82565541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210409128.8A Active CN114842864B (zh) | 2022-04-19 | 2022-04-19 | 一种基于神经网络的短波信道信号分集合并方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114842864B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2889804A1 (en) * | 2013-12-30 | 2015-07-01 | Alcatel Lucent | Systems and methods for contactless speech recognition |
US20180261225A1 (en) * | 2017-03-13 | 2018-09-13 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for Multichannel End-to-End Speech Recognition |
CN109147759A (zh) * | 2018-10-09 | 2019-01-04 | 电子科技大学 | 一种基于打分算法的短波话音信号分集合并接收方法 |
WO2021013345A1 (en) * | 2019-07-24 | 2021-01-28 | Huawei Technologies Co., Ltd. | Audio processing apparatus and method for denoising a multi-channel audio signal |
CN112634927A (zh) * | 2020-12-03 | 2021-04-09 | 电子科技大学 | 一种短波信道语音增强方法 |
CN112634926A (zh) * | 2020-11-24 | 2021-04-09 | 电子科技大学 | 一种基于卷积神经网络的短波信道语音抗衰落辅助增强方法 |
CN112992121A (zh) * | 2021-03-01 | 2021-06-18 | 德鲁动力科技(成都)有限公司 | 基于注意力残差学习的语音增强方法 |
CN113160839A (zh) * | 2021-04-16 | 2021-07-23 | 电子科技大学 | 一种基于自适应注意力机制和渐进式学习的单声道语音增强方法 |
US20210256386A1 (en) * | 2020-02-13 | 2021-08-19 | Soundhound, Inc. | Neural acoustic model |
KR102316712B1 (ko) * | 2021-01-21 | 2021-10-22 | 한양대학교 산학협력단 | 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치 |
CN113936680A (zh) * | 2021-10-08 | 2022-01-14 | 电子科技大学 | 基于多尺度信息感知卷积神经网络的单通道语音增强方法 |
CN113936679A (zh) * | 2021-09-23 | 2022-01-14 | 电子科技大学 | 一种基于信息蒸馏与聚合的低信噪比语音增强方法 |
CN114144790A (zh) * | 2020-06-12 | 2022-03-04 | 百度时代网络技术(北京)有限公司 | 具有三维骨架正则化和表示性身体姿势的个性化语音到视频 |
-
2022
- 2022-04-19 CN CN202210409128.8A patent/CN114842864B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2889804A1 (en) * | 2013-12-30 | 2015-07-01 | Alcatel Lucent | Systems and methods for contactless speech recognition |
US20180261225A1 (en) * | 2017-03-13 | 2018-09-13 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for Multichannel End-to-End Speech Recognition |
CN109147759A (zh) * | 2018-10-09 | 2019-01-04 | 电子科技大学 | 一种基于打分算法的短波话音信号分集合并接收方法 |
WO2021013345A1 (en) * | 2019-07-24 | 2021-01-28 | Huawei Technologies Co., Ltd. | Audio processing apparatus and method for denoising a multi-channel audio signal |
US20210256386A1 (en) * | 2020-02-13 | 2021-08-19 | Soundhound, Inc. | Neural acoustic model |
CN114144790A (zh) * | 2020-06-12 | 2022-03-04 | 百度时代网络技术(北京)有限公司 | 具有三维骨架正则化和表示性身体姿势的个性化语音到视频 |
CN112634926A (zh) * | 2020-11-24 | 2021-04-09 | 电子科技大学 | 一种基于卷积神经网络的短波信道语音抗衰落辅助增强方法 |
CN112634927A (zh) * | 2020-12-03 | 2021-04-09 | 电子科技大学 | 一种短波信道语音增强方法 |
KR102316712B1 (ko) * | 2021-01-21 | 2021-10-22 | 한양대학교 산학협력단 | 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치 |
CN112992121A (zh) * | 2021-03-01 | 2021-06-18 | 德鲁动力科技(成都)有限公司 | 基于注意力残差学习的语音增强方法 |
CN113160839A (zh) * | 2021-04-16 | 2021-07-23 | 电子科技大学 | 一种基于自适应注意力机制和渐进式学习的单声道语音增强方法 |
CN113936679A (zh) * | 2021-09-23 | 2022-01-14 | 电子科技大学 | 一种基于信息蒸馏与聚合的低信噪比语音增强方法 |
CN113936680A (zh) * | 2021-10-08 | 2022-01-14 | 电子科技大学 | 基于多尺度信息感知卷积神经网络的单通道语音增强方法 |
Non-Patent Citations (1)
Title |
---|
蒯红权 等: "基于注意力机制的深度循环神经网络的语音情感识别", 电子器件 * |
Also Published As
Publication number | Publication date |
---|---|
CN114842864B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100304666B1 (ko) | 음성 향상 방법 | |
CN108735213A (zh) | 一种基于相位补偿的语音增强方法及系统 | |
US8804980B2 (en) | Signal processing method and apparatus, and recording medium in which a signal processing program is recorded | |
CN112634926B (zh) | 一种基于卷积神经网络的短波信道语音抗衰落辅助增强方法 | |
CN102484626B (zh) | 用于精确的信道探测的分级调制 | |
CN102549659A (zh) | 抑制音频信号中的噪声 | |
CN108701465A (zh) | 音频信号解码 | |
CN102576542A (zh) | 从窄频带信号确定上频带信号 | |
JP2001320344A (ja) | チャネル推定を用いるクラスタ化されたofdm | |
JP2000513180A (ja) | 通信システムにおける信号対ノイズ込み干渉電力比(sinr)を決定する方法およびシステム | |
WO2005029875A3 (en) | Digital convertible radio snr optimization | |
CN107680609A (zh) | 一种基于噪声功率谱密度的双通道语音增强方法 | |
CN107863099A (zh) | 一种新型双麦克风语音检测和增强方法 | |
CN114242099A (zh) | 基于改进相位谱补偿和全卷积神经网络的语音增强算法 | |
CN112634927B (zh) | 一种短波信道语音增强方法 | |
CN107294616A (zh) | 基于基扩展模型的双扩展水声信道多普勒分集通信方法 | |
CN104981870A (zh) | 声音增强装置 | |
CN112786064A (zh) | 一种端到端的骨气导语音联合增强方法 | |
CN104616665B (zh) | 基于语音类似度的混音方法 | |
US7308232B2 (en) | Method and apparatus for estimating a channel based on channel statistics | |
CN114842864A (zh) | 一种基于神经网络的短波信道信号分集合并方法 | |
CN110233687B (zh) | 一种多路数据信号联合判决检测方法 | |
CN114785645B (zh) | 基于CP-Free MIMO-OFDM信号循环平稳特性的盲信噪比估计方法 | |
US20080219473A1 (en) | Signal processing method, apparatus and program | |
CN110444228B (zh) | 一种短波接收方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |