CN111341342A - 基于环境声分离的车载语音提取方法及系统 - Google Patents
基于环境声分离的车载语音提取方法及系统 Download PDFInfo
- Publication number
- CN111341342A CN111341342A CN202010087309.4A CN202010087309A CN111341342A CN 111341342 A CN111341342 A CN 111341342A CN 202010087309 A CN202010087309 A CN 202010087309A CN 111341342 A CN111341342 A CN 111341342A
- Authority
- CN
- China
- Prior art keywords
- signal
- sound
- decomposed
- vehicle
- eigenmode function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 29
- 238000000605 extraction Methods 0.000 title claims abstract description 22
- 230000007613 environmental effect Effects 0.000 title claims abstract description 18
- 230000005236 sound signal Effects 0.000 claims abstract description 88
- 238000000034 method Methods 0.000 claims abstract description 34
- 230000006870 function Effects 0.000 claims description 65
- 238000000354 decomposition reaction Methods 0.000 claims description 30
- 238000012935 Averaging Methods 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 abstract description 17
- 230000002596 correlated effect Effects 0.000 abstract description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供了一种基于环境声分离的车载语音提取方法及系统,包括如下步骤:将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。本发明中通过将声音信号进行分解生成多个本征模态函数分量,然后多个声源对应的原始声音信号进行关联,经与所述语音相关联的本征模态函数分量进行重构生成目标语音信号,从而实现语音的准确分离。
Description
技术领域
本发明涉及信号处理领域,具体地,涉及基于环境声分离的车载语音提取方法及系统。
背景技术
生活中噪声无处不在,语音分离的目的是要从含有噪声的信号中将需要的声音分离出来,进而提高其质量。因此语音分离可广泛应用于助听器、移动通讯等领域。
人类的听力系统可以在复杂的噪声环境下,轻松地区分出感兴趣的语音,屏蔽掉周围的噪声,但是随着计算机飞速的发展以及生活水平的提高,人们希望移动通讯里的声音越来越清楚,戴有助听器的人们也能清楚的听见想要听的声音,此时就需要机器也能拥有像人一样的语音分离的能力。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于环境声分离的车载语音提取方法及系统。
根据本发明提供的基于环境声分离的车载语音提取方法,包括如下步骤:
步骤S1:将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
步骤S2:将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
步骤S3:将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
优选地,在步骤S2在将所述本征模态函数分量与多个声源对应的声音信号进行关联时生成相关系数,所述相关系数表征本征模态函数分量与声音信号的相似度;
将所述本征模态函数分量与其对应的最大相关系数的声音信号进行关联。
优选地,所述步骤S1具体为:通过变分模态分解方法和瞬时频率均值法对经由A/D模数转换器和DSP处理后的待分解声音信号进行分解。
优选地,所述变分模态分解方法用于对待分解声音信号通过迭代搜寻变分模型的最优解来实现对于待分解声音信号的自适应分解,分解出本征模态函数分量。
优选地,所述瞬时频率均值法用于计算本征模态函数分量的数目k;
当对待分解声音信号通过变分模态分解方法进行预分解时,当瞬时频率均值减小时确定k值。
优选地,所述待分解声音信号对应的语音模拟信号通过设置在汽车厢内、汽车发动机旁以及汽车前窗玻璃下侧的传感器采集。
优选地,所述待分解声音信号为离散的数字信号;所述A/D模数转换器,用于将所述语音模拟信号转换成待分解声音信号;
通过DSP中TMS320VC5402芯片对待分解声音信号进行存储器的读写操作。
优选地,所述变分模态分解方法具体为将输入的待分解声音信号f1分解成为若干本征模态函数(Intrinsic Mode Function,IMF)分量uk,所述本征模态函数分量包括待分解声音信号的局部特征信号,并定义成带宽受限的调幅调频信号,用公式(1)表示为:
设uk(t)具有中心频率和有限带宽,约束条件为每个本征模态函数分量的估计带宽最小,且所有本征模态函数分量之和等于输入信号,则约束模型表示为
式中,k表示本征模态函数分量的数量,f为输入信号,{uk}={u1,u2,u3,…,uk}表示分解得到的k个有限带宽的本征模态函数分量,{wk}={w1,w2,w3,…wk}表示各个本征模态函数分量的中心频率,j为虚数单位,δ(t)为冲激函数,为对t求偏导。
优选地,所述瞬时频率均值法的实施步骤为:
对所述待分解声音信号进行变换:
式中,PV表示柯西主值,X(τ)与Y(t)互为共轭,X(τ)是经过对待分解声音信号f1进行希尔伯特(Hibert)变换得到的,Y(t)为利用柯西主值得到的与X(τ)互为共轭关系的反变换,τ为变量,c(τ)为待解声音信号f1,X(τ)为将X(t)带入值,t为时间;
通过X(t)、Y(t)得到新的时间序列Z(t):
Z(t)=X(t)+Y(t)j=a(t)eθ(t)j (7)
式中a(t)为瞬时幅值,θ(t)表示相位,j为虚数单位;
计算瞬时频率均值:
瞬时频率f(t)计算公式为
得到瞬时频率均值RESF
本发明提供的基于环境声分离的车载语音提取系统,包括如下模块:
信号分解模块,用于将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
信号关联模块,用于将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
信号重构模块,用于将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
与现有技术相比,本发明具有如下的有益效果:
本发明中通过将声音信号进行分解生成多个本征模态函数分量,然后多个声源对应的原始声音信号进行关联,经与所述语音相关联的本征模态函数分量进行重构生成目标语音信号,从而实现语音的准确分离。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例中待分解声音信号采集的工作流程图;
图2为本发明实施例中汽车安装上传感器的示意图;
图3为本发明实施例中对语音模拟信号预处理的流程图;
图4为本发明实施例中本征模态函数分量的数目选取的步骤流程图;
图5为本发明实施例中待分解声音信号进行分解的步骤流程图;
图6为本发明实施例中基于环境声分离的车载语音提取方法的步骤流程图;
图7为本发明实施例中基于环境声分离的车载语音提取系统的模块示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
图1为本发明实施例中待分解声音信号采集的工作流程图,如图1所示,首先尽可能多地收集语音,携带语音坐在车上,在不同的车载环境下播放并再次收集语音,为训练做好准备。其中,不同车载环境分别指的是:汽车启动但并未出发、汽车出发后平稳行驶并且车内无其他声音、汽车平稳行驶并且车内有其他声音(例如聊天声音、车载广播声音等)、汽车出发后刹车、汽车停车。
图6为本发明实施例中基于环境声分离的车载语音提取方法的步骤流程图,如图6所示,本发明提供的基于环境声分离的车载语音提取方法,包括如下步骤:
步骤S1:对于预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
步骤S2:将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
步骤S3:将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
在本发明一实施例中,在步骤S2在将所述本征模态函数分量与多个声源对应的声音信号进行关联时生成相关系数,所述相关系数表征本征模态函数分量与声音信号的相似度;
将所述本征模态函数分量与其对应的最大相关系数的声音信号进行关联。
在本发明一实施例中,所述步骤S1具体为:通过变分模态分解方法和瞬时频率均值法对经由A/D模数转换器和DSP处理后的待分解声音信号进行分解。
在本发明一实施例中,所述变分模态分解方法用于对待分解声音信号通过迭代搜寻变分模型的最优解来实现对于待分解声音信号的自适应分解,分解出本征模态函数分量。
在本发明实施例在,所述变分模态分解方法(VMD)采用循环筛分剥离的方式处理待分解声音信号,将待分解声音信号的分解过程转移到变分框架里,通过迭代搜寻变分模型的最优解来实现对于待分解声音信号进行自适应分解,分解出各个声音片段,以便于后续对语音信号的处理。
所述变分模态分解方法的实质是将输入的待分解声音信号f1分解成为若干本征模态函数(Intrinsic Mode Function,IMF)分量uk,IMF分量包含原待分解声音信号的局部特征信号,并定义成带宽受限的调幅-调频(AM-FM)信号,用公式(1)表示为:
设uk(t)具有中心频率和有限带宽,约束条件为每个IMF分量的估计带宽最小,且所有IMF分量之和等于输入信号,则约束模型表示为
式中,k表示IMF分量的数量,f为输入信号,{uk}={u1,u2,u3,…,uk}表示分解得到的k个有限带宽的IMF分量,{wk}={w1,w2,w3,…wk}表示各个IMF分量的中心频率,j为虚数单位,δ(t)为冲激函数,为对t求偏导。
为了解决(2)式的约束性变分问题,引入惩罚因子α和Lagrange算子λ(t),将式(2)变为非约束性变分问题,得到扩展的Lagrange表达式L({uk},{wk},λ)为:
式中,α为惩罚参数,λ(t)为Lagrange算子,δ(t)为冲激函数,f(t)为原信号,利用交替方向乘子算法交替更新各IMF分量及中心频率,可求得上式增广拉格朗日函数的鞍点,即为所求问题的最优解,从而实现对待分解声音信号的分解。
其中,对于模态信号uk和中心频率ωk的更新,采用公式(4)(5):
式中,ω表示模态的中心频率;相当于当前剩余量的维纳滤波,f(ω)为实部为f(t)经过傅里叶变换得到的,为实部为ui(t)经过傅里叶变换得到的,ui(t)为中k=i时的状态,为实部为λ(t)经过傅里叶变换得到的;为当前模态函数功能谱的重心;是实部为uk(t)经过傅里叶变换得到的,n为迭代过程。
在本发明实施例中,所述瞬时频率均值法用于计算本征模态函数分量的数目k;
通过对待分解声音信号通过变分模态分解方法进行预分解,当瞬时频率均值减小时确定k值。
由于VMD方法分解待分解声音信号f1时,k值过小会出现欠分解现象,而k值过大会有过分解现象,会导致瞬时频率断断续续,因此k值的选取至关重要,本发明实施例中采用瞬时频率均值法确定k值。所述瞬时频率均值法的实施步骤为:
(1)对所述待分解声音信号正反变换
式中,PV表示柯西主值,X(τ)与Y(t)互为共轭,X(τ)是经过对待分解声音信号f1进行希尔伯特(Hibert)变换得到的,Y(t)为利用柯西主值得到的与X(τ)互为共轭关系的反变换,τ为变量,c(τ)为待解声音信号f1,X(τ)为将X(t)带入值,t为时间;
(2)利用X(t)、Y(t)得到新的时间序列Z(t)
Z(t)=X(t)+Y(t)j=a(t)eθ(t)j (7)
式中a(t)为瞬时幅值,θ(t)表示相位,j为虚数单位
(3)计算瞬时频率均值
瞬时频率f(t)计算公式为
得到瞬时频率均值RESF
为判断环境声分离的准确性,本发明实施例中采用求解互相关系数作为依据,互相关系数法能够定量的表示两个变量之间的相互依赖程度,计算每个IMF分量与原始对应信号的互相关系数ρxy,用到的公式是:
图4为本发明实施例中本征模态函数分量的数目选取的步骤流程图,如图4所示,首先对待分解声音信号f1进行预分解,令k从小到大取值,初始化k=2,惩罚因子α和带宽使用默认值,即α=2000,τ=1e-7;然后对各IMF分量进行希尔伯特变换(Hibert Transform),再求出瞬时频率均值;最后比较各瞬时频率均值,当出现明显减小时所对应的k值就是所要求解的模态数目。
在本发明实施例中,所述待分解声音信号对应的语音模拟信号通过设置在汽车厢内、汽车发动机旁以及汽车前窗玻璃下侧的传感器采集。
图2为本发明实施例中汽车安装上传感器的示意图,如图2所示,在汽车厢内安装传感器s1,用来录制车厢内的声音,包括人说话声音、车载广播声音等;在汽车发动机旁安装传感器s2,用来录制汽车发动机的声音;在汽车前窗玻璃下侧安装传感器s3,用来录制环境声。
在本发明实施例中,所述待分解声音信号为离散的数字信号;所述A/D模数转换器,用于将所述语音模拟信号转换成待分解声音信号;
通过DSP中TMS320VC5402芯片对待分解声音信号进行存储器的读写操作。
所述A/D模数转换器是一个将模拟信号转变为数字信号的元件,采样频率可以是8K,16K,…,采样频率最高到500K,最理想的采样频率是44.1K,本发明实施例中采用型号为TLC320AD50C的芯片,可以同时进行接收和发送任务。
所述TMS320VC5402芯片编程实现对存储器的读写功能,次芯片包含在DSPC5000系列中,属于定点DSP,主要适用于通信、IP、助听器等相关产品,此系列低功耗、小封装,处理速度一般在80MIPS-400MIPS。
图3为本发明实施例中对语音模拟信号预处理的流程图;如图3所示,将待分解声音信号通过A/D转换器和DSP进行预处理过程。将传感器s1、将传感器s2、将传感器s3录制的声音以及图1中语音声音首先经过A/D模数转换器处理,将语音模拟信号转换成离散的数字信号,存储在flash存储器中;DSP主要通过外部存储器接口来访问片外存储器。所述TMS320VC5402芯片的PS和DS引脚通过逻辑开关来分别控制flash和sram的使能端,由RW和MSTRB来控制位通过逻辑电路分别控制读和写,通过编程来完成具体的功能。
图5为本发明实施例中待分解声音信号进行分解的步骤流程图,如图5所示,在求得k后,利用VMD方法将输入的待分解声音信号f1分解成为若干个本征模态函数IMF分量uk,然后通过迭代的方法计算变分模型的最优解从而确定每个IMF的中心频率(带宽),从而实现分离原始信号成为k个IMF分量的目的。最后对含有不同信号的IMF分量进行重组,成为u1,…,uk这k个信号,也就完成了分离信号的任务。
将上述处理后的信号u1,…,uk分别与图3中的语音、传感器s2录制的发动机语音信号、传感器s3录制的环境声信号预处理后的信号分别做互相关,得出互相关系数,比较相关系数,相关系数越大,说明相似度高,可以确定各分离信号的所属类型,并提取出与其语音相关的IMF分量重构语音信号。
图7为本发明实施例中基于环境声分离的车载语音提取系统的模块示意图,如图7所示,本发明提供的基于环境声分离的车载语音提取系统,包括如下模块:
信号分解模块,用于将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
信号关联模块,用于将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
信号重构模块,用于将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
在本发明实施例中,采用VMD算法常用到故障诊断问题中,是在经验模态分解(EMD)以及集合经验模态分解(EEMD)的基础上提出的,很好的解决了模态混叠现象,分解方式也由EMD以及EEMD的递归分解变为VMD的迭代求解,来实现信号的自适应分解,表现出较好的鲁棒性。
本发明实施中分离车载语音环境声音,是希望可以通过VMD算法以及瞬间频率均值法来分离出人声、汽车发动机的声音以及其他声音,以便可以用于其他领域,比如根据汽车发动机的声音来判断汽车的故障所在,或者根据分离出来的车载空调的声音判断汽车的空调制冷效果等等。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (10)
1.一种基于环境声分离的车载语音提取方法,其特征在于,包括如下步骤:
步骤S1:将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
步骤S2:将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
步骤S3:将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
2.根据权利要求1所述的基于环境声分离的车载语音提取方法,其特征在于,在步骤S2在将所述本征模态函数分量与多个声源对应的声音信号进行关联时生成相关系数,所述相关系数表征本征模态函数分量与声音信号的相似度;
将所述本征模态函数分量与其对应的最大相关系数的声音信号进行关联。
3.根据权利要求1所述的基于环境声分离的车载语音提取方法,其特征在于,所述步骤S1具体为:通过变分模态分解方法和瞬时频率均值法对经由A/D模数转换器和DSP处理后的待分解声音信号进行分解。
4.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述变分模态分解方法用于对待分解声音信号通过迭代搜寻变分模型的最优解来实现对于待分解声音信号的自适应分解,分解出本征模态函数分量。
5.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述瞬时频率均值法用于计算本征模态函数分量的数目k;
当对待分解声音信号通过变分模态分解方法进行预分解时,当瞬时频率均值减小时确定k值。
6.根据权利要求1所述的基于环境声分离的车载语音提取方法,其特征在于,所述待分解声音信号对应的语音模拟信号通过设置在汽车厢内、汽车发动机旁以及汽车前窗玻璃下侧的传感器采集。
7.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述待分解声音信号为离散的数字信号;所述A/D模数转换器,用于将所述语音模拟信号转换成待分解声音信号;
通过DSP中TMS320VC5402芯片对待分解声音信号进行存储器的读写操作。
8.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述变分模态分解方法具体为将输入的待分解声音信号f1分解成为若干本征模态函数(IntrinsicMode Function,IMF)分量uk,所述本征模态函数分量包括待分解声音信号的局部特征信号,并定义成带宽受限的调幅调频信号,用公式(1)表示为:
设uk(t)具有中心频率和有限带宽,约束条件为每个本征模态函数分量的估计带宽最小,且所有本征模态函数分量之和等于输入信号,则约束模型表示为
9.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述瞬时频率均值法的实施步骤为:
对所述待分解声音信号进行变换:
式中,PV表示柯西主值,X(τ)与Y(t)互为共轭,X(τ)是经过对待分解声音信号f1进行希尔伯特(Hibert)变换得到的,Y(t)为利用柯西主值得到的与X(τ)互为共轭关系的反变换,τ为变量,c(τ)为待解声音信号f1,X(τ)为将X(t)带入值,t为时间;
通过X(t)、Y(t)得到新的时间序列Z(t):
Z(t)=X(t)+Y(t)j=a(t)eθ(t)j (7)
式中a(t)为瞬时幅值,θ(t)表示相位,j为虚数单位;
计算瞬时频率均值:
瞬时频率f(t)计算公式为
得到瞬时频率均值RESF
10.一种基于环境声分离的车载语音提取系统,其特征在于,包括如下模块:
信号分解模块,用于将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
信号关联模块,用于将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
信号重构模块,用于将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010087309.4A CN111341342A (zh) | 2020-02-11 | 2020-02-11 | 基于环境声分离的车载语音提取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010087309.4A CN111341342A (zh) | 2020-02-11 | 2020-02-11 | 基于环境声分离的车载语音提取方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111341342A true CN111341342A (zh) | 2020-06-26 |
Family
ID=71182151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010087309.4A Pending CN111341342A (zh) | 2020-02-11 | 2020-02-11 | 基于环境声分离的车载语音提取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111341342A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3301461A1 (en) * | 2016-09-28 | 2018-04-04 | Siemens Aktiengesellschaft | Method for detection of harmonics of a univariate signal |
CN108574906A (zh) * | 2017-03-09 | 2018-09-25 | 比亚迪股份有限公司 | 用于汽车的声音处理方法、系统和汽车 |
CN108597540A (zh) * | 2018-04-11 | 2018-09-28 | 南京信息工程大学 | 一种基于变分模态分解和极限学习机的语音情感识别方法 |
CN109087631A (zh) * | 2018-08-08 | 2018-12-25 | 北京航空航天大学 | 一种适于复杂环境的车辆智能语音控制系统及其构建方法 |
CN109410977A (zh) * | 2018-12-19 | 2019-03-01 | 东南大学 | 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法 |
CN109785854A (zh) * | 2019-01-21 | 2019-05-21 | 福州大学 | 一种经验模态分解和小波阈值去噪相结合的语音增强方法 |
CN110459234A (zh) * | 2019-08-15 | 2019-11-15 | 苏州思必驰信息科技有限公司 | 用于车载的语音识别方法及系统 |
CN110517701A (zh) * | 2019-07-25 | 2019-11-29 | 华南理工大学 | 一种麦克风阵列语音增强方法及实现装置 |
-
2020
- 2020-02-11 CN CN202010087309.4A patent/CN111341342A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3301461A1 (en) * | 2016-09-28 | 2018-04-04 | Siemens Aktiengesellschaft | Method for detection of harmonics of a univariate signal |
CN108574906A (zh) * | 2017-03-09 | 2018-09-25 | 比亚迪股份有限公司 | 用于汽车的声音处理方法、系统和汽车 |
CN108597540A (zh) * | 2018-04-11 | 2018-09-28 | 南京信息工程大学 | 一种基于变分模态分解和极限学习机的语音情感识别方法 |
CN109087631A (zh) * | 2018-08-08 | 2018-12-25 | 北京航空航天大学 | 一种适于复杂环境的车辆智能语音控制系统及其构建方法 |
CN109410977A (zh) * | 2018-12-19 | 2019-03-01 | 东南大学 | 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法 |
CN109785854A (zh) * | 2019-01-21 | 2019-05-21 | 福州大学 | 一种经验模态分解和小波阈值去噪相结合的语音增强方法 |
CN110517701A (zh) * | 2019-07-25 | 2019-11-29 | 华南理工大学 | 一种麦克风阵列语音增强方法及实现装置 |
CN110459234A (zh) * | 2019-08-15 | 2019-11-15 | 苏州思必驰信息科技有限公司 | 用于车载的语音识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
李晶皎等: "基于EEMD和ICA的语音去噪方法", 《东北大学学报(自然科学版)》 * |
李晶皎等: "基于EEMD和ICA的语音去噪方法", 《东北大学学报(自然科学版)》, no. 11, 15 November 2011 (2011-11-15), pages 1554 - 1557 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Two heads are better than one: A two-stage complex spectral mapping approach for monaural speech enhancement | |
CN110197670B (zh) | 音频降噪方法、装置及电子设备 | |
CN107068161B (zh) | 基于人工智能的语音降噪方法、装置和计算机设备 | |
CN110600059B (zh) | 声学事件检测方法、装置、电子设备及存储介质 | |
CN108335694B (zh) | 远场环境噪声处理方法、装置、设备和存储介质 | |
MXPA04011033A (es) | Metodo y aparato para el mejoramiento de dialogo multisensorial. | |
US20170213550A1 (en) | Adaptive dual collaborative kalman filtering for vehicular audio enhancement | |
CN112149498B (zh) | 一种面向汽车复杂部件异响的在线智能识别系统及方法 | |
CN113674763B (zh) | 利用线谱特性的鸣笛声识别方法及系统、设备与存储介质 | |
CN112216300A (zh) | 用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车 | |
CN114333865A (zh) | 一种模型训练以及音色转换方法、装置、设备及介质 | |
CN112002341B (zh) | 语音信号的参数化表达、加密传输和重构的方法 | |
Ashraf et al. | Underwater ambient-noise removing GAN based on magnitude and phase spectra | |
US20060009968A1 (en) | Unified treatment of resolved and unresolved harmonics | |
US7877252B2 (en) | Automatic speech recognition method and apparatus, using non-linear envelope detection of signal power spectra | |
CN113782011B (zh) | 频带增益模型的训练方法及用于车载场景的语音降噪方法 | |
CN114189781A (zh) | 双麦神经网络降噪耳机的降噪方法及系统 | |
CN118118626A (zh) | 一种用于触摸液晶显示屏的生产监控系统 | |
CN111341342A (zh) | 基于环境声分离的车载语音提取方法及系统 | |
CN113658607A (zh) | 基于数据增强和卷积循环神经网络的环境声音分类方法 | |
CN107919136B (zh) | 一种基于高斯混合模型的数字语音采样频率估计方法 | |
CN111028857A (zh) | 基于深度学习的多通道音视频会议降噪的方法及系统 | |
JP3510458B2 (ja) | 音声認識システムおよび音声認識制御プログラムを記録した記録媒体 | |
JP2003271166A (ja) | 入力信号処理方法および入力信号処理装置 | |
CN108574911B (zh) | 一种无监督单传声器语音降噪方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200626 |
|
RJ01 | Rejection of invention patent application after publication |