CN111341342A - 基于环境声分离的车载语音提取方法及系统 - Google Patents

基于环境声分离的车载语音提取方法及系统 Download PDF

Info

Publication number
CN111341342A
CN111341342A CN202010087309.4A CN202010087309A CN111341342A CN 111341342 A CN111341342 A CN 111341342A CN 202010087309 A CN202010087309 A CN 202010087309A CN 111341342 A CN111341342 A CN 111341342A
Authority
CN
China
Prior art keywords
signal
sound
decomposed
vehicle
eigenmode function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010087309.4A
Other languages
English (en)
Inventor
沈希忠
刘爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Technology
Original Assignee
Shanghai Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Technology filed Critical Shanghai Institute of Technology
Priority to CN202010087309.4A priority Critical patent/CN111341342A/zh
Publication of CN111341342A publication Critical patent/CN111341342A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种基于环境声分离的车载语音提取方法及系统,包括如下步骤:将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。本发明中通过将声音信号进行分解生成多个本征模态函数分量,然后多个声源对应的原始声音信号进行关联,经与所述语音相关联的本征模态函数分量进行重构生成目标语音信号,从而实现语音的准确分离。

Description

基于环境声分离的车载语音提取方法及系统
技术领域
本发明涉及信号处理领域,具体地,涉及基于环境声分离的车载语音提取方法及系统。
背景技术
生活中噪声无处不在,语音分离的目的是要从含有噪声的信号中将需要的声音分离出来,进而提高其质量。因此语音分离可广泛应用于助听器、移动通讯等领域。
人类的听力系统可以在复杂的噪声环境下,轻松地区分出感兴趣的语音,屏蔽掉周围的噪声,但是随着计算机飞速的发展以及生活水平的提高,人们希望移动通讯里的声音越来越清楚,戴有助听器的人们也能清楚的听见想要听的声音,此时就需要机器也能拥有像人一样的语音分离的能力。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于环境声分离的车载语音提取方法及系统。
根据本发明提供的基于环境声分离的车载语音提取方法,包括如下步骤:
步骤S1:将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
步骤S2:将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
步骤S3:将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
优选地,在步骤S2在将所述本征模态函数分量与多个声源对应的声音信号进行关联时生成相关系数,所述相关系数表征本征模态函数分量与声音信号的相似度;
将所述本征模态函数分量与其对应的最大相关系数的声音信号进行关联。
优选地,所述步骤S1具体为:通过变分模态分解方法和瞬时频率均值法对经由A/D模数转换器和DSP处理后的待分解声音信号进行分解。
优选地,所述变分模态分解方法用于对待分解声音信号通过迭代搜寻变分模型的最优解来实现对于待分解声音信号的自适应分解,分解出本征模态函数分量。
优选地,所述瞬时频率均值法用于计算本征模态函数分量的数目k;
当对待分解声音信号通过变分模态分解方法进行预分解时,当瞬时频率均值减小时确定k值。
优选地,所述待分解声音信号对应的语音模拟信号通过设置在汽车厢内、汽车发动机旁以及汽车前窗玻璃下侧的传感器采集。
优选地,所述待分解声音信号为离散的数字信号;所述A/D模数转换器,用于将所述语音模拟信号转换成待分解声音信号;
通过DSP中TMS320VC5402芯片对待分解声音信号进行存储器的读写操作。
优选地,所述变分模态分解方法具体为将输入的待分解声音信号f1分解成为若干本征模态函数(Intrinsic Mode Function,IMF)分量uk,所述本征模态函数分量包括待分解声音信号的局部特征信号,并定义成带宽受限的调幅调频信号,用公式(1)表示为:
Figure BDA0002382510970000025
Ak(t)为uk(t)的瞬时幅值,
Figure BDA0002382510970000026
是uk(t)的瞬时频率,uk(t)为频率为ωk(t)、幅值为Ak(t)的谐波信号,t为时间;
设uk(t)具有中心频率和有限带宽,约束条件为每个本征模态函数分量的估计带宽最小,且所有本征模态函数分量之和等于输入信号,则约束模型表示为
Figure BDA0002382510970000021
式中,k表示本征模态函数分量的数量,f为输入信号,{uk}={u1,u2,u3,…,uk}表示分解得到的k个有限带宽的本征模态函数分量,{wk}={w1,w2,w3,…wk}表示各个本征模态函数分量的中心频率,j为虚数单位,δ(t)为冲激函数,
Figure BDA0002382510970000022
为对t求偏导。
优选地,所述瞬时频率均值法的实施步骤为:
对所述待分解声音信号进行变换:
Figure BDA0002382510970000023
Figure BDA0002382510970000024
式中,PV表示柯西主值,X(τ)与Y(t)互为共轭,X(τ)是经过对待分解声音信号f1进行希尔伯特(Hibert)变换得到的,Y(t)为利用柯西主值得到的与X(τ)互为共轭关系的反变换,τ为变量,c(τ)为待解声音信号f1,X(τ)为将X(t)带入值,t为时间;
通过X(t)、Y(t)得到新的时间序列Z(t):
Z(t)=X(t)+Y(t)j=a(t)eθ(t)j (7)
式中a(t)为瞬时幅值,θ(t)表示相位,j为虚数单位;
Figure BDA0002382510970000031
计算瞬时频率均值:
瞬时频率f(t)计算公式为
Figure BDA0002382510970000032
得到瞬时频率均值RESF
Figure BDA0002382510970000033
本发明提供的基于环境声分离的车载语音提取系统,包括如下模块:
信号分解模块,用于将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
信号关联模块,用于将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
信号重构模块,用于将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
与现有技术相比,本发明具有如下的有益效果:
本发明中通过将声音信号进行分解生成多个本征模态函数分量,然后多个声源对应的原始声音信号进行关联,经与所述语音相关联的本征模态函数分量进行重构生成目标语音信号,从而实现语音的准确分离。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例中待分解声音信号采集的工作流程图;
图2为本发明实施例中汽车安装上传感器的示意图;
图3为本发明实施例中对语音模拟信号预处理的流程图;
图4为本发明实施例中本征模态函数分量的数目选取的步骤流程图;
图5为本发明实施例中待分解声音信号进行分解的步骤流程图;
图6为本发明实施例中基于环境声分离的车载语音提取方法的步骤流程图;
图7为本发明实施例中基于环境声分离的车载语音提取系统的模块示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
图1为本发明实施例中待分解声音信号采集的工作流程图,如图1所示,首先尽可能多地收集语音,携带语音坐在车上,在不同的车载环境下播放并再次收集语音,为训练做好准备。其中,不同车载环境分别指的是:汽车启动但并未出发、汽车出发后平稳行驶并且车内无其他声音、汽车平稳行驶并且车内有其他声音(例如聊天声音、车载广播声音等)、汽车出发后刹车、汽车停车。
图6为本发明实施例中基于环境声分离的车载语音提取方法的步骤流程图,如图6所示,本发明提供的基于环境声分离的车载语音提取方法,包括如下步骤:
步骤S1:对于预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
步骤S2:将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
步骤S3:将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
在本发明一实施例中,在步骤S2在将所述本征模态函数分量与多个声源对应的声音信号进行关联时生成相关系数,所述相关系数表征本征模态函数分量与声音信号的相似度;
将所述本征模态函数分量与其对应的最大相关系数的声音信号进行关联。
在本发明一实施例中,所述步骤S1具体为:通过变分模态分解方法和瞬时频率均值法对经由A/D模数转换器和DSP处理后的待分解声音信号进行分解。
在本发明一实施例中,所述变分模态分解方法用于对待分解声音信号通过迭代搜寻变分模型的最优解来实现对于待分解声音信号的自适应分解,分解出本征模态函数分量。
在本发明实施例在,所述变分模态分解方法(VMD)采用循环筛分剥离的方式处理待分解声音信号,将待分解声音信号的分解过程转移到变分框架里,通过迭代搜寻变分模型的最优解来实现对于待分解声音信号进行自适应分解,分解出各个声音片段,以便于后续对语音信号的处理。
所述变分模态分解方法的实质是将输入的待分解声音信号f1分解成为若干本征模态函数(Intrinsic Mode Function,IMF)分量uk,IMF分量包含原待分解声音信号的局部特征信号,并定义成带宽受限的调幅-调频(AM-FM)信号,用公式(1)表示为:
Figure BDA00023825109700000513
Ak(t)为uk(t)的瞬时幅值,
Figure BDA00023825109700000514
是uk(t)的瞬时频率,uk(t)为频率为ωk(t)、幅值为Ak(t)的谐波信号,t为时间。
设uk(t)具有中心频率和有限带宽,约束条件为每个IMF分量的估计带宽最小,且所有IMF分量之和等于输入信号,则约束模型表示为
Figure BDA0002382510970000051
式中,k表示IMF分量的数量,f为输入信号,{uk}={u1,u2,u3,…,uk}表示分解得到的k个有限带宽的IMF分量,{wk}={w1,w2,w3,…wk}表示各个IMF分量的中心频率,j为虚数单位,δ(t)为冲激函数,
Figure BDA0002382510970000052
为对t求偏导。
为了解决(2)式的约束性变分问题,引入惩罚因子α和Lagrange算子λ(t),将式(2)变为非约束性变分问题,得到扩展的Lagrange表达式L({uk},{wk},λ)为:
Figure BDA0002382510970000053
式中,α为惩罚参数,λ(t)为Lagrange算子,δ(t)为冲激函数,f(t)为原信号,利用交替方向乘子算法交替更新各IMF分量及中心频率,可求得上式增广拉格朗日函数的鞍点,即为所求问题的最优解,从而实现对待分解声音信号的分解。
其中,对于模态信号uk和中心频率ωk的更新,采用公式(4)(5):
Figure BDA0002382510970000054
Figure BDA0002382510970000055
式中,ω表示模态的中心频率;
Figure BDA0002382510970000056
相当于当前剩余量
Figure BDA0002382510970000057
的维纳滤波,f(ω)为实部为f(t)经过傅里叶变换得到的,
Figure BDA0002382510970000058
为实部为ui(t)经过傅里叶变换得到的,ui(t)为
Figure BDA0002382510970000059
中k=i时的状态,
Figure BDA00023825109700000510
为实部为λ(t)经过傅里叶变换得到的;
Figure BDA00023825109700000511
为当前模态函数功能谱的重心;
Figure BDA00023825109700000512
是实部为uk(t)经过傅里叶变换得到的,n为迭代过程。
在本发明实施例中,所述瞬时频率均值法用于计算本征模态函数分量的数目k;
通过对待分解声音信号通过变分模态分解方法进行预分解,当瞬时频率均值减小时确定k值。
由于VMD方法分解待分解声音信号f1时,k值过小会出现欠分解现象,而k值过大会有过分解现象,会导致瞬时频率断断续续,因此k值的选取至关重要,本发明实施例中采用瞬时频率均值法确定k值。所述瞬时频率均值法的实施步骤为:
(1)对所述待分解声音信号正反变换
Figure BDA0002382510970000061
Figure BDA0002382510970000062
式中,PV表示柯西主值,X(τ)与Y(t)互为共轭,X(τ)是经过对待分解声音信号f1进行希尔伯特(Hibert)变换得到的,Y(t)为利用柯西主值得到的与X(τ)互为共轭关系的反变换,τ为变量,c(τ)为待解声音信号f1,X(τ)为将X(t)带入值,t为时间;
(2)利用X(t)、Y(t)得到新的时间序列Z(t)
Z(t)=X(t)+Y(t)j=a(t)eθ(t)j (7)
式中a(t)为瞬时幅值,θ(t)表示相位,j为虚数单位
Figure BDA0002382510970000063
(3)计算瞬时频率均值
瞬时频率f(t)计算公式为
Figure BDA0002382510970000064
得到瞬时频率均值RESF
Figure BDA0002382510970000065
为判断环境声分离的准确性,本发明实施例中采用求解互相关系数作为依据,互相关系数法能够定量的表示两个变量之间的相互依赖程度,计算每个IMF分量与原始对应信号的互相关系数ρxy,用到的公式是:
Figure BDA0002382510970000066
式中,xn、yn分别为IMF分量和原始声音信号,
Figure BDA0002382510970000067
为IMF分量数据点均值和原始声音信号对应信号数据点均值,N为分解IMF分量数量。
图4为本发明实施例中本征模态函数分量的数目选取的步骤流程图,如图4所示,首先对待分解声音信号f1进行预分解,令k从小到大取值,初始化k=2,惩罚因子α和带宽使用默认值,即α=2000,τ=1e-7;然后对各IMF分量进行希尔伯特变换(Hibert Transform),再求出瞬时频率均值;最后比较各瞬时频率均值,当出现明显减小时所对应的k值就是所要求解的模态数目。
在本发明实施例中,所述待分解声音信号对应的语音模拟信号通过设置在汽车厢内、汽车发动机旁以及汽车前窗玻璃下侧的传感器采集。
图2为本发明实施例中汽车安装上传感器的示意图,如图2所示,在汽车厢内安装传感器s1,用来录制车厢内的声音,包括人说话声音、车载广播声音等;在汽车发动机旁安装传感器s2,用来录制汽车发动机的声音;在汽车前窗玻璃下侧安装传感器s3,用来录制环境声。
在本发明实施例中,所述待分解声音信号为离散的数字信号;所述A/D模数转换器,用于将所述语音模拟信号转换成待分解声音信号;
通过DSP中TMS320VC5402芯片对待分解声音信号进行存储器的读写操作。
所述A/D模数转换器是一个将模拟信号转变为数字信号的元件,采样频率可以是8K,16K,…,采样频率最高到500K,最理想的采样频率是44.1K,本发明实施例中采用型号为TLC320AD50C的芯片,可以同时进行接收和发送任务。
所述TMS320VC5402芯片编程实现对存储器的读写功能,次芯片包含在DSPC5000系列中,属于定点DSP,主要适用于通信、IP、助听器等相关产品,此系列低功耗、小封装,处理速度一般在80MIPS-400MIPS。
图3为本发明实施例中对语音模拟信号预处理的流程图;如图3所示,将待分解声音信号通过A/D转换器和DSP进行预处理过程。将传感器s1、将传感器s2、将传感器s3录制的声音以及图1中语音声音首先经过A/D模数转换器处理,将语音模拟信号转换成离散的数字信号,存储在flash存储器中;DSP主要通过外部存储器接口来访问片外存储器。所述TMS320VC5402芯片的PS和DS引脚通过逻辑开关来分别控制flash和sram的使能端,由RW和MSTRB来控制位通过逻辑电路分别控制读和写,通过编程来完成具体的功能。
图5为本发明实施例中待分解声音信号进行分解的步骤流程图,如图5所示,在求得k后,利用VMD方法将输入的待分解声音信号f1分解成为若干个本征模态函数IMF分量uk,然后通过迭代的方法计算变分模型的最优解从而确定每个IMF的中心频率(带宽),从而实现分离原始信号成为k个IMF分量的目的。最后对含有不同信号的IMF分量进行重组,成为u1,…,uk这k个信号,也就完成了分离信号的任务。
将上述处理后的信号u1,…,uk分别与图3中的语音、传感器s2录制的发动机语音信号、传感器s3录制的环境声信号预处理后的信号分别做互相关,得出互相关系数,比较相关系数,相关系数越大,说明相似度高,可以确定各分离信号的所属类型,并提取出与其语音相关的IMF分量重构语音信号。
图7为本发明实施例中基于环境声分离的车载语音提取系统的模块示意图,如图7所示,本发明提供的基于环境声分离的车载语音提取系统,包括如下模块:
信号分解模块,用于将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
信号关联模块,用于将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
信号重构模块,用于将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
在本发明实施例中,采用VMD算法常用到故障诊断问题中,是在经验模态分解(EMD)以及集合经验模态分解(EEMD)的基础上提出的,很好的解决了模态混叠现象,分解方式也由EMD以及EEMD的递归分解变为VMD的迭代求解,来实现信号的自适应分解,表现出较好的鲁棒性。
本发明实施中分离车载语音环境声音,是希望可以通过VMD算法以及瞬间频率均值法来分离出人声、汽车发动机的声音以及其他声音,以便可以用于其他领域,比如根据汽车发动机的声音来判断汽车的故障所在,或者根据分离出来的车载空调的声音判断汽车的空调制冷效果等等。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (10)

1.一种基于环境声分离的车载语音提取方法,其特征在于,包括如下步骤:
步骤S1:将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
步骤S2:将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
步骤S3:将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
2.根据权利要求1所述的基于环境声分离的车载语音提取方法,其特征在于,在步骤S2在将所述本征模态函数分量与多个声源对应的声音信号进行关联时生成相关系数,所述相关系数表征本征模态函数分量与声音信号的相似度;
将所述本征模态函数分量与其对应的最大相关系数的声音信号进行关联。
3.根据权利要求1所述的基于环境声分离的车载语音提取方法,其特征在于,所述步骤S1具体为:通过变分模态分解方法和瞬时频率均值法对经由A/D模数转换器和DSP处理后的待分解声音信号进行分解。
4.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述变分模态分解方法用于对待分解声音信号通过迭代搜寻变分模型的最优解来实现对于待分解声音信号的自适应分解,分解出本征模态函数分量。
5.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述瞬时频率均值法用于计算本征模态函数分量的数目k;
当对待分解声音信号通过变分模态分解方法进行预分解时,当瞬时频率均值减小时确定k值。
6.根据权利要求1所述的基于环境声分离的车载语音提取方法,其特征在于,所述待分解声音信号对应的语音模拟信号通过设置在汽车厢内、汽车发动机旁以及汽车前窗玻璃下侧的传感器采集。
7.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述待分解声音信号为离散的数字信号;所述A/D模数转换器,用于将所述语音模拟信号转换成待分解声音信号;
通过DSP中TMS320VC5402芯片对待分解声音信号进行存储器的读写操作。
8.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述变分模态分解方法具体为将输入的待分解声音信号f1分解成为若干本征模态函数(IntrinsicMode Function,IMF)分量uk,所述本征模态函数分量包括待分解声音信号的局部特征信号,并定义成带宽受限的调幅调频信号,用公式(1)表示为:
Figure FDA0002382510960000021
Ak(t)为uk(t)的瞬时幅值,
Figure FDA0002382510960000022
是uk(t)的瞬时频率,uk(t)为频率为ωk(t)、幅值为Ak(t)的谐波信号,t为时间;
设uk(t)具有中心频率和有限带宽,约束条件为每个本征模态函数分量的估计带宽最小,且所有本征模态函数分量之和等于输入信号,则约束模型表示为
Figure FDA0002382510960000023
式中,k表示本征模态函数分量的数量,f为输入信号,{uk}={u1,u2,u3,…,uk}表示分解得到的k个有限带宽的本征模态函数分量,{Wk}={w1,w2,w3,…wk}表示各个本征模态函数分量的中心频率,j为虚数单位,δ(t)为冲激函数,
Figure FDA0002382510960000024
为对t求偏导。
9.根据权利要求3所述的基于环境声分离的车载语音提取方法,其特征在于,所述瞬时频率均值法的实施步骤为:
对所述待分解声音信号进行变换:
Figure FDA0002382510960000025
Figure FDA0002382510960000026
式中,PV表示柯西主值,X(τ)与Y(t)互为共轭,X(τ)是经过对待分解声音信号f1进行希尔伯特(Hibert)变换得到的,Y(t)为利用柯西主值得到的与X(τ)互为共轭关系的反变换,τ为变量,c(τ)为待解声音信号f1,X(τ)为将X(t)带入值,t为时间;
通过X(t)、Y(t)得到新的时间序列Z(t):
Z(t)=X(t)+Y(t)j=a(t)eθ(t)j (7)
式中a(t)为瞬时幅值,θ(t)表示相位,j为虚数单位;
Figure FDA0002382510960000027
计算瞬时频率均值:
瞬时频率f(t)计算公式为
Figure FDA0002382510960000028
得到瞬时频率均值RESF
Figure FDA0002382510960000031
10.一种基于环境声分离的车载语音提取系统,其特征在于,包括如下模块:
信号分解模块,用于将预处理后的待分解声音信号进行分解生成多个本征模态函数分量;
信号关联模块,用于将所述本征模态函数分量与多个声源对应的原始声音信号进行关联,所述原始声音信号包括语音;
信号重构模块,用于将多个与所述语音相关联的本征模态函数分量进行重构生成目标语音信号。
CN202010087309.4A 2020-02-11 2020-02-11 基于环境声分离的车载语音提取方法及系统 Pending CN111341342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010087309.4A CN111341342A (zh) 2020-02-11 2020-02-11 基于环境声分离的车载语音提取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010087309.4A CN111341342A (zh) 2020-02-11 2020-02-11 基于环境声分离的车载语音提取方法及系统

Publications (1)

Publication Number Publication Date
CN111341342A true CN111341342A (zh) 2020-06-26

Family

ID=71182151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010087309.4A Pending CN111341342A (zh) 2020-02-11 2020-02-11 基于环境声分离的车载语音提取方法及系统

Country Status (1)

Country Link
CN (1) CN111341342A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3301461A1 (en) * 2016-09-28 2018-04-04 Siemens Aktiengesellschaft Method for detection of harmonics of a univariate signal
CN108574906A (zh) * 2017-03-09 2018-09-25 比亚迪股份有限公司 用于汽车的声音处理方法、系统和汽车
CN108597540A (zh) * 2018-04-11 2018-09-28 南京信息工程大学 一种基于变分模态分解和极限学习机的语音情感识别方法
CN109087631A (zh) * 2018-08-08 2018-12-25 北京航空航天大学 一种适于复杂环境的车辆智能语音控制系统及其构建方法
CN109410977A (zh) * 2018-12-19 2019-03-01 东南大学 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法
CN109785854A (zh) * 2019-01-21 2019-05-21 福州大学 一种经验模态分解和小波阈值去噪相结合的语音增强方法
CN110459234A (zh) * 2019-08-15 2019-11-15 苏州思必驰信息科技有限公司 用于车载的语音识别方法及系统
CN110517701A (zh) * 2019-07-25 2019-11-29 华南理工大学 一种麦克风阵列语音增强方法及实现装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3301461A1 (en) * 2016-09-28 2018-04-04 Siemens Aktiengesellschaft Method for detection of harmonics of a univariate signal
CN108574906A (zh) * 2017-03-09 2018-09-25 比亚迪股份有限公司 用于汽车的声音处理方法、系统和汽车
CN108597540A (zh) * 2018-04-11 2018-09-28 南京信息工程大学 一种基于变分模态分解和极限学习机的语音情感识别方法
CN109087631A (zh) * 2018-08-08 2018-12-25 北京航空航天大学 一种适于复杂环境的车辆智能语音控制系统及其构建方法
CN109410977A (zh) * 2018-12-19 2019-03-01 东南大学 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法
CN109785854A (zh) * 2019-01-21 2019-05-21 福州大学 一种经验模态分解和小波阈值去噪相结合的语音增强方法
CN110517701A (zh) * 2019-07-25 2019-11-29 华南理工大学 一种麦克风阵列语音增强方法及实现装置
CN110459234A (zh) * 2019-08-15 2019-11-15 苏州思必驰信息科技有限公司 用于车载的语音识别方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李晶皎等: "基于EEMD和ICA的语音去噪方法", 《东北大学学报(自然科学版)》 *
李晶皎等: "基于EEMD和ICA的语音去噪方法", 《东北大学学报(自然科学版)》, no. 11, 15 November 2011 (2011-11-15), pages 1554 - 1557 *

Similar Documents

Publication Publication Date Title
Li et al. Two heads are better than one: A two-stage complex spectral mapping approach for monaural speech enhancement
CN110197670B (zh) 音频降噪方法、装置及电子设备
CN107068161B (zh) 基于人工智能的语音降噪方法、装置和计算机设备
CN110600059B (zh) 声学事件检测方法、装置、电子设备及存储介质
CN108335694B (zh) 远场环境噪声处理方法、装置、设备和存储介质
MXPA04011033A (es) Metodo y aparato para el mejoramiento de dialogo multisensorial.
US20170213550A1 (en) Adaptive dual collaborative kalman filtering for vehicular audio enhancement
CN112149498B (zh) 一种面向汽车复杂部件异响的在线智能识别系统及方法
CN113674763B (zh) 利用线谱特性的鸣笛声识别方法及系统、设备与存储介质
CN112216300A (zh) 用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车
CN114333865A (zh) 一种模型训练以及音色转换方法、装置、设备及介质
CN112002341B (zh) 语音信号的参数化表达、加密传输和重构的方法
Ashraf et al. Underwater ambient-noise removing GAN based on magnitude and phase spectra
US20060009968A1 (en) Unified treatment of resolved and unresolved harmonics
US7877252B2 (en) Automatic speech recognition method and apparatus, using non-linear envelope detection of signal power spectra
CN113782011B (zh) 频带增益模型的训练方法及用于车载场景的语音降噪方法
CN114189781A (zh) 双麦神经网络降噪耳机的降噪方法及系统
CN118118626A (zh) 一种用于触摸液晶显示屏的生产监控系统
CN111341342A (zh) 基于环境声分离的车载语音提取方法及系统
CN113658607A (zh) 基于数据增强和卷积循环神经网络的环境声音分类方法
CN107919136B (zh) 一种基于高斯混合模型的数字语音采样频率估计方法
CN111028857A (zh) 基于深度学习的多通道音视频会议降噪的方法及系统
JP3510458B2 (ja) 音声認識システムおよび音声認識制御プログラムを記録した記録媒体
JP2003271166A (ja) 入力信号処理方法および入力信号処理装置
CN108574911B (zh) 一种无监督单传声器语音降噪方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200626

RJ01 Rejection of invention patent application after publication