CN109308909B - 一种信号分离方法、装置、电子设备及存储介质 - Google Patents

一种信号分离方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN109308909B
CN109308909B CN201811311484.6A CN201811311484A CN109308909B CN 109308909 B CN109308909 B CN 109308909B CN 201811311484 A CN201811311484 A CN 201811311484A CN 109308909 B CN109308909 B CN 109308909B
Authority
CN
China
Prior art keywords
signal
function
separation
observation
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811311484.6A
Other languages
English (en)
Other versions
CN109308909A (zh
Inventor
杨亮
雷宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Rubu Technology Co ltd
Original Assignee
Beijing Rubu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Rubu Technology Co ltd filed Critical Beijing Rubu Technology Co ltd
Priority to CN201811311484.6A priority Critical patent/CN109308909B/zh
Publication of CN109308909A publication Critical patent/CN109308909A/zh
Application granted granted Critical
Publication of CN109308909B publication Critical patent/CN109308909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种信号分离方法、装置、电子设备及存储介质,该方法包括:通过基于预设方向范围和采集到的观测信号确定分离函数;利用所述分离函数从所述观测信号中分离出目标声源信号,实现从观测信号中分离出特定方向范围内的声源信号作为目标声源信号。其中,由于分离函数与预设方向范围有关,因此,在目标声源和麦克风的相对位置确定的场景中,利用本实施例可以通过分离出某个方向范围内的信号可以实现目标声源信号的分离。

Description

一种信号分离方法、装置、电子设备及存储介质
技术领域
本发明涉及信号分离技术领域,尤其涉及一种信号分离方法、装置、电子设备及存储介质。
背景技术
盲信号处理在生物医学信号处理、通讯、图像和语音信号处理等多领域极具有应用价值。盲源分离(BSS,Blind Source Separation),又称为盲信号分离,是指在信号的理论模型和声源信号无法精确获知的情况下,如何仅从若干混迭信号(观测信号)中恢复出无法直接观测的各个原始信号的过程中分离出各源信号的过程。
在一些特定的场景下,比如在一个较小的空间中,不同传感器中观测到的信号的差异性很小,相应的,利用现有分离算法分离的难度会增加。同时,如果多个声源的信号具有很大的相似性,比如是声音音调、音色、响度等很相近的人声,这样会进一步增加信号分离的难度,同时分离结果的准确性也会降低。
发明内容
本发明提供一种信号分离方法、装置、电子设备及存储介质,解决了现有技术中信号分离结果准确度低的问题。
第一方面,本发明实施例提供了一种信号分离方法,包括:
基于预设方向范围和采集到的观测信号确定分离函数;
利用所述分离函数从所述观测信号分中分离出目标声源信号。
进一步的,基于预设方向范围和采集到的观测信号确定分离函数,包括:
根据所述观测信号确定辅助函数,其中,所述辅助函数的参数包括所述预定方向范围和/或范围外声源信号的能量
根据所述辅助函数计算分离函数。
进一步的,根据所述观测信号确定辅助函数,包括:
通过以下公式构建与第t帧观测信号对应的辅助函数Vk
Figure BDA0001855106230000021
其中,比较函数G(rk)=rk 2/3,rk是在所述预设方向范围内或范围外的第t帧观测信号的能量值,k=1,2…m,m为麦克风的数量;xxh为所述至少两个麦克风采集到的第t帧观测信号构成的协方差矩阵;第t帧观测信号为x(ω)={x1(ω),…,xm(ω)}T,其中,x1(ω),…,xm(ω)分别为第一个、第二个……第m个麦克风采集到的与频点ω相关的信号,m≥2。
进一步的,根据所述辅助函数计算分离函数,包括:
根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t);
W(ω,t)=[w1(ω,t)w2(ω,t)…wk(ω,t)];
wk(ω,t)=(W(ω,t-1)Vk(ω,t))-1ek
其中,W(ω,t-1)表示第t帧的前一帧观测信号对应的分离函数,ω=1,2,3…n,n为第t帧观测信号的频点数量;第一帧观测信号对应的分离函数为预设的初始矩阵W(ω,0),ek表示单位矩阵中对应的第k列列向量,k=1,2,3…m,m为麦克风的数量,m≥2。
进一步的,根据所述辅助函数计算分离函数之前,所述方法还包括:计算在所述预设方向范围内和/或范围外的观测信号的能量,包括:
计算所述至少两个麦克风采集到的信号在对应频点之间的相位差;
根据所述相位差与预设相位差阈值的大小确定所述预设方向范围内和/或范围外观测信号的能量。
进一步的,基于预设方向范围和采集到的观测信号确定分离函数之前,还包括:
将采集到的时域信号变换为频域信号。
进一步的,根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t)之后,还包括:
对所述分离函数进行归一化。
第二方面,本发明实施例还提供了一种信号分离装置,包括:
分离函数确定模块,用于基于预设方向范围和采集到的观测信号确定分离函数;
目标声源分离模块,用于根据所述分离函数和所述观测信号分离出目标声源信号。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的一种信号分离方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例所述的一种信号分离方法。
本发明实施例通过基于预设方向范围和采集到的观测信号确定分离函数;利用所述分离函数从所述观测信号分中分离出目标声源信号,实现从观测信号中分离出特定方向范围内的声源信号作为目标声源信号。其中,由于分离函数与预设方向范围有关,因此,在目标声源位置确定的场景中,比如车辆中,利用本实施例可以通过分离出某个方向范围内的信号实现目标声源信号的分离。
附图说明
图1是本发明实施例一中的一种信号分离方法的流程图。
图2是本发明实施例二中的一种信号分离方法的流程图。
图3是本发明实施例二中的目标声源方向范围的示意图。
图4是本发明实施例三中的一种信号分离装置的结构示意图。
图5是本发明实施例四中的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种信号分离方法的流程图,本实施例可适用于信号分离的情况,该方法可以由信号分离装置来执行,具体包括如下步骤:
S110、基于预设方向范围和采集到的观测信号确定分离函数。
其中,所述预设方向范围是预先设定的用于表示从观测信号中分离的是哪个方向范围内的信号。具体的,预设方向范围可以根据目标声源和麦克风的相对位置确定。示例性的,如果在车辆中司机需要语音导航,即语音导航设备需要获取驾驶员的声音信号进行语音识别以及其他操作,而车室中的其他方位,比如副驾驶位置发出的声音信号则不需要去进行识别,甚至需要抑制或去除才可以更好的识别驾驶员的声音信号。也就是说在这个场景下,需要从麦克风采集的观测信号中分离出驾驶员的信号,具体可以通过从观测信号中分离出驾驶员所在方向范围内的信号,这样对分离得到的信号可以作为目标声源信号,其他设备在进行驾驶员的语音识别时会更加准确。
观测信号可以是麦克风采集到的信号,分离函数可以用于从观测信号中分离出预设方向范围内的函数。示例性的,在频域下,信号采集和信号的分离的基本模型如下:
x(ω)=H(ω)s(ω) (1)
y(ω)=W(ω)x(ω) (2)
其中,x(ω)={x1(ω),…,xm(ω)}T为麦克风采集到的信号,x1(ω),…,xm(ω)分别为第一个、第二个……第m个麦克风采集到的与频点ω相关的信号,m≥2。s(ω)={s1(ω),…,sn(ω)}T为目标声源信号,即要分离出的声源信号,H(ω)为声源到传声器(比如麦克风)的传递函数,可以称为混合矩阵(Mixing matrix);W(ω)解混矩阵(demixingmatrix),W(ω)={w1(ω),…,wn(ω)}h,即为本发明实施例中的分离函数。值得注意的是,本发明实施例中的分离函数是基于预设方向范围和采集的观测信号确定的,也即在目标声源和麦克风的位置确定以后,可以根据目标声源所在方向确定所述预设方向范围,比如可以是以目标声源位置为基准的一个10度的夹角,分离出在这个10度的锥形之内的信号。即将与预设方向范围对应的信号参量设置在分离函数中,便可以利用分离函数求解目标声源信号。
S120、利用所述分离函数从所述观测信号分中离出目标声源信号。
目标声源信号可以是目标发声者发出的信号,示例性的,在车辆中,语音导航设备需要获取到驾驶员发出的声音信号,则驾驶员可以是为目标发声者,驾驶员发出的声音信号便可以是目标声源信号。在分离函数确定以后,可以利用公式(2)将y(ω)解出来,得到预设方向范围内的信号y(ω),即分离出的该预设方向的信号便可以视为是目标声源信号。因此y(ω)可以视为s(ω)目标声源信号的近似,即本实施例中可以在目标声源位置确定以后,可以利用分离出预设方向内的信号作为目标声源的信号。
本实施例的技术方案,通过基于预设方向范围和采集到的观测信号确定分离函数;利用所述分离函数从所述观测信号分中离出目标声源信号,实现从观测信号中分离出特定方向范围内的声源信号作为目标声源信号。其中,由于分离函数与预设方向范围有关,因此,在特定场景比如车辆中,利用本实施例可以通过分离出某个方向范围内的信号实现目标声源信号的分离。
实施例二
图2是本发明实施例二提供的一种信号分离方法的流程图,在上述实施例的基础上,可选的,对步骤S110、基于预设方向范围和采集到的观测信号确定分离函数,作了进一步的优化,如图2所示,该方法包括:
S210、根据所述观测信号确定辅助函数,其中,所述辅助函数的参数包括所述预定方向范围内和/或范围外观测信号的能量。
辅助函数可以是根据观测信号构建的用于求解分离函数的函数。可选的,构建的辅助函数要可以确保分离函数的单调递减性,这样在求解分离函数时,由于其单调递减性,可以快速的得到稳定的解。即可以无需考虑调节合适的步长实现系统的鲁棒性和收敛速度的折衷。由于本实施例中要通过分离出预设方向范围内的信号确定出目标声源的信号,因此可以通过将预设方向范围内和/或范围外的观测信号的能量作为参数应用在辅助函数中。其中,预设方向范围内可以是指目标声源信号所在的方向范围内,而预设范围外可以是指目标声源信号所在的方向范围外。
S220、根据所述辅助函数计算分离函数。
具体的,可以利用矩阵之间的转置、共轭转置和矩阵的逆等运算,利用构建的辅助函数表示出分离函数。
S230、利用所述分离函数从所述观测信号分中分离出目标声源信号。
可选的,步骤S220、根据所述观测信号确定辅助函数,包括:
通过以下公式构建与第t帧观测信号对应的辅助函数Vk
Figure BDA0001855106230000071
其中,比较函数G(rk)=rk 2/3,rk是在所述预设方向范围内或范围外的第t帧观测信号的能量值,k=1,2…m,m为麦克风的数量;xxh为所述至少两个麦克风采集到的第t帧观测信号构成的协方差矩阵;第t帧观测信号为x(ω)={x1(ω),…,xm(ω)}T,其中,x1(ω),…,xm(ω)分别为第一个、第二个……第m个麦克风采集到的与频点ω相关的信号,m≥2。
可选的,基于预设方向范围和采集到的观测信号确定分离函数之前,还包括:将采集到的时域信号变换为频域信号。
麦克风采集的到的观测信号一般是时域信号,时域信号是以时间轴为坐标表示动态信号;而频域信号是把信号变为以频率轴为坐标表示出来。在本实施例中,可以通过傅里叶变换将采集的时域信号转换为频域信号。示例性的,可以将预设时间内采集的时域信号转变为频域信号,作为一帧的观测信号。比如将10ms采集的观测信号作为一帧的信号,并且转换为相应频域下对应不同频点的观测信号。
可选的,根据所述辅助函数计算分离函数之前,所述方法还包括:计算在所述预设方向范围内和/或范围外的观测信号的能量,具体包括:
计算所述至少两个麦克风采集到的信号在对应频点之间的相位差;
根据所述相位差与预设相位差阈值的大小确定所述预设方向范围内和/或范围外观测信号的能量。
预设相位差阈值可以是根据预设方向范围设定的阈值,用于作为判断不同频点对应的信号是否处于所述预设方向范围内的依据。示例性的,当存在两个麦克风时,如图3所示,图3是本发明实施例二提供的目标声源方向范围的示意图,图中的角度θ便可以为预设方向范围,在θ角度的锥体之内(左边的虚线和右边角度θ处的实线构成的锥形体之内)的信号都可以视为是在该预设方向范围内的观测信号。在具体实施过程中,可以在目标声源位置和麦克风位置确定的情况下,确定所述预设方向范围以及预设相位差阈值。
在将麦克风采集到的时域信号转换为频域信号之后,每一帧的频域信号是与频点有关的,在不同频点处对应的相应的信号,得到的观测信号中包括对应频点的信号幅值和相位等参量。
可以通过比较麦克风采集的观测信号之间的相位差与预设相位差阈值确定该频点对应的信号是否属于该预设方向范围内。具体的,如果是两个麦克风,两个麦克风中的对应同一个频点的信号的相位进行相减可以得到相位差,如果计算的相位差小于所述预设相位差阈值,则可以认为该频点对应的信号属于该预设方向范围内;如果大于所述预设相位差阈值,则可以认为该频点对应的信号不属于该预设方向范围内,即属于预设方向范围外。如果是三个麦克风,则可以计算三个麦克风之间的两两麦克风之间对应频点的相位差,这种情况下可以预先设定在某个频点下需要得到一组相位差、两组相位差或三组相位差小于预设相位差阈值时,便可以视为该频点对应的信号属于该预设方向范围内。相应的,可以将属于预设方向范围内和范围外的信号的能量分别进行累加,分别得到预设方向范围内和范围外的观测信号的能量,用于计算辅助函数。
在上述实施例的基础上,可选的,步骤S220、根据所述辅助函数计算分离函数,具体可以包括:
根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t);
W(ω,t)=[w1(ω,t)w2(ω,t)…wk(ω,t)]; (4)
wk(ω,t)=(W(ω,t-1)Vk(ω,t))-1ek; (5)
其中,W(ω,t-1)表示第t帧的前一帧观测信号对应的分离函数,ω=1,2,3…n,n为第t帧观测信号的频点数量;第一帧观测信号对应的分离函数为预设的初始矩阵W(ω,0),ek表示单位矩阵中对应的第k列列向量,k=1,2,3…m,m为麦克风的数量,m≥2。
在计算第一帧信号对应的分离函数时,可以通过预先设定的初始矩阵W(ω,0),利用公式(5)进行计算,对初始矩阵的设置不做限制,比如可以是一个与麦克风数量对应的单位矩阵,例如,如果有两个麦克风,相应的,初始矩阵可以是一个二阶的单位矩阵。在计算下一帧信号对应的分离函数时,便可以利用公式(5)根据辅助函数和上一帧观测信号中计算得到的分离函数wk(ω,t)。由于语音信号具有连续性,因此每帧信号之间有一定的相关性,利用上一帧信号得到的分离函数计算得到的下一帧信号的分离函数更合理和准确。具体的,如果有两个麦克风,则wk(ω,t)可以有两个,包括:w1(ω,t)和w2(ω,t)。最终的分离函数可以写为W(ω,t)=[w1(ω,t)w2(ω,t)]。
可选的,根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t)之后,还包括:对所述分离函数进行归一化。
归一化可以进一步方便后续数据的处理,以及提高计算下一帧信号对应的分离函数的收敛速度。分离函数进行归一化之后,再利用公式(2)可以更加准确的分离出目标声源信号。具体可以通过公式
Figure BDA0001855106230000101
对wk(ω,t)进行归一化。
本实施例的技术方案,通过基于预设方向范围和采集到的观测信号确定分离函数;利用所述分离函数从所述观测信号分中离出目标声源信号,实现从观测信号中分离出特定方向范围内的声源信号作为目标声源信号。其中,由于分离函数与预设方向范围有关,因此,在特定场景中,利用本实施例可以通过分离出某个方向范围内的信号实现目标声源信号的分离,同时以方向范围分离信号得到的分离结果更加接近目标声源信号。
实施例三
图4为本发明实施例六提供的一种信号分离装置的结构示意图,如图4所示,所述装置包括:
分离函数确定模块410,用于基于预设方向范围和采集到的观测信号确定分离函数;
目标声源分离模块420,用于根据所述分离函数和所述观测信号分离出目标声源信号。
可选的,所述分离函数确定模块410,包括:
辅助函数确定单元,用于根据所述观测信号确定辅助函数;
分离函数确定单元,用于根据所述辅助函数计算分离函数;
其中,所述辅助函数的参数包括所述预定方向范围内和/或范围外观测信号的能量。
可选的,所述辅助函数确定单元,具体用于通过以下公式构建与第t帧观测信号对应的辅助函数Vk
Figure BDA0001855106230000111
其中,比较函数G(rk)=rk 2/3,rk是在所述预设方向范围内或范围外的第t帧观测信号的能量值,k=1,2…m,m为麦克风的数量;xxh为所述至少两个麦克风采集到的第t帧观测信号构成的协方差矩阵;第t帧观测信号为x(ω)={x1(ω),…,xm(ω)}T,其中,x1(ω),…,xm(ω)分别为第一个、第二个……第m个麦克风采集到的与频点ω相关的信号,m≥2。
可选的,所述分离函数确定单元,具体用于根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t);
W(ω,t)=[w1(ω,t)w2(ω,t)…wk(ω,t)];
wk(ω,t)=(W(ω,t-1)Vk(ω,t))-1ek
其中,W(ω,t-1)表示第t帧的前一帧观测信号对应的分离函数,ω=1,2,3…n,n为第t帧观测信号的频点数量;第一帧观测信号对应的分离函数为预设的初始矩阵W(ω,0),ek表示单位矩阵中对应的第k列列向量,k=1,2,3…m,m为麦克风的数量m≥2。
可选的,所述装置还包括信号能量确定模块,用于根据所述辅助函数计算分离函数之前,计算所述至少两个麦克风采集到的信号在对应频点之间的相位差;并根据所述相位差与预设相位差阈值的大小确定所述预设方向范围内和/或范围外观测信号的能量。
可选的,所述装置还包括:信号转换模块,用于在基于预设方向范围和采集到的观测信号确定分离函数之前,将采集到的时域信号变换为频域信号。
可选的,所述分离函数确定模块410还包括函数归一化单元,用于根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t)之后,对所述分离函数进行归一化。
本发明实施例所提供的信号分离装置,可执行本发明任意实施例所提供的信号分离方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的一种信号分离方法。
实施例四
参见图5,本实施例提供了一种电子设备500,其包括:一个或多个处理器520;存储装置510,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器520执行,使得所述一个或多个处理器520实现本发明实施例所提供的一种信号分离方法,包括:
基于预设方向范围和采集到的观测信号确定分离函数;
利用所述分离函数从所述观测信号分中分离出目标声源信号。
当然,本领域技术人员可以理解,处理器520还可以实现本发明任意实施例所提供的一种信号分离方法的技术方案。
图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:一个或者多个处理器520,存储装置510,连接不同系统组件(包括存储装置510和处理器520)的总线550。
总线550表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备500典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备500访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置510可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)511和/或高速缓存存储器512。电子设备500可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统513可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线550相连。存储装置510可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块515的程序/实用工具514,可以存储在例如存储装置510中,这样的程序模块515包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块515通常执行本发明所描述的任意实施例中的功能和/或方法。
电子设备500也可以与一个或多个外部设备560(例如键盘、指向设备、显示器570等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口530进行。并且,电子设备500还可以通过网络适配器540与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器540通过总线550与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器520通过运行存储在存储装置510中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种信号分离方法。
实施例五
本发明实施例五提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种信号分离方法,该方法包括:
基于预设方向范围和采集到的观测信号确定分离函数;
利用所述分离函数从所述观测信号分中分离出目标声源信号。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的一种信号分离方法中的相关操作。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.一种信号分离方法,其特征在于,所述方法包括:
基于预设方向范围和采集到的观测信号确定分离函数;
利用所述分离函数从所述观测信号中分离出目标声源信号;
基于预设方向范围和采集到的观测信号确定分离函数,包括:
根据所述观测信号确定辅助函数,其中,所述辅助函数的参数包括预定方向范围内和/或范围外观测信号的能量;
根据所述辅助函数计算分离函数;
根据所述观测信号确定辅助函数,包括:
通过以下公式构建与第t帧观测信号对应的辅助函数Vk
Figure FDA0003620994450000011
其中,比较函数G(rk)=rk 2/3,rk是在所述预设方向范围内或范围外的第t帧观测信号的能量值,k=1,2...m,m为麦克风的数量;xxh为至少两个麦克风采集到的第t帧观测信号构成的协方差矩阵;第t帧观测信号为x(ω)={x1(ω),...,xm(ω)}T,其中,x1(ω),...,xm(ω)分别为第一个、第二个......第m个麦克风采集到的与频点ω相关的信号,m≥2;
根据所述辅助函数计算分离函数,包括:
根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t);
wk(ω,t)=(W(ω,t-1)Vk(ω,t))-1ek
W(ω,t)=[w1(ω,t)w2(ω,t)...wk(ω,t)];
其中,W(ω,t-1)表示第t帧的前一帧观测信号对应的分离函数,ω=1,2,3...n,n为第t帧观测信号的频点数量;第一帧观测信号对应的分离函数为预设的初始矩阵W(ω,0),ek表示单位矩阵中对应的第k列列向量,k=1,2,3...m,m为麦克风的数量,m≥2。
2.根据权利要求1所述的方法,其特征在于,根据所述辅助函数计算分离函数之前,所述方法还包括:计算在所述预设方向范围内和/或范围外的观测信号的能量,包括:
计算所述至少两个麦克风采集到的信号在对应频点之间的相位差;
根据所述相位差与预设相位差阈值的大小确定所述预设方向范围内和/或范围外观测信号的能量。
3.根据权利要求1所述的方法,其特征在于,基于预设方向范围和采集到的观测信号确定分离函数之前,还包括:
将采集到的时域信号变换为频域信号。
4.根据权利要求1所述的方法,其特征在于,根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t)之后,还包括:
对所述分离函数进行归一化。
5.一种信号分离装置,其特征在于,所述装置包括:
分离函数确定模块,用于基于预设方向范围和采集到的观测信号确定分离函数;
目标声源分离模块,用于根据所述分离函数和所述观测信号分离出目标声源信号;
所述分离函数确定模块,包括:
辅助函数确定单元,用于根据所述观测信号确定辅助函数;
分离函数确定单元,用于根据所述辅助函数计算分离函数;
其中,所述辅助函数的参数包括预定方向范围内和/或范围外观测信号的能量;
所述辅助函数确定单元,具体用于通过以下公式构建与第t帧观测信号对应的辅助函数Vk
Figure FDA0003620994450000031
其中,比较函数G(rk)=rk 2/3,rk是在所述预设方向范围内或范围外的第t帧观测信号的能量值,k=1,2...m,m为麦克风的数量;xxh为至少两个麦克风采集到的第t帧观测信号构成的协方差矩阵;第t帧观测信号为x(ω)={x1(ω),...,xm(ω)}T,其中,x1(ω),...,xm(ω)分别为第一个、第二个......第m个麦克风采集到的与频点ω相关的信号,m≥2;
所述分离函数确定单元,具体用于根据所述辅助函数计算与第t帧观测信号对应的分离函数W(ω,t);
W(ω,t)=[w1(ω,t)w2(ω,t)...wk(ω,t)];
wk(ω,t)=(W(ω,t-1)Vk(ω,t))-1ek
其中,W(ω,t-1)表示第t帧的前一帧观测信号对应的分离函数,ω=1,2,3...n,n为第t帧观测信号的频点数量;第一帧观测信号对应的分离函数为预设的初始矩阵W(ω,0),ek表示单位矩阵中对应的第k列列向量,k=1,2,3...m,m为麦克风的数量m≥2。
6.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的一种信号分离方法。
7.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-4中任一所述的一种信号分离方法。
CN201811311484.6A 2018-11-06 2018-11-06 一种信号分离方法、装置、电子设备及存储介质 Active CN109308909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811311484.6A CN109308909B (zh) 2018-11-06 2018-11-06 一种信号分离方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811311484.6A CN109308909B (zh) 2018-11-06 2018-11-06 一种信号分离方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN109308909A CN109308909A (zh) 2019-02-05
CN109308909B true CN109308909B (zh) 2022-07-15

Family

ID=65221843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811311484.6A Active CN109308909B (zh) 2018-11-06 2018-11-06 一种信号分离方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN109308909B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110675892B (zh) * 2019-09-24 2022-04-05 北京地平线机器人技术研发有限公司 多位置语音分离方法和装置、存储介质、电子设备
CN111862987B (zh) 2020-07-20 2021-12-28 北京百度网讯科技有限公司 语音识别方法和装置
CN112509584A (zh) * 2020-12-03 2021-03-16 北京声智科技有限公司 声源位置确定方法、装置和电子设备
CN113793599B (zh) * 2021-09-15 2023-09-29 北京百度网讯科技有限公司 语音识别模型的训练方法和语音识别方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079267A (zh) * 2006-05-26 2007-11-28 富士通株式会社 定向集音装置、定向集音方法以及存储器产品
CN103038823A (zh) * 2010-01-29 2013-04-10 马里兰大学派克分院 用于语音提取的系统和方法
CN108717495A (zh) * 2018-05-22 2018-10-30 出门问问信息科技有限公司 多波束波束成形的方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI429885B (zh) * 2011-12-02 2014-03-11 Nat Univ Tsing Hua 迴響環境之聲源能量分佈可視化的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079267A (zh) * 2006-05-26 2007-11-28 富士通株式会社 定向集音装置、定向集音方法以及存储器产品
CN103038823A (zh) * 2010-01-29 2013-04-10 马里兰大学派克分院 用于语音提取的系统和方法
CN108717495A (zh) * 2018-05-22 2018-10-30 出门问问信息科技有限公司 多波束波束成形的方法、装置及电子设备

Also Published As

Publication number Publication date
CN109308909A (zh) 2019-02-05

Similar Documents

Publication Publication Date Title
CN109308909B (zh) 一种信号分离方法、装置、电子设备及存储介质
CN109410978B (zh) 一种语音信号分离方法、装置、电子设备及存储介质
TWI711035B (zh) 方位角估計的方法、設備、語音交互系統及儲存介質
CN110673096B (zh) 语音定位方法和装置、计算机可读存储介质、电子设备
WO2022121184A1 (zh) 声音事件检测与定位方法、装置、设备及可读存储介质
WO2016100460A1 (en) Systems and methods for source localization and separation
CN110706719B (zh) 一种语音提取方法、装置、电子设备及存储介质
EP3839949A1 (en) Audio signal processing method and device, terminal and storage medium
WO2016119388A1 (zh) 一种基于语音信号构造聚焦协方差矩阵的方法及装置
CN110827843A (zh) 音频处理方法、装置、存储介质及电子设备
CN112652320B (zh) 声源定位方法和装置、计算机可读存储介质、电子设备
US11790888B2 (en) Multi channel voice activity detection
CN112799017B (zh) 声源定位方法、装置、存储介质及电子设备
EP4172987A1 (en) Speech enhancement
US11107492B1 (en) Omni-directional speech separation
CN103688187A (zh) 使用相位谱的声音源定位
CN112466327B (zh) 语音处理方法、装置和电子设备
CN113314138A (zh) 基于麦克风阵列的声源监听分离方法、装置及存储介质
CN113689870B (zh) 一种多通道语音增强方法及其装置、终端、可读存储介质
CN111833847A (zh) 语音处理模型训练方法和装置
CN112151058A (zh) 一种声音信号的处理方法、装置及设备
WO2022222922A1 (zh) 语音信号的处理方法和装置
CN113707149A (zh) 音频处理方法和装置
CN111048096B (zh) 一种语音信号处理方法、装置及终端
CN113808606B (zh) 语音信号处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun District Economic Development Zone, Beijing 101500

Applicant after: BEIJING ROOBO TECHNOLOGY Co.,Ltd.

Address before: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun District Economic Development Zone, Beijing 101500

Applicant before: BEIJING INTELLIGENT STEWARD Co.,Ltd.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20210819

Address after: Room 301-112, floor 3, building 2, No. 18, YANGFANGDIAN Road, Haidian District, Beijing 100089

Applicant after: Beijing Rubu Technology Co.,Ltd.

Address before: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun District Economic Development Zone, Beijing 101500

Applicant before: BEIJING ROOBO TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220915

Address after: 518000 Guangdong 4 Baoan District City, Shenzhen Province, the third floor of the community of Taihang Wutong Industrial Park, 9A

Patentee after: Shenzhen Rubu Technology Co.,Ltd.

Address before: Room 301-112, floor 3, building 2, No. 18, YANGFANGDIAN Road, Haidian District, Beijing 100089

Patentee before: Beijing Rubu Technology Co.,Ltd.

TR01 Transfer of patent right