CN112435659B - 一种信号处理方法、装置、电子设备及介质 - Google Patents
一种信号处理方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN112435659B CN112435659B CN202110114570.3A CN202110114570A CN112435659B CN 112435659 B CN112435659 B CN 112435659B CN 202110114570 A CN202110114570 A CN 202110114570A CN 112435659 B CN112435659 B CN 112435659B
- Authority
- CN
- China
- Prior art keywords
- signal
- voice
- voice signal
- target
- crosstalk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000008030 elimination Effects 0.000 claims description 12
- 238000003379 elimination reaction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 7
- 230000015654 memory Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000009435 building construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请提供了一种信号处理方法、装置、电子设备及介质,方法包括:接收目标路语音信号和对比信号,其中,目标路语音信号是第一语音接收器收录的,对比信号包括至少一个第二语音接收器收录的参考路语音信号或由参考路语音信号进行信号叠加得到的混合参考信号;根据目标路语音信号与对比信号之间相似度,判断目标路语音信号中是否存在串扰语音信号;其中,串扰语音信号为目标路语音信号中和对比信号相似度大于等于阈值的信号;若存在,则在目标路语音信号中消除串扰语音信号。本申请在目标发言人发言时能够消除目标发言人的话筒中进入的非目标发言人的声音,使得发送给语音识别设备的语音只包含目标发言人的声音,便于语音识别设备进行针对性识别。
Description
技术领域
本申请涉及语音识别领域,具体而言,涉及一种信号处理方法、装置、电子设备及介质。
背景技术
随着科技的发展,语音识别越来越普遍的应用在人们的生活中,通过语音识别可以快速将语音信息转换成文本信息,方便人们及时了解语音内容并且省去了文字书写的时间。
如今,语音识别的准确度得到了大幅的提高,然而目前的语音识别技术对应用环境的要求依然较为严苛,在某些复杂的应用环境中便无法进行准确的识别或是识别出非目标语音信息的内容,例如:在会议室中,存在多个与会人员,每个与会人员的面前都设置有一个麦克风,若想要仅仅获得某个目标与会人员干净清晰的目标发言内容,则其他与会人员在目标与会人员发言的时候便不能对着自己面前的麦克风讲话,否则目标与会人员的麦克风就会录入其他与会人员的非目标发言内容,从而导致目标与会人员的麦克风发送给语音识别设备的语音信息不仅存在目标发言内容,还掺杂串扰语音信号(即非目标发言内容),使语音识别设备不能仅针对目标发言内容进行识别。
发明内容
有鉴于此,本申请的目的在于提供一种信号处理方法、装置、电子设备及介质,能够大幅降低待识别语音中的串扰,使得即便处于复杂的应用环境中,也能仅保留待识别语音中来自目标发言人的目标语音内容,从而使接收到待识别语音的语音识别服务器能够进行针对性语音识别。
第一方面,本申请实施例提供了一种信号处理方法,所述方法包括:
接收目标路语音信号和对比信号,其中,所述目标路语音信号是第一语音接收器收录的,所述对比信号包括至少一个第二语音接收器收录的参考路语音信号或由所述参考路语音信号进行信号叠加得到的混合参考信号;
根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述对比信号相似度大于等于阈值的信号;
若所述目标路语音信号中存在所述串扰语音信号,则在所述目标路语音信号中消除所述串扰语音信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,在接收目标路语音信号和对比信号之后,所述方法还包括:
判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;
对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,在对所述参考路语音信号进行信号叠加之前,所述方法还包括:
判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;
对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号;
将每一无噪声参考路语音信号进行叠加,得到所述混合参考信号,其中,所述无噪声参考路语音信号包括:不存在噪声信号的参考路语音信号和完成去躁处理的参考路语音信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
针对每一所述参考路语音信号,根据所述目标路语音信号与该参考路语音信号之间相似度,判断所述目标路语音信号中是否存在所述串扰语音信号;
其中,所述串扰语音信号为所述目标路语音信号中和该参考路语音信号相似度大于等于阈值的信号。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
根据所述目标路语音信号与所述混合参考信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;
其中,所述串扰语音信号为所述目标路语音信号中和所述混合参考信号相似度大于等于阈值的信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述方法包括:
针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的阈值,其中,所述阈值与所述距离呈负相关的关系。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述方法包括:
针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的第一阈值,其中,所述第一阈值与所述距离呈负相关的关系;
根据每一所述第一阈值,确定所述混合参考信号对应的阈值。
第二方面,本申请实施例提供了一种信号处理装置,所述装置包括:
语音接收器,用于接收目标路语音信号和对比信号,其中,所述目标路语音信号是第一语音接收器收录的,所述对比信号包括至少一个第二语音接收器收录的参考路语音信号或由所述参考路语音信号进行信号叠加得到的混合参考信号;
串扰消除模块,用于根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述对比信号相似度大于等于阈值的信号;若所述目标路语音信号中存在所述串扰语音信号,则在所述目标路语音信号中消除所述串扰语音信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,在接收目标路语音信号和对比信号之后,所述装置还包括:
噪声消除模块,用于判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,在对所述参考路语音信号进行信号叠加之前,所述装置还包括:
噪声消除模块,用于判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号;
混音模块,用于将每一无噪声参考路语音信号进行叠加,得到所述混合参考信号,其中,所述无噪声参考路语音信号包括:不存在噪声信号的参考路语音信号和完成去躁处理的参考路语音信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
串扰消除模块,还用于针对每一所述参考路语音信号,根据所述目标路语音信号与该参考路语音信号之间相似度,判断所述目标路语音信号中是否存在所述串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和该参考路语音信号相似度大于等于阈值的信号。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
串扰消除模块,还用于根据所述目标路语音信号与所述混合参考信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述混合参考信号相似度大于等于阈值的信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述装置还包括:
第一阈值确定模块,用于针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的阈值,其中,所述阈值与所述距离呈负相关的关系。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述装置还包括:
第一阈值确定模块,还用于针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的第一阈值,其中,所述第一阈值与所述距离呈负相关的关系;
第二阈值确定模块,用于根据每一所述第一阈值,确定所述混合参考信号对应的阈值。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面任一项所述的信号处理方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行第一方面任一项所述的信号处理方法的步骤。
本申请实施例提供的一种信号处理方法、装置、电子设备及介质,使得即便处于复杂的应用环境中,也能仅保留待识别语音中来自目标发言人的目标语音内容,从而使接收到待识别语音的语音识别服务器能够进行针对性语音识别。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种信号处理方法的流程图;
图2示出了本申请实施例提供的另一种信号处理方法的流程图;
图3示出了本申请实施例提供的另一种信号处理方法的流程图;
图4示出了本申请实施例提供的另一种信号处理方法的流程图;
图5示出了本申请实施例提供的另一种信号处理方法的流程图;
图6示出了本申请实施例提供的另一种信号处理方法的流程图;
图7示出了本申请实施例提供的另一种信号处理方法的流程图;
图8示出了本申请实施例提供的一种信号处理装置的结构示意图;
图9示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的一种信号处理方法,能够大幅降低语音中的噪声和串扰,使得即便处于复杂的应用环境中,也能仅保留待识别语音中来自目标发言人的目标语音内容,从而使接收到待识别语音的语音识别服务器能够进行针对性语音识别。
参照图1所示,本申请实施例提供的一种信号处理方法的流程图,所述方法包括:
S101、接收目标路语音信号和对比信号,其中,所述目标路语音信号是第一语音接收器收录的,所述对比信号包括至少一个第二语音接收器收录的参考路语音信号或由所述参考路语音信号进行信号叠加得到的混合参考信号。
在本申请实施例中,第一语音接收器为距离目标声源最近的一个语音接收器,第二语音接收器包括至少一个,每个第二语音接收器都对应有一个距离其最近的非目标声源,第一语音接收器和第二语音接收器处于同一场景中,例如,可以在会议室中。
在一种可能的情况中,第一语音接收器在接收到目标声源发出的目标语音信号的同时,还接收到了非目标声源的非目标语音信号,将第一语音接收器接收到的信号作为目标路语音信号;第二语音接收器在接收到其对应的非目标声源发出的非目标语音信号的同时,还可能会接收到目标声源发出的目标语音信号和/或其他非目标声源发出的非目标语音信号,将第二语音接收器接收到的语音信号作为参考路语音信号。
在一种可能的实施例中,对比信号为每一第二语音接收器接收的参考路语音信号。
在另一种可能的实施例中,对比信号为将每一第二语音接收器接收的参考路语音信号叠加(混音)后得到的混合参考信号。
S102、根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述对比信号相似度大于等于阈值的信号;若所述目标路语音信号中存在所述串扰语音信号,则在所述目标路语音信号中消除所述串扰语音信号。
在本申请实施例中,将对比信号作为参考,在目标路语音信号中筛选出与对比信号相似度足够高的串扰语音信号,即目标路语音信号中与对比信号相似度达到阈值及以上的信号会被认作串扰语音信号消除。
参照图2所示,本申请实施例提供的另一种信号处理方法的流程图,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,在接收目标路语音信号和对比信号之后,所述方法还包括:
S201、判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号。
在一种可能的情况中,目标路语音信号和/或参考路语音信号中可能会混入噪声信号,在将对比信号作为参考和目标路语音信号进行对比之前,先对存在噪声信号的目标路语音信号和/或参考路语音信号进行去躁处理,去除其中的噪声信号,其中,噪声信号包括但不限于:交通噪声信号,工业噪声信号,建筑施工噪声信号,社会生活噪声信号,发动机噪声信号。
参照图3所示,本申请实施例提供的另一种信号处理方法的流程图,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,在对所述参考路语音信号进行信号叠加之前,所述方法还包括:
S301、判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号。
在一种可能的情况中,目标路语音信号和/或参考路语音信号中可能会混入噪声信号,在将对比信号作为参考和目标路语音信号进行对比之前,先对存在噪声信号的目标路语音信号和/或参考路语音信号进行去躁处理,去除其中的噪声信号,其中,噪声信号包括但不限于:交通噪声信号,工业噪声信号,建筑施工噪声信号,社会生活噪声信号,发动机噪声信号。
S302、将每一无噪声参考路语音信号进行叠加,得到所述混合参考信号,其中,所述无噪声参考路语音信号包括:不存在噪声信号的参考路语音信号和完成去躁处理的参考路语音信号。
在去除存在的噪声信号之后,再对每一无噪声参考路语音信号进行叠加得到混合参考信号(即对比信号),无噪声参考路语音信号包括不存在噪声信号的参考路语音信号和完成去躁处理的参考路语音信号。
参照图4所示,本申请实施例提供的另一种信号处理方法的流程图,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
S401、针对每一所述参考路语音信号,根据所述目标路语音信号与该参考路语音信号之间相似度,判断所述目标路语音信号中是否存在所述串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和该参考路语音信号相似度大于等于阈值的信号。
当对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,即把每一第二语音接收器收录的每一参考路语音信号都作为一个对比信号。将每一参考路语音信号(对比信号)作为参照,判断目标路语音信号中是否存在与参考路语音信号(对比信号)相似度大于等于阈值的串扰语音信号,若存在则将其消除。例如,若存在10个参考路语音信号(对比信号),则根据这10个参考路语音信号(对比信号)依次分别对目标路语音信号进行10次判断。
参照图5所示,本申请实施例提供的另一种信号处理方法的流程图,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
S501、根据所述目标路语音信号与所述混合参考信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述混合参考信号相似度大于等于阈值的信号。
当对比信号为由每一参考路语音信号进行信号叠加得到的混合参考信号时,将混合参考信号(对比信号)作为参照,判断目标路语音信号中是否存在与混合参考信号(对比信号)相似度大于等于阈值的串扰语音信号,若存在则将串扰语音信号消除。
参照图6所示,本申请实施例提供的另一种信号处理方法的流程图,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述方法包括:
S601、针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的阈值,其中,所述阈值与所述距离呈负相关的关系。
本申请实施例中,根据第一语音接收器和每一第二语音接收器之间的距离,确定每一参考路语音信号对应的阈值的大小。例如,假定第一语音接收器与某一第二语音接收器的距离为3米,则阈值为a,即目标路语音信号中与该第二语音接收器收录的参考路语音信号(对比信号)的相似程度达到a及以上的信号会被判定做串扰语音信号,若第一语音接收器与某一第二语音接收器的距离为5米,则阈值为b(a>b)。其中,距离越小,阈值越大;相反,距离越大,阈值越小,二者为非线性负相关,且阈值大于0小于1。
参照图7所示,本申请实施例提供的另一种信号处理方法的流程图,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述方法包括:
S701、针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的第一阈值,其中,所述第一阈值与所述距离呈负相关的关系。
本申请实施例中,根据第一语音接收器和组成混合参考信号(对比信号)的每一参考路语音信号对应的每一第二语音接收器之间的距离,确定组成混合参考信号(对比信号)的每一参考路语音信号对应的第一阈值的大小。例如,假定第一语音接收器与某一第二语音接收器的距离为2米,则第一阈值为c,即目标路语音信号中与该第二语音接收器收录的参考路语音信号的相似程度达到c及以上的信号会被判定做串扰语音信号,若第一语音接收器与另一第二语音接收器的距离为4米,则第一阈值为d(c>d)。其中,距离越小,第一阈值越大;相反,距离越大,第一阈值越小,二者为非线性负相关,且第一阈值大于0小于1。
S702、根据每一所述第一阈值,确定所述混合参考信号对应的阈值。
例如,混合参考信号(对比信号)是由三个第二语音接器收录的三个参考路语音信号叠加得到的。在确定了该三个参考路语音信号分别对应的第一阈值后,根据该三个第一阈值确定由这三个参考路语音信号叠加而成的混合参考信号(对比信号)对应的阈值,其中,阈值大于0小于1。
基于同一发明构思,本申请实施例中还提供了与实施例中信号处理方法对应的信号处理装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述信号处理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图8所示,本申请实施例提供了一种信号处理装置的结构示意图,所述装置包括:
语音接收器801,用于接收目标路语音信号和对比信号,其中,所述目标路语音信号是第一语音接收器收录的,所述对比信号包括至少一个第二语音接收器收录的参考路语音信号或由所述参考路语音信号进行信号叠加得到的混合参考信号;
串扰消除模块802,用于根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述对比信号相似度大于等于阈值的信号;若所述目标路语音信号中存在所述串扰语音信号,则在所述目标路语音信号中消除所述串扰语音信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,在接收目标路语音信号和对比信号之后,所述装置还包括:
噪声消除模块,用于判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,在对所述参考路语音信号进行信号叠加之前,所述装置还包括:
噪声消除模块,判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号;
混音模块,将每一无噪声参考路语音信号进行叠加,得到所述混合参考信号,其中,所述无噪声参考路语音信号包括:不存在噪声信号的参考路语音信号和完成去躁处理的参考路语音信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
串扰消除模块802,还用于针对每一所述参考路语音信号,根据所述目标路语音信号与该参考路语音信号之间相似度,判断所述目标路语音信号中是否存在所述串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和该参考路语音信号相似度大于等于阈值的信号。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
串扰消除模块802,还用于根据所述目标路语音信号与所述混合参考信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述混合参考信号相似度大于等于阈值的信号。
在一种可能的实施方式中,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述装置还包括:
第一阈值确定模块,用于针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的阈值,其中,所述阈值与所述距离呈负相关的关系。
在一种可能的实施方式中,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述装置还包括:
第一阈值确定模块,还用于针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的第一阈值,其中,所述第一阈值与所述距离呈负相关的关系;
第二阈值确定模块,用于根据每一所述第一阈值,确定所述混合参考信号对应的阈值。
本申请实施例提供的一种信号处理装置,能够大幅降低语音中的噪声和串扰,使得即便处于复杂的应用环境中,也能仅保留待识别语音中来自目标发言人的目标语音内容,从而使接收到待识别语音的语音识别服务器能够进行针对性语音识别。
如图9所示,本申请实施例提供的一种电子设备900,包括:处理器901、存储器902和总线,所述存储器902存储有所述处理器901可执行的机器可读指令,当电子设备运行时,所述处理器901与所述存储器902之间通过总线通信,所述处理器901执行所述机器可读指令,以执行如上述信号处理方法的步骤。
具体地,上述存储器902和处理器901能够为通用的存储器和处理器,这里不做具体限定,当处理器901运行存储器902存储的计算机程序时,能够执行上述信号处理方法。
对应于上述信号处理方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述信号处理方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种信号处理方法,其特征在于,所述方法包括:
接收目标路语音信号和对比信号,其中,所述目标路语音信号是第一语音接收器收录的,所述对比信号包括至少一个第二语音接收器收录的参考路语音信号或由所述参考路语音信号进行信号叠加得到的混合参考信号;
根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述对比信号相似度大于等于阈值的信号;
若所述目标路语音信号中存在所述串扰语音信号,则在所述目标路语音信号中消除所述串扰语音信号;
当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
针对每一所述参考路语音信号,根据所述目标路语音信号与该参考路语音信号之间相似度,判断所述目标路语音信号中是否存在所述串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和该参考路语音信号相似度大于等于阈值的信号;
当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述方法包括:
针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的阈值,其中,所述阈值与所述距离呈负相关的关系。
2.根据权利要求1所述的信号处理方法,其特征在于,当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,在接收目标路语音信号和对比信号之后,所述方法还包括:
判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;
对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号。
3.根据权利要求1所述的信号处理方法,其特征在于,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,在对所述参考路语音信号进行信号叠加之前,所述方法还包括:
判断候选语音信号中是否存在噪声信号,其中,所述候选语音信号包括:所述目标路语音信号和所述参考路语音信号;
对存在噪声的所述候选语音信号进行去噪处理,去除所述噪声信号;
将每一无噪声参考路语音信号进行叠加,得到所述混合参考信号,其中,所述无噪声参考路语音信号包括:不存在噪声信号的参考路语音信号和完成去躁处理的参考路语音信号。
4.根据权利要求1所述的信号处理方法,其特征在于,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
根据所述目标路语音信号与所述混合参考信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;
其中,所述串扰语音信号为所述目标路语音信号中和所述混合参考信号相似度大于等于阈值的信号。
5.根据权利要求4所述的信号处理方法,其特征在于,当所述对比信号为由所述参考路语音信号进行信号叠加得到的混合参考信号时,所述方法包括:
针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的第一阈值,其中,所述第一阈值与所述距离呈负相关的关系;
根据每一所述第一阈值,确定所述混合参考信号对应的阈值。
6.一种信号处理装置,其特征在于,所述装置包括:
语音接收器,用于接收目标路语音信号和对比信号,其中,所述目标路语音信号是第一语音接收器收录的,所述对比信号包括至少一个第二语音接收器收录的参考路语音信号或由所述参考路语音信号进行信号叠加得到的混合参考信号;
串扰消除模块,用于根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和所述对比信号相似度大于等于阈值的信号;若所述目标路语音信号中存在所述串扰语音信号,则在所述目标路语音信号中消除所述串扰语音信号;
当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述根据所述目标路语音信号与所述对比信号之间相似度,判断所述目标路语音信号中是否存在串扰语音信号,包括:
串扰消除模块,还用于针对每一所述参考路语音信号,根据所述目标路语音信号与该参考路语音信号之间相似度,判断所述目标路语音信号中是否存在所述串扰语音信号;其中,所述串扰语音信号为所述目标路语音信号中和该参考路语音信号相似度大于等于阈值的信号;
当所述对比信号为包括至少一个第二语音接收器收录的参考路语音信号时,所述装置包括:
第一阈值确定模块,用于针对每个所述第二语音接收器,根据所述第一语音接收器和该第二语音接收器之间的距离,确定该第二语音接收器收录的参考路语音信号对应的阈值,其中,所述阈值与所述距离呈负相关的关系。
7.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至5任一项所述的信号处理方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至5任一项所述的信号处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110114570.3A CN112435659B (zh) | 2021-01-28 | 2021-01-28 | 一种信号处理方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110114570.3A CN112435659B (zh) | 2021-01-28 | 2021-01-28 | 一种信号处理方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112435659A CN112435659A (zh) | 2021-03-02 |
CN112435659B true CN112435659B (zh) | 2021-04-30 |
Family
ID=74697361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110114570.3A Active CN112435659B (zh) | 2021-01-28 | 2021-01-28 | 一种信号处理方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112435659B (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10171908B1 (en) * | 2015-07-27 | 2019-01-01 | Evernote Corporation | Recording meeting audio via multiple individual smartphones |
KR102088216B1 (ko) * | 2018-10-31 | 2020-03-12 | 김정근 | 자동 통역 시스템에서 크로스토크를 감소시키는 방법 및 장치 |
CN110798580B (zh) * | 2019-11-12 | 2021-08-17 | 深圳市瑞讯云技术有限公司 | 远程多方语音会议的噪声去除方法、装置及电子设备 |
CN110992972B (zh) * | 2019-11-20 | 2023-11-14 | 佳禾智能科技股份有限公司 | 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质 |
CN111105811B (zh) * | 2019-12-31 | 2023-04-07 | 西安讯飞超脑信息科技有限公司 | 声音信号的处理方法、相关设备及可读存储介质 |
CN111477240B (zh) * | 2020-04-07 | 2023-04-07 | 浙江同花顺智能科技有限公司 | 音频处理方法、装置、设备和存储介质 |
CN111883166B (zh) * | 2020-07-17 | 2024-05-10 | 北京百度网讯科技有限公司 | 一种语音信号处理方法、装置、设备以及存储介质 |
-
2021
- 2021-01-28 CN CN202110114570.3A patent/CN112435659B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112435659A (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2016095218A1 (en) | Speaker identification using spatial information | |
CN108922553B (zh) | 用于音箱设备的波达方向估计方法及系统 | |
CN108140398B (zh) | 用于基于多个音频馈源来标识来自兴趣源的声音的方法和系统 | |
CN109644192B (zh) | 具有语音检测周期持续时间补偿的音频传送方法和设备 | |
US20170243581A1 (en) | Using combined audio and vision-based cues for voice command-and-control | |
US20130253932A1 (en) | Conversation supporting device, conversation supporting method and conversation supporting program | |
US20180109874A1 (en) | User Experience Oriented Audio Signal Processing | |
CN107578770A (zh) | 网络电话语音识别方法、装置、计算机设备和存储介质 | |
US10789954B2 (en) | Transcription presentation | |
CN112435659B (zh) | 一种信号处理方法、装置、电子设备及介质 | |
US11600279B2 (en) | Transcription of communications | |
WO2013132216A1 (en) | Method and apparatus for determining the number of sound sources in a targeted space | |
US11081125B2 (en) | Noise cancellation in voice communication systems | |
JP2017097160A (ja) | 音声処理装置、音声処理方法、およびプログラム | |
CN113707149A (zh) | 音频处理方法和装置 | |
JP2002315089A (ja) | 話者方向検出回路 | |
CN112542157A (zh) | 语音处理方法、装置、电子设备及计算机可读存储介质 | |
CN111899738A (zh) | 对话生成方法、装置及存储介质 | |
US10580410B2 (en) | Transcription of communications | |
CN113066504A (zh) | 音频传输方法、装置及计算机存储介质 | |
CN112542178B (zh) | 音频数据处理方法及装置 | |
JP2020024310A (ja) | 音声処理システム及び音声処理方法 | |
CN111401152B (zh) | 人脸识别方法及装置 | |
CN112788278B (zh) | 视频流的生成方法、装置、设备及存储介质 | |
WO2022079773A1 (ja) | 分析装置、システム、方法及びプログラムが格納された非一時的なコンピュータ可読媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |