CN115798493A - 降噪方法、降噪装置和执法记录仪 - Google Patents

降噪方法、降噪装置和执法记录仪 Download PDF

Info

Publication number
CN115798493A
CN115798493A CN202211351561.7A CN202211351561A CN115798493A CN 115798493 A CN115798493 A CN 115798493A CN 202211351561 A CN202211351561 A CN 202211351561A CN 115798493 A CN115798493 A CN 115798493A
Authority
CN
China
Prior art keywords
characteristic value
noise reduction
background noise
voice
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211351561.7A
Other languages
English (en)
Inventor
涂贤玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN202211351561.7A priority Critical patent/CN115798493A/zh
Publication of CN115798493A publication Critical patent/CN115798493A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供一种降噪方法、降噪装置和执法记录仪,涉及语音处理技术领域,该降噪方法包括:获取至少两个语音采集设备各自采集的采样信号;基于背景噪声特征值对采样信号进行降噪处理,得到至少两个语音采集设备各自对应的语音信号;基于至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;在检测到声源位置信息发生变化的情况下,更新背景噪声特征值。本发明提供的技术方案能够提高执法记录仪的录音质量。

Description

降噪方法、降噪装置和执法记录仪
技术领域
本发明涉及语音处理技术领域,尤其涉及一种降噪方法、降噪装置和执法记录仪。
背景技术
执法记录仪是执法人员随身佩带的取证设备,可以集实时视音频摄录、照相、录音和定位等功能于一体,能够对执法过程进行现场情况的数字化记录。
相关技术中,执法记录仪使用单麦克风进行录音,而实际应用中,受各种复杂应用环境条件的影响,单麦克风采集的语音信号会掺杂噪声,导致录音质量不佳。
发明内容
本发明提供一种降噪方法、降噪装置和执法记录仪,以提高执法记录仪的录音质量。
本发明提供一种降噪方法,应用于执法记录仪,所述执法记录仪包括至少两个语音采集设备,所述降噪方法包括:
获取所述至少两个语音采集设备各自采集的采样信号;
基于背景噪声特征值对所述采样信号进行降噪处理,得到所述至少两个语音采集设备各自对应的语音信号;
基于所述至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;
在检测到所述声源位置信息发生变化的情况下,更新所述背景噪声特征值。
根据本发明提供的一种降噪方法,还包括:
根据所述声源位置信息对所述语音信号进行语音增强处理,得到目标语音信号;
保存所述目标语音信号。
根据本发明提供的一种降噪方法,所述更新所述背景噪声特征值,包括:
获取所述声源位置信息发生变化的变化时刻前,第一时间段内所述至少两个语音采集设备各自采集的采样信号段;
从所述采样信号段中提取背景噪声;
对所述背景噪声进行音频特征提取,得到所述目标噪声特征值;
将所述背景噪声特征值更新为所述目标噪声特征值。
根据本发明提供的一种降噪方法,所述更新所述背景噪声特征值,包括:
在检测到所述声源位置信息发生变化的情况下,获取所述声源位置信息的变化量;
根据所述变化量确定噪声调整系数;
基于所述噪声调整系数对所述背景噪声特征值进行调整。
根据本发明提供的一种降噪方法,还包括:
接收用于选择目标场景的选择指令;
根据所述选择指令确定目标场景;
获取所述目标场景对应的噪声特征值,得到所述背景噪声特征值。
根据本发明提供的一种降噪方法,还包括:
在每次开启录音后,获取开启时刻后的第二时间段内,所述至少两个语音采集设备各自采集的初始采样信号;
提取所述初始采样信号的音频特征,得到所述背景噪声特征值。
根据本发明提供的一种降噪方法,所述提取所述初始采样信号的音频特征,得到所述背景噪声特征值,包括:
获取所述初始采样信号的时域幅值,并基于第一修正系数对所述时域幅值进行修正,得到目标时域特征值;
和/或,对所述初始采样信号进行傅里叶变换,得到频域特征值,并基于第二修正系数对所述频域特征值进行修正,得到目标频域特征值;
其中,所述背景噪声特征值包括所述目标时域特征值和所述目标频域特征值中的至少一个。
根据本发明提供的一种降噪方法,还包括:
响应于检测到修正系数调整指令,显示修正系数调整界面,所述修正系数调整界面中包括第一修正系数调整控件和第二修正系数调整控件;
响应于面向所述第一修正系数调整控件的调整操作,调整所述第一修正系数;
响应于面向所述第二修正系数调整控件的调整操作,调整所述第二修正系数。
本发明还提供一种降噪装置,应用于执法记录仪,所述执法记录仪包括至少两个语音采集设备,所述降噪装置包括:
获取模块,用于获取所述至少两个语音采集设备各自采集的采样信号;
降噪模块,用于基于背景噪声特征值对所述采样信号进行降噪处理,得到所述至少两个语音采集设备各自对应的语音信号;
定位模块,用于基于所述至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;
更新模块,用于在检测到所述声源位置信息发生变化的情况下,更新所述背景噪声特征值。
本发明还提供一种执法记录仪,包括存储器、处理器、与所述处理器连接的至少两个语音采集设备、及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述降噪方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述降噪方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述降噪方法。
本发明提供的降噪方法、降噪装置和执法记录仪,通过至少两个语音采集设备采集采样信号,然后基于背景噪声特征值对采样信号进行降噪处理,得到各语音采集设备各自对应的语音信号,接着基于各语音采集设备对应的语音信号进行声源定位,得到声源位置信息,在声源位置信息发生变化时,更新背景噪声特征值。这样,通过对执法记录仪的至少两路采样信号进行基于背景噪声特征值的降噪处理,可以滤除采样信号中的背景噪声,提高了语音采集设备采集的语音信号的质量,从而提高了执法记录仪的录音效果;而且,对采样信号进行降噪处理的背景噪声特征值可以基于声源位置信息动态更新,能够适应环境的变化,进一步提高了录音质量。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的降噪方法的流程示意图之一;
图2是本发明实施例提供的降噪方法的流程示意图之二;
图3是本发明实施例提供的降噪装置的结构示意图;
图4是本发明实施例提供的执法记录仪的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明中为描述的对象所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。
下面结合图1-图2对本发明的执法记录仪的降噪方法进行描述。该降噪方法可以应用于执法记录仪,也可以应用于设置在执法记录仪中的降噪装置中,该降噪装置可以通过软件、硬件或两者的结合来实现。
图1示例性示出了本发明实施例提供的降噪方法的流程示意图之一,参照图1所示,该降噪方法可以包括如下的步骤110~步骤140。
步骤110:获取至少两个语音采集设备各自采集的采样信号。
在本发明实施例中,执法记录仪可以包括至少两个语音采集设备,该语音采集设备比如可以包括拾音器或麦克风。执法记录仪可以通过该至少两个语音采集设备分别采集采样信号。
步骤120:基于背景噪声特征值对采样信号进行降噪处理,得到至少两个语音采集设备各自对应的语音信号。
背景噪声特征值可以表征背景噪声的特征,示例性的,执法记录仪的每个语音采集设备可以有各自对应的背景噪声特征值,对于每一路语音采集设备采集的采样信号,可以利用该路语音采集设备对应的背景噪声特征值对该路的采样信号进行降噪处理,得到各语音采集设备对应的语音信号。
例如,执法记录仪可以包括两个麦克风,比如包括麦克风1和麦克风2,这两个麦克风可以形成一定角度的拾音点,比如形成90°夹角的两个拾音点,执法记录仪可以利用这两个麦克风分别获取各自拾音范围内的采样信号。假设麦克风1对应的背景噪声特征值为E1,采集的采样信号为S1,麦克风2对应的背景噪声特征值为E2,采集的采样信号为S2,则可以利用背景噪声特征值E1对采样信号S1进行降噪处理,得到语音信号Y1,利用背景噪声特征值E2对采样信号S2进行降噪处理,得到语音信号Y2。
示例性的,可以在每次开启录音时确定背景噪声特征值的初始值,比如可以采集开启录音后预设时长(如10s)的初始采样信号,将从该初始采样信号提取的音频特征值作为初始的背景噪声特征值。或者,在每次开启录音时,也可以从预先设置的初始背景噪声特征值集合中,为每个语音采集设备选择初始的背景噪声特征值,比如可以预先建立应用场景与噪声特征值的对应关系,在开启录音后,可以基于选定的应用场景从该对应关系中匹配出对应的噪声特征值作为初始的背景噪声特征值。
步骤130:基于至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息。
通过降噪处理获取到每个语音采集设备的语音信号之后,可以基于各语音采集设备的语音信号对声源进行定位,得到声源位置信息,该声源位置信息可以反映声源点相对于语音采集设备的到达方向和距离等,其中的到达方向可以包括方位角和俯仰角等。
例如,执法记录仪包括麦克风1和麦克风2,对麦克风1和麦克风2采集的采样信号分别进行降噪处理后得到语音信号Y1和语音信号Y2,可以基于语音信号Y1与语音信号Y2的时延以及麦克风1和麦克风2之间的距离,利用声学定位原理对声源进行定位,得到声源位置信息。可以理解的是,这里以执法记录仪包括两个麦克风为例进行说明,对于执法记录仪包括三个或三个以上麦克风的情况,也可以根据各麦克风的语音信号,利用声源定位原理确定出声源位置信息。
步骤140:在检测到声源位置信息发生变化的情况下,更新背景噪声特征值。
获取到声源位置信息后,判断该声源位置信息是否发生变化,在声源位置信息发生变化时,对背景噪声特征值进行更新。比如,可以根据声源位置信息的变化量调整背景噪声特征值;或者,可以根据声源位置信息发生变化前的采样信号确定目标噪声特征值,将背景噪声特征值更新为该目标噪声特征值。
可选的,背景噪声特征值也可以基于设定的时间段周期性地更新。
这样,通过对背景噪声特征值进行基于声源位置信息的动态更新,或基于设定的时间段周期性地更新等,使得背景噪声特征值可以跟随环境的变化而变化,反映出更接近当前环境的背景噪声的特点,从而使得基于该背景噪声特征值对采样信号进行降噪处理的效果更佳,进而提高了所录制语音的质量。
本发明提供的降噪方法,通过至少两个语音采集设备采集采样信号,然后基于背景噪声特征值对采样信号进行降噪处理,得到各语音采集设备各自对应的语音信号,接着基于各语音采集设备对应的语音信号进行声源定位,得到声源位置信息,在声源位置信息发生变化时,更新背景噪声特征值。这样,通过对执法记录仪的至少两路采样信号进行基于背景噪声特征值的降噪处理,可以滤除采样信号中的背景噪声,提高了语音采集设备采集的语音信号的质量,从而提高了执法记录仪的录音效果;而且,对采样信号进行降噪处理的背景噪声特征值可以基于声源位置信息动态更新,能够适应环境的变化,进一步提高了录音质量。
基于图1对应实施例的降噪方法,在一种示例实施例中,获得声源位置信息之后,还可以根据声源位置信息对语音信号进行语音增强处理,得到目标语音信号。
具体的,得到声源位置信息之后,可以根据声源位置信息确定声源落入各语音采集设备的采样范围的采样扇区,可以对该采样扇区的语音信号进行增强处理,得到目标语音信号。
例如,以执法记录仪包括麦克风1和麦克风2为例,麦克风1的采样信号经降噪处理后得到语音信号Y1,麦克风2的采样信号经降噪处理后得到语音信号Y2。假设麦克风1的采样范围可以划分为A1、A2、A3和A4共4个连续的采样扇区,麦克风2的采样范围可以划分为B1、B2和B3共3个连续的采样扇区,若根据声源位置信息确定声源落在了麦克风1的A4扇区和麦克风2的B2扇区,则可以在融合语音信号Y1和语音信号Y2时,将语音信号Y1中对应于A4扇区的信号和语音信号Y2中对应于B2扇区的信号进行增强,其中的增强比如可以是乘以大于1的放大倍数,或者可以乘以大于其他采样扇区的放大倍数,最终得到所需的目标语音信号。
这样,通过声源定位和语音增强,可以将声源所在方位的语音信号进行增强而抑制其他方位的语音信号,得到的目标语音信号更多地反映了声源的特征,有效降低了背景噪声的影响,进一步提高了执法记录仪所录语音的质量。
得到目标语音信号之后,将该目标语音信号进行保存,实现执法记录仪的录音功能。
基于图1对应实施例的降噪方法,在一种示例实施例中,在检测到声源位置信息发生变化的情况下,或更新背景噪声特征值的时间间隔大于时间间隔阈值的情况下,可以根据更新规则确定目标噪声特征值;将背景噪声特征值更新为目标噪声特征值。
在一种可选的实施方式中,可以利用声源位置信息发生变化的变化时刻前,固定时长的采样信号对背景噪声特征值进行更新。具体的,更新背景噪声特征值可以包括:获取声源位置信息发生变化的变化时刻前,第一时间段内至少两个语音采集设备各自采集的采样信号段;从采样信号段中提取背景噪声;对该背景噪声进行音频特征提取,得到目标噪声特征值;将背景噪声特征值更新为目标噪声特征值。
例如,执法记录仪包括麦克风1和麦克风2,在t1时刻,检测到声源位置信息发生了变化,此时,执法记录仪可以获取t1时刻前,时长为T的时间段内麦克风1采集的采样信号段ΔS1和麦克风2采集的采样信号段ΔS2。接着从采样信号段ΔS1中提取出背景噪声ΔC1,从采样信号段ΔS2中提取出背景噪声ΔC2,然后分别提取背景噪声ΔC1和背景噪声ΔC2的音频特征,得到麦克风1的目标噪声特征值ΔE1和麦克风2的目标噪声特征值ΔE2。之后,可以将麦克风1的背景噪声特征值更新为ΔE1,将麦克风2的背景噪声特征值更新为ΔE2,实现背景噪声特征值的更新。这样,可以根据声源位置的变化实时更新背景噪声特征值,使背景噪声特征值能够反映出更接近当前环境的背景噪声的特点,提高采样信号的降噪效果。
其中,从采样信号段中提取出背景噪声比如可以是,从采样信号段中去除通过降噪处理得到的语音信号段。比如,针对麦克风1,可以获取T时间段内通过降噪处理得到的语音信号ΔY1,从采样信号段ΔS1中去除语音信号ΔY1,得到背景噪声ΔC1。
在另一种可选的实施方式中,可以根据声源位置的变化量调整背景噪声特征值。具体的,更新背景噪声特征值可以包括:在检测到声源位置信息发生变化的情况下,获取声源位置信息的变化量;根据变化量确定噪声调整系数;基于噪声调整系数对背景噪声特征值进行调整。
例如,可以预先建立噪声调整映射表,在该噪声调整映射表中存储声源位置信息的变化量与噪声调整系数的映射关系,当检测到声源从P1位置变化P2位置时,可以根据P1和P2计算得到声源位置信息的变化量ΔP,然后基于变化量ΔP,从噪声调整映射表中匹配出噪声调整系数,利用预先建立的噪声调整系数与背景噪声特征值的函数关系计算出目标噪声特征值,比如可以将当前的背景噪声特征值乘以匹配出噪声调整系数,得到目标噪声特征值,然后将当前的背景噪声特征值更新为该目标噪声特征值,实现背景噪声特征值的调整。
在一种示例实施例中,也可以由用户主动更新背景噪声特征值。具体的,本发明实施例提供的降噪方法还可以包括:在检测到更新背景噪声特征值的更新指令时,接收面向噪声特征值调整按键的调整操作;根据调整操作确定目标噪声特征值。
例如,执法记录仪上可以设置噪声更新物理按键和噪声特征值调整按键,噪声更新物理按键可以用于触发背景噪声特征值的更新功能,噪声特征值调整按键用于调整背景噪声特征值的大小。示例性的,噪声特征值调整按键可以是旋钮按键,该旋钮按键的不同旋转位置可以对应着不同的调整系数,当噪声更新物理按键被触发时,用户可以通过该旋钮按键选择调整系数,执法记录仪根据用户在噪声特征值调整按键的调整操作,获取旋钮按键当前的旋转位置信息,根据该旋转位置信息确定调整系数,基于该调整系数和当前的背景噪声特征值确定目标噪声特征值。示例性的,噪声特征值调整按键也可以是在执法记录仪显示界面中显示的调整控件,用户可以通过该调整控件增大或减小调整系数,执法记录仪根据用户面向该调整控件的调整操作,确定调整系数,基于该调整系数和当前的背景噪声特征值确定目标噪声特征值。
基于图1对应实施例的降噪方法,在一种示例实施例中,该降噪方法还可以包括确定背景噪声特征值的初始值的步骤。在一种可选的实施方式中,可以由用户根据执法记录仪具体的应用场景设置背景噪声特征值的初始值,该初始值作为执法记录仪开始录音时的背景噪声特征值。具体的,该降噪方法还可以包括:接收用于选择目标场景的选择指令;根据该选择指令确定目标场景;获取目标场景对应的噪声特征值,得到目标噪声特征值。
例如,在每次开启录音前,用户可以根据执法记录仪的应用场景,通过执法记录仪上的目标场景选择按键进行目标场景的选择。其中的目标场景选择按键可以是设置于执法记录仪上的物理按键,也可以是显示界面上显示的目标场景选择控件,用户可以通过该物理按键或目标场景选择控件进行场景选择。其中,执法记录仪提供的可选场景,比如可以包括:户外场景、室内场景、喧闹环境场景和安静环境场景等其中的至少一个,但不限于此。执法记录仪接收用于选择目标场景的选择指令,该选择指令比如指示选择的是室内场景,则确定目标场景为室内场景,然后可以从场景与噪声特征值的映射关系表中查找出室内场景对应的噪声特征值。开启录音后,执法记录仪可以以该噪声特征值为背景噪声特征值,对采集的采样信号进行降噪处理。这样,可以根据执法记录仪使用场景的不同,选取合适的背景噪声特征值,以对采样信号进行较好的降噪处理。
在另一种可选的实施方式中,执法记录仪也可以根据当前的使用环境自动确定背景噪声特征值。具体的,本发明实施例提供的降噪方法还可以包括:在每次开启录音后,获取开启时刻后的第二时间段内,至少两个语音采集设备各自采集的初始采样信号;提取初始采样信号的音频特征,得到背景噪声特征值。
例如,以执法记录仪包括麦克风1和麦克风2两个麦克风为例,每次开启录音后,执法记录仪可以获取最开始t2时长内麦克风1和麦克风2采集的初始采样信号,得到初始采样信号S1t2和初始采样信号S2t2,然后提取初始采样信号S1t2的音频特征,得到麦克风1对应的背景噪声特征值,提取初始采样信号S2t2的音频特征,得到麦克风2对应的背景噪声特征值。在后续的录音过程中,麦克风1和麦克风2各自的背景噪声特征值可以基于噪声更新条件动态更新,该噪声更新条件比如可以包括:声源位置信息发生变化,或更新背景噪声特征值的时间间隔大于时间间隔阈值等。
这样,通过将执法记录仪开启录音后第二时间段内的采样信号的音频特征作为背景噪声特征值,可以自动获取到符合当前应用场景下的背景噪声,智能化程度高,且得到的背景噪声特征值可以较好地反映当前环境下的背景噪声的特点,能够提高采样信号降噪处理的效果。
示例性的,背景噪声特征值可以是时域的音频特征,也可以是频域的音频特征,或者可以是时域和频域的音频特征。示例性,背景噪声特征值可以是提取到的初始采样信号的音频特征值,也可以是对提取的该音频特征值进行修正后得到,比如乘以相应的修正系数得到。具体的,提取初始采样信号的音频特征,得到背景噪声特征值,可以包括:获取初始采样信号的时域幅值,并基于第一修正系数对该时域幅值进行修正,得到目标时域特征值;和/或,对初始采样信号进行傅里叶变换,得到频域特征值,并基于第二修正系数对频域特征值进行修正,得到目标频域特征值;其中,背景噪声特征值包括目标时域特征值和目标频域特征值中的至少一个。
示例性的,第一修正系数和第二修正系数可以由用户进行调整。具体的,该降噪方法还可以包括:响应于检测到修正系数调整指令,显示修正系数调整界面,修正系数调整界面中包括第一修正系数调整控件和第二修正系数调整控件;响应于面向第一修正系数调整控件的调整操作,调整第一修正系数;响应于面向第二修正系数调整控件的调整操作,调整第二修正系数。
例如,执法记录仪上可以设置用于激活修正系数调整功能的激活按键,当检测到该激活按键被触发时,显示修正系数调整界面,在该界面上可以提供第一修正系数调整控件和第二修正系数调整控件,用户可以通过第一修正系数调整控件调整第一修正系数,通过第二修正系数调整控件调整第二修正系数。示例性的,第一修正系数调整控件可以指示第一修正系数的调整范围,第二修正系数调整控件可以指示第二修正系数的调整范围。这样,通过对第一修正系数和/或第二修正系数的调整,可以对背景噪声特征值的初始值进行调整,比如,用户可以根据执法记录仪当前的使用环境进行调整,以适配当前环境,比如在嘈杂的环境中可以适当地调大修正系数,在安静的环境中可以适当地调小修正系数。
基于上述各实施例的降噪方法,下面以以执法记录仪包括麦克风1和麦克风2两个麦克风为例,对本发明实施例提供的降噪方法作进一步的举例说明。
图2示例性示出了本发明实施例提供的降噪方法的流程示意图之二,参照图2所示,该降噪方法可以包括如下的步骤201~步骤210。
步骤201:采集第一固定时长的初始采样信号。
每次开启录音后,执法记录仪可以获取最开始第一固定时长t2时长内麦克风1和麦克风2各自采集的初始采样信号,将得到的初始采样信号S1t2和初始采样信号S2t2作为背景噪声信号。
步骤202:提取初始采样信号的音频特征,得到背景噪声特征值。
对初始采样信号S1t2和初始采样信号S2t2分别进行音频特征提取,得到麦克风1对应的背景噪声特征值E1和麦克风2对应的背景噪声特征值E2,然后保存E1和E2,比如可以利用第一变量S01和第二变量S02记录两个麦克风当前的背景噪声特征值,将E1赋给第一变量S01,将E2赋给第二变量S02。之后,开始正常录音。
步骤203:获取双路麦克风各自采集的采样信号。
执法记录仪通过麦克风1和麦克风2采集周围环境的采样信号,得到采样信号为S1和采样信号为S2,将采样信号为S1和采样信号为S2作为执法记录仪的原始音频信号。
步骤204:对采样信号进行降噪处理,得到语音信号。
执法记录仪可以从采样信号为S1中减去第一变量S01中保存的背景噪声特征值,得到降噪处理后的语音信号Y1;从采样信号为S2中减去第二变量S02中保存的背景噪声特征值,得到降噪处理后的语音信号Y2。
步骤205:基于语音信号进行声源定位和语音增强,得到目标语音信号。
执法记录仪可以根据语音信号Y1与语音信号Y2的时延以及麦克风1与麦克风2之间的距离,利用声学定位原理对声源进行定位,得到声源位置信息。然后根据声源位置信息对语音信号Y1和语音信号Y2进行语音增强,在语音增强过程中融合语音信号Y1和语音信号Y2,得到目标语音信号。通过声源定位和语音增强,可以对麦克风采集的采样信号进行二次降噪,进一步提高所录制语音的质量。
步骤206:保存目标语音信号。
步骤207:判断声源位置是否发生变化。若发生变化,则执行步骤208,否则继续执行步骤203。
例如,若检测到声源位置信息的变化量超过变化量阈值,则可以判定声源位置发生了变化。示例性的,可以每间隔一设定时间段,判断一次声源位置是否发生变化。
在一种可选的实施方式中,还可以判断距离前次更新背景噪声特征值的时间间隔是否大于时间间隔阈值,若声源位置发生变化或距离前次更新背景噪声特征值的时间间隔大于时间间隔阈值,则执行步骤208,否则继续执行步骤203。
步骤208:获取变化时刻前第二固定时长内双路麦克风的采样信号段。
比如执法记录仪在t1时刻检测到声源位置信息发生了变化,则可以获取t1时刻前,时长为第二固定时长T的时间段内麦克风1采集的采样信号段ΔS1和麦克风2采集的采样信号段ΔS2。
步骤209:提取采样信号段中背景噪声的音频特征,得到目标噪声特征值。
示例性的,执法记录仪可以获取语音信号Y1在T时间段内的语音信号ΔY1,获取语音信号Y2在T时间段内的语音信号ΔY2,然后从采样信号段ΔS1中减去ΔY1,从采样信号段ΔS2中减去ΔY2,得到T时间段内麦克风1采集的背景噪声ΔC1和麦克风2采集的背景噪声ΔC2。然后可以分别提取背景噪声ΔC1和背景噪声ΔC2的音频特征,得到麦克风1对应的目标噪声特征值E3和麦克风2对应的目标噪声特征值E4。
在本示例实施例中,步骤208~步骤209通过历史采样信号段确定目标噪声特征值,在一种可选的实施方式中,执法记录仪也可以利用步骤201~步骤202的方法重新确定目标噪声特征值。
步骤210:将背景噪声特征值更新为目标噪声特征值。
得到麦克风1对应的目标噪声特征值E3和麦克风2对应的目标噪声特征值E4之后,执法记录仪可以将第一变量S01的值更新为E3,将第二变量S02的值更新为E4,实现背景噪声特征值的更新。之后,继续执行步骤203。
本发明实施例提供的降噪方法,可以利用两路麦克风实现执法记录仪的录音功能。一方面,在录音过程中,可以基于背景噪声特征值对麦克风采集的采样信号进行降噪处理,可以初步滤除采样信号中的背景噪声,提高采样信号的质量。然后可以对降噪处理后得到的语音信号进行声源定位和语音增强,实现采样信号的二次降噪,进一步提高了所录制语音的质量。另一方面,背景噪声特征值可以在声源位置发生变化、或距离前次更新背景噪声特征值的时间间隔大于时间间隔阈值时进行更新,能够适配环境的变化,获得反映当前环境背景噪声特点的背景噪声特征值,提高了基于背景噪声特征值的降噪效果,从而进一步提高了所录制语音的质量。
下面对本发明提供的降噪装置进行描述,下文描述的降噪装置与上文描述的降噪方法可相互对应参照。该降噪装置可以应用于执法记录仪,该执法记录仪包括至少两个语音采集设备,其中的语音采集设备可以是麦克风或拾音器等。
图3示例性示出了本发明实施例提供的降噪装置的结构示意图,参照图3所示,降噪装置300可以包括获取模块310、降噪模块320、定位模块330和更新模块340。其中:获取模块310可以用于获取至少两个语音采集设备各自采集的采样信号;降噪模块320可以用于基于背景噪声特征值对获取模块310获取的采样信号进行降噪处理,得到至少两个语音采集设备各自对应的语音信号;定位模块330可以用于基于降噪模块320得到的至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;更新模块340可以用于在检测到声源位置信息发生变化的情况下,更新背景噪声特征值。
在一种示例实施例中,降噪装置300还可以包括:增强模块,用于根据定位模块330得到的声源位置信息对语音信号进行语音增强处理,得到目标语音信号。示例性的,降噪装置300还可以包括:存储模块,用于保存增强模块得到的目标语音信号。
在一种示例实施例中,更新模块340可以包括:第一获取单元,用于在检测到声源位置信息发生变化的情况下,获取声源位置信息发生变化的变化时刻前,第一时间段内至少两个语音采集设备各自采集的采样信号段;第一提取单元,用于从采样信号段中提取背景噪声;第二提取单元,用于对背景噪声进行音频特征提取,得到目标噪声特征值;更新单元,用于将背景噪声特征值更新为目标噪声特征值。
在一种示例实施例中,更新模块340可以包括:第二获取单元,用于在检测到声源位置信息发生变化的情况下,获取声源位置信息的变化量;第一确定单元,用于根据第二获取单元获取的变化量确定噪声调整系数;第一调整单元,用于基于噪声调整系数对背景噪声特征值进行调整。
在一种示例实施例中,降噪装置300还可以包括:接收模块,用于在检测到更新背景噪声特征值的更新指令时,接收面向噪声特征值调整按键的调整操作;第一确定模块,用于根据接收模块接收的调整操作确定目标噪声特征值,并将背景噪声特征值更新为目标噪声特征值。
在一种示例实施例中,降噪装置300还可以包括第二确定模块,该第二确定模块可以用于:接收用于选择目标场景的选择指令;根据选择指令确定目标场景;获取目标场景对应的噪声特征值,得到背景噪声特征值。
在一种示例实施例中,降噪装置300还可以包括提取模块。相应的,获取模块310还可以用于在每次开启录音后,获取开启时刻后的第二时间段内,至少两个语音采集设备各自采集的初始采样信号;提取模块可以用于提取初始采样信号的音频特征,得到背景噪声特征值。
在一种示例实施例中,提取模块可以包括第三提取单元和/或第四提取单元。其中:第三提取单元可以用于获取初始采样信号的时域幅值,并基于第一修正系数对时域幅值进行修正,得到目标时域特征值;第四提取单元可以用于对初始采样信号进行傅里叶变换,得到频域特征值,并基于第二修正系数对频域特征值进行修正,得到目标频域特征值;其中,背景噪声特征值包括目标时域特征值和目标频域特征值中的至少一个。
在一种示例实施例中,提取模块还可以包括:显示单元,用于响应于检测到修正系数调整指令,显示修正系数调整界面,修正系数调整界面中包括第一修正系数调整控件和第二修正系数调整控件;第二调整单元,用于响应于面向第一修正系数调整控件的调整操作,调整第一修正系数;第三调整单元,用于响应于面向第二修正系数调整控件的调整操作,调整第二修正系数。
图4示例了一种执法记录仪的结构示意图,如图4所示,该执法记录仪可以包括:处理器(processor)410、与处理器410连接的至少两个语音采集设备450(图4中以两个语音采集设备进行示例)、通信接口(Communication Interface)420、存储器(memory)430和通信总线440。其中,处理器410、通信接口420和存储器430可以通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行上述各方法实施例提供的降噪方法,该方法比如可以包括:获取至少两个语音采集设备各自采集的采样信号;基于背景噪声特征值对采样信号进行降噪处理,得到至少两个语音采集设备各自对应的语音信号;基于至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;在检测到声源位置信息发生变化的情况下,更新背景噪声特征值。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法实施例所提供的降噪方法,该方法比如可以包括:获取至少两个语音采集设备各自采集的采样信号;基于背景噪声特征值对采样信号进行降噪处理,得到至少两个语音采集设备各自对应的语音信号;基于至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;在检测到声源位置信息发生变化的情况下,更新背景噪声特征值。
又一方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法实施例所提供的降噪方法,该方法比如可以包括:获取至少两个语音采集设备各自采集的采样信号;基于背景噪声特征值对采样信号进行降噪处理,得到至少两个语音采集设备各自对应的语音信号;基于至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;在检测到声源位置信息发生变化的情况下,更新背景噪声特征值。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种降噪方法,其特征在于,应用于执法记录仪,所述执法记录仪包括至少两个语音采集设备,所述降噪方法包括:
获取所述至少两个语音采集设备各自采集的采样信号;
基于背景噪声特征值对所述采样信号进行降噪处理,得到所述至少两个语音采集设备各自对应的语音信号;
基于所述至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;
在检测到所述声源位置信息发生变化的情况下,更新所述背景噪声特征值。
2.根据权利要求1所述的降噪方法,其特征在于,所述更新所述背景噪声特征值,包括:
获取所述声源位置信息发生变化的变化时刻前,第一时间段内所述至少两个语音采集设备各自采集的采样信号段;
从所述采样信号段中提取背景噪声;
对所述背景噪声进行音频特征提取,得到目标噪声特征值;
将所述背景噪声特征值更新为所述目标噪声特征值。
3.根据权利要求1所述的降噪方法,其特征在于,所述更新所述背景噪声特征值,包括:
获取所述声源位置信息的变化量;
根据所述变化量确定噪声调整系数;
基于所述噪声调整系数对所述背景噪声特征值进行调整。
4.根据权利要求1至3中任一项所述的降噪方法,其特征在于,还包括:
接收用于选择目标场景的选择指令;
根据所述选择指令确定目标场景;
获取所述目标场景对应的噪声特征值,得到所述背景噪声特征值。
5.根据权利要求1至3中任一项所述的降噪方法,其特征在于,还包括:
在每次开启录音后,获取开启时刻后的第二时间段内,所述至少两个语音采集设备各自采集的初始采样信号;
提取所述初始采样信号的音频特征,得到所述背景噪声特征值。
6.根据权利要求5所述的降噪方法,其特征在于,所述提取所述初始采样信号的音频特征,得到所述背景噪声特征值,包括:
获取所述初始采样信号的时域幅值,并基于第一修正系数对所述时域幅值进行修正,得到目标时域特征值;
和/或,对所述初始采样信号进行傅里叶变换,得到频域特征值,并基于第二修正系数对所述频域特征值进行修正,得到目标频域特征值;
其中,所述背景噪声特征值包括所述目标时域特征值和所述目标频域特征值中的至少一个。
7.根据权利要求6所述的降噪方法,其特征在于,还包括:
响应于检测到修正系数调整指令,显示修正系数调整界面,所述修正系数调整界面中包括第一修正系数调整控件和第二修正系数调整控件;
响应于面向所述第一修正系数调整控件的调整操作,调整所述第一修正系数;
响应于面向所述第二修正系数调整控件的调整操作,调整所述第二修正系数。
8.一种降噪装置,其特征在于,应用于执法记录仪,所述执法记录仪包括至少两个语音采集设备,所述降噪装置包括:
获取模块,用于获取所述至少两个语音采集设备各自采集的采样信号;
降噪模块,用于基于背景噪声特征值对所述采样信号进行降噪处理,得到所述至少两个语音采集设备各自对应的语音信号;
定位模块,用于基于所述至少两个语音采集设备各自对应的语音信号进行声源定位,得到声源位置信息;
更新模块,用于在检测到所述声源位置信息发生变化的情况下,更新所述背景噪声特征值。
9.一种执法记录仪,其特征在于,包括存储器、处理器、与所述处理器连接的至少两个语音采集设备、及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述降噪方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述降噪方法。
CN202211351561.7A 2022-10-31 2022-10-31 降噪方法、降噪装置和执法记录仪 Pending CN115798493A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211351561.7A CN115798493A (zh) 2022-10-31 2022-10-31 降噪方法、降噪装置和执法记录仪

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211351561.7A CN115798493A (zh) 2022-10-31 2022-10-31 降噪方法、降噪装置和执法记录仪

Publications (1)

Publication Number Publication Date
CN115798493A true CN115798493A (zh) 2023-03-14

Family

ID=85434695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211351561.7A Pending CN115798493A (zh) 2022-10-31 2022-10-31 降噪方法、降噪装置和执法记录仪

Country Status (1)

Country Link
CN (1) CN115798493A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117238312A (zh) * 2023-08-28 2023-12-15 深蓝感知(杭州)物联科技有限公司 一种执法记录仪背景声音放大方法与系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117238312A (zh) * 2023-08-28 2023-12-15 深蓝感知(杭州)物联科技有限公司 一种执法记录仪背景声音放大方法与系统
CN117238312B (zh) * 2023-08-28 2024-05-03 深蓝感知(杭州)物联科技有限公司 一种执法记录仪背景声音放大方法与系统

Similar Documents

Publication Publication Date Title
JP7158806B2 (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
JP6553111B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
WO2017181772A1 (zh) 语音检测方法、装置及存储介质
US9591410B2 (en) Hearing assistance apparatus
EP1585947B1 (en) Sound detection and localization system
CN106664486B (zh) 用于风噪声检测的方法和装置
JP5493611B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN106612482B (zh) 一种调整音频参数的方法及移动终端
CN107863099B (zh) 一种新型双麦克风语音检测和增强方法
JPH09212196A (ja) 雑音抑圧装置
JP2012142745A (ja) 音声信号処理装置、音声信号処理方法及びプログラム
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
CN115798493A (zh) 降噪方法、降噪装置和执法记录仪
US20190362736A1 (en) Dry sound and ambient sound separation
JP2014126856A (ja) 雑音除去装置及びその制御方法
JP2010021627A (ja) 音量調整装置、音量調整方法および音量調整プログラム
WO2020128088A1 (fr) Mesure temporelle a haute precision d'evenements vibro-acoustiques en synchronisation avec un signal sonore sur dispositif a ecran tactile
CN109920444B (zh) 回声时延的检测方法、装置以及计算机可读存储介质
CN110248300A (zh) 一种基于自主学习的啸叫抑制方法及扩声系统
CN115412803A (zh) 音频信号补偿方法及装置、耳机、存储介质
CN113409800A (zh) 一种监控音频的处理方法、装置、存储介质及电子设备
CN110913312B (zh) 一种回声消除方法及装置
CN115410593A (zh) 音频信道的选择方法、装置、设备及存储介质
CN112235679B (zh) 适用于耳机的信号均衡方法、处理器及耳机
CN114333894A (zh) 增益补偿方法及相关装置、设备、系统和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination