CN101458943B - 一种录音控制方法和录音设备 - Google Patents

一种录音控制方法和录音设备 Download PDF

Info

Publication number
CN101458943B
CN101458943B CN 200810247078 CN200810247078A CN101458943B CN 101458943 B CN101458943 B CN 101458943B CN 200810247078 CN200810247078 CN 200810247078 CN 200810247078 A CN200810247078 A CN 200810247078A CN 101458943 B CN101458943 B CN 101458943B
Authority
CN
China
Prior art keywords
recording
sound
data
present frame
collection unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 200810247078
Other languages
English (en)
Other versions
CN101458943A (zh
Inventor
张晨
冯宇红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Zhonggan Microelectronics Co Ltd
Original Assignee
Wuxi Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Vimicro Corp filed Critical Wuxi Vimicro Corp
Priority to CN 200810247078 priority Critical patent/CN101458943B/zh
Publication of CN101458943A publication Critical patent/CN101458943A/zh
Application granted granted Critical
Publication of CN101458943B publication Critical patent/CN101458943B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及信号技术,特别涉及一种录音控制技术,公开了一种录音控制方法和录音设备,用以提高声控录音的可靠性。一种录音设备的录音控制方法,所述录音设备上设置有至少两个声音采集单元,包括:获得每一个声音采集单元采集到的当前帧目标声音数据;根据各当前帧目标声音数据确定当前帧信号的平均信噪比;并当所述平均信噪比大于第二判决阈值的第二设定条件满足时,将各声音采集单元采集的当前帧目标声音数据存储为录音数据,所述第二判决阈值大于1;当所述第二设定条件从开始不满足的起始帧至当前帧的持续时间到达设定沉默时长时,停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据。

Description

一种录音控制方法和录音设备
技术领域
本发明涉及信号技术,特别涉及一种录音控制技术。
背景技术
随着数码产品的普及,各种录音设备的应用越来越广,比如录音笔或带有录音功能的其它数码产品等,越来越多的被人们所使用。为节省存储空间,带有声控录音功能的录音设备应运而生,目的在于通过监测目标声音是否存在以控制录音,有目标声音存在时开始录音,没有目标声音时暂停录音,这样可以避免存储空间的浪费,另外也可以使得录音资料更紧凑,节约回放时间。
现有的声控录音的解决方法是,设定一个固定的阈值,然后逐帧检测采集信号的能量,如果能量大于这个阈值,则启动录音,如果能量小于这个阈值,则暂停录音。本申请发明人发现,根据录音距离的远近,目标声音的特性有所不同,而现有技术并没有针对不同距离的目标声音给出相应的声控机制,从而造成声音控制功能的可靠性较低。
发明内容
本发明实施例提供一种录音控制方法和录音设备,用以提高声控录音的可靠性。
一种录音设备的录音控制方法,所述录音设备上设置有至少两个声音采集单元,包括:
获得每一个声音采集单元采集到的当前帧目标声音数据;
根据各当前帧目标声音数据确定当前帧信号的平均信噪比;并
当所述平均信噪比大于判决阈值的设定条件满足时,将各声音采集单元采集的当前帧目标声音数据存储为录音数据,所述判决阈值大于1;
当从开始不满足所述设定条件的起始帧至不满足所述设定条件的当前帧的持续时间到达设定沉默时长时,停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据。
进一步,在确定录音设备被启动或者暂停录音后,还包括:启动录制备用数据,所述备用数据为各声音采集单元在当前帧之前的设定备用时长内采集到的目标声音数据;以及
所述启动录音时,还将之前录制的备用数据存储为当前帧之前的录音数据。
较佳的,所述判决阈值小于2。
较佳的,所述的根据各当前帧目标声音数据确定当前帧信号的平均信噪比,具体包括:
对各当前帧目标声音数据进行平均,获得平均信号;
获得平均信号每条谱线的谱能量,并进行平滑处理;
搜索平滑处理后的信号的每条谱线的局部最小能量;
将所述局部最小能量作为噪声方差确定目标声音方差;
将根据各条谱线获得的目标声音方差进行平均,获得平均信噪比。
其中:所述的平滑处理包括:用汉宁窗作区域平滑和用一阶递推平均处理方法进一步做时间上的平滑处理。
一种录音设备,包括至少两个声音采集单元,还包括:
判决阈值存储单元,用于存储判决阈值,所述判决阈值大于1;
录音数据存储单元,用于存储录音数据;
录音控制单元,用于从所述判决阈值存储单元获得判决阈值,根据各当前帧目标声音数据确定当前帧信号的平均信噪比,并当所述平均信噪比大于判决阈值的设定条件满足时,将各声音采集单元采集的当前帧目标声音数据存储为录音数据,当从开始不满足所述设定条件的起始帧至不满足所述设定条件当前帧的持续时间到达设定沉默时长时,停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据。
进一步,还包括:缓存单元,用于缓存录制的备用数据,所述录音控制单元在确定录音设备被启动或者暂停录音后,还用于根据设定的备用时长,将各声音采集单元在当前帧之前的设定备用时长内采集到的目标声音数据作为备用数据存储到所述缓存单元中,并在启动录音时,将缓存单元中存储的备用数据作为启动前的录音数据转存到所述录音数据存储单元中。
本发明实施例提出的录音控制方法,改进了目前的声控录音中仅仅采用能量阈值的方法,而是根据一定距离以外录音时的声音特性采用信噪比估计目标声音的存在概率,使得录音控制技术在低信噪比下仍然有较好的判断准确性。进一步还提出录制一段时间备用数据的技术,确保不丢失目标声音开始阶段的数据,进一步提高了录音准确性。
附图说明
图1为本发明实施例提供的近讲模式声强比判决阈值获得方法示意图;
图2为本发明实施例提供的信噪比估计方法流程示意图;
图3为本发明实施例提供的近讲模式录音控制方法流程示意图;
图4为本发明实施例提供的远讲模式录音控制方法流程示意图;
图5为本发明实施例提供的录音设备结构示意图。
具体实施方式
本发明实施例充分考虑到录音距离对目标声音特性造成的影响,根据录音距离远近提出两种不同的录音控制技术,下面结合附图进行详细说明。
一、近讲模式
近讲模式也可称为口述模式,即录音距离比较近,声音采集单元的灵敏度可以设置的较低,例如采访或自述时进行的录音。这时,声波到达录音装置的声音采集单元时为球面波,球面波的声波强度与距离的平方成反比,一般情况下,录音装置具备两个或两个以上的声音采集单元,如果不同声音采集单元采集到的声音的强度比值满足球面波特性,则可以据此判定目标声音存在,应该启动录音。而球面波的特性和声源距离以及采集单元之间的间距相关,因此在设定声强比判定阈值时,需要根据为近讲模式设定的最大录音距离或常规录音距离,以及各个声音采集单元之间的距离确定。
如图1所示,以录音设备具备的两个声音采集单元为例,两个声音采集单元的间距为3cm,近讲的常规录音距离为10cm,录音设备例如图示的录音笔,两个声音采集单元例如图示的麦克风Mic1和Mic2,则:
声源距离Mic1的距离r1=10cm;
声源距离Mic2的距离r2=13cm;
假设两个声音采集单元录到的声音强度为P1和P2,则如公式1所示:
Pr = P 1 P 2 = r 2 * r 2 r 1 * r 1 = 1.69 - - - ( 1 )
考虑到如果声源距离录音笔的最远距离大于10cm,则这个比值Pr会降低,反之会升高。进一步考虑到录音笔的摆放方向并不能像图1所示,和声源处于一条直线上,如果摆放斜了,那么声源到两个声音采集单元的距离差将小于3cm,则近讲的有效距离就会缩短,因此,声音强度的判决阈值小于1.69,根据经验可以将判决阈值设定为1.3,以判定是否存在近讲目标声音声源,从而实现近讲目标声音检测。
为增加声强检测的准确性,本发明实施例还可以采用一阶低通滤波对Pr做平滑处理,具体方法为:
Prn’=Prn-1’*alfa+Prn*(1-alfa)
其中Prn为第n次采集的声强值,Prn-1’根据第n-1次采集的声强值进行一阶低通滤波后获得的声强均值,Prn’为根据第n次采集的声强值进行一阶低通滤波后获得的声强均值,alfa为0~1之间的加权系数,可以为0.9、0.8或其它值,本发明实施例不加限定。本领域技术人员还可以采用其它滤波方法进行平滑处理,这里不再一一详细说明。
基于上述原理,当给定近讲模式的常规录音距离或最远录音距离,并且已知各录音单元之间间距的情况下,可以确定声强比阈值Threshold,当检测到的任意两个声音采集单元采集的同一帧声音信号的声强比Pr大于Threshold时,就可以判定为有近讲目标声音出现,需要将各声音采集单元采集的当前帧目标声音数据存储为录音数据,当上述条件从开始不满足的起始帧至当前帧的持续时间到达设定沉默时长时,可以判为无目标声音,停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据。
本领域技术人员根据经验值可以设定声强比的判决阈值,也可以根据近讲模式的常规录音距离或最远录音距离,以及各录音单元之间间距进行合理推算,下面给出两种具体计算方法,设录音设备包括多个声音采集单元。
第一种计算根据设定的最远录音距离确定,具体包括如下步骤:
确定各声音采集单元两两组合后形成的I组声音采集单元组;
对其中每一组声音采集单元,根据公式1确定:Zi=(R+di)2/R2,其中:Zi为第i组声音采集单元对应的最小声强比阈值,R为录音设备的最远录音距离,di为第i组声音采集单元中的两个声音采集单元之间的间距;
确定所述第一判决阈值为:大于等于Z1~ZI中最小值或小于等于其中最大值的任意值。
上述方法中,利用公式1,可以根据最远录音距离计算出每一组声音采集设备的最小声强比,然后将声强比判决阈值设定为:大于等于Z1~ZI中最小值或小于等于其中最大值的任意值。较佳的,声强比判决阈值设定为:Z1~ZI的平均值。本领域技术人员还可以根据Z1~ZI,通过试验方法确定B′的具体取值,这里不再一一详细说明。
根据第一种计算方法,还可以进一步确定装置的最远录音距离R为公式B′=(R+di)2/R2的大于零的解。
第二种计算根据设定的常规录音距离确定,具体包括如下步骤:
确定各声音采集单元两两组合后形成的I组声音采集单元组;
对其中每一组声音采集单元,根据公式1确定:Bi=(r+di)2/r2,其中:Bi为第i组声音采集单元对应的常规声强比阈值,r为录音设备的常规录音距离,di为第i组声音采集单元中的两个声音采集单元之间的间距;
确定B为所述B1~BI的平均值;
确定所述第一判决阈值B′为大于1小于B的值。
根据本发明实施例技术方案的原理,最远录音距离的判决阈值应该小于常规录音距离的判决阈值,因此取B′为大于1小于B的值,当然,B也可以是B1~BI中的最大值或最小值,较佳的B′为:1和B的平均值。本领域技术人员还可以根据B1~BI,通过试验方法确定B′的具体取值,这里不再一一详细说明。
根据上述原理,在录音设备中设定近讲模式,当用户选择近讲模式录音时,根据设定的声强比阈值判定是否录音,由于声强比阈值的设定充分考虑了近讲声源的球面波特性和录音距离,从而提高了录音控制的可靠性。
根据上述原理,当近讲模式的最远录音距离确定后,如果在近讲模式的最远录音距离之外进行录音,则本发明实施例称之为远讲模式录音。
对于远讲模式下的目标声音的检测,本发明实施例也提出了相应的检测方法,下面进行详细说明。
二、远讲模式
本发明实施例考虑到录音设备远离声源时,声波信号的到达各录音采集设备时基本上成为平面波,各声音采集单元采集的声音信号强度与距离的相关性可以忽略,而声音的信噪比特性可以用于判决声音是否存在,因此本发明实施例提出一种在远讲模式下,利用信噪比来估计目标声音存在概率的录音控制技术。
如图2所示,为远讲目标声音检测原理示意图,对于各声音采集单元采集的多路信号取平均,利用信号平均值进行分析可以减少运算量。其中:
Avg模块就是将两路信号取平均的操作,获得平均信号Sf,然后信号经过分析窗平滑后,利用傅立叶变换FFT,将信号从时域变换到频域,假定频域信号用Y[k]表示,对Y[k]进行信噪比估计,首先要估计背景噪声的方差。背景噪声通常是不稳定且时变的,这就要求噪声估计算法能够实时跟踪背景噪声的变化,首先假设信号的能量要大于噪声的能量,这个假设在一般的应用场合都能满足,于是噪声估计的基本原理就是在目标声音存在概率较小的时候,通过不断搜索最小能量,来估计噪声方差,具体方法包括如下步骤:
1、首先得到Sf每条谱线的谱能量,并进行平滑处理;
平滑处理包括用汉宁窗作区域平滑和用一阶递推平均处理方法进一步做时间上的平滑处理,其中,用汉宁窗作区域平滑为:
S f [ i ] = Σ k = - W W b [ k ] | Y [ k - i ] | 2
其中b代表汉宁窗,汉宁窗的宽度为2W,W可以取1。
用一阶递推平均处理方法进一步做时间上的平滑处理为:
S[i]=αsS[i]+(1-αs)Sf[i]
其中αs满足0<αs<1。
2、搜索平滑处理后的信号S[i]每条谱线的局部最小能量Smin[i];
这个局部最小值的搜索可以用快降慢升的递推简化算法实现,即:
如果S[i]>Smin[i],则Smin[i]=Smin[i]*alfa+S[i](1-alfa)
如果S[i]<=Smin[i],则Smin[i]=Smin[i]*beta+S[i](1-beta)
其中alfa和beta都是0~1之间的数,为了体现快降慢升的特点,一般alfa>beta;
3、对每一条谱线,分别将Smin[i]作为噪声方差,而S[i]为噪声加目标声音的方差。即目标声音方差为:
Sv[i]=S[i]-Smin[i]
则第i个谱线上的信噪比为:
SNR[i]=Sv[i]/Smin[i]
所有谱线的SNR[i]的平均信噪比为:
SNR=Average(SNR[i]),i=0-fftsize/2
上述信噪比估计技术为本领域技术人员所熟知,本领域技术人员还可以采用其它的信噪比估计技术获得多个信号的平均信噪比,本发明实施例中,当根据多个信号采集单元采集到的信号获得的平均信噪比大于1,或者比1稍大的数,例如1.1或1.2时,或者信号质量非常好,信噪比非常大,达到几十或几百时,可以判决远讲声源的存在,开始录音。在远讲模式下,根据不同的录音质量要求,可以将信噪比的判决阈值设定为大于1的数,一般不超过1.5即可。
三、录制备用数据
本发明实施例还进一步考虑到启动录音之前有可能会错过一些有用的声音数据,因此在录音设备被启动或者每一次暂停录音后,后循环录制一段备用数据,备用数据为各声音采集单元在当前帧之前的设定备用时长内采集到的目标声音数据;以及每一次启动录音时,还将之前录制的备用数据存储为当前帧之前的录音数据。为实现备用数据的录制,本发明实施例提供一种具体实现方式:
首先,根据设定的备用时长,申请相应存储量的回滚内存,其中:
在回滚内存中,每一个声音采集单元采集的各帧声音数据,可以存储为一个循环链表结构,该循环链表结构的每个节点可以用一个如下的结构体表示:
Figure GDA00001649668000081
Node表示这个节点的结构体名称,Data1[L]为Mic1采集的某一帧信号,Data2为Mic2采集的某一帧信号。NextNode为指向下一帧信号,即下一个节点的指针。其中L为帧长。
假设,信号的采样率为8k,帧长L为128,则,如果希望回滚内存中暂存0.5s的数据,则大概需要暂存32帧。即可以设置循环链表中有32个节点,并定义为:Node1,Node2,...,Node32,然后初始化时将32个节点串联起来,形成循环链表,即:
Node1->NextNode=Node2;
Node2->NextNode=Node3;
Node31->NextNode=Node32;
Node32->NextNode=Node1;
假设NodeCurrent为当前节点,则每来一帧信号,需要做:
将Mic1采集的信号赋给NodeCurrent.Data1
将Mic2采集的信号赋给NodeCurrent.Data2
NodeCurrent=NodeCurrent->NextNode
通过这种方法,对于每一个信号采集单元,可以始终在回滚内存中保留最新的0.5s的数据。以备需要的时候使用。
如果上一帧处于暂停录音状态,而当前帧判决结果为有目标声音,则启动录音,并连接回滚内存模块,将录音起始点回滚到回滚内存的数据起始位置。假设起始位置的节点位NodeHead,则可根据回滚内存的当前节点NodeCurrent,通过NodeHead=NodeCurrent->NextNode得到起始节点。然后将整个循环列表里的节点里的数据全部录制下来。这样就可以将目标声音起始段的一部分本来要丢掉的数据,通过回滚的方式找回来。回滚的备用时间长度,可以通过设置节点个数来控制。
基于上述原理,可以在录音设备中设置近讲和远讲两种模式,根据用户的选择,采用对应的控制方法判断是否启动录音,也可以在专用的近讲录音设备或者远讲录音设备中采用其中对应的控制方法控制录音。
如图3所示,本发明实施例提供的近讲模式录音控制方法包括如下步骤:
S300、录音设备开机;
S301、录制备用数据并保存在缓存中;
S302、获得每一个声音采集单元采集到的当前帧目标声音数据,并确定每一个当前帧目标声音数据对应的目标声音信号强度;
S303、判定第一设定条件是否满足;
S304、当第一设定条件满足时录音;
当其中两个声音信号强度的比值大于第一判决阈值的第一设定条件满足时录音,包括:将各声音采集单元采集的当前帧目标声音数据存储为录音数据,如果缓存中录制有备用数据,则还将备用数据存储为录音数据,并停止步骤S301;
S305、当第一设定条件不满足时,判断第一设定条件从开始不满足的起始帧至当前帧的持续时间是否到达设定沉默时长;
当第一设定条件从开始不满足的起始帧至当前帧的持续时间未到达设定沉默时长时,继续步骤S304录音,否则执行步骤S306暂停录音,包括:停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据,并触发步骤S301执行,将数据录制为备用数据,保存在缓存中。
第一设定条件即为近讲模式判定条件,即两个声音信号强度的是否比值大于针对近讲模式设定的声强比判决阈值,具体确定方法如前,这里不再重复描述。
设定沉默时长为无目标声音状态持续的最长时间,可以利用一个计数器进行检测,只有当无目标声音状态持续一段时间后,才暂停录音。这样做的原因是,人说话一般都有目标声音间歇期,因此,较短的目标声音间歇期应该给与保留。因此,设定无目标声音状态的持续时间例如3s,3s后,如果仍然判定为无目标声音,则暂停录音。无目标声音状态计数器在每次判定为有启动录音都归0。
如图4所示,本发明实施例提供的远讲模式录音控制方法包括如下步骤:
S400、录音设备开机;
S401、录制备用数据并保存在缓存中;
S402、获得每一个声音采集单元采集到的当前帧目标声音数据,并根据各当前帧目标声音数据确定当前帧信号的平均信噪比;
S403、判定平均信噪比大于第二判决阈值的第二设定条件是否满足;
S404、当第二设定条件满足时录音;
当其中两个声音信号强度的比值大于第二判决阈值的第二设定条件满足时录音,包括:将各声音采集单元采集的当前帧目标声音数据存储为录音数据,如果缓存中录制有备用数据,则还将备用数据存储为录音数据,并停止步骤S401;
S405、当第二设定条件不满足时,判断第二设定条件从开始不满足的起始帧至当前帧的持续时间是否到达设定沉默时长;
当第二设定条件从开始不满足的起始帧至当前帧的持续时间未到达设定沉默时长时,继续步骤S404录音,否则执行步骤S406暂停录音,包括:停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据,并触发步骤S401执行,将数据录制为备用数据,保存在缓存中。
第二设定条件即为远讲模式判定条件,即当前帧信号的平均信噪比是否大于针对远讲模式设定的信噪比判决阈值,具体确定方法如前,这里不再重复描述。
如果录音设备同时设置了可选在近讲模式和远讲模式,则根据用户的选择,在开机后先判定录音模式,然后根据用户选择的录音模式,进入图3或图4所示的控制流程。
如图5所示,本发明实施例还提供一种可以根据近讲模式控制录音的录音设备,包括至少两个声音采集单元501(5011、5012...501n),还包括:
第一阈值存储单元502,用于存储第一判决阈值,第一判决阈值根据录音设备的录音距离和各声音采集单元之间的间距确定;
录音数据存储单元503,用于存储录音数据;
录音控制单元504,用于从第一阈值存储单元获得第一判决阈值,并在接收到每一个声音采集单元采集到的当前帧目标声音数据,确定每一个当前帧目标声音数据对应的目标声音信号强度,以及当其中两个声音信号强度的比值大于第一判决阈值的第一设定条件满足时,将各声音采集单元采集的当前帧目标声音数据存储到存储单元,当第一设定条件从开始不满足的起始帧至当前帧的持续时间到达设定沉默时长时,停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据。
该录音设备还可以根据设定的参数获得第一判决阈值,则该录音设备进一步还可以包括:
第一判决阈值确定单元505,用于确定第一判决阈值为大于等于Z1~ZI中最小值或小于等于其中最大值的任意值,并将确定的第一判决阈值存储到第一阈值存储单元中,其中Zi为任意两个声音采集单元组合后,第i组声音采集单元对应的最小声强比阈值,Zi=(R+di)2/R2,R为录音设备的最远录音距离,di为第i组声音采集单元中的两个声音采集单元之间的间距;或者用于确定第一判决阈值B′为大于1小于B的值,B为B1~BI的平均值,Bi为任意两个声音采集单元组合后,第i组声音采集单元对应的常规声强比阈值,Bi=(r+di)2/r2,r为录音设备的常规录音距离。
如果该录音设备进一步还可以根据远讲模式控制录音,则还包括:
第二判决阈值存储单元506,用于存储第二判决阈值,第二判决阈值大于1;
模式设置单元507,用于接收用户的录音模式设置指示信号,并输出给录音控制单元,录音控制单元根据接收的录音模式设置指示信号确认当前录音模式为最远录音距离为R的第一模式时,在接收到每一个声音采集单元采集到的当前帧目标声音数据后继续确认第一设定条件是否满足;否则从第二判决阈值存储单元获得第二判决阈值,根据各当前帧目标声音数据确定当前帧信号的平均信噪比,并当平均信噪比大于第二判决阈值的第二设定条件满足时,将各声音采集单元采集的当前帧目标声音数据存储为录音数据,当第二设定条件从开始不满足的起始帧至当前帧的持续时间到达设定沉默时长时,停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据。
如果该录音设备还进一步可以录制备用数据,则还包括:
缓存单元508,用于缓存录制的备用数据,录音控制单元在确定录音设备被启动或者暂停录音后,还用于根据设定的备用时长,将各声音采集单元在当前帧之前的设定备用时长内采集到的目标声音数据作为备用数据存储到缓存单元中,并在启动录音时,将缓存单元中存储的备用数据作为启动前的录音数据转存到录音数据存储单元中。
当然,如果是专用远讲模式录音设备,则可以只包括:至少两个声音采集单元501(5011、5012...501n)、录音数据存储单元503、第二判决阈值存储单元506和录音控制单元504,录音控制单元504根据远讲模式录音控制方法控制录音。专用远讲模式录音设备还进一步可以录制备用数据时,则可以进一步包括缓存单元508。
本发明实施例提出的录音控制方法,改进了目前的声控录音中仅仅采用能量阈值的方法,而是根据近讲和远讲两种类别,分别应用适合的目标声音检测算法。在近讲方式下,采用两个声音采集单元之间的声强比作为是否录音的判决依据;而在远讲方式下,采用信噪比估计目标声音的存在概率,使得录音控制技术在低信噪比下仍然有较好的判断准确性。进一步还提出录制一段时间备用数据的技术,确保不丢失目标声音开始阶段的数据,进一步提高了录音准确性。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种录音设备的录音控制方法,所述录音设备上设置有至少两个声音采集单元,其特征在于,包括:
获得每一个声音采集单元采集到的当前帧目标声音数据;
根据各当前帧目标声音数据确定当前帧信号的平均信噪比;并
当所述平均信噪比大于判决阈值的设定条件满足时,将各声音采集单元采集的当前帧目标声音数据存储为录音数据,所述判决阈值大于1;
当从开始不满足所述设定条件的起始帧至不满足所述设定条件的当前帧的持续时间到达设定沉默时长时,停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据。
2.如权利要求1所述的录音控制方法,其特征在于:
在确定录音设备被启动或者暂停录音后,还包括:启动录制备用数据,所述备用数据为各声音采集单元在当前帧之前的设定备用时长内采集到的目标声音数据;以及
所述启动录音时,还将之前录制的备用数据存储为当前帧之前的录音数据。
3.如权利要求1或2所述的方法,其特征在于,所述判决阈值小于2。
4.如权利要求3所述的方法,其特征在于,所述的根据各当前帧目标声音数据确定当前帧信号的平均信噪比,具体包括:
对各当前帧目标声音数据进行平均,获得平均信号;
获得平均信号每条谱线的谱能量,并进行平滑处理;
搜索平滑处理后的信号的每条谱线的局部最小能量;
将所述局部最小能量作为噪声方差确定目标声音方差;
将根据各条谱线获得的目标声音方差进行平均,获得平均信噪比。
5.如权利要求4所述的方法,其特征在于,所述的平滑处理包括:用汉宁窗作区域平滑和用一阶递推平均处理方法进一步做时间上的平滑处理。
6.一种录音设备,包括至少两个声音采集单元,其特征在于,还包括:
判决阈值存储单元,用于存储判决阈值,所述判决阈值大于1;
录音数据存储单元,用于存储录音数据;
录音控制单元,用于从所述判决阈值存储单元获得判决阈值,根据各当前帧目标声音数据确定当前帧信号的平均信噪比,并当所述平均信噪比大于判决阈值的设定条件满足时,将各声音采集单元采集的当前帧目标声音数据存储为录音数据,当从开始不满足所述设定条件的起始帧至不满足所述设定条件的当前帧的持续时间到达设定沉默时长时,停止将各声音采集单元采集的当前帧目标声音数据存储为录音数据。
7.如权利要求6所述的录音设备,其特征在于,还包括:
缓存单元,用于缓存录制的备用数据,所述录音控制单元在确定录音设备被启动或者暂停录音后,还用于根据设定的备用时长,将各声音采集单元在当前帧之前的设定备用时长内采集到的目标声音数据作为备用数据存储到所述缓存单元中,并在启动录音时,将缓存单元中存储的备用数据作为启动前的录音数据转存到所述录音数据存储单元中。
CN 200810247078 2008-12-31 2008-12-31 一种录音控制方法和录音设备 Active CN101458943B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200810247078 CN101458943B (zh) 2008-12-31 2008-12-31 一种录音控制方法和录音设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200810247078 CN101458943B (zh) 2008-12-31 2008-12-31 一种录音控制方法和录音设备

Publications (2)

Publication Number Publication Date
CN101458943A CN101458943A (zh) 2009-06-17
CN101458943B true CN101458943B (zh) 2013-01-30

Family

ID=40769747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810247078 Active CN101458943B (zh) 2008-12-31 2008-12-31 一种录音控制方法和录音设备

Country Status (1)

Country Link
CN (1) CN101458943B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102376303B (zh) * 2010-08-13 2014-03-12 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
CN102568473A (zh) * 2011-12-30 2012-07-11 深圳市车音网科技有限公司 语音信号的录制方法和装置
JP5610235B2 (ja) * 2012-01-17 2014-10-22 カシオ計算機株式会社 録音再生装置およびプログラム
CN103778925B (zh) * 2012-10-22 2017-09-22 爱国者电子科技有限公司 录音电路关闭状态下控制录音的录音装置
CN105635500B (zh) * 2014-10-29 2019-01-25 辰芯科技有限公司 双麦克风回声及噪声的抑制系统及其方法
CN106326804B (zh) * 2015-06-16 2022-03-08 中兴通讯股份有限公司 一种录音控制方法和装置
CN108962252A (zh) * 2017-05-17 2018-12-07 武汉默联股份有限公司 数据处理方法、装置以及医用终端
CN108932234A (zh) * 2017-05-17 2018-12-04 武汉默联股份有限公司 医疗处理方法、装置以及医用终端
CN108962363A (zh) * 2017-05-17 2018-12-07 武汉默联股份有限公司 医疗服务方法、装置以及医用终端
CN107633854A (zh) 2017-09-29 2018-01-26 联想(北京)有限公司 一种语音数据的处理方法和电子设备
CN108962284B (zh) * 2018-07-04 2021-06-08 科大讯飞股份有限公司 一种语音录制方法及装置
CN111124349A (zh) * 2019-12-03 2020-05-08 维沃移动通信有限公司 一种音频处理方法及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1354455A (zh) * 2000-11-18 2002-06-19 深圳市中兴通讯股份有限公司 一种从噪声环境中识别出语音和音乐的声音活动检测方法
CN1912993A (zh) * 2005-08-08 2007-02-14 中国科学院声学研究所 基于能量及谐波的语音端点检测方法
WO2007091956A2 (en) * 2006-02-10 2007-08-16 Telefonaktiebolaget Lm Ericsson (Publ) A voice detector and a method for suppressing sub-bands in a voice detector
CN101197130A (zh) * 2006-12-07 2008-06-11 华为技术有限公司 声音活动检测方法和声音活动检测器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1354455A (zh) * 2000-11-18 2002-06-19 深圳市中兴通讯股份有限公司 一种从噪声环境中识别出语音和音乐的声音活动检测方法
CN1912993A (zh) * 2005-08-08 2007-02-14 中国科学院声学研究所 基于能量及谐波的语音端点检测方法
WO2007091956A2 (en) * 2006-02-10 2007-08-16 Telefonaktiebolaget Lm Ericsson (Publ) A voice detector and a method for suppressing sub-bands in a voice detector
CN101197130A (zh) * 2006-12-07 2008-06-11 华为技术有限公司 声音活动检测方法和声音活动检测器

Also Published As

Publication number Publication date
CN101458943A (zh) 2009-06-17

Similar Documents

Publication Publication Date Title
CN101458943B (zh) 一种录音控制方法和录音设备
EP3703052B1 (en) Echo cancellation method and apparatus based on time delay estimation
CN110556103B (zh) 音频信号处理方法、装置、系统、设备和存储介质
CN100580770C (zh) 基于能量及谐波的语音端点检测方法
US20110099010A1 (en) Multi-channel noise suppression system
CN104424956B (zh) 激活音检测方法和装置
CN109767769B (zh) 一种语音识别方法、装置、存储介质及空调
US8239194B1 (en) System and method for multi-channel multi-feature speech/noise classification for noise suppression
US20080312918A1 (en) Voice performance evaluation system and method for long-distance voice recognition
US8194882B2 (en) System and method for providing single microphone noise suppression fallback
CN103165137B (zh) 一种非平稳噪声环境下传声器阵列的语音增强方法
WO2021093808A1 (zh) 一种有效语音信号的检测方法、装置及设备
US20110099007A1 (en) Noise estimation using an adaptive smoothing factor based on a teager energy ratio in a multi-channel noise suppression system
CN102819009A (zh) 用于汽车的驾驶者声源定位系统及方法
US20130006150A1 (en) Bruxism detection device and bruxism detection method
CN109102819A (zh) 一种啸叫检测方法及装置
US20160134759A1 (en) Pure Delay Estimation
CN102655010B (zh) 录音控制方法和录音设备
CN102655009B (zh) 录音控制方法和录音设备
EP2907121A1 (en) Real-time traffic detection
CN101458944B (zh) 一种录音控制方法和录音设备
CN103578478A (zh) 实时获取音乐节拍信息的方法及系统
CN102739286B (zh) 一种用于通信系统中的回声抵消方法
CN106094598A (zh) 声控开关控制方法、系统及声控开关
CN106297795B (zh) 语音识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: WUXI VIMICRO CORPORATION

Free format text: FORMER OWNER: BEIJING ZHONGXING MICROELECTRONICS CO., LTD.

Effective date: 20110328

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100083 15/F, SHINING BUILDING, NO. 35, XUEYUAN ROAD, HAIDIAN DISTRICT, BEIJING TO: 214028 (CHUANGYUAN BUILDING), NATIONAL INTEGRATED CIRCUIT DESIGN PARK, NO. 21-1, YANGTES RIVER ROAD, WUXI NEW DISTRICT, JIANGSU PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20110328

Address after: 214028 national integrated circuit design Park, Changjiang Road, New District, Jiangsu,, Wuxi

Applicant after: Wuxi Vimicro Co., Ltd.

Address before: 100083, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 15 Floor

Applicant before: Beijing Vimicro Corporation

C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 214135 Taihu International Science Park Sensor Network University Science Park 530 Building A1001, No. 18 Qingyuan Road, Wuxi City, Jiangsu Province

Patentee after: WUXI ZHONGGAN MICROELECTRONIC CO., LTD.

Address before: 214028 National Integrated Circuit Design Park 21-1 Changjiang Road, New District, Wuxi City, Jiangsu Province (Chuangyuan Building)

Patentee before: Wuxi Vimicro Co., Ltd.