CN102714034B - 信号处理的方法、装置和系统 - Google Patents

信号处理的方法、装置和系统 Download PDF

Info

Publication number
CN102714034B
CN102714034B CN201080001404.2A CN201080001404A CN102714034B CN 102714034 B CN102714034 B CN 102714034B CN 201080001404 A CN201080001404 A CN 201080001404A CN 102714034 B CN102714034 B CN 102714034B
Authority
CN
China
Prior art keywords
signal
frame
present frame
background
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080001404.2A
Other languages
English (en)
Other versions
CN102714034A (zh
Inventor
刘媛媛
王喆
艾雅·苏谟特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201080001404.2A priority Critical patent/CN102714034B/zh
Publication of CN102714034A publication Critical patent/CN102714034A/zh
Application granted granted Critical
Publication of CN102714034B publication Critical patent/CN102714034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例涉及一种信号处理的方法,包括获得输入信号当前帧的信号特征;根据包括所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;检测为背景信号帧的所述当前帧是否处于第一类信号状态;根据为背景帧的所述当前帧是否处于第一类信号状态调整信号分类判决的门限以提升语音信号识别能力。

Description

信号处理的方法、装置和系统
技术领域
本发明实施例涉及通信或网络领域,尤其涉及一种信号处理技术,具体为信号识别和分析的方法、装置和系统。
背景技术
语音编码技术可以压缩语音信号的传输带宽,增加通信系统的容量,随着Internet的日益普及和通信领域的进一步扩展,语音编码技术成为国内和国际最活跃的领域之一。随着时间的推移,语音编码器正朝着多码率,宽带的方向发展,其输入信号也呈多元化趋势,不仅限于语音,还包含音乐等其它信号,而且人们对于通话质量,尤其是音乐信号的质量要求也在不断的提高。对于不同的输入信号,能够采用不同的码率,甚至不同的核心编码算法的编码器,既可以保证不同类别信号的编码质量,又可以最大限度的节省带宽,已成为语音编码器的发展趋势。因此准确的识别输入信号的类别也随之成为了业界研究的热点。
在信号分类一个应用场景中,如图1所示,原始信号通过声音采集装置转换为可编码的输入信号,输入信号在编码前进行信号分类,即识别出输入信号中各个不同类型的信号,对不同类型的信号采用不同的编码算法的编码器进行信号编码得到编码后的信号,将编码后的信号转换为编码码流发送到解码端采用不同的解码器对不同类型信号进行解码,进一步将解码后的信号还原为原始信号输入给接收端。
判决树是应用较为广泛的一种信号分类方法,判决树的信号分类采用长时判决树和短时判决树相结合进行信号分类判决。首先设置一个时间长度的FIFO(First-In First-Out先入先出)存储器进行短时信号特征变量缓冲,通过包括当前帧在内的前同一时间长度的短时信号特征变量来计算长时信号特征,并依据计算得出的长时信号特征进行语音音乐分类。在信号开始前同一时间安长度即FIFO存储器未存满时,先用短时信号特征进行判决。长时和短时判决采用如图2和图3所示判决树进行分类判决。
现有技术的方案不适用于语音信号的各种情况,例如在语音信号的背景噪声为音乐时,由于音乐信号的特征会弱化语音信号的特征,采用现有技术的方案使得一些语音帧被判别为其他类别的信号帧,因此有较高的信号误判率,降低了信号的识别能力,严重影响了信号处理时的质量,如降低信号编码的效率,信号传输准确性,还原出的原始信号的真实性等等。
发明内容
本发明实施例提供一种压缩编码的方法和装置、压缩解码方法以及压缩编码设备,提升信号识别能力,保证信号质量。
本发明实施例提供了一种信号识别的方法,所述方法包括:
获得输入信号当前帧的信号特征,根据包括所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧,检测所述当前帧是否处于第一类信号状态,根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限。
本发明另一实施例还提供了一种信号识别的方法,所述方法包括:
根据所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧,对为背景信号帧的当前帧,获得所述当前帧的音调特性以及当前帧之前的多个背景信号帧的音调特性,关联所述当前帧的音调特性和当前帧之前的多个背景信号帧的音调特性,将所述关联后的音调特性与第一阈值比较,根据比较结果确定所述为背景信号帧的当前帧是否为第一类信号。
本发明另一实施例提供了一种信号分类的方法,所述方法包括:
根据包括所述当前帧的信号特征以及当前帧之前的背景信号帧更新后的信号特征进行第一判断,判断所述当前帧是否为有用信号帧,对为有用信号帧的所述当前帧,获得所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征,根据包括所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征进行第二判断,判断所述当前帧的信号类型,所述第一判断或第二判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到。
本发明另一实施例提供了一种信号识别的装置,所述装置包括:
背景信号判断模块,用于根据包括当前帧的信号特征以及所述当前帧之前背景信号帧更新后的信号特征判断当前帧是否为背景信号帧,信号特性检测模块,用于检测所述当前帧是否处于第一类信号状态,门限调整第一模块,用于根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限。
本发明另一实施例还提供了一种信号识别的装置,所述装置包括:
背景信号判断模块,用于根据所述当前帧的信号特征以及当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧,音调特性获取模块,用于对为背景信号帧的当前帧,获得所述当前帧的音调特性以及当前帧之前多个背景信号帧的音调特性,信号特性关联模块,用于关联所述当前帧的音调特性和当前帧之前多个背景信号帧的音调特性,第一类信号模块,用于将所述关联后的音调特性与第一阈值比较,根据比较结果确定所述为背景信号帧的当前帧是否为第一类信号。
本发明另一实施例提供了一种信号分类的装置,所述装置包括:
信号判断模块,用于根据包括所述当前帧的信号特征以及当前帧之前多个有用信号帧更新后的信号特征进行第一判断,判断所述当前帧是否为有用信号帧,信号特征模块,用于对为有用信号帧的所述当前帧,获得所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征,信号判决模块,用于根据包括所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征进行第二判断,判断所述当前帧的信号类型,所述第一判断或第二判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧处于第一类信号状态时调整得到。
本发明另一实施例提供了一种信号处理系统,所述系统包括:
信号特征获取装置,获得输入信号当前帧的信号特征,信号识别装置,用于根据所述当前帧的信号特征,检测当前帧是否为背景信号帧,根据为背景帧的所述当前帧是否处于第一类信号状态调整信号分类判决的门限,信号分类装置,用于根据所述当前帧的信号特征,判断所述当前帧是否为有用信号帧以及判断所述为有用帧的当前帧的信号类型,所述是否为有用信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到。
本发明另一实施例提供了一种音频信号编码系统,所述系统包括:
信号输入装置,用于接收音频信号,信号分类装置,用于根据所述当前帧的信号特征,判断所述当前帧是否为有用信号帧以及判断所述为有用帧的当前帧的信号类型,所述是否为有用信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整所得,信号编码装置,用于根据判断的为有用信号帧的当前帧的信号类型为不同类型的信号分别采用编码器进行编码获得包括不同类型的信号的编码码流。
本发明另一实施例提供了一种信号判决的方法,所述方法包括:
获得输入信号当前帧的信号特征;
判断所述当前帧是否处于第一类信号状态,根据所述当前帧是否处于第一类信号状态确定信号分类判决的门限;
将确定后的信号分类判决门限与所述当前帧的信号特征进行比较判断当前帧的信号类别。
本发明另一实施例提供了一种信号判决的装置,所述装置包括:
获得输入信号当前帧的信号特征的模块;
判断所述当前帧是否处于第一类信号状态,根据所述当前帧是否处于第一类信号状态确定信号分类判决的门限的模块;
将确定后的信号分类判决门限与所述当前帧的信号特征进行比较判断当前帧的信号类别的模块。
因此,通过引入本发明实施例,可以识别出信号中的非语音背景,并且在在识别出信号中的非语音背景后调整信号分类判决的门限,通过该门限的调整有效降低了信号的误判率,提升在非语音背景下的识别语音信号的能力和信号处理质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术信号分类的应用场景示意图;
图2为现有技术判决树进行信号分类的短时判决示意图;
图3为现有技术判决树进行信号分类的长时判决示意图;
图4为本发明信号识别方法实施例示意图;
图5为本发明另一信号识别方法实施例示意图;
图6(a)和图6(b)为本发明另一信号识别方法实施例示意图;
图7为本发明另一信号识别方法实施例示意图;
图8为本发明信号分类方法实施例示意图;
图9为本发明另一信号识别方法实施例示意图;
图10为本发明另一信号识别方法实施例示意图;
图11为本发明信号处理系统实施例示意图;
图12(a)和图12(b)为本发明另一信号处理系统实施例示意图;
图13(a)和图13(b)为本发明信号识别装置实施例示意图;
图14为本发明另一信号识别装置实施例示意图;
图15为本发明信号分类装置实施例示意图;
图16为本发明音频信号编码系统实施例示意图;
图17为本发明信号判决方法实施例示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:信号识别的方法
图4为信号识别方法实施的示意图,包括:
步骤101:获得输入信号当前帧的信号特征;
将输入信号分帧,以帧为操作单位逐一进行本实施例的各操作步骤,此处的输入信号可以为音频信号,音频信号根据信号环境可以分为前景信号和背景信号,在前景信号和背景信号中又可以按照音频信号的特性分为语音和非语音,如音乐信号,当然,在不同的应用场景下,还可以根据特定的环境和音频信号进行其他类别的划分,本发明各实施例仅以前景信号和背景信号以及语音和非语音为例进行描述。对于音频信号划分的各帧,将当前正在处理的信号帧称为当前帧,提取当前帧的特征参数获得当前帧的信号特征,帧的信号特征可以包括体现信号物理特性的所有特征或者部分特征,如信噪比特征、能量特征等等,该信号特征可以以特征参数的形式参与信号识别,获得当前帧的信号特征根据不同的环境特点和应用需求可以做不同的选择提取,为便于理解和描述的方面,实施例仅以信号帧的信噪比作为当前帧的信号特征的描述。
步骤102:根据包括所述当前帧的信号特征以及所述当前帧之前背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;
不同的信号特征可以用于区别按照不同标准划分的不同类型的音频信号,结合当前帧的信号特征和当前帧之前的背景信号帧更新后的信号特征即可判断出当前帧是否为背景信号帧,一般来说,背景信号帧可以理解为我们通常意义理解的背景噪声或者背景音乐等,本步骤即要从音频信号中将背景信号区别出来,判断出当前帧是否为背景信号帧,对于在当前帧之前的首个或者当前帧之前的多个背景信号帧中的一个,当对所述背景信号帧进行信号特征更新后,将所述更新后的信号特征和当前帧的信号特征关联,获得关联后的当前帧的信号特征,将所述关联后的当前帧的信号特征用于当前帧是否为背景信号帧的判断,若当前帧为背景信号帧转步骤103,本发明各实施例中对所述背景信号帧进行信号特征的更新得到的更新后的信号特征包括得到对背景信号帧的特征估计。
步骤103:检测所述当前帧是否处于第一类信号状态;
对为背景信号帧的当前帧进行检测,检测其是否处于第一类信号状态,所述的第一类信号状态可以采用调整门限判决参数来表征,本发明各实施例中以第一类信号状态的音乐背景拖尾保护变量b_mus_hang为例对调整门限判决参数进行描述,音乐背景拖尾保护变量b_mus_hang预设一个初始值,音乐背景拖尾保护变量b_mus_hang的变化包括在判断到分帧为背景信号帧时的减操作以及判断到分帧为音乐背景帧时的最大化操作。第一类信号可以理解为非语音信号中的一类信号,例如用户希望接收语音信号,那么第一类信号相对于语音而言可以包括噪声,音乐等,本发明各实施例中以音乐信号为例作为第一类信号的描述。
步骤104:根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限。
根据当前帧是否处于第一类信号状态调整信号分类判决的门限,当当前帧处于第一类信号状态或者不处于第一类信号状态,对信号分类判决的门限有不同的调整方案,无论何种调整方案,所述分类信号判决的门限可以包括多种门限,可以根据不同的需求在不同的应用环境中选择调整其中的一个或多个,分类信号判决的门限用于对当前帧,具体的说对当前帧进行信号的分类,确定当前帧为语音帧还是非语音帧。
该实施例中,不对步骤103和步骤104的执行顺序进行限制,步骤103和步骤104可以在步骤102之前执行,也就是说信号分类判决门限是否调整的判断以及对信号分类判决门限的调整本实施例中可以放在对当前帧是否为背景信号帧的判断前进行,进一步若信号分类判决门限中如果与背景信号帧的判断有关的门限进行了调整,即将调整后的门限用于当前帧是否为背景信号帧的判断中,背景信号帧的判决需要和信号分类判决门限进行比较,信号分类判决门限取决于调整门限判决参数值,在步骤102前执行步骤103和步骤104,可以将门限的判断和调整后的门限用于当前帧是否为背景信号帧的判决中,否则当前帧是否为背景信号帧的判断中采用的判断门限为预设门限或者当前帧之前的背景信号帧处于第一类信号状态时调整得到的信号分类判决门限。
在以下本发明各实施例中,当前帧是否处于第一类状态的判决以及信号分类判决门限的调整均可以在信号分类判决门限用于当前帧的判决前调整,也可以在当前帧的判决后调整,在当前帧的判决前调整的信号分类门限用于当前帧的判决中,在当前帧的判决后调整的信号分类判决门限用于后续帧的判决中,所述的当前帧的判决包括背景信号的判断、有用信号的判断以及语音音乐信号的判断。
实施例二:信号识别的方法
图5为另一信号识别方法实施的示意图,包括:
步骤201:根据所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;
在当前帧判断是否为背景信号帧的判断前,当前帧之前的被判断为背景信号帧的分帧需要进行背景信号帧的更新,背景信号帧的更新包括对背景信号帧的信号特征进行更新,例如根据分帧的信号特征对背景信号帧的长时特征参数进行滑动平均得到背景信号的长时滑动平均参数,可以理解为利用当前背景帧的特征参数去更新背景信号的长时平均参数,对背景信号帧的更新除之前提到的信号特性估计,也可以包括对根据分帧的特征参数对背景信号的其他参数进行加窗或其他的操作。以长时滑动平均参数为例,将长时滑动平均参数关联到当前帧的的信号特征中,作为当前信号帧是否为背景信号帧的判断依据,具体的,可以采用将关联后的当前信号帧的信号特征和前景背景判决门限T1进行比较,若当前信号帧的信号特征大于前景背景判决门限T1,则判断所述当前帧为背景信号帧。所述进行比较的前景背景判决门限T1,通过如下方式获得:预设背景前景判决门限;或根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到,所述根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到包括通过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调整。
步骤202:对为背景信号帧的当前帧,获得所述当前帧的音调特性以及当前帧之前多个背景信号帧的音调特性;
累积一段时间的音调特性,可以为设定时间条件下的包括当前帧在内的以及当前帧之前的多个背景信号帧的音调特性,也可以为为设定计数条件下的包括当前帧在内的以及当前帧之前的多个背景信号帧的音调特性,包括当前帧在内可以为3、100或者更多,本实施例不对其进行限定。
步骤203:关联所述当前帧的音调特性和当前帧之前多个背景信号帧的音调特性;
关联所述当前帧的音调特性和当前帧之前多个背景信号帧的音调特性包括对上述各音调特性进行求和的操作,或者求和后的变形或替换,或者变形或替换后进行求和、或者形式更新等操作,得到关联音调特性。
步骤204:将所述关联后的音调特性与第一阈值比较,根据比较结果确定所述为背景信号帧的当前帧是否为第一类信号。
所述第一类信号在本发明实施例中可以包括音乐信号,通过比较结果可以判断当前帧是否为音乐背景,该步骤还包括根据比较的结果调整信号分类判决的门限以对当前帧进行信号分类,如果关联音调特性大于第一阈值,则为背景信号帧的当前帧为非语音背景,此处以音乐背景为例加以说明,如果关联音调特征小于等于第一阈值,则为背景信号帧的当前帧为非音乐背景,根据比较结果,对应音乐背景和非音乐背景,还可以对信号分类判决的门限进行调整,所述信号分类判决的门限可以包括背景前景判决门限T1、声音活动性能检测(VAD)时的有用信号判决门限T2或语音音乐判决门限T3。
实施例三:信号识别的方法
图6(a)和图6(b)为另一信号识别方法实施的示意图,包括:
获得输入信号当前帧的信号特征。
根据包括所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧,包括将当前帧之前的背景信号帧更新后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信号特征,将关联后的当前帧的信号特征和背景前景判决门限进行比较判断当前帧是否为背景信号帧,当关联后的当前帧的信号特征大于背景前景判决门限则当前帧为背景信号帧,背景前景判决门限通过如下方式获得:预设背景前景判决门限,或根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到,根据判断当前帧之前的背景信号帧是否处于第一类信号状态时调整得到背景前景判决门限包括:通过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调整,所述调整门限判决参数在当前帧之前的背景信号帧处于第一类信号状态时被重新设置,根据判断当前帧是否处于第一类信号状态时调整得到背景前景判决门限包括:在判断当前帧是否为背景信号帧前,对调整门限判决参数和阀值进行比较,判断调整门限判决参数与阀值的大小对信号分类判决的门限进行调整,将调整的结果用于当前帧是否为背景信号帧的判断门限。
对判断出的为背景信号帧的当前帧进行背景信号更新,所述更新后的背景信号用于后续帧是否为背景信号的判决中。对判断出的为背景信号帧的当前帧将调整门限判决参数值进行减操作。
检测为背景信号帧的所述当前帧是否处于第一类信号状态,包括对调整门限判决参数和阀值进行比较,判断调整门限判决参数与阀值的大小对信号分类判决的门限进行调整,将调整的结果用于当前帧是否为背景信号帧的判断门限。
该实施例还包括对为背景信号帧的当前帧是否为背景音乐的判断,包括对为背景信号帧的当前帧,获得所述当前帧的音调特性以及当前帧之前的多个背景信号帧的音调特性,关联所述当前帧的音调特性和当前帧之前的多个背景信号帧的音调特性,对所述信号特性关联模块关联的所述当前帧之前多个背景信号帧进行计数加操作,若当前帧关联计数加操作达到技术预定值则停止关联,对所述信号特性关联模块关联所述当前帧之前多个背景信号帧的音调特性时进行调整门限判决参数值的减操作,每关联一个当前帧之前的背景信号帧的音调特性对调整门限判决数值进行减操作。
将所述关联后的音调特性与第一阈值比较,检测为背景信号帧的所述当前帧是否为第一类信号,即音乐信号,所述关联后的音调特性大于所述第一阈值则当前帧为音乐背景,此时重新设置调整门限判决参数,否则调整门限判决参数不变化,进一步通过判断调整门限判决参数与阀值的大小对信号分类判决的门限进行调整,使其更倾向于提高背景信号更新率,可以使得部分前景帧被当作背景帧进行更新,调整信号分类判决的门限,包括调整信号分类判决的门限包括:调整背景前景判决门限、有用信号判决门限或语音音乐判决门限,
实施例四:信号识别的方法
图7为另一信号识别方法实施的示意图,该实施例举例了本发明信号识别方法中一种具体的实施方案,需要说明的说,该实施例中的技术参数、技术数值、或名称等不可用于限定本发明,在不同的应用场景中可以进行适当的变形、修改或替换,该信号识别方法包括:
提取当前输入信号的特征参数,如信噪比等参数,此时进行调整信号分类判决门限的操作,如图7虚框所示,也可以在后续执行,后续执行调整的过程该实施例后面进行了描述,在此进行调整信号分类判决门限需要判断调整门限判决参数,调整门限判决参数有一个设定的初始值,调整门限判决参数可以表示为音乐背景拖尾保护变量b_mus_hang,判断b_mus_hang是否大于零,如果大于零,则对信号分类判决门限进行调整,若调整背景前景判决门限,则当b_mus_hang大于零时调整为T1x,否则调整为T1y,将特征参数与调整后的背景前景判决门限T1进行比较来判断当前帧是有用信号帧还是背景信号帧。当前帧为背景信号时,该变量b_mus_hang减1,b_mus_hang小于零时将零附值给b_mus_hang,计数器加1,计数器初始值可以为0,同时检测当前帧是否具有音乐特征,检测当前帧是否具有音乐特性包括:若当前帧判决中计数器的数值达到达到预定值,如100,计算当前帧的音调特性参数tonal,获得缓存的包括当前帧在内的前100个背景帧的tonal参数,将其求和得到tonal_sum参数,如果tonal_sum大于第一阈值t,则说明当前为音乐背景,置音乐背景拖尾保护变量b_mus_hang=max,本实施例中设t=1200,max=1000。
进一步的,还可以进行信号分类判决门限的调整,判断b_mus_hang是否大于零,调整信号分类判决门限T1,T2或T3,当调整T1时,若b_mus_hang大于零,则信号分类判决门限为T1x,否则为T1y;当调整T2时,若b_mus_hang大于零,则信号分类判决门限为T2x,否则为T2y;当调整T3时,若b_mus_hang大于零,则信号分类判决门限为T3x,否则为T3y。
如果上述判断当前帧为背景信号帧,则对背景信号进行更新,如根据当前帧的特征参数对背景信号的长时特征参数进行滑动平均得到长时滑动平均参数,长时滑动平均参数当当前帧为背景帧是,可用于后续帧是背景信号帧还是有用信号帧的判断,在判断当前帧为背景信号帧还是有用信号帧的过程中,与背景前景判决门限进行比较的当前帧的特征参数同样关联了当前帧之前的背景信号帧的背景信号更新信息,以长时滑动平均参数为例根据分帧的特征参数将背景信号前后数帧的长时特征参数进行滑动平均得到长时滑动平均参数,将该滑动平均参数和当前帧的特征参数关联得到关联后的当前帧的特征参数,根据关联后的当前帧的特征参数和T1进行比较以获得当前帧是否为背景信号帧。
若没有特殊说明,下述各实施例的描述的当前帧之前的背景信号帧均以上一背景信号帧为例以说明,后续帧均以下一帧为例进行说明,也就是说采用上一帧或者下一帧对当前帧之前的帧或当前帧之后的帧进行描述。
实施例五:信号分类的方法
图8为信号分类方法实施的示意图,包括:
步骤301:根据包括所述当前帧的信号特征以及当前帧之前多个背景信号帧更新后的信号特征进行第一判断,判断所述当前帧是否为有用信号帧;
对输入信号进行分帧,以信号分帧后的信号帧为处理对象,获得当前帧的信号特征,接收或主动获取上一背景信号帧更新后的背景信号的信号特征,将更新后的背景信号的信号特征关联到当前帧的信号特征中,将关联后的当前帧的信号特征作为判断当前帧是否为有用信号帧的依据,将所述关联后的当前帧的信号特征作为参数和有用信号判决门限T2进行比较,当根据比较结果确定当前帧是否为有用信号,若为有用信号转步骤302执行。
步骤302:对为有用信号帧的所述当前帧,获得所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征;
根据步骤301得出的结果即有用信号与否,决定着是否将该帧的信号特征参数累积起来,当信号为有用信号时,获得当前帧的信号特征以及当前帧之前多个有用信号帧的信号特征,具体的,可将该帧特征参数缓存至一个数组中,本实施例中,缓存包括当前帧在内的前多个有用信号帧的特征参数,反之,则不缓存。
步骤303:根据所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征进行第二判断,判断所述当前帧的信号类型,所述第一判断或第二判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断上一背景信号帧处于第一类信号状态时调整所得。
判断时,可以将缓存的信号特征作为特征参数逐一与语音音乐判决门限T3进行比较,根据比较的结果判断当前帧的信号类别为语音帧或者为音乐帧信号。
其中,步骤301和步骤303中,有用信号判决门限和语音音乐判决门限之一采用对判决出上一音乐背景信号帧时调整得到的信号分类判决的门限,对没有采用所述信号分类判决门限的用信号判决门限和语音音乐判决门限之一则采用预设的门限值、经验门限值或者沿用上次判断时采用的门限,在某些情况下,甚至可以是随机门限值,在此不做限定,采用调整后的门限值还是其他门限值,需要在适用信号分类判决门限的时候对信号分类判决门限进行查找,若信号分类判决门限值在之前帧的信号识别中发生调整,则采用调整后的信号分类判决门限值,否则采用其他的门限值信息,在另一情况下,可以在第一判断或第二判断前进行信号分类判决门限的调整,判断当前调整门限判决参数是否大于阀值对信号分类判决门限进行相应的调整。
在另一实施条件下,也可以不改变有用信号判决门限和语音音乐判决门限之一为调整后的信号分类判决门限,而采用将信号识别方法中的背景信号判断时采用的背景前景判决门限变换为调整后的信号分类判决门限,也可以达到同样的技术效果。
实施例六:信号分类的方法
图9为另一信号分类方法实施的示意图,包括
根据包括所述当前帧的信号特征以及当前帧之前的背景信号帧更新后的信号特征进行第一判断,判断所述当前帧是否为有用信号帧,包括将当前帧之前的背景信号帧更新后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信号特征,将关联后的当前帧的信号特征和有用信号判决门限进行第一判断,判断所述当前帧是否为有用信号帧。
当所述关联后的当前帧的信号特征大于有用信号信号帧判决门限则判断所述当前帧为有用信号帧。由于信号识别时将部分有用信号帧做为背景信号帧进行更新,使得背景信号的电平提高了,而前景信号电平没有变化,这样在声音活动性检测对有用信号帧的判断中背景信号的信噪比降低了,从而使得部分非语音帧未被判为有用信号。
对为有用信号帧的所述当前帧,获得所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征。
根据包括所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征进行第二判断,判断所述当前帧的信号类型,包括:将包括当前帧在内的多个有用信号帧的信号特征与语音音乐判决门限进行比较;若信号特征大于等于语音音乐判决门限的帧数大于信号特征小于语音音乐判决门限的帧数时,判断当前帧为语音帧,否则为第一类信号帧。
所述第一判断或第二判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到,可以为信号分类判决的门限通过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调整得到,所述调整门限判决参数当所述当前帧判断为背景信号帧时进行减操作,所述调整门限判决参数在当前帧之前背景信号帧处于第一类信号状态时被重新设置,信号分类判决的门限包括:调整背景前景判决门限、有用信号判决门限或语音音乐判决门限。
实施例七:信号分类的方法
图10为另一信号分类方法实施的示意图,该实施例举例了本发明信号识别方法中一种具体的实施方案,需要说明的说,该实施例中的技术参数、技术数值、或名称等不可用于限定本发明,在不同的应用场景中可以进行适当的变形、修改或替换,该信号分类方法包括:
每帧提取信号的特征参数,根据当前帧的特征参数判断当前帧是否为有用信号,即将当前帧的特征参数和有用信号判决门限T2进行比较,当前帧的特征参数关联有当前帧之前多个有用信号帧更新后的信号特征,有用信号判决门限通过调整信号分类判决门限所得,在当前帧或者当前帧之前的背景信号帧识别的过程中,根据调整门限判决参数b_mus_hang与0值的比较结果调整信号分类判决门限,当对有用信号判决门限T2进行调整时,则将调整后的有用信号判决门限用于信号分类的方法中,作为判决当前帧信号是否为有用信号的判决门限,当当前帧的特征参数大于所述调整后的有用信号判决门限T2时,当前帧为有用信号,有用信号与否,决定是否将该帧的信号特征参数累积起来,当信号为有用信号时,将该帧特征参数缓存至一个数组中起来,本实施例中,缓存包括当前帧在内的前120个前景帧的特征参数,反之,则不缓存。判决时,将缓存的特征参数逐一与语音音乐判决门限进行比较,语音音乐判决门限采用预设门限,计算出缓存的参数中大于等于该门限的帧数m和小于该门限的帧数n,当m>n时当前帧被判为语音帧,否则判为音乐帧,其中特征参数数值较大表明该帧具备语音特性,当前帧为语音帧,反之具备音乐特性,当前帧为音乐帧。由于当前帧或当前帧之前的背景信号帧中调整了有用信号判决门限,使部分音乐帧在有用信号帧的判断中未被判为有用信号,因而使得一部分音乐帧的特征参数没有被缓存,这样在计算m和n时,就减小了小于语音音乐判决门限的帧数,进而提升了语音信号的识别率。
实施例八:信号处理系统
图11为信号处理系统实施的示意图,包括:
信号特征获取装置,获得输入信号当前帧的信号特征。
还包括信号识别装置,用于根据所述当前帧的信号特征,检测当前帧是否为背景信号帧,根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限。
信号识别装置根据当前帧的信号特征对当前帧是否为背景信号帧进行判断,判断包括将关联了当前帧之前背景信号帧更新背景信号后的信号特征的当前帧的信号特征和背景前景判决门限进行比较,当大于所述背景前景判决门限时判断当前帧为背景信号帧,对为背景信号帧的当前帧,获得所述当前帧的音调特性以及当前帧之前多个背景信号帧的音调特性,关联所述当前帧的音调特性和当前帧之前多个背景信号帧的音调特性;关联至计数器预定值时将所述关联后的音调特性与第一阈值比较,当大于所述第一阈值时判断所述背景信号帧为音乐背景信号,若调整门限判决参数大于预设的阀值,调整信号分类判决的门限,所述调整信号分类判决的门限包括调整背景前景判决门限T1、声音活动性能检测(VAD)时的有用信号判决门限T2或语音音乐判决门限T3。调整后的信号分类判决门限用于后续帧的背景信号判断、有用信号判断或者语音音乐分类判断中。例如若当前帧对背景前景判决门限进行调整,那么用于下一帧的背景信号判断时,下一帧参与是否为背景信号帧的判断比较的背景前景判决门限门限为在本帧信号识别装置中调整后的T1,调整门限判决参数的比较也可以用在是否为背景信号的判断前,当调整的背景前景判决门限用于当前帧是否为背景信号帧的判断中。
还包括信号分类装置,用于根据所述当前帧的信号特征,判断所述当前帧是否为有用信号帧以及判断所述为有用帧的当前帧的信号类型,所述是否为有用信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到。
信号分类装置根据包括所述当前帧的信号特征以及当前帧之前多个背景信号帧更新后的信号特征进行第一判断,判断所述当前帧是否为有用信号帧,对为有用信号帧的所述当前帧,获得所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征,根据所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征进行第二判断,判断所述当前帧的信号类型,区分出输入信号中的语音帧和音乐帧。其中,所述第一判断或第二判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧处于第一类信号状态时调整所得,所述信号分类门限用于第一判断还是第二判断取决于当前帧或当前帧之前的帧中进行信号分类门限调整是调整的是哪一个门限信息,例如,若调整有用信号判决门限,则信号分类装置在进行第一判断的时候将关联了当前帧之前多个背景信号帧更新后的信号特征的当前帧的信号特征和调整后的有用信号判决门限进行比较,判断当前帧是否为有用信号帧。
实施例九:信号处理系统
图12(a)和图12(b)为信号处理系统实施的示意图,包括输入信号接收器120,输入信号接收器接收输入的信号,对输入信号进行分帧得到N个信号帧10,N为自然数,对每个信号帧进行处理,处理的当前信号帧被称为当前帧,输入信号接收器将分帧后的信号帧逐一送入信号特征分析器121,信号特征分析器121对当前帧进行分析,提取出当前帧的特征参数,如信噪比参数,将提取出的信噪比参数11送入特征关联器122,背景前景判决门限T1被送入背景信号判决器123,背景前景判决门限由信号门限调整器124提供,门限查找器1241查找门限调整器中信号帧判决门限中当前帧或上一背景信号帧的背景前景判决门限没有被调整时,采用预设门限或或沿用上一次判决时的门限值,或者系统随机提供,当在上一帧的处理中对背景前景判决门限进行了调整或者在当前帧对门限值进行了调整,当前帧处理中送入背景信号判决器的为经上一帧处理调整后的背景前景判决门限或当前帧调整后的背景前景判决门限,信噪比参数送入背景信号判决器前在特征关联器中进行特征关联,特征关联器接收当前帧的特征参数,将其与上一背景信号帧判决后的背景信号更新信息12关联在一起形成关联后的当前帧的特征参数13,如将根据上一帧的特征参数对背景信号的长时特征参数进行滑动平均后得到长时滑动平均参数和当前帧的特征参数关联在一起形成当前帧关联后的特征参数,所述上一背景信号判决后的背景信号更新信息来至于背景信号更新器125,将关联后的当前帧的特征参数送入背景信号判决器,背景信号判决器对关联后的当前帧的特征参数和背景前景判决门限进行比较,当当前帧的特征参数大于所述背景前景判决门限时,判断当前帧为背景信号帧,将判断结果14送入音乐背景判断器,同样送入音乐背景判断器127的还有缓存器126中缓存的包括当前帧在内的前100个背景帧的音调特性tonal参数的和值以及判决门限15,所述tonal参数也可以通过信号特征分析器121获得,系统中还包括一个计数器128对当前帧在内的前100个背景帧进行计数的操作,系统中还包括一个减法器129对音乐背景拖尾保护变量b_mus_hang进行减操作,每处理一信号帧,计数器加1,b_mus_hang减1,当计数器达到100时计算tonal的和值tonal_sum,若当前帧为计数器达到100时的帧,则音乐背景判决器将tonal_sum和判决门限进行比较,如果tonal_sum大于预设的判决门限,则说明当前为音乐背景,置音乐背景拖尾保护变量b_mus_hang=max,如果tonal_sum不大于预设的判决门限,则b_mus_hang不变,本实施例中T=1200,max=1000,进一步可以对信号分类判决门限进行调整,b_mus_hang的结果16被送入调整门限判决器130,当b_mus_hang大于零时,门限调整器124调整信号分类判决门限为第一门限,否则调整为第二门限,所述调整第一或第二门限17包括对背景前景判决门限T1、有用信号判决门限T2或语音音乐判决门限T3的调整,若对信号分类判决门限的调整在信号进入背景信号判决器前进行,则调整门限判决器先进行b_mus_hang是否大于零的判断,门限调整器根据判决结果进行信号分类判决门限的调整,此时门限查找器查找背景前景判决门限,将若进行了调整的背景前景判决门限送入背景信号判决器,如图12(b)所示。上述各器件可以集成于背景检测器中。
输入信号经过输入信号接收器分帧、信号特征分析器分析以及特征关联器关联后得到的关联的当前帧的特征参数也送入有用信号判决器131,送入有用信号判决器的还有来至于门限调整器的有用信号判决门限,门限查找器1241查找信号帧判决门限中上一背景信号帧的有用信号判决门限在上一帧的处理中没有被调整时,采用预设门限或沿用上一次判决时的门限值,或者系统随机提供,当在上一帧的处理中对有用信号判决门限进行了调整,当前帧处理中送入有用信号帧判决器的为经上一帧处理调整后的有用信号判决门限。有用信号判决器将有用信号判决门限与关联后的当前帧的特征参数进行比较,如果关联后的当前帧的特征参数大于所述有用信号判决门限,则判断当前帧为有用信号帧,当当前帧为有用信号帧时,则将当前帧的特征参数通过缓存器126缓存至一个数组中,本实施例中,缓存包括当前帧在内的前120个有用信号帧的特征参数17,将缓存的特征参数送入语音音乐判决器132,同时送入语音音乐判决器的还有来至于门限调整器语音音乐判决门限,门限查找器1241查找信号帧判决门限中上一背景信号帧的语音音乐判决门限在上一帧的处理中没有被调整时,采用预设门限或沿用上一次判决时的门限值,或者系统随机提供,当在上一帧的处理中对语音音乐判决门限进行了调整,当前帧处理中送入背景信号判决器的为经上一帧处理调整后的语音音乐判决门限,语音音乐判决器将缓存的特征参数逐一与语音音乐判决门限进行比较,信号分类器133根据语音音乐判决器的比较结果,计算出缓存的参数中大于等于该门限的帧数m和小于该门限的帧数n,当m>n时当前帧分类为语音帧,否则分类为音乐帧,其中特征参数数值较大表明该帧具备语音特性,反之具备音乐特性。上述采用的有用信号判决门限或语音音乐判决门限除采用上一帧的调整结果外,还可以在信号送入有用信号判决器或语音音乐判决器前有调整门限判决器和门限和门限调整器针对当前门限调整判决参数获得送入有用信号判决器或语音音乐判决器,见图12(b),上述各器件可以集成于语音音乐分类器中。也可以将有用信号帧的判决所需的器件独立于语音音乐分类器之外作为声音活动性检测器。背景检测器和语音音乐分类器也可以公用一个输入信号接收器,信号特征分析器、特征关联器或缓存器。
实施例十:信号识别装置
图13(a)和图13(b)为信号识别装置实施的示意图,包括:
背景信号判断模块1300,用于根据包括当前帧的信号特征以及所述当前帧之前背景信号帧更新后的信号特征判断当前帧是否为背景信号帧。背景信号判断模块获得当前帧的信号特征以及所述当前帧之前背景信号帧更新后的信号特征,将所述当前帧的信号特征与所述当前帧之前背景信号帧更新后的信号特征关联,得到关联后的信号特征。将此信号特征与背景前景判决门限进行比较,所述背景前景判决门限包括预设的门限值,如经验值、随即值等,或者包括前一帧进行信号类别判决门限调整时调整背景前景判决门限后的值。
信号识别装置还包括信号特性检测模块1027,用于检测所述当前帧是否处于第一类信号状态。具体包括根据当前帧的门限调整判决参数和一阈值进行比较判断当前帧是否处于第一类信号状态。
信号识别装置还包括门限调整第一模块1024,用于根据为背景帧的所述当前帧是否处于第一类信号状态调整信号分类判决的门限。进行信号分类判决门限的调整,调整背景前景判决门限T1、有用信号判决门限T2或语音音乐判决门限T3,在后续各帧的判决中将所述调整后的信号分类判决门限用于背景前景信号的判断、有用信号的判断或者语音音乐信号的判断中。
信号识别装置还包括背景信号更新模块1025,用于对背景信号判决单元判断出的为背景信号帧的当前帧进行背景信号更新,所述更新后的背景信号用于背景信号判决单元对后续帧是否为背景信号的判决中。
背景信号判断模块包括特征关联单元1022,用于将当前帧之前的背景信号帧更新后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信号特征,背景信号判决单元1023,用于将关联后的当前帧的信号特征和背景前景判决门限进行比较判断当前帧是否为背景信号帧。
背景信号判决单元中进行比较的背景前景判决门限通过如下方式获得:预设背景前景判决门限,或根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到。根据判断当前帧是否处于第一类信号状态时调整背景前景判决门限如图13(b)所示。
实施例十一:信号识别装置
图14为另一信号识别装置实施的示意图,包括:
背景信号判断模块1300,用于根据所述当前帧的信号特征以及当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;
信号识别装置还包括音调特性获取模块1301,用于对为背景信号帧的当前帧,获得所述当前帧的音调特性以及当前帧之前多个背景信号帧的音调特性;
信号识别装置还包括信号特性关联模块1302,用于关联所述当前帧的音调特性和当前帧之前多个背景信号帧的音调特性;
信号识别装置还包括第一类信号模块1303,用于将所述关联后的音调特性与第一阈值比较,根据比较结果确定所述为背景信号帧的当前帧是否为第一类信号。
信号识别装置还包括门限调整第二模块1306,用于根据所述比较结果调整信号分类判决的门限以对当前帧进行信号分类,包括调整背景前景判决门限、有用信号判决门限或语音音乐判决门限。
信号识别装置还包括计数器1304,用于对所述信号特性关联模块关联的所述当前帧之前多个背景信号帧进行计数加操作,以及减法器1305,用于对所述信号特性关联模块关联所述当前帧之前多个背景信号帧的音调特性时进行调整门限判决参数值的减操作。
所述门限调整第二模块可以集成于第一类信号模块中,此时,第一类信号模块包括:第一类信号特性判决单元1027,用于将所述关联后的音调特性与第一阈值比较确定调整门限判决参数,调整门限判决单元1030,用于将所述调整门限判决参数和阀值比较,门限调整单元1024,用于根据所述调整门限判决单元的比较结果进行信号分类判决的门限的调整。所述门限调整第二模块的输出若作为背景信号判断模块的输入时,所述门限调整第二模块包括调整门限判决单元1030,用于将所述调整门限判决参数和阀值比较,门限调整单元1024,用于根据所述调整门限判决单元的比较结果进行信号分类判决的门限的调整,将信号分类判决门限中的背景前景判决门限送入所述背景信号判断模块中。
实施例十二:信号分类装置
图15为信号分类装置实施的示意图,包括:
信号判断模块,用于根据包括所述当前帧的信号特征以及当前帧之前多个背景信号帧更新后的信号特征进行第一判断,判断所述当前帧是否为有用信号帧。
信号分类装置还包括信号特征模块,用于对为有用信号帧的所述当前帧,获得所述当前帧的信号特征以及所述当前帧之前多个背景信号帧的信号特征。
信号分类装置还包括信号判决模块,用于根据包括所述当前帧的信号特征以及所述当前帧之前多个背景信号帧的信号特征进行第二判断,判断所述当前帧的信号类型,所述第一判断或第二判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧处于第一类信号状态时调整得到,包括调整背景前景判决门限、有用信号判决门限或语音音乐判决门限,信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到包括信号分类判决的门限通过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调整得到,所述调整门限判决参数在当前帧或当前帧之前的背景信号帧处于第一类信号状态时被重新设置。
信号判断模块包括特征关联单元,用于将当前帧之前的背景信号帧更新后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信号特征,有用信号帧判决单元,用于将关联后的当前帧的信号特征和有用信号判决门限进行第一判断,判断所述当前帧是否为有用信号帧,其中有用信号帧判决单元的有用信号判决门限包括预设的有用信号判决门限或根据判断上一背景信号帧是否处于第一类信号状态时调整得到。
信号分类装置还包括门限查找单元,用于查找信号帧判决门限中上一背景信号帧的有用信号判决门限是否调整,若调整,则有用信号帧判决单元采用调整后的有用信号判决门限与所述关联后的当前帧的信号特征进行比较,否则采用预设的有用信号判决门限。
信号判决模块包括判决比较单元,用于将包括当前帧在内的多个有用信号帧的信号特征与语音音乐判决门限进行比较,信号分类单元,用于若信号特征大于等于语音音乐判决门限的帧数大于信号特征小于语音音乐判决门限的帧数时,判断当前帧为语音帧,否则为第一类信号帧。
实施例十三:音频信号编码系统,
图16为音频信号编码系统实施的示意图,包括:
信号输入装置1601,用于接收音频信号;
信号特征获取装置1602,获得音频信号中当前帧的信号特征;
信号分类装置1603,用于根据所述当前帧的信号特征,判断所述当前帧是否为有用信号帧以及判断所述为有用帧的当前帧的信号类型,所述是否为有用信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧处于第一类信号状态时调整得到;
信号编码装置1604,用于根据判断的为有用信号帧的当前帧的信号类型为不同类型的信号分别采用编码器进行编码获得包括不同类型的信号的编码码流。
所述信号分类装置包括特征关联单元1631,用于将当前帧之前的背景信号帧更新后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信号特征;1632有用信号帧判决单元,用于将关联后的当前帧的信号特征和有用信号判决门限进行第一判断,判断所述当前帧是否为有用信号帧;信号特征单元1633,用于对为有用信号帧的所述当前帧,获得所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征;判决比较单元1634,用于将包括当前帧在内的多个有用信号帧的信号特征与语音音乐判决门限进行比较;信号分类单元1635,用于若信号特征大于语音音乐判决门限的帧数大于信号特征小于语音音乐判决门限的帧数时,判断当前帧为语音帧,否则为第一类信号帧,所述有用信号判决门限或语音音乐判决门限从门限调整单元获得。
实施例十四,一种信号判决方法,
图17为信号判决方法实施的示意图,包括:
步骤401:获得输入信号当前帧的信号特征;
步骤402:检测所述当前帧是否处于第一类信号状态;
步骤403:根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限;
步骤404:将调整后的信号分类判决门限与所述当前帧的信号特征进行比较判断当前帧的信号类别。
所述检测所述当前帧是否处于第一类信号状态包括:将调整门限判决参数与预定值进行比较,根据比较结果判断所述当前帧是否处于第一类信号状态。
所述根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限包括调整背景前景判决门限、有用信号判决门限或语音音乐判决门限。
所述将调整后的信号分类判决门限与所述当前帧的信号特征进行比较判断当前帧的信号类别包括:将调整后的背景前景判决门限与所述当前帧的信号特征进行比较判断当前帧是否为背景信号帧,将调整后的有用信号判决门限与所述当前帧的信号特征进行比较判断当前帧是否为有用信号帧,将调整后的语音音乐判决门限与所述当前帧的信号特征进行比较判断当前帧为语音帧或者音乐帧。通过信号分类判决门限的调整,提升信号分类时对不同类型信号的识别能力。
本发明的各实施例,可以识别出信号中的非语音背景,并且在在识别出信号中的非语音背景后调整信号分类判决的门限,通过该门限的调整有效降低了信号的误判率,进一步将对门限的调整用于对输入信号的有用信号判决,并用于输入信号中语音和非语音信号的分类中,有效的提升在非语音背景下的识别语音信号的能力和信号处理质量。上述各实施例即可以用于语音与音频编码中,也可以用到针对多类型信号的环境需要对不同类型信号进行区别处理时的所有通讯技术、网络技术以及计算机解决方案中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
最后应说明的是:以上实施例仅用以说明本发明实施例的技术方案而非对其进行限制,尽管参照较佳实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明实施例的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明实施例技术方案的精神和范围。

Claims (10)

1.一种信号识别的方法,其特征在于:
根据所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;
对为背景信号帧的当前帧,获得所述当前帧的音调特性以及当前帧之前的多个背景信号帧的音调特性;
关联所述当前帧的音调特性和当前帧之前的多个背景信号帧的音调特性;
将所述关联后的音调特性与第一阈值比较,根据比较结果确定所述为背景信号帧的当前帧是否为第一类信号;所述第一类信号包括音乐信号;
根据所述比较结果调整信号分类判决的门限。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据所述比较结果调整信号分类判决的门限,所述调整信号分类判决的门限包括:调整背景前景判决门限、有用信号判决门限或语音音乐判决门限。
3.根据权利要求2所述的方法,其特征在于,所述根据所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧需要与背景前景判决门限进行比较,所述进行比较的背景前景判决门限通过如下方式获得:预设背景前景判决门限;或根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到;
所述根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到包括通过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调整,所述调整门限判决参数当所述当前帧判断为背景信号帧时进行减操作。
4.根据权利要求2所述的方法,其特征在于,所述将所述关联后的音调特性与第一阈值比较,根据比较结果调整信号分类判决的门限包括:
将所述关联后的音调特性与第一阈值比较,所述关联后的音调特性大于所述第一阈值则重新设置调整门限判决参数;
通过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调整。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对所述信号特性关联模块关联的所述当前帧之前多个背景信号帧进行计数加操作;
对所述信号特性关联模块关联所述当前帧之前多个背景信号帧的音调特性时进行调整门限判决参数值的减操作。
6.一种信号识别装置,其特征在于,所述信号识别装置包括:
背景信号判断模块,用于根据所述当前帧的信号特征以及当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;
音调特性获取模块,用于对为背景信号帧的当前帧,获得所述当前帧的音调特性以及当前帧之前多个背景信号帧的音调特性;
信号特性关联模块,用于关联所述当前帧的音调特性和当前帧之前多个背景信号帧的音调特性;
第一类信号模块,用于将所述关联后的音调特性与第一阈值比较,根据比较结果确定所述为背景信号帧的当前帧是否为第一类信号;所述第一类信号包括音乐信号;
门限调整第二模块,用于根据所述比较结果调整信号分类判决的门限。
7.根据权利要求6所述的装置,其特征在于,所述调整信号分类判决的门限包括调整背景前景判决门限、有用信号判决门限或语音音乐判决门限。
8.根据权利要求7所述的装置,其特征在于,还包括门限调整第二模块,所述门限调整第二模块可以包括在所述第一类信号模块中,用于根据所述比较结果调整信号分类判决的门限,所述门限调整第二模块包括:
第一类信号特性判决单元,用于将所述关联后的音调特性与第一阈值比较确定调整门限判决参数;
调整门限判决单元,用于将所述调整门限判决参数和阀值比较;
门限调整单元,用于根据所述调整门限判决单元的比较结果进行信号分类判决的门限的调整;
所述门限调整第二模块可以独立于所述第一类信号模块,用于调整信号分类判决的门限,所述门限调整第二模块包括:
调整门限判决单元,用于将门限判决参数和阀值比较;
门限调整单元,用于根据所述调整门限判决单元的比较结果进行信号分类判决的门限的调整。
9.根据权利要求8所述的装置,其特征在于,还包括:
计数器,用于对所述信号特性关联模块关联的所述当前帧之前多个背景信号帧进行计数加操作;
减法器,用于对所述信号特性关联模块关联所述当前帧之前多个背景信号帧的音调特性时进行调整门限判决参数值的减操作。
10.一种信号处理系统,其特征在于,所述信号处理系统包括:
信号特征获取装置,获得输入信号当前帧的信号特征;
信号识别装置,用于根据所述当前帧的信号特征,检测当前帧是否为背景信号帧,根据为背景帧的所述当前帧是否处于第一类信号状态调整信号分类判决的门限;所述第一类信号包括音乐信号;
信号分类装置,用于根据所述当前帧的信号特征,判断所述当前帧是否为有用信号帧以及判断所述为有用帧的当前帧的信号类型,所述是否为有用信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分类判决的门限进行,所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到。
CN201080001404.2A 2009-10-15 2010-10-15 信号处理的方法、装置和系统 Active CN102714034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201080001404.2A CN102714034B (zh) 2009-10-15 2010-10-15 信号处理的方法、装置和系统

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN200910110792.7 2009-10-15
CN200910110792 2009-10-15
PCT/CN2010/077760 WO2011044848A1 (zh) 2009-10-15 2010-10-15 信号处理的方法、装置和系统
CN201080001404.2A CN102714034B (zh) 2009-10-15 2010-10-15 信号处理的方法、装置和系统

Publications (2)

Publication Number Publication Date
CN102714034A CN102714034A (zh) 2012-10-03
CN102714034B true CN102714034B (zh) 2014-06-04

Family

ID=43875850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080001404.2A Active CN102714034B (zh) 2009-10-15 2010-10-15 信号处理的方法、装置和系统

Country Status (4)

Country Link
US (2) US20120197642A1 (zh)
EP (1) EP2490214A4 (zh)
CN (1) CN102714034B (zh)
WO (1) WO2011044848A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9160837B2 (en) 2011-06-29 2015-10-13 Gracenote, Inc. Interactive streaming content apparatus, systems and methods
US20130090926A1 (en) * 2011-09-16 2013-04-11 Qualcomm Incorporated Mobile device context information using speech detection
CN103716470B (zh) * 2012-09-29 2016-12-07 华为技术有限公司 语音质量监控的方法和装置
CN104347067B (zh) 2013-08-06 2017-04-12 华为技术有限公司 一种音频信号分类方法和装置
US9508339B2 (en) * 2015-01-30 2016-11-29 Microsoft Technology Licensing, Llc Updating language understanding classifier models for a digital personal assistant based on crowd-sourcing
KR102446392B1 (ko) * 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US10678828B2 (en) 2016-01-03 2020-06-09 Gracenote, Inc. Model-based media classification service using sensed media noise characteristics
CN109598741A (zh) * 2017-09-30 2019-04-09 佳能株式会社 图像处理装置和方法及监控系统
CN112162256B (zh) * 2020-09-29 2023-08-01 中国船舶集团有限公司第七二四研究所 一种基于脉冲相关的级联式多维度径向运动特征检测方法
CN115334349B (zh) * 2022-07-15 2024-01-02 北京达佳互联信息技术有限公司 音频处理方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
CN101197135A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 声音信号分类方法和装置
CN101197130A (zh) * 2006-12-07 2008-06-11 华为技术有限公司 声音活动检测方法和声音活动检测器
CN101236742A (zh) * 2008-03-03 2008-08-06 中兴通讯股份有限公司 音乐/非音乐的实时检测方法和装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6507814B1 (en) * 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6330533B2 (en) * 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6381570B2 (en) * 1999-02-12 2002-04-30 Telogy Networks, Inc. Adaptive two-threshold method for discriminating noise from speech in a communication signal
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6983242B1 (en) * 2000-08-21 2006-01-03 Mindspeed Technologies, Inc. Method for robust classification in speech coding
WO2003017255A1 (en) * 2001-08-17 2003-02-27 Broadcom Corporation Bit error concealment methods for speech coding
US6959276B2 (en) * 2001-09-27 2005-10-25 Microsoft Corporation Including the category of environmental noise when processing speech signals
US20030236663A1 (en) * 2002-06-19 2003-12-25 Koninklijke Philips Electronics N.V. Mega speaker identification (ID) system and corresponding methods therefor
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
US7469209B2 (en) * 2003-08-14 2008-12-23 Dilithium Networks Pty Ltd. Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
EP1756539A1 (en) * 2004-06-04 2007-02-28 Philips Intellectual Property & Standards GmbH Performance prediction for an interactive speech recognition system
US7505902B2 (en) * 2004-07-28 2009-03-17 University Of Maryland Discrimination of components of audio signals based on multiscale spectro-temporal modulations
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
WO2007023660A1 (ja) * 2005-08-24 2007-03-01 Matsushita Electric Industrial Co., Ltd. 音識別装置
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
DE602007005833D1 (de) * 2006-11-16 2010-05-20 Ibm Sprachaktivitätdetektionssystem und verfahren
KR100964402B1 (ko) * 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
WO2008143569A1 (en) * 2007-05-22 2008-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Improved voice activity detector
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
CN101197135A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 声音信号分类方法和装置
CN101197130A (zh) * 2006-12-07 2008-06-11 华为技术有限公司 声音活动检测方法和声音活动检测器
CN101236742A (zh) * 2008-03-03 2008-08-06 中兴通讯股份有限公司 音乐/非音乐的实时检测方法和装置

Also Published As

Publication number Publication date
US20120215541A1 (en) 2012-08-23
EP2490214A4 (en) 2012-10-24
EP2490214A1 (en) 2012-08-22
WO2011044848A1 (zh) 2011-04-21
CN102714034A (zh) 2012-10-03
US20120197642A1 (en) 2012-08-02

Similar Documents

Publication Publication Date Title
CN102714034B (zh) 信号处理的方法、装置和系统
Chatlani et al. Local binary patterns for 1-D signal processing
CN103700370B (zh) 一种广播电视语音识别系统方法及系统
CN102446504B (zh) 语音/音乐识别方法及装置
EP2486562B1 (en) Method for the detection of speech segments
CN111524527B (zh) 话者分离方法、装置、电子设备和存储介质
JP2006079079A (ja) 分散音声認識システム及びその方法
WO2010001393A1 (en) Apparatus and method for classification and segmentation of audio content, based on the audio signal
CN110390946A (zh) 一种语音信号处理方法、装置、电子设备和存储介质
CN101751920A (zh) 基于再次分类的音频分类装置及其实现方法
KR20140031790A (ko) 잡음 환경에서 강인한 음성 구간 검출 방법 및 장치
CN102446506A (zh) 音频信号的分类识别方法及装置
JP2000066691A (ja) オーディオ情報分類装置
CN111081223A (zh) 一种语音识别方法、装置、设备和存储介质
CN1218945A (zh) 静态和非静态信号的鉴别
JP4201204B2 (ja) オーディオ情報分類装置
US8606569B2 (en) Automatic determination of multimedia and voice signals
CN115223584B (zh) 音频数据处理方法、装置、设备及存储介质
JP4392805B2 (ja) オーディオ情報分類装置
JPH10247093A (ja) オーディオ情報分類装置
CN115762500A (zh) 语音处理方法、装置、设备及存储介质
CN112992175B (zh) 一种语音区分方法及其语音记录装置
CN111128244B (zh) 基于过零率检测的短波通信语音激活检测方法
CN114038487A (zh) 一种音频提取方法、装置、设备和可读存储介质
US20140058726A1 (en) Automated difference recognition between speaking sounds and music

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant