CN102714034A - 信号处理的方法、装置和系统 - Google Patents

信号处理的方法、装置和系统 Download PDF

Info

Publication number
CN102714034A
CN102714034A CN2010800014042A CN201080001404A CN102714034A CN 102714034 A CN102714034 A CN 102714034A CN 2010800014042 A CN2010800014042 A CN 2010800014042A CN 201080001404 A CN201080001404 A CN 201080001404A CN 102714034 A CN102714034 A CN 102714034A
Authority
CN
China
Prior art keywords
signal
present frame
frame
background
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800014042A
Other languages
English (en)
Other versions
CN102714034B (zh
Inventor
刘媛媛
王喆
艾雅·苏谟特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201080001404.2A priority Critical patent/CN102714034B/zh
Publication of CN102714034A publication Critical patent/CN102714034A/zh
Application granted granted Critical
Publication of CN102714034B publication Critical patent/CN102714034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例涉及一种信号识别的方法,包括获得输入信号当前帧的信号特征;根据包括所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;检测为背景信号帧的所述当前帧是否处于第一类信号状态;根据为背景帧的所述当前帧是否处于第一类信号状态调整信号分类判决的门限以提升语音信号识别能力。

Description

信号处理的方法、 装置和系统 本申请要求于 2009年 10月 15 日 提交中 国专利局, 申请号为 200910110792.7 , 发明名称为"信号处理的方法、 装置和系统,,的中国专利申请 的优先权, 其全部内容通过引用结合在本申请中。 技术领域
本发明实施例涉及通信或网络领域, 尤其涉及一种信号处理技术, 具体 为信号识别和分析的方法、 装置和系统。 背景技术
语音编码技术可以压缩语音信号的传输带宽, 增加通信系统的容量, 随 着 Internet的日益普及和通信领域的进一步扩展, 语音编码技术成为国内和 国际最活跃的领域之一。 随着时间的推移, 语音编码器正朝着多码率, 宽带 的方向发展, 其输入信号也呈多元化趋势, 不仅限于语音, 还包含音乐等其 它信号, 而且人们对于通话质量, 尤其是音乐信号的质量要求也在不断的提 高。 对于不同的输入信号, 能够釆用不同的码率, 甚至不同的核心编码算法 的编码器, 既可以保证不同类别信号的编码质量, 又可以最大限度的节省带 宽, 已成为语音编码器的发展趋势。 因此准确的识别输入信号的类别也随之 成为了业界研究的热点。 在信号分类一个应用场景中, 如图 1 所示, 原始信号通过声音釆集装置 转换为可编码的输入信号, 输入信号在编码前进行信号分类, 即识别出输入 信号中各个不同类型的信号, 对不同类型的信号釆用不同的编码算法的编码 器进行信号编码得到编码后的信号, 将编码后的信号转换为编码码流发送到 解码端釆用不同的解码器对不同类型信号进行解码, 进一步将解码后的信号 还原为原始信号输入给接收端。
判决树是应用较为广泛的一种信号分类方法, 判决树的信号分类釆用长 时判决树和短时判决树相结合进行信号分类判决。 首先设置一个时间长度的 FIFO ( Fi r s t-In Fi rs t-Out 先入先出)存储器进行短时信号特征变量緩冲, 通过包括当前帧在内的前同一时间长度的短时信号特征变量来计算长时信号 特征, 并依据计算得出的长时信号特征进行语音音乐分类。 在信号开始前同 一时间安长度即 FIFO存储器未存满时, 先用短时信号特征进行判决。 长时和 短时判决釆用如图 1和图 3所示判决树进行分类判决。 现有技术的方案不适用于语音信号的各种情况, 例如在语音信号的背景 噪声为音乐时, 由于音乐信号的特征会弱化语音信号的特征, 釆用现有技术 的方案使得一些语音帧被判别为其他类别的信号帧, 因此有较高的信号误判 率, 降低了信号的识别能力, 严重影响了信号处理时的质量, 如降低信号编 码的效率, 信号传输准确性, 还原出的原始信号的真实性等等。 发明内容
本发明实施例提供一种压缩编码的方法和装置、 压缩解码方法以及压 缩编码设备, 提升信号识别能力, 保证信号质量。
本发明实施例提供了一种信号识别的方法, 所述方法包括:
获得输入信号当前帧的信号特征,根据包括所述当前帧的信号特征以及 所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否为背景信号 帧,检测所述当前帧是否处于第一类信号状态,根据所述当前帧是否处于第一 类信号状态调整信号分类判决的门限。
本发明另一实施例还提供了一种信号识别的方法, 所述方法包括: 根据所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的 信号特征判断当前帧是否为背景信号帧, 对为背景信号帧的当前帧, 获得所 述当前帧的音调特性以及当前帧之前的多个背景信号帧的音调特性, 关联所 述当前帧的音调特性和当前帧之前的多个背景信号帧的音调特性, 将所述关 联后的音调特性与第一阔值比较, 根据比较结果确定所述为背景信号帧的当 前帧是否为第一类信号。 本发明另一实施例提供了一种信号分类的方法, 所述方法包括: 根据包括所述当前帧的信号特征以及当前帧之前的背景信号帧更新后的 信号特征进行第一判断, 判断所述当前帧是否为有用信号帧, 对为有用信号 帧的所述当前帧, 获得所述当前帧的信号特征以及所述当前帧之前多个有用 信号帧的信号特征, 根据包括所述当前帧的信号特征以及所述当前帧之前多 个有用信号帧的信号特征进行第二判断, 判断所述当前帧的信号类型, 所述 第一判断或第二判断基于信号分类判决的门限进行, 所述信号分类判决的门 限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调 整得到。
本发明另一实施例提供了一种信号识别的装置, 所述装置包括: 背景信号判断模块, 用于根据包括当前帧的信号特征以及所述当前帧之 前背景信号帧更新后的信号特征判断当前帧是否为背景信号帧, 信号特性检 测模块, 用于检测所述当前帧是否处于第一类信号状态, 门限调整第一模块, 用于根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限。
本发明另一实施例还提供了一种信号识别的装置, 所述装置包括: 背景信号判断模块, 用于根据所述当前帧的信号特征以及当前帧之前的 背景信号帧更新后的信号特征判断当前帧是否为背景信号帧, 音调特性获取 模块, 用于对为背景信号帧的当前帧, 获得所述当前帧的音调特性以及当前 帧之前多个背景信号帧的音调特性, 信号特性关联模块, 用于关联所述当前 帧的音调特性和当前帧之前多个背景信号帧的音调特性, 第一类信号模块, 用于将所述关联后的音调特性与第一阔值比较, 根据比较结果确定所述为背 景信号帧的当前帧是否为第一类信号。
本发明另一实施例提供了一种信号分类的装置, 所述装置包括: 信号判断模块, 用于根据包括所述当前帧的信号特征以及当前帧之前多 个有用信号帧更新后的信号特征进行第一判断, 判断所述当前帧是否为有用 信号帧, 信号特征模块, 用于对为有用信号帧的所述当前帧, 获得所述当前 帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征, 信号判决模 块, 用于根据包括所述当前帧的信号特征以及所述当前帧之前多个有用信号 帧的信号特征进行第二判断, 判断所述当前帧的信号类型, 所述第一判断或 第二判断基于信号分类判决的门限进行, 所述信号分类判决的门限根据判断 当前帧或当前帧之前的背景信号帧处于第一类信号状态时调整得到。
本发明另一实施例提供了一种信号处理系统, 所述系统包括:
信号特征获取装置, 获得输入信号当前帧的信号特征, 信号识别装置, 用于根据所述当前帧的信号特征, 检测当前帧是否为背景信号帧, 根据为背 景帧的所述当前帧是否处于第一类信号状态调整信号分类判决的门限, 信号 分类装置, 用于根据所述当前帧的信号特征, 判断所述当前帧是否为有用信 号帧以及判断所述为有用帧的当前帧的信号类型, 所述是否为有用信号帧的 判断或为有用信号帧的当前帧的信号类型的判断基于信号分类判决的门限进 行, 所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧是 否处于第一类信号状态时调整得到。
本发明另一实施例提供了一种音频信号编码系统, 所述系统包括: 信号输入装置, 用于接收音频信号, 信号分类装置, 用于根据所述当前 帧的信号特征, 判断所述当前帧是否为有用信号帧以及判断所述为有用帧的 当前帧的信号类型, 所述是否为有用信号帧的判断或为有用信号帧的当前帧 的信号类型的判断基于信号分类判决的门限进行, 所述信号分类判决的门限 根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整 所得, 信号编码装置, 用于根据判断的为有用信号帧的当前帧的信号类型为 不同类型的信号分别釆用编码器进行编码获得包括不同类型的信号的编码码 流。
本发明另一实施例提供了一种信号判决的方法, 所述方法包括: 获得输入信号当前帧的信号特征, 判断所述当前帧是否处于第一类信号 状态, 根据所述当前帧是否处于第一类信号状态确定信号分类判决的门限; 将确定后的信号分类判决门限与所述当前帧的信号特征进行比较判断当 前帧的信号类别。
本发明另一实施例提供了一种信号判决的装置, 所述装置包括: 获得输入信号当前帧的信号特征的模块;
判断所述当前帧是否处于第一类信号状态, 根据所述当前帧是否处于第 一类信号状态确定信号分类判决的门限的模块;
将确定后的信号分类判决门限与所述当前帧的信号特征进行比较判断当 前帧的信号类别的模块。 因此, 通过引入本发明实施例, 可以识别出信号中的非语音背景, 并且 在在识别出信号中的非语音背景后调整信号分类判决的门限, 通过该门限的 调整有效降低了信号的误判率, 提升在非语音背景下的识别语音信号的能力 和信号处理质量。 附图说明
为了更清楚地说明本发明实施例中的技术方案, 下面将对实施例描述中 所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动性 的前提下, 还可以根据这些附图获得其他的附图。
图 1为现有技术信号分类的应用场景示意图;
图 1为现有技术判决树进行信号分类的短时判决示意图;
图 3为现有技术判决树进行信号分类的长时判决示意图;
图 4为本发明信号识别方法实施例示意图;
图 5为本发明另一信号识别方法实施例示意图;
图 6 ( a )和图 6 ( b )为本发明另一信号识别方法实施例示意图; 图 7为本发明另一信号识别方法实施例示意图;
图 8为本发明信号分类方法实施例示意图;
图 9为本发明另一信号识别方法实施例示意图; 图 10为本发明另一信号识别方法实施例示意图;
图 11为本发明信号处理系统实施例示意图;
图 12 ( a )和图 12 ( b ) 为本发明另一信号处理系统实施例示意图; 图 1 3 ( a )和图 1 3 ( b ) 为本发明信号识别装置实施例示意图; 图 14为本发明另一信号识别装置实施例示意图;
图 15为本发明信号分类装置实施例示意图;
图 16为本发明音频信号编码系统实施例示意图; 图 17为本发明信号判决方法实施例示意图。 具体实施方式
下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行 清楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而 不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人员在没有作 出创造性劳动前提下所获得的所有其他实施例 , 都属于本发明保护的范围。 实施例一: 信号识别的方法
图 4为信号识别方法实施的示意图, 包括:
步骤 101 : 获得输入信号当前帧的信号特征;
将输入信号分帧, 以帧为操作单位逐一进行本实施例的各操作步骤, 此 处的输入信号可以为音频信号, 音频信号根据信号环境可以分为前景信号和 背景信号, 在前景信号和背景信号中又可以按照音频信号的特性分为语音和 非语音, 如音乐信号, 当然, 在不同的应用场景下, 还可以根据特定的环境 和音频信号进行其他类别的划分, 本发明各实施例仅以前景信号和背景信号 以及语音和非语音为例进行描述。 对于音频信号划分的各帧, 将当前正在处 理的信号帧称为当前帧, 提取当前帧的特征参数获得当前帧的信号特征, 帧 的信号特征可以包括体现信号物理特性的所有特征或者部分特征, 如信噪比 特征、 能量特征等等, 该信号特征可以以特征参数的形式参与信号识别, 获 得当前帧的信号特征根据不同的环境特点和应用需求可以做不同的选择提 取, 为便于理解和描述的方面, 实施例仅以信号帧的信噪比作为当前帧的信 号特征的描述。
步骤 102 :根据包括所述当前帧的信号特征以及所述当前帧之前背景信号 帧更新后的信号特征判断当前帧是否为背景信号帧;
不同的信号特征可以用于区别按照不同标准划分的不同类型的音频信 号, 结合当前帧的信号特征和当前帧之前的背景信号帧更新后的信号特征即 可判断出当前帧是否为背景信号帧, 一般来说, 背景信号帧可以理解为我们 通常意义理解的背景噪声或者背景音乐等, 本步骤即要从音频信号中将背景 信号区别出来, 判断出当前帧是否为背景信号帧, 对于在当前帧之前的首个 或者当前帧之前的多个背景信号帧中的一个, 当对所述背景信号帧进行信号 特征更新后, 将所述更新后的信号特征和当前帧的信号特征关联, 获得关联 后的当前帧的信号特征, 将所述关联后的当前帧的信号特征用于当前帧是否 为背景信号帧的判断, 若当前帧为背景信号帧转步骤 103 , 本发明各实施例中 对所述背景信号帧进行信号特征的更新得到的更新后的信号特征包括得到对 背景信号帧的特征估计。
步骤 103: 检测所述当前帧是否处于第一类信号状态;
对为背景信号帧的当前帧进行检测, 检测其是否处于第一类信号状态, 所述的第一类信号状态可以釆用调整门限判决参数来表征, 本发明各实施例 中以第一类信号状态的音乐背景拖尾保护变量 b_mus _hang为例对调整门限判 决参数进行描述, 音乐背景拖尾保护变量 b_mus _hang预设一个初始值, 音乐 背景拖尾保护变量 b_mus _hang的变化包括在判断到分帧为背景信号帧时的减 操作以及判断到分帧为音乐背景帧时的最大化操作。 第一类信号可以理解为 非语音信号中的一类信号, 例如用户希望接收语音信号, 那么第一类信号相 对于语音而言可以包括噪声, 音乐等, 本发明各实施例中以音乐信号为例作 为第一类信号的描述。 步骤 104 :根据所述当前帧是否处于第一类信号状态调整信号分类判决的 门限。
根据当前帧是否处于第一类信号状态调整信号分类判决的门限, 当当前 帧处于第一类信号状态或者不处于第一类信号状态, 对信号分类判决的门限 有不同的调整方案, 无论何种调整方案, 所述分类信号判决的门限可以包括 多种门限, 可以根据不同的需求在不同的应用环境中选择调整其中的一个或 多个, 分类信号判决的门限用于对当前帧, 具体的说对当前帧进行信号的分 类, 确定当前帧为语音帧还是非语音帧。
该实施例中, 不对步骤 103和步骤 104 的执行顺序进行限制, 步骤 103 和步骤 104 可以在步骤 102之前执行, 也就是说信号分类判决门限是否调整 的判断以及对信号分类判决门限的调整本实施例中可以放在对当前帧是否为 背景信号帧的判断前进行, 进一步若信号分类判决门限中如果与背景信号帧 的判断有关的门限进行了调整, 即将调整后的门限用于当前帧是否为背景信 号帧的判断中, 背景信号帧的判决需要和信号分类判决门限进行比较, 信号 分类判决门限取决于调整门限判决参数值, 在步骤 102前执行步骤 1 03和步 骤 104 ,可以将门限的判断和调整后的门限用于当前帧是否为背景信号帧的判 决中, 否则当前帧是否为背景信号帧的判断中釆用的判断门限为预设门限或 者当前帧之前的背景信号帧处于第一类信号状态时调整得到的信号分类判决 门限。
在以下本发明各实施例中, 当前帧是否处于第一类状态的判决以及信号 分类判决门限的调整均可以在信号分类判决门限用于当前帧的判决前调整, 也可以在当前帧的判决后调整, 在当前帧的判决前调整的信号分类门限用于 当前帧的判决中, 在当前帧的判决后调整的信号分类判决门限用于后续帧的 判决中, 所述的当前帧的判决包括背景信号的判断、 有用信号的判断以及语 音音乐信号的判断。 实施例二: 信号识别的方法
图 5为另一信号识别方法实施的示意图, 包括:
步骤 201 :根据所述当前帧的信号特征以及所述当前帧之前的背景信号帧 更新后的信号特征判断当前帧是否为背景信号帧;
在当前帧判断是否为背景信号帧的判断前, 当前帧之前的被判断为背景 信号帧的分帧需要进行背景信号帧的更新, 背景信号帧的更新包括对背景信 号帧的信号特征进行更新, 例如根据分帧的信号特征对背景信号帧的长时特 征参数进行滑动平均得到背景信号的长时滑动平均参数, 可以理解为利用当 前背景帧的特征参数去更新背景信号的长时平均参数, 对背景信号帧的更新 除之前提到的信号特性估计, 也可以包括对根据分帧的特征参数对背景信号 的其他参数进行加窗或其他的操作。 以长时滑动平均参数为例, 将长时滑动 平均参数关联到当前帧的的信号特征中, 作为当前信号帧是否为背景信号帧 的判断依据, 具体的, 可以釆用将关联后的当前信号帧的信号特征和前景背 景判决门限 T1进行比较,若当前信号帧的信号特征大于前景背景判决门限 T1, 则判断所述当前帧为背景信号帧。 所述进行比较的前景背景判决门限 T1 , 通 过如下方式获得: 预设背景前景判决门限; 或根据判断当前帧或当前帧之前 的背景信号帧是否处于第一类信号状态时调整得到, 所述根据判断当前帧或 当前帧之前的背景信号帧是否处于第一类信号状态时调整得到包括通过判断 调整门限判决参数与阀值的大小对背景前景判决门限进行调整。
步骤 202 : 对为背景信号帧的当前帧, 获得所述当前帧的音调特性以及当 前帧之前多个背景信号帧的音调特性;
累积一段时间的音调特性, 可以为设定时间条件下的包括当前帧在内的 以及当前帧之前的多个背景信号帧的音调特性, 也可以为为设定计数条件下 的包括当前帧在内的以及当前帧之前的多个背景信号帧的音调特性, 包括当 前帧在内可以为 3、 1 00或者更多, 本实施例不对其进行限定。 步骤 203 :关联所述当前帧的音调特性和当前帧之前多个背景信号帧的音 调特性;
关联所述当前帧的音调特性和当前帧之前多个背景信号帧的音调特性包 括对上述各音调特性进行求和的操作, 或者求和后的变形或替换, 或者变形 或替换后进行求和、 或者形式更新等操作, 得到关联音调特性。
步骤 204 : 将所述关联后的音调特性与第一阔值比较, 根据比较结果确定 所述为背景信号帧的当前帧是否为第一类信号。
所述第一类信号在本发明实施例中可以包括音乐信号, 通过比较结果可 以判断当前帧是否为音乐背景, 该步骤还包括根据比较的结果调整信号分类 判决的门限以对当前帧进行信号分类, 如果关联音调特性大于第一阔值, 则 为背景信号帧的当前帧为非语音背景, 此处以音乐背景为例加以说明, 如果 关联音调特征小于等于第一阔值, 则为背景信号帧的当前帧为非音乐背景, 根据比较结果, 对应音乐背景和非音乐背景, 还可以对信号分类判决的门限 进行调整, 所述信号分类判决的门限可以包括背景前景判决门限 τι、 声音活 动性能检测 (VAD ) 时的有用信号判决门限 Τ2或语音音乐判决门限 Τ 3。 实施例三: 信号识别的方法
图 6 ( a )和图 6 ( b )为另一信号识别方法实施的示意图, 包括: 获得输入信号当前帧的信号特征。
根据包括所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新 后的信号特征判断当前帧是否为背景信号帧, 包括将当前帧之前的背景信号 帧更新后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信号 特征, 将关联后的当前帧的信号特征和背景前景判决门限进行比较判断当前 帧是否为背景信号帧, 当关联后的当前帧的信号特征大于背景前景判决门限 则当前帧为背景信号帧, 背景前景判决门限通过如下方式获得: 预设背景前 景判决门限, 或根据判断当前帧或当前帧之前的背景信号帧是否处于第一类 信号状态时调整得到, 根据判断当前帧之前的背景信号帧是否处于第一类信 号状态时调整得到背景前景判决门限包括: 通过判断调整门限判决参数与阀 值的大小对背景前景判决门限进行调整, 所述调整门限判决参数在当前帧之 前的背景信号帧处于第一类信号状态时被重新设置, 根据判断当前帧是否处 于第一类信号状态时调整得到背景前景判决门限包括: 在判断当前帧是否为 背景信号帧前, 对调整门限判决参数和阀值进行比较, 判断调整门限判决参 数与阀值的大小对信号分类判决的门限进行调整, 将调整的结果用于当前帧 是否为背景信号帧的判断门限。
对判断出的为背景信号帧的当前帧进行背景信号更新, 所述更新后的背 景信号用于后续帧是否为背景信号的判决中。 对判断出的为背景信号帧的当 前帧将调整门限判决参数值进行减操作。
检测为背景信号帧的所述当前帧是否处于第一类信号状态, 包括对调整 门限判决参数和阀值进行比较, 判断调整门限判决参数与阀值的大小对信号 分类判决的门限进行调整, 将调整的结果用于当前帧是否为背景信号帧的判 断门限。
该实施例还包括对为背景信号帧的当前帧是否为背景音乐的判断, 包括 对为背景信号帧的当前帧, 获得所述当前帧的音调特性以及当前帧之前的多 个背景信号帧的音调特性, 关联所述当前帧的音调特性和当前帧之前的多个 背景信号帧的音调特性, 对所述信号特性关联模块关联的所述当前帧之前多 个背景信号帧进行计数加操作, 若当前帧关联计数加操作达到技术预定值则 停止关联, 对所述信号特性关联模块关联所述当前帧之前多个背景信号帧的 音调特性时进行调整门限判决参数值的减操作, 每关联一个当前帧之前的背 景信号帧的音调特性对调整门限判决数值进行减操作。
将所述关联后的音调特性与第一阔值比较, 检测为背景信号帧的所述当 前帧是否为第一类信号, 即音乐信号, 所述关联后的音调特性大于所述第一 阔值则当前帧为音乐背景, 此时重新设置调整门限判决参数, 否则调整门限 判决参数不变化, 进一步通过判断调整门限判决参数与阀值的大小对信号分 类判决的门限进行调整, 使其更倾向于提高背景信号更新率, 可以使得部分 前景帧被当作背景帧进行更新, 调整信号分类判决的门限, 包括调整信号分 类判决的门限包括: 调整背景前景判决门限、 有用信号判决门限或语音音乐 判决门限, 实施例四: 信号识别的方法
图 7 为另一信号识别方法实施的示意图, 该实施例举例了本发明信号识 别方法中一种具体的实施方案, 需要说明的说, 该实施例中的技术参数、 技 术数值、 或名称等不可用于限定本发明, 在不同的应用场景中可以进行适当 的变形、 修改或替换,该信号识别方法包括:
提取当前输入信号的特征参数, 如信噪比等参数, 此时进行调整信号分 类判决门限的操作, 如图 7虚框所示, 也可以在后续执行, 后续执行调整的 过程该实施例后面进行了描述, 在此进行调整信号分类判决门限需要判断调 整门限判决参数, 调整门限判决参数有一个设定的初始值, 调整门限判决参 数可以表示为音乐背景拖尾保护变量 b_mus_hang,判断 b_mus_hang是否大于 零, 如果大于零, 则对信号分类判决门限进行调整, 若调整背景前景判决门 限, 则当 b_mus_hang大于零时调整为 Tlx, 否则调整为 Tly, 将特征参数与 调整后的背景前景判决门限 T1进行比较来判断当前帧是有用信号帧还是背景 信号帧。 当前帧为背景信号时, 该变量 b_mus_hang减 1, b_mus_hang小于零 时将零附值给 b_mus_hang, 计数器加 1, 计数器初始值可以为 0, 同时检测当 前帧是否具有音乐特征, 检测当前帧是否具有音乐特性包括: 若当前帧判决 中计数器的数值达到达到预定值,如 100,计算当前帧的音调特性参数 tonal, 获得緩存的包括当前帧在内的前 100个背景帧的 tonal参数, 将其求和得到 tonal-sum参数, 如果 tonal-sum大于第一阔值 t, 则说明当前为音乐背景, 置音乐背景拖尾保护变量 b_mus_hang=max, 本实施例中设 t = 1200, max = 1000。
进一步的, 还可以进行信号分类判决门限的调整, 判断 b_腿 s _hang是否 大于零, 调整信号分类判决门限 Tl , T2或 T3 , 当调整 T1时, 若1)_觀3 _1 &1^ 大于零,则信号分类判决门限为 Tlx,否则为 Tly;当调整 T2时,若 b_mus _hang 大于零,则信号分类判决门限为 T2x,否则为 T2y;当调整 T3时,若 b_mus _hang 大于零, 则信号分类判决门限为 T3x, 否则为 T3y。
如果上述判断当前帧为背景信号帧, 则对背景信号进行更新, 如根据当 前帧的特征参数对背景信号的长时特征参数进行滑动平均得到长时滑动平均 参数, 长时滑动平均参数当当前帧为背景帧是, 可用于后续帧是背景信号帧 还是有用信号帧的判断, 在判断当前帧为背景信号帧还是有用信号帧的过程 中, 与背景前景判决门限进行比较的当前帧的特征参数同样关联了当前帧之 前的背景信号帧的背景信号更新信息, 以长时滑动平均参数为例根据分帧的 特征参数将背景信号前后数帧的长时特征参数进行滑动平均得到长时滑动平 均参数, 将该滑动平均参数和当前帧的特征参数关联得到关联后的当前帧的 特征参数, 根据关联后的当前帧的特征参数和 T1进行比较以获得当前帧是否 为背景信号帧。
若没有特殊说明, 下述各实施例的描述的当前帧之前的背景信号帧均以 上一背景信号帧为例以说明, 后续帧均以下一帧为例进行说明, 也就是说釆 用上一帧或者下一帧对当前帧之前的帧或当前帧之后的帧进行描述。 实施例五: 信号分类的方法
图 8为信号分类方法实施的示意图, 包括:
步骤 301 :根据包括所述当前帧的信号特征以及当前帧之前多个背景信号 帧更新后的信号特征进行第一判断, 判断所述当前帧是否为有用信号帧; 对输入信号进行分帧, 以信号分帧后的信号帧为处理对象, 获得当前帧 的信号特征, 接收或主动获取上一背景信号帧更新后的背景信号的信号特征, 将更新后的背景信号的信号特征关联到当前帧的信号特征中, 将关联后的当 前帧的信号特征作为判断当前帧是否为有用信号帧的依据, 将所述关联后的 当前帧的信号特征作为参数和有用信号判决门限 T2进行比较, 当根据比较结 果确定当前帧是否为有用信号, 若为有用信号转步骤 302执行。
步骤 302 : 对为有用信号帧的所述当前帧, 获得所述当前帧的信号特征以 及所述当前帧之前多个有用信号帧的信号特征;
根据步骤 301 得出的结果即有用信号与否, 决定着是否将该帧的信号特 征参数累积起来, 当信号为有用信号时, 获得当前帧的信号特征以及当前帧 之前多个有用信号帧的信号特征, 具体的, 可将该帧特征参数緩存至一个数 组中, 本实施例中, 緩存包括当前帧在内的前多个有用信号帧的特征参数, 反之, 则不緩存。
步骤 303 :根据所述当前帧的信号特征以及所述当前帧之前多个有用信号 帧的信号特征进行第二判断, 判断所述当前帧的信号类型, 所述第一判断或 第二判断基于信号分类判决的门限进行, 所述信号分类判决的门限根据判断 上一背景信号帧处于第一类信号状态时调整所得。
判断时, 可以将緩存的信号特征作为特征参数逐一与语音音乐判决门限 T3进行比较, 根据比较的结果判断当前帧的信号类别为语音帧或者为音乐帧 信号。
其中, 步骤 301和步骤 303中, 有用信号判决门限和语音音乐判决门限 之一釆用对判决出上一音乐背景信号帧时调整得到的信号分类判决的门限, 对没有釆用所述信号分类判决门限的用信号判决门限和语音音乐判决门限之 一则釆用预设的门限值、 经验门限值或者沿用上次判断时釆用的门限, 在某 些情况下, 甚至可以是随机门限值, 在此不做限定, 釆用调整后的门限值还 是其他门限值, 需要在适用信号分类判决门限的时候对信号分类判决门限进 行查找, 若信号分类判决门限值在之前帧的信号识别中发生调整, 则釆用调 整后的信号分类判决门限值, 否则釆用其他的门限值信息, 在另一情况下, 可以在第一判断或第二判断前进行信号分类判决门限的调整, 判断当前调整 门限判决参数是否大于阀值对信号分类判决门限进行相应的调整。
在另一实施条件下, 也可以不改变有用信号判决门限和语音音乐判决门 限之一为调整后的信号分类判决门限, 而釆用将信号识别方法中的背景信号 判断时釆用的背景前景判决门限变换为调整后的信号分类判决门限, 也可以 达到同样的技术效果。 实施例六: 信号分类的方法
图 9为另一信号分类方法实施的示意图, 包括
根据包括所述当前帧的信号特征以及当前帧之前的背景信号帧更新后的 信号特征进行第一判断, 判断所述当前帧是否为有用信号帧, 包括将当前帧 之前的背景信号帧更新后的信号特征关联到当前帧的信号特征中得到关联后 的当前帧的信号特征, 将关联后的当前帧的信号特征和有用信号判决门限进 行第一判断, 判断所述当前帧是否为有用信号帧。
当所述关联后的当前帧的信号特征大于有用信号信号帧判决门限则判断 所述当前帧为有用信号帧。 由于信号识别时将部分有用信号帧做为背景信号 帧进行更新, 使得背景信号的电平提高了, 而前景信号电平没有变化, 这样 在声音活动性检测对有用信号帧的判断中背景信号的信噪比降低了, 从而使 得部分非语音帧未被判为有用信号。
对为有用信号帧的所述当前帧, 获得所述当前帧的信号特征以及所述当 前帧之前多个有用信号帧的信号特征。
根据包括所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的 信号特征进行第二判断, 判断所述当前帧的信号类型, 包括: 将包括当前帧 在内的多个有用信号帧的信号特征与语音音乐判决门限进行比较; 若信号特 征大于等于语音音乐判决门限的帧数大于信号特征小于语音音乐判决门限的 帧数时, 判断当前帧为语音帧, 否则为第一类信号帧。 所述第一判断或第二判断基于信号分类判决的门限进行, 所述信号分类 判决的门限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号 状态时调整得到, 可以为信号分类判决的门限通过判断调整门限判决参数与 阀值的大小对背景前景判决门限进行调整得到, 所述调整门限判决参数当所 述当前帧判断为背景信号帧时进行减操作, 所述调整门限判决参数在当前帧 之前背景信号帧处于第一类信号状态时被重新设置, 信号分类判决的门限包 括: 调整背景前景判决门限、 有用信号判决门限或语音音乐判决门限。 实施例七: 信号分类的方法
图 10为另一信号分类方法实施的示意图, 该实施例举例了本发明信号识 别方法中一种具体的实施方案, 需要说明的说, 该实施例中的技术参数、 技 术数值、 或名称等不可用于限定本发明, 在不同的应用场景中可以进行适当 的变形、 修改或替换,该信号分类方法包括:
每帧提取信号的特征参数, 根据当前帧的特征参数判断当前帧是否为有 用信号, 即将当前帧的特征参数和有用信号判决门限 T2进行比较, 当前帧的 特征参数关联有当前帧之前多个有用信号帧更新后的信号特征, 有用信号判 决门限通过调整信号分类判决门限所得, 在当前帧或者当前帧之前的背景信 号帧识别的过程中, 根据调整门限判决参 ¾ b_mus _hang与 0值的比较结果调 整信号分类判决门限, 当对有用信号判决门限 T2进行调整时, 则将调整后的 有用信号判决门限用于信号分类的方法中, 作为判决当前帧信号是否为有用 信号的判决门限, 当当前帧的特征参数大于所述调整后的有用信号判决门限 T2 时, 当前帧为有用信号, 有用信号与否, 决定是否将该帧的信号特征参数 累积起来, 当信号为有用信号时, 将该帧特征参数緩存至一个数组中起来, 本实施例中, 緩存包括当前帧在内的前 120个前景帧的特征参数, 反之, 则 不緩存。 判决时, 将緩存的特征参数逐一与语音音乐判决门限进行比较, 语 音音乐判决门限釆用预设门限,计算出緩存的参数中大于等于该门限的帧数 m 和小于该门限的帧数 n, 当 m>n时当前帧被判为语音帧, 否则判为音乐帧, 其 中特征参数数值较大表明该帧具备语音特性, 当前帧为语音帧, 反之具备音 乐特性, 当前帧为音乐帧。 由于当前帧或当前帧之前的背景信号帧中调整了 有用信号判决门限, 使部分音乐帧在有用信号帧的判断中未被判为有用信号 , 因而使得一部分音乐帧的特征参数没有被緩存, 这样在计算 m和 n时, 就减 小了小于语音音乐判决门限的帧数, 进而提升了语音信号的识别率。 实施例八: 信号处理系统
图 11为信号处理系统实施的示意图, 包括:
信号特征获取装置, 获得输入信号当前帧的信号特征。
还包括信号识别装置, 用于根据所述当前帧的信号特征, 检测当前帧是 否为背景信号帧, 根据所述当前帧是否处于第一类信号状态调整信号分类判 决的门限。
信号识别装置根据当前帧的信号特征对当前帧是否为背景信号帧进行判 断, 判断包括将关联了当前帧之前背景信号帧更新背景信号后的信号特征的 当前帧的信号特征和背景前景判决门限进行比较, 当大于所述背景前景判决 门限时判断当前帧为背景信号帧, 对为背景信号帧的当前帧, 获得所述当前 帧的音调特性以及当前帧之前多个背景信号帧的音调特性, 关联所述当前帧 的音调特性和当前帧之前多个背景信号帧的音调特性; 关联至计数器预定值 时将所述关联后的音调特性与第一阔值比较, 当大于所述第一阔值时判断所 述背景信号帧为音乐背景信号, 若调整门限判决参数大于预设的阀值, 调整 信号分类判决的门限, 所述调整信号分类判决的门限包括调整背景前景判决 门限 Tl、 声音活动性能检测 (VAD ) 时的有用信号判决门限 Τ2或语音音乐判 决门限 Τ3。 调整后的信号分类判决门限用于后续帧的背景信号判断、 有用信 号判断或者语音音乐分类判断中。 例如若当前帧对背景前景判决门限进行调 整, 那么用于下一帧的背景信号判断时, 下一帧参与是否为背景信号帧的判 断比较的背景前景判决门限门限为在本帧信号识别装置中调整后的 T1 , 调整 门限判决参数的比较也可以用在是否为背景信号的判断前, 当调整的背景前 景判决门限用于当前帧是否为背景信号帧的判断中。
还包括信号分类装置, 用于根据所述当前帧的信号特征, 判断所述当前 帧是否为有用信号帧以及判断所述为有用帧的当前帧的信号类型, 所述是否 为有用信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分 类判决的门限进行, 所述信号分类判决的门限根据判断当前帧或当前帧之前 的背景信号帧是否处于第一类信号状态时调整得到。
信号分类装置根据包括所述当前帧的信号特征以及当前帧之前多个背景 信号帧更新后的信号特征进行第一判断, 判断所述当前帧是否为有用信号帧, 对为有用信号帧的所述当前帧, 获得所述当前帧的信号特征以及所述当前帧 之前多个有用信号帧的信号特征, 根据所述当前帧的信号特征以及所述当前 帧之前多个有用信号帧的信号特征进行第二判断, 判断所述当前帧的信号类 型, 区分出输入信号中的语音帧和音乐帧。 其中, 所述第一判断或第二判断 基于信号分类判决的门限进行, 所述信号分类判决的门限根据判断当前帧或 当前帧之前的背景信号帧处于第一类信号状态时调整所得, 所述信号分类门 限用于第一判断还是第二判断取决于当前帧或当前帧之前的帧中进行信号分 类门限调整是调整的是哪一个门限信息, 例如, 若调整有用信号判决门限, 则信号分类装置在进行第一判断的时候将关联了当前帧之前多个背景信号帧 更新后的信号特征的当前帧的信号特征和调整后的有用信号判决门限进行比 较, 判断当前帧是否为有用信号帧。 实施例九: 信号处理系统
图 12 ( a )和图 12 ( b )为信号处理系统实施的示意图, 包括输入信号接 收器 120 , 输入信号接收器接收输入的信号,对输入信号进行分帧得到 N个信 号帧 10 , N为自然数, 对每个信号帧进行处理, 处理的当前信号帧被称为当 前帧, 输入信号接收器将分帧后的信号帧逐一送入信号特征分析器 121, 信号 特征分析器 121 对当前帧进行分析, 提取出当前帧的特征参数, 如信噪比参 数, 将提取出的信噪比参数 11送入特征关联器 122, 背景前景判决门限 T1被 送入背景信号判决器 123, 背景前景判决门限由信号门限调整器 124提供, 门 限查找器 1241查找门限调整器中信号帧判决门限中当前帧或上一背景信号帧 的背景前景判决门限没有被调整时, 釆用预设门限或或沿用上一次判决时的 门限值, 或者系统随机提供, 当在上一帧的处理中对背景前景判决门限进行 了调整或者在当前帧对门限值进行了调整, 当前帧处理中送入背景信号判决 器的为经上一帧处理调整后的背景前景判决门限或当前帧调整后的背景前景 判决门限, 信噪比参数送入背景信号判决器前在特征关联器中进行特征关联, 特征关联器接收当前帧的特征参数, 将其与上一背景信号帧判决后的背景信 号更新信息 12关联在一起形成关联后的当前帧的特征参数 13,如将根据上一 帧的特征参数对背景信号的长时特征参数进行滑动平均后得到长时滑动平均 参数和当前帧的特征参数关联在一起形成当前帧关联后的特征参数, 所述上 一背景信号判决后的背景信号更新信息来至于背景信号更新器 125,将关联后 的当前帧的特征参数送入背景信号判决器, 背景信号判决器对关联后的当前 帧的特征参数和背景前景判决门限进行比较, 当当前帧的特征参数大于所述 背景前景判决门限时, 判断当前帧为背景信号帧, 将判断结果 14送入音乐背 景判断器, 同样送入音乐背景判断器 127的还有緩存器 126 中緩存的包括当 前帧在内的前 100个背景帧的音调特性 tonal参数的和值以及判决门限 15, 所述 tonal参数也可以通过信号特征分析器 121获得, 系统中还包括一个计 数器 128对当前帧在内的前 100个背景帧进行计数的操作, 系统中还包括一 个减法器 129对音乐背景拖尾保护变量 b_mus_hang进行减操作, 每处理一信 号帧, 计数器加 1, b_mus_hang减 1, 当计数器达到 100时计算 tonal的和值 tonal-sum, 若当前帧为计数器达到 100 时的帧, 则音乐背景判决器将 tonal-s丽和判决门限进行比较, 如果 tonal-sum大于预设的判决门限, 则说 明当前为音乐背景, 置音乐背景拖尾保护变量 b_mus _hang=max , 如果 tona l - sum不大于预设的判决门限,则 b_mus _hang不变,本实施例中 T = 1200 , max = 1000 , 进一步可以对信号分类判决门限进行调整, b_mus _hang 的结果 16被送入调整门限判决器 1 30 , 当 b_mus _hang大于零时, 门限调整器 124调 整信号分类判决门限为第一门限, 否则调整为第二门限, 所述调整第一或第 二门限 17包括对背景前景判决门限 Tl、 有用信号判决门限 Τ2或语音音乐判 决门限 Τ3的调整, 若对信号分类判决门限的调整在信号进入背景信号判决器 前进行, 则调整门限判决器先进行 b_mus _hang是否大于零的判断, 门限调整 器根据判决结果进行信号分类判决门限的调整, 此时门限查找器查找背景前 景判决门限, 将若进行了调整的背景前景判决门限送入背景信号判决器, 如 图 12 ( b )所示。 上述各器件可以集成于背景检测器中。
输入信号经过输入信号接收器分帧、 信号特征分析器分析以及特征关联 器关联后得到的关联的当前帧的特征参数也送入有用信号判决器 1 31 ,送入有 用信号判决器的还有来至于门限调整器的有用信号判决门限, 门限查找器 1241 查找信号帧判决门限中上一背景信号帧的有用信号判决门限在上一帧的 处理中没有被调整时, 釆用预设门限或沿用上一次判决时的门限值, 或者系 统随机提供, 当在上一帧的处理中对有用信号判决门限进行了调整, 当前帧 处理中送入有用信号帧判决器的为经上一帧处理调整后的有用信号判决门 限。 有用信号判决器将有用信号判决门限与关联后的当前帧的特征参数进行 比较, 如果关联后的当前帧的特征参数大于所述有用信号判决门限, 则判断 当前帧为有用信号帧, 当当前帧为有用信号帧时, 则将当前帧的特征参数通 过緩存器 126緩存至一个数组中, 本实施例中, 緩存包括当前帧在内的前 120 个有用信号帧的特征参数 Π , 将緩存的特征参数送入语音音乐判决器 1 32 , 同时送入语音音乐判决器的还有来至于门限调整器语音音乐判决门限, 门限 查找器 1241查找信号帧判决门限中上一背景信号帧的语音音乐判决门限在上 一帧的处理中没有被调整时, 釆用预设门限或沿用上一次判决时的门限值, 或者系统随机提供, 当在上一帧的处理中对语音音乐判决门限进行了调整, 当前帧处理中送入背景信号判决器的为经上一帧处理调整后的语音音乐判决 门限, 语音音乐判决器将緩存的特征参数逐一与语音音乐判决门限进行比较, 信号分类器 1 33根据语音音乐判决器的比较结果, 计算出緩存的参数中大于 等于该门限的帧数 m和小于该门限的帧数 n, 当 m>n时当前帧分类为语音帧, 否则分类为音乐帧, 其中特征参数数值较大表明该帧具备语音特性, 反之具 备音乐特性。 上述釆用的有用信号判决门限或语音音乐判决门限除釆用上一 帧的调整结果外, 还可以在信号送入有用信号判决器或语音音乐判决器前有 调整门限判决器和门限和门限调整器针对当前门限调整判决参数获得送入有 用信号判决器或语音音乐判决器, 见图 12 ( b ), 上述各器件可以集成于语音 音乐分类器中。 也可以将有用信号帧的判决所需的器件独立于语音音乐分类 器之外作为声音活动性检测器。 背景检测器和语音音乐分类器也可以公用一 个输入信号接收器, 信号特征分析器、 特征关联器或緩存器。 实施例十: 信号识别装置
图 1 3 ( a )和图 1 3 ( b ) 为信号识别装置实施的示意图, 包括:
背景信号判断模块 1 300 , 用于根据包括当前帧的信号特征以及所述当前 帧之前背景信号帧更新后的信号特征判断当前帧是否为背景信号帧。 背景信 号判断模块获得当前帧的信号特征以及所述当前帧之前背景信号帧更新后的 信号特征, 将所述当前帧的信号特征与所述当前帧之前背景信号帧更新后的 信号特征关联, 得到关联后的信号特征。 将此信号特征与背景前景判决门限 进行比较, 所述背景前景判决门限包括预设的门限值, 如经验值、 随即值等, 或者包括前一帧进行信号类别判决门限调整时调整背景前景判决门限后的 值。
信号识别装置还包括信号特性检测模块 1027 , 用于检测所述当前帧是否 处于第一类信号状态。 具体包括根据当前帧的门限调整判决参数和一阔值进 行比较判断当前帧是否处于第一类信号状态。
信号识别装置还包括门限调整第一模块 1024 , 用于根据为背景帧的所述 当前帧是否处于第一类信号状态调整信号分类判决的门限。 进行信号分类判 决门限的调整, 调整背景前景判决门限 Tl、有用信号判决门限 Τ2或语音音乐 判决门限 Τ3 , 在后续各帧的判决中将所述调整后的信号分类判决门限用于背 景前景信号的判断、 有用信号的判断或者语音音乐信号的判断中。
信号识别装置还包括背景信号更新模块 1025 , 用于对背景信号判决单元 判断出的为背景信号帧的当前帧进行背景信号更新, 所述更新后的背景信号 用于背景信号判决单元对后续帧是否为背景信号的判决中。
背景信号判断模块包括特征关联单元 1022 , 用于将当前帧之前的背景信 号帧更新后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信 号特征, 背景信号判决单元 1023 , 用于将关联后的当前帧的信号特征和背景 前景判决门限进行比较判断当前帧是否为背景信号帧。
背景信号判决单元中进行比较的背景前景判决门限通过如下方式获得: 预设背景前景判决门限, 或根据判断当前帧或当前帧之前的背景信号帧是否 处于第一类信号状态时调整得到。 根据判断当前帧是否处于第一类信号状态 时调整背景前景判决门限如图 1 3 ( b ) 所示。 实施例十一: 信号识别装置
图 14为另一信号识别装置实施的示意图, 包括:
背景信号判断模块 1 300 , 用于根据所述当前帧的信号特征以及当前帧之 前的背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;
信号识别装置还包括音调特性获取模块 1 301 , 用于对为背景信号帧的当 前帧, 获得所述当前帧的音调特性以及当前帧之前多个背景信号帧的音调特 性;
信号识别装置还包括信号特性关联模块 1 302 , 用于关联所述当前帧的音 调特性和当前帧之前多个背景信号帧的音调特性;
信号识别装置还包括第一类信号模块 1 303 , 用于将所述关联后的音调特 性与第一阔值比较, 根据比较结果确定所述为背景信号帧的当前帧是否为第 一类信号。
信号识别装置还包括门限调整第二模块 1 306 , 用于根据所述比较结果调 整信号分类判决的门限以对当前帧进行信号分类, 包括调整背景前景判决门 限、 有用信号判决门限或语音音乐判决门限。
信号识别装置还包括计数器 1 304 , 用于对所述信号特性关联模块关联的 所述当前帧之前多个背景信号帧进行计数加操作, 以及减法器 1 305 , 用于对 所述信号特性关联模块关联所述当前帧之前多个背景信号帧的音调特性时进 行调整门限判决参数值的减操作。
所述门限调整第二模块可以集成于第一类信号模块中, 此时, 第一类信 号模块包括: 第一类信号特性判决单元 1027 , 用于将所述关联后的音调特性 与第一阔值比较确定调整门限判决参数, 调整门限判决单元 1030 , 用于将所 述调整门限判决参数和阀值比较, 门限调整单元 1024 , 用于根据所述调整门 限判决单元的比较结果进行信号分类判决的门限的调整。 所述门限调整第二 模块的输出若作为背景信号判断模块的输入时, 所述门限调整第二模块包括 调整门限判决单元 1030 , 用于将所述调整门限判决参数和阀值比较, 门限调 整单元 1024 , 用于根据所述调整门限判决单元的比较结果进行信号分类判决 的门限的调整, 将信号分类判决门限中的背景前景判决门限送入所述背景信 号判断模块中。 实施例十二: 信号分类装置
图 15为信号分类装置实施的示意图, 包括:
信号判断模块, 用于根据包括所述当前帧的信号特征以及当前帧之前多 个背景信号帧更新后的信号特征进行第一判断, 判断所述当前帧是否为有用 信号帧。
信号分类装置还包括信号特征模块, 用于对为有用信号帧的所述当前帧, 获得所述当前帧的信号特征以及所述当前帧之前多个背景信号帧的信号特 征。
信号分类装置还包括信号判决模块, 用于根据包括所述当前帧的信号特 征以及所述当前帧之前多个背景信号帧的信号特征进行第二判断, 判断所述 当前帧的信号类型, 所述第一判断或第二判断基于信号分类判决的门限进行, 所述信号分类判决的门限根据判断当前帧或当前帧之前的背景信号帧处于第 一类信号状态时调整得到, 包括调整背景前景判决门限、 有用信号判决门限 或语音音乐判决门限, 信号分类判决的门限根据判断当前帧或当前帧之前的 背景信号帧是否处于第一类信号状态时调整得到包括信号分类判决的门限通 过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调整得到, 所述调整门限判决参数在当前帧或当前帧之前的背景信号帧处于第一类信号 状态时被重新设置。
信号判断模块包括特征关联单元, 用于将当前帧之前的背景信号帧更新 后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信号特征, 有用信号帧判决单元, 用于将关联后的当前帧的信号特征和有用信号判决门 限进行第一判断, 判断所述当前帧是否为有用信号帧, 其中有用信号帧判决 单元的有用信号判决门限包括预设的有用信号判决门限或根据判断上一背景 信号帧是否处于第一类信号状态时调整得到。
信号分类装置还包括门限查找单元, 用于查找信号帧判决门限中上一背 景信号帧的有用信号判决门限是否调整, 若调整, 则有用信号帧判决单元釆 用调整后的有用信号判决门限与所述关联后的当前帧的信号特征进行比较, 否则釆用预设的有用信号判决门限。
信号判决模块包括判决比较单元, 用于将包括当前帧在内的多个有用信 号帧的信号特征与语音音乐判决门限进行比较, 信号分类单元, 用于若信号 特征大于等于语音音乐判决门限的帧数大于信号特征小于语音音乐判决门限 的帧数时, 判断当前帧为语音帧, 否则为第一类信号帧。 实施例十三: 音频信号编码系统,
图 16为音频信号编码系统实施的示意图, 包括:
信号输入装置 1601 , 用于接收音频信号;
信号特征获取装置 1602 , 获得音频信号中当前帧的信号特征;
信号分类装置 1603 , 用于根据所述当前帧的信号特征, 判断所述当前帧 是否为有用信号帧以及判断所述为有用帧的当前帧的信号类型, 所述是否为 有用信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分类 判决的门限进行, 所述信号分类判决的门限根据判断当前帧或当前帧之前的 背景信号帧处于第一类信号状态时调整得到;
信号编码装置 1604 , 用于才艮据判断的为有用信号帧的当前帧的信号类型 为不同类型的信号分别釆用编码器进行编码获得包括不同类型的信号的编码 码流。
所述信号分类装置包括特征关联单元 1631 , 用于将当前帧之前的背景信 号帧更新后的信号特征关联到当前帧的信号特征中得到关联后的当前帧的信 号特征; 1632有用信号帧判决单元, 用于将关联后的当前帧的信号特征和有 用信号判决门限进行第一判断, 判断所述当前帧是否为有用信号帧; 信号特 征单元 1633 , 用于对为有用信号帧的所述当前帧, 获得所述当前帧的信号特 征以及所述当前帧之前多个有用信号帧的信号特征; 判决比较单元 1634 , 用 于将包括当前帧在内的多个有用信号帧的信号特征与语音音乐判决门限进行 比较; 信号分类单元 1635 , 用于若信号特征大于语音音乐判决门限的帧数大 于信号特征小于语音音乐判决门限的帧数时, 判断当前帧为语音帧, 否则为 第一类信号帧, 所述有用信号判决门限或语音音乐判决门限从门限调整单元 获得。 实施例十四, 一种信号判决方法,
图 17为信号判决方法实施的示意图, 包括:
步骤 401 : 获得输入信号当前帧的信号特征;
步骤 402 : 检测所述当前帧是否处于第一类信号状态;
步骤 403:根据所述当前帧是否处于第一类信号状态调整信号分类判决的 门限;
步骤 404 :将调整后的信号分类判决门限与所述当前帧的信号特征进行比 较判断当前帧的信号类别。
所述检测所述当前帧是否处于第一类信号状态包括: 将调整门限判决参 数与预定值进行比较, 根据比较结果判断所述当前帧是否处于第一类信号状 态。
所述根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限 包括调整背景前景判决门限、 有用信号判决门限或语音音乐判决门限。
所述将调整后的信号分类判决门限与所述当前帧的信号特征进行比较判 断当前帧的信号类别包括: 将调整后的背景前景判决门限与所述当前帧的信 号特征进行比较判断当前帧是否为背景信号帧, 将调整后的有用信号判决门 限与所述当前帧的信号特征进行比较判断当前帧是否为有用信号帧, 将调整 后的语音音乐判决门限与所述当前帧的信号特征进行比较判断当前帧为语音 帧或者音乐帧。 通过信号分类判决门限的调整, 提升信号分类时对不同类型 信号的识别能力。 本发明的各实施例, 可以识别出信号中的非语音背景, 并且在在识别出 信号中的非语音背景后调整信号分类判决的门限, 通过该门限的调整有效降 低了信号的误判率, 进一步将对门限的调整用于对输入信号的有用信号判决, 并用于输入信号中语音和非语音信号的分类中, 有效的提升在非语音背景下 的识别语音信号的能力和信号处理质量。 上述各实施例即可以用于语音与音 频编码中, 也可以用到针对多类型信号的环境需要对不同类型信号进行区别 处理时的所有通讯技术、 网络技术以及计算机解决方案中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流 程, 是可以通过计算机程序来指令相关的硬件来完成, 所述的程序可存储于 一计算机可读取存储介质中, 该程序在执行时, 可包括如上述各方法的实施 例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM )或随机存 己忆体 ( Random Access Memory, RAM )等。
对其进行限制, 尽管参照较佳实施例对本发明实施例进行了详细的说明, 本 领域的普通技术人员应当理解: 其依然可以对本发明实施例的技术方案进行 修改或者等同替换, 而这些修改或者等同替换亦不能使修改后的技术方案脱 离本发明实施例技术方案的精神和范围。

Claims (38)

  1. 权 利 要 求
    1、 一种信号识别的方法, 其特征在于, 所述方法包括:
    获得输入信号当前帧的信号特征;
    根据包括所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新 后的信号特征判断当前帧是否为背景信号帧;
    检测所述当前帧是否处于第一类信号状态;
    根据所述当前帧是否处于第一类信号状态调整信号分类判决的门限。
  2. 2、 根据权利要求 1所述的方法, 其特征在于, 所述调整信号分类判决的 门限包括: 调整背景前景判决门限、 有用信号判决门限或语音音乐判决门限。
  3. 3、 根据权利要求 2所述的方法, 其特征在于, 所述根据包括所述当前帧 的信号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧 是否为背景信号帧包括:
    将当前帧之前的背景信号帧更新后的信号特征关联到当前帧的信号特征 中得到关联后的当前帧的信号特征, 将关联后的当前帧的信号特征和背景前 景判决门限进行比较判断当前帧是否为背景信号帧。
  4. 4、 根据权利要求 2或 3所述的方法, 其特征在于, 所述进行比较的背景 前景判决门限通过如下方式获得:
    预设背景前景判决门限; 或
    根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时 调整得到。
  5. 5、 根据权利要求 4所述的方法, 其特征在于, 所述根据判断当前帧或当 前帧之前的背景信号帧是否处于第一类信号状态时调整得到背景前景判决门 限包括:
    通过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调 整, 所述调整门限判决参数当所述当前帧判断为背景信号帧时进行减操作。 6、 根据权利要求 3所述的方法, 其特征在于, 所述方法还包括: 对判断 出的为背景信号帧的当前帧进行背景信号更新, 所述更新后的背景信号用于 后续帧是否为背景信号的判决中。
  6. 7、 一种信号识别的方法, 其特征在于:
    根据所述当前帧的信号特征以及所述当前帧之前的背景信号帧更新后的 信号特征判断当前帧是否为背景信号帧;
    对为背景信号帧的当前帧, 获得所述当前帧的音调特性以及当前帧之前 的多个背景信号帧的音调特性;
    关联所述当前帧的音调特性和当前帧之前的多个背景信号帧的音调特 性;
    将所述关联后的音调特性与第一阔值比较, 根据比较结果确定所述为背 景信号帧的当前帧是否为第一类信号。
  7. 8、 根据权利要求 7所述的方法, 其特征在于, 还包括:
    根据所述比较结果调整信号分类判决的门限, 所述调整信号分类判决的 门限包括: 调整背景前景判决门限、 有用信号判决门限或语音音乐判决门限。
  8. 9、 根据权利要求 8所述的方法, 其特征在于, 所述根据所述当前帧的信 号特征以及所述当前帧之前的背景信号帧更新后的信号特征判断当前帧是否 为背景信号帧需要与背景前景判决门限进行比较, 所述进行比较的背景前景 判决门限通过如下方式获得: 预设背景前景判决门限; 或根据判断当前帧或 当前帧之前的背景信号帧是否处于第一类信号状态时调整得到;
    所述根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状 态时调整得到包括通过判断调整门限判决参数与阀值的大小对背景前景判决 门限进行调整, 所述调整门限判决参数当所述当前帧判断为背景信号帧时进 行减操作。
  9. 1 0、 根据权利要求 8 所述的方法, 其特征在于, 所述将所述关联后的音 调特性与第一阔值比较, 根据比较结果调整信号分类判决的门限包括: 将所述关联后的音调特性与第一阔值比较, 所述关联后的音调特性大于 所述第一阔值则重新设置调整门限判决参数;
    通过判断调整门限判决参数与阀值的大小对背景前景判决门限进行调 整。
  10. 11、 根据权利要求 10所述的方法, 其特征在于, 所述方法还包括: 对所述信号特性关联模块关联的所述当前帧之前多个背景信号帧进行计 数加操作;
    对所述信号特性关联模块关联所述当前帧之前多个背景信号帧的音调特 性时进行调整门限判决参数值的减操作。
  11. 12、 一种信号分类的方法, 其特征在于:
    根据包括所述当前帧的信号特征以及当前帧之前的背景信号帧更新后的 信号特征进行第一判断, 判断所述当前帧是否为有用信号帧;
    对为有用信号帧的所述当前帧, 获得所述当前帧的信号特征以及所述当 前帧之前多个有用信号帧的信号特征;
    根据包括所述当前帧的信号特征以及所述当前帧之前多个有用信号帧的 信号特征进行第二判断, 判断所述当前帧的信号类型, 所述第一判断或第二 判断基于信号分类判决的门限进行, 所述信号分类判决的门限根据判断当前 帧或当前帧之前的背景信号帧是否处于第一类信号状态时调整得到。
  12. 13、 根据权利要求 12所述的方法, 其特征在于, 所述信号分类判决的门 限包括: 背景前景判决门限、 有用信号判决门限或语音音乐判决门限。
  13. 14、 根据权利要求 13所述的方法, 其特征在于, 所述根据包括所述当前 帧的信号特征以及当前帧之前的背景信号帧更新后的信号特征进行第一判 断, 判断所述当前帧是否为有用信号帧包括:
    将当前帧之前的背景信号帧更新后的信号特征关联到当前帧的信号特征 中得到关联后的当前帧的信号特征, 将关联后的当前帧的信号特征和有用信 号判决门限进行第一判断, 判断所述当前帧是否为有用信号帧; 当所述关联后的当前帧的信号特征大于有用信号信号帧判决门限则判断 所述当前帧为有用信号帧。
  14. 15、 根据权利要求 1 3或 14所述的方法, 其特征在于, 所述根据包括所 述当前帧的信号特征以及所述当前帧之前多个有用信号帧的信号特征进行第 二判断, 判断所述当前帧的信号类型包括:
    将包括当前帧在内的多个有用信号帧的信号特征与语音音乐判决门限进 行比较;
    若信号特征大于等于语音音乐判决门限的帧数大于信号特征小于语音音 乐判决门限的帧数时, 判断当前帧为语音帧, 否则为第一类信号帧。
  15. 16、 根据权利要求 1 3所述的方法, 其特征在于, 所述信号分类判决的门 限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调 整得到包括:
    所述信号分类判决的门限通过判断调整门限判决参数与阀值的大小对背 景前景判决门限进行调整得到, 所述调整门限判决参数当所述当前帧判断为 背景信号帧时进行减操作, 所述调整门限判决参数在当前帧之前的背景信号 帧处于第一类信号状态时被重新设置。
  16. 17、 一种信号识别装置, 其特征在于, 所述信号识别装置包括: 背景信号判断模块, 用于根据包括当前帧的信号特征以及所述当前帧之 前背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;
    信号特性检测模块, 用于检测所述当前帧是否处于第一类信号状态; 门限调整第一模块, 用于根据所述当前帧是否处于第一类信号状态调整 信号分类判决的门限。
  17. 18、 根据权利要求 17所述的装置, 其特征在于, 所述调整信号分类判决 的门限包括调整背景前景判决门限、 有用信号判决门限或语音音乐判决门限。
  18. 19、 根据权利要求 18所述的装置, 其特征在于, 所述背景信号判断模块 包括: 特征关联单元, 用于将当前帧之前的背景信号帧更新后的信号特征关联 到当前帧的信号特征中得到关联后的当前帧的信号特征;
    背景信号判决单元, 用于将关联后的当前帧的信号特征和背景前景判决 门限进行比较判断当前帧是否为背景信号帧。
  19. 20、 根据权利要求 18所述的装置, 其特征在于, 还包括背景信号更新单 元, 用于对背景信号判决单元判断出的为背景信号帧的当前帧进行背景信号 更新, 所述更新后的背景信号用于背景信号判决单元对后续帧是否为背景信 号的判决中。
  20. 21、 根据权利要求 19所述的装置, 其特征在于, 所述背景信号判决单元 中进行比较的背景前景判决门限通过如下方式获得:
    预设背景前景判决门限; 或
    根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时 调整得到。
  21. 22、 一种信号识别装置, 其特征在于, 所述信号识别装置包括: 背景信号判断模块, 用于根据所述当前帧的信号特征以及当前帧之前的 背景信号帧更新后的信号特征判断当前帧是否为背景信号帧;
    音调特性获取模块, 用于对为背景信号帧的当前帧, 获得所述当前帧的 音调特性以及当前帧之前多个背景信号帧的音调特性;
    信号特性关联模块, 用于关联所述当前帧的音调特性和当前帧之前多个 背景信号帧的音调特性;
    第一类信号模块, 用于将所述关联后的音调特性与第一阔值比较, 根据 比较结果确定所述为背景信号帧的当前帧是否为第一类信号。
  22. 23、 根据权利要求 22所述的装置, 其特征在于, 所述调整信号分类判决 的门限包括调整背景前景判决门限、 有用信号判决门限或语音音乐判决门限。
  23. 24、 根据权利要求 23所述的装置, 其特征在于, 还包括门限调整第二模 块, 所述门限调整第二模块可以包括在所述第一类信号模块中, 用于根据所 述比较结果调整信号分类判决的门限, 所述门限调整第二模块包括: 第一类信号特性判决单元, 用于将所述关联后的音调特性与第一阔值比 较确定调整门限判决参数;
    调整门限判决单元, 用于将所述调整门限判决参数和阀值比较; 门限调整单元, 用于根据所述调整门限判决单元的比较结果进行信号分 类判决的门限的调整;
    所述门限调整第二模块可以独立于所述第一类信号模块, 用于调整信号 分类判决的门限, 所述门限调整第二模块包括:
    调整门限判决单元, 用于将门限判决参数和阀值比较;
    门限调整单元, 用于根据所述调整门限判决单元的比较结果进行信号分 类判决的门限的调整。
  24. 25、 根据权利要求 24所述的装置, 其特征在于, 还包括:
    计数器, 用于对所述信号特性关联模块关联的所述当前帧之前多个背景 信号帧进行计数加操作;
    减法器, 用于对所述信号特性关联模块关联所述当前帧之前多个背景信 号帧的音调特性时进行调整门限判决参数值的减操作。
  25. 26、 一种信号分类装置, 其特征在于, 所述信号分类装置包括: 信号判断模块, 用于根据包括所述当前帧的信号特征以及当前帧之前多 个背景信号帧更新后的信号特征进行第一判断, 判断所述当前帧是否为有用 信号帧;
    信号特征模块, 用于对为有用信号帧的所述当前帧, 获得所述当前帧的 信号特征以及所述当前帧之前多个有用信号帧的信号特征;
    信号判决模块, 用于根据包括所述当前帧的信号特征以及所述当前帧之 前多个有用信号帧的信号特征进行第二判断, 判断所述当前帧的信号类型, 所述第一判断或第二判断基于信号分类判决的门限进行, 所述信号分类判决 的门限根据判断当前帧或当前帧之前的背景信号帧处于第一类信号状态时调 整得到。
  26. 27、 根据权利要求 26所述的装置, 其特征在于, 所述调整信号分类判决 的门限包括调整背景前景判决门限、 有用信号判决门限或语音音乐判决门限。
  27. 28、根据权利要求 27所述的装置,其特征在于, 所述信号判断模块包括: 特征关联单元, 用于将当前帧之前的背景信号帧更新后的信号特征关联 到当前帧的信号特征中得到关联后的当前帧的信号特征;
    有用信号帧判决单元, 用于将关联后的当前帧的信号特征和有用信号判 决门限进行第一判断, 判断所述当前帧是否为有用信号帧。
  28. 29、 根据权利要求 28所述的装置, 其特征在于, 所述有用信号帧判决单 元的有用信号判决门限包括预设的有用信号判决门限或根据判断当前帧或当 前帧之前的背景信号帧是否处于第一类信号状态时调整得到;
    所述装置还包括门限查找单元, 用于查找信号帧判决门限中当前帧或当 前帧之前的背景信号帧的有用信号判决门限是否调整, 若调整, 则有用信号 帧判决单元釆用调整后的有用信号判决门限与所述关联后的当前帧的信号特 征进行比较, 否则釆用预设的有用信号判决门限。
  29. 30、根据权利要求 28所述的装置, 其特征在于, 所述信号判决模块包括: 判决比较单元, 用于将包括当前帧在内的多个有用信号帧的信号特征与 语音音乐判决门限进行比较;
    信号分类单元, 用于若信号特征大于等于语音音乐判决门限的帧数大于 信号特征小于语音音乐判决门限的帧数时, 判断当前帧为语音帧, 否则为第 一类信号帧。
  30. 31、 根据权利要求 29所述的装置, 其特征在于, 所述信号分类判决的门 限根据判断当前帧或当前帧之前的背景信号帧是否处于第一类信号状态时调 整得到包括:
    所述信号分类判决的门限通过判断调整门限判决参数与阀值的大小对背 景前景判决门限进行调整得到。 32、 如权利要求 17的背景检测器。
  31. 33、 如权利要求 26的语音音乐信号分类器。
  32. 34、 一种信号处理系统, 其特征在于, 所述信号处理系统包括: 信号特征获取装置, 获得输入信号当前帧的信号特征;
    信号识别装置, 用于根据所述当前帧的信号特征, 检测当前帧是否为背 景信号帧, 根据为背景帧的所述当前帧是否处于第一类信号状态调整信号分 类判决的门限;
    信号分类装置, 用于根据所述当前帧的信号特征, 判断所述当前帧是否 为有用信号帧以及判断所述为有用帧的当前帧的信号类型, 所述是否为有用 信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分类判决 的门限进行, 所述信号分类判决的门限根据判断当前帧或当前帧之前的背景 信号帧是否处于第一类信号状态时调整得到。
  33. 35、 一种音频信号编码系统, 其特征在于, 所述系统包括:
    信号输入装置, 用于接收音频信号;
    信号分类装置, 用于根据所述当前帧的信号特征, 判断所述当前帧是否 为有用信号帧以及判断所述为有用帧的当前帧的信号类型, 所述是否为有用 信号帧的判断或为有用信号帧的当前帧的信号类型的判断基于信号分类判决 的门限进行, 所述信号分类判决的门限根据判断当前帧或当前帧之前的背景 信号帧是否处于第一类信号状态时调整所得;
    信号编码装置, 用于根据判断的为有用信号帧的当前帧的信号类型为不 同类型的信号分别釆用编码器进行编码获得包括不同类型的信号的编码码 流。
  34. 36、根据权利要求 34所述的系统, 其特征在于, 所述信号分类装置包括: 特征关联单元, 用于将当前帧之前的背景信号帧更新后的信号特征关联 到当前帧的信号特征中得到关联后的当前帧的信号特征;
    有用信号帧判决单元, 用于将关联后的当前帧的信号特征和有用信号判 决门限进行第一判断, 判断所述当前帧是否为有用信号帧;
    信号特征单元, 用于对为有用信号帧的所述当前帧, 获得所述当前帧的 信号特征以及所述当前帧之前多个有用信号帧的信号特征;
    判决比较单元, 用于将包括当前帧在内的多个有用信号帧的信号特征与 语音音乐判决门限进行比较;
    信号分类单元, 用于若信号特征大于语音音乐判决门限的帧数大于信号 特征小于语音音乐判决门限的帧数时, 判断当前帧为语音帧, 否则为第一类 信号帧。
  35. 37、 一种信号判决的方法, 其特征在于, 所述方法包括:
    获得输入信号当前帧的信号特征;
    判断所述当前帧是否处于第一类信号状态, 根据所述当前帧是否处于第 一类信号状态确定信号分类判决的门限;
    将确定后的信号分类判决门限与所述当前帧的信号特征进行比较判断当 前帧的信号类别。
  36. 38、 根据权利要求 37所述的方法, 其特征在于, 所述判断所述当前帧是 否处于第一类信号状态包括:
    将确定门限判决参数与预定值进行比较, 根据比较结果判断所述当前帧 是否处于第一类信号状态。
  37. 39、 根据权利要求 37所述的方法, 其特征在于, 所述根据所述当前帧是 否处于第一类信号状态确定信号分类判决的门限包括确定背景前景判决门 限、 有用信号判决门限或语音音乐判决门限;
    所述将确定后的信号分类判决门限与所述当前帧的信号特征进行比较判 断当前帧的信号类别包括:
    将确定后的背景前景判决门限与所述当前帧的信号特征进行比较判断当 前帧是否为背景信号帧;
    或者, 将确定后的有用信号判决门限与所述当前帧的信号特征进行比较 判断当前帧是否为有用信号帧;
    或者, 将确定后的语音音乐判决门限与所述当前帧的信号特征进行比较 判断当前帧为语音帧或者音乐帧。
  38. 40、 一种信号判决的装置, 其特征在于, 所述装置包括:
    获得输入信号当前帧的信号特征的模块;
    判断所述当前帧是否处于第一类信号状态, 根据所述当前帧是否处于第 一类信号状态确定信号分类判决的门限的模块;
    将确定后的信号分类判决门限与所述当前帧的信号特征进行比较判断当 前帧的信号类别的模块。
CN201080001404.2A 2009-10-15 2010-10-15 信号处理的方法、装置和系统 Active CN102714034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201080001404.2A CN102714034B (zh) 2009-10-15 2010-10-15 信号处理的方法、装置和系统

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN200910110792.7 2009-10-15
CN200910110792 2009-10-15
PCT/CN2010/077760 WO2011044848A1 (zh) 2009-10-15 2010-10-15 信号处理的方法、装置和系统
CN201080001404.2A CN102714034B (zh) 2009-10-15 2010-10-15 信号处理的方法、装置和系统

Publications (2)

Publication Number Publication Date
CN102714034A true CN102714034A (zh) 2012-10-03
CN102714034B CN102714034B (zh) 2014-06-04

Family

ID=43875850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080001404.2A Active CN102714034B (zh) 2009-10-15 2010-10-15 信号处理的方法、装置和系统

Country Status (4)

Country Link
US (2) US20120197642A1 (zh)
EP (1) EP2490214A4 (zh)
CN (1) CN102714034B (zh)
WO (1) WO2011044848A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107210033A (zh) * 2015-01-30 2017-09-26 微软技术许可有限责任公司 基于众包来更新用于数字个人助理的语言理解分类器模型
CN112162256A (zh) * 2020-09-29 2021-01-01 中国船舶重工集团公司第七二四研究所 一种基于脉冲相关的级联式多维度径向运动特征检测方法
CN115334349A (zh) * 2022-07-15 2022-11-11 北京达佳互联信息技术有限公司 音频处理方法、装置、电子设备及存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9160837B2 (en) 2011-06-29 2015-10-13 Gracenote, Inc. Interactive streaming content apparatus, systems and methods
US20130090926A1 (en) * 2011-09-16 2013-04-11 Qualcomm Incorporated Mobile device context information using speech detection
CN103716470B (zh) * 2012-09-29 2016-12-07 华为技术有限公司 语音质量监控的方法和装置
CN106409313B (zh) * 2013-08-06 2021-04-20 华为技术有限公司 一种音频信号分类方法和装置
KR102446392B1 (ko) * 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US10902043B2 (en) 2016-01-03 2021-01-26 Gracenote, Inc. Responding to remote media classification queries using classifier models and context parameters
CN109598741A (zh) * 2017-09-30 2019-04-09 佳能株式会社 图像处理装置和方法及监控系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
CN101197135A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 声音信号分类方法和装置
CN101197130A (zh) * 2006-12-07 2008-06-11 华为技术有限公司 声音活动检测方法和声音活动检测器
CN101236742A (zh) * 2008-03-03 2008-08-06 中兴通讯股份有限公司 音乐/非音乐的实时检测方法和装置
US20100211385A1 (en) * 2007-05-22 2010-08-19 Martin Sehlstedt Improved voice activity detector

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6330533B2 (en) * 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6507814B1 (en) * 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6381570B2 (en) * 1999-02-12 2002-04-30 Telogy Networks, Inc. Adaptive two-threshold method for discriminating noise from speech in a communication signal
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6983242B1 (en) * 2000-08-21 2006-01-03 Mindspeed Technologies, Inc. Method for robust classification in speech coding
US6885988B2 (en) * 2001-08-17 2005-04-26 Broadcom Corporation Bit error concealment methods for speech coding
US6959276B2 (en) * 2001-09-27 2005-10-25 Microsoft Corporation Including the category of environmental noise when processing speech signals
US20030236663A1 (en) * 2002-06-19 2003-12-25 Koninklijke Philips Electronics N.V. Mega speaker identification (ID) system and corresponding methods therefor
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
US7469209B2 (en) * 2003-08-14 2008-12-23 Dilithium Networks Pty Ltd. Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
CN1965218A (zh) * 2004-06-04 2007-05-16 皇家飞利浦电子股份有限公司 交互式语音识别系统的性能预测
US7505902B2 (en) * 2004-07-28 2009-03-17 University Of Maryland Discrimination of components of audio signals based on multiscale spectro-temporal modulations
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
JP3913772B2 (ja) * 2005-08-24 2007-05-09 松下電器産業株式会社 音識別装置
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
US8311813B2 (en) * 2006-11-16 2012-11-13 International Business Machines Corporation Voice activity detection system and method
KR100964402B1 (ko) * 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
CN101197135A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 声音信号分类方法和装置
CN101197130A (zh) * 2006-12-07 2008-06-11 华为技术有限公司 声音活动检测方法和声音活动检测器
US20100211385A1 (en) * 2007-05-22 2010-08-19 Martin Sehlstedt Improved voice activity detector
CN101236742A (zh) * 2008-03-03 2008-08-06 中兴通讯股份有限公司 音乐/非音乐的实时检测方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107210033A (zh) * 2015-01-30 2017-09-26 微软技术许可有限责任公司 基于众包来更新用于数字个人助理的语言理解分类器模型
CN107210033B (zh) * 2015-01-30 2020-10-16 微软技术许可有限责任公司 基于众包来更新用于数字个人助理的语言理解分类器模型
CN112162256A (zh) * 2020-09-29 2021-01-01 中国船舶重工集团公司第七二四研究所 一种基于脉冲相关的级联式多维度径向运动特征检测方法
CN112162256B (zh) * 2020-09-29 2023-08-01 中国船舶集团有限公司第七二四研究所 一种基于脉冲相关的级联式多维度径向运动特征检测方法
CN115334349A (zh) * 2022-07-15 2022-11-11 北京达佳互联信息技术有限公司 音频处理方法、装置、电子设备及存储介质
CN115334349B (zh) * 2022-07-15 2024-01-02 北京达佳互联信息技术有限公司 音频处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
EP2490214A1 (en) 2012-08-22
WO2011044848A1 (zh) 2011-04-21
EP2490214A4 (en) 2012-10-24
US20120197642A1 (en) 2012-08-02
CN102714034B (zh) 2014-06-04
US20120215541A1 (en) 2012-08-23

Similar Documents

Publication Publication Date Title
CN102714034A (zh) 信号处理的方法、装置和系统
CN102687196B (zh) 用于检测语音段的方法
CN105190746B (zh) 用于检测目标关键词的方法和设备
US20100004926A1 (en) Apparatus and method for classification and segmentation of audio content, based on the audio signal
KR101863097B1 (ko) 키워드 인식 장치 및 방법
CN102056026A (zh) 音视频同步检测方法及其系统、语音检测方法及其系统
CN103700370A (zh) 一种广播电视语音识别系统方法及系统
CN110706694A (zh) 一种基于深度学习的语音端点检测方法及系统
WO2011044795A1 (zh) 一种音频信号检测方法和装置
WO2011015237A1 (en) Method and apparatus for audio signal classification
JP2000066691A (ja) オーディオ情報分類装置
CN101149921A (zh) 一种静音检测方法和装置
CN101751920A (zh) 基于再次分类的音频分类装置及其实现方法
CN114627899A (zh) 声音信号检测方法及装置、计算机可读存储介质、终端
Górriz et al. An effective cluster-based model for robust speech detection and speech recognition in noisy environments
CN112420079B (zh) 语音端点检测方法和装置、存储介质及电子设备
JP4201204B2 (ja) オーディオ情報分類装置
CN110444194B (zh) 一种语音检测方法和装置
CN111341351A (zh) 基于自注意力机制的语音活动检测方法、装置及存储介质
CN116259322A (zh) 音频数据压缩方法及相关产品
CN114038487A (zh) 一种音频提取方法、装置、设备和可读存储介质
CN112185367A (zh) 关键词检测方法和装置、计算机可读存储介质、电子设备
CN117395341B (zh) 基于i2s的智能手表通话音频处理单元智能切换方法
CN111128244B (zh) 基于过零率检测的短波通信语音激活检测方法
JP5028651B2 (ja) 情報処理装置およびコンテンツ解析プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant