CN112750463A

CN112750463A - 一种误识别抑制方法

Info

Publication number: CN112750463A
Application number: CN202011497926.8A
Authority: CN
Inventors: 丁少为; 关海欣; 梁家恩
Original assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date: 2020-12-17
Filing date: 2020-12-17
Publication date: 2021-05-04

Abstract

本发明涉及一种误识别抑制方法，本发明根据波达方向和能量抑制比判断定向拾音输出信号的识别结果是否由非拾音区的干扰引起，很大程度上抑制由强干扰引起的误识别。通过结合识别语句的波达方向(DOA)信息以及定向拾音对识别信号的能量抑制比，降低整个系统的误识别。

Description

一种误识别抑制方法

技术领域

本发明涉及音频识别技术领域，具体涉及一种误识别抑制方法。

背景技术

现有技术中，在一些特定场景中，通过波束形成技术可以获取固定方向的目标信号(称之为定向拾音技术)，同时抑制其它方向的噪声和干扰。然而，当在非拾音区存在较强干扰时，误识别现象比较严重。

发明内容

本发明提供一种误识别抑制方法，以解决强干扰环境下定向拾音技术的误识别问题，进一步完善定向拾音功能。

本发明解决上述技术问题的技术方案如下：

根据本发明实施例的一个方面，提供一种误识别抑制方法，包括：

步骤一：麦克风阵列接收信号进行短时傅里叶变换；

步骤二：根据短时傅里叶变换后的信号对每帧数据进行波达方向估计θ_t，同时选取任意一个麦克风信号计算每帧数据能量，记为初始能量

并将波达方向估计θ_t和初始能量

缓存；

步骤三：将短时傅里叶变换后的信号经过定向拾音处理；

步骤四：计算定向拾音处理后每帧数据的能量，记为输出能量

并缓存；

步骤五：将定向拾音处理后的数据送入识别引擎，并得到识别信号的起止时间点信息，分别记为起始时间t₁和终止时间t₂；

步骤六：根据起止时间点信息计算识别信号的初始能量E₁及其对应的输出能量E₂，并计算识别信号能量比R；

步骤七：统计起始时间t₁到终止时间t₂时间段θ_t的众数作为识别信号的波达方向记为θ_mode，计算波达方向与定向拾音目标方向偏差θ_error；

步骤八：判决系统根据识别信号能量比和波达方向进行判决，并根据判决结果判断识别信号是否为干扰。

优选地，所述初始能量为

优选地，所述输出能量为

优选地，所述信号能量比为

优选地，所述方向偏差为θ_error＝|θ_mode-θ_in|。

优选地，所述判决系统设置为强抑制模式和/或弱抑制模式。

优选地，所述强抑制模式实施为波达方向偏差θ_error大于角度偏差阈值θ_th或识别信号能量比R小于阈值R_th，则该识别信号为干扰引起的误识别。

优选地，所述弱抑制模式实施为波达方向偏差θ_error大于阈值θ_th且识别信号能量比R大于阈值R_th，则该识别信号为干扰引起的误识别。

优选地，还包括，步骤九：若识别信号被判定为干扰，则系统不输出任何识别结果。

据本发明实施例的另一个方面，提供一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行前述误识别抑制方法。

从而，本发明根据波达方向和能量抑制比判断定向拾音输出信号的识别结果是否由非拾音区的干扰引起，能够很大程度上抑制由强干扰引起的误识别。

附图说明

图1为本发明麦克风阵列示意图；

图2为本发明提供的算法流程图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

本发明实施例提供的一种误识别抑制方法，以解决强干扰环境下定向拾音技术的误识别问题，进一步完善定向拾音功能。

通过波束形成技术可以实现定向拾音，但当环境中存在较强的干扰时，定向拾音对强干扰的抑制能力比较有限，因此还会存在误识别的问题，尤其是当仅存在强干扰时，误识别会更加明显。通过结合识别语句的波达方向(DOA)信息以及定向拾音对识别信号的能量抑制比，降低整个系统的误识别。

设定向拾音的目标方位为θ_in，具体步骤如下：

步骤一：麦克风阵列接收信号进行短时傅里叶变换；

并将波达方向估计θ_t和初始能量

缓存；

步骤三：将短时傅里叶变换后的信号经过定向拾音处理；

并缓存；

若识别信号在定向拾音的拾音区域内，则定向拾音输出信号能量和初始信号能量仅会有微弱变化，相反，若在拾音区域外，则其能量衰减较多；同时，其波达方向是否在拾音区域内也是判断其为信号或干扰的一个重要参考。本发明根据波达方向和能量抑制比判断定向拾音输出信号的识别结果是否由非拾音区的干扰引起，能够很大程度上抑制由强干扰引起的误识别。

在一些实施例中，初始能量为

在一些实施例中，输出能量为

在一些实施例中，信号能量比为

在一些实施例中，方向偏差为θ_error＝|θ_mode-θ_in|。

在一些实施例中，判决系统设置为强抑制模式和/或弱抑制模式。

在一些实施例中，强抑制模式实施为波达方向偏差θ_error大于角度偏差阈值θ_th或识别信号能量比R小于阈值R_th，则该识别信号为干扰引起的误识别。

在一些实施例中，弱抑制模式实施为波达方向偏差θ_error大于阈值θ_th且识别信号能量比R大于阈值R_th，则该识别信号为干扰引起的误识别。

在一些实施例中，还包括步骤九：若识别信号被判定为干扰，则系统不输出任何识别结果。

本发明实施例提供的一种误识别抑制方法可以软件功能模块的形式实现并作为独立的产品销售或使用，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。