CN109256153A

CN109256153A - 一种声源定位方法及系统

Info

Publication number: CN109256153A
Application number: CN201810995819.4A
Authority: CN
Inventors: 关海欣; 丁少为; 马金龙
Original assignee: Beijing Yunzhisheng Information Technology Co Ltd
Current assignee: Beijing Yunzhisheng Information Technology Co Ltd
Priority date: 2018-08-29
Filing date: 2018-08-29
Publication date: 2019-01-22
Anticipated expiration: 2038-08-29
Also published as: CN109256153B

Abstract

本发明提供了一种声源定位方法及系统，其中，所述方法包括：从声源数据中识别语音段数据和噪音段数据；分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值；对相同相位处的所述语音评分值和所述噪音评分值进行处理，得到规整评分值，并基于所述规整评分值，确定所述声源对应的目标角度。本申请提供的技术方案，能够提高声源定位的精度。

Description

一种声源定位方法及系统

技术领域

本发明涉及声音处理技术领域，特别涉及一种声源定位方法及系统。

背景技术

目前，为了对声源进行定位，通常是通过麦克风阵列接收的多通道语音数据计算声源方位。如可以在给定的角度范围内，计算归一化频谱与不同导向矢量间的内积，可以得到每个相位的打分输出，最终，可以将最大打分输出对应的相位位置作为声源的实际角度位置。

然而，在噪声干扰下，如果噪声分量高于语音分量就很容易造成计算方位错误。而这种情况在实际应用环境中非常容易出现，比如智能音箱放置于靠近马路的窗口位置，或者旁边挨着厨房的智能设备等等，都很容易出现定位错误。

发明内容

本申请的目的在于提供一种声源定位方法及系统，能够提高声源定位的精度。

为实现上述目的，本申请提供一种声源定位方法，所述方法包括：

从声源数据中识别语音段数据和噪音段数据；

分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值；

对相同相位处的所述语音评分值和所述噪音评分值进行处理，得到规整评分值，并基于所述规整评分值，确定所述声源对应的目标角度。

进一步地，从声源数据中识别语音段数据和噪音段数据包括：

对所述声源数据进行语音检测，得到所述声源数据中的语音起止点，并将所述语音起止点之间的数据作为所述语音段数据；

将所述语音段数据之前指定时长内的声源数据作为所述噪音段数据。

进一步地，在从声源数据中识别语音段数据和噪音段数据之后，所述方法还包括：

根据所述语音段数据和噪音段数据计算信噪比，若计算得到的所述信噪比小于预设信噪比阈值，才分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值。

进一步地，分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值包括：

分别确定所述语音段数据和所述噪音段数据各自的归一化频谱，并确定用于表征不同相位的导向矢量；

计算所述归一化频谱与所述导向矢量的内积，以确定所述归一化频谱在各个相位的评分值。

进一步地，对相同相位处的所述语音评分值和所述噪音评分值进行处理包括：

将相同相位处的语音评分值减去噪音评分值，得到对应相位处的规整评分值。

进一步地，基于所述规整评分值，确定所述声源对应的目标角度包括：

将最大规整评分值对应的相位确定为所述声源对应的目标角度。

为实现上述目的，本申请还提供一种声源定位系统，所述系统包括：

数据识别单元，用于从声源数据中识别语音段数据和噪音段数据；

评分值计算单元，用于分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值；

目标角度确定单元，用于对相同相位处的所述语音评分值和所述噪音评分值进行处理，得到规整评分值，并基于所述规整评分值，确定所述声源对应的目标角度。

进一步地，所述数据识别单元包括：

语音识别模块，用于对所述声源数据进行语音检测，得到所述声源数据中的语音起止点，并将所述语音起止点之间的数据作为所述语音段数据；

噪音确定模块，用于将所述语音段数据之前指定时长内的声源数据作为所述噪音段数据。

进一步地，所述系统还包括：

信噪比判断单元，用于根据所述语音段数据和噪音段数据计算信噪比，若计算得到的所述信噪比小于预设信噪比阈值，才分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值。

进一步地，所述评分值计算单元包括：

频谱确定模块，用于分别确定所述语音段数据和所述噪音段数据各自的归一化频谱，并确定用于表征不同相位的导向矢量；

内积计算模块，用于计算所述归一化频谱与所述导向矢量的内积，以确定所述归一化频谱在各个相位的评分值。

由上可见，本申请提供的技术方案，对于噪声部分的评分值可看作是假分分布，通过将噪声部分的评分值与语音部分的评分值做减法，本质上是在抵消干扰数据的打分贡献，这种方法在高噪声的数据上，通过测试发现会极大提高声源的定位精度。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中声源定位方法的流程图；

图2为本发明实施例中声源定位系统的功能模块图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

请参阅图1，本申请提供一种声源定位方法，所述方法包括：

S1：从声源数据中识别语音段数据和噪音段数据。

S2：分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值。

S3：对相同相位处的所述语音评分值和所述噪音评分值进行处理，得到规整评分值，并基于所述规整评分值，确定所述声源对应的目标角度。

在本实施方式中，从声源数据中识别语音段数据和噪音段数据包括：

在本实施方式中，在从声源数据中识别语音段数据和噪音段数据之后，所述方法还包括：

在本实施方式中，分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值包括：

在本实施方式中，对相同相位处的所述语音评分值和所述噪音评分值进行处理包括：

在本实施方式中，基于所述规整评分值，确定所述声源对应的目标角度包括：

在一个具体应用实例中，可以通过语音检测，得到语音起止点。然后，可以始终保持存储语音前面一段时间的噪声数据。这样，可以根据语音和噪声部分数据计算信噪比，如果信噪比较高(与预设阈值比较)则使用通用算法计算，如果信噪比较低，则使用下面计算方法：

(1)分别计算语音段每个相位对应的打分输出，得到各角度的打分结果，噪声部分数据也做如此操作；

(2)语音部分各角度得分减掉噪声部分对应角度打分，得到规整打分结果，以此结果取最大值确定对应角度作为最终输出。

请参阅图2，本申请还提供一种声源定位系统，所述系统包括：

在一个实施方式中，所述数据识别单元包括：

在一个实施方式中，所述系统还包括：

在一个实施方式中，所述评分值计算单元包括：

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种声源定位方法，其特征在于，所述方法包括：

从声源数据中识别语音段数据和噪音段数据；

2.根据权利要求1所述的方法，其特征在于，从声源数据中识别语音段数据和噪音段数据包括：

3.根据权利要求1所述的方法，其特征在于，在从声源数据中识别语音段数据和噪音段数据之后，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值包括：

5.根据权利要求1所述的方法，其特征在于，对相同相位处的所述语音评分值和所述噪音评分值进行处理包括：

6.根据权利要求1所述的方法，其特征在于，基于所述规整评分值，确定所述声源对应的目标角度包括：

7.一种声源定位系统，其特征在于，所述系统包括：

8.根据权利要求7所述的系统，其特征在于，所述数据识别单元包括：

9.根据权利要求7所述的系统，其特征在于，所述系统还包括：

10.根据权利要求7所述的系统，其特征在于，所述评分值计算单元包括：