CN110515039A

CN110515039A - 一种基于时间频率域的语音追踪及定位方法

Info

Publication number: CN110515039A
Application number: CN201910604534.8A
Authority: CN
Inventors: 赵晖; 黄生莉
Original assignee: Foshan Long Valley Chuang Ke Technology Co Ltd
Current assignee: Foshan Long Valley Chuang Ke Technology Co Ltd
Priority date: 2019-07-05
Filing date: 2019-07-05
Publication date: 2019-11-29

Abstract

本发明提供一种基于时间频率域的语音追踪及定位方法，涉及语音追踪及定位技术领域。该基于时间频率域的语音追踪及定位方法，包括语音采集模块、语音存储模块、语音预识别模块、语音处理模块以及语音追踪定位模块，所述语音采集模块对声源信号进行采集，所述语音采集模块采样完毕之后，将数据传输给语音存储模块，所述语音存储模块将音频储存在存储单元中，同时语音存储模块对接收到音频的采样精度进行分析，转化成适配的格式。通过将音频中的噪音分离开，从而使得音频追踪及定位的效率提高，且音频追踪及定位的准确度也受到了也得到了相应的提高，给时间频率域的语音追踪及定位减少了许多不必要的麻烦。

Description

一种基于时间频率域的语音追踪及定位方法

技术领域

本发明涉及语音追踪及定位方法技术领域，具体为一种基于时间频率域的语音追踪及定位方法。

背景技术

频率域是指从函数的频率角度出发分析函数，和频率域相对的是时间域，简单说就是如果从时间域分析信号时，时间是横坐标振幅是纵坐标，而在频率域分析的时候则是频率是横坐标，振幅是纵坐标，站在频域的角度上来讲，音乐是一个随着频率变化的震动，这样我们站在时间域的角度去观察你会发现音乐是静止的。

在对时间频率域的语音追踪及定位时，音频中常常掺杂有其它的声音，我们可以称之为噪音，一般的时间频率域的语音追踪及定位系统通常都是直接对这些音频进行识别处理，然后再进行追踪及定位，但是由于噪音的存在，音频追踪及定位的效率较低，且音频追踪及定位的准确度也受到了较大的干扰，给时间频率域的语音追踪及定位带来了不利影响。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种基于时间频率域的语音追踪及定位方法，解决了由于噪音的存在，音频追踪及定位的效率较低，且音频追踪及定位的准确度也受到了较大的干扰，给时间频率域的语音追踪及定位带来了不利影响的问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：一种基于时间频率域的语音追踪及定位方法，所述基于时间频率域的语音追踪及定位方法包括语音采集模块、语音存储模块、语音预识别模块、语音处理模块以及语音追踪定位模块。

优选的，所述语音采集模块对声源信号进行采集，保证采样频率为信号最高频率的6-9倍，且保证采样位数的充分。

优选的，所述语音采集模块采样完毕之后，将数据传输给语音存储模块，所述语音存储模块将音频储存在存储单元中，同时语音存储模块对接收到音频的采样精度进行分析，转化成适配的格式。

优选的，所述语音存储模块将音频储存之后，音频传输给语音预识别模块，所述语音预识别模块对音频中出现的多种声波进行预识别，初步分析出不同声波的频率以及种类，然后将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较，将相似度最高者作为识别结果输出。

优选的，所述语音预识别模块对音频预识别之后将数据传输给语音处理模块，所述语音处理模块根据上述识别输出的结果做出合理的判断，从而对音频进行综合分类。

优选的，所述语音处理模块处理音频之后，会将处理之后的音频发送一份到音频备份单元，所述处理音频备份单元将接收到的音频进行分类备份，并转化成适配的格式。

优选的，所述语音处理模块对音频进行综合分类之后，将音频分为两大类，一类为主音频，其它的全部分类为噪音，其中语音处理模块还包括主音频识别处理与噪音识别处理模块，所述主音频识别处理与噪音识别处理模块对主音频与噪音两大类进行单独的识别处理。

优选的，所述语音处理模块对主音频与噪音两大类进行单独识别处理之后，将数据反馈给语音追踪定位模块，所述语音追踪定位模块将主音频与噪音相结合，分析出声源所在的位置，从而对声源进行追踪定位。

工作原理：使用时，通过语音采集模块对声源信号进行采集，语音采集模块采样完毕之后，将数据传输给语音存储模块，语音存储模块将音频储存在存储单元中，同时语音存储模块对接收到音频的采样精度进行分析，转化成适配的格式，语音存储模块将音频储存之后，音频传输给语音预识别模块，语音预识别模块对音频中出现的多种声波进行预识别，初步分析出不同声波的频率以及种类，语音预识别模块对音频预识别之后将数据传输给语音处理模块，语音处理模块根据上述识别输出的结果做出合理的判断，从而对音频进行综合分类，语音处理模块处理音频之后，会将处理之后的音频发送一份到音频备份单元，其中语音处理模块还包括主音频识别处理与噪音识别处理模块，主音频识别处理与噪音识别处理模块对主音频与噪音两大类进行单独的识别处理，语音处理模块对主音频与噪音两大类进行单独识别处理之后，将数据反馈给语音追踪定位模块，语音追踪定位模块将主音频与噪音相结合，分析出声源所在的位置，从而对声源进行追踪定位。

(三)有益效果

本发明提供了一种基于时间频率域的语音追踪及定位方法。具备以下有益效果：

1、该基于时间频率域的语音追踪及定位方法，通过语音处理模块中的主音频识别处理与噪音识别处理模块对主音频与噪音两大类进行单独的识别处理，然后将数据反馈给语音追踪定位模块，语音追踪定位模块将主音频与噪音相结合，分析出声源所在的位置，从而对声源进行追踪定位，由于将音频中的噪音分离开，从而使得音频追踪及定位的效率提高，且音频追踪及定位的准确度也受到了也得到了相应的提高，给时间频率域的语音追踪及定位减少了许多不必要的麻烦。

2、该基于时间频率域的语音追踪及定位方法，通过语音存储模块与处理音频备份单元的结合，使得音频得以更好的保存，且音频以不同的形式保存，给日后提供了极大的便利。

附图说明

图1为本发明的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例：

如图1所示，本发明实施例提供一种基于时间频率域的语音追踪及定位方法，包括语音采集模块、语音存储模块、语音预识别模块、语音处理模块以及语音追踪定位模块，且具体实施步骤为：

步骤S1，语音采集模块对声源信号进行采集，保证采样频率为信号最高频率的6-9倍，且保证采样位数的充分性，采样频率是指计算机每秒钟采样多少个声音样本，是描述声音文件的音质、音频、衡量声卡、声音文件的质量标准，采样频率越高，即采样的时间间隔越短，则在单位时间内计算机得到的声音样本数据越多，无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围，采样位数越多则捕捉到的信号越精确。

步骤S2，语音采集模块采样完毕之后，将数据传输给语音存储模块，语音存储模块将音频储存在存储单元中，同时语音存储模块对接收到音频的采样精度进行分析，转化成适配的格式，采样精度也叫样本位数或位深度，用每个样本的位数表示，位数越少，声音质量越低，需要存储空间越少，采样频率和采样精度是数字声音质量的两项重要指标。

步骤S3,语音存储模块将音频储存之后，音频传输给语音预识别模块，语音预识别模块对音频中出现的多种声波进行预识别，初步分析出不同声波的频率以及种类，然后将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较，将相似度最高者作为识别结果输出。

步骤S4，语音预识别模块对音频预识别之后将数据传输给语音处理模块，语音处理模块根据上述识别输出的结果做出合理的判断，从而对音频进行综合分类。

步骤S41，语音处理模块处理音频之后，会将处理之后的音频发送一份到音频备份单元，处理音频备份单元将接收到的音频进行分类备份，并转化成适配的格式，通过将音频进行分类备份之后，可以方便日后的使用，也方便进行不同类型的分析。

步骤S42与步骤S43，语音处理模块对音频进行综合分类之后，将音频分为两大类，一类为主音频，其它的全部分类为噪音，也可以成为环境音频，其中语音处理模块还包括主音频识别处理与噪音识别处理模块，主音频识别处理与噪音识别处理模块对主音频与噪音两大类进行单独的识别处理。

步骤S5，语音处理模块对主音频与噪音两大类进行单独识别处理之后，将数据反馈给语音追踪定位模块，语音追踪定位模块将主音频与噪音相结合，分析出声源所在的位置，从而对声源进行追踪定位。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于时间频率域的语音追踪及定位方法，其特征在于：所述基于时间频率域的语音追踪及定位方法包括语音采集模块、语音存储模块、语音预识别模块、语音处理模块以及语音追踪定位模块。

2.根据权利要求1所述的一种基于时间频率域的语音追踪及定位方法，其特征在于：所述语音采集模块对声源信号进行采集，保证采样频率为信号最高频率的6-9倍，且保证采样位数的充分性。

3.根据权利要求1所述的一种基于时间频率域的语音追踪及定位方法，其特征在于：所述语音采集模块采样完毕之后，将数据传输给语音存储模块，所述语音存储模块将音频储存在存储单元中，同时语音存储模块对接收到音频的采样精度进行分析，转化成适配的格式。

4.根据权利要求1所述的一种基于时间频率域的语音追踪及定位方法，其特征在于：所述语音存储模块将音频储存之后，音频传输给语音预识别模块，所述语音预识别模块对音频中出现的多种声波进行预识别，初步分析出不同声波的频率以及种类，然后将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较，将相似度最高者作为识别结果输出。

5.根据权利要求1所述的一种基于时间频率域的语音追踪及定位方法，其特征在于：所述语音预识别模块对音频预识别之后将数据传输给语音处理模块，所述语音处理模块根据上述识别输出的结果做出合理的判断，从而对音频进行综合分类。

6.根据权利要求5所述的一种基于时间频率域的语音追踪及定位方法，其特征在于：所述语音处理模块处理音频之后，会将处理之后的音频发送一份到音频备份单元，所述处理音频备份单元将接收到的音频进行分类备份，并转化成适配的格式。

7.根据权利要求5所述的一种基于时间频率域的语音追踪及定位方法，其特征在于：所述语音处理模块对音频进行综合分类之后，将音频分为两大类，一类为主音频，其它的全部分类为噪音，其中语音处理模块还包括主音频识别处理与噪音识别处理模块，所述主音频识别处理与噪音识别处理模块对主音频与噪音两大类进行单独的识别处理。

8.根据权利要求1所述的一种基于时间频率域的语音追踪及定位方法，其特征在于：所述语音处理模块对主音频与噪音两大类进行单独识别处理之后，将数据反馈给语音追踪定位模块，所述语音追踪定位模块将主音频与噪音相结合，分析出声源所在的位置，从而对声源进行追踪定位。