CN112750458B

CN112750458B - 一种触屏声音检测方法和装置

Info

Publication number: CN112750458B
Application number: CN201911043701.2A
Authority: CN
Inventors: 张晴晴; 杨金富; 岑吴镕; 罗磊; 马光谦; 汪洋
Original assignee: Beijing Aishu Wisdom Technology Co ltd
Current assignee: Beijing Qingshu Intelligent Technology Co ltd
Priority date: 2019-10-30
Filing date: 2019-10-30
Publication date: 2022-11-25
Anticipated expiration: 2039-10-30
Also published as: CN112750458A

Abstract

本发明公开一种触屏声音检测方法和装置，该方法包括以下步骤：获取用户通过触屏设备录制的音频信号；对所述音频信号与模板信号进行相关度分析，得到所述音频信号与所述模板信号之间的相关系数；根据所述相关系数确定所述音频信号是否包含触屏声音。本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析，从而确定音频信号是否包含触屏信号，提升了触屏信号检测的准确率。

Description

一种触屏声音检测方法和装置

技术领域

本发明涉及音频技术领域，特别涉及一种触屏声音检测方法和装置。

背景技术

声音检测及识别是一种行为识别技术，声音检测及识别设备不断地测量、纪录被识别物体发出声音的波形和变化，将现场采集到的声音同登记过的声音模板进行精确的匹配，从而确定物体发出的声音。

在实现本发明的过程中，发明人发现以上相关技术中至少存在如下问题：

现有技术中，传统的声音检测一般是基于激光多普勒效应和干涉效应，基于这些技术生产的电子设备获取声音信号后输出的检测信号非常微弱与短暂，导致声音检测的可靠性比较差。

发明内容

本发明提供了一种触屏声音检测方法和装置，以解决现有技术中的声音检测的可靠性较差的缺陷。

本发明提供了一种触屏声音检测方法，包括以下步骤：

获取用户通过触屏设备录制的音频信号；

对所述音频信号与模板信号进行相关度分析，得到所述音频信号与所述模板信号之间的相关系数；

根据所述相关系数确定所述音频信号是否包含触屏声音。

可选地，所述根据所述相关系数确定所述音频信号是否包含触屏声音，包括：

若所述相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述相关系数不大于预设阈值，则确定所述音频信号不包含触屏信号。

可选地，所述模板信号的长度为预设时长；

所述对所述音频信号与模板信号进行相关度分析，得到所述音频信号与所述模板信号之间的相关系数，包括：

对所述音频信号进行分割，得到多个音频段，其中，每个所述音频段的长度均不大于所述预设时长；

将所述多个音频段分别与所述模板信号进行相关度分析，得到多个相关系数；

所述根据所述相关系数确定所述音频信号是否包含触屏声音，包括：

若所述多个相关系数中的至少一个相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述多个相关系数均不大于预设阈值，则确定所述音频信号不包含触屏信号。

可选地，所述的方法，还包括：

获取预设数量的标准音频信号，每个所述标准音频信号的尾部均包含触屏信号；

使用长度为所述预设时长的时间窗，分别对所述预设数量的标准音频信号进行采样，得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值；

分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值，并根据所述均值以及所述时间窗内的多个采样点之间的位置关系，生成所述模板信号。

可选地，所述多个音频段中的每个所述音频段的长度均为所述预设时长；

或者，所述多个音频段中的一个音频段的长度小于所述预设时长，且除所述音频段之外的其他音频段的长度均为所述预设时长。

本发明还提供了一种触屏声音检测装置，包括：

第一获取模块，用于获取用户通过触屏设备录制的音频信号；

分析模块，用于对所述音频信号与模板信号进行相关度分析，得到所述音频信号与所述模板信号之间的相关系数；

检测模块，用于根据所述相关系数确定所述音频信号是否包含触屏声音。

可选地，所述检测模块，具体用于若所述相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述相关系数不大于预设阈值，则确定所述音频信号不包含触屏信号。

可选地，所述模板信号的长度为预设时长；

所述分析模块，具体用于对所述音频信号进行分割，得到多个音频段，其中，每个所述音频段的长度均不大于所述预设时长；将所述多个音频段分别与所述模板信号进行相关度分析，得到多个相关系数；

所述检测模块，具体用于若所述多个相关系数中的至少一个相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述多个相关系数均不大于预设阈值，则确定所述音频信号不包含触屏信号。

可选地，所述的装置，还包括：

第二获取模块，用于获取预设数量的标准音频信号，每个所述标准音频信号的尾部均包含触屏信号；

采样模块，用于使用长度为所述预设时长的时间窗，分别对所述预设数量的标准音频信号进行采样，得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值；

生成模块，用于分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值，并根据所述均值以及所述时间窗内的多个采样点之间的位置关系，生成所述模板信号。

本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析，从而确定音频信号是否包含触屏信号，提升了触屏信号检测的准确率。

附图说明

图1为本发明实施例中的一种触屏声音检测方法流程图；

图2为本发明实施例中的另一种触屏声音检测方法流程图；

图3为本发明实施例中的模板信号的示意图；

图4为本发明实施例中的相关度分析的示意图；

图5为本发明实施例中的一种触屏声音检测装置结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种触屏声音检测方法，如图1所示，包括以下步骤：

步骤101，获取用户通过触屏设备录制的音频信号。

例如，音频信号可以是用户使用手机录音得到的音频信号。

步骤102，对音频信号与模板信号进行相关度分析，得到音频信号与模板信号之间的相关系数。

其中，模板信号的长度为预设时长。

步骤103，根据相关系数确定音频信号是否包含触屏声音。

具体地，若相关系数大于预设阈值，则可以确定音频信号包含触屏声音；若相关系数不大于预设阈值，则确定音频信号不包含触屏信号。

本实施例中，预设阈值可以为0.8。

本发明实施例对模板信号以及通过触屏设备录制的音频信号进行相关度分析，从而确定音频信号是否包含触屏信号，提升了触屏信号检测的准确率。

本发明实施例还提供了另一种触屏声音检测方法，如图2所示，包括以下步骤：

步骤201，获取预设数量的标准音频信号。

其中，每个标准音频信号的尾部均包含触屏信。

本实施例中，不同的录音员分别用不同手机录制不同语种和/或不同形式的音频信号，在录制结束阶段用不同力度点击手机中的录音结束按钮，从而得到预设数量的标准音频信号，该预设数量可以为100个。

步骤202，使用时间窗分别对预设数量的标准音频信号进行采样，得到时间窗内的每个采样点从每个标准音频信号中采样得到的采样值。

其中，时间窗的长度为预设时长，时间窗具有多个采样点。

本实施例中，时间窗的长度为12.5ms，时间窗具有200个采样点，时间窗的采样频率为16kHz。

步骤203，分别计算时间窗内的每个采样点采样得到的多个采样值的均值，并根据均值以及时间窗内的多个采样点之间的位置关系，生成模板信号。

具体地，可以根据多个采样点之间的位置关系，对每个采样点采样得到的多个采样值的均值进行组合，得到模板信号，如图3所示。其中，模板信号中的多个采样点之间的时间间隔与时间窗中的多个采样点之间的时间间隔相同。

步骤204，获取用户通过触屏设备录制的音频信号。

步骤205，对音频信号进行分割，得到多个音频段。

其中，每个音频段的长度均不大于预设时长。

本实施例中，多个音频段中的每个音频段的长度均为预设时长；

或者，多个音频段中的一个音频段的长度小于预设时长，且除该音频段之外的其他音频段的长度均为预设时长。

步骤206，将多个音频段分别与模板信号进行相关度分析，得到多个相关系数。

步骤207，判断多个相关系数中的至少一个相关系数是否大于预设阈值，如果是，则执行步骤208；否则，执行步骤209。

步骤208，确定音频信号包含触屏声音。

具体地，如图4所示，若多个相关系数中的至少一个相关系数大于预设阈值，则确定音频信号包含触屏声音。

步骤209，确定音频信号不包含触屏信号。

本发明实施例从预设数量的标准音频信号中提取合适的模型特征，作为模板信号，并使用对音频信号分割得到的多个音频段分别与模板信号进行相关度分析，从而确定音频信号是否包含触屏信号，提升了触屏信号检测的准确率。

基于上述方法，本发明实施例还提供了一种触屏声音检测装置，如图5所示，包括：

第一获取模块510，用于获取用户通过触屏设备录制的音频信号；

分析模块520，用于对所述音频信号与模板信号进行相关度分析，得到所述音频信号与所述模板信号之间的相关系数；

检测模块530，用于根据所述相关系数确定所述音频信号是否包含触屏声音。

具体地，检测模块530，具体用于若所述相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述相关系数不大于预设阈值，则确定所述音频信号不包含触屏信号。

其中，模板信号的长度为预设时长；

相应地，分析模块520，具体用于对所述音频信号进行分割，得到多个音频段，其中，每个所述音频段的长度均不大于所述预设时长；将所述多个音频段分别与所述模板信号进行相关度分析，得到多个相关系数；

检测模块530，具体用于若所述多个相关系数中的至少一个相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述多个相关系数均不大于预设阈值，则确定所述音频信号不包含触屏信号。

进一步地，上述装置，还包括：

结合本文中所公开的实施例描述的方法中的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种触屏声音检测方法，其特征在于，包括以下步骤：

获取用户通过触屏设备录制的音频信号；

根据所述相关系数确定所述音频信号是否包含触屏声音；

所述模板信号的长度为预设时长；

若所述相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述相关系数不大于预设阈值，则确定所述音频信号不包含触屏信号；

具体地，若所述多个相关系数中的至少一个相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述多个相关系数均不大于预设阈值，则确定所述音频信号不包含触屏信号；

所述方法，还包括：

2.如权利要求1所述的方法，其特征在于，所述多个音频段中的每个所述音频段的长度均为所述预设时长；

3.一种触屏声音检测装置，其特征在于，包括：

检测模块，用于根据所述相关系数确定所述音频信号是否包含触屏声音；

所述模板信号的长度为预设时长；

所述检测模块，具体用于若所述相关系数大于预设阈值，则确定所述音频信号包含触屏声音；若所述相关系数不大于预设阈值，则确定所述音频信号不包含触屏信号；

所述装置，还包括：第二获取模块，用于获取预设数量的标准音频信号，每个所述标准音频信号的尾部均包含触屏信号；

4.如权利要求3所述的装置，其特征在于，所述多个音频段中的每个所述音频段的长度均为所述预设时长；或者，所述多个音频段中的一个音频段的长度小于所述预设时长，且除所述音频段之外的其他音频段的长度均为所述预设时长。