CN112750458A - 一种触屏声音检测方法和装置 - Google Patents

一种触屏声音检测方法和装置 Download PDF

Info

Publication number
CN112750458A
CN112750458A CN201911043701.2A CN201911043701A CN112750458A CN 112750458 A CN112750458 A CN 112750458A CN 201911043701 A CN201911043701 A CN 201911043701A CN 112750458 A CN112750458 A CN 112750458A
Authority
CN
China
Prior art keywords
touch screen
signal
audio
audio signal
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911043701.2A
Other languages
English (en)
Other versions
CN112750458B (zh
Inventor
张晴晴
杨金富
岑吴镕
罗磊
马光谦
汪洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qingshu Intelligent Technology Co ltd
Original Assignee
Beijing Aishu Wisdom Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aishu Wisdom Technology Co ltd filed Critical Beijing Aishu Wisdom Technology Co ltd
Priority to CN201911043701.2A priority Critical patent/CN112750458B/zh
Publication of CN112750458A publication Critical patent/CN112750458A/zh
Application granted granted Critical
Publication of CN112750458B publication Critical patent/CN112750458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Abstract

本发明公开一种触屏声音检测方法和装置,该方法包括以下步骤:获取用户通过触屏设备录制的音频信号;对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;根据所述相关系数确定所述音频信号是否包含触屏声音。本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。

Description

一种触屏声音检测方法和装置
技术领域
本发明涉及音频技术领域,特别涉及一种触屏声音检测方法和装置。
背景技术
声音检测及识别是一种行为识别技术,声音检测及识别设备不断地测量、纪录被识别物体发出声音的波形和变化,将现场采集到的声音同登记过的声音模板进行精确的匹配,从而确定物体发出的声音。
在实现本发明的过程中,发明人发现以上相关技术中至少存在如下问题:
现有技术中,传统的声音检测一般是基于激光多普勒效应和干涉效应,基于这些技术生产的电子设备获取声音信号后输出的检测信号非常微弱与短暂,导致声音检测的可靠性比较差。
发明内容
本发明提供了一种触屏声音检测方法和装置,以解决现有技术中的声音检测的可靠性较差的缺陷。
本发明提供了一种触屏声音检测方法,包括以下步骤:
获取用户通过触屏设备录制的音频信号;
对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
根据所述相关系数确定所述音频信号是否包含触屏声音。
可选地,所述根据所述相关系数确定所述音频信号是否包含触屏声音,包括:
若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号。
可选地,所述模板信号的长度为预设时长;
所述对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数,包括:
对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;
将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
所述根据所述相关系数确定所述音频信号是否包含触屏声音,包括:
若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号。
可选地,所述的方法,还包括:
获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
可选地,所述多个音频段中的每个所述音频段的长度均为所述预设时长;
或者,所述多个音频段中的一个音频段的长度小于所述预设时长,且除所述音频段之外的其他音频段的长度均为所述预设时长。
本发明还提供了一种触屏声音检测装置,包括:
第一获取模块,用于获取用户通过触屏设备录制的音频信号;
分析模块,用于对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
检测模块,用于根据所述相关系数确定所述音频信号是否包含触屏声音。
可选地,所述检测模块,具体用于若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号。
可选地,所述模板信号的长度为预设时长;
所述分析模块,具体用于对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
所述检测模块,具体用于若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号。
可选地,所述的装置,还包括:
第二获取模块,用于获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
采样模块,用于使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
生成模块,用于分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
可选地,所述多个音频段中的每个所述音频段的长度均为所述预设时长;
或者,所述多个音频段中的一个音频段的长度小于所述预设时长,且除所述音频段之外的其他音频段的长度均为所述预设时长。
本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
附图说明
图1为本发明实施例中的一种触屏声音检测方法流程图;
图2为本发明实施例中的另一种触屏声音检测方法流程图;
图3为本发明实施例中的模板信号的示意图;
图4为本发明实施例中的相关度分析的示意图;
图5为本发明实施例中的一种触屏声音检测装置结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种触屏声音检测方法,如图1所示,包括以下步骤:
步骤101,获取用户通过触屏设备录制的音频信号。
例如,音频信号可以是用户使用手机录音得到的音频信号。
步骤102,对音频信号与模板信号进行相关度分析,得到音频信号与模板信号之间的相关系数。
其中,模板信号的长度为预设时长。
步骤103,根据相关系数确定音频信号是否包含触屏声音。
具体地,若相关系数大于预设阈值,则可以确定音频信号包含触屏声音;若相关系数不大于预设阈值,则确定音频信号不包含触屏信号。
本实施例中,预设阈值可以为0.8。
本发明实施例对模板信号以及通过触屏设备录制的音频信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
本发明实施例还提供了另一种触屏声音检测方法,如图2所示,包括以下步骤:
步骤201,获取预设数量的标准音频信号。
其中,每个标准音频信号的尾部均包含触屏信。
本实施例中,不同的录音员分别用不同手机录制不同语种和/或不同形式的音频信号,在录制结束阶段用不同力度点击手机中的录音结束按钮,从而得到预设数量的标准音频信号,该预设数量可以为100个。
步骤202,使用时间窗分别对预设数量的标准音频信号进行采样,得到时间窗内的每个采样点从每个标准音频信号中采样得到的采样值。
其中,时间窗的长度为预设时长,时间窗具有多个采样点。
本实施例中,时间窗的长度为12.5ms,时间窗具有200个采样点,时间窗的采样频率为16kHz。
步骤203,分别计算时间窗内的每个采样点采样得到的多个采样值的均值,并根据均值以及时间窗内的多个采样点之间的位置关系,生成模板信号。
具体地,可以根据多个采样点之间的位置关系,对每个采样点采样得到的多个采样值的均值进行组合,得到模板信号,如图3所示。其中,模板信号中的多个采样点之间的时间间隔与时间窗中的多个采样点之间的时间间隔相同。
步骤204,获取用户通过触屏设备录制的音频信号。
步骤205,对音频信号进行分割,得到多个音频段。
其中,每个音频段的长度均不大于预设时长。
本实施例中,多个音频段中的每个音频段的长度均为预设时长;
或者,多个音频段中的一个音频段的长度小于预设时长,且除该音频段之外的其他音频段的长度均为预设时长。
步骤206,将多个音频段分别与模板信号进行相关度分析,得到多个相关系数。
步骤207,判断多个相关系数中的至少一个相关系数是否大于预设阈值,如果是,则执行步骤208;否则,执行步骤209。
步骤208,确定音频信号包含触屏声音。
具体地,如图4所示,若多个相关系数中的至少一个相关系数大于预设阈值,则确定音频信号包含触屏声音。
步骤209,确定音频信号不包含触屏信号。
本发明实施例从预设数量的标准音频信号中提取合适的模型特征,作为模板信号,并使用对音频信号分割得到的多个音频段分别与模板信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
基于上述方法,本发明实施例还提供了一种触屏声音检测装置,如图5所示,包括:
第一获取模块510,用于获取用户通过触屏设备录制的音频信号;
分析模块520,用于对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
检测模块530,用于根据所述相关系数确定所述音频信号是否包含触屏声音。
具体地,检测模块530,具体用于若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号。
其中,模板信号的长度为预设时长;
相应地,分析模块520,具体用于对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
本实施例中,多个音频段中的每个音频段的长度均为预设时长;
或者,多个音频段中的一个音频段的长度小于预设时长,且除该音频段之外的其他音频段的长度均为预设时长。
检测模块530,具体用于若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号。
进一步地,上述装置,还包括:
第二获取模块,用于获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
采样模块,用于使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
生成模块,用于分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
本发明实施例从预设数量的标准音频信号中提取合适的模型特征,作为模板信号,并使用对音频信号分割得到的多个音频段分别与模板信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
结合本文中所公开的实施例描述的方法中的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种触屏声音检测方法,其特征在于,包括以下步骤:
获取用户通过触屏设备录制的音频信号;
对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
根据所述相关系数确定所述音频信号是否包含触屏声音。
2.如权利要求1所述的方法,其特征在于,所述根据所述相关系数确定所述音频信号是否包含触屏声音,包括:
若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号。
3.如权利要求1所述的方法,其特征在于,所述模板信号的长度为预设时长;
所述对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数,包括:
对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;
将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
所述根据所述相关系数确定所述音频信号是否包含触屏声音,包括:
若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号。
4.如权利要求3所述的方法,其特征在于,还包括:
获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
5.如权利要求3所述的方法,其特征在于,所述多个音频段中的每个所述音频段的长度均为所述预设时长;
或者,所述多个音频段中的一个音频段的长度小于所述预设时长,且除所述音频段之外的其他音频段的长度均为所述预设时长。
6.一种触屏声音检测装置,其特征在于,包括:
第一获取模块,用于获取用户通过触屏设备录制的音频信号;
分析模块,用于对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
检测模块,用于根据所述相关系数确定所述音频信号是否包含触屏声音。
7.如权利要求6所述的装置,其特征在于,
所述检测模块,具体用于若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号。
8.如权利要求6所述的装置,其特征在于,所述模板信号的长度为预设时长;
所述分析模块,具体用于对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
所述检测模块,具体用于若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号。
9.如权利要求8所述的装置,其特征在于,还包括:
第二获取模块,用于获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
采样模块,用于使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
生成模块,用于分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
10.如权利要求6所述的装置,其特征在于,所述多个音频段中的每个所述音频段的长度均为所述预设时长;
或者,所述多个音频段中的一个音频段的长度小于所述预设时长,且除所述音频段之外的其他音频段的长度均为所述预设时长。
CN201911043701.2A 2019-10-30 2019-10-30 一种触屏声音检测方法和装置 Active CN112750458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911043701.2A CN112750458B (zh) 2019-10-30 2019-10-30 一种触屏声音检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911043701.2A CN112750458B (zh) 2019-10-30 2019-10-30 一种触屏声音检测方法和装置

Publications (2)

Publication Number Publication Date
CN112750458A true CN112750458A (zh) 2021-05-04
CN112750458B CN112750458B (zh) 2022-11-25

Family

ID=75640615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911043701.2A Active CN112750458B (zh) 2019-10-30 2019-10-30 一种触屏声音检测方法和装置

Country Status (1)

Country Link
CN (1) CN112750458B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220067213A1 (en) * 2020-08-31 2022-03-03 Lieb Lindsey S Subliminal Software Detection

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080304672A1 (en) * 2006-01-12 2008-12-11 Shinichi Yoshizawa Target sound analysis apparatus, target sound analysis method and target sound analysis program
CN102142257A (zh) * 2010-12-28 2011-08-03 北大方正集团有限公司 一种音频信号处理方法及装置
CN106157952A (zh) * 2016-08-30 2016-11-23 北京小米移动软件有限公司 声音识别方法及装置
CN107545904A (zh) * 2016-06-23 2018-01-05 杭州海康威视数字技术股份有限公司 一种音频检测方法及装置
JP2019164107A (ja) * 2018-03-20 2019-09-26 本田技研工業株式会社 異音判定装置および判定方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080304672A1 (en) * 2006-01-12 2008-12-11 Shinichi Yoshizawa Target sound analysis apparatus, target sound analysis method and target sound analysis program
CN102142257A (zh) * 2010-12-28 2011-08-03 北大方正集团有限公司 一种音频信号处理方法及装置
CN107545904A (zh) * 2016-06-23 2018-01-05 杭州海康威视数字技术股份有限公司 一种音频检测方法及装置
CN106157952A (zh) * 2016-08-30 2016-11-23 北京小米移动软件有限公司 声音识别方法及装置
JP2019164107A (ja) * 2018-03-20 2019-09-26 本田技研工業株式会社 異音判定装置および判定方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220067213A1 (en) * 2020-08-31 2022-03-03 Lieb Lindsey S Subliminal Software Detection

Also Published As

Publication number Publication date
CN112750458B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
US8971549B2 (en) Audio signal processing apparatus, audio signal processing method, and program
CN109326305B (zh) 一种批量测试语音识别和文本合成的方法和测试系统
CN109903752B (zh) 对齐语音的方法和装置
CN113259832B (zh) 麦克风阵列的检测方法、装置、电子设备及存储介质
CN110019922B (zh) 一种音频高潮识别方法和装置
US10522160B2 (en) Methods and apparatus to identify a source of speech captured at a wearable electronic device
CN104252872A (zh) 歌词生成方法和智能终端
CN112750458B (zh) 一种触屏声音检测方法和装置
JP5395399B2 (ja) 携帯端末、拍位置推定方法および拍位置推定プログラム
CN104021791B (zh) 数字音频波形突变的检测方法
KR101808810B1 (ko) 음성/무음성 구간 검출 방법 및 장치
CN109377982A (zh) 一种有效语音获取方法
CN111063360B (zh) 一种声纹库的生成方法和装置
CN113053365A (zh) 语音分离方法、装置、设备和存储介质
KR101382356B1 (ko) 오디오파일의 위변조 검출장치
CN108093356A (zh) 一种啸叫检测方法及装置
CN114114400B (zh) 微地震事件有效信号拾取方法
TW200811833A (en) Detection method for voice activity endpoint
CN107548007B (zh) 一种音频信号采集设备的检测方法及装置
CN113411663B (zh) 一种用于非编工程中的音乐节拍提取方法
CN113242507A (zh) 快速调节麦克风增益和检测麦克风底噪的方法
EP3456067B1 (en) Noise detection and noise reduction
CN111314536B (zh) 一种用于检测终端设备的收听模块的方法及设备
CN108235137B (zh) 一种通过声音波形判断切台动作的方法、装置及电视机
KR101327664B1 (ko) 음성 영역 검출 방법 및 그 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 411, 4th floor, building 4, No.44, Middle North Third Ring Road, Haidian District, Beijing 100088

Patentee after: Beijing Qingshu Intelligent Technology Co.,Ltd.

Address before: 100044 1415, 14th floor, building 1, yard 59, gaoliangqiaoxie street, Haidian District, Beijing

Patentee before: BEIJING AISHU WISDOM TECHNOLOGY CO.,LTD.