CN112750458B - 一种触屏声音检测方法和装置 - Google Patents
一种触屏声音检测方法和装置 Download PDFInfo
- Publication number
- CN112750458B CN112750458B CN201911043701.2A CN201911043701A CN112750458B CN 112750458 B CN112750458 B CN 112750458B CN 201911043701 A CN201911043701 A CN 201911043701A CN 112750458 B CN112750458 B CN 112750458B
- Authority
- CN
- China
- Prior art keywords
- signal
- audio
- touch screen
- audio signal
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 29
- 230000005236 sound signal Effects 0.000 claims abstract description 108
- 238000000034 method Methods 0.000 claims abstract description 11
- 238000010219 correlation analysis Methods 0.000 claims abstract description 9
- 238000005070 sampling Methods 0.000 claims description 55
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开一种触屏声音检测方法和装置,该方法包括以下步骤:获取用户通过触屏设备录制的音频信号;对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;根据所述相关系数确定所述音频信号是否包含触屏声音。本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
Description
技术领域
本发明涉及音频技术领域,特别涉及一种触屏声音检测方法和装置。
背景技术
声音检测及识别是一种行为识别技术,声音检测及识别设备不断地测量、纪录被识别物体发出声音的波形和变化,将现场采集到的声音同登记过的声音模板进行精确的匹配,从而确定物体发出的声音。
在实现本发明的过程中,发明人发现以上相关技术中至少存在如下问题:
现有技术中,传统的声音检测一般是基于激光多普勒效应和干涉效应,基于这些技术生产的电子设备获取声音信号后输出的检测信号非常微弱与短暂,导致声音检测的可靠性比较差。
发明内容
本发明提供了一种触屏声音检测方法和装置,以解决现有技术中的声音检测的可靠性较差的缺陷。
本发明提供了一种触屏声音检测方法,包括以下步骤:
获取用户通过触屏设备录制的音频信号;
对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
根据所述相关系数确定所述音频信号是否包含触屏声音。
可选地,所述根据所述相关系数确定所述音频信号是否包含触屏声音,包括:
若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号。
可选地,所述模板信号的长度为预设时长;
所述对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数,包括:
对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;
将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
所述根据所述相关系数确定所述音频信号是否包含触屏声音,包括:
若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号。
可选地,所述的方法,还包括:
获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
可选地,所述多个音频段中的每个所述音频段的长度均为所述预设时长;
或者,所述多个音频段中的一个音频段的长度小于所述预设时长,且除所述音频段之外的其他音频段的长度均为所述预设时长。
本发明还提供了一种触屏声音检测装置,包括:
第一获取模块,用于获取用户通过触屏设备录制的音频信号;
分析模块,用于对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
检测模块,用于根据所述相关系数确定所述音频信号是否包含触屏声音。
可选地,所述检测模块,具体用于若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号。
可选地,所述模板信号的长度为预设时长;
所述分析模块,具体用于对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
所述检测模块,具体用于若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号。
可选地,所述的装置,还包括:
第二获取模块,用于获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
采样模块,用于使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
生成模块,用于分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
可选地,所述多个音频段中的每个所述音频段的长度均为所述预设时长;
或者,所述多个音频段中的一个音频段的长度小于所述预设时长,且除所述音频段之外的其他音频段的长度均为所述预设时长。
本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
附图说明
图1为本发明实施例中的一种触屏声音检测方法流程图;
图2为本发明实施例中的另一种触屏声音检测方法流程图;
图3为本发明实施例中的模板信号的示意图;
图4为本发明实施例中的相关度分析的示意图;
图5为本发明实施例中的一种触屏声音检测装置结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种触屏声音检测方法,如图1所示,包括以下步骤:
步骤101,获取用户通过触屏设备录制的音频信号。
例如,音频信号可以是用户使用手机录音得到的音频信号。
步骤102,对音频信号与模板信号进行相关度分析,得到音频信号与模板信号之间的相关系数。
其中,模板信号的长度为预设时长。
步骤103,根据相关系数确定音频信号是否包含触屏声音。
具体地,若相关系数大于预设阈值,则可以确定音频信号包含触屏声音;若相关系数不大于预设阈值,则确定音频信号不包含触屏信号。
本实施例中,预设阈值可以为0.8。
本发明实施例对模板信号以及通过触屏设备录制的音频信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
本发明实施例还提供了另一种触屏声音检测方法,如图2所示,包括以下步骤:
步骤201,获取预设数量的标准音频信号。
其中,每个标准音频信号的尾部均包含触屏信。
本实施例中,不同的录音员分别用不同手机录制不同语种和/或不同形式的音频信号,在录制结束阶段用不同力度点击手机中的录音结束按钮,从而得到预设数量的标准音频信号,该预设数量可以为100个。
步骤202,使用时间窗分别对预设数量的标准音频信号进行采样,得到时间窗内的每个采样点从每个标准音频信号中采样得到的采样值。
其中,时间窗的长度为预设时长,时间窗具有多个采样点。
本实施例中,时间窗的长度为12.5ms,时间窗具有200个采样点,时间窗的采样频率为16kHz。
步骤203,分别计算时间窗内的每个采样点采样得到的多个采样值的均值,并根据均值以及时间窗内的多个采样点之间的位置关系,生成模板信号。
具体地,可以根据多个采样点之间的位置关系,对每个采样点采样得到的多个采样值的均值进行组合,得到模板信号,如图3所示。其中,模板信号中的多个采样点之间的时间间隔与时间窗中的多个采样点之间的时间间隔相同。
步骤204,获取用户通过触屏设备录制的音频信号。
步骤205,对音频信号进行分割,得到多个音频段。
其中,每个音频段的长度均不大于预设时长。
本实施例中,多个音频段中的每个音频段的长度均为预设时长;
或者,多个音频段中的一个音频段的长度小于预设时长,且除该音频段之外的其他音频段的长度均为预设时长。
步骤206,将多个音频段分别与模板信号进行相关度分析,得到多个相关系数。
步骤207,判断多个相关系数中的至少一个相关系数是否大于预设阈值,如果是,则执行步骤208;否则,执行步骤209。
步骤208,确定音频信号包含触屏声音。
具体地,如图4所示,若多个相关系数中的至少一个相关系数大于预设阈值,则确定音频信号包含触屏声音。
步骤209,确定音频信号不包含触屏信号。
本发明实施例从预设数量的标准音频信号中提取合适的模型特征,作为模板信号,并使用对音频信号分割得到的多个音频段分别与模板信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
基于上述方法,本发明实施例还提供了一种触屏声音检测装置,如图5所示,包括:
第一获取模块510,用于获取用户通过触屏设备录制的音频信号;
分析模块520,用于对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
检测模块530,用于根据所述相关系数确定所述音频信号是否包含触屏声音。
具体地,检测模块530,具体用于若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号。
其中,模板信号的长度为预设时长;
相应地,分析模块520,具体用于对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
本实施例中,多个音频段中的每个音频段的长度均为预设时长;
或者,多个音频段中的一个音频段的长度小于预设时长,且除该音频段之外的其他音频段的长度均为预设时长。
检测模块530,具体用于若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号。
进一步地,上述装置,还包括:
第二获取模块,用于获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
采样模块,用于使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
生成模块,用于分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
本发明实施例从预设数量的标准音频信号中提取合适的模型特征,作为模板信号,并使用对音频信号分割得到的多个音频段分别与模板信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
结合本文中所公开的实施例描述的方法中的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (4)
1.一种触屏声音检测方法,其特征在于,包括以下步骤:
获取用户通过触屏设备录制的音频信号;
对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
根据所述相关系数确定所述音频信号是否包含触屏声音;
所述模板信号的长度为预设时长;
所述对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数,包括:
对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;
将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
所述根据所述相关系数确定所述音频信号是否包含触屏声音,包括:
若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号;
具体地,若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号;
所述方法,还包括:
获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
2.如权利要求1所述的方法,其特征在于,所述多个音频段中的每个所述音频段的长度均为所述预设时长;
或者,所述多个音频段中的一个音频段的长度小于所述预设时长,且除所述音频段之外的其他音频段的长度均为所述预设时长。
3.一种触屏声音检测装置,其特征在于,包括:
第一获取模块,用于获取用户通过触屏设备录制的音频信号;
分析模块,用于对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;
检测模块,用于根据所述相关系数确定所述音频信号是否包含触屏声音;
所述模板信号的长度为预设时长;
所述分析模块,具体用于对所述音频信号进行分割,得到多个音频段,其中,每个所述音频段的长度均不大于所述预设时长;将所述多个音频段分别与所述模板信号进行相关度分析,得到多个相关系数;
所述检测模块,具体用于若所述相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述相关系数不大于预设阈值,则确定所述音频信号不包含触屏信号;
具体地,若所述多个相关系数中的至少一个相关系数大于预设阈值,则确定所述音频信号包含触屏声音;若所述多个相关系数均不大于预设阈值,则确定所述音频信号不包含触屏信号;
所述装置,还包括:第二获取模块,用于获取预设数量的标准音频信号,每个所述标准音频信号的尾部均包含触屏信号;
采样模块,用于使用长度为所述预设时长的时间窗,分别对所述预设数量的标准音频信号进行采样,得到所述时间窗内的每个采样点从每个所述标准音频信号中采样得到的采样值;
生成模块,用于分别计算所述时间窗内的每个采样点采样得到的多个采样值的均值,并根据所述均值以及所述时间窗内的多个采样点之间的位置关系,生成所述模板信号。
4.如权利要求3所述的装置,其特征在于,所述多个音频段中的每个所述音频段的长度均为所述预设时长;或者,所述多个音频段中的一个音频段的长度小于所述预设时长,且除所述音频段之外的其他音频段的长度均为所述预设时长。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043701.2A CN112750458B (zh) | 2019-10-30 | 2019-10-30 | 一种触屏声音检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043701.2A CN112750458B (zh) | 2019-10-30 | 2019-10-30 | 一种触屏声音检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112750458A CN112750458A (zh) | 2021-05-04 |
CN112750458B true CN112750458B (zh) | 2022-11-25 |
Family
ID=75640615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911043701.2A Active CN112750458B (zh) | 2019-10-30 | 2019-10-30 | 一种触屏声音检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112750458B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220067213A1 (en) * | 2020-08-31 | 2022-03-03 | Lieb Lindsey S | Subliminal Software Detection |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142257A (zh) * | 2010-12-28 | 2011-08-03 | 北大方正集团有限公司 | 一种音频信号处理方法及装置 |
CN106157952A (zh) * | 2016-08-30 | 2016-11-23 | 北京小米移动软件有限公司 | 声音识别方法及装置 |
CN107545904A (zh) * | 2016-06-23 | 2018-01-05 | 杭州海康威视数字技术股份有限公司 | 一种音频检测方法及装置 |
JP2019164107A (ja) * | 2018-03-20 | 2019-09-26 | 本田技研工業株式会社 | 異音判定装置および判定方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101213589B (zh) * | 2006-01-12 | 2011-04-27 | 松下电器产业株式会社 | 对象声音分析装置和对象声音分析方法 |
-
2019
- 2019-10-30 CN CN201911043701.2A patent/CN112750458B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142257A (zh) * | 2010-12-28 | 2011-08-03 | 北大方正集团有限公司 | 一种音频信号处理方法及装置 |
CN107545904A (zh) * | 2016-06-23 | 2018-01-05 | 杭州海康威视数字技术股份有限公司 | 一种音频检测方法及装置 |
CN106157952A (zh) * | 2016-08-30 | 2016-11-23 | 北京小米移动软件有限公司 | 声音识别方法及装置 |
JP2019164107A (ja) * | 2018-03-20 | 2019-09-26 | 本田技研工業株式会社 | 異音判定装置および判定方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112750458A (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105118522B (zh) | 噪声检测方法及装置 | |
CN109326305B (zh) | 一种批量测试语音识别和文本合成的方法和测试系统 | |
CN104252872A (zh) | 歌词生成方法和智能终端 | |
US10522160B2 (en) | Methods and apparatus to identify a source of speech captured at a wearable electronic device | |
CN110019922B (zh) | 一种音频高潮识别方法和装置 | |
CN112750458B (zh) | 一种触屏声音检测方法和装置 | |
CN113053365A (zh) | 语音分离方法、装置、设备和存储介质 | |
CN104021791B (zh) | 数字音频波形突变的检测方法 | |
KR101808810B1 (ko) | 음성/무음성 구간 검출 방법 및 장치 | |
CN109377982B (zh) | 一种有效语音获取方法 | |
JP2010097084A (ja) | 携帯端末、拍位置推定方法および拍位置推定プログラム | |
CN111063360B (zh) | 一种声纹库的生成方法和装置 | |
TWI299855B (en) | Detection method for voice activity endpoint | |
JP5815435B2 (ja) | 音源位置判定装置、音源位置判定方法、プログラム | |
KR101382356B1 (ko) | 오디오파일의 위변조 검출장치 | |
CN108093356A (zh) | 一种啸叫检测方法及装置 | |
CN114114400B (zh) | 微地震事件有效信号拾取方法 | |
CN112901146A (zh) | 声波测井探测中坏道的识别方法及装置 | |
CN107548007B (zh) | 一种音频信号采集设备的检测方法及装置 | |
CN113242507A (zh) | 快速调节麦克风增益和检测麦克风底噪的方法 | |
KR101327664B1 (ko) | 음성 영역 검출 방법 및 그 장치 | |
CN111314536B (zh) | 一种用于检测终端设备的收听模块的方法及设备 | |
CN108235137B (zh) | 一种通过声音波形判断切台动作的方法、装置及电视机 | |
CN109949828A (zh) | 一种文字校验方法及装置 | |
US20230129442A1 (en) | System and method for real-time detection of user's attention sound based on neural signals, and audio output device using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 411, 4th floor, building 4, No.44, Middle North Third Ring Road, Haidian District, Beijing 100088 Patentee after: Beijing Qingshu Intelligent Technology Co.,Ltd. Address before: 100044 1415, 14th floor, building 1, yard 59, gaoliangqiaoxie street, Haidian District, Beijing Patentee before: BEIJING AISHU WISDOM TECHNOLOGY CO.,LTD. |