CN114550395B - 声音报警检测方法及设备 - Google Patents

声音报警检测方法及设备 Download PDF

Info

Publication number
CN114550395B
CN114550395B CN202210455293.7A CN202210455293A CN114550395B CN 114550395 B CN114550395 B CN 114550395B CN 202210455293 A CN202210455293 A CN 202210455293A CN 114550395 B CN114550395 B CN 114550395B
Authority
CN
China
Prior art keywords
sound data
detected
sound
alarm
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210455293.7A
Other languages
English (en)
Other versions
CN114550395A (zh
Inventor
张明
杜文强
关磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Fenyinta Technology Co ltd
Original Assignee
Changzhou Fenyinta Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Fenyinta Technology Co ltd filed Critical Changzhou Fenyinta Technology Co ltd
Priority to CN202210455293.7A priority Critical patent/CN114550395B/zh
Publication of CN114550395A publication Critical patent/CN114550395A/zh
Application granted granted Critical
Publication of CN114550395B publication Critical patent/CN114550395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B3/00Audible signalling systems; Audible personal calling systems
    • G08B3/10Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Electromagnetism (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Emergency Alarm Devices (AREA)
  • Alarm Systems (AREA)

Abstract

本申请涉及一种声音报警检测方法及设备,方法包括:获取待检测声音数据,对待检测声音数据进行预处理,得到处理后声音数据。计算处理后声音数据中各信号的自相关函数值。基于预设的窗函数,对处理后声音数据中各信号的自相关函数值进行滑窗,得到处理后声音数据中通过滑窗的信号个数,在信号个数处于预设范围值时,进行报警。由于本申请中的预设范围值根据周期性敲击声得到的,无语言能力者可以选择进行周期性的敲击生成待检测声音数据,在待检测声音数据通过滑窗的信号个数处于预设范围值时,判断待检测声音数据为周期性敲击声,此时达到报警条件,进行报警。本申请中还通过自相关函数检测声音的周期规律,从而屏蔽各种噪声,降低误报警率。

Description

声音报警检测方法及设备
技术领域
本申请涉及智能安防技术领域,尤其涉及一种声音报警检测方法及设备。
背景技术
声音报警具有广泛的应用场景,比如在应用到智能安防领域时,在卧室、卫生间等不方便安装摄像头的地方,可以安装声音报警器做为监控,通过语音识别的方式,报警人通过喊出设定的报警敏感词,触发报警装置。但是一些丧失语音能力的人(如不能发音的老人或脑梗患者)无法通过声音报警,现有技术中的声音报警器无法顾及到无语言能力者。
发明内容
为至少在一定程度上克服相关技术中的声音报警器只能识别设定的报警敏感词,无法顾及到无语言能力者的问题,本申请提供一种声音报警检测方法及设备。
本申请的方案如下:
根据本申请实施例的第一方面,提供一种声音报警检测方法,包括:
获取待检测声音数据;
对所述待检测声音数据进行预处理,得到处理后声音数据;
计算所述处理后声音数据中各信号的自相关函数值;
基于预设的窗函数,对所述处理后声音数据中各信号的自相关函数值进行滑窗,得到所述处理后声音数据中通过滑窗的信号个数;
在所述信号个数处于预设范围值时,进行报警;其中,所述预设范围值是根据周期性敲击声得到的。
优选的,在本申请一种可实现的方式中,所述对所述待检测声音数据进行预处理,包括:
基于预设特征提取方法对所述待检测声音数据进行特征提取。
优选的,在本申请一种可实现的方式中,所述预设特征提取方法为Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)或Fbank或CQCC。
优选的,在本申请一种可实现的方式中,所述特征包括多个维度。
优选的,在本申请一种可实现的方式中,所述对所述待检测声音数据进行预处理,还包括:
在多个维度的所述特征中选取符合预设要求的多个子带特征。
优选的,在本申请一种可实现的方式中,所述对所述待检测声音数据进行预处理,还包括:
将多个所述子带特征进行特征融合。
优选的,在本申请一种可实现的方式中,所述将多个所述子带特征进行特征融合,包括:
将多个所述子带特征进行相加取均值。
根据本申请实施例的第二方面,提供一种声音报警检测设备,包括:
处理器、拾音器和报警器;
所述处理器分别连接所述拾音器和所述报警器;
所述拾音器用于获取待检测声音数据并将所述声音数据发送到所述处理器;
所述处理器用于对所述待检测声音数据进行预处理,得到处理后声音数据;计算所述处理后声音数据中各信号的自相关函数值;基于预设的窗函数,对所述处理后声音数据中各信号的自相关函数值进行滑窗,得到所述处理后声音数据中通过滑窗的信号个数;在所述信号个数处于预设范围值时,控制所述报警器进行报警;其中,所述预设范围值是根据周期性敲击声得到的。
本申请提供的技术方案可以包括以下有益效果:本申请中的声音报警检测方法,包括:获取待检测声音数据,对待检测声音数据进行预处理,得到处理后声音数据。计算处理后声音数据中各信号的自相关函数值。基于预设的窗函数,对处理后声音数据中各信号的自相关函数值进行滑窗,得到处理后声音数据中通过滑窗的信号个数,在信号个数处于预设范围值时,进行报警。由于本申请中的预设范围值根据周期性敲击声得到的,无语言能力者可以选择进行周期性的敲击生成待检测声音数据,在待检测声音数据通过滑窗的信号个数处于预设范围值时,判断待检测声音数据为周期性敲击声,此时达到报警条件,进行报警。本申请中还通过自相关函数检测声音的周期规律,从而屏蔽如电视声、日常聊天声等各种噪声,降低误报警率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请一个实施例提供的一种声音报警检测方法的流程示意图;
图2是本申请另一个实施例提供的一种声音报警检测方法的流程示意图;
图3是本申请一个实施例提供的一种声音报警检测设备的结构示意图。
附图标记:处理器-21;拾音器-22;报警器-23。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
一种声音报警检测方法,参照图1,包括:
S11:获取待检测声音数据;
本实施例中,可以在卧室、卫生间等不方便安装摄像头的地方,安装拾音器来采集待检测声音数据。
待检测声音数据可能为电视声、日常聊天声等杂音,也可能为无语言能力者发出的报警声音数据。
S12:对待检测声音数据进行预处理,得到处理后声音数据;
对待检测声音数据进行预处理,参照图2,包括:
S121:基于预设特征提取方法对待检测声音数据进行特征提取;
本实施例中,可以但不限于采用MFCC或Fbank或CQCC方法对待检测声音数据进行特征提取。
MFCC或Fbank或CQCC等声音特征提取方法均为成熟的现有技术,此处不做赘述。
本实施例中,通过预设特征提取方法提取待检测声音数据中多个维度的特征。
S122:在多个维度的特征中选取符合预设要求的多个子带特征;
举例说明:如包括13维度的MFCC特征,本实施例中可取符合预设要求的第二维度和第三维度特征作为子带特征。
S123:将多个子带特征进行特征融合。
特征融合具有多种,本实施例中可以但不限于将多个子带特征进行相加取均值进行特征融合。
本实施例中,通过将多个子带特征进行特征融合从而去除扰动,增加模型鲁棒性。
S13:计算处理后声音数据中各信号的自相关函数值;
S14:基于预设的窗函数,对处理后声音数据中各信号的自相关函数值进行滑窗,得到处理后声音数据中通过滑窗的信号个数;
对于计算得到的自相关函数值,通过设定特定长的窗函数,对处理后声音数据中各信号的自相关函数值进行滑窗,统计处理后声音数据中通过滑窗的信号个数。
具体的,判断统计处理后声音数据中每个信号的自相关函数值是否大于预设阈值a,处理后声音数据中每有一个大于预设阈值a的信号,进行一次计数,统计最后的计数n。
S15:在信号个数处于预设范围值时,进行报警;其中,预设范围值是根据周期性敲击声得到的。
在计数n处于预设范围值m时,判断待检测声音数据为周期性敲击声,而非其他周期性声音,进行报警。
本实施例中的声音报警检测方法,包括:获取待检测声音数据,对待检测声音数据进行预处理,得到处理后声音数据。计算处理后声音数据中各信号的自相关函数值。基于预设的窗函数,对处理后声音数据中各信号的自相关函数值进行滑窗,得到处理后声音数据中通过滑窗的信号个数,在信号个数处于预设范围值时,进行报警。由于本实施例中的预设范围值根据周期性敲击声得到的,无语言能力者可以选择进行周期性的敲击生成待检测声音数据,在待检测声音数据通过滑窗的信号个数处于预设范围值时,判断待检测声音数据为周期性敲击声,此时达到报警条件,进行报警。本申请中还通过自相关函数检测声音的周期规律,从而屏蔽如电视声、日常聊天声等各种噪声,降低误报警率。
一种声音报警检测设备,参照图3,包括:
处理器21、拾音器22和报警器23;
处理器21分别连接拾音器和报警器;
拾音器22用于获取待检测声音数据并将声音数据发送到处理器21;
处理器21用于对待检测声音数据进行预处理,得到处理后声音数据;计算处理后声音数据中各信号的自相关函数值;基于预设的窗函数,对处理后声音数据中各信号的自相关函数值进行滑窗,得到处理后声音数据中通过滑窗的信号个数;在信号个数处于预设范围值时,控制报警器23进行报警;其中,预设范围值是根据周期性敲击声得到的。
本实施例中的拾音器22可以但不限于为麦克风。
本实施例中的报警器23可以但不限于为声光报警器。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (4)

1.一种声音报警检测方法,其特征在于,包括:
获取待检测声音数据;
对所述待检测声音数据进行预处理,得到处理后声音数据;包括:基于预设特征提取方法对所述待检测声音数据进行特征提取,特征包括多个维度,在多个维度的所述特征中选取符合预设要求的多个子带特征,将多个所述子带特征进行特征融合;
计算所述处理后声音数据中各信号的自相关函数值;
基于预设的窗函数,对所述处理后声音数据中各信号的自相关函数值进行滑窗,得到所述处理后声音数据中通过滑窗的信号个数;
在所述信号个数处于预设范围值时,进行报警;其中,所述预设范围值是根据周期性敲击声得到的。
2.根据权利要求1所述的方法,其特征在于,所述预设特征提取方法为MFCC或Fbank或CQCC。
3.根据权利要求1所述的方法,其特征在于,所述将多个所述子带特征进行特征融合,包括:
将多个所述子带特征进行相加取均值。
4.一种声音报警检测设备,其特征在于,包括:
处理器、拾音器和报警器;
所述处理器分别连接所述拾音器和所述报警器;
所述拾音器用于获取待检测声音数据并将所述声音数据发送到所述处理器;
所述处理器用于对所述待检测声音数据进行预处理,得到处理后声音数据;计算所述处理后声音数据中各信号的自相关函数值;基于预设的窗函数,对所述处理后声音数据中各信号的自相关函数值进行滑窗,得到所述处理后声音数据中通过滑窗的信号个数;在所述信号个数处于预设范围值时,控制所述报警器进行报警;其中,所述预设范围值是根据周期性敲击声得到的;
其中,所述对所述待检测声音数据进行预处理包括:基于预设特征提取方法对所述待检测声音数据进行特征提取,特征包括多个维度,在多个维度的所述特征中选取符合预设要求的多个子带特征,将多个所述子带特征进行特征融合。
CN202210455293.7A 2022-04-28 2022-04-28 声音报警检测方法及设备 Active CN114550395B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210455293.7A CN114550395B (zh) 2022-04-28 2022-04-28 声音报警检测方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210455293.7A CN114550395B (zh) 2022-04-28 2022-04-28 声音报警检测方法及设备

Publications (2)

Publication Number Publication Date
CN114550395A CN114550395A (zh) 2022-05-27
CN114550395B true CN114550395B (zh) 2022-07-19

Family

ID=81666782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210455293.7A Active CN114550395B (zh) 2022-04-28 2022-04-28 声音报警检测方法及设备

Country Status (1)

Country Link
CN (1) CN114550395B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115798514B (zh) * 2023-02-06 2023-04-21 成都启英泰伦科技有限公司 一种敲击声检测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102621520A (zh) * 2011-01-27 2012-08-01 西门子公司 在紧急状况下定位受困个体的方法和装置
US10062395B2 (en) * 2015-12-03 2018-08-28 Loop Labs, Inc. Spectral recognition of percussive sounds
CN106887122B (zh) * 2015-12-15 2019-08-30 美的集团股份有限公司 通过音箱进行报警的方法、装置以及音箱
CN107170466B (zh) * 2017-04-14 2020-12-29 中国科学院计算技术研究所 基于音频的拖地声检测方法
CN110969805A (zh) * 2018-09-30 2020-04-07 杭州海康威视数字技术股份有限公司 一种安全检测方法、装置和系统

Also Published As

Publication number Publication date
CN114550395A (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
KR101437830B1 (ko) 음성 구간 검출 방법 및 장치
Adeel et al. Lip-reading driven deep learning approach for speech enhancement
KR101519104B1 (ko) 목적음 검출 장치 및 방법
KR101759143B1 (ko) 음향 추적 정보 제공 방법, 차량용 음향 추적 장치, 및 이를 포함하는 차량
JP4729927B2 (ja) 音声検出装置、自動撮像装置、および音声検出方法
Chan et al. An abnormal sound detection and classification system for surveillance applications
JP2012048689A (ja) 異常検知装置
CN103198838A (zh) 一种用于嵌入式系统的异常声音监控方法和监控装置
Schroeder et al. Detection and classification of acoustic events for in-home care
EP2881948A1 (en) Spectral comb voice activity detection
CN114550395B (zh) 声音报警检测方法及设备
Hollosi et al. Voice activity detection driven acoustic event classification for monitoring in smart homes
KR101250668B1 (ko) Gmm을 이용한 응급 단어 인식 방법
CN110969805A (zh) 一种安全检测方法、装置和系统
EP1751740A1 (en) System and method for babble noise detection
KR20110010179A (ko) 음성 인식을 이용한 엘리베이터 내의 자동 보안 시스템 및 그 방법
JP5627962B2 (ja) 異常検知装置
KR20130097490A (ko) 음향 정보 기반 상황 인식 장치 및 방법
Istrate et al. Embedded implementation of distress situation identification through sound analysis
US20230162755A1 (en) Object left-behind detection method, object left-behind detection apparatus, and program
US11490198B1 (en) Single-microphone wind detection for audio device
JP5619529B2 (ja) 悲鳴検知装置
JP2018109739A (ja) 音声フレーム処理用の装置及び方法
Kolovou et al. Video-surveillance and context aware system for activity recognition
KR102169797B1 (ko) 이벤트 검출 기반 전관 방송 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant