CN115103159A - 一种利用摄像头进行监控的方法、装置、系统及相关设备 - Google Patents

一种利用摄像头进行监控的方法、装置、系统及相关设备 Download PDF

Info

Publication number
CN115103159A
CN115103159A CN202210699785.0A CN202210699785A CN115103159A CN 115103159 A CN115103159 A CN 115103159A CN 202210699785 A CN202210699785 A CN 202210699785A CN 115103159 A CN115103159 A CN 115103159A
Authority
CN
China
Prior art keywords
audio data
preset
factor
threshold
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210699785.0A
Other languages
English (en)
Inventor
郭沛炜
郭涛
郭宁
徐龙杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Shilian Technology Co ltd
Original Assignee
Tianyi Digital Life Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Digital Life Technology Co Ltd filed Critical Tianyi Digital Life Technology Co Ltd
Priority to CN202210699785.0A priority Critical patent/CN115103159A/zh
Publication of CN115103159A publication Critical patent/CN115103159A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Emergency Alarm Devices (AREA)

Abstract

本申请公开了一种利用摄像头进行监控的方法、装置、系统及相关设备,该方法包括:利用预设的第二音频数据对采集到的第一音频数据进行过滤处理,得到目标音频数据;分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;基于分析结果,判断是否需要延长分析过程;若是,获取预设时长的第三音频数据,以第三音频数据作为第一音频数据,返回执行利用预设的第二音频数据对第一音频数据进行过滤处理的步骤;若否,基于分析结果,确定异常情况,并基于异常情况制动摄像头。本申请实现了在应用环境存在噪音的情况下,有效过滤噪音,准确识别异常事件并进行监控,减小了摄像头漏报、误报异常事件的情况。

Description

一种利用摄像头进行监控的方法、装置、系统及相关设备
技术领域
本申请涉及视频监控技术领域,更具体地说,是涉及一种利用摄像头进行监控的方法、装置、系统及相关设备。
背景技术
当前家用安防摄像头主要通过用户在手机端进行远程控制以实现摄像头监控角度变换,部分摄像头辅以图像识别或声音识别以实现摄像头自动对异常区域进行监控。其中,具备图像识别功能的摄像头通过人形监测、自动追踪功能实现了对异常事件的识别与追踪,减小了监控死角。但对于初始监控角度以外的事件无法进行监控、识别与追踪,依然存在较大的监控盲区。具备声音识别的摄像头通过指向性麦克风识别异响,并控制摄像头转动对异响区域进行监控,实现了对异常事件发生区域的定位及监控。然而,由于现实环境中存在各种各样意料之外的噪音干扰,例如持续性、高分贝的环境噪音容易引起事件误报的问题,导致依靠声音识别功能的摄像头大大降低了其对异常事件发生区域的判断力。
发明内容
有鉴于此,本申请提供了一种利用摄像头进行监控的方法、装置及相关设备,以实现对异常声响事件的监控。
为实现上述目的,本申请第一方面提供了一种利用摄像头进行监控的方法,包括:
获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
基于所述分析结果,判断是否需要延长分析过程;
若是,获取预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;
以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
若否,基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。
优选地,所述利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据的过程,包括:
对所述第一音频数据和所述第二音频数据的频率、振幅和声纹进行比对分析,得到所述第一音频数据中与所述第二音频数据的相似度达到预设阈值的音频部分;
利用所述音频部分的反相波对所述第一音频数据进行过滤处理,得到目标音频数据。
优选地,所述分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果的过程,包括:
获取目标音频数据在所述预设时长内的内容因素、音调因素以及方位因素;
将所述内容因素、所述音调因素以及所述方位因素确定为目标音频数据的分析结果。
优选地,基于所述分析结果,判断是否需要延长分析过程的过程,包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素大于预设的第二方位阈值,则确定需要延长分析过程;
若所述内容因素小于预设的第一内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
若所述内容因素大于预设的第二内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
否则,确定不需要延长分析过程。
优选地,基于所述分析结果,确定异常情况的过程,包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定存在普通噪音;
若所述内容因素大于预设的第二内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素大于预设的第二方位阈值,则确定存在异常声响。
优选地,基于所述异常情况制动摄像头的过程,包括:
当确定存在异常声响后,基于异常声响的方位调整摄像头的监控角度。
本申请第二方面提供了一种利用摄像头进行监控的装置,包括:
获取单元,用于获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
过滤单元,用于利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分析单元,用于分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
判断单元,用于基于所述分析单元的所述分析结果,判断是否需要延长分析过程;
延长单元,用于当所述判断单元判断出需要延长分析过程时,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;以及以所述第三音频数据作为所述第一音频数据,返回所述过滤单元执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
确定单元,用于当所述判断单元判断出不需要延长分析过程时,基于所述分析结果,确定异常情况。
本申请第三方面提供了一种利用摄像头进行监控的系统,包括声音采集模块、声音处理模块和摄像头驱动模块;
所述声音采集模块用于基于采集到声音生成音频数据,并将所述音频数据传递给所述声音处理模块;
所述声音处理模块用于实现如上述的利用摄像头进行监控的方法的各个步骤;
所述摄像头驱动模块用于配合所述声音处理模块调整摄像头的监控角度。
本申请第四方面提供了一种利用摄像头进行监控的设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述的利用摄像头进行监控的方法的各个步骤。
本申请第五方面提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的利用摄像头进行监控的方法的各个步骤。
经由上述的技术方案可知,本申请首先获取预设时长的第一音频数据,其中,所述第一音频数据为实时采集得到的。然后,利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据。所述第二音频数据为预先存储的音频数据,通过所述过滤处理,可以去掉第一音频数据中无需关注的音频部分,避免了环境噪音等因素的影响。接着,分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果。基于所述分析结果,判断是否需要延长分析过程。若是,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据。以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤。通过延长分析过程,对更多的音频数据进行持续分析,可以有效地识别出持续性的噪音,更准确地捕获音频数据的信息。若否,意味着可以确定无需延长分析过程,则基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。本申请实现了在应用环境存在噪音的情况下,有效过滤噪音,准确识别异常事件并进行监控,减小了摄像头漏报、误报异常事件的情况。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的利用摄像头进行监控的方法的示意图;
图2为本申请实施例公开的利用摄像头进行监控的系统的示意图;
图3为本申请实施例公开的利用摄像头进行监控的装置的示意图;
图4为本申请实施例公开的利用摄像头进行监控的设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面介绍本申请实施例提供的利用摄像头进行监控的方法。请参阅图1,本申请实施例提供的利用摄像头进行监控的方法可以包括如下步骤:
步骤S101,获取预设时长的第一音频数据。
其中,该第一音频数据为实时采集得到的。该预设时长为预先设定的时间长度,例如,1秒,2秒等,预设时长的具体参数可以根据实际调试来确定。
步骤S102,利用预设的第二音频数据对第一音频数据进行过滤处理,得到目标音频数据。
其中,该第二音频数据为预先存储好的,可以是在通用场景或者特定用户的特定场景下预先录入的声音信号,如狗吠、猫叫、装修打墙等声音信号,以及用户及其同住人的声音信号。
通过采用预设的第二音频数据对第一音频数据进行过滤处理,可以去掉第一音频数据中无需被关注的音频部分。
步骤S103,分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果。
其中,音频数据的内容可以是声音所传递的信息,例如,白噪音之类的音频数据所传递的信息可以表示为“0”,人们谈话的音频数据所传递的信息则可以表示为“1”。音频数据的音调通常可以用声音的频率来表征,频率越高则音调越高,频率越低则音调越低。音频数据的方位可以是声源相对于监控设备的方位,该方位信息可以通过具有方向识别功能的麦克风获取得到。
步骤S104,基于该分析结果,判断是否需要延长分析过程。若是,执行步骤S105;若否,执行步骤S106。
步骤S105,获取预设时长的第三音频数据,以第三音频数据作为第一音频数据,返回执行步骤S102。
其中,该预设时长与步骤S101中的预设时长一致,第三音频数据同样为实时采集得到的,且第三音频数据在时间上紧接着步骤S101中的第一音频数据。可以理解为,前面对第一音频数据的分析尚不能得出结论,还需要对更多的音频数据进行分析,以得到确切的分析结果。
步骤S106,基于该分析结果,确定异常情况,并基于该异常情况制动摄像头。
其中,异常情况可以是异常声响,例如存在不速之客在做非法之事等,当出现此种情况,可以制动摄像头转向异常声响的方位,以对现场进行精准的拍摄。
本申请首先获取预设时长的第一音频数据,其中,所述第一音频数据为实时采集得到的。然后,利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据。所述第二音频数据为预先存储的音频数据,通过所述过滤处理,可以去掉第一音频数据中无需关注的音频部分,避免了环境噪音等因素的影响。接着,分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果。基于所述分析结果,判断是否需要延长分析过程。若是,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据。以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤。通过延长分析过程,对更多的音频数据进行持续分析,可以有效地识别出持续性的噪音,更准确地捕获音频数据的信息。若否,意味着可以确定无需延长分析过程,则基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。本申请实现了在应用环境存在噪音的情况下,有效过滤噪音,准确识别异常事件并进行监控,减小了摄像头漏报、误报异常事件的情况。
在本申请的一些实施例中,上述步骤S102利用预设的第二音频数据对第一音频数据进行过滤处理,得到目标音频数据的过程,可以包括:
S1,对第一音频数据和第二音频数据的频率、振幅和声纹进行比对分析,得到第一音频数据中与第二音频数据的相似度达到预设阈值的音频部分。
S2,利用该音频部分的反相波对第一音频数据进行过滤处理,得到目标音频数据。
其中,反相波是指频率一致、相位相反的波形。通过上述处理,可以将第一音频数据中与第二音频数据相似的音频成分过滤掉,所保留的音频部分才是需要关注的,构成目标音频数据,以供进一步的分析。
在本申请的一些实施例中,上述步骤S103分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果的过程,可以包括:
S1,获取目标音频数据在预设时长内的内容因素、音调因素以及方位因素。
S2,将该内容因素、该音调因素以及该方位因素确定为目标音频数据的分析结果。
该分析结果可以表示为a(α,β,γ),其中,α为内容因素,具体地可以根据内容的变化程度设定为0或1,0表示内容相对不变,1表示内容持续变化;β为音调因素,可以由检测到的音调变化幅度差的平均值确定;γ为方位因素,可以由声音方位的偏差角度的平均值确定。
在本申请的一些实施例中,上述步骤S104基于所述分析结果,判断是否需要延长分析过程的过程,可以包括:
S1,若内容因素α小于预设的第一内容阈值,音调因素β小于预设的第一音调阈值,且方位因素γ大于预设的第二方位阈值,则确定需要延长分析过程。
其中,内容因素α小于预设的第一内容阈值意味着内容比较固定,音调因素β小于预设的第一音调阈值意味着音调比较平缓,方位因素γ大于预设的第二方位阈值意味着声源的方位变动较大,在这种情况下无法确定到底是普通噪音、异常声响还是其他可忽略的声响,因此,需要延长分析过程,继续对后续的音频数据进行分析。
S2,若内容因素α小于预设的第一内容阈值,音调因素β大于预设的第二音调阈值,且方位因素γ小于预设的第一方位阈值,则确定需要延长分析过程。
其中,内容因素α小于预设的第一内容阈值意味着内容比较固定,音调因素β大于预设的第二音调阈值意味着音调比较多变,方位因素γ小于预设的第一方位阈值意味着声源的方位变动较大,在这种情况下无法确定到底是普通噪音、异常声响还是其他可忽略的声响,因此,需要延长分析过程,继续对后续的音频数据进行分析。
S3,若内容因素α大于预设的第二内容阈值,音调因素β小于预设的第一音调阈值,且方位因素γ小于预设的第一方位阈值,则确定需要延长分析过程。
其中,内容因素α大于预设的第二内容阈值意味着内容比较跳跃,音调因素β小于预设的第一音调阈值意味着音调比较平缓,方位因素γ小于预设的第一方位阈值意味着声源的方位变动较小,在这种情况下无法确定到底是普通噪音、异常声响还是其他可忽略的声响,因此,需要延长分析过程,继续对后续的音频数据进行分析。
S4,对于除上述S1至S3以外的其他情况,则确定不需要延长分析过程。
其中,上述第一内容阈值、第二内容阈值、第一音调阈值、第二音调阈值、第一方位阈值以及第二方位阈值可以根据实际调试情况进行具体的设定。例如,可以将第一音调阈值设定为2mel,将第二音调阈值设定为5mel,将第一方位阈值设定为5°,将第二方位阈值设定为30°
在本申请的一些实施例中,上述步骤S106基于该分析结果,确定异常情况的过程,可以包括:
S1,若内容因素α小于预设的第一内容阈值,音调因素β小于预设的第一音调阈值,且方位因素γ小于预设的第一方位阈值,则确定存在普通噪音。
其中,内容因素α小于预设的第一内容阈值意味着内容比较固定,音调因素β小于预设的第一音调阈值意味着音调比较平缓,方位因素γ小于预设的第一方位阈值意味着声源的方位基本没有变动或变动较少,那么容易推导出这可能是机械性的普通噪音。
S2,若内容因素α大于预设的第二内容阈值,音调因素β大于预设的第二音调阈值,且方位因素γ大于预设的第二方位阈值,则确定存在异常声响。
其中,内容因素α大于预设的第二内容阈值意味着内容变动较大,音调因素β大于预设的第二音调阈值意味着音调变动也较大,方位因素γ大于预设的第二方位阈值意味着声源方位也经常在变,那么容易推导出这是可能人为的声响,需要进入预警操作。
在本申请的一些实施例中,上述步骤S106基于该异常情况制动摄像头的过程,可以包括:
当确定存在异常声响后,基于异常声响的方位调整摄像头的监控角度。
通过将摄像头的监控角度调整至异常声响的方位,可以有针对性拍摄导致异常声响的现场画面,以便更准确的发现异常原因。
下面对本申请实施例提供的利用摄像头进行监控的系统进行描述,请参阅图2,本申请实施例提供的利用摄像头进行监控的系统可以包括声音采集模块10、声音处理模块20和摄像头驱动模块40。
其中,声音采集模块10用于基于采集到声音生成音频数据,并将该音频数据传递给声音处理模块20。
声音处理模块20用于实现如上述各实施例提供的利用摄像头进行监控的方法的各个步骤。
摄像头驱动模块40用于配合声音处理模块20调整摄像头的监控角度。
具体地,声音采集模块10内置麦克风,完成声源数据的取得及预处理,得到音频数据,并将音频数据传递至声音处理模块20。
用户预先将环境噪音声源存储至预存储声源保存器21,以便声音过滤输出器22对预存储声源保存器21的噪音声源进行提取,并用于音频数据的比对与识别。
声音过滤输出器22对声音采集模块10传递的音频数据进行比对,对同频音波进行标记识别,并通过反相波运算对标记音波进行消除过滤,得到目标音频数据。
声音分析输出器23对滤后的目标音频数据进行三元素分析,得到分析结果a(α,β,γ),a(α,β,γ)实时更新并同步至时间参数处理模组24。
时间参数处理模组24根据a(α,β,γ)算出分析时间系数b(α,β,γ),其中,b(α,β,γ)作用于声音分析时长。
当确定为异常声响时,向摄像头驱动模块40下达指令,调整摄像头监控角度,对异常声响的方向进行监控。
本申请实施例提供的利用摄像头进行监控的系统具有实现简单的优点,在家用安防摄像头终端的基础上,只需内置一个或多个全向监听麦克风,同时增加声音处理模块即可,无需改动终端设备的整体形态;此外,对原有的家用安防摄像头的数据传输、网络连接等方式无须作任何改动,能够便捷的实现设备的部署。
下面对本申请实施例提供的利用摄像头进行监控的装置进行描述,下文描述的利用摄像头进行监控的装置与上文描述的利用摄像头进行监控的方法可相互对应参照。
请参见图3,本申请实施例提供的利用摄像头进行监控的装置,可以包括:
获取单元51,用于获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
过滤单元52,用于利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分析单元53,用于分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
判断单元54,用于基于所述分析单元的所述分析结果,判断是否需要延长分析过程;
延长单元55,用于当所述判断单元判断出需要延长分析过程时,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;以及以所述第三音频数据作为所述第一音频数据,返回所述过滤单元52执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
确定单元56,用于当所述判断单元判断出不需要延长分析过程时,基于所述分析结果,确定异常情况。
在本申请的一些实施例中,过滤单元52利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据的过程,可以包括:
对所述第一音频数据和所述第二音频数据的频率、振幅和声纹进行比对分析,得到所述第一音频数据中与所述第二音频数据的相似度达到预设阈值的音频部分;
利用所述音频部分的反相波对所述第一音频数据进行过滤处理,得到目标音频数据。
在本申请的一些实施例中,分析单元53分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果的过程,可以包括:
获取目标音频数据在所述预设时长内的内容因素、音调因素以及方位因素;
将所述内容因素、所述音调因素以及所述方位因素确定为目标音频数据的分析结果。
在本申请的一些实施例中,判断单元54基于所述分析结果,判断是否需要延长分析过程的过程,可以包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素大于预设的第二方位阈值,则确定需要延长分析过程;
若所述内容因素小于预设的第一内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
若所述内容因素大于预设的第二内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
否则,确定不需要延长分析过程。
在本申请的一些实施例中,确定单元56基于所述分析结果,确定异常情况的过程,可以包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定存在普通噪音;
若所述内容因素大于预设的第二内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素大于预设的第二方位阈值,则确定存在异常声响。
在本申请的一些实施例中,确定单元56基于所述异常情况制动摄像头的过程,可以包括:
当确定存在异常声响后,基于异常声响的方位调整摄像头的监控角度。
本申请实施例提供的利用摄像头进行监控的装置可应用于利用摄像头进行监控的设备,如计算机等。可选的,图4示出了利用摄像头进行监控的设备的硬件结构框图,参照图4,利用摄像头进行监控的设备的硬件结构可以包括:至少一个处理器31,至少一个通信接口32,至少一个存储器33和至少一个通信总线34。
在本申请实施例中,处理器31、通信接口32、存储器33、通信总线34的数量为至少一个,且处理器31、通信接口32、存储器33通过通信总线34完成相互间的通信;
处理器31可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路等;
存储器32可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器33存储有程序,处理器31可调用存储器33存储的程序,所述程序用于:
获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
基于所述分析结果,判断是否需要延长分析过程;
若是,获取预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;
以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
若否,基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
基于所述分析结果,判断是否需要延长分析过程;
若是,获取预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;
以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
若否,基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
综上所述:
本申请首先获取预设时长的第一音频数据,其中,所述第一音频数据为实时采集得到的。然后,利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据。所述第二音频数据为预先存储的音频数据,通过所述过滤处理,可以去掉第一音频数据中无需关注的音频部分,避免了环境噪音等因素的影响。接着,分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果。基于所述分析结果,判断是否需要延长分析过程。若是,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据。以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤。通过延长分析过程,对更多的音频数据进行持续分析,可以有效地识别出持续性的噪音,更准确地捕获音频数据的信息。若否,意味着可以确定无需延长分析过程,则基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。本申请实现了在应用环境存在噪音的情况下,有效过滤噪音,准确识别异常事件并进行监控,减小了摄像头漏报、误报异常事件的情况。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种利用摄像头进行监控的方法,其特征在于,包括:
获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
基于所述分析结果,判断是否需要延长分析过程;
若是,获取预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;
以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
若否,基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。
2.根据权利要求1所述的方法,其特征在于,所述利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据的过程,包括:
对所述第一音频数据和所述第二音频数据的频率、振幅和声纹进行比对分析,得到所述第一音频数据中与所述第二音频数据的相似度达到预设阈值的音频部分;
利用所述音频部分的反相波对所述第一音频数据进行过滤处理,得到目标音频数据。
3.根据权利要求1所述的方法,其特征在于,所述分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果的过程,包括:
获取目标音频数据在所述预设时长内的内容因素、音调因素以及方位因素;
将所述内容因素、所述音调因素以及所述方位因素确定为目标音频数据的分析结果。
4.根据权利要求3所述的方法,其特征在于,基于所述分析结果,判断是否需要延长分析过程的过程,包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素大于预设的第二方位阈值,则确定需要延长分析过程;
若所述内容因素小于预设的第一内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
若所述内容因素大于预设的第二内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
否则,确定不需要延长分析过程。
5.根据权利要求3所述的方法,其特征在于,基于所述分析结果,确定异常情况的过程,包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定存在普通噪音;
若所述内容因素大于预设的第二内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素大于预设的第二方位阈值,则确定存在异常声响。
6.根据权利要求5所述的方法,其特征在于,基于所述异常情况制动摄像头的过程,包括:
当确定存在异常声响后,基于异常声响的方位调整摄像头的监控角度。
7.一种利用摄像头进行监控的装置,其特征在于,包括:
获取单元,用于获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
过滤单元,用于利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分析单元,用于分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
判断单元,用于基于所述分析单元的所述分析结果,判断是否需要延长分析过程;
延长单元,用于当所述判断单元判断出需要延长分析过程时,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;以及以所述第三音频数据作为所述第一音频数据,返回所述过滤单元执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
确定单元,用于当所述判断单元判断出不需要延长分析过程时,基于所述分析结果,确定异常情况。
8.一种利用摄像头进行监控的系统,其特征在于,包括声音采集模块、声音处理模块和摄像头驱动模块;
所述声音采集模块用于基于采集到声音生成音频数据,并将所述音频数据传递给所述声音处理模块;
所述声音处理模块用于实现如权利要求1~6中任一项所述的利用摄像头进行监控的方法的各个步骤;
所述摄像头驱动模块用于配合所述声音处理模块调整摄像头的监控角度。
9.一种利用摄像头进行监控的设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~6中任一项所述的利用摄像头进行监控的方法的各个步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~6中任一项所述的利用摄像头进行监控的方法的各个步骤。
CN202210699785.0A 2022-06-20 2022-06-20 一种利用摄像头进行监控的方法、装置、系统及相关设备 Pending CN115103159A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210699785.0A CN115103159A (zh) 2022-06-20 2022-06-20 一种利用摄像头进行监控的方法、装置、系统及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210699785.0A CN115103159A (zh) 2022-06-20 2022-06-20 一种利用摄像头进行监控的方法、装置、系统及相关设备

Publications (1)

Publication Number Publication Date
CN115103159A true CN115103159A (zh) 2022-09-23

Family

ID=83293575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210699785.0A Pending CN115103159A (zh) 2022-06-20 2022-06-20 一种利用摄像头进行监控的方法、装置、系统及相关设备

Country Status (1)

Country Link
CN (1) CN115103159A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117557966A (zh) * 2024-01-09 2024-02-13 南京格瑞物联科技有限公司 基于监控图像识别的校园异常行为安全检测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117557966A (zh) * 2024-01-09 2024-02-13 南京格瑞物联科技有限公司 基于监控图像识别的校园异常行为安全检测方法及系统
CN117557966B (zh) * 2024-01-09 2024-04-02 南京格瑞物联科技有限公司 基于监控图像识别的校园异常行为安全检测方法及系统

Similar Documents

Publication Publication Date Title
CN102246228B (zh) 声音识别系统
JP5043940B2 (ja) ビデオおよびオーディオ認識を組み合わせたビデオ監視システムおよび方法
CN109920419B (zh) 语音控制方法和装置、电子设备及计算机可读介质
US20080309761A1 (en) Video surveillance system and method with combined video and audio recognition
WO2013157254A1 (en) Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program
CN111034222A (zh) 拾音装置、拾音方法以及程序
WO2019128263A1 (zh) 检测车辆鸣笛的方法、装置、设备、存储介质以及系统
CN111223261B (zh) 一种复合智能生产安防系统及其安防方法
CN115103159A (zh) 一种利用摄像头进行监控的方法、装置、系统及相关设备
CN110313031A (zh) 针对语音隐私的自适应语音可懂度控制
CN110634506A (zh) 一种语音数据的处理方法及装置
JP2003270034A (ja) 音情報解析方法、装置、プログラム、および記録媒体
US10621424B2 (en) Multi-level state detecting system and method
CN111653067A (zh) 智能家居设备及基于音频的报警方法
KR101124371B1 (ko) 음성인식 범죄예방경보시스템
CN107734416B (zh) 一种激光面纹识别降噪装置、耳机及方法
KR102034176B1 (ko) 음성 인식을 통한 현장 응급 상황 인지 방법 및 이에 사용되는 관리 서버
CN113409800A (zh) 一种监控音频的处理方法、装置、存储介质及电子设备
CN110610706A (zh) 声音信号采集方法、装置、电器设备控制方法及电器设备
KR102048021B1 (ko) 외부 소음 적응형 음장 보안 감시 방법
CN213042656U (zh) 信息处理装置
KR101578108B1 (ko) 오디오 데이터 기반의 감시 시스템을 위한 비명 검출 장치 및 그 방법
KR101670801B1 (ko) 이상 음원 감지 방법 및 시스템
US10863146B1 (en) Setup and configuration of audio/video recording and communication devices
TWI609193B (zh) 基於調頻聲波的空間擾動偵測方法與裝置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240315

Address after: Unit 1, Building 1, China Telecom Zhejiang Innovation Park, No. 8 Xiqin Street, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province, 311100

Applicant after: Tianyi Shilian Technology Co.,Ltd.

Country or region after: China

Address before: 200000 room 1423, No. 1256 and 1258, Wanrong Road, Jing'an District, Shanghai

Applicant before: Tianyi Digital Life Technology Co.,Ltd.

Country or region before: China