发明内容
有鉴于此,本申请提供了一种利用摄像头进行监控的方法、装置及相关设备,以实现对异常声响事件的监控。
为实现上述目的,本申请第一方面提供了一种利用摄像头进行监控的方法,包括:
获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
基于所述分析结果,判断是否需要延长分析过程;
若是,获取预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;
以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
若否,基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。
优选地,所述利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据的过程,包括:
对所述第一音频数据和所述第二音频数据的频率、振幅和声纹进行比对分析,得到所述第一音频数据中与所述第二音频数据的相似度达到预设阈值的音频部分;
利用所述音频部分的反相波对所述第一音频数据进行过滤处理,得到目标音频数据。
优选地,所述分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果的过程,包括:
获取目标音频数据在所述预设时长内的内容因素、音调因素以及方位因素;
将所述内容因素、所述音调因素以及所述方位因素确定为目标音频数据的分析结果。
优选地,基于所述分析结果,判断是否需要延长分析过程的过程,包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素大于预设的第二方位阈值,则确定需要延长分析过程;
若所述内容因素小于预设的第一内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
若所述内容因素大于预设的第二内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
否则,确定不需要延长分析过程。
优选地,基于所述分析结果,确定异常情况的过程,包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定存在普通噪音;
若所述内容因素大于预设的第二内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素大于预设的第二方位阈值,则确定存在异常声响。
优选地,基于所述异常情况制动摄像头的过程,包括:
当确定存在异常声响后,基于异常声响的方位调整摄像头的监控角度。
本申请第二方面提供了一种利用摄像头进行监控的装置,包括:
获取单元,用于获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
过滤单元,用于利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分析单元,用于分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
判断单元,用于基于所述分析单元的所述分析结果,判断是否需要延长分析过程;
延长单元,用于当所述判断单元判断出需要延长分析过程时,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;以及以所述第三音频数据作为所述第一音频数据,返回所述过滤单元执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
确定单元,用于当所述判断单元判断出不需要延长分析过程时,基于所述分析结果,确定异常情况。
本申请第三方面提供了一种利用摄像头进行监控的系统,包括声音采集模块、声音处理模块和摄像头驱动模块;
所述声音采集模块用于基于采集到声音生成音频数据,并将所述音频数据传递给所述声音处理模块;
所述声音处理模块用于实现如上述的利用摄像头进行监控的方法的各个步骤;
所述摄像头驱动模块用于配合所述声音处理模块调整摄像头的监控角度。
本申请第四方面提供了一种利用摄像头进行监控的设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述的利用摄像头进行监控的方法的各个步骤。
本申请第五方面提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的利用摄像头进行监控的方法的各个步骤。
经由上述的技术方案可知,本申请首先获取预设时长的第一音频数据,其中,所述第一音频数据为实时采集得到的。然后,利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据。所述第二音频数据为预先存储的音频数据,通过所述过滤处理,可以去掉第一音频数据中无需关注的音频部分,避免了环境噪音等因素的影响。接着,分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果。基于所述分析结果,判断是否需要延长分析过程。若是,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据。以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤。通过延长分析过程,对更多的音频数据进行持续分析,可以有效地识别出持续性的噪音,更准确地捕获音频数据的信息。若否,意味着可以确定无需延长分析过程,则基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。本申请实现了在应用环境存在噪音的情况下,有效过滤噪音,准确识别异常事件并进行监控,减小了摄像头漏报、误报异常事件的情况。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面介绍本申请实施例提供的利用摄像头进行监控的方法。请参阅图1,本申请实施例提供的利用摄像头进行监控的方法可以包括如下步骤:
步骤S101,获取预设时长的第一音频数据。
其中,该第一音频数据为实时采集得到的。该预设时长为预先设定的时间长度,例如,1秒,2秒等,预设时长的具体参数可以根据实际调试来确定。
步骤S102,利用预设的第二音频数据对第一音频数据进行过滤处理,得到目标音频数据。
其中,该第二音频数据为预先存储好的,可以是在通用场景或者特定用户的特定场景下预先录入的声音信号,如狗吠、猫叫、装修打墙等声音信号,以及用户及其同住人的声音信号。
通过采用预设的第二音频数据对第一音频数据进行过滤处理,可以去掉第一音频数据中无需被关注的音频部分。
步骤S103,分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果。
其中,音频数据的内容可以是声音所传递的信息,例如,白噪音之类的音频数据所传递的信息可以表示为“0”,人们谈话的音频数据所传递的信息则可以表示为“1”。音频数据的音调通常可以用声音的频率来表征,频率越高则音调越高,频率越低则音调越低。音频数据的方位可以是声源相对于监控设备的方位,该方位信息可以通过具有方向识别功能的麦克风获取得到。
步骤S104,基于该分析结果,判断是否需要延长分析过程。若是,执行步骤S105;若否,执行步骤S106。
步骤S105,获取预设时长的第三音频数据,以第三音频数据作为第一音频数据,返回执行步骤S102。
其中,该预设时长与步骤S101中的预设时长一致,第三音频数据同样为实时采集得到的,且第三音频数据在时间上紧接着步骤S101中的第一音频数据。可以理解为,前面对第一音频数据的分析尚不能得出结论,还需要对更多的音频数据进行分析,以得到确切的分析结果。
步骤S106,基于该分析结果,确定异常情况,并基于该异常情况制动摄像头。
其中,异常情况可以是异常声响,例如存在不速之客在做非法之事等,当出现此种情况,可以制动摄像头转向异常声响的方位,以对现场进行精准的拍摄。
本申请首先获取预设时长的第一音频数据,其中,所述第一音频数据为实时采集得到的。然后,利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据。所述第二音频数据为预先存储的音频数据,通过所述过滤处理,可以去掉第一音频数据中无需关注的音频部分,避免了环境噪音等因素的影响。接着,分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果。基于所述分析结果,判断是否需要延长分析过程。若是,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据。以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤。通过延长分析过程,对更多的音频数据进行持续分析,可以有效地识别出持续性的噪音,更准确地捕获音频数据的信息。若否,意味着可以确定无需延长分析过程,则基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。本申请实现了在应用环境存在噪音的情况下,有效过滤噪音,准确识别异常事件并进行监控,减小了摄像头漏报、误报异常事件的情况。
在本申请的一些实施例中,上述步骤S102利用预设的第二音频数据对第一音频数据进行过滤处理,得到目标音频数据的过程,可以包括:
S1,对第一音频数据和第二音频数据的频率、振幅和声纹进行比对分析,得到第一音频数据中与第二音频数据的相似度达到预设阈值的音频部分。
S2,利用该音频部分的反相波对第一音频数据进行过滤处理,得到目标音频数据。
其中,反相波是指频率一致、相位相反的波形。通过上述处理,可以将第一音频数据中与第二音频数据相似的音频成分过滤掉,所保留的音频部分才是需要关注的,构成目标音频数据,以供进一步的分析。
在本申请的一些实施例中,上述步骤S103分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果的过程,可以包括:
S1,获取目标音频数据在预设时长内的内容因素、音调因素以及方位因素。
S2,将该内容因素、该音调因素以及该方位因素确定为目标音频数据的分析结果。
该分析结果可以表示为a(α,β,γ),其中,α为内容因素,具体地可以根据内容的变化程度设定为0或1,0表示内容相对不变,1表示内容持续变化;β为音调因素,可以由检测到的音调变化幅度差的平均值确定;γ为方位因素,可以由声音方位的偏差角度的平均值确定。
在本申请的一些实施例中,上述步骤S104基于所述分析结果,判断是否需要延长分析过程的过程,可以包括:
S1,若内容因素α小于预设的第一内容阈值,音调因素β小于预设的第一音调阈值,且方位因素γ大于预设的第二方位阈值,则确定需要延长分析过程。
其中,内容因素α小于预设的第一内容阈值意味着内容比较固定,音调因素β小于预设的第一音调阈值意味着音调比较平缓,方位因素γ大于预设的第二方位阈值意味着声源的方位变动较大,在这种情况下无法确定到底是普通噪音、异常声响还是其他可忽略的声响,因此,需要延长分析过程,继续对后续的音频数据进行分析。
S2,若内容因素α小于预设的第一内容阈值,音调因素β大于预设的第二音调阈值,且方位因素γ小于预设的第一方位阈值,则确定需要延长分析过程。
其中,内容因素α小于预设的第一内容阈值意味着内容比较固定,音调因素β大于预设的第二音调阈值意味着音调比较多变,方位因素γ小于预设的第一方位阈值意味着声源的方位变动较大,在这种情况下无法确定到底是普通噪音、异常声响还是其他可忽略的声响,因此,需要延长分析过程,继续对后续的音频数据进行分析。
S3,若内容因素α大于预设的第二内容阈值,音调因素β小于预设的第一音调阈值,且方位因素γ小于预设的第一方位阈值,则确定需要延长分析过程。
其中,内容因素α大于预设的第二内容阈值意味着内容比较跳跃,音调因素β小于预设的第一音调阈值意味着音调比较平缓,方位因素γ小于预设的第一方位阈值意味着声源的方位变动较小,在这种情况下无法确定到底是普通噪音、异常声响还是其他可忽略的声响,因此,需要延长分析过程,继续对后续的音频数据进行分析。
S4,对于除上述S1至S3以外的其他情况,则确定不需要延长分析过程。
其中,上述第一内容阈值、第二内容阈值、第一音调阈值、第二音调阈值、第一方位阈值以及第二方位阈值可以根据实际调试情况进行具体的设定。例如,可以将第一音调阈值设定为2mel,将第二音调阈值设定为5mel,将第一方位阈值设定为5°,将第二方位阈值设定为30°。
在本申请的一些实施例中,上述步骤S106基于该分析结果,确定异常情况的过程,可以包括:
S1,若内容因素α小于预设的第一内容阈值,音调因素β小于预设的第一音调阈值,且方位因素γ小于预设的第一方位阈值,则确定存在普通噪音。
其中,内容因素α小于预设的第一内容阈值意味着内容比较固定,音调因素β小于预设的第一音调阈值意味着音调比较平缓,方位因素γ小于预设的第一方位阈值意味着声源的方位基本没有变动或变动较少,那么容易推导出这可能是机械性的普通噪音。
S2,若内容因素α大于预设的第二内容阈值,音调因素β大于预设的第二音调阈值,且方位因素γ大于预设的第二方位阈值,则确定存在异常声响。
其中,内容因素α大于预设的第二内容阈值意味着内容变动较大,音调因素β大于预设的第二音调阈值意味着音调变动也较大,方位因素γ大于预设的第二方位阈值意味着声源方位也经常在变,那么容易推导出这是可能人为的声响,需要进入预警操作。
在本申请的一些实施例中,上述步骤S106基于该异常情况制动摄像头的过程,可以包括:
当确定存在异常声响后,基于异常声响的方位调整摄像头的监控角度。
通过将摄像头的监控角度调整至异常声响的方位,可以有针对性拍摄导致异常声响的现场画面,以便更准确的发现异常原因。
下面对本申请实施例提供的利用摄像头进行监控的系统进行描述,请参阅图2,本申请实施例提供的利用摄像头进行监控的系统可以包括声音采集模块10、声音处理模块20和摄像头驱动模块40。
其中,声音采集模块10用于基于采集到声音生成音频数据,并将该音频数据传递给声音处理模块20。
声音处理模块20用于实现如上述各实施例提供的利用摄像头进行监控的方法的各个步骤。
摄像头驱动模块40用于配合声音处理模块20调整摄像头的监控角度。
具体地,声音采集模块10内置麦克风,完成声源数据的取得及预处理,得到音频数据,并将音频数据传递至声音处理模块20。
用户预先将环境噪音声源存储至预存储声源保存器21,以便声音过滤输出器22对预存储声源保存器21的噪音声源进行提取,并用于音频数据的比对与识别。
声音过滤输出器22对声音采集模块10传递的音频数据进行比对,对同频音波进行标记识别,并通过反相波运算对标记音波进行消除过滤,得到目标音频数据。
声音分析输出器23对滤后的目标音频数据进行三元素分析,得到分析结果a(α,β,γ),a(α,β,γ)实时更新并同步至时间参数处理模组24。
时间参数处理模组24根据a(α,β,γ)算出分析时间系数b(α,β,γ),其中,b(α,β,γ)作用于声音分析时长。
当确定为异常声响时,向摄像头驱动模块40下达指令,调整摄像头监控角度,对异常声响的方向进行监控。
本申请实施例提供的利用摄像头进行监控的系统具有实现简单的优点,在家用安防摄像头终端的基础上,只需内置一个或多个全向监听麦克风,同时增加声音处理模块即可,无需改动终端设备的整体形态;此外,对原有的家用安防摄像头的数据传输、网络连接等方式无须作任何改动,能够便捷的实现设备的部署。
下面对本申请实施例提供的利用摄像头进行监控的装置进行描述,下文描述的利用摄像头进行监控的装置与上文描述的利用摄像头进行监控的方法可相互对应参照。
请参见图3,本申请实施例提供的利用摄像头进行监控的装置,可以包括:
获取单元51,用于获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
过滤单元52,用于利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分析单元53,用于分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
判断单元54,用于基于所述分析单元的所述分析结果,判断是否需要延长分析过程;
延长单元55,用于当所述判断单元判断出需要延长分析过程时,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;以及以所述第三音频数据作为所述第一音频数据,返回所述过滤单元52执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
确定单元56,用于当所述判断单元判断出不需要延长分析过程时,基于所述分析结果,确定异常情况。
在本申请的一些实施例中,过滤单元52利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据的过程,可以包括:
对所述第一音频数据和所述第二音频数据的频率、振幅和声纹进行比对分析,得到所述第一音频数据中与所述第二音频数据的相似度达到预设阈值的音频部分;
利用所述音频部分的反相波对所述第一音频数据进行过滤处理,得到目标音频数据。
在本申请的一些实施例中,分析单元53分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果的过程,可以包括:
获取目标音频数据在所述预设时长内的内容因素、音调因素以及方位因素;
将所述内容因素、所述音调因素以及所述方位因素确定为目标音频数据的分析结果。
在本申请的一些实施例中,判断单元54基于所述分析结果,判断是否需要延长分析过程的过程,可以包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素大于预设的第二方位阈值,则确定需要延长分析过程;
若所述内容因素小于预设的第一内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
若所述内容因素大于预设的第二内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定需要延长分析过程;
否则,确定不需要延长分析过程。
在本申请的一些实施例中,确定单元56基于所述分析结果,确定异常情况的过程,可以包括:
若所述内容因素小于预设的第一内容阈值,所述音调因素小于预设的第一音调阈值,且所述方位因素小于预设的第一方位阈值,则确定存在普通噪音;
若所述内容因素大于预设的第二内容阈值,所述音调因素大于预设的第二音调阈值,且所述方位因素大于预设的第二方位阈值,则确定存在异常声响。
在本申请的一些实施例中,确定单元56基于所述异常情况制动摄像头的过程,可以包括:
当确定存在异常声响后,基于异常声响的方位调整摄像头的监控角度。
本申请实施例提供的利用摄像头进行监控的装置可应用于利用摄像头进行监控的设备,如计算机等。可选的,图4示出了利用摄像头进行监控的设备的硬件结构框图,参照图4,利用摄像头进行监控的设备的硬件结构可以包括:至少一个处理器31,至少一个通信接口32,至少一个存储器33和至少一个通信总线34。
在本申请实施例中,处理器31、通信接口32、存储器33、通信总线34的数量为至少一个,且处理器31、通信接口32、存储器33通过通信总线34完成相互间的通信;
处理器31可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路等;
存储器32可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器33存储有程序,处理器31可调用存储器33存储的程序,所述程序用于:
获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
基于所述分析结果,判断是否需要延长分析过程;
若是,获取预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;
以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
若否,基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
获取预设时长的第一音频数据,所述第一音频数据为实时采集得到的;
利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据;
分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果;
基于所述分析结果,判断是否需要延长分析过程;
若是,获取预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据;
以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤;
若否,基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
综上所述:
本申请首先获取预设时长的第一音频数据,其中,所述第一音频数据为实时采集得到的。然后,利用预设的第二音频数据对所述第一音频数据进行过滤处理,得到目标音频数据。所述第二音频数据为预先存储的音频数据,通过所述过滤处理,可以去掉第一音频数据中无需关注的音频部分,避免了环境噪音等因素的影响。接着,分别对目标音频数据的内容、音调和方位进行分析,得到目标音频数据的分析结果。基于所述分析结果,判断是否需要延长分析过程。若是,获取新的预设时长的第三音频数据,所述第三音频数据为实时采集得到的,且所述第三音频数据在时间上紧接着所述第一音频数据。以所述第三音频数据作为所述第一音频数据,返回执行利用预设的第二音频数据对所述第一音频数据进行过滤处理的步骤。通过延长分析过程,对更多的音频数据进行持续分析,可以有效地识别出持续性的噪音,更准确地捕获音频数据的信息。若否,意味着可以确定无需延长分析过程,则基于所述分析结果,确定异常情况,并基于所述异常情况制动摄像头。本申请实现了在应用环境存在噪音的情况下,有效过滤噪音,准确识别异常事件并进行监控,减小了摄像头漏报、误报异常事件的情况。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。