CN115376545A - 一种声音侦测方法、装置、设备及存储介质 - Google Patents
一种声音侦测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115376545A CN115376545A CN202110558996.8A CN202110558996A CN115376545A CN 115376545 A CN115376545 A CN 115376545A CN 202110558996 A CN202110558996 A CN 202110558996A CN 115376545 A CN115376545 A CN 115376545A
- Authority
- CN
- China
- Prior art keywords
- sound
- signal
- sound signal
- detection
- time length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 161
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 230000005236 sound signal Effects 0.000 claims abstract description 222
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000036578 sleeping time Effects 0.000 claims abstract description 6
- 238000010586 diagram Methods 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 8
- 230000000737 periodic effect Effects 0.000 claims description 4
- 230000007958 sleep Effects 0.000 abstract description 11
- 230000005059 dormancy Effects 0.000 abstract 1
- 230000008859 change Effects 0.000 description 32
- 238000012545 processing Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000009467 reduction Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 239000000779 smoke Substances 0.000 description 3
- 230000004617 sleep duration Effects 0.000 description 2
- 230000004622 sleep time Effects 0.000 description 2
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
- H04W52/0209—Power saving arrangements in terminal devices
- H04W52/0225—Power saving arrangements in terminal devices using monitoring of external events, e.g. the presence of a signal
- H04W52/0248—Power saving arrangements in terminal devices using monitoring of external events, e.g. the presence of a signal dependent on the time of the day, e.g. according to expected transmission activity
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本申请适用于声音侦测技术领域,提供一种声音侦测方法、装置、设备及存储介质,其中方法包括:若休眠时长达到第一时长,进入唤醒状态并开始采集声音信号直到唤醒时长达到第二时长,所述第二时长小于所述第一时长;确定所述声音信号的特性参数是否大于相应阈值;若是,则继续采集声音信号直到满预设数量个音框;若否,则进入休眠状态;分阶段对所述声音信号进行声音侦测;若通过第k阶段的声音侦测,则进行第k+1阶段的声音侦测;若未通过第k或k+1阶段的声音侦测,则进入休眠状态。本申请可以在采集到的声音信号不满足相应侦测条件时,进入休眠状态以降低耗电量,同时可以降低运行负荷和发热量,从而提高寿命。
Description
技术领域
本申请属于声音侦测技术领域,尤其涉及一种声音侦测方法、装置、设备及存储介质。
背景技术
现有的声音侦测设备出于方便安装、美观及成本等考量,通常是通过电池来供电,然而,电池的容量是有限的,在声音侦测设备持续长时间开启的情况下,容易导致电池电量耗尽而使得声音侦测设备停机,也会由于持续长时间满负荷运行和发热而使得声音侦测设备的寿命降低。
发明内容
本申请实施例提供了一种声音侦测方法、装置、设备及存储介质,以解决现有的声音侦测设备持续长时间开启,容易导致电池电量耗尽而使得声音侦测设备停机,也会由于持续长时间满负荷运行和发热而使得声音侦测设备的寿命降低的问题。
本申请实施例的第一方面提供一种声音侦测方法,包括:
若休眠时长达到第一时长,进入唤醒状态并开始采集声音信号直到唤醒时长达到第二时长,所述第二时长小于所述第一时长;
确定所述声音信号的特性参数是否大于相应阈值;若是,则继续采集声音信号直到满预设数量个音框;若否,则进入休眠状态;其中,所述特性参数包括振幅或能量;
分阶段对所述声音信号进行声音侦测;若通过第k阶段的声音侦测,则进行第k+1阶段的声音侦测;若未通过第k或k+1阶段的声音侦测,则进入休眠状态;其中,k=1,2,…,K,K为正整数。
本申请实施例的第二方面提供一种声音侦测装置,包括:
唤醒单元,用于若休眠时长达到第一时长,进入唤醒状态并开始采集声音信号直到唤醒时长达到第二时长,所述第二时长小于所述第一时长;
第一侦测单元,用于确定所述声音信号的特性参数是否大于相应阈值;若是,则继续采集声音信号直到满预设数量个音框;若否,则进入休眠状态;其中,所述特性参数包括振幅或能量;
第二侦测单元,用于分阶段对所述声音信号进行声音侦测;若通过第k阶段的声音侦测,则进行第k+1阶段的声音侦测;若未通过第k或k+1阶段的声音侦测,则进入休眠状态;其中,k=1,2,…,K,K为正整数。
本申请实施例的第三方面提供一种声音侦测设备,包括声音采集模块、通信模块、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述声音采集模块、所述通信模块和所述存储器分别与所述处理器连接,所述处理器执行所述计算机程序时实现如本申请实施例的第一方面所述声音侦测方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本申请实施例的第一方面所述声音侦测方法的步骤。
本申请实施例的第一方面提供的声音侦测方法,通过周期性唤醒声音侦测设备,然后先根据采集的第二时长的声音信号确定其特性参数是否大于相应阈值,若否则再度进入休眠状态,若是则继续采集声音信号直到满预设数量个音框并分阶段进行声音侦测,在每一阶段,若通过该阶段的声音侦测,则进行下一阶段的声音侦测,否则再度进入休眠状态,如此可以在采集到的声音信号不满足相应侦测条件时,进入休眠状态以降低耗电量,同时可以降低运行负荷和发热量,从而提高寿命。
可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的声音侦测方法的第一种流程示意图;
图2是本申请实施例提供的声音侦测方法的第二种流程示意图;
图3是本申请实施例提供的声音侦测方法的第三种流程示意图;
图4是本申请实施例提供的声音侦测方法的第四种流程示意图;
图5是本申请实施例提供的声音侦测方法的第五种流程示意图;
图6是本申请实施例提供的声音侦测方法的第六种流程示意图;
图7是本申请实施例提供的T3警报声音信号的正负周期时序的示意图;
图8是本申请实施例提供的T4警报声音信号的正负周期时序的示意图;
图9是本申请实施例提供的声音侦测方法的第七种流程示意图;
图10是本申请实施例提供的声音侦测装置的结构示意图;
图11是本申请实施例提供的声音侦测设备的第一种结构示意图;
图12是本申请实施例提供的声音侦测设备的第二种结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供一种声音侦测方法,可以由声音侦测设备的处理器在运行相应的计算机程序时执行,用于侦测环境中的声音信号,并在侦测到与预设声音信号的特性类似或相同的声音信号时,向客户端发送警报信号,以及时通知客户端的用户。预设声音信号可以是警报器发出的警报声音信号,也可以是需要被侦测的特定物体发出的声音信号,例如,车辆发出的鸣笛信号、珍稀动物发出的叫声信号、地震波形成的地声(EarthquakeSound)信号等。警报器可以包括但不限于烟雾警报器、一氧化碳警报器、防盗警报器等各种可以发出警报声音信号的警报器。客户端可以是手机、智能环(智能手环、智能颈环等)、平板电脑、笔记本电脑、上网本、数字助理(Digital Assistant,DA)、超级移动个人计算机(Ultra-Mobile Personal Computer,UMPC)、服务器等可供个人用户或相关救援单位使用的计算设备。
如图1所示,本申请实施例提供的声音侦测方法,包括如下步骤S101至S108:
步骤S101、进入休眠状态并重置特性参数,进入步骤S102;
步骤S102、若休眠时长达到第一时长,进入唤醒状态并开始采集声音信号直到唤醒时长达到第二时长,进入步骤S103;
步骤S103、确定所述声音信号的特性参数是否大于相应阈值;若是,则进入步骤S104;若否,则进入步骤S101;
步骤S104、继续采集声音信号直到满预设数量个音框,进入步骤S105;
步骤S105、对声音信号进行第k阶段的声音侦测;若通过第k阶段的声音侦测,则进入步骤S106;若未通过第k阶段的声音侦测,则进入步骤S101;
步骤S106、对声音信号进行第k+1阶段的声音侦测;若通过第k+1阶段的声音侦测,则进入步骤S107;若未通过第k+1阶段的声音侦测,则进入步骤S101;
步骤S107、确定所述声音信号是否为预设声音信号;若是,则进入步骤S108;若否,则进入步骤S101;
步骤S108、发出警报信号,进入步骤S101。
在应用中,声音侦测设备具有周期性唤醒功能,每次进入休眠状态之后,开始记录进入休眠状态的持续时长,在休眠时长达到第一时长时进入唤醒状态,开始记录进入唤醒状态的持续时长并开始采集声音信号,在唤醒时长达到第二时长时,确定采集到的第二时长的声音信号(少量声音信号)的振幅或能量等特性参数是否大于相应阈值,若否,则再度进入休眠状态,若是,则继续采集声音信号直到满预设数量个音框(Frame)并分阶段进行声音侦测,针对每一阶段(也即第k阶段)的声音侦测,若通过该阶段的声音侦测,则继续进行下一阶段(也即第k+1阶段)的声音侦测,若未通过该阶段的声音,则再度进入休眠状态,在通过所有阶段的声音侦测之后,再根据各阶段的声音侦测结果确定采集到的声音信号是否为预设声音信号。
在应用中,k=1,2,…,K,K为正整数,也即K为大于或等于1的整数,所有声音侦测阶段包括至少两个阶段。第一时长、第二时长、预设数量和K的取值可以根据实际需要进行设置,例如,第一时长为50毫秒(ms)、第二时长为0.5ms,预设数量为1,K为3。第一时长应当大于第二时长,以使得声音侦测设备的休眠时间大于初始唤醒时间(也即第二时长),从而使得在初始唤醒时间内仅需先采集少量的声音信号,并根据少量的声音信号的特性参数来初步判断采集到的声音信号是否与预设声音信号的特性类似或相同,若否(也即第二时长的声音信号的特性参数小于或等于相应阈值),则再次进入休眠状态,如此,通过短暂唤醒并采集少量的声音信号进行初步判断,可以有效降低耗电量,避免一开始就长时间唤醒并采集到较多不符合特性参数阈值的声音信号,浪费电能。在初始唤醒时间内采集的声音信号的特性参数大于相应阈值之后,再继续保持唤醒状态并采集较多的声音信号(也即满预设数量个音框的声音信号),预设数量应当大于或等于1,以使得用于进行分阶段侦测的声音信号至少包含一个音框,从而使得用于进行分阶段侦测的声音信号具有足够的数据量,以提高侦测结果的准确性,在通过第一阶段的声音侦测之后,继续保持唤醒状态并采集声音信号,以进行第二阶段的声音侦测,在通过第二阶段的声音侦测之后,继续保持唤醒状态并采集声音信号,以进行第三阶段的声音侦测,依此类推,直到通过所有阶段的声音侦测。
在应用中,正常情况下,若环境中不存在需要侦测的预设声音信号,声音侦测设备侦测到的声音信号在时域或频域特性上体现为平缓变化,也即在时域或频域上的振幅或能量应当较低,若环境中存在需要侦测的预设声音信号,声音侦测设备侦测到的声音信号在时域或频域特性上体现为具有较大的波动变化,也即在时域或频域上的振幅或能量应当较高,因此,通过初步确定采集的声音信号的振幅或能量是否大于相应阈值,可以初步确定是否侦测到预设声音信号。
在应用中,声音侦测设备可以通过任意有线或无线通信方式与客户端进行通信,以向客户端发送警报信号。警报信号可以以客户端的人机交互器件所支持的人机交互方式告知用户。客户端的人机交互器件可以包括显示器、语音播放器件(例如,扬声器)、LED灯中的至少一种,使得客户端可以通过对应的显示方式、语音播报方式、声音提示或灯光提示方式,将警报信号告知用户。
如图2所示,在一个实施例中,所述特性参数包括时域峰值振幅,步骤S103之前,包括如下步骤S201和S202:
步骤S201、对所述声音信号的数位信号进行时域转换,获得所述声音信号的时域波形图;
步骤S202、根据所述时域波形图,获取所述声音信号的时域峰值振幅。
如图2所示,在一个实施例中,所述特性参数包括时域能量,步骤S103之前,包括如下步骤S201、S203和S204:
步骤S201、对所述声音信号的数位信号进行时域转换,获得所述声音信号的时域波形图;
步骤S203、根据所述时域波形图,获取所述声音信号的所有时域振幅;
步骤S204、根据所述所有时域振幅,获取所述声音信号的时域能量。
在一个实施例中,所述时域能量的计算公式为:
其中,E表示所述时域能量,A表示所述所有时域振幅的数量,S(a)表示所述时域波形图的第a个时域振幅,a=1,2,…,A,A≥2且A为整数。
在应用中,时域波形图是以时间为横坐标、振幅为纵坐标,用于反应数位信号的振幅随时间变化的情况的图形。声音信号在时域上的特性参数也可以等效替换为频域上的特性参数,二者的获得方法类似,只需将时域等效替换为频域即可,此处不再赘述。
在一个实施例中,分阶段对所述声音信号进行声音侦测的操作包括:
在第一阶段对所述声音信号进行连续相同的频率侦测;
在后续阶段对所述声音信号进行周期侦测。
在应用中,需要侦测的预设声音信号是以固定发声方式发出的具有周期性的连续声音信号,因此,侦测所有峰值振幅的频率中是否存在连续相同的频率,是判断采集到的声音信号是否为预设声音信号的条件之一,侦测声音信号的周期,是判断采集到的声音信号是否为预设声音信号的条件之二。
如图3所示,在一个实施例中,分阶段对所述声音信号进行声音侦测的操作具体包括如下步骤S301至S307:
步骤S301、对所述声音信号的数位信号进行第一预设时间长度的音框撷取,获得所述声音信号的每个音框;
步骤S302、对每个所述音框进行频域转换,获得每个所述音框的频域波形图。
在应用中,在获取到满预设数量个音框的声音信号之后,首先,通过处理器采用窗函数(window function)对数位信号进行第一预设时间长度的音框截取,将声音信号撷取为若干第一预设时间长度的音框,以减少频谱上的失真,获得声音信号的每个音框;然后,分别对每个音框进行频谱转换,获得每个音框的频域波形图(Amplitude FrequencySpectrum Map)。窗函数可以是汉明窗(Hamming Window)、费杰窗(Fejer Window)、汉宁窗(Hanning Window)、高斯窗(Gaussian Window)等。可以采用傅里叶变换(FourierTransformation,FT)对音框进行频谱转换,傅里叶变换可以是快速傅里叶变换(FastFourier Transformation,FFT)。第一预设时间长度可以根据实际需要进行设置,例如,32ms。频域波形图是以频率为横坐标、振幅为纵坐标,用于反应每个音框的振幅随频率变化的情况的图形。
在一个实施例中,步骤S201和S301之前,都包括如下步骤:
将所述声音信号转换为电流信号;
对所述电流信号进行放大;
对放大后的所述电流信号进行滤波处理,获得类比信号;
对所述类比信号进行类比数位转换,获得数位信号;
步骤S301之后,包括如下步骤:
对每个所述音框进行降噪处理。
在应用中,首先,通过收音单元将采集到的声音信号转换为电流信号;然后,通过预设灵敏度的放大器对电流信号进行放大,预设灵敏度可以根据实际需要事先设置;再然后,通过滤波器对放大后的电流信号进行滤波处理,获得类比信号(Analog Signal),滤波处理包括调整频谱响应(Frequency Spectrum Response)、声音加强、均衡化(Equalization)处理、滤除杂波等;再然后,通过预设采样频率和预设位元数的类比数位转换器(Analog to Digital Converter,ADC))对类比信号进行数位转换,获得数位信号(Digital Signal),预设采样频率和预设位元数可以根据实际需要设置;最后,通过数位滤波器或处理器对每个音框进行降噪处理,以降低不需要侦测的频段的频谱响应或滤除杂波。
步骤S303、获取每个所述音框的频域波形图的频域峰值振幅的频率。
在应用中,音框的峰值振幅的频率,即为该音框的频域波形图中最大振幅对应的频率。频域波形图的分辨率fr由预设采样频率FS和傅里叶变换的长度N决定,fr=Fs/N,每个频谱信号的振幅可以表示为Xf(n),n=0,1,2,…,N-1,每个频谱信号所在的频率位置fp=n*Fs/N=n*fr。
如图4所示,在一个实施例中,步骤S303包括如下步骤S401至S403:
S401、获取每个所述音框的频域波形图的所有振幅;
S402、根据每个所述音框的频域波形图的所有振幅,确定每个所述音框的频域波形图的峰值振幅;
S403、根据每个所述音框的频域波形图的峰值振幅,获取每个所述音框的频域波形图的峰值振幅的频率。
在应用中,针对任一音框,获取其频域波形图的峰值振幅的频率的方法为:首先,获取该音框的频域波形图中的所有振幅;然后,从所有振幅中确定峰值振幅;最后,获取峰值振幅对应的频率。
在一个实施例中,步骤S402包括:
比较每个所述音框的频域波形图的第n个振幅与第n-1个振幅、第n-2个振幅的2倍、第n-3个振幅的3倍、第n+1个振幅、第n+2个振幅的2倍及第n+3个振幅的3倍的大小;其中,n=0,1,2,…,N-1,N为每个所述音框的频域波形图的所有振幅的个数;
将每个所述音框的频域波形图中大于第i-1个振幅、第i-2个振幅的2倍、第i-3个振幅的3倍、第i+1个振幅、第i+2个振幅的2倍及第i+3个振幅的3倍的第i个振幅,确定为每个所述音框的频域波形图的峰值振幅;其中,i∈[0,N-1]。
在应用中,针对任一音框,若其频域波形图中的某一振幅分别大于在该振幅之前的三个振幅的3倍、2倍和1倍且大于在该振幅之后的三个振幅的1倍、2倍和3倍,则认为该振幅是峰值振幅。也即,针对每一振幅Xf(n),比较Xf(n)与Xf(n-3)*3、Xf(n-2)*2、Xf(n-1)以及Xf(n+1)、Xf(n+2)*2、Xf(n+3)*3的大小,当其中某一振幅Xf(i)大于Xf(i-3)*3、Xf(i-2)*2、Xf(i-1)以及Xf(i+1)、Xf(i+2)*2、Xf(i+3)*3时,确定振幅Xf(i)的为峰值振幅。然后根据i和频域波形图的分辨率fr计算峰值振幅对应的频率fpmax,fpmax=i*fr。
步骤S304、侦测所有所述峰值振幅的频率中是否存在连续相同的频率。
如图5所示,在一个实施例中,步骤S304包括如下步骤S501至S503:
S501、比较所有所述音框中第m个音框与第m-1和m-2个音框的频域波形图的峰值振幅的频率的大小;其中,m=1,2,…,M,M为所有所述音框的个数;
S502、当所有所述音框中第j个音框与第j-1或j-2个音框的频域波形图的峰值振幅的频率之差在预设频率差值范围内时,确定侦测到连续相同的频率;其中,j∈[1,M];
S503、当所有所述音框中第j个音框与第j-1和j-2个音框的频域波形图的峰值振幅的频率之差都不在预设频率差值范围内时,确定未侦测到连续相同的频率。
在应用中,侦测所有峰值振幅的频率中是否存在连续相同的频率的方法为:针对任一音框m,分别比较该音框m与在其之前的音框m-1和音框m-2(音框m与音框m-2之间间隔音框m-1)的频域波形图的峰值振幅的频率的大小;当其中某一音框j与在其之前的音框j-1或音框j-2(音框j与音框j-2之间间隔音框j-1)的频域波形图的峰值振幅的频率之差在预设频率差值范围内时,确定侦测到连续相同的频率;当其中某一音框j与在其之前的音框j-1和音框j-2的频域波形图的峰值振幅的频率之差都不在预设频率差值范围内时,确定未侦测到连续相同的频率。预设频率差值范围可以根据实际需要进行设置,例如,预设频率差值范围可以是-fr~+fr,fr为频域波形图的分辨率。
步骤S305、若所有所述峰值振幅的频率中存在连续相同的频率,确定所述声音信号通过第一阶段的连续相同的频率侦测;
步骤S306、若所有所述峰值振幅的频率中不存在连续相同的频率,确定所述声音信号未通过第一阶段的连续相同的频率侦测;
步骤S307、若所述声音信号通过第一阶段的连续相同的频率侦测,根据所有所述音框的频域波形图,进行后续阶段的周期侦测。
如图6所示,在一个实施例中,步骤S307包括如下步骤S601至S603:
步骤S601、当第一计数值等于1时,若相位变化周期数等于0且第二计数值大于或等于第二预设时间长度,确定侦测到所述声音信号的第一个正周期的起始时间;其中,所述第一计数值用于记录侦测到连续相同的频率的音框数,所述第二计数值用于记录未侦测到连续相同的频率的音框数,所述相位变化周期数用于记录所述声音信号的正周期和负周期发生变化的次数,第二预设时间长度等于未侦测到所述预设声音信号的时间长度或两个所述预设声音信号之间的间隔时间长度。
在应用中,第一计数值用于记录侦测到连续相同的频率的音框数。第二计数值用于记录未侦测到连续相同的频率的音框数。相位变化周期数用于记录声音信号的正负周期的时序变化。正负周期总时长用于记录正负周期发生变化的时间,正负周期总时长在数值上用音框数来表示、单位为第一预设时间长度。
在步骤S601之前,先将第一计数值SameMaxPeakPosCnt、第二计数值DiffMaxPeakPosCnt、相位变化周期数Alarm_Pattern_Phase、正负周期总时长Alarm_Pattern_Time[Alarm_Pattern_Phase]和撷取到的音框数FrameCnt这些待侦测参数的初值设置为0,也即,令
SameMaxPeakPosCnt=0;
DiffMaxPeakPosCn=0;
Alarm_Pattern_Phase=0;
Alarm_Pattern_Time[Alarm_Pattern_Phase]=0;
FrameCnt=0。
在应用中,设置初值的具体时机可以是在步骤S304之前的任意时刻,例如,步骤S101之前。
在应用中,当侦测到连续相同的频率时将第一计数值加1、将第二计数值重置为0,也即,令
SameMaxPeakPosCnt=SameMaxPeakPosCnt+1;
DiffMaxPeakPosCn=0;
当未侦测到连续相同的频率时,将第二计数值加1,也即,令
DiffMaxPeakPosCn=DiffMaxPeakPosCn+1;
当相位变化周期数大于0且撷取到音框时,将撷取到的音框数加1,也即,令
Alarm_Pattern_Time[Alarm_Pattern_Phase]=FrameCnt;
当相位变化周期数大于0时,正负周期总时间长度等于撷取到的音框数,也即,令
FrameCnt=FrameCnt+1。
在应用中,第一计数值等于1表明侦测到连续相同的频率的音框数等于1,此时若相位变化周期数等于0表明正负周期未发生变化、处于第一个周期的起始时间或第一个周期的起始时间之前,第二计数值大于或等于第二预设时间长度Td表明未侦测到连续相同的频率的音框数大于或等于两个预设声音信号之间的间隔时间长度或未侦测到预设声音信号的时间长度对应的音框数。当同时满足第一计数值等于1、相位变化周期数等于0且第二计数值大于或等于第二预设时间长度这三个条件时,可以确定侦测到声音信号的第一个正周期的起始时间。也即当SameMaxPeakPosCnt=1、Alarm_Pattern_Phase=1且DiffMaxPeakPosCn≥Td时,令
Alarm_Pattern_Time[0]=0;
Alarm_Pattern_Phase=1;
FrameCnt=1;
Alarm_Pattern_Time[1]=1。
在应用中,第二预设时间长度Td在数值上等于两个预设声音信号之间的间隔时间长度或未侦测到预设声音信号的时间长度对应的音框数、单位为第一预设时间长度,第二预设时间长度Td可以根据预设声音信号的类型来确定,例如,Td=32(Frames),第一预设时间长度为30ms,Td=32*30ms≈1s(秒)。
步骤S602、当第一计数值等于1时,若相位变化周期数大于或等于1且第二计数值大于或等于第三预设时间长度,确定侦测到所述声音信号的第k个正周期的起始时间;其中,第三预设时间长度等于所述预设声音信号的负周期的时间长度或所述预设声音信号的两个正周期的间隔时间长度,k为大于或等于2的整数。
在应用中,第一计数值等于1表明侦测到连续相同的频率的音框数等于1,此时若相位变化周期数大于或等于1表明相位至少发生一次变化、处于第二个周期的开始时间或第二个周期的开始时间之后,第二计数值大于或等于第三预设时间长度Tn表明未侦测到连续相同的频率的音框数大于或等于预设声音信号的负周期的时间长度或预设声音信号的两个正周期的间隔时间长度对应的音框数。当同时满足第一计数值等于1、相位变化周期数大于或等于1且第二计数值大于或等于第三预设时间长度这三个条件时,可以确定侦测到声音信号的第二个或第二个以后正周期的起始时间。也即,当SameMaxPeakPosCnt=1、Alarm_Pattern_Phase≥1且DiffMaxPeakPosCn≥Tn时,令
Alarm_Pattern_Time[Alarm_Pattern_Phase]=FrameCnt-1;
Alarm_Pattern_Phase=Alarm_Pattern_Phase+1;
Alarm_Pattern_Time[Alarm_Pattern_Phase]=FrameCnt。
在应用中,第三预设时间长度Tn在数值上等于预设声音信号的负周期的时间长度或预设声音信号的两个正周期的间隔时间长度对应的音框数、单位为第一预设时间长度。第三预设时间长度Tn可以根据预设声音信号的类型来确定,例如,负周期的时间长度为0.5s时,Tn=15(Frames),当第一预设时间长度为30ms时,Tn=15*30ms≈0.5s;在实际声音侦测环境下,受空间回音的影响,侦测到的负周期的时间长度会小于0.5s,因此,可以设置Tn=5(Frames),当第一预设时间长度为30ms时,Tn=5*30ms=0.15s;当负周期的时间长度为0.1s时,也可以设置Tn=1(Frames),当第一预设时间长度为30ms时,Tn=1*30ms=0.03s。
步骤S603、当未侦测到连续相同的频率时,若相位变化周期数大于0、第一计数值大于或等于第四预设时间长度且第二计数值大于或等于第三预设时间长度,确定侦测到所述声音信号的一个负周期的起始时间;其中,所述第四预设时间长度等于所述预设声音信号的正周期的时间长度。
在应用中,未侦测到连续相同的频率表明未侦测到声音信号的正周期,此时若相位变化周期数大于0表明相位发生变化、处于第二个周期的开始时间或第二个周期的开始时间之后,第一计数值大于或等于第四预设时间长度Tp表明侦测到连续相同的频率的音框数大于或等于预设声音信号的正周期的时间长度对应的音框数,第二计数值大于或等于第三预设时间长度Tn表明未侦测到连续相同的频率的音框数大于或等于预设声音信号的负周期的时间长度或预设声音信号的两个正周期的间隔时间长度对应的音框数。当同时满足第一计数值等于1、相位变化周期数大于或等于1且第二计数值大于或等于第三预设时间长度这三个条件时,可以确定侦测到声音信号的一个负周期的起始时间。也即,当Alarm_Pattern_Phase>0、SameMaxPeakPosCnt≥Tp且DiffMaxPeakPosCn≥Tn时,令
Alarm_Pattern_Time[Alarm_Pattern_Phase]=FrameCnt-Tn;
Alarm_Pattern_Phase=Alarm_Pattern_Phase+1;
SameMaxPeakPosCnt=0。
在应用中,第三预设时间长度Tn在数值上等于预设声音信号的负周期的时间长度或预设声音信号的两个正周期的间隔时间长度对应的音框数、单位为第一预设时间长度。第四预设时间长度Tp在数值上等于预设声音信号的正周期的时间长度对应的音框数、单位为第一预设时间长度。第三预设时间长度Tn和第四预设时间长度Tp可以根据预设声音信号的类型来确定,例如,正周期和负周期的时间长度都为0.5s时,Tp=Tn=15(Frames),当第一预设时间长度为30ms时,Tp=Tn=15*30ms≈0.5s;在实际声音侦测环境下,受空间回音的影响,侦测到的正周期和负周期的时间长度都会小于0.5s,因此,可以设置Tp=Tn=5(Frames),当第一预设时间长度为30ms时,TpTn=5*30ms=0.15s;当正周期和负周期的时间长度都为0.1s时,也可以设置Tp=3(Frames)、Tn=1(Frames),当第一预设时间长度为30ms时,Tp=3*30ms≈0.1s、Tn=1*30ms=0.03s。
如图7所示,示例性的示出了T3烟雾警报器标准下的T3警报声音信号的正负周期时序的示意图;其中,正周期的时间长度和负周期的时间长度均为0.5s,两个T3警报声音信号之间的时间间隔长度为1.5s。
如图8所示,示例性的示出了T4烟雾警报器标准下的T4警报声音信号的正负周期时序的示意图;其中,正周期的时间长度和负周期的时间长度均为0.1s,两个T4警报声音信号之间的时间间隔长度为5.1s。
在一个实施例中,步骤S107包括:
根据所述声音信号的周期,确定所述声音信号是否为预设声音信号。
在应用中,在确定声音信号的周期之后,即可将声音信号的周期特征与预设声音信号的周期特征进行比对,若二者的周期特征相匹配,则可确定声音信号为预设声音信号。周期特征可包括但不限于正负周期总时长、相位变化周期数、正负周期时序、正周期的时间长度、负周期的时间长度等。
如图9所示,在一个实施例中,步骤S107包括如下步骤S901至S905:
步骤S901、当所述相位变化周期数大于0且所述第二计数值大于或等于第二预设时间长度时,确定正负周期总时长是否在预设时长范围内。
在应用中,相位变化周期数大于0且第二计数值大于或等于第二预设时间长度表明检测到至少一个正周期,此时,可以开始根据相位变化周期数和正负周期总时间长度判断待测声音信号是否为预设声音信号。首先,判断正负周期总时长是否在预设时长范围内,当正负周期总时长在预设时长范围内时,再进一步进行下一步判断,否则,返回初始侦测状态,将各待侦测参数的初值设置为0,重新开始侦测。预设时长范围可以根据预设声音信号的正负周期总时长进行设置,具体可以设置为与预设声音信号的正负周期总时长之间存在一定可容许的误差的时长范围,以T3警报声音信号为例,T3警报声音信号的正负周期总时长(第一个正周期的开始时间到第三个负周期的开始时间)为2.5s,预设时长范围可以设置为2s~3s;以T4警报声音信号为例,T4警报声音信号的正负周期总时长(第一个正周期的开始时间到第四个负周期的开始时间)为0.7s,预设时长范围可以设置为0.6~1s。
步骤S902、当所述正负周期总时长在预设时间范围内时,确定所述相位变化周期数是否在预设周期数范围内。
在应用中,当正负周期总时长在预设时间范围内时,进一步判断相位变化周期数是否在预设周期数范围内,当相位变化周期数在预设周期数范围内时,再进一步进行下一步判断,否则,返回初始侦测状态,将各待侦测参数的初值设置为0,重新开始侦测。预设周期数范围可以根据预设声音信号的相位变化周期数设置,具体可以设置为与预设声音信号的相位变化周期数之间存在一定可容许的误差的周期数范围,以T3警报声音信号为例,T3警报声音信号的相位变化周期数(第一个正周期的开始到第三个负周期结束)为6,预设周期数范围可以设置为6~10;以T4警报声音信号为例,T4警报声音信号的相位变化周期数(第一个正周期的开始到第四个负周期结束)为8,预设周期数范围可以设置为6~12。
步骤S903、当所述相位变化周期数在预设周期数范围内时,确定所述声音信号的正负周期时序是否在预设时序范围内;其中,所述正负周期时序包括正周期时序和负周期时序。
在应用中,当相位变化周期数在预设周期数范围内时,进一步判断声音信号的正负周期时序是否在预设时序范围内,当正负周期时序在预设时序范围内时,再进一步进行下一步判断,否则,返回初始侦测状态,将各待侦测参数的初值设置为0,重新开始侦测。预设时序范围可以根据预设声音信号的正负周期时序设置,具体可以设置为与预设声音信号的正负周期时序之间存在一定可容许的误差的时序范围,以T3警报声音信号为例,T3警报声音信号的两个正周期的开始时间或结束时间之间的间隔时间长度1s,预设时序范围可以设置为0.75s~1.25s;以T4警报声音信号为例,T4警报声音信号的两个正周期的开始时间或结束时间之间的间隔时间长度0.2s,预设时序范围可以设置为0.1s~0.3s。
步骤S904、当所述正负周期时序在预设时序范围内时,确定所述声音信号与所述预设声音信号的正负周期匹配数是否大于或等于预设匹配数;
步骤S905、当所述正负周期匹配数与预设匹配数之差在预设匹配数差值范围内时,确定所述声音信号为所述预设声音信号。
在应用中,当正负周期时序在预设时序范围内时,进一步判断声音信号与预设声音信号的正负周期匹配数是否大于或等于预设匹配数,当正负周期匹配数大于或等于预设匹配数时,确定声音信号为预设声音信号,否则,返回初始侦测状态,将各待侦测参数的初值设置为0,重新开始侦测。预设匹配数范围可以设置为2,也即,只要声音信号与预设声音信号的有至少两组周期相匹配,即可确定声音信号为预设声音信号,每组周期包括时序相邻的一个正周期和一个负周期。以T3警报声音信号为例,T3警报声音信号包括三组周期P1、P2和P3,只要待测声音信号与P1、P2和P3中的至少两组满足上述预设时序范围的要求,即可确定待测声音信号为T3警报声音信号;以T4警报声音信号为例,T4警报声音信号包括四组周期Q1、Q2、Q3和Q4,只要待测声音信号与Q1、Q2、Q3和Q4中的至少两组满足上述预设时序范围的要求,即可确定待测声音信号为T4警报声音信号。
在应用中,预设灵敏度、预设采样频率、预设位元数、预设频率差值范围、第一预设时间长度~第四预设时间长度、预设时长范围、预设周期数范围、预设时序范围、预设匹配数、预设声音信号等参数,可以由用户根据实际需要通过声音侦测设备或客户端的人机交互器件设置。人机交互器件可以包括实体按键、触控传感器、手势识别传感器和语音识别器件(例如,麦克风和语音处理芯片)中的至少一种,使得用户可以通过对应的触控方式、手势操控方式或语音控制方式设置各参数。
在应用中,特性参数包括对声音信号进行分析处理得到的与其特性相关的各种参数,例如,振幅、能量、频率以及周期等相关参数,在每次进入休眠状态之后,即恢复初始状态,将这些特性参数重置为0或初始值,并等到休眠时间达到第一时长之后重新进入下一个周期的唤醒和声音侦测。
本申请实施例提供的声音侦测方法,可以在采集到的声音信号不满足相应侦测条件时,进入休眠状态以降低耗电量,同时可以降低运行负荷和发热量,从而提高寿命,还可以与警报器进行通信及联动,能够在侦测到警报器发出警报声音信号时,及时通知远距离处的用户或相关救援单位进行紧急救援处理,可以有效防止灾害或降低灾害所造成的人生财产损失;还可以用于侦测车辆发出的鸣笛信号、珍稀动物发出的叫声信号、地震波形成的地声信号等,从而可以用于侦测车辆是否违规鸣笛或者是否有车辆靠近、用于侦测是否存在珍稀动物、用于侦测是否发生地震等。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本申请实施例还提供一种声音侦测装置,应用于声音侦测设备,声音侦测装置用于执行上述声音侦测方法实施例中的方法步骤。声音侦测装置可以是声音侦测设备中的虚拟装置(virtual appliance),由声音侦测设备的处理器运行,也可以是声音侦测设备本身。
如图10所示,本申请实施例提供的声音侦测装置100包括:
唤醒单元101,用于若休眠时长达到第一时长,进入唤醒状态并开始采集声音信号直到唤醒时长达到第二时长,所述第二时长小于所述第一时长;
第一侦测单元102,用于确定所述声音信号的特性参数是否大于相应阈值;若是,则继续采集声音信号直到满预设数量个音框;若否,则进入休眠状态;其中,所述特性参数包括振幅或能量;
第二侦测单元103,用于分阶段对所述声音信号进行声音侦测;若通过第k阶段的声音侦测,则进行第k+1阶段的声音侦测;若未通过第k或k+1阶段的声音侦测,则进入休眠状态;其中,k=1,2,…,K,K为正整数。
警报单元104,用于在通过所有阶段的声音侦测之后,根据声音侦测结果确定所述声音信号是否为预设声音信号;若是,则发出警报信号;若否,则进入休眠状态。
在一个实施例中,声音侦测装置还包括数据处理单元,用于:
对所述声音信号的数位信号进行时域转换,获得所述声音信号的时域波形图;
根据所述时域波形图,获取所述声音信号的时域峰值振幅。
根据所述时域波形图,获取所述声音信号的所有时域振幅;
根据所述所有时域振幅,获取所述声音信号的时域能量。
在一个实施例中,声音侦测装置还包括:
声音采集单元,用于将所述声音信号转换为电流信号;
放大单元,用于对所述电流信号进行放大;
滤波单元,用于对放大后的所述电流信号进行滤波处理,获得类比信号;
类比数位转换单元,用于对所述类比信号进行类比数位转换,获得数位信号;
降噪单元,用于对每个所述音框进行降噪处理。
在应用中,声音侦测装置中的各单元可以为软件程序单元,也可以通过处理器中集成的不同逻辑电路实现,还可以通过多个分布式处理器实现。例如,唤醒单元可以通过计时器(晶振)实现,第一侦测单元、第二侦测单元和数据处理单元音框撷取单元可以通过处理器实现,声音采集单元可以通过麦克风实现,放大单元可以通过放大器实现,滤波单元和降噪单元可以通过滤波器实现,类比数位转换单元可以通过类比数位转换器实现。
如图11所示,本申请实施例还提供一种声音侦测设备200,包括:至少一个处理器201(图11中仅示出一个处理器)、存储器202、存储在存储器202中并可在至少一个处理器201上运行的计算机程序203、声音采集模块204以及通信模块205,存储器202、声音采集模块204和通信模块205分别与至少一个处理器201通信连接,处理器201执行计算机程序203时实现上述各个声音侦测方法实施例中的步骤。
在应用中,声音侦测设备可包括,但不仅限于,处理器、存储器、声音采集模块以及通信模块等。本领域技术人员可以理解,图11仅仅是声音侦测设备的举例,并不构成对声音侦测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括人机交互器件、电源器件、输入输出设备、网络接入设备等。
在应用中,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在应用中,存储器在一些实施例中可以是声音侦测设备的内部存储单元,例如声音侦测设备的硬盘或内存。存储器在另一些实施例中也可以声音侦测设备的外部存储设备,例如,声音侦测设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器还可以既包括声音侦测设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(Boot Loader)、数据以及其他程序等,例如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
如图12所示,在一个实施例中,声音采集模块204包括依次连接的收音单元2041、放大器2042、滤波器2043和类比数位转换器2044,放大器2042、滤波器2043和类比数位转换器2044分别与处理器201连接。
在应用中,收音单元可以包括麦克风,放大器、滤波器和类比数位转换器可以集成设置为语音处理芯片或者与处理器集成于一体。
在应用中,通信模块可以根据实际需要设置为任意能够与客户端直接或间接进行远距离有线或无线通信的器件,例如,通信模块可以提供应用在网络设备上的包括无线局域网(Gireless Localarea Networks,WLAN)(如Wi-Fi网络),蓝牙,Zigbee,移动通信网络,全球导航卫星系统(Global Navigation Satellite System,GNSS),调频(FrequencyModulation,FM),近距离无线通信技术(Near Field Communication,NFC),红外技术(Infrared,IR)等通信的解决方案。通信模块可以是集成至少一个通信处理模块的一个或多个器件。通信模块可以包括天线,天线可以只有一个阵元,也可以是包括多个阵元的天线阵列。通信模块可以通过天线接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器。通信模块还可以从处理器接收待发送的信号,对其进行调频、放大,经天线转为电磁波辐射出去。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将所述装置的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个声音侦测方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在声音侦测设备上运行时,使得声音侦测设备可实现上述各个声音侦测方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到声音侦测设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种声音侦测方法,其特征在于,包括:
若休眠时长达到第一时长,进入唤醒状态并开始采集声音信号直到唤醒时长达到第二时长,所述第二时长小于所述第一时长;
确定所述声音信号的特性参数是否大于相应阈值;若是,则继续采集声音信号直到满预设数量个音框;若否,则进入休眠状态;其中,所述特性参数包括振幅或能量;
分阶段对所述声音信号进行声音侦测;若通过第k阶段的声音侦测,则进行第k+1阶段的声音侦测;若未通过第k或k+1阶段的声音侦测,则进入休眠状态;其中,k=1,2,…,K,K为正整数。
2.如权利要求1所述的声音侦测方法,其特征在于,所述确定所述声音信号的特性参数是否大于相应阈值之前,包括:
对所述声音信号的数位信号进行时域转换,获得所述声音信号的时域波形图;
根据所述时域波形图,获取所述声音信号的时域峰值振幅;
或者,根据所述时域波形图,获取所述声音信号的所有时域振幅;
根据所述所有时域振幅,获取所述声音信号的时域能量。
4.如权利要求1所述的声音侦测方法,其特征在于,所述分阶段对所述声音信号进行声音侦测,包括:
在第一阶段对所述声音信号进行连续相同的频率侦测;
在后续阶段对所述声音信号进行周期侦测。
5.如权利要求4所述的声音侦测方法,其特征在于,所述分阶段对所述声音信号进行声音侦测,包括:
对所述声音信号的数位信号进行第一预设时间长度的音框撷取,获得所述声音信号的每个音框;
对每个所述音框进行频域转换,获得每个所述音框的频域波形图;
获取每个所述音框的频域波形图的频域峰值振幅的频率;
侦测所有所述峰值振幅的频率中是否存在连续相同的频率;
若所有所述峰值振幅的频率中存在连续相同的频率,确定所述声音信号通过第一阶段的连续相同的频率侦测;
若所有所述峰值振幅的频率中不存在连续相同的频率,确定所述声音信号未通过第一阶段的连续相同的频率侦测;
若所述声音信号通过第一阶段的连续相同的频率侦测,根据所有所述音框的频域波形图,进行后续阶段的周期侦测。
6.如权利要求4或5所述的声音侦测方法,其特征在于,所述分阶段对所述声音信号进行声音侦测之后,包括:
根据所述声音信号的周期,确定所述声音信号是否为预设声音信号;若是,则发出警报信号;若否,则进入休眠状态。
7.如权利要求2或5所述的声音侦测方法,其特征在于,所述对所述声音信号的数位信号进行时域转换,获得所述声音信号的时域波形图之前,或者,所述对所述声音信号的数位信号进行第一预设时间长度的音框撷取,获得所述声音信号的每个音框之前,包括:
将所述声音信号转换为电流信号;
对所述电流信号进行放大;
对放大后的所述电流信号进行滤波处理,获得类比信号;
对所述类比信号进行类比数位转换,获得数位信号。
8.一种声音侦测装置,其特征在于,包括:
唤醒单元,用于若休眠时长达到第一时长,进入唤醒状态并开始采集声音信号直到唤醒时长达到第二时长,所述第二时长小于所述第一时长;
第一侦测单元,用于确定所述声音信号的特性参数是否大于相应阈值;若是,则继续采集声音信号直到满预设数量个音框;若否,则进入休眠状态;其中,所述特性参数包括振幅或能量;
第二侦测单元,用于分阶段对所述声音信号进行声音侦测;若通过第k阶段的声音侦测,则进行第k+1阶段的声音侦测;若未通过第k或k+1阶段的声音侦测,则进入休眠状态;其中,k=1,2,…,K,K为正整数。
9.一种声音侦测设备,其特征在于,包括声音采集模块、通信模块、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述声音采集模块、所述通信模块和所述存储器分别与所述处理器连接,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述声音侦测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述声音侦测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110558996.8A CN115376545A (zh) | 2021-05-21 | 2021-05-21 | 一种声音侦测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110558996.8A CN115376545A (zh) | 2021-05-21 | 2021-05-21 | 一种声音侦测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115376545A true CN115376545A (zh) | 2022-11-22 |
Family
ID=84059989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110558996.8A Pending CN115376545A (zh) | 2021-05-21 | 2021-05-21 | 一种声音侦测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115376545A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108877788A (zh) * | 2017-05-08 | 2018-11-23 | 瑞昱半导体股份有限公司 | 具有语音唤醒功能的电子装置及其操作方法 |
TWI643123B (zh) * | 2017-05-02 | 2018-12-01 | 瑞昱半導體股份有限公司 | 具有語音喚醒功能的電子裝置及其操作方法 |
CN109243497A (zh) * | 2018-11-02 | 2019-01-18 | 钟祥博谦信息科技有限公司 | 语音唤醒的控制方法及装置 |
CN110968353A (zh) * | 2019-12-06 | 2020-04-07 | 惠州Tcl移动通信有限公司 | 中央处理器的唤醒方法、装置、语音处理器以及用户设备 |
CN111369988A (zh) * | 2018-12-26 | 2020-07-03 | 华为终端有限公司 | 一种语音唤醒方法及电子设备 |
CN111880856A (zh) * | 2020-07-31 | 2020-11-03 | Oppo广东移动通信有限公司 | 语音唤醒方法、装置、电子设备及存储介质 |
-
2021
- 2021-05-21 CN CN202110558996.8A patent/CN115376545A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI643123B (zh) * | 2017-05-02 | 2018-12-01 | 瑞昱半導體股份有限公司 | 具有語音喚醒功能的電子裝置及其操作方法 |
CN108877788A (zh) * | 2017-05-08 | 2018-11-23 | 瑞昱半导体股份有限公司 | 具有语音唤醒功能的电子装置及其操作方法 |
CN109243497A (zh) * | 2018-11-02 | 2019-01-18 | 钟祥博谦信息科技有限公司 | 语音唤醒的控制方法及装置 |
CN111369988A (zh) * | 2018-12-26 | 2020-07-03 | 华为终端有限公司 | 一种语音唤醒方法及电子设备 |
CN110968353A (zh) * | 2019-12-06 | 2020-04-07 | 惠州Tcl移动通信有限公司 | 中央处理器的唤醒方法、装置、语音处理器以及用户设备 |
CN111880856A (zh) * | 2020-07-31 | 2020-11-03 | Oppo广东移动通信有限公司 | 语音唤醒方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104867495B (zh) | 声音辨识设备及其操作方法 | |
US9549273B2 (en) | Selective enabling of a component by a microphone circuit | |
CN107403621B (zh) | 语音唤醒装置及方法 | |
US10381021B2 (en) | Robust feature extraction using differential zero-crossing counts | |
US9785706B2 (en) | Acoustic sound signature detection based on sparse features | |
CN105869655B (zh) | 音频装置以及语音检测方法 | |
CN111510825B (zh) | 用于声分析的工作循环式麦克风/传感器 | |
US9443508B2 (en) | User programmable voice command recognition based on sparse features | |
US9460720B2 (en) | Powering-up AFE and microcontroller after comparing analog and truncated sounds | |
US9177546B2 (en) | Cloud based adaptive learning for distributed sensors | |
TW201618490A (zh) | 低功率聲音設備及操作方法 | |
CN103956164A (zh) | 一种声音唤醒方法及系统 | |
WO2014000605A1 (zh) | 触摸屏终端的报警方法及触摸屏终端 | |
Fourniol et al. | Low-power wake-up system based on frequency analysis for environmental internet of things | |
CN106611596A (zh) | 模拟信息特征提取的基于时间的频率调谐 | |
CN105094590A (zh) | 运动传感器 | |
Fourniol et al. | Analog ultra Low-Power acoustic Wake-Up system based on frequency detection | |
CN110933345A (zh) | 一种降低电视待机功耗的方法、电视机及存储介质 | |
CN115376545A (zh) | 一种声音侦测方法、装置、设备及存储介质 | |
CN112286068A (zh) | 一种基于微波唤醒的智能面板及智能面板唤醒方法 | |
CN114765032B (zh) | 一种声音侦测方法、装置及设备 | |
CN114765032A (zh) | 一种声音侦测方法、装置及设备 | |
CN112654960A (zh) | 人机语音交互装置及其操作方法 | |
CN210225432U (zh) | 通信设备 | |
CN114812789B (zh) | 一种声音侦测方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |