CN111583943A - 音频信号的处理方法、装置、安防摄像头及存储介质 - Google Patents

音频信号的处理方法、装置、安防摄像头及存储介质 Download PDF

Info

Publication number
CN111583943A
CN111583943A CN202010211970.1A CN202010211970A CN111583943A CN 111583943 A CN111583943 A CN 111583943A CN 202010211970 A CN202010211970 A CN 202010211970A CN 111583943 A CN111583943 A CN 111583943A
Authority
CN
China
Prior art keywords
array
processing
frequency point
audio
audio frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010211970.1A
Other languages
English (en)
Inventor
陈英博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TP Link Technologies Co Ltd
Original Assignee
TP Link Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TP Link Technologies Co Ltd filed Critical TP Link Technologies Co Ltd
Priority to CN202010211970.1A priority Critical patent/CN111583943A/zh
Publication of CN111583943A publication Critical patent/CN111583943A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/19Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及通信技术领域,公开了音频信号的处理方法、装置、安防摄像头及存储介质,该方法包括:将接收到的音频帧依次插入第一数组;当第一数组的音频帧的数量达到数量阈值时,根据第二数组,判断第一数组的音频帧的每一频点对应的处理数值是否为零;第二数组包含与每一频点对应的处理数值;当第一数组的音频帧的任一频点对应的处理数值为零时,从第一数组依次选取该频点构成第三数组;当第三数组中的频点的周期符合预设的条件时,将第二数组中该频点对应的处理数值更新为预设数值;在完成处理后,将第一数组的首个插入的音频帧发至终端设备,将下一个音频帧插入第一数组的末尾。本发明能够降低误检率,提高啸叫检测的准确度,保证音频的质量。

Description

音频信号的处理方法、装置、安防摄像头及存储介质
技术领域
本发明涉及通信技术领域,特别是涉及一种音频信号的处理方法、装置、安防摄像头及存储介质。
背景技术
随着物联网进程加快,作为家庭安防设备的安防摄像头正走进千家万户,并在我们的生活中扮演越来越重要的角色;而且,随着科学技术的发展,安防摄像头也越来越智能,它不仅仅是一个监控工具,还有手机查看、实时对讲、视频回放、移动侦测等功能。
目前,现有的安防摄像头可以将监控到的音频与画面实时传输给手机app(Application,应用程序),用户通过手机app便能对实际场景进行监控。然而,当用户开启手机app的扬声器,并在距离安防摄像头较近的地方观看安防摄像头的画面时,安防摄像头采集环境中的声音发送给手机app,手机app再将此声音通过扬声器播放出来,而扬声器播放的音频会重新被安防摄像头的麦克风采集到,如此循环往复,声音不断叠加,导致容易产生啸叫。
因此,对音频进行啸叫检测及抑制是避免产生啸叫的有效措施。目前,普遍采用频点响度探测的方式来进行啸叫检测。具体地,当检测到某个频点连续若干帧的频谱能量均达到一定值时,判定这个频点可能存在啸叫的现象。在判定该频点具有啸叫的现象后,将该频点的增益进行抑制,从而实现消除啸叫。但是,该方法难以区别啸叫声和其他声音,因此容易将非啸叫的频点误判为有啸叫的频点,误检率较高;而且,将非啸叫的频点误判为有啸叫的频点,并进行抑制处理后,必然会造成音频的失真,导致对原始音频造成损坏。
发明内容
本发明的目的是提供一种音频信号的处理方法、装置、安防摄像头及存储介质,能够降低误检率,提高啸叫检测的准确度,从而保证音频的质量。
为了解决上述技术问题,本发明提供一种音频信号的处理方法,包括:
当接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中;
当所述第一数组中的音频帧的数量达到预设的数量阈值时,根据预先配置的第二数组,判断所述第一数组中的音频帧的每一频点对应的处理数值是否为零;其中,所述第二数组包含有与每一频点一一对应的处理数值,所述处理数值用于指示后续接收到的音频帧的数量,并对该数量的音频帧对应的频点进行啸叫抑制处理,所述处理数值的初始值为零;
当判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一数组中依次选取每一音频帧的该频点,构成第三数组;
计算所述第三数组中的频点的周期;
当确定所述第三数组中的频点的周期符合预设的条件时,将所述第二数组中该频点对应的处理数值更新为预设数值;
在完成对所述第一数组中的音频帧的每一频点的处理后,将所述第一数组中的首个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所述第一数组的末尾。
作为优选方案,所述音频信号的处理方法,还包括:
当判定所述第一数组中的音频帧的任一频点对应的处理数值大于零时,将所述第二数组中该频点对应的处理数值减一;
对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理。
作为优选方案,所述计算所述第三数组中的频点的周期,具体包括:
根据所述第三数组中的每一频点,通过以下公式依次计算所述第三数组的自相关函数值,并由依次获得的所述自相关函数值构成第四数组:
Figure BDA0002423136830000031
其中,k为时间偏移量,
Figure BDA0002423136830000032
T为所述第三数组的长度;R[k]为当时间偏移量为k时,所述第三数组的自相关函数值;x[i]为所述第三数组中的第i个频点;
以所述第四数组中数值最大的自相关函数值的位置的下标,作为所述第三数组中的频点的周期。
作为优选方案,所述音频信号的处理方法,还包括:
根据所述第三数组中的每一频点,计算所述第三数组的均值;
所述预设的条件为同时满足:
所述第三数组中的频点的周期处于预设的数值范围,且所述第三数组中的频点的周期与所述第三数组的均值之比大于预设的比值。
作为优选方案,所述对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理,具体包括:
通过以下公式,对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理:
F[f]new=F[f]old*a
其中,F[f]new为处理后的所述第一数组中的末尾的音频帧的该频点;F[f]old为处理前的所述第一数组中的末尾的音频帧的该频点;a为预设的衰减值,0≤a<1。
作为优选方案,所述当接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中,具体包括:
当接收到所述音频信号时,将循环接收到的多个频点组成一个音频帧;
对每一所述音频帧进行傅里叶变换,获得每一所述音频帧的频域信号;
按照音频帧的接收顺序,将每一所述音频帧的频域信号依次插入所述第一数组中。
作为优选方案,所述在完成对所述第一数组中的音频帧的每一频点的处理后,将所述第一数组中的首个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所述第一数组的末尾,具体包括:
在完成对所述第一数组中的音频帧的每一频点的处理后,对所述第一数组中的首个插入的音频帧进行逆傅里叶变换,获得所述首个插入的音频帧的时域信号;
将所述首个插入的音频帧的时域信号发送至所述终端设备;
在发送之后,将接收到的下一个音频帧的频域信号插入所述第一数组的末尾。
为了解决相同的技术问题,相应地,本发明实施例还提供一种音频信号的处理装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述的音频信号的处理方法。
为了解决相同的技术问题,本发明实施例还提供一种安防摄像头,包括上述的音频信号的处理装置。
为了解决相同的技术问题,本发明实施例还提供一种计算机可读存储介质,所述存储介质上存储有程序,当所述程序运行时,实现上述的音频信号的处理方法。
与现有技术相比,本发明提供一种音频信号的处理方法、装置、安防摄像头及存储介质,通过在接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中,并在判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一数组中依次选取每一音频帧的该频点构成所述第三数组,以使在确定所述第三数组中的频点的周期符合预设的条件时,将所述第二数组中该频点对应的处理数值更新为预设数值,以指示在后续接收到的预设数值个音频帧中,对该频点进行啸叫抑制处理,从而实现了有效的啸叫检测及抑制处理,降低了误检率,进而提高了啸叫检测的准确度,减少了误检导致对非啸叫的频点进行抑制处理而造成音频失真的问题,因此保证了音频的质量。
附图说明
图1是本发明实施例提供的一种音频信号的处理方法的流程示意图;
图2是本发明实施例提供的另一种音频信号的处理方法的流程示意图;
图3是本发明实施例提供的音频信号的处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例提供的音频信号的处理方法的流程示意图。
在本发明实施例中,所述音频信号的处理方法,适用于安防摄像头,包括以下步骤S11-S16:
S11、当接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中。
具体地,当接收到音频信号时,根据所述音频帧的接收顺序,依次将所述音频帧的频谱插入所述第一数组中。
可以理解的,预先配置有一个空的第一数组Track[][],用于存储接收到的每一音频帧的频谱。其中,所述第一数组为二维数组;所述第一数组的具体设置可以根据实际使用情况设置;优选地,所述第一数组存储过去t秒内的每一音频帧的频谱。令t秒内一共有T个音频帧,则所述第一数组的列数为T,行数为N/2+1,即所述第一数组中的每一列存储一个音频帧的频谱,每一行为每一音频帧的同一频点;其中,T为正整数,N为二的对数,如256或128。t可以根据实际使用情况设置;优选地,本实施例中t为2-3秒。
S12、当所述第一数组中的音频帧的数量达到预设的数量阈值时,根据预先配置的第二数组,判断所述第一数组中的音频帧的每一频点对应的处理数值是否为零;其中,所述第二数组包含有与每一频点一一对应的处理数值,所述处理数值用于指示后续接收到的音频帧的数量,并对该数量的音频帧对应的频点进行啸叫抑制处理,所述处理数值的初始值为零。
需要说明的是,预先配置有一个第二数组Handle[],用于记录每个频点是否需要进行啸叫抑制处理,以及在接下来还有多少个音频帧需要对这个频点进行啸叫抑制处理。其中,所述第二数组为一维数组;所述第二数组中的元素即为所述处理数值,所述处理数值的初始值均为零。可以理解的,在所述第二数组Handle[]中,当Handle[i]=0时,即第i个频点对应的处理数值为零,表明不对该频点进行啸叫抑制处理;当Handle[i]=m,m>0时,即第i个频点对应的处理数值大于零,表示该频点在接下来的m个音频帧内需要进行啸叫抑制处理。另外,当所述第一数组的列数为T,行数为N/2+1时,相应地,所述第二数组的长度为N/2+1。
在具体实施时,当所述第一数组的列数为T,行数为N/2+1时,当插入所述第一数组中的音频帧的数量达到T个时,根据所述第二数组,针对所述第一数组中的每一行,判断每一频点对应的处理数值是否为零。
S13、当判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一数组中依次选取每一音频帧的该频点,构成第三数组。
具体地,当判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,表明目前还未获知该频点是否存在啸叫,因此,按照所述第一数组中的每一音频帧的排序,依次获取所述第一数组中的每一音频帧的该频点,构成所述第三数组,以进行啸叫检测。可以理解的,针对所述第一数组中的第f行,若Handle[f]=0,则获取所述第一数组中的第f行作为所述第三数组。
S14、计算所述第三数组中的频点的周期。
需要说明的是,啸叫是由共振而产生的,因此当啸叫产生时,会以一定的周期发声;基于此,可以通过检测这种周期性的声音来识别该频点是否产生了啸叫。本实施例通过计算所述第三数组中的频点的周期,以识别该频点是否存在啸叫,有效地避免了啸叫声与其他声音的混淆,因此降低了误检率。
S15、当确定所述第三数组中的频点的周期符合预设的条件时,将所述第二数组中该频点对应的处理数值更新为预设数值。
具体地,当确定所述第三数组中的频点的周期符合预设的条件时,表明该频点存在啸叫的现象,因此,将所述第二数组中的该频点对应的处理数值更新为预设数值,表示在接下来的所述预设数值个音频帧的范围内,都要对这个频点进行啸叫抑制处理。其中,所述预设数值可以根据实际使用情况设置,本发明对此不做限制。
S16、在完成对所述第一数组中的音频帧的每一频点的处理后,将所述第一数组中的首个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所述第一数组的末尾。
具体地,在判断完所述第一数组中的音频帧的每一频点对应的处理数值是否为零,并进行相应的处理后,将所述第一数组中的首个插入的音频帧发送至终端设备,以使所述终端设备进行播放;并将接收到的下一个音频帧以末尾增加的方式插入所述第一数组中。可以理解的,当将所述第一数组中的首个插入的音频帧发送后,所述第一数组中的音频帧的数量已少于预设的数量阈值,而当将接收到的下一个音频帧插入所述第一数组后,所述第一数组中的音频帧的数量再次达到预设的数量阈值,因此,返回步骤S12。
其中,所述将所述第一数组中的首个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所述第一数组的末尾,具体表现为:
将所述第一数组中第1列的音频帧丢弃,以将其发送至所述终端设备,并将所述第一数组中第2-T列的音频帧放置在第1-T-1列,然后将接收到的下一个音频帧的频谱放在第T列中。
此外,需要说明的是,当后续未接收到音频信号时,则停止执行上述步骤。
在本发明实施例中,通过在接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中,并在判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一数组中依次选取每一音频帧的该频点构成所述第三数组,以使在确定所述第三数组中的频点的周期符合预设的条件时,将所述第二数组中该频点对应的处理数值更新为预设数值,以指示在后续接收到的预设数值个音频帧中,对该频点进行啸叫抑制处理,从而实现了有效地啸叫检测及抑制处理,避免了采用频点响度探测的方式进行啸叫检测而导致误检率较高的问题,降低了误检率,进而提高了啸叫检测的准确度,减少了误检导致对非啸叫的频点进行抑制处理而造成音频失真的问题,因此保证了音频的质量。
在一种优选实施方式中,所述步骤S14,计算所述第三数组中的频点的周期,具体包括以下步骤S141-S142:
S141、根据所述第三数组中的每一频点,通过以下公式依次计算所述第三数组的自相关函数值,并由依次获得的所述自相关函数值构成第四数组:
Figure BDA0002423136830000081
其中,k为时间偏移量,
Figure BDA0002423136830000082
T为所述第三数组的长度;R[k]为当时间偏移量为k时,所述第三数组的自相关函数值;x[i]为所述第三数组中的第i个频点;x[i+k]为所述第三数组中的第i+k个频点;
S142、以所述第四数组中数值最大的自相关函数值的位置的下标,作为所述第三数组中的频点的周期。
需要说明的是,在步骤S141中,通过上述自相关函数的公式依次计算获得T/2个自相关函数值,按照计算的顺序,将获得的所述自相关函数值组成所述第四数组。在步骤S142中,从所述第四数组中找到数值最大的自相关函数值,以获得所述数值最大的自相关函数值对应的所述第四数组的下标,即所述数值最大的自相关函数值在所述第四数组中的位置的序号,作为所述第三数组中的频点的周期。
进一步地,所述音频信号的处理方法,还包括:
根据所述第三数组中的每一频点,计算所述第三数组的均值。
可以理解的,所述第三数组的均值即为所述第三数组中的频点的平均值。
进而,在步骤S15中,所述预设的条件为同时满足:
所述第三数组中的频点的周期处于预设的数值范围,且所述第三数组中的频点的周期与所述第三数组的均值之比大于预设的比值。
可以理解的,当所述第四数组中数值最大的自相关函数值的位置的下标满足:klo≤kmax≤khi,且kmax/Avg>M时,确定所述第三数组中的该频点存在啸叫的现象;其中,[klo,khi]为所述预设的数值范围,kmax为所述第四数组中数值最大的自相关函数值的位置的下标,即所述第三数组中的频点的周期,Avg为所述第三数组的均值,M为所述预设的比值。
此外,在本发明实施例中,在实施步骤S14后,当确定所述第三数组中的频点的周期不符合预设的条件时,表明该频点不存在啸叫的现象,因此,保持所述第二数组中该频点对应的处理数值不变,且无需对该频点进行啸叫抑制处理。
如图2所示,在一种优选实施方式中,所述音频信号的处理方法,还包括以下步骤S13’-S14’:
S13’、当判定所述第一数组中的音频帧的任一频点对应的处理数值大于零时,将所述第二数组中该频点对应的处理数值减一;
S14’、对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理。
具体地,在实施步骤S12后,当判定所述第一数组中的音频帧的任一频点对应的处理数值大于零时,表明该频点已经被检测到存在啸叫的现象,因此,将所述第二数组中该频点对应的处理数值减一,以更新所述第二数组中该频点对应的处理数值。可以理解的,针对所述第一数组中的第f行,若Handle[f]>0,则另Handle[f]new=Handle[f]old-1,其中,Handle[f]new为更新后的该频点对应的处理数值,Handle[f]old为更新前的该频点对应的处理数值。
进一步地,所述步骤S14’对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理,具体包括:
通过以下公式,对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理:
F[f]new=F[f]old*a
其中,F[f]new为处理后的所述第一数组中的末尾的音频帧的该频点;F[f]old为处理前的所述第一数组中的末尾的音频帧的该频点;a为预设的衰减值,0≤a<1。
在本发明实施例中,所述对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理,即将所述第一数组中的末尾的音频帧的该频点乘上一个固定的经验衰减值,从而实现减益处理。
此外,需要说明的是,本发明实施例在判定所述第一数组中的音频帧的任一频点对应的处理数值大于零时,可以先对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理,再将所述第二数组中该频点对应的处理数值减一,当然也可以同时执行将所述第二数组中该频点对应的处理数值减一,以及对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理,本发明对此顺序不做限制。
在一种优选实施方式中,所述步骤S11,当接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中,具体包括:
当接收到所述音频信号时,将循环接收到的多个频点组成一个音频帧;
对每一所述音频帧进行傅里叶变换,获得每一所述音频帧的频域信号;
按照音频帧的接收顺序,将每一所述音频帧的频域信号依次插入所述第一数组中。
在本发明实施例中,具体可以采用FFT(Fast Fourier Transformation,快速傅里叶变换)对所述音频帧进行傅里叶变换,从而将接收到的所述音频帧变换到频域。可以理解的,当将N个频点组成一个音频帧后,N点时域信号通过FFT生成N/2+1点的频域信号;其中,N为二的对数,一般取256或128。
在一种优选实施方式中,所述步骤S16,在完成对所述第一数组中的音频帧的每一频点的处理后,将所述第一数组中的首个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所述第一数组的末尾,具体包括:
在完成对所述第一数组中的音频帧的每一频点的处理后,对所述第一数组中的首个插入的音频帧进行逆傅里叶变换,获得所述首个插入的音频帧的时域信号;
将所述首个插入的音频帧的时域信号发送至所述终端设备;
在发送之后,将接收到的下一个音频帧的频域信号插入所述第一数组的末尾。
可以理解的,在完成对所述第一数组中的音频帧的每一频点的处理后,表明已经处理完所述第一数组中的每一个频点,已对所述第一数组中的每一个可能存在啸叫的频点进行了减益处理,因此,可将所述第一数组中的首个插入的音频帧变换到时域,并发送至所述终端设备,以使所述终端设备进行播放。在发送所述首个插入的音频帧后,对接收到的下一个音频帧进行傅里叶变换,获得所述下一个音频帧的频域信号,并将所述下一个音频帧的频域信号插入所述第一数组的末尾。
参见图3,是本发明另一实施例对应提供的一种音频信号的处理装置的结构示意图。
在本发明实施例中,所述音频信号的处理装置100,包括处理器101、存储器102以及存储在所述存储器102中且被配置为由所述处理器101执行的计算机程序,所述处理器执行所述计算机程序时实现上述的音频信号的处理方法。
在本发明实施例中,通过所述音频信号的处理装置100,实现在接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中,并在判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一数组中依次选取每一音频帧的该频点构成所述第三数组,以使在确定所述第三数组中的频点的周期符合预设的条件时,将所述第二数组中该频点对应的处理数值更新为预设数值,以指示在后续接收到的预设数值个音频帧中,对该频点进行啸叫抑制处理,从而实现了有效的啸叫检测及抑制处理,避免了采用频点响度探测的方式来进行啸叫检测而导致误检率较高,降低了误检率,进而提高了啸叫检测的准确度,减少了误检导致对非啸叫的频点进行抑制处理而造成音频失真的问题,因此保证了音频的质量。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器102中,并由所述处理器101执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述音频信号的处理装置100中的执行过程。
所称处理器101可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器102可用于存储所述计算机程序和/或模块,所述处理器101通过运行或执行存储在所述存储器102内的计算机程序和/或模块,以及调用存储在存储器102内的数据,实现所述音频信号的处理装置100的各种功能。所述存储器102可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述音频信号的处理装置100集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
此外,为了解决相同的技术问题,本发明实施例还提供一种安防摄像头,包括上述的音频信号的处理装置。
在本发明实施例中,所述安防摄像头还包括麦克风,所述麦克风用于采集音频信号。
综上,本发明提供一种音频信号的处理方法、装置、安防摄像头及存储介质,通过在接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中,并在判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一数组中依次选取每一音频帧的该频点构成所述第三数组,以使在确定所述第三数组中的频点的周期符合预设的条件时,将所述第二数组中该频点对应的处理数值更新为预设数值,以指示在后续接收到的预设数值个音频帧中,对该频点进行啸叫抑制处理,从而实现了有效的啸叫检测及抑制处理,降低了误检率,进而提高了啸叫检测的准确度,减少了误检导致对非啸叫的频点进行抑制处理而造成音频失真的问题,因此保证了音频的质量。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

Claims (10)

1.一种音频信号的处理方法,其特征在于,包括:
当接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中;
当所述第一数组中的音频帧的数量达到预设的数量阈值时,根据预先配置的第二数组,判断所述第一数组中的音频帧的每一频点对应的处理数值是否为零;其中,所述第二数组包含有与每一频点一一对应的处理数值,所述处理数值用于指示后续接收到的音频帧的数量,并对该数量的音频帧对应的频点进行啸叫抑制处理,所述处理数值的初始值为零;
当判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一数组中依次选取每一音频帧的该频点,构成第三数组;
计算所述第三数组中的频点的周期;
当确定所述第三数组中的频点的周期符合预设的条件时,将所述第二数组中该频点对应的处理数值更新为预设数值;
在完成对所述第一数组中的音频帧的每一频点的处理后,将所述第一数组中的首个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所述第一数组的末尾。
2.如权利要求1所述的音频信号的处理方法,其特征在于,所述音频信号的处理方法,还包括:
当判定所述第一数组中的音频帧的任一频点对应的处理数值大于零时,将所述第二数组中该频点对应的处理数值减一;
对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理。
3.如权利要求1或2所述的音频信号的处理方法,其特征在于,所述计算所述第三数组中的频点的周期,具体包括:
根据所述第三数组中的每一频点,通过以下公式依次计算所述第三数组的自相关函数值,并由依次获得的所述自相关函数值构成第四数组:
Figure FDA0002423136820000021
其中,k为时间偏移量,
Figure FDA0002423136820000022
T为所述第三数组的长度;R[k]为当时间偏移量为k时,所述第三数组的自相关函数值;x[i]为所述第三数组中的第i个频点;
以所述第四数组中数值最大的自相关函数值的位置的下标,作为所述第三数组中的频点的周期。
4.如权利要求3所述的音频信号的处理方法,其特征在于,所述音频信号的处理方法,还包括:
根据所述第三数组中的每一频点,计算所述第三数组的均值;
所述预设的条件为同时满足:
所述第三数组中的频点的周期处于预设的数值范围内,且所述第三数组中的频点的周期与所述第三数组的均值之比大于预设的比值。
5.如权利要求2所述的音频信号的处理方法,其特征在于,所述对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理,具体包括:
通过以下公式,对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理:
F[f]new=F[f]old*a
其中,F[f]new为处理后的所述第一数组中的末尾的音频帧的该频点;F[f]old为处理前的所述第一数组中的末尾的音频帧的该频点;a为预设的衰减值,0≤a<1。
6.如权利要求1或2所述的音频信号的处理方法,其特征在于,所述当接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组中,具体包括:
当接收到所述音频信号时,将循环接收到的多个频点组成一个音频帧;
对每一所述音频帧进行傅里叶变换,获得每一所述音频帧的频域信号;
按照音频帧的接收顺序,将每一所述音频帧的频域信号依次插入所述第一数组中。
7.如权利要求6所述的音频信号的处理方法,其特征在于,所述在完成对所述第一数组中的音频帧的每一频点的处理后,将所述第一数组中的首个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所述第一数组的末尾,具体包括:
在完成对所述第一数组中的音频帧的每一频点的处理后,对所述第一数组中的首个插入的音频帧进行逆傅里叶变换,获得所述首个插入的音频帧的时域信号;
将所述首个插入的音频帧的时域信号发送至所述终端设备;
在发送之后,将接收到的下一个音频帧的频域信号插入所述第一数组的末尾。
8.一种音频信号的处理装置,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的音频信号的处理方法。
9.一种安防摄像头,其特征在于,包括如权利要求8所述的音频信号的处理装置。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有程序,当所述程序运行时,实现如权利要求1至7中任一项所述的音频信号的处理方法。
CN202010211970.1A 2020-03-24 2020-03-24 音频信号的处理方法、装置、安防摄像头及存储介质 Withdrawn CN111583943A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010211970.1A CN111583943A (zh) 2020-03-24 2020-03-24 音频信号的处理方法、装置、安防摄像头及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010211970.1A CN111583943A (zh) 2020-03-24 2020-03-24 音频信号的处理方法、装置、安防摄像头及存储介质

Publications (1)

Publication Number Publication Date
CN111583943A true CN111583943A (zh) 2020-08-25

Family

ID=72112435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010211970.1A Withdrawn CN111583943A (zh) 2020-03-24 2020-03-24 音频信号的处理方法、装置、安防摄像头及存储介质

Country Status (1)

Country Link
CN (1) CN111583943A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020175998A1 (en) * 2000-05-31 2002-11-28 Hoang Khoi Nhu Data-on-demand digital broadcast system utilizing prefetch data transmission
US20130272095A1 (en) * 2010-09-29 2013-10-17 Adrian S. Brown Integrated audio-visual acoustic detection
CN110136735A (zh) * 2019-05-13 2019-08-16 腾讯音乐娱乐科技(深圳)有限公司 一种音频修复方法、设备及可读存储介质
CN110838301A (zh) * 2019-11-20 2020-02-25 北京雷石天地电子技术有限公司 抑制啸叫的方法、装置终端和非临时性计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020175998A1 (en) * 2000-05-31 2002-11-28 Hoang Khoi Nhu Data-on-demand digital broadcast system utilizing prefetch data transmission
US20130272095A1 (en) * 2010-09-29 2013-10-17 Adrian S. Brown Integrated audio-visual acoustic detection
CN110136735A (zh) * 2019-05-13 2019-08-16 腾讯音乐娱乐科技(深圳)有限公司 一种音频修复方法、设备及可读存储介质
CN110838301A (zh) * 2019-11-20 2020-02-25 北京雷石天地电子技术有限公司 抑制啸叫的方法、装置终端和非临时性计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐舜;刘郁林;柏森;: "一种基于模式识别的多路盲语音提取方法" *

Similar Documents

Publication Publication Date Title
CN107566890B (zh) 处理音频流播放异常的方法、装置、计算机装置及计算机可读存储介质
US11039204B2 (en) Frequency band selection and processing techniques for media source detection
CN108076226B (zh) 一种通话质量调整的方法、移动终端及存储介质
CN110838301B (zh) 抑制啸叫的方法、装置终端和非临时性计算机可读存储介质
CN109961797B (zh) 一种回声消除方法、装置以及电子设备
CN110677718B (zh) 一种视频识别方法和装置
CN110830832B (zh) 移动终端的音频播放参数配置方法及相关设备
CN108737818B (zh) 一种拥塞网络下的丢帧方法、装置及终端设备
CN107371053B (zh) 音频视频流对比分析方法及装置
CN110751045B (zh) 故障录波方法、系统及终端设备
CN111586529A (zh) 音频数据处理方法、装置、终端和计算机可读存储介质
CN112151051B (zh) 音频数据的处理方法和装置及存储介质
CN111583943A (zh) 音频信号的处理方法、装置、安防摄像头及存储介质
CN112929728A (zh) 一种视频渲染方法、装置、系统、电子设备及存储介质
CN112669865B (zh) 一种主麦克风的切换方法、装置、设备及可读存储介质
JP2011135485A (ja) ハウリング抑制装置
CN113488068B (zh) 音频异常检测方法、装置及计算机可读存储介质
US20130304470A1 (en) Electronic device and method for detecting pornographic audio data
CN112735481B (zh) Pop音检测方法、装置、终端设备及存储介质
CN111599370A (zh) 一种音频信号的处理方法、装置及存储介质
CN112612688A (zh) 设备流畅度的测试方法、装置、电子设备及存储介质
CN116017048B (zh) 片尾的开始位置识别方法、装置、电子设备及存储介质
CN117354579A (zh) 投屏方法、投屏装置、计算机设备及计算机可读存储介质
CN111083137B (zh) 物联网终端设备状态调整的方法、装置及操作系统
CN113082710B (zh) 一种音频播放方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200825