CN111901704B - 音频数据处理方法、装置、设备及计算机可读存储介质 - Google Patents

音频数据处理方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111901704B
CN111901704B CN202010552971.2A CN202010552971A CN111901704B CN 111901704 B CN111901704 B CN 111901704B CN 202010552971 A CN202010552971 A CN 202010552971A CN 111901704 B CN111901704 B CN 111901704B
Authority
CN
China
Prior art keywords
audio data
processing
filtering threshold
threshold value
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010552971.2A
Other languages
English (en)
Other versions
CN111901704A (zh
Inventor
沈卫民
刘祖芳
骆传伏
黄猛
王志辉
王伟林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Michoi Security Technology Co ltd
Original Assignee
Shenzhen Michoi Security Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Michoi Security Technology Co ltd filed Critical Shenzhen Michoi Security Technology Co ltd
Priority to CN202010552971.2A priority Critical patent/CN111901704B/zh
Publication of CN111901704A publication Critical patent/CN111901704A/zh
Application granted granted Critical
Publication of CN111901704B publication Critical patent/CN111901704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q5/00Selecting arrangements wherein two or more subscriber stations are connected by the same line to the exchange
    • H04Q5/24Selecting arrangements wherein two or more subscriber stations are connected by the same line to the exchange for two-party-line systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种音频数据处理方法,所述音频数据处理方法包括以下步骤:在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。本发明还公开了一种音频数据处理装置、设备及计算机可读存储介质。本发明通过根据采集到的音频数据确定过滤阈值,以动态获得过滤阈值,能够根据动态的过滤阈值在消除音频数据的回声时避免回声过度消除,以确保语音数据中的正常语音不被消除且正常语音声音不变小。

Description

音频数据处理方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及楼宇对讲技术领域,尤其涉及一种音频数据处理方法、装置、设备及计算机可读存储介质。
背景技术
楼宇对讲是一个安全防范系统,在多层或高层建筑中实现访客、住户和物业管理中心相互通话、进行信息交流并实现对小区安全出入通道控制的管理系统。来访者可通过楼下单元门前的门口机呼叫住户并与其对话,而且在没有带钥匙的情况下呼叫物业管理人员,协助开启单元门锁,而住户在户内也可以控制单元门的启闭,住户可以操作室内机进行呼叫物业管理人员,门口机也可以随时接收住户报警信号传给值班主机通知小区保卫人员,不仅增强了高层住宅安全保卫工作,而且大大方便了住户,减少许多不必要的上下楼麻烦,沟通更方便快捷安全可靠。
目前,在楼宇对讲中要求全双工对讲,如果不对需要传输的音频数据进行处理,会出现对讲两端都能听到自己的回声,严重影响对讲通话质量。为减少回声,常常采用开源免费的Speex和Webrtc技术对需要传输的音频数据进行回声消除,但存在回声过度消除导致部分正常语音被消除和声音变小的现象。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种音频数据处理方法、装置、设备及计算机可读存储介质,旨在解决现有对讲终端由于回声过度消除而导致的部分正常语音被消除和声音变小的技术问题。
为实现上述目的,本发明提供一种音频数据处理方法,所述音频数据处理方法包括以下步骤:
在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;
将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。
进一步地,在一实施方式中,所述基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据的步骤包括:
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得处理后的音频数据;
对处理后的音频数据进行高通滤波处理,以获得目标音频数据。
进一步地,在一实施方式中,所述对处理后的音频数据进行高通滤波处理,以获得目标音频数据的步骤包括:
对处理后的音频数据进行高通滤波处理,以获得滤波后的音频数据;
对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据。
进一步地,在一实施方式中,所述对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据的步骤包括:
对滤波后的音频数据进行AGC自动增益处理,以获得增益后的音频数据;
对增益后的音频数据执行相位反转操作,以获得目标音频数据。
进一步地,在一实施方式中,所述确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值的步骤包括:
对第一对讲终端的麦克当前采集的音频数据进行VAD检测,以获得VAD检测结果;
确定所述VAD检测结果对应的过滤阈值。
进一步地,在一实施方式中,所述确定所述VAD检测结果对应的过滤阈值的步骤包括:
获取预设检测结果与预设过滤阈值之间的映射关系;
基于所述映射关系,确定所述VAD检测结果对应的过滤阈值。
进一步地,在一实施方式中,所述音频数据处理方法还包括:
在接收到所述第二对讲终端发送的待播放音频数据时,播放所述待播放音频数据。
此外,为实现上述目的,本发明还提供一种音频数据处理装置,所述音频数据处理装置包括:
确定模块,用于在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;
处理模块,用于基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;
发送模块,用于将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。
此外,为实现上述目的,本发明还提供一种音频数据处理设备,所述音频数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音频数据处理程序,所述音频数据处理程序被所述处理器执行时实现前述的音频数据处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有音频数据处理程序,所述音频数据处理程序被处理器执行时实现前述的音频数据处理方法的步骤。
本发明通过在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;接着基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;而后将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据,通过根据采集到的音频数据确定过滤阈值,以动态获得过滤阈值,能够根据动态的过滤阈值在消除音频数据的回声时避免回声过度消除,以确保语音数据中的正常语音不被消除且正常语音声音不变小。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中音频数据处理设备的结构示意图;
图2为本发明音频数据处理方法第一实施例的流程示意图;
图3为本发明音频数据处理装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境中音频数据处理设备的结构示意图。
本发明实施例音频数据处理设备可以是PC,也可以是对讲系统中的门口机或者室内机等。
如图1所示,该音频数据处理设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,音频数据处理设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器。当然,音频数据处理设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的音频数据处理设备结构并不构成对音频数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及音频数据处理程序。
在图1所示的音频数据处理设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的音频数据处理程序。
在本实施例中,音频数据处理设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的音频数据处理程序,其中,处理器1001调用存储器1005中存储的音频数据处理程序时,并执行以下操作:
在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;
将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。
进一步地,处理器1001可以调用存储器1005中存储的音频数据处理程序,还执行以下操作:
所述基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据的步骤包括:
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得处理后的音频数据;
对处理后的音频数据进行高通滤波处理,以获得目标音频数据。
进一步地,处理器1001可以调用存储器1005中存储的音频数据处理程序,还执行以下操作:
所述对处理后的音频数据进行高通滤波处理,以获得目标音频数据的步骤包括:
对处理后的音频数据进行高通滤波处理,以获得滤波后的音频数据;
对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据。
进一步地,处理器1001可以调用存储器1005中存储的音频数据处理程序,还执行以下操作:
所述对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据的步骤包括:
对滤波后的音频数据进行AGC自动增益处理,以获得增益后的音频数据;
对增益后的音频数据执行相位反转操作,以获得目标音频数据。
进一步地,处理器1001可以调用存储器1005中存储的音频数据处理程序,还执行以下操作:
所述确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值的步骤包括:
对第一对讲终端的麦克当前采集的音频数据进行VAD检测,以获得VAD检测结果;
确定所述VAD检测结果对应的过滤阈值。
进一步地,处理器1001可以调用存储器1005中存储的音频数据处理程序,还执行以下操作:
获取预设检测结果与预设过滤阈值之间的映射关系;
基于所述映射关系,确定所述VAD检测结果对应的过滤阈值。
进一步地,处理器1001可以调用存储器1005中存储的音频数据处理程序,还执行以下操作:
在接收到所述第二对讲终端发送的待播放音频数据时,播放所述待播放音频数据。
本发明还提供一种音频数据处理方法,参照图2,图2为本发明音频数据处理方法第一实施例的流程示意图。
本实施例中,该音频数据处理方法包括以下步骤:
步骤S100,在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;
在本实施例中,该第一对讲终端可以为楼宇对讲系统中的室内机、门口机或者全管理终端等。
在楼宇对讲系统中,处于对讲状态的两端采用全双工模式进行通信,以在发送当前采集的音频数据(或者音视频数据)的同时,接收并播放对端传输的音频数据(或者音视频数据)。
本实施例中,在第一对讲终端处于全双工模式时,获取第一对讲终端的麦克当前采集的音频数据,该当前采集的音频数据包括当前时刻之前麦克已采集且未发送至第二对讲终端的音频数据,并根据当前采集的音频数据确定对应的过滤阈值,以实现过滤阈值与音频数据之间进行关联,使得过滤阈值的大小不固定。其中,当前采集的音频数据包括使用第一对讲终端的使用者的人声数据、第一对讲终端所处环境的环境音数据以及第一对讲终端的扬声器播放的第二对讲终端的音频数据。
步骤S200,基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;
本实施例中,在获得过滤阈值之后,根据过滤阈值对音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据,具体的,可根据过滤阈值调整噪声抑制处理以及回声消除处理中的过滤参数,并在调整后对音频数据进行噪声抑制处理以及回声消除处理,或者,先对音频数据进行噪声抑制处理,根据过滤阈值调整回声消除处理中的过滤参数,在调整后对的噪声抑制处理后的音频数据进行回声消除处理,例如,根据过滤阈值调整回声消除处理所对应的滤波器的滤波系数,通过系数调整后的滤波器对音频数据(噪声抑制处理后的音频数据)进行回声消除处理,避免回声过度消除导致正常语音被消除和正常语音声音变小。
步骤S300,将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。
在本实施例中,第二对讲终端为楼宇对讲系统中与第一对讲终端进行对讲(可视对讲)的室内机、门口机或者安全管理终端。例如,第一对讲终端为楼宇对讲系统中的门口机,第二对讲终端可以为楼宇对讲系统中的室内机,或者,第一对讲终端为楼宇对讲系统中的室内机,第二对讲终端可以为楼宇对讲系统中的门口机。
在获取到目标音频数据之后,将所述目标音频数据发送至第二对讲终端,第二对讲终端在接收到该目标音频数据之后,该第二对讲终端播放所述目标音频数据。
进一步地,在一实施例中,该音频数据处理方法还包括:
在接收到所述第二对讲终端发送的待播放音频数据时,播放所述待播放音频数据。
本实施例中,第二对讲终端采用相同的处理方式对其采集到的音频数据进行处理,得到待播放音频数据,并将待播放音频数据发送至第一对讲终端,在接收到所述第二对讲终端发送的待播放音频数据时,该第一对讲终端播放所述待播放音频数据。
本实施例提出的音频数据处理方法,通过在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;接着基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;而后将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据,通过根据采集到的音频数据确定过滤阈值,以动态获得过滤阈值,能够根据动态的过滤阈值在消除音频数据的回声时避免回声过度消除,以确保语音数据中的正常语音不被消除且正常语音声音不变小。
基于第一实施例,提出本发明音频数据处理方法的第二实施例,在本实施例中,步骤S200包括:
步骤S210,基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得处理后的音频数据;
步骤S220,对处理后的音频数据进行高通滤波处理,以获得目标音频数据。
本实施例中,在获得过滤阈值之后,根据过滤阈值对音频数据进行噪声抑制处理以及回声消除处理,以获得处理后的音频数据,具体的,可根据过滤阈值调整噪声抑制处理以及回声消除处理中的过滤参数,并在调整后对音频数据进行噪声抑制处理以及回声消除处理,或者,先对音频数据进行噪声抑制处理,根据过滤阈值调整回声消除处理中的过滤参数,在调整后对的噪声抑制处理后的音频数据进行回声消除处理,例如,根据过滤阈值调整回声消除处理所对应的滤波器的滤波系数,通过系数调整后的滤波器对音频数据(噪声抑制处理后的音频数据)进行回声消除处理,得到处理后的音频数据。
而后,对处理后的音频数据进行高通滤波处理,以获得目标音频数据,通过高通滤波,以过滤音频数据中的低频信号,得到更准确的目标音频数据。
本实施例提出的音频数据处理方法,通过基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得处理后的音频数据,接着对处理后的音频数据进行高通滤波处理,以获得目标音频数据,能够通过高通滤波更准确的目标音频数据,同时避免回声过度消除导致正常语音被消除和正常语音声音变小。
基于第二实施例,提出本发明音频数据处理方法的第三实施例,在本实施例中,步骤S220包括:
步骤S222,对处理后的音频数据进行高通滤波处理,以获得滤波后的音频数据;
步骤S223,对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据。
在本实施例中,在获得处理后的音频数据之后,对处理后的音频数据进行高通滤波处理,以滤波后的音频数据,通过高通滤波,以过滤音频数据中的低频信号。
而后,对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据,通过AGC自动增益处理对滤波后的音频数据进行滤波后的音频控制,以对滤波后的音频数据中语音的响度进行调整,得到增益后的语音数据,即目标语音数据,以提高目标语音数据在播放时的音量,避免对端(第二对讲终端)的播放声音过小。
本实施例提出的音频数据处理方法,通过对处理后的音频数据进行高通滤波处理,以获得滤波后的音频数据;接着对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据,通过对音频数据进行AGC自动增益处理,提升音频数据中语音的响度,以提高目标语音数据在播放时的音量,避免对端(第二对讲终端)的播放声音过小。
基于第四实施例,提出本发明音频数据处理方法的第四实施例,在本实施例中,步骤S223包括:
步骤a,对滤波后的音频数据进行AGC自动增益处理,以获得增益后的音频数据;
步骤b,对增益后的音频数据执行相位反转操作,以获得目标音频数据。
本实施例中,在获取到滤波后的音频数据,对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据,通过AGC自动增益处理对滤波后的音频数据进行滤波后的音频控制,以对滤波后的音频数据中语音的响度进行调整,得到增益后的语音数据,以提高目标语音数据在播放时的音量,避免对端(第二对讲终端)的播放声音过小。
在获得,增益后的音频数据之后,对增益后的音频数据执行相位反转操作,以获得目标音频数据,通过相位反转避免目标音频数据对应的啸叫。
本实施例提出的音频数据处理方法,通过对滤波后的音频数据进行AGC自动增益处理,以获得增益后的音频数据,接着对增益后的音频数据执行相位反转操作,以获得目标音频数据,通过AGC自动增益处理提高目标语音数据在播放时的音量,避免对端(第二对讲终端)的播放声音过小,通过相位反转避免目标音频数据对应的啸叫。
基于第一实施例,提出本发明音频数据处理方法的第五实施例,在本实施例中,步骤S100包括:
步骤S110,对第一对讲终端的麦克当前采集的音频数据进行VAD检测,以获得VAD检测结果;
步骤S120,确定所述VAD检测结果对应的过滤阈值。
其中,VAD(Voice Activity Detection,语音活动检测)又称语音端点检测或者语音边界检,是指在噪声环境中检测语音的存在与否,通常用于语音编码、语音增强等语音处理系统中,起到降低语音编码速率、节省通信带宽、减少移动设备能耗、提高识别率等作用。
本实施例中,在第一对讲终端处于全双工模式时,获取第一对讲终端的麦克当前采集的音频数据,该当前采集的音频数据包括当前时刻之前麦克已采集且未发送至第二对讲终端的音频数据,对第一对讲终端的麦克当前采集的音频数据进行VAD检测,以获得VAD检测结果,并根据VAD检测结果确定对应的过滤阈值,以实现过滤阈值与音频数据之间进行关联,使得过滤阈值的大小不固定。
本实施例提出的音频数据处理方法,通过对第一对讲终端的麦克当前采集的音频数据进行VAD检测,以获得VAD检测结果;接着确定所述VAD检测结果对应的过滤阈值,通过对语音数据进行VAD检测,以通过VAD检测结果准确地到过滤阈值,提高过滤阈值的准确性,进而提高对音频数据进行回声消除的准确性。
基于第五实施例,提出本发明音频数据处理方法的第六实施例,在本实施例中,步骤S120包括:
步骤S121,获取预设检测结果与预设过滤阈值之间的映射关系;
步骤S122,基于所述映射关系,确定所述VAD检测结果对应的过滤阈值。
本实施例中,可预先设置,预设检测结果与预设过滤阈值之间的映射关系,在获得VAD检测结果之后,先获取预设检测结果与预设过滤阈值之间的映射关系;而后基于映射关系,确定所述VAD检测结果对应的过滤阈值,进而通过预设检测结果与预设过滤阈值之间的映射关系根据VAD检测结果准确获得过滤阈值。
本实施例提出的音频数据处理方法,通过获取预设检测结果与预设过滤阈值之间的映射关系;接着基于所述映射关系,确定所述VAD检测结果对应的过滤阈值,通过预设检测结果与预设过滤阈值之间的映射关系根据VAD检测结果准确获得过滤阈值,提高过滤阈值的准确性,进而提高对音频数据进行回声消除的准确性。
本发明实施例还提供一种音频数据处理装置,参照图3,图3为本发明音频数据处理装置一实施例的功能模块示意图,所述音频数据处理装置包括:
确定模块100,用于在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;
处理模块200,用于基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;
发送模块300,用于将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。
进一步地,处理模块200还用于:
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得处理后的音频数据;
对处理后的音频数据进行高通滤波处理,以获得目标音频数据。
进一步地,处理模块200还用于:
对处理后的音频数据进行高通滤波处理,以获得滤波后的音频数据;
对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据。
进一步地,处理模块200还用于:
对滤波后的音频数据进行AGC自动增益处理,以获得增益后的音频数据;
对增益后的音频数据执行相位反转操作,以获得目标音频数据。
进一步地,确定模块100还用于:
对第一对讲终端的麦克当前采集的音频数据进行VAD检测,以获得VAD检测结果;
确定所述VAD检测结果对应的过滤阈值。
进一步地,确定模块100还用于:
获取预设检测结果与预设过滤阈值之间的映射关系;
基于所述映射关系,确定所述VAD检测结果对应的过滤阈值。
进一步地,音频数据处理装置还包括:
在接收到所述第二对讲终端发送的待播放音频数据时,播放所述待播放音频数据。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有音频数据处理程序,所述音频数据处理程序被处理器执行时实现如下操作:
在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;
将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。
进一步地,所述音频数据处理程序被处理器执行时还实现如下操作:
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得处理后的音频数据;
对处理后的音频数据进行高通滤波处理,以获得目标音频数据。
进一步地,所述音频数据处理程序被处理器执行时还实现如下操作:
对处理后的音频数据进行高通滤波处理,以获得滤波后的音频数据;
对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据。
进一步地,所述音频数据处理程序被处理器执行时还实现如下操作:
对滤波后的音频数据进行AGC自动增益处理,以获得增益后的音频数据;
对增益后的音频数据执行相位反转操作,以获得目标音频数据。
进一步地,所述音频数据处理程序被处理器执行时还实现如下操作:
对第一对讲终端的麦克当前采集的音频数据进行VAD检测,以获得VAD检测结果;
确定所述VAD检测结果对应的过滤阈值。
进一步地,所述音频数据处理程序被处理器执行时还实现如下操作:
获取预设检测结果与预设过滤阈值之间的映射关系;
基于所述映射关系,确定所述VAD检测结果对应的过滤阈值。
进一步地,所述音频数据处理程序被处理器执行时还实现如下操作:
在接收到所述第二对讲终端发送的待播放音频数据时,播放所述待播放音频数据。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种音频数据处理方法,其特征在于,所述音频数据处理方法包括以下步骤:
在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值;
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据,其中,根据过滤阈值调整回声消除处理所对应的滤波器的滤波系数,对音频数据进行噪声抑制处理,通过系数调整后的滤波器对噪声抑制处理后的音频数据进行回声消除处理,得到所述目标音频数据;
将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。
2.如权利要求1所述的音频数据处理方法,其特征在于,所述基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据的步骤包括:
基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得处理后的音频数据;
对处理后的音频数据进行高通滤波处理,以获得目标音频数据。
3.如权利要求2所述的音频数据处理方法,其特征在于,所述对处理后的音频数据进行高通滤波处理,以获得目标音频数据的步骤包括:
对处理后的音频数据进行高通滤波处理,以获得滤波后的音频数据;
对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据。
4.如权利要求3所述的音频数据处理方法,其特征在于,所述对滤波后的音频数据进行AGC自动增益处理,以获得目标音频数据的步骤包括:
对滤波后的音频数据进行AGC自动增益处理,以获得增益后的音频数据;
对增益后的音频数据执行相位反转操作,以获得目标音频数据。
5.如权利要求1所述的音频数据处理方法,其特征在于,所述确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值的步骤包括:
对第一对讲终端的麦克当前采集的音频数据进行VAD检测,以获得VAD检测结果;
确定所述VAD检测结果对应的过滤阈值。
6.如权利要求5所述的音频数据处理方法,其特征在于,所述确定所述VAD检测结果对应的过滤阈值的步骤包括:
获取预设检测结果与预设过滤阈值之间的映射关系;
基于所述映射关系,确定所述VAD检测结果对应的过滤阈值。
7.如权利要求1至6任一项所述的音频数据处理方法,其特征在于,所述音频数据处理方法还包括:
在接收到所述第二对讲终端发送的待播放音频数据时,播放所述待播放音频数据。
8.一种音频数据处理装置,其特征在于,所述音频数据处理装置包括:
确定模块,用于在第一对讲终端处于全双工模式时,确定第一对讲终端的麦克当前采集的音频数据对应的过滤阈值,其中,根据过滤阈值调整回声消除处理所对应的滤波器的滤波系数,对音频数据进行噪声抑制处理,通过系数调整后的滤波器对噪声抑制处理后的音频数据进行回声消除处理,得到目标音频数据;
处理模块,用于基于所述过滤阈值对所述音频数据进行噪声抑制处理以及回声消除处理,以获得目标音频数据;
发送模块,用于将所述目标音频数据发送至第二对讲终端,以供所述第二对讲终端播放所述目标音频数据。
9.一种音频数据处理设备,其特征在于,所述音频数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音频数据处理程序,所述音频数据处理程序被所述处理器执行时实现如权利要求1至7 中任一项所述的音频数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有音频数据处理程序,所述音频数据处理程序被处理器执行时实现如权利要求1至7中任一项所述的音频数据处理方法的步骤。
CN202010552971.2A 2020-06-16 2020-06-16 音频数据处理方法、装置、设备及计算机可读存储介质 Active CN111901704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010552971.2A CN111901704B (zh) 2020-06-16 2020-06-16 音频数据处理方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010552971.2A CN111901704B (zh) 2020-06-16 2020-06-16 音频数据处理方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111901704A CN111901704A (zh) 2020-11-06
CN111901704B true CN111901704B (zh) 2022-07-22

Family

ID=73206739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010552971.2A Active CN111901704B (zh) 2020-06-16 2020-06-16 音频数据处理方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111901704B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112216297B (zh) * 2020-12-10 2021-02-26 全时云商务服务股份有限公司 针对安卓手机端VoIP声音小的处理方法、系统、介质及设备
CN113286228B (zh) * 2021-05-28 2022-11-08 北京千丁互联科技有限公司 楼宇对讲音频自动调节方法、装置和楼宇对讲设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281745A (zh) * 2008-05-23 2008-10-08 深圳市北科瑞声科技有限公司 一种车载语音交互系统
CN102347785A (zh) * 2010-07-23 2012-02-08 联芯科技有限公司 一种回声消除方法及装置
CN102572646A (zh) * 2011-12-31 2012-07-11 广东步步高电子工业有限公司 一种在耳机听音乐状态下的消噪方法及设备
CN202475574U (zh) * 2012-03-12 2012-10-03 杭州艾力特音频技术有限公司 一种回声消除对讲设备
CN104980600A (zh) * 2014-04-02 2015-10-14 想象技术有限公司 非线性处理器阈值的自动调谐
CN105913853A (zh) * 2016-06-13 2016-08-31 上海盛本智能科技股份有限公司 近场集群对讲回声消除的系统及实现方法
CN110913312A (zh) * 2018-09-17 2020-03-24 海信集团有限公司 一种回声消除方法及装置
CN111131645A (zh) * 2019-12-24 2020-05-08 河南华启思创智能科技有限公司 改进型的nlms消回声算法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9947337B1 (en) * 2017-03-21 2018-04-17 Omnivision Technologies, Inc. Echo cancellation system and method with reduced residual echo
US20190387368A1 (en) * 2018-06-14 2019-12-19 Motorola Solutions, Inc Communication device providing half-duplex and pseudo full-duplex operation using push-to-talk switch

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281745A (zh) * 2008-05-23 2008-10-08 深圳市北科瑞声科技有限公司 一种车载语音交互系统
CN102347785A (zh) * 2010-07-23 2012-02-08 联芯科技有限公司 一种回声消除方法及装置
CN102572646A (zh) * 2011-12-31 2012-07-11 广东步步高电子工业有限公司 一种在耳机听音乐状态下的消噪方法及设备
CN202475574U (zh) * 2012-03-12 2012-10-03 杭州艾力特音频技术有限公司 一种回声消除对讲设备
CN104980600A (zh) * 2014-04-02 2015-10-14 想象技术有限公司 非线性处理器阈值的自动调谐
CN105913853A (zh) * 2016-06-13 2016-08-31 上海盛本智能科技股份有限公司 近场集群对讲回声消除的系统及实现方法
CN110913312A (zh) * 2018-09-17 2020-03-24 海信集团有限公司 一种回声消除方法及装置
CN111131645A (zh) * 2019-12-24 2020-05-08 河南华启思创智能科技有限公司 改进型的nlms消回声算法

Also Published As

Publication number Publication date
CN111901704A (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
CN111901704B (zh) 音频数据处理方法、装置、设备及计算机可读存储介质
CN107231473B (zh) 一种音频输出调控方法、设备及计算机可读存储介质
CN106164846A (zh) 音频信号处理
EP2982101B1 (en) Noise reduction
US20130070931A1 (en) Ambient Noise Compensation System Robust to High Excitation Noise
CN107919138B (zh) 一种语音中的情绪处理方法及移动终端
CN107785027B (zh) 一种音频处理方法及电子设备
JP2002534716A (ja) 注目期間を有する音声入力装置
CN109951602B (zh) 一种振动控制方法及移动终端
CN110855313B (zh) 一种信号控制方法及电子设备
CN108521501B (zh) 语音输入方法及移动终端、计算机可读存储介质
CN111447223A (zh) 一种通话处理方法及电子设备
CN111083297A (zh) 一种回声消除方法及电子设备
CN109754823A (zh) 一种语音活动检测方法、移动终端
CN117480554A (zh) 语音增强方法及相关设备
US11653184B2 (en) Call prompt method
JP6153020B2 (ja) 携帯端末、プログラム、通話システム
WO2011033870A1 (ja) 通信装置
CN109889665B (zh) 一种音量调节方法、移动终端及存储介质
CN108900706B (zh) 一种通话语音调整方法及移动终端
EP3493200B1 (en) Voice-controllable device and method of voice control
CN112217948B (zh) 语音通话的回声处理方法、装置、设备及存储介质
CN115050382A (zh) 一种车内外语音通话方法、装置、电子设备和存储介质
CN108668007A (zh) 一种移动终端中新消息的处理方法、移动终端及存储介质
JP2023519408A (ja) リソース選択方法及び機器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant