CN111128216A - 一种音频信号的处理方法、处理装置及可读存储介质 - Google Patents

一种音频信号的处理方法、处理装置及可读存储介质 Download PDF

Info

Publication number
CN111128216A
CN111128216A CN201911371154.0A CN201911371154A CN111128216A CN 111128216 A CN111128216 A CN 111128216A CN 201911371154 A CN201911371154 A CN 201911371154A CN 111128216 A CN111128216 A CN 111128216A
Authority
CN
China
Prior art keywords
voice interaction
audio signal
state parameter
determining
interaction equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911371154.0A
Other languages
English (en)
Other versions
CN111128216B (zh
Inventor
于龙华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Wentai Information Technology Co Ltd
Original Assignee
Shanghai Wentai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Wentai Information Technology Co Ltd filed Critical Shanghai Wentai Information Technology Co Ltd
Priority to CN201911371154.0A priority Critical patent/CN111128216B/zh
Publication of CN111128216A publication Critical patent/CN111128216A/zh
Application granted granted Critical
Publication of CN111128216B publication Critical patent/CN111128216B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本申请提供了一种音频信号的处理方法、处理装置及可读存储介质,其中,该方法包括:获取语音交互设备当前的状态参数;根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。这样,可以降低语音交互设备产生的噪声,提高语音交互设备的语音识别率。

Description

一种音频信号的处理方法、处理装置及可读存储介质
技术领域
本申请涉及音频信号处理技术领域,尤其是涉及一种音频信号的处理方法、处理装置及可读存储介质。
背景技术
随着人工智能和物联网技术的发展,人们对处理装置有着更高的个性化需求,比如,语音交互、提供音乐、信息查询等功能。常见的语音交互设备包括智能音箱、基于终端的语音助手等,其中,语音识别技术是语音交互设备的基本功能之一,只有语音交互设备的语音识别率足够高,用户与语音交互设备的交互才能顺利进行。
然而,语音交互设备在播放音频时,会产生无法消除的噪声,如音频的残存回声、扬声器失真带来的噪声等,尤其在密封的环境下,噪声更为严重,影响语音交互设备对用户语音信息的识别,其语音识别率较低。
发明内容
有鉴于此,本申请的目的在于提供一种音频信号的处理方法、处理装置及可读存储介质,通过获取语音交互设备当前的状态参数确定播放音频信号的回声频率,根据回声频率选择滤波器对音频信号进行过滤处理,以降低语音交互设备产生的噪声,提高语音交互设备的语音识别率。
第一方面,本申请实施例提供了一种音频信号的处理方法,所述处理方法包括:
获取语音交互设备当前的状态参数;
根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;
根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述状态参数包括音量、温度、湿度、音频类别,以及工作模式。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率,包括:
获取与所述语音交互设备当前的状态参数相对应的权重,其中,所述权重用于表征各状态参数对所述回声频率的贡献比率;
分别计算获取的状态参数与对应权重的乘积,并将各乘积相加,得到和值;
将所述和值确定为所述语音交互设备当前播放音频信号的回声频率。
结合第一方面的第二种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述获取与所述语音交互设备当前的状态参数相对应的权重,包括:
根据预存的所述语音交互设备的各状态参数与在各状态参数下的语音识别率的映射关系,获取与所述语音交互设备当前的各状态参数对应的语音识别率;
将各状态参数对应的语音识别率确定为各状态参数的权重。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,包括:
获取用于过滤所述语音交互设备的音频信号的多个滤波器系数;
将所述回声频率分别与多个滤波器系数中的每个滤波系数作差,得到多个差值;
从所述多个差值中选取最小差值,并将所述最小差值对应的滤波器系数确定为目标滤波器系数。
第二方面,本申请实施例提供了一种音频信号的处理装置,所述处理装置包括:
获取模块,用于获取语音交互设备当前的状态参数;
确定模块,用于根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;
过滤处理模块,用于根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述状态参数包括音量、温度、湿度、音频类别,以及工作模式。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述确定模块包括:
权重获取单元,用于获取与所述语音交互设备当前的状态参数相对应的权重,其中,所述权重用于表征各状态参数对所述回声频率的贡献比率;
计算单元,用于分别计算获取的状态参数与对应权重的乘积,并将各乘积相加,得到和值;
第一确定单元,用于将所述和值确定为所述语音交互设备当前播放音频信号的回声频率。
结合第二方面的第二种可能的实施方式,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述权重获取单元在用于获取与所述语音交互设备当前的状态参数相对应的权重时,所述权重获取单元具体用于:
根据预存的所述语音交互设备的各状态参数与在各状态参数下的语音识别率的映射关系,获取与所述语音交互设备当前的各状态参数对应的语音识别率;
将各状态参数对应的语音识别率确定为各状态参数的权重。
结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述过滤处理模块包括:
获取单元,用于获取用于过滤所述语音交互设备的音频信号的多个滤波器系数;
差值获取单元,用于将所述回声频率分别与多个滤波器系数中的每个滤波器系数作差,得到多个差值;
第二确定单元,用于从所述多个差值中选取最小差值,并将所述最小差值对应的滤波器系数确定为目标滤波器系数。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的音频信号的处理方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述的音频信号的处理方法的步骤。
本申请实施例提供的一种音频信号的处理方法、处理装置及可读存储介质,获取语音交互设备当前的状态参数;根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。这样,语音交互设备可以根据当前状态参数自适应调整当前播放的音频信号的频率,以降低语音交互设备产生的噪声,提高语音交互设备的语音识别率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种音频信号的处理方法的流程图;
图2示出了本申请另一实施例所提供的一种音频信号的处理方法的流程图;
图3示出了本申请实施例所提供的一种音频信号的处理装置的结构示意图;
图4示出了图3中所示的确定模块的结构示意图;
图5示出了图3中所示的过滤处理模块的结构示意图;
图6示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于语音交互设备,包括智能音箱、基于终端的语音助手、可穿戴设备、智能手环等语音交互设备,通过获取语音交互设备当前的状态参数,确定当前播放音频信号的回声频率,根据确定出的回声频率,从语音交互设备中的多个滤波器中选择用于过滤当前播放的音频信号的滤波器。这样,语音交互设备可以根据当前状态参数自适应调整当前播放的音频信号的频率,以滤除语音交互设备产生的噪声,使语音交互设备能够大概率识别出用户的语音信息,从而提高语音交互设备的语音识别率。
经研究发现,语音交互设备在播放音频时,用户发出语音唤醒命令,语音设备很难识别出唤醒命令,执行用户的唤醒操作。为了保证语音交互设备能够识别语音唤醒命令,通常需要将语音交互设备放置在特定的位置或相对开阔的环境,不便于用户对语音交互设备的使用,此外,语音交互设备在播放音频时所产生的噪声会干扰用户的语音唤醒命令,其语音识别率较低。
基于此,本申请实施例提供了一种音频信号的处理方法,以降低语音交互设备产生的噪声,提高语音交互设备的语音识别率。
请参阅图1,图1示出了本申请实施例所提供的一种音频信号的处理方法的流程图。如图1中所示,本申请实施例提供的一种音频信号的处理方法,所述处理方法包括:
步骤101,获取语音交互设备当前的状态参数。
该步骤中,实时监测语音交互设备的当前状态,获取语音交互设备当前的状态参数,其中,语音交互设备的当前状态可以是播放音频信号的音频参数,如音量等,也可以是语音交互设备的工作环境参数,如摆放位置、温度、湿度等。
这样,通过获取语音交互设备当前的状态参数,以便于语音交互设备根据状态参数自适应调整输出音频的频率。
步骤102,根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率。
该步骤中,通过步骤101中获取到的语音交互设备当前的状态参数,确定出语音交互设备当前播放音频信号的回声频率。具体的,首先确定影响语音交互设备拾音效果的状态参数,然后获取语音交互设备当前的状态参数,通过当前的状态参数确定语音交互设备当前播放音频信号的回声频率。例如,在播放音频时,语音交互设备的工作音量会影响语音交互设备的拾音效果,音量越大,对语音的干扰越大;语音交互设备放置在不同的环境(室内、室外)下,语音交互设备的拾音效果会不同,密闭环境的拾音效果相对较差;不同的温湿度会导致语音交互设备的音频失真等因素。这些参数都会对语音交互设备的拾音效果造成一定程度的影响。
步骤103,根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。
该步骤中,在语音交互设备中通常包括多个滤波器,不同的滤波器对应不同的滤波器系数,根据回声频率确定出目标滤波器系数,从语音交互设备中的多个滤波器中,选择目标滤波器系数对应的滤波器,通过该滤波器对语音交互设备当前播放的音频信号进行过滤处理。
需要说明的是,该步骤也可以通过确定出的回声频率,调整自适应滤波器的滤波器系数。
本申请实施例提供的一种音频信号的处理方法,获取语音交互设备当前的状态参数;根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。这样,语音交互设备可以根据当前状态参数自适应调整当前播放的音频信号的频率,以降低语音交互设备产生的噪声,提高语音交互设备的语音识别率。
请参阅图2,图2示出了本申请另一实施例所提供的一种音频信号的处理方法的流程图。如图2中所示,本申请实施例提供的一种音频信号的处理方法,包括:
步骤201,获取语音交互设备当前的状态参数。
其中,步骤201的描述可以参照步骤101的描述,并且能达到相同的技术效果,对此不做赘述。
本申请实施例中,作为一种可选实施例,所述状态参数包括音量、温度、湿度、音频类别,以及工作模式。
具体的,音量可以划分为1%~99%,可以识别出语音交互设备当前播放音频的音量,也可以获取用户设置的音量等级;温度和湿度分别是语音交互设备所在位置的当前温度和湿度,具体的可以通过温湿度传感器进行采集;音频类别为用户设置的类型,具体可分为流行、摇滚、轻音乐等;工作模式可以是语音交互设备所处的工作环境,具体可以分为客厅、卧室、餐厅和办公室等。
步骤202,获取与所述语音交互设备当前的状态参数相对应的权重,其中,所述权重用于表征各状态参数对所述回声频率的贡献比率。
由于每个状态参数对回声频率的影响程度不同,所以获取语音交互设备当前的状态相对应的权重,以表征各状态参数对回声频率的贡献比率。
本申请实施例中,作为一种可选实施例,所述获取与所述语音交互设备当前的状态参数相对应的权重,包括:
步骤2021,根据预存的所述语音交互设备的各状态参数与在各状态参数下的语音识别率的映射关系,获取与所述语音交互设备当前的各状态参数对应的语音识别率。
该步骤中,预先存储语音交互设备在各状态参数下的语音识别率与各状态参数的映射关系,获取语音交互设备当前的状态参数所对应的语音识别率,将状态参数所对应的识别率确定为状态参数的权重。具体的,可以将语音交互设备进行分类,分别对各类语音交互设备进行测试。以音量对应的语音识别率为例,将语音交互设备调节至不同音量播放等级,分别测试每个音量播放等级下语音交互设备的语音识别率,保存测试结果。获取语音交互设备所属的测试类型,然后根据测试结果得到语音交互设备当前音量所对应的语音识别率。
步骤2022,将各状态参数对应的语音识别率确定为各状态参数的权重。
该步骤中,将A21中语音交互设备当前的状态参数所对应的语音识别率确定为各状态参数的权重。
步骤203,分别计算获取的状态参数与对应权重的乘积,并将各乘积相加,得到和值。
该步骤中,可以通过以下公式计算和值:
L=V*Fv+T*Ft+H*Fh+Fu+Fs
式中,L为和值,V为音量,Fv为音量对应的权重,T为温度,Fv为温度对应的权重,H为湿度,Fh为湿度对应的权重,Fu和Fs分别是语音交互设备当前的音频类别和工作模式对应的权重。
步骤204,将所述和值确定为所述语音交互设备当前播放音频信号的回声频率。
该步骤中,将步骤203中计算的和值确定为语音交互设备当前播放音频信号的回声频率。
由于语音交互设备的各状态参数对回声频率的影响程度不同,所以获取与所述语音交互设备当前的状态参数相对应的权重,将各状态参数的加权和确定为语音交互设备当前播放音频信号的回声频率,这样,可以准确地确定出语音交互设备当前播放音频信号的回声频率,有利于提高噪声的滤除效果。
步骤205,根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。
其中,步骤205的描述可以参照步骤103的描述,并且能达到相同的技术效果,对此不做赘述。
本申请实施例中,作为一种可选实施例,所述根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,包括:
步骤2051,获取用于过滤所述语音交互设备的音频信号的多个滤波器系数。
该步骤中,语音交互设备中用于过滤音频信号的多个滤波器系数,具体的,可以是具有不同频率的二阶无源高通滤波器。
步骤2052,将所述回声频率分别与多个滤波器系数中的每个滤波器系数作差,得到多个差值。
该步骤中,获取步骤204中计算得到的回声频率,以及步骤2051中的语音交互设备的多个滤波器系数,分别计算回声频率与多个滤波器系数中的每个滤波器系数的差值。
步骤2053,从所述多个差值中选取最小差值,并将所述最小差值对应的滤波器系数确定为目标滤波器系数。
该步骤中,将与回声频率的差值最小的滤波器系数确定为目标滤波器系数。
本申请实施例提供的一种音频信号的处理方法,获取语音交互设备当前的状态参数;根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。
这样,语音交互设备可以根据当前状态参数自适应调整当前播放的音频信号的频率,以降低语音交互设备产生的噪声,提高语音交互设备的语音识别率。进一步的,通过获取语音交互设备当前的状态参数相对应的权重,根据各状态参数和各状态参数所对应的权重确定回声频率,可以准确地确定出语音交互设备当前播放音频信号的回声频率,有利于提高噪声的滤除效果。
请参阅图3、图4和图5,图3示出了本申请实施例所提供的一种音频信号的处理装置的结构示意图,图4示出了图3中所示的确定模块的结构示意图,图5示出了图3中所示的过滤处理模块的结构示意图。如图3中所示,所述处理装置300包括:
获取模块310,用于获取语音交互设备当前的状态参数;
确定模块320,用于根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;
过滤处理模块330,用于根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。
可选的,所述状态参数包括音量、温度、湿度、音频类别,以及工作模式。
可选的,如图4所示,所述确定模块320包括:
权重获取单元321,用于获取与所述语音交互设备当前的状态参数相对应的权重,其中,所述权重用于表征各状态参数对所述回声频率的贡献比率;
计算单元322,用于分别计算获取的状态参数与对应权重的乘积,并将各乘积相加,得到和值;
第一确定单元323,用于将所述和值确定为所述语音交互设备当前播放音频信号的回声频率。
可选的,所述权重获取单元321在用于获取与所述语音交互设备当前的状态参数相对应的权重时,所述权重获取单元321具体用于:
根据预存的所述语音交互设备的各状态参数与在各状态参数下的语音识别率的映射关系,获取与所述语音交互设备当前的各状态参数对应的语音识别率;
将各状态参数对应的语音识别率确定为各状态参数的权重。
可选的,如图5所示,所述过滤处理模块330包括:
获取单元331,用于获取用于过滤所述语音交互设备的音频信号的多个滤波器系数;
差值获取单元332,用于将所述回声频率分别与多个滤波器系数中的每个滤波器系数作差,得到多个差值;
第二确定单元333,用于从所述多个差值中选取最小差值,并将所述最小差值对应的滤波器系数确定为目标滤波器系数。
本申请实施例提供的一种音频信号的处理装置,获取语音交互设备当前的状态参数;根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。这样,语音交互设备可以根据当前状态参数自适应调整当前播放的音频信号的频率,以降低语音交互设备产生的噪声,提高语音交互设备的语音识别率。
请参阅图6,图6示出了本申请实施例所提供的一种电子设备的结构示意图。如图6中所示,所述电子设备600包括处理器610、存储器620和总线630。
所述存储器620存储有所述处理器610可执行的机器可读指令,当电子设备600运行时,所述处理器610与所述存储器620之间通过总线630通信,所述机器可读指令被所述处理器610执行时,可以执行如上述图1以及图2所示方法实施例中的一种音频信号的处理方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的一种音频信号的处理方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种音频信号的处理方法,其特征在于,所述处理方法包括:
获取语音交互设备当前的状态参数;
根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;
根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。
2.根据权利要求1所述的处理方法,其特征在于,所述状态参数包括音量、温度、湿度、音频类别,以及工作模式。
3.根据权利要求2所述的处理方法,其特征在于,所述根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率,包括:
获取与所述语音交互设备当前的状态参数相对应的权重,其中,所述权重用于表征各状态参数对所述回声频率的贡献比率;
分别计算获取的状态参数与对应权重的乘积,并将各乘积相加,得到和值;
将所述和值确定为所述语音交互设备当前播放音频信号的回声频率。
4.根据权利要求3所述的处理方法,其特征在于,所述获取与所述语音交互设备当前的状态参数相对应的权重,包括:
根据预存的所述语音交互设备的各状态参数与在各状态参数下的语音识别率的映射关系,获取与所述语音交互设备当前的各状态参数对应的语音识别率;
将各状态参数对应的语音识别率确定为各状态参数的权重。
5.根据权利要求1所述的处理方法,其特征在于,所述根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,包括:
获取用于过滤所述语音交互设备的音频信号的多个滤波器系数;
将所述回声频率分别与多个滤波器系数中的每个滤波器系数作差,得到多个差值;
从所述多个差值中选取最小差值,并将所述最小差值对应的滤波器系数确定为目标滤波器系数。
6.一种音频信号的处理装置,其特征在于,所述处理装置包括:
获取模块,用于获取语音交互设备当前的状态参数;
确定模块,用于根据所述语音交互设备当前的状态参数,确定所述语音交互设备当前播放音频信号的回声频率;
过滤处理模块,用于根据所述回声频率,从用于过滤所述语音交互设备的音频信号的多个滤波器系数中确定出目标滤波器系数,并通过所述目标滤波器系数所对应的滤波器对所述语音交互设备当前播放的音频信号进行过滤处理。
7.根据权利要求6所述的处理装置,其特征在于,所述确定模块包括:
权重获取单元,用于获取与所述语音交互设备当前的状态参数相对应的权重,其中,所述权重用于表征各状态参数对所述回声频率的贡献比率;
计算单元,用于分别计算获取的状态参数与对应权重的乘积,并将各乘积相加,得到和值;
第一确定单元,用于将所述和值确定为所述语音交互设备当前播放音频信号的回声频率。
8.根据权利要求6所述的处理装置,其特征在于,所述过滤处理模块包括:
获取单元,用于获取用于过滤所述语音交互设备的音频信号的多个滤波器系数;
差值获取单元,用于将所述回声频率分别与多个滤波器系数中的每个滤波器系数作差,得到多个差值;
第二确定单元,用于从所述多个差值中选取最小差值,并将所述最小差值对应的滤波器系数确定为目标滤波器系数。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至5中任一项所述的一种音频信号的处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至5中任一项所述的一种音频信号的处理方法的步骤。
CN201911371154.0A 2019-12-26 2019-12-26 一种音频信号的处理方法、处理装置及可读存储介质 Active CN111128216B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911371154.0A CN111128216B (zh) 2019-12-26 2019-12-26 一种音频信号的处理方法、处理装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911371154.0A CN111128216B (zh) 2019-12-26 2019-12-26 一种音频信号的处理方法、处理装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN111128216A true CN111128216A (zh) 2020-05-08
CN111128216B CN111128216B (zh) 2023-05-30

Family

ID=70503593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911371154.0A Active CN111128216B (zh) 2019-12-26 2019-12-26 一种音频信号的处理方法、处理装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN111128216B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111885459A (zh) * 2020-07-24 2020-11-03 歌尔科技有限公司 一种音频处理方法、音频处理装置、智能耳机
CN113362819A (zh) * 2021-05-14 2021-09-07 歌尔股份有限公司 语音提取方法、装置、设备、系统及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030026437A1 (en) * 2001-07-20 2003-02-06 Janse Cornelis Pieter Sound reinforcement system having an multi microphone echo suppressor as post processor
CN103262163A (zh) * 2010-10-25 2013-08-21 弗兰霍菲尔运输应用研究公司 包含晚期混响成分的模型化的回声抑制技术
CN108630219A (zh) * 2018-05-08 2018-10-09 北京小鱼在家科技有限公司 一种音频处理系统、方法、装置、设备及存储介质
US20190244628A1 (en) * 2018-02-05 2019-08-08 Beijing Baidu Netcom Science And Technology Co., Ltd. Device and method for cancelling echo

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030026437A1 (en) * 2001-07-20 2003-02-06 Janse Cornelis Pieter Sound reinforcement system having an multi microphone echo suppressor as post processor
CN103262163A (zh) * 2010-10-25 2013-08-21 弗兰霍菲尔运输应用研究公司 包含晚期混响成分的模型化的回声抑制技术
US20190244628A1 (en) * 2018-02-05 2019-08-08 Beijing Baidu Netcom Science And Technology Co., Ltd. Device and method for cancelling echo
CN108630219A (zh) * 2018-05-08 2018-10-09 北京小鱼在家科技有限公司 一种音频处理系统、方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周一潮;: "基于带阻滤波器的语音信号处理" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111885459A (zh) * 2020-07-24 2020-11-03 歌尔科技有限公司 一种音频处理方法、音频处理装置、智能耳机
CN113362819A (zh) * 2021-05-14 2021-09-07 歌尔股份有限公司 语音提取方法、装置、设备、系统及存储介质
CN113362819B (zh) * 2021-05-14 2022-06-14 歌尔股份有限公司 语音提取方法、装置、设备、系统及存储介质

Also Published As

Publication number Publication date
CN111128216B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN1951147B (zh) 啸声检测设备和方法
CN108766454A (zh) 一种语音噪声抑制方法及装置
CN112562626B (zh) 混合降噪滤波器的设计方法、降噪方法、系统及电子设备
TW479437B (en) Compensation system and method for sound reproduction
JP6339187B2 (ja) 音声信号品質を測定するためのシステムおよび方法
CN109473091B (zh) 一种语音样本生成方法及装置
CN101411213A (zh) 音频系统中的校准方法和装置
JPWO2016002358A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP6203003B2 (ja) 信号処理装置、信号処理方法およびプログラム
CN111128216A (zh) 一种音频信号的处理方法、处理装置及可读存储介质
CN110347366B (zh) 音量调节方法、终端设备、存储介质及电子设备
CN109920446B (zh) 一种音频数据处理方法、装置及计算机存储介质
JP2013037174A (ja) 雑音/残響除去装置とその方法とプログラム
CN111627460B (zh) 环境混响检测方法、装置、设备与计算机可读存储介质
WO2023246327A1 (zh) 音频信号处理方法、装置和计算机设备
CN111785298A (zh) 声学性能测试方法及装置、电子设备、计算机可读介质
CN113257247B (zh) 一种测试方法及系统
CN109121068A (zh) 音效控制方法、装置及电子设备
CN113450811B (zh) 对音乐进行通透处理的方法及设备
CN114420153A (zh) 音质调整方法、装置、设备及存储介质
CN113593594A (zh) 语音增强模型的训练方法和设备及语音增强方法和设备
CN113593604A (zh) 检测音频质量方法、装置及存储介质
CN114584908B (zh) 助听器的声学测试方法、装置以及设备
CN116033314B (zh) 一种音频自动增益补偿方法、系统、计算机及存储介质
CN115050367B (zh) 一种说话目标定位方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant