CN110808064A - 一种音频处理方法及装置 - Google Patents

一种音频处理方法及装置 Download PDF

Info

Publication number
CN110808064A
CN110808064A CN201810884112.6A CN201810884112A CN110808064A CN 110808064 A CN110808064 A CN 110808064A CN 201810884112 A CN201810884112 A CN 201810884112A CN 110808064 A CN110808064 A CN 110808064A
Authority
CN
China
Prior art keywords
audio signal
energy
output audio
target output
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810884112.6A
Other languages
English (en)
Other versions
CN110808064B (zh
Inventor
李东洋
孙永文
刘炳毓
王维佳
贾全升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201810884112.6A priority Critical patent/CN110808064B/zh
Publication of CN110808064A publication Critical patent/CN110808064A/zh
Application granted granted Critical
Publication of CN110808064B publication Critical patent/CN110808064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种音频处理方法及装置,所述方法包括对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小,然后,基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号,最后,对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。该方案解决了现有技术中存在播报的输出音频的不清晰的技术问题,实现对能量集中的频段的音频进行放大后输出,提高播报的输出音频的清晰度,有利于播报内容有效传达的技术效果。

Description

一种音频处理方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种音频处理方法及装置。
背景技术
随着如学校、车站、边检、海关等公共场所中智能终端系统的广泛应用,语音播报系统作为这些智能终端系统的一个重要组成部分也获得了较大的关注。其中,智能终端系统包括如学校和车站的人工播报系统,边检与海关的自助通道系统中的语音提示系统等。
现有的语音播报系统通常以微型计算机控制板的输出音频作为输入的待处理音频,因微型计算机控制板的输出音频的功率有限,该音频无法直接通过扬声器播放,所以通常会对该音频分频进行放大处理后输出,但是微型计算机控制板的输出音频通常存在噪声,在对输出音频进行放大处理同时也导致了噪声的在全频段内的放大,使得最终扬声器播报的音频不清晰。
因此现有技术中存在播报的输出音频的不清晰,不利于播报内容有效传达的技术问题。
发明内容
本发明实施例通过提供一种音频处理方法及装置,用于解决播报的输出音频的不清晰,不利于播报内容有效传达的技术问题,实现对能量集中的频段对应的音频进行放大后输出,提高播报的输出音频的清晰度,有利于播报内容有效传达的技术效果。
第一方面,本发明一实施例提供了一种音频处理方法,具体包括以下步骤:
对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,其中,N为大于1的正整数;
获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小;
基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号;
对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。
可选的,所述对输入的音频信号进行处理,包括:
对所述输入的音频信号进行分频处理;或者
对所述输入的音频信号进行噪声隔离,获得去噪后的音频信号,并对所述去噪音后的音频信号进行分频处理。
可选的,所述获取所述N个输出音频信号各自的能量参数,包括:
分别对所述N个输出音频信号进行模拟/数字转换,获得N个各自属于不同频段的数字音频信号;
基于所述N个数字音频信号,计算所述N个输出音频信号各自的能量参数。
可选的,所述对所述第一目标输出音频信号进行功率放大处理,包括:
检测外部环境声音的音频信号;
对所述外部环境声音的音频信号与所述第二目标输出音频信号分别进行模拟/数字转换,分别获得外部环境的数字音频信号及第二目标输出数字音频信号;
分别计算所述外部环境的数字音频信号及所述第二目标输出数字音频信号的能量参数;
若能量参数与信号能量大小的关系为正相关,所述外部环境的数字音频信号的能量参数与所述的数字音频信号的能量参数的差值大于第一预设值,提高对所述第一目标输出音频信号的功率放大倍数;
若能量参数与信号能量大小的关系为负相关,所述第二目标输出数字音频信号的能量参数与所述外部环境的数字音频信号的能量参数的差值大于第二预设值,提高对所述第一目标输出音频信号的功率放大倍数。
第二方面,本发明一实施例提供了一种音频处理装置,包括:
处理单元,用于对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,其中,N为大于1的正整数;
获取单元,用于获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小;
选择单元,用于基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号;
功放单元,用于对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。
可选的,所述处理单元包括:
第一分频子单元,用于对所述输入的音频信号进行分频处理;或者
所述处理单元包括:
去噪子单元,用于对所述输入的音频信号进行噪声隔离,获得去噪后的音频信号;
第二分频子单元,用于对所述去噪后的音频信号进行分频处理。
可选的,所述获取单元,包括:
第一模拟/数字转换子单元,用于分别对所述N个输出音频信号进行模拟/数字转换,获得N个各自属于不同频段的数字音频信号;
第一计算子单元,用于基于所述N个数字音频信号,计算所述N个输出音频信号各自的能量参数。
可选的,所述功放单元,包括:
检测子单元,用于检测外部环境声音的音频信号;
第二模拟/数字转换子单元,用于对所述外部环境声音的音频信号与所述第二目标输出音频信号分别进行模拟/数字转换,分别获得外部环境的数字音频信号及第二目标输出数字音频信号;
第二计算子单元,用于分别计算所述外部环境的数字音频信号及所述第二目标输出数字音频信号的能量参数;
功放子单元,用于若能量参数与信号能量大小的关系为正相关,所述外部环境的数字音频信号的能量参数与所述的数字音频信号的能量参数的差值大于第一预设值,提高对所述第一目标输出音频信号的功率放大倍数;
若能量参数与信号能量大小的关系为负相关,所述第二目标输出数字音频信号的能量参数与所述外部环境的数字音频信号的能量参数的差值大于第二预设值,提高对所述第一目标输出音频信号的功率放大倍数。
第三方面,本发明一实施例提供了一种音频处理装置,包括:
至少一个处理器,以及与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如第一方面所述的方法。
第四方面,本发明一实施例提供了一种计算机可读存储介质,包括:
所述计算机可读存储介质上存储有计算机指令,当所述计算机指令被音频处理装置的至少一个处理器执行时,实现如第一方面所述的方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
在本发明实施例中,对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小,然后,基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号,最后,对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号的技术方案,避免了现有技术中播报的输出音频的不清晰,不利于播报内容有效传达的技术问题,实现对能量集中的频段的音频进行放大后输出,提高播报的输出音频的清晰度的技术效果。
附图说明
图1为本发明实施例提供的音频处理方法流程图;
图2为本发明实施例提供的音频处理装置的结构示意图;
图3为图2中获取单元的功能子单元的结构示意图;
图4为图2中功放单元的功能子单元的结构示意图。
具体实施方式
为了解决现有技术中播报的输出音频的不清晰,不利于播报内容有效传达的技术问题,本发明实施例中的技术方案的总体思路如下:
首先,对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,其中,N为大于1的正整数;
然后,获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小;
之后,基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号;
最后,对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。请参考图1,本发明实施例一提供了一种音频处理方法,具体包括以下步骤:
步骤S101:对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,其中,N为大于1的正整数;
步骤S102:获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小;
步骤S103:基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号;
步骤S104:对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。
本发明实施例中的方法首先执行步骤S101,对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,其中,N为大于1的正整数。
在具体实践中,所述对输入的音频信号进行处理,具有以下两种处理方法:
方法1:对所述输入的音频信号进行分频处理,而获得各自属于不同频段的输出音频信号。
例如,以频段划分为高频段、中频段及低频段为例,其中,高频段的通频带为4KHz或以上的频率范围,中频段的通频带为800Hz至4KHz的频率范围,低频段的通频带为800Hz或以下的频率范围,因此输入的音频信号根据高频段、中频段、低频的通频带分为3路各自属于不同频段的音频信号。分频处理的频段划分处理除开上述的高频段、中频段及低频段的频段划分方式,还可以根据用户自身应用需要对频段进行的划分,例如,超低频段、低频段、中低频段、中频段、中高频段、次高频段、高频段、特高频段的八个频段划分方式,或者只进行二分频段划分方式。需要指出的是,上述举例是说明性的,不是对本申请中分频处理的频段划分方式的具体限定。
方法2:对所述输入的音频信号进行噪声隔离,获得去噪后的音频信号,并对所述去噪音后的音频信号进行分频处理。先对输入的音频信号进行去噪声的噪声隔离处理,然后再对去噪声后的音频信号进行分频处理,而获得各自属于不同频段的输出音频信号。
例如,智能语音提示系统通常在工控机的控制下与其它系统连接,导致输入的音频信号中会存在由电磁干扰、电流干扰等引起的系统内部噪声,此时可以先对输入的音频信号经过隔离变压器或噪声滤波器等噪声隔离单元去除该内部噪声,然后对去噪后的音频信号进行分频处理,此处的音频分频处理同样以高频段、中频段及低频段的频段划分方式为例,其中,高频段的通频带为4KHz或以上的频率范围,中频段的通频带为800Hz至4KHz的频率范围,低频段的通频带为800Hz或以下的频率范围,因此输入的音频信号根据高频段、中频段、低频段的通频带分为3路各自属于不同频段的音频信号。如方法一所述,分频处理的频段划分除划分为高频段、中频段及低频段之外,还可以有其它的划分方式,此处同样并不作限制。上述的智能语音提示系统可用于如出入境管理局外国人识别系统,海关的执法自助终端系统,海关或是边检的自助通道系统,银行与车站等公共场所的自助终端系统,学校和车站的人工播报系统以及小型个体机等。
所述输入的音频信号可以时通过音频采集装置接收的音频信号,例如是麦克风采集的语言信号;也可以是处理器所控制的存储介质内已存储的音频数据。
本发明实例中的方法在执行完步骤S101之后,将执行步骤S102,获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小。
在具体实施例中,对分频处理后的N个不同频段的输出音频信号进行模拟/数字转换,获得N个各自属于不同频段的数字音频信号,基于所述N个数字音频信号,计算所述N个输出音频信号各自的能量参数。其中,所述能量参数是用于表征音频信号能量大小,能量参数可以是与能量相关的音频信号的振幅大小,或直接计算短时平均能量等,总之,任何可以表征能量大小的参数均可以作为能量参数,此处不作限制。
例如,以分频处理的输出模拟语音信号为高频段模拟语音信号、中频段模拟语音信号及低频段模拟语音信号,信号幅度作为能量参数为例,由于模拟音频信号在时间及幅度上都是连续的,要获得上述的3路各自对应的不同频段的模拟音频信号的能量参数比较困难,因此对3路各自对应不同频段的模拟音频信号分别进行采样及量化处理,获得3路各自对应不同频段的数字音频信号。在t时刻,3路数字音频信号各自的能量参数即是t时刻3路数字音频信号各自对应的信号幅值,当然能量参数除了是某时刻的信号幅值,也可以是一个时间段内的信号幅值,如可以用t时刻至t+n时刻的平均信号幅值作为能量参数。
本发明实施例中的方法在执行完步骤S102之后,将执行步骤S103,基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号。
在具体实施例中,执行完步骤S102获得的N个不同频段各自对应的输出音频信号的能量参数,将在控制器的控制下选择出能量最大的1个输出音频信号作为第一目标输出音频信号。其中,该控制器可以是单片机、DSP、FPGA等能够实现上述功能的硬件设备。
例如,有高频段、中频段与低频段各自对应的3路输出音频信号,其中,高频段对应的输出音频信号的能量参数值为A,中频段对应的输出音频信号的能量参数值为B,低频段对应的输出音频信号的能量参数值为C,且上述3个能量参数值的大小满足条件A>C>B,此时,若能量参数与能量的关系是正相关的,控制器将会把高频段对应的输出音频信号作为第一目标输出音频信号;若能量参数与能量的关系是负相关的,控制器将会把中频段对应的输出音频信号作为第一目标输出音频信号。
本发明实施例中的方法在执行完步骤S103之后,将执行步骤S104,对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。
在具体实施例中,首先,通过音频采集装置如麦克风收集外部环境声音的音频信号,然后,对外部环境声音的音频信号和第二目标输出音频信号进行采样与量化,实现模拟/数字转换,获得外部环境的数字音频信号,之后,分别计算所述外部环境的数字音频信号及所述第二目标输出数字音频信号的能量参数,最后,若能量参数与信号能量大小的关系为正相关,所述外部环境的数字音频信号的能量参数与所述的数字音频信号的能量参数的差值大于第一预设值,提高对所述第一目标输出音频信号的功率放大倍数;若能量参数与信号能量大小的关系为负相关,所述第二目标输出数字音频信号的能量参数与所述外部环境的数字音频信号的能量参数的差值大于第二预设值,提高对所述第一目标输出音频信号的功率放大倍数。其中,外部环境的数字音频信号和第二目标输出数字音频信号的能量参数的计算方式和步骤S102所述的输出音频信号的能量参数的计算方式相同,该能量参数可以是与能量相关的音频信号的振幅大小,或直接计算短时平均能量等,总之,能表征能量大小的参数均可,此处不作限制。
例如,若处于外部播放环境的麦克风收集的环境声音信号是模拟信号,在获取外部环境音频信号的能量参数之前仍然需要进行模拟/数字转换,若外部环境的数字音频信号的能量参数为幅度值V1,第二目标输出数字音频信号的能量参数为幅度值V2,预设值为V3。因为音频信号的能量与幅度值的关系为正相关,幅度值越大说明能量越大,比较外部环境的数字音频信号与第二目标输出数字音频信号的能量,可转化为比较它们幅度值的大小。在t时刻,外部环境的数字音频信号的能量参数与第二目标输出数字音频信号的能量参数的差值为D_value=V1-V2,当D_value<V3时,说明此时外部播放环境的音频能量比第二目标输出音频能量小,即使t+n时刻保持现有的功率放大倍数不变,也可以保证在t+n时刻的第二目标输出音频不被外部播放环境音淹没;当D_value>V3时,说明外部环境的音频能量比第二目标输出音频能量大,为保证t+n时刻的第二目标输出音频不会被外部环境的声音淹没,在t+n时刻,提高对第二目标输出音频功率放大倍数。
此时,可以通过在控制器控制功率放大器接通不同阻值的反馈电阻电路,提高对第二目标输出音频功率放大倍数,如果,反馈电阻电路R1接对应的功率放大倍数为a倍,反馈电阻电路R2对应的功率放大倍数为b倍,反馈电阻电路R3对应的功率放大倍数为c倍,且a、b、c各不相等,外部环境的数字音频信号的能量参数与第二目标输出音频信号的能量参数的比值S_value=V1/V2,在对应的功率放大倍数大于S_value的反馈电阻电路中,选择接通对应放大倍数最小的反馈电阻电路与功率放大器的线路,那么第二目标输出音频功率放大倍数得以提高。当然,提高功率放大倍数的方式除了上述改变反馈电阻阻值的方式,还可以是其他的方式,此处不作限制。
为了更加系统的阐述本发明实施例一所述方法,以商场、学校等公共场所使用的小型简单语音播报系统为例,首先将播报的语音信号进行噪声隔离,去除如电磁干扰、电流干扰等引起的系统内部噪声和/或背景噪声等,获得去噪后的播报语音信号;其次,将该去噪后的播报语音信号进行分频处理,获得与高频段、中频段及低频段各自对应的3路播报语音信号,;然后,将3路播报语音信号分别进行模拟/数字转换,获得对应不同频段的3路数字播报语音信号,若在t时刻,3路播报数字语音信号的幅度值分别为p1、p2、p3,其中p1>p3>p2,由于语音信号的能量最大的频段包含了该语音信号最主要的信息,为尽量少的输出未剔除的噪声,以最大幅度值p1对应的播报语音信号作为第一目标输出语音信号;之后,对t时刻的第一目标输出语音信号进行功率放大,获得t时刻的第二目标输出语音信号,同时,通过音频采集装置(如麦克风)收录语音信号输出的环境音频,并将环境音频信号进行模拟/数字转换,获取t时刻的幅度值作为对应的能量参量q,计算q减p1的差值D_value,如果该差值D_value大于预设值u,为保证t+n时刻第二目标输出音频不会被外部环境的声音淹没,可以在控制器控制下选择接通一条可提高功放倍数的反馈电阻电路与功率放大器的线路,以提高t+n时刻的第一目标输出语音信号的功率放大倍数;最后,对t+n时刻的第二目标输出音频信号用扬声器播出,其中,为更清晰度的播放第二目标输出音频信号,可以在功率放大器的输出端接上与高频段、中频段及低频段向适应的扬声器。本实施例中选择了噪声隔离后的能量最大的频段对应的音频进行功率放大,减少未剔除的噪声的输出,功率放大倍数考虑了环境音的响度,使得播出的音频更加的清晰
基于同一发明构思,本发明实施例二提供了一种音频处理装置,图2为本申请实施例二提供的一种音频处理装置的结构示意图,包括:
处理单元201,用于对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,其中,N为大于1的正整数;
获取单元202,用于获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小;
选择单元203,用于基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号;
功放单元204,用于对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。
可选的,所述处理单元201包括:
第一分频子单元,用于对所述输入的音频信号进行分频处理;或者
所述处理单元201包括:
去噪子单元,用于对所述输入的音频信号进行噪声隔离,获得去噪后的音频信号;
第二分频子单元,用于对所述去噪后的音频信号进行分频处理。
可选的,所述第一分频子单元包含多个对应不同频段的第一分频模块,例如,第一高频分频模块的频率范围为4KHz或以上,第一中高频分频模块的频率范围为800Hz至4KHz,第一低频分频模块的频率范围为800Hz或以下。
可选的,多个所述第一分频模块的输入接口为相同的接口。
可选的,所述第二分频子单元包含多个对应不同频段的第二分频模块,例如,第二高频分频模块的频率范围为4KHz或以上,第二中高频分频模块的频率范围为800Hz至4KHz,第二低频分频模块的频率范围为800Hz或以下。
可选的,如图3所示,在上述图2的实施例的基础上,所述获取单元202,包括:
第一模拟/数字转换子单元2021,用于分别对所述N个输出音频信号进行模拟/数字转换,获得N个各自属于不同频段的数字音频信号;
第一计算子单元2022,用于基于所述N个数字音频信号,计算所述N个输出音频信号各自的能量参数。其中,能量参数可以是与能量相关的音频信号的振幅大小,或直接计算短时平均能量等,总之,任何可以表征能量大小的参数均可以作为能量参数,此处不作限制。可选的,如图4所示,在上述图2的实施例的基础上,所述功放单元204,包括:
检测子单元2041,用于检测外部环境声音的音频信号;
第二模拟/数字转换子单元2042,用于对所述外部环境声音的音频信号与所述第二目标输出音频信号分别进行模拟/数字转换,分别获得外部环境的数字音频信号及第二目标输出数字音频信号;
第二计算子单元2043,用于分别计算所述外部环境的数字音频信号及所述第二目标输出数字音频信号的能量参数;
功放子单元2044,用于若能量参数与信号能量大小的关系为正相关,所述外部环境的数字音频信号的能量参数与所述的数字音频信号的能量参数的差值大于第一预设值,提高对所述第一目标输出音频信号的功率放大倍数;
若能量参数与信号能量大小的关系为负相关,所述第二目标输出数字音频信号的能量参数与所述外部环境的数字音频信号的能量参数的差值大于第二预设值,提高对所述第一目标输出音频信号的功率放大倍数。
可选的,所述去噪子单元的输出接口,所述第一分频模块、所述第二分频模块及所述功放单元的输入接口和输出接口均可用相同的接口,以增加音频处理装置的可扩展性,方便在使用时根据实际需要随时扩展。上述接口可选择EX-2EDGV、EX-2EDG-5.08的插拔式接线端子,UDK-PLC-RI的光电耦合接线端子等,需要说明,此处的举例是说明性的,并不是对接口类型的限制。
可选的,所述音频处理装置的供电设备可选择线性变压设备,为减小电源对音频信号的干扰,可以在供电设备的输入端的接入保护电源的滤波装置。
基于同一发明构思,本发明实施例三提供了一种音频处理装置,包括:
至少一个处理器,以及与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如实施例一所述的方法。
基于同一发明构思,本发明实施例四提供了一种计算机可读存储介质,包括:
所述计算机可读存储介质上存储有计算机指令,当所述计算机指令被音频处理装置的至少一个处理器执行时,实现如实施例一所述的方法。
上述本发明实施例中的技术方案,至少具有如下的技术效果或优点:
首先,对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小,然后,基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号,最后,对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。该方案解决了现有技术中播报的输出音频的不清晰的技术问题,实现对能量集中的频段的音频进行放大后输出,提高播报的输出音频的清晰度的技术效果。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
本领域内的技术人员应明白,本发明实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、设备、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种音频处理方法,其特征在于,所述方法包括:
对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,其中,N为大于1的正整数;
获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小;
基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号;
对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。
2.如权利要求1所述方法,其特征在于,所述对输入的音频信号进行处理,包括:
对所述输入的音频信号进行分频处理;或者
对所述输入的音频信号进行噪声隔离,获得去噪后的音频信号,并对所述去噪音后的音频信号进行分频处理。
3.如权利要求1所述方法,其特征在于,所述获取所述N个输出音频信号各自的能量参数,包括:
分别对所述N个输出音频信号进行模拟/数字转换,获得N个各自属于不同频段的数字音频信号;
基于所述N个数字音频信号,计算所述N个输出音频信号各自的能量参数。
4.如权利要求1至3任一项所述方法,其特征在于,所述对所述第一目标输出音频信号进行功率放大处理,包括:
检测外部环境声音的音频信号;
对所述外部环境声音的音频信号与所述第二目标输出音频信号分别进行模拟/数字转换,分别获得外部环境的数字音频信号及第二目标输出数字音频信号;
分别计算所述外部环境的数字音频信号及所述第二目标输出数字音频信号的能量参数;
若能量参数与信号能量大小的关系为正相关,所述外部环境的数字音频信号的能量参数与所述的数字音频信号的能量参数的差值大于第一预设值,提高对所述第一目标输出音频信号的功率放大倍数;
若能量参数与信号能量大小的关系为负相关,所述第二目标输出数字音频信号的能量参数与所述外部环境的数字音频信号的能量参数的差值大于第二预设值,提高对所述第一目标输出音频信号的功率放大倍数。
5.一种音频处理装置,其特征在于,包括:
处理单元,用于对输入的音频信号进行处理,获得N个各自属于不同频段的输出音频信号,其中,N为大于1的正整数;
获取单元,用于获取所述N个输出音频信号各自的能量参数,所述能量参数用于表征信号能量大小;
选择单元,用于基于所述能量参数,在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号;
功放单元,用于对所述第一目标输出音频信号进行功率放大处理,获得第二目标输出音频信号。
6.如权利要求5所述的装置,其特征在于,
所述处理单元包括:
第一分频子单元,用于对所述输入的音频信号进行分频处理;或者
所述处理单元包括:
去噪子单元,用于对所述输入的音频信号进行噪声隔离,获得去噪后的音频信号;
第二分频子单元,用于对所述去噪后的音频信号进行分频处理。
7.如权利要求5所述的装置,其特征在于,所述获取单元,包括:
第一模拟/数字转换子单元,用于分别对所述N个输出音频信号进行模拟/数字转换,获得N个各自属于不同频段的数字音频信号;
第一计算子单元,用于基于所述N个数字音频信号,计算所述N个输出音频信号各自的能量参数。
8.如权利要求5至7任一项所述的装置,其特征在于,所述功放单元,包括:
检测子单元,用于检测外部环境声音的音频信号;
第二模拟/数字转换子单元,用于对所述外部环境声音的音频信号与所述第二目标输出音频信号分别进行模拟/数字转换,分别获得外部环境的数字音频信号及第二目标输出数字音频信号;
第二计算子单元,用于分别计算所述外部环境的数字音频信号及所述第二目标输出数字音频信号的能量参数;
功放子单元,用于若能量参数与信号能量大小的关系为正相关,所述外部环境的数字音频信号的能量参数与所述的数字音频信号的能量参数的差值大于第一预设值,提高对所述第一目标输出音频信号的功率放大倍数;
若能量参数与信号能量大小的关系为负相关,所述第二目标输出数字音频信号的能量参数与所述外部环境的数字音频信号的能量参数的差值大于第二预设值,提高对所述第一目标输出音频信号的功率放大倍数。
9.一种音频处理装置,其特征在于,包括:
至少一个处理器,以及与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,包括:
所述计算机可读存储介质上存储有计算机指令,当所述计算机指令被音频处理装置的至少一个处理器执行时,实现如权利要求1-4中任一项所述的方法。
CN201810884112.6A 2018-08-06 2018-08-06 一种音频处理方法及装置 Active CN110808064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810884112.6A CN110808064B (zh) 2018-08-06 2018-08-06 一种音频处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810884112.6A CN110808064B (zh) 2018-08-06 2018-08-06 一种音频处理方法及装置

Publications (2)

Publication Number Publication Date
CN110808064A true CN110808064A (zh) 2020-02-18
CN110808064B CN110808064B (zh) 2022-06-03

Family

ID=69486964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810884112.6A Active CN110808064B (zh) 2018-08-06 2018-08-06 一种音频处理方法及装置

Country Status (1)

Country Link
CN (1) CN110808064B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112929794A (zh) * 2021-01-26 2021-06-08 歌尔科技有限公司 音效调节方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5666426A (en) * 1996-10-17 1997-09-09 Advanced Micro Devices, Inc. Automatic volume control to compensate for ambient noise variations
CN103915103A (zh) * 2014-04-15 2014-07-09 成都凌天科创信息技术有限责任公司 语音质量增强系统
CN105812919A (zh) * 2014-12-30 2016-07-27 深圳Tcl数字技术有限公司 音频多功放处理的方法及装置
CN206181171U (zh) * 2016-11-10 2017-05-17 上海传英信息技术有限公司 一种手机外放音质自动调节系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5666426A (en) * 1996-10-17 1997-09-09 Advanced Micro Devices, Inc. Automatic volume control to compensate for ambient noise variations
CN103915103A (zh) * 2014-04-15 2014-07-09 成都凌天科创信息技术有限责任公司 语音质量增强系统
CN105812919A (zh) * 2014-12-30 2016-07-27 深圳Tcl数字技术有限公司 音频多功放处理的方法及装置
CN206181171U (zh) * 2016-11-10 2017-05-17 上海传英信息技术有限公司 一种手机外放音质自动调节系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112929794A (zh) * 2021-01-26 2021-06-08 歌尔科技有限公司 音效调节方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110808064B (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
AU2014340178B2 (en) System and method for digital signal processing
CN103081356B (zh) 用于控制音频信号的临界频带中的失真的方法和系统
CN103428607A (zh) 一种音频信号播放系统及电子设备
US9431982B1 (en) Loudness learning and balancing system
KR101855969B1 (ko) 오디오 신호를 압축하는 디지털 압축기
CN105900335B (zh) 用于压缩音频信号的音频压缩系统
EP2545552A1 (en) Method and system for scaling ducking of speech-relevant channels in multi-channel audio
CN102497168B (zh) 智能音量限制装置及方法
CN104967951A (zh) 一种降低噪声的方法和装置
CN104363510B (zh) 一种播放终端
CN101843115A (zh) 听觉灵敏度校正装置
JP6785907B2 (ja) ワイヤレススピーカの配置方法、ワイヤレススピーカ及び端末装置
EP2460156A1 (en) Method and device for eliminating background noise
CN110808064B (zh) 一种音频处理方法及装置
CN107886964B (zh) 一种音频处理方法及其系统
CN103618983A (zh) 一种音响控制电路和控制方法
CN105261363A (zh) 一种语音识别的方法、装置及终端
WO2011034520A1 (en) System and method for modifying an audio signal
CN111726730A (zh) 声音播放装置及其调整输出声音的方法
US9514765B2 (en) Method for reducing noise and computer program thereof and electronic device
JP2006042027A (ja) 音量制御装置
EP3471267B1 (en) Method and apparatus for repairing distortion of an audio signal
US10374566B2 (en) Perceptual power reduction system and method
US9571950B1 (en) System and method for audio reproduction
CN205195946U (zh) 一种dac音响设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant