CN104699447B - 一种基于能量统计的语音音量自动调整方法 - Google Patents

一种基于能量统计的语音音量自动调整方法 Download PDF

Info

Publication number
CN104699447B
CN104699447B CN201510109054.6A CN201510109054A CN104699447B CN 104699447 B CN104699447 B CN 104699447B CN 201510109054 A CN201510109054 A CN 201510109054A CN 104699447 B CN104699447 B CN 104699447B
Authority
CN
China
Prior art keywords
factor
peak
max
frame
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510109054.6A
Other languages
English (en)
Other versions
CN104699447A (zh
Inventor
松春锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Wanpeng Digital Intelligence Technology Co ltd
Original Assignee
Zhejiang Wanpeng Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Wanpeng Education Technology Co Ltd filed Critical Zhejiang Wanpeng Education Technology Co Ltd
Priority to CN201510109054.6A priority Critical patent/CN104699447B/zh
Publication of CN104699447A publication Critical patent/CN104699447A/zh
Application granted granted Critical
Publication of CN104699447B publication Critical patent/CN104699447B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本发明公开了一种基于能量统计的语音音量自动调整方法。本发明包括如下步骤:(1)统计每帧采样点的能量平均值energy和该帧中所有采样点能量值的绝对值中的最大值峰值peak;(2)计算0到frame_index帧中每帧采样点的能量平均值energy的平均值energy_avg和最大值峰值peak的平均值peak_avg;(3)计算下个时间段time内的放大因子factor_max′和缩小因子factor_min′;(4)对下个时间段time内的每帧语音数据进行判定,当需要缩放时,通过缩放因子进行放大或者缩小;(5)将处理好后的语音数据帧输出,结束。本发明利用语音数据的相似性和持续性,根据前一段时间的语音数据统计信息,来预测下一段时间需要用到的放大因子和缩小因子,在满足实用性的同时尽量降低算法的复杂度。

Description

一种基于能量统计的语音音量自动调整方法
技术领域
本发明属于计算机数字语音处理通信领域,具体来说是一种基于能量统计的语音音量自动调整方法。
背景技术
在语音处理通信领域,比如在线教育系统、视频会议系统等,从麦克风输入的语音数据由于各种情况的影响,语音有可能太小,也有可能太大,通过音量调整模块对语音音量进行相应的增加或减少,可以维持音量大小的相对稳定,让人听起来比较舒适。
在各种语音处理通信系统中,大部分系统都有音量自动调整的功能,实现方法主要有两大类,一是通过调整系统麦克风音量来改变从麦克风采集到的源语音的音量来实现,二是通过软件对采集到的语音数据进行放大和缩小来实现,而第二种通过软件来实现的方法又可以进一步进行细分为在时域和频域中进行实现。在通过调整系统麦克风音量实现时,当判断出音量需要增强或者减少时,通过调用系统的麦克风接口,对麦克风的增益和音量进行相应的增加和减少来达到音量的自动调整,优点是可以降低软件处理时需要的计算量,对语音音质不会造成影响,缺点是会对系统音量进行频繁调整,会影响到用户体验;在通过软件在时域中进行处理时,会直接对pcm语音数据进行缩放运算,其优点是算法简单,计算量小,缺点是理论上会对一些语音中的噪音也进行相应的发大和缩小,但是实际使用过程中发现对用户体验影响并不大,而在频域中处理时需要先将pcm数据变换到频域中,在频域中进行相应的处理后再把频域中的数据通过逆变换转换为pcm数据,在频域中处理的优点是可以对各个频段的数据进行控制,更有目的地对需要的频段和数据进行缩放,缺点是算法复杂度高,计算量比较大。通过软件对语音数据进行音量调整时,优点是不需要对系统麦克风音量进行操作,对系统音量不会造成影响,缺点是需要一定的计算量,对音质也会有些影响。
各个系统根据实际需求情况来决定使用哪种方法进行自动音量调整,一般都是在满足需求的基础上力求简单,从而达到节省资源的目的。
发明内容
本发明的目的是针对现有技术的不足,提供一种基于能量统计的语音音量自动调整方法。本发明对判定为语音的数据进行处理,对噪声等非语音数据不进行处理,语音数据的判定通过vad算法进行,本发明不对vad算法进行讨论。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤(1)、统计每帧采样点的能量平均值energy和该帧中所有采样点能量值的绝对值中的最大值峰值peak,计算公式如下:
energy=(|sample[0]|+...+|sample[count-1]|)÷count;
peak=max(|sample[0]|,...,|sample[count-1]|);
即能量平均值energy为每个采样点的能量值的绝对值之和再除以该帧中总的采样点个数;sample[i]表示当前语音数据帧中第i个采样点的值,0≤i≤count-1,sample[i]数据类型为16位的short型,取值范围为32767≥sample[i]≥-32768;
步骤(2)、计算0到frame_index帧中每帧采样点的能量平均值energy的平均值energy_avg和最大值峰值peak的平均值peak_avg,计算公式如下:
energy_avg=(energy[0]+...+energy[frame_index])÷frame_count;
即energy_avg为每帧的采样点的能量平均值energy相加再除以总的帧数frame_count;frame_count=time÷frame_len,其中frame_len为语音数据帧的长度,该长度为10或20毫秒;
peak_avg=(peak[0]+...+peak[frame_index])÷frame_count;
即peak_avg为每帧中采样点的最大值峰值peak相加再除以总的帧数frame_count;其中,frame_count为time时间内总的帧数,即时间段time内要统计的帧数;frame_index表示当前处理的语音数据帧的索引;
步骤(3)、计算下个时间段time内的放大因子factor_max′和缩小因子factor_min′;所述的放大因子和缩小因子在最开始的时间段time内不进行缩放操作,其初始值都均为1.0,当frame_index>=frame_count时(即time时间内统计结束),计算一次缩放因子;
所述的缩放判定条件和计算公式如下:
3-1.当peak_avg<peak_max_threshold时,预测下个时间段time内的音量偏小,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_temp=peak_max_threshold÷peak_avg;
factor_max′=factor_max×0.6+factor_temp×0.4;
factor_min′=factor_min×0.6+1.0×0.4;
其中,factor_temp为临时因子,是计算下个时间段time内放大因子factor_max′和缩小因子factor_min′的临时变量;peak_max_threshold为最大峰值均值peak_avg的放大阈值(即峰值均值阈值下限);factor_max为当前时间段time内放大因子,factor_min为当前时间段time内缩小因子;
具体的,下个时间段time内放大因子factor_max′通过临时因子factor_temp的计算,尽量将语音数据帧的peak_avg放大到放大阈值peak_max_threshold的大小附近,下个时间段time内放大因子factor_max′通过权重来分配当前时间段time内的放大因子factor_max和临时因子factor_temp的比重,使下个时间段time内的放大因子factor_max′平滑进行增大最终稳定在一个大于1.0的浮点值附近;由于此时是音量偏小,所以下个时间段time内缩小因子factor_min′通过计算最终会趋向初始值1.0附近;
3-2.当peak_avg>peak_min_threshold时,预测下个时间段time内的音量偏大,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_temp=peak_avg÷peak_min_threshold;
factor_min′=factor_min×0.6+factor_temp×0.4;
factor_max′=factor_max×0.6+1.0×0.4;
其中,peak_min_threshold为语音数据帧的采样点的峰值均值peak_avg的缩小阈值(即峰值均值阈值上限);
具体的,下个时间段time内缩小因子factor_min′通过临时因子factor_temp的计算,尽量将语音数据帧的peak_avg缩小到缩小阈值peak_min_threshold的大小附近,下个时间段time内缩小因子factor_min′通过权重来分配当前时间段time内的缩小因子factor_min和临时因子factor_temp的比重,使下个时间段time内的缩小因子factor_min′平滑进行增大最终稳定在一个大于1.0的浮点值附近;由于此时是音量偏大,所以下个时间段time内放大因子factor_max′通过计算最终会趋向初始值1.0附近;
3-3.当peak_min_threshold≤peak_avg≤peak_max_threshold时,预测下个时间段time内音量正常,不需要对音量进行缩小放大,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_min′=factor_min×0.6+1.0×0.4;
factor_max′=factor_max×0.6+1.0×0.4;
其中,下个时间段time内的放大因子factor_max′和缩小因子factor_min′通过上述公式计算最终会趋向初始值1.0附近。
步骤(4)、对下个时间段time内的每帧语音数据进行判定,当需要缩放时,通过缩放因子进行放大或者缩小;
4-1.当energy<energy_avg_max_threshold,或者peak<peak_max_threshold时,该语音数据帧需要放大;
其中,energy_avg_max_threshold为能量平均值energy的放大阈值(即能量均值阈值下限);
4-1-1.判断是否需要修正放大因子factor_max′,防止放大后的最大值峰值peak超出其放大峰值上限peak_max_volume;若factor_max′>factor_temp′>1.0,则放大因子factor_max′修正如下:放大因子factor_max′=factor_temp′;
其中,另一个临时因子factor_temp′=peak_max_volume÷peak;
通过计算临时因子factor_temp′来防止放大因子factor_max′过大,造成放大后的音量超过放大峰值上限peak_max_volume的情况发生;
4-1-2.对该语音数据帧中的每个采样点的音量进行如下放大:
sample[i]=sample[i]×factor_max′;且32767≥sample[i]≥-32768;
4-2.当energy>energy_avg_min_threshold或者peak>peak_min_threshold时,该语音数据帧需要缩小;
4-2-1.判断是否需要修正缩小因子factor_min′,防止缩小后的最大值峰值peak超出其缩小峰值下限peak_min_volume;如果factor_min′>factor_temp″>1.0,则缩小因子factor_min′修正如下:缩小因子factor_min′=factor_temp″;
其中,另一个临时因子factor_temp″=peak÷peak_min_volume
通过计算另一个临时因子factor_temp″来防止缩小因子factor_min′过大造成缩小后的数据小于缩小峰值下限peak_min_volume的情况发生,
4-2-2.对该语音数据帧中的每个采样点的音量进行如下缩小:
sample[i]=sample[i]÷factor_min′;且32767≥sample[i]≥-32768;
4-3.其他情况下,音量在正常范围,不进行放大和缩小。
步骤(5)、将处理好后的语音数据帧输出,结束。
本发明会尽量将采样点的绝对值维持在放大峰值上限peak_max_volume和缩小峰值下限peak_min_volume之间,正常音数据量的采样点值并不会被放大和缩小。
本发明有益效果如下:
本发明从简单实用的角度出发,能够对在语音音量小的时候对音量进行放大,音量过大的时候对音量进行减小,音量适中的时候不进行操作,从而保持音量在一定范围内,使人听起来比较舒适。
本发明通过对过去一段时间内的语音数据的采样点进行峰值统计和能量统计,通过统计出来的特征数据和判定条件来计算出相应的放大因子和缩小因子,利用放大因子和缩小因子对下一时间段满足判定条件的语音数据进行放大或者缩小,从而将语音音量维持在一定范围内,达到音量自动调节的目的。
本发明利用语音数据的相似性和持续性,根据前一段时间的语音数据统计信息,来预测下一段时间需要用到的放大因子和缩小因子,在满足实用性的同时尽量降低算法的复杂度。
附图说明
图1为本发明的流程图。
具体实施方式
下面对本发明的具体实施方式进行说明。
如图1所示,一种基于能量统计的语音音量自动调整方法,包括如下步骤:
步骤(1)、统计每帧采样点的能量平均值energy和该帧中所有采样点能量值的绝对值中的最大值峰值peak,计算公式如下:
energy=(|sample[0]|+...+|sample[count-1]|)÷count;
peak=max(|sample[0]|,...,|sample[count-1]|);
即能量平均值energy为每个采样点的能量值的绝对值之和再除以该帧中总的采样点个数;sample[i]表示当前语音数据帧中第i个采样点的值,0≤i≤count-1,sample[i]数据类型为16位的short型,取值范围为32767≥sample[i]≥-32768;
步骤(2)、计算0到frame_index帧中每帧采样点的能量平均值energy的平均值energy_avg和最大值峰值peak的平均值peak_avg,计算公式如下:
energy_avg=(energy[0]+...+energy[frame_index])÷frame_count;
即energy_avg为每帧的采样点的能量平均值energy相加再除以总的帧数frame_count;frame_count=time÷frame_len,其中frame_len为语音数据帧的长度,该长度为10或20毫秒;
peak_avg=(peak[0]+...+peak[frame_index])÷frame_count;
即peak_avg为每帧中采样点的最大值峰值peak相加再除以总的帧数frame_count;其中,frame_count为time时间内总的帧数,即时间段time内要统计的帧数;frame_index表示当前处理的语音数据帧的索引;
步骤(3)、计算下个时间段内放大因子factor_max′和缩小因子factor_min′;所述的放大因子和缩小因子在最开始的时间段time内不进行缩放操作,其初始值都均为1.0,当frame_index>=frame_count时(即time时间内统计结束),计算一次缩放因子;
所述的缩放判定条件和计算公式如下:
3-1.当peak_avg<peak_max_threshold时,预测下个时间段time内的音量偏小,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_temp=peak_max_threshold÷peak_avg;
factor_max′=factor_max×0.6+factor_temp×0.4;
factor_min′=factor_min×0.6+1.0×0.4;
其中,factor_temp为临时因子,是计算下个时间段time内放大因子factor_max′和缩小因子factor_min′的临时变量;peak_max_threshold为最大值峰值均值peak_avg的放大阈值(即峰值均值阈值下限);factor_max为当前时间段time内放大因子,factor_min为当前时间段time内缩小因子;
具体的,下个时间段time内放大因子factor_max′通过临时因子factor_temp的计算,尽量将语音数据帧的peak_avg放大到放大阈值peak_max_threshold的大小附近,下个时间段time内放大因子factor_max′通过权重来分配当前时间段time内的放大因子factor_max和临时因子factor_temp的比重,使下个时间段time内的放大因子factor_max′平滑进行增大最终稳定在一个大于1.0的浮点值附近;由于此时是音量偏小,所以下个时间段time内缩小因子factor_min′通过计算最终会趋向初始值1.0附近;
3-2.当peak_avg>peak_min_threshold时,预测下个时间段time内的音量偏大,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_temp=peak_avg÷peak_min_threshold;
factor_min′=factor_min×0.6+factor_temp×0.4;
factor_max′=factor_max×0.6+1.0×0.4;
其中,peak_min_threshold为语音数据帧的采样点的最大值峰值均值peak_avg的缩小阈值(即峰值均值阈值上限);
具体的,下个时间段time内缩小因子factor_min′通过临时因子factor_temp的计算,尽量将语音数据帧的peak_avg缩小到缩小阈值peak_min_threshold的大小附近,下个时间段time内缩小因子factor_min′通过权重来分配当前时间段time内的缩小因子factor_min和临时因子factor_temp的比重,使下个时间段time内的缩小因子factor_min′平滑进行增大最终稳定在一个大于1.0的浮点值附近;由于此时是音量偏大,所以下个时间段time内放大因子factor_max′通过计算最终会趋向初始值1.0附近;
3-3.当peak_min_threshold≤peak_avg≤peak_max_threshold时,预测下个时间段time内音量正常,不需要对音量进行缩小放大,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_min′=factor_min×0.6+1.0×0.4;
factor_max′=factor_max×0.6+1.0×0.4;
其中,下个时间段time内的放大因子factor_max′和缩小因子factor_min′通过上述公式计算最终会趋向初始值1.0附近。
步骤(4)、对下个时间段time内的每帧语音数据进行判定,当需要缩放时,通过缩放因子进行放大或者缩小,其中
peak_max_threshold<peak_max_volume,
peak_min_threshold>peak_min_volume,
peak_max_threshold<peak_min_threshold;
4-1.当energy<energy_avg_max_threshold,或者peak<peak_max_threshold时,该语音数据帧需要放大;
其中,energy_avg_max_threshold为能量平均值energy的放大阈值(即能量均值阈值下限);
4-1-1.判断是否需要修正放大因子factor_max′,防止放大后的最大值峰值peak超出其放大峰值上限peak_max_volume;若factor_max′>factor_temp′>1.0,则放大因子factor_max′修正如下:放大因子factor_max′=factor_temp′;
其中,另一个临时因子factor_temp′=peak_max_volume÷peak;
通过计算临时因子factor_temp′来防止放大因子factor_max′过大,造成放大后的音量超过放大峰值上限peak_max_volume的情况发生;
4-1-2.对该语音数据帧中的每个采样点的音量进行如下放大:
sample[i]=sample[i]×factor_max′;且32767≥sample[i]≥-32768;
4-2.当energy>energy_avg_min_threshold或者peak>peak_min_threshold时,该该语音数据帧需要缩小;
4-2-1.判断是否需要修正缩小因子factor_min′,防止缩小后的最大值峰值peak超出其缩小峰值下限peak_min_volume;如果factor_min′>factor_temp″>1.0,则缩小因子factor_min′修正如下:缩小因子factor_min′=factor_temp″;
其中,另一个临时因子factor_temp″=peak÷peak_min_volume
通过计算另一个临时因子factor_temp″来防止缩小因子factor_min′过大造成缩小后的数据小于缩小峰值下限peak_min_volume的情况发生,
4-2-2.对该语音数据帧中的每个采样点的音量进行如下缩小:
sample[i]=sample[i]÷factor_min′;且32767≥sample[i]≥-32768;
4-3.其他情况下,音量在正常范围,不进行放大和缩小。
步骤(5)、将处理好后的语音数据帧输出,结束。
本发明会尽量将采样点的绝对值维持在放大峰值上限peak_max_volume和缩小峰值下限peak_min_volume之间,正常音量数据的采样点值并不会被放大和缩小。

Claims (1)

1.一种基于能量统计的语音音量自动调整方法,其特征在于包括如下步骤:
步骤(1)、统计每帧采样点的能量平均值energy和该帧中所有采样点能量值的绝对值中的最大值峰值peak,计算公式如下:
energy=(|sample[0]|+...+|sample[count-1]|)÷count;
peak=max(|sample[0]|,...,|sample[count-1]|);
即能量平均值energy为每个采样点的能量值的绝对值之和再除以该帧中总的采样点个数;sample[i]表示当前语音数据帧中第i个采样点的值,0≤i≤count-1,sample[i]数据类型为16位的short型,取值范围为32767≥sample[i]≥-32768;
步骤(2)、计算0到frame_index帧中每帧采样点的能量平均值energy的平均值energy_avg和最大值峰值peak的平均值peak_avg,计算公式如下:
energy_avg=(energy[0]+...+energy[frame_index])÷frame_count;
即energy_avg为每帧的采样点的能量平均值energy相加再除以总的帧数frame_count;frame_count=time÷frame_len,其中frame_len为语音数据帧的长度,该长度为10或20毫秒;peak_avg=(peak[0]+...+peak[frame_index])÷frame_count;
即peak_avg为每帧中采样点的最大值峰值peak相加再除以总的帧数frame_count;其中,frame_count为time时间内总的帧数,即时间段time内要统计的帧数;frame_index表示当前处理的语音数据帧的索引;
步骤(3)、计算下个时间段time内的放大因子factor_max′和缩小因子factor_min′;所述的放大因子和缩小因子在最开始的时间段time内不进行缩放操作,其初始值都均为1.0,当frame_index>=frame_count时,计算一次缩放因子;
缩放判定条件和计算公式如下:
3-1.当peak_avg<peak_max_threshold时,预测下个时间段time内的音量偏小,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_temp=peak_max_threshold÷peak_avg;
factor_max′=factor_max×0.6+factor_temp×0.4;
factor_min′=factor_min×0.6+1.0×0.4;
其中,factor_temp为临时因子,是计算下个时间段time内放大因子factor_max′和缩小因子factor_min′的临时变量;peak_max_threshold为最大峰值均值peak_avg的放大阈值;factor_max为当前时间段time内放大因子,factor_min为当前时间段time内缩小因子;
3-2.当peak_avg>peak_min_threshold时,预测下个时间段time内的音量偏大,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_temp=peak_avg÷peak_min_threshold;
factor_min′=factor_min×0.6+factor_temp×0.4;
factor_max′=factor_max×0.6+1.0×0.4;
其中,peak_min_threshold为语音数据帧的采样点的峰值均值peak_avg的缩小阈值;
3-3.当peak_min_threshold≤peak_avg≤peak_max_threshold时,预测下个时间段time内音量正常,不需要对音量进行缩小放大,则下个时间段time内的放大因子factor_max′和缩小因子factor_min′需如下操作:
factor_min′=factor_min×0.6+1.0×0.4;
factor_max′=factor_max×0.6+1.0×0.4;
其中,下个时间段time内的放大因子factor_max′和缩小因子factor_min′通过步骤3-3公式计算趋向初始值1.0附近;
步骤(4)、对下个时间段time内的每帧语音数据进行判定,当需要缩放时,通过缩放因子进行放大或者缩小;
4-1.当energy<energy_avg_max_threshold,或者peak<peak_max_threshold时,该语音数据帧需要放大;
其中,energy_avg_max_threshold为能量平均值energy的放大阈值;
4-1-1.判断是否需要修正放大因子factor_max′,防止放大后的最大值峰值peak超出其放大峰值上限peak_max_volume;若factor_max′>factor_temp′>1.0,则放大因子factor_max′修正如下:放大因子factor_max′=factor_temp′;
其中,另一个临时因子factor_temp′=peak_max_volume÷peak;
通过计算临时因子factor_temp′来防止放大因子factor_max′过大,造成放大后的音量超过放大峰值上限peak_max_volume的情况发生;
4-1-2.对该语音数据帧中的每个采样点的音量进行如下放大:
sample[i]=sample[i]×factor_max′;且32767≥sample[i]≥-32768;
4-2.当energy>energy_avg_min_threshold或者peak>peak_min_threshold时,该语音数据帧需要缩小;
4-2-1.判断是否需要修正缩小因子factor_min′,防止缩小后的最大值峰值peak超出其缩小峰值下限peak_min_volume;如果factor_min′>factor_temp″>1.0,则缩小因子factor_min′修正如下:缩小因子factor_min′=factor_temp″;
其中,再一个临时因子factor_temp″=peak÷peak_min_volume
通过计算再一个临时因子factor_temp″来防止缩小因子factor_min′过大造成缩小后的数据小于缩小峰值下限peak_min_volume的情况发生,
4-2-2.对该语音数据帧中的每个采样点的音量进行如下缩小:
sample[i]=sample[i]÷factor_min′;且32767≥sample[i]≥-32768;
4-3.其他情况下,音量在正常范围,不进行放大和缩小;
步骤(5)、将处理好后的语音数据帧输出。
CN201510109054.6A 2015-03-12 2015-03-12 一种基于能量统计的语音音量自动调整方法 Active CN104699447B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510109054.6A CN104699447B (zh) 2015-03-12 2015-03-12 一种基于能量统计的语音音量自动调整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510109054.6A CN104699447B (zh) 2015-03-12 2015-03-12 一种基于能量统计的语音音量自动调整方法

Publications (2)

Publication Number Publication Date
CN104699447A CN104699447A (zh) 2015-06-10
CN104699447B true CN104699447B (zh) 2017-10-10

Family

ID=53346624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510109054.6A Active CN104699447B (zh) 2015-03-12 2015-03-12 一种基于能量统计的语音音量自动调整方法

Country Status (1)

Country Link
CN (1) CN104699447B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105743806B (zh) * 2016-04-19 2019-02-26 浙江万朋教育科技股份有限公司 用于tcp协议的基于能量阈值的语音缓冲丢包处理方法
CN106126164B (zh) * 2016-06-16 2019-05-17 Oppo广东移动通信有限公司 一种音效处理方法及终端设备
CN108573709B (zh) * 2017-03-09 2020-10-30 中移(杭州)信息技术有限公司 一种自动增益控制方法及装置
CN107680612A (zh) * 2017-10-27 2018-02-09 深圳市共进电子股份有限公司 音频优化单元及网络摄像机
CN108550365B (zh) * 2018-02-01 2021-04-02 云知声智能科技股份有限公司 离线语音识别的阈值自适应调整方法
CN108924465B (zh) * 2018-06-26 2021-02-09 广州视源电子科技股份有限公司 视频会议发言人终端的确定方法、装置、设备和存储介质
CN111277784A (zh) * 2018-12-05 2020-06-12 中兴通讯股份有限公司 一种音量自动控制方法、装置、终端及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101053277A (zh) * 2004-11-10 2007-10-10 Adc技术株式会社 声音电子电路及其音量调节方法
CN103050119A (zh) * 2012-12-30 2013-04-17 安徽科大讯飞信息科技股份有限公司 一种灯光或电机与声音同步的自适应检测方法
US8731216B1 (en) * 2010-10-15 2014-05-20 AARIS Enterprises, Inc. Audio normalization for digital video broadcasts
CN103915103A (zh) * 2014-04-15 2014-07-09 成都凌天科创信息技术有限责任公司 语音质量增强系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101356206B1 (ko) * 2007-02-01 2014-01-28 삼성전자주식회사 자동 오디오 볼륨 기능을 갖는 오디오 재생 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101053277A (zh) * 2004-11-10 2007-10-10 Adc技术株式会社 声音电子电路及其音量调节方法
US8731216B1 (en) * 2010-10-15 2014-05-20 AARIS Enterprises, Inc. Audio normalization for digital video broadcasts
CN103050119A (zh) * 2012-12-30 2013-04-17 安徽科大讯飞信息科技股份有限公司 一种灯光或电机与声音同步的自适应检测方法
CN103915103A (zh) * 2014-04-15 2014-07-09 成都凌天科创信息技术有限责任公司 语音质量增强系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
音量自适应的实现方法;王景明;《2009年声频工程学术交流年会》;20091231;第144-149页 *

Also Published As

Publication number Publication date
CN104699447A (zh) 2015-06-10

Similar Documents

Publication Publication Date Title
CN104699447B (zh) 一种基于能量统计的语音音量自动调整方法
CN104200810B (zh) 自动增益控制装置及方法
CN101320559B (zh) 一种声音激活检测装置及方法
CN108573709B (zh) 一种自动增益控制方法及装置
EP2389773B1 (en) Hearing aid and a method of detecting and attenuating transients
EP2898510B1 (en) Method, system and computer program for adaptive control of gain applied to an audio signal
WO2018107874A1 (zh) 一种音频数据的自动增益控制方法与装置
CN108172242B (zh) 一种改进的蓝牙智能云音箱语音交互端点检测方法
CN105490654B (zh) 语音采集系统的自动增益控制器控制方法及电路
CN110650410B (zh) 一种麦克风自动增益控制方法、装置及存储介质
CN101689373A (zh) 智能梯度噪声降低系统
CN110660408B (zh) 一种数字自动控制增益的方法和装置
CN101567672B (zh) 获取增益的方法及系统
CN104269177B (zh) 一种语音处理方法及电子设备
CN106782586A (zh) 一种音频信号处理方法及装置
CN107331393A (zh) 一种自适应语音活动检测方法
CN106571138B (zh) 一种信号端点的检测方法、检测装置及检测设备
CN101740037B (zh) 一种基于滑动增益的语音自动增益和动态范围控制方法
CN108231088A (zh) 一种应用于语音数字信号的快速自动增益控制方法和装置
US20240088856A1 (en) Long-term signal estimation during automatic gain control
CN110895930B (zh) 语音识别方法及装置
CN103021419A (zh) 一种混合音频的处理方法及装置
CN102595297B (zh) 数字式助听器增益控制优化方法
CN205304747U (zh) 语音采集系统的自动增益控制器控制电路
CN111243631B (zh) 一种自动增益控制方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: The electronic commerce building, No. 118 Hangzhou West Road, Zhejiang province 310013 city 15 Floor

Applicant after: ZHEJIANG WANPENG EDUCATION SCIENCE AND TECHNOLOGY STOCK CO.,LTD.

Address before: The electronic commerce building, No. 118 Hangzhou West Road, Zhejiang province 310013 city 15 Floor

Applicant before: ZHEJIANG WANPENG NETWORK TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 310051 12 / F, building 8, No. 19, Jugong Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: ZHEJIANG WANPENG EDUCATION SCIENCE AND TECHNOLOGY STOCK Co.,Ltd.

Address before: The electronic commerce building, No. 118 Hangzhou West Road, Zhejiang province 310013 city 15 Floor

Patentee before: ZHEJIANG WANPENG EDUCATION SCIENCE AND TECHNOLOGY STOCK Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 12 / F, building 8, No. 19, Jugong Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee after: Zhejiang Wanpeng Digital Intelligence Technology Co.,Ltd.

Address before: 12 / F, building 8, No. 19, Jugong Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee before: ZHEJIANG WANPENG EDUCATION SCIENCE AND TECHNOLOGY STOCK CO.,LTD.