CN1728546A - 进行自动音量控制的相关方法与电路 - Google Patents
进行自动音量控制的相关方法与电路 Download PDFInfo
- Publication number
- CN1728546A CN1728546A CN 200410058646 CN200410058646A CN1728546A CN 1728546 A CN1728546 A CN 1728546A CN 200410058646 CN200410058646 CN 200410058646 CN 200410058646 A CN200410058646 A CN 200410058646A CN 1728546 A CN1728546 A CN 1728546A
- Authority
- CN
- China
- Prior art keywords
- volume
- data
- extreme value
- voice
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Receiver Circuits (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种可对一声音讯号进行自动音量追踪/控制的相关方法与电路。该声音讯号中有多个取样点的声音数据,而本发明是先根据各声音数据邻近的多个声音数据统计得到一对应的平均音量数据;若该平均音量数据大于一预先记录的音量极值数据,则更新该音量极值数据,反之则不更新该音量极值数据,并记录该音量极值数据是否被更新。若在对预设数目个声音数据依序进行上述处理后,发现该音量极值数据均未被更新,则依据现行的平均音量数据更新该音量极值数据。如此,该音量极值数据即可反应该声音讯号的局部音量极值,而本发明即可据此自动控制该声音讯号播放时的音量大小。
Description
技术领域
本发明涉及一种可对一声音讯号进行自动音量追踪/控制的方法及相关电路,特别是涉及一种可追踪声音讯号的局部音量极值以进行自动音量控制的方法及相关电路。
背景技术
由有线或无线广电媒体提供的影音节目服务是现代信息社会最重要的信息来源之一。从这些整合有声音、动态影像的影音节目中,观众可获得有用的新闻、知识、信息、或是能抒解身心的声光娱乐。然而,在商业的考虑下,广电媒体所提供的影音节目常会有广告片段穿插于正常节目之间;尤有甚者,广电媒体还会在播出广告片段时增强其音量,以凸显广告的效果。然而,对观众来说,广告片段突增的音量会造成听觉上的不舒适,造成收视时的干扰。在现行技术下,观众只能手动地在广告片段播出时将音量调小。然而,等到广告片段结束、正常节目要继续播出时,观众又要手动地重新将音量调大,以恢复正常节目原本的音量。这样反复地手动调整,对观众来说极为不便。
发明内容
因此,本发明的主要目的是提出一种能自动追踪/控制音量的方法与相关电路,能够动态地、适应性地进行自动音量调整,以克服前述的问题。
在对一声音讯号(像是整合于影音节目中的声音讯号)进行音量追踪时,本发明可依序针对该声音讯号中每一取样点的声音数据进行一音量追踪程序。此音量追踪程序先针对一声音数据邻近的多笔声音数据进行统计的计算(像是计算这些声音数据的绝对值的平均),以求得一平均音量数据。若此平均音量数据大于一预先记录的音量极值数据,则根据该平均音量数据来更新该音量极值数据,像是以该平均音量数据与更新前音量极值数据两者间的平均值来当作更新后的音量极值数据。相反地,若该平均音量数据小于该预先记录的音量极值数据,则不更新该音量极值数据。同时,并记录下该音量极值数据是否被更新。若连续对预设数目声音数据进行上述步骤后,发现该音量极值数据均未被更新,则强制更新该音量极值数据,譬如说是以现行的平均音量数据与更新前音量极值数据两者的平均来作为更新后的音量极值数据。这样一来,音量极值数据就可反映该声音讯号的局部音量极值,追踪该声音讯号的局部音量变化。
在取得该音量极值数据后,本发明即可检测出该声音讯号中音量突增的片段,并根据该音量极值数据来进行自动音量控制。举例来说,若该音量极值数据超过一预设的音量临限数据,就代表该声音讯号中音量突增的片段正要被播放了;此时本发明就可对应地以较小的音量播出该声音讯号,譬如说是以一个小于1的音量调整因素乘上该声音讯号后再予以播放。相对地,若该音量极值数据未超越该音量临限数据,就不用调整该声音讯号播出的音量。换句话说,本发明可动态地根据音量极值数据的变化来进行自动音量调整与控制,以克服声音讯号中音量突增片段为使用者(观众或听众)所带来的困扰。
附图说明
图1为本发明控制电路一实施例的功能方块示意图。
图2为图1中控制电路进行自动音量追踪/控制的流程示意图。
图3为图1中控制电路进行音量追踪时相关数据、讯号的时序示意图。
图4为图1中控制电路进行自动音量控制时各相关数据、讯号的时序示意图。
图5为本发明自动音量控制另一实施例的流程示意图。
图6为图5流程进行时相关数据讯号的时序示意图。
附图符号说明
10控制电路 12接收电路
14音量检测模块 16比较模块
18更新模块 20判断模块
22音量调整模块
24A-24C、26A-26B寄存模块
100流程 102-120、214-220步骤
S声音讯号 S(n)、S2(n)声音数据
mean、max_mean、max_volume_level、window、life_threshold、max_mean、life_counter、min_volume_level 数据
T、TL时段
t1-t2、ta时间点
scalar音量调整因素
具体实施方式
请参考图1。图1为本发明实现于一控制电路10中的功能方块示意图。控制电路10能架构于各种播放装置中,像是设置于光盘播放器(DVD player或CD player)、收音机、电视、附有扬声器的屏幕、用来播放音乐的音响或多媒体计算机中,也可以整合于计算机的音效芯片上,以便在播放声音讯号时自动地进行音量追踪及控制。控制电路10中包含有一接收电路12、一音量检测模块14、一比较模块16、一更新模块18、一判断模块20、一音量调整模块22以及寄存模块24A至24C、26A至26B。其中,音量检测模块14、比较模块16、更新模块18、判断模块20可形成一音量追踪模块;寄存模块26A作为一极值寄存模块,用来记录一音量极值数据max_mean;寄存模块26B则作为一延续状态寄存模块,用来记录一数据life_counter。接收电路12用来接收一声音讯号S,并可由声音讯号中取得各取样点对应的声音数据(其第n个取样点对应的声音数据可记为S(n))。举例来说,若控制电路10是架构于一光盘播放器中,光盘播放器中的读取系统可读取、译码出光盘上记录的声音讯号,而接收电路12就能取得此读取系统读出的电子声音讯号,作为声音讯号S。
控制电路10的运作原理可先大致描述如下。首先,控制电路10中的音量检测模块14可针对每一声音数据S(n)计算出一对应的平均音量数据mean,以代表声音数据S(n)处对应的音量。然后控制电路10可将此平均音量数据mean与音量极值数据max_mean相比较;若平均音量数据mean大于音量极值数据max_mean,则根据此平均音量数据mean来更新音量极值数据max_mean,使音量极值数据max_mean能够追踪(track)声音讯号S的最大音量大小。反之,若平均音量数据mean未超越音量极值数据max_mean的值,就不需更新音量极值数据max_mean的值,同时则持续累算数据life_counter的值,以数据life_counter的值来表示音量极值数据max_mean未被更新所持续的次数。在控制电路10依序对S(n)、S(n+1)、S(n+2)等等声音数据持续进行上述处理后,若数据life_counter的值显示音量极值数据持续未被更新的次数已经超过一默认值,就强制更新音量极值数据max_mean的值,以使音量极值数据max_mean能反映声音讯号S的局部音量极值(local maximum of volume)。根据音量极值数据max_mean的值,控制电路10就能适当地判断出声音讯号S中音量突增的片段,并进行自动音量控制,使音量突增的片段能以较小的音量播出。
至于控制电路10进行上述运作的详细情形可描述如下。首先,音量检测模块14能针对每一取样点的声音数据S(n)计算出一对应的平均音量数据mean。在本发明的较佳实施例中,音量检测模块14能针对声音数据S(n)邻近的声音数据进行一统计计算以求得平均音量数据mean;举例来说,就像图1中所显示的,声音数据S(n)所对应的平均音量数据mean可以是声音数据S(n-L1)、S(n-L1+1)、S(n-L1+2)等等一直到S(n+L1-2)、S(n+L1-1)这些声音数据取绝对值后的平均值。其中,L1、L2为两个常数,可记录于寄存模块24A中。换句话说,音量检测模块14能针对声音讯号S中的每一个取样点进行移动平均(moving average),而移动平均所涵括的范围(可称为窗口,window)则记录于寄存模块24A中。根据寄存模块24A中记录的窗口范围,音量检测模块14就能针对每一笔声音数据S(n)统计计算出一对应的平均音量数据mean。
在音量检测模块14针对一声音数据S(n)计算出对应的平均音量数据mean后,比较模块16就能比较平均音量数据mean与寄存模块26A中记录的音量极值数据max_mean两者间的数值大小。若平均音量数据mean大于音量极值数据max_mean,则更新模块18更新寄存模块26A中音量极值数据max_mean的值。在本发明的较佳实施例中,更新模块18能以更新前音量极值数据max_mean与平均音量数据mean两者间的平均值(即(max_mean+mean)/2)作为音量极值数据max_mean更新后的值。同时,更新模块18在更新音量极值数据max_mean之后,重设寄存模块26B中数据life_counter的值,代表音量极值数据max_mean已被更新。
相反地,若比较模块16比较的结果是平均音量数据mean并未大于音量极值数据max_mean,则由判断模块20比较数据life_counter与寄存模块24B中记录的常数数据life_threshold;若数据life_counter的值已经超越常数数据life_threshold,代表max_mean持续未被更新的次数已经超越一默认值,此时判断模块16强制地更新音量极值数据max_mean的值;在本发明的较佳实施例中,判断模块16能以更新前音量极值数据max_mean与平均音量数据mean两者间的平均值作为音量极值数据max_mean更新后的值。反之,若数据life_counter的值并未超越常数数据life_threshold的值,音量极值数据max_mean就不被更新,而判断模块20则更新寄存模块26B中数据life_counter的值,使数据life_counter持续地累计,代表音量极值数据max_mean未被更新的次数又增加了一次。
在经过更新模块18、判断模块20的持续运作后,音量极值数据max_mean应该就能反映出声音讯号S中音量变化的局部极值;而控制电路10中的音量调整模块22就能据此来调整声音讯号S播出时的音量。在本发明的较佳实施例中,音量调整模块22能将音量极值数据max_mean与寄存模块24C中寄存的常数数据max_volume_level做比较。此常数数据max_volume_level可视为一音量临限数据;当音量调整模块22比较出音量极值数据max_mean已经超越此音量临限数据max_volume_level之后,音量调整模块22计算出一个数值小于1的音量调整因素scalar(譬如说是以max_volume_level/max_mean的值作为scalar的值),将原来的声音数据S(n)乘上此音量调整因素scalar后得到音量调整后的声音数据S2(n)。反之,若音量极值数据max_mean未超越音量临限数据max_volume_level,音量调整模块22就会使音量调整因素scalar的数值维持为1。在以音量调整因素scalar来反应自动音量控制的结果后,声音数据S2(n)就可作为控制电路10的输出。播放声音数据S2(n),就能补偿声音讯号S中原本音量突增的片段,消除音量突增片段为使用者(观众或听众)带来的不适。
上述控制电路10的运作情形可以用图2的算法流程100来进一步归纳。请参考图2(并一并参考图1);图2中的流程100是针对声音讯号S中的每一笔取样的声音讯号S(n)依序进行,其包括有下列步骤:
步骤102:由声音讯号S中取得一声音数据S(n)。
步骤104:根据声音数据S(n)邻近的声音数据统计计算出一对应的平均音量数据mean。此步骤可由图1中的音量检测模块14来进行,以声音数据S(n)邻近的多笔声音数据的绝对值的平均作为平均音量数据mean的值。
步骤106:判断平均音量数据mean的值是否大于音量极值数据max_mean的值。若是,则进行至步骤110,以更新音量极值数据max_mean的值;若否,进行至步骤108。
步骤108:检查数据life_counter的值是否超越常数数据life_threshold的值;若是,进行至步骤110;若否,则进行至步骤112。
步骤110:根据平均音量数据mean的值来更新音量极值数据max_mean的值,并重设数据life_counter的值。如前面提到过的,在本发明的较佳实施例中,是以更新前音量极值数据max_mean与平均音量数据mean两者间的平均值来当作音量极值数据max_mean更新后的值。另外,在本发明的一实施例中,是以递增(increase)的方式来累计数据life_counter的值,故在重设数据life_counter时,可将数据life_counter的值重设为数值0。
步骤112:持续累计数据life_counter的值。在以递增方式来累计数据life_counter的情况下,可使life_counter的值递增数值1来进行数据life_counter的累计。
步骤114:检查音量极值数据max_mean是否大于常数的音量临限数据max_volume_level。若是,进行至步骤118,反之,则进行至步骤116。
步骤116:使音量调整因素scalar维持于数值1,维持声音数据S(n)原本的音量。
步骤118:计算出一个数值小于1的音量调整因素scalar,并将此音量调整因素scalar乘上原先的声音数据S(n),譬如说是以max_volume_level/max_mean的值作为scalar的值,使得声音数据S(n)的音量能变小。
步骤120:递增n,对声音讯号S中的次一笔声音数据继续进行流程100。
在流程100中,步骤102到112可视为一音量追踪程序,步骤114到118则可视为一音量调整程序。在流程100持续对声音讯号S中的各笔声音数据进行此音量追踪程序时,若音量极值数据max_mean一直未被更新,数据life_counter的值就不会在步骤110中被重设而会在步骤112中被持续累计。在以递增方式来累计数据life_counter下,数据life_counter终究会因持续的递增而大于常数数据life_threshold,并从步骤114进行至步骤108,在更新音量极值数据max_mean时,也重新将数据life_counter的值重设为数值0。当然,在本发明中,数据life_counter的值也可采用递减的倒数方式来累计:在步骤110重设数据life_counter时,使数据life_counter的值被重设为常数数据life_threshold的值,在步骤112中则使数据life_counter递减数值1来进行累计;而在步骤108中,则以数据life_counter的值是否递减至小于零来判断应进行至步骤110或112。无论以何种方式来进行,数据life_counter及常数数据life_threshold都是设计用来判断音量极值数据max_mean连续未被更新的次数是否已经超过预设的次数。
为进一步说明图1及图2中本发明以音量极值数据max_mean来追踪音量时的情形,请继续参考图3(以及图1及图2);图3为图1中控制电路10在运作时各相关讯号、数据随时间变化的时序示意图。图3中的示意例分别示出了声音讯号S、平均音量数据mean及音量极值数据max_mean随时间改变的情形,各讯号、数据的横轴为时间顺序,纵轴为讯号、数据的大小。如前所述,声音讯号S可依序提供多个取样点的声音数据,像是声音数据S(n1)、S(n1+1)到S(n2)、S(n3)等等,以代表声音随时时间变化的情形。由于各声音讯号中有声音的相位数据,故各笔声音数据的值也可能为正值或负值。当要针对声音数据S(n1)进行流程100(图2)时,会先依据声音数据S(n1)邻近的多个声音数据S(n1-L1)至S(n1+L2-1)的绝对值进行平均的统计计算,得到对应的音量平均数据mean。为了方便以下的说明,图3中将此音量平均数据标示为mean(n1),代表其系对应于声音数据S(n1)。接下来,就要比较平均音量数据mean(n1)与记录于寄存模块26A(图1)中的音量极值数据max_mean两者的大小。当进行比较时,此音量极值数据max_mean是流程100对前一声音数据S(n-1)进行处理时所设定的,故在图3中将此音量极值数据max_mean特别标示为max_mean(n1-1)。
在图3的例子中,因为声音数据S(n1)位于音量渐增的时段,故声音数据S(n1)大于音量极值数据max_mean(n1-1)。根据图2中的流程,此时就应该更新音量极值数据max_mean的值;如前所述,在本发明的较佳实施例中,可用平均音量数据mean(n1)及前一音量极值数据max_mean(n1-1)两者的平均来将音量极值数据更新为max_mean(n1);而数据life_counter也会随之被重设。当然,在实际实现本发明时,音量极值数据max_mean(n1)的值会被记录于寄存模块26A中而覆盖原先记录的音量极值数据max_mean(n1-1)。
结束对声音数据S(n1)的处理后,流程100继续对声音数据S(n1+1)进行,以设定对应的音量极值数据max_mean(n1+1),以此类推。在图3的例子中,当在对声音数据S(n2)进行流程100时,由于声音讯号S在声音数据S(n2)之后就开始音量渐减,故声音数据S(n2)对应的平均音量数据mean(n2)会小于前一音量极值数据max_mean(n2-1),此时音量极值数据max_mean就不会被更新(也就是说,max_mean(n2)=max_mean(n2-1)),而数据life_counter也会开始累计。在图3的例子中,假设在声音讯号S从声音数据S(n2)之后各声音数据对应的平均音量数据均小于音量极值数据max_mean,在流程100对这些声音数据进行处理后,音量极值数据max_mean就不会被更新而维持于音量极值数据max_mean(n2-1)的值;在此同时,数据life_counter也就会被不断的累计。在以递增方式累计数据life_counter的情形下,数据life_counter就会被持续累增。图3中与平均音量数据mean重迭绘制的虚线即代表音量极值数据max_mean的变化情形。
等到流程100进行至声音数据S(n3)时,假设此数据life_counter已经被累增至超过常数数据life_threshold,流程100就会进行至步骤110(图2),强制更新音量极值数据max_mean。原本的音量极值数据max_mean(n3-1)还维持于max_mean(n2-1)的值,但由于声音数据S(n3)对应的平均音量数据mean(n3)较小,在以音量极值数据max_mean(n3-1)与mean(n3)的平均来将音量极值数据更新为max_mean(n3)之后,音量极值数据max_mean(n3)的值就会随之变小。在更新音量极值数据后,数据life_counter又会被重设。
由以上描述可知,本发明中的音量极值数据max_mean大致上会随平均音量数据mean的增高而增高;在平均音量数据开始下降时,音量极值数据max_mean至少会维持一段预设长短的时段而不会随之下降;若在这预设时段之内,平均音量数据mean均未超过音量极值数据max_mean,本发明就会强制更新音量极值数据max_mean,使其继续追踪平均音量数据的变化。而此预设的时段就由数据life_counter是否累计至逾越数据life_threshold来决定。基本上,音量极值数据max_mean的设计就是要追踪声音讯号S的音量的极值,但最好是局部极值,才能反映不同片段的音量变化。而数据life_counter累计的设计就是为了要使音量极值数据max_mean能适当地反映音量的局部极值(local maximum),而非全域的极值(global maximum)。以图3为例,若没有数据life_counter的累计,流程100就不会在处理声音数据S(n3)强制更新音量极值数据max_mean,而使音量极值数据max_mean变成全域的极值。
而由图3中,也可看出本发明另外的一些特点。首先,在更新音量极值数据max_mean时,本发明是未更新的音量极值数据与当前的音量平均数据来做运算而得到更新后的音量极值数据。这样一来,即使平均音量数据mean偶有剧烈的震荡变化,音量极值数据max_mean也不会剧烈地随平均音量数据mean变化。举例来说,在图3中,声音讯号S的平均音量数据mean在声音数据S(n1)及S(n2)之间会震荡地变化,但音量极值数据max_mean的变化相对来说就平缓许多。
另外,本发明在计算平均音量数据mean时,也可应用于因果性(causal)或非因果性(non-causal)的系统。在实时(real-time)、因果性的系统中,声音讯号S仅能依据时间先后来依序提供各笔声音数据;换句话说,当本发明的控制电路10(图1)要对一声音讯号S(n)进行流程100时,控制电路10仅能取得声音讯号S(n)之前的声音讯号,像是声音数据S(n-1)、S(n-2)等等。在此种情况下,本发明可以仅使用声音数据S(n)之前的多笔声音数据来计算平均音量数据;举例来说,只要使L1为正数,L2为1,声音数据S(n)对应的平均音量数据mean(n)就是以声音数据S(n-L1)、S(n-L1+1)、S(n-L1+2)…到S(n)的绝对值的平均来计算。由于这些声音数据都是声音数据S(n)之前的声音数据,故在计算平均音量数据mean(n)时,控制电路10(图1)应该已经能取得这些声音数据。
相对地,在一非实时、非因果性的系统中,声音讯号S可以在某一声音数据被播放前预先提供该声音数据之后的各个声音数据。举例来说,在某些影音数据压缩规格(像是MPEG,motion picture experts group)中,声音讯号S在解压缩的过程中是非因果性的,也就是当一声音数据S(n)尚未被播放前,其后的声音数据,像是声音数据S(n+1)、S(n+2)等等,也已经被解压缩出来。在此种情况下,本发明也可利用声音数据S(n)之后的声音数据来计算其对应的平均音量数据mean(n)。举例来说,只要使L1、L2皆为正数(L2大于1),声音数据S(n)对应的平均音量数据mean(n)就是以声音数据S(n-L1)、S(n-L1+1)、S(n-L1+2)…到S(n)乃至于S(n+1)、S(n+2)…至S(n+L2-1)的绝对值平均来计算。另外,本发明也可使用加权平均来计算平均音量数据,也就是在计算声音数据S(n)所对应的平均音量数据时,以预设的不同加权值分别乘上声音数据S(n-L1)、S(n-L1+1)等等的绝对值后,再进行平均以得到对应的平均音量数据mean(n)。
至于本发明利用音量极值数据max_mean来进行自动音量控制的情形,请继续参考图4(并一并参考图1及图2);图4为本发明运作时各相关讯号、数据随时间变化的时序示意图,图4的横轴为时间,纵轴为各讯号、数据的数值大小。在图4的例子中,假设声音讯号S在时段T内为一音量突增的片段,譬如说是一广告片段对应的声音片段;而其它的时间则为音量正常的片段,像是正常节目的片段。如图4所示,当音量突增片段开始后,在时间点t1,音量极值数据max_mean就会随追踪声音讯号S的音量增加而超越音量临限数据max_volume_level,使得本发明开始以较小的音量调整因素scalar(图1、图2)来调整音量。如图4所示,虽然在时间点t1、t2之间的音量突增片段还是会有音量的大小变化,但因本发明有数据life_counter及life_threshold的设计,音量极值数据max_mean还是会维持一定的程度,反映出音量突增片段的所在。
当音量突增片段结束后,若没有一定的机制使音量极值数据max_mean重新追踪局部极值,那么在时间点t2之后的片段即使已经恢复正常音量,音量极值数据max_mean还是维持于时间点t2的电平,无法正确反映局部极值。而在本发明中,即以数据life_counter、life_threshold的设计来强制音量极值数据max_mean的更新,使其在时间点t2之后能继续追踪其后的局部极值。如图4中的例子,音量极值数据max_mean在时间点ta时达到局部极值,之后音量突增片段就要结束,而本发明就会由时间点ta开始累计数据life_counter;在经过时段TL而到时间点t2之后,本发明就会因数据life_counter累计超过定值数据life_threshold而强制使音量极值数据max_mean不再维持于时间点ta的极值,而重新开始追踪时间点t2之后的局部极值。这也可使音量极值数据max_mean能适当地反映出音量突增片段的结束;而在时间点t2之后,本发明就会因音量极值数据max_mean小于音量临限数据max_volume_level而使音量调整因素重新变为数值1。
在本发明中有三个常数的数据可微调音量追踪/控制的行为,即数据life_threshold、音量临限数据max_volume_level及在计算平均音量数据mean时所依据的窗口范围(即window或L1、L2,如图1所示)。当本发明的控制电路10(图1)架构于一播放装置中时,该播放装置应可提供适当的使用者接口,让使用者能通过此接口来设定、自订这些常数数据的值。尤其是音量临限数据,因为其控制了声音讯号被实际播放时的最大音量。播放装置(或控制电路10本身)应可储存这些常数数据,以便在进行流程100时加以引用。当然,厂商也可预先内建一些较为常用或较佳的常数数据值,作为这些常数数据的默认值。另外,播放装置或控制电路10本身也可以具备某些转换计算的功能;举例来说,使用者可能是以秒或毫秒为单位来指定音量极值数据会在持续多久之后被强制更新(也就是图4中时段TL的时间长短),而播放装置或控制电路10本身就可按照声音讯号的取样频率来计算出数据life_threshold应该是多少(譬如说是时段TL的长短除以取样频率)。
如前面讨论过的,在图2的流程100中,步骤114、116及118可视为一音量调整程序。除了在音量极值数据max_mean大于音量临限数据max_volume_level时将声音数据S(n)的音量调小之外,本发明当然还可进行其它种类的自动音量调整,像是在音量太小时自动将声音数据的音量调大。关于此情形,请进一步参考图5;图5中示意的流程200即为本发明进行自动音量控制的另一实施例。类似于流程100,在流程200中,同样是以步骤102到112来进行音量追踪程序,以对一声音数据S(n)产生一对应的音量极值数据max_mean,代表声音讯号的局部音量极值。而流程200中的音量调整程序,则改以步骤214至220来进行(可由图1中的音量调整模块22统一进行),以根据音量极值数据max_mean的数值范围来自动调整音量。关于流程200的音量追踪程序(也就是步骤102到112),其进行的过程就与图2中音量追踪程序相同,在不妨碍本发明技术披露的情形下,不再赘述。流程200的音量调整程序则有下列步骤:
步骤214:判断音量极值数据max_mean的数值范围。在进行过步骤102至112后,应已针对声音数据S(n)产生出对应的音量极值数据max_mean。在本步骤中,即可判断此音量极值数据max_mean的数值范围。在流程200中,除了音量极限数据max_volume_level,还可设定另一个定值的低音量临限数据min_volume_level。此低音量临限数据min_volume_leve1低于音量临限数据max_volume_level,故音量临限数据max_volume_level也可称为一高音量临限数据。若音量极值数据max_mean已大于高音量临限数据max_volume_level,则可进行至步骤218。若音量极值数据max_mean小于低音量临限数据min_volume_level,则进行至步骤220。若音量极值数据max_mean的数值范围落在高音量临限数据max_volume_level及低音量临限数据min_volume_level之间,则进行至步骤220。
步骤216:不改变声音数据S(n)的音量。
步骤218:减少声音数据S(n)的音量。与流程100的步骤118相同,要实现本步骤时,也可以计算出一个数值小于1的音量调整因素scalar,并将此音量调整因素scalar乘上原先的声音数据S(n),譬如说是以max_volume_level/max_mean的值作为scalar的值,使声音数据的音量能变小(也就是变小为scalar*S(n))。
步骤220:若音量极值数据max_mean小于低音量临限数据min_volume_level,代表声音讯号的音量可能太低了。在此种情况下,本发明就可以自动帮助使用者将音量调大。类似于步骤218,此步骤也可利用一音量调整因素scalar乘上原先的声音数据来改变音量,但在本步骤中,此音量调整因素scalar的数值应该大于1,使音量能变大。
请参考图6(并一并参考图5)。当本发明以图5中的流程200来进行自动音量控制时,各相关讯号、数据的时序变化情形可以用图6中的例子来进一步说明;图6的横轴为时间,纵轴为各数据、讯号的大小。如图6所示,声音讯号S中可能会有三段音量不同的片段,而本发明的音量极值数据max_mean就可追踪声音讯号的局部音量极值。在音量极值数据max_mean小于低音量临限数据min_volume_level时,本发明就可利用大于1的音量调整因素scalar来提高声音讯号的音量;当音量极值数据max_mean大于高音量临限数据max_volume_level时,本发明则可利用小于1的音量调整因素scalar来降低声音讯号的音量。当音量极值数据max_mean在高低音量临限数据之间时,则不需改变声音讯号S的音量。
换句话说,由于本发明进行音量追踪程序所产生的音量极值数据max_mean能有效追踪局部音量极值,故在进行音量自动调整时,不仅能在局部音量过大时自动将音量调小,还能在局部音量过小时自动将音量调大,就像流程200所示;而这也就能使使用者享受到较为均一的音量。配合流程200的实施,图1中的控制电路10可增设一寄存模块来储存低音量临限数据min_volume_level,而设置有控制电路10的播放装置则可提供使用者接口,来让使用者设定此一定值的低音量临限数据min_volume_level。此外,控制电路10的音量调整模块22也可以通过使用者接口来接受使用者的控制,以选择音量自动调整进行的模式;举例来说,音量调整模块22可以仅在音量过大时自动将音量调小(也就是流程100),也可以在音量过大/过小时自动将音量调小/大(也就是流程200),或是仅在音量过小时自动将音量调大。经过上述对本发明流程100(及200)的讨论后,本领域的技术人员应已能推知在音量过小时可自动将音量调大的操控流程,故此处不再赘述。
总结来说,相较于已知技术,本发明可以自动追踪声音讯号的局部音量极值,进而自动控制声音讯号被实际播出的音量,消除音量突增片段对使用者(观众或听众)带来的不便。如前所述,在各种广电节目中,常会在播放广告片段突增音量;既然本发明可以有效追踪音量突增的片段,应该也可以应用于广告片段的检测。在本发明于图1的实施例中,各个模块应可用软件、固件或硬件等各种方式来加以实现;举例来说,音量检测模块14、比较模块16、更新模块18、判断模块20与音量调整模块22等各模块的功能可以由单一处理芯片执行适当的软件程序代码来加以实现。
以上所述仅为本发明的较佳实施例,凡依本发明的权利要求所做的均等变化与修饰,均应属本发明专利的涵盖范围。
Claims (10)
1.一种进行自动音量控制的方法,其包含有:
接收一声音讯号,该声音讯号包含有多笔声音数据,而该声音讯号可依一预设顺序提供各笔声音数据;
记录一音量极值数据;
针对该声音讯号中的每一笔声音数据,进行一音量追踪程序;而该音量追踪程序包含有:
在对一声音数据进行该音量追踪程序时,进行一音量检测步骤,以根据该声音数据于该声音讯号中的顺序另外选取多笔声音数据,并根据选取的声音数据统计计算出一对应的平均音量数据;
比较该平均音量数据及该音量极值数据的数值大小;
若该平均音量数据大于该音量极值数据,则进行一更新步骤以根据该平均音量数据更新该音量极值数据原来的数值;
记录该音量极值数据是否被更新;以及
在对一声音数据进行该音量追踪程序时,若在对该声音数据之前的预设数目笔声音数据进行该音量追踪程序时均未更新该音量极值数据,则根据该声音数据对应的平均音量数据更新该音量极值数据的数值;以及
在对一声音数据进行该音量追踪程序后,进行一音量调整程序,以根据该音量极值数据的数值决定该笔声音数据的音量。
2.如权利要求1所述的方法,其中在对不同的声音数据进行该音量检测步骤时,是针对不同的声音数据选取不同的多笔声音数据来分别计算出各声音数据对应的平均音量数据。
3.如权利要求1所述的方法,其中当进行该音量检测步骤时,是根据选取的声音讯号的绝对值进行平均值的计算以计算出该平均音量数据。
4.如权利要求1所述的方法,其中在对一声音数据进行该音量追踪程序后而要进行该音量调整程序时,该音量调整程序包含有:
比较该音量极值数据与一预设的音量临限数据间的数值大小;
若该音量极值数据大于该音量临限数据,则减少该声音数据的音量;以及
若该音量极值数据小于该音量临限数据,则不改变该声音数据播放时的音量。
5.如权利要求1所述的方法,其还包含有:
在对一声音数据进行该音量追踪程序时,若对该声音数据之前的预设数目笔声音数据进行该音量追踪程序时均未更新该音量极值数据而更新该音量极值数据的数值后,记录该音量极值数据已被更新。
6.一种可进行自动音量控制的控制电路,其包含有:
一接收电路,用来接收一声音讯号,该声音讯号包含有多笔声音数据,而该声音讯号可依一预设顺序提供各笔声音数据;
一极值寄存模块,用来记录一音量极值数据;
一音量追踪模块,其包含有:
一音量检测模块,其可根据每一声音数据于该声音讯号中的顺序另外选取多笔声音数据,并根据选取的声音数据统计计算出一对应的平均音量数据;
一比较模块,其可接收该平均音量数据,并比较该平均音量数据及该音量极值数据的数值大小;
一更新模块;若该比较模块比较出该平均音量数据大于该音量极值数据,则该更新模块可根据该平均音量数据更新该音量极值数据原来的数值;
一延续状态寄存模块,以根据该更新模块是否更新该音量极值数据而记录该音量极值数据是否被更新;以及
一判断模块;当该音量检测模块对一声音数据进行处理时,若该延续状态寄存模块的记录显示在对该声音数据之前的预设数目笔声音数据进行处理时均未更新该音量极值数据,则该判断模块可根据该声音数据对应的平均音量数据更新该音量极值数据的数值;以及
一音量调整模块;当该音量追踪模块对一声音数据进行处理后,该音量调整模块可以根据该音量极值数据的数值调整该笔声音数据的音量。
7.如权利要求6所述的控制电路,其中当该音量检测模块在对不同的声音数据进行处理时,是针对不同的声音数据选取不同的多笔声音数据来分别计算出各声音数据对应的平均音量数据。
8.如权利要求6所述的控制电路,其中该音量检测模块根据选取的声音讯号的绝对值进行平均值的计算以计算出该平均音量数据。
9.如权利要求6所述的控制电路,其中当该音量追踪模块对一声音数据进行处理后而该音量调整模块要调整该声音数据的音量时,该音量调整模块可比较该音量极值数据与一预设的音量临限数据间的数值大小;若该音量极值数据大于该音量临限数据,该音量调整模块会减少该声音数据的音量;以及若该音量极值数据小于该音量临限数据,则该音量调整模块不会改变该声音数据的音量。
10.如权利要求6所述的控制电路,其中当该判断模块更新音量极值数据后,该延续状态寄存模块会记录该音量极值数据已被更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200410058646 CN1728546A (zh) | 2004-07-27 | 2004-07-27 | 进行自动音量控制的相关方法与电路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200410058646 CN1728546A (zh) | 2004-07-27 | 2004-07-27 | 进行自动音量控制的相关方法与电路 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1728546A true CN1728546A (zh) | 2006-02-01 |
Family
ID=35927618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200410058646 Pending CN1728546A (zh) | 2004-07-27 | 2004-07-27 | 进行自动音量控制的相关方法与电路 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1728546A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101471664B (zh) * | 2007-12-29 | 2011-11-16 | 安凯(广州)微电子技术有限公司 | 一种修复已失真的数字声音信号的方法 |
CN105307012A (zh) * | 2015-11-20 | 2016-02-03 | 青岛海信电器股份有限公司 | 一种电视音量调节方法及装置 |
CN107680612A (zh) * | 2017-10-27 | 2018-02-09 | 深圳市共进电子股份有限公司 | 音频优化单元及网络摄像机 |
-
2004
- 2004-07-27 CN CN 200410058646 patent/CN1728546A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101471664B (zh) * | 2007-12-29 | 2011-11-16 | 安凯(广州)微电子技术有限公司 | 一种修复已失真的数字声音信号的方法 |
CN105307012A (zh) * | 2015-11-20 | 2016-02-03 | 青岛海信电器股份有限公司 | 一种电视音量调节方法及装置 |
CN105307012B (zh) * | 2015-11-20 | 2019-06-14 | 青岛海信电器股份有限公司 | 一种电视音量调节方法及装置 |
CN107680612A (zh) * | 2017-10-27 | 2018-02-09 | 深圳市共进电子股份有限公司 | 音频优化单元及网络摄像机 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI240573B (en) | Methods and related circuit for automatic audio volume level control | |
CN1331889A (zh) | 用于定制商业广告节目提供的方法和装置 | |
KR101334366B1 (ko) | 오디오 배속 재생 방법 및 장치 | |
US7987327B2 (en) | Backup system and associated methodology for storing backup data based on data quality | |
CN1682532A (zh) | 用于内容呈现的方法和设备 | |
CN1925698A (zh) | 音频信号处理装置、音频信号处理方法、程序和输入装置 | |
CN1742492A (zh) | 媒体内容的基于音频和视频的媒体服务的自动同步 | |
CN1722280A (zh) | 光盘、光盘记录方法和光盘记录设备 | |
CN1215540A (zh) | 声反馈校正 | |
CN101809999B (zh) | 声音信号控制装置 | |
CN1822507A (zh) | 多路传输设备以及多路传输数据发送与接收系统 | |
CN100339906C (zh) | 控制音频流缓冲的方法和装置 | |
CN1728546A (zh) | 进行自动音量控制的相关方法与电路 | |
US20190222188A1 (en) | Information processing device, information processing method, and program | |
CN115002618A (zh) | 基于大数据的数字媒体音频智能调节方法 | |
CN1750629A (zh) | 记录再现装置 | |
CN113423006B (zh) | 一种基于主副声道的多音频流混音播放方法及系统 | |
US9621985B2 (en) | Apparatus and method for adjusting volume in terminal | |
CN1320822C (zh) | 以不同检测原则交叉检测广告片段的方法及相关系统 | |
CN1841947A (zh) | 地面广播终端的音频选择输出装置及方法 | |
US20120251069A1 (en) | Audio enhancement based on video and/or other characteristics | |
CN110364188A (zh) | 音频播放方法、装置及计算机可读存储介质 | |
CN1901614A (zh) | 控制模拟视频和音频信号同步的音频/视频装置 | |
CN1589002A (zh) | 在视频信号中进行高效能广告检测的方法与相关系统 | |
CN1771763A (zh) | 包括声音再现构件和耳塞式麦克风的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |