CN102142256A - 淡入时间的计算方法和装置 - Google Patents

淡入时间的计算方法和装置 Download PDF

Info

Publication number
CN102142256A
CN102142256A CN2010102521221A CN201010252122A CN102142256A CN 102142256 A CN102142256 A CN 102142256A CN 2010102521221 A CN2010102521221 A CN 2010102521221A CN 201010252122 A CN201010252122 A CN 201010252122A CN 102142256 A CN102142256 A CN 102142256A
Authority
CN
China
Prior art keywords
value
volume
average
maximum value
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102521221A
Other languages
English (en)
Other versions
CN102142256B (zh
Inventor
郝红霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2010102521221A priority Critical patent/CN102142256B/zh
Publication of CN102142256A publication Critical patent/CN102142256A/zh
Application granted granted Critical
Publication of CN102142256B publication Critical patent/CN102142256B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

本发明公开了一种淡入时间的计算方法和装置。该方法包括:依次将音量序列中的音量值和第一音量阈值进行比较,当比较出第一个音量值大于或等于所述第一音量阈值的帧时,所述帧之前的各帧音量值均小于所述第一音量阈值,所述小于所述第一音量阈值的音量值构成第一音量子序列;根据所述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间;根据所述音量序列中所述第一音量子序列之外的音量值得到第二音量子序列;根据所述第二音量子序列计算第二淡入子时间;将所述第一淡入子时间和所述第二淡入子时间相加,得到淡入时间。本发明在无法获知铃音变换曲线的情况下,通过对音量序列进行计算处理得出淡入时间,提高了得出的淡入时间的准确性。

Description

淡入时间的计算方法和装置
技术领域
本发明实施例涉及音频分析领域,特别涉及一种淡入时间的计算方法和装置。
背景技术
随着通信技术的发展,越来越多的用户在呼叫通话业务中使用铃音,铃音可包括彩铃或振铃。铃音提供商通常将铃音制作为具有淡入过程的铃音,铃音的淡入过程是指铃音从较低音量水平逐渐上升到适合用户听觉的正常音量水平的过程。
当铃音提供商的铃音编辑人员对铃音进行编辑过程中出现失误时,会造成铃音的淡入时间为零或者淡入时间过长的情况。为提高铃音的质量,运营商需要计算出每个铃音的淡入时间,并将淡入时间为零以及淡入时间大于规定值的铃音反馈给铃音提供商,要求铃音提供商重新对铃音进行编辑。由于铃音编辑人员是采用铃音变换曲线对铃音进行编辑从而得出铃音的淡入过程,因此若运营商获知编辑铃音时的铃音变换曲线就可根据铃音变换曲线计算出该铃音的淡入时间。
但是,由于铃音的数量极大且铃音编辑人员会采用不同的铃音变换曲线对不同的铃音进行编辑,因此运营商无法获知每个铃音的铃音变换曲线。在无法获知铃音变换曲线的情况下,运营商只能粗略的将铃音开始部分的音量逐渐上升的时间作为淡入时间,从而导致得出的淡入时间准确性低。
发明内容
本发明实施例提供一种淡入时间的计算方法和装置,用以提高淡入时间的准确性。
本发明实施例提供一种淡入时间的计算方法,包括:
依次将音量序列中的音量值和第一音量阈值进行比较,当比较出第一个音量值大于或等于所述第一音量阈值的帧时,所述帧之前的各帧音量值均小于所述第一音量阈值,所述小于所述第一音量阈值的音量值构成第一音量子序列;
根据所述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间;
根据所述音量序列中所述第一音量子序列之外的音量值得到第二音量子序列;
根据所述第二音量子序列计算第二淡入子时间;
将所述第一淡入子时间和所述第二淡入子时间相加,得到淡入时间。
本发明实施例提供了一种淡入时间的计算装置,包括:
比较模块,用于依次将音量序列中的音量值和第一音量阈值进行比较;
序列生成模块,用于当比较出第一个音量值大于或等于所述第一音量阈值的帧的时,所述帧之前的各帧音量值均小于所述第一音量阈值,所述小于所述第一音量阈值的音量值构成第一音量子序列,并根据所述音量序列中所述第一音量子序列之外的音量值得到第二音量子序列;
第一时间计算模块,用于根据所述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间;
第二时间计算模块,用于根据所述第二音量子序列计算第二淡入子时间;
第三时间计算模块,用于将所述第一淡入子时间和所述第二淡入子时间相加,得到淡入时间。
本实施例提供的淡入时间的计算方法和装置,依次将音量序列中的音量值和第一音量阈值进行比较,得到第一音量子序列和第二音量子序列,并根据第一音量子序列对应的各帧计算出第一淡入子时间以及根据第二音量子序列计算第二淡入子时间,将第一淡入子时间和第二淡入子时间相加得到淡入时间,从而在无法获知铃音变换曲线的情况下,通过对音量序列进行计算处理得出淡入时间,提高了得出的淡入时间的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种淡入时间的计算方法的流程图;
图2为本发明实施例二提供的一种淡入时间的计算方法的流程图;
图3为本发明实施例三提供的一种淡入时间的计算装置的结构示意图;
图4为本发明实施例四提供的一种淡入时间的计算装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的一种淡入时间的计算方法的流程图,如图1所示,该方法包括:
步骤101、依次将音量序列中的音量值和第一音量阈值进行比较,当比较出第一个音量值大于或等于第一音量阈值的帧时,该帧之前各帧的音量值均小于该第一音量阈值,所述小于第一音量阈值的各帧的音量值构成第一音量子序列。
本实施例中的各步骤可以由淡入时间的生成装置执行。
本实施例中,音量序列是根据音频数据生成的,该音量序列包括音频数据中的每一帧子音频数据的音量值。本实施例中,生成音量序列的具体过程包括:根据预先确定的帧率对音频数据进行分帧处理,得出子音频数据;计算出每一帧子音频数据的音量值;每一帧子音频数据的音量值组成音量序列。其中,帧率可根据需要进行确定,例如:帧率P可以为30帧/秒。
本发明实施例中,小于一定音量值的音量对于用户来说是无声的。因此可以设置第一音量阈值,并认为小于该第一音量阈值的音量值对于用户来说是无声的。如果第1帧到第M帧的音量值小于第一音量阈值T1,并且第M+1帧的音量值大于等于T1,则M帧所代表的音频段落即为音频数据开始阶段的无声段落和/或背景噪声段落,M为自然数。
步骤102、根据上述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间。
本实施例中,第一淡入子时间为上述音量值均小于该第一音量阈值的各帧对应的音频数据的持续时间,如(M-N)帧/(30帧/秒)。
步骤103、根据音量序列中第一音量子序列之外的音量值得到第二音量子序列。
步骤104、根据该第二音量子序列计算出第二淡入子时间。
本发明实施例中,根据第二音量子序列生成的第二淡入子时间为音频数据中开始阶段的无声段落之后的音量逐渐增大的段落对应的音频数据的持续时间。
一种具体计算方式为:将第二音量子序列V进行分段求均值,得到分段均值序列W。即如果步长为L,V=(v1,v2,v3,...,vm),W=(w1,w2,w3,...,wn),m,n均为自然数,则
wi={v[(i-1)*L+1]+...+v[i*L]}/L
根据分段均值向量W,计算出音量序列V中的数据从第M+1帧开始的上升趋势持续的帧数S,转化为第二淡入子时间:S/P。
步骤105、将该第一淡入子时间和该第二淡入子时间相加,得到淡入时间。
本实施例中各步骤的执行顺序仅为一种示例,在实际应用中可根据需要进行变更。例如:步骤102可以于步骤103之后执行。
本实施例提供的淡入时间的计算方法,依次将音量序列中的音量值和第一音量阈值进行比较,得到第一音量子序列和第二音量子序列,并根据第一音量子序列对应的各帧计算出第一淡入子时间以及根据第二音量子序列计算出第二淡入子时间,将第一淡入子时间和第二淡入子时间相加得到淡入时间,从而在无法获知铃音变换曲线的情况下,通过对音量序列进行计算处理得出淡入时间,提高了得出的淡入时间的准确性。
图2为本发明实施列提供的一种淡入时间的计算方法的流程图,如图2所示,该方法包括:
步骤201、依次将音量序列中的音量值和第一音量阈值进行比较,当比较出第一个音量值大于或等于第一音量阈值的帧时,所述帧之前的各帧的音量值均小于该第一音量阈值,所述小于第一音量阈值的各帧的音量值构成第一音量子序列。
本实施例中的各步骤可以由淡入时间的生成装置执行。
对步骤201的描述可参见上述实施例一中的步骤101。本实施例中,音量序列可包括m帧子音频数据的音量值。每一帧子音频数据的音量值对应于该帧音频数据的帧数,例如:第1帧子音频数据的音量值对应的帧数为第1帧,依此类推,第m帧子音频数据的音量值对应的帧数为第m帧。
例如:依次将音量序列中的音量值和第一音量阈值T1进行比较,例如T1的默认值为50,比较出第1帧子音量数据的音量值至第t帧子音量数据的音量值均小于第一音量阈值T1,当比较出第t+1帧子音量数据的音量值大于或等于第一音量阈值T1时,第1帧子音量数据的音量值至第t帧子音量数据的音量值构成第一音量子序列
步骤202、根据上述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间。
本步骤具体可包括:将第一音量子序列中的最后一个音量值对应的帧数与帧率相除,得出第一淡入子时间。即:T1_FadeIn=t/P,其中,T1_FadeIn为第一淡入子时间,t为第一音量子序列中的最后一个音量值对应的帧数,P为帧率。例如:P可以设置为30帧/秒,则当t=45时,T1_FadeIn=t/P=1.5秒。
或者,本步骤具体可包括:将第一音量子序列中的最后一个音量值对应的帧数与指定帧数的差值除以帧率,得出第一淡入子时间。即:T1_FadeIn=(t-N)/P,其中,T1_FadeIn为第一淡入子时间,t为第一音量子序列中的最后一个音量值对应的帧数,N为指定帧数,P为帧率。指定帧数N为第一音量子序列中需要忽略的前N帧,N的默认值为2。例如:P可以设置为30帧/秒,则当t=45时,N=2时,T1_FadeIn=(t-N)/P=1.4秒。采用忽略掉指定帧数的方法计算出的第一淡入子时间的准确性更高。
步骤203、根据音量序列中第一音量子序列之外的音量值得到第二音量子序列。
从原音量序列中去掉开头无声段落所对应的第一音量子序列,得到的音量子序列作为第二音量子序列,例如:第二音量子序列可表示为Vold=(v1,v2,v3,...,vm),该第二音量子序列Vold中包括m个音量值,m为自然数。
步骤204、计算出第二音量子序列的整体均值mean和起始音量startV,该整体均值为第二音量子序列中的所有音量值的均值,该起始音量为第二音量子序列中的前指定数量个音量值的均值。例如:指定数量的默认值为2。
步骤205、判断该起始音量startV是否小于第二音量阈值或者该整体均值与该起始音量的差值是否大于第三音量阈值,如果是,则执行步骤206;如果否,则执行步骤210。
本步骤中,如果判断出该起始音量小于第二音量阈值T2或者该整体均值与该起始音量的差值大于第三音量阈值,即mean-startV>T3,则执行步骤206。如果判断出该起始音量大于或等于第二音量阈值以及该整体均值与该起始音量的差值小于或等于第三音量阈值,则执行步骤210,即第二淡入子时间为0。例如:第二音量阈值T2的默认值可以为87,第三音量阈值T3的默认值可以为10。
步骤206、将第二音量子序列中的音量值依次进行分组处理生成音量值组,该音量值组包括预定数量个音量值,计算出音量值组中的音量值的均值,并根据音量值组中的音量值的均值生成分段均值序列,该分段均值序列中的均值对应于音量值组。
本实施例中,第二音量子序列为Vold=(v1,v2,v3,...,vm),预定数量为L,生成的分段均值序列为Vnew=(w1,w2,w3,...,wn)。
例如:当预定数量L为3时,Vold中的v1、v2和V3组成第一个音量值组,v4、v5和V6组成第二个音量值组,依次类推,v(m-2)、v(m-1)和Vm组成第n个音量值组。Vnew中的w1等于Vold中的v1、v2和V3的均值,Vnew中的w2等于Vold中的v4、v5和V6的均值,依次类推,Vnew中的wn等于Vold中的v(m-2)、v(m-1)和vm的均值。w1对应于包括v1、v2和V3的第一个音量值组,w2对应于包括v4、v5和V6的第二个音量值组,依次类推,wn对应于包括v(m-2)、v(m-1)和Vm的第n个音量值组。
步骤207、从分段均值序列的均值中确定出淡入结束均值。
本实施例中,步骤207具体可以包括:
步骤2071、依次将分段均值序列中的均值进行比较确定出下降均值,该下降均值为分段均值序列中第一个小于前一均值的均值。
步骤2072、依次将分段均值序列中的均值与整体均值进行比较确定出第一均值,该第一均值为分段均值序列中第一个大于或等于整体均值的均值。
步骤2073、判断该下降均值在分段均值序列中的位置是否位于该第一均值在分段均值序列中的位置之前,如果是,则执行步骤2075;如果否,则执行步骤2074。
步骤2074、将第一均值确定为淡入结束均值,并继续执行步骤208。
步骤2075、判断下降均值是否小于第四音量阈值,如果是,则执行步骤2077;如果否,则执行步骤2076。例如:第四音量阈值的默认值可以为98。
步骤2076、将下降均值确定为淡入结束均值,并执行步骤208。
步骤2077、从该下降均值和该分段均值序列中的位于该下降均值之后的均值中确定出淡入结束均值,并继续执行步骤208。
本实施例中,步骤2077具体包括:
对下降均值、第一极大值和第二极大值进行比较,其中,第一极大值为分段均值序列中下降均值之后的第一个极大值,第二极大值为分段均值序列中下降均值之后的第二个极大值,若比较出下降均值小于第一极大值并且第一极大值小于第二极大值时,执行步骤A1;若比较出下降均值大于第一极大值并且下降均值小于第二极大值时,执行步骤B1;若比较出下降均值小于第一极大值并且第二极大值小于第一极大值时,执行步骤C1。
步骤A1、判断第一关键差值是否小于1,或者判断第一关键差值是否小于第五音量阈值且第一极大值与下降均值的差值是否大于第一关键差值,其中,第一关键差值为下降均值与第一最小值的差值,第一最小值为下降均值与第一极大值之间的最小值。如果判断出第一关键差值大于或等于1,和判断出第一关键差值大于或等于第五音量阈值或者第一极大值与下降均值的差值小于或等于第一关键差值时,则执行步骤A2;如果判断出第一关键差值小于1,或者判断出第一关键差值小于第五音量阈值且第一极大值与下降均值的差值大于第一关键差值时,则执行步骤A3,淡入结束均值可以向后推进到第一极大值点或第二极大值点。
本实施例中,例如:第五音量阈值的默认值可以为3。
步骤A2、将下降均值确定为淡入结束均值,步骤2077流程结束。
步骤A3、判断第一极大值是否小于整体均值以及第一极大值是否小于第四音量阈值,如果判断出第一极大值大于或等于整体均值,和/或判断出第一极大值大于或等于第四音量阈值,则执行步骤A4;如果判断出第一极大值小于整体均值以及第一极大值小于第四音量阈值,则执行步骤A5。
步骤A4、将第一极大值确定为淡入结束均值,步骤2077流程结束。
步骤A5、判断第二关键差值是否小于1,或者判断第二关键差值是否小于第五音量阈值且第二极大值与第一极大值的差值是否大于第二关键差值,其中,第二关键差值为第一极大值与第二最小值的差值,第二最小值为第一极大值与第二极大值之间的最小值。如果判断出第二关键差值大于或等于1,和判断出第二关键差值大于或等于第五音量阈值或者第二极大值与第一极大值的差值小于或等于第二关键差值时,则执行步骤A6;如果判断出第二关键差值小于1,或者判断出第二关键差值小于第五音量阈值且第二极大值与第一极大值的差值大于第二关键差值,则执行步骤D1,将淡入结束点暂定为第二极大值的点,淡入结束点即对应于淡入结束均值的点。
步骤A6、将第一极大值确定为淡入结束均值,即淡入结束点终止于第一极大值点,步骤2077流程结束。
步骤B1、判断第三关键差值是否小于1,或者判断第三关键差值是否小于第五音量阈值且第二极大值与下降均值的差值是否大于第三关键差值,其中,第三关键差值为下降均值与第三最小值的差值,第三最小值为下降均值与第二极大值之间的最小值。如果判断出第三关键差值大于或等于1,和判断出第三关键差值大于或等于第五音量阈值或者第二极大值与下降均值的差值小于或等于第三关键差值时,执行步骤B2;如果判断出第三关键差值小于1,或者第三关键差值小于第五音量阈值且第二极大值与第一极大值的差值大于第三关键差值,则执行步骤D1,将淡入结束均值推进到第二极大值。
步骤B2、将下降均值确定为淡入结束均值,步骤2077流程结束。
步骤C1、判断第一关键差值是否小于1,或者判断第一关键差值是否小于第五音量阈值且第一极大值与下降均值的差值是否大于第一关键差值,如果判断出第一关键差值大于或等于1,和第一关键差值大于或等于第五音量阈值或者第一极大值与下降均值的差值小于或等于第一关键差值时,则执行步骤C2;如果判断出第一关键差值小于1,或者判断出第一关键差值小于第五音量阈值且第一极大值与下降均值的差值大于第一关键差值,则执行步骤C3,则淡入结束点可以推进到第一极大值点,且可以考虑到第二极大值点后的下一极值点,即第三极大值点。
步骤C2、将下降均值确定为淡入结束均值,步骤2077流程结束。
步骤C3、判断第一极大值是否小于整体均值以及第一极大值是否小于第四音量阈值,如果判断出第一极大值大于或等于整体均值,和/或判断出第一极大值大于或等于第四音量阈值,则执行步骤C4;如果判断出第一极大值小于整体均值以及第一极大值小于第四音量阈值,则执行步骤C5。
步骤C4、将第一极大值确定为淡入结束均值,步骤2077流程结束。
步骤C5、判断第四关键差值是否小于1,或者判断第四关键差值是否小于第五音量阈值且第三极大值与第一极大值的差值是否大于第四关键差值,其中,第四关键差值为第一极大值与第四最小值的差值,第四最小值为第一极大值与第三极大值之间的最小值,第三极大值为分段均值序列中下降均值之后的第三个极大值。如果判断出第四关键差值大于或等于1,和判断出第四关键差值大于或等于第五音量阈值或者第三极大值与第一极大值的差值小于或等于第四关键差值时,则执行步骤C4;如果判断出第四关键差值小于1,或者判断出第四关键差值小于第五音量阈值且第三极大值与第一极大值的差值大于第四关键差值,则执行步骤D4,即淡入结束点可以推进到第三极大值点;
步骤D1、在目前的淡入结束点是第二极大值点时,则淡入结束点有是第三极大值点的可能,需进一步判断第二极大值是否小于整体均值以及第二极大值是否小于第四音量阈值T4,如果判断出第二极大值大于或等于整体均值,和/或判断出第二极大值大于或等于第四音量阈值,则执行步骤D2;如果判断出第二极大值小于整体均值以及第二极大值小于第四音量阈值,则执行步骤D3。
步骤D2、将第二极大值确定为淡入结束均值,步骤2077流程结束。
步骤D3、判断第五关键差值是否小于1,或者判断第五关键差值是否小于第五音量阈值且第三极大值与第二极大值的差值是否大于第五关键差值,其中,第五关键差值为第二极大值与第五最小值的差值,第五最小值为第二极大值和第三极大值之间的最小值。如果判断出第五关键差值大于或等于1,和判断出第五关键差值大于或等于第五音量阈值或者第三极大值与第二极大值的差值小于或等于第五关键差值时,则执行步骤D2;如果判断出第五关键差值小于1,或者判断出第五关键差值小于第五音量阈值且第三极大值与第二极大值的差值大于第五关键差值,则执行步骤D4,即淡入结束点推进到第三极大值点。
步骤D4、判断第三极大值是否小于整体均值以及第三极大值是否小于第四音量阈值,如果判断出第三极大值大于或等于整体均值,和/或判断出第三极大值大于或等于第四音量阈值时,执行步骤D5;如果判断出第三极大值小于整体均值以及第三极大值小于第四音量阈值时,执行步骤D6。
步骤D5、将第三极大值确定为淡入结束均值,步骤2077流程结束。
步骤D6、判断第三极大值是否小于当前极大值,其中,当前极大值为分段均值序列中第三极大值之后的极大值,如果否,则将第三极大值确定为淡入结束均值,如果是则执行步骤D7;
步骤D7、判断第六关键差值是否小于1,或者判断第六关键差值是否小于第五音量阈值且当前极大值与第三极大值的差值是否大于第六关键差值,其中,第六关键差值为第三极大值与第六最小值的差值,第六最小值为第三极大值和当前极大值中的最小值,如果判断出第六关键差值大于或等于1,和判断出第六关键差值大于或等于第五音量阈值或者当前极大值与第三极大值的差值小于或等于第六关键差值时,则将第三极大值确定为淡入结束均值;如果判断出第六关键差值小于1,或者判断出第六关键差值小于第五音量阈值且当前极大值与第三极大值的差值大于第六关键差值,则执行步骤D8。
步骤D8、判断当前极大值是否小于下一个极大值,其中,下一个极大值为分段均值序列中位于当前极大值之后的极大值,如果否,则执行步骤D9,如果是则执行步骤D10;
步骤D9、将当前极大值确定为淡入结束均值,步骤2077流程结束。
步骤D10、判断当前关键差值是否小于1,或者判断当前关键差值是否小于第五音量阈值且下一个极大值与当前极大值的差值是否大于当前关键差值,其中,并将当前极大值与当前最小值相减生成当前关键差值,从当前极大值和下一个极大值中查询出当前最小值,如果判断出当前关键差值大于或等于1,和判断出当前关键差值大于或等于第五音量阈值或者下一个极大值与当前极大值的差值小于或等于当前关键差值时,则执行步骤D11;如果判断出当前关键差值小于1,或者当前关键差值小于第五音量阈值且下一个极大值与当前极大值的差值大于当前关键差值,则将下一个极大值作为当前极大值,并继续执行步骤D8。
步骤D11、将当前极大值确定为淡入结束均值,步骤2077流程结束。
步骤208、判断第二音量子序列中第默认数量个音量值是否大于或等于整体均值或者第默认数量个音量值是否大于或等于第四音量阈值,如果判断出第默认数量个音量值大于或等于整体均值,或者判断出第默认数量个音量值大于或等于第四音量阈值,则执行步骤210;如果判断出第默认数量个音量值小于整体均值以及第默认数量个音量值小于第四音量阈值则执行步骤209。
例如:默认数量可以为7。
步骤209、查询出该淡入结束均值对应的音量值组,将淡入结束均值对应的音量值组中的最后一个音量值在第二音量子序列中对应的帧数与帧率相除,得出第二淡入子时间,并执行步骤211。
步骤210、将第二淡入子时间设置为0,并执行步骤211。
步骤211、将第一淡入子时间和第二淡入子时间相加,生成淡入时间。
本实施例的技术方案中,依次将音量序列中的音量值和第一音量阈值进行比较,生成第一音量子序列和第二音量子序列,并根据第一音量子序列生成第一淡入子时间以及根据第二音量子序列生成第二淡入子时间,将第一淡入子时间和第二淡入子时间相加生成淡入时间,从而在无法获知铃音变换曲线的情况下,通过对音量序列进行计算处理得出淡入时间,提高了得出的淡入时间的准确性。
图3为本发明实施例三提供的一种淡入时间的计算装置的结构示意图,如图3所示,该装置包括:比较模块1、序列生成模块2、第一时间计算模块3、第二时间计算模块4和第三时间计算模块5。
比较模块1用于依次将音量序列中的音量值和第一音量阈值进行比较。
序列生成模块2用于当比较出第一个音量值大于或等于所述第一音量阈值的帧的音量值时,该帧之前的各帧音量值均小于所述第一音量阈值,所述小于所述第一音量阈值的音量值构成第一音量子序列,并根据所述音量序列中所述第一音量子序列之外的音量值得到第二音量子序列;
第一时间计算模块3用于根据上述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间。
第二时间计算模块4用于根据所述第二音量子序列计算出第二淡入子时间。
第三时间计算模块5用于将所述第一淡入子时间和所述第二淡入子时间相加,得到淡入时间。
本实施例提供的淡入时间的生成装置可用于实现上述实施例一提供的淡入时间的计算方法,具体描述可参见实施例一,此处不再赘述。
本实施例的提供的淡入时间的计算装置,依次将音量序列中的音量值和第一音量阈值进行比较,生成第一音量子序列和第二音量子序列,并根据第一音量子序列计算第一淡入子时间以及根据第二音量子序列计算第二淡入子时间,将第一淡入子时间和第二淡入子时间相加得到淡入时间,从而在无法获知铃音变换曲线的情况下,通过对音量序列进行计算处理得出淡入时间,提高了得出的淡入时间的准确性。
图4为本发明实施例四提供的一种淡入时间的计算装置的结构示意图,如图4所示,本实施例在上述实施例三的基础上,第一时间计算模块3具体用于将第一音量子序列中的最后一个音量值对应的帧数和指定帧数的差值与帧率相除,得出第一淡入子时间。
进一步地,第二时间计算模块4包括:分段序列生成模块41、确定模块42、查询模块43和处理模块44。分段序列生成模块41用于将所述第二音量子序列中的音量值依次进行分组处理生成音量值组,所述音量值组包括预定数量个音量值,计算出所述音量值组中的音量值的均值,根据所述音量值组中的音量值的均值生成分段均值序列,所述分段均值序列中的均值对应于所述音量值组。确定模块42用于从所述分段均值序列的均值中确定出淡入结束均值。查询模块43用于查询出所述淡入结束均值对应的音量值组。处理模块44用于将所述淡入结束均值对应的音量组值中的最后一个音量值在第二音量子序列中对应的帧数与帧率相除,得出所述第二淡入子时间。
进一步地,确定模块42包括:第一比较子模块421、第二比较子模块422、第一判断模块423、第二判断模块424和确定子模块425。第一比较子模块421用于依次将所述分段均值序列中的均值进行比较确定出下降均值,所述下降均值为所述分段均值序列中第一个小于前一均值的均值。第二比较子模块422用于依次将所述分段均值序列中的均值与整体均值进行比较确定出第一均值,该第一均值为分段均值序列中第一个大于或等于整体均值的均值,所述整体均值为所述第二音量子序列中的所有音量值的均值。第一判断模块423用于判断所述下降均值在所述分段均值序列中的位置是否位于所述第一均值在所述分段均值序列中的位置之前。第二判断模块424用于当所述第一判断模块判断出所述下降均值在所述分段均值序列中的位置位于所述第一均值在所述分段均值序列中的位置之前时,判断所述下降均值是否小于第四音量阈值。确定子模块425用于当判断出下降均值小于第四音量阈值时,从所述下降均值和所述分段序列中位于所述下降均值之后的均值中确定出所述淡入结束均值。
本实施例提供的淡入时间的计算装置可用于实现上述实施例二提供的淡入时间的计算方法,具体描述可参见实施例二,此处不再赘述。
本实施例的技术方案中,依次将音量序列中的音量值和第一音量阈值进行比较,生成第一音量子序列和第二音量子序列,并根据第一音量子序列对应的各帧计算第一淡入子时间以及根据第二音量子序列计算出第二淡入子时间,将第一淡入子时间和第二淡入子时间相加得到淡入时间,从而在无法获知铃音变换曲线的情况下,通过对音量序列进行计算处理得出淡入时间,提高了得出的淡入时间的准确性。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (15)

1.一种淡入时间的计算方法,其特征在于,包括:
依次将音量序列中的音量值和第一音量阈值进行比较,当比较出第一个音量值大于或等于所述第一音量阈值的帧时,所述帧之前的各帧音量值均小于所述第一音量阈值,所述小于所述第一音量阈值的音量值构成第一音量子序列;
根据所述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间;
根据所述音量序列中所述第一音量子序列之外的音量值得到第二音量子序列;
根据所述第二音量子序列计算第二淡入子时间;
将所述第一淡入子时间和所述第二淡入子时间相加,得到淡入时间。
2.根据权利要求1所述的方法,其特征在于,所述根据所述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间包括:
将第一音量子序列中的最后一个音量值对应的帧数和指定帧数的差值与帧率相除,得出第一淡入子时间。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第二音量子序列计算第二淡入子时间包括:
将所述第二音量子序列中的音量值依次进行分组处理生成音量值组,所述音量值组包括预定数量个音量值,计算出所述音量值组中的音量值的均值,根据所述音量值组中的音量值的均值生成分段均值序列,所述分段均值序列中的均值对应于所述音量值组;
从所述分段均值序列的均值中确定出淡入结束均值;
查询出所述淡入结束均值对应的音量值组;
将所述淡入结束均值对应的音量组值中的最后一个音量值在第二音量子序列中对应的帧数与帧率相除,得出所述第二淡入子时间。
4.根据权利要求3所述的方法,其特征在于,所述从所述分段均值序列的均值中确定出淡入结束均值包括:
依次将所述分段均值序列中的均值进行比较确定出下降均值,所述下降均值为所述分段均值序列中第一个小于前一均值的均值;
依次将所述分段均值序列中的均值与整体均值进行比较确定出第一均值,该第一均值为分段均值序列中第一个大于或等于整体均值的均值,所述整体均值为所述第二音量子序列中的所有音量值的均值;
当判断出所述下降均值在所述分段均值序列中的位置位于所述第一均值在所述分段均值序列中的位置之前,并判断出所述下降均值小于第四音量阈值时,从所述下降均值和所述分段序列中位于所述下降均值之后的均值中确定出所述淡入结束均值。
5.根据权利要求4所述的方法,其特征在于,所述从所述下降均值和所述分段序列中位于所述下降均值之后的均值中确定出所述淡入结束均值包括:
若比较出下降均值小于第一极大值并且第一极大值小于第二极大值时,
如果判断出第一关键差值大于或等于1,和判断出第一关键差值大于或等于第五音量阈值或者第一极大值与下降均值的差值小于或等于第一关键差值时,将所述下降均值确定为所述淡入结束均值;
如果判断出第一关键差值小于1,或者判断出第一关键差值小于第五音量阈值且第一极大值与下降均值的差值大于第一关键差值,并且判断出第一极大值大于或等于整体均值和/或判断出第一极大值大于或等于第四音量阈值时,将所述第一极大值确定为所述淡入结束均值;
如果判断出第一关键差值小于1,或者判断出第一关键差值小于第五音量阈值且第一极大值与下降均值的差值大于第一关键差值,判断出第一极大值小于整体均值以及第一极大值小于第四音量阈值,并且判断出第二关键差值大于或等于1和判断出第二关键差值大于或等于第五音量阈值或者第二极大值与第一极大值的差值小于或等于第二关键差值时,将所述第二极大值确定为所述淡入结束均值;
其中,第一极大值为分段均值序列中下降均值之后的第一个极大值,第二极大值为分段均值序列中下降均值之后的第二个极大值;第一关键差值为下降均值与第一最小值的差值,第一最小值为下降均值与第一极大值之间的最小值;第二关键差值为第一极大值与第二最小值的差值,第二最小值为第一极大值与第二极大值之间的最小值。
6.根据权利要求4所述的方法,其特征在于,所述从所述下降均值和所述分段序列中位于所述下降均值之后的均值中确定出所述淡入结束均值包括:
若比较出下降均值大于第一极大值并且下降均值小于第二极大值时,
如果判断出第三关键差值大于或等于1,和判断出第三关键差值大于或等于第五音量阈值或者第二极大值与下降均值的差值小于或等于第三关键差值时,将所述下降均值确定为所述淡入结束均值;其中,第一极大值为分段均值序列中下降均值之后的第一个极大值,第二极大值为分段均值序列中下降均值之后的第二个极大值;第三关键差值为下降均值与第三最小值的差值,第三最小值为下降均值与第二极大值之间的最小值;
如果判断出第三关键差值小于1,或者第三关键差值小于第五音量阈值且第二极大值与第一极大值的差值大于第三关键差值,执行淡入结束均值推进到第二极大值的操作。
7.根据权利要求4所述的方法,其特征在于,所述从所述下降均值和所述分段序列中位于所述下降均值之后的均值中确定出所述淡入结束均值包括:
若比较出下降均值小于第一极大值并且第二极大值小于第一极大值时,
如果判断出第一关键差值大于或等于1,和第一关键差值大于或等于第五音量阈值或者第一极大值与下降均值的差值小于或等于第一关键差值时,将所述下降均值确定为所述淡入结束均值;
如果判断出第一关键差值小于1或者判断出第一关键差值小于第五音量阈值且第一极大值与下降均值的差值大于第一关键差值,并且如果判断出第一极大值大于或等于整体均值,和/或判断出第一极大值大于或等于第四音量阈值时,将所述第一极大值确定为所述淡入结束均值;
在判断出第一关键差值小于1或者判断出第一关键差值小于第五音量阈值且第一极大值与下降均值的差值大于第一关键差值,且判断出第一极大值小于整体均值以及第一极大值小于第四音量阈值,如果判断出第四关键差值大于或等于1和判断出第四关键差值大于或等于第五音量阈值或者第三极大值与第一极大值的差值小于或等于第四关键差值时,将所述第一极大值确定为所述淡入结束均值;如果判断出第四关键差值小于1,或者判断出第四关键差值小于第五音量阈值且第三极大值与第一极大值的差值大于第四关键差值,则执行淡入结束点推进到第三极大值点的操作;
其中,第一极大值为分段均值序列中下降均值之后的第一个极大值,第二极大值为分段均值序列中下降均值之后的第二个极大值,第三极大值为分段均值序列中下降均值之后的第三个极大值;第一关键差值为下降均值与第一最小值的差值,第一最小值为下降均值与第一极大值之间的最小值;第四关键差值为第一极大值与第四最小值的差值,第四最小值为第一极大值与第三极大值之间的最小值。
8.根据权利要求6所述的方法,其特征在于:所述执行淡入结束均值推进到第二极大值的操作包括:进一步判断第二极大值是否小于整体均值以及第二极大值是否小于第四音量阈值,如果判断出第二极大值大于或等于整体均值,和/或判断出第二极大值大于或等于第四音量阈值,则将第二极大值确定为淡入结束均值;
如果判断出第二极大值小于整体均值以及第二极大值小于第四音量阈值,则判断第五关键差值是否小于1,或者判断第五关键差值是否小于第五音量阈值且第三极大值与第二极大值的差值是否大于第五关键差值,其中,第五关键差值为第二极大值与第五最小值的差值,第五最小值为第二极大值和第三极大值之间的最小值;如果判断出第五关键差值大于或等于1,和判断出第五关键差值大于或等于第五音量阈值或者第三极大值与第二极大值的差值小于或等于第五关键差值时,则将第二极大值确定为淡入结束均值;如果判断出第五关键差值小于1,或者判断出第五关键差值小于第五音量阈值且第三极大值与第二极大值的差值大于第五关键差值,则执行淡入结束点推进到第三极大值点的操作。
9.根据权利要求7或8所述的方法,其特征在于:所述执行淡入结束点推进到第三极大值点的操作包括:判断第三极大值是否小于整体均值以及第三极大值是否小于第四音量阈值,如果否则将第三极大值确定为淡入结束均值,如果是则执行以下步骤,
判断第三极大值是否小于当前极大值,其中,当前极大值为分段均值序列中第三极大值之后的极大值,如果否,则将第三极大值确定为淡入结束均值,如果是则执行以下步骤;
判断第六关键差值是否小于1,或者判断第六关键差值是否小于第五音量阈值且当前极大值与第三极大值的差值是否大于第六关键差值,其中,第六关键差值为第三极大值与第六最小值的差值,第六最小值为第三极大值和当前极大值中的最小值,如果判断出第六关键差值大于或等于1,和判断出第六关键差值大于或等于第五音量阈值或者当前极大值与第三极大值的差值小于或等于第六关键差值时,则将第三极大值确定为淡入结束均值;如果判断出第六关键差值小于1,或者判断出第六关键差值小于第五音量阈值且当前极大值与第三极大值的差值大于第六关键差值,则执行以下步骤,
判断当前极大值是否小于下一个极大值,其中,下一个极大值为分段均值序列中位于当前极大值之后的极大值,如果否,则将当前极大值确定为淡入结束均值,如果是则执行以下步骤,
判断当前关键差值是否小于1,或者判断当前关键差值是否小于第五音量阈值且下一个极大值与当前极大值的差值是否大于当前关键差值,其中,并将当前极大值与当前最小值相减生成当前关键差值,从当前极大值和下一个极大值中查询出当前最小值,如果判断出当前关键差值大于或等于1,和判断出当前关键差值大于或等于第五音量阈值或者下一个极大值与当前极大值的差值小于或等于当前关键差值时,则将当前局部极大值确定为淡入结束均值;如果判断出当前关键差值小于1,或者当前关键差值小于第五音量阈值且下一个极大值与当前极大值的差值大于当前关键差值,则将下一个极大值作为当前极大值,并返回执行判断当前极大值是否小于下一个极大值的步骤。
10.根据权利要求3所述的方法。其特征在于,所述将所述第二音量子序列中的音量值依次进行分组处理生成音量值组之前包括:
当判断出所述起始音量小于第二音量阈值或者所述整体均值与所述起始音量的差值大于第三音量阈值时,执行所述将所述第二音量子序列中的音量值依次进行分组处理生成音量值组的步骤;
其中,所述整体均值为所述第二音量子序列中的所有音量值的均值,所述起始音量为所述第二音量子序列中的前指定数量个音量值的均值。
11.根据权利要求10所述的方法,其特征在于,当判断出所述起始音量大于或等于第二音量阈值以及所述整体均值与所述起始音量的差值小于或等于第三音量阈值,将所述第二淡入子时间设置为0。
12.一种淡入时间的计算装置,其特征在于,包括:
比较模块,用于依次将音量序列中的音量值和第一音量阈值进行比较;
序列生成模块,用于当比较出第一个音量值大于或等于所述第一音量阈值的帧的时,所述帧之前的各帧音量值均小于所述第一音量阈值,所述小于所述第一音量阈值的音量值构成第一音量子序列,并根据所述音量序列中所述第一音量子序列之外的音量值得到第二音量子序列;
第一时间计算模块,用于根据所述音量值均小于该第一音量阈值的各帧计算出第一淡入子时间;
第二时间计算模块,用于根据所述第二音量子序列计算第二淡入子时间;
第三时间计算模块,用于将所述第一淡入子时间和所述第二淡入子时间相加,得到淡入时间。
13.根据权利要求12所述的装置,其特征在于,所述第一时间计算模块用于将第一音量子序列中的最后一个音量值对应的帧数和指定帧数的差值与帧率相除,得出第一淡入子时间。
14.根据权利要求12所述的装置,其特征在于,所述第二时间计算模块包括:
分段序列生成模块,用于将所述第二音量子序列中的音量值依次进行分组处理生成音量值组,所述音量值组包括预定数量个音量值,计算出所述音量值组中的音量值的均值,根据所述音量值组中的音量值的均值生成分段均值序列,所述分段均值序列中的均值对应于所述音量值组;
确定模块,用于从所述分段均值序列的均值中确定出淡入结束均值;
查询模块,用于查询出所述淡入结束均值对应的音量值组;
处理模块,用于将所述淡入结束均值对应的音量组值中的最后一个音量值在第二音量子序列中对应的帧数与帧率相除,得出所述第二淡入子时间。
15.根据权利要求14所述的装置,其特征在于,所述确定模块包括:
第一比较子模块,用于依次将所述分段均值序列中的均值进行比较确定出下降均值,所述下降均值为所述分段均值序列中第一个小于前一均值的均值;
第二比较子模块,用于依次将所述分段均值序列中的均值与整体均值进行比较确定出第一均值,该第一均值为分段均值序列中第一个大于或等于整体均值的均值,所述整体均值为所述第二音量子序列中的所有音量值的均值;
第一判断模块,用于判断所述下降均值在所述分段均值序列中的位置是否位于所述第一均值在所述分段均值序列中的位置之前;
第二判断模块,用于当所述第一判断模块判断出所述下降均值在所述分段均值序列中的位置位于所述第一均值在所述分段均值序列中的位置之前时,判断所述下降均值是否小于第四音量阈值;
确定子模块,用于从所述下降均值和所述分段序列中位于所述下降均值之后的均值中确定出所述淡入结束均值。
CN2010102521221A 2010-08-06 2010-08-06 淡入时间的计算方法和装置 Expired - Fee Related CN102142256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102521221A CN102142256B (zh) 2010-08-06 2010-08-06 淡入时间的计算方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102521221A CN102142256B (zh) 2010-08-06 2010-08-06 淡入时间的计算方法和装置

Publications (2)

Publication Number Publication Date
CN102142256A true CN102142256A (zh) 2011-08-03
CN102142256B CN102142256B (zh) 2012-08-01

Family

ID=44409714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102521221A Expired - Fee Related CN102142256B (zh) 2010-08-06 2010-08-06 淡入时间的计算方法和装置

Country Status (1)

Country Link
CN (1) CN102142256B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104157287A (zh) * 2014-07-29 2014-11-19 广州视源电子科技股份有限公司 音频处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4181410A (en) * 1977-02-17 1980-01-01 Robert Bosch Gmbh Method and apparatus for automatic implementation of fade-in, fade-out and fade-over recording effects on film
CN1575042A (zh) * 2003-06-20 2005-02-02 西门子测听技术有限责任公司 助听器运行方法及具有可调方向特性麦克风系统的助听器
CN101107650A (zh) * 2005-01-14 2008-01-16 松下电器产业株式会社 语音切换装置及语音切换方法
CN101223819A (zh) * 2005-07-15 2008-07-16 弗劳恩霍夫应用研究促进协会 借助于dsp来控制多个扬声器的设备和方法
CN101489070A (zh) * 2009-02-17 2009-07-22 华为技术有限公司 电视音量调节方法、装置及系统
CN101601302A (zh) * 2007-01-31 2009-12-09 汤姆森特许公司 用于自动分类潜在的镜头和场景检测信息的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4181410A (en) * 1977-02-17 1980-01-01 Robert Bosch Gmbh Method and apparatus for automatic implementation of fade-in, fade-out and fade-over recording effects on film
CN1575042A (zh) * 2003-06-20 2005-02-02 西门子测听技术有限责任公司 助听器运行方法及具有可调方向特性麦克风系统的助听器
CN101107650A (zh) * 2005-01-14 2008-01-16 松下电器产业株式会社 语音切换装置及语音切换方法
CN101223819A (zh) * 2005-07-15 2008-07-16 弗劳恩霍夫应用研究促进协会 借助于dsp来控制多个扬声器的设备和方法
CN101601302A (zh) * 2007-01-31 2009-12-09 汤姆森特许公司 用于自动分类潜在的镜头和场景检测信息的方法和装置
CN101489070A (zh) * 2009-02-17 2009-07-22 华为技术有限公司 电视音量调节方法、装置及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《计算机应用研究》 20081031 王辰等 基于声像特征的场景检测 第25卷, 第10期 2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104157287A (zh) * 2014-07-29 2014-11-19 广州视源电子科技股份有限公司 音频处理方法及装置
CN104157287B (zh) * 2014-07-29 2017-08-25 广州视源电子科技股份有限公司 音频处理方法及装置

Also Published As

Publication number Publication date
CN102142256B (zh) 2012-08-01

Similar Documents

Publication Publication Date Title
US9767790B2 (en) Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium
US7412377B2 (en) Voice model for speech processing based on ordered average ranks of spectral features
CN108630193A (zh) 语音识别方法及装置
WO2014204997A1 (en) Adaptive audio content generation
US20120101606A1 (en) Information processing apparatus, content data reconfiguring method and program
CN107045871A (zh) 利用外部数据源重新识别语音
US11327710B2 (en) Automatic audio ducking with real time feedback based on fast integration of signal levels
US8885841B2 (en) Audio processing apparatus and method, and program
US6889193B2 (en) Method and system for smart cross-fader for digital audio
CN105718486B (zh) 在线哼唱检索方法及系统
CN108053696A (zh) 一种根据阅读内容进行声音播放的方法、装置和终端设备
CN104898821A (zh) 一种信息处理的方法及电子设备
CN102208208B (zh) 无损音频播放方法以及音频播放器
US8548960B2 (en) Music processing method and apparatus to use music data or metadata of music data regardless of an offset discrepancy
JP2009058970A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN108022604A (zh) 补录音频内容的方法和装置
CN102142256B (zh) 淡入时间的计算方法和装置
CN107247574A (zh) 一种音频输出控制方法及装置
JP4239109B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN112133269B (zh) 一种音频处理方法、装置、设备及介质
CN109495786B (zh) 视频处理参数信息的预配置方法、装置及电子设备
CN113766307A (zh) 用于音轨分析以支持音频个性化的技术
JPH1078791A (ja) ピッチ変換器
JP2007025039A5 (zh)
JP5699496B2 (ja) 音合成用確率モデル生成装置、特徴量軌跡生成装置およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120801

CF01 Termination of patent right due to non-payment of annual fee