CN101120412A - 一种用于将第一音频数据和第二音频数据混合的系统和方法、一种程序单元以及一种计算机可读介质 - Google Patents
一种用于将第一音频数据和第二音频数据混合的系统和方法、一种程序单元以及一种计算机可读介质 Download PDFInfo
- Publication number
- CN101120412A CN101120412A CNA2006800048818A CN200680004881A CN101120412A CN 101120412 A CN101120412 A CN 101120412A CN A2006800048818 A CNA2006800048818 A CN A2006800048818A CN 200680004881 A CN200680004881 A CN 200680004881A CN 101120412 A CN101120412 A CN 101120412A
- Authority
- CN
- China
- Prior art keywords
- voice data
- component
- frequency scope
- transition
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/038—Cross-faders therefor
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
一种用于将第一音频数据(201)和第二音频数据(202)混合的系统(200),该系统(200)包括滤波器单元(203)和确定单元(210),该滤波器单元适于过滤第一音频数据(201)和第二音频数据(202)以生成第一音频数据(201)在第一频率范围内的分量(206)、第一音频数据(201)在第二频率范围内的分量(207)、第二音频数据(202)在第一频率范围内的分量(208)和第二音频数据(202)在第二频率范围内的分量(209);确定单元(210)适于按照将第一音频数据(201)和第二音频数据(202)在第一频率范围内的分量(206,208)之间的过渡的过渡特性与第一音频数据(201)和第二音频数据(202)在第二频率范围内的分量(207,209)之间的过渡的过渡特性分开确定的这种方式来确定第一音频数据(201)和第二音频数据(202)之间的过渡分布。
Description
技术领域
本发明涉及一种用于将第一音频数据和第二音频数据混合的系统。
本发明还涉及一种将第一音频数据和第二音频数据混合的方法。
此外,本发明涉及一种程序单元。
而且,本发明涉及一种计算机可读介质。
背景技术
在电子娱乐装置的领域中,目前在市场上开发和引入了许多新的应用。当音频播放器相继重放不同的音频节目(item)时,希望在两个连续乐曲之间具有明显无缝的(seamless)过渡。这可以表示为“混频(mixing)”。在“声音交叉衰减”的过程中,可以在从一个乐曲到另一个乐曲的过渡分布期间将每个乐曲放大。在自动系统中,为了提供乐曲之间的无缝过渡,通常按照与放大即将进入的乐曲相同的速率来缩小即将过去的乐曲。
参照图1来描述图表100,该图表依照现有技术的用于将第一音频数据与第二音频数据混合的系统来说明功率互补过渡方案。
图表100包括横坐标101,在该横坐标上标绘出了音频段(piece)的重放时间。在图表100的纵坐标102上以0和1之间的任意值来显示出不同音频段的增益。图1示出第一音频段103和第二音频段104之间的功率互补过渡。在第一部分105中,第一音频段103具有高增益,第二音频段104具有低增益。在随后的过渡部分106中,该第一音频段103渐弱,即相应的增益减小,而第二音频段104的增益在过渡部分106中增大(渐强)。在第二部分107中,过渡完成,仅仅重放第二音频段104,而不再重放第一音频段103。
在混频过程中,存在许多即将过去的音频段或歌曲103以及即将到来的音频段或歌曲104同时播放的时刻,这些时刻称之为过渡部分106。在图1中所示的现有技术的实施中,实现了根据图表100的交叉削弱曲线图(profile)。所述的交叉削弱按照在任何给定时刻总的音频功率或多或少保持不变(所谓的“功率互补过渡”)的方式来进行。但是,这种方法的缺点在于如果在低频信号的相位中存在微小不重合那么基线会相消地增加。特别是,当过渡间隔106相对较长时可能是这种情况。
US6534700B2公开了一种自动音乐编译系统,其中在两个音乐乐曲的混合过程中,通过分析每个乐曲的固有振幅或通过分析输出振幅,并且通过修改在混频分布中的固有振幅或放大的量来减少混合输出音量的变化。通过分析相似频率的两首乐曲(track)的固有振幅来检测碰撞声的可能性从而避免混频过程中的音乐碰撞声,结果通过减小相关频率处的一首乐曲的输出振幅检测碰撞声。特别是,可以使音频信号通过许多平行的信号处理通道,每个通道都具有各自的频率通带滤波器。处理器可以确定对于一对乐曲来说在其共同的过渡期间上哪个频率范围占优势。然后利用该占优势的频率范围来提供使两个乐曲之间的过渡分布的净输出音量均衡所必需的数据。
但是,US6534700B2的缺点在于,在连接两个乐曲的过渡间隔中可能会出现听觉假象(artefact)。
发明内容
本发明的目的在于在相继重放的两个音频乐曲之间获得不失真的平滑过渡。
为了获得上述目的,一种用于将第一音频数据与第二音频数据混合的系统和方法、一种程序单元以及一种计算机可读介质具有如独立权利要求所限定的特征。
在本发明的一个实施例中,提供了一种用于将第一音频数据和第二音频数据混合的系统,其中该系统包括滤波器单元,其适于过滤第一音频数据和第二音频数据以生成第一音频数据在第一频率范围内的分量、第一音频数据在第二频率范围内的分量、第二音频数据在第一频率范围内的分量和第二音频数据在第二频率范围内的分量。确定单元可适于按照将第一音频数据和第二音频数据在第一频率范围内的两分量之间的过渡的过渡特性与第一音频数据和第二音频数据在第二频率范围内的两分量之间的过渡的过渡特性分开确定的这种方式来确定第一音频数据和第二音频数据之间的过渡分布(profile)。
在本发明的另一个实施例中,提供一种将第一音频数据和第二音频数据混合的方法,其中该方法包括以下步骤,过滤第一音频数据和第二音频数据以生成第一音频数据在第一频率范围内的分量、第一音频数据在第二频率范围内的分量、第二音频数据在第一频率范围内的分量和第二音频数据在第二频率范围内的分量。而且,按照将第一音频数据和第二音频数据在第一频率范围内的分量之间的过渡的过渡特性与第一音频数据和第二音频数据在第二频率范围内的分量之间的过渡的过渡特性分开确定的这种方式来确定第一音频数据和第二音频数据之间的过渡分布。
此外,在本发明的又一个实施例中,提供一种程序单元,当由处理器执行该程序单元时,该程序单元适于依照上述方法步骤实施该将第一音频数据和第二音频数据混合的方法。
在本发明的再一个实施例中,提供一种计算机可读介质,在该计算机可读介质中存储计算机程序,当由处理器执行该计算机可读介质时,该计算机可读介质适于依照上述方法步骤实施该将第一音频数据和第二音频数据混合的方法。
根据本发明,对第一音频数据和第二音频数据的混合可以通过计算机程序来实现,即借助于软件来实现,或者通过利用一种或多种专用电子优化电路来实现,即以硬件的形式,或者以混合的形式,如借助于软件部件和硬件部件。
根据本发明的特性特征,特别具有以下优点,即能够为不同频率的子波段分别确定过渡分布,该过渡分布限定从第一音频段到第二音频段的过渡性质或参数。就采取这种措施来说,可能要考虑两个连续音频段之间的平滑继续(segueing)的特定频率帧情况,其中,过渡特性可能对于不同的频率值是不同的。例如,音频内容的低频分量(低音分量)比高频音频成分(“高音分量”)更易于在过渡过程中产生听觉假象。因此,对于良好品质的再播放的音频内容来说,为低音分量和高音分量选择不同的用于限定过渡范围的形状、长度等性质可能是有利的。例如,按照对于低音分量和高音分量不同的方式来调整该过渡范围内的振幅和/或相位可能是有利的。进一步有利的是为低音分量选择相对较窄的过渡范围以避免这些分量的不希望的相消干扰,其中高音分量的过渡时期可能会更宽(即,其可能具有更长的持续时间)。这导致两个音频摘录之间更平滑的过渡。
根据本发明,可以进行频率均衡的受控的音频混频。在音频处理中,术语“均衡”涉及修改音频内容的频率包络的过程。根据本发明可以在两个连续乐曲之间的音频过渡过程中获得不失真的平滑继续,特别是通过调整两个连贯的音频段,如歌曲,之间的依赖频带的过渡时间。进一步有利的是为不同的频带提供同时但不相等的混合阶段。可以实现两个通道中的低音分量的相位比较和延迟调整,从而降低不希望的相位相消(cancellation)。避免相位相消可以在过渡范围内带来改进音频质量的效果。
根据本发明的实施例,提供一种以漂亮的方式来调整子波段信号的相位和振幅的方法。依照可调整的或预定义的过渡阶段来进行振幅重叠。例如,可以为低音分量选择短的过渡重叠,并为高音分量选择较长的重叠。根据本发明的系统可以降低听觉假象,特别是通过进行补偿两首歌曲之间可能的相位冲突来降低听觉假象。这样,可以在子波段范围内控制混频阶段。
在自动的播放音乐(AutoDJ)设备中,节拍的精确重合对于歌曲之间的平滑过渡是很重要的。歌曲的低频分量的相位中的微小不重合都能够导致严重的扰乱干涉。根据本发明的实施例,公开了一种方法和一种系统,其利用频率均衡技术按照有系统的且受控的方式通过不同地混合高频分量和低频分量而使这种不希望的干涉效应最小化或者抑制这种不希望的干涉效应。
根据本发明的一个方面,可以实现高音分量和低音分量的同时但不相等的混频曲线阶段。根据预期的相位关系,可以实现依赖频率的过渡间隔。当长的过渡是不可避免的或者是首选的时候,可以执行一种方法以按照使相加的相位相消的风险最小化的方式来适当地混合低音分量。
根据本发明的一个方面,提供一种自动DJ系统,当在即将播完的歌曲和即将播放的歌曲的低频信号的相位中存在微小不重合时,该系统提供一种解决过渡间隔中的基线相消干扰的机构。
根据本发明,在自动DJ应用中能够获得过渡性能较好的控制。仅仅留下最小的相位相消的机会,因此有效地抑制了听觉假象。而且,如果需要可以在过渡间隔中引入令人愉快的声效果。根据本发明的一个方面,提供了一种用于在两首歌曲之间创造平滑过渡的自动DJ功能,其可以在多个频带中将歌曲的高音分量和低音分量同时和/或不相等地混合。这样,能够进行多过渡阶段混合。由此,本发明提供了一个漂亮的交叉削弱阶段。该交叉削弱可以按照在任何给定时刻总体音频功率本质上恒定的方式来进行(“功率互补过渡”),或者可以不按照上述方式来进行。但是,对于不同的频率分量可能要分别进行过渡阶段的调整。这具有以下优点,即有效地防止了由于低频信号的相位的微小不重合而引起的基线的相消增加,因为音频成分的过渡间隔和/或相位性质能够按照抑制假象的这种方式来调整。
本发明的应用领域的例子是DVD/HD播放器、便携式/可佩戴的产品、互联网-无线电应用、公众娱乐中心等。
特别是,在本发明的范围内,可以有利地为低频分量提供相对较短的重叠并为高频分量提供相对较长的重叠从而有效地避免低音分量以不希望的方式被抵消掉。通过防止这种相消干涉,避免了重叠区域中的不好的声音。
例如,延迟或超前能够调整要被混合的音频成分的相位。本发明的特殊优点在于已经认识到低音分量比高音分量更易被不希望的抵消,因此,低音分量的最佳调整对于最后声音的质量有重要的影响。
在下文中参考从属权利要求来描述本发明的其他优选实施例。
现在描述用于将第一音频数据与第二音频数据混合的系统的优选实施例。这些实施例也适用于将第一音频数据与第二音频数据混合的方法、程序单元和计算机可读介质。
在这种系统的构架中,滤波器单元适于过滤第一音频数据与第二音频数据从而生成第一音频数据在至少一个其他频率范围内的分量。确定单元可适于分开地确定第一音频数据与第二音频数据在至少一个其他频率范围内的分量之间的过渡阶段的过渡特性以及第一音频数据与第二音频数据在第一频率范围和在第二频率范围内的分量之间的过渡阶段的过渡特性。换句话说,本发明不限于区别两个不同的频带(特别是高频高音范围和低频低音范围),而是也能够实现区别三个或更多不同的频带,例如高频带、中频带和低频带。通过对每个频率范围使用各自的带通滤波器可以实现对这些单一分量的过滤。对于要区分和要分开处理的有关过渡阶段的过渡特性的频带数量越多,能够实现的混频方案和音频质量就越精炼。
而且,由于播放音乐的播音员被限制为只具有两只手和两只耳朵,因此其最大程度上只能手动控制两个频率范围,相比之下要想控制扩展到三个或更多个频率范围只能采取自动地控制方式。因此,在重叠范围内的三个或多个频率分量的自动混频明显提高了系统的灵活性和功能性。
确定单元可适合于确定过渡阶段,因此在过渡之前,混合数据由第一音频数据组成;在过渡过程中,混合数据包括第一音频数据的递减成分和第二音频数据的递增成分,在过渡之后,混合音频数据由第二音频数据组成。换句话说,根据本发明的系统可以按照“交叉削弱”的方式来实现,其中,在第一音频剪辑的末端,各个振幅相继递减,而同时随后的第二音频剪辑的振幅相继递增。
确定单元可适于确定过渡阶段,因此第一频率范围的过渡时间间隔比第二频率范围的过渡时间间隔长。可以分别为每个频率范围选择在将要混合的第一和第二首歌曲之间的重叠的长度。特别是,当第一频率范围包括比第二频率范围更高的频率时,低频分量具有相对较短的时间间隔是有利的,该低频分量比高频分量更容易存在相消干扰的风险。那么,可以将相对较短的低音过渡时间与相对较长的高音过渡时间组合,这样可以同时实现平滑过渡和无假象的过渡。
确定单元可适于确定过渡阶段,因此第一频率范围的过渡时间间隔的中心基本上等于第二频率范围的过渡时间间隔的中心。不同子波段的过渡窗口的宽度可能不同,但有利的是这些过渡范围相对于公共听觉中心而对称设置。这有助于提高听众聆听混合的第一和第二音频数据时所感受的主观质量。
确定单元还适于确定混合音频数据的振幅在过渡过程中基本上恒定。换句话说,当重叠的第一和第二音频剪辑的振幅在混合操作过程中保持基本恒定时,可以提高听众听见该混合音频内容所感受的主观质量。
确定单元可适于同时确定在第一频率范围内和第二频率范围内的过渡特性。换句话说,确定单元可以按照时间上并行的方式处理将要混合的音频数据。
而且,该系统可包括相位分析单元,其适于分析第一音频数据和第二音频数据在第一频率范围中的分量的相位关系和/或第一音频数据和第二音频数据在第二频率范围中的分量的相位关系。该确定单元可以与该相位分析单元耦合,并且该确定单元适于在考虑该所分析的相位关系时确定过渡特性。通过考虑将要混合的音频剪辑的不同成分的频率特定的相位性质,能够按照抑制听觉假象的这种方式使不同分量超前或延迟,这是由这些分量的不希望的相互作用引起的,例如低音分量的相消干扰。通过不仅控制过渡范围内的振幅,而且另外或可选择地控制相位性质,提高了所混合音频剪辑的质量。
特别是,能够明显地增大确定的声音。该单元可适于确定过渡特性,从而通过使第一音频数据和/或第二音频数据在第一频率范围内和/或第二频率范围内选择性地延迟或超前来防止过渡过程中第一音频数据和第二音频数据在第一频率范围内的分量的相位相消干扰,和/或第一音频数据和第二音频数据在第二频率范围内的分量的相位相消干扰。通过包括各自的延迟(或超前)元件以便在每个频率范围内可分别选择地和可调整地控制将要混合的成分的相位关系,来降低由不利的重叠而引起的假象的危险。
该系统还可以包括混合单元,其适于根据已确定的过渡特性而将第一音频数据与第二音频数据混合。该混合单元可以增加独立的频率特定的成分以产生输出信号,其能够经由扬声器、头戴式收话器等输出。
确定单元还可适于按照与第一音频数据和第二音频数据在第二频率范围内的分量之间的过渡的过渡特性相比不同的方式来确定第一音频数据和第二音频数据在第一频率范围内的分量之间的过渡的过渡特性。根据该实施例,不同频带的过渡特性是不同的。限定每个频率间隔中的过渡的独立的参数和/或参数值可以被限定。这样,增大了最优化的自由度,实现过渡特性的精调。
确定第一音频数据和第二音频数据的分量之间的过渡的过渡特性的步骤包括确定第一音频数据和/或第二音频数据在第一频率范围和/或第二频率范围内的振幅性质和/或相位性质。这两个参数组合适于精确地限定符合单个应用的框架条件的过渡特性。
本发明所述的系统能够以集成电路来实现,特别是以半导体集成电路来实现。特别是,该系统能够以单片集成电路来实现,其能够以硅工艺制造。
本发明所述的系统能够以自动播放音乐设备来实现,也就是说能够以混合不同音频剪辑而不需要用户干涉的播放音乐设备来实现。
本发明所述的系统能够以下面组中的至少一个来实现,所述组由DVD播放器、基于硬盘的音频播放器、便携式音频播放器、可佩戴的音频播放器、网络无线电装置、公共娱乐装置以及MP3播放器组成。这些应用领域仅仅是以举例的方式给出;本发明所述的系统也可以用于其他领域。
而且,已经参考纯音频数据描述了本发明。但是,根据本发明处理的音频数据还可以包括音频和可视数据的组合,如视频数据。例如,根据本发明可以混合具有可视和声学分量的不同的连续音乐节目,特别是按照使过渡部分的声音从第一视频节目平滑转变到第二视频节目的方式。
本发明的这些和其他方面从下文描述的实施例中显而易见,并且将参照下文描述的实施例来进行说明。
附图说明
在下文中将参照非限制性的实施例更详细地描述本发明。
图1示出说明了根据现有技术的用于将第一音频数据与第二音频数据混合的系统的功率互补过渡方案的图表。
图2说明了根据本发明第一实施例的用于将第一音频数据与第二音频数据混合的系统。
图3示出说明了根据本发明实施例的多过渡分布混合的图表。
图4说明了根据本发明第二实施例的用于将第一音频数据与第二音频数据混合的系统。
图5说明了根据本发明第三实施例的用于将第一音频数据与第二音频数据混合的系统。
图6说明了在根据本发明的用于将第一音频数据与第二音频数据混合的系统中所实现的低通滤波器和高通滤波器的频率性能的图表。
图7说明了根据本发明第四实施例的用于将第一音频数据与第二音频数据混合的系统的一部分。
图8说明了根据本发明一实施例的自动播放音乐设备。
具体实施方式
这些图中的说明是示意性的。在不同的图中,用相同的附图标记来表示相似或相同的元件。
现在将参考图2来描述根据本发明实施例的系统200,该系统200用于混合第一音频段201和第二音频段202。
系统200包括滤波器单元203,该滤波器单元203包括第一滤波器子单元204和第二滤波器子单元205。第一滤波器子单元204适合于过滤第一音频段201以生成第一音频段201的低频分量206和高频分量207,低频分量206包括频率低于阈值的音频成分,高频分量207包括频率处于至少第一音频段201的所述阈值的音频成分。第二滤波器子单元205适合于从第二音频段202生成低频分量208和高频分量209,低频分量208包括频率低于所述阈值的音频成分,高频分量209包括频率处于至少所述阈值的音频成分。
而且,所述系统200提供确定单元210,其包括第一确定子单元211和第二确定子单元212。确定单元210适合于确定第一音频段201和第二音频段202之间的过渡分布,即确定在第一音频段201的末端和在第二音频段202的开始的过渡的特性。特别是,第一确定子单元211确定在低频范围内第一音频段201的低频分量206与第二音频段202的低频分量208之间的过渡的过渡特性。与该确定相分开地,第二确定子单元212确定在高频范围内第一音频段201的高频分量207和第二音频段202的高频分量209之间的过渡的过渡特性。换句话说,第一确定子单元211确定用于定义输入音频段201、202的低音分量的过渡的参数。第二确定子单元212确定用于音频段201、202的高音分量的平滑过渡的参数。这样,第一确定子单元211的输出是依照某一低频过渡分布通过将输入音频段201的低频分量206和输入音频段202的低频分量208混合而获得的低频混合音频段213。第二确定子单元212的输出是依照某一高频过渡分布通过将输入音频段201的高频分量207和输入音频段202的高频分量209混合而获得的高频混合音频段214。
将低频混合音频段213和高频混合音频段214输入到组合单元215,其按照在混合单元215的输出端提供混合音频数据216的方式合并这些不同的音频成分,准备由扬声器、戴在头上的收话器等来输出。混合单元215根据对两个不同频率范围的确定的过渡特性将第一音频段201与第二音频段202混合。
现在将参照图3图示说明由用于混合音频数据的系统200来进行混合的第一图表300和第二图表310。
在第一图表300中,在横坐标301上标绘出将与第二音频段202的高频分量209混合的第一音频段201的高频分量207重放的时间的变化。高频分量207包含在频率fH附近的范围内的第一音频段201的频率的成分。高频分量209包含在频率fH附近的范围内的第二音频段202的频率的成分。在第一图表300的纵坐标302上以0和1之间的任意单位标绘出增益(也就是说音频成分207、209的振幅)。高频成分207也可以表示为即将播完的音频段或歌曲201的高音分布。术语“即将播完的”表示已经播放了一段时间并且其振幅平滑减小从而渐弱的音频段。术语“即将播放的”表示下一个要播放的并且振幅其平滑将增加从而渐强的音频段。高频分量209也可以表示为即将播放的歌曲202的高音分布。
如从第一图表300看到的,有第一高音部分303,其中基本上只播放第一音频段201。在随后的高音过渡部分304中,示出对于高频成分207、209的即将播完的第一音频段201与即将播放的第二音频段202的重叠。在该高音过渡部分304中,第一音频段201的高频分量207强度减小,而同时地,第二音频段202的高频分量209强度增强。在随后的第二高音部分305中,基本上只重放第二音频段202的高音分量209。
按照如在第一图表300中的相似的方式,第二图表310说明了将第一和第二音频段201、202的低频分量206、208混合的多过渡分布(multiple transition profile)。低频分量206包含在频率fL附近的范围内的第一音频段201的频率的成分。低频分量208包含在频率fL附近的范围内的第二音频段202的频率的成分。将横坐标301分成三个部分,即第一低音部分311、低音过渡部分312和第二低音部分313。在第一低音部分311中,只重放第一音频段201的低频分量206,即第一低音部分311代表即将播完的歌曲201的低音分布。在低音过渡部分312中,存在低音重叠,也就是说第一音频段201的低频分量206被振幅递减地重放,而即将播放的歌曲202的低频分量208的振幅在低音过渡部分312中增大。在第二低音部分313中,基本上仅有源于第二音频段202的低频分量208的成分。
如从图3可以了解的,独立地并且与低频分量207、209的过渡特性分开地调整高频分量206、208的过渡特性(参见第一图表300)(参见图表310)。
图3的说明以某种三维方式即在频率轴330上标绘图表300、310。虽然图3中仅仅为fL和fH附近的两个频率范围标绘出了分开的过渡范围,但是当然可以将其扩展到分开地调整过渡分布的所用的任何希望数量的频率范围。
在过渡时段304、312中进行混合操作期间,存在许多同时播放即将播完的歌曲201和即将播放的歌曲202的时刻。对于两个随后混合的乐曲201、202之间的这种过渡时段304、312的时间间隔的典型持续时间可以是例如10至30秒的数量级。根据本发明,实现了适宜的交叉衰减分布。如图3中所看到的,将歌曲201、202的高音分量207、209和低音分量206、208进行不同的混合,并且在不同的时刻混合。在不同时刻将高音分量207、209和低音分量206、208混合的用户(例如播放音乐(disk jockey)的播音员)可以将精力同时集中在至多两种声音和两种控制(“两只耳朵、两只手”的限制)上。因此,播放音乐的播音员一次能够适当地混合至多两个信号。与此相对照,基于图2和图3中所图示说明的系统200的音频播放音乐不受这种限制。除了区别如图2和图3中所图示说明的高频和低频(低音和高音)之外,利用系统200可以同时且不相等地混合高音分量和低音分量的分布,并且如果想要,还可以混合至少一个其他频率分量。这样,可以分开处理任何想要数量的频率子波段,其中混合性质是关心的。根据预期的相位关系,依赖于频率的过渡间隔304、312可以被实施。当长的过渡间隔304、312是不可避免的或者是首选的时,可以按照减小相位相消添加的风险或将其最小化的方式来混合低音分量。
根据本发明,如图3所示,可以独立地但优选同时地控制多个频段中的过渡的分布。在图3的简单例子中,说明了两个频带的情况,即高音频带和低音频带。
由于基线的重叠时间对于低音分量来说很小(参见低音过渡部分312的相对狭窄的时间间隔),因此相位相消混合的风险最小。但是,由于高音频率不易于这种相消混合,因此高音过渡部分304可能更宽,其允许从一首歌曲201到另一首歌曲202的平滑过渡。根据本发明,通常可以选择几个依赖于频带的过渡分布。
现在将参考图4描述根据本发明第二实施例的用于混合音频数据的系统400。
参考将音频数据进行混合的系统400,第一音频段201应用于第一滤波器组401,第二音频段202应用于第二滤波器组402。每个滤波器组401、402过滤所提供的音频段201、202从而至少将低频分量和高频分量分开。因此,第一滤波器组401过滤与第一音频段201有关的数据x[n]以产生低频分量xL[n]206和高频分量xH[n]207。按照类似的方式,第二滤波器组402过滤与第二音频段202有关的数据y[n]以产生低频分量yL[n]208和高频分量yH[n]209。低频分量206、208供给低频混频器403的输入端。高频分量207、209供给高频混频器404的输入端。混频器403、404接收来自微处理器405的命令,该命令定义关于应该如何将输入信号按照进行第一音频段201和第二音频段202之间的过渡从而使听众感觉到的主观音频质量是良好的这样方式来混合。与低频过渡分布213相对应的低频信号zL[n]供给低频混频器403的输出端。与高频过渡分布214相对应的数据zH[n]供给第二混频器404的输出端。将这些信号zL[n]和zH[n]施加于合成滤波器406的输入端,该合成滤波器将不同分量合成以生成表示在合成滤波器406的输出端处的混合音频数据216的信号z[n]。
仍然参考图4中所示的实施例,在所述过渡时段期间,两个相同的分析滤波器组401、402将两个输入信号x[n]和y[n]分别分解成两个互补的分量xL[n]和xH[n],以及yL[n]和yH[n]。这些可以是低频(低音)和高频(高音)分量。随后,应用混频器403、404(也表示为MX1和MX2)将两个信号的对应频率分量混合。假定xL[n]和yL[n]是低频分量,xH[n]和yH[n]是高频分量,那么MX1和MX2的过渡分布可以与图3中所示的过渡分布类似。因此,图4示出根据本发明实施例的用于混合音频数据的系统的基于滤波器组的实施方案。
然后混频器403、404的输出zL[n]和zH[n]被传递到合成滤波器组406以生成输出混合信号z[n]。优选地,按照形成具有滤波器组401、402的完美重构对的这种方式来设计合成滤波器406。来自微处理器405的输入控制该两个混频器403、404并且优选地传送关于混合时刻和重叠量的信息。
现在将参考图5来描述根据本发明第三实施例的混合音频数据的系统500。
系统500与系统400的不同之处在于用第一低通滤波器501和第一高通滤波器502取代第一滤波器组401。用第二低通滤波器503和第二高通滤波器504取代第二滤波器组402。第一低通滤波器501提取第一音频歌曲x[n]201的低频分量xL[n]206。第一高通滤波器502从第一音频段x[n]201提取高频分量xH[n]207。第二低通滤波器503从第二音频段y[n]202提取低频分量yL[n]208。第二高通滤波器504从第二音频段y[n]202提取高频分量yH[n]209。
而且,在图5中所示的实施例中,用加法单元505取代图4的合成滤波器406,该加法单元505用于将在混频器403、404的输出端提供的分量zL[n]和zH[n]相加。图5示出的实施例具有一对补偿滤波器。
图6示出具有横坐标601的图表600,在该横坐标601上标绘出频率。而且,在纵坐标602上以任意单位标绘出强度。图6示出低通滤波器频率行为603,其图示说明低通滤波器501、503的频率响应。图6还示出高通滤波器频率行为604,其反映高通滤波器502、504的频率响应。
低通滤波器501、503和高通滤波器502、504应当具有这样的行为,使得LPF+HPF之和形成全通滤波器。图6中示出LPF和HPF的频率响应的例子。
根据本发明,可以选择任何所希望数量的多频带,每个频带都具有其自己的过渡分布。此外,每个频带中的过渡分布可以独立地在零重叠到变化到非常大的重叠。
现在将参考图7描述根据本发明第四实施例的用于将音频数据进行混合的系统700的一部分。
图7中所示的用于将音频数据进行混合的系统700的这一部分着手于解决控制将要混合的信号的低音分量的相位的问题以便使相消干扰的风险最小化或减小该风险。对于这种情况,图4和图5中所示的混频器403可以如图7中所示来实现。
首先在相位分析单元701中比较低频分量xL[n]和yL[n]的相位。将比较器701的输出用作控制信号C的基础,该控制信号C控制第一延迟单元702和第二延迟单元703,以便使加法过程中的任何相位抵触最小化。因此,利用第一延迟单元702限定的具体延迟(或超前)将信号xL[n]延迟,然后将其应用于第一增益单元704。利用第二延迟单元703将信号yL[n]延迟或超前,然后由第二增益单元705使其增大。增益单元704、705的输出在加法单元706中相加以生成信号zL[n]。
图7中所示的电路因此补偿了相位差,并且该图示出了用于相位补偿混合的混频器单元403(或MX1)的细节。
为了防止听觉假象,可以以适宜的方式来改变或调整延迟单元702、703的延迟Dx和Dy。增益单元704、705的增益Gx和Gy实现了与图3的第二图表310中所示的相类似的交叉衰减分布。
现在参考图8来描述根据本发明实施例的自动播放音乐设备800。
自动播放音乐设备800包括根据本发明实施例的用于将音频信号进行混合的系统。利用自动播放音乐设备800,可以根据一些相似性准则将内容分类并且按照平滑、节奏一致的方式来播放。该后面的程序称为自动播放音乐或AutoDJ。图8中示出了实施根据本发明的系统的AutoDJ的功能。
首先,对歌曲数据库单元801(例如硬盘或CD或DVD)中存储的歌曲进行分析以提取代表性的参数。该分析在自动播放音乐分析单元802中进行。这些代表性的参数可以包括,其中,引子的结束、Outro的开始、短句(phase)或小节界限、节奏和节拍位置(初起)、和声标记(HarmonicSignature)等。这些参数也可以表示为AutoDJ参数,其可以被离线计算,并存储在链接的数据库中,即特征数据库单元803(其例如是硬盘等)中。
在并行的路径上,生成使用用户偏爱的播放列表,其中播放列表生成单元805生成该播放列表。在给定这种播放列表的情况下,所谓的过渡分析器和播放列表-重排序单元804比较与播放列表中的歌曲相对应的AutoDJ参数,确定最佳播放顺序,并生成由重放单元806(CD播放器、DVD播放器等)执行的一组命令。
最后,播放器将来自数据库的歌曲流到执行命令序列的输出播放(rendering)设备(例如扬声器807)中,该命令序列指示应该怎样混合和重放这些歌曲。依照根据本发明的频率均衡控制音频混合方案在过渡分析器和重放-重排序单元804中确定由重放单元806和扬声器807要重放的两个随后音频段之间的过渡。
应该注意,所使用的动词“包括”及其动词变化不排除还存在其它权利要求中没有指定的元件或步骤,元件或步骤之前使用的数量词“一”或“一个”不排除存在多个这种元件或步骤。此外,可以将相互关联的不同实施例描述的元件进行组合。
还应该注意,权利要求中的附图标记不应当理解为对权利要求范围的限制。
Claims (20)
1.一种用于将第一音频数据(201)和第二音频数据(202)混合的系统(200),该系统(200)包括
滤波器单元(203),其适于过滤第一音频数据(201)和第二音频数据(202)以生成第一音频数据(201)在第一频率范围内的分量(206)、第一音频数据(201)在第二频率范围内的分量(207)、第二音频数据(202)在第一频率范围内的分量(208)和第二音频数据(202)在第二频率范围内的分量(209);
确定单元(210),其适于按照将第一音频数据(201)和第二音频数据(202)在第一频率范围内的分量(206,208)之间的过渡的过渡特性与第一音频数据(201)和第二音频数据(202)在第二频率范围内的分量(207,209)之间的过渡的过渡特性分开确定的这种方式来确定第一音频数据(201)和第二音频数据(202)之间的过渡分布。
2.根据权利要求1的系统(200),
其中该滤波器单元(203)适于过滤第一音频数据(201)与第二音频数据(201)从而生成第一音频数据(201)在至少一个其他频率范围内的分量以及生成第二音频数据(202)在该至少一个其他频率范围内的分量;
其中该确定单元(210)适于将第一音频数据(201)与第二音频数据(202)在所述至少一个其他频率范围内的分量之间的过渡分布的过渡特性与第一音频数据(201)与第二音频数据(202)在第一频率范围和第二频率范围内的分量(206到209)之间的过渡分布的过渡特性分别地确定。
3.根据权利要求1的系统(200),
其中该确定单元(210)适于确定所述过渡分布,使得在所述过渡之前,混合的数据包含第一音频数据(201);
在所述过渡期间,混合的数据包括第一音频数据(201)的递减成分和第二音频数据(202)的递增成分,以及
在所述过渡之后,混合数据由第二音频数据(202)组成。
4.根据权利要求1的系统(200),
其中该确定单元(210)适于确定过渡分布,使得对于第一频率范围的用于限定所述过渡的持续时间的时间间隔(304,312)比对于第二频率范围的用于限定所述过渡的持续时间的时间间隔长。
5.根据权利要求4的系统(200),
其中所述第一频率范围包括比所述第二频率范围更高的频率。
6.根据权利要求1的系统(200),
其中该确定单元(210)适于确定所述过渡分布,使得对于所述第一频率范围的用于限定所述过渡的持续时间的时间间隔(304)的中心基本上等于对于所述第二频率范围的用于限定所述过渡持续时间的时间间隔(312)的中心。
7.根据权利要求1的系统(200),
其中该确定单元(210)适于确定所述混合的音频数据的总振幅在所述过渡期间基本上恒定。
8.根据权利要求1的系统(200),
其中该确定单元(210)适于同时确定第一频率范围内和第二频率范围内的过渡特性。
9.根据权利要求1的系统(200),
包括相位分析单元(701),其适于分析第一音频数据(201)和第二音频数据(202)在第一频率范围中的分量(206,208)的相位关系和/或第一音频数据(201)和第二音频数据(202)在第二频率范围中的分量的相位关系;
其中该确定单元(210)适于在考虑所分析的相位关系时确定所述过渡特性。
10.根据权利要求9的系统(200),
其中该确定单元(210)适于确定过渡特性,从而在所述过渡期间基本上防止了第一音频数据(201)和第二音频数据(202)在第一频率范围内的分量(206,208)的相位相消干扰,和/或第一音频数据(201)和第二音频数据(202)在第二频率范围内的分量的相位相消干扰。
11.根据权利要求9的系统(200),
其中该确定单元(210)适于确定所述过渡特性,从而通过使第一音频数据(201)和/或第二音频数据(202)在第一频率范围和/或第二频率范围内选择性地延迟或超前而在所述过渡期间防止了第一音频数据(201)和第二音频数据(202)在第一频率范围内的分量(206,208)的相位相消干扰,和/或第一音频数据(201)和第二音频数据(202)在第二频率范围内的分量的相位相消干扰。
12.根据权利要求1的系统(200),还包括混合单元(215),其适于根据已确定的过渡特性而将第一音频数据(201)与第二音频数据(202)混合。
13.根据权利要求1的系统(200),
其中该确定单元(210)适于按照与在第二频率范围内第一音频数据(201)的分量和第二音频数据(202)的分量之间的过渡的过渡特性相比不同的方式来确定在第一频率范围内第一音频数据(201)的分量和第二音频数据(202)的分量之间的过渡的过渡特性。
14.根据权利要求1的系统(200),
其中确定第一音频数据(201)和第二音频数据(202)的分量之间的过渡的过渡特性的步骤包括确定第一音频数据(201)和/或第二音频数据(202)在第一频率范围内和/或在第二频率范围内的振幅性质和/或相位性质。
15.根据权利要求1的系统(200),
其以集成电路来实现。
16.根据权利要求1的系统(200),
其以自动播放音乐设备(800)来实现。
17.根据权利要求1的系统(200),
其以下面组中的至少一个来实现,所述组包括DVD播放器、基于硬盘的音频播放器、便携式音频播放器、可佩戴的音频播放器、网络无线电装置、公共娱乐装置、以及MP3播放器。
18.一种用于将第一音频数据(201)和第二音频数据(202)混合的方法,该方法包括以下步骤
过滤第一音频数据(201)和第二音频数据(202)以生成第一音频数据(201)在第一频率范围内的分量(206)、第一音频数据(201)在第二频率范围内的分量(207)、第二音频数据(202)在第一频率范围内的分量(208)和第二音频数据(202)在第二频率范围内的分量(209);
按照将第一音频数据(201)和第二音频数据(202)在第一频率范围内的分量(206,208)之间的过渡的过渡特性与第一音频数据(201)和第二音频数据(202)在第二频率范围内的分量(207,209)之间的过渡的过渡特性分开确定的这种方式来确定第一音频数据(201)和第二音频数据(202)之间的过渡分布。
19.一种程序单元,当由处理器执行该程序单元时,该程序单元适于实施将第一音频数据(201)和第二音频数据(202)混合的方法,该方法包括以下步骤
过滤第一音频数据(201)和第二音频数据(202)以生成第一音频数据(201)在第一频率范围内的分量(206)、第一音频数据(201)在第二频率范围内的分量(207)、第二音频数据(202)在第一频率范围内的分量(208)和第二音频数据(202)在第二频率范围内的分量(209);
按照将第一音频数据(201)和第二音频数据(202)在第一频率范围内的分量(206,208)之间的过渡的过渡特性与第一音频数据(201)和第二音频数据(202)在第二频率范围内的分量(207,209)之间的过渡的过渡特性分开确定的这种方式来确定第一音频数据(201)和第二音频数据(202)之间的过渡分布。
20.一种计算机可读介质,在该计算机可读介质中存储计算机程序,当由处理器执行该计算机程序时,该计算机程序适于实施将第一音频数据(201)和第二音频数据(202)混合的方法,该方法包括以下步骤
过滤第一音频数据(201)和第二音频数据(202)以生成第一音频数据(201)在第一频率范围内的分量(206)、第一音频数据(201)在第二频率范围内的分量(207)、第二音频数据(202)在第一频率范围内的分量(208)和第二音频数据(202)在第二频率范围内的分量(209);
按照将第一音频数据(201)和第二音频数据(202)在第一频率范围内的分量(206,208)之间的过渡的过渡特性与第一音频数据(201)和第二音频数据(202)在第二频率范围内的分量(207,209)之间的过渡的过渡特性分开确定的这种方式来确定第一音频数据(201)和第二音频数据(202)之间的过渡分布。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05101092.4 | 2005-02-14 | ||
EP05101092 | 2005-02-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101120412A true CN101120412A (zh) | 2008-02-06 |
Family
ID=36688142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800048818A Pending CN101120412A (zh) | 2005-02-14 | 2006-02-07 | 一种用于将第一音频数据和第二音频数据混合的系统和方法、一种程序单元以及一种计算机可读介质 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2008532353A (zh) |
CN (1) | CN101120412A (zh) |
WO (1) | WO2006085265A2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157944A (zh) * | 2015-05-14 | 2016-11-23 | 仁宝电脑工业股份有限公司 | 节拍标记方法 |
WO2023035647A1 (zh) * | 2021-09-10 | 2023-03-16 | 安徽华米健康科技有限公司 | 基于可穿戴设备的音乐推荐方法、装置、设备及存储介质 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080319756A1 (en) * | 2005-12-22 | 2008-12-25 | Koninklijke Philips Electronics, N.V. | Electronic Device and Method for Determining a Mixing Parameter |
JP5057535B1 (ja) * | 2011-08-31 | 2012-10-24 | 国立大学法人電気通信大学 | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 |
US9596538B2 (en) | 2014-12-12 | 2017-03-14 | Intel Corporation | Wearable audio mixing |
JP6482880B2 (ja) * | 2015-01-19 | 2019-03-13 | 国立大学法人電気通信大学 | ミキシング装置、信号ミキシング方法、及びミキシングプログラム |
DK179034B1 (en) * | 2016-06-12 | 2017-09-04 | Apple Inc | Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs |
EP3783912B1 (en) * | 2018-04-17 | 2023-08-23 | The University of Electro-Communications | Mixing device, mixing method, and mixing program |
JP7260101B2 (ja) | 2018-04-19 | 2023-04-18 | 国立大学法人電気通信大学 | 情報処理装置、これを用いたミキシング装置、及びレイテンシ減少方法 |
WO2019203126A1 (ja) | 2018-04-19 | 2019-10-24 | 国立大学法人電気通信大学 | ミキシング装置、ミキシング方法、及びミキシングプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0158055A1 (de) * | 1984-03-06 | 1985-10-16 | WILLI STUDER AG Fabrik für elektronische Apparate | Verfahren zur Ueberblendung digitaler Audiosignale, sowie Vorrichtung zur Durchfahrung des Verfahrens |
GB9918502D0 (en) * | 1999-08-06 | 1999-10-06 | Carey Daniel | Apparatus |
GB2378626B (en) * | 2001-04-28 | 2003-11-19 | Hewlett Packard Co | Automated compilation of music |
-
2006
- 2006-02-07 WO PCT/IB2006/050392 patent/WO2006085265A2/en active Application Filing
- 2006-02-07 CN CNA2006800048818A patent/CN101120412A/zh active Pending
- 2006-02-07 JP JP2007554707A patent/JP2008532353A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157944A (zh) * | 2015-05-14 | 2016-11-23 | 仁宝电脑工业股份有限公司 | 节拍标记方法 |
CN106157944B (zh) * | 2015-05-14 | 2019-11-05 | 仁宝电脑工业股份有限公司 | 节拍标记方法 |
WO2023035647A1 (zh) * | 2021-09-10 | 2023-03-16 | 安徽华米健康科技有限公司 | 基于可穿戴设备的音乐推荐方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2008532353A (ja) | 2008-08-14 |
WO2006085265A3 (en) | 2006-10-26 |
WO2006085265A2 (en) | 2006-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101120412A (zh) | 一种用于将第一音频数据和第二音频数据混合的系统和方法、一种程序单元以及一种计算机可读介质 | |
JP4823030B2 (ja) | 音声処理装置および音声処理方法 | |
US20080160943A1 (en) | Method and apparatus to post-process an audio signal | |
CN1830141B (zh) | 音频调节装置和方法 | |
JP6484605B2 (ja) | 複数のオーディオステムからの自動マルチチャネル音楽ミックス | |
US20140157970A1 (en) | Mobile Music Remixing | |
US20050201572A1 (en) | Method and system for approximating graphic equalizers using dynamic filter order reduction | |
KR102477001B1 (ko) | 오디오 특성의 분석을 기반으로 오디오 재생 설정을 조정하는 방법 및 장치 | |
JP4766491B2 (ja) | 音声処理装置および音声処理方法 | |
CN202871289U (zh) | 一种基于mp3格式的便携式卡拉ok装置 | |
WO2005106843A1 (en) | Reproduction control of an audio signal based on musical genre classification | |
De Man et al. | A semantic approach to autonomous mixing | |
CN103262573B (zh) | 声音再生装置、再生音调整方法、音响特性调整装置、音响特性调整方法及计算机程序 | |
US20040002781A1 (en) | Methods and apparatuses for adjusting sonic balace in audio reproduction systems | |
Shelvock | Audio mastering as musical practice | |
Deruty et al. | Human–made rock mixes feature tight relations between spectrum and loudness | |
CN112511966B (zh) | 一种车载立体声重放的自适应主动分频方法 | |
WO2011087460A1 (en) | A method and a device for generating at least one audio file, and a method and a device for playing at least one audio file | |
US20090192636A1 (en) | Media Modeling | |
US20180070175A1 (en) | Management device and sound adjustment management method, and sound device and music reproduction method | |
DK201300471A1 (en) | System for dynamically modifying car audio system tuning parameters | |
JP6474292B2 (ja) | カラオケ装置 | |
US8086448B1 (en) | Dynamic modification of a high-order perceptual attribute of an audio signal | |
JP5591098B2 (ja) | カラオケ多重録音編集システム | |
US12010495B2 (en) | Techniques for audio track analysis to support audio personalization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |