CN110574107A - 数据格式 - Google Patents

数据格式 Download PDF

Info

Publication number
CN110574107A
CN110574107A CN201780085855.0A CN201780085855A CN110574107A CN 110574107 A CN110574107 A CN 110574107A CN 201780085855 A CN201780085855 A CN 201780085855A CN 110574107 A CN110574107 A CN 110574107A
Authority
CN
China
Prior art keywords
audio data
audio
tempo
playback
range
Prior art date
Application number
CN201780085855.0A
Other languages
English (en)
Inventor
艾伦·坎尼斯特拉罗
丹尼尔·达尼拉托斯
智弗兰克·黄
尼克·拉奈
拉尔斯·拉斯姆森
乔治·埃洛米达·维斯维基
Original Assignee
韦弗音乐有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to GB1620839.9 priority Critical
Priority to GBGB1620839.9A priority patent/GB201620839D0/en
Application filed by 韦弗音乐有限公司 filed Critical 韦弗音乐有限公司
Priority to PCT/GB2017/053690 priority patent/WO2018104744A1/en
Publication of CN110574107A publication Critical patent/CN110574107A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • G10H1/0025Automatic or semi-automatic music composition, e.g. producing random music, applying rules from music theory or modifying a musical piece
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/40Rhythm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/076Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/101Music Composition or musical creation; Tools or processes therefor
    • G10H2210/125Medley, i.e. linking parts of different musical pieces in one single piece, e.g. sound collage, DJ mix
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/375Tempo or beat alterations; Music timing control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/375Tempo or beat alterations; Music timing control
    • G10H2210/385Speed change, i.e. variations from preestablished tempo, tempo change, e.g. faster or slower, accelerando or ritardando, without change in pitch
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/011Files or data streams containing coded musical information, e.g. for transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/011Files or data streams containing coded musical information, e.g. for transmission
    • G10H2240/031File merging MIDI, i.e. merging or mixing a MIDI-like file or stream with a non-MIDI file or stream, e.g. audio or video
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods

Abstract

一种用于构造自适应媒体文件的方法,该自适应媒体文件包括配置为用于形成被布置为具有可控拍速的音频输出的多个音频分量,该方法包括:提供与该多个音频分量中的第一音频分量相关联的第一音频数据,设定该第一音频数据的回放拍速范围,提供与该第一音频分量相关联的第二音频数据,设定该第二音频数据的回放拍速范围,其中该第二音频数据的拍速范围与第一音频数据的拍速范围不同,将该第一音频数据、该第二音频数据和相应的回放拍速范围相关联。

Description

数据格式

技术领域

本公开涉及用于构造媒体文件和相关联的文件的方法。更具体地但非排它地,提出了允许以不同的拍速(tempo)回放音频的音频文件类型。还讨论了用于控制音乐轨(music track)所呈现的回放拍速的方法。在以下讨论的基础上,许多其它应用将是明显的。

背景技术

在音乐产业中,许多标准和成功的音乐轨经常被再混合(remix)(即再制作)以创造不同的歌曲。即使旋律大部分被保留,再混合通常也会改变歌曲的原始节律(rythem)或每分钟节拍(Beat Per Minute,BPM)以创造不同的气氛或氛围。歌曲可以被加速以赋予它俱乐部的感触,和被放慢以赋予它更休闲的输入。

歌曲或音乐轨通常是几个音频数据组(例如8个音频数据组)的混合的结果,每个音频数据组对应于被分配了特定功能(声乐1、声乐2、节拍……)或乐器(钢琴、吉他、竖琴、萨克斯、贝斯……)的音频通道。每个音频数据组以及由此的音乐轨本身的特征在于其旨在被呈现或被播放的回放拍速。回放拍速通常对应于记录了不同音频数据组的原始BPM。音频通道(更具体地是所分配的音频数据组)通常由音乐编辑器重新制作,以产生用于能够取悦收听者的音乐轨的原始编排(original arrangement)。

改变回放拍速是复杂的过程,因为原始编排可能会被显著地影响。主要的干扰是该编排的音高通常会受到严重地影响,使得该歌曲对于耳朵而言听起来“怪异”或“静默”。再混合通常会包括艺术和技术工作,以改变回放拍速,同时产生保持悦耳的新编排。为了协助该技术工作,如今可以使用不同的工具,例如时间拉伸音频数据组。时间拉伸由将音频数据组从其最初意图用于的原始回放拍速转换为与不同的回放拍速相关联的修改的音频数据组所组成。该转换允许对音调的控制,以使得回放拍速中的差异减小在艺术布置上的影响。

时间拉伸的问题在于,在影响失去控制之前所允许的回放拍速的范围相当有限。原始回放拍速经过一定百分比的增加或减少后,可用工具以及音乐编辑器的艺术技巧将不能补偿该编排和原始音频样本的粗糙变形。

如今仍然需要一种方法,以在大范围的值上改变音乐轨的回放拍速,同时限制人的耳朵所感知的劣化。具体地,需要在收听者收听音乐轨时实现这种拍速的改变。

发明内容

根据一方面,提供了一种用于构造自适应媒体文件的方法,该自适应媒体文件包括配置为用于形成被布置为具有可控拍速的音频输出的多个音频分量,该方法包括:提供与该多个音频分量中的第一音频分量相关联的第一音频数据,设定该第一音频数据的回放拍速范围,提供与该第一音频分量相关联的第二音频数据,设定该第二音频数据的回放拍速范围,其中该第二音频数据的拍速范围与第一音频数据的拍速范围不同,并将该第一音频数据、该第二音频数据和相应的回放拍速范围相关联。

可选地,该第一音频数据、该第二音频数据和相应的回放拍速范围通过将放置在文件结构内而相关联。可选地,通过与第一音频数据和第二音频数据相关联的元数据中的引用而将该第一音频数据、第二音频数据和相应的回放拍速范围相关联。可选地,该第一音频数据的回放拍速范围被并入第一音频数据的元数据中。

可选地,该第一音频数据的回放拍速范围提供代表下限拍速和上限拍速的数据。可选地,在回放期间,该第一音频数据布置为:当回放拍速高于下限拍速并且低于上限拍速,或者高于或等于下限拍速并且低于或等于上限拍速时,呈现为音频输出的一部分。可选地,该第一音频数据具有拍速,并且代表该下限拍速和该上限拍速的数据是以下中的一者:实际上限拍速和实际下限拍速;高于第一音频数据的拍速的每分钟的节拍数和低于第一音频数据的拍速的每分钟的节拍数。

可选地,该第一音频数据的拍速范围定义第一音频数据将被时间拉伸至的最大和最小拍速。可选地,该提供通过下述中的一个或多个来实现:记录声音以形成音频数据、使用音频生产工具创建音频数据,或导入音频数据。

可选地,该第一音频数据和该第二音频数据是第一音频文件和第二音频文件,或者是从第一音频文件和第二音频文件导出的。可选地,将该第一音频数据、该第二音频数据和相应的回放拍速范围相关联是基于包括在自适应媒体文件中的一个或多个配置文件的。可选地,在自适应媒体文件内识别与多个音频分量中的第一音频分量相关联的第一音频数据。可选地,自适应媒体文件是音频文件或者包括视频帧数据和相关联的音频数据的视频文件中的一者。

根据进一步的方面,提供了一种计算机可读介质,其包括计算机可读指令,该计算机可读指令配置为在使用中使得处理器能够执行所述方法。

根据进一步的方面,提供了一种自适应媒体文件,该自适应媒体文件用于提供包括用于形成被布置为具有可控拍速的音频输出的多个音频分量的数据,该自适应媒体文件包括:与该多个音频分量中的第一音频分量相关联的第一音频数据;该第一音频数据的回放拍速范围;与该多个音频分量中的第一音频分量相关联的第二音频数据和该第二音频数据的回放拍速范围,其中:该第二音频数据的拍速范围与该第一音频数据的拍速范围不同,且该第一音频数据、该第二音频数据和相应的回放拍速范围是相互关联的。

可选地,该第一音频数据、该第二音频数据和相应的回放拍速范围通过处于文件结构内而相关联。可选地,通过与第一音频数据和第二音频数据相关联的元数据中引用而将该第一音频数据、第二音频数据和相应的回放拍速范围相关联。可选地,该第一音频数据的回放拍速范围被并入第一音频数据的元数据中。

可选地,该第一音频数据的回放拍速范围提供代表下限拍速和上限拍速的数据。可选地,在回放期间,该第一音频数据布置为:当回放拍速高于下限拍速并且低于上限拍速,或者高于或等于下限拍速并且低于或等于上限拍速时,呈现为音频输出的一部分。可选地,该第一音频数据具有拍速,并且代表该下限拍速和该上限拍速的数据是以下中的一者:实际上限拍速和实际下限拍速;高于第一音频数据的拍速的每分钟的节拍数和低于第一音频数据的拍速的每分钟的节拍数;或该拍速能够被移位为低于或高于该拍速的量。可选地,该第一音频数据的拍速范围定义第一音频数据将被时间拉伸至的最大拍速和最小拍速。

可选地,该第一音频数据和该第二音频数据是第一音频文件和第二音频文件,或者是从第一音频文件和第二音频文件导出的。可选地,在包括在自适应媒体文件中的一个或多个配置文件中识别相互关联的第一音频数据、第二音频数据和相应的回放拍速范围。可选地,在自适应媒体文件内识别与多个音频分量中的第一音频分量相关联的第一音频数据。可选地,自适应媒体文件是音频文件或者包括视频帧数据和相关联的音频数据的视频文件中的一者。

归功于本方法,由于音频通道与能够基于输入回放拍速而交替使用的多个音频数据组相关联,因此减小了在其上可以使用音频数据组的回放拍速的范围。在现有技术中,用户必须使用例如时间拉伸处理而在回放拍速的大间隔上进行转换。利用本方案,他可以针对同一音频通道定义多个音频数据组,每个音频数据组仅在相关联的且较小的回放拍速范围上使用。如果用户所选择的更新的回放拍速落在不同的回放拍速范围内,则本音频混合方案将触发不同的音频数据组的使用,从而减少例如“超时间拉伸”音频数据组。

可以使用电子设备(例如通过应用程序在移动设备上实现的音乐控制器)来实现本方法。该电子设备也可以是计算机,而声音混合方案可以通过如本文所述的界面来控制。本方案可以被称为音频混合控制器,回放拍速控制器或简称为音频混合器。

附图说明

现在将通过参考附图仅作为示例地进一步详细描述布置,其中:

图1是配置为实施本方法的布置的电子设备的示意图;

图2是本方法的另一布置的示意图,包括电子设备、远程设备和音频输出设备;

图3是根据本音频控制器的另一布置的示例性图形用户界面(Graphical UserInterface,GUI);

图4.1至4.3是根据本音频控制器的另一布置的GUI的替代性示例;

图5.1和5.2是展示根据本方法的不同配布置由本音频控制器实现的总体操作步骤的流程图;以及

图6示出了计算设备的一种实现的框图。

具体实施方式

在本说明书中,术语“呈现”或“渲染”将涉及制造用户能够听得到的音频数据组、音乐轨或音频通道等的工作。

音轨(audio track)(例如歌曲)通常包括一个或多个音频分量。每个音频分量对应于音轨的不同部分,例如不同的乐器、声乐等。图3中可以看到用于产生音轨的自适应媒体文件的图示,其示出了具有由垂直延伸的条形元素所代表的10个音频分量的自适应媒体文件。音频分量可以各自对应于相应的音频通道,或者由多于一个音频数据组所组成的音频分量可以散布在多于一个音频通道上。例如,图3中,“钢琴高”音频分量对应于单个音频通道,“钢琴低”音频分量对应于两个音频通道。在垂直轴上指示轨(track)的回放拍速。

每个音频分量具有由条形元素的不同部分所代表的一个或多个音频数据组。每个部分对应于一回放拍速范围。如此,这些部分在垂直方向上不重叠,并且在垂直方向上分别用第一边界和第二边界界定。看向“钢琴低”音频通道,3个部分311、312和313分别与回放拍速范围60-100bpm、100-170bpm和170-240bpm相关联,这些值以bpm表示。“竖琴:合成器”音频通道包括2个部分301和302,其分别与回放拍速范围80-139bpm和139-240bpm相关联。对于给定的音频分量,回放拍速范围可以被视为音频数据组可以在其上使用的回放拍速的范围。该回放拍速范围可以是相邻的,即第一回放拍速范围的最高水平对应于第二回放拍速范围的最低水平。在这种情况下,两个毗连的回放拍速范围共享共同的回放拍速边界。

音频数据组或“音干(stem)”及其相应的回放拍速范围可以通过将它们放置在文件结构内或通过与音频数据组或音干相关联的元数据中的引用来相关联。给定的音频数据组的回放拍速范围可以被并入该音频数据组的元数据中。可选地,音频数据组可以包含在一个或多个音频文件中,且配置文件可以定义该文件的相关细节,例如回放拍速范围以及数据组之间的关系,包括数据组之间的过渡特性,这将在稍后变得明显。

更通常地,形成音乐轨的每个音频分量与多个音频数据组相关联,每个音频数据组本身与回放拍速范围相关联。由于本方案允许控制回放拍速以在音频输出设备处呈现音乐轨,所以回放拍速的选择将基于所选择的回放拍速所属于的回放拍速范围来确定针对音频分量选择哪个音频数据组。回放拍速范围可以被视为针对音频分量在其上可以使用音频数据组的回放拍速的范围。

在回放期间,当选择的回放拍速高于音频数据组的下限拍速且低于音频数据组的上限拍速时,可以将该音频数据组布置为作为音频输出的一部分呈现。可选地,当选择的回放拍速为或高于或等于该下限拍速且低于或等于该上限拍速时,可以将该音频数据组布置为作为音频输出的一部分呈现。

在记录音频数据组期间,音乐家以若干拍速在乐器上演奏相同系列的音符,以便记录必要数量的音频数据组。类似地,歌手以不同的速度唱出相同的旋律以针对语音音频分量定义多个音频数据组。图3的示例中的不同拍速为70bpm、120bpm和172bpm。这些预定的回放拍速值对应于可以被称为相应的音频数据组的本地回放拍速的内容。它们定义了在记录音频数据组时该音频数据组旨在被呈现于的回放拍速(例如,声音、乐器、节拍等的初始拍速)。用于音频数据组的本地回放拍速包括在用于该音频数据组的回放拍速范围之中。

可以根据其本地拍速来计算音频数据组的回放拍速范围。例如,该范围可以被定义为高于该音频数据组的本地拍速的每分钟节拍数和低于该音频数据组的本地拍速的每分钟节拍数。该第一音频数据的拍速范围可以定义第一音频数据在回放期间要被时间所拉伸至的最大拍速和最小拍速。

每个音频数据组可以与多个音频分量中相应的音频分量相关联。这可以在自适应媒体文件内被识别。自适应媒体文件可以为音频数据组或者包括视频帧数据和相关联的音频数据的视频文件中的一者。

回放拍速范围可以是用户基于对他想要使用的记录所处的回放拍速的范围的欣赏来定义的。假设他记录了以三个本地拍速70BPM、120BPM和172BPM提到的低钢琴的三个音频数据组,那么他将分别将三个拍速范围311、312和313相关联。每次用户选择回放拍速时,本方案将使得每个音频分量能够选择与包括所选择的回放拍速的回放拍速范围相对应的音频数据组。为此,图3中GUI的左手侧示出了附加的条形元素315,该条形元素315在与用于音频通道的条形元素相同的方向上延伸。该附加条形元素可以被视为游标条315,以设定用于通过游标图形元素316上的输入来呈现音乐轨的回放拍速。游标元素316可以呈现标签以显示与在光标条315上的用户选择相对应的BPM值。如果如图3的图示中选择了120BPM的回放拍速,则将选择对应于用于低钢琴的范围312的音频数据组和用于竖琴的范围301的音频数据组,并将其分配给用于呈现音乐轨的它们各自的音频分量。

由于在垂直方向上延伸的许多条形元素可能使用户难以读取所选择的节拍范围,所以本系统提出了在GUI的第二方向上延伸以使得其穿过所有的垂直条形元素的另一图形元素320。在图3的图示中,在垂直方向上提出了10个条形元素,同时在穿过多个条形元素的水平方向上设定了BPM水平。然而,当移动游标316以选择水平地穿过所有音频通道的回放拍速时,用户可能会陷入已选择了哪个回放拍速范围的怀疑中。对于其图形条形元素位于界面的相对侧的音频分量尤其如此,如用于2个合成器的音频通道。图形元素320在第一方向(即游标条的方向和条形元素的方向)上可移动,该动作例如通过游标条315上的输入来致动。可以被视为用于回放拍速范围的选择条的图形元素320在穿过用于音频分量的所有条的水平方向上延伸。因此,用户具有将选择哪个拍速范围的清楚的可视的表现。

在本系统中提出了进一步的GUI反馈。可以在图4.1至4.3中看到该GUI反馈的图示。在用于控制电子设备(例如,音频混合器设备)的GUI的本方案中,设备的处理器配置为响应于用于将游标条415的游标(图形元素)416沿第一方向移动的用户输入:

确定游标416的新位置;

针对每个条形元素,确定被图形元素或选择条420穿过的子部分;

通过使用第一渲染模式渲染被选择条420穿过的子部分,以将它们标记为活跃;

通过使用与第一渲染模式不同的第二渲染模式渲染其它子部分,以将它们标记为非活跃。

不同的渲染模式可以包括如下突出显示选择的回放拍速范围的子部分元素。图4.1的GUI示出了具有用于多个音频通道的11个垂直条形元素的开始界面。由于回放尚未开始,因此没有突出显示回放拍速范围。示出了用于不同音频通道的所有拍速范围,并且从游标条415上的默认起始拍速147BPM处示出了选择条420。当用户提供输入以将游标条415上的游标元素416向下滑动至如游标元素415所携带的标签上所示的112BPM的选择的值处时,处理器将检查针对选择的112BMP的回放拍速的每个音频分量提供了哪些回放拍速范围。在图4.2的图示中,对应于这些回放拍速范围的子部分元素421将以第一渲染模式被渲染,此处以浅白的形式,但是替代性地以强烈颜色的突出显示的形式,而不包括所选择的回放拍速的其它回放拍速范围将以可辨别的第二渲染模式被渲染。这在图4.2中用阴影线的子部分(如子部分422)所示,但替代性地也可以是暗淡的子部分。在本方法的附加布置中,条形元素中未定义有回放拍速范围的部分(如当拍速范围未被分配至任何音频数据组时条形元素可以呈现不连续性)也可以以相同的第二渲染模式被渲染。替代性地,它们可以以第三渲染模式被渲染,如更窄的阴影线或更强的暗淡,以使得如子部分423所见的容易被用户忽略。当前有区别的渲染模式允许用户具有哪些子部分为活跃(即分配给音频分量的相应的音频数据组),以及哪些子部分为非活跃(即没有对应于用户当前所作为目标的回放拍速范围的音频数据组)上的清楚的反馈。

本GUI的另一布置如图4.3所示,其中所选择的回放拍速现在为148BPM。这时,7个子部分被突出显示为活跃,而某些回放拍速范围不再活跃,因为所选择的回放拍速的值大于它们的上限。在此图示中,回放拍速范围对于大多数音频分量是毗连的,并且随着用户所请求的BPM的增大上限值范围变为活跃。

本图示提出将游标作为可移动图形元素,但是使用不同可移动图形元素的其它图示将从本教导中受益。此外,在音频混合器的背景下,图示是本GUI的可能用途。可选地,任何对多分量变形的控制可以从本教导中受益。实际上,如果在第一方向上延伸的每个条形元素代表分量的值,并且条形元素包括代表值间隔的一个或多个子部分,则当前GUI允许被选择条穿过的活跃间隔的容易地选择。值的每个间隔可以被分配有例如文件、函数、唯一标识符或值,并且当界面包括大量的分量值的条时,当前界面允许在多个活跃间隔上的缓和的同时反馈,否则这些大量的分量值的条会使其控制更加复杂。

回到实施音频混合器或控制器的电子设备,图1中示出了用于这种设备的示例性组件。本音频混合器可以在此处示出作为具有触敏界面或显示器125的移动设备的电子设备100上实现。可以提供其它感应元素(例如传感器120)以用于定义例如,如下文所解释的回放拍速的输入。移动设备100还包括处理器110,用于执行计算机程序的指令以执行本文所述的方法。移动设备100还可以包括接收器/发送器单元130,用于通过网络无线或非无线地交换数据。所交换的数据可以是实现本音频混合方案所需的音频数据或其它类型的数据。处理器10还控制选择单元140,用于基于通过触敏显示器125或传感器130接收的回放拍速从多个音频数据组中选择音频数据组。可以提供时间拉伸单元140,以在需要时将所选择的音频数据组的时间拉伸实现为与其本地回放拍速不同的接收的回放拍速。混合单元也可以混合被分配给相应的音频分量的不同音频数据组,以便能够使用呈现单元170将音乐轨呈现在本地的输出设备(如扬声器或通过插孔——图1中未示出)处或在远距离音频输出设备(例如图2的扬声器230)处。音频分量可以被存储在处理器110可以与之交互的设备的存储器(memory)上。可选地,通过在网络上流式传输至电子设备100并且通过接收器/发射器单元130接收,音频数据组可以被远程地存储并且可用。

本音频混合器可以完全地在电子设备100上实现,或者通过如图2所示的客户端/服务器关系启用。实际上,图2示出了本方案的另一实例。包括用户界面210的音频混合器200布置为接收音乐轨的回放拍速。可以通过用户界面210或者可选地通过感应单元(例如陀螺仪、加速度计或GPS芯片)来接收回放拍速以测量位置……,从而可以计算位移的节律。这可能是当用户携带移动设备上启用的音频混合器或控制器200的同时进行慢跑的情况。他跑步的步速将决定节律以通过所连接的耳机同步和控制他正在收听的音乐。

在该布置中,当音乐是从远程服务器220流式传输时,音频混合器200仅捕获回放拍速输入。更确切地,音频分量管理以及相关回放拍速范围和相应的音频数据组的选择可以在远程服务器220处执行,该远程服务器220还管理对存储了音频数据组的数据库(图2中未示出)的访问。音频输出设备被示出为扬声器230,当不使用移动设备的插孔输出时,服务器或音频混合器200可以与该扬声器230交互。

现在将结合图5说明本音频混合方法,图5示出了执行该方法的不同操作或步骤的流程图。

图5.1是根据第一布置的本方法的说明性流程图。该方法可以由图1的电子设备100的处理器执行,或者替代性地由远程电子设备(如服务器410)的处理器执行。在启动步骤500中,一旦选择了音乐轨,就从用户设备100的存储器120加载用于音乐轨的不同音频数据组。可选地,音频数据组可以以任何可用的标准音频格式通过空中流式传输或从远程存储器下载。

如上所讨论,每个音频数据组对应于一音频分量。每个分量对应于音乐轨的一部分,例如乐器、节拍或者一个或多个语音。可以将每个分量分配给单个音频通道,或者如果分量由多个音频数据组所组成,则分配给多个通道。每个音频数据组与回放拍速范围相关联。在为给定的分量加载多于一个音频数据组的情况下,每个音频数据组覆盖不同的拍速范围。音频数据组可以进一步与本地回放拍速相关联,该本地回放拍速对应于其旨在被呈现于的初始拍速(例如,其被记录于的拍速)。

与回放拍速范围相关联的音频数据组在下文中也称为“音干”。音干在图3中对应于图形条形元素的任何子部分。当启动当前音频混合器时,用户可以选择启用或禁用用于音干的时间拉伸。当时间拉伸被禁用时,在回放拍速范围上选择的所选择的回放拍速将不会影响音频数据组的呈现。时间拉伸是改变音频信号的速度或持续时间而不过度地影响其音调的过程,以便除了回放拍速改变之外还保持歌曲“熟悉”。

以一首歌曲为例,该歌曲最初以原始79BPM记录和混合,其被由不同的DJ以65BPM的较低回放拍速混合,且还以其79BPM的原始拍速和95BPM的较快拍速进行再混合。三个不同音乐轨的生成可以是通过在所提出的回放拍速下记录原始编排,或者使用不同的时间拉伸技术或其它技术来混合以改变歌曲可以被呈现于的回放拍速。如果该歌曲具有可用的另外十二个音频分量,则用户将能够针对每个音频分量以及三个布置中的每一个布置,生成12*3=36个文件,这些文件具有围绕3个相应的本地拍速65、79和95BPM变化幅度的回放拍速范围。可以通过图3的GUI看到这样的音频分量生成。

音频分量现在与多个音频数据组及多个音频数据组的相应的回放拍速范围,以及其最初旨在被呈现于的本地回放拍速相关联。

在图5.1的示例中,未执行时间拉伸。这可以通过例如之前提到的时间拉伸选项的停用来实现。替代性地,用户可以简单地选择丢弃与回放拍速的改变有关的任何副作用。

在进一步的步骤510中,处理器110将接收用于例如以上文在跑步的背景中论述的方式之一来呈现音乐轨的回放拍速。每次用户输入回放拍速时,本方案使得能够选择具有包括针对每个音频分量的输入回放拍速的回放拍速范围的音频数据组。现在针对第一音频分量来大体地描述步骤520至550。

在步骤520中,处理器110确定对于具有包括所接收的回放拍速的回放拍速范围的音频分量是否存在音频数据组。如果是,则将在进一步的步骤530中选择与包括所接收的回放拍速的回放拍速范围相关联的音频数据组。在随后的步骤540中,处理器将所选择的音频数据组分配至第一音频分量,用于在稍后的步骤560中在用户设备100的音频输出160处呈现音乐轨。

由于音乐轨包括一个或多个附加音频分量,该一个或多个附加音频分量与第一音频分量一起形成多个音频分量,因此音乐轨的呈现包括在步骤550中该多个音频分量的混合。与第一音频分量一样,每个分量与至少一个音频数据组相关联,并且每个音频数据组与回放拍速范围相关联。与第一分量一样,对于其它分量重复用于第一分量的步骤520至550,如图5.1中所示有用于第二音频分量的步骤522至552。换句话说,对于每个附加的或当前的音频分量,以下步骤是重复的:

从与给定音频分量相关联的多个音频数据组中识别和选择与包括所接收的回放拍速的回放拍速范围相关联的音频数据组;以及

将所选择的音频数据组分配至给定的音频分量,用于在用户设备的音频输出160处呈现音乐轨;

用户可以在轨中的任何点处改变回放拍速。如果在步骤570中接收到新的回放拍速(对步骤570回答“是”),则过程将返回至步骤510以更新用于每个音频分量的回放拍速范围并因此根据需要改变音频数据组。在本方案中,给定音频分量可以包括两个连贯的回放拍速范围,其可以是毗连的并且共享共同的回放拍速边界。当由于输入回放拍速的增大而越过该共同的回放速度边界时,所选择的音频数据组将改变。在这种情况下,回放拍速的更新将引起处理器110“关闭”当前选择的音频数据组并“打开”与更新的回放拍速所属于的回放拍速范围相关联的音频数据组。

在图3的示例中,如果回放拍速从120bpm改变为100bpm,则停止“钢琴高”音频分量中范围为从104-171bpm的部分。开始“合成器&竖琴”音频分量中范围为从60-115bpm的部分。

如果新的回放拍速落在音频分量的两个音频数据组之间的共享边界上,如图3的示例中的“钢琴低”音频通道的情况,则处理器将使用渐变(fade)参数以在两个相邻部分之间实现交界渐变(cross-fade)的效果。渐变参数包括表明在回放拍速越过阈值bpm值之后是否应该立即开始渐变,或者是否应该将该开始延迟直到下一个条形的第一个节拍。渐变参数还包括指定该渐变应该发生得多快或多慢的参数。

当在步骤570中没有接收到更新的回放拍速时(对步骤570回答“否”),该过程将继续呈现具有在步骤560中混合的当前音频数据组的音乐轨。

如果输入回放速度与音频数据组的本地拍速不完全匹配,但是落在该组音频数据的速度范围内,则用户可以选择在启动当前音频混合时启用对于音频数据组的时间拉伸。时间拉伸是改变音频信号的速度或持续时间而不影响其音调的过程,以便除了回放拍速改变之外还保持歌曲“熟悉”。当时间拉伸被禁用时,如图5.1的示例中,在回放拍速范围上选择的输入回放拍速将不会影响音频数据组的呈现。

图5.2示出了当前音频混合方案的示例,其中用户启用了时间拉伸。除了分别用步骤541和543替换图5.1的步骤540和542的分配之外,该附加布置中的步骤类似于图5.1中所示的布置的步骤。

步骤541和543分别描述在输入回放拍速不同于该音频数据组的本地回放拍速的情况下对给定的音频数据组执行的时间拉伸过程。更确切地说,对于当前选择的音频数据组,用户设备100的处理器110将执行所选择的音频数据组的时间拉伸过程,时间拉伸流程包括转换所选择的音频数据组以产生修改的音频数据组,该修改的音频数据组旨在以受控制的音调在输入回放拍速下被呈现。然后使用该修改的音频数据组代替(或作为)用于分配给音频分量的所选择的音频数据组。

在图3的示例中,在95bpm的回放拍速下,音频混合器将仅选择“钢琴低”通道、第一个“弦乐器”通道、“竖琴:合成器”通道以及“合成器&竖琴”通道。这些分量中的音频数据组分别具有70bpm、70bpm、120bpm和70bpm的本地回放拍速。因此,音频数据组从70被拉伸至95bpm,除了“竖琴:合成器”音频数据组从120降至95bpm地被拉伸。

在步骤541和543中,本领域技术人员可以使用不同的技术以从它的本地回放拍速来时间拉伸该音频数据组,以生成旨在以接收的回放拍速呈现的修改的音频数据组。类似地,许多技术可用于图5.2的混合步骤551,以使得音乐轨的布置更加悦耳。这些方案超出了本说明书的范围。然而,在本方案中,通过限制可能对于足够的时间拉伸来说太大的回放拍速范围的影响,向用户提出了改进的回放拍速控制器。

涉及所选择的音频数据组的混合的图5.1的混合步骤550,在图5.2的这个附加布置中被用混合步骤551替换,其中混合了修改的音频数据组。一旦被混合,修改的音频数据组在步骤551中被混合成旨在以接收的回放拍速呈现的音乐轨,本方法在步骤560中继续,例如在用户设备100的音频输出160处呈现音乐轨。与图5.1的布置一样,处理器将在步骤570中继续监视是否接收到新的回放拍速值。

当没有接收到新的回放拍速时(对步骤570回答“否”),本方法将继续混合不同的音频分量以在步骤560中在音频输出160处呈现音乐。

如果接收到更新的回放拍速(对步骤570回答“是”),则处理器110会将该更新的回放拍速视为新的当前回放拍速。它将继续重复已经描述过的图5.2的步骤510至560。在这种情况下,可能会出现两种情境。

在第一种情境下,更新的回放拍速包括在与先前回放拍速相同的回放拍速范围内,这样不需要改变所选择的音频数据组。更新的回放拍速将替代地影响时间拉伸,并且修改的音频数据组需要更新。实际上,使用与先前回放拍速相同的所选择的音频数据组,通过对先前修改的音频数据组进行时间拉伸来产生旨在以更新的回放速度呈现的更新的修改的音频数据组,并利用更新的修改的音频数据组来替换被分配至音频分量的先前修改的音频数据组。

在第二种情境下,更新的回放拍速包括在不同的回放拍速范围中,这样需要改变所选择的音频数据组。这在当更新回放速度越过回放速度边界(例如两个毗连的回放拍速范围之间)时发生。然后,处理器110将关闭修改的音频数据组,并且如果存在具有与新的回放拍速相对应的回放拍速范围的音频数据组,则开启与该新的回放拍速范围相关联的音频数据组。这是在执行可能需要考虑新选择的音频数据组的更新的回放节奏和本地回放节奏的任何差异的时间拉伸之前完成的。

当用于音频分量的音频数据组变化时,音乐轨的渲染可能会由于例如音频数据组的突然变化或错过的节拍而被影响。为了解决这种情况,在下文中提出了不同的方案。当涉及到时间拉伸时,将关联图5.2的音频混合方案的布置来说明它们,但是它们也可以在当不使用或禁用时间拉伸时被使用。

让我们假设在第一时刻(time instant)(例如2分钟)接收到更新的回放拍速至音乐轨的呈现。然后,使用用于音频分量的更新的修改的音频数据组的音乐轨的呈现将考虑第一时刻,从而使得音轨的呈现无间隙或连续而不论音频数据组的改变。

第一时刻用于确定当越过回放拍速阈值时,关闭看到越过的阈值的音频分量(例如,在图3的示例中的间隔311和312之间的回放拍速为100bpm的低钢琴通道)的先前音频数据组,并开启更新的修改的音频数据组以代替地使用的时间。

在本方法的附加布置中,用户可以定义先前修改的音频数据组与更新的修改的音频数据组之间的交叉淡化,该交叉淡化在第一时刻之后开始。因此,可以在预设的持续时间内执行先前修改的音频数据组的关闭,从而缓和该过渡。

此外,由于所接收的更新的回放拍速引起拍速范围的改变,因此可以在第一时刻之后使用延迟来呈现使用更新的修改的音频数据组的音乐轨。该延迟可以依据完成节拍的数量来定义。定义音乐轨被呈现的速度的回放拍速可以被视为音乐轨的节拍之间的时间间隔。延迟可能根据使用先前回放拍速或更新的拍速测量的预定数量的完成节拍而变化。

从一个音频数据组到其它音频数据组的过渡还可以控制与每个音频数据组相关联的音量。返回参考图3,代表音频数据组的每个部分与在水平方向上延伸的音量曲线相关联。当着眼于部分301或311时,这些部分的左手侧将定义用于该音频数据组的音量的最小值例如0,而右手侧边缘将定义音频数据的最大值例如1。如从部分301和311可以看出的,可以为回放拍速范围的每个回放拍速定义例如包括于间隔[0-1]或任何其它值范围中的音量值。音量值定义拍速范围内的音量曲线,其可用作对音频数据组的附加控制。通过减小接近第一回放拍速范围的上限的音量,并且在移动到远离第二回放拍速范围的下限的更高的回放拍速值时增大音量,该音量曲线可以有利地用于在回放拍速阈值处的音频数据组之间的过渡的背景下。

音量曲线还可以用于减小第一音频数据组的回放拍速范围的末端上的第一音频数据组的音量,特别是如果没有其它音频数据组可连续地用于第一音频数据组时。

本音频控制器能够用于自适应音乐的创建,并且允许用户/收听者在音轨中的任何点实时改变音乐轨的回放拍速,而不受拍速范围上的限制并且在某些拍速下没有差的性能。使用本音频混合方案,收听者能够在任何拍速下使自适应音轨更好听,而无需专家或混音专业人员。

尽管这种类型的自适应音乐本身很有趣,但它特别适合于特定的活动。例如,移动跑步应用程序可以自动调整自适应轨的拍速以匹配收听者的跑步速度,或者通过在她的锻炼中的正确点处改变自适应轨的拍速来来引导她通过间歇的训练会话。滑雪应用程序可能会使轨的速度取决于滑雪者的速度:在山顶缓慢且磨蹭;但她滑下山时速度越快则会更快且更急速泵发(pumping)。在你的舞蹈派对上,轮流控制音乐的拍速,而每个人都在按照你的拍子跳舞。在舞蹈课上,教练以慢拍速解释编舞,并且她随着舞者熟悉该舞步而加速音乐。等等。

如在本公开中所解释的,为了使音乐轨自适应,该轨由音干的集以及这些音干的布置应如何随着回放拍速而改变的描述组成。在任何给定的回放拍速下,艺术家能够控制哪些音干应该播放而哪些不应该播放,音干在开始或结束其回放时如何过渡,以及每个音干的相对音量。使用图3的示例性GUI可以容易地实现该控制,并且通过改变例如音干的回放拍速范围、它的本地回放拍速、它的音量、时间拉伸是否被启用,来进一步控制每个子部分/音干的特性。

音频控制器将仅仅从本地存储(local storage)导入音干或以任何可用的标准音频格式来空中流式传输它们。

如图3中所示,每个着色的框或子部分代表轨中的单个音干,并且框被垂直地分组于与音频分量相关联的条形元素中。图3的图示由3个钢琴通道和5个音干、3个弦乐器通道和3个音干、4个竖琴/弦乐器通道和5个音干组成。每个音干都以三个独立的本地拍速之一记录:70bpm、120bpm和172bpm。

每个音干的拍速阈值告诉音频控制器音干应该播放于的回放拍速范围。现在,对于特定的回放速度,当前的音频控制器为每个音频分量挑选适当的音干组来播放,将每个音频分量从它们的本地速度时间拉伸至回放拍速,并将该结果混合在一起以用于回放给收听者。例如,在回放速度112bpm(如图4.2中所示),音频混音器将挑选所有的中等拍速音干并将它们从它们本地的120bpm拉伸至112bpm的回放拍速,然后混合并回放该结果。

回到图3,在回放速度85bpm处,音频混合器将仅挑选低钢琴通道、第一弦乐器以及第一竖琴/合成器和第二竖琴/合成器。这些音干从70bpm被拉伸至95bpm,除了第一个竖琴/合成器将音频数据组从120bpm降至95bpm地拉伸。

收听者可以在轨中的任何点处改变回放速度。当越过其中一个音干的拍速阈值时,音频控制器将视情况停止或开始回放该音干。如前所述,可以使用例如音干的交叉淡化来指定过渡应如何发生。

本音频控制器提供自适应的聆听体验,当在不同拍速范围的氛围/流派/感觉/声音/等尽可能不同时,效果最佳。这个想法类似于以与原始的不同的拍速再混合音乐轨。通常来说,收听者不希望再混合听起来仅仅像以不同拍速的原始演奏,而是挑选适合于新拍速的再混合的新流派/声音。使用本声音混合方案,用户可以为给定的音频分量添加额外的或选择变化的音干,以使得回放拍速的改变将平滑且逐渐地引导音乐轨也完全地改变特性。

由于本方案,像来自阿黛尔(Adele)的“Hello”的歌曲能够在慢拍速中听起来就像首梦幻般的民谣(ballad),在中音范围内是首欢快(upbeat)的嘻哈(hip-hop)轨,然后以更高的拍速切换到EDM风格。

申请人已经发现,使用本回放拍速控制方案的音乐轨将在非常宽的拍速范围内听起来良好:例如从60bpm至240bpm及以上。这允许从以低BPM行走过渡到以约每分钟140步的跑步,过渡到长距离跑步者通常以持续的每分钟180步的跑步,并且以每分钟200步以上发生的冲刺。对于收听者的许多其它活动则将需要在不那么极端的拍速需求下调整音乐。

虽然以上描述讨论了音频数据所被播放于的系统,但将理解,这些原理适用于利用音频的任何应用或媒体。例如,视频包括作为该整个视频的组成部分的视频帧和音频数据。该应用可以应用于该视频的音频部分。结果,与跑步、滑雪或其它的运动相关的许多有益应用可以提供于健身设施内,其中用户能够收听音频并且还能够观看相关的视觉效果。响应于用户输入改变而改变音频元素的拍速的概念也可以应用于视频帧。

本文档中自始至终提供的音频应用的示例涉及音乐。然而,应当理解,所讨论的应用可以应用于其它类型的音频。例如,这些原理可以应用于包括对跑步者具有节律(例如“左、右、左、右”)的可听指令的音轨。然后,这些指令可以根据与拍速相关的特征而变化。

还提供了一种用于控制在电子设备的显示设备上渲染的用户界面(UserInterface,UI)的方法,该UI包括:多个媒体组件,每个媒体组件在彼此平行的第一方向上延伸并且包括一个或多个媒体元素,每个媒体组件布置为被组合以当在回放操作模式中时提供输出;多个媒体组件中的第一媒体组件的多个第一媒体元素,每个第一媒体元素在第一方向上由代表将播放该多个第一媒体元素于的下限拍速和上限拍速的第一末端和第二末端来界定;以及响应于用户输入的在第一方向上可移动的图形元素,该图形元素代表当在回放操作模式中时将播放多个媒体组件的拍速,电子设备的处理器配置为,响应于在第一方向上移动图形的用户输入,确定图形元素的当前位置,并针对第一媒体组件确定多个第一媒体元素中的图形元素在第一方向上的第一末端和第二末端之间的第一媒体元素,其中当在操作的回放模式中时,从而选择第一媒体元素以形成用于输出的媒体组件的组合的一部分。

可以突出显示所选择的媒体元素。也可以突出显示其图形元素在对应于其它媒体组件的第一方向上的第一末端和第二末端之间的其它媒体元素。图形元素可以具有在与多个通道中的每个通道交叉的第二方向上延伸的至少一部分。图形元素和媒体元素之间的交叉可以是选择该媒体元素以形成用于输出的媒体组件的组合的一部分的事实的代表。第二方向可以垂直于第一方向。

应当理解,控制UI的方法可以与本文中描述的和权利要求中限定的本公开的各种其它方面组合。

可以提供电子设备,其被布置为提供上述设备功能。

可以提供包括计算机可读指令的计算机可读介质,所述计算机可读指令配置为在使用中使处理器能够执行用于控制上述UI的方法。

图6示出了计算设备600的一个实现的框图,在该计算设备600内可以执行用于引起计算设备执行本文所讨论的方法中的任何一个或多个方法的指令组。在替代性的实现中,计算设备可以连接(例如,联网)至局域网(Local Area Network,LAN)、内联网、外联网或因特网中的其它机器。计算设备可以在客户端-服务器网络环境中以服务器或客户端机器的能力来操作,或者作为对等(Peer-to-Peer)(或分布式)网络环境中的对等机器(PeerMachine)来操作。计算设备可以是个人计算机(Personal Computer,PC)、平板计算机、机顶盒(Set-Top Box,STB)、个人数字助理(Personal Digital Assistant,PDA)、蜂窝电话、网络设备(Web Appliance)、服务器、网络路由器、交换机或网桥、或者任何能够执行指定该机器要采取的行动的指令组(顺序或其它)的机器。此外,虽然仅示出了单个计算设备,但是术语“计算设备”还应被视为包括单独地或联合地执行一组(或多组)指令以执行任何一个或多个本文所讨论的方法的机器(例如,计算机)的任何集合。

示例的计算设备600包括处理设备602、主存储器604(例如,只读存储器(Read-Only Memory,ROM)、闪存、动态随机存取存储器(Dynamic Random Access Memory,DRAM))(例如同步动态随机存取存储器(Synchronous DRAM,SDRAM)或Rambus动态随机存取存储器(Rambus DRAM,RDRAM)等)、静态存储器606(例如,闪存、静态随机存取存储器(StaticRandom Access Memory,SRAM)等)和辅助存储器(例如,数据存储设备618),它们经由总线630彼此通信。

处理设备602代表一个或多个通用处理器(General-Purpose Processor),例如微处理器(Microprocessor)或中央处理单元(Central Processing Unit)等。更具体地,处理设备602可以是复杂指令集计算(Complex Instruction Set Computing,CISC)微处理器、精简指令集计算(Reduced Instruction Set Computing,RISC)微处理器、超长指令字(Very Long Instruction Word,VLIW)微处理器、实施其它指令集的处理器,或实施指令集的组合的处理器。处理设备602还可以是一个或多个专用处理设备(Special-PurposeProcessing Device),例如专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)或网络处理器等。处理设备602配置为执行用于执行本文所讨论的操作和步骤的处理逻辑(指令622)。

计算设备600还可以包括网络接口设备(Network Interface Device)608。计算设备600还可以包括视频显示单元610(例如,液晶显示器(Liquid Crystal Display,LCD)或阴极射线管(Cathode Ray Tube,CRT))、字母数字输入设备612(例如,键盘或触摸屏)、光标控制设备614(例如,鼠标或触摸屏)和音频设备616(例如,扬声器)。

数据存储设备618可以包括一个或多个机器可读存储介质(或者更具体地,一个或多个非暂时性计算机可读存储介质)628,其上存储有一组或多组指令622,该一组或多组指令622包含本文所述的任何一个或多个方法或功能。指令622还可以在由计算机系统600的执行期间全部地或至少部分地驻留在主存储器604内和/或处理设备602内,主存储器604和处理设备602也构成计算机可读存储介质。

上述各种方法可以由计算机程序实现。该计算机程序可以包括计算机代码,该计算机代码被布置成指示计算机执行上述各种方法中的一个或多个的功能。可以将用于执行这些方法的计算机程序和/或代码提供至装置(例如计算机),或提供到一个或多个计算机可读介质(或者更一般地,计算机程序产品)上。计算机可读介质可以是暂时性的(Transitory)或非暂时性的(Non-Transitory)。一个或多个计算机可读介质可以是例如电子、磁、光、电磁、红外或半导体系统,或者用于数据传输(例如用于通过因特网下载代码)的传播介质。替代性地,一个或多个计算机可读介质可以采用一个或多个物理计算机可读介质的形式,例如半导体或固态存储器、磁带、可移动计算机磁盘、随机存取存储器(RandomAccess Memory,RAM)、只读存储器(Read-Only Memory,ROM)、刚性磁盘和光盘(例如CD-ROM、CD-R/W或DVD)。

在一种实现中,本文所描述的模块、组件和其它特征可以实施为分立组件或者集成在硬件部件(例如ASICS、FPGA、DSP或类似设备)的功能中。

“硬件部件”是能够执行某些操作的有形(例如,非暂时性的)物理部件(例如,一个或多个处理器的组),并且可以以某种物理方式配置或布置。硬件部件可以包括永久地配置为执行某些操作的专用电路(Dedicated Circuitry)或逻辑。硬件组件可以是或包括专用处理器,例如现场可编程门阵列(FPGA)或ASIC。硬件组件还可以包括由软件临时配置以执行某些操作的可编程逻辑或电路。

相应地,短语“硬件部件”应该被理解为包含可以被物理构造、永久配置(例如,硬连线的(hardwired))或临时配置(例如,编程的)以便以某种方式运行或者执行本文所描述的某些操作的有形实体。

此外,模块和组件可以实现为硬件设备内的固件或功能电路。此外,模块和组件可以以硬件设备和软件组件的任何组合来实现,或者仅以软件(例如,存储或以其它方式体现于机器可读介质或传输介质中的代码)来实现。

除非另外特别声明,否则从以下讨论中可明显得出,应理解,在整个说明书中,利用例如“接收”、“确定”、“比较”、“启用”、“维持”、“识别”、“选择”、“分配”等术语的讨论,指的是计算机系统或类似的电子计算设备的动作和处理,其将计算机系统的寄存器和存储器内表示为物理(电子)量的数据操纵和转换成类似地表示为计算机系统存储器或寄存器或者其它此类信息存储、传输或显示设备内的物理量的其它数据。

应理解,以上说明书旨在是说明性的而非限制性的。在阅读和理解以上说明书后,许多其它实施方式对于本领域技术人员而言将是显而易见的。尽管已经参考特定示例的实施方式描述了本公开,但是将认识到,本公开不限于所描述的实施方式,而是能够在所附权利要求的精神和范围内通过修改和变更来实行。相应地,说明书和附图应被视为说明性意义而非限制性意义。因此,本公开的范围应该参考所附权利要求以及这些权利要求所享有的等同物的全部范围来确定。

Claims (26)

1.用于构造自适应媒体文件的方法,该自适应媒体文件包括配置为用于形成被布置为具有可控拍速的音频输出的多个音频分量,所述方法包括:
提供与所述多个音频分量中的第一音频分量相关联的第一音频数据;
设定所述第一音频数据的回放拍速范围;
提供与所述第一音频分量相关联的第二音频数据;
设定所述第二音频数据的回放拍速范围,其中所述第二音频数据的拍速范围与所述第一音频数据的拍速范围不同;以及
将所述第一音频数据、所述第二音频数据和相应的回放拍速范围相关联。
2.根据权利要求1所述的方法,其特征在于,所述第一音频数据、所述第二音频数据和相应的回放拍速范围通过放置在文件结构内而相关联。
3.根据权利要求1所述的方法,其特征在于,通过与所述第一音频数据和所述第二音频数据相关联的元数据中引用而将所述第一音频数据、所述第二音频数据和相应的回放拍速范围相关联。
4.根据前述权利要求中任意一项所述的方法,其特征在于,所述第一音频数据的回放拍速范围被并入所述第一音频数据的元数据中。
5.根据前述权利要求中任意一项所述的方法,其特征在于,所述第一音频数据的回放拍速范围提供代表下限拍速和上限拍速的数据。
6.根据权利要求5所述的方法,其特征在于,在回放期间,所述第一音频数据布置为:当回放拍速高于所述下限拍速并且低于所述上限拍速,或者高于或等于所述下限拍速并且低于或等于所述上限拍速时,呈现为所述音频输出的一部分。
7.根据权利要求5所述的方法,其特征在于,所述第一音频数据具有拍速,并且代表所述下限拍速和所述上限拍速的数据是以下中的一者:实际上限拍速和实际下限拍速;高于所述第一音频数据的拍速的每分钟的节拍数和低于所述第一音频数据的拍速的每分钟的节拍数。
8.根据前述权利要求中任意一项所述的方法,其特征在于,所述第一音频数据的拍速范围定义所述第一音频数据将被时间拉伸至的最大拍速和最小拍速。
9.根据前述权利要求中任意一项所述的方法,其特征在于,所述提供通过以下中的一个或多个来实现:记录声音以形成所述音频数据;使用音频生产工具创建所述音频数据;或导入所述音频数据。
10.根据前述权利要求中任意一项所述的方法,其特征在于,所述第一音频数据和所述第二音频数据是第一音频文件和第二音频文件,或者是从第一音频文件和第二音频文件导出的。
11.根据权利要求10所述的方法,其特征在于,将所述第一音频数据、所述第二音频数据和相应的回放拍速范围相关联是基于包括在所述自适应媒体文件中的一个或多个配置文件的。
12.根据前述权利要求中任意一项所述的方法,其特征在于,在所述自适应媒体文件内识别与所述多个音频分量中的所述第一音频分量相关联的所述第一音频数据。
13.根据前述权利要求中任意一项所述的方法,其特征在于,所述自适应媒体文件是音频文件或者包括视频帧数据和相关联的音频数据的视频文件中的一者。
14.计算机可读介质,其包括计算机可读指令,所述计算机可读指令配置为在使用中使得处理器能够执行如权利要求1至13中任意一项所述的方法。
15.自适应媒体文件,其用于提供包括用于形成被布置为具有可控拍速的音频输出的多个音频分量的数据,所述自适应媒体文件包括:
与所述多个音频分量中的第一音频分量相关联的第一音频数据;
所述第一音频数据的回放拍速范围;
与所述多个音频分量中的所述第一音频分量相关联的第二音频数据;以及
所述第二音频数据的回放拍速范围,其中:
所述第二音频数据的拍速范围与所述第一音频数据的拍速范围不同;且
所述第一音频数据、所述第二音频数据和相应的回放拍速范围是相互关联的。
16.根据权利要求15所述的自适应媒体文件,其特征在于,所述第一音频数据、所述第二音频数据和相应的回放拍速范围通过处于文件结构内而相关联。
17.根据权利要求15所述的自适应媒体文件,其特征在于,通过与所述第一音频数据和所述第二音频数据相关联的元数据中引用而将所述第一音频数据、所述第二音频数据和相应的回放拍速范围相关联。
18.根据权利要求15至17中任意一项所述的自适应媒体文件,其特征在于,所述第一音频数据的回放拍速范围被并入所述第一音频数据的元数据中。
19.根据权利要求15至18中任意一项所述的自适应媒体文件,其特征在于,所述第一音频数据的回放拍速范围提供代表下限拍速和上限拍速的数据。
20.根据权利要求19所述的自适应媒体文件,其特征在于,在回放期间,所述第一音频数据布置为:当回放拍速高于所述下限拍速并且低于所述上限拍速,或者高于或等于所述下限拍速并且低于或等于所述上限拍速时,呈现为所述音频输出的一部分。
21.根据权利要求19所述的自适应媒体文件,其特征在于,所述第一音频数据具有拍速,并且代表所述下限拍速和所述上限拍速的数据是以下中的一者:实际上限拍速和实际下限拍速;高于所述第一音频数据的拍速的每分钟的节拍数和低于所述第一音频数据的拍速的每分钟的节拍数;或所述拍速能够被移位为低于或高于所述拍速的量。
22.根据权利要求15至21中任意一项所述的自适应媒体文件,其特征在于,所述第一音频数据的拍速范围定义所述第一音频数据将被时间拉伸至的最大拍速和最小拍速。
23.根据权利要求15至22中任意一项所述的自适应媒体文件,其特征在于,所述第一音频数据和所述第二音频数据是第一音频文件和第二音频文件,或者是从第一音频文件和第二音频文件导出的。
24.根据权利要求23所述的自适应媒体文件,其特征在于,在包括在所述自适应媒体文件中的一个或多个配置文件中识别相互关联的所述第一音频数据、所述第二音频数据和相应的回放拍速范围。
25.根据权利要求15至24中任意一项所述的自适应媒体文件,其特征在于,在所述自适应媒体文件内识别与所述多个音频分量中的所述第一音频分量相关联的所述第一音频数据。
26.根据权利要求15至25中任意一项所述的自适应媒体文件,其特征在于,所述自适应媒体文件是音频文件或者包括视频帧数据和相关联的音频数据的视频文件中的一者。
CN201780085855.0A 2016-12-07 2017-12-07 数据格式 CN110574107A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
GB1620839.9 2016-12-07
GBGB1620839.9A GB201620839D0 (en) 2016-12-07 2016-12-07 Data format
PCT/GB2017/053690 WO2018104744A1 (en) 2016-12-07 2017-12-07 Data format

Publications (1)

Publication Number Publication Date
CN110574107A true CN110574107A (zh) 2019-12-13

Family

ID=58159895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780085855.0A CN110574107A (zh) 2016-12-07 2017-12-07 数据格式

Country Status (6)

Country Link
US (1) US20200074965A1 (zh)
EP (1) EP3552202A1 (zh)
JP (1) JP2020501201A (zh)
CN (1) CN110574107A (zh)
GB (1) GB201620839D0 (zh)
WO (1) WO2018104744A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050132293A1 (en) * 2003-12-10 2005-06-16 Magix Ag System and method of multimedia content editing
US7521623B2 (en) * 2004-11-24 2009-04-21 Apple Inc. Music synchronization arrangement
JP2007188598A (ja) * 2006-01-13 2007-07-26 Sony Corp コンテンツ再生装置およびコンテンツ再生方法並びにプログラム
JP5500058B2 (ja) * 2010-12-07 2014-05-21 株式会社Jvcケンウッド 曲順決定装置、曲順決定方法、および曲順決定プログラム

Also Published As

Publication number Publication date
GB201620839D0 (en) 2017-01-18
JP2020501201A (ja) 2020-01-16
WO2018104744A1 (en) 2018-06-14
US20200074965A1 (en) 2020-03-05
EP3552202A1 (en) 2019-10-16

Similar Documents

Publication Publication Date Title
US9471271B2 (en) Systems and methods for portable audio synthesis
US9208762B1 (en) Musical systems and methods
US20160358593A1 (en) Association of virtual controls with physical controls
GB2550090B (en) Method of splicing together two audio sections and computer program product therefor
US9530396B2 (en) Visually-assisted mixing of audio using a spectral analyzer
US8816180B2 (en) Systems and methods for portable audio synthesis
US9177540B2 (en) System and method for conforming an audio input to a musical key
US8674206B2 (en) Systems and methods for creating, modifying, interacting with and playing musical compositions
US8026436B2 (en) Method and apparatus for producing audio tracks
ES2561534T3 (es) Mezclador de pistas de audio semántico
CN1941071B (zh) 拍子提取及检测设备和方法、音乐同步显示设备和方法
CN101322179B (zh) 音乐编辑设备、创建音乐编辑信息的方法及其记录介质
CN102640211B (zh) 根据与节奏模式的相似度搜索乐音数据组
US7888582B2 (en) Sound sequences with transitions and playlists
US6815600B2 (en) Systems and methods for creating, modifying, interacting with and playing musical compositions
US9190110B2 (en) System and method for assembling a recorded composition
US7076035B2 (en) Methods for providing on-hold music using auto-composition
US7716572B2 (en) Creating a new music video by intercutting user-supplied visual data with a pre-existing music video
US20150161973A1 (en) Synthesized Percussion Pedal and Docking Station
JP5007563B2 (ja) 音楽編集装置および方法、並びに、プログラム
EP2830041A2 (en) Interactive audio content generation, delivery, playback and sharing
US20140140536A1 (en) System and method for enhancing audio
US6756533B2 (en) Automatic music composing apparatus and automatic music composing program
KR100913978B1 (ko) 미디어 데이터 포맷을 위한 메타데이터 유형
US8492637B2 (en) Information processing apparatus, musical composition section extracting method, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination