CN105766001A - 用于使用任意触发的音频处理的系统和方法 - Google Patents

用于使用任意触发的音频处理的系统和方法 Download PDF

Info

Publication number
CN105766001A
CN105766001A CN201480049975.1A CN201480049975A CN105766001A CN 105766001 A CN105766001 A CN 105766001A CN 201480049975 A CN201480049975 A CN 201480049975A CN 105766001 A CN105766001 A CN 105766001A
Authority
CN
China
Prior art keywords
track
acoustic characteristic
data
transition
implemented method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480049975.1A
Other languages
English (en)
Inventor
梅于尔·A·特里维迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AliphCom LLC
Original Assignee
AliphCom LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AliphCom LLC filed Critical AliphCom LLC
Publication of CN105766001A publication Critical patent/CN105766001A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/02Arrangements for generating broadcast information; Arrangements for generating broadcast-related information with a direct linking to broadcast information or to broadcast space-time; Arrangements for simultaneous generation of broadcast information and broadcast-related information
    • H04H60/04Studio equipment; Interconnection of studios

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)

Abstract

本发明涉及用于回放的音频处理,更具体地涉及处理音频文件以在回放时在连续的音轨间提供平滑过渡。根据一些实例,流程包括,利用计算设备确定第一音轨的第一音频特性,和利用计算设备确定第二音轨的第二音频特性。该流程还进一步包括在所述计算设备接收代表用户产生的触发的数据。该流程进一步可以响应于用户产生的触发,基于第一音频特性和第二音频特性中的一个或多个,确定用于第一音轨和第二音频轨道的过渡参数。此外,该流程还可使得从第一音轨到第二音轨的过渡的呈现。

Description

用于使用任意触发的音频处理的系统和方法
技术领域
本发明涉及用于回放的音频处理,更具体地涉及处理音频文件以便在回放期间提供音轨之间的平滑过渡。
背景技术
作为音频压缩进步的结果,在家和在移动设备上接入宽带互联网的可行性,和基于云的音乐流媒体服务的日益普及,用户可以访问越来越大库的音乐内容。此外,用于播放这些音频内容的计算设备,如智能手机,平板电脑,数字音乐播放器,笔记本电脑,台式机,智能电视,家庭影院系统和其他计算设备,已经变得足够强大来执行复杂的信号处理。
可以期望呈现的是,在回放中音轨之间平滑过渡如无缝流和没有中断。提供歌曲与歌曲之间的平滑过渡的自动混音和播放系统已知的。例如,一个自动音乐节目主持人(“DJ”)可在消费者硬件平台中被实现为软件节点,因为他认识音乐。自动DJ可以从一个给定的数据库选择并混合歌曲。自动DJ不是人类用户用于执行音频混合的工具。而是,自动DJ是人类用户的代替者,并以最少的干预操作。
已知自动混合方法的一个缺点是轨道之间预定混合点的要求。一旦确定,传统的过渡通常在当前曲目到达预定混合后发生。如果一首新的歌曲在到达该点之间就被想要,要听到连续流的可能性就会失去。
发明内容
本公开的一个示范性方面是针对一种计算机实现的方法。例如,流程包括利用计算设备确定第一音轨的第一音频特性,和利用计算设备确定第二音轨的第二音频特性。该流程可以进一步包括,在所述计算设备接收代表用户产生的触发的数据。该流程进一步可以响应于用户产生的触发,基于第一音频特性和第二音频特性中的一个或多个,确定用于第一音轨和第二音轨的过渡参数。此外,该流程可以使得从第一音轨到第二音轨的过渡的呈现。
在特定的实施方式中,第一音频特性和第二音频特性可以是速度,节拍乐句,音调,拍子记号,或任何其他音频特性。在一些实施例中,音频特性可以是描述音乐或歌曲的属性(即,音频特性可以是音乐特性)。过渡参数可以包括混合点,回响参数,淡出时间,淡入时间,回放速度,或者任何其它过渡参数。用户产生的触发可以包括用户与在软件或硬件的用户接口元件的交互,手势检测,或使用传感器来检测环境的变化。
本公开的另一示例性方面涉及一种计算机实现的方法。该方法包括计算音频(例如,音乐)的特性或元素,如当前和即将到来的内容的速度,节拍乐句,节拍和乐句边界。在整体上的音频内容中的一部分内容不可获得的情况下(例如,从远程源接收歌曲时),该方法可以包括监测新的数据的可用性和在必要时进行重新处理。该方法还可以包括将内容与一个或多个远程媒体内容库相匹配,并且使用双方的元数据信息,以确定最合适的中点以及用于任何给定的触发时间的混合参数。该方法可进一步包括监测触发事件,并在计算出的中点处应用指定的混合参数的执行。
然而,本公开内容的另一示例性方面是针对一种计算机实现的方法。该方法包括识别内容并将其与存储在一个或多个远程计算设备中的媒体内容相匹配,以确定用于媒体对象的一个或多个标识符。该标识符可以用于计算最大有效时间和任何两个音频内容片段之间的混合指令。
本公开内容还涉及用于在整个音轨提供平滑的过渡的系统,装置,非临时性计算机可读介质,设备和用户接口。
这些和其它特性被理解参照下面的描述和所附的权利要求书。附图被包含在说明书中并构成本说明书的一部分,与说明书举例说明和描述本发明的各种实施例,并一起用于解释实施例的原理。
因此,希望提供一个系统,允许用户交互以触发从当前歌曲到下一首的过渡,加上对音乐特性的“了解”,以确定定时和混合参数。允许在任意点混合的该系统是很有用的。
附图说明
本发明的完整的和可能的公开,包括其最佳模式,通过参考附图,针对一个本领域的普通技术人员,在本说明书中被阐述,其中:
图1是一个功能块图,根据一些实施例,描绘了配置成自主地过渡音轨的计算设备;
图2描绘了根据一些实施例的两个音频轨道之间进行过渡的流程图的实例;
图3根据一个或多个实施例示出了计算系统的实例;
图4和5根据一些实施例分别描绘了轨道参数分析器和自主混合器以促进过渡音轨;
图6示出根据一些实施例的用于开始音轨过渡的各种基于传感器的触发数据的实现;
图7示出了根据一个或多个实施例的计算系统的另一实例,;和
图8示出根据各种实施例的被配置为提供自主的音频过渡的示例性的计算平台,。
具体实施方式
本发明实施例的参考将详细作出,一个或多个实施例连同附图被描述。通过各种实施例解释的方式提供的实施例,并且不限制在一个或多个实施例的范围。很明显,在本发明中而不脱离本发明的范围或精神的前提下,本领域技术人员可以做出各种修改和变化。例如,举例说明或描述为一个实施例的一部分的特征可与另一实施例一起使用,以产生又一个实施例。因此,目的是,各种实施例涵盖这些修改和变化落入所附权利要求及其等同物的范围之内。
一般地,本公开内容涉及的系统和方法,提供音轨之间的过渡,响应于用户手势,或类似的。更具体地,本公开内容的各方面涉及提供一种系统,自主地无缝(或接近无缝)地从一条内容到下一个过渡音轨,在任意时间点通过用户交互触发。使用一种方法,用于识别在音频轨道中相关的音乐特性或特征(包括但不限于速度(tempo),节拍乐句(beatphrase),音调(key),和拍子记号(timesignature)),任选地与其他轨道的元数据结合(是否包含在文件中,或利用一种方法,识别内容和匹配它到该元数据的库),设备可以促进自主通过计算“混合”歌曲,基于用户交互,最大有效时间和风格/轮廓用于过渡,除了应用对于两个轨道必要的处理。这提供了一个有经验的和专业DJ创作自由自主的用户。
图1是根据一些实施例的功能块图,描绘被配置成自主地过渡音轨的计算设备。图100示出了回放模块140,被配置为将例如歌曲(“1”)160的第一音轨听觉地呈现给用户,以及图100还示出了自主混频器模块150,被配置成自主地过渡呈现音频歌曲160到歌曲(“Y”)172。
如图所示,播放模块140和/或自主混频器模块150可以在计算设备中实现,诸如具有用户界面112的移动计算设备110。作为一个例子,考虑到在播放或播放歌曲160时,用户希望选择另一个音轨或歌曲来播放。用户界面112被示出为播放选择歌曲X,歌曲Y和歌曲Z。进一步,考虑到用户120选择歌曲Y,由此代表该选择的用户界面产生的信号作为数据122发送到自主混频器模块150。数据122可包括表示用于歌曲172的歌曲标识符(“ID”)的数据,以及其他通过自主混频来促进自动过渡的数据。
自主混频器模块150可配置为确定一个或多个过渡参数,用于在过渡窗164期间促进过渡,作为从歌曲160到歌曲172的音频过渡。例如,自主混频器模块150可配置为识别歌曲160音频特性163,并识别歌曲172的音频特性165,由此混合点162可以被确定为一个过渡参数。在一些情况下,自主混频器模块150排列歌曲172的音频特性165到歌曲160音频特性163,以形成混合点162。其它与过渡有关的参数可确定和/或执行,如歌曲160从音量水平V1淡出的速率,或歌曲172淡入到音量水平V2的速率。此外,自主混频器模块150可配置为基于,例如歌曲160和172的速度的测定,确定过渡到歌曲172速率(“R2”)161。
鉴于上述情况,自主混频器模块150(和/或本文描述的其它元件)的结构和/或功能可以促进自主地无缝(或基本上无缝)从一个音轨过渡到另一个音轨。根据各种实施方案中,自主混频器模块150(和/或其他本文描述的组件)可以确定原位过渡参数,以促进歌曲172在歌曲160播放期间的任何点中混合。在一些实例中,过渡参数可以在一首正播放的歌曲和另一首歌曲之后被确定,例如,其他歌曲进行播放的选择。根据一些实施方式中,歌曲172和160的混合点不必被确定,在选择两首歌曲其中一首之前。如本文所述,例如,这里描述的各种特征可通过混合促进过渡,由此用户不需要手动确定,设置,或者使用预定的混合点。因此,中点可以在一个或多个任意时间点中实现,根据各种实施例实施。
图2示出两个音轨之间的过渡的流程图200的一个例子,根据一些实施例。流程200可通过任何一种或多种合适的计算设备来实现,如智能电话,平板电脑,数字音乐播放器,笔记本电脑,台式机,智能电视,家庭影院系统,或其他计算设备,包括服务器(例如,网络服务器)。注意,根据各种实施方式,流程200的一部分可以重新排列,省略,改写,修改或以各种方式扩大。
在202,流程200包括识别一个或多个音轨中的一个或多个相关的音频特性。所述一个或多个识别的音频特性可以涉及或包括速度,节拍乐句,音调,拍子记号,和/或其它音频特性。音频特性可以用许多不同的方法来识别,或几个联合一起来提高附加的准确性。例如,数字文件元数据(例如MP3音频文件的ID3标签,或描述音频或音乐或图像的特性的其他类似的数据的排列),用户手动标记,或采用所述内容的原始音频数据的计算(例如开始,从文件波形检测节拍)可以被用来识别音频特性。此外,音频特性可以计算或以其他方式衍生的,根据一些实施例。根据一些实施例,音频特性可以包括音乐特性,或可被描述,至少在一种情况下,作为一个音乐特性。
识别音频特性还可以包括识别与所述音频轨道相关联的元数据。与音频轨道相关联的元数据可以从本地存储的音频轨道或远程存储的音轨导出。在一些实例中,元数据可以从远程媒体内容库或音乐流业务中提取(例如,SpotifyTM,RDIOTM,iTunesTM等)。例如,在计算设备识别为播放的一个或多个音轨可以有关可能被远程存储的一个或多个参考轨道。在一些情况下,在计算设备的一个或更多个音频轨道的元数据可以匹配于包含在远程媒体内容库的一个或多个参考轨道。该内容可被识别,相对于一个或多个参考数据库,从而使设备内容可以被识别,相对于其他内容,以及与外部系统关联的内容(例如数字内容传递网络归档,音乐流服务等)。
在204,用户产生的触发被接收。该用户产生的触发包含在数据中,该数据关联用户希望的开始过渡到另一个音轨(例如跳过播放列表中的下一首歌曲)的信号指示。用户产生的触发可以使用任何合适的技术来实现。例如,用户可以在软件或硬件的用户接口元件(例如,物理或屏幕上的按钮)相互作用以触发过渡。用户产生的触发也可基于手势检测(例如摇动设备,屏幕上滑动,等等),由此手势可以被检测(例如,通过一个手势检测器)来启动过渡。用户产生的触发也可基于从传感器(例如,音频噪声传感器,加速计,运动传感器等)接收的信号,用于在环境中检测变化(例如在环境噪声或运动的下降或上升)。运动可以通过运动传感器的方式进行检测。
在206,流程200可基于音频特性和/或识别为音频轨道的元数据,响应于用户产生的触发事件确定一个或多个过渡参数。这可以被执行,在播放设备本身(例如,音频产生设备逻辑或电路),或者与该播放设备进行通信的外部系统(例如,web服务器)。在一些实施方案中,过渡参数可以包括混合点。例如,混合点可以自主地被确定,作为在从第一音轨以第二音轨的音乐过渡中的一个点。根据本公开内容的各方面,在接收到用户产生触发事件之后,该混合点可以被确定落后于、靠近,或者在第一音轨的节拍上。
一种或多种过渡参数还可以包括,但不限于,音量的变化(例如,代表淡入和淡出参数的数据),播放控制(例如,代表开始操作,停止操作,等的数据),处理效果的应用(如混响,延迟,高/低通滤波器)和其它参数。在一些实施方案中,过渡参数可使用调度系统,关联于播放设备的操作,指示事件结构的定时信息(例如,开始,持续等的时间)和相关参数(例如,变化率,起始值,结束值等)的变化。
在208,流程200可导致音轨之间的音频播放过渡,基于一种或多种过渡参数。特别是,流程200可包括读取或获得用于播放的音频数据,处理与过渡参数(例如,在一个或多个任意时间加点上加入混合点,淡入/淡出,和其他处理效果)一致的数据,以及在输出设备(如扬声器,耳机等)上翻译用于播放的处理后的信号。这可以在一个内容是被控制和处理的设备上被执行,或一个单独的输出设备上。
图3示出了计算系统的一个例子,根据一个或多个实施例。系统300包括计算设备310,其可以是一个或多个的任何设备或能够处理媒体,如音频和/或视频内容的机器。例如,计算设备可以包括智能电话,平板电脑,数字音乐播放器,笔记本电脑,台式机,智能电视,家庭影院系统,和其他计算设备。
计算设备310可具有处理器312(多个)和内存314。计算设备310还可以包括用于通过网络340与远程计算设备进行通信的网络接口。网络接口可以包括任何合适的组件用于连接与一个或多个网络,包括例如,发射机,接收机,端口,控制器,天线,或其他合适的组件。在特定实现方式,计算设备310可以与远程内容服务器330通信,诸如网络服务器,经由网络340。远程内容服务器330可以耦合到音频数据库335或与其通信。数据库335可以包括服务于远程设备和关联元数据的媒体。在特定实现中,作为计算设备310的用户设备可以从远程内容服务器330中访问内容(例如,流音频内容)。
处理器312可以是任何合适的处理设备,诸如微处理器。内存314可包括任何合适的计算机可读介质或媒体,其中包括,但不限于,非临时性计算机可读介质,RAM,ROM,硬盘驱动器,闪存驱动器,磁或光介质,或其它存储器装置。内存314可以存储由处理器312访问的信息,包括处理器312执行的指令316。内存314还可以包括可以由处理器312检索,操纵,创建或存储的数据318。在一些例子中,数据318可以包括元数据,过渡参数数据,音频特性数据,等等)。指令316可以是任何一组指令,当由处理器312执行,引起任何处理器312提供所需功能。例如,指令316可通过处理器312实现执行轨道参数模块320,界面模块322,混合模块324,和播放模块326。
轨道参数模块320可以被配置为识别和/或计算相关的音频或一个或几个音轨的音乐特性(例如,为一个或多个歌曲确定速度或每分钟节拍数),并识别与音轨相关联的元数据,例如,通过存储在数据库335的请求信息耦合到远程内容服务器330(例如,获取歌曲元数据)。界面模块322可以被配置为接收数据,该数据代表触发基于用户界面的音轨之间过渡的信号,(如从用户与界面交互,或从其他输入和/或信号,例如,手势识别信号,环境信号,运动信号,或其它信号)。
混合模块324被配置为确定响应于用户产生的触发的一个或多个过渡参数。例如,混合模块324可以使用由轨道参数模块320确定的信息来确定适当的参数(例如该混合点)和处理过渡。混合模块324可以在计算设备310中执行。可替代地和/或另外地,混合模块324可以在远程内容服务器330中执行。
在一些实施方案中,代表拍子图的量可以被计算出来,为了音轨在整个所述一个或几个音频轨迹确定潜在的混合点。在用户产生的触发的开始,在音轨时间点中的代表拍子图的量可以用于结合相对于音频播放开始时间的事件时间,以确定该活动的合适的参数。
播放模块326被配置为根据通过混合模块324确定的过渡参数来控制音轨的播放。播放模块326可以产生经处理的信号,用于在输出设备上播放。
应当理解的是,术语“模块”指的是用于提供期望的功能的计算机的逻辑。因此,模块可以实现为硬件,专用电路,固件和/或软件控制的通用处理器。在一个实施例中,模块存储在存储设备上的程序代码文件,加载到存储器,并由处理器执行或可以由计算机程序产品提供,例如计算机可执行指令,存储在有形的计算机可读存储介质如RAM,硬盘或光或磁介质。
计算设备310可以包括或可以连接到一个或多个输入/输出装置。输入设备可对应于经配置以允许用户与计算设备交互的一个或多个外围装置。一个示范性输入装置可以是触摸界面(例如触摸屏或触摸板),其允许用户提供一个用户产生的触发。所述输出设备可对应于用于提供信息给用户的设备。一个示例性输出装置包括用于播放音频给用户的合适的音频输出(例如扬声器,耳机,无线电发射器)。该计算设备310可以包括或耦合到其他输入/输出设备,诸如键盘,麦克风,鼠标,打印机,和/或其他适当的输入/输出装置。
网络340可以是任何类型的通信网络,诸如局域网(例如内联网),广域网(例如因特网),或者它们的一些组合。该网络还可以包括任何计算设备之间的直接连接。在一般情况下,计算设备之间的通信可以通过网络接口来进行,使用任何类型的有线和/或无线连接,各种通信协议,编码或格式,和/或保护方案。
图4和5分别描绘一个轨道参数分析器和自主混合器以促进过渡音轨,根据一些实施例。图400示出了一个轨道参数分析器402,包括一个特性鉴别器410和元数据确定器430,并且被配置为确定轨道参数数据490。特性鉴别器410被配置为一个或多个音轨确定音频数据401的一个或多个特性。根据一个实施例,特性鉴别器410中的速度鉴别器412配置为确定用于音频轨迹(“1”)420的速度及音频轨道(“2…n”)424的速度。例如,速度鉴别器412被配置成为音频轨道420确定每分钟节拍数(“BPM1”)422,BPM1422可以被用来确定相对于音轨420的开始时间的节拍的定时。例如,速度鉴别器412可以确定在时间S1B1、S1B2、…、S1Bn等出现的节拍。在一些情况下,部分421和423可被确定为具有不同的节拍速率,当一首歌曲从一部分到另一部分减慢或加快。注意到,音频轨道420可以是用户在播放时间T1在设备上听到的歌曲。此外,速度鉴别器412可被配置成为音轨424之一确定一个或多个每分钟节拍数(“BPM2…BPMn”)426,BPM2426可以被用来确定相对于音轨420的开始时间的节拍的定时。例如,速度鉴别器412可以确定在时间S2B1、S2B2、…、S1Bm等出现的节拍。在一些情况下,BPM426的一个或多个部分可被确定为具有不同的节拍速率,当一首歌曲从一部分到另一部分减慢或加快。在某些情况下,代表BPM的数据可以是来源于计算的过渡参数,该计算基于音轨420和424的检测分析。
元数据确定器430被配置成确定与一个或多个音轨420和424相关的元数据。在一些实例中,元数据确定器430可以识别音轨420(例如,作为歌曲1)作为参考轨道,Tr1。如图所示,参考轨道,Tr1,可以设置作为在远程存储435中的表示参考轨道438的数据。此外,元数据确定器430可以识别音轨424之一(例如,作为歌曲2)作为参考轨道,Tr2。如图所示,参考轨道,Tr2,可以设置作为在远程存储435中的表示参考轨道439的数据。此外,元数据确定器430包括元数据提取器432,被配置为提取元数据信息,从参考轨道438和439中,或从存储在本地资源库433中的音频轨道相关的元数据信息中。轨道参数分析器402,包括特性鉴别器410和元数据确定器430,被配置为发送轨道参数数据490到自主混合器。
图5示出了一个自主混合器,其配置为从一个音轨到下一个音轨过渡音频播放,根据一些实施例。图500示出了自主混合器502包括过渡参数确定器510,和调度器系统540。根据一个实施例,过渡参数确定器510被配置为产生一组或多组数据591到595,基于来自于图4的轨道参数分析器402的数据490,表示,例如,过渡参数。例如,过渡参数确定器510可确定回响数据(“R1”)591,以应用到,例如,歌曲(“S1”)550,淡出持续时间的数据(“D1”)592,歌曲1音量(“V1”)数据594,淡出开始数据(“S1V1T1”)593,歌曲2音量(“V2”)数据595,其它的数据组之间。需要注意的是,根据一些实施例,一组或多组数据591到595可来源于或接收于数据490。
过渡参数确定器510被配置成确定一个最佳的混合点,S1Bx的,其中S1Bx>T2,这是触发数据542被接收的在播放时间中的点,由此触发数据542指示一个用户产生的触发到过渡音轨。过渡参数确定器510配置为确定混合点,对准歌曲1的节拍Bx1(即,S1Bx)和歌曲2的节拍1(即,S2b1),由此混合点数据518可也指示歌曲2的偏移,以指示开始播放歌曲(“S2”)522的时间点。
此外,过渡参数确定器510被配置为使用Tr1和TR2的元数据,以确定歌曲2的初始音量(“V2i”)数据595,歌曲1的回响参数(“R1”)数据591,淡出时间(“D1”)592,并开始淡出时间(“S1V1T1”)。如插图512所示,过渡参数确定器510被配置为确定一个速率,在持续时间“D1”(从数据592)之后,第一首歌从音量水平“V1”到音量水平“0”而淡出。持续时间D1开始于在一个时间点(“S1V1T1”)511和减少到另一个时间点(“f1”)513。如插图514所示,过渡参数确定器510被配置为确定一个速率,在持续时间“D2”(从数据595,等)之后,第二首歌从音量水平“V2i”到音量水平“V2f”而淡入。持续时间D2开始于在一个时间点(“X”)512和增加到另一个时间点(“Y”)517。此外,过渡参数确定器510被配置为确定播放第二首歌S2的速率R2,如插图520所示。特别是,过渡参数确定器510被配置成为第二首歌计算播放速率R2为BPM2/BPM1,由此BPM2=R2*BPM1。过渡参数确定器510还可以设置一个处理参数,这是可选的,如第一首歌的回响参数R1。
从过渡参数确定器510来的数据530被发送到调度系统540,其被配置来安排和/或执行上述的数据(例如,过渡参数,音频特性等)以引起从歌曲550到歌曲552的音频过渡的播放。作为一个例子,考虑到该歌曲(“S1”)在时间点T的当前正在播放。在T2,当检测到触发事件,由此自主混合器502被配置为测定一个或多个过渡参数,包括混合点,基于歌曲550的节拍S1bX到歌曲552的节拍S2b1的对准(例如,在拍子音阶)。在时间S1Bx(例如,混合点),调度系统540开始播放过渡音频554的预定的事件,其中包括开始播放歌曲(“S2”)作为内容补偿和节拍S2B1的功能。调度系统540还可以为第二首歌设置播放速率R2。此外,调度系统540将参数R1应用于第一首歌。如过渡音频554所示,第二首歌的音量在第二持续时间内从开始量(即,V2i)增加到最终量(即,V2f)。在S1V1T1内,第一首歌的音量在第一持续时间内从初始量(即,V1)减少至最终量(例如,0)。
在图4和5中的上述实施例,可在服务器-客户端结构中实现,该设备,未示出,与服务器进行通信。那些本领域的普通技术人员,使用本文提供的公开内容,应理解,根据本公开内容的各方面的方法和系统可以实现其它适当的结构,如一个或多个计算装置。
图6示出了,执行各种基于传感器的触发数据,为了音轨的开始过渡,根据一些实施例。图600示出了移动设备602,其可以被实现为可穿戴计算设备604或移动计算设备606,其中的任一个包括传感器,作为为产生数据指示用户产生的触发的接口。
图600还示出了调度系统650,包括一个手势检测器652和一个动作检测器654。手势检测器652被配置为接收数据642(例如,基于运动传感器,加速计,陀螺仪,电容式传感器等),和检测这样的数据表示指示用户请求开始过渡的手势。类似地,动作检测器654被配置为接收数据642(例如,基于运动传感器,加速计,陀螺仪,等),并检测出这样的数据表示的运动(例如,小步和大步的时间)作为隐式请求来开始过渡。开始过渡的请求可被产生为数据660,与一种或多种本文描述的组件可以被用来促进从一个音轨到另一个音轨的过渡,以基于任意触发的时间点。
图7示出了计算系统的另一实例中,根据一个或多个实施例。系统700包括计算设备710和远程服务器730。如图所示,计算设备710可具有处理器712(多个)和一个存储器714。计算设备710还可以包括用于通过网络740与远程计算设备进行通信的网络界面。在特定实现方式,计算设备710可以与远程服务器730通信,诸如网络服务器,经由网络740。远程服务器730可以耦合到内容传送服务732,或与其通信,如SpotifyTM,RDIOTM,iTunesTM等,其中包括在库735中的音频数据和元数据。数据库735可以包括媒体,通过网络742服务到远程设备和相关的元数据。在特定实现中,实现为计算设备710的用户设备可以从远程服务器730或从数据718访问内容(例如,流音频内容)。指令716可以是任何一组指令,当由处理器712执行,引起任何处理器712提供所需的功能。例如,指令716可以通过处理器712实现界面模块722和播放模块726的执行。
请注意,在所示的系统中,远程服务器730包括配置成实现轨道参数模块720和混频模块724的硬件,软件,和/或逻辑。这样,远程服务器730可以被配置为通过用户设备710,识别使用的音频特性和/或过渡参数。在各种其他实施方式中,设备710的一个或多个模块可以被布置在远程服务器730中,并且远程服务器730的一个或多个模块可以被布置在用户设备710中。
图8示出一个实例性的计算平台,其被配置为提供自主的音频过渡,示例性的计算平台。在一些实例中,计算平台800可以被用于实现计算机程序,应用,方法,过程,算法,或其他软件来执行上述技术。
在一些情况下,计算平台可以设置在可穿戴设备或仪器,一个移动计算设备,或任何其他设备。
计算平台800包括:用于信息通信的总线802或其他通信机构,其连接子系统和设备,如处理器804,系统存储器806(例如,RAM等),存储设备8012(例如,ROM等),通信接口813(例如,以太网或无线控制器,蓝牙控制器等),以促进经由通信链路821端口的通信,例如,与计算设备,包括移动计算和/或与通信设备处理器的通信。处理器804可以实现为一个或多个中央处理单元(“CPUs”),例如由英特尔公司制造的,或一个或多个虚拟处理器,以及CPUs和虚拟处理器的任意组合。计算平台800交换数据,该数据代表经由输入和输出设备801的输入和输出,包括但不限于,键盘,鼠标,音频输入(例如,语音到文本的设备),用户界面,显示器,监视器,光标,触敏显示器,LCD或LED显示器,以及其它I/O相关的设备。
根据一些实施例,计算平台800由处理器804执行特定操作,执行存储在系统存储器806中的一个或多个指令的一个或多个序列,以及计算平台800可以在客户端-服务器结构来实现,对等网络装置,或作为任何移动计算设备,包括智能电话等。这样的指令或数据可以被读入系统存储器806,从另一计算机可读介质,例如存储设备808。在一些实例中,硬接线电路可以代替或者与执行软件指令组合使用。指令可以被嵌入在软件或固件。术语“计算机可读介质”指的是任何有形介质,其参与提供指令给处理器804以供执行。这样的介质可以采取许多形式,包括但不限于非易失性介质和易失性介质。非易失性介质包括例如,光盘或磁盘等。易失性介质包括动态存储器,例如系统存储器806。
计算机可读介质的常见形式包括,例如,软盘,柔性盘,硬盘,磁带,任何其它磁介质,CD-ROM,任何其它光学介质,穿孔卡片,纸质磁带,具有孔图案的任何其他物理介质,RAM,PROM,EPROM,FLASH-EPROM,任何其他存储器芯片或盒,或从该计算机可以读取的任何其它介质。指令还可以被发送或使用传输介质接收。术语“传输介质”可以包括能够存储,编码或由机器携带用于执行的指令,并且包括数字或模拟通信信号或其它无形介质,以促进这种指令的通信的任何有形或无形介质。传输介质包括同轴电缆,铜线,和光纤,包括电线,其包含用于发射计算机数据信号的总线802。
在一些实例中,系列指令的执行可通过计算平台800来实现。根据一些实施例,计算平台800可以通过通信链路821(例如,有线网络,如LAN,PSTN,或任何无线网络)被耦合到任何其他处理器来实现系列指令,协同(或异步)于另一个。计算平台800可以发送和接收消息,数据和指令,包括程序代码(例如,应用程序代码),通过通信链路821和通信接口813。接收程序代码可以由处理器804来执行,当它是被接收和/或存储在存储器806或用于稍后执行其他非易失性存储。
在示出的实例中,系统存储器806可包括各种模块,包括实施本文中所描述的功能的可执行指令。在示出的实例中,系统存储器806包括一个轨道参数模块870,和一个自主混合器模块872,其包括过渡参数确定器模块874,其中的一个或多个可以被配置为提供或消耗的输出来实现本文中所描述的一个或多个功能。
在至少一些实施例中,任何的上述特性的结构和/或功能可以在软件,硬件,固件,电路或者它们的组合来实现。注意,上述结构和组成元件,以及它们的功能,可以与一个或多个其它结构或元件被聚集。替代地,元件和它们的功能可以被细分成构成子元素,如果有的话。作为软件,上述技术可使用各种类型的编程或格式化语言,框架,句法,应用程序,协议,对象,或技术来实现。为硬件和/或固件,上述技术可使用各种类型的编程或集成电路设计语言,包括硬件描述语言,诸如被配置来设计现场可编程门阵列(“FPGAs”)的任何寄存器传送语言(“RTL”)来实现,应用专用集成电路(“ASICs”),或者任何其他类型的集成电路。根据一些实施方案,术语“模块”可以指,例如,在任一硬件电路或软件,或它们的组合中实现的算法或其部分,和/或逻辑。这些可以变化,并且不限于所提供的示例或说明。
在一些实施方案中,本文中描述的自主混合器或一种或多种其组件(或本文描述的任何其它结构/功能),或者任何处理或设备,可以与移动设备通信(例如,有线或无线),诸如移动电话或计算设备,或者可以在其中设置。在一些情况下,移动设备,或者任何联网的计算设备(未示出)连通(本文描述的或任何其它结构/功能或任何过程或设备)的自主混合器或一种或多种其组件,至少可以提供一些任何本文描述的特性的结构和/或功能的。正如图1和/或随后的附图所描绘的,结构和/或任何的上述特性的功能可以在软件,硬件,固件,电路或者它们的任何组合来实现。注意,上述结构和组成元件,以及它们的功能,可以被聚合或与一个或多个其它结构或元件组合。替代地,元件和它们的功能可以被细分成构成子元素,如果有的话。作为软件,至少一些上述技术可使用各种类型的编程或格式化语言,框架,语法,应用程序,协议,对象,或技术来实现。例如,在任何图中所描绘的元件中的至少一个可以表示一个或多个算法。或者,元件中的至少一个可以表示包括经配置以提供组成结构和/或功能性硬件的一部分的逻辑的至少一部分。
例如,一个自主混合器或其一个或多个组件,其任何一个或多个组件,或任何过程或本文中所描述的结构/装置,可在一个或多个计算设备来实现(即,任何移动计算设备,例如作为可佩戴设备,音频设备(如耳机或头戴式耳机),包括配置成在存储器以执行一个或多个算法中的一个或多个处理器或移动电话,无论是穿戴或携带)。因此,在图1(或任何后续图)中的至少一些元素可以表示一个或多个算法。或者,元件中的至少一个可以表示包括经配置以提供组成结构和/或功能性硬件的一部分的逻辑的至少一部分。这些可以变化,并且不限于所提供的示例或说明。
作为硬件和/或固件,上述的结构和技术可使用各种类型的编程或集成电路设计语言,包括硬件描述语言,诸如被配置来设计现场可编程门阵列(“FPGAs”)的任何寄存器传送语言(“RTL”)来实现,应用专用集成电路(“ASICs”),多芯片模块,或任何其他类型的集成电路。例如,本文中描述的自主混合器,包括一个或多个其它组件,或者任何处理或设备,可以在包括一个或多个电路的一个或多个计算设备来实现。因此,在图1(或任何后续图)元件中的至少一个可以表示硬件的一个或多个组件。或者,元件中的至少一个可以表示包括经配置以提供组成结构和/或功能性的电路的一部分的逻辑的至少一部分。
根据一些实施方案,术语“电路”可以指,例如,包括多个组件的任何系统,通过该电流实现一个或多个功能,该组件包括离散的和复杂的部件。分立元件的例子包括晶体管,电阻器,电容器,电感器,二极管,和类似物,和复杂的部件的例子包括存储器,处理器,模拟电路,数字电路,和类似物,包括现场可编程门阵列(“FPGAs”),应用专用集成电路(“ASICs”)。因此,电路可以包括电子元件和逻辑元件的系统(例如,配置为执行指令的逻辑,算法的一组可执行指令,例如,因此,是一个电路的组件)。根据一些实施方案,术语“模块”可以指,例如,在任一硬件电路或软件,或它们的组合中实现的算法或其部分,和/或逻辑(即,模块可以被实现为电路)。在一些实施方案中,算法和/或在其中的算法被存储在存储器是一个电路的“组件”。因此,术语“电路”也可以指,例如,部件的系统,包括算法。这些可以变化,并且不限于所提供的示例或说明。
尽管前述实施例已经在一些细节为了清楚理解的目的进行了描述,上述本发明的技术并不限于所提供的细节。存在实施上述发明的技术的许多替代方式。所公开的例子是说明性的而不是限制性的。尽管本主题进行了详细相对于具体的示例性实施例及其方法中描述的,可以理解,那些本领域技术人员,在获得对前述内容的理解可以很容易地产生的改变,变化和等同物,例如实施方案。因此,本公开内容的范围是通过举例的方式,而不是通过限制的方式,并且主题公开不排除包含这样的修改,变化和/或添加到本主题的是显而易见的,对一个本领域普通的技术人员来说。

Claims (20)

1.一种计算机实现的方法,其特征在于,包括:
利用计算设备识别第一音轨的第一音频特性;
利用所述计算设备识别第二音轨的第二音频特性;
在所述计算设备接收代表用户产生的触发的数据;
响应于所述用户产生的触发,基于所述第一音频特性和所述第二音频特性中的一个或多个,确定用于所述第一音轨和所述第二音轨的过渡参数;以及
使得从所述第一音轨到所述第二音轨的过渡呈现。
2.如权利要求1所述的计算机实现的方法,其特征在于,所述第一音频特性和所述第二音频特性包括速度,节拍乐句,音调和拍子记号中的一个或多个。
3.如权利要求1所述的计算机实现的方法,其特征在于,识别所述第一音频特性和所述第二音频特性分别包括:
识别第一每分钟节拍数;和
识别第二每分钟节拍数。
4.如权利要求1所述的计算机实现的方法,其特征在于,还包括:
基于所述第一音频特性识别代表所述第一音轨的第一轨部分的数据;
基于所述第二音频特性识别代表所述第二音轨的第二轨部分的数据;和
在所述计算设备的处理器,将所述第二轨部分对准到所述第一轨部分,以自主地形成混合点。
5.如权利要求4所述的计算机实现的方法,其特征在于,还包括:
应用过渡参数,引起音量的修改,以使所述第一音轨或所述第二音轨中的一个或两者渐弱。
6.如权利要求1所述的计算机实现的方法,其特征在于,识别所述第一音频特性和所述第二音频特性是响应于接收代表所述用户产生的触发的数据。
7.如权利要求1所述的计算机实现的方法,其特征在于,确定所述过渡参数包括:
识别元数据;和
基于与所述第一音轨或所述第二音轨相关联的所述元数据,确定所述过渡参数。
8.如权利要求1所述的计算机实现的方法,其特征在于,接收所述代表所述用户产生的触发的数据包括:
接收指示与用户界面的用户交互的数据。
9.如权利要求8所述的计算机实现的方法,其特征在于,还包括:
基于传感器数据接收指示手势的数据。
10.如权利要求8所述的计算机实现的方法,其特征在于,还包括:
基于传感器数据接收指示移动的数据。
11.如权利要求8所述的计算机实现的方法,其特征在于,还包括:
接收指示包括环境噪声变化的环境变化的数据。
12.如权利要求1所述的计算机实现的方法,其特征在于,所述过渡参数包括代表混合点、混响处理参数、所述第一音轨的淡出时间,所述第二音轨的淡入时间,和所述第二音轨的回放速率中的一个或多个的数据。
13.如权利要求1所述的计算机实现的方法,其特征在于,还包括:
至少部分基于所述过渡参数,从所述第一音轨过渡到所述第二音轨。
14.一种系统,其特征在于,包括:
内存,包括:
实现轨道参数模块的可执行指令,所述轨道参数模块被配置为识别第一音轨的第一音频特性,以及识别第二音轨的第二音频特性;和
实现自主混合器模块的可执行指令,所述自主混合器模块被配置成基于所述第一音频特性和所述第二音频特性中的一个或多个,确定用于所述第一音轨和所述第二音轨的过渡参数;和
处理器,所述处理器被配置为执行所述可执行指令,以实现所述轨道参数模块和所述自主混合器模块,所述处理器进一步被配置成接收代表用户产生的触发的数据,并使得从所述第一音轨到所述第二音轨的过渡呈现。
15.如权利要求14所述的系统,其特征在于,其中所述第一音频特性和所述第二音频特性包括速度。
16.如权利要求15所述的系统,其特征在于,所述第一音频特性和所述第二音频特性分别包括:
第一每分钟节拍数;和
第二每分钟节拍数。
17.如权利要求16所述的系统,其中所述处理器被配置为执行实现所述自主混合器模块的另一组可执行指令,所述自主混合器模块被配置为确定由所述第一每分钟节拍数确定的节拍的第一子集,并确定由所述第二每分钟节拍数确定的节拍的第二子集,
其中所述处理器被配置为对准节拍的第一子集和节拍的第二子集,以自主地形成中点。
18.如权利要求14所述的系统,其特征在于,实现轨道参数模块的所述可执行指令包括:
识别元数据和基于与所述第一音轨或所述第二音轨相关联的所述元数据来确定过渡参数的可执行指令。
19.如权利要求14所述的系统,其特征在于,所述处理器进一步被配置为基于作为所述用户产生的触发的传感器数据,接收指示手势的数据。
20.如权利要求14所述的系统,其特征在于,所述处理器进一步被配置为基于作为所述用户产生的触发的传感器数据,接收指示移动的数据。
CN201480049975.1A 2013-07-10 2014-07-10 用于使用任意触发的音频处理的系统和方法 Pending CN105766001A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361844488P 2013-07-10 2013-07-10
US61/844,488 2013-07-10
PCT/US2014/046252 WO2015006627A1 (en) 2013-07-10 2014-07-10 System and method for audio processing using arbitrary triggers

Publications (1)

Publication Number Publication Date
CN105766001A true CN105766001A (zh) 2016-07-13

Family

ID=52277738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480049975.1A Pending CN105766001A (zh) 2013-07-10 2014-07-10 用于使用任意触发的音频处理的系统和方法

Country Status (7)

Country Link
US (1) US20150018993A1 (zh)
EP (1) EP3020214A1 (zh)
CN (1) CN105766001A (zh)
AU (1) AU2014287072A1 (zh)
CA (1) CA2917595A1 (zh)
RU (1) RU2016103331A (zh)
WO (1) WO2015006627A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204048546U (zh) * 2014-05-02 2014-12-31 加埃塔诺·朱塞佩·克赛拉 头发延展部分、微环以及包括该头发延展部分的配套件
US9933991B2 (en) * 2015-03-10 2018-04-03 Harman International Industries, Limited Remote controlled digital audio mixing system
US9985676B2 (en) * 2015-06-05 2018-05-29 Braven, Lc Multi-channel mixing console
GB2539875B (en) 2015-06-22 2017-09-20 Time Machine Capital Ltd Music Context System, Audio Track Structure and method of Real-Time Synchronization of Musical Content
WO2017075281A1 (en) 2015-10-27 2017-05-04 ZALON, Zack, J. Audio content production, audio sequencing, and audio blending system and method
NO342833B1 (en) * 2016-06-16 2018-08-13 Soundio As Media player with multifunctional crossfader
GB2557970B (en) * 2016-12-20 2020-12-09 Mashtraxx Ltd Content tracking system and method
EP4115628A1 (en) * 2020-03-06 2023-01-11 algoriddim GmbH Playback transition from first to second audio track with transition functions of decomposed signals

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1456780A4 (en) * 1997-04-01 2007-04-25 Medic Interactive Inc SYSTEM FOR THE AUTOMATIC GENERATION OF MEDIA PROGRAMS FROM A MEDIA ELEMENTS DATABASE
US7424117B2 (en) * 2003-08-25 2008-09-09 Magix Ag System and method for generating sound transitions in a surround environment
US7518053B1 (en) * 2005-09-01 2009-04-14 Texas Instruments Incorporated Beat matching for portable audio
US8086265B2 (en) * 2008-07-15 2011-12-27 At&T Intellectual Property I, Lp Mobile device interface and methods thereof
US8805693B2 (en) * 2010-08-18 2014-08-12 Apple Inc. Efficient beat-matched crossfading
KR20120024247A (ko) * 2010-09-06 2012-03-14 삼성전자주식회사 사용자의 제스처를 인식하여 이동 장치를 동작하는 방법 및 그 이동 장치

Also Published As

Publication number Publication date
AU2014287072A1 (en) 2016-01-28
CA2917595A1 (en) 2015-01-15
EP3020214A1 (en) 2016-05-18
US20150018993A1 (en) 2015-01-15
RU2016103331A (ru) 2017-08-15
WO2015006627A1 (en) 2015-01-15

Similar Documents

Publication Publication Date Title
CN105766001A (zh) 用于使用任意触发的音频处理的系统和方法
US9979691B2 (en) Watermarking and signal recognition for managing and sharing captured content, metadata discovery and related arrangements
US10250650B2 (en) Discovery playlist creation
CN105009118B (zh) 定制的内容消费界面
US20140059430A1 (en) System and method for generating a mood gradient
CN107924679A (zh) 输入理解处理期间在响应选择中的延迟绑定
US20170060520A1 (en) Systems and methods for dynamically editable social media
US11669296B2 (en) Computerized systems and methods for hosting and dynamically generating and providing customized media and media experiences
US11755280B2 (en) Media content system for enhancing rest
CN107483597B (zh) 一种资源转移方法、相关设备及系统
US9224385B1 (en) Unified recognition of speech and music
WO2018223837A1 (zh) 音乐播放方法及相关产品
US20150058007A1 (en) Method for modifying text data corresponding to voice data and electronic device for the same
CN1937462A (zh) 内容偏好得分确定方法、内容重放装置及内容重放方法
WO2017028704A1 (zh) 伴奏音乐的提供方法和装置
US11799930B2 (en) Providing related content using a proxy media content item
CN104205791A (zh) 管理补充信息的回放
US20190289254A1 (en) Systems and methods for intelligently synchronizing events in visual content with musical features in audio content
US20160117144A1 (en) Collaborative and interactive queuing of content via electronic messaging and based on attribute data
US20150055934A1 (en) Enhancing karaoke systems utilizing audience sentiment feedback and audio watermarking
TW201535358A (zh) 互動節拍特效系統及互動節拍特效處理方法
US20230251820A1 (en) Systems and Methods for Generating Recommendations in a Digital Audio Workstation
CN106484856A (zh) 音频播放方法及装置
CN109644291A (zh) 将辅助数据同步到包括音频的内容
US20160255025A1 (en) Systems, methods and computer readable media for communicating in a network using a multimedia file

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160713