CN101399037A - 用于提供音乐片段概观的方法和装置 - Google Patents

用于提供音乐片段概观的方法和装置 Download PDF

Info

Publication number
CN101399037A
CN101399037A CNA2008101681673A CN200810168167A CN101399037A CN 101399037 A CN101399037 A CN 101399037A CN A2008101681673 A CNA2008101681673 A CN A2008101681673A CN 200810168167 A CN200810168167 A CN 200810168167A CN 101399037 A CN101399037 A CN 101399037A
Authority
CN
China
Prior art keywords
music
snatch
happy
happy joint
joint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101681673A
Other languages
English (en)
Other versions
CN101399037B (zh
Inventor
T·坎普
W·哈格
J·埃金克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101399037A publication Critical patent/CN101399037A/zh
Application granted granted Critical
Publication of CN101399037B publication Critical patent/CN101399037B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/64Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/101Music Composition or musical creation; Tools or processes therefor
    • G10H2210/125Medley, i.e. linking parts of different musical pieces in one single piece, e.g. sound collage, DJ mix

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本发明涉及用于提供音乐片段概观的方法和装置。用于提供音乐片段概观的方法包括:提供至少两个音乐片段;确定所述音乐片段的至少两个乐节,其中所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从所述音乐片段中的另一个确定;以及将所述乐节布置在一个序列中。

Description

用于提供音乐片段概观的方法和装置
技术领域
本发明的一个实施例涉及用于提供音乐片段(pieces of music)概观的方法和装置.本发明的另一实施例涉及用于提供音乐片段概观的系统。
背景技术
例如由于诸如音频压缩的新技术允许汇编包含几千或几百万个歌曲的大的音乐集合,所以在大的音乐数据库中找到音乐片段已经变成一项有挑战性的任务.
此外,存在大的音乐数据库并且可以例如通过因特网来访问。浏览这种大的集合对于用户来说通常是耗时且痛苦的。
发明内容
因此,本发明的目的是提供用于提供音乐片段概观的方法和装置。
该目的分别通过根据权利要求1、16、18、19、和20所述的方法和装置来解决。
从对附图以及随后的描述的考虑,本发明的另外的目的和可能的优点将变得显而易见.
附图说明
图1示出用于提供音乐片段概观的方法的一个实施例;
图2示出用于提供音乐片段概观的方法的另一实施例;
图3示出本发明的一个实施例,其中来自一个目录的歌曲被布置成混合曲;
图4示出本发明的另一实施例,其中执行音乐片段的乐节(section)的聚类(clustering),并且其中根据所述聚类来布置所述乐节;
图5示出本发明的另一实施例,其中执行音乐片段的聚类,并且其中位于每个群集(cluster)的质心附近的音乐片段被识别;
图6示出用于提供音乐片段概观的装置的一个实施例;
图7示出用于提供音乐片段概观的装置的另一实施例,其中该装置包括用于进行数据交换的发送/接收单元;
图8示出用于提供音乐片段概观的、作为手持装置实现的装置的另一实施例;
图9示出用于提供音乐片段概观的、具有受限制的图形用户接口的装置的另一实施例;
图10示出用于提供音乐片段概观的系统的一个实施例,其中该系统包括通过发送/接收单元进行通信的客户机和服务器;以及
图11示出用于提供音乐片段概观的系统的又一实施例,其中该系统包括通过因特网进行通信的客户机和服务器。
具体实施方式
在下文中描述了本发明的实施例.重要的是注意,在下文中所描述的所有实施例可以以任何方式来组合,也即,并不存在所描述的某些实施例不能与其它实施例相组合的限制。
在本发明的一个实施例中,一种用于提供音乐片段概观的方法包括提供至少两个音乐片段、确定所述音乐片段的至少两个乐节,其中所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从所述音乐片段中的另一个确定,并且将所述片段布置在一个序列中。可以通过包含该序列的混合曲来提供概观.
所述音乐片段可以从包含音乐数据的任何集合(例如目录、文件夹、或包含音乐数据的任何其它容器)中确定。所述音乐片段还可以从诸如数据库的集合中例如通过以下方式来检索,即利用播放列表,确定音乐片段的有序列表、音乐风格(mood)选择器,提供对相同风格的内容项布置、或艺术家选择器的访问,允许选择由所选择的艺术家所创作或表演的音乐片段,等等。此外,所述音乐片段可以从远程数据库例如通过因特网或者通过用户环境中的本地网接收。除了音乐数据之外,所述集合可以包含例如用于用户娱乐的其它的内容项,诸如视频数据或计算机游戏。在后一种情况下,来自音频数据磁道的音乐可以从所述内容项中得到。
当从所述音乐片段中确定所述乐节时,一个乐节可以从一个音乐片段中确定,另一乐节可以从另一个音乐片段中确定。因此,来自所述音乐片段中的至少两个音乐片段的乐节可以被确定。换句话说,所述概观可以包含源自所述音乐片段中的至少两个的乐节。因此,可以把它视为反映所述集合或其一部分的内容的摘要。
另外,可以确定所述音乐片段中的每一个的至少一个乐节。替代地,为了生成短的摘要,可以从所述音乐片段中的每一个中确定至多一个乐节。这允许收听者获得例如对所述集合的最相关项的快速概观。
可以根据作为生成所述概观的基础的目的来确定乐节.典型的乐节可能对概括音乐片段集合特别感兴趣。因此,相应的音乐片段的有代表性的部分可以被得到,例如合唱、副歌、和/或歌声.乐节还可以被确定以便代表性地概括音乐片段,例如如果所述音乐片段包含可被认为是平静的章节以及可被认为是充满活力的其它章节,那么来自两个章节的乐节可以被确定/选择.
还可以根据生成概观的目的来将乐节布置在一个序列中。例如,所述乐节可以被布置在反映所述音乐片段的有序列表、例如播放列表的顺序的所述序列中.这导致集合中所包含的音乐片段的内容以及顺序的概观.替代地,乐节可以被布置在一个随机的序列中.这导致随机化,保证例如在随后浏览或访问同一目录或文件夹时不重复地产生相同的序列。此外,用于布置所述乐节的其它选项可能是感兴趣的。为了迅速引起用户的注意,在该序列的开头布置源自该集合中的人所共知的音乐片段的乐节可能是合适的.如果例如所述音乐集合包含流行歌曲,那么所述人所共知的音乐片段可以是被置于实际命中列表的顶部的歌曲,其中所述列表可以例如从因特网自动地下载。在另一例子中,如果所述音乐集合反映电影的声带(soundtrack),那么所述人所共知的音乐片段可以包含介绍性的主题.在又一例子中,如果所述集合包含另一年代、例如七十年代的歌曲,那么可被认为是常青树的歌曲就可以被置于该概观的开头。用于布置的另一标准可以是乐节的类型。例如,具有歌声的乐节可以被布置在该序列的开头,并且后面可以是包含副歌的那些乐节。另外,在布置乐节时可以考虑节拍,例如可以布置乐节,使得连续的乐节的节奏或步调相互匹配,或者产生一种在节奏上引人注意的效果。
在布置所述乐节时另一重要的问题可能是音乐片段和/或乐节的多样性。为了获得该集合的快速的概观,可以选择来自最多样的音乐片段的乐节。此外,可以在不考虑音乐片段的多样性的情况下选择乐节,但是把源自最多样的音乐片段的乐节放置在该概观的开头。在概观中反映音乐片段和/或乐节的多样性的又一方式是确定所选择的乐节的多样性并把最多样的乐节置于开头。确定音乐片段和/或乐节的多样性以及在布置中考虑该多样性的各种不同方式将在下文中进行讨论。
为了在布置在所述序列中的乐节之间实现平滑的过渡,可以应用渐变过程.这可以是在该序列的开头的渐强、在该序列的结尾的渐弱和/或关于该序列中的两个连续乐节的信号的交叉渐变.这种渐变还可以包括例如通过韵律的在所述连续乐节的基调之间的调制.所述调制还可以通过组合所述连续乐节的旋律的至少部分或者组合节奏的至少部分来执行.在后一种情况下,节奏的组合可能导致乐节之间的速率、例如各乐节的速度或步调的同化,其中所述速度或步调例如可以以每分钟的节拍来测量。
根据本发明的所述实施例所生成的概观允许用户方便地浏览大的音乐集合,因为它可以提供作为基础的音乐数据的简短的、非视觉的印象。可以通过组合来自不同源的曲调或章节的混合曲来提供该概观.
为了便于浏览,可以为包含音乐数据的大量容器、例如目录、文件夹、播放列表、音乐风格选择器、或艺术家选择器生成概观.这允许例如在用户期望向朋友介绍最新分类的播放列表或者研究最近知晓的艺术家的音乐以获得有关作品的第一概观时给出或获得这样的容器的快速概观.
混合曲可以被预先计算,以便在浏览期间提高性能。一旦被预先计算,该混合曲就可以与所述容器一起被存储,并且当用户选择或进入所述容器时可以从数据存储器中检索该混合曲并向他/她播放该混合曲。
替代地,可以在向用户播放混合曲之前、例如当该用户选择容器或进入目录时生成该混合曲.这种生成混合曲的方式可以被认为是“即时(on the fly)”或“按需(on demand)”合成.这允许结果的随机化,并保证在用户随后访问相同的容器或目录时不重复相同的序列.
在图1中示出了提供音乐片段的步骤S100,其中至少两个音乐片段可以从包含音乐数据的集合中被确定,或者可以替代地从远程数据存储器例如通过因特网接收。另外,示出了确定乐节的步骤S102,其中至少两个乐节可以用以下方式被确定,即所述乐节之一源自所述音乐片段之一,并且所述乐节中的另一个源自所述音乐片段中的另一个。在这之后是布置乐节的步骤S104,其中所述乐节被布置在一个序列中.该序列可以被播放给用户,由此提供该集合的概观.
因此,按照图1的实施例,可以生成概观,其包括源自至少两个音乐片段的至少两个乐节。该概观可以为不同的目的、例如为了概括目录的内容、为了给出用户可能计划收听的或者令人愉快地吸引用户注意他可能有兴趣购买的包含音乐数据的捆绑套装(bundle)的播放列表、音乐风格选择器、或艺术家选择器的内容的快速印象而生成.
图2示出本发明的另一实施例,其中通过提供步骤S200来提供音乐片段。如上所述,该提供可以包括从音乐数据集合中确定所述音乐片段,或者从可能远程的数据存储器接收音乐数据。
然后,在之后的音乐片段聚类步骤S202中,所述音乐片段可以根据音乐片段量度被聚类。所述音乐片段量度可以描述相应音乐片段的至少一个特性.所述音乐片段量度可以用数字来表示或者通过类别来指示,并且可以被限制于一维,或者可以替代地包含多维表示。由所述音乐片段量度反映的所述属性可以涉及所述音乐片段的特征或特色,或者可以涉及属性、例如音乐风格、时期、作曲者、或演奏艺术家。它可以是当收听所述音乐片段时由用户感觉到的可听特性。替代地或附加地,所述音乐片段量度可以从所述音乐片段的信号频谱例如通过计算Mel频率倒谱系数(MFCC)来确定。
在所述音乐片段聚类步骤S202中,所述音乐片段量度可以被用于确定所述音乐片段之间的距离.为此,可以使用已知的距离量度之一,例如欧几里德距离或Mahalanobis距离。根据所述距离量度,所述音乐片段可以在音乐片段群集中被聚类.为此可以使用分级或分区的聚类算法。
之后的乐节确定步骤S204然后可以涉及所述音乐片段的聚类。例如,可以从每个音乐片段群集中确定至少一个乐节,从而保证基本上每个音乐片段群集都在所述混合曲中被表示。另外,可以选择来自在音乐片段群集的质心附近的音乐片段的乐节,因而实现对可以被认为代表所述音乐片段群集的乐节的选择。这种选择被认为有代表性的乐节的方式将在下文中详细描述。
在另一实施例中,例如通过对属于相应音乐片段群集的音乐片段的数目进行计数,或者通过对相应音乐片段群集中所包含的每个音乐片段的相应播放时间进行求和,可以确定所述音乐片段群集中的每一个的大小。在所述乐节确定步骤S204中,所述乐节在这种情况下可以根据所述大小来确定.例如,可以确定乐节,使得在所述序列中,被分配给源自相应音乐片段群集的音乐片段的乐节的时间量与它的大小相对应。例如可以确定由相应音乐片段群集的音乐片段所贡献的总播放时间的百分比。然后,在乐节确定步骤S204中,可以利用与所述百分比相对应的播放时间量来选择所述相应音乐片段群集的音乐片段的乐节,其中该时间涉及所述概观的预期的或预定的播放时间。例如,如果一个音乐片段群集包含贡献总播放时间的约30%的音乐片段,并且应生成总长度为100秒的混合曲,那么源自该音乐片段群集的乐节可以被选择为具有大约30秒的播放时间量。这可以导致集合中所包含的音乐风格的平衡表示:例如如果一个播放列表包含总播放时间为35分钟的快乐的歌曲、以及总播放时间为15分钟的悲伤的歌曲,那么可以从具有35秒的总播放时间量的快乐的歌曲和具有15秒的总播放时间量的悲伤的歌曲中确定乐节.因此,该混合曲可以反映悲伤和快乐的歌曲的这种平衡,并且用户可以获得这种平衡的快速印象。
在乐节确定步骤S204之后,在图2中示出了乐节聚类步骤S206.作为乐节聚类的基础,确定乐节量度.所述乐节量度可以描述相应乐节的至少一个特性。所述乐节量度的表示可以是数字的或者通过类别来指示,并且可以是一维的或者多维的。所述乐节量度可以涉及所述乐节的特征、特色、或者属性,例如音乐风格、时期、作曲者、或演奏艺术家.所述乐节量度还可以反映当收听所述乐节时收听者所感觉到的其它可听特性。另外,所述乐节量度可以从相应乐节的信号频谱中例如通过计算Mel频率倒谱系数(MFCC)来确定。尤其,所述乐节量度还可以取决于所述乐节所源自的相应音乐片段的所述音乐片段量度.例如,通过多维表示的一个或多个分量,所述音乐片段量度可以被合并在所述乐节量度中。在下文中,所述乐节量度可以被称为第一量度,而所述音乐片段量度可以被称为第二量度。
所述乐节量度可以被用于计算乐节之间的距离,例如通过计算欧几里德距离或Mahalanobis距离。乐节之间的所述距离然后可以被用作在乐节聚类步骤S206中使所述乐节聚类的基础,例如利用分级的或分区的聚类算法。
在这种情况下,可以根据所述乐节的聚类来执行乐节的布置,如在图2中的乐节布置步骤S208中所示。布置所述乐节的方式可以取决于生成混合曲的目的.
例如如果生成该混合曲以便提供关于目录或文件夹的内容的快速概观,那么可能适当的是按照多样性来进行布置,把最多样的乐节放置在所述混合曲的开头。这可以通过选择具有最高距离差的乐节并把它们布置在所述序列的开头来实现.在该序列之后,可以布置具有递减的距离的乐节。替代地或者附加地,当布置乐节时,还可以考虑乐节属于哪个乐节群集。为了保证收听者获得关于所有所包含的乐节群集的快速概观,来自每个群集的一个乐节可以被置于该混合曲的开头。
所述按照多样性的布置可能适于或可能不适于生成所述混合曲,这取决于生成该混合曲的目的.一方面,它保证收听者可以获得该混合曲可表示的集合的内容的快速概观。另一方面,如果该混合曲在非常多样的乐节之间跳跃,那么它对于收听者来说可能是令人讨厌的.因此,为了生成令人愉快地收听但同时反映音乐集合的多样性的混合曲,可能适当的是在乐节布置步骤S208中把所述序列划分为属于相同群集的一个或多个乐节的子序列。换句话说,该序列可以通过将源自相同乐节群集和/或音乐片段群集的乐节的子序列进行连接而构成。这导致把少量相似的乐节分组在一个子序列中,该子序列可以使收听者愉快地收听,而目录的多样性通过该序列总体上来表示。
可以使用用于在乐节布置步骤S208中布置乐节的其它标准。例如,具有歌声的乐节可以优先于那些包含副歌的乐节,并且可以被分组到该混合曲的开头的一个子序列。然后,在该第一子序列之后,第二子序列包含可能随后的包括副歌的乐节。替代地,具有来自单个音乐片段的歌声和副歌的乐节可以被分组在一个子序列中,使得子序列构成相应音乐片段的简短摘要。
根据用作所述乐节聚类的基础的所述乐节量度,通过将乐节布置在子序列中并把子序列连接为单个序列的这种方式,可以获得各不相同的结果。例如,乐节可以根据它们的音乐类型来分组。然后所述布置可以反映文件夹或目录的音乐类型的分布。如果例如一个文件夹拥有很多浪漫的歌曲和仅仅少数进取型的歌曲,那么该混合曲可以以多个浪漫的乐节开始,之后是一个或两个进取型的乐节,之后是一些更多的浪漫的乐节,等等。
在另一实施例中,可以根据从中提取所述乐节的音乐片段所属的相应群集来布置所述乐节.这可以允许选择源自可以被认为代表整个音乐片段群集的音乐片段的乐节,并把它们置于开头。如前所述的按照多样性的布置允许把来自最多样的音乐片段和/或来自不同音乐片段群集的乐节布置在开头,从而保证收听者获得基本上所有现有的音乐片段群集的快速概观.另外,当所述乐节的子序列在所述序列中被构建并被连接时,可以考虑所述音乐片段聚类.因此,可以实现乐节的布置,包含来自同一音乐片段群集的乐节子序列。
图3示出本发明的一个实施例,其中目录300拥有歌曲A和歌曲B.作为一个例子,在对这种情况没有任何限制的情况下,从歌曲A中选择了第一乐节306.另外,从歌曲B中选择第二乐节308和第三乐节310。这些乐节通过布置模块312来布置,其中该布置模块可以根据前面所讨论的标准来执行布置。于是所得到的混合曲314包括所布置的乐节的序列.在该例子中,该序列包含第一个被放置的处理后的乐节308'、第二个被放置的处理后的乐节306'、以及第三个被放置的处理后的乐节310'。如在该例子中通过长度所示,第一个被放置的处理后的乐节308'可以是例如通过应用渐变过程而从第二乐节308得到的,第二个被放置的处理后的乐节306'可以是从第一乐节306得到的,而第三个被放置的处理后的乐节310'可以是从第三乐节310得到的。乐节308也可以等于或基本上等于乐节308',乐节306也可以等于或基本上等于乐节306',等等.
图4示出根据本发明的另一实施例的乐节聚类。在该实施例中,作为一个例子并且在对这种情况没有限制的情况下,乐节根据它们每分钟的平均节拍被聚类。所述每分钟的平均节拍被用作乐节量度(第一量度),其通过轴400上的一维参数来表示.在轴400上,相应乐节用叉号402-1、...、402-12来指示.把乐节聚类为乐节群集SC1、SC2、和SC3用方括号404-1、...、404-6来指示。根据所述聚类来布置乐节的可能结果在图4的下面部分中示出,该部分描绘了混合曲406形式的概观,其中处理后的乐节402-1'、...、402-12'被分组在子序列410-1、...、410-5中,这些子序列包含来自乐节群集SC1、SC2、SC3中的同一相应乐节群集的乐节。在该例子中,子序列410-1包含处理后的乐节402-1'、402-3'、和402-6',其可以是从属于乐节群集SC1的乐节402-1、402-3和402-6得到的.相应地,子序列410-2包含从属于乐节群集SC3的乐节得到的处理后的乐节,等等。
在图5中,示出了本发明的另一实施例的音乐片段505-1、...、505-n的聚类.根据音乐片段量度来执行所述音乐片段聚类,在该例子中,该音乐片段量度包含两个参数,这两个参数被绘制于由第一轴502和第二轴504所定义的二维坐标系统中。音乐片段505-1、...、505-n通过小点来绘制(也请参见在图5右手侧的图例).如可以看到的,音乐片段505-1、...、505-n被分配给音乐片段群集MPC1、MPC2、MPC3。每个音乐片段群集MPC1、MPC2、MPC3都具有相应的质心508-1、508-2、508-3,其被绘制为小叉号.质心508-1、508-2、508-3可以被认为是相应音乐片段群集的中心,并且可以被确定为这样一个点,即该群集中的所有点到该点的偏移之和为零.对于每个音乐片段群集MPC1、MPC2、MPC3,位于相应质心508-1、508-2、508-3附近的音乐片段通过小的环绕的圆来突出显示(也请再次参见图5的图例)。例如,在音乐片段群集MPC1中,音乐片段505-3、505-4、505-5、505-6可以被认为是位于质心508-1附近,并且因此可以被认为是音乐片段群集MPC1的根据形成音乐片段聚类的基础的参数的代表性组成部分。音乐片段群集的代表性组成部分还可以被认为是代表性音乐片段。
确定音乐片段群集MPC1、MPC2、MPC3的代表性音乐片段可以包括确定所述音乐片段群集的与相应质心的距离小于预定阈值的所有组成部分。作为一个例子,音乐片段群集MPC1的阈值510通过图5中的虚线来描绘。该阈值510可以被用作用于确定代表性音乐片段505-3、...、505-6的基础。替代地或者附加地,确定相应音乐片段群集的代表性组成部分可以包括确定属于与相应质心的距离最小的预定百分比的音乐片段的百分位数的所有组成部分。
此外,为了确定音乐片段群集MPC1、MPC2、MPC3的质心508-1、508-2、508-3,当考虑属于该群集的音乐片段时,可以例如通过它们的相应播放时间来对音乐片段量度的参数进行加权。例如,当确定音乐片段群集MPC1的质心508-1时,可以考虑音乐片段505-1、...、505-8的相应播放时间.在这种情况下,这种加权还可以对音乐片段群集MPC1、MPC2、MPC3的代表性组成部分的确定具有影响。
音乐片段群集MPC1、MPC2、MPC3的代表性音乐片段的确定可以影响乐节确定步骤S204.例如,可以仅仅从代表性音乐片段中、例如从音乐片段群集MPC1的代表性音乐片段505-3、505-4、505-5、505-6中以及从音乐片段群集MPC2和MPC3的代表性片段中选择乐节.此外,可以允许从代表性音乐片段中选择长的乐节,和/或限制来自未被识别为有代表性的音乐片段的乐节的长度.
另外,代表性音乐片段的识别可能影响图2中的乐节布置步骤S208.在此,源自代表性音乐片段的乐节可以被置于该序列的开头。
图6示出用于提供音乐片段概观的装置600的一个实施例。装置600包含数据存储器602、数据处理器604、音频输出单元606、以及扬声器608。
在该实施例中,音乐数据可以被存储在数据存储器602中。当应用用于生成音乐片段概观的方法时,例如按照图2在提供步骤S200中,在装置600中可以使用所述音乐数据。另外,数据存储器602可以包含与所述音乐数据有关的元数据。当应用所述用于生成音乐片段概观的方法时,例如在图2中所描绘的音乐片段聚类步骤S202中或者在乐节聚类步骤S206中,也可以使用所述元数据。在这些步骤中,元数据可以被用作用于计算所述音乐片段量度(第二量度)和/或所述乐节量度(第一量度)的基础.这些量度可以例如完全地通过元数据来定义,或者替代地,仅仅第一和/或第二量度的多维表示的一部分分量可以从所述元数据得到.在又一替代方案中,元数据可以被用作计算所述第一和/或第二量度的基础。
该数据处理器604可以被配置用于例如通过从数据存储器602中检索音乐数据来提供音乐片段.另外,数据处理器604可以负责从所述音乐片段中确定乐节,并负责将所述乐节布置在一个序列中。数据处理器604还可以执行另外的支持步骤,例如确定音乐片段量度并根据该量度来使音乐片段中的至少一些聚类。数据处理器604也可以执行乐节量度以及根据该乐节量度的乐节聚类。可以通过从数据存储器602检索元数据来执行或者至少部分地支持所述音乐片段量度的确定以及所述乐节量度的确定。另外,数据处理器604可以对通过布置而获得的乐节序列应用渐变过程,以便平滑乐节之间的过渡。
所得到的概观或混合曲然后可以被存储在数据存储器602中,或者可以被传输到音频输出单元606.音频输出单元606通过扬声器608输出该混合曲。
装置600可以是手持音乐存储装置、移动电话或者个人数字助理(PDA)类型的装置。它还可以是汽车音频设备或者例如用在居室或公共场所中的音频系统.
图7示出用于提供音乐片段概观的装置700的另一个实施例,该装置包含数据存储器702、数据处理器704、发送/接收单元706、音频输出单元708、以及扬声器710.数据存储器702、数据处理器704、音频输出单元708、以及扬声器710可以被配置为与图6的数据存储器602、数据处理器604、音频输出单元606、以及扬声器608相似或相同.因此,数据存储器702可以保存并提供音乐数据和有关的元数据。数据处理器704可以负责为生成混合曲而执行的所有步骤.音频输出单元708然后可以通过扬声器710向用户输出该混合曲.
附加的发送/接收单元706允许该装置700与其它的装置通信。它还可以被用于从外部数据源、例如远程数据库检索数据.例如如果该用户拥有私人的集中的数据存储器,那么这种数据库可以位于用户的环境中,或者可以通过因特网来访问。所检索的数据可以包括音乐数据和元数据。
另外,该发送/接收单元使用户能够向另一装置发送所生成的概观,例如用于向另一人呈现该混合曲作为新布置的播放列表或者新获取的光盘的摘要。如果该装置700仅仅具有有限的数据存储器702,并且如果期望通过网络来交换数据,那么该发送/接收单元706的提供可以是可选的。
图8示出用于提供音乐片段概观的一种可能的用户界面.示出了手持装置800,给用户提供图形用户界面802。图形用户界面802可以提供显示屏和触摸垫功能。另外,用户命令可以通过键盘804来输入,该键盘包含用于在音乐片段列表中开始和停止音乐数据的回放的键805-1、用于暂停的键805-2、用于快进的键805-3以及用于快退的键805-4.另外,示出键805-5和805-6,用于确定输出音量。当在包含音乐片段列表的文件夹结构中导航时,键805-7允许返回前一项,键805-8允许选择下一项,键805-9允许向上移动一级,并且805-10允许向下移动一级。
在图形用户界面802中,示出了几个目录806-1、806-2、播放列表806-3、806-4和风格选择器806-5、806-6。在进入目录806-1之前,用户可以选择“播放摘要”按钮807。在选择时,目录806-1的音乐数据的混合曲可以例如通过头戴耳机或扬声器(二者在图8中未示出)被播放给该用户。该用户然后可以决定是否进入该目录。如果他/她不喜欢该摘要,那么他/她可以转到下一或前一容器、例如目录、播放列表、或文件夹,或者如果目录以分级的方式被构造,那么他/她可以向上一级。
在图8中所示的例子中,还为播放列表806-3、806-4以及风格选择器806-5、806-6提供了用于播放摘要的选项。在后一情况下,将呈现由相同风格的歌曲构成的混合曲。
因此,手持装置800使用户能够方便地浏览音乐集合,给他提供目录、播放列表、文件夹、和/或风格选择器的内容的快速印象。这可以允许用户决定该内容是否符合他的口味/当前的心情和/或选择是否可能是正确的选择。
在另一实施例中,文件夹/目录可以是在线音乐商店的目录。如果该用户喜欢该混合曲,那么他/她可能想购买该文件夹/目录的所有或至少部分的歌曲。
为了与其它装置、例如外部数据存储器或另外的音频装置通信,附加地提供了网络访问812.
图9示出用于提供音乐片段概观的装置900的另一实施例.装置900仅允许受限制的用户交互:用户界面包含小的、单行的显示屏902以及有限数目的具有预定功能的键903。音频输出通过扬声器904来支持。装置900可以是汽车音频设备的部分.
浏览大的音乐集合或者选择文件夹或播放列表来进行收听在这种环境中对于用户来说可能是单调乏味和痛苦的任务。如果高分辨率的图形界面不可用,那么有限的视觉显示建立对通过音频信号来交换信息的需要。作为音频数据的摘要而生成的、并提供文件夹或播放列表的内容的非视觉概观的混合曲可能是支持用户使用该装置的一个重要信息。
具有受限制的用户界面的音频系统可以在汽车中找到,在汽车中驾驶员的视觉注意力转向周围的交通,并且驾驶员的额外的分心是不可接受的.具有受限制的用户交互的音频装置的另一例子是在居室环境中所使用的高保真(hi-fi)系统。在此,通常仅仅小的显示屏、有限数目的键、以及具有有限数目的按钮的附加遥控器是可用的。
图10示出包含客户机100和服务器1002的本发明的另一实施例。客户机100包含数据处理器1010、数据存储器1012、以及发送接收单元1014.服务器1002包含发送/接收单元1022、数据处理器1024、以及数据库1026.
数据处理器1010可以负责生成混合曲.用作混合曲生成的基础的音乐数据可以从位于客户机1000处的数据存储器1012检索。替代地或者附加地,音乐数据可以从服务器1002检索.为此,客户机1000可以使用它的发送/接收单元1014来发送对音乐数据的请求.该请求被该服务器1002的发送/接收单元1022接受.然后该请求被数据处理器1024处理,该处理器从数据库中检索所请求的数据,并通过相应的发送/接收单元1022和1014将该数据发送回该客户机1000。客户机1000的数据处理器1010然后可以生成包含所检索的音乐数据的混合曲。如果需要附加的信息来生成该混合曲,那么可以从本地数据存储器1012或从位于服务器1002上的数据库1026检索该信息。这种附加的信息可以包括与要生成的混合曲的音乐片段有关的元数据。所述元数据可以自动地被预先计算/确定或被手动标注,并且可以被集中地例如存储在可以通过因特网访问的大的音乐数据库中。该元数据然后例如可以被用作在乐节聚类步骤S206中确定所述第一量度和/或在音乐片段聚类步骤S202中确定所述第二量度的基础。
因此,在图10中所示的客户机-服务器体系结构使客户机能够访问大的音乐数据库,以便检索可以被用于例如通过生成混合曲来提供音乐片段概观的音乐数据和/或元数据.在检索到所需数据之后,该客户机1000的数据处理器1010可以例如按照如图1或图2中所述的步骤生成混合曲。
此外,该客户机1000可以仅仅向服务器1002发送生成混合曲的请求。该请求可以包含关于如何生成该混合曲的另外的信息、例如应被并入到该混合曲中的音乐片段的标题列表。该请求可以通过该客户机的发送/接收单元1014来发送,并且可以通过该服务器的发送/接收单元1022来接收。生成该混合曲的计算负荷在这种情况下将由服务器1002来承担。在这种情况下,用于生成该混合曲的步骤可以由服务器1002的处理器1024例如按照在图1或图2中所描绘的步骤来执行。在生成之后,该混合曲可以由服务器1002的发送/接收单元1022发送给客户机1000的发送/接收单元1014。然后它可以被播放给客户机1000的用户,并且,如果需要,那么可以被存储在本地数据存储器1012中。
图11示出具有客户机-服务器体系结构的本发明的另一实施例.在此,该客户机通过个人计算机1101来实现,该个人计算机包括显示器1102。通过因特网1103,客户机1101被连接到服务器1104,该服务器包含数据处理器1106、数据存储器1108、以及传输单元1110.
在图11中所描绘的例子中,该服务器1104提供对在线音乐商店的访问.该客户机1101的显示器1102显示该在线音乐商店的图形用户界面.在此,可以提供歌曲集合。用户可以在把集合添加到他的购物车之前请求播放套餐(package)的摘要.这样做时,他/她可以获得该套餐的内容的快速印象,并且可以决定是否购买该套餐。在该例子中,每个套餐的摘要可以包含按照图1或2中所描绘的步骤而生成的该套餐的概观.
上述的实施例还可以用在用于生成混合曲的方法中.例如,用户可能完全不想收听某一目录/播放列表的歌曲。在这种情况下,上述的原理可以被用于生成用户能够喜爱的混合曲,其中该混合曲仅仅包含该目录/播放列表的歌曲的部分。换句话说,该混合曲包含重新布置的乐节,例如在图3中所示的乐节308'、306'、310'或者在图4的下部所示的乐节408-1、408-2、...。

Claims (19)

1.用于提供音乐片段概观的方法,包括:
提供至少两个音乐片段;
确定所述音乐片段的至少两个乐节,其中所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从所述音乐片段中的另一个中确定;以及
将所述乐节布置在一个序列中.
2.根据权利要求1所述的方法,其中为所述乐节确定第一量度,所述第一量度描述相应乐节的至少一个第一特性,并且根据所述第一量度来布置所述乐节.
3.根据权利要求2所述的方法,其中根据所述第一量度来确定所述乐节中的至少两个之间的距离,并且所述乐节中的所述至少两个中的第一乐节和所述乐节中的所述至少两个中的第二乐节被布置在所述序列的开头,所述第一乐节和所述第二乐节在所有的所述乐节中的所述至少两个中具有最高的距离差。
4.根据权利要求3所述的方法,其中执行第一聚类,根据所述第一量度把所述乐节划分为乐节群集,并且其中根据所述第一聚类将所述乐节布置在所述序列中.
5.根据权利要求4所述的方法,其中所述序列包括至少一个子序列,所述子序列包括属于所述乐节群集中的相同乐节群集的所述乐节中的至少两个。
6.根据前述权利要求中任一所述的方法,其中为所述音乐片段中的至少一个确定第二量度,所述第二量度描述相应音乐片段的至少一个第二特性,并且执行第二聚类,根据所述第二量度把所述音乐片段划分为音乐片段群集,并且其中根据所述第二聚类来确定所述乐节。
7.根据权利要求6所述的方法,其中从所述音乐片段中的代表性音乐片段中确定所述乐节中的至少一个代表性乐节,所述代表性音乐片段位于相应音乐片段群集的质心的附近。
8.根据权利要求7所述的方法,其中所述至少一个代表性乐节被布置在所述序列的开头.
9.根据权利要求6至8中任一所述的方法,其中确定所述音乐片段群集中的每一个的大小,并且其中根据所述大小来确定所述乐节,使得在所述序列中,为源自相应音乐片段群集中的音乐片段的乐节所分配的时间量与它的大小相对应.
10.根据权利要求2至9中任一所述的方法,其中所述第一特性和/或所述第二特性是可听特性.
11.根据权利要求2至10中任一所述的方法,其中根据元数据来确定所述第一量度和/或所述第二量度,所述元数据被预先计算和/或被手动标注.
12.根据前述权利要求中任一所述的方法,其中所述乐节至少包含相应音乐片段的代表性部分、合唱、副歌、和/或歌声。
13.根据前述权利要求中任一所述的方法,其中对所述乐节中的至少一个应用渐变过程.
14.根据前述权利要求中任一所述的方法,其中在向用户播放混合曲之前,生成或预先计算并从数据存储器中检索所述混合曲.
15.音乐回放装置,包括:
数据存储器,被配置用于存储至少两个音乐片段;
数据处理器,被配置用于确定所述音乐片段的至少两个乐节,所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从所述音乐片段中的另一个中确定,以及用于将所述乐节布置在一个序列中。
16.根据权利要求15所述的装置,还包括发送/接收单元,该发送/接收单元被配置用于接收所述至少两个音乐片段和/或元数据,该元数据描述所述音乐片段中的至少一个的至少一个特性。
17.系统,包括:
服务器,包括数据库,该数据库包含音乐片段和/或描述所述音乐片段的至少一个特性的元数据;以及
客户机,包括:
发送/接收机构,被配置用于接收所述服务器的所述音乐片段中的至少两个和/或所述元数据;
数据处理器,被配置用于确定所述音乐片段的至少两个乐节,所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从所述音乐片段中的另一个中确定;以及用于将所述乐节布置在一个序列中。
18.系统,包括:
服务器,包括:
数据库,该数据库包含至少两个音乐片段和/或描述所述音乐片段的至少一个特性的元数据;
数据处理器,被配置用于确定所述音乐片段的至少两个乐节,所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从所述音乐片段中的另一个中确定,以及用于将所述乐节布置在一个序列中;
发送/接收机构,被配置用于发送所述序列;以及
客户机,包括:
发送/接收机构,被配置用于接收所述服务器的所述序列。
19.一种计算机可读介质,包括使计算机执行用于生成混合曲的方法的计算机程序指令,包括:
提供至少两个音乐片段;
确定所述音乐片段的至少两个乐节,其中所述乐节中的第一乐节从所述音乐片段之一中确定,并且所述乐节中的第二乐节从所述音乐片段中的另一个中确定;以及
将所述乐节布置在一个序列中。
CN200810168167.3A 2007-09-28 2008-09-28 用于提供音乐片段概观的方法和装置 Expired - Fee Related CN101399037B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP07019202.6 2007-09-28
EP07019202A EP2043006A1 (en) 2007-09-28 2007-09-28 Method and device for providing an overview of pieces of music

Publications (2)

Publication Number Publication Date
CN101399037A true CN101399037A (zh) 2009-04-01
CN101399037B CN101399037B (zh) 2014-01-01

Family

ID=39705237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810168167.3A Expired - Fee Related CN101399037B (zh) 2007-09-28 2008-09-28 用于提供音乐片段概观的方法和装置

Country Status (3)

Country Link
US (1) US7868239B2 (zh)
EP (1) EP2043006A1 (zh)
CN (1) CN101399037B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103871433A (zh) * 2012-12-10 2014-06-18 联想(北京)有限公司 一种控制方法及电子设备

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1975866A1 (en) 2007-03-31 2008-10-01 Sony Deutschland Gmbh Method and system for recommending content items
EP2101501A1 (en) * 2008-03-10 2009-09-16 Sony Corporation Method for recommendation of audio
US20110078323A1 (en) * 2009-09-29 2011-03-31 Wooden Richard D Rules-based user preferences for stream switching in an internet radio player
KR20140102656A (ko) 2011-10-24 2014-08-22 옴니폰 리미티드 디지털 미디어 콘텐트를 내비게이트하는 방법, 시스템 및 컴퓨터 프로그램 제품
US11468243B2 (en) 2012-09-24 2022-10-11 Amazon Technologies, Inc. Identity-based display of text
US9570059B2 (en) 2015-05-19 2017-02-14 Spotify Ab Cadence-based selection, playback, and transition between song versions
US9824719B2 (en) 2015-09-30 2017-11-21 Apple Inc. Automatic music recording and authoring tool
US9852721B2 (en) 2015-09-30 2017-12-26 Apple Inc. Musical analysis platform
US9804818B2 (en) 2015-09-30 2017-10-31 Apple Inc. Musical analysis platform
US9672800B2 (en) * 2015-09-30 2017-06-06 Apple Inc. Automatic composer
US11989202B2 (en) * 2021-11-22 2024-05-21 International Business Machines Corporation Realtime viewer in cloud storage environments

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7075000B2 (en) * 2000-06-29 2006-07-11 Musicgenome.Com Inc. System and method for prediction of musical preferences
JP4646099B2 (ja) * 2001-09-28 2011-03-09 パイオニア株式会社 オーディオ情報再生装置及びオーディオ情報再生システム
US20030205124A1 (en) * 2002-05-01 2003-11-06 Foote Jonathan T. Method and system for retrieving and sequencing music by rhythmic similarity
US7208672B2 (en) * 2003-02-19 2007-04-24 Noam Camiel System and method for structuring and mixing audio tracks
US7521623B2 (en) * 2004-11-24 2009-04-21 Apple Inc. Music synchronization arrangement
US7189913B2 (en) * 2003-04-04 2007-03-13 Apple Computer, Inc. Method and apparatus for time compression and expansion of audio data with dynamic tempo change during playback
US20040254660A1 (en) * 2003-05-28 2004-12-16 Alan Seefeldt Method and device to process digital media streams
US7026536B2 (en) * 2004-03-25 2006-04-11 Microsoft Corporation Beat analysis of musical signals
US7592534B2 (en) * 2004-04-19 2009-09-22 Sony Computer Entertainment Inc. Music composition reproduction device and composite device including the same
DE102004047069A1 (de) * 2004-09-28 2006-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ändern einer Segmentierung eines Audiostücks
DE102004047032A1 (de) * 2004-09-28 2006-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bezeichnen von verschiedenen Segmentklassen
JP4329697B2 (ja) * 2005-01-12 2009-09-09 ヤマハ株式会社 音楽再生装置および同装置に適用されるコンピュータ読み取り可能な音楽再生プログラム
KR20070116853A (ko) 2005-03-04 2007-12-11 뮤직아이피 코포레이션 플레이리스트를 작성하기 위한 스캔 셔플
JP4345697B2 (ja) * 2005-03-22 2009-10-14 ヤマハ株式会社 自動演奏データ処理装置および自動演奏データ処理方法を実現するためのプログラム
CN1881411A (zh) * 2005-06-17 2006-12-20 鸿富锦精密工业(深圳)有限公司 一种播放列表生成系统及方法
US7518053B1 (en) * 2005-09-01 2009-04-14 Texas Instruments Incorporated Beat matching for portable audio
US20070074618A1 (en) * 2005-10-04 2007-04-05 Linda Vergo System and method for selecting music to guide a user through an activity
US20070124293A1 (en) * 2005-11-01 2007-05-31 Ohigo, Inc. Audio search system
KR100725018B1 (ko) * 2005-11-24 2007-06-07 삼성전자주식회사 음악 내용 자동 요약 방법 및 그 장치
WO2007105180A2 (en) * 2006-03-16 2007-09-20 Pace Plc Automatic play list generation
US7521620B2 (en) * 2006-07-31 2009-04-21 Hewlett-Packard Development Company, L.P. Method of and system for browsing of music
US20080097633A1 (en) * 2006-09-29 2008-04-24 Texas Instruments Incorporated Beat matching systems

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103871433A (zh) * 2012-12-10 2014-06-18 联想(北京)有限公司 一种控制方法及电子设备
CN103871433B (zh) * 2012-12-10 2019-11-26 联想(北京)有限公司 一种控制方法及电子设备

Also Published As

Publication number Publication date
EP2043006A1 (en) 2009-04-01
CN101399037B (zh) 2014-01-01
US20090084249A1 (en) 2009-04-02
US7868239B2 (en) 2011-01-11

Similar Documents

Publication Publication Date Title
CN101399037B (zh) 用于提供音乐片段概观的方法和装置
US9268812B2 (en) System and method for generating a mood gradient
US7613736B2 (en) Sharing music essence in a recommendation system
US20090063971A1 (en) Media discovery interface
US20170300567A1 (en) Media content items sequencing
US6605770B2 (en) Play list generation device, audio information provision device, audio information provision system, method, program and recording medium
US8260760B2 (en) Content providing apparatus, content providing system, web site changing apparatus, web site changing system, content providing method, and web site changing method
JP5533868B2 (ja) コンテンツ推薦システム、コンテンツ推薦方法、コンテンツ推薦装置及び情報記憶媒体
US9171001B2 (en) Personalized playlist arrangement and stream selection
US20060224260A1 (en) Scan shuffle for building playlists
US10506268B2 (en) Identifying media content for simultaneous playback
JP2022529028A (ja) デジタル資産へのアクセスの管理
US12118267B2 (en) Automatically generated media preview
EP2208149A2 (en) Classifying a set of content items
KR100978689B1 (ko) 미디어 선택 방법 및 시스템
JP2003015666A (ja) プレイリスト生成装置、オーディオ情報提供装置、オーディオ情報提供システムおよびその方法、プログラム、記録媒体
CN106775567B (zh) 一种音效匹配方法及系统
JP4916945B2 (ja) 楽曲情報付与サーバ、端末、及び楽曲情報付与システム
Lehtiniemi et al. Evaluation of automatic mobile playlist generator
JP2012208367A (ja) 楽曲再生システム及び楽曲再生プログラム
JP2008234672A (ja) コンテンツ提供装置およびコンテンツ提供システム
Karydis et al. Augmenting virtual-reality environments with social-signal based music content
WO2024020497A1 (en) Interface customized generation of gaming music

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140101

Termination date: 20150928

EXPY Termination of patent right or utility model