CN111399745A - 音乐播放方法、音乐播放界面生成方法及相关产品 - Google Patents

音乐播放方法、音乐播放界面生成方法及相关产品 Download PDF

Info

Publication number
CN111399745A
CN111399745A CN202010223115.2A CN202010223115A CN111399745A CN 111399745 A CN111399745 A CN 111399745A CN 202010223115 A CN202010223115 A CN 202010223115A CN 111399745 A CN111399745 A CN 111399745A
Authority
CN
China
Prior art keywords
beats
beat
music
music playing
playing interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010223115.2A
Other languages
English (en)
Other versions
CN111399745B (zh
Inventor
鲁霄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN202010223115.2A priority Critical patent/CN111399745B/zh
Publication of CN111399745A publication Critical patent/CN111399745A/zh
Application granted granted Critical
Publication of CN111399745B publication Critical patent/CN111399745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/40Rhythm

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

本申请提供了一种音乐播放方法、音乐播放界面生成方法及相关产品,音乐播放方法应用于具有屏幕的电子设备,包括:在屏幕上显示音乐播放界面,其中,音乐播放界面展示了音乐的多个节拍以及多个节拍中每个节拍的颜色;接收用户在屏幕上的触摸输入,获取触摸输入对应的目标节拍,其中,目标节拍属于多个节拍;从目标节拍开始播放音乐。

Description

音乐播放方法、音乐播放界面生成方法及相关产品
技术领域
本申请涉及多媒体技术领域,尤其涉及一种音乐播放方法、音乐播放界面生成方法及相关产品。
背景技术
音乐,虽然只由几个的简单音符组成,但是却可以为听众展示出一个包罗万象的世界。随着手机、电脑等智能设备的日渐普及,人们可以通过各种音乐播放器实现音乐在线听,从而随时随地的享受音乐带来的美好与震撼。
音乐的聆听体验除了使用耳朵,操控感也非常重要。大多数音乐播放器的播放界面仅仅通过以时间为单位来呈现音乐的信息,比如说,播放进度条或者快进/回退按键等等,因此当用户想要反复听一首曲子的某一句或者某一段时,用户需要反复拖动进度条或者多次点击快进/回退按键才能找到用户想听的句子或者段落的位置,然后重新点击播放。这种方式通过播放进度条或者快进/回退按键播放音乐的方式,不仅浪费时间,而且还无法实现播放位置的准确定位,从而降低了用户的舒适度。
发明内容
本申请实施例公开了一种音乐播放方法、音乐播放界面生成方法及相关产品。
第一方面,本申请提供了一种音乐播放方法,应用于具有屏幕的电子设备,包括:
在所述屏幕上显示音乐播放界面,其中,所述音乐播放界面展示了音乐的多个节拍以及所述多个节拍中每个节拍的颜色;
接收用户在所述屏幕上的触摸输入,获取所述触摸输入对应的目标节拍,其中,所述目标节拍属于所述多个节拍;
从所述目标节拍开始播放所述音乐。
在本申请具体的实施例中,所述音乐播放界面包括多个图形,其中,所述多个节拍通过所述多个图形进行表示,所述多个节拍中每个节拍的音色通过图形的颜色进行表示,所述多个图形与所述多个节拍存在一一对应关系,并且,节拍的音色相同或者相近时,图形的颜色相同或者相近;所述播放界面中的目标节拍为所述用户根据所述音乐中的多个节拍以及所述多个节拍中每个节拍的音色确定的。
在本申请具体的实施例中,所述音乐播放界面展示了音乐的多个节拍,包括:根据所述音乐的频谱特征,得到节拍拍点位置,其中,所述节拍拍点位置与所述频谱特征中的局部峰值点一一对应;根据所述节拍拍点位置,将所述音乐切分为所述多个节拍,并将所述多个节拍进行编号;将所述多个节拍按照所述编号的顺序显示在所述音乐播放界面上。
在本申请具体的实施例中,所述音乐播放界面展示了所述多个节拍中每个节拍的颜色,包括:获取所述多个节拍中每个节拍的音色特征向量;通过k均值聚类算法对所述每个节拍的音色特征向量进行聚类;将聚类后的节拍进行颜色对应,并将所述聚类后的节拍的颜色显示在所述音乐播放界面上,其中,不同颜色对应不同的所述聚类后的节拍。
可以看出,利用上述方法使得用户不仅能够根据节拍来选定音乐的播放位置,还可以根据节拍来控制音乐的播放进度。因此,当用户点击音乐播放界面中的图形时,上述方法通过判断该图形对应的节拍从而确定音乐的播放位置,并从该位置开始播放音乐。相比于音乐播放进度条或者快进/回退按键来说,利用上述音乐播放方法播放音乐不仅增强了交互感和娱乐性,还方便用户了解待播放音乐的节拍信息以及音色信息,从而使得用户可以快速且精准地定位到需要播放的位置。
第二方面,本申请提供了一种音乐播放界面生成方法,包括:
获取音乐的多个节拍及节拍拍点位置,并将所述多个节拍进行编号;
根据所述多个节拍,得到所述多个节拍中每个节拍的特征向量,并对所述每个节拍的特征向量进行聚类;
对聚类后的节拍进行颜色对应,其中,不同颜色对应不同的所述聚类后的节拍;
在音乐播放界面显示所述多个节拍以及所述聚类后的节拍的颜色。
在本申请具体的实施例中,所述获取音乐的多个节拍及节拍拍点位置,并将所述多个节拍进行编号,包括:获取所述音乐的频谱特征,得到所述节拍拍点位置,其中,所述节拍拍点位置与所述频谱特征中的局部峰值点一一对应;根据所述节拍拍点位置,将所述音乐切分为所述多个节拍,并将所述多个节拍进行编号;所述在音乐播放界面显示所述多个节拍包括:将所述多个节拍按照所述编号的顺序显示在所述音乐播放界面上。
在本申请具体的实施例中,所述对所述每个节拍的特征向量进行聚类包括:通过k均值聚类算法对所述每个节拍的特征向量进行聚类。
上述音乐播放界面生成方法中,通过获取音乐的节拍以及节拍对应的音色,从而确定音乐播放界面中用于表示该节拍的图形的位置以及图形的颜色。相比于音乐播放界面中只显示音乐播放进度条或者快进/回退按键来说,在音乐播放界面中显示节拍以及节拍的音色可以清楚地向用户展示待播放音乐的结构信息,方便用户了解待播放音乐的节拍信息以及音色信息,增强了交互感和娱乐性,而且使得用户可以根据图形的位置和颜色准确定位播放位置,提高音乐播放的效率,节省用户的时间。
第三方面,本申请提供了一种音乐播放装置,应用于具有屏幕的电子设备,包括:
显示单元,用于在所述屏幕上显示音乐播放界面,其中,所述音乐播放界面展示了音乐的多个节拍以及所述多个节拍中每个节拍的颜色;
获取单元,用于接收用户在所述屏幕上的触摸输入,获取所述触摸输入对应的目标节拍,其中,所述目标节拍属于所述多个节拍;
播放单元,用于从所述目标节拍开始播放所述音乐。
在本申请具体的实施例中,所述音乐播放界面包括多个图形,其中,所述多个节拍通过所述多个图形进行表示,所述多个节拍中每个节拍的音色通过图形的颜色进行表示,所述多个图形与所述多个节拍存在一一对应关系,并且,节拍的音色相同或者相近时,图形的颜色相同或者相近;所述播放界面中的目标节拍为所述用户根据所述音乐中的多个节拍以及所述多个节拍中每个节拍的音色确定的。
在本申请具体的实施例中,所述装置还包括节拍识别单元,所述节拍识别单元用于:获取所述音乐的频谱特征,得到节拍拍点位置,其中,所述节拍拍点位置与所述频谱特征中的局部峰值点一一对应;根据所述节拍拍点位置,将所述音乐切分为所述多个节拍,并将所述多个节拍进行编号;所述显示单元具体用于将所述多个节拍按照所述编号的顺序显示在所述音乐播放界面上。
在本申请具体的实施例中,所述装置还包括音色识别单元,所述音色识别单元用于:获取所述多个节拍中每个节拍的音色特征向量;通过k均值聚类算法对所述每个节拍的音色特征向量进行聚类;对聚类后的节拍进行颜色对应,其中,不同颜色对应不同的所述聚类后的节拍;所述显示单元还用于将所述聚类后的节拍的颜色显示在所述音乐播放界面上。
上述音乐播放装置将待播放音乐以节拍为单位进行切分,并在音乐播放界面上以带有颜色的图形的方式展示待播放音乐的节拍和节拍的音色信息,从而使得用户可以根据待播放音乐的节拍及其音色,快速且精准地确定播放位置。因此,当用户点击音乐播放界面中的图形时,音乐播放装置通过判断该图形对应的节拍从而确定音乐的播放位置,并从该位置开始播放音乐,使得用户不需要反复拖动播放进度条或者反复快进/回退来确定音乐的播放位置,节省用户的时间,提高了播放的效率,而且还可以增强用户的娱乐感以及交互感。
第四方面,本申请提供了一种音乐播放界面的生成装置,包括:
节拍识别单元,用于获取音乐的多个节拍及节拍拍点位置,并将所述多个节拍进行编号;
音色识别单元,用于根据所述多个节拍中每个节拍的特征向量,并对所述每个节拍的特征向量进行聚类;
音色识别单元还用于对聚类后的节拍进行颜色对应,其中,不同颜色对应不同的所述聚类后的节拍;
显示单元,用于在音乐播放界面显示所述多个节拍以及所述聚类后的节拍的颜色。
在本申请具体的实施例中,所述节拍识别单元具体用于:获取所述音乐的频谱特征,得到所述节拍拍点位置,其中,所述节拍拍点位置与所述频谱特征中的局部峰值点一一对应;根据所述节拍拍点位置,将所述音乐切分为所述多个节拍,并将所述多个节拍进行编号;所述显示单元具体用于将所述多个节拍按照所述编号的顺序显示在所述音乐播放界面上。
在本申请具体的实施例中,所述音色识别单元具体用于:通过k均值聚类算法对所述每个节拍的特征向量进行聚类。
上述音乐播放界面生成装置,通过识别待播放音乐的节拍信息以及节拍的音色信息,将待播放音乐的节拍显示在音乐播放界面上,并用不同的颜色对节拍的音色进行标识,方便用户清楚得知待播放音乐中的节拍、每一个节拍的音色以及音乐的结构。另外,上述音乐播放界面生成装置还使得用户可以根据图形的位置和颜色准确定位播放位置,提高音乐播放的效率,节省用户的时间。
第五方面,本申请提供了一种音乐播放装置,包括:处理器、通信接口以及存储器,所述通信接口在所述处理器的控制下与其他设备进行通信,所述处理器执行所述存储器中的代码以实现第一方面所述的任一项方法。
第六方面,本申请提供了一种音乐播放装置,包括:处理器、通信接口以及存储器,所述通信接口在所述处理器的控制下与其他设备进行通信,所述处理器执行所述存储器中的代码以实现第二方面所述的任一项方法。
第七方面,本申请提供了一种计算机存储介质,存储有计算机程序,所述计算机程序被硬件执行以实现第一方面所述的任一项方法。
第八方面,本申请提供了一种计算机存储介质,存储有计算机程序,所述计算机程序被硬件执行以实现第二方面所述的任一项方法。
附图说明
为了更清楚地说明本申请实施例涉及到的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种音乐播放界面的示意图;
图2是本申请提供的一种音乐播放界面示意图;
图3A是本申请提供的一段声音信号;
图3B是本申请提供的一种频谱差分幅度曲线图;
图4是本申请提供的一种音乐播放界面的生成方法的流程示意图;
图5是本申请提供的一种音乐播放方法的流程示意图;
图6是本申请提供的一种音乐播放界面生成装置的结构示意图;
图7是本申请提供的一种音乐播放装置的结构示意图;
图8是本申请提供的另一种音乐播放界面生成装置的结构示意图;
图9是本申请提供的另一种音乐播放装置的结构示意图。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。应当理解,本申请的实施例中使用的术语仅用于对本申请的具体实施例进行解释,而非旨在限定本申请。
为了便于理解本申请实施例,首先举例说明本申请实施例涉及到的主要应用场景:音乐播放场景。
如图1所示,图1示出了一种音乐播放界面的示意图。在如图1示出的应用场景中,当用户想要听歌曲时,用户可以点击播放按键110;当该用户听完这首歌曲并想要重新听歌曲的高潮部分,即第1.3分钟至第2.5分钟这个时间段内的歌曲时,用户需要将播放进度条120拖动至第1.3分钟,和/或,用户需要多次点击快进/回退按键130直至播放器从第1.3分钟开始重新播放该歌曲。可以看出,上述三种方法虽然都可以使得音乐播放器从第1.3分钟开始播放音乐,但是由于第1.3分钟是一个准确的时间点,当用户拖动播放进度条时,用户可能无法精准地将播放进度条120直接拖动至第1.3分钟,因此用户需要反复拖动播放进度条120才能使得播放位置定位在第1.3分钟;同样的,由于每点击一次快进/回退按键,播放位置会快进/回退5秒,因此当用户通过点击快进/回退按键130来使得播放器从第1.3分钟开始播放歌曲时,用户需要多次点击快进/回退按键。如果此时用户想要反复听这首歌曲的高潮部分,那么用户在每次听这部分之前都要通过上述繁琐的方式来将播放位置定位至第1.3分钟,不仅增加了用户的工作量,而且浪费时间。另外,由于用户需要反复多次的调整播放进度,从而使得用户听到的音乐是不连贯的,从而降低用户的舒适度。
因此,为了解决上述由于反复调整音乐的播放位置而造成的音乐不连贯以及效率低下等问题,本申请提供了一种音乐播放方法:根据音乐播放界面上显示待播放音乐的节拍及节拍对应的颜色,从而确定目标节拍的位置,然后点击目标节拍的位置便可以从目标节拍开始播放音乐。
如图2所示,图2是本申请提供的一种音乐播放界面的示意图。其中,音乐播放界面显示了多个带有颜色图形,一个图形表示一个节拍,图形的颜色表示该节拍的音色信息。当节拍的音色相同或者相近时,图形的颜色相同或者相近。下面首先介绍音乐播放界面中显示的待播放音乐的多个节拍的识别的具体过程。
一首乐曲可以由多个节拍组合而成,每个节拍又可以由多个音符组成,这些音符中包含了一个或者多个需要着重表达的音符,即强拍,相对应的,这些音符中也包含了一个或者多个弱拍。一般情况下,每个节拍大多数是从强拍开始计算的,因此通过检测一首乐曲中的强拍就可以确定这首乐曲中的节拍。
在本申请实施例中,通过计算待播放音乐在预设时刻的频谱差分幅度,从而得到待播放音乐中的节拍,具体过程如下:
步骤一,获取待播放音乐的时间轴。
步骤二,根据时间轴,计算待播放音乐在n个预设时刻的频谱差分幅度。
其中,时间轴是一条由n个时间点组成的线段,每个时间点对应一个预设时刻,并且n是正整数。以第m个预设时刻为例,第m个预设时刻的频谱差分幅度可以这样得到:首先,音乐节拍识别装置210对第m个预设时刻的声音信号进行傅里叶变换(Fast FourierTransform,FFT),得到第m个预设时刻对应的声音信号的频谱图;然后利用以下公式计算可得到第m个预设时刻的频谱差分幅度:
Figure BDA0002426764150000051
式中,m表示时间轴的索引值,1≤m≤n,N表示频率采样点的个数,N是正整数,k表示频率采样点的索引值,0≤k≤N,则在第m个预设时刻的频谱差分幅度为第m个预设时刻下所有频率采样点的总能量与第m-1个预设时刻下所有频率采样点的总能量的差值的平均值。由于FFT形成的频谱在第N/2个频率采样点处对称,因此只需要计算第0个频率采样点至第N/2个频率采样点的能量,换句话说,第m个预设时刻下的频谱差分幅度也可以表示为第m个预设时刻下N/2个频率采样点的总能量与第m-1个预设时刻下N/2个频率采样点的总能量的差值的平均值。
为了简便起见,上面只陈述了待播放音乐在第m个预设时刻的频谱差分幅度,实际上,第1个预设时刻的频谱差分幅度、第2个预设时刻的频谱差分幅度、…、第m-1个预设时刻的频谱差分幅度、第m+1个预设时刻的频谱差分幅度、…、第n个预设时刻的频谱差分幅度的计算方式与第m个预设时刻的频谱差分幅度的计算方式类似,此处不再展开具体赘述。
步骤三,判断n个预设时刻中每个预设时刻的频谱差分幅度与上一个预设时刻的频谱差分幅度和下一个预设时刻的频谱差分幅度之间的大小关系,从而得到节拍B1,B2,...,Bt,其中t是正整数。
可选的,在预设时刻的频谱差分幅度大于该预设时刻的前一时刻的频谱差分幅度且预设时刻的频谱差分幅度大于该预设时刻的后一时刻的频谱差分幅度的情况下,将该预设时刻作为一个节拍的起始时刻,即节拍拍点位置。
举例说明,假设第m个预设时刻的频谱差分幅度大于第m-1个预设时刻的频谱差分幅度且第m个预设时刻的频谱差分幅度大于第m+1个预设时刻的频谱差分幅度,则第m个预设时刻对应的音符是节拍Bi的起始音符(节拍Bi的节拍拍点位置)。其中,i是正整数且1≤i≤t。若第m+2个预设时刻的频谱差分幅度大于第m+1个预设时刻的频谱差分幅度且第m+2个预设时刻的频谱差分幅度大于第m+3个预设时刻的频谱差分幅度,则第m+2个预设时刻对应的音符是节拍Bi+1的起始音符(节拍Bi+1的节拍拍点位置)。因此,第m个预设时刻至第m+2个预设时刻之间的音符组成了节拍Bi
可以理解的,当第m个预设时刻的频谱差分幅度大于第m-1个预设时刻的频谱差分幅度且第m个预设时刻的频谱差分幅度大于第m+1个预设时刻的频谱差分幅度时,第m个预设时刻对应的声音信号的强度至少是第m-1个预设时刻至第m+1个预设时刻这个时间段内对应的声音信号的强度最大值,因此第m个预设时刻对应的音符是一个强拍,即第m个预设时刻是节拍Bi的节拍拍点位置。
为了便于理解上述音乐节拍的提取方法,图3A示出了一段声音信号,为了得到该段声音信号的节拍,首先需要计算该段声音信号在多个采样时刻的频谱差分幅度,由此可得到如图3B示出的频谱差分幅度曲线图。从图3B可知,在该段声音信号中节拍拍点位置与曲线的峰值一一对应,也就是说,节拍拍点位置是曲线局部峰值对应的时刻。
在本申请实施例中,还可以结合机器学习的方法得到待播放音乐中的节拍,具体过程为:对所述待播放音乐进行频谱分析,得到所述待播放音乐的对数梅尔谱;然后利用卷积循环神经网络对上述对数梅尔谱进行节拍识别,从而得到待播放音乐的多个节拍,其中,卷积循环神经网络是通过将大量的对数梅尔谱样本以及对应的节拍标注样本进行训练得到的。需要说明的,待播放音乐的音乐节拍还可以通过人为录入的节拍或者待播放音乐的和弦信息获得,本申请不作具体限定。
其次,对本申请实施例中音乐播放界面显示的待播放音乐的节拍的颜色进行详细解释。
在本申请实施例中,通过计算待播放音乐中每个节拍对应的声音信号的音色相似度,便可以得到每个节拍的音色信息。具体过程如下:
步骤一,分别对节拍B1,B2,...,Bt中包含的声音信号进行音频特征提取,从而得到梅尔倒谱系数(Mel Frequency CepstrumCoefficient,MFCC)特征向量V1,V2,...,Vt
其中,MFCC特征向量与节拍存在一一对应的关系,并且每个节拍对应的MFCC特征向量表征了该节拍中所包含的声音信号的音频特征。
具体的,以节拍Bi为例,节拍Bi的MFCC特征向量Vi可以这样得到:音乐播放装置首先对节拍Bi中包含的声音信号进行分帧处理,得到分帧信号;然后将分帧信号进行加窗处理,并对加窗处理后的分帧信号进行傅里叶变换,得到每一帧的频谱,并利用梅尔滤波器组对每一帧频谱进行带通滤波,并将每个滤波器频带内的能量叠加以得到频谱能量;最后将梅尔滤波器组中的每一个梅尔滤波器输出的频谱能量取对数,再经过离散余弦变换即可得到节拍Bi的MFCC特征向量Vi
为了简便起见,上面只陈述了节拍Bi的MFCC特征向量Vi的提取,实际上,节拍B1,B2,...,Bt的MFCC特征向量V1,V2,...,Vt的提取方式与节拍Bi的MFCC特征向量Vi的提取方式类似,此处不再展开赘述。需要说明的,MFCC特征向量的维数与梅尔滤波器组中梅尔滤波器的个数相同,但是在实际应用中通常只取前19维的MFCC特征向量。应理解的,MFCC特征向量的维数还可以根据实际情况进行确定,此处不作具体限定。
步骤二,通过k均值聚类算法对MFCC特征向量V1,V2,...,Vt进行聚类分析,得到k个分类结果C1,C2,...,Ck,从而得到k类音色以及k个音色分类结果C1,C2,...,Ck
其中,一个音色分类结果中包括了一个或多个音色相近或相同的MFCC特征向量,并且k为正整数。
具体的,音色分类装置120从t个MFCC特征向量V1,V2,...,Vt中随机选择k个MFCC特征向量作为初始的k个质心向量μ12,...,μk;然后计算t个MFCC特征向量V1,V2,...,Vt中每一个MFCC特征向量与k个质心向量μ12,...,μk之间的距离,得到t×k个距离,其中,与MFCC特征向量V1对应的距离为l11,l12,...l1k,与MFCC特征向量V2对应的距离为l21,l22,...l2k,…,与MFCC特征向量Vt对应的距离为lt1,lt2,...ltk;然后在距离l11,l12,...l1k中确定最小值,并将MFCC特征向量V1划分到最小距离值对应的类中,同样的,可以将MFCC特征向量V2,V3,...,Vt分别划分到对应的类中,从而得到第一分类结果,其中,k个分类结果中每一类中包含有一个或者多个MFCC特征向量;最后,根据第一分类结果,按照以下公式计算得到第一分类结果的误差平方和E1
Figure BDA0002426764150000071
式中,x表示在Ci中MFCC特征向量。接下来,音乐播放装置根据第一分类结果以及以下公式重新调整质心向量μ12,...,μk,并重复上述步骤得到第二分类结果以及第二分类结果的误差平方和E2
Figure BDA0002426764150000072
以此类推,可以得到第三分类结果、第四分类结果等等,直至分类结果对应的误差平方和小于预设收敛值,并将小于预设收敛值对应的分类结果作为音色的分类结果。
步骤三,将k类音色映射到k个颜色中,其中,一个颜色用于表示一类音色
例如,常见的几类音色包括钢琴类音色、打击乐器音色、吉他类音色等等,为了区别各个音色,音色分类装置120可以利用红色表示钢琴类音色、绿色表示打击乐器音色,蓝色表示吉他类音色,需要说明的,上述不同的音色可以用不同的颜色进行区分,本申请不作具体限定。
步骤四,根据音色分类结果C1,C2,...,Ck以及每类音色对应的颜色,确定节拍B1,B2,...,Bt对应的音色以及节拍B1,B2,...,Bt对应的颜色。
可以理解的,一个音色分类结果中包括了一个或多个音色相近或相同的MFCC特征向量,一类音色用一个颜色进行表示,因此,音色相近或相同的MFCC特征向量可以用一个颜色进行表示,也就是说,音色相近或相同的节拍可以用一个颜色进行表示。
在本申请实施例中,还可以结合深度学习算法来确定待播放音乐中每个节拍的音色。例如,可以利用音频自编码器提取节拍B1,B2,...,Bt中声音信号的音频特征,其中,音频自编码器可以是通过大量音频特征样本以及声音信号样本进行训练得到的;然后再通过上述k均值聚类算法对提取到的音频特征进行聚类分析,从而得到节拍B1,B2,...,Bt对应的音色以及节拍B1,B2,...,Bt对应的颜色。
因此,待播放音乐可以切分为节拍B1,B2,...,Bt,每一个节拍可以用一个带有颜色的图形表示,那么t个节拍B1,B2,...,Bt可以通过t个图形G1,G2,...,Gt表示,将图形G1,G2,...,Gt按照顺序进行排列从而构成了音乐播放界面。如图4所示,图4是本申请提供的一种音乐播放界面的生成方法的流程示意图。本实施方式的音乐播放界面的生成方法包括如下步骤:
S101、获取音乐的多个节拍及节拍拍点位置,并将多个节拍进行编号。
在本申请实施例中,获取音乐的频谱特征,得到音乐的节拍拍点位置,其中,节拍拍点位置与音乐的频谱特征中的局部峰值点一一对应;根据节拍拍点位置,将音乐切分为多个节拍,并将多个节拍进行编号;将多个节拍按照编号的顺序显示在音乐播放界面上。
S102、根据所述多个节拍,得到多个节拍中每个节拍的特征向量,并对每个节拍的特征向量进行聚类。
在本申请实施例中,通过k均值聚类算法对音乐的每个节拍的特征向量进行聚类
S103、对聚类后的节拍进行颜色对应。其中,不同颜色对应不同的聚类后的节拍。
S104、在音乐播放界面显示多个节拍以及聚类后的节拍的颜色。
在本申请实施例中,利用图形表示音乐的节拍,那么图形的颜色为音乐的节拍的颜色。图形可以是图2示出的方形,也可以是圆形、星形、心形、或者三角形等等,此处不作具体限定。颜色可以是图2示出的黑色、白色、灰色,也可以是红色、黄色等等其他颜色,此处不作具体限定。
为了简便陈述,本实施例并没有对音乐的节拍以及节拍的音色的获取过程进行详细描述,具体请参见图2、图3B中关于节拍B1,B2,...,Bt的识别过程以及音色分类结果C1,C2,...,Ck的识别过程,此处不再展开赘述。
上述音乐播放界面的生成方法中,通过获取音乐的节拍以及节拍对应的音色,从而在音乐播放界面显示出代表节拍和节拍音色的图形,其中,图形的颜色可以帮助用户定位音乐的具体位置。相比于音乐播放界面中只显示音乐播放进度条或者快进/回退按键来说,在音乐播放界面中显示节拍以及节拍的音色可以清楚地向用户展示待播放音乐的结构信息,方便用户了解待播放音乐的节拍信息以及音色信息,增强了交互感和娱乐性,而且使得用户可以根据图形的位置和颜色准确定位播放位置,提高音乐播放的效率,节省用户的时间。
在本申请实施例中,通过显示上述音乐播放界面,使得用户可以通过控制节拍来播放音乐。如图5所示,图5是本申请提供的一种音乐播放方法的流程示意图。本实施方式的音乐播放方法应用于具有屏幕的电子设备,该方法具体可以包括如下步骤:
S201、在屏幕上显示音乐播放界面,其中,音乐播放界面展示了音乐的多个节拍以及多个节拍中每个节拍的音色。
在本申请实施例中,音乐播放界面包括多个图形,其中,多个节拍通过多个图形进行表示,多个节拍中每个节拍的音色通过图形的颜色进行表示,多个图形与多个节拍存在一一对应关系,并且,节拍的音色相同或者相近时,图形的颜色相同或相近。
在本申请实施例中,图形包括圆形、星形、心形、方形以及三角形。
在本申请实施例中,根据音乐的频谱特征,得到节拍拍点位置,其中,节拍拍点位置与频谱特征中的局部峰值点一一对应;根据节拍拍点位置,将音乐切分为所述多个节拍,并将多个节拍进行编号;将多个节拍按照编号的顺序显示在音乐播放界面上。
在本申请实施例中,获取多个节拍中每个节拍的音色特征向量;通过k均值聚类算法对每个节拍的音色特征向量进行聚类;将聚类后的节拍进行颜色对应,并将聚类后的节拍的颜色显示在音乐播放界面上,其中,不同颜色对应不同的所述聚类后的节拍。
S202、接收用户在屏幕上的触摸输入,获取触摸输入对应的目标节拍。其中,目标节拍属于多个节拍。
在本申请实施例中,用户根据音乐中的多个节拍以及多个节拍中每个节拍的音色确定目标节拍。当用户点击音乐播放界面中的目标节拍对应的图形时,确定目标节拍为播放位置。
S203、从目标节拍开始播放音乐。
为了简便陈述,本实施例并没有对音乐播放界面、节拍以及节拍的音色的获取过程进行详细描述,具体请参见图2至图4以及相关描述。
上述方法,通过音乐播放界面上展示的音乐节拍以及节拍的音色信息,使得用户不仅可以根据节拍来选定音乐的播放位置,还可以根据节拍来控制音乐的播放进度。相比于音乐播放进度条或者快进/回退按键来说,显示有节拍和节拍音色的音乐播放界面可以清楚地展示待播放音乐的结构信息,方便用户了解待播放音乐的节拍信息以及音色信息,增强了交互感和娱乐性。
如图6所示,图6是本申请提供的一种音乐播放界面生成装置的结构示意图。音乐播放界面生成装置包括节拍识别单元110、音色识别单元120以及显示单元130。下面分别介绍每个功能单元的功能,其中,
节拍识别单元110,用于获取音乐的多个节拍及节拍拍点位置,并将所述多个节拍进行编号;
音色识别单元120,用于根据所述多个节拍中每个节拍的特征向量,并对所述每个节拍的特征向量进行聚类;
音色识别单元120还用于对聚类后的节拍进行颜色对应,其中,不同颜色对应不同的所述聚类后的节拍;
显示单元130,用于在音乐播放界面显示所述多个节拍以及所述聚类后的节拍的颜色。
在本申请实施例中,节拍识别单元110具体用于:获取音乐的频谱特征,得到节拍拍点位置,其中,节拍拍点位置与音乐的频谱特征中的局部峰值点一一对应;根据节拍拍点位置,将音乐切分为多个节拍,并将多个节拍进行编号;显示单元120具体用于将多个节拍按照编号的顺序显示在音乐播放界面上。
在本申请实施例中,音色识别单元120具体用于:通过k均值聚类算法对音乐的每个节拍的特征向量进行聚类。
在本申请实施例中,利用图形表示音乐的节拍,那么图形的颜色为音乐的节拍的颜色。图形可以是图2示出的方形,也可以是圆形、星形、心形、或者三角形等等,此处不作具体限定。颜色可以是图2示出的黑色、白色、灰色,也可以是红色、黄色等等其他颜色,此处不作具体限定。
为了简便陈述,本实施例并没有对音乐的节拍以及节拍的音色的获取过程进行详细描述,具体请参见图2、图3B中关于节拍B1,B2,...,Bt的识别过程以及音色分类结果C1,C2,...,Ck的识别过程,此处不再展开赘述。
上述音乐播放界面生成装置根据音乐的节拍以及节拍对应的音色,从而在音乐播放界面显示出代表节拍和节拍音色的图形,其中,图形的颜色可以帮助用户定位音乐的具体位置。相比于音乐播放界面中只显示音乐播放进度条或者快进/回退按键来说,在音乐播放界面中显示节拍以及节拍的音色可以清楚地向用户展示待播放音乐的结构信息,方便用户了解待播放音乐的节拍信息以及音色信息,增强了交互感和娱乐性,而且使得用户可以根据图形的位置和颜色准确定位播放位置,提高音乐播放的效率,节省用户的时间。
如图7所示,图7是本申请提供的一种音乐播放装置的结构示意图。音乐播放装置包括显示单元210、获取单元220以及播放单元230。下面分别介绍每个功能单元的功能,其中,
显示单元210,用于在所述屏幕上显示音乐播放界面,其中,所述音乐播放界面展示了音乐的多个节拍以及所述多个节拍中每个节拍的颜色;
获取单元220,用于接收用户在所述屏幕上的触摸输入,获取所述触摸输入对应的目标节拍,其中,所述目标节拍属于所述多个节拍;
播放单元230,用于从所述目标节拍开始播放所述音乐。
在本申请实施例中,音乐播放界面包括多个图形,其中,多个节拍通过多个图形进行表示,多个节拍中每个节拍的音色通过图形的颜色进行表示,多个图形与多个节拍存在一一对应关系,并且,节拍的音色相同或者相近时,图形的颜色相同或相近。播放界面中的目标节拍为用户根据音乐中的多个节拍以及多个节拍中每个节拍的音色确定的。
在本申请实施例中,图形包括圆形、星形、心形、方形以及三角形。
在本申请实施例中,音乐播放装置还包括节拍识别单元240,节拍识别单元240用于:获取音乐的频谱特征,得到节拍拍点位置,其中,节拍拍点位置与频谱特征中的局部峰值点一一对应;根据节拍拍点位置,将音乐切分为所述多个节拍,并将多个节拍进行编号;显示单元210具体用于将多个节拍按照编号的顺序显示在音乐播放界面上。
在本申请实施例中,音乐播放装置还包括音色识别单元250,音色识别单元250用于:获取多个节拍中每个节拍的音色特征向量;通过k均值聚类算法对每个节拍的音色特征向量进行聚类;对聚类后的节拍进行颜色对应,其中,不同颜色对应不同的所述聚类后的节拍;显示单元210还用于将聚类后的节拍的颜色显示在音乐播放界面上。
为了简便陈述,本实施例并没有对音乐播放界面、音乐节拍以及节拍的音色的获取过程进行详细描述,具体请参见图2至图4以及相关描述。
上述音乐播放装置通过音乐播放界面上展示的音乐节拍以及节拍的音色信息,使得用户不仅可以根据节拍来选定音乐的播放位置,还可以根据节拍来控制音乐的播放进度。相比于音乐播放进度条或者快进/回退按键来说,显示有节拍和节拍音色的音乐播放界面可以清楚地展示待播放音乐的结构信息,方便用户了解待播放音乐的节拍信息以及音色信息,增强了交互感和娱乐性。
参见图8,图8是本申请提供的另一种音乐播放界面生成装置的结构示意图。音乐播放界面生成装置通常包括处理器310、通信接口320以及存储器330,其中,处理器310、通信接口320以及存储器330通过总线340进行耦合。其中,
处理器310可以是中央处理器(Central Processing Unit,CPU),通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件(Programmable Logic Device,PLD)、晶体管逻辑器件、硬件部件或者其任意组合。处理器310可以实现或执行结合本申请公开内容所描述的各种示例性的方法。具体的,处理器310读取存储器330中存储的程序代码,并与通信接口320配合执行图6示出的音乐播放界面生成装置所执行的方法的部分或者全部步骤,例如,图4示出的S101-S104。
通信接口320可以为有线接口或无线接口,用于与其他模块或设备进行通信,有线接口可以是以太接口、控制器局域网络接口、局域互联网络(Local InterconnectNetwork,LIN)以及FlexRay接口,无线接口可以是蜂窝网络接口或使用无线局域网接口等。
存储器330可以包括易失性存储器,例如随机存取存储器(Random AccessMemory,RAM);第一存储器430也可以包括非易失性存储器,例如只读存储器(Read OnlyMemory,ROM)、快闪存储器、硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid State Drive,SSD);存储器330还可以包括上述种类的存储器的组合。存储器330可以存储有程序代码以及程序数据。其中,程序代码由图6示出的音乐播放界面生成装置中的部分或者全部单元的代码组成,例如,节拍识别单元110的代码、音色识别单元120的代码以及显示单元130的代码等等。程序数据由图6示出的音乐播放界面生成装置在运行过程中产生的组成,例如,节拍数据、音色数据以及图形数据等等。
总线340可以是控制器局域网络(Controller Area Network,CAN)或者其他内部总线。总线340可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
应当理解,音乐播放界面生成装置可能包含相比于图8展示的更多或者更少的组件,或者有不同的组件配置方式。
上述音乐播放界面生成装置根据音乐的节拍以及节拍对应的音色,从而在音乐播放界面显示出代表节拍和节拍音色的图形,其中,图形的颜色可以帮助用户定位音乐的具体位置。相比于音乐播放界面中只显示音乐播放进度条或者快进/回退按键来说,在音乐播放界面中显示节拍以及节拍的音色可以清楚地向用户展示待播放音乐的结构信息,方便用户了解待播放音乐的节拍信息以及音色信息,增强了交互感和娱乐性,而且使得用户可以根据图形的位置和颜色准确定位播放位置,提高音乐播放的效率,节省用户的时间。
参见图9,图9是本申请提供的另一种音乐播放装置的结构示意图。音乐播放装置通常包括处理器410、通信接口420以及存储器430,其中,处理器410、通信接口420以及存储器430通过总线440进行耦合。其中,
处理器410可以是CPU,通用处理器、DSP、ASIC、FPGA或者其他PLD、晶体管逻辑器件、硬件部件或者其任意组合。处理器410可以实现或执行结合本申请公开内容所描述的各种示例性的方法。具体的,处理器410读取存储器430中存储的程序代码,并与通信接口420配合执行图7示出的音乐播放装置执行的方法的部分或者全部步骤,例如,图5示出的S201-S203。
通信接口420可以为有线接口或无线接口,用于与其他模块或设备进行通信,有线接口可以是以太接口、控制器局域网络接口、LIN以及FlexRay接口,无线接口可以是蜂窝网络接口或使用无线局域网接口等。
存储器430可以包括易失性存储器,例如RAM;存储器430也可以包括非易失性存储器,例如ROM、快闪存储器、HDD或SSD;存储器430还可以包括上述种类的存储器的组合。存储器430可以存储有程序代码以及程序数据。其中,程序代码由图7示出的音乐播放装置中的部分或者全部单元的代码组成,例如,显示单元210的代码、获取单元220的代码以及播放单元230的代码等等。程序数据由图7示出的音乐播放装置在运行过程中产生的组成,例如,节拍数据、音色数据以及图形数据等等。
总线440可以是CAN或其他内部总线。总线440可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
应当理解,音乐播放装置可能包含相比于图9展示的更多或者更少的组件,或者有不同的组件配置方式。
上述音乐播放装置通过音乐播放界面上展示的音乐节拍以及节拍的音色信息,使得用户不仅可以根据节拍来选定音乐的播放位置,还可以根据节拍来控制音乐的播放进度。相比于音乐播放进度条或者快进/回退按键来说,显示有节拍和节拍音色的音乐播放界面可以清楚地展示待播放音乐的结构信息,方便用户了解待播放音乐的节拍信息以及音色信息,增强了交互感和娱乐性。
本申请还提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,当计算机程序被硬件(如,处理器)执行时,以实现图4示出的音乐播放界面生成方法中部分或全部步骤。
本申请还提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,当计算机程序被硬件(如,处理器)执行时,以实现图5示出的音乐播放方法中部分或全部步骤。
经测试发现,利用本申请提供的技术方案可以使得用户理解音乐的结构,方便用户根据节拍来控制音乐的播放进度,更加符合用户收听音乐时的期待,尤其对于了解音乐知识的用户来说,这种音乐播放方式比单一的进度条要更加界面友好。例如,通常情况下4~8个节拍组成一句乐句,当用户想要跳过前奏时,用户只需要在音乐开始播放时点击前奏后的节拍即可从主旋律开始播放;当用户想要循环一遍副歌时,用户只需在副歌结束后再次点击副歌对应的起始节拍即可重复听一遍副歌。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如,红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、存储盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如,SSD)等。在所述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,也可以通过其它的方式实现。例如以上所描述的装置实施例仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可结合或者可以集成到另一个系统,或一些特征可以忽略或不执行。另一点,所显示或讨论的相互之间的间接耦合或者直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例的方案的目的。
另外,在本申请各实施例中的各功能单元可集成在一个处理单元中,也可以是各单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质例如可包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或光盘等各种可存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (18)

1.一种音乐播放方法,所述方法应用于具有屏幕的电子设备,其特征在于,包括:
在所述屏幕上显示音乐播放界面,其中,所述音乐播放界面展示了音乐的多个节拍以及所述多个节拍中每个节拍的颜色;
接收用户在所述屏幕上的触摸输入,获取所述触摸输入对应的目标节拍,其中,所述目标节拍属于所述多个节拍;
从所述目标节拍开始播放所述音乐。
2.根据权利要求1所述的方法,其特征在于,所述音乐播放界面包括多个图形,其中,所述多个节拍通过所述多个图形进行表示,所述多个节拍中每个节拍的音色通过图形的颜色进行表示,所述多个图形与所述多个节拍存在一一对应关系,并且,节拍的音色相同或者相近时,图形的颜色相同或者相近;所述播放界面中的目标节拍为所述用户根据所述音乐中的多个节拍以及所述多个节拍中每个节拍的音色确定的。
3.根据权利要求2所述的方法,其特征在于,所述音乐播放界面展示了音乐的多个节拍,包括:
根据所述音乐的频谱特征,得到节拍拍点位置,其中,所述节拍拍点位置与所述频谱特征中的局部峰值点一一对应;
根据所述节拍拍点位置,将所述音乐切分为所述多个节拍,并将所述多个节拍进行编号;
将所述多个节拍按照所述编号的顺序显示在所述音乐播放界面上。
4.根据权利要求3所述的方法,其特征在于,所述音乐播放界面展示了所述多个节拍中每个节拍的颜色,包括:
获取所述多个节拍中每个节拍的音色特征向量;
通过k均值聚类算法对所述每个节拍的音色特征向量进行聚类;
将聚类后的节拍进行颜色对应,并将所述聚类后的节拍的颜色显示在所述音乐播放界面上,其中,不同颜色对应不同的所述聚类后的节拍。
5.一种音乐播放界面生成方法,其特征在于,包括:
获取音乐的多个节拍及节拍拍点位置,并将所述多个节拍进行编号;
根据所述多个节拍,得到所述多个节拍中每个节拍的特征向量,并对所述每个节拍的特征向量进行聚类;
对聚类后的节拍进行颜色对应,其中,不同颜色对应不同的所述聚类后的节拍;
在音乐播放界面显示所述多个节拍以及所述聚类后的节拍的颜色。
6.根据权利要求5所述的方法,其特征在于,所述获取音乐的多个节拍及节拍拍点位置,并将所述多个节拍进行编号,包括:
获取所述音乐的频谱特征,得到所述节拍拍点位置,其中,所述节拍拍点位置与所述频谱特征中的局部峰值点一一对应;
根据所述节拍拍点位置,将所述音乐切分为所述多个节拍,并将所述多个节拍进行编号;
所述在音乐播放界面显示所述多个节拍包括:
将所述多个节拍按照所述编号的顺序显示在所述音乐播放界面上。
7.根据权利要求6所述的方法,其特征在于,所述对所述每个节拍的特征向量进行聚类包括:通过k均值聚类算法对所述每个节拍的特征向量进行聚类。
8.一种音乐播放装置,所述装置应用于具有屏幕的电子设备,其特征在于,包括:
显示单元,用于在所述屏幕上显示音乐播放界面,其中,所述音乐播放界面展示了音乐的多个节拍以及所述多个节拍中每个节拍的颜色;
获取单元,用于接收用户在所述屏幕上的触摸输入,获取所述触摸输入对应的目标节拍,其中,所述目标节拍属于所述多个节拍;
播放单元,用于从所述目标节拍开始播放所述音乐。
9.根据权利要求8所述的装置,其特征在于,所述音乐播放界面包括多个图形,其中,所述多个节拍通过所述多个图形进行表示,所述多个节拍中每个节拍的音色通过图形的颜色进行表示,所述多个图形与所述多个节拍存在一一对应关系,并且,节拍的音色相同或者相近时,图形的颜色相同或者相近;所述播放界面中的目标节拍为所述用户根据所述音乐中的多个节拍以及所述多个节拍中每个节拍的音色确定的。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括节拍识别单元,所述节拍识别单元用于:
获取所述音乐的频谱特征,得到节拍拍点位置,其中,所述节拍拍点位置与所述频谱特征中的局部峰值点一一对应;
根据所述节拍拍点位置,将所述音乐切分为所述多个节拍,并将所述多个节拍进行编号;
所述显示单元具体用于将所述多个节拍按照所述编号的顺序显示在所述音乐播放界面上。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括音色识别单元,所述音色识别单元用于:
获取所述多个节拍中每个节拍的音色特征向量;
通过k均值聚类算法对所述每个节拍的音色特征向量进行聚类;
对聚类后的节拍进行颜色对应,其中,不同颜色对应不同的所述聚类后的节拍;
所述显示单元还用于将所述聚类后的节拍的颜色显示在所述音乐播放界面上。
12.一种音乐播放界面生成装置,其特征在于,包括:
节拍识别单元,用于获取音乐的多个节拍及节拍拍点位置,并将所述多个节拍进行编号;
音色识别单元,用于根据所述多个节拍中每个节拍的特征向量,并对所述每个节拍的特征向量进行聚类;
音色识别单元还用于对聚类后的节拍进行颜色对应,其中,不同颜色对应不同的所述聚类后的节拍;
显示单元,用于在音乐播放界面显示所述多个节拍以及所述聚类后的节拍的颜色。
13.根据权利要求12所述的装置,其特征在于,所述节拍识别单元具体用于:
获取所述音乐的频谱特征,得到所述节拍拍点位置,其中,所述节拍拍点位置与所述频谱特征中的局部峰值点一一对应;
根据所述节拍拍点位置,将所述音乐切分为所述多个节拍,并将所述多个节拍进行编号;
所述显示单元具体用于将所述多个节拍按照所述编号的顺序显示在所述音乐播放界面上。
14.根据权利要求13所述的装置,其特征在于,所述音色识别单元具体用于:通过k均值聚类算法对所述每个节拍的特征向量进行聚类。
15.一种音乐播放装置,其特征在于,包括处理器、通信接口以及存储器,所述通信接口在所述处理器的控制下与其他设备进行通信,所述处理器执行所述存储器中的代码以实现权利要求1至4任一项权利要求所述的方法。
16.一种音乐播放界面生成装置,其特征在于,包括处理器、通信接口以及存储器,所述通信接口在所述处理器的控制下与其他设备进行通信,所述处理器执行所述存储器中的代码以实现权利要求5至7任一项权利要求所述的方法。
17.一种计算机存储介质,其特征在于,存储有计算机程序,所述计算机程序被硬件执行以实现权利要求1至4任一项权利要求所述的方法。
18.一种计算机存储介质,其特征在于,存储有计算机程序,所述计算机程序被硬件执行以实现权利要求5至7任一项权利要求所述的方法。
CN202010223115.2A 2020-03-26 2020-03-26 音乐播放方法、音乐播放界面生成方法及相关产品 Active CN111399745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010223115.2A CN111399745B (zh) 2020-03-26 2020-03-26 音乐播放方法、音乐播放界面生成方法及相关产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010223115.2A CN111399745B (zh) 2020-03-26 2020-03-26 音乐播放方法、音乐播放界面生成方法及相关产品

Publications (2)

Publication Number Publication Date
CN111399745A true CN111399745A (zh) 2020-07-10
CN111399745B CN111399745B (zh) 2021-06-25

Family

ID=71431248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010223115.2A Active CN111399745B (zh) 2020-03-26 2020-03-26 音乐播放方法、音乐播放界面生成方法及相关产品

Country Status (1)

Country Link
CN (1) CN111399745B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112259062A (zh) * 2020-10-20 2021-01-22 北京字节跳动网络技术有限公司 特效展示方法、装置、电子设备及计算机可读介质
CN112380362A (zh) * 2020-10-27 2021-02-19 脸萌有限公司 基于用户交互的音乐播放方法、装置、设备及存储介质
CN113641851A (zh) * 2021-08-11 2021-11-12 乐聚(深圳)机器人技术有限公司 乐谱预览方法、装置、终端设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120247305A1 (en) * 2011-03-31 2012-10-04 Masanori Katsuta Musical score playing device and musical score playing program
CN103400593A (zh) * 2013-07-03 2013-11-20 网易(杭州)网络有限公司 一种试听音频的方法及装置
CN104346147A (zh) * 2013-07-29 2015-02-11 人人游戏网络科技发展(上海)有限公司 音乐游戏的节拍点的编辑方法及装置
CN106304539A (zh) * 2016-08-03 2017-01-04 杭州电子科技大学 一种基于节奏跟随的音乐彩灯控制器设计方法
CN106683651A (zh) * 2015-11-11 2017-05-17 谢剑 乐谱的展现方法
CN107220047A (zh) * 2017-05-19 2017-09-29 北京酷我科技有限公司 一种音频频谱的动图显示进度条控件实现方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120247305A1 (en) * 2011-03-31 2012-10-04 Masanori Katsuta Musical score playing device and musical score playing program
CN103400593A (zh) * 2013-07-03 2013-11-20 网易(杭州)网络有限公司 一种试听音频的方法及装置
CN104346147A (zh) * 2013-07-29 2015-02-11 人人游戏网络科技发展(上海)有限公司 音乐游戏的节拍点的编辑方法及装置
CN106683651A (zh) * 2015-11-11 2017-05-17 谢剑 乐谱的展现方法
CN106304539A (zh) * 2016-08-03 2017-01-04 杭州电子科技大学 一种基于节奏跟随的音乐彩灯控制器设计方法
CN107220047A (zh) * 2017-05-19 2017-09-29 北京酷我科技有限公司 一种音频频谱的动图显示进度条控件实现方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112259062A (zh) * 2020-10-20 2021-01-22 北京字节跳动网络技术有限公司 特效展示方法、装置、电子设备及计算机可读介质
WO2022083148A1 (zh) * 2020-10-20 2022-04-28 北京字节跳动网络技术有限公司 特效展示方法、装置、电子设备及计算机可读介质
CN112259062B (zh) * 2020-10-20 2022-11-04 北京字节跳动网络技术有限公司 特效展示方法、装置、电子设备及计算机可读介质
CN112380362A (zh) * 2020-10-27 2021-02-19 脸萌有限公司 基于用户交互的音乐播放方法、装置、设备及存储介质
US11886484B2 (en) 2020-10-27 2024-01-30 Lemon Inc. Music playing method and apparatus based on user interaction, and device and storage medium
CN113641851A (zh) * 2021-08-11 2021-11-12 乐聚(深圳)机器人技术有限公司 乐谱预览方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
CN111399745B (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN111399745B (zh) 音乐播放方法、音乐播放界面生成方法及相关产品
US20050115382A1 (en) Method and apparatus for tracking musical score
CN107680571A (zh) 一种歌曲伴奏方法、装置、设备和介质
US10971125B2 (en) Music synthesis method, system, terminal and computer-readable storage medium
US11511200B2 (en) Game playing method and system based on a multimedia file
CN100585663C (zh) 语言学习系统
CN108986841B (zh) 音频信息处理方法、装置及存储介质
CN111192594B (zh) 人声和伴奏分离方法及相关产品
US20200228596A1 (en) Streaming music categorization using rhythm, texture and pitch
CN104505103B (zh) 语音质量评价设备、方法和系统
Sabathé et al. Deep recurrent music writer: Memory-enhanced variational autoencoder-based musical score composition and an objective measure
WO2020015411A1 (zh) 一种训练改编水平评价模型、评价改编水平的方法及装置
WO2023051246A1 (zh) 视频录制方法、装置、设备及存储介质
Comunità et al. Guitar effects recognition and parameter estimation with convolutional neural networks
TWI740315B (zh) 聲音分離方法、電子設備和電腦可讀儲存媒體
CN111445922B (zh) 音频匹配方法、装置、计算机设备及存储介质
CN109410972B (zh) 生成音效参数的方法、装置及存储介质
Zhang et al. Influence of musical elements on the perception of ‘Chinese style’in music
CN111859008A (zh) 一种推荐音乐的方法及终端
US20070028751A1 (en) System for using sound inputs to obtain video display response
Mauthes VGM-RNN: Recurrent neural networks for video game music generation
CN111508454A (zh) 乐谱的处理方法、装置、电子设备及存储介质
Desblancs Self-supervised beat tracking in musical signals with polyphonic contrastive learning
CN116189636B (zh) 基于电子乐器的伴奏生成方法、装置、设备及存储介质
CN113744721B (zh) 模型训练方法、音频处理方法、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant