CN102222074A - 在线歌词数据匹配的方法、装置及后台数据装置 - Google Patents

在线歌词数据匹配的方法、装置及后台数据装置 Download PDF

Info

Publication number
CN102222074A
CN102222074A CN2010101533363A CN201010153336A CN102222074A CN 102222074 A CN102222074 A CN 102222074A CN 2010101533363 A CN2010101533363 A CN 2010101533363A CN 201010153336 A CN201010153336 A CN 201010153336A CN 102222074 A CN102222074 A CN 102222074A
Authority
CN
China
Prior art keywords
music file
file
attribute information
information
condition code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101533363A
Other languages
English (en)
Inventor
李大龙
梅江霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN2010101533363A priority Critical patent/CN102222074A/zh
Publication of CN102222074A publication Critical patent/CN102222074A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本发明提供了一种在线歌词数据匹配的方法,从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;根据所获取的当前音乐文件的文件属性信息进行歌词数据搜索,得到搜索结果;从所述搜索结果中选择一个歌词数据进行下载并将所述下载的歌词数据进行加载,相应的,本发明还提供了一种在线歌词数据匹配装置及后台数据装置,能够针对传统播放器无法进行自动歌词匹配的音乐文件完成自动匹配,无需用户手动参与,提高了在线歌词匹配的准确性和及时性。

Description

在线歌词数据匹配的方法、装置及后台数据装置
技术领域
本发明涉及音视频播放领域,尤其涉及一种在线歌词数据匹配的方法、装置及后台数据装置。
背景技术
在线歌词功能,是指多媒体播放器(下简称:播放器)软件产品针对用户播放本地音乐文件时,通过获取音乐文件属性信息(如:歌曲名/歌手名)后进行网络搜索,并将对应的歌词文件下载后进行加载的过程。一般情况下,大多数播放器会自动完成音乐文件属性信息的获取、网络歌词搜索、歌词下载和歌词加载过程,当然,也可以由用户手动输入歌曲名等音乐文件属性信息后,再进行后续的搜索等过程,前者无需用户主动参与,具备较好的用户体验。
因此,为了完成在线歌词的自动匹配,音乐文件属性信息的获取十分重要。由于音乐文件在硬盘上的存储文件名具有可随意修改的特点,可靠性相对较低,所以传统的播放器会根据音乐文件的标签协议头(例如:MP3文件的ID3标签)来获取音乐文件属性信息,一般为歌曲名/歌手名信息,并用于后续的搜索。所述ID3标签一般位于一个MP3文件的开头或末尾的若干字节没,附加了关于该MP3歌手、标题、专辑名称、年代和风格等信息,ID3信息被分为两个版本,V1和V2,其中V1版的ID3在MP3文件的末尾128字节,以TAG三个字符开头,后面附上歌曲信息,ID3V1按照顺序依次存放如下信息:
第0~2个字节,为ID3v1标识头,即TAG三个字符;
第3~32个字节,用30个字符包含该音乐文件的标题信息,即歌曲名;
第33~62个字节,用30个字符包含该音乐文件的作者信息,即歌手名;
第63~92个字节,用30个字符包含该音乐文件所属的专辑信息;
第93~96个字节,用4个字符包含该音乐文件的产品年代信息;
第97~126个字节,用30个字符包含备注信息;
第127个字节,用1个字符包含音乐文件的风格类型信息,如流行乐、乡村乐等。
于是,从一个基于ID3V1的标签信息中获取音乐文件的文件属性信息,如只获取歌曲名和歌手名信息的步骤为:在打开一个MP3文件后,将文件流读取指针跳转到距离文件结尾128字节处,顺序读取3个字节,若该3个字节标识的字符为TAG,则顺序读取30个字节,将其标识的字符串信息作为歌曲名,再顺序读取30个字节,将其标识的字符串信息作为歌手名。
但标签协议头包含的信息易被发布者用于身份标识或广告宣传,且标签数据本身属于音乐文件的可选数据项,对于那些缺损标签协议头或者数据不正确的音乐文件将无法完成在线歌词的自动匹配,任何用户、无论何时播放这种音乐文件,都必须手动输入音乐文件属性信息,才能进行搜索并最终得到歌词文件,使得在线歌词的体验大打折扣。
发明内容
鉴于上述现有技术所存在的问题,本发明实施例提供了一种在线歌词数据匹配的方法、装置及后台数据装置,能够针对传统播放器无法进行自动歌词匹配的音乐文件完成自动匹配,无需用户手动参与,提高了在线歌词匹配的准确性和及时性。
为了达到上述技术效果,本发明实施例提供了一种在线歌词数据匹配的方法,包括:
从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;
根据所获取的当前音乐文件的文件属性信息进行歌词搜索,得到搜索结果;
从所述搜索结果中选择至少一个歌词数据进行下载并将所述下载的歌词数据进行加载。
优选的,在所述从音乐文件信息数据库中获取当前音乐文件的文件属性信息步骤之前,还包括:
创建音乐文件信息数据库,所述音乐文件信息数据库是基于表结构的记录体,每一个表项包括特征码和文件属性信息。
优选的,所述从音乐文件信息数据库中获取当前音乐文件的文件属性信息,进一步包括:
计算当前音乐文件的特征码;
通过所述特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息。
优选的,所述计算当前音乐文件的特征码是通过安全散列算法SHA-1计算而成。
优选的,所述根据所获取的当前音乐文件的文件属性信息进行歌词数据搜索步骤之前还包括:
判断从音乐文件信息数据库中获取当前音乐文件的文件属性信息是否成功;
当判断结果为否时,获取用户输入的当前音乐文件的文件属性信息。
优选的,若获取的当前音乐文件的文件属性信息是通过用户输入方式获取的,则所述从所述搜索结果中选择一个歌词数据进行下载步骤后,还包括:
将获取到的当前音乐文件的文件属性信息记录到音乐文件信息采集数据库,其进一步包括:
计算当前音乐文件的特征码;
将所述特征码和所述文件属性信息录入音乐文件信息采集数据库。
优选的,所述音乐文件信息数据库和所述音乐文件信息采集数据库均是基于表结构的记录体,每一个表项包括:特征码、文件属性信息和热度值;
定期根据所述音乐文件信息采集数据库更新所述音乐文件信息数据库;
所述将所述特征码和所述文件属性信息录入音乐文件采集信息数据库步骤进一步包括:
检索所述特征码和所述文件属性信息组成的关键词组合在音乐文件信息采集数据库中是否存在;
若存在,则将对应表项的热度值加1;
若不存在,则添加一个新的表项记录所述特征码和所述文件属性信息。
优选的,通过所述特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息进一步包括:
检索该特征码在音乐文件信息数据库中对应的所有表项;
获取所述检索出的所有表项中热度值最大的一个表项中的文件属性信息。
优选的,所述从音乐文件信息数据库中获取当前音乐文件的文件属性信息步骤包括:
从当前音乐文件的标签信息中获取文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;
判断从当前音乐文件的标签信息中获取文件属性信息是否成功;
当判断结果为否时,从音乐文件信息数据库中获取当前音乐文件的文件属性信息。
相应的,本发明实施例还提供了一种在线歌词数据匹配的装置,包括:
第一获取模块,用于从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;
歌词搜索模块,与所述第一获取模块相连,用于根据获取的当前音乐文件的文件属性信息进行歌词数据搜索,得到搜索结果;
加载模块,与所述歌词搜索模块相连,用于从所述搜索结果中选择至少一个歌词数据进行下载并将所述下载的歌词数据进行加载。
优选的,所述第一获取模块包括:
特征码计算单元,用于计算当前音乐文件的特征码;
获取单元,与所述特征码计算单元相连,用于根据所述特征码计算单元计算出的特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息。
优选的,所述装置还包括:
输入模块,分别与所述第一获取模块中的获取单元及所述歌词搜索模块相连,用于在所述获取单元从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息不成功时,获取用户输入的当前音乐文件的文件属性信息。
优选的,所述装置还包括:
第二获取模块,分别与所述第一获取模块和所述歌词搜索模块相连,用于从当前音乐文件的标签信息中获取文件属性信息;
所述第一获取模块,用于在所述第二获取模块从当前音乐文件的标签信息中获取文件属性信息不成功时,从音乐文件信息数据库中获取当前音乐文件的文件属性信息。
相应的,本发明实施例还提供了一种后台数据装置,包括:
第一存储单元,用于存储音乐文件信息数据库,所述音乐文件信息数据库是基于表结构的记录体,每一个表项包括:特征码、文件属性信息和热度值。
优选的,所述装置还包括:
第二存储单元,用于存储音乐文件信息采集数据库,所述音乐文件信息采集数据库是基于表结构的记录体,每一个表项包括:特征码、文件属性信息和热度值;
录入单元,与所述第二存储单元相连,用于以用户输入方式获取音乐文件属性信息并成功下载歌词数据后,将用户输入的当前音乐文件的文件属性信息录入所述第二存储单元内的音乐文件信息采集数据库;
更新单元,分别与所述第一存储单元和所述第二存储单元相连,用于定期根据所述第二存储单元内的音乐文件信息采集数据库更新所述第一存储单元内的音乐文件信息数据库。
优选的,所述录入单元包括:
特征码计算单元,用于计算当前音乐文件的特征码;
检索单元,分别与所述特征码计算单元和所述第二存储单元相连,用于检索所述特征码和所述文件属性信息组成的关键词组合在音乐文件信息采集数据库中是否存在,得出检索结果;
录入执行单元,分别与所述特征码计算单元、检索单元和所述第二存储单元相连,用于当所述检索单元得出的检索结果为是时,将所述音乐文件采集信息数据库对应表项的热度值加1,当所述检索单元得出的检索结果为否时,在所述音乐文件采集信息数据库中添加一个新的表项记录所述特征码和所述文件属性信息。
实施本发明实施例,从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;根据所获取的当前音乐文件的文件属性信息进行歌词数据搜索,得到搜索结果;从所述搜索结果中选择一个歌词数据进行下载并将所述下载的歌词数据进行加载,能够针对传统播放器无法进行自动歌词匹配的音乐文件完成自动匹配,无需用户手动参与,提高了在线歌词匹配的准确性和及时性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中一种在线歌词数据匹配方法的流程图;
图2是本发明实施例中一种在线歌词数据匹配装置的结构示意图;
图3是本发明实施例中一种后台数据装置结构示意图。
具体实施方式
本发明实施例提供了一种在线歌词数据匹配的方法、装置及后台数据装置,对于缺损标签协议头或其数据不正确而无法完成在线歌词自动匹配的音乐文件,当用户以手动方式输入音乐文件属性信息并完成一次歌词数据搜索和下载过程后,会将用户手动输入的音乐文件属性信息记录到后台数据库上,并建立音乐文件属性信息与该音乐文件的对应关系,当该用户再次播放这个文件时,即可利用后台数据库已有的信息完成自动在线歌词匹配。且由于目前音乐文件的获取方式大多数是通过网络下载方式获取的,故不同的用户在各自的计算机上播放同样音乐文件的可能性极大,使用上述方法,可以利用某用户手动搜索某个缺损标签协议头的音乐文件时的输入信息来完成其他所有用户播放同样文件时的在线歌词自动匹配过程,提高了在线歌词匹配的准确性和及时性。
下面结合附图详细说明本发明的实施例。
参见图1,为本发明实施例中一种在线歌词数据匹配方法的流程图,其包括如下步骤:
步骤101:从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个,在具体实施时,一般获取的文件属性信息至少为歌曲名、歌手名中的一个或一个以上。在步骤101之前,还包括在后台创建音乐文件信息数据库,所述音乐文件信息数据库是基于表结构的记录体,每一个表项包括特征码和文件属性信息,当然还可以包括其他信息例如词曲作者、歌曲所属专辑等信息,在此不做限制。
其中,步骤101进一步包括:
A:计算当前音乐文件的特征码,所述计算当前音乐文件的特征码可以通过安全散列算法(Secure Hash Algorithm,SHA-1)计算而成,对于同一个音乐文件,无论在哪个终端上通过SHA-1计算出的特征码均相同,根据SHA-1计算特征码属于现有技术,在此不详细介绍,但特征码的计算不仅限于此方法。
B:通过所述特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息,所述音乐文件信息数据库的结构将在后面进行详细描述。
为了兼容现有技术,本发明实施例可首先选用目前主流的在线歌词匹配技术,即从音乐文件的标签信息(如MP3文件的ID3标签)中获取音乐文件的文件属性信息,并判断从当前音乐文件的标签信息中获取文件属性信息是否成功,当判断出从标签信息中获取音乐文件的文件属性信息不成功,进入步骤101,从音乐文件信息数据库中获取当前音乐文件的文件属性信息;当判断出从音乐文件的标签信息中获取音乐文件的文件属性信息成功,则直接进入步骤102。
步骤102:根据所获取的当前音乐文件的文件属性信息进行歌词数据搜索,得到搜索结果,以获取的文件属性信息作为关键词在网络上进行歌词数据搜索属于现有技术,在此不赘述;
在步骤101中,若音乐文件信息数据库中不存在所述特征码对应的音乐文件的文件属性信息,则步骤101中将不能获取到当前音乐文件的文件属性信息,因此在步骤102之前,还可包括:
判断从音乐文件信息数据库中获取当前音乐文件的文件属性信息是否成功;
当判断结果为是时,执行步骤102,根据从音乐文件信息数据库中获取的当前音乐文件的文件属性信息进行歌词数据搜索;
当判断结果为否时,需要从用户端获取用户输入的当前音乐文件的文件属性信息,从而系统可通过用户的输入获取当前音乐文件的文件属性信息。
步骤103:从所述搜索结果中选择一个歌词数据进行下载并将所述下载的歌词数据进行加载,在步骤102中得到的搜索结果可能会由于搜索引擎的具体实现而在不同的应用中相差很大,如何决定一个搜索结果进行下载属于现有技术,在此不赘述。
从上面实施例可以看出,本发明实施例中文件属性信息的获取方式有3种,包括:通过传统的在标签信息中获取;通过本发明实施例中的音乐文件信息数据库获取;从用户端获取用户输入的当前音乐文件的文件属性信息的方式获取。在通过上述三种方式中的任意一种方式获取到音乐文件的文件属性信息后,进入步骤102,以获取到的文件属性信息为关键词在网络上进行歌词数据搜索。
实施本发明实施例时,获取音乐文件的文件属性信息可通过如下步骤进行:首先通过传统的在标签信息中获取当前音乐文件属性信息,当从标签信息中未获取到文件属性信息后,再通过本发明实施例中的音乐文件信息数据库获取当前音乐文件属性信息,若从音乐文件信息数据库中获取文件属性信息失败,则需提示用户进行手动输入文件属性信息,在用户手动输入当前音乐文件属性信息(如歌曲名、歌手名中的一个或多个)后,从用户端获取用户输入的当前音乐文件的文件属性信息。
若用于搜索的当前音乐文件的文件属性信息是通过从用户端获取用户输入的当前音乐文件的文件属性信息的方式获取的,则所述从所述搜索结果中选择一个歌词数据进行下载步骤后,还包括:
将获取到的当前音乐文件的文件属性信息记录到音乐文件信息采集数据库,其进一步包括:
计算当前音乐文件的特征码,同样采用SHA-1计算特征码;
将所述特征码和所述文件属性信息录入音乐文件信息采集数据库。
所述音乐文件信息采集数据库与所述音乐文件信息数据库均存储于后台服务器,两数据库结构一样,均是基于表结构的记录体,其可以借助目前任何主流数据库产品,每一个表项可包括:特征码、文件属性信息和热度值。
当文件属性信息包括歌曲名和歌手名时,所述音乐文件信息采集数据库与所述音乐文件信息数据库结构均可以如表一所示:
表一:
  ID   Title   Performer   HotValue
  08c9e9138c86478bbb8d00e8276eb33d25c43349   Beat It   MichaelJackson   5000
  08c9e9138c86478bbb8d00e8276eb33d25c43349   Bea It   MJ   4302
  f6217f0f05c49258bfec82a1850faca02319e131   日不落   蔡依林   1335
  a5fd50c081e9d6246d72a586b6e4508d689d406f   我的兄弟姐妹   蔡琴   9434
  …   …   …   …
其中,ID表示音乐文件的特征码,使用SHA-1值作为音乐文件特征码,可以唯一标识一个音乐文件;Title表示音乐文件歌曲名,以字符串表示;Performer表示音乐文件歌手名,以字符串表示;HotValue是热度值,以正整数表示,表示在数据采集期间特征码为ID,输入歌曲名称为Title且输入歌手名为Performer的用户数量。显然,在“音乐文件信息数据库”中由(ID,Title,Performer)联合起来唯一标识一个数据项,即“音乐文件信息数据库”中不可能存在这样两个表项(IDi,Titlei,Performeri,HotValuei)和(IDj,Titlej,Performerj,HotValuej)满足条件IDi=IDj,Titlei=Titlej,Performeri=Performerj,HotValuei=HotValuej
音乐文件信息采集数据库的数据采集时间周期由运营商设定,可以为几小时到几天甚至几个月不等的时间,系统会定期根据所述音乐文件信息采集数据库更新所述音乐文件信息数据库,音乐文件信息采集数据库的建立是为了更好的为用户提供一个更合理的音乐文件信息数据库,当然在实际运用中,也可以在后台只设计一个音乐文件信息数据库,根据用户的输入信息实时更新此数据库内容,但是在此种情况下,同一个音乐文件的文件属性信息在数据库中就只能有一个记录,为最初从用户端获取的用户输入的第一个记录,这样的方式对文件属性信息的获取结果正确性会降低。
所述将所述特征码和所述文件属性信息录入音乐文件采集信息数据库步骤进一步包括:
检索所述特征码和所述文件属性信息组成的关键词组合,如特征码、歌曲名、歌手名组成的三元组(ID,Title,Performer)在音乐文件信息采集数据库中是否存在;
若存在,则将对应表项的热度值加1;
若不存在,则添加一个新的表项记录所述特征码和所述文件属性信息,新添表项的热度值记录为1。
在步骤101的B步骤中,通过所述特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息进一步包括:
检索该特征码在音乐文件信息数据库中对应的所有表项,如表一中特征码ID为08c9e9138c86478bbb8d00e8276eb33d25c43349的表项有2个,见表一中第一行和第二行;
获取所述检索出的所有表项中热度值最大的一个表项中的文件属性信息,即获取表一中,ID为08c9e9138c86478bbb8d00e8276eb33d25c43349的热度值5000的一项中的文件属性信息,歌曲名为Beat It,歌手名为Michael Jackson,选择HotValue值最大的作为输出结果,可以保证对同样一个音乐文件有最多用户选择对应的文件属性信息作为其搜索关键字,能保证获取的文件属性信息的正确性较高,进而通过获取的文件属性信息搜索出的歌词数据准确性也较高。
采用本发明实施例中的在线歌词数据匹配方法,当音乐文件信息数据库足够完整后,能完全实现传统播放器无法进行自动歌词匹配的音乐文件的自动歌词匹配,无需用户手动参与,提高了在线歌词匹配的准确性和及时性。
上面介绍了本发明实施例中在线歌词数据匹配的方法,下面结合图2、图3介绍本发明实施例中在线歌词数据匹配装置和后台数据装置。
参见图2,为本发明实施例中一种在线歌词数据匹配装置的结构示意图,包括
第一获取模块11,用于从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;所述第一获取模块11可包括:特征码计算单元111和获取单元112,其中:所述特征码计算单元111,用于计算当前音乐文件的特征码,特征码的计算是采用SHA-1计算的;所述获取单元112,与所述特征码计算单元111相连,用于根据所述特征码计算单元111计算出的特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息。
歌词搜索模块12,与所述第一获取模块11相连,用于根据获取的当前音乐文件的文件属性信息进行歌词数据搜索,得到搜索结果,以获取的文件属性信息作为关键词在网络上进行歌词数据搜索属于现有技术,在此不赘述;
加载模块13,与所述歌词搜索模块12相连,用于从所述搜索结果中选择一个歌词数据进行下载并将所述下载的歌词数据进行加载,搜索结果可能会由于搜索引擎的具体实现而在不同的应用中相差很大,如何决定一个搜索结果进行下载属于现有技术,在此不赘述。
若后台音乐文件信息数据库中不存在所述特征码对应的音乐文件的文件属性信息,则第一获取模块11将不能获取到当前音乐文件的文件属性信息,因此,本发明实施例提出的在线歌词数据匹配装置还可以包括:
输入模块14,分别与所述第一获取模块11中的获取单元112及所述歌词搜索模块12相连,用于在所述获取单元112从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息不成功时,获取用户手动输入的当前音乐文件的文件属性信息。
为了兼容现有技术,本发明实施例可首先选用目前主流的在线歌词数据匹配技术,此时,所述在线歌词数据匹配装置还包括:
第二获取模块15,分别与所述第一获取模块11和所述歌词搜索模块12相连,用于从当前音乐文件的标签信息中获取文件属性信息,从音乐文件的标签信息中获取文件属性信息在前面有详细介绍,在此不赘述;
此种情况下,所述第一获取模块11,用于在所述第二获取模块15从当前音乐文件的标签信息中获取文件属性信息不成功时,从音乐文件信息数据库中获取当前音乐文件的文件属性信息,以实现由于缺损标签协议头或其数据不正确而无法通过传统技术完成在线歌词数据匹配的音乐文件的歌词的自动匹配。
前述在线歌词数据匹配方法和在线歌词数据匹配装置均需要后台数据库的支持,下面将结合图3介绍本发明实施例中的一种后台数据装置。
参见图3,为本发明实施例中一种后台数据装置结构示意图,包括:
第一存储单元21,用于存储音乐文件信息数据库,所述音乐文件信息数据库是基于表结构的记录体,每一个表项包括:特征码、文件属性信息和热度值。
音乐文件数据库中的数据可以根据用户的输入实时更新此数据库内容,但是在此种情况下,同一个音乐文件的文件属性信息在数据库中就只能有一个记录,为最初从用户端获取的用户输入的第一个记录,这样的方式对文件属性信息的获取结果正确性会降低。
为了使获取的文件属性信息更加准确,可采取阶段性采集文件属性信息的方式更新音乐文件数据库,此时,所述后台数据装置还可包括:
第二存储单元22,用于存储音乐文件信息采集数据库,所述音乐文件信息采集数据库是与音乐文件信息数据库的结构完全一致,用于采集音乐文件属性信息,数据采集时间周期由运营商设定,可以为几小时到几天甚至几个月不等的时间,以能定期更新第一存储单元21内的音乐文件信息数据库,其结构在前面有详细介绍,在此不赘述。
录入单元23,与所述第二存储单元22相连,用于以用户输入方式获取音乐文件属性信息并成功下载歌词数据后,将用户输入的当前音乐文件的文件属性信息录入所述第二存储单元22内存储的音乐文件信息采集数据库里;
所述录入单元23可具体包括:
特征码计算单元231,用于计算当前音乐文件的特征码,计算方式可以为采用SHA-1计算;
检索单元231,分别与所述特征码计算单元231和所述第二存储单元22相连,用于检索所述特征码和所述文件属性信息组成的关键词组合在音乐文件信息采集数据库中是否存在,得出检索结果;
录入执行单元233,分别与所述特征码计算单元231、检索单元232和所述第二存储单元22相连,用于当所述检索单元232得出的检索结果为是时,将所述音乐文件采集信息数据库对应表项的热度值加1,当所述检索单元232得出的检索结果为否时,在所述音乐文件采集信息数据库中添加一个新的表项记录所述特征码和所述文件属性信息。
更新单元24,分别与所述第一存储单元21和所述第二存储单元22相连,用于定期根据所述第二存储单元22内的音乐文件信息采集数据库更新所述第一存储单元21内的音乐文件信息数据库,当音乐文件信息数据库足够完整后,能完全实现传统播放器无法进行自动歌词数据匹配的音乐文件的自动歌词匹配,无需用户手动参与,提高了在线歌词匹配的准确性和及时性。
实施本发明实施例,从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;根据所获取的当前音乐文件的文件属性信息进行歌词数据搜索,得到搜索结果;从所述搜索结果中选择一个歌词数据进行下载并将所述下载的歌词数据进行加载,能够针对传统播放器无法进行自动歌词匹配的音乐文件完成自动匹配,无需用户手动参与,提高了在线歌词匹配的准确性和及时性。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

Claims (16)

1.一种在线歌词数据匹配的方法,其特征在于,包括:
从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;
根据所获取的当前音乐文件的文件属性信息进行歌词数据搜索,得到搜索结果;
从所述搜索结果中选择至少一个歌词数据进行下载并将所述下载的歌词数据进行加载。
2.如权利要求1所述的方法,其特征在于,所述从音乐文件信息数据库中获取当前音乐文件的文件属性信息步骤之前,还包括:
创建音乐文件信息数据库,所述音乐文件信息数据库是基于表结构的记录体,每一个表项包括特征码和文件属性信息。
3.如权利要求2所述的方法,其特征在于,所述从音乐文件信息数据库中获取当前音乐文件的文件属性信息,进一步包括:
计算当前音乐文件的特征码;
通过所述特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息。
4.如权利要求3所述的方法,其特征在于,所述计算当前音乐文件的特征码是通过安全散列算法SHA-1计算而成。
5.如权利要求1至4中任一项所述的方法,其特征在于,所述根据所获取的当前音乐文件的文件属性信息进行歌词数据搜索步骤之前还包括:
判断从音乐文件信息数据库中获取当前音乐文件的文件属性信息是否成功;
当判断结果为否时,获取用户输入的当前音乐文件的文件属性信息。
6.如权利要求5所述的方法,其特征在于,若获取的当前音乐文件的文件属性信息是通过用获取用户输入的当前音乐文件的文件属性信息的方式获取的,则所述从所述搜索结果中选择一个歌词数据进行下载步骤后,还包括:
将获取到的当前音乐文件的文件属性信息记录到音乐文件信息采集数据库,其进一步包括:
计算当前音乐文件的特征码;
将所述特征码和所述文件属性信息录入音乐文件信息采集数据库。
7.如权利要求6所述的方法,其特征在于,所述音乐文件信息数据库和所述音乐文件信息采集数据库均是基于表结构的记录体,每一个表项包括:特征码、文件属性信息和热度值;
定期根据所述音乐文件信息采集数据库更新所述音乐文件信息数据库;
所述将所述特征码和所述文件属性信息录入音乐文件采集信息数据库步骤进一步包括:
检索所述特征码和所述文件属性信息组成的关键词组合在音乐文件信息采集数据库中是否存在;
若存在,则将对应表项的热度值加1;
若不存在,则添加一个新的表项记录所述特征码和所述文件属性信息。
8.如权利要求7所述的方法,其特征在于,通过所述特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息进一步包括:
检索该特征码在音乐文件信息数据库中对应的所有表项;
获取所述检索出的所有表项中热度值最大的一个表项中的文件属性信息。
9.如权利要求1所述的方法,其特征在于,所述从音乐文件信息数据库中获取当前音乐文件的文件属性信息步骤包括:
从当前音乐文件的标签信息中获取文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;
判断从当前音乐文件的标签信息中获取文件属性信息是否成功;
当判断结果为否时,从音乐文件信息数据库中获取当前音乐文件的文件属性信息。
10.一种在线歌词数据匹配的装置,其特征在于,包括:
第一获取模块,用于从音乐文件信息数据库中获取当前音乐文件的文件属性信息,所述文件属性信息包括歌曲名、歌手名信息中的一个或多个;
歌词搜索模块,与所述第一获取模块相连,用于根据获取的当前音乐文件的文件属性信息进行歌词数据搜索,得到搜索结果;
加载模块,与所述歌词搜索模块相连,用于从所述搜索结果中选择至少一个歌词数据进行下载并将所述下载的歌词数据进行加载。
11.如权利要求10所述的装置,其特征在于,所述第一获取模块包括:
特征码计算单元,用于计算当前音乐文件的特征码;
获取单元,与所述特征码计算单元相连,用于根据所述特征码计算单元计算出的特征码从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息。
12.如权利要求11所述的装置,其特征在于,所述装置还包括:
输入模块,分别与所述第一获取模块中的获取单元及所述歌词搜索模块相连,用于在所述获取单元从音乐文件信息数据库中获取该特征码对应的音乐文件的文件属性信息不成功时,获取用户输入的当前音乐文件的文件属性信息。
13.如权利要求12所述的装置,其特征在于,所述装置还包括:
第二获取模块,分别与所述第一获取模块和所述歌词搜索模块相连,用于从当前音乐文件的标签信息中获取文件属性信息;
所述第一获取模块,用于在所述第二获取模块从当前音乐文件的标签信息中获取文件属性信息不成功时,从音乐文件信息数据库中获取当前音乐文件的文件属性信息。
14.一种后台数据装置,其特征在于,包括:
第一存储单元,用于存储音乐文件信息数据库,所述音乐文件信息数据库是基于表结构的记录体,每一个表项包括:特征码、文件属性信息和热度值。
15.如权利要求14所述的装置,其特征在于,还包括:
第二存储单元,用于存储音乐文件信息采集数据库,所述音乐文件信息采集数据库是基于表结构的记录体,每一个表项包括:特征码、文件属性信息和热度值;
录入单元,与所述第二存储单元相连,用于以用户输入方式获取音乐文件属性信息并成功下载歌词数据后,将用户输入的当前音乐文件的文件属性信息录入所述第二存储单元内的音乐文件信息采集数据库;
更新单元,分别与所述第一存储单元和所述第二存储单元相连,用于定期根据所述第二存储单元内的音乐文件信息采集数据库更新所述第一存储单元内的音乐文件信息数据库。
16.如权利要求15所述的装置,其特征在于,所述录入单元包括:
特征码计算单元,用于计算当前音乐文件的特征码;
检索单元,分别与所述特征码计算单元和所述第二存储单元相连,用于检索所述特征码和所述文件属性信息组成的关键词组合在音乐文件信息采集数据库中是否存在,得出检索结果;
录入执行单元,分别与所述特征码计算单元、检索单元和所述第二存储单元相连,用于当所述检索单元得出的检索结果为是时,将所述音乐文件采集信息数据库对应表项的热度值加1,当所述检索单元得出的检索结果为否时,在所述音乐文件采集信息数据库中添加一个新的表项记录所述特征码和所述文件属性信息。
CN2010101533363A 2010-04-16 2010-04-16 在线歌词数据匹配的方法、装置及后台数据装置 Pending CN102222074A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101533363A CN102222074A (zh) 2010-04-16 2010-04-16 在线歌词数据匹配的方法、装置及后台数据装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101533363A CN102222074A (zh) 2010-04-16 2010-04-16 在线歌词数据匹配的方法、装置及后台数据装置

Publications (1)

Publication Number Publication Date
CN102222074A true CN102222074A (zh) 2011-10-19

Family

ID=44778629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101533363A Pending CN102222074A (zh) 2010-04-16 2010-04-16 在线歌词数据匹配的方法、装置及后台数据装置

Country Status (1)

Country Link
CN (1) CN102222074A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102497448A (zh) * 2011-12-26 2012-06-13 深圳市五巨科技有限公司 一种移动终端在线音乐播放的方法及系统
CN102999637A (zh) * 2012-12-29 2013-03-27 珠海金山办公软件有限公司 根据文件特征码为文件自动添加文件标签的方法及系统
CN103049578A (zh) * 2013-01-15 2013-04-17 深圳市宜搜科技发展有限公司 一种获取歌曲信息的方法及系统
CN103092859A (zh) * 2011-11-02 2013-05-08 腾讯科技(深圳)有限公司 一种获取音乐文件信息的方法及装置
CN103853778A (zh) * 2012-12-04 2014-06-11 大陆汽车投资(上海)有限公司 音乐标签信息更新、音乐推送的方法及相应装置、系统
CN104142936A (zh) * 2013-05-07 2014-11-12 腾讯科技(深圳)有限公司 匹配音视频的方法和装置
CN106126748A (zh) * 2016-07-22 2016-11-16 广东欧珀移动通信有限公司 歌词匹配的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063970A (zh) * 2006-04-24 2007-10-31 亿览在线网络技术(北京)有限公司 一种基于音频特征码识别技术的音频文件管理方法和系统
CN101075308A (zh) * 2006-11-08 2007-11-21 腾讯科技(深圳)有限公司 一种编辑电子邮件的方法
CN101206900A (zh) * 2007-11-23 2008-06-25 深圳市同洲电子股份有限公司 一种歌词显示的方法及系统
CN101312565A (zh) * 2007-05-25 2008-11-26 上海美通无线网络信息有限公司 在手机播放音乐文件时同步浏览歌词的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063970A (zh) * 2006-04-24 2007-10-31 亿览在线网络技术(北京)有限公司 一种基于音频特征码识别技术的音频文件管理方法和系统
CN101075308A (zh) * 2006-11-08 2007-11-21 腾讯科技(深圳)有限公司 一种编辑电子邮件的方法
CN101312565A (zh) * 2007-05-25 2008-11-26 上海美通无线网络信息有限公司 在手机播放音乐文件时同步浏览歌词的方法
CN101206900A (zh) * 2007-11-23 2008-06-25 深圳市同洲电子股份有限公司 一种歌词显示的方法及系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092859A (zh) * 2011-11-02 2013-05-08 腾讯科技(深圳)有限公司 一种获取音乐文件信息的方法及装置
CN103092859B (zh) * 2011-11-02 2016-03-23 腾讯科技(深圳)有限公司 一种获取音乐文件信息的方法及装置
CN102497448A (zh) * 2011-12-26 2012-06-13 深圳市五巨科技有限公司 一种移动终端在线音乐播放的方法及系统
CN103853778A (zh) * 2012-12-04 2014-06-11 大陆汽车投资(上海)有限公司 音乐标签信息更新、音乐推送的方法及相应装置、系统
CN102999637A (zh) * 2012-12-29 2013-03-27 珠海金山办公软件有限公司 根据文件特征码为文件自动添加文件标签的方法及系统
CN102999637B (zh) * 2012-12-29 2015-11-18 珠海金山办公软件有限公司 根据文件特征码为文件自动添加文件标签的方法及系统
CN103049578A (zh) * 2013-01-15 2013-04-17 深圳市宜搜科技发展有限公司 一种获取歌曲信息的方法及系统
CN104142936A (zh) * 2013-05-07 2014-11-12 腾讯科技(深圳)有限公司 匹配音视频的方法和装置
CN106126748A (zh) * 2016-07-22 2016-11-16 广东欧珀移动通信有限公司 歌词匹配的方法及装置
CN106126748B (zh) * 2016-07-22 2019-07-12 Oppo广东移动通信有限公司 歌词匹配的方法及装置

Similar Documents

Publication Publication Date Title
CN102222074A (zh) 在线歌词数据匹配的方法、装置及后台数据装置
CN101167075B (zh) 专有表现抽取装置、方法以及程序
US9053183B2 (en) System and method for storing and retrieving non-text-based information
US10445809B2 (en) Relationship discovery engine
US9268847B2 (en) Information processing device, information processing method, and program for the same
US7707231B2 (en) Creating standardized playlists and maintaining coherency
CN100461261C (zh) 乐曲认识方法与系统
JP4750814B2 (ja) コンテキスト広告情報を露出する広告方法及びそのシステム
US20110225150A1 (en) Automatically Acquiring Acoustic Information About Music
CN104899302A (zh) 向用户推荐音乐的方法和装置
US20040267715A1 (en) Processing TOC-less media content
US20090055390A1 (en) Information sorting device and information retrieval device
JP5066963B2 (ja) データベース構築装置
US8751494B2 (en) Constructing album data using discrete track data from multiple sources
US20110046955A1 (en) Speech processing apparatus, speech processing method and program
CN107885745A (zh) 一种歌曲推荐方法及装置
US20190138548A1 (en) Generating playlists using calendar, location and event data
JP2008083914A (ja) データ再生機能を有する電子装置
CN105824861A (zh) 一种推荐音频的方法和移动终端
WO2005059775A1 (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US20060253433A1 (en) Method and apparatus for knowledge-based music searching and method and apparatus for managing music file
US10776421B2 (en) Music search system, music search method, server device, and program
JP2001306580A (ja) 音楽データベース検索装置
CN106775567B (zh) 一种音效匹配方法及系统
CN101925897B (zh) 建议用于与内容数据项同步再现的伴奏乐曲的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20111019