CN101071422A - 一种音乐文件搜索处理系统及方法 - Google Patents

一种音乐文件搜索处理系统及方法 Download PDF

Info

Publication number
CN101071422A
CN101071422A CNA2006100611886A CN200610061188A CN101071422A CN 101071422 A CN101071422 A CN 101071422A CN A2006100611886 A CNA2006100611886 A CN A2006100611886A CN 200610061188 A CN200610061188 A CN 200610061188A CN 101071422 A CN101071422 A CN 101071422A
Authority
CN
China
Prior art keywords
search
title
search results
information
singer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100611886A
Other languages
English (en)
Other versions
CN101071422B (zh
Inventor
余祥鑫
熊应
刘致远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN2006100611886A priority Critical patent/CN101071422B/zh
Priority to PCT/CN2007/070114 priority patent/WO2007147359A1/zh
Publication of CN101071422A publication Critical patent/CN101071422A/zh
Application granted granted Critical
Publication of CN101071422B publication Critical patent/CN101071422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种音乐文件搜索处理系统,包括利用现有的搜索技术从互联网获取音乐文件的第一搜索结果的音乐文件搜索子系统和将最终搜索结果展现给用户的搜索结果输出子系统,还包括:搜索结果修正子系统,用于利用现有音乐信息修正第一搜索结果中搜索条目的音乐信息,并形成最终搜索结果。同时本发明还公开了一种音乐文件搜索处理方法。本发明通过对现有技术的搜索结果利用过滤条件过滤广告、欺骗信息,利用现有音乐信息修正歌手名称、歌曲名称和专辑名称,在保证搜索数量的基础上,有效地提高了搜索结果的质量,减少了广告和欺骗的出现次数,能提供给用户歌曲更准确的信息。

Description

一种音乐文件搜索处理系统及方法
技术领域
本发明涉及音乐文件的搜索技术,对利用现有技术搜索到的音乐文件进行进一步处理的系统和方法。
背景技术
目前的音乐信息采集主要有以下两种方式:使用爬虫对整个互联网进行爬行和对专门的音乐网站进行爬行。
通过使用爬虫对整个互联网进行爬行,并从中提取出与音乐文件有关的链接,保存其对应的锚文本、标题等文本信息,并对这部分文本建索引,用户通过输入关键字在其中进行检索,然后通过搜索结果输出系统展现给用户,由用户进行选择处理。目前,如百度、一搜、中搜等搜索引擎都是采用这种方式进行处理。
通过使用爬虫对整个互联网进行爬行,可搜索的链接数量较多,需要人工干预较少,然而其信息的准确率较低,常出现以下的错误:
信息不完整,如缺少歌曲名、歌手、专辑名称等中的一个或多个;
信息填写不准确,比如出现错别字、错误写法等;
歌曲描述信息为无意义的广告或乱码;
歌曲描述信息与真实内容不符;
故意堆砌大量广告关键字或热门歌曲名进行欺骗。
图1所示为利用现有技术进行搜索后得到的结果示意图,如图1所示,其中:
第2条搜索信息中,歌曲名中的“舞娘”应该是专辑名,而不是歌曲名的一部分;
第10条搜索信息中,歌曲名中的“爱娱乐”是提供该歌曲的网站名称,属于广告文字;
第11条搜索信息中,歌曲名写法不完全正确,并且此条目缺少歌手与专辑名;
第16条,搜索信息中,歌曲名中的最后一个字是乱码,且缺少歌手与专辑名称。
至于利用对专门的音乐网站进行爬行获取音乐文件的方法,其可以获得比较准确的信息,然而由于该方法使用人工维护的模板来提取页面上的音乐文件和描述信息,能采集到的音乐链接文件数量有限。
发明内容
为解决现有技术中搜索音乐无法同时兼顾数量与准确度的问题,本发明的目的在于提供一种音乐文件搜索处理系统和搜索方法,对音乐文件进行搜索,在满足数量的同时,尽可能给用户提供准确的搜索结果。
为实现上述目的,本发明提供了一种音乐文件搜索处理系统,包括音乐文件搜索子系统和搜索结果输出子系统,其中,还包括:
搜索结果修正子系统,用于利用现有音乐信息修正第一搜索结果中搜索条目的音乐信息,并形成最终搜索结果。
上述的系统,其中,所述搜索结果修正子系统还用于利用过滤条件过滤第一搜索结果中用户不需要的搜索条目。
上述的系统,其中,所述用户不需要的搜索条目为包括广告、欺骗信息的搜索条目。
上述的系统,其中,所述音乐信息包括歌曲名称、歌手名称和专辑名称。
上述的系统,其中,所述搜索结果修正子系统具体包括:
音乐信息保存模块,用于保存歌曲名称、歌手名称及专辑名称;
分词模块,用于对第一搜索结果中的每一搜索条目的以文本形式保存的锚文本、网页标题和Tag(标签)内容进行分词处理;
过滤模块,用于保存过滤条件,并根据过滤条件对所述用户不需要的搜索条目进行过滤;
歌曲信息修正模块,用于根据分词、过滤后的词语以及音乐信息保存模块中的音乐信息确定每个搜索条目正确的歌曲名称、歌手名称和专辑名称,并形成最终搜索结果。
上述的系统,其中,所述搜索结果修正子系统还包括:
文件哈希信息模块,用于保存已确定音乐信息的音乐文件的哈希信息。
为了更好的实现上述目的,本发明还提供了一种音乐文件搜索处理方法,包括:
步骤S1,利用现有的搜索技术从互联网获取音乐文件的第一搜索结果;
步骤S2,利用现有音乐信息修正第一搜索结果中搜索条目的音乐信息,并形成最终搜索结果;
步骤S3,将最终搜索结果展现给用户。
上述的方法,其中,所述步骤S2中,还利用过滤条件过滤第一搜索结果中用户不需要的搜索条目后形成最终搜索结果。
上述的方法,其中,所述用户不需要的搜索条目为包括广告、欺骗信息的搜索条目。
上述的方法,其中,所述音乐信息包括歌曲名称、歌手名称和专辑名称。
上述的方法,其中,所述步骤S2具体包括:
步骤S21,对第一搜索结果中的每一搜索条目的以文本形式保存的锚文本、网页标题和Tag内容进行分词处理;
步骤S22,根据过滤条件对所述用户不需要的搜索条目进行过滤;
步骤S23,用于根据分词、过滤后的词语以及音乐信息保存模块中的音乐信息确定每个搜索条目正确的歌曲名称、歌手名称和专辑名称,并形成最终搜索结果。
本发明的音乐文件搜索处理系统和搜索方法通过对现有技术的搜索结果利用过滤条件过滤广告、欺骗信息,利用现有音乐信息修正歌手名称、歌曲名称和专辑名称,在保证搜索数量的基础上,有效地提高了搜索结果的质量,减少了广告和欺骗的出现次数,能提供给用户歌曲更准确的信息。
附图说明
图1为利用现有技术进行搜索得到的结果示意图;
图2为本发明的音乐搜索处理系统的结构示意图;
图3为本发明的音乐搜索处理方法的流程示意图。
具体实施方式
图2为本发明的音乐文件搜索处理系统的结构示意图,如图2所示,其包括:
音乐文件搜索子系统,用于利用现有的搜索技术从互联网获取音乐文件的第一搜索结果,如可以利用爬虫对整个互联网爬行,并从中提取出与音乐文件有关的链接,保存其对应的锚文本、标题、Tag等文本信息,并对这部分文本建索引;
搜索结果修正子系统,用于接收音乐文件搜索子系统获取的第一搜索结果,并对第一搜索结果进行修正处理,形成最终搜索结果;
搜索结果输出子系统,用于将通过修正处理后形成的最终搜索结果展现给用户。
由于音乐文件搜索子系统和搜索结果输出子系统为现有技术,在此不再赘述。
下面结合附图对本发明的音乐文件搜索处理系统中的搜索结果修正子系统进行详细描述。
互联网所提供的供搜索的音乐大部分是由唱片公司正式发行的歌曲,本发明正是基于这一点进行第一搜索结果的修正处理,如图3所示,搜索结果修正子系统包括音乐信息保存模块、分词模块、过滤模块及歌曲信息修正模块,下面分别对各模块进行详细说明。
音乐信息保存模块,用于保存歌曲名称、歌曲对应的歌手名称及专辑名称等音乐信息,如下表所示,为其中的一种实现方式:
  序号     歌曲名称     歌手名称     专辑名称
  1     A1     A2     A3
2 B1     B21     B31
    B22     B32
3 C1 C2     C31
    C32
... ... ...
上表中描述了多种情况:
1、歌曲A1,唯一由歌手A2演唱,其对应的专辑为A3
2、歌曲B1,歌手B21和B22都演唱过,其对应的专辑为B31和B32;
3、歌曲C1,唯一由歌手C2演唱,但该歌在两张专辑C31和C32中出现。
当然上述只是一种示范,一首歌也可以由两位以上的歌手演唱,也可以出现在2张以上的专辑都有可能。
也可以利用另外的方式实现音乐信息的保存:
存储所有专辑的信息,包括专辑中的歌曲和对应的歌手名称;或
存储所有歌手的信息,包括歌手名称、演唱过的歌曲名称和歌曲对应的专辑名称。
歌曲信息可以保存在一个保存模块中,也可以分多个模块进行保存。
分词模块,用于对第一搜索结果中的每一搜索条目的以文本形式保存的锚文本、网页标题和Tag内容进行分词处理;
上述的分词处理分为两种情况:
锚文本、网页标题和Tag内容中存在空格和/或标点符号时,以空格和/或标点符号作为分隔符对文本进行分词,如“周杰伦-夜曲”会被切分为“周杰伦”和“夜曲”两个词;
锚文本、网页标题和Tag内容中没有分隔符隔开时,如“周杰伦夜曲”,因为其中不带有分隔符,因此使用上述的利用分隔符分词的方法无法实现分词,在此,本发明使用音乐信息保存模块中的歌曲信息、歌手信息及专辑信息作为词典,用分词方法实现分词,如逆向最大匹配法、正向最大匹配法、基于统计的分词方法等分词方法进行分词,当然也可以多种分词方法结合起来实现分词,如将正向最大匹配法和逆向最大匹配法结合起来构成双向匹配法实现分词。
一般来说,歌手名称、歌曲名称、专辑名称等均为专有名词,较少产生歧义,使用上述方法进行分词即可达到较好的效果,如如“周杰伦夜曲”也会被正确切分为“周杰伦”和“夜曲”两个词;
对文本形式保存的锚文本、网页标题和Tag内容进行分词处理后,第一搜索结果中的每一个条目的锚文本、网页标题和Tag内容都转化为一个或一组词语,如上面的例子中就被转化为“周杰伦”和“夜曲”两个词语。
分词结束后接着由过滤模块来过滤广告、欺骗信息等对用户来说没有任何意义的信息。
过滤模块中保存有过滤条件,用于根据过滤条件对广告或欺骗信息等用户不需要的信息进行过滤,如果发现符合过滤条件,则将第一搜索结果中的相关条目去除。
其中过滤条件主要包括两部分:动作和要比较的值,其中动作可以是包括、相同、长度大于、长度小于等多种动作,例如“包括WWW”是一条过滤条件、“包括XX”(XX为某些色情或反动的词汇)也是一条过滤条件,如果分词后的一个或多个词汇满足过滤条件,则将第一搜索结果中的相关条目去除。如,分词后的词组中包括“WWW”或“XX”等,则将相应的条目去除。
上述的过滤条件可随时进行修改、删除、增加等操作。
同时,在第一搜索结果中,还有可能出现以下的情况:由于音乐网站会在标题中罗列大量的热门歌曲来提高自己的排名,但并不提供真实的内容。
对于上述情况,本发明中的过滤模块还用于根据另外的过滤条件过滤这种搜索条目,处理流程如下:
首先,统计第一搜索结果中来自同一网站的搜索条目的总数;
其次,统计各搜索条目的分词后的词语在该网站的搜索条目中出现的次数;
最后,判断二者之间的比例,如果超过一定的阈值(如50%)时,即可判定为欺骗信息,将第一搜索结果中的相应条目去除。
如从某网站下共采集了1000条搜索条目,其中“七里香”在搜索条目的标题中出现了超过500次,则可判断这个词语被该网站用来当作欺骗信息,因此删除相关条目。
通过上述的处理后,基本过滤了欺骗信息、广告信息以及其他一些不是用户所需要的信息,得到了一组过滤后的词语。
结合图2所示,上述的对过滤模块的描述中,过滤条件保存在过滤模块中,当然,也可以将过滤条件保存在音乐信息保存模块中,并将过滤模块与音乐信息保存模块连接,在进行过滤处理的时候,由过滤模块调用过滤条件进行过滤即可实现。
在过滤模块对分词后的锚文本、网页标题和Tag内容的词组过滤掉部分搜索条目后,得到了一组过滤后的词语。
歌曲信息修正模块,用于根据分词、过滤后的词语以及音乐信息保存模块中的信息确定每个搜索条目的歌曲的名称、对应的歌手名称和专辑名称。
下面对歌曲信息修正模块的处理进行详细描述,其包括歌曲名称确定步骤、歌手名称确定步骤和专辑名称确定步骤,其中:
歌曲名称确定步骤,将分词、过滤后的词语按锚文本、标题、Tag的顺序排序,然后依次与音乐信息保存模块中的歌曲名称进行匹配查找,看是否有完全匹配的词语,如果有,将第一个匹配的词语作为歌曲名称,否则将评判标准之上的相似度最高的词语作为歌曲名称。
在此,相似度的定义为:S1与S2相同的字符数与S1与S2的平均长度的比值,其中,S1与S2与比对的两个词语,“ABC”与”BCA”的相似度为100%,而“ABC”与”BCD”的相似度为67%,而“ABC”与”BA”的相似度为80%。
在此,相似度的评判标准应该设置一个合适的值,如70%,如果相似度低于70%则不能将其作为歌曲名称。
歌手名称确定步骤,在确定歌曲名称之后,如果音乐信息保存模块中该歌曲对应的歌手名称是唯一的,则可同时确定歌手名,否则说明这是一首曾被多人翻唱过的同名歌曲,因此,将分词、过滤后的词语按锚文本、标题、Tag的顺序依次与歌曲名称对应的歌手名称进行匹配查找,看是否有完全匹配的词语,如果有,将第一个匹配的词语作为歌曲名称,否则将评判标准之上的相似度最高的词语作为歌手名称,如果找不到,则将歌手名称项留空。
专辑名称确定步骤,在确定了歌曲名称和歌手名称之后,如果音乐信息保存模块中该歌曲对应的专辑名称是唯一的,则可确定专辑名称,否则将分词、过滤后的词语按锚文本、标题、Tag的顺序依次与歌曲名称对应的专辑名称进行匹配查找,看是否有完全匹配的词语,如果有,将第一个匹配的词语作为专辑名称,否则将评判标准之上的相似度最高的词语作为专辑名称,如果找不到,则将专辑名称项留空。
在每个搜索条目的歌曲的名称、对应的歌手名称和专辑名称确定后,将第一搜索结果中的对应信息进行替换由搜索结果输出子系统展现给用户。
同时,本发明的音乐文件搜索处理系统中还包括一个文件哈希信息模块,用于保存音乐文件的哈希信息。其数据保存格式如下:
    文件哈希码     歌曲名称     歌手名称     专辑名称
    0x1234ABCD     A1     B1     C1
    0x5678CDEF     A2     B2     C2
    ...     ...     ...     ...
其中,文件哈希码可以是一个32位或64位的整数,常用的哈希算法有CRC32、MD5等。
一般来说,互联网上的歌曲都存在一个文件多份拷贝的情况。假设我们可以确定某音乐文件F的准确信息,则可以将这一信息保存在文件哈希信息库中。这样,在以后遇到与F的哈希值相同的文件时(即F的其它拷贝),可以直接从文件哈希信息模块查找歌曲的准确信息。
如果两个文件F1和F2用同一算法所计算出来的哈希码相等,则可认为F1和F2的内容完全相等,即F2是F1的一个拷贝。
本发明的音乐文件搜索处理方法主要包括如下步骤:
步骤S1,利用现有的搜索技术从互联网获取音乐文件的第一搜索结果;
步骤S2,接收音乐文件搜索子系统获取的第一搜索结果,并对第一搜索结果进行修正处理,形成最终搜索结果后展现给用户。
其中,步骤S2具体包括:
步骤S21,对第一搜索结果中的每一搜索条目的以文本形式保存的锚文本、网页标题和Tag内容进行分词处理;
步骤S22,根据过滤条件和分词后的词组对第一搜索结果进行过滤操作,过滤广告、欺骗信息等对用户来说没有任何意义的信息;
步骤S23,根据过滤后的词组,结合音乐信息保存模块中的歌曲信息确定每个搜索条目的歌曲的名称、对应的歌手名称和专辑名称;
步骤S24,将第一搜索结果中每个搜索条目的歌曲名称、歌手名称和专辑名称对应替换为步骤S23中确定的每个搜索条目的歌曲的名称、对应的歌手名称和专辑名称;
步骤S25,将最后的搜索结果展现给用户。
这样,通过本发明的音乐文件搜索处理系统和方法处理过后展现给用户的搜索结果已经排除了大部分的广告、欺骗信息,同时其结果也得到了修正,展现给用户的是正确的歌曲名称、歌手名称和专辑名称。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种音乐文件搜索处理系统,包括用于从互联网获取音乐文件的第一搜索结果的音乐文件搜索子系统和将最终搜索结果展现给用户的搜索结果输出子系统,其特征在于,还包括:
搜索结果修正子系统,用于利用现有音乐信息修正第一搜索结果中搜索条目的音乐信息,并形成最终搜索结果。
2.根据权利要求1所述的一种音乐文件搜索处理系统,其特征在于,所述搜索结果修正子系统还用于利用过滤条件过滤第一搜索结果中用户不需要的搜索条目。
3.根据权利要求2所述的一种音乐文件搜索处理系统,其特征在于,所述用户不需要的搜索条目为包括广告、欺骗信息的搜索条目。
4.根据权利要求2所述的一种音乐文件搜索处理系统,其特征在于,所述音乐信息包括歌曲名称、歌手名称和专辑名称。
5.根据权利要求4所述的一种音乐文件搜索处理系统,其特征在于,所述搜索结果修正子系统具体包括:
音乐信息保存模块,用于保存歌曲名称、歌手名称及专辑名称;
分词模块,用于对第一搜索结果中的每一搜索条目的以文本形式保存的锚文本、网页标题和标签内容进行分词处理;
过滤模块,用于保存过滤条件,并根据过滤条件对所述用户不需要的搜索条目进行过滤;
歌曲信息修正模块,用于根据分词、过滤后的词语以及音乐信息保存模块中的音乐信息确定每个搜索条目正确的歌曲名称、歌手名称和专辑名称,并形成最终搜索结果。
6.根据权利要求5所述的音乐文件搜索处理系统,其特征在于,所述搜索结果修正子系统还包括:
文件哈希信息模块,用于保存已确定音乐信息的音乐文件的哈希信息。
7.一种音乐文件搜索处理方法,包括:
步骤S1,通过互联网获取音乐文件的第一搜索结果;
步骤S2,利用现有音乐信息修正第一搜索结果中搜索条目的音乐信息,并形成最终搜索结果;
步骤S3,将最终搜索结果展现给用户。
8.根据权利要求7所述的音乐文件搜索处理方法,其特征在于,所述步骤S2中,还利用过滤条件过滤第一搜索结果中用户不需要的搜索条目后形成最终搜索结果。
9.根据权利要求8所述的一种音乐文件搜索处理方法,其特征在于,所述用户不需要的搜索条目为包括广告、欺骗信息的搜索条目。
10.根据权利要求8所述的一种音乐文件搜索处理方法,其特征在于,所述音乐信息包括歌曲名称、歌手名称和专辑名称。
11.根据权利要求10所述的一种音乐文件搜索处理方法,其特征在于,所述步骤S2具体包括:
步骤S21,对第一搜索结果中的每一搜索条目的以文本形式保存的锚文本、网页标题和标签内容进行分词处理;
步骤S22,根据过滤条件对所述用户不需要的搜索条目进行过滤;
步骤S23,用于根据分词、过滤后的词语以及音乐信息保存模块中的音乐信息确定每个搜索条目正确的歌曲名称、歌手名称和专辑名称,并形成最终搜索结果。
12.根据权利要求11所述的一种音乐文件搜索处理方法,其特征在于,所述步骤S23具体包括:
歌曲名称确定步骤,将分词、过滤后的词语按锚文本、标题、标签的顺序排序,然后依次与音乐信息保存模块中的歌曲名称进行匹配查找,并将第一个完全匹配的词语作为歌曲名称,否则将评判标准之上的相似度最高的词语作为歌曲名称;
歌手名称确定步骤,如果音乐信息保存模块中该歌曲名称对应的歌手名称是唯一的,则确定为歌手名称,否则将分词、过滤后的词语按锚文本、标题、标签的顺序依次与歌曲名称对应的歌手名称进行匹配查找,将第一个完全匹配的词语作为歌曲名称,否则将评判标准之上的相似度最高的词语作为歌手名称,如果找不到,则将歌手名称项留空;
专辑名称确定步骤,如果音乐信息保存模块中该歌曲名称和歌手名称对应的专辑名称是唯一的,则确定为专辑名称,否则将分词、过滤后的词语按锚文本、标题、标签的顺序依次与对应的专辑名称进行匹配查找,并将第一个完全匹配的词语作为专辑名称,否则将评判标准之上的相似度最高的词语作为专辑名称,如果找不到,则将专辑名称项留空。
13.根据权利要求12所述的音乐文件搜索处理方法,其特征在于,相似度为匹配对比的词组的相同的字符数与匹配对比的词组的平均长度的比值。
14.根据权利要求8所述的音乐文件搜索处理方法,其特征在于,所述现有音乐信息还包括歌曲的哈希码。
CN2006100611886A 2006-06-15 2006-06-15 一种音乐文件搜索处理系统及方法 Active CN101071422B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2006100611886A CN101071422B (zh) 2006-06-15 2006-06-15 一种音乐文件搜索处理系统及方法
PCT/CN2007/070114 WO2007147359A1 (fr) 2006-06-15 2007-06-14 Système et procédé permettant de rectifier les informations d'un fichier multimédia

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100611886A CN101071422B (zh) 2006-06-15 2006-06-15 一种音乐文件搜索处理系统及方法

Publications (2)

Publication Number Publication Date
CN101071422A true CN101071422A (zh) 2007-11-14
CN101071422B CN101071422B (zh) 2010-10-13

Family

ID=38833082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100611886A Active CN101071422B (zh) 2006-06-15 2006-06-15 一种音乐文件搜索处理系统及方法

Country Status (2)

Country Link
CN (1) CN101071422B (zh)
WO (1) WO2007147359A1 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207941A (zh) * 2010-03-29 2011-10-05 上海博泰悦臻电子设备制造有限公司 车载音乐的提供、获取方法和装置以及车载音乐传输系统
CN102289439A (zh) * 2010-06-18 2011-12-21 上海博泰悦臻电子设备制造有限公司 音乐文件提供方法及其提供系统
CN102289440A (zh) * 2010-06-18 2011-12-21 上海博泰悦臻电子设备制造有限公司 音乐文件提供方法及其提供系统
CN102662957A (zh) * 2012-03-02 2012-09-12 百度在线网络技术(北京)有限公司 用于优化浏览器的搜索结果页面的装置及方法
CN102929874A (zh) * 2011-08-08 2013-02-13 深圳市快播科技有限公司 检索数据的排序方法及装置
CN103049578A (zh) * 2013-01-15 2013-04-17 深圳市宜搜科技发展有限公司 一种获取歌曲信息的方法及系统
CN103150595A (zh) * 2011-12-06 2013-06-12 腾讯科技(深圳)有限公司 数据处理系统中的自动配对选择方法和装置
CN104484379A (zh) * 2014-12-09 2015-04-01 百度在线网络技术(北京)有限公司 确定音乐实体关系的方法和装置及查询处理方法和装置
CN105608129A (zh) * 2015-12-16 2016-05-25 北京奇虎科技有限公司 文件清理方法、装置及系统、移动终端
CN105808627A (zh) * 2014-12-31 2016-07-27 高德软件有限公司 Poi信息更新、检索、poi数据包生成方法及装置
CN107077509A (zh) * 2016-11-25 2017-08-18 深圳前海达闼云端智能科技有限公司 一种改进浏览体验的方法、装置和设备
CN108319635A (zh) * 2017-12-15 2018-07-24 海南智媒云图科技股份有限公司 一种多平台音乐资源整合播放的方法、电子设备及存储介质
CN108463816A (zh) * 2016-12-09 2018-08-28 谷歌有限责任公司 通过使用自动变体检测来防止禁止网络内容的分发
WO2018184510A1 (zh) * 2017-04-07 2018-10-11 腾讯科技(深圳)有限公司 分词方法、装置及存储介质
CN109543064A (zh) * 2018-11-30 2019-03-29 北京微播视界科技有限公司 歌词显示处理方法、装置、电子设备及计算机存储介质
CN110717062A (zh) * 2018-07-11 2020-01-21 阿里巴巴集团控股有限公司 音乐搜索及车载音乐播放方法、装置、设备以及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827074A (zh) * 2019-10-31 2020-02-21 夏振宇 采用视频语音分析进行广告投放评估的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5751672A (en) * 1995-07-26 1998-05-12 Sony Corporation Compact disc changer utilizing disc database
US20050065912A1 (en) * 2003-09-02 2005-03-24 Digital Networks North America, Inc. Digital media system with request-based merging of metadata from multiple databases
JP2005309712A (ja) * 2004-04-21 2005-11-04 Sharp Corp 楽曲検索システムおよび楽曲検索方法
JP4189758B2 (ja) * 2004-06-30 2008-12-03 ソニー株式会社 コンテンツ記憶装置、コンテンツ記憶方法、コンテンツ記憶プログラム、コンテンツ転送装置、コンテンツ転送プログラム及びコンテンツ転送記憶システム

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207941A (zh) * 2010-03-29 2011-10-05 上海博泰悦臻电子设备制造有限公司 车载音乐的提供、获取方法和装置以及车载音乐传输系统
CN102289439A (zh) * 2010-06-18 2011-12-21 上海博泰悦臻电子设备制造有限公司 音乐文件提供方法及其提供系统
CN102289440A (zh) * 2010-06-18 2011-12-21 上海博泰悦臻电子设备制造有限公司 音乐文件提供方法及其提供系统
CN102289439B (zh) * 2010-06-18 2014-10-22 上海博泰悦臻电子设备制造有限公司 音乐文件提供方法及其提供系统
CN102929874A (zh) * 2011-08-08 2013-02-13 深圳市快播科技有限公司 检索数据的排序方法及装置
CN103150595A (zh) * 2011-12-06 2013-06-12 腾讯科技(深圳)有限公司 数据处理系统中的自动配对选择方法和装置
CN102662957A (zh) * 2012-03-02 2012-09-12 百度在线网络技术(北京)有限公司 用于优化浏览器的搜索结果页面的装置及方法
CN103049578A (zh) * 2013-01-15 2013-04-17 深圳市宜搜科技发展有限公司 一种获取歌曲信息的方法及系统
CN104484379A (zh) * 2014-12-09 2015-04-01 百度在线网络技术(北京)有限公司 确定音乐实体关系的方法和装置及查询处理方法和装置
CN104484379B (zh) * 2014-12-09 2018-06-12 百度在线网络技术(北京)有限公司 确定音乐实体关系的方法和装置及查询处理方法和装置
CN105808627A (zh) * 2014-12-31 2016-07-27 高德软件有限公司 Poi信息更新、检索、poi数据包生成方法及装置
CN105608129A (zh) * 2015-12-16 2016-05-25 北京奇虎科技有限公司 文件清理方法、装置及系统、移动终端
CN107077509A (zh) * 2016-11-25 2017-08-18 深圳前海达闼云端智能科技有限公司 一种改进浏览体验的方法、装置和设备
WO2018094689A1 (zh) * 2016-11-25 2018-05-31 深圳前海达闼云端智能科技有限公司 一种改进浏览体验的方法、装置和设备
CN107077509B (zh) * 2016-11-25 2021-03-16 深圳前海达闼云端智能科技有限公司 一种改进浏览体验的方法、装置和设备
CN108463816A (zh) * 2016-12-09 2018-08-28 谷歌有限责任公司 通过使用自动变体检测来防止禁止网络内容的分发
US11526554B2 (en) 2016-12-09 2022-12-13 Google Llc Preventing the distribution of forbidden network content using automatic variant detection
WO2018184510A1 (zh) * 2017-04-07 2018-10-11 腾讯科技(深圳)有限公司 分词方法、装置及存储介质
CN108319635A (zh) * 2017-12-15 2018-07-24 海南智媒云图科技股份有限公司 一种多平台音乐资源整合播放的方法、电子设备及存储介质
CN110717062A (zh) * 2018-07-11 2020-01-21 阿里巴巴集团控股有限公司 音乐搜索及车载音乐播放方法、装置、设备以及存储介质
CN110717062B (zh) * 2018-07-11 2024-03-22 斑马智行网络(香港)有限公司 音乐搜索及车载音乐播放方法、装置、设备以及存储介质
CN109543064A (zh) * 2018-11-30 2019-03-29 北京微播视界科技有限公司 歌词显示处理方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN101071422B (zh) 2010-10-13
WO2007147359A1 (fr) 2007-12-27

Similar Documents

Publication Publication Date Title
CN101071422B (zh) 一种音乐文件搜索处理系统及方法
US8554854B2 (en) Systems and methods for identifying terms relevant to web pages using social network messages
CN101464898B (zh) 一种提取文本主题词的方法
US8402036B2 (en) Phrase based snippet generation
CN102207948B (zh) 一种事件陈述句素材库的生成方法
CN103324626B (zh) 一种建立多粒度词典的方法、分词的方法及其装置
CN103823799A (zh) 新一代行业知识全文检索方法
JP2004289848A5 (zh)
JP2009520264A5 (zh)
CN106294320A (zh) 一种面向学术论文的术语抽取方法及系统
CN102081642A (zh) 搜索引擎检索结果聚类的中文标签提取方法
CN101201838A (zh) 利用词组索引技术对基于关键词索引的搜索引擎进行改进的方法
CN101877711A (zh) 社会网络建立方法及装置、以及社区发现方法及装置
CN103678412A (zh) 一种文档检索的方法及装置
CN102043808A (zh) 利用网页结构抽取双语词条的方法及设备
CN101923556B (zh) 根据句子序列号进行网页搜索的方法和装置
CN107526841A (zh) 一种基于Web的藏文文本自动摘要生成方法
CN105404677A (zh) 一种基于树形结构的检索方法
CN103377224A (zh) 识别问题类型的方法及装置、建立识别模型的方法及装置
CN101599075B (zh) 汉语缩略语处理方法和装置
CN102117285A (zh) 一种基于语义索引的检索方法
CN111008285B (zh) 一种基于论文关键属性网络的作者消歧方法
Viveros-Jiménez et al. Improving the boilerpipe algorithm for boilerplate removal in news articles using html tree structure
CN107145947A (zh) 一种信息处理方法、装置及电子设备
Zhang et al. A tag recommendation system based on contents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant