CN103279513B - 产生内容标签的方法、提供多媒体内容信息的方法及装置 - Google Patents

产生内容标签的方法、提供多媒体内容信息的方法及装置 Download PDF

Info

Publication number
CN103279513B
CN103279513B CN201310192835.7A CN201310192835A CN103279513B CN 103279513 B CN103279513 B CN 103279513B CN 201310192835 A CN201310192835 A CN 201310192835A CN 103279513 B CN103279513 B CN 103279513B
Authority
CN
China
Prior art keywords
label
semantic
semantic label
multimedia
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310192835.7A
Other languages
English (en)
Other versions
CN103279513A (zh
Inventor
吴曌
李丕勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310192835.7A priority Critical patent/CN103279513B/zh
Publication of CN103279513A publication Critical patent/CN103279513A/zh
Application granted granted Critical
Publication of CN103279513B publication Critical patent/CN103279513B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

提供一种产生内容标签的方法、提供多媒体内容信息的方法及装置。一种产生内容标签的方法,包括:获取多个多媒体内容项目的第一语义标签集合,每个多媒体内容项目的每个第一语义标签包括标签值和标签维度;通过计算第一语义标签集合当中标签值的共现次数,对第一语义标签进行排序,并且从第一语义标签集合筛选出第一预定个数的高频第一语义标签;根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合,第二语义标签集合中的每个第二语义标签包括标签值、标签维度以及权值;存储第二语义标签集合中的标签值以及相应的标签维度。

Description

产生内容标签的方法、提供多媒体内容信息的方法及装置
技术领域
本申请涉及一种产生内容标签的方法、提供多媒体内容信息的方法以及执行所述方法的装置,尤其涉及一种针对多媒体内容的泛需求挖掘用户可能感兴趣的内容并且缩短内容搜索途径的信息处理技术。
背景技术
用户在搜索多媒体内容时,多数时候并没有明确的目标,而开始仅提供包括较宽泛的兴趣类型的搜索词。此后,从例如搜索引擎得到一些搜索结果后,用户再从搜索结果中点击更多的链接,一步一步地继续查找兴趣内容。
图7示出用户输入兴趣搜索词从搜索引擎获得搜索结果,再通过点击更多的链接找到实际感兴趣的电影的示例性过程。首先,用户在搜索引擎的输入框输入“美国科幻电影”得到例如“美国科幻大片排行榜”以及“美国十大经典科幻电影推荐”、“美国最经典科幻电影的排行榜是?百度知道”等链接,并且在“美国最经典科幻电影的排行榜是?百度知道”链接下方,显示了“银翼杀手”、“星球大战”、“终结者”等电影信息。此后,用户从“美国最经典科幻电影的排行榜是?百度知道”链接中提供的电影项目当中,选择继续查找电影“银翼杀手”的信息,因此,用户重新在搜索引擎的输入框中输入“银翼杀手”,获得了关于此电影的百科信息以及视频的链接。
可见,通过兴趣类别搜索多媒体内容时,通常要经过多次点击、多次输入搜索词才能找到用户可能想看的内容项目,搜索路径较长,不方便用户操作。
发明内容
本发明的目的在于提供一种产生内容标签的方法、提供多媒体内容信息的方法以及执行所述方法的装置,针对多媒体内容挖掘关注度高的语义标签,并且通过对用户的多媒体内容泛性需求,通过与挖掘出的语义标签进行匹配来提供用户可能感兴趣的内容,缩短内容搜索途径,为用户搜索多媒体内容提供便利。
根据本发明的一方面,提供一种产生内容标签的方法,包括:获取多个多媒体内容项目的第一语义标签集合,每个多媒体内容项目的每个第一语义标签包括标签值和标签维度;通过计算第一语义标签集合当中标签值的共现次数,对第一语义标签进行排序,并且从第一语义标签集合筛选出第一预定个数的高频第一语义标签;根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合,第二语义标签集合中的每个第二语义标签包括标签值、标签维度以及权值;存储第二语义标签集合中的标签值以及相应的标签维度。
所述多媒体内容可以是电影、音乐、电视剧之一。
所述标签维度可以是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
优选地,所述根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合的处理还包括:根据预定时间段的网络搜索日志计算标签值被搜索的次数。
优选地,所述的方法还包括:对第二语义标签进行排序,并且筛选出第二预定个数的高关注度第二语义标签;计算各高关注度第二语义标签中标签维度出现的次数,并且算则第三预定个数的高关注度的标签维度;从高频第一语义标签当中选择属于高关注度的标签维度的高频第一语义标签,对选择的高频第一语义标签加权,以产生第二语义标签,并且将产生的第二语义标签添加到第二语义标签集合。
根据本发明的另一方面,提供一种产生内容标签的装置,包括:第一语义标签集合获取单元,用于获取多个多媒体内容项目的第一语义标签集合,每个多媒体内容项目的每个第一语义标签包括标签值和标签维度;第二语义标签集合产生单元,用于通过计算第一语义标签集合当中标签值的共现次数,对第一语义标签进行排序,并且从第一语义标签集合筛选出第一预定个数的高频第一语义标签;以及用于根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合,第二语义标签集合中的每个第二语义标签包括标签值、标签维度以及权值;标签存储单元,用于存储第二语义标签集合中的标签值以及相应的标签维度。
所述多媒体内容可以是电影、音乐、电视剧之一。
所述标签维度可以是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
优选地,第二语义标签集合产生单元还根据预定时间段的网络搜索日志计算标签值被搜索的次数。
优选地,所述的装置还包括:第二语义标签集合泛化单元,用于对第二语义标签进行排序,并且筛选出第二预定个数的高关注度第二语义标签;用于计算各高关注度第二语义标签中标签维度出现的次数,并且算则第三预定个数的高关注度的标签维度;以及用于从高频第一语义标签当中选择属于高关注度的标签维度的高频第一语义标签,对选择的高频第一语义标签加权,以产生第二语义标签,并且将产生的第二语义标签添加到第二语义标签集合。其中,标签存储单元存储经第二语义标签集合泛化单元处理的第二语义标签集合。
根据本发明的另一方面,提供一种提供多媒体内容的方法,包括,在服务器端,执行以下步骤:从用户客户端接收包括搜索词的搜索请求;确定接收的搜索词是否包含预定的特征词;当确定接收的搜索词包含预定的特征词时,执行以下处理:将接收的搜索词与预先存储的语义标签集合进行匹配,以提取至少一个语义标签,所述语义标签集合中的每个语义标签包括标签值和标签维度,根据提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的信息,将提取的至少一个语义标签以及获取的多个多媒体内容项目的信息发送给所述用户客户端。
所述多媒体内容可以是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
所述标签维度可以是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
优选地,所述将接收的搜索词与预先存储的语义标签集合进行匹配,以提取至少一个语义标签的处理包括:从搜索词切除预定的特征词和无意义的杂质词,将切除后剩余的搜索词部分与所述语义标签集合进行匹配,以提取至少一个语义标签。
优选地,所述根据提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的处理包括:分别通过基于标签维度的倒排索引查询预定个数的与相应的语义标签匹配的多媒体内容项目,将查询到的多媒体内容项目合并,根据预定的规则对合并的多媒体内容项目排序,从排序的多媒体内容项目当中选择预定个数的多媒体内容项目。
优选地,所述预定的规则包括以下评估标准的至少一个:多媒体内容项目的上映时间、用户评分、近期被搜索的频次以及多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数。
优选地,所述根据预定的规则对合并的多媒体内容项目排序的处理包括:所述预定的规则是根据至少一个评估标准对合并的多媒体内容项目进行综合相关评分,并根据综合相关评分由高到低对合并的多媒体内容项目进行排序。
优选地,当多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数被作为评估标准之一时,其在所述综合相关评分占最大比重。
优选地,所述将提取的至少一个语义标签以及获取的多个多媒体内容项目的信息发送给所述用户客户端的处理包括:将提取的至少一个语义标签、获取的多个多媒体内容项目的信息以及其综合相关评分发送给所述用户客户端。
优选地,根据多个预定的规则分别对合并的多媒体内容项目排序,分别从排序的多媒体内容项目当中选择预定个数的多媒体内容项目,并且将分别选择的多媒体内容项目的信息以及评估标准的信息连同提取的至少一个语义标签发送给用户客户端。
根据本发明的另一方面,提供一种从服务器端提供多媒体内容的装置,包括:搜索请求接收单元,用于从用户客户端接收包括搜索词的搜索请求;泛需求确定单元,用于确定搜索请求接收单元接收的搜索词是否包含预定的特征词;标签提取单元,用于当泛需求确定单元确定接收的搜索词包含预定的特征词时,将接收的搜索词与预先存储的语义标签集合进行匹配,以提取至少一个语义标签,所述语义标签集合中的每个语义标签包括标签值和标签维度;内容信息查询单元,用于根据标签提取单元提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的信息;内容信息发送单元,用于将提取的至少一个语义标签以及获取的多个多媒体内容项目的信息发送给所述用户客户端。
所述多媒体内容可以是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
所述标签维度可以是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
优选地,标签提取单元从搜索词切除预定的特征词和无意义的杂质词,并且将切除后剩余的搜索词部分与所述语义标签集合进行匹配,以提取至少一个语义标签。
优选地,内容信息查询单元分别通过基于标签维度的倒排索引查询预定个数的与相应的语义标签匹配的多媒体内容项目,将查询到的多媒体内容项目合并,根据预定的规则对合并的多媒体内容项目排序,并且从排序的多媒体内容项目当中选择预定个数的多媒体内容项目。
优选地,所述预定的规则包括以下评估标准的至少一个:多媒体内容项目的上映时间、用户评分、近期被搜索的频次以及多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数。
优选地,所述预定的规则是根据至少一个评估标准对合并的多媒体内容项目进行综合相关评分,并内容信息查询单元根据综合相关评分由高到低对合并的多媒体内容项目进行排序。
优选地,当多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数被作为评估标准之一时,其在所述综合相关评分占最大比重。
优选地,内容信息发送单元将提取的至少一个语义标签、获取的多个多媒体内容项目的信息以及其综合相关评分发送给所述用户客户端。
优选地,内容信息查询单元根据多个预定的规则分别对合并的多媒体内容项目排序,分别从排序的多媒体内容项目当中选择预定个数的多媒体内容项目,并且内容信息发送单元将分别选择的多媒体内容项目的信息以及评估标准的信息连同提取的至少一个语义标签发送给用户客户端。
根据本发明的另一方面,提供一种提供多媒体内容的方法,包括,在网页客户端,执行以下步骤:接收用户输入的搜索词;确定用户输入的搜索词是否包括预定的特征词;当确定用户输入的搜索词包括预定的特征词时,执行以下处理:将包括所述搜索词的搜索请求发送给服务器,从服务器接收包括至少一个语义标签以及多个多媒体内容项目的信息,每个语义标签包括标签值和标签维度,显示接收的多个多媒体内容项目的信息。
所述多媒体内容可以是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
所述标签维度可以是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
优选地,所述的方法还包括:显示所述多媒体内容的筛选条件,所述筛选条件是至少一个预定标签维度以及所述标签维度的预定标签值集合,并且高亮显示接收的至少一个语义标签的标签值以及其链接。
优选地,所述的方法还包括:将接收的至少一个语义标签中的标签值显示为当前筛选条件。
优选地,接收的每个多媒体内容项目的信息包括多媒体内容项目的名称、代表图片、链接以及综合评分。
优选地,所述显示接收的多个多媒体内容项目的信息的处理包括:显示每个多媒体内容项目的名称、代表图片、链接以及综合评分。
优选地,接收的多个多媒体内容项目的信息包括:多组多媒体内容项目的信息以及评估标准的信息。
优选地,所述显示接收的多个多媒体内容项目的信息的处理包括:将接收的评估标准的信息分别显示为内容标签,并且显示与默认网页标签相应的一组多媒体内容项目的信息。
根据本发明的另一方面,提供一种提供多媒体内容的装置,包括:用户搜索词接收单元,用于接收用户输入的搜索词;泛需求确定单元,用于确定用户输入的搜索词是否包括预定的特征词;搜索请求发送单元,用于当泛需求确定单元确定用户输入的搜索词包括预定的特征词时,将包括所述搜索词的搜索请求发送给服务器;内容信息接收单元,用于从服务器接收包括至少一个语义标签以及多个多媒体内容项目的信息,每个语义标签包括标签值和标签维度;内容信息显示单元,用于内容信息接收单元显示接收的多个多媒体内容项目的信息。
所述多媒体内容可以是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
所述标签维度可以是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
优选地,内容信息显示单元还显示所述多媒体内容的筛选条件,所述筛选条件是至少一个预定标签维度以及所述标签维度的预定标签值集合,并且高亮显示接收的至少一个语义标签的标签值以及其链接。
优选地,内容信息显示单元还将接收的至少一个语义标签中的标签值显示为当前筛选条件。
优选地,内容信息接收单元接收的每个多媒体内容项目的信息包括多媒体内容项目的名称、代表图片、链接以及综合评分。
优选地,内容信息显示单元显示每个多媒体内容项目的名称、代表图片、链接以及综合评分。
优选地,内容信息接收单元接收的多个多媒体内容项目的信息包括:多组多媒体内容项目的信息以及评估标准的信息。
优选地,内容信息显示单元将接收的评估标准的信息分别显示为内容标签,并且显示与默认网页标签相应的一组多媒体内容项目的信息。
附图说明
通过下面结合附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
图1是示出根据本发明的示例性实施例的产生内容标签的方法的流程图;
图2是示出根据本发明的示例性实施例的提供多媒体内容的方法的流程图;
图3是示出根据本发明的另一示例性实施例的提供多媒体内容的方法的流程图;
图4是示出根据本发明的示例性实施例的产生内容标签的装置的逻辑框图;
图5是示出根据本发明的示例性实施例的提供多媒体内容的装置的逻辑框图;
图6是示出根据本发明的另一示例性实施例的提供多媒体内容的装置的逻辑框图;
图7是示出在现有技术根据多媒体内容泛需求搜索内容的过程的示例;
图8是示出根据本发明的示例性实施例提供多媒体内容信息的示例界面。
具体实施方式
以下,将参照附图来详细说明本发明的实施例。
本发明的总体发明构思分为三个方面:首先,对多媒体内容项目的语义标签进行分析,根据标签值在语义标签中出现的次数、被搜索的次数以及是否属于高关注度的标签维度来产生易被一般用户关注的多媒体内容的标签集合;其次,对于来自客户端的多媒体内容的泛需求搜索,从接收的搜索词提取与前述产生的标签集合匹配的语义标签,并且根据提取的语义标签从多媒体内容库获取多媒体内容项目的信息,以提供给客户端;最后,在用户客户端,对于用户的多媒体内容泛需求,也根据从服务器端接收的多媒体内容信息显示多媒体内容项目的信息以及筛选条件,以便于用户直接改变筛选条件,而不必预定手动输入筛选条件。
图1是示出根据本发明的示例性实施例的产生内容标签的方法的流程图。
参照图1,在步骤S110,获取多个多媒体内容项目的第一语义标签集合,每个多媒体内容项目的每个第一语义标签包括标签值和标签维度。可从用于存储多媒体内容项目的多媒体内容库获取多媒体内容项目的标注信息,从所述标注信息获取所述第一语义标签集合。这里所述的多媒体内容可以是,但不限于,电影、音乐、电视剧之一。所述标签维度是,但不限于,类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
此后,在步骤S120,通过计算第一语义标签集合当中标签值的共现次数,对第一语义标签进行排序,并且从第一语义标签集合筛选出第一预定个数的高频第一语义标签。例如,标签值为“张艺谋”、标签维度为“导演”的语义标签在例如“红高粱”、“英雄”、“金陵十二钗”、“山楂树之恋”、“十面埋伏”等多部电影中出现,则通过步骤S120的处理可将标签值为“张艺谋”、标签维度为“导演”的语义标签筛选为高频第一语义标签之一。
在步骤S130,根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合,第二语义标签集合中的每个第二语义标签包括标签值、标签维度以及权值。根据本发明的可选实施例,根据预定时间段的网络搜索日志计算标签值被搜索的次数。根据本发明的其他实施例,也可从其他应用或从预先存储的文件或数据库获取标签值被搜索的次数。可根据标签值在预定时间段被搜索的次数,按照统一的规则对所述高频第一语义标签进行加权,加权处理属本领域的常用技术手段,在此不再赘述。
根据本发明的可选实施例,在完成步骤S130的处理后,执行步骤S170,存储第二语义标签集合中的标签值以及相应的标签维度。当然,也可以一同存储每个标签值的权值。
由于用户的搜索行为是相对稀疏的,通过步骤S130的处理后获得的第二语义标签数量会较为有限。为此,根据本发明的优选实施例,进一步执行步骤S140~S160,对第二语义标签集合中的标签维度进行泛化,以产生更多的第二语义标签。
在步骤S140,对第二语义标签进行排序,并且筛选出第二预定个数的高关注度第二语义标签。
在步骤S150,计算各高关注度第二语义标签中标签维度出现的次数,并且选择第三预定个数的高关注度的标签维度。也就是说,对于用户搜索较频繁的标签维度(例如“导演”或“主演/主唱”)进行统计,从而可确定哪些标签维度的多媒体内容比较受关注。
在步骤S160,从高频第一语义标签当中选择属于高关注度的标签维度的高频第一语义标签,对选择的高频第一语义标签加权,以产生第二语义标签,并且将产生的第二语义标签添加到第二语义标签集合。例如,假设在步骤S150,将“导演”选择为高关注度的标签维度之一,则作为步骤S160的部分处理,从步骤S120中筛选出的高频第一语义标签当中选择标签维度是“导演”的高频第一语义标签,并且可根据预定的规则对所述选择的高频第一语义标签赋权值,并且添加到第二语义标签集合中;这样,将其他一些导演也添加到第二语义标签集合中。
在步骤S170,存储第二语义标签集合中的标签值以及相应的标签维度。当然,也可以一同存储每个标签值的权值。
可根据处理的数据总量或其他预定规则静态或动态地确定所述的第一预定个数、第二预定个数以及第三预定个数。
可通过图4所示的装置实现图1示出的产生内容标签的方法。
通过图1所示的产生内容标签的方法,可对多媒体内容产生出现次数较多、被用户搜索较频繁的语义标签集合,通过步骤S140~S160的泛化处理,还可收录较受关注的标签维度下的语义标签。
图2是示出根据本发明的示例性实施例的提供多媒体内容的方法的流程图。所述多媒体内容是,但不限于电影、音乐和电视剧之一。
参照图2,在步骤S210,在服务器端,从用户客户端接收包括搜索词的搜索请求。
在步骤S220,服务器确定接收的搜索词是否包含预定的特征词。所述特征词可以是,但不限于,“电影”、“音乐”和“电视剧”之一。当确定接收的搜索词包含这样的特征词时,服务器可确定所述搜索请求是多媒体内容的泛需求搜索请求,并且进行步骤S230~S250的处理。另一方面,如果确定接收的搜索词不包含预定的特征词,则服务器可将所述搜索请求作为一般的搜索请求继续进行通常的处理,在此不再赘述。
在步骤S230,服务器将接收的搜索词与预先存储的语义标签集合进行匹配,以提取至少一个语义标签,所述语义标签集合中的每个语义标签包括标签值和标签维度。所述预先存储的语义标签集合可以是如图1所述的方法产生的第二语义标签集合或其中的标签值及标签维度。
根据本发明的示例性实施例,在步骤S230中,服务器从搜索词切除预定的特征词和无意义的杂质词(如“的”、“什么”、“好不好”等),并且将切除后剩余的搜索词部分与所述语义标签集合进行匹配,以提取至少一个语义标签。例如,可切除了特征词和杂质词后剩余的部分按照标签集合切词,再进行标签维度的匹配;直到将所有搜索词文本切除而不遗留无法解析的部分为止。
在步骤S240,服务器根据提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的信息。可根据提取的至少一个语义标签,使用任何查询算法从多媒体内容库获取多媒体内容项目的信息。
通常,数据库系统会对其存储的数据根据字段制作索引,而对多媒体内容库中的多媒体内容项目可根据标签维度(和/或标签值)创建倒排索引。根据本发明的优选实施例,在步骤S240,服务器分别通过基于标签维度的倒排索引查询预定个数的与相应的语义标签匹配的多媒体内容项目,将查询到的多媒体内容项目合并,再根据预定的规则对合并的多媒体内容项目排序,然后从排序的多媒体内容项目当中选择预定个数的多媒体内容项目。
这里,所述预定的规则可包括以下评估标准的至少一个:多媒体内容项目的上映时间、用户评分、近期被搜索的频次以及多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数。
此外,根据本发明的优选实施例,所述预定的规则也可以是根据至少一个评估标准对合并的多媒体内容项目分别进行综合相关评分。例如,对各个评估标准赋予预定的权值,分别将多媒体项目的评估标准的值与相应的权值相乘,再对各相乘结果求和,就获得所述多媒体内容项目的综合相关评分。然后,根据综合相关评分由高到低对合并的多媒体内容项目进行排序。
这里,如果一个多媒体内容项目在一个语义标签组合下被搜索过,那么可以认为搜索这个语义标签组合的多数用户较为偏好这个多媒体内容项目。例如,假设一个用户搜索过“动作电影”和“虎胆龙威”,那么可以认为在“动作”标签下,用户更喜欢“虎胆龙威”;同理,另一用户搜索过“美国科幻动作电影”和“黑衣人3”,则可以认为在(美国,国别)、(科幻,类型)和(动作,类型)这三个标签组合下,用户更喜欢“黑衣人3”这个电影。
因此,根据本发明的优选实施例,当多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数被作为评估标准之一时,其在所述综合相关评分占最大比重。
根据本发明的另一优选实施例,在步骤S240,服务器根据多个预定的规则分别对合并的多媒体内容项目排序,分别从排序的多媒体内容项目当中选择预定个数的多媒体内容项目。
在步骤S250,服务器将提取的至少一个语义标签以及获取的多个多媒体内容项目的信息发送给所述用户客户端。
根据本发明的优选实施例,在对多媒体内容项目计算综合相关评分的情形下,在步骤S250,服务器将提取的至少一个语义标签、获取的多个多媒体内容项目的信息以及其综合相关评分发送给所述用户客户端。
根据本发明的又一优选实施例,在服务器根据多个预定的规则分别从排序的多媒体内容项目当中选择多媒体内容项目的情况下,在步骤S250,服务器将分别选择的多媒体内容项目的信息以及评估标准的信息连同提取的至少一个语义标签发送给用户客户端。
可通过图5所示的装置实现图2示出的提供多媒体内容的方法。
图3是示出根据本发明的另一示例性实施例的提供多媒体内容的方法的流程图。所述多媒体内容是,但不限于电影、音乐和电视剧之一。
参照图3,在步骤S310,网页客户端接收用户输入的搜索词。
在步骤S320,网页客户端确定用户输入的搜索词是否包括预定的特征词。所述特征词可以是,但不限于,“电影”、“音乐”和“电视剧”之一。
当在步骤S320,确定接收的搜索词包括预定的特征词时,网页客户端可确定所述搜索是多媒体内容的泛需求搜索,并且进行步骤S330~S350的处理。另一方面,如果确定接收的搜索词不包含预定的特征词,则网页客户端可将所述搜索作为一般的搜索继续进行通常的处理,在此不再赘述。
在步骤S330,网页客户端将包括所述搜索词的搜索请求发送给服务器。
在步骤S340,网页客户端从服务器接收包括至少一个语义标签以及多个多媒体内容项目的信息,每个语义标签包括标签值和标签维度。所述标签维度是,但不限于,类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。接收的每个多媒体内容项目的信息包括多媒体内容项目的名称、代表图片以及链接。接收的每个多媒体内容项目的信息还可包括多媒体内容项目的综合评分。
根据本发明的可选实施例,在步骤S340接收的多个多媒体内容项目的信息包括多组多媒体内容项目的信息以及评估标准的信息。
在步骤S350,网页客户端显示接收的多个多媒体内容项目的信息。其中,显示每个多媒体内容项目的名称、代表图片和链接。当接收的多媒体内容项目的信息包括多媒体内容项目的综合评分时,还可显示多媒体内容项目的综合评分。
图8示出根据本发明的示例性实施例提供多媒体内容信息的示例界面。当用户通过“美国科幻电影”执行搜索时,在搜索结果页面上,显示了接收的“云图”、“复仇者联盟”、“黑衣人3”、“超凡蜘蛛侠”等电影项目的信息,在每个电影项目的下端,还显示所述电影的综合评分。
根据本发明的优选实施例,在步骤S350,网页客户端还显示所述多媒体内容的筛选条件,所述筛选条件是至少一个预定标签维度以及所述标签维度的预定标签值集合,并且高亮显示接收的至少一个语义标签的标签值以及其链接。根据本发明的另一优选实施例,在步骤S350,网页客户端还将接收的至少一个语义标签中的标签值显示为当前筛选条件。
例如,在图8示出的示例界面上,还显示了“类型”、“地区”、“年代”(标签维度)以及所述标签维度的预定标签值集合(和“全部”、“其他”)等作为筛选条件。其中,高亮显示了“科幻”、“美国”。此外,在筛选条件下端,还显示了包括“科幻”、“美国”的当前筛选条件。通过在搜索结果页面上提供多种筛选条件,用户不需要多次输入搜索词,也不需要通过几次点击其他链接就可以直接在搜索页面上重新选择筛选条件,方便用户搜索多媒体内容。
根据本发明的优选实施例,如果在步骤S340接收的多个多媒体内容项目的信息包括多组多媒体内容项目的信息以及评估标准的信息,则在步骤S350,网页客户端将接收的评估标准的信息分别显示为内容标签,并且显示与默认网页标签相应的一组多媒体内容项目的信息。
例如,在图8示出的示例界面上,显示了“最热电影”(与搜索频次相应)、“最新电影”(与上映时间相应)以及“用户好评”(与用户评分相应)内容标签,并且显示了当前的默认内容标签“最热电影”,即搜索频次评估标准相应的电影项目的信息。
可通过图6所示的装置实现图3示出的提供多媒体内容的方法。
图4是示出根据本发明的示例性实施例的产生内容标签的装置的逻辑框图。
参照图4,产生内容标签的装置包括第一语义标签集合获取单元410、第二语义标签集合产生单元420和标签存储单元440。
第一语义标签集合获取单元410用于获取多个多媒体内容项目的第一语义标签集合,每个多媒体内容项目的每个第一语义标签包括标签值和标签维度。可从用于存储多媒体内容项目的多媒体内容库获取多媒体内容项目的标注信息,从所述标注信息获取所述第一语义标签集合。这里所述的多媒体内容可以是,但不限于,电影、音乐、电视剧之一。所述标签维度是,但不限于,类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
第二语义标签集合产生单元420用于通过计算第一语义标签集合当中标签值的共现次数,对第一语义标签进行排序,并且从第一语义标签集合筛选出第一预定个数的高频第一语义标签;第二语义标签集合产生单元420还根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合,第二语义标签集合中的每个第二语义标签包括标签值、标签维度以及权值。其中,根据本发明的示例性实施例,第二语义标签集合产生单元420根据预定时间段的网络搜索日志计算标签值被搜索的次数。
根据本发明的可选实施例,标签存储单元440用于存储第二语义标签集合产生单元420产生的第二语义标签集合,或者第二语义标签集合中的标签值及相应的标签维度。
根据本发明的优选实施例,所述产生内容标签的装置还包括第二语义标签集合泛化单元430。第二语义标签集合泛化单元430用于对第二语义标签集合产生单元420产生的第二语义标签进行排序,并且筛选出第二预定个数的高关注度第二语义标签;用于计算各高关注度第二语义标签中标签维度出现的次数,并且选择第三预定个数的高关注度的标签维度;第二语义标签集合泛化单元430还用于从高频第一语义标签当中选择属于高关注度的标签维度的高频第一语义标签,对选择的高频第一语义标签加权,以产生第二语义标签,并且将产生的第二语义标签添加到第二语义标签集合。
根据本发明的优选实施例,标签存储单元440用于存储经过第二语义标签集合泛化单元430处理的第二语义标签集合,或者第二语义标签集合中的标签值及相应的标签维度。
图5是示出根据本发明的示例性实施例的提供多媒体内容的装置的逻辑框图。所述多媒体内容是,但不限于电影、音乐和电视剧之一。
参照图5,服务器端的提供多媒体内容的装置包括搜索请求接收单元510、泛需求确定单元520、标签提取单元530、内容信息查询单元540和内容信息发送单元550。
搜索请求接收单元510用于从用户客户端接收包括搜索词的搜索请求。
泛需求确定单元520用于确定搜索请求接收单元510接收的搜索词是否包含预定的特征词。所述特征词与所述多媒体内容的类型相应,可以是,但不限于,“电影”、“音乐”和“电视剧”之一。
标签提取单元530用于当泛需求确定单元520确定接收的搜索词包含预定的特征词时,将接收的搜索词与预先存储的语义标签集合进行匹配,以提取至少一个语义标签,所述语义标签集合中的每个语义标签包括标签值和标签维度。例如,标签提取单元530从搜索词切除预定的特征词和无意义的杂质词,并且将切除后剩余的搜索词部分与所述语义标签集合进行匹配,以提取至少一个语义标签。
内容信息查询单元540用于根据标签提取单元530提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的信息。
根据本发明的优选实施例,内容信息查询单元540分别通过基于标签维度的倒排索引查询预定个数的与相应的语义标签匹配的多媒体内容项目,将查询到的多媒体内容项目合并,根据预定的规则对合并的多媒体内容项目排序,并且从排序的多媒体内容项目当中选择预定个数的多媒体内容项目。
所述预定的规则可包括,但不限于,以下评估标准的至少一个:多媒体内容项目的上映时间、用户评分、近期被搜索的频次以及多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数。
根据本发明的优选实施例,所述预定的规则是根据至少一个评估标准对合并的多媒体内容项目进行综合相关评分,并内容信息查询单元540根据综合相关评分由高到低对合并的多媒体内容项进行排序。
根据本发明的优选实施例,当多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数被作为评估标准之一时,其在所述综合相关评分占最大比重。
根据本发明的另一优选实施例,内容信息查询单元540根据多个预定的规则分别对合并的多媒体内容项目排序,分别从排序的多媒体内容项目当中选择预定个数的多媒体内容项目。
内容信息发送单元550用于将标签提取单元530提取的至少一个语义标签以及内容信息查询单元540获取的多个多媒体内容项目的信息发送给所述用户客户端。根据本发明的优选实施例,在内容信息查询单元540对多媒体内容项目计算综合相关评分的情形下,内容信息发送单元550将提取的至少一个语义标签、获取的多个多媒体内容项目的信息以及其综合相关评分发送给所述用户客户端。
根据本发明的又一优选实施例,在内容信息查询单元540根据多个预定的规则分别从排序的多媒体内容项目当中选择多媒体内容项目的情况下,内容信息发送单元550将分别选择的多媒体内容项目的信息以及评估标准的信息连同提取的至少一个语义标签发送给用户客户端。
图6是示出根据本发明的另一示例性实施例的提供多媒体内容的装置的逻辑框图。
参照图6,位于网页客户端的提供多媒体内容的装置包括用户搜索词接收单元610、泛需求确定单元620、搜索请求发送单元630、内容信息接收单元640以及内容信息显示单元650。
用户搜索词接收单元610用于接收用户输入的搜索词。
泛需求确定单元620用于确定用户输入的搜索词是否包括预定的特征词。所述多媒体内容是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
搜索请求发送单元630用于当泛需求确定单元620确定用户输入的搜索词包括预定的特征词时,将包括所述搜索词的搜索请求发送给服务器。
内容信息接收单元640用于从服务器接收包括至少一个语义标签以及多个多媒体内容项目的信息,每个语义标签包括标签值和标签维度。所述标签维度是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
内容信息显示单元650用于显示内容信息接收单元640接收的多个多媒体内容项目的信息。
根据本发明的优选实施例,内容信息显示单元650还显示所述多媒体内容的筛选条件,所述筛选条件是至少一个预定标签维度以及所述标签维度的预定标签值集合,并且高亮显示接收的至少一个语义标签的标签值以及其链接。
根据本发明的优选实施例,内容信息显示单元650还将接收的至少一个语义标签中的标签值显示为当前筛选条件。
内容信息接收单元640接收的每个多媒体内容项目的信息可包括,但不限于,多媒体内容项目的名称、代表图片、链接以及综合评分等。内容信息显示单元650显示每个多媒体内容项目的名称、代表图片、链接以及综合评分。
根据本发明的另一优选实施例,内容信息接收单元640接收的多个多媒体内容项目的信息包括多组多媒体内容项目的信息以及评估标准的信息,并且内容信息显示单元650将接收的评估标准的信息分别显示为内容标签,并且显示与默认网页标签相应的一组多媒体内容项目的信息。
从上述参照附图对本发明的示例性实施例的描述可以看出,本发明的产生内容标签的方法、提供多媒体内容信息的方法及装置从多媒体内容项目的语义标签中提取用户搜索频次较高、较受关注的属性的高关注语义标签,通过将用户的泛需求搜索词与提取的高关注语义标签进行匹配,根据匹配得到的至少语义标签生成用户可能喜欢的多媒体内容项目的信息,并且将多媒体内容项目的信息发送给用户客户端,从而可为用户提供相关度高并且用户更可能感兴趣的多媒体内容的信息。在客户端,除了提供从服务器端接收的用户可能喜欢的多媒体内容项目的信息,还显示多种筛选条件以及当前筛选条件,从而用户不需要重新输入搜索词、也不需要经过多次点击即可通过选择其他筛选条件进一步进行多媒体内容项目的搜索,可缩短用户搜索的路径,并且方便用户进行多媒体内容搜索。
需要指出,根据实施的需要,可将本申请中描述的各个步骤拆分为更多步骤,也可将两个或多个步骤或者步骤的部分操作组合成新的步骤,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
尽管已参照优选实施例表示和描述了本发明,但本领域技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可以对这些实施例进行各种修改和变换。

Claims (46)

1.一种产生内容标签的方法,包括:
获取多个多媒体内容项目的第一语义标签集合,每个多媒体内容项目的每个第一语义标签包括标签值和标签维度;
通过计算第一语义标签集合当中标签值的共现次数,对第一语义标签进行排序,并且从第一语义标签集合筛选出第一预定个数的高频第一语义标签;
根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合,第二语义标签集合中的每个第二语义标签包括标签值、标签维度以及权值;
存储第二语义标签集合中的标签值以及相应的标签维度,
其中,还包括:
对第二语义标签进行排序,并且筛选出第二预定个数的高关注度第二语义标签;
计算各高关注度第二语义标签中标签维度出现的次数,并且选择第三预定个数的高关注度的标签维度;
从高频第一语义标签当中选择属于高关注度的标签维度的高频第一语义标签,对选择的高频第一语义标签加权,以产生第二语义标签,并且将产生的第二语义标签添加到第二语义标签集合。
2.如权利要求1所述的方法,其特征在于,所述多媒体内容是电影、音乐、电视剧之一。
3.如权利要求2所述的方法,其特征在于,所述标签维度是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
4.如权利要求3所述的方法,其特征在于,所述根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合的处理还包括:
根据预定时间段的网络搜索日志计算标签值被搜索的次数。
5.一种产生内容标签的装置,包括:
第一语义标签集合获取单元,用于获取多个多媒体内容项目的第一语义标签集合,每个多媒体内容项目的每个第一语义标签包括标签值和标签维度;
第二语义标签集合产生单元,用于通过计算第一语义标签集合当中标签值的共现次数,对第一语义标签进行排序,并且从第一语义标签集合筛选出第一预定个数的高频第一语义标签;以及用于根据标签值在预定时间段被搜索的次数,对筛选出的高频第一语义标签加权,以产生第二语义标签集合,第二语义标签集合中的每个第二语义标签包括标签值、标签维度以及权值;
标签存储单元,用于存储第二语义标签集合中的标签值以及相应的标签维度,
其中,还包括:
第二语义标签集合泛化单元,用于对第二语义标签进行排序,并且筛选出第二预定个数的高关注度第二语义标签;用于计算各高关注度第二语义标签中标签维度出现的次数,并且选择第三预定个数的高关注度的标签维度;以及用于从高频第一语义标签当中选择属于高关注度的标签维度的高频第一语义标签,对选择的高频第一语义标签加权,以产生第二语义标签,并且将产生的第二语义标签添加到第二语义标签集合,
其中,标签存储单元存储经第二语义标签集合泛化单元处理的第二语义标签集合。
6.如权利要求5所述的装置,其特征在于,所述多媒体内容是电影、音乐、电视剧之一。
7.如权利要求6所述的装置,其特征在于,所述标签维度是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
8.如权利要求7所述的装置,其特征在于,第二语义标签集合产生单元还根据预定时间段的网络搜索日志计算标签值被搜索的次数。
9.一种提供多媒体内容的方法,包括,在服务器端,执行以下步骤:
从用户客户端接收包括搜索词的搜索请求;
确定接收的搜索词是否包含预定的特征词;
当确定接收的搜索词包含预定的特征词时,执行以下处理:
将接收的搜索词与预先存储的语义标签集合进行匹配,以从接收的搜索词提取至少一个语义标签,所述语义标签集合中的每个语义标签包括标签值和标签维度,其中,所述预先存储的语义标签集合为根据权利要求1所述的方法产生的第二语义标签集合或其中的标签值及标签维度,
根据提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的信息,
将提取的至少一个语义标签以及获取的多个多媒体内容项目的信息发送给所述用户客户端。
10.如权利要求9所述的方法,其特征在于,所述多媒体内容是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
11.如权利要求10所述的方法,其特征在于,所述标签维度是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
12.如权利要求11所述的方法,其特征在于,所述将接收的搜索词与预先存储的语义标签集合进行匹配,以提取至少一个语义标签的处理包括:
从搜索词切除预定的特征词和无意义的杂质词,
将切除后剩余的搜索词部分与所述语义标签集合进行匹配,以提取至少一个语义标签。
13.如权利要求12所述的方法,其特征在于,所述根据提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的处理包括:
分别通过基于标签维度的倒排索引查询预定个数的与相应的语义标签匹配的多媒体内容项目,
将查询到的多媒体内容项目合并,
根据预定的规则对合并的多媒体内容项目排序,
从排序的多媒体内容项目当中选择预定个数的多媒体内容项目。
14.如权利要求13所述的方法,其特征在于,所述预定的规则包括以下评估标准的至少一个:多媒体内容项目的上映时间、用户评分、近期被搜索的频次以及多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数。
15.如权利要求14所述的方法,其特征在于,所述根据预定的规则对合并的多媒体内容项目排序的处理包括:
所述预定的规则是根据至少一个评估标准对合并的多媒体内容项目进行综合相关评分,并根据综合相关评分由高到低对合并的多媒体内容项目进行排序。
16.如权利要求15所述的方法,其特征在于,当多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数被作为评估标准之一时,其在所述综合相关评分占最大比重。
17.如权利要求16所述的方法,其特征在于,所述将提取的至少一个语义标签以及获取的多个多媒体内容项目的信息发送给所述用户客户端的处理包括:
将提取的至少一个语义标签、获取的多个多媒体内容项目的信息以及其综合相关评分发送给所述用户客户端。
18.如权利要求14所述的方法,其特征在于,根据多个预定的规则分别对合并的多媒体内容项目排序,分别从排序的多媒体内容项目当中选择预定个数的多媒体内容项目,并且将分别选择的多媒体内容项目的信息以及评估标准的信息连同提取的至少一个语义标签发送给用户客户端。
19.一种从服务器端提供多媒体内容的装置,包括:
搜索请求接收单元,用于从用户客户端接收包括搜索词的搜索请求;
泛需求确定单元,用于确定搜索请求接收单元接收的搜索词是否包含预定的特征词;
标签提取单元,用于当泛需求确定单元确定接收的搜索词包含预定的特征词时,将接收的搜索词与预先存储的语义标签集合进行匹配,以从接收的搜索词提取至少一个语义标签,所述语义标签集合中的每个语义标签包括标签值和标签维度,其中,所述预先存储的语义标签集合为根据权利要求5所述的装置产生的第二语义标签集合或其中的标签值及标签维度;
内容信息查询单元,用于根据标签提取单元提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的信息;
内容信息发送单元,用于将提取的至少一个语义标签以及获取的多个多媒体内容项目的信息发送给所述用户客户端。
20.如权利要求19所述的装置,其特征在于,所述多媒体内容是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
21.如权利要求20所述的装置,其特征在于,所述标签维度是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
22.如权利要求21所述的装置,其特征在于,标签提取单元从搜索词切除预定的特征词和无意义的杂质词,并且将切除后剩余的搜索词部分与所述语义标签集合进行匹配,以提取至少一个语义标签。
23.如权利要求22所述的装置,其特征在于,内容信息查询单元分别通过基于标签维度的倒排索引查询预定个数的与相应的语义标签匹配的多媒体内容项目,将查询到的多媒体内容项目合并,根据预定的规则对合并的多媒体内容项目排序,并且从排序的多媒体内容项目当中选择预定个数的多媒体内容项目。
24.如权利要求23所述的装置,其特征在于,所述预定的规则包括以下评估标准的至少一个:多媒体内容项目的上映时间、用户评分、近期被搜索的频次以及多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数。
25.如权利要求24所述的装置,其特征在于,所述预定的规则是根据至少一个评估标准对合并的多媒体内容项目进行综合相关评分,并内容信息查询单元根据综合相关评分由高到低对合并的多媒体内容项目进行排序。
26.如权利要求25所述的装置,其特征在于,当多媒体内容项目在提取的至少一个语义标签的组合下被搜索的次数被作为评估标准之一时,其在所述综合相关评分占最大比重。
27.如权利要求26所述的装置,其特征在于,内容信息发送单元将提取的至少一个语义标签、获取的多个多媒体内容项目的信息以及其综合相关评分发送给所述用户客户端。
28.如权利要求24所述的装置,其特征在于,内容信息查询单元根据多个预定的规则分别对合并的多媒体内容项目排序,分别从排序的多媒体内容项目当中选择预定个数的多媒体内容项目,并且内容信息发送单元将分别选择的多媒体内容项目的信息以及评估标准的信息连同提取的至少一个语义标签发送给用户客户端。
29.一种提供多媒体内容的方法,包括,在网页客户端,执行以下步骤:
接收用户输入的搜索词;
确定用户输入的搜索词是否包括预定的特征词;
当确定用户输入的搜索词包括预定的特征词时,执行以下处理:
将包括所述搜索词的搜索请求发送给服务器,
从服务器接收包括至少一个语义标签以及多个多媒体内容项目的信息,每个语义标签包括标签值和标签维度,
显示接收的多个多媒体内容项目的信息,
其中,所述至少一个语义标签以及获取的多个多媒体内容项目的信息由服务器通过以下方式获得:将接收的搜索词与预先存储的语义标签集合进行匹配,以从接收的搜索词提取至少一个语义标签,所述语义标签集合中的每个语义标签包括标签值和标签维度,根据提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的信息,其中,所述预先存储的语义标签集合为根据权利要求1所述的方法产生的第二语义标签集合或其中的标签值及标签维度。
30.如权利要求29所述的方法,其特征在于,所述多媒体内容是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
31.如权利要求30所述的方法,其特征在于,所述标签维度是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
32.如权利要求31所述的方法,还包括:显示所述多媒体内容的筛选条件,所述筛选条件是至少一个预定标签维度以及所述标签维度的预定标签值集合,并且高亮显示接收的至少一个语义标签的标签值以及其链接。
33.如权利要求32所述的方法,还包括:将接收的至少一个语义标签中的标签值显示为当前筛选条件。
34.如权利要求33所述的方法,其特征在于,接收的每个多媒体内容项目的信息包括多媒体内容项目的名称、代表图片、链接以及综合评分。
35.如权利要求34所述的方法,其特征在于,所述显示接收的多个多媒体内容项目的信息的处理包括:显示每个多媒体内容项目的名称、代表图片、链接以及综合评分。
36.如权利要求35所述的方法,其特征在于,接收的多个多媒体内容项目的信息包括:多组多媒体内容项目的信息以及评估标准的信息。
37.如权利要求36所述的方法,其特征在于,所述显示接收的多个多媒体内容项目的信息的处理包括:将接收的评估标准的信息分别显示为内容标签,并且显示与默认网页标签相应的一组多媒体内容项目的信息。
38.一种提供多媒体内容的装置,包括:
用户搜索词接收单元,用于接收用户输入的搜索词;
泛需求确定单元,用于确定用户输入的搜索词是否包括预定的特征词;
搜索请求发送单元,用于当泛需求确定单元确定用户输入的搜索词包括预定的特征词时,将包括所述搜索词的搜索请求发送给服务器;
内容信息接收单元,用于从服务器接收包括至少一个语义标签以及多个多媒体内容项目的信息,每个语义标签包括标签值和标签维度;
内容信息显示单元,用于内容信息接收单元显示接收的多个多媒体内容项目的信息,
其中,所述至少一个语义标签以及获取的多个多媒体内容项目的信息由服务器通过以下方式获得:服务器将接收的搜索词与预先存储的语义标签集合进行匹配,以从接收的搜索词提取至少一个语义标签,所述语义标签集合中的每个语义标签包括标签值和标签维度,根据提取的至少一个语义标签查询多媒体内容库,以获取多个多媒体内容项目的信息,其中,所述预先存储的语义标签集合为根据权利要求5所述的装置产生的第二语义标签集合或其中的标签值及标签维度。
39.如权利要求38所述的装置,其特征在于,所述多媒体内容是电影、音乐、电视剧之一,并且所述特征词与所述多媒体内容的类型相应。
40.如权利要求39所述的装置,其特征在于,所述标签维度是类型、制片人、导演、主演或主唱、年代、国别、语言中的一个。
41.如权利要求40所述的装置,其特征在于,内容信息显示单元还显示所述多媒体内容的筛选条件,所述筛选条件是至少一个预定标签维度以及所述标签维度的预定标签值集合,并且高亮显示接收的至少一个语义标签的标签值以及其链接。
42.如权利要求41所述的装置,其特征在于,内容信息显示单元还将接收的至少一个语义标签中的标签值显示为当前筛选条件。
43.如权利要求42所述的装置,其特征在于,内容信息接收单元接收的每个多媒体内容项目的信息包括多媒体内容项目的名称、代表图片、链接以及综合评分。
44.如权利要求43所述的装置,其特征在于,内容信息显示单元显示每个多媒体内容项目的名称、代表图片、链接以及综合评分。
45.如权利要求44所述的装置,其特征在于,内容信息接收单元接收的多个多媒体内容项目的信息包括:多组多媒体内容项目的信息以及评估标准的信息。
46.如权利要求45所述的装置,其特征在于,内容信息显示单元将接收的评估标准的信息分别显示为内容标签,并且显示与默认网页标签相应的一组多媒体内容项目的信息。
CN201310192835.7A 2013-05-22 2013-05-22 产生内容标签的方法、提供多媒体内容信息的方法及装置 Active CN103279513B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310192835.7A CN103279513B (zh) 2013-05-22 2013-05-22 产生内容标签的方法、提供多媒体内容信息的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310192835.7A CN103279513B (zh) 2013-05-22 2013-05-22 产生内容标签的方法、提供多媒体内容信息的方法及装置

Publications (2)

Publication Number Publication Date
CN103279513A CN103279513A (zh) 2013-09-04
CN103279513B true CN103279513B (zh) 2017-03-01

Family

ID=49062032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310192835.7A Active CN103279513B (zh) 2013-05-22 2013-05-22 产生内容标签的方法、提供多媒体内容信息的方法及装置

Country Status (1)

Country Link
CN (1) CN103279513B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679386B (zh) * 2013-12-25 2017-07-04 深圳市盈富在线信息科技有限公司 一种资讯数据处理方法及资讯数据处理的客户端
CN103970812A (zh) * 2013-12-27 2014-08-06 乐视网信息技术(北京)股份有限公司 多媒体内容的搜寻方法与系统
CN103914543B (zh) * 2014-04-03 2017-12-26 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN104133877B (zh) * 2014-07-25 2017-09-29 百度在线网络技术(北京)有限公司 软件标签的生成方法和装置
CN104199898B (zh) * 2014-08-26 2018-05-15 北京小度互娱科技有限公司 一种属性信息的获取方法及装置、推送方法及装置
CN105117449B (zh) * 2015-08-14 2019-08-16 百度在线网络技术(北京)有限公司 一种用于生成内容项的标签的方法和装置
CN106611008B (zh) * 2015-10-26 2020-06-12 中国移动通信集团公司 一种互联网内容标签的管理方法及装置
CN105550217B (zh) * 2015-12-03 2021-05-07 腾讯科技(深圳)有限公司 场景音乐搜索方法及场景音乐搜索装置
CN105912620A (zh) * 2016-04-07 2016-08-31 乐视控股(北京)有限公司 一种个性化多媒体推荐方法和装置
CN106250420A (zh) * 2016-07-21 2016-12-21 深圳市辣妈帮科技有限公司 标签关联方法和装置
WO2018023685A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 一种识别用户兴趣的方法和识别系统
CN107818092B (zh) * 2016-09-12 2023-05-26 百度在线网络技术(北京)有限公司 文档处理方法及装置
CN107092616B (zh) * 2016-11-02 2020-08-28 北京星选科技有限公司 一种对象排序方法及装置
CN107291930A (zh) * 2017-06-29 2017-10-24 环球智达科技(北京)有限公司 权重数的计算方法
CN110399505A (zh) * 2018-04-17 2019-11-01 华为技术有限公司 语义标签生成方法及设备、计算机存储介质
CN109976622B (zh) * 2019-04-04 2021-02-02 掌阅科技股份有限公司 书籍标签确定方法、电子设备及计算机存储介质
CN111324771B (zh) * 2020-02-26 2022-11-04 腾讯科技(深圳)有限公司 视频标签的确定方法、装置、电子设备及存储介质
CN111782880B (zh) * 2020-07-10 2023-12-15 聚好看科技股份有限公司 语义泛化方法及显示设备
CN114513575B (zh) * 2020-10-29 2023-06-06 华为技术有限公司 一种收藏处理的方法及相关装置
CN112989118B (zh) * 2021-02-04 2023-08-18 北京奇艺世纪科技有限公司 视频召回方法及装置
CN113793193B (zh) * 2021-08-13 2024-02-02 唯品会(广州)软件有限公司 数据搜索准确性验证方法、装置、设备及计算机可读介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236669A (zh) * 2010-04-30 2011-11-09 腾讯科技(深圳)有限公司 推荐列表的生成方法和装置、媒体服务器、客户端及方法
CN102622358A (zh) * 2011-01-27 2012-08-01 天脉聚源(北京)传媒科技有限公司 一种搜索信息的方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7051023B2 (en) * 2003-04-04 2006-05-23 Yahoo! Inc. Systems and methods for generating concept units from search queries
CN101262494A (zh) * 2008-01-23 2008-09-10 华为技术有限公司 对发布信息进行处理的方法、客户端、服务器和系统
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236669A (zh) * 2010-04-30 2011-11-09 腾讯科技(深圳)有限公司 推荐列表的生成方法和装置、媒体服务器、客户端及方法
CN102622358A (zh) * 2011-01-27 2012-08-01 天脉聚源(北京)传媒科技有限公司 一种搜索信息的方法和系统

Also Published As

Publication number Publication date
CN103279513A (zh) 2013-09-04

Similar Documents

Publication Publication Date Title
CN103279513B (zh) 产生内容标签的方法、提供多媒体内容信息的方法及装置
CN111984689B (zh) 信息检索的方法、装置、设备以及存储介质
US8630972B2 (en) Providing context for web articles
US8719283B2 (en) Summarizing reviews
KR101166130B1 (ko) 컨텐츠 태그를 이용하여 사용자 프로파일을 구성하는 방법및 장치, 그리고 생성된 사용자 프로파일을 이용하여컨텐츠를 추천하는 방법
US9152674B2 (en) Performing application searches
Zubiaga et al. Classifying trending topics: a typology of conversation triggers on twitter
CN103729359B (zh) 一种推荐搜索词的方法及系统
US8650198B2 (en) Systems and methods for facilitating the gathering of open source intelligence
JP2010067175A (ja) ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法
JP2015524962A (ja) 各マイクロブログがスパースな情報だけを含む多数のマイクロブログから情報に富んだ内容を自動生成するためのシステム及び方法
Schedl Leveraging microblogs for spatiotemporal music information retrieval
JP4896268B2 (ja) 情報価値を反映した情報検索方法及びその装置
CN110888990A (zh) 文本推荐方法、装置、设备及介质
CN103942198B (zh) 用于挖掘意图的方法和设备
CN110633406B (zh) 事件专题的生成方法、装置、存储介质和终端设备
CN102163228A (zh) 用于确定资源候选项的排序结果的方法、装置及设备
CN102930038A (zh) 一种检索结果相似条目的合并方法及其系统
CN113039539A (zh) 使用ai模型推荐来扩展搜索引擎能力
CN111460289A (zh) 新闻资讯的推送方法和装置
US20130346385A1 (en) System and method for a purposeful sharing environment
JP2005107688A (ja) 情報表示方法及びシステム及び情報表示プログラム
CN112116426A (zh) 一种推送物品信息的方法和装置
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
JP5952756B2 (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant