CN104166648A - 基于标签的推荐数据挖掘方法及装置 - Google Patents

基于标签的推荐数据挖掘方法及装置 Download PDF

Info

Publication number
CN104166648A
CN104166648A CN201310182148.7A CN201310182148A CN104166648A CN 104166648 A CN104166648 A CN 104166648A CN 201310182148 A CN201310182148 A CN 201310182148A CN 104166648 A CN104166648 A CN 104166648A
Authority
CN
China
Prior art keywords
recommending data
label
target labels
recommending
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310182148.7A
Other languages
English (en)
Inventor
刘凯奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310182148.7A priority Critical patent/CN104166648A/zh
Publication of CN104166648A publication Critical patent/CN104166648A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于标签的推荐数据挖掘方法及装置。本发明实施例通过确定至少一个与评论信息相关的标签,以作为目标标签,使得能够根据所述目标标签,获得与所述目标标签相关的目标推荐数据,由于采用与评论信息相关的标签所描述的特征维度较多,且数量很多,因此,能够避免现有技术中由于推荐数据的标签都是一些只描述推荐数据的固定特征的词语而导致的该标签所描述的特征维度比较单一,且数量有限的问题,从而提高了推荐数据的准确率、利用率和点击率。

Description

基于标签的推荐数据挖掘方法及装置
【技术领域】
本发明涉及推荐技术,尤其涉及一种基于标签的推荐数据挖掘方法及装置。
【背景技术】
随着通信技术的发展,终端集成了越来越多的功能,从而使得终端的系统功能列表中包含了越来越多相应的应用程序。有些应用程序中会涉及一些推荐服务,例如,百度地图中的附近美食推荐等。这些应用程序的客户端可以利用推荐数据的标签(tag),还可以称其为标注,进行一些基于标签的推荐等。现有技术中,具体可以基于预先设置的标准词语,提取推荐数据的标签,这些标准词语都是一些描述推荐数据的固定特征的词语,例如,中餐馆、川菜或烧烤等标准词语。
然而,由于推荐数据的标签都是一些只描述推荐数据的固定特征的词语,例如,中餐馆、川菜或烧烤等标准词语,因此,该标签所描述的特征维度比较单一,且数量有限,从而导致了基于标签所挖掘的推荐数据的准确率、利用率和点击率的降低。
【发明内容】
本发明的多个方面提供一种基于标签的推荐数据挖掘方法及装置,用以提高推荐数据的准确率、利用率和点击率。
本发明的一方面,提供一种基于标签的推荐数据挖掘方法,包括:
确定至少一个与评论信息相关的标签,以作为目标标签;
根据所述目标标签,获得与所述目标标签相关的目标推荐数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述目标标签,获得与所述目标标签相关的目标推荐数据,包括:
根据所述目标标签,利用基于项目的协同过滤算法,获得与所述目标标签相关的目标推荐数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述目标标签,利用基于项目的协同过滤算法,获得与所述目标标签相关的目标推荐数据,包括:
根据所述目标标签,利用基于项目的协同过滤算法,在待推荐的全部推荐数据或部分推荐数据的标签中进行匹配,以获得与所述目标标签一致或相近似的匹配标签;
根据所述匹配标签,获得与所述匹配标签对应的推荐数据,以作为所述目标推荐数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述确定至少一个与评论信息相关的标签,以作为目标标签之前,还包括:
通过与至少一个服务器进行交互,获得待推荐的全部推荐数据或部分推荐数据的评论信息;
根据每个所述推荐数据的评论信息,提取每个所述推荐数据的标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据每个所述推荐数据的评论信息,提取每个所述推荐数据的标签,包括:
在每个所述推荐数据的评论信息中进行挖掘,以获得每个所述推荐数据的评论索引;
根据每个所述推荐数据的评论索引,提取每个所述推荐数据的标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述标签包括环境信息、服务信息和推荐项目信息中的至少一项。
本发明的另一方面,提供一种基于标签的推荐数据挖掘装置,包括:
确定单元,用于确定至少一个与评论信息相关的标签,以作为目标标签;
获得单元,用于根据所述目标标签,获得与所述目标标签相关的目标推荐数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,具体用于
根据所述目标标签,利用基于项目的协同过滤算法,获得与所述目标标签相关的目标推荐数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,具体用于
根据所述目标标签,利用基于项目的协同过滤算法,在待推荐的全部推荐数据或部分推荐数据的标签中进行匹配,以获得与所述目标标签一致或相近似的匹配标签;以及根据所述匹配标签,获得标签为所述匹配标签的推荐数据,以作为所述目标推荐数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括提取单元,用于
通过与至少一个服务器进行交互,获得待推荐的全部推荐数据或部分推荐数据的评论信息;以及根据每个所述推荐数据的评论信息,提取每个所述推荐数据的标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述提取单元,具体用于
在每个所述推荐数据的评论信息中进行挖掘,以获得每个所述推荐数据的评论索引;以及根据每个所述推荐数据的评论索引,提取每个所述推荐数据的标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述标签包括环境信息、服务信息和推荐项目信息中的至少一项。
由上述技术方案可知,本发明实施例通过确定至少一个与评论信息相关的标签,以作为目标标签,使得能够根据所述目标标签,获得与所述目标标签相关的目标推荐数据,由于采用与评论信息相关的标签所描述的特征维度较多,且数量很多,因此,能够避免现有技术中由于推荐数据的标签都是一些只描述推荐数据的固定特征的词语而导致的该标签所描述的特征维度比较单一,且数量有限的问题,从而提高了推荐数据的准确率、利用率和点击率。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的基于标签的推荐数据挖掘方法的流程示意图;
图2为本发明另一实施例提供的基于标签的推荐数据挖掘装置的结构示意图;
图3为本发明另一实施例提供的基于标签的推荐数据挖掘装置的结构示意图。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持装置、无线上网本、个人电脑、便携电脑、MP3播放器、MP4播放器等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的基于标签的推荐数据挖掘方法的流程示意图,如图1所示。
101、确定至少一个与评论信息相关的标签,以作为目标标签。
具体地,具体可以根据目标用户历史访问的万维网(World Wide Web,Web)页面、历史点击的推荐数据、当前所在的位置数据和历史发表的用户评论等相关信息,确定该目标用户可能感兴趣的兴趣点(Point of Interest,POI)。然后,则可以根据所确定的兴趣点,确定至少一个与评论信息相关的标签,以作为目标标签,本实施例对此不进行限定。
例如,目标用户昨天刚刚点击过“江边城外(上地店)”,那么,根据目标用户对“江边城外(上地店)”所发表的用户评论即“环境优雅,适合带宝宝用餐”,则可以确定该目标用户可能感兴趣的兴趣点为“环境优雅”;然后,则可以根据所确定的兴趣点“环境优雅”,确定“环境优雅”作为目标标签。
102、根据所述目标标签,获得与所述目标标签相关的目标推荐数据。
需要说明的是,101~102的执行主体可以是推荐引擎,可以位于本地的客户端中,以进行离线推荐,或者还可以位于网络侧的服务器中,以进行在线推荐,本实施例对此不进行限定。
可以理解的是,在102之后,推荐引擎则可以进一步将目标推荐数据发送给客户端,以供该客户端将所述目标推荐数据展现给目标用户。
可以理解的是,所述客户端可以是安装在终端上的应用程序,或者还可以是浏览器的一个网页,只要能够实现推荐,以提供推荐服务的客观存在形式都可以,本实施例对此不进行限定。
这样,通过确定至少一个与评论信息相关的标签,以作为目标标签,使得能够根据所述目标标签,获得与所述目标标签相关的目标推荐数据,由于采用与评论信息相关的标签所描述的特征维度较多,且数量很多,因此,能够避免现有技术中由于推荐数据的标签都是一些只描述推荐数据的固定特征的词语而导致的该标签所描述的特征维度比较单一,且数量有限的问题,从而提高了推荐数据的准确率、利用率和点击率。
另外,采用本发明提供的技术方案,能够挖掘到更多的推荐数据,从而能够进一步提高推荐数据的利用率和点击率。
可选地,在本实施例的一个可能的实现方式中,在102中,推荐引擎具体可以根据所述目标标签,利用基于项目(Item-based)的协同过滤算法,获得与所述目标标签相关的目标推荐数据。
具体地,在本实施例中“项目”可以理解为标签,基于项目的协同过滤算法,也就是说,基于标签的协同过滤算法,是根据用户对相似项目的评分数据预测目标项目的评分,它是建立在如下假设基础上的:如果大部分用户对某些项目的打分比较相近,则当前用户对这些项的打分也会比较接近。基于项目的协同过滤算法主要对目标用户所评价的一组项目进行研究,并计算这些项目与目标项目之间的相似性,然后从选择前K个最相似度最大的项目输出。
例如,所述推荐引擎具体可以根据所述目标标签,利用基于项目的协同过滤算法,在待推荐的全部推荐数据或部分推荐数据的标签中进行匹配,以获得与所述目标标签一致或相近似的匹配标签;然后,所述推荐引擎则可以根据所述匹配标签,获得与所述匹配标签对应的推荐数据,以作为所述目标推荐数据。
可选地,在本实施例的一个可能的实现方式中,在101之前,推荐引擎还可以进一步通过与至少一个服务器进行交互,获得待推荐的全部推荐数据或部分推荐数据的评论信息。例如,大众点评、饭统网、百度身边等应用所涉及的服务器,该服务器中存储有用户关于待推荐的全部推荐数据或部分推荐数据的点评。然后,所述推荐引擎则可以根据每个所述推荐数据的评论信息,提取每个所述推荐数据的标签。
具体地,具体可以利用分词处理、停用词过滤等方法,从每个所述推荐数据的评论信息中,提取每个所述推荐数据的标签。
其中,分词处理是指,对目标文本进行切分,例如,字符串匹配分词、词义分词、统计分词等方法。
其中,停用词过滤是指,对一些出现频率太高,且没有太大搜索含义的词,例如,的、是、太、非常、of、the和is等,进行过滤。
例如,所述评论信息可以为如下形式:
环境优雅,非常适合带宝宝用餐,赞一个。
其中,采用逗号等分隔符进行分隔,不同的输入法分隔符可以不相同,本实施例对此不进行限定,只要能够需要根据评论信息具体情况进行分隔设置即可。具体可以先通过分隔符,将评论信息分割成一个一个的部分,然后对每个部分进行分词处理。“非常适合带宝宝用餐”这一位置信息,如果直接成为一个tag,是不合理的,因为长度过长了,需要对其进行分词处理。分词处理技术当前是成熟的,会将其分隔为“非常”、“带”、“宝宝”和“用餐”等tag。
但是,明显“非常”这个tag对于读者了解这家商户没有任何帮助,因此需要进一步进行停用词过滤。例如,使用一个停用词列表来进行过滤,该列表所包含的tag为一些出现频率太高,且没有太大搜索含义的词,例如,的、是、太、非常、of、the和is等,进行过滤,得到标签。
具体地,所述推荐引擎具体可以在每个所述推荐数据的评论信息中进行挖掘,以获得每个所述推荐数据的评论索引。然后,所述推荐引擎则可以根据每个所述推荐数据的评论索引,提取每个所述推荐数据的标签。
可选地,在本实施例的一个可能的实现方式中,本发明所涉及的所述标签可以包括但不限于环境信息、服务信息和推荐项目信息中的至少一项。例如,环境嘈杂、环境优雅等环境信息;或者再例如,服务员态度太差、门口等位设置娱乐设备等服务信息;或者再例如,推荐鱼香味烤鱼、水煮鱼味道鲜美等推荐项目信息,本实施例对此不进行限定。
本实施例中,通过确定至少一个与评论信息相关的标签,以作为目标标签,使得能够根据所述目标标签,获得与所述目标标签相关的目标推荐数据,由于采用与评论信息相关的标签所描述的特征维度较多,且数量很多,因此,能够避免现有技术中由于推荐数据的标签都是一些只描述推荐数据的固定特征的词语而导致的该标签所描述的特征维度比较单一,且数量有限的问题,从而提高了推荐数据的准确率、利用率和点击率。
另外,采用本发明提供的技术方案,能够挖掘到更多的推荐数据,从而能够进一步提高推荐数据的利用率和点击率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本发明另一实施例提供的基于标签的推荐数据挖掘装置的结构示意图,如图2所示。本实施例的基于标签的推荐数据挖掘装置可以包括确定单元21和获得单元22。其中,确定单元21,用于确定至少一个与评论信息相关的标签,以作为目标标签;获得单元22,用于根据所述目标标签,获得与所述目标标签相关的目标推荐数据。
具体地,所述确定单元21具体可以根据目标用户历史访问的万维网(World Wide Web,Web)页面、历史点击的推荐数据、当前所在的位置数据和历史发表的用户评论等相关信息,确定该目标用户可能感兴趣的兴趣点(Point of Interest,POI)。然后,所述确定单元21则可以根据所确定的兴趣点,确定至少一个与评论信息相关的标签,以作为目标标签,本实施例对此不进行限定。
例如,目标用户昨天刚刚点击过“江边城外(上地店)”,那么,所述确定单元21根据目标用户对“江边城外(上地店)”所发表的用户评论即“环境优雅,适合带宝宝用餐”,则可以确定该目标用户可能感兴趣的兴趣点为“环境优雅”;然后,所述确定单元21则可以根据所确定的兴趣点“环境优雅”,确定“环境优雅”作为目标标签。
需要说明的是,本实施例提供的装置可以是推荐引擎,可以位于本地的客户端中,以进行离线推荐,或者还可以位于网络侧的服务器中,以进行在线推荐,本实施例对此不进行限定。
可以理解的是,在获得单元22执行根据所述目标标签,获得与所述目标标签相关的目标推荐数据的操作之后,推荐引擎则可以进一步将目标推荐数据发送给客户端,以供该客户端将所述目标推荐数据展现给目标用户。
可以理解的是,所述客户端可以是安装在终端上的应用程序,或者还可以是浏览器的一个网页,只要能够实现推荐,以提供推荐服务的客观存在形式都可以,本实施例对此不进行限定。
这样,通过确定单元确定至少一个与评论信息相关的标签,以作为目标标签,使得获得单元能够根据所述目标标签,获得与所述目标标签相关的目标推荐数据,由于采用与评论信息相关的标签所描述的特征维度较多,且数量很多,因此,能够避免现有技术中由于推荐数据的标签都是一些只描述推荐数据的固定特征的词语而导致的该标签所描述的特征维度比较单一,且数量有限的问题,从而提高了推荐数据的准确率、利用率和点击率。
另外,采用本发明提供的技术方案,能够挖掘到更多的推荐数据,从而能够进一步提高推荐数据的利用率和点击率。
可选地,在本实施例的一个可能的实现方式中,所述获得单元22,具体可以用于根据所述目标标签,利用基于项目(Item-based)的协同过滤算法,获得与所述目标标签相关的目标推荐数据。
具体地,在本实施例中“项目”可以理解为标签,基于项目的协同过滤算法,也就是说,基于标签的协同过滤算法,是根据用户对相似项目的评分数据预测目标项目的评分,它是建立在如下假设基础上的:如果大部分用户对某些项目的打分比较相近,则当前用户对这些项的打分也会比较接近。基于项目的协同过滤算法主要对目标用户所评价的一组项目进行研究,并计算这些项目与目标项目之间的相似性,然后从选择前K个最相似度最大的项目输出。
例如,所述获得单元22,具体可以根据所述目标标签,利用基于项目的协同过滤算法,在待推荐的全部推荐数据或部分推荐数据的标签中进行匹配,以获得与所述目标标签一致或相近似的匹配标签;以及根据所述匹配标签,获得标签为所述匹配标签的推荐数据,以作为所述目标推荐数据。
可选地,在本实施例的一个可能的实现方式中,如图3所示,本实施例提供的基于标签的推荐数据挖掘装置还可以进一步包括提取单元31,用于通过与至少一个服务器进行交互,获得待推荐的全部推荐数据或部分推荐数据的评论信息,例如,大众点评、饭统网、百度身边等应用所涉及的服务器,该服务器中存储有用户关于待推荐的全部推荐数据或部分推荐数据的点评;以及根据每个所述推荐数据的评论信息,提取每个所述推荐数据的标签。
具体地,所述提取单元31具体可以利用分词处理、停用词过滤等方法,从每个所述推荐数据的评论信息中,提取每个所述推荐数据的标签。
其中,分词处理是指,对目标文本进行切分,例如,字符串匹配分词、词义分词、统计分词等方法。
其中,停用词过滤是指,对一些出现频率太高,且没有太大搜索含义的词,例如,的、是、太、非常、of、the和is等,进行过滤。
例如,所述评论信息可以为如下形式:
环境优雅,非常适合带宝宝用餐,赞一个。
其中,采用逗号等分隔符进行分隔,不同的输入法分隔符可以不相同,本实施例对此不进行限定,只要能够需要根据评论信息具体情况进行分隔设置即可。所述提取单元31具体可以先通过分隔符,将评论信息分割成一个一个的部分,然后对每个部分进行分词处理。“非常适合带宝宝用餐”这一位置信息,如果直接成为一个tag,是不合理的,因为长度过长了,需要对其进行分词处理。分词处理技术当前是成熟的,会将其分隔为“非常”、“带”、“宝宝”和“用餐”等tag。
但是,明显“非常”这个tag对于读者了解这家商户没有任何帮助,因此需要进一步进行停用词过滤。例如,使用一个停用词列表来进行过滤,该列表所包含的tag为一些出现频率太高,且没有太大搜索含义的词,例如,的、是、太、非常、of、the和is等,进行过滤,得到标签。
具体地,所述提取单元31,具体可以用于在每个所述推荐数据的评论信息中进行挖掘,以获得每个所述推荐数据的评论索引;以及根据每个所述推荐数据的评论索引,提取每个所述推荐数据的标签。
可选地,在本实施例的一个可能的实现方式中,本发明所涉及的所述标签包括环境信息、服务信息和推荐项目信息中的至少一项。例如,环境嘈杂、环境优雅等环境信息;或者再例如,服务员态度太差、门口等位设置娱乐设备等服务信息;或者再例如,推荐鱼香味烤鱼、水煮鱼味道鲜美等推荐项目信息,本实施例对此不进行限定。
本实施例中,通过确定单元确定至少一个与评论信息相关的标签,以作为目标标签,使得获得单元能够根据所述目标标签,获得与所述目标标签相关的目标推荐数据,由于采用与评论信息相关的标签所描述的特征维度较多,且数量很多,因此,能够避免现有技术中由于推荐数据的标签都是一些只描述推荐数据的固定特征的词语而导致的该标签所描述的特征维度比较单一,且数量有限的问题,从而提高了推荐数据的准确率、利用率和点击率。
另外,采用本发明提供的技术方案,能够挖掘到更多的推荐数据,从而能够进一步提高推荐数据的利用率和点击率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种基于标签的推荐数据挖掘方法,其特征在于,包括:
确定至少一个与评论信息相关的标签,以作为目标标签;
根据所述目标标签,获得与所述目标标签相关的目标推荐数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标标签,获得与所述目标标签相关的目标推荐数据,包括:
根据所述目标标签,利用基于项目的协同过滤算法,获得与所述目标标签相关的目标推荐数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标标签,利用基于项目的协同过滤算法,获得与所述目标标签相关的目标推荐数据,包括:
根据所述目标标签,利用基于项目的协同过滤算法,在待推荐的全部推荐数据或部分推荐数据的标签中进行匹配,以获得与所述目标标签一致或相近似的匹配标签;
根据所述匹配标签,获得与所述匹配标签对应的推荐数据,以作为所述目标推荐数据。
4.根据权利要求1~3任一权利要求所述的方法,其特征在于,所述确定至少一个与评论信息相关的标签,以作为目标标签之前,还包括:
通过与至少一个服务器进行交互,获得待推荐的全部推荐数据或部分推荐数据的评论信息;
根据每个所述推荐数据的评论信息,提取每个所述推荐数据的标签。
5.根据权利要求4所述的方法,其特征在于,所述根据每个所述推荐数据的评论信息,提取每个所述推荐数据的标签,包括:
在每个所述推荐数据的评论信息中进行挖掘,以获得每个所述推荐数据的评论索引;
根据每个所述推荐数据的评论索引,提取每个所述推荐数据的标签。
6.根据权利要求1~5任一权利要求所述的方法,其特征在于,所述标签包括环境信息、服务信息和推荐项目信息中的至少一项。
7.一种基于标签的推荐数据挖掘装置,其特征在于,包括:
确定单元,用于确定至少一个与评论信息相关的标签,以作为目标标签;
获得单元,用于根据所述目标标签,获得与所述目标标签相关的目标推荐数据。
8.根据权利要求7所述的装置,其特征在于,所述获得单元,具体用于
根据所述目标标签,利用基于项目的协同过滤算法,获得与所述目标标签相关的目标推荐数据。
9.根据权利要求8所述的装置,其特征在于,所述获得单元,具体用于
根据所述目标标签,利用基于项目的协同过滤算法,在待推荐的全部推荐数据或部分推荐数据的标签中进行匹配,以获得与所述目标标签一致或相近似的匹配标签;以及根据所述匹配标签,获得标签为所述匹配标签的推荐数据,以作为所述目标推荐数据。
10.根据权利要求7~9任一权利要求所述的装置,其特征在于,所述装置还包括提取单元,用于
通过与至少一个服务器进行交互,获得待推荐的全部推荐数据或部分推荐数据的评论信息;以及根据每个所述推荐数据的评论信息,提取每个所述推荐数据的标签。
11.根据权利要求10所述的装置,其特征在于,所述提取单元,具体用于
在每个所述推荐数据的评论信息中进行挖掘,以获得每个所述推荐数据的评论索引;以及根据每个所述推荐数据的评论索引,提取每个所述推荐数据的标签。
12.根据权利要求7~11任一权利要求所述的装置,其特征在于,所述标签包括环境信息、服务信息和推荐项目信息中的至少一项。
CN201310182148.7A 2013-05-16 2013-05-16 基于标签的推荐数据挖掘方法及装置 Pending CN104166648A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310182148.7A CN104166648A (zh) 2013-05-16 2013-05-16 基于标签的推荐数据挖掘方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310182148.7A CN104166648A (zh) 2013-05-16 2013-05-16 基于标签的推荐数据挖掘方法及装置

Publications (1)

Publication Number Publication Date
CN104166648A true CN104166648A (zh) 2014-11-26

Family

ID=51910467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310182148.7A Pending CN104166648A (zh) 2013-05-16 2013-05-16 基于标签的推荐数据挖掘方法及装置

Country Status (1)

Country Link
CN (1) CN104166648A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104732422A (zh) * 2015-02-27 2015-06-24 湖南大学 基于移动用户标签的个性化美食推荐方法
CN105095387A (zh) * 2015-06-30 2015-11-25 北京奇虎科技有限公司 基于用户评论信息的poi数据采集方法及装置
CN106960030A (zh) * 2017-03-21 2017-07-18 北京百度网讯科技有限公司 基于人工智能的推送信息方法及装置
CN108073640A (zh) * 2016-11-17 2018-05-25 广州市动景计算机科技有限公司 页面推送方法和系统
WO2020006834A1 (zh) * 2018-07-06 2020-01-09 平安科技(深圳)有限公司 金融机构推荐方法、设备、存储介质及装置
CN110730382A (zh) * 2019-09-27 2020-01-24 北京达佳互联信息技术有限公司 一种视频交互方法、装置、终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070250895A1 (en) * 2006-03-31 2007-10-25 Fujitsu Limited Electronic apparatus, information browsing method thereof, and storage medium
CN101216842A (zh) * 2008-01-07 2008-07-09 华为技术有限公司 获取页面关键词的方法及页面信息处理装置
CN101984437A (zh) * 2010-11-23 2011-03-09 亿览在线网络技术(北京)有限公司 音乐资源个性化推荐方法及系统
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070250895A1 (en) * 2006-03-31 2007-10-25 Fujitsu Limited Electronic apparatus, information browsing method thereof, and storage medium
CN101216842A (zh) * 2008-01-07 2008-07-09 华为技术有限公司 获取页面关键词的方法及页面信息处理装置
CN101984437A (zh) * 2010-11-23 2011-03-09 亿览在线网络技术(北京)有限公司 音乐资源个性化推荐方法及系统
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周卫敏: ""基于网络短评的个性化推荐系统的研究与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104732422A (zh) * 2015-02-27 2015-06-24 湖南大学 基于移动用户标签的个性化美食推荐方法
CN105095387A (zh) * 2015-06-30 2015-11-25 北京奇虎科技有限公司 基于用户评论信息的poi数据采集方法及装置
CN108073640A (zh) * 2016-11-17 2018-05-25 广州市动景计算机科技有限公司 页面推送方法和系统
CN106960030A (zh) * 2017-03-21 2017-07-18 北京百度网讯科技有限公司 基于人工智能的推送信息方法及装置
CN106960030B (zh) * 2017-03-21 2020-11-10 北京百度网讯科技有限公司 基于人工智能的推送信息方法及装置
WO2020006834A1 (zh) * 2018-07-06 2020-01-09 平安科技(深圳)有限公司 金融机构推荐方法、设备、存储介质及装置
CN110730382A (zh) * 2019-09-27 2020-01-24 北京达佳互联信息技术有限公司 一种视频交互方法、装置、终端及存储介质
CN110730382B (zh) * 2019-09-27 2020-10-30 北京达佳互联信息技术有限公司 一种视频交互方法、装置、终端及存储介质

Similar Documents

Publication Publication Date Title
US11157926B2 (en) Digital content prioritization to accelerate hyper-targeting
Kennedy-Eden et al. A taxonomy of mobile applications in tourism
CA2797401C (en) Automated social networking graph mining and visualization
CN107222526B (zh) 推送推广信息的方法、装置、设备和计算机存储介质
CN104166648A (zh) 基于标签的推荐数据挖掘方法及装置
US20110119267A1 (en) Method and system for processing web activity data
CN105279224A (zh) 信息推送方法及装置
CN104102719A (zh) 一种轨迹信息的推送方法及装置
GB2507667A (en) Targeted advertising based on momentum of activities
CN104750789A (zh) 标签的推荐方法及装置
CN109933699A (zh) 一种学术画像模型的构建方法及装置
CN103136253A (zh) 获取信息的方法和装置
CN106991175B (zh) 一种客户信息挖掘方法、装置、设备以及存储介质
US20160125028A1 (en) Systems and methods for query rewriting
CN104217030A (zh) 一种根据服务器搜索日志数据进行用户分类的方法和装置
CN106062743A (zh) 用于关键字建议的系统和方法
US20160104074A1 (en) Recommending Bidded Terms
CN110674620A (zh) 目标文案生成方法、装置、介质及电子设备
CN105916032A (zh) 视频推荐的方法及视频推荐的终端设备
CN103412958A (zh) 一种搜索结果显示方法和装置
CN105408929A (zh) 利用反向拍卖的加盟店推荐方法及推荐装置
CN103262079B (zh) 检索装置及检索方法
CN115423555A (zh) 一种商品推荐方法、装置、电子设备及存储介质
CN104462061A (zh) 词语提取方法及提取装置
CN106383857A (zh) 一种信息处理方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20141126

RJ01 Rejection of invention patent application after publication