CN104601670A

CN104601670A - 一种用户兴趣对象验证方法及装置

Info

Publication number: CN104601670A
Application number: CN201410827157.1A
Authority: CN
Inventors: 李金奎
Original assignee: Weimeng Chuangke Network Technology China Co Ltd
Current assignee: Weimeng Chuangke Network Technology China Co Ltd
Priority date: 2014-12-25
Filing date: 2014-12-25
Publication date: 2015-05-06

Abstract

本申请公开了一种用户兴趣对象验证方法。用于解决现有技术对于用户兴趣的验证效率较低的问题。方法包括：获取用户兴趣信息；其中，所述用户兴趣信息用于表示当前用户感兴趣的对象；根据用户兴趣信息构建兴趣标签集；验证推测的兴趣对象信息与兴趣标签集是否匹配；并在验证结果为匹配时，确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。本申请还公开了一种用户兴趣对象验证装置。

Description

一种用户兴趣对象验证方法及装置

技术领域

本申请涉及互联网技术领域，尤其涉及一种用户兴趣对象验证方法及装置。

背景技术

微博是一个基于用户关系的信息分享、传播以及获取平台，是基于web2.0平台兴起的开放互联网社交服务。在微博平台中，用户行为能够体现用户在微博等社交网络上的兴趣。然而在用户兴趣的挖掘中，结果的准确性成为了重要的问题，兴趣是非常主观的概念，不同于计算结果的对错，在数据挖掘的计算过程中，不是简单的是非对错之差，而是不断地提高挖掘结果准确程度，所以对于挖掘出的结果需要进行验证来判断准确程度。

现有技术中验证用户兴趣主要有以下两种方法：

第一种方法，A/B测试，即在该线上产品的一部分部署中引入推测的兴趣对象，另一部分部署保持不变。通过一段时间的运行，对线上产品两部分部署的活跃度等参数进行对比，验证引入推测的兴趣对象是否有效地改善了相关参数。比如，挖掘到10个用户对NBA感兴趣，将NBA这一类目的新闻，广告，文章等兴趣信息不断推荐给5个用户，另外5个用户不推送类似兴趣信息，观察一段时间这两部分用户的在线时长，活跃度等参数有没有改善，如果在线时长延长，活跃度提升则证明挖掘结果较准确。

第二种，先选定一批样本用户，将挖掘出的样本用户的推测的兴趣对象分发给每个相应的用户；然后让用户将对自己的挖掘结果进行判定；最后，将样本用户的判定结果进行统计，从而对整个样本用户集的挖掘效果进行验证。比如，找到10个样本用户，分别挖掘每位用户的兴趣，将挖掘出的每位用户感兴趣的信息分别推荐给每个用户，然后让每位用户对挖掘结果做判定，将判定结果进行统计，从而验证了挖掘结果的准确性。

第一种方法由于需要在线上部署信息，所以对线上产品的影响较大，还需要一段时间的验证。第二种方法对于用户的覆盖面较低，而且需要针对每个人进行操作，验证的代价较高。总之，现有技术对于用户兴趣的验证效率较低。

发明内容

本申请实施例提供一种用户兴趣对象验证方法，用于解决现有技术对于用户兴趣的验证效率较低的问题。

本申请实施例提供一种用户兴趣对象验证装置，用于解决现有技术对于用户兴趣的验证效率较低的问题。

本申请实施例采用下述技术方案：

一种用户兴趣对象验证方法，包括：获取用户兴趣信息；其中，所述用户兴趣信息用于表示当前用户感兴趣的对象；根据用户兴趣信息构建兴趣标签集；验证推测的兴趣对象信息与兴趣标签集是否匹配；并在验证结果为匹配时，确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。

一种用户兴趣对象验证装置，包括：获取信息单元，用于获取用户兴趣信息；其中，所述用户兴趣信息用于表示当前用户感兴趣的对象；构建信息单元，用于根据用户兴趣信息构建兴趣标签集；验证信息单元，用于验证推测的兴趣对象信息与兴趣标签集是否匹配；并在验证结果为匹配时，确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

由于采用了先根据用户兴趣信息构建兴趣标签集，再验证推测的兴趣对象信息与兴趣标签集是否匹配，并在验证结果为匹配时，确定推测的兴趣对象信息属于当前用户感兴趣的对象，可以实时地构建每位用户的兴趣标签集，对挖掘出的结果通过对兴趣标签集进行匹配来验证。相对于现有技术而言，较少影响线上产品，缩短了验证时间，覆盖面更广阔，验证的代价较低。总之，有效地提升了用户兴趣的验证效率。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例提供的一种用户兴趣对象验证方法的具体实现流程示意图；

图2为本申请实施例提供的一种用户兴趣对象验证装置的具体结构示意图；

图3为本申请实施例提供的一种用户兴趣对象验证方法的示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本申请各实施例提供的技术方案。

本申请实施例提供一种用户兴趣对象验证方法，用于解决现有技术对于用户兴趣的验证效率较低的问题。该方法的实现流程示意图如图1所示，包括下述步骤：

步骤11，获取用户兴趣信息；其中，用户兴趣信息用于表示当前用户感兴趣的对象。

步骤12，根据用户兴趣信息构建兴趣标签集。

步骤13，验证推测的兴趣对象信息与兴趣标签集是否匹配。

步骤14，在验证结果为匹配时，确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。

采用实施例提供的该方法，由于采用了先根据用户兴趣信息构建兴趣标签集，再验证推测的兴趣对象信息与兴趣标签集是否匹配，可以实时地构建每位用户的兴趣标签集，对挖掘出结果通过对兴趣标签集进行匹配来验证，相对于现有技术而言，较少影响线上产品，缩短了验证时间，覆盖面更广阔，验证的代价较低。总之，有效地提升了用户兴趣的验证效率。

以下分别详细介绍步骤11至步骤14：

针对步骤11而言，所述用户兴趣信息可以但不限于包括下述一种或多种：用户的分组名称；用户的自标签；用户关注对象的能力标签；用户的教育信息；用户的职业信息。

具体而言，用户的分组名称一般是指：社交网络中的用户按照自己与关注对象的关系，或按照自己对关注对象产生兴趣的原因，将关注对象划分到不同分组后，为分组取的名称；用户的自标签一般是指：用户将自己的兴趣以标签的方式填写在自标签信息中，如“手机”、“NBA”等表示用户兴趣的信息；能力标签一般是指：关注对象在某一专业领域或学科等具备的能力，如篮球明星姚明的能力标签可能有“NBA”、“休斯顿火箭”等，儿科专家崔玉涛的能力标签可能有“母婴育儿”、“健康医疗”等，用户关注了这些名人，意义在于该用户对关注对象的能力感兴趣；获取用户的教育信息的意义在于可以根据该信息，确定用户可能会对自己学校的相关信息(如学校公众号)感兴趣；可以根据用户的职业信息确定用户的兴趣，如：律师事务所、证券公司等。

针对步骤13而言，可以有以下三种方式实现将推测的兴趣对象信息与兴趣标签集进行匹配。

第一种方式：直接验证推测的兴趣对象信息与兴趣标签集直接是否匹配。

在对第一种方式进行详细说明之前，先说明一下兴趣标签库，在服务器中，存在一个“三层结构兴趣标签库”，存在递进和细化的关系，它的具体结构如下表1所示。

表1

对第一种方式具体而言，即通过步骤11中获取到的用户兴趣信息，直接将用户兴趣信息中的词语确定为兴趣标签集，或提取用户兴趣信息中词语的特定关键词，确定为兴趣标签集；对关注对象的能力标签，采用特定的统计方法确定用户兴趣标签集。

比如，对于“母婴育儿”、“健康医疗”这一类词语，可以直接将其定为兴趣标签；而对于“游戏风云”、“爱篮球”这一类词语，分别提取词语中“游戏”和“篮球”这些关键词，将这些关键词确定为兴趣标签。对于用户的所有关注对象，可以将所有关注对象的所有能力标签全部作为用户的兴趣标签；也可以根据特定的规则对所有关注对象的所有能力标签进行筛选，将保留下来的能力标签作为用户的兴趣标签集，意义在于根据确定出的用户最有代表性的兴趣标签构成兴趣标签集。

在确定出用户兴趣标签集后，直接验证推测的兴趣对象信息与兴趣标签集直接是否匹配；其中，兴趣对象信息可以指兴趣对象名称。

在一种实施方式中，为了达到验证推测的兴趣对象信息与兴趣标签集直接是否匹配的效果。可以制定一套验证方法：当推测的兴趣对象信息(兴趣对象名称)与兴趣标签集中某一标签名称的编辑距离等于1，或编辑距离等于2且含有两个及两个以上相同字符时，得到推测的兴趣对象信息与兴趣标签集匹配的验证结果，并执行步骤14，即在验证结果为匹配时，确定推测的兴趣对象信息属于当前用户感兴趣的对象；否则，得到推测的兴趣对象信息与兴趣标签集不匹配的验证结果，确定推测的兴趣对象信息不属于当前用户感兴趣的对象。

具体而言，比如用户A(以下统称A)评论并转发过几张篮球鞋的图片，通过挖掘，推测出A对篮球鞋感兴趣。通过获取A的用户兴趣信息来构建A的兴趣标签集，将“篮球鞋”与A的兴趣标签集中每个标签进行匹配，兴趣标签集中有“篮球”这一标签，其与“篮球鞋”的编辑距离为1，得到推测的兴趣对象信息与兴趣标签集匹配的验证结果，可以确定篮球鞋是属于当前用户感兴趣的对象。

第二种方式：对兴趣标签集进行扩展后，验证推测的兴趣对象信息与扩展后的兴趣标签集直接是否匹配。

比如，可以在执行步骤12后，利用与兴趣标签集中的标签相关联的标签，对兴趣标签集进行扩展，得到扩展后的兴趣标签集；进而验证推测的兴趣对象信息与扩展后的兴趣标签集直接是否匹配。

具体而言，为了增大兴趣标签集的覆盖面，通过层次、相关、同义等关系对兴趣标签集进行扩展。可以参考下表2所示实例。

用户标签名称	关系	扩展出的标签
			医生	同义	大夫、doctor
NBA球星	层次	NBA、美职篮
			财经	相关	金融、股票

表2

具体匹配的方法可参照第一种方式中所述的验证方法，此处不再赘述。

第三种方式，可以在执行步骤12后，利用根据用户兴趣标签集构建的公共兴趣标签，对兴趣标签集进行扩展，得到扩展后的兴趣标签集；进而验证推测的兴趣对象信息与扩展后的兴趣标签集是否匹配。

具体而言，在已构建的所有用户的所有兴趣标签集上进行兴趣标签频次的统计，可以是计算所有兴趣标签出现的次数，并将第二层和第三层相关联的标签的频次进行了叠加计算到第一层，将叠加后的第一层的兴趣标签从大到小排列，选取排列中前n位(如前6位)构成公共兴趣标签集，可以参考下表3所示实例。

标签序号	兴趣标签名称	兴趣标签频次
			1	名人明星	409986881
2	娱乐	37102748
			3	购物	24832050
4	美女	23022212
			5	旅游	16820766
6	美食	11834510

表3

将公共兴趣标签补充到兴趣标签集中的意义在于，若某用户没有设置分组名称或自标签，则这两种信息的缺失容易导致用户兴趣标签集内的兴趣标签不够全面。而对于公共兴趣标签来讲，其本就代表非常大众的兴趣。比如，极少有某一个人同时对表3中的6个兴趣标签包含的内容都反感，绝大多数人都对这6个中的至少一个感兴趣。从而利用公共兴趣标签，对通过执行步骤11生成的兴趣标签集进行扩展，可以增加用户兴趣标签集内的兴趣标签的全面性。

针对步骤13进一步而言，推测的兴趣对象信息，具体可以但不限于包括：推测的兴趣对象所属类目的名称；推测的兴趣对象名称。

验证推测的兴趣对象信息与兴趣标签集时候匹配，可以包括：根据推测的兴趣对象信息与兴趣标签集的编辑距离，验证推测的兴趣对象信息与兴趣标签集是否匹配。

在前文介绍实现验证推测的兴趣对象信息与兴趣标签集是否匹配的第一种方式中，就具体介绍了当兴趣对象信息是指兴趣对象名称时，根据推测的兴趣对象信息与兴趣标签集的编辑距离，验证推测的兴趣对象信息与兴趣标签集是否匹配的验证方法。

但在实际应用中会遇到这样的情况，比如用户B(以下统称B)转发过几条养生小常识，通过挖掘，认为B对“养生”感兴趣。然而，通过获取B的用户兴趣信息，包括分组名称、自标签、关注对象的能力标签等来构建B的兴趣标签集时，由于B的用户兴趣信息中有可能不包含任何与“养生”有关的信息，从而导致构建的兴趣标签集中没有任何标签与“养生”这个2字词的编辑距离为1或2。所以通过前文所述的第一种方式中的验证方法进行验证的话，会得到推测的兴趣对象信息与兴趣标签集不匹配的验证结果，确定“养生”不属于B对感兴趣的对象。但实际情况是B的兴趣标签集中有“母婴育儿”、“健康医疗”、“保健”这种标签，然而在医学领域，健康医疗和养生是相关的，往往对于医疗感兴趣的人不排斥养生方面的知识。显然，对于B的情况，得到B对养生不感兴趣这个结果是不准确的，这就需要进一步的完善验证方法。

如果将前文介绍实现验证推测的兴趣对象信息与兴趣标签集是否匹配的第一种方式中的方法称为第一种方法，下面就介绍第二种方法：

当兴趣对象信息是指推测的兴趣对象所属类目的名称时，验证推测的兴趣对象所属类目的名称与兴趣标签集是否匹配。

仍然以上述用户B为例，“养生”在上文所述的表1的“三层结构兴趣标签库”属于第三层，第二层是医疗学科，第一层是“医疗”，将“养生”所属类目的上层兴趣标签“医疗”与B的兴趣标签集中的“健康医疗”这个标签进行匹配，编辑距离等于2且含有两个及两个以上相同字符，得到推测的兴趣对象信息(医疗)与兴趣标签集(健康医疗)匹配的验证结果，并执行步骤14，在验证结果为匹配时，确定推测的兴趣对象信息属于当前用户感兴趣的对象，即可以确定B是对健康医疗方面，包括健康养生感兴趣的。

通过本实施例中三种利用不同构建兴趣标签集来进行匹配的方式以及两种验证过程中的验证方法，有效地提升了用户兴趣的验证效率。

需要说明的是，本申请实施例所提供方法的各步骤的执行主体均可以是同一设备，或者，该方法也由不同设备作为执行主体。比如，步骤11和步骤12的执行主体可以为设备1，步骤13和步骤14的执行主体可以为设备2；又比如，步骤11的执行主体可以为设备1，步骤12的执行主体可以为设备2，步骤13的执行主体可以为设备3，步骤14的执行主体可以为设备4；等等。

本申请实施例提供一种用户兴趣对象验证装置，用于解决现有技术对于用户兴趣的验证效率较低的问题。该装置的具体结构示意图如图2所示，包括如下功能单元：

获取信息单元21，可以用于获取用户兴趣信息；其中，所述用户兴趣信息用于表示当前用户感兴趣的对象；

构建信息单元22，可以用于根据用户兴趣信息构建兴趣标签集；

验证信息单元23，可以用于验证推测的兴趣对象信息与兴趣标签集是否匹配；并在验证结果为匹配时，确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。

在一种实施例中，验证信息单元23，可以用于：利用特定标签，对所述兴趣标签集进行扩展，得到扩展后的兴趣标签集；验证推测的兴趣对象信息与扩展后的兴趣标签集是否匹配；其中，所述特定标签包括下述标签中的一种或两种：与所述兴趣标签集中的标签相关联的标签；根据用户兴趣标签集构建的公共兴趣标签。

在一种实施例中，验证信息单元23，可以用于：根据推测的兴趣对象信息与兴趣标签集的编辑距离，验证推测的兴趣对象信息与兴趣标签集是否匹配。

在一种实施例中，验证信息单元23，具体可以用于：当推测的兴趣对象信息与兴趣标签集中某一标签名称的编辑距离等于1，或编辑距离等于2且含有两个及两个以上相同字符时，得到推测的兴趣对象信息与兴趣标签集匹配的验证结果。

本申请实施例提供一种用户兴趣验证方法，用于解决现有技术对于用户兴趣的验证效率较低的问题。

该方法的实现前提可以包括：对根据推测的兴趣对象信息与兴趣标签集的编辑距离，验证推测的兴趣对象信息与兴趣标签集是否匹配的验证方法做如下制定：

当推测的兴趣对象信息的兴趣对象名称与兴趣标签集中某一标签名称的编辑距离等于1时，或编辑距离等于2且含有两个及两个以上相同字符时，得到推测的兴趣对象信息与兴趣标签集匹配的验证结果，并在验证结果为匹配时，确定推测的兴趣对象信息属于当前用户感兴趣的对象；否则，得到推测的兴趣对象信息与兴趣标签集不匹配的验证结果，确定推测的兴趣对象信息不属于当前用户感兴趣的对象。

以用户C(以下统称C)为例：

步骤31，获取C的兴趣信息，包括：无用户分组，关注很多汽车评论人，发过关于汽车改装，赛车的原创微博，转发过很多汽车图片。

步骤32，构建C的兴趣标签集，兴趣标签集包括：汽车、汽车评测、汽车行业、汽车改装、赛车、F1、拉力赛等等。

步骤33，推测出用户的兴趣有：汽车改装、赛车、汽车测评、汽车行业。

步骤34，按照前文所述验证方法，将“汽车改装”、“赛车”、“汽车测评”、“汽车行业”与C的兴趣标签集中的“汽车”、“汽车评测”、“汽车行业”、“汽车改装”、“赛车”、“F1”、“拉力赛”等按照实现前提设定的验证方法进行验证。

步骤35，得到推测出的用户的兴趣：汽车改装、赛车、汽车测评、汽车行业，与兴趣标签集匹配的验证结果，确定推测的兴趣对象信息属于C感兴趣的对象。

本领域内的技术人员应明白，本发明的实施例可提供为装置、系统、或计算机程序商品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序商品的形式。

本发明是参照根据本发明实施例的装置、设备(系统)、和计算机程序商品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何装置或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、装置、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为装置、系统或计算机程序商品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序商品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种用户兴趣对象验证方法，其特征在于，包括：

获取用户兴趣信息；其中，所述用户兴趣信息用于表示当前用户感兴趣的对象；

根据用户兴趣信息构建兴趣标签集；

验证推测的兴趣对象信息与兴趣标签集是否匹配；并

在验证结果为匹配时，确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。

2.如权利要求1所述的方法，其特征在于，所述用户兴趣信息包括下述一种或多种：

用户的分组名称；

用户的自标签；

用户关注对象的能力标签；

用户的教育信息；

用户的职业信息。

3.如权利要求1或2所述的方法，其特征在于，验证推测的兴趣对象信息与兴趣标签集是否匹配，具体包括：

利用特定标签，对所述兴趣标签集进行扩展，得到扩展后的兴趣标签集；

验证推测的兴趣对象信息与扩展后的兴趣标签集是否匹配；

其中，所述特定标签包括下述标签中的一种或两种：

与所述兴趣标签集中的标签相关联的标签；

根据用户兴趣标签集构建的公共兴趣标签。

4.如权利要求1所述的方法，其特征在于，验证推测的兴趣对象信息与兴趣标签集是否匹配，包括：

根据推测的兴趣对象信息与兴趣标签集的编辑距离，验证推测的兴趣对象信息与兴趣标签集是否匹配。

5.如权利要求4所述的方法，其特征在于，所述方法还包括：当推测的兴趣对象信息与兴趣标签集中某一标签名称的编辑距离等于1，或编辑距离等于2且含有两个及两个以上相同字符时，得到推测的兴趣对象信息与兴趣标签集匹配的验证结果。

6.如权利要求1所述的方法，其特征在于，推测的兴趣对象信息，具体包括：

推测的兴趣对象所属类目的名称；或

推测的兴趣对象名称。

7.一种用户兴趣验证装置，其特征在于，包括：

获取信息单元，用于获取用户兴趣信息；其中，所述用户兴趣信息用于表示当前用户感兴趣的对象；

构建信息单元，用于根据用户兴趣信息构建兴趣标签集；

验证信息单元，用于验证推测的兴趣对象信息与兴趣标签集是否匹配；并在验证结果为匹配时，确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。

8.如权利要求7所述的装置，其特征在于，验证信息单元，具体用于：

验证推测的兴趣对象信息与扩展后的兴趣标签集是否匹配；

其中，所述特定标签包括下述标签中的一种或两种：

与所述兴趣标签集中的标签相关联的标签；

根据用户兴趣标签集构建的公共兴趣标签。

9.如权利要求6所述的装置，其特征在于，验证信息单元，具体用于：

10.如权利要求9所述的装置，其特征在于，验证信息单元，具体用于：

当推测的兴趣对象信息与兴趣标签集中某一标签名称的编辑距离等于1，或编辑距离等于2且含有两个及两个以上相同字符时，得到推测的兴趣对象信息与兴趣标签集匹配的验证结果。