CN105354202B - 数据推送方法及装置 - Google Patents

数据推送方法及装置 Download PDF

Info

Publication number
CN105354202B
CN105354202B CN201410412622.5A CN201410412622A CN105354202B CN 105354202 B CN105354202 B CN 105354202B CN 201410412622 A CN201410412622 A CN 201410412622A CN 105354202 B CN105354202 B CN 105354202B
Authority
CN
China
Prior art keywords
data
label
pushed
similarity
labeled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410412622.5A
Other languages
English (en)
Other versions
CN105354202A (zh
Inventor
李阳华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410412622.5A priority Critical patent/CN105354202B/zh
Publication of CN105354202A publication Critical patent/CN105354202A/zh
Application granted granted Critical
Publication of CN105354202B publication Critical patent/CN105354202B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据推送方法及装置,其中,该方法包括:获取待推送数据并根据待推送数据中的标签标识识别出有标签数据和无标签数据;根据有标签数据与无标签数据的相似度为无标签数据生成标签,以得到与无标签数据对应的目标数据,其中,目标数据包括:携带有标签的无标签数据;推送有标签数据以及目标数据。本发明解决了由于现有技术中一些数据缺失标签而需要进一步操作所导致数据推送的效率较低的技术问题。

Description

数据推送方法及装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种数据推送方法及装置。
背景技术
在互联网应用环境中,通常只有少量的准确的样本数据是有标签的,而大部分数据是没有标签的数据,但没有标签的数据通常不能产生价值,若将这些没有标签的数据转成有标签的数据,则将创造出巨大的价值。例如,以产品标签为例,一部分产品上面已经有比较准确的标签,比如母婴行业中,一般奶粉的段位,尿不湿的尺码等产品属性描述会用标签标明,而大部分用户也都会认真填写自己宝宝的年龄,在购买相关产品的时候,通常会参照自己宝宝的年龄选择和自己宝宝相符合的产品。进一步,在产品信息推送过程中,一般情况下,用户都希望接收到与其填写的宝宝年龄最符合的产品信息。
然而,由于一些产品上面缺失相关的属性描述标签,或者,一些产品包括隐含的描述标签(如人工抽象或者概括的具有代表性的关键词,例如,产品风格),使得这些标签的产品无法及时准确推送给用户,还需要进一步的搜索,从而影响了数据推送的效率。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据推送方法及装置,以至少解决由于现有技术中一些数据缺失标签而需要进一步操作所导致数据推送的效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种数据推送方法,包括:获取待推送数据并根据上述待推送数据中的标签标识识别出有标签数据和无标签数据;根据上述有标签数据与上述无标签数据的相似度为上述无标签数据生成标签,以得到与上述无标签数据对应的目标数据,其中,上述目标数据包括:携带有上述标签的上述无标签数据;推送上述有标签数据以及上述目标数据。
可选地,上述根据上述有标签数据与上述无标签数据的相似度为上述无标签数据生成标签包括:获取已记录的对上述有标签数据执行操作的第一账号以及已记录的对上述无标签数据执行操作的第二账号;获取上述第一账号与上述第二账号之间相同账号;根据上述相同账号得到上述有标签数据与上述无标签数据的相似度;根据上述相似度为上述无标签数据生成标签。
可选地,上述根据上述相同账号得到上述有标签数据与上述无标签数据的相似度包括:将上述相同账号的个数作为上述有标签数据与上述无标签数据的相似度;或者,将上述相同账号的个数与上述第一账号与上述第二账号之间不同账号的个数的比值作为上述有标签数据与上述无标签数据的相似度。
可选地,上述有标签数据包括一个或多个有标签数据,上述根据上述相似度为上述无标签数据生成标签包括:将所有上述有标签数据中与上述无标签数据的相似度最高的有标签数据的标签作为上述无标签数据的标签。
可选地,上述有标签数据包括一个或多个有标签数据,上述根据上述相似度为上述无标签数据生成标签包括:将与上述无标签数据位于同一个类别的上述有标签数据中与上述无标签数据的相似度最高的有标签数据的标签作为上述无标签数据的标签。
可选地,在获取上述待推送数据之前,还包括:接收到用于搜索上述待推送数据的搜索请求,并响应上述搜索请求发送用于获取上述待推送数据的获取请求;其中,上述获取上述待推送数据包括:响应上述获取请求获取上述待推送数据;或者,在获取上述待推送数据之前,还包括:统计用户的历史操作数据,根据上述历史操作数据发送用于获取上述待推送数据的获取请求;其中,上述获取上述待推送数据包括:响应上述获取请求获取上述待推送数据。
根据本发明实施例的另一方面,还提供了一种数据推送装置,包括:获取单元,用于获取待推送数据并根据上述待推送数据中的标签标识识别出有标签数据和无标签数据;生成单元,用于根据上述有标签数据与上述无标签数据的相似度为上述无标签数据生成标签,以得到与上述无标签数据对应的目标数据,其中,上述目标数据包括:携带有上述标签的上述无标签数据;推送单元,用于推送上述有标签数据以及上述目标数据。
可选地,上述生成单元包括:第一获取模块,用于获取已记录的对上述有标签数据执行操作的第一账号以及已记录的对上述无标签数据执行操作的第二账号;第二获取模块,用于获取上述第一账号与上述第二账号之间相同账号;计算模块,用于根据上述相同账号得到上述有标签数据与上述无标签数据的相似度;生成模块,用于根据上述相似度为上述无标签数据生成标签。
可选地,上述计算模块包括:第一计算子模块,用于将上述相同账号的个数作为上述有标签数据与上述无标签数据的相似度;或者,第二计算子模块,用于将上述相同账号的个数与上述第一账号与上述第二账号之间不同账号的个数的比值作为上述有标签数据与上述无标签数据的相似度。
可选地,上述有标签数据包括一个或多个有标签数据,上述生成模块包括:第一生成子模块,用于将所有上述有标签数据中与上述无标签数据的相似度最高的有标签数据的标签作为上述无标签数据的标签。
可选地,上述有标签数据包括一个或多个有标签数据,上述生成模块包括:第二生成子模块,用于将与上述无标签数据位于同一个类别的上述有标签数据中与上述无标签数据的相似度最高的有标签数据的标签作为上述无标签数据的标签。
可选地,第一收发单元,用于在获取上述待推送数据之前,接收到用于搜索上述待推送数据的搜索请求,并响应上述搜索请求发送用于获取上述待推送数据的获取请求;其中,上述获取上述待推送数据包括:响应上述获取请求获取上述待推送数据;或者,第二收发单元,用于在获取上述待推送数据之前,统计用户的历史操作数据,根据上述历史操作数据发送用于获取上述待推送数据的获取请求;其中,上述获取上述待推送数据包括:响应上述获取请求获取上述待推送数据。
在本发明实施例中,通过根据获取到的有标签数据与无标签数据的相似度为上述无标签数据生成标签,以得到携带有上述标签的目标数据,进而推送上述有标签数据以及上述目标数据,从而实现了为缺失标签的数据生成标签,避免了由于现有技术中一些数据缺失标签而需要进一步操作所导致数据推送的效率较低的问题,提高了数据推送的效率。
进一步,上述有标签数据可以包括一个或多个有标签数据,在本实施例中,可以通过以下方式为上述无标签数据生成标签:将所有有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签,或者,将与无标签数据位于同一个类别的有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签,从而实现为上述无标签数据生成较为准确的标签,使得在数据推送时可以根据生成的数据标签直接进行数据推送,从而提高了数据推送的准确性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的数据推送方法的应用场景示意图;
图2是根据本发明实施例的一种可选的数据推送方法的流程示意图;
图3是根据本发明实施例的另一种可选的数据推送方法的流程示意图;以及
图4是根据本发明实施例的一种可选的数据推送装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种数据推送方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
可选地,在本实施例中,上述数据推送方法可以应用于如图1所示的网络环境中,终端104可以通过网络向多个终端102获取待推送数据,并对获取到的待推送数据进行预定的处理后,再向预定的终端推送上述待推送数据。其中,上述终端104可以但不限于为服务器,通过服务器对待推送数据进行预定的处理。可选地,在本实施例中,上述网络可以包括但不限于:广域网、城域网、局域网。可选地,在本实施例中,上述终端可以包括但不限于:手机、平板电脑、笔记本电脑、PC机、数字电视。上述举例只是一种示例,本实施例对此不做任何限定。
可选地,本申请提供了如图2所示的数据推送方法,包括:
S202,获取待推送数据并根据待推送数据中的标签标识识别出有标签数据和无标签数据;
S204,根据有标签数据与无标签数据的相似度为无标签数据生成标签,以得到与无标签数据对应的目标数据,其中,目标数据包括:携带有标签的无标签数据;
S206,推送有标签数据以及目标数据。
可选地,在本实施例中,在获取待推送数据之前,还包括以下至少一种获取上述待推送数据的方式:
1)接收到用于搜索待推送数据的搜索请求,并响应搜索请求发送用于获取待推送数据的获取请求;其中,获取待推送数据包括:响应获取请求获取待推送数据;或者
2)统计用户的历史操作数据,根据历史操作数据发送用于获取待推送数据的获取请求;其中,获取待推送数据包括:响应获取请求获取待推送数据。
可选地,在本实施例中,上述数据推送方法具体可以应用于电子购物过程中对商品数据的推送过程中。例如,用户张三登录第一账号输入搜索关键词,请求获取关于“母婴类”的商品数据,服务器在接收到上述搜索请求后,响应搜索请求向网络发送用于获取待推送数据(例如,关于“母婴类”的商品数据),响应上述请求各终端向服务器发送待推送数据。服务器在接收到上述关于“母婴类”的商品数据后,对所有数据进行识别,判断出有标签数据和无标签数据,并根据上述有标签数据与无标签数据的相似度为无标签数据生成标签,将生成的标签贴在上述无标签数据上以得到携带有标签的无标签数据,进而将上述获取到的有标签数据及无标签数据推送给用户A。上述举例只是一种示例,本实施例对此不做任何限定。
可选地,在本实施例中,上述待推送数据中可以包括但不限于一个或多个标签标识,其中,通过上述标签标识可以识别出上述待推送数据中的有标签数据及无标签数据。进一步,在本实施例中,上述一个标签标识可以但不限于对应一种属性标签。
可选地,在本实施例中,上述有标签数据与无标签数据的相似度可以包括但不限于:根据对上述有标签数据执行操作,同时也对上述无标签数据执行操作的相同账号得到上述有标签数据与上述无标签数据的相似度。
可选地,在本实施例中,对上述有标签数据执行的操作,同时也对上述无标签数据执行的操作可以包括但不限于多个,则上述有标签数据与上述无标签数据的相似度可以包括但不限于:
S1,获取对上述有标签数据以及上述无标签数据执行相同操作的相同账号所得到的相似度;
S2,对不同操作所得到的相似度进行加权平均,以得到上述有标签数据以及上述无标签数据最后的相似度。
具体结合以下示例进行描述,以电子购物为例,上述操作可以包括但不限于以下至少之一:收藏、立即购买、关注、加入购物车。假设商品X为有标签商品,商品Y为无标签商品,对商品X执行收藏操作的用户账号包括:ID_1、ID_2、ID_3、ID_4、ID_5、ID_6,对商品X执行立即购买操作的用户账号包括:ID_1、ID_2、ID_3、ID_7、ID_9;对商品Y执行收藏操作的用户账号包括:ID_1、ID_2、ID_3、ID_4、ID_8,对商品Y执行立即购买操作的用户账号包括:ID_2、ID_3、ID_4、ID_5,则对商品X与商品Y的相似度计算应为:对商品X以及商品Y都进行收藏操作的用户账号包括:ID_1、ID_2、ID_3、ID_4;对商品X以及商品Y都进行立即购买操作的用户账号包括:ID_1、ID_2、ID_3,则先跟据收藏操作得到商品X以及商品Y的第一相似度,再根据立即购买操作得到商品X以及商品Y的第二相似度,将上述第一相似度以及第二相似度进行加权平均计算,进而得到上述商品X以及商品Y的相似度。
可选地,在本实施例中,上述有标签数据与无标签数据的相似度可以包括但不限于以下至少之一:
1)将相同账号的个数作为有标签数据与无标签数据的相似度;或者
2)将相同账号的个数与对有标签数据及无标签数据执行操作的所有不同账号的个数的比值作为有标签数据与无标签数据的相似度。
可选地,在本实施例中,上述有标签数据包括一个或多个,则根据相似度为上述无标签数据生成标签的方式可以包括但不限于以下至少之一:
1)当上述有标签数据为一个时,上述有标签数据与无标签数据的相似度大于等于预定阈值,则将上述有标签商品的标签作为上述无标签商品的标签。
2)当上述有标签数据为一个或多个时,将上述有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签。
具体结合以下示例进行描述,假设有标签商品包括商品X、商品Z、商品S,无标签商品包括商品Y,且将对上述有标签数据执行操作,同时也对上述无标签数据执行操作的相同账号的个数与对上述有标签数据及无标签数据执行操作的所有不同账号的个数的比值作为有标签数据与无标签数据的相似度,则商品Y与商品X的相似度为0.5,商品Y与商品Z的相似度为0.3,商品Y与商品S的相似度为0.7,其中,与商品S的相似度最高,则把商品S的标签作为商品Y的标签。
进一步,将有标签的商品X、商品Z、商品S,以及贴上标签的商品Y推送给相应的用户账号所在的终端。例如,用户张三在登录的第一账号中输入搜索关键词,请求获取关于“母婴类”的商品数据,响应上述请求获取到的为商品X、商品Z、商品S、商品Y,在经过标签的识别生成过程后,将为用户张三登录的第一账号所在的终端推送有标签的商品X、商品Z、商品S以及贴上标签的商品Y。
通过本申请提供的实施例,通过根据获取到的有标签数据与无标签数据的相似度为上述无标签数据生成标签,以得到携带有上述标签的目标数据,进而推送上述有标签数据以及上述目标数据,从而实现了为缺失标签的数据生成标签,避免了由于现有技术中一些数据缺失标签而需要进一步操作所导致数据推送的效率较低的问题,提高了数据推送的效率,进一步,为无标签数据生成标签,也使得数据推送时可以根据数据标签进行推送,从而提高了数据推送的准确性。
作为一种可选的方案,如图3所示,根据有标签数据与无标签数据的相似度为无标签数据生成标签包括:
S302,获取已记录的对有标签数据执行操作的第一账号以及已记录的对无标签数据执行操作的第二账号;
S304,获取第一账号与第二账号之间相同账号;
S306,根据相同账号得到有标签数据与无标签数据的相似度;
S308,根据相似度为无标签数据生成标签。
可选地,在本实施例中,上述根据相似度为无标签数据生成标签的方式可以包括但不限于以下至少之一:上述相似度大于等于预定阈值,则将上述有标签商品的标签作为上述无标签商品的标签。
具体结合以下示例进行描述,假设以电子购物为例,商品X为有标签商品,商品Y为无标签商品,获取到已记录的对有标签商品X执行操作的第一账号包括:ID_1、ID_2、ID_3,已记录的对有标签商品Y执行操作的第一账号包括:ID_2、ID_3、ID_4,经判断上述第一账号以及第二账号中相同账号包括:ID_2、ID_3,则可根据上述相同账号ID_2、ID_3得到上述有标签商品X与无标签商品Y的相似度为2(例如,预定阈值为1),经判断上述相似度大于预定阈值,则可以为上述无标签商品生成标签,即,将上述有标签商品X的标签作为上述无标签商品Y的标签。具体而言,若商品X为衣柜,商品Y为无标签商品,则根据上述分析可知,上述商品Y的标签与上述商品X相同,即,也属于衣柜。
通过本申请提供的实施例,通过获取对有标签数据执行操作的第一账号,以及对无标签数据执行操作的第二账号,并根据上述第一账号与上述第二账号之间的相同账号得到上述有标签数据与上述无标签数据的相似度,进而根据该相似度为上述无标签数据生成标签。从而实现了重新为无标签数据打上标签,以使在数据推送的过程中避免不必要的操作,实现数据的准确推送,并提高了数据推送的效率。
作为一种可选的方案,根据相同账号得到有标签数据与无标签数据的相似度包括:
1)将相同账号的个数作为有标签数据与无标签数据的相似度;或者
2)将相同账号的个数与第一账号与第二账号之间不同账号的个数的比值作为有标签数据与无标签数据的相似度。
可选地,在本实施例中,上述相似度可以包括但不限于以下至少之一:相同账号的数量、相同账号与所有不同账号的比值。
具体结合以下示例进行说明,假设商品X为有标签商品,商品Y为无标签商品,获取到已记录的对有标签商品X执行操作的第一账号包括:ID_1、ID_2、ID_3,已记录的对有标签商品Y执行操作的第一账号包括:ID_2、ID_3、ID_4,经判断上述第一账号以及第二账号中相同账号包括:ID_2、ID_3,共两个,所有不同的账号包括:ID_1、ID_2、ID_3、ID_4,一共四个。则上述商品X与商品Y的相似度的可以包括以下两种形式:
1)若将相同账号的个数作为有标签数据与无标签数据的相似度,则上述商品X与商品Y的相似度为2。
2)若将相同账号的个数与第一账号与第二账号之间不同账号的个数的比值作为有标签数据与无标签数据的相似度,则上述商品X与商品Y的相似度为0.5。
通过本申请提供的实施例,将相同账号的个数作为有标签数据与无标签数据的相似度,或将相同账号与所有不同账号的比值作为有标签数据与无标签数据的相似度,实现了利用对有标签数据以及无标签数据执行操作的相同账号的关联关系,以得到上述有标签数据及无标签数据的相似度,从而保证了为上述无标签数据生成的标签的准确性。
作为一种可选的方案,有标签数据包括一个或多个有标签数据,根据相似度为无标签数据生成标签包括:
S1,将所有有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签。
具体结合一下示例进行描述,假设有标签商品包括商品X、商品Z、商品S,无标签商品包括商品Y,且将对上述有标签数据执行操作,同时也对上述无标签数据执行操作的相同账号的个数与对上述有标签数据及无标签数据执行操作的所有不同账号的个数的比值作为有标签数据与无标签数据的相似度,获取到对商品X执行操作的用户账号包括:ID_1、ID_2、ID_3、ID_4,对商品Z执行操作的用户账号包括:ID_2、ID_3,对商品S执行操作的用户账号包括:ID_1、ID_2、ID_6,对商品Y执行操作的用户账号包括:ID_1、ID_2、ID_5、ID_6,不同的账号共6个。则对商品Y与商品X都执行操作的相同账号包括:ID_1、ID_2,共2个,商品Y与商品X的相似度则为1/3;对商品Y与商品Z都执行操作的相同账号包括:ID_2,共1个,商品Y与商品Z的相似度为1/6,对商品Y与商品S都执行操作的相同账号包括:ID_1、ID_2、ID_6,共3个,商品Y与商品S的相似度为1/2,其中,无标签商品Y与有标签商品S的相似度最高,则把商品S的标签作为商品Y的标签。具体而言,若有标签商品X的标签为沙发,有标签商品Z为桌椅,有标签商品S为衣柜,则可为上述无标签商品Y生成新标签衣柜。
通过本申请提供的实施例,通过将所有有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签,实现了为无标签数据生成标签,避免了由于缺失标签而导致在数据推送过程中推送效率较低的问题,从而实现了提高数据推送的效率。
作为一种可选的方案,有标签数据包括一个或多个有标签数据,根据相似度为无标签数据生成标签包括:
S1,将与无标签数据位于同一个类别的有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签。
可选地,在本实施例中,上述同一个类别可以包括但不限于以下至少之一:根据数据属性预先创建的数据集合、根据不同算法划分的数据集合。
具体结合以下示例进行描述,假设有标签商品包括商品X、商品Z、商品S,无标签商品包括商品Y。其中,上述商品X、商品Z与商品Y同属于预设的数据集合(例如,上述数据集合为欧美风格),则为上述无标签商品Y生成的标签可能不再与上述商品S(与商品Y的相似度最高的有标签商品)的标签相同,而是根据与无标签商品Y属于同一类别(例如,欧美风格)的商品X、商品Z中相似度较高的有标签商品的标签生成,具体而言,在本实施例中,将把与无标签商品Y属于同一类别的有标签商品中相似度较高的有标签商品X的标签作为上述无标签商品Y的标签。
通过本申请提供的实施例,通过将与无标签数据位于同一个类别的有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签,实现了根据待推送数据预先设定的类别加强数据之间的关联度,从而使得为无标签商品生成的标签更加准确,更加贴合无标签数据的真实属性,进而提高了数据推送的效率。
作为一种可选的方案,在获取待推送数据之前,还包括以下至少一种情况:
1)接收到用于搜索待推送数据的搜索请求,并响应搜索请求发送用于获取待推送数据的获取请求;其中,获取待推送数据包括:响应获取请求获取待推送数据;
2)统计用户的历史操作数据,根据历史操作数据发送用于获取待推送数据的获取请求;其中,获取待推送数据包括:响应获取请求获取待推送数据。
通过本申请提供的实施例,通过响应用于搜索上述待推送数据的搜索请求发送用于获取待推送数据的获取请求,或者,根据历史操作数据发送用于获取待推送数据的获取请求,进而根据上述获取请求以获取待推送数据。实现了通过上述不同的方式以获取上述待推送数据,进而使得上述为待推送数据中的无标签数据生成标签的方法可以应用于数据搜索或根据用户习惯进行数据推荐的不同场景。
可选地,在本实施例中,上述有标签数据与无标签数据的相似度还可以但不限于用其他计算方式得到,例如,欧式距离、cos函数等。
具体结合以下示例描述,还可以通过以下方式计算相似度,进而根据计算得到的相似度来为无标签数据生成标签:
1)给定有标签数据集合:(x1,y1),(x2,y2)...(xn,yn),其中Yn={y1,y2,...yn}是所有数据的标签,这里,可以用数字来表示有标签数据的标签。其中,未标签数据集合可以为:(xn+1,yn+1),(xn+2,yn+2)...(xn+u,yn+u)其中,YU={yn+1,yn+2,...yn+u}需要进行预测。通常,n<<u,也就是未标签数据集合远远大于有标签数据集合。
2)如果把数据置于欧式空间中,距离越近的点,它们的标签也越相似(近)。定义两 个点之间的距离为wij。距离计算的方法可以是欧式距离:其中我 们把每个点用D维向量表示。每个维度的特征可以是0/1值,也可以是连续型变量。在推荐场 景下,我们通常使用点i,j的Pearson Correlation:其中Uij是都和物品i,j有过行为的用 户。Nui是用户u对物品i的行为分数,行为包括点击,搜藏,购买,关注,加入购物车等。是 物品j上所有的行为分数的平均值。
3)定义(n+u)×(n+u)的转移概率矩阵T.其中,矩阵T可以看作是相似度矩阵M按照列进行归一化。T中每一列的和为1,即:
4)同时定义(n+u)×L的标签矩阵Y。L可以是分段的离散型变量,也可以是连续值 变量。Yi表示物品i在各个标签段上的分布。初始时:即开始时,我们给没有 标签的数据赋值为0.
5)把矩阵Y划分成两个小矩阵,Yn和Yu.其中,Yn∈n×L,取自矩阵Y的前n行,Yu∈u ×L取自矩阵Y的后u行,即:注意,因为Yn是有标签的数据,在算法的执行过程中 保持不变,进而计算Yu
6)同样把矩阵T按照前面n行和n列划分成4个小矩阵如下:
7)标签扩散:这一步之后,对矩阵Yu进 行行归一化,重复迭代,直至收敛。最后矩阵Yu保持的值即为无标签商品的预测标签。
8)融入泛商品的信息。泛商品包括用户创建的专辑,算法划分的商品簇等。通常在一个组内的商品的相似度比较高。融入商品所属的簇信息能提高标签扩散算法的精度。利用簇信息能加强某些商品之间的关联,对于转移概率矩阵T中的每一项:Yij,如果i,j属于同一个簇或者组,我们将它们之间的相似度扩大一个常数倍:wij=α*wij.在这一步之后,重新对T进行归一化。
9)融入用户标签。用户标签和用户-商品之间的关系能加速标签扩散算法的迭代。在对无标签矩阵数据进行初始化时,我们不是对每个物品的标签进行赋值0,而是赋予一个用户标签的加权平均值:其中,L(u)是和商品k有行为的用户的标签。wu是赋予用户u的权重,权重的计算根据用户对商品的行为进行拟合。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述数据推送方法的数据推送装置,可选地,在本实施例中,上述数据推送方法可以应用于如图1所示的网络环境中,终端104可以通过网络向多个终端102获取待推送数据,并对获取到的待推送数据进行预定的处理后,再向预定的终端推送上述待推送数据。其中,上述终端104可以但不限于为服务器,通过服务器对待推送数据进行预定的处理。可选地,在本实施例中,上述网络可以包括但不限于:广域网、城域网、局域网。可选地,在本实施例中,上述终端可以包括但不限于:手机、平板电脑、笔记本电脑、PC机、数字电视。上述举例只是一种示例,本实施例对此不做任何限定。
可选地,在本实施例中,上述数据推送装置可以如图4所示,该装置包括:
1)获取单元402,用于获取待推送数据并根据待推送数据中的标签标识识别出有标签数据和无标签数据;
2)生成单元404,用于根据有标签数据与无标签数据的相似度为无标签数据生成标签,以得到与无标签数据对应的目标数据,其中,目标数据包括:携带有标签的无标签数据;
3)推送单元406,用于推送有标签数据以及目标数据。
可选地,在本实施例中,在获取待推送数据之前,还包括以下至少一种获取上述待推送数据的方式:
1)接收到用于搜索待推送数据的搜索请求,并响应搜索请求发送用于获取待推送数据的获取请求;其中,获取待推送数据包括:响应获取请求获取待推送数据;或者
2)统计用户的历史操作数据,根据历史操作数据发送用于获取待推送数据的获取请求;其中,获取待推送数据包括:响应获取请求获取待推送数据。
可选地,在本实施例中,上述数据推送方法具体可以应用于电子购物过程中对商品数据的推送过程中。例如,用户张三登录第一账号输入搜索关键词,请求获取关于“母婴类”的商品数据,服务器在接收到上述搜索请求后,响应搜索请求向网络发送用于获取待推送数据(例如,关于“母婴类”的商品数据),响应上述请求各终端向服务器发送待推送数据。服务器在接收到上述关于“母婴类”的商品数据后,对所有数据进行识别,判断出有标签数据和无标签数据,并根据上述有标签数据与无标签数据的相似度为无标签数据生成标签,将生成的标签贴在上述无标签数据上以得到携带有标签的无标签数据,进而将上述获取到的有标签数据及无标签数据推送给用户A。上述举例只是一种示例,本实施例对此不做任何限定。
可选地,在本实施例中,上述待推送数据中可以包括但不限于一个或多个标签标识,其中,通过上述标签标识可以识别出上述待推送数据中的有标签数据及无标签数据。进一步,在本实施例中,上述一个标签标识可以但不限于对应一种属性标签。
可选地,在本实施例中,上述有标签数据与无标签数据的相似度可以包括但不限于:根据对上述有标签数据执行操作,同时也对上述无标签数据执行操作的相同账号得到上述有标签数据与上述无标签数据的相似度。
可选地,在本实施例中,对上述有标签数据执行的操作,同时也对上述无标签数据执行的操作可以包括但不限于多个,则上述有标签数据与上述无标签数据的相似度可以包括但不限于:
S1,获取对上述有标签数据以及上述无标签数据执行相同操作的相同账号所得到的相似度;
S2,对不同操作所得到的相似度进行加权平均,以得到上述有标签数据以及上述无标签数据最后的相似度。
具体结合以下示例进行描述,以电子购物为例,上述操作可以包括但不限于以下至少之一:收藏、立即购买、关注、加入购物车。假设商品X为有标签商品,商品Y为无标签商品,对商品X执行收藏操作的用户账号包括:ID_1、ID_2、ID_3、ID_4、ID_5、ID_6,对商品X执行立即购买操作的用户账号包括:ID_1、ID_2、ID_3、ID_7、ID_9;对商品Y执行收藏操作的用户账号包括:ID_1、ID_2、ID_3、ID_4、ID_8,对商品Y执行立即购买操作的用户账号包括:ID_2、ID_3、ID_4、ID_5,则对商品X与商品Y的相似度计算应为:对商品X以及商品Y都进行收藏操作的用户账号包括:ID_1、ID_2、ID_3、ID_4;对商品X以及商品Y都进行立即购买操作的用户账号包括:ID_1、ID_2、ID_3,则先跟据收藏操作得到商品X以及商品Y的第一相似度,再根据立即购买操作得到商品X以及商品Y的第二相似度,将上述第一相似度以及第二相似度进行加权平均计算,进而得到上述商品X以及商品Y的相似度。
可选地,在本实施例中,上述有标签数据与无标签数据的相似度可以包括但不限于以下至少之一:
1)将相同账号的个数作为有标签数据与无标签数据的相似度;或者
2)将相同账号的个数与对有标签数据及无标签数据执行操作的所有不同账号的个数的比值作为有标签数据与无标签数据的相似度。
可选地,在本实施例中,上述有标签数据包括一个或多个,则根据相似度为上述无标签数据生成标签的方式可以包括但不限于以下至少之一:
1)当上述有标签数据为一个时,上述有标签数据与无标签数据的相似度大于等于预定阈值,则将上述有标签商品的标签作为上述无标签商品的标签。
2)当上述有标签数据为一个或多个时,将上述有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签。
具体结合以下示例进行描述,假设有标签商品包括商品X、商品Z、商品S,无标签商品包括商品Y,且将对上述有标签数据执行操作,同时也对上述无标签数据执行操作的相同账号的个数与对上述有标签数据及无标签数据执行操作的所有不同账号的个数的比值作为有标签数据与无标签数据的相似度,则商品Y与商品X的相似度为0.5,商品Y与商品Z的相似度为0.3,商品Y与商品S的相似度为0.7,其中,与商品S的相似度最高,则把商品S的标签作为商品Y的标签。
进一步,将有标签的商品X、商品Z、商品S,以及贴上标签的商品Y推送给相应的用户账号所在的终端。例如,用户张三在登录的第一账号中输入搜索关键词,请求获取关于“母婴类”的商品数据,响应上述请求获取到的为商品X、商品Z、商品S、商品Y,在经过标签的识别生成过程后,将为用户张三登录的第一账号所在的终端推送有标签的商品X、商品Z、商品S以及贴上标签的商品Y。
通过本申请提供的实施例,通过根据获取到的有标签数据与无标签数据的相似度为上述无标签数据生成标签,以得到携带有上述标签的目标数据,进而推送上述有标签数据以及上述目标数据,从而实现了为缺失标签的数据生成标签,避免了由于现有技术中一些数据缺失标签而需要进一步操作所导致数据推送的效率较低的问题,提高了数据推送的效率,进一步,为无标签数据生成标签,也使得数据推送时可以根据数据标签进行推送,从而提高了数据推送的准确性。
作为一种可选的方案,上述生成单元404包括:
1)第一获取模块,用于获取已记录的对有标签数据执行操作的第一账号以及已记录的对无标签数据执行操作的第二账号;
2)第二获取模块,用于获取第一账号与第二账号之间相同账号;
3)计算模块,用于根据相同账号得到有标签数据与无标签数据的相似度;
4)生成模块,用于根据相似度为无标签数据生成标签。
可选地,在本实施例中,上述根据相似度为无标签数据生成标签的方式可以包括但不限于以下至少之一:上述相似度大于等于预定阈值,则将上述有标签商品的标签作为上述无标签商品的标签。
具体结合以下示例进行描述,假设以电子购物为例,商品X为有标签商品,商品Y为无标签商品,获取到已记录的对有标签商品X执行操作的第一账号包括:ID_1、ID_2、ID_3,已记录的对有标签商品Y执行操作的第一账号包括:ID_2、ID_3、ID_4,经判断上述第一账号以及第二账号中相同账号包括:ID_2、ID_3,则可根据上述相同账号ID_2、ID_3得到上述有标签商品X与无标签商品Y的相似度为2(例如,预定阈值为1),经判断上述相似度大于预定阈值,则可以为上述无标签商品生成标签,即,将上述有标签商品X的标签作为上述无标签商品Y的标签。具体而言,若商品X为衣柜,商品Y为无标签商品,则根据上述分析可知,上述商品Y的标签与上述商品X相同,即,也属于衣柜。
通过本申请提供的实施例,通过获取对有标签数据执行操作的第一账号,以及对无标签数据执行操作的第二账号,并根据上述第一账号与上述第二账号之间的相同账号得到上述有标签数据与上述无标签数据的相似度,进而根据该相似度为上述无标签数据生成标签。从而实现了重新为无标签数据打上标签,以使在数据推送的过程中避免不必要的操作,实现数据的准确推送,并提高了数据推送的效率。
作为一种可选的方案,上述计算模块包括:
1)第一计算子模块,用于将相同账号的个数作为有标签数据与无标签数据的相似度;或者
2)第二计算子模块,用于将相同账号的个数与第一账号与第二账号之间不同账号的个数的比值作为有标签数据与无标签数据的相似度。
可选地,在本实施例中,上述相似度可以包括但不限于以下至少之一:相同账号的数量、相同账号与所有不同账号的比值。
具体结合以下示例进行说明,假设商品X为有标签商品,商品Y为无标签商品,获取到已记录的对有标签商品X执行操作的第一账号包括:ID_1、ID_2、ID_3,已记录的对有标签商品Y执行操作的第一账号包括:ID_2、ID_3、ID_4,经判断上述第一账号以及第二账号中相同账号包括:ID_2、ID_3,共两个,所有不同的账号包括:ID_1、ID_2、ID_3、ID_4,一共四个。则上述商品X与商品Y的相似度的可以包括以下两种形式:
1)若将相同账号的个数作为有标签数据与无标签数据的相似度,则上述商品X与商品Y的相似度为2。
2)若将相同账号的个数与第一账号与第二账号之间不同账号的个数的比值作为有标签数据与无标签数据的相似度,则上述商品X与商品Y的相似度为0.5。
通过本申请提供的实施例,将相同账号的个数作为有标签数据与无标签数据的相似度,或将相同账号与所有不同账号的比值作为有标签数据与无标签数据的相似度,实现了利用对有标签数据以及无标签数据执行操作的相同账号的关联关系,以得到上述有标签数据及无标签数据的相似度,从而保证了为上述无标签数据生成的标签的准确性。
作为一种可选的方案,有标签数据包括一个或多个有标签数据,上述生成模块包括:
1)第一生成子模块,用于将所有有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签。
具体结合一下示例进行描述,假设有标签商品包括商品X、商品Z、商品S,无标签商品包括商品Y,且将对上述有标签数据执行操作,同时也对上述无标签数据执行操作的相同账号的个数与对上述有标签数据及无标签数据执行操作的所有不同账号的个数的比值作为有标签数据与无标签数据的相似度,获取到对商品X执行操作的用户账号包括:ID_1、ID_2、ID_3、ID_4,对商品Z执行操作的用户账号包括:ID_2、ID_3,对商品S执行操作的用户账号包括:ID_1、ID_2、ID_6,对商品Y执行操作的用户账号包括:ID_1、ID_2、ID_5、ID_6,不同的账号共6个。则对商品Y与商品X都执行操作的相同账号包括:ID_1、ID_2,共2个,商品Y与商品X的相似度则为1/3;对商品Y与商品Z都执行操作的相同账号包括:ID_2,共1个,商品Y与商品Z的相似度为1/6,对商品Y与商品S都执行操作的相同账号包括:ID_1、ID_2、ID_6,共3个,商品Y与商品S的相似度为1/2,其中,无标签商品Y与有标签商品S的相似度最高,则把商品S的标签作为商品Y的标签。具体而言,若有标签商品X的标签为沙发,有标签商品Z为桌椅,有标签商品S为衣柜,则可为上述无标签商品Y生成新标签衣柜。
通过本申请提供的实施例,通过将所有有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签,实现了为无标签数据生成标签,避免了由于缺失标签而导致在数据推送过程中推送效率较低的问题,从而实现了提高数据推送的效率。
作为一种可选的方案,有标签数据包括一个或多个有标签数据,上述生成模块包括:
1)第二生成子模块,用于将与无标签数据位于同一个类别的有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签。
可选地,在本实施例中,上述同一个类别可以包括但不限于以下至少之一:根据数据属性预先创建的数据集合、根据不同算法划分的数据集合。
具体结合以下示例进行描述,假设有标签商品包括商品X、商品Z、商品S,无标签商品包括商品Y。其中,上述商品X、商品Z与商品Y同属于预设的数据集合(例如,上述数据集合为欧美风格),则为上述无标签商品Y生成的标签可能不再与上述商品S(与商品Y的相似度最高的有标签商品)的标签相同,而是根据与无标签商品Y属于同一类别(例如,欧美风格)的商品X、商品Z中相似度较高的有标签商品的标签生成,具体而言,在本实施例中,将把与无标签商品Y属于同一类别的有标签商品中相似度较高的有标签商品X的标签作为上述无标签商品Y的标签。
通过本申请提供的实施例,通过将与无标签数据位于同一个类别的有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签,实现了根据待推送数据预先设定的类别加强数据之间的关联度,从而使得为无标签商品生成的标签更加准确,更加贴合无标签数据的真实属性,进而提高了数据推送的效率。
作为一种可选的方案,上述装置还包括:
1)第一收发单元,用于在获取待推送数据之前,接收到用于搜索待推送数据的搜索请求,并响应搜索请求发送用于获取待推送数据的获取请求;其中,获取待推送数据包括:响应获取请求获取待推送数据;或者
2)第二收发单元,用于在获取待推送数据之前,统计用户的历史操作数据,根据历史操作数据发送用于获取待推送数据的获取请求;其中,获取待推送数据包括:响应获取请求获取待推送数据。
通过本申请提供的实施例,通过响应用于搜索上述待推送数据的搜索请求发送用于获取待推送数据的获取请求,或者,根据历史操作数据发送用于获取待推送数据的获取请求,进而根据上述获取请求以获取待推送数据。实现了通过上述不同的方式以获取上述待推送数据,进而使得上述为待推送数据中的无标签数据生成标签的方法可以应用于数据搜索或根据用户习惯进行数据推荐的不同场景。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
实施例3
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的数据推送方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于如图1所示的网络环境中的任意一个终端中。上述终端104可以通过网络向多个终端102获取待推送数据,并对获取到的待推送数据进行预定的处理后,再向预定的终端推送上述待推送数据。其中,上述终端104可以但不限于为服务器,通过服务器对待推送数据进行预定的处理。可选地,在本实施例中,上述网络可以包括但不限于:广域网、城域网、局域网。可选地,在本实施例中,上述终端可以包括但不限于:手机、平板电脑、笔记本电脑、PC机、数字电视。上述举例只是一种示例,本实施例对此不做任何限定。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,获取待推送数据并根据待推送数据中的标签标识识别出有标签数据和无标签数据;
S2,根据有标签数据与无标签数据的相似度为无标签数据生成标签,以得到与无标签数据对应的目标数据,其中,目标数据包括:携带有标签的无标签数据;
S3,推送有标签数据以及目标数据。
可选地,在本实施例中,存储介质被设置为存储还用于通过执行以下步骤的程序代码实现根据有标签数据与无标签数据的相似度为无标签数据生成标签:
S1,将所有有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签。
可选地,在本实施例中,存储介质被设置为存储还用于通过执行以下步骤的程序代码实现根据有标签数据与无标签数据的相似度为无标签数据生成标签:
S1,将与无标签数据位于同一个类别的有标签数据中与无标签数据的相似度最高的有标签数据的标签作为无标签数据的标签。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例,本实施例在此不再赘述。
此处需要说明的是,上述计算机终端群中的任意一个可以与网站服务器和扫描器建立通信关系,扫描器可以扫描计算机终端上php执行的web应用程序的值命令。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种数据推送方法,其特征在于,包括:
获取待推送数据并根据所述待推送数据中的标签标识识别出有标签数据和无标签数据;
根据所述有标签数据与所述无标签数据的相似度为所述无标签数据生成标签,以得到与所述无标签数据对应的目标数据,其中,所述目标数据包括:携带有所述标签的所述无标签数据;
推送所述有标签数据以及所述目标数据;
其中,所述根据所述有标签数据与所述无标签数据的相似度为所述无标签数据生成标签包括:获取已记录的对所述有标签数据执行操作的第一账号以及已记录的对所述无标签数据执行操作的第二账号;获取所述第一账号与所述第二账号之间相同账号;根据所述相同账号得到所述有标签数据与所述无标签数据的相似度;根据所述相似度为所述无标签数据生成标签。
2.根据权利要求1所述的方法,其特征在于,所述根据所述相同账号得到所述有标签数据与所述无标签数据的相似度包括:
将所述相同账号的个数作为所述有标签数据与所述无标签数据的相似度;或者
将所述相同账号的个数与所述第一账号与所述第二账号之间不同账号的个数的比值作为所述有标签数据与所述无标签数据的相似度。
3.根据权利要求1所述的方法,其特征在于,所述有标签数据包括一个或多个有标签数据,所述根据所述相似度为所述无标签数据生成标签包括:
将所有所述有标签数据中与所述无标签数据的相似度最高的有标签数据的标签作为所述无标签数据的标签。
4.根据权利要求1所述的方法,其特征在于,所述有标签数据包括一个或多个有标签数据,所述根据所述相似度为所述无标签数据生成标签包括:
将与所述无标签数据位于同一个类别的所述有标签数据中与所述无标签数据的相似度最高的有标签数据的标签作为所述无标签数据的标签。
5.根据权利要求1所述的方法,其特征在于,
在获取所述待推送数据之前,还包括:接收到用于搜索所述待推送数据的搜索请求,并响应所述搜索请求发送用于获取所述待推送数据的获取请求;其中,所述获取所述待推送数据包括:响应所述获取请求获取所述待推送数据;或者
在获取所述待推送数据之前,还包括:统计用户的历史操作数据,根据所述历史操作数据发送用于获取所述待推送数据的获取请求;其中,所述获取所述待推送数据包括:响应所述获取请求获取所述待推送数据。
6.一种数据推送装置,其特征在于,包括:
获取单元,用于获取待推送数据并根据所述待推送数据中的标签标识识别出有标签数据和无标签数据;
生成单元,用于根据所述有标签数据与所述无标签数据的相似度为所述无标签数据生成标签,以得到与所述无标签数据对应的目标数据,其中,所述目标数据包括:携带有所述标签的所述无标签数据;
推送单元,用于推送所述有标签数据以及所述目标数据;
其中.所述生成单元包括:第一获取模块,用于获取已记录的对所述有标签数据执行操作的第一账号以及已记录的对所述无标签数据执行操作的第二账号;第二获取模块,用于获取所述第一账号与所述第二账号之间相同账号;计算模块,用于根据所述相同账号得到所述有标签数据与所述无标签数据的相似度;生成模块,用于根据所述相似度为所述无标签数据生成标签。
7.根据权利要求6所述的装置,其特征在于,所述计算模块包括:
第一计算子模块,用于将所述相同账号的个数作为所述有标签数据与所述无标签数据的相似度;或者
第二计算子模块,用于将所述相同账号的个数与所述第一账号与所述第二账号之间不同账号的个数的比值作为所述有标签数据与所述无标签数据的相似度。
8.根据权利要求6所述的装置,其特征在于,所述有标签数据包括一个或多个有标签数据,所述生成模块包括:
第一生成子模块,用于将所有所述有标签数据中与所述无标签数据的相似度最高的有标签数据的标签作为所述无标签数据的标签。
9.根据权利要求6所述的装置,其特征在于,所述有标签数据包括一个或多个有标签数据,所述生成模块包括:
第二生成子模块,用于将与所述无标签数据位于同一个类别的所述有标签数据中与所述无标签数据的相似度最高的有标签数据的标签作为所述无标签数据的标签。
10.根据权利要求6所述的装置,其特征在于,
第一收发单元,用于在获取所述待推送数据之前,接收到用于搜索所述待推送数据的搜索请求,并响应所述搜索请求发送用于获取所述待推送数据的获取请求;其中,所述获取所述待推送数据包括:响应所述获取请求获取所述待推送数据;或者
第二收发单元,用于在获取所述待推送数据之前,统计用户的历史操作数据,根据所述历史操作数据发送用于获取所述待推送数据的获取请求;其中,所述获取所述待推送数据包括:响应所述获取请求获取所述待推送数据。
CN201410412622.5A 2014-08-20 2014-08-20 数据推送方法及装置 Active CN105354202B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410412622.5A CN105354202B (zh) 2014-08-20 2014-08-20 数据推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410412622.5A CN105354202B (zh) 2014-08-20 2014-08-20 数据推送方法及装置

Publications (2)

Publication Number Publication Date
CN105354202A CN105354202A (zh) 2016-02-24
CN105354202B true CN105354202B (zh) 2019-03-15

Family

ID=55330175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410412622.5A Active CN105354202B (zh) 2014-08-20 2014-08-20 数据推送方法及装置

Country Status (1)

Country Link
CN (1) CN105354202B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107347050B (zh) * 2016-05-05 2019-12-20 腾讯科技(深圳)有限公司 基于反向钓鱼的恶意识别方法和装置
CN108121737B (zh) * 2016-11-29 2022-04-26 阿里巴巴集团控股有限公司 一种业务对象属性标识的生成方法、装置和系统
CN108399551A (zh) * 2017-02-08 2018-08-14 阿里巴巴集团控股有限公司 一种确定用户标签和推送信息的方法及系统
CN110019774B (zh) * 2017-08-23 2023-01-31 腾讯科技(深圳)有限公司 标签分配方法、装置、存储介质及电子装置
CN109522424B (zh) * 2018-10-16 2020-04-24 北京达佳互联信息技术有限公司 数据的处理方法、装置、电子设备及存储介质
CN109359689B (zh) * 2018-10-19 2021-06-04 科大讯飞股份有限公司 一种数据识别方法及装置
CN111291264B (zh) * 2020-01-23 2023-06-23 腾讯科技(深圳)有限公司 基于机器学习的访问对象预测方法、装置和计算机设备
CN111598630A (zh) * 2020-06-30 2020-08-28 成都新潮传媒集团有限公司 小区画像构建方法、装置及存储介质
CN111949912B (zh) * 2020-08-12 2021-05-18 北京一起教育信息咨询有限责任公司 一种基于标签的消息推送方法、装置和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722524A (zh) * 2012-05-07 2012-10-10 北京邮电大学 网站推荐结果显示方法、装置及具有该装置的终端
CN103995839A (zh) * 2014-04-30 2014-08-20 兴天通讯技术(天津)有限公司 基于协同过滤的商品推荐优化方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101514039B1 (ko) * 2011-03-28 2015-04-24 주식회사 케이티 태그 정보 제공 방법 및 그 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722524A (zh) * 2012-05-07 2012-10-10 北京邮电大学 网站推荐结果显示方法、装置及具有该装置的终端
CN103995839A (zh) * 2014-04-30 2014-08-20 兴天通讯技术(天津)有限公司 基于协同过滤的商品推荐优化方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
社会性网络服务的个性化推荐关键技术研究;孙婧;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130415(第4期);I138-1452
非常好的协同过滤入门文章;wentingtu;《https://www.cnblogs.com/wentingtu/archive/2011/12/16/2289926.html》;20111216;第4页第16行-24行,图3

Also Published As

Publication number Publication date
CN105354202A (zh) 2016-02-24

Similar Documents

Publication Publication Date Title
CN105354202B (zh) 数据推送方法及装置
CN110941740B (zh) 视频推荐方法及计算机可读存储介质
CN109658206B (zh) 信息推荐方法和装置
CN111523010A (zh) 推荐方法、装置、终端设备及计算机存储介质
CN107644036B (zh) 一种数据对象推送的方法、装置及系统
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
US20230214895A1 (en) Methods and systems for product discovery in user generated content
US20190294259A1 (en) Sticker recommendation method and apparatus
CN108288208B (zh) 基于图像内容的展示对象确定方法、装置、介质及设备
CN110674391B (zh) 基于大数据的产品数据推送方法、系统和计算机设备
JP6767342B2 (ja) 検索装置、検索方法および検索プログラム
CN111695960A (zh) 一种对象推荐系统、方法、电子设备及存储介质
JP7231317B2 (ja) 推定装置、推定方法及び推定プログラム
CN112307352B (zh) 内容推荐方法、系统、装置和存储介质
CN109819002B (zh) 数据推送方法和装置、存储介质及电子装置
CN113450172B (zh) 一种商品推荐方法和装置
CN110060121A (zh) 基于特征排序的商品推荐方法、装置和存储介质
CN110688565A (zh) 基于多维霍克斯过程和注意力机制的下一个物品推荐方法
CN114297509A (zh) 用户兴趣向量生成方法、产品推荐方法、装置、设备、介质
CN110399564B (zh) 帐号分类方法和装置、存储介质及电子装置
CN110443264A (zh) 一种聚类的方法和装置
CN114066533A (zh) 产品推荐方法、装置、电子设备及存储介质
CN105589873B (zh) 数据搜索方法、终端及服务器
CN108563648B (zh) 数据显示方法和装置、存储介质及电子装置
CN110942345B (zh) 种子用户的选取方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant