CN107545453A - 一种信息投放方法及装置 - Google Patents

一种信息投放方法及装置 Download PDF

Info

Publication number
CN107545453A
CN107545453A CN201610491441.5A CN201610491441A CN107545453A CN 107545453 A CN107545453 A CN 107545453A CN 201610491441 A CN201610491441 A CN 201610491441A CN 107545453 A CN107545453 A CN 107545453A
Authority
CN
China
Prior art keywords
user
information
user set
data
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610491441.5A
Other languages
English (en)
Inventor
吴黎霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610491441.5A priority Critical patent/CN107545453A/zh
Publication of CN107545453A publication Critical patent/CN107545453A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种信息投放方法及装置,用以实现有针对性地向用户投放信息,提高信息投放的用户定位的准确性,并且扩大目标用户范围,进而提高信息投放效果,节约成本,避免资源浪费。本申请提供的一种信息投放方法,包括:提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合;确定在第三用户集合中归属于第一用户集合的目标用户;向所述目标用户投放信息。

Description

一种信息投放方法及装置
技术领域
本申请涉及信息技术领域,尤其涉及一种信息投放方法及装置。
背景技术
近年来,数据交互平台蓬勃发展,伴随着的数据交互平台的信息投放也发展迅猛,分别衍生出了按展现量收费的信息(例如CPM广告),按点击收费的信息(例如CPC广告)等。近期,实时竞价(Real Time Biding,RTB)模式越来越受到信息投放主的欢迎,与传统信息模式通过对关键词或者标签设置固定价格来售卖信息位不同;RTB模式将各信息位的每个流量作为售卖单元,各需求方平台(Demand Side Platform,DSP)根据每个流量对各自的价值选择是否竞价;如果这个流量对应的用户是本DSP代表的信息投放主的目标用户,则应选择竞价,而如果该用户对信息投放主推广的信息中的目标物体并不感兴趣,若仍然采用现有技术对所有用户都推送信息,则对这类用户竞价并投放信息势必增加了信息投放主的无效信息投放,即增加了成本,浪费了资源,同时对用户的体验也是巨大的伤害。
发明内容
本申请实施例提供了一种信息投放方法及装置,用以实现有针对性地向用户投放信息,提高信息投放的用户定位的准确性,并且扩大目标用户范围,进而提高信息投放效果,节约成本,避免资源浪费。
本申请实施例提供的一种信息投放方法,包括:
提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合;
确定在第三用户集合中归属于第一用户集合的目标用户;
向所述目标用户投放信息。
通过该方法提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合,确定在第三用户集合中归属于第一用户集合的目标用户,向所述目标用户投放信息,从而实现了更有针对性地向用户投放广告,而不是向所有用户投放广告,提高了信息投放的用户定位的准确性,并且扩大了目标用户的范围,进而信息投放效果更佳,节约了成本,避免了资源浪费,并且可以避免对非目标用户的打扰,提高了用户的体验。
可选地,所述将用户集合划分为第一用户集合、第二用户集合和第三用户集合,具体包括:
将对在信息投放平台上已投放信息进行了点击并完成相应的数据交互的用户,确定为第一用户集合;
将对在信息投放平台上已投放信息进行了点击但并未进行相应的数据交互的用户,确定为第二用户集合;
将未对在信息投放平台上已投放的信息进行点击的用户,确定为第三用户集合。
可选地,所述确定在第三用户集合中归属于第一用户集合的目标用户,具体包括:
获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的行为数据;
根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户;
将所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,确定为在第三用户集合中归属于第一用户集合的目标用户。
其中,所述第三用户集合中的用户可以理解为待定用户,一部分可能作为目标用户,另一部分可能作为非目标用户。
获取每一所述用户在第三方数据平台上的行为数据,并根据所述行为数据建立用户之间的相似关系,可以理解为根据每一所述用户在第三方数据平台上的行为数据,构建预测模型,用于预测哪些用户可以最终作为目标用户,哪些用户可以最终作为非目标用户,基于此进行的信息投放,相当于是基于半监督分类方法,较好地运用记录下来的非常庞大的用户数据,而这类用户数据的利用可以借助于这些用户在第三方数据平台(例如淘宝)上的行为数据,以充分发挥这类庞大的用户数据的价值。
由此可见,本申请实施例提供的方法中,不仅仅利用已投放信息的用户数据得到的少量种子用户(即第一用户集合)及非目标用户数据(即第二用户集合),而且还利用每天记录下来的未参与竞价或者参与竞价但未成功的大量的用户数据(即第三用户集合);可以通过其他数据交互平台得到这些大量的用户在数据交互平台上的行为及目标物体交互数据。例如,本申请实施例充分利用第一用户集合、第二用户集合和第三用户集合的基于图的半监督分类方法(Linear Neighborhood Propagation,LNP,线性邻近点传播),来解决新业务DSP的受众选择或用户定位问题,通过所有用户在其他数据交互平台上的行为得到用户间的相似关系,利用该相似关系(每个用户最相似的K个用户)构成图,并在构造的图上标记用户(包括第一用户集合、第二用户集合)的正、负标签传播到那些未标记的第三用户集合上,从而确定在第三用户集合中归属于第一用户集合的目标用户。
可选地,获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的行为数据,具体包括:
获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的下列信息之一或组合:
数据交互所涉及的店铺的标识、店铺的标题、目标物体的标识、目标物体的标题。
可选地,根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,具体包括:
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或者目标物体的标识,计算两两标识之间的相似度s1;
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或目标物体的标题提取关键词,计算两两关键词之间的相似度s2;
根据所述s1和s2,确定最终相似度S;
根据所述最终相似度S,确定第三用户集合中与所述第一用户集合中的用户存在相似关系的用户。
本申请实施例中,可以向第一用户集合,以及在第三用户集合中归属于第一用户集合的目标用户投放信息。
与上述方法相对应地,本申请实施例提供的一种信息投放装置,包括:
第一单元,用于提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合;
第二单元,用于确定在第三用户集合中归属于第一用户集合的目标用户;
第三单元,用于向所述目标用户投放信息。
可选地,所述第一单元将用户集合划分为第一用户集合、第二用户集合和第三用户集合,具体包括:
将对在信息投放平台上已投放信息进行了点击并完成相应的数据交互的用户,确定为第一用户集合;
将对在信息投放平台上已投放信息进行了点击但并未进行相应的数据交互的用户,确定为第二用户集合;
将未对在信息投放平台上已投放的信息进行点击的用户,确定为第三用户集合。
可选地,所述第二单元,具体用于:
获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的行为数据;
根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户;
将所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,确定为在第三用户集合中归属于第一用户集合的目标用户。
可选地,所述第二单元获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的行为数据,具体包括:
获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的下列信息之一或组合:
数据交互所涉及的店铺的标识、店铺的标题、目标物体的标识、目标物体的标题。
可选地,所述第二单元根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,具体包括:
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或者目标物体的标识,计算两两标识之间的相似度s1;
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或目标物体的标题提取关键词,计算两两关键词之间的相似度s2;
根据所述s1和s2,确定最终相似度S;
根据所述最终相似度S,确定第三用户集合中与所述第一用户集合中的用户存在相似关系的用户。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种信息投放方法的总体流程示意图;
图2为本申请实施例提供的一种信息投放方法的具体流程示意图;
图3为本申请实施例提供的一种用户分布示意图;
图4为本申请实施例提供的一种用户之间的相似关系的示意图;
图5为本申请实施例提供的一种信息投放装置的结构示意图。
具体实施方式
本申请实施例提供了一种信息投放方法及装置,用以实现有针对性地向用户投放信息,提高信息投放的用户定位的准确性,并且扩大目标用户范围,进而提高信息投放效果,节约成本,避免资源浪费。
本申请实施例提供的技术方案,一个核心技术就是目标用户的定位问题;一般情况下,将为信息投放主带来过数据交互的用户定义为种子用户,种子用户毫无疑问是信息投放主的核心目标用户,而在新业务发展早期是极其匮乏而珍贵的,仅仅重定向获取这部分用户显然满足不了信息投放主的需求,也不利于信息投放主的品牌推广和实现引入新用户的目标。但如果对触达的流量进行全部投放,势必增大信息投放主的投放成本,信息投放效果(ROI)太差,信息投放平台势必无法发展。信息投放的数据交互平台(AdExchange,即联系信息投放主方和信息投放位拥有方)会将每次流量的基本信息,包括当前的用户标识Cookie Id,当前信息投放位等信息;无论竞价成功与否,DSP都可以记录以进行数据分析。对于新业务DSP而言,进行短期投放后,会得到少量的种子用户数据及一些非目标用户的用户数据;除此之外,还有未参与信息投放平台的信息投放竞价的用户,以及非常庞大的竞价未成功的用户流量数据(各DSP针对每个流量一般会根据自己的收益情况进行竞价,但出价过低而未赢得该流量,记录下来,就是竞价未成功的用户流量数据),通过第三方数据平台的对接,可以得到这批庞大的用户数据在已有成熟的数据交互平台上对目标物体的反馈数据及人群属性标签情况。因此,如何充分利用这少量种子用户、非目标用户、未参与信息投放平台的信息投放竞价的用户、以及参与了信息投放竞价但未成功的用户的数据,在巨大的流量池中筛选出信息投放主的潜在目标用户,减少无效信息投放是新业务DSP需解决的首要问题,也即是本申请实施例所要解决的问题。
参见图1,本申请实施例提供的一种信息投放方法,包括:
S101、提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合。
可选地,所述第一用户集合包括通过信息投放平台点击过信息并完成相应的数据交互的用户;
所述第二用户集合包括未对信息投放平台上已投放的信息进行点击的用户,以及对在信息投放平台上已投放信息进行了点击但并未进行相应的数据交互的用户;
所述第三用户集合包括未参与信息投放平台的信息投放竞价的用户,以及参与了信息投放竞价但未成功的用户。
S102、确定在第三用户集合中归属于第一用户集合的目标用户。
为了实现更有针对性地向用户投放信息,而不是向所有用户投放信息,提高信息投放的用户定位的准确性,并且扩大目标用户的范围,在步骤S102确定的信息投放平台的目标用户中,包括根据第一用户集合确定的潜在目标用户,即在第三用户集合中归属于第一用户集合的目标用户。
S103、向步骤S102中确定的目标用户投放信息。
从而,可以实现更有针对性地向用户投放信息,而不是向所有用户投放信息,提高了信息投放的用户定位的准确性,并且扩大了目标用户的范围,进而信息投放效果更佳,相比现有技术向所有用户投放信息,节约了成本,避免了资源浪费,并且可以避免对非目标用户的打扰,提高了这些用户的体验。
可选地,所述确定在第三用户集合中归属于第一用户集合的目标用户,具体包括:
获取每一所述用户在第三方数据平台上的行为数据,并根据所述行为数据建立用户之间的相似关系;
根据所述相似关系将所述第三用户集合中的至少一个用户确定为归属于第一用户集合的目标用户。
其中,所述第三用户集合中的用户可以理解为待定用户,一部分可能作为目标用户,另一部分可能作为非目标用户。
获取每一所述用户在第三方数据平台上的行为数据,并根据所述行为数据建立用户之间的相似关系,可以理解为根据每一所述用户在第三方数据平台上的行为数据,构建预测模型,用于预测哪些用户可以最终作为目标用户,哪些用户可以最终作为非目标用户,基于此进行的信息投放,相当于是基于半监督分类方法,较好地运用记录下来的非常庞大的用户数据,而这类用户数据的利用可以借助于这些用户在第三方数据平台(例如淘宝)上的行为数据,以充分发挥这类庞大的用户数据的价值。
可选地,根据所述相似关系将所述第三用户集合中的至少一个用户确定为归属于第一用户集合的目标用户,具体包括:
为所述第一用户集合中的用户设置用于表示目标用户的正标签,以及为所述第二用户集合中的用户设置用于表示非目标用户的负标签;
根据所述相似关系,为所述第三用户集合中的每一用户设置所述正标签或所述负标签;
将所述第三用户集合中设置有所述正标签的用户确定为归属于第一用户集合的目标用户。
由此可见,本申请实施例提供的方法中,不仅仅利用已投放信息的用户数据得到的少量种子用户(即第一用户集合)及非目标用户数据(即第二用户集合),而且还利用每天记录下来的未参与竞价或者参与竞价但未成功的大量的用户数据(即第三用户集合);可以通过其他数据交互平台得到这些大量的用户在数据交互平台上的行为及目标物体交互数据。例如,本申请实施例充分利用第一用户集合、第二用户集合和第三用户集合的基于图的半监督分类方法(Linear Neighborhood Propagation,LNP,线性邻近点传播),来解决新业务DSP的受众选择或用户定位问题,通过所有用户在其他数据交互平台上的行为得到用户间的相似关系,利用该相似关系(每个用户最相似的K个用户)构成图,并在构造的图上标记用户(包括第一用户集合、第二用户集合)的正、负标签传播到那些未标记的第三用户集合上,从而确定在第三用户集合中归属于第一用户集合的目标用户。
可选地,所述行为数据包括下列信息之一或组合:
每一所述用户在第三方数据平台上进行数据交互所涉及的店铺的标识、店铺的标题、目标物体的标识、目标物体的标题。
可选地,该方法还包括:向所述第一用户集合中的用户投放信息。
也就是说,本申请实施例中,可以向第一用户集合,以及在第三用户集合中归属于第一用户集合的目标用户投放信息。
下面给出本申请实施例提供的技术方案的具体说明。
本申请实施例提供的技术方案的主要实现过程可以如图2所示,实现上可以划分为四个主要步骤:
步骤S201:日志采集当前信息投放平台的已投放信息的用户数据,确定少量的种子用户,即第一用户集合,以及非目标用户,即第二用户集合,并记录所有未参与竞价或者参与竞价但未成功的用户的Cookie(用于识别用户的身份标识),即确定第三用户集合;
步骤S202:将第一用户集合中的用户作为正标签样本,设置正标签,以及将第二用户集合中的用户作为负标签样本,设置负标签。
当然,只将第一用户集合中的用户作为正标签样本设置正标签,而不对第二用户集合中的用户作为负标签样本设置负标签也是可以的。
步骤S202’:获取所有这些用户在其他信息平台(即第三方数据平台)上的行为数据。
步骤S203:根据这些行为数据建立第三用户集合中的用户分别与第一用户集合中的用户、第二用户集合中的用户之间的相似关系,并可以进一步根据该相似关系构建如图3所示的用户相似关系图,即用户作为顶点,用户间相似度体现顶点之间的位置距离,相似度越大,距离越近。
步骤S204:针对用户相似关系图上每一正、负标签样本(将潜在目标用户的识别问题建模成一个半监督分类问题,分类一般需要正、负标签样本,第一用户集合中的用户作为正标签样本,第二用户集合中的用户作为负标签样本),根据该样本最近邻(最相似)的K个用户的数据,将该样本的标签在用户关系图上迭代传播到没有标签的用户顶点上去,从而使得用户相似关系图上所有顶点具备相应的标签;即确定第三用户集合中归属于第一用户集合的用户,并设置正标签,以及确定第三用户集合中归属于第二用户集合的用户,并设置负标签。
步骤S205:线上实时受众选择。即根据步骤S204中得到的用户相似关系图中所有用户的标签,进行用户选择,只有被赋予正标签的用户作为目标用户,线上该目标用户将进行竞价并尝试进行信息投放。因此,只将第一用户集合中的用户作为正标签样本设置正标签,而不对第二用户集合中的用户作为负标签样本设置负标签也是可以的。
例如,有一个新的信息需求方平台DSP A,而A刚开始投放信息时,因不知道信息的数据交互平台(AdExchange)的所有用户流量类型,所以先出一个保底价,然后可以记录所有AdExchange的可以投放信息的流量用户;并记录其中竞价成功的用户流量后续的信息推广目标物体的数据交互情况,将里面有过目标物体的数据交互的用户作为第一用户集合,也就是设置正标签的样本,简称正样本标签,将里面多次展现但无目标物体的数据交互的用户作为非目标用户,即第二用户集合,也就是设置负标签的样本,简称负样本标签。同时,根据记录的所有可投放信息的用户,去从别的数据交互平台(比如淘宝)抓取其行为信息,并根据这些行为信息计算第三用户集合分别与第一用户集合、第二用户集合的用户间相似度,并构建用户相似关系图,顶点是用户,相似度构成顶点间距离的权重(即距离越短,相应的用户越相似),并在该用户相似关系图上标上哪些是第一用户集合中的用户,哪些是第二用户集合中的用户,并分别设置正、负标签,接着在该用户相似关系图上进行正、负标签传播。线上竞价投放信息时,仅针对设置有正标签的用户进行投放即可。操作起来非常便捷,提高了信息投放效率以及有针对性地对用户进行信息投放。
下面主要对上述用户相似关系图的构建,及正、负标签传播这两个部分重点介绍。
根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,具体包括:
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或者目标物体的标识,计算两两标识之间的相似度s1;
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或目标物体的标题提取关键词,计算两两关键词之间的相似度s2;
根据所述s1和s2,确定最终相似度S;
根据所述最终相似度S,确定第三用户集合中与所述第一用户集合中的用户存在相似关系的用户。
其中,计算两两标识之间的相似度s1具体包括:
将每个用户最近交互的店铺或者目标物体ID组成ID偏好向量,计算两两ID偏好向量的相似度s1。
计算两两关键词之间的相似度s2具体包括:
对用户交互的店铺或目标物体的标题等信息中提取关键词(产品词、品牌词等),组成偏好关键词向量,并计算两两偏好关键词向量的相似度s2。
根据所述s1和s2,确定最终相似度S具体包括:
通过线性融合s1和s2得到最终相似度S。
关于构建用户相似关系图,即根据获取的第一用户集合中的每一用户、第二用户集合中的每一用户、第三用户集合中的每一用户,在第三方数据平台上的行为数据,建立第三用户集合分别与第一用户集合、第二用户集合的用户之间的相似关系,例如包括:
本申请实施例提出的基于半监督分类方法,较好地运用记录下来的非常庞大的第三用户集合中的每一用户的用户数据,而这类用户数据的利用,可以借助于这些用户在其他平台上的行为数据,以充分发挥这类庞大的未标记用户数据的价值。而使用基于图的半监督方法LNP来挖掘这部分数据价值,最重要步骤是构建第三用户集合中的用户与第一用户集合中的用户数据之间的相似关系图,即如何确定第三用户集合中归属于第一用户集合的目标用户。在LNP中,每个第三用户集合中的用户的数据可由其K个邻居或最相似的用户的属性特点线性组合重构而成,因此可通过最小化如下ε获得相似关系图中各顶点之间的连线的权重,ε可通过公式(1)计算得到:
其中,ε是目标函数,最小化表示该用户顶点与其邻居的属性非常相似,N(xk)表示用户xk最相似的K个邻居点构成的集合,而wki为xi重构xk贡献的权重,且因此,若xj不为用户xk的邻居,则wkj=0。
计算得到所有的wki,则可完成确定所有上述用户的相似度。进一步地,还可以设置顶点之间的连线,即由图3所示的用户,得到图4所示的用户相似关系。
这整个过程中,还涉及到一个关键问题,就是各个用户数据点的最相似的邻居的定位获取;在该方法中,主要采用了现有的这些用户数据在其他平台上已有的丰富的行为表现数据,主要抽取了2大类最重要的行为信息,一类是交互ID相似度量,即将每个用户最近交互的店铺或者目标物体ID组成ID偏好向量,计算两ID偏好向量的相似度构成s1;另一类是交互获取兴趣相似度量,即对用户交互的店铺或目标物体的标题等信息中提取关键词(产品词、品牌词等),组成偏好关键词向量,并计算两个偏好关键词向量的相似度构成s2;最后通过线性融合s1和s2得到最终相似度S,作为每个数据点最近邻居的判断标准,S=w1*s1+w2*s2,w1与w2通过经验确定,例如w1和w2分别设置为0.4和0.6。s1与s2计算采用如下公式(2)得到:
其中,xi,xj分别表示第i个与第j个用户;W(xi)为第i个用户的偏好ID或者偏好关键词集合。
公式(2)计算的是两个用户之间的相似度,s1是目标物体ID向量相似,所以W(xi)表示i用户的目标物体ID;s2是词向量,则W(xi)表示i用户的词。
关于受众标签传播,即根据所述相似关系,为第三用户集合中的每一用户设置所述正标签或所述负标签,例如包括:
得到图3或图4所示的用户相似关系图之后,下一步是在用户相似关系图上,将目标用户或者非目标用户的标签,迭代传播到图上所有其他用户顶点上去,例如正标签可以是绿色标签,负标签可以是粉色标签,为不同的顶点设置不同颜色的标签(图中未示出)。
具体地,使用初始标签矩阵Y∈Rn×2,假设共有n个用户顶点,每个顶点为2维向量,<1,0>与<0,1>分别表示第一用户集合中的用户与第二用户集合中的用户点的向量,而第三用户集合中的用户的数据,则为<0,0>。令矩阵F表示所有顶点的分类函数,初始F=Y,可多次迭代如下公式(3),最终收敛得到公式(4)。Ft为第t次迭代的结果。
Ft+1=αWFt+(1-α)Y,0<α<1 (3)
其中,α为预设的常数因子,表示来自邻居顶点与来自第一用户集合中的用户的标签的占比情况,例如可以是0.6。
F*=limt→∞Ft=(1-α)(I-αW)-1Y (4)
其中,W为计算得到的各边的权重(权重表示用户间的相似度关系)均值,I为单位矩阵。而最终那些第三用户集合中的用户的标签为正标签还是负标签,可通过公式(5)来确定,这样就确定了所有用户的标签,后续可根据标签(是否受众)在线上竞价时针对性选择竞价。
其中,Fij*表示迭代到最后的F分类矩阵第i行第j列的值,表示用户i属于第j类的概率。
需要说明的是,本申请实施例中,采用的是基于图的半监督分类方法以充分利用没有标签的用户数据信息,除此之外,也可采用如Co-Training(协同过滤算法,为一种半监督学习方法)等别的半监督分类框架。
另外,本申请实施例在构建用户相似关系图中得到每个用户相似邻居时,采用的是偏好ID与偏好关键词线性加权的相似性度量方法,当然也可通过交互信息抽取别的相似性度量方法,来确定邻居顶点关系,例如也可以抽取用户行为的别的维度信息,比如偏好类目,人口属性相似等来确定邻居顶点关系。
与上述方法相对应地,参见图5,本申请实施例提供的一种信息投放装置,包括:
第一单元11,用于提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合;
第二单元12,用于确定在第三用户集合中归属于第一用户集合的目标用户;
第三单元13,用于向所述目标用户投放信息。
可选地,所述第一用户集合包括通过信息投放平台点击过信息并完成相应的数据交互的用户;
所述第二用户集合包括未对信息投放平台上已投放的信息进行点击的用户,以及对在信息投放平台上已投放信息进行了点击但并未进行相应的数据交互的用户;
所述第三用户集合包括未参与信息投放平台的信息投放竞价的用户,以及参与了信息投放竞价但未成功的用户。
可选地,所述第二单元具体用于:
获取每一所述用户在第三方数据平台上的行为数据,并根据所述行为数据建立用户之间的相似关系;
根据所述相似关系将所述第三用户集合中的至少一个用户确定为归属于第一用户集合的目标用户。
可选地,所述第二单元根据所述相似关系将所述第三用户集合中的至少一个用户确定为归属于第一用户集合的目标用户,具体包括:
为所述第一用户集合中的用户设置用于表示目标用户的正标签,以及为所述第二用户集合中的用户设置用于表示非目标用户的负标签;
根据所述相似关系,为所述第三用户集合中的每一用户设置所述正标签或所述负标签;
将所述第三用户集合中设置有所述正标签的用户确定为归属于第一用户集合的目标用户。
可选地,所述行为数据包括下列信息之一或组合:
每一所述用户在第三方数据平台上进行数据交互所涉及的店铺的标识、店铺的标题、目标物体的标识、目标物体的标题。
可选地,所述第三单元还用于:向所述第一用户集合中的用户投放信息。
上述任一单元,均可以是处理器等实体器件,所述处理器可以是中央处埋器(CPU)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或复杂可编程逻辑器件(ComplexProgrammable Logic Device,CPLD)。
所述的信息投放装置,例如可以是服务器等设备。
综上所述,本申请实施例提供的技术方案,提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合,确定在第三用户集合中归属于第一用户集合的目标用户,向所述目标用户投放信息,从而实现了更有针对性地向用户投放广告,而不是向所有用户投放广告,提高了信息投放的用户定位的准确性,并且扩大了目标用户的范围,进而信息投放效果更佳,节约了成本,避免了资源浪费,并且可以避免对非目标用户的打扰,提高了用户的体验。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种信息投放方法,其特征在于,包括:
提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合;
确定在第三用户集合中归属于第一用户集合的目标用户;
向所述目标用户投放信息。
2.根据权利要求1所述的方法,其特征在于,所述将用户集合划分为第一用户集合、第二用户集合和第三用户集合,具体包括:
将对在信息投放平台上已投放信息进行了点击并完成相应的数据交互的用户,确定为第一用户集合;
将对在信息投放平台上已投放信息进行了点击但并未进行相应的数据交互的用户,确定为第二用户集合;
将未对在信息投放平台上已投放的信息进行点击的用户,确定为第三用户集合。
3.根据权利要求1所述的方法,其特征在于,所述确定在第三用户集合中归属于第一用户集合的目标用户,具体包括:
获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的行为数据;
根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户;
将所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,确定为在第三用户集合中归属于第一用户集合的目标用户。
4.根据权利要求3所述的方法,其特征在于,获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的行为数据,具体包括:
获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的下列信息之一或组合:
数据交互所涉及的店铺的标识、店铺的标题、目标物体的标识、目标物体的标题。
5.根据权利要求4所述的方法,其特征在于,根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,具体包括:
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或者目标物体的标识,计算两两标识之间的相似度s1;
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或目标物体的标题提取关键词,计算两两关键词之间的相似度s2;
根据所述s1和s2,确定最终相似度S;
根据所述最终相似度S,确定第三用户集合中与所述第一用户集合中的用户存在相似关系的用户。
6.一种信息投放装置,其特征在于,包括:
第一单元,用于提供用户集合,将用户集合划分为第一用户集合、第二用户集合和第三用户集合;
第二单元,用于确定在第三用户集合中归属于第一用户集合的目标用户;
第三单元,用于向所述目标用户投放信息。
7.根据权利要求6所述的装置,其特征在于,所述第一单元将用户集合划分为第一用户集合、第二用户集合和第三用户集合,具体包括:
将对在信息投放平台上已投放信息进行了点击并完成相应的数据交互的用户,确定为第一用户集合;
将对在信息投放平台上已投放信息进行了点击但并未进行相应的数据交互的用户,确定为第二用户集合;
将未对在信息投放平台上已投放的信息进行点击的用户,确定为第三用户集合。
8.根据权利要求6所述的装置,其特征在于,所述第二单元,具体用于:
获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的行为数据;
根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户;
将所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,确定为在第三用户集合中归属于第一用户集合的目标用户。
9.根据权利要求8所述的装置,其特征在于,所述第二单元获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的行为数据,具体包括:
获取所述第一用户集合和所述第三用户集合中的用户在第三方数据平台上的下列信息之一或组合:
数据交互所涉及的店铺的标识、店铺的标题、目标物体的标识、目标物体的标题。
10.根据权利要求9所述的装置,其特征在于,所述第二单元根据所述行为数据,确定所述第三用户集合中与所述第一用户集合中的用户存在相似关系的用户,具体包括:
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或者目标物体的标识,计算两两标识之间的相似度s1;
对所述第一用户集合和所述第三用户集合中的用户在预设时间内进行数据交互所涉及的店铺或目标物体的标题提取关键词,计算两两关键词之间的相似度s2;
根据所述s1和s2,确定最终相似度S;
根据所述最终相似度S,确定第三用户集合中与所述第一用户集合中的用户存在相似关系的用户。
CN201610491441.5A 2016-06-28 2016-06-28 一种信息投放方法及装置 Pending CN107545453A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610491441.5A CN107545453A (zh) 2016-06-28 2016-06-28 一种信息投放方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610491441.5A CN107545453A (zh) 2016-06-28 2016-06-28 一种信息投放方法及装置

Publications (1)

Publication Number Publication Date
CN107545453A true CN107545453A (zh) 2018-01-05

Family

ID=60963100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610491441.5A Pending CN107545453A (zh) 2016-06-28 2016-06-28 一种信息投放方法及装置

Country Status (1)

Country Link
CN (1) CN107545453A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135916A (zh) * 2019-05-23 2019-08-16 北京优网助帮信息技术有限公司 一种相似人群识别方法及系统
CN110738529A (zh) * 2019-10-21 2020-01-31 秒针信息技术有限公司 用户扩散方法、装置、可读存储介质及电子设备
CN111178943A (zh) * 2019-12-16 2020-05-19 北京淇瑀信息科技有限公司 广告实时出价方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246323A1 (en) * 2010-03-31 2011-10-06 Mihir Mehta User segmentation for listings in online publications
CN102722832A (zh) * 2012-01-05 2012-10-10 合一网络技术(北京)有限公司 在线视频广告精细化定向投放方法
CN104063801A (zh) * 2014-06-23 2014-09-24 广州优蜜信息科技有限公司 一种基于聚类的移动广告推荐方法
CN105005917A (zh) * 2015-07-07 2015-10-28 上海晶赞科技发展有限公司 一种通用的关联不同电商网站单品的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246323A1 (en) * 2010-03-31 2011-10-06 Mihir Mehta User segmentation for listings in online publications
CN102722832A (zh) * 2012-01-05 2012-10-10 合一网络技术(北京)有限公司 在线视频广告精细化定向投放方法
CN104063801A (zh) * 2014-06-23 2014-09-24 广州优蜜信息科技有限公司 一种基于聚类的移动广告推荐方法
CN105005917A (zh) * 2015-07-07 2015-10-28 上海晶赞科技发展有限公司 一种通用的关联不同电商网站单品的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
尚燕敏 等: "基于社会正则的行为定向", 《计算机研究与发展》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135916A (zh) * 2019-05-23 2019-08-16 北京优网助帮信息技术有限公司 一种相似人群识别方法及系统
CN110738529A (zh) * 2019-10-21 2020-01-31 秒针信息技术有限公司 用户扩散方法、装置、可读存储介质及电子设备
CN111178943A (zh) * 2019-12-16 2020-05-19 北京淇瑀信息科技有限公司 广告实时出价方法、装置及电子设备
CN111178943B (zh) * 2019-12-16 2024-04-26 北京淇瑀信息科技有限公司 广告实时出价方法、装置及电子设备

Similar Documents

Publication Publication Date Title
US11070643B2 (en) Discovering signature of electronic social networks
CN105991397B (zh) 信息传播方法和装置
WO2019144892A1 (zh) 数据处理方法、装置、存储介质和电子装置
CN102737334B (zh) 微细分定义系统
CN107871244A (zh) 一种广告效果的检测方法和装置
CN106250403A (zh) 用户流失预测方法及装置
CN110245301A (zh) 一种推荐方法、装置及存储介质
CN107688605B (zh) 跨平台数据匹配方法、装置、计算机设备和存储介质
CN110263235A (zh) 信息推送对象更新方法、装置和计算机设备
Nobre et al. A hierarchical network-oriented analysis of user participation in misinformation spread on WhatsApp
CN108334575A (zh) 一种推荐结果排序修正方法及装置,电子设备
CN109783539A (zh) 用户挖掘及其模型构建方法、装置及计算机设备
CN110472154A (zh) 一种资源推送方法、装置、电子设备及可读存储介质
Zeng et al. Incentive mechanisms in federated learning and a game-theoretical approach
CN110009430A (zh) 作弊用户检测方法、电子设备及计算机可读存储介质
CN110414547A (zh) 一种行为检测方法、装置、计算机设备和存储介质
WO2017143773A1 (zh) 一种众包学习方法及装置
CN110247974A (zh) 基于区块链的信息推送方法、装置、计算机和存储介质
CN107545453A (zh) 一种信息投放方法及装置
CN108305181A (zh) 社交影响力确定、信息投放方法及装置、设备及存储介质
CN108399551A (zh) 一种确定用户标签和推送信息的方法及系统
Xu et al. Incentive mechanisms for large-scale crowdsourcing task diffusion based on social influence
Zhang et al. Mining target users for mobile advertising based on telecom big data
CN112053184B (zh) 推广信息投放方法、装置、电子设备以及存储介质
CN107688964A (zh) 一种用于大规模众包任务扩散的激励方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1249259

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20180105

RJ01 Rejection of invention patent application after publication