CN107862532B - 一种用户特征提取方法及相关装置 - Google Patents

一种用户特征提取方法及相关装置 Download PDF

Info

Publication number
CN107862532B
CN107862532B CN201610843241.1A CN201610843241A CN107862532B CN 107862532 B CN107862532 B CN 107862532B CN 201610843241 A CN201610843241 A CN 201610843241A CN 107862532 B CN107862532 B CN 107862532B
Authority
CN
China
Prior art keywords
operation object
user
different levels
features
scoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610843241.1A
Other languages
English (en)
Other versions
CN107862532A (zh
Inventor
邹缘孙
汤煌
林家欣
李俊
蔡业首
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610843241.1A priority Critical patent/CN107862532B/zh
Priority to PCT/CN2017/102690 priority patent/WO2018054328A1/zh
Publication of CN107862532A publication Critical patent/CN107862532A/zh
Priority to US16/018,919 priority patent/US20180307733A1/en
Application granted granted Critical
Publication of CN107862532B publication Critical patent/CN107862532B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/282Hierarchical databases, e.g. IMS, LDAP data stores or Lotus Notes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例中公开了一种用户特征提取方法及相关装置,包括:获取用户的活动日志,活动日志中记录有用户网络操作过程中产生的操作行为;从操作行为中分层提取与操作行为对应的操作对象特征,得到不同层级的操作对象特征,不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;针对同一层级的操作对象特征,依据操作对象特征对应的操作行为,生成用户特征。可知,本发明实施例中由于将操作对象特征分成不同的层级,不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细,本发明实施例中可以从细粒度的操作对象特征层级中挖掘出细粒度的用户特征,从而满足一些需要使用细粒度用户特征的使用场景的需求。

Description

一种用户特征提取方法及相关装置
技术领域
本发明涉及数据处理技术领域,具体涉及一种用户特征提取方法及相关装置。
背景技术
用户特征主要是用来描述一个用户的特征属性,例如:性别、年龄、职业、爱好、地域或者用户访问网站的规律等特征,用户特征的挖掘是在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户的特征属性。而用户特征的挖掘对于网络的营销策略具有重要意义,例如:通过用户特征的挖掘,发现用户的偏好,生成与用户偏好相对应的个性化的推荐服务,从而为用户推荐符合用户需求的推荐服务。
然而,现有技术中主要挖掘的是业务场景层次的用户特征,不能挖掘出更细粒度的用户特征,因此,现有技术中的用户特征挖掘方案,挖掘出的用户特征不精细,不能满足一些需要使用细粒度用户特征的使用场景的需求。
发明内容
有鉴于此,本发明实施例提供一种用户特征提取方法及相关装置,能够挖掘出细粒度的用户特征,从而满足一些需要使用细粒度用户特征的使用场景的需求。
为实现上述目的,本发明实施例提供如下技术方案:
一种用户特征提取方法,包括:
获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;
从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;
针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征。
一种用户特征提取装置,包括:
活动日志获取模块,用于获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;
操作对象特征提取模块,用于从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;
用户特征生成模块,用于针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征。
基于上述技术方案,本发明实施例中公开了一种用户特征提取方法及相关装置,包括:获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征。由此可知,本发明实施例中由于将操作对象特征分成不同的层级,不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细,本发明实施例中可以从细粒度的操作对象特征层级中挖掘出细粒度的用户特征,从而满足一些需要使用细粒度用户特征的使用场景的需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种用户特征提取方法的流程图;
图2为本发明实施例提供的一种对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的方法流程图;
图3为本发明实施例提供的另一种对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的方法流程图;
图4为本发明实施例提供的又一种对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的方法流程图;
图5为本发明实施例提供的一种用户特征提取装置的结构框图;
图6为本发明实施例提供的一种用户特征提取装置的硬件结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种用户特征提取方法的流程图,该方法可以包括:
步骤S100、获取用户的活动日志;
需要说明的是,所述活动日志中记录有用户网络操作过程中产生的操作行为,包含用户访问任何网站过程中产生的操作行为,用户的活动日志可以为数据表,也可以为分布式系统基础架构上的文件,还可以为流式的数据,本发明实施例中不做具体限定。例如:用户打开了一个视频网站中的某一娱乐节目观看了一个小时,或者,用户访问了一新闻网站中某一条体育新闻,或者,用户打开某一购物网站浏览了哪些店铺信息等都属于活动日志中记录的用户网络操作过程中产生的操作行为,本发明实施例做具体限定。
步骤S110、从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征;
需要说明的是,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细。
需要说明的是,所述操作对象特征为用户操作行为对应的操作对象的特征,例如:用户的操作行为为听了一首歌曲,歌曲为操作对象,而操作对象特征为歌曲名、歌曲的演唱者、歌曲发布时间、歌曲的类型等。
由于本发明实施例中不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细,层级数最低的操作对象特征的数据粒度最细,层级数最高的操作对象特征的数据粒度最粗。
举例来说:第一层级为关键词层,关键词层中的操作对象特征主要为从操作行为中提取的文字词语,例如:宇宙、黑洞、上衣、裤子等;第二层级为文本主题层,文本主题层中的操作对象特征主要为从操作行为中提取的文本主题,例如:科技类,衣服类等;第三层为场景类目层,场景类目层中的操作对象特征主要为从操作行为中提取的场景类型,例如:新闻类,购物类等。第一层级关键词层中包含的操作对象特征的粒度最细,第三层场景类目层中包含的操作对象特征的数据粒度最粗。
可选的,本发明实施例中并不限于以上公开的三层操作对象特征,本发明实施例中可以按照预先定义的分层类别方向以及分层粒度层级,从所述用户在网络上的操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征。
可以由技术人员自定义操作对象特征的分层类别方向,所述操作对象特征的分层类别方向为对所述操作对象特征进行分层的类别方向,例如:用户浏览的视频网站中的节目可以按照节目的题材进行分层,还可以按照节目的类型进行分层,如:用户浏览视频网站得到的三层操作对象特征分别为:泰坦尼克号,爱情类,视频;用户浏览视频网站得到的三层操作对象特征还可以为:泰坦尼克号,电影,视频。
其中,分层粒度层级也可以由技术人员自定义,可以定义三层、四层或五层,本发明实施例不做具体限定。
需要说明的是,本发明实施例中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,每层操作对象特征的提取过程采用不同的提取方法,并且,同一层级的操作对象特征的提取过程也可以采用不同的提取方法,从而在海量的用户活动日志中能够快速并且精确的提取操作行为对应的操作对象特征。
可选的,针对关键词层,本发明实施例中可以采用如下提取方法提取关键词层中的操作对象特征:中文分词方法,复合词挖掘方法或关键词提取方法等;
针对文本主题层,本发明实施例中可以采用如下提取方法提取文本主题层中的操作对象特征:词嵌入方法,主题提取方法,文本分类方法或聚类方法等;
针对场景类目层,本发明实施例中可以采用如下提取方法提取场景类目层中的操作对象特征:依据与文本主题层的映射关系构造设计等。
需要说明的是,本发明实施例中并不限于以上公开的操作对象特征提取方法。
步骤S120、针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征。
需要说明的是,本发明实施例中主要是将操作对象特征以及操作对象特征对应的操作行为,映射到用户,从而得到用户特征的。例如:用户浏览视频网站得到的三层操作对象特征分别为:泰坦尼克号,爱情类,视频,由此映射得到的用户特征可以为:该用户喜欢观看视频,喜欢观看爱情类视频等。
可选的,本发明实施例中可以由技术人员根据实际需要来针对用户不同层级的操作对象特征生成用户特征,当技术人员需要获得细粒度的用户特征时,可以依据层级数比较低的操作对象特征生成用户特征;当技术人员需要获得粗粒度的用户特征时,可以依据层级数比较高的操作对象特征生成用户特征,本发明实施例中不做具体限定。
本发明实施例公开的技术方案可以实时获取用户的活动日志,从所述操作行为中分层提取与所述操作行为对应的操作对象特征,并实时生成用户特征,从而能够依据实时生成的用户特征及时向用户推荐用户感兴趣的产品或业务。
需要说明的是,本发明实施例中公开的用户特征提取方法,通过引入一种工作流模式,将数据、算法、计算有机的综合在一起,具有更好的数据扩展性、算法通用性以及应用扩展性。本方案通过将用户特征提取过程中的各个具体处理流程模块化,各个模块之间通过定义好的挖掘任务来统一协调,各个模块中只需要关注自身处理的数据流程,模块之间的耦合性降低。在不同场景中的用户特征挖掘,都可以采用本发明实施例中公开的用户特征提取方法。
因此,本发明实施例中提供了一种通用的用户特征提取方案,在数据层面上具有良好的数据扩展性,有效的降低了不同数据源需要单独设计并维护一套挖掘方案的问题,同时又能综合利用不同数据源信息从而达到更准确的挖掘用户特征。在用户特征设计及挖掘方面,结合具体的业务实践经验,设计了不同层级的操作对象特征描述,从而使得一套挖掘方案能够满足多个不同业务场景的需求。
本发明实施例中公开的用户特征提取方法的实际应用场景可以为:用户画像或广告定向等。
用户画像主要是用来描述用户属性,目前主要关注这么几个方面:人口统计学,用户身份状态,场景兴趣。人口统计学特征主要包括,年龄、性别,地域等;身份状态可以是用户的学历、职业,收入情况等本人信息;兴趣类的画像可以根据用户的场景行为来具体的定义:比如用户在观看视频,我们可以定义用户的观影兴趣。这类兴趣可以基于用户观看视频的类型,可以利用本发明实施例中公开的用户特征提取方法挖掘出用户在不同题材上的偏好,视频的题材可以是喜剧、武侠、爱情、都市、玄幻等。
用户画像具体的使用场景案例:产品推荐服务,比如在视频业务中,每天几千万的活跃观影用户,百万级别的视频资源,为用户提供个性化的推荐服务,采用基于热度,协同过滤,矩阵分解等方法。基于用户观影行为,利用本发明实施例中公开的用户特征提取方法挖掘出用户兴趣特征,基于用户的兴趣特征,可以使用协同过滤算法、矩阵分解算法或逻辑回归算法来预测用户对于影视剧的偏好程度,然后推荐给用户。
广告定向主要是在朋友圈投放广告时,广告主会综合自己产品的特性和使用群体,来选择曝光的受众人群。例如:某公司要投放新款售价在60万人民币的电动汽车广告,该公司期望曝光的广告用户是年龄24-45岁,年薪在40万以上,地域是一线城市,有过驾驶经验,乐于接受新事物,敢于冒险,喜欢科技类产品。利用本发明实施例中公开的用户特征提取方法挖掘出的符合上述条件的用户特征为:23-45岁,高净值,理财,金领,北上广深,汽车,科技,运动,户外,电子产品,基于以上挖掘好的用户特征,可以找出满足以上用户特征的用户作为广告投放的目标用户。
需要说明的是,本发明实施例中在从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征之后还包括:
对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值。
所述对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的过程包括:
确定不同层级中的操作对象特征在用户的活动日志中各自出现的次数;确定所述不同层级中的操作对象特征各自在用户的活动日志中的重要性指标;依据所述不同层级中的操作对象特征在用户的活动日志中各自出现的次数以及各自在用户的活动日志中的重要性指标,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值。
下面给出两种具体的对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值的算法:
算法一:score(source,item,tag)=tf*idf
其中,score(source,item,tag)为某一操作对象特征对应的分值,source为操作对象特征所来自的活动日志源,item为操作对象特征所属的层级,tag为该操作对象特征;
tf为操作对象特征在同一层级的所有操作对象中出现的次数,idf为该操作对象特征的重要性指标;
具体的,
Figure BDA0001118814800000071
||D||为同一层级中的操作对象总数,||Dt||为同一层级中具有该操作对象特征的操作对象总数,
依据上述算法对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值。
算法二:
利用TextRank模型,通过把同一层级中的所有操作对象特征分割成若干组成单元并建立图模型,利用投票机制对任一操作对象特征的重要性进行排序。TextRank模型在数学上可以表示一个有向有权图G=(V,E),V为同一层级中的所有操作对象特征的集合,E为同一层级中的所有操作对象特征关系集合。设图中任两点Vi,Vj(即任意两个操作对象特征)之间边的关系权重为wji,对于一个给定的点Vi(即一个给定的操作对象特征),In(Vi)为所有指向该点的点集合,Out(Vi)为点Vi指向的点的集合,则点Vi的得分定义如下:
Figure BDA0001118814800000081
其中,score(item,vi)为item层级中操作对象特征vi的得分,score(item,vj)为item层级中操作对象特征vj的得分,d为小于1的常数;
通过上述公式,迭代计算图中各点的得分直到收敛,得到一操作对象特征的最终得分;
依据上述算法对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值。
可选的,图2为本发明实施例提供的一种对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的方法流程图,参照图2,该方法可以包括:
步骤S200、确定操作对象特征各自对应的操作行为的权重值;
步骤S210、依据所述操作对象特征各自对应的操作行为的权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
具体的,score(user,source,tag)=action_weight*score(source,item,tag);
score(user,source,tag)为操作对象特征对应的分值,score(source,item,tag)为操作对象特征对应的重要性分值,source为操作对象特征所来自的活动日志源,item为操作对象特征所属的层级,tag为操作对象特征,user为操作对象特征所属的用户名。
action_weight为操作对象特征对应的操作行为的权重值,该权重值表明了用户对该操作对象的偏好程度,该权重值可以由技术人员依据实际场景中的情况自行定义,例如:在用户访问视频网站场景下,用户对于视频的观看操作行为的权重值要大于用户对于视频的点击操作行为的权重值,因为用户观看了某一视频表明用户比较偏好该视频,而用户仅点击了该视频并没有观看,表面用户对该视频的偏好程度比较低。在用户访问购物网站的场景下,用户对于一件商品的购买操作行为的权重值要大于用户将一件商品放到购物车的操作行为的权重值等,本发明实施例中并不限于以上情况。
本发明实施例中通过依据所述操作对象特征各自对应的操作行为的权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值的技术方案,能够考虑到重要的操作对象特征对应的操作行为对用户特征的影响,从而得到更加准确的用户特征。
具体的,图3为本发明实施例提供的另一种对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的方法流程图,参照图3,该方法可以包括:
步骤S300、确定操作对象特征各自对应的操作行为发生的时间周期;
步骤S310、确定操作对象特征各自对应的预设的时间衰减权重值;
需要说明的是,本发明实施例中可以采取指数时间衰减方式,还可以采取线性时间衰减方式,本发明实施例中不做具体限定。
具体的时间衰减权重值可以由技术人员依据实际场景中的操作行为确定,例如:对于新闻类,更新时间比较快,因此,时间衰减也比较快,定义的时间衰减权重值则大些;对于用户观看的电视剧,更新时间比较慢,因此,时间衰减也比较慢,定义的时间衰减权重值则小些。
步骤S320、在操作对象特征各自对应的操作行为发生的时间周期内,依据操作对象特征各自对应的预设的时间衰减权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
对上述实施例中得到的操作对象特征对应的重要性分值score(user,source,tag)进行时间衰减,得到经过时间衰减后得到的操作对象特征对应的用户偏好分值为:
Figure BDA0001118814800000101
Figure BDA0001118814800000102
为时间衰减权重值,
Figure BDA0001118814800000103
为给定的衰减基准,d为衰减天数,如给定
Figure BDA0001118814800000104
当d=30,时间衰减权重值为e-1;T为操作对象特征对应的操作行为发生的时间周期。
本发明实施例中通过在操作对象特征各自对应的操作行为发生的时间周期内,依据操作对象特征各自对应的预设的时间衰减权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值,从而考虑到时间因素对于操作对象特征的影响,使得得到的用户特征更加符合当前的用户情况,从而得到更加准确的用户特征。
具体的,图4为本发明实施例提供的又一种对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的方法流程图,参照图4,该方法可以包括:
步骤S400、在用户的活动日志是由多个不同种类的数据源构成的情况下,分别确定不同层级的各操作对象特征所来自的目标数据源;
本发明实施例中可以采用在不同场景下的通用的账号来加载不同种类的数据源,例如:用户在不同场景中登录的用户名可能是同一个手机号或者同一个邮箱账号等。
步骤S410、确定所述各个目标数据源在用户的活动日志中的多个不同种类的数据源中的数据源权重值;
步骤S420、依据所述各个数据源权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
融合多个数据源用户在一定周期内对单个操作对象特征对应的用户偏好分值的打分方案如下:
Figure BDA0001118814800000111
其中,set(source)表示用户的活动日志中的多个不同种类的数据源的集合,source_weight表示用户的活动日志中的各个数据源的权重,T为操作对象特征对应的操作行为发生的时间周期,
Figure BDA0001118814800000112
为用户的活动日志中某一数据源对应的经过时间衰减后的操作对象特征对应的用户偏好分值。
本发明实施例中在用户特征提取的过程中,考虑到了用户的活动日志是由多个不同种类的数据源构成的情况,对于不同的场景,用户会对不同种类的数据源具有不同的偏好,比如:电影预告片广告投放的用户,用户则看重的是视频类、新闻类的数据源,游戏类的广告投放的用户看重的是手机软件上的用户人群数据源。如果广告投放在微信公公众号里面,则对于来自于公众号的数据相关数据源,会给一个高于其他数据源的权重;如果广告是一则电影宣传片,那么视频娱乐类数据源会给予一个高权重。从而本发明实施例中结合用户的活动日志中的各个数据源的权重,得到操作对象特征对应的用户偏好分值,从而结合操作对象特征对应的用户偏好分值,得到更加准确的用户特征。
同时,对于一个新的视频用户,由于在视频场景下用户没有过任何观看的行为数据,因此仅仅依据视频数据源,并不能得到用户特征,即无法挖掘出该用户在视频方面的偏好。而通过加载其它场景的数据源,比如用户新闻、文章的阅读兴趣等方面的数据源,可以提取到一些用户特征,即利用该用户在其他场景中的兴趣特征来描述用户,从而有效缓解推荐中普遍存在的用户冷启动问题。
基于以上实施例,本发明中在针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征的过程中可以基于操作对象特征、操作对象特征对应的分值以及所述操作对象特征对应的操作行为,生成用户特征。
下面,以一个具体的例子详细说明上述本发明实施例中公开的用户特征提取方法:
1、获取用户的活动日志,获取用户的活动日志通过数据采集系统采集,落地成数据仓库中的一张数据表,以文件形式存放在分布式文件系统中。
2、编写文件,该文件主要描述用户特征提取过程中使用的数据源,挖掘用户的特征粒度层级,数据的融合方式,不同数据源的权重安排,用户特征的时间衰减方式等,如下是一个具体的文件例子:
#MiningJobConfig
[data_source]
source=video,news
[video]
source=video
data_hdfs_path=video_hdfs_path
data_schema_path=video_schema_path
actionType=watch:watchWeight,click:clickWeight
item_text_field=video_text_fielname
action_duration=30d
decay_mode=exp_model
encoding=utf-8
[news]
source=news
data_hdfs_path=news_hdfs_path
data_schema_path=news_schema_path
actionType=read:readWeight,click:clickWeight
item_text_field=news_text_fielname
action_duration=30d
decay_mode=exp_model
encoding=utf-8
[feature]
feature_level=keyword,topic,category
feature_algorithm=keyword:textrank,topic:word2vec_kmeans
[source_merge]
weight_assign=video:video_weight,news:news_weight
[mined_result]
feature_path=feature_hdfs_path
在上述文件中,data_source中定义了本次用户特征提取过程需要使用到的数据源有视频(video)和新闻(news);
在视频数据中,定义用户操作行为数据的存放路径为:data_hdfs_path=video_hdfs_path;
数据的组织方式为:data_schema_path=video_schema_path;
视频中观看和点击行为在计算用户特征中的权重分配:actionType=watch:watchWeight,click:clickWeight;
视频中的文本字段名为:item_text_field=news_text_fielname;
用户特征提取的时间周期为action_duration=30d,这里是30天;
时间衰减的形式为decay_mode=eps_model,表示指数形式按天衰减;
文件的编码方式为encoding=utf-8;
在新闻数据中,定义用户操作行为数据的存放路径为:data_hdfs_path=news_hdfs_path;
数据的组织方式为:data_schema_path=news_schema_path;
新闻中阅读和点击行为在计算用户特征中的权重分配:
actionType=read:readWeight,click:clickWeight;
新闻中的文本字段名为:item_text_field=news_text_fielname;
用户特征提取的时间周期为action_duration=30d,这里是30天;
时间衰减的形式为decay_mode=eps_model,表示指数形式按天衰减;
文件的编码方式为encoding=utf-8;
[feature]中定义了本次是在关键词层(keyword)和文本主题层(topic)中提取用户特征;
分别选择的在关键词层(keyword)和文本主题层(topic)中提取操作对象特征的方式为:基于textrank挖掘关键词层,基于word2vec和kmean挖掘文本主题层,source_merge定义了数据的融合方式以及权重分配;mined_result定义了用户特征存放的路径。
3、定义好了文件后,按照上述文件中定义的提取算法提取用户特征。
本发明实施例中公开的一种用户特征提取方法,包括:获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征。由此可知,本发明实施例中由于将操作对象特征分成不同的层级,不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细,本发明实施例中可以从细粒度的操作对象特征层级中挖掘出细粒度的用户特征,从而满足一些需要使用细粒度用户特征的使用场景的需求。
下面对本发明实施例提供的用户特征提取装置进行介绍,下文描述的用户特征提取装置可与上文用户特征提取方法相互对应参照。
图5为本发明实施例提供的用户特征提取装置的结构框图,参照图5,该用户特征提取装置可以包括:
活动日志获取模块100,用于获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;
操作对象特征提取模块110,用于从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;
用户特征生成模块120,用于针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征。
所述操作对象特征提取模块的一种可选结构包括:
操作对象特征提取子模块,用于按照预先定义的分层类别方向以及分层粒度层级,从所述用户在网络上的操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征。
还包括:
操作对象特征评分模块,用于对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值。
所述操作对象特征评分模块的一种可选结构包括:
次数确定模块,用于确定不同层级中的操作对象特征在用户的活动日志中各自出现的次数;
重要性指标确定模块,用于确定所述不同层级中的操作对象特征各自在用户的活动日志中的重要性指标;
第一操作对象特征评分子模块,用于依据所述不同层级中的操作对象特征在用户的活动日志中各自出现的次数以及各自在用户的活动日志中的重要性指标,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值。
所述操作对象特征评分模块的一种可选结构包括:
操作行为权重值确定模块,用于确定操作对象特征各自对应的操作行为的权重值;
第二操作对象特征评分子模块,用于依据所述操作对象特征各自对应的操作行为的权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
所述操作对象特征评分模块的一种可选结构包括:
时间周期确定模块,用于确定操作对象特征各自对应的操作行为发生的时间周期;
时间衰减权重值确定模块,用于确定操作对象特征各自对应的预设的时间衰减权重值;
第三操作对象特征评分子模块,用于在操作对象特征各自对应的操作行为发生的时间周期内,依据操作对象特征各自对应的预设的时间衰减权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
所述操作对象特征评分模块的一种可选结构包括:
目标数据源确定模块,用于在用户的活动日志是由多个不同种类的数据源构成的情况下,分别确定不同层级的各操作对象特征所来自的目标数据源;
数据源权重值确定模块,用于确定所述各个目标数据源在用户的活动日志中的多个不同种类的数据源中的数据源权重值;
第四操作对象特征评分子模块,用于依据所述各个数据源权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
可选的,用户特征提取装置可以为硬件设备,上文描述的模块、单元可以设置于用户特征提取装置内的功能模块。图6示出了用户特征提取装置的硬件结构框图,参照图6,用户特征提取装置可以包括:处理器1,通信接口2,存储器3和通信总线4;其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1,用于执行程序;存储器3,用于存放程序;程序可以包括程序代码,所述程序代码包括计算机操作指令;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路;存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,程序可具体用于:
获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;
从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;
针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征。
综上所述:
本发明实施例中公开了一种用户特征提取方法及相关装置,包括:获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征。由此可知,本发明实施例中由于将操作对象特征分成不同的层级,不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细,本发明实施例中可以从细粒度的操作对象特征层级中挖掘出细粒度的用户特征,从而满足一些需要使用细粒度用户特征的使用场景的需求。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种用户特征提取方法,其特征在于,包括:
获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;
从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;
针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征;
所述从所述用户在网络上的操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征的过程包括:
按照预先定义的分层类别方向以及分层粒度层级,从所述用户在网络上的操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,且操作对象特征的分层类别方向是由技术人员自定义的;
其中,在从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征之后还包括:对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值;
所述对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值包括,将所述同一层级中的所有操作对象特征分割成若干组成单元并建立图模型,利用投票机制对任一操作对象特征的重要性进行排序,根据两个操作对象之间边的关系权重、所有指向给定点的点集合和所述给定点指向的点的集合对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值。
2.根据权利要求1所述的方法,其特征在于,所述对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的过程包括:
确定不同层级中的操作对象特征在用户的活动日志中各自出现的次数;
确定所述不同层级中的操作对象特征各自在用户的活动日志中的重要性指标;
依据所述不同层级中的操作对象特征在用户的活动日志中各自出现的次数以及各自在用户的活动日志中的重要性指标,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值。
3.根据权利要求1-2任意一项所述的方法,其特征在于,所述对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的过程包括:
确定操作对象特征各自对应的操作行为的权重值;
依据所述操作对象特征各自对应的操作行为的权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
4.根据权利要求1-2任意一项所述的方法,其特征在于,所述对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的过程包括:
确定操作对象特征各自对应的操作行为发生的时间周期;
确定操作对象特征各自对应的预设的时间衰减权重值;
在操作对象特征各自对应的操作行为发生的时间周期内,依据操作对象特征各自对应的预设的时间衰减权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
5.根据权利要求1-2任意一项所述的方法,其特征在于,所述对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值的过程包括:
在用户的活动日志是由多个不同种类的数据源构成的情况下,分别确定不同层级的各操作对象特征所来自的目标数据源;
确定所述各个目标数据源在用户的活动日志中的多个不同种类的数据源中的数据源权重值;
依据所述各个数据源权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
6.一种用户特征提取装置,其特征在于,包括:
活动日志获取模块,用于获取用户的活动日志,所述活动日志中记录有用户网络操作过程中产生的操作行为;
操作对象特征提取模块,用于从所述操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,所述不同层级的操作对象特征随着层级数的降低,操作对象特征的数据粒度越细;
用户特征生成模块,用于针对同一层级的操作对象特征,依据所述操作对象特征对应的操作行为,生成用户特征;
所述操作对象特征提取模块包括:
操作对象特征提取子模块,用于按照预先定义的分层类别方向以及分层粒度层级,从所述用户在网络上的操作行为中分层提取与所述操作行为对应的操作对象特征,得到不同层级的操作对象特征,且操作对象特征的分层类别方向是由技术人员自定义的;
其中,操作对象特征评分模块,用于对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值;
所述对不同层级的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的分值包括,将所述同一层级中的所有操作对象特征分割成若干组成单元并建立图模型,利用投票机制对任一操作对象特征的重要性进行排序,根据两个操作对象之间边的关系权重、所有指向给定点的点集合和所述给定点指向的点的集合对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值。
7.根据权利要求6所述的装置,其特征在于,所述操作对象特征评分模块包括:
次数确定模块,用于确定不同层级中的操作对象特征在用户的活动日志中各自出现的次数;
重要性指标确定模块,用于确定所述不同层级中的操作对象特征各自在用户的活动日志中的重要性指标;
第一操作对象特征评分子模块,用于依据所述不同层级中的操作对象特征在用户的活动日志中各自出现的次数以及各自在用户的活动日志中的重要性指标,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的重要性分值。
8.根据权利要求6-7任意一项所述的装置,其特征在于,所述操作对象特征评分模块包括:
操作行为权重值确定模块,用于确定操作对象特征各自对应的操作行为的权重值;
第二操作对象特征评分子模块,用于依据所述操作对象特征各自对应的操作行为的权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
9.根据权利要求6-7任意一项所述的装置,其特征在于,所述操作对象特征评分模块包括:
时间周期确定模块,用于确定操作对象特征各自对应的操作行为发生的时间周期;
时间衰减权重值确定模块,用于确定操作对象特征各自对应的预设的时间衰减权重值;
第三操作对象特征评分子模块,用于在操作对象特征各自对应的操作行为发生的时间周期内,依据操作对象特征各自对应的预设的时间衰减权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
10.根据权利要求6-7任意一项所述的装置,其特征在于,所述操作对象特征评分模块包括:
目标数据源确定模块,用于在用户的活动日志是由多个不同种类的数据源构成的情况下,分别确定不同层级的各操作对象特征所来自的目标数据源;
数据源权重值确定模块,用于确定所述各个目标数据源在用户的活动日志中的多个不同种类的数据源中的数据源权重值;
第四操作对象特征评分子模块,用于依据所述各个数据源权重值与所述操作对象特征各自对应的重要性分值,对不同层级中的各操作对象特征进行评分,得到不同层级的各操作对象特征对应的用户偏好分值。
CN201610843241.1A 2016-09-22 2016-09-22 一种用户特征提取方法及相关装置 Active CN107862532B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610843241.1A CN107862532B (zh) 2016-09-22 2016-09-22 一种用户特征提取方法及相关装置
PCT/CN2017/102690 WO2018054328A1 (zh) 2016-09-22 2017-09-21 一种用户特征提取方法、装置及存储介质
US16/018,919 US20180307733A1 (en) 2016-09-22 2018-06-26 User characteristic extraction method and apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610843241.1A CN107862532B (zh) 2016-09-22 2016-09-22 一种用户特征提取方法及相关装置

Publications (2)

Publication Number Publication Date
CN107862532A CN107862532A (zh) 2018-03-30
CN107862532B true CN107862532B (zh) 2021-11-26

Family

ID=61690192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610843241.1A Active CN107862532B (zh) 2016-09-22 2016-09-22 一种用户特征提取方法及相关装置

Country Status (3)

Country Link
US (1) US20180307733A1 (zh)
CN (1) CN107862532B (zh)
WO (1) WO2018054328A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034876A (zh) * 2018-07-05 2018-12-18 天津璧合信息技术有限公司 一种行业画像分析方法及装置
CN110032860B (zh) * 2018-12-27 2020-07-28 阿里巴巴集团控股有限公司 登录方式的推送、展示方法、装置及设备
CN109729377B (zh) * 2019-01-02 2021-06-08 广州虎牙信息科技有限公司 一种主播信息的推送方法、装置、计算机设备和存储介质
CN109903127A (zh) * 2019-02-14 2019-06-18 广州视源电子科技股份有限公司 一种群组推荐方法、装置、存储介质及服务器
CN110363387B (zh) * 2019-06-14 2023-09-05 平安科技(深圳)有限公司 基于大数据的画像分析方法、装置、计算机设备及存储介质
CN110430471B (zh) * 2019-07-24 2021-05-07 山东海看新媒体研究院有限公司 一种基于瞬时计算的电视推荐方法和系统
CN111061773A (zh) * 2019-11-25 2020-04-24 深圳壹账通智能科技有限公司 数据统计方法及服务器
CN112488768A (zh) * 2020-12-10 2021-03-12 深圳市欢太科技有限公司 特征提取方法、特征提取装置、存储介质与电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014205231A1 (en) * 2013-06-19 2014-12-24 The Regents Of The University Of Michigan Deep learning framework for generic object detection
US9311386B1 (en) * 2013-04-03 2016-04-12 Narus, Inc. Categorizing network resources and extracting user interests from network activity

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758026A (en) * 1995-10-13 1998-05-26 Arlington Software Corporation System and method for reducing bias in decision support system models
US8732150B2 (en) * 2010-09-23 2014-05-20 Salesforce.Com, Inc. Methods and apparatus for suppressing network feed activities using an information feed in an on-demand database service environment
JP2015518210A (ja) * 2012-04-11 2015-06-25 シンガポール国立大学National University Of Singapore 製品に関連するデータを体系化する方法、装置及びコンピュータ読み取り可能な媒体
CN102685565B (zh) * 2012-05-18 2014-07-16 合一网络技术(北京)有限公司 一种点击反馈式个性化推荐系统
CN102946566B (zh) * 2012-10-24 2015-07-01 北京奇虎科技有限公司 基于历史信息的视频推荐方法和装置
US9002889B2 (en) * 2012-12-21 2015-04-07 Ebay Inc. System and method for social data mining that learns from a dynamic taxonomy
CN103914492B (zh) * 2013-01-09 2018-02-27 阿里巴巴集团控股有限公司 查询词融合方法、商品信息发布方法和搜索方法及系统
CN103440335B (zh) * 2013-09-06 2016-11-09 北京奇虎科技有限公司 视频推荐方法及装置
CN104090888B (zh) * 2013-12-10 2016-05-11 深圳市腾讯计算机系统有限公司 一种用户行为数据的分析方法和装置
US9600561B2 (en) * 2014-04-11 2017-03-21 Palo Alto Research Center Incorporated Computer-implemented system and method for generating an interest profile for a user from existing online profiles
US9479518B1 (en) * 2014-06-18 2016-10-25 Emc Corporation Low false positive behavioral fraud detection
WO2015196397A1 (zh) * 2014-06-25 2015-12-30 北京百付宝科技有限公司 一种基于用户搜索行为进行数据挖掘的方法和装置
US20160085850A1 (en) * 2014-09-23 2016-03-24 Kaybus, Inc. Knowledge brokering and knowledge campaigns
US20160125501A1 (en) * 2014-11-04 2016-05-05 Philippe Nemery Preference-elicitation framework for real-time personalized recommendation
US9740590B2 (en) * 2015-03-27 2017-08-22 International Business Machines Corporation Determining importance of an artifact in a software development environment
CN105718579B (zh) * 2016-01-22 2018-12-18 浙江大学 一种基于上网日志挖掘和用户活动识别的信息推送方法
CN105809474B (zh) * 2016-02-29 2020-11-17 深圳市未来媒体技术研究院 一种层次化商品信息过滤推荐方法
CN105574216A (zh) * 2016-03-07 2016-05-11 达而观信息科技(上海)有限公司 基于概率模型和用户行为分析的个性化推荐方法、系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311386B1 (en) * 2013-04-03 2016-04-12 Narus, Inc. Categorizing network resources and extracting user interests from network activity
WO2014205231A1 (en) * 2013-06-19 2014-12-24 The Regents Of The University Of Michigan Deep learning framework for generic object detection

Also Published As

Publication number Publication date
WO2018054328A1 (zh) 2018-03-29
CN107862532A (zh) 2018-03-30
US20180307733A1 (en) 2018-10-25

Similar Documents

Publication Publication Date Title
CN107862532B (zh) 一种用户特征提取方法及相关装置
US8412707B1 (en) Method and apparatus for distributing content
Harper et al. The movielens datasets: History and context
US9792366B2 (en) Content recommendation using third party profiles
US8407104B2 (en) Catalog based price search
US20160364762A1 (en) Method and system for creating an audience list based on user behavior data
US9195753B1 (en) Displaying interest information
CN108648010B (zh) 用于向用户提供内容的方法、系统及相应介质
US8498992B2 (en) Item selecting apparatus and method, and computer program
KR101865710B1 (ko) 소셜 네트워킹 엔진의 사용자들에게 콘텐츠를 다이렉팅하는 시스템 및 방법
US20120078725A1 (en) Method and system for contextual advertisement recommendation across multiple devices of content delivery
US20080071929A1 (en) Methods and apparatus for selection of information and web page generation
US20120030018A1 (en) Systems And Methods For Managing Electronic Content
JP2002520689A (ja) Tic:プライバシーを保護しながらターゲットコンテンツについての消費者属性の階層モデルを用いた、オンラインリポートのユーザ側面情報に基づく電子コンテンツのカスタマイズ化
US20130030909A1 (en) Customizable social campaigns
US20130262242A1 (en) Method and Apparatus for the Handling and Aggregation of Multimedia Contents, for the Creation and Distribution of Multimedia Aggregates and the Distribution of the Associated Advertising Revenue
CN106874314A (zh) 信息推荐的方法和装置
Ha et al. An analysis on information diffusion through BlogCast in a blogosphere
WO2008035044A2 (en) Methods and apparatus for selection of information and web page generation
US20240177184A1 (en) Self-learning valuation and access to digital content
Shokouhyar et al. Toward customer-centric mobile phone reverse logistics: using the DEMATEL approach and social media data
US20100131357A1 (en) System and method for controlling user and content interactions
GB2444284A (en) Method and apparatus for selection of information and web page generation
CN110555163A (zh) 用于使应用商店推荐个性化的技术
US20130339154A1 (en) System and method for assembling personalized offers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant