CN111339429B - 一种资讯推荐方法 - Google Patents

一种资讯推荐方法 Download PDF

Info

Publication number
CN111339429B
CN111339429B CN202010228414.5A CN202010228414A CN111339429B CN 111339429 B CN111339429 B CN 111339429B CN 202010228414 A CN202010228414 A CN 202010228414A CN 111339429 B CN111339429 B CN 111339429B
Authority
CN
China
Prior art keywords
information
user
tag
theme
current information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010228414.5A
Other languages
English (en)
Other versions
CN111339429A (zh
Inventor
肖剑
王鑫
赵泽俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinguniverse Intelligent Technology Group Co.,Ltd.
Original Assignee
Shanghai Jingyu Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jingyu Intelligent Technology Co ltd filed Critical Shanghai Jingyu Intelligent Technology Co ltd
Priority to CN202010228414.5A priority Critical patent/CN111339429B/zh
Publication of CN111339429A publication Critical patent/CN111339429A/zh
Application granted granted Critical
Publication of CN111339429B publication Critical patent/CN111339429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种资讯推荐方法,包括以下步骤:步骤S1:构建资讯画像;步骤S2:记录用户浏览行为,构建用户画像;步骤S3:根据用户画像和资讯画像得到用户对当前资讯的感兴趣程度,并根据感兴趣程度实时推荐资讯。与现有技术相比,增加推荐资讯匹配度,使资讯的推荐更加准确,且以服务为核心。

Description

一种资讯推荐方法
技术领域
本发明涉及资讯技术领域,尤其是涉及一种资讯推荐方法。
背景技术
目前,市面上有各类出游助手,表面上是内容服务平台,提供各类资讯和服务,但不管何种形式的资讯、何种服务方式,最终都会将用户引导到交易环节,内容只是交易完成前的导流路径,交易是内容服务的核心目的、是系统的核心诉求,是包着内容外衣的电商,以交易为核心的电商逻辑仍没有变,这类出游助手称为内容电商更为合适。真正做到以游客为中心、以服务为核心的出游助手系统尚未面世。
目前,缺少真正以服务为核心的、匹配度高且准确的资讯推荐方法。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种资讯推荐方法。
本发明的目的可以通过以下技术方案来实现:
一种资讯推荐方法,该方法包括以下步骤:
步骤S1:构建资讯画像;
步骤S2:记录用户浏览行为,构建用户画像;
步骤S3:根据用户画像和资讯画像得到用户对当前资讯的感兴趣程度,并根据感兴趣程度实时推荐资讯。
所述的资讯画像包括主题标签、主题标签的行为权重和资讯发表的时间。
所述的用户画像包括用户浏览过的资讯、点击资讯的次数和点击资讯的时间。
所述用户对当前资讯的感兴趣程度Lall为:
Figure BDA0002428507730000011
其中,i表示第i个主题标签,Ii为用户对当前资讯中第i个主题标签的感兴趣程度,m表示当前资讯中包含m个主题标签,tagi为用户对当前资讯中主题标签i的行为权重,TimeBias为当前资讯的时间惩罚项。
所述用户对当前资讯中第i个主题标签的感兴趣程度Ii表示为:
Figure BDA0002428507730000021
其中,Sim(i,j)表示主题标签i和主题标签j之间的相似性,S(i,k)表示和主题标签i最相似的k个主题标签,N表示用户浏览过的主题标签的集合。
所述主题标签i和主题标签j之间的相似性Sim(i,j)表示为:
Figure BDA0002428507730000022
其中,N(i)表示对主题标签i感兴趣的用户集合,N(j)表示对主题标签j感兴趣的用户集合。
所述用户对当前资讯中主题标签i的行为权重tagi表示为:
Figure BDA0002428507730000023
其中,n为用户浏览过的N篇资讯中的第n篇,tagni表示主题标签i在第n篇资讯中的行为权重,TimeBiasn表示第n篇资讯的时间惩罚项,TimeBiasq表示第q次点击有关主题标签i的资讯的时间惩罚项,q为小于10的有限个常数。
所述当前资讯的综合主题标签行为权重W为:
W=[tag1,tag2,...,tagi]×TimeBias i={1,2,...m,m∈R}
其中,i表示第i个主题标签,m表示当前资讯中包含m个主题标签,tagi为用户对当前资讯中主题标签i的行为权重,TimeBias为当前资讯的时间惩罚项。
与现有技术相比,本发明具有以下优点:
能够根据用户画像,进行资讯检索比对,并根据关联值展示资讯列表,从而增加推荐资讯匹配度,使资讯的推荐更加准确,且真正做到以服务为核心;进而提升资讯页打开率和用户粘性,最终可提升用户日活跃度和停留时长。
附图说明
图1为本发明的流程图;
图2为本发明实施例中资讯推荐结果示意图;
图3为本发明实施例中资讯推荐过程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
本实施例提供一种资讯推荐方法,包括以下步骤:
步骤S1:构建资讯画像;
步骤S2:记录用户浏览行为,构建用户画像;
步骤S3:根据用户画像和资讯画像得到用户对当前资讯的感兴趣程度,并根据感兴趣程度实时推荐资讯。
资讯画像包括主题标签、主题标签的行为权重和资讯发表的时间,用户画像包括用户浏览过的资讯、点击资讯的次数和点击资讯的时间。
每篇资讯按照不同的特色被赋予多个主题标签,一个主题标签代表一种旅游特色,主题标签如建筑、美食和文化等;每篇资讯的综合主题标签行为权重为:
W=[tag1,tag2,...,tagi]×TimeBias (1)
其中,W为综合主题标签行为权重,tagi为某一个主题标签的行为权重,TimeBias为时间惩罚项引入资讯的时效性,使得在主题标签行为权重相同时,新发布的资讯更容易被推荐给用户,是故越新发布的资讯时间惩罚项的值越大,越老旧的资讯时间惩罚项越小,i={1,2,...m,m∈R}。
根据用户画像推测出用户对当前资讯中第i个主题标签的感兴趣程度Ii,查找已有资讯中的相关主题标签的行为权重,则用户对当前资讯的感兴趣程度Lall为:
Figure BDA0002428507730000031
其中,i表示当前资讯中第i个主题标签,Ii为用户对当前资讯中第i个主题标签的感兴趣程度,m表示当前资讯中包含m个主题标签,tagi为用户对当前资讯中主题标签i的行为权重,TimeBias为当前资讯的时间惩罚项。
将所有的Lall从大到小排序,排在前面的对应资讯设定为针对该用户的重点推介特色。
图1中实线连接的资讯为用户点击浏览过的资讯,虚线连接的资讯为推荐给用户的资讯,U1、U2和U3分别表示用户1、用户2和用户3。虚线的推荐过程的一个示例如图2所示。
设用户1浏览了N篇旅游资讯涉及到m个主题标签,对于主题标签来说,在不同资讯里的行为权重可能是不一样的,用户1点击次数也可能是不一样的,故有:
Figure BDA0002428507730000041
其中,n为用户浏览过的N篇资讯中的第n篇,tagni表示主题标签i在第n篇资讯中的行为权重,tagni是已知的,TimeBiasn表示第n篇资讯的时间惩罚项,TimeBiasq表示第q次点击有关主题标签i的资讯的时间惩罚项,q为小于10的有限个常数,表示最近10次点击内,用户第q次点击了有关主题标签i的资讯,如果,最近10次内未点击与主题标签i相关的资讯,则关于q的求和项结果为0。
那么,用户对当前资讯中第i个主题标签的感兴趣程度Ii
Figure BDA0002428507730000042
Figure BDA0002428507730000043
其中,Sim(i,j)表示主题标签i和主题标签j之间的相似性,N(i)表示对主题标签i感兴趣的用户集合,N(j)表示对主题标签j感兴趣的用户集合,r(U,j)表示用户U对主题标签j的行为权重,S(i,k)表示和主题标签i最相似的k个主题标签,k的值可自行设定,S(i,k)可根据Sim(i,j)的大小得到,N(U)表示用户U浏览过的主题标签的集合。
将(1)(3)(4)(5)式代入(2)中,即可完成相关资讯推荐。
以下为一具体例子:
旅游资讯推荐需要的数据包括资讯的主题标签,主题标签的行为权重,以及资讯发表的时间。针对用户进行资讯推荐,需要的包含用户点击资讯次数、点击时间和用户浏览过的资讯。
每篇资讯的主题标签一般有多个(少数资讯只有一个主题标签),而这些主题标签是根据资讯中相应关键字而定的。
以为U1(即用户1)推荐资讯为例来说明资讯推荐的相关计算方法。
如表1所示,对于U1来说,涉及到三个主题标签,分别是:建筑、文化和美食。其中“文化”在U1点击的两篇资讯中都有出现。
根据公式(3)计算用户对主题标签的行为权重。
关于“建筑”的“用户对主题标签的行为权重”计算方式:
Figure BDA0002428507730000051
关于“文化”的“用户对主题标签的行为权重”计算方式为:
Figure BDA0002428507730000052
关于“美食”的“用户对主题标签的行为权重”计算方式为:
Figure BDA0002428507730000053
同理,可计算得知U2和U3的“用户对主题标签的行为权重”。
根据公式(5)可得知,各主题标签之间的相似性计算如下:
将建筑记为a,文化记为b,美食记为c,活动记为e,户外记为f,则:
Figure BDA0002428507730000054
同理:
Figure BDA0002428507730000055
Figure BDA0002428507730000056
Figure BDA0002428507730000057
分析用户对主题标签的感兴趣程度,可以根据公式(4)进行计算。
分析U1对于主题标签“建筑”(a)的感兴趣程度,此处假设S(i,k)中k取3。
Figure BDA0002428507730000058
其中,因为Sim(a,b)=Sim(a,c)=Sim(a,e)>Sim(a,f),S(a,3)为{a,b,c},N(U1)={a,b,c},那么:
Figure BDA0002428507730000059
同理,可得到U1对主题标签b、c、e、f的感兴趣程度,分别为:
Figure BDA0002428507730000061
Figure BDA0002428507730000062
因为,Ia>Ib=Ic>Ie>If,所以U1对主题标签a即主题标签“建筑”最为感兴趣。其次是主题标签“文化”和主题标签“美食”,以上三个主题标签均为U1的兴趣标签。
表1用户及标签的相关权重
Figure BDA0002428507730000063
然后,在资讯库内寻找包含主题标签为“建筑”或“文化”或“美食”的资讯,将相关信息代入公式(2)中,最后比较Lall值的大小,按从大到小排列,将Lall值大的资讯优先推荐给U1。

Claims (4)

1.一种资讯推荐方法,其特征在于,该方法包括以下步骤:
步骤S1:构建资讯画像;
步骤S2:记录用户浏览行为,构建用户画像;
步骤S3:根据用户画像和资讯画像得到用户对当前资讯的感兴趣程度,并根据感兴趣程度实时推荐资讯;
所述用户对当前资讯的感兴趣程度Lall为:
Figure FDA0003755151870000011
其中,i表示第i个主题标签,Ii为用户对当前资讯中第i个主题标签的感兴趣程度,m表示当前资讯中包含m个主题标签,tagi为用户对当前资讯中主题标签i的行为权重,TimeBias为当前资讯的时间惩罚项;
所述用户对当前资讯中第i个主题标签的感兴趣程度Ii表示为:
Figure FDA0003755151870000012
其中,Sim(i,j)表示主题标签i和主题标签j之间的相似性,S(i,k)表示和主题标签i最相似的k个主题标签,N表示用户浏览过的主题标签的集合;
所述主题标签i和主题标签j之间的相似性Sim(i,j)表示为:
Figure FDA0003755151870000013
其中,N(i)表示对主题标签i感兴趣的用户集合,N(j)表示对主题标签j感兴趣的用户集合;
所述用户对当前资讯中主题标签i的行为权重tagi表示为:
Figure FDA0003755151870000014
其中,n为用户浏览过的N篇资讯中的第n篇,tagni表示主题标签i在第n篇资讯中的行为权重,TimeBiasn表示第n篇资讯的时间惩罚项,TimeBiasq表示第q次点击有关主题标签i的资讯的时间惩罚项,q为小于10的有限个常数。
2.根据权利要求1所述的一种资讯推荐方法,其特征在于,所述的资讯画像包括主题标签、主题标签的行为权重和资讯发表的时间。
3.根据权利要求1所述的一种资讯推荐方法,其特征在于,所述的用户画像包括用户浏览过的资讯、点击资讯的次数和点击资讯的时间。
4.根据权利要求1所述的一种资讯推荐方法,其特征在于,所述当前资讯的综合主题标签行为权重W为:
W=[tag1,tag2,...,tagi]×TimeBias i={1,2,...m,m∈R}
其中,i表示第i个主题标签,m表示当前资讯中包含m个主题标签,tagi为用户对当前资讯中主题标签i的行为权重,TimeBias为当前资讯的时间惩罚项。
CN202010228414.5A 2020-03-27 2020-03-27 一种资讯推荐方法 Active CN111339429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010228414.5A CN111339429B (zh) 2020-03-27 2020-03-27 一种资讯推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010228414.5A CN111339429B (zh) 2020-03-27 2020-03-27 一种资讯推荐方法

Publications (2)

Publication Number Publication Date
CN111339429A CN111339429A (zh) 2020-06-26
CN111339429B true CN111339429B (zh) 2022-09-13

Family

ID=71182784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010228414.5A Active CN111339429B (zh) 2020-03-27 2020-03-27 一种资讯推荐方法

Country Status (1)

Country Link
CN (1) CN111339429B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326434B (zh) * 2021-06-15 2023-03-03 深圳前海微众银行股份有限公司 一种信息推荐方法、设备及存储介质
CN116089624B (zh) * 2022-11-17 2024-02-27 昆仑数智科技有限责任公司 基于知识图谱的数据推荐方法、装置和系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
CN106126582A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 推荐方法及装置
CN107844525A (zh) * 2017-10-12 2018-03-27 广州艾媒数聚信息咨询股份有限公司 一种基于用户行为的资讯个性化推荐方法、系统及装置
CN108846097A (zh) * 2018-06-15 2018-11-20 北京搜狐新媒体信息技术有限公司 用户的兴趣标签表示方法、文章推荐方法、及装置、设备
CN108920521A (zh) * 2018-06-04 2018-11-30 上海财经大学 基于伪本体的用户画像-项目推荐系统及方法
CN109493199A (zh) * 2019-01-04 2019-03-19 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109829108A (zh) * 2019-01-28 2019-05-31 北京三快在线科技有限公司 信息推荐方法、装置、电子设备及可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
CN106126582A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 推荐方法及装置
CN107844525A (zh) * 2017-10-12 2018-03-27 广州艾媒数聚信息咨询股份有限公司 一种基于用户行为的资讯个性化推荐方法、系统及装置
CN108920521A (zh) * 2018-06-04 2018-11-30 上海财经大学 基于伪本体的用户画像-项目推荐系统及方法
CN108846097A (zh) * 2018-06-15 2018-11-20 北京搜狐新媒体信息技术有限公司 用户的兴趣标签表示方法、文章推荐方法、及装置、设备
CN109493199A (zh) * 2019-01-04 2019-03-19 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109829108A (zh) * 2019-01-28 2019-05-31 北京三快在线科技有限公司 信息推荐方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN111339429A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN100465954C (zh) 用于搜索术语建议的多种类型数据的加强群集
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US7941383B2 (en) Maintaining state transition data for a plurality of users, modeling, detecting, and predicting user states and behavior
US9576251B2 (en) Method and system for processing web activity data
TWI636416B (zh) 內容個人化之多相排序方法和系統
CN1934569B (zh) 集成有用户注释的搜索系统和方法
US8612435B2 (en) Activity based users' interests modeling for determining content relevance
US8600979B2 (en) Infinite browse
US7519588B2 (en) Keyword characterization and application
CN101739467B (zh) 用于个人化网络搜索的方法和系统
CN102929939B (zh) 个性化信息的提供方法及装置
KR20030091751A (ko) 분배 데이터베이스의 문서 분류 및 제시용 방법 및 장치
US20170154116A1 (en) Method and system for recommending contents based on social network
CN101454771A (zh) 基于使用多媒体调查特征匹配以划分和标记个体的系统和方法
US20100161592A1 (en) Query Intent Determination Using Social Tagging
CN101317177A (zh) 确定内容提供商优先级的系统和方法
WO2008153625A2 (en) Recommendation systems and methods
KR20110048065A (ko) 사용자 소셜 정보를 사용하는 온라인 광고를 위한 시스템 및 방법
CN101216825A (zh) 标引关键词提取/预测方法、在线广告推荐方法和装置
CN111177538A (zh) 一种基于无监督权值计算的用户兴趣标签构建方法
CN111339429B (zh) 一种资讯推荐方法
JP4939637B2 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
CN110069713A (zh) 一种基于用户上下文感知的个性化推荐方法
CN112612951A (zh) 一种面向收益提升的无偏学习排序方法
US9064014B2 (en) Information provisioning device, information provisioning method, program, and information recording medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 201800 No. 6, Lane 129, Huajiang highway, Jiading District, Shanghai

Patentee after: Shanghai Jinguniverse Intelligent Technology Group Co.,Ltd.

Address before: 201800 No. 6, Lane 129, Huajiang highway, Jiading District, Shanghai

Patentee before: Shanghai Jingyu Intelligent Technology Co.,Ltd.