CN107480227A - 一种基于大数据的信息推送方法 - Google Patents

一种基于大数据的信息推送方法 Download PDF

Info

Publication number
CN107480227A
CN107480227A CN201710654955.2A CN201710654955A CN107480227A CN 107480227 A CN107480227 A CN 107480227A CN 201710654955 A CN201710654955 A CN 201710654955A CN 107480227 A CN107480227 A CN 107480227A
Authority
CN
China
Prior art keywords
content
user
information
pushed
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710654955.2A
Other languages
English (en)
Inventor
张凡伊
张剑
冯焕霞
邹雅欣
寇慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Academy Of South Data Sciences
Original Assignee
Foshan Academy Of South Data Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Academy Of South Data Sciences filed Critical Foshan Academy Of South Data Sciences
Priority to CN201710654955.2A priority Critical patent/CN107480227A/zh
Publication of CN107480227A publication Critical patent/CN107480227A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于大数据的信息推送方法,包括如下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;提取每个用户的历史信息中的关键词,并获取所述关键词对应用户的初始权重;根据用户与各其他用户之间的数据传输记录,计算各其他用户对所述用户的关联权重。本发明通过用户与各其他用户之间的数据传输记录,计算出各其他用户对所述用户的关联权重,最后再根据所述初始权重及所述关联权重,计算出所述关键词对应所述用户的关联后权重,并根据所述关联后权重为用户推送匹配的信息,准确率高。

Description

一种基于大数据的信息推送方法
技术领域
本发明涉及一种推送方法,具体是一种基于大数据的信息推送方法。
背景技术
互联网快速增长的信息使得用户发现有价值信息愈发困难,从而使得信息推送系统成为当今学术最为活跃的研究领域之一。信息推送系统力图辅助用户发现潜在喜欢的音乐、电影、商品、App等。一些信息推送系统根据用户信息和商品信息进行学习,使得用户更喜欢的商品拥有更高的权重。当有大量用户信息可供使用时,信息推送系统可以提供个性化的推送结果。例如为软件工作者推送软件类书籍,而为艺术工作者提供艺术类书籍等。然而,用户的兴趣和偏好在很多情况下是随时间变化的。当前的信息推送系统在向用户推送信息时,缺乏考虑用户兴趣和偏好的特点,信息推送的准确性较差。
发明内容
本发明的目的在于提供一种基于大数据的信息推送方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于大数据的信息推送方法,包括如下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;提取每个用户的历史信息中的关键词,并获取所述关键词对应用户的初始权重;根据用户与各其他用户之间的数据传输记录,计算各其他用户对所述用户的关联权重;根据所述初始权重及所述关联权重,计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测结果对所述关联系数进行修正;根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应的待推送内容推送给所述目标用户。
作为本发明进一步的方案:所述待推送内容的特征信息包括:待推送内容的类别,待推送内容的页面浏览量与各个待推送内容的平均页面浏览量的比例,待推送内容不同时段内的页面浏览量,待推送内容的不同时段内的页面浏览量的变化率,待推送内容的生成时间,待推送内容的页面浏览量对应的时间信息,待推送内容在网页中的展示位置,所述用户转发其他用户的发布信息的记录,所述用户评论其他用户的发布信息的记录,所述用户引用其他用户的发布信息的记录,以及所述用户与其他用户的链接记录。
作为本发明进一步的方案:根据所述特征信息构建内容特征向量的步骤包括:从数据库中提取待推送内容的特征信息;根据所述特征信息对待推送内容进行建模,得到所述待推送内容的模型;根据所述模型构建内容特征向量。
作为本发明再进一步的方案:所述历史操作信息包括:查看、复制、粘贴、删除、保存。
作为本发明再进一步的方案:还包括统计推广信息的正确率,具体为:根据每个识别码所对应的客户端,调用该客户端浏览所对应的推广信息,根据用户的点击记录筛选该类推广信息的预计投放总数,计算该推广信息的投放正确率。
作为本发明再进一步的方案:还包括计推广信息的错误率,具体为:根据每个识别码所对应的客户端,调用该客户端浏览所对应的推广信息,根据用户的点击记录筛选该类推广信息的预计投放总数,计算该推广信息的投放错误率。
与现有技术相比,本发明的有益效果是:本发明通过用户与各其他用户之间的数据传输记录,计算出各其他用户对所述用户的关联权重,最后再根据所述初始权重及所述关联权重,计算出所述关键词对应所述用户的关联后权重,并根据所述关联后权重为用户推送匹配的信息,准确率高。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,一种基于大数据的信息推送方法,包括如下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;提取每个用户的历史信息中的关键词,并获取所述关键词对应用户的初始权重;根据用户与各其他用户之间的数据传输记录,计算各其他用户对所述用户的关联权重;根据所述初始权重及所述关联权重,计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测结果对所述关联系数进行修正;根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应的待推送内容推送给所述目标用户。所述待推送内容的特征信息包括:待推送内容的类别,待推送内容的页面浏览量与各个待推送内容的平均页面浏览量的比例,待推送内容不同时段内的页面浏览量,待推送内容的不同时段内的页面浏览量的变化率,待推送内容的生成时间,待推送内容的页面浏览量对应的时间信息,待推送内容在网页中的展示位置,所述用户转发其他用户的发布信息的记录,所述用户评论其他用户的发布信息的记录,所述用户引用其他用户的发布信息的记录,以及所述用户与其他用户的链接记录。根据所述特征信息构建内容特征向量的步骤包括:从数据库中提取待推送内容的特征信息;根据所述特征信息对待推送内容进行建模,得到所述待推送内容的模型;根据所述模型构建内容特征向量。所述历史操作信息包括:查看、复制、粘贴、删除、保存。
本发明还包括统计推广信息的正确率,具体为:根据每个识别码所对应的客户端,调用该客户端浏览所对应的推广信息,根据用户的点击记录筛选该类推广信息的预计投放总数,计算该推广信息的投放正确率。
本发明还包括计推广信息的错误率,具体为:根据每个识别码所对应的客户端,调用该客户端浏览所对应的推广信息,根据用户的点击记录筛选该类推广信息的预计投放总数,计算该推广信息的投放错误率。
本发明通过用户与各其他用户之间的数据传输记录,计算出各其他用户对所述用户的关联权重,最后再根据所述初始权重及所述关联权重,计算出所述关键词对应所述用户的关联后权重,并根据所述关联后权重为用户推送匹配的信息,准确率高。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (6)

1.一种基于大数据的信息推送方法,其特征在于,包括如下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;提取每个用户的历史信息中的关键词,并获取所述关键词对应用户的初始权重;根据用户与各其他用户之间的数据传输记录,计算各其他用户对所述用户的关联权重;根据所述初始权重及所述关联权重,计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测结果对所述关联系数进行修正;根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应的待推送内容推送给所述目标用户。
2.根据权利要求1所述的基于大数据的信息推送方法,其特征在于,所述待推送内容的特征信息包括:待推送内容的类别,待推送内容的页面浏览量与各个待推送内容的平均页面浏览量的比例,待推送内容不同时段内的页面浏览量,待推送内容的不同时段内的页面浏览量的变化率,待推送内容的生成时间,待推送内容的页面浏览量对应的时间信息,待推送内容在网页中的展示位置,所述用户转发其他用户的发布信息的记录,所述用户评论其他用户的发布信息的记录,所述用户引用其他用户的发布信息的记录,以及所述用户与其他用户的链接记录。
3.根据权利要求1所述的基于大数据的信息推送方法,其特征在于,根据所述特征信息构建内容特征向量的步骤包括:从数据库中提取待推送内容的特征信息;根据所述特征信息对待推送内容进行建模,得到所述待推送内容的模型;根据所述模型构建内容特征向量。
4.根据权利要求1所述的基于大数据的信息推送方法,其特征在于,所述历史操作信息包括:查看、复制、粘贴、删除、保存。
5.根据权利要求1所述的基于大数据的信息推送方法,其特征在于,还包括统计推广信息的正确率,具体为:根据每个识别码所对应的客户端,调用该客户端浏览所对应的推广信息,根据用户的点击记录筛选该类推广信息的预计投放总数,计算该推广信息的投放正确率。
6.根据权利要求1所述的基于大数据的信息推送方法,其特征在于,还包括计推广信息的错误率,具体为:根据每个识别码所对应的客户端,调用该客户端浏览所对应的推广信息,根据用户的点击记录筛选该类推广信息的预计投放总数,计算该推广信息的投放错误率。
CN201710654955.2A 2017-07-28 2017-07-28 一种基于大数据的信息推送方法 Pending CN107480227A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710654955.2A CN107480227A (zh) 2017-07-28 2017-07-28 一种基于大数据的信息推送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710654955.2A CN107480227A (zh) 2017-07-28 2017-07-28 一种基于大数据的信息推送方法

Publications (1)

Publication Number Publication Date
CN107480227A true CN107480227A (zh) 2017-12-15

Family

ID=60596936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710654955.2A Pending CN107480227A (zh) 2017-07-28 2017-07-28 一种基于大数据的信息推送方法

Country Status (1)

Country Link
CN (1) CN107480227A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108762804A (zh) * 2018-04-24 2018-11-06 阿里巴巴集团控股有限公司 灰度发布新产品的方法和装置
CN108933819A (zh) * 2018-06-26 2018-12-04 尹煦 一种基于区块链的信息推送方法
CN109993583A (zh) * 2019-04-02 2019-07-09 深圳市腾讯信息技术有限公司 信息推送方法和装置、存储介质及电子装置
CN110213606A (zh) * 2019-05-30 2019-09-06 上海云甫智能科技有限公司 一种直播平台内容推荐方法及系统
CN113327154A (zh) * 2021-06-18 2021-08-31 苏州易卖东西信息技术有限公司 基于大数据的电商用户讯息推送方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799623A (zh) * 2012-06-21 2012-11-28 杜小勇 信息推送方法
US20140379516A1 (en) * 2013-06-19 2014-12-25 Thomson Licensing Context based recommender system
CN105338076A (zh) * 2015-10-21 2016-02-17 重庆微客巴巴信息技术有限公司 信息推送系统
CN105787061A (zh) * 2016-02-29 2016-07-20 广东顺德中山大学卡内基梅隆大学国际联合研究院 信息推送方法
CN105808685A (zh) * 2016-03-02 2016-07-27 腾讯科技(深圳)有限公司 推广信息的推送方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799623A (zh) * 2012-06-21 2012-11-28 杜小勇 信息推送方法
US20140379516A1 (en) * 2013-06-19 2014-12-25 Thomson Licensing Context based recommender system
CN105338076A (zh) * 2015-10-21 2016-02-17 重庆微客巴巴信息技术有限公司 信息推送系统
CN105787061A (zh) * 2016-02-29 2016-07-20 广东顺德中山大学卡内基梅隆大学国际联合研究院 信息推送方法
CN105808685A (zh) * 2016-03-02 2016-07-27 腾讯科技(深圳)有限公司 推广信息的推送方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108762804A (zh) * 2018-04-24 2018-11-06 阿里巴巴集团控股有限公司 灰度发布新产品的方法和装置
CN108762804B (zh) * 2018-04-24 2021-11-19 创新先进技术有限公司 灰度发布新产品的方法和装置
CN108933819A (zh) * 2018-06-26 2018-12-04 尹煦 一种基于区块链的信息推送方法
CN109993583A (zh) * 2019-04-02 2019-07-09 深圳市腾讯信息技术有限公司 信息推送方法和装置、存储介质及电子装置
CN109993583B (zh) * 2019-04-02 2021-07-27 深圳市腾讯信息技术有限公司 信息推送方法和装置、存储介质及电子装置
CN110213606A (zh) * 2019-05-30 2019-09-06 上海云甫智能科技有限公司 一种直播平台内容推荐方法及系统
CN113327154A (zh) * 2021-06-18 2021-08-31 苏州易卖东西信息技术有限公司 基于大数据的电商用户讯息推送方法及系统
CN113327154B (zh) * 2021-06-18 2022-05-13 苏州极易科技股份有限公司 基于大数据的电商用户讯息推送方法及系统

Similar Documents

Publication Publication Date Title
CN107480227A (zh) 一种基于大数据的信息推送方法
CN110909176B (zh) 数据推荐方法、装置、计算机设备以及存储介质
CN102902691B (zh) 推荐方法及系统
CN103329151B (zh) 基于话题聚类的推荐
AU2004262302B2 (en) Methods and systems for understanding a meaning of a knowledge item using information associated with the knowledge item
US7908184B2 (en) Method of providing customized information of commodity for on-line shopping mall users
CN111259263B (zh) 一种物品推荐方法、装置、计算机设备及存储介质
CN107729937A (zh) 用于确定用户兴趣标签的方法及装置
CN107392049A (zh) 一种基于差分隐私保护的推荐方法
WO2018014771A1 (zh) 一种数据对象推送的方法、装置及系统
US20130173524A1 (en) Extracting predictive segments from sampled data
CN105205689A (zh) 推荐商户的方法及系统
CN106447463A (zh) 一种基于马尔科夫决策过程模型的商品推荐方法
CN107005599A (zh) 改善位置传感器查准率的系统和方法
CN104992348B (zh) 一种信息展示的方法和装置
CN107205042B (zh) 一种信息精准推送方法及系统
CN107730337A (zh) 信息推送方法和装置
CN115917577A (zh) 使用动态属性建模进行下一个篮子推荐的系统和方法
CN109961080A (zh) 终端识别方法及装置
CN110175895A (zh) 一种物品推荐方法及装置
CN114663197A (zh) 商品推荐方法及其装置、设备、介质、产品
WO2023142520A1 (zh) 信息推荐方法及装置
CN110689402A (zh) 推荐商家的方法、装置、电子设备及可读存储介质
US20190392478A1 (en) Automated Generation of Personalized Mail
CN103810262B (zh) 信息推荐方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171215