CN112989185B - 信息推送方法、装置、计算机设备及存储介质 - Google Patents

信息推送方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112989185B
CN112989185B CN202110206455.9A CN202110206455A CN112989185B CN 112989185 B CN112989185 B CN 112989185B CN 202110206455 A CN202110206455 A CN 202110206455A CN 112989185 B CN112989185 B CN 112989185B
Authority
CN
China
Prior art keywords
click
page
click event
difference value
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110206455.9A
Other languages
English (en)
Other versions
CN112989185A (zh
Inventor
顾聪聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Health Insurance Company of China Ltd
Original Assignee
Ping An Health Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Health Insurance Company of China Ltd filed Critical Ping An Health Insurance Company of China Ltd
Priority to CN202110206455.9A priority Critical patent/CN112989185B/zh
Publication of CN112989185A publication Critical patent/CN112989185A/zh
Application granted granted Critical
Publication of CN112989185B publication Critical patent/CN112989185B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及关系网络分析领域,揭露了一种信息推送方法、装置、设备及介质。该方法通过自用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件;将页面点击事件以及待匹配点击事件输入至正序相似度确定模型,令正序相似度确定模型根据第一位置信息差值,确定正序相似度;将页面点击事件以及待匹配点击事件输入至逆序相似度确定模型,令逆序相似度确定模型根据第二位置信息差值,确定逆序相似度;将与同一待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为待匹配点击事件与页面点击事件之间的总相似度;在所有历史点击事件均被选取完毕之后,将与最大的总相似度对应的历史点击事件推送至目标用户。本发明提高信息推送准确率。

Description

信息推送方法、装置、计算机设备及存储介质
技术领域
本发明涉及关系网络分析领域,尤其涉及一种信息推送方法、装置、计算机设备及存储介质。
背景技术
随着信息技术和互联网的发展,针对于各类产品,应用程序,活动信息等均存在相应的推荐系统,进而缩短用户寻找各类信息的时间,从而提升用户体验。
目前,各个推荐系统在向目标用户进行信息推送时,一般会选取热门信息或者热门产品向目标用户进行推送,但是推荐系统设计的初衷是使得各个物品均存在被推送的可能性,进而导致非热门信息或者非热门商品无法准确推送至对应的目标用户,降低了推荐系统的推荐准确率,且降低了用户体验。
发明内容
本发明实施例提供一种信息推送方法、装置、计算机设备及存储介质,以解决推荐系统的推荐准确率低的问题。
一种信息推送方法,包括:
在检测到目标用户触发页面点击事件时,获取用户行为序列;所述用户行为序列中包含所述页面点击事件,以及在所述页面点击事件之前基于历史点击时间顺序排列的多个历史点击事件;一个所述历史点击事件以及所述页面点击事件均关联一个位置信息;
自所述用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件;
将所述页面点击事件以及所述待匹配点击事件输入至正序相似度确定模型,令所述正序相似度确定模型根据第一位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的正序相似度;所述第一位置信息差值指的是所述待匹配点击事件的位置信息与所述页面点击事件的位置信息之间的差值;
将所述页面点击事件以及所述待匹配点击事件输入至逆序相似度确定模型,令所述逆序相似度确定模型根据第二位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的逆序相似度;所述第二位置信息差值指的是所述页面点击事件的位置信息与所述待匹配点击事件的位置信息之间的差值;
将与同一所述待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为所述待匹配点击事件与页面点击事件之间的总相似度;
在所有所述历史点击事件均被选取完毕之后,将与最大的所述总相似度对应的历史点击事件推送至所述目标用户。
一种信息推送装置,包括:
用户行为序列获取模块,用于在检测到目标用户触发页面点击事件时,获取用户行为序列;所述用户行为序列中包含所述页面点击事件,以及在所述页面点击事件之前基于历史点击时间顺序排列的多个历史点击事件;一个所述历史点击事件以及所述页面点击事件均关联一个位置信息;
点击事件选取模块,用于自所述用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件;
正序相似度确定模块,用于将所述页面点击事件以及所述待匹配点击事件输入至正序相似度确定模型,令所述正序相似度确定模型根据第一位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的正序相似度;所述第一位置信息差值指的是所述待匹配点击事件的位置信息与所述页面点击事件的位置信息之间的差值;
逆序相似度确定模块,用于将所述页面点击事件以及所述待匹配点击事件输入至逆序相似度确定模型,令所述逆序相似度确定模型根据第二位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的逆序相似度;所述第二位置信息差值指的是所述页面点击事件的位置信息与所述待匹配点击事件的位置信息之间的差值;
总相似度确定模块,用于将与同一所述待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为所述待匹配点击事件与页面点击事件之间的总相似度;
事件推送模块,用于在所有所述历史点击事件均被选取完毕之后,将与最大的所述总相似度对应的历史点击事件推送至所述目标用户。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信息推送方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息推送方法。
上述信息推送方法、装置、计算机设备及存储介质,该方法通过在检测到目标用户触发页面点击事件时,获取用户行为序列;所述用户行为序列中包含所述页面点击事件,以及在所述页面点击事件之前基于历史点击时间顺序排列的多个历史点击事件;一个所述历史点击事件以及所述页面点击事件均关联一个位置信息;自所述用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件;将所述页面点击事件以及所述待匹配点击事件输入至正序相似度确定模型,令所述正序相似度确定模型根据第一位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的正序相似度;所述第一位置信息差值指的是所述待匹配点击事件的位置信息与所述页面点击事件的位置信息之间的差值;将所述页面点击事件以及所述待匹配点击事件输入至逆序相似度确定模型,令所述逆序相似度确定模型根据第二位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的逆序相似度;所述第二位置信息差值指的是所述页面点击事件的位置信息与所述待匹配点击事件的位置信息之间的差值;将与同一所述待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为所述待匹配点击事件与页面点击事件之间的总相似度;在所有所述历史点击事件均被选取完毕之后,将与最大的所述总相似度对应的历史点击事件推送至所述目标用户。
本发明通过引入用户序列中各点击事件之间的正序相似度以及逆序相似度,综合考虑各点击事件之间的先后关联程度,进而提高信息推送准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中信息推送方法的一应用环境示意图;
图2是本发明一实施例中信息推送方法的一流程图;
图3是本发明一实施例中信息推送方法中步骤S30的一流程图;
图4是本发明一实施例中信息推送方法中步骤S301的一流程图;
图5是本发明一实施例中信息推送装置的一原理框图;
图6是本发明一实施例中信息推送装置中正序相似度确定模块的一原理框图;
图7是本发明一实施例中信息推送装置中特征提取单元的一原理框图;
图8是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的信息推送方法,该信息推送方法可应用如图1所示的应用环境中。具体地,该信息推送方法应用在信息推送系统中,该信息推送系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决推荐系统的推荐准确率低的问题。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种信息推送方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10:在检测到目标用户触发页面点击事件时,获取用户行为序列;所述用户行为序列中包含所述页面点击事件,以及在所述页面点击事件之前基于历史点击时间顺序排列的多个历史点击事件;一个所述历史点击事件以及所述页面点击事件均关联一个位置信息。
可以理解地,目标用户可以为正在浏览页面(该页面可以为任意页面,如购物页面、搜索页面等)的用户。页面点击事件指的是目标用户在当前浏览页面触发的动作信息,示例性地,页面点击事件可以为目标用户打开一个新的网页,亦或者目标用户点击网页中某个物品信息或者文字信息等。历史点击事件指的是目标用户历史浏览页面触发的动作信息,一个历史点击事件关联一个历史点击时间。位置信息表征历史点击事件或者页面点击事件处于用户行为序列的位置。在用户行为序列中,可以将各历史点击事件按照历史点击时间从先后顺序插入用户行为序列中,进而将页面点击事件插入至各历史点击事件的尾端。
S20:自所述用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件。
具体地,在检测到目标用户触发页面点击事件时,获取用户行为序列之后,自用户行为序列中随机选取一个历史点击事件,并将该被选取的历史点击事件记录为待匹配点击事件。
S30:将所述页面点击事件以及所述待匹配点击事件输入至正序相似度确定模型,令所述正序相似度确定模型根据第一位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的正序相似度;所述第一位置信息差值指的是所述待匹配点击事件的位置信息与所述页面点击事件的位置信息之间的差值。
其中,正序相似度确定模型可以为基于神经网络构建的模型,该正序相似度确定模型用于确定页面点击事件与待匹配点击事件之间的正序相似度。可以理解地,正序相似度指的是在待匹配点击事件触发之后,触发的页面点击事件与该待匹配点击事件之间的相似度,也即待匹配点击事件发生在页面点击事件之前。
在一实施例中,如图3所示,所述历史点击事件以及所述页面点击事件均关联一个页面信息;所述正序相似度确定模型关联正序权重;步骤S30中,包括:
S301:对所述待匹配点击事件关联的页面信息进行特征提取,得到待匹配特征信息;同时,对所述页面点击事件关联的页面信息进行特征提取,得到目标特征信息。
示例性地,待匹配特征信息可以为与待匹配点击事件关联的页面信息的图片信息(如购物页面中的商品图片),或者文字信息(如购物页面中的标题、文字等);目标特征信息可以为与页面点击事件关联的页面信息的图片信息,或者文字信息。进一步地,对待匹配点击事件亦或者页面点击事件的页面信息进行特征提取可以采用如下方法:seletors、scrapy shell、xpath、css、BeautifulSoup等,上述方法可以配置在正序相似度确定模型中。
进一步地,如图4所示,在一具体实施方式中,所述页面信息中包括图片信息以及标题信息;步骤S301中,包括:
S3011:获取所述图片信息的命名信息,并对所述命名信息进行文字识别,得到与所述命名信息对应的命名特征。
可以理解地,图片信息指的是在用户将图片信息上传至页面供其它用户浏览之前,会对图片信息进行命名,例如,在购物页面中,将一个商品上传至网页上之前,需要对该商品对应的图片信息进行命名,也即命名信息是预先通过人工命名的方式生成的;进而在将待匹配点击事件输入至正序相似度确定模型之后,获取待匹配点击事件的图片信息,以获取与图片信息对应的命名信息,并对该命名信息进行文字识别,得到与命名信息对应的命名特征。其中,文字识别可以采用如CNN(Convolutional Neural Networks,卷积神经网络)、RNN(Recurrent Neural Network,循环神经网络)等神经网络实现。
S3012:对所述标题信息进行文字识别,得到与所述标题信息对应的标题特征。
可以理解地,标题信息指的是网页中由网页发布者在标题栏中输入的文字信息,标题特征即为对标题信息进行文字识别后得到的特征信息。
S3013:对所述命名特征以及所述标题特征进行归一化处理,得到所述待匹配特征信息。
可以理解地,由于对于图片信息的命名方式,与对标题信息的命名方式可能存在不同,因此为了得到更优的待匹配特征信息,进而需要对命名特征以及标题特征进行归一化处理,统一命名特征以及标题特征,提高后续特征相似度的计算,或者模型的处理的速率。
S302:确定所述待匹配特征信息与所述目标特征信息之间的特征相似度。
可以理解地,特征相似度指的是待匹配特征信息与目标特征信息之间的相似程度,该特征相似度可以通过余弦相似度函数确定,特征相似度的取值范围为0至1。
S303:将所述待匹配点击事件对应的历史点击时间与所述页面点击事件的页面点击时间之间的差值记录为第一时间差值。
可以理解地,第一时间差值指的是历史点击时间与页面点击时间之间的时间差,信息推送需要考虑各个页面点击发生的先后顺序,示例性地,一般用户在购买电脑时,应先浏览相关的电脑信息,再考虑购买其余配件,因此时间维度对于信息推送也应纳入考虑,进而提高信息推送的准确性。
S304:根据所述特征相似度、所述第一时间差值、所述第一位置信息差值以及所述正序权重,确定所述正序相似度。
具体地,在确定特征相似度以及第一时间差值之后,根据特征相似度、第一时间差值、第一位置信息差值以及正序权重,确定正序相似度。
在一实施例中,步骤S304包括:
通过下述表达式确定所述正序相似度:
其中,Wij表征用户行为序列中第i个位置信息上的历史点击事件与处于第j个位置信息上的页面点击事件之间的正序相似度;M为正序权重;cos(i,j)为特征相似度;X为位置信息的权重衰减值(X需要满足小于1);uloc(i)-uloc(j)为第一位置信息差值;utime(i)-utime(j)为第一时间差值;click(u)表征目标用户u的用户行为序列中历史点击事件的总数;N(i)为所有点击第i位置上事件的用户集合;N(j)为所有点击第j位置上事件的用户集合。
可以理解地,在本实施例中,除了引入各历史点击事件与页面点击事件的正序相似度之外,还引入了所有用户点击待匹配点击事件的次数,以及用户点击页面点击事件的次数,但是可能由于待匹配点击事件,亦或者页面点击事件中存在高频点击事件(如10000个用户中触发过待匹配点击事件的用户数为9000人),亦或者低频点击事件(如10000个用户中触发过待匹配点击事件的用户数为10人),进而在一般的信息推送系统中,则会更倾向性选择高频点击事件作为推送对象推送至目标用户中,而忽略的一些低频点击事件与目标用户的页面点击事件的相关性,因此本实施例中,引入二次方根的方式(如上述表达式中的),进而去除高频点击事件亦或者低频点击事件对正序相似度带来的影响,进而提高信息推送的准确率,并且扩大了信息推送的范围。此外,log(1+click(u))也对活跃用户的权重进行惩罚。例如,一个用户点击了当当80%的书籍,那么他的喜好对于模型而言重要性较低,因为该用户浏览爱好的页面过多,该用户的喜好对于模型的参考性不大(用户活跃度越高,对模型的影响越低)。
S40:将所述页面点击事件以及所述待匹配点击事件输入至逆序相似度确定模型,令所述逆序相似度确定模型根据第二位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的逆序相似度;所述第二位置信息差值指的是所述页面点击事件的位置信息与所述待匹配点击事件的位置信息之间的差值。
其中,逆序相似度确定模型可以为基于神经网络构建的模型,该逆序相似度确定模型用于确定页面点击事件与待匹配点击事件之间的逆序相似度。逆序相似度模型关联逆序权重,优选地,逆序相似度模型的逆序权重小于正序相似度模型的正序权重。
可以理解地,逆序相似度指的是在页面点击事件触发之后,触发的待匹配点击事件与该页面点击事件之间的相似度,也即待匹配点击事件发生在页面点击事件之后。
具体地,在自所述用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件之后,将页面点击事件以及待匹配点击事件输入至逆序相似度确定模型中,对待匹配点击事件关联的页面信息进行特征提取,得到待匹配特征信息;同时,对页面点击事件关联的页面信息进行特征提取,得到目标特征信息,进而确定待匹配特征信息与目标特征信息之间的特征相似度;将所述页面点击事件对应的页面点击时间与所述历史点击事件的历史点击时间之间的差值记录为第二时间差值,进而根据所述特征相似度、第二时间差值、第二位置信息差值以及逆序权重,确定所述逆序相似度。
在一具体实施例中,可以根据下述表达式确定逆序相似度:
其中,Wji表征用户行为序列中第i个位置信息上的历史点击事件(也即被选取的待匹配点击事件)与处于第j个位置信息上的页面点击事件之间的逆序相似度;N为逆序权重;cos(i,j)为特征相似度;X为位置信息的权重衰减值;uloc(j)-uloc(i)为第二位置信息差值;utime(j)-utime(i)为第二时间差值;click(u)表征目标用户u的用户行为序列中历史点击事件的总数;N(i)为所有点击第i位置上事件的用户集合;N(j)为所有点击第j位置上事件的用户集合。
S50:将与同一所述待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为所述待匹配点击事件与页面点击事件之间的总相似度。
可以理解地,在确定页面点击事件与待匹配点击事件之间的正序相似度,以及确定页面点击事件与待匹配点击事件之间的逆序相似度之后,将与同一待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为待匹配点击事件与页面点击事件之间的总相似度,也即每一个待匹配点击事件均存在一个对应的总相似度。
S60:在所有所述历史点击事件均被选取完毕之后,将与最大的所述总相似度对应的历史点击事件推送至所述目标用户。
具体地,在用户行为序列中所有历史点击事件均被选取记录为待匹配点击事件,并最终确定待匹配点击事件与页面点击事件之间的总相似度之后,将与最大的总相似度对应的历史点击事件推送至目标用户中。示例性地,将最大的总相似度对应的历史点击事件推送至目标用户可以通过如下方式:将历史点击事件以弹窗方式,在目标用户的当前浏览页面的任意一方弹出;亦或者将历史点击事件的网页链接发送至目标用户的移动终端中等。
在本实施例中,通过引入用户序列中各点击事件之间的正序相似度以及逆序相似度,综合考虑各点击事件之间的先后关联程度,进而提高信息推送准确率。
在一实施例中,页面点击事件关联页面点击时间,步骤S10之前,也即所述获取用户行为序列之前,还包括:
S01:获取所述目标用户的历史行为数据;所述历史行为数据关联一个历史点击时间。
可以理解地,历史行为数据指的是目标用户历史浏览页面的记录,一个历史行为数据关联一个历史点击时间;历史点击时间也即目标用户生成历史行为数据的时间点。
S02:将各所述历史行为数据按照所述历史点击时间顺序插入行为数据序列中。
可以理解地,在获取目标用户的历史行为数据之后,将各历史行为数据按照历史点击时间顺序插入至行为数据序列中,可以按照历史点击时间从先至后的顺序,也可以按照历史点击时间从后至先的顺序。
S03:将各所述历史行为数据的历史点击时间与所述页面点击事件对应的页面点击时间之间的差值记录为点击时间差值。
可以理解地,在获取目标用户的历史行为数据之后,将各历史行为数据的历史点击时间与页面点击事件对应的页面点击时间之间的差值记录为点击时间差值。
S04:将各所述点击时间差值与时间差值阈值进行比较,并自所述行为数据序列中,剔除大于或等于所述时间差值阈值的点击时间差值对应的历史行为数据。
可选地,时间差值阈值可以根据具体应用需求进行选择,示例性地,该时间差值阈值可以为5天、10天等。
具体地,在将各所述历史行为数据的历史点击时间与所述页面点击事件对应的页面点击时间之间的差值记录为点击时间差值之后,将各点击时间差值与时间差值阈值进行比较,并自行为数据序列中,剔除大于或等于时间差值阈值的点击时间差值对应的历史行为数据。示例性地,假设时间差值阈值为10天,一个点击时间差值为15天,则与该点击时间差值对应的历史行为数据则应从行为数据序列中被剔除。
S05:将剔除之后的行为数据序列记录为所述用户行为序列,并将一个所述历史行为数据记录为一个所述历史点击事件。
具体地,在将各所述点击时间差值与时间差值阈值进行比较,并自所述行为数据序列中,剔除大于或等于所述时间差值阈值的点击时间差值对应的历史行为数据之后,将剔除之后的行为数据序列记录为所述用户行为序列,并将一个所述历史行为数据记录为一个所述历史点击事件。
在本实施例中,通过历史点击时间对所有历史点击事件进行筛选,由于时间跨度过大的历史点击事件对于目标用户短期内的影响较小,并且随着时间的推移,目标用户的兴趣偏好转变也会发生较大的变化,进而剔除时间跨度过大的历史点击事件,可以提高信息推送的准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种信息推送装置,该信息推送装置与上述实施例中信息推送方法一一对应。如图5所示,该信息推送装置包括用户行为序列获取模块10、点击事件选取模块20、正序相似度确定模块30、逆序相似度确定模块40、总相似度确定模块50和事件推送模块60。各功能模块详细说明如下:
用户行为序列获取模块10,用于在检测到目标用户触发页面点击事件时,获取用户行为序列;所述用户行为序列中包含所述页面点击事件,以及在所述页面点击事件之前基于历史点击时间顺序排列的多个历史点击事件;一个所述历史点击事件以及所述页面点击事件均关联一个位置信息;
点击事件选取模块20,用于自所述用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件;
正序相似度确定模块30,用于将所述页面点击事件以及所述待匹配点击事件输入至正序相似度确定模型,令所述正序相似度确定模型根据第一位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的正序相似度;所述第一位置信息差值指的是所述待匹配点击事件的位置信息与所述页面点击事件的位置信息之间的差值;
逆序相似度确定模块40,用于将所述页面点击事件以及所述待匹配点击事件输入至逆序相似度确定模型,令所述逆序相似度确定模型根据第二位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的逆序相似度;所述第二位置信息差值指的是所述页面点击事件的位置信息与所述待匹配点击事件的位置信息之间的差值;
总相似度确定模块50,用于将与同一所述待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为所述待匹配点击事件与页面点击事件之间的总相似度;
事件推送模块60,用于在所有所述历史点击事件均被选取完毕之后,将各所述总相似度中最大总相似度对应的历史点击事件推送至所述目标用户。
优选地,信息推送装置包括:
历史行为数据获取模块,用于获取所述目标用户的历史行为数据;所述历史行为数据关联一个历史点击时间;
行为数据插入模块,用于将各所述历史行为数据按照所述历史点击时间顺序插入行为数据序列中;
点击时间差值记录模块,用于将各所述历史行为数据的历史点击时间与所述页面点击事件对应的页面点击时间之间的差值记录为点击时间差值;
行为数据剔除模块,用于将各所述点击时间差值与时间差值阈值进行比较,并自所述行为数据序列中,剔除大于或等于所述时间差值阈值的点击时间差值对应的历史行为数据;
点击事件记录模块,用于将剔除之后的行为数据序列记录为所述用户行为序列,并将一个所述历史行为数据记录为一个所述历史点击事件。
优选地,如图6所示,正序相似度确定模块30包括:
特征提取单元301,用于对所述待匹配点击事件关联的页面信息进行特征提取,得到待匹配特征信息;同时,对所述页面点击事件关联的页面信息进行特征提取,得到目标特征信息;
特征相似度确定单元302,用于确定所述待匹配特征信息与所述目标特征信息之间的特征相似度;
第一时间差值记录单元303,用于将所述待匹配点击事件对应的历史点击时间与所述页面点击事件的页面点击时间之间的差值记录为第一时间差值;
正序相似度确定单元304,用于根据所述特征相似度、所述第一时间差值、所述第一位置信息差值以及所述正序权重,确定所述正序相似度。
优选地,如图7所示,特征提取单元301包括:
第一文字识别子单元3011,用于获取所述图片信息的命名信息,并对所述命名信息进行文字识别,得到与所述命名信息对应的命名特征;
第二文字识别子单元3012,用于对所述标题信息进行文字识别,得到与所述标题信息对应的标题特征;
归一化处理子单元3013,用于对所述命名特征以及所述标题特征进行归一化处理,得到所述待匹配特征信息。
优选地,正序相似度确定单元304包括:
正序相似度确定子单元,用于通过下述表达式确定所述正序相似度:
其中,Wij表征用户行为序列中第i个位置信息上的历史点击事件与处于第j个位置信息上的页面点击事件之间的正序相似度;M为正序权重;cos(i,j)为特征相似度;X为位置信息的权重衰减值;uloc(i)-uloc(j)为第一位置信息差值;utime(i)-utime(j)为第一时间差值;click(u)表征目标用户u的用户行为序列中历史点击事件的总数;N(i)为所有点击第i位置上事件的用户集合;N(j)为所有点击第j位置上事件的用户集合。
优选地,逆序相似度确定模块40包括:
第二时间差值记录单元,用于将所述页面点击事件对应的页面点击时间与所述历史点击事件的历史点击时间之间的差值记录为第二时间差值;
逆序相似度确定单元,用于根据所述特征相似度、第二时间差值、第二位置信息差值以及逆序权重,确定所述逆序相似度。
关于信息推送装置的具体限定可以参见上文中对于信息推送方法的限定,在此不再赘述。上述信息推送装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中信息推送方法所使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推送方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中信息推送方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中信息推送方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种信息推送方法,其特征在于,包括:
在检测到目标用户触发页面点击事件时,获取用户行为序列;所述用户行为序列中包含所述页面点击事件,以及在所述页面点击事件之前基于历史点击时间顺序排列的多个历史点击事件;一个所述历史点击事件以及所述页面点击事件均关联一个位置信息;
自所述用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件;
将所述页面点击事件以及所述待匹配点击事件输入至正序相似度确定模型,令所述正序相似度确定模型根据第一位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的正序相似度;所述第一位置信息差值指的是所述待匹配点击事件的位置信息与所述页面点击事件的位置信息之间的差值;
将所述页面点击事件以及所述待匹配点击事件输入至逆序相似度确定模型,令所述逆序相似度确定模型根据第二位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的逆序相似度;所述第二位置信息差值指的是所述页面点击事件的位置信息与所述待匹配点击事件的位置信息之间的差值;
将与同一所述待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为所述待匹配点击事件与页面点击事件之间的总相似度;
在所有所述历史点击事件均被选取完毕之后,将与最大的所述总相似度对应的历史点击事件推送至所述目标用户;
所述历史点击事件以及所述页面点击事件均关联一个页面信息;所述正序相似度确定模型关联正序权重;所述令所述正序相似度确定模型根据第一位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的正序相似度,包括:
对所述待匹配点击事件关联的页面信息进行特征提取,得到待匹配特征信息;同时,对所述页面点击事件关联的页面信息进行特征提取,得到目标特征信息;
确定所述待匹配特征信息与所述目标特征信息之间的特征相似度;
将所述待匹配点击事件对应的历史点击时间与所述页面点击事件的页面点击时间之间的差值记录为第一时间差值;
根据所述特征相似度、所述第一时间差值、所述第一位置信息差值以及所述正序权重,确定所述正序相似度;
所述逆序相似度确定模型关联逆序权重;所述令所述逆序相似度确定模型根据第二位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的逆序相似度,包括:
将所述页面点击事件对应的页面点击时间与所述历史点击事件的历史点击时间之间的差值记录为第二时间差值;
根据所述特征相似度、第二时间差值、第二位置信息差值以及逆序权重,确定所述逆序相似度。
2.如权利要求1所述的信息推送方法,其特征在于,所述页面点击事件关联页面点击时间,所述获取用户行为序列之前,还包括:
获取所述目标用户的历史行为数据;所述历史行为数据关联一个历史点击时间;
将各所述历史行为数据按照所述历史点击时间顺序插入行为数据序列中;
将各所述历史行为数据的历史点击时间与所述页面点击事件对应的页面点击时间之间的差值记录为点击时间差值;
将各所述点击时间差值与时间差值阈值进行比较,并自所述行为数据序列中,剔除大于或等于所述时间差值阈值的点击时间差值对应的历史行为数据;
将剔除之后的行为数据序列记录为所述用户行为序列,并将一个所述历史行为数据记录为一个所述历史点击事件。
3.如权利要求1所述的信息推送方法,其特征在于,所述页面信息中包括图片信息以及标题信息;所述对所述待匹配点击事件关联的页面信息进行特征提取,得到待匹配特征信息,包括:
获取所述图片信息的命名信息,并对所述命名信息进行文字识别,得到与所述命名信息对应的命名特征;
对所述标题信息进行文字识别,得到与所述标题信息对应的标题特征;
对所述命名特征以及所述标题特征进行归一化处理,得到所述待匹配特征信息。
4.如权利要求1所述的信息推送方法,其特征在于,所述根据所述特征相似度、所述第一时间差值、所述第一位置信息差值以及所述正序权重,确定所述正序相似度,包括:
通过下述表达式确定所述正序相似度:
其中,Wij表征用户行为序列中第i个位置信息上的历史点击事件与处于第j个位置信息上的页面点击事件之间的正序相似度;M为正序权重;cos(i,j)为特征相似度;X为位置信息的权重衰减值;uloc(i)-uloc(j)为第一位置信息差值;utime(i)-utime(j)为第一时间差值;click(u)表征目标用户u的用户行为序列中历史点击事件的总数;N(i)为所有点击第i位置上事件的用户集合;N(j)为所有点击第j位置上事件的用户集合。
5.一种信息推送装置,其特征在于,包括:
用户行为序列获取模块,用于在检测到目标用户触发页面点击事件时,获取用户行为序列;所述用户行为序列中包含所述页面点击事件,以及在所述页面点击事件之前基于历史点击时间顺序排列的多个历史点击事件;一个所述历史点击事件以及所述页面点击事件均关联一个位置信息;
点击事件选取模块,用于自所述用户行为序列中任意选取一个历史点击事件并记录为待匹配点击事件;
正序相似度确定模块,用于将所述页面点击事件以及所述待匹配点击事件输入至正序相似度确定模型,令所述正序相似度确定模型根据第一位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的正序相似度;所述第一位置信息差值指的是所述待匹配点击事件的位置信息与所述页面点击事件的位置信息之间的差值;
逆序相似度确定模块,用于将所述页面点击事件以及所述待匹配点击事件输入至逆序相似度确定模型,令所述逆序相似度确定模型根据第二位置信息差值,确定所述页面点击事件与所述待匹配点击事件之间的逆序相似度;所述第二位置信息差值指的是所述页面点击事件的位置信息与所述待匹配点击事件的位置信息之间的差值;
总相似度确定模块,用于将与同一所述待匹配点击事件对应的正序相似度以及逆序相似度之和,记录为所述待匹配点击事件与页面点击事件之间的总相似度;
事件推送模块,用于在所有所述历史点击事件均被选取完毕之后,将与最大的所述总相似度对应的历史点击事件推送至所述目标用户;
正序相似度确定模块包括:
特征提取单元,用于对所述待匹配点击事件关联的页面信息进行特征提取,得到待匹配特征信息;同时,对所述页面点击事件关联的页面信息进行特征提取,得到目标特征信息;
特征相似度确定单元,用于确定所述待匹配特征信息与所述目标特征信息之间的特征相似度;
第一时间差值记录单元,用于将所述待匹配点击事件对应的历史点击时间与所述页面点击事件的页面点击时间之间的差值记录为第一时间差值;
正序相似度确定单元,用于根据所述特征相似度、所述第一时间差值、所述第一位置信息差值以及所述正序权重,确定所述正序相似度;
逆序相似度确定模块包括:
第二时间差值记录单元,用于将所述页面点击事件对应的页面点击时间与所述历史点击事件的历史点击时间之间的差值记录为第二时间差值;
逆序相似度确定单元,用于根据所述特征相似度、第二时间差值、第二位置信息差值以及逆序权重,确定所述逆序相似度。
6.如权利要求5所述的信息推送装置,其特征在于,所述页面点击事件关联页面点击时间,所述信息推送装置还包括:
历史行为数据获取模块,用于获取所述目标用户的历史行为数据;所述历史行为数据关联一个历史点击时间;
行为数据插入模块,用于将各所述历史行为数据按照所述历史点击时间顺序插入行为数据序列中;
点击时间差值记录模块,用于将各所述历史行为数据的历史点击时间与所述页面点击事件对应的页面点击时间之间的差值记录为点击时间差值;
行为数据剔除模块,用于将各所述点击时间差值与时间差值阈值进行比较,并自所述行为数据序列中,剔除大于或等于所述时间差值阈值的点击时间差值对应的历史行为数据;
点击事件记录模块,用于将剔除之后的行为数据序列记录为所述用户行为序列,并将一个所述历史行为数据记录为一个所述历史点击事件。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述信息推送方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述信息推送方法。
CN202110206455.9A 2021-02-24 2021-02-24 信息推送方法、装置、计算机设备及存储介质 Active CN112989185B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110206455.9A CN112989185B (zh) 2021-02-24 2021-02-24 信息推送方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110206455.9A CN112989185B (zh) 2021-02-24 2021-02-24 信息推送方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN112989185A CN112989185A (zh) 2021-06-18
CN112989185B true CN112989185B (zh) 2023-07-28

Family

ID=76350097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110206455.9A Active CN112989185B (zh) 2021-02-24 2021-02-24 信息推送方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112989185B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115964190B (zh) * 2022-12-07 2023-07-14 中科雨辰科技有限公司 一种更新历史事件信息的数据处理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246453A (zh) * 2012-02-01 2013-08-14 上海博路信息技术有限公司 一种基于图片区域动作的解锁方法
CN106101222A (zh) * 2016-06-08 2016-11-09 腾讯科技(深圳)有限公司 信息的推送方法和装置
CN106488278A (zh) * 2015-08-25 2017-03-08 姜洪军 一种多功能智能电视
CN107293142A (zh) * 2017-06-27 2017-10-24 北京交通大学 基于lbs的交通信息主动推送方法及系统
CN111429204A (zh) * 2020-03-10 2020-07-17 携程计算机技术(上海)有限公司 酒店推荐方法、系统、电子设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011111302A1 (ja) * 2010-03-10 2011-09-15 パナソニック株式会社 押し込み位置制御装置、押し込み位置制御方法及びタッチセンサシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246453A (zh) * 2012-02-01 2013-08-14 上海博路信息技术有限公司 一种基于图片区域动作的解锁方法
CN106488278A (zh) * 2015-08-25 2017-03-08 姜洪军 一种多功能智能电视
CN106101222A (zh) * 2016-06-08 2016-11-09 腾讯科技(深圳)有限公司 信息的推送方法和装置
CN107293142A (zh) * 2017-06-27 2017-10-24 北京交通大学 基于lbs的交通信息主动推送方法及系统
CN111429204A (zh) * 2020-03-10 2020-07-17 携程计算机技术(上海)有限公司 酒店推荐方法、系统、电子设备和存储介质

Also Published As

Publication number Publication date
CN112989185A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN110674319B (zh) 标签确定方法、装置、计算机设备及存储介质
US20200134300A1 (en) Predictive analysis of target behaviors utilizing rnn-based user embeddings
CN110377725B (zh) 数据生成方法、装置、计算机设备及存储介质
CN110765754B (zh) 文本数据排版方法、装置、计算机设备及存储介质
CN110880006B (zh) 用户分类方法、装置、计算机设备和存储介质
CN112784168B (zh) 信息推送模型训练方法以及装置、信息推送方法以及装置
US11488270B2 (en) System and method for context and sequence aware recommendation
CN109753421B (zh) 服务系统的优化方法、装置、计算机设备和存储介质
CN110674144A (zh) 用户画像生成方法、装置、计算机设备和存储介质
CN110363580B (zh) 信息推荐方法、装置、计算机设备及存储介质
CN111967914A (zh) 基于用户画像的推荐方法、装置、计算机设备和存储介质
CN112035611A (zh) 目标用户推荐方法、装置、计算机设备和存储介质
CN112395875A (zh) 一种关键词提取方法、装置、终端以及存储介质
CN112487283A (zh) 训练模型的方法、装置、电子设备及可读存储介质
WO2019227629A1 (zh) 文本信息的生成方法、装置、计算机设备及存储介质
CN110555165B (zh) 信息识别方法、装置、计算机设备和存储介质
CN112989179B (zh) 模型训练、多媒体内容推荐方法和装置
CN112989185B (zh) 信息推送方法、装置、计算机设备及存储介质
CN111651666A (zh) 用户主题推荐方法、装置、计算机设备及存储介质
CN111563212A (zh) 一种内链添加方法及装置
Takayama et al. Dialogue breakdown detection robust to variations in annotators and dialogue systems
CN115687810A (zh) 网页搜索方法、装置及相关设备
CN115618054A (zh) 视频推荐方法及装置
Steinert-Threlkeld et al. Protest event data from geolocated social media content
CN115114415A (zh) 问答知识库更新方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant