CN113676505A - 信息推送方法、装置、计算机设备和存储介质 - Google Patents
信息推送方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113676505A CN113676505A CN202010411750.3A CN202010411750A CN113676505A CN 113676505 A CN113676505 A CN 113676505A CN 202010411750 A CN202010411750 A CN 202010411750A CN 113676505 A CN113676505 A CN 113676505A
- Authority
- CN
- China
- Prior art keywords
- resource transfer
- sample
- user identifier
- information
- sequence information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012546 transfer Methods 0.000 claims abstract description 419
- 239000013598 vector Substances 0.000 claims abstract description 162
- 238000004364 calculation method Methods 0.000 claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 56
- 238000004590 computer program Methods 0.000 claims description 13
- 238000005295 random walk Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 description 15
- 230000006399 behavior Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种信息推送方法、装置、计算机设备和存储介质。所述方法包括:获取目标用户标识的资源转移序列信息,所述资源转移序列信息是根据所述目标用户标识的历史资源转移记录确定的;根据所述目标用户标识的资源转移序列信息以及词向量计算模型,生成所述目标用户标识的资源转移标签向量,所述词向量计算模型是根据第一样本资源转移序列信息训练得到的,所述第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;根据所述目标用户标识的资源转移标签向量确定目标推荐信息,并将所述目标推荐信息推送给所述目标用户标识。采用本方法能够提高推荐信息的准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种信息推送方法、装置、计算机设备和存储介质。
背景技术
在传统的互联网技术中,网站或者应用程序会向用户推荐一些用户可能感兴趣的信息,以使用户能够快速从推荐信息中找到自身需要的信息,比如,购物网站会推荐商品给用户,资讯网站会推荐资讯给用户,视频、音乐、书籍等资源网站会推送资源给用户,社交网站会推送社交账号、Feed流信息给用户。
但是,在传统的互联网技术中,一般是根据用户搜索或者浏览的信息,确定与用户搜索或者浏览的信息相似的信息,并将相似的信息推荐给用户,导致推荐信息不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高推荐信息的准确性的信息推送方法、装置、计算机设备和存储介质。
一种信息推送方法,方法包括:
获取目标用户标识的资源转移序列信息,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的;
根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;
根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识。
一种信息推送装置,装置包括:
获取模块,用于获取目标用户标识的资源转移序列信息,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的;
生成模块,用于根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;
确定模块,用于根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取目标用户标识的资源转移序列信息,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的;
根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;
根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取目标用户标识的资源转移序列信息,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的;
根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;
根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识。
上述信息推送方法、装置、计算机设备和存储介质,获取目标用户标识的资源转移序列信息,根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识,其中,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的,这样,将目标用户标识的历史资源转移记录形成资源转移序列信息,进而采用词向量计算模型得到资源转移序列信息对应的资源转移标签向量,使得资源转移标签向量可准确表达目标用户标识的资源转移行为,并根据资源转移标签向量确定目标用户标识的推荐信息,从而提高了推荐信息的准确性。
附图说明
图1为一个实施例中信息推送方法的应用环境图;
图2为一个实施例中信息推送方法的流程示意图;
图3为一个实施例中获取带权有向图的示意图;
图4为一个实施例中获取第一样本资源转移序列信息的示意图;
图5为一个实施例中随机游走的示意图;
图6为一个实施例中词向量计算模型的训练结果的示意图;
图7为一个实施例中词向量计算模型的训练效果的示意图;
图8为一个实施例中获取目标推荐信息的流程示意图
图9为另一个实施例中信息推送方法的流程示意图;
图10为一个实施例中信息推送装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的信息推送方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104获取目标用户标识的资源转移序列信息,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的;接着,服务器104根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;接着,服务器104根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识对应的终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种信息推送方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取目标用户标识的资源转移序列信息,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的。
其中,目标用户标识是指待进行信息推荐的用户标识。目标用户标识用于唯一表示目标用户身份。目标用户标识可为目标用户的身份证号码、护照号码、驾驶证号码、手机号码、应用程序账号等。
资源转移序列信息用于描述目标用户标识的历史资源转移记录。资源转移是指以预定数值的资源作为输入,通过交换模型处理,输出对应的资源的过程。资源可为目标用户标识所对应的资产等。序列信息是指按照预设规则排列目标信息,该目标信息可从历史资源转移记录中获取得到,该预设规则可为时间顺序,比如按照时间由远至近排列目标信息,或者按照时间由近至远排列目标信息。
在一个实施例中,获取目标用户标识在预设时间段内的历史资源转移记录,根据目标用户标识在预设时间段内的历史资源转移记录,生成目标用户标识的资源转移序列信息。预设时间段可为7天、1个月、6个月、12个月等。
在一个实施例中,服务器获取目标用户标识的资源转移序列信息。
步骤204,根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的。
其中,词向量计算模型是用于产生词向量的相关模型,词向量是词语被映射到实数的向量。词向量计算模型通过语料库中的句子序列来描述词与词的共现关系,进而学习到词语的向量表示。可选地,若至少两个词语的上下文意思相近,通过词向量计算模型产生的词向量,其向量距离也是相近的。在一个实施例中,词向量计算模型可为Word2vec模型。
资源转移标签向量用于表征目标用户标识的资源转移行为,资源转移行为可体现目标用户标识的资源转移偏好、资源转移能力等特征。可选地,若至少两个用户标识的资源转移行为相似,通过词向量计算模型产生的资源转移标签向量,其向量距离也是相近的。
第一样本资源转移序列信息用于对词向量计算模型进行训练,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的。
在一个实施例中,获取各个样本用户标识在预定时间段内的历史资源转移记录,根据各个样本用户标识在预定时间段内的历史资源转移记录,生成各个样本用户标识的第二样本资源转移序列信息,根据各个样本用户标识的第二样本资源转移序列信息,确定第一样本资源转移序列信息。其中,第二样本资源转移序列信息用于描述样本用户标识的历史资源转移记录,预定时间段可为7天、1个月等。
在一个实施例中,服务器根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量。
步骤206,根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识。
其中,目标推荐信息可以是金融网站的产品、购物网站的商品,资讯网站的资讯,视频、音乐、书籍等资源网站的资源,社交网站的社交账号、Feed流信息等。
在一个实施例中,可预先设置多个用户类别,并预先设置各个用户类别对应的预设资源转移标签向量以及推荐信息。当获取到目标用户标识的资源转移标签向量时,获取目标用户标识的资源转移标签向量与各个预设资源转移标签向量之间的向量距离,并将向量距离满足预设条件的预设资源转移标签向量所对应的推荐信息,作为目标推荐信息推送给目标用户标识。其中,预设条件可以是向量距离最短。
在一个实施例中,根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识。
上述信息推送方法中,获取目标用户标识的资源转移序列信息,根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识,其中,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的,这样,将目标用户标识的历史资源转移记录形成资源转移序列信息,进而采用词向量计算模型得到资源转移序列信息对应的资源转移标签向量,使得资源转移标签向量可准确表达目标用户标识的资源转移行为,并根据资源转移标签向量确定目标用户标识的推荐信息,从而提高了推荐信息的准确性。
在一个实施例中,获取目标用户标识的资源转移序列信息,包括:获取目标用户标识在预设时间段内的历史资源转移记录;从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词,并按照时间顺序对第一关键词进行排列,得到目标用户标识的资源转移序列信息。
其中,预设时间段可为7天、1个月、6个月、12个月等。第一关键词可为目标用户标识在预设时间段内的历史资源转移记录中的接收方标识,比如,一条历史资源转移记录为“某某便利店-消费5元”,第一关键词可为“某某便利店”。
在一个实施例中,从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词的方式可以是:从目标用户标识在预设时间段内的历史资源转移记录中获取接收方标识。
在一个实施例中,由于历史资源转移记录中携带有资源转移时间,可按照资源转移时间对第一关键词进行排列,得到目标用户标识的资源转移序列信息。具体地,按照资源转移时间由远至近,或者资源转移时间由近至远,对第一关键词进行排列,得到目标用户标识的资源转移序列信息。
比如,目标用户标识在预设时间段内的历史资源转移记录为:第一时间点在M资源转移第一数值,第二时间点在N资源转移第二数值,第三时间点在J资源转移第三数值,第四时间点在K资源转移第四数值。第一时间点、第二时间点、第三时间点以及第四时间点的顺序为由远至近,目标用户标识的资源转移序列信息可为:M→N→J→K。
本实施例中,获取目标用户标识在预设时间段内的历史资源转移记录,从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词,并按照时间顺序对第一关键词进行排列,得到目标用户标识的资源转移序列信息,这样,将目标用户标识的历史资源转移记录形成资源转移序列信息,不仅剔除了无效信息,并且保留了历史资源转移记录的关联性。
在一个实施例中,第一样本资源转移序列信息的生成方式,包括:获取各个样本用户标识在预定时间段内的历史资源转移记录;根据各个样本用户标识在预定时间段内的历史资源转移记录,生成各个样本用户标识的第二样本资源转移序列信息;根据各个样本用户标识的第二样本资源转移序列信息,生成第一样本资源转移序列信息。
其中,预定时间段可为7天、1个月等。第二样本资源转移序列信息用于描述样本用户标识的历史资源转移记录。
在一个实施例中,根据各个样本用户标识的第二样本资源转移序列信息,生成第一样本资源转移序列信息,包括:对各个样本用户标识的第二样本资源转移序列信息进行随机抽样,得到第一样本资源转移序列信息。
本实施例中,获取各个样本用户标识在预定时间段内的历史资源转移记录,根据各个样本用户标识在预定时间段内的历史资源转移记录,生成各个样本用户标识的第二样本资源转移序列信息,根据各个样本用户标识的第二样本资源转移序列信息,生成第一样本资源转移序列信息,这样,使得第一样本资源转移序列信息可充分表达样本用户标识的历史资源转移记录的关联性,进而提升对词向量计算模型训练的准确性。
在一个实施例中,根据各个样本用户标识在预定时间段内的历史资源转移记录,生成各个样本用户标识的第二样本资源转移序列信息,包括:从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词,并按照时间顺序对第二关键词进行排列,得到各个样本用户标识的第二样本资源转移序列信息。
其中,预定时间段可根据实际应用进行设定,比如7天、14天等。第二关键词可为样本用户标识在预定时间段内的历史资源转移记录中的接收方标识,比如,一条历史资源转移记录为“某某餐厅-消费200元”,第二关键词可为“某某餐厅”。
在一个实施例中,从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词的方式可以是:从样本用户标识在预定时间段内的历史资源转移记录中获取接收方标识。
在一个实施例中,由于历史资源转移记录中携带有资源转移时间,可按照资源转移时间对第二关键词进行排列,得到样本用户标识的第二样本资源转移序列信息。具体地,按照资源转移时间由远至近,或者资源转移时间由近至远,对第二关键词进行排列,得到样本用户标识的第二样本资源转移序列信息。
比如,样本用户标识在预定时间段内的历史资源转移记录为:第一时间点在P资源转移第一数值;第二时间点在O资源转移第二数值;第三时间点在Y资源转移第三数值;第四时间点在U资源转移第四数值。第一时间点、第二时间点、第三时间点以及第四时间点的顺序为由远至近,样本用户标识的第二样本资源转移序列信息为:P→O→Y→U。
本实施例中,从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词,并按照时间顺序对第二关键词进行排列,得到各个样本用户标识的第二样本资源转移序列信息,这样,将样本用户标识的历史资源转移记录形成资源转移序列信息,不仅剔除了无效信息,并且保留了历史资源转移记录的关联性。
在一个实施例中,根据各个样本用户标识的第二样本资源转移序列信息,生成第一样本资源转移序列信息,包括:根据各个样本用户标识的第二样本资源转移序列信息,生成带权有向图;对带权有向图进行随机游走,得到第一样本资源转移序列信息。
其中,带权有向图包括至少两个节点,且至少两个节点之间具有指向以及连接权重。随机游走是从当前访问节点出发,从其邻居中随机采样节点作为下一访问节点。
在一个实施例中,根据各个样本用户标识的第二样本资源转移序列信息,生成带权有向图,包括:将各个样本用户标识的第二样本资源转移序列信息中的第二关键词作为节点,根据各个样本用户标识的第二样本资源转移序列信息中的第二关键词之间的指向,将各个样本用户标识的第二关键词进行连接,生成带权有向图,其中,带权有向图中的各个节点之间的指向,为各个样本用户标识的第二关键词之间的指向的并集,带权有向图中的各个节点之间的连接权重,可根据各个样本用户标识的第二关键词之间的指向次数确定,比如各个样本用户标识的第二关键词之间的指向次数之和。
比如,如图3所示,以样本用户标识包括样本用户标识1、样本用户标识2、样本用户标识3为例,样本用户标识1的第二样本资源转移序列信息是由第二关键词E、D、C、B构成,且E、D、C、B的指向为:E→D→C→B;样本用户标识2的第二样本资源转移序列是由第二关键词E、B、C构成,且E、B、C的指向为:E→B→C;样本用户标识3的第二样本资源转移序列是由C、F、E、A、F构成,且C、F、E、A、F的指向为:C→F→E→A→F。将E、D、C、B、F、A作为节点,根据样本用户标识1、样本用户标识2、样本用户标识3的第二样本资源转移序列信息中的第二关键词之间的指向,将E、D、C、B、F、A进行连接,生成带权有向图。其中,在样本用户标识1的第二样本资源转移序列中存在C→B,在样本用户标识2的第二样本资源转移序列中存在B→C,因此带权有向图中B、C之间的指向为B←→C;在样本用户标识2的第二样本资源转移序列中存在E→B,且样本用户标识1、样本用户标识3的第二样本资源转移序列信息中,均不存在E→B,因此带权有向图中E、B之间的指向为E→B;在样本用户标识1的第二样本资源转移序列中存在C→B,在样本用户标识2的第二样本资源转移序列中存在B→C,因此带权有向图中B←→C的连接权重为2;在样本用户标识1的第二样本资源转移序列中存在F→D,且样本用户标识2、样本用户标识3的第二样本资源转移序列信息中,均不存在F→D,因此带权有向图中F→D的连接权重为1。
在一个实施例中,对带权有向图进行随机游走,得到第一样本资源转移序列信息,包括:根据DeepWalk算法进行随机游走,在带权有向图中对节点进行采样,根据采样得到的节点生成第一样本资源转移序列信息。具体地,给定当前访问起始节点,从其邻居中随机采样节点作为下一个访问节点,重复此过程,直到访问序列长度满足预定条件,得到第一样本资源转移序列信息。可以理解,随机游走的流向与带权有向图中的节点之间的指向一致。
比如,如图4所示,以设定访问序列长度为5个节点为例,第一轮随机游走结果为:E→B→C→F→D,第二轮随机游走结果为:A→F→D→C→B,第三轮随机游走结果为:F→E→B→C→F,以上随机游走结果均为第一样本资源转移序列信息。
本实施例中,根据各个样本用户标识的第二样本资源转移序列信息,生成带权有向图,对带权有向图进行随机游走,得到第一样本资源转移序列信息,这样,对各个样本用户标识的第二样本资源转移序列信息进行重构,形成带权有向图,并对带权有向图进行随机游走,得到第一样本资源转移序列信息,从而完成对样本序列的随机抽样,避免了资源转移标签的头部效应问题以及重复信息问题。
在一个实施例中,对带权有向图进行随机游走,得到第一样本资源转移序列信息,包括:获取带权有向图中的节点之间的游走概率,游走概率根据带权有向图中的节点之间的连接权重确定;根据带权有向图中的节点之间的游走概率,对带权有向图进行随机游走,得到第一样本资源转移序列信息。
其中,游走概率用于描述由当前访问节点游走至下一访问节点的概率。
在一个实施例中,可通过node2vec算法进行随机游走。比如,如图5所示,带权有向图包括t、v、x1、x2、x3五个节点,若已采样了t、v两个节点,即当前访问节点为v,那么下一访问节点是x1、x2或者x3,由v与x1、x2、x3之间的游走概率确定。节点之间的游走概率可由如下公式进行计算:
其中,πvx为两个节点之间的游走概率;为两个节点之间的基础游走概率,如果dtx=0,即t与x相等,那么采样x的概率为1/p,如果dtx=1,即t与x相连,那么采样x的概率1,如果dtx=2,即t与x不相连,那么采样x概率为1/q;ln(tvx)为边权重,tvx为节点v与节点x1、x2、x3之间的连接权重;p为返回概率,q为出入参数。
对于返回概率p,若p>max(q,1),那么采样倾向于往前走,即下一个访问节点可能不会是节点t,若p<min(q,1),那么采样倾向于往回走,即下一个访问节点可能会是节点t。对于出入参数,若q>1,那么采样倾向于在节点周围进行,若q<1,那么采样倾向于远离节点进行。
本实施例中,获取带权有向图中的节点之间的游走概率,根据带权有向图中的节点之间的游走概率,对带权有向图进行随机游走,得到第一样本资源转移序列信息,这样,提高了对样本序列进行随机抽样的准确性。
在一个实施例中,第一样本资源转移序列信息的生成方式,包括:获取各个样本用户标识在预定时间段内的历史资源转移记录;从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词,并按照时间顺序对第二关键词进行排列,得到各个样本用户标识的第二样本资源转移序列信息;根据各个样本用户标识的第二样本资源转移序列信息,生成带权有向图,获取带权有向图中的节点之间的游走概率,游走概率根据带权有向图中的节点之间的连接权重确定,根据带权有向图中的节点之间的游走概率,对带权有向图进行随机游走,得到第一样本资源转移序列信息。
具体地,由于资源转移行为频发,样本用户标识的历史资源转移记录数量庞大;并且,在样本用户标识的历史资源转移记录中,资源转移标签的头部效应明显;另外,在样本用户标识的历史资源转移记录中,有大量的重复信息。
本实施例中,根据目标用户标识的历史资源转移记录确定第二样本资源转移序列信息,剔除了无效信息,并且保留了历史资源转移记录的关联性,提高了词向量计算模型的训练效率以及准确性;接着,对各个样本用户标识的第二样本资源转移序列信息进行重构,形成带权有向图,并对带权有向图进行随机游走,得到第一样本资源转移序列信息,从而完成对样本序列的随机抽样,避免了资源转移标签的头部效应问题以及重复信息问题。
在一个实施例中,词向量计算模型的训练方式,包括:获取第一样本资源转移序列信息以及预设文本信息;根据第一样本资源转移序列信息以及预设文本信息,训练词向量计算模型。
其中,预设文本信息可为新闻文本信息、资讯文本信息、文学文本信息等。在一个实施例中,预设文本信息可从多个渠道获取得到,比如网站、应用程序等。可选地,预设文本信息可从视频中获取得到,将视频的语音信息转化为文本信息,得到预设文本信息。
具体地,由于资源转移存在地域限制,第一样本资源转移序列信息缺乏常识信息,比如北京、上海的共线序列概率较低,而在预设文本信息中,可得到“北京、上海、深圳、广州作为一线城市”这样的信息,从而可消除第一样本资源转移序列信息存在的信息缺陷问题。
如图6所示,当根据第一样本资源转移序列信息以及预设文本信息,对词向量计算模型进行训练后,可通过词向量计算模型确定词语的向量表示。如图7所示,根据“医院”、“酒店”、“汽车”这3类相关的2000多个标签进行t-SNE(t-distributed stochasticneighbor embedding)算法降维,可以看出,结合预设文本信息进行训练,所得到的标签的类间距离更大,类内距离更小,训练效果更好。
本实施例中,获取第一样本资源转移序列信息以及预设文本信息,根据第一样本资源转移序列信息以及预设文本信息,训练词向量计算模型,这样,引入预设文本信息,消除了第一样本资源转移序列信息存在的信息缺陷问题。
在一个实施例中,根据目标用户标识的资源转移标签向量确定目标推荐信息的方式,包括:根据目标用户标识的资源转移标签向量以及第一推荐模型确定目标推荐信息,第一推荐模型是根据样本资源转移标签向量训练得到的。
其中,第一推荐模型用于根据输入的资源转移标签向量,输出目标推荐信息。样本资源转移标签向量用于对第一推荐模型进行训练。
在一个实施例中,第一推荐模型可为逻辑回归模型、树模型、深度学习模型等。可选地,第一推荐模型的训练方式为:根据标记信息对样本资源转移标签向量进行标记,将标记后的样本资源转移标签向量输入第一推荐模型,得到第一推荐模型输出的预测信息,根据标记信息与预测信息之间的差异,更新第一推荐模型的参数,直至满足训练停止条件时,结束训练。
本实施例中,根据目标用户标识的资源转移标签向量以及第一推荐模型确定目标推荐信息,这样,实现对目标用户标识的精准推荐。
在一个实施例中,如图8所示,根据目标用户标识的资源转移标签向量确定目标推荐信息的方式,包括:
步骤802,获取目标用户标识的属性信息。
其中,属性信息可包括资产信息、身份信息等。资产信息可以包括:收入、固定资产等;身份信息可以包括:年龄、性别、地域、学历等。
步骤804,根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型,确定目标推荐信息,第二推荐模型是根据样本属性信息以及样本资源转移标签向量训练得到的。
其中,第二推荐模型用于根据输入的属性信息以及资源转移标签向量,输出目标推荐信息。
在一个实施例中,第二推荐模型可为逻辑回归模型、树模型、深度学习模型等。可选地,第二推荐模型的训练方式为:根据标记信息对样本属性信息以及样本资源转移标签向量进行标记,将标记后的样本属性信息以及样本资源转移标签向量输入第二推荐模型,得到第二推荐模型输出的预测信息,根据标记信息与预测信息之间的差异,更新第二推荐模型的参数,直至满足训练停止条件时,结束训练。
本实施例中,获取目标用户标识的属性信息;根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型,确定目标推荐信息,这样,提高了对目标用户标识推荐的精准度。
本申请还提供一种应用场景,该应用场景应用上述的信息推送方法。具体地,该信息推送方法在该应用场景的应用如下:对目标用户标识推送目标推荐信息,该目标推荐信息可以是金融网站的产品、购物网站的商品,资讯网站的资讯,视频、音乐、书籍等资源网站的资源,社交网站的社交账号、Feed流信息等。该方法包括:
获取目标用户标识在预设时间段内的历史资源转移记录,从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词,并按照时间顺序对第一关键词进行排列,得到目标用户标识的资源转移序列信息。
接着,根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的。
进一步地,获取目标用户标识的属性信息,根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型,确定目标推荐信息,第二推荐模型是根据样本属性信息以及样本资源转移标签向量训练得到的。
接着,将目标推荐信息推送给目标用户标识。
其中,第一样本资源转移序列信息的生成方式,包括:获取各个样本用户标识在预定时间段内的历史资源转移记录;从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词,并按照时间顺序对第二关键词进行排列,得到各个样本用户标识的第二样本资源转移序列信息;根据各个样本用户标识的第二样本资源转移序列信息,生成带权有向图;获取带权有向图中的节点之间的游走概率,游走概率根据带权有向图中的节点之间的连接权重确定;根据带权有向图中的节点之间的游走概率,对带权有向图进行随机游走,得到第一样本资源转移序列信息。
其中,词向量计算模型的训练方式,包括:获取第一样本资源转移序列信息以及预设文本信息;根据第一样本资源转移序列信息以及预设文本信息,训练词向量计算模型,预设文本信息为新闻文本信息。
具体地,本实施例提供的方法,在模型训练方面,训练效率提升了12倍,由36h降低至3h;在模型应用方面,推荐模型的AUC(Area Under Curve)提升了1.2%,风控模型的区分度评估指标提升了4.5%。上述信息推送方法中,根据目标用户标识的历史资源转移记录确定第二样本资源转移序列信息,剔除了无效信息,并且保留了历史资源转移记录的关联性,提高了词向量计算模型的训练效率以及准确性;接着,对各个样本用户标识的第二样本资源转移序列信息进行重构,形成带权有向图,并对带权有向图进行随机游走,得到第一样本资源转移序列信息,从而完成对样本序列的随机抽样,避免了资源转移标签的头部效应问题以及重复信息问题;并且,资源转移标签向量可准确表达目标用户标识的资源转移行为,根据资源转移标签向量确定目标用户标识的推荐信息,从而提高了推荐信息的准确性。
本申请还另外提供一种应用场景,该应用场景应用上述的信息推送方法。具体地,该信息推送方法在该应用场景的应用如下:对词向量计算模型进行训练,该词向量计算模型用于确定资源转移标签向量,该资源转移标签向量可用于对目标用户标识推送目标推荐信息,该目标推荐信息可以是金融网站的产品、购物网站的商品,资讯网站的资讯,视频、音乐、书籍等资源网站的资源,社交网站的社交账号、Feed流信息等。该方法包括:
获取各个样本用户标识在预定时间段内的历史资源转移记录。
接着,从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词,并按照时间顺序对第二关键词进行排列,得到各个样本用户标识的第二样本资源转移序列信息。
进一步地,根据各个样本用户标识的第二样本资源转移序列信息,生成带权有向图。
接着,获取带权有向图中的节点之间的游走概率,游走概率根据带权有向图中的节点之间的连接权重确定,根据带权有向图中的节点之间的游走概率,对带权有向图进行随机游走,得到第一样本资源转移序列信息。
进一步地,根据第一样本资源转移序列信息以及预设文本信息,训练词向量计算模型,预设文本信息为新闻文本信息。
上述信息推送方法中,根据目标用户标识的历史资源转移记录确定第二样本资源转移序列信息,剔除了无效信息,并且保留了历史资源转移记录的关联性;接着,对各个样本用户标识的第二样本资源转移序列信息进行重构,形成带权有向图,并对带权有向图进行随机游走,得到第一样本资源转移序列信息,从而完成对样本序列的随机抽样,避免了资源转移标签的头部效应问题以及重复信息问题,提高了词向量计算模型的训练效率以及准确性。
本申请还另外提供一种应用场景,该应用场景应用上述的信息推送方法。具体地,该信息推送方法在该应用场景的应用如下:对目标用户标识推送目标推荐信息,该目标推荐信息可以是金融网站的产品、购物网站的商品,资讯网站的资讯,视频、音乐、书籍等资源网站的资源,社交网站的社交账号、Feed流信息等。该方法包括:
获取目标用户标识在预设时间段内的历史支付记录,从目标用户标识在预设时间段内的历史支付记录中获取第一关键词,并按照时间顺序对第一关键词进行排列,得到目标用户标识的支付序列信息。
接着,根据目标用户标识的支付序列信息以及词向量计算模型,生成目标用户标识的支付标签向量,词向量计算模型是根据第一样本支付序列信息训练得到的,第一样本支付序列信息是根据各个样本用户标识的历史支付记录确定的。
进一步地,获取目标用户标识的属性信息,根据目标用户标识的属性信息、目标用户标识的支付标签向量以及第二推荐模型,确定目标推荐信息,第二推荐模型是根据样本属性信息以及样本支付标签向量训练得到的。
接着,将目标推荐信息推送给目标用户标识。
其中,如图9所示,第一样本支付序列信息的生成方式,包括:获取各个样本用户标识在预定时间段内的历史支付记录;从各个样本用户标识在预定时间段内的历史支付记录中获取第二关键词,并按照时间顺序对第二关键词进行排列,得到各个样本用户标识的第二样本支付序列信息;根据各个样本用户标识的第二样本支付序列信息,生成带权有向图;获取带权有向图中的节点之间的游走概率,游走概率根据带权有向图中的节点之间的连接权重确定;根据带权有向图中的节点之间的游走概率,对带权有向图进行随机游走,得到第一样本支付序列信息。词向量计算模型的训练方式,包括:获取第一样本支付序列信息以及新闻文本信息;根据第一样本支付序列信息以及新闻文本信息,训练词向量计算模型。
其中,目标用户标识的支付序列信息用于描述目标用户标识的历史支付记录。支付标签向量用于表征目标用户标识的支付行为,支付行为可体现目标用户标识的支付偏好、支付能力等特征。可选地,若至少两个用户标识的支付行为相似,通过词向量计算模型产生的支付标签向量,其向量距离也是相近的。
第一样本支付序列信息用于对词向量计算模型进行训练,第一样本支付序列信息是根据各个样本用户标识的历史支付记录确定的。第二样本支付序列信息用于描述样本用户标识的历史支付记录。
第一关键词可为目标用户标识在预设时间段内的历史支付记录中的接收方标识。第二关键词可为样本用户标识在预定时间段内的历史支付记录中的接收方标识。
在一个实施例中,可通过node2vec算法进行随机游走。还是以图5为例,节点之间的游走概率可由如下公式进行计算:
上述信息推送方法中,根据目标用户标识的历史支付记录确定第二样本支付序列信息,剔除了无效信息,并且保留了历史支付记录的关联性,提高了词向量计算模型的训练效率以及准确性;接着,对各个样本用户标识的第二样本支付序列信息进行重构,形成带权有向图,并对带权有向图进行随机游走,得到第一样本支付序列信息,从而完成对样本序列的随机抽样,避免了支付标签的头部效应问题以及重复信息问题;并且,支付标签向量可准确表达目标用户标识的支付行为,根据支付标签向量确定目标用户标识的推荐信息,从而提高了推荐信息的准确性。
应该理解的是,虽然图2、图8-9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、图8-9中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图10所示,提供了一种信息推送装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取模块1002、生成模块1004和确定模块1006,其中:
获取模块1002,用于获取目标用户标识的资源转移序列信息,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的;
生成模块1004,用于根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;
确定模块1006,用于根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识。
上述信息推送装置中,获取目标用户标识的资源转移序列信息,根据目标用户标识的资源转移序列信息以及词向量计算模型,生成目标用户标识的资源转移标签向量,根据目标用户标识的资源转移标签向量确定目标推荐信息,并将目标推荐信息推送给目标用户标识,其中,资源转移序列信息是根据目标用户标识的历史资源转移记录确定的,词向量计算模型是根据第一样本资源转移序列信息训练得到的,第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的,这样,将目标用户标识的历史资源转移记录形成资源转移序列信息,进而采用词向量计算模型得到资源转移序列信息对应的资源转移标签向量,使得资源转移标签向量可准确表达目标用户标识的资源转移行为,并根据资源转移标签向量确定目标用户标识的推荐信息,从而提高了推荐信息的准确性。
在一个实施例中,获取模块1002,还用于:获取目标用户标识在预设时间段内的历史资源转移记录;从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词,并按照时间顺序对第一关键词进行排列,得到目标用户标识的资源转移序列信息。
本实施例中,获取目标用户标识在预设时间段内的历史资源转移记录,从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词,并按照时间顺序对第一关键词进行排列,得到目标用户标识的资源转移序列信息,这样,将目标用户标识的历史资源转移记录形成资源转移序列信息,不仅剔除了无效信息,并且保留了历史资源转移记录的关联性。
在一个实施例中,生成模块1004,还用于:获取各个样本用户标识在预定时间段内的历史资源转移记录;根据各个样本用户标识在预定时间段内的历史资源转移记录,生成各个样本用户标识的第二样本资源转移序列信息;根据各个样本用户标识的第二样本资源转移序列信息,生成第一样本资源转移序列信息。
本实施例中,获取各个样本用户标识在预定时间段内的历史资源转移记录,根据各个样本用户标识在预定时间段内的历史资源转移记录,生成各个样本用户标识的第二样本资源转移序列信息,根据各个样本用户标识的第二样本资源转移序列信息,生成第一样本资源转移序列信息,这样,使得第一样本资源转移序列信息可充分表达样本用户标识的历史资源转移记录的关联性,进而提升对词向量计算模型训练的准确性。
在一个实施例中,生成模块1004,还用于:从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词,并按照时间顺序对第二关键词进行排列,得到各个样本用户标识的第二样本资源转移序列信息。
本实施例中,从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词,并按照时间顺序对第二关键词进行排列,得到各个样本用户标识的第二样本资源转移序列信息,这样,将样本用户标识的历史资源转移记录形成资源转移序列信息,不仅剔除了无效信息,并且保留了历史资源转移记录的关联性。
在一个实施例中,生成模块1004,还用于:根据各个样本用户标识的第二样本资源转移序列信息,生成带权有向图;对带权有向图进行随机游走,得到第一样本资源转移序列信息。
本实施例中,根据各个样本用户标识的第二样本资源转移序列信息,生成带权有向图,对带权有向图进行随机游走,得到第一样本资源转移序列信息,这样,对各个样本用户标识的第二样本资源转移序列信息进行重构,形成带权有向图,并对带权有向图进行随机游走,得到第一样本资源转移序列信息,从而完成对样本序列的随机抽样,避免了资源转移标签的头部效应问题以及重复信息问题。
在一个实施例中,生成模块1004,还用于:获取带权有向图中的节点之间的游走概率,游走概率根据带权有向图中的节点之间的连接权重确定;根据带权有向图中的节点之间的游走概率,对带权有向图进行随机游走,得到第一样本资源转移序列信息。
本实施例中,获取带权有向图中的节点之间的游走概率,根据带权有向图中的节点之间的游走概率,对带权有向图进行随机游走,得到第一样本资源转移序列信息,这样,提高了对样本序列进行随机抽样的准确性。
在一个实施例中,信息推送装置还包括训练模块,训练模块,用于:获取第一样本资源转移序列信息以及预设文本信息;根据第一样本资源转移序列信息以及预设文本信息,训练词向量计算模型,预设文本信息为新闻文本信息。
本实施例中,获取第一样本资源转移序列信息以及预设文本信息,根据第一样本资源转移序列信息以及预设文本信息,训练词向量计算模型,这样,引入预设文本信息,消除了第一样本资源转移序列信息存在的信息缺陷问题。
在一个实施例中,确定模块1006,还用于:根据目标用户标识的资源转移标签向量以及第一推荐模型确定目标推荐信息,第一推荐模型是根据样本资源转移标签向量训练得到的。
本实施例中,根据目标用户标识的资源转移标签向量以及第一推荐模型确定目标推荐信息,这样,实现对目标用户标识的精准推荐。
在一个实施例中,确定模块1006,还用于:获取目标用户标识的属性信息;根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型,确定目标推荐信息,第二推荐模型是根据样本属性信息以及样本资源转移标签向量训练得到的。
本实施例中,获取目标用户标识的属性信息;根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型,确定目标推荐信息,这样,提高了对目标用户标识推荐的精准度。
关于信息推送装置的具体限定可以参见上文中对于信息推送方法的限定,在此不再赘述。上述信息推送装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储信息推送数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推送方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (13)
1.一种信息推送方法,其特征在于,所述方法包括:
获取目标用户标识的资源转移序列信息,所述资源转移序列信息是根据所述目标用户标识的历史资源转移记录确定的;
根据所述目标用户标识的资源转移序列信息以及词向量计算模型,生成所述目标用户标识的资源转移标签向量,所述词向量计算模型是根据第一样本资源转移序列信息训练得到的,所述第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;
根据所述目标用户标识的资源转移标签向量确定目标推荐信息,并将所述目标推荐信息推送给所述目标用户标识。
2.根据权利要求1所述的方法,其特征在于,所述获取目标用户标识的资源转移序列信息,包括:
获取所述目标用户标识在预设时间段内的历史资源转移记录;
从所述目标用户标识在所述预设时间段内的历史资源转移记录中获取第一关键词,并按照时间顺序对所述第一关键词进行排列,得到所述目标用户标识的资源转移序列信息。
3.根据权利要求1所述的方法,其特征在于,所述第一样本资源转移序列信息的生成方式,包括:
获取各个所述样本用户标识在预定时间段内的历史资源转移记录;
根据各个所述样本用户标识在所述预定时间段内的历史资源转移记录,生成各个所述样本用户标识的第二样本资源转移序列信息;
根据各个所述样本用户标识的第二样本资源转移序列信息,生成所述第一样本资源转移序列信息。
4.根据权利要求3所述的方法,其特征在于,所述根据各个所述样本用户标识在所述预定时间段内的历史资源转移记录,生成各个所述样本用户标识的第二样本资源转移序列信息,包括:
从各个所述样本用户标识在所述预定时间段内的历史资源转移记录中获取第二关键词,并按照时间顺序对所述第二关键词进行排列,得到各个所述样本用户标识的第二样本资源转移序列信息。
5.根据权利要求3所述的方法,其特征在于,所述根据各个所述样本用户标识的第二样本资源转移序列信息,生成所述第一样本资源转移序列信息,包括:
根据各个所述样本用户标识的第二样本资源转移序列信息,生成带权有向图;
对所述带权有向图进行随机游走,得到所述第一样本资源转移序列信息。
6.根据权利要求5所述的方法,其特征在于,所述对所述带权有向图进行随机游走,得到所述第一样本资源转移序列信息,包括:
获取所述带权有向图中的节点之间的游走概率,所述游走概率根据所述带权有向图中的节点之间的连接权重确定;
根据所述带权有向图中的节点之间的游走概率,对所述带权有向图进行随机游走,得到所述第一样本资源转移序列信息。
7.根据权利要求1所述的方法,其特征在于,所述词向量计算模型的训练方式,包括:
获取所述第一样本资源转移序列信息以及预设文本信息;
根据所述第一样本资源转移序列信息以及所述预设文本信息,训练所述词向量计算模型。
8.根据权利要求7所述的方法,其特征在于,所述预设文本信息为新闻文本信息。
9.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户标识的资源转移标签向量确定目标推荐信息的方式,包括:
根据所述目标用户标识的资源转移标签向量以及第一推荐模型确定所述目标推荐信息,所述第一推荐模型是根据样本资源转移标签向量训练得到的。
10.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户标识的资源转移标签向量确定目标推荐信息的方式,包括:
获取所述目标用户标识的属性信息;
根据所述目标用户标识的属性信息、所述目标用户标识的资源转移标签向量以及第二推荐模型,确定所述目标推荐信息,所述第二推荐模型是根据样本属性信息以及样本资源转移标签向量训练得到的。
11.一种信息推送装置,其特征在于,所述装置包括:
获取模块,用于获取目标用户标识的资源转移序列信息,所述资源转移序列信息是根据所述目标用户标识的历史资源转移记录确定的;
生成模块,用于根据所述目标用户标识的资源转移序列信息以及词向量计算模型,生成所述目标用户标识的资源转移标签向量,所述词向量计算模型是根据第一样本资源转移序列信息训练得到的,所述第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的;
确定模块,用于根据所述目标用户标识的资源转移标签向量确定目标推荐信息,并将所述目标推荐信息推送给所述目标用户标识。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。
13.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010411750.3A CN113676505B (zh) | 2020-05-15 | 2020-05-15 | 信息推送方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010411750.3A CN113676505B (zh) | 2020-05-15 | 2020-05-15 | 信息推送方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113676505A true CN113676505A (zh) | 2021-11-19 |
CN113676505B CN113676505B (zh) | 2023-11-28 |
Family
ID=78537545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010411750.3A Active CN113676505B (zh) | 2020-05-15 | 2020-05-15 | 信息推送方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113676505B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6012052A (en) * | 1998-01-15 | 2000-01-04 | Microsoft Corporation | Methods and apparatus for building resource transition probability models for use in pre-fetching resources, editing resource link topology, building resource link topology templates, and collaborative filtering |
CN106548402A (zh) * | 2016-10-18 | 2017-03-29 | 财付通支付科技有限公司 | 资源转移监控方法及装置 |
WO2017101389A1 (zh) * | 2015-12-15 | 2017-06-22 | 乐视控股(北京)有限公司 | 一种移动终端的信息推荐方法及装置 |
CN107977355A (zh) * | 2017-11-17 | 2018-05-01 | 四川长虹电器股份有限公司 | 基于词向量训练的电视节目推荐方法 |
CN108133013A (zh) * | 2017-12-22 | 2018-06-08 | 平安养老保险股份有限公司 | 信息处理方法、装置、计算机设备和存储介质 |
CN108363821A (zh) * | 2018-05-09 | 2018-08-03 | 深圳壹账通智能科技有限公司 | 一种信息推送方法、装置、终端设备及存储介质 |
CN109426985A (zh) * | 2017-09-04 | 2019-03-05 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机设备和存储介质 |
US20190102468A1 (en) * | 2017-09-29 | 2019-04-04 | Facebook, Inc. | Determining a rate for sampling information describing presentation of content based on previously received information describing presentation of content |
WO2019120037A1 (zh) * | 2017-12-18 | 2019-06-27 | Oppo广东移动通信有限公司 | 模型构建方法、网络资源预加载方法、装置、介质及终端 |
US20190236488A1 (en) * | 2018-01-30 | 2019-08-01 | Wal-Mart Stores, Inc. | Machine learning techniques for transmitting push notifications |
CN110704730A (zh) * | 2019-09-06 | 2020-01-17 | 中国平安财产保险股份有限公司 | 基于大数据的产品数据推送方法、系统及计算机设备 |
WO2020037930A1 (zh) * | 2018-08-20 | 2020-02-27 | 平安科技(深圳)有限公司 | 信息推荐方法、装置、计算机设备及存储介质 |
CN110909258A (zh) * | 2019-11-22 | 2020-03-24 | 上海喜马拉雅科技有限公司 | 一种信息推荐方法、装置、设备及存储介质 |
CN111028071A (zh) * | 2019-12-04 | 2020-04-17 | 北京三快在线科技有限公司 | 账单处理方法、装置、电子设备及存储介质 |
CN111062709A (zh) * | 2019-12-30 | 2020-04-24 | 北京三快在线科技有限公司 | 资源转移方式推荐方法、装置、电子设备及存储介质 |
-
2020
- 2020-05-15 CN CN202010411750.3A patent/CN113676505B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6012052A (en) * | 1998-01-15 | 2000-01-04 | Microsoft Corporation | Methods and apparatus for building resource transition probability models for use in pre-fetching resources, editing resource link topology, building resource link topology templates, and collaborative filtering |
WO2017101389A1 (zh) * | 2015-12-15 | 2017-06-22 | 乐视控股(北京)有限公司 | 一种移动终端的信息推荐方法及装置 |
CN106548402A (zh) * | 2016-10-18 | 2017-03-29 | 财付通支付科技有限公司 | 资源转移监控方法及装置 |
CN109426985A (zh) * | 2017-09-04 | 2019-03-05 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机设备和存储介质 |
US20190102468A1 (en) * | 2017-09-29 | 2019-04-04 | Facebook, Inc. | Determining a rate for sampling information describing presentation of content based on previously received information describing presentation of content |
CN107977355A (zh) * | 2017-11-17 | 2018-05-01 | 四川长虹电器股份有限公司 | 基于词向量训练的电视节目推荐方法 |
WO2019120037A1 (zh) * | 2017-12-18 | 2019-06-27 | Oppo广东移动通信有限公司 | 模型构建方法、网络资源预加载方法、装置、介质及终端 |
CN108133013A (zh) * | 2017-12-22 | 2018-06-08 | 平安养老保险股份有限公司 | 信息处理方法、装置、计算机设备和存储介质 |
US20190236488A1 (en) * | 2018-01-30 | 2019-08-01 | Wal-Mart Stores, Inc. | Machine learning techniques for transmitting push notifications |
CN108363821A (zh) * | 2018-05-09 | 2018-08-03 | 深圳壹账通智能科技有限公司 | 一种信息推送方法、装置、终端设备及存储介质 |
WO2020037930A1 (zh) * | 2018-08-20 | 2020-02-27 | 平安科技(深圳)有限公司 | 信息推荐方法、装置、计算机设备及存储介质 |
CN110704730A (zh) * | 2019-09-06 | 2020-01-17 | 中国平安财产保险股份有限公司 | 基于大数据的产品数据推送方法、系统及计算机设备 |
CN110909258A (zh) * | 2019-11-22 | 2020-03-24 | 上海喜马拉雅科技有限公司 | 一种信息推荐方法、装置、设备及存储介质 |
CN111028071A (zh) * | 2019-12-04 | 2020-04-17 | 北京三快在线科技有限公司 | 账单处理方法、装置、电子设备及存储介质 |
CN111062709A (zh) * | 2019-12-30 | 2020-04-24 | 北京三快在线科技有限公司 | 资源转移方式推荐方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
XIAO, Y (XIAO, YAO); SHI, Q (SHI, QUAN): "Research and Implementation of Hybrid Recommendation Algorithm Based on Collaborative Filtering and Word2Vec", 8TH INTERNATIONAL SYMPOSIUM ON COMPUTATIONAL INTELLIGENCE AND DESIGN (ISCID), pages 172 - 175 * |
崔艳萍, 阎知知, 王小巍等: "互联网信息资源用户获取优化推送仿真研究", 计算机仿真, vol. 34, no. 07, pages 273 - 276 * |
Also Published As
Publication number | Publication date |
---|---|
CN113676505B (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109919316B (zh) | 获取网络表示学习向量的方法、装置和设备及存储介质 | |
Qi et al. | Finding all you need: web APIs recommendation in web of things through keywords search | |
CN110941740B (zh) | 视频推荐方法及计算机可读存储介质 | |
CN108804633B (zh) | 基于行为语义知识网络的内容推荐方法 | |
US20220365939A1 (en) | Methods and systems for client side search ranking improvements | |
WO2018192496A1 (zh) | 热度信息的生成方法和装置、存储介质以及电子装置 | |
May Petry et al. | MARC: a robust method for multiple-aspect trajectory classification via space, time, and semantic embeddings | |
CN109062994A (zh) | 推荐方法、装置、计算机设备和存储介质 | |
Xu et al. | Integrated collaborative filtering recommendation in social cyber-physical systems | |
US20160125028A1 (en) | Systems and methods for query rewriting | |
CN110223186B (zh) | 用户相似度确定方法以及信息推荐方法 | |
US9674128B1 (en) | Analyzing distributed group discussions | |
CN113377971A (zh) | 多媒体资源生成方法、装置、电子设备以及存储介质 | |
CN110263160A (zh) | 一种计算机问答系统中的问句分类方法 | |
US20160104074A1 (en) | Recommending Bidded Terms | |
CN108133357A (zh) | 一种人才推荐方法及计算设备 | |
CN111369313A (zh) | 订房失败订单的处理方法、装置、计算机设备及存储介质 | |
CN110866637B (zh) | 评分预测方法、装置、计算机设备和存储介质 | |
Ravi et al. | An intelligent location recommender system utilising multi-agent induced cognitive behavioural model | |
Zhang et al. | Matching state estimation scheme for content-based sensor search in the Web of things | |
Dong et al. | Improving sequential recommendation with attribute-augmented graph neural networks | |
Kim et al. | Topic-Driven SocialRank: Personalized search result ranking by identifying similar, credible users in a social network | |
Shoja et al. | Tags-aware recommender systems: a systematic review | |
Ozsoy | Utilizing fasttext for venue recommendation | |
CN113676505B (zh) | 信息推送方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40055272 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |