CN110263250B - 一种推荐模型的生成方法及装置 - Google Patents

一种推荐模型的生成方法及装置 Download PDF

Info

Publication number
CN110263250B
CN110263250B CN201910505842.5A CN201910505842A CN110263250B CN 110263250 B CN110263250 B CN 110263250B CN 201910505842 A CN201910505842 A CN 201910505842A CN 110263250 B CN110263250 B CN 110263250B
Authority
CN
China
Prior art keywords
feature vector
node
model
geographic
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910505842.5A
Other languages
English (en)
Other versions
CN110263250A (zh
Inventor
郑文琛
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201910505842.5A priority Critical patent/CN110263250B/zh
Publication of CN110263250A publication Critical patent/CN110263250A/zh
Application granted granted Critical
Publication of CN110263250B publication Critical patent/CN110263250B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及科技金融(Fintech)技术领域,尤其涉及一种推荐模型的生成方法及装置,适用于以地理位置为节点、根据节点间的位置关系确定邻边的网络嵌入模型;所述方法包括:针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的;针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重。通过节点的时序特征向量、地理特征向量和信息推荐向量,提高推荐模型的推荐的准确性。

Description

一种推荐模型的生成方法及装置
技术领域
本发明涉及金融技术领域,尤其涉及一种推荐模型的生成方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Finteh)转变,信息推荐技术也不例外,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。
随着互联网技术的发展,网络平台上信息大量而多样,随着用户和产品数据的不断丰富(比如用户有社交关系,产品有属性、类别关联等)、以及用户和产品之间的交互变得越来越多样(除了点击、还有点赞、转发、浏览时长等行为),如何实现为用户推荐个性化和感兴趣的信息服务,是非常重要的。
现有技术中,信息推荐方法中考虑的用户和产品数据间的关联关系难以全面覆盖,影响用户覆盖率和推荐信息的多样性。
发明内容
本发明实施例提供一种推荐模型的生成方法及装置,以解决现有技术中信息推荐多样性差、推荐模型的推荐信息效果不佳的问题。
本发明实施例提供的具体技术方案如下:
本发明实施例提供一种推荐模型的生成方法,适用于以地理位置为节点、根据节点间的位置关系确定邻边的网络嵌入模型;所述方法包括:
针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的;所述关注对象为信息推荐的最小粒度;所述地理特征向量是根据所述节点所在地理区域的属性信息确定的;所述信息推荐向量是根据所述节点的已推荐信息的属性信息确定的;
针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,所述推荐模型中的各节点具有第二全局特征向量,节点间的邻边具有第二权重。
一种可能的实现方式,所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的,包括:
根据节点中的至少一个关注对象随时间变化的属性信息,建立RNN模型,所述RNN模型用于提取所述节点中的至少一个关注对象的时序特征向量;
对所述至少一个关注对象的时序特征向量进行池化,并对每个关注对象的时序特征向量增加权重,获得所述节点的第一时序特征向量。
一种可能的实现方式,所述地理特征向量是根据所述节点所在地理区域的属性信息确定的,包括:
根据节点中的地理位置的属性信息,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中的地理特征向量;
根据节点中的信息推荐数据,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中信息推荐特征向量;
将所述节点中的地理特征向量作为特征维度的地理特征向量;
将所述节点中的信息推荐特征向量作为地理特征维度的信息推荐特征向量。
一种可能的实现方式,所述根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量,包括:
对所述时序特征向量、地理特征向量和信息推荐特征向量进行池化,并根据所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重,确定所述节点的第一全局特征向量;所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重为根据所述网络嵌入模型训练得到的。
一种可能的实现方式,所述根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,包括:
将所述第一全局特征向量输入至特征提取模块,确定每个节点的第二全局特征向量;
将所述每个节点的第二全局特征向量作为所述网络嵌入模型中每个节点的特征向量进行训练;
根据所述第一样本数据的标签数据训练所述每个节点的第二全局特征向量及所述每个节点与其邻近节点的第二权重;所述每个节点的第二全局特征向量用于预测所述每个节点的推荐效果。
本发明实施例提供一种推荐模型的生成装置,适用于以地理位置为节点、根据节点间的位置关系确定邻边的网络嵌入模型;所述装置包括:
数据处理单元,用于针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的;所述关注对象为信息推荐的最小粒度;所述地理特征向量是根据所述节点所在地理区域的属性信息确定的;所述信息推荐向量是根据所述节点的已推荐信息的属性信息确定的;针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;
训练单元,用于根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,所述推荐模型中的各节点具有第二全局特征向量,节点间的邻边具有第二权重。
一种可能的实现方式,所述数据处理单元,具体用于:
根据节点中的至少一个关注对象随时间变化的属性信息,建立RNN模型,所述RNN模型用于提取所述节点中的至少一个关注对象的时序特征向量;对所述至少一个关注对象的时序特征向量进行池化,并对每个关注对象的时序特征向量增加权重,获得所述节点的第一时序特征向量。
一种可能的实现方式,所述数据处理单元,具体用于:
根据节点中的地理位置的属性信息,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中的地理特征向量;根据节点中的信息推荐数据,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中信息推荐特征向量;将所述节点中的地理特征向量作为特征维度的地理特征向量;将所述节点中的信息推荐特征向量作为地理特征维度的信息推荐特征向量。
一种可能的实现方式,所述数据处理单元,具体用于:
对所述时序特征向量、地理特征向量和信息推荐特征向量进行池化,并根据所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重,确定所述节点的第一全局特征向量;所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重为根据所述网络嵌入模型训练得到的。
一种可能的实现方式,所述训练单元,具体用于:
将所述第一全局特征向量输入至特征提取模块,确定每个节点的第二全局特征向量;将所述每个节点的第二全局特征向量作为所述网络嵌入模型中每个节点的特征向量进行训练;根据所述第一样本数据的标签数据训练所述每个节点的第二全局特征向量及所述每个节点与其邻近节点的第二权重;所述每个节点的第二全局特征向量用于预测所述每个节点的推荐效果。
本发明另一个实施例提供了一种电子设备,包括:
至少一个存储器,用于存储程序指令;
至少一个处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行上述任一种信息推荐方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种信息推荐方法的步骤。
通过上述实施例,针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;可以在时空环境中,综合考虑每个地点的时间特征、地理特征、信息推荐特征、以及地理位置相关性,根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,从而提高信息推荐的准确性。
附图说明
图1为本发明实施例中推荐模型的架构示意图;
图2为本发明实施例中推荐模型的生成方法的流程示意图;
图3为本发明实施例中推荐模型的生成装置结构示意图;
图4为本发明实施例中电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着用户和产品数据的不断丰富(比如用户有社交关系,产品有属性、类别关联等)、以及用户和产品之间的交互变得越来越多样(除了点击、还有点赞、转发、浏览时长等行为),传统的推荐和广告方法主要将用户和产品的交互数据处理成非结构化数据(比如用户-产品点击矩阵),然后通过矩阵分解等方法来进行计算用户对产品的感兴趣度。该方法无法很好的利用产品和用户间的关联关系。
下面对本发明实施例涉及的概念进行说明。
LBS:Location-based Service,即基于位置的服务。
LBS信息推荐:指媒体利用移动设备的位置和相关上下文信息,来对该设备的用户进行信息推荐推送。
ROI:Return on Investment,即投资回报率,在信息推荐中指信息推荐收益除以信息推荐费用。
POI:Point of Interest,关注对象,一个POI可以代表一栋大厦、一家商店等。
网络嵌入模型:为以对象为节点、对象间的关系为边的网络嵌入模型;所述网络嵌入模型中的每个节点包括表征节点属性的特征向量和表征节点作为邻居节点的参数向量。具体的,可以根据网络,定义每个节点的随机游走规则;根据规则对网络进行随机游走,保存游走记录;求得游走记录的最大似然函数,得到每个用户节点的节点属性的特征向量和表征节点作为邻居节点的参数向量。给定一个用户节点,通过网络嵌入模型确定的特征向量,确定出在网络上和他相关度高的产品节点。
传统LBS信息推荐主要基于设备所在的位置和当时的上下文来决定是否推荐,而这个推荐模型通常需要通过收集一些过往的信息推荐历史数据来训练和调优。一种可能的实现方式,可以直接利用地理特征学习,基于A的时序数据、地理数据和信息推荐数据学到一个能够预测每个地点可信息推荐程度(比如该地点的信息推荐ROI是多少)的模型M,然后直接把M用在B的时序数据和地理数据上,来预测B的每个地点的信息推荐ROI。
一种可能的实现方式,LBS的信息推荐主要基于设备所在的位置即节点的地理位置和节点的上下文来作为样本数据,进而确定网络嵌入模型,最终决定是否进行推荐。但是,可能对空间信息和时序信息的考虑不够,导致预测的准确率不足。
比如说空间信息,对于一个小微企业贷款而言,一个地点的好坏,通常和它周边的环境相关,如果它的周边是很多高准入门槛的工业园区,那么它也很有可能是个好园区,从而适合推送小微企业贷款的信息推荐。另比如说时间信息,一个地点对于小微企业贷款的好坏,也要看这个地点区域内的企业近一段时间的经营、交税、招聘等表现。比如只考虑利用空间信息对POI进行建模,但不考虑时间信息,预测的准确率不高。
基于上述问题,为提高推荐信息的准确率,本发明实施例中,如图2所示,提供一种信息模型的生成方法,适用于以地理位置为节点、根据节点间的位置关系确定邻边的网络嵌入模型;所述方法包括:
步骤201:针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;
其中,所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的;所述关注对象为信息推荐的最小粒度;所述地理特征向量是根据所述节点所在地理区域的属性信息确定的;所述信息推荐向量是根据所述节点的已推荐信息的属性信息确定的;
步骤202:针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;
步骤203:根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型;
其中,所述推荐模型中的各节点具有第二全局特征向量,节点间的邻边具有第二权重。
通过上述实施例,针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;可以在时空环境中,综合考虑每个地点的时间特征、地理特征、信息推荐特征、以及地理位置相关性,根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,从而提高信息推荐的准确性。
步骤201之前,可以获取推荐模型的第一样本数据,其中,第一样本数据可以包括但不限于时序数据、地理数据和第一信息推荐数据。其中,如图1所示,第一信息推荐数据可以为城市A已投放的信息,并获得标签值,例如ROI的数据。
举例来说,第一样本数据可以为一个已推荐信息推荐的城市A,它的一个地点集合,每个地点对应地图上的一个地域范围(比如500米*500米的方块),每个地点的坐标(比如经纬度)、地点的时序特征(比如在该地点上每个企业随时间变化的经营、交税、招聘等信息)、地理特征(比如有多少企业、有多少道路、是否在市中心等)、信息推荐特征(比如过往推荐了什么信息,效果如何)。
一种可能的实现方式,所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的,包括:
根据节点中的至少一个关注对象随时间变化的属性信息,建立RNN模型,所述RNN模型用于提取所述节点中的至少一个关注对象的时序特征向量;
对所述至少一个关注对象的时序特征向量进行池化,并对每个关注对象的时序特征向量增加权重,获得所述节点的第一时序特征向量。
举例来说,可以给定一个地点,它的每个节点中的POI的时序数据可以通过Recurrent Neural Network(RNN)建模,输出一个低维向量。得到多个POI的低维向量之后,进行Pooling(池化)得到一个低维向量,作为该地点的时序特征向量。在Pooling过程中,可以考虑使用attention(注意力)机制,对不同POI的贡献进行权重区分,比如一个地点内的工业园区企业占比重较高,而餐馆的占比重较低。
一种可能的实现方式,所述地理特征向量是根据所述节点所在地理区域的属性信息确定的,包括:
根据节点中的地理位置的属性信息,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中的地理特征向量;
根据节点中的信息推荐数据,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中信息推荐特征向量;
将所述节点中的地理特征向量作为特征维度的地理特征向量;
将所述节点中的信息推荐特征向量作为地理特征维度的信息推荐特征向量。
一种可能的实现方式,所述根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量,包括:
对所述时序特征向量、地理特征向量和信息推荐特征向量进行池化,并根据所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重,确定所述节点的第一全局特征向量;所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重为根据所述网络嵌入模型训练得到的。
举例来说,给定一个地点,会有多种特征,包括模块1的时序特征,以及地理特征和信息推荐特征。可选的,对地理特征和信息推荐特征进行深度学习,利用Deep NeuralNetwork(DNN)等模型,学到新的地理特征和新的信息推荐特征。在得到一个地点的多个特征之后,进行Pooling(池化),并引入attention(注意力)机制,最终得到一个低维向量,作为该地点的全局特征向量。
在步骤203中,一种可能的实现方式,根据每个节点的距离,确定每个节点的K个邻近节点,构建每个节点的邻边,建立关系网络;所述关系网络的参数为每个节点与其K个邻近节点间的邻边的权重。
在具体实施过程中,可以基于距离对每个地点做K近邻(K Nearest Neighbor,KNN)搜索,并将该地点和这K个最近邻做连边,从而最终得到一个节点间的关系网络。在这个网络上,每个边的权重取决于它的两个地点之间关系权重。地点和地点之间的关系权重由多项因素决定,这包括距离,即两个节点间的全局特征向量相似度大于预设阈值(比如越近的地点,特征应该越像)、两个节点间时序特征向量相似度大于预设阈值,即POI的关系(比如,相较于工业园区和餐饮区,工业园区和工业园区之间的特征应该越像)、两个节点间的地理特征向量相似度大于预设阈值(比如,两个市中心地点的特征应该更像,相较于一个市中心地点和一个郊区地点)等。进一步的,这些因素在衡量不同地点之间关系权重时的贡献占比可以不同,可以通过引入一个attention(注意力)机制,结合信息推荐的标签,来学习出特征向量权重的占比和对应边的权重。
进一步的,一种可能的实现方式,一种可能的实现方式,所述根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,包括:
将所述第一全局特征向量输入至特征提取模块,确定每个节点的第二全局特征向量;
将所述每个节点的第二全局特征向量作为所述网络嵌入模型中每个节点的特征向量进行训练;
根据所述第一样本数据的标签数据训练所述每个节点的第二全局特征向量及所述每个节点与其邻近节点的第二权重;所述每个节点的第二全局特征向量用于预测所述每个节点的推荐效果。
在具体实施过程中,通过一个有监督的、带attention(注意力)机制的网络嵌入(network embedding)模型,来学习每个地点的最终低维特征向量。这个模型要求每个节点的特征向量满足的第二设定条件,可以包括但不限于以下一项或多项:
1)节点的第二全局特征向量,预测的信息推荐效果大于第二预设阈值;
2)节点的第二全局特征向量可以通过对节点的第一全局特征向量特征提取获得,即节点的第二全局特征向量与节点的第一全局特征向量存在非线性变化。
3)节点的第二全局特征向量与其关系网络上的邻近节点的第二全局特征向量的相似度大于第三预设阈值。
通过上述实施例,可以在时空环境中,综合考虑每个地点的时间特征、地理特征、信息推荐特征、以及地理位置相关性,从而提高信息推荐的准确性。
以节点为地点举例,给定城市A的一个地点a和一个地点b,通过相关性分析(correlation analysis),计算a和b之间的相关度。如果a和b的相关度超过一定阈值ε,那么a和b之间就建立一个对应连边。需要说明的是,第一预设阈值ε可以通过对第一样本数据的有监督学习得到。相应的,给定城市A,也可以对它城内的所有地点进行类似相关性分析和关系网络建模。假设城内节点相关度的第三预设阈值为ε′,也可以通过对第一样本数据的有监督学习得到。
基于相同的发明构思,如图3所示,本发明实施例提供一种推荐模型的生成装置,适用于以地理位置为节点、根据节点间的位置关系确定邻边的网络嵌入模型;所述装置包括:
数据处理单元401,用于针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的;所述关注对象为信息推荐的最小粒度;所述地理特征向量是根据所述节点所在地理区域的属性信息确定的;所述信息推荐向量是根据所述节点的已推荐信息的属性信息确定的;针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;
训练单元402,用于根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,所述推荐模型中的各节点具有第二全局特征向量,节点间的邻边具有第二权重。
一种可能的实现方式,数据处理单元401,具体用于:
根据节点中的至少一个关注对象随时间变化的属性信息,建立RNN模型,所述RNN模型用于提取所述节点中的至少一个关注对象的时序特征向量;对所述至少一个关注对象的时序特征向量进行池化,并对每个关注对象的时序特征向量增加权重,获得所述节点的第一时序特征向量。
一种可能的实现方式,数据处理单元401,具体用于:
根据节点中的地理位置的属性信息,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中的地理特征向量;根据节点中的信息推荐数据,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中信息推荐特征向量;将所述节点中的地理特征向量作为特征维度的地理特征向量;将所述节点中的信息推荐特征向量作为地理特征维度的信息推荐特征向量。
一种可能的实现方式,数据处理单元401,具体用于:
对所述时序特征向量、地理特征向量和信息推荐特征向量进行池化,并根据所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重,确定所述节点的第一全局特征向量;所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重为根据所述网络嵌入模型训练得到的。
一种可能的实现方式,训练单元402,具体用于:
将所述第一全局特征向量输入至特征提取模块,确定每个节点的第二全局特征向量;将所述每个节点的第二全局特征向量作为所述网络嵌入模型中每个节点的特征向量进行训练;根据所述第一样本数据的标签数据训练所述每个节点的第二全局特征向量及所述每个节点与其邻近节点的第二权重;所述每个节点的第二全局特征向量用于预测所述每个节点的推荐效果。
基于上述实施例,参阅图4所示,本发明实施例中,一种计算机设备的结构示意图。
本发明实施例提供了一种计算机设备,该计算机设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图4中示出的结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及推荐模型的生成程序。其中,操作系统是管理和控制模型参数获取系统硬件和软件资源的程序,支持推荐模型的生成程序以及其它软件或程序的运行。
用户接口1003主要用于连接、第二服务器和第三服务器等,与各个服务器进行数据通信;网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;而处理器1001可以用于调用存储器1005中存储的推荐模型的生成程序,并执行以下操作:
针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的;所述关注对象为信息推荐的最小粒度;所述地理特征向量是根据所述节点所在地理区域的属性信息确定的;所述信息推荐向量是根据所述节点的已推荐信息的属性信息确定的;针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;
根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,所述推荐模型中的各节点具有第二全局特征向量,节点间的邻边具有第二权重。
一种可能的实现方式,处理器1001,用于:
根据节点中的至少一个关注对象随时间变化的属性信息,建立RNN模型,所述RNN模型用于提取所述节点中的至少一个关注对象的时序特征向量;对所述至少一个关注对象的时序特征向量进行池化,并对每个关注对象的时序特征向量增加权重,获得所述节点的第一时序特征向量。
一种可能的实现方式,处理器1001,用于:
根据节点中的地理位置的属性信息,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中的地理特征向量;根据节点中的信息推荐数据,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中信息推荐特征向量;将所述节点中的地理特征向量作为特征维度的地理特征向量;将所述节点中的信息推荐特征向量作为地理特征维度的信息推荐特征向量。
一种可能的实现方式,处理器1001,用于:
对所述时序特征向量、地理特征向量和信息推荐特征向量进行池化,并根据所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重,确定所述节点的第一全局特征向量;所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重为根据所述网络嵌入模型训练得到的。
一种可能的实现方式,处理器1001,用于:
将所述第一全局特征向量输入至特征提取模块,确定每个节点的第二全局特征向量;将所述每个节点的第二全局特征向量作为所述网络嵌入模型中每个节点的特征向量进行训练;根据所述第一样本数据的标签数据训练所述每个节点的第二全局特征向量及所述每个节点与其邻近节点的第二权重;所述每个节点的第二全局特征向量用于预测所述每个节点的推荐效果。
基于上述实施例,本发明实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的推荐模型的生成方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种推荐模型的生成方法,其特征在于,适用于以地理位置为节点、根据节点间的位置关系确定邻边的网络嵌入模型;所述方法包括:
针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的;所述关注对象为信息推荐的最小粒度;所述地理特征向量是根据所述节点所在地理区域的属性信息确定的;所述信息推荐向量是根据所述节点的已推荐信息的属性信息确定的;
针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;
基于所述网络嵌入模型中各节点的第一全局特征向量以及节点间的第一权重,根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型;所述训练后的推荐模型中的各节点具有第二全局特征向量,所述第二全局特征向量与其邻近节点的第二全局特征向量的相似度大于第三预设阈值,节点间的邻边具有第二权重,其中,每个节点的第二全局特征向量用于预测所述每个节点的推荐效果,且预测的信息推荐效果大于第二预设阈值。
2.如权利要求1所述的方法,其特征在于,所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的,包括:
根据节点中的至少一个关注对象随时间变化的属性信息,建立RNN模型,所述RNN模型用于提取所述节点中的至少一个关注对象的时序特征向量;
对所述至少一个关注对象的时序特征向量进行池化,并对每个关注对象的时序特征向量增加权重,获得所述节点的第一时序特征向量。
3.如权利要求1所述的方法,其特征在于,所述地理特征向量是根据所述节点所在地理区域的属性信息确定的,包括:
根据节点中的地理位置的属性信息,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中的地理特征向量;
根据节点中的信息推荐数据,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中信息推荐特征向量;
将所述节点中的地理特征向量作为特征维度的地理特征向量;
将所述节点中的信息推荐特征向量作为地理特征维度的信息推荐特征向量。
4.如权利要求1-3任一项所述的方法,其特征在于,所述根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量,包括:
对所述时序特征向量、地理特征向量和信息推荐特征向量进行池化,并根据所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重,确定所述节点的第一全局特征向量;所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重为根据所述网络嵌入模型训练得到的。
5.如权利要求1所述的方法,其特征在于,所述基于所述网络嵌入模型中各节点的第一全局特征向量以及节点间的第一权重,根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,包括:
将所述第一全局特征向量输入至特征提取模块,确定每个节点的第二全局特征向量;
将所述每个节点的第二全局特征向量作为所述网络嵌入模型中每个节点的特征向量进行训练;
基于所述第二全局特征向量以及节点间的第一权重,根据第一样本数据的标签数据训练所述每个节点的第二全局特征向量及所述每个节点与其邻近节点的第二权重;所述每个节点的第二全局特征向量用于预测所述每个节点的推荐效果。
6.一种推荐模型的生成装置,其特征在于,适用于以地理位置为节点、根据节点间的位置关系确定邻边的网络嵌入模型;所述装置包括:
数据处理单元,用于针对所述网络嵌入模型中的任一节点,根据所述节点的时序特征向量、地理特征向量和信息推荐向量,确定所述节点的第一全局特征向量;所述时序特征向量是根据所述节点的至少一个关注对象随时间变化的属性信息确定的;所述关注对象为信息推荐的最小粒度;所述地理特征向量是根据所述节点所在地理区域的属性信息确定的;所述信息推荐向量是根据所述节点的已推荐信息的属性信息确定的;针对所述网络嵌入模型中的任一邻边,根据所述邻边的两个节点的第一全局特征向量确定所述邻边的第一权重;
训练单元,用于基于所述网络嵌入模型中各节点的第一全局特征向量以及节点间的第一权重,根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,所述推荐模型中的各节点具有第二全局特征向量,所述第二全局特征向量与其邻近节点的第二全局特征向量的相似度大于第三预设阈值,节点间的邻边具有第二权重,其中,每个节点的第二全局特征向量用于预测所述每个节点的推荐效果,且预测的信息推荐效果大于第二预设阈值。
7.如权利要求6所述的装置,其特征在于,所述数据处理单元,具体用于:
根据节点中的至少一个关注对象随时间变化的属性信息,建立RNN模型,所述RNN模型用于提取所述节点中的至少一个关注对象的时序特征向量;对所述至少一个关注对象的时序特征向量进行池化,并对每个关注对象的时序特征向量增加权重,获得所述节点的第一时序特征向量。
8.如权利要求6所述的装置,其特征在于,所述数据处理单元,具体用于:
根据节点中的地理位置的属性信息,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中的地理特征向量;根据节点中的信息推荐数据,建立深度学习网络DNN模型,所述DNN模型用于提取所述节点中信息推荐特征向量;将所述节点中的地理特征向量作为特征维度的地理特征向量;将所述节点中的信息推荐特征向量作为地理特征维度的信息推荐特征向量。
9.如权利要求6-8任一项所述的装置,其特征在于,所述数据处理单元,具体用于:
对所述时序特征向量、地理特征向量和信息推荐特征向量进行池化,并根据所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重,确定所述节点的第一全局特征向量;所述时序特征向量的特征向量权重、地理特征向量的特征向量权重和信息推荐特征向量的特征向量权重为根据所述网络嵌入模型训练得到的。
10.如权利要求6所述的装置,其特征在于,所述基于所述网络嵌入模型中各节点的第一全局特征向量以及节点间的第一权重,根据样本数据对所述网络嵌入模型进行训练,得到训练后的推荐模型,包括:
将所述第一全局特征向量输入至特征提取模块,确定每个节点的第二全局特征向量;将所述每个节点的第二全局特征向量作为所述网络嵌入模型中每个节点的特征向量进行训练;基于所述第二全局特征向量以及节点间的第一权重,根据第一样本数据的标签数据训练所述每个节点的第二全局特征向量及所述每个节点与其邻近节点的第二权重;所述每个节点的第二全局特征向量用于预测所述每个节点的推荐效果。
11.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一项所述的方法中的步骤。
12.一种计算机设备,其特征在于,包括:
至少一个存储器,用于存储程序指令;
至少一个处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行上述权利要求1-5任一项所述的方法。
CN201910505842.5A 2019-06-12 2019-06-12 一种推荐模型的生成方法及装置 Active CN110263250B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910505842.5A CN110263250B (zh) 2019-06-12 2019-06-12 一种推荐模型的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910505842.5A CN110263250B (zh) 2019-06-12 2019-06-12 一种推荐模型的生成方法及装置

Publications (2)

Publication Number Publication Date
CN110263250A CN110263250A (zh) 2019-09-20
CN110263250B true CN110263250B (zh) 2023-04-28

Family

ID=67917805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910505842.5A Active CN110263250B (zh) 2019-06-12 2019-06-12 一种推荐模型的生成方法及装置

Country Status (1)

Country Link
CN (1) CN110263250B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990698B (zh) * 2019-11-29 2021-01-08 珠海大横琴科技发展有限公司 一种推荐模型构建方法和装置
CN111092804B (zh) * 2019-12-05 2022-03-08 腾讯科技(深圳)有限公司 信息推荐方法、信息推荐装置、电子设备和存储介质
CN112328911B (zh) * 2020-10-30 2023-05-23 腾讯科技(深圳)有限公司 地点推荐方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596774A (zh) * 2018-04-24 2018-09-28 山东师范大学 基于深层次网络嵌入特征的社会化信息推荐算法及系统
CN109242633A (zh) * 2018-09-20 2019-01-18 阿里巴巴集团控股有限公司 一种基于二部图网络的商品推送方法和装置
CN109408731A (zh) * 2018-12-27 2019-03-01 网易(杭州)网络有限公司 一种多目标推荐方法、多目标推荐模型生成方法以及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009007965A2 (en) * 2007-07-09 2009-01-15 Technion Research & Development Foundation Ltd Routing methods for multiple geographical entities
US20160350834A1 (en) * 2015-06-01 2016-12-01 Nara Logics, Inc. Systems and methods for constructing and applying synaptic networks
WO2018097898A1 (en) * 2016-11-23 2018-05-31 Linkedin Corporation Embedded deep representation of social network taxonomy
CN108304526B (zh) * 2018-01-25 2022-02-11 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN108763493B (zh) * 2018-05-30 2022-06-21 深圳市思迪信息技术股份有限公司 一种基于深度学习的推荐方法
CN109034960B (zh) * 2018-07-12 2022-09-06 电子科技大学 一种基于用户节点嵌入的多属性推断的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596774A (zh) * 2018-04-24 2018-09-28 山东师范大学 基于深层次网络嵌入特征的社会化信息推荐算法及系统
CN109242633A (zh) * 2018-09-20 2019-01-18 阿里巴巴集团控股有限公司 一种基于二部图网络的商品推送方法和装置
CN109408731A (zh) * 2018-12-27 2019-03-01 网易(杭州)网络有限公司 一种多目标推荐方法、多目标推荐模型生成方法以及装置

Also Published As

Publication number Publication date
CN110263250A (zh) 2019-09-20

Similar Documents

Publication Publication Date Title
Luo et al. ESTNet: embedded spatial-temporal network for modeling traffic flow dynamics
Mehmood et al. Smart infrastructure and applications
US9904932B2 (en) Analyzing semantic places and related data from a plurality of location data reports
CN105532030B (zh) 用于分析目标实体的移动的装置、系统和方法
Christelis et al. Pumping optimization of coastal aquifers assisted by adaptive metamodelling methods and radial basis functions
US9123259B2 (en) Discovering functional groups of an area
CN110263250B (zh) 一种推荐模型的生成方法及装置
Wang et al. Comparative performance of logistic regression and survival analysis for detecting spatial predictors of land-use change
CN110276387B (zh) 一种模型的生成方法及装置
Li et al. Towards smart transportation system: A case study on the rebalancing problem of bike sharing system based on reinforcement learning
CN116828515A (zh) 一种车联网下基于时空图卷积的边缘服务器负载预测方法
Andrade et al. From mobility data to habits and common pathways
Halim et al. On finding optimum commuting path in a road network: a computational approach for smart city traveling
CN115408618A (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
CN110889029B (zh) 城市目标推荐方法和装置
CN106600053B (zh) 一种基于时空轨迹和社会网络的用户属性预测系统
Quan et al. An optimized task assignment framework based on crowdsourcing knowledge graph and prediction
Zhou et al. Traffic conduction analysis model with time series rule mining
CN116976961A (zh) 选址方法、装置、电子设备及存储介质
Bencekri et al. A planning support system for boosting bikeability in seoul
JP6276722B2 (ja) 行動予測装置、行動予測方法及び行動予測プログラム
US9532165B2 (en) Method and apparatus for location prediction using short text
CN114119078A (zh) 目标资源确定方法、装置、电子设备及介质
Cao et al. Modeling the variation in the trajectory of crosswalk overflow violation pedestrians in China and Countermeasure
Camargo et al. Diagnosing the performance of human mobility models at small spatial scales using volunteered geographic information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant