CN111523933A - 一种下单概率预测方法、装置、电子设备及可读存储介质 - Google Patents

一种下单概率预测方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN111523933A
CN111523933A CN202010319254.5A CN202010319254A CN111523933A CN 111523933 A CN111523933 A CN 111523933A CN 202010319254 A CN202010319254 A CN 202010319254A CN 111523933 A CN111523933 A CN 111523933A
Authority
CN
China
Prior art keywords
node
bubbling
user
feature
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010319254.5A
Other languages
English (en)
Other versions
CN111523933B (zh
Inventor
唐甜田
段明琪
卓呈祥
李奘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202010319254.5A priority Critical patent/CN111523933B/zh
Publication of CN111523933A publication Critical patent/CN111523933A/zh
Application granted granted Critical
Publication of CN111523933B publication Critical patent/CN111523933B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种下单概率预测方法、装置、电子设备及可读存储介质,通过获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和场景节点的出行特征异构图;基于用户特征、冒泡特征、场景特征和出行特征异构图,确定待预测用户的下单概率的预测特征异构图;将预测特征异构图输入至训练好的下单概率预测模型中,得到所述待预测用户此次冒泡行为的下单概率。这样,通过乘客、冒泡、场景等实体之间的关联对待预测用户的冒泡行为进行特征聚合,能够更加准确的对待预测用户此次冒泡行为的下单概率进行预测,有效提高下单概率的预测准确度。

Description

一种下单概率预测方法、装置、电子设备及可读存储介质
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种下单概率预测方法、装置、电子设备及可读存储介质。
背景技术
随着科技的逐步发展,人们生活水平的日益提高,如今,人们出行时大多会选择通过出行软件进行打车服务,一般人们在正式下单进行车辆预约之前会输入起点和终点等用车信息,然后获取反馈信息,例如出行的预估时间、预估距离和预估价钱等,这样的一次询问可以称为一次冒泡。对于网约车平台而言,当有用户出现冒泡后,对用户的下单意愿作出准确、合理的测算十分重要。
目前,对用户发生冒泡后的下单概率进行预测,大多是只关注冒泡用户当时的特征,或者冒泡用户的历史下单情况等,但是,因为单个用户的数据有限,预测结果易存在统计片面、测算不准确的问题。
发明内容
有鉴于此,本申请的目的在于提供一种下单概率预测方法、装置、电子设备及可读存储介质,能够通过广泛历史数据构建的乘客、冒泡、场景等实体之间的关联,以及待预测用户的相关特征和深度学习模型,对待预测用户的冒泡行为进行特征聚合,利用节点丰富的属性信息与异构图网络的结构信息预测用户冒泡后的下单概率,更加准确的对待预测用户此次冒泡行为的下单概率进行预测,可以有效提高下单概率的预测准确度。
本申请实施例提供了一种下单概率预测方法,所述下单概率预测方法包括:
获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;
基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;
将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;
将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
进一步的,在所述获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图之前,所述下单概率预测方法包括:
从获取到的历史出行数据中确定出多个历史出行订单,以及与每个历史出行订单对应的用户历史特征向量、冒泡历史特征向量和场景历史特征向量;
确定出与每个用户历史特征向量对应的包括对应用户历史特征向量的用户节点、与每个冒泡历史特征信息对应的包括对应冒泡历史特征向量的冒泡节点和与每个场景历史特征信息对应的包括对应场景历史特征向量的场景节点;
构建包括多个用户节点、多个冒泡节点和多个场景节点的所述出行特征异构图,其中,在所述出行特征异构图中,每个冒泡历点与相关联的用户节点和场景节点连接,每个用户节点与相关联的至少一个冒泡节点连接,每个场景节点与相关联的至少一个冒泡节点连接。
进一步的,所述基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图,包括:
从所述出行特征异构图中确定与所述待预测用户的用户信息相匹配的用户节点或者场景节点,其中,所述用户信息包括所述用户特征或者所述场景特征;
从所述出行特征异构图中确定出与匹配到的用户节点或者场景节点直接连接的冒泡节点和间接连接的冒泡节点,以及与直接连接的冒泡节点或者间接连接的冒泡节点间接连接的用户节点和场景节点;
生成包括所述用户特征的用户节点、包括所述场景特征的场景节点和包括所述冒泡特征的冒泡节点;
将生成的用户节点、场景节点和冒泡节点加入到匹配出的多个用户节点、多个场景节点和多个冒泡节点中,并构建用于预测所述待预测用户的下单概率的预测特征异构图。
进一步的,所述将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数,包括:
将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,分别对所述预测特征异构图中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到包括邻居节点特征聚合处理后的多个用户节点、多个场景节点和多个冒泡节点的特征聚合异构图;
将得到的特征聚合异构图作为所述预测特征异构图,对其中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到聚合后的特征聚合异构图;
直至进行k次邻居节点特征聚合,得到进行k阶邻居节点特征聚合后的预测特征异构图,并从k阶邻居节点特征聚合后的预测特征异构图中确定出与所述冒泡特征对应的待预测冒泡节点以及所述待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数。
进一步的,通过以下公式对所述预测特征异构图中的冒泡节点进行邻居节点特征聚合:
Figure BDA0002460726820000031
其中,
Figure BDA0002460726820000032
为进行k阶邻居节点特征聚合后预测特征异构图中冒泡节点b的特征向量,σ为聚合参数,
Figure BDA0002460726820000033
为进行k阶邻居节点特征聚合后预测特征异构图中冒泡节点b的邻接矩阵,concat为连接标识符,
Figure BDA0002460726820000034
为进行k-1阶邻居节点特征聚合后所述预测特征异构图中冒泡节点b的特征向量,
Figure BDA0002460726820000035
为进行k-1阶邻居节点特征聚合后预测特征异构图中用户节点p的特征向量,
Figure BDA0002460726820000036
为进行k-1阶邻居节点特征聚合后预测特征异构图中场景节点s的特征向量。
进一步的,通过以下方式对所述预测特征异构图中的用户节点或者场景节点进行邻居节点特征聚合:
在对预测特征异构图进行k阶邻居节点特征聚合时,确定进行k-1阶邻居节点特征聚合后的预测特征异构图中与用户节点或者场景节点连接的至少一个冒泡节点,以及确定出的至少一个冒泡节点中冒泡时间最近的最新冒泡节点;
确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值;
基于所述注意力值和基于所述最新冒泡节点的冒泡特征向量确定出的值向量,以及k-1阶邻居节点特征聚合后所述用户节点或者场景节点的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合后,得到所述预测特征异构图中所述用户节点或者场景节点的节点特征向量。
进一步的,所述确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值,包括:
基于确定出的至少一个冒泡节点中每个冒泡节点的冒泡特征向量,确定出所述最新冒泡节点的查询向量、键向量和值向量,以及至少一个冒泡节点中除所述最新冒泡节点外的每个其他冒泡节点的键向量和值向量;
基于所述最新冒泡节点的查询向量、键向量和值向量,以及每个其他冒泡节点的键向量和值向量,确定出所述历史冒泡节点对于所述最新冒泡节点的注意力值。
进一步的,所述基于所述最新冒泡节点的查询向量、键向量和值向量,以及每个其他冒泡节点的键向量和值向量,确定出所述历史冒泡节点对于所述最新冒泡节点的注意力值,包括:
通过以下公式计算其他冒泡节点对于所述最新冒泡节点的注意力值:
Figure BDA0002460726820000041
其中,Attention(Q(b,n),K(b,n),V(b,n))为所述历史冒泡节点对于至少一个冒泡节点中第n个的所述最新冒泡节点b的注意力值,FC为全连接层网络,concat为连接标识符,Q(b,n)为第n个的所述最新冒泡节点b的查询向量,K(b,n)为第n个的所述最新冒泡节点b的键向量,V(b,n)为第n个的所述最新冒泡节点b的值向量,当i属于(0,n-1)时,K(b,i)为n-1个所述历史冒泡节点中第i个其他冒泡节点的键向量,V(b,i)为n-1个所述历史冒泡节点中第i个其他冒泡节点的值向量,当i=n时,K(b,i)=K(b,n),V(b,i)=V(b,n)
进一步的,所述基于所述注意力值和基于所述最新冒泡节点的冒泡特征向量确定出的值向量,以及k-1阶邻居节点特征聚合后所述用户节点或者场景节点的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合后,得到所述预测特征异构图中所述用户节点或者场景节点的节点特征向量,包括:
通过以下公式确定所述用户节点或者场景节点的节点特征向量:
Figure BDA0002460726820000042
其中,
Figure BDA0002460726820000043
为进行L次第k阶集合时,第i次进行第k阶集合得到的针对用户节点或这场景节点进行k阶邻居节点特征聚合后的单次特征向量,concat为连接标识符ResNet表示残差网络,Attention(Q(b,n),K(b,n),V(b,n))为所述历史冒泡节点对于所述最新冒泡节点n的注意力值,
Figure BDA0002460726820000044
为所述最新冒泡节点b的k-1阶聚合输出的邻居节点特征聚合向量,
Figure BDA0002460726820000045
为用户节点p或者场景节点s的k-1阶聚合输出的节点特征向量,
Figure BDA0002460726820000046
为合并多个所述单次特征向量后得到的对用户节点p或者场景节点s进行k阶邻居节点特征聚合后的节点特征向量,Wmh为将多头注意力机制的结果进行合并聚合的邻接矩阵。
进一步的,通过以下步骤训练所述下单概率预测模型:
从样本冒泡数据中确定出多个样本冒泡行为,以及与每个样本冒泡行为对应的样本用户特征、样本冒泡特征、样本场景特征和每个样本冒泡行为的真实下单结果;
基于确定出的多个样本用户特征、多个样本冒泡特征和多个样本场景特征,构建用于模型训练的样本特征异构图,其中,所述样本特征异构图包括多个包括对应样本冒泡特征的样本冒泡节点,与至少一个样本冒泡节点连接的包括对应样本用户特征的样本用户节点,和与至少一个样本冒泡节点连接包括对应样本场景特征的样本场景节点;
将所述样本特征异构图输入至构建好的神经网络模型中,得到每个样本冒泡节点的样本下单概率;
基于每个样本冒泡节点的样本下单概率和真实下单结果对所述神经网络模型进行反向训练,直至所述神经网络模型的交叉熵损失值小于预设交叉熵损失阈值,确定所述神经网络模型训练完毕,并将训练完毕的所述神经网络模型作为所述下单概率预测模型。
本申请实施例还提供了一种下单概率预测装置,所述下单概率预测装置包括:
特征获取模块,用于获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;
第一异构图确定模块,用于基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;
特征向量确定模块,用于将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;
概率预测模块,用于将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
进一步的,所述下单概率预测装置还包括第二异构图确定模块,所述第二异构图确定模块用于:
从获取到的历史出行数据中确定出多个历史出行订单,以及与每个历史出行订单对应的用户历史特征向量、冒泡历史特征向量和场景历史特征向量;
确定出与每个用户历史特征向量对应的包括对应用户历史特征向量的用户节点、与每个冒泡历史特征信息对应的包括对应冒泡历史特征向量的冒泡节点和与每个场景历史特征信息对应的包括对应场景历史特征向量的场景节点;
构建包括多个用户节点、多个冒泡节点和多个场景节点的所述出行特征异构图,其中,在所述出行特征异构图中,每个冒泡历点与相关联的用户节点和场景节点连接,每个用户节点与相关联的至少一个冒泡节点连接,每个场景节点与相关联的至少一个冒泡节点连接。
进一步的,所述第一异构图确定模块在用于基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图时,所述第一异构图确定模块用于:
从所述出行特征异构图中确定与所述待预测用户的用户信息相匹配的用户节点或者场景节点,其中,所述用户信息包括所述用户特征或者所述场景特征;
从所述出行特征异构图中确定出与匹配到的用户节点或者场景节点直接连接的冒泡节点和间接连接的冒泡节点,以及与直接连接的冒泡节点或者间接连接的冒泡节点间接连接的用户节点和场景节点;
生成包括所述用户特征的用户节点、包括所述场景特征的场景节点和包括所述冒泡特征的冒泡节点;
将生成的用户节点、场景节点和冒泡节点加入到匹配出的多个用户节点、多个场景节点和多个冒泡节点中,并构建用于预测所述待预测用户的下单概率的预测特征异构图。
进一步的,所述特征向量确定模块在用于将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数时,所述特征向量确定模块用于:
将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,分别对所述预测特征异构图中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到包括邻居节点特征聚合处理后的多个用户节点、多个场景节点和多个冒泡节点的特征聚合异构图;
将得到的特征聚合异构图作为所述预测特征异构图,对其中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到聚合后的特征聚合异构图;
直至进行k次邻居节点特征聚合,得到进行k阶邻居节点特征聚合后的预测特征异构图,并从k阶邻居节点特征聚合后的预测特征异构图中确定出与所述冒泡特征对应的待预测冒泡节点以及所述待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数。
进一步的,所述特征向量确定模块通过以下公式对所述预测特征异构图中的冒泡节点进行邻居节点特征聚合:
Figure BDA0002460726820000061
其中,
Figure BDA0002460726820000062
为进行k阶邻居节点特征聚合后预测特征异构图中冒泡节点b的特征向量,σ为聚合参数,
Figure BDA0002460726820000063
为进行k阶邻居节点特征聚合后预测特征异构图中冒泡节点b的邻接矩阵,concat为连接标识符,
Figure BDA0002460726820000064
为进行k-1阶邻居节点特征聚合后所述预测特征异构图中冒泡节点b的特征向量,
Figure BDA0002460726820000065
为进行k-1阶邻居节点特征聚合后预测特征异构图中用户节点p的特征向量,
Figure BDA0002460726820000066
为进行k-1阶邻居节点特征聚合后预测特征异构图中场景节点s的特征向量。
进一步的,所述特征向量确定模块用于通过以下方式对所述预测特征异构图中的用户节点或者场景节点进行邻居节点特征聚合:
在对预测特征异构图进行k阶邻居节点特征聚合时,确定进行k-1阶邻居节点特征聚合后的预测特征异构图中与用户节点或者场景节点连接的至少一个冒泡节点,以及确定出的至少一个冒泡节点中冒泡时间最近的最新冒泡节点;
确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值;
基于所述注意力值和基于所述最新冒泡节点的冒泡特征向量确定出的值向量,以及k-1阶邻居节点特征聚合后所述用户节点或者场景节点的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合后,得到所述预测特征异构图中所述用户节点或者场景节点的节点特征向量。
进一步的,所述特征向量确定模块在用于确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值时,所述特征向量确定模块用于:
基于确定出的至少一个冒泡节点中每个冒泡节点的冒泡特征向量,确定出所述最新冒泡节点的查询向量、键向量和值向量,以及至少一个冒泡节点中除所述最新冒泡节点外的每个其他冒泡节点的键向量和值向量;
基于所述最新冒泡节点的查询向量、键向量和值向量,以及每个其他冒泡节点的键向量和值向量,确定出所述历史冒泡节点对于所述最新冒泡节点的注意力值。
进一步的,所述特征向量确定模块在用于基于所述最新冒泡节点的查询向量、键向量和值向量,以及每个其他冒泡节点的键向量和值向量,确定出所述历史冒泡节点对于所述最新冒泡节点的注意力值时,所述特征向量确定模块用于:
通过以下公式计算其他冒泡节点对于所述最新冒泡节点的注意力值:
Figure BDA0002460726820000071
其中,Attention(Q(b,n),K(b,n),V(b,n))为所述历史冒泡节点对于至少一个冒泡节点中第n个的所述最新冒泡节点b的注意力值,FC为全连接层网络,concat为连接标识符,Q(b,n)为第n个的所述最新冒泡节点b的查询向量,K(b,n)为第n个的所述最新冒泡节点b的键向量,V(b,n)为第n个的所述最新冒泡节点b的值向量,当i属于(0,n-1)时,K(b,i)为n-1个所述历史冒泡节点中第i个其他冒泡节点的键向量,V(b,i)为n-1个所述历史冒泡节点中第i个其他冒泡节点的值向量,当i=n时,K(b,i)=K(b,n),V(b,i)=V(b,n)
进一步的,所述特征向量确定模块在用于基于所述注意力值和基于所述最新冒泡节点的冒泡特征向量确定出的值向量,以及k-1阶邻居节点特征聚合后所述用户节点或者场景节点的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合后,得到所述预测特征异构图中所述用户节点或者场景节点的节点特征向量时,所述特征向量确定模块用于:
通过以下公式确定所述用户节点或者场景节点的节点特征向量:
Figure BDA0002460726820000081
其中,
Figure BDA0002460726820000082
为进行L次第k阶集合时,第i次进行第k阶集合得到的针对用户节点或这场景节点进行k阶邻居节点特征聚合后的单次特征向量,concat为连接标识符ResNet表示残差网络,Attention(Q(b,n),K(b,n),V(b,n))为所述历史冒泡节点对于所述最新冒泡节点n的注意力值,
Figure BDA0002460726820000083
为所述最新冒泡节点b的k-1阶聚合输出的邻居节点特征聚合向量,
Figure BDA0002460726820000084
为用户节点p或者场景节点s的k-1阶聚合输出的节点特征向量,
Figure BDA0002460726820000085
为合并多个所述单次特征向量后得到的对用户节点p或者场景节点s进行k阶邻居节点特征聚合后的节点特征向量,Wmh为将多头注意力机制的结果进行合并聚合的邻接矩阵。
进一步的,所述下单概率预测装置还包括预测模型训练模块,所述预测模型训练模块用于通过以下步骤训练所述下单概率预测模型:
从样本冒泡数据中确定出多个样本冒泡行为,以及与每个样本冒泡行为对应的样本用户特征、样本冒泡特征、样本场景特征和每个样本冒泡行为的真实下单结果;
基于确定出的多个样本用户特征、多个样本冒泡特征和多个样本场景特征,构建用于模型训练的样本特征异构图,其中,所述样本特征异构图包括多个包括对应样本冒泡特征的样本冒泡节点,与至少一个样本冒泡节点连接的包括对应样本用户特征的样本用户节点,和与至少一个样本冒泡节点连接包括对应样本场景特征的样本场景节点;
将所述样本特征异构图输入至构建好的神经网络模型中,得到每个样本冒泡节点的样本下单概率;
基于每个样本冒泡节点的样本下单概率和真实下单结果对所述神经网络模型进行反向训练,直至所述神经网络模型的交叉熵损失值小于预设交叉熵损失阈值,确定所述神经网络模型训练完毕,并将训练完毕的所述神经网络模型作为所述下单概率预测模型。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的下单概率预测方法的步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述的下单概率预测方法的步骤。
本申请实施例提供的下单概率预测方法、装置、电子设备及可读存储介质,获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
与现有技术中的下单概率预测方法相比,本申请通过获取待预测用户发送冒泡行为时的用户特征、冒泡特征和场景特征,以及根据历史出行数据确定出的出行特征异构图,确定出能够用于预测该待预测用户下单概率的预测特征异构图,将预测特征异构图输入至训练好的下单概率预测模型中,对预测特征异构图进行k阶邻居节点特征聚合,确定待预测冒泡节点的聚合特征向量,并通过聚合特征向量得到待预测用户此次冒泡行为的下单概率,从而能够通过广泛历史数据构建的乘客、冒泡、场景等实体之间的关联,以及待预测用户的相关特征和深度学习模型,对待预测用户的冒泡行为进行特征聚合,利用节点丰富的属性信息与异构图网络的结构信息预测用户冒泡后的下单概率,更加准确的对待预测用户此次冒泡行为的下单概率进行预测,可以有效提高下单概率的预测准确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种下单概率预测系统的架构示意图;
图2为本申请实施例所提供的一种下单概率预测方法的流程图;
图3为预测特征异构图示意图;
图4为本申请另一实施例所提供的一种下单概率预测方法的流程图;
图5为冒泡节点的邻居节点特征聚合示意图;
图6为用户节点的邻居节点特征聚合示意图;
图7为本申请实施例所提供的一种下单概率预测装置的结构示意图之一;
图8为本申请实施例所提供的一种下单概率预测装置的结构示意图之二;
图9为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“当用户存在冒泡行为时,该用户此次冒泡行为的下单概率”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕当用户存在冒泡行为时,该用户此次冒泡行为的下单概率进行描述,但是应该理解,这仅是一个示例性实施例。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“乘客”、“请求方”、“服务请求方”和“客户”可互换使用,以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“提供方”、“服务提供方”和“供应商”可互换使用,以指代可以提供服务的个人、实体或工具。本申请中的术语“用户”可以指代请求服务、订购服务、提供服务或促成服务的提供的个人、实体或工具。例如,用户可以是乘客、驾驶员、操作员等,或其任意组合。在本申请中,“乘客”和“乘客终端”可以互换使用,“驾驶员”和“驾驶员终端”可以互换使用。
本申请中的术语“服务请求”和“订单”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的请求。接受该“服务请求”或“订单”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务请求可以是收费的或免费的。
本申请中使用的定位技术可以基于全球定位系统(Global Positioning System,GPS)、全球导航卫星系统(Global Navigation Satellite System,GLONASS),罗盘导航系统(COMPASS)、伽利略定位系统、准天顶卫星系统(Quasi-Zenith Satellite System,QZSS)、无线保真(Wireless Fidelity,WiFi)定位技术等,或其任意组合。一个或多个上述定位系统可以在本申请中互换使用。
本申请的一个方面涉及一种下单概率预测系统。该系统可以通过获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及基于历史出行数据确定出的出行特征异构图,进一步的确定出用于待预测用户的下单概率的预测特征异构图,将预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,再将得到的聚合特征向量输入至下单概率预测模型的概率预测网络层中,得到待预测用户此次冒泡行为的下单概率。
值得注意的是,在本申请提出申请之前,对用户发生冒泡后的下单概率进行预测,大多是只关注冒泡用户当时的特征,或者冒泡用户的历史下单情况等,但是,因为单个用户的数据有限,预测结果易存在统计片面、测算不准确的问题。然而,本申请提供的下单概率预测方法可以获取待预测用户在发生冒泡行为时的用户特征、冒泡特征和场景特征,并结合出行特征异构图,确定出用于预测待预测用户下单概率的预测特征异构图,并通过训练好的下单概率预测模型待预测用户此次冒泡行为的下单概率。
图1是本申请实施例提供的一种下单概率预测系统的架构示意图。例如,下单概率预测系统可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。下单概率预测系统可以包括服务器110、网络120、服务请求端130、服务提供端140、和数据库150中的一种或多种。
在一些实施例中,服务器110可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。例如,处理器可以基于从服务请求端130获得的服务请求来确定目标车辆。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing,RISC)、或微处理器等,或其任意组合。
在一些实施例中,服务请求端130和服务提供端140对应的设备类型可以是移动设备,比如可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,也可以是平板计算机、膝上型计算机、或机动车辆中的内置设备等。
在一些实施例中,数据库150可以连接到网络120以与下单概率预测系统中的一个或多个组件(例如,服务器110,服务请求端130,服务提供端140等)通信。下单概率预测系统中的一个或多个组件可以经由网络120访问存储在数据库150中的数据或指令。在一些实施例中,数据库150可以直接连接到下单概率预测系统中的一个或多个组件,或者,数据库150也可以是服务器110的一部分。
下面结合上述图1示出的下单概率预测系统中描述的内容,对本申请实施例提供的下单概率预测方法进行详细说明。
参照图2所示,为本申请实施例提供的一种下单概率预测方法的流程示意图,该方法可以由下单概率预测系统中的处理器来执行,具体执行过程为:
S201、获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图。
该步骤中,当检测到待预测用户存在冒泡行为时,获取待预测用户在发生冒泡行为时的用户特征、冒泡特征以及场景特征等,并根据历史出行数据,确定出历史出行数据中包括的多个冒泡节点,以及与至少一个冒泡节点存在连接的用户节点,以及与至少一个冒泡节点存在连接的场景节点,并且基于各个冒泡节点、各个用户节点以及各个场景节点确定出该待预测用户对应的出行特征异构图。
冒泡行为可以是指待预测用户在软件中输入了起始地、目的地,软件为待预测用户显示从起始地至目的地的预估时间、距离、价格等信息的询问过程,冒泡特征可以包括:此次冒泡行为发生的时间、此次冒泡行为发生的地点、起始地、目的地、预估时间、距离以及价格等。
用户特征可以包括:待预测用户的身份信息、待预测用户的年龄信息、待预测用户职业信息等。
场景特征可以包括:时空场景(起始地、目的地等)、事件场景(通勤、医院等)等。
其中,对于一个用户来说,每一次冒泡行为都会构成一个冒泡节点,每一次获取到的用户特征会构成一个用户节点,每一次获取到的场景特征会构成一个场景节点(每次也可能获取到多个场景特征);对于该用户来说每一次发生冒泡行为时,冒泡节点与用户节点以及场景节点之间是存在联系的,因此,在根据历史出行数据确定出的出行特征异构图中,冒泡节点会分别与用户节点以及场景节点连接,用户节点和场景节点分别只与冒泡节点相连接。对于一次冒泡行为来说场景节点可以有多种,代表不同维度的场景,本申请中仅以一个场景为例。
S202、基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图。
该步骤中,在根据历史出行数据确定出行特征异构图之后,根据获取到的待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征以及出行特征异构图,从出行特征异构图中确定出与待预测用户此次冒泡行为相匹配的冒泡节点、用户节点以及场景节点,将不匹配的冒泡节点、用户节点以及场景节点去除,得到能够用于预测待预测用户的下单率的预测特征异构图,所述预测特征异构图如图3所示。
这样,能够从出行特征异构图中确定出用于预测待预测用户下单概率的预测特征异构图,进一步的缩小了预测下单概率过程的计算量,有助于提高下单概率预测的准确性,加快预测速率。
S203、将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数。
该步骤中,将确定出的能够用于预测待预测用户的下单概率的预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对预测特征异构图进行k阶邻居节点特征聚合,得到用于预测待预测用户的下单概率的待预测冒泡节点的聚合特征向量。
其中,为了能够进一步的提高预测结果的准确性,对预测特征异构图进行邻居节点特征图聚合的阶数k可以为大于或者等于2的正整数,也就是说若想进一步的提高预测结果的准确性,至少要对待预测用户对应的预测特征异构图进行2阶的邻居节点特征聚合。
S204、将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
该步骤中,将经过k阶邻居节点特征聚合处理后得到的待预测冒泡节点的聚合特征向量输入至训练好的下单概率预测模型中的概率预测网络层中,对待预测用户此次冒泡行为的下单概率进行预测。
这样,本申请能够通过对预测特征异构图进行k阶邻居节点特征聚合,获得待预测冒泡节点的聚合特征向量,而后再通过聚合特征向量预测待预测用户此次冒泡行为的下单概率,从而能够考虑到待预测用户此次冒泡行为与历史出行数据中用户节点以及场景节点之间的联系,更加准确的对待预测用户此次冒泡行为的下单概率进行预测。
本申请实施例提供的下单概率预测方法,获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
与现有技术中的下单概率预测方法相比,本申请通过获取待预测用户发送冒泡行为时的用户特征、冒泡特征和场景特征,以及根据历史出行数据确定出的出行特征异构图,确定出能够用于预测该待预测用户下单概率的预测特征异构图,将预测特征异构图输入至训练好的下单概率预测模型中,对预测特征异构图进行k阶邻居节点特征聚合,确定待预测冒泡节点的聚合特征向量,并通过聚合特征向量得到待预测用户此次冒泡行为的下单概率,从而能够通过广泛历史数据构建的乘客、冒泡、场景等实体之间的关联,以及待预测用户的相关特征和深度学习模型,对待预测用户的冒泡行为进行特征聚合,利用节点丰富的属性信息与异构图网络的结构信息预测用户冒泡后的下单概率,更加准确的对待预测用户此次冒泡行为的下单概率进行预测,可以有效提高下单概率的预测准确度。
请参阅图4,图4为本申请另一实施例提供的下单概率预测方法的流程图,该方法可以由下单概率预测系统中的处理器来执行,如图4中所示,具体执行过程为:
S401、从获取到的历史出行数据中确定出多个历史出行订单,以及与每个历史出行订单对应的用户历史特征向量、冒泡历史特征向量和场景历史特征向量。
该步骤中,获取服务提供方的历史出行数据,并从获取到的历史出行数据中确定出多个历史出行订单,以及与每个历史出行订单对应的用户历史特征向量、冒泡历史特征向量和场景历史特征向量。
其中,对于一个历史用户来说,在同一个时间段(例如,周一的7点至8点和周二的7点至8点属于同一时间段)可能会存在多次往返于两个地方(例如,公司和家)的行为,这种行为对应的场景信息可以为“通勤”,因此,对于场景同为“通勤”的其他用户来说,历史用户的历史出行数据以及下单概率与待预测用户的下单概率之间存在一定的联系,可以用于预测待预测用户的下单概率。
S402、确定出与每个用户历史特征向量对应的包括对应用户历史特征向量的用户节点、与每个冒泡历史特征信息对应的包括对应冒泡历史特征向量的冒泡节点和与每个场景历史特征信息对应的包括对应场景历史特征向量的场景节点。
该步骤中,基于获取到的每个历史出行订单对应的用户历史特征向量,确定出与每个用户历史特征向量对应的包括该用户历史特征向量的用户节点;基于获取到的每个历史出行订单对应的冒泡历史特征向量,确定出与每个冒泡历史特征向量对应的包括该冒泡历史特征向量的冒泡节点;基于获取到的每个历史出行订单对应的场景历史特征向量,确定出与每个场景历史特征向量对应的包括该场景历史特征向量的用户节点。
S403、构建包括多个用户节点、多个冒泡节点和多个场景节点的所述出行特征异构图,其中,在所述出行特征异构图中,每个冒泡历点与相关联的用户节点和场景节点连接,每个用户节点与相关联的至少一个冒泡节点连接,每个场景节点与相关联的至少一个冒泡节点连接。
该步骤中,基于确定出的多个用户节点、多个冒泡节点和多个场景节点,构建包括多个用户节点、多个冒泡节点和多个场景节点的出行特征异构图,其中,在出行特征异构图中,每个冒泡节点同与其相关联的用户节点和场景节点连接,每个用户节点则会同与其相关联的至少一个冒泡节点连接,同样的,每个场景节点也会同与其相关联的至少一个冒泡节点连接,用户节点与场景节点之间不存在连接。
S404、获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图。
S405、基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图。
S406、将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数。
S407、将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
其中,S404至S407的描述可以参照S201至S204的描述,并且能达到相同的技术效果,对此不做赘述。
进一步的,S405包括:从所述出行特征异构图中确定与所述待预测用户的用户信息相匹配的用户节点或者场景节点,其中,所述用户信息包括所述用户特征或者所述场景特征;从所述出行特征异构图中确定出与匹配到的用户节点或者场景节点直接连接的冒泡节点和间接连接的冒泡节点,以及与直接连接的冒泡节点或者间接连接的冒泡节点间接连接的用户节点和场景节点;生成包括所述用户特征的用户节点、包括所述场景特征的场景节点和包括所述冒泡特征的冒泡节点;将生成的用户节点、场景节点和冒泡节点加入到匹配出的多个用户节点、多个场景节点和多个冒泡节点中,并构建用于预测所述待预测用户的下单概率的预测特征异构图。
该步骤中,从基于历史出行数据构建的出行特征异构图中,确定出与待预测用户的用户信息相匹配的用户节点或者场景节点,其中,用户信息可以包括待预测用户发生冒泡行为时的用户特征或者场景特征;然后,从构建的出行特征异构图中确定出与匹配到的用户节点或者场景节点直接连接的冒泡节点,或者是与匹配到的用户节点或者场景节点间接连接的冒泡节点,以及间接连接的用户节点和场景节点;基于待预测用户发生冒泡行为时获取到的用户特征、场景特征以及冒泡特征,生成包括用户特征的用户节点、包括场景特征的场景节点以及包括用冒泡特征的冒泡节点;将生成的包括用户特征的用户节点、包括场景特征的场景节点以及包括用冒泡特征的冒泡节点,加入到匹配出的与待预测用户的用户信息相匹配的用户节点和场景节点之中,构建用于预测待预测用户的下单概率的预测特征异构图。
这样,能够从根据历史出行数据构建的出行特征异构图中,根据用户信息确定出用于预测待预测用户的下单概率的预测特征异构图,进一步的缩小了后续预测下单概率过程的计算量,有助于提高下单概率预测的准确性,加快预测速率。
进一步的,S406包括:将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,分别对所述预测特征异构图中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到包括邻居节点特征聚合处理后的多个用户节点、多个场景节点和多个冒泡节点的特征聚合异构图;将得到的特征聚合异构图作为所述预测特征异构图,对其中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到聚合后的特征聚合异构图;直至进行k次邻居节点特征聚合,得到进行k阶邻居节点特征聚合后的预测特征异构图,并从k阶邻居节点特征聚合后的预测特征异构图中确定出与所述冒泡特征对应的待预测冒泡节点以及所述待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数。
该步骤中,将预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,通过特征聚合网络层对预测特征异构图中包括的每个用户节点、每个场景节点以及每个冒泡节点进行邻居节点特征聚合,得到包括邻居节点特征聚合处理后的多个用户节点、多个场景节点和多个冒泡节点的特征聚合异构图。
具体的,通过下单概率预测模型中的特征聚合网络层,分别确定出预测特征异构图中的每个用户节点、每个场景节点和每个冒泡节点,首先对每个冒泡节点进行邻居节点特征聚合处理,确定出与该冒泡节点相邻的所有用户节点以及场景节点,基于确定出的所有的用户节点以及场景节点对该冒泡节点进行邻居节点特征聚合处理,冒泡节点的邻居节点特征聚合示意图如图5所示;然后,对确定出的每个用户节点进行邻居节点特征聚合处理(由于在本申请中对用户节点进行邻居节点特征聚合处理的过程,与场景节点进行邻居节点特征聚合处理的过程相同,此处,以用户节点为例进行解释),确定出与该用户节点相邻连接的所有冒泡节点,基于所有的与用户节点相连的相邻冒泡节点对该用户节点进行邻居节点特征聚合处理。
而后,将进行过一次邻居节点特征聚合后得到特征聚合异构图作为预测特征异构图,对预测特征异构图中的每个用户节点、每个场景节点和每个冒泡节点再次进行邻居节点特征聚合,得到第二次聚合(即2阶邻居节点特征聚合)后的特征聚合异构图;直至进行k次邻居节点特征聚合,得到进行了k阶邻居节点特征聚合后的预测特征异构图为止,从k阶邻居节点特征聚合后的预测特征异构图中确定与待预测用户此次冒泡行为发生时获取到的冒泡特征对应的待预测冒泡节点,以及该待预测冒泡节点的聚合特征向量。
同样的,为了能够进一步的提高预测结果的准确性,对预测特征异构图进行邻居节点特征图聚合的阶数,k可以为大于或者等于2的正整数,也就是说若想进一步的提高预测结果的准确性,对待预测用户的下单概率进行预测,至少要对待预测用户对应的预测特征异构图进行2阶的邻居节点特征聚合,从而能够提高预测结果的准确性。
进一步的,通过以下公式对所述预测特征异构图中的冒泡节点进行邻居节点特征聚合:
Figure BDA0002460726820000161
其中,
Figure BDA0002460726820000162
为进行k阶邻居节点特征聚合后预测特征异构图中冒泡节点b的特征向量,σ为聚合参数,
Figure BDA0002460726820000163
为进行k阶邻居节点特征聚合后预测特征异构图中冒泡节点b的邻接矩阵,concat为连接标识符,
Figure BDA0002460726820000164
为进行k-1阶邻居节点特征聚合后所述预测特征异构图中冒泡节点b的特征向量,
Figure BDA0002460726820000171
为进行k-1阶邻居节点特征聚合后预测特征异构图中用户节点p的特征向量,
Figure BDA0002460726820000172
为进行k-1阶邻居节点特征聚合后预测特征异构图中场景节点s的特征向量。
进一步的,通过以下方式对所述预测特征异构图中的用户节点或者场景节点进行邻居节点特征聚合:在对预测特征异构图进行k阶邻居节点特征聚合时,确定进行k-1阶邻居节点特征聚合后的预测特征异构图中与用户节点或者场景节点连接的至少一个冒泡节点,以及确定出的至少一个冒泡节点中冒泡时间最近的最新冒泡节点;确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值;基于所述注意力值和基于所述最新冒泡节点的冒泡特征向量确定出的值向量,以及k-1阶邻居节点特征聚合后所述用户节点或者场景节点的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合后,得到所述预测特征异构图中所述用户节点或者场景节点的节点特征向量。
该步骤中,在对预测特征异构图中的用户节点或者场景节点进行邻居节点特征聚合时,确定出在进行了k-1阶邻居节点特征聚合后得到的预测特征异构图中,与用户节点(或者是场景节点)连接的至少一个冒泡节点,并按照每个冒泡节点的冒泡时间的时间顺序,对至少一个冒泡节点进行排序,确定出在至少一个冒泡节点中冒泡时间最近的最新冒泡节点,即按照冒泡时间进行排序后,位于最后一位的冒泡节点;在确定出最新冒泡节点之后,通过advanced transformer attention注意力值确定方法,确定出至少一个冒泡节点中除最新冒泡节点之外的历史冒泡节点对于该最新冒泡节点的注意力值。
注意力值能够表明历史冒泡节点与最新冒泡节点之间的关联程度,注意力值越大说明历史冒泡节点与最冒泡节点的关联越大,相反的,注意力值越小说明历史冒泡节点与最冒泡节点的关联越小。
然后,基于确定出的历史冒泡节点与最新冒泡节点之间的注意力值,基于最新冒泡节点的冒泡特征向量确定出的最新冒泡节点的值向量,以及经过k-1阶邻居节点特征聚合后,得到的用户节点对应的节点特征向量或者场景节点对应的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合,得到k阶邻居节点特征聚合后,预测特征异构图中用户节点(或者场景节点)的节点特征向量。
在本申请中advanced transformer attention注意力值确定方法,相较于传统的向量点击计算attention的方式,advanced transformer attention注意力值确定方法不仅使节点特征表达的更为充分,还可以将每个冒泡间的时序关系引入到权重之中,并且强调了最新冒泡的重要性,使得学习到的关系权重更为精确。
进一步的,通过以下公式确定所述用户节点或者场景节点的节点特征向量:
Figure BDA0002460726820000181
其中,
Figure BDA0002460726820000182
为进行L次第k阶集合时,第i次进行第k阶集合得到的针对用户节点或这场景节点进行k阶邻居节点特征聚合后的单次特征向量,concat为连接标识符ResNet表示残差网络,Attention(Q(b,n),K(b,n),V(b,n))为所述历史冒泡节点对于所述最新冒泡节点n的注意力值,
Figure BDA0002460726820000183
为所述最新冒泡节点b的k-1阶聚合输出的邻居节点特征聚合向量,
Figure BDA0002460726820000184
为用户节点p或者场景节点s的k-1阶聚合输出的节点特征向量,
Figure BDA0002460726820000185
为合并多个所述单次特征向量后得到的对用户节点p或者场景节点s进行k阶邻居节点特征聚合后的节点特征向量,Wmh为将多头注意力机制的结果进行合并聚合的邻接矩阵。
进一步的,所述确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值,包括:基于确定出的至少一个冒泡节点中每个冒泡节点的冒泡特征向量,确定出所述最新冒泡节点的查询向量、键向量和值向量,以及至少一个冒泡节点中除所述最新冒泡节点外的每个其他冒泡节点的键向量和值向量;基于所述最新冒泡节点的查询向量、键向量和值向量,以及每个其他冒泡节点的键向量和值向量,确定出所述历史冒泡节点对于所述最新冒泡节点的注意力值。
该步骤中,确定出至少一个冒泡节点中每一个冒泡节点的冒泡特征向量,从至少一个冒泡特征向量中,确定出最新冒泡节点的冒泡节点特征向量,并根据最新冒泡节点的冒泡节点特征向量,确定出最新冒泡节点的查询向量、键向量和值向量;另外,从至少一个冒泡特征向量中,确定出除最新冒泡节点的冒泡特征向量之外,各个其他冒泡节点的冒泡特征向量,并基于每个其他冒泡节点的冒泡特征向量,确定出其他冒泡节点的键向量和值向量;而后,将其他冒泡节点的键向量与最新冒泡节点的查询向量进行元素乘运算,计算出每个其他冒泡节点对于最新冒泡节点之间的中间向量,并对得到的至少一个中间向量进行softmax运算,再基于其他冒泡节点的值向量与每个其他冒泡节点对应的经过softmax运算后的中间向量,计算出历史冒泡节点对于最新冒泡节点的注意力值,所述用户节点(或者场景节点的)邻居节点特征聚合示意图如图6所示,图6仅为对用户节点进行一次邻居节点特征聚合的示意图,在本申请中需要对一个用户节点(或者场景节点)进行多次邻居节点特征聚合,从而提高下单概率预测的准确性。
这样,通过计算历史冒泡节点对于最新冒泡节点的注意力值,强调了最新冒泡节点的重要性,有助于提高预测结果的准确性。
进一步的,通过以下公式计算其他冒泡节点对于所述最新冒泡节点的注意力值:
Figure BDA0002460726820000186
其中,Attention(Q(b,n),K(b,n),V(b,n))为所述历史冒泡节点对于至少一个冒泡节点中第n个的所述最新冒泡节点b的注意力值,FC为全连接层网络,concat为连接标识符,Q(b,n)为第n个的所述最新冒泡节点b的查询向量,K(b,n)为第n个的所述最新冒泡节点b的键向量,V(b,n)为第n个的所述最新冒泡节点b的值向量,当i属于(0,n-1)时,K(b,i)为n-1个所述历史冒泡节点中第i个其他冒泡节点的键向量,V(b,i)为n-1个所述历史冒泡节点中第i个其他冒泡节点的值向量,当i=n时,K(b,i)=K(b,n),V(b,i)=V(b,n)
其中,对于任意一个节点来说,可以通过以下公式确定每个节点在进行邻居节点特征聚合时的查询向量、键向量和值向量:
Q=Wq*h;
K=Wk*h;
V=Wv*h;
Q为节点的查询向量,K为节点的键向量,V为节点的值向量,h为节点的特征向量,Wq为确定查询向量时节点的邻接矩阵;Wk为确定键向量时节点的邻接矩阵;Wv为确定值向量时节点的邻接矩阵。
相应的,当确定了冒泡节点的特征向量时,可以通过以下公式计算最新冒泡节点和其他冒泡节点在进行邻居节点特征聚合时的查询向量、键向量和值向量:
Q(b,n)=Wq,n*hb,n
K(b,i)=Wk,i*hb,i
V(b,i)=Wv,i*hb,i
Q(b,n)为第n个冒泡节点b的查询向量,hb,n为第n个冒泡节点b的特征向量,Wq,n为确定查询向量时节点的邻接矩阵;K(b,i)为第i个冒泡节点b的键向量,hb,i为第i个冒泡节点b的特征向量,Wk,i为确定键向量时节点的邻接矩阵;V(b,i)为第i个冒泡节点b的值向量,hb,i为第i个冒泡节点b的特征向量,Wv,i为确定值向量时节点的邻接矩阵。
进一步的,所述下单概率预测方法通过以下步骤训练所述下单概率预测模型:
第一步:从样本冒泡数据中确定出多个样本冒泡行为,以及与每个样本冒泡行为对应的样本用户特征、样本冒泡特征、样本场景特征和每个样本冒泡行为的真实下单结果。
第二步:基于确定出的多个样本用户特征、多个样本冒泡特征和多个样本场景特征,构建用于模型训练的样本特征异构图,其中,所述样本特征异构图包括多个包括对应样本冒泡特征的样本冒泡节点,与至少一个样本冒泡节点连接的包括对应样本用户特征的样本用户节点,和与至少一个样本冒泡节点连接包括对应样本场景特征的样本场景节点。
第三步:将所述样本特征异构图输入至构建好的神经网络模型中,得到每个样本冒泡节点的样本下单概率。
第四步:基于每个样本冒泡节点的样本下单概率和真实下单结果对所述神经网络模型进行反向训练,直至所述神经网络模型的交叉熵损失值小于预设交叉熵损失阈值,确定所述神经网络模型训练完毕,并将训练完毕的所述神经网络模型作为所述下单概率预测模型。
具体的,在训练下单概率预测模型之前,首先获取多个用于训练下单概率预测模型的样本冒泡数据,并从样本冒泡数据中确定出多个样本冒泡行为,以及每个样本冒泡行为对应的样本用户特征、样本冒泡特征、样本场景特征和每个样本冒泡行为的真实下单结果;其次,基于确定出的多个样本用户特征、多个样本冒泡特征和多个样本场景特征,构建用于模型训练的样本特征异构图,在该样本特征异构图中包含多个包括对应样本冒泡特征的样本冒泡节点,以及与至少一个样本冒泡节点存在连接关系的包括对应样本用户特征的样本用户节点,和与至少一个样本冒泡节点存在连接关系的包括对应样本场景特征的样本场景节点;然后,将样本特征异构图输入至构建好的神经网络模型中,得到每个样本冒泡节点的样本下单概率;最后,基于得到的每个样本冒泡节点的样本下单概率以及每个样本冒泡行为的真实下单结果,对构建好的神经网络模型进行反向训练,调节神经网络模型中的各个待调节的参数,直至神经网络模型的交叉熵损失值小于预设交叉熵损失阈值,确定构建的神经网络模型训练完毕,此时,便可以将训练完毕的神经网络模型作为下单概率模型。
本申请中可以使用leaky relu函数作为激活函数,在训练初始时,冒泡节点的初始特征向量即为该冒泡节点的初始属性/初始特征;同理,用户节点的初始特征向量即为该用户节点的初始属性/初始特征;场景节点的初始特征向量即为该场景节点的初始属性/初始特征,即:
Figure BDA0002460726820000201
另外,本申请通过以下计算交叉熵损失值:
Figure BDA0002460726820000202
其中,L表示交叉熵损失值,yi表示第i个样本冒泡行为的真实下单结果,
Figure BDA0002460726820000203
表示第i个样本冒泡节点的样本下单概率。
其中,下单结果可以为:下单、撤单,待下单等。
本申请实施例提供的下单概率预测方法,从获取到的历史出行数据中确定出多个历史出行订单,以及与每个历史出行订单对应的用户历史特征向量、冒泡历史特征向量和场景历史特征向量;确定出与每个用户历史特征向量对应的包括对应用户历史特征向量的用户节点、与每个冒泡历史特征信息对应的包括对应冒泡历史特征向量的冒泡节点和与每个场景历史特征信息对应的包括对应场景历史特征向量的场景节点;构建包括多个用户节点、多个冒泡节点和多个场景节点的所述出行特征异构图,其中,在所述出行特征异构图中,每个冒泡历点与相关联的用户节点和场景节点连接,每个用户节点与相关联的至少一个冒泡节点连接,每个场景节点与相关联的至少一个冒泡节点连接;获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
与现有技术中的下单概率预测方法相比,本申请能够从历史出行数据中确定出构建出行特征异构图的用户历史特征向量、冒泡历史特征向量以及场景历史特征向量,通过获取到的待预测用户发送冒泡行为时的用户特征、冒泡特征和场景特征,以及确定出的出行特征异构图,确定出能够用于预测该待预测用户下单概率的预测特征异构图,将预测特征异构图输入至训练好的下单概率预测模型中,对预测特征异构图进行k阶邻居节点特征聚合,确定待预测冒泡节点的聚合特征向量,并通过聚合特征向量得到待预测用户此次冒泡行为的下单概率,从而能够通过广泛历史数据构建的乘客、冒泡、场景等实体之间的关联,以及待预测用户的相关特征和深度学习模型,对待预测用户的冒泡行为进行特征聚合,利用节点丰富的属性信息与异构图网络的结构信息预测用户冒泡后的下单概率,更加准确的对待预测用户此次冒泡行为的下单概率进行预测,可以有效提高下单概率的预测准确度。
请参阅图7、图8,图7为本申请实施例所提供的一种下单概率预测装置的结构示意图之一,图8为本申请实施例所提供的一种下单概率预测装置的结构示意图之二。如图7中所示,所述下单概率预测装置700包括:
特征获取模块710,用于获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;
第一异构图确定模块720,用于基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;
特征向量确定模块730,用于将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;
概率预测模块740,用于将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
进一步的,如图8所示,所述下单概率预测装置700还包括第二异构图确定模块750,所述第二异构图确定模块750用于:
从获取到的历史出行数据中确定出多个历史出行订单,以及与每个历史出行订单对应的用户历史特征向量、冒泡历史特征向量和场景历史特征向量;
确定出与每个用户历史特征向量对应的包括对应用户历史特征向量的用户节点、与每个冒泡历史特征信息对应的包括对应冒泡历史特征向量的冒泡节点和与每个场景历史特征信息对应的包括对应场景历史特征向量的场景节点;
构建包括多个用户节点、多个冒泡节点和多个场景节点的所述出行特征异构图,其中,在所述出行特征异构图中,每个冒泡历点与相关联的用户节点和场景节点连接,每个用户节点与相关联的至少一个冒泡节点连接,每个场景节点与相关联的至少一个冒泡节点连接。
进一步的,如图8所示,所述下单概率预测装置700还包括预测模型训练模块760,所述预测模型训练模块760通过以下步骤训练所述下单概率预测模型:
从样本冒泡数据中确定出多个样本冒泡行为,以及与每个样本冒泡行为对应的样本用户特征、样本冒泡特征、样本场景特征和每个样本冒泡行为的真实下单结果;
基于确定出的多个样本用户特征、多个样本冒泡特征和多个样本场景特征,构建用于模型训练的样本特征异构图,其中,所述样本特征异构图包括多个包括对应样本冒泡特征的样本冒泡节点,与至少一个样本冒泡节点连接的包括对应样本用户特征的样本用户节点,和与至少一个样本冒泡节点连接包括对应样本场景特征的样本场景节点;
将所述样本特征异构图输入至构建好的神经网络模型中,得到每个样本冒泡节点的样本下单概率;
基于每个样本冒泡节点的样本下单概率和真实下单结果对所述神经网络模型进行反向训练,直至所述神经网络模型的交叉熵损失值小于预设交叉熵损失阈值,确定所述神经网络模型训练完毕,并将训练完毕的所述神经网络模型作为所述下单概率预测模型。
进一步的,所述第一异构图确定模块720在用于基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图时,所述第一异构图确定模块720用于:
从所述出行特征异构图中确定与所述待预测用户的用户信息相匹配的用户节点或者场景节点,其中,所述用户信息包括所述用户特征或者所述场景特征;
从所述出行特征异构图中确定出与匹配到的用户节点或者场景节点直接连接的冒泡节点和间接连接的冒泡节点,以及与直接连接的冒泡节点或者间接连接的冒泡节点间接连接的用户节点和场景节点;
生成包括所述用户特征的用户节点、包括所述场景特征的场景节点和包括所述冒泡特征的冒泡节点;
将生成的用户节点、场景节点和冒泡节点加入到匹配出的多个用户节点、多个场景节点和多个冒泡节点中,并构建用于预测所述待预测用户的下单概率的预测特征异构图。
进一步的,所述特征向量确定模块730在用于将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数时,所述特征向量确定模块730用于:
将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,分别对所述预测特征异构图中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到包括邻居节点特征聚合处理后的多个用户节点、多个场景节点和多个冒泡节点的特征聚合异构图;
将得到的特征聚合异构图作为所述预测特征异构图,对其中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到聚合后的特征聚合异构图;
直至进行k次邻居节点特征聚合,得到进行k阶邻居节点特征聚合后的预测特征异构图,并从k阶邻居节点特征聚合后的预测特征异构图中确定出与所述冒泡特征对应的待预测冒泡节点以及所述待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数。
进一步的,所述特征向量确定模块730通过以下公式对所述预测特征异构图中的冒泡节点进行邻居节点特征聚合:
Figure BDA0002460726820000231
其中,
Figure BDA0002460726820000232
为进行k阶邻居节点特征聚合后预测特征异构图中冒泡节点b的特征向量,σ为聚合参数,
Figure BDA0002460726820000233
为进行k阶邻居节点特征聚合后预测特征异构图中冒泡节点b的邻接矩阵,concat为连接标识符,
Figure BDA0002460726820000234
为进行k-1阶邻居节点特征聚合后所述预测特征异构图中冒泡节点b的特征向量,
Figure BDA0002460726820000235
为进行k-1阶邻居节点特征聚合后预测特征异构图中用户节点p的特征向量,
Figure BDA0002460726820000236
为进行k-1阶邻居节点特征聚合后预测特征异构图中场景节点s的特征向量。
进一步的,所述特征向量确定模块730通过以下方式对所述预测特征异构图中的用户节点或者场景节点进行邻居节点特征聚合:
在对预测特征异构图进行k阶邻居节点特征聚合时,确定进行k-1阶邻居节点特征聚合后的预测特征异构图中与用户节点或者场景节点连接的至少一个冒泡节点,以及确定出的至少一个冒泡节点中冒泡时间最近的最新冒泡节点;
确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值;
基于所述注意力值和基于所述最新冒泡节点的冒泡特征向量确定出的值向量,以及k-1阶邻居节点特征聚合后所述用户节点或者场景节点的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合后,得到所述预测特征异构图中所述用户节点或者场景节点的节点特征向量。
进一步的,所述特征向量确定模块730在用于确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值时,所述特征向量确定模块730用于:
基于确定出的至少一个冒泡节点中每个冒泡节点的冒泡特征向量,确定出所述最新冒泡节点的查询向量、键向量和值向量,以及至少一个冒泡节点中除所述最新冒泡节点外的每个其他冒泡节点的键向量和值向量;
基于所述最新冒泡节点的查询向量、键向量和值向量,以及每个其他冒泡节点的键向量和值向量,确定出所述历史冒泡节点对于所述最新冒泡节点的注意力值。
进一步的,所述特征向量确定模块730在用于基于所述最新冒泡节点的查询向量、键向量和值向量,以及每个其他冒泡节点的键向量和值向量,确定出所述历史冒泡节点对于所述最新冒泡节点的注意力值时,所述特征向量确定模块730用于:
通过以下公式计算其他冒泡节点对于所述最新冒泡节点的注意力值:
Figure BDA0002460726820000241
其中,Attention(Q(b,n),K(b,n),V(b,n))为所述历史冒泡节点对于至少一个冒泡节点中第n个的所述最新冒泡节点b的注意力值,FC为全连接层网络,concat为连接标识符,Q(b,n)为第n个的所述最新冒泡节点b的查询向量,K(b,n)为第n个的所述最新冒泡节点b的键向量,V(b,n)为第n个的所述最新冒泡节点b的值向量,当i属于(0,n-1)时,K(b,i)为n-1个所述历史冒泡节点中第i个其他冒泡节点的键向量,V(b,i)为n-1个所述历史冒泡节点中第i个其他冒泡节点的值向量,当i=n时,K(b,i)=K(b,n),V(b,i)=V(b,n)
进一步的,所述特征向量确定模块730在用于基于所述注意力值和基于所述最新冒泡节点的冒泡特征向量确定出的值向量,以及k-1阶邻居节点特征聚合后所述用户节点或者场景节点的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合后,得到所述预测特征异构图中所述用户节点或者场景节点的节点特征向量时,所述特征向量确定模块730用于:
通过以下公式确定所述用户节点或者场景节点的节点特征向量:
Figure BDA0002460726820000242
其中,
Figure BDA0002460726820000251
为进行L次第k阶集合时,第i次进行第k阶集合得到的针对用户节点或这场景节点进行k阶邻居节点特征聚合后的单次特征向量,concat为连接标识符ResNet表示残差网络,Attention(Q(b,n),K(b,n),V(b,n))为所述历史冒泡节点对于所述最新冒泡节点n的注意力值,
Figure BDA0002460726820000252
为所述最新冒泡节点b的k-1阶聚合输出的邻居节点特征聚合向量,
Figure BDA0002460726820000253
为用户节点p或者场景节点s的k-1阶聚合输出的节点特征向量,
Figure BDA0002460726820000254
为合并多个所述单次特征向量后得到的对用户节点p或者场景节点s进行k阶邻居节点特征聚合后的节点特征向量,Wmh为将多头注意力机制的结果进行合并聚合的邻接矩阵。
本申请实施例提供的下单概率预测装置,获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
与现有技术中的下单概率预测方法相比,本申请通过获取待预测用户发送冒泡行为时的用户特征、冒泡特征和场景特征,以及根据历史出行数据确定出的出行特征异构图,确定出能够用于预测该待预测用户下单概率的预测特征异构图,将预测特征异构图输入至训练好的下单概率预测模型中,对预测特征异构图进行k阶邻居节点特征聚合,确定待预测冒泡节点的聚合特征向量,并通过聚合特征向量得到待预测用户此次冒泡行为的下单概率,从而能够通过广泛历史数据构建的乘客、冒泡、场景等实体之间的关联,以及待预测用户的相关特征和深度学习模型,对待预测用户的冒泡行为进行特征聚合,利用节点丰富的属性信息与异构图网络的结构信息预测用户冒泡后的下单概率,更加准确的对待预测用户此次冒泡行为的下单概率进行预测,可以有效提高下单概率的预测准确度。
请参阅图9,图9为本申请实施例所提供的一种电子设备的结构示意图。如图9中所示,所述电子设备900包括处理器910、存储器920和总线930。
所述存储器920存储有所述处理器910可执行的机器可读指令,当电子设备900运行时,所述处理器910与所述存储器920之间通过总线930通信,所述机器可读指令被所述处理器910执行时,可以执行如上述图2以及图4所示方法实施例中的下单概率预测方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时可以执行如上述图2以及图4所示方法实施例中的下单概率预测方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种下单概率预测方法,其特征在于,所述下单概率预测方法包括:
获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;
基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;
将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;
将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
2.根据权利要求1所述的下单概率预测方法,其特征在于,在所述获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图之前,所述下单概率预测方法包括:
从获取到的历史出行数据中确定出多个历史出行订单,以及与每个历史出行订单对应的用户历史特征向量、冒泡历史特征向量和场景历史特征向量;
确定出与每个用户历史特征向量对应的包括对应用户历史特征向量的用户节点、与每个冒泡历史特征信息对应的包括对应冒泡历史特征向量的冒泡节点和与每个场景历史特征信息对应的包括对应场景历史特征向量的场景节点;
构建包括多个用户节点、多个冒泡节点和多个场景节点的所述出行特征异构图,其中,在所述出行特征异构图中,每个冒泡历点与相关联的用户节点和场景节点连接,每个用户节点与相关联的至少一个冒泡节点连接,每个场景节点与相关联的至少一个冒泡节点连接。
3.根据权利要求1所述的下单概率预测方法,其特征在于,所述基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图,包括:
从所述出行特征异构图中确定与所述待预测用户的用户信息相匹配的用户节点或者场景节点,其中,所述用户信息包括所述用户特征或者所述场景特征;
从所述出行特征异构图中确定出与匹配到的用户节点或者场景节点直接连接的冒泡节点和间接连接的冒泡节点,以及与直接连接的冒泡节点或者间接连接的冒泡节点间接连接的用户节点和场景节点;
生成包括所述用户特征的用户节点、包括所述场景特征的场景节点和包括所述冒泡特征的冒泡节点;
将生成的用户节点、场景节点和冒泡节点加入到匹配出的多个用户节点、多个场景节点和多个冒泡节点中,并构建用于预测所述待预测用户的下单概率的预测特征异构图。
4.根据权利要求1所述的下单概率预测方法,其特征在于,所述将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数,包括:
将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,分别对所述预测特征异构图中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到包括邻居节点特征聚合处理后的多个用户节点、多个场景节点和多个冒泡节点的特征聚合异构图;
将得到的特征聚合异构图作为所述预测特征异构图,对其中的每个用户节点、每个场景节点和每个冒泡节点进行邻居节点特征聚合,得到聚合后的特征聚合异构图;
直至进行k次邻居节点特征聚合,得到进行k阶邻居节点特征聚合后的预测特征异构图,并从k阶邻居节点特征聚合后的预测特征异构图中确定出与所述冒泡特征对应的待预测冒泡节点以及所述待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数。
5.根据权利要求4所述的下单概率预测方法,其特征在于,通过以下方式对所述预测特征异构图中的用户节点或者场景节点进行邻居节点特征聚合:
在对预测特征异构图进行k阶邻居节点特征聚合时,确定进行k-1阶邻居节点特征聚合后的预测特征异构图中与用户节点或者场景节点连接的至少一个冒泡节点,以及确定出的至少一个冒泡节点中冒泡时间最近的最新冒泡节点;
确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值;
基于所述注意力值和基于所述最新冒泡节点的冒泡特征向量确定出的值向量,以及k-1阶邻居节点特征聚合后所述用户节点或者场景节点的节点特征向量,对预测特征异构图进行k阶邻居节点特征聚合后,得到所述预测特征异构图中所述用户节点或者场景节点的节点特征向量。
6.根据权利要求5所述的下单概率预测方法,其特征在于,所述确定至少一个冒泡节点中除所述最新冒泡节点之外的历史冒泡节点对于所述最新冒泡节点的注意力值,包括:
基于确定出的至少一个冒泡节点中每个冒泡节点的冒泡特征向量,确定出所述最新冒泡节点的查询向量、键向量和值向量,以及至少一个冒泡节点中除所述最新冒泡节点外的每个其他冒泡节点的键向量和值向量;
基于所述最新冒泡节点的查询向量、键向量和值向量,以及每个其他冒泡节点的键向量和值向量,确定出所述历史冒泡节点对于所述最新冒泡节点的注意力值。
7.根据权利要求1所述的下单概率预测方法,其特征在于,通过以下步骤训练所述下单概率预测模型:
从样本冒泡数据中确定出多个样本冒泡行为,以及与每个样本冒泡行为对应的样本用户特征、样本冒泡特征、样本场景特征和每个样本冒泡行为的真实下单结果;
基于确定出的多个样本用户特征、多个样本冒泡特征和多个样本场景特征,构建用于模型训练的样本特征异构图,其中,所述样本特征异构图包括多个包括对应样本冒泡特征的样本冒泡节点,与至少一个样本冒泡节点连接的包括对应样本用户特征的样本用户节点,和与至少一个样本冒泡节点连接包括对应样本场景特征的样本场景节点;
将所述样本特征异构图输入至构建好的神经网络模型中,得到每个样本冒泡节点的样本下单概率;
基于每个样本冒泡节点的样本下单概率和真实下单结果对所述神经网络模型进行反向训练,直至所述神经网络模型的交叉熵损失值小于预设交叉熵损失阈值,确定所述神经网络模型训练完毕,并将训练完毕的所述神经网络模型作为所述下单概率预测模型。
8.一种下单概率预测装置,其特征在于,所述下单概率预测装置包括:
特征获取模块,用于获取待预测用户发生冒泡行为时的用户特征、冒泡特征和场景特征,以及包括基于历史出行数据确定出的多个冒泡节点、与至少一个冒泡节点连接的用户节点和与至少一个冒泡节点连接的场景节点的出行特征异构图;
第一异构图确定模块,用于基于所述用户特征、所述冒泡特征、所述场景特征和所述出行特征异构图,确定用于预测所述待预测用户的下单概率的预测特征异构图;
特征向量确定模块,用于将所述预测特征异构图输入至训练好的下单概率预测模型中的特征聚合网络层中,对所述预测特征异构图进行k阶邻居节点特征聚合,得到待预测冒泡节点的聚合特征向量,其中,k为大于或者等于2的正整数;
概率预测模块,用于将所述待预测冒泡节点的聚合特征向量输入至所述下单概率预测模型中的概率预测网络层中,得到所述待预测用户此次冒泡行为的下单概率。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一所述下单概率预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述下单概率预测方法的步骤。
CN202010319254.5A 2020-04-21 2020-04-21 一种下单概率预测方法、装置、电子设备及可读存储介质 Active CN111523933B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010319254.5A CN111523933B (zh) 2020-04-21 2020-04-21 一种下单概率预测方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010319254.5A CN111523933B (zh) 2020-04-21 2020-04-21 一种下单概率预测方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN111523933A true CN111523933A (zh) 2020-08-11
CN111523933B CN111523933B (zh) 2021-02-02

Family

ID=71910610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010319254.5A Active CN111523933B (zh) 2020-04-21 2020-04-21 一种下单概率预测方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111523933B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011483A (zh) * 2021-03-11 2021-06-22 北京三快在线科技有限公司 一种模型训练和业务处理的方法及装置
CN113032694A (zh) * 2021-05-26 2021-06-25 浙江口碑网络技术有限公司 基于场景的查询方法及装置、存储介质、计算机设备
CN115080871A (zh) * 2022-07-07 2022-09-20 国家计算机网络与信息安全管理中心 一种跨社交网络社交用户对齐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140317038A1 (en) * 2013-04-23 2014-10-23 International Business Machines Corporation Predictive and descriptive analysis on relations graphs with heterogeneous entities
CN109299373A (zh) * 2018-10-20 2019-02-01 上海交通大学 基于图卷积技术的推荐系统
CN109598566A (zh) * 2017-09-30 2019-04-09 北京嘀嘀无限科技发展有限公司 下单预测方法、装置、计算机设备和计算机可读存储介质
CN110263780A (zh) * 2018-10-30 2019-09-20 腾讯科技(深圳)有限公司 实现异构图、分子空间结构性质识别的方法、装置和设备
CN110569437A (zh) * 2019-09-05 2019-12-13 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置
CN110858366A (zh) * 2018-08-24 2020-03-03 北京嘀嘀无限科技发展有限公司 一种下单转化率预测方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140317038A1 (en) * 2013-04-23 2014-10-23 International Business Machines Corporation Predictive and descriptive analysis on relations graphs with heterogeneous entities
CN109598566A (zh) * 2017-09-30 2019-04-09 北京嘀嘀无限科技发展有限公司 下单预测方法、装置、计算机设备和计算机可读存储介质
CN110858366A (zh) * 2018-08-24 2020-03-03 北京嘀嘀无限科技发展有限公司 一种下单转化率预测方法和装置
CN109299373A (zh) * 2018-10-20 2019-02-01 上海交通大学 基于图卷积技术的推荐系统
CN110263780A (zh) * 2018-10-30 2019-09-20 腾讯科技(深圳)有限公司 实现异构图、分子空间结构性质识别的方法、装置和设备
CN110569437A (zh) * 2019-09-05 2019-12-13 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011483A (zh) * 2021-03-11 2021-06-22 北京三快在线科技有限公司 一种模型训练和业务处理的方法及装置
CN113032694A (zh) * 2021-05-26 2021-06-25 浙江口碑网络技术有限公司 基于场景的查询方法及装置、存储介质、计算机设备
CN113032694B (zh) * 2021-05-26 2021-11-09 浙江口碑网络技术有限公司 基于场景的查询方法及装置、存储介质、计算机设备
CN115080871A (zh) * 2022-07-07 2022-09-20 国家计算机网络与信息安全管理中心 一种跨社交网络社交用户对齐方法
CN115080871B (zh) * 2022-07-07 2024-05-17 国家计算机网络与信息安全管理中心 一种跨社交网络社交用户对齐方法

Also Published As

Publication number Publication date
CN111523933B (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN111523933B (zh) 一种下单概率预测方法、装置、电子设备及可读存储介质
US10733639B2 (en) System and method for analysis and presentation of used vehicle pricing data
CN111324824B (zh) 一种目的地推荐方法、其装置、电子设备及可读存储介质
CN111831897B (zh) 一种出行目的地推荐方法、装置、电子设备及存储介质
CN111612489A (zh) 订单量的预测方法、装置及电子设备
CN109084797B (zh) 一种导航路径推荐方法和装置
CN111861643A (zh) 一种乘车位置的推荐方法、装置、电子设备及存储介质
US11416800B2 (en) System and method for comparing enterprise performance using industry consumer data in a network of distributed computer systems
WO2023134188A1 (zh) 指标确定方法、装置、电子设备和计算机可读介质
CN112418341A (zh) 模型融合方法、预测方法、装置、设备及存储介质
Wang et al. On the development of a semi-nonparametric generalized multinomial logit model for travel-related choices
CN111831967A (zh) 一种到店识别方法、装置、电子设备及介质
CN114201482A (zh) 人口动态分布统计方法、装置、电子设备及可读存储介质
CN112767032A (zh) 一种信息处理方法、装置、电子设备及存储介质
CN111476389A (zh) 一种预估接单等待时长的方法及装置
CN111325614B (zh) 电子对象的推荐方法、装置和电子设备
CN115859016B (zh) 基于处理器的运算方法、装置、计算机设备及存储介质
CN111833080A (zh) 信息推送的方法、装置、电子设备和计算机可读存储介质
CN111861538A (zh) 信息推送方法、装置、电子设备和存储介质
CN111651686B (zh) 一种测试处理方法、装置、电子设备及存储介质
CN111881375A (zh) 一种顺路订单分配方法、装置、电子设备及可读存储介质
CN114493674A (zh) 一种广告点击率预测模型及方法
CN113591986A (zh) 用于生成推荐模型的对象权值的方法和个性化推荐方法
CN112801690A (zh) 一种干预特征的确定方法和装置
CN111831927B (zh) 信息推送装置、方法、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant