CN111861535A - 一种订单类型的预测方法、预测装置及可读存储介质 - Google Patents

一种订单类型的预测方法、预测装置及可读存储介质 Download PDF

Info

Publication number
CN111861535A
CN111861535A CN202010321062.8A CN202010321062A CN111861535A CN 111861535 A CN111861535 A CN 111861535A CN 202010321062 A CN202010321062 A CN 202010321062A CN 111861535 A CN111861535 A CN 111861535A
Authority
CN
China
Prior art keywords
sample
travel
destination
vector
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010321062.8A
Other languages
English (en)
Other versions
CN111861535B (zh
Inventor
杨晓庆
李奘
林宇澄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202010321062.8A priority Critical patent/CN111861535B/zh
Publication of CN111861535A publication Critical patent/CN111861535A/zh
Application granted granted Critical
Publication of CN111861535B publication Critical patent/CN111861535B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种订单类型的预测方法、预测装置及可读存储介质,通过从预先构建好的多关系异质信息模型图中,获取订单中的出行始发地的第一关系特征向量和出行目的地的第二关系特征向量;基于出行始发地信息和第一关系特征向量,确定出行始发地的第一预测特征向量,基于出行目的地信息和第二关系特征向量,确定出行目的地的第二预测特征向量;基于第一预测特征向量和第二预测特征向量,确定订单的订单类型。这样,不仅可以减少预测过程中处理的数据量,而且多关系异质信息模型图中出行始发地以及出行目的地的预测特征向量可以表征彼此之间出行关系的关联,包含丰富的多维特征,有助于提高对订单类型预测的效率,提高订单预测结果的准确率。

Description

一种订单类型的预测方法、预测装置及可读存储介质
技术领域
本申请涉及出行订单预测技术领域,具体而言,涉及一种订单类型的预测方法、预测装置及可读存储介质。
背景技术
随着科技的逐步发展,人们生活水平的日益提高,如今,人们出行时大多会选择通过出行软件进行打车服务,目前在乘客输入起点和终点等用车信息进行车辆预约从而生成出行订单后,一般会对所述出行订单的类别进行识别,这样可以提前判断订单类别,如识别出行订单是否是醉酒订单、代驾订单或者低质量订单等,以便提供不同的出行服务,有助于进一步优化系统调度,降低安全风险,从而提升司乘体验。
现阶段,在对于出行订单进行订单类型预测时,大多是通过与出行订单相关的出行信息,甚至结合历史出行信息,分别对起点和终点进行特征统计,以分别得到起点和终点的特征,但是,无论是通过机器学习还是人工专家来进行地点特征挖掘,需要消耗大量人力物力,而且只能获得单独表征各个特征地点本身属性的特征,导致订单预测时使用特征孤立,预测效率差,准确率低。
发明内容
有鉴于此,本申请的目的在于提供一种订单类型的预测方法、预测装置及可读存储介质,能够通过使用多关系异质信息模型图中聚集的出行始发地以及出行目的地的预测特征向量,来预测订单类型,不仅可以减少预测过程中处理的数据量,而且多关系异质信息模型图中出行始发地以及出行目的地的预测特征向量可以表征彼此之间出行关系的关联,包含丰富的多维特征,有助于提高对订单类型预测的效率,提高订单预测结果的准确率。
根据本申请的第一方面,提供了一种订单类型的预测方法,所述预测方法包括:
从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地;
从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量;
基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量;
基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
在本申请的一些实施例中,通过以下步骤确定所述多关系异质信息模型图:
从出行平台存储的出行数据中,确定包括所述出行始发地和所述出行目的地的出行区域中的多种出行关系;
确定所述出行区域中的多个特征预测地点,其中,所述多个特征预测地点包括所述出行始发地和所述出行目的地;
基于所述多个特征预测地点和所述多种出行关系,确定出多个出行样本,其中,每个出行样本包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系;
分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量;
将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量;
基于每个特征预测地点以及对应的关系特征向量,构建所述多关系异质信息模型图。
在本申请的一些实施例中,所述确定所述出行区域中的多个特征预测地点,包括:
从所述出行数据中确定出多个出行订单,并确定每个出行订单的出发地和目的地;
将确定出的多个出发地和多个目的地确定为所述出行区域中的多个特征预测地点。
在本申请的一些实施例中,所述确定所述出行区域中的多个特征预测地点,包括:
按照预设区域划分条件,将所述出行区域划分为多个子区域,其中,所述预设区域划分条件包括经纬度、地点类别、地理信息中的一种或者多种;
基于每个子区域的划分信息,确定与每个子区域对应的特征预测地点。
在本申请的一些实施例中,所述分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量,包括:
确定每个出行样本中样本出发地的第一初始特征向量、样本目的地的第二初始特征向量和与样本关系对应的神经网络参数;
将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练;
调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量。
在本申请的一些实施例中,所述将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练,包括:
针对每个出行样本,确定该出行样本的多个负样本,其中,每个负样本包括该出行样本的样本出发地、负样本目的地和该出行样本的样本关系;
将该出行样本中的第一初始特征向量作为输入,神经网络参数作为模型参数,通过构建好的神经网络模型得到输出的输出目的地;
通过训练好的分类器,确定从该出行样本的样本出发地去往输出目的地、样本目的地和各负样本目的地的概率;
所述调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量,包括:
针对每个出行样本,调整该出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,且从该出行样本的样本出发地去往样本目的地的概率大于该出行样本的样本出发地去往其他目的地的概率,确定调整后的第一初始特征向量为该出行样本中样本出发地的预测特征向量,调整后的第二初始特征向量为该出行样本中样本目的地的预测特征向量,其中,所述其他目的地为输出目的地和确定出的多个负样本目的地中的任意一个目的地。
在本申请的一些实施例中,在所述基于所述多个特征预测地点和所述多种出行关系,确定出多个出行样本,其中,每个出行样本包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系之后,所述预测方法包括:
确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地;
分别将每个反向样本输入至所述神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于所述预设阈值,得到每个反向出发地的反向特征向量和每个反向目的地的反向特征向量;
所述将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量,包括:
基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量。
在本申请的一些实施例中,所述确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地,包括:
针对每个出行样本,确定该出行样本中的样本出发地为反向目的地,该出行样本中的样本目的地为反向出发地;
确定包括确定出的反向出发地、反向目的地和该出行样本的样本关系的样本,为与该出行样本对应的反向样本。
在本申请的一些实施例中,所述基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量,包括:
针对每个出行样本,将该出行样本中样本出发地的预测特征向量和与该出行样本对应的反向样本中的反向目的地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本出发地对应的特征预测地点的关系特征向量;
将该出行样本中样本目的地的预测特征向量和与该出行样本对应的反向样本中的反向出发地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本目的地对应的特征预测地点的关系特征向量。
在本申请的一些实施例中,所述基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量,包括:
基于所述订单信息中指示的出行始发地信息,确定出行始发地的出发特征向量;
将确定出的出发特征向量和所述第一关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行始发地的第一预测特征向量;
基于所述订单信息中指示的出行目的地信息,确定出行目的地的到达特征向量;
将确定出的到达特征向量和所述第二关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行目的地的第二预测特征向量。
根据本申请的第二方面,提供了一种订单类型的预测装置,所述预测装置包括:
出行确定模块,用于从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地;
向量获取模块,用于从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量;
第一向量确定模块,用于基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量;
订单预测模块,用于基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
在本申请的一些实施例中,所述预测装置还包括模型图构建模块,所述模型图构建模块用于:
从出行平台存储的出行数据中,确定包括所述出行始发地和所述出行目的地的出行区域中的多种出行关系;
确定所述出行区域中的多个特征预测地点,其中,所述多个特征预测地点包括所述出行始发地和所述出行目的地;
基于所述多个特征预测地点和所述多种出行关系,确定出多个出行样本,其中,每个出行样本包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系;
分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量;
将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量;
基于每个特征预测地点以及对应的关系特征向量,构建所述多关系异质信息模型图。
在本申请的一些实施例中,所述模型图构建模块在用于确定所述出行区域中的多个特征预测地点时,所述模型图构建模块用于:
从所述出行数据中确定出多个出行订单,并确定每个出行订单的出发地和目的地;
将确定出的多个出发地和多个目的地确定为所述出行区域中的多个特征预测地点。
在本申请的一些实施例中,所述模型图构建模块在用于确定所述出行区域中的多个特征预测地点时,所述模型图构建模块用于:
按照预设区域划分条件,将所述出行区域划分为多个子区域,其中,所述预设区域划分条件包括经纬度、地点类别、地理信息中的一种或者多种;
基于每个子区域的划分信息,确定与每个子区域对应的特征预测地点。
在本申请的一些实施例中,所述模型图构建模块在用于分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量时,所述模型图构建模块用于:
确定每个出行样本中样本出发地的第一初始特征向量、样本目的地的第二初始特征向量和与样本关系对应的神经网络参数;
将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练;
调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量。
在本申请的一些实施例中,所述模型图构建模块在用于将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练时,所述模型图构建模块用于:
针对每个出行样本,确定该出行样本的多个负样本,其中,每个负样本包括该出行样本的样本出发地、负样本目的地和该出行样本的样本关系;
将该出行样本中的第一初始特征向量作为输入,神经网络参数作为模型参数,通过构建好的神经网络模型得到输出的输出目的地;
通过训练好的分类器,确定从该出行样本的样本出发地去往输出目的地、样本目的地和各负样本目的地的概率;
所述模型图构建模块在用于调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量时,所述模型图构建模块用于:
针对每个出行样本,调整该出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,且从该出行样本的样本出发地去往样本目的地的概率大于该出行样本的样本出发地去往其他目的地的概率,确定调整后的第一初始特征向量为该出行样本中样本出发地的预测特征向量,调整后的第二初始特征向量为该出行样本中样本目的地的预测特征向量,其中,所述其他目的地为输出目的地和确定出的多个负样本目的地中的任意一个目的地。
在本申请的一些实施例中,所述预测装置还包括第二向量确定模块,所述第二向量确定模块用于:
确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地;
分别将每个反向样本输入至所述神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于所述预设阈值,得到每个反向出发地的反向特征向量和每个反向目的地的反向特征向量;
所述向量获取模块在用于将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量时,所述向量获取模块用于:
基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量。
在本申请的一些实施例中,所述第二向量确定模块在用于确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地时,所述第二向量确定模块用于:
针对每个出行样本,确定该出行样本中的样本出发地为反向目的地,该出行样本中的样本目的地为反向出发地;
确定包括确定出的反向出发地、反向目的地和该出行样本的样本关系的样本,为与该出行样本对应的反向样本。
在本申请的一些实施例中,所述第二向量确定模块在用于基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量时,所述第二向量确定模块用于:
针对每个出行样本,将该出行样本中样本出发地的预测特征向量和与该出行样本对应的反向样本中的反向目的地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本出发地对应的特征预测地点的关系特征向量;
将该出行样本中样本目的地的预测特征向量和与该出行样本对应的反向样本中的反向出发地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本目的地对应的特征预测地点的关系特征向量。
在本申请的一些实施例中,所述第一向量确定模块在用于基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量时,所述第一向量确定模块用于:
基于所述订单信息中指示的出行始发地信息,确定出行始发地的出发特征向量;
将确定出的出发特征向量和所述第一关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行始发地的第一预测特征向量;
基于所述订单信息中指示的出行目的地信息,确定出行目的地的到达特征向量;
将确定出的到达特征向量和所述第二关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行目的地的第二预测特征向量。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的订单类型的预测方法的步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述的订单类型的预测方法的步骤。
本申请实施例提供的订单类型的预测方法、预测装置及可读存储介质,从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地;从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量;基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量;基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
与现有技术中的订单预测方法相比,确定出待预测订单的出行始发地和出行目的地,从预先构建的多关系异质信息模型图中确定出出行始发地的第一关系特征向量以及出行目的地的第二关系特征向量,并基于所述第一关系特征向量以及所述第二关系特征向量,对应的确定出所述出行始发地的第一预测特征向量,以及所述出行目的地的第二关系特征向量,再根据所述第一预测特征向量和所述第二预测特征向量确定出所述待预测订单的订单类型。这样,不仅可以减少预测过程中处理的数据量,而且多关系异质信息模型图中出行始发地以及出行目的地的预测特征向量可以表征彼此之间出行关系的关联,包含丰富的多维特征,有助于提高对订单类型预测的效率,提高订单预测结果的准确率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种预测系统的架构示意图;
图2为本申请实施例所提供的一种订单类型的预测方法的流程图;
图3为多关系异质信息模型图示意图;
图4为本申请另一实施例提供的一种订单类型的预测方法的流程图;
图5为本申请实施例所提供的一种订单类型的预测装置的结构示意图之一;
图6为本申请实施例所提供的一种订单类型的预测装置的结构示意图之二;
图7为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“预测订单类型”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕根据订单信息中的出行目的地对应的第一关系特征向量以及出行目的地对应的第一关系特征向量,确定出行始发地的第一预测特征向量以及出行目的地的第二预测特征向量,进而确定订单类型进行描述,但是应该理解,这仅是一个示例性实施例。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“乘客”、“请求方”、“服务请求方”和“客户”可互换使用,以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“提供方”、“服务提供方”和“供应商”可互换使用,以指代可以提供服务的个人、实体或工具。本申请中的术语“用户”可以指代请求服务、订购服务、提供服务或促成服务的提供的个人、实体或工具。例如,用户可以是乘客、驾驶员、操作员等,或其任意组合。在本申请中,“乘客”和“乘客终端”可以互换使用,“驾驶员”和“驾驶员终端”可以互换使用。
本申请中的术语“服务请求”和“订单”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的请求。接受该“服务请求”或“订单”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务请求可以是收费的或免费的。
本申请的一个方面涉及一种预测系统。所述预测系统可以通过从获取到的待预测订单的订单信息中,确定出待预测订单的出行始发地和出行目的地,从预先构建的多关系异质信息模型图中确定出出行始发地的第一关系特征向量以及出行目的地的第二关系特征向量,并基于所述第一关系特征向量以及所述第二关系特征向量,对应的确定出所述出行始发地的第一预测特征向量,以及所述出行目的地的第二关系特征向量,再根据所述第一预测特征向量和所述第二预测特征向量确定出所述待预测订单的订单类型。这样,不仅可以减少预测过程中处理的数据量,而且多关系异质信息模型图中出行始发地以及出行目的地的预测特征向量可以表征彼此之间出行关系的关联,包含丰富的多维特征,有助于提高对订单类型预测的效率,以及提高订单预测结果的准确率。
值得注意的是,现阶段,在对于出行订单进行订单类型预测时,大多是通过与出行订单相关的出行信息,甚至结合历史出行信息,分别对起点和终点进行特征统计,以分别得到起点和终点的特征,但是,无论是通过机器学习还是人工专家来进行地点特征挖掘,需要消耗大量人力物力,而且只能获得单独表征各个特征地点本身属性的特征,导致订单预测时使用特征孤立,预测效率差,准确率低。本申请的目的在于提供一种订单类型的预测方法、预测装置及可读存储介质,能够通过使用多关系异质信息模型图中聚集的出行始发地以及出行目的地的预测特征向量,来预测订单类型,不仅可以减少预测过程中处理的数据量,而且多关系异质信息模型图中出行始发地以及出行目的地的预测特征向量可以表征彼此之间出行关系的关联,包含丰富的多维特征,有助于提高对订单类型预测的效率,提高订单预测结果的准确率。
图1为本申请实施例提供的一种预测系统的架构示意图。例如,预测系统可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。预测系统可以包括服务器110、网络120、服务请求端130、服务提供端140、和数据库150中的一种或多种。
在一些实施例中,服务器110可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。例如,处理器可以基于从服务请求端130获得的服务请求来确定订单信息。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing,RISC)、或微处理器等,或其任意组合。
在一些实施例中,服务请求端130和服务提供端140对应的设备类型可以是移动设备,比如可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,也可以是平板计算机、膝上型计算机、或机动车辆中的内置设备等。
在一些实施例中,数据库150可以连接到网络120以与预测系统中的一个或多个组件(例如,服务器110,服务请求端130,服务提供端140等)通信。预测系统中的一个或多个组件可以经由网络120访问存储在数据库150中的数据或指令。在一些实施例中,数据库150可以直接连接到预测系统中的一个或多个组件,或者,数据库150也可以是服务器110的一部分。
下面结合上述图1示出的预测系统中描述的内容,对本申请实施例提供的订单类型的预测方法进行详细说明。
请参阅图2,图2为本申请实施例所提供的一种订单类型的预测方法的流程图。该方法可以由预测系统中的处理器来执行,具体执行过程为:
S201、从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地。
该步骤中,在获取到待预测出行订单时,从所述待预测订单对应的订单信息中确定出的出行始发地以及出行目的地。
这里,在所述待预测出行订单的订单信息中可以包括该订单对应的出行始发地、出行目的地以及出行时间段等信息。
S202、从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量。
该步骤中,从依据历史订单的订单信息,构建好的多关系异质信息模型图中,确定出与待预测订单中的所述出行始发地的第一关系特征向量,以及所述出行目的地的第二关系特征向量,其中,所述多关系异质信息模型图中表征包括有所述出行始发地和所述出行目的地的出行区域。
这里,所述第一关系特征向量以及第二关系特征向量,对应的表示了出行始发地这一节点与其他节点(可以是出行目的地)之间的关系,以及出行目的地这一节点与其他节点(可以是出行始发地)之间的关系,还可以表示出行始发地/出行目的地与特征关系之间的关系,这里所述关系可以指打车时间,可以通过一个三元组(出发地,打车时间,目的地)来表示关系特征向量。
这里,所述多关系异质信息模型图是根据平台中历史订单数据构建的,构成多关系异质信息模型图的三元组(出发地,打车时间,目的地),通过大量历史订单数据,得到了一个大规模的多关系异质信息模型图,如图3所示,图3为多关系异质信息模型图示意图,图上的每一条边代表了一次出行记录,每一个节点都代表一次出行记录中的出行始发地或出行目的地,每一条边代表了出行类型,即三元组中的打车时间,实际上,基于打车时间所述的时间段可以确定出十种类型,分别对应于工作日凌晨、工作日早高峰、工作日白天平峰、工作日晚高峰、工作日晚上、节假日凌晨、节假日早高峰、节假日白天平峰、节假日晚高峰、节假日晚上这10个打车时间段。基于获取的订单记录,确定出七个三元组,(1,工作日早高峰,5);(1,工作日晚高峰,2);(5,工作日白天平峰,2);(2,工作日白天平峰,3);(3,工作日早高峰,4);(4,工作日晚高峰,5);(4,工作日白天平峰,6),在所述多关系异质信息模型图中的边可以设计成不同的形状,以此更直观地确定出每两个节点之间的关系,如图3中所示,单直线r1表示工作日早高峰,虚线r2表示工作日白天平峰,双直线r3表示工作日晚高峰。
其中,所述异质信息模型图也可以是单关系图,指的是在所述单关系图中所有边都是一个类型,即单关系图统计的是某一打车时间中每个节点之间的关系。
S203、基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量。
该步骤中,根据所述订单信息中指示的出行始发地信息以及在步骤S202中确定出的第一关系特征向量,确定所述出行始发地的第一预测特征向量,并根据同样的原理反向计算,基于出行目的地信息以及在步骤S202中确定出的第二关系特征向量,确定出所述出行目的地的第二预测特征向量。
其中,所述第一预测特征向量可以由出行始发地的出行始发地信息以及所述第一关系特征向量拼接得到;同理的,所述第二预测特征向量可以由出行目的地的出行目的地信息以及所述第二关系特征向量拼接得到,表示了出行始发地的自身属性信息以及与其他节点(可以是出行目的地)之间的关系,以及出行目的地的自身属性信息以及与其他节点(可以是出行始发地)之间的关系,还可以表示出行始发地/出行目的地与特征关系之间的关系。
S204、基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
该步骤中,根据出行始发地的第一预测特征向量对所述出行始发地的定性描述以及所述出行目的地的第二预测特征向量对所述出行目的地的定性描述,确定出本次订单的订单类型,从而根据订单类型,确定行车路线以及是否接单等信息。
这里,所述订单类型可以表示乘客的叫车类型是顺风车还是出租车等,还可以根据乘客的出行始发地等表示乘客的状态,例如,乘客在晚上11点在某饭店门口提交了代驾订单,此时根据出行时间以及出行地点,此时乘客很有可能处于醉酒状态,本次订单类型是醉酒订单,司机在接单时考虑时间以及乘客的状态,可以选择是否接单。
本申请实施例提供的订单类型的预测方法,从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地;从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量;基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量;基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
与现有技术中的订单预测方法相比,确定出待预测订单的出行始发地和出行目的地,从预先构建的多关系异质信息模型图中确定出出行始发地的第一关系特征向量以及出行目的地的第二关系特征向量,并基于所述第一关系特征向量以及所述第二关系特征向量,对应的确定出所述出行始发地的第一预测特征向量,以及所述出行目的地的第二关系特征向量,再根据所述第一预测特征向量和所述第二预测特征向量确定出所述待预测订单的订单类型。这样,不仅可以减少预测过程中处理的数据量,而且多关系异质信息模型图中出行始发地以及出行目的地的预测特征向量可以表征彼此之间出行关系的关联,包含丰富的多维特征,有助于提高对订单类型预测的效率,提高订单预测结果的准确率。
请参阅图4,图4为本申请另一实施例提供的一种订单类型的预测方法的流程图。该方法可以由预测系统中的处理器来执行,具体执行过程为:
S401、从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地。
S402、从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量。
S403、基于所述订单信息中指示的出行始发地信息,确定出行始发地的出发特征向量。
该步骤中,根据所述订单信息中指示的出行始发地信息,将出行始发地信息中的多个特征集合,确定出所述出发特征向量。
其中,所述出发特征向量中可以包括所述出行始发地的位置(地理位置)、所述出行始发地的周围建筑,在历史订单数据中,所述出行始发地对应的多个出行目的地,以及最常去的出行目的地等信息。
S404、将确定出的出发特征向量和所述第一关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行始发地的第一预测特征向量。
该步骤中,将步骤S403确定出的出发特征向量和所述第一关系特征向量进行向量拼接,确定出一个新的向量,这个新的向量就是所述出行始发地的第一预测特征向量。
其中,所述第一关系特征向量可以是表示所述出行始发地与出行目的地之间的打车关系,一般由打车时间表示,还可以是表示所述出行始发地与打车关系之间的关系,这种关系可以体现于在某一打车时间段内,所述出行始发地作为出行始发地的次数。
这里,在对出发特征向量和所述第一关系特征向量进行向量拼接时,可以是直接将两者进行拼接,还可以是在分析两者中包含的特征之后,将相同的特征合并后再进行拼接。
S405、基于所述订单信息中指示的出行目的地信息,确定出行目的地的到达特征向量。
该步骤中,根据所述订单信息中指示的出行目的地信息,将出行目的地信息中的多个特征集合,确定出所述到达特征向量。
其中,所述到达特征向量中可以包括所述出行目的地的位置(地理位置)、所述出行目的地的周围建筑,在历史订单数据中,所述出行目的地对应的多个出行始发地,以及开始次数最多的出行始发地等信息。
S406、将确定出的到达特征向量和所述第二关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行目的地的第二预测特征向量。
该步骤中,将步骤S405确定出的到达特征向量和所述第二关系特征向量进行向量拼接,确定出一个新的向量,这个新的向量就是所述出行始发地的第二预测特征向量。
其中,所述第二关系特征向量可以是表示所述出行目的地与出行始发地之间的打车关系,一般由打车时间表示,还可以是表示所述出行目的地与打车关系之间的关系,这种关系可以体现于在某一打车时间段内,所述出行目的地作为行车目的地的次数。
这里,在对到达特征向量和所述第二关系特征向量进行向量拼接时,可以是直接将两者进行拼接,还可以是在分析两者中包含的特征之后,将相同的特征合并后再进行拼接。
S407、基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
其中,S401、S402以及S407的描述可以参照S201、S202以及S204的描述,并且能达到相同的技术效果,对此不做赘述。
进一步的,通过以下步骤确定所述多关系异质信息模型图:
S4021、从出行平台存储的出行数据中,确定包括所述出行始发地和所述出行目的地的出行区域中的多种出行关系。
该步骤中,从出行平台存储的历史记录中的出行数据中的包括出行数据中的出行始发地以及出行目的地的出行区域中的多种出行关系。
这里,从出行平台中可以获得多条出行数据,每一条出行数据中都包括一个出行始发地以及一个出行目的地,在获取地点数据时,无需获取该地点是出行始发地还是出行目的地的特征,只确定对应的出行区域。
这里,所述出行关系还是用打车时间来表征,也是从多条出行数据中确定出多个打车时间。
S4022、确定所述出行区域中的多个特征预测地点,其中,所述多个特征预测地点包括所述出行始发地和所述出行目的地。
该步骤中,从出行区域中确定出多个特征预测地点,这些出行预测地点包括出行始发地和出行目的地。
这里,出行区域可以是根据出行数据中的出行始发地和所述出行目的地所属区域确定的,也可以是根据预设划分条件确定的多个出行区域。
S4023、基于所述多个特征预测地点和所述多种出行关系,确定出多个出行样本,其中,每个出行样本包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系。
该步骤中,将步骤S4022确定的多个特征预测地点以及步骤S4021确定的多种出行关系随机排列组合,确定出包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系的多个出行样本。
这里,所述出行样本的格式可以是一个三元组(样本出发地,样本关系,所述样本目的)。
例如,确定出三个特征预测地点:A、B、C,以及两个样本关系:工作日早高峰以及节假日晚高峰,可以确定出的出行样本为(A,工作日早高峰,B)、(A,节假日晚高峰,B)、(A,工作日早高峰,C)、(A,节假日晚高峰,C)、(B,工作日早高峰,C)、(B,节假日晚高峰,C)、(B,工作日早高峰,A)、(B,节假日晚高峰,A)、(C,工作日早高峰,A)、(C,节假日晚高峰,A)、(C,工作日早高峰,B)、(C,节假日晚高峰,B)。
其中,出行样本是根据订单中的出行始发地、出行目的地以及出行关系随机组合确定的,所以样本数据的数量是多于订单数量的,并且订单中表示的出行始发地、出行目的地以及出行关系是包含在出行样本中的。
S4024、分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量。
该步骤中,将步骤S4023中确定的每个出行样本输入到构建好的神经网络模型中进行训练,在每个出行样本输入后都调整所述神经网络模型的参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量。
这里,所述在神经网络可以看作是一个函数,在训练过程中通过每次输入不同的出行样本后调整参数,调整该函数的收敛范围,直至对应的目标函数的变化值小于预设阈值,确定训练完成。
这里,每个预测特征向量都表示了样本出发地/样本目的地与样本目的地/样本出发地之间的出行关系,同样的,出行关系由打车时间表示。
这里,确定出的多个出行样本可以生成一个向量矩阵,同时输入至所述神经网络模型中,所述向量矩阵与预测地点的数量有关,假设某一出行区域中包括3万个预测地点,每个预测地点随机初始化一个d维的初始特征向量,假设d=20。对应到输入到神经网络模型中的所述向量矩阵就是一个3万*20维的向量矩阵。
S4025、将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量。
该步骤中,针对每个样本出发地,将步骤S4024确定的预测特征向量地确定为对应的关系特征向量,同样的,针对每个样本目的地,将步骤S4024确定的预测特征向量地确定为对应的关系特征向量。
S4026、基于每个特征预测地点以及对应的关系特征向量,构建所述多关系异质信息模型图。
该步骤中,根据每个特征预测地点以及对应的关系特征向量,确定出多个特征预测地点,以及每两个预测特征地点之间的关系特征向量,将每个特征预测地点作为顶点,将每两个预测特征地点之间的关系特征向量指示的出行关系作为边属性,形成所述多关系异质信息模型图。
其中,在所述多关系异质信息模型图中,相同的出行关系的边相同,同为单直线、虚线等。
例如,预测特征地点A对应的关系特征向量为(A,r,B),在图中预测特征地点A与预测特征B之间存在代表出行关系r的线段。
进一步的,步骤S4022包括:从所述出行数据中确定出多个出行订单,并确定每个出行订单的出发地和目的地;将确定出的多个出发地和多个目的地确定为所述出行区域中的多个特征预测地点。
该步骤中,从出行平台的出行数据中确定出多个出行订单,并确定每个订单中的出发地和目的地,并将确定出的多个出发地和多个目的地确定为出行区域中的多个特征预测地点。
这里,对于同一个地点可能在不同的订单中表示不同的地点特征,例如,S地在订单1中是出发地,在订单2中是目的地,这时在确定特征预测地点时,S地就是一个地点。
进一步的,步骤S4022包括:按照预设区域划分条件,将所述出行区域划分为多个子区域,其中,所述预设区域划分条件包括经纬度、地点类别、地理信息中的一种或者多种;基于每个子区域的划分信息,确定与每个子区域对应的特征预测地点。
该步骤中,按照预设的区域划分条件,划分所述出行区域,确定出多个子区域,根据每个子区域的划分信息,确定出每个子区域对应的特征预测地点。
其中,所述预设区域划分条件包括经纬度、地点类别、地理信息中的一种或者多种,当所述划分条件包括经纬度时,可以确定出的特征预测地点包括东经X°的全部地点等;当所述划分条件包括地点类别时,可以确定出的特征预测地点包括写字楼、百货商场、加油站;当所述划分条件包括地理信息时,可以确定出的特征预测地点包括XX街道、XX路段等。
进一步的,步骤S4024包括:确定每个出行样本中样本出发地的第一初始特征向量、样本目的地的第二初始特征向量和与样本关系对应的神经网络参数;将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练;调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量。
该步骤中,在每个出行样本中,为该样本中的样本出发地初始化一个第一初始特征向量,同时为样本目的地初始化一个第二初始特征向量,并将每个样本中的样本出发地以及样本目的地之间的样本关系确定为神经网络参数,针对每个出行样本,将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练,在训练过程中调整第一初始特征向量、第二初始特征向量以及神经网络参数,每调整一次神经网络模型的目标函数的都会对应一个变化值,直到所述目标函数的变化值小于预设阈值,确定对应的特征向量调整完成,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量。
这里,对于所述第一初始特征向量以及第二初始特征向量,在针对于所述样本始发地以及样本目的地来说,在初始化特征向量时,可以是随机初始化一个向量,对于初始化的特征向量中包含的参数的意义以及个数不作具体限定;也可以是根据最后的预测特征向量中的参数个数,在确定初始特征向量中参数的个数,并对初始特征向量中的每个参数进行随机赋值;还可以是根据历史数据中所述样本始发地以及样本目的地的出发地信息以及目的地信息,对应的对所述特征向量中包含的参数的意义以及个数作限定。
这里,所述神经网络参数是根据所述样本关系(打车时间)确定的,对应于上一实施例,共有十种打车时间,那么需要初始化10组独立的神经网络参数。
这里,对于所述神经网络模型的组成结构不做具体限定,可以是用三层感知机对所述神经网络模型的每一层进行限定,所述感知机是由两层神经元组成,输入层接受外界输入信号以后传递给输出层,感知机是二分类的线性分类模型,输入为实例的特征向量,输出为实例的类别,取+1和-1二值。线性分类模型表现在:感知机需要学习出一个在正类和负类之间的超平面使得正类和负类能够被正确的划分,所以需要通过出行样本进行模型训练时,输入的是正负两种样本。
进一步的,所述将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练,包括:针对每个出行样本,确定该出行样本的多个负样本,其中,每个负样本包括该出行样本的样本出发地、负样本目的地和该出行样本的样本关系;将该出行样本中的第一初始特征向量作为输入,神经网络参数作为模型参数,通过构建好的神经网络模型得到输出的输出目的地;通过训练好的分类器,确定从该出行样本的样本出发地去往输出目的地、样本目的地和各负样本目的地的概率。
该步骤中,对于每个出行样本,将所述出行样本中正确的样本目的地随机替换成错误的其他负样本目的地,形成多个负样本,将出行样本中的第一初始特征向量作为输入,神经网络参数作为模型参数,通过构建好的神经网络模型得到输出的输出目的地,在将所述输出目的地、所述样本目的地以及每个负样本目的地输入到训练好的分类器中,确定出从该出行样本的样本出发地去往输出目的地、样本目的地和各负样本目的地的概率。
这里,针对一个出行样本(A,r,B),其中,A为样本出行地、r为样本关系、B为该样本中正确的样本目的地,随机确定出多个错误的地点,生成k个负样本,如(A,r,B1),(A,r,B2)……(A,r,Bk)等等,B1、B2到Bk可以都属于特征预测地点中的一个。
这里,分类器的类型可以是softmax函数,通过所述softmax函数,输出样本出发地分别到B、B1、B2……、Bk的概率值,并且B的概率值越大越好,B1、B2……、Bk的概率值的越小越好。
进一步的,在确定出的多个负样本的基础上,所述调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量,包括:
针对每个出行样本,调整该出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,且从该出行样本的样本出发地去往样本目的地的概率大于该出行样本的样本出发地去往其他目的地的概率,确定调整后的第一初始特征向量为该出行样本中样本出发地的预测特征向量,调整后的第二初始特征向量为该出行样本中样本目的地的预测特征向量,其中,所述其他目的地为输出目的地和确定出的多个负样本目的地中的任意一个目的地。
该步骤中,逐步调整该出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,在所述神经网络模型的目标函数的变化值小于预设阈值,并且在出行样本中以及各负样本中,经由所述分类器确定出的样本出发地到所述样本目的地的概率值是最大的,这时,确定所述第一初始特征向量、第二初始特征向量调整结束,确定调整后的第一初始特征向量为该出行样本中样本出发地的预测特征向量,调整后的第二初始特征向量为该出行样本中样本目的地的预测特征向量。
这里,在调整过程中,可以采用梯度下降的方法,逐步调整该出行样本中的第一初始特征向量、第二初始特征向量,使得所述神经网络模型的目标函数的值向变小的趋势发展。
进一步的,在步骤S4023之后,所述预测方法还包括:确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地;分别将每个反向样本输入至所述神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于所述预设阈值,得到每个反向出发地的反向特征向量和每个反向目的地的反向特征向量。
该步骤中,将每一个出行样本中的样本出发地与样本目的地对调,将样本出发地作为反向目的地,将样本目的地作为反向出发地,确定出多个反向样本,将确定的每一个反向样本输入至所述神经网络模型中进行训练,与正向训练一样,调整每个反向样本的反向出发地的初始特征向量、反向目的地的初始特征向量以及神经网络参数,直至所述神经网络模型的目标函数的变化值小于所述预设阈值,得到每个反向出发地的反向特征向量和每个反向目的地的反向特征向量。
这里,对于得到的每个出行样本的调换过程可以是下述过程,有一预测地点A,以及与其有出行关系的预测地点B,在正向样本中,预测地点A作为样本出发地,预测地点B作为样本目的地,那么在反向样本中是预测地点A作为样本目的地,预测地点B作为样本出发地。
进一步的,在确定出反向样本后,步骤S4025包括:基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量。
该步骤中,在每一个出行样本中,将所述样本出发地对应的预测特征向量以及对应的反向样本中反向目的地的反向特征向量进行向量拼接,确定该出行样本中的样本出发地对应的特征预测地点的关系特征向量;同理,在每一个出行样本中,将所述样本目的地对应的预测特征向量以及对应的反向样本中反向目的地的反向特征向量进行向量拼接,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量。
这里,每一个预测地点的关系特征向量涵盖了该预测地点的全部出行关系,所以需要确定在该预测地点作为样本出发地的预测特征向量以及作为反向目的地的反向特征向量进行了向量拼接,以保证形成的预测特征向量包括了该预测地点的全部信息。
进一步的,所述确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地,包括:针对每个出行样本,确定该出行样本中的样本出发地为反向目的地,该出行样本中的样本目的地为反向出发地;确定包括确定出的反向出发地、反向目的地和该出行样本的样本关系的样本,为与该出行样本对应的反向样本。
该步骤中,针对于每一个出行样本,将该出行样本中的样本出发地作为反向目的地,将样本目的地作为反向出发地,样本中的样本关系不变,将确定出的反向出发地、反向目的地和该出行样本的按照样本格式形成与该出行样本对应的反向样本。
例如,出行样本(A,r,B)在该出行样本中,预测地点A为样本出发地,预测地点B为样本目的地,r为样本关系,那么在形成反向样本时,将预测地点A作为反向目的地,将预测地点B作为反向出发地,样本关系r保持不变,那么出行样本(A,r,B)对应的反向样本为(B,r,A)。
进一步的,所述基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量,包括:
(1)针对每个出行样本,将该出行样本中样本出发地的预测特征向量和与该出行样本对应的反向样本中的反向目的地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本出发地对应的特征预测地点的关系特征向量。
该步骤中,针对于每个出行样本,将该样本中的样本出发地的预测特征向量,以及该样本对应的反向样本中的反向目的地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本出发地对应的特征预测地点的关系特征向量。
这里,针对于同一出行样本中的样本出发地与对应的反向样本中的反向目的地是同一预测地点,所述样本出发地的预测特征向量以及反向目的地的反向特征向量都可以表征该预测地点的信息,需要将两者进行拼接。
其中,在对预测特征向量和所述反向特征向量进行向量拼接时,可以是直接将两者进行拼接,还可以是在分析两者中包含的特征之后,将相同的特征合并后再进行拼接。
(2)将该出行样本中样本目的地的预测特征向量和与该出行样本对应的反向样本中的反向出发地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本目的地对应的特征预测地点的关系特征向量。
该步骤中,同理,针对于每个出行样本,将该样本中的样本目的地的预测特征向量,以及该样本对应的反向样本中的反向出发地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本目的地对应的特征预测地点的关系特征向量。
这里,针对于同一出行样本中的样本目的地与对应的反向样本中的反向出发地是同一预测地点,所述样本目的地的预测特征向量以及反向出发地的反向特征向量都可以表征该预测地点的信息,需要将两者进行拼接。
其中,在对预测特征向量和所述反向特征向量进行向量拼接时,可以是直接将两者进行拼接,还可以是在分析两者中包含的特征之后,将相同的特征合并后再进行拼接。
本申请实施例提供的订单类型的预测方法,从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地;从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量;基于所述订单信息中指示的出行始发地信息,确定出行始发地的出发特征向量;将确定出的出发特征向量和所述第一关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行始发地的第一预测特征向量;基于所述订单信息中指示的出行目的地信息,确定出行目的地的到达特征向量;将确定出的到达特征向量和所述第二关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行目的地的第二预测特征向量。
与现有技术中的订单预测方法相比,确定出待预测订单的出行始发地和出行目的地,从预先构建的多关系异质信息模型图中确定出出行始发地的第一关系特征向量以及出行目的地的第二关系特征向量,并基于所述第一关系特征向量以及所述第二关系特征向量,对应的确定出所述出行始发地的第一预测特征向量,以及所述出行目的地的第二关系特征向量,再根据所述第一预测特征向量和所述第二预测特征向量确定出所述待预测订单的订单类型。这样,不仅可以减少预测过程中处理的数据量,而且多关系异质信息模型图中出行始发地以及出行目的地的预测特征向量可以表征彼此之间出行关系的关联,包含丰富的多维特征,有助于提高对订单类型预测的效率,以及提高订单预测结果的准确率。
请参阅图5、图6,图5为本申请实施例所提供的一种订单类型的预测装置的结构示意图之一,图6为本申请实施例所提供的一种订单类型的预测装置的结构示意图之二。如图5中所示,所述预测装置500包括:
出行确定模块510,用于从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地。
向量获取模块520,用于从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量。
第一向量确定模块530,用于基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量。
订单预测模块540,用于基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
进一步的,如图6所示,所述预测装置500还包括模型图构建模块550,所述模型图构建模块550用于:
从出行平台存储的出行数据中,确定包括所述出行始发地和所述出行目的地的出行区域中的多种出行关系;
确定所述出行区域中的多个特征预测地点,其中,所述多个特征预测地点包括所述出行始发地和所述出行目的地;
基于所述多个特征预测地点和所述多种出行关系,确定出多个出行样本,其中,每个出行样本包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系;
分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量;
将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量;
基于每个特征预测地点以及对应的关系特征向量,构建所述多关系异质信息模型图。
进一步的,所述模型图构建模块550在用于确定所述出行区域中的多个特征预测地点时,所述模型图构建模块550用于:
从所述出行数据中确定出多个出行订单,并确定每个出行订单的出发地和目的地;
将确定出的多个出发地和多个目的地确定为所述出行区域中的多个特征预测地点。
进一步的,所述模型图构建模块550在用于确定所述出行区域中的多个特征预测地点时,所述模型图构建模块550用于:
按照预设区域划分条件,将所述出行区域划分为多个子区域,其中,所述预设区域划分条件包括经纬度、地点类别、地理信息中的一种或者多种;
基于每个子区域的划分信息,确定与每个子区域对应的特征预测地点。
进一步的,所述模型图构建模块550在用于分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量时,所述模型图构建模块550用于:
确定每个出行样本中样本出发地的第一初始特征向量、样本目的地的第二初始特征向量和与样本关系对应的神经网络参数;
将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练;
调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量。
进一步的,所述模型图构建模块550在用于将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练时,所述模型图构建模块550用于:
针对每个出行样本,确定该出行样本的多个负样本,其中,每个负样本包括该出行样本的样本出发地、负样本目的地和该出行样本的样本关系;
将该出行样本中的第一初始特征向量作为输入,神经网络参数作为模型参数,通过构建好的神经网络模型得到输出的输出目的地;
通过训练好的分类器,确定从该出行样本的样本出发地去往输出目的地、样本目的地和各负样本目的地的概率;
所述模型图构建模块550在用于调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量时,所述模型图构建模块550用于:
针对每个出行样本,调整该出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,且从该出行样本的样本出发地去往样本目的地的概率大于该出行样本的样本出发地去往其他目的地的概率,确定调整后的第一初始特征向量为该出行样本中样本出发地的预测特征向量,调整后的第二初始特征向量为该出行样本中样本目的地的预测特征向量,其中,所述其他目的地为输出目的地确定出的多个负样本目的地中的任意一个目的地。
进一步的,如图6所示,所述预测装置500还包括第二向量确定模块560,所述第二向量确定模块560用于:
确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地;
分别将每个反向样本输入至所述神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于所述预设阈值,得到每个反向出发地的反向特征向量和每个反向目的地的反向特征向量;
所述模型图构建模块550在用于将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量时,所述模型图构建模块550用于:
基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量。
进一步的,所述第二向量确定模块560在用于确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地时,所述第二向量确定模块560用于:
针对每个出行样本,确定该出行样本中的样本出发地为反向目的地,该出行样本中的样本目的地为反向出发地;
确定包括确定出的反向出发地、反向目的地和该出行样本的样本关系的样本,为与该出行样本对应的反向样本。
进一步的,所述第二向量确定模块560在用于基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量时,所述第二向量确定模块560用于:
针对每个出行样本,将该出行样本中样本出发地的预测特征向量和与该出行样本对应的反向样本中的反向目的地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本出发地对应的特征预测地点的关系特征向量;
将该出行样本中样本目的地的预测特征向量和与该出行样本对应的反向样本中的反向出发地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本目的地对应的特征预测地点的关系特征向量。
进一步的,所述第一向量确定模块530在用于基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量时,所述第一向量确定模块530用于:
基于所述订单信息中指示的出行始发地信息,确定出行始发地的出发特征向量;
将确定出的出发特征向量和所述第一关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行始发地的第一预测特征向量;
基于所述订单信息中指示的出行目的地信息,确定出行目的地的到达特征向量;
将确定出的到达特征向量和所述第二关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行目的地的第二预测特征向量。
本申请实施例提供的订单类型的预测装置,从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地;从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量;基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量;基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
与现有技术中的订单预测方法相比,确定出待预测订单的出行始发地和出行目的地,从预先构建的多关系异质信息模型图中确定出出行始发地的第一关系特征向量以及出行目的地的第二关系特征向量,并基于所述第一关系特征向量以及所述第二关系特征向量,对应的确定出所述出行始发地的第一预测特征向量,以所及所述出行目的地的第二关系特征向量,再根据所述第一预测特征向量和述第二预测特征向量确定出所述待预测订单的订单类型。这样,不仅可以减少预测过程中处理的数据量,而且多关系异质信息模型图中出行始发地以及出行目的地的预测特征向量可以表征彼此之间出行关系的关联,包含丰富的多维特征,有助于提高对订单类型预测的效率,提高订单预测结果的准确率。
请参阅图7,图7为本申请实施例所提供的一种电子设备的结构示意图。如图7中所示,所述电子设备700包括处理器710、存储器720和总线730。
所述存储器720存储有所述处理器710可执行的机器可读指令,当电子设备700运行时,所述处理器710与所述存储器720之间通过总线730通信,所述机器可读指令被所述处理器710执行时,可以执行如上述图2以及图4所示方法实施例中的订单类型的预测方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时可以执行如上述图2以及图4所示方法实施例中的订单类型的预测方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (14)

1.一种订单类型的预测方法,其特征在于,所述预测方法包括:
从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地;
从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量;
基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量;
基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
2.根据权利要求1所述的预测方法,其特征在于,通过以下步骤确定所述多关系异质信息模型图:
从出行平台存储的出行数据中,确定包括所述出行始发地和所述出行目的地的出行区域中的多种出行关系;
确定所述出行区域中的多个特征预测地点,其中,所述多个特征预测地点包括所述出行始发地和所述出行目的地;
基于所述多个特征预测地点和所述多种出行关系,确定出多个出行样本,其中,每个出行样本包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系;
分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量;
将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量;
基于每个特征预测地点以及对应的关系特征向量,构建所述多关系异质信息模型图。
3.根据权利要求2所述的预测方法,其特征在于,所述确定所述出行区域中的多个特征预测地点,包括:
从所述出行数据中确定出多个出行订单,并确定每个出行订单的出发地和目的地;
将确定出的多个出发地和多个目的地确定为所述出行区域中的多个特征预测地点。
4.根据权利要求2所述的预测方法,其特征在于,所述确定所述出行区域中的多个特征预测地点,包括:
按照预设区域划分条件,将所述出行区域划分为多个子区域,其中,所述预设区域划分条件包括经纬度、地点类别、地理信息中的一种或者多种;
基于每个子区域的划分信息,确定与每个子区域对应的特征预测地点。
5.根据权利要求2所述的预测方法,其特征在于,所述分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量,包括:
确定每个出行样本中样本出发地的第一初始特征向量、样本目的地的第二初始特征向量和与样本关系对应的神经网络参数;
将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练;
调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量。
6.根据权利要求5所述的预测方法,其特征在于,所述将每个出行样本中的第一初始特征向量作为输入、第二初始特征向量作为输出以及神经网络参数作为模型参数,对构建好的神经网络模型进行训练,包括:
针对每个出行样本,确定该出行样本的多个负样本,其中,每个负样本包括该出行样本的样本出发地、负样本目的地和该出行样本的样本关系;
将该出行样本中的第一初始特征向量作为输入,神经网络参数作为模型参数,通过构建好的神经网络模型得到输出的输出目的地;
通过训练好的分类器,确定从该出行样本的样本出发地去往输出目的地、样本目的地和各负样本目的地的概率;
所述调整每个出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,确定调整后的每个第一初始特征向量为对应的样本出发地的预测特征向量,调整后的每个第二初始特征向量为对应的样本目的地的预测特征向量,包括:
针对每个出行样本,调整该出行样本中的第一初始特征向量、第二初始特征向量和神经网络参数,直至所述神经网络模型的目标函数的变化值小于预设阈值,且从该出行样本的样本出发地去往样本目的地的概率大于该出行样本的样本出发地去往其他目的地的概率,确定调整后的第一初始特征向量为该出行样本中样本出发地的预测特征向量,调整后的第二初始特征向量为该出行样本中样本目的地的预测特征向量,其中,所述其他目的地为输出目的地和确定出的多个负样本目的地中的任意一个目的地。
7.根据权利要求2所述的预测方法,其特征在于,在所述基于所述多个特征预测地点和所述多种出行关系,确定出多个出行样本,其中,每个出行样本包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系之后,所述预测方法包括:
确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地;
分别将每个反向样本输入至所述神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于所述预设阈值,得到每个反向出发地的反向特征向量和每个反向目的地的反向特征向量;
所述将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量,包括:
基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量。
8.根据权利要求7所述的预测方法,其特征在于,所述确定每个出行样本的反向样本,其中,每个反向样本包括与该反向样本对应的出行样本中的样本关系、反向出发地和反向目的地,包括:
针对每个出行样本,确定该出行样本中的样本出发地为反向目的地,该出行样本中的样本目的地为反向出发地;
确定包括确定出的反向出发地、反向目的地和该出行样本的样本关系的样本,为与该出行样本对应的反向样本。
9.根据权利要求7所述的预测方法,其特征在于,所述基于每个出行样本中样本出发地的预测特征向量以及对应的反向样本中反向目的地的反向特征向量,确定与每个出行样本中样本出发地对应的特征预测地点的关系特征向量,并基于每个出行样本中样本目的地的预测特征向量以及对应的反向样本中反向出发地的反向特征向量,确定与每个出行样本中样本目的地对应的特征预测地点的关系特征向量,包括:
针对每个出行样本,将该出行样本中样本出发地的预测特征向量和与该出行样本对应的反向样本中的反向目的地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本出发地对应的特征预测地点的关系特征向量;
将该出行样本中样本目的地的预测特征向量和与该出行样本对应的反向样本中的反向出发地的反向特征向量进行向量拼接,将得到的拼接向量确定为与该出行样本中样本目的地对应的特征预测地点的关系特征向量。
10.根据权利要求1所述的预测方法,其特征在于,所述基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量,包括:
基于所述订单信息中指示的出行始发地信息,确定出行始发地的出发特征向量;
将确定出的出发特征向量和所述第一关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行始发地的第一预测特征向量;
基于所述订单信息中指示的出行目的地信息,确定出行目的地的到达特征向量;
将确定出的到达特征向量和所述第二关系特征向量进行向量拼接,将得到的拼接向量确定为所述出行目的地的第二预测特征向量。
11.一种订单类型的预测装置,其特征在于,所述预测装置包括:
出行确定模块,用于从获取到的待预测订单的订单信息中,确定出所述待预测订单的出行始发地和出行目的地;
向量获取模块,用于从预先构建好的、包括所述出行始发地和所述出行目的地的出行区域的多关系异质信息模型图中,获取所述出行始发地的第一关系特征向量和所述出行目的地的第二关系特征向量;
第一向量确定模块,用于基于所述订单信息中指示的出行始发地信息和所述第一关系特征向量,确定所述出行始发地的第一预测特征向量,并基于所述订单信息中指示的出行目的地信息和所述第二关系特征向量,确定所述出行目的地的第二预测特征向量;
订单预测模块,用于基于所述第一预测特征向量和所述第二预测特征向量,确定所述待预测订单的订单类型。
12.根据权利要求11所述的预测装置,其特征在于,所述预测装置还包括模型图构建模块,所述模型图构建模块用于:
从出行平台存储的出行数据中,确定包括所述出行始发地和所述出行目的地的出行区域中的多种出行关系;
确定所述出行区域中的多个特征预测地点,其中,所述多个特征预测地点包括所述出行始发地和所述出行目的地;
基于所述多个特征预测地点和所述多种出行关系,确定出多个出行样本,其中,每个出行样本包括样本出发地、样本目的地和所述样本出发地与所述样本目的地之间的样本关系;
分别将每个出行样本输入至构建好的神经网络模型中进行训练,直至所述神经网络模型的目标函数的变化值小于预设阈值,得到每个样本出发地的预测特征向量和每个样本目的地的预测特征向量;
将每个样本出发地的预测特征向量确定为对应的特征预测地点的关系特征向量,并将每个样本目的地的预测特征向量确定为对应的特征预测地点的关系特征向量;
基于每个特征预测地点以及对应的关系特征向量,构建所述多关系异质信息模型图。
13.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至10任一项所述订单类型的预测方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至10任一项所述订单类型的预测方法的步骤。
CN202010321062.8A 2020-04-22 2020-04-22 一种订单类型的预测方法、预测装置及可读存储介质 Active CN111861535B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010321062.8A CN111861535B (zh) 2020-04-22 2020-04-22 一种订单类型的预测方法、预测装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010321062.8A CN111861535B (zh) 2020-04-22 2020-04-22 一种订单类型的预测方法、预测装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN111861535A true CN111861535A (zh) 2020-10-30
CN111861535B CN111861535B (zh) 2024-09-24

Family

ID=72985710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010321062.8A Active CN111861535B (zh) 2020-04-22 2020-04-22 一种订单类型的预测方法、预测装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN111861535B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010145115A (ja) * 2008-12-16 2010-07-01 Nec Corp 目的地予測システム、目的地予測方法及びプログラム
CN106897919A (zh) * 2017-02-28 2017-06-27 百度在线网络技术(北京)有限公司 用车类型预测模型建立、信息提供方法及装置
CN107438226A (zh) * 2016-05-25 2017-12-05 滴滴(中国)科技有限公司 订单发布处理方法及服务器
CN109800232A (zh) * 2019-01-21 2019-05-24 北京邮电大学 一种异质信息网络嵌入方法、装置、电子设备及存储介质
CN110599767A (zh) * 2019-09-04 2019-12-20 广东工业大学 一种基于网约车出行需求的长短期预测方法
CN110851662A (zh) * 2019-11-05 2020-02-28 中国人民解放军国防科技大学 基于元路径的异质信息网络链路预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010145115A (ja) * 2008-12-16 2010-07-01 Nec Corp 目的地予測システム、目的地予測方法及びプログラム
CN107438226A (zh) * 2016-05-25 2017-12-05 滴滴(中国)科技有限公司 订单发布处理方法及服务器
CN106897919A (zh) * 2017-02-28 2017-06-27 百度在线网络技术(北京)有限公司 用车类型预测模型建立、信息提供方法及装置
CN109800232A (zh) * 2019-01-21 2019-05-24 北京邮电大学 一种异质信息网络嵌入方法、装置、电子设备及存储介质
CN110599767A (zh) * 2019-09-04 2019-12-20 广东工业大学 一种基于网约车出行需求的长短期预测方法
CN110851662A (zh) * 2019-11-05 2020-02-28 中国人民解放军国防科技大学 基于元路径的异质信息网络链路预测方法

Also Published As

Publication number Publication date
CN111861535B (zh) 2024-09-24

Similar Documents

Publication Publication Date Title
TWI746814B (zh) 電腦可讀介質、車險風險預測裝置及伺服器
CN111366160B (zh) 路径规划方法、路径规划装置及终端设备
JP6677802B2 (ja) 到着時間を推定するための方法およびシステム
CN109840660B (zh) 一种车辆特征数据处理方法及车辆风险预测模型训练方法
CN111862585B (zh) 用于交通预测的系统和方法
US10380503B2 (en) Distributed online learning for privacy-preserving personal predictive models
TW201741993A (zh) 確定運輸服務路線之系統及方法
CN111612122A (zh) 实时需求量的预测方法、装置及电子设备
CN111859172B (zh) 信息推送方法、装置、电子设备和计算机可读存储介质
CN111680382A (zh) 等级预测模型训练方法、等级预测方法、装置及电子设备
CN116362431B (zh) 共享车辆的调度方法、装置、计算机设备和存储介质
CN111523933B (zh) 一种下单概率预测方法、装置、电子设备及可读存储介质
CN116341773A (zh) 车辆需求预测方法、装置、计算机设备和存储介质
CN111861178A (zh) 服务匹配模型的训练方法、服务匹配方法、设备及介质
CN111833119A (zh) 一种订单分配的方法、装置、电子设备及存储介质
CN111861538B (zh) 信息推送方法、装置、电子设备和存储介质
CN111199440A (zh) 事件预估方法、装置以及电子设备
CN111861535A (zh) 一种订单类型的预测方法、预测装置及可读存储介质
CN117333093A (zh) 配送订单的处理方法、装置、设备及存储介质
CN109948822B (zh) 一种地理区域内网约车供需缺口预测方法
CN111612198B (zh) 预测拼单成功率的方法、装置和电子设备
CN112329962B (zh) 数据处理方法、装置、电子设备和存储介质
CN113255952A (zh) 信息推送方法、装置、电子设备和存储介质
CN111813881A (zh) 用于行程信息处理的方法、装置、设备和存储介质
CN111881375A (zh) 一种顺路订单分配方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant