CN112884235A - 出行推荐方法、出行推荐模型的训练方法、装置 - Google Patents

出行推荐方法、出行推荐模型的训练方法、装置 Download PDF

Info

Publication number
CN112884235A
CN112884235A CN202110239861.5A CN202110239861A CN112884235A CN 112884235 A CN112884235 A CN 112884235A CN 202110239861 A CN202110239861 A CN 202110239861A CN 112884235 A CN112884235 A CN 112884235A
Authority
CN
China
Prior art keywords
travel
travel mode
user
mode
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110239861.5A
Other languages
English (en)
Other versions
CN112884235B (zh
Inventor
钟子宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110239861.5A priority Critical patent/CN112884235B/zh
Publication of CN112884235A publication Critical patent/CN112884235A/zh
Application granted granted Critical
Publication of CN112884235B publication Critical patent/CN112884235B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Navigation (AREA)

Abstract

本申请提供了一种出行推荐方法、出行推荐模型的训练方法和装置,能够应用于地图类应用、导航、自动驾驶等领域,能够推荐目标对象偏好的出行方式,以及基于目标对象偏好的出行方式推荐出行路径。出行推荐方法包括:获取T时期的特征信息;将T时期的特征信息输入出行方式推荐模型,得到目标出行方式;获取目标出行方式下的时间向量、限速向量、时间上限值和距离约束值;将时间向量、限速向量、时间上限值、距离约束值输入目标出行方式下的出行路径推荐模型,得到速度估计向量和截距估计向量;根据速度估计向量和截距估计向量,计算路径距离向量;根据路径距离向量计算的距离最小方差,确定目标出行方式下的目标出行路径。

Description

出行推荐方法、出行推荐模型的训练方法、装置
技术领域
本申请实施例涉及人工智能技术领域,并且更具体地,涉及一种出行推荐方法、出行推荐模型的训练方法、装置。
背景技术
随着互联网技术的发展,一些出行服务应用(如导航类应用程序或者导航类小程序)能够生成出行路径,丰富了用户的出行体验。然而,现阶段的出行路径生成方案还不够完善,如未考虑用户的出行偏好等,如何基于用户需求生成更为合理的出行路径,是一项亟待解决的技术问题。
发明内容
本申请提供了一种出行推荐方法、出行推荐模型的训练方法、装置、电子设备、芯片和计算机可读存储介质,能够根据目标对象出行偏好的行为特征,自动为目标对象推荐最优出行方式,并在此基础上,根据距离最小方差的最优化算法计算该出行方式下的最优路线方案,以及出行服务应用可以根据推荐得到的最优出行方式和路径方案进入导航模式,解决了地图类应用中需要人工搜索出行方式和出行路线的缺点,并且考虑了出行偏好和出行路线的限制信息等实际情况,能够更贴近现实生活。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请的一方面,提供了一种出行推荐方法,包括:
获取T时期的特征信息,其中,T时期的特征信息是根据T时期的用户个人特征信息、用户出行特征信息和始发地与目的地之间的路况特征信息确定的;
将T时期的特征信息输入预先训练的出行方式推荐模型,得到出行方式推荐模型从M种出行方式中推荐的目标出行方式,M为正整数;
获取目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值和距离约束值,N为正整数;
将目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值输入目标出行方式下预先训练的出行路径推荐模型,得到目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量;
根据目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量,计算得到目标出行方式下对应于N条出行路径的路径距离向量;
根据目标出行方式下对应于N条出行路径的路径距离向量计算的距离最小方差,确定目标出行方式下的目标出行路径。
根据本申请的一方面,提供了一种出行推荐模型的训练方法,包括:
获取出行方式训练样本集和M个出行路径训练样本集;
其中,出行方式训练样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;M个出行路径训练样本集分别对应M种出行方式,M个出行路径训练样本集中的每个出行路径训练样本集包括对应的出行方式下对应于N条出行路径的时间向量、限速向量、距离向量、时间上限值、距离约束值,M和N均为正整数;
根据出行方式训练样本集训练出行方式推荐模型,以及根据M个出行路径训练样本集分别训练M种出行方式下的出行路径推荐模型。
根据本申请的一方面,提供了一种出行推荐装置,包括:
获取模块,用于获取T时期的特征信息,其中,T时期的特征信息是根据T时期的用户个人特征信息、用户出行特征信息和始发地与目的地之间的路况特征信息确定的;
处理模块,用于将T时期的特征信息输入预先训练的出行方式推荐模型,得到出行方式推荐模型从M种出行方式中推荐的目标出行方式,M为正整数;
获取模块,还用于获取目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值和距离约束值,N为正整数;
处理模块,还用于将目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值输入目标出行方式下预先训练的出行路径推荐模型,得到目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量;
计算模块,用于根据目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量,计算得到目标出行方式下对应于N条出行路径的路径距离向量;
确定模块,用于根据目标出行方式下对应于N条出行路径的路径距离向量计算的距离最小方差,确定目标出行方式下的目标出行路径。
根据本申请的一方面,提供了一种出行推荐模型的训练装置,包括:
获取模块,用于获取出行方式训练样本集和M个出行路径训练样本集;
其中,出行方式训练样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;M个出行路径训练样本集分别对应M种出行方式,M个出行路径训练样本集中的每个出行路径训练样本集包括对应的出行方式下对应于N条出行路径的时间向量、限速向量、距离向量、时间上限值、距离约束值,M和N均为正整数;
训练模块,用于根据出行方式训练样本集训练出行方式推荐模型,以及根据M个出行路径训练样本集分别训练M种出行方式下的出行路径推荐模型。
根据本申请的一方面,提供了一种电子设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,执行上述出行推荐方法的步骤,或者,执行上述出行推荐模型的训练方法的步骤。
根据本申请的一方面,提供了一种芯片,包括:处理器,用于从存储器中调用并运行计算机程序,使得该处理器执行上述出行推荐方法的步骤,或者,执行上述出行推荐模型的训练方法的步骤。
根据本申请的一方面,提供了一种计算机可读存储介质,用于存储计算机程序,该计算机程序使得计算机执行上述出行推荐方法的步骤,或者,执行上述出行推荐模型的训练方法的步骤。
基于上述技术方案,能够根据目标对象出行偏好的行为特征,自动为目标对象推荐最优出行方式,并在此基础上,根据距离最小方差的最优化算法计算该出行方式下的最优路线方案,以及出行服务应用可以根据推荐得到的最优出行方式和路径方案进入导航模式,解决了地图类应用中需要人工搜索出行方式和出行路线的缺点,并且考虑了出行偏好和出行路线的限制信息等实际情况,能够更贴近现实生活。
本申请实施例的其他特性和优点将通过下面的详细描述变得显然,或者部分通过本申请的实践而习得。
应理解,以上的一般描述和后文的细节描述仅是示例性的,并不对本申请构成限定。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出了根据本申请的一个实施例中提供的出行推荐方法以及出行推荐模型的训练方法的应用场景图;
图2示意性示出了本申请提供的基于距离、时间和限速约束下的最优出行方式的推荐流程图;
图3示意性示出了本申请提供的基于用户出行偏好的双层softmax多分类最优出行方式及路线的推荐流程图;
图4示意性示出了根据本申请的一实施例的出行推荐方法的流程图;
图5示意性示出了根据本申请的一实施例的出行推荐模型的训练方法的流程图;
图6示意性示出了根据本申请的一实施例的出行方式推荐阶段和出行路径推荐阶段的示意性图;
图7示意性示出了根据本申请的一实施例的出行方式推荐的示意性图;
图8示意性示出了根据本申请的一实施例的出行方式推荐模型的训练及测试的示意性图;
图9示意性示出了根据本申请的一实施例的出行方式推荐模型的预测的示意性图;
图10示意性示出了根据本申请的一实施例的出行路径推荐的示意性图;
图11示意性示出了根据本申请的一实施例的出行推荐装置的框图;
图12示意性示出了根据本申请的一实施例的出行推荐模型的训练装置的框图;
图13示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些示例实施方式使得本申请的描述将更加全面的完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的示例实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略特定细节中的一个或更多,或者可以采用其他的方法、组元、步骤等。在其它情况下,不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本申请的各方面变得模糊。
附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络、处理器装置或者微控制装置中现实这些功能实体。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。本申请可以基于人工智能技术进行多说话人场景识别以及多说话人场景识别网络训练。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能,也即使机器具有学习能力。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门科学。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络(如卷积神经网络)、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
人工智能结合云服务,也可以实现人工智能云服务,一般也被称作是AI即服务(AIas a Service,AIaaS)。这是目前主流的一种人工智能平台的服务方式,具体来说AIaaS平台会把几类常见的AI服务进行拆分,并在云端提供独立或者打包的服务。这种服务模式类似于开了一个AI主题商城:所有的开发者都可以通过应用程序接口(ApplicationProgramming Interface,API)接口的方式来接入使用平台提供的一种或者是多种人工智能服务,部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运维自已专属的云人工智能服务。
图1为一个实施例中提供的出行推荐方法以及出行推荐模型的训练方法的应用场景图,如图1所示,在该应用场景中,包括终端110和服务器120。
在一些实现方式中,可以通过服务器120对出行方式推荐模型和出行路径推荐模型进行训练。服务器120获取到训练好的出行方式推荐模型和出行路径推荐模型后,可以将其部署在出行服务应用中,终端110可以安装该出行服务应用,当终端110获取得到T时期的特征信息之后,用户可以通过相应的操作发出出行推荐指令,终端110可以接收出行推荐指令,出行方式推荐模型根据获取的T时期的特征信息输出目标出行方式,以及目标出行方式下的出行路径推荐模型根据目标出行方式下的时间向量、限速向量、时间上限值、距离约束值输出目标出行路径。
上述出行服务应用可以是导航或地图类应用程序或小程序,该出行服务应用还可以具有语音输入、导航、数据记录、音视频播放、翻译、数据查询等功能。
在另一些实现方式中,可以通过终端110对出行方式推荐模型和出行路径推荐模型进行训练。终端110可以接收用户的出行推荐指令,出行方式推荐模型根据获取的T时期的特征信息输出目标出行方式,以及目标出行方式下的出行路径推荐模型根据目标出行方式下的时间向量、限速向量、时间上限值、距离约束值输出目标出行路径。
可以理解,上述应用场景仅是一个示例,并不能构成对本申请实施例提供的出行推荐方法以及出行推荐模型的训练方法的限制。例如,训练好的出行方式推荐模型和出行路径推荐模型可以存储在服务器120中,服务器120可以接收终端110发送的出行相关信息,以及分别基于出行方式推荐模型和出行路径推荐模型获取目标出行方式和目标出行路径,并返回到终端110中。
服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、车载设备以及智能手表等,但并不局限于此。终端110和服务器120可以通过有线或者无线通信方式进行直接或间接地连接,本申请对此并不限定。
为便于更好的理解本申请实施例,对本申请相关的术语进行说明。
最小二乘法:是一种数学优化技术;它通过最小化误差的平方和寻找数据的最佳函数匹配。
Softmax算法:将一个含任意实数的K维向量Z“压缩”到另一个K维实向量f(Z)中,使得每一个元素的范围都在(0,1)之间,并且所有元素的和为1。其中,
Figure BDA0002961758620000071
ei表示第i个位置为1其余位置为0的单位向量。
最优化算法:给定一个函数f(x),寻找一个元素x0使得函数值f(x0)最小化或者最大化的方法。
出行方式:地图应用中的驾车、打车、公交地铁、步行、骑行等方式。
出行方式推荐:根据出发地与目的地的距离、路面交通状况、交通出行费用、油耗等,对地图应用中的驾车、打车、公交地铁、步行、骑行等出行方式的一种推荐。
出行偏好:用户常用的出行方式表示用户出行偏好。
出行路线方案推荐:在每种出行方式下,根据用户行为偏好,经算法推荐为用户给出的最优出行路线方案。
为便于更好的理解本申请实施例,对本申请相关的基于距离、时间和限速约束下的最优出行方式推荐方案进行说明。
该方案主要根据用户的距离约束、时间约束、限速约束条件下,通过最小损失的最优化方法进行,寻找最优的出行方式及最优出行方式下的最优路线,如图2所示。具体可以包括如图2所示的S1-S9。
S1,输入时间矩阵T和限速矩阵K,时间上限tc,距离约束d;
S2.基于输入数据确定训练样本和测试样本;
S3.代入训练样本和约束条件,使用线性回归模型训练模型;
S4.得到参数模型矩阵V(速度矩阵)、C(截距矩阵);
S5.代入测试样本、模型矩阵V、C,计算方差;
S6.使用有放回重采样方法循环得到方差矩阵;
S7.获取方差最优模型(V,C);
S8.代入全部样本计算各出行方式的行进距离;
S9.将行进距离最短的路线及对应出行方式形成信息推荐给用户。
如图2所示的方案能够解决人工选择出行方式和出行路线方案的缺点,然而,该方法并没有解决用户出行偏好的问题,只能根据距离、时间、限速进行统一的综合计算,并不能根据用户出行偏好进行个性化推荐。
为便于更好的理解本申请实施例,对本申请相关的基于用户出行偏好的双层softmax多分类最优出行方式及路线推荐方案进行说明。
该方案通过双层softmax多分类算法,根据T-1期用户出行偏好的用户(User)特征和项目(Item)特征及T期用户分类标签组成的训练样本,训练用户偏好的出行方式模型W和偏好的出行路线方案模型S,再根据用户的出行偏好预测样本(T期用户出行偏好的User特征和Item特征)预测用户偏好的出行方式和出行路线方案(i,j),如图3所示,出行方式推荐阶段可以如图3所示的S1a-S1d,出行路线推荐阶段可以如图3所示的S2a-S2e。
出行方式推荐阶段:
S1a.输入数据(T-1时期的用户特征、项目特征、T时期的出行方式多分类标签);
S1b.样本处理阶段:输入特征数据,并将特征分成个人信息部分特征和与车相关信息部分特征,将与车相关信息特征与项目特征进行交叉后,与个人信息相关特征、分类标签根据用户标识进行拼接得到最终训练和测试样本;
S1c.出行方式模型训练测试阶段:输入处理后的训练样本,使用softmax(逻辑回归)六分类模型进行训练,代入测试样本,计算查全率、查准率和AUC,如果模型达标则保存模型,否则重复执行S1b~S1c,直至模型达标;
S1d.出行方式模型预测阶段:输入处理后的T时期预测样本,训练好的模型,使用softmax(逻辑回归)六分类模型计算用户得分,并给定固定阈值下的用户分类测试标签,从而得到用户偏好的出行方式(i)。
出行路线推荐阶段:
S2a.输入数据(T-1时期的用户在每种出行方式下各个路线的用户特征、项目特征、T时期点击导航路线的多分类标签);输入最优出行方式i(i=0,1,2,3,4,5);
S2b.样本处理阶段:将输入的T-1时期用户特征、项目特征、标签进行拼接后,按出行方式分为6组,并按照S1b划分成训练样本、测试样本;
S2c.最优出行路线模型训练测试阶段:输入处理后的第i组训练样本,使用softmax(逻辑回归)四分类模型进行训练,代入第i组测试样本,计算查全率、查准率和AUC,如果模型达到评价指标则保存模型,否则重复执行S2b~S2c,直至模型达标;
S2d.最优路线模型预测阶段:输入处理后的T时期预测样本,训练好的模型,使用softmax(逻辑回归)四分类模型计算用户得分,并给定固定阈值下的用户分类预测标签,从而得到用户偏好的最优出行方式及路线(i,j)。
S2e.用户偏好出行方式和路线推荐阶段:输出用户偏好的最优出行方式及路线(i,j)后,系统根据该最优出行方式和路径直接进入导航页面,用户点击“开始导航”即进入导航。
如图3所示的方案能根据用户出行偏好进行个性化推荐,然而,该方案并没有考虑出行路线方案中的距离约束、时间约束、限速等实际问题。
上述基于距离、时间和限速约束下的最优出行方式推荐方案,根据用户的距离约束、时间约束、限速约束条件下,通过最小损失的最优化方法进行,寻找最优的出行方式及最优出行方式下的最优路线,并不能使用用户出行偏好的行为特征进行个性化推荐。
上述基于用户出行偏好的双层softmax多分类最优出行方式及路线推荐方案,根据用户出行偏好行为特征进行模型训练和预测得到用户偏好的最优路径,从而根据用户出行偏好的不同进行个性化推荐。然而,该方案仅考虑用户出行偏好,并没有考虑实际的时间、距离、限速等约束问题。
基于上述技术问题,本申请提出了出行推荐方案,能够根据用户出行偏好的行为特征,自动为用户选择最优出行方式,并在此基础上,根据距离最小方差的最优化算法计算该出行方式下的最优路线方案,以及根据推荐得到的最优出行方式和路径方案自动进入导航模式,解决了地图应用中需要人工搜索出行方式和出行路线的缺点,并且考虑了用户偏好和路线方案的限制信息等实际情况,能够更贴近现实生活。
本方案分为两层,第一层为用户偏好的出行方式推荐层,该层采用softmax多分类算法,根据用户始发地和目的地的距离、道路交通状况信息、费用信息、油耗信息、耗时信息、用户的收入情况、资产情况、出行服务应用程序(APP)或出行服务小程序中的点击情况、活跃情况、模块付费情况、导航路线信息等数据特征,训练得到出行方式推荐模型W后,根据用户(User)特征、项目(Item)特征构成的预测样本得到用户最优出行方式i。第二层为带约束条件的距离最小方差条件下的出行路径推荐层,该层根据始发地与目的地的距离约束、时间约束、限速约束,通过路线方案与两地之间的直线距离最小损失的最优化方法寻找用户最优出行方式i下的最优路线j,从而形成个性化最优出行方式及路线方案(i,j)。
本方案在第一层使用softmax多分类算法选出用户偏好的出行方式后,对第二层中每种出行方式下的出行路径推荐模型,采用分布式并行方式进行训练,提高模型训练效率。
本方案第一层采用用户在地图APP或地图小程序端的点击行为、活跃行为、付费行为、导航行为等用户偏好行为特征,解决了用户出行偏好问题,而在第二层根据实际路况信息特征,采用动态规划方法,解决了实际出行路线中的路线规划问题。
下面对本申请实施例的具体实施过程进行详细的描述。
图4示出了根据本申请的一个实施例的出行推荐方法200的示意性流程图,该出行推荐方法200可以由具有计算处理能力的设备来执行,例如,上述终端110或服务器120。参照图4所示,该出行推荐方法200至少可以包括S210至S260,详细介绍如下:
在S210中,获取T时期的特征信息,其中,T时期的特征信息是根据T时期的用户个人特征信息、用户出行特征信息和始发地与目的地之间的路况特征信息确定的。
具体的,本申请实施例中,一个“时期”可以是指一分钟、k1分钟、半小时、一小时、k2小时、一天、k3天、一周…等周期时间,k1、k2、k3均为正整数。
在一些实施例中,T时期的特征信息是由T时期始发地与目的地之间的路况特征信息中的每个特征与T时期的用户出行特征信息中的每个特征进行交叉,再与T时期的用户个人特征信息中的特征进行连接之后得到的。
在一些实施例中,T时期的特征信息根据以下公式1确定:
Figure BDA0002961758620000111
其中,XT表示T时期的特征信息,U1,T表示T时期的用户个人特征信息,U2,T表示T时期的用户出行特征信息,IT表示T时期始发地与目的地之间的路况特征信息,
Figure BDA0002961758620000112
表示IT中的每个特征与U2,T中的每个特征进行交叉,再与U1,T中的特征进行连接。
基于上述公式1所确定的特征信息,能够将始发地与目的地之间的路况特征信息和用户出行特征信息进行有效关联,特征丰富度得到极大提高,进而能有效提升出行方式推荐模型的出行推荐效果。
在一些实施例中,用户个人信息特征包括用户基本信息、用户资产信息中的至少一种。
具体的,用户基本信息可以包括但不限于以下至少一种:
性别、年龄、收入、工作性质、工作地、家庭成员数量。
具体的,用户资产信息可以包括但不限于以下至少一种:
固定资产、股票、证券、房产。
在一些实施例中,用户出行特征信息包括用户是否有车、用户在出行服务应用中的点击信息、用户在出行服务应用中的活跃信息、用户在出行服务应用中的出行消费信息、用户在出行服务应用中的出行信息、用户车辆油耗信息、用户出行成本信息、用户等车时长信息中的至少一种。
具体的,在用户有车的情况下,用户出行特征信息还可以包括车辆品牌、车辆型号、车牌归属地等。
在一些实施例中,出行服务应用可以是出行服务APP或出行服务小程序。例如,地图APP或地图小程序。
具体的,用户在出行服务应用中的点击信息包括但不限于以下至少一种:
用户点击出行服务应用及其内部各个模块的点击次数、取消次数、退出次数。
具体的,用户在出行服务应用中的活跃信息包括但不限于以下至少一种:
活跃次数、活跃天数、活跃时长、最近一次活跃时长、出行服务应用注册时长。
具体的,用户在出行服务应用中的出行消费信息可以包括但不限于以下至少一种:
出行服务应用中的模块消费次数、出行服务应用中的模块消费天数、出行服务应用中的模块消费金额、出行服务应用中的模块消费占总消费的比例。
具体的,用户在出行服务应用中的出行信息可以包括但不限于以下至少一种:
每种出行方式开始导航的次数、退出次数、经常导航的目的地、目的地与用户当前位置/始发地距离信息、用户常用出行方式的点击/切换次数。
具体的,用户出行成本信息可以包括但不限于以下至少一种:
加油费、公交地铁费、打车费、骑行费、平均步行时长。
在一些实施例中,路况特征信息包括交通状况信息、交通灯信息、道路信息、车辆等待时长、道路限速信息、路段平均耗时信息中的至少一种。
具体的,交通状况信息可以包括但不限于以下至少一种:
用户在出行服务应用上显示的道路拥堵情况(严重拥堵、拥堵、行车缓慢、行车畅通)。
具体的,交通灯信息可以包括但不限于以下至少一种:
道路交通灯个数、交通灯等待时长。
在一些实施例中,路况特征信息还可以包括始发地与目的地之间的站数。例如,如果选择公交方式:则表示公交站数;如果选择地铁出行:则表示地铁站数。
具体的,用户等车时长信息可以包括但不限于以下至少一种:
公交等待时长、地铁等待时长、网约车等待时长、车辆通过交通灯时候的等待时长、道路拥堵等待时长。
在S220中,将T时期的特征信息输入预先训练的出行方式推荐模型,得到出行方式推荐模型从M种出行方式中推荐的目标出行方式,M为正整数。
具体地,出行方式推荐模型可以是softmax多分类模型。
在一些实施例中,可以采用用户在出行服务应用上点击出行方式并利用该出行方式导航作为出行方式分类标签,每一种出行方式的点击导航作为该类的标签,因此,M可以等于6,其中,1表示打车、2表示驾车、3表示公交地铁、4表示步行、5表示骑行,其余在出行服务应用内注册/活跃的用户或者点击出行方式但并没有使用该方式导航的用户记为0。出行方式分类标签可以记为Y,Y=0,1,2,3,4,5。
在一些实施例中,目标出行方式为M种出行方式中概率得分大于第一阈值的出行方式。
具体的,第一阈值可以在出行方式推荐模型的训练过程中确定,或者,第一阈值可以根据需求设置。例如,第一阈值为0.5。
在一些实施例中,M种出行方式的概率得分为根据T时期的特征信息计算得到的。
在一些实施例中,M种出行方式的概率得分通过以下公式2计算得到:
Figure BDA0002961758620000131
其中,W表示出行方式推荐模型,YT+1表示T+1时期的出行方式,P(YT+1=i|XT)表示预测的T+1时期的出行方式i的概率得分,XT表示T时期的特征信息,
Figure BDA0002961758620000132
U1,T表示T时期的用户个人特征信息,U2,T表示T时期的用户出行特征信息,IT表示T时期始发地与目的地之间的路况特征信息,
Figure BDA0002961758620000133
表示IT中的每个特征与U2,T中的每个特征进行交叉,再与U1,T中的特征进行连接。
需要说明的是,模型训练的目标是得到更好的模型参数,以提高出行分类的效果。
在S230中,获取目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值和距离约束值,N为正整数。
具体的,目标出行方式下对应于N条出行路径的时间向量为Tt,t表示目标出行方式,且Tt=[tt1 tt2 … ttN];目标出行方式下对应于N条出行路径的限速向量为Kt,t表示目标出行方式,且Kt=[kt1 kt2 … ktN];目标出行方式下对应于N条出行路径的时间上限值为tc,目标出行方式下对应于N条出行路径的距离约束值为d。
具体的,不同的出行方式下的出行路径数量可以相同,也可以不同,本申请实施例对此并不限定。也即,不同的出行方式下,N的取值可以相同,也可以不同。
在一些实施例中,时间向量可以通过“出行服务应用”后台数据库得到的始发地与目的地之间的路段历史行程时间数据平均得到;限速向量可以通过“出行服务应用”后台数据库记录的始发地与目的地之间的路段历史最大限速得到;时间上限值由用户自行设定;距离约束值由“出行服务应用”后台计算的“目的地”与“始发地”的直线距离得到。
在S240中,将目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值输入目标出行方式下预先训练的出行路径推荐模型,得到目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量。
具体的,每种出行方式存在其对应的出行路径推荐模型,也即,M种出行方式分别对应M个出行路径推荐模型。
在一些实施例中,M种出行方式下的出行路径推荐模型是采用分布式并行方式进行训练的。能极大提高出行路径推荐模型的训练效率。
在S250中,根据目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量,计算得到目标出行方式下对应于N条出行路径的路径距离向量。
具体的,根据目标出行方式下对应于N条出行路径的时间向量和速度估计向量的转置,计算得到第一向量;以及根据目标出行方式下对应于N条出行路径的截距估计向量和第一向量,计算得到目标出行方式下对应于N条出行路径的路径距离向量。
在一些实施例中,将目标出行方式下对应于N条出行路径的时间向量Tt、速度估计向量Vt和截距估计向量Ct代入以下公式3,计算得到目标出行方式下对应于N条出行路径的路径距离向量Dt
Dt=Vt T·Tt+Ct 公式3
其中,Tt=[tt1 tt2 … ttN],Vt=[vt1 vt2 … vtN],Ct=[ct1 ct2 … ctN],Dt=[dt1dt2 … dtN];以及t表示目标出行方式,Vt T表示Vt的转置。
在S260中,根据目标出行方式下对应于N条出行路径的路径距离向量计算的距离最小方差,确定目标出行方式下的目标出行路径。
在一些实施例中,目标出行路径为N条出行路径中距离最短的路径。
在一些实施例中,可以将目标出行方式和目标出行路径通过出行服务应用推送给用户。此外,出行服务应用也可以是基于目标出行方式和目标出行路径自动进入导航模式。
因此,在本申请实施例中,能够根据用户个人特征信息、用户出行特征信息和始发地与目的地之间的路况特征信息,从M种出行方式中推荐的目标出行方式,以及基于目标出行方式下的时间向量、限速向量、时间上限值和距离约束值,结合距离最小方差的最优化算法计算目标出行方式下的目标出行路径,出行服务应用可以根据推荐得到的目标出行方式和目标出行路径进入导航模式,解决了地图类应用中需要人工搜索出行方式和出行路线的缺点,并且考虑了用户出行偏好和时间向量、限速向量、时间上限值和距离约束值等实际出行情况,能够更贴近现实生活。
进一步地,在目标出行路径选择上采用距离最小方差的最优化算法,充分考虑时间约束、限速约束、距离约束的实际条件,能够更加贴近现实出行环境和出行方案。
图5示出了根据本申请的一个实施例的出行推荐模型的训练方法300的示意性流程图,该出行推荐模型的训练方法300可以由具有计算处理能力的设备来执行,例如,上述图1中的终端110或服务器120。具体的,出行推荐模型可以包括上述出行方式推荐模型和出行路径推荐模型。参照图5所示,该出行推荐模型的训练方法300至少可以包括S310至S320,详细介绍如下:
在S310中,获取出行方式训练样本集和M个出行路径训练样本集;
其中,出行方式训练样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;M个出行路径训练样本集分别对应M种出行方式,M个出行路径训练样本集中的每个出行路径训练样本集包括对应的出行方式下对应于N条出行路径的时间向量、限速向量、距离向量、时间上限值、距离约束值,M和N均为正整数。
出行方式训练样本集中训练样本的数量可以根据需求设置。例如,若出行方式推荐模型在训练时需要训练40次,每次利用5000个训练样本进行训练,则出行方式训练样本集中可以包括5000个训练样本,每次模型训练时利用这5000个训练样本进行训练。
应理解,T-1时期的特征信息(训练样本)的具体描述可以参考上述关于T时期的特征信息(预测样本)的相关描述,为了简洁,在此不再赘述。
一个“时期”可以是指一分钟、k1分钟、半小时、一小时、k2小时、一天、k3天、一周…等周期时间,k1、k2、k3均为正整数。
在一些实施例中,T-1时期的特征信息是由T-1时期始发地与目的地之间的路况特征信息中的每个特征与T-1时期的用户出行特征信息中的每个特征进行交叉,再与T-1时期的用户个人特征信息中的特征进行连接之后得到的。
在一些实施例中,T-1时期的特征信息根据以下公式4确定:
Figure BDA0002961758620000161
其中,XT-1表示T-1时期的特征信息,U1,T-1表示T-1时期的用户个人特征信息,U2,T-1表示T-1时期的用户出行特征信息,IT-1表示T-1时期始发地与目的地之间的路况特征信息,
Figure BDA0002961758620000162
表示IT-1中的每个特征与U2,T-1中的每个特征进行交叉,再与U1,T-1中的特征进行连接。
具体地,出行方式推荐模型可以是softmax多分类模型。
在一些实施例中,可以采用用户在出行服务应用上点击出行方式并利用该出行方式导航作为出行方式分类标签,每一种出行方式的点击导航作为该类的标签,因此,M可以等于6,其中,1表示打车、2表示驾车、3表示公交地铁、4表示步行、5表示骑行,其余在出行服务应用内注册/活跃的用户或者点击出行方式但并没有使用该方式导航的用户记为0。出行方式分类标签可以记为Y,Y=0,1,2,3,4,5。
M个出行路径训练样本集中的每个出行路径训练样本集中所包括的训练样本的数量可以根据需求设置。不同的出行路径训练样本集中所包括的训练样本的数量可以相同,也可以不同,本申请对此并不限定。
具体的,第i种出行方式下对应于N条出行路径的时间向量为Ti,且Ti=[ti1 ti2 …tiN];第i种出行方式下对应于N条出行路径的限速向量为Ki,且Ki=[ki1 ki2 … kiN];Di表示第i种出行方式下对应于N条出行路径的距离向量为Di,且Di=[di1 di2 … diN];第i种出行方式下对应于N条出行路径的时间上限值为tc,第i种出行方式下对应于N条出行路径的距离约束值为d。
具体的,不同的出行方式下的出行路径数量可以相同,也可以不同,本申请实施例对此并不限定。也即,不同的出行方式下,N的取值可以相同,也可以不同。
在一些实施例中,时间向量可以通过“出行服务应用”后台数据库得到的始发地与目的地之间的路段历史行程时间数据平均得到;限速向量可以通过“出行服务应用”后台数据库记录的始发地与目的地之间的路段历史最大限速得到;时间上限值由用户自行设定;距离约束值由“出行服务应用”后台计算的“目的地”与“始发地”的直线距离得到。
在S320中,根据出行方式训练样本集训练出行方式推荐模型,以及根据M个出行路径训练样本集分别训练M种出行方式下的出行路径推荐模型。
具体地,出行方式推荐模型即为上述实施例中所述的预先训练的出行方式推荐模型,出行路径推荐模型即为上述实施例中所述的预先训练的出行路径推荐模型。存在M种出行方式,也即,存在M个出行路径推荐模型。
在一些实施例中,可以根据出行方式训练样本集中包括的T-1时期的特征信息计算得到T时期的M种出行方式的概率得分,以及采用梯度下降的方式训练所述出行方式推荐模型。
在一些实施例中,可以根据以下公式5计算得到T时期的M种出行方式的概率得分,以及采用梯度下降的方式训练出行方式推荐模型:
Figure BDA0002961758620000171
其中,W表示出行方式推荐模型,YT表示T时期的出行方式,P(YT=i|XT-1)表示预测的T时期的出行方式i的概率得分,XT-1表示T-1时期的特征信息,
Figure BDA0002961758620000172
U1,T-1表示T-1时期的用户个人特征信息,U2,T-1表示T-1时期的用户出行特征信息,IT-1表示T-1时期的始发地与目的地之间的路况特征信息,
Figure BDA0002961758620000173
表示IT-1中的每个特征与U2,T-1中的每个特征进行交叉,再与U1,T-1中的特征进行连接。
在一些实施例中,可以对训练好的出行方式推荐模型进行测试。
具体的,获取出行方式测试样本集,其中,出行方式测试样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;以及根据上述公式5计算得到T时期的M种出行方式的概率得分,以及根据查全率、查准率、曲线下方的面积(AreaUnder Curve,AUC)中的至少一种测试出行方式推荐模型。
例如,使用T时期的M种出行方式的标签YT与T-1时期的特征信息XT-1构成T时期的样本,按一定比例随机切分为出行方式训练样本
Figure BDA0002961758620000174
(比例为а)和出行方式测试样本
Figure BDA0002961758620000181
(比例为1-а),例如,按照通用经验将样本随机切分为
Figure BDA0002961758620000182
(即,按8:2的比例随机切分出行方式训练样本和出行方式测试样本)。
具体的,在出行方式推荐模型测试不达标的情况下,根据出行方式训练样本集重新训练出行方式推荐模型。
在一些实施例中,可以根据第i种出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值,确定第i种出行方式下对应于N条出行路径的速度估计向量和截距估计向量;以及根据第i种出行方式下对应于N条出行路径的速度估计向量和截距估计向量,以及第i种出行方式下对应于N条出行路径的时间向量和距离向量,使用线性回归和最小二乘法训练第i种出行方式下的出行路径推荐模型。
在一些实施例中,将第i种出行方式下对应于N条出行路径的时间向量、限速向量、距离向量、时间上限值、距离约束值代入以下公式6,使用线性回归和最小二乘法训练第i种出行方式下的出行路径推荐模型:
Figure BDA0002961758620000183
其中,i表示第i种出行方式,j表示第i种出行方式下的第j条出行路径,j≤N,dij表示第i种出行方式下第j条出行路径的目的地与始发地的实际距离,tij表示第i种出行方式下第j条出行路径的时间,vij表示第i种出行方式下第j条出行路径的平均速度,kij表示第i种出行方式下第j条出行路径的速度上限,cij表示第i种出行方式下第j条出行路径的截距,d表示距离约束值,即d为始发地与目的地的直线距离,tc表示时间上限值,即tc为始发地与目的地的时间上限值,Ti表示第i种出行方式下对应于N条出行路径的时间向量,Ti=[ti1ti2 … tiN],Ki表示第i种出行方式下对应于N条出行路径的限速向量,Ki=[ki1 ki2 …kiN],Di表示第i种出行方式下对应于N条出行路径的距离向量,Di=[di1 di2 … diN],Vi表示第i种出行方式下对应于N条出行路径的速度估计向量,Vi=[vi1 vi2 … viN],Ci表示第i种出行方式下对应于N条出行路径的截距估计向量,Ci=[ci1 ci2 … ciN]。
在一些实施例中,M种出行方式下的出行路径推荐模型是采用分布式并行方式进行训练的。也即,在对用户出行方式进行softmax分类后,采用并行式计算方法对每种出行方式下的最优路线方案进行分组并行式计算,能极大提高计算效率。
在一些实施例中,出行推荐可以分为两个阶段:出行方式推荐阶段、出行路径推荐阶段,如图6所示。
出行方式推荐阶段:先使用T时期的M种出行方式的标签和T-1时期的特征信息
Figure BDA0002961758620000191
构建出行方式训练样本集,采用softmax多分类(M分类)算法训练出行方式推荐模型W,并代入T时期的特征信息
Figure BDA0002961758620000192
构建的出行方式预测样本集,预测T+1时期用户偏好的出行方式并分类。例如,如图6所示,M=6,其中,1表示打车、2表示驾车、3表示公交地铁、4表示步行、5表示骑行,其余在出行服务应用内注册/活跃的用户或者点击出行方式但并没有使用该方式导航的用户记为0。
出行路径推荐阶段:根据用户出行方式进行分类,并对每一类的用户出行方式及对应的时间向量、限速向量、距离向量、时间上限值、距离约束值分别存放在不同集群(即出行路径训练样本集),对每个集群的数据分别进行并行式最优化算法模型(即出行路径推荐模型)训练,得到各种出行方式下的最优路线j。最后形成用户偏好出行方式下的最优路线方案(i,j)推荐给用户。
在一些实施例中,出行方式推荐可以包括数据输入阶段、多分类标签构建阶段、样本处理阶段、模型训练及测试阶段、模型预测阶段、出行方式推荐阶段等6个阶段,具体如图7中的S11-S16所示。
S11.数据输入阶段:数据特征包括用户(User)特征和项目(Item)特征。其中,User特征包括:用户基本信息(性别、年龄、收入、工作性质等)、用户资产信息(是否有车、车辆品牌、车辆型号、车牌归属地、是否有房等)、用户出行服务APP/小程序中的点击情况信息(用户点击出行服务APP/小程序及其内部各个模块的点击次数、取消次数、退出次数等)、在出行服务APP/小程序中的活跃情况(活跃次数、活跃天数、活跃时长、最近一次活跃与注册时长等)、出行服务APP/小程序中的模块消费情况(模块消费次数、模块消费天数、模块消费金额、模块消费占总消费的比例等)、用户出行信息(每种出行方式开始导航的次数、退出次数、经常导航的目的地、目的地与用户当前位置/出发地距离信息、用户常用出行方式的点击/切换次数等)、用户车辆油耗信息、用户出行成本信息(加油费、公交地铁费、打车费、骑行费、平均步行时长)。Item特征包括:道路交通状况信息(出行服务APP/小程序上显示的道路拥堵情况(严重拥堵、拥堵、行车缓慢、行车畅通)、交通信号灯信息(道路交通灯个数、交通灯等待时长)、道路信息、目的地与始发地站数(例如,如果选择公交方式:则表示公交站数;如果选择地铁出行:则表示地铁站数)、车辆等待时长(公交等待时长、地铁等待时长、网约车等待时长、车辆通过交通灯时候的等待时长、道路拥堵等待时长…)、路段限速、路段平均耗时等。
S12.多分类标签构建阶段:输入用户在出行服务APP/小程序的点击出行方式的行为数据,例如采用用户点击出行方式并利用该出行方式导航作为用户分类标签,每一种出行方式的点击导航作为该类的标签,因此,共有6类,其中,1表示打车、2表示驾车、3表示公交地铁、4表示步行、5表示骑行,其余在出行服务APP/小程序的内注册/活跃的用户或者点击出行方式但并没有使用该方式导航的用户记为0。多分类标签记为Y,Y=0,1,2,3,4,5。
S13.样本处理阶段:在样本处理阶段,先将User特征划分成用户个人特征信息和用户出行特征信息,其中,用户个人特征信息包括:用户基本信息、用户资产信息(排除是否有车特征(1-有车,0-无车)),记为U1;用户出行特征信息包括:用户是否有车(1-有车,0-无车)、用户在出行服务应用中的点击信息、用户在出行服务应用中的活跃信息、用户在出行服务应用中的出行消费信息、用户在出行服务应用中的出行信息、用户车辆油耗信息、用户出行成本信息、用户等车时长信息,记为U2。始发地与目的地之间的路况特征信息包括:交通状况信息、交通灯信息、道路信息、车辆等待时长、道路限速信息、路段平均耗时信息,记为I。将始发地与目的地之间的路况特征信息中的每个特征与用户出行特征信息中的每个特征进行交叉,记为:
Figure BDA0002961758620000201
再与用户个人特征信息按用户标识(UserId)进行连接,记为:
Figure BDA0002961758620000202
因此,这样处理特征能够将始发地与目的地之间的路况特征信息和用户出行特征信息进行有效关联,特征丰富度得到极大提高,进而能有效提升分类模型效果。
需要说明的是,出行服务应用也即出行服务APP/小程序。始发地与目的地可以是由用户确定的。
使用T时期的用户多分类标签YT(即6种出行方式的标签)与T-1时期特征信息
Figure BDA0002961758620000211
构成T时期的样本,按一定比例随机切分为出行方式训练样本
Figure BDA0002961758620000212
(比例为а)和出行方式测试样本
Figure BDA0002961758620000213
(比例为1-а),例如,按照通用经验将样本随机切分为
Figure BDA0002961758620000214
(即,按8:2的比例随机切分出行方式训练样本和出行方式测试样本)。同理,对T时期的用户个人特征信息U1,T、用户出行特征信息U2,T和始发地与目的地之间的路况特征信息IT进行处理,得到出行方式预测样本
Figure BDA0002961758620000215
S14.模型训练及测试阶段:输入出行方式训练样本
Figure BDA0002961758620000216
代入softmax多分类模型(M=6,即6种出行方式),如公式7,采用梯度下降法训练出出行方式推荐模型W。在模型测试阶段,输入出行方式测试样本
Figure BDA0002961758620000217
和出行方式推荐模型W,计算得到用户在每一出行分类的概率,并计算出行方式测试样本下的查全率、查准率、AUC等评估指标,当出行方式推荐模型W达标后,保存出行方式推荐模型W,否则重复S13~S14,直到出行方式推荐模型W达标后,再保存最终出行方式推荐模型W,如图8所示。
Figure BDA0002961758620000218
其中,W表示出行方式推荐模型,YT表示T时期的出行方式,P(YT=i|XT-1)表示预测的T时期的出行方式i的概率得分,XT-1表示T-1时期的特征信息,
Figure BDA0002961758620000219
U1,T-1表示T-1时期的用户个人特征信息,U2,T-1表示T-1时期的用户出行特征信息,IT-1表示T-1时期的始发地与目的地之间的路况特征信息,
Figure BDA00029617586200002110
表示IT-1中的每个特征与U2,T-1中的每个特征进行交叉,再与U1,T-1中的特征进行连接。
S15.出行方式预测阶段:输入S14中得到的出行方式推荐模型W,出行方式预测样本
Figure BDA00029617586200002111
代入模型softmax多分类模型(M=6,即6种出行方式),如公式8,计算用户在每一类出行方式下的概率得分,给定0.5的阈值,当Pi≥0.5,归类为第i类,否则归类为0类,如图9所示。
Figure BDA00029617586200002112
其中,W表示出行方式推荐模型,YT+1表示T+1时期的出行方式,P(YT+1=i|XT)表示预测的T+1时期的出行方式i的概率得分,XT表示T时期的特征信息,
Figure BDA00029617586200002113
U1,T表示T时期的用户个人特征信息,U2,T表示T时期的用户出行特征信息,IT表示T时期始发地与目的地之间的路况特征信息,
Figure BDA00029617586200002114
表示IT中的每个特征与U2,T中的每个特征进行交叉,再与U1,T中的特征进行连接。
S16.出行方式推荐阶段:将第i类出行方式推荐至出行路径推荐阶段。
在一些实施例中,出行路径推荐可以包括用户分类阶段、数据输入阶段、参数拟合阶段、路线选择阶段、出行路径推荐阶段,具体如图10中的S21-S25所示。
S21.用户分类阶段:在这一阶段,将上述出行方式推荐阶段中得到的出行方式对用户进行分类(分为0、1、2、3、4、5类),并将每一类出行方式的用户存放在独立计算集群中,因此,预测为出行方式1的用户存放在集群1中,预测为出行方式2的用户存放在集群2中,如此类推,预测为出行方式5的用户存放在集群5中,其余存放在集群0中。第i种出行方式下第j种出行路线(i=0,1,2,3,4,5;j=1,2,3)。也即,第i类(i=0,1,2,3,4,5)出行方式对应3条出行路径。
S22.数据输入阶段:对第i类(i=0,1,2,3,4,5)出行方式的用户,输入该出行方式下的训练样本:时间向量Ttrain i=[ti1 ti2 ti3](i=0,1,2,3,4,5),限速向量Ki=[ki1 ki2ki3](i=0,1,2,3,4,5)(其中,当出行方式为步行或骑行时,其限速为该出行方式下路段的平均速度),距离向量Di=[di1 di2 di3](i=0,1,2,3,4,5),时间上限tc,距离约束d。其中,tij表示第i种出行方式下第j种出行路线的时间(i=1,2,3,4,5;j=1,2,3),该数据通过“出行服务应用”后台数据库得到的该路段历史行程时间数据平均得到;kij表示第i种出行方式下第j种出行路线的最大限速(i=1,2,3,4,5;j=1,2,3),该数据通过“出行服务应用”后台数据库记录的该路段历史最大限速得到;dij表示第i种出行方式下第j种出行路线目的地与始发地的实际距离,该数据通过“出行服务应用”后台数据库记录的该路段距离得到;dij≥d,是因为d是两点之间的直线距离,因此该两点之间任意一段路都大于等于直线距离;dij=f(tij)表示距离dij是时间tij的函数;时间上限tc由用户自行设定;距离约束d由“出行服务应用”后台计算的“目的地”与“始发地”的直线距离得到。每个集群输入对应的时间向量、限速向量和距离向量。
S23.参数拟合阶段:对第i种出行方式,将S22输入的参数Ttrain i=[ti1 ti2 ti3](i=0,1,2,3,4,5)、Ki=[ki1 ki2 ki3](i=0,1,2,3,4,5)、tc、d和Di=[di1 di2 di3](i=0,1,2,3,4,5)代入公式9,以及使用线性回归及最小二乘法,得到方差最小下的第i种出行方式下的参数估计向量:速度估计向量Vi=[vi1 vi2 vi3](i=0,1,2,3,4,5)和截距估计向量Ci=[ci1 ci2 ci3](i=0,1,2,3,4,5)。
Figure BDA0002961758620000231
其中,i表示第i种出行方式,j表示第i种出行方式下的第j条出行路径,j≤N,dij表示第i种出行方式下第j条出行路径的目的地与始发地的实际距离,tij表示第i种出行方式下第j条出行路径的时间,vij表示第i种出行方式下第j条出行路径的平均速度,kij表示第i种出行方式下第j条出行路径的速度上限,cij表示第i种出行方式下第j条出行路径的截距,d表示距离约束值,即d为始发地与目的地的直线距离,tc表示时间上限值,即tc为始发地与目的地的时间上限值。
S24.路线选择阶段:将S23得到的第i中出行方式下,各路线方案的速度估计向量Vi=[vi1 vi2 vi3](i=0,1,2,3,4,5)和截距估计向量Ci=[ci1 ci2 ci3](i=0,1,2,3,4,5),以及预测样本Ti=[ti1 ti2 ti3](i=0,1,2,3,4,5)代入距离公式10中,拟合距离向量Di,并用于计算最小方差,得到第i中出行方式下的路线距离向量Di=[di1 di2 di3](i=0,1,2,3,4,5)。从而,在第i中出行方式中,选择距离最短的作为最优路线方案,例如,第2种出行方式中,第3条路线方案距离最短,则第2种出行方式下的最优出行路线方案为(2,3)。
Di=Vi T·Ti+Ci 公式10
其中,Ti=[ti1 ti2 ti3](i=0,1,2,3,4,5),Vi=[vi1 vi2 vi3](i=0,1,2,3,4,5),Ci=[ci1 ci2 ci3](i=0,1,2,3,4,5),Di=[di1 di2 di3](i=0,1,2,3,4,5);以及i表示第i种出行方式,Vi T表示Vi的转置。
S25.出行路径推荐阶段:将S24选出的最优出行方式及最优出行路径(i,j)直接输入出行服务应用的导航模式,并推送给用户。
因此,在本申请实施例中,能够根据用户个人特征信息、用户出行特征信息和始发地与目的地之间的路况特征信息,从M种出行方式中推荐的目标出行方式,以及基于目标出行方式下的时间向量、限速向量、时间上限值和距离约束值,结合距离最小方差的最优化算法计算目标出行方式下的目标出行路径,出行服务应用可以根据推荐得到的目标出行方式和目标出行路径进入导航模式,解决了地图类应用中需要人工搜索出行方式和出行路线的缺点,并且考虑了用户出行偏好和时间向量、限速向量、时间上限值和距离约束值等实际出行情况,能够更贴近现实生活。
本申请实施例根据用户出行偏好标签,用户收入情况、资产情况、出行服务APP/小程序中的点击情况、活跃情况、模块付费情况、导航路线信息、始发地和目的地的距离、道路交通状况信息、费用信息、油耗信息、耗时信息等数据特征构成的样本特征进行模型训练和预测,充分考虑用户对出行方式和出行路线方案的行为偏好。
进一步地,在目标出行路径选择上采用距离最小方差的最优化算法,充分考虑时间约束、限速约束、距离约束的实际条件,能够更加贴近现实出行环境和出行方案。
本申请实施例在对用户出行方式进行softmax分类后,采用并行式计算方法对每种出行方式下的最优路线方案进行分组并行式计算,能极大提高计算效率。
此外,本申请实施例在计算最优路线方案的时候,采用最小二乘法拟合参数向量,并直接代入时间向量计算出距离向量,在带约束条件小的最小方差的最小二乘法求解,充分考虑了解的局部最优化,从而直接拟合距离向量能够进一步提高运算效果。
上文结合图4至图10,详细描述了本申请的方法实施例,下文结合图11至图12,详细描述本申请的装置实施例,应理解,装置实施例与方法实施例相互对应,类似的描述可以参照方法实施例。
图11示意性示出了根据本申请的一实施例的出行推荐装置的框图。该出行推荐装置可以采用软件单元或硬件单元,或者是二者的结合成为计算机设备的一部分。如图11所示,本申请实施例提供的出行推荐装置400具体可以包括:
获取模块410,用于获取T时期的特征信息,其中,T时期的特征信息是根据T时期的用户个人特征信息、用户出行特征信息和始发地与目的地之间的路况特征信息确定的;
处理模块420,用于将T时期的特征信息输入预先训练的出行方式推荐模型,得到出行方式推荐模型从M种出行方式中推荐的目标出行方式,M为正整数;
获取模块410,还用于获取目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值和距离约束值,N为正整数;
处理模块420,还用于将目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值输入目标出行方式下预先训练的出行路径推荐模型,得到目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量;
计算模块430,用于根据目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量,计算得到目标出行方式下对应于N条出行路径的路径距离向量;
确定模块440,用于根据目标出行方式下对应于N条出行路径的路径距离向量计算的距离最小方差,确定目标出行方式下的目标出行路径。
在一个实施例中,目标出行方式为M种出行方式中概率得分大于第一阈值的出行方式。
在一个实施例中,M种出行方式的概率得分为根据T时期的特征信息计算得到的。
在一个实施例中,计算模块430具体用于:
根据目标出行方式下对应于N条出行路径的时间向量和速度估计向量的转置,计算得到第一向量;以及
根据目标出行方式下对应于N条出行路径的截距估计向量和第一向量,计算得到目标出行方式下对应于N条出行路径的路径距离向量。
在一个实施例中,T时期的特征信息是由T时期始发地与目的地之间的路况特征信息中的每个特征与T时期的用户出行特征信息中的每个特征进行交叉,再与T时期的用户个人特征信息中的特征进行连接之后得到的。
在一个实施例中,出行推荐装置还包括:推送模块,用于将目标出行方式和目标出行路径通过出行服务应用推送给用户。
在一个实施例中,用户个人信息特征包括用户基本信息、用户资产信息中的至少一种;
用户出行特征信息包括用户是否有车、用户在出行服务应用中的点击信息、用户在出行服务应用中的活跃信息、用户在出行服务应用中的出行消费信息、用户在出行服务应用中的出行信息、用户车辆油耗信息、用户出行成本信息、用户等车时长信息中的至少一种;
路况特征信息包括交通状况信息、交通灯信息、道路信息、车辆等待时长、道路限速信息、路段平均耗时信息中的至少一种。
本申请实施例提供的出行推荐装置中的各个模块的具体实现可以参照上述出行推荐方法中的内容,在此不再赘述。
图12示意性示出了根据本申请的一实施例的出行推荐模型的训练装置的框图。该出行推荐模型的训练装置可以采用软件单元或硬件单元,或者是二者的结合成为计算机设备的一部分。如图12所示,本申请实施例提供的出行推荐模型的训练装置500具体可以包括:
获取模块510,用于获取出行方式训练样本集和M个出行路径训练样本集;
其中,出行方式训练样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;M个出行路径训练样本集分别对应M种出行方式,M个出行路径训练样本集中的每个出行路径训练样本集包括对应的出行方式下对应于N条出行路径的时间向量、限速向量、距离向量、时间上限值、距离约束值,M和N均为正整数;
训练模块520,用于根据出行方式训练样本集训练出行方式推荐模型,以及根据M个出行路径训练样本集分别训练M种出行方式下的出行路径推荐模型。
在一个实施例中,训练模块520具体用于:
根据出行方式训练样本集中包括的T-1时期的特征信息计算得到T时期的M种出行方式的概率得分,以及采用梯度下降的方式训练出行方式推荐模型。
在一个实施例中,出行推荐模型的训练装置还包括:测试模块,
获取模块510,还用于获取出行方式测试样本集,其中,出行方式测试样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;
测试模块,用于根据出行方式测试样本集中包括的T-1时期的特征信息计算得到T时期的M种出行方式的概率得分,以及根据查全率、查准率、AUC中的至少一种测试出行方式推荐模型。
在一个实施例中,训练模块520还用于在出行方式推荐模型测试不达标的情况下,根据出行方式训练样本集重新训练出行方式推荐模型。
在一个实施例中,训练模块520具体用于:
根据第i种出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值,确定第i种出行方式下对应于N条出行路径的速度估计向量和截距估计向量;
根据第i种出行方式下对应于N条出行路径的速度估计向量和截距估计向量,以及第i种出行方式下对应于N条出行路径的时间向量和距离向量,使用线性回归和最小二乘法训练第i种出行方式下的出行路径推荐模型。
在一个实施例中,M种出行方式下的出行路径推荐模型是采用分布式并行方式进行训练的。
本申请实施例提供的出行推荐模型的训练装置中的各个模块的具体实现可以参照上述出行推荐模型的训练方法中的内容,在此不再赘述。
上述出行推荐装置或出行推荐模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各个模块可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行上述各个模块对于的操作。
图13示出了实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是,图13示出的电子设备的计算机系统600仅是一个示例,不应该对本申请实施例的功能和使用范围带来任何限制。
如图13所示,计算机系统600包括中央处理单元(Central Processing Unit,CPU)601,其可以根据存储在只读存储器(Read-Only Memory,ROM)602中的程序或者从存储部分608加载到随机访问存储器(Random Access Memory,RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(Input/Output,I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如局域网(Local AreaNetwork,LAN)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读取的计算机程序根据需要被安装入存储部分608。
特别地,根据本申请实施例,上文流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行上述流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理器(CPU)601执行时,执行本申请的装置中限定的各种功能。
在一个实施例中,还提供了一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,处理器配置为经由执行可执行指令来执行上述各方法实施例中的步骤。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所述的计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或者器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或者多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁盘存储器件、或者上述任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或者存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或者上述的任何合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何恰当的介质传输,包括但不限于:无线、电线、光缆、射频等等,或者上述的任意合适的组合。
本实施例仅用于说明本申请,本实施例的软硬件平台架构、开发环境、开发语言、消息获取源头等的选取都是可以变化的,在本申请技术方案的基础上,凡根据本申请原理对某个部分进行的改进和等同变换,均不应排除在本申请的保护范围之外。
需要说明的是,在本申请实施例和所附权利要求书中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请实施例。
所属领域的技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请提供的几个实施例中,应该理解到,所揭露的电子设备、装置和方法,可以通过其它的方式实现。
例如,以上所描述的装置实施例中单元或模块或组件的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或模块或组件可以结合或者可以集成到另一个系统,或一些单元或模块或组件可以忽略,或不执行。
又例如,上述作为分离/显示部件说明的单元/模块/组件可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元/模块/组件来实现本申请实施例的目的。
最后,需要说明的是,上文中显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
以上内容,仅为本申请实施例的具体实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。因此,本申请实施例的保护范围应以权利要求的保护范围为准。

Claims (15)

1.一种出行推荐方法,其特征在于,包括:
获取T时期的特征信息,其中,所述T时期的特征信息是根据T时期的用户个人特征信息、用户出行特征信息和始发地与目的地之间的路况特征信息确定的;
将所述T时期的特征信息输入预先训练的出行方式推荐模型,得到所述出行方式推荐模型从M种出行方式中推荐的目标出行方式,M为正整数;
获取所述目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值和距离约束值,N为正整数;
将所述目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值输入所述目标出行方式下预先训练的出行路径推荐模型,得到所述目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量;
根据所述目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量,计算得到所述目标出行方式下对应于N条出行路径的路径距离向量;
根据所述目标出行方式下对应于N条出行路径的路径距离向量计算的距离最小方差,确定所述目标出行方式下的目标出行路径。
2.根据权利要求1所述的方法,其特征在于,所述目标出行方式为所述M种出行方式中概率得分大于第一阈值的出行方式,所述M种出行方式的概率得分为根据所述T时期的特征信息计算得到的。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量,计算得到所述目标出行方式下对应于N条出行路径的路径距离向量,包括:
根据所述目标出行方式下对应于N条出行路径的时间向量和速度估计向量的转置,计算得到第一向量;以及
根据所述目标出行方式下对应于N条出行路径的截距估计向量和所述第一向量,计算得到所述目标出行方式下对应于N条出行路径的路径距离向量。
4.根据权利要求1所述的方法,其特征在于,所述T时期的特征信息是由所述T时期始发地与目的地之间的路况特征信息中的每个特征与所述T时期的用户出行特征信息中的每个特征进行交叉,再与所述T时期的用户个人特征信息中的特征进行连接之后得到的。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
将所述目标出行方式和所述目标出行路径通过出行服务应用推送给用户。
6.根据权利要求1至4中任一项所述的方法,其特征在于,
所述用户个人信息特征包括用户基本信息、用户资产信息中的至少一种;
所述用户出行特征信息包括用户是否有车、用户在出行服务应用中的点击信息、用户在出行服务应用中的活跃信息、用户在出行服务应用中的出行消费信息、用户在出行服务应用中的出行信息、用户车辆油耗信息、用户出行成本信息、用户等车时长信息中的至少一种;
所述路况特征信息包括交通状况信息、交通灯信息、道路信息、车辆等待时长、道路限速信息、路段平均耗时信息中的至少一种。
7.一种出行推荐模型的训练方法,其特征在于,包括:
获取出行方式训练样本集和M个出行路径训练样本集;
其中,所述出行方式训练样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,所述T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;所述M个出行路径训练样本集分别对应所述M种出行方式,所述M个出行路径训练样本集中的每个出行路径训练样本集包括对应的出行方式下对应于N条出行路径的时间向量、限速向量、距离向量、时间上限值、距离约束值,M和N均为正整数;
根据所述出行方式训练样本集训练出行方式推荐模型,以及根据所述M个出行路径训练样本集分别训练所述M种出行方式下的出行路径推荐模型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述出行方式训练样本集训练出行方式推荐模型,包括:
根据所述出行方式训练样本集中包括的所述T-1时期的特征信息计算得到T时期的M种出行方式的概率得分,以及采用梯度下降的方式训练所述出行方式推荐模型。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
获取出行方式测试样本集,其中,所述出行方式测试样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,所述T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;
根据所述出行方式测试样本集中包括的所述T-1时期的特征信息计算得到T时期的M种出行方式的概率得分,以及根据查全率、查准率、AUC中的至少一种测试所述出行方式推荐模型。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
在所述出行方式推荐模型测试不达标的情况下,根据所述出行方式训练样本集重新训练所述出行方式推荐模型。
11.根据权利要求7所述的方法,其特征在于,所述根据所述M个出行路径训练样本集分别训练所述M种出行方式下的出行路径推荐模型,包括:
根据第i种出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值,确定第i种出行方式下对应于N条出行路径的速度估计向量和截距估计向量;
根据第i种出行方式下对应于N条出行路径的速度估计向量和截距估计向量,以及第i种出行方式下对应于N条出行路径的时间向量和距离向量,使用线性回归和最小二乘法训练第i种出行方式下的出行路径推荐模型。
12.根据权利要求11所述的方法,其特征在于,所述M种出行方式下的出行路径推荐模型是采用分布式并行方式进行训练的。
13.一种出行推荐装置,其特征在于,包括:
获取模块,用于获取T时期的特征信息,其中,所述T时期的特征信息是根据T时期的用户个人特征信息、用户出行特征信息和始发地与目的地之间的路况特征信息确定的;
处理模块,用于将所述T时期的特征信息输入预先训练的出行方式推荐模型,得到所述出行方式推荐模型从M种出行方式中推荐的目标出行方式,M为正整数;
所述获取模块,还用于获取所述目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值和距离约束值,N为正整数;
所述处理模块,还用于将所述目标出行方式下对应于N条出行路径的时间向量、限速向量、时间上限值、距离约束值输入所述目标出行方式下预先训练的出行路径推荐模型,得到所述目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量;
计算模块,用于根据所述目标出行方式下对应于N条出行路径的速度估计向量和截距估计向量,计算得到所述目标出行方式下对应于N条出行路径的路径距离向量;
确定模块,用于根据所述目标出行方式下对应于N条出行路径的路径距离向量计算的距离最小方差,确定所述目标出行方式下的目标出行路径。
14.一种出行推荐模型的训练装置,其特征在于,包括:
获取模块,用于获取出行方式训练样本集和M个出行路径训练样本集;
其中,所述出行方式训练样本集包括T时期的M种出行方式的标签和T-1时期的特征信息,所述T-1时期的特征信息是根据T-1时期的用户个人信息特征、用户出行信息特征和始发地与目的地之间的路况特征确定的;所述M个出行路径训练样本集分别对应所述M种出行方式,所述M个出行路径训练样本集中的每个出行路径训练样本集包括对应的出行方式下对应于N条出行路径的时间向量、限速向量、距离向量、时间上限值、距离约束值,M和N均为正整数;
训练模块,用于根据所述出行方式训练样本集训练出行方式推荐模型,以及根据所述M个出行路径训练样本集分别训练所述M种出行方式下的出行路径推荐模型。
15.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至6中任一项所述的方法,或者,执行权利要求7至12中任一项所述的方法。
CN202110239861.5A 2021-03-04 2021-03-04 出行推荐方法、出行推荐模型的训练方法、装置 Active CN112884235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110239861.5A CN112884235B (zh) 2021-03-04 2021-03-04 出行推荐方法、出行推荐模型的训练方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110239861.5A CN112884235B (zh) 2021-03-04 2021-03-04 出行推荐方法、出行推荐模型的训练方法、装置

Publications (2)

Publication Number Publication Date
CN112884235A true CN112884235A (zh) 2021-06-01
CN112884235B CN112884235B (zh) 2022-02-22

Family

ID=76055424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110239861.5A Active CN112884235B (zh) 2021-03-04 2021-03-04 出行推荐方法、出行推荐模型的训练方法、装置

Country Status (1)

Country Link
CN (1) CN112884235B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536112A (zh) * 2021-06-11 2021-10-22 五邑大学 一种乘客接驳预测方法、装置及存储介质
CN113946757A (zh) * 2021-12-21 2022-01-18 深圳市活力天汇科技股份有限公司 一种识别用户出行目的的方法、装置及可读存储介质
CN114384823A (zh) * 2022-03-23 2022-04-22 智能网联汽车(山东)协同创新研究院有限公司 基于智能网联汽车的模拟道路仿真测试系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150046088A1 (en) * 2013-08-12 2015-02-12 Samsung Electronics Co., Ltd. Method and system for managing itinerary
US20150285643A1 (en) * 2014-04-03 2015-10-08 Palo Alto Research Center Incorporated Computer-Implemented System And Method For Social Routing
CN108072380A (zh) * 2016-11-14 2018-05-25 福特环球技术公司 用于选择出行方式的方法、装置及出行路径管理系统
CN108444486A (zh) * 2017-02-16 2018-08-24 高德信息技术有限公司 一种导航路线排序方法和装置
CN108716920A (zh) * 2018-01-24 2018-10-30 上海擎感智能科技有限公司 路径推荐方法与导航终端
CN109612488A (zh) * 2018-12-26 2019-04-12 东北大学 基于大数据微服务的混合出行方式路径规划系统及方法
CN109977322A (zh) * 2019-03-05 2019-07-05 百度在线网络技术(北京)有限公司 出行方式推荐方法、装置、计算机设备和可读存储介质
CN112129306A (zh) * 2020-09-24 2020-12-25 腾讯科技(深圳)有限公司 路线生成方法、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150046088A1 (en) * 2013-08-12 2015-02-12 Samsung Electronics Co., Ltd. Method and system for managing itinerary
US20150285643A1 (en) * 2014-04-03 2015-10-08 Palo Alto Research Center Incorporated Computer-Implemented System And Method For Social Routing
CN108072380A (zh) * 2016-11-14 2018-05-25 福特环球技术公司 用于选择出行方式的方法、装置及出行路径管理系统
CN108444486A (zh) * 2017-02-16 2018-08-24 高德信息技术有限公司 一种导航路线排序方法和装置
CN108716920A (zh) * 2018-01-24 2018-10-30 上海擎感智能科技有限公司 路径推荐方法与导航终端
CN109612488A (zh) * 2018-12-26 2019-04-12 东北大学 基于大数据微服务的混合出行方式路径规划系统及方法
CN109977322A (zh) * 2019-03-05 2019-07-05 百度在线网络技术(北京)有限公司 出行方式推荐方法、装置、计算机设备和可读存储介质
CN112129306A (zh) * 2020-09-24 2020-12-25 腾讯科技(深圳)有限公司 路线生成方法、装置、计算机设备和存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
LI, WEI等: "A Smart Path Recommendation Method for Metro Systems With Passenger Preferences", 《IEEE ACCESS》 *
TENEMAZA, MARITZOL等: "Improving Itinerary Recommendations for Tourists Through Metaheuristic Algorithms: An Optimization Proposal", 《IEEE ACCESS》 *
刘宇峰等: "基于结构方程模型的不同规模城市居民出行方式选择影响因素的关联性分析", 《长安大学学报(自然科学版)》 *
吴炜光: "多模式交通网络环境下典型多方式组合出行效用分析", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》 *
杨励雅等: "考虑偏好差异与备选方案相关性的居民出行方式选择模型", 《北京大学学报(自然科学版)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536112A (zh) * 2021-06-11 2021-10-22 五邑大学 一种乘客接驳预测方法、装置及存储介质
CN113946757A (zh) * 2021-12-21 2022-01-18 深圳市活力天汇科技股份有限公司 一种识别用户出行目的的方法、装置及可读存储介质
CN113946757B (zh) * 2021-12-21 2022-04-12 深圳市活力天汇科技股份有限公司 一种识别用户出行目的的方法、装置及可读存储介质
CN114384823A (zh) * 2022-03-23 2022-04-22 智能网联汽车(山东)协同创新研究院有限公司 基于智能网联汽车的模拟道路仿真测试系统

Also Published As

Publication number Publication date
CN112884235B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
CN112884235B (zh) 出行推荐方法、出行推荐模型的训练方法、装置
CN112766607B (zh) 出行路线的推荐方法、装置、电子设备及可读存储介质
CN115917535A (zh) 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN111582559B (zh) 一种到达时间的预估方法及装置
CN116664719B (zh) 一种图像重绘模型训练方法、图像重绘方法及装置
US20210011920A1 (en) Architecture for data analysis of geographic data and associated context data
CN107392389A (zh) 基于arima模型的出租车调度处理方法
CN111667693B (zh) 用于确定预计到达时间的方法、装置、设备及介质
Liu et al. Modeling the interaction coupling of multi-view spatiotemporal contexts for destination prediction
CN114417174B (zh) 内容推荐方法、装置、设备及计算机存储介质
Xu et al. A taxi dispatch system based on prediction of demand and destination
Zhao et al. Developing a multiview spatiotemporal model based on deep graph neural networks to predict the travel demand by bus
CN115114329A (zh) 数据流异常检测的方法、装置、电子设备和存储介质
CN113918802B (zh) 导航方法、装置、设备、介质及产品
CN112686457B (zh) 路线到达时间预估方法及装置、电子设备、存储介质
Li et al. Driving cycle prediction based on Markov chain combined with driving information mining
US11715023B2 (en) Methods and apparatuses for training one or more model parameters of a predictive parking difficulty model
Syed et al. Neural network-based metaheuristic parameterization with application to the vehicle matching problem in ride-hailing services
CN114463590A (zh) 信息处理方法、装置、设备、存储介质及程序产品
CN112417260B (zh) 本地化推荐方法、装置及存储介质
Rahaman Context-aware mobility analytics and trip planning
CN117132958B (zh) 道路要素识别方法及相关装置
CN112070530A (zh) 广告预估模型的上线评估方法及相关装置
CN113283184B (zh) 一种出行推荐方法、装置、计算机设备和存储介质
CN114510638B (zh) 信息处理方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40050060

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant