CN110689150A - 基于机器学习的订单预测方法、预测装置及计算机设备 - Google Patents
基于机器学习的订单预测方法、预测装置及计算机设备 Download PDFInfo
- Publication number
- CN110689150A CN110689150A CN201810631116.3A CN201810631116A CN110689150A CN 110689150 A CN110689150 A CN 110689150A CN 201810631116 A CN201810631116 A CN 201810631116A CN 110689150 A CN110689150 A CN 110689150A
- Authority
- CN
- China
- Prior art keywords
- order
- driver
- information
- prediction
- accident
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000011156 evaluation Methods 0.000 claims description 44
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000035987 intoxication Effects 0.000 description 3
- 231100000566 intoxication Toxicity 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/02—Reservations, e.g. for tickets, services or events
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
Abstract
本公开实施例提出了一种基于机器学习的订单预测方法、预测装置、计算机设备及计算机可读存储介质,属于计算机技术领域。其中,基于机器学习的订单预测方法包括:获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息,提取第一订单信息包含的第一订单特征和交通工具的第一驾驶员特征;基于第一订单特征和第一驾驶员特征,利用第一预测模型预测第一订单发生意外情况的概率。采用本公开实施例的技术方案,能够在为驾驶员分派订单前预测到意外情况发生的概率,提升驾驶员对于网约车平台的满意度,保障司乘的安全。
Description
技术领域
本公开实施例涉及计算机技术领域,具体而言,涉及一种基于机器学习的订单预测方法、预测装置、计算机设备及计算机可读存储介质。
背景技术
互联网交通预约服务是当前互联网服务中的一个主要分支,在互联网交通预约服务中,互联网平台会对订单的派送进行综合的计算,以合理的调度订单分配。
在交通服务中,驾驶员和乘客会在交通工具中相处较长的一段时间,因此包括醉酒在内的某一方的不良行为会极大地影响交通服务的质量,甚至产生人身冲突等恶劣结果。
针对发生不良行为的意外订单场景,相关技术中大多采用事后对相关人员进行处理的办法。比如允许驾驶员拒载等,但往往效果不佳且难以评估。
发明内容
本公开实施例旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本公开实施例的一个方面在于提出了一种基于机器学习的订单预测方法。
本公开实施例的另一个方面在于提出了一种基于机器学习的订单预测装置。
本公开实施例的再一个方面在于提出了一种计算机设备。
本公开实施例的又一个方面在于提出了一种计算机可读存储介质。
有鉴于此,根据本公开实施例的一个方面,提出了一种基于机器学习的订单预测方法,包括:获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息,提取第一订单信息包含的第一订单特征和交通工具的第一驾驶员特征;基于第一订单特征和第一驾驶员特征,利用第一预测模型预测第一订单发生意外情况的概率。
本公开实施例提供的基于机器学习的订单预测方法,获取第一订单信息(乘客订单),并获取与第一订单对应的交通工具信息,即可以为乘客分派的车辆信息,分别提取第一订单特征和第一驾驶员特征。进一步地将第一订单特征和第一驾驶员特征输入至已建立的第一预测模型,输出第一订单发生意外情况的概率,即如果为该下单乘客分派某一驾驶员后,发生意外情况的概率。采用本公开实施例的技术方案,能够在为驾驶员分派订单前预测到意外情况发生的概率,提升驾驶员对于网约车平台的满意度,保障司乘的安全。
根据本公开实施例的上述基于机器学习的订单预测方法,还可以具有以下技术特征:
在上述技术方案中,优选地,在获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息之前,还包括:建立第一预测模型。
在该技术方案中,建立第一预测模型,能够通过该第一预测模型预测第一订单发生意外情况的概率,降低派单后意外情况的发生。
在上述任一技术方案中,优选地,还包括:当第一订单发生意外情况的概率大于预设阈值时,对第一订单进行标记。
在该技术方案中,当第一订单发生意外情况的概率大于预设阈值时对第一订单进行标记,从而进行相应的后续干预,降低意外情况发生概率。
在上述任一技术方案中,优选地,建立第一预测模型的步骤,具体包括:获取作为样本的第二订单信息和与第二订单信息对应的交通工具信息;获取第二订单信息中的驾驶员评价信息,根据驾驶员评价信息判断第二订单是否为意外情况订单;若判断第二订单为意外情况订单,则从第二订单信息中提取意外情况订单的第二订单特征;从与第二订单信息对应的交通工具信息中提取与意外情况订单对应的第二驾驶员特征;根据第二订单特征以及第二驾驶员特征,训练得到第一预测模型。
在该技术方案中,上网约车兴起之后,驾驶员、乘客可以很方便的进行相互评价,利用驾驶员在网约车应用程序、电话等方式的评价信息中进行模式识别,来判断第二订单是否是意外情况订单,统计意外情况订单的共有特征作为第二订单特征,同时从与第二订单信息对应的交通工具信息中提取对应的第二驾驶员特征。训练第二订单特征和第二驾驶员特征,建立第一预测模型。通过本公开实施例的技术方案,能够利用采集的大量的样本订单和样本交通工具信息,确定合理的特征,从而建立精准的预测模型。
需要说明的是,意外情况(例如车内冲突)的发生几率往往是百万分之几,这就意味着黑白样本比例达到1:1000000(黑样本为车内发生冲突,白样本为车内未发生冲突),黑白样本比例如此失衡条件下的建模,是机器学习领域的巨大挑战。为此,在采集第二订单信息和与第二订单信息对应的交通工具信息时,反复进行负采样测试,以使黑白样本达到合适的比例。
在上述任一技术方案中,优选地,第二订单特征包括以下一种或其组合:发单时间、发单地点、发单城市、城市天气、发单地点历史意外情况订单密度、预估里程、乘客性别、乘客年龄、乘客历史评价信息、乘客平台注册时间;第二驾驶员特征包括以下一种或其组合:驾驶员性别、驾驶员年龄、驾驶员历史评价信息、驾驶员平台注册时间、驾驶员服务分数。
在该技术方案中,第二订单特征以及第二驾驶员特征包括但不限于上述信息,其中,乘客历史评价信息包括被驾驶员投诉的情况以及投诉驾驶员与自己发生冲突的情况,驾驶员历史评价信息包括乘客对该驾驶员的评价情况以及驾驶员对乘客的评价情况,通过结合上述第二订单特征和第二驾驶员特征建立第一预测模型。例如,意外情况订单的共同特征包括订单时间为夜间,订单地点在酒吧、饭店等地方、乘客历史被投诉中醉酒原因较多等,而与意外情况订单对应的第二驾驶员特征包括投诉乘客的次数较多、历史被投诉的次数较多、该驾驶员比较年轻(比较年轻的驾驶员可能易与乘客发生冲突)等。
在上述任一技术方案中,优选地,第一预测模型为XGBoost模型。
在该技术方案中,XGBoost模型是专注于梯度提升算法的机器学习函数库,利用XGBoost模型,训练第二订单特征以及第二驾驶员特征,建立出预测模型,XGBoost模型一方面在解决分类问题上效果优异,另一方面该算法优于人工神经网络,算法的过程可解释。
在上述任一技术方案中,优选地,意外情况包括驾驶员和乘客发生冲突。
在该技术方案中,意外情况包括驾驶员和乘客发生冲突,第一预测模型可以为乘客醉酒冲突概率预测模型,可以利用该预测模型预测如果为某一下单乘客分派某一驾驶员后,驾驶员与乘客因为乘客醉酒发生冲突的概率。
根据本公开实施例的另一个方面,提出了一种基于机器学习的订单预测装置,包括:特征获取单元,用于获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息,提取第一订单信息包含的第一订单特征和交通工具的第一驾驶员特征;预测单元,用于基于第一订单特征和第一驾驶员特征,利用第一预测模型预测第一订单发生意外情况的概率。
本公开实施例提供的基于机器学习的订单预测装置,获取第一订单信息(乘客订单),并获取与第一订单对应的交通工具信息,即可以为乘客分派的车辆信息,分别提取第一订单特征和第一驾驶员特征。进一步地将第一订单特征和第一驾驶员特征输入至已建立的第一预测模型,输出第一订单发生意外情况的概率,即如果为该下单乘客分派某一驾驶员后,发生意外情况的概率。采用本公开实施例的技术方案,能够在为驾驶员分派订单前预测到意外情况发生的概率,提升驾驶员对于网约车平台的满意度,保障司乘的安全。
根据本公开实施例的上述基于机器学习的订单预测装置,还可以具有以下技术特征:
在上述技术方案中,优选地,还包括:模型建立单元,用于建立第一预测模型。
在该技术方案中,建立第一预测模型,能够通过该第一预测模型预测第一订单发生意外情况的概率,降低派单后意外情况的发生。
在上述任一技术方案中,优选地,还包括:标记单元,用于当第一订单发生意外情况的概率大于预设阈值时,对第一订单进行标记。
在该技术方案中,当第一订单发生意外情况的概率大于预设阈值时对第一订单进行标记,从而进行相应的后续干预,降低意外情况发生概率。
在上述任一技术方案中,优选地,模型建立单元,具体用于:获取作为样本的第二订单信息和与第二订单信息对应的交通工具信息;获取第二订单信息中的驾驶员评价信息,根据驾驶员评价信息判断第二订单是否为意外情况订单;若判断第二订单为意外情况订单,则从第二订单信息中提取意外情况订单的第二订单特征;从与第二订单信息对应的交通工具信息中提取与意外情况订单对应的第二驾驶员特征;根据第二订单特征以及第二驾驶员特征,训练得到第一预测模型。
在该技术方案中,上网约车兴起之后,驾驶员、乘客可以很方便的进行相互评价,利用驾驶员在网约车应用程序、电话等方式的评价信息中进行模式识别,来判断第二订单是否是意外情况订单,统计意外情况订单的共有特征作为第二订单特征,同时从与第二订单信息对应的交通工具信息中提取对应的第二驾驶员特征。训练第二订单特征和第二驾驶员特征,建立第一预测模型。通过本公开实施例的技术方案,能够利用采集的大量的样本订单和样本交通工具信息,确定合理的特征,从而建立精准的预测模型。
需要说明的是,意外情况(例如车内冲突)的发生几率往往是百万分之几,这就意味着黑白样本比例达到1:1000000(黑样本为车内发生冲突,白样本为车内未发生冲突),黑白样本比例如此失衡条件下的建模,是机器学习领域的巨大挑战。为此,在采集第二订单信息和与第二订单信息对应的交通工具信息时,反复进行负采样测试,以使黑白样本达到合适的比例。
在上述任一技术方案中,优选地,第二订单特征包括以下一种或其组合:发单时间、发单地点、发单城市、城市天气、发单地点历史意外情况订单密度、预估里程、乘客性别、乘客年龄、乘客历史评价信息、乘客平台注册时间;第二驾驶员特征包括以下一种或其组合:驾驶员性别、驾驶员年龄、驾驶员历史评价信息、驾驶员平台注册时间、驾驶员服务分数。
在该技术方案中,第二订单特征以及第二驾驶员特征包括但不限于上述信息,其中,乘客历史评价信息包括被驾驶员投诉的情况以及投诉驾驶员与自己发生冲突的情况,驾驶员历史评价信息包括乘客对该驾驶员的评价情况以及驾驶员对乘客的评价情况,通过结合上述第二订单特征和第二驾驶员特征建立第一预测模型。例如,意外情况订单的共同特征包括订单时间为夜间,订单地点在酒吧、饭店等地方、乘客历史被投诉中醉酒原因较多等,而与意外情况订单对应的第二驾驶员特征包括投诉乘客的次数较多、历史被投诉的次数较多、该驾驶员比较年轻(比较年轻的驾驶员可能易与乘客发生冲突)等。
在上述任一技术方案中,优选地,第一预测模型为XGBoost模型。
在该技术方案中,XGBoost模型是专注于梯度提升算法的机器学习函数库,利用XGBoost模型,训练第二订单特征以及第二驾驶员特征,建立出预测模型,XGBoost模型一方面在解决分类问题上效果优异,另一方面该算法优于人工神经网络,算法的过程可解释。
在上述任一技术方案中,优选地,意外情况包括驾驶员和乘客发生冲突。
在该技术方案中,意外情况包括驾驶员和乘客发生冲突,第一预测模型可以为乘客醉酒冲突概率预测模型,可以利用该预测模型预测如果为某一下单乘客分派某一驾驶员后,驾驶员与乘客因为乘客醉酒发生冲突的概率。
根据本公开实施例的再一个方面,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述任一项的基于机器学习的订单预测方法的步骤。
本公开提供的计算机设备,计算机程序被处理器执行时实现如上述任一技术方案的基于机器学习的订单预测方法的步骤,因此该计算机设备包括上述任一技术方案的基于机器学习的订单预测方法的全部有益效果。
根据本公开实施例的又一个方面,提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一项的基于机器学习的订单预测方法的步骤。
本公开实施例提供的计算机可读存储介质,计算机程序被处理器执行时实现如上述任一技术方案的基于机器学习的订单预测方法的步骤,因此该计算机可读存储介质包括上述任一技术方案的基于机器学习的订单预测方法的全部有益效果。
本公开实施例的附加方面和优点将在下面的描述部分中变得明显,或通过本公开实施例的实践了解到。
附图说明
本公开实施例的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本公开实施例的一个实施例的基于机器学习的订单预测方法的流程示意图;
图2示出了本公开实施例的另一个实施例的基于机器学习的订单预测方法的流程示意图;
图3示出了本公开实施例的再一个实施例的基于机器学习的订单预测方法的流程示意图;
图4示出了本公开实施例的一个实施例的基于机器学习的订单预测装置的示意图;
图5示出了本公开实施例的另一个实施例的基于机器学习的订单预测装置的示意图;
图6示出了本公开实施例的一个具体实施例的预测模型影响情况的示意图。
具体实施方式
为了能够更清楚地理解本公开实施例的上述目的、特征和优点,下面结合附图和具体实施方式对本公开实施例进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开实施例,但是,本公开实施例还可以采用其他不同于在此描述的其他方式来实施,因此,本公开实施例的保护范围并不限于下面公开的具体实施例的限制。
本公开实施例第一方面的实施例,提出一种基于机器学习的订单预测方法,图1示出了本公开实施例的一个实施例的基于机器学习的订单预测方法的流程示意图。其中,该方法包括:
步骤102,获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息,提取第一订单信息包含的第一订单特征和交通工具的第一驾驶员特征;
步骤104,基于第一订单特征和第一驾驶员特征,利用第一预测模型预测第一订单发生意外情况的概率。
本公开实施例提供的乘客醉酒冲突的预测方法,获取第一订单信息(乘客订单),并获取与第一订单对应的交通工具信息,即可以为乘客分派的车辆信息,分别提取第一订单特征和第一驾驶员特征。进一步地将第一订单特征和第一驾驶员特征输入至已建立的第一预测模型,输出第一订单发生意外情况的概率,即如果为该下单乘客分派某一驾驶员后,发生意外情况的概率。采用本公开实施例的技术方案,能够在为驾驶员分派订单前预测到意外情况发生的概率,提升驾驶员对于网约车平台的满意度,保障司乘的安全。
图2示出了本公开实施例的另一个实施例的基于机器学习的订单预测方法的流程示意图。其中,该方法包括:
步骤202,建立第一预测模型;
步骤204,获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息,提取第一订单信息包含的第一订单特征和交通工具的第一驾驶员特征;
步骤206,基于第一订单特征和第一驾驶员特征,利用第一预测模型预测第一订单发生意外情况的概率。
在该实施例中,建立第一预测模型,能够通过该第一预测模型预测第一订单发生意外情况的概率,降低派单后意外情况的发生。
优选地,建立第一预测模型的步骤,具体包括:获取作为样本的第二订单信息和与第二订单信息对应的交通工具信息;获取第二订单信息中的驾驶员评价信息,根据驾驶员评价信息判断第二订单是否为意外情况订单;若判断第二订单为意外情况订单,则从第二订单信息中提取意外情况订单的第二订单特征;从与第二订单信息对应的交通工具信息中提取与意外情况订单对应的第二驾驶员特征;根据第二订单特征以及第二驾驶员特征,训练得到第一预测模型。
在该实施例中,上网约车兴起之后,驾驶员、乘客可以很方便的进行相互评价,利用驾驶员在网约车应用程序、电话等方式的评价信息中进行模式识别,来判断第二订单是否是意外情况订单,统计意外情况订单的共有特征作为第二订单特征,同时从与第二订单信息对应的交通工具信息中提取对应的第二驾驶员特征。训练第二订单特征和第二驾驶员特征,建立第一预测模型。通过本公开的技术方案,能够利用采集的大量的样本订单和样本交通工具信息,确定合理的特征,从而建立精准的预测模型。
需要说明的是,意外情况(例如车内冲突)的发生几率往往是百万分之几,这就意味着黑白样本比例达到1:1000000(黑样本为车内发生冲突,白样本为车内未发生冲突),黑白样本比例如此失衡条件下的建模,是机器学习领域的巨大挑战。为此,在采集第二订单信息和与第二订单信息对应的交通工具信息时,反复进行负采样测试,以使黑白样本达到合适的比例。
优选地,第二订单特征包括以下一种或其组合:发单时间、发单地点、发单城市、城市天气、发单地点历史意外情况订单密度、预估里程、乘客性别、乘客年龄、乘客历史评价信息、乘客平台注册时间;第二驾驶员特征包括以下一种或其组合:驾驶员性别、驾驶员年龄、驾驶员历史评价信息、驾驶员平台注册时间、驾驶员服务分数。
在该实施例中,第二订单特征以及第二驾驶员特征包括但不限于上述信息,其中,乘客历史评价信息包括被驾驶员投诉的情况以及投诉驾驶员与自己发生冲突的情况,驾驶员历史评价信息包括乘客对该驾驶员的评价情况以及驾驶员对乘客的评价情况,通过结合上述第二订单特征和第二驾驶员特征建立第一预测模型。例如,意外情况订单的共同特征包括订单时间为夜间,订单地点在酒吧、饭店等地方、乘客历史被投诉中醉酒原因较多等,而与意外情况订单对应的第二驾驶员特征包括投诉乘客的次数较多、历史被投诉的次数较多、该驾驶员比较年轻(比较年轻的驾驶员可能易与乘客发生冲突)等。
优选地,第一预测模型为XGBoost模型。
在该实施例中,XGBoost模型是专注于梯度提升算法的机器学习函数库,利用XGBoost模型,训练第二订单特征以及第二驾驶员特征,建立出预测模型,XGBoost模型一方面在解决分类问题上效果优异,另一方面该算法优于人工神经网络,算法的过程可解释。
优选地,意外情况包括驾驶员和乘客发生冲突。
在该实施例中,意外情况包括驾驶员和乘客发生冲突,第一预测模型可以为乘客醉酒冲突概率预测模型,可以利用该预测模型预测如果为某一下单乘客分派某一驾驶员后,驾驶员与乘客因为乘客醉酒发生冲突的概率。
图3示出了本公开实施例的再一个实施例的基于机器学习的订单预测方法的流程示意图。其中,该方法包括:
步骤302,建立第一预测模型;
步骤304,获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息,提取第一订单信息包含的第一订单特征和交通工具的第一驾驶员特征;
步骤306,基于第一订单特征和第一驾驶员特征,利用第一预测模型预测第一订单发生意外情况的概率;
步骤308,当第一订单发生意外情况的概率大于预设阈值时,对第一订单进行标记。
在该实施例中,当第一订单发生意外情况的概率大于预设阈值时对第一订单进行标记,从而进行相应的后续干预,降低意外情况发生概率。
优选地,建立第一预测模型的步骤,具体包括:获取作为样本的第二订单信息和与第二订单信息对应的交通工具信息;获取第二订单信息中的驾驶员评价信息,根据驾驶员评价信息判断第二订单是否为意外情况订单;若判断第二订单为意外情况订单,则从第二订单信息中提取意外情况订单的第二订单特征;从与第二订单信息对应的交通工具信息中提取与意外情况订单对应的第二驾驶员特征;根据第二订单特征以及第二驾驶员特征,训练得到第一预测模型。
优选地,第二订单特征包括以下一种或其组合:发单时间、发单地点、发单城市、城市天气、发单地点历史意外情况订单密度、预估里程、乘客性别、乘客年龄、乘客历史评价信息、乘客平台注册时间;第二驾驶员特征包括以下一种或其组合:驾驶员性别、驾驶员年龄、驾驶员历史评价信息、驾驶员平台注册时间、驾驶员服务分数。第一预测模型为XGBoost模型。
本公开实施例第二方面的实施例,提出一种基于机器学习的订单预测装置,图4示出了本公开实施例的一个实施例的基于机器学习的订单预测装置40的示意图。其中,该装置40包括:
特征获取单元402,用于获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息,提取第一订单信息包含的第一订单特征和交通工具的第一驾驶员特征;预测单元404,用于基于第一订单特征和第一驾驶员特征,利用第一预测模型预测第一订单发生意外情况的概率。
本公开实施例提供的基于机器学习的订单预测装置40,获取第一订单信息(乘客订单),并获取与第一订单对应的交通工具信息,即可以为乘客分派的车辆信息,分别提取第一订单特征和第一驾驶员特征。进一步地将第一订单特征和第一驾驶员特征输入至已建立的第一预测模型,输出第一订单发生意外情况的概率,即如果为该下单乘客分派某一驾驶员后,发生意外情况的概率。采用本公开实施例的技术方案,能够在为驾驶员分派订单前预测到意外情况发生的概率,提升驾驶员对于网约车平台的满意度,保障司乘的安全。
图5示出了本公开实施例的另一个实施例的基于机器学习的订单预测装置50的示意图。其中,该装置50包括:
模型建立单元502,用于建立第一预测模型;
特征获取单元504,用于获取提供运输服务的第一订单信息和与第一订单对应的交通工具信息,提取第一订单信息包含的第一订单特征和交通工具的第一驾驶员特征;
预测单元506,用于基于第一订单特征和第一驾驶员特征,利用第一预测模型预测第一订单发生意外情况的概率;
标记单元508,用于当第一订单发生意外情况的概率大于预设阈值时,对第一订单进行标记。
在该实施例中,建立第一预测模型,能够通过该第一预测模型预测第一订单发生意外情况的概率,降低派单后意外情况的发生。
当第一订单发生意外情况的概率大于预设阈值时对第一订单进行标记,从而进行相应的后续干预,降低意外情况发生概率。
优选地,模型建立单元502,具体用于:获取作为样本的第二订单信息和与第二订单信息对应的交通工具信息;获取第二订单信息中的驾驶员评价信息,根据驾驶员评价信息判断第二订单是否为意外情况订单;若判断第二订单为意外情况订单,则从第二订单信息中提取意外情况订单的第二订单特征;从与第二订单信息对应的交通工具信息中提取与意外情况订单对应的第二驾驶员特征;根据第二订单特征以及第二驾驶员特征,训练得到第一预测模型。
在该实施例中,上网约车兴起之后,驾驶员、乘客可以很方便的进行相互评价,利用驾驶员在网约车应用程序、电话等方式的评价信息中进行模式识别,来判断第二订单是否是意外情况订单,统计意外情况订单的共有特征作为第二订单特征,同时从与第二订单信息对应的交通工具信息中提取对应的第二驾驶员特征。训练第二订单特征和第二驾驶员特征,建立第一预测模型。通过本公开实施例的技术方案,能够利用采集的大量的样本订单和样本交通工具信息,确定合理的特征,从而建立精准的预测模型。
需要说明的是,意外情况(例如车内冲突)的发生几率往往是百万分之几,这就意味着黑白样本比例达到1:1000000(黑样本为车内发生冲突,白样本为车内未发生冲突),黑白样本比例如此失衡条件下的建模,是机器学习领域的巨大挑战。为此,在采集第二订单信息和与第二订单信息对应的交通工具信息时,反复进行负采样测试,以使黑白样本达到合适的比例。
优选地,第二订单特征包括以下一种或其组合:发单时间、发单地点、发单城市、城市天气、发单地点历史意外情况订单密度、预估里程、乘客性别、乘客年龄、乘客历史评价信息、乘客平台注册时间;第二驾驶员特征包括以下一种或其组合:驾驶员性别、驾驶员年龄、驾驶员历史评价信息、驾驶员平台注册时间、驾驶员服务分数。
在该实施例中,第二订单特征以及第二驾驶员特征包括但不限于上述信息,其中,乘客历史评价信息包括被驾驶员投诉的情况以及投诉驾驶员与自己发生冲突的情况,驾驶员历史评价信息包括乘客对该驾驶员的评价情况以及驾驶员对乘客的评价情况,通过结合上述第二订单特征和第二驾驶员特征建立第一预测模型。例如,意外情况订单的共同特征包括订单时间为夜间,订单地点在酒吧、饭店等地方、乘客历史被投诉中醉酒原因较多等,而与意外情况订单对应的第二驾驶员特征包括投诉乘客的次数较多、历史被投诉的次数较多、该驾驶员比较年轻(比较年轻的驾驶员可能易与乘客发生冲突)等。
优选地,第一预测模型为XGBoost模型。
在该实施例中,XGBoost模型是专注于梯度提升算法的机器学习函数库,利用XGBoost模型,训练第二订单特征以及第二驾驶员特征,建立出预测模型,XGBoost模型一方面在解决分类问题上效果优异,另一方面该算法优于人工神经网络,算法的过程可解释。
优选地,意外情况包括驾驶员和乘客发生冲突。
在该实施例中,意外情况包括驾驶员和乘客发生冲突,第一预测模型可以为乘客醉酒冲突概率预测模型,可以利用该预测模型预测如果为某一下单乘客分派某一驾驶员后,驾驶员与乘客因为乘客醉酒发生冲突的概率。
在一个具体实施例中,涉及乘客醉酒冲突概率的预测方法,采用本公开实施例的技术方案能够解决以下技术问题:
1、醉酒订单的标记
在相关技术中,由于订单信息都是线下传递的,导致已经发生的订单的性质比如好评、投诉等很难收集。而电话回访等手段成本巨大,对于需要海量数据的模型来讲,几乎不能实现。如何解决醉酒订单的标记问题为第一难点。
2、模型的特征建设
网约车平台的醉酒投诉率只有万分之二,醉酒导致的冲率则只有百万分之一,都是小概率事件,很难找到规律。且醉酒订单的预测,离不了合理的特征建设。如何找到与乘客醉酒相关的特征为第二难点。
3、算法选择
目前用于分类的算法很多,如逻辑回归、决策树、支持向量机、人工神经网络等,如何选择合适的模型,使其对于当前的问题能有最好的解决为第三难点。
针对上述三点,本公开实施例的具体实施例中提出一种乘客醉酒冲突预测模型的建立方法,包括:
1、利用驾驶员对乘客的评价,对醉酒订单进行标记
如网约车兴起之后,驾驶员、乘客可以很方便的进行相互评价,这给识别醉酒订单带来了便利。利用驾驶员在网约车应用程序、电话评价中的信息进行模式识别,来判断订单是否是醉酒订单。例如驾驶员的评价为“乘客喝的烂醉,态度恶劣”,则可以判断这是醉酒订单。
2、通过关联分析,建设醉酒相关的特征
经过大量的数据分析,发现与醉酒相关的特征,如发单时间、发单POI(point ofinterest,兴趣点)、预估里程,以及乘客特征如性别、年龄、历史被投诉次数。以发单时间为例,分析发现醉酒订单在夜间的发生率显著增大;而醉酒订单的起点往往集中在酒吧、KTV等地方,经过分析发现,网约车平台上的代驾订单,很大一部分都是醉酒代驾的,利用这些订单的起点,可以很好的建设醉酒订单POI特征。
3、模型建设
利用XGBoost算法,一方面在解决分类问题上效果优异,另一方面其优于人工神经网络,算法的过程可解释。采用XGBoost算法,将订单特征如发单时间、发单POI、预估里程,乘客特征如性别、年龄、历史被投诉次数等纳入模型,建设了乘客醉酒冲突预测模型,如图6所示,乘客醉酒冲突预测模型在影响1%的订单的情况下,可以召回30%的醉酒订单。
本公开实施例第三方面的实施例,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述任一项的基于机器学习的订单预测方法的步骤。
本公开提供的计算机设备,计算机程序被处理器执行时实现如上述任一实施例的基于机器学习的订单预测方法的步骤,因此该计算机设备包括上述任一实施例的基于机器学习的订单预测方法的全部有益效果。
本公开实施例第四方面的实施例,提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一项的基于机器学习的订单预测方法的步骤。
本公开实施例提供的计算机可读存储介质,计算机程序被处理器执行时实现如上述任一实施例的基于机器学习的订单预测方法的步骤,因此该计算机可读存储介质包括上述任一实施例的基于机器学习的订单预测方法的全部有益效果。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本公开实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本公开实施例的优选实施例而已,并不用于限制本公开实施例,对于本领域的技术人员来说,本公开实施例可以有各种更改和变化。凡在本公开实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开实施例的保护范围之内。
Claims (16)
1.一种基于机器学习的订单预测方法,其特征在于,包括:
获取提供运输服务的第一订单信息和与所述第一订单对应的交通工具信息,提取所述第一订单信息包含的第一订单特征和所述交通工具的第一驾驶员特征;
基于所述第一订单特征和所述第一驾驶员特征,利用第一预测模型预测所述第一订单发生意外情况的概率。
2.根据权利要求1所述的基于机器学习的订单预测方法,其特征在于,在所述获取提供运输服务的第一订单信息和与所述第一订单对应的交通工具信息之前,还包括:
建立所述第一预测模型。
3.根据权利要求1或2所述的基于机器学习的订单预测方法,其特征在于,还包括:
当所述第一订单发生意外情况的概率大于预设阈值时,对所述第一订单进行标记。
4.根据权利要求2所述的基于机器学习的订单预测方法,其特征在于,所述建立所述第一预测模型的步骤,具体包括:
获取作为样本的第二订单信息和与所述第二订单信息对应的交通工具信息;
获取所述第二订单信息中的驾驶员评价信息,根据所述驾驶员评价信息判断所述第二订单是否为意外情况订单;
若判断所述第二订单为所述意外情况订单,则从所述第二订单信息中提取所述意外情况订单的第二订单特征;
从与所述第二订单信息对应的交通工具信息中提取与所述意外情况订单对应的第二驾驶员特征;
根据所述第二订单特征以及所述第二驾驶员特征,训练得到所述第一预测模型。
5.根据权利要求4所述的基于机器学习的订单预测方法,其特征在于,
所述第二订单特征包括以下一种或其组合:发单时间、发单地点、发单城市、城市天气、发单地点历史意外情况订单密度、预估里程、乘客性别、乘客年龄、乘客历史评价信息、乘客平台注册时间;
所述第二驾驶员特征包括以下一种或其组合:驾驶员性别、驾驶员年龄、驾驶员历史评价信息、驾驶员平台注册时间、驾驶员服务分数。
6.根据权利要求4所述的基于机器学习的订单预测方法,其特征在于,
所述第一预测模型为XGBoost模型。
7.根据权利要求1或2所述的基于机器学习的订单预测方法,其特征在于,
所述意外情况包括驾驶员和乘客发生冲突。
8.一种基于机器学习的订单预测装置,其特征在于,包括:
特征获取单元,用于获取提供运输服务的第一订单信息和与所述第一订单对应的交通工具信息,提取所述第一订单信息包含的第一订单特征和所述交通工具的第一驾驶员特征;
预测单元,用于基于所述第一订单特征和所述第一驾驶员特征,利用第一预测模型预测所述第一订单发生意外情况的概率。
9.根据权利要求8所述的基于机器学习的订单预测装置,其特征在于,还包括:
模型建立单元,用于建立所述第一预测模型。
10.根据权利要求8或9所述的基于机器学习的订单预测装置,其特征在于,还包括:
标记单元,用于当所述第一订单发生意外情况的概率大于预设阈值时,对所述第一订单进行标记。
11.根据权利要求9所述的基于机器学习的订单预测装置,其特征在于,所述模型建立单元,具体用于:
获取作为样本的第二订单信息和与所述第二订单信息对应的交通工具信息;
获取所述第二订单信息中的驾驶员评价信息,根据所述驾驶员评价信息判断所述第二订单是否为意外情况订单;
若判断所述第二订单为所述意外情况订单,则从所述第二订单信息中提取所述意外情况订单的第二订单特征;
从与所述第二订单信息对应的交通工具信息中提取与所述意外情况订单对应的第二驾驶员特征;
根据所述第二订单特征以及所述第二驾驶员特征,训练得到所述第一预测模型。
12.根据权利要求11所述的基于机器学习的订单预测装置,其特征在于,
所述第二订单特征包括以下一种或其组合:发单时间、发单地点、发单城市、城市天气、发单地点历史意外情况订单密度、预估里程、乘客性别、乘客年龄、乘客历史评价信息、乘客平台注册时间;
所述第二驾驶员特征包括以下一种或其组合:驾驶员性别、驾驶员年龄、驾驶员历史评价信息、驾驶员平台注册时间、驾驶员服务分数。
13.根据权利要求11所述的基于机器学习的订单预测装置,其特征在于,
所述第一预测模型为XGBoost模型。
14.根据权利要求8或9所述的基于机器学习的订单预测装置,其特征在于,
所述意外情况包括驾驶员和乘客发生冲突。
15.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于机器学习的订单预测方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于机器学习的订单预测方法的步骤。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810631116.3A CN110689150A (zh) | 2018-06-19 | 2018-06-19 | 基于机器学习的订单预测方法、预测装置及计算机设备 |
PCT/CN2018/125394 WO2019242286A1 (en) | 2018-06-19 | 2018-12-29 | Systems and methods for allocating service requests |
CN201880002690.0A CN110839346A (zh) | 2018-06-19 | 2018-12-29 | 用于分配服务请求的系统和方法 |
US16/732,046 US20200193357A1 (en) | 2018-06-19 | 2019-12-31 | Systems and methods for allocating service requests |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810631116.3A CN110689150A (zh) | 2018-06-19 | 2018-06-19 | 基于机器学习的订单预测方法、预测装置及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110689150A true CN110689150A (zh) | 2020-01-14 |
Family
ID=69106247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810631116.3A Pending CN110689150A (zh) | 2018-06-19 | 2018-06-19 | 基于机器学习的订单预测方法、预测装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110689150A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523766A (zh) * | 2020-03-27 | 2020-08-11 | 中国平安财产保险股份有限公司 | 驾驶风险评估方法、装置、电子设备及可读存储介质 |
CN111859104A (zh) * | 2020-03-31 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种乘客状态判断方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715285A (zh) * | 2015-03-31 | 2015-06-17 | 北京嘀嘀无限科技发展有限公司 | 处理订单的方法和设备 |
CN204759760U (zh) * | 2015-07-22 | 2015-11-11 | 北京博曼迪汽车科技有限公司 | 一种车辆的路口防碰撞预警装置和系统 |
CN107195000A (zh) * | 2016-03-14 | 2017-09-22 | 滴滴(中国)科技有限公司 | 一种打车计费的显示方法及装置 |
CN107194762A (zh) * | 2017-05-05 | 2017-09-22 | 腾讯科技(深圳)有限公司 | 交通工具推荐方法、系统及其设备 |
-
2018
- 2018-06-19 CN CN201810631116.3A patent/CN110689150A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715285A (zh) * | 2015-03-31 | 2015-06-17 | 北京嘀嘀无限科技发展有限公司 | 处理订单的方法和设备 |
CN204759760U (zh) * | 2015-07-22 | 2015-11-11 | 北京博曼迪汽车科技有限公司 | 一种车辆的路口防碰撞预警装置和系统 |
CN107195000A (zh) * | 2016-03-14 | 2017-09-22 | 滴滴(中国)科技有限公司 | 一种打车计费的显示方法及装置 |
CN107194762A (zh) * | 2017-05-05 | 2017-09-22 | 腾讯科技(深圳)有限公司 | 交通工具推荐方法、系统及其设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523766A (zh) * | 2020-03-27 | 2020-08-11 | 中国平安财产保险股份有限公司 | 驾驶风险评估方法、装置、电子设备及可读存储介质 |
CN111859104A (zh) * | 2020-03-31 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种乘客状态判断方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | How much data are enough? A statistical approach with case study on longitudinal driving behavior | |
US11138524B2 (en) | Cascaded boosted predictive models | |
CN112015843B (zh) | 基于多车意图交互结果的行车风险态势评估方法及系统 | |
CN111523932A (zh) | 一种网约车服务的评分方法、装置、系统及存储介质 | |
CN109670970B (zh) | 一种驾驶行为评分方法、装置及计算机可读存储介质 | |
CN111105110A (zh) | 驾驶风险确定方法、装置、介质和计算设备 | |
CN111861501A (zh) | 申诉处理方法、处理系统、计算机设备及存储介质 | |
CN113160602A (zh) | 一种智能公交调度模拟系统 | |
CN111340355A (zh) | 行程订单的匹配方法、装置、服务器和介质 | |
CN112598192B (zh) | 一种车辆进入物流园区的预测方法、装置、存储介质及终端 | |
CN110827088A (zh) | 基于大数据的用车成本预测方法、装置及存储介质 | |
CN110689150A (zh) | 基于机器学习的订单预测方法、预测装置及计算机设备 | |
Verma et al. | Avoiding stress driving: Online trip recommendation from driving behavior prediction | |
CN107867295B (zh) | 基于车辆出险概率的事故预警方法、存储设备及车载终端 | |
CN111797755A (zh) | 一种汽车乘员情绪识别方法及电子设备 | |
CN114638666A (zh) | 车联网数据的处理方法和装置 | |
CN109376665B (zh) | 基于群智感知的出租车驾驶员的驾驶行为评估系统 | |
CN113407871A (zh) | 上车点推荐方法、装置、电子设备和可读存储介质 | |
DE102021102146A1 (de) | Fahrzeugantriebsstranganalyse in vernetzten flotten | |
WO2020120538A1 (de) | Verfahren, computerprogramm, vorrichtung, fahrzeug und netzwerkkomponente zur schätzung eines abfahrtzeitpunktes eines nutzers mit einem fahrzeug | |
CN112070571B (zh) | 智能化的网约车信息处理方法 | |
CN115577173A (zh) | 信息推送方法、装置、设备及存储介质 | |
CN111598275B (zh) | 一种电动汽车信用分评测方法、装置、设备和介质 | |
CN110782061A (zh) | 一种恶性事件的预测方法及系统 | |
CN113505955A (zh) | 一种基于tsp系统的用户驾驶行为评分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200114 |