CN110998648A - 一种分配订单的系统和方法 - Google Patents
一种分配订单的系统和方法 Download PDFInfo
- Publication number
- CN110998648A CN110998648A CN201880002067.5A CN201880002067A CN110998648A CN 110998648 A CN110998648 A CN 110998648A CN 201880002067 A CN201880002067 A CN 201880002067A CN 110998648 A CN110998648 A CN 110998648A
- Authority
- CN
- China
- Prior art keywords
- target
- requester
- service
- provider
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 139
- 239000013598 vector Substances 0.000 claims description 96
- 238000012549 training Methods 0.000 claims description 89
- 238000003860 storage Methods 0.000 claims description 83
- 238000013473 artificial intelligence Methods 0.000 claims description 56
- 238000000605 extraction Methods 0.000 claims description 51
- 238000004891 communication Methods 0.000 claims description 45
- 238000004422 calculation algorithm Methods 0.000 claims description 33
- 239000000203 mixture Substances 0.000 claims description 21
- 239000002131 composite material Substances 0.000 claims description 13
- 230000001568 sexual effect Effects 0.000 claims description 12
- 230000000670 limiting effect Effects 0.000 claims description 10
- 230000002147 killing effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 102
- 230000000875 corresponding effect Effects 0.000 description 44
- 230000008569 process Effects 0.000 description 40
- 239000000284 extract Substances 0.000 description 28
- 238000010586 diagram Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 17
- 230000015654 memory Effects 0.000 description 17
- 230000003190 augmentative effect Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 239000000835 fiber Substances 0.000 description 6
- 230000035987 intoxication Effects 0.000 description 6
- 231100000566 intoxication Toxicity 0.000 description 6
- 230000003211 malignant effect Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 206010001488 Aggression Diseases 0.000 description 3
- 230000016571 aggressive behavior Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000029305 taxis Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 235000015842 Hesperis Nutrition 0.000 description 1
- 235000012633 Iberis amara Nutrition 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- -1 merchandise Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/02—Reservations, e.g. for tickets, services or events
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/02—Reservations, e.g. for tickets, services or events
- G06Q10/025—Coordination of plural reservations, e.g. plural trip segments, transportation combined with accommodation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063112—Skill-based matching of a person or a group to a task
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
提供了一种分配订单的系统和方法。该方法包括提取与服务请求者关联的订单的目标订单特征;提取服务请求者的目标请求者特征;提取服务提供者的目标提供者特征;获得用于确定目标事件发生的概率的预测模型;以及基于目标订单特征,目标请求者特征和目标提供者特征,使用预测模型确定目标事件的发生概率。
Description
技术领域
本申请一般涉及使用人工智能来处理线上到线下服务的打车订单的系统和方法,具体涉及基于目标事件的发生概率分配订单的系统和方法。
背景技术
线上到线下服务,例如在线打车服务,利用互联网技术,因其便利性而变得越来越流行。但是,当乘客通过线上到线下服务平台请求打车服务时,该线上到线下服务平台会指派司机为乘客服务,而不会考虑突发事件的可能性(例如恶性事件),因而影响为乘客和/或驾驶员服务的质量和/或体验。因此,提供合适系统和方法来分配订单是有必要的。
发明内容
根据本申请的一个方面,提供了一种用于确定目标事件发生概率的系统,该系统包括一个或多个电子设备。根据本申请的一个方面,提供了一种用于确定目标事件发生概率的系统,所述系统包括一个或多个电子设备。所述系统可以包括至少一个存储设备和与所述至少一个存储设备通信的至少一个处理器。所述至少一个存储设备可以包括操作系统和与所述操作系统兼容的第一组指令,用于确定目标事件的发生概率。当执行所述操作系统和所述第一组指令时,所述至少一个处理器可以用于提取与服务请求者关联的订单的目标订单特征;提取所述服务请求者的目标请求者特征;提取服务提供者的目标提供者特征;获得用于确定所述目标事件发生的概率的预测模型;以及基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
在一些实施例中,为了获得所述预测模型,所述至少一个处理器进一步用于获得训练数据。所述训练数据可以包括多个正样本和多个负样本,所述多个正样本中的每一个所述目标事件没有发生,所述多个负样本中的每一个目标事件已经发生。所述多个正样本和所述多个负样本中的每一个可以包括历史交易数据和对应于所述历史交易数据的历史事件数据。所述至少一个处理器可以进一步用于从所述多个正样本和所述多个负样本的所述历史交易数据中提取多个候选特征。对于所述多个正样本和所述多个负样本中的每一个,所述至少一个处理器可以进一步用于使用特征选择算法从所述多个候选特征中确定一个或多个目标特征。所述至少一个处理器可以进一步用于基于所述多个正样本的所述一个或多个目标特征,所述多个负样本的所述一个或多个目标特征,和所述多个正样本和所述多个负样本的所述历史事件数据生成所述预测模型。
在一些实施例中,为了获得所述预测模型,所述至少一个处理器可以进一步用于基于所述多个正样本和所述多个负样本判断出所述训练数据包括不平衡样本;以及当判断出所述训练数据包括所述不平衡样本时,基于所述训练数据,使用样本平衡技术平衡所述样本组成。
在一些实施例中,所述样本平衡技术可以包括对所述多个正样本进行欠采样。
在一些实施例中,所述样本平衡技术可以包括对所述多个负样本进行过采样。
在一些实施例中,为了平衡所述样本组成,所述至少一个处理器可以进一步用于使用K近邻(KNN)技术确定多个合成样本;以及指定所述多个合成样品为负样本。
在一些实施例中,使用所述KNN技术确定所述多个合成样本,所述至少一个处理器可以用于基于所述负样本的所述一个或多个目标特征,为所述多个负样本中的每一个生成特征向量。为每个所述特征向量,所述至少一个处理器可以进一步用于使用所述KNN技术确定所述特征向量的近邻的第一数目;根据过采样率从最近邻居的所述第一数目中选择最近邻居的第二数目;以及基于所述特征向量和最近邻居的所述第二个数目生成关于所述特征向量的合成样本。
在一些实施例中,所述至少一个存储设备可以进一步包括第二组指令,所述第二组指令与用于分配订单的所述操作系统兼容。当所述至少一个处理器执行所述第二组指令时,所述至少一个处理器可以进一步用于从一个或多个请求者终端获得一个或多个目标订单,所述一个或多个请求者终端与一个或多个目标服务请求者相关联;识别可用于接收所述一个或多个订单的多个候选服务提供者;通过将所述一个或多个目标服务请求者中的每一个与所述多个候选服务提供者中的每一个相关联来确定候选请求者-提供者对;为每个所述候选请求者-提供者对,执行所述第一组指令确定所述目标事件的发生概率;以及至少部分地基于所述目标事件的所述发生概率和相应的候选请求者-提供者对分配一个或多个目标订单。
在一些实施例中,所述预测模型是极限梯度增强(Xgboost)模型。
在一些实施例中,所述目标事件包括以下事件中的至少一个:攻击,性骚扰,杀害,醉酒,强奸,或抢劫。
根据本申请的一个方面,提供了一种确定目标事件发生概率的方法。所述方法可以在一个或多个电子设备上实施,所述一个或多个电子设备包括至少一个存储设备和与所述至少一个存储装置通信的至少一个处理器所述方法可以包括提取与服务请求者关联的订单的目标订单特征;提取所述服务请求者的目标请求者特征;提取服务提供者的目标提供者特征;获得用于确定所述目标事件发生的概率的预测模型;以及基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
在一些实施例中,获得所述预测模型可以包括获得训练数据,所述训练数据包括多个正样本和多个负样本,所述多个正样本的每一个中所述目标事件没有发生,所述多个负样本的每一个目标事件已经发生,所述多个正样本和所述多个负样本中的每一个包括历史交易数据和对应于所述历史交易数据的历史事件数据;从所述多个正样本和所述多个负样本的所述历史交易数据中提取多个候选特征;对于所述多个正样本和所述多个负样本中的每一个,使用特征选择算法从所述多个候选特征中确定一个或多个目标特征;以及基于所述多个正样本的所述一个或多个目标特征,所述多个负样本的所述一个或多个目标特征,和所述多个正样本和所述多个负样本的所述历史事件数据生成所述预测模型。
在一些实施例中,获取所述预测模型可以进一步包括基于所述多个正样本和所述多个负样本判断出所述训练数据包括不平衡样本;以及当判断出所述训练数据包括所述不平衡样本时,基于所述训练数据,使用样本平衡技术平衡所述样本组成。
在一些实施例中,平衡所述样本组成进一步可以包括使用K近邻(KNN)技术确定多个合成样本;以及指定所述多个合成样品为负样本。
在一些实施例中,使用所述KNN技术确定所述多个合成样本可以包括基于所述负样本的所述一个或多个目标特征,为所述多个负样本中的每一个生成特征向量。在一些实施例中,为每个所述特征向量,使用所述KNN技术确定所述多个合成样本可以包括使用所述KNN技术确定所述特征向量的近邻的第一数目;根据过采样率从近邻的所述第一数目中选择近邻的第二数目;以及基于所述特征向量和近邻的所述第二个数目生成关于所述特征向量的合成样本。
在一些实施例中,所述方法可以进一步包括从一个或多个请求者终端获得一个或多个目标订单,所述一个或多个请求者终端与一个或多个目标服务请求者相关联;识别可用于接收所述一个或多个订单的多个候选服务提供者;通过将所述一个或多个目标服务请求者中的每一个与所述多个候选服务提供者中的每一个相关联来确定候选请求者-提供者对;为每个所述候选请求者-提供者对,确定所述目标事件的发生概率;以及至少部分地基于所述目标事件的所述发生概率和相应的候选请求者-提供者对分配一个或多个目标订单。
根据本申请的另一方面,提供了一种非暂时性计算机可读介质。所述非暂时性计算机可读介质可以包括操作系统和至少一组指令,所述至少一组指令与所述操作系统兼容,用于确定目标事件的发生概率。当一个或多个电子设备的至少一个处理器执行时,所述至少一组指令指示所述至少一个处理器提取与服务请求者关联的订单的目标订单特征;提取所述服务请求者的目标请求者特征;提取服务提供者的目标提供者特征;获得用于确定所述目标事件发生的概率的预测模型;以及基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
根据本申请的另一方面,提供了一种用于确定目标事件发生概率的一个或多个电子设备的人工智能系统。所述人工智能系统可以包括至少一个第一信息交换端口,所述至少一个第一信息交换端口对应于服务请求系统,其中所述服务请求系统经由无线通信与一个或多个请求者终端相关联,所述无线通信处于所述至少一个第一信息交换端口与一个或多个所述请求者终端之间。所述人工智能系统可以包括至少一个第二信息交换端口,所述至少一个第二信息交换端口对应于服务提供系统,其中所述服务提供系统经由无线通信与一个或多个提供者终端相关联,所述无线通信处于至少一个第二信息交换端口与所述一个或多个所述提供者终端之间。所述人工智能系统可以包括至少一个存储设备,所述存储设备包括操作系统和第一组指令,所述第一组指令与所述操作系统兼容,用于确定目标事件的发生概率。所述人工智能系统可以包括至少一个处理器,所述至少一个处理器与所述至少一个存储设备通信,其中当执行所述操作系统和所述第一组指令时,所述至少一个处理器可以进一步提取所述订单的目标订单特征;提取与所述订单相关联的所述服务请求者的目标请求者特征;识别与服务提供者相关联的提供者终端;提取所述服务提供者的目标提供者特征;获得用于确定所述目标事件发生的概率的预测模型;以及基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
根据本申请的一个方面,提供了一种确定目标事件发生概率的方法。所述方法可以在一个或多个电子设备上实施,所述一个或多个电子设备包括至少一个与一个或多个请求者终端通信的第一信息交换端口,至少一个与一个或多个提供者终端通信的第二信息交换端口,至少一个存储设备,和与所述至少一个存储设备通信的至少一个处理器。所述方法可以包括经由所述至少一个第一信息交换端口从请求者终端获得服务请求者的订单;提取所述订单的目标订单特征;提取与所述订单相关联的服务请求者的目标请求者特征;识别与服务提供者相关联的提供者终端;提取所述服务提供者的目标提供者特征;获得用于确定所述目标事件发生的概率的预测模型;以及基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
根据本申请的另一方面,提供了一种非暂时性计算机可读介质。所述非暂时性计算机可读介质可以包括操作系统和至少一组指令,所述至少一组指令与所述操作系统兼容,用于确定目标事件的发生概率。当一个或多个电子设备的至少一个处理器执行时,所述至少一组指令指示所述至少一个处理器经由至少一个信息交换端口从请求者终端获得服务请求者的订单;提取所述订单的目标订单特征;提取与所述订单相关联的所述服务请求者的目标请求者特征;识别与服务提供者相关联的提供者终端;提取所述服务提供者的目标提供者特征;获得用于确定所述目标事件发生的概率的预测模型;以及基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
根据本申请的一个方面,提供了一种用于分配订单的人工智能系统。所述人工智能系统可以包括事件预测模块和订单分配模块。所述事件预测模块可以被配置为确定订单的目标事件的发生概率。所述订单分配模块可以被配置为基于所述目标事件的所述发生概率分配所述订单。
在一些实施例中,所述事件预测模块可以包括订单特征提取单元、请求者特征提取单元、提供者特征提取单元、模型确定单元和事件预测单元。所述订单特征提取单元可以被配置为提取订单的目标订单特征。所述请求者特征提取单元可以被配置为提取与所述订单相关联的服务请求者的目标请求者特征。所述提供者特征提取单元可以被配置为提取服务提供者的目标提供者特征。所述模型确定单元可以被配置为获取用于确定所述目标事件发生概率的预测模型。所述事件预测单元可以被配置为基于所述目标订单特征,所述目标请求者特征,和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
一部分附加特征将在下面描述中进行说明,通过对以下描述和相应附图的检查或者对实施例的生产或操作的学习,一部分附加特性对于本领域技术人员是明显的。本申请的特征可以通过实践或使用以下实例中详细讨论的方法、手段及组合的各个方面来达成。
附图说明
本申请将结合示例性实施例进一步进行描述。这些示例性的实施例将结合参考附图进行详细描述附图未按比例绘制这些实施例是非限制性的示例性实施例,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本申请一些实施例所示的一种示例性人工智能系统的模块图;
图2是根据本申请一些实施例所示的一种示例性计算设备的示例性硬件和/或软件组件的示意图;
图3是根据本申请一些实施例所示的一种示例性移动设备的示意图;
图4A是根据本申请一些实施例所示的一种示例性处理设备的模块图;
图4B是根据本申请一些实施例所示的一种示例性事件预测模块的模块图;
图4C是根据本申请一些实施例所示的一种示例性模型确定单元的模块图;
图4D是根据本申请一些实施例所示的一种示例性订单分配模块的模块图;
图5是根据本申请一些实施例所示的一种使用预测模型来确定目标事件的发生概率的示例性过程的流程图;
图6是根据本申请一些实施例所示的一种用于生成预测模型的示例性过程的流程图;
图7是根据本申请一些实施例所示的一种用于生成平衡样本的示例性过程的流程图;
图8A是根据本申请一些实施例所示的一种用于生成合成样本的示例性过程的流程图;
图8B是根据本申请一些实施例所示的一种不平衡样本组成的示意图;以及
图9是根据本申请一些实施例所示的一种用于分配订单的示例性过程的流程图。
具体实施方式
以下描述是为了使本领域的普通技术人员能够实施本申请的技术方案,并在上下文中提供本申请中特定的应用及其要求。对于本领域的普通技术人员来说,显然可以对本申请披露的实施例作出各种修改,且在不背离本申请的精神和范围的情况下,本申请中所定义的一般原则可以适用于其他实施例和应用场景。因此,本申请并不限于所披露的实施例,而应被给予与申请专利范围一致的最宽的范围。
本文中所使用的术语仅用于描述特定示例性实施例,并不限制本申请的范围。除非上下文明确提示例外情形,本申请中使用的“一”、“一个”、“一种”和“该”等词并非特指单数,也可包括复数。一般说来,本申请的术语“包括”与“包含”指定所述特征、整体、步骤、操作、元素和/或组件的存在,而这些并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或其组合的存在或增加。
在考虑了作为本申请一部分的附图的描述内容后,本申请的这些和其它特征、特点以及操作方法、结构的相关元素的功能、各部分的组合、制造的经济性变得显而易见。然而,要明确理解的是,附图仅仅是为了说明和描述的目的,并不旨在限制本申请的范围。应当理解的是附图并不是按比例绘制的。
本申请中使用了流程图来说明根据本申请的实施例的系统所执行的操作。要明确理解的是,流程图的操作可以不按顺序执行。相反,可以按照倒序或同时处理各种步骤。此外,可以将一个或多个其他操作添加到流程图中。一个或多个操作也可以从流程图中删除。
此外,虽然本申请中披露的系统和方法主要关于线上到线下服务系统的分配订单,但是应当理解的是,这仅仅是一个示例性实施例。本申请的系统或方法可以应用于任何其他类型的线上到线下服务平台的用户。例如,本申请的系统和方法可以应用于不同的运输系统,包括陆地、海洋、航空航天等,或其任意组合。该运输系统中使用的交通工具包括出租车、私家车、顺风车、巴士、火车、子弹头列车、高速铁路、地铁、船舶、飞机、宇宙飞船、热气球、无人驾驶车辆等,或其任意组合。该运输系统也包括应用管理和/或分配的任何运输系统,例如,发送和/或接收快递的系统。本申请的系统和方法的应用场景包括网页、浏览器插件、客户端、定制系统、企业内部分析系统、人工智能机器人等,或其任意组合。
本申请中的位置(例如,服务请求者的当前位置,服务提供者的当前位置)可以通过嵌入在无线设备(例如,请求者终端,提供者终端等)中的定位技术来获取。本申请中使用的定位技术包括全球定位系统(GPS)、全球卫星导航系统(GLONASS)、北斗导航系统(COMPASS)、伽利略定位系统、准天顶卫星系统(QZSS)、无线保真(Wi-Fi)定位技术等,或其任意组合。以上定位技术中的一个或多个可以在本申请中互换使用。例如,基于GPS的方法和基于WiFi的方法可以一起作为定位无线设备的定位技术。
本申请一方面涉及确定目标事件的发生概率(在本文中也被称为目标事件发生概率)的系统和方法,该目标事件在服务提供者服务与订单相关的服务请求者时发生。为此,系统提取订单的目标订单特征,服务请求者的目标请求者特征和服务提供者的目标提供者特征。然后系统获得用于确定目标事件发生概率的预测模型。使用训练数据训练预测模型。训练数据包括多个正样本和多个负样本。在一些实施例中,正样本和负样本不平衡。系统使用样本平衡技术确定平衡样本。最后,系统使用基于目标订单特征,目标请求者特征和/或目标提供者特征的预测模型确定目标事件发生概率。因为用于训练预测模型的样本是平衡的,所以系统可以使用预测模型提高预测目标事件发生概率的准确度。系统也可以基于如此确定的目标事件发生概率获得多个订单并分配订单。由于在分配订单时考虑了目标事件发生概率,所以系统能够降低目标事件发生的可能性,由此改善服务请求者和/或服务提供者的服务质量和/或体验。
应该注意的是,线上到线下服务,如在线打车服务,是一种根植于后互联网时代的新型服务形式。它提供了只能在后互联网时代兴起的用户终端的详细信息。它为服务请求者和服务提供者提供了只能在后互联网时代才可能实现的技术方案。在互联网之前的时代,当服务请求者(例如,乘客)在街道上打车时,出租车请求和接受仅发生在乘客和看到乘客的出租车司机之间。如果乘客通过电话预定一辆出租车,出租车预定请求和接受只可能在该乘客和一个服务提供者(如:一个出租车公司或代理商)之间发生。然而,在线打车允许该服务的用户实时并自动地将服务请求分配给远离该用户的大量个体服务提供者(例如出租车)。同时允许多个服务提供者同时和实时对该服务请求进行响应。因此,通过互联网,线上到线下服务系统为服务请求者和服务提供者提供更加高效的交易平台,这在传统的互联网前的运输服务系统中可能永远不会遇到。系统接收到来自服务请求者的订单,当不同的服务提供者为服务请求者提供服务时,系统确定目标事件发生概率。然后,基于目标事件发生概率,系统选择合适的服务提供者来为服务请求者服务,以使订单分配更合理。
图1是根据本申请一些实施例所示的一种示例性线上到线下服务人工智能系统的模块图。例如,线上到线下服务人工智能系统(本文也称为人工智能系统或AI系统)100是用于提供运输服务的在线运输服务平台,所述运输服务例如出租车服务、司机服务、快车服务、拼车服务、巴士服务、司机租用和班车服务。人工智能系统100包括服务器110、网络120、请求者终端130、提供者终端140和存储设备150。该服务器110包括处理设备112。
在一些实施例中,服务器110是单一服务器或服务器组。所述服务器组是集中式的或分布式的(例如,服务器110可以是分布式的系统)。在一些实施例中,服务器110是本地的或远程的。例如,服务器110通过网络120访问储存在请求者终端130、提供者终端140和/或存储设备150内的信息和/或数据。又例如,服务器110与请求者终端130、提供者终端140和/或存储设备150直接连接,并且访问储存在其中的信息和/或数据。在一些实施例中,服务器110在云平台上实施。仅作为范例,云平台包括私有云、公用云、混合云、社区云、分布式云、内部云、多重云等,或其任意组合。在一些实施例中,服务器110可以在如本申请中图2所示的,具有一个或多个部件的计算装置上实现。
在一些实施例中,服务器110包括处理设备112。该处理设备112处理与服务请求相关的信息及/或数据,以执行本申请中描述的服务器110的一个或多个功能。例如,处理设备112确定服务提供者服务于服务请求者时的目标事件的发生概率。目标事件包括恶性事件,例如攻击,性骚扰,杀害,醉酒,强奸,抢劫等。又例如,处理设备112还训练用于确定目标事件发生概率的预测模型。再例如,处理设备112还至少部分地基于目标事件的发生概率来分配一个或多个订单。
在一些实施例中,处理设备112包括一个或者多个处理设备(例如,单芯片处理设备或多芯片处理设备)。仅作为范例,处理设备112包括中央处理单元(CPU)、特定应用集成电路(ASIC)、特定应用指令集处理器(ASIP)、图形处理单元(GPU)、物理处理单元(PPU)、数字信号处理器(DSP)、现场可程序门阵列(FPGA)、可程序逻辑装置(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等,或其任意组合。
网络120促进信息和/或数据的交换。在一些实施例中,人工智能系统100中的一个或多个组件(例如,服务器110,请求者终端130,提供者终端140和/或存储设备150)经由网络120将信息和/或数据传输到人工智能系统100中的其他组件。例如,服务器110经由网络120从请求者终端130获得/取得服务请求数据。在一些实施例中,网络120为任意形式的有线或无线网络,或其任意组合。仅作为范例,网络120包括电缆网络、有线网络、光纤网络、通信网络、内部网络、互联网、局域网络(LAN)、广域网路(WAN)、无线局域网络(WLAN)、城域网(MAN)、广域网(WAN)、公共电话交换网络(PSTN)、蓝牙网络、无线个域网、近场通讯(NFC)网络、全球移动通讯系统(GSM)网络、码分多址(CDMA)网络、时分多址(TDMA)网络、通用分组无线服务(GPRS)网络、增强数据速率GSM演进(EDGE)网络、宽带码分多址(WCDMA)网络、高速下行分组接入(HSDPA)网络、长期演进(LTE)网络、用户数据报协议(UDP)网络、传输控制协议/互联网协议(TCP/IP)网络、短讯息服务(SMS)网络、无线应用协议(WAP)网络、超宽带(UWB)网络、红外线等,或其任意组合。在一些实施例中,服务器110包括一个或多个网络接入点。例如,服务器110包括有线或无线网络接入点,例如基站和/或互联网交换点120-1、120-2、……,通过人工智能系统100的一个或多个组件连接到网络120以交换数据和/或信息。
请求者终端130可以被乘客用来请求线上到线下服务。例如,请求者终端130的用户使用请求者终端130为自己或其他用户发送服务请求,或从服务器110接收服务和/或信息或指令。提供者终端140被驾驶员用来回复线上到线下服务。例如,提供者终端140的用户使用提供者终端140接收来自请求者终端130的服务请求,和/或来自服务器110的信息或指令。在一些实施例中,术语“用户”、“乘客”、“客户”、“服务请求方”和“服务请求者”可以互换使用,并且术语“用户”、“司机”和“服务提供者”可以互换使用。在一些实施例中,用户根据具体情况指服务请求者或服务提供者。在一些实施例中,术语“用户终端”、“乘客终端”,“请求者终端”和“请求方终端”可以互换使用。在一些实施例中,术语“用户终端”、“司机终端”和“提供者终端”可以互换使用。
在一些实施例中,请求者终端130包括移动设备130-1、平板电脑130-2、膝上计算机130-3、机动车辆中的内置设备130-4等,或其任意组合。在一些实施例中,移动设备130-1包括智能家居设备,可穿戴设备,智能移动设备,虚拟现实设备,增强现实设备等,或其任意组合。在一些实施例中,智能家居设备包括智能照明设备、智能电器的控制设备、智能监控设备、智能电视、智能摄像机、对讲机等,或其任意组合。在一些实施例中,可穿戴设备包括智能手镯、智能鞋袜、智能眼镜、智能头盔、智能手表、智能服装、智能背包、智能配饰等,或其任意组合。在一些实施例中,智能移动设备包括智能电话、个人数字助理(PDA)、游戏设备、导航设备、销售点(POS)设备等,或其任意组合。在一些实施例中,虚拟现实设备和/或增强现实设备包括虚拟现实头盔、虚拟现实眼镜、虚拟现实眼罩、增强现实头盔、增强现实眼镜、增强现实眼罩等,或其任意组合。例如,虚拟现实设备和/或增强现实设备包括GoogleGlass、Oculus Rift、HoloLens或Gear VR等。在一些实施例中,机动车辆中的内置设备130-4包括车载计算机、车载电视等。在一些实施例中,请求者终端130是带有定位技术的无线设备,该定位技术用于定位用户和/或请求者终端130的位置。
在一些实施例中,请求者终端130进一步包括至少一个网络端口。经由该至少一个网络端口,请求者终端130被配置为经由网络120向人工智能系统100(例如,服务器110,存储设备150)中的一个或多个组件发送信息和/或从其接收信息。在一些实施例中,本申请中请求者终端130在如图2所示的具有一个或多个组件的计算设备200上实施,或者在如图3所示的具有一个或多个组件的移动设备300上实施。
在一些实施例中,请求者终端130可以包括一移动装置130-1、平板计算机130-2、膝上型计算机130-3、内建装置130-4等或其任意组合。在一些实施例中,移动设备140-1包括智能家居设备,可穿戴设备,智能移动设备,虚拟现实设备,增强现实设备等,或其任意组合。在一些实施例中,提供者终端140是与请求者终端130相似,或相同的设备。在一些实施例中,提供者终端140是具有定位技术的无线设备,该定位技术可以用来定位司机和/或提供者终端140位置。在一些实施例中,请求者终端130和/或提供者终端140与其他定位装置通讯来确定乘客、请求者终端130、司机、和/或提供者终端140的位置。在一些实施例中,请求者终端130和/或提供者终端140向服务器110传送定位信息。
在一些实施例中,提供者终端140进一步包括至少一个网络端口。经由至少一个网络端口,提供者终端140被配置为经由网络120向人工智能系统100(例如,服务器110,存储设备150)中的一个或多个组件发送信息和/或从其接收信息。在一些实施例中,本申请中提供者终端140在具有如图2所示的一个或多个组件的计算设备200上实施,或者在具有如图3所示的一个或多个组件的移动设备300上实施。
存储设备150存储数据和/或指令。在一些实施例中,存储设备150存储从请求者终端130和/或提供者终端140获得/取得的数据。在一些实施例中,储存器140储存数据和/或指令,服务器110使用这些数据或者执行这些指定来实施本申请中描述的示例性方法。在一些实施例中,储存设备150包括大容量储存设备、可移动储存设备、易失性读写存储器、只读存储器(ROM)等,或其任意组合。示例性大容量存储设备包括磁盘,光盘,固态驱动器等。示例性可移动存储设备包括闪存驱动器,软盘,光盘,存储卡,压缩盘,磁带等。示例性的易失性读写存储器包括随机访问存储器(RAM)。示例性的随机储存器包括动态随机储存器(DRAM)、双倍速率同步动态随机储存器(DDRSDRAM)、静态随机储存器(SRAM)、闸流体随机储存器(T-RAM)和零电容储存器(Z-RAM)等。示例性的只读存储器包括掩蔽型只读存储器(MROM)、可以程序只读存储器(PROM)、可以清除可以程序只读存储器(EPROM)、电子可以抹除可以程序只读存储器(EEPROM)、压缩盘只读存储器(CD-ROM)和数字通用磁盘只读存储器等。在一些实施例中,储存设备150可以在云平台上实施。仅作为范例,云平台包括私有云、公用云、混合云、社区云、分布式云、内部云、多重云等,或其任意组合。
在一些实施例中,存储设备150包括至少一个网络端口以与人工智能系统100中的其他设备或组件进行通信。例如,存储设备150经由至少一个网络端口连接到网络120以与人工智能系统100中的一个或多个组件(例如,服务器110,请求者终端130,提供者终端140等)通信。人工智能系统100中的一个或多个组件经由网络120访问存储在存储设备150中的数据或指令。在一些实施例中,存储设备150直接与按需服务系统100(例如服务器110,请求者终端130,提供者终端140等)中的一个或多个组件连接或通信。在一些实施例中,存储设备150是服务器110的一部分。
在一些实施例中,人工智能系统100中的一个或多个组件(例如,服务器110,请求者终端130,提供者终端140等)具有访问存储设备150的许可。在一些实施例中,当满足一个或多个条件时,人工智能系统100中的一个或多个组件读取和/或修改与乘客、司机和/或公众相关的信息。例如,服务器110在完成或接收一服务之后读取和/或修改一个或多个用户的信息。又例如,当提供者终端140从请求者终端130接收到服务请求时,提供者终端140可以访问与乘客相关的信息,但是不能修改乘客的相关信息。
在一些实施例中,线上到线下服务人工智能系统100(例如,服务器110,请求者终端130,提供者终端140或存储设备150)中的一个或多个组件可以以电子和/或电磁信号的形式,通过有线和/或无线彼此通信。在一些实施例中,人工智能系统100进一步包括至少一个对应于服务请求系统的第一信息交换端口和至少一个对应于服务提供系统的第二信息交换端口。服务请求系统包括请求者终端130和网络120。服务提供系统包括提供者终端140和网络120。经由至少一个第一信息交换端口,与服务请求(例如,以电子信号和/或电磁信号的形式)相关的信息在人工智能系统100中的任何电子设备之间交换。例如,经由至少一个第一信息交换端口,服务器110通过服务器110和提供者终端130之间的无线通信从请求者终端130接收命令。通过至少一个第二信息交换端口信息(例如,以电子信号和/或电磁信号的形式)在人工智能系统100中的任何电子设备之间交换。例如,经由至少一个第二信息交换端口,服务器110通过无线通信将电磁信号发送给提供者终端140,该电磁信号包括分配的订单的信息。在一些实施例中,至少一个第一信息交换端口和/或至少一个第二信息交换端口是天线,网络接口,网络端口等,或其任意组合中的一个或多个。例如,至少一个第一信息交换端口和/或至少一个第二信息交换端口是网络端口,该网络端口连接到服务器110以发送和/或接收信息。
在一些实施例中,人工智能系统100中的一个或多个组件的数据交换可以通过请求服务来实现。服务请求的对象为任何产品。在一些实施例中,所述产品是有形产品,无形产品,服务等。有形产品包括食品,医药,商品,化学产品,电器,服装,汽车,住房,奢侈品等,或其任意组合。无形产品包括金融产品,知识产品,互联网产品等,或其任意组合。互联网产品包括个人主机产品,网络产品,移动互联网产品,商业主机产品,嵌入式产品等,或其任意组合。移动互联网产品被用于移动终端的软件、程序、系统等,或其任意组合。移动终端包括平板电脑,膝上计算机,移动电话,个人数字助理(PDA),智能手表,POS设备,车载计算机,车载电视,可穿戴设备等,或其任意组合。例如,所述产品可以是在计算机或移动电话上使用的任一软件和/或应用。所述软件和/或应用与社交、购物、运输、娱乐、学习、投资等或其任意组合相关。在一些实施例中,与运输相关的软件和/或应用包括旅行软件和/或应用,车辆调度软件和/或应用,地图软件和/或应用等。在车辆调度软件和/或应用中,车辆包括马车,人力车(如独轮车,自行车,三轮车等),汽车(如出租车,巴士,私家车等),火车,地铁,船只,航空器(例如飞机,直升机,航天飞机,火箭,热气球等)等,或其任意组合。
本领域普通技术人员将理解,当人工智能系统100的组件执行功能时,该组件通过电信号和/或电磁信号执行。例如,当请求者终端130处理例如发送服务请求的任务时,请求者终端130在其处理器中操作逻辑电路来执行这样的任务。当请求者终端130将服务请求发送到服务器110时,服务器110的处理器可以生成编码该服务请求的电信号。然后,服务器110的处理器将电信号传输到与服务器110相关的第一目标系统(例如,服务请求系统)的至少一个第一信息交换端口。服务器110经由有线网络与服务请求系统通信,至少一个第一信息交换端口物理连接到电缆,该电缆进一步将电信号传输到请求者终端130的输入端口(例如信息交换端口)。如果服务器110经由无线网络与服务请求系统通信,则服务请求系统的至少一个第一信息交换端口是一个或多个天线,该天线将电信号转换为电磁信号。类似地,提供者终端140通过其处理器中的逻辑电路的操作来处理任务,并且以电信号或电磁信号的形式从服务器110接收指令和/或服务请求。服务器110的处理器生成用于编码分配订单信息的电信号,并将电信号传输到与服务器110相关联的第二目标系统(例如,服务提供系统)的至少一个第二信息交换端口。服务器110经由有线网络与服务提供系统通信,至少一个第二信息交换端口物理连接到电缆,该电缆进一步将电信号传输到提供者终端140的输入端口(例如信息交换端口)。如果服务器110经由无线网络与服务提供系统通信,则服务提供系统的至少一个第二信息交换端口是一个或多个天线,该天线将电信号转换为电磁信号。在例如请求者终端130、提供者终端140和/或服务器110的电子设备中,当该电子设备的处理器处理指令时,处理器发送指令和/或执行动作,该指令和/或动作经由电信号传导。例如,当处理器从存储介质中取回数据或将数据保存在存储介质中时,该处理器将电信号传输到存储介质的读取/写入设备,所述设备可以读取和/或写入存储介质中的结构化数据。结构化数据以电信号的形式经由电子设备的总线被传输至处理器。此处,电信号指一个电信号、一系列电信号和/或多个不连续的电信号。
图2是根据本申请一些实施例所示的一种计算设备的示例性硬件和软件组件的示意图,该计算设备可以实施所述服务器110、请求者终端130和/或提供者终端140相应的功能。例如,处理设备112在计算设备200上实施,并被配置为执行本申请中所披露的处理设备112的功能。
计算设备200用于实施本申请的线上到线下系统。计算设备200实施本申请所述的线上到线下服务的任何部件。在图2中,为方便起见只绘制了一台计算机设备。本领域的一位普通技术人员在提交本申请时将理解,与本申请所描述的线上到线下服务相关的计算机功能以分布式在多个类似平台上实施,以分散处理负载。
例如,计算设备200包括与网络相连接并促进数据传输的通讯(COM)端口250。计算设备200还包括用于执行程序指令的一个或多个处理器形式的处理器(例如,处理器220)。例如,处理器包括其中的接口电路和处理电路。接口电路被配置为从总线210接收电子信号,其中电子信号对用于处理电路处理的结构数据和/或指令进行编码。处理电路执行逻辑计算,然后判断结论、结果和/或被编码为电子信号的指令。示例性的计算机平台包括内部通讯总线210、不同形式的程序存储器和数据存储器,例如,磁盘270、和只读存储器(ROM)230或随机访问存储器(RAM)240,用于存储由计算机处理和/或传输的各种各样的数据文件。示例性的计算机平台也包括储存于ROM 230、RAM 240和/或其他形式的非暂时性存储介质中的能够被处理器220执行的程序指令。本申请披露的方法和/或过程可以作为程序指令来实施。计算设备200还包括输入/输出组件260,用来支持计算机和其他组件之间进行输入/输出。计算设备200也通过网络通信接收程序编制和数据
仅为了说明,计算装置200中仅绘制了一个处理器。然而,应该注意的是,本申请中的计算设备200还包括多个处理器,因此,如本申请中描述的由一个处理器220执行的操作和/或方法步骤也可以由多个处理器共同或分别执行。例如,在本申请中,如果计算设备200的处理器220执行步骤A和步骤B,应当被理解为是步骤A和步骤B由计算设备200的两个不同的处理器共同或分别执行(例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B)。
图3是根据本申请一些实施例所示的一种可以实施请求者终端130和/或提供者终端140的示例性设备的示例性硬件和/或软件组件的示意图。该设备可以是移动设备,例如乘客或司机的移动电话。该设备也可以是安装在由司机驾驶的车辆上的电子设备。如图3所示,设备300包括通信平台310,显示器320,图形处理单元(GPU)330,中央处理单元(CPU)340,输入/输出设备350,内存360和存储设备390。CPU包括与处理器220类似的接口电路和处理电路。在一些实施例中,任何其他合适的组件,包括但不限于系统总线或控制器(未标示),也可包括于设备300内。在一些实施例中,移动操作系统370(如,iOS系统,Android系统,Windows系统,Phone系统等)和一个或多个应用程序380可以从存储设备390加载到内存360中,以便由CPU 340执行。应用程序380包括浏览器或任何其他合适的移动应用程序,用于接收及呈现与线上到线下服务相关的信息或来自服务器110的其他信息,并将这些信息发送到服务器110。用户交互信息流经由输入/输出设备350获取,并经由网络120提供给服务器110和/或线上人工智能系统100的其他组件。
为了实施不同的模块、单元以及在之前的披露中所描述的他们的功能,计算机硬件平台被用作本申请描述的一个或多个元素的硬件平台(例如:线上人工智能系统100,和/或图1-9中描述的人工智能系统100其他组件)。这些计算机的硬件元素、操作系统和程序语言是常见的,可以假定本领域技术人员对这些技术都足够熟悉,能够利用这些技术像本申请描述的那样分配订单。带有用户界面元素的计算机可以用作个人计算机(PC)或其他类型的工作站或终端设备。经过正确编程后也可以用作服务器。可以相信本领域技术人员熟悉这些计算机设备的结构,编程和一般操作,因此图纸应该是不言自明的。
图4A是根据本申请一些实施例所示的一种示例性处理设备的模块图。在一些实施例中,处理设备112包括事件预测模块410和/或订单分配模块420。事件预测模块410通过将一个服务请求者与一个服务提供者相关联来确定请求者-提供者对。事件预测模块410预测服务提供者服务于服务请求者时的目标事件的发生概率。目标事件的发生概率(这里也被称为目标事件发生概率)反映当服务提供者服务于服务请求者时目标事件发生的可能性。目标事件包括恶性事件,例如攻击,性骚扰,杀害,醉酒,强奸,抢劫等。
订单分配模块420至少部分地基于与订单相关的目标事件的发生概率来分配订单。在一些实施例中,订单分配模块420进一步基于其他因素来分配目标订单,所述其他因素包括例如服务提供者的位置与目标订单的开始位置之间的距离,从服务提供者移动到目标订单的起始位置所需时间,交通信息,提供者特征(例如,服务提供者的服务类型,服务提供者的车辆类型,服务提供者的服务得分等),服务提供者的需求(例如,服务请求者的性别,服务提供者偏好或接受的订单的目的地等),服务请求者的需求(例如服务提供者的性别)等。在一些实施例中,订单分配模块420对发生概率和此类其他因素分配权重以确定如何分配目标订单。在一些实施例中,对于相同的目标订单,分配给目标事故发生概率的权重和分配给一个或多个此类其他因素的权重可以相同或不同的。在一些实施例中,分配给与目标订单相关的目标事件发生概率的权重大于分配给一个或多个此类其他因素的权重。在一些实施例中,对于不同的目标订单,分配给与目标订单相关的目标事件发生概率的权重可以相同或不同的。
处理设备112中的模块经由有线连接或无线连接以互相连接或互相通讯。有线连接包括金属电缆、光缆、混合电缆等,或其任意组合。无线连接包括局域网(LAN)、广域网(WAN),蓝牙,无线个域网,近场通讯(NFC)等,或其任意组合。在一些实施例中,处理设备112还包括其他模块。在一些实施例中,事件预测模块410和订单分配模块420在服务器110中的不同处理器上实施。在一些实施例中,事件预测模块410和订单分配模块420在服务器110中的单个处理器上实施。
图4B是根据本申请一些实施例所示的一种示例性事件预测模块的模块图。事件预测模块410包括订单特征提取单元411,请求者特征提取单元412,提供者特征提取单元413,模型确定单元414和/或事件预测单元415。
订单特征提取单元411提取订单的特征。在一些实施例中,订单特征提取单元411提取订单的目标订单特征。目标订单特征被视为与订单的目标事件发生概率的预测高度相关。订单特征提取单元411从与订单相关的信息中提取目标订单特征。与订单相关的信息包括订单的起始位置,订单的目的地,从起始位置到目的地的路线,沿着该路线的邻近区域,订单的开始时间,订单到达的估计时间,订单的类型,与订单相关的服务类型等,或其任意组合。订单的类型包括实时订单或未来时间的服务预订(或在此称为预订)。服务类型包括出租车服务,快车服务,特殊(例如,无障碍轮椅,配备汽车座椅,一定容量等)的汽车服务等,或其任意组合。
请求者特征提取单元412提取与服务请求者有关的特征。在一些实施例中,请求者特征提取单元412提取服务请求者的目标请求者特征。请求者特征提取单元412从与服务请求者有关的信息中提取目标请求者特征。与服务请求者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,服务请求者的电话品牌,职业,简历图像,文档编号(例如,身份证号码等),第三方账户(例如电子邮件账户),习惯/偏好,服务请求者经常访问的位置(例如,酒店,宾馆,酒吧,卡拉OK(KTV)俱乐部等),被放置并随后被服务请求者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务提供者被投诉数量和/或频率,犯罪记录,服务请求者在论坛,博客或社交网络上发布的信息或与服务请求者有关的信息等,或其任意组合。
提供者特征提取单元413提取与服务提供者有关的特征。在一些实施例中,提供者特征提取单元413提取服务提供者的目标提供者特征。提供者特征提取单元413从与服务提供者有关的信息中提取目标提供者特征。与服务提供者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,服务提供者的电话品牌,职业,电子邮件地址,简历图像,文档编号(例如,司机的驾驶证号码,身份证号码等),第三方账户(例如电子邮件账户),车辆类型,车龄,牌照,人工智能系统100中的认证状态,驾驶经验,背书,习惯/偏好,服务提供者经常访问的位置(例如,酒店,宾馆,酒吧,KTV俱乐部等),被接受并随后被服务提供者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务请求者被投诉数量和/或频率,犯罪记录,评分,服务提供者在论坛,博客或社交网络上发布的信息或与服务提供者有关的信息等,或其任意组合。
模型确定单元414确定用于确定目标事件发生的概率的预测模型。在一些实施例中,模型确定单元414还从人工智能系统100的存储设备(例如,存储设备150,ROM 230,RAM240)中获得预测模型。模型确定单元414使用一个或多个机器学习算法来训练预测模型。机器学习算法包括神经网络算法,回归算法,决策树算法,深度学习算法等,或其任意组合。仅作为范例,预测模型是极限梯度增强(Xgboost)模型。
事件预测单元415使用预测模型基于目标订单特征,目标请求者特征和/或目标提供者特征确定目标事件的发生概率。
事件预测模块410的单元经由有线连接或无线连接而彼此连接或通信。有线连接包括金属电缆、光缆、混合电缆等,或其任意组合。无线连接包括局域网(LAN)、广域网(WAN),蓝牙,无线个域网,近场通讯(NFC)等,或其任意组合。事件预测模块410中的两个或更多个单元可以被组合成单个单元,且任何一个单元可以被划分成两个或更多个子单元。例如,可以将订单特征提取单元411,请求者特征提取单元412和/或提供者特征提取单元413集成到单个单元中以提取与订单,服务请求者,和/或服务提供者相关的特征(例如目标订单特征,目标请求者特征,目标提供者特征)。在一些实施例中,事件预测模块410还包括其他单元。例如,事件预测模块410包括通信单元以与人工智能系统100的其他模块或单元进行通信,例如,请求者终端130,提供者终端140,存储器140等。
图4C是根据本申请一些实施例所示的一种示例性模型确定单元的模块图。在一些实施例中,模型确定单元414包括训练数据获取子单元414-1,特征提取单元子单元414-2,特征选择子单元414-3,模型确定子单元414-4,和/或样本平衡子单元414-5。
训练数据获取子单元414-1从服务器110中的存储设备150或其他存储设备或人工智能系统100外部的存储设备中获取训练数据。训练数据是与线上到线下服务平台上发生的多个历史交易有关的历史数据。多个历史交易中的每一个与由服务请求者发起并被服务提供者接受的历史订单有关。因此,每个历史交易的有关信息与历史订单,服务请求者和相应的服务提供者有关。训练数据还包括对应于多个历史交易中的每一个的历史事件数据。历史事件数据包括事件是否发生,事件的类型(在本申请中被称为事件类型),事件的严重程度(在本申请中被称为事件程度)等,或者其任意组合。事件类型包括攻击,性骚扰,杀害,醉酒,强奸,抢劫等。事件程度包括非常严重,严重,正常,轻微,非常轻微等。训练数据包括多个正样本和多个负样本。正样本指未发生目标事件的样本。负样本指发生目标事件的样本。
特征提取子单元414-2从训练数据中提取多个候选特征。候选特征包括候选订单特征,候选请求者特征和候选提供者特征。特征提取子单元414-2从与历史订单相关的信息中提取候选订单特征。特征提取子单元414-2从服务请求者相关的信息中提取候选请求者特征,该服务请求者与历史订单相关。特征提取子单元414-2从服务提供者有关的信息中提取候选提供者特征,该服务提供者在历史订单中响应,接受和/或提供服务。
特征选择子单元414-3使用特征选择算法从多个候选特征中确定一个或多个目标特征。特征选择算法包括前向特征选择,后向特征消除,递归特征消除等。通过使用特征选择算法添加或者移除特征来确定目标特征,特征选择子单元414-3确定预测模型的精确率,召回率和/或准确率。
模型确定子单元414-4从特征选择子单元414-3获得多个正样本的一个或多个目标特征和多个负样本的一个或多个目标特征。模型确定子单元414-4从训练数据获取子单元414-1获得多个正样本和多个负样本的历史事件数据。模型确定子单元414-4基于多个正样本的一个或多个目标特征,多个负样本的一个或多个目标特征和/或多个正样本和多个负样本的历史事件数据生成预测模型。例如,模型确定子单元414-4将正样本的一个或多个目标特征和多个负样本的一个或多个目标特征输入预测模型(在本申请中也被称为初始预测模型)并且生成与目标特征相对应的预测结果,然后模型确定子单元414-4基于具有多个正样本和多个负样本的历史事件数据的预测结果来生成损失函数。然后,模型确定子单元414-4确定损失函数是否满足条件。在一些实施例中,该条件可以是损失函数是否小于预设阈值。当损失函数小于预设阈值时,模型确定子单元414-4将初始预测模型指定为预测模型,即预测模型训练良好。当损失函数大于预设阈值时,模型确定子单元414-4修改初始预测模型并使用训练数据或获得不同的训练数据来生成更新的预测模型,直到更新的预测模型满足条件。在一些实施例中,当损失函数等于预设阈值时,模型确定子单元414-4认为满足条件并将初始预测模型指定为预测模型。在一些实施例中,当损失函数等于预设阈值时,模型确定子单元414-4认为条件不满足,并继续训练预测模型生成更新的预测模型,直到更新的预测模型满足条件。在一些实施例中,本申请基于参数和阈值的值将参数与阈值进行比较并作出判断(当参数大于/高于/多于阈值时,确定决策A;当参数小于/低于/少于阈值时,确定决策B,决策B不同于决策A),参数等于阈值的情况被分类为上述两种情况中的任何一种。
样本平衡子单元414-5确定训练数据是否包括不平衡样本组成。例如,样本平衡子单元414-5获得正样本的计数和负样本的计数。样本平衡子单元414-5生成正样本计数与负样本计数之间的比率(在本申请中也被称为样本比率)。样本平衡子单元414-5确定样本比率是否超过比率阈值。当样本平衡子单元414-5确定样本比率超过比率阈值时,样本平衡子单元414-5确定训练数据包括不平衡样本(或者在本申请中称为不平衡样本组成)。在一些实施例中,样本平衡子单元414-5使用样本平衡技术基于训练数据来平衡样本组成。
模型确定单元414的子单元经由有线连接或无线连接彼此连接或通信。有线连接包括金属电缆、光缆、混合电缆等,或其任意组合。无线连接包括局域网(LAN)、广域网(WAN),蓝牙,无线个域网,近场通讯(NFC)等,或其任意组合。模型确定单元414中的两个或更多个子单元可以被组合成单个子单元,并且任何一个子单元可以被分成两个或更多个组件。例如,特征提取子单元414-2被划分为三个组件,例如,订单特征提取组件,请求者特征提取组件,提供者特征提取组件。订单特征提取组件从与历史订单有关的信息中提取候选订单特征。请求者特征提取组件从与历史订单对应的服务请求者的有关信息中提取候选请求者特征。提供者特征提取组件从与历史订单对应的服务提供者的有关信息中提取候选提供者特征。在一些实施例中,特征提取子单元414-2和特征选择子单元414-3可以被集成到单个单元中。在一些实施例中,特征提取子单元414-2,订单特征提取单元411,请求者特征提取单元412,和/或提供者特征提取单元413可以被集成到单个单元中以提取与订单,服务请求者,和/或服务提供者有关的特征。
图4D是根据本申请一些实施例所示的一种示例性订单分配模块的模块图。在一些实施例中,订单分配模块420包括订单信息获取单元421,请求者信息获取单元422,提供者信息获取单元423,请求者-提供者对确定单元424和/或订单分配单元425。
定单信息获取单元421从一个或多个服务请求者终端130获得与要分配的一个或多个目标定单有关的信息。与每个目标订单有关的信息包括目标订单的起始位置,目标订单的目的地,从目标订单的起始位置到目的地的路线,沿着目标订单的路线的邻近区域,目标订单的开始时间,目标订单的估计到达时间,目标订单的类型,与目标订单相关的服务类型等,或其任意组合。订单的类型包括实时订单或未来时间的服务预订。服务类型包括出租车服务,快车服务,特殊(例如,无障碍轮椅,配备汽车座椅,一定容量等)的汽车服务等,或其任意组合。
请求者信息获得单元422获得与一个或多个目标订单相关联的服务请求者的有关信息。例如,请求者信息获取单元422还可以从存储设备150,服务器110中的另一存储设备或系统100外部的存储设备获得与服务请求者有关的信息。与服务请求者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,服务请求者的电话品牌,职业,简历图像,文档编号(例如,身份证号码等),第三方账户(例如电子邮件账户),习惯/偏好,服务请求者经常访问的位置(例如,酒店,宾馆,酒吧,卡拉OK(KTV)俱乐部等),被放置并随后被服务请求者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务提供者被投诉数量和/或频率,犯罪记录,服务请求者在论坛,博客或社交网络上发布的信息或与服务请求者有关的信息等,或其任意组合。
提供者信息获取单元423识别可用于接受一个或多个目标订单的多个候选服务提供者。提供者信息获取单元423还可以获得与多个候选服务提供者有关的信息。在一些实施例中,提供者信息获取单元422从存储设备150或服务器110中的其他存储设备获得与多个候选服务提供者有关的信息。与候选服务提供者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,候选服务提供者的电话品牌,职业,电子邮件地址,简历图像,文档编号(例如,司机的驾驶证号码,身份证号码等),第三方账户(例如电子邮件账户),车辆类型,车龄,牌照,人工智能系统100中的认证状态,驾驶经验,背书,习惯/偏好,服务提供者经常访问的位置(例如,酒店,宾馆,酒吧,KTV俱乐部等),被接受并随后被服务提供者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务请求者被投诉数量和/或频率,犯罪记录,评分,服务提供者在论坛,博客或社交网络上发布的信息或与候选服务提供者有关的信息等,或其任意组合。
在一些实施例中,订单分配模块420还包括请求者-提供者对确定单元424。订单分配模块420通过将一个或多个目标服务请求者中的每一个与多个候选服务提供者中的每一个相关联来确定候选请求者-提供者对。应该注意的是,请求者-提供者对确定单元424也可以在事件预测模块410或处理设备112的其他组件上实施。订单分配单元425从事件预测模块410获得与候选请求者-提供者对相关的目标事件发生概率。订单分配单元425至少部分地基于目标事件发生概率和相应的候选请求者-提供者者对来分配目标订单。在一些实施例中,订单分配单元425根据其他因素来确定是否向服务提供者分配目标订单,所述其他因素包括,例如,服务提供者的位置和目标订单的开始位置之间的距离,从服务提供者的位置移动到目标订单的开始位置所需时间,交通信息,提供者特征(例如,服务提供者的服务类型,服务提供者的车辆类型,服务提供者的服务得分等),服务提供者的需求(例如,服务请求者的性别,服务提供者优选或接受的订单的目的地等),服务请求者的需求(例如,服务提供者的性别)等。在一些实施例中,订单分配单元425为目标事件发生概率以及一个或多个此类其他因素分配权重,以决定如何分配目标订单。在一些实施例中,对于相同的目标订单,分配给目标事件发生概率和一个或多个此类其他因素的权重可以相同的或不同的。在一些实施例中,分配给与目标订单相关的目标事件发生概率的权重可以大于分配给一个或多个此类其他因素的权重。在一些实施例中,对于不同的目标订单,分配给与目标订单相关的目标事件发生概率的权重可以相同的或不同的。
订单分配模块420的各个单元经由有线连接或无线连接彼此连接或通信。有线连接包括金属电缆、光缆、混合电缆等,或其任意组合。无线连接包括局域网(LAN)、广域网(WAN),蓝牙,无线个域网,近场通讯(NFC)等,或其任意组合。
图5是根据本申请一些实施例所示的一种确定目标事件的发生概率的另一种示例性过程的流程图。在一些实施例中,过程650可以在如图1所示的人工智能系统100中实施。例如,过程500以指令的形式被存储在存储设备150和/或其它存储设备(例如,ROM 230,RAM240)中,并且由服务器110调用和/或执行(例如,服务器110中的处理设备112,服务器110中的处理设备112的处理器220,服务器110中的处理设备112的一个或多个模块)。
在510中,处理设备112(例如,订单特征提取单元411)提取与服务请求者相关的订单的目标订单特征。订单特征提取单元411从与订单相关的信息中提取目标订单特征。与订单相关的信息包括订单的起始位置,订单的目的地,从起始位置到目的地的路线,邻近路线,订单的开始时间,订单到达的估计时间,订单的类型,与订单相关的服务类型等,或其任意组合。订单的类型包括实时订单或未来时间的服务预订。服务类型包括出租车服务,快车服务,特殊(例如,无障碍轮椅,配备汽车座椅,一定容量等)的汽车服务等,或其任意组合。目标特征与目标事件发生概率的预测高度相关。.
在一些实施例中,服务请求系统的请求者终端130经由至少一个第一信息交换端口向服务器110发送和/或传输订单。请求者终端130经由无线通信与服务器110交换信息。服务请求系统包括请求者终端130和网络120。至少一个第一信息交换端口促进请求者终端130和服务器110之间经由网络120的通信。例如,至少一个第一信息交换端口是连接到服务器110和/或与服务器110通信的一个或多个网络输入/输出端口(例如,天线)。对应于服务请求系统或与服务请求系统通信的至少一个第一信息交换端口将订单发送到处理设备112。
在520中,处理设备112(例如,请求者特征提取单元412)提取服务请求者的目标请求者特征。在一些实施例中,请求者特征提取单元412从与服务请求者相关的信息中提取目标请求者特征。与服务请求者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,服务请求者的电话品牌,职业,简历图像,文档编号(例如,身份证号码等),第三方账户(例如电子邮件账户),习惯/偏好,服务请求者经常访问的位置(例如,酒店,宾馆,酒吧,卡拉OK(KTV)俱乐部等),被放置并随后被服务请求者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务提供者被投诉数量和/或频率,犯罪记录,服务请求者在论坛,博客或社交网络上发布的信息或与服务请求者有关的信息等,或其任意组合。.
在530中,处理设备112(例如,提供者特征提取单元413)提取服务提供者的目标请求者特征。目标订单特征,目标提供者特征,和目标请求者特征被视为与订单的目标事件发生概率的预测高度相关。在一些实施例中,提供者特征提取单元413从与服务提供者有关的信息中提取目标提供者特征。与服务提供者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,服务提供者的电话品牌,职业,电子邮件地址,简历图像,文档编号(例如,司机的驾驶证号码,身份证号码等),第三方账户(例如电子邮件账户),车辆类型,车龄,牌照,人工智能系统100中的认证状态,驾驶经验,背书,习惯/偏好,服务提供者经常访问的位置(例如,酒店,宾馆,酒吧,KTV俱乐部等),被接受并随后被服务提供者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务请求者被投诉数量和/或频率,犯罪记录,评分,服务提供者在论坛,博客或社交网络上发布的信息或与服务提供者有关的信息等,或其任意组合。服务评分反映了服务提供者的服务质量,该服务评分基于由服务提供者服务的一个或多个服务请求者的反馈确定。服务评分可以是数字(例如,从0到100,从0到10等),字符(例如,A,B,C,D……)等等。
在540中,处理设备112(例如,模型确定单元414)获得用于确定目标事件发生概率的预测模型。在一些实施例中,处理设备112从人工智能系统100的存储设备(例如,存储设备150,ROM 230,RAM 240)中获得预测模型。
目标事件可能是恶性事件,例如攻击,性骚扰,杀害,醉酒,强奸,抢劫等。在一些实施例中,可预先训练预测模型。在一些实施例中,预测模型被实时地训练和/或更新。模型确定单元414可以使用一个或多个机器学习算法来训练预测模型。机器学习算法包括神经网络算法,回归算法,决策树算法,深度学习算法等,或其任意组合。神经网络算法包括递归神经网络,感知器神经网络,霍普菲尔德网络,自组织映射(SOM)或学习矢量量化(LVQ)等。回归算法包括逻辑回归,逐步回归,多元自适应回归样条,局部估计散点图平滑等。决策树算法包括分类和回归树(CART)算法,迭代二分法3(ID3)算法,C4.5,卡方自动交互检测(CHAID),决策树桩,随机森林,多元自适应回归样条(MARS),梯度提升机(GBM)算法,梯度增强决策树(GBDT)算法,极端梯度增强(Xgboost)算法等。深度学习算法包括受限玻耳兹曼机(RBN),深信念网络(DBN),卷积网络,堆叠自编码器等。在一些实施例中,预测模型通过实施图6中描述的一个或多个操作来获得。
在550中,处理设备112(例如,事件预测单元415)基于目标订单特征,目标请求者特征和/或目标提供者特征,使用预测模型来确定目标事件发生的概率。例如,处理设备112基于目标订单特征,目标请求者特征和/或目标提供者特征来生成向量空间中的特征向量。特征向量用作预测模型的输入。预测模型的输出可以是目标事件发生概率。.
在一些实施例中,目标事件发生概率可以表示为数字(例如,从0到100,从0到10等)。在一些实施例中,目标事件发生概率可以表示为字符(例如,A,B,C,D……)。目标事件发生概率反映了服务提供者为服务请求者提供服务时出现目标事件的可能性,以及服务请求者与服务提供者配对的合理性。简言之,服务提供者和服务提供者服务的服务请求者被称为请求者-提供者对。例如,如果目标事件发生概率被表示为例如从0到100的数字,低目标事件发生概率对应于小数字和高目标事件发生概率对应于大数字,与目标事件发生概率为60的请求者-提供者对相比,目标事件发生概率为30的请求者-提供者对可能更合理。又例如,如果目标事件发生概率被表示为与增加的目标事件发生概率相对应的A,B,C或D,……,则与目标事件发生概率为“C”的请求者-提供者对相比,目标事件发生概率为“A”的请求者-提供者对可能更加合理。
基于目标事件发生概率,处理设备112确定是否将与服务请求者相关联的订单分配给服务提供者。基于目标事件发生概率分配订单的过程可以在本申请的其他地方找到。参见例如图9及其相关描述。
需要说明的是,以上关于确定目标事件发生的目标事件发生概率的过程500的描述仅仅是一个示例,而不对本申请构成任何限制。在一些实施例中,过程500在实施时可以添加一个或多个本申请未描述的额外操作,和/或删减一个或多个此处所描述的操作。此外,图5中所示的过程500中的操作顺序和下文描述的操作的顺序并加以限制。例如,操作510-530可以同时执行。又例如,操作540可以在操作510-530之前执行。
图6是根据本申请一些实施例所示的用于生成预测模型的另一示例性过程的流程图。在一些实施例中,过程600在如图1所示的人工智能系统100上实施。例如,过程600以指令的形式被存储在存储设备150和/或其他存储设备(例如,ROM 230,RAM 240)中,并且由服务器110调用和/或执行(例如,服务器110中的处理设备112,服务器110中的处理设备112的处理器220,服务器110中的处理设备112的一个或多个模块)。在一些实施例中,过程600和过程500在处理设备112的相同或不同的处理器中执行。.
在610中,处理设备112(例如,训练数据获取子单元414-1)获得训练数据。在一些实施例中,训练数据获取子单元414-1从服务器110中的存储设备150或其他存储设备或人工智能系统100外部的存储设备中获取训练数据。训练数据可以是与线上到线下服务平台上发生的多个历史交易相关的历史数据。多个历史交易中的每一个涉及由服务请求者发起并由服务提供者接受的历史订单。因此,与每个历史交易有关的信息涉及历史订单,服务请求者和相应的服务提供者。训练数据还包括对应于多个历史交易中的每一个的历史事件数据。历史事件数据包括事件是否已经发生,事件类型,事件程度等,或其任意组合。事件类型包括攻击,性骚扰,杀害,醉酒,强奸,抢劫等。事件程度包括非常严重,严重,正常,轻微,非常轻微等.
训练数据包括多个正样本和多个负样本。正样本指未发生目标事件的样本。负样本指发生目标事件的样本。应该注意的是,术语“正样本”和“负样本”是为了说明性的目的而定义的,而不是限制性的。
多个正样本和多个负样本中的每一个包括历史交易数据和对应于历史交易数据的历史事件数据。
在620中,处理设备112(例如,特征提取子单元414-2)从多个正样本和多个负样本的历史交易数据中提取多个候选特征。候选特征包括候选订单特征,候选请求者特征和候选提供者特征。特征提取子单元414-2从与历史订单相关的信息中提取候选订单特征。特征提取子单元414-2从与历史订单对应的服务请求者的相关信息中提取候选请求者特征。特征提取子单元414-2从与历史订单对应的服务提供者的有关信息中提取候选提供者特征。候选订单特征包括每个历史订单的起始位置,每个历史订单的目的地,每个历史订单从起始位置到目的地的路线,沿着每个历史订单的路线的邻近区域,每个历史订单的开始时间,每个历史订单到达的估计时间,每个历史订单到达的实时时间,每个历史订单的类型,每个历史订单相关的服务类型等,或者其任意组合。候选请求者特征包括与服务请求者相关的信息。与服务请求者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,服务请求者的电话品牌,职业,简历图像,文档编号(例如,身份证号码等),第三方账户(例如电子邮件账户),习惯/偏好,服务请求者经常访问的位置(例如,酒店,宾馆,酒吧,KTV俱乐部等),被放置并随后被服务请求者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务提供者被投诉数量和/或频率,犯罪记录,从服务请求者在论坛,博客或社交网络上发布的信息或与服务请求者有关的信息提取的特征等,或其任意组合。与候选提供者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,服务提供者的电话品牌,职业,电子邮件地址,简历图像,文档编号(例如,司机的驾驶证号码,身份证号码等),第三方账户(例如电子邮件账户),车辆类型,车龄,牌照,人工智能系统100中的认证状态,驾驶经验,背书,习惯/偏好,服务提供者经常访问的位置(例如,酒店,宾馆,酒吧,KTV俱乐部等),被接受并随后被服务提供者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务请求者被投诉数量和/或频率,犯罪记录,评分,从服务提供者在论坛,博客或社交网络上发布的信息或与服务提供者有关的信息中提取的特征等,或其任意组合。.
在一些实施例中,候选特征的维度是巨大的,并且只有部分候选特征与目标事件发生概率的预测高度相关。处理设备112选择与预测目标事件发生概率高度相关的特征来训练预测模型。通过特征选择,预测模型被简化和精确化,训练时间缩短,并且预测模型的过拟合减少。
因此,在630中,处理设备112(例如,特征选择子单元414-3)使用特征选择算法从多个候选特征中确定一个或多个目标特征。特征选择算法包括前向特征选择,后向特征消除,递归特征消除等。通过使用特征选择算法添加或者移除特征来确定目标特征,特征选择子单元414-3确定预测模型的精确率,召回率,和/或准确率。目标特征包括一个或多个目标订单特征,一个或多个目标请求者特征,和/或一个或多个目标提供者特征。
在640中,处理设备112(例如,模型确定子单元414)基于多个正样本的一个或多个目标特征,多个负样本的一个或多个目标特征,和/或多个正样本和多个负样本的历史事件数据来生成预测模型。例如,基于预测模型(这里也称为初始预测模型),模型确定子单元414-4生成预测结果,该预测结果基于正样本的一个或多个目标特征以及多个负样本的一个或多个目标特征;然后模型确定子单元414-4基于具有多个正样本和多个负样本的历史事件数据的预测结果来确定损失函数的值。然后,模型确定子单元414-4基于与损失函数有关的标准来确定预测模型是否令人满意。在一些实施例中,当损失函数的值小于预设阈值时,模型确定子单元414-4将初始预测模型指定为预测模型,即,预测模型已经训练良好并且令人满意。当损失函数的值超过预设阈值时,模型确定子单元414-4修改初始预测模型并使用训练数据或获得其他不同的训练数据来生成更新的预测模型,直到更新的预测模型满足标准。
应该注意的是,关于确定预测模型的过程600的以上描述仅是示例性的,并不构成对本申请的限制。在一些实施例中,过程600在实施时可以添加一个或多个本申请未描述的额外操作,和/或删减一个或多个此处所描述的操作。例如,在610中获得训练数据之后,处理设备112对训练数据进行预处理,例如去除异常数据,弥补或删除不完整的数据。又例如,处理设备112还独立于训练数据获得测试数据以访问预测模型的性能。再例如,处理设备112实施用于训练预测模型的交叉验证(例如,k倍交叉验证)。
在一些实施例中,训练数据包括有关多于一种类型的事件的数据。过程600还包括将训练数据分成多于一个组。每个组对应于一种事件类型。对于每个组,处理设备112确定一个子模型来预测对应事件的发生概率。然后,处理设备112将多于一个子模型指定为预测模型。当处理设备112使用预测模型时,处理设备112针对每种事件类型生成发生概率。例如,处理设备112确定杀人事件的发生概率为30,性骚扰事件的发生概率为45,抢劫事件的发生概率为17。.
在一些实施例中,处理设备112还通过向多于一个子模型分配不同的权重来确定预测模型。当处理设备112使用预测模型时,处理设备112确定关于不同事件类型的总体预测。例如,处理设备112基于一种或多种事件类型的发生概率确定恶性事件的发生概率为40。
在一些实施例中,处理设备112离线训练预测模型。例如,处理设备112使用训练数据预先生成预测模型并将该预测模型存储在人工智能系统100的存储设备(例如,存储设备150,ROM 230,RAM 240)中以供将来使用。例如,处理设备112在非高峰时间段生成预测模型,在该时间段人工智能系统100的至少一部分(例如,服务请求系统,服务提供系统,服务器110等,或其任意组合)通信量低(例如低于阈值)。在一些实施例中,处理设备112不响应于实时订单或预订的形式而是独立于个体的实时服务请求来生成预测模型。处理设备112在服务提供者服务于服务请求者时确定目标事件的发生概率,此时处理设备112直接从人工智能系统100的存储设备(例如,存储设备150,ROM230,RAM240)获得预测模型。处理设备112定期或不定期地更新预测模型。在一些实施例中,处理设备112将更新的预测模型存储在人工智能系统100的存储设备(例如,存储设备150,ROM 230,RAM 240)中。
在一些实施例中,训练数据具有不平衡的组成。例如,训练数据包括比负样本多得多的正样本(即,训练数据不平衡),并且如果训练数据不平衡,则模型的性能(例如,预测准确性)可能较差。因此,在一些实施例中,期望使用平衡训练的数据(也称为平衡样本)来训练预测模型。
图7是根据本申请一些实施例所示的一种用于生成平衡样本的示例性过程的流程图。在一些实施例中,过程700在图1所示的人工智能系统100中实施。例如,过程700以指令的形式被存储在存储设备150和/或其他存储设备(例如,ROM 230,RAM 240)中,并且由服务器110调用和/或执行(例如,服务器110中的处理设备112,服务器110中的处理设备112的处理器220,服务器110中的处理设备112的一个或多个模块)。
在710中,处理设备112(例如,训练数据获取子单元414-1)获得训练数据。训练数据包括多个正样本和多个负样本。
在720中,处理设备112(例如,样本平衡子单元414-5)确定训练数据是否包括不平衡的样本组成。例如,样本平衡子单元414-5获得正样本的计数Mp和负样本的计数Mn。样本平衡子单元414-5产生多数样本的计数与少数样本的计数之间的比率(在本申请中也被称为样本比率)。如本申请中所使用的,在训练数据中的正样本和负样本之间,具有较高样本计数的样本的类型被称为多数样本,具有较低样本计数的样本的类型被称为少数样本。例如,当正样本的样本计数高于训练数据中负样本的样本计数,即训练数据中正样本较负样本多,则正样本被称为多数样本,负样本被称为少数样本。又例如,当正样本的样本计数低于训练数据中负样本的样本计数,即,训练数据中正样本较负样本少,则正样本被称为少数样本,负样本被称为多数样本。当正样本的样本计数大于负样本的样本计数(即,正样本是多数样本,负样本是少数样本)时,样本比率表示为Mp/Mn;当负样本的样本计数大于正样本的样本计数(即,正样本是少数样本,而负样本是多数样本)时,样本比率表示为Mn/Mp。样本平衡子单元414-5确定样本比率是否超过阈值。比值阈值大于或等于10。例如,比率阈值可以是从10至20,从21至30,从31至40或大于40。
当样本平衡子单元414-5确定样本比率超过比率阈值时,样本平衡子单元414-5确定训练数据包括不平衡样本组成,然后样本平衡子单元414-5使用在730中的样本平衡技术来平衡样本组成。在一些实施例中,样本平衡技术包括向正样本和负样本分配不同的权重。在一些实施例中,样本平衡技术包括重新采样训练数据,例如,过采样少数样本和/或欠采样多数样本。在一些实施例中,目标事件未发生的正样本是多数样本,发生目标事件的负样本是少数样本。然后,样本平衡子单元414-5对负样本进行过采样和/或对正样本进行欠采样。
在一些实施例中,样本平衡子单元414-5基于欠采样率对正样本进行欠采样。欠采样比率基于采样比率来确定。例如,当负样本的计数大于预设数量时,欠采样比率是与采样比率近似相等的值。假设预设数量是1000,负样本的计数是1200,正样本的计数是1200000(即,样本比率是1000),那么样本平衡子单元414-5通过从例如每1000个正样本中随机选择一个正样本来对正样本进行欠采样。
在一些实施例中,样本平衡子单元414-5过采样负样本。在一些实施例中,负样本通过例如复制负样本的全部或部分来过采样。在一些实施例中,负样本通过例如使用例如K近邻(KNN)技术产生多个合成样本并将多个合成样本的至少一部分指定为负样本来过采样。
在本申请中,在数据空间中训练数据。数据空间指其中用点表示样本(例如,正样本,负样本)的空间。在一些实施例中,处理设备112在特征空间中生成合成样本。特征空间指其中用点表示特征向量的空间。特征向量的维度可以是任意值,例如10,20,30,40等。图8B是说明不平衡样本的示意图。如图8B所示,对应于正样本的十字标志或对应于正样本的特征向量,对应于负样本的空心圆或对应于负样本的特征向量。
图8A是根据本申请一些实施例所示的利用KNN技术在特征空间生成合成样本的示例性过程的流程图。在一些实施例中,过程800在如图2所示的人工智能系统100中实施。例如,过程800以指令的形式被存储在存储设备150和/或其他存储设备(例如ROM 230,RAM240)中,并且由服务器110调用和/或执行(例如,服务器110中的处理设备112,服务器110中的处理设备112的处理器220,服务器110中的处理设备112的一个或多个模块)。
在810中,处理设备112(例如,样本平衡子单元414-5)基于负样本(在本申请中也被称为目标负样本)的一个或多个目标特征产生目标特征向量。目标特征向量的维度与负样本的目标特征的个数相同。
在一些实施例中,处理设备112还对对应于训练数据中的负样本的特征向量中的特征和/或对应于训练数据中正样本的特征向量进行归一化。然后,处理设备112使用归一化特征来确定任何两个特征向量之间的距离(例如,Euclidean距离,Minkowski距离等)。
在820中,基于对应于训练数据中负样本的特征向量中的每一个和目标特征向量之间的距离,处理设备112(例如,样本平衡子单元414-5)使用针对目标特征向量的KNN技术来确定特征向量的近邻的第一数目。第一个数目可以是任何合适的值,例如5,6,7等。.
在一些实施例中,样本平衡子单元414-5从对应于目标负样本附近的负样本的特征向量和对应于目标正样本附近的特征向量确定近邻的第一数目。在一些实施例中,样本平衡子单元414-5仅从对应于负样本的特征向量确定近邻的第一数目。如图8B所示,第一数目为5,并且负样本的特征向量(N1)(在本申请中也被称为目标特征向量),样本平衡子单元414-5确定五个近邻N1,N3,N4,N5和N6,这五个近邻是对应于五个负样本特征向量。.
在830中,对于目标特征向量,处理设备112(例如,样本平衡子单元414-5)从820中确定的第一数目的近邻中确定第二数目的近邻。在一些实施例中,第二数目可以预设数量,例如一个,两个,三个等。在一些实施例中,第二数目基于过采样比率来确定,例如,第二数目可以是最接近过采样比率整数。例如,如果负样本的计数是100且负样本的目标计数是200(即,过采样比率是200%),则样本平衡子单元414-5确定第二数目是二。
在一些实施例中,采样平衡子单元414-5从近邻的第一数目中随机选择近邻的第二数目。在一些实施例中,样本平衡子单元414-5基于近邻的第一数目中的每一个与目标特征向量之间的距离来选择近邻的第二数目。例如,样本平衡子单元414-5基于近邻的第一数目(例如,N1,N3,N4,N5,N6)中的每一个与目标特征向量(例如,N1)之间的距离来选择近邻的第二数目,然后选择对应于距近邻的第一数目(例如,N1,N3,N4,N5,N6)的一个或多个最小距离的近邻的第二数目。两个特征向量之间的距离表示两个特征向量之间的相似程度。.
在840中,针对目标特征向量,处理设备112(例如,样本平衡子单元414-5)基于目标特征向量和对应于目标特征向量的近邻的第二数目,生成关于目标特征向量的一个或多个合成特征向量。
在一些实施例中,对于目标特征向量的近邻的第二数目中的每一个,样本平衡子单元414-5确定近邻(例如,特征向量N5)和目标特征向量(例如,特征向量N1)之间的差值。然后,样本平衡子单元414-5将该差值乘以0和1之间的系数,以确定合成特征向量。对应于合成特征向量的样本在本申请中被称为合成样本。如图8B所示。差值表示为N5和N1之间的线段,合成特征向量表示为该线段中的点(以实心三角形示出)。应该注意的是,符号实体三角形表示数据空间中的合成样本或特征空间中的合成特征向量。
在一些实施例中,样本平衡子单元414-5在连接对应于两个特定样本(例如,两个负样本或一个正样本和一个目标负样本)的两个特定特征向量的线段中确定两个或更多个合成特征向量。例如,样本平衡子单元414-5将两个特定特征向量的差值乘以0和1之间的两个或更多个系数,以确定两个或更多个合成特征向量。例如,对于连接N5和N1的线段,样本平衡子单元414-5选择线段中对应于两个或更多个合成特征向量的两个或更多个点。在一些实施例中,系数在0和1之间随机选择。在一些实施例中,如果在连接对应于两个特定样本的两个特定特征向量的线段中使用多个系数来确定多个合成特征向量,则这些系数可以彼此等距或不等距。例如,两个系数用于确定连接两个对应于两个负样本的两个特定特征向量的线段中的两个合成特征向量,系数可以是1/3和2/3或1/3和1/4等。
应该注意的是,以上关于使用KNN技术为目标负样本产生合成样本的过程的描述仅仅是示例性的,不构成对本申请的限制。在一些实施例中,样本平衡子单元414-5使用其他技术来为目标负样本生成一个或多个合成样本。例如,样本平衡子单元414-5确定区域(例如,具有以目标特征向量为中心的半径的圆形区域)。根据各种因素中的一个或多个因素,半径是固定的或者可调整的,这些因素包括,例如,训练数据中负样本的计数,训练数据中正样本的计数,与训练数据相关的样本比率等。在一些实施例中,不同的目标特征向量,半径可以不同。该区域的样本包括负样本,正样本,或两者兼而有之。然后,样本平衡子单元414-5基于该区域中的样本(例如,仅负样本,或负样本和正样本两者)来确定合成样本。
在一些实施例中,为了基于目标样本来确定合成样本,样本平衡子单元414-5基于对应于训练数据(例如,目标样本的目标特征向量的附近的一个样本)中的样本(例如,负样本,正样本)的特征向量和对应于目标样本的目标特征向量之间的距离,直接选择目标特征向量的近邻的一定数目(例如,第二数目),而不执行操作820。
图8A描述了为目标负样本确定合成样本的过程800。为了产生平衡样本组成,处理设备112针对训练数据中的至少一些负样本中的每一个执行过程800。
当生成对应于训练数据中的至少一些负样本的全部特征向量的合成特征向量的合成样本时,样本平衡子单元414-5指定对应于合成特征向量的样本作为负样本,以使得样本组成是平衡的。然后处理设备112使用平衡样本来训练预测模型。在一些实施例中,仅基于原始训练数据中的实际样本的特征向量而不是另一合成样本的合成特征向量来生成合成样本的合成特征向量。
图9是根据本申请一些实施例所示的一种用于分配订单的示例性过程的流程图。在一些实施例中,过程900在如图1所示的人工智能系统100中实施。例如,过程900以指令的形式被存储在存储设备150和/或其他存储设备(例如,ROM 230,RAM 240)中,并由服务器110调用和/或执行(例如,服务器110中的处理设备112,服务器110中的处理设备112的处理器220,服务器110中的处理设备112的一个或多个模块)。
在910中,处理设备112(例如订单信息获取单元421)从一个或多个服务请求者终端获得要分配的一个或多个目标订单。一个或多个服务请求者终端与一个或多个服务请求者相关联。与每个目标订单相关的信息包括目标订单的起始位置,目标订单的目的地,从目标订单的起始位置到目的地的路线,沿着目标订单的路线的邻近区域,目标订单的开始时间,目标订单的估计到达时间,目标订单的类型,与目标订单相关的服务类型等,或其任意组合。目标订单的类型包括实时订单或未来时间的服务预订。服务类型包括出租车服务,快车服务,特殊(例如,无障碍轮椅,配备汽车座椅,一定容量等)的汽车服务等,或其任意组合。请求者信息获取单元422还获得与一个或多个目标订单相关联的服务请求者相关信息。例如,请求者信息获取单元422还可以从服务器110中的存储设备150或其他存储设备或人工智能系统100的外部存储设备中获得与服务请求者相关的信息。与服务请求者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,服务请求者的电话品牌,职业,简历图像,文档编号(例如,身份证号码等),第三方账户(例如电子邮件账户),习惯/偏好,服务请求者经常访问的位置(例如,酒店,宾馆,酒吧,KTV俱乐部等),被放置并随后被服务请求者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务提供者被投诉数量和/或频率,犯罪记录,服务请求者在论坛,博客或社交网络上发布的信息或与服务请求者有关的信息等,或其任意组合。
在一些实施例中,服务请求系统的一个或多个请求者终端130经由至少一个第一信息交换端口向服务器110发送和/或传送包括一个或多个目标订单的电子信号。一个或多个请求者终端130经由无线通信与服务器110交换信息。服务请求系统包括一个或多个请求者终端130和网络120。所述至少一个第一信息交换端口促进一个或多个请求者终端130中的每一个与服务器110之间经由网络120的通信。例如,至少一个第一信息交换端口是连接到服务器110和/或与服务器110通信的一个或多个网络输入/输出端口(例如,天线)。对应于服务请求系统或与服务请求系统通信的至少一个第一信息交换端口将包括一个或多个目标订单的电子信号发送到处理设备112。
在920中,处理设备112(例如,提供者信息获取单元423)识别可用于接收一个或多个目标订单的多个候选服务提供者。在一些实施例中,处理设备112通过实时定位提供者终端的模块来获得多个服务提供者的位置。然后,处理设备识别用于接收订单并且在每个目标订单的起始位置周围的预设范围(例如,2公里)内的候选服务提供者。提供者信息获取单元423还可以获得与多个候选服务提供者相关的信息。例如,提供者信息获取单元423还可以从服务器110中的存储设备150或其他存储设备或人工智能系统100外部获得与多个候选服务提供商有关的信息。与候选服务提供者有关的信息包括显示的姓名(例如昵称),年龄,性别,电话号码,候选服务提供者的电话品牌,职业,电子邮件地址,简历图像,文档编号(例如,司机的驾驶证号码,身份证号码等),第三方账户(例如电子邮件账户),车辆类型,车龄,牌照,人工智能系统100中的认证状态,驾驶经验,背书,习惯/偏好,候选服务提供者经常访问的位置(例如,酒店,宾馆,酒吧,KTV俱乐部等),被接受并随后被候选服务提供者在任何时间或特定时间段内(例如,过去的一周,过去的一个月,过去的一年等)取消的订单的数量,候选服务提供者或服务请求者提交的在任何时间或特定时间段内(例如,过去一周,过去的一个月,过去的一年等)的服务请求者被投诉数量和/或频率,犯罪记录,评分,候选服务提供者在论坛,博客或社交网络上发布的信息或与候选服务提供者有关的信息等,或其任意组合。
当订单分配模块420获得一个或多个订单的信息,与一个或多个目标订单相关联的服务请求者的信息和多个候选服务提供者的信息时,订单分配模块420发送信息给事件预测模块410以确定目标事件发生概率。
在930中,处理设备112(例如,请求者-提供者对确定单元424)通过将一个或多个目标服务请求者中的每一个与多个候选服务提供者中的每一个相关联来确定候选请求者-提供者对。请求者-提供者对确定单元可以是事件预测模块410,订单分配模块420,或处理设备112的其他组件的一部分。例如,假定要分配的目标订单的计数是M1,候选服务提供者的计数是M2,请求者-提供者对确定单元可以生成候选人请求者-提供者对。M1×M2
在940中,处理设备112(例如,事件预测模块410)针对每个候选请求者-提供者对确定目标事件发生的目标事件发生概率。目标事件包括恶性事件,例如攻击,性骚扰,杀害,醉酒,强奸,抢劫等。关于确定目标事件发生概率的详细描述在本申请的其他地方也可以找到。例如,参见图5及其相关描述。.
当已经确定了与所有候选请求者-提供者对相对应的目标事件发生概率时,订单分配模块420从事件预测模块410获得目标事件发生概率。然后在950中,订单分配模块420(例如,订单分配单元425)至少部分地基于目标事件发生概率和相应的候选请求者-提供者对来分配目标订单。在一些实施例中,订单分配模块420(例如,订单分配单元425)可以根据其他因素来确定是否向服务提供者分配目标订单,所述其他因素包括,例如,服务提供者的位置和目标订单的开始位置之间的距离,从服务提供者的位置移动到目标订单的开始位置所需时间,交通信息,提供者特征(例如,服务提供者的服务类型,服务提供者的车辆类型,服务提供者的服务得分,等),服务提供者的需求(例如,服务请求者的性别,服务提供者优选或接受的订单的目的地等),服务请求者的需求(例如,服务提供者的性别)等。在一些实施例中,订单分配模块420(例如订单分配单元425)为目标事件发生概率以及此类其他因素分配权重,以决定如何分配目标订单。.在一些实施例中,对于相同的目标订单,分配给目标事件发生概率的权重和一个或多个此类其他因素权重可以相同或不同。.在一些实施例中,分配给与目标订单相关联的目标事件发生概率的权重可以大于分配给一个或多个此类其他因素的权重。.在一些实施例中,对于不同的目标订单,分配给与目标订单相关联的目标事件发生概率的权重可以相同或不同。
在一些实施例中,处理设备112经由对应于服务提供系统的至少一个第二信息交换端口,将第二电子信号发送和/或传输给与多个服务提供者相关联的一个或多个提供者终端,其中第二电子信号包括分配的目标订单的信息。一个或多个提供者终端140经由无线通信与服务器110交换信息。服务提供系统包括一个或多个提供者终端140和网络120。至少一个第二信息交换端口可以促进一个或多个提供者终端140与服务器110之间的通信。例如,至少一个第二信息交换端口是连接到服务器110和/或与服务器110通信的一个或多个网络输入/输出端口(例如,天线)。
因此,当处理设备112分配订单时,考虑到目标事件发生概率可以使得分配更加合理并减少目标事件(例如恶性事件)的可能性,这有助于保护人身安全和/或服务提供者和/或服务请求者的财产安全,维护社会稳定。
本申请已对基本概念做了描述,显然,对于阅读此申请后的本领域的普通技术人员来说,上述发明披露仅作为示例,并不构成对本申请的限制。虽然此处并未明确说明,但本领域的普通技术人员可以进行各种变更、改良和修改。此类变更、改良和修改在本申请中被建议,所以该类变更、改良和修改仍被包含于本申请示例性实施例的精神和范围之内。
同时,本申请使用了特定术语来描述本申请的实施例。例如,术语“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特性。因此,应当强调并注意的是,本申请中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特性可以进行适当的组合。
此外,本领域的普通技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的过程、机器、产品或物质的组合,或对其任何新的和有用的改良。相应地,本申请的各个方面可以完全由硬件实施、可以完全由软件(包括固件、常驻软件、微代码等)实施、也可以由硬件和软件组合实施。以上硬件或软件均可被称为“单元”、“模块”或“系统”。此外,本申请的各方面可以呈现为位于一个或多个计算机可读媒体中的计算机产品,该产品具有计算机可读程序代码。
计算机可读信号介质包括一个含有计算机可读程序代码的传播数据信号,例如在基带上或作为载波的一部分。此类传播信号可以有多种形式,包括电磁形式、光形式等,或其任意合适的组合。计算机可读信号介质为除计算机可读储存介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序代码可以通过任何合适的介质进行传播,包括无线电、缆线、光纤电缆、RF等,或任何上述介质的合适组合。
本申请各方面操作所需的计算机程序代码可以用一种或多种程序语言的任意组合编写,包括面向对象程序设计语言,如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET,Python等,或类似的常规程序编程语言,如"C"编程语言,Visual Basic,Fortran 2003,Perl,COBOL2002,PHP,ABAP,动态编程语言如Python,Ruby和Groovy或其它编程语言。程序代码可以完全在用户计算机上执行、或部分在用户计算机上执行,或作为独立的软件包、或部分在用户计算机上执行部分在远程计算机上执行、或完全在远程计算机或服务器上执行。在后一种情况下,远程计算器可以通过任何类型的网络与用户计算器连接,包括局域网(LAN)或广域网(WAN),或连接到外部计算器(例如通过因特网),或在云端计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非本申请专利范围中明确说明,否则过程元素或序列的叙述顺序、数字字母的使用、或其他标记的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的本申请的实施例,但应当理解,此类细节仅起说明的目的,附加的申请范围不限于披露的实施例,相反,申请范围旨在覆盖所有符合本申请实施例精神和范围的修正和等价组合。例如,虽然以上描述的各种系统组件可以通过安装于硬件装置中实施,但也可以只通过软件的解决方案实施,例如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。然而,此披露方法并不意味着本申请所需的特征比申请专利范围中涉及的特征多。实际上,申请专利范围的特征要少于上述披露的单个实施例的全部特征。
在一些实施例中,用于描述和要求保护本申请的某些实施例的数量,性质等,应被理解为在一些情况下被术语“约”,“近似”或“基本上”修饰。除非另外说明,“约”,“近似”或“基本上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
本申请中提及的所有专利、专利申请、专利申请公布和其他材料,例如论文、书籍、说明书、出版物、文件、事物等,均在此通过引用的方式全部并入本申请以达到所有目的,与本文件相关的任何起诉文档记录、与本文件不一致或冲突的任何文件或迟早对本文件相关的权利要求书的最广泛范畴有限定作用的任何文件除外。举例来说,如果在描述,定义和/或与任何所结合的材料相关联的术语的使用和与本文件相关联的术语之间存在任何不一致或冲突,则描述,定义和/或在本文件中使用的术语以本文件为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也被包含在本申请的范围之内。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
Claims (44)
1.一种用于确定目标事件发生概率的一个或多个电子设备的系统,包括:
至少一个存储设备,所述存储设备包括操作系统和与所述操作系统兼容的第一组指令,用于确定目标事件的发生概率;和
至少一个处理器,所述处理器与所述至少一个存储设备通信,其中当执行所述操作系统和所述第一组指令时,所述至少一个处理器:
提取与服务请求者关联的订单的目标订单特征;
提取所述服务请求者的目标请求者特征;
提取服务提供者的目标提供者特征;
获得用于确定所述目标事件发生的概率的预测模型;以及
基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
2.根据权利要求1所述的系统,其中为了获得所述预测模型,所述至少一个处理器进一步:
获得训练数据,所述训练数据包括多个正样本和多个负样本,所述多个正样本中的每一个所述目标事件没有发生,所述多个负样本中的每一个目标事件已经发生,所述多个正样本和所述多个负样本中的每一个包括历史交易数据和对应于所述历史交易数据的历史事件数据;
从所述多个正样本和所述多个负样本的所述历史交易数据中提取多个候选特征;
对于所述多个正样本和所述多个负样本中的每一个,使用特征选择算法从所述多个候选特征中确定一个或多个目标特征;以及
基于所述多个正样本的所述一个或多个目标特征,所述多个负样本的所述一个或多个目标特征,和所述多个正样本和所述多个负样本的所述历史事件数据生成所述预测模型。
3.根据权利要求2所述的系统,其中为了获得所述预测模型,所述至少一个处理器进一步:
基于所述多个正样本和所述多个负样本判断出所述训练数据包括不平衡样本;以及
当判断出所述训练数据包括所述不平衡样本时,基于所述训练数据,使用样本平衡技术平衡所述样本组成。
4.根据权利要求3所述的系统,其中所述样本平衡技术包括对所述多个正样本进行欠采样。
5.根据权利要求3或4所述的系统,其中所述样本平衡技术包括对所述多个负样本进行过采样。
6.根据权利要求5所述的系统,其中为了平衡所述样本组成,所述至少一个处理器进一步:
使用K近邻(KNN)技术确定多个合成样本;以及
指定所述多个合成样品为负样本。
7.根据权利要求6所述的系统,其中使用所述KNN技术确定所述多个合成样本,所述至少一个处理器:
基于所述负样本的所述一个或多个目标特征,为所述多个负样本中的每一个生成特征向量;以及
为每个所述特征向量,
使用所述KNN技术确定所述特征向量的近邻的第一数目;
根据过采样率从近邻的所述第一数目中选择近邻的第二数目;以及
基于所述特征向量和近邻的所述第二个数目生成关于所述特征向量的合成样本。
8.根据权利要求1所述的系统,其中所述至少一个存储设备进一步包括第二组指令,所述第二组指令与用于分配订单的所述操作系统兼容,其中当所述至少一个处理器执行所述第二组指令时,所述至少一个处理器进一步:
从一个或多个请求者终端获得一个或多个目标订单,所述一个或多个请求者终端与一个或多个目标服务请求者相关联;
识别可用于接收所述一个或多个订单的多个候选服务提供者;
通过将所述一个或多个目标服务请求者中的每一个与所述多个候选服务提供者中的每一个相关联来确定候选请求者-提供者对;
为每个所述候选请求者-提供者对,执行所述第一组指令确定所述目标事件的发生概率;以及
至少部分地基于所述目标事件的所述发生概率和相应的候选请求者-提供者对分配一个或多个目标订单。
9.根据权利要求1-8中任一项所述的系统,其中所述预测模型是极限梯度增强(Xgboost)模型。
10.根据权利要求1-9中任一项所述的系统,其中所述目标事件包括以下事件中的至少一个:攻击,性骚扰,杀害,醉酒,强奸,或抢劫。
11.一种确定目标事件发生概率的方法,所述方法在一个或多个电子设备上实施,所述一个或多个电子设备包括至少一个存储设备和与所述至少一个存储装置通信的至少一个处理器,所述方法包括:
提取与服务请求者关联的订单的目标订单特征;
提取所述服务请求者的目标请求者特征;
提取服务提供者的目标提供者特征;
获得用于确定所述目标事件发生的概率的预测模型;以及
基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
12.根据权利要求11所述的方法,其中获得所述预测模型包括:
获得训练数据,所述训练数据包括多个正样本和多个负样本,所述多个正样本的每一个中所述目标事件没有发生,所述多个负样本的每一个目标事件已经发生,所述多个正样本和所述多个负样本中的每一个包括历史交易数据和对应于所述历史交易数据的历史事件数据;
从所述多个正样本和所述多个负样本的所述历史交易数据中提取多个候选特征;
对于所述多个正样本和所述多个负样本中的每一个,使用特征选择算法从所述多个候选特征中确定一个或多个目标特征;以及
基于所述多个正样本的所述一个或多个目标特征,所述多个负样本的所述一个或多个目标特征,和所述多个正样本和所述多个负样本的所述历史事件数据生成所述预测模型。
13.根据权利要求12所述的方法,获取所述预测模型进一步包括:
基于所述多个正样本和所述多个负样本判断出所述训练数据包括不平衡样本;以及
当判断出所述训练数据包括所述不平衡样本时,基于所述训练数据,使用样本平衡技术平衡所述样本组成。
14.根据权利要求13所述的方法,其中所述样本平衡技术包括对所述多个正样本进行欠采样。
15.根据权利要求13或14所述的方法,其中所述样本平衡技术包括对所述多个负样本进行过采样。
16.根据权利要求15所述的方法,其中平衡所述样本组成进一步包括:
使用K近邻(KNN)技术确定多个合成样本;以及
指定所述多个合成样品为负样本。
17.根据权利要求16所述的方法,其中使用所述KNN技术确定所述多个合成样本包括:
基于所述负样本的所述一个或多个目标特征,为所述多个负样本中的每一个生成特征向量;以及
为每个所述特征向量,
使用所述KNN技术确定所述特征向量的近邻的第一数目;
根据过采样率从近邻的所述第一数目中选择近邻的第二数目;以及
基于所述特征向量和近邻的所述第二个数目生成关于所述特征向量的合成样本。
18.根据权利要求11所述的方法,进一步包括:
从一个或多个请求者终端获得一个或多个目标订单,所述一个或多个请求者终端与一个或多个目标服务请求者相关联;
识别可用于接收所述一个或多个订单的多个候选服务提供者;
通过将所述一个或多个目标服务请求者中的每一个与所述多个候选服务提供者中的每一个相关联来确定候选请求者-提供者对;
为每个所述候选请求者-提供者对,确定所述目标事件的发生概率;以及
至少部分地基于所述目标事件的所述发生概率和相应的候选请求者-提供者对分配一个或多个目标订单。
19.根据权利要求11-18中任一项所述的方法,其中所述预测模型是极限梯度增强(Xgboost)模型。
20.根据权利要求11-19中任一项所述的方法,其中所述目标事件包括以下事件中的至少一个:攻击,性骚扰,杀害,醉酒,强奸,或抢劫。
21.一种非暂时性计算机可读介质,包括操作系统和至少一组指令,所述至少一组指令与所述操作系统兼容,用于确定目标事件的发生概率,其中当一个或多个电子设备的至少一个处理器执行时,所述至少一组指令指示所述至少一个处理器:
提取与服务请求者关联的订单的目标订单特征;
提取所述服务请求者的目标请求者特征;
提取服务提供者的目标提供者特征;
获得用于确定所述目标事件发生的概率的预测模型;以及
基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
22.一种用于确定目标事件发生概率的一个或多个电子设备的人工智能系统,包括:
至少一个第一信息交换端口,所述至少一个第一信息交换端口对应于服务请求系统,其中所述服务请求系统经由无线通信与一个或多个请求者终端相关联,所述无线通信处于所述至少一个第一信息交换端口与一个或多个所述请求者终端之间;
至少一个第二信息交换端口,所述至少一个第二信息交换端口对应于服务提供系统,其中所述服务提供系统经由无线通信与一个或多个提供者终端相关联,所述无线通信处于至少一个第二信息交换端口与所述一个或多个所述提供者终端之间;
至少一个存储设备,所述存储设备包括操作系统和第一组指令,所述第一组指令与所述操作系统兼容,用于确定目标事件的发生概率;以及
至少一个处理器,所述至少一个处理器与所述至少一个存储设备通信,其中当执行所述操作系统和所述第一组指令时,所述至少一个处理器进一步:
经由所述至少一个第一信息交换端口从与所述服务请求系统相关联的请求者终端获得服务请求者的订单;
提取所述订单的目标订单特征;
提取与所述订单相关联的所述服务请求者的目标请求者特征;
识别与服务提供者相关联的提供者终端;
提取所述服务提供者的目标提供者特征;
获得用于确定所述目标事件发生的概率的预测模型;以及
基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
23.根据权利要求22所述的系统,其中获得预测模型,所述至少一个处理器进一步:
获得训练数据,所述训练数据包括多个正样本和多个负样本,所述多个正样本的每一个中所述目标事件没有发生,所述多个负样本的每一个目标事件已经发生,所述多个正样本和所述多个负样本中的每一个包括历史交易数据和对应于所述历史交易数据的历史事件数据;
从所述多个正样本和所述多个负样本的所述历史交易数据中提取多个候选特征;
对于所述多个正样本和所述多个负样本中的每一个,使用特征选择算法从所述多个候选特征中确定一个或多个目标特征;以及
基于所述多个正样本的所述一个或多个目标特征,所述多个负样本的所述一个或多个目标特征,和所述多个正样本和所述多个负样本的所述历史事件数据生成所述预测模型。
24.根据权利要求23所述的系统,其中获得预测模型,所述至少一个处理器进一步:
基于所述多个正样本和所述多个负样本判断出所述训练数据包括不平衡样本;以及
当判断出所述训练数据包括所述不平衡样本时,基于所述训练数据,使用样本平衡技术平衡所述样本组成。
25.根据权利要求24所述的系统,其中所述样本平衡技术包括对所述多个正样本进行欠采样。
26.根据权利要求24或25所述的系统,其中所述样本平衡技术包括对所述多个负样本进行过采样。
27.根据权利要求26所述的系统,其中平衡所述样本组成,所述至少一个处理器进一步:
使用K近邻(KNN)技术确定多个合成样本;以及
指定所述多个合成样品为负样本。
28.根据权利要求27所述的系统,其中使用所述KNN技术确定所述多个合成样本,所述至少一个处理器:
基于所述负样本的所述一个或多个目标特征,为所述多个负样本中的每一个生成特征向量;以及
为每个所述特征向量,
使用所述KNN技术确定所述特征向量的近邻的第一数目;
根据过采样率从近邻的所述第一数目中选择近邻的第二数目;以及
基于所述特征向量和近邻的所述第二个数目生成关于所述特征向量的合成样本。
29.根据权利要求22所述的系统,其中所述至少一个存储设备还包括第二组指令,所述第二组指令与用于分配订单的所述操作系统兼容,其中当所述至少一个处理器执行所述第二组指令时,所述至少一个处理器进一步:
经由所述至少一个第一信息交换端口从所述一个或多个请求者终端获得第一电子信号,所述第一电子信号包括与一个或多个目标服务请求者相关联的一个或多个目标订单;
识别可用于接收所述一个或多个订单的多个候选服务提供者;
通过将所述一个或多个目标服务请求者中的每一个与所述多个候选服务提供者中的每一个相关联来确定候选请求者-提供者对;
为每个所述候选请求者-提供者对,执行所述第一组指令确定所述目标事件的发生概率;以及
至少部分地基于所述发生概率和相应的候选请求者-提供者对分配一个或多个目标订单;以及
经由所述至少一个第二信息交换端口将第二电子信号发送到与所述多个服务提供者相关联的一个或多个提供者终端,所述第二电子信号包括所述分配的目标订单的信息。
30.根据权利要求22至29中任一项所述的系统,其中所述预测模型是极限梯度增强(Xgboost)模型。
31.根据权利要求22-30中任一项所述的系统,其中所述目标事件包括以下事件中的至少一个:攻击,性骚扰,杀害,醉酒,强奸,或抢劫。
32.一种确定目标事件发生概率的方法,所述方法在一个或多个电子设备上实施,所述一个或多个电子设备包括至少一个与一个或多个请求者终端通信的第一信息交换端口,至少一个与一个或多个提供者终端通信的第二信息交换端口,至少一个存储设备,和与所述至少一个存储设备通信的至少一个处理器,所述方法包括:
经由所述至少一个第一信息交换端口从请求者终端获得服务请求者的订单;
提取所述订单的目标订单特征;
提取与所述订单相关联的服务请求者的目标请求者特征;
识别与服务提供者相关联的提供者终端;
提取所述服务提供者的目标提供者特征;
获得用于确定所述目标事件发生的概率的预测模型;以及
基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
33.根据权利要求32所述的方法,其中获得所述预测模型包括:
获得训练数据,所述训练数据包括多个正样本和多个负样本,所述多个正样本的每一个中所述目标事件没有发生,所述多个负样本的每一个目标事件已经发生,所述多个正样本和所述多个负样本中的每一个包括历史交易数据和对应于所述历史交易数据的历史事件数据;
从所述多个正样本和所述多个负样本的所述历史交易数据中提取多个候选特征;
对于所述多个正样本和所述多个负样本中的每一个,使用特征选择算法从所述多个候选特征中确定一个或多个目标特征;以及
基于所述多个正样本的所述一个或多个目标特征,所述多个负样本的所述一个或多个目标特征,和所述多个正样本和所述多个负样本的所述历史事件数据生成所述预测模型。
34.根据权利要求33所述的方法,其中获得所述预测模型进一步包括:
基于所述多个正样本和所述多个负样本确定所述训练数据,所述训练数据包括不平衡样本组成;以及
当判断出所述训练数据包括所述不平衡样本时,基于所述训练数据,使用样本平衡技术平衡所述样本组成。
35.根据权利要求34所述的方法,其中所述样本平衡技术包括对所述多个正样本进行欠采样。
36.如权利要求34或35所述的方法,其中所述样本平衡技术包括对所述多个负样本进行过采样。
37.根据权利要求36所述的方法,其中平衡所述样本组成进一步包括:
和使用K近邻(KNN)技术确定多个合成样本;以及
指定所述多个合成样品为负样本。
38.根据权利要求37所述的方法,其中使用所述KNN技术确定所述多个合成样本包括:
基于所述负样本的所述一个或多个目标特征,为所述多个负样本中的每一个生成特征向量;以及
为每个所述特征向量,
使用所述KNN技术确定所述特征向量的近邻的第一数目;
根据过采样率从近邻的所述第一数目中选择近邻的第二数目;以及
基于所述特征向量和近邻的所述第二个数目生成关于所述特征向量的合成样本。
39.根据权利要求32所述的方法,进一步包括:
经由所述至少一个第一信息交换端口从所述一个或多个请求者终端获得第一电子信号,所述第一电子信号包括与一个或多个目标服务请求者相关联的一个或多个目标订单;
识别可用于接收所述一个或多个订单的多个候选服务提供者;
通过将所述一个或多个目标服务请求者中的每一个与所述多个候选服务提供者中的每一个相关联来确定候选请求者-提供者对;
为每个所述候选请求者-提供者对,确定所述目标事件的发生概率;
至少部分地基于所述目标事件的所述发生概率和相应的候选请求者-提供者对分配一个或多个目标订单;以及
经由所述至少一个第二信息交换端口将第二电子信号发送到与所述多个服务提供者相关联的一个或多个提供者终端,所述第二电子信号包括所述分配的目标订单的信息。
40.根据权利要求32-39中任一项所述的方法,其中所述预测模型是极限梯度增强(Xgboost)模型。
41.根据权利要求32-40中任一项所述的方法,其中所述目标事件包括以下事件中的至少一个:攻击,性骚扰,杀害,醉酒,强奸,或抢劫。
42.一种非暂时性计算机可读介质,包括操作系统和至少一组指令,所述至少一组指令与所述操作系统兼容,用于确定目标事件的发生概率,其中当一个或多个电子设备的至少一个处理器执行时,所述至少一组指令指示所述至少一个处理器:
经由至少一个信息交换端口从请求者终端获得服务请求者的订单;
提取所述订单的目标订单特征;
提取与所述订单相关联的所述服务请求者的目标请求者特征;
识别与服务提供者相关联的提供者终端;
提取所述服务提供者的目标提供者特征;
获得用于确定所述目标事件发生的概率的预测模型;以及
基于所述目标订单特征,所述目标请求者特征和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
43.一种用于分配订单的人工智能系统,包括:
事件预测模块,被配置为确定订单的目标事件的发生概率;以及
订单分配模块,被配置为基于所述目标事件的所述发生概率分配所述订单。
44.根据权利要求43所述的系统,其中所述事件预测模块包括:
订单特征提取单元,被配置为提取订单的目标订单特征;
请求者特征提取单元,被配置为提取与所述订单相关联的服务请求者的目标请求者特征;
提供者特征提取单元,被配置为提取服务提供者的目标提供者特征;
模型确定单元,被配置为获取用于确定所述目标事件发生概率的预测模型;以及
事件预测单元,被配置为基于所述目标订单特征,所述目标请求者特征,和所述目标提供者特征,使用所述预测模型确定所述目标事件的所述发生概率。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2018/099587 WO2020029164A1 (en) | 2018-08-09 | 2018-08-09 | Systems and methods for allocating orders |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110998648A true CN110998648A (zh) | 2020-04-10 |
Family
ID=69406198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880002067.5A Pending CN110998648A (zh) | 2018-08-09 | 2018-08-09 | 一种分配订单的系统和方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20200051193A1 (zh) |
EP (1) | EP3635675A1 (zh) |
JP (1) | JP2020531933A (zh) |
CN (1) | CN110998648A (zh) |
AU (1) | AU2018286596A1 (zh) |
CA (1) | CA3028643A1 (zh) |
SG (1) | SG11201811698UA (zh) |
TW (1) | TW202009807A (zh) |
WO (1) | WO2020029164A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625571A (zh) * | 2020-05-28 | 2020-09-04 | 上海钧正网络科技有限公司 | 一种服务业务的匹配方法、装置、计算机设备和存储介质 |
CN111694884A (zh) * | 2020-06-12 | 2020-09-22 | 广元量知汇科技有限公司 | 基于大数据的智慧政务请求处理方法 |
CN111881375A (zh) * | 2020-07-28 | 2020-11-03 | 北京嘀嘀无限科技发展有限公司 | 一种顺路订单分配方法、装置、电子设备及可读存储介质 |
CN111931101A (zh) * | 2020-06-30 | 2020-11-13 | 汉海信息技术(上海)有限公司 | 信息推送方法、装置、电子设备及存储介质 |
CN112053116A (zh) * | 2020-09-10 | 2020-12-08 | 广州回头车信息科技有限公司 | 一种可拼车订单识别方法和装置 |
CN112330321A (zh) * | 2020-11-20 | 2021-02-05 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、电子设备和计算机可读存储介质 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200334524A1 (en) * | 2019-04-17 | 2020-10-22 | Here Global B.V. | Edge learning |
US11244466B2 (en) * | 2020-02-27 | 2022-02-08 | Dell Products L.P. | Automated capacity management using artificial intelligence techniques |
US20210365970A1 (en) * | 2020-05-20 | 2021-11-25 | Coupang Corp. | Systems and methods for optimizing cost of goods sold |
TWI742709B (zh) | 2020-06-04 | 2021-10-11 | 國立成功大學 | 預測機台加工事件發生的方法與其虛擬量測應用及其電腦程式產品 |
CN112766394B (zh) * | 2021-01-26 | 2024-03-12 | 维沃移动通信有限公司 | 建模样本生成方法及装置 |
CN113762980A (zh) * | 2021-03-29 | 2021-12-07 | 北京京东拓先科技有限公司 | 外呼订单分派方法、装置、设备及存储介质 |
CN113052345B (zh) * | 2021-03-29 | 2022-07-29 | 浙江吉利控股集团有限公司 | 一种预约订单的分配方法及分配系统 |
CN113450002A (zh) * | 2021-07-01 | 2021-09-28 | 京东科技控股股份有限公司 | 任务的分配方法、装置、电子设备及存储介质 |
CN116611664B (zh) * | 2023-06-13 | 2024-02-13 | 杭州派迩信息技术有限公司 | 一种地服标签管理系统及其装置、方法 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101430709A (zh) * | 2008-09-24 | 2009-05-13 | 腾讯科技(深圳)有限公司 | 近邻查找方法和装置 |
CN102521656A (zh) * | 2011-12-29 | 2012-06-27 | 北京工商大学 | 非平衡样本分类的集成迁移学习方法 |
CN102789578A (zh) * | 2012-07-17 | 2012-11-21 | 北京市遥感信息研究所 | 基于多源目标特征支持的红外遥感图像变化检测方法 |
CN103400144A (zh) * | 2013-07-17 | 2013-11-20 | 山东师范大学 | 一种基于k近邻的支持向量机主动学习的方法 |
CN104503436A (zh) * | 2014-12-08 | 2015-04-08 | 浙江大学 | 一种基于随机投影和k近邻的快速故障检测方法 |
CN105096166A (zh) * | 2015-08-27 | 2015-11-25 | 北京嘀嘀无限科技发展有限公司 | 一种订单分配的方法及装置 |
CN105975993A (zh) * | 2016-05-18 | 2016-09-28 | 天津大学 | 一种基于边界升采样的不平衡数据分类方法 |
CN105975992A (zh) * | 2016-05-18 | 2016-09-28 | 天津大学 | 一种基于自适应升采样的不平衡数据集分类方法 |
CN106503617A (zh) * | 2016-09-21 | 2017-03-15 | 北京小米移动软件有限公司 | 模型训练方法及装置 |
CN106909981A (zh) * | 2015-12-23 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 模型训练、样本平衡方法及装置以及个人信用评分系统 |
CN107644057A (zh) * | 2017-08-09 | 2018-01-30 | 天津大学 | 一种基于迁移学习的绝对不平衡文本分类方法 |
CN107704966A (zh) * | 2017-10-17 | 2018-02-16 | 华南理工大学 | 一种基于天气大数据的能源负荷预测系统及方法 |
CN107730006A (zh) * | 2017-09-13 | 2018-02-23 | 重庆电子工程职业学院 | 一种基于可再生能源大数据深度学习的建筑近零能耗控制器 |
CN107798390A (zh) * | 2017-11-22 | 2018-03-13 | 阿里巴巴集团控股有限公司 | 一种机器学习模型的训练方法、装置以及电子设备 |
CN107908819A (zh) * | 2017-10-19 | 2018-04-13 | 深圳和而泰智能控制股份有限公司 | 预测用户状态变化的方法和装置 |
EP3320530A1 (en) * | 2016-06-06 | 2018-05-16 | Beijing Didi Infinity Technology and Development Co., Ltd. | Systems and methods for allocating appointment orders |
CN108205766A (zh) * | 2016-12-19 | 2018-06-26 | 阿里巴巴集团控股有限公司 | 信息推送方法、装置及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8155877B2 (en) * | 2007-11-29 | 2012-04-10 | Microsoft Corporation | Location-to-landmark |
CN105118013A (zh) * | 2015-07-29 | 2015-12-02 | 北京嘀嘀无限科技发展有限公司 | 一种订单的分配方法及装置 |
US10540611B2 (en) * | 2015-05-05 | 2020-01-21 | Retailmenot, Inc. | Scalable complex event processing with probabilistic machine learning models to predict subsequent geolocations |
CN112149855A (zh) * | 2015-07-28 | 2020-12-29 | 北京嘀嘀无限科技发展有限公司 | 一种订单分配的方法及装置 |
US9734455B2 (en) * | 2015-11-04 | 2017-08-15 | Zoox, Inc. | Automated extraction of semantic information to enhance incremental mapping modifications for robotic vehicles |
CN107767197B (zh) * | 2016-08-16 | 2021-06-04 | 北京嘀嘀无限科技发展有限公司 | 一种订单分配的方法及服务器 |
CN106447114A (zh) * | 2016-09-30 | 2017-02-22 | 百度在线网络技术(北京)有限公司 | 提供叫车服务的方法和装置 |
US10720050B2 (en) * | 2016-10-18 | 2020-07-21 | Uber Technologies, Inc. | Predicting safety incidents using machine learning |
-
2018
- 2018-08-09 AU AU2018286596A patent/AU2018286596A1/en not_active Abandoned
- 2018-08-09 WO PCT/CN2018/099587 patent/WO2020029164A1/en unknown
- 2018-08-09 EP EP18819305.6A patent/EP3635675A1/en not_active Withdrawn
- 2018-08-09 JP JP2018568432A patent/JP2020531933A/ja active Pending
- 2018-08-09 CN CN201880002067.5A patent/CN110998648A/zh active Pending
- 2018-08-09 SG SG11201811698UA patent/SG11201811698UA/en unknown
- 2018-08-09 CA CA3028643A patent/CA3028643A1/en not_active Abandoned
- 2018-12-06 TW TW107143871A patent/TW202009807A/zh unknown
- 2018-12-27 US US16/234,286 patent/US20200051193A1/en not_active Abandoned
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101430709A (zh) * | 2008-09-24 | 2009-05-13 | 腾讯科技(深圳)有限公司 | 近邻查找方法和装置 |
CN102521656A (zh) * | 2011-12-29 | 2012-06-27 | 北京工商大学 | 非平衡样本分类的集成迁移学习方法 |
CN102789578A (zh) * | 2012-07-17 | 2012-11-21 | 北京市遥感信息研究所 | 基于多源目标特征支持的红外遥感图像变化检测方法 |
CN103400144A (zh) * | 2013-07-17 | 2013-11-20 | 山东师范大学 | 一种基于k近邻的支持向量机主动学习的方法 |
CN104503436A (zh) * | 2014-12-08 | 2015-04-08 | 浙江大学 | 一种基于随机投影和k近邻的快速故障检测方法 |
CN105096166A (zh) * | 2015-08-27 | 2015-11-25 | 北京嘀嘀无限科技发展有限公司 | 一种订单分配的方法及装置 |
CN106909981A (zh) * | 2015-12-23 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 模型训练、样本平衡方法及装置以及个人信用评分系统 |
CN105975993A (zh) * | 2016-05-18 | 2016-09-28 | 天津大学 | 一种基于边界升采样的不平衡数据分类方法 |
CN105975992A (zh) * | 2016-05-18 | 2016-09-28 | 天津大学 | 一种基于自适应升采样的不平衡数据集分类方法 |
EP3320530A1 (en) * | 2016-06-06 | 2018-05-16 | Beijing Didi Infinity Technology and Development Co., Ltd. | Systems and methods for allocating appointment orders |
CN106503617A (zh) * | 2016-09-21 | 2017-03-15 | 北京小米移动软件有限公司 | 模型训练方法及装置 |
CN108205766A (zh) * | 2016-12-19 | 2018-06-26 | 阿里巴巴集团控股有限公司 | 信息推送方法、装置及系统 |
CN107644057A (zh) * | 2017-08-09 | 2018-01-30 | 天津大学 | 一种基于迁移学习的绝对不平衡文本分类方法 |
CN107730006A (zh) * | 2017-09-13 | 2018-02-23 | 重庆电子工程职业学院 | 一种基于可再生能源大数据深度学习的建筑近零能耗控制器 |
CN107704966A (zh) * | 2017-10-17 | 2018-02-16 | 华南理工大学 | 一种基于天气大数据的能源负荷预测系统及方法 |
CN107908819A (zh) * | 2017-10-19 | 2018-04-13 | 深圳和而泰智能控制股份有限公司 | 预测用户状态变化的方法和装置 |
CN107798390A (zh) * | 2017-11-22 | 2018-03-13 | 阿里巴巴集团控股有限公司 | 一种机器学习模型的训练方法、装置以及电子设备 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625571A (zh) * | 2020-05-28 | 2020-09-04 | 上海钧正网络科技有限公司 | 一种服务业务的匹配方法、装置、计算机设备和存储介质 |
CN111694884A (zh) * | 2020-06-12 | 2020-09-22 | 广元量知汇科技有限公司 | 基于大数据的智慧政务请求处理方法 |
CN112258009A (zh) * | 2020-06-12 | 2021-01-22 | 广元量知汇科技有限公司 | 一种智慧政务请求处理方法 |
CN112258009B (zh) * | 2020-06-12 | 2021-10-26 | 新疆新创高科企业管理有限公司 | 一种智慧政务请求处理方法 |
CN111931101A (zh) * | 2020-06-30 | 2020-11-13 | 汉海信息技术(上海)有限公司 | 信息推送方法、装置、电子设备及存储介质 |
CN111881375A (zh) * | 2020-07-28 | 2020-11-03 | 北京嘀嘀无限科技发展有限公司 | 一种顺路订单分配方法、装置、电子设备及可读存储介质 |
CN111881375B (zh) * | 2020-07-28 | 2024-09-06 | 北京嘀嘀无限科技发展有限公司 | 一种顺路订单分配方法、装置、电子设备及可读存储介质 |
CN112053116A (zh) * | 2020-09-10 | 2020-12-08 | 广州回头车信息科技有限公司 | 一种可拼车订单识别方法和装置 |
CN112053116B (zh) * | 2020-09-10 | 2023-11-03 | 江苏运满满同城信息科技有限公司 | 一种可拼车订单识别方法和装置 |
CN112330321A (zh) * | 2020-11-20 | 2021-02-05 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、电子设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2020531933A (ja) | 2020-11-05 |
SG11201811698UA (en) | 2020-03-30 |
AU2018286596A1 (en) | 2020-02-27 |
CA3028643A1 (en) | 2020-02-09 |
EP3635675A4 (en) | 2020-04-15 |
WO2020029164A1 (en) | 2020-02-13 |
TW202009807A (zh) | 2020-03-01 |
US20200051193A1 (en) | 2020-02-13 |
EP3635675A1 (en) | 2020-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110998648A (zh) | 一种分配订单的系统和方法 | |
TWI676783B (zh) | 用於預估到達時間之方法及系統 | |
JP6797943B2 (ja) | サービスリクエストを割り振るシステムおよび方法 | |
WO2017088828A1 (en) | Systems and methods for allocating sharable orders | |
CN112236787B (zh) | 用于生成个性化目的地推荐的系统和方法 | |
GB2550523A (en) | Methods and systems for order processing | |
CN111316308B (zh) | 用于识别错误订单请求的系统及方法 | |
US20200300650A1 (en) | Systems and methods for determining an estimated time of arrival for online to offline services | |
EP3635706B1 (en) | Methods and systems for estimating time of arrival | |
CN109416823A (zh) | 用于确定司机安全分的系统和方法 | |
US20200193357A1 (en) | Systems and methods for allocating service requests | |
WO2019037549A1 (en) | SYSTEM AND METHOD FOR DESTINATION PREDICTION | |
CN111353092B (zh) | 服务推送方法、装置、服务器及可读存储介质 | |
TW201923663A (zh) | 用於線上到線下服務的系統和方法 | |
CN111104585B (zh) | 一种问题推荐方法及装置 | |
CN112243487A (zh) | 用于按需服务的系统和方法 | |
CN111259119A (zh) | 一种问题推荐方法及装置 | |
CN111353093B (zh) | 问题推荐方法、装置、服务器及可读存储介质 | |
CN110832513B (zh) | 用于按需服务的系统和方法 | |
CN111259229A (zh) | 一种问题推荐方法及装置 | |
US10990500B2 (en) | Systems and methods for user analysis | |
CN111353090B (zh) | 服务分流方法、装置、服务器及可读存储介质 | |
CN115605906A (zh) | 线上到线下服务的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200410 |