CN114418236A - 信息预测方法、装置、存储介质及电子设备 - Google Patents

信息预测方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN114418236A
CN114418236A CN202210122596.7A CN202210122596A CN114418236A CN 114418236 A CN114418236 A CN 114418236A CN 202210122596 A CN202210122596 A CN 202210122596A CN 114418236 A CN114418236 A CN 114418236A
Authority
CN
China
Prior art keywords
information
waybill
node
delay
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210122596.7A
Other languages
English (en)
Inventor
郝诗琦
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN202210122596.7A priority Critical patent/CN114418236A/zh
Publication of CN114418236A publication Critical patent/CN114418236A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开涉及信息处理领域,具体涉及一种信息预测方法、装置、存储介质及电子设备。该信息预测方法包括:获取在途运单的属性信息、实时路由信息、规划路由信息;根据所述实时路由信息提取已经过节点的流转信息作为部分流转信息;以及基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息;其中,所述全节点包括所述已经过节点和待经过节点;利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误结果。本公开提供的信息预测方法能够准确预测运单的延误情况。

Description

信息预测方法、装置、存储介质及电子设备
技术领域
本公开涉及信息处理领域,具体涉及一种信息预测方法、信息预测装置、存储介质及电子设备。
背景技术
在物流场景中,运单的配送时效是非常重要的指标,如果包裹不能够及时按时配送,将极大影响到用户体验,甚至对于有强烈时效需求的用户(如商家)也会造成经济损失。
然而,在实际的物流运输和配送过程中,由于爆仓、人力不足等原因周转不及时,可能导致妥投时间晚于承诺时效的情况。针对这种情况,对运单的延误情况进行预测,在运单延迟成为既定事实之前给出预警提示信息,能够辅助运营人员决策是否投入资源提前干预,可以有效降低运单延误风险,帮助物流企业提高服务水平。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种信息预测方法、信息预测装置、存储介质及电子设备,旨在准确预测运单的延误情况。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一个方面,提供了信息预测方法,包括:获取在途运单的属性信息、实时路由信息、规划路由信息;根据所述实时路由信息提取已经过节点的流转信息作为部分流转信息;以及基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息;其中,所述全节点包括所述已经过节点和待经过节点;利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误结果。
根据本公开的一些实施例,基于前述方案,所述所述基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息,包括:基于所述规划路由信息确定全节点中各节点的规划节点信息;其中,所述规划节点信息包括规划节点名称和规划经过时间;针对一节点,从节点历史信息中提取与所述规划节点名称匹配的目标节点历史信息;基于所述规划经过时间和所述目标节点信息按照预设粒度进行统计以得到所述节点的历史粒度统计信息;遍历全节点中的所有节点,得到各所述节点的历史粒度统计信息作为所述完整参照信息。
根据本公开的一些实施例,基于前述方案,所述利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误结果,包括:对所述属性信息、所述部分流转信息和所述完整参照信息进行特征加工得到带缺失的特征向量;将所述带缺失的特征向量输入至预先训练的延误预测模型中,以得到输出的预测延误概率。
根据本公开的一些实施例,基于前述方案,所述方法还包括:基于所述规划路由信息确定全节点的节点数量;选取与所述节点数量对应的延误预测模型进行预测。
根据本公开的一些实施例,基于前述方案,所述方法还包括预先训练所述延误预测模型,包括:获取历史运单的属性信息、实时路由信息和运单延误信息;根据所述历史运单的实时路由信息提取全节点的流转信息作为完整流转信息,以及确定全节点的历史粒度统计信息作为完整参照信息;基于随机生成的所述历史运单的当前节点,将所述完整流转信息中所述当前节点之后的节点的流转信息替换为缺失数据得到缺失流转信息;利用所述历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述延误预测模型。
根据本公开的一些实施例,基于前述方案,所述根据所述历史运单的实时路由信息确定全节点的历史粒度统计信息作为完整参照信息,包括:基于所述历史运单的实时路由信息确定全节点中各节点的规划节点信息;根据所述各节点的规划节点信息,基于节点历史信息确定各节点的历史粒度统计信息,以得到所述完整参照信息。
根据本公开的一些实施例,基于前述方案,所述利用所述历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述延误预测模型,包括:将节点数量相同的历史运单划分为同一运单样本集;利用所述同一运单样本集中的历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述节点数量对应的所述延误预测模型。
根据本公开的一些实施例,基于前述方案,所述利用所述同一运单样本集中的历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,包括:对所述历史运单的属性信息、缺失流转信息和完整参照信息进行特征加工得到所述历史运单的带缺失的特征向量;将所述历史运单的带缺失的特征向量输入至所述延误预测模型,获取所述历史运单的预测延误结果;将所述预测延误结果和所述运单延误信息进行比对,并根据对比结果,对所述延误预测模型的参数进行调整。
根据本公开的一些实施例,基于前述方案,在得到所述在途运单的预测延误结果之后,所述方法还包括:在所述预测延误结果中的预测延误概率大于预设阈值时,将所述在途运单确定为预测延误运单;基于所述预测延误运单生成预警信息。
根据本公开实施例的第二个方面,提供了一种信息预测装置,包括:获取模块,用于获取在途运单的属性信息、实时路由信息、规划路由信息;流转模块,用于根据所述实时路由信息提取已经过节点的流转信息作为部分流转信息;以及参照模块,用于基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息;其中,所述全节点包括所述已经过节点和待经过节点;预测模块,用于利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误概率。
根据本公开实施例的第三个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中的信息预测方法。
根据本公开实施例的第四个方面,提供了一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中的信息预测方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在本公开的一些实施例所提供的技术方案中,通过在途运单的实时路由信息获取运单的部分流转信息,以及通过在途运单的规划路由信息获取运单的完整参照信息,最后根据属性信息、部分流转信息和完整参照信息进行预测最终得到在途运单的预测延误结果。本公开提供的信息预测方法,一方面不仅利用在途运单的属性信息以及已经过节点的流转信息,还能够综合考虑在途运单全节点上的参照信息进行预测,能够充分利用在途运单相关的数据,进而得到更精准的预测结果;另一方面,对待经过节点的流转信息不进行缺失数值估计,而是直接根据缺失流转信息也能进行运单延误预测,可以平衡数据的非结构化特性,适用性更强。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出本公开示例性实施例中一种信息预测方法的流程示意图;
图2示意性示出本公开示例性实施例中一种模型训练的流程示意图;
图3示意性示出本公开示例性实施例中一种模型预测的流程示意图;
图4示意性示出本公开示例性实施例中一种信息预测装置的组成示意图;
图5示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图;
图6示意性示出本公开示例性实施例中一种电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在实际物流配送场景中,由于爆仓、人力不足等原因周转不及时,可能导致妥投时间晚于承诺时效的情况。因此,在运单运输过程中对延误情况进行预测,并根据预测结果及时给出预警提示信息,能够辅助运营人员提前进行干预,有效降低延误风险,帮助物流企业提高服务水平。
在现有的运单延误预警中,主要有以下几种方案:1)通过采集运单实时物流轨迹信息,对在环节中已经发生延误的或者在某个物流节点停留的时长超过了预设阈值的运单进行预警。2)对于物流网络中的物流线路的预警方案,对预先圈定的预警范围,在包裹吞吐量等超出处理能力上限时生成预警信息。3)使用机器学习的方法,通过从出库开始到当前节点的信息预测是否会发生延迟。
但以上的预警方案中往往只基于运单的某个流转环节进行预警,这样做很容易造成对运单履约的误判及漏判。例如,部分运单尽管在当前环节发生了延误,但从历史同线路的相似运单来看,大概率在后续环节可以追回这部分时长,这种情况下投入资源并没有太大意义。
另外,这些方法对实际的预警处理作用不大。例如部分运单从当前状态来看还没有延误风险,但根据规划线路信息其在后续环节有较大的延误倾向,如果在延误发生时才进行处理,可能很难补救。或者例如对圈定预警范围进行预警的方式,当物流节点没有爆发集中性问题前,是没有办法指导操作的。
而使用机器学习的方法通过出库到当前节点的信息建立模型对是否会延迟进行预测虽然可以考虑更多环节的信息,但由于运单经过的环节数不固定,相应的信息也是非结构化的,因此只能引入当前和之前环节的信息,不能很好地对后续节点的信息进行借鉴。
基于现有技术中的缺陷,本公开提供了一种信息预测方法,能够综合考虑运单规划的全环节的信息来对最终能否履约进行预判,解决现有技术无法平衡数据的非结构化特性和充分利用数据的缺点,得出更准确的预测结果,进而能够根据预测结果辅助决策,减少运单延误风险。
以下对本公开实施例的技术方案的实现细节进行详细阐述。
图1示意性示出本公开示例性实施例中一种信息预测方法的流程示意图。如图1所示,该信息预测方法包括步骤S1至步骤S4:
步骤S1,获取在途运单的属性信息、实时路由信息、规划路由信息;
步骤S2,根据所述实时路由信息提取已经过节点的流转信息作为部分流转信息;以及
步骤S3,基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息;其中,所述全节点包括所述已经过节点和待经过节点;
步骤S4,利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误结果。
在本公开的一些实施例所提供的技术方案中,通过在途运单的实时路由信息获取运单的部分流转信息,以及通过在途运单的规划路由信息获取运单的完整参照信息,最后根据属性信息、部分流转信息和完整参照信息进行预测最终得到在途运单的预测延误结果。本公开提供的信息预测方法,一方面不仅利用在途运单的属性信息以及已经过节点的流转信息,还能够综合考虑在途运单全节点上的历史粒度统计信息进行预测,能够充分利用在途运单相关的数据,进而得到更精准的预测结果;另一方面,对待经过节点的流转信息不进行缺失数值估计,而是直接根据缺失流转信息也能进行运单延误预测,可以平衡数据的非结构化特性,适用性更强。
下面,将结合附图及实施例对本示例实施方式中的信息预测方法的各个步骤进行更详细的说明。
在步骤S1中,获取在途运单的属性信息、实时路由信息、规划路由信息。
在本公开的一个实施例中,在途运单是指处于物流运输过程中的运单,而运单实际上就是物流运输场景下针对用户订单生成的运输单据,是指承运人与托运人之间关于货物运输事宜的书面契约,整个运输过程中,运单是进行各项运输作业和处理有关事项的基本依据。
由于物流操作的流程化和规划化,运单在运输过程中都需要历经多个场地,例如一级分拣中心、二级分拣中心、站点等等,在每一个场地处有时还需历经多个节点,例如分拣中心需要历经揽收、分拣验货、发货等。
运单在出库之前,就已经确定了该运单的属性,并且已经规划好了该运单的配送路径。因此,在途运单的属性信息和规划路由信息通常情况是不变的,是从运单出库时就确定了的。
运单的属性信息例如运单是否为生鲜、是否跨区,业务类型是B网营业厅、B2B快运零担还是B2B仓配零担等等属性。而规划路由信息也就是提前预估的该运单的静态路由信息,例如该运单在何时到达何地,经过哪些分拣场地等。
在途运单的实时路由信息是根据实际的运输过程实时获取,能够体现运单对应的商品在运输过程中的真实情况。例如该运单对应商品目前到达的场地,以及每一场地中各节点的完成情况,例如操作时间、操作人员等信息。
在本公开的一个实施例中,路由系统会实时收集到物流运作过程中工作人员上传的各物流环节实时路由信息。之后可以通过输入在途运单的运单号,从路由系统中查询得到该运单的属性信息、实时路由信息以及规划路由信息。
在进行运单延误预测时,除了运单的属性信息,本公开着重使用了两种类型的数据作为特征,来分析其与最终是否晚点的关联性。一种信息为运单在每个环节处的相关状态,如运单到达该环节的时间与计划时间的差异,也就是各节点的流转信息;另一种信息是运单所经过和即将经过的各个环节本身的一些信息,如所对应环节在历史上处理的运单数量,所处理的运单中延迟的比例等,也就是各节点的参照信息。
由于每个环节本身的信息可以通过对历史数据的统计信息获得,因此这部分数据不会缺失,而运单在各个环节的状态,由于在途的运单在后续环节的状态还未发生,无法获得,所以需要设置为缺失数据。
因此,在预测之前,还需要执行步骤S2得到已经过节点的流转信息,以及执行步骤S3得到全节点的参照信息。需要说明的是,本公开对步骤S2和步骤S3的执行顺序不做限定,可以先执行步骤S2,也可以先执行步骤S3,或者还可以同时执行。
在步骤S2中,根据所述实时路由信息提取已经过节点的流转信息作为部分流转信息。
在本公开的一个实施例中,实时路由信息中包含了该在途运单截止目前的实际配送结果,其中有路由信息记录都是在物流环节中已经过的节点,因此从中可以提取出运单在已经过节点的流转信息。
需要注意的时,每一个已经过的节点都有其对应的流转信息。具体来说,流转信息可以是该节点的操作时间,例如揽收到分拣验货时间、分拣验货到发货时间、站点验货到配送员收货时间、配送员收货到计划妥投时间以及分拣到站点、站点到站点的运输时长等等。当然也可以是该节点的起始时间等,可以根据实际情况进行相应的配置。
由于在途运单还没有配送完成,所以只有已经过节点的流转信息,而没有待经过节点的流转信息。因此,相对于在途运单的全节点来说,流转信息算是缺少待经过节点流转信息的“部分”流转信息。
在步骤S3中,基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息;其中,所述全节点包括所述已经过节点和待经过节点。
在本公开的一个实施例中,所述基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息,包括:
步骤S31,基于所述规划路由信息确定全节点中各节点的规划节点信息;其中,所述规划节点信息包括规划节点名称和规划经过时间;
步骤S32,针对一节点,从节点历史信息中提取与所述规划节点名称匹配的目标节点历史信息;
步骤S33,基于所述规划经过时间和所述目标节点信息按照预设粒度进行统计以得到所述节点的历史粒度统计信息;
步骤S34,遍历全节点中的所有节点,得到各所述节点的历史粒度统计信息作为所述完整参照信息。
接下来,对步骤S31至步骤S34的各个步骤进行详细解释:
在步骤S31中,基于所述规划路由信息确定全节点中各节点的规划节点信息。
在本公开的一个实施例中,由于规划路由信息中包括了该在途运单预估的全节点,也就是当前已经过的节点和待经过的节点,所以根据规划路由信息可以获取到全节点中各节点的规划节点信息。
其中,规划节点信息包括规划节点名称和规划经过时间,也就是该在途运单应当在何时经过何地。
接下来的步骤S32和步骤S33是针对全节点中的每一个节点而言,针对每一节点,都可以利用该节点的规划节点信息获取该节点的历史粒度统计信息,进而得到完整参照信息的过程。这个节点是全节点中的任一节点,可以是已经过节点或者待经过节点,之后再通过步骤S34进行遍历。
在步骤S32中,针对一节点,从节点历史信息中提取与所述规划节点名称匹配的目标节点历史信息。
在本公开的一个实施例中,节点历史信息是对途经该节点所有运单的相关操作数据的记录信息。举例来说,可以是运单的操作时长、途经该节点的运单是否达成履约等,也可以是这些信息的任意组合。
每个节点对应有该节点的节点历史信息,利用规划节点名称从节点历史信息中提取出与该名称匹配的节点历史信息,也就是目标节点历史信息。
在步骤S33中,基于所述规划经过时间和所述目标节点信息按照预设粒度进行统计以得到所述节点的历史粒度统计信息。
其中,粒度是统计时的参考信息,统计时可以按照不同的粒度进行统计。举例而言,可以是按天粒度统计,也就是可以统计一天内该节点的运单平均操作时长、一天内途经该节点的运单履约达成比例等等。当然粒度也可以是比天跨度小的小时,或者是跨度较大的周、月等等。预设粒度可以根据实际需求进行灵活配置和调整。
规划节点信息还包括规划经过时间,为了确保历史粒度统计信息的时效性和准确性,所以需要根据规划经过时间来确定。具体地,根据参考规划经过时间进行统计就是指需要基于规划经过时间确定一个与之相关联的时间,再从目标节点历史信息提取该时间对应的统计信息作为参照信息,以确保历史粒度统计信息可用。
比如,统计粒度为天,规划经过时间为12月2日,则可以选取规划经过时间中与规划日期最近一天(12月1日)有操作的统计信息,作为参照信息。
当然,还可以基于规划经过时间确定多个时间,将这多个时间的统计信息进行综合得到参照信息。比如,如果统计粒度为小时,可以提取规划小时之前几小时的统计信息,并取均值来作为参照信息。
需要说明的是,在确定历史粒度统计信息时可以根据需要按照不同的预设规则来确定,本公开的实施例仅是示例性说明,并不能限制本公开。
在本公开的一个实施例中,除了根据预设粒度和规划经过时间进行粒度统计之外,还可以在获取到节点历史信息之后直接预先按照预设粒度提前对各个节点处的信息进行统计,而后再根据规划经过时间从中提取与规划经过时间相关联的统计信息即可,这样一来可以减少计算过程,提高计算的速度。
在步骤S34中,遍历全节点中的所有节点,得到各所述节点的历史粒度统计信息作为所述完整参照信息。
对全节点的每一个节点,都可以根据节点的规划信息确定该节点对应的历史粒度统计信息。通过遍历全节点中所有节点,可以整合得到全节点的历史粒度统计信息。
由于规划路由信息中获取的是该运单的全节点,因此可以获取全节点中各个节点的历史粒度统计信息用来参照,因此又可以称之为“完整”参照信息。
步骤S4,利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误概率。
在本公开的一个实施例中,可以利用预先训练好的延误预测模型进行预测,预测模型的输入是在途运单的特征向量,输出时该在途运单的预测延误概率。
因此,所述利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误结果,包括:
步骤S41,对所述属性信息、所述部分流转信息和所述完整参照信息进行特征加工得到带缺失的特征向量;
步骤S42,将所述带缺失的特征向量输入至预先训练的延误预测模型中,以得到输出的预测延误概率。
需要注意的是,特征向量是具有结构化维度的向量,其维度与在途运单的全节点数量有关,运单的全节点数量不同,对应的特征向量的维度也不同。
因此,在本公开的一个实施例中,所述方法还包括:基于所述规划路由信息确定全节点的节点数量;选取与所述节点数量对应的延误预测模型进行预测。
具体地,为了便于利用不同维度的特征向量进行预测,设计多个维度对应的延误预测模型。在使用时,首先获取全节点的节点数量,以此来确定用于预测的模型。
但对于具有相同的全节点数量时,属性信息和完整参照信息的维度是相同的,而由于待预测的在途运单当前所在的节点不同,为了得到结构化维度的向量,就存在着带有缺失数据的特征向量。
目前在有缺失数据的情况下进行分类的方法大致分为两个路线,第一种是把缺失数据用统计或机器学习的方法估计出来,再进行分类;第二种是在不对缺失数据进行估计的前提下,使用统计学手段分析缺失数据和所属分类的联合分布情况,进而预测出该样本所属的类别。
由于在途运单有可能缺失较多的环节信息,需要估计的值也较多,而由于每个环节都存在一定的不确定性,估计也都会存在一定误差,在估计多个值的情况下,每个取值的估计误差会累积产生更大的误差,进而对最终的分类结果造成较大影响。因此,在本公开中采用第二种方法,不预测缺失值,而是直接将其视为缺失信息。
具体地址,在步骤S41中进行特征加工时,运单i所对应的特征可以用向量Xi表示,根据属性信息、部分流转信息和完整参照信息确定特征值对应的字段,没有的流转信息可以用特殊字符“#”表示,或者其他字符表示,因此得到的在途运单的特征向量就是带缺失的特征向量。
需要说明的是,此处对缺失信息仅是用缺失字符表示,而并没有如现有技术中常用的配置相应的缺失值。由于减少了配置缺失值这一过程,使得本公开提供的技术方案在缺失信息的前提下,不设置缺失值也可以完成信息预测,降低了方案的复杂度。
之后将带缺失的特征向量输入至选取的与节点数量对应的延误预测模型中,得到该模型输出的预测延误结果,例如预测延误概率、预测时间,预测延误等级等。
在本公开的一个实施例中,在步骤S41之前,还需要预先训练延误预测模型,因此,所述方法还包括步骤S40:预先训练所述延误预测模型,具体内容如下:
步骤S401,获取历史运单的属性信息、实时路由信息和运单延误信息;
步骤S402,根据所述历史运单的实时路由信息提取全节点的流转信息作为完整流转信息,以及确定全节点的历史粒度统计信息作为完整参照信息;
步骤S403,基于随机生成的所述历史运单的当前节点,将所述完整流转信息中所述当前节点之后的节点的流转信息替换为缺失数据得到缺失流转信息;
步骤S404,利用所述历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述延误预测模型。
接下来,对各个步骤进行详细解释:
在步骤S401中,获取历史运单的属性信息、实时路由信息和运单延误信息。
具体地,可以从历史数据中获取已经妥投的历史运单。已经妥投的历史运单也就是已经完成的订单。
妥投的历史运单对应有一个运单完成的结果,在本公开中关注的是运单延误,因此已经妥投的历史运单的结果有两种,一种是按配送时效准时到达的未延迟运单,另一种是未按配送时效准时到达延迟运单两种类型。因此,在实际的业务中,已经妥投的运单有是否按时送达的记录,将其作为历史运单的运单延误信息。
运单延误信息可以分为延误与不延误,例如可以用正负标签表示,例如标签Yi∈{0,1}表示,其中1为延迟,0为未延迟。也可以将延误的运单按延误时间进行分级,例如轻度延误、中度延误、严重延误。
另外,与在途运单类似,也可以获取这些历史运单的属性信息和实时路由信息。
运单的属性信息例如运单是否为生鲜、是否跨区,业务类型是B网营业厅、B2B快运零担还是B2B仓配零担等等属性。而规划路由信息也就是提前预估的该运单的静态路由信息,例如该运单在何时到达何地,经过哪些分拣场地等。
运单的实时路由信息是根据实际的运输过程实时获取,能够体现运单对应的商品在运输过程中的真实情况。例如该运单对应商品目前到达的场地,以及每一场地中各节点的完成情况,例如操作时间、操作人员等信息。
在本公开的一个实施例中,在选取已经妥投的历史运单时,可以选取预设天数内的运单,也可以选择预设天数内的运单,或者按照节点数量选择,例如节点数为8的运单选取500条,节点数为10的运单选取500条等等。
当然,不仅如此,还可以目前的情况选取与该情况相似的运单进行分析。如果预测时正处于“双11”旺季,那么可以从历史数据调取同样处于旺季时的妥投订单,更具有参考性,还可例如按照月份、季节、所处位置环境、天气等这些会影响运单运输的因素来从历史数据调取相应的历史运单。
在步骤S402中,根据所述历史运单的实时路由信息提取全节点的流转信息作为完整流转信息,以及确定全节点的历史粒度统计信息作为完整参照信息。
进一步地,步骤S402具体包括以下各个步骤:基于所述历史运单的实时路由信息确定全节点中各节点的规划节点信息;根据所述各节点的规划节点信息,基于节点历史信息确定各节点的历史粒度统计信息,以得到所述完整参照信息。
具体而言,获取的历史运单的流转信息与在途运单方法相同,但结果不同,由于历史运单是已经配送完毕的运单,因此可以获取全节点的流转信息,即完整流转信息。
提取历史运单的完整参照信息的过程与在途运单的过程类似,只是因为历史运单各节点的信息可以根据实时路由信息确定,所以不需要根据规划路由信息,而可以直接利用历史运单的实时路由信息获取。在此处就不做过多赘述,具体可参照之前的步骤解释。
在步骤S403中,基于随机生成的所述历史运单的当前节点,将所述完整流转信息中所述当前节点之后的节点的流转信息替换为缺失数据得到缺失流转信息。
具体而言,妥投的历史运单的样本是不含有缺失值的,如果直接把这些样本作为训练数据,由于训练阶段数据没有缺失,模型无法学习到将缺失值如何分配才是最优策略,这样对未妥投运单进行预测时,无法充分利用历史运单中的信息,得到的预测结果也会不准确。
因此,本公开提供的信息预测方法自行构造一定的含有缺失特征取值的运单样本,可以先随机产生一个运单当前所在的环节,然后把后续环节状态信息对应的字段取值抹去并替换成缺失值。
举例来说,一个运单需要经过5个环节送达,那么在构造样本时,假设该运单处在第3个环节,则把最后两个环节对应的状态信息全部用缺失值代替。
上述方法虽然能够使模型学习到处理缺失数据的方法,但由于所构建出的样本后续的状态信息全部消失,在所有样本中,越靠后的环节对应的缺失数据越多,容易使模型无法很好对这些特征进行学习。因此,可以进行数据增强,例如在生成样本时,以30%的概率随机保留后续一个环节的状态值。
在步骤S404中,利用所述历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述延误预测模型。
进一步地,步骤S404具体包括以下各个步骤:将节点数量相同的历史运单划分为同一运单样本集;利用所述同一运单样本集中的历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述节点数量对应的所述延误预测模型。
在本公开的一个实施例中,由于节点数量不同的运单对应的运单维度不同,因此需要将不同的维度的运单区分开来训练,进而得到该维度下的预测模型。
具体地,节点数量可以根据分拣场地数确定,分拣场地数固定,则节点数量固定。例如一个从北京运送至西安的运单,需要经过北京仓库-北京(一级)分拣中心-西安(二级)分拣中心-站点;还可例如一个从北京运送至兰州的运单,需要经过北京仓库-北京(一级)分拣中心-西安(二级)分拣中心-兰州(三级)分拣中心-站点。
因此,在划分运单原本集时,可以通过运单的路由信息确定该运单的分拣场地的数量,分拣场地数量相同,即节点数量相同,然后将这些运单划分为一个运单样本集。
对于每一个运单样本集,利用其中的运单数据进行模型训练,训练所得到的模型以数据文件的格式存放在大数据平台,并为每一个模型配置相应的标识,来用于根据在途运单的节点数量进行查询对应的预测模型。
在本公开的一个实施例中,所述利用所述同一运单样本集中的历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,包括:
步骤(一)、对所述历史运单的属性信息、缺失流转信息和完整参照信息进行特征加工得到所述历史运单的带缺失的特征向量;
步骤(二)、将所述历史运单的带缺失的特征向量输入至所述延误预测模型,获取所述历史运单的预测延误结果;
步骤(三)、将所述预测延误结果和所述运单延误信息进行比对,并根据对比结果,对所述延误预测模型的参数进行调整。
具体地,首先还是需要将历史运单的特征数据进行映射得到特征向量,该特征向量也是缺失部分节点的流转信息的带缺失的特征向量。
在模型训练时,本公开采用决策树的方式来处理存在缺失数据情况下的问题。与基于参数的机器学习算法(如神经网络)相比,决策树类的算法对特征的取值空间进行分割,最终每个子空间的样本对应到一个特定的标签。在对空间进行分割时,使用信息增益等指标计算最优的分割位置(即决策树节点的分裂位置),并优先选择能够获得最大信息增益的特征进行分割。在分割的过程中,可以把缺失值分配到能够最优化信息增益的子空间中。
具体而言,本公开使用LightGBM算法。LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架,可用于排序,分类,回归以及很多其他的机器学习任务中。该算法在使用决策树算法进行分类的同时,使用了集成学习、直方图、单边梯度采样和特征绑定等策略以进一步提升算法效果。
梯度提升树模型(GBDT)在每一步拟合损失函数的负梯度。梯度提升树模型是计算损失函数在当前模型的负梯度值,作为下一次模型训练的目标函数,每次迭代时沿着损失函数的负梯度方向移动,最终损失函数越来越小,得到越来越精确的模型。
对于分类问题来说,每棵Cart回归树学习的是上个模型的残差。LightGBM在决策树节点分裂时采用了直方图算法,首先对样本按特征进行分桶,这样在节点分裂时只需遍历各个特征桶,而非全部样本。在处理缺失特征时,模型分别考虑了将其划分到右侧及左侧节点的信息增益,即在节点分裂的时候分别按照从左向右、从右向左的顺序依次将缺失值划分到左右侧节点,最终选择使得信息增益最大的分裂方式。
在分裂过程中,将当前所要进行分裂的节点中所含有的样本个数(即当前子空间内样本的个数)表示为N,该节点所对应的特征表示为f(含有缺失值),每个样本在当前所对应的梯度(即LightGBM中上一个决策树所对应的残差)表示为gn。因此,决策树选择分裂节点的具体过程如下:
1.使用LightGBM中的直方图算法将所有的特征进行分箱(bin),其中缺失数据自成一个箱,非缺失值箱的总数为Kf。第k个箱中所有样本的数量和梯度和分别记为H[k].n和H[k].g。
2.初始化SL=0,NL=0。对于k=1,2,…,Kf
(1)将bin k加入左子树,计算SL+=H[k].g;NL+=H[k].n;
(2)计算SR=G-SL,NR=N-NL
(3)计算分裂的方差增益
Figure BDA0003499075780000171
3.初始化SR=0,NR=0。对于k=1,2,…,Kf
(1)将bin k加入右子树,计算SR+=H[k].g;NR+=H[k].n;
(2)计算SL=G-SR,NL=N-NR
(3)计算分裂的方差增益
Figure BDA0003499075780000172
4.选择最大的方差增益作为最终的节点分裂方式。
其中,2.(1),2.(2)和2.(3)是将缺失值分到右子树,以此为基础再计算分裂其它的箱能够带来的最大增益,3.(1),3.(2)和3.(3)是将缺失值分到左子树,以此为基础再计算分裂其它的箱能够带来的最大增益。最终,将缺失值分到右子树和左子树的所有分裂方法一起比较,能够带来最大增益的分裂方式最终被选用。
通过LightGBM算法对历史运单的特征向量进行预测,得到模型初始预测的结果,而历史运单的真实延误信息是已知的,通过预测结果进而真实结果计算损失函数,以此来调整预测模型的参数,直至得到训练好的延误预测模型。
在本公开的一个实施例中,在得到所述在途运单的预测延误结果之后,所述方法还包括:在所述预测延误结果中的预测延误概率大于预设阈值时,将所述在途运单确定为预测延误运单;基于所述预测延误运单生成预警信息。
为了使运单的预测延误结果指导实践操作,可以根据预测结果输出相应的预警信息,以辅助运营人员决策。因此在预测结果为预测在途运单的预测延误概率时,可以预设一个阈值,一旦概率高于给定的阈值,则认为该运单有较大的延迟风险,将预警信息发送给相关运营人员,帮助其提前决策,减少风险。
基于上述方法,本公开本方案提出了一种快运场景下,综合考虑规划线路信息以及物流流转状态的运单时效预警方案,能够准确地预测在途地运单是否会发生延迟,在运单延迟成为既定事实之前给出预警提示信息,辅助运营人员决策是否投入资源提前干预。
在技术上,本方案将对未妥投运单预测的问题抽象为一个存在缺失值情况下的分类问题,将运单所在环节的后续环节信息视为缺失数据,进而在训练过程中更好地利用未来信息。同时,本方案采用了决策树的方法实现存在缺失数据情况下的分类,具有较好的预测精度。
图2示意性示出本公开示例性实施例中一种模型训练的流程示意图。参考图2所示,模型训练的主要过程包括:
步骤S201,按照分拣场地数加工近十天妥投运单的属性信息、流转信息;其中,选取的历史订单是近十天妥投运单,可以对属性和流转信息进行特征加工得到特征值。
步骤S202,加工场地粒度统计信息表存入hive表;也就是提前获取节点历史信息以便于使用。
步骤S203,将场地统计信息按照静态计划时间关联到运单,并将运单展开成不同流转状态;静态计划时间也就是路由规划信息中该节点的规划节点时间,步骤S203是为了得到各节点的参照信息。
步骤S204,按照分拣场地数分别训练LightGMB预测模型,并将模型持久化到文件。
图3示意性示出本公开示例性实施例中一种模型预测的流程示意图。参考图3所示,在使用模型时,步骤如下:
步骤S301,实时加工运单的属性信息、流转信息以及参照信息;
步骤S302,按照规划路由信息中的分拣场地数,输入相应模型得到预测概率;
步骤S303,对预测概率高于预设阈值的运单打上预警标识。
基于上述描述,本公开提供的信息预测方法中通过使用LightGBM算法进行模型训练,能够在预测时对有缺失值的样本不需要提前估计缺失值来进行预测,并且预测结果也更为优异。
在现有技术中,论文R.Gong,S.H.Huang and T.Chen,"Robust and EfficientRule Extraction Through Data Summarization and Its Application in WeldingFault Diagnosis,"in IEEE Transactions on Industrial Informatics,vol.4,no.3,pp.198-206,Aug.2008一文中也是采用不需要提前估计出缺失值的处理方法。下面,将本公开的预测结果与该论文中提出的方法进行对比,来详细说明本公开中方法的有益效果。
在对比试验中共选取1128173个样本进行训练,131076个样本进行测试,构建的运单样本与本方法过程相同,都是进行数据缺失处理随机构建模拟真实在途运单的样本。按照运单对应的分拣场地的个数进行分组,分别统计其AUC(Area under Curve),精确率(Precision)和召回率(Recall),最后再整体进行统计。表1示出的是本公开的预测统计结果,表2示出的是对比论文的预测统计结果。
表1本公开的预测统计结果
Figure BDA0003499075780000191
表2对比论文的预测统计结果
Figure BDA0003499075780000192
Figure BDA0003499075780000201
参考表1和表2,可以看出相较于对比论文,本公开提供的方法在任何一种情况下都具有更好的效果,AUC综合相比提升了约0.2左右,精确率和召回率也都有较为客观的结果。
基于上述描述,本公开提供了一种信息预测方法,能够综合考虑运单的规划线路信息以及物流流转状态进行延误预测,并配置相应的预警方案,可以准确地预测在途地运单是否会发生延迟,在运单延迟成为既定事实之前给出预警提示信息,辅助运营人员决策是否投入资源提前干预。
并且本公开的方法将对未妥投运单预测的问题抽象为一个存在缺失值情况下的分类问题,将运单所在环节的后续环节信息视为缺失数据,进而在训练过程中更好地利用未来信息。
同时在技术上也提供了一种采用决策树的方法实现存在缺失数据情况下的分类,根据对比实验结果,可以看出相较于现有技术,能够得到更精准的预测概率,达到更好的预测效果。
图4示意性示出本公开示例性实施例中一种信息预测装置的组成示意图,如图4所示,该信息预测装置400可以包括获取模块401、流转模块402、参照模块403以及预测模块404。其中:
获取模块401,用于获取在途运单的属性信息、实时路由信息、规划路由信息;
流转模块402,用于根据所述实时路由信息提取已经过节点的流转信息作为部分流转信息;以及
参照模块403,用于基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息;其中,所述全节点包括所述已经过节点和待经过节点;
预测模块404,用于利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误概率。
根据本公开的示例性实施例,所述参照模块403用于基于所述规划路由信息确定全节点中各节点的规划节点信息;其中,所述规划节点信息包括规划节点名称和规划经过时间;针对一节点,从节点历史信息中提取与所述规划节点名称匹配的目标节点历史信息;基于所述规划经过时间和所述目标节点信息按照预设粒度进行统计以得到所述节点的历史粒度统计信息;遍历全节点中的所有节点,得到各所述节点的历史粒度统计信息作为所述完整参照信息。
根据本公开的示例性实施例,所述预测模块404用于对所述属性信息、所述部分流转信息和所述完整参照信息进行特征加工得到带缺失的特征向量;将所述带缺失的特征向量输入至预先训练的延误预测模型中,以得到输出的预测延误概率。
根据本公开的示例性实施例,所述预测模块404还包括选择单元(图中未示出),所述选择单元用于基于所述规划路由信息确定全节点的节点数量;选取与所述节点数量对应的延误预测模型进行预测。
根据本公开的示例性实施例,所述预测模块404还包括训练单元(图中未示出)用于预先训练所述延误预测模型,包括:获取历史运单的属性信息、实时路由信息和运单延误信息;根据所述历史运单的实时路由信息提取全节点的流转信息作为完整流转信息,以及确定全节点的历史粒度统计信息作为完整参照信息;基于随机生成的所述历史运单的当前节点,将所述完整流转信息中所述当前节点之后的节点的流转信息替换为缺失数据得到缺失流转信息;利用所述历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述延误预测模型。
根据本公开的示例性实施例,所述训练单元还包括获取单元,用于基于所述历史运单的实时路由信息确定全节点中各节点的规划节点信息;根据所述各节点的规划节点信息,基于节点历史信息确定各节点的历史粒度统计信息,以得到所述完整参照信息。
根据本公开的示例性实施例,所述训练单元还包括划分单元,用于将节点数量相同的历史运单划分为同一运单样本集;利用所述同一运单样本集中的历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述节点数量对应的所述延误预测模型。
根据本公开的示例性实施例,所述训练单元还包括调整单元,用于对所述历史运单的属性信息、缺失流转信息和完整参照信息进行特征加工得到所述历史运单的带缺失的特征向量;将所述历史运单的带缺失的特征向量输入至所述延误预测模型,获取所述历史运单的预测延误结果;将所述预测延误结果和所述运单延误信息进行比对,并根据对比结果,对所述延误预测模型的参数进行调整。
根据本公开的示例性实施例,所述信息预测装置400还包括预警模块(图中未示出),所述预警模块用于在得到所述在途运单的预测延误结果之后,在所述预测延误结果中的预测延误概率大于预设阈值时,将所述在途运单确定为预测延误运单;基于所述预测延误运单生成预警信息。
上述的信息预测装置400中各模块的具体细节已经在对应的信息预测方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的存储介质。图5示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图,如图5所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品500,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如手机上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。图6示意性示出本公开示例性实施例中一种电子设备的计算机系统的结构示意图。
需要说明的是,图6示出的电子设备的计算机系统600仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(Central Processing Unit,CPU)601,其可以根据存储在只读存储器(Read-Only Memory,ROM)602中的程序或者从存储部分608加载到随机访问存储器(Random Access Memory,RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM602以及RAM 603通过总线604彼此相连。输入/输出(Input/Output,I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本公开的系统中限定的各种功能。
需要说明的是,本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (12)

1.一种信息预测方法,其特征在于,包括:
获取在途运单的属性信息、实时路由信息、规划路由信息;
根据所述实时路由信息提取已经过节点的流转信息作为部分流转信息;以及
基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息;其中,所述全节点包括所述已经过节点和待经过节点;
利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误结果。
2.根据权利要求1所述的信息预测方法,其特征在于,所述基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息,包括:
基于所述规划路由信息确定全节点中各节点的规划节点信息;其中,所述规划节点信息包括规划节点名称和规划经过时间;
针对一节点,从节点历史信息中提取与所述规划节点名称匹配的目标节点历史信息;
基于所述规划经过时间和所述目标节点信息按照预设粒度进行统计以得到所述节点的历史粒度统计信息;
遍历全节点中的所有节点,得到各所述节点的历史粒度统计信息作为所述完整参照信息。
3.根据权利要求1所述的信息预测方法,其特征在于,所述利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误结果,包括:
对所述属性信息、所述部分流转信息和所述完整参照信息进行特征加工得到带缺失的特征向量;
将所述带缺失的特征向量输入至预先训练的延误预测模型中,以得到输出的预测延误概率。
4.根据权利要求3所述的信息预测方法,其特征在于,所述方法还包括:
基于所述规划路由信息确定全节点的节点数量;
选取与所述节点数量对应的延误预测模型进行预测。
5.根据权利要求3所述的信息预测方法,其特征在于,所述方法还包括预先训练所述延误预测模型,包括:
获取历史运单的属性信息、实时路由信息和运单延误信息;
根据所述历史运单的实时路由信息提取全节点的流转信息作为完整流转信息,以及确定全节点的历史粒度统计信息作为完整参照信息;
基于随机生成的所述历史运单的当前节点,将所述完整流转信息中所述当前节点之后的节点的流转信息替换为缺失数据得到缺失流转信息;
利用所述历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述延误预测模型。
6.根据权利要求5所述的信息预测方法,其特征在于,所述根据所述历史运单的实时路由信息确定全节点的历史粒度统计信息作为完整参照信息,包括:
基于所述历史运单的实时路由信息确定全节点中各节点的规划节点信息;
根据所述各节点的规划节点信息,基于节点历史信息确定各节点的历史粒度统计信息,以得到所述完整参照信息。
7.根据权利要求5所述的信息预测方法,其特征在于,所述利用所述历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述延误预测模型,包括:
将节点数量相同的历史运单划分为同一运单样本集;
利用所述同一运单样本集中的历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,以得到所述节点数量对应的所述延误预测模型。
8.根据权利要求7所述的信息预测方法,其特征在于,所述利用所述同一运单样本集中的历史运单的属性信息、运单延误信息、缺失流转信息和完整参照信息进行模型训练,包括:
对所述历史运单的属性信息、缺失流转信息和完整参照信息进行特征加工得到所述历史运单的带缺失的特征向量;
将所述历史运单的带缺失的特征向量输入至所述延误预测模型,获取所述历史运单的预测延误结果;
将所述预测延误结果和所述运单延误信息进行比对,并根据对比结果,对所述延误预测模型的参数进行调整。
9.根据权利要求1所述的信息预测方法,其特征在于,在得到所述在途运单的预测延误结果之后,所述方法还包括:
在所述预测延误结果中的预测延误概率大于预设阈值时,将所述在途运单确定为预测延误运单;
基于所述预测延误运单生成预警信息。
10.一种信息预测装置,其特征在于,包括:
获取模块,用于获取在途运单的属性信息、实时路由信息、规划路由信息;
流转模块,用于根据所述实时路由信息提取已经过节点的流转信息作为部分流转信息;以及
参照模块,用于基于所述规划路由信息确定全节点的历史粒度统计信息作为完整参照信息;其中,所述全节点包括所述已经过节点和待经过节点;
预测模块,用于利用所述属性信息、所述部分流转信息和所述完整参照信息进行预测得到所述在途运单的预测延误结果。
11.一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如权利要求1至9任一项所述的信息预测方法。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至9任一项所述的信息预测方法。
CN202210122596.7A 2022-02-09 2022-02-09 信息预测方法、装置、存储介质及电子设备 Pending CN114418236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210122596.7A CN114418236A (zh) 2022-02-09 2022-02-09 信息预测方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210122596.7A CN114418236A (zh) 2022-02-09 2022-02-09 信息预测方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN114418236A true CN114418236A (zh) 2022-04-29

Family

ID=81279103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210122596.7A Pending CN114418236A (zh) 2022-02-09 2022-02-09 信息预测方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN114418236A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116402236A (zh) * 2023-05-31 2023-07-07 北京京东乾石科技有限公司 信息生成方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116402236A (zh) * 2023-05-31 2023-07-07 北京京东乾石科技有限公司 信息生成方法和装置

Similar Documents

Publication Publication Date Title
CN109635292B (zh) 基于机器学习算法的工单质检方法和装置
CN109117883B (zh) 基于长短时记忆网络的sar影像海冰分类方法及系统
US10354210B2 (en) Quality prediction
Nyrkov et al. Mathematical models for solving problems of reliability maritime system
CN110598620A (zh) 模型训练方法和装置、目标检测方法和装置
CN109598566A (zh) 下单预测方法、装置、计算机设备和计算机可读存储介质
CN112101839A (zh) 建立快递送达时间预测模型的方法、预测方法及相关设备
CN114187120A (zh) 一种车险理赔欺诈风险识别方法及装置
CN111582538A (zh) 一种基于图神经网络的社群价值预测方法及系统
CN113674087A (zh) 企业信用等级评定方法、装置、电子设备和介质
CN114418236A (zh) 信息预测方法、装置、存储介质及电子设备
CN115423040A (zh) 互动营销平台的用户画像识别方法及ai系统
CN116823793A (zh) 设备缺陷检测方法、装置、电子设备和可读存储介质
Schmid et al. Modeling train route decisions during track works
CN114328277A (zh) 一种软件缺陷预测和质量分析方法、装置、设备及介质
CN110807159B (zh) 数据标记方法、装置、存储介质及电子设备
CN108959577A (zh) 基于非主属性离群点检测的实体匹配方法和计算机程序
CN115438190B (zh) 一种配电网故障辅助决策知识抽取方法及系统
CN115439079A (zh) 项目分类方法及装置
US20210065225A1 (en) Information processing method and information processing apparatus
Valatsos et al. Freight transportation route time prediction with ensemble learning techniques
CN114187081A (zh) 估值表处理方法、装置、电子设备及计算机可读存储介质
González-Vidal et al. BIGcoldTRUCKS: a BIG data dashboard for the management of COLD chain logistics in refrigerated TRUCKS
CN112183859A (zh) 路由配置表更新方法、装置、电子设备以及存储介质
CN116503887B (zh) 基于图像识别的货代订单处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination