CN110119784B

CN110119784B - 一种订单推荐方法及装置

Info

Publication number: CN110119784B
Application number: CN201910411144.9A
Authority: CN
Inventors: 莫坤东
Original assignee: Chongqing Tianpeng Network Co ltd
Current assignee: Chongqing Tianpeng Network Co ltd
Priority date: 2019-05-16
Filing date: 2019-05-16
Publication date: 2020-08-04
Anticipated expiration: 2039-05-16
Also published as: CN110119784A

Abstract

本发明提供一种订单推荐方法，该方法包括：获取多个历史订单，对每个历史订单的文本信息进行哈希hash编码，并获取各历史订单的历史相关订单集；根据每个历史订单的订单信息及该历史订单的N个相似性较大的历史相关订单的订单信息，获取该历史订单的相似性特征矩阵，并获得相似性特征矩阵训练集，以获得订单排序模型；将当前订单的相似性特征矩阵输入订单排序模型，得到与当前订单相关的N个推荐订单。本发明在实际应用中通过对用户数据和行为的挖掘，帮助企业推销商品，增大经济收益的同时，也节省了用户挑选商品的时间和精力。

Description

一种订单推荐方法及装置

技术领域

本申请涉及机器学习领域，尤其涉及一种订单推荐方法及装置。

背景技术

现在社会每天都会产生海量的信息。面对这么多信息好多人都不知道什么信息是自己需要的。

随着烟草行业电子商务的发展，积累了大量的用户数据和行为数据，如何有效的利用这些数据提高用户的体验和烟草企业的经济效益，改变传统的零售户订货方式。

数据挖掘技术是近年来计算机技术发展的热点之一。通过对历史积累的大量数据的有效挖掘，可以发现隐藏的规律或模式，为决策提供支持，而这些规律或模式是不能够依靠简单的数据查询得到，或者是不能在可接受的时间内得到。这些规律或模式可以进一步在专业人员的识别下成为知识。数据挖掘面对的任务是复杂的，通常包括分类、预测、关联规则发现和聚类分析等。

数据挖掘建立在对大量的网络数据进行分析的基础上，采用相应的数据挖掘算法，在具体的应用模型上进行数据的提取、数据筛选、数据转换、数据挖掘和模式分析，最后做出归纳性的推理、预测客户的个性化行为以及用户习惯，从而帮助进行决策和管理，减少决策的风险。

随着公司业务的发展，现有的派单系统在处理劣质订单上，转化率难以保证。当前系统采用文本标签化匹配方式以及线性模型进行排序推荐派单。但这种方式会出现以下两大问题：

1)由于从发布订单获取的标签数量有限，标签化匹配效果不理想，且标签库维护更新成本较高；

2)线性模型无法挖掘特征间的非线性的关系，模型效果有限。

这已成了急需解决的问题。

发明内容

有鉴于此，本发明提供一种订单推荐方法及装置，依据文本相似性进行特征描述，生成的特征矩阵的稀疏性将降低，加上使用非线性的提升树模型，挖掘特征间的非线性关系，将大大提高算法的排序效果，提高推荐准确性。本发明采用如下技术方案：

一种订单推荐方法，该方法应用于订单推荐装置中，该订单推荐装置包括获取单元、计算单元以及训练单元，该方法包括：

步骤1，获取单元获取多个历史订单，对每个所述历史订单的文本信息进行哈希hash编码，并获取各个所述历史订单的历史相关订单集；

步骤2，计算单元针对每个所述历史订单，计算所述历史订单的hash编码与该历史订单的历史相关订单集中各个历史相关订单的哈希hash编码之间的距离，并依据计算出的所述距离的大小，在该历史订单的历史相关订单集中，按照相似性从大到小的顺序，获取前N个相似性较大的历史相关订单，其中，所述N为正整数；

步骤3，训练单元根据每个所述历史订单的订单信息及该历史订单的N个相似性较大的历史相关订单的订单信息，获取该历史订单的相似性特征矩阵，并利用梯度提升树GBDT算法对各历史订单的相似性特征矩阵进行特征选择和组合，获得相似性特征矩阵训练集；将所述相似性特征矩阵训练集输入LambdaMART模型进行训练，获得订单排序模型；

训练单元获取当前订单的相似性特征矩阵，并将所述当前订单的相似性特征矩阵输入所述订单排序模型，得到与所述当前订单相关的N个推荐订单。

进一步的，步骤3中，所述获取当前订单的相似性特征矩阵，包括：

对所述当前订单的文本信息进行哈希hash编码，并获取所述当前订单的当前相关订单集；

针对所述当前订单，计算所述当前订单的哈希hash编码与所述当前订单的当前相关订单集中各个当前相关订单的哈希hash编码之间的距离，并依据所述各个当前相关订单的哈希hash编码之间的距离大小，在所述当前订单的历史订单中获取N个相似性的相似历史订单；

根据所述当前订单的订单信息及所述当前订单的N个相似性较大的当前相关订单的订单信息，获取所述当前订单的相似性特征矩阵。

进一步的，步骤2中，依据计算出的所述距离的大小，在该历史订单的历史相关订单集中获取N个相似性较大的历史相关订单，具体包括：

依据距离值由小及大的方式，在该历史订单的历史相关订单集中对应获取相似度降序排序的N个相似性较大的历史相关订单；

步骤3中，得到与所述当前订单相关的N个推荐订单，具体包括：

得到相似度降序排序的与所述当前订单相似度较大的N个推荐订单。

进一步的，步骤3中还包括：对所述历史相关订单标注用于描述与历史订单相似性大小的相似性等级；

所述利用梯度提升树GBDT算法对各历史订单的相似性特征矩阵进行特征选择和组合，具体包括：

利用所述GBDT算法，从各历史订单的相似性特征矩阵中选择与各相似性等级对应的相似性特征；

根据各相似性等级的组合，从各历史订单的相似性特征矩阵中选择与各相似性等级组合对应的相似性特征。

进一步的，在步骤3之后，该方法还包括：

步骤4，存储当前订单及N个推荐订单；

所述训练单元将所述当前订单作为新的历史订单、将所述当前相关订单集作为历史相关订单集，将获取的所述新的相似性特征矩阵训练集输入LambdaMART模型进行训练，以获得新的订单排序模型。

一种订单推荐装置，用于实现上述的订单推荐方法，该订单推荐装置包括：

获取单元，用于获取多个历史订单，对每个所述历史订单的文本信息进行哈希hash编码，并获取各个所述历史订单的历史相关订单集；

计算单元，用于针对每个所述历史订单，计算所述历史订单的hash编码与该历史订单的历史相关订单集中各个历史相关订单的哈希hash编码之间的距离，并依据计算出的所述距离的大小，在该历史订单的历史相关订单集中，按照相似性从大到小的顺序，获取前N个相似性较大的历史相关订单，其中，所述N为正整数；

训练单元，用于根据每个所述历史订单的订单信息及该历史订单的N个相似性较大的历史相关订单的订单信息，获取该历史订单的相似性特征矩阵，并利用梯度提升树GBDT算法对各历史订单的相似性特征矩阵进行特征选择和组合，获得相似性特征矩阵训练集；将所述相似性特征矩阵训练集输入LambdaMART模型进行训练，获得订单排序模型；

进一步的，所述获取单元还用于对所述当前订单的文本信息进行哈希hash编码，并获取所述当前订单的当前相关订单集；

所述计算单元还用于针对所述当前订单，计算所述当前订单的哈希hash编码与所述当前订单的当前相关订单集中各个当前相关订单的哈希hash编码之间的距离，并依据所述各个当前相关订单的哈希hash编码之间的距离大小，在所述当前订单的历史订单中获取N个相似性的相似历史订单；

所述训练单元还用于根据所述当前订单的订单信息及所述当前订单的N个相似性较大的当前相关订单的订单信息，获取所述当前订单的相似性特征矩阵。

进一步的，所述计算单元还用于依据距离值由小及大的方式，在该历史订单的历史相关订单集中对应获取相似度降序排序的N个相似性较大的历史相关订单；

所述训练单元还用于得到相似度降序排序的与所述当前订单相似度较大的N个推荐订单。

进一步的，所述订单推荐装置还包括标记单元，所述标记单元用于对所述历史相关订单标注用于描述与历史订单相似性大小的相似性等级；

所述训练单元还用于利用所述GBDT算法，从各历史订单的相似性特征矩阵中选择与各相似性等级对应的相似性特征；所述训练单元根据各相似性等级的组合，从各历史订单的相似性特征矩阵中选择与各相似性等级组合对应的相似性特征。

进一步的，所述订单推荐装置还包括存储单元，用于存储当前订单及N个推荐订单；所述训练单元还用于将所述当前订单作为新的历史订单、将所述当前相关订单集作为历史相关订单集，并将获取的所述新的相似性特征矩阵训练集输入LambdaMART模型进行训练，以获得新的订单排序模型。

本发明的有益效果为：本发明在实际应用中通过对用户数据和行为的挖掘，帮助企业推销商品，增大经济收益的同时，也节省了用户挑选商品的时间和精力。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的订单推荐方法的流程示意图；

图2为本申请另一实施例提供的订单推荐方法的流程示意图；

图3为本申请一实施例提供的订单推荐装置的结构示意图；

图4为本申请实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应当理解，尽管在本申请实施例中可能采用术语第一、第二、第三等来描述XXX，但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如，在不脱离本申请实施例范围的情况下，第一XXX也可以被称为第二XXX，类似地，第二XXX也可以被称为第一XXX。

发明人在研究中发现：现有的订单推荐方法会有以下问题：

一、由于从发布订单获取的标签数量有限，标签化匹配效果不理想，且标签库维护更新成本较高；

二、线性模型无法挖掘特征间的非线性的关系，模型效果有限。

为此，本申请提供一种订单推荐方法和装置，依据文本相似性进行特征描述，生成的特征矩阵的稀疏性将降低，加上使用非线性的提升树模型，挖掘特征间的非线性关系，将大大提高算法的排序效果，提高推荐准确性。

请参阅图1，本申请实施例提供一种订单推荐方法，该方法包括两个过程：训练过程和推荐过程。其中。训练过程为步骤101至103，推荐过程为步骤104。下面对这两个过程具体说明。

在步骤101，获取多个历史订单，对每个历史订单的文本信息进行哈希hash编码，并获取各历史订单的历史相关订单集。

在实施例中，可以根据订单的订单信息，确定两个订单是否相关。

具体的，订单的订单信息可以包括以下任意组合：服务商，类目信息，地域信息，金额，完成周期，完成时间，订单类型。

当两个订单的服务商、类目信息、地域信息、订单类型的至少一个相同时，可以认为两个订单相关。

当两个订单的完成周期在预设周期范围时，可以认为两个订单相关。

当两个订单的完成时间在预设时间差范围内时，可以认为两个订单相关。

当上述三个条件中任意条件满足，且金额之差小于预设阈值时，可以认为两个订单相关。

在步骤102，针对每个历史订单，计算该历史订单的hash编码与该历史订单的历史相关订单集中各历史相关订单的hash编码之间的距离，并依据距离大小，在该历史订单的历史相关订单集中获取N个相似性较大的历史相关订单。其中，所述N为正整数，可以依据需要具体设定。

具体的，依据距离由小及大的方式，在该历史订单的历史相关订单集中对应获取相似度降序排序的N个相似性较大的历史相关订单。排序越靠前的，则与该历史订单越相关。

在步骤103，根据每个历史订单的订单信息及该历史订单的N个相似性较大的历史相关订单的订单信息，获取该历史订单的相似性特征矩阵，并利用梯度提升树GBDT算法对各历史订单的相似性特征矩阵进行特征选择和组合，获得相似性特征矩阵训练集；将所述相似性特征矩阵训练集输入LambdaMART模型进行训练，获得订单排序模型。

在实施例中，还可以获取各历史相关订单的相似性等级。相似性等级用于描述与历史订单相似性大小，具体的，相似性等级可以分为0-未投标,1-投标,2-中标,3-成交。

那么，所述利用梯度提升树GBDT算法对各历史订单的相似性特征矩阵进行特征选择，包括：利用所述GBDT算法，从各历史订单的相似性特征矩阵中选择与各相似性等级对应的相似性特征。

例如：可以利用所述GBDT算法，从各历史订单的相似性特征矩阵中选择与相似性等级0对应的相似性特征、与相似性等级1对应的相似性特征、与相似性等级2对应的相似性特征、和/或与相似性等级30对应的相似性特征。

所述利用梯度提升树GBDT算法对各历史订单的相似性特征矩阵进行特征选择组合，包括：根据各相似性等级的组合，从各历史订单的相似性特征矩阵中选择与各相似性等级组合对应的相似性特征。

例如，可以利用GBDT算法，从各历史订单的相似性特征矩阵中选择与相似性等级01对应的相似性特征、与相似性等级02对应的相似性特征、与相似性等级03对应的相似性特征、与相似性等级12对应的相似性特征、与相似性等级13对应的相似性特征、与相似性等级23对应的相似性特征、与相似性等级012对应的相似性特征、与相似性等级013对应的相似性特征和/或与相似性等级123对应的相似性特征。

在步骤104，获取当前订单的相似性特征矩阵，并将所述当前订单的相似性特征矩阵输入所述订单排序模型，得到与所述当前订单相关的N个推荐订单。其中，得到的推荐订单为相似度降序排序的与所述当前订单相似度较大的N个推荐订单。

具体的，请参阅图2，步骤104中，所述获取当前订单的相似性特征矩阵，可以由步骤1041-1043实现。

在步骤1041，对所述当前订单的文本信息进行hash编码，并获取所述当前订单的当前相关订单集。步骤1041可以参阅步骤101，在此不再赘述。

在步骤1042，针对所述当前订单，计算所述当前订单的hash编码与所述当前订单的当前相关订单集中各当前相关订单的hash编码之间的距离，并依据距离大小，在所述当前订单的历史订单中获取N个相似性的相似历史订单。步骤1042可以参阅步骤102，在此不再赘述。

在步骤1043，根据所述当前订单的订单信息及所述当前订单的N个相似性较大的当前相关订单的订单信息，获取所述当前订单的相似性特征矩阵。步骤1043可以参阅步骤103，在此不再赘述。

本申请实施例依据文本相似性进行特征描述，生成的特征矩阵的稀疏性将降低，加上使用非线性的提升树模型，挖掘特征间的非线性关系，将大大提高算法的排序效果，提高推荐准确性。本申请实施例并不需要匹配标签，使用的也不是线性模型，能够避免背景技术中提到的技术问题。

在一个实施例中，订单推荐方法还包括：存储所述当前订单及N个推荐订单，并将所述当前订单作为新的历史订单、将所述当前相关订单集作为历史相关订单集，获取新的相似性特征矩阵训练集训练所述订单排序模型。通过此步骤，可以对订单排序模型进行优化，同时可以重复步骤104，判断重新获取的推荐订单与之前获得的N个推荐订单之间的误差，以用于分析问题，优化模型。

请参阅图3，本申请实施例提供一种订单推荐装置，包括：获取单元300、计算单元301、训练单元302。

获取单元300，用于获取多个历史订单，对每个历史订单的文本信息进行哈希hash编码，并获取各历史订单的历史相关订单集；

计算单元301，用于针对每个历史订单，计算该历史订单的hash编码与该历史订单的历史相关订单集中各历史相关订单的hash编码之间的距离，并依据距离大小，在该历史订单的历史相关订单集中获取N个相似性较大的历史相关订单；其中，所述N为正整数；

训练单元302，用于根据每个历史订单的订单信息及该历史订单的N个相似性较大的历史相关订单的订单信息，获取该历史订单的相似性特征矩阵，并利用梯度提升树GBDT算法对各历史订单的相似性特征矩阵进行特征选择和组合，获得相似性特征矩阵训练集；将所述相似性特征矩阵训练集输入LambdaMART模型进行训练，获得订单排序模型；

所述训练单元302，还用于获取当前订单的相似性特征矩阵，将所述当前订单的相似性特征矩阵输入所述订单排序模型，得到与所述当前订单相关的N个推荐订单。

可选的，所述获取单元300，还用于对所述当前订单的文本信息进行hash编码，并获取所述当前订单的当前相关订单集；

所述计算单元301，还用于针对所述当前订单，计算所述当前订单的hash编码与所述当前订单的当前相关订单集中各当前相关订单的hash编码之间的距离，并依据距离大小，在所述当前订单的历史订单中获取N个相似性的相似历史订单；

所述训练单元302，还用于根据所述当前订单的订单信息及所述当前订单的个相似性较大的当前相关订单的订单信息，获取所述当前订单的相似性特征矩阵。

可选的，所述计算单元301，还用于依据距离由小及大的方式，在该历史订单的历史相关订单集中对应获取相似度降序排序的N个相似性较大的历史相关订单；

则所述训练单元302，还用于得到相似度降序排序的与所述当前订单相似度较大的N个推荐订单。

可选的，还包括标记单元，用于：对所述历史相关订单标注用于描述与历史订单相似性大小的相似性等级；则所述训练单元，还用于：

可选的，还包括存储单元，用于：存储所述当前订单及N个推荐订单；则，所述训练单元，还用于将所述当前订单作为新的历史订单、将所述当前相关订单集作为历史相关订单集，获取新的相似性特征矩阵训练集训练所述订单排序模型。

图3所示装置可以执行图1、2所示实施例的方法，本实施例未详细描述的部分，可参考对图1、2所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1、2所示实施例中的描述，在此不再赘述。

本申请实施例提供一种电子设备，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机程序指令，所述处理器执行所述计算机程序指令时，实现前述任一实施例的方法步骤。

本申请实施例提供一种计算机可读存储介质，存储有计算机程序指令，所述计算机程序指令在被处理器调用和执行时实现前述任一实施例的方法步骤。

如图4所示，电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401，其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中，还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

通常，以下装置可以连接至I/O接口405：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407；包括例如磁带、硬盘等的存储装置408；以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置409从网络上被下载和安装，或者从存储装置408被安装，或者从ROM 402被安装。在该计算机程序被处理装置401执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：获取至少两个网际协议地址；向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求，其中，所述节点评价设备从所述至少两个网际协议地址中，选取网际协议地址并返回；接收所述节点评价设备返回的网际协议地址；其中，所获取的网际协议地址指示内容分发网络中的边缘节点。

或者，上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：接收包括至少两个网际协议地址的节点评价请求；从所述至少两个网际协议地址中，选取网际协议地址；返回选取出的网际协议地址；其中，接收到的网际协议地址指示内容分发网络中的边缘节点。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种订单推荐方法，该方法应用于订单推荐装置中，该订单推荐装置包括获取单元、计算单元以及训练单元，其特征在于，该方法包括：

所述相关订单集是指由订单的各个相关订单构成的相关订单集合；

所述历史相关订单集是指由历史订单的历史相关订单构成的历史相关订单集合；

所述相关订单是指满足订单的服务商、类目信息、地域信息、订单类型的至少一个相同时的两个订单，或者服务商、类目信息、地域信息、订单类型的至少一个相同的两个订单，或者订单的完成时间在预设时间差范围内的两个订单；步骤2，计算单元针对每个所述历史订单，计算所述历史订单的hash编码与该历史订单的历史相关订单集中各个历史相关订单的哈希hash编码之间的距离，并依据计算出的所述距离的大小，在该历史订单的历史相关订单集中，按照相似性从大到小的顺序，获取前N个相似性较大的历史相关订单，其中，所述N为正整数；

步骤3，训练单元根据每个所述历史订单的订单信息及该历史订单的N个相似性较大的历史相关订单的订单信息，获取该历史订单的相似性特征矩阵，并利用梯度提升树GBDT算法对各历史订单的相似性特征矩阵进行特征选择和组合，获得相似性特征矩阵训练集；将所述相似性特征矩阵训练集输入Lambda MART模型进行训练，获得订单排序模型；

训练单元获取当前订单的相似性特征矩阵，并将所述当前订单的相似性特征矩阵输入所述订单排序模型，得到与所述当前订单相关的N个推荐订单；

步骤3中还包括：对所述历史相关订单标注用于描述与历史订单相似性大小的相似性等级；相似性等级用于描述与历史订单相似性大小，所述相似性等级可以分为0-未投标，1-投标，2-中标，3-成交；

2.根据权利要求1所述的方法，其特征在于，步骤3中，所述获取当前订单的相似性特征矩阵，包括：

所述当前相关订单集是指由当前订单的当前相关订单构成的当前相关订单集合；

3.根据权利要求1所述的方法，其特征在于，

步骤2中，依据计算出的所述距离的大小，在该历史订单的历史相关订单集中获取N个相似性较大的历史相关订单，具体包括：

4.根据权利要求1所述的方法，其特征在于，在步骤3之后，该方法还包括：

步骤4，存储当前订单及N个推荐订单，并将所述当前订单作为新的历史订单、将所述当前相关订单集作为历史相关订单集，

并将获取的所述新的相似性特征矩阵训练集输入LambdaMART模型进行训练，以获得新的订单排序模型。

5.一种订单推荐装置，用于实现权利要求1至4之一所述的订单推荐方法，其特征在于，该订单推荐装置包括：

所述相关订单集是指由订单的各个相关订单构成的相关订单合集；

所述历史相关订单集是指由历史订单的历史相关订单构成的历史相关订单合集；

所述相关订单是指满足订单的服务商、类目信息、地域信息、订单类型的至少一个相同时订单的两个订单，或者服务商、类目信息、地域信息、订单类型的至少一个相同的两个订单，或者订单的完成时间在预设时间差范围内的两个订单；

所述订单推荐装置还包括标记单元，所述标记单元用于对所述历史相关订单标注用于描述与历史订单相似性大小的相似性等级；相似性等级用于描述与历史订单相似性大小，所述相似性等级可以分为0-未投标，1-投标，2-中标，3-成交；

6.根据权利要求5所述的装置，其特征在于，

所述获取单元还用于对所述当前订单的文本信息进行哈希hash编码，并获取所述当前订单的当前相关订单集；

所述当前相关订单集是指由当前订单的当前相关订单构成的当前相关订单合集；

7.根据权利要求5所述的装置，其特征在于，

所述计算单元还用于依据距离值由小及大的方式，在该历史订单的历史相关订单集中对应获取相似度降序排序的N个相似性较大的历史相关订单；

8.根据权利要求5所述的装置，其特征在于，所述订单推荐装置还包括存储单元，用于存储当前订单及N个推荐订单；所述训练单元还用于将所述当前订单作为新的历史订单、将所述当前相关订单集作为历史相关订单集，并将获取的所述新的相似性特征矩阵训练集输入LambdaMART模型进行训练，以获得新的订单排序模型。