CN117610891B

CN117610891B - 一种基于大数据的灵活用工接单与风险控制系统

Info

Publication number: CN117610891B
Application number: CN202410086542.9A
Authority: CN
Inventors: 吴琼; 喻文涌; 张炳凯; 喻伟; 贺麟茹; 苏洁琼; 邓琼慧; 钟洋
Original assignee: Hunan Xiaochi Technology Co ltd
Current assignee: Hunan Xiaochi Technology Co ltd
Priority date: 2024-01-22
Filing date: 2024-01-22
Publication date: 2024-04-02
Anticipated expiration: 2044-01-22
Also published as: CN117610891A

Abstract

本发明涉及一种基于大数据的灵活用工接单与风险控制系统，属于灵活用工工单派发系统领域，通过构建分类和回归树模型对不同工单信息的接单等待时长进行分类，并根据分类结果划分工单的接单意愿等级；采用K‑means方法划分接单人员信息的接单人员风险等级，并识别影响接单人员风险等级的关键接单人员信息；设定期望的接单等待时长和风险等级，对工单信息和接单人员进行调整。本发明解决了现有技术中通过工单信息评估接单意愿时，对接单意愿等级划分不明确的问题，同时解决了划分接单人员风险等级时，关键接单人员信息不明确的问题，提高了灵活用工接单的质量和风险控制能力。

Description

一种基于大数据的灵活用工接单与风险控制系统

技术领域

本发明属于灵活用工工单派发系统技术领域，涉及一种基于大数据的灵活用工接单与风险控制系统。

背景技术

新经济新业态背景下，作为新就业形态的灵活用工，目前市场需求大，因此衍生出大量的灵活用工平台系统。

然而，当前的灵活用工平台系统更多针对接单效率而制定不同的派单模式，较少考虑接单人员对工单的接单意愿，以及接单人员的素质和工作效率，导致灵活用工接单的质量和风险控制能力大大降低。

发明内容

为解决上述现有技术存在的问题，本发明提供了一种基于大数据的灵活用工接单与风险控制系统。

本发明的目的可以通过以下技术方案实现：

一种基于大数据的灵活用工接单与风险控制系统，包括工单接收模块、工单管理模块、大数据分析模块和调整模块，其中：

所述工单接收模块，用于接收平台发布的任务工单；

所述工单管理模块，用于管理工单信息和接单信息；所述工单信息包括工单类别、工单提成和接单端与派单端的距离；所述接单信息包括接单等待时长和接单人员信息；所述接单人员信息包括员工年龄、接单次数、好评率和工单完成时间；

所述大数据分析模块，包括接单意愿分析模块和接单风险评估模块；所述接单意愿分析模块，用于构建分类和回归树模型对不同工单信息的接单等待时长进行分类，并按照分类结果划分工单的接单意愿等级；所述接单风险评估模块，采用K-means方法划分接单人员信息的接单人员风险等级，并确定影响接单人员风险等级的关键接单人员信息；

所述调整模块，用于根据设定期望的接单等待时长和接单人员风险等级，对工单信息和接单人员进行调度和调整。

进一步地，大数据分析模块中，所述构建分类和回归树模型对不同工单信息的接单等待时长进行分类，并按照分类结果划分工单的接单意愿等级，包括以下步骤：

A1、选择分割点：采用基尼系数识别解释变量的最佳分割特征，以作为分割点；

A2、分割数据集：根据选择的分割点，将响应变量数据集拆分成两个子集；

A3、生成决策树：对每个子集递归地重复步骤A1-A2的操作，直至达到停止条件，生成合适的决策树；

A4、划分接单意愿等级：根据决策树的终端节点，确定响应变量的分类，计算各个分类的数据平均值，按照平均值从大到小的顺序划分各个分类的接单意愿等级。

进一步地，所述分类和回归树模型，是以工单信息作为解释变量，接单等待时长作为响应变量。

进一步地，步骤A1中，所述基尼系数公式为：

，

式中，Gini为基尼系数，用于衡量一个随机选中的样本被错误分类为其它类别的概率，Gini越小则表示节点的纯度越高；K为对数据集分类的类别数；P_n为第n个类别的样本量占总样本量的比例，n=1，2，……，K。

进一步地，步骤A3中，所述步骤A3中，所述停止条件，是指对每个子集递归地重复步骤A1-A2的操作过程中，基尼系数随着表面误差率增益值减小而不再减小，所述表面误差率增益值，计算公式为：

，

式中，α为表面误差率增益值，α越小时决策树的节点越多，剪枝时通过增大α值来减少决策树的节点数以获得最优子树；R(t)为以t为单节点的树的误差代价，在该节点树被剪枝，R(t) = r(t)×p(t)，r(t)为节点t的误差率，p(t)为节点t上的样本数占总样本数的比例；T_t为子树中包含的叶子节点个数，R(T_t)则表示以t为根节点的子树T的误差代价，

，其中m为节点数，i =1，2，……，m。

进一步地，所述大数据分析模块中，所述接单风险评估模块，所述采用K-means方法划分接单人员信息的接单人员风险等级，并识别影响接单人员风险等级的关键接单人员信息，包括以下步骤：

B1、数据归一化处理：将所述接单人员信息数据集进行归一化处理；

B2、初始化聚类中心：随机选取数据空间中的若干个数据对象作为初始聚类中心；

B3、初始化数据对象聚类簇：计算所有数据对象与初始聚类中心之间的欧式距离，将各数据对象划分至与初始聚类中心欧氏距离最小的类别中，形成初始聚类簇；

B4、更新聚类中心：计算各初始聚类簇的数据对象的平均值，以该平均值作为新聚类中心，再次计算所有数据对象与新聚类中心之间的欧式距离；

B5、确定聚类簇：重复将各数据对象划分至与新聚类中心欧氏距离最小的类别中，形成新聚类簇，当各新聚类簇的数据对象的平均值不再发生改变时，确定各新聚类中心所对应的最终聚类簇，并根据最终聚类簇中接单人员信息的数据平均值大小，划分接单人员风险等级；

B6、识别关键接单人员信息：根据接单人员信息中各变量在聚类簇中的纯度，对接单人员信息各变量的重要性进行排序，以识别关键接单人员信息，所述纯度是根据接单人员风险等级的大小顺序，识别的接单人员信息变量数据的大小连续性程度。

进一步地，步骤B1中，所述归一化处理，表达公式为：

，

式中，ɡ(X)为归一化函数；X _i表示接单人员信息数据，1≤i≤n，n为数据集的样本数，X _min表示数据集中的最小值，X _max表示数据集中的最大值。

进一步地，步骤B3中，所述欧式距离，计算公式为：

，

式中，d(x, C _i )表示欧式距离函数；x为归一化后的数据对象；C_i表示第i个聚类中心，1≤i≤k，k为聚类中心的数目；n为数据集的样本数；x _j表示数据集中第j个变量的数据对象；C _ij表示第j个变量的聚类中心。

进一步地，调整模块中，所述调整模块，工作流程如下：

C1、利用所述工单接收模块，接收平台发布的任务工单；

C2、识别工单，获取工单信息，并输入所述大数据分析模块中的接单意愿分析模块，以预测接单等待时长T₁；

C3、设定期望的接单等待T₂，当T₁>T₂时，对工单信息进行调整；

C4、调整到合适的工单信息后，设定期望的接单人员风险等级，当接单人员接单时，识别关键接单人员信息，并输入所述大数据分析模块中的接单风险评估模块中，以输出接单人员风险等级，当接单人员风险等级符合期望的接单人员风险等级时，同意接单人员接单；当接单人员风险等级不符合期望的接单人员风险等级时，更换接单人员。

本发明的有益效果为：

通过构建分类和回归树模型对不同工单信息的接单等待时长进行分类，并根据分类结果划分工单的接单意愿等级；采用K-means方法划分接单人员信息的接单人员风险等级，并识别影响接单人员风险等级的关键接单人员信息；设定期望的接单等待时长和风险等级，对工单信息和接单人员进行调整。本发明解决了现有技术中通过工单信息评估接单意愿时，对接单意愿等级划分不明确的问题，同时解决了划分接单人员风险等级时，关键接单人员信息不明确的问题，提高了灵活用工接单的质量和风险控制能力。

附图说明

为了便于本领域技术人员理解，下面结合附图对本发明作进一步地说明。

图1为本发明中一种基于大数据的灵活用工接单与风险控制系统的结构图。

具体实施方式

为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明的具体实施方式、结构、特征及其功效，详细说明如后。

请参阅图1，本发明提供了一种基于大数据的灵活用工接单与风险控制系统，包括工单接收模块、工单管理模块、大数据分析模块和调整模块，其中：

所述工单接收模块，用于接收平台发布的任务工单；

本实施例中，利用接单等待时长作为衡量接单人员对工单的接单意愿，其对接单等待时长的影响因素主要考虑了工单信息，包括工单类别、工单提成和接单端与派单端的距离，通过量化接单等待时长与工单信息之间的关系，即可根据工单信息判断接单人员对工单的接单意愿，并对工单信息在合理范围内进行调整，以达到对接单等待时长的期望。

所述构建分类和回归树模型对不同工单信息的接单等待时长进行分类，并按照分类结果划分工单的接单意愿等级，包括以下步骤：

进一步地，步骤A1中，所述基尼系数公式为：

，

进一步地，步骤A3中，所述步骤A3中，所述停止条件，是指对每个子集递归地重复步骤A1-A2的操作过程中，基尼系数随着表面误差率增益值减小而不再减小，所述表面率误差增益值，计算公式为：

，

，其中m为节点数，i =1，2，……，m。

B6、识别关键接单人员信息：根据接单人员信息中各变量在聚类簇中的纯度，对接单人员信息各变量的重要性进行排序，以识别关键接单人员信息，所述纯度是指根据接单人员风险等级的大小顺序，识别接单人员信息各变量数据的大小连续性程度。

需要注意的是，在K-means分析中，并没有按照所有接单人员信息变量进行划分接单人员风险等级，而是选择具有明显差异特征的变量进行划分，因此该具有明显差异特征的变量可以认为是关键接单人员信息，对接单人员风险等级具有决定性作用。本发明的关键接单人员信息，是基于接单人员信息在各个聚类簇中的纯度识别的，该方法的纯度是根据接单人员风险等级的大小顺序，识别接单人员信息各变量数据的大小连续性程度，变量的连续性程度越大，代表该变量被错误放入该聚类簇中的概率越小，即该变量是划分聚类簇的重要依据，因此该变量可作为关键变量。

进一步地，步骤B1中，所述归一化处理，表达公式为：

，

进一步地，步骤B3中，所述欧式距离，计算公式为：

，

进一步地，调整模块中，所述调整模块，工作流程如下：

C1、利用所述工单接收模块，接收平台发布的任务工单；

C3、设定期望的接单等待T2，当T1>T2时，对工单信息进行调整；

本发明的有益效果为：

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭示如上，然而并非用以限定本发明，任何本领域技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种基于大数据的灵活用工接单与风险控制系统，其特征在于：包括工单接收模块、工单管理模块、大数据分析模块和调整模块，其中：

所述大数据分析模块，包括接单意愿分析模块和接单风险评估模块；所述接单意愿分析模块，用于构建分类和回归树模型对不同工单信息的接单等待时长进行分类，并按照分类结果划分工单的接单意愿等级；

其中，所述分类和回归树模型，是以工单信息作为解释变量，接单等待时长作为响应变量，包括以下构建步骤：

A4、划分接单意愿等级：根据决策树的终端节点，确定响应变量的分类，计算各个分类的数据平均值，按照平均值从大到小的顺序划分各个分类的接单意愿等级；

所述接单风险评估模块，采用K-means方法划分接单人员信息的接单人员风险等级，并识别影响接单人员风险等级的关键接单人员信息，包括以下步骤：

B6、识别关键接单人员信息：根据接单人员信息中各变量在聚类簇中的纯度，对接单人员信息各变量的重要性进行排序，以识别关键接单人员信息，所述纯度是根据接单人员风险等级的大小顺序，识别的接单人员信息各变量数据的大小连续性程度；

所述调整模块，用于根据设定期望的接单等待时长和接单人员风险等级，对工单信息和接单人员进行调度和调整，包括以下步骤：

C1、利用所述工单接收模块，接收平台发布的任务工单；

C3、设定期望的接单等待时长T₂，当T₁>T₂时，对工单信息进行调整；

2.根据权利要求1所述的一种基于大数据的灵活用工接单与风险控制系统，其特征在于：步骤A1中，所述基尼系数，计算公式为：

，

式中，Gini为基尼系数，Gini越小则表示节点的纯度越高；K为对数据集分类的类别数；P_n为第n个类别的样本量占总样本量的比例，n=1，2，…，K。

3.根据权利要求1所述的一种基于大数据的灵活用工接单与风险控制系统，其特征在于：步骤A3中，所述停止条件，是指对每个子集递归地重复步骤A1-A2的操作过程中，基尼系数随着表面误差率增益值减小而不再减小，所述表面误差率增益值，计算公式为：

，

式中，α为表面误差率增益值，α越小时决策树的分割点越多；R(t)为以t为单分割点的决策树误差代价，在该单分割点决策树停止分割，R(t) = r(t)×p(t)，r(t)为节点t的误差率，p(t)为节点t上的样本数占总样本数的比例；T_t为子树中包含的叶子节点个数，R(T_t)则表示以t为根节点的子树T的误差代价，

，其中m为节点数，i =1，2，……，m。

4.根据权利要求1所述的一种基于大数据的灵活用工接单与风险控制系统，其特征在于：步骤B1中，所述归一化处理，表达公式为：

，

5.根据权利要求1所述的一种基于大数据的灵活用工接单与风险控制系统，其特征在于：步骤B3中，所述欧式距离，计算公式为：

，

式中，d(x, C _i)表示欧式距离函数；x为归一化后的数据对象；C_i表示第i个聚类中心，1≤i≤k，k为聚类中心的数目；n为数据集的样本数；x _j表示数据集中第j个变量的数据对象；C _ij表示第j个变量的聚类中心。