CN117610891B - 一种基于大数据的灵活用工接单与风险控制系统 - Google Patents
一种基于大数据的灵活用工接单与风险控制系统 Download PDFInfo
- Publication number
- CN117610891B CN117610891B CN202410086542.9A CN202410086542A CN117610891B CN 117610891 B CN117610891 B CN 117610891B CN 202410086542 A CN202410086542 A CN 202410086542A CN 117610891 B CN117610891 B CN 117610891B
- Authority
- CN
- China
- Prior art keywords
- order
- information
- receiving
- person
- work order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012954 risk control Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000003066 decision tree Methods 0.000 claims description 16
- 238000007405 data analysis Methods 0.000 claims description 15
- 238000012502 risk assessment Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 210000001503 joint Anatomy 0.000 description 10
- 230000000694 effects Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063118—Staff planning in a project environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063116—Schedule adjustment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于大数据的灵活用工接单与风险控制系统,属于灵活用工工单派发系统领域,通过构建分类和回归树模型对不同工单信息的接单等待时长进行分类,并根据分类结果划分工单的接单意愿等级;采用K‑means方法划分接单人员信息的接单人员风险等级,并识别影响接单人员风险等级的关键接单人员信息;设定期望的接单等待时长和风险等级,对工单信息和接单人员进行调整。本发明解决了现有技术中通过工单信息评估接单意愿时,对接单意愿等级划分不明确的问题,同时解决了划分接单人员风险等级时,关键接单人员信息不明确的问题,提高了灵活用工接单的质量和风险控制能力。
Description
技术领域
本发明属于灵活用工工单派发系统技术领域,涉及一种基于大数据的灵活用工接单与风险控制系统。
背景技术
新经济新业态背景下,作为新就业形态的灵活用工,目前市场需求大,因此衍生出大量的灵活用工平台系统。
然而,当前的灵活用工平台系统更多针对接单效率而制定不同的派单模式,较少考虑接单人员对工单的接单意愿,以及接单人员的素质和工作效率,导致灵活用工接单的质量和风险控制能力大大降低。
发明内容
为解决上述现有技术存在的问题,本发明提供了一种基于大数据的灵活用工接单与风险控制系统。
本发明的目的可以通过以下技术方案实现:
一种基于大数据的灵活用工接单与风险控制系统,包括工单接收模块、工单管理模块、大数据分析模块和调整模块,其中:
所述工单接收模块,用于接收平台发布的任务工单;
所述工单管理模块,用于管理工单信息和接单信息;所述工单信息包括工单类别、工单提成和接单端与派单端的距离;所述接单信息包括接单等待时长和接单人员信息;所述接单人员信息包括员工年龄、接单次数、好评率和工单完成时间;
所述大数据分析模块,包括接单意愿分析模块和接单风险评估模块;所述接单意愿分析模块,用于构建分类和回归树模型对不同工单信息的接单等待时长进行分类,并按照分类结果划分工单的接单意愿等级;所述接单风险评估模块,采用K-means方法划分接单人员信息的接单人员风险等级,并确定影响接单人员风险等级的关键接单人员信息;
所述调整模块,用于根据设定期望的接单等待时长和接单人员风险等级,对工单信息和接单人员进行调度和调整。
进一步地,大数据分析模块中,所述构建分类和回归树模型对不同工单信息的接单等待时长进行分类,并按照分类结果划分工单的接单意愿等级,包括以下步骤:
A1、选择分割点:采用基尼系数识别解释变量的最佳分割特征,以作为分割点;
A2、分割数据集:根据选择的分割点,将响应变量数据集拆分成两个子集;
A3、生成决策树:对每个子集递归地重复步骤A1-A2的操作,直至达到停止条件,生成合适的决策树;
A4、划分接单意愿等级:根据决策树的终端节点,确定响应变量的分类,计算各个分类的数据平均值,按照平均值从大到小的顺序划分各个分类的接单意愿等级。
进一步地,所述分类和回归树模型,是以工单信息作为解释变量,接单等待时长作为响应变量。
进一步地,步骤A1中,所述基尼系数公式为:
,
式中,Gini为基尼系数,用于衡量一个随机选中的样本被错误分类为其它类别的概率,Gini越小则表示节点的纯度越高;K为对数据集分类的类别数;Pn为第n个类别的样本量占总样本量的比例,n=1,2,……,K。
进一步地,步骤A3中,所述步骤A3中,所述停止条件,是指对每个子集递归地重复步骤A1-A2的操作过程中,基尼系数随着表面误差率增益值减小而不再减小,所述表面误差率增益值,计算公式为:
,
式中,α为表面误差率增益值,α越小时决策树的节点越多,剪枝时通过增大α值来减少决策树的节点数以获得最优子树;R(t)为以t为单节点的树的误差代价,在该节点树被剪枝,R(t) = r(t)×p(t),r(t)为节点t的误差率,p(t)为节点t上的样本数占总样本数的比例;Tt为子树中包含的叶子节点个数,R(Tt)则表示以t为根节点的子树T的误差代价,
,其中m为节点数,i =1,2,……,m。
进一步地,所述大数据分析模块中,所述接单风险评估模块,所述采用K-means方法划分接单人员信息的接单人员风险等级,并识别影响接单人员风险等级的关键接单人员信息,包括以下步骤:
B1、数据归一化处理:将所述接单人员信息数据集进行归一化处理;
B2、初始化聚类中心:随机选取数据空间中的若干个数据对象作为初始聚类中心;
B3、初始化数据对象聚类簇:计算所有数据对象与初始聚类中心之间的欧式距离,将各数据对象划分至与初始聚类中心欧氏距离最小的类别中,形成初始聚类簇;
B4、更新聚类中心:计算各初始聚类簇的数据对象的平均值,以该平均值作为新聚类中心,再次计算所有数据对象与新聚类中心之间的欧式距离;
B5、确定聚类簇:重复将各数据对象划分至与新聚类中心欧氏距离最小的类别中,形成新聚类簇,当各新聚类簇的数据对象的平均值不再发生改变时,确定各新聚类中心所对应的最终聚类簇,并根据最终聚类簇中接单人员信息的数据平均值大小,划分接单人员风险等级;
B6、识别关键接单人员信息:根据接单人员信息中各变量在聚类簇中的纯度,对接单人员信息各变量的重要性进行排序,以识别关键接单人员信息,所述纯度是根据接单人员风险等级的大小顺序,识别的接单人员信息变量数据的大小连续性程度。
进一步地,步骤B1中,所述归一化处理,表达公式为:
,
式中,ɡ(X)为归一化函数;X i 表示接单人员信息数据,1≤i≤n,n为数据集的样本数,X min 表示数据集中的最小值,X max 表示数据集中的最大值。
进一步地,步骤B3中,所述欧式距离,计算公式为:
,
式中,d(x, C i )表示欧式距离函数;x为归一化后的数据对象;C i 表示第i个聚类中心,1≤i≤k,k为聚类中心的数目;n为数据集的样本数;x j 表示数据集中第j个变量的数据对象;C ij 表示第j个变量的聚类中心。
进一步地,调整模块中,所述调整模块,工作流程如下:
C1、利用所述工单接收模块,接收平台发布的任务工单;
C2、识别工单,获取工单信息,并输入所述大数据分析模块中的接单意愿分析模块,以预测接单等待时长T1;
C3、设定期望的接单等待T2,当T1>T2时,对工单信息进行调整;
C4、调整到合适的工单信息后,设定期望的接单人员风险等级,当接单人员接单时,识别关键接单人员信息,并输入所述大数据分析模块中的接单风险评估模块中,以输出接单人员风险等级,当接单人员风险等级符合期望的接单人员风险等级时,同意接单人员接单;当接单人员风险等级不符合期望的接单人员风险等级时,更换接单人员。
本发明的有益效果为:
通过构建分类和回归树模型对不同工单信息的接单等待时长进行分类,并根据分类结果划分工单的接单意愿等级;采用K-means方法划分接单人员信息的接单人员风险等级,并识别影响接单人员风险等级的关键接单人员信息;设定期望的接单等待时长和风险等级,对工单信息和接单人员进行调整。本发明解决了现有技术中通过工单信息评估接单意愿时,对接单意愿等级划分不明确的问题,同时解决了划分接单人员风险等级时,关键接单人员信息不明确的问题,提高了灵活用工接单的质量和风险控制能力。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步地说明。
图1为本发明中一种基于大数据的灵活用工接单与风险控制系统的结构图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如后。
请参阅图1,本发明提供了一种基于大数据的灵活用工接单与风险控制系统,包括工单接收模块、工单管理模块、大数据分析模块和调整模块,其中:
所述工单接收模块,用于接收平台发布的任务工单;
所述工单管理模块,用于管理工单信息和接单信息;所述工单信息包括工单类别、工单提成和接单端与派单端的距离;所述接单信息包括接单等待时长和接单人员信息;所述接单人员信息包括员工年龄、接单次数、好评率和工单完成时间;
所述大数据分析模块,包括接单意愿分析模块和接单风险评估模块;所述接单意愿分析模块,用于构建分类和回归树模型对不同工单信息的接单等待时长进行分类,并按照分类结果划分工单的接单意愿等级;所述接单风险评估模块,采用K-means方法划分接单人员信息的接单人员风险等级,并确定影响接单人员风险等级的关键接单人员信息;
所述调整模块,用于根据设定期望的接单等待时长和接单人员风险等级,对工单信息和接单人员进行调度和调整。
本实施例中,利用接单等待时长作为衡量接单人员对工单的接单意愿,其对接单等待时长的影响因素主要考虑了工单信息,包括工单类别、工单提成和接单端与派单端的距离,通过量化接单等待时长与工单信息之间的关系,即可根据工单信息判断接单人员对工单的接单意愿,并对工单信息在合理范围内进行调整,以达到对接单等待时长的期望。
所述构建分类和回归树模型对不同工单信息的接单等待时长进行分类,并按照分类结果划分工单的接单意愿等级,包括以下步骤:
A1、选择分割点:采用基尼系数识别解释变量的最佳分割特征,以作为分割点;
A2、分割数据集:根据选择的分割点,将响应变量数据集拆分成两个子集;
A3、生成决策树:对每个子集递归地重复步骤A1-A2的操作,直至达到停止条件,生成合适的决策树;
A4、划分接单意愿等级:根据决策树的终端节点,确定响应变量的分类,计算各个分类的数据平均值,按照平均值从大到小的顺序划分各个分类的接单意愿等级。
进一步地,所述分类和回归树模型,是以工单信息作为解释变量,接单等待时长作为响应变量。
进一步地,步骤A1中,所述基尼系数公式为:
,
式中,Gini为基尼系数,用于衡量一个随机选中的样本被错误分类为其它类别的概率,Gini越小则表示节点的纯度越高;K为对数据集分类的类别数;Pn为第n个类别的样本量占总样本量的比例,n=1,2,……,K。
进一步地,步骤A3中,所述步骤A3中,所述停止条件,是指对每个子集递归地重复步骤A1-A2的操作过程中,基尼系数随着表面误差率增益值减小而不再减小,所述表面率误差增益值,计算公式为:
,
式中,α为表面误差率增益值,α越小时决策树的节点越多,剪枝时通过增大α值来减少决策树的节点数以获得最优子树;R(t)为以t为单节点的树的误差代价,在该节点树被剪枝,R(t) = r(t)×p(t),r(t)为节点t的误差率,p(t)为节点t上的样本数占总样本数的比例;Tt为子树中包含的叶子节点个数,R(Tt)则表示以t为根节点的子树T的误差代价,
,其中m为节点数,i =1,2,……,m。
进一步地,所述大数据分析模块中,所述接单风险评估模块,所述采用K-means方法划分接单人员信息的接单人员风险等级,并识别影响接单人员风险等级的关键接单人员信息,包括以下步骤:
B1、数据归一化处理:将所述接单人员信息数据集进行归一化处理;
B2、初始化聚类中心:随机选取数据空间中的若干个数据对象作为初始聚类中心;
B3、初始化数据对象聚类簇:计算所有数据对象与初始聚类中心之间的欧式距离,将各数据对象划分至与初始聚类中心欧氏距离最小的类别中,形成初始聚类簇;
B4、更新聚类中心:计算各初始聚类簇的数据对象的平均值,以该平均值作为新聚类中心,再次计算所有数据对象与新聚类中心之间的欧式距离;
B5、确定聚类簇:重复将各数据对象划分至与新聚类中心欧氏距离最小的类别中,形成新聚类簇,当各新聚类簇的数据对象的平均值不再发生改变时,确定各新聚类中心所对应的最终聚类簇,并根据最终聚类簇中接单人员信息的数据平均值大小,划分接单人员风险等级;
B6、识别关键接单人员信息:根据接单人员信息中各变量在聚类簇中的纯度,对接单人员信息各变量的重要性进行排序,以识别关键接单人员信息,所述纯度是指根据接单人员风险等级的大小顺序,识别接单人员信息各变量数据的大小连续性程度。
需要注意的是,在K-means分析中,并没有按照所有接单人员信息变量进行划分接单人员风险等级,而是选择具有明显差异特征的变量进行划分,因此该具有明显差异特征的变量可以认为是关键接单人员信息,对接单人员风险等级具有决定性作用。本发明的关键接单人员信息,是基于接单人员信息在各个聚类簇中的纯度识别的,该方法的纯度是根据接单人员风险等级的大小顺序,识别接单人员信息各变量数据的大小连续性程度,变量的连续性程度越大,代表该变量被错误放入该聚类簇中的概率越小,即该变量是划分聚类簇的重要依据,因此该变量可作为关键变量。
进一步地,步骤B1中,所述归一化处理,表达公式为:
,
式中,ɡ(X)为归一化函数;X i 表示接单人员信息数据,1≤i≤n,n为数据集的样本数,X min 表示数据集中的最小值,X max 表示数据集中的最大值。
进一步地,步骤B3中,所述欧式距离,计算公式为:
,
式中,d(x, C i )表示欧式距离函数;x为归一化后的数据对象;C i 表示第i个聚类中心,1≤i≤k,k为聚类中心的数目;n为数据集的样本数;x j 表示数据集中第j个变量的数据对象;C ij 表示第j个变量的聚类中心。
进一步地,调整模块中,所述调整模块,工作流程如下:
C1、利用所述工单接收模块,接收平台发布的任务工单;
C2、识别工单,获取工单信息,并输入所述大数据分析模块中的接单意愿分析模块,以预测接单等待时长T1;
C3、设定期望的接单等待T2,当T1>T2时,对工单信息进行调整;
C4、调整到合适的工单信息后,设定期望的接单人员风险等级,当接单人员接单时,识别关键接单人员信息,并输入所述大数据分析模块中的接单风险评估模块中,以输出接单人员风险等级,当接单人员风险等级符合期望的接单人员风险等级时,同意接单人员接单;当接单人员风险等级不符合期望的接单人员风险等级时,更换接单人员。
本发明的有益效果为:
通过构建分类和回归树模型对不同工单信息的接单等待时长进行分类,并根据分类结果划分工单的接单意愿等级;采用K-means方法划分接单人员信息的接单人员风险等级,并识别影响接单人员风险等级的关键接单人员信息;设定期望的接单等待时长和风险等级,对工单信息和接单人员进行调整。本发明解决了现有技术中通过工单信息评估接单意愿时,对接单意愿等级划分不明确的问题,同时解决了划分接单人员风险等级时,关键接单人员信息不明确的问题,提高了灵活用工接单的质量和风险控制能力。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (5)
1.一种基于大数据的灵活用工接单与风险控制系统,其特征在于:包括工单接收模块、工单管理模块、大数据分析模块和调整模块,其中:
所述工单管理模块,用于管理工单信息和接单信息;所述工单信息包括工单类别、工单提成和接单端与派单端的距离;所述接单信息包括接单等待时长和接单人员信息;所述接单人员信息包括员工年龄、接单次数、好评率和工单完成时间;
所述大数据分析模块,包括接单意愿分析模块和接单风险评估模块;所述接单意愿分析模块,用于构建分类和回归树模型对不同工单信息的接单等待时长进行分类,并按照分类结果划分工单的接单意愿等级;
其中,所述分类和回归树模型,是以工单信息作为解释变量,接单等待时长作为响应变量,包括以下构建步骤:
A1、选择分割点:采用基尼系数识别解释变量的最佳分割特征,以作为分割点;
A2、分割数据集:根据选择的分割点,将响应变量数据集拆分成两个子集;
A3、生成决策树:对每个子集递归地重复步骤A1-A2的操作,直至达到停止条件,生成合适的决策树;
A4、划分接单意愿等级:根据决策树的终端节点,确定响应变量的分类,计算各个分类的数据平均值,按照平均值从大到小的顺序划分各个分类的接单意愿等级;
所述接单风险评估模块,采用K-means方法划分接单人员信息的接单人员风险等级,并识别影响接单人员风险等级的关键接单人员信息,包括以下步骤:
B1、数据归一化处理:将所述接单人员信息数据集进行归一化处理;
B2、初始化聚类中心:随机选取数据空间中的若干个数据对象作为初始聚类中心;
B3、初始化数据对象聚类簇:计算所有数据对象与初始聚类中心之间的欧式距离,将各数据对象划分至与初始聚类中心欧氏距离最小的类别中,形成初始聚类簇;
B4、更新聚类中心:计算各初始聚类簇的数据对象的平均值,以该平均值作为新聚类中心,再次计算所有数据对象与新聚类中心之间的欧式距离;
B5、确定聚类簇:重复将各数据对象划分至与新聚类中心欧氏距离最小的类别中,形成新聚类簇,当各新聚类簇的数据对象的平均值不再发生改变时,确定各新聚类中心所对应的最终聚类簇,并根据最终聚类簇中接单人员信息的数据平均值大小,划分接单人员风险等级;
B6、识别关键接单人员信息:根据接单人员信息中各变量在聚类簇中的纯度,对接单人员信息各变量的重要性进行排序,以识别关键接单人员信息,所述纯度是根据接单人员风险等级的大小顺序,识别的接单人员信息各变量数据的大小连续性程度;
所述调整模块,用于根据设定期望的接单等待时长和接单人员风险等级,对工单信息和接单人员进行调度和调整,包括以下步骤:
C1、利用所述工单接收模块,接收平台发布的任务工单;
C2、识别工单,获取工单信息,并输入所述大数据分析模块中的接单意愿分析模块,以预测接单等待时长T1;
C3、设定期望的接单等待时长T2,当T1>T2时,对工单信息进行调整;
C4、调整到合适的工单信息后,设定期望的接单人员风险等级,当接单人员接单时,识别关键接单人员信息,并输入所述大数据分析模块中的接单风险评估模块中,以输出接单人员风险等级,当接单人员风险等级符合期望的接单人员风险等级时,同意接单人员接单;当接单人员风险等级不符合期望的接单人员风险等级时,更换接单人员。
2.根据权利要求1所述的一种基于大数据的灵活用工接单与风险控制系统,其特征在于:步骤A1中,所述基尼系数,计算公式为:
,
式中,Gini为基尼系数,Gini越小则表示节点的纯度越高;K为对数据集分类的类别数;Pn为第n个类别的样本量占总样本量的比例,n=1,2,…,K。
3.根据权利要求1所述的一种基于大数据的灵活用工接单与风险控制系统,其特征在于:步骤A3中,所述停止条件,是指对每个子集递归地重复步骤A1-A2的操作过程中,基尼系数随着表面误差率增益值减小而不再减小,所述表面误差率增益值,计算公式为:
,
式中,α为表面误差率增益值,α越小时决策树的分割点越多;R(t)为以t为单分割点的决策树误差代价,在该单分割点决策树停止分割,R(t) = r(t)×p(t),r(t)为节点t的误差率,p(t)为节点t上的样本数占总样本数的比例;Tt为子树中包含的叶子节点个数,R(Tt)则表示以t为根节点的子树T的误差代价,
,其中m为节点数,i =1,2,……,m。
4.根据权利要求1所述的一种基于大数据的灵活用工接单与风险控制系统,其特征在于:步骤B1中,所述归一化处理,表达公式为:
,
式中,ɡ(X)为归一化函数;X i 表示接单人员信息数据,1≤i≤n,n为数据集的样本数,X min 表示数据集中的最小值,X max 表示数据集中的最大值。
5.根据权利要求1所述的一种基于大数据的灵活用工接单与风险控制系统,其特征在于:步骤B3中,所述欧式距离,计算公式为:
,
式中,d(x, C i )表示欧式距离函数;x为归一化后的数据对象;C i 表示第i个聚类中心,1≤i≤k,k为聚类中心的数目;n为数据集的样本数;x j 表示数据集中第j个变量的数据对象;C ij 表示第j个变量的聚类中心。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410086542.9A CN117610891B (zh) | 2024-01-22 | 2024-01-22 | 一种基于大数据的灵活用工接单与风险控制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410086542.9A CN117610891B (zh) | 2024-01-22 | 2024-01-22 | 一种基于大数据的灵活用工接单与风险控制系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117610891A CN117610891A (zh) | 2024-02-27 |
CN117610891B true CN117610891B (zh) | 2024-04-02 |
Family
ID=89960178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410086542.9A Active CN117610891B (zh) | 2024-01-22 | 2024-01-22 | 一种基于大数据的灵活用工接单与风险控制系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117610891B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008209698A (ja) * | 2007-02-27 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 適応モデル学習方法とその装置、それを用いた音声認識用音響モデル作成方法とその装置、及び音響モデルを用いた音声認識方法とその装置、及びそれら装置のプログラムと、それらプログラムの記憶媒体 |
KR20180120056A (ko) * | 2017-04-26 | 2018-11-05 | 김정희 | 학습 데이터 전처리 방법 및 시스템 |
CN109685635A (zh) * | 2018-09-11 | 2019-04-26 | 深圳平安财富宝投资咨询有限公司 | 金融业务的风险评估方法、风控服务端及存储介质 |
WO2020015104A1 (zh) * | 2018-07-18 | 2020-01-23 | 平安科技(深圳)有限公司 | 风险旅客流量预测方法、装置、计算机设备和存储介质 |
CN112766362A (zh) * | 2021-01-18 | 2021-05-07 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置和设备 |
DE102019217733A1 (de) * | 2019-11-18 | 2021-05-20 | Volkswagen Aktiengesellschaft | Verfahren zum Betreiben eines Bediensystems in einem Fahrzeug und Bediensystem für ein Fahrzeug |
CN113112282A (zh) * | 2021-04-20 | 2021-07-13 | 平安银行股份有限公司 | 基于客户画像处理咨诉问题的方法、装置、设备及介质 |
CN114547128A (zh) * | 2021-12-14 | 2022-05-27 | 浙江吉利控股集团有限公司 | 虚假订单的识别方法、系统、计算机设备及存储介质 |
CN116152863A (zh) * | 2023-04-19 | 2023-05-23 | 尚特杰电力科技有限公司 | 一种人员信息识别方法、装置、电子设备及存储介质 |
CN116484244A (zh) * | 2022-12-30 | 2023-07-25 | 东南大学 | 基于聚类模型的自动驾驶事故发生机制分析方法 |
CN116502742A (zh) * | 2023-02-23 | 2023-07-28 | 北京民智数字科技有限公司 | 一种基于梯度提升决策树的风险行为信息预测方法及系统 |
WO2023224742A1 (en) * | 2022-05-17 | 2023-11-23 | Microsoft Technology Licensing, Llc | Predicting runtime variation in big data analytics |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8606603B2 (en) * | 2003-12-05 | 2013-12-10 | Scorelogix Llc | Unemployment risk score and private insurance for employees |
US20130268936A1 (en) * | 2012-04-09 | 2013-10-10 | Yu-Hung Hsu | Workflow management system and method |
TWI801767B (zh) * | 2020-11-09 | 2023-05-11 | 財團法人工業技術研究院 | 機器學習分類模型之修正方法與訓練系統及使用者介面 |
-
2024
- 2024-01-22 CN CN202410086542.9A patent/CN117610891B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008209698A (ja) * | 2007-02-27 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 適応モデル学習方法とその装置、それを用いた音声認識用音響モデル作成方法とその装置、及び音響モデルを用いた音声認識方法とその装置、及びそれら装置のプログラムと、それらプログラムの記憶媒体 |
KR20180120056A (ko) * | 2017-04-26 | 2018-11-05 | 김정희 | 학습 데이터 전처리 방법 및 시스템 |
WO2020015104A1 (zh) * | 2018-07-18 | 2020-01-23 | 平安科技(深圳)有限公司 | 风险旅客流量预测方法、装置、计算机设备和存储介质 |
CN109685635A (zh) * | 2018-09-11 | 2019-04-26 | 深圳平安财富宝投资咨询有限公司 | 金融业务的风险评估方法、风控服务端及存储介质 |
DE102019217733A1 (de) * | 2019-11-18 | 2021-05-20 | Volkswagen Aktiengesellschaft | Verfahren zum Betreiben eines Bediensystems in einem Fahrzeug und Bediensystem für ein Fahrzeug |
CN112766362A (zh) * | 2021-01-18 | 2021-05-07 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置和设备 |
CN113112282A (zh) * | 2021-04-20 | 2021-07-13 | 平安银行股份有限公司 | 基于客户画像处理咨诉问题的方法、装置、设备及介质 |
CN114547128A (zh) * | 2021-12-14 | 2022-05-27 | 浙江吉利控股集团有限公司 | 虚假订单的识别方法、系统、计算机设备及存储介质 |
WO2023224742A1 (en) * | 2022-05-17 | 2023-11-23 | Microsoft Technology Licensing, Llc | Predicting runtime variation in big data analytics |
CN116484244A (zh) * | 2022-12-30 | 2023-07-25 | 东南大学 | 基于聚类模型的自动驾驶事故发生机制分析方法 |
CN116502742A (zh) * | 2023-02-23 | 2023-07-28 | 北京民智数字科技有限公司 | 一种基于梯度提升决策树的风险行为信息预测方法及系统 |
CN116152863A (zh) * | 2023-04-19 | 2023-05-23 | 尚特杰电力科技有限公司 | 一种人员信息识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
基于Bi-LSTM和TFIDF的工单事件提取;范华;翁利国;周艳;姜川;孙涛;;电脑知识与技术;20200205(第04期);第291页-293页 * |
范华 ; 翁利国 ; 周艳 ; 姜川 ; 孙涛 ; .基于Bi-LSTM和TFIDF的工单事件提取.电脑知识与技术.2020,(第04期),第291页-293页. * |
Also Published As
Publication number | Publication date |
---|---|
CN117610891A (zh) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109873779B (zh) | 一种基于lstm的分级式无线信号调制类型识别方法 | |
CN107516135A (zh) | 一种支持多源数据的自动化监督性学习方法 | |
CN111160750A (zh) | 一种基于关联规则挖掘的配网分析和投资决策方法 | |
CN111291822B (zh) | 基于模糊聚类最优k值选择算法的设备运行状态判断方法 | |
CN112926045B (zh) | 一种基于逻辑回归模型的群控设备识别方法 | |
CN116028838B (zh) | 一种基于聚类算法的能源数据处理方法、装置及终端设备 | |
CN112819299A (zh) | 一种基于中心优化的差分K-means负荷聚类方法 | |
CN112783938B (zh) | 一种水文遥测实时数据异常检测方法 | |
WO2018006631A1 (zh) | 一种用户等级自动划分方法及系统 | |
CN111046977A (zh) | 基于em算法和knn算法的数据预处理方法 | |
WO2020024444A1 (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 | |
CN114048318A (zh) | 基于密度半径的聚类方法、系统、设备及存储介质 | |
CN117610891B (zh) | 一种基于大数据的灵活用工接单与风险控制系统 | |
CN111612519A (zh) | 一种识别金融产品潜在客户的方法、装置及存储介质 | |
CN110956541A (zh) | 一种基于智能融合计算的股票走势分类预测方法 | |
CN112508363A (zh) | 基于深度学习的电力信息系统状态分析方法及装置 | |
CN117131449A (zh) | 面向数据治理的具有传播学习能力的异常识别方法及系统 | |
CN111950652A (zh) | 一种基于相似度的半监督学习数据分类算法 | |
CN116206208A (zh) | 一种基于人工智能的林业病虫害快速分析系统 | |
CN113360657B (zh) | 一种公文智能分发办理方法、装置及计算机设备 | |
CN114444573A (zh) | 基于大数据聚类技术的电力客户标签生成方法 | |
CN114298460A (zh) | 素材工单分派处理方法、装置、设备及存储介质 | |
CN113191771A (zh) | 采购商账期风险预测方法 | |
CN117333486B (zh) | Uv面漆性能检测数据分析方法、装置及存储介质 | |
CN113011472B (zh) | 一种多段电力报价曲线相似性判断方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |