CN110930017A - 数据处理的方法及装置 - Google Patents
数据处理的方法及装置 Download PDFInfo
- Publication number
- CN110930017A CN110930017A CN201911134950.2A CN201911134950A CN110930017A CN 110930017 A CN110930017 A CN 110930017A CN 201911134950 A CN201911134950 A CN 201911134950A CN 110930017 A CN110930017 A CN 110930017A
- Authority
- CN
- China
- Prior art keywords
- task
- index data
- data
- distributed
- personnel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种数据处理的方法及装置,在获取待分配的任务的指标数据和待分配的人员的指标数据后,将获取待分配的任务的指标数据和待分配的人员的指标数据输入预先训练的任务分配预测模型中,该任务分配预测模型是根据已完成任务的指标数据和对应的人员的指标数据训练获得的,进而可以利用任务分配预测模型将待分配的人员与待分配的任务进行匹配,获得待分配的人员对于完成待分配的任务的预测结果,从而可以根据该待分配的人员对于完成待分配的任务的预测结果确定是否将该待分配的任务分配给该待分配的人员,即本发明实施例中,在分配任务和人员时,不再依赖人工经验,任务分配的效率和准确度较人工分配都有提升。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及数据处理的方法及装置。
背景技术
在游戏领域中,美术处理是非常重要的环节,在美术处理中,通常需要将各美术任务分配给不同的美工人员,由美工人员对各美术任务进行处理。
现有技术中,在进行美术任务分配时,大多是基于管理者的主观经验进行分配,任务分配的效率很低,且经常出现任务分配不合理的情况。
发明内容
本发明实施例提供数据处理的方法及装置,以解决任务分配的效率和准确度很低的技术问题。
本发明实施例第一方面提供一种数据处理的方法,包括:
获取待分配的任务的指标数据和待分配的人员的指标数据;
将所述待分配的任务的指标数据和所述待分配的人员的指标数据输入任务分配预测模型中,其中,所述任务分配预测模型根据已完成任务的指标数据和对应的人员的指标数据训练获得;
利用所述任务分配预测模型将所述待分配的人员与所述待分配的任务进行匹配,获得所述待分配的人员对于完成所述待分配的任务的预测结果。
可选的,所述方法还包括:
对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型。
可选的,所述对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型,包括:
获取已完成任务的指标数据和对应的人员的指标数据;
通过预设的库函数统计所述指标数据之间的关联关系;
根据所述关联关系从所述已获取的已完成任务的指标数据和对应的人员的指标数据中选取作为模型训练的指标数据的目标类型;
对所述已完成任务中所述目标类型的指标数据和对应的人员的目标类型的指标数据进行训练,获得所述任务分配预测模型。
可选的,所述通过预设的库函数统计所述指标数据之间的关联关系之后,还包括:
通过可视化图表显示所述关联关系。
可选的,所述根据所述关联关系从所述已获取的已完成任务的指标数据和对应的人员的指标数据中选取作为模型训练的指标数据的目标类型之前,还包括:
根据所述可视化图表中所显示的关联关系,确定异常数据;
对所述异常数据进行修正后,根据所述预设的库函数得到修正后的关联关系。
可选的,所述对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型之前,还包括:
对已完成任务的指标数据和对应的人员的指标数据进行标准化处理。
可选的,所述对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型,包括:
根据预设的分类模型和Boosting算法对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型。
可选的,所述预测结果与所述指标数据中的一种指标数据类型相同。
可选的,所述预测结果包括以下任意一项:提前完成任务、按时完成任务、延迟完成任务。
本发明实施例第二方面提供一种数据处理的装置,包括:
获取模块,用于获取待分配的任务的指标数据和待分配的人员的指标数据;
输入模块,用于将所述待分配的任务的指标数据和所述待分配的人员的指标数据输入任务分配预测模型中,其中,所述任务分配预测模型根据已完成任务的指标数据和对应的人员的指标数据训练获得;
处理模块,用于利用所述任务分配预测模型将所述待分配的人员与所述待分配的任务进行匹配,获得所述待分配的人员对于完成所述待分配的任务的预测结果。
可选的,还包括:
训练模块,用于对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型。
可选的,所述训练模块具体用于:
获取已完成任务的指标数据和对应的人员的指标数据;
通过预设的库函数统计所述指标数据之间的关联关系;
根据所述关联关系从所述已获取的已完成任务的指标数据和对应的人员的指标数据中选取作为模型训练的指标数据的目标类型;
对所述已完成任务中所述目标类型的指标数据和对应的人员的目标类型的指标数据进行训练,获得所述任务分配预测模型。
可选的,所述训练模块具体还用于:
通过可视化图表显示所述关联关系。
可选的,所述训练模块具体还用于:
根据所述可视化图表中所显示的关联关系,确定异常数据;
对所述异常数据进行修正后,根据所述预设的库函数得到修正后的关联关系。
可选的,所述训练模块具体还用于:
对已完成任务的指标数据和对应的人员的指标数据进行标准化处理。
可选的,所述训练模块具体还用于:
根据预设的分类模型和Boosting算法对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型。
可选的,所述预测结果与所述指标数据中的一种指标数据类型相同。
可选的,所述预测结果包括以下任意一项:提前完成任务、按时完成任务、延迟完成任务。
本发明实施例第三方面提供一种电子设备,包括:处理器,存储器以及计算机程序;其中,所述计算机程序被存储在所述存储器中,并且被配置为由所述处理器执行,所述计算机程序包括用于执行如前述第一方面任一项所述的方法的指令。
本发明实施例第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时,实现如前述第一方面任一项所述的方法。
本发明实施例相对于现有技术的有益效果:
本发明实施例中提供一种数据处理的方法及装置,在获取待分配的任务的指标数据和待分配的人员的指标数据后,将获取待分配的任务的指标数据和待分配的人员的指标数据输入预先训练的任务分配预测模型中,该任务分配预测模型是根据已完成任务的指标数据和对应的人员的指标数据训练获得的,进而可以利用任务分配预测模型将待分配的人员与待分配的任务进行匹配,获得待分配的人员对于完成待分配的任务的预测结果,从而可以根据该待分配的人员对于完成待分配的任务的预测结果确定是否将该待分配的任务分配给该待分配的人员,即本发明实施例中,在分配任务和人员时,不再依赖人工经验,任务分配的效率和准确度较人工分配都有提升。
附图说明
图1为本发明实施例提供的数据处理的方法的流程示意图;
图2为本发明实施例提供的数据处理的方法的另一流程示意图;
图3为本发明实施例提供的输出数据与输入数据的离散值示意图;
图4为本发明实施例提供的数据热力图示意图;
图5为本发明实施例提供的初始获取的任务统计样本示意图;
图6为本发明实施例提供的目标统计样本数据示意图;
图7为本发明实施例提供的数据处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,本发明说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
本发明实施例中提供一种数据处理的方法及装置,在获取待分配的任务的指标数据和待分配的人员的指标数据后,将获取待分配的任务的指标数据和待分配的人员的指标数据输入预先训练的任务分配预测模型中,该任务分配预测模型是根据已完成任务的指标数据和对应的人员的指标数据训练获得的,进而可以利用任务分配预测模型将待分配的人员与待分配的任务进行匹配,获得待分配的人员对于完成待分配的任务的预测结果,从而可以根据该待分配的人员对于完成待分配的任务的预测结果确定是否将该待分配的任务分配给该待分配的人员,即本发明实施例中,在分配任务和人员时,不再依赖人工经验,任务分配的效率和准确度较人工分配都有提升。
本发明实施例的数据处理方法可以应用于终端,终端可以包括:手机、平板电脑、笔记本电脑、台式电脑或者服务器等的电子设备。示例性的,终端中可以提供图形用户界面(graphical user interface,GUI),在图形用户界面中可以设置用于接收用户输入的输入框、语音录入按钮等,使得用户可以在图形用户界面中通过文字、语音等方式输入本发明实施例的待分配的任务的指标数据和待分配的人员的指标数据,可以理解,图形用户界面的具体内容可以根据实际的应用场景确定,本发明实施例对此不作具体限定。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
如图1所示,图1为本发明实施例提供的数据处理的方法的流程示意图。
该方法具体可以包括:
步骤S101:获取待分配的任务的指标数据和待分配的人员的指标数据。
本发明实施例中,可以基于用户的输入,获取待分配的任务的指标数据和待分配的人员的指标数据,或者根据实际的应用场景,采用其他的方式获取待分配的任务的指标数据和待分配的人员的指标数据,本发明实施例对此不作具体限定。
示例性的,可以在终端设备中设置图形用户界面,图形用户界面中可以分别设置接收用户输入的待分配的任务的指标数据的输入框、和接收用户输入待分配的人员的指标数据的输入框,进而终端可以从各输入框中接收用户输入的待分配的任务的指标数据和待分配的人员的指标数据。
可以理解,根据实际的应用场景,本发明实施例还可以采用其他方式在图形用户界面中接收用户输入的待分配的任务的指标数据和待分配的人员的指标数据,本发明实施例对此不作具体限定。
本发明实施例中,待分配的人员例如可以是美术师或供应商等,待分配的人员的指标数据可以是已完成美术任务所对应美术师或供应商的数据描述,例如人员等级、擅长风格、项目配合年限等。
本发明实施例所描述的待分配的任务的指标数据可以是美术待分配的任务的指标数据,也可以是其他的待分配的任务的指标数据。示例性的,美术待分配的任务的指标数据可以包括:任务类型、任务难度、成本、完成日期等。
步骤S102:将所述待分配的任务的指标数据和所述待分配的人员的指标数据输入任务分配预测模型中,其中,所述任务分配预测模型根据已完成任务的指标数据和对应的人员的指标数据训练获得。
本发明实施例中,任务分配预测模型可以是通过已完成任务的指标数据和对应的人员的指标数据训练得到的。
示例性的,可以已完成任务的指标数据和对应的人员的指标数据的样本,将样本标注后输入神经网络模型,进而结合损失函数和神经节点权重调节等方式,使得该神经网络模型输出的历史已完成任务对应的人员对该历史已完成任务的完成情况与样本实际相近,从而得到任务分配预测模型。通过向任务分配预测模型输入待分配的任务的指标数据和待分配的人员的指标数据,任务分配预测模型可以自动计算输出该待分配的人员对该待分配的任务的完成情况。任务分配预测模型的训练方式将在后续的实施例中进一步详细说明,在此不作赘述。
步骤S103:利用所述任务分配预测模型将所述待分配的人员与所述待分配的任务进行匹配,获得所述待分配的人员对于完成所述待分配的任务的预测结果。
本发明实施例中,任务分配预测模型可以基于训练时的已完成任务的指标数据和对应的人员的指标数据,将待分配的任务的指标数据与待分配的人员的指标数据进行匹配,进而基于匹配情况确定该待分配的人员对于该待分配的任务的预测结果。
示例性的,以所述待分配的任务的指标数据为游戏中的美术任务的指标数据,所述预测结果的完成情况包括:提前完成任务、按时完成任务或延迟完成任务为例进行说明。
本发明实施例中,可以将美术任务采用各个维度的数据描述,比如,每个美术任务的指标数据可以包括:任务类型、任务难度、成本、完成日期等,则任务分配预测模型可以基于用户输入的待分配的任务的指标数据中的任务类型、任务难度、成本、完成日期,与待分配的人员等级、擅长风格、项目配合年限、已分配任务等进行匹配计算,确定该待分配的人员完成该待分配的任务可能的日期,从而确定该待分配的任务提前完成、按时完成或延迟完成,进一步可以在图形用户界面中输出待分配的任务的完成情况,则用户可以判定该待分配的人员是否能准时完成该待分配的任务,进而确定是否将该待分配的任务分配给该待分配的人员。
综上所述,本发明实施例中提供一种数据处理的方法及装置,在获取待分配的任务的指标数据和待分配的人员的指标数据后,将获取待分配的任务的指标数据和待分配的人员的指标数据输入预先训练的任务分配预测模型中,该任务分配预测模型是根据已完成任务的指标数据和对应的人员的指标数据训练获得的,进而可以利用任务分配预测模型将待分配的人员与待分配的任务进行匹配,获得待分配的人员对于完成待分配的任务的预测结果,从而可以根据该待分配的人员对于完成待分配的任务的预测结果确定是否将该待分配的任务分配给该待分配的人员,即本发明实施例中,在分配任务和人员时,不再依赖人工经验,任务分配的效率和准确度较人工分配都有提升。
可选的,在所述预测结果为延迟完成任务的情况下,利用所述任务分配预测模型输出所述待分配的任务的目标处理对象。
本发明实施例中,在待分配的任务的完成情况为延迟完成的情况下,可以进一步利用任务分配预测模型中预先训练的多个处理对象的历史任务完成数据,为该待分配的任务匹配能提前完成或按时完成的目标处理对象,并输出该待分配的任务的目标处理对象,以达到向用户推荐合适的目标处理对象的效果。
可选的,图2为本发明实施例提供的数据处理的方法的任务分配预测模型得到流程示意图。如图2所示,本发明提供的数据处理的方法具体可以包括:
步骤S201:获取已完成任务的指标数据和对应的人员的指标数据。
本申请实施例中,可以从本地服务器或网络获取已完成任务的指标数据和对应的人员的指标数据作为模型训练的样本,本发明实施例对此不作具体限定。
示例性的,以已完成任务的指标数据和对应的人员的指标数据为美术任务和对应该的美工人员为例,已完成任务的指标数据和对应的人员的指标数据的来源可以是基于“项目维度每月人天”数据表,该数据表中可以包括当月每个已完成美术任务的制作详情和人员分配情况。在具体实现中,可以从每个美术任务中把所需维度的数据提取出来,存放到数据表中,将美术任务对应的现有美术师(或供应商)进行数据评价,然后将人员数据放到数据表中对应任务后面。最后,将各项任务是否按时完成的状态全部转化为数字表示,得到数据表。可以理解,在实际应用中,已完成任务的指标数据和对应的人员的指标数据的数量越大,通常能得到越准确的任务分配预测模型。
步骤S202:通过预设的库函数统计所述指标数据之间的关联关系。
本申请实施例中,关联关系指的是具有一定相关性的关系。示例性的,可以利用机器学习中现有的库函数来统计已完成任务的指标数据和对应的人员的指标数据的相关程度,示例性的,已完成任务的指标数据和对应的人员的指标数据之间的关联关系可以抽取为:任务类型、任务难度、任务执行对象(也可以称为任务对应的人员)、各任务执行对象的数据以及任务完成情况之间的关联关系。
可以理解,库函数、任务类型、任务难度、任务执行对象以及任务完成情况均可以根据实际的应用场景采用适应的内容表示,本发明实施例对此不作具体限定。
示例性的,任务类型(Project Style)用于表示美术任务风格,可以设置为1为欧美写实、2为欧美卡通、3为国风写实、4为国风卡通、5为日韩写实、6为日韩卡通。
任务难度(Hard Level)可以设置为:0简单、0.5中等、1复杂。
任务执行对象(ID)可以为当前人员姓名。
任务完成情况(Label)中,可以设置:延迟为“-1”,按时为“0”,提前为“1”。
各任务执行对象的数据中可以包括:
任务执行对象的级别(Personal Level),例如可以直接对标任务执行对象(比如美术师)在公司内的专业级别,数值越大级别越高。
任务执行对象的第一擅长风格(Personal Style),可以设置为:1为欧美写实、2为欧美卡通、3为国风写实、4为国风卡通、5为日韩写实、6为日韩卡通。
任务执行对象的第二擅长的风格(Personal Sytle2),可以与第一擅长风格属性定义一致,如果没有则设置为0。
任务执行对象的效率指标(Personal Efficiency),可以设置数值在0~1之间,越高效率越高。
任务执行对象的已分配或跟进的项目数量(Nums of serviced project)。
任务执行对象的跟进项目的年限(Years in this project),可以反映任务执行对象的经验。
可以理解,模型训练中的所包含的数据越多,通常能得到越准确的任务分配预测模型,因此,本发明实施例可以持续积累模型训练需要的数据,持续对任务分配预测模型进行调优,从而得到准确度较高的任务分配预测模型。
可选的,还可以通过可视化图表显示所述关联关系。
示例性的,如图3所示,示出了输出数据(对应于预测结果)与两两输入数据(对应于已完成任务的指标数据和对应的人员的指标数据)的离散值示意图,输出数据与两两输入数据的离散值呈现明显可分类的情况。例如在图3中,延期交付几乎全部集中于图片的一部分,说明了随着任务难度加大、并行的项目任务数量增多,延期的任务数随之变多,任务难度和并行项目任务数对于最终输出(项目任务是否能够按时完成)是有强烈影响的。同理于其他图,也可以明显看到类似正相关或负相关性。
示例性的,如图4所示,示出了数据热力图示意图,可以从数值上反映数据维度同输出维度的相关性,比如图4第一行数值大小即为相关程度大小的呈现,可以看到所有输入数据对输出数据都有大于0的影响。例如人员效率对最终输出有很强的正向影响,而个人第二擅长风格的影响就不是很大,以上相关影响从实际角度考虑存在合理的解释,也从侧面说明了本发明实施例所选取的用于描述美术任务的数据维度是比较准确的。
可选的,还可以根据所述可视化图表中所显示的关联关系,确定异常数据;对所述异常数据进行修正后,根据所述预设的库函数得到修正后的关联关系。
本发明实施例中,可以对已完成任务的指标数据和对应的人员的指标数据进行数据清洗,将异常数据进行修正,得到准确的关联关系。示例性的,可以过滤已完成任务的指标数据和对应的人员的指标数据中的无效数据,并补全已完成任务的指标数据和对应的人员的指标数据中的缺失数据。
本发明实施例中,在得到已完成任务的指标数据和对应的人员的指标数据后,可以根据图3或图4的可视化的图,剔除异常点对应的无效数据,降低异常点对于模型训练的干扰,同时检查任务统计样本中是否有缺失数据,进行数据不全。
可选的,还可以对已完成任务的指标数据和对应的人员的指标数据进行标准化处理。
本发明实施例中,可以对数据清洗后得到的已完成任务的指标数据和对应的人员的指标数据进行标准化处理,因为每一项数据的数据范围可能有非常大的不同,比如级别和成本,两者范围相差很大,这对回归模型是非常不友好的,会较大程度影响准确率,为了将各个数据维度对最终输出的影响同等化,需要将它们都标准到一个固定统一维度,示例的,可以将目标样本数据的数据范围标准化到0~1之间。
示例性的,图5可以为初始获取的已完成任务的指标数据和对应的人员的指标数据,经过数据清洗和处理为预设的数据范围后,可以得到如图6所示的已完成任务的指标数据和对应的人员的指标数据。
步骤S203:根据所述关联关系从所述已获取的已完成任务的指标数据和对应的人员的指标数据中选取作为模型训练的指标数据的目标类型。
本申请实施例中,模型训练时,已完成任务的指标数据和对应的人员的指标数据可以进一步划分为训练集和测试集,因此,目标类型可以包括对应于测试集的测试类型和对应于训练集的训练类型,训练集就是用于构建模型的数据集,测试集则是对已完成的模型进行评估,具体操作将利用Python机器学习库sklearn的train_test_split方法进行分割,训练中可以通过测试集验证当前模型的准确性,如果达不到预期的要求,就需要调整参数后进行下一轮的迭代,直到达到设定标准。
步骤S204:对所述已完成任务中所述目标类型的指标数据和对应的人员的目标类型的指标数据进行训练,获得所述任务分配预测模型。
本发明实施例中,可以通过测试集合训练集进行迭代训练,得到任务分配预测模型。
本发明实施例中,为了提升任务分配预测模型的准确度、鲁棒性和泛化能力,可选的,可以根据预设的分类模型和Boosting算法对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型,具体的,可以采用多种形式的神经网络模型和目标样本数据,训练得到多个模型,再根据各模型输出的预测结果和实际的任务完成情况的匹配情况,将多个模型进行集成,得到任务分配预测模型。
示例性的,所述多种形式的神经网络模型包括:线性分类模型、决策树模型、支持向量机(Support Vector Machine,SVM)分类模型、邻近算法(k-NearestNeighbor,KNN)分类模型和朴素贝叶斯分类模型。进而可以根据各模型输出的预测结果和实际的任务完成情况的匹配情况,确定各模型的权重;根据各模型的权重和Boosting算法将多个模型组合,得到任务分配预测模型。
可以理解,线性分类模型、决策树模型、SVM分类模型、KNN分类模型和朴素贝叶斯分类模型的训练都是较为惯用的神经网络模型,在此不再赘述各模型的具体训练方式。
示例性的,通过各模型输出的预测结果和实际的任务完成情况的匹配情况确定:线性分类模型的准确率为66.6%,决策树模型的准确率为63.9%,SVM分类模型的准确率为69.4%,KNN分类模型的准确率为66.6%,朴素贝叶斯分类模型的准确率为69.4%,则可以为SVM分类模型确定较高的权重,为决策树模型确定较低的权重,进而通过对各模型加权平均或投票,采用Boosting算法将所述多个模型组合,得到具有较好鲁棒性和泛化能力的任务分配预测模型。
具体的,Boosting是一种框架算法,主要是通过对样本集的操作获得样本子集。然后用弱分类算法在样本子集上训练生成一系列的基分类器,可以用来提高其他弱分类算法的识别率。Boosting是较为惯用的算法,在此不再赘述其具体实现方式。
综上所述,本发明实施例将机器学习的技术引入到游戏美术项目管理中来,对过往数据进行整理、清洗与总结,以发现可以适用于未来的规律,用科学的方法进行合理的美术任务人员适配与风险预判,最大化利用客观数据的价值,使得对于每个具体的美术任务,都可以迅速在可选范围内挑选出最合适的人员进行匹配,相比此前人工评估匹配提高了效率,且可以逐渐摒弃人工经验模式,匹配结果由数据规律给出,科学合理,提前预判人员与任务的匹配程度,及早发现甚至规避风险项,提升了项目管理价值,助力项目健康运转。
图7为本发明提供的数据处理的装置一实施例的结构示意图。如图7所示,本实施例提供的数据处理的装置包括:
获取模块31,用于获取待分配的任务的指标数据和待分配的人员的指标数据;
输入模块32,用于将所述待分配的任务的指标数据和所述待分配的人员的指标数据输入任务分配预测模型中,其中,所述任务分配预测模型根据已完成任务的指标数据和对应的人员的指标数据训练获得;
处理模块33,用于利用所述任务分配预测模型将所述待分配的人员与所述待分配的任务进行匹配,获得所述待分配的人员对于完成所述待分配的任务的预测结果。
可选的,还包括:
训练模块,用于对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型。
可选的,所述训练模块具体用于:
获取已完成任务的指标数据和对应的人员的指标数据;
通过预设的库函数统计所述指标数据之间的关联关系;
根据所述关联关系从所述已获取的已完成任务的指标数据和对应的人员的指标数据中选取作为模型训练的指标数据的目标类型;
对所述已完成任务中所述目标类型的指标数据和对应的人员的目标类型的指标数据进行训练,获得所述任务分配预测模型。
可选的,所述训练模块具体还用于:
通过可视化图表显示所述关联关系。
可选的,所述训练模块具体还用于:
根据所述可视化图表中所显示的关联关系,确定异常数据;
对所述异常数据进行修正后,根据所述预设的库函数得到修正后的关联关系。
可选的,所述训练模块具体还用于:
对已完成任务的指标数据和对应的人员的指标数据进行标准化处理。
可选的,所述训练模块具体还用于:
根据预设的分类模型和Boosting算法对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型。
可选的,所述预测结果与所述指标数据中的一种指标数据类型相同。
可选的,所述预测结果包括以下任意一项:提前完成任务、按时完成任务、延迟完成任务。
综上所述,本发明实施例中提供一种数据处理的方法及装置,在获取待分配的任务的指标数据和待分配的人员的指标数据后,将获取待分配的任务的指标数据和待分配的人员的指标数据输入预先训练的任务分配预测模型中,该任务分配预测模型是根据已完成任务的指标数据和对应的人员的指标数据训练获得的,进而可以利用任务分配预测模型将待分配的人员与待分配的任务进行匹配,获得待分配的人员对于完成待分配的任务的预测结果,从而可以根据该待分配的人员对于完成待分配的任务的预测结果确定是否将该待分配的任务分配给该待分配的人员,即本发明实施例中,在分配任务和人员时,不再依赖人工经验,任务分配的效率和准确度较人工分配都有提升。
本发明各实施例提供的数据处理的装置可用于执行如前述各对应的实施例所示的方法,其实现方式与原理相同,不再赘述。
本发明实施例还提供一种电子设备,包括:处理器,存储器以及计算机程序;其中,所述计算机程序被存储在所述存储器中,并且被配置为由所述处理器执行,所述计算机程序包括用于执行如前述实施例中任一项所述的方法的指令。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时,实现如前述实施例中任一项所述的方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (12)
1.一种数据处理的方法,其特征在于,所述方法包括:
获取待分配的任务的指标数据和待分配的人员的指标数据;
将所述待分配的任务的指标数据和所述待分配的人员的指标数据输入任务分配预测模型中,其中,所述任务分配预测模型根据已完成任务的指标数据和对应的人员的指标数据训练获得;
利用所述任务分配预测模型将所述待分配的人员与所述待分配的任务进行匹配,获得所述待分配的人员对于完成所述待分配的任务的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对已完成任的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型。
3.根据权利要求2所述的方法,其特征在于,所述对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型,包括:
获取已完成任务的指标数据和对应的人员的指标数据;
通过预设的库函数统计所述指标数据之间的关联关系;
根据所述关联关系从所述已获取的已完成任务的指标数据和对应的人员的指标数据中选取作为模型训练的指标数据的目标类型;
对所述已完成任务中所述目标类型的指标数据和对应的人员的目标类型的指标数据进行训练,获得所述任务分配预测模型。
4.根据权利要求3所述的方法,其特征在于,所述通过预设的库函数统计所述指标数据之间的关联关系之后,还包括:
通过可视化图表显示所述关联关系。
5.根据权利要求4所述的方法,其特征在于,所述根据所述关联关系从所述已获取的已完成任务的指标数据和对应的人员的指标数据中选取作为模型训练的指标数据的目标类型之前,还包括:
根据所述可视化图表中所显示的关联关系,确定异常数据;
对所述异常数据进行修正后,根据所述预设的库函数得到修正后的关联关系。
6.根据权利要求2所述的方法,其特征在于,所述对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型之前,还包括:
对已完成任务的指标数据和对应的人员的指标数据进行标准化处理。
7.根据权利要求2所述的方法,其特征在于,所述对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型,包括:
根据预设的分类模型和Boosting算法对已完成任务的指标数据和对应的人员的指标数据进行训练获得所述任务分配预测模型。
8.根据权利要求1所述的方法,其特征在于,所述预测结果与所述指标数据中的一种指标数据类型相同。
9.根据权利要求1所述的方法,其特征在于,所述预测结果包括以下任意一项:提前完成任务、按时完成任务、延迟完成任务。
10.一种数据处理的装置,其特征在于,包括:
获取模块,用于获取待分配的任务的指标数据和待分配的人员的指标数据;
输入模块,用于将所述待分配的任务的指标数据和所述待分配的人员的指标数据输入任务分配预测模型中,其中,所述任务分配预测模型根据已完成任务的指标数据和对应的人员的指标数据训练获得;
处理模块,用于利用所述任务分配预测模型将所述待分配的人员与所述待分配的任务进行匹配,获得所述待分配的人员对于完成所述待分配的任务的预测结果。
11.一种电子设备,其特征在于,包括:
处理器,存储器以及计算机程序;其中,所述计算机程序被存储在所述存储器中,并且被配置为由所述处理器执行,所述计算机程序包括用于执行如权利要求1-9任一项所述的方法的指令。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时,实现如权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911134950.2A CN110930017B (zh) | 2019-11-19 | 2019-11-19 | 数据处理的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911134950.2A CN110930017B (zh) | 2019-11-19 | 2019-11-19 | 数据处理的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110930017A true CN110930017A (zh) | 2020-03-27 |
CN110930017B CN110930017B (zh) | 2023-04-07 |
Family
ID=69850294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911134950.2A Active CN110930017B (zh) | 2019-11-19 | 2019-11-19 | 数据处理的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110930017B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111754121A (zh) * | 2020-06-28 | 2020-10-09 | 北京百度网讯科技有限公司 | 任务分配的方法、装置、设备以及存储介质 |
CN112036648A (zh) * | 2020-09-02 | 2020-12-04 | 中国平安财产保险股份有限公司 | 基于模型的任务分配方法、装置、计算机设备和存储介质 |
CN112053092A (zh) * | 2020-09-29 | 2020-12-08 | 中国银行股份有限公司 | 工单的处理方法、装置、可读介质以及设备 |
CN112184050A (zh) * | 2020-10-13 | 2021-01-05 | 深圳壹账通智能科技有限公司 | 任务分发方法、装置、电子设备及存储介质 |
CN112529390A (zh) * | 2020-12-02 | 2021-03-19 | 平安医疗健康管理股份有限公司 | 任务分配方法、装置、计算机设备和存储介质 |
CN116109116A (zh) * | 2023-04-13 | 2023-05-12 | 中建安装集团有限公司 | 一种基于云计算的应用程序综合监管控制系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109597851A (zh) * | 2018-09-26 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 基于关联关系的特征提取方法和装置 |
CN109902901A (zh) * | 2017-12-11 | 2019-06-18 | 广东智动力知识产权运营有限公司 | 任务分配方法、装置、存储介质和计算机设备 |
CN109919417A (zh) * | 2019-01-18 | 2019-06-21 | 深圳壹账通智能科技有限公司 | 金融系统的任务分配方法及装置、电子设备、存储介质 |
-
2019
- 2019-11-19 CN CN201911134950.2A patent/CN110930017B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902901A (zh) * | 2017-12-11 | 2019-06-18 | 广东智动力知识产权运营有限公司 | 任务分配方法、装置、存储介质和计算机设备 |
CN109597851A (zh) * | 2018-09-26 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 基于关联关系的特征提取方法和装置 |
CN109919417A (zh) * | 2019-01-18 | 2019-06-21 | 深圳壹账通智能科技有限公司 | 金融系统的任务分配方法及装置、电子设备、存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111754121A (zh) * | 2020-06-28 | 2020-10-09 | 北京百度网讯科技有限公司 | 任务分配的方法、装置、设备以及存储介质 |
CN111754121B (zh) * | 2020-06-28 | 2024-02-06 | 北京百度网讯科技有限公司 | 任务分配的方法、装置、设备以及存储介质 |
CN112036648A (zh) * | 2020-09-02 | 2020-12-04 | 中国平安财产保险股份有限公司 | 基于模型的任务分配方法、装置、计算机设备和存储介质 |
CN112053092A (zh) * | 2020-09-29 | 2020-12-08 | 中国银行股份有限公司 | 工单的处理方法、装置、可读介质以及设备 |
CN112053092B (zh) * | 2020-09-29 | 2023-09-12 | 中国银行股份有限公司 | 工单的处理方法、装置、可读介质以及设备 |
CN112184050A (zh) * | 2020-10-13 | 2021-01-05 | 深圳壹账通智能科技有限公司 | 任务分发方法、装置、电子设备及存储介质 |
CN112529390A (zh) * | 2020-12-02 | 2021-03-19 | 平安医疗健康管理股份有限公司 | 任务分配方法、装置、计算机设备和存储介质 |
CN116109116A (zh) * | 2023-04-13 | 2023-05-12 | 中建安装集团有限公司 | 一种基于云计算的应用程序综合监管控制系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110930017B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110930017B (zh) | 数据处理的方法及装置 | |
CN108009465B (zh) | 一种人脸识别方法及装置 | |
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
US10983786B2 (en) | Automatically evaluating software project requirements | |
US20210103858A1 (en) | Method and system for model auto-selection using an ensemble of machine learning models | |
US20210012145A1 (en) | System and method for multi-modal image classification | |
CN107886231B (zh) | 客服的服务质量评价方法与系统 | |
CN107833059B (zh) | 客服的服务质量评价方法与系统 | |
US20140324908A1 (en) | Method and system for increasing accuracy and completeness of acquired data | |
CN111340233B (zh) | 机器学习模型的训练方法及装置、样本处理方法及装置 | |
CN110348516B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN113159213A (zh) | 一种业务分配方法、装置及设备 | |
CN112053205A (zh) | 通过机器人情绪识别的产品推荐方法及装置 | |
CN112884569A (zh) | 一种信用评估模型的训练方法、装置及设备 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN113392920B (zh) | 生成作弊预测模型的方法、装置、设备、介质及程序产品 | |
CN111754287A (zh) | 物品筛选方法、装置、设备和存储介质 | |
CN112561569B (zh) | 基于双模型的到店预测方法、系统、电子设备及存储介质 | |
CN113887214A (zh) | 基于人工智能的意愿推测方法、及其相关设备 | |
CN113822390B (zh) | 用户画像构建方法、装置、电子设备和存储介质 | |
CN115630708A (zh) | 一种模型更新方法、装置、电子设备、存储介质及产品 | |
CN110472680B (zh) | 目标分类方法、装置和计算机可读存储介质 | |
CN115907926A (zh) | 商品的推荐方法、装置、电子设备及存储介质 | |
CN115034762A (zh) | 一种岗位推荐方法、装置、存储介质、电子设备及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |