CN108564247A

CN108564247A - 数据调整方法、装置及服务器

Info

Publication number: CN108564247A
Application number: CN201810174729.9A
Authority: CN
Inventors: 阮征
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2018-03-02
Filing date: 2018-03-02
Publication date: 2018-09-21

Abstract

本说明书实施例提供一种数据调整方法、装置及服务器，该方案涉及两个模型，任务量预测模型用于根据历史任务数据的任务特征预测出未来预定时间的待处理任务的任务量预测值，而处理能力预测模型用于根据数据集中的处理单元特征，预测出该数据集的可处理任务量的预测值。通过上述两项预测，本说明书实施例可以根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整。

Description

数据调整方法、装置及服务器

技术领域

本说明书实施例涉及信息处理技术领域，尤其涉及数据调整方法、装置及服务器。

背景技术

在计算机应用技术领域，通常会面临任务处理需求，对于这些任务处理需求，需要提前制定任务计划，以调度一些处理单元处理实际产生的任务。然而，即使预先安排了这些处理单元，但出于计划不够周全或实际产生的任务不可控等原因，安排好的处理单元有可能无法完成任务的处理，也有可能出现任务较少而处理单元闲置的情况。

发明内容

为克服相关技术中存在的问题，本说明书实施例提供了数据调整方法、装置及服务器。

根据本说明书实施例实施例的第一方面，提供一种数据调整方法，所述方法包括：

获取待调度人员数据集，所述人员数据集表征未来预定时间内的待调度人员；

以历史任务数据的任务特征为输入，利用任务量预测模型获得未来预定时间的待处理任务的任务量预测值；

以所述人员数据集中的人员特征为输入，利用处理能力预测模型获得所述人员数据集的可处理任务量的预测值；

根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述人员数据集的数据进行调整。

可选的，所述待处理任务包括至少两种任务类型，所述待处理任务的任务量预测值包括：针对每种类型待处理任务的数量预测值；

所述人员数据集中的人员具有适配任务类型标签，所述获得所述人员数据集的可处理任务量的预测值，包括：针对由不同标签人员所构成的子集，分别获得所述子集的可处理任务量的预测值。

可选的，所述根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对待调度人员数据集的数据进行调整，包括：

根据所述子集的可处理任务量的预测值与对应类型待处理任务的数量预测值的相对关系，确定是否针对所述子集的数据进行调整。

可选的，所述人员所具有的标签，通过该人员对所述一种或多种类型任务的历史处理效率而确定。

根据所述可处理任务量的预测值与任务量预测值的差值，确定是否对所述人员数据集中的人员进行增加处理或减少处理。

可选的，所述历史任务数据的任务特征包括如下一种或多种：

设定时间周期内的任务产生数量、任务处理完成数量、任务类型、任务积压数量、任务积压类型、任务平均处理时长、任务期限或任务处理能力要求信息。

可选的，所述人员特征包括如下一种或多种：

人员身份信息、设定时间周期内所分配的任务数量、未完成的任务数量、已完成任务总量所有任务的平均处理时长、每种类型任务的平均处理时长、每种类型任务的完成量或每种类型任务的未完成量。

根据本说明书实施例实施例的第二方面，提供一种数据调整方法，所述方法包括：

获取处理单元数据集，所述数据集表征未来预定时间内的待调度处理单元；

以所述数据集中的处理单元特征为输入，利用处理能力预测模型获得所述数据集的可处理任务量的预测值；

根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整。

所述数据集中的处理单元具有适配任务类型标签，所述获得所述数据集的可处理任务量的预测值，包括：针对由不同标签处理单元所构成的子集，分别获得所述子集的可处理任务量的预测值。

可选的，所述根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整，包括：

可选的，所述处理单元所具有的标签，通过该处理单元对所述一种或多种类型任务的历史处理效率而确定。

根据所述可处理任务量的预测值与任务量预测值的差值，确定是否对所述数据集中的处理单元数量进行增加处理或减少处理。

可选的，所述处理特征包括如下一种或多种：

处理单元标识特征、设定时间周期内所分配的任务数量、未完成的任务数量、已完成任务总量所有任务的平均处理时长、每种类型任务的平均处理时长、每种类型任务的完成量或每种类型任务的未完成量。

根据本说明书实施例实施例的第三方面，提供一种数据调整装置，所述装置包括：

数据集获取模块，用于：获取待调度人员数据集，所述人员数据集表征未来预定时间内的待调度人员；

任务量预测模块，用于：以历史任务数据的任务特征为输入，利用任务量预测模型获得未来预定时间的待处理任务的任务量预测值；

处理能力预测模块，用于：以所述人员数据集中的人员特征为输入，利用处理能力预测模型获得所述人员数据集的可处理任务量的预测值；

调整模块，用于：根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述人员数据集的数据进行调整。

所述人员数据集中的人员具有适配任务类型标签，所述任务量预测模块42，用于：针对由不同标签人员所构成的子集，分别获得所述子集的可处理任务量的预测值。

可选的，所述调整模块，用于：

根据所述可处理任务量的预测值与任务量预测值的差值，确定是否对待调度人员数据集中的人员数量进行增加处理或减少处理。

可选的，所述人员特征包括如下一种或多种：

人员身份特征、设定时间周期内所分配的任务数量、未完成的任务数量、已完成任务总量所有任务的平均处理时长、每种类型任务的平均处理时长、每种类型任务的完成量或每种类型任务的未完成量。

根据本说明书实施例实施例的第四方面，提供一种数据调整装置，所述装置包括：

数据集获取模块，用于：获取处理单元数据集，所述数据集表征未来预定时间内的待调度处理单元；

处理能力预测模块，用于：以所述数据集中的处理单元特征为输入，利用处理能力预测模型获得所述数据集的可处理任务量的预测值；

调整模块，用于：根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整。

所述数据集中的处理单元具有适配任务类型标签，所述任务量预测模块52，用于：针对由不同标签处理单元所构成的子集，分别获得所述子集的可处理任务量的预测值。

可选的，所述调整模块，用于：

根据所述可处理任务量的预测值与任务量预测值的差值，确定是否对所述数据集中的处理单元进行增加处理或减少处理。

可选的，所述处理特征包括如下一种或多种：

根据本说明书实施例实施例的第五方面，提供一种服务器，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

根据本说明书实施例实施例的第六方面，提供一种服务器，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

本说明书实施例的实施例提供的技术方案可以包括以下有益效果：

本说明书实施例中，该方案涉及两个模型，任务量预测模型用于根据历史任务数据的任务特征预测出未来预定时间的待处理任务的任务量预测值，而处理能力预测模型用于根据数据集中的处理单元特征，预测出该数据集的可处理任务量的预测值。通过上述两项预测，本说明书实施例可以根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书实施例。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本说明书的实施例，并与说明书一起用于解释本说明书实施例的原理。

图1是本说明书根据一示例性实施例示出的一种数据调整方法的流程图。

图2A是本说明书根据一示例性实施例示出的另一种数据调整方法的流程图。

图2B是本说明书根据一示例性实施例示出的一种数据调整方法的应用场景图。

图2C是本说明书根据一示例性实施例示出的另一种数据调整方法的流程图。

图3是本说明书根据一示例性实施例示出的一种数据调整装置所在服务设备的一种硬件结构图。

图4是本说明书实施例根据一示例性实施例示出的一种数据调整装置的框图。

图5是本说明书实施例根据一示例性实施例示出的另一种数据调整装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书实施例的一些方面相一致的装置和方法的例子。

在本说明书实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书实施例。在本说明书实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

背景技术中所描述的情况，在计算机应用领域中常常会遇到。举例来说，为了处理某类计算任务，处理方需要提前安排一些处理单元，理想状态是处理方所提前安排的待调度处理单元刚好能够满足计算任务的需求，既不会出现因为处理单元较少而导致无法完成任务的情况，也不会因为处理单元较多而导致某些处理单元处于闲置状态的情况。

基于此，本说明书实施例提供一种数据调整方案，该方案涉及两个模型，任务量预测模型用于根据历史任务数据的任务特征预测出未来预定时间的待处理任务的任务量预测值，而处理能力预测模型用于根据数据集中的处理单元特征，预测出该数据集的可处理任务量的预测值。通过上述两项预测，本说明书实施例可以根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整。接下来对本说明书实施例进行详细说明。

如图1所示，是本说明书根据一示例性实施例示出的一种数据调整方法的流程图，包括：

在步骤102中，获取处理单元数据集，所述数据集表征未来预定时间内的待调度处理单元。

在步骤104中，以历史任务数据的任务特征为输入，利用任务量预测模型获得未来预定时间的待处理任务的任务量预测值；

在步骤106中，以所述数据集中的处理单元特征为输入，利用处理能力预测模型获得所述数据集的可处理任务量的预测值；

在步骤108中，根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整。

本说明书实施例的处理单元在不同应用场景下可以指代不同的对象，在某些服务场景中，处理单元可以包括服务集群中的服务器，服务器用于处理服务请求等任务；在其他调度场景中，处理单元可以包括线程池中的线程，线程用于供应用程序等任务进行调度使用；在另一些场景中，处理单元还可以包括解决任务所需要的人员等等，本说明书实施例对此不作限定。

本说明书实施例可以预先训练得到任务量预测模型和处理能力预测模型，接下来对这两个模型分别进行说明。

针对任务量预测模型，可以预先准备用于训练的样本数据，本说明书实施例中可以选取历史任务数据作为样本数据，以使任务量预测模型能够分析得到历史各个时期任务数量的增减或波动趋势等，进而准确预测出未来一段时间的待处理任务。其中，用于训练的历史任务数据需要达到一定的数量以保证训练出的模型的精确度。另一方面，当任务预测模型训练好开始应用后，实际产生的任务数据也可以作为样本，从而实现对任务预测模型的持续训练及优化。

在准备有上述样本数据后，任务预测模型可以利用样本数据对机器学习模型训练得到。在训练过程中，训练一个准确率较高的合适的模型，需要依赖于特征选择和模型选择。其中，机器学习模型可以包括逻辑回归模型、随机森林模型、贝叶斯方法模型、支持向量机模型或神经网络模型等等，模型的选择影响最终所训练得到的识别模型的精确度，因此，实际应用中可以选择多种模型进行训练，而训练过程较为耗时，需要复杂的迭代计算过程，以选取出合适的模型。

训练过程的另一方面，是选取合适的特征。本实施例中的任务特征，可以包括设定时间周期内的任务产生数量、任务处理完成数量、任务类型、任务积压数量、任务积压类型、任务平均处理时长、任务期限或任务处理能力要求信息等等。

通过上述方式，在准备好样本数据、选取好任务特征和模型后，即可训练出任务预测模型，在任务预测模型训练完成后，该任务预测模型在需要时，可以输出未来预定时间的待处理任务的任务量预测值。作为示例，在某些例子中，任务量预测值可以指示未来预定时间内这些待处理任务的总数量，也即是，该总数量表示：未来预定时间，要完成这些待处理任务，对处理单元的处理能力的需求只有基本的数量要求。

在一些例子，若没有特殊的要求，任务量预测值可以指示基本的任务总量；具体的，作为示例，获取的任务量预测值可以是N，即待处理任务有N个。

在另一些例子中，待处理任务可能还会有某些特殊的需求，例如某些任务对完成期限有需求、某些任务对处理时长有需求、某些任务对存储空间的需求、某些任务对资源的需求等等。因此，该任务量预测值还可以包括：对各项处理能力具有需求的任务量预测值；具体的，作为示例，待处理任务的任务量预测值可以包括N1、N2或N3等，N1可以表示待处理任务中要求处理时长在1天内的任务量有N1个，N2可以表示待处理任务中要求存储空间大于1G的任务有N2个等等。

针对上述情况，在一个可选的实现方式中，还可以根据需要对待处理任务进行类型区分，具体的，可以将待处理任务区分至少两种任务类型，待处理任务的任务量预测值包括：针对每种类型待处理任务的数量预测值。通过上述方式，可以获得更为精细的任务量预测值，从而可以提高后续计划调整的精确度。而为了获得上述针对每种类型待处理任务的数量预测值，在模型训练阶段，可以对历史任务数据中的任务标记对应的任务类型，使得任务量预测模型能够区分出历史任务数据中不同类型的任务，进而在后续的应用阶段能够输出针对每种类型待处理任务的数量预测值。

作为例子，可以基于待处理任务本身的特点将待处理任务区分类型。例如，在业务售后支持领域，业务类型包括有企业业务和个人业务，企业业务还可能按照贷款额度的高低等进一步细分多种类型，个人类型的业务还可能根据用户所使用的贷款渠道等进一步细分多种类型。在这种场景下，待处理任务的类型可以基于任务的属性信息而确定。在模型训练阶段，通过任务属性信息自动对历史任务数据中的任务标记对应的任务类型，使得任务量预测模型能够区分出历史任务数据中不同类型的任务，进而在后续的应用阶段能够输出针对每种类型待处理任务的数量预测值。

针对处理能力预测模型，可以预先准备用于训练的样本数据，本说明书实施例中选取处理单元的历史处理数据作为样本数据，以使处理能力预测模型能够分析得到历史各个时期处理单元的处理能力。其中，用于训练的历史处理数据需要达到一定的数量以保证训练出的模型的精确度。另一方面，当处理能力预测模型训练好开始应用后，实际产生的处理数据也可以作为样本，从而实现对处理能力预测模型的持续训练及优化。

在准备有上述样本数据后，任务预测模型可以利用样本数据对机器学习模型训练得到。可选的，任务预测模型的数量可以是一个，该任务预测模型用于预测处理单元集合中所有处理单元的整体处理能力；在另一些例子中，由于各个处理单元的配置可能不同而导致各个处理单元的处理能力不尽相同，因此可以是针对每个处理单元配置对应的任务预测模型，每个任务预测模型用于预测对应处理单元的处理能力；在其他例子中，可能某些处理单元的配置较为接近，处理能力也可能较为接近，可以针对这些配置较为接近或相同的处理单元设置任务预测模型，因此任务预测模型可以包括多个，每个任务预测模型用于输出对应配置接近或相同的处理单元的处理能力预测值。

在训练过程中，训练一个准确率较高的合适的模型，需要依赖于特征选择和模型选择。其中，机器学习模型可以包括逻辑回归模型、随机森林模型、贝叶斯方法模型、支持向量机模型或神经网络模型等等，模型的选择影响最终所训练得到的识别模型的精确度，因此，实际应用中可以选择多种模型进行训练，而训练过程较为耗时，需要复杂的迭代计算过程，以选取出合适的模型。

训练过程的另一方面，是选取合适的特征。本实施例中的处理单元特征，可以包括处理单元本身的标识特征，由于不同应用场景下处理单元指代不同的对象，因此可以根据不同应用场景灵活选取处理单元的标识特征。作为例子，假设处理单元是服务器，处理单元的标识特征可以包括服务器的硬件配置特征，例如内存空间大小、硬盘容量或CPU型号等等；假设处理单元代表能处理任务的人员，处理单元标识特征可以包括该人员的身份特征，例如年龄、性别或学历等等。

处理单元特征还可以包括处理单元历史处理任务的相关特征，例如设定时间周期内所分配的任务数量、未完成的任务数量、已完成任务的平均处理时长、每种类型任务的平均处理时长、每种类型任务的完成量或每种类型任务的未完成量等等。

因此，在准备好样本数据，选取好处理单元特征和模型后，即可预先训练出处理能力预测模型，在处理能力预测模型训练完成后，该处理能力预测模型可以上线应用，首先向该模型输入处理单元集合，由该模型输出处理单元集合的处理能力预测值。作为示例，在某些例子中，处理能力预测值可以指示未来一段时间处理单元集合、某个处理单元或某些处理单元所能处理任务的总数量，具体的，输出的处理能力预测值可以是M，即该模型对应的处理单元或处理单元集合能够完成M个任务。

在另一些例子中，考虑到待处理任务可能处理能力还会有某些特殊的需求，而各个处理单元的处理能力不尽相同，因此模型输出的处理能力预测值，还可以是针对各个处理单元的多项处理能力预测值，例如处理时长预测值、对处理完成时刻预测值等等。具体的，作为示例，处理时长预测值可以包括M1、M2或M3等，M1可以表示处理单元的平均处理时长在2天内；M2可以表示该处理单元的平均处理时长在5天以上；M3表示该处理单元能够处理某类难度较高的任务等等。

由前述描述可知，任务量预测模型在模型训练阶段，还可以对历史任务数据中每个任务标记对应的任务类型，该任务量预测模型能够区分出历史任务数据中不同类型的任务，并输出针对每种类型任务的数量预测值。相对应的，本说明书实施例中的处理单元可以具有适配任务类型标签，该标签表示该处理单元适配哪种类型的任务，该标签可以是人工配置，也可以由处理能力预测模型对处理单元进行配置，可选的，可以是处理能力预测模型对处理单元的处理能力进行分析，通过处理单元的各项处理能力，确定该处理单元各项处理能力的预测值，从而确定该处理单元适配哪种类型的任务。作为例子，处理单元所具有的标签，通过所述处理单元对所述一种或多种类型任务的历史处理效率而确定。例如，可以是通过历史任务数据中获取处理单元对每种类型任务的平均处理效率值，根据每种类型任务的平均处理效率确定处理单元在哪种类型任务的处理效率最高，从而确定该类处理效率最高的任务作为适配该处理单元的任务。

在另一些例子中，任务类型标签还可以是由技术人员根据应用场景需要而进行配置，例如，在业务售后支持领域，业务类型包括有企业业务和个人业务，某些售后人员专门负责企业业务，某些售后人员专门负责个人业务，因此可以根据业务类型，为售后人员配置适配任务类型标签。

作为示例，对于配置具有标签的处理单元，可以针对由不同标签处理单元所构成的子集，可以分别获得所述子集的可处理任务量的预测值，所获得的可处理任务量的预测值可以如下表格所示：

处理单元	预测值	标签
			处理单元1	6	B
处理单元2	8	A
			处理单元3	7	A

表1

对于标签为A的处理单元所构成的子集(包括处理单元1)，其预测值为15个；

对于标签为B的处理单元所构成的子集(包括处理单元2和3)，其预测值为6个。

通过上述方式，任务量预测模型可以输出任务量预测值，处理能力预测模型可以输出可处理任务量的预测值，根据所述可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整。作为例子，所述可处理任务量的预测值与任务量预测值的相对关系可以通过比较可处理任务量的预测值与任务量预测值的的大小关系而确定，例如根据所述可处理任务量的预测值与任务量预测值的差值，确定是否对所述数据集中的处理单元数量进行增加处理或减少处理。

对于具有标签的处理单元，可以根据所述子集的可处理任务量的预测值与对应类型待处理任务的数量预测值的相对关系，确定是否针对所述子集的数据进行调整。若可处理任务量的预测值小于任务量预测值，则说明待调度处理单元无法完成待处理任务，需要对数据集中的处理单元进行增加处理；进一步的，还可以根据可处理任务量的预测值与任务量预测值的差值，确定具体需要增加多少处理单元、增加具备哪种处理能力的处理单元或增加具有哪种标签的处理单元等等。若可处理任务量的预测值大于或等于任务量预测值，则说明待调度处理单元能够完成待处理任务，此种情况下，不需要对数据集中的处理单元进行增加处理；进一步的，还可以根据两者差值，确定是否需要减少处理单元，具体的，还可以包括需要减少多少处理单元、减少具备哪种处理能力的处理单元或减少具有哪种标签的处理单元等等。

其中，对于处理单元所适配的标签，实际应用中可以是一个，也可以是多个。若处理单元所适配的标签只有一个，则该处理单元所分配的子集就只有一个；若处理单元所适配的标签具有多个，则可以根据需要灵活配置该处理单元所分配的子集，例如，可以根据所预测任务的类型及数量而确定，假设处理单元1适配A类型和B类型，而预测出的A类型任务较多，则可以先将该处理单元分配给A标签所构成的子集，之后进行数据调整的判断；或者，在进行一次分配后，还可以将该处理单元1分配给B标签所构成的子集，之后进行数据调整的判断；之后，根据两次数据调整的判断，确定将处理单元1分配给哪个子集，例如，实际情况可能出现，将处理单元1分配给A标签所构成的子集后，发现处理单元不够，需要增加处理单元，而将处理单元1分配给B标签所构成的子集后，发现处理单元足够，则可确定将处理单元1分配给B标签所构成的子集。

接下来再通过一实施例对本说明书的数据调整方案进行详细说明。

在信用贷款领域，由于种种主观或客观的原因，可能出现借款方未能及时还款的情况。贷款提供方可以采用自动化或人工的催收方式来提醒借款方及时归还贷款。出于成本和效率的考量，可以是先进入自动化催收阶段，自动催收没有收回贷款后，再进入人工催收阶段。人工催收一般包括人工电话催收，人工线下上门催收等。

人工催收整体的处理流程包括，用于对贷款数据进行管理的系统可以每天进行数据清洗加工，获得需要进入催收阶段的案件。该进入催收阶段的案件即待处理任务。进入人工催收阶段的案件，会分派给催收团队。然后在催收团队内部，将案件分配给催收人员。在这里，会出现的问题是，每天产生的催收案件是波动的，但催收团队中催收人员的排班是提前安排，当案件量比较大的时候，可能会超出所排班的催收人力，催收人员加班加点可能也难以处理完成；而当案件量比较小的时候，排班的催收人员又处于空闲状态，造成了人力的浪费。进一步地，催收人员的个人能力也参差不齐，每天固定人数的排班，能处理的案件量也有可能不一样。

基于此，本说明书实施例提供如下方案，如图2A所示，是本说明书根据一示例性实施例示出的另一种数据调整方法的流程图，包括：

在步骤202中，获取待调度人员数据集，所述人员数据集表征未来预定时间内的待调度人员；

在步骤204中，以历史任务数据的任务特征为输入，利用任务量预测模型获得未来预定时间的待处理任务的任务量预测值；

在步骤206中，以所述人员数据集中的人员特征为输入，利用处理能力预测模型获得所述人员数据集的可处理任务量的预测值；

在步骤208中，根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对待调度人员数据集的数据进行调整。

如图2B所示，是本说明书实施例提供的数据调整方案的应用场景图，图2B中包括用于管理数据的催收系统，以及应用图2A所示方法的数据调整装置，接下来结合图2C所示的另一种数据调整方案进行详细说明。

第1催收系统用于管理贷款数据。

催收人员可以登录催收系统，从催收系统中获取需要催收的案件，催收系统向催收人员返回案件信息，并由催收人员登记处理催收案件的结果等等。

第2，数据同步。

催收系统产生的生产数据可以同步给数据调整装置。可选的，同步数据可以主要包括案件明细，案件类型，处理时刻，处理时长，处理人或处理结果等等。

第2.1，数据加工。

具体包括：训练任务量预测模型，用于输出未来预定时间的待处理任务的任务量预测值。可选的，考虑到贷款业务通常可以包括企业贷款业务和个人贷款业务，本说明书实施例将案件区分为企业类型和个人类型。实际应用中，根据需要，企业类型的业务还可以按照贷款额度的高低等进一步细分多种类型，个人类型的业务还可以根据用户所使用的贷款渠道等进一步细分多种类型。

催收系统同步过来的数据即历史任务数据，作为用于训练的样本数据，可以从样本数据提取任务特征。可选的，可以天为维度，读取每天的催收案件量、案件类型、案件处理完成量、平均案件处理效率，从而确定设定时间周期内的任务产生数量、任务处理完成数量、任务类型、任务积压数量、任务积压类型、任务平均处理时长或任务期限或任务处理能力要求信息等特征。

任务量预测模型根据历史任务数据的任务特征，分析出任务量的变化趋势，从而预测未来一段时间内(比如七天)待处理的任务量，具体的，可以是案件总量，或者可以是区分有类型的案件量：企业类型的案件量以及个人类型的案件量。

第二天实际产生的案件总量和各类型数量，经过数据同步，又能反馈到预测模型，模型对比分析实际产生量，以及前一天的预测量，根据两者间的差值，修正调整模型系数，优化后续预测输出值。

第2.2，数据加工。

具体包括：训练催收人员的处理能力模型，获得催收人员的处理能力预测值。

催收人员能力模型，所需的数据输入主要包括两部分：

催收人员的身份信息，包括年龄，性别，籍贯，学历等。

催收系统每天同步过来的数据，可以按人维度，读取每天处理的催收案件量，处理完成的催收案件量，案件类型，处理时长，按全类型平均处理时长，按子类型平均处理时长等。

接下来，根据上面两部分的人员特征作为处理能力模型的数据输入，根据这些数据，处理能力预测模型可以输出催收人员的处理能力预测值，可选的，本实施例的处理能力预测值可以是案件处理量预测值，进一步的，处理能力预测值还可以细化为每种类型任务的处理量预测值，处理能力预测模型可以根据该催收人员对每种类型任务的平均处理效率，为该催收人员配置适配任务类型标签。

当一个催收人员刚刚使用催收系统，还未沉淀数据时，处理能力模型可以根据人员的身份信息输出初始的处理能力预测值，随着该催收人员使用催收系统的时间越来越久，沉淀的相关数据越来越多，以及随着催收人员的能力和经验不断增加，数据调整装置会不断调整该催收人员对应模型的产生，使得处理能力预测模型的输出越来越准确。

第3，催收排班人员提供计划给数据调整装置。

第3.1，运行任务量预测模型，输出未来一段时间的待处理任务的任务量预测值，具体的，可以包括案件总量和/或各类型案件的数量。

第3.2，运行处理能力预测模型，预测出未来预定时间内的催收人员的可处理任务的预测值，可选的，可以是催收人员的可处理案件总量，或者是各种类型案件的数量。

第3.3，将任务量预测模型输出的案件总量和/或各类型案件的数量，与处理能力预测模型输出的催收人员的可处理案件总量和/或各种类型案件的数量进行比较，获得两者之间的差值。

第3.4，根据差值，确定对计划的调整。比如处理能力过剩，那么就建议适当减少排班人员；如果处理能力短缺，那么就建议适当增加排班人员，进一步是需要增加几个人员、增加处理哪些类型案件的人员等等。

与前述数据调整方法的实施例相对应，本说明书实施例还提供了数据调整装置及其所应用的服务器的实施例。

本说明书实施例数据调整装置的实施例可以应用在计算机设备上，例如服务器或终端设备。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在数据调整的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图3所示，为本说明书实施例数据调整装置所在计算机设备的一种硬件结构图，除了图3所示的处理器310、内存330、网络接口320、以及非易失性存储器340之外，实施例中装置331所在的服务器或电子设备，通常根据该计算机设备的实际功能，还可以包括其他硬件，对此不再赘述。

如图4所示，图4是本说明书实施例根据一示例性实施例示出的一种数据调整装置的框图，所述数据调整装置包括：

数据集获取模块41，用于：获取待调度人员数据集，所述人员数据集表征未来预定时间内的待调度人员；

任务量预测模块42，用于：以历史任务数据的任务特征为输入，利用任务量预测模型获得未来预定时间的待处理任务的任务量预测值；

处理能力预测模块43，用于：以所述人员数据集中的人员特征为输入，利用处理能力预测模型获得所述人员数据集的可处理任务量的预测值；

调整模块44，用于：根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对待调度人员数据集的数据进行调整。

可选的，所述调整模块44，用于：

可选的，所述人员特征包括如下一种或多种：

人员身份特征、设定时间周期内所分配的任务数量、未完成的任务数量、已完成任务的平均处理时长、每种类型任务的平均处理时长、每种类型任务的完成量或每种类型任务的未完成量。

如图5所示，图5是本说明书实施例根据一示例性实施例示出的另一种数据调整装置的框图，所述数据调整装置包括：

数据获取模块51，用于：获取处理单元数据集，所述数据集表征未来预定时间内的待调度处理单元；

任务量预测模块52，用于：以历史任务数据的任务特征为输入，利用任务量预测模型获得未来预定时间的待处理任务的任务量预测值；

处理能力预测模块53，用于：以所述数据集中的处理单元特征为输入，利用处理能力预测模型获得所述数据集的可处理任务量的预测值；

调整模块54，用于：根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整。

可选的，所述调整模块54，用于：

可选的，所述处理特征包括如下一种或多种：

处理单元标识特征、设定时间周期内所分配的任务数量、未完成的任务数量、已完成任务的平均处理时长、每种类型任务的平均处理时长、每种类型任务的完成量或每种类型任务的未完成量。

相应的，本说明书实施例还提供一种服务器，所述服务器包括有处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为：

根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对待调度人员数据集的数据进行调整。

上述数据调整装置中各个模块的功能和作用的实现过程具体详见上述数据调整方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本领域技术人员在考虑说明书及实践这里说明书实施例的发明后，将容易想到本说明书实施例的其它实施方案。本说明书实施例旨在涵盖本说明书实施例的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本说明书实施例的一般性原理并包括本说明书实施例未说明书实施例的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本说明书实施例的真正范围和精神由下面的权利要求指出。

应当理解的是，本说明书实施例并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本说明书实施例的范围仅由所附的权利要求来限制。

以上所述仅为本说明书实施例的较佳实施例而已，并不用以限制本说明书实施例，凡在本说明书实施例的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书实施例保护的范围之内。

Claims

1.一种数据调整方法，所述方法包括：

2.根据权利要求1所述的方法，所述待处理任务包括至少两种任务类型，所述待处理任务的任务量预测值包括：针对每种类型待处理任务的数量预测值；

3.根据权利要求2所述的方法，所述根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对待调度人员数据集的数据进行调整，包括：

4.根据权利要求2所述的方法，所述人员所具有的标签，通过该人员对所述一种或多种类型任务的历史处理效率而确定。

5.根据权利要求1所述的方法，所述根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对待调度人员数据集的数据进行调整，包括：

6.根据权利要求1所述的方法，所述历史任务数据的任务特征包括如下一种或多种：

设定时间周期内的任务产生数量、任务处理完成数量、任务类型、任务积压数量、任务积压类型、平均处理时长、任务期限或任务处理能力要求信息。

7.根据权利要求1所述的方法，所述人员特征包括如下一种或多种：

人员身份信息、设定时间周期内所分配的任务数量、未完成的任务数量、已完成任务的平均处理时长、每种类型任务的平均处理时长、每种类型任务的完成量或每种类型任务的未完成量。

8.一种数据调整方法，所述方法包括：

9.根据权利要求8所述的方法，所述待处理任务包括至少两种任务类型，所述待处理任务的任务量预测值包括：针对每种类型待处理任务的数量预测值；

10.根据权利要求9所述的方法，所述根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整，包括：

11.根据权利要求9所述的方法，所述处理单元所具有的标签，通过该处理单元对所述一种或多种类型任务的历史处理效率而确定。

12.根据权利要求8所述的方法，所述根据可处理任务量的预测值与任务量预测值的相对关系，确定是否对所述数据集的数据进行调整，包括：

13.根据权利要求8所述的方法，所述历史任务数据的任务特征包括如下一种或多种：

14.根据权利要求8所述的方法，所述处理特征包括如下一种或多种：

15.一种数据调整装置，所述装置包括：

16.一种数据调整装置，所述装置包括：

17.一种服务器，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

18.一种服务器，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：