CN113391923A - 系统资源数据分配方法和装置 - Google Patents

系统资源数据分配方法和装置 Download PDF

Info

Publication number
CN113391923A
CN113391923A CN202110677086.1A CN202110677086A CN113391923A CN 113391923 A CN113391923 A CN 113391923A CN 202110677086 A CN202110677086 A CN 202110677086A CN 113391923 A CN113391923 A CN 113391923A
Authority
CN
China
Prior art keywords
feature data
classifier
data
category
trip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110677086.1A
Other languages
English (en)
Other versions
CN113391923B (zh
Inventor
杨磊
盛小双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Junzheng Network Technology Co Ltd
Original Assignee
Shanghai Junzheng Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Junzheng Network Technology Co Ltd filed Critical Shanghai Junzheng Network Technology Co Ltd
Priority to CN202110677086.1A priority Critical patent/CN113391923B/zh
Publication of CN113391923A publication Critical patent/CN113391923A/zh
Application granted granted Critical
Publication of CN113391923B publication Critical patent/CN113391923B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书涉及机器学习技术领域,具体地公开了一种系统资源数据分配方法和装置,其中,该方法包括:接收目标特征数据,其中,目标特征数据用于表征目标用户的出行概率;基于第一分类器和目标特征数据,确定目标用户的第一出行类别,基于第二分类器和目标特征数据,确定目标用户的第二出行类别,其中,第一分类器的精确率大于预设精确率,第二分类器的召回率大于预设召回率;根据第一出行类别和第二出行类别向目标用户分配系统资源数据。基于上述方案对系统资源数据进行分配,可以提高资源利用率,节约资源成本。

Description

系统资源数据分配方法和装置
技术领域
本说明书涉及机器学习技术领域,特别涉及一种系统资源数据分配方法和装置。
背景技术
随着大数据服务平台技术的快速发展,资源数据服务类型以及可选择的服务渠道也越来越多样化、越来越便捷。可以通过对资源数据进行合理分配,来提高资源利用率。
目前,在对系统资源数据进行分配时,一般采用人工方式进行分配,需要依赖工作人员的工作经验,因此,整体分配效率较低。并且,这种资源分配的方式也很难达到最优的分配效果,容易导致系统资源分配不均衡,利用率不高。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书实施例提供了一种系统资源数据分配方法和装置,以提高系统资源数据的利用率,节约资源成本。
本说明书实施例提供了一种系统资源数据分配方法,应用于服务器,包括:接收目标特征数据,其中,目标特征数据用于表征目标用户的出行概率;基于第一分类器和目标特征数据,确定目标用户的第一出行类别,基于第二分类器和目标特征数据,确定目标用户的第二出行类别,其中,第一分类器的精确率大于预设精确率,第二分类器的召回率大于预设召回率;根据第一出行类别和第二出行类别向目标用户分配系统资源数据。
在一个实施例中,在接收目标特征数据之前,还包括:获取具有用于表征用户出行概率的特征数据集和标签集,其中,标签集包括特征数据集中的多个特征数据中的各特征数据对应的出行类别;利用特征数据集和标签集,构建第一分类器,其中,第一分类器的精确率大于预设精确率;利用特征数据集和标签集,构建第二分类器,其中,第二分类器的召回率大于预设召回率。
在一个实施例中,利用特征数据集和标签集,构建第一分类器,包括:将特征数据集划分为第一特征数据训练集和第一特征数据测试集,将标签集划分为第一特征数据训练集对应的第一标签训练集和第一特征数据测试集对应的第一标签测试集,其中,第一标签训练集中的正类别的个数大于负类别的个数;基于第一特征数据训练集、第一特征数据测试集、第一标签训练集和第一标签测试集,构建第一分类器。
在一个实施例中,利用特征数据集和标签集,构建第二分类器,包括:将特征数据集划分为第二特征数据训练集和第二特征数据测试集,将标签集划分为第二特征数据训练集对应的第二标签训练集和第二特征数据测试集对应的第二标签测试集,其中,第二标签训练集中的正类别的个数小于负类别的个数;基于第二特征数据训练集、第二特征数据测试集、第二标签训练集和第二标签测试集,构建第二分类器。
在一个实施例中,根据第一出行类别和第二出行类别向目标用户分配系统资源数据,包括:在第一出行类别为正的情况下,不向目标用户分配系统资源数据;在第二出行类别为负的情况下,按照第一预设方式向目标用户分配系统资源数据。
在一个实施例中,根据第一出行类别和第二出行类别向目标用户分配系统资源数据,包括:在第一出行类别为负且第二出行类别为正的情况下,按照第二预设方式向目标用户分配系统资源数据。
本说明书实施例还提供了一种系统资源数据分配装置,位于服务器中,包括:接收模块,用于接收目标特征数据,其中,目标特征数据用于表征目标用户的出行概率;确定模块,用于基于第一分类器和目标特征数据,确定目标用户的第一出行类别,基于第二分类器和目标特征数据,确定目标用户的第二出行类别,其中,第一分类器的精确率大于预设精确率,第二分类器的召回率大于预设召回率;分配模块,用于根据第一出行类别和第二出行类别向目标用户分配系统资源数据。
在一个实施例中,分配模块具体用于:在第一出行类别为正的情况下,不向目标用户分配系统资源数据;在第二出行类别为负的情况下,按照第一预设方式向目标用户分配系统资源数据。
本说明书实施例还提供一种计算机设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述任意实施例中所述的系统资源数据分配方法的步骤。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述任意实施例中所述的系统资源数据分配方法的步骤。
在本说明书实施例中,提供了一种系统资源数据分配方法,服务器可以接收用于表征目标用户的出行概率的目标特征数据,基于精确率较高的第一分类器和目标特征数据,确定目标用户的第一出行类别,基于召回率较高的第二分类器和目标特征数据,确定目标用户的第二出行类别,之后,可以根据目标用户的第一出行类别和第二出行类别向目标用户分配系统资源数据。上述方案中,基于高精确率分类器和高召回率分类器分别对用户的出行概率进行预测,得到用户的第一出行类别和第二出行类别,并基于用户的第一出行类别和第二出行类别来向用户分配系统资源数据,通过同时考虑精确率和召回率,可以使得系统资源分配更加合理,资源利用率得以提高,可以节约成本。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,并不构成对本说明书的限定。在附图中:
图1示出了本说明书一实施例中系统资源数据分配方法的流程图;
图2示出了本说明书一实施例中的系统资源数据分配方法的示意图;
图3示出了本说明书一实施例中的系统资源数据分配装置的示意图;
图4示出了本说明书一实施例中的计算机设备的示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本说明书的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本说明书,而并非以任何方式限制本说明书的范围。相反,提供这些实施方式是为了使本说明书公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域的技术人员知道,本说明书的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本说明书公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
本说明书实施例提供了一种系统资源数据分配方法。在本说明书实施例的一个场景示例中,服务器可以从数据库获取具有用于表征用户出行概率的特征数据集和标签集。标签集可以包括特征数据集中的多个特征数据中的各特征数据对应的出行类别。之后,服务器可以利用特征数据集和标签集,分别构建第一分类器和第二分类器。第一分类器的精确率大于预设精确率,为高精确率分类器。第二分类器的召回率大于预设召回率,为高召回率分类器。在得到第一分类器和第二分类器之后,服务器可以接收业务人员输入的多个目标用户中各目标用户对应的目标特征数据,得到多个目标特征数据。服务器可以基于第一分类器和多个目标特征数据,确定多个目标用户中各目标用户的第一出行类别。服务器可以基于第二分类器和多个目标特征数据,确定多个目标用户中各目标用户的第二出行类别。之后,服务器可以根据各目标用户的第一出行类别和第二出行类别向各目标用户分配系统资源数据。
图1示出了本说明书一实施例中系统资源数据分配方法的流程图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本说明书实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至分布式处理环境)。
具体地,如图1所示,本说明书一种实施例提供的系统资源数据分配方法可以包括以下步骤:
步骤S101,接收目标特征数据,其中,目标特征数据用于表征目标用户的出行概率。
本说明书实施例中的系统资源数据分配方法可以应用于服务器。服务器可以接收用于表征目标用户出行概率的目标特征数据。在一个实施例中,服务器可以接收终端设备发送的特征数据。目标特征数据如可以为基于金融机构或者其他服务机构的业务系统中存储用户的历史业务数据提取得到的特征数据。可以通过特征工程进行特征提取。特征数据的提取方式及特征类型可以根据实际应用场景设定,这里不做限定。当然,也可以包括服务器从与金融机构或其他服务机构的关联平台中获取的用户信息提取得到的特征数据。例如,对于顺风车业务,用户可以是顺风车司机,目标特征数据可以表征司机出车概率。对于顺风车司机,出车概率可以指顺风车司机第二天或未来预设时间段内接单并完成订单的概率。
步骤S102,基于第一分类器和目标特征数据,确定目标用户的第一出行类别,基于第二分类器和目标特征数据,确定目标用户的第二出行类别,其中,第一分类器的精确率大于预设精确率,第二分类器的召回率大于预设召回率。
服务器可以将多个目标特征数据中各目标特征数据分别输入到第一分类器中,得到多个目标用户中各目标用户的第一出行类别。可以将多个目标特征数据中各目标特征数据分别输入到第二分类器中,得到多个目标用户中各目标用户的第二出行类别。其中,第一分类器的精确率大于预设精确率。第二分类器的召回率大于预设召回率。其中,预设精确率和预设召回率可以根据实际需要进行设定,例如,可以设置为0.7、0.8或0.9等。
精确率是针对预测结果而言的,表示预测为正的样本中有多少是真正的正样本。真正的正样本是指分类器将正类别样本正确地预测为正类别。其中,正类别样本是已知为正类别的样本。本实施例中,真正的正样本可以是指预测出行且实际出行的用户对应的特征数据。预测为正的样本就有两种可能,一种就是把正类预测为正类,即真正(TruePositives,TP),另一种就是把负类预测为正类,即假正(False Positives,FP)。精确率P的计算公式是:P=TP/(TP+FP)。
召回率是针对原来的样本而言的,表示样本中的正例有多少被预测正确。那也有两种可能,一种是把原来的正类预测成正类,即真正(TP);另一种就是把原来的正类预测为负类,即假负(False Negatives,FN)。召回率R的计算公式是:R=TP/(TP+FN)。
步骤S103,根据第一出行类别和第二出行类别向目标用户分配系统资源数据。
在得到目标用户的第一出行类别和第二出行类别之后,可以根据目标用户的第一出行类别和第二出行类别向目标用户分配系统资源数据。其中,系统资源数据可以是资金、优惠券或者计算资源等。在一个实施例中,可以根据目标用户的第一出行类别和第二出行类别确定分配给该用户的系统资源数据的数量。在一个实施例中,可以根据目标用户的第一出行类别和第二出行类别确定分配给该用户的系统资源数据的类型。在一个实施例中,可以根据目标用户的第一出行类别和第二出行类别确定是否向该目标用户分配系统资源数据。
上述实施例中的系统资源数据分配方法,基于高精确率分类器和高召回率分类器分别对用户的出行概率进行预测,得到用户的第一出行类别和第二出行类别,并基于用户的第一出行类别和第二出行类别来向用户分配系统资源数据,通过同时考虑精确率和召回率,可以使得系统资源分配更加合理,资源利用率得以提高,可以节约成本。
在本说明书一些实施例中,在接收目标特征数据之前,还可以包括:获取具有用于表征用户出行概率的特征数据集和标签集,其中,标签集包括特征数据集中的多个特征数据中的各特征数据对应的出行类别;利用特征数据集和标签集,构建第一分类器,其中,第一分类器的精确率大于预设精确率;利用特征数据集和标签集,构建第二分类器,其中,第二分类器的召回率大于预设召回率。
具体地,服务器可以获取具有用于表征用户出行概率的特征数据集和标签集。例如,对于顺风车业务,用户可以是顺风车司机,特征数据集中的特征数据可以表征司机出车概率。标签集中可以包括特征数据集中多个特征数据中各特征数据对应的出行类别。例如,出行类别为正,表明用户(例如,顺风车司机)次日出行概率很高;出行类别为负,表明次日出行概率较低。
特征数据如可以为基于金融机构或者其他服务机构的业务系统中存储用户的历史业务数据提取得到的特征数据。可以通过特征工程进行特征提取。特征数据的提取方式及特征类型可以根据实际应用场景设定,这里不做限定。当然,也可以包括服务器从与金融机构或其他服务机构的关联平台中获取的用户信息提取得到的特征数据。
一些实施例中,可以分别提取已知出行类别的用户的特征数据,构建特征数据集和标签集。服务器可以从数据库或本地内存中获取特征数据集和标签集。可以将预先构建的特征数据集及标签集进行本地存储、或者存储至数据库中。服务器可以在系统资源数据分配或者分类器构建时,提取特征数据集及标签集。若构建的特征数据集是对应指定产品或者指定服务场景所对应的用户的特征数据所组成的特征数据集,则可以为各特征数据集设定数据集标识。相应的,服务器可以根据当前测试场景的需要,获取相应数据集标识所对应的特征数据集及标签集,以用于当前测试场景下的系统资源数据分配。目前业务系统内的业务数据较大部分更新速度较快,相应的,可以间隔一段时间对特征数据集的特征数据以及标签集进行动态更新,以保证特征数据集内的数据的准确性,进而提高预测的准确性。
在得到特征数据集和标签集之后,服务器可以利用特征数据集和标签集分别构建第一分类器和第二分类器。其中,第一分类器的精确率大于预设精确率。第二分类器的召回率大于预设召回率。其中,预设精确率和预设召回率可以根据实际需要进行设定,例如,可以设置为0.7、0.8或0.9等。
上述实施例中,通过利用表征用户出行概率的特征数据集和对应的标签集来训练高精确率分类器和高召回率分类器,以基于高精确率分类器和高召回率分类器分别对多个用户进行预测,可以兼顾精确率和召回率。
在本说明书一些实施例中,利用特征数据集和标签集,构建第一分类器,可以包括:将特征数据集划分为第一特征数据训练集和第一特征数据测试集,将标签集划分为第一特征数据训练集对应的第一标签训练集和第一特征数据测试集对应的第一标签测试集,其中,第一标签训练集中的正类别的个数大于负类别的个数;基于第一特征数据训练集、第一特征数据测试集、第一标签训练集和第一标签测试集,构建第一分类器。
在构建第一分类器时,即构建高精确率分类器模型时,可以将特征数据集划分为训练集和样本集,可以调整训练样本中的正负样本的比例来提高分类器的精确率。精确率是对于预测结果而言的,表示的是预测为正的样本中有多少是真正的正样本。为了提高分类器的精确率,可以将训练样本集中的正样本的数量设置为大于负样本的数量。具体地,可以将特征数据集划分为第一特征数据训练集和第一特征数据测试集,将标签集划分为第一特征数据训练集对应的第一标签训练集和第一特征数据测试集对应的第一标签测试集。第一标签训练集中的正类别的个数大于负类别的个数。之后,可以基于第一特征数据训练集、第一特征数据测试集、第一标签训练集和第一标签测试集,构建第一分类器。在本说明书一些实施例中,第一标签训练集中的正负类别的比例可以为3:1。在本说明书的一些实施例中,第一标签训练集中的正负类别的比例可以为5:2。在本说明书的一些实施例中,第一标签训练集中的正负类别的比例可以为7:2。通过上述方式,可以基于特征数据集和标签集构建高精确率分类器。
在本说明书一些实施例中,利用特征数据集和标签集,构建第二分类器,可以包括:将特征数据集划分为第二特征数据训练集和第二特征数据测试集,将标签集划分为第二特征数据训练集对应的第二标签训练集和第二特征数据测试集对应的第二标签测试集,其中,第二标签训练集中的正类别的个数小于负类别的个数;基于第二特征数据训练集、第二特征数据测试集、第二标签训练集和第二标签测试集,构建第二分类器。
在构建第二分类器时,即构建高召回率分类器模型时,可以将特征数据集划分为训练集和样本集可以调整训练样本中的正负样本的比例来提高分类器的召回率。召回率是针对原来的样本而言的,表示样本中的正例有多少被预测正确。为了提高分类器的召回率,可以将训练样本集中的负样本的数量设置为大于正样本的数量。具体地,可以将特征数据集划分为第二特征数据训练集和第二特征数据测试集,将标签集划分为第二特征数据训练集对应的第二标签训练集和第二特征数据测试集对应的第二标签测试集。第二标签训练集中的正类别的个数小于负类别的个数。之后,可以基于第二特征数据训练集、第二特征数据测试集、第二标签训练集和第二标签测试集,构建第二分类器。在本说明书一些实施例中,第二标签训练集中的正负类别的比例可以为1:20。在本说明书的一些实施例中,第二标签训练集中的正负类别的比例可以为1:15。在本说明书的一些实施例中,第二标签训练集中的正负类别的比例可以为1:30。通过上述方式,可以基于特征数据集和标签集构建高召回率分类器。
在本说明书一些实施例中,根据第一出行类别和第二出行类别向目标用户分配系统资源数据,可以包括:在第一出行类别为正的情况下,不向目标用户分配系统资源数据;在第二出行类别为负的情况下,按照第一预设方式向目标用户分配系统资源数据。
具体地,由于第一分类器为高精确率分类器,因此,利用第一分类器进行分类时,预测为正的样本中是真正的正样本的比例较高。即,若目标用户的第一出行类别为正,则说明该用户次日出行的概率很高,无需分配系统资源数据。由于第二分类器为高召回率分类器,因此,利用第二分类器进行分类时,样本中的正例被预测正确的概率很高。即,若目标用户的第二出行类别为负,则说明该用户次日出行的概率较低,可以按照第一预设方式分配系统资源数据。示例性地,第一预设方式可以通过系统站内推送系统资源数据。例如,在顺风车发券的情况下,对于第二出行类别为负的目标用户,可以直接在站内推送来发放优惠券,不发短信通知。对于第一出行类别为正的目标用户,可以不发放优惠券,节约资源。通过上述方式,对于出行概率很高的用户不分配系统资源数据,可以节约系统资源,对于出行概率很低的用户按照预设方式分配系统资源数据,可以提高目标用户的出行概率。
在本说明书一些实施例中,根据第一出行类别和第二出行类别向目标用户分配系统资源数据,可以包括:在第一出行类别为负且第二出行类别为正的情况下,按照第二预设方式向目标用户分配系统资源数据。
若目标用户的第一出行类别为负而第二出行类别为正,说明该用户的出行概率中等,可以通过分配系统资源数据来提高出行概率。具体地,对于第一出行类别为负且第二出行类别为正的目标用户,可以按照第二预设方式分配系统资源数据。例如,第二预设方式可以是通过短信触达发放优惠券。又例如,第二预设方式可以是发放面额较大的优惠券。通过上述方式,通过分配系统资源数据可以进一步提高目标用户的出行概率,从而可以提高资源利用率。
下面结合一个具体实施例对上述方法进行说明,然而,值得注意的是,该具体实施例仅是为了更好地说明本说明书,并不构成对本说明书的不当限定。
本具体实施例中,以顺风车发放优惠券为例进行说明。在顺风车营销的场景中,精准营销是最好的选择,也是最考验算法能力的业务需求。根据车主历史的浏览记录和完单记录,预测车主明天是否会出行,根据出行概率采取不同的营销发券策略,实现精准的推送和高成交率。顺风车营销场景,需要对车主有更入的用户画像和行为画像,但是往往一个模型不能同时兼顾精确率和召回率,因此本发明提出了一种两个模型融合的算法。为了实现以上目的,本具体实施例中的方法,先对车主根据历史数据进行了静态画像和行为画像。请参考图2,示出了本具体实施例中的系统资源分配方法的流程示意图。如图2所示,具体步骤如下:
步骤1,每天定时计算过去1个月车主的行为画像,比如过去14天选单平均间隔天数,过去31天选单平均间隔天数,过去7天选单平均间隔天数,过去14天有选单行为的天数,过去7天有选单行为的天数等等。
对于顺风车业务,特征数据可以包括以下至少之一:过去31天有取消订单行为的天数;出发时间为当日的订单取消次数;当日订单信息页浏览次数,即当日选单行为次数;过去31天有选单行为的天数;司机年龄;车主认证距今天数;车主最后一次发单距今天数;车主第一次发单距今天数;性别;当日订单列表页浏览次数,即当日找单行为次数;过去31天有找单行为的天数;过去31天有接单行为的天数;出发时间为当日的接单数;选单次数/找单次数的过去三日均值;当日选单次数/找单次数;过去14天选单平均间隔天数;过去31天选单平均间隔天数;过去7天选单平均间隔天数;过去14天有选单行为的天数;过去7天有选单行为的天数;选单次数过去1日均值相对过去3日均值,变大则为1,否则为0;选单次数过去3日均值相对过去7日均值,变大则为1,否则为0;选单次数过去1日均值相对过去3日均值的差值;选单次数过去3日均值相对过去7日均值的差值;过去14天接单量;过去3天接单量;过去30天接单量;过去7天接单量;最后一次选单距今天数;最后一次找单距今天数;最后一次接单距今天数;过去14天找单平均间隔天数;过去31天找单平均间隔天数;过去7天找单平均间隔天数;过去14天有找单行为的天数;过去7天有找单行为的天数;找单次数过去1日均值相对过去3日均值,变大则为1,否则为0;找单次数过去3日均值相对过去7日均值,变大则为1,否则为0;找单次数过去1日均值相对过去3日均值的差值;找单次数过去3日均值相对过去7日均值的差值;过去14天接单的平均间隔天数;过去31天接单的平均间隔天数;过去7天接单的平均间隔天数;过去14天有接单行为的天数;过去7天有接单行为的天数;累计打车次数;过去1个月助力车的骑行频率;过去1个月单车的骑行频率;过去1个月单车的骑行复杂度。
步骤2,调整训练数据比例做一个高召回率模型,概率低(如图2中的B)的人不做短信触达,将短信费用省一部分下来,直接站内推送来发放优惠券。
步骤3,调整训练数据比例做一个高精确率模型,概率高(如图2中的C)的人不发券,将自然转化高的那部分优惠券省下来。
步骤4,对于概率中等的用户通过短信触达来发放优惠券(如图2中的A-C和D-B)。
上述实施例中,通过调整训练数据比例来训练高精确率模型和高召回率模型,并利用这两个模型来预测用户的出行概率,并根据预测结果来确定营销策略,可以实现精准营销,节约成本,提高出行概率,解决了一个模型不能将召回率和精确率同时提升的痛点,通过两个模型配合可以有效解决了这个问题,成本节省20%。
基于同一发明构思,本说明书实施例中还提供了一种系统资源数据分配装置,如下面的实施例所述。由于系统资源数据分配装置解决问题的原理与系统资源数据分配方法相似,因此系统资源数据分配装置的实施可以参见系统资源数据分配方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图3是本说明书实施例的系统资源数据分配装置的一种结构框图,如图3所示,包括:接收模块301、确定模块302和分配模块303,下面对该结构进行说明。
接收模块301用于接收目标特征数据,其中,目标特征数据用于表征目标用户的出行概率。
确定模块302用于基于第一分类器和目标特征数据,确定目标用户的第一出行类别,基于第二分类器和目标特征数据,确定目标用户的第二出行类别,其中,第一分类器的精确率大于预设精确率,第二分类器的召回率大于预设召回率。
分配模块303用于根据第一出行类别和第二出行类别向目标用户分配系统资源数据。
在本说明书一些实施例中,该装置还包括构建模块,所述构建模块可以包括:获取单元,用于在接收目标特征数据之前,获取具有用于表征用户出行概率的特征数据集和标签集,其中,标签集包括特征数据集中的多个特征数据中的各特征数据对应的出行类别;第一构建单元,用于利用特征数据集和标签集,构建第一分类器,其中,第一分类器的精确率大于预设精确率;第二构建单元,用于利用特征数据集和标签集,构建第二分类器,其中,第二分类器的召回率大于预设召回率。
在本说明书一些实施例中,第一构建单元可以用于:将特征数据集划分为第一特征数据训练集和第一特征数据测试集,将标签集划分为第一特征数据训练集对应的第一标签训练集和第一特征数据测试集对应的第一标签测试集,其中,第一标签训练集中的正类别的个数大于负类别的个数;基于第一特征数据训练集、第一特征数据测试集、第一标签训练集和第一标签测试集,构建第一分类器。
在本说明书一些实施例中,第二构建单元可以用于:将特征数据集划分为第二特征数据训练集和第二特征数据测试集,将标签集划分为第二特征数据训练集对应的第二标签训练集和第二特征数据测试集对应的第二标签测试集,其中,第二标签训练集中的正类别的个数小于负类别的个数;基于第二特征数据训练集、第二特征数据测试集、第二标签训练集和第二标签测试集,构建第二分类器。
在本说明书一些实施例中,分配模块可以具体用于:在第一出行类别为正的情况下,不向目标用户分配系统资源数据;在第二出行类别为负的情况下,按照第一预设方式向目标用户分配系统资源数据。
在本说明书一些实施例中,分配模块可以具体用于:在第一出行类别为负且第二出行类别为正的情况下,按照第二预设方式向目标用户分配系统资源数据。
从以上的描述中,可以看出,本说明书实施例实现了如下技术效果:基于高精确率分类器和高召回率分类器分别对用户的出行概率进行预测,得到用户的第一出行类别和第二出行类别,并基于用户的第一出行类别和第二出行类别来向用户分配系统资源数据,通过同时考虑精确率和召回率,可以使得系统资源分配更加合理,资源利用率得以提高,可以节约成本。
本说明书实施方式还提供了一种计算机设备,具体可以参阅图4所示的基于本说明书实施例提供的系统资源数据分配方法的计算机设备组成结构示意图,所述计算机设备具体可以包括输入设备41、处理器42、存储器43。其中,所述存储器43用于存储处理器可执行指令。所述处理器42执行所述指令时实现上述任意实施例中所述的系统资源数据分配方法的步骤。
在本实施方式中,所述输入设备具体可以是用户和计算机系统之间进行信息交换的主要装置之一。所述输入设备可以包括键盘、鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等;输入设备用于把原始数据和处理这些数的程序输入到计算机中。所述输入设备还可以获取接收其他模块、单元、设备传输过来的数据。所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述存储器具体可以是现代信息技术中用于保存信息的记忆设备。所述存储器可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
在本实施方式中,该计算机设备具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
本说明书实施方式中还提供了一种基于系统资源数据分配方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现上述任意实施例中所述系统资源数据分配方法的步骤。
在本实施方式中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
显然,本领域的技术人员应该明白,上述的本说明书实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本说明书实施例不限制于任何特定的硬件和软件结合。
应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施方式和许多应用对本领域技术人员来说都将是显而易见的。因此,本说明书的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。
以上所述仅为本说明书的优选实施例而已,并不用于限制本说明书,对于本领域的技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。

Claims (10)

1.一种系统资源数据分配方法,其特征在于,应用于服务器,包括:
接收目标特征数据,其中,所述目标特征数据用于表征目标用户的出行概率;
基于第一分类器和所述目标特征数据,确定所述目标用户的第一出行类别,基于第二分类器和所述目标特征数据,确定所述目标用户的第二出行类别,其中,所述第一分类器的精确率大于预设精确率,所述第二分类器的召回率大于预设召回率;
根据所述第一出行类别和所述第二出行类别向所述目标用户分配系统资源数据。
2.根据权利要求1所述的方法,其特征在于,在接收目标特征数据之前,还包括:
获取具有用于表征用户出行概率的特征数据集和标签集,其中,所述标签集包括所述特征数据集中的多个特征数据中的各特征数据对应的出行类别;
利用所述特征数据集和所述标签集,构建第一分类器,其中,所述第一分类器的精确率大于预设精确率;
利用所述特征数据集和所述标签集,构建第二分类器,其中,所述第二分类器的召回率大于预设召回率。
3.根据权利要求2所述的方法,其特征在于,利用所述特征数据集和所述标签集,构建第一分类器,包括:
将所述特征数据集划分为第一特征数据训练集和第一特征数据测试集,将所述标签集划分为所述第一特征数据训练集对应的第一标签训练集和所述第一特征数据测试集对应的第一标签测试集,其中,所述第一标签训练集中的正类别的个数大于负类别的个数;
基于所述第一特征数据训练集、所述第一特征数据测试集、所述第一标签训练集和所述第一标签测试集,构建第一分类器。
4.根据权利要求2所述的方法,其特征在于,利用所述特征数据集和所述标签集,构建第二分类器,包括:
将所述特征数据集划分为第二特征数据训练集和第二特征数据测试集,将所述标签集划分为所述第二特征数据训练集对应的第二标签训练集和所述第二特征数据测试集对应的第二标签测试集,其中,所述第二标签训练集中的正类别的个数小于负类别的个数;
基于所述第二特征数据训练集、所述第二特征数据测试集、所述第二标签训练集和所述第二标签测试集,构建第二分类器。
5.根据权利要求1所述的方法,其特征在于,根据所述第一出行类别和所述第二出行类别向所述目标用户分配系统资源数据,包括:
在所述第一出行类别为正的情况下,不向所述目标用户分配系统资源数据;
在所述第二出行类别为负的情况下,按照第一预设方式向所述目标用户分配系统资源数据。
6.根据权利要求1所述的方法,其特征在于,根据所述第一出行类别和所述第二出行类别向所述目标用户分配系统资源数据,包括:
在第一出行类别为负且第二出行类别为正的情况下,按照第二预设方式向所述目标用户分配系统资源数据。
7.一种系统资源数据分配装置,其特征在于,位于服务器中,包括:
接收模块,用于接收目标特征数据,其中,所述目标特征数据用于表征目标用户的出行概率;
确定模块,用于基于第一分类器和所述目标特征数据,确定所述目标用户的第一出行类别,基于第二分类器和所述目标特征数据,确定所述目标用户的第二出行类别,其中,所述第一分类器的精确率大于预设精确率,所述第二分类器的召回率大于预设召回率;
分配模块,用于根据所述第一出行类别和所述第二出行类别向所述目标用户分配系统资源数据。
8.根据权利要求7所述的装置,其特征在于,所述分配模块具体用于:
在所述第一出行类别为正的情况下,不向所述目标用户分配系统资源数据;
在所述第二出行类别为负的情况下,按照第一预设方式向所述目标用户分配系统资源数据。
9.一种计算机设备,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被执行时实现权利要求1至6中任一项所述方法的步骤。
CN202110677086.1A 2021-06-18 2021-06-18 系统资源数据分配方法和装置 Active CN113391923B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110677086.1A CN113391923B (zh) 2021-06-18 2021-06-18 系统资源数据分配方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110677086.1A CN113391923B (zh) 2021-06-18 2021-06-18 系统资源数据分配方法和装置

Publications (2)

Publication Number Publication Date
CN113391923A true CN113391923A (zh) 2021-09-14
CN113391923B CN113391923B (zh) 2022-12-23

Family

ID=77621898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110677086.1A Active CN113391923B (zh) 2021-06-18 2021-06-18 系统资源数据分配方法和装置

Country Status (1)

Country Link
CN (1) CN113391923B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504460A (zh) * 2014-12-09 2015-04-08 北京嘀嘀无限科技发展有限公司 预测叫车平台的用户流失的方法和装置
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及系统
WO2017219548A1 (zh) * 2016-06-20 2017-12-28 乐视控股(北京)有限公司 用户属性预测方法及装置
WO2018072663A1 (zh) * 2016-10-18 2018-04-26 腾讯科技(深圳)有限公司 数据处理方法及装置、分类器训练方法及系统、存储介质
JP2018205860A (ja) * 2017-05-31 2018-12-27 株式会社Screenホールディングス 分類器構築方法、分類器および分類器構築装置
CN109299961A (zh) * 2017-07-24 2019-02-01 北京嘀嘀无限科技发展有限公司 防止用户流失的方法及装置、设备和存储介质
CN109460795A (zh) * 2018-12-17 2019-03-12 北京三快在线科技有限公司 分类器训练方法、装置、电子设备及计算机可读介质
CN109492226A (zh) * 2018-11-10 2019-03-19 上海文军信息技术有限公司 一种提高情感倾向占比低文本预断准确率的方法
CN112052356A (zh) * 2020-08-14 2020-12-08 腾讯科技(深圳)有限公司 多媒体分类方法、装置和计算机可读存储介质
CN112836750A (zh) * 2021-02-03 2021-05-25 中国工商银行股份有限公司 一种系统资源分配方法、装置及设备
CN112884028A (zh) * 2021-02-03 2021-06-01 中国工商银行股份有限公司 一种系统资源调整方法、装置及设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504460A (zh) * 2014-12-09 2015-04-08 北京嘀嘀无限科技发展有限公司 预测叫车平台的用户流失的方法和装置
WO2017219548A1 (zh) * 2016-06-20 2017-12-28 乐视控股(北京)有限公司 用户属性预测方法及装置
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及系统
WO2018072663A1 (zh) * 2016-10-18 2018-04-26 腾讯科技(深圳)有限公司 数据处理方法及装置、分类器训练方法及系统、存储介质
JP2018205860A (ja) * 2017-05-31 2018-12-27 株式会社Screenホールディングス 分類器構築方法、分類器および分類器構築装置
CN109299961A (zh) * 2017-07-24 2019-02-01 北京嘀嘀无限科技发展有限公司 防止用户流失的方法及装置、设备和存储介质
US20200134648A1 (en) * 2017-07-24 2020-04-30 Beijing Didi Infinity Technology And Development Co., Ltd. Methods and systems for preventing user churn
CN109492226A (zh) * 2018-11-10 2019-03-19 上海文军信息技术有限公司 一种提高情感倾向占比低文本预断准确率的方法
CN109460795A (zh) * 2018-12-17 2019-03-12 北京三快在线科技有限公司 分类器训练方法、装置、电子设备及计算机可读介质
CN112052356A (zh) * 2020-08-14 2020-12-08 腾讯科技(深圳)有限公司 多媒体分类方法、装置和计算机可读存储介质
CN112836750A (zh) * 2021-02-03 2021-05-25 中国工商银行股份有限公司 一种系统资源分配方法、装置及设备
CN112884028A (zh) * 2021-02-03 2021-06-01 中国工商银行股份有限公司 一种系统资源调整方法、装置及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
崔洪军等: "基于朴素贝叶斯分类器的乘客出行属性分析", 《科学技术与工程》 *
韩震等: "基于共享单车出行数据的用户行为分析", 《大连海事大学学报》 *

Also Published As

Publication number Publication date
CN113391923B (zh) 2022-12-23

Similar Documents

Publication Publication Date Title
McCormack et al. A simulation model to enable the optimization of ambulance fleet allocation and base station location for increased patient survival
CN109872535B (zh) 一种智慧交通通行预测方法、装置及服务器
CN110163474A (zh) 一种任务分配的方法及设备
CN109753356A (zh) 一种容器资源调度方法、装置及计算机可读存储介质
CN112541745B (zh) 用户行为数据分析方法、装置、电子设备及可读存储介质
CN111127778B (zh) 银行自助终端推荐方法和装置
CN111371767B (zh) 恶意账号识别方法、恶意账号识别装置、介质及电子设备
CN102129737A (zh) 一种排队等待时间的获取方法及系统
Rahaman et al. Wait time prediction for airport taxis using weighted nearest neighbor regression
CN115130711A (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN115829124A (zh) 充电桩选址方法、装置、设备及存储介质
Ma et al. Public transportation big data mining and analysis
CN114626735A (zh) 催收案件分配方法、装置、设备及计算机可读存储介质
CN112579910A (zh) 信息处理方法、信息处理装置、存储介质和电子设备
Haliem et al. AdaPool: An adaptive model-free ride-sharing approach for dispatching using deep reinforcement learning
CN106453557A (zh) 一种IaaS服务中的双时间尺度用户动态竞价和资源管理算法
CN113391923B (zh) 系统资源数据分配方法和装置
CN113032440A (zh) 训练风险模型的数据处理方法和装置
CN112651782A (zh) 基于缩放点积注意力的行为预测方法、装置、设备及介质
CN115375453A (zh) 系统资源分配方法及装置
CN109697224B (zh) 一种账单消息处理方法、装置和存储介质
CN115081983A (zh) 派单方法、装置、设备及存储介质
CN108259588A (zh) 一种基于大数据的文化云平台的推送方法及装置
CN112637793B (zh) 一种基于5g的场景化计费方法、系统、电子设备和存储介质
CN113886086A (zh) 云平台计算资源分配方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant