CN113657948B - 一种对学生进行分配的方法、装置、电子设备及存储介质 - Google Patents

一种对学生进行分配的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113657948B
CN113657948B CN202111218392.5A CN202111218392A CN113657948B CN 113657948 B CN113657948 B CN 113657948B CN 202111218392 A CN202111218392 A CN 202111218392A CN 113657948 B CN113657948 B CN 113657948B
Authority
CN
China
Prior art keywords
characteristic information
purchasing
students
student
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111218392.5A
Other languages
English (en)
Other versions
CN113657948A (zh
Inventor
张悦
贾延夺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yizhen Xuesi Education Technology Co Ltd
Original Assignee
Beijing Yizhen Xuesi Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yizhen Xuesi Education Technology Co Ltd filed Critical Beijing Yizhen Xuesi Education Technology Co Ltd
Priority to CN202111218392.5A priority Critical patent/CN113657948B/zh
Publication of CN113657948A publication Critical patent/CN113657948A/zh
Application granted granted Critical
Publication of CN113657948B publication Critical patent/CN113657948B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Technology (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供一种对学生进行分配的方法、装置、电子设备及存储介质,涉及数据处理技术领域,方法包括:获取待分配学生的特征信息以及学习规划师的特征信息;对所述待分配学生的特征信息以及所述学习规划师的特征信息分别进行组合,得到多个组合特征信息;对所述多个组合特征信息分别进行one‑hot编码,得到多个编码后的组合特征信息;基于所述多个编码后的组合特征信息以及预先训练的学生分配模型,确定所述待分配学生对应的学习规划师。采用本公开,可以充分利用已有信息对学生进行分配、提高了为学生分配学习规划师的准确率、提高了购课效果。

Description

一种对学生进行分配的方法、装置、电子设备及存储介质
技术领域
本公开涉及数据处理技术领域,尤其涉及一种对学生进行分配的方法、装置、电子设备及存储介质。
背景技术
在学生进行网上购课时,一般是将其分配给学习规划人员进行引导购课,然而不同的分配方式产生的购课结果是不同的,如何对学生进行合理有效的分配是一个亟待解决的问题。目前主流的分配方式是随机分配,将学生随机的分配给学习规划人员进行引导,但是随机分配并未考虑学生的购课意愿,对学习规划人员的引导能力也缺少一定的学习,无法得到较好的购课结果。
发明内容
为了解决现有技术的问题,本公开实施例提供了一种对学生进行分配的方法、装置、电子设备及存储介质。技术方案如下:
根据本公开的一方面,提供了一种对学生进行分配的方法,该方法包括:
获取待分配学生的特征信息以及学习规划师的特征信息;
对所述待分配学生的特征信息以及所述学习规划师的特征信息分别进行组合,得到多个组合特征信息;
对所述多个组合特征信息分别进行one-hot编码,得到多个编码后的组合特征信息;
基于所述多个编码后的组合特征信息以及预先训练的学生分配模型,确定所述待分配学生对应的学习规划师。
根据本公开的另一方面,提供了一种对学生进行分配的装置,所述对学生进行分配的装置用于执行上述对学生进行分配的方法,所述装置包括:
获取模块,用于获取待分配学生的特征信息以及学习规划师的特征信息;
组合模块,用于对所述待分配学生的特征信息以及所述学习规划师的特征信息分别进行组合,得到多个组合特征信息;
编码模块,用于对所述多个组合特征信息分别进行one-hot编码,得到多个编码后的组合特征信息;
分配模块,用于基于所述多个编码后的组合特征信息以及预先训练的学生分配模型,确定所述待分配学生对应的学习规划师。
根据本公开的另一方面,提供了一种电子设备,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述一种对学生进行分配的方法中任一项所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述一种对学生进行分配的方法中任一项所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现上述一种对学生进行分配的方法中任一项所述的方法。
本申请实施例中提供的一个或多个技术方案,可以实现充分利用已有信息对学生进行分配、提高了为学生分配学习规划师的准确率、提高了购课效果技术效果。
附图说明
在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
图1示出了根据本公开示例性实施例的一种对学生进行分配方法的流程图;
图2示出了根据本公开示例性实施例的一种对学生进行分配方法的流程图;
图3示出了根据本公开示例性实施例的一种对学生进行分配的装置示意性框图;
图4示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
以下参照附图1描述本公开的一种对学生进行分配的方法,该方法可以由电子设备实现,电子设备可以包括终端或者服务器,该方法包括以下步骤:
步骤101、获取待分配学生的特征信息以及学习规划师的特征信息。
步骤102、对待分配学生的特征信息以及学习规划师的特征信息分别进行组合,得到多个组合特征信息。
步骤103、对多个组合特征信息分别进行one-hot编码,得到多个编码后的组合特征信息。
步骤104、基于多个编码后的组合特征信息以及预先训练的学生分配模型,确定待分配学生对应的学习规划师。
可选地,对初始学生分配模型进行训练的过程包括:
获取数据集,其中,数据集包括购课学生的特征向量以及对应的购课结果;
在数据集中,选择第一数量的数据构建训练数据集,选择第二数量的数据构建测试数据集;其中,训练数据集包括训练输入以及训练真值,训练输入为购课学生的特征向量,训练真值为购课学生对应的购课结果;测试数据集包括测试输入以及测试真值,测试输入为购课学生的特征向量,测试真值为购课学生对应的购课结果;
基于训练输入以及训练真值,对初始学生分配模型进行训练;
基于测试输入以及测试真值,对训练后的学生分配模型进行测试;
当测试到训练后的学生分配模型的准确率达到阈值时,将当前测试的学生分配模型确定为训练好的学生分配模型。
可选地,获取数据集,包括:
获取购课学生的特征信息、对应的学习规划师的特征信息以及购课结果;
分别对购课学生的特征信息以及对应的学习规划师的特征信息进行one-hot编码;
将经过编码的学习规划师的特征信息拼接到经过编码的购课学生的特征信息之后,生成特征向量。
可选地,学生分配模型为Xgboost算法模型;
基于训练输入以及训练真值,对初始学生分配模型进行训练,包括:
基于训练输入、训练真值以及下述目标函数,对初始学生分配模型进行训练;
Figure 108270DEST_PATH_IMAGE001
其中,
Figure 588930DEST_PATH_IMAGE002
为目标函数;
Figure DEST_PATH_IMAGE003
为损失函数,损失函数采用MSE均方差形式;
Figure 615791DEST_PATH_IMAGE004
为训练输入i对应的预测值;
Figure DEST_PATH_IMAGE005
为训练输入i对应的训练真值;
Figure 269627DEST_PATH_IMAGE006
为正则化项;k表示初始学生分配模型中第k棵回归树;
Figure DEST_PATH_IMAGE007
为叶子树惩罚正则项;T为树叶子节点数;
Figure 698334DEST_PATH_IMAGE008
为叶子权重惩罚正则项;
Figure DEST_PATH_IMAGE009
为叶子节点权重的
Figure 146633DEST_PATH_IMAGE010
范数;
Figure DEST_PATH_IMAGE011
为叶子权重值。
可选地,基于多个编码后的组合特征信息以及预先训练的学生分配模型,确定待分配学生对应的学习规划师,包括:
将多个编码后的组合特征信息输入预先训练的学生分配模型中,得到每个组合特征信息对应的购课率;
在得到的多个购课率中选取最优购课率;
基于最优购课率,确定待分配学生对应的学习规划师。
可选地,在得到的多个购课率中选取最优购课率,包括:
将多个购课率按照从大到小的顺序进行排列,确定每个购课率对应的等级数值;
确定每个购课率对应的学习规划师的已分配学生数量;
对于每个购课率,确定对应的等级数值与对应的学习规划师的已分配学生数量的和值;
确定得到的多个和值中的最小值,将最小值对应的购课率确定为最优购课率。
本公开实施例中,通过one-hot编码将学生和学习规划师的特征信息转化成特征向量,利用Xgboost算法模型学习了各种学生和学习规划师组合的特征信息与购课结果的关系,然后,通过待分配学生的特征信息、学习规划师的特征信息以及Xgboost算法模型,为待分配学生分配更合适的学习规划师,基于此,本公开可以充分利用已有信息对学生进行分配,提高了为学生分配学习规划师的准确率,提高了购课效果。
以下参照附图2描述本公开的一种对学生进行分配的方法,该方法可以由电子设备实现,电子设备可以包括终端或者服务器,在本实施例中,学生分配模型可以为Xgboost(eXtreme Gradient Boosting,极端梯度提升)算法模型,并按照先训练模型、再使用模型的顺序进行描述,该方法包括以下步骤:
步骤201、获取数据集,在数据集中,选择第一数量的数据构建训练数据集,选择第二数量的数据构建测试数据集。
其中,数据集可以包括购课学生的特征向量以及对应的购课结果,而且,数据集中购课学生的特征向量以及对应的购课结果是相互对应的,也可以说,数据集中的每个数据包括一个购课学生的特征向量以及对应的购课结果。
在数据集中,训练数据集包括训练输入以及训练真值,训练输入为购课学生的特征向量,训练真值为购课学生对应的购课结果;测试数据集包括测试输入以及测试真值,测试输入为购课学生的特征向量,测试真值为购课学生对应的购课结果。
一种可行的实施方式中,由于学生购课的历史数据中会包含学生的特征信息、学生对应的学习规划是的特征信息以及学生的购课结果,因此,用户可以通过学生购课的历史数据构建数据集,在数据集中选择第一数量的数据构建训练数据集,用于对Xgboost算法模型进行训练,构建的训练数据集包括训练输入以及训练真值,训练输入为购课学生的特征向量,训练真值为所述购课学生对应的购课结果;在数据集中选择第二数量的数据构建测试数据集,用于对训练好的Xgboost算法模型进行测试,构建的测试数据集包括测试输入以及测试真值,测试输入为购课学生的特征向量,测试真值为购课学生对应的购课结果。其中,第一数量与第二数量可以根据用户需求设定,可选的一种设定方式为,确定数据集中数据的总数量,将总数量与80%的乘积作为第一数量,将总数量与20%的乘积作为第二数量,也即,按照训练数据80%、测试数据20%的比例,将数据集分为训练数据集和测试数据集。
可选地,获取数据集的过程可以包括以下步骤2011-2013:
步骤2011、获取购课学生的特征信息、对应的学习规划师的特征信息以及购课结果。
其中,购课学生的特征信息可以包括但不限于:手机型号、app版本、当前年级、省份、城市、是否游客、是否新用户、注册日期、注册来源、各个学科点击次数、各个年级访问次数、各个课程访问次数、约课次数、是否完成、互动次数、答疑次数等特征。
学习规划师的特征信息可以包括但不限于:省份、城市级别、年级、注册时间、服务状态、最新订单时间、订单数、体验课约课数、爆品课约课数、精品课约课数、约课记录、长期班订单数、用户意向度、首次分配时间、最新沟通时间、最新接通时间、最近分配时间等特征。
步骤2012、分别对购课学生的特征信息以及对应的学习规划师的特征信息进行one-hot编码。
其中,one-hot 编码可称为独热编码,又称一位有效编码,其方法是使用 N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。上述步骤2012中,对购课学生的特征信息以及对应的学习规划师的特征信息进行one-hot编码的方式可以采用现有技术对特征信息进行编码的方式,此处不做赘述。
步骤2013、将经过编码的学习规划师的特征信息拼接到经过编码的购课学生的特征信息之后,生成特征向量。
一种可行的实施方式中,可以采用下述表达式表示生成的数据集:
Figure 926370DEST_PATH_IMAGE012
其中,数据集合G中有n个样本数据,
Figure 118317DEST_PATH_IMAGE013
为第i个购课学生对应的m维特征向量,
Figure 667110DEST_PATH_IMAGE014
为购课结果,
Figure 755152DEST_PATH_IMAGE015
为实数集。
步骤202、基于训练输入以及训练真值,对初始Xgboost算法模型进行训练。
一种可行的实施方式中,确定训练数据集后,构建初始Xgboost算法模型,将模型中的参数设定为初始参数,将购课学生的特征向量作为训练输入,输入到初始Xgboost算法模型中,得到初始Xgboost算法模型输出的预测值,通过下属表达式进行说明,一个购课学生和对应的学习规划师组合的购课结果由K棵回归树的计算结果的相加确定:
Figure 756606DEST_PATH_IMAGE016
其中,
Figure 955506DEST_PATH_IMAGE004
为购课学生和对应的学习规划师组合i的预测值,
Figure 155543DEST_PATH_IMAGE017
为第k棵回归树的预测值,F为回归树的集合。
其中,Xgboost算法生成回归树的集合F为:
Figure 414486DEST_PATH_IMAGE018
其中,
Figure 903236DEST_PATH_IMAGE019
为叶子节点q的分数,
Figure 640248DEST_PATH_IMAGE020
m维的特征向量
Figure 960371DEST_PATH_IMAGE013
映射到T个叶子节点,T个叶子节点数值的权重由T维向量
Figure 390215DEST_PATH_IMAGE021
确定,
Figure 100682DEST_PATH_IMAGE022
为其中一棵回归树的映射关系;对于任意一个样本x,最后会落在树的某个叶子节点上,其值为
Figure 641385DEST_PATH_IMAGE023
基于目标函数对训练输入对应的训练真值与预测值进行比较,调节初始Xgboost算法模型中的参数,以此方式对Xgboost算法模型进行训练。其中,Xgboost算法模型的参数可以包括:子树的最大深度、最小叶子节点样本的权重和、学习率、迭代次数、特征采样比例、划分树的叶节点值、随机种子。
其中,目标函数如下述表达式:
Figure 81594DEST_PATH_IMAGE001
其中,
Figure 416760DEST_PATH_IMAGE002
为目标函数;
Figure 145682DEST_PATH_IMAGE003
为损失函数,损失函数采用MSE均方差形式;
Figure 958917DEST_PATH_IMAGE004
为训练输入i对应的预测值;
Figure 456894DEST_PATH_IMAGE005
为训练输入i对应的训练真值;
Figure 759700DEST_PATH_IMAGE006
为正则化项;k表示初始学生分配模型中第k棵回归树;
Figure 975917DEST_PATH_IMAGE007
为叶子树惩罚正则项;T为树叶子节点数;
Figure 592844DEST_PATH_IMAGE008
为叶子权重惩罚正则项;
Figure 945327DEST_PATH_IMAGE009
为叶子节点权重的
Figure 684613DEST_PATH_IMAGE010
范数;
Figure 122548DEST_PATH_IMAGE011
为叶子权重值。
步骤203、基于测试输入以及测试真值,对训练后的Xgboost算法模型进行测试。
一种可行的实施方式中,完成对Xgboost算法模型的训练后,向训练好的模型中输入测试数据集中的测试输入,得到Xgboost算法模型输出的测试值。
步骤204、当测试到训练后的Xgboost算法模型的准确率达到阈值时,将当前测试的Xgboost算法模型确定为训练好的Xgboost算法模型。
一种可行的实施方式中,将测试值与测试输入对应的测试真值进行比较,计算Xgboost算法模型的输出准确率,如果准确率达到阈值,说明当前的Xgboost算法模型的准确率已基本符合需求,无需继续训练,可以进行使用,因此,将当前测试的Xgboost算法模型确定为训练好的Xgboost算法模型。通过对模型的测试,可以保证模型输出的准确率。
步骤205、获取待分配学生的特征信息以及学习规划师的特征信息。
一种可行的实施方式中,待分配学生的特征信息的类型与上述步骤2011中的购课学生的特征信息的类型基本一致,学习规划师的特征信息的类型上述步骤2011中的学习规划师的特征信息的类型基本一致,与此处不做赘述。
步骤206、对待分配学生的特征信息以及学习规划师的特征信息分别进行组合,得到多个组合特征信息。
步骤207、对多个组合特征信息分别进行one-hot编码,得到多个编码后的组合特征信息。
步骤208、将多个编码后的组合特征信息输入预先训练的Xgboost算法模型中,得到每个组合特征信息对应的购课率。
步骤209、在得到的多个购课率中选取最优购课率。
一种可行的实施方式中,每个购课率表示将待分配学生分配给对应的学习规划师后、可能达到的购课率,购课率越高,越符合用户的需求。
可选地,在得到的多个购课率中选取最优购课率的步骤可以包括下述步骤2091-2094:
步骤2091、将多个购课率按照从大到小的顺序进行排列,确定每个购课率对应的等级数值。
确定每个购课率对应的等级数值的方法有多种,可选的一种为:先确定等级数值包括1到10,将排序后排名位于前10%的购课率等级确定为1,将排名位于前10%-20%的购课率等级确定为2,将排名位于前20%-30%的购课率等级确定为3,以此类推,确定出所有购课率的等级。
步骤2092、确定每个购课率对应的学习规划师的已分配学生数量。
步骤2093、对于每个购课率,确定对应的等级数值与对应的学习规划师的已分配学生数量的和值。
步骤2094、确定得到的多个和值中的最小值,将最小值对应的购课率确定为最优购课率。
一种可行的实施方式中,可以通过下述表达式表示确定最优购课率的过程:
Figure 277586DEST_PATH_IMAGE024
其中,L表示最优购课率,
Figure 750155DEST_PATH_IMAGE025
为组合l的等级;
Figure 598026DEST_PATH_IMAGE026
为组合l中学习规划师的已分配人数;min表示取最小值。这样,可以在保证购课率较高的同时、为学生分配一个已分配学生数量较少的学习规划师,减少一个学习规划师同时分配太多学生、导致无法顾及每个学生的情况。
步骤210、基于最优购课率,确定待分配学生对应的学习规划师。
本公开实施例中,通过one-hot编码将学生和学习规划师的特征信息转化成特征向量,利用Xgboost算法模型学习了各种学生和学习规划师组合的特征信息与购课结果的关系,然后,通过待分配学生的特征信息、学习规划师的特征信息以及Xgboost算法模型,为待分配学生分配更合适的学习规划师,基于此,本公开可以充分利用已有信息对学生进行分配,提高了为学生分配学习规划师的准确率,提高了购课效果。
本公开实施例提供了一种对学生进行分配的装置,该装置用于实现上述对学生进行分配的方法。如图3所示的对学生进行分配的装置的示意性框图,对学生进行分配的装置300包括:获取模块301、组合模块302、编码模块303以及分配模块304。
获取模块301,用于获取待分配学生的特征信息以及学习规划师的特征信息;
组合模块302,用于对所述待分配学生的特征信息以及所述学习规划师的特征信息分别进行组合,得到多个组合特征信息;
编码模块303,用于对所述多个组合特征信息分别进行one-hot编码,得到多个编码后的组合特征信息;
分配模块304,用于基于所述多个编码后的组合特征信息以及预先训练的学生分配模型,确定所述待分配学生对应的学习规划师。
可选地,所述装置还包括训练模块;
所述训练模块,用于:
获取数据集,其中,所述数据集包括购课学生的特征向量以及对应的购课结果;
在所述数据集中,选择第一数量的数据构建训练数据集,选择第二数量的数据构建测试数据集;其中,所述训练数据集包括训练输入以及训练真值,所述训练输入为购课学生的特征向量,所述训练真值为所述购课学生对应的购课结果;所述测试数据集包括测试输入以及测试真值,所述测试输入为购课学生的特征向量,所述测试真值为所述购课学生对应的购课结果;
基于所述训练输入以及训练真值,对初始学生分配模型进行训练;
基于所述测试输入以及测试真值,对训练后的学生分配模型进行测试;
当测试到所述训练后的学生分配模型的准确率达到阈值时,将当前测试的学生分配模型确定为训练好的学生分配模型。
可选地,所述训练模块,用于:
获取购课学生的特征信息、对应的学习规划师的特征信息以及购课结果;
分别对所述购课学生的特征信息以及对应的学习规划师的特征信息进行one-hot编码;
将经过编码的学习规划师的特征信息拼接到经过编码的购课学生的特征信息之后,生成特征向量。
可选地,所述学生分配模型为Xgboost算法模型;
所述训练模块,用于:
基于所述训练输入、训练真值以及下述目标函数,对初始学生分配模型进行训练;
Figure 319994DEST_PATH_IMAGE001
其中,
Figure 544302DEST_PATH_IMAGE002
为目标函数;
Figure 605799DEST_PATH_IMAGE003
为损失函数,损失函数采用MSE均方差形式;
Figure 890150DEST_PATH_IMAGE004
为训练输入i对应的预测值;
Figure 99414DEST_PATH_IMAGE005
为训练输入i对应的训练真值,k表示初始学生分配模型中第k棵回归树;
Figure 861834DEST_PATH_IMAGE006
为正则化项;
Figure 777837DEST_PATH_IMAGE007
为叶子树惩罚正则项;T为树叶子节点数;
Figure 233089DEST_PATH_IMAGE008
为叶子权重惩罚正则项;
Figure 929650DEST_PATH_IMAGE009
为叶子节点权重的
Figure 495760DEST_PATH_IMAGE010
范数;
Figure 531850DEST_PATH_IMAGE011
为叶子权重值。
可选地,所述分配模块,用于:
将所述多个编码后的组合特征信息输入预先训练的学生分配模型中,得到所述每个组合特征信息对应的购课率;
在得到的多个购课率中选取最优购课率;
基于所述最优购课率,确定所述待分配学生对应的学习规划师。
可选地,所述分配模块,用于:
将所述多个购课率按照从大到小的顺序进行排列,确定每个购课率对应的等级数值;
确定每个购课率对应的学习规划师的已分配学生数量;
对于每个购课率,确定对应的等级数值与对应的学习规划师的已分配学生数量的和值;
确定得到的多个和值中的最小值,将所述最小值对应的购课率确定为最优购课率。
本公开实施例中,通过one-hot编码将学生和学习规划师的特征信息转化成特征向量,利用Xgboost算法模型学习了各种学生和学习规划师组合的特征信息与购课结果的关系,然后,通过待分配学生的特征信息、学习规划师的特征信息以及Xgboost算法模型,为待分配学生分配更合适的学习规划师,基于此,本公开可以充分利用已有信息对学生进行分配,提高了为学生分配学习规划师的准确率,提高了购课效果。
参考图4,现将描述可以作为本公开的服务器或客户端的电子设备400的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图4所示,电子设备400包括计算单元401,其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序,来执行各种适当的动作和处理。在RAM 403中,还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
电子设备400中的多个部件连接至I/O接口405,包括:输入单元406、输出单元407、存储单元408以及通信单元409。输入单元406可以是能向电子设备400输入信息的任何类型的设备,输入单元406可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元407可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元408可以包括但不限于磁盘、光盘。通信单元409允许电子设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理。例如,在一些实施例中,上述一种对学生进行分配的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到电子设备400上。在一些实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述一种对学生进行分配的方法。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本公开使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

Claims (7)

1.一种对学生进行分配的方法,其特征在于,包括:
获取待分配学生的特征信息以及学习规划师的特征信息;
对所述待分配学生的特征信息以及所述学习规划师的特征信息分别进行组合,得到多个组合特征信息;
对所述多个组合特征信息分别进行one-hot编码,得到多个编码后的组合特征信息;
基于所述多个编码后的组合特征信息以及预先训练的学生分配模型,确定所述待分配学生对应的学习规划师;
所述基于所述多个编码后的组合特征信息以及预先训练的学生分配模型,确定所述待分配学生对应的学习规划师,包括:
将所述多个编码后的组合特征信息输入预先训练的学生分配模型中,得到每个组合特征信息对应的购课率;
在得到的多个购课率中选取最优购课率;
基于所述最优购课率,确定所述待分配学生对应的学习规划师;
所述在得到的多个购课率中选取最优购课率,包括:
将所述多个购课率按照从大到小的顺序进行排列,确定每个购课率对应的等级数值;
确定每个购课率对应的学习规划师的已分配学生数量;
对于每个购课率,确定对应的等级数值与对应的学习规划师的已分配学生数量的和值;
确定得到的多个和值中的最小值,将所述最小值对应的购课率确定为最优购课率。
2.根据权利要求1所述的对学生进行分配的方法,其特征在于,对初始学生分配模型进行训练的过程包括:
获取数据集,其中,所述数据集包括购课学生的特征向量以及对应的购课结果;
在所述数据集中,选择第一数量的数据构建训练数据集,选择第二数量的数据构建测试数据集;其中,所述训练数据集包括训练输入以及训练真值,所述训练输入为购课学生的特征向量,所述训练真值为所述购课学生对应的购课结果;所述测试数据集包括测试输入以及测试真值,所述测试输入为购课学生的特征向量,所述测试真值为所述购课学生对应的购课结果;
基于所述训练输入以及训练真值,对初始学生分配模型进行训练;
基于所述测试输入以及测试真值,对训练后的学生分配模型进行测试;
当测试到所述训练后的学生分配模型的准确率达到阈值时,将当前测试的学生分配模型确定为训练好的学生分配模型。
3.根据权利要求2所述的对学生进行分配的方法,其特征在于,所述获取数据集,包括:
获取购课学生的特征信息、对应的学习规划师的特征信息以及购课结果;
分别对所述购课学生的特征信息以及对应的学习规划师的特征信息进行one-hot编码;
将经过编码的学习规划师的特征信息拼接到经过编码的购课学生的特征信息之后,生成特征向量。
4.根据权利要求2所述的对学生进行分配的方法,其特征在于,所述学生分配模型为Xgboost算法模型;
所述基于所述训练输入以及训练真值,对初始学生分配模型进行训练,包括:
基于所述训练输入、训练真值以及下述目标函数,对初始学生分配模型进行训练;
Figure 913717DEST_PATH_IMAGE001
其中,
Figure 915171DEST_PATH_IMAGE002
为目标函数;
Figure 848492DEST_PATH_IMAGE003
为损失函数,损失函数采用MSE均方差形式;
Figure 251792DEST_PATH_IMAGE004
为训练输入i对应的预测值;
Figure 979576DEST_PATH_IMAGE005
为训练输入i对应的训练真值;
Figure 468326DEST_PATH_IMAGE006
为正则化项;k表示初始学生分配模型中第k棵回归树;
Figure 939759DEST_PATH_IMAGE007
为叶子树惩罚正则项;T为树叶子节点数;
Figure 197565DEST_PATH_IMAGE008
为叶子权重惩罚正则项;
Figure 361830DEST_PATH_IMAGE009
为叶子节点权重的
Figure 603456DEST_PATH_IMAGE010
范数;
Figure 613000DEST_PATH_IMAGE011
为叶子权重值。
5.一种对学生进行分配的装置,其特征在于,所述对学生进行分配的装置用于执行所述权利要求1-4中任一项所述的方法,所述装置包括:
获取模块,用于获取待分配学生的特征信息以及学习规划师的特征信息;
组合模块,用于对所述待分配学生的特征信息以及所述学习规划师的特征信息分别进行组合,得到多个组合特征信息;
编码模块,用于对所述多个组合特征信息分别进行one-hot编码,得到多个编码后的组合特征信息;
分配模块,用于:
基于所述多个编码后的组合特征信息以及预先训练的学生分配模型,确定所述待分配学生对应的学习规划师;
将所述多个编码后的组合特征信息输入预先训练的学生分配模型中,得到每个组合特征信息对应的购课率;
在得到的多个购课率中选取最优购课率;
基于所述最优购课率,确定所述待分配学生对应的学习规划师;
将所述多个购课率按照从大到小的顺序进行排列,确定每个购课率对应的等级数值;
确定每个购课率对应的学习规划师的已分配学生数量;
对于每个购课率,确定对应的等级数值与对应的学习规划师的已分配学生数量的和值;
确定得到的多个和值中的最小值,将所述最小值对应的购课率确定为最优购课率。
6.一种电子设备,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-4中任一项所述的方法。
7.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-4中任一项所述的方法。
CN202111218392.5A 2021-10-20 2021-10-20 一种对学生进行分配的方法、装置、电子设备及存储介质 Active CN113657948B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111218392.5A CN113657948B (zh) 2021-10-20 2021-10-20 一种对学生进行分配的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111218392.5A CN113657948B (zh) 2021-10-20 2021-10-20 一种对学生进行分配的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113657948A CN113657948A (zh) 2021-11-16
CN113657948B true CN113657948B (zh) 2022-03-04

Family

ID=78484254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111218392.5A Active CN113657948B (zh) 2021-10-20 2021-10-20 一种对学生进行分配的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113657948B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114140033B (zh) * 2022-01-29 2022-04-12 北京新唐思创教育科技有限公司 一种服务人员的分配方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11836447B2 (en) * 2019-04-25 2023-12-05 Koninklijke Philips N.V. Word embedding for non-mutually exclusive categorical data
CN112765451A (zh) * 2020-12-30 2021-05-07 中国人寿保险股份有限公司上海数据中心 一种基于集成学习算法的客户智能筛选方法和系统
CN112989188B (zh) * 2021-03-08 2023-05-26 上海钧正网络科技有限公司 推荐订单的确定方法、装置和服务器
CN113254775A (zh) * 2021-06-04 2021-08-13 上海浦东发展银行股份有限公司 一种基于客户浏览行为序列的信用卡产品推荐方法
CN113469653A (zh) * 2021-07-05 2021-10-01 上海松鼠课堂人工智能科技有限公司 匹配智适应学习系统的课程分配系统及方法

Also Published As

Publication number Publication date
CN113657948A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
US10713574B2 (en) Cognitive distributed network
CN109657793B (zh) 模型训练方法及装置、存储介质及电子设备
US11151324B2 (en) Generating completed responses via primal networks trained with dual networks
CN110520871A (zh) 训练机器学习模型
CN104516897B (zh) 一种针对应用对象进行排序的方法和装置
CN107911491A (zh) 信息推荐方法、装置及存储介质、服务器和移动终端
CN109165081B (zh) 基于机器学习的Web应用自适应资源配置方法
CN114519143A (zh) 课程推荐模型的训练方法、课程推荐方法及装置
EP3852014A1 (en) Method and apparatus for training learning model, and computing device
US11221940B2 (en) Performance engineering
CN113657948B (zh) 一种对学生进行分配的方法、装置、电子设备及存储介质
US20210110248A1 (en) Identifying and optimizing skill scarcity machine learning algorithms
CN109815406A (zh) 一种数据处理、信息推荐方法及装置
CN110992190A (zh) 基于用户画像的资产配置方法及装置
CN113538188A (zh) 试卷生成方法、装置、电子设备及计算机可读存储介质
US11068856B2 (en) Biometric data based scheduling
US11281867B2 (en) Performing multi-objective tasks via primal networks trained with dual networks
JP2023552459A (ja) クロスバーアレイの為の、最悪のケースのノイズ及びバウンド管理
US10229041B2 (en) Run time TPNS workload controls for test workload tuning in relation to customer profiling workload
CN108550019A (zh) 一种简历筛选方法及装置
US11023530B2 (en) Predicting user preferences and requirements for cloud migration
US11500340B2 (en) Performance evaluation based on resource dynamics
CN114140033B (zh) 一种服务人员的分配方法、装置、电子设备及存储介质
CN113366510A (zh) 经由训练的原始网络与双网络来执行多目标任务
CN115545638A (zh) 一种知识动态掌握程度确定方法、试题推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant