CN110232646A - 基于深度置信网络的研究生就业推荐方法 - Google Patents

基于深度置信网络的研究生就业推荐方法 Download PDF

Info

Publication number
CN110232646A
CN110232646A CN201910501514.8A CN201910501514A CN110232646A CN 110232646 A CN110232646 A CN 110232646A CN 201910501514 A CN201910501514 A CN 201910501514A CN 110232646 A CN110232646 A CN 110232646A
Authority
CN
China
Prior art keywords
data
model
depth confidence
employment
confidence network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910501514.8A
Other languages
English (en)
Inventor
吴怡之
李沙
张雪琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
National Dong Hwa University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201910501514.8A priority Critical patent/CN110232646A/zh
Publication of CN110232646A publication Critical patent/CN110232646A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度置信网络的研究生就业推荐方法,其特征在于,首先从研究生信息管理系统中筛选出学生数据;对数据样本进行预处理后,对就业信息进行分类;然后选取深度置信网络模型参数建立深度置信网络模型;接着将经过预处理的数据放到建立的模型中进行训练;最后将未进行训练的数据放入模型进行测试,检测模型准确度和合理性。本发明具有特征提取能力强、预测精度高等特点,可实现研究生就业推荐的需求。

Description

基于深度置信网络的研究生就业推荐方法
技术领域
本发明涉及的是一种基于深度置信网络的研究生就业推荐方法,可将其应用于研究生就业指导领域,通过对研究生现有的条件及基本特征数据的研究,对其进行就业岗位的推荐,针对其所期望岗位的要求,对其进行相应的就业指导,实现对研究生就业工作的指导和帮助。
背景技术
近年来,研究生招生规模逐年扩大,但是部分高校受自身办学条件的限制,师资力量不足,研究生教育培养体系不够完善,使得研究生就业形势不容乐观。另外,研究生就业方式趋于多元化和自主化,研究生就业问题成为一个值得关注的问题。高校研究生院一般都具备较完整的学生信息管理系统,其中存有学生的个人信息和就业历史数据,充分利用已有的毕业生的就业信息资源,对其中有价值的信息进行挖掘和分析,以便对研究生的就业提供指导和帮助,提高学校的就业率和学生的就业质量。
国内外有关研究生就业预测和推荐的研究主要集中在影响就业的因素和方法上。如早期提出了基于中国教育机构近20年就业数据的分析框架,包括地理,行业,年龄,教育体制,智力发展和政治等因素,开发了研究生的培养模式来加强学生的就业指导。此外,还应用统计学习方法对研究生就业进行预测和推荐,如使用c4.5数据挖掘算法对学生数据进行分类和预测。考虑到数据样本的多维度和随机性特征,想要从数据样本中获取更有意义的特征信息,深度置信网络在研究生就业推荐模型的建立方面体现出了巨大的优势。
发明内容
本发明所要解决的技术问题是:提供一种基于深度置信网络的研究生就业推荐方法,用于对学生样本数据进行分析,为研究生的就业提供指导和帮助。
本发明解决上述技术问题所采用的技术方案是:提供一种基于深度置信网络的研究生就业推荐方法,其特征在于,包括以下步骤:
步骤1):数据样本的选取:从研究生信息管理系统中筛选出学生数据;
步骤2):对数据样本进行预处理后,对就业信息进行分类;
步骤3):建立深度置信网络模型:选取深度置信网络模型参数;
步骤4):训练深度置信网络模型:将经过预处理的数据放到建立的模型中进行训练;
步骤5):模型的测试:将未进行训练的数据放入模型进行测试,检测模型准确度和合理性。
优选地,所述步骤1)中数据样本的选取具体为:根据研究的目的,从研究生信息管理系统中选取已就业研究生的个人信息和就业数据信息。这里需要选取的研究生个人信息及其就业信息的数据分布比较均匀,从这些数据中筛选出能够用来当作训练样本的数据。
优选地,所述步骤2)中对数据样本进行预处理具体为:对采取到的原始数据进行初步的数据清洗,消除其中的噪声,进行空缺值的填充以及冗余信息的剔除,对得到的数据进行合并、量化、转换、清理、集成,得到特征信息,对其进行编码和分类。以消除原始数据样本可能存在数据缺失、重复等情况。
更优选地,所述特征信息包括性别、生源地、政治面貌、考试成绩、本科院校、入学方式、学位类型、实习时长、实习公司属性、科研能力、竞赛获奖等级及次数和奖学金获奖等级及次数中的至少一种,然后对特征信息进行编码,作为模型的输入;然后将学生按照就业公司性质、就业岗位及薪资进行分类:好的国企、一般的国企、好的私企、一般的私企、好的外企、一般的外企、中外合资企业、学校或研究院,并分别用001、010、011、100、101、110、111、000表示,作为输出。
优选地,所述步骤3)中建立深度置信网络模型。深度置信网络(Deep BeliefNetwork,DBN)是Hinton等人在2006年提出的一种概率生成模型。它通常被用于提取输入特征的高层抽象的特征表示,是由多个受限玻尔兹曼机(RBM)堆积而成的网络模型。RNM由一个可视层v和一个隐藏层h组成,可视层包括n个单元v={v1,v2,…,vn},隐藏层包括m个单元h={h1,h2,…,hm}。RBM是基于能量的模型,可视层和隐藏层的能量函数公式为:
其中,θ={Wij,ai,bj}是RBM的参数,Wij表示可视层和隐藏层之间的连接权重,ai和bj分别表示可视层和隐藏层的偏置。因此想要构建深度置信网络模型,首先需要确定玻尔兹曼机的参数。由此可知深度置信网络模型的网络结构中包含了许多个隐藏层节点,从而可以利用在多个层次结构的不同级别中学习到底层的特征组合来获取出高阶特征,并以此来表示出训练数据中深层结构的特征信息。
优选地,所述步骤4)中的深度置信网络模型由多层无监督的受限玻尔兹曼机网络和一层有监督的反向传播神经网络组成,将选取的多组训练样本放入模型中进行训练,深度置信网络的训练过程可以分为两步:第一,无监督逐层训练受限玻尔兹曼机,对深度置信网络模型中的受限玻尔兹曼机自底向上进行逐层的训练,在尽最大可能保留训练数据的重要信息的前提下,对训练数据进行特征提取和抽象;第二,利用反向传播算法微调整个深度置信网络模型的参数,即使用误差反向传播算法训练带标签的数据来实现,目的是得到模型的全局最优点。
优选地,所述步骤5)中模型的测试具体为:将未进行训练的样本数据作为输入,输入到已经训练好的模型中进行模型的测试;根据测试所得的结果找到其对应的就业信息的分类结果。本发明可通过学生现有的条件及其所具备的特征技能对其就业进行推荐,根据推荐结果及其对就业公司性质、就业岗位、薪资的期望,进行相关的就业指导。
本发明与现有技术相比,具有以下有益效果:本发明考虑到数据样本的多维度和随机性特征,使用深度置信网络进行有意义的特征提取和表示,输入到支持向量机得到分类结果,使得分类结果更准确,更有意义,可满足研究生就业推荐的需求。
附图说明
图1为本发明的流程图;
图2是本发明中使用的深度置信网络结构图;
图3是本发明中训练深度置信网络的算法流程图。
具体实施方式
为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。
实施例
一种基于深度置信网络的研究生就业推荐方法,包括以下步骤:
首先对学生信息管理系统中的学生数据进行筛选和处理,进行样本的选取。接着对所选数据进行预处理,主要包括数据的清洗、转换、量化、合并、集成以及特征编码。然后建立深度置信网络模型,顶层网络选择支持向量机,选择合适的模型参数。将数据放入模型中进行训练,通过深度置信网络模型实现对数据特征的提取。最后将未进行训练的数据放入模型中进行测试并检测此模型的准确度和合理性。如图1所示,具体步骤如下:
(1)数据样本的选取,根据研究的目的,从研究生信息管理系统中选取已就业研究生的个人信息和就业数据信息。这里需要选取的研究生个人信息及其就业信息的数据分布比较均匀,从这些数据中筛选出能够用来当作训练样本的数据。
(2)数据样本预处理,由于原始数据样本可能存在数据缺失、重复等情况,首先需要对采取到的原始数据进行初步的数据清洗,消除其中的噪声,进行空缺值的填充以及冗余信息的剔除。从中选取的特征信息包括性别、生源地、政治面貌、考试成绩、本科院校、入学方式、学位类型、实习时长、实习公司属性、科研能力、竞赛获奖等级及次数、奖学金获奖等级及次数,然后对上述特征进行编码,作为模型的输入。分类的结果按照学生就业公司性质、就业岗位及薪资进行划分,可划分为:好的国企、一般的国企、好的私企、一般的私企、好的外企、一般的外企、中外合资企业、学校或研究院。分别用001、010、011、100、101、110、111、000表示,作为输出。
(3)建立深度置信网络模型,深度置信网络是Hinton等人在2006年提出的一种概率生成模型。它通常被用于提取输入特征的高层抽象的特征表示,是由多个受限玻尔兹曼机(RBM)堆积而成的网络模型。R RNM由一个可视层v和一个隐藏层h组成,可视层包括n个单元v={v1,v2,…,vn},隐藏层包括m个单元h={h1,h2,…,hm}。RBM是基于能量的模型,可视层和隐藏层的能量函数公式为:
其中,θ={Wij,ai,bj}是RBM的参数,Wij表示可视层和隐藏层之间的连接权重,ai和bj分别表示可视层和隐藏层的偏置。因此想要构建深度置信网络模型,首先需要确定玻尔兹曼机的参数。深度置信网络模型的网络结构中包含了许多个隐藏层节点,从而可以利用在多个层次结构的不同级别中学习到底层的特征组合来获取出高阶特征,并以此来表示出训练数据中深层结构的特征信息。图2即为深度置信网络模型的结构图。
(4)训练深度置信网络模型,深度置信网络模型由多层无监督的受限玻尔兹曼机网络和一层有监督的反向传播神经网络组成。将选取的多组训练样本放入模型中进行训练,训练过程可分为两步:第一,无监督逐层训练受限玻尔兹曼机,对深度置信网络模型中的受限玻尔兹曼机自底向上进行逐层的训练,在尽最大可能保留训练数据重要信息的前提下,对数据进行特征提取和抽象;第二,利用反向传播算法微调整个深度置信网络模型的参数,主要目的是得到模型的全局最优点,可以使用误差反向传播算法训练带标签的数据来实现。
(5)模型的测试,将未进行训练的样本数据作为输入,输入到已经训练好的模型中进行模型的测试。根据测试所得的结果找到其对应的就业分类结果。本发明的实用性在于,可通过学生现有的条件及其所具备的特征技能对其就业进行推荐,根据推荐结果及其对就业公司性质、就业岗位、薪资的期望,进行相关的就业指导。
如本学院信息与通信工程专业一同学,性别男,本科院校为普通一本,入学方式为保研,学位类型为学术型硕士,有过三次时长不少于半年的实习经历,实习公司属性为外企,科研能力一般,多次在比赛中获奖并获得国奖奖学金。将这些特征信息作为模型输入,其得到的就业指导信息为:优先推荐其入职外企,其次可选择加班力度一般的国企或非互联网企业。

Claims (7)

1.一种基于深度置信网络的研究生就业推荐方法,其特征在于,包括以下步骤:
步骤1):数据样本的选取:从研究生信息管理系统中筛选出学生数据;
步骤2):对数据样本进行预处理后,对就业信息进行分类;
步骤3):建立深度置信网络模型:选取深度置信网络模型参数;
步骤4):训练深度置信网络模型:将经过预处理的数据放到建立的模型中进行训练;
步骤5):模型的测试:将未进行训练的数据放入模型进行测试,检测模型准确度和合理性。
2.如权利要求1所述的基于深度置信网络的研究生就业推荐方法,其特征在于,所述步骤1)中数据样本的选取具体为:根据研究的目的,从研究生信息管理系统中选取已就业研究生的个人信息和就业数据信息。
3.如权利要求1所述的基于深度置信网络的研究生就业推荐方法,其特征在于,所述步骤2)中对数据样本进行预处理具体为:对采取到的原始数据进行初步的数据清洗,消除其中的噪声,进行空缺值的填充以及冗余信息的剔除,对得到的数据进行合并、量化、转换、清理、集成,得到特征信息,对其进行编码和分类。
4.如权利要求2所述的基于深度置信网络的研究生就业推荐方法,其特征在于,所述特征信息包括性别、生源地、政治面貌、考试成绩、本科院校、入学方式、学位类型、实习时长、实习公司属性、科研能力、竞赛获奖等级及次数和奖学金获奖等级及次数中的至少一种,然后对特征信息进行编码,作为模型的输入;然后将学生按照就业公司性质、就业岗位及薪资进行分类:好的国企、一般的国企、好的私企、一般的私企、好的外企、一般的外企、中外合资企业、学校或研究院,并分别用001、010、011、100、101、110、111、000表示,作为输出。
5.如权利要求1所述的基于深度置信网络的研究生就业推荐方法,其特征在于,所述步骤3)中建立深度置信网络模型。
6.如权利要求1所述的基于深度置信网络的研究生就业推荐方法,其特征在于,所述步骤4)中的深度置信网络模型由多层无监督的受限玻尔兹曼机网络和一层有监督的反向传播神经网络组成,将选取的多组训练样本放入模型中进行训练,深度置信网络的训练过程可以分为两步:第一,无监督逐层训练受限玻尔兹曼机,对深度置信网络模型中的受限玻尔兹曼机自底向上进行逐层的训练,在尽最大可能保留训练数据的重要信息的前提下,对训练数据进行特征提取和抽象;第二,利用反向传播算法微调整个深度置信网络模型的参数,即使用误差反向传播算法训练带标签的数据来实现,目的是得到模型的全局最优点。
7.如权利要求1所述的基于深度置信网络的研究生就业推荐方法,其特征在于,所述步骤5)中模型的测试具体为:将未进行训练的样本数据作为输入,输入到已经训练好的模型中进行模型的测试;根据测试所得的结果找到其对应的就业信息的分类结果。
CN201910501514.8A 2019-06-11 2019-06-11 基于深度置信网络的研究生就业推荐方法 Pending CN110232646A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910501514.8A CN110232646A (zh) 2019-06-11 2019-06-11 基于深度置信网络的研究生就业推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910501514.8A CN110232646A (zh) 2019-06-11 2019-06-11 基于深度置信网络的研究生就业推荐方法

Publications (1)

Publication Number Publication Date
CN110232646A true CN110232646A (zh) 2019-09-13

Family

ID=67858837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910501514.8A Pending CN110232646A (zh) 2019-06-11 2019-06-11 基于深度置信网络的研究生就业推荐方法

Country Status (1)

Country Link
CN (1) CN110232646A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475531A (zh) * 2020-04-12 2020-07-31 魏秋云 一种基于学生就业数据的信息分析系统
CN112365159A (zh) * 2020-11-11 2021-02-12 福建亿榕信息技术有限公司 一种基于深度神经网络的后备干部推荐方法及系统
CN112686624A (zh) * 2020-12-24 2021-04-20 江苏金智教育信息股份有限公司 一种学生工作岗位推荐的方法和装置
CN116563067A (zh) * 2023-05-15 2023-08-08 北京融信数联科技有限公司 一种基于大数据的毕业生人群就业分析方法、系统及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229896A1 (en) * 2005-04-11 2006-10-12 Howard Rosen Match-based employment system and method
CN106408262A (zh) * 2016-09-27 2017-02-15 吉林码帝科技有限公司 一种招聘和应聘匹配方法
CN106600213A (zh) * 2016-11-15 2017-04-26 广东家易科技有限公司 一种个人简历智能管理系统及方法
CN107590133A (zh) * 2017-10-24 2018-01-16 武汉理工大学 基于语义的招聘职位与求职简历匹配的方法及系统
CN109255646A (zh) * 2018-07-27 2019-01-22 国政通科技有限公司 利用大数据进行深度学习以提供增值服务的方法、系统
CN109597937A (zh) * 2018-12-03 2019-04-09 华中师范大学 网络课程推荐方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229896A1 (en) * 2005-04-11 2006-10-12 Howard Rosen Match-based employment system and method
CN106408262A (zh) * 2016-09-27 2017-02-15 吉林码帝科技有限公司 一种招聘和应聘匹配方法
CN106600213A (zh) * 2016-11-15 2017-04-26 广东家易科技有限公司 一种个人简历智能管理系统及方法
CN107590133A (zh) * 2017-10-24 2018-01-16 武汉理工大学 基于语义的招聘职位与求职简历匹配的方法及系统
CN109255646A (zh) * 2018-07-27 2019-01-22 国政通科技有限公司 利用大数据进行深度学习以提供增值服务的方法、系统
CN109597937A (zh) * 2018-12-03 2019-04-09 华中师范大学 网络课程推荐方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
尹传城 等: "一种基于在校历史信息的就业推荐算法", 《计算机与数字工程》 *
王芳: "基于深度信念网络的资源检索与推荐系统", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475531A (zh) * 2020-04-12 2020-07-31 魏秋云 一种基于学生就业数据的信息分析系统
CN112365159A (zh) * 2020-11-11 2021-02-12 福建亿榕信息技术有限公司 一种基于深度神经网络的后备干部推荐方法及系统
CN112686624A (zh) * 2020-12-24 2021-04-20 江苏金智教育信息股份有限公司 一种学生工作岗位推荐的方法和装置
CN112686624B (zh) * 2020-12-24 2024-01-23 江苏金智教育信息股份有限公司 一种学生工作岗位推荐的方法和装置
CN116563067A (zh) * 2023-05-15 2023-08-08 北京融信数联科技有限公司 一种基于大数据的毕业生人群就业分析方法、系统及介质
CN116563067B (zh) * 2023-05-15 2024-03-15 北京融信数联科技有限公司 一种基于大数据的毕业生人群就业分析方法、系统及介质

Similar Documents

Publication Publication Date Title
CN110232646A (zh) 基于深度置信网络的研究生就业推荐方法
Crisp et al. Hispanic student success: Factors influencing the persistence and transfer decisions of Latino community college students enrolled in developmental education
Mullen et al. Who goes to graduate school? Social and academic correlates of educational continuation after college
Li et al. Does attending elite colleges pay in China?
Ligon et al. Quantifying leader lives: What historiometric approaches can tell us
Pulido et al. Female social entrepreneurship and socio-cultural context: An international analysis
Gauja et al. The comparative study of political party organization: Changing perspectives and prospects
Luke The discipline as disciplinary normalization: networks of research
LaVelle Planning for Evaluation’s Future: Undergraduate Students' Interest in Program Evaluation
Pietsch et al. The effects of competition in local schooling markets on leadership for learning
Fachinelli et al. Measuring the capital systems categories: the perspective of an integrated value system of social life as perceived by young citizens
Clark et al. Condensed mastery profile method for setting standards for diagnostic assessment systems
CN111476352B (zh) 基于深度学习的随堂扫码评教数据有效性分析方法
CN104574234A (zh) 大学申请机会最优化教育咨询系统
Araújo et al. Building local networking in education? Decision-makers’ discourses on school achievement and dropout in Portugal
Amburgey et al. Using business intelligence in college admissions: a strategic approach
CN109492676A (zh) 基于粒子群算法优化支持向量机的研究生就业预测方法
Jimenez-Raygoza et al. Proposal of a computer system for vocational guidance with data mining
Schreiner et al. Monitoring student achievement in Austria: Implementation, results and political reactions
Novita et al. Use of the C4. 5 Algorithm in Determining Scholarship Recipients
Stops et al. Extracting skill requirements from job ads-the" Machbarkeitsstudie Kompetenz-Kompass"
Woelmer et al. Macrosystems EDDIE module 8: Using ecological forecasts to guide decision-making (instructor materials)
Chen et al. Value oriented social decision analysis: A communication tool for public decision making on technological projects
Rai Student Dropout Risk Assessment in Undergraduate Course at Residential University
Glassett Using self-determination theory in participant selection for narrative inquiry: A methodology for the participant-selection variant of an explanatory sequential design

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190913