CN109492676A - 基于粒子群算法优化支持向量机的研究生就业预测方法 - Google Patents
基于粒子群算法优化支持向量机的研究生就业预测方法 Download PDFInfo
- Publication number
- CN109492676A CN109492676A CN201811235357.2A CN201811235357A CN109492676A CN 109492676 A CN109492676 A CN 109492676A CN 201811235357 A CN201811235357 A CN 201811235357A CN 109492676 A CN109492676 A CN 109492676A
- Authority
- CN
- China
- Prior art keywords
- postgraduate
- data
- employment
- support vector
- vector machines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于粒子群算法优化支持向量机的研究生就业预测方法,其特征在于,包括以下步骤:对研究生信息管理系统中的学生数据进行筛选和处理,选取数据样本;建立支持向量机模型;将数据样本放入支持向量机模型中进行训练;对研究生信息管理系统中的学生数据进行筛选和处理,选取测试样本,对测试样本进行预处理后输入训练好的支持向量机模型中,检测模型准确度和合理性。本发明考虑到数据样本的多维度和随机性特征,使用经过粒子群算法寻得最优参数的支持向量机,使得对研究生就业预测的精度更高,可满足研究生就业预测的需求。
Description
技术领域
本发明涉及一种基于粒子群算法优化支持向量机的研究生就业预测方法,可以应用于研究生就业指导领域,通过对研究生行为数据的研究,预测研究生就业能力从而为研究生的就业工作提供帮助。
背景技术
近年来,研究生招生规模逐年扩大,但是部分高校受自身办学条件的限制,师资力量不足,研究生教育培养体系不够完善,使得研究生就业形势不容乐观。另外,研究生就业方式趋于多元化和自主化,研究生就业问题成为一个值得关注的问题。高校研究生院一般都具备较完整的学生信息管理系统,其中存有学生的个人信息和就业历史数据,充分利用已有的毕业生的就业信息资源,对其中有价值的信息进行挖掘和分析,以便对研究生的就业提供指导和帮助,可以提高学校的就业率和学生的就业质量。
国内外有关研究生就业预测的研究主要集中在影响就业预测的因素和方法上。如早期提出了基于中国教育机构近20年就业数据的分析框架,包括地理、行业、年龄、教育体制、智力发展和政治等因素,开发了研究生的培养模式来加强学生的就业指导。此外,还应用统计学习方法和现存的学生个人信息和历史就业数据对研究生就业进行分析和预测,如使用c4.5数据挖掘算法对学生数据进行分类和预测。考虑到数据样本的多维度和随机性特征,支持向量机在研究生就业预测模型的建立方面体现出了巨大的优势。
发明内容
本发明的目的是:利用基于粒子群算法优化支持向量机对研究生就业进行预测。
为了达到上述目的,本发明的技术方案是提供了一种基于粒子群算法优化支持向量机的研究生就业预测方法,其特征在于,包括以下步骤:
步骤1、对研究生信息管理系统中的学生数据进行筛选和处理,选取数据样本;
步骤2、对数据样本进行预处理;
步骤3、选取合适的支持向量机训练参数,建立支持向量机模型;
步骤4、将步骤2得到的数据样本放入支持向量机模型中进行训练;
步骤5、对研究生信息管理系统中的学生数据进行筛选和处理,选取测试样本,对测试样本进行预处理后输入训练好的支持向量机模型中,检测模型准确度和合理性。
优选地,步骤1中,根据研究的目的,选择研究生信息管理系统中已就业研究生的个人信息和就业信息数据,选取出的数据达到研究生的个人信息及就业信息数据分布比较均匀的要求,从选取出的数据中筛选出能够用来作为训练样本的数据样本。
优选地,步骤2中,对数据样本进行预处理包括以下步骤:
步骤201、对数据样本进行初步的清洗和校验,补齐空缺值,消除噪声,剔除冗余信息;
步骤202、在步骤201得到的数据样本中选取:性别、政治面貌、生源地、成绩、入学方式、本科院校、学位类型、科研能力、奖学金获奖等级及次数、竞赛获奖等级及次数、实习时长作为特征数据进行数值编码,作为支持向量机模型的输入,将分类结果作为支持向量机模型的输出,分类结果综合了就业岗位、就业公司性质及薪资,分别为:好的国企、一般的国企、好的外企、一般的外企、好的私企、一般的私企、中外合资企业、学校或研究院,分别用001、010、011、100、101、110、111、000表示。
优选地,步骤4中,进行训练时,将数据样本放入支持向量机模型中进行训练,通过粒子群算法对支持向量机的惩罚因子和核函数进行寻优,得到一个最优解模型,支持向量机中惩罚因子越大,对目标函数的损失也越大,惩罚因子过大可能退化为硬间隔问题,而惩罚因子过小则错分的可能性变大,对样本的拟合性下降,另外,在模型的训练中用粒子群算法对不同的惩罚因子和核函数进行寻优,获得最优解。
优选地,步骤5中,检测模型准确度和合理性时,将需要进行测试的检验向量写入程序,对已经训练好的模型进行测试,将训练出的训练结果与期望数据进行比较,找到其对应的就业分类结果。
本发明的实用性在于,可以通过学生现在所具备的特征技能对其以后就业去向进行预测,还可以根据其对就业岗位、薪资、公司性质的期望,对其进行相关就业指导。
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明考虑到数据样本的多维度和随机性特征,使用经过粒子群算法寻得最优参数的支持向量机,使得对研究生就业预测的精度更高,可满足研究生就业预测的需求。
附图说明
图1是本发明的流程图;
图2是本发明中使用的支持向量机结构图;
图3是本发明中使用粒子群算法优化支持向量机的算法流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种基于粒子群算法优化支持向量机的研究生就业预测方法,包括以下步骤:首先进行数据样本的选取,对研究生信息管理系统中的学生数据进行筛选和处理。接着对数据样本进行预处理,主要包括数据的合并、量化、转换、清理、集成以及特征编码。然后通过粒子群优化算法选取最优的支持向量机训练参数,建立支持向量机模型。再将处理好的数据放入模型中进行训练。最后将未进行训练的数据放入支持向量机模型中进行测试并检测模型的准确度及合理性。如图1所示,包括以下步骤:
(1)数据样本的选取,根据研究的目的,选择研究生信息管理系统中已就业研究生的个人信息和就业信息数据。在这里首先要求研究生的个人信息及就业信息数据分布比较均匀,然后筛选出能够用来作为训练样本的数据。
(2)数据样本预处理,先对从学生信息管理系统中采取的数据进行初步的清洗和校验,补齐空缺值,消除噪声,剔除冗余信息。选取的特征为:性别、政治面貌、生源地、成绩、入学方式、本科院校、学位类型、科研能力、奖学金获奖等级及次数、竞赛获奖等级及次数、实习时长,将上述特征数据进行数值编码,作为输入。分类结果综合了就业岗位、就业公司性质及薪资,分别为:好的国企、一般的国企、好的外企、一般的外企、好的私企、一般的私企、中外合资企业、学校或研究院。分别用001、010、011、100、101、110、111、000表示,作为输出。
(3)建立支持向量机模型,支持向量机(Support Vector Machine,SVM)是Vapnik等在1995年提出的。支持向量机是一种二类分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,由于包括核技巧,这使它成为实质上的非线性分类器,其学习策略为间隔最大化,即:
式中,w表示法向量,b表示截距,γ表示几何间隔,yi表示xi的类标记,xi表示第i个特征向量。
构建支持向量机模型,模型的设计主要包括两个方面,一个是参数的选取,另一个就是核函数的选择。对于非线性分类,将其分类决策函数中的内积用核函数代替,分类决策函数式成为:
式中,f(x)表示分类决策函数,Ns表示训练数据的个数,表示对偶问题的解,φ(xi)表示原空间到新空间的映射,b*表示原始最优化问题的解,K(xi,x)表示核函数。
在核函数给定的条件下,利用解线性分类的方法求解非线性分类问题的支持向量机。
(4)训练支持向量机模型,将选取的多组训练样本放入模型中进行训练,通过粒子群算法(PSO)对支持向量机的惩罚因子和核函数进行寻优,得到一个最优解模型。支持向量机中惩罚因子越大,对目标函数的损失也越大,惩罚因子过大可能退化为硬间隔问题,而惩罚因子过小则错分的可能性变大,对样本的拟合性下降。此外,对于此类非线性问题,需要选择一个最优的核函数,因此,在模型的训练中就需要用粒子群算法对不同的惩罚因子和核函数进行寻优,获得最优解。
(5)模型的测试,对已经训练好的模型进行测试。将训练出的结果与期望数据进行比较,找到对应的就业分类结果。本发明的实用性在于,可以通过学生现在所具备的特征技能对其以后就业去向进行预测,还可以根据其对就业岗位、薪资、公司性质的期望,对其进行相关就业指导。
Claims (5)
1.一种基于粒子群算法优化支持向量机的研究生就业预测方法,其特征在于,包括以下步骤:
步骤1、对研究生信息管理系统中的学生数据进行筛选和处理,选取数据样本;
步骤2、对数据样本进行预处理;
步骤3、选取合适的支持向量机训练参数,建立支持向量机模型;
步骤4、将步骤2得到的数据样本放入支持向量机模型中进行训练;
步骤5、对研究生信息管理系统中的学生数据进行筛选和处理,选取测试样本,对测试样本进行预处理后输入训练好的支持向量机模型中,检测模型准确度和合理性。
2.如权利要求1所述的一种基于粒子群算法优化支持向量机的研究生就业预测方法,其特征在于,步骤1中,根据研究的目的,选择研究生信息管理系统中已就业研究生的个人信息和就业信息数据,选取出的数据达到研究生的个人信息及就业信息数据分布比较均匀的要求,从选取出的数据中筛选出能够用来作为训练样本的数据样本。
3.如权利要求1所述的一种基于粒子群算法优化支持向量机的研究生就业预测方法,其特征在于,步骤2中,对数据样本进行预处理包括以下步骤:
步骤201、对数据样本进行初步的清洗和校验,补齐空缺值,消除噪声,剔除冗余信息;
步骤202、在步骤201得到的数据样本中选取:性别、政治面貌、生源地、成绩、入学方式、本科院校、学位类型、科研能力、奖学金获奖等级及次数、竞赛获奖等级及次数、实习时长作为特征数据进行数值编码,作为支持向量机模型的输入,将分类结果作为支持向量机模型的输出,分类结果综合了就业岗位、就业公司性质及薪资,分别为:好的国企、一般的国企、好的外企、一般的外企、好的私企、一般的私企、中外合资企业、学校或研究院,分别用001、010、011、100、101、110、111、000表示。
4.如权利要求1所述的一种基于粒子群算法优化支持向量机的研究生就业预测方法,其特征在于,步骤4中,进行训练时,将数据样本放入支持向量机模型中进行训练,通过粒子群算法对支持向量机的惩罚因子和核函数进行寻优,得到一个最优解模型,支持向量机中惩罚因子越大,对目标函数的损失也越大,惩罚因子过大可能退化为硬间隔问题,而惩罚因子过小则错分的可能性变大,对样本的拟合性下降,另外,在模型的训练中用粒子群算法对不同的惩罚因子和核函数进行寻优,获得最优解。
5.如权利要求1所述的一种基于粒子群算法优化支持向量机的研究生就业预测方法,其特征在于,步骤5中,检测模型准确度和合理性时,将需要进行测试的检验向量写入程序,对已经训练好的模型进行测试,将训练出的训练结果与期望数据进行比较,找到其对应的就业分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811235357.2A CN109492676A (zh) | 2018-10-23 | 2018-10-23 | 基于粒子群算法优化支持向量机的研究生就业预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811235357.2A CN109492676A (zh) | 2018-10-23 | 2018-10-23 | 基于粒子群算法优化支持向量机的研究生就业预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109492676A true CN109492676A (zh) | 2019-03-19 |
Family
ID=65692453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811235357.2A Pending CN109492676A (zh) | 2018-10-23 | 2018-10-23 | 基于粒子群算法优化支持向量机的研究生就业预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492676A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112200353A (zh) * | 2020-09-30 | 2021-01-08 | 重庆师范大学 | 基于改进量子优化算法的支持向量机天气预测方法 |
CN116205377A (zh) * | 2023-04-28 | 2023-06-02 | 江西恒能电力工程有限公司 | 分布式光伏电站出力预测方法、系统、计算机及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663412A (zh) * | 2012-02-27 | 2012-09-12 | 浙江大学 | 基于最小二乘支持向量机的电力设备载流故障趋势预测方法 |
CN103679263A (zh) * | 2012-08-30 | 2014-03-26 | 重庆邮电大学 | 基于粒子群支持向量机的雷电临近预测方法 |
CN103743980A (zh) * | 2014-01-14 | 2014-04-23 | 山东科技大学 | 基于pso优化的svm的电能质量扰动识别与分类方法 |
CN105741077A (zh) * | 2016-01-26 | 2016-07-06 | 南华大学 | 职业信息提供方法及系统 |
CN106845544A (zh) * | 2017-01-17 | 2017-06-13 | 西北农林科技大学 | 一种基于粒子群与支持向量机的小麦条锈病预测方法 |
CN108256699A (zh) * | 2018-04-10 | 2018-07-06 | 张永新 | 基于高校学生立体数据的毕业去向预测方法及系统 |
-
2018
- 2018-10-23 CN CN201811235357.2A patent/CN109492676A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663412A (zh) * | 2012-02-27 | 2012-09-12 | 浙江大学 | 基于最小二乘支持向量机的电力设备载流故障趋势预测方法 |
CN103679263A (zh) * | 2012-08-30 | 2014-03-26 | 重庆邮电大学 | 基于粒子群支持向量机的雷电临近预测方法 |
CN103743980A (zh) * | 2014-01-14 | 2014-04-23 | 山东科技大学 | 基于pso优化的svm的电能质量扰动识别与分类方法 |
CN105741077A (zh) * | 2016-01-26 | 2016-07-06 | 南华大学 | 职业信息提供方法及系统 |
CN106845544A (zh) * | 2017-01-17 | 2017-06-13 | 西北农林科技大学 | 一种基于粒子群与支持向量机的小麦条锈病预测方法 |
CN108256699A (zh) * | 2018-04-10 | 2018-07-06 | 张永新 | 基于高校学生立体数据的毕业去向预测方法及系统 |
Non-Patent Citations (5)
Title |
---|
刘冰 著: "《基于流形正则化的核方法研究与应用》", 30 June 2016, 中国矿业大学出版社 * |
吴静: "KNN算法在就业预测模型中的应用", 《莆田学院学报》 * |
陈晋音 等: "基于粒子群算法的支持向量机的参数优化", 《计算机科学》 * |
陈高波: "基于自适应多分类最小二乘支持向量机的大学生就业预测", 《甘肃科技》 * |
韩媚 等: "SVM的特征选择方法在高校就业预测中的应用研究", 《杭州师范大学学报(自然科学版)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112200353A (zh) * | 2020-09-30 | 2021-01-08 | 重庆师范大学 | 基于改进量子优化算法的支持向量机天气预测方法 |
CN112200353B (zh) * | 2020-09-30 | 2022-06-17 | 重庆师范大学 | 基于改进量子优化算法的支持向量机天气预测方法 |
CN116205377A (zh) * | 2023-04-28 | 2023-06-02 | 江西恒能电力工程有限公司 | 分布式光伏电站出力预测方法、系统、计算机及存储介质 |
CN116205377B (zh) * | 2023-04-28 | 2023-08-18 | 江西恒能电力工程有限公司 | 分布式光伏电站出力预测方法、系统、计算机及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nieto et al. | Supporting academic decision making at higher educational institutions using machine learning-based algorithms | |
Zabriskie et al. | Using machine learning to predict physics course outcomes | |
Sivakumar et al. | Predictive modeling of student dropout indicators in educational data mining using improved decision tree | |
Obsie et al. | Prediction of student academic performance using neural network, linear regression and support vector regression: a case study | |
Young et al. | Identifying features predictive of faculty integrating computation into physics courses | |
Hussain et al. | Mining moodle data to detect the inactive and low-performance students during the moodle course | |
CN112183652A (zh) | 一种联邦机器学习环境下的边缘端偏见检测方法 | |
Fong et al. | Applying a hybrid model of neural network and decision tree classifier for predicting university admission | |
Nathani et al. | Influence of technology entrepreneurship on entrepreneurial intentions: A cross country analysis | |
Alsmadi et al. | US News & World Report Best Colleges rankings: Which institutional metrics contribute to sustained stratification? | |
Palacios-Pacheco et al. | Application of data mining for the detection of variables that cause university desertion | |
CN109492676A (zh) | 基于粒子群算法优化支持向量机的研究生就业预测方法 | |
Chen et al. | Research on the education of migrant children in China: A review of the literature | |
Atienza et al. | A Deep Neural Network in a Web-based Career Track Recommender System for Lower Secondary Education | |
Marcarelli et al. | School and academic performance for ranking high schools: Some evidence from Italy | |
Panthee et al. | Career Guidance System Using Machine Learning | |
Majeed et al. | Current state of art of academic data mining and future vision | |
Parkhi et al. | Machine Learning Based Prediction Model for College Admission | |
Chen et al. | Intelligent decision system for accessing academic performance of candidates for early admission to university | |
Liu et al. | A hybrid method based on MLFS approach to analyze students' academic achievement | |
Deepika et al. | Analyze and predicting the student academic performance using data mining tools | |
KR20220067613A (ko) | 기계학습 모델을 이용한 대학입시예측 장치 및 그 제어방법 | |
Sani et al. | Development of a Predictive Model of Student Attrition Rate | |
Nájera et al. | Selection of academic tutors in higher education using decision trees | |
Sherzad | Shaping the selection of fields of study in Afghanistan through educational data mining approaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190319 |