CN106447165A - 一种启发式的工作岗位分级方法及装置 - Google Patents

一种启发式的工作岗位分级方法及装置 Download PDF

Info

Publication number
CN106447165A
CN106447165A CN201610773434.4A CN201610773434A CN106447165A CN 106447165 A CN106447165 A CN 106447165A CN 201610773434 A CN201610773434 A CN 201610773434A CN 106447165 A CN106447165 A CN 106447165A
Authority
CN
China
Prior art keywords
work position
classification
rule
post
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610773434.4A
Other languages
English (en)
Inventor
刘宏志
付彬
易晖
吴波
赵鹏
吴中海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hua Rui Rui Network Technology Co Ltd
Peking University
Original Assignee
Beijing Hua Rui Rui Network Technology Co Ltd
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hua Rui Rui Network Technology Co Ltd, Peking University filed Critical Beijing Hua Rui Rui Network Technology Co Ltd
Priority to CN201610773434.4A priority Critical patent/CN106447165A/zh
Publication of CN106447165A publication Critical patent/CN106447165A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种启发式的工作岗位分级方法。本方法为:确定岗位分级层数;获取每一级工作岗位的特征属性;通过训练集工作岗位特征生成分级规则;利用训练集生成的分级规则,对待分级的工作岗位进行分级处理。本发明还公开了一种启发式的工作岗位分级装置。本发明中启发式的工作岗位分级方法及装置通过将工作岗位进行关键词提取并与分级规则匹配,采取关键词的经验规则来判断工作岗位的级别,可以在保证工作岗位分级正确性的前提下提高分级的效率,解决了互联网这类新兴行业的工作岗位分级困难和效率低的问题。

Description

一种启发式的工作岗位分级方法及装置
技术领域
本发明属于电子人力资源管理和数据挖掘领域,通过构造工作岗位分级规则,自动对工作岗位进行分级。本发明可直接应用在工作岗位管理、分析和推荐中。该发明涉及一种启发式的工作岗位分级方法及装置。
背景技术
目前的工作岗位分级,主要是针对专业技术岗位和管理岗位进行分类和分级,包含的领域有政府机构、事业单位、咨询公司等传统领域。由于这些领域的岗位名称相对固定,在相当长的时间内岗位名称不会发生变化,因此针对这些领域有固定的岗位分级依据,每一个岗位都有固定的归类和分级。现有的岗位分级和分类主要依靠领域专家人工完成。
以互联网为代表的新兴行业的岗位具有周期短、变化快等特点,往往会在短时间内出现较多新的岗位名称,传统的基于人工的和固定式的岗位分级方式不适用于互联网这类的新兴行业。
发明内容
对于以互联网为代表的新兴行业,由于其工作岗位更新周期短、变化快,使用传统的基于人工的和固定内容的分级方法来判断岗位的级别高低,不但效率低,而且无法满足市场快速发展的需求。本发明设计了一种启发式工作岗位分级方法,利用岗位关键词构造分级规则来判断工作岗位的级别,可以在保证工作岗位分级正确性的前提下提高分级的效率,解决了互联网这类新兴行业的工作岗位分级困难和效率低的问题。
本发明解决其技术问题所采用的技术方案是:首先根据所选行业确定岗位层级,然后结合使用通用词典和行业专用词典对训练集中的工作岗位进行关键词提取,最后通过对提取的关键词进行迭代统计分析生成分级规则。对于新的需要分级的工作岗位,首先同样进行分词处理后提取关键词列表,然后把提取的工作岗位关键词列表按照分级规则进行逐条匹配,满足哪一条分级规则就判断其为该级工作岗位。
本发明的出发点是通过工作岗位的关键词列表与分级规则进行匹配来进行岗位分级,关键在于工作岗位的关键词提取和分级规则的制定与匹配。主要包含三个子过程,分别是工作岗位的关键词提取过程、启发式分级规则的制定和分级规则匹配过程。
本发明的技术方案为:
1)对训练集中的工作岗位进行分词处理,生成每一个工作岗位的关键词列表;
2)对岗位关键词进行统计分析,生成工作岗位分级规则;
3)对测试集的工作岗位同样进行分词处理,生成每一个工作岗位的关键词列表;
4)将待分级的工作岗位的关键词列表与分级规则逐级进行匹配,符合某一条分级规则就将这个工作岗位归类为此级别。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,步骤1)中工作岗位的分词处理,具体过程为:
(1)将通用分词词典和行业专用词典进行统一,生成综合分词词典;
(2)将训练集的工作岗位应用综合分词词典进行分词处理,得到工作岗位的分词结果;
(3)在分词结果中去除与分级无明显相关性或不相关的词语,得到工作岗位的关键词列表。
进一步,步骤2)中生成工作岗位规则,具体过程为:
(1)对工作岗位的关键词列表进行统计分析,使用频率较高的关键词生成分级的基础规则;
(2)依据分级的基础规则对训练集的工作岗位进行分级匹配;
(3)对分级得到的每一级中的工作岗位的关键词重新进行统计分析,根据相关领域专家的判断,如果高频率关键词列表中出现不合理的关键词,则通过添加新的约束条件对分级结果进行调整以避免出现的不合理现象;
(4)依据附有约束条件的基础规则对训练集的工作岗位重新进行分级匹配;
(5)迭代执行步骤(3)和(4),直至分级匹配后的工作岗位正确率符合要求,即在每一级的分级结果中,对于设定频率阈值的高频词列表中未出现不合理的关键词;
(6)根据基础规则和迭代添加的约束条件生成分级规则。
进一步,步骤3)中工作岗位的分词处理,具体过程为:
(1)将通用分词词典和行业专用词典进行统一,生成综合分词词典;
(2)将测试集的工作岗位应用综合分词词典进行分词处理,得到工作岗位的分词结果;
(3)在分词结果中去除与分级无明显相关性或不相关的词语,得到工作岗位的关键词列表。
进一步,步骤4)中关键词列表与分级规则逐级匹配,具体过程为:
(1)将匹配规则按照其判断准确率的顺序排列,准确率越高的规则匹配时优先权越高;
(2)对于每一个工作岗位的关键词列表,按照规则的优先级与分级规则逐条进行匹配;
(3)若符合某一条规则,匹配结束并将该工作岗位归类为相应的级别。
此外,为解决传统的固定式工作岗位分级方法对于互联网这类新兴行业的不适用性问题,本发明提出了一种启发式的工作岗位分级装置。
一种启发式的工作岗位分级装置,包括:
工作岗位的关键词提取模块,用于对工作岗位进行自然语言处理并提取关键词列表;
启发式分级规则制定模块,用于根据训练集中工作岗位关键词的统计分析结果,迭代生成
分级规则;
分级规则匹配模块,用于将工作岗位的关键词列表与分级规则逐条进行匹配,若满足某一条规则,则匹配结束,并将该工作岗位归类为此工作岗位级别。
本方法的有益效果是:
该启发式方法及装置在对互联网这类新兴行业的工作岗位进行分级处理时,在保证准确性的前提下,可以大大提高数据处理的效率,并减少人工操作的成本。
以互联网为例,数据涵盖了互联网行业所有主流的公司和工作岗位,具有高度的普遍性和代表性。下面结合数据实例进行分析。
数据集信息如表1所示。
表1数据集详细参数
序号 参数 数量
1 用户数 129055
2 工作记录 256491
3 公司数 358921
根据互联网行业的工作岗位特征,具体分级如表2所示。
表2工作岗位分级说明
级别序列 级别岗位
1 实习生
2 工程师
3 高级工程师、经理
4 公司高层
利用在上述训练数据集上得到的分级规则,对测试的300个互联网工作岗位进行分级,通过领域专家人工对分级结果进行检查,结果显示300个被测岗位中有290个岗位分级正确,10个工作岗位分级结果不合理,正确率为96.7%。实验结果表明所设计的方法不仅正确率较高,且效率远远高于人工手动分级。该方法及装置能够很好的对互联网行业工作岗位进行分级处理,解决了人工分类成本高昂以及固定式分类不适用于互联网这类新兴行业的问题。
附图说明
下面结合附图和实施例对本方法进一步说明。
图1是工作岗位关键词提取过程的流程图。
图2是启发式分级规则制定过程的流程图。
图3是工作岗位关键词列表与分级规则匹配的流程图。
图4是一种启发式的工作岗位分级方法及装置的示意图。
具体实施方式
以下结合附图对本发明的原理和性质进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种启发式的工作岗位分级方法,包括三个过程:工作岗位关键词提取过程、启发式分级规则制定过程和工作岗位关键词列表与分级规则匹配过程,以下步骤:
工作岗位关键词提取过程,如图1所示,详细过程如下:
1)如图步骤S101,对于训练数据上的每一个工作岗位,综合使用通用分词词典和行业专用词典,进行自然语言处理,得到分词的结果;
2)如图步骤S102,对于每一个工作岗位的分词结果,去除与判断工作岗位级别不相关或不明显的词语;
3)如图步骤S103,将处理后的关键词构造为该工作岗位的关键词列表;
启发式分级规则制定过程,如图2所示,详细过程如下:
1)如图步骤S201,对分词后的工作岗位关键词列表进行统计分析,按照频率从高到低进行排序;
2)如图步骤S202,根据频率较高的关键词生成分级的基础规则;
3)如图步骤S203,依据分级的基础规则对训练集的工作岗位进行分级匹配;
4)如图步骤S204,对各级岗位中的关键词分别进行统计分析;
5)如图步骤S205,根据相关领域专家的判断,如果所有岗位级别的高频率关键词列表中都没有出现不合理的关键词,则转至步骤S208,否则转至步骤S206;
6)如图步骤S206,根据每级岗位的高频率关键词列表中的不合理关键词,添加新的约束条件以避免不合理分级的出现;
7)如图步骤S207,依据附有约束条件的基础规则对训练集的工作岗位重新进行分级匹配,并跳转至步骤S204;
8)如图步骤S208,根据基础规则和迭代添加的约束条件生成分级规则。
工作岗位关键词列表与分级规则匹配过程,如图3所示,详细如下:
1)如图步骤S301,将工作岗位的关键词列表逐条与分级规则匹配,先与优先级最高的规则1进行匹配;
2)如图步骤S302,如果该工作岗位的关键词列表与分级规则1匹配,则跳至步骤S304;
3)如图步骤S303,如果该工作岗位的关键词列表与分级规则1不匹配,则继续与下一个优先级的分级规则进行匹配,并跳至步骤S302;
4)如图步骤S304,一旦工作岗位的关键词满足某一条分级规则后,则可判定该工作岗位属于这个工作岗位级别。
此外,本发明提供一种启发式的工作岗位分级装置,如图4所示,包括三个模块:工作岗位的关键词提取模块、启发式分级规则制定模块和分级规则匹配模块,其中:
工作岗位的关键词提取模块101,用于将工作岗位进行自然语言处理后得到关键词列表。
启发式分级规则制定模块102,用于根据训练集的工作岗位数据特征迭代生成分级规则。
工作岗位关键词列表和分级规则匹配模块103,用于将工作岗位的关键词列表逐条与工作岗位的分级规则进行匹配,从而判断每一个工作岗位分别属于哪一个工作岗位级别。
在本实施例中,工作岗位的关键词提取模块101还用于去除工作岗位中的与分级特征不相关或者不明显的词语,从而得到特征明显的关键词列表。
工作岗位的关键词提取模块101还用于通过结合通用词典和行业专用词典,生成行业工作岗位专用词典。
启发式分级规则制定模块102还用于生成基础规则和约束条件,其中基础规则由第一次关键词统计分析得出,约束条件由分级结果不合理的数据集合迭代产生,最终的分级规则由基础规则和约束条件共同构成。
采用了上述基于启发式的工作岗位分级及装置之后,对于以互联网为代表的新兴行业工作岗位的分级过程,对于每一个岗位都采取提取关键词的方式进行分析,并将这个岗位的关键词列表与每一个级别的分级规则按照优先级的顺序进行匹配,从而完成对每一个工作岗位的分级过程。这样的分级方式,可以在保证工作岗位分级正确性的前提下提高分级的效率,解决了互联网这类新兴行业的工作岗位分级困难和效率低的问题。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (12)

1.一种启发式的工作岗位分级方法,其特征在于,所述方法包括:
确定岗位分级层数;
获取每一级工作岗位的特征属性;
通过训练集工作岗位特征生成分级规则;
利用训练集生成的分级规则,对待分级的工作岗位进行分级处理。
2.根据权利要求1所述的方法,其特征在于,确定岗位分级层数,包括:
确定目标行业领域;
确定目标行业领域的工作岗位分级层数。
3.根据权利要求1所述的方法,其特征在于,获取每级工作岗位的特征属性,包括:
获取每级工作岗位的职位名称集合;
提取每级工作岗位的关键词列表。
4.根据权利要求3所述的方法,其特征在于,提取岗位关键词,包括:
对工作岗位进行分词处理;
提取可用于判断属于该级工作岗位的关键词;
将提取的关键词构成该工作岗位的关键词列表。
5.根据权利要求4所述的方法,其特征在于,分词处理,包括:
综合使用通用分词词典和行业专用词典对工作岗位进行分词处理。
6.根据权利要求1所述的方法,其特征在于,生成分级规则,包括:
根据关键词统计分析的结果生成基础规则;
使用基础规则对训练集进行分级处理;
使用分级统计结果中出现的高频的不合理的关键词构造分级的约束条件;
结合分级的基础规则和所有的约束条件生成最终的分级规则。
7.根据权利要求6所述的方法,其特征在于,构造分级的约束条件,包括:
结合分级的基础规则和分级的约束条件对训练集重新进行分级处理;
使用分级统计结果中出现的高频的不合理的关键词构造新的分级的约束条件,并添加到约束条件集合中;
重复上述操作,直至分级统计结果中未出现不合理的高频关键词。
8.根据权利要求1所述的方法,其特征在于,利用分级规则进行分级,包括:
将所有分级规则按照对工作岗位判断的准确性高低进行排序;
对待分级的工作岗位进行分词出来得到关键词列表;
依据分级规则逐条与待分级工作岗位的关键词列表进行匹配,一旦满足某一条规则,直接将该工作岗位归为对应的级别。
9.一种启发式的工作岗位分级装置,其特征在于,包括:
工作岗位关键词分析模块,对工作岗位进行关键词分析,并生成每一个工作岗位对应的关键词列表;
启发式分级规则制定模块,用于根据训练集中工作岗位的关键词统计分析结果,生成分级规则;
工作岗位分级归类模块,依据工作岗位分级规则,与每一个工作岗位的关键词列表进行综合分析比较,确定工作岗位的具体级别。
10.根据权利要求9所述的启发式的工作岗位分级装置,其特征在于,对每一个工作岗位综合使用通用词典和行业专用词典提取关键词列表,需先对工作岗位进行自然语言处理,建立关键词列表。
11.根据权利要求9所述的启发式的工作岗位分级装置,其特征在于,根据关键词的统计分析结果,先生成分级的基础规则后,并根据基础规则对训练集工作岗位进行分级处理,然后利用分级结果中出现的不合理的高频关键词构造约束条件,结合基础规则和约束条件重新进行分级处理,重复上述操作直至最终的分级统计结果中未出现不合理的高频关键词,最后利用基础规则和所有的约束条件构造最终的分级规则。
12.根据权利要求9所述的启发式的工作岗位分级装置,其特征在于,按照不同规则的优先级,将工作岗位的关键词列表与分级规则逐条进行对比,满足某一级条件则归为该级的工作岗位。
CN201610773434.4A 2016-08-30 2016-08-30 一种启发式的工作岗位分级方法及装置 Pending CN106447165A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610773434.4A CN106447165A (zh) 2016-08-30 2016-08-30 一种启发式的工作岗位分级方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610773434.4A CN106447165A (zh) 2016-08-30 2016-08-30 一种启发式的工作岗位分级方法及装置

Publications (1)

Publication Number Publication Date
CN106447165A true CN106447165A (zh) 2017-02-22

Family

ID=58090701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610773434.4A Pending CN106447165A (zh) 2016-08-30 2016-08-30 一种启发式的工作岗位分级方法及装置

Country Status (1)

Country Link
CN (1) CN106447165A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107833055A (zh) * 2017-10-19 2018-03-23 广东欧珀移动通信有限公司 评论处理方法及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107833055A (zh) * 2017-10-19 2018-03-23 广东欧珀移动通信有限公司 评论处理方法及设备

Similar Documents

Publication Publication Date Title
CN103812872B (zh) 一种基于混合狄利克雷过程的网络水军行为检测方法及系统
CN109783639B (zh) 一种基于特征提取的调解案件智能分派方法及系统
CN107766324B (zh) 一种基于深度神经网络的文本一致性分析方法
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN111709244B (zh) 一种用于矛盾纠纷事件因果关系识别的深度学习方法
CN103838754B (zh) 信息搜索装置及方法
CN106709754A (zh) 一种用基于文本挖掘的电力用户分群方法
CN104820724B (zh) 文本类教育资源知识点预测模型获得方法及模型应用方法
CN106202380A (zh) 一种分类语料库的构建方法、系统及具有该系统的服务器
CN105574544A (zh) 一种数据处理方法和装置
CN104536881A (zh) 基于自然语言分析的众测错误报告优先级排序方法
CN109410184A (zh) 基于稠密对抗网络半监督学习的直播色情图像检测方法
Zanghi et al. Strategies for online inference of model-based clustering in large and growing networks
CN105677640A (zh) 一种面向开放文本的领域概念抽取方法
CN105426441B (zh) 一种时间序列自动预处理方法
CN105654144A (zh) 一种基于机器学习的社交网络本体构建方法
CN106875278A (zh) 基于随机森林的社交网络用户画像方法
CN111597331A (zh) 一种基于贝叶斯网络的裁判文书分类方法
CN110990718A (zh) 一种公司形象提升系统的社会网络模型构建模块
CN112364352A (zh) 可解释性的软件漏洞检测与推荐方法及系统
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN105787662A (zh) 基于属性的移动应用软件性能预测方法
CN110910175A (zh) 一种旅游门票产品画像生成方法
CN110942098A (zh) 一种基于贝叶斯剪枝决策树的供电服务质量分析方法
CN103426039B (zh) 一种山地光伏电站选址模型建立的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Liu Hongzhi

Inventor after: Jiang Zhentao

Inventor after: Yi Hui

Inventor after: Zhao Peng

Inventor after: Wu Zhonghai

Inventor after: Zhang Xing

Inventor before: Liu Hongzhi

Inventor before: Fu Bin

Inventor before: Yi Hui

Inventor before: Wu Bo

Inventor before: Zhao Peng

Inventor before: Wu Zhonghai

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170222