CN111241361A - 基于云平台的企业与高校的智能引荐系统及方法 - Google Patents
基于云平台的企业与高校的智能引荐系统及方法 Download PDFInfo
- Publication number
- CN111241361A CN111241361A CN202010023218.4A CN202010023218A CN111241361A CN 111241361 A CN111241361 A CN 111241361A CN 202010023218 A CN202010023218 A CN 202010023218A CN 111241361 A CN111241361 A CN 111241361A
- Authority
- CN
- China
- Prior art keywords
- enterprises
- keywords
- keyword
- information
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000007115 recruitment Effects 0.000 claims abstract description 36
- 238000011156 evaluation Methods 0.000 claims abstract description 14
- 238000013507 mapping Methods 0.000 claims description 38
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000000354 decomposition reaction Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 208000011597 CGF1 Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- NJPPVKZQTLUDBO-UHFFFAOYSA-N novaluron Chemical compound C1=C(Cl)C(OC(F)(F)C(OC(F)(F)F)F)=CC=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F NJPPVKZQTLUDBO-UHFFFAOYSA-N 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000004039 social cognition Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开基于云平台的企业与高校的智能引荐系统及方法,基于SaaS云架构,硬件软件均在云端,企业高效对系统的访问不受时间地点工具的限制,只要有互联网均可以。本发明集成企业和高校的信息,构建全领域学科知识图谱,通过企业岗位关键词与学科关键词进行映射匹配,为学校智能化推荐企业岗位信息,企业可以根据推荐反馈结果,有针对性去相关学校甚至学院进行宣讲,降低招聘成本。此外本发明还提出了基于评价的个人简历智能匹配模型,能够更加准确和真实反映学生简历信息,提高匹配的真实性。
Description
技术领域
本发明涉及招聘系统技术领域,尤其涉及基于云平台的企业与高校的智能引荐系统及方法。
背景技术
随着国家的高速发展,一批批互联网企业迅速成长,物联网、区块链、大数据、云计算等高新技术也随之兴起,企业的招聘方式也逐渐多样化,其中校园招聘已经是企业招聘环节中不可或缺的一部分,而其招聘渠道也趋向于主流化、系统化、多元化。但是如何才能让合适的人才在合适的岗位做合适的事情,如何提高校园招聘效率、降低成本,如何发挥人才的专业优势等等,这些仍然是企业所面临的问题。然而应届毕业生从未踏入社会,大部分对自己的就业方向并没有清晰的认知,如何快速帮助应届毕业生认知自己,找到合适自己的工作,也是应届毕业生所苦恼的事情。
目前的招聘系统主要根据个人简历智能匹配到毕业生,然后将职位推荐给毕业生,毕业生在系统上投递简历,系统根据简历信息智能匹配测试题目。例如专利号为201811150487.6公开了“一种智能招聘方法及系统”,该专利系统可以通过云服务器,互联网、物联网技术,实现招聘会的人脸识别、扫码识别进入会场;可以快速投递简历,实现人才快速匹配以及企业与应聘者的实时互动。但是该方案的主要问题太依赖于个人简历,简历的真实性、有效性无法进行评估。
专利号为201910262478.4公开了“一种校园招聘管理系统”,该专利根据简历信息,提取招聘职位的关键词和简历中关键词,并对其进行相似度计算,将第最大值进行累计求和,按照求和值的大小从招聘职位集筛选招聘职位并推送给应聘方。该专利的主要问题在于简历中提取关键词多为文本形式,但是文本存在相似度,多个相似度高的关键词分别跟职位关键词进行相似度累加求和会影响匹配结果。
发明内容
本发明的目的在于提供基于云平台的企业与高校的智能引荐系统及方法。
本发明采用的技术方案是:
基于云平台的企业与高校的智能引荐系统,其包括以下模块:
校企信息采集模块:从互联网中采集获取企业和高校的基本信息;
校企信息去重模块:基于布隆过滤器的页面去重策略对企业和高校的基本信息进行去重处理;
职位学科图谱映射模块:基于去重后的大规模的企业职位和高校学科信息根据不同的映射任务动态选择映射策略的方法实现大规模异构职位学科图谱;
匹配模块:一方面针对职位关键词词库在根据学科知识图谱数据对职位和学科进行关键词联想和聚类;另一方面综合个人简历关键词与评论语关键词与职位关键词词库进行匹配;
职位发布模块:用于企业发布招聘职位信息;
职位信息预处理模块:对职位信息数据去除噪音、去除常用词、去除区分度低词后提取职位关键词构建大规模职位关键词词库;
简历评语上传模块:用于学科专业老师上传学生的简历信息以及对应的评语;
简历关键词提取模块:提取简历关键词和评论语关键词,将关键词作为map键值对存储,key-value分别对应对学生的评价和专业词汇;判断学生投递或者接受专业老师推荐的职位历史信息;
人才测评模块:用于企业向有意向的学生进行在线测试,并对生成评分表排序后供企业使用;
推荐模块:一方面针对职位和学科的关键词联想和聚类结果为对应的企业和高校学科专业教师相互推荐;另一方面针对个人简历关键词与评论语关键词与职位关键词词库的匹配结果为对应的企业和学生相互推荐。
进一步地,职位学科图谱映射模块使用基于最小风险模型为每个可能的映射赋予一个映射风险并对全局映射风险进行优化快速求解;职位学科图谱映射模块采用双标签概率因子图模型利用多个目标属性之间的关联关系建立统一模型以提高识别精度。
进一步地,职位信息预处理模块采用TF-IDF算法去除区分度低词。
进一步地,匹配模块基于加权矩阵分解与用户近邻模型的协同过滤推荐算法达到个人简历关键词与评论语关键词与职位关键词词库精准匹配。
进一步地,简历关键词提取模块通过TF-IDF算法提取评论语关键词。
基于云平台的企业与高校的智能引荐方法,采用了基于云平台的企业与高校的智能引荐系统,方法包括以下步骤:
步骤1,分别获取企业和高校的基本信息,并基于布隆过滤器的页面去重策略进行去重处理;
步骤2,基于去重后的企业职位和高校学科信息根据不同的映射任务动态选择映射策略异构职位学科图谱;
步骤3,企业进行招聘职位信息的发布,并由系统进行去除噪音、去除常用词、去除区分度低词后提取职位关键词构建大规模职位关键词词库;
步骤4,通过职位关键词词库在根据学科知识图谱数据对职位和学科进行关键词联想和聚类,
步骤5,针对职位和学科的关键词联想和聚类结果为对应的企业和高校学科专业教师进行相互推荐,
步骤6,专业教师上传学生的个人简历和对学生的评论语,
步骤7,系统提取简历关键词和评论语关键词,将关键词作为map键值对存储,key-value分别对应对学生的评价和专业词汇,
步骤8,系统综合个人简历关键词和评论语关键词一同与职位关键词词库进行匹配,并向匹配对应的企业和学生进行相互推荐,
步骤9,对符合匹配要求的学生进行在线测试,并按测试评分高低排序由企业选择面试学生。
进一步地,步骤3中采用TF-IDF算法去除区分度低词,步骤7中通过TF-IDF算法提取评论语关键词。
进一步地,步骤4中采用word2vec的方法对职位和学科进行关键词联想和聚类。
进一步地,步骤5将职位信息推送给高校专业老师或者邀请匹配高校的专业老师发起宣讲会或者招聘会。
进一步地,步骤8中基于加权矩阵分解与用户近邻模型的协同过滤推荐。
本发明采用以上技术方案,基于SaaS云架构,硬件软件均在云端,企业高效对系统的访问不受时间地点工具的限制,只要有互联网均可以。本发明集成企业和高校的信息,构建全领域学科知识图谱,通过企业岗位关键词与学科关键词进行映射匹配,为学校智能化推荐企业岗位信息,企业可以根据推荐反馈结果,有针对性去相关学校甚至学院进行宣讲,降低招聘成本。此外本发明还提出了基于评价的个人简历智能匹配模型,能够更加准确和真实反映学生简历信息,提高匹配的真实性。
附图说明
以下结合附图和具体实施方式对本发明做进一步详细说明;
图1为本发明基于云平台的企业与高校的智能引荐系统的结构示意图;
图2为本发明基于云平台的企业与高校的智能引荐方法的流程示意图;
图3为基于布隆过滤器的页面去重策略示意图;
图4为基于Forinone轻量级分布式数据采集架构示意图;
图5为动态选择映射策略的方法RiMOM的流程示意图;
图6为双标签概率因子图模型示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
如图1至图6所示,本发明公开了基于云平台的企业与高校的智能引荐系统,其包括以下模块:
校企信息采集模块:从互联网中采集获取企业和高校的基本信息;
校企信息去重模块:基于布隆过滤器的页面去重策略对企业和高校的基本信息进行去重处理;
职位学科图谱映射模块:基于去重后的大规模的企业职位和高校学科信息根据不同的映射任务动态选择映射策略的方法实现大规模异构职位学科图谱;
匹配模块:一方面针对职位关键词词库在根据学科知识图谱数据对职位和学科进行关键词联想和聚类;另一方面综合个人简历关键词与评论语关键词与职位关键词词库进行匹配;
职位发布模块:用于企业发布招聘职位信息;
职位信息预处理模块:对职位信息数据去除噪音、去除常用词、去除区分度低词后提取职位关键词构建大规模职位关键词词库;
简历评语上传模块:用于学科专业老师上传学生的简历信息以及对应的评语;
简历关键词提取模块:提取简历关键词和评论语关键词,将关键词作为map键值对存储,key-value分别对应对学生的评价和专业词汇;判断学生投递或者接受专业老师推荐的职位历史信息;
人才测评模块:用于企业向有意向的学生进行在线测试,并对生成评分表排序后供企业使用;
推荐模块:一方面针对职位和学科的关键词联想和聚类结果为对应的企业和高校学科专业教师相互推荐;另一方面针对个人简历关键词与评论语关键词与职位关键词词库的匹配结果为对应的企业和学生相互推荐。
校企信息采集模块连接校企信息去重模块,并通过校企信息去重模块连接职位学科图谱映射模块,职位发布模块的输出端连接职位信息预处理模块,简历评语上传模块的输出端连接简历关键词提取模块,职位学科图谱映射模块、职位信息预处理模块和简历关键词提取模块分别连接匹配模块,匹配模块的输出连接推荐模块,推荐模块连接人才测评模块,推荐模块分别与企业、学科专业老师以及学生相互交互,人才测评模块分别与企业和学生相互交互。
进一步地,职位学科图谱映射模块使用基于最小风险模型为每个可能的映射赋予一个映射风险并对全局映射风险进行优化快速求解;职位学科图谱映射模块采用双标签概率因子图模型利用多个目标属性之间的关联关系建立统一模型以提高识别精度。
进一步地,职位信息预处理模块采用TF-IDF算法去除区分度低词。
进一步地,匹配模块基于加权矩阵分解与用户近邻模型的协同过滤推荐算法达到个人简历关键词与评论语关键词与职位关键词词库精准匹配。
进一步地,简历关键词提取模块通过TF-IDF算法提取评论语关键词。
基于云平台的企业与高校的智能引荐方法,采用了基于云平台的企业与高校的智能引荐系统,方法包括以下步骤:
步骤1,分别获取企业和高校的基本信息,并基于布隆过滤器的页面去重策略进行去重处理;
步骤2,基于去重后的企业职位和高校学科信息根据不同的映射任务动态选择映射策略异构职位学科图谱;
步骤3,企业进行招聘职位信息的发布,并由系统进行去除噪音、去除常用词、去除区分度低词后提取职位关键词构建大规模职位关键词词库;
步骤4,通过职位关键词词库在根据学科知识图谱数据对职位和学科进行关键词联想和聚类,
步骤5,针对职位和学科的关键词联想和聚类结果为对应的企业和高校学科专业教师进行相互推荐,
步骤6,专业教师上传学生的个人简历和对学生的评论语,
步骤7,系统提取简历关键词和评论语关键词,将关键词作为map键值对存储,key-value分别对应对学生的评价和专业词汇,
步骤8,系统综合个人简历关键词和评论语关键词一同与职位关键词词库进行匹配,并向匹配对应的企业和学生进行相互推荐,
步骤9,对符合匹配要求的学生进行在线测试,并按测试评分高低排序由企业选择面试学生。
进一步地,步骤3中采用TF-IDF算法去除区分度低词,步骤7中通过TF-IDF算法提取评论语关键词。
进一步地,步骤4中采用word2vec的方法对职位和学科进行关键词联想和聚类。
进一步地,步骤5将职位信息推送给高校专业老师或者邀请匹配高校的专业老师发起宣讲会或者招聘会。
进一步地,步骤8中基于加权矩阵分解与用户近邻模型的协同过滤推荐。
下面就本发明的具体工作原理做详细说明:
如图1所示,本发明总体上可以分为三大功能模块:
1、本发明首先需要对企业高校信息进行挖掘,为两个部分:
1-1、企业与高校信息数据采集:在数据采集的过程,去重策略是采集互联网领域专家或者研究者的核心关键问题,此流程采用基于布隆过滤器的页面去重策略,以克服传统检索去重策略随数量增长性能快速下降的问题,
如图3所示的布隆过滤器的基本原理,采用基于Forinone轻量级分布式数据采集架构,传统的基于Hadoop的分布式架构对于本课题的互联网专家智库信息采集而言过于复杂,存在API不易理解,成本高、Map/Reduce导致业务逻辑不连贯等问题。而基于Fourinone的轻量级分布式框架则简而精,保留了分布式中的精髓,非常适合企业高校这样的分布式采集问题,基于Fourinone的轻量级分布式架构.如图4所示,基于Fourinone分布式采集系统有三个角色:包工头,工人和职介所。工头负责分配任务放进仓库;工人从仓库取出任务执行;职介所负责监测工人状态。在进行分布式改造时需要实现两个核心函数分配任务giveTask()和执行任务doTask(),通过在不同机器上启动多个工人就实现了程序的分布化运行。
1-2、关联关系语义发现,构建学科知识图谱:根据大规模的职位和学科信息,根据不同的映射任务动态选择映射策略的方法RiMon,如图5所示,实现大规模异构学科知识图谱关联关系的自动发现。使用基于最小风险模型为每个可能的映射赋予一个映射风险,并对全局映射风险进行优化,给出快速求解方法。为进一步提高关联精度,提出映射策略的动态选择方法,可以针对不同关联问题自动选择关联策略,有效提高了关联精度。同时,为保证方法互补而获得更加准确丰富的关联关系信息,本发明还采用双标签概率因子图模型,利用多个目标属性之间的关联关系建立统一模型从而提高识别精度。双标签概率因子图模型如图6所示。
2、本发明另一个功能为基于评论的简历与职位智能匹配:该部分具体有课分为两部分内容:
2-1、企业职位与学校专业的智能匹配:各大企业的职位信息错综复杂,内容简短不一,职位发布标准参差不齐。首先本需要对职位信息数据进行预处理,去除噪音数据,提取职位关键词。本发明采用去除噪音、去除常用词、采用TF-IDF算法去除区分度低的词,自动提取职位关键词,构建大规模职位关键词词库。
TF-IDF可用如下公式计算:
tf(t,d,D)=tf(t,d)*idf(t,D)
其中,
去除词示例:科学研究,示范项目,新方法,体系建设,方案优化,应用成果,…
针对职位关键词词库,在根据学科知识图谱数据,采用word2vec的方法对职位和学科进行关键词联想和聚类。该方法通过计算关键词的词共现度和关键词上下文关系,计算关键词相似度,对关键词进行关联。Word2vec方法将每一个关键词转化成N维空间的词向量,之后根据两个向量在N维空间中的cosine值大小作为其相似度的衡量。
Word2vec采用的是层次化的Log-Bilinear语言模型,其中一种是CBOW模型。根据上下文预测下一个词为w_t的公式为:
p(wt|context)=p(wt|wt-k,wt-k+1,…,wt-1,wt+1,…,wt+k)
结合层次softmax算法可以进行高效的计算。
需要通过对关键词进行聚类,清晰的看出关键词之间的关联关系,本发明对关键词的聚类采用层次聚类(Agglomerative Hierarchical clustering),该方法描述如下:
输入:类数K,关键词组W
初始状态设置每一个节点(关键词)为一个类
找出当前类中相似度最高的一对,将其合并
计算当前新生成的类和其余类两两之间的相似度
查看当前类数,若当前类数小于等于K,则结束,否则循环II,III
其中,类之间的相似度算法采用Average Linkage clustering,即
节点相似度采用word2vec方法计算出的关键词相似度。
通过以上的智能匹配方式,企业端可以根据本公司职位信息智能获取匹配的高校专业信息,同时将职位信息推送给高校相关的专业老师,也可以邀请匹配高校的专业老师发起宣讲会或者招聘会,大大节省校园招聘成本,也可以提高学校冷门专业的就业率。
2-2、基于评论的简历与职位智能推荐:除此之外,本发明的亮点是专业老师可以在系统上上传学生的个人简历和对学生的评论语,系统会再次综合个人简历关键词与评论语关键词与职位关键词词库进行智能推荐。本发明提出了基于加权矩阵分解与用户近邻模型的协同过滤推荐算法,达到精准匹配,智能推荐。基于加权矩阵分解与用户近邻模型的协同过滤推荐算法主要思想:首先通过TF-IDF算法提取评论语关键词,将关键词作为map键值对存储,key-value分别对应对学生的评价(优良中差)和专业词汇(性格、态度、具体的技能等)。其次判断学生投递或者接受专业老师推荐的职位历史信息,如果无历史信息,则以评论关键词为主要加权项,如果有历史信息,则根据评论加权项,再应用用户邻近模型和矩阵分解方式来达到准确预测,该算法能有效地解决评分矩阵稀疏问题和新使用者问题,提高了求职者简历的真实度,提高了推荐精度。具体逻辑如下:
本发明中使用增量奇异值矩阵分解的方式将简历—职位评分矩阵R分解为P、Q两个矩阵的乘积,R=P×Q。S表示评论对简历与职位的加权值。这样做有两点好处:1)能够有效减少空间复杂度;2)能够提取出隐藏的k维属性,为预测矩阵缺失值(用户对物品评分的预测)提供依据。要将用户评分矩阵R分解成矩阵P和Q的乘积,本发明所使用的方法是最小化下式:
∑(rui*sui-pu*qi)2+λ1(|pu|2+|qi|2)
其中:rui为R矩阵中的第u行、第i列的已知打分值;sui是S矩阵中第U行,第i列的评论加权值;pu为用户P矩阵中的第u行;qi为物品Q矩阵中的第i行;λ1(|pu|2+|qi|2)是为避免相对数据量比较小的物品和数据过拟合现象,需要加惩罚因子来约束递归调整过程。
为了最小化上式,通过应用随机梯度下降法,得到:
Puk←puk+γ(euiqik-λ1puk)
qik←qik+γ(euipuk-λ1qik)
其中k表示f维向量中第k个值。训练过程中,首先初始化pu和qi,随机对pu,qi中的f维的向量赋值。对于一个已知的评分记录rui,计算得到误差然后对每一维都做更新。在完成20-30轮迭代更新之后,得到P、Q两个矩阵,就是所需的分解矩阵。
近邻模型是协同过滤算法中最常用的模型,它的中心思想是通过寻找k个近邻来模拟主体的行为。结合邻近模型,为了进一步提高预测准确性,本发明将矩阵分解方法也加入预测公式中,因此得到如下预测公式:
3、本发明最后一个功能为人才的在线测评功能部分:
学生收到推荐岗位后,进行反馈,企业收到反馈信息后,对有意向的学生进行在线测试,在系统生成评分表,企业根据系统生成的评分高低,选择合适的应届生批量进行面试。极大的简化招聘流程,提高招聘效率。
本发明采用以上技术方案,提出了基于云平台的企业与高校招聘模式,构建学科领域知识图谱,根据企业职位关键词词库智能匹配学校学科信息,实现企业与高校的连接网,提出了基于评论的简历智能匹配,以评论为加权值,提出基于加权矩阵分解与用户近邻模型的协同过滤推荐算法。本发明具有以下有益效果:1、企业与高校的云招聘系统,紧固了企业与高校的关系,使得企业和高校能够全面的互相了解,增强合作,避免社会不良机构的混入。2、基于评论的简历与职位智能匹配,提出基于加权矩阵分解与用户近邻模型的协同过滤推荐算法,一方面提升了简历的真实性,一方面能够从毕业生角度,为毕业提供就业方向参考,增强毕业生的社会认知,另外一方面提高了职位与简历的更加高推荐精度,达到高效、精准推送,为企业找到满意合适的人才。3、企业职位与学科知识图谱的智能匹配,在校园招聘环节,可以快速定位企业所需要的学校专业分布,有针对性的进行校园宣讲会或者招聘会,提升了招聘效率,降低了招聘成本,同时对学校而言,提高了冷门专业的就业率。
本发明基于SaaS云架构,硬件软件均在云端,企业高效对系统的访问不受时间地点工具的限制,只要有互联网均可以。本发明集成企业和高校的信息,构建全领域学科知识图谱,通过企业岗位关键词与学科关键词进行映射匹配,为学校智能化推荐企业岗位信息,企业可以根据推荐反馈结果,有针对性去相关学校甚至学院进行宣讲,降低招聘成本。此外本发明还提出了基于评价的个人简历智能匹配模型,能够更加准确和真实反映学生简历信息,提高匹配的真实性。
Claims (10)
1.基于云平台的企业与高校的智能引荐方法,其特征在于:方法包括以下步骤:
步骤1,分别获取企业和高校的基本信息,并基于布隆过滤器的页面去重策略进行去重处理;
步骤2,基于去重后的企业职位和高校学科信息根据不同的映射任务动态选择映射策略异构职位学科图谱;
步骤3,企业通过云平台进行招聘职位信息的发布,并由云平台系统进行去除噪音、去除常用词、去除区分度低词后提取职位关键词构建大规模职位关键词词库;
步骤4,通过职位关键词词库在根据学科知识图谱数据对职位和学科进行关键词联想和聚类,
步骤5,针对职位和学科的关键词联想和聚类结果为对应的企业和高校学科专业教师进行相互推荐,
步骤6,专业教师上传学生的个人简历和对学生的评论语,
步骤7,系统提取简历关键词和评论语关键词,将关键词作为map键值对存储,key-value分别对应对学生的评价和专业词汇,
步骤8,系统综合个人简历关键词和评论语关键词一同与职位关键词词库进行匹配,并向匹配对应的企业和学生进行相互推荐,
步骤9,对符合匹配要求的学生进行在线测试,并按测试评分高低排序由企业选择面试学生。
2.根据权利要求1所述的基于云平台的企业与高校的智能引荐方法,其特征在于:步骤3中采用TF-IDF算法去除区分度低词,步骤7中通过TF-IDF算法提取评论语关键词。
3.根据权利要求1所述的基于云平台的企业与高校的智能引荐方法,其特征在于:步骤4中采用word2vec的方法对职位和学科进行关键词联想和聚类。
4.根据权利要求1所述的基于云平台的企业与高校的智能引荐方法,其特征在于:步骤5将职位信息推送给高校专业老师或者邀请匹配高校的专业老师发起宣讲会或者招聘会。
5.根据权利要求1所述的基于云平台的企业与高校的智能引荐方法,其特征在于:步骤8中基于加权矩阵分解与用户近邻模型的协同过滤推荐。
6.基于云平台的企业与高校的智能引荐系统,采用了权利要求1至5之一所述的基于云平台的企业与高校的智能引荐方法,其特征在于:系统包括以下模块:
校企信息采集模块:从互联网中采集获取企业和高校的基本信息;
校企信息去重模块:基于布隆过滤器的页面去重策略对企业和高校的基本信息进行去重处理;
职位学科图谱映射模块:基于去重后的大规模的企业职位和高校学科信息根据不同的映射任务动态选择映射策略的方法实现大规模异构职位学科图谱;
职位发布模块:用于企业发布招聘职位信息;
职位信息预处理模块:对职位信息数据去除噪音、去除常用词、去除区分度低词后提取职位关键词构建大规模职位关键词词库;
简历评语上传模块:用于学科专业老师上传学生的简历信息以及对应的评语;
简历关键词提取模块:提取简历关键词和评论语关键词,将关键词作为map键值对存储,key-value分别对应对学生的评价和专业词汇;判断学生投递或者接受专业老师推荐的职位历史信息;
匹配模块:一方面针对职位关键词词库在根据学科知识图谱数据对职位和学科进行关键词联想和聚类;另一方面综合个人简历关键词与评论语关键词与职位关键词词库进行匹配;
人才测评模块:用于企业向有意向的学生进行在线测试,并对生成评分表排序后供企业使用;
推荐模块:一方面针对职位和学科的关键词联想和聚类结果为对应的企业和高校学科专业教师相互推荐;另一方面针对个人简历关键词与评论语关键词与职位关键词词库的匹配结果为对应的企业和学生相互推荐。
7.根据权利要求6所述的基于云平台的企业与高校的智能引荐系统,其特征在于:职位学科图谱映射模块使用基于最小风险模型为每个可能的映射赋予一个映射风险并对全局映射风险进行优化快速求解;职位学科图谱映射模块采用双标签概率因子图模型利用多个目标属性之间的关联关系建立统一模型以提高识别精度。
8.根据权利要求6所述的基于云平台的企业与高校的智能引荐系统,其特征在于:职位信息预处理模块采用TF-IDF算法去除区分度低词。
9.根据权利要求6所述的基于云平台的企业与高校的智能引荐系统,其特征在于:匹配模块基于加权矩阵分解与用户近邻模型的协同过滤推荐算法达到个人简历关键词与评论语关键词与职位关键词词库精准匹配。
10.根据权利要求6所述的基于云平台的企业与高校的智能引荐系统,其特征在于:简历关键词提取模块通过TF-IDF算法提取评论语关键词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010023218.4A CN111241361B (zh) | 2020-01-09 | 2020-01-09 | 基于云平台的企业与高校的智能引荐系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010023218.4A CN111241361B (zh) | 2020-01-09 | 2020-01-09 | 基于云平台的企业与高校的智能引荐系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111241361A true CN111241361A (zh) | 2020-06-05 |
CN111241361B CN111241361B (zh) | 2022-07-15 |
Family
ID=70866297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010023218.4A Active CN111241361B (zh) | 2020-01-09 | 2020-01-09 | 基于云平台的企业与高校的智能引荐系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111241361B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111694961A (zh) * | 2020-06-23 | 2020-09-22 | 上海观安信息技术股份有限公司 | 一种用于敏感数据泄露检测的关键词语义分类方法与系统 |
CN111754109A (zh) * | 2020-06-23 | 2020-10-09 | 重庆电子工程职业学院 | 一种毕业生就业管理系统 |
CN112132536A (zh) * | 2020-08-31 | 2020-12-25 | 三盟科技股份有限公司 | 一种岗位推荐方法、系统、计算机设备及存储介质 |
CN113221000A (zh) * | 2021-05-17 | 2021-08-06 | 上海博亦信息科技有限公司 | 一种人才数据智能检索及推荐方法 |
CN113240562A (zh) * | 2021-05-27 | 2021-08-10 | 南通大学 | 一种基于nlp的产学研项目推荐匹配方法与系统 |
CN114969273A (zh) * | 2022-07-28 | 2022-08-30 | 广州宏途数字科技有限公司 | 一种高考专业推荐方法、装置、设备及存储介质 |
CN116402046A (zh) * | 2023-06-09 | 2023-07-07 | 电子科技大学成都学院 | 基于招聘信息的岗位词条构建方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070042329A1 (en) * | 2005-08-18 | 2007-02-22 | Diane Curtin | Personal organizer method and system |
WO2014177951A2 (en) * | 2013-04-29 | 2014-11-06 | Choppla Gulshan Prem | Student, teacher, administrative and research coordinating helper |
CN108897887A (zh) * | 2018-07-10 | 2018-11-27 | 华南师范大学 | 一种基于知识图谱和用户相似度的教学资源推荐方法 |
CN108920544A (zh) * | 2018-06-13 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化职位推荐方法 |
CN110399475A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 基于人工智能的简历匹配方法、装置、设备及存储介质 |
-
2020
- 2020-01-09 CN CN202010023218.4A patent/CN111241361B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070042329A1 (en) * | 2005-08-18 | 2007-02-22 | Diane Curtin | Personal organizer method and system |
WO2014177951A2 (en) * | 2013-04-29 | 2014-11-06 | Choppla Gulshan Prem | Student, teacher, administrative and research coordinating helper |
CN108920544A (zh) * | 2018-06-13 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化职位推荐方法 |
CN108897887A (zh) * | 2018-07-10 | 2018-11-27 | 华南师范大学 | 一种基于知识图谱和用户相似度的教学资源推荐方法 |
CN110399475A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 基于人工智能的简历匹配方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
黄耿生 等: "基于深度学习的就业推荐系统研究", 《软件研发与应用》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111694961A (zh) * | 2020-06-23 | 2020-09-22 | 上海观安信息技术股份有限公司 | 一种用于敏感数据泄露检测的关键词语义分类方法与系统 |
CN111754109A (zh) * | 2020-06-23 | 2020-10-09 | 重庆电子工程职业学院 | 一种毕业生就业管理系统 |
CN112132536A (zh) * | 2020-08-31 | 2020-12-25 | 三盟科技股份有限公司 | 一种岗位推荐方法、系统、计算机设备及存储介质 |
CN113221000A (zh) * | 2021-05-17 | 2021-08-06 | 上海博亦信息科技有限公司 | 一种人才数据智能检索及推荐方法 |
CN113221000B (zh) * | 2021-05-17 | 2023-02-28 | 上海博亦信息科技有限公司 | 一种人才数据智能检索及推荐方法 |
CN113240562A (zh) * | 2021-05-27 | 2021-08-10 | 南通大学 | 一种基于nlp的产学研项目推荐匹配方法与系统 |
CN114969273A (zh) * | 2022-07-28 | 2022-08-30 | 广州宏途数字科技有限公司 | 一种高考专业推荐方法、装置、设备及存储介质 |
CN114969273B (zh) * | 2022-07-28 | 2022-11-15 | 广州宏途数字科技有限公司 | 一种高考专业推荐方法、装置、设备及存储介质 |
CN116402046A (zh) * | 2023-06-09 | 2023-07-07 | 电子科技大学成都学院 | 基于招聘信息的岗位词条构建方法 |
CN116402046B (zh) * | 2023-06-09 | 2023-08-18 | 电子科技大学成都学院 | 基于招聘信息的岗位词条构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111241361B (zh) | 2022-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111241361B (zh) | 基于云平台的企业与高校的智能引荐系统及方法 | |
CN111737495B (zh) | 基于领域自分类的中高端人才智能推荐系统及其方法 | |
Rao et al. | Learning to ask good questions: Ranking clarification questions using neural expected value of perfect information | |
Neculoiu et al. | Learning text similarity with siamese recurrent networks | |
CN107562836B (zh) | 基于主题模型和机器学习的回答者推荐方法 | |
CN115564393B (zh) | 一种基于招聘需求相似度的职位推荐方法 | |
Adeyemo et al. | Effects of normalization techniques on logistic regression in data science | |
Sugiharti et al. | ON-LINE CLUSTERING OF LECTURERS PERFORMANCE OF COMPUTER SCIENCE DEPARTMENT OF SEMARANG STATE UNIVERSITY USING K-MEANSALGORITHM. | |
CN113723853A (zh) | 岗位胜任力需求数据处理方法及装置 | |
CN114186983A (zh) | 视频面试多维评分方法、系统、计算机设备及存储介质 | |
Athukorala et al. | Business intelligence assistant for human resource management for IT companies | |
CN111241251A (zh) | 一种计算机差异化辅助教学分析系统 | |
Chu et al. | Distribution of Large‐Scale English Test Scores Based on Data Mining | |
Kim et al. | Summarizing Students’ Free Responses for an Introductory Algebra-Based Physics Course Survey Using Cluster and Sentiment Analysis | |
Blšták | Automatic Question Generation Based on Sentence Structure Analysis. | |
Orozova et al. | How to follow modern trends in courses in “databases”-introduction of data mining techniques by example | |
Karbasian et al. | Keeping curriculum relevant: Identifying longitudinal shifts in computer science topics through analysis of Q&A communities | |
Pichugin et al. | The model of informative ordering in the analysis of socio-psychological processes | |
Santhanavijayan et al. | Fuzzy-MCS algorithm-based ontology generation for e-assessment | |
Wu et al. | Digital Management of Teaching Cases in Colleges and Universities Based on Cluster Analysis. | |
Albano et al. | Managing Large Multiple-choice Test Items Repositories | |
Liu et al. | Comparing Machine Learning Algorithms to Predict Topic Keywords of Student Comments | |
Peng et al. | Establishment of big data application platform for education industry | |
Qbadou et al. | Towards an educational recommendation system based on big data techniques-case of Hadoop | |
Ngo et al. | Exploration and integration of job portals in Vietnam |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |