CN112528158B - 课程推荐方法、装置、设备及存储介质 - Google Patents

课程推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112528158B
CN112528158B CN202011553894.9A CN202011553894A CN112528158B CN 112528158 B CN112528158 B CN 112528158B CN 202011553894 A CN202011553894 A CN 202011553894A CN 112528158 B CN112528158 B CN 112528158B
Authority
CN
China
Prior art keywords
course
courses
staff
recommended
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011553894.9A
Other languages
English (en)
Other versions
CN112528158A (zh
Inventor
仲敏
张虎
张琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011553894.9A priority Critical patent/CN112528158B/zh
Publication of CN112528158A publication Critical patent/CN112528158A/zh
Application granted granted Critical
Publication of CN112528158B publication Critical patent/CN112528158B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种课程推荐方法、装置、设备及存储介质,涉及人工智能技术领域,进一步深度学习技术。具体实现方案为:根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值;根据所述至少两个课程在工作序列分布上的熵值,从所述至少两个课程中滤除无关课程;根据滤除后的课程,向员工进行课程推荐。解决了现有课程推荐方法无法识别点击率高但无专业知识的课程,进而导致课程推荐效果差的问题,能够向员工推荐专业知识课程,进而提升了用户体验。

Description

课程推荐方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及人工智能技术,具体涉及一种课程推荐方法、装置、设备及存储介质。
背景技术
随着计算机技术的发展,企业为帮助员工成长,开发线程课程平台,平台收录各种视频课程,比如内部讲师录制课程、外部付费专业课程、全员培训课程、部门大会等课程。然而现有课程推荐方法,对于高点击率但没有专业知识的课程(比如全员培训课程),无法识别,推荐的概率大,导致推荐效果差,亟需改进。
发明内容
本公开提供了一种课程推荐方法、装置、设备及存储介质。
根据本公开的一方面,提供了一种课程推荐方法,该方法包括:
根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值;
根据所述至少两个课程在工作序列分布上的熵值,从所述至少两个课程中滤除无关课程;
根据滤除后的课程,向员工进行课程推荐。
根据本公开的另一方面,提供了一种课程推荐装置,该装置包括:
熵值确定模块,用于根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值;
课程滤除模块,用于根据所述至少两个课程在工作序列分布上的熵值,从所述至少两个课程中滤除无关课程;
课程推荐模块,用于根据滤除后的课程,向员工进行课程推荐。
根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任一实施例所述的课程推荐方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本申请任一实施例所述的课程推荐方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本申请任一实施例所述的课程推荐方法。
根据本申请的技术解决了现有课程推荐方法无法识别点击率高但无专业知识的课程,进而导致课程推荐效果差的问题,能够向员工推荐专业知识课程,进而提升了用户体验。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例提供的一种课程推荐方法的流程图;
图2是根据本申请实施例提供的另一种课程推荐方法的流程图;
图3是根据本申请实施例提供的又一种课程推荐方法的流程图;
图4是根据本申请实施例提供的又一种课程推荐方法的流程图;
图5A是根据本申请实施例提供的再一种课程推荐方法的流程图;
图5B是根据本申请实施例提供的一种课程推荐系统的示意图;
图6是根据本申请实施例提供的一种课程推荐装置的结构示意图;
图7是用来实现本申请实施例的课程推荐方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请实施例提供的一种课程推荐方法的流程图。本申请实施例适用于如何进行课程推荐的情况,尤其适用于在企业环境下,如何向员工推荐专业知识的课程的情况。该实施例可以由课程推荐装置来执行,该装置可以采用软件和/或硬件来实现,并可集成于承载课程推荐功能的电子设备中,如服务器中。如图1所示,该方法包括:
S101,根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值。
本实施例中,历史课程观看记录为执行本次课程推荐之前,所统计的所有员工观看课程的记录。在保证能够精准地确定每个课程在工作序列分布上的熵值的情况下,为降低计算复杂度,进一步的,历史课程观看记录为执行本次课程推荐之前,所统计的一定时间内所有员工观看课程的记录。历史课程观看记录至少包括观看课程的员工姓名、员工所在工作序列、课程观看时间、课程观看时长、以及观看的课程名称等。所谓工作序列为工作方向,包括但不限于产品、开发、设计等;对于每个工作序列,该工作序列的人员数量即为该工作序列所包括的员工的总人数。
需要说明的是,本实施例通过对历史课程观看记录进行数据探查,能够确定对于无专业知识性的课程,如安全培训会录制课程和部门大会录制课程等在不同工作序列的学习人数较多,即这些课程具有工作序列无差异性和职级无差异性等特性;进而基于无专业知识的课程的特性,引入工作序列进行熵值计算,以进行课程过滤。
可选的,可以对历史课程观看记录和每个工作序列的人员数量进行统计分析,在能够消除工作序列的差异性和课程的差异性等不确定因素的情况下,确定每个工作序列在每个课程上的概率分布;进而基于信息熵计算公式,根据每个工作序列在每个课程上的概率分布,确定每个课程在工作序列分布上的熵值。
S102,根据至少两个课程在工作序列分布上的熵值,从至少两个课程中滤除无关课程。
本实施例中,所谓无关课程为缺少专业知识性的课程,如安全培训会录制课程和部门大会录制课程等。熵值可用于表征各个工作序列在课程上的混乱程度,也就是说,各个工作序列观看课程的情况。可选的,课程在工作序列分布上的熵值越大,则说明各个工作序列在该课程上的观看人数越多,也就是说对于该课程在各个工作序列上是无差异的。
具体的,本实施例可以按照课程在工作序列分布上的熵值,对课程进行降序排序,之后可以根据排序结果和设定阈值,对至少两个课程进行过滤,以滤除至少两个课程中的无关课程。可选的,可以根据排序结果,将熵值大于设定阈值的课程滤除。其中,设定阈值是预先根据实际场景设定的,可灵活调整。
需要说明的是,本实施例通过引入熵值对课程质量进行评估,对于无关课程在推荐时进行滤除,为后续针对性的向员工推荐专业课程奠定了基础。此外,本实施例通过熵值可准确识别无关课程,为无关课程识别提供了一种新思路。
S103,根据滤除后的课程,向员工进行课程推荐。
具体的,对于企业的每一员工,在从至少两个课程中滤除无关课程之后,可以基于设定的课程推荐规则,从滤除后的课程中选择向该员工推荐的目标推荐课程,之后,向该员工推荐目标推荐课程。其中,设定的课程推荐规则是预先设定能够针对性的向员工推荐课程的规则。例如,设定的课程推荐规则包括根据工作序列进行课程推荐,进而可以根据与该员工位于同一工作序列的其他员工已观看过的课程,从滤除后的课程中确定向该员工推荐的目标推荐课程,并向该员工推荐目标推荐课程。
本申请实施例的技术方案,通过对历史课程观看记录和至少两个工作序列的人员数量进行统计分析,引入熵值对课程质量进行评估,对于无关课程在推荐时进行滤除,为后续针对性的向员工推荐专业课程奠定了基础。解决了现有课程推荐方法无法识别点击率高但无专业知识的课程,进而导致课程推荐效果差的问题,能够向员工推荐专业知识课程,进而提升了用户体验。
图2是根据本申请实施例提供的另一种课程推荐方法的流程图。本申请实施例在上述实施例的基础上,进一步对如何确定至少两个课程在工作序列分布上的熵值进行解释说明。如图2所示,该方法包括:
S201,根据历史课程观看记录,确定每个工作序列在每个课程的观看人数。
本实施例中,对于每个工作序列,该工作序列中观看每个课程的员工数量即为该工作序列在每个课程的观看人数。
具体的,可以对历史课程观看记录进行统计分析,以确定每个工作序列在每个课程的观看人数;还可以将历史课程观看记录输入预先训练好的数量统计模型,得到每个工作序列在每个课程的观看人数。
S202,根据每个工作序列在每个课程的观看人数和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值。
可选的,为了能够消除工作序列的差异性和课程的差异性等不确定因素的影响,可以根据每个工作序列在每个课程上的观看人数和每个工作序列的人员数量,确定每个工作序列在每个课程上的归一占比;根据每个工作序列在每个课程上的归一占比,确定每个工作序列在每个课程上的概率分布;基于信息熵计算公式,根据每个工作序列在每个课程上的概率分布,确定每个课程在工作序列分布上的熵值。
作为本申请实施例的一种可选方式,根据每个工作序列在每个课程的观看人数和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值可以通过如下步骤确定:
步骤A、根据每个工作序列在每个课程的观看人数和至少两个工作序列的人员数量,确定每个工作序列在每个课程上的人员占比;
具体的,对于每个工作序列在任一课程上的人员占比可以通过该工作序列在该课程的观看人数与该工作序列的人员数量之间的比值确定。例如,目前有三个工作序列,有三个课程。通过对历史课程观看记录进行统计分析,可以确定每个工作序列在每个课程的观看人数,若以工作序列为行,每个课程为列,每个工作序列在每个课程的观看人数如下表1所示,其中,aij表示第i个工作序列在j课程的观看人数,i取值为1、2和3,j取值为1、2和3;例如,a11表示工作序列1在课程1的观看人数。
之后,采用aij/Si可以确定Pij,即第i个工作序列在j课程上的人员占比,其中,Si表示第i个工作序列的人员数量;例如,若工作序列1的人员数量为S1,则工作序列1在课程1上的人员占比P11可以表示为a11/S1。具体的,每个工作序列在每个课程上的人员占比如表2所示。
表1每个工作序列在每个课程的观看人数统计表
表2每个工作序列在每个课程上的人员占比统计表
需要说明的是,由于每个工作序列的人员数量不同,本实施例采用人员占比能够消除工作序列人员数量差异所带来的影响。
步骤B:根据每个工作序列在每个课程上的人员占比,确定每个课程在每个工作序列上的归一占比;
可选的,考虑到每个课程发布时间的差异性,引入每个课程在每个工作序列上的归一占比,使具体某个课程发布时间对每个工作序列而言是一致的,以此来消除课程发布时间影响因素。
具体的,对于每个课程在任一工作序列上的归一占比可以通过该工作序列在该课程上的人员占比,与所有工作序列在该课程上的人员占比之和之间的比值确定。可选的,采用可以确定qij,即第j课程在第i个工作序列上的归一占比。例如,课程1在工作序列1上的归一占比q11可以表示为P11/(P11+P21+P31)。具体的,每个课程在每个工作序列上的归一占比如表3所示。
表3每个课程在每个工作序列上的归一占比统计表
步骤C:根据每个课程在每个工作序列上的归一占比,确定每个工作序列在每个课程上的归一占比;
可选的,考虑到每个工作序列的学习花费时间不同,引入每个工作序列在每个课程上的归一占比,以此消除学习花费时间差异性带来的影响。
具体的,对于每个工作序列在任一课程上的归一占比可以通过该课程在该工作序列上的归一占比,与所有课程在该工作序列上的归一占比之和之间的比值确定。可选的,采用可以确定Rij,即第i个工作序列在第j个课程上的归一占比。例如,工作序列1在课程1上的归一占比R11可以表示为q11/(q11+q12+q13)。具体的,每个工作序列在每个课程上的归一占比如表4所示。
表4每个工作序列在每个课程上的归一占比统计表
步骤D:根据每个工作序列在每个课程上的归一占比,确定至少两个课程在工作序列分布上的熵值。
可选的,可以根据每个工作序列在每个课程上的归一占比,确定每个工作序列在每个课程上的概率分布;基于信息熵计算公式,根据每个工作序列在每个课程上的概率分布,确定每个课程在工作序列分布上的熵值。
以课程1在工作序列分布上的熵值为例进行说明。工作序列1在课程1上的概率分布可以表示为P序1课1=R11/(R11+R21+R31),同理工作序列2在课程1上的概率分布可以表示为P序2课1=R21/(R11+R21+R31),工作序列3在课程1上的概率分布可以表示为P序3课1=R31/(R11+R21+R31);基于信息熵计算公式,可以确定课程1在工作序列分布上的熵值H(课1)为-P序1课1*logP序1课1-P序2课1*log P序2课1-P序3课1log P序3课1
S203,根据至少两个课程在工作序列分布上的熵值,从至少两个课程中滤除无关课程。
S204,根据滤除后的课程,向员工进行课程推荐。
本申请实施例的技术方案,通过对每个工作序列在每个课程的观看人数和至少两个工作序列的人员数量进行统计分析,能够在消除工作序列的差异性和课程的差异性等不确定因素影响的情况下,确定至少两个课程在工作序列分布上的熵值,为熵值的确定提供了一种新思路;之后基于熵值滤除无关课程,并基于滤除后的课程向员工进行课程推荐,解决了现有课程推荐方法无法识别点击率高但无专业知识的课程,进而导致课程推荐效果差的问题,能够向员工推荐专业知识课程,进而提升了用户体验。
图3是根据本申请实施例提供的又一种课程推荐方法的流程图。本申请实施例在上述实施例的基础上,进一步对如何根据滤除后的课程,向员工进行课程推荐进行解释说明。如图3所示,该方法包括:
S301,根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值。
S302,根据至少两个课程在工作序列分布上的熵值,从至少两个课程中滤除无关课程。
S303,根据员工关系、员工画像、课程关系和课程画像中的至少一项,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程。
本实施例中,员工关系用于表征员工之间的相似程度。可选的,可以从企业内部数据库中获取员工的协同关系数据,之后根据员工的协同关系数据,确定员工关系。其中,员工的协同关系数据包括员工之间交互的相关数据,具体可以包括员工之间沟通数据、收发邮件数据等。示例性的,可以根据员工的协同关系数据构建协同网络;根据协同网络,结合node2vec模型和word2vec模型,得到每个员工的员工协同特征;根据员工协同特征之间的余弦相似度,确定员工关系。其中,根据协同网络,结合node2vec模型和word2vec模型,得到每个员工的员工协同特征具体可以是基于node2vec模型,得到每个员工的员工序列;将每个员工的员工序列输入word2vec模型,得到每个员工的员工协同特征。进一步的,为了降低计算复杂度,在得到每个员工的员工协同特征之后,可以将每个员工的员工协同特征输入faiss模型,进而得到员工关系。本实施例中,任一员工的员工协同特征均可用向量进行表征,具体可以用于描述该员工与其他员工之间的交互关系。
员工画像由至少一种内容标签构成,用于直观描述员工的特征。可选的,本实施例中,对于每个员工,可以根据该员工的基础数据和技能数据,构建该员工的员工画像。其中,员工的基础数据即为员工的基本属性数据,包括但不限于员工所在工作序列、工龄、司龄、年龄、职级等;员工的技能数据包括员工擅长的技术数据和/或员工从事工作的技术数据等。具体的,对于每个员工,可以对该员工的基础数据和技能数据进行建模分析,以得到该员工的员工画像。进一步的,本实施例中,每个员工的员工画像中内容标签包括基础标签(如工作序列标签)和技能标签等。
进一步的,本实施例中的课程画像由至少一种内容标签构成,用于直观描述课程的特征。可选的,对于每个过滤后的课程,可以根据该课程的课程文本内容,构建该课程的课程画像。具体的,可以对该课程的课程文本内容进行建模分析,以得到该课程的课程画像。进一步的,本实施例中,每个课程的课程画像中内容标签包括技能标签和基础标签(如课程名称标签、课程发布时间标签等)等。
课程关系用于表征课程之间的相似程度。可选的,可以根据历史课程观看记录和滤除后的课程的课程相关数据,确定课程关系。进一步的,根据历史课程观看记录和滤除后的课程的课程文本内容,确定课程关系。具体的,可以根据历史课程观看记录和滤除后的课程的课程文本内容,确定滤除后的每个课程的课程特征;根据课程特征之间的距离,确定课程关系。其中,任一过滤后的课程的课程特征均可以用向量进行表征,进而课程特征之间的距离可以采用课程特征之间的余弦相似度来表征。
可选的,本实施例通过对历史课程观看记录进行统计分析,可以确定每个员工与课程之间的关系,其中,员工与课程之间的关系可用于表征员工观看课程的行为。进一步的,员工与课程之间的关系至少包括员工标识和员工已观看课程的课程标识。其中,员工标识为唯一识别员工身份的标识符,可以是员工ID、员工的工号等;课程标识为唯一识别课程的标识符,可以是课程ID、课程编号等。为了提高向员工推荐课程的精确度,示例性的,本实施例中将员工历史观看课程的时长小于设定时长的观看记录视为异常观看记录,在确定每个员工与课程之间的关系时,从历史课程观看记录中滤除异常观看记录,并采用滤除后的历史课程观看记录来确定每个员工与课程之间的关系。也就是说,若某个员工历史观看课程1的时长小于设定时长(比如15分钟),则该员工与课程之间的关系中不包括课程1的课程标识。
具体的,在确定员工关系、员工画像、课程关系、课程画像以及员工与课程之间的关系之后,可以根据员工关系、员工画像、课程关系和课程画像中的至少一项,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程。其中,候选推荐课程的数量小于滤除后的课程的数量,且候选推荐课程包括一个或多个滤除后的课程;进一步的,本实施例中,候选推荐课程包括至少两个滤除后的课程。
例如,可以根据课程关系,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程。具体可以是,对于每个员工,可以根据该员工与课程之间的关系,确定该员工的已观看课程;根据课程关系,确定与该员工的已观看课程相似的课程;根据与该员工的已观看课程相似的课程和滤除后的课程确定候选推荐课程。或者可以根据该员工的已观看课程和滤除后的课程,确定该员工的未观看课程;根据课程关系,从该员工的未观看课程中确定候选推荐课程。
又如,可以根据员工关系,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程。具体可以是,对于每个员工,可以根据该员工与课程之间的关系,确定该员工的已观看课程;根据员工关系,确定与该员工相似的员工;根据与该员工相似的员工的已观看课程、该员工的已观看课程和滤除后的课程,确定候选推荐课程。
或者,还可以根据员工画像或课程画像,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程。
进一步的,为了能够准确地确定候选推荐课程,还可以根据员工关系、员工画像、课程关系和课程画像中的至少两项,从滤除后的课程中确定候选推荐课程。例如,可以根据课程关系和员工关系,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程。具体的,对于每个员工,可以根据课程关系,以及员工与课程之间的关系,从滤除后的课程中确定第一候选推荐课程;同时根据员工关系,以及员工与课程之间的关系,从滤除后的课程中确定第二候选推荐课程;之后,根据所确定的两个候选推荐课程,确定最终的候选推荐课程。例如,可以将两个候选推荐课程中共有的课程作为最终的候选推荐课程;或者可以根据设定的最大课程推荐数量,从两个候选推荐课程中确定最终的候选推荐课程等。
S304,基于排序模型,从候选推荐课程中确定目标推荐课程。
本实施例中,排序模型是预先采用样本对机器学习模型进行训练得到的。可选的,目标推荐课程的数量小于或等于候选推荐课程的数量;优选的,本实施例中的目标推荐课程的数量小于候选推荐课程的数量。
具体的,对于每个员工,在确定该员工的候选推荐课程之后,可以将该员工的候选推荐课程输入至排序模型,得到该员工的目标推荐课程。为了降低计算复杂度,可以将所有员工的候选推荐课程一并输入排序模型,进而可同时得到所有员工的目标推荐课程。
需要说明的是,本实施例采用两层次的递进筛选方式,从滤除后的课程中选择出目标推荐课程,不仅提高了所选出的目标推荐课程的准确度,而且降低了排序模型计算的复杂度。
S305,向员工推荐目标推荐课程。
对于每个员工,在确定向该员工推荐的目标推荐课程之后,可以向该员工推荐目标推荐课程,以供该员工进行点击观看。
本申请实施例的技术方案,通过引入员工关系、员工画像、课程关系、课程画像、以及员工与课程之间的关系等不同维度数据,进行综合分析,能够准确从滤除后的课程中选择出候选推荐课程,为后续针对性地向员工推荐课程奠定了基础;并引入人工智能技术如排序模型,从候选推荐课程中选择目标推荐课程,极大了提高了向员工推荐课程的精度,为针对性、快速、精准地向员工推荐课程提供了一种新思路。
可选的,作为本申请实施例的一种可选方式,根据历史课程观看记录和滤除后的课程的课程文本内容,确定课程关系可以通过如下步骤确定:
步骤1:根据滤除后的课程的课程文本内容,确定滤除后的课程的课程内容特征;
可选的,对于每个过滤后的课程,可以根据该课程的课程文本内容,采用word2vec,确定该课程的课程内容特征。其中,课程内容特征可以用向量来表征,具体可以用来描述课程内容的整体特征。
步骤2:根据历史课程观看记录和滤除后的课程,构建员工的课程集合;其中,每个课程集合中包括至少一个滤除后的课程;
为了提高向员工推荐课程的精确度,示例性的,本实施例中将员工历史观看课程的时长小于设定时长的观看记录视为异常观看记录。可选的,从历史课程观看记录中滤除异常观看记录,根据滤除后的历史观看记录确定每个员工与课程之间的关系,根据每个员工与课程之间的关系和滤除后的课程,可以为每个员工构建一个课程集合。进一步的,对于每个员工,可以根据该员工与课程之间的关系,确定该员工的已观看课程;根据该员工的已观看课程和滤除后的课程,确定该员工的目标观看课程;根据该员工历史观看每个目标观看课程的时间,确定每个目标观看课程的观看顺序;根据该员工的目标观看课程和观看顺序,构建该员工的课程集合。可以理解的是,员工的已观看课程中可能包括无关课程,为了能够向员工推荐专业知识课程,本实施例根据滤除后的课程和员工的已观看课程,确定员工的目标观看课程,以滤除无关课程对推荐结果的影响。本实施例中,员工的目标观看课程即为从员工的已观看课程中滤除无关课程所剩余的课程。
步骤3:根据员工的课程集合,确定滤除后的课程的课程行为特征;
具体的,在为每个员工构建一个课程集合之后,可以将所有员工的课程结合输入至word2vec,得到每个滤除后的课程的课程行为特征。可选的,本实施例中,课程行为特征可以用向量来表征,具体可以用来描述课程在人的行为上的特征。
需要说明的是,考虑到人观看课程从易到难的逻辑思维,本实施例引入员工的课程集合,并基于员工的课程集合构建课程行为特征,进而使课程行为特征中包含课程递进关系,为后续针对性的向员工推荐课程奠定了基础。
步骤4:根据课程内容特征和课程行为特征,确定滤除后的课程的课程特征;
具体的,对于每一滤除后的课程,可以按照设定格式,将该滤除后的课程的课程内容特征和课程行为特征进行拼接,得到该滤除后的课程的课程特征。
步骤5:根据课程特征之间的距离,确定课程关系。
可选的,任一过滤后的课程的课程特征均可以用向量进行表征,进而课程特征之间的距离可以采用课程特征之间的余弦相似度来表征。
具体的,对于任一过滤后的课程,可以计算该过滤后的课程的课程特征,与每一其他过滤后的课程特征之间的余弦相似度,根据计算结果和设定相似度值,确定该过滤后的课程与每一其他过滤后的课程之间的关系。
需要说明的是,本实施例通过结合课程文本内容和课程集合,确定课程特征,使所确定的课程特征所包含特征丰富,为后续基于课程关系针对性的向员工推荐课程奠定了基础。此外,由于课程关系基于课程特征确定,课程特征中包括课程内容特征和可用于表征课程递进关系的课程行为特征,进而在基于课程关系向员工推荐课程时,不仅可以针对内容相似性进行推荐,还可以针对课程知识的递进性进行推进。例如,有三个课程,课程难度从课程1、课程2和课程3依次递增,进而在员工A历史观看过课程1的情况下,基于课程关系,可以向该员工推荐课程2。
图4是根据本申请实施例提供的又一种课程推荐方法的流程图。本申请实施例在上述实施例的基础上,进一步对如何根据滤除后的课程,向员工进行课程推荐进行解释说明。如图4所示,该方法包括:
S401,根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值。
S402,根据至少两个课程在工作序列分布上的熵值,从至少两个课程中滤除无关课程。
S403,根据待推荐员工与课程之间的关系,从滤除后的课程中确定待推荐员工的未观看课程。
本实施例中,每个员工均可以作为待推荐员工,进一步的,每个员工可以依次或一并作为待推荐员工。可选的,对于每个待推荐员工,可以根据该待推荐员工与课程之间的关系,确定该待推荐员工的已观看课程;根据该待推荐员工的已观看课程和滤除后的课程,确定该待推荐员工的未观看课程。
S404,根据员工关系、员工画像、课程关系和课程画像中的至少一项,从待推荐员工的未观看课程中,确定待推荐员工的候选推荐课程。
可选的,对于每个待推荐员工,可以根据课程关系,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。具体的,可以根据该待推荐员工的未观看课程与已观看课程(进一步为目标观看课程)之间的课程关系,从该待推荐员工的未观看课程中确定该待推荐员工的候选推荐课程。例如,可以将该待推荐员工的未观看课程中与已观看课程之间的相似度大于设定相似度值的课程,作为该待推荐员工的候选推荐课程。
进一步的,对于每个待推荐员工,还可以根据员工关系,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。可选的,可以根据员工关系,确定该待推荐员工的相似员工;根据相似员工与课程之间的关系,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。具体的,可以根据员工关系,确定该待推荐员工的相似员工;根据相似员工与课程之间的关系,确定相似员工的已观看课程,之后根据相似员工的已观看课程和该待推荐员工的未观看课程,确定该待推荐员工的候选推荐课程。例如,可以将相似员工的已观看课程和该待推荐员工的未观看课程之间的共有课程,作为该待推荐员工的候选推荐课程。本实施例中,该待推荐员工的相似员工为与该待推荐员工相似的其他待推荐员工。
进一步的,对于每个待推荐员工,还可以根据员工画像,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。可选的,可以根据员工画像,确定该待推荐员工的相似员工;根据相似员工与课程之间的关系,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。其中,根据员工画像,确定该待推荐员工的相似员工可以是,根据该待推荐员工的员工画像中基础标签,以及其他待推荐员工的员工画像中基础标签,确定该待推荐员工的相似员工;其中,基础标签包括但不限于司龄、工龄、职级和工作序列等。例如,可以将与该待推荐员工位于相同工作序列的其他待推荐员工,作为该待推荐员工的相似员工;或者,可以将职级高于该推荐员工,且与该待推荐员工位于相同工作序列的其他待推荐员工,作为该待推荐员工的相似员工;或者,可以将与该待推荐员工司龄相同的其他待推荐员工,作为该待推荐员工的相似员工等。
进一步的,对于每个待推荐员工,还可以根据课程画像,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。可选的,根据该待推荐员工的已观看课程(进一步为目标观看课程)的课程画像中技能标签,和该待推荐员工的未观看课程的课程画像中技能标签,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。
进一步的,为了能够准确地确定候选推荐课程,还可以根据员工关系、员工画像、课程关系和课程画像中的至少两项,从待推荐员工的未观看课程中,确定待推荐员工的候选推荐课程。例如,对于每个待推荐员工,可以根据员工画像和员工关系,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。具体的,可以根据员工画像和员工关系,确定该待推荐员工的相似员工;根据相似员工与课程之间的关系,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。其中,根据员工画像和员工关系,确定该待推荐员工的相似员工可以是,根据员工画像,确定该待推荐员工的第一相似员工;根据员工关系,确定该待推荐员工的第二相似员工;根据第一相似员工和第二相似员工,确定待推荐员工最终的相似员工。例如,可以将第一相似员工和第二相似员工,一并作为待推荐员工最终的相似员工;或者,可以将第一相似员工和第二相似员工中共有的相似员工,作为待推荐员工最终的相似员工等。
又如,对于每个待推荐员工,还可以根据员工画像和课程画像,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。具体的,根据该待推荐员工的员工画像中技能标签,和课程画像中技能标签,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。例如,该待推荐员工的员工画像中技能标签所关联的内容包括JAVA,进而可以将该待推荐员工的未观看课程的课程画像中技能标签所关联的内容包括JAVA的课程,作为该待推荐员工的候选推荐课程。
又如,对于每个待推荐员工,还可以根据课程关系和员工关系,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。例如,可以根据员工关系和课程关系,分别从该待推荐员工的未观看课程中确定该待推荐员工的第一候选推荐课程和第二候选推荐课程;之后,根据所确定的第一候选推荐课程和第二候选推荐课程,确定最终的候选推荐课程。
又如,对于每个待推荐员工,还可以根据员工关系、员工画像、课程关系和课程画像中的三项,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。例如,可以基于员工关系,确定第一候选推荐课程;基于课程关系,确定第二候选推荐课程;基于课程画像,确定第三候选推荐课程;之后根据第一候选推荐课程、第二候选推荐课程和第三候选推荐课程,确定该待推荐员工的候选推荐课程。
又如,对于每个待推荐员工,还可以根据员工关系、员工画像、课程关系和课程画像,从该待推荐员工的未观看课程中,确定该待推荐员工的候选推荐课程。具体的,可以基于员工关系,确定第一候选推荐课程;基于课程关系,确定第二候选推荐课程;基于课程画像,确定第三候选推荐课程;基于员工画像,确定第四候选推荐课程;之后根据第一候选推荐课程、第二候选推荐课程、第三候选推荐课程和第四候选推荐课程,确定该待推荐员工的候选推荐课程。例如,可以对基于每一项所确定的候选推荐课程进行打分,进而可以根据打分结果,确定最终的候选推荐课程。例如,基于每一项所确定的候选推荐课程中均包括课程1,则将课程1的分值设置为4。
需要说明的是,本实施例可以灵活从员工关系、员工画像、课程关系和课程画像中选择至少一项,来确定待推荐员工的候选推荐课程,在能够准确从未观看课程中选择出候选推荐课程的情况下,极大地增加了方案的灵活度;同时,扩宽了选择候选推荐课程的思路。
S405,基于排序模型,从候选推荐课程中确定目标推荐课程。
S406,向待推荐员工推荐目标推荐课程。
本申请实施例的技术方案,通过基于待推荐员工与课程之间的关系确定待推荐员工的未观看课程,并引入员工关系、员工画像、课程关系和课程画像不同维度数据,进行综合分析,能够准确从未观看课程中选择出候选推荐课程,为后续针对性地向员工推荐课程奠定了基础。
图5A是根据本申请实施例提供的再一种课程推荐方法的流程图;图5B是根据本申请实施例提供的一种课程推荐系统的示意图。本申请实施例在上述实施例的基础上,对排序模型的确定过程进行介绍。结合图5A和5B,该方法包括:
S501,根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值。
S502,根据至少两个课程在工作序列分布上的熵值,从至少两个课程中滤除无关课程。
S503,根据员工关系、员工画像、课程关系和课程画像中的至少一项,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程。
S504,基于排序模型,从候选推荐课程中确定目标推荐课程。
可选的,本实施例中的排序模型通过如下方式确定:
步骤51:根据至少两个课程在工作序列分布上的熵值,从至少两个课程中滤除无关课程;
本实施例中,确定至少两个课程在工作序列分布上的熵值的过程,与步骤S501相同;且从至少两个课程中滤除无关课程的过程,与步骤S502相同,此处不再赘述。
步骤52:根据历史课程观看记录和滤除后的课程,确定员工的未观看课程和目标观看课程;
示例性的,本实施例中将员工历史观看课程的时长小于设定时长的观看记录视为异常观看记录。可选的,从历史课程观看记录中滤除异常观看记录,根据滤除后的历史观看记录确定每个员工与课程之间的关系;对于每个员工,可以根据该员工与课程之间的关系,确定该员工的已观看课程;根据该员工的已观看课程和滤除后的课程,确定该员工的目标观看课程;之后,可以根据该员工的目标观看课程或已观看课程,以及滤除后的课程,确定该员工的未观看课程。
步骤53:根据员工的目标观看课程,构建员工的正样本;
具体的,对于每个员工,可以将该员工的目标观看课程作为该员工的正样本。可选的,本实施例中正样本可以采用KV数据结构的形式进行表示,具体可以为,将员工标识和课程标识作为Key,将喜欢标签作为Value。
步骤54:根据员工的未观看课程和员工所在工作序列在每个滤除后的课程上的人员占比,构建员工的负样本;
具体的,对于每个员工,可以根据该员工所在工作序列的人员数量,以及该员工所在工作序列在每个滤除后的课程的观看人数,可以确定该员工所在工作序列在每个滤除后课程上的人员占比;按照升序排序方式,根据该员工所在工作序列在每个滤除后课程上的人员占比,对该员工的未观看课程进行排序;根据排序结果,从该员工的未观看课程中抽取设定数量的课程,构建该员工的负样本。例如,根据排序在前的200个未观看课程,构建该员工的负样本。可选的,与正样本类似,本实施例中负样本也可以采用KV数据结构的形式进行表示,具体可以为,将员工标识和课程标识作为Key,将不喜欢标签作为Value。
步骤55:采用员工的正样本和员工的负样本,进行机器学习,得到排序模型。
具体的,在确定员工的正样本和负样本之后,可以采用员工的正样本和员工的负样本,进行机器学习,得到排序模型。可选的,可以从课程特征库中获取正样本和负样本中课程的课程特征,以及从员工特征库中获取员工的员工特征;之后,对于每一正样本,可以按照设定格式,将该正样本所关联的员工特征、课程特征、以及标签特征进行拼接,得到该正样本的正样本特征;同时,对于每一负样本,可以按照设定格式,将该负样本所关联的员工特征、课程特征、以及标签特征进行拼接,得到该负样本的负样本特征;进而采用正样本特征和负样本特征,进行机器学习,即可得到排序模型。
其中,员工特征库中的每个员工的员工特征是根据员工相关数据所确定的,进一步的,根据员工的基础数据、技能数据和协同关系数据确定的。具体的,对于基础数据中的年龄、工龄和司龄等数值型数据,可以直接或归一化处理后作为数值向量;对于基础数据中的文本型数据,可以采用word2vec模型进行向量化处理;对于基础数据中的枚举型数据,例如序列、职级,可以处理成one-hot向量;对于技能数据,可以采用cout2vec模型进行向量化处理;对于协同关系数据,可以根据协同关系数据构建协同网络,并根据协同网络通过node2vec模型和word2vec模型进行向量化处理;之后,可以按照设定格式,将员工的基础数据中不同数据类型数据进行向量化处理后得到的向量,技能数据进行向量化处理后得到的向量,以及根据协同关系数据进行向量化处理后得到的向量进行拼接,得到员工特征。
其中,课程特征库中的每个滤除后的课程特征是根据历史课程观看记录和滤除后的课程的课程文本内容确定的。具体的,根据滤除后的课程的课程文本内容,确定滤除后的课程的课程内容特征;根据历史课程观看记录和滤除后的课程,构建员工的课程集合;根据员工的课程集合,确定滤除后的课程的课程行为特征;根据课程内容特征和课程行为特征,确定滤除后的课程的课程特征。
进而,对于每个员工,在确定该员工的候选推荐课程之后,可以从员工特征库中获取该员工的员工特征,以及从课程特征库中获取该员工的候选推荐课程的课程特征;之后,可以按照设定格式,将该员工所关联的员工特征分别与每个该员工的候选推荐课程的课程特征进行拼接,并将拼接结果输入至排序模型,进而得到该员工的目标推荐课程。
S505,向员工推荐目标推荐课程。
本申请实施例的技术方案,引入排序模型,从候选推荐课程中选择目标推荐课程,极大了提高了向员工推荐课程的精度,为针对性、快速、精准地向员工推荐课程提供了一种新思路。
图6是根据本申请实施例提供的一种课程推荐装置的结构示意图。该装置可实现本申请实施例所述的课程推荐方法。该装置可集成于承载课程推荐功能的电子设备中,如服务器中。该课程推荐装置600具体包括:
熵值确定模块601,用于根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值;
课程滤除模块602,用于根据至少两个课程在工作序列分布上的熵值,从至少两个课程中滤除无关课程;
课程推荐模块603,用于根据滤除后的课程,向员工进行课程推荐。
本申请实施例的技术方案,通过对历史课程观看记录和至少两个工作序列的人员数量进行统计分析,引入熵值对课程质量进行评估,对于无关课程在推荐时进行滤除,为后续针对性的向员工推荐专业课程奠定了基础。解决了现有课程推荐方法无法识别点击率高但无专业知识的课程,进而导致课程推荐效果差的问题,能够向员工推荐专业知识课程,进而提升了用户体验。
示例性的,熵值确定模块601包括:
观看人数确定单元,用于根据历史课程观看记录,确定每个工作序列在每个课程的观看人数;
熵值确定单元,用于根据每个工作序列在每个课程的观看人数和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值。
示例性的,熵值确定单元具体用于:
根据每个工作序列在每个课程的观看人数和至少两个工作序列的人员数量,确定每个工作序列在每个课程上的人员占比;
根据每个工作序列在每个课程上的人员占比,确定每个课程在每个工作序列上的归一占比;
根据每个课程在每个工作序列上的归一占比,确定每个工作序列在每个课程上的归一占比;
根据每个工作序列在每个课程上的归一占比,确定至少两个课程在工作序列分布上的熵值。
示例性的,课程推荐模块603包括:
候选课程确定单元,用于根据员工关系、员工画像、课程关系和课程画像中的至少一项,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程;
目标课程确定单元,用于基于排序模型,从候选推荐课程中确定目标推荐课程;
课程推荐单元,用于向员工推荐目标推荐课程。
示例性的,上述装置还包括:
员工关系确定单元,用于根据员工的协同关系数据,确定员工关系;
员工画像构建单元,用于根据员工的基础数据和技能数据,构建员工画像;
课程关系确定单元,用于根据历史课程观看记录和滤除后的课程的课程文本内容,确定课程关系;
课程画像确定单元,用于根据滤除后的课程的课程文本内容,构建课程画像。
示例性的,课程关系确定单元具体用于:
根据候滤除后的课程的课程文本内容,确定滤除后的课程的课程内容特征;
根据历史课程观看记录和滤除后的课程,构建员工的课程集合;其中,每个课程集合中包括至少一个滤除后的课程;
根据员工的课程集合,确定滤除后的课程的课程行为特征;
根据课程内容特征和课程行为特征,确定滤除后的课程的课程特征;
根据课程特征之间的距离,确定课程关系。
示例性的,候选课程确定单元包括:
未观看课程确定子单元,用于根据待推荐员工与课程之间的关系,从滤除后的课程中确定待推荐员工的未观看课程;
候选课程确定子单元,用于根据员工关系、员工画像、课程关系和课程画像中的至少一项,从待推荐员工的未观看课程中,确定待推荐员工的候选推荐课程。
示例性的,候选课程确定子单元具体用于:
根据员工画像和/或员工关系,确定待推荐员工的相似员工;
根据相似员工与课程之间的关系,从待推荐员工的未观看课程中,确定待推荐员工的候选推荐课程。
示例性的,候选课程确定子单元还具体用于:
根据待推荐员工的员工画像中技能标签,和课程画像中技能标签,从待推荐员工的未观看课程中,确定待推荐员工的候选推荐课程。
示例性的,排序模型通过如下方式确定:
根据至少两个课程在工作序列分布上的熵值,从至少两个课程中滤除无关课程;
根据历史课程观看记录和滤除后的课程,确定员工的未观看课程和目标观看课程;
根据员工的目标观看课程,构建员工的正样本;
根据员工的未观看课程和员工所在工作序列在每个滤除后的课程上的人员占比,构建员工的负样本;
采用员工的正样本和员工的负样本,进行机器学习,得到排序模型。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元801、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如课程推荐方法。例如,在一些实施例中,课程推荐方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的课程推荐方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行课程推荐方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (18)

1.一种课程推荐方法,包括:
根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值;
根据所述至少两个课程在工作序列分布上的熵值,从所述至少两个课程中滤除无关课程;
根据滤除后的课程,向员工进行课程推荐;
其中,根据历史课程观看记录和至少两个工作序列总人数,确定课程的熵值,包括:
根据历史课程观看记录,确定每个工作序列在每个课程的观看人数;
根据每个工作序列在每个课程的观看人数和至少两个工作序列的人员数量,确定每个工作序列在每个课程上的人员占比;
根据每个工作序列在每个课程上的人员占比,确定每个课程在每个工作序列上的归一占比;
根据每个课程在每个工作序列上的归一占比,确定每个工作序列在每个课程上的归一占比;
根据每个工作序列在每个课程上的归一占比,确定至少两个课程在工作序列分布上的熵值;
其中,所述工作序列为工作方向,所述工作序列的人员数量为该工作序列所包括的员工的总人数;所述无关课程为缺少专业知识性的课程;所述熵值用于表征各个工作序列在课程上的混乱程度。
2.根据权利要求1所述的方法,其中,根据滤除后的课程,向员工进行课程推荐,包括:
根据员工关系、员工画像、课程关系和课程画像中的至少一项,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程;
基于排序模型,从所述候选推荐课程中确定目标推荐课程;
向员工推荐所述目标推荐课程。
3.根据权利要求2所述的方法,其中,根据员工关系、员工画像、课程关系和课程画像中的至少一项,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程之前,还包括:
根据员工的协同关系数据,确定员工关系;
根据员工的基础数据和技能数据,构建员工画像;
根据历史课程观看记录和滤除后的课程的课程文本内容,确定课程关系;
根据滤除后的课程的课程文本内容,构建课程画像。
4.根据权利要求3所述的方法,其中,根据历史课程观看记录和滤除后的课程的课程文本内容,确定课程关系,包括:
根据滤除后的课程的课程文本内容,确定滤除后的课程的课程内容特征;
根据历史课程观看记录和滤除后的课程,构建员工的课程集合;其中,每个课程集合中包括至少一个滤除后的课程;
根据所述员工的课程集合,确定滤除后的课程的课程行为特征;
根据所述课程内容特征和所述课程行为特征,确定滤除后的课程的课程特征;
根据所述课程特征之间的距离,确定课程关系。
5.根据权利要求2所述的方法,其中,根据员工关系、员工画像、课程关系和课程画像中的至少一项,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程,包括:
根据待推荐员工与课程之间的关系,从滤除后的课程中确定所述待推荐员工的未观看课程;
根据员工关系、员工画像、课程关系和课程画像中的至少一项,从所述待推荐员工的未观看课程中,确定所述待推荐员工的候选推荐课程。
6.根据权利要求5所述的方法,其中,根据员工画像和/或员工关系,从所述待推荐员工的未观看课程中,确定所述待推荐员工的候选推荐课程,包括:
根据员工画像和/或员工关系,确定所述待推荐员工的相似员工;
根据相似员工与课程之间的关系,从所述待推荐员工的未观看课程中,确定所述待推荐员工的候选推荐课程。
7.根据权利要求5所述的方法,其中,根据员工画像和课程画像,从所述待推荐员工的未观看课程中,确定所述待推荐员工的候选推荐课程,包括:
根据所述待推荐员工的员工画像中技能标签,和所述课程画像中技能标签,从所述待推荐员工的未观看课程中,确定所述待推荐员工的候选推荐课程。
8.根据权利要求2所述的方法,其中,所述排序模型通过如下方式确定:
根据所述至少两个课程在工作序列分布上的熵值,从所述至少两个课程中滤除无关课程;
根据历史课程观看记录和滤除后的课程,确定员工的未观看课程和目标观看课程;
根据员工的目标观看课程,构建员工的正样本;
根据员工的未观看课程和员工所在工作序列在每个滤除后的课程上的人员占比,构建员工的负样本;
采用所述员工的正样本和所述员工的负样本,进行机器学习,得到所述排序模型。
9.一种课程推荐装置,包括:
熵值确定模块,用于根据历史课程观看记录和至少两个工作序列的人员数量,确定至少两个课程在工作序列分布上的熵值;
课程滤除模块,用于根据所述至少两个课程在工作序列分布上的熵值,从所述至少两个课程中滤除无关课程;
课程推荐模块,用于根据滤除后的课程,向员工进行课程推荐;
其中,所述熵值确定模块包括:
观看人数确定单元,用于根据历史课程观看记录,确定每个工作序列在每个课程的观看人数;
人员占比确定单元,用于根据每个工作序列在每个课程的观看人数和至少两个工作序列的人员数量,确定每个工作序列在每个课程上的人员占比;
第一归一占比确定单元,用于根据每个工作序列在每个课程上的人员占比,确定每个课程在每个工作序列上的归一占比;
第一归一占比确定单元,用于根据每个课程在每个工作序列上的归一占比,确定每个工作序列在每个课程上的归一占比;
熵值确定单元,用于根据每个工作序列在每个课程上的归一占比,确定至少两个课程在工作序列分布上的熵值;
其中,所述工作序列为工作方向,所述工作序列的人员数量为该工作序列所包括的员工的总人数;所述无关课程为缺少专业知识性的课程;所述熵值用于表征各个工作序列在课程上的混乱程度。
10.根据权利要求9所述的装置,其中,所述课程推荐模块包括:
候选课程确定单元,用于根据员工关系、员工画像、课程关系和课程画像中的至少一项,以及员工与课程之间的关系,从滤除后的课程中确定候选推荐课程;
目标课程确定单元,用于基于排序模型,从所述候选推荐课程中确定目标推荐课程;
课程推荐单元,用于向员工推荐所述目标推荐课程。
11.根据权利要求10所述的装置,还包括:
员工关系确定单元,用于根据员工的协同关系数据,确定员工关系;
员工画像构建单元,用于根据员工的基础数据和技能数据,构建员工画像;
课程关系确定单元,用于根据历史课程观看记录和滤除后的课程的课程文本内容,确定课程关系;
课程画像确定单元,用于根据滤除后的课程的课程文本内容,构建课程画像。
12.根据权利要求11所述的装置,其中,所述课程关系确定单元具体用于:
根据候滤除后的课程的课程文本内容,确定滤除后的课程的课程内容特征;
根据历史课程观看记录和滤除后的课程,构建员工的课程集合;其中,每个课程集合中包括至少一个滤除后的课程;
根据所述员工的课程集合,确定滤除后的课程的课程行为特征;
根据所述课程内容特征和所述课程行为特征,确定滤除后的课程的课程特征;
根据所述课程特征之间的距离,确定课程关系。
13.根据权利要求11所述的装置,其中,所述候选课程确定单元包括:
未观看课程确定子单元,用于根据待推荐员工与课程之间的关系,从滤除后的课程中确定所述待推荐员工的未观看课程;
候选课程确定子单元,用于根据员工关系、员工画像、课程关系和课程画像中的至少一项,从所述待推荐员工的未观看课程中,确定所述待推荐员工的候选推荐课程。
14.根据权利要求13所述的装置,其中,所述候选课程确定子单元具体用于:
根据员工画像和/或员工关系,确定所述待推荐员工的相似员工;
根据相似员工与课程之间的关系,从所述待推荐员工的未观看课程中,确定所述待推荐员工的候选推荐课程。
15.根据权利要求13所述的装置,其中,所述候选课程确定子单元还具体用于:
根据所述待推荐员工的员工画像中技能标签,和所述课程画像中技能标签,从所述待推荐员工的未观看课程中,确定所述待推荐员工的候选推荐课程。
16.根据权利要求10所述的装置,所述排序模型通过如下方式确定:
根据所述至少两个课程在工作序列分布上的熵值,从所述至少两个课程中滤除无关课程;
根据历史课程观看记录和滤除后的课程,确定员工的未观看课程和目标观看课程;
根据员工的目标观看课程,构建员工的正样本;
根据员工的未观看课程和员工所在工作序列在每个滤除后的课程上的人员占比,构建员工的负样本;
采用所述员工的正样本和所述员工的负样本,进行机器学习,得到所述排序模型。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的课程推荐方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行权利要求1-8中任一项所述的课程推荐方法。
CN202011553894.9A 2020-12-24 2020-12-24 课程推荐方法、装置、设备及存储介质 Active CN112528158B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011553894.9A CN112528158B (zh) 2020-12-24 2020-12-24 课程推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011553894.9A CN112528158B (zh) 2020-12-24 2020-12-24 课程推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112528158A CN112528158A (zh) 2021-03-19
CN112528158B true CN112528158B (zh) 2023-08-11

Family

ID=74976246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011553894.9A Active CN112528158B (zh) 2020-12-24 2020-12-24 课程推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112528158B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934748A (zh) * 2019-03-25 2019-06-25 京工博创(北京)科技有限公司 一种基于大数据条件下的个性化课程定制方法
CN111191833A (zh) * 2019-12-25 2020-05-22 湖北美和易思教育科技有限公司 一种基于神经网络的智能实验过程推荐方法及系统
CN111428138A (zh) * 2020-03-26 2020-07-17 中国建设银行股份有限公司 一种课程推荐方法、系统、设备及存储介质
CN112001656A (zh) * 2020-09-01 2020-11-27 北京弘远博学科技有限公司 基于员工历史培训信息针对性进行培训课推荐的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3092578A4 (en) * 2014-01-08 2017-08-23 Civitas Learning, Inc. Data-adaptive insight and action platform for higher education
US20170011095A1 (en) * 2015-07-10 2017-01-12 Fujitsu Limited Processing search queries for open education resources

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934748A (zh) * 2019-03-25 2019-06-25 京工博创(北京)科技有限公司 一种基于大数据条件下的个性化课程定制方法
CN111191833A (zh) * 2019-12-25 2020-05-22 湖北美和易思教育科技有限公司 一种基于神经网络的智能实验过程推荐方法及系统
CN111428138A (zh) * 2020-03-26 2020-07-17 中国建设银行股份有限公司 一种课程推荐方法、系统、设备及存储介质
CN112001656A (zh) * 2020-09-01 2020-11-27 北京弘远博学科技有限公司 基于员工历史培训信息针对性进行培训课推荐的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈晋音 ; 方航 ; 林翔 ; 郑海斌 ; 杨东勇 ; 周晓 ; .基于在线学习行为分析的个性化学习推荐.计算机科学.2018,(第S2期),全文. *

Also Published As

Publication number Publication date
CN112528158A (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN110070391B (zh) 数据处理方法、装置、计算机可读介质及电子设备
US11663536B2 (en) Generating a machine-learned model for scoring skills based on feedback from job posters
CN112733042B (zh) 推荐信息的生成方法、相关装置及计算机程序产品
US11556851B2 (en) Establishing a communication session between client terminals of users of a social network selected using a machine learning model
CN114519143A (zh) 课程推荐模型的训练方法、课程推荐方法及装置
CN113301442B (zh) 确定直播资源的方法、设备、介质及程序产品
CN114494784A (zh) 深度学习模型的训练方法、图像处理方法和对象识别方法
CN110727852A (zh) 一种推送招聘推荐服务的方法、装置及终端
CN112270533A (zh) 一种数据处理方法、装置、电子设备以及存储介质
CN110990627A (zh) 一种知识图谱构建的方法、装置、电子设备及介质
CN114169418B (zh) 标签推荐模型训练方法及装置、标签获取方法及装置
CN117668373B (zh) 一种级联标签推荐方法、装置、电子设备及存储介质
CN110111011A (zh) 一种教学质量监管方法、装置及电子设备
US11593740B1 (en) Computing system for automated evaluation of process workflows
CN116578925B (zh) 基于特征画像的行为预测方法、装置及存储介质
CN112925913A (zh) 用于匹配数据的方法、装置、设备和计算机可读存储介质
CN112528158B (zh) 课程推荐方法、装置、设备及存储介质
CN112270318A (zh) 自动阅卷方法和装置、电子设备和存储介质
CN116468479A (zh) 确定页面质量评估维度方法、页面质量的评估方法和装置
CN113901302B (zh) 数据处理方法、装置、电子设备和介质
CN115545674A (zh) 一种人岗匹配检测方法、装置、设备以及存储介质
CN114547416A (zh) 一种媒体资源排序方法及电子设备
CN113987260A (zh) 一种视频推送方法、装置、电子设备及存储介质
CN113239889A (zh) 图像识别方法、装置、设备、存储介质以及计算机程序产品
CN113378781B (zh) 视频特征提取模型的训练方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant