CN113918806A - 自动推荐培训课程的方法及相关设备 - Google Patents

自动推荐培训课程的方法及相关设备 Download PDF

Info

Publication number
CN113918806A
CN113918806A CN202111004986.6A CN202111004986A CN113918806A CN 113918806 A CN113918806 A CN 113918806A CN 202111004986 A CN202111004986 A CN 202111004986A CN 113918806 A CN113918806 A CN 113918806A
Authority
CN
China
Prior art keywords
user
course
recall
courses
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111004986.6A
Other languages
English (en)
Inventor
马岩
李�杰
刘芳
赵卫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guodiantong Network Technology Co Ltd
Original Assignee
Beijing Guodiantong Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guodiantong Network Technology Co Ltd filed Critical Beijing Guodiantong Network Technology Co Ltd
Priority to CN202111004986.6A priority Critical patent/CN113918806A/zh
Publication of CN113918806A publication Critical patent/CN113918806A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • G06Q50/2057Career enhancement or continuing education service

Abstract

本公开提供一种自动推荐培训课程的方法及相关设备,通过从多个方面分析处理教育平台收集到的用户个人信息和课程信息,得到多个课程召回备选集,从多个课程召回备选集中按照预定权重选取相应数量的课程,得到用于向用户推荐课程的多路课程召回备选集。实现了根据用户岗位分类,将用户分组进行分析计算,从而提高计算效率及数据分析精准度,且分析结果更贴合企业及个人的培训需求,从而实现精准的课程推荐。

Description

自动推荐培训课程的方法及相关设备
技术领域
本公开涉及教育培训技术领域,尤其涉及一种自动推荐培训课程的方法及相关设备。
背景技术
在当今互联网信息过载的背景下,大多数人除了主动获取信息外,对被动获取到的信息的质量和特性要求越来越高。因此基于场景服务的软件平台迫切需要提升信息分发的效率,当效率提升到一定程序,会给用户带来一种全新的体验。
大型企业在线教育平台亟需从采用传统的手工维护或简单的流量排序推送资源信息的手段,向个性化、自动化、智能化的推送方式变革。之所以使用推荐模型,是因为不同用户对于培训学习资源有着不同的需求,用户对培训课程的偏好越来越多样化,而针对全体用户的统一推荐并不能满足用户个性化的需求。通常运维人员只会推荐绝大多数人喜欢的内容,而推荐模型就可以根据用户个性的需求推送个性化的课程资源。然而互联网主流的推荐模型并不适用于企业级教育平台的培训课程推荐,为满足企业级教育平台推荐课程的需求,需要一种新的自动推荐培训课程的方法。
发明内容
有鉴于此,本公开的目的在于提出一种自动推荐培训课程的方法及相关设备。
基于上述目的,本公开提供了一种自动推荐培训课程的方法,应用于企业级教育平台,包括:
收集使用所述教育平台的用户的个人数据和行为数据,并从所述个人数据和所述行为数据中提取出用户特征向量;
将所述教育平台上的课程分别按照所述用户学习次数最多和评价分数最高进行排序,分别获取基于所述用户学习次数和所述评价分数的第一课程召回备选集;
对于任一用户,确定所述用户所属的用户组;根据所述用户特征向量计算单个所述用户与同一所述用户组内其余所述用户的用户相似度,将其余所述用户按照所述用户相似度从大到小排序,根据排序结果和所述行为数据获取基于所述用户相似度的第二课程召回备选集;其中,所述用户组是根据用户岗位类别预先划分出的;
计算所述用户学习过的所述课程与学习过同一所述课程的其余所述用户学习过的其余所述课程的课程相似度,根据所述课程相似度从大到小为其余所述课程排序,获得基于所述课程相似度的第三课程召回备选集;
按照预定的权重分别从所述第一课程召回备选集、所述第二课程召回备选集和所述第三课程召回备选集选取一定数量的所述课程,生成多路课程召回备选集推荐给所述用户。
基于同一发明目的,本公开还提供了一种自动推荐培训课程装置,包括:
数据收集模块,被配置为收集使用所述教育平台的用户的个人数据和行为数据,并从所述个人数据和所述行为数据中提取出用户特征向量;
第一课程召回备选集生成模块,被配置为将所述教育平台上的课程分别按照所述用户学习次数最多和评价分数最高进行排序,分别获取基于所述用户学习次数和所述评价分数的第一课程召回备选集;
第二课程召回备选集生成模块,被配置为对于任一用户,确定所述用户所属的用户组;根据所述用户特征向量计算单个所述用户与同一所述用户组内其余所述用户的用户相似度,将其余所述用户按照所述用户相似度从大到小排序,根据排序结果和所述行为数据获取基于所述用户相似度的第二课程召回备选集;其中,所述用户组是根据用户岗位类别预先划分出的;
第三课程召回备选集生成模块,被配置为计算所述用户学习过的所述课程与学习过同一所述课程的其余所述用户学习过的其余所述课程的课程相似度,根据所述课程相似度从大到小为其余所述课程排序,获得基于所述课程相似度的第三课程召回备选集;
多路课程召回备选集生成模块,被配置为按照预定的权重分别从所述第一课程召回备选集、所述第二课程召回备选集和所述第三课程召回备选集选取一定数量的所述课程,生成多路课程召回备选集推荐给所述用户。
基于同一发明目的,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现自动推荐培训课程的方法。
基于同一发明目的,本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行自动推荐培训课程的方法。
从上面所述可以看出,本公开提供的自动推荐培训课程的方法及相关设备,通过多种方式收集用户信息和课程信息,分析后精确的根据用户的学习情况推荐更符合企业要求和用户需求的培训课程。
附图说明
为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的自动推荐培训课程的方法的流程图;
图2为本公开实施例提供的自动推荐培训课程装置的结构图;
图3为本公开实施例提供的电子设备结构图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
现有技术中,主流的课程推荐系统大致分为两类:基于内容的推荐和基于用户的推荐,采用的算法主要有协同过滤和机器学习,也就是通过历史数据来训练模型,通过对象行为来不断完善模型指标,从而保证推荐结果的准确性。
然而企业级在线教育平台推荐模型与互联网主流的推荐模型存在比较大的差异,包括:
企业级教育平台构建在企业级信息化平台之上,可以获取到用户完整、准确的画像,通过用户的画像及特征信息作为用户相似度分析的数据来源。而开放的互联网平台受限于安全等因素,通常只能获取用户较少部分信息,这就导致在进行基于协同过滤的分析过程中可能产生较大的偏差。
企业级用户数量通常比较稳定,预期的数据总量、计算资源、分析效率方便评估,准确度较高,而互联网平台相关指标通常较难预估。
企业级教育平台课程资源通常与企业性质有直接的关系,偏向于一些专业课程,并且具有明确的分类,对于用户来说又与其所属工作岗位直接相关;而互联网平台具有更多样化的课程资源,分类有时并不是很明确。
为解决上述问题,本公开提供了一种自动推荐培训课程的方法,通过收集使用企业级教育平台的用户信息,采用不同的方法处理信息得到多个课程召回备选集,按照不同的权重从各个课程召回备选集中抽取相应数目的课程组成推荐给用户的多路课程召回备选集,以达到精准的向使用教育平台的用户推荐培训课程的目的。
作为一个可选的实施例,参照图1,本公开提供的自动推荐培训课程的方法,包括:
步骤S101,收集使用所述教育平台的用户的个人数据和行为数据,并从所述个人数据和所述行为数据中提取出用户特征向量。
本步骤中,所述个人数据包括:人员编号、姓名、性别、年龄、学历、专业、岗位分类、工作年限、所属单位等属性。所述行为数据指用户对教育平台的课程进行的搜索、学习、评价和收藏这几种行为。其中,用户对于课程的评价指将课程评价为差、一般、良好、优秀、推荐这五个等级。在获取用户的行为数据时,需要对得到的行为数据进行去重操作,并且最大保存用户的最近100条行为记录。
本步骤中,从个人数据和行为数据中提取出学历层次、岗位级别、工作年限、累计学习时长和学习课程数量这些特征作为用户特征向量的五个维度,按照预设的标准为上述特征分别打分,打分结果即为各个维度对应的特征向量的特征值。其中,学历层次、岗位级别、工作年限构成用户的静态画像,累计学习时长、学习课程数量构成用户的动态画像。
步骤S102,将所述教育平台上的课程分别按照所述用户学习次数最多和评价分数最高进行排序,分别获取基于所述用户学习次数和所述评价分数的第一课程召回备选集。
本步骤中,根据收集到的用户信息中的学习次数为所有课程进行按照学习次数从大到小的顺序排序,排序得到的结果即为基于用户学习次数的第一课程召回备选集;同样,根据用户对课程的评价获取课程的总评价分数,将所有课程按照总评价分数从高到低的顺序排序,得到的结果就是基于评价分数的第一课程召回备选集。
其中,根据用户评价课程的不同等级计算课程的得分,包括:差对应0分、一般对应1分、良好对应2分、优秀对应3分、推荐对应5分。一门课程的总评价分数就是通过将用户对这门课程的不同评价对应的分数累加得到的。
步骤S103,根据所述用户特征向量计算单个所述用户与同一所述用户组内其余所述用户的用户相似度,将其余所述用户按照所述用户相似度从大到小排序,根据排序结果和所述行为数据获取基于所述用户相似度的第二课程召回备选集。
本步骤中,由于不同岗位的工作需求导致不同用户需要学习不同的课程,岗位相差过大的用户需要学习的课程的差别也很大,而岗位相似的用户需要学习的课程也是相似的,故将用户根据岗位类别划分出四个用户组,包括管理组、经营组、技术组和服务组。以保证同一个用户组内的不同用户学习的课程的没有明显的差别,使计算得到的用户相似度更具有代表意义。并将按照
Figure BDA0003236883200000051
计算得出的余弦相似度cosθ作为用户A与用户B的所述用户相似度;其中,Ai表示所述用户A的所述用户特征向量的第i个所述特征值,Bi表示所述用户B的所述用户特征向量的第i个所述特征值,n=5。
将用户划分为管理组、经营组、技术组和服务组也只是根据用户岗位对应的职责进行的大致划分,当对用户相似度的精确程度要求更高时,还可以进一步根据不同岗位对应的职责对上述用户组进行进一步的划分,如将技术组进一步划分为风电组、水电组和火电组等。
步骤S104,计算所述用户学习过的所述课程与学习过同一所述课程的其余所述用户学习过的其余所述课程的课程相似度,根据所述课程相似度从大到小为其余所述课程排序,获得基于所述课程相似度的第三课程召回备选集。
本步骤中,将按照
Figure BDA0003236883200000061
计算出的Wab视为课程a与课程b的所述课程相似度;其中,N(a)表示学习过所述课程a的所述用户的数量,N(b)表示学习过所述课程b的所述用户的数量。
步骤S105,按照预定的权重分别从所述第一课程召回备选集、所述第二课程召回备选集和所述第三课程召回备选集选取一定数量的所述课程,生成多路课程召回备选集推荐给所述用户。
本步骤中,从各个课程召回备选集中选取课程之前,需对课程召回备选集进行去重,保证没有重复的课程;并将待推荐课程的用户已经学习过的课程从课程召回备选集中剔除。
本步骤中,在生成所述多路召回备选集时,还需要由业务管理人员根据待推荐课程的用户的岗位类别添加或去除特定的课程。
作为一个可选的实施例,步骤S101中按照预设的标准为用户特征向量打分,所述标准包括:
学历层次:高中1分、大专2分、本科3分、硕士4分、博士5分。
岗位级别:初级1分、中级2分、高级3分。
工作年限:1-3年1分、3-5年2分、5-10年3分、10-20年4分、20年以上5分。
累计学习时长:1-3小时1分、3-10小时2分、10-30小时3分、30-60小时4分、60小时以上5分。
学习课程数量:1-5个1分、5-10个2分、10-20个3分、20-40个4分,40个以上5分。
设有一个用户,其学历层次为硕士、岗位级别为高级、工作年限为3年,累计学习时长是3小时、学习了3门课程,根据上述标准,可以得到该用户的用户特征向量为(4,3,1,1,1)。
作为一个可选的实施例,步骤S103中计算用户相似度并获取第二课程召回备选集,其中,参照表1,计算出的用户相似度为:
表1,用户相似度计算结果
Figure BDA0003236883200000071
按照用户相似度从大到小的顺序为表1中的用户2-9排序,选取用户相似度最大的前三个用户,并分别获取这三个用户最近学习的三门课程,将得到的九门课程去重后作为第二课程召回备选集。
作为一个可选的实施例,步骤S104中计算课程相似度并获取第三课程召回备选集,其中,参照表2,计算出的课程相似度为:
表2,课程相似度计算结果
Figure BDA0003236883200000072
Figure BDA0003236883200000081
表2中计算的是其余课程与课程a的相似度,当用户学习过多门课程时,需要分别计算其余课程与每门课程的课程相似度,并按照计算结果统一排序,得到第三课程召回备选集。
作为一个可选的实施例,步骤S105中按照预定的权重从各个课程召回备选集中选取课程生成多路课程召回备选集,预定的权重由教育平台的工作人员自行设定,如设定两个第一课程召回备选集的权重分别为20%,第二课程召回备选集的权重为30%,第三课程召回备选集的权重为30%。
按照上述权重分别去重后的从基于用户学习次数和课程评价分数的第一课程召回备选集中选取排序靠前的前两门课程,从去重后的基于用户相似度的第二课程召回备选集中选取排序靠前的前三门课程,从去重后的基于课程相似的的第三课程召回备选集中选取前三门课程,将得到的10门课程作为多路课程召回备选集推荐给用户。
本公开提供的自动推荐培训课程的方法,通过收集用户多方面的数据,采用不同的角度分析用户数据并生成对应的课程召回备选集,从各个课程召回备选集中按照预设权重选取课程生成推荐给用户的多路课程召回备选集。实现了根据用户岗位分类,将用户分组进行分析计算,从而提高计算效率及数据分析精准度,且分析结果更贴合企业及个人的培训需求,从而实现精准的课程推荐。
需要说明的是,本公开实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种自动推荐培训课程装置。
参考图2,所述自动推荐培训课程装置,包括:
数据收集模块201,被配置为收集使用所述教育平台的用户的个人数据和行为数据,并从所述个人数据和所述行为数据中提取出用户特征向量;
第一课程召回备选集生成模块202,被配置为将所述教育平台上的课程分别按照所述用户学习次数最多和评价分数最高进行排序,分别获取基于所述用户学习次数和所述评价分数的第一课程召回备选集;
第二课程召回备选集生成模块203,被配置为对于任一用户,确定所述用户所属的用户组;根据所述用户特征向量计算单个所述用户与同一所述用户组内其余所述用户的用户相似度,将其余所述用户按照所述用户相似度从大到小排序,根据排序结果和所述行为数据获取基于所述用户相似度的第二课程召回备选集;其中,所述用户组是根据用户岗位类别预先划分出的;
第三课程召回备选集生成模块204,被配置为计算所述用户学习过的所述课程与学习过同一所述课程的其余所述用户学习过的其余所述课程的课程相似度,根据所述课程相似度从大到小为其余所述课程排序,获得基于所述课程相似度的第三课程召回备选集;
多路课程召回备选集生成模块205,被配置为按照预定的权重分别从所述第一课程召回备选集、所述第二课程召回备选集和所述第三课程召回备选集选取一定数量的所述课程,生成多路课程召回备选集推荐给所述用户。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本公开时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的自动推荐培训课程方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的自动推荐培训课程方法。
图3示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的自动推荐培训课程自动推荐培训课程方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的自动推荐培训课程方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的自动推荐培训课程方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
需要说明的是,本公开的实施例还可以以下方式进一步描述:
一种自动推荐培训课程的方法,应用于企业级教育平台,包括:
收集使用所述教育平台的用户的个人数据和行为数据,并从所述个人数据和所述行为数据中提取出用户特征向量;
将所述教育平台上的课程分别按照所述用户学习次数最多和评价分数最高进行排序,分别获取基于所述用户学习次数和所述评价分数的第一课程召回备选集;
对于任一用户,确定所述用户所属的用户组;根据所述用户特征向量计算单个所述用户与同一所述用户组内其余所述用户的用户相似度,将其余所述用户按照所述用户相似度从大到小排序,根据排序结果和所述行为数据获取基于所述用户相似度的第二课程召回备选集;其中,所述用户组是根据用户岗位类别预先划分出的;
计算所述用户学习过的所述课程与学习过同一所述课程的其余所述用户学习过的其余所述课程的课程相似度,根据所述课程相似度从大到小为其余所述课程排序,获得基于所述课程相似度的第三课程召回备选集;
按照预定的权重分别从所述第一课程召回备选集、所述第二课程召回备选集和所述第三课程召回备选集选取一定数量的所述课程,生成多路课程召回备选集推荐给所述用户。
作为一个可选的实施例,提取出所述用户特征向量,包括:从所述个人数据和所述行为数据中提取出学历层次、岗位级别、工作年限、累计学习时长和学习课程数量并分别打分,将各项打分结果分别视为所述用户特征向量的五个维度特征向量的特征值。
作为一个可选的实施例,根据所述岗位类别预先划分的所述用户组,包括:管理组、经营组、技术组和服务组。
作为一个可选的实施例,计算所述用户相似度,包括:将按照
Figure BDA0003236883200000121
Figure BDA0003236883200000122
计算得出的余弦相似度cosθ作为用户A与用户B的所述用户相似度;其中,Ai表示所述用户A的所述用户特征向量的第i个所述特征值,Bi表示所述用户B的所述用户特征向量的第i个所述特征值,n=5。
作为一个可选的实施例,所述获取基于所述第二课程召回备选集,包括:将同一所述用户组的其余所述用户按照各自所述用户相似度从大到小的排序,分别选取前三个所述用户最近学习的三门所述课程,将得到的九门所述课程视为基于所述第二课程召回备选集。
作为一个可选的实施例,计算所述课程相似度,包括:将根据
Figure BDA0003236883200000123
Figure BDA0003236883200000124
计算出的Wab视为课程a与课程b的所述课程相似度;其中,N(a)表示学习过所述课程a的所述用户的数量,N(b)表示学习过所述课程b的所述用户的数量。
作为一个可选的实施例,生成所述多路召回课程备选集,包括:对各个所述课程召回备选集进行去重操作,去除重复的所述课程和使用所述教育平台的单个所述用户已经学习过的所述课程;根据实际情况加入或移除特定的所述课程。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本公开实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本公开实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本公开实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本公开实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种自动推荐培训课程的方法,应用于企业级教育平台,包括:
收集使用所述教育平台的用户的个人数据和行为数据,并从所述个人数据和所述行为数据中提取出用户特征向量;
将所述教育平台上的课程分别按照所述用户学习次数最多和评价分数最高进行排序,分别获取基于所述用户学习次数和所述评价分数的第一课程召回备选集;
对于任一用户,确定所述用户所属的用户组;根据所述用户特征向量计算单个所述用户与同一所述用户组内其余所述用户的用户相似度,将其余所述用户按照所述用户相似度从大到小排序,根据排序结果和所述行为数据获取基于所述用户相似度的第二课程召回备选集;其中,所述用户组是根据用户岗位类别预先划分出的;
计算所述用户学习过的所述课程与学习过同一所述课程的其余所述用户学习过的其余所述课程的课程相似度,根据所述课程相似度从大到小为其余所述课程排序,获得基于所述课程相似度的第三课程召回备选集;
按照预定的权重分别从所述第一课程召回备选集、所述第二课程召回备选集和所述第三课程召回备选集选取一定数量的所述课程,生成多路课程召回备选集推荐给所述用户。
2.根据权利要求1所述的方法,其中,提取出所述用户特征向量,包括:
从所述个人数据和所述行为数据中提取出学历层次、岗位级别、工作年限、累计学习时长和学习课程数量并分别打分,将各项打分结果分别视为所述用户特征向量的五个维度特征向量的特征值。
3.根据权利要求1所述的方法,其中,根据所述岗位类别预先划分的所述用户组,包括:管理组、经营组、技术组和服务组。
4.根据权利要求2所述的方法,其中,计算所述用户相似度,包括:
将按照
Figure FDA0003236883190000011
计算得出的余弦相似度cosθ作为用户A与用户B的所述用户相似度;
其中,Ai表示所述用户A的所述用户特征向量的第i个所述特征值,Bi表示所述用户B的所述用户特征向量的第i个所述特征值,n=5。
5.根据权利要求1所述的方法,其中,所述获取基于所述第二课程召回备选集,包括:
将同一所述用户组的其余所述用户按照各自所述用户相似度从大到小的排序,分别选取前三个所述用户最近学习的三门所述课程,将得到的九门所述课程视为基于所述第二课程召回备选集。
6.根据权利要求1所述的方法,其中,计算所述课程相似度,包括:
将根据
Figure FDA0003236883190000021
计算出的Wab视为课程a与课程b的所述课程相似度;
其中,N(a)表示学习过所述课程a的所述用户的数量,N(b)表示学习过所述课程b的所述用户的数量。
7.根据权利要求1所述的方法,其中,生成所述多路召回课程备选集,包括:
对各个所述课程召回备选集进行去重操作,去除重复的所述课程和使用所述教育平台的单个所述用户已经学习过的所述课程;
根据实际情况加入或移除特定的所述课程。
8.一种自动推荐培训课程装置,包括:
数据收集模块,被配置为收集使用所述教育平台的用户的个人数据和行为数据,并从所述个人数据和所述行为数据中提取出用户特征向量;
第一课程召回备选集生成模块,被配置为将所述教育平台上的课程分别按照所述用户学习次数最多和评价分数最高进行排序,分别获取基于所述用户学习次数和所述评价分数的第一课程召回备选集;
第二课程召回备选集生成模块,被配置为对于任一用户,确定所述用户所属的用户组;根据所述用户特征向量计算单个所述用户与同一所述用户组内其余所述用户的用户相似度,将其余所述用户按照所述用户相似度从大到小排序,根据排序结果和所述行为数据获取基于所述用户相似度的第二课程召回备选集;其中,所述用户组是根据用户岗位类别预先划分出的;
第三课程召回备选集生成模块,被配置为计算所述用户学习过的所述课程与学习过同一所述课程的其余所述用户学习过的其余所述课程的课程相似度,根据所述课程相似度从大到小为其余所述课程排序,获得基于所述课程相似度的第三课程召回备选集;
多路课程召回备选集生成模块,被配置为按照预定的权重分别从所述第一课程召回备选集、所述第二课程召回备选集和所述第三课程召回备选集选取一定数量的所述课程,生成多路课程召回备选集推荐给所述用户。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行权利要求1至7任一所述方法。
CN202111004986.6A 2021-08-30 2021-08-30 自动推荐培训课程的方法及相关设备 Pending CN113918806A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111004986.6A CN113918806A (zh) 2021-08-30 2021-08-30 自动推荐培训课程的方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111004986.6A CN113918806A (zh) 2021-08-30 2021-08-30 自动推荐培训课程的方法及相关设备

Publications (1)

Publication Number Publication Date
CN113918806A true CN113918806A (zh) 2022-01-11

Family

ID=79233726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111004986.6A Pending CN113918806A (zh) 2021-08-30 2021-08-30 自动推荐培训课程的方法及相关设备

Country Status (1)

Country Link
CN (1) CN113918806A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114461914A (zh) * 2022-02-11 2022-05-10 江苏灵狐软件科技有限公司 一种基于课程平台数据库的专业教程推送方法及系统
CN115063269A (zh) * 2022-06-21 2022-09-16 北京全道智源教育科技院 职业教育课程开发方法、装置及计算机设备
CN115511677A (zh) * 2022-10-18 2022-12-23 天津景润网络科技有限公司 一种智能化教育资源平台调配的方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114461914A (zh) * 2022-02-11 2022-05-10 江苏灵狐软件科技有限公司 一种基于课程平台数据库的专业教程推送方法及系统
CN115063269A (zh) * 2022-06-21 2022-09-16 北京全道智源教育科技院 职业教育课程开发方法、装置及计算机设备
CN115511677A (zh) * 2022-10-18 2022-12-23 天津景润网络科技有限公司 一种智能化教育资源平台调配的方法及系统

Similar Documents

Publication Publication Date Title
CN110377804B (zh) 培训课程数据的推送方法、装置、系统及存储介质
CN113918806A (zh) 自动推荐培训课程的方法及相关设备
CN108121785A (zh) 一种基于教育大数据的分析方法
CN105117460A (zh) 学习资源推荐方法和系统
WO2021047237A1 (zh) 一种up主匹配方法及装置
CN107944986A (zh) 一种o2o商品推荐方法、系统及设备
Asanbe et al. Teachers’ performance evaluation in higher educational institution using data mining technique
CN112214670A (zh) 一种在线课程推荐方法、装置、电子设备及存储介质
CN109711424B (zh) 一种基于决策树的行为规则获取方法、装置及设备
CN111914176B (zh) 题目的推荐方法及装置
CN104993962A (zh) 获取终端使用状态的方法和系统
CN110334356A (zh) 文章质量的确定方法、文章筛选方法、以及相应的装置
Lee et al. An intelligent course recommendation system
Mgala et al. Data-driven intervention-level prediction modeling for academic performance
CN108960884A (zh) 信息处理方法、模型构建方法及装置、介质和计算设备
CN112214688A (zh) 选修课的推荐方法、装置和服务器
CN110147504B (zh) 区域教育资源满足度评价方法及系统
CN114969528A (zh) 基于能力评测的用户画像和学习路径推荐方法、装置及设备
CN112150094A (zh) 模型训练方法、基于模型的评估方法及装置
CN110019556A (zh) 一种话题新闻获取方法、装置及其设备
Szyjewski et al. A study on existing and actually used capabilities of mobile phones technologies
CN112734142B (zh) 基于深度学习的资源学习路径规划方法及装置
CN113657766A (zh) 一种基于游客多元数据的旅游景区欢乐指数的计量方法
Doan et al. Analyzing Students Usage of e-Learning Systems in the Cloud for Course Management
Hasibuan et al. Determining the Main Priority in the Assessment of Hollywood Horror Films by Applying the AHP and SAW Methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination