CN111402098B - 基于儿童成长期的智慧早教方法、系统、设备、存储介质 - Google Patents

基于儿童成长期的智慧早教方法、系统、设备、存储介质 Download PDF

Info

Publication number
CN111402098B
CN111402098B CN202010315867.1A CN202010315867A CN111402098B CN 111402098 B CN111402098 B CN 111402098B CN 202010315867 A CN202010315867 A CN 202010315867A CN 111402098 B CN111402098 B CN 111402098B
Authority
CN
China
Prior art keywords
course
resources
children
curriculum
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010315867.1A
Other languages
English (en)
Other versions
CN111402098A (zh
Inventor
李鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huohuohuotu Intelligent Technology Co ltd
Original Assignee
Shenzhen Huohuohuotu Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huohuohuotu Intelligent Technology Co ltd filed Critical Shenzhen Huohuohuotu Intelligent Technology Co ltd
Priority to CN202010315867.1A priority Critical patent/CN111402098B/zh
Publication of CN111402098A publication Critical patent/CN111402098A/zh
Application granted granted Critical
Publication of CN111402098B publication Critical patent/CN111402098B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于儿童成长期的智慧早教方法、系统、设备、存储介质,包括根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分,获取儿童有效收听的课程资源的次数,并利用欧拉常数计算关于收听课程资源的积分值;根据儿童在一段时间内的行为数据建立模型,利用模型为儿童推荐喜欢的课程资源、增添缺乏的课程资源;通过儿童的八大智能、年龄和二级分类之间的关系进行课程划分,使每日课程资源在年龄、八大智能、二级分类的分布和总时长达到每日课程总时长预设值,使课程资源分布合理,能使儿童的八大智能均衡发展。通过积分计算以及积分累加算法,实现了积分排名,能够为儿童学习带来较好的反馈。

Description

基于儿童成长期的智慧早教方法、系统、设备、存储介质
技术领域
本发明涉及早教装置技术领域,尤其涉及一种基于儿童成长期的智慧早教方法、系统、设备、存储介质。
背景技术
早教,广义指从人出生到小学以前阶段的教育,狭义主要指上述阶段的早期学习。一些国家出现提前开始学习读、写、算,提前开始正式教育的探讨和实验。但另有人主张早期教育应重在发展智力。还有人认为早期教育应向前延伸到出生以前的母亲怀孕期的胎教。家庭教育对早期教育有重大影响。
在当前技术中,市场上的早教课程很多都是给儿童推荐每天的固定课程资源,无法顾及到儿童是否喜欢、是否能学到东西,对于推荐的课程资源在收听完之后,就结束了任务,无法实现早教的意义。
公开于该背景技术部分的信息仅仅旨在加深对本发明的总体背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
基于上述原因,本申请人提出了一种基于儿童成长期的智慧早教方法、系统、设备、存储介质,旨在解决上述问题。
发明内容
为了满足上述要求,本发明的第一个目的在于提供一种基于儿童成长期的智慧早教方法,旨在可预知儿童在不同年龄期内该培养哪些关键技能,并根据儿童的不同喜好,智能地、周期性地推荐儿童喜欢且能提高关键技能的课程资源,使儿童能得到全面发展,接收到较好的早教课程。
本发明的第二个目的在于提供一种基于儿童成长关键期的智慧早教系统。
本发明的第三个目的在于提供一种基于儿童成长关键期的智慧早教用计算机设备。
本发明的第四个目的在于提供一种非临时性计算机可读存储介质,其上存储有计算机程序。
为了实现上述目的,本发明采用以下技术方案:
一种基于儿童成长关键期的智慧早教方法,其特征在于,包括以下步骤:
根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分(后续会发展到八大智能、年龄和二级分类及其多重级分类之间的关系),将数量值低于阈值的二级分类合并为一个支持课程分配的合集;根据课程划分选取每日课程资源,使每日课程资源在年龄、八大智能、二级分类的分布和总时长达到每日课程总时长预设值;
获取儿童有效收听的课程资源的次数,并利用欧拉常数计算关于收听课程资源的积分值;根据八大智能以及每个年龄段对应的二级分类,计算出各个年龄段内的八大智能对应的二级分类的数量,以及在各年龄段内的八大智能的二级分类分布的权重比值,获取数值为儿童获取的成长值之和再乘以对应的权重比值的积分值,累计儿童各个年龄段的积分值之和,得到不同儿童的总积分排名;
根据儿童在一段时间内的行为数据建立模型,利用模型为儿童推荐喜欢的课程资源、增添缺乏的课程资源;根据一段时间内儿童信息、儿童的行为数据和课程资源信息,建立儿童个性化模型,根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将排在前面的课程资源优先推荐给儿童。
在一个可能的实施方式中,所述根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分的步骤包括,将各个年龄、八大智能对应的课程资源按照二级分类对应课程资源数量的比例来分配课程资源,使课程资源量最少的二级分类和最多的二级分类比例不超过可调整的预定阈值,且被收听一次的课程资源的收听总时长小于目标时长;
使用插空法将与一组二级分类课程资源按顺序插入另一组二级分类课程资源的偶数位置,使二级分类课程资源排序时长均匀;
并创建空列表,将分配好课程以顺序循环的方式添加至空列表,当列表的播放时长达到目标时长时停止。
在一个可能的实施方式中,所述根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,排在前面的课程资源优先推荐给儿童的步骤包括,
将数据分为纯数值数据和文本数据;
对于纯数值数据,做如下预处理:
a、对于缺失值,根据不同情况进行填充或者删除;
b、对于异常值进行处理,包括若课程资源收听时长大于课程资源时长,则去除,若课程资源点播量和收藏量服从正态分布,则设值超过N倍的方差为异常并去除;
c、从已有的数值数据直接提取课程资源时长、课程资源收听总次数、课程资源收藏量、课程资源收听总天数、课程资源收听总用户数、课程资源大小;
d、获取人为添加的对结果有影响的特征。
进一步技术方案为,所述获取人为添加的对结果有影响的特征的步骤之后还包括:
使一条课程资源的文本数据包括课程资源的一级分类、二级分类、标签、名称、简介以及用户对该课程资源的评价,并实施如下处理步骤:
a、将每一条课程资源的所有文本拼接,提取关键词、特征词列表;
b、添加关键词和去掉停用词;
c、对词向量列表进行训练,生成词向量矩阵;
d、当参数维度过高时,采用PCA降维,将数组维度降低。
进一步技术方案为,所述将数组维度降低的步骤之后还包括:
将处理过的纯数字数据数组和文本数据数组按行拼接,获得机器学习模型用于训练的数据;
将拼接好的数据,以课程资源收听总次数作为目标值且其余特征均为训练值进行标准化;
采用模型对所有特征进行打分,选取与结果相关性最大的前N个特征进行训练。
进一步技术方案为,所述采用模型对所有特征进行打分,选取与结果相关性最大的前N个特征进行训练的步骤之后包括:构建自定义集成算法,对每个回归模型进行参数调优,计算出评分,选择评分最高的模型和对应的参数。
进一步技术方案为,所述选择评分最高的模型和对应的参数的步骤之后还包括:
用已经训练好的回归模型对每个用户为学习过的课程资源进行预测课程资源的喜好程度,按喜好程度降序排序;
从重新排序的课程资源中为用户分配学习课程资源。
在另一方面,本发明还提出了一种基于儿童成长关键期的智慧早教系统,包括以下单元:
课程划分单元,用于根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分,将数量值低于阈值的二级分类合并为一个支持课程分配的合集;根据课程划分选取每日课程资源,使每日课程资源在年龄、八大智能、二级分类的分布和总时长达到每日课程总时长预设值;
积分计算单元,用于获取儿童有效收听的课程资源的次数,并利用欧拉常数计算关于收听课程资源的积分值;根据八大智能以及每个年龄段对应的二级分类,计算出各个年龄段内的八大智能对应的二级分类的数量,以及在各年龄段内的八大智能的二级分类及课程资源分布的权重比值,获取数值为儿童获取的成长值之和再乘以对应的权重比值的积分值,累计儿童各个年龄段的积分值之和,得到不同儿童的总积分排名;
课程推荐单元,根据儿童在一段时间内的行为数据建立模型,利用模型为儿童推荐喜欢的课程资源、增添缺乏的课程资源;根据一段时间内儿童信息、儿童的行为数据和课程资源信息,建立儿童个性化模型,根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将靠前的课程资源优先推荐给儿童。
在另一方面,本发明还提出了一种基于儿童成长关键期的智慧早教用计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于儿童成长关键期的智慧早教程序,所述基于儿童成长关键期的智慧早教程序被所述处理器执行时实现如上述任一项所述的基于儿童成长关键期的智慧早教方法。
本发明还公开了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一项所述的基于儿童成长关键期的智慧早教方法。
相比于现有技术,本发明的有益效果在于:通过儿童的八大智能、年龄和二级分类之间的关系进行课程划分,能够划分选取每日课程资源,使每日课程资源在年龄、八大智能、二级分类的分布和总时长达到每日课程总时长预设值,使课程资源分布合理,能使儿童的八大智能均衡发展。通过积分计算以及积分累加算法,实现了总积分排名,能够为儿童学习带来较好的反馈。本方案通过根据儿童在一段时间内的行为数据,可以分析出不同儿童的不同性格、喜好、长处等,可根据这行数据建立模型,给儿童推荐喜欢的课程资源、增添缺乏的课程资源,提高儿童对课程的兴趣和提高自身能力。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
图1是本发明一种基于儿童成长关键期的智慧早教方法的具体实施例流程示意图;
图2是本发明一种基于儿童成长关键期的智慧早教系统的具体实施例框架示意图;
图3是本发明一种基于儿童成长关键期的智慧早教计算机设备的具体实施例框架示意图;
图4是本发明一种非临时性计算机可读存储介质的具体实施例框架示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不应理解为必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。此外,本领域的技术人员可以将本说明书中描述的不同实施例或示例进行接合和组合。
一方面,如图1所示的方法流程图,本发明提出了一种基于儿童成长关键期的智慧早教方法的具体实施例流程示意图,包括以下步骤:
步骤S1、根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分,将数量值低于阈值的二级分类合并为一个支持课程分配的合集;根据课程划分选取每日课程资源,使每日课程资源在年龄、八大智能、二级分类的分布和总时长达到每日课程总时长预设值;
步骤S2、获取儿童有效收听的课程资源的次数,并利用欧拉常数计算关于收听课程资源的积分值;根据八大智能以及每个年龄段对应的二级分类,计算出各个年龄段内的八大智能对应的二级分类的数量,以及在各年龄段内的八大智能的二级分类课程资源分布的权重比值,获取数值为儿童获取的成长值之和再乘以对应的权重比值的积分值,累计儿童各个年龄段的积分值之和,得到不同儿童的总积分排名;
步骤S3、根据儿童在一段时间内的行为数据建立模型,利用模型为儿童推荐喜欢的课程资源、增添缺乏的课程资源;根据一段时间内儿童信息、儿童的行为数据和课程资源信息,建立儿童个性化模型,根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将排在前面的课程资源优先推荐给儿童。
作为较佳的实施方式,所述步骤S1包括,将各个年龄、八大智能对应的课程资源按照二级分类对应课程资源数量的比例来分配课程资源,使课程资源量最少的二级分类和最多的二级分类比例不超过可调整的预定阈值(可包括但不限于1:3),且被收听一次的课程资源的收听总时长小于目标时长;
作为可选的实施方式,步骤S1中记载的将各个年龄、八大智能对应的课程资源按照二级分类对应课程资源数量的比例来分配课程资源的步骤,还包括八大智能、年龄和二级分类及其多重级分类之间的关系。
例如,需要按顺序分配的课程资源则是按数量比进行分配,如普通课程资源:专辑课程资源=5:1,则普通课程资源分配5首,专辑课程资源分配1首。
具体地,步骤S1的目的在于实现课程归类,合理的课程资源分布,能使儿童的八大智能均衡发展。其中,八大智能是指语言智能、数学逻辑智能、空间智能、身体运动智能、音乐智能、人际智能、自我认知智能、自然认知智能;
课程资源是根据八大智能、年龄和二级分类之间的关系进行划分,在划分过程中,会存在一些二级分类数量太少的问题。
在本实施例中,将数量过少的二级分类归并为一个合集,是的该合集数量支持每天课程的分配,以解决二级分类数量少的问题。
在本实施例中,使用插空法将与一组二级分类课程资源按顺序插入另一组二级分类课程资源的偶数位置,使二级分类课程资源排序时长均匀;
具体地,二级分类课程资源存在排序时长分布不均问题(如第一首几十秒,第二首二十几分钟),会导致每天的课程资源分配总数量差过大(如今天15首,明天30首);为了应对这个问题,在本实施例中采用插空法。如与原时长顺序为1、2、3、4、5、6,排序完后的顺序变为1、4、2、5、3、6。上述处理步骤为先将二级分类的课程资源按升序排序,再从中间分为两组。在遍历时长较短的一组课程资源,按顺序将另一组的每个课程资源插入该组的偶数位置。
在本实施例中,为了确保每天课程总时长要达到目标时长,需要在上一实施例的基础上创建空列表,将分配好课程以顺序循环的方式添加至空列表,当列表的播放时长达到目标时长时停止。
具体地,在一实施例中,各年龄段(0-6岁)的初始目标时长分别为30分钟、45分钟、45分钟、60分钟、90分钟、120分钟。为了确保每天课程总时长要大于目标时长且不能超过太多,创建一个空列表,将分配好的排行列表按顺序循环添加到列表中,直到总时长超过目标时长后为止。
作为较佳的实施例,步骤S2的目的在于实现儿童有效收听一首歌n(n为正整数)遍,则获得积分S,并根据积分进行排名,以增加学习反馈作用。
具体地,总积分排名和积分值算法如下:
(1)、儿童有效收听一首歌n遍,则获得的积分S为
S=1/1+1/2+1/3+…+1/n=ln(n+1)+r,其中r被称为欧拉常数,约等于0.577218。
通过上式可知,儿童的昨日总积分等于儿童昨日有效收听的所有课程资源的积分之和。
(2)、每个智能对应多个二级分类,每个年龄段对应多个二级分类,则可以计算出在各个年龄段内,八大智能对应的二级分类数量比例,及在各年龄段内,八大智能的二级分类课程资源分布的权重比值。
儿童的积分值计算方法如下:
假设儿童在1-2岁内,对应的权重为Wa、Wb、Wc、Wd、We、Wf、Wg、Wh,有效收听一首歌n遍,这首歌属于三种智能语言a、逻辑b、空间c,则儿童有效学完这首歌后增加的成长积分为
Sa1=Sb1=Sc1=1/1+1/2+1/3+…+1/n=1n(n+1)+r;
通过上式,我们不难发现,儿童在1-2岁内所获得的的各个积分值=儿童有效学习每首歌曲获取的成长值之和再乘以对应的权重,即:
Sa=Sa总*Wa,Sb=Sb总*Wb,Sc=Sc总*Wc,Sd=Sd总*Wd,Se=Se总*We,Sf=Sf总*Wf,Sg=Sg总*Wg;
则儿童的各个智能总成长值等于各个年龄段累计的各个积分值之和,如儿童0-6岁都有学习该课程,可该儿童的语言智能a的总成长值为Sa=S1+S2+S3+S4+S5+S6;
在一个可能的实施方式中,步骤S3中记载的根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将排在前面的课程资源优先推荐给儿童的步骤包括,
将数据分为纯数值数据和文本数据;
对于纯数值数据,做如下预处理:
a、对于缺失值,根据不同情况进行填充或者删除;
b、对于异常值进行处理,包括若课程资源收听时长大于课程资源时长,则去除,若课程资源点播量和收藏量服从正态分布,则设值超过N倍(具体可包括但不限于10倍)的方差为异常并去除;
c、从已有的数值数据直接提取课程资源时长、课程资源收听总次数、课程资源收藏量、课程资源收听总天数、课程资源收听总用户数、课程资源大小;
d、获取人为添加的对结果有影响的特征。
其中,步骤d的特征可包括但不限于,课程资源日均收听次数=课程资源收听总次数//课程资源收听总天数;课程资源收听时长均值=课程资源收听总时长//课程资源收听总次数;课程资源名称长度=len(课程资源名称);课程资源收听时长占比=课程资源收听时长均值//课程资源时长。
进一步技术方案为,上述步骤d中之后还包括:
使一条课程资源的文本数据包括课程资源的一级分类、二级分类、标签、名称、简介以及用户对该课程资源的评价,并实施如下处理步骤:
a、将每一条课程资源的所有文本拼接,提取关键词、特征词列表;
b、添加关键词和去掉停用词;
c、对词向量列表进行训练,生成词向量矩阵;
具体地,在本实施例中,可通过调用IF-IDF,IF-IDF是一种用来评估某个词对于一个语料库中某一份文件的重要程度.字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。计算公式如下:
①计算词频,指的是某一个给定的词语在该文件中出现的频率。即词w在文档d中出现的次数count(w,d)和文档d中总词数size(d)的比值,即tf(w,d)=count(w,d)/size(d)。
②计算逆向文件频率,是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。即文档总数n与词w所出现文件数docs(w,D)比值的对数,即idf=log(n/docs(w,D))。
③TF-IDF根据tf和idf为每一个文档d和由关键词w[1]…w[k]组成的查询串q计算一个权值,用于表示查询串q与文档d的匹配度,即
tf-idf(q,d)=sum{i=1..k|tf-idf(w[i],d)}=sum{i=1..k|tf(w[i],d)*idf(w[i])}。
d、当参数维度过高时,采用PCA降维,将数组维度降低(如降低至100维)。
具体地,在参数处理中,由于维度过高,可将几千维度的数组降至100维,去除影响不大的特征,并保留对结果影响大的主要成分,可使得到的结果准确。
进一步技术方案为,所述将数组维度降低的步骤之后还包括:
将处理过的纯数字数据数组和文本数据数组按行拼接,获得机器学习模型用于训练的数据;
将拼接好的数据,以课程资源收听总次数作为目标值且其余特征均为训练值进行标准化;
具体地,将拼接好的数据,课程资源收听总次数作为目标值,其余特征均为训练值。由于不同特征的数值大小不在统一量级,需要对每个特征进行标准化,计算公式如下:
Figure BDA0002458523240000131
其中
Figure BDA0002458523240000132
和S分别为特征的均值和标准差。
在本实施例中,采用模型对所有特征进行打分,选取与结果相关性最大的前N个(具体可包括但不限于10个)特征进行训练。
具体地,由于特征较多,在进行个性化推荐处理时,还需要对特征进行选择,在本实施例中通常采用GBDT模型对所有特征进行打分,选取与结果相关性最大的前N个(具体可包括但不限于10个)特征进行训练。
在本申请中,采用GBDT算法实现上述训练目的;
GBDT是一种常见的集成学习算法,底层是CART回归树,回归树分支时穷举每一个特征的每一个阈值寻找最好的分割点,衡量好坏的标准是最小化平方误差,常用与回归预测和特征选择。
GBDT进行特征选择的原理是计算所有的非叶子节点在分裂时加权不纯度(即下列步骤中的残差)的减少,减少得越多说明特征越重要。不纯度的减少实际上就是该节点此次分裂的收益,因此我们也可以这样理解,节点分裂时收益越大,该节点对应的特征的重要度越高。实现步骤如下:
A、初始化f_0(x)=0
B、对m=1,2,…,M,n=m-1
a、计算残差r_mi=y_m-f_n(x),i=1,2,...,N
b、拟合残差r_mi学习一个回归树,得到h_m(x)
c、更新f_m(x)=f_n+h_m(x)A
C、得到回归提升树公式
Figure BDA0002458523240000141
经过选择后,最终保留下来的特征主要有课程资源收听时长均值、课程资源收藏量、课程资源收听时长占比、二级分类等N个(具体可包括但不限于10个)特征。
进一步技术方案为,所述采用模型对所有特征进行打分,选取与结果相关性最大的前N个(具体可包括但不限于10个)特征进行训练的步骤之后包括:
构建自定义集成算法,对每个回归模型进行参数调优,计算出评分,选择评分最高的模型和对应的参数。
具体地,在本实施例中,通过构建自定义集成算法estimators实现(集成算法的子模型分别为RandomForestRegressor、支持向量机、线性回归模型),并且使用GridSearchCV对每个回归模型进行参数调优,计算出评分,选择评分最高的模型和对应的参数。
其中,线性回归模型(LinearRegression),及每条数据有n个特征,每个特征对应着一个自己的权重值w,与权重的乘积再加上一个偏置值b。原理是最小二乘法,即通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。该模型的参数和权重计算公式为
Figure BDA0002458523240000151
其中,X为训练集,y为训练结果集;
上述支持向量机(support vector machine)是一种分类算法,也可用来做回归。是通过寻找一个最佳决策面,使得所有数据坐标中,离该面的距离最远的两边的点之间的距离最近。
在本实施例中,还采用了随机森林进行决策树的生成,随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树。实现原理是随机选取训练数量和部分特征,生成决策树。可生成多颗决策树,采用投票机制来决定生成的最终结果。
在本实施例中,对于模型和对应参数的评分指标采用R平方值,表示回归方程在多大程度上解释了因变量的变化,或表示方程对观测值的拟合程度。
在本方案中采用的计算公式如下,
R平方值=回归平方和(ssreg)/总平方和(sstotal),
其中回归平方和=总平方和-残差平方和(ssresid),总平方和=y的实际值与平均值的平方差之和,残差平方和=y的估计值与y的实际值的平方差之和。
在本实施例中,还采用了网格搜索的方式进行参数调优,其中,网格搜索(GridSearchCV)是一种使用的参数调优方法,传入模型和多个参数数组,参数会进行组合,如三个参数数量为3:2:5,则有3*2*5=30种参数组合,将每种参数组合带入模型中,算出评分和参数,评分最高的参数组称为最佳模型。
作为较佳的实施方式,所述选择评分最高的模型和对应的参数的步骤之后还包括:
用已经训练好的回归模型对每个用户为学习过的课程资源进行预测课程资源的喜好程度(即用户可能的喜好程度,课程资源收听总次数越高,表示用户可能的喜欢程度越高),按喜好程度降序排序;
从重新排序的课程资源中为用户分配学习课程资源,从而使用了本方案的早教方法实现了可预知儿童在不同年龄期内该培养哪些关键技能,并根据儿童的不同喜好,每天智能推荐儿童喜欢且能提高这些关键技能的课程资源给儿童学习,使儿童能得到全面发展。
在另一方面,如图2所示,本发明还提出了一种基于儿童成长关键期的智慧早教系统,包括以下单元:
课程划分单元100,用于根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分,将数量值低于阈值的二级分类合并为一个支持课程分配的合集;根据课程划分选取每日课程资源,使每日课程资源在年龄、八大智能、二级分类的分布和总时长达到每日课程总时长预设值;
积分计算单元200,用于获取儿童有效收听的课程资源的次数,并利用欧拉常数计算关于收听课程资源的积分值;根据八大智能以及每个年龄段对应的二级分类,计算出各个年龄段内的八大智能对应的二级分类的数量,以及在各年龄段内的八大智能的二级分类课程资源分布的权重比值,获取数值为儿童获取的成长值之和再乘以对应的权重比值的积分值,累计儿童各个年龄段的积分值之和,得到不同儿童的总积分排名;
课程推荐单元300,根据儿童在一段时间内的行为数据建立模型,利用模型为儿童推荐喜欢的课程资源、增添缺乏的课程资源;根据一段时间内儿童信息、儿童的行为数据和课程资源信息,建立儿童个性化模型,根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将靠前的课程资源优先推荐给儿童。
其中,课程划分单元100、积分计算单元200,课程资源推荐单元300,旨在实现如图1所示的方法步骤,以使本申请提出的智慧早教系统能够实现如图本申请的方法的有益效果。
在另一方面,如图3所示,本发明还提出了一种基于儿童成长关键期的智慧早教用计算机设备,包括存储器400、处理器500及存储在所述存储器400上并可在所述处理器500上运行的基于儿童成长关键期的智慧早教程序,所述基于儿童成长关键期的智慧早教程序被所述处理器执行时实现如上述任一项所述的基于儿童成长关键期的智慧早教方法。
其中,所述存储器可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其它类型的静态存储设备,随机存取存储器(random access memory,RAM))或者可存储信息和指令的其它类型的动态存储设备,也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质,但不限于此。存储器可以是独立存在,通过通信总线与处理器相连接。存储器也可以和处理器集成在一起。
如图4所示,本发明还公开了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一项所述的基于儿童成长关键期的智慧早教方法。
所述存储介质可以是前述服务器的内部存储单元,例如服务器的硬盘或内存。所述存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述系统的单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的单元,可以通过其它的方式实现。例如,以上所描述的单元实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如一个以上单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其他各种相应的改变以及形变,而所有的这些改变以及形变应该属于本发明权利要求的保护范围之内。

Claims (5)

1.一种基于儿童成长关键期的智慧早教方法,其特征在于,包括以下步骤:
根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分,将数量值低于阈值的二级分类合并为一个支持课程分配的合集;根据课程划分选取每日课程资源,使每日课程资源在年龄、八大智能、二级分类的分布和总时长达到每日课程总时长预设值;
获取儿童有效收听的课程资源的次数,并利用欧拉常数计算关于收听课程资源的积分值;根据八大智能以及每个年龄段对应的二级分类,计算出各个年龄段内的八大智能对应的二级分类的数量,以及在各年龄段内的八大智能的二级分类课程资源分布的权重比值,获取数值为儿童获取的成长值之和再乘以对应的权重比值的积分值,累计儿童各个年龄段的积分值之和,得到不同儿童的总积分排名;
根据儿童在一段时间内的行为数据建立模型,利用模型为儿童推荐喜欢的课程资源、增添缺乏的课程资源;根据一段时间内儿童信息、儿童的行为数据和课程资源信息,建立儿童个性化模型,根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将排在前面的课程资源优先推荐给儿童;
所述根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将排在前面的课程资源优先推荐给儿童的步骤包括,
将数据分为纯数值数据和文本数据;
对于纯数值数据,做如下预处理:
a、对于缺失值,根据不同情况进行填充或者删除;
b、对于异常值进行处理,包括若课程资源收听时长大于课程资源时长,则去除,若课程资源点播量和收藏量服从正态分布,则设值超过N倍的方差为异常并去除;
c、从已有的数值数据直接提取课程资源时长、课程资源收听总次数、课程资源收藏量、课程资源收听总天数、课程资源收听总用户数、课程资源大小;
d、获取人为添加的对结果有影响的特征;
使一条课程资源的文本数据包括课程资源的一级分类、二级分类、标签、名称、简介以及用户对该课程资源的评价,并实施如下处理步骤:
a、将每一条课程资源的所有文本拼接,提取关键词、特征词列表;
b、添加关键词和去掉停用词;
c、对词向量列表进行训练,生成词向量矩阵;
d、当参数维度过高时,采用PCA降维,将数组维度降低;
将处理过的纯数字数据数组和文本数据数组按行拼接 ,获得机器学习模型用于训练的数据;
将拼接好的数据,以课程资源收听总次数作为目标值且其余特征均为训练值进行标准化;
采用模型对所有特征进行打分,选取与结果相关性最大的前N个特征进行训练;
构建自定义集成算法,对每个回归模型进行参数调优,计算出评分,选择评分最高的模型和对应的参数;
用已经训练好的回归模型对每个用户为学习过的课程资源进行预测课程资源的喜好程度,按喜好程度降序排序;
根据重新排序的课程资源为用户分配学习课程资源。
2.根据权利要求1所述的基于儿童成长关键期的智慧早教方法,其特征在于,所述根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分的步骤包括,将各个年龄、八大智能对应的课程资源按照二级分类对应课程资源数量的比例来分配课程资源,使课程资源量最少的二级分类和最多的二级分类比例不超过可调整的预定阈值,且被收听一次的课程资源的收听总时长小于目标时长;
使用插空法将与一组二级分类课程资源按顺序插入另一组二级分类课程资源的偶数位置,使二级分类课程资源排序时长均匀;
并创建空列表,将分配好课程以顺序循环的方式添加至空列表,当列表的播放时长达到目标时长时停止。
3.一种基于儿童成长关键期的智慧早教系统,其特征在于,包括以下单元:
课程划分单元,用于根据儿童的八大智能、年龄和二级分类之间的关系进行课程划分,将数量值低于阈值的二级分类合并为一个支持课程分配的合集;根据课程划分选取每日课程资源,使每日课程资源在年龄、八大智能、二级分类的分布和总时长达到每日课程总时长预设值;
积分计算单元,用于获取儿童有效收听的课程资源的次数,并利用欧拉常数计算关于收听课程资源的积分值;根据八大智能以及每个年龄段对应的二级分类,计算出各个年龄段内的八大智能对应的二级分类的数量,以及在各年龄段内的八大智能的二级分类课程资源分布的权重比值,获取数值为儿童获取的成长值之和再乘以对应的权重比值的积分值,累计儿童各个年龄段的积分值之和,得到不同儿童的总积分排名;
课程推荐单元,用于根据儿童在一段时间内的行为数据,建立模型,给儿童推荐喜欢的课程资源,增添缺乏的课程资源;根据一段时间内儿童信息、儿童的行为数据和课程资源信息,建立儿童个性化模型,根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将靠前的课程资源优先推荐给儿童;其中,所述根据模型预测儿童对未学习过的课程资源的喜好程度,再根据预测的未学习课程资源的喜好程度进行排序,将排在前面的课程资源优先推荐给儿童的步骤包括,
将数据分为纯数值数据和文本数据;
对于纯数值数据,做如下预处理:
a、对于缺失值,根据不同情况进行填充或者删除;
b、对于异常值进行处理,包括若课程资源收听时长大于课程资源时长,则去除,若课程资源点播量和收藏量服从正态分布,则设值超过N倍的方差为异常并去除;
c、从已有的数值数据直接提取课程资源时长、课程资源收听总次数、课程资源收藏量、课程资源收听总天数、课程资源收听总用户数、课程资源大小;
d、获取人为添加的对结果有影响的特征;
使一条课程资源的文本数据包括课程资源的一级分类、二级分类、标签、名称、简介以及用户对该课程资源的评价,并实施如下处理步骤:
a、将每一条课程资源的所有文本拼接,提取关键词、特征词列表;
b、添加关键词和去掉停用词;
c、对词向量列表进行训练,生成词向量矩阵;
d、当参数维度过高时,采用PCA降维,将数组维度降低;
将处理过的纯数字数据数组和文本数据数组按行拼接 ,获得机器学习模型用于训练的数据;
将拼接好的数据,以课程资源收听总次数作为目标值且其余特征均为训练值进行标准化;
采用模型对所有特征进行打分,选取与结果相关性最大的前N个特征进行训练;
构建自定义集成算法,对每个回归模型进行参数调优,计算出评分,选择评分最高的模型和对应的参数;
用已经训练好的回归模型对每个用户为学习过的课程资源进行预测课程资源的喜好程度,按喜好程度降序排序;
根据重新排序的课程资源为用户分配学习课程资源。
4.一种基于儿童成长关键期的智慧早教用计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于儿童成长关键期的智慧早教程序,所述基于儿童成长关键期的智慧早教程序被所述处理器执行时实现如权利要求1或2所述的基于儿童成长关键期的智慧早教方法。
5.一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1或2所述的基于儿童成长关键期的智慧早教方法。
CN202010315867.1A 2020-04-20 2020-04-20 基于儿童成长期的智慧早教方法、系统、设备、存储介质 Active CN111402098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010315867.1A CN111402098B (zh) 2020-04-20 2020-04-20 基于儿童成长期的智慧早教方法、系统、设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010315867.1A CN111402098B (zh) 2020-04-20 2020-04-20 基于儿童成长期的智慧早教方法、系统、设备、存储介质

Publications (2)

Publication Number Publication Date
CN111402098A CN111402098A (zh) 2020-07-10
CN111402098B true CN111402098B (zh) 2023-02-28

Family

ID=71431654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010315867.1A Active CN111402098B (zh) 2020-04-20 2020-04-20 基于儿童成长期的智慧早教方法、系统、设备、存储介质

Country Status (1)

Country Link
CN (1) CN111402098B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528656A (zh) * 2016-10-20 2017-03-22 杨瀛 一种基于学员历史和实时学习状态参量实现课程推荐的方法和系统
CN106600492A (zh) * 2016-12-12 2017-04-26 戴雨霖 一种定制化课程生成系统
CN106846191A (zh) * 2016-11-25 2017-06-13 北京粉笔蓝天科技有限公司 一种课程列表的编排方法、系统及服务器
CN107808144A (zh) * 2017-11-10 2018-03-16 深圳市唯特视科技有限公司 一种基于视频时空关系进行自我监督嵌入姿态学习方法
CN108345697A (zh) * 2018-03-22 2018-07-31 山东财经大学 面向大学生群体的智慧课程推荐方法、系统及存储介质
CN109299372A (zh) * 2018-10-18 2019-02-01 浙江正元智慧科技股份有限公司 一种基于协同过滤的智慧选课推荐方法
CN109740861A (zh) * 2018-12-12 2019-05-10 中国联合网络通信集团有限公司 一种学习数据分析方法及装置
CN109740048A (zh) * 2018-12-12 2019-05-10 中国联合网络通信集团有限公司 一种课程推荐方法及装置
CN109903205A (zh) * 2019-03-27 2019-06-18 嘉应学院 一种公开课智能推荐方法以及管理系统
WO2019160212A1 (ko) * 2018-02-13 2019-08-22 크레스 아동의 학습 발달을 기반으로 한 콘텐츠 추천 시스템 및 그 방법
CN110728431A (zh) * 2019-09-18 2020-01-24 北京绿橙天下信息技术有限公司 一种基于能力轴的排课方法及装置
CN110929163A (zh) * 2019-12-09 2020-03-27 上海复深蓝软件股份有限公司 课程推荐方法、装置、计算机设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528656A (zh) * 2016-10-20 2017-03-22 杨瀛 一种基于学员历史和实时学习状态参量实现课程推荐的方法和系统
CN106846191A (zh) * 2016-11-25 2017-06-13 北京粉笔蓝天科技有限公司 一种课程列表的编排方法、系统及服务器
CN106600492A (zh) * 2016-12-12 2017-04-26 戴雨霖 一种定制化课程生成系统
CN107808144A (zh) * 2017-11-10 2018-03-16 深圳市唯特视科技有限公司 一种基于视频时空关系进行自我监督嵌入姿态学习方法
WO2019160212A1 (ko) * 2018-02-13 2019-08-22 크레스 아동의 학습 발달을 기반으로 한 콘텐츠 추천 시스템 및 그 방법
CN108345697A (zh) * 2018-03-22 2018-07-31 山东财经大学 面向大学生群体的智慧课程推荐方法、系统及存储介质
CN109299372A (zh) * 2018-10-18 2019-02-01 浙江正元智慧科技股份有限公司 一种基于协同过滤的智慧选课推荐方法
CN109740861A (zh) * 2018-12-12 2019-05-10 中国联合网络通信集团有限公司 一种学习数据分析方法及装置
CN109740048A (zh) * 2018-12-12 2019-05-10 中国联合网络通信集团有限公司 一种课程推荐方法及装置
CN109903205A (zh) * 2019-03-27 2019-06-18 嘉应学院 一种公开课智能推荐方法以及管理系统
CN110728431A (zh) * 2019-09-18 2020-01-24 北京绿橙天下信息技术有限公司 一种基于能力轴的排课方法及装置
CN110929163A (zh) * 2019-12-09 2020-03-27 上海复深蓝软件股份有限公司 课程推荐方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111402098A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN110188272B (zh) 一种基于用户背景的社区问答网站标签推荐方法
Chen et al. General functional matrix factorization using gradient boosting
CN111539197B (zh) 文本匹配方法和装置以及计算机系统和可读存储介质
CN103699521A (zh) 文本分析方法及装置
CN106503192A (zh) 基于人工智能的命名实体识别方法及装置
Gkotsis et al. It's all in the content: state of the art best answer prediction based on discretisation of shallow linguistic features
CN110543564B (zh) 基于主题模型的领域标签获取方法
CN104572982B (zh) 基于问题引导的个性化推荐方法及系统
CN109492213B (zh) 句子相似度计算方法和装置
EP3940582A1 (en) Method for disambiguating between authors with same name on basis of network representation and semantic representation
CN111914162B (zh) 一种基于知识图谱的个性化学习方案引导方法
CN111242310A (zh) 特征有效性评估方法、装置、电子设备及存储介质
CN111737558A (zh) 一种资讯推荐方法、装置及计算机可读存储介质
CN110096686A (zh) 基于人工智能的多媒体教材编辑方法及其系统
US10354010B2 (en) Information processing system, an information processing method and a computer readable storage medium
Ben-Shimon et al. An ensemble method for top-N recommendations from the SVD
CN110781300A (zh) 基于百度百科知识图谱的旅游资源文化特色评分算法
Mnih et al. Learning label trees for probabilistic modelling of implicit feedback
CN111402098B (zh) 基于儿童成长期的智慧早教方法、系统、设备、存储介质
CN108550019A (zh) 一种简历筛选方法及装置
CN109344319B (zh) 一种基于集成学习的线上内容热度预测方法
KR20170087434A (ko) 테이블 구조 및 데이터 특성에 따른 통계 분석 함수 추천 시스템
US10606956B2 (en) Semantic textual similarity system
Arifin et al. Automatic essay scoring for Indonesian short answers using siamese Manhattan long short-term memory
CN115738285A (zh) 一种游戏质量评价反馈方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 518000 R & D building 2103, block B, building 1, Shenzhen International Innovation Valley, Dashi 1st Road, Xili community, Nanshan District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen huohuohuotu Intelligent Technology Co.,Ltd.

Address before: 518000 unit 07, 9 floor, Changhong science and technology building, 18 Nanshan District science and technology south twelve Road, Shenzhen, Guangdong.

Applicant before: SHENZHEN ALILO DIGITAL TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant