CN116578755A

CN116578755A - 基于人工智能和大数据的信息分析系统及方法

Info

Publication number: CN116578755A
Application number: CN202210325786.9A
Authority: CN
Inventors: 白红英
Original assignee: Jiangsu Zhi Zhi Electronic Technology Co ltd
Current assignee: Zhangjiakou Weizhi Network Technology Co ltd
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2023-08-11
Anticipated expiration: 2042-03-30
Also published as: CN116578755B

Abstract

本发明公开了基于人工智能和大数据的信息分析系统及方法，包括：学习信息采集模块、数据库、信息分析模块、机器学习模块和训练调整模块，通过学习信息采集模块采集测试、学习和教学数据，通过数据库存储并管理采集到的所有数据，通过信息分析模块分析测试数据和教学数据并绘制能力曲线，通过机器学习模块拟合能力曲线并建立教学筛选模型，通过训练调整模块筛选教学对象和训练试题，检验训练成果，根据用户的综合学习能力和教师的综合教学能力，匹配合适的教学对象和训练试题，帮助用户学习能力得到了综合且稳定提高。

Description

基于人工智能和大数据的信息分析系统及方法

技术领域

本发明涉及信息分析技术领域，具体为基于人工智能和大数据的信息分析系统及方法。

背景技术

随着时代发展，信息化和数字化逐渐成为发展趋势，通过运用数字信息为社会的各行各业服务帮助有效释放了人力成本，在教育领域的信息化建设和数据分析，能够综合评估用户学习能力，帮助用户在学习上得到高效训练以迅速提升学习水平；

现有的通过信息分析对用户学习进行辅助训练的方式，存在一定弊端：首先，缺乏对教学信息的全面且科学的分析，用户的学习进度受到一定的迟滞影响；其次，教学信息更迭较快，无法通过大数据分析和人工智能对海量信息进行归纳并实时更新以适应教学信息的变化，帮助及时更换更好的教学方案和辅助训练方式；最后，在教学信息分析方面，通常只侧重于对学习方的能力进行评估分析，忽略了教育方的能力对于学习方也存在影响，使得学习无法快速推进或容易到达瓶颈，降低了学习效果。

所以，人们需要基于人工智能和大数据的信息分析系统及方法来解决上述问题。

发明内容

本发明的目的在于提供基于人工智能和大数据的信息分析系统及方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：基于人工智能和大数据的信息分析系统，其特征在于：所述系统包括：学习信息采集模块、数据库、信息分析模块、机器学习模块和训练调整模块；

所述学习信息采集模块用于采集测试、学习和教学数据；

所述数据库用于存储并管理采集到的所有数据；

所述信息分析模块用于分析测试数据和教学数据并绘制能力曲线；

所述机器学习模块用于拟合能力曲线并建立教学筛选模型；

所述训练调整模块用于筛选教学对象和训练试题，检验训练成果。

进一步的，所述学习信息采集模块包括测试信息采集单元、学习记录采集单元和教学信息采集单元，所述测试信息采集单元用于采集历史数据：采集用户在做试题时的测试结果数据；所述学习记录采集单元用于采集用户在做对应试题前的学习记录；所述教学信息采集单元用于采集当前已有的教师的教学成果数据，将采集到的所有数据传输到所述数据库中。

进一步的，所述信息分析模块包括学习能力分析单元和教学能力分析单元，所述学习能力分析单元用于依据测试结果数据分析对应用户的学习能力，绘制学习能力曲线；所述教学能力分析单元用于依据教学成果数据分析教师的教学能力，绘制教学能力曲线，将教学能力曲线传输到所述机器学习模块中。

进一步的，所述机器学习模块包括数据曲线拟合单元和筛选模型建立单元，所述数据曲线拟合单元用于对学习能力曲线和教学能力曲线进行拟合；所述筛选模型建立单元用于依据拟合结果建立筛选函数。

进一步的，所述教学调整模块包括教学对象筛选单元、训练试题筛选单元和训练成果检验单元，所述教学对象筛选单元用于分析用户在训练平台的登录数据，分析筛选函数的误差数据，筛选与用户匹配的教师，获取最终匹配的教育和学习对象；所述训练试题筛选单元用于分析学习记录信息，绘制记忆曲线，对记忆曲线进行拟合并为对应用户筛选训练试题进行测试；所述训练成果检验单元用于在选择教学对象和测试试题后，检验用户的训练成果，实时更新学习和教学数据，调整筛选函数。

基于人工智能和大数据的信息分析方法，其特征在于：包括以下步骤：

S1：采集用户学习数据和测试数据以及教师的教学成果数据；

S2：分析用户测试数据和教师的教学成果数据，绘制能力曲线，建立筛选函数；

S3：分析学习数据，生成筛选函数误差数据，调整筛选函数，筛选教学对象；

S4：分析用户学习记录信息，绘制记忆曲线，筛选训练试题；

S5：检验用户训练成果。

进一步的，在步骤S1-S2中：采集用户在做试题时的训练结果数据：采集到随机一个用户在不同试卷中的错题数量集合为a＝{a1，a2，...，an}，每张试卷的试题数量相等，统计到对应用户在做对应试卷前登录训练平台的时长集合为t＝{t1，t2，...，tn}，其中，n表示对应用户做的试卷数量，每张试卷中的试题属于同一类型，共有n种类型，获取到不同类型试题的难度系数集合为w＝{w1，w2，...，wn}，难度系数范围为(0，1)，根据下列公式计算用户进行随机一种试题测试时的学习能力系数Pi：

其中，wi表示对应类型试题的难度系数，ai表示用户在对应试卷中的错题数量，ti表示用户在做对应试卷前登录训练平台的时长，w_min、a_min分别表示集合w和集合a中的最小值，w_max、a_max分别表示集合w和a中的最大值，得到用户测试的学习能力系数集合为P＝{P1，P2，...，Pn}，绘制学习能力曲线：试题种类为自变量，学习能力系数为因变量，通过对用户在学习训练平台上的学习数据进行综合分析计算用户的学习能力系数的目的在于帮助绘制用户的综合学习能力曲线，由于数据属性不同，数据的边界性不同：试题的难度系数、错题数量都有一定的边界性，而训练时长不具边界性，采用正态分布的方式将时长数据进行处理，有利于为数据解析提供便利。

进一步的，采集到随机一名教师对每种试题进行教学的时长集合为T＝{T1，T2，...，Tn}，对应进行教学的用户在被测试时，每种试题的平均成绩集合为b＝{b1，b2，...，bn}，根据下列公式计算对应教师对于随机一种试题的教学能力系数Qi：

其中，Ti表示对应教师对随机一种试题进行教学的时长，bi表示对应教师教学的用户关于对应类型试题的平均成绩，b_min和b_max分别表示集合b中的最小值和最大值，得到教师对所有试题的教学能力系数集合为Q＝{Q1，Q2，...，Qn}，绘制教学能力曲线：试题种类为自变量，教学能力系数为因变量，对学习能力曲线和教学能力曲线进行拟合，建立筛选函数：其中，f(x)表示拟合后的学习能力曲线函数，F(X)表示拟合后的教学能力曲线函数，通过对教师的教学信息进行分析并计算教学能力系数的目的在于分析教学的综合能力并帮助绘制教学能力曲线，与学习能力曲线进行匹配，为用户选择合适的教学对象以提升学习效果，将教学数据做和学习数据同样的处理方式，有利于避免分析能力曲线时出现数据属性的偏差从而影响匹配结果。

进一步的，在步骤S3中：采集到用户登录训练平台的总时长集合为t^’＝{t1^’，t2^’，...，tk^’}，其中，k表示用户数量，将登录总时长作为误差数据，将筛选函数调整为：其中，ti^’表示随机一个用户登录总时长；得到随机一个教师的教学能力曲线函数和随机一个用户的学习能力曲线函数后代入函数Y_调，获取对应用户的登录总时长并代入函数Y_调，得到随机一个用户与所有教师的教学匹配程度集合为Y^’＝{Y1^’，Y2^’，...，Ym^’}，其中，m表示教师数量，筛选匹配程度最高的教师对用户进行教学，最高匹配程度为Y_max ^’，由于用户登录训练平台的初始时间不同，登录时间短的用户的学习数据存在一定的不可信性或片面性，将时长作为误差数据：登录时间越长，学习数据分析结果越可信且全面，对筛选函数进行调整后，通过分析学习能力和教学能力曲线的差异性匹配教学对象，有利于帮助用户的学习水平得到综合提升。

进一步的，在步骤S4-S5中：采集用户学习记录：获取到用户第一次练习随机一种试题的时间点为：T_初，练习同一种试题与第一次练习的时间间隔集合为T_隔＝{T1_隔，T2_隔，...，Te_隔}，e+1表示练习对应试题次数，得到用户每次练习时正确试题数集合，根据时间间隔和正确试题数绘制记忆曲线，对曲线进行拟合，得到对应类型试题的记忆曲线函数为y＝f(x^’)，获取用户对所有类型试题的记忆曲线函数，根据筛选训练试题：依据从大到小的顺序筛选出对应试题依次供用户练习，在用户经过匹配的教师教学和对应试题练习后检验用户训练成果，实时更新学习和教学数据并调整筛选函数，用户在做训练试题时往往没有自己的规划，对学习效果产生一定影响，通过分析用户学习记录数据绘制遗忘曲线，判断用户对不同类型训练试题的遗忘程度，选择遗忘程度大的训练试题进行优先训练，有利于帮助用户巩固记忆，学习和教学数据更新速度快，通过机器学习实时获取更新数据并调整筛选函数，有利于灵活变换教学试题和对象，提高学习水平的稳定性。

与现有技术相比，本发明所达到的有益效果是：

本发明通过大数据挖掘学习信息、教学信息，将不同属性的信息进行归纳总结，绘制用户的学习能力曲线和教师的教学能力曲线，通过分析曲线间的差异性分析教学对象的匹配程度，匹配综合能力合适的教学对象，帮助用户的学习效果得到综合性提高；通过采集分析用户的学习记录数据，绘制遗忘曲线，判断用户对不同类型训练试题的遗忘程度，选择遗忘程度大的训练试题进行优先训练，有利于帮助用户巩固记忆；通过人工智能实时获取更新数据并调整筛选函数，有利于灵活变换教学试题和对象，提高学习水平的稳定性。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明基于人工智能和大数据的信息分析系统的结构图；

图2是本发明基于人工智能和大数据的信息分析方法的步骤图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

请参阅图1-图2，本发明提供技术方案：基于人工智能和大数据的信息分析系统，其特征在于：系统包括：学习信息采集模块、数据库、信息分析模块、机器学习模块和训练调整模块；

学习信息采集模块用于采集测试、学习和教学数据；

数据库用于存储并管理采集到的所有数据；

信息分析模块用于分析测试数据和教学数据并绘制能力曲线；

机器学习模块用于拟合能力曲线并建立教学筛选模型；

训练调整模块用于筛选教学对象和训练试题，检验训练成果。

学习信息采集模块包括测试信息采集单元、学习记录采集单元和教学信息采集单元，测试信息采集单元用于采集历史数据：采集用户在做试题时的测试结果数据；学习记录采集单元用于采集用户在做对应试题前的学习记录；教学信息采集单元用于采集当前已有的教师的教学成果数据，将采集到的所有数据传输到数据库中。

信息分析模块包括学习能力分析单元和教学能力分析单元，学习能力分析单元用于依据测试结果数据分析对应用户的学习能力，绘制学习能力曲线；教学能力分析单元用于依据教学成果数据分析教师的教学能力，绘制教学能力曲线，将教学能力曲线传输到机器学习模块中。

机器学习模块包括数据曲线拟合单元和筛选模型建立单元，数据曲线拟合单元用于对学习能力曲线和教学能力曲线进行拟合；筛选模型建立单元用于依据拟合结果建立筛选函数。

教学调整模块包括教学对象筛选单元、训练试题筛选单元和训练成果检验单元，教学对象筛选单元用于分析用户在训练平台的登录数据，分析筛选函数的误差数据，筛选与用户匹配的教师，获取最终匹配的教育和学习对象；训练试题筛选单元用于分析学习记录信息，绘制记忆曲线，对记忆曲线进行拟合并为对应用户筛选训练试题进行测试；训练成果检验单元用于在选择教学对象和测试试题后，检验用户的训练成果，实时更新学习和教学数据，调整筛选函数。

S5：检验用户训练成果。

在步骤S1-S2中：采集用户在做试题时的训练结果数据：采集到随机一个用户在不同试卷中的错题数量集合为a＝{a1，a2，...，an}，每张试卷的试题数量相等，统计到对应用户在做对应试卷前登录训练平台的时长集合为t＝{t1，t2，...，tn}，其中，n表示对应用户做的试卷数量，每张试卷中的试题属于同一类型，共有n种类型，获取到不同类型试题的难度系数集合为w＝{w1，w2，...，wn}，难度系数范围为(0，1)，根据下列公式计算用户进行随机一种试题测试时的学习能力系数Pi：

其中，wi表示对应类型试题的难度系数，ai表示用户在对应试卷中的错题数量，ti表示用户在做对应试卷前登录训练平台的时长，w_min、a_min分别表示集合w和集合a中的最小值，w_max、a_max分别表示集合w和a中的最大值，得到用户测试的学习能力系数集合为P＝{P1，P2，...，Pn}，绘制学习能力曲线：试题种类为自变量，学习能力系数为因变量，采用正态分布的方式将时长数据进行处理，规避了数据属性差异和边界性不同的问题，为数据的解析提供了便利。

采集到随机一名教师对每种试题进行教学的时长集合为T＝{T1，T2，...，Tn}，对应进行教学的用户在被测试时，每种试题的平均成绩集合为b＝{b1，b2，...，bn}，根据下列公式计算对应教师对于随机一种试题的教学能力系数Qi：

其中，Ti表示对应教师对随机一种试题进行教学的时长，bi表示对应教师教学的用户关于对应类型试题的平均成绩，b_min和b_max分别表示集合b中的最小值和最大值，得到教师对所有试题的教学能力系数集合为Q＝{Q1，Q2，...，Qn}，绘制教学能力曲线：试题种类为自变量，教学能力系数为因变量，对学习能力曲线和教学能力曲线进行拟合，建立筛选函数：其中，f(x)表示拟合后的学习能力曲线函数，F(X)表示拟合后的教学能力曲线函数，绘制教学能力曲线，与学习能力曲线进行匹配，为用户选择合适的教学对象以提升学习效果，将教学数据做和学习数据同样的处理方式，避免了分析能力曲线时出现数据属性的偏差从而影响匹配结果的问题。

在步骤S3中：采集到用户登录训练平台的总时长集合为t^’＝{t1^’，t2^’，...，tk^’}，其中，k表示用户数量，将登录总时长作为误差数据，将筛选函数调整为：其中，ti^’表示随机一个用户登录总时长；得到随机一个教师的教学能力曲线函数和随机一个用户的学习能力曲线函数后代入函数Y_调，获取对应用户的登录总时长并代入函数Y_调，得到随机一个用户与所有教师的教学匹配程度集合为Y^’＝{Y1^’，Y2^’，...，Ym^’}，其中，m表示教师数量，筛选匹配程度最高的教师对用户进行教学，最高匹配程度为Y_max ^’，通过分析学习能力和教学能力曲线的差异性匹配教学对象，帮助用户的学习水平得到了综合提升。

在步骤S4-S5中：采集用户学习记录：获取到用户第一次练习随机一种试题的时间点为：T_初，练习同一种试题与第一次练习的时间间隔集合为T_隔＝{T1_隔，T2_隔，...，Te_隔}，e+1表示练习对应试题次数，得到用户每次练习时正确试题数集合，根据时间间隔和正确试题数绘制记忆曲线，对曲线进行拟合，得到对应类型试题的记忆曲线函数为y＝f(x^’)，获取用户对所有类型试题的记忆曲线函数，根据筛选训练试题：依据/>从大到小的顺序筛选出对应试题依次供用户练习，在用户经过匹配的教师教学和对应试题练习后检验用户训练成果，实时更新学习和教学数据并调整筛选函数，选择遗忘程度大的训练试题进行优先训练，帮助用户巩固了记忆，通过机器学习实时获取更新数据并调整筛选函数，通过灵活变换教学试题和对象提高了用户学习水平的稳定性。

实施例一：采集到随机一个用户在不同试卷中的错题数量集合为a＝{a1，a2，a3}＝{50，10，30}，统计到对应用户在做对应试卷前登录训练平台的时长集合为t＝{t1，t2，t3}＝{20，60，30}，单位为：分钟，获取到不同类型试题的难度系数集合为w＝{w1，w2，w3}＝{0.6，0.8，0.4}，根据公式得到用户测试的学习能力系数集合为P＝{P1，P2，P3}＝{1.91，0.62，0}，绘制学习能力曲线，采集到随机一名教师对每种试题进行教学的时长集合为T＝{T1，T2，T3}＝{100，200，50}，单位为：小时，对应进行教学的用户在被测试时，每种试题的平均成绩集合为b＝{b1，b2，b3}＝{60，80，50}，单位为：分，根据公式/>得到教师对所有试题的教学能力系数集合为Q＝{Q1，Q2，Q3}＝{0.09，1.34，0}，绘制教学能力曲线，对学习能力曲线和教学能力曲线进行拟合，建立筛选函数：/>采集到用户登录训练平台的总时长集合为t^’＝{t1^’，t2^’，t3^’}＝{100，60，50}，将登录总时长作为误差数据，将筛选函数调整为：/>得到随机一个教师的教学能力曲线函数为：F(X)＝-2X²+1，随机一个用户的学习能力曲线函数为：/>对应用户的登录总时长为60，代入函数Y_调，得到对应教师和用户的匹配程度为2.4，得到对应用户与所有教师的教学匹配程度集合为Y^’＝{Y1^’，Y2^’，Y3^’}＝{2.4，0.6，1.8}，筛选匹配程度最高的教师对用户进行教学，最高匹配程度为Y_max ^’＝2.4。

最后应说明的是：以上所述仅为本发明的优选实例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于人工智能和大数据的信息分析系统，其特征在于：所述系统包括：学习信息采集模块、数据库、信息分析模块、机器学习模块和训练调整模块；

所述学习信息采集模块用于采集测试、学习和教学数据；

所述数据库用于存储并管理采集到的所有数据；

所述机器学习模块用于拟合能力曲线并建立教学筛选模型；

2.根据权利要求1所述的基于人工智能和大数据的信息分析系统，其特征在于：所述学习信息采集模块包括测试信息采集单元、学习记录采集单元和教学信息采集单元，所述测试信息采集单元用于采集历史数据：采集用户在做试题时的测试结果数据；所述学习记录采集单元用于采集用户在做对应试题前的学习记录；所述教学信息采集单元用于采集当前已有的教师的教学成果数据，将采集到的所有数据传输到所述数据库中。

3.根据权利要求1所述的基于人工智能和大数据的信息分析系统，其特征在于：所述信息分析模块包括学习能力分析单元和教学能力分析单元，所述学习能力分析单元用于依据测试结果数据分析对应用户的学习能力，绘制学习能力曲线；所述教学能力分析单元用于依据教学成果数据分析教师的教学能力，绘制教学能力曲线，将教学能力曲线传输到所述机器学习模块中。

4.根据权利要求1所述的基于人工智能和大数据的信息分析系统，其特征在于：所述机器学习模块包括数据曲线拟合单元和筛选模型建立单元，所述数据曲线拟合单元用于对学习能力曲线和教学能力曲线进行拟合；所述筛选模型建立单元用于依据拟合结果建立筛选函数。

5.根据权利要求1所述的基于人工智能和大数据的信息分析系统，其特征在于：所述教学调整模块包括教学对象筛选单元、训练试题筛选单元和训练成果检验单元，所述教学对象筛选单元用于分析用户在训练平台的登录数据，分析筛选函数的误差数据，筛选与用户匹配的教师，获取最终匹配的教育和学习对象；所述训练试题筛选单元用于分析学习记录信息，绘制记忆曲线，对记忆曲线进行拟合并为对应用户筛选训练试题进行测试；所述训练成果检验单元用于在选择教学对象和测试试题后，检验用户的训练成果，实时更新学习和教学数据，调整筛选函数。

6.基于人工智能和大数据的信息分析方法，其特征在于：包括以下步骤：

S5：检验用户训练成果。

7.根据权利要求6所述的基于人工智能和大数据的信息分析方法，其特征在于：在步骤S1-S2中：采集用户在做试题时的训练结果数据：采集到随机一个用户在不同试卷中的错题数量集合为a＝{a1，a2，...，an}，每张试卷的试题数量相等，统计到对应用户在做对应试卷前登录训练平台的时长集合为t＝{t1，t2，...，tn}，其中，n表示对应用户做的试卷数量，每张试卷中的试题属于同一类型，共有n种类型，获取到不同类型试题的难度系数集合为w＝{w1，w2，...，wn}，难度系数范围为(0，1)，根据下列公式计算用户进行随机一种试题测试时的学习能力系数Pi：

其中，wi表示对应类型试题的难度系数，ai表示用户在对应试卷中的错题数量，ti表示用户在做对应试卷前登录训练平台的时长，w_min、a_min分别表示集合w和集合a中的最小值，w_max、a_max分别表示集合w和a中的最大值，得到用户测试的学习能力系数集合为P＝{P1，P2，...，Pn}，绘制学习能力曲线：试题种类为自变量，学习能力系数为因变量。

8.根据权利要求7所述的基于人工智能和大数据的信息分析方法，其特征在于：采集到随机一名教师对每种试题进行教学的时长集合为T＝{T1，T2，...，Tn}，对应进行教学的用户在被测试时，每种试题的平均成绩集合为b＝{b1，b2，...，bn}，根据下列公式计算对应教师对于随机一种试题的教学能力系数Qi：

其中，Ti表示对应教师对随机一种试题进行教学的时长，bi表示对应教师教学的用户关于对应类型试题的平均成绩，b_min和b_max分别表示集合b中的最小值和最大值，得到教师对所有试题的教学能力系数集合为Q＝{Q1，Q2，...，Qn}，绘制教学能力曲线：试题种类为自变量，教学能力系数为因变量，对学习能力曲线和教学能力曲线进行拟合，建立筛选函数：其中，f(x)表示拟合后的学习能力曲线函数，F(X)表示拟合后的教学能力曲线函数。

9.根据权利要求6所述的基于人工智能和大数据的信息分析方法，其特征在于：在步骤S3中：采集到用户登录训练平台的总时长集合为t’＝{t1’，t2’，...，tk’}，其中，k表示用户数量，将登录总时长作为误差数据，将筛选函数调整为：其中，ti’表示随机一个用户登录总时长；得到随机一个教师的教学能力曲线函数和随机一个用户的学习能力曲线函数后代入函数Y_调，获取对应用户的登录总时长并代入函数Y_调，得到随机一个用户与所有教师的教学匹配程度集合为Y’＝{Y1’，Y2’，...，Ym’}，其中，m表示教师数量，筛选匹配程度最高的教师对用户进行教学，最高匹配程度为Y_max’。

10.根据权利要求7所述的基于人工智能和大数据的信息分析方法，其特征在于：在步骤S4-S5中：采集用户学习记录：获取到用户第一次练习随机一种试题的时间点为：T_初，练习同一种试题与第一次练习的时间间隔集合为T_隔＝{T1_隔，T2_隔，...，Te_隔}，e+1表示练习对应试题次数，得到用户每次练习时正确试题数集合，根据时间间隔和正确试题数绘制记忆曲线，对曲线进行拟合，得到对应类型试题的记忆曲线函数为y＝f(x’)，获取用户对所有类型试题的记忆曲线函数，根据筛选训练试题：依据/>从大到小的顺序筛选出对应试题依次供用户练习，在用户经过匹配的教师教学和对应试题练习后检验用户训练成果，实时更新学习和教学数据并调整筛选函数。