CN115618105A - 一种基于大数据的数据信息分析系统及方法 - Google Patents

一种基于大数据的数据信息分析系统及方法 Download PDF

Info

Publication number
CN115618105A
CN115618105A CN202211222322.1A CN202211222322A CN115618105A CN 115618105 A CN115618105 A CN 115618105A CN 202211222322 A CN202211222322 A CN 202211222322A CN 115618105 A CN115618105 A CN 115618105A
Authority
CN
China
Prior art keywords
user
learning
data
information
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202211222322.1A
Other languages
English (en)
Inventor
吕海军
孙雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Jianweizhishu Technology Co ltd
Original Assignee
Harbin Jianweizhishu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Jianweizhishu Technology Co ltd filed Critical Harbin Jianweizhishu Technology Co ltd
Priority to CN202211222322.1A priority Critical patent/CN115618105A/zh
Publication of CN115618105A publication Critical patent/CN115618105A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据转化和信息分析技术领域,具体为一种基于大数据的数据信息分析系统及方法,系统包括数据采集模块、数据转化模块、用户信息库模块和信息分析模块;数据采集模块用于采集用户通过互联网进行学习过程中产生的数据,与数据转化模块相连;数据转化模块用于将数据采集模块采集到的数据转化为用户学习习惯信息,并上传到用户信息库模块;用户信息库模块用于存储用户学习习惯信息并进行分类保存;信息分析模块用于获取数据转化模块转化的用户学习习惯信息并进行分析,然后为用户通过互联网进行学习提供合适的学习内容和学习方式;本发明通过采集用户通过互联网进行学习过程中产生的数据,分析得出用户的学习意愿和学习能力。

Description

一种基于大数据的数据信息分析系统及方法
技术领域
本发明涉及数据转化和信息分析技术领域,具体为一种基于大数据的数据信息分析系统及方法。
背景技术
随着移动互联网的深入发展,各种移动智能终端给人们的生活带来了很多便利和乐趣,移动互联网已经成为人们生活、学习和工作的重要组成部分;同时,移动互联网快速发展的节奏使得人们的学习生活被分割成很多碎片,这些被分割的碎片化时间不够完成某一项系统性的学习,但加在一起的体量又非常庞大;为了有效利用这些碎片化的学习时间,我们需要把系统的、具体的学习分散在这些碎片化的学习中,同时移动智能终端能让学习者随时随地、按需学习成为了可能,但是,人们在碎片化学习中面临学习内容微型化、海量化,人们在选择学习内容无法匹配适合自身兴趣、理解能力和思维边界的学习内容,所以,人们需要一种基于大数据的数据信息分析系统及方法来解决上述问题。
发明内容
本发明的目的在于提供一种基于大数据的数据信息分析系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的数据信息分析系统,所述系统包括数据采集模块、数据转化模块、用户信息库模块和信息分析模块;所述数据采集模块用于采集用户通过互联网进行学习过程中产生的数据,与数据转化模块相连;所述数据转化模块用于将数据采集模块采集到的数据转化为用户学习习惯信息,并上传到用户信息库模块;所述用户信息库模块用于存储用户学习习惯信息并进行分类保存;所述信息分析模块用于获取数据转化模块转化的用户学习习惯信息并进行分析,然后为用户通过互联网进行学习提供合适的学习内容和学习方式。
进一步的,所述数据采集模块包括行为数据采集单元和内容数据采集单元,所述行为数据采集单元用于采集用户利用互联网进行学习时与使用终端交互过程中用户产生的动作行为数据和终端产生的交互数据,所述用户产生的行为数据包括用户与终端设备交互时用户动作数据,以便于分析用户在互联网学习中使用终端的动作行为,从而判断用户在学习不同内容时表现的不同的学习状态,然后提供提高用户思维认知的学习内容;所述终端产生的行为数据包括用户与终端设备交互时终端的行为数据,以便于分析用户对正在学习的内容的难度感受和兴趣;所述内容数据采集单元用于采集用户利用互联网进行学习时在使用终端中的软件应用类型和软件应用中学习的内容,以便于分析用户习惯通过哪种形式来进行学习。
进一步的,所述数据转化模块包括交互数据转化单元和特征数据转化单元,所述交互数据转化单元用于将行为数据采集单元采集到的数据和内容采集单元采集到的数据转化为用户学习特征信息,以便于通过用户学习特征信息对用户学习性格和用户学习能力进行标记,与用户信息库存储的历史数据进行对比,从而更精确的为用户匹配适合用户学习性格和用户学习能力的内容进行学习;所述特征转化单元用于将用户特征信息转化为用户学习性格信息和用户学习能力信息,以便于更好的分类存储在用户信息库中作为大数据进行检索。
进一步的,所述用户信息库模块包括学习性格库单元和学习能力库单元,所述学习性格库单元用于存储数据转化单元转化得到的用户学习性格信息,并提取用户学习性格进行学习性格分类,以便于在进行用户信息分析时更准确的匹配到用户的学习性格;所述学习能力库单元用于存储数据转化单元转化得到的用户学习能力信息,并提取用户学习能力进行学习能力分级,以便于在进行用户信息分析时根据用户的学习能力为用户匹配能够不断提升学习能力的内容。
进一步的,所述信息分析模块包括学习方式分析单元和学习内容分析单元,所述学习方式分析单元用于获取数据采集模块采集到的用户产生的动作行为数据和终端产生的交互数据,并结合学习性格库中存储的性格信息,分析用户通过互联网学习时的习惯,并根据分析出的习惯为用户提供合适的学习方法;所述学习内容分析单元用于获取数据采集模块采集到的终端中的软件应用类型和软件应用中学习的内容,分析用户通过互联网学习时的载体和内容,并结合学习能力库中存储的用户学习能力分级信息,提供用户合适的学习内容。
一种基于大数据的数据信息分析方法,包括以下步骤:
S1:数据采集模块采集用户通过互联网学习时使用终端过程中产生的数据;
S2:数据转化模块将数据采集模块采集到的数据转化为用户学习特征信息;
S3:用户信息库模块根据用户学习特征信息进行学习性格分类和学习能力分级;
S4:信息分析模块分析用户学习特征信息并结合学习性格分类和学习能力分级,提供用户合适的学习内容和学习方式;
S5:信息分析模块提供符合用户学习性格和学习能力的内容同时,提供用户学习兴趣之外的内容,然后反馈用户在学习时的交互数据。
进一步的,在步骤S1中:数据采集模块通过互联网终端先采集用户每天互联网在线的总时长t,将用户通过互联网访问的应用分为音频应用、图文应用和视频应用,再采集音频应用的在线时长t1、图文应用的在线时长t2和视频应用的在线时长t3,再然后采集在t1时间内使用应用的用户点击次数d1、用户滑动次数h1、用户按压拖动次数a1;在t2时间内使用应用的用户点击次数d2、用户滑动次数h2、用户按压拖动次数a2;在t3时间内使用应用的用户点击次数d3、用户滑动次数h3、用户按压拖动次数a3;通过采集用户通过互联网进行学习的应用形式,分析用户的学习习惯,采集用户在终端中的交互数据,分析用户的对学习内容的兴趣和接受程度,从而根据内容判断用户的学习认知边界。
在步骤S2中:数据转化模块获取到数据采集模块采集到的数据,首先将音频应用、图文应用和视频应用的在线时长数据转化为用户使用意愿,通过计算音频应用、图文应用和视频应用占互联网使用总时长的占比yi表示用户使用意愿,公式为:
Figure BDA0003878347800000031
其中ti=t1,t2,t3,设置用户使用意愿阈值ys,当yi<ys,表示用户使用意愿低;当yi≥ys,表示用户使用意愿高;然后将用户点击次数、用户滑动次数和用户按压拖动次数转换为用户学习程度,通过分别计算用户点击次数、用户滑动次数和用户按压拖动次数占总次数的比例作为权重,利用线性加权公式计算结果Ci表示用户学习程度,公式为:
Figure BDA0003878347800000032
其中di=d1,d2,d3,hi=h1,h2,h3,ai=a1,a2,a3,设置用户学习程度标准值Cs,当Ci<Cs,表示用户学习程度低;当Ci≥Cs,表示用户学习程度高。根据用户使用意愿和用户学习程度进行用户学习特征标记;通过将用户的学习在线时长转化为学习意愿,用户的交互数据转化学习程度,从而更好的根据用户的学习意愿匹配适合用户学习的应用形式,根据用户的学习程度结合用户学习的内容为用户匹配能够提高思维认知和深度广度的学习内容。
进一步的,在步骤S3中:用户信息库模块根据用户通过互联网在终端上进行学习的内容结合数据转化模块转化得到的用户使用意愿和用户学习程度进行用户学习性格分类和用户学习能力分级,将用户学习性格分为主动学习型和被动学习型,将用户学习能力分为信息接收快和信息接收慢;以便于根据用户的学习性格和用户的学习能力的历史数据分析用户通过互联网学习的变化过程。
进一步的,在步骤S4中:信息分析模块首先获取用户在终端上学习的内容信息,根据学习的内容分析用户的学习兴趣,然后获取用户使用意愿信息和用户学习程度信息,分析用户学习性格和用户学习能力给用户提供符合用户学习性格和用户学习能力的内容,同时会在用户学习兴趣之外提供其他内容供用户学习,然后反馈用户在学习其他内容时跟终端的交互数据,通过分析反馈的数据判断用户在接受学习兴趣之外的其他内容时的学习程度信息,同时将分析结果存储得到用户信息库模块,形成用户思维认知大数据,然后不断地在用户学习兴趣之内和用户学习兴趣之外同时去推荐学习内容,拓展用户的思维认知边界,冲破个人信息茧房。
进一步的,在步骤S5中:信息分析模块在提供给用户在用户学习兴趣之内的符合用户学习能力的内容,同时提供用户学习能力之外的内容,首先采集用户在学习能力之外的内容时的内容总时长t,用户在线时长t,计算用户在线时长与内容总时长的占比
Figure BDA0003878347800000041
然后采集用户在学习过程中的交互数据包括用户点击次数d4、用户滑动次数h4、用户按压拖动次数a4,分别以用户点击次数、用户滑动次数和用户按压拖动次数为x轴、y轴和z轴建立三维直角坐标系,得到一组交互数据集合D={(x1,y1,z1),(x2,y2,z2),...,(xn,yn,zn)},其中xn表示第n个用户点击次数数据,yn表示第n个用户滑动次数数据,zn表示第n个用户按压拖动次数数据;利用聚类算法对用户学习内容进行聚类,选取用户感兴趣的学习内容交互数据(x,y,z)为样本中心点,计算集合中其他样本点(xj,yj,zj)到样本中心点的距离,公式为:
Figure BDA0003878347800000042
其中(x,y,z)∈D,(xj,yj,zj)∈D,选取聚类后得到邻居多的距离为特征距离,然后计算特征距离之内的内容的用户使用意愿和用户学习程度,然后扩大特征距离,得到新的聚类,此时得到新增加的样本点,向用户推荐新增加的样本点对应的学习内容。
与现有技术相比,本发明所达到的有益效果是:通过数据采集模块采集用户利用互联网进行学习时与使用终端交互过程中用户产生的动作行为数据和终端产生的交互数据,数据转化模块将采集到数据转化为用户学习性格信息和用户学习能力信息,以便于更好的分类存储在用户信息库中作为大数据进行检索,用户信息库模块将用户学习性格分为主动学习型和被动学习型,将用户学习能力分为信息接收快和信息接收慢,信息分析模块获取数据采集模块采集到的数据和用户信息库模块存储的信息,分析用户学习性格和用户学习能力并结合用户的学习兴趣给用户提供适合的学习方式和学习内容,能够提高用户思维认知和深度广度。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于大数据的数据信息分析系统的结构示意图;
图2是本发明一种基于大数据的数据信息分析方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图2,本发明提供技术方案:一种基于大数据的数据信息分析系统,系统包括数据采集模块、数据转化模块、用户信息库模块和信息分析模块;所述数据采集模块用于采集用户通过互联网进行学习过程中产生的数据,与数据转化模块相连;所述数据转化模块用于将数据采集模块采集到的数据转化为用户学习习惯信息,并上传到用户信息库模块;所述用户信息库模块用于存储用户学习习惯信息并进行分类保存;所述信息分析模块用于获取数据转化模块转化的用户学习习惯信息并进行分析,然后为用户通过互联网进行学习提供合适的学习内容和学习方式。
数据采集模块包括行为数据采集单元和内容数据采集单元,所述行为数据采集单元用于采集用户利用互联网进行学习时与使用终端交互过程中用户产生的动作行为数据和终端产生的交互数据,所述用户产生的行为数据包括用户与终端设备交互时用户动作数据,以便于分析用户在互联网学习中使用终端的动作行为,从而判断用户在学习不同内容时表现的不同的学习状态,然后提供提高用户思维认知的学习内容;比如用户点击屏幕次数、用户按压屏幕拖动次数,所述终端产生的行为数据包括用户与终端设备交互时终端的行为数据,比如屏幕亮屏时间,用户经常浏览的页面,用户经常使用的应用,以便于分析用户对正在学习的内容的难度感受和兴趣;所述内容数据采集单元用于采集用户利用互联网进行学习时在使用终端中的软件应用类型和软件应用中学习的内容,比如是音频应用、图文应用和视频应用,以便于分析用户习惯通过哪种形式来进行学习。
数据转化模块包括交互数据转化单元和特征数据转化单元,所述交互数据转化单元用于将行为数据采集单元采集到的数据和内容采集单元采集到的数据转化为用户学习特征信息,以便于通过用户学习特征信息对用户学习性格和用户学习能力进行标记,与用户信息库存储的历史数据进行对比,从而更精确的为用户匹配适合用户学习性格和用户学习能力的内容进行学习;所述特征转化单元用于将用户特征信息转化为用户学习性格信息和用户学习能力信息,以便于更好的分类存储在用户信息库中作为大数据进行检索。
用户信息库模块包括学习性格库单元和学习能力库单元,所述学习性格库单元用于存储数据转化单元转化得到的用户学习性格信息,并提取用户学习性格进行学习性格分类,以便于在进行用户信息分析时更准确的匹配到用户的学习性格;所述学习能力库单元用于存储数据转化单元转化得到的用户学习能力信息,并提取用户学习能力进行学习能力分级,以便于在进行用户信息分析时根据用户的学习能力为用户匹配能够不断提升学习能力的内容。
信息分析模块包括学习方式分析单元和学习内容分析单元,所述学习方式分析单元用于获取数据采集模块采集到的用户产生的动作行为数据和终端产生的交互数据,并结合学习性格库中存储的性格信息,分析用户通过互联网学习时的习惯,并根据分析出的习惯为用户提供合适的学习方法;所述学习内容分析单元用于获取数据采集模块采集到的终端中的软件应用类型和软件应用中学习的内容,分析用户通过互联网学习时的载体和内容,并结合学习能力库中存储的用户学习能力分级信息,提供用户合适的学习内容。
一种基于大数据的数据信息分析方法,包括以下步骤:
S1:数据采集模块采集用户通过互联网学习时使用终端过程中产生的数据;
S2:数据转化模块将数据采集模块采集到的数据转化为用户学习特征信息;
S3:用户信息库模块根据用户学习特征信息进行学习性格分类和学习能力分级;
S4:信息分析模块分析用户学习特征信息并结合学习性格分类和学习能力分级,提供用户合适的学习内容和学习方式;
S5:信息分析模块提供符合用户学习性格和学习能力的内容同时,提供用户学习兴趣之外的内容,然后反馈用户在学习时的交互数据。
在步骤S1中:数据采集模块通过互联网终端先采集用户每天互联网在线的总时长t,将用户通过互联网访问的应用分为音频应用、图文应用和视频应用,再采集音频应用的在线时长t1、图文应用的在线时长t2和视频应用的在线时长t3,再然后采集在t1时间内使用应用的用户点击次数d1、用户滑动次数h1、用户按压拖动次数a1;在t2时间内使用应用的用户点击次数d2、用户滑动次数h2、用户按压拖动次数a2;在t3时间内使用应用的用户点击次数d3、用户滑动次数h3、用户按压拖动次数a3;通过采集用户通过互联网进行学习的应用形式,分析用户的学习习惯,采集用户在终端中的交互数据,分析用户的对学习内容的兴趣和接受程度,从而根据内容判断用户的学习认知边界。
在步骤S2中:数据转化模块获取到数据采集模块采集到的数据,首先将音频应用、图文应用和视频应用的在线时长数据转化为用户使用意愿,通过计算音频应用、图文应用和视频应用占互联网使用总时长的占比yi表示用户使用意愿,公式为:
Figure BDA0003878347800000071
其中ti=t1,t2,t3,设置用户使用意愿阈值ys,当yi<ys,表示用户使用意愿低;当yi≥ys,表示用户使用意愿高;然后将用户点击次数、用户滑动次数和用户按压拖动次数转换为用户学习程度,通过分别计算用户点击次数、用户滑动次数和用户按压拖动次数占总次数的比例作为权重,利用线性加权公式计算结果Ci表示用户学习程度,公式为:
Figure BDA0003878347800000072
其中di=d1,d2,d3,hi=h1,h2,h3,ai=a1,a2,a3,设置用户学习程度标准值Cs,当Ci<Cs,表示用户学习程度低;当Ci≥Cs,表示用户学习程度高。根据用户使用意愿和用户学习程度进行用户学习特征标记;通过将用户的学习在线时长转化为学习意愿,用户的交互数据转化学习程度,从而更好的根据用户的学习意愿匹配适合用户学习的应用形式,根据用户的学习程度结合用户学习的内容为用户匹配能够提高思维认知和深度广度的学习内容。
在步骤S3中:用户信息库模块根据用户通过互联网在终端上进行学习的内容结合数据转化模块转化得到的用户使用意愿和用户学习程度进行用户学习性格分类和用户学习能力分级,将用户学习性格分为主动学习型和被动学习型,将用户学习能力分为信息接收快和信息接收慢;以便于根据用户的学习性格和用户的学习能力的历史数据分析用户通过互联网学习的变化过程。
在步骤S4中:信息分析模块首先获取用户在终端上学习的内容信息,根据学习的内容分析用户的学习兴趣,然后获取用户使用意愿信息和用户学习程度信息,分析用户学习性格和用户学习能力给用户提供符合用户学习性格和用户学习能力的内容,同时会在用户学习兴趣之外提供其他内容供用户学习,然后反馈用户在学习其他内容时跟终端的交互数据,通过分析反馈的数据判断用户在接受学习兴趣之外的其他内容时的学习程度信息,同时将分析结果存储得到用户信息库模块,形成用户思维认知大数据,然后不断地在用户学习兴趣之内和用户学习兴趣之外同时去推荐学习内容,拓展用户的思维认知边界,冲破个人信息茧房。
在步骤S5中:信息分析模块在提供给用户在用户学习兴趣之内的符合用户学习能力的内容,同时提供用户学习能力之外的内容,首先采集用户在学习能力之外的内容时的内容总时长t,用户在线时长t,计算用户在线时长与内容总时长的占比
Figure BDA0003878347800000081
然后采集用户在学习过程中的交互数据包括用户点击次数d4、用户滑动次数h4、用户按压拖动次数a4,分别以用户点击次数、用户滑动次数和用户按压拖动次数为x轴、y轴和z轴建立三维直角坐标系,得到一组交互数据集合D={(x1,y1,z1),(x2,y2,z2),...,(xn,yn,zn)},其中xn表示第n个用户点击次数数据,yn表示第n个用户滑动次数数据,zn表示第n个用户按压拖动次数数据;利用聚类算法对用户学习内容进行聚类,选取用户感兴趣的学习内容交互数据(x,y,z)为样本中心点,计算集合中其他样本点(xj,yj,zj)到样本中心点的距离,公式为:
Figure BDA0003878347800000082
其中(x,y,z)∈D,(xj,yj,zj)∈D,选取聚类后得到邻居多的距离为特征距离,然后计算特征距离之内的内容的用户使用意愿和用户学习程度,然后扩大特征距离,得到新的聚类,此时得到新增加的样本点,向用户推荐新增加的样本点对应的学习内容。
实施例一:数据采集模块采集到用户每天互联网在线的总时长t,音频应用的在线时长t1、图文应用的在线时长t2和视频应用的在线时长t3,然后计算音频应用、图文应用和视频应用占互联网使用总时长的占比yi表示用户使用意愿,公式为
Figure BDA0003878347800000083
设置用户使用意愿阈值ys=10min,当yi<ys,表示用户使用意愿低;当yi≥ys,表示用户使用意愿高;再采集在t1时间内使用应用的用户点击次数d1、用户滑动次数h1、用户按压拖动次数a1;在t2时间内使用应用的用户点击次数d2、用户滑动次数h2、用户按压拖动次数a2;在t3时间内使用应用的用户点击次数d3、用户滑动次数h3、用户按压拖动次数a3,计算用户点击次数、用户滑动次数和用户按压拖动次数占总次数的比例作为权重,利用线性加权公式计算结果表示用户学习程度,公式为:
Figure BDA0003878347800000091
设置用户学习程度标准值Cs=50,当Ci<Cs,表示用户学习程度低;当Ci≥Cs,表示用户学习程度高;根据用户的学习程度结合用户学习的内容为用户匹配能够提高思维认知和深度广度的学习内容。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于大数据的数据信息分析系统,其特征在于,所述系统包括数据采集模块、数据转化模块、用户信息库模块和信息分析模块;所述数据采集模块用于采集用户通过互联网进行学习过程中产生的数据,与数据转化模块相连;所述数据转化模块用于将数据采集模块采集到的数据转化为用户学习习惯信息,并上传到用户信息库模块;所述用户信息库模块用于存储用户学习习惯信息并进行分类保存;所述信息分析模块用于获取数据转化模块转化的用户学习习惯信息并进行分析,然后为用户通过互联网进行学习提供合适的学习内容和学习方式。
2.根据权利要求1所述的一种基于大数据的数据信息分析系统,其特征在于:所述数据采集模块包括行为数据采集单元和内容数据采集单元,所述行为数据采集单元用于采集用户利用互联网进行学习时与使用终端交互过程中用户产生的动作行为数据和终端产生的交互数据;所述内容数据采集单元用于采集用户利用互联网进行学习时在使用终端中的软件应用类型和软件应用中学习的内容。
3.根据权利要求1所述的一种基于大数据的数据信息分析系统,其特征在于:所述数据转化模块包括交互数据转化单元和特征数据转化单元,所述交互数据转化单元用于将行为数据采集单元采集到的数据和内容采集单元采集到的数据转化为用户学习特征信息;所述特征转化单元用于将用户特征信息转化为用户学习性格信息和用户学习能力信息。
4.根据权利要求1所述的一种基于大数据的数据信息分析系统,其特征在于:所述用户信息库模块包括学习性格库单元和学习能力库单元,所述学习性格库单元用于存储数据转化单元转化得到的用户学习性格信息,并提取用户学习性格进行学习性格分类;所述学习能力库单元用于存储数据转化单元转化得到的用户学习能力信息,并提取用户学习能力进行学习能力分级。
5.根据权利要求1所述的一种基于大数据的数据信息分析系统,其特征在于:所述信息分析模块包括学习方式分析单元和学习内容分析单元,所述学习方式分析单元用于获取数据采集模块采集到的用户产生的动作行为数据和终端产生的交互数据,并结合学习性格库中存储的性格信息,分析用户通过互联网学习时的习惯,并根据分析出的习惯为用户提供合适的学习方法;所述学习内容分析单元用于获取数据采集模块采集到的终端中的软件应用类型和软件应用中学习的内容,分析用户通过互联网学习时的载体和内容,并结合学习能力库中存储的用户学习能力分级信息,提供用户合适的学习内容。
6.一种基于大数据的数据信息分析方法,其特征在于:包括以下步骤:
S1:数据采集模块采集用户通过互联网学习时使用终端过程中产生的数据;
S2:数据转化模块将数据采集模块采集到的数据转化为用户学习特征信息;
S3:用户信息库模块根据用户学习特征信息进行学习性格分类和学习能力分级;
S4:信息分析模块分析用户学习特征信息并结合学习性格分类和学习能力分级,提供给用户合适的学习内容和学习方式;
S5:信息分析模块提供符合用户学习性格和学习能力的内容同时,提供用户学习兴趣之外的内容,然后反馈用户在学习时的交互数据。
7.根据权利要求6所述的一种基于大数据的数据信息分析方法,其特征在于:在步骤S1中:数据采集模块通过互联网终端先采集用户每天互联网在线的总时长t,将用户通过互联网访问的应用分为音频应用、图文应用和视频应用,再采集音频应用的在线时长t1、图文应用的在线时长t2和视频应用的在线时长t3,再然后采集在t1时间内使用应用的用户点击次数d1、用户滑动次数h1、用户按压拖动次数a1;在t2时间内使用应用的用户点击次数d2、用户滑动次数h2、用户按压拖动次数a2;在t3时间内使用应用的用户点击次数d3、用户滑动次数h3、用户按压拖动次数a3
在步骤S2中:数据转化模块获取到数据采集模块采集到的数据,首先将音频应用、图文应用和视频应用的在线时长数据转化为用户使用意愿,通过计算音频应用、图文应用和视频应用占互联网使用总时长的占比yi表示用户使用意愿,公式为:
Figure FDA0003878347790000021
其中ti=t1,t2,t3,设置用户使用意愿阈值ys,当yi<ys,表示用户使用意愿低;当yi≥ys,表示用户使用意愿高;然后将用户点击次数、用户滑动次数和用户按压拖动次数转换为用户学习程度,通过分别计算用户点击次数、用户滑动次数和用户按压拖动次数占总次数的比例作为权重,利用线性加权公式计算结果Ci表示用户学习程度,公式为:
Figure FDA0003878347790000022
其中di=d1,d2,d3,hi=h1,h2,h3,ai=a1,a2,a3,设置用户学习程度标准值Cs,当Ci<Cs,表示用户学习程度低;当Ci≥Cs,表示用户学习程度高;根据用户使用意愿和用户学习程度进行用户学习特征标记。
8.根据权利要求6所述的一种基于大数据的数据信息分析方法,其特征在于:在步骤S3中:用户信息库模块根据用户通过互联网在终端上进行学习的内容结合数据转化模块转化得到的用户使用意愿和用户学习程度进行用户学习性格分类和用户学习能力分级,将用户学习性格分为主动学习型和被动学习型,将用户学习能力分为信息接收快和信息接收慢。
9.根据权利要求6所述的一种基于大数据的数据信息分析方法,其特征在于:在步骤S4中:信息分析模块首先获取用户在终端上学习的内容信息,根据学习的内容分析用户的学习兴趣,然后获取用户使用意愿信息和用户学习程度信息,分析用户学习性格和用户学习能力给用户提供符合用户学习性格和用户学习能力的内容,同时会在用户学习能力之外提供其他内容供用户学习,然后反馈用户在学习其他内容时跟终端的交互数据,通过分析反馈的数据判断用户在接受学习能力之外的其他内容时的学习程度信息,同时将分析结果存储得到用户信息库模块,形成用户思维认知大数据,然后不断地在用户学习能力之内和用户学习能力之外同时去推荐学习内容,拓展用户的思维认知边界。
10.根据权利要求6所述的一种基于大数据的数据信息分析方法,其特征在于:在步骤S5中:信息分析模块在提供给用户在用户学习兴趣之内的符合用户学习能力的内容,同时提供用户学习能力之外的内容,首先采集用户在学习能力之外的内容时的内容总时长t,用户在线时长t,计算用户在线时长与内容总时长的占比
Figure FDA0003878347790000031
然后采集用户在学习过程中的交互数据包括用户点击次数d4、用户滑动次数h4、用户按压拖动次数a4,分别以用户点击次数、用户滑动次数和用户按压拖动次数为x轴、y轴和z轴建立三维直角坐标系,得到一组交互数据集合D={(x1,y1,z1),(x2,y2,z2),...,(xn,yn,zn)},其中xn表示第n个用户点击次数数据,yn表示第n个用户滑动次数数据,zn表示第n个用户按压拖动次数数据;利用聚类算法对用户学习内容进行聚类,选取用户感兴趣的学习内容交互数据(x,y,z)为样本中心点,计算集合中其他样本点(xj,yj,zj)到样本中心点的距离,公式为:
Figure FDA0003878347790000032
其中(x,y,z)∈D,(xj,yj,zj)∈D,选取聚类后得到邻居多的距离为特征距离,然后计算特征距离之内的内容的用户使用意愿和用户学习程度,然后扩大特征距离,得到新的聚类,此时得到新增加的样本点,向用户推荐新增加的样本点对应的学习内容。
CN202211222322.1A 2022-10-08 2022-10-08 一种基于大数据的数据信息分析系统及方法 Withdrawn CN115618105A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211222322.1A CN115618105A (zh) 2022-10-08 2022-10-08 一种基于大数据的数据信息分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211222322.1A CN115618105A (zh) 2022-10-08 2022-10-08 一种基于大数据的数据信息分析系统及方法

Publications (1)

Publication Number Publication Date
CN115618105A true CN115618105A (zh) 2023-01-17

Family

ID=84861186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211222322.1A Withdrawn CN115618105A (zh) 2022-10-08 2022-10-08 一种基于大数据的数据信息分析系统及方法

Country Status (1)

Country Link
CN (1) CN115618105A (zh)

Similar Documents

Publication Publication Date Title
US8196066B1 (en) Collaborative gesture-based input language
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
CN106055617A (zh) 一种数据推送方法及装置
CN109446328A (zh) 一种文本识别方法、装置及其存储介质
CN106959998B (zh) 一种试题推荐方法及装置
CN106991115A (zh) 向用户提供经适配的学习信息的方法和设备
CN108764084A (zh) 基于空域分类网络和时域分类网络融合的视频分类方法
CN115131698B (zh) 视频属性确定方法、装置、设备及存储介质
CN111191133B (zh) 业务搜索处理方法、装置及设备
WO2023108993A1 (zh) 基于深度聚类算法的产品推荐方法、装置、设备及介质
CN110516749A (zh) 模型训练方法、视频处理方法、装置、介质和计算设备
CN112270579A (zh) 一种基于大数据的智能广告系统
CN112307352A (zh) 内容推荐方法、系统、装置和存储介质
CN112148952A (zh) 一种任务执行方法、装置、设备及计算机可读存储介质
CN113297486B (zh) 一种点击率预测方法及相关装置
Antila et al. RoutineMaker: Towards end-user automation of daily routines using smartphones
CN113407696A (zh) 收集表处理方法、装置、设备以及存储介质
JP2005267095A (ja) 情報表示方法及び装置及び情報表示プログラム
CN115618105A (zh) 一种基于大数据的数据信息分析系统及方法
CN112464106A (zh) 对象推荐方法及装置
US11775144B2 (en) Place-based semantic similarity platform
CN115098777A (zh) 一种基于数据分析的用户个性化推荐方法和系统
CN114416664A (zh) 信息显示方法、信息显示装置、电子设备和可读存储介质
Mauri et al. Social smart meter: Identifying energy consumption behavior in user-generated content
CN113407821A (zh) 一种小区动态内容推荐方法、系统、智能终端及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20230117