CN111192170B - 题目推送方法、装置、设备和计算机可读存储介质 - Google Patents

题目推送方法、装置、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN111192170B
CN111192170B CN201911363722.2A CN201911363722A CN111192170B CN 111192170 B CN111192170 B CN 111192170B CN 201911363722 A CN201911363722 A CN 201911363722A CN 111192170 B CN111192170 B CN 111192170B
Authority
CN
China
Prior art keywords
question
data
topic
log
pushing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911363722.2A
Other languages
English (en)
Other versions
CN111192170A (zh
Inventor
柳阳
冯晶凌
喻宁
徐宁
刘会哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN201911363722.2A priority Critical patent/CN111192170B/zh
Publication of CN111192170A publication Critical patent/CN111192170A/zh
Application granted granted Critical
Publication of CN111192170B publication Critical patent/CN111192170B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Technology (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种题目推送方法,包括以下步骤:获取做题日志样本集,根据所述做题日志样本集构建题目分析模型;在接收到题目推送请求时,获取所述题目推送请求对应的账户标识,及所述账户标识关联的做题日志;将所述做题日志输入至所述题目分析模型进行日志信息分析,得到所述做题日志对应的题目特征数据;根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出。本发明还公开了一种题目推送装置、设备和计算机可读存储介质。本发明中构建题目分析模型,在题目推送时基于题目分析模型分析用户的做题日志,得到题目特征数据,获得题目特征数据对应的练习题目,以实现题目准确地推送。

Description

题目推送方法、装置、设备和计算机可读存储介质
技术领域
本发明涉及大数据分析领域,尤其涉及题目推送方法、装置、设备和计算机可读存储介质。
背景技术
随着计算机技术和网络的快速发展,互联网在线教育得以广泛应用。用户可以通过在线教育学习系统,进行在线学习、在线做题、在线考试等,方便学生进行个性化的学习和评测。
目前越来越多的学生通过计算机和互联网进行在线学习。在线学习后,学习系统一般会提供与视频学习内容关联的练习题目,以供学生练习;这些练习题目大多是老师或视频制作者事先制作好的对应配套练习题目,配套练习题目的练习题目数量、内容都是固定,无法根据学生需求、新的应用场景或不同教学点提供对应数量的或学生期望的题目。
发明内容
本发明的主要目的在于提供一种题目推送方法、装置、设备和计算机可读存储介质,旨在解决当前在线学习中练习题目不可以根据用户的需求进行准确推送的技术问题。
为实现上述目的,本发明提供题目推送方法,所述题目推送方法包括以下步骤:
获取做题日志样本集,根据所述做题日志样本集构建题目分析模型;
在接收到题目推送请求时,获取所述题目推送请求对应的账户标识,及所述账户标识关联的做题日志;
将所述做题日志输入至所述题目分析模型进行日志信息分析,得到所述做题日志对应的题目特征数据;
根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出。
在一实施例中,所述获取做题日志样本集,根据所述做题日志样本集构建题目分析模型的步骤,包括:
获取做题日志样本集,对所述做题日志样本集中的各做题日志样本进行预处理,得到所述做题日志样本集对应的原始数据、中间数据和衍生数据;
将所述原始数据、所述中间数据和所述衍生数据进行维度划分,得到维度表与事实表,将所述维度表与所述事实表进行融合生成数据立方体;
统计所述数据立方体中相同维度的数据得到特征指标,利用所述特征指标进行模型训练,得到题目分析模型。
在一实施例中,所述获取做题日志样本集,对所述做题日志样本集中的各做题日志样本进行预处理,得到所述做题日志样本集对应的原始数据、中间数据和衍生数据的步骤,包括:
获取做题日志样本集,对所述做题日志样本集中各做题日志样本进行解析,获得各所述做题日志样本中已做练习题目的章节信息、题目信息、答题信息和/或操作信息;
将所述章节信息、所述题目信息、所述答题信息和/或所述操作信息作为原始数据,删除所述原始数据中的冗余信息,并对剩余的原始数据做归一化处理得到中间数据;
将所述中间数据按题目类型、题目知识点和/或题目考察频率分类形成数据子集,统计各所述数据子集中的中间数据,得到衍生数据。
在一实施例中,所述统计所述数据立方体中相同维度的数据得到特征指标,利用所述特征指标进行模型训练,得到题目分析模型的步骤,包括:
统计所述数据立方体中相同维度的数据得到特征指标,从所述特征指标中抽取预设比例的一次训练特征指标;
将所述一次训练特征指标作为自变量,将预设的题目特征数据作为因变量,基于所述自变量和所述因变量构建初始分析函数;
以所述预设比例从所述特征指标中抽取迭代训练特征指标,通过所述迭代训练特征指标对所述初始分析函数进行迭代调整,得到训练分析函数;
获取所述训练分析函数的分析准确率,将分析准确率超过预设阈值的训练分析函数作为题目分析模型。
在一实施例中,所述根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出的步骤,包括:
获取所述题目特征数据的类型,根据所述题目特征数据的类型为所述题目特征数据分配加权权重;
查询预设公共题库,获取与所述题目特征数据类型相同的第一练习题目集合;
获取所述第一练习题目集合中与所述加权权重相同的练习题目,并将所述练习题目作为题目推送请求对应的练习题目输出。
在一实施例中,所述根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出的步骤之后,包括:
在接收到基于所述练习题目触发答题操作时,获取所述练习题目的操作信息,获取登录用户的账户标识,及所述账户标识对应的答题日志;
将所述练习题目的章节信息、题目信息、答题信息和操作信息添加到所述做题日志,并更新所述做题日志。
在一实施例中,所述根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出的步骤包括:
在接收到基于所述练习题目触发的提交指令时,获取所述提交请求对应的答题信息,将所述答题信息与所述练习题目的标准答案进行比对;
若所述答题信息与所述练习题目的标准答案不匹配,则输出推送提示;
在接收到基于所述推送提示输入的确认指令时,查询预设公共题库,获取与所述练习题目相似度最高的目标练习题目并输出。
此外,为实现上述目的,本发明还提供一种题目推送装置,所述题目推送装置包括:
获取训练模块,用于获取做题日志样本集,根据所述做题日志样本集构建题目分析模型;
请求接收模块,用于在接收到题目推送请求时,获取所述题目推送请求对应的账户标识,及所述账户标识关联的做题日志;
分析获取模块,用于将所述做题日志输入至所述题目分析模型进行日志信息分析,得到所述做题日志对应的题目特征数据;
题目推送模块,用于根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出。
此外,为实现上述目的,本发明还提供一种题目推送设备;
所述题目推送设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现如上所述的题目推送方法的步骤。
此外,为实现上述目的,本发明还提供计算机可读存储介质;
所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的题目推送方法的步骤。
本发明实施例提出的一种题目推送方法、装置、设备和计算机可读存储介质,本发明实施例中题目推送设备通过获取做题日志样本集,根据所述做题日志样本集构建题目分析模型;在接收到题目推送请求时,获取所述题目推送请求对应的账户标识,及所述账户标识关联的做题日志;题目推送设备将所述做题日志输入至所述题目分析模型进行日志信息分析,得到所述做题日志对应的题目特征数据;题目推送设备根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出,本发明实施例实现了根据用户综合需求进行练习题目准确地推送。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明题目推送方法第一实施例的流程示意图;
图3为本发明题目推送方法第二实施例的流程示意图;
图4为本发明题目推送方法第二实施例的具体场景示意图;
图5为本发明题目推送装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的服务器(又叫题目推送设备,其中,题目推送设备可以是由单独的题目推送装置构成,也可以是由其他装置与题目推送装置组合形成)结构示意图。
本发明实施例服务器指一个管理资源并为用户提供服务的计算机,通常分为文件服务器、数据库服务器和应用程序服务器。运行以上软件的计算机或计算机系统也被称为服务器。相对于普通PC(personal computer)个人计算机来说,服务器在稳定性、安全性、性能等方面都要求较高;如图1所示,该服务器可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),网络接口1004,用户接口1003,存储器1005,通信总线1002、芯片组、磁盘系统、网络等硬件等。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WIFI接口)。存储器1005可以是高速随机存取存储器(random access memory,RAM),也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,服务器还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除WiFi外,蓝牙、探针等。本领域技术人员可以理解,图1中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,该计算机软件产品存储在一个计算机可读存储介质(计算机可读存储介质:计算机介质、可读介质、可读存储介质、计算机存储介质或者直接叫介质等,计算机可读存储介质可以是非易失性可读存储介质,如RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。
在图1所示的服务器中,网络接口1004主要用于连接后台数据库,与后台数据库进行数据通信;用户接口1003主要用于连接客户端(客户端,又叫用户端或终端,本发明实施例终端可以固定终端也可以是移动终端,如,带联网功能的智能空调、智能电灯、智能电源、智能音箱、自动驾驶汽车、PC、智能手机、平板电脑、电子书阅读器、便携计算机等,终端中包含传感器比如光传感器、运动传感器以及其他传感器,在此不再赘述),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的题目推送方法中的步骤。
当前在线学习系统中的练习题目都是固定的,即,在线学习系统的开发者,或者在线学习系统中的教师预先根据考试的考点设置练习题目,学生在线学习之后就会将预先设置的练习题目进行推送,以供学生进行答题,这样的题目推送方式并不可以根据用户进行个性化定制,使得在线学习不可以发挥最大的用途。
本发明实施例中针对上述现象做出的改进,本发明实施例中题目推送设备获取做题日志样本集,根据做题日志样本集构建题目分析模型;在接收到题目推送请求时,获取题目推送请求对应的账户标识,及账户标识关联的做题日志;题目推送设备将做题日志输入至题目分析模型进行日志信息分析,得到做题日志对应的题目特征数据;根据题目特征数据确定题目推送请求对应的练习题目并输出。
参照图2,本发明一种题目推送方法的第一实施例中,所述题目推送方法包括:
步骤S10,获取做题日志样本集,根据所述做题日志样本集构建题目分析模型。
本实施例中题目推送方法应用于题目推送设备,在题目推送之前,题目推送设备需要构建出题目分析模型,题目分析模型通过机器学习的方式来构建。具体地,题目推送设备首先获取用于训练模型的做题日志样本集,该题日志样本集中包括有不同学生历史做题的做题日志样本,题目推送设备使用该做题日志样本集中的做题日志样本进行机器学习,训练获得题目分析模型。其中,对于该机器学习的过程,可以是通过神经网络、遗传算法、支持向量机等多种方式实现。
本实施例中,由于做题日志样本集中的数据量庞大,若要获取到全部做题日志样本中的所有日志信息用于进行模型训练,则会增大工作量,因此,本发明实施例中采用linear-svm(线性-支持向量机)的方式进行建模。题目推送设备为训练题目分析模型,首先要获取到做题日志样本集;然后从做题日志样本集中抽取一定数量的做题日志样本建立一个初始分析函数,在得到初始分析函数之后,题目推送设备用做题日志样本集中剩余的做题日志样本进行迭代训练,得到题目分析模型。
具体地,本实施例中根据分析要求定义样本属性,可在做题日志样本集中随机抽取若干比例的做题日志样本作为一次训练样本,利用这些一次训练样本对初始分析函数进行训练,在一次训练中,该初始分析函数可以是随机确定,或者通过某些约束条件进行确定。在进行了一次训练后,题目推送设备再从做题日志样本集中抽取相同比例样本作为迭代样本,并利用这些迭代样本对初始分析函数不断进行调整,直至其对样本的正确分值率达到预设阈值(预设阈值是指预先设置的临界值,例如,预设阈值设作为98%),即认为训练完成,获得题目分析模型。
步骤S20,在接收到题目推送请求时,获取所述题目推送请求对应的账户标识,及所述账户标识关联的做题日志。
题目推送设备接收题目推送请求,题目推送请求的触发方式不作具体限定,即,题目推送请求可以用户主动触发的,例如,用户在客户终端点击显示界面上题目获取按键,触发题目推送请求,终端将题目推送请求发送至题目推送设备;此外,题目推送请求还可以是题目推送设备自动触发的,例如,题目推送设备中预设题目推送条件:每天凌晨自动进行题目推送,题目推送设备在到达凌晨时,自动触发题目推送请求。
题目推送设备在接收到题目推送请求时,题目推送设备获取题目推送请求对应的账户标识(账户标识是指唯一识别登录用户的标识信息),题目推送设备获取账户标识对应的做题日志。
步骤S30,将所述做题日志输入至所述题目分析模型进行日志信息分析,得到所述做题日志对应的题目特征数据。
题目推送设备将做题日志输入至题目分析模型进行日志信息分析,即,题目分析模型获取做题日志日志信息,题目分析模型对做题日志进行分词处理,得到做题日志中已做练习题目的章节信息(章节信息包括章节编号,和各个章节对应知识点)、题目信息、答题信息(答题信息是指用户作答的答案信息)和/或操作信息(操作信息是指答题时长、修改次数等等)等等。
题目推送设备对做题日志中已做练习题目的章节信息、题目信息、答题信息和/或操作信息等等进行分析,确定做题日志中的重要考点、用户未掌握知识点、未掌握练习题目类型,题目推送设备将重要考点、用户未掌握知识点、未掌握练习题目类型进行分词处理作为做题日志对应的题目特征数据。
步骤S40,根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出。
题目推送设备根据题目特征数据确定题目推送请求对应的练习题目,具体地,包括:
步骤a1,获取所述题目特征数据的类型,根据所述题目特征数据的类型为所述题目特征数据分配加权权重;
步骤a2,查询预设公共题库,获取与所述题目特征数据类型相同的第一练习题目集合;
步骤a3,获取所述第一练习题目集合中与所述加权权重相同的练习题目,并将所述练习题目作为题目推送请求对应的练习题目输出。
即,题目推送设备获取题目特征数据的类型,题目推送设备根据题目特征数据的类型为题目特征数据分配加权权重;例如,题目特征数据的类型为第一类型时,题目推送设备设置第一权重值;题目特征数据的类型为第二类型时,题目推送设备设置第二权重值,然后,题目推送设备查询预设公共题库(预设公共题库是指预先设置的题目数据库),获取与题目特征数据类型相同的第一练习题目集合;题目推送设备获取第一练习题目集合中与加权权重相同的练习题目,并将练习题目作为题目推送请求对应的练习题目输出。本实施例中根据题目特征数据的类型为题目特征数据分配加权权重,确定用户综合需求,以准确地确定练习题目进行推送。
进一步地,参照图3,在本发明第一实施例的基础上,提出了本发明题目推送方法的第二实施例。
本实施例是第一实施例中步骤S10的细化,本实施例给出了提取做题日志样本中题目特征数据,生成题目分析模型的具体实现方式,包括:
步骤S11,获取做题日志样本集,对所述做题日志样本集中的各做题日志样本进行预处理,得到所述做题日志样本集对应的原始数据、中间数据和衍生数据。
题目推送设备获取预设的题日志样本集,题目推送设备对做题日志样本集中的各做题日志样本进行处理,得到做题日志样本集对应的原始数据、中间数据和衍生数据,具体地,包括:
步骤b1,获取做题日志样本集,对所述做题日志样本集中各做题日志样本进行解析,获得各所述做题日志样本中已做练习题目的章节信息、题目信息、答题信息和/或操作信息;
步骤b2,将所述章节信息、所述题目信息、所述答题信息和/或所述操作信息作为原始数据,删除所述原始数据中的冗余信息,并对剩余的原始数据做归一化处理得到中间数据;
步骤b3,将所述中间数据按题目类型、题目知识点和/或题目考察频率分类形成数据子集,统计各所述数据子集中的中间数据,得到衍生数据。
题目推送设备获取做题日志样本集,对做题日志样本集中各做题日志样本进行解析,获得各做题日志样本中已做练习题目的章节信息、题目信息、答题信息和/或操作信息;题目推送设备将章节信息、题目信息、答题信息和/或操作信息作为原始数据,题目推送设备删除原始数据中的冗余信息(冗余信息是指重复信息、或者虚词等等),题目推送设备对剩余的原始数据做归一化处理得到中间数据,其中,归一化处理是指可以是指调整原始数据的量纲;题目推送设备将中间数据按题目类型、题目知识点和/或题目考察频率分类形成数据子集,题目推送设备统计各数据子集中的中间数据,得到衍生数据。
本实施例中题目推送设备处理做题日志生成为原始数据、中间数据和衍生数据,参照图4,题目推送设备将原始数据、中间数据和衍生数据分别存储到hive数据库中DW1原始数据层、DW2中间数据层、DWA衍生数据层;其中,原始数据层直接来源于日志中的中的日志数据,中间数据层是对原始数据层中的原始数据进行特征工程预处理,这些处理逻辑只从数据本身数值层面出发,和业务无关,例如归一化、同量纲等,衍生数据层是对中间数据层中的行贴近业务场景的数据处理,例如group by、partition by等。此外,本实施例中需要构建“统计后台”进行分析数据,统计后台将数据进行归一化、离散化、缺失值处理、数值变换、降维PCA/LDA、相关系数、卡方检验、正则化等处理,题目推送设备将统计后台得到的数据输入在hive数据库、Hbase数据库或者MySQL数据库,以保证数据的全面性。
本实施例中将数据划分为三层,这三个数据层从数据产生顺序上,虽然有先后关系,但是在被作为特征库使用上,是同一个级别同等对待,在数据的处理中每个步骤的数据演进都记录血缘关系,这对后面的模型优化起到重要作用。
步骤S12,将所述原始数据、所述中间数据和所述衍生数据进行维度划分,得到维度表与事实表,将所述维度表与所述事实表进行融合生成数据立方体。
题目推送设备将原始数据、中间数据和衍生数据进行维度划分,得到维度表与事实表,题目推送设备将维度表与事实表进行融合生成数据立方体。例如,题目推送设备中预设Kylin,Kylin是与Linux应用二进制兼容的国产中文服务器操作系统,题目推送设备可以利用预设的Kylin实现数据处理,以将原始数据、中间数据和衍生数据进行星型、雪花型数据关联,形成维度表和事实表,维度表和事实表通过主表外键相关联,这样不需要关注太多数据的业务逻辑,只需要确定哪些是用户事实,哪些是维度,或者再告诉它一些有意义的交叉维度(哪种组合在后面的机器学习或深度学习中有很强的相关性),题目推送设备会自动的构建数据立方体,解决了大量的冗余计算逻辑,并且只从数据层面出来构建特征,没有带入人的思维逻辑,这对后面的深度学习模型大规模特征要求、数据多样性要求非常有帮助,并且它采用了与计算的逻辑,降低了数据存储、计算成本,大大提升了效率。
步骤S13,统计所述数据立方体中相同维度的数据得到特征指标,利用所述特征指标进行模型训练,得到题目分析模型。
题目推送设备统计数据立方体中相同维度的数据得到特征指标,题目推送设备利用特征指标进行模型训练,得到题目分析模型,具体地,包括:
步骤c1,统计所述数据立方体中相同维度的数据得到特征指标,从所述特征指标中抽取预设比例的一次训练特征指标;
步骤c2,将所述一次训练特征指标作为自变量,将预设的题目特征数据作为因变量,基于所述自变量和所述因变量构建初始分析函数;
步骤c3,以所述预设比例从所述特征指标中抽取迭代训练特征指标,通过所述迭代训练特征指标对所述初始分析函数进行迭代调整,得到训练分析函数;
步骤c4,获取所述训练分析函数的分析准确率,将分析准确率超过预设阈值的训练分析函数作为题目分析模型。
即,题目推送设备统计数据立方体中相同维度的数据得到特征指标,题目推送设备从特征指标中抽取预设比例(预设比例是指预先设置的数据比例,例如预设比例为1%)的一次训练特征指标;题目推送设备将一次训练特征指标作为自变量,将预设的题目特征数据作为因变量,题目推送设备构建一下简单的初始分析函数,表示自变量和因变量之间的关系,然后,题目推送设备以预设比例从所述特征指标中抽取迭代训练特征指标,通过迭代训练特征指标对初始分析函数进行迭代调整,得到训练分析函数;题目推送设备获取训练分析函数的分析准确率,题目推送设备将分析准确率超过预设阈值的训练分析函数作为题目分析模型。
本实施例中题目推送设备得到数据立方体,由于数据立方体中的数据较多,会有维度爆炸的情况,因此,题目推送设备统计数据立方体中相同维度的数据得到特征指标,通过特征指标进行模型训练,这样的数据处理方案,不需要人为地设置数据指标,既可以减少用户的操作,提高数据处理效率,又可以避免人对数据的影响,使得基于训练得到的题目分析模型更加合理。
本实施例中减少了人为数据处理量,只从数据层面出来构建特征,没有带入人的思维逻辑,这对后面的深度学习模型大规模特征要求、数据多样性要求非常有帮助,并且通过采用预设数据处理系统降低了数据存储、计算成本,大大提升了效率,且利用上述方式得到的数据进行模型训练,使得训练的模型更加准确。
进一步地,在本发明上述实施例的基础上,提出了本发明题目推送方法的第三实施例。
本实施例是第一实施例中步骤S40之后的步骤,本实施例与上实施例的区别在于:
在接收到基于所述练习题目触发答题操作时,获取所述练习题目的操作信息,获取登录用户的账户标识,及所述账户标识对应的答题日志;
将所述练习题目的章节信息、题目信息、答题信息和操作信息添加到所述做题日志,并更新所述做题日志
本实施例中,题目推送设备在接收到基于练习题目触发答题操作时,题目推送设备获取练习题目的操作信息(操作信息是指用户答题时的用户操作时间、用户操作频率等等),题目推送设备获取登录用户的账户标识,及账户标识对应的答题日志。
题目推送设备将练习题目的章节信息、题目信息、答题信息和操作信息添加到做题日志,并更新做题日志,本实施例中题目推送设备可以实时地检测答题的状态,进行答题日志更新,以保证利用答题日志的实时性,从而实现更加准确地题目推送。
进一步地,在本发明上述实施例的基础上,提出了本发明题目推送方法的第四实施例。
本实施例是第一实施例中步骤S40之后的步骤,本实施例与上实施例的区别在于:
在接收到基于所述练习题目触发的提交指令时,获取所述提交请求对应的答题信息,将所述答题信息与所述练习题目的标准答案进行比对;
若所述答题信息与所述练习题目的标准答案不匹配,则输出推送提示;
在接收到基于所述推送提示输入的确认指令时,查询预设公共题库,获取与所述练习题目相似度最高的目标练习题目并输出。
本实施例中题目推送设备在接收到练习题目触发的提交指令时,题目推送设备获取答题信息,题目推送设备将答题信息与练习题目的标准答案进行比对,判断答案是否正确,若答题信息与练习题目的标准答案匹配,则答题正确,输出下一题目信息,若答题信息与练习题目的标准答案不匹配,则答案不正确,输出推送提示。
题目推送设备在接收到基于推送提示输入的确认指令时,题目推送设备查询预设公共题库(预设公共题库是指预先设置的题目数据库),题目推送设备获取与练习题目相似度最高的目标练习题目并输出。本实施例中题目推送设备可以就一个知识点对应的题目进行推送,使得用户可以及时了解该知识点对应的练习题目。
此外,参照图5,本发明实施例还提出一种题目推送装置,所述题目推送装置包括:
获取训练模块10,用于获取做题日志样本集,根据所述做题日志样本集构建题目分析模型;
请求接收模块20,用于在接收到题目推送请求时,获取所述题目推送请求对应的账户标识,及所述账户标识关联的做题日志;
分析获取模块30,用于将所述做题日志输入至所述题目分析模型进行日志信息分析,得到所述做题日志对应的题目特征数据;
题目推送模块40,用于根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出。
在一实施例中,所述获取训练模块10,包括:
获取处理子模块,用于获取做题日志样本集,对所述做题日志样本集中的各做题日志样本进行预处理,得到所述做题日志样本集对应的原始数据、中间数据和衍生数据;
数据处理子模块,用于将所述原始数据、所述中间数据和所述衍生数据进行维度划分,得到维度表与事实表,将所述维度表与所述事实表进行融合生成数据立方体;
模型构建子模块,用于统计所述数据立方体中相同维度的数据得到特征指标,利用所述特征指标进行模型训练,得到题目分析模型。
在一实施例中,所述获取处理子模块,包括:
获取分析单元,用于获取做题日志样本集,对所述做题日志样本集中各做题日志样本进行解析,获得各所述做题日志样本中已做练习题目的章节信息、题目信息、答题信息和/或操作信息;
删除处理单元,用于将所述章节信息、所述题目信息、所述答题信息和/或所述操作信息作为原始数据,删除所述原始数据中的冗余信息,并对剩余的原始数据做归一化处理得到中间数据;
分类统计单元,用于将所述中间数据按题目类型、题目知识点和/或题目考察频率分类形成数据子集,统计各所述数据子集中的中间数据,得到衍生数据。
在一实施例中,所述模型构建子模块,包括:
指标抽取单元,用于统计所述数据立方体中相同维度的数据得到特征指标,从所述特征指标中抽取预设比例的一次训练特征指标;
函数构建单元,用于将所述一次训练特征指标作为自变量,将预设的题目特征数据作为因变量,基于所述自变量和所述因变量构建初始分析函数;
模型训练单元,用于以所述预设比例从所述特征指标中抽取迭代训练特征指标,通过所述迭代训练特征指标对所述初始分析函数进行迭代调整,得到训练分析函数;
模型生成单元,用于获取所述训练分析函数的分析准确率,将分析准确率超过预设阈值的训练分析函数作为题目分析模型。
在一实施例中,所述题目推送模块,包括:
获取分配单元,用于获取所述题目特征数据的类型,根据所述题目特征数据的类型为所述题目特征数据分配加权权重;
查询获取单元,用于查询预设公共题库,获取与所述题目特征数据类型相同的第一练习题目集合;
题目输出单元,用于获取所述第一练习题目集合中与所述加权权重相同的练习题目,并将所述练习题目作为题目推送请求对应的练习题目输出。
在一实施例中,所述的题目推送装置,包括:
信息获取模块,用于在接收到基于所述练习题目触发答题操作时,获取所述练习题目的操作信息,获取登录用户的账户标识,及所述账户标识对应的答题日志;
日志更新模块,用于将所述练习题目的章节信息、题目信息、答题信息和操作信息添加到所述做题日志,并更新所述做题日志。
在一实施例中,所述的题目推送装置,包括:
检测比对模块,用于在接收到基于所述练习题目触发的提交指令时,获取所述提交请求对应的答题信息,将所述答题信息与所述练习题目的标准答案进行比对;
推送提示模块,用于若所述答题信息与所述练习题目的标准答案不匹配,则输出推送提示;
推送更新模块,用于在接收到基于所述推送提示输入的确认指令时,查询预设公共题库,获取与所述练习题目相似度最高的目标练习题目并输出。
其中,题目推送装置的各个功能模块实现的步骤可参照本发明题目推送方法的各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质。
所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的题目推送方法中的操作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种题目推送方法,其特征在于,所述题目推送方法包括以下步骤:
获取做题日志样本集,根据所述做题日志样本集构建题目分析模型;
在接收到题目推送请求时,获取所述题目推送请求对应的账户标识,及所述账户标识关联的做题日志;
将所述做题日志输入至所述题目分析模型进行日志信息分析,得到所述做题日志对应的题目特征数据;
根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出;
所述获取做题日志样本集,根据所述做题日志样本集构建题目分析模型的步骤,包括:
获取做题日志样本集,对所述做题日志样本集中的各做题日志样本进行预处理,得到所述做题日志样本集对应的原始数据、中间数据和衍生数据;
将所述原始数据、所述中间数据和所述衍生数据进行维度划分,得到维度表与事实表,将所述维度表与所述事实表进行融合生成数据立方体;
统计所述数据立方体中相同维度的数据得到特征指标,利用所述特征指标进行模型训练,得到题目分析模型。
2.如权利要求1所述的题目推送方法,其特征在于,所述获取做题日志样本集,对所述做题日志样本集中的各做题日志样本进行预处理,得到所述做题日志样本集对应的原始数据、中间数据和衍生数据的步骤,包括:
获取做题日志样本集,对所述做题日志样本集中各做题日志样本进行解析,获得各所述做题日志样本中已做练习题目的章节信息、题目信息、答题信息和/或操作信息;
将所述章节信息、所述题目信息、所述答题信息和/或所述操作信息作为原始数据,删除所述原始数据中的冗余信息,并对剩余的原始数据做归一化处理得到中间数据;
将所述中间数据按题目类型、题目知识点和/或题目考察频率分类形成数据子集,统计各所述数据子集中的中间数据,得到衍生数据。
3.如权利要求1所述的题目推送方法,其特征在于,所述统计所述数据立方体中相同维度的数据得到特征指标,利用所述特征指标进行模型训练,得到题目分析模型的步骤,包括:
统计所述数据立方体中相同维度的数据得到特征指标,从所述特征指标中抽取预设比例的一次训练特征指标;
将所述一次训练特征指标作为自变量,将预设的题目特征数据作为因变量,基于所述自变量和所述因变量构建初始分析函数;
以所述预设比例从所述特征指标中抽取迭代训练特征指标,通过所述迭代训练特征指标对所述初始分析函数进行迭代调整,得到训练分析函数;
获取所述训练分析函数的分析准确率,将分析准确率超过预设阈值的训练分析函数作为题目分析模型。
4.如权利要求1所述的题目推送方法,其特征在于,所述根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出的步骤,包括:
获取所述题目特征数据的类型,根据所述题目特征数据的类型为所述题目特征数据分配加权权重;
查询预设公共题库,获取与所述题目特征数据类型相同的第一练习题目集合;
获取所述第一练习题目集合中与所述加权权重相同的练习题目,并将所述练习题目作为题目推送请求对应的练习题目输出。
5.如权利要求1所述的题目推送方法,其特征在于,所述根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出的步骤之后,包括:
在接收到基于所述练习题目触发答题操作时,获取所述练习题目的操作信息,获取登录用户的账户标识,及所述账户标识对应的答题日志;
将所述练习题目的章节信息、题目信息、答题信息和操作信息添加到所述做题日志,并更新所述做题日志。
6.如权利要求1至5任意一项所述的题目推送方法,其特征在于,所述根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出的步骤包括:
在接收到基于所述练习题目触发的提交指令时,获取所述提交指令对应的答题信息,将所述答题信息与所述练习题目的标准答案进行比对;
若所述答题信息与所述练习题目的标准答案不匹配,则输出推送提示;
在接收到基于所述推送提示输入的确认指令时,查询预设公共题库,获取与所述练习题目相似度最高的目标练习题目并输出。
7.一种题目推送装置,其特征在于,所述题目推送装置包括:
获取训练模块,用于获取做题日志样本集,根据所述做题日志样本集构建题目分析模型;
请求接收模块,用于在接收到题目推送请求时,获取所述题目推送请求对应的账户标识,及所述账户标识关联的做题日志;
分析获取模块,用于将所述做题日志输入至所述题目分析模型进行日志信息分析,得到所述做题日志对应的题目特征数据;
题目推送模块,用于根据所述题目特征数据获取所述题目推送请求对应的练习题目并输出;
所述获取训练模块,还用于获取做题日志样本集,对所述做题日志样本集中的各做题日志样本进行预处理,得到所述做题日志样本集对应的原始数据、中间数据和衍生数据;将所述原始数据、所述中间数据和所述衍生数据进行维度划分,得到维度表与事实表,将所述维度表与所述事实表进行融合生成数据立方体;统计所述数据立方体中相同维度的数据得到特征指标,利用所述特征指标进行模型训练,得到题目分析模型。
8.一种题目推送设备,其特征在于,所述题目推送设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的题目推送方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的题目推送方法的步骤。
CN201911363722.2A 2019-12-25 2019-12-25 题目推送方法、装置、设备和计算机可读存储介质 Active CN111192170B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911363722.2A CN111192170B (zh) 2019-12-25 2019-12-25 题目推送方法、装置、设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911363722.2A CN111192170B (zh) 2019-12-25 2019-12-25 题目推送方法、装置、设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111192170A CN111192170A (zh) 2020-05-22
CN111192170B true CN111192170B (zh) 2023-05-30

Family

ID=70709396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911363722.2A Active CN111192170B (zh) 2019-12-25 2019-12-25 题目推送方法、装置、设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111192170B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111722720B (zh) * 2020-06-22 2022-10-14 芯盟科技有限公司 人机交互方法、装置及终端
CN112256549B (zh) * 2020-11-13 2022-01-04 珠海大横琴科技发展有限公司 一种日志处理方法和装置
CN113297371A (zh) * 2021-07-28 2021-08-24 北京猿力未来科技有限公司 推荐题目库的生成方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108462605A (zh) * 2018-02-06 2018-08-28 国家电网公司 一种数据的预测方法和装置
CN109714187A (zh) * 2018-08-17 2019-05-03 平安普惠企业管理有限公司 基于机器学习的日志分析方法、装置、设备及存储介质
CN110263235A (zh) * 2019-06-05 2019-09-20 深圳市腾讯计算机系统有限公司 信息推送对象更新方法、装置和计算机设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016201631A1 (en) * 2015-06-17 2016-12-22 Yahoo! Inc. Systems and methods for online content recommendation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108462605A (zh) * 2018-02-06 2018-08-28 国家电网公司 一种数据的预测方法和装置
CN109714187A (zh) * 2018-08-17 2019-05-03 平安普惠企业管理有限公司 基于机器学习的日志分析方法、装置、设备及存储介质
CN110263235A (zh) * 2019-06-05 2019-09-20 深圳市腾讯计算机系统有限公司 信息推送对象更新方法、装置和计算机设备

Also Published As

Publication number Publication date
CN111192170A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
US20220215032A1 (en) Ai-based recommendation method and apparatus, electronic device, and storage medium
KR102260554B1 (ko) 학습 컨텐츠 생성 방법
US11645517B2 (en) Information processing method and terminal, and computer storage medium
WO2021000909A1 (zh) 一种课程优化方法、装置和系统
CN111192170B (zh) 题目推送方法、装置、设备和计算机可读存储介质
CN106126524B (zh) 信息推送方法和装置
CN110597962B (zh) 搜索结果展示方法、装置、介质及电子设备
CN113360616A (zh) 自动问答处理方法、装置、设备及存储介质
CN113590850A (zh) 多媒体数据的搜索方法、装置、设备及存储介质
CN117149989B (zh) 大语言模型训练方法、文本处理方法及装置
CN110472008B (zh) 智能交互方法以及装置
CN112995690B (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
WO2023040516A1 (zh) 一种事件整合方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN110929169A (zh) 基于改进Canopy聚类协同过滤算法的职位推荐方法
CN116796802A (zh) 基于错题分析的学习推荐方法、装置、设备及存储介质
Arai et al. Predicting quality of answer in collaborative Q/A community
CN112995719B (zh) 基于弹幕文本的问题集获取方法、装置及计算机设备
CN110377706B (zh) 基于深度学习的搜索语句挖掘方法及设备
CN111443973A (zh) 备注信息的填入方法、装置、设备及存储介质
CN116228361A (zh) 基于特征匹配的课程推荐方法、装置、设备和存储介质
CN112860983B (zh) 一种学习内容推送的方法、系统、设备及可读存储介质
CN113407806A (zh) 网络结构搜索方法、装置、设备及计算机可读存储介质
CN112330387A (zh) 一种应用于看房软件的虚拟经纪人
CN113066327B (zh) 一种大学生在线智能教育方法
CN111209817A (zh) 基于人工智能的考核方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant