发明内容
本申请实施例提供了一种多通道信息特征融合的学业预警方法、系统、装置和介质,以至少解决相关技术中现有学业预警方法的预测精准率低的问题。
第一方面,本申请实施例提供了一种多通道信息特征融合的学业预警方法,所述方法包括:
对学生的多类型行为信息进行预设编码,得到所述多类型行为信息的各个类型的向量化表示;
根据所述向量化表示,通过卷积神经网络提取得到所述多类型行为信息的各个类型的抽象特征;
根据注意力机制,获取所述各个类型的抽象特征对应的注意力机制表示;
通过融合算法将所述各个类型的注意力机制表示进行融合,得到所述多类型行为信息的融合特征;
设置预测周期,根据以所述预测周期为间隔的连续时序上的融合特征,通过长短期记忆网络作出序列化的学业预警。
在其中一些实施例中,所述多类型行为信息包括学业成绩信息、消费情况信息和常时轨迹信息;
对学生的多类型行为信息进行预设编码,得到所述多类型行为信息的各个类型的向量化表示包括:
分别对学生的学业成绩信息和消费情况信息进行word2vec编码,得到所述学业成绩信息和消费情况信息的向量化表示;
对学生的常时轨迹信息进行one-hot编码,得到所述常时轨迹信息的向量化表示。
在其中一些实施例中,根据所述向量化表示,通过卷积神经网络提取得到所述多类型行为信息的各个类型的抽象特征包括:
通过卷积神经网络分别对学业成绩信息、消费情况信息和常时轨迹信息的向量化表示进行卷积操作和池化操作,提取得到学业成绩特征、消费情况特征和常时轨迹特征。
在其中一些实施例中,通过融合算法将所述各个类型的注意力机制表示进行融合,得到所述多类型行为信息的融合特征包括:
通过融合算法公式
将学业成绩特征、
消费情况特征和常时轨迹特征的注意力机制表示进行融合,得到融合特征,其中,
和
分别为所述学业成绩特征的注意力机制表示和映射矩阵,
和
分别为所述常
时轨迹特征的注意力机制表示和映射矩阵,
和
分别为所述消费情况特征的注意力
机制表示和映射矩阵。
在其中一些实施例中,设置预测周期,根据以所述预测周期为间隔的连续时序上的融合特征,通过长短期记忆网络作出序列化的学业预警包括:
设置以日作为预测周期,根据连续时序上前一日的状态值和当前日的融合特征,通过长短期记忆网络LSTM结合softmax函数预测所述当前日的学业标签;
根据所述学业标签作出对所述学生的学业预警。
在其中一些实施例中,在进行学业预警之前,所述方法还包括:
采用训练集对由所述向量化表示、所述卷积神经网络、所述注意力机制、所述融合算法和所述长短期记忆网络组成的学业预警模型进行训练,基于预设损失函数反向传播更新所述学业预警模型的参数;
采用开发集对所述学业预警模型进行测试,选择预设指标最佳的模型进行保存。
在其中一些实施例中,所述预设损失函数为负对数似然函数,所述预设指标为F1指标。
第二方面,本申请实施例提供了一种多通道信息特征融合的学业预警系统,所述系统包括信息编码模块、特征提取模块、注意力模块、融合模块和预测模块;
所述信息编码模块,用于对学生的多类型行为信息进行预设编码,得到所述多类型行为信息的各个类型的向量化表示;
所述特征提取模块,用于根据所述向量化表示,通过卷积神经网络提取得到所述多类型行为信息的各个类型的抽象特征;
所述注意力模块,用于根据注意力机制,获取所述各个类型的抽象特征对应的注意力机制表示;
所述融合模块,用于通过融合算法将所述各个类型的注意力机制表示进行融合,得到所述多类型行为信息的融合特征;
所述预测模块,用于设置预测周期,根据以所述预测周期为间隔的连续时序上的融合特征,通过长短期记忆网络作出序列化的学业预警。
第三方面,本申请实施例提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的多通道信息特征融合的学业预警方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的多通道信息特征融合的学业预警方法。
相比于相关技术,本申请实施例提供的一种多通道信息特征融合的学业预警方法、系统、装置和介质,对学生的多类型行为信息进行预设编码,得到多类型行为信息的各个类型的向量化表示,并通过卷积神经网络提取的抽象特征,再获取抽象特征的注意力机制表示;通过融合算法将各个类型的注意力机制表示进行融合,得到多类型行为信息的融合特征;设置预测周期,根据以预测周期为间隔的连续时序上的融合特征,通过长短期记忆网络作出序列化的学业预警。解决了现有学业预警方法的预测精准率低的问题,实现了多通道学生行为信息特征融合的学业预警,利用长短期记忆网络来强化时序特征信息获取能力,使用注意力机制来融合多类型特征,提升学生学业预警的准确度。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本申请实施例提供了一种多通道信息特征融合的学业预警方法,图1是根据本申请实施例的多通道信息特征融合的学业预警方法的步骤流程图,如图1所示,该方法包括以下步骤:
步骤S102,对学生的多类型行为信息进行预设编码,得到多类型行为信息的各个类型的向量化表示;
具体地,多类型行为信息包括学业成绩信息、消费情况信息和常时轨迹信息;分别对学生的学业成绩信息和消费情况信息进行word2vec编码,得到学业成绩信息和消费情况信息的向量化表示;对学生的常时轨迹信息进行one-hot编码,得到常时轨迹信息的向量化表示。
优选地,在编码阶段,首先对学业成绩信息和消费情况信息进行word2vec编码,对
常时轨迹信息进行one-hot编码,得到第i天学生的学业成绩信息的向量化表示:
;第i天学生的常时轨迹信息的向量化表示
;第i天
学生的消费情况信息的向量化表示
需要说明的是,学业成绩信息,比如:大考成绩、月考成绩以及平时作业成绩等;常时轨迹信息,比如事件类型(宿舍出入事件、人员出入事件、消费事件、上课签到事件等),发生时间(早餐时间、出寝室时间、入校时间、早上上课时间、午饭时间、下午上课时间、晚饭时间、晚自修时间、出校时间、入寝室时间),进出方向(入、出、无),设备名称(三食堂控制器、2号超市超市3号消费机、1号超市超市2号消费机),其中发生时间可根据作息表生成的固定时间段确定。
步骤S104,根据向量化表示,通过卷积神经网络提取得到多类型行为信息的各个类型的抽象特征;
具体地,通过卷积神经网络分别对学业成绩信息、消费情况信息和常时轨迹信息的向量化表示进行卷积操作和池化操作,提取得到学业成绩特征、消费情况特征和常时轨迹特征。
优选地,使用卷积神经网络分别对这些向量化表示的学生行为数据进行
Convolution和Pooling操作后,得到学业成绩特征、常时轨迹特征和消费情况特征分别为
、
和
步骤S106,根据注意力机制,获取各个类型的抽象特征对应的注意力机制表示;
优选地,根据注意力机制,获取学业成绩特征的注意力机制表示:
获取常时轨迹特征的注意力机制表示:
获取消费情况特征的注意力机制表示:
步骤S108,通过融合算法将各个类型的注意力机制表示进行融合,得到多类型行为信息的融合特征;
具体地,通过融合算法公式
将学业成
绩特征、消费情况特征和常时轨迹特征的注意力机制表示进行融合,得到融合特征,其中,
和
分别为学业成绩特征的注意力机制表示和映射矩阵,
和
分别为常时轨
迹特征的注意力机制表示和映射矩阵,
和
分别为消费情况特征的注意力机制表示
和映射矩阵。
步骤S110,设置预测周期,根据以预测周期为间隔的连续时序上的融合特征,通过长短期记忆网络作出序列化的学业预警。
具体地,设置以日作为预测周期,根据连续时序上前一日的状态值和当前日的融合特征,通过长短期记忆网络LSTM结合softmax函数预测当前日的学业标签;根据学业标签作出对学生的学业预警。
优选地,在解码阶段,对学生过去一段时间的行为数据进行序列化特征编码,设置
以日作为预测周期,在第i日,依据长短期记忆网络LSTM的前一日的状态值
,当前日的
特征融合值
并使用sofmax来完成对当前时刻学业标签的预测:
LSTM前一日的状态值
或当前的状态值
的更新过程如下:
通过本申请实施例的步骤S102至步骤S110,解决了现有学业预警方法的预测精准率低的问题,实现了多通道学生行为信息特征融合的学业预警,利用长短期记忆网络来强化时序特征信息获取能力,使用注意力机制来融合多类型特征,提升学生学业预警的准确度。
在其中一些实施例中,在步骤S110,进行学业预警之前,该方法还包括:
图2是根据本申请实施例的学业预警模型的结构示意图,如图2所示,通过向量化表示、卷积神经网络、注意力机制、融合算法和长短期记忆网络组成的学业预警模型进行训练,基于预设损失函数反向传播更新学业预警模型的参数;采用开发集对学业预警模型进行测试,选择预设指标最佳的模型进行保存。
优选地,预设损失函数为负对数似然函数,预设指标为F1指标。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例提供了一种多通道信息特征融合的学业预警系统,图3是根据本申请实施例的多通道信息特征融合的学业预警系统的结构框图,如图3所示,该系统包括信息编码模块31、特征提取模块32、注意力模块33、融合模块34和预测模块35;
信息编码模块31,用于对学生的多类型行为信息进行预设编码,得到多类型行为信息的各个类型的向量化表示;
特征提取模块32,用于根据向量化表示,通过卷积神经网络提取得到多类型行为信息的各个类型的抽象特征;
注意力模块33,用于根据注意力机制,获取各个类型的抽象特征对应的注意力机制表示;
融合模块34,用于通过融合算法将各个类型的注意力机制表示进行融合,得到多类型行为信息的融合特征;
预测模块35,用于设置预测周期,根据以预测周期为间隔的连续时序上的融合特征,通过长短期记忆网络作出序列化的学业预警。
通过本申请实施例的信息编码模块31、特征提取模块32、注意力模块33、融合模块34和预测模块35,解决了现有学业预警方法的预测精准率低的问题,实现了多通道学生行为信息特征融合的学业预警,利用长短期记忆网络来强化时序特征信息获取能力,使用注意力机制来融合多类型特征,提升学生学业预警的准确度。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
另外,结合上述实施例中的多通道信息特征融合的学业预警方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种多通道信息特征融合的学业预警方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多通道信息特征融合的学业预警方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,图4是根据本申请实施例的电子设备的内部结构示意图,如图4所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图4所示。该电子设备包括通过内部总线连接的处理器、网络接口、内存储器和非易失性存储器,其中,该非易失性存储器存储有操作系统、计算机程序和数据库。处理器用于提供计算和控制能力,网络接口用于与外部的终端通过网络连接通信,内存储器用于为操作系统和计算机程序的运行提供环境,计算机程序被处理器执行时以实现一种多通道信息特征融合的学业预警方法,数据库用于存储数据。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。