CN112331211A - 学情信息获取方法、装置、设备和存储介质 - Google Patents
学情信息获取方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN112331211A CN112331211A CN202110010071.XA CN202110010071A CN112331211A CN 112331211 A CN112331211 A CN 112331211A CN 202110010071 A CN202110010071 A CN 202110010071A CN 112331211 A CN112331211 A CN 112331211A
- Authority
- CN
- China
- Prior art keywords
- learning
- information
- target text
- text
- learning situation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Abstract
本申请提出一种学情信息获取方法、装置、设备和存储介质,其中,学情信息获取方法包括:获取待处理语音信息;将待处理语音信息进行文本转换,得到目标文本;对目标文本进行学情信息提取,得到目标文本的针对多个学情维度的学情信息;在目标文本的学情信息满足预设学情输出条件的情况下,对多个学情维度的学情信息进行组合,得到学情结果。本申请实现了学情监督的自动化和智能化。
Description
技术领域
本申请涉及人工智能技术,尤其涉及一种学情信息获取方法、装置、设备和存储介质。
背景技术
人工智能实时检测技术越来越成为课堂教育的关键技术,信息提取在其中扮演着重要的角色。目前,信息提取技术大多是基于视频图像进行检测,比如,针对课堂视频而言,检测学生的行为,如趴桌子、玩手机、睡觉、听讲、阅读、举手等,仅能针对视频图像中可观测维度进行信息提取,显然,信息提取维度受到了限制。
发明内容
本申请实施例提供一种学情信息获取方法、装置、设备和存储介质,以解决相关技术存在的问题,技术方案如下:
第一方面,本申请实施例提供了一种学情信息获取方法,包括:
获取待处理语音信息;
将待处理语音信息进行文本转换,得到目标文本;
对目标文本进行学情信息提取,得到目标文本的针对多个学情维度的学情信息;
在目标文本的学情信息满足预设学情输出条件的情况下,对多个学情维度的学情信息进行组合,得到学情结果。
第二方面,本申请实施例提供一种学情信息获取装置,包括:
语音信息获取模块,用于获取待处理语音信息;
目标文本获取模块,用于将待处理语音信息进行文本转换,得到目标文本;
学情信息提取模块,用于对目标文本进行学情信息提取,得到目标文本的针对多个学情维度的学情信息;
学情结果获取模块,用于在目标文本的学情信息满足预设学情输出条件的情况下,对多个学情维度的学情信息进行组合,得到学情结果。
第三方面,本申请实施例提供了一种学情信息获取设备,该设备包括:存储器和处理器。其中,该存储器和该处理器通过内部连接通路互相通信,该存储器用于存储指令,该处理器用于执行该存储器存储的指令,并且当该处理器执行该存储器存储的指令时,使得该处理器执行上述各方面任一种实施方式中的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机程序,当计算机程序在计算机上运行时,上述各方面任一种实施方式中的方法被执行。
上述技术方案中的优点或有益效果至少包括:能够针对多种维度,对语音信息进行学情信息的提取,从而利用提取的学情信息得到学情结果,实现了学情监督的自动化和智能化。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
图1为根据本申请实施例的学情信息获取方法的流程图;
图2为根据本申请实施例的学情信息获取方法中,学情评价提取模型中的BRET模型的示例图;
图3为根据本申请实施例的学情信息获取方法中,学情细节提取模型中的BRET模型的示例图;
图4为根据本申请实施例的学情信息获取方法的模块框架图;
图5为根据本申请实施例的学情信息获取装置的结构框图;
图6为根据本申请实施例的学情信息获取设备的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1示出根据本申请实施例的学情信息获取方法的流程图。如图1所示,该学情信息获取方法可以包括:
S101、获取待处理语音信息;
S102、将待处理语音信息进行文本转换,得到目标文本;
S103、对目标文本进行学情信息提取,得到目标文本的针对多个学情维度的学情信息;
S104、在目标文本的学情信息满足预设学情输出条件的情况下,对多个学情维度的学情信息进行组合,得到学情结果。
其中,待处理语音信息可以包括课堂语音信息,或者课堂语音信息经过过滤得到的教师语音信息。除了课堂语音信息,待处理语音信息也可以包括课后教师的语音信息,例如家长会语音信息、教师课后语音录制的学生评语等等。
其中,待处理语音信息可以是目标场景中实时的语音信息,即对目标场景中的语音信息进行实时处理获取学情信息。待处理语音信息也可以是在结束对目标场景的语音录制后,对录制语音信息进行文本转换后切分为多个目标文本,再获取目标文本的学情信息。
其中,学情信息可以包括学生姓名、学情评价、学情细节和学情评价类型信息中的至少一种。举例说明,目标文本是“张三这次作业写得很好”,该目标文本中,学生姓名信息是“张三”,学情评价是“表扬”,学情评价细节是“作业写得很好”,学情评价类型是“作业”。
本申请实施例能够针对多种维度,对语音信息进行学情信息提取,从而利用提取的学情信息得到学情结果,实现了学情监督的自动化和智能化,有利于完善教育服务支撑体系。例如,该方法可以引入课堂监督系统,对课堂中教师语音进行学情信息提取,得到学情结果,实现课堂学生情况的自动化和智能化记录,减少教师课后对学生课堂评价的工作,而且,相比于教师课后再回忆学生情况进行课堂评价,本申请实施例更加客观全面。
在一种实施方式中,步骤S103,包括:
获取预设学生名单;
确定目标文本中存在与预设学生名单中的预设姓名相匹配的目标学生姓名,将目标学生姓名作为目标文本的针对学生姓名维度的学情信息。
在上述实施方式中,通过提取针对学生姓名维度的学情信息,可以了解到学情信息的评价对象。其次,由于通常教师的评价对象具有一定范围,例如在一个班级内。因此,给定预设学生名单,直接预设学生名单和目标文本进行文本匹配的方式,来实现学生姓名提取,既简单又准确。
在一种实施方式中,确定目标文本中存在与预设学生名单中的预设姓名相匹配的目标学生姓名,包括:
对于预设学生名单中的各个预设姓名,获取目标文本中文字组合与预设姓名的匹配值;
在目标文本存在匹配值大于预设匹配值的情况下,将匹配值大于预设匹配值的文字组合作为目标学生姓名;
其中,匹配值是根据文字组合中各单字的匹配类型而确定的,匹配类型包括文字匹配、拼音匹配、前后鼻音匹配和卷翘舌音匹配中的至少一种。
在上述实施方式中,采用单字匹配,同时,在单字匹配的基础上采用拼音模糊策略,如拼音匹配、前后鼻音匹配和卷翘舌音匹配等多种形式的拼音模糊策略,能够在遇到文本攻击以及老师表达不清的情况下,依然可以有效提取到姓名。
进一步地,单字匹配的步骤可以是:按照文本位置从左往右的顺序,对目标文本中的文字依次进行匹配。具体操作步骤示例:选取目标文本中的待匹配的第一个字,和预设姓名中的第一个字进行文字匹配,匹配值大于预设单字阈值则继续选取第二个字。将目标文本中的第二个字和预设姓名中的第二个字进行文字匹配,匹配值大于预设单字阈值则继续选取第三个字进行匹配,依次类推,直至得到和目标文本中文字组合的各个单字均匹配上的预设姓名。最后,基于各个单字的匹配值,确定预设姓名和目标文本的匹配值。
进一步地,根据相同位置上各个单字的匹配类型以及匹配类型对应的预设匹配值,确定相同位置上各个单字的匹配值;然后将相同位置上各个单字的匹配值连乘,确定预设姓名和目标文本的匹配值。
举例说明,假设文字匹配、拼音匹配、前后鼻音匹配、卷翘舌音匹配、不匹配各自对应的匹配值分别为1、0.9、0.8、0.6、0,目标文本中的一文字组合和预设姓名在相同位置上的单字的匹配类型依次为文字匹配、拼音匹配和前后鼻音匹配,则该文字组合和预设姓名的匹配值为1×0.9×0.8=0.72。
在一种实施方式中,步骤S103,包括:
获取完成训练的学情评价提取模型;
将目标文本输入学情评价提取模型,得到目标文本针对学情评价维度的学情信息。
在上述实施方式中,通过提取针对学情评价维度的学情信息,可以了解到对学生的评价,例如表扬、批评。其次,采用完成训练的模型提取学情评价的方式,通过模型可以更好地理解目标文本的语义,实现学情评价的有效提取。
进一步地,由于学情评价通常和学生姓名是紧密相连的,只有出现了学生姓名的地方才需要提取学情评价。因此,上述提取目标文本针对学情评价维度的学情信息的步骤,可以在出现了学生姓名的情况下才执行。即先判断目标文本是否存在学生姓名,或者判断目标文本或者与目标文本关联的前后文本中是否存在学生姓名,若存在,则执行将目标文本输入学情评价提取模型,得到目标文本针对学情评价维度的学情信息,若不存在,则直接确定目标文本不存在针对学情评价维度的学情信息,有利于节省计算量。
在一种实施方式中,上述学情评价提取模型可以为文本分类模型,确定目标文本的学情评价所属分类。
例如,目标文本用于表达表扬学生时,输出“表扬”。
又例如,目标文本用于表达批评学生时,输出“批评”。
又例如,目标文本表达对学生的任何评价时,输出“正常”。
上述几种分类仅为示例,实际运用时可以对上述分类进行替换或者拓展。
在一种实施方式中,学情评价提取模型的训练步骤,包括:
获取第一样本文本;
对第一样本文本中用于指示姓名的姓名词进行处理,以消除姓名词自身的语义信息,得到第二样本文本;
获取第二样本文本的学情评价标签;
获取待训练神经网络;
根据第二样本文本和第二样本文本的学情评价标签,对待训练神经网络进行训练,得到学情评价提取模型。
在上述实施方式中,在训练学情评价提取模型时,消除训练样本中姓名自身语义信息,使得模型更加关注评价的表述方式而不是名字,提高模型对学情评价的提取效果。
在上述实施方式中,对姓名词进行的处理可以是:将姓名词均通过预设词进行统一表示,预设词可以随意设定,如name、小A之类,能够消除姓名词自身语义对目标文本的评价表达的干扰即可;又或者是直接删除姓名词。
在上述实施方式中,第一样本文本可以包括由课堂语音转换得到的文本、教师评语中的至少一项。
进一步地,待训练神经网络可以包括BERT(Bidirectional EncoderRepresentations from Transformers)模型。对于BERT模型的训练,前期可以采用大量文本进行训练BERT模型,以使初步训练后的BERT模型可以获得文本的高效表示,此时的训练文本不需要局限于目标场景的文本,可以是日常对话、会议对话等多种场景的文本。后期可以采用与学情评价有关的目标场景的文本对初步训练后的BERT模型进行训练,实现对BERT的微调,得到最终的学情评价提取模型,可以获得学情评价的高效表示。这样处理的好处是,在保证学情评价提取模型的训练效果的同时,可以降低对目标场景的文本的数量要求。
图2为待训练神经网络采用的一种BERT模型的示例图。图2中,[CLS]放在第一个句子的首位,表示得到的特征用于后续的分类任务;C是BERT模型输出中的[CLS]符号,经过BERT模型得到的C 可以用于后续的分类任务;Tok表示不同的Token,图中Tok1、Tok2……TokN构成一个单独的句子;E表示嵌入向量;Ti表示第i个Token在经过BERT模型处理之后得到的特征向量。
在一种实施方式中,步骤S103,包括:
获取学情细节语料库;
将目标文本和学情细节语料库中的学情细节模板进行文本匹配,确定目标文本中与学情细节模板匹配的候选词句及候选词句的匹配值;
如果候选词句的匹配值大于预设学情细节提取阈值,则从目标文本中提取候选词句,作为目标文本的针对学情细节维度的学情信息。
在上述实施方式中,通过提取针对学情细节的学情信息,可以了解到学生情况的具体细节,例如表现非常好,坐得很直,写作业很仔细。其次,针对学情细节的提取,采用文本匹配的方式提取学情细节,比较简单准确。
进一步地,采用Word2Vector计算候选词句和学情细节模板的语义余弦(cosine)相似度作为匹配值,然后根据预设阈值对匹配值进行筛选得到最终匹配结果。其中,Word2Vector指的是一种文本转词向量的算法,利用Word2Vector计算候选词句和学情细节模板的相似度公式可以为,其中,x表示候选词句的向量,y表示学情细节模板的向量,||x||表示向量x的模(即向量x的长度),||y||表示向量y的模(即向量y的长度),<x,y>表示求向量x和向量y的内积。
在一种实施方式中,学情细节语料库的建立步骤包括:
获取与学情细节有关的文本语料;例如,可以是课堂语音转换得到的文本语料;
统计文本语料中的词句的频率,确定文本语料中出现频率超过预设频率的多个目标词句;
将多个目标词句作为学情细节模板,建立学情细节语料库。
进一步地,上述实施方式中统计词句的频率以及抽取出现频率超过预设频率高的目标词句的步骤,可以通过N-gram模型来实现。N-gram是一种基于统计语言模型的算法。
在上述实施方式中,与学情有关的文本语料中出现频率较高的词句,往往是学情细节。因此,通过对文本语料中的词句进行概率统计,进而提取高频词句,作为学情细节语料,可以节省人工采集学情细节语料的成本。
在一种实施方式中,步骤S103,包括:
获取目标文本中针对学情细节维度的学情信息;
获取学情评价类型提取模型;
将目标文本中针对学情细节维度的学情信息和目标文本输入学情评价类型提取模型,得到目标文本的针对学情评价类型维度的学情信息。
上述实施方式中,通过提取针对学情细节的学情评价类型,可以了解到对学生的评价时针对哪一类别的,例如坐姿、笔记、记录、作业、问答等。其次,采用学情评价类型维度提取模型提取学情评价类型时,将目标文本中的学情细节和目标文本一起联合输入模型,使得模型更关注于文本中的学情细节,更加有效提取学情评价所针对的类型。
进一步地,学情评价类型提取模型中可以包括BERT模型,图3示出学情评价类型提取模型中采用的BERT模型的示例图。需要说明的是,图3中,[SEP]标志用于分开两个输入句子,例如输入句子sentence1和sentence2,要在句子sentence1后面增加[SEP]标志。这里的sentence1可以是目标文本,sentence2可以是目标文本中针对学情细节维度的学情信息。图3中的其它图标说明均可参照图2的说明,此处不再赘述。
进一步地,由于学情评价通常和学生姓名是紧密相连的,只有出现了学生姓名的地方才需要提取学情评价。因此,上述针对学情评价类型维度的学情信息的步骤,可以在出现了学生姓名的情况下才执行。即先判断目标文本是否存在学生姓名,或者判断目标文本或者与目标文本关联的前后文本中是否存在学生姓名,若存在,则执行将目标文本中针对学情细节维度的学情信息和目标文本输入学情评价类型提取模型,若不存在,则直接确定目标文本不存在针对学情评价类型维度的学情信息,有利于节省计算量。
在一种实施方式中,步骤S104,包括:
在目标文本中存在包含有针对学生姓名维度的学情信息,以及包含有超过预设个数的学情维度的学情信息的情况下,对多个学情维度的学情信息进行组合,得到学情结果。
在上述实施方式中,通过要求包含学生姓名维度以及学情维度数量,保证输出的学情结果的完整性。
进一步地,方法还可以还包括:如果目标文本的学情信息不满足预设学情输出条件,则按照预设的组合方案的判断顺序,依次判断目标文本和各个相邻的文本组合后的文本对应得到的学情信息是否满足预设学情输出条件,若满足则输出,对多个学情维度的学情信息进行组合,得到学情结果。否则直接输出无结果。
一种示例,(1)如果目标文本任何学情元素都没有提取到,直接输出空学情。
(2)如果目标文本没有提取到学生姓名,直接输出空学情。
(3)如果目标文本提取到学生姓名,那么需要根据相邻文本的学情信息组合学情结果。当存在一种相邻文本的组合方案可以得到学生姓名以及评价,则可以输出对应的学情结果。
组合优先顺序为:目标文本的下一个文本,目标文本的上一个文本,目标文本的下两个文本。
需要说明的是,这里的目标文本可以是一个句子,也可以是两个或两个以上的句子,具体数量可以根据实际情况进行设定。
一种示例,步骤S103中,对目标文本进行学情信息提取,所提取的学情信息可以包括学生姓名、学情评价、学情细节和学情细节维度中的一种或任意多种(包括两种)的组合,例如,学生姓名和学情评价的组合,又例如,学生姓名、学情细节和学情细节维度的组合。
图4给出本申请实施例的一个具体示例的模块框架图。参见图4,该示例包括姓名提取模块、学情细节提取模块、学情评价提取模块和学情评价类型提取模块,具体操作流程如下:
步骤S1.1:将目标文本输入姓名提取模块。
步骤S1.2:将目标文本输入学情评价提取模块。
步骤S1.3:将目标文本输入学情评价类型提取模块。
步骤S1.4:将目标文本输入学情细节提取模块。
步骤S2.1:将姓名提取模块提取的学生姓名结果输入学情评价提取模块,以供学情评价提取模块确定目标文本中存在的学生姓名,进而去除姓名本身的语义后再对目标文本进行学情评价提取。
步骤S2.2:将学情细节提取模块提取的学情细节结果输入学情评价类型提取模块,以使学情评价类型提取模块在提取学情评价类型提取过程中更加关注目标文本的学情细节结果。
步骤S3.1:将姓名提取模块提取的学生姓名结果输入学情信息融合模块。
步骤S3.2:将学情评价提取模块的结果输入学情信息融合模块。
步骤S3.3:将学情评价类型提取模块的结果输入学情信息融合模块。
步骤S3.4:将学情细节提取模块的学情细节结果输入学情信息融合模块。
步骤S4:将学情信息融合模块的结果输出作为最终的学情结果。
其中,名字提取模块提取目标文本的学生姓名、评价细节提取模块提取目标文本的学情细节、学情评价提取模块提取学情评价和评价维度提取模块提取学情评价类型的过程可以参照上述步骤S103的各实施方式的内容,学情信息融合模块获取学情结果的过程可以参照上述步骤S104的实施方式的内容,此处不再赘述。
图5示出根据本申请实施例的学情信息获取装置的结构框图。如图5所示,该学情信息获取装置500可以包括:
语音信息获取模块501,用于获取待处理语音信息;
目标文本获取模块502,用于将待处理语音信息进行文本转换,得到目标文本;
学情信息提取模块503,用于对目标文本进行学情信息提取,得到目标文本的针对多个学情维度的学情信息;
学情结果获取模块504,用于在目标文本的学情信息满足预设学情输出条件的情况下,对多个学情维度的学情信息进行组合,得到学情结果。
在一种实施方式中,学情信息提取模块503,包括:
学生名单获取子模块,用于获取预设学生名单;
第一学情信息提取子模块,用于确定目标文本中存在与预设学生名单中的预设姓名相匹配的目标学生姓名,将目标学生姓名作为目标文本的针对学生姓名维度的学情信息。
在一种实施方式中,第一学情信息提取子模块,还用于:对于预设学生名单中的各个预设姓名,获取目标文本中文字组合与预设姓名的匹配值;在目标文本存在匹配值大于预设匹配值的情况下,将匹配值大于预设匹配值的文字组合作为目标学生姓名。其中,匹配值是根据文字组合中各单字的匹配类型而确定的,匹配类型包括文字匹配、拼音匹配、前后鼻音匹配和卷翘舌音匹配中的至少一种。
在一种实施方式中,学情信息提取模块503,包括:
学情评价提取模型获取子模块,用于获取完成训练的学情评价提取模型;
第二学情信息提取子模块,用于将目标文本输入学情评价提取模型,得到目标文本针对学情评价维度的学情信息。
在一种实施方式中,学情信息获取装置还包括:学情评价提取模型训练模块,用于:获取第一样本文本;对第一样本文本中用于指示姓名的姓名词进行处理,以消除姓名词自身的语义信息,得到第二样本文本;获取第二样本文本的学情评价标签;获取待训练神经网络;根据第二样本文本和第二样本文本的学情评价标签,对待训练神经网络进行训练,得到学情评价提取模型。
在一种实施方式中,学情信息提取模块503,包括:
学情细节语料库获取子模块,用于获取学情细节语料库;
文本匹配子模块,用于将目标文本和学情细节语料库中的学情细节模板进行文本匹配,确定目标文本中与学情细节模板匹配的候选词句及候选词句的匹配值;
第三学情信息提取子模块,用于在候选词句的匹配值大于预设学情细节提取阈值的情况下,从目标文本中提取候选词句,作为目标文本的针对学情细节维度的学情信息。
在一种实施方式中,学情信息获取装置还包括:学情细节语料库建立模块,用于:获取与学情细节有关的文本语料;统计文本语料中的词句的频率,确定文本语料中出现频率超过预设频率的多个目标词句;将多个目标词句作为学情细节模板,建立学情细节语料库。
在一种实施方式中,学情信息提取模块503,包括:
学情细节维度获取子模块,用于获取目标文本中针对学情细节维度的学情信息;
学情评价类型提取模型获取子模块,用于获取学情评价类型提取模型;
第四学情信息提取子模块,用于将目标文本中针对学情细节维度的学情信息和目标文本输入学情评价类型提取模型,得到目标文本的针对学情评价类型维度的学情信息。
在一种实施方式中,学情结果获取模块504,还用于在目标文本中存在包含有针对学生姓名维度的学情信息,以及包含有超过预设个数的学情维度的学情信息的情况下,对多个学情维度的学情信息进行组合,得到学情结果。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
图6示出根据本申请实施例的学情信息获取设备的结构框图。如图6所示,该学情信息提取设备包括:存储器610和处理器620,存储器610内存储有可在处理器620上运行的计算机程序。处理器620执行该计算机程序时实现上述实施例中的学情信息获取方法。存储器610和处理器620的数量可以为一个或多个。
该学情信息获取设备还包括:
通信接口630,用于与外界设备进行通信,进行数据交互传输。
如果存储器610、处理器620和通信接口630独立实现,则存储器610、处理器620和通信接口630可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral ComponentInterconnect ,PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture ,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器610、处理器620及通信接口630集成在一块芯片上,则存储器610、处理器620及通信接口630可以通过内部接口完成相互间的通信。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现本申请实施例中提供的方法。
本申请实施例还提供了一种芯片,该芯片包括,包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本申请实施例提供的方法。
本申请实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammablegate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(advanced RISC machines,ARM)架构的处理器。
进一步地,可选的,上述存储器可以包括只读存储器和随机存取存储器,还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以包括随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic random access memory,DRAM) 、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data dateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (18)
1.一种学情信息获取方法,其特征在于,包括:
获取待处理语音信息;
将所述待处理语音信息进行文本转换,得到目标文本;
对所述目标文本进行学情信息提取,得到所述目标文本的针对多个学情维度的学情信息;
在所述目标文本的学情信息满足预设学情输出条件的情况下,对多个学情维度的学情信息进行组合,得到学情结果;
其中,所述在所述目标文本的学情信息满足预设学情输出条件的情况下,对多个学情维度的学情信息进行组合,得到学情结果,包括:
在所述目标文本中存在包含有针对学生姓名维度的学情信息,以及包含有超过预设个数的学情维度的学情信息的情况下,对多个学情维度的学情信息进行组合,得到学情结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标文本进行学情信息提取,得到所述目标文本的针对多个学情维度的学情信息,包括:
获取预设学生名单;
确定所述目标文本中存在与所述预设学生名单中的预设姓名相匹配的目标学生姓名,将所述目标学生姓名作为所述目标文本的针对学生姓名维度的学情信息。
3.根据权利要求2所述的方法,其特征在于,所述确定所述目标文本中存在与所述预设学生名单中的预设姓名相匹配的目标学生姓名,包括:
对于所述预设学生名单中的各个预设姓名,获取所述目标文本中文字组合与所述预设姓名的匹配值;
在所述目标文本存在匹配值大于预设匹配值的情况下,将所述匹配值大于预设匹配值的文字组合作为所述目标学生姓名;
其中,所述匹配值是根据文字组合中各单字的匹配类型而确定的,所述匹配类型包括文字匹配、拼音匹配、前后鼻音匹配和卷翘舌音匹配中的至少一种。
4.根据权利要求1所述的方法,其特征在于,所述对所述目标文本进行学情信息提取,得到所述目标文本的针对多个学情维度的学情信息,还包括:
获取完成训练的学情评价提取模型;
将所述目标文本输入所述学情评价提取模型,得到所述目标文本针对学情评价维度的学情信息。
5.根据权利要求4所述的方法,其特征在于,所述学情评价提取模型的训练步骤,包括:
获取第一样本文本;
对所述第一样本文本中用于指示姓名的姓名词进行处理,以消除所述姓名词自身的语义信息,得到第二样本文本;
获取所述第二样本文本的学情评价标签;
获取待训练神经网络;
根据所述第二样本文本和所述第二样本文本的学情评价标签,对所述待训练神经网络进行训练,得到所述学情评价提取模型。
6.根据权利要求1所述的方法,其特征在于,所述对所述目标文本进行学情信息提取,得到所述目标文本的针对多个学情维度的学情信息,包括:
获取学情细节语料库;
将所述目标文本和所述学情细节语料库中的学情细节模板进行文本匹配,确定所述目标文本中与所述学情细节模板匹配的候选词句及候选词句的匹配值;
如果所述候选词句的匹配值大于预设学情细节提取阈值,则从所述目标文本中提取所述候选词句,作为所述目标文本的针对学情细节维度的学情信息。
7.根据权利要求6所述的方法,其特征在于,所述学情细节语料库的建立步骤包括:
获取与学情细节有关的文本语料;
统计所述文本语料中的词句的频率,确定所述文本语料中出现频率超过预设频率的多个目标词句;
将所述多个目标词句作为学情细节模板,建立所述学情细节语料库。
8.根据权利要求1或6或7所述的方法,其特征在于,所述对所述目标文本进行学情信息提取,得到所述目标文本的针对多个学情维度的学情信息,包括:
获取所述目标文本中针对学情细节维度的学情信息;
获取学情评价类型提取模型;
将所述目标文本中针对学情细节维度的学情信息和所述目标文本输入所述学情评价类型提取模型,得到所述目标文本的针对学情评价类型维度的学情信息。
9.一种学情信息获取装置,其特征在于,包括:
语音信息获取模块,用于获取待处理语音信息;
目标文本获取模块,用于将所述待处理语音信息进行文本转换,得到目标文本;
学情信息提取模块,用于对所述目标文本进行学情信息提取,得到所述目标文本的针对多个学情维度的学情信息;
学情结果获取模块,用于在所述目标文本的学情信息满足预设学情输出条件的情况下,对多个学情维度的学情信息进行组合,得到学情结果;
所述学情结果获取模块,还用于在所述目标文本中存在包含有针对学生姓名维度的学情信息,以及包含有超过预设个数的学情维度的学情信息的情况下,对多个学情维度的学情信息进行组合,得到学情结果。
10.根据权利要求9所述的装置,其特征在于,所述学情信息提取模块,包括:
学生名单获取子模块,用于获取预设学生名单;
第一学情信息提取子模块,用于确定所述目标文本中存在与所述预设学生名单中的预设姓名相匹配的目标学生姓名,将所述目标学生姓名作为所述目标文本的针对学生姓名维度的学情信息。
11.根据权利要求10所述的装置,其特征在于,所述第一学情信息提取子模块,还用于:
对于所述预设学生名单中的各个预设姓名,获取所述目标文本中文字组合与所述预设姓名的匹配值;
在所述目标文本存在匹配值大于预设匹配值的情况下,将所述匹配值大于预设匹配值的文字组合作为所述目标学生姓名;
其中,所述匹配值是根据文字组合中各单字的匹配类型而确定的,所述匹配类型包括文字匹配、拼音匹配、前后鼻音匹配和卷翘舌音匹配中的至少一种。
12.根据权利要求9所述的装置,其特征在于,所述学情信息提取模块,包括:
学情评价提取模型获取子模块,用于获取完成训练的学情评价提取模型;
第二学情信息提取子模块,用于将所述目标文本输入所述学情评价提取模型,得到所述目标文本针对学情评价维度的学情信息。
13.根据权利要求12所述的装置,其特征在于,还包括:学情评价提取模型训练模块,用于:
获取第一样本文本;对所述第一样本文本中用于指示姓名的姓名词进行处理,以消除所述姓名词自身的语义信息,得到第二样本文本;获取所述第二样本文本的学情评价标签;获取待训练神经网络;根据所述第二样本文本和所述第二样本文本的学情评价标签,对所述待训练神经网络进行训练,得到所述学情评价提取模型。
14.根据权利要求9所述的装置,其特征在于,所述学情信息提取模块,包括:
学情细节语料库获取子模块,用于获取学情细节语料库;
文本匹配子模块,用于将所述目标文本和所述学情细节语料库中的学情细节模板进行文本匹配,确定所述目标文本中与所述学情细节模板匹配的候选词句及候选词句的匹配值;
第三学情信息提取子模块,用于在所述候选词句的匹配值大于预设学情细节提取阈值的情况下,从所述目标文本中提取所述候选词句,作为所述目标文本的针对学情细节维度的学情信息。
15.根据权利要求14所述的装置,其特征在于,还包括:学情细节语料库建立模块,用于:
获取与学情细节有关的文本语料;
统计所述文本语料中的词句的频率,确定所述文本语料中出现频率超过预设频率的多个目标词句;
将所述多个目标词句作为学情细节模板,建立所述学情细节语料库。
16.根据权利要求9或14或15所述的装置,其特征在于,所述学情信息提取模块,包括:
学情细节维度获取子模块,用于获取所述目标文本中针对学情细节维度的学情信息;
学情评价类型提取模型获取子模块,用于获取学情评价类型提取模型;
第四学情信息提取子模块,用于将所述目标文本中针对学情细节维度的学情信息和所述目标文本输入所述学情评价类型提取模型,得到所述目标文本的针对学情评价类型维度的学情信息。
17.一种学情信息获取设备,其特征在于,包括:处理器和存储器,所述存储器中存储指令,所述指令由所述处理器加载并执行,以实现如权利要求1至8任一项所述的方法。
18.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110010071.XA CN112331211B (zh) | 2021-01-06 | 2021-01-06 | 学情信息获取方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110010071.XA CN112331211B (zh) | 2021-01-06 | 2021-01-06 | 学情信息获取方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112331211A true CN112331211A (zh) | 2021-02-05 |
CN112331211B CN112331211B (zh) | 2021-05-07 |
Family
ID=74302214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110010071.XA Active CN112331211B (zh) | 2021-01-06 | 2021-01-06 | 学情信息获取方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112331211B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108109446A (zh) * | 2017-12-26 | 2018-06-01 | 重庆大争科技有限公司 | 教学课情监控系统 |
CN109036424A (zh) * | 2018-08-30 | 2018-12-18 | 出门问问信息科技有限公司 | 语音识别方法、装置、电子设备及计算机可读存储介质 |
CN109471915A (zh) * | 2018-10-09 | 2019-03-15 | 科大讯飞股份有限公司 | 一种文本评价方法、装置、设备以及可读存储介质 |
CN109635091A (zh) * | 2018-12-14 | 2019-04-16 | 上海钛米机器人科技有限公司 | 一种语义识别方法、装置、终端设备和存储介质 |
CN110091335A (zh) * | 2019-04-16 | 2019-08-06 | 威比网络科技(上海)有限公司 | 学伴机器人的控制方法、系统、设备及存储介质 |
CN110333774A (zh) * | 2019-03-20 | 2019-10-15 | 中国科学院自动化研究所 | 一种基于多模态交互的远程用户注意力评估方法及系统 |
CN110600033A (zh) * | 2019-08-26 | 2019-12-20 | 北京大米科技有限公司 | 学习情况的评估方法、装置、存储介质及电子设备 |
CN111402641A (zh) * | 2020-05-06 | 2020-07-10 | 陈俞伶 | 一种基于互动的课堂教学分析系统及方法 |
JP2020118930A (ja) * | 2019-01-28 | 2020-08-06 | パナソニックIpマネジメント株式会社 | 称賛者支援システム及び称賛者支援方法 |
CN111681143A (zh) * | 2020-04-27 | 2020-09-18 | 平安国际智慧城市科技股份有限公司 | 基于课堂语音的多维度分析方法、装置、设备及存储介质 |
CN111932418A (zh) * | 2020-09-09 | 2020-11-13 | 中山大学深圳研究院 | 一种学生学习情况识别方法、系统、教学终端及存储介质 |
CN112069315A (zh) * | 2020-08-31 | 2020-12-11 | 深圳市卡牛科技有限公司 | 提取文本多维度信息方法、装置、服务器及存储介质 |
-
2021
- 2021-01-06 CN CN202110010071.XA patent/CN112331211B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108109446A (zh) * | 2017-12-26 | 2018-06-01 | 重庆大争科技有限公司 | 教学课情监控系统 |
CN109036424A (zh) * | 2018-08-30 | 2018-12-18 | 出门问问信息科技有限公司 | 语音识别方法、装置、电子设备及计算机可读存储介质 |
CN109471915A (zh) * | 2018-10-09 | 2019-03-15 | 科大讯飞股份有限公司 | 一种文本评价方法、装置、设备以及可读存储介质 |
CN109635091A (zh) * | 2018-12-14 | 2019-04-16 | 上海钛米机器人科技有限公司 | 一种语义识别方法、装置、终端设备和存储介质 |
JP2020118930A (ja) * | 2019-01-28 | 2020-08-06 | パナソニックIpマネジメント株式会社 | 称賛者支援システム及び称賛者支援方法 |
CN110333774A (zh) * | 2019-03-20 | 2019-10-15 | 中国科学院自动化研究所 | 一种基于多模态交互的远程用户注意力评估方法及系统 |
CN110091335A (zh) * | 2019-04-16 | 2019-08-06 | 威比网络科技(上海)有限公司 | 学伴机器人的控制方法、系统、设备及存储介质 |
CN110600033A (zh) * | 2019-08-26 | 2019-12-20 | 北京大米科技有限公司 | 学习情况的评估方法、装置、存储介质及电子设备 |
CN111681143A (zh) * | 2020-04-27 | 2020-09-18 | 平安国际智慧城市科技股份有限公司 | 基于课堂语音的多维度分析方法、装置、设备及存储介质 |
CN111402641A (zh) * | 2020-05-06 | 2020-07-10 | 陈俞伶 | 一种基于互动的课堂教学分析系统及方法 |
CN112069315A (zh) * | 2020-08-31 | 2020-12-11 | 深圳市卡牛科技有限公司 | 提取文本多维度信息方法、装置、服务器及存储介质 |
CN111932418A (zh) * | 2020-09-09 | 2020-11-13 | 中山大学深圳研究院 | 一种学生学习情况识别方法、系统、教学终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112331211B (zh) | 2021-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110427623B (zh) | 半结构化文档知识抽取方法、装置、电子设备及存储介质 | |
CN111046133A (zh) | 基于图谱化知识库的问答方法、设备、存储介质及装置 | |
WO2021114840A1 (zh) | 基于语义分析的评分方法、装置、终端设备及存储介质 | |
CN107679032A (zh) | 语音转换纠错方法和装置 | |
KR20200119410A (ko) | 전역 및 지역 문맥 기반 한국어 대화문 감정 인식 시스템 및 방법 | |
WO2022007723A1 (zh) | 语句类型识别方法、装置、电子设备和存储介质 | |
CN111180025A (zh) | 表示病历文本向量的方法、装置及问诊系统 | |
CN111145903A (zh) | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 | |
CN111881297A (zh) | 语音识别文本的校正方法及装置 | |
CN112016271A (zh) | 语言风格转换模型的训练方法、文本处理方法以及装置 | |
CN114218945A (zh) | 实体识别方法、装置、服务器及存储介质 | |
JP6425493B2 (ja) | 人の発言に基づいて学習項目に対する評価レベルを推定するプログラム、装置及び方法 | |
CN111444729A (zh) | 信息处理的方法、装置、设备及可读存储介质 | |
CN110852071A (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
CN114461366A (zh) | 多任务模型训练方法、处理方法、电子设备及存储介质 | |
KR20170086233A (ko) | 라이프 음성 로그 및 라이프 영상 로그를 이용한 점증적 음향 모델 및 언어 모델 학습 방법 | |
CN112559725A (zh) | 文本匹配方法、装置、终端和存储介质 | |
CN117152770A (zh) | 一种面向手写输入的书写能力智能评测方法及系统 | |
CN112331211B (zh) | 学情信息获取方法、装置、设备和存储介质 | |
CN115116427B (zh) | 标注方法、语音合成方法、训练方法及装置 | |
CN112151019A (zh) | 文本处理方法、装置及计算设备 | |
CN113205813B (zh) | 语音识别文本的纠错方法 | |
CN112509559B (zh) | 音频识别方法、模型训练方法、装置、设备及存储介质 | |
CN115099222A (zh) | 标点符号误用检测纠正方法、装置、设备及存储介质 | |
CN114241279A (zh) | 图文联合纠错方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |