CN116450848B - 一种基于事理图谱的计算思维水平评估方法、装置及介质 - Google Patents
一种基于事理图谱的计算思维水平评估方法、装置及介质 Download PDFInfo
- Publication number
- CN116450848B CN116450848B CN202310393999.XA CN202310393999A CN116450848B CN 116450848 B CN116450848 B CN 116450848B CN 202310393999 A CN202310393999 A CN 202310393999A CN 116450848 B CN116450848 B CN 116450848B
- Authority
- CN
- China
- Prior art keywords
- thinking
- score
- event
- calculated
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000006399 behavior Effects 0.000 claims abstract description 44
- 238000011156 evaluation Methods 0.000 claims abstract description 33
- 238000010223 real-time analysis Methods 0.000 claims abstract description 33
- 238000004458 analytical method Methods 0.000 claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims abstract description 30
- 239000013598 vector Substances 0.000 claims description 51
- 238000003860 storage Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 230000000052 comparative effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 14
- 238000003745 diagnosis Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000000605 extraction Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000019771 cognition Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003340 mental effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于事理图谱的计算思维水平评估方法、装置及介质,方法包括:获取目标对象的多模态信息;根据语音信息提取事件元素,编码事件元素的知识图谱;对行为信息进行流计算,得到实时分析数据;基于知识图谱和实时分析数据,构建得到事理图谱;根据事理图谱与预先事理图谱的对比学习,得到第一计算思维得分;根据文本信息与预设标准结果的相似度分析,得到第二计算思维得分;对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果。本发明能够实现计算思维评价的可解释性及实时性,并在事理图谱的基础上结合指定任务的完成结果的文本信息共同进行计算思维评估,提高评价精度,可广泛应用于计算机技术领域。
Description
技术领域
本发明涉及计算机技术领域,尤其是一种基于事理图谱的计算思维水平评估方法、装置及介质。
背景技术
随着计算机的快速发展,计算思维逐渐成为人们生活在成为信息社会中人们解决问题的一项基本能力。但是,思维往往是抽象且内隐的,这使得思维诊断不同于知识测量,具有结构复杂、过程性要求高、不确定性强等特点,而传统的基于量表的计算思维评估方法大多只能进行延时性反馈,评价过程较为耗时,容易引起学习者的负面情绪,也难以实现对计算思维状态的智能诊断和实时的个性化反馈。因此长期以来,计算思维诊断问题一直是教育领域中备受关注的难点问题。
近年来,基于过程产生的事理图谱得到了广泛的关注,它在学习过程中的应用能够极好的反映出学习行为及其之间的关系,对过程性评价的发展具有重要意义。但是,现有构建事理图谱的数据采集较为单一,导致当前基于事理图谱的学习分析往往仅有单模态的数据。并且往往伴随数据采集主观性以及评估的延时性,未能真正体现事理图谱表达现实世界中不同事件的演化模式和发展逻辑的价值。同时,如何对事理图谱进行解释,从中获取有利的信息当前也未有一个明确的答案。
发明内容
有鉴于此,本发明实施例提供一种基于事理图谱的计算思维水平评估方法、装置及介质,能够高效实现计算思维水平评估。
一方面,本发明的实施例提供了一种基于事理图谱的计算思维水平评估方法,包括:
获取目标对象的多模态信息;多模态信息包括语音信息、行为信息和文本信息;多模态信息表征目标对象完成指定任务过程中采集的信息,文本信息表征指定任务的完成结果;
根据语音信息提取事件元素,编码事件元素的知识图谱;和,对行为信息进行流计算,得到实时分析数据;
基于知识图谱和实时分析数据,构建得到事理图谱;
根据事理图谱与预先事理图谱的对比学习,得到第一计算思维得分;
根据文本信息与预设标准结果的相似度分析,得到第二计算思维得分;
对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果。
可选地,根据语音信息提取事件元素,编码事件元素的知识图谱,包括:
对语音信息进行识别,得到转换文本;
根据转换文本提取事件元素;
对事件元素进行关系抽取,获得各事件元素间的关系向量;
将各事件元素编码成节点和关系向量编码成边,构建得到事件元素的知识图谱。
可选地,根据转换文本提取事件元素,包括:
通过分词器对转换文本进行切片处理,得到语句序列;
通过嵌入层进行向量化处理,并通过多层变压编码器进行自注意力操作和全连接操作,得到语义向量;
对语义向量进行特征提取和编码,并结合池化操作和全连接操作,得到事件元素。
可选地,对事件元素进行关系抽取,获得各事件元素间的关系向量,包括:
根据两个事件元素的组合,得到事件元素对;
将事件元素对输入卷积神经网络,通过卷积层提取局部特征,并通过池化层对局部特征进行下采样和压缩处理,得到全局特征;对全局特征进行全连接处理和归一化处理,得到事件元素对的关系向量;
其中,卷积神经网络通过已标注关系标签的事件元素对训练生成的。
可选地,对行为信息进行流计算,得到实时分析数据,包括:
其中,行为信息通过与日志服务器关联的日志采集系统采集,并存储于日志缓存集群;日志缓存集群与批处理引擎关联;
通过批处理引擎对行为信息的实时计算实现流计算,得到实时分析数据。
可选地,基于知识图谱和实时分析数据,构建得到事理图谱,包括:
通过数据库分别存储知识图谱和实时分析数据;
将存储知识图谱的数据库和存储实时分析数据的数据库统一连接到图形数据库,构建得到事理图谱。
可选地,对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果,包括:
对第一计算思维得分和第二计算思维得分进行标度比较,通过判断矩阵确定第一计算思维得分的第一加权系数和第二计算思维得分的第二加权系数;
根据第一加权系数和第二加权系数,对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果。
另一方面,本发明的实施例提供了一种基于事理图谱的计算思维水平评估装置,包括:
第一模块,用于获取目标对象的多模态信息;多模态信息包括语音信息、行为信息和文本信息;多模态信息表征目标对象完成指定任务过程中采集的信息,文本信息表征指定任务的完成结果;
第二模块,用于根据语音信息提取事件元素,编码事件元素的知识图谱;和,对行为信息进行流计算,得到实时分析数据;
第三模块,用于基于知识图谱和实时分析数据,构建得到事理图谱;
第四模块,用于根据事理图谱与预先事理图谱的对比学习,得到第一计算思维得分;
第五模块,用于根据文本信息与预设标准结果的相似度分析,得到第二计算思维得分;
第六模块,用于对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果。
另一方面,本发明的实施例提供了一种基于事理图谱的计算思维水平评估装置,包括处理器以及存储器;
存储器用于存储程序;
处理器执行程序实现如前面的方法。
另一方面,本发明的实施例提供了一种计算机可读存储介质,存储介质存储有程序,程序被处理器执行实现如前面的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
本发明实施例首先获取目标对象的多模态信息;多模态信息包括语音信息、行为信息和文本信息;多模态信息表征目标对象完成指定任务过程中采集的信息,文本信息表征指定任务的完成结果;根据语音信息提取事件元素,编码事件元素的知识图谱;和,对行为信息进行流计算,得到实时分析数据;基于知识图谱和实时分析数据,构建得到事理图谱;根据事理图谱与预先事理图谱的对比学习,得到第一计算思维得分;根据文本信息与预设标准结果的相似度分析,得到第二计算思维得分;对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果。本发明实施例基于多模态信息的语音信息和行为信息实现思维分析的多元化,进而基于语音信息提取的事件元素编码知识图谱,同时融合基于行为信息的实时分析数据构建事理图谱,能够有效实现计算思维评价的可解释性及实时性,并且通过在事理图谱的基础上结合指定任务的完成结果的文本信息共同进行计算思维评估,能够进一步提高评价精度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于事理图谱的计算思维水平评估方法的流程示意图;
图2为本发明实施例提供的一种基于事理图谱的计算思维水平评估方法的总体流程示意图;
图3为本发明实施例提供的方法流程应用场景的系统框架示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一方面,如图1所示,本发明的实施例提供了一种基于事理图谱的计算思维水平评估方法,包括:
S100、获取目标对象的多模态信息;
需要说明的是,多模态信息包括语音信息、行为信息和文本信息;多模态信息表征目标对象完成指定任务过程中采集的信息,文本信息表征指定任务的完成结果;
具体地,一些具体实施例中,目标对象的行为信息可以通过前端埋点来进行采集,即通过浏览器内置javascript对象收集信息,而后借助访问图片资源的方法来实现,即使用图片请求后端controller。此时,目标对象的行为信息/数据存储在日志服务器中,需采用Flume(采集系统)以监听命令的方式对日志文件进行监听,实现将日志文件实时采集到Flume上。语音信息则可以通过相关音频采集设备进行获取。而文本信息则可以通过运行客户端获取用户输入的答案。
S200、根据语音信息提取事件元素,编码事件元素的知识图谱;和,对行为信息进行流计算,得到实时分析数据;
需要说明的是,一些实施例中,根据语音信息提取事件元素,编码事件元素的知识图谱,包括:对语音信息进行识别,得到转换文本;根据转换文本提取事件元素;对事件元素进行关系抽取,获得各事件元素间的关系向量;将各事件元素编码成节点和关系向量编码成边,构建得到事件元素的知识图谱。
其中,一些实施例中,根据转换文本提取事件元素,包括:通过分词器对转换文本进行切片处理,得到语句序列;通过嵌入层进行向量化处理,并通过多层变压编码器进行自注意力操作和全连接操作,得到语义向量;对语义向量进行特征提取和编码,并结合池化操作和全连接操作,得到事件元素。
其中,一些实施例中,对事件元素进行关系抽取,获得各事件元素间的关系向量,包括:根据两个事件元素的组合,得到事件元素对;将事件元素对输入卷积神经网络,通过卷积层提取局部特征,并通过池化层对局部特征进行下采样和压缩处理,得到全局特征;对全局特征进行全连接处理和归一化处理,得到事件元素对的关系向量;其中,卷积神经网络通过已标注关系标签的事件元素对训练生成的。
具体地,一些具体实施例中,如图2所示,可以通过如下步骤实现:
步骤1:采用基于ASRT(Auto Speech Recognition Tool,基于深度学习的中文语音识别系统)的开源项目实现实时的语音转文本;
步骤2:采用基于Bert模型将语音转译的文本编码为句子的语义向量,并进一步通过语义向量提取出事件和事件元素,采用多标签分类的方式对事件元素进行分类,得到事件集合。该过程具体包括三个层次:
输入编码层:基于Bert模型对输入句子进行编码,首先通过分词器(切片)将句子x变成一字,然后用Bert Tokenizer将其变成一个token序列X={x1,x2,x3....xn},其中每一个token是一个字的id(设置do_basic_tokenize为True),即每个句子由一个token id序列组成,其中Bert Tokenizer还会在每个句子的开始添加一个[CLS]标记,在每个句子的结尾添加一个[SEP]标记。然后,对token id序列进行padding操作,使其长度达到最大长度。
语义向量提取层:加载预训练模型Bert,将token id序列输入该模型。Bert模型内含多层Transformer Encoder(变压编码器),目的是将token id序列转变成句子的语义向量。具体方法如下:首先通过Embedding层(嵌入层)将每个token序列编码成一个由字向量矩阵Wt、分隔向量矩阵Ws和位置向量矩阵Wp的加和而成的向量,其嵌入表示为h0,如公式(1)所示。然后将这些向量输入到多层Transformer Encoder中。在每个TransformerEncoder中,输入的向量序列经过一系列的self-attention层(实现自注意力操作)和全连接层操作,需要注意的是,无论是self-attention层还是全连接层的输入都要先通过残差连接和Layer Normalization的标准化处理,以缓解梯度消失问题,加速模型收敛。经过了多层Encoder层后输出一个三维张量,形状为(batch_size,sequence_length,hidden_size),其中:
batch_size:表示输入的句子数量,可以是任意正整数。
sequence_length:表示输入的每个句子经过Normalization之后的长度。
hidden_size:表示Bert模型的隐层节点数。
将其中sequence_length的进行max-pooling池化操作,即将每个特征的sequence_length维度上的所有值进行比较,取其中的最大值作为该特征的池化值。这样操作后,我们就得到了一个大小为(batch_size,hidden_size)的二维张量,其中每行是对应句子的语义表示。
h0=XWt+Ws+Wp (1)
事件元素抽取层:即将由编码层输出的句子的语义向量作为输入,采用transformer来检测文本中存在的事件,具体方法为:将二维张量输入到TransformerEncoder中进行特征提取和编码。后将Transformer Encoder输出的向量进行池化操作,然后连接一个全连接层(实现全连接操作)。最后使用Bi-LSTM-CRF模式来实现序列标注任务,即首先将全连接层输出的向量通过bert中文预训练模型得到中文词向量,然后将该向量输入到双向长短期记忆神经网络(Bi-LSTM),BiLSTM会输出表示该token对应各个类别的分数。该分值最终会进入CRF层,CRF层增加约束规则以降低预测结果错误的概率。而这些约束可以通过训练数据被CRF层自动学习得到。通过CRF层后,即可得到更加准确的事件元素的类型。将事件元素的标签序列输入到预训练的词向量模型中(Word2Vec),将每个事件元素对应的词向量作为事件元素的语义向量。
步骤3:该步骤的目的进行事件元素的关系抽取,将S2中输出的各个事件元素的语义向量作为输入,将一个句子中的任意两个语义向量组成一个组合,得到的是一个事件元素对的语义向量。将各个元素对的语义向量输入到Text-CNN卷积神经网络中,进一步考察其关系,在Text-CNN中主要采用卷积层和池化层的组合,通过卷积层提取局部特征,再通过池化层对这些特征进行下采样和压缩,得到固定长度的全局特征向量。而后将事件元素对的全局特征向量输入到全连接层中,全连接层(实现全连接处理)通过事件元素关系抽取模型,利用softmax函数(实现归一化处理)映射到各个事件关系标签的概率分布上,并选择得分最高的标签作为模型最终的预测结果,即最终得到事件元素对关系的语义向量(即事件元素对的关系向量)。该预测结果是准确性是由预先训练的事件元素关系抽取模型的准确性来决定的。因此,在此之前,需要大量数据来训练事件元素关系抽取模型,以保证其有合适的超参数设置。
具体方法如下:
数据预处理:将不同计算思维水平答题者的口述语音转为文字,并作为语料库进行标注,得到事件元素对和对应的关系标签,并将其转换为神经网络所需的输入格式。
模型构建:根据任务需求,通过Bi-LSTM-CRF标注后输入到Text-CNN得到事件元素的语义向量表示,并将其连接至全连接层,用于预测事件元素对的关系标签。
模型训练:使用预处理好的数据集,通过反向传播算法优化模型参数,使得模型的输出结果能够尽可能地接近真实标签,达到最优化的状态。
模型评估:将训练好的模型应用到测试集中,计算模型的准确率、召回率、F1值等指标,以评估模型的性能。
模型调优:根据评估结果,进行模型调整和优化,如调整超参数、改变神经网络结构等,以提升模型性能。
步骤4:通过上述步骤得到的事件元素对及其之间的关系需进一步转化成节点和边。即首先将所有事件元素编码成节点,后将事件元素对之间的关系向量编码成边,并使用Neo4j的Cypher语言将节点和关系存储到数据库中。
需要说明的是,一些实施例中,对行为信息进行流计算,得到实时分析数据,包括:其中,行为信息通过与日志服务器关联的日志采集系统采集,并存储于日志缓存集群;日志缓存集群与批处理引擎关联;通过批处理引擎对行为信息的实时计算实现流计算,得到实时分析数据。
具体地,一些具体实施例中,在对用户口述语音进行收集的同时,还要对用户的行为进行实时的收集与分析,如图2中S5-1至S5-4,具体方法如下:
数据采集:用户行为的收据主要通过前端埋点来进行采集,即通过浏览器内置javascript对象收集信息。而后借助访问图片资源的方法来,即使用图片请求后端controller。此时,用户的行为数据存储在日志服务器中,需采用Flume(作为日志采集系统)以监听命令的方式对日志文件进行监听,实现将日志文件实时采集到Flume上;
数据存储:通过Flume Sink组件配置Kafka集群(即日志缓存集群)连接地址进行数据传输,即将Flume采集的数据传入到Kafka集群中,集群按照业务进行区分,以不同的Topic来存储各种类型的业务数据。使用Spark Streaming将Spark(批处理引擎)和Kafka关联起来;
流计算:该步骤主要通过Spark来实现。首先通过Spark Streaming将Spark和Kafka关联起来。再通过指定的Topic来获取Spark中的业务数据,并将获取的业务数据利用Spark集群来做实时计算。
结果存储:Spark计算出的结果会进一步存储到数据库,本发明实施例选用了Redis和MySQL作为存储介质(Redis作为MySQL的缓存,将Redis同步到MySQL),在Spark代码逻辑中使用对应的编程接口(如Java Redis API或Java MySQL API)将计算后的结果存储到数据库。
在经过上述四个环节后,通过对数据清洗,即可对数据进行进一步的分析。首先,通过行为数据中的时间戳生成用户的完成的行为过程,并统计各种行为序列的数量(频繁模式挖掘)、行为之间的转化率、行为之间是否成线性关系等,从而实现提取识别行为之间的顺承关系、因果关系、反转关系和并发关系。
S300、基于知识图谱和实时分析数据,构建得到事理图谱;
需要说明的是,一些实施例中,通过数据库分别存储知识图谱和实时分析数据;将存储知识图谱的数据库和存储实时分析数据的数据库统一连接到图形数据库,构建得到事理图谱。
具体地,一些具体实施例中,对应图2中S6,完成了用户行为和用户口述音频的分析后,最终得到了事件元素及其之间的关系,进而可以通过步骤S200的具体实施例中的步骤4和结果存储的相关方案实现通过数据库分别存储知识图谱和实时分析数据,将二者分别进行存储,后将存储数据的MySQL连接到neo4j(即图数据库),进一步形成事理图谱。
S400、根据事理图谱与预先事理图谱的对比学习,得到第一计算思维得分;
具体地,一些具体实施例中,对应图2中S7-1和S7-2,通过事理图谱与预先建立的计算思维不同水平的人做题的事理图谱进行对比,应用对比学习计算出事理图谱和不同等级计算思维的人的事理图谱的相似度,根据相似度数据,计算出计算思维的得分(即第一计算思维得分)。
S500、根据文本信息与预设标准结果的相似度分析,得到第二计算思维得分;
其中,相似度分析包括结果对比分析和逻辑相似度分析,通过将两个分析结果进行平均,得到第二计算思维得分。
具体地,一些具体实施例中,对应图2中S8-1和S8-2,用户在完成整个作答后,对用户提交的答案进行分析,分析方法具体两个模块。并通过这两个模块进行打分后,将各得分进行求平均:
结果对比模块,用于运行客户端输入的答案,并判断得出的结果与标准答案是否一致,再给出得分。
逻辑分析模块,该模块将客户端输入的答案和标准答案分别转化成逻辑结构,进行相似度分析,根据相似度进行打分。
S600、对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果;
需要说明的是,一些实施例中,对第一计算思维得分和第二计算思维得分进行标度比较,通过判断矩阵确定第一计算思维得分的第一加权系数和第二计算思维得分的第二加权系数;根据第一加权系数和第二加权系数,对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果。
具体地,一些具体实施例中,对应图2中S9,将基于事理图谱的计算思维诊断得分和作答结果分析的得分进行加权求和,如公式(2)所示,T1为基于事理图谱的诊断得分,T2为基于作答情况分析的诊断得分,得到最终计算思维的得分。其中,和是根据题目动态变化的,且。
T=ω1T1+ω2T2 (2)
ω1和ω2两个加权系数的值确定是基于AHP(层次分析法)方法决定的,具体包括以下几个步:
建立判断矩阵:将基于事理图谱的诊断得分(指标T1)和基于作答情况分析的诊断得分(指标T2)进行比较,用1-9的标度表示它们之间的相对重要性。此过程需结合不同题目的特征由多位专家参与评判。例如,如果认为指标T1比指标T2重要两倍,那么可以将9分分配给指标T1,4分分配给指标T2。
计算权向量:对于每个评价指标,将其与另外一个指标之间的比较值求和并取平均值,得到一个权向量。这个向量表示每个指标的相对重要性。
一致性检验:计算一致性指标和一致性比例,以确保判断矩阵中的比较具有合理性和稳定性。
一些具体实施例中,上述方法流程可以在通过事理图谱实时表征答题过程和结果的计算思维诊断与反馈系统的场景应用及实现,如图3所示,系统的功能模块实现但不限于:
基础数据采集模块:用于收集用户的年龄、专业、编程知识掌握水平等,从而定义和判断用户的认知程度;
题库答题模块:根据基础数据采集模块对用户认知程度的判断,选择合适的题目集用于下游的诊断任务;
对应关系存储模块:用于存储训练过程不同计算思维子维度及其对应事件元素对,并根据答题模块选择的题目集和基础数据采集模块对用户认知程度的判断,选择对应的事件元素对用于下游的诊断任务;
口述语音分析模块:用于将实时的语音转文本,并提取出其中的事件元素对;
行为数据分析模块:用于采集用用户回答编程问题时的行为数据,并根据行为事件元素特征得到行为事件元素关系对;
事件元素对评估模块:用于根据对应关系存储模块得到提取出的事件元素对应的计算思维水平,及其相似性,进而得到计算思维不同子维度的得分;
代码诊断模块:根据用户输入的代码得到用户输入代码与标准答案的相似程度;
评估分析模块:根据事件元素对评估模块和代码诊断模块的分析结果,进行加权计算得到最终计算思维水平。
评估结果反馈优化模块:根据评估分析模块输出结果,将评估结果反馈回基础数据采集模块,从而更新后续的题库答题模块和事件元素对的评估机制。
另一方面,本发明的实施例提供了一种基于事理图谱的计算思维水平评估装置,包括:第一模块,用于获取目标对象的多模态信息;多模态信息包括语音信息、行为信息和文本信息;多模态信息表征目标对象完成指定任务过程中采集的信息,文本信息表征指定任务的完成结果;第二模块,用于根据语音信息提取事件元素,编码事件元素的知识图谱;和,对行为信息进行流计算,得到实时分析数据;第三模块,用于基于知识图谱和实时分析数据,构建得到事理图谱;第四模块,用于根据事理图谱与预先事理图谱的对比学习,得到第一计算思维得分;第五模块,用于根据文本信息与预设标准结果的相似度分析,得到第二计算思维得分;第六模块,用于对第一计算思维得分和第二计算思维得分进行加权求和,得到目标对象的计算思维评估结果。
本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例的另一方面还提供了一种基于事理图谱的计算思维水平评估装置,包括处理器以及存储器;
存储器用于存储程序;
处理器执行程序实现如前面的方法。
本发明方法实施例的内容均适用于本装置实施例,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例的另一方面还提供了一种计算机可读存储介质,存储介质存储有程序,程序被处理器执行实现如前面的方法。
本发明方法实施例的内容均适用于本计算机可读存储介质实施例,本计算机可读存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行装置、装置或设备(如基于计算机的装置、包括处理器的装置或其他可以从指令执行装置、装置或设备取指令并执行指令的装置)使用,或结合这些指令执行装置、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行装置、装置或设备或结合这些指令执行装置、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。
Claims (10)
1.一种基于事理图谱的计算思维水平评估方法,其特征在于,包括:
获取目标对象的多模态信息;所述多模态信息包括语音信息、行为信息和文本信息;所述多模态信息表征所述目标对象完成指定任务过程中采集的信息,所述文本信息表征所述指定任务的完成结果;
根据所述语音信息提取事件元素,编码所述事件元素的知识图谱;和,对所述行为信息进行流计算,得到实时分析数据;
基于所述知识图谱和所述实时分析数据,构建得到事理图谱;
根据所述事理图谱与预先事理图谱的对比学习,得到第一计算思维得分;
其中,所述根据所述事理图谱与预先事理图谱的对比学习,得到第一计算思维得分,包括:通过所述事理图谱与预先建立的计算思维不同等级的人做题的事理图谱进行对比,应用对比学习计算出事理图谱和不同等级计算思维的人的事理图谱的相似度,根据相似度数据,计算出第一计算思维得分;
根据所述文本信息与预设标准结果的相似度分析,得到第二计算思维得分;
其中,所述相似度分析包括结果对比分析和逻辑相似度分析,通过将两个分析结果进行平均,得到第二计算思维得分;
对所述第一计算思维得分和所述第二计算思维得分进行加权求和,得到所述目标对象的计算思维评估结果。
2.根据权利要求1所述的一种基于事理图谱的计算思维水平评估方法,其特征在于,所述根据所述语音信息提取事件元素,编码所述事件元素的知识图谱,包括:
对所述语音信息进行识别,得到转换文本;
根据所述转换文本提取事件元素;
对所述事件元素进行关系抽取,获得各事件元素间的关系向量;
将各所述事件元素编码成节点和所述关系向量编码成边,构建得到所述事件元素的知识图谱。
3.根据权利要求2所述的一种基于事理图谱的计算思维水平评估方法,其特征在于,所述根据所述转换文本提取事件元素,包括:
通过分词器对所述转换文本进行切片处理,得到语句序列;
通过嵌入层进行向量化处理,并通过多层变压编码器进行自注意力操作和全连接操作,得到语义向量;
对所述语义向量进行特征提取和编码,并结合池化操作和全连接操作,得到事件元素。
4.根据权利要求2所述的一种基于事理图谱的计算思维水平评估方法,其特征在于,所述对所述事件元素进行关系抽取,获得各事件元素间的关系向量,包括:
根据两个所述事件元素的组合,得到事件元素对;
将所述事件元素对输入卷积神经网络,通过卷积层提取局部特征,并通过池化层对所述局部特征进行下采样和压缩处理,得到全局特征;对所述全局特征进行全连接处理和归一化处理,得到所述事件元素对的关系向量;
其中,所述卷积神经网络通过已标注关系标签的事件元素对训练生成的。
5.根据权利要求1所述的一种基于事理图谱的计算思维水平评估方法,其特征在于,所述对所述行为信息进行流计算,得到实时分析数据,包括:
其中,所述行为信息通过与日志服务器关联的日志采集系统采集,并存储于日志缓存集群;所述日志缓存集群与批处理引擎关联;
通过所述批处理引擎对所述行为信息的实时计算实现流计算,得到实时分析数据。
6.根据权利要求1所述的一种基于事理图谱的计算思维水平评估方法,其特征在于,所述基于所述知识图谱和所述实时分析数据,构建得到事理图谱,包括:
通过数据库分别存储所述知识图谱和所述实时分析数据;
将存储所述知识图谱的数据库和存储所述实时分析数据的数据库统一连接到图形数据库,构建得到事理图谱。
7.根据权利要求1所述的一种基于事理图谱的计算思维水平评估方法,其特征在于,所述对所述第一计算思维得分和所述第二计算思维得分进行加权求和,得到所述目标对象的计算思维评估结果,包括:
对所述第一计算思维得分和所述第二计算思维得分进行标度比较,通过判断矩阵确定所述第一计算思维得分的第一加权系数和所述第二计算思维得分的第二加权系数;
根据所述第一加权系数和所述第二加权系数,对所述第一计算思维得分和所述第二计算思维得分进行加权求和,得到所述目标对象的计算思维评估结果。
8.一种基于事理图谱的计算思维水平评估装置,其特征在于,包括:
第一模块,用于获取目标对象的多模态信息;所述多模态信息包括语音信息、行为信息和文本信息;所述多模态信息表征所述目标对象完成指定任务过程中采集的信息,所述文本信息表征所述指定任务的完成结果;
第二模块,用于根据所述语音信息提取事件元素,编码所述事件元素的知识图谱;和,对所述行为信息进行流计算,得到实时分析数据;
第三模块,用于基于所述知识图谱和所述实时分析数据,构建得到事理图谱;
第四模块,用于根据所述事理图谱与预先事理图谱的对比学习,得到第一计算思维得分;
其中,所述根据所述事理图谱与预先事理图谱的对比学习,得到第一计算思维得分,包括:通过所述事理图谱与预先建立的计算思维不同等级的人做题的事理图谱进行对比,应用对比学习计算出事理图谱和不同等级计算思维的人的事理图谱的相似度,根据相似度数据,计算出第一计算思维得分;
第五模块,用于根据所述文本信息与预设标准结果的相似度分析,得到第二计算思维得分;
其中,所述相似度分析包括结果对比分析和逻辑相似度分析,通过将两个分析结果进行平均,得到第二计算思维得分;
第六模块,用于对所述第一计算思维得分和所述第二计算思维得分进行加权求和,得到所述目标对象的计算思维评估结果。
9.一种基于事理图谱的计算思维水平评估装置,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310393999.XA CN116450848B (zh) | 2023-04-12 | 2023-04-12 | 一种基于事理图谱的计算思维水平评估方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310393999.XA CN116450848B (zh) | 2023-04-12 | 2023-04-12 | 一种基于事理图谱的计算思维水平评估方法、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116450848A CN116450848A (zh) | 2023-07-18 |
CN116450848B true CN116450848B (zh) | 2023-10-03 |
Family
ID=87123256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310393999.XA Active CN116450848B (zh) | 2023-04-12 | 2023-04-12 | 一种基于事理图谱的计算思维水平评估方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116450848B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117635381B (zh) * | 2023-11-07 | 2024-06-25 | 华南师范大学 | 一种基于人机对话的计算思维品质评估方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114020936A (zh) * | 2022-01-06 | 2022-02-08 | 北京融信数联科技有限公司 | 多模态事理图谱的构建方法、系统和可读存储介质 |
WO2023050295A1 (zh) * | 2021-09-30 | 2023-04-06 | 中远海运科技股份有限公司 | 一种基于多模态异质特征融合的视频密集事件描述方法 |
-
2023
- 2023-04-12 CN CN202310393999.XA patent/CN116450848B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023050295A1 (zh) * | 2021-09-30 | 2023-04-06 | 中远海运科技股份有限公司 | 一种基于多模态异质特征融合的视频密集事件描述方法 |
CN114020936A (zh) * | 2022-01-06 | 2022-02-08 | 北京融信数联科技有限公司 | 多模态事理图谱的构建方法、系统和可读存储介质 |
Non-Patent Citations (2)
Title |
---|
《Research on Event Logic Knowledge Graph Construction Method of Robot Transmission System Fault Diagnosis》;JIANFENG DENG 等;《 IEEE Access》;第10卷;全文 * |
《基于事理图谱的多维特征网络舆情演化路径研究》;徐海玲;《情报科学》;第第40卷卷(第第7期期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116450848A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11861307B2 (en) | Request paraphrasing system, request paraphrasing model and request determining model training method, and dialogue system | |
CN110188047B (zh) | 一种基于双通道卷积神经网络的重复缺陷报告检测方法 | |
CN111460101B (zh) | 知识点类型的识别方法、装置及处理器 | |
US20230027526A1 (en) | Method and apparatus for classifying document based on attention mechanism and semantic analysis | |
CN113962219A (zh) | 面向电力变压器知识检索和问答的语义匹配方法及系统 | |
CN116450848B (zh) | 一种基于事理图谱的计算思维水平评估方法、装置及介质 | |
CN112231491A (zh) | 基于知识结构的相似试题识别方法 | |
Liu et al. | Audio and video bimodal emotion recognition in social networks based on improved alexnet network and attention mechanism | |
CN117312562A (zh) | 内容审核模型的训练方法、装置、设备及存储介质 | |
CN113486174A (zh) | 模型训练、阅读理解方法、装置、电子设备及存储介质 | |
CN117312514A (zh) | 咨询答复方法、装置及计算机可读取存储介质 | |
CN117094835A (zh) | 面向社交媒体内容的多目标群体分类方法 | |
CN117193823A (zh) | 一种软件需求变更的代码工作量评估方法、系统及设备 | |
CN115376547B (zh) | 发音评测方法、装置、计算机设备和存储介质 | |
CN115391523A (zh) | 风电场多源异构数据处理方法及装置 | |
CN115114453A (zh) | 基于知识图谱的智能客服实现方法和装置 | |
CN116010563A (zh) | 一种多轮对话数据分析方法、电子设备和存储介质 | |
CN114357284A (zh) | 基于深度学习的众包任务个性化推荐方法和系统 | |
CN117635381B (zh) | 一种基于人机对话的计算思维品质评估方法及系统 | |
CN116978408B (zh) | 基于语音预训练模型的抑郁症检测方法及系统 | |
CN113377915B (zh) | 对话篇章解析方法 | |
CN117574916B (zh) | 临时报告语义分析方法和系统 | |
CN115269844B (zh) | 模型的处理方法、装置、电子设备和存储介质 | |
CN113780418B (zh) | 一种数据的筛选方法、系统、设备和存储介质 | |
CN117933259B (zh) | 基于局部文本信息的命名实体识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231225 Address after: Building 2, No. 20 Second Road, Lianzifang South District, Wanjiang Street, Dongguan City, Guangdong Province, 523058 Patentee after: Guangdong guangshitong Wisdom Education Technology Co.,Ltd. Address before: College of Educational Information Technology, South China Normal University, No. 55, Zhongshan Avenue West, Guangzhou, Guangdong 510000 Patentee before: SOUTH CHINA NORMAL University |