CN114281947A - 试题搜索方法、装置、存储介质及电子设备 - Google Patents

试题搜索方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN114281947A
CN114281947A CN202111631970.8A CN202111631970A CN114281947A CN 114281947 A CN114281947 A CN 114281947A CN 202111631970 A CN202111631970 A CN 202111631970A CN 114281947 A CN114281947 A CN 114281947A
Authority
CN
China
Prior art keywords
data
test question
question
candidate
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111631970.8A
Other languages
English (en)
Inventor
孙瑜声
徐陈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202111631970.8A priority Critical patent/CN114281947A/zh
Publication of CN114281947A publication Critical patent/CN114281947A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种试题搜索方法、装置、存储介质及电子设备。其中,方法包括获取目标对象对参考试题的作答数据;根据作答数据对目标对象针对参考试题的掌握程度进行评估,得到掌握程度数据;获取参考试题的试题属性数据;根据试题属性数据以及掌握程度数据,从候选试题中搜索得到与参考试题匹配的目标试题。本申请能够提升试题搜索的准确性。

Description

试题搜索方法、装置、存储介质及电子设备
技术领域
本申请涉及数据处理技术领域,具体涉及一种试题搜索方法、装置、存储介质及电子设备。
背景技术
随着智能化时代以及国家教育双减政策的到来,教育智能化以及精准化的需求越来越急迫,怎样能让学生在有限的时间内更加有效的练习,同时可以最大程度上解放教师重复性劳动,成为目前急需解决的问题。
然而目前,学生在考试后根据考试结果进行针对性训练的试题,仍然需要教师根据学生的考试结果在海量试题库中进行人工寻找,不仅增加了教师的教学负担,也使得试题搜索的效率一直非常低下。
发明内容
本申请提供了一种试题搜索方法、装置、存储介质及电子设备,能够提升试题搜索的效率。
本申请提供的试题搜索方法,包括:
获取目标对象对参考试题的作答数据;
根据所述作答数据对所述目标对象针对所述参考试题的掌握程度进行评估,得到掌握程度数据;
获取所述参考试题的试题属性数据;
根据所述试题属性数据以及所述掌握程度数据,从候选试题中搜索得到与所述参考试题匹配的目标试题。
本申请提供的试题搜索装置,包括:
第一获取模块,用于获取目标对象对参考试题的作答数据;
评估模块,用于根据所述作答数据对所述目标对象针对所述参考试题的掌握程度进行评估,得到掌握程度数据;
第二获取模块,用于所述参考试题的试题属性数据;
搜索模块,用于根据所述试题属性数据以及所述掌握程度数据,从候选试题中搜索得到与所述参考试题匹配的目标试题。
本申请提供的存储介质,其上存储有计算机程序,当所述计算机程序被处理器加载时执行如本申请提供的试题搜索方法中的步骤。
本申请提供的电子设备,包括处理器和存储器,所述存储器存有计算机程序,所述处理器通过加载所述计算机程序,用于执行本申请提供的试题搜索方法中的步骤。
本申请中,获取目标对象对参考试题的作答数据;根据作答数据对目标对象针对参考试题的掌握程度进行评估,得到掌握程度数据;获取参考试题的试题属性数据;根据试题属性数据以及掌握程度数据,从候选试题中搜索得到与参考试题匹配的目标试题。相较于相关技术,本申请基于目标对象对参考试题的作答数据和参考试题本身的试题属性数据进行试题搜索,充分考虑了目标对象的对试题的掌握程度,从而可以大大提升试题搜索的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的试题搜索系统的场景示意图。
图2本申请实施例提供的试题搜索方法的流程示意图。
图3是本申请实施例中提供的试题掌握程度评估模型的结构示意图。
图4是本申请实施例提供的批改结果评估模型的结构示意图。
图5是本申请中第一分类网络的结构示意图。
图6是本申请中第二分类网络的结构示意图。
图7是本申请提供的题面数据生成模型的结构示意图。
图8是本申请提供的试题相似程度评估模型的结构示意图。
图9是本申请实施例提供的试题搜索装置的结构框图。
图10是本申请实施例提供的电子设备的结构框图。
具体实施方式
需要说明的是,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其他具体实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请以下实施例中所涉及的诸如第一和第二等关系术语仅用于将一个对象或者操作与另一个对象或者操作区分开来,并不用于限定这些对象或操作之间存在着实际的顺序关系。在本申请实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能、感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括机器学习(Machine Learning,ML)技术,其中,深度学习(Deep Learning,DL)是机器学习中一个新的研究方向,它被引入机器学习以使其更接近于最初的目标,即人工智能。目前,深度学习主要应用在计算机视觉、自然语言处理等领域。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音数据的解释有很大的帮助。利用深度学习技术,以及对应的训练数据集,能够训练得到实现不同功能的网络模型,比如,基于一训练数据集能够训练得到用于性别分类的深度学习网络,基于另一训练数据集能够训练得到图像优化的深度学习网络等。
为了能够提高试题搜索的效率,本申请将深度学习引入到试题搜索中,相应提供一种试题搜索方法装置、存储介质以及电子设备。其中,试题搜索方法可由电子设备执行。
请参照图1,本申请还提供一种试题搜索系统,如图1所示,为本申请提供的试题搜索系统的使用场景示意图,该试题搜索系统包括电子设备100,比如,电子设备可以获取目标对象对参考试题的作答数据;根据作答数据对目标对象针对参考试题的掌握程度进行评估,得到掌握程度数据;获取参考试题的试题属性数据;根据试题属性数据以及掌握程度数据,从候选试题中搜索得到与参考试题匹配的目标试题。
电子设备100可以是任何配置有处理器而具备处理能力的设备,比如智能手机、平板电脑、掌上电脑、笔记本电脑等具备处理器的移动式电子设备,或者台式电脑、电视、服务器等具备处理器的固定式电子设备。
另外,如图1所示,该试题搜索系统还可以包括存储设备200,用于存储数据,包括但不限于试题搜索过程中得到的原始数据、中间数据以及结果数据等,比如,电子设备100可以将获取到的目标对象对参考试题的作答数据、根据作答数据评估得到的目标对象对参考试题的掌握程度数据、参考试题的试题属性数据以及候选试题存入存储设备200中。
需要说明的是,图1所示的试题搜索系统的场景示意图仅仅是一个示例,本申请实施例描述的试题搜索系统以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着试题搜索系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
请参照图2,图2为本申请实施例提供的试题搜索方法的流程示意图。如图2所示,本申请实施例提供的试题搜索方法的流程可以如下:
在S310中,获取目标对象对参考试题的作答数据。
其中,参考试题可以为用于进行试题搜索的参考试题,即试题搜索的目的可以为搜索与参考试题相似的试题。具体例如,在考试后进行巩固练习的场景中,若考生在考试中对试题A的得分较低,那么考生在考试后便需要对此进行巩固练习以针对性地进行提升改善,那么便需要在题库中的候选试题中搜索到与试题A相似的试题。在该场景下,试题A便为前述参考试题。参考试题可以为中文试题,也可以为其他语种的试题。
其中,目标对象可以为对上述参考试题进行作答的对象,该对象可以为人、可以为计算机设备也可以为计算机设备中的人工智能虚拟人物。
目标对象对参考试题的作答数据,可以包括作答结果数据和参考试题的标准答案数据。其中,当参考试题的题型为选择题或者判断题时,作答结果数据可以是目标对象在多个预设结果中选择的一个数据;当参考试题的题型为简答题时,作答结果数据可以为目标对象在答题区域中输入的作答文本数据。对应地,参考试题的标准答案数据也可以为在多个预设结果中的某一数据或者是文本数据。目标对象对参考试题的作答结果数据可以从作答区域中获取,其中作答区域可以为拍摄的纸质试题的对应区域也可以是电子试题的对应存储区域。参考试题的标准答案数据可以从题库中进行获取。
在S320中,根据作答数据对目标对象针对参考试题的掌握程度进行评估,得到掌握程度数据。
在相关技术中,在进行相似试题搜索时,往往只是基于参考试题的相关数据,例如知识点、题型、难度以及领域等数据进行相似搜索。但这种搜索方法没有考虑作答对象与参考试题的交互,即没有考虑到作答对象对该参考试题的掌握程度数据。例如作答对象是能力不足导致该题没有得分还是因为粗心问题导致该题没有得分等情况,可以由作答对象对参考试题的掌握程度数据进行描述。因此,现有相关技术中的试题搜索方法搜索得到的相似试题,不一定适合作答对象进行巩固训练。
而在本实施例中,可以通过目标对象对参考试题的作答数据来评估目标对象对参考试题的掌握程度,得到掌握程度数据。进而再根据目标对象对参考试题的掌握程度数据结合参考试题本身的相关数据进行联合搜索,便可以搜索得到更适合目标对象进行巩固联系的目标试题。
具体地,目标对象对参考试题的掌握程度数据,可以根据目标对象对参考试题的作答结果数据以及参考试题的标准答案数据进行评估得到。
在一些实施例中,根据作答数据对目标对象针对参考试题的掌握程度进行评估,得到掌握程度数据,包括:
通过词嵌入模型分别对第一作答结果数据以及第一标准答案数据进行词嵌入处理,得到第一作答特征以及第一答案特征;
将第一作答特征以及第一答案特征输入试题掌握程度评估模型,得到目标对象对参考试题的掌握程度数据。
在本实施例中,可以提前训练试题掌握程度评估模型,然后将目标对象对参考试题的作答结果数据以及参考试题的标准答案数据对应的特征输入到该试题掌握程度评估模型中,便可以得到目标对象对参考试题的掌握程度数据。
其中,目标对象对参考试题的作答结果数据以及参考试题的标准答案数据对应的特征,可以采用词嵌入的方法获得。具体地,目标对象对参考试题的作答结果数据可以称为第一作答结果数据,参考试题的标准答案数据可以称为第一标准答案数据。对第一作答结果数据和第一标准答案数据进行词嵌入具体可以采用如下词嵌入模型进行预训练:BERT模型或者ELMo模型。BERT模型全称为Bidirectional Encoder Representation fromTransformers,意为基于变换的双向编码表示模型,是一个预训练的语言表征模型。ELMo模型全称为Embeddings from Language Models,意为基于语言模型的嵌入,也是一个预训练的语言表征模型。现有技术中有较多对BERT模型和ELMo模型的介绍,此处不再予以赘述。
采用上述任意一种词嵌入模型对第一作答结果数据和第一标准答案数据进行词嵌入处理,实现预训练过程,得到第一作答特征以及第一答案特征。然后,把第一作答特征以及第一答案特征再输入到前述试题掌握程度评估模型中,便可以得到目标对象对参考试题的掌握程度数据。
在一些实施例中,通过词嵌入模型分别对第一作答结果数据以及第一标准答案数据进行词嵌入处理,得到第一作答特征以及第一答案特征,包括:
对第一作答结果数据进行文本清洗,得到清洗后的作答结果文本;
对第一标准答案数据进行文本清洗,得到清洗后的标准答案文本;
对作答结果文本和标准答案文本进行分词,得到作答结果词序列和标准答案词序列;
通过词嵌入模型分别对作答结果词序列和标准答案词序列进行词嵌入处理,得到第一作答特征以及第一答案特征。
在本实施例中,采用词嵌入模型对第一作答结果数据和第一标准答案数据进行词嵌入处理,具体可以为先将第一作答结果数据和第一标准答案数据进行文本清洗,分别得到对应的清洗后的文本。然后分别对清洗后的文本进行分词处理,得到对应的词序列,即作答结果词序列和标准答案词序列。其中,对清洗后的文本进行分词,可以采用预设的分词工具进行分词,当参考试题为中文试题时,分词工具可以为LTP分词工具或者jieba分词工具。其中,LTP为哈工大开源的一套中文语言处理系统,jieba是一款中文分词工具,现有技术中已有较多对该两款分词工具的介绍,此处不再予以赘述。
在一些实施例中,试题掌握程度评估模型包括第一卷积神经网络、第二卷积神经网络和注意力网络,将第一作答特征以及第一答案特征输入试题掌握程度评估模型,得到目标对象对参考试题的掌握程度数据,包括:
采用第一卷积神经网络对第一作答特征进行特征采样,得到第二作答特征;采用第二卷积神经网络对第一答案特征进行特征采样,得到第二答案特征;
采用注意力网络对第二作答特征与第二答案特征进行注意力计算,得到第一注意力信息;
根据第一注意力信息确定目标对象对参考试题的掌握程度数据。
在本实施例中,前述试题掌握程度评估模型可以包括第一卷积神经网络(Convolutional Neural Networks,CNN)、第二卷积神经网络以及注意力网络。如图3所示,为本申请中试题掌握程度评估模型的结构示意图。其中,该第一卷积神经网络和第二卷积神经网络可以是一层CNN网络也可以是多层CNN。将前述词嵌入得到的第一作答特征和第一答案特征输入到试题掌握程度评估模型中进行试题掌握程度评估,试题掌握程度评估模型可以采用第一卷积神经网络对第一作答特征进行特征采样,得到第二作答特征;同时第二卷积神经网络可以对第一答案特征进行特征采样,得到第二答案特征。然后,将第二作答特征和第二答案特征输入到注意力层中进行注意力计算,计算得到第二作答特征在第二答案特征上的第一注意力信息,该第一注意力信息可以为注意力矩阵,然后将该注意力矩阵输出。根据该注意力矩阵,可以确定目标对象对参考试题的掌握程度数据。
在一些实施例中,第一注意力信息包括权重矩阵,根据第一注意力信息确定目标对象对参考试题的掌握程度数据,包括:
根据第二作答特征的特征维度对权重矩阵进行池化处理,得到权重向量;
将权重向量确定为目标对象对参考试题的掌握程度数据。
在本实施例中,目标对象对参考试题的掌握程度数据可以为将前述第一注意力信息对应的注意力矩阵进行压缩得到。具体地,可以根据第二作答特征的特征维度对试题掌握程度评估模型输出的权重矩阵进行池化处理,该池化处理可以为最大池化,得到权重向量。该权重向量便可以为目标对象对参考试题的掌握程度数据。
在一些实施例中,将第一作答特征以及第一答案特征输入试题掌握程度评估模型,得到目标对象对参考试题的掌握程度数据之前,还包括:
获取批改结果评估模型的第一训练样本数据集合,第一训练样本数据集合包括多个第一训练样本数据,第一训练样本数据包括第一样本试题的第一文本数据、第一样本试题的第二标准答案数据、针对第一样本试题的第二作答结果数据以及对第二作答结果数据的批改数据,批改数据包括第一批改结论和第一批改得分;
以每一第一训练样本数据中的第一文本数据、第二标准答案数据以及第二作答结果数据对应的特征为输入,以对第二作答结果数据的批改数据为输出训练批改结果评估模型。
其中,在使用试题掌握程度评估模型进行掌握程度评估之前,需要先对试题掌握程度评估模型进行训练。在本实施例中,可以采用训练包含前述试题掌握程度评估模型的批改结果评估模型来实现对试题掌握程度评估模型的训练。即在本实施例中,试题掌握程度评估模型为批改结果评估模型中的子模型。在对批改结果评估模型进行训练的过程中,也可以对试题掌握程度评估模型的模型参数进行训练。
对批改结果评估模型进行训练,需要先获取训练样本,训练样本可以为第一训练样本数据集合,第一训练样本数据集合中包括了多个第一训练样本数据。每一第一训练样本数据包括第一样本试题的第一文本数据、第一样本试题的第二标准答案数据、针对第一样本试题的第二作答结果数据以及对第二作答结果数据的批改数据。其中,该批改数据包括了第一批改结论和第一批改得分。具体地,批改结论可以为对或者错,批改得分为该第二作答结果数据对应的得分数据。例如,一些简答题中,虽然最后的作答结果是错的,但并不代表过程不能得分。因此批改数据中既包含了批改结论也包含了批改得分。
在获取了训练样本后,可以确定对模型进行训练时的输入数据和对应的标签数据,标签数据即理论输出数据。本实施例中对批改结果评估模型进行训练,可以以每一第一训练样本数据中的第一文本数据、第二标准答案数据以及第二作答结果数据对应的特征为输入,以对第二作答结果数据的批改数据为输出来训练批改结果评估模型。
在一些实施例中,批改结果评估模型包括试题掌握程度评估模型、第三卷积神经网络、第一特征融合网络、第一特征计算网络、第一分类网络以及第二分类网络,试题掌握程度评估模型包括第一卷积神经网络、第二卷积神经网络和注意力网络,以每一训练样本数据中的第一文本数据、第二标准答案数据以及第二作答结果数据对应的特征为输入,以对第二作答结果数据的批改数据为输出训练批改结果评估模型,包括:
采用第一卷积神经网络对针对第二作答结果数据对应的词嵌入特征进行采样,得到第三作答特征,采用第二卷积神经网络对第二标准答案数据对应的词嵌入特征进行采样,得到第三答案特征,以及采用第三卷积神经网络对第一文本数据对应的词嵌入特征进行采样,得到第一文本特征;
采用注意力网络对第三作答特征与第三答案特征进行注意力计算,得到第二注意力信息;
采用第一特征计算网络计算第二注意力信息与第三作答特征的乘积,得到第四作答特征;
采用第一特征融合网络将第一文本特征、第三答案特征以及第四作答特征进行融合,得到第一融合特征;
将第一融合特征输入至第一分类网络,得到输出的第二批改结论,以及将训练拼接特征输入至第二分类网络,得到输出的第二批改得分;
根据第一批改结论、第一批改得分、第二批改结论和第二批改得分对批改结果评估模型的模型参数进行迭代更新,直到达到第一预设迭代停止条件,完成对批改结果评估模型的训练。
其中,本申请提供了批改结果评估模型的一种具体结构示例,如图4所示,为本申请提供的批改结果评估模型的一种结构示意图。如图所示,该批改结果评估模型除了包含前述试题掌握程度评估模型中的第一卷积神经网络、第二卷积神经网络以及注意力网络之外,还包括第三卷积神经网络、第一特征计算网络、第一特征融合网络、第一分类网络以及第二分类网络。
具体地,在采用每一第一训练样本数据中的第一文本数据、第二标准答案数据以及第二作答结果数据对应的特征为输入,采用对第二作答结果数据的批改数据为输出对该结构的批改结果评估模型进行训练时,可以先将第一文本数据对应的词嵌入特征输入至第三卷积神经网络中进行特征采样,得到第一文本特征;将第二作答结果数据对应的词嵌入特征输入至第一卷积神经网络中进行特征采样,得到第三作答特征;将第二标准答案数据对应的词嵌入特征输入至第二卷积神经网络中进行特征采样,得到第三答案特征。
然后,采用注意力网络对第三作答特征和第三答案特征做一次attention(注意力)处理,得到第二注意力信息。采用第一特征计算网络计算第二注意力信息与第三作答特征的乘积,得到第四作答特征。
进一步地,可以采用第一特征融合网络将第一文本特征、第三答案特征以及第四作答特征进行融合处理,得到第一融合特征。此处融合处理可以为将每一特征对应的特征向量在相同维度上相加、求平均或者也可以将每一特征对应的特征向量进行拼接。在本实施例中,可以对第一文本特征、第三答案特征以及第四作答特征进行拼接,得到第一融合特征。
然后,可以将第一融合特征分别输入至第一分类网络和第二分类网络中进行分类,得到输出的第二批改结论和第二批改得分。其中,第一分类网络可以为一个二分类模型,输出为此题的批改结论,即此题为对还是错;第二分类网络可以为一个回归模型,输出为此题的批改得分,即该题预测得分是多少。
然后,根据批改结果评估模型输出的第二批改结论和第二批改得分,结合标签数据,即第一批改结论和第一批改得分计算损失值。其中,损失函数的设置可以为计算输出和标签之间的交叉熵。根据计算得到的损失值进行梯度反传,调整批改结果评估模型的模型参数,具体为调整第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第一分类网络以及第二分类网络的参数。然后,基于第一训练样本数据集合中的所有第一训练样本数据对批改结果评估模型进行迭代训练,直到达到第一预设迭代停止条件,完成对批改结果评估模型的训练,得到训练后的批改结果评估模型。
可以理解的是,上述批改结果评估模型的模型结构只是一个示例,批改结果评估模型的模型结构还可以有其他的模型结构。
其中,完成对批改结果评估模型的训练,也就完成了对其中的子模型,即试题掌握程度预估模型的训练。
在一些实施例中,第一分类网络包括第一全连接网络和第一分类模块,第二分类网络包括第二全连接网络和第二分类模块,将第一融合特征输入至第一分类网络,得到输出的第二批改结论,以及将第一融合特征输入至第二分类网络,得到输出的第二批改得分,包括:
将第一融合特征输入至第一全连接网络,得到批改结论特征;
采用第一分类模块对批改结论特征进行分类计算,得到第二批改结论;
将第一融合特征输入至第二全连接网络,得到批改得分特征;
采用第二分类模块对批改得分特征进行分类计算,得到第二批改得分。
在本实施例中,第一分类网络和第二分类网络均可以由全连接网络和分类模块构成,其中全连接网络具体可以为多层感知机或者深度神经网络(Deep Neural Networks,DNN),分类模块可以实现一个分类函数的功能,分类函数可以为Softmax函数。如图5所示,为本申请中第一分类网络的结构示意图;如图6所示,为本申请中第二分类网络的结构示意图。
具体地,第一分类网络可以包括第一全连接网络和第一分类模块,第二分类网络可以包括第二全连接网络和第二分类模块。具体处理时,可以先将第一融合特征输入至第一全连接网络,得到批改结论特征,然后采用第一分类模块对批改结论特征进行分类计算,得到第二批改结论。以及,将第一融合特征输入至第二全连接网络,得到批改得分特征,然后采用第二分类模块对批改得分特征进行分类计算,得到第二批改得分。
在S330中,获取参考试题的试题属性数据。
其中,参考试题的试题属性数据为参考试题本身所具有的属性相关的数据,具体可以包括但不限于参考试题的知识点数据、参考试题的题型数据、参考试题的试题文本数据等。
在S340中,根据试题属性数据以及掌握程度数据,从候选试题中搜索得到与参考试题匹配的目标试题。
其中,在本实施例中,在获取到目标对象对参考试题的掌握程度数据以及参考试题本身的试题属性数据后,便可以进一步根据掌握程度数据以及参考试题本身的试题属性数据在候选试题中进行试题搜索,确定候选试题中与候选试题匹配的目标候选试题,即为与参考试题匹配的目标试题。
具体地,可以将目标对象对参考试题的掌握程度数据、参考试题的试题属性数据与每一候选试题的掌握程度数据以及试题属性数据进行匹配,根据匹配结果确定目标试题。
在一些实施例中,根据试题属性数据以及掌握程度数据,从候选试题中搜索得到与参考试题匹配的目标试题,包括:
根据试题属性数据中包含的第二文本数据以及第一知识点数据生成参考试题的题面数据;
根据试题属性数据中包含的第一知识点数据以及题型数据生成参考试题的基础属性数据;
根据掌握程度数据、题面数据以及基础属性数据,从候选试题中搜索得到与参考试题匹配的目标试题。
在本实施例中,参考试题的试题属性数据中可以包含参考试题的第二文本数据、第一知识点数据以及题型数据。本实施例中可以将试题的属性数据进行升级,得到试题的题面数据和基础属性数据。具体地,可以根据试题属性数据中的第二文本数据和第一知识点数据生成升级的题面数据。进一步,可以根据试题属性数据中的第一知识点数据以及题型数据生成参考试题的基础属性数据。然后进一步根据掌握程度数据、题面数据以及基础属性数据从候选试题中进行试题搜索,得到与参考试题匹配的目标试题。
具体地,根据试题属性数据中的第一知识点数据以及题型数据生成参考试题的基础属性数据,可以为将对参考试题的知识点描述文本和题型描述文本进行组合,然后对组合得到的文本进行词嵌入处理,得到参考试题的基础属性数据。该基础属性数据可以为一个词特征向量,词嵌入处理的方法在前述实施例中已经介绍,此处不再予以赘述。
在一些实施例中,根据试题属性数据中包含的第二文本数据以及第一知识点数据生成参考试题的题面数据,包括:
通过词嵌入模型对试题属性数据中包含的第二文本数据进行词嵌入处理,得到第二文本特征;
将第二文本特征和试题属性数据中包含的第一知识点数据输入至题面数据生成模型,得到参考试题的题面数据。
在本实施例中,可以采用预先训练好的题面数据生成模型来进行参考试题的题面数据生成。具体地,可以先将参考试题的第二文本数据进行词嵌入处理,得到第二文本特征,然后将该第二文本特征和第一知识点数据输入到前述训练好的题面数据生成模型中,从而生成参考试题的题面数据。其中,此处词嵌入处理也可以采用BERT模型或者ELMo模型中的任意一种进行,此处不再予以赘述。
在一些实施例中,题面数据生成模型包括第二特征计算网络、第二特征融合网络、第三全连接网络以及第四全连接网络,将第二文本特征和试题属性数据中包含的试题知识点数据输入至题面数据生成模型,得到参考试题的题面数据,包括:
将第一知识点数据数据输入至第三全连接网络,得到第一知识点特征集合;
采用第二特征计算网络计算第一知识点特征集合中的所有知识点特征的平均值,得到第一平均知识点特征;
采用第二特征融合网络将第二文本特征与第一平均知识点特征进行融合,并将融合得到的特征输入第四全连接网络,得到参考试题的题面数据。
在本实施例中,提供了前述题面数据生成模型的一种可能的结构。具体地,如图7所示,为本申请提供的题面数据生成模型的结构示意图。在该结构中,题面数据生成模型可以由第三全连接网络、第二特征计算网络、第二特征融合网络以及第四全连接网络构成。其中,第三全连接网络和第四全连接网络可以为DNN网络或者多层感知机。
具体地,根据该结构的题面数据生成模型,可以按照如下逻辑生成参考试题的题面数据:先将参考试题的第一知识点数据输入至第三全连接网络中,得到第一知识点特征集合。具体地,每一知识点可以对应一个知识点特征,当参考试题涉及多个知识点时,便可以输出多个知识点特征,得到第一知识点集合。
然后采用第二特征计算网络计算第一知识点特征集合中所有知识点特征的平均值,便可以得到第一平均知识点特征。然后采用第二特征融合网络将第二文本特征和前面得到的第一平均知识点特征进行融合。其中,此处将第二文本特征和第一平均知识点特征进行融合,可以为将特征对应的向量进行同纬度的相加或者求平均处理,又或者可以将第二文本特征和第一平均知识点特征对应的特征向量进行拼接。然后进一步将融合后的特征输入到第四全连接网络中,便可以得到参考试题的题面数据。
在一些实施例中,将第二文本特征和试题属性数据中包含的第一知识点数据输入至题面数据生成模型,得到参考试题的题面数据之前,还包括:
获取试题相似程度评估模型的第二训练样本数据集合,第二训练样本数据集合包括多个第二训练样本数据,第二训练样本数据包括第二样本试题的第三文本数据、第二样本试题的第二知识点数据、第三样本试题的第四文本数据、第三样本试题的第三知识点数据以及第二样本试题与第三样本试题的第一相似程度数据;
以第三文本数据对应的第三文本特征、第二知识点数据、第四文本数据对应的第四文本特征以及第三知识点数据为输入,以第一相似程度数据为输出训练试题相似程度评估模型。
在采用题面数据生成模型生成参考试题的题面数据之前,需要先对该题面数据生成模型进行训练,然后再采用训练过的题面数据生成模型生成参考试题的题面数据。在本实施例中,具体采用了对包括前述题面数据生成模型的试题相似程度评估模型进行训练的方法来间接对题面数据生成模型进行训练。即在本实施例中,题面数据生成模型为试题相似程度评估模型的子模型,在对试题相似程度评估模型进行训练的过程中,同时可以对题面数据生成模型的模型参数进行训练,从而在完成试题相似程度评估模型训练的同时,也可以完成题面数据生成模型的训练。
具体地,对本实施例中的试题相似程度评估模型进行训练之前,需要先获取对试题相似程度评估模型进行训练的样本数据。样本数据可以为包括多个第二训练样本数据的第二训练样本数据集合,其中第二训练样本数据包括一对样本试题对,具体可以为第二样本试题以及第三样本试题。具体地,第二训练样本数据包括第二样本试题的第三文本数据、第二样本试题的第二知识点数据、第三样本试题的第四文本数据、第三样本试题的第三知识点数据以及第二样本试题与第三样本试题的第一相似程度数据。
然后,根据上述样本数据对试题相似程度评估模型进行训练。具体地,先在样本数据中确定对试题相似程度评估模型进行训练时的输入数据和输出数据。具体可以以第三文本数据对应的第三文本特征、第二知识点数据、第四文本数据对应的第四文本特征以及第三知识点数据为输入,以第一相似程度数据为输出,以此来对试题相似程度评估模型进行训练。
在一些实施例中,试题相似程度评估模型包括题面数据生成模型、第三特征计算网络、第四特征计算网络、第三特征融合网络、以及第三分类网络,题面数据生成模型包括第二特征计算网络、第二特征融合网络、第三全连接网络以及第四全连接网络,以第三文本数据对应的第三文本特征、第二知识点数据、第四文本数据对应的第四文本特征以及第三知识点数据为输入,以第一相似程度数据为输出训练试题相似程度评估模型,包括:
将第二知识点数据和第三知识点数据分别输入第三全连接网络,得到输出的第二知识点特征集合和第三知识点特征集合;
采用第二特征计算网络分别计算第二知识点特征集合和第三知识点特征集合中的知识点特征的平均值,得到第二平均知识点特征与第三平均知识点特征;
采用第二特征融合网络将第三文本特征与第二平均知识点特征进行融合,得到第二融合特征;
采用第二特征融合网络将第四文本特征与第三平均知识点特征进行融合,得到第三融合特征;
将第二融合特征与第三融合特征分别输入至第四全连接网络,得到输出的第一题面特征和第二题面特征;
采用第三特征计算网络计算第一题面特征与第二题面特征的差值,得到差特征;
采用第四特征计算网络计算第一题面特征与第二题面特征的乘积,得到积特征;
采用第三特征融合网络将差特征与积特征进行特征融合,得到第四融合特征;
将第四融合特征输入至第三分类网络,得到输出的第二相似程度数据;
根据第一相似程度数据与第二相似程度数据对试题相似程度评估模型的模型参数进行迭代更新,直至达到第二预设迭代停止条件,完成对试题相似程度评估模型的训练。
在本实施例中,提供了上述试题相似程度评估模型的一种可能的模型结构,在该模型结构中,除了包含前述题面数据生成模型包括的第二特征计算网络、第二特征融合网络、第三全连接网络以及第四全连接网络之外,还具有第三特征计算网络、第四特征计算网络、第三特征融合网络以及第三分类网络。如图8所示,为本申请提供的试题相似程度评估模型的结构示意图。
对该结构的试题相似程度评估模型进行训练的具体过程可以包括如下步骤:先将第二知识点数据和第三知识点数据分别输入第三全连接网络,得到输出的第二知识点特征集合和第三知识点特征集合。然后采用第二特征计算网络分别计算第二知识点特征集合和第三知识点特征集合中的知识点特征的平均值,得到第二平均知识点特征与第三平均知识点特征。进一步采用第二特征融合网络将第三文本特征与第二平均知识点特征进行融合,得到第二融合特征。此处特征融合可以为对第三文本特征与第二平均知识点特征对应的特征向量进行相应维度的相加或者求平均,也可以是将第三文本特征与第二平均知识点特征对应的特征向量进行拼接得到第二融合特征。然后采用第二特征融合网络将第四文本特征与第三平均知识点特征进行融合,得到第三融合特征;此处对第四文本特征与第三平均知识点特征进行融合的方法可以与前述对第三文本特征与第二平均知识点特征进行融合的方法保持一致。进一步地,将第二融合特征与第三融合特征分别输入至第四全连接网络,得到输出的第一题面特征和第二题面特征。如前所述,此处第四全连接网络可以为一个DNN。接着采用第三特征计算网络计算第一题面特征与第二题面特征的差值,得到差特征;以及采用第四特征计算网络计算第一题面特征与第二题面特征的乘积,得到积特征。然后采用第三特征融合网络将计算得到的差特征与积特征进行特征融合,得到第四融合特征,此处特征融合可以为特征拼接。最后将第四融合特征输入至第三分类网络,得到输出的第二相似程度数据。
在得到试题相似程度评估模型输出的第二相似程度数据后,可以进一步根据第一相似程度数据与第二相似程度数据对试题相似程度评估模型的模型参数进行迭代更新,直至达到第二预设迭代停止条件,完成对试题相似程度评估模型的训练。具体地,对试题相似程度评估模型的模型参数进行迭代更新的过程,包括了对第三全连接网络和第四全连接网络的参数进行迭代更新,也就是对题面数据生成模型的模型参数进行迭代更新直至满足预设迭代停止条件,完成对题面数据生成模型的训练。
在一些实施例中,根据掌握程度数据、题面数据以及基础属性数据,从候选试题中搜索得到与参考试题匹配的目标试题,包括:
获取每一候选试题的候选试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据;
根据掌握程度数据、题面数据、基础属性数据、候选试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据计算参考试题与每一候选试题的相似度;
根据相似度从候选试题中搜索得到与参考试题匹配的目标试题。
在本实施例中,可以预先对候选试题库中的所有候选试题进行匹配数据提取,具体地,可以提取到每一候选试题的掌握程度数据、候选试题题面数据以及候选试题基础属性数据。然后,根据参考试题的掌握程度数据、题面数据和基础属性数据以及每一候选试题的掌握程度数据、候选试题题面数据以及候选试题基础属性数据计算参考试题与每一候选试题的相似度。
具体地,可以先获取目标候选试题的掌握程度数据对应的特征向量、题面数据对应的特征向量以及基础属性数据对应的特征向量,然后将这三个特征向量进行加权得到目标候选试题的特征向量。同样地,可以将参考试题的掌握程度数据、题面数据以及基础属性数据对应的特征向量进行加权得到参考试题的特征向量。其中,加权的权重系数可以根据实际情况进行具体调整。
然后,将目标候选试题的特征向量与参考试题的特征向量进行余弦相似度计算,得到目标候选试题与参考试题的相似度。然后,遍历每一候选试题,得到每一候选试题与参考试题的相似度。最后,根据相似度值的排序确定相似度最大的候选试题为目标试题。
在一些实施例中,获取每一候选试题的候选试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据,包括:
获取每一候选试题的候选试题文本数据、候选试题知识点数据、候选试题题型数据、候选试题标准答案数据以及对每一候选试题的作答数据;
根据每一候选试题的知识点数据与候选试题题型数据生成每一候选试题的基础属性数据;
将每一候选试题的候选试题文本数据和候选试题知识点数据输入至题面数据生成模型,得到每一候选试题的候选试题题面数据;
将每一候选试题的候选试题标准答案数据和对每一候选试题的作答数据输入至试题掌握程度评估模型,得到每一候选试题的试题掌握程度数据。
其中,在本实施例中,获取每一候选试题的掌握程度数据、题面数据以及基础属性数据,可以先获取每一候选试题的候选试题文本数据、候选试题知识点数据、候选试题题型数据、候选试题标准答案数据以及对每一候选试题的作答数据,然后再根据前述训练过的试题掌握程度预估模型以及题面数据生成模型来分别获得每一候选数据的掌握程度数据以及题面数据。
在一些实施例中,将每一候选试题的候选试题标准答案数据和对每一候选试题的作答数据输入至试题掌握程度评估模型中,得到每一候选试题的试题掌握程度数据,包括:
将对每一候选试题的作答数据根据作答对象的属性信息分为多个类别的候选试题作答数据;
将每一候选试题的候选试题标准答案数据和多个类别的候选试题作答数据输入至试题掌握程度评估模型中,得到每一候选试题的多个试题掌握程度数据;
根据掌握程度数据、题面数据、基础属性数据、候选试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据计算参考试题与每一候选试题的相似度,包括:
获取目标对象的目标类别;
根据目标类别在每一候选试题的多个试题掌握程度数据中确定目标试题掌握程度数据;
根据掌握程度数据、试题题面数据、基础属性数据、目标试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据计算参考试题与每一候选试题的相似度。
在本实施例中,每一候选试题的作答数据可以有多个,例如一个候选试题可以有100个作答数据。此时,可以将这些作答数据按照作答对象的学习成绩进行划分,具体例如可以将作答对象的学习成绩分为学习成绩好、学习成绩中等以及学习成绩较差。具体对作答对象学习成绩的分类标准可以根据需要进行具体设定。那么候选试题的多个作答数据也可以分为三类,例如学习成绩好的作答对象对应的作答数据有20个,学习成绩中等的作答对象对应的作答数据有50个,学习成绩较差的作答对象对应的作答数据有30个。
由于对每个作答数据都可以根据试题掌握程度预估模型生成一个掌握程度数据,那么便可以得到20个学习成绩好的作答对象对应的掌握程度数据、50个学习成绩中等的作答对象对应的掌握程度数据以及30个学习成绩较差的作答对象对应的掌握程度数据。对于每一类作答对象对应的多个掌握程度数据,可以进一步计算其平均值,得到每一类作答对象对应的一个平均掌握程度数据。由于掌握程度数据可以为特征向量,也就是对多个特征向量在相应维度上进行平均池化,得到每一类作答对象对应的一个掌握程度数据。
如此,在进行试题搜索时,可以先确定目标对象的类别,例如确定目标对象为学习成绩好的。然后根据目标对象的类别从候选试题对应的多个掌握程度数据中确定与目标对象的类别对应的掌握程度数据作为候选试题用来试题匹配的掌握程度数据。
如此,可以通过将候选试题的掌握程度数据按照作答对象的类别进行分层,从而提高试题搜索结果的准确性。
在一些实施例中,本申请提供的试题搜索方法还可以包括:
将目标试题推送给目标对象。
即在本实施例中,当从候选试题中搜索得到与参考试题最匹配的目标试题后,可以自动将该目标试题推送给目标对象,例如显示在目标对象登录的终端中,从而可以让目标对象进行巩固练习。
根据上述描述可知,本申请提供的试题搜索方法,通过获取目标对象对参考试题的作答数据;根据作答数据对目标对象针对参考试题的掌握程度进行评估,得到掌握程度数据;获取参考试题的试题属性数据;根据试题属性数据以及掌握程度数据,从候选试题中搜索得到与参考试题匹配的目标试题。相较于相关技术,本申请基于目标对象对参考试题的作答数据和参考试题本身的试题属性数据进行试题搜索,充分考虑了目标对象的对试题的掌握程度,从而可以大大提升试题搜索的准确性。
请参照图9,为更好的执行本申请所提供的试题搜索方法,本申请进一步提供一种试题搜索装置400,如图9所示,该试题搜索装置400包括:
第一获取模块410,用于获取目标对象对参考试题的作答数据;
评估模块420,用于根据作答数据对目标对象针对参考试题的掌握程度进行评估,得到掌握程度数据;
第二获取模块430,用于获取参考试题的试题属性数据;
搜索模块440,用于根据试题属性数据以及掌握程度数据,从候选试题中搜索得到与参考试题匹配的目标试题。
在一可选的实施例中,作答数据包括第一作答结果数据以及第一标准答案数据,评估模块420用于:
通过词嵌入模型分别对第一作答结果数据以及第一标准答案数据进行词嵌入处理,得到第一作答特征以及第一答案特征;
将第一作答特征以及第一答案特征输入试题掌握程度评估模型,得到目标对象对参考试题的掌握程度数据。
在一可选的实施例中,试题掌握程度评估模型包括第一卷积神经网络、第二卷积神经网络和注意力网络,评估模块420还用于:
采用第一卷积神经网络对第一作答特征进行特征采样,得到第二作答特征;采用第二卷积神经网络对第一答案特征进行特征采样,得到第二答案特征;
采用注意力网络对第二作答特征与第二答案特征进行注意力计算,得到第一注意力信息;
根据第一注意力信息确定目标对象对参考试题的掌握程度数据。
在一可选的实施例中,第一注意力信息包括权重矩阵,评估模块420还用于:
根据第二作答特征的特征维度对权重矩阵进行池化处理,得到权重向量;
将权重向量确定为目标对象对参考试题的掌握程度数据。
在一可选的实施例中,评估模块420还用于:
对第一作答结果数据进行文本清洗,得到清洗后的作答结果文本;
对第一标准答案数据进行文本清洗,得到清洗后的标准答案文本;
对作答结果文本和标准答案文本进行分词,得到作答结果词序列和标准答案词序列;
通过词嵌入模型分别对作答结果词序列和标准答案词序列进行词嵌入处理,得到第一作答特征以及第一答案特征。
在一可选的实施例中,本申请提供的试题搜索装置还包括第一训练模块,用于:
获取批改结果评估模型的第一训练样本数据集合,第一训练样本数据集合包括多个第一训练样本数据,第一训练样本数据包括第一样本试题的第一文本数据、第一样本试题的第二标准答案数据、针对第一样本试题的第二作答结果数据以及对第二作答结果数据的批改数据,批改数据包括第一批改结论和第一批改得分;
以每一第一训练样本数据中的第一文本数据、第二标准答案数据以及第二作答结果数据对应的特征为输入,以对第二作答结果数据的批改数据为输出训练批改结果评估模型。
在一可选的实施例中,批改结果评估模型包括试题掌握程度评估模型、第三卷积神经网络、第一特征融合网络、第一特征计算网络、第一分类网络以及第二分类网络,试题掌握程度评估模型包括第一卷积神经网络、第二卷积神经网络和注意力网络,第一训练模块,还用于:
采用第一卷积神经网络对针对第二作答结果数据对应的词嵌入特征进行采样,得到第三作答特征,采用第二卷积神经网络对第二标准答案数据对应的词嵌入特征进行采样,得到第三答案特征,以及采用第三卷积神经网络对第一文本数据对应的词嵌入特征进行采样,得到第一文本特征;
采用注意力网络对第三作答特征与第三答案特征进行注意力计算,得到第二注意力信息;
采用第一特征计算网络计算第二注意力信息与第三作答特征的乘积,得到第四作答特征;
采用第一特征融合网络将第一文本特征、第三答案特征以及第四作答特征进行融合,得到第一融合特征;
将第一融合特征输入至第一分类网络,得到输出的第二批改结论,以及将训练拼接特征输入至第二分类网络,得到输出的第二批改得分;
根据第一批改结论、第一批改得分、第二批改结论和第二批改得分对批改结果评估模型的模型参数进行迭代更新,直到达到第一预设迭代停止条件,完成对批改结果评估模型的训练。
在一可选的实施例中,第一分类网络包括第一全连接网络和第一分类模块,第二分类网络包括第二全连接网络和第二分类模块,第一训练模块还用于:
将第一融合特征输入至第一全连接网络,得到批改结论特征;
采用第一分类模块对批改结论特征进行分类计算,得到第二批改结论;
将第一融合特征输入至第二全连接网络,得到批改得分特征;
采用第二分类模块对批改得分特征进行分类计算,得到第二批改得分。
在一可选的实施例中,搜索模块440还用于:
根据试题属性数据中包含的第二文本数据以及第一知识点数据生成参考试题的题面数据;
根据试题属性数据中包含的第一知识点数据以及题型数据生成参考试题的基础属性数据;
根据掌握程度数据、题面数据以及基础属性数据,从候选试题中搜索得到与参考试题匹配的目标试题。
在一可选的实施例中,搜索模块440还用于:
通过词嵌入模型对试题属性数据中包含的第二文本数据进行词嵌入处理,得到第二文本特征;
将第二文本特征和试题属性数据中包含的第一知识点数据输入至题面数据生成模型,得到参考试题的题面数据。
在一可选的实施例中,题面数据生成模型包括第二特征计算网络、第二特征融合网络、第三全连接网络以及第四全连接网络,搜索模块440还用于:
将第一知识点数据数据输入至第三全连接网络,得到第一知识点特征集合;
采用第二特征计算网络计算第一知识点特征集合中的所有知识点特征的平均值,得到第一平均知识点特征;
采用第二特征融合网络将第二文本特征与第一平均知识点特征进行融合,并将融合得到的特征输入第四全连接网络,得到参考试题的题面数据。
在一可选的实施例中,本申请提供的试题搜索装置还包括第二训练模块,用于:
获取试题相似程度评估模型的第二训练样本数据集合,第二训练样本数据集合包括多个第二训练样本数据,第二训练样本数据包括第二样本试题的第三文本数据、第二样本试题的第二知识点数据、第三样本试题的第四文本数据、第三样本试题的第三知识点数据以及第二样本试题与第三样本试题的第一相似程度数据;
以第三文本数据对应的第三文本特征、第二知识点数据、第四文本数据对应的第四文本特征以及第三知识点数据为输入,以第一相似程度数据为输出训练试题相似程度评估模型。
在一可选的实施例中,试题相似程度评估模型包括题面数据生成模型、第三特征计算网络、第四特征计算网络、第三特征融合网络以及第三分类网络,题面数据生成模型包括第二特征计算网络、第二特征融合网络、第三全连接网络以及第四全连接网络,第二训练模块还用于:
将第二知识点数据和第三知识点数据分别输入第三全连接网络,得到输出的第二知识点特征集合和第三知识点特征集合;
采用第二特征计算网络分别计算第二知识点特征集合和第三知识点特征集合中的知识点特征的平均值,得到第二平均知识点特征与第三平均知识点特征;
采用第二特征融合网络将第三文本特征与第二平均知识点特征进行融合,得到第二融合特征;
采用第二特征融合网络将第四文本特征与第三平均知识点特征进行融合,得到第三融合特征;
将第二融合特征与第三融合特征分别输入至第四全连接网络,得到输出的第一题面特征和第二题面特征;
采用第三特征计算网络计算第一题面特征与第二题面特征的差值,得到差特征;
采用第四特征计算网络计算第一题面特征与第二题面特征的乘积,得到积特征;
采用第三特征融合网络将差特征与积特征进行特征融合,得到第四融合特征;
将第四融合特征输入至第三分类网络,得到输出的第二相似程度数据;
根据第一相似程度数据与第二相似程度数据对试题相似程度评估模型的模型参数进行迭代更新,直至达到第二预设迭代停止条件,完成对试题相似程度评估模型的训练。
在一可选的实施例中,搜索模块440还用于:
获取每一候选试题的候选试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据;
根据掌握程度数据、题面数据、基础属性数据、候选试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据计算参考试题与每一候选试题的相似度;
根据相似度从候选试题中搜索得到与参考试题匹配的目标试题。
在一可选的实施例中,搜索模块440还用于:
获取每一候选试题的候选试题文本数据、候选试题知识点数据、候选试题题型数据、候选试题标准答案数据以及对每一候选试题的作答数据;
根据每一候选试题的知识点数据与候选试题题型数据生成每一候选试题的基础属性数据;
将每一候选试题的候选试题文本数据和候选试题知识点数据输入至题面数据生成模型,得到每一候选试题的候选试题题面数据;
将每一候选试题的候选试题标准答案数据和对每一候选试题的作答数据输入至试题掌握程度评估模型,得到每一候选试题的试题掌握程度数据。
在一可选的实施例中,搜索模块440还用于:
将对每一候选试题的作答数据根据作答对象的属性信息分为多个类别的候选试题作答数据;
将每一候选试题的候选试题标准答案数据和多个类别的候选试题作答数据输入至试题掌握程度评估模型中,得到每一候选试题的多个试题掌握程度数据;
获取目标对象的目标类别;
根据目标类别在每一候选试题的多个试题掌握程度数据中确定目标试题掌握程度数据;
根据掌握程度数据、试题题面数据、基础属性数据、目标试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据计算参考试题与每一候选试题的相似度。
在一可选的实施例中,本申请提供的试题搜索装置还包括推送模块,用于:
将目标试题推送给目标对象。
应当说明的是,本申请实施例提供的试题搜索装置400与上文实施例中的试题搜索方法属于同一构思,其具体实现过程详见以上相关实施例,此处不再赘述。
本申请实施例还提供一种电子设备,包括存储器和处理器,其中处理器通过调用存储器中存储的计算机程序,用于执行本实施例提供的试题搜索方法中的步骤。
请参照图10,图10为本申请实施例提供的电子设备100的结构示意图。
该电子设备100可以包括网络接口110、存储器120、处理器130以及屏幕组件等部件。本领域技术人员可以理解,图10中示出的电子设备100结构并不构成对电子设备100的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
网络接口110可以用于进行设备之间的网络连接。
存储器120可用于存储计算机程序和数据。存储器120存储的计算机程序中包含有可执行代码。计算机程序可以划分为各种功能模块。处理器130通过运行存储在存储器120的计算机程序,从而执行各种功能应用以及数据处理。
处理器130是电子设备100的控制中心,利用各种接口和线路连接整个电子设备100的各个部分,通过运行或执行存储在存储器120内的计算机程序,以及调用存储在存储器120内的数据,执行电子设备100的各种功能和处理数据,从而对电子设备100进行整体控制。
在本实施例中,电子设备100中的处理器130会按照如下的指令,将一个或一个以上的计算机程序对应的可执行代码加载到存储器120中,并由处理器130来执行本申请提供的试题搜索方法中的步骤,比如:
获取目标对象对参考试题的作答数据;
根据作答数据对目标对象针对参考试题的掌握程度进行评估,得到掌握程度数据;
获取参考试题的试题属性数据;
根据试题属性数据以及掌握程度数据,从候选试题中搜索得到与参考试题匹配的目标试题。
应当说明的是,本申请实施例提供的电子设备100与上文实施例中的试题搜索方法属于同一构思,其具体实现过程详见以上相关实施例,此处不再赘述。
本申请还提供一种计算机可读的存储介质,其上存储有计算机程序,当其存储的计算机程序在本申请实施例提供的电子设备的处理器上执行时,使得电子设备的处理器执行以上任一适于电子设备的试题搜索方法中的步骤。其中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM)或者随机存取器(Random Access Memory,RAM)等。
以上对本申请所提供的一种试题搜索方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (17)

1.一种试题搜索方法,其特征在于,所述方法包括:
获取目标对象对参考试题的作答数据;
根据所述作答数据对所述目标对象针对所述参考试题的掌握程度进行评估,得到掌握程度数据;
获取所述参考试题的试题属性数据;
根据所述试题属性数据以及所述掌握程度数据,从候选试题中搜索得到与所述参考试题匹配的目标试题。
2.根据权利要求1所述的方法,其特征在于,所述作答数据包括第一作答结果数据以及第一标准答案数据,所述根据所述作答数据对所述目标对象针对所述参考试题的掌握程度进行评估,得到掌握程度数据,包括:
通过词嵌入模型分别对所述第一作答结果数据以及所述第一标准答案数据进行词嵌入处理,得到第一作答特征以及第一答案特征;
将所述第一作答特征以及所述第一答案特征输入试题掌握程度评估模型,得到所述目标对象对所述参考试题的掌握程度数据。
3.根据权利要求2所述的方法,其特征在于,试题掌握程度评估模型包括第一卷积神经网络、第二卷积神经网络和注意力网络,所述将所述第一作答特征以及所述第一答案特征输入试题掌握程度评估模型,得到所述目标对象对所述参考试题的掌握程度数据,包括:
采用所述第一卷积神经网络对所述第一作答特征进行特征采样,得到第二作答特征;采用所述第二卷积神经网络对所述第一答案特征进行特征采样,得到第二答案特征;
采用所述注意力网络对所述第二作答特征与所述第二答案特征进行注意力计算,得到第一注意力信息;
根据所述第一注意力信息确定所述目标对象对所述参考试题的掌握程度数据。
4.根据权利要求3所述的方法,其特征在于,所述第一注意力信息包括权重矩阵,所述根据所述第一注意力信息确定所述目标对象对所述参考试题的掌握程度数据,包括:
根据所述第二作答特征的特征维度对所述权重矩阵进行池化处理,得到权重向量;
将所述权重向量确定为所述目标对象对所述参考试题的掌握程度数据。
5.根据权利要求2所述的方法,其特征在于,所述通过词嵌入模型分别对所述第一作答结果数据以及所述第一标准答案数据进行词嵌入处理,得到第一作答特征以及第一答案特征,包括:
对所述第一作答结果数据进行文本清洗,得到清洗后的作答结果文本;
对所述第一标准答案数据进行文本清洗,得到清洗后的标准答案文本;
对所述作答结果文本和所述标准答案文本进行分词,得到作答结果词序列和标准答案词序列;
通过词嵌入模型分别对所述作答结果词序列和所述标准答案词序列进行词嵌入处理,得到第一作答特征以及第一答案特征。
6.根据权利要求2所述的方法,其特征在于,所述将所述第一作答特征以及所述第一答案特征输入试题掌握程度评估模型,得到所述目标对象对所述参考试题的掌握程度数据之前,还包括:
获取批改结果评估模型的第一训练样本数据集合,所述批改结果评估模型包括所述试题掌握程度评估模型,所述第一训练样本数据集合包括多个第一训练样本数据,所述第一训练样本数据包括第一样本试题的第一文本数据、第一样本试题的第二标准答案数据、针对所述第一样本试题的第二作答结果数据以及对所述第二作答结果数据的批改数据,所述批改数据包括第一批改结论和第一批改得分;
以每一第一训练样本数据中的第一文本数据、第二标准答案数据以及第二作答结果数据对应的特征为输入,以对所述第二作答结果数据的批改数据为输出训练所述批改结果评估模型。
7.根据权利要求1所述的方法,其特征在于,所述根据所述试题属性数据以及所述掌握程度数据,从候选试题中搜索得到与所述参考试题匹配的目标试题,包括:
根据所述试题属性数据中包含的第二文本数据以及第一知识点数据生成所述参考试题的题面数据;
根据所述试题属性数据中包含的第一知识点数据以及题型数据生成所述参考试题的基础属性数据;
根据所述掌握程度数据、所述题面数据以及所述基础属性数据,从候选试题中搜索得到与所述参考试题匹配的目标试题。
8.根据权利要求7所述的方法,其特征在于,所述根据所述试题属性数据中包含的第二文本数据以及第一知识点数据生成所述参考试题的题面数据,包括:
通过词嵌入模型对所述试题属性数据中包含的第二文本数据进行词嵌入处理,得到第二文本特征;
将所述第二文本特征和所述试题属性数据中包含的第一知识点数据输入至题面数据生成模型,得到所述参考试题的题面数据。
9.根据权利要求8所述的方法,其特征在于,所述题面数据生成模型包括第二特征计算网络、第二特征融合网络、第三全连接网络以及第四全连接网络,所述将所述第二文本特征和所述试题属性数据中包含的试题知识点数据输入至题面数据生成模型,得到所述参考试题的题面数据,包括:
将所述第一知识点数据数据输入至所述第三全连接网络,得到第一知识点特征集合;
采用所述第二特征计算网络计算所述第一知识点特征集合中的所有知识点特征的平均值,得到第一平均知识点特征;
采用所述第二特征融合网络将所述第二文本特征与所述第一平均知识点特征进行融合,并将融合得到的特征输入所述第四全连接网络,得到所述参考试题的题面数据。
10.根据权利要求8所述的方法,其特征在于,所述将所述第二文本特征和所述试题属性数据中包含的第一知识点数据输入至题面数据生成模型,得到所述参考试题的题面数据之前,还包括:
获取试题相似程度评估模型的第二训练样本数据集合,所述第二训练样本数据集合包括多个第二训练样本数据,所述第二训练样本数据包括第二样本试题的第三文本数据、第二样本试题的第二知识点数据、第三样本试题的第四文本数据、第三样本试题的第三知识点数据以及所述第二样本试题与所述第三样本试题的第一相似程度数据;
以所述第三文本数据对应的第三文本特征、所述第二知识点数据、所述第四文本数据对应的第四文本特征以及所述第三知识点数据为输入,以所述第一相似程度数据为输出训练所述试题相似程度评估模型。
11.根据权利要求7所述的方法,其特征在于,所述根据所述掌握程度数据、所述题面数据以及所述基础属性数据,从候选试题中搜索得到与所述参考试题匹配的目标试题,包括:
获取每一候选试题的候选试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据;
根据所述掌握程度数据、所述题面数据、所述基础属性数据、所述候选试题掌握程度数据、所述候选试题题面数据以及所述候选试题基础属性数据计算所述参考试题与每一候选试题的相似度;
根据所述相似度从候选试题中搜索得到与所述参考试题匹配的目标试题。
12.根据权利要求11所述的方法,其特征在于,所述获取每一候选试题的候选试题掌握程度数据、候选试题题面数据以及候选试题基础属性数据,包括:
获取每一候选试题的候选试题文本数据、候选试题知识点数据、候选试题题型数据、候选试题标准答案数据以及对每一候选试题的作答数据;
根据每一候选试题的知识点数据与候选试题题型数据生成每一候选试题的基础属性数据;
将每一候选试题的候选试题文本数据和候选试题知识点数据输入至所述题面数据生成模型,得到每一候选试题的候选试题题面数据;
将每一候选试题的候选试题标准答案数据和对每一候选试题的作答数据输入至所述试题掌握程度评估模型,得到每一候选试题的试题掌握程度数据。
13.根据权利要求12所述的方法,其特征在于,所述将每一候选试题的候选试题标准答案数据和对每一候选试题的作答数据输入至所述试题掌握程度评估模型中,得到每一候选试题的试题掌握程度数据,包括:
将所述对每一候选试题的作答数据根据作答对象的属性信息分为多个类别的候选试题作答数据;
将每一候选试题的候选试题标准答案数据和所述多个类别的候选试题作答数据输入至所述试题掌握程度评估模型中,得到每一候选试题的多个试题掌握程度数据;
所述根据所述掌握程度数据、所述题面数据、所述基础属性数据、所述候选试题掌握程度数据、所述候选试题题面数据以及所述候选试题基础属性数据计算所述参考试题与每一候选试题的相似度,包括:
获取所述目标对象的目标类别;
根据所述目标类别在每一候选试题的多个试题掌握程度数据中确定目标试题掌握程度数据;
根据所述掌握程度数据、所述试题题面数据、所述基础属性数据、所述目标试题掌握程度数据、所述候选试题题面数据以及所述候选试题基础属性数据计算所述参考试题与每一候选试题的相似度。
14.根据权利要求1至13中任一项所述的方法,其特征在于,所述方法还包括:
将所述目标试题推送给所述目标对象。
15.一种试题搜索装置,其特征在于,包括:
第一获取模块,用于获取目标对象对参考试题的作答数据;
评估模块,用于根据所述作答数据对所述目标对象针对所述参考试题的掌握程度进行评估,得到掌握程度数据;
第二获取模块,用于所述参考试题的试题属性数据;
搜索模块,用于根据所述试题属性数据以及所述掌握程度数据,从候选试题中搜索得到与所述参考试题匹配的目标试题。
16.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序被处理器加载时执行如权利要求1-14任一项所述的试题搜索方法中的步骤。
17.一种电子设备,包括处理器和存储器,所述存储器储存有计算机程序,其特征在于,所述处理器通过加载所述计算机程序,用于执行如权利要求1至14任一项所述的试题搜索方法中的步骤。
CN202111631970.8A 2021-12-29 2021-12-29 试题搜索方法、装置、存储介质及电子设备 Pending CN114281947A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111631970.8A CN114281947A (zh) 2021-12-29 2021-12-29 试题搜索方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111631970.8A CN114281947A (zh) 2021-12-29 2021-12-29 试题搜索方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN114281947A true CN114281947A (zh) 2022-04-05

Family

ID=80877429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111631970.8A Pending CN114281947A (zh) 2021-12-29 2021-12-29 试题搜索方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN114281947A (zh)

Similar Documents

Publication Publication Date Title
CN111741330B (zh) 一种视频内容评估方法、装置、存储介质及计算机设备
CN109993102B (zh) 相似人脸检索方法、装置及存储介质
CN111046275B (zh) 基于人工智能的用户标签确定方法及装置、存储介质
CN110234018B (zh) 多媒体内容描述生成方法、训练方法、装置、设备及介质
CN111666416B (zh) 用于生成语义匹配模型的方法和装置
CN113761153B (zh) 基于图片的问答处理方法、装置、可读介质及电子设备
CN110852256A (zh) 时序动作提名的生成方法、装置、设备及存储介质
CN110795944A (zh) 推荐内容处理方法及装置、情感属性确定方法及装置
CN110728319B (zh) 一种图像生成方法、装置以及计算机存储介质
CN114140885A (zh) 一种情感分析模型的生成方法、装置、电子设备以及存储介质
CN112668608A (zh) 一种图像识别方法、装置、电子设备及存储介质
CN112420125A (zh) 分子属性预测方法、装置、智能设备和终端
CN116956116A (zh) 文本的处理方法和装置、存储介质及电子设备
CN116975350A (zh) 图文检索方法、装置、设备及存储介质
CN113313215B (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN110852071A (zh) 知识点检测方法、装置、设备及可读存储介质
CN117421639A (zh) 多模态数据分类方法、终端设备及存储介质
CN113705293A (zh) 图像场景的识别方法、装置、设备及可读存储介质
CN114419514B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN113434722B (zh) 图像分类方法、装置、设备及计算机可读存储介质
CN114281947A (zh) 试题搜索方法、装置、存储介质及电子设备
CN113821610A (zh) 信息匹配方法、装置、设备及存储介质
CN114357964A (zh) 主观题评分方法、模型的训练方法、计算机设备及存储介质
CN113779244A (zh) 文档情感分类方法、装置、存储介质以及电子设备
CN117711001B (zh) 图像处理方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination