CN111353037B - 一种题目生成方法、装置以及计算机可读存储介质 - Google Patents

一种题目生成方法、装置以及计算机可读存储介质 Download PDF

Info

Publication number
CN111353037B
CN111353037B CN202010125284.2A CN202010125284A CN111353037B CN 111353037 B CN111353037 B CN 111353037B CN 202010125284 A CN202010125284 A CN 202010125284A CN 111353037 B CN111353037 B CN 111353037B
Authority
CN
China
Prior art keywords
question
topic
parameter information
content
generation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010125284.2A
Other languages
English (en)
Other versions
CN111353037A (zh
Inventor
王紫静
罗小飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Douyin Vision Beijing Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010125284.2A priority Critical patent/CN111353037B/zh
Publication of CN111353037A publication Critical patent/CN111353037A/zh
Application granted granted Critical
Publication of CN111353037B publication Critical patent/CN111353037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本公开提供了一种题目生成方法,其中,该方法包括:获取多个基于结构化规则进行标注后的题目样本数据;所述结构化规则中定义有与多种题目类型分别对应的结构化参数;基于所述多个题目样本数据进行模型训练,生成初始的题目生成模型;题目生成模型用于基于题目类型和考核点确定待生成题目内容对应的结构化参数下的参数信息,并基于确定的参数信息生成题目内容。本公开实施例通过训练出可以针对多种不同的题目类型进行自动出题的题目生成模型,来实现自动出题,解放了人力成本,提高了出题的灵活性。

Description

一种题目生成方法、装置以及计算机可读存储介质
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种题目生成方法、装置以及计算机可读存储介质。
背景技术
随着智能终端设备的快速发展,其功能也越来越强大,人们可以通过智能终端设备连接网络获取可用资源。智能终端设备在教学方面的应用也日益增多,很多教学类的应用程序可以为学生提供用于巩固所学知识的题库。
一般的教学类应用程序,是将书本上的题目直接收录在应用程序的题库中,缺少变通,而且题目类型和数量受限,用户基于这些题目无法得到充分的锻炼。
发明内容
本公开实施例至少提供一种题目生成的方法、装置以及计算机可读存储介质。
第一方面,本公开实施例提供了一种题目生成的方法,包括:
获取多个基于结构化规则进行标注后的题目样本数据;结构化规则中定义有与多种题目类型分别对应的结构化参数;所述题目样本数据中包含题目内容和标注数据,所述标注数据中包含题目类型、考核点、以及在至少一种结构化参数下的参数信息;
基于所述多个题目样本数据进行模型训练,生成初始的题目生成模型;
其中,所述题目生成模型用于基于题目类型和考核点确定待生成题目内容对应的结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
一种可能的实施方式中,在生成初始的题目生成模型之后,还包括:
获取在模型测试阶段输入的第一出题参考信息,所述第一出题参考信息包括第一题目类型和第一考核点,或者所述第一出题参考信息包括第一参考题目内容;
将所述第一出题参考信息输入所述初始的题目生成模型,通过所述初始的题目生成模型确定与所述第一出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第一题目内容;
获取用户针对所述生成的第一题目内容的校正内容;
基于所述校正内容,对所述初始的题目生成模型进行调整,得到调整后的题目生成模型。
一种可能的实施方式中,在得到调整后的题目生成模型之后,还包括:
获取待出题的第二出题参考信息,所述第二出题参考信息包括第二题目类型和第二考核点,或者所述第二出题参考信息包括第二参考题目内容;
将所述第二出题参考信息输入所述调整后的题目生成模型进行处理,通过所述调整后的题目生成模型确定与所述第二出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第二题目内容。
一种可能的实施方式中,所述多种题目类型至少包括:数学计算题和数学应用题。
第二方面,本公开提供的基于上述训练的题目生成模型的题目生成方法包括:
获取待出题的出题参考信息,所述出题参考信息包括题目类型和考核点,或者所述出题参考信息包括参考题目内容;
将所述出题参考信息输入训练的题目生成模型进行处理,通过所述题目生成模型确定与所述出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
一种可能的实施方式中,若所述出题参考信息包括题目类型和考核点,则通过所述题目生成模型确定与所述出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容,包括:
根据所述题目类型,确定与所述题目类型对应的至少一种结构化参数;
基于所述考核点,为确定的至少一种结构化参数配置参数信息;
基于配置的所述参数信息,生成所述题目内容。
一种可能的实施方式中,若所述出题参考信息包括参考题目内容,则通过所述题目生成模型确定与所述出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容,包括:
对所述参考题目内容进行文本解析,得到与该参考题目内容匹配的题目类型和考核点;
确定与得到的所述题目类型对应的至少一种结构化参数,并基于得到的所述考核点,为确定的至少一种结构化参数配置参数信息;
基于配置的所述参数信息,生成所述题目内容。
一种可能的实施方式中,基于配置的所述参数信息,生成所述题目内容,包括:
从配置的所述参数信息中,确定解题关键数据;
基于训练的语法规则,生成包含所述解题关键数据、且与配置的所述参数信息中除所述解题关键数据外的参数信息匹配的题目内容。
第三方面,本公开实施例还提供一种题目生成的装置,包括:
样本数据获取模块,用于获取多个基于结构化规则进行标注后的题目样本数据;结构化规则中定义有与多种题目类型分别对应的结构化参数;所述题目样本数据中包含题目内容和标注数据,所述标注数据中包含题目类型、考核点、以及在至少一种结构化参数下的参数信息;
模型训练模块,用于基于所述多个题目样本数据进行模型训练,生成初始的题目生成模型;其中,所述题目生成模型用于基于题目类型和考核点确定待生成题目内容对应的结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
一种可能的实施方式中,所述装置还包括调整模块;
所述调整模块用于:获取在模型测试阶段输入的第一出题参考信息,所述第一出题参考信息包括第一题目类型和第一考核点,或者所述第一出题参考信息包括第一参考题目内容;将所述第一出题参考信息输入所述初始的题目生成模型,通过所述初始的题目生成模型确定与所述第一出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第一题目内容;获取用户针对所述生成的第一题目内容的校正内容;基于所述校正内容,对所述初始的题目生成模型进行调整,得到调整后的题目生成模型。
一种可能的实施方式中,所述装置还包括题目生成模块;
所述题目生成模块,用于获取待出题的第二出题参考信息,所述第二出题参考信息包括第二题目类型和第二考核点,或者所述第二出题参考信息包括第二参考题目内容;将所述第二出题参考信息输入所述调整后的题目生成模型进行处理,通过所述调整后的题目生成模型确定与所述第二出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第二题目内容。
一种可能的实施方式中,所述多种题目类型至少包括:数学计算题和数学应用题。
第四方面,本公开实施例还提供了应用上述题目生成模型进行题目生成的装置,所述装置包括:
出题参考信息获取模块,用于获取待出题的出题参考信息,所述出题参考信息包括题目类型和考核点,或者所述出题参考信息包括参考题目内容;
题目生成模块,用于将所述出题参考信息输入训练的题目生成模型进行处理,通过所述题目生成模型确定与所述出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
一种可能的实施方式中,若所述出题参考信息包括题目类型和考核点,则所述题目生成模块用于:根据所述题目类型,查找与所述题目类型对应的结构化参数集合;基于所述考核点,为所述结构化参数集合中与该考核点匹配的至少一种结构化参数配置参数信息;基于配置的所述参数信息,生成所述题目内容。
一种可能的实施方式中,若所述出题参考信息包括参考题目内容,则所述题目生成模块用于:对所述参考题目内容进行文本解析,得到与该参考题目内容匹配的题目类型和考核点;查找与得到的所述题目类型对应的结构化参数集合,并基于得到的所述考核点,为所述结构化参数集合中与该考核点匹配的至少一种结构化参数配置参数信息;基于配置的所述参数信息,生成所述题目内容。
一种可能的实施方式中,所述题目生成模块用于:
从配置的所述参数信息中,确定解题关键数据;基于训练的语法规则,生成包含所述解题关键数据、且与配置的所述参数信息中除所述解题关键数据外的参数信息匹配的题目内容。
第五方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第六方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有题目生成方法的计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本公开实施例提供的题目生成的方法,对多种题目类型进行了结构化规则定义,其中定义了与多种题目类型分别对应的至少一种结构化参数,在此基础上,获取多个基于该结构化规则进行标注后的题目样本数据,题目样本数据中包含题目内容和标注数据,标注数据中包含题目类型、考核点、以及在至少一种结构化参数下的参数信息;然后基于多个题目样本数据进行模型训练,生成初始的题目生成模型;采用该题目生成模型,就可以基于题目类型和考核点确定待生成题目内容对应的至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容。从而本公开实施例可以根据需求,自动生成不同题目类型下的题目,提高了出题的灵活性和丰富性。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种题目生成方法的流程图;
图2示出了本公开实施例所提供的基于题目生成模型自动生成题目的流程示意图;
图3示出了本公开实施例所提供的一种题目生成装置的示意图;
图4示出了本公开实施例所提供的另一种题目生成装置的示意图;
图5示出了本公开实施例所提供的一种计算机设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开提供了一种题目生成方法,定义了多种结构类型下的结构化规则,每种题目类型下的结构化规则中定义了至少一种结构化参数,基于结构化参数可反映题目的结构特点,训练的题目生成模型能够基于待生成题目内容对应的题目类型和考核点来确定对应该题目类型的结构化参数下的参数信息,然后基于这些结构化参数的参数信息,按照训练的语法规则生成题目。一方面,本公开基于训练的模型自动生成题目,解放了人力成本,另一方面,可以根据题目类型和考核点确定待生成题目内容的结构化参数信息,然后基于结构化参数信息,按照训练的语法规则生成题目,生成的题目不受固定题目模板约束,提高了出题的灵活性。
针对以上方案,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人对本公开做出的贡献。
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种题目生成方法进行详细介绍,本公开实施例所提供的题目生成方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、教学终端等。在一些可能的实现方式中,该题目生成方法可以通过处理器调用存储器中存储的题目生成方法的计算机可读指令的方式来实现。
下面以执行主体为终端设备为例对本公开实施例提供的题目生成方法加以说明。
为了解放人力成本,同时提高出题的灵活性,本公开实施例提供了一种基于模型训练的题目生成的方法,通过训练出可以针对多种不同的题目类型进行自动出题的题目生成模型,来实现自动出题。为了训练题目生成模型,本公开实施例定义了多种题目类型下的结构化规则,每种题目类型下的结构化规则中定义了至少一种结构化参数,一般为多种结构化参数,结构化参数为反映对应的题目类型下的题目结构特点的参数,比如计算公式、题目中参与计算的参数值的取值范围、题设背景(应用题中假设的应用场景)等。训练的题目生成模型能够基于待生成题目内容对应的题目类型和考核点来确定对应该题目类型的结构化参数下的参数信息,然后基于这些结构化参数的参数信息,按照训练的语法规则生成题目。
下面对本公开实施例的方法做进一步描述。首先介绍题目生成模型的训练阶段。
本公开实施例中的题目生成模型的训练过程主要包括以下步骤S101~S102,在得到初始的题目生成模型之后,还加入了模型测试和应用流程,见步骤S103~S107,如图1所示。
S101:获取多个基于结构化规则进行标注后的题目样本数据。该结构化规则中定义有与多种题目类型分别对应的至少一种结构化参数;题目样本数据中包含题目内容和标注数据,该标注数据中包含题目类型、考核点、以及在至少一种结构化参数下的参数信息。
在具体实施中,获取标注的多个题目样本数据,题目样本数据中除了题目内容本身外,还有基于预先定义的结构化规则标注好的数据,其中包括题目类型和考核点,也就是最终的题目生成模型用来生成题目内容的核心参数,除此之外,还有在与该题目类型对应的结构化规则下,与该考核点匹配的结构化参数的参数信息,题目生成模型通过这些结构化参数的参数信息、以及题目类型和考核点,来学习怎么基于题目类型和考核点来匹配对应的结构化参数的参数信息,并且,基于这些结构化参数的参数信息和对应的题目内容本身,来学习如何基于这些结构化参数的参数信息生成符合语法规则的题目内容。
这里,针对不同的题目类型,可以定义不同的结构化规则。下面以计算题和应用题为例进行说明。
对于计算题这种题目类型,该题目类型下可以有多种考核点,可以考核乘除法、加减法、以及加减和乘除的综合运算等。计算题对应的结构化规则中可以包括:运算数数量、取值范围、运算类型、不同类型括号的数量、运算值的取值范围等等。
比如,根据定义的结构化规则,对于一道题目内容为“200×3”的计算题,标注数据中可以包括以下内容:
题目类型:计算题,考核点:三位数乘一位数基础计算
运算数数量:2
取值范围:A∈(100,1000),B∈[2,9]
运算类型:×
小括号数量:0
中括号数量:0
运算值范围:(200,9000)
再比如,对于应用题这种题目类型,该题目类型下可以考核实际应用场景的公式的套用,可以预设有多种题设背景,比如场景中的计算对象可以是水果、家电、玩具、人物等,计算的参数可以是价格、重量、数量、年龄等。
比如,根据定义的结构化规则,对于一道题目内容为“已知一斤苹果的价格为3元,问4斤苹果的价格”的应用题,标注数据中可以包括以下内容:
题目类型:应用题,考核点:已知一份的量求几份的量(运算数为个位数)
计算公式:A=B×N
取值范围:N∈[1,10),B∈(1,10)
题设背景:随机在预设的多种题设背景中选择,比如场景中的计算对象可以是水果、家电、玩具、人物等,计算的参数可以是价格、重量、数量、年龄等。
再比如,对于另一道应用题:“A、B两地距离600km,一辆小汽车以60km/h的速度从A地出发,请问多久可以到达B地?”,根据定义的结构化规则,标注数据中可以包括以下内容:
考核知识点:行程问题-行程三要素-已知路程和速度求时间
考核方式:直接公式套用
计算公式:A÷B=C
数据位置:路程=600(可替换)km、速度=60(可替换)km/h
这里,每种题目类型都有对应的一套结构化参数,其中一般包含了多种结构化参数,而在一种题目类型下的不同考核点下,可能涉及的结构化参数不同,比如上述第一道应用题,在考核知识点“已知一份的量求几份的量(运算数为个位数)”下,使用了应用题型下的一套结构化参数中的计算公式、取值范围、题设背景这些结构化参数,而在考核知识点“行程问题-行程三要素-已知路程和速度求时间”下,使用了应用题型下的一套结构化参数中的计算公式、考核方式、数据位置这些结构化参数。
S102:基于所述多个题目样本数据进行模型训练,生成初始的题目生成模型,生成的题目生成模型用于基于题目类型和考核点确定待生成题目内容对应的至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
这里,基于上述描述内容可知,基于标注的结构化参数的参数信息、以及题目类型和考核点,题目生成模型可以学习到如何基于题目类型和考核点来匹配对应的结构化参数的参数信息,并且,基于这些结构化参数的参数信息和对应的题目内容本身,来学习如何基于结构化参数的参数信息生成符合语法规则的题目内容。这样,训练后的题目生成模型就可以基于待生成的题目内容对应的题目类型和考核点确定至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
在生成上述初始的题目生成模型后,可以进一步对该初始的题目生成模型进行测试、调整。见下述步骤。
S103:获取在模型测试阶段输入的第一出题参考信息,所述第一出题参考信息包括第一题目类型和第一考核点,或者所述第一出题参考信息包括第一参考题目内容。
这里,输入到题目生成模型的可以是题目类型和考核点,也可以是一道具体的题目内容。
S104:将所述第一出题参考信息输入所述初始的题目生成模型,通过所述初始的题目生成模型确定与所述第一出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第一题目内容。
在S103中,若输入到题目生成模型的为题目类型和考核点,题目生成模型基于该题目类型和考核点确定匹配的结构化参数下的参数信息,并基于确定的参数信息生成题目内容;若输入到题目生成模型的为具体的参考题目内容,题目生成模型先基于该参考题目内容,提炼出题目类型和考核点,再基于该题目类型和考核点确定匹配的结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
S105:获取用户针对所述生成的第一题目内容的校正内容;基于所述校正内容,对所述初始的题目生成模型进行调整,得到调整后的题目生成模型。
这里,针对生成的题目内容,可以从题干搭配及叙述是否符合常理、数据计算结果是否与事实匹配、题干是否有歧义、中间过程是否有超纲现象等几个方面来判断生成的题目内容的质量,若发现题目内容质量不合格,对生成的题目内容进行校正,然后再将校正后的题目内容作为样本,进行标注后,返回上述模型训练过程,重新进行模型训练,直到调整后的题目生成模型的出题质量符合预期。
S106:获取待出题的第二出题参考信息,所述第二出题参考信息包括第二题目类型和第二考核点,或者所述第二出题参考信息包括第二参考题目内容。
S107:将所述第二出题参考信息输入所述调整后的题目生成模型进行处理,通过所述调整后的题目生成模型确定与所述第二出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第二题目内容。
上述S106和S107为对训练好的题目生成模型的应用过程,具体应用过程与上述测试过程类似,即,将出题的题目类型和考核点,或者是用于出题参考的参考题目内容输入到训练好的题目生成模型。题目生成模型基于输入的题目类型和考核点确定匹配的结构化参数下的参数信息,并基于确定的参数信息生成题目内容;或者,题目生成模型基于输入的参考题目内容,提炼出题目类型和考核点,再基于该题目类型和考核点确定匹配的结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
下面通过另一个实施例,对本公开中题目生成模型的应用过程做进一步介绍。
如图2所示,为本公开实施例基于题目生成模型自动生成题目的流程示意图,包括以下步骤:
S201:获取待出题的出题参考信息,所述出题参考信息包括题目类型和考核点,或者所述出题参考信息包括参考题目内容。
S202:将所述出题参考信息输入训练的题目生成模型进行处理,通过所述题目生成模型确定与所述出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
这里,若出题参考信息包括题目类型和考核点,S202具体执行过程可以包括:根据所述题目类型,确定与所述题目类型对应的至少一种结构化参数;基于所述考核点,为确定的至少一种结构化参数配置参数信息;基于配置的所述参数信息,生成所述题目内容。
比如,若题目类型为应用题,查找与应用题对应的结构化参数集合,包括计算公式、取值范围、题设背景等。若该应用题的考核点为“已知一份的量求几份的量(运算数为个位数)”,则确定与应用题匹配的结构化参数的参数信息分别为:计算公式:A=B×N、取值范围:N∈[1,10),B∈(1,10);题设背景可以随机在预设的多种题设背景中选择,比如场景中的计算对象可以为水果,计算的参数可以是价格。
另外,若出题参考信息为具体的参考题目内容,则S202具体执行过程可以包括:对所述参考题目内容进行文本解析,得到与该参考题目内容匹配的题目类型和考核点;查找与得到的所述题目类型对应的结构化参数集合,并基于得到的所述考核点,为所述结构化参数集合中与该考核点匹配的至少一种结构化参数配置参数信息;基于配置的所述参数信息,生成所述题目内容。
比如,还是以上述应用题为例,输入的参考题目内容为“已知一斤苹果的价格为3元,问4斤苹果的价格”,题目生成模型进行文本解析,确定该参考题目内容的题目类型为应用题,考核点为“已知一份的量求几份的量(运算数为个位数)”,进而基于解析的题目类型和考核点,进一步确定匹配的结构化参数的参数信息,再生成新的题目内容。
对于应用题,题目生成模型在基于配置的参数信息生成题目内容时,需要从配置的所述参数信息中,确定解题关键数据;基于训练的语法规则,生成包含所述解题关键数据、且与配置的所述参数信息中除所述解题关键数据外的参数信息匹配的题目内容。
比如,上述题目中,确定解题关键数据为参数信息中的“苹果的价格为3元”“4斤苹果”,再比如,在上述“路程-速度”的应用题中,解题关键数据为参数信息中的“路程=600km”“速度=60km/h”,生成的题目内容中需要包含这些关键数据,同时对于其他参数信息,可以通过近义词、语义变换等方式,将其他参数信息的意思表达在题目内容中,比如“路程”还可以用“距离”代替,涉及的对象可以是任何可以有运动速度的对象,比如汽车、火车、飞机等等。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与题目生成方法对应的题目生成装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述题目生成方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
如图3所示,本公开实施例还提供一种题目生成装置,包括:样本数据获取模块31和模型训练模块32,其中:
样本数据获取模块31,用于获取多个基于结构化规则进行标注后的题目样本数据;结构化规则中定义有与多种题目类型分别对应的结构化参数;所述题目样本数据中包含题目内容和标注数据,所述标注数据中包含题目类型、考核点、以及在至少一种结构化参数下的参数信息;
模型训练模块32,用于基于所述多个题目样本数据进行模型训练,生成初始的题目生成模型;所述题目生成模型基于题目类型和考核点确定待生成题目内容对应的结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
一种可能的实施方式中,所述装置还包括:调整模块33;
调整模块33用于:获取在模型测试阶段输入的第一出题参考信息,所述第一出题参考信息包括第一题目类型和第一考核点,或者所述第一出题参考信息包括第一参考题目内容;将所述第一出题参考信息输入所述初始的题目生成模型,通过所述初始的题目生成模型确定与所述第一出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第一题目内容;获取用户针对所述生成的第一题目内容的校正内容;基于所述校正内容,对所述初始的题目生成模型进行调整,得到调整后的题目生成模型。
一种可能的实施方式中,所述装置还包括:题目生成模块34;
题目生成模块34用于:获取待出题的第二出题参考信息,所述第二出题参考信息包括第二题目类型和第二考核点,或者所述第二出题参考信息包括第二参考题目内容;将所述第二出题参考信息输入所述调整后的题目生成模型进行处理,通过所述调整后的题目生成模型确定与所述第二出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第二题目内容。
一种可能的实施方式中,所述多种题目类型至少包括:数学计算题和数学应用题。
如图4所述,本公开另一实施例提供的题目生成装置包括:出题参考信息获取模块41和题目生成模块42,其中:
出题参考信息获取模块41,用于获取待出题的出题参考信息,所述出题参考信息包括题目类型和考核点,或者所述出题参考信息包括参考题目内容;
题目生成模块42,用于将所述出题参考信息输入训练的题目生成模型进行处理,通过所述题目生成模型确定与所述出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成题目内容。
一种可能的实施方式中,若所述出题参考信息包括题目类型和考核点,则题目生成模块42,用于:
根据所述题目类型,查找与所述题目类型对应的结构化参数集合;基于所述考核点,为所述结构化参数集合中与该考核点匹配的至少一种结构化参数配置参数信息;基于配置的所述参数信息,生成所述题目内容。
一种可能的实施方式中,若所述出题参考信息包括参考题目内容,则题目生成模块42,用于:对所述参考题目内容进行文本解析,得到与该参考题目内容匹配的题目类型和考核点;查找与得到的所述题目类型对应的结构化参数集合,并基于得到的所述考核点,为所述结构化参数集合中与该考核点匹配的至少一种结构化参数配置参数信息;基于配置的所述参数信息,生成所述题目内容。
一种可能的实施方式中,题目生成模块42具体用于根据以下步骤基于配置的所述参数信息,生成所述题目内容:
从配置的所述参数信息中,确定解题关键数据;基于训练的语法规则,生成包含所述解题关键数据、且与配置的所述参数信息中除所述解题关键数据外的参数信息匹配的。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
对应于图1或图2所示的题目生成的方法,本公开实施例还提供了一种计算机设备50,如图5所示,为本公开实施例提供的计算机设备50结构示意图,包括:处理器51、存储器52、和总线53。所述存储器52存储有所述处理器41可执行的机器可读指令,当计算机设备50运行时,所述处理器51与所述存储器52之间通过总线53通信,所述机器可读指令被所述处理器51执行时执行上述题目生成的方法,这里不再赘述。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的题目生成方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例所提供的题目生成方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的题目生成方法的步骤,具体可参见上述方法实施例,在此不再赘述。
本公开实施例还提供一种计算机程序,该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software DevelopmentKit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (11)

1.一种题目生成的方法,其特征在于,所述方法包括:
获取多个基于结构化规则进行标注后的题目样本数据;所述结构化规则中定义有与多种题目类型分别对应的结构化参数;所述题目样本数据中包含题目内容和标注数据,所述标注数据中包含题目类型、考核点、以及在至少一种结构化参数下的参数信息;
基于多个题目样本数据进行模型训练,生成初始的题目生成模型;
其中,所述题目生成模型用于基于输入的参考题目内容生成题目类型和考核点,并基于题目类型和考核点配置待生成题目内容对应的结构化参数下的参数信息,基于配置的参数信息生成题目内容。
2.根据权利要求1所述的方法,其特征在于,生成初始的题目生成模型之后,还包括:
获取在模型测试阶段输入的第一出题参考信息,所述第一出题参考信息包括第一参考题目内容;
将所述第一出题参考信息输入所述初始的题目生成模型,通过所述初始的题目生成模型确定与所述第一出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第一题目内容;
获取用户针对所述生成的第一题目内容的校正内容;
基于所述校正内容,对所述初始的题目生成模型进行调整,得到调整后的题目生成模型。
3.根据权利要求2所述的方法,其特征在于,得到调整后的题目生成模型之后,还包括:
获取待出题的第二出题参考信息,所述第二出题参考信息包括第二参考题目内容;
将所述第二出题参考信息输入所述调整后的题目生成模型进行处理,通过所述调整后的题目生成模型确定与所述第二出题参考信息匹配的至少一种结构化参数下的参数信息,并基于确定的参数信息生成第二题目内容。
4.根据权利要求1所述的方法,其特征在于,所述多种题目类型至少包括:数学计算题和数学应用题。
5.一种题目生成的方法,其特征在于,所述方法包括:
获取待出题的出题参考信息,所述出题参考信息包括参考题目内容;
将所述出题参考信息输入训练的题目生成模型进行处理,通过所述题目生成模型确定与所述参考题目内容匹配的题目类型和考核点,并基于所述题目类型和考核点配置至少一种结构化参数下的参数信息,基于配置的参数信息生成题目内容。
6.根据权利要求5所述的方法,其特征在于,通过所述题目生成模型确定与所述参考题目内容匹配的题目类型和考核点,并基于所述题目类型和考核点配置至少一种结构化参数下的参数信息,基于配置的参数信息生成题目内容,包括:
对所述参考题目内容进行文本解析,得到与该参考题目内容匹配的题目类型和考核点;
查找与得到的所述题目类型对应的结构化参数集合,并基于得到的所述考核点,为所述结构化参数集合中与该考核点匹配的至少一种结构化参数配置参数信息;
基于配置的所述参数信息,生成所述题目内容。
7.根据权利要求5或6所述的方法,其特征在于,基于配置的参数信息生成题目内容,包括:
从配置的所述参数信息中,确定解题关键数据;
基于训练的语法规则,生成包含所述解题关键数据、且与配置的所述参数信息中除所述解题关键数据外的参数信息匹配的题目内容。
8.一种题目生成的装置,其特征在于,包括:
样本数据获取模块,用于获取多个基于结构化规则进行标注后的题目样本数据;所述结构化规则中定义有与多种题目类型分别对应的结构化参数;所述题目样本数据中包含题目内容和标注数据,所述标注数据中包含题目类型、考核点、以及在至少一种结构化参数下的参数信息;
模型训练模块,用于基于多个题目样本数据进行模型训练,生成初始的题目生成模型;其中,所述题目生成模型用于基于输入的参考题目内容生成题目类型和考核点,并基于题目类型和考核点配置待生成题目内容对应的结构化参数下的参数信息,基于配置的参数信息生成题目内容。
9.一种题目生成的装置,其特征在于,包括:
出题参考信息获取模块,用于获取待出题的出题参考信息,所述出题参考信息包括参考题目内容;
题目生成模块,用于将所述出题参考信息输入训练的题目生成模型进行处理,通过所述题目生成模型确定与所述参考题目内容匹配的题目类型和考核点,并基于所述题目类型和考核点配置至少一种结构化参数下的参数信息,基于配置的参数信息生成题目内容。
10.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至4,或5至7任一所述的题目生成的方法的步骤。
11.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有题目生成方法计算机程序,该计算机程序被处理器运行时执行如权利要求1至4,或5至7任一所述的题目生成的方法的步骤。
CN202010125284.2A 2020-02-27 2020-02-27 一种题目生成方法、装置以及计算机可读存储介质 Active CN111353037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010125284.2A CN111353037B (zh) 2020-02-27 2020-02-27 一种题目生成方法、装置以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010125284.2A CN111353037B (zh) 2020-02-27 2020-02-27 一种题目生成方法、装置以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111353037A CN111353037A (zh) 2020-06-30
CN111353037B true CN111353037B (zh) 2021-06-22

Family

ID=71197134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010125284.2A Active CN111353037B (zh) 2020-02-27 2020-02-27 一种题目生成方法、装置以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111353037B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183048A (zh) * 2020-09-30 2021-01-05 北京有竹居网络技术有限公司 一种自动解题方法、装置、计算机设备及存储介质
CN112182200A (zh) * 2020-09-30 2021-01-05 北京有竹居网络技术有限公司 一种题目信息生成方法、装置及计算机存储介质
CN112308946B (zh) * 2020-11-09 2023-08-18 电子科技大学中山学院 题目生成方法、装置、电子设备及可读存储介质
CN112560593A (zh) * 2020-11-30 2021-03-26 宁波阶梯教育科技有限公司 一种课堂答题测评方法、设备和计算机存储介质
CN112579735B (zh) * 2020-12-09 2023-04-28 北京字节跳动网络技术有限公司 一种题目生成方法、装置、计算机设备及存储介质
CN112560443B (zh) * 2020-12-29 2022-11-29 平安银行股份有限公司 选择题生成模型训练方法、选择题生成方法、设备及介质
CN112863278B (zh) * 2021-02-09 2022-07-01 柳州智视科技有限公司 一种题目条件替换后的解题方法
CN113254591A (zh) * 2021-06-16 2021-08-13 北京世纪好未来教育科技有限公司 题目生成方法、装置、设备及存储介质
CN113807990A (zh) * 2021-09-27 2021-12-17 苏州思萃融合基建技术研究所有限公司 施工现场安全培训方法、系统、装置及存储介质
CN117494674A (zh) * 2023-11-15 2024-02-02 华中师范大学 一种基于已有习题改编的几何证明题自动生成方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006039353A (ja) * 2004-07-29 2006-02-09 Advanced Telecommunication Research Institute International 多肢選択言語試験問題自動作成装置およびコンピュータプログラム
JP2007248605A (ja) * 2006-03-14 2007-09-27 Fujitsu Support & Service Kk 試験問題作成方法、試験問題作成システムおよび試験問題作成プログラム
CN103150938A (zh) * 2013-03-14 2013-06-12 南京信息工程大学 一种自动出题方法
CN108182275A (zh) * 2018-01-24 2018-06-19 上海互教教育科技有限公司 一种数学变式训练题推送系统以及关联方法
CN109241534A (zh) * 2018-09-12 2019-01-18 重庆工业职业技术学院 一种基于文本ai学习的考题自动生成方法和装置
CN110175332A (zh) * 2019-06-03 2019-08-27 山东浪潮人工智能研究院有限公司 一种基于人工神经网络的智能出题方法及系统
CN110399495A (zh) * 2018-04-24 2019-11-01 中国移动通信集团有限公司 一种自动出题方法、系统以及计算机存储介质
CN110599838A (zh) * 2019-09-20 2019-12-20 北京猿力未来科技有限公司 一种数学自动出题方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006039353A (ja) * 2004-07-29 2006-02-09 Advanced Telecommunication Research Institute International 多肢選択言語試験問題自動作成装置およびコンピュータプログラム
JP2007248605A (ja) * 2006-03-14 2007-09-27 Fujitsu Support & Service Kk 試験問題作成方法、試験問題作成システムおよび試験問題作成プログラム
CN103150938A (zh) * 2013-03-14 2013-06-12 南京信息工程大学 一种自动出题方法
CN108182275A (zh) * 2018-01-24 2018-06-19 上海互教教育科技有限公司 一种数学变式训练题推送系统以及关联方法
CN110399495A (zh) * 2018-04-24 2019-11-01 中国移动通信集团有限公司 一种自动出题方法、系统以及计算机存储介质
CN109241534A (zh) * 2018-09-12 2019-01-18 重庆工业职业技术学院 一种基于文本ai学习的考题自动生成方法和装置
CN110175332A (zh) * 2019-06-03 2019-08-27 山东浪潮人工智能研究院有限公司 一种基于人工神经网络的智能出题方法及系统
CN110599838A (zh) * 2019-09-20 2019-12-20 北京猿力未来科技有限公司 一种数学自动出题方法及装置

Also Published As

Publication number Publication date
CN111353037A (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
CN111353037B (zh) 一种题目生成方法、装置以及计算机可读存储介质
CN108076154B (zh) 应用信息推荐方法、装置及存储介质和服务器
CN109271493A (zh) 一种语言文本处理方法、装置和存储介质
CN110008973B (zh) 一种模型训练方法、基于模型确定目标用户的方法及装置
CN107305578A (zh) 人机智能问答方法和装置
CN109241525B (zh) 关键词的提取方法、装置和系统
CN109472305A (zh) 答案质量确定模型训练方法、答案质量确定方法及装置
CN109218390A (zh) 用户筛选方法及装置
CN111400473A (zh) 意图识别模型的训练方法及装置、存储介质及电子设备
CN112183048A (zh) 一种自动解题方法、装置、计算机设备及存储介质
CN112188232A (zh) 一种视频生成、视频展示方法及装置
CN109408396A (zh) 软件质量评价方法、装置、设备及计算机可读存储介质
CN109190116A (zh) 语义解析方法、系统、电子设备及存储介质
CN111199421B (zh) 一种基于社交关系的用户推荐方法、装置及电子设备
CN112184505A (zh) 一种信息处理方法、装置及计算机存储介质
CN111062449A (zh) 预测模型的训练方法、兴趣度预测方法、装置和存储介质
CN116662495A (zh) 问答处理方法、训练问答处理模型的方法及装置
CN114528494A (zh) 一种信息推送方法、装置、设备及存储介质
Pušnik et al. Patterns for improving mobile user experience
CN114218377A (zh) 书籍推荐方法、电子设备及存储介质
CN112560500A (zh) 文本处理方法、装置、设备及存储介质
CN113468306A (zh) 语音对话方法、装置、电子设备及存储介质
CN112182200A (zh) 一种题目信息生成方法、装置及计算机存储介质
CN112541069A (zh) 一种结合关键词的文本匹配方法、系统、终端及存储介质
CN111949783A (zh) 知识库中问答结果生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Tiktok vision (Beijing) Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.