CN115600587A - 数学应用题生成系统、方法、智能终端及可读存储介质 - Google Patents

数学应用题生成系统、方法、智能终端及可读存储介质 Download PDF

Info

Publication number
CN115600587A
CN115600587A CN202211617742.XA CN202211617742A CN115600587A CN 115600587 A CN115600587 A CN 115600587A CN 202211617742 A CN202211617742 A CN 202211617742A CN 115600587 A CN115600587 A CN 115600587A
Authority
CN
China
Prior art keywords
word
term
description word
mathematical
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211617742.XA
Other languages
English (en)
Other versions
CN115600587B (zh
Inventor
洪日昌
秦伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Original Assignee
Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Artificial Intelligence of Hefei Comprehensive National Science Center filed Critical Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Priority to CN202211617742.XA priority Critical patent/CN115600587B/zh
Publication of CN115600587A publication Critical patent/CN115600587A/zh
Application granted granted Critical
Publication of CN115600587B publication Critical patent/CN115600587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种数学应用题生成系统、方法、智能终端及可读存储介质,属于电数字数据处理技术领域。所述系统包括:语言输入模块,用于接收输入的主题词和算式;主题词记忆检索模块,用于根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项;算式记忆检索模块,用于根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项;应用题生成模块,用于结合所述目标场景描述字词项和所述目标逻辑描述字词项以生成数学应用题。通过将本发明,能够生成场景描述丰富、逻辑描述与算式保持一致以及层次结构符合逻辑且灵活的数学应用题,大幅提升了设计数学应用题的效率、数量和质量,减少了人工出题的成本。

Description

数学应用题生成系统、方法、智能终端及可读存储介质
技术领域
本发明涉及电数字数据处理技术领域,尤其涉及一种数学应用题生成系统、方法、智能终端及计算机可读存储介质。
背景技术
数学应用题在教育领域中举足轻重,因为它们是学生们认识数学、提高对数学概念的理解及增强解决数学问题的有效途径。一个数学应用题通常由算式和问题组成,问题主要分为场景描述和逻辑描述。教育上通常是用不同的场景描述和相同的逻辑描述组成的多个数学应用题增强学生的数学问题解决能力,许多研究也证实了高质量的数学应用题能带来更好的教学成果。
就目前设计数学应用题的方式而言,主要分为人工出题和机器出题,对于人为设计应用题而言,不但耗费的精力多、花销大,而且出题质量也高度依赖于出题人。对于机器设计应用题而言,往往是基于预定义的文本模板自动地生成数学应用题,但由于文本模板比较地固定。所以设计出的应用题较为单调有限,难以保证多样性,且叙述方式僵化不生动,更加欠缺出题质量。
发明内容
本发明的主要目的在于提供一种数学应用题生成系统、方法、智能终端及计算机可读存储介质,旨在解决设计数学应用题成本高以及设计的数学应用题质量偏低的技术问题。
为实现上述目的,本发明提供一种数学应用题生成系统,所述数学应用题生成系统包括:
语言输入模块,用于接收输入的主题词和算式;
主题词记忆检索模块,用于根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项;
算式记忆检索模块,用于根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项;
应用题生成模块,用于结合所述目标场景描述字词项和所述目标逻辑描述字词项以生成数学应用题。
可选地,所述场景描述字词训练集表征名词词性的字词训练数据;所述逻辑描述字词训练集表征动词词性的字词训练数据、副词词性的字词训练数据和介词词性的字词训练数据。
可选地,所述应用题生成模块,还用于结合所述主题词、所述目标场景描述字词项和所述算式以及经过预设的交叉注意力机制调整后的所述目标逻辑描述字词项以生成数学应用题。
可选地,所述主题词记忆检索模块,还用于通过以下第一相关性公式检索确定所述场景描述字词训练集中与所述主题词匹配相关的目标场景描述字词项:
Figure 392514DEST_PATH_IMAGE001
其中,在所述第一相关性公式中:
Figure 993260DEST_PATH_IMAGE002
Figure 394286DEST_PATH_IMAGE003
其中,
Figure 676362DEST_PATH_IMAGE004
表征所述场景描述字词训练集中的各个场景描述字词项
Figure 846444DEST_PATH_IMAGE005
与所述主题词
Figure 618091DEST_PATH_IMAGE006
之间匹配相关性得分;
Figure 506412DEST_PATH_IMAGE007
表征所述主题词
Figure 326601DEST_PATH_IMAGE006
对应的归一化 编码函数;
Figure 613838DEST_PATH_IMAGE008
表征所述场景描述字词项
Figure 494069DEST_PATH_IMAGE005
对应的归一化编码函数;
Figure 869687DEST_PATH_IMAGE009
Figure 555883DEST_PATH_IMAGE010
分别表征所述主题词
Figure 700557DEST_PATH_IMAGE006
的线性投影矩阵和所述场景描述字词项
Figure 751689DEST_PATH_IMAGE005
的线性投影矩 阵,都用于降低所述系统中特征的维度;
Figure 614603DEST_PATH_IMAGE011
表征变换器模型对所述主题词
Figure 838911DEST_PATH_IMAGE006
进行编码的 函数;
Figure 103670DEST_PATH_IMAGE012
表征变换器模型对所述场景描述字词项
Figure 60125DEST_PATH_IMAGE005
进行编码的函数,函数
Figure 407405DEST_PATH_IMAGE013
用于将 所述系统中任意向量归一化为单位向量以及调节各个所述场景描述字词项
Figure 373087DEST_PATH_IMAGE005
与所述主 题词
Figure 554670DEST_PATH_IMAGE006
之间匹配相关性得分的范围。
可选地,所述算式记忆检索模块,还用于通过以下第二相关性公式检索确定所述逻辑描述字词训练集中与所述算式匹配相关的目标逻辑描述字词项:
Figure 947605DEST_PATH_IMAGE014
其中,在所述第二相关性公式中:
Figure 519532DEST_PATH_IMAGE015
Figure 23325DEST_PATH_IMAGE016
其中,
Figure 262677DEST_PATH_IMAGE017
表征所述逻辑描述字词训练集中的各个逻辑描述字词项
Figure 888830DEST_PATH_IMAGE018
与所述算式
Figure 948053DEST_PATH_IMAGE019
之间匹配相关性得分;
Figure 255538DEST_PATH_IMAGE020
表征所述算式
Figure 346466DEST_PATH_IMAGE019
对应的归一化编码函数;
Figure 81204DEST_PATH_IMAGE021
表征所述逻辑描述字词项
Figure 627723DEST_PATH_IMAGE018
对应的归一化编码函数;
Figure 535636DEST_PATH_IMAGE022
Figure 484000DEST_PATH_IMAGE023
分别表征 所述算式
Figure 389639DEST_PATH_IMAGE019
的线性投影矩阵和所述逻辑描述字词项
Figure 423455DEST_PATH_IMAGE018
的线性投影矩阵,都用于降低所 述系统中特征的维度;
Figure 72742DEST_PATH_IMAGE024
表征门控循环单元结构模型对所述算式
Figure 937930DEST_PATH_IMAGE019
进行编码的函数;
Figure 14470DEST_PATH_IMAGE025
表征变换器模型对所述逻辑描述字词项
Figure 532651DEST_PATH_IMAGE018
进行编码的函数,函数
Figure 985630DEST_PATH_IMAGE013
用于将所述 系统中任意向量归一化为单位向量以及调节各个所述逻辑描述字词项
Figure 643007DEST_PATH_IMAGE018
与所述算式
Figure 952766DEST_PATH_IMAGE019
之间匹配相关性得分的范围。
可选地,所述应用题生成模块包括:
场景描述字词编码器,用于对所述主题词和所述目标场景描述字词项进行编码以得到场景编码;
算式编码器,用于对所述算式进行编码以得到算式编码;
逻辑描述字词编码器,用于对所述目标逻辑描述字词项进行编码以得到逻辑编码;
场景-算式融合编码器,用于对所述场景编码和所述算式编码进行融合编码为场景-算式编码;
应用题解码器,用于对所述场景-算式编码和逻辑编码进行解码以生成数学应用题。
可选地,所述场景描述字词编码器、所述逻辑描述字词编码器以及所述场景-算式融合编码器都为变换器编码器;所述算式编码器为门控循环单元结构模型编码器。
此外,为实现上述目的,本发明还提供一种数学应用题生成方法,所述数学应用题生成方法应用于如上所述的数学应用题生成系统,所述方法包括以下步骤:
接收输入的主题词和算式;
根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项;
根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项;
结合所述目标场景描述字词项和所述目标逻辑描述字词项以生成数学应用题。
此外,为实现上述目的,本发明还提供一种智能终端,包括处理器、存储器、以及存储在所述存储器上的可被所述处理器执行的数学应用题生成程序,其中,所述数学应用题生成程序被所述处理器执行时,实现如上所述的数学应用题生成方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数学应用题生成程序,其中,所述数学应用题生成程序被处理器执行时,实现如上所述的数学应用题生成方法的步骤。
本发明技术方案中的数学应用题生成系统,包括:语言输入模块,用于接收输入的主题词和算式;主题词记忆检索模块,用于根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项;算式记忆检索模块,用于根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项;应用题生成模块,用于结合所述目标场景描述字词项和所述目标逻辑描述字词项以生成数学应用题。本发明解决了设计数学应用题成本高以及设计的数学应用题质量不高的技术问题。
核心地,本发明可以使得用户根据相应的数学应用题设计需求,将一些应用题的主题词和算式输入到数学应用题生成系统,由语言输入模块接收之后分别通过解耦合式的主题词记忆检索模块对预设在所述系统中场景描述字词训练集检索得到与主题词比较相关的一个或多个目标场景描述字词项,通过解耦合式的算式记忆检索模块对预设在所述系统中的逻辑描述字词训练集检索得到与算式比较相关的一个或多个目标逻辑描述字词项,将得到的各个目标场景描述字词项和各个目标逻辑描述字词项通过应用题生成模块进行组合就能够生成场景描述丰富、逻辑描述与算式保持一致以及层次结构符合逻辑且灵活的多个应用题,大幅提升了设计数学应用题的效率、数量和质量,减少了人工出题的成本,本发明将场景描述字词和逻辑描述字词基于不同记忆检索模块分开进行处理,所以也不会使得场景描述和逻辑描述混在一起因随意匹配形成内容描述混乱的数学应用题,以人工智能与数学应用题相结合,通过深度学习的方式实现了代替人工出题和代替传统机器使用文本模板出题的功能,具有广阔的应用前景。
附图说明
图1为本发明实施例方案涉及的智能终端的硬件运行环境的结构示意图;
图2为为本发明数学应用题生成系统的框架结构示意图;
图3为本发明数学应用题生成系统涉及的主题词记忆检索模块示意图;
图4为本发明数学应用题生成系统涉及的算式记忆检索模块示意图;
图5为本发明数学应用题生成系统涉及的应用题生成模块示意图;
图6为本发明数学应用题生成系统涉及的数学应用题生成模型整体结构示意图;
图7为本发明数学应用题生成系统涉及的训练样本示意图;
图8为本发明数学应用题生成方法第一实施例的流程示意图。
附图标号说明:
Figure 961173DEST_PATH_IMAGE026
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提出一种智能终端,该智能终端可以为各种计算机设备,比如个人计算机、工业计算机、工作站等。
如图1所示,图1是本发明实施例方案涉及的智能终端的硬件运行环境的结构示意图。
如图1所示,该智能终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示器(Display)、输入单元比如控制面板,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WIFI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。作为一种计算机存储介质的存储器1005中可以包括数学应用题生成程序。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、用户接口模块、网络通信模块以及数学应用题生成程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的数学应用题生成程序,并执行以下各个实施例中的步骤。
基于上述智能终端的硬件结构,提出本发明数学应用题生成系统的各个实施例。
本发明实施例提供一种数学应用题生成系统。
请参照图2,图2为本发明数学应用题生成系统框架结构示意图;在本发明第一实施例中,所述数学应用题生成系统应用于智能终端;所述系统包括:
语言输入模块1,用于接收输入的主题词和算式;
在本实施例中,数学应用题生成系统可以基于训练好的数学应用题生成模型来实现自动地生成数学应用题,为了便于理解,可以将数学应用题生成系统和数学应用题生成模型作为同一概念。
其中的主题词(关键词)指的是数学应用题所需要的各种词汇,包括场景描述字词和逻辑描述字词。比如数学应用题:“果园有5棵梨树,苹果树比梨树多3棵,问果园里共有多少棵苹果树”中除数字3、5和量词“棵”以外的其他字词都可以作为主题词。其中的名词可以作为场景描述字词,动词、副词、介词、连接词等其他词性的可以作为逻辑描述字词其中的算式也就是数学应用题所需要的各种公式。
其中的语言输入模块1既可以用于分别接收用户或设备输入的主题词和算式,也可以接收输入的一整段包括主题词和算式在内的文本,语言输入模块1可以包括主题词输入模块和算式输入模块,用户可以基于不同的输入模块进行分别输入,用户也可以输入一整段包括主题词和算式在内的文本,比如输入一整个现有的数学应用题,通过TF-IDF(termfrequency–inverse document frequency,词频-逆向文件频率)方法来区分文本中的主题词和算式,进而将主题词和算式分别分配到主题词输入模块和算式输入模块。
主题词记忆检索模块2,用于根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项;
对于本实施例中包括主题词记忆检索模块2和算式记忆检索模块3在内的记忆检索模块,主要用于对自然语言的处理,可以记录大量的自然语言文本训练数据。
对于主题词记忆检索模块2,在接收到来自语言输入模块1传递的主题词时,从主题词记忆检索模块2中存储的预设的场景描述字词训练集中检索得到与主题词比较相关的各个目标场景描述字词项。
算式记忆检索模块3,用于根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项;
对于算式记忆检索模块3,在接收到来自语言输入模块1传递的算式时,从算式记忆检索模块3中存储的预设的逻辑描述字词训练集中检索得到与算式比较相关的各个目标逻辑描述字词项。
在检索得到各个目标场景描述字词项和各个目标逻辑描述字词项之前,也是在主题词记忆检索模块2存储场景描述字词训练集和算式记忆检索模块3存储逻辑描述字词训练集之前,还包括对数据预处理进行解耦合确定场景描述字词训练集和逻辑描述字词训练集的过程:
将用于训练的数学应用题训练集
Figure 952263DEST_PATH_IMAGE027
分为逻辑描述的词对应的逻辑描述字词 训练集
Figure 729726DEST_PATH_IMAGE028
和场景描述的词对应的场景描述字词训练集
Figure 148069DEST_PATH_IMAGE029
,并把它们分别存进算 式记忆检索模块3中的LDM(logical description memory,逻辑描述记忆)和主题词记忆检 索模块2中的SDM(scenario description memory,场景描述记忆)中。其中,场景描述字词 训练集中的各项场景描述词可以为名词,逻辑描述字词训练集中的各项逻辑描述词则可以 为动词、副词、连接词和介词,因此,可以使用TF-IDF的方法来分出它们。提取数学应用题训 练集的第i个训练句子
Figure 706089DEST_PATH_IMAGE030
的名词作为场景描述词,除名词、数字、量词之外的词为逻辑描述 词,并将场景描述词和逻辑描述词分别归类放入场景描述字词训练集SDM(
Figure 235291DEST_PATH_IMAGE031
)和逻辑描 述字词训练集LDM(
Figure 887768DEST_PATH_IMAGE032
)中。
为了更加便于清楚地理解上述预处理解耦合(去耦合)的过程,可以参照图7,图7为本发明数学应用题生成系统涉及的训练样本示意图;如图所示,数学应用题的训练样本包括:
(一):果园有N0棵梨树,苹果树比梨树多N1棵。问果园里共有多少棵苹果树。在经过去耦合之后得到存入场景描述记忆中的场景描述词可以包括“梨树”、“苹果树”、“果园”等名词词性的字词,存入逻辑描述记忆中的逻辑描述词可以包括“有”、“比”、“多”、“共有”“多少”等不为名词、数字和量词其它词性的字词。
(二):学校有N0个女生,男生的数量是女生的N1倍。问一共有多少学生。在经过去耦合之后得到存入场景描述记忆中的场景描述词可以包括学校,男生,女生,学生等名词词性的字词,存入逻辑描述记忆中的逻辑描述词可以包括“的“数量”是”等不为名词、数字和量词其它词性的字词。
通过本实施例中的主题词记忆检索模块2和算式记忆检索模块3,能够将各个数学应用题的训练集(训练样本)进行解耦合,分别对场景描述词和逻辑描述词进行处理,从而防止当需要生成关于场景描述的词时,记忆检索模块带来的额外输入包含逻辑描述,当需要生成关于逻辑描述的词时,记忆检索模块带来的额外输入包含场景描述,避免最终生成数学应用题结果因随意组合样本中不同词性的字词造成数学应用题描述不准逻辑不通的问题。
在一实施例中,对于主题词记忆检索模块2如何根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项,包括:
主题词记忆检索模块2,还用于通过以下第一相关性公式检索确定所述场景描述字词训练集中与所述主题词匹配相关的目标场景描述字词项:
Figure 742592DEST_PATH_IMAGE001
其中,在所述第一相关性公式中:
Figure 460012DEST_PATH_IMAGE002
Figure 792904DEST_PATH_IMAGE003
其中,
Figure 607276DEST_PATH_IMAGE004
表征所述场景描述字词训练集中的各个场景描述字词项
Figure 367422DEST_PATH_IMAGE005
与所述主题词
Figure 572138DEST_PATH_IMAGE006
之间匹配相关性得分;
Figure 708722DEST_PATH_IMAGE007
表征所述主题词
Figure 315283DEST_PATH_IMAGE006
对应的归一化 编码函数;
Figure 308647DEST_PATH_IMAGE008
表征所述场景描述字词项
Figure 997730DEST_PATH_IMAGE005
对应的归一化编码函数;
Figure 672425DEST_PATH_IMAGE009
Figure 133493DEST_PATH_IMAGE010
分别表征所述主题词
Figure 501021DEST_PATH_IMAGE006
的线性投影矩阵和所述场景描述字词项
Figure 742646DEST_PATH_IMAGE005
的线性投影矩 阵,都用于降低所述系统中特征的维度;
Figure 955453DEST_PATH_IMAGE011
表征变换器模型对所述主题词
Figure 536607DEST_PATH_IMAGE006
进行编码的 函数;
Figure 809456DEST_PATH_IMAGE012
表征变换器模型对所述场景描述字词项
Figure 476061DEST_PATH_IMAGE005
进行编码的函数,函数
Figure 489629DEST_PATH_IMAGE013
用于将 所述系统中任意向量归一化为单位向量以及调节各个所述场景描述字词项
Figure 987606DEST_PATH_IMAGE005
与所述主 题词
Figure 696936DEST_PATH_IMAGE006
之间匹配相关性得分的范围。
在该实施例中,使用作为输入的主题词
Figure 585258DEST_PATH_IMAGE006
生成的query(查询)检索SDM,就会得到
Figure 405447DEST_PATH_IMAGE033
个与主题词最相关的SDM项
Figure 757930DEST_PATH_IMAGE034
(也可以表示为
Figure 638162DEST_PATH_IMAGE005
),也即目标场景描述字词 项。
为了进一步理解上述过程,可以参照图3,图3为本发明数学应用题生成系统涉及 的主题词记忆检索模块2示意图;如图所示,基于主题词的检索模块即主题词记忆检索模块 2,其中包括了基于Transformer(变换器)的编码器ENCtw,和基于Transformer的编码器 ENCsdm,在场景描述记忆(SDM)中,包括了各个场景描述字词项
Figure 13779DEST_PATH_IMAGE035
,也即场景描 述词,其中的相关记忆项就是目标场景描述字词项,也可以表示为
Figure 372080DEST_PATH_IMAGE035
其中的编码器ENCtw用于对输入的主题词进行编码,编码器ENCsdm用于对场景描述 字词训练集中的各个场景描述字词项进行编码,该场景描述字词训练集在场景描述记忆 中;编码器ENCtw和编码器ENCsdm分别进行编码之后将编码后的主题词
Figure 782332DEST_PATH_IMAGE006
和编码之后的场景 描述字词项
Figure 830535DEST_PATH_IMAGE005
通过上述的第一相关性公式确定两者之间内积相似度,也即各个场景描 述字词项
Figure 755766DEST_PATH_IMAGE005
与所述主题词
Figure 917757DEST_PATH_IMAGE006
之间匹配相关性得分,在相关性得分处于或大于预设的匹 配相关性得分的范围时认为两者相关,否则则不相关,以此来确定较为相关的目标场景描 述字词项。
在另一实施例中,对于算式记忆检索模块3如何根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项,包括:
所述算式记忆检索模块3,还用于通过以下第二相关性公式检索确定所述逻辑描述字词训练集中与所述算式匹配相关的目标逻辑描述字词项:
Figure 916937DEST_PATH_IMAGE014
其中,在所述第二相关性公式中:
Figure 138971DEST_PATH_IMAGE015
Figure 551498DEST_PATH_IMAGE016
其中,
Figure 517180DEST_PATH_IMAGE017
表征所述逻辑描述字词训练集中的各个逻辑描述字词项
Figure 636445DEST_PATH_IMAGE018
与所述算式
Figure 763801DEST_PATH_IMAGE019
之间匹配相关性得分;
Figure 601307DEST_PATH_IMAGE020
表征所述算式
Figure 102171DEST_PATH_IMAGE019
对应的归一化编码函数;
Figure 403840DEST_PATH_IMAGE021
表征所述逻辑描述字词项
Figure 702097DEST_PATH_IMAGE018
对应的归一化编码函数;
Figure 26899DEST_PATH_IMAGE022
Figure 334384DEST_PATH_IMAGE023
分别表征 所述算式
Figure 162662DEST_PATH_IMAGE019
对应特征的线性投影矩阵和所述逻辑描述字词项
Figure 959717DEST_PATH_IMAGE018
对应特征的线性投影矩 阵,都用于降低所述系统中特征的维度;
Figure 506236DEST_PATH_IMAGE024
表征门控循环单元结构模型对所述算式
Figure 617412DEST_PATH_IMAGE019
进行编码的函数;
Figure 565776DEST_PATH_IMAGE025
表征变换器模型对所述逻辑描述字词项
Figure 468485DEST_PATH_IMAGE018
进行编码的函数,函数
Figure 564617DEST_PATH_IMAGE013
用于将所述系统中任意向量归一化为单位向量以及调节各个所述逻辑描述字词项
Figure 213905DEST_PATH_IMAGE018
与所述算式
Figure 16776DEST_PATH_IMAGE019
之间匹配相关性得分的范围。
在该实施例中,与上述实施例同理,使用作为输入的算式
Figure 93316DEST_PATH_IMAGE019
生成的query(查询)检 索LDM,就会得到
Figure 614427DEST_PATH_IMAGE036
个与算式最相关的LDM项
Figure 864143DEST_PATH_IMAGE037
(也可以表示为
Figure 787100DEST_PATH_IMAGE018
),也即目标逻 辑描述字词项。
为了进一步理解上述过程,可以参照图4,图4为本发明数学应用题生成系统涉及 的算式记忆检索模块3示意图;如图所示,基于算式的检索模块即算式记忆检索模块3,其中 包括了基于GRU(Gate Recurrent Unit,门控循环单元)模型的编码器ENCeq(此处使用基于 GRU编码器在实验结果上优于基于Transformer的编码器)和基于Transformer的编码器 ENCldm,在逻辑描述记忆(LDM)中,包括了各个逻辑描述字词项
Figure 34541DEST_PATH_IMAGE038
,也即逻辑描 述词,其中的相关记忆项就是目标逻辑描述字词项,也可以表示为
Figure 42949DEST_PATH_IMAGE038
其中的编码器ENCeq用于对输入的算式(公式)进行编码,编码器ENCldm用于对逻辑 描述字词训练集中各个逻辑描述字词项进行编码,该逻辑描述字词训练集在逻辑描述记忆 中;编码器ENCeq和编码器ENCldm分别进行编码之后将编码后的算式
Figure 31109DEST_PATH_IMAGE019
和编码之后的逻辑描 述字词项
Figure 870889DEST_PATH_IMAGE018
通过上述的第二相关性公式确定两者之间内积相似度,也即各个逻辑描述字 词项
Figure 289232DEST_PATH_IMAGE018
与所述算式
Figure 519356DEST_PATH_IMAGE019
之间匹配相关性得分,在相关性得分处于或大于预设的匹配相关 性得分的范围时认为两者相关,否则则不相关,以此来确定较为相关的目标逻辑描述字词 项。
应用题生成模块4,用于结合所述目标场景描述字词项和所述目标逻辑描述字词项以生成数学应用题。
可以将目标场景描述字词项和目标逻辑描述字词项通过不同的编码器编码组合之后再解码生成数学应用题。
在一实施例中,所述应用题生成模块4包括:
场景描述字词编码器,用于对所述主题词和所述目标场景描述字词项进行编码以得到场景编码;
算式编码器,用于对所述算式进行编码以得到算式编码;
逻辑描述字词编码器,用于对所述目标逻辑描述字词项进行编码以得到逻辑编码;
场景-算式融合编码器,用于对所述场景编码和所述算式编码进行融合编码为场景-算式编码;
应用题解码器,用于对所述场景-算式编码和逻辑编码进行解码以生成数学应用题。
其中的所述场景描述字词编码器、所述逻辑描述字词编码器以及所述场景-算式融合编码器都为变换器编码器;所述算式编码器为门控循环单元结构模型编码器。
在该实施例中,请参照图5,图5为本发明数学应用题生成系统涉及的应用题生成 模块4示意图;如图所示,在生成模块中,即应用题生成模块4中,包括有基于Transformer的 场景描述字词编码器
Figure 314137DEST_PATH_IMAGE039
,基于Transformer的逻辑描述字词编码器
Figure 946106DEST_PATH_IMAGE040
(也可以表示为
Figure 597667DEST_PATH_IMAGE041
Figure 580667DEST_PATH_IMAGE042
)、基于GRU的算式编码器GRU、基于Transformer的场景-算式融合编码器
Figure 913559DEST_PATH_IMAGE043
,解 码器,以及输出模块,用于输出数学应用题结果
Figure 400035DEST_PATH_IMAGE044
其中的编码器
Figure 422830DEST_PATH_IMAGE039
用于对来自语言输入模块1的主题词
Figure 627547DEST_PATH_IMAGE006
以及检索得到的目标场 景描述字词项进行编码,并将编码后的结果数据场景编码传递到编码器
Figure 826447DEST_PATH_IMAGE043
中;其中的 编码器GRU用于来自语言输入模块1的算式
Figure 167430DEST_PATH_IMAGE019
进行编码,并将编码后的结果数据算式编码 传递到编码器
Figure 364056DEST_PATH_IMAGE043
中;其中的编码器
Figure 56068DEST_PATH_IMAGE040
用于对检索得到的目标逻辑描述字词项进行编 码,并将编码后的结果数据逻辑编码传递到解码器中;其中的编码器
Figure 730763DEST_PATH_IMAGE043
用于对场景编 码和算式编码进行融合编码得到场景-算式编码,并将场景-算式编码与逻辑编码在解码器 中进行结合解码并进一步输出最终的数学应用题。
为了进一步理解上述应用题生成模块4的内部在数据、函数以及特征方面的实现 过程,可以将生成模块当成一个如下的概率模型:
Figure 191832DEST_PATH_IMAGE045
,这里的各个参数所表达的含义在上文中已经提到,在此不再赘述。需要说补充说 明的是,其中的函数
Figure 621676DEST_PATH_IMAGE046
()同上述的函数
Figure 535405DEST_PATH_IMAGE047
()。
由于检索出来的场景描述字词项
Figure 846799DEST_PATH_IMAGE034
是没有结构的名词,可以直接用于增 强扩充主题词
Figure 427953DEST_PATH_IMAGE006
。但是检索出来的逻辑描述字词项
Figure 700802DEST_PATH_IMAGE037
含有运算逻辑在内的结构信 息,因此通过交叉注意力机制将检索到的逻辑描述复制到生成模块中。
编码器把原始输入和从解耦合式的记忆检索模块获取的
Figure 429724DEST_PATH_IMAGE034
Figure 446222DEST_PATH_IMAGE037
编码为各种表征(表征指的是上述的场景编码、算式编码、场景-算式编码以及逻辑编码), 公式分别如下:
Figure 881882DEST_PATH_IMAGE048
Figure 325633DEST_PATH_IMAGE049
Figure 479534DEST_PATH_IMAGE050
Figure 299722DEST_PATH_IMAGE051
其中Transformer的编码器
Figure 652206DEST_PATH_IMAGE039
把主题词和从SDM搜索的结果
Figure 529508DEST_PATH_IMAGE034
编码为表 征场景编码
Figure 905125DEST_PATH_IMAGE052
。GRU编码器把算式编码为表征算式编码
Figure 263426DEST_PATH_IMAGE053
。基于Transformer的编码器
Figure 673678DEST_PATH_IMAGE054
Figure 521549DEST_PATH_IMAGE052
Figure 384462DEST_PATH_IMAGE053
融合起来编码为场景-算式编码
Figure 546453DEST_PATH_IMAGE055
。基于Transformer的编码器
Figure 811213DEST_PATH_IMAGE042
把每 一个从基于LDM搜索的结果
Figure 33247DEST_PATH_IMAGE018
分别编码为
Figure 445773DEST_PATH_IMAGE056
,它们组成的集合为
Figure 142946DEST_PATH_IMAGE057
Figure 262212DEST_PATH_IMAGE058
Figure 655147DEST_PATH_IMAGE018
的长度。
其中生成模块中的应用题解码器(以下简称编码器)可以看成一个概率模型:
Figure 554970DEST_PATH_IMAGE059
解码器以自回归的方式产生一个输出序列
Figure 58764DEST_PATH_IMAGE044
。每一个时间步长t,解码器都会注意 来自编码器的
Figure 32536DEST_PATH_IMAGE055
、已预测的序列
Figure 596373DEST_PATH_IMAGE060
,输出一个隐藏状态
Figure 921175DEST_PATH_IMAGE061
。隐藏状态
Figure 25397DEST_PATH_IMAGE061
会通过线性投影然 后进行softmax函数处理最终被传递到下一个词的预测,解码器所用公式如下:
Figure 119255DEST_PATH_IMAGE062
,其中的
Figure 851063DEST_PATH_IMAGE063
表征偏差项,
Figure 397582DEST_PATH_IMAGE064
为隐藏状态
Figure 508758DEST_PATH_IMAGE061
对应的维度转换 矩阵,可以根据实际需要进行设定或训练得到。
此外,在一实施例中,为了进一步提高逻辑描述字词项与算式之间的相关性,得到 描述更为准确可靠的数学应用题,解码器还用于计算预设的逻辑描述字词训练集(LDM)中 所有逻辑描述字词项
Figure 519439DEST_PATH_IMAGE018
对应的token(标记,也即计算机可读取的逻辑表述字词项)的特 征的交叉注意力,公式如下:
Figure 425078DEST_PATH_IMAGE065
Figure 458893DEST_PATH_IMAGE066
Figure 842601DEST_PATH_IMAGE067
表示第k个token和第j个来自LDM的结果(目标逻辑描述字词项)间的注意力分 数,举个例子,比如第j=1个数学应用题训练样本:果园有N0棵梨树,苹果树比梨树多N1棵。问 果园里共有多少棵苹果树。其中LDM中第j=1个的目标逻辑描述字词项包括有:“有”、“比”、 “多”、“共有”“多少”,对应的第k=1时的token为“有”,也即
Figure 911051DEST_PATH_IMAGE068
为“有”。
需要说明的是,这里的k的取值范围为[1,
Figure 987592DEST_PATH_IMAGE058
],如前文所述,
Figure 571020DEST_PATH_IMAGE058
Figure 755489DEST_PATH_IMAGE018
的长度。
Figure 678446DEST_PATH_IMAGE069
是memory embedding(记忆嵌入)的加权组合,
Figure 925887DEST_PATH_IMAGE070
Figure 996611DEST_PATH_IMAGE071
都为预设的维度转换矩 阵,都可训练得到。与简单记忆检索模块一样,在解码阶段交叉注意力会使用两次。通过 memory embedding的加权和来更新解码器的隐藏状态,将每个交叉注意力分数视为复制检 索到的记忆项的相应token的概率。因此,使用
Figure 987701DEST_PATH_IMAGE072
和memory embedding加权成的
Figure 765164DEST_PATH_IMAGE069
计算下一 个token的概率,计算公式如下:
Figure 183507DEST_PATH_IMAGE073
Figure 413631DEST_PATH_IMAGE074
是指示函数,
Figure 270729DEST_PATH_IMAGE075
是另一个前馈网络计算的门控变量。
与简单记忆检索模块一样,在注意力分数的偏置项里添加了LDM有关分数,所以公式重写为:
Figure 902699DEST_PATH_IMAGE076
这里的
Figure 489013DEST_PATH_IMAGE077
指的是检索到的第i个记忆项的第j个字符(token),β是可训练的标量, 用于控制相关性的权重分数,注意力分数的计算上没有SDM相关分数。一方面预训练了基于 主题词的模块的编码器,它检索能力已经足够了。另一方面,SDM 检索结果用于直接扩充输 入主题词,而不是通过交叉注意机制复制,所以不需要将 SDM 相关性添加到LDM的交叉注 意力。
为了从整体上理解本发明上述各个实施例,请参照图6,图6为本发明数学应用题 生成系统涉及的数学应用题生成模型整体结构示意图;图6也是上述图3、图4以及图5之间 组成的本发明数学应用题生成系统的整体,也可以认为是数学应用题生成模型整体。如图 所示,对于主题词记忆检索模块2和算式记忆检索模块3以及生成模块请分别参照上述对图 3、图4、图5的描述,至于三者的之间的内部关系,还需要说明的是:在语言输入模块1(图示 未标出)输入的主题词
Figure 472013DEST_PATH_IMAGE006
在主题词记忆检索模块2中的编码器
Figure 804905DEST_PATH_IMAGE078
进行编码,输入的算式
Figure 353698DEST_PATH_IMAGE019
在算式记忆检索模块3中的编码器
Figure 379423DEST_PATH_IMAGE079
进行编码,还在生成模块(应用题生成模块4)中 的编码器GRU中进行编码,对于上述两个记忆检索模块中的检索确定的相关记忆项:目标场 景描述字词项和目标逻辑描述字词项分别传递到生成模块中编码器
Figure 584139DEST_PATH_IMAGE039
和编码器
Figure 455143DEST_PATH_IMAGE040
中进 行编码。
在一实施例中,所述应用题生成模块4,还用于结合所述主题词、所述目标场景描述字词项和所述算式以及经过预设的交叉注意力机制调整后的所述目标逻辑描述字词项以生成数学应用题。
可以继续参照上述图6,可以看出,主题词
Figure 61705DEST_PATH_IMAGE006
、目标场景描述字词项
Figure 258331DEST_PATH_IMAGE005
、算式
Figure 747082DEST_PATH_IMAGE019
以及采用上述实施例中的交叉注意力机制调整后的所述目标逻辑描述字词项
Figure 684426DEST_PATH_IMAGE005
在经过 数学应用题生成模型编码之后再进行解码就得到了数学应用题
Figure 145494DEST_PATH_IMAGE044
在一实施例中,为了形成和实现本发明中的数学应用题生成系统(数学应用题生成模型),所述数学应用题生成系统的训练过程,包括:
在如下的负对数似然损失函数上使用SGD(Stochastic gradient descent,随机梯度下降)优化模型的参数。
Figure 247443DEST_PATH_IMAGE080
其中
Figure 426751DEST_PATH_IMAGE030
是生成的数学应用题。为了提高训练效率,通过使用交叉对齐任务预训练 解耦合式记忆检索模块中的四个编码器(上述两个记忆检索模块中编码器)来热启动记忆 检索模块。
关于SDM的预训练,从来自训练集的所有主题词和场景描述词对
Figure 967454DEST_PATH_IMAGE081
采 样,以
Figure 283029DEST_PATH_IMAGE082
表示主题词经由
Figure 821458DEST_PATH_IMAGE078
生成的表征,
Figure 222483DEST_PATH_IMAGE083
表示由场景词经由
Figure 504560DEST_PATH_IMAGE084
生成的表征。
Figure 2537DEST_PATH_IMAGE085
是表示相关分数的矩阵,每一行对应一个训练样例的主题词,每一 列对应一个SDM项的场景描述。当i=j时,任意
Figure 443358DEST_PATH_IMAGE086
对都应对齐,因此,损失函数应该 最大化沿矩阵对角线的分数并最小化其他分数,写为公式如下:
Figure 597259DEST_PATH_IMAGE087
关于LDM的预训练,从来自训练集的所有算式和逻辑描述词对
Figure 417448DEST_PATH_IMAGE088
采样, 以
Figure 707615DEST_PATH_IMAGE089
表示算式经由
Figure 322267DEST_PATH_IMAGE079
生成的表征,
Figure 760201DEST_PATH_IMAGE090
表示由逻辑描述词经由
Figure 384081DEST_PATH_IMAGE091
生 成的表征。
Figure 528754DEST_PATH_IMAGE092
是表示
Figure 579887DEST_PATH_IMAGE093
Figure 463308DEST_PATH_IMAGE094
相关性分数的矩阵。类似的,LDM的损失函数如下:
Figure 625299DEST_PATH_IMAGE095
通过该实施例的训练过程,能够训练得到本发明所需要的数学应用题生成模型,并且训练过程强调解耦合记忆检索,将逻辑描述和场景描述分别记录在不同的记忆检索模块,防止生成的数学应用题在描述上逻辑混乱描述不清的问题,降低了最终得到的数学应用题结果的误匹配,提高数学应用题的生成质量。
本发明数学应用题生成系统可以使得用户根据相应的数学应用题设计需求,将一些应用题的主题词和算式输入到数学应用题生成系统,由语言输入模块接收之后分别通过解耦合式的主题词记忆检索模块对预设在所述系统中场景描述字词训练集检索得到与主题词比较相关的一个或多个目标场景描述字词项,通过解耦合式的算式记忆检索模块对预设在所述系统中的逻辑描述字词训练集检所得到与算式比较相关的一个或多个目标逻辑描述字词项,将得到的各个目标场景描述字词项和各个目标逻辑描述字词项通过应用题生成模块进行组合就能够生成场景描述丰富、逻辑描述与算式保持一致以及层次结构符合逻辑且灵活的多个应用题,大幅提升了设计数学应用题的效率、数量和质量,减少了人工出题的成本,本发明将场景描述字词和逻辑描述字词基于不同记忆检索模块分开进行处理,所以也不会使得场景描述和逻辑描述混在一起因随意匹配形成内容描述混乱的数学应用题,以人工智能与数学应用题相结合,通过深度学习的方式实现了代替人工出题和代替传统机器使用文本模板出题的功能,具有广阔的应用前景。
请参照图8,图8为本发明数学应用题生成方法第一实施例的流程示意图;本发明还提出一种数学应用题生成方法,在本实施例中,所述数学应用题生成系统应用于上述各个实施例中的数学应用题生成系统;所述方法包括:
步骤S10,接收输入的主题词和算式;
步骤S20,根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项;
步骤S30,根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项;
步骤S40,结合所述目标场景描述字词项和所述目标逻辑描述字词项以生成数学应用题。
本实施例中数学应用题生成方法应用于本发明中的数学应用题生成系统,其各个步骤的具体展开和实现过程请参照上述数学应用题生成系统的各个实施例,在此不再赘述。
此外,本发明还提供一种计算机可读存储介质。本发明计算机可读存储介质上存储有数学应用题生成程序,其中,数学应用题生成程序被处理器执行时,实现如上述的数学应用题生成系统的步骤。
其中,数学应用题生成程序被执行时所实现的系统可参照本发明数学应用题生成系统的各个实施例,此处不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为系统、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的系统、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (10)

1.一种数学应用题生成系统,其特征在于,所述数学应用题生成系统包括:
语言输入模块,用于接收输入的主题词和算式;
主题词记忆检索模块,用于根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项;
算式记忆检索模块,用于根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项;
应用题生成模块,用于结合所述目标场景描述字词项和所述目标逻辑描述字词项以生成数学应用题。
2.如权利要求1所述的数学应用题生成系统,其特征在于,所述场景描述字词训练集表征名词词性的字词训练数据;所述逻辑描述字词训练集表征动词词性的字词训练数据、副词词性的字词训练数据和介词词性的字词训练数据。
3.如权利要求1所述的数学应用题生成系统,其特征在于,所述应用题生成模块,还用于结合所述主题词、所述目标场景描述字词项和所述算式以及经过预设的交叉注意力机制调整后的所述目标逻辑描述字词项以生成数学应用题。
4.如权利要求1所述的数学应用题生成系统,其特征在于,所述主题词记忆检索模块,还用于通过以下第一相关性公式检索确定所述场景描述字词训练集中与所述主题词匹配相关的目标场景描述字词项:
Figure 25465DEST_PATH_IMAGE001
其中,在所述第一相关性公式中:
Figure 44237DEST_PATH_IMAGE002
Figure 128867DEST_PATH_IMAGE003
其中,
Figure 156866DEST_PATH_IMAGE004
表征所述场景描述字词训练集中的各个场景描述字词项
Figure 476465DEST_PATH_IMAGE005
与 所述主题词
Figure 666138DEST_PATH_IMAGE006
之间匹配相关性得分;
Figure 503644DEST_PATH_IMAGE007
表征所述主题词
Figure 7437DEST_PATH_IMAGE006
对应的归一化编码函 数;
Figure 981209DEST_PATH_IMAGE008
表征所述场景描述字词项
Figure 748308DEST_PATH_IMAGE005
对应的归一化编码函数;
Figure 869848DEST_PATH_IMAGE009
Figure 177333DEST_PATH_IMAGE010
分别 表征所述主题词
Figure 67928DEST_PATH_IMAGE006
的线性投影矩阵和所述场景描述字词项
Figure 2999DEST_PATH_IMAGE005
的线性投影矩阵,都用于 降低所述系统中特征的维度;
Figure 549518DEST_PATH_IMAGE011
表征变换器模型对所述主题词
Figure 457431DEST_PATH_IMAGE006
进行编码的函数;
Figure 202533DEST_PATH_IMAGE012
表征变换器模型对所述场景描述字词项
Figure 311434DEST_PATH_IMAGE005
进行编码的函数,函数
Figure 141987DEST_PATH_IMAGE013
用于将所述系统 中任意向量归一化为单位向量以及调节各个所述场景描述字词项
Figure 994537DEST_PATH_IMAGE005
与所述主题词
Figure 125304DEST_PATH_IMAGE006
之 间匹配相关性得分的范围。
5.如权利要求1所述的数学应用题生成系统,其特征在于,所述算式记忆检索模块,还用于通过以下第二相关性公式检索确定所述逻辑描述字词训练集中与所述算式匹配相关的目标逻辑描述字词项:
Figure 201844DEST_PATH_IMAGE014
其中,在所述第二相关性公式中:
Figure 254114DEST_PATH_IMAGE015
Figure 907424DEST_PATH_IMAGE016
其中,
Figure 627119DEST_PATH_IMAGE017
表征所述逻辑描述字词训练集中的各个逻辑描述字词项
Figure 936877DEST_PATH_IMAGE018
与所 述算式
Figure 882968DEST_PATH_IMAGE019
之间匹配相关性得分;
Figure 874058DEST_PATH_IMAGE020
表征所述算式
Figure 448258DEST_PATH_IMAGE019
对应的归一化编码函数;
Figure 69864DEST_PATH_IMAGE021
表征所述逻辑描述字词项
Figure 627884DEST_PATH_IMAGE018
对应的归一化编码函数;
Figure 157085DEST_PATH_IMAGE022
Figure 54634DEST_PATH_IMAGE023
分别表征 所述算式
Figure 664386DEST_PATH_IMAGE019
对应特征的线性投影矩阵和所述逻辑描述字词项
Figure 381807DEST_PATH_IMAGE018
对应特征的线性投影矩 阵,都用于降低所述系统中特征的维度;
Figure 777016DEST_PATH_IMAGE024
表征门控循环单元结构模型对所述算式
Figure 325809DEST_PATH_IMAGE019
进行编码的函数;
Figure 289217DEST_PATH_IMAGE025
表征变换器模型对所述逻辑描述字词项
Figure 290671DEST_PATH_IMAGE018
进行编码的函数,函数
Figure 630517DEST_PATH_IMAGE013
用于将所述系统中任意向量归一化为单位向量以及调节各个所述逻辑描述字词项
Figure 237078DEST_PATH_IMAGE018
与所述算式
Figure 230442DEST_PATH_IMAGE019
之间匹配相关性得分的范围。
6.如权利要求1所述的数学应用题生成系统,其特征在于,所述应用题生成模块包括:
场景描述字词编码器,用于对所述主题词和所述目标场景描述字词项进行编码以得到场景编码;
算式编码器,用于对所述算式进行编码以得到算式编码;
逻辑描述字词编码器,用于对所述目标逻辑描述字词项进行编码以得到逻辑编码;
场景-算式融合编码器,用于对所述场景编码和所述算式编码进行融合编码为场景-算式编码;
应用题解码器,用于对所述场景-算式编码和逻辑编码进行解码以生成数学应用题。
7.如权利要求6所述的数学应用题生成系统,其特征在于,所述场景描述字词编码器、所述逻辑描述字词编码器以及所述场景-算式融合编码器都为变换器编码器;所述算式编码器为门控循环单元结构模型编码器。
8.一种数学应用题生成方法,其特征在于,所述数学应用题生成方法应用于如所述权利要求1中所述的数学应用题生成系统,所述方法包括以下步骤:
接收输入的主题词和算式;
根据所述主题词从预设的场景描述字词训练集中检索确定对应的目标场景描述字词项;
根据所述算式从预设的逻辑描述字词训练集中确定对应的目标逻辑描述字词项;
结合所述目标场景描述字词项和所述目标逻辑描述字词项以生成数学应用题。
9.一种智能终端,其特征在于,所述智能终端包括处理器、存储器、以及存储在所述存储器上的可被所述处理器执行的数学应用题生成程序,其中,所述数学应用题生成程序被所述处理器执行时,实现如权利要求8中所述数学应用题生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数学应用题生成程序,其中,所述数学应用题生成程序被处理器执行时,实现如权利要求8中所述的数学应用题生成方法的步骤。
CN202211617742.XA 2022-12-16 2022-12-16 数学应用题生成系统、方法、智能终端及可读存储介质 Active CN115600587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211617742.XA CN115600587B (zh) 2022-12-16 2022-12-16 数学应用题生成系统、方法、智能终端及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211617742.XA CN115600587B (zh) 2022-12-16 2022-12-16 数学应用题生成系统、方法、智能终端及可读存储介质

Publications (2)

Publication Number Publication Date
CN115600587A true CN115600587A (zh) 2023-01-13
CN115600587B CN115600587B (zh) 2023-04-07

Family

ID=84854115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211617742.XA Active CN115600587B (zh) 2022-12-16 2022-12-16 数学应用题生成系统、方法、智能终端及可读存储介质

Country Status (1)

Country Link
CN (1) CN115600587B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018060450A1 (en) * 2016-09-29 2018-04-05 Koninklijke Philips N.V. Question generation
CN108052492A (zh) * 2017-12-11 2018-05-18 上海启思教育科技服务有限公司 一种数学题目自动生成系统
US20190370389A1 (en) * 2018-05-31 2019-12-05 Applied Brain Research Inc. Methods and systems for generating and traversing discourse graphs using artificial neural networks
CN111414464A (zh) * 2019-05-27 2020-07-14 腾讯科技(深圳)有限公司 一种问题生成方法、装置、设备及存储介质
CN111428467A (zh) * 2020-02-19 2020-07-17 平安科技(深圳)有限公司 生成阅读理解的问题题目的方法、装置、设备及存储介质
CN112163405A (zh) * 2020-09-08 2021-01-01 北京百度网讯科技有限公司 问题的生成方法和装置
CN112287659A (zh) * 2019-07-15 2021-01-29 北京字节跳动网络技术有限公司 一种信息生成方法、装置、电子设备及存储介质
CN112487139A (zh) * 2020-11-27 2021-03-12 平安科技(深圳)有限公司 基于文本的自动出题方法、装置及计算机设备
CN113095045A (zh) * 2021-04-20 2021-07-09 河海大学 一种基于逆向操作的中文数学应用题数据增强方法
CN113204698A (zh) * 2021-05-31 2021-08-03 平安科技(深圳)有限公司 新闻主题词生成方法、装置、设备及介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018060450A1 (en) * 2016-09-29 2018-04-05 Koninklijke Philips N.V. Question generation
CN108052492A (zh) * 2017-12-11 2018-05-18 上海启思教育科技服务有限公司 一种数学题目自动生成系统
US20190370389A1 (en) * 2018-05-31 2019-12-05 Applied Brain Research Inc. Methods and systems for generating and traversing discourse graphs using artificial neural networks
CN111414464A (zh) * 2019-05-27 2020-07-14 腾讯科技(深圳)有限公司 一种问题生成方法、装置、设备及存储介质
CN112287659A (zh) * 2019-07-15 2021-01-29 北京字节跳动网络技术有限公司 一种信息生成方法、装置、电子设备及存储介质
CN111428467A (zh) * 2020-02-19 2020-07-17 平安科技(深圳)有限公司 生成阅读理解的问题题目的方法、装置、设备及存储介质
CN112163405A (zh) * 2020-09-08 2021-01-01 北京百度网讯科技有限公司 问题的生成方法和装置
CN112487139A (zh) * 2020-11-27 2021-03-12 平安科技(深圳)有限公司 基于文本的自动出题方法、装置及计算机设备
CN113095045A (zh) * 2021-04-20 2021-07-09 河海大学 一种基于逆向操作的中文数学应用题数据增强方法
CN113204698A (zh) * 2021-05-31 2021-08-03 平安科技(深圳)有限公司 新闻主题词生成方法、装置、设备及介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WEI QIN; HANWANG ZHANG; RICHANG HONG;: "Causal Interventional Training for Image Recognition", 《IEEE TRANSACTIONS ON MULTIMEDIA》 *
吴林静等: "基于依存句法的初等数学分层抽样应用题题意理解", 《计算机应用与软件》 *
黄振亚,刘淇: "面向学科题目的文本分析方法与应用研究综述", 《中文信息学报》 *

Also Published As

Publication number Publication date
CN115600587B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
Zhao et al. A survey of large language models
Liu et al. Tree-structured decoding for solving math word problems
Alomari et al. Deep reinforcement and transfer learning for abstractive text summarization: A review
Yin et al. Neural enquirer: Learning to query tables with natural language
CN108628935B (zh) 一种基于端到端记忆网络的问答方法
CN106484682A (zh) 基于统计的机器翻译方法、装置及电子设备
CN110795552A (zh) 一种训练样本生成方法、装置、电子设备及存储介质
CN111191002A (zh) 一种基于分层嵌入的神经代码搜索方法及装置
CN109582786B (zh) 一种基于自动编码的文本表示学习方法、系统及电子设备
CN113239169A (zh) 基于人工智能的回答生成方法、装置、设备及存储介质
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN111814451A (zh) 文本处理方法、装置、设备和存储介质
CN116662502A (zh) 基于检索增强的金融问答文本生成方法、设备及存储介质
CN116561251A (zh) 一种自然语言处理方法
CN116186216A (zh) 基于知识增强和双图交互的问题生成方法及系统
CN112417155B (zh) 基于指针-生成Seq2Seq模型的庭审询问生成方法、装置、介质
Nagatsuka et al. Length-based curriculum learning for efficient pre-training of language models
Assem et al. QASAR: self-supervised learning framework for extractive question answering
CN115600587B (zh) 数学应用题生成系统、方法、智能终端及可读存储介质
Bai et al. Gated character-aware convolutional neural network for effective automated essay scoring
CN113641789B (zh) 基于分层融合多头注意力网络和卷积网络的观点检索方法及系统
Suwarningsih et al. RoBERTa: language modelling in building Indonesian question-answering systems
De Kruijf et al. Training a Dutch (+ English) BERT model applicable for the legal domain
Xie et al. Match matrix aggregation enhanced transition-based neural network for sql parsing
Liang et al. Knowledge graph enhanced transformer for generative question answering tasks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant