CN111950701A

CN111950701A - 一种融合公式信息的数学题求解方法及系统

Info

Publication number: CN111950701A
Application number: CN202010668286.6A
Authority: CN
Inventors: 陈恩红; 黄振亚; 刘淇; 阴钰; 王皓; 高维博; 吴金泽
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2020-07-13
Filing date: 2020-07-13
Publication date: 2020-11-17
Anticipated expiration: 2040-07-13
Also published as: CN111950701B

Abstract

本申请公开了一种融合公式信息的数学题求解方法及系统，该方法利用以图为表示方法的公式结构来建模数学题目中公式特有的结构信息，并依据该公式依赖图，利用预先训练的公式图神经网络，获取公式依赖图中各个节点的表征向量，同时基于公式依赖图，将图中的文字映射为文字向量。然后利用双GRU以及融合字形网络结构FGN，将节点的表征向量和文字向量嵌入语义向量，在该过程中可使用嵌套序列模型捕获题目整体的文本语义和公式语义两方面的隐式表征，通过融入公式自身元素之间及多个公式之间的结构依赖关系，从而表示数学简答题的信息；最后基于所述语义向量，生成所述待处理数学题的答案序列，实现对包含公式信息的数学题的求解。

Description

一种融合公式信息的数学题求解方法及系统

技术领域

本申请设计计算机应用技术领域，更具体地说，设计一种融合公式信息的数学题求解方法及系统。

背景技术

在智能教育中，构建具有人类智能的数学题目解答器是一项具有挑战性的任务。

由于数学题目往往由复杂的自然语言和公式组成，因此求解数学题不仅要求算法具有对自然语言的语义理解能力，还要具备深层次数学公式的推理能力。

现有的方法主要针对数学应用题，即由自然语言本文和简单数字描述的一类基础数学题目，这些方法旨在将用自然语言描述的应用题目文本转化为可以计算求解的表达式。然而，这些工作只专注于探索如何让计算机理解应用题文本的语义，但无法解答更普遍的含有公式的数学简答题。由于数学简答题通常包含大量的公式，因此现有方法不能准确解答答案。

发明内容

为解决上述技术问题，本申请提供了一种融合公式信息的数学题求解方法及系统，以实现解决包含公式信息的数学题的目的。

为实现上述技术目的，本申请实施例提供了如下技术方案：

一种融合公式信息的数学题求解方法，包括：

获取待处理数学题，所述待处理数学题至少包括由文字和公式描述的题目；

对所述待处理数学题中的公式进行提取，并依据提取的公式建立公式依赖图，所述公式依赖图用于表征节点的关联关系，所述节点的属性类型包括所述公式中的变量、数字和运算符中的任意一种，所述节点的文本信息包括描述该节点的文本信息；

基于所述公式依赖图，利用公式图神经网络，将所述节点的文本信息和属性类型进行融合学习，以获得所述节点的表征向量，所述表征向量包括结构向量和文字向量，所述结构向量表征所述公式依赖图的结构，所述文字向量表征所述公式依赖图的文字；

利用嵌套的序列模型以及所述公式图神经网络中的融合字形结构，将所述节点的结构向量和所述文字向量嵌入语义向量，所述嵌套的序列模型包括第一门控循环单元和第二门控循环单元；

基于所述语义向量，生成所述待处理数学题的答案序列。

可选的，所述对所述待处理数学题中的公式进行提取，并依据提取的公式建立公式依赖图包括：

提取所述待处理数学题包含的公式；

将提取的所述公式转换为TEX代码格式，并将TEX代码格式的公式替换所述待处理数学题中的公式；

将每个所述TEX代码格式的公式中的变量、数字和运算符对象作为一个节点，并根据所述节点与其他节点的关联关系，构建所述公式依赖图；

所述关联关系包括兄弟关系、父亲关系、孩子关系、旁亲关系和自环关系中的任意一种，所述兄弟关系表示两个节点处于同一层级且相互关联，所述父亲关系表示所述节点处于另一节点的高层层级且相互关联，所述孩子关系表示所述节点处于另一节点的低层层级且相互关联，所述旁亲关系表示所述公式中相同变量之间的关联关系，所述自环关系表示所述节点指向节点本身。

可选的，所述基于所述公式依赖图，利用公式图神经网络，将所述节点的文本信息和属性类型进行融合学习，以获得所述节点的表征向量包括：

将所述公式依赖图表示为G＝{V,E,R}；其中，V和R分别表示点集和关系集，E表示所述公式依赖图中边的集合；(v_i,v_j,r)∈E表示一条从节点v_i到节点v_j的具有关系r∈R的边；

基于G＝{V,E,R}，所述公式图神经网络利用K个图卷积层学习所述节点的表征向量。

可选的，所述基于G＝{V,E,R}，所述公式图神经网络利用K个图卷积层学习每个节点v_i的表征向量包括：

所述公式图神经网络将第k+1层的每个节点v_i的向量表示为

其中，d表示预设的向量维度，R表示实数集，N_i表示所有指向节点v_i的入向邻居节点，AGGR(x)表示聚合器，用于聚合节点v_i的所有入向邻居节点的信息，ACT(x)表示全连接层，所述全连接层的激活函数为线性整流函数 ReLU(·)，表示向量连接操作，用于将节点v_i的邻居向量

和节点v_i在第k层的向量

连接。

可选的，所述聚合器包括：基本聚合器和注意力聚合器；

所述基本聚合器表示为：

其中，

表示待训练的参数，用于线性转换邻居节点传递的消息；

所述注意力聚合器表示为：

其中，

用于捕获节点v_i的邻居v_j本身传递的信息，α_ji表示权重计算函数，

用于不同关系的边的权重β_ji，γ∈[0,1]表示平衡因子；

其中，

和w^k∈R^b是待训练参数， σ(·)是非线性激活函数LeakyReLU，使用softmax函数对权值归一化处理；

其中，

表示与节点v_i存在关系r的相邻节点，MaxPool(.)表示最大池化函数。

可选的，所述利用嵌套的序列模型以及所述公式图神经网络中的融合字形结构，将所述节点的结构向量和所述文字向量嵌入语义向量包括：

利用三种向量对所述文字向量进行初始化，并对初始化后的文字向量连接起来经过全连接层，嵌入到维度为定长的文字表征向量中；所述三种向量包括随机向量、“独热码”向量和利用word2vec预训练的词向量；所述随机向量包括：

所述“独热码”向量包括：

所述利用word2vec 预训练的词向量包括：

利用所述第一门控循环单元更新所述向量序列中的文字表征向量，以获取所述文字表征向量的正向语义和反向语义；

利用所述第二门控循环单元更新所述向量序列中节点的结构向量，以获取所述结构向量的正向语义和反向语义，并利用所述公式图神经网络中的融合字形网络结构，将所述节点的表征向量嵌入所述语义向量；

分别对所述文字表征向量的正向语义和反向语义以及所述结构向量的正向语义和反向语义进行最大池化操作以聚集语义，以获得所述语义向量。

一种融合公式信息的数学题求解系统，包括：公式图构造模块、公式图网络模块和神经求解器模块；其中，

所述公式图构造模块，用于获取待处理数学题，所述待处理数学题至少包括由文字和公式描述的题目；对所述待处理数学题中的公式进行提取，并依据提取的公式建立公式依赖图，所述公式依赖图用于表征节点的关联关系，所述节点的属性类型包括所述公式中的变量、数字和运算符中的任意一种，所述节点的文本信息包括描述该节点的文字信息；

所述公式图网络模块，用于基于所述公式依赖图，利用公式图神经网络，将所述节点的文本信息和属性类型进行融合学习，以获得所述节点的表征向量，所述表征向量包括所述公式依赖图的结构与文本；

所述神经求解器模块，用于基于所述公式依赖图，将所述公式依赖图中的文字映射为文字向量；利用所述公式图神经网络中的融合字形网络结构，将所述节点的表征向量和所述文字向量嵌入语义向量；基于所述语义向量，生成所述待处理数学题的答案序列。

可选的，所述公式图构造模块对所述待处理数学题中的公式进行提取，并依据提取的公式建立公式依赖图的过程具体包括：

提取所述待处理数学题包含的公式；

可选的，所述公式图网络模块基于所述公式依赖图，利用公式图神经网络，将所述节点的文本信息和属性类型进行融合学习，以获得所述节点的表征向量，所述表征向量包括所述公式依赖图的结构与文本；的过程具体包括：

可选的，所述公式图网络模块基于G＝{V,E,R}，所述公式图神经网络利用 K个图卷积层学习每个节点v_i的表征向量的过程具体包括：

所述公式图神经网络将第k+1层的每个节点v_i的向量表示为

和节点v_i在第k层的向量

连接。

从上述技术方案可以看出，本申请实施例提供了一种融合公式信息的数学题求解方法及系统，其中，所述融合公式信息的数学题求解方法将待处理数学题转换为公式依赖图为表示方法的公式结构，即利用以图为表示方法的公式结构来建模数学题目中公式特有的结构信息，并依据该公式依赖图，利用预先训练的公式图神经网络，获取所述公式依赖图中各个节点的表征向量，同时基于所述公式依赖图，将所述公式依赖图中的文字映射为文字向量。然后利用嵌套的序列模型以及所述公式图神经网络中的融合字形结构，将所述节点的结构向量和所述文字向量嵌入语义向量，所述嵌套的序列模型包括第一门控循环单元和第二门控循环单元，在该过程中可使用嵌套序列模型捕获题目整体的文本语义和公式语义两方面的隐式表征，通过融入公式自身元素 (如：数字、变量、运算符)之间及多个公式之间的结构依赖关系，从而表示数学简答题的信息；最后基于所述语义向量，生成所述待处理数学题的答案序列，实现对包含公式信息的数学题的求解。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请的一个实施例提供的一种融合公式信息的数学题求解方法的流程示意图；

图2为本申请的一个实施例提供的一种数学题的示意图；

图3为本申请的一个实施例提供的一种提取公式并建立公式依赖图的示意图；

图4为本申请的一个实施例提供的一种基于Seq2Seq结构的神经模型的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供了一种融合公式信息的数学题求解方法，如图1所示，包括：

S101：获取待处理数学题，所述待处理数学题至少包括由文字和公式描述的题目；

参考图2，图2示出了两个待处理数学题的可行例子，图2中的问题1 (Problem 1)为：Solve-42×r+27×c＝-1167and 130×r+4×c＝372for r，答案 (Answer)为r＝4，即已知

求r，答案为r＝4。问题2 为：Let f(x)＝-x³-x².Let g(x)＝-2x.solve f(g(x))，答案为8x³-4x²。

S102：对所述待处理数学题中的公式进行提取，并依据提取的公式建立公式依赖图，所述公式依赖图用于表征节点的关联关系，所述节点的属性类型包括所述公式中的变量、数字和运算符中的任意一种，所述节点的文本信息包括描述该节点的文字信息；

具体地，所述节点的文本信息用于描述该节点中包含的文字具体是什么，例如，如果节点的属性类型为数字，那么节点中包含的数字“2”“3”等就是具体的文字信息。所述节点的属性类型包括但不限于变量、数字和运算符。

在本申请的一个实施例中，所述对所述待处理数学题中的公式进行提取，并依据提取的公式建立公式依赖图包括：

S1021：提取所述待处理数学题包含的公式；

对于数学简答题求解任务来说，其目的是根据题目内容表征其语义特征和内含的公式信息特征，从而进行深度推理，预测题目对应的答案。输入数学题目的题面文本P，假定每个token表示其中的一个汉字、单词或数学符号，那么可将数学题目P表示为由L个token组成的序列P＝{p₁,p₂,…,p_L}，其中p_i可以表示题目文本对应位置的字词或公式里的数字、数学符号(如“+”)等元素。由于每道题目里可能包含多个公式，则把每道题包含的M个公式集合表示为F＝{f₁,f₂,…,f_M}，f_i＝{p_i,…,p_j}其中(1≤i，j≤L)代表一个单独的公式。此外，题目的答案序列Y和题目P一样使用token定义的序列，表示为 Y＝{y₁,y₂,…,y_T}。题目中的token是指题目中文本的单位，每个token代表题目中的一个汉字、单词或者数学符号，对于中文来说，token可以表示单个汉字，对于英文来说，token表示一个单词，例如：

一个题目表示为：假设alpha为3，计算2+alpha。则转化为token序列为：假、设、alpha、3、计、算、2、+、alpha(顿号表示分隔符)。在该划分过程中，中文可以直接按照汉字划分或者按照分词工具划分，英文则以空格分割，可以直接按照空格将单词划分出来。

参考图3，图3中数学题(Problem)为：If

solve tan(2θ)，经过公式提取后，提取的公式包括

和tan(2θ)。

S1022：将提取的所述公式转换为TEX代码格式，并将TEX代码格式的公式替换所述待处理数学题中的公式；

TEX是指“基于宏的流行的文本格式化程序”，TEX代码是指遵循TEX 语法的代码，可以在TEX中编译执行，适用于处理复杂的数学公式。将公式转换为TEX代码有利于在处理过程中保持公式以通用的语言格式描述，不是一般性，且原始的公式以token序列表示，确实了公式的结构信息，而在TEX 代码格式的公式则可保留公式的结构信息，例如对于分式2/3，从TEX代码 (\frac{2}{3})中，可以直观地知道2是分子，3是分母。由于TEX代码格式的公式保留了公式的结构信息，才可以构造相应的公式依赖图。另外，TEX 代码很通用，所以将公式转成TEX代码再构造公式依赖图，会更加普适和科学，有利于满足更多人需求，具有实际应用价值。在构造公式依赖图中，首先把变量(如θ)、数字(如：2)和TEX运算符(如：tan)这些数学符号对象作为图中节点。相较于现有的TEX处理工具(如KaTex)，此工具过滤了大量的TEX用于注释排版的信息(如\begin{}等)，仅考虑了数学公式符号相关的信息元素，可以降低空间复杂度，提高公式信息的提取与处理效率。

S1023：将每个所述TEX代码格式的公式中的变量、数字和运算符对象作为一个节点，并根据所述节点与其他节点的关联关系，构建所述公式依赖图；

所述关联关系包括兄弟关系、父亲关系、孩子关系、旁亲关系和自环关系中的任意一种，所述兄弟关系表示两个节点处于同一层级且相互关联，所述父亲关系表示所述节点处于另一节点的高层层级且相互关联，所述孩子关系表示所述节点处于另一节点的低层层级且相互关联，所述旁亲关系表示所述公式中相同变量之间的关联关系，所述自环关系表示所述节点指向节点本身。在图3中，brother relation表示所述兄弟关系，fatherrelation表示所述父亲关系，child relation表示所述孩子关系，relative relation表示所述旁亲关系。

仍然参考图3，图3中节点V10和V11是节点V9的孩子，V9是它们的父亲，同时，不同公式之间也因有相同变量而存在庞亲关系，如本例中两个公式因均含有元素由V3和V11关联起来。最后为了增强公式依赖图的语义，为每个节点赋予了类型、文本含义等属性(图3，点V4的类型是运算符，其文本含义是“＝”)，表1为公式依赖图的节点属性类型表。

表1公式依赖图的节点属性类型表

S103：基于所述公式依赖图，利用公式图神经网络，将所述节点的文本信息和属性类型进行融合学习，以获得所述节点的表征向量，所述表征向量包括结构向量和文字向量，所述结构向量表征所述公式依赖图的结构，所述文字向量表征所述公式依赖图的文字；

具体地，在本申请的一个实施例中，所述基于所述公式依赖图，利用公式图神经网络，将所述节点的文本信息和属性类型进行融合学习，以获得所述节点的表征向量包括：

S1031：将所述公式依赖图表示为G＝{V,E,R}；其中，V和R分别表示点集和关系集，E表示所述公式依赖图中边的集合；(v_i,v_j,r)∈E表示一条从节点v_i到节点v_j的具有关系r∈R的边；

S1032：基于G＝{V,E,R}，所述公式图神经网络利用K个图卷积层学习所述节点的表征向量。

所述基于G＝{V,E,R}，所述公式图神经网络利用K个图卷积层学习每个节点v_i的表征向量包括：

所述公式图神经网络将第k+1层的每个节点v_i的向量表示为

和节点v_i在第k层的向量

连接。

所述聚合器包括：基本聚合器和注意力聚合器；

基本聚合器(Basic Aggregator)的FGNB(Formula Graph Network with BasicAggregator，基于基础聚合器的公式图神经网络)假设每个点的入向邻居对其影响是相同的，此时所述基本聚合器表示为：

其中，

表示待训练的参数，用于线性转换邻居节点传递的消息；

考虑到在公式依赖图中，不同层次或不同关系的邻居节点的影响是不同的，如图3所示，节点V5的邻居V4(兄弟节点)和V6(父亲节点)对其影响不同，我们在聚合器中引入注意力机制，以实现FGNA(Formula Graph Network with Attention Aggregator，基于注意力聚合器的公式图神经网络)。具体来说，FGNA在聚合节点v_i的邻居传递的信息时，考虑了它们对v_i的重要程度，又因为不同层次的节点和不同关系的边均会对消息传递和发送产生影响，因此我们从节点层次和边类别的角度，将所述注意力聚合器表示为：

其中，

用于不同关系的边的权重β_ji，γ∈[0,1]表示平衡因子；

其中，

其中，

表示与节点v_i存在关系r的相邻节点，MaxPool(.)表示最大池化函数。该部分用最大池化操作聚集与点v_i存在关系r的邻居信息，并将它们在关系层面上的权值置为相同值。

在公式图网络FGN操作后，选择每个公式在数学问题中的顶级节点在第 K层的向量作为其在序列模块中的嵌入输入(图3中，节点{V1，V2，V4， V5}是公式

的顶级节点)

S104：利用嵌套的序列模型以及所述公式图神经网络中的融合字形结构，将所述节点的结构向量和所述文字向量嵌入语义向量，所述嵌套的序列模型包括第一门控循环单元和第二门控循环单元；

具体地，所述利用嵌套的序列模型以及所述公式图神经网络中的融合字形结构，将所述节点的结构向量和所述文字向量嵌入语义向量，包括：

所述“独热码”向量包括：

所述利用word2vec 预训练的词向量包括：；

S105：基于所述语义向量，生成所述待处理数学题的答案序列。

具体地，在该求解过程中，我们设计了基于Seq2Seq(Sequence to Sequence)结构的神经模型，该神经模型如图4所示，分为编码器(Encoder) 和解码器(Decoder)两部分：

3.1)编码器

编码器用于将某一具体的数学问题的输入序列转为隐式向量表征，具体来说可分为两个模块：(1)嵌入模块，用于将不同形式的输入映射到向量空间中；(2)序列模块，用于学习问题的语义理解。

在嵌入模块中，每个问题P＝{p₁,p₂,L,p_L}由词和公式组成，其中词{p_l}的嵌入过程Emb(x)为：首先初用三种向量对词初始化：(1)随机向量

(2)“独热码”向量

(3)利用word2vec预训练的词向量。然后在初始化三种向量后，将它们连接起来并经过全连接层F(·)，嵌入到维度为定长的向量x_l：

对于公式的嵌入，利用了所述公式图神经网络中的融合字形网络FGN(x) 结构。由此，嵌入过程可表示为：

在序列模块中，根据嵌入模块输出的向量序列{x₁,x₂,L,x_L}学习它们的语义。为了能够把从词空间的嵌入和公式图空间的嵌入统一表示，我们在编码阶段设计了两个GRU(Gated Recurrent Unit，门控循环单元)，这两个GRU 即分别为所述第一门控循环单元和第二门控循环单元，在第l步，更新语义的隐向量s_l：

为了增强句子的正、反向语义，我们使用了双向GRU(GRU_w和GRU_f分别表示所述第一门控循环单元和第二门控循环单元)，即s_l包括正向语义

和反向语义

最后用最大池化操作聚集语义

3.2)解码器

解码器用以根据编码器理解的语义向量，生成问题的答案序列 {y₁,y₂,…,y_t-1}，它也是基于GRU(门控循环单元)实现的。在第t步，解码器根据Softmax选择最合适的输出。

另外，本申请实施例还提供了所述融合公式信息的数学题求解方法的具体实现过程及发明思路。

首先对于问题定义与形式化：

如前文所述，对于数学简答题求解任务来说，其目的是根据题目内容表征其语义特征和内含的公式信息特征，从而进行深度推理，预测题目对应的答案。输入数学题目的题面文本P，假定每个token表示其中的一个汉字、单词或数学符号，那么可将数学题目P表示为由L个token组成的序列 P＝{p₁,p₂,…,p_L}，其中p_i可以表示题目文本对应位置的字词(图1黑色字)或公式里的数字、数学符号(如“+”)等元素(图1蓝色字)。由于每道题目里可能包含多个公式，则把每道题包含的M个公式集合表示为 F＝{f₁,f₂,…,f_M}，其中f_i＝{p_i,…,p_j}(1≤i，j≤L)代表一个单独的公式。此外，题目的答案序列Y和题目P一样使用token定义的序列，表示为 Y＝{y₁,y₂,…,y_T}。那么，数学题求解任务可以被形式化为：给定一道数学题P 的文字描述序列，我们的目的是训练一个数学题求解模型，学习对题目的语义理解和数学推理，为其生成答案序列。

其次，对于数据收集与预处理；

本发明使用广义上的数学简答题为输入数据集，题目的文本内容需要含有用于描述题目信息的自然文本(如字词)和描述数学公式信息的文本(如图1中“蓝色”部分)。此类数据样例如DeepMind公司发布的开源数学题集中的代数题集数据(Algebra)和算数题集(Arithmetic)等。此外，也可以在通过网络爬取或线下收集初高中生的作业或考试数学题集获得输入数据集。

2.数据预处理

在构建模型之前，需要对收集的数据进行预处理以保证模型的效果。预处理主要包括以下内容：

1)题目过滤

本发明实例主要针对带有公式结构的数学题求解问题，因此需要选取数据集中含有公式的题目，过滤掉仅由字词、数字等非结构语言描述的题目，并滤掉token数小于10的题目。

2)抽样

在每类数据集中，分别进行随机抽样，选用原始数据集的子集训练模型。

再次，对于模型的建立：

数学题的描述普遍由字词和公式组成，这些公式遵循特殊的依赖结构，且同一题中不同公式间也因拥有相同元素而存在关联，在某些特定的问题(如：算术、代数)中，公式字符长度在题目总长度中占有较高比例，这说明融合公式结构特征的有助于对题目语义的理解。现有的研究工作大多忽略了隐藏在题目中公式结构信息中的依赖和关联，仅仅只利用了题目文本序列信息，缺乏深层次的数学推理能力和对数学题求解的普适性。实际上，要将公式信息提取并辅助理解和推理数学题，并提高答案生成的效果，是存在诸多困难与挑战的：(1)如何将由自然语言描述的公式文本序列识别和提取，并转为结构化的公式依赖图；(2)如何将题目内容语义理解和融合公式的数学推理统一表示，从而全面理解数学题。为了解决上述挑战，更好地利用公式提高推理能力，最终增强解答效果，我们设计了该融合公式信息的数学题求解器(Neural Mathematical Solver，NMS)(下文中称为融合公式信息的数学题求解系统)。NMS模型包含三个主要模块，公式图构造模块(FormulaGraph Construction Module)、公式图网络模块(Formula Graph Network Module)和神经求解器模块(Neural Solver Module)。公式图构造模块负责构造具有结构信息的“公式依赖图”，公式图网络模块负责学习公式元素的表征向量，神经求解器模块基于Seq2Seq框架，在语义信息建模的基础上，进一步融合图结构信特征，并设计了嵌套序列模型，使用两个GRU结构连接字词语义空间和公式结构空间的表征信息，从而增强了求解数学题的效果。

模型建立之后利用原始数据集的子集训练模型，整个融合公式信息的数学题求解可以通过Adam优化方法最小化如下损失函数L进行训练：

相应的，本申请实施例提供了一种融合公式信息的数学题求解系统，包括：公式图构造模块、公式图网络模块和神经求解器模块；其中，

提取所述待处理数学题包含的公式；

将每个所述TEX代码格式的公式作为一个节点，并根据所述节点与其他节点的关联关系，构建所述公式依赖图；

所述公式图神经网络将第k+1层的每个节点v_i的向量表示为

和节点v_i在第k层的向量

连接。

综上所述，本申请实施例提供了一种融合公式信息的数学题求解方法及系统，其中，所述融合公式信息的数学题求解方法将待处理数学题转换为公式依赖图为表示方法的公式结构，即利用以图为表示方法的公式结构来建模数学题目中公式特有的结构信息，并依据该公式依赖图，利用预先训练的公式图神经网络，获取所述公式依赖图中各个节点的表征向量，同时基于所述公式依赖图，将所述公式依赖图中的文字映射为文字向量。然后利用嵌套的序列模型以及所述公式图神经网络中的融合字形结构，将所述节点的结构向量和所述文字向量嵌入语义向量，所述嵌套的序列模型包括第一门控循环单元和第二门控循环单元，在该过程中可使用嵌套序列模型捕获题目整体的文本语义和公式语义两方面的隐式表征，通过融入公式自身元素(如：数字、变量、运算符)之间及多个公式之间的结构依赖关系，从而表示数学简答题的信息；最后基于所述语义向量，生成所述待处理数学题的答案序列，实现对包含公式信息的数学题的求解。

本说明书中各实施例中记载的特征可以相互替换或者组合，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。