CN104933158B - 数学问题求解模型的训练方法和装置、推理方法和装置 - Google Patents
数学问题求解模型的训练方法和装置、推理方法和装置 Download PDFInfo
- Publication number
- CN104933158B CN104933158B CN201510363088.8A CN201510363088A CN104933158B CN 104933158 B CN104933158 B CN 104933158B CN 201510363088 A CN201510363088 A CN 201510363088A CN 104933158 B CN104933158 B CN 104933158B
- Authority
- CN
- China
- Prior art keywords
- training text
- mathematical problem
- feature vector
- numbers
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 148
- 238000000034 method Methods 0.000 title claims abstract description 59
- 239000013598 vector Substances 0.000 claims abstract description 116
- 238000000605 extraction Methods 0.000 claims description 22
- 230000009467 reduction Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 239000000523 sample Substances 0.000 description 6
- 238000009795 derivation Methods 0.000 description 5
- 238000007476 Maximum Likelihood Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 235000014443 Pyrus communis Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种数学问题求解模型的训练方法和装置、推理方法和装置。所述训练方法包括:确定针对训练文本的简化的公式模板库;提取所述训练文本的特征向量;以及通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。本发明实施例提供的数学问题求解模型的训练方法和装置、推理方法和装置缩小了模型的搜索空间,降低了运算量。
Description
技术领域
本发明实施例涉及自然语言处理技术领域,尤其涉及一种数学问题求解模型的训练方法和装置、推理方法和装置。
背景技术
对自然语言描述的数学问题的自动求解是教育产业的应用热点。目前,在这个方向上已经陆续有成型的产品推出。但是,已经推出的产品普遍存在着对文本的理解能力不强,应用效果不好的缺陷。
Kushman等人针对现有技术的上述缺陷,提出了一种专门用于理解数学问题的描述文本,并求取数学问题的解的模型。参见图1,通过对输入文本的理解,可以将输入文本描述的数学问题对应至一个公式模板,然后,通过将所述输入文本中已知量、未知量以及名词对齐至所述公式模板中的各个槽位(slot),可以将公式模板实例化为一个具体的公式。然后,通过对公式的求解就可以得到所述数学问题的解。
如果将上述选取模板、实例化及求解的全过程称为一次推导,则可以定义一次推导y相对于问题x的条件概率是:
其中,φ(x,y)表示问题x与推导y之间的特征函数,θ表示权重参数。
将式(1)取对数,并对不同的推导y进行求和,即得到最大似然估计的目标函数:
假定对于问题x的特征向量是确定的,那么,运用最大似然估计的理念,使得上述式(2)的取值为最大的权重向量θ对应的模型即是求解文本描述的数学问题的最优的模型。
这种方案虽然提供了文本描述的数学问题的一种理论上可行的方法。但是,求解上述模型的时候,备选求解公式模板及对齐方式的数目太多,造成需要搜索的搜索空间太大,算法复杂度太高。并且,这种解决方案还存在着局部收敛的问题。
发明内容
针对上述技术问题,本发明实施例提供了一种数学问题自动求解模型的训练方法和装置、推理方法和装置,以缩小搜索空间,降低运算量。
第一方面,本发明实施例提供了一种数学问题求解模型的训练方法,所述方法包括:
确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的公式模板;
提取所述训练文本的特征向量;
通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
第二方面,本发明实施例提供了一种数学问题求解模型的训练装置,所述装置包括:
模板库确定模块,用于确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的公式模板;
特征向量提取模块,用于提取所述训练文本的特征向量;
模型确定模块,用于通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
第三方面,本发明实施例提供了一种数学问题求解模型的推理方法,所述方法包括:
利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规划方法构建的求解模型;
利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。
第四方面,本发明实施例还提供了一种数学问题求解模型的推理装置,所述装置包括:
特征提取模块,用于利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规划方法构建的求解模型;
求解模块,用于利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。
本发明实施例提供的数学问题自动求解模型的训练方法和装置通过确定针对训练文本的简化的公式模板库,提取所述训练文本的特征向量,以及通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量,从而有效地缩小了解决模型训练时的搜索空间,降低了运算量。
附图说明
图1是现有技术提供的数学问题自动求解过程的示意图;
图2是本发明第一实施例提供的数学问题求解模型的训练方法的流程图;
图3是本发明第一实施例提供的简化的公式模板及简化前的公式模板的比较示意图;
图4是简化前的公式模板产生的阳性样本与假阳性样本的比较示意图;
图5是本发明第二实施例提供的数学问题求解模型的训练方法中特征向量提取操作的流程图;
图6是本发明第二实施例提供的特征向量提取的效果示意图;
图7是本发明第三实施例提供的数学问题求解模型的训练方法中特征向量提取操作的流程图;
图8是本发明第四实施例提供的数学问题求解模型的推理方法的流程图;
图9是本发明第五实施例提供的实现数学问题自动求解过程的流程示意图;
图10是本发明第五实施例提供的生成的数学问题的解答过程的示意图;
图11是本发明第六实施例提供的数学问题求解模型的训练装置的结构图;
图12是本发明第七实施例提供的数学问题求解模型的推理装置的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
第一实施例
本实施例提供了数学问题求解模型的训练方法的一种技术方案。
参见图2,所述数学问题求解模型的训练方法包括:
S21,确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的经过简化的公式模板。
在本发明中,对Kushman等人提出的公式模板进行了简化。简化以后的公式模板被称为简化的公式模板,所有简化的公式模板的集合被称为简化的公式模板库。
参见图3,在本发明中,简化的公式模板不再像Kushman等人提出的公式模板那样,不仅包含未知量的系数,还包括未知量本身。公式模板中的未知量的系数对应于训练文本中的数字,而未知量本身对应于训练文本中的名词。不再包含未知量本身,意味着在参数对齐时,仅需要将文本中数字与所述简化的公式模板中的系数槽位进行对齐,而不再需要将文本中的名词代表的未知量与所述简化的公式模板中的槽位进行对齐。因为如果在公式模板中考虑未知量本身的不同,样本空间中样本的数量会呈指数增长,所以,不再考虑未知量以后,每个公式模板对应的样本数量会大大减小。
另外,参见图4,Kushman等人提出的公式模板容易产生假阳性样本。这是因为,当公式模板的系数正确填充后,公式未知数的对齐并不影响计算结果。因此,错误的未知数的对齐也可能产生正确的结果。这些假阳性样本将影响训练结果。需要说明的是,为了凸显未知量对齐所产生的假阳性样本,图4中并未示出对文本中不同系数的对齐方案。
在Kushman等人提出的方法中,对未知量的分析有助于将文本中的数字最优的对齐至所述公式模板中的系数槽位上。在本实施例提供的方法中,由于公式模板中不再考虑未知量本身,转而通过针对训练文本中的数字与疑问句之间关系设计合适的特征向量而完成数字对系数槽位的最优对齐。
参见图4,由于简化的公式模板不再考虑未知量本身,从样本空间中剔除了假阳性样本,因而样本空间中样本的数量大大减少。
S22,提取所述训练文本的特征向量。
所述特征向量是所述训练文本的特征参数。由于本实施例中公式模板不再考虑未知量本身,所以可以通过对从所述训练文本中提取的特征向量的设计,解决文本中的数字与所述公式模板中系数槽位之间的最优对齐的问题。
在提取所述训练文本的特征向量的过程中,可以通过提取所述训练文本中数字的上下文特征确定所述训练文本的特征向量元素,也可以通过所述训练文本中不同数字的上下文之间的相似程度来确定所述训练文本的特征向量元素,还可以通过所述训练文中不同数字的上下文之间的相关程度来确定所述训练文本的特征向量元素,最后还可以通过所述训练文本中数字与所述训练文本中问句之间的相关程度来确定所述训练文本的特征向量元素。
通过提取所述训练文本中数字的上下文特征确定所述训练文本的特征向量元素时,可以提取数字的上下文的词性标签、词语标签以及依存特征,并将上述三种上下文特征作为该数字在所述训练文本中的上下文特征。
在通过数字的上下文之间的相似程度确定所述训练文本的特征向量元素之时,可以通过提取所述训练文本中每个数字的上下文中的词语、词性标签以及依存特征,计算不同数字的上下文的上述三种属性之间的相似程度,并将计算得到的相似程度作为所述数字的上下文之间的相似程度。
进一步优选的,可以提取所述训练文本中每个数字[-5,5]大小的窗口内的上下文中的词语、词性标签及依存特征,并依据上述三种特征计算所述数字的上下文之间的相似程度。
在通过数字的上下文之间的相关程度确定所述训练文本的特征向量元素之时,可以获取与所述数字相关的名词词组,再依据所述名词词组中各个名词的出现次序,确定所述数字的上下文之间的相关程度。
在通过所述训练文本中数字与所述训练文本中问句之间的相关程度来确定所述训练文本的特征向量元素之时,假设名词词组NPi是与数字ni相关联的名词词组,nounj是名词词组NPi中按照与数字的依存关系排序的第j个名词,并且nounj是在问句中首先出现的名词,则可以确定数字ni与问句之间的相关程度为1/j。数字与问句的相关程度的取值越大,数字更大程度的与被查询主体相联系。
S23,通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
由于每个数学问题可能对应多个公式模板,并且用同一个公式模板之时,文本中的数字又存在多个不同的对齐方案,所以对于同一个数学问题,其可能的解的数量十分巨大。这样,就造成式(2)的搜索空间中搜索样本的数量十分巨大,精确的求解最大似然估计问题的难度。如果采用折中的近似解法,则有可能产生局部收敛的问题,导致计算效果的下降。
在本实施例中,定义yc是对自然语言描述的数学问题的正确的解,而ye是对自然语言描述的数学问题的错误的解。本实施例给出数学问题自动求解模型的训练目标是:
p(yc|x)>p(ye|x) (3)
在式(3)中,p(yc|x)表示对于问题x,获得正确解yc的概率,p(ye|x)表示对于问题x,获得错误解ye的概率。
对式(3)的两端取对数,则有:
ln p(yc|x)>ln p(ye|x) (4)
将式(1)代入上式,则有:
θ·φ(x,yc)>θ·φ(x,ye) (5)
其中,θ是所述数学问题求解模型的模型参数,也就是权重向量。它表示不同的公式模板及不同的数字对齐方式在所述数学问题的最优解中所占的权重比例。φ则表示问题x的特征向量。并且φ(x,yc)表示问题x与正确解yc之间的特征向量,φ(x,ye)表示问题x与错误解ye之间的特征向量。
加入对θ的约束条件,则有如下的约束优化问题:
该约束优化问题是一个典型的二次规划问题。所以,在模型训练过程中,可以通过对式(6)的求解确定模型中的权重向量θ,进而完成对数学问题自动求解模型的训练。其中,ξ是一个大于零的变量。
一旦所述模型中的权重向量一一确定,则所述数学问题求解模型确定,也就是所述数学问题求解模型训练完毕。
在使用训练完成的数学问题自动求解模型解决实际的自然语言描述的数学问题时,可以根据如下公式确定所述数学问题的最优解yc:
应该理解的是,二次规划问题是一个凸优化问题,具有全局最优解。因此,通过求解二次规划问题来确定数学问题求解模型中的模型参数,也就是权重向量,能够保证得到的模型参数是全局最优解,不存在局部收敛的问题。
本实施例通过确定针对训练文本的简化的公式模板库,提取所述训练文本的特征向量,以及通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量,不仅有效的缩小了模型的搜索空间,降低了运算量,而且克服了现有技术中存在的局部收敛问题。
第二实施例
本实施例以本发明的上述实施例为基础,进一步的提供了数学问题求解模型的训练方法中特征向量提取的一种技术方案。在该技术方案中,根据所述训练文本中不同数字的上下文之间的相关程度确定所述训练文本的特征向量元素包括:获取与所述数字相关联的名词词组;根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。
参见图5,根据所述训练文本中数字之间的相关程度确定所述训练文本的特征向量元素包括:
S51,获取与所述数字相关联的名词词组。
为了正确的解决所述数学问题,我们需要根据不同数字之间的关系建立方程。
应该理解的是,在所述训练文本中,每个数字都有与之相关联的名词词组,在根据数字之间的相关程度确定所述训练文本的特征向量元素之时,首先应当获取与这些数字相关联的名词词组。一般情况下,所述名词词组中包括至少两个名词,但是,也不排除所述名词词组中只包括一个名词的情况。
S52,根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。
假设n1及n2是在所述训练文本中出现的两个数字,与它们最为相关的名词词组分别是NP1及NP2。在NPi中出现的名词分别根据依存路径的长度而排序。这样,数字n1与n2之间的关系可以通过如下公式表示:
其中,是名词词组NP1中的名词,也即与数字n1相关的名词。ord(×)函数用于计算名词的出现次序,这种次序由名词与同它相关的数字之间的路径长度所决定。根据式(8)计算得到的r(n1,n2)的取值越大,表明数字n1与数字n2之间的相关程度越高。
这种特征参数有助于对训练操作引入一些基本的规则。例如,与被加数相关联的名词应当相同。另外,这种特征参数体现了一些非显性的关系。参见图6,尽管数字6100与数字405相关联的名词都是“dollar”,但是数字6100与7%、6%通过名词“fund”相关联,而数字405与7%、6%通过名词“interest”相关联。这种不同有助于将上述两个数字对齐至模板中的正确槽位。
本实施例通过获取与所述数字相关联的名词,以及根据所述不同数字与所述相同名词之间相关联的次序,确定所述训练文本的特征向量元素,实现了根据所述训练文本中数字与所述训练文本中问句之间的相关程度确定所述训练文本的特征向量元素。
第三实施例
本实施例以本发明的上述实施例为基础,进一步的提供了所述数学问题求解模型的训练方法中特征向量提取的一种技术方案。在该技术方案中,根据所述训练文本中不同数字的上下文之间的相似程度确定所述训练文本的特征向量元素包括:提取不同数字在所述训练文本中的特征参数;根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素。
参见图7,根据所述训练文本中不同数字之间的相似程度确定所述训练文本的特征向量元素包括:
S71,提取不同数字在所述训练文本中的特征参数。
在本实施例中,提取每个数字的[-5,5]窗口内中的词语、词性标签以及依存特征,作为所述数字在所述训练文本中的特征参数。
S72,根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素。
假设数字n1及n2分别对应于特征参数ST1及ST2,则两个数字之间的相似程度sim(n1,n2)可以依据如下公式确定:
确定两个数字之间的相似程度之后,可以依据所述两个数字之间的相似程度确定所述特征向量中相应位置上的元素的取值。
本实施例通过提取所述数字在所述训练文本中的特征参数,以及根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素,实现了根据所述训练文本中数字之间的相似程度确定所述训练文本的特征向量元素。
第四实施例
本实施例提供了数学问题求解模型的推理方法的一种技术方案。在该技术方案中,所述数学问题求解模型的推理方法包括:利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规划方法构建的求解模型;利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。
参见图8,所述数学问题求解模型的推理方法包括:
S81,利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规划方法构建的求解模型。
一旦所述数学问题求解模型训练完成,所述数学问题求解模型即可以被用于解决实际的自然语言描述的数学问题。
在将描述待求解的数学问题的输入文本输入至所述数学问题求解模型中以后,所述模型首先提取所述输入文本的特征向量,也就是式(5)中的φ参数。
同样,所述模型可以通过提取输入文本中数字的上下文之间的相似程度的方式提取特征向量元素,也可以通过提取输入文本中数字与问句之间的相关程度的方式提取特征向量元素。
S82,利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。
由于所述数学问题求解模型中的权重向量已经在训练过程中完全确定,也就是说,所述数学问题求解模型已经完全确定,因此,在提取所述输入文本的特征向量之后,所述数学问题求解模型可以根据所述特征向量给出所述数学问题的最优解。
本实施例通过利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,并利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解,实现里通过较小的计算了对自然语言描述的数学问题的准确求解。
第五实施例
本实施例提供了采用上述实施例训练的数学问题求解模型解决自然语言描述的数学问题的方法的一种技术方案。在该技术方案中,数学问题的求解方法包括:获取包含用来描述数学问题的自然语言的网页、语音或者图片;利用训练的数学问题求解模型求解所述网页、语音或者图片中描述的数学问题;获取所述数学问题求解模型给出的答案或者相关知识点提示。
参见图9,所述数学问题的求解方法包括:
S91,获取包含用来描述数学问题的自然语言的网页、语音或者图片。
在获取到的网页中应该包含描述待解决的数学问题的文字。在获取到的语音中应该包含描述待解决的数学问题的语音。同样,在获取到的图片中也应该包含描述待解决的数学问题的文字。
S92,利用训练的数学问题求解模型求解所述网页、语音或者图片中描述的数学问题。
在利用所述数学问题求解模型求解所述数学问题之前,应该从所述网页、语音或者图片中提取描述所述数学问题的文本。从所述网页中提取描述所述数学问题的文本之时,应当依据对网页中文本的分析,选择描述所述数学问题的文本。从语音中提取描述所述数学问题的文本之时,应当通过对所述语音的语音识别,来提取描述所述数学问题的文本。从图片中提取描述所述数学问题的文本之时,应当通过对图片中文字的光学字符识别(Optical character recognition,OCR)来提取描述所述数学问题的文本。
完成对文本的提取操作之后,利用训练好的数学问题求解模型求解所述数学问题。
S93,获取所述数学问题自动求解模型给出的答案或者相关知识点提示。
利用所述数学问题自动求解模型求解所述数学问题之后,能够获取到所述模型给出的数学问题的答案或者相关知识点提示。
进一步的,还可以依据所述数学问题求解模型给出的答案,以及对描述所述数学问题的文本的处理,生成对所述数学问题进行求解的推导过程,并通过自然语言的形式展示给用户。
图10示出了依据上述方式生成的所述数学问题的解答过程的一个示例。参见图10,待求解的数学问题是:梨的框数是苹果的3/4,又是橘子的4/5,苹果有80框,橘子多少框?解决该数学问题的公式为:
其中,N、kb a和kc a为参数。通过本申请上述实施例描述的算法计算得到了权重向量之后,可以通过公式(7)求取y,同时获得N、kb a和kc a所对应的取值。
同时,通过是(10),我们可以知道该问题为如下比例问题的实例化:
a是b的kb a,是c的kc a,已知b为N,求c。
将a、b、c替换为梨、苹果和橘子,kb a与kc a替换为3/4和4/5,即可生成如图10所示的该数学问题的求解方法。
本实施例通过获取包含用来描述数学问题的自然语言的网页、语音或者图片,利用训练的数学问题自动求解模型求解所述网页、语音或者图片中描述的数学问题,以及获取所述数学问题自动求解模型给出的答案或者相关知识点提示,从而实现了利用预先训练的模型对自然语言描述的数学问题的自动求解。
第六实施例
本实施例提供了数学问题求解模型的训练装置的一种技术方案。参见图11,在该技术方案中,所述数学问题自动求解模型的训练装置包括:模板库确定模块111、特征向量提取模块112以及模型确定模块113。
所述模板库确定模块111用于确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的经过简化的公式模板。
所述特征向量提取模块112用于提取所述训练文本的特征向量。
所述模型确定模块113用于通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
进一步的,所述特征向量提取模块112具体用于:根据数字的上下文特征、所述训练文本中不同数字的上下文之间的相似程度及相关程度,和/或数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素。
进一步的,根据数字的上下文特征确定所述训练文本的特征向量元素包括:提取所述数字的上下文中的词语、词性标签以及依存特征。
进一步的,所述特征向量提取模块112根据所述训练文本中不同数字的上下文之间的相似程度确定所述训练文本的特征向量元素包括:提取不同数字在所述训练文本中的特征参数;根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素。
进一步的,所述特征参数包括:所述数字的上下文中的词语、所述数字的上下文的词性标签以及所述数字的上下文的依存特征。
进一步的,所述特征向量提取模块112根据所述训练文本中数字的上下文之间的相关程度确定所述训练文本的特征向量元素包括:获取与所述数字相关联的名词词组;根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。
进一步的,所述特征向量提取模块112根据数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素包括:根据与所述数字相关联的名词词组中的名词在问句中的出现次序,确定所述训练文本的特征向量元素。
第七实施例
本实施例提供了数学问题求解模型的推理装置的一种技术方案。在该技术方案中,所述数学问题求解模型的推理装置包括:特征提取模块121以及求解模块122。
所述特征提取模块121用于利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规划方法构建的求解模型。
所述求解模块122用于利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间的相同或相似的部分互相参见即可。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (16)
1.一种数学问题求解模型的训练方法,其特征在于,包括:
确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的经过简化的公式模板;其中,所述简化的公式模板为不再考虑所述训练文本中未知量本身的公式模板;
提取所述训练文本的特征向量;
通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
2.根据权利要求1所述的方法,其特征在于,提取所述训练文本的特征向量包括:
根据数字的上下文特征、所述训练文本中不同数字的上下文之间的相似程度及相关程度,和/或数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素。
3.根据权利要求2所述的方法,其特征在于,根据数字的上下文特征确定所述训练文本的特征向量元素包括:
提取所述数字的上下文中的词性标签、词语标签以及依存特征。
4.根据权利要求2所述的方法,其特征在于,根据所述训练文本中不同数字的上下文之间的相似程度确定所述训练文本的特征向量元素包括:
提取不同数字在所述训练文本中的特征参数;
根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素。
5.根据权利要求4所述的方法,其特征在于,所述特征参数包括:所述数字的上下文中的词语、所述数字的上下文的词性标签以及所述数字的上下文的依存特征。
6.根据权利要求2所述的方法,其特征在于,根据所述训练文本中不同数字的上下文之间的相关程度确定所述训练文本的特征向量元素包括:
获取与所述数字相关联的名词词组;
根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。
7.根据权利要求2所述的方法,其特征在于,根据数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素包括:
根据与所述数字相关联的名词词组中的名词在问句中的出现次序,确定所述训练文本的特征向量元素。
8.一种数学问题求解模型的训练装置,其特征在于,包括:
模板库确定模块,用于确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的经过简化的公式模板;其中,所述简化的公式模板为不再考虑所述训练文本中未知量本身的公式模板;
特征向量提取模块,用于提取所述训练文本的特征向量;
模型确定模块,用于通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
9.根据权利要求8所述的装置,其特征在于,所述特征向量提取模块具体用于:
根据数字的上下文特征、所述训练文本中不同数字的上下文之间的相似程度及相关程度,和/或数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素。
10.根据权利要求9所述的装置,其特征在于,根据数字的上下文特征确定所述训练文本的特征向量元素包括:
提取所述数字的上下文中的词性标签、词语标签以及依存特征。
11.根据权利要求9所述的装置,其特征在于,所述特征向量提取模块根据所述训练文本中不同数字的上下文之间的相似程度确定所述训练文本的特征向量元素包括:
提取不同数字在所述训练文本中的特征参数;
根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素。
12.根据权利要求11所述的装置,其特征在于,所述特征参数包括:所述数字的上下文中的词语、所述数字的上下文的词性标签以及所述数字的上下文的依存特征。
13.根据权利要求9所述的装置,其特征在于,所述特征向量提取模块根据所述训练文本中数字的上下文之间的相关程度确定所述训练文本的特征向量元素包括:
获取与所述数字相关联的名词词组;
根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。
14.根据权利要求9所述的装置,其特征在于,所述特征向量提取模块根据数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素包括:
根据与所述数字相关联的名词词组中的名词在问句中的出现次序,确定所述训练文本的特征向量元素。
15.一种数学问题求解模型的推理方法,其特征在于,包括:
利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,所述简化的公式模板为不再考虑训练文本中未知量本身的公式模板,并根据二次规划方法构建的求解模型;
利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。
16.一种数学问题求解模型的推理装置,其特征在于,包括:
特征向量提取模块,用于利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,所述简化的公式模板为不再考虑训练文本中未知量本身的公式模板,并根据二次规划方法构建的求解模型;
求解模块,用于利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510363088.8A CN104933158B (zh) | 2015-06-26 | 2015-06-26 | 数学问题求解模型的训练方法和装置、推理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510363088.8A CN104933158B (zh) | 2015-06-26 | 2015-06-26 | 数学问题求解模型的训练方法和装置、推理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104933158A CN104933158A (zh) | 2015-09-23 |
CN104933158B true CN104933158B (zh) | 2018-06-19 |
Family
ID=54120325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510363088.8A Active CN104933158B (zh) | 2015-06-26 | 2015-06-26 | 数学问题求解模型的训练方法和装置、推理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104933158B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105302875A (zh) * | 2015-10-09 | 2016-02-03 | 电子科技大学 | 交互式问题求解方法及服务器及系统 |
CN107357757B (zh) * | 2017-06-29 | 2020-10-09 | 成都考拉悠然科技有限公司 | 一种基于深度增强学习的代数应用题自动求解器 |
CN108234610A (zh) * | 2017-12-22 | 2018-06-29 | 深圳市华士精成科技有限公司 | 一种课堂互动和反馈系统 |
CN107992482B (zh) * | 2017-12-26 | 2021-12-07 | 科大讯飞股份有限公司 | 数学主观题解答步骤的规约方法及系统 |
CN110689249A (zh) * | 2019-09-20 | 2020-01-14 | 怀化学院 | 一种数学学科素养能力综合分析系统及分析方法 |
CN111767307A (zh) * | 2020-07-06 | 2020-10-13 | 北京猿力未来科技有限公司 | 对象处理方法及系统、数学题目批改方法及系统 |
CN111767708A (zh) * | 2020-07-09 | 2020-10-13 | 北京猿力未来科技有限公司 | 解题模型的训练方法及装置、解题公式生成方法及装置 |
CN116108326A (zh) * | 2023-04-12 | 2023-05-12 | 山东工程职业技术大学 | 一种数学工具软件控制方法、装置、设备及存储介质 |
CN116680502B (zh) * | 2023-08-02 | 2023-11-28 | 中国科学技术大学 | 数学应用题智能求解方法、系统、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0911805A2 (en) * | 1997-10-23 | 1999-04-28 | Pioneer Electronic Corporation | Speech recognition method and speech recognition apparatus |
CN1719436A (zh) * | 2004-07-09 | 2006-01-11 | 中国科学院自动化研究所 | 一种新的面向文本分类的特征向量权重的方法及装置 |
CN101329731A (zh) * | 2008-06-06 | 2008-12-24 | 南开大学 | 图像中数学公式的自动识别方法 |
CN103299292A (zh) * | 2010-12-02 | 2013-09-11 | Sk电信有限公司 | 用于处理自然语言和数学公式的方法及其设备 |
-
2015
- 2015-06-26 CN CN201510363088.8A patent/CN104933158B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0911805A2 (en) * | 1997-10-23 | 1999-04-28 | Pioneer Electronic Corporation | Speech recognition method and speech recognition apparatus |
CN1719436A (zh) * | 2004-07-09 | 2006-01-11 | 中国科学院自动化研究所 | 一种新的面向文本分类的特征向量权重的方法及装置 |
CN101329731A (zh) * | 2008-06-06 | 2008-12-24 | 南开大学 | 图像中数学公式的自动识别方法 |
CN103299292A (zh) * | 2010-12-02 | 2013-09-11 | Sk电信有限公司 | 用于处理自然语言和数学公式的方法及其设备 |
Non-Patent Citations (1)
Title |
---|
Learning to automatically solve algebra word problems;Nate Kushman等;《http://groups.csail.mit.edu/rbg/code/wordprobs/.》;20140612;第3-7页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104933158A (zh) | 2015-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104933158B (zh) | 数学问题求解模型的训练方法和装置、推理方法和装置 | |
CN110096570B (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
CN108363790B (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
US10146859B2 (en) | System and method for entity recognition and linking | |
US20180121415A1 (en) | Probabilistic matching for dialog state tracking with limited training data | |
CN111309915A (zh) | 联合学习的自然语言训练方法、系统、设备及存储介质 | |
CN111563384B (zh) | 面向电商产品的评价对象识别方法、装置及存储介质 | |
CN108228758A (zh) | 一种文本分类方法及装置 | |
US11669740B2 (en) | Graph-based labeling rule augmentation for weakly supervised training of machine-learning-based named entity recognition | |
CN115357719B (zh) | 基于改进bert模型的电力审计文本分类方法及装置 | |
CN110674642B (zh) | 一种用于含噪稀疏文本的语义关系抽取方法 | |
CN113743099A (zh) | 基于自注意力机制方面术语提取系统、方法、介质、终端 | |
Charoenpornsawat et al. | Improving translation quality of rule-based machine translation | |
WO2023088278A1 (zh) | 用于验证表述的真实性的方法、设备、装置和介质 | |
CN110765241B (zh) | 推荐题的超纲检测方法、装置、电子设备和存储介质 | |
CN110852071A (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
CN111723583B (zh) | 基于意图角色的语句处理方法、装置、设备及存储介质 | |
CN112632956A (zh) | 文本匹配方法、装置、终端和存储介质 | |
CN113012685B (zh) | 音频识别方法、装置、电子设备及存储介质 | |
CN113822052A (zh) | 一种文本错误检测方法、装置、电子设备及存储介质 | |
US20240232245A1 (en) | Method, device, and medium for consistency detection of a document and an abstract | |
CN114417881B (zh) | 敏感词检测方法、装置、电子设备及存储介质 | |
CN115906818A (zh) | 语法知识预测方法、装置、电子设备和存储介质 | |
CN114239555A (zh) | 一种关键词提取模型的训练方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |