CN111027327A

CN111027327A - 机器阅读理解方法、设备、存储介质及装置

Info

Publication number: CN111027327A
Application number: CN201911058199.2A
Authority: CN
Inventors: 郝正鸿; 许开河; 王少军
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-10-29
Filing date: 2019-10-29
Publication date: 2020-04-17
Anticipated expiration: 2039-10-29
Also published as: CN111027327B; WO2021082953A1

Abstract

本发明公开了一种机器阅读理解方法、设备、存储介质及装置，该方法通过获取待理解段落及对应的多个目标问题，将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义，基于人工智能，将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量，所述有价值句子向量经过所述预设机器阅读理解模型的回答层，获得各所述目标问题的预测答案范围，通过预设机器阅读理解模型进行答案预测，提高预测答案的准确率和效率，将所述预测答案范围发送至目标终端，提升用户体验。

Description

机器阅读理解方法、设备、存储介质及装置

技术领域

本发明涉及人工智能的技术领域，尤其涉及一种机器阅读理解方法、设备、存储介质及装置。

背景技术

机器阅读理解是自然语言处理(Natural Language Processing，缩写NLP)领域的核心任务之一，需要通过算法设计实现教会机器对段落文本进行阅读理解并找到问题答案，目前已有的机器阅读理解数据集包括选择题、完形填空题、问答题等。

根据人类的阅读理解行为，是需要在通读段落(paragraph)后过滤出与问题(question)相关且对回答问题有价值的词语，然后再进一步理解question确定答案范围(answer span)，但是针对问答类阅读理解任务，现有阅读理解模型多是在整个paragraph上寻找答案，导致寻找到的答案准确率不高，且效率低。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种机器阅读理解方法、设备、存储介质及装置，旨在解决现有技术中机器阅读理解寻找到的答案准确率不高且效率低的技术问题。

为实现上述目的，本发明提供一种机器阅读理解方法，所述机器阅读理解方法包括以下步骤：

获取待理解段落及对应的多个目标问题；

将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义；

将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量；

所述有价值句子向量经过所述预设机器阅读理解模型的回答层，获得各所述目标问题的预测答案范围；

将所述预测答案范围发送至目标终端。

优选地，所述将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义，包括：

将所述待理解段落及对应的多个所述目标问题进行多线程处理，经过预设机器阅读理解模型的嵌入层，获得待理解段落的向量表示及各目标问题的向量表示；

所述待理解段落的向量表示及各所述目标问题的向量表示经过所述预设机器阅读理解模型的编码层，获得所述待理解段落对应的段落语义及各所述目标问题对应的问题语义；

所述段落语义及各所述问题语义经过所述预设机器阅读理解模型的交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义。

优选地，所述将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量，包括：

经过所述预设机器阅读理解模型的筛选层，根据所述待理解段落的向量表示，通过门过滤概率公式计算门过滤概率；

将所述待理解段落中每个句子的向量表示与所述门过滤概率点乘，获得所述待理解段落中每个句子门过滤后的向量表示；

根据所述交互信息语义，将所述待理解段落中每个句子门过滤后的向量表示与各所述目标问题的向量表示通过预设交互公式进行注意力交互，获得与各所述目标问题关联性较强的有价值句子向量。

优选地，所述门过滤概率公式为：

其中，g_i为句子i的门过滤概率，σ为sigmoid函数，W_g和U_g均为待学习参数，h_i为所述待理解段落中句子i的向量表示，

为所述待理解段落的集中资源的向量表示，b_g为偏置项。

优选地，所述获取待理解段落及对应的多个目标问题之前，所述机器阅读理解方法还包括：

从预设数据库获取开放数据，对所述开放数据进行数据抽取，获得样本段落；

对所述样本段落进行关键词提取，获得所述样本段落对应的关键词；

根据所述关键词生成样本答案；

根据所述样本段落和所述样本答案生成样本问题；

建立基础机器阅读理解模型；

根据所述样本段落、所述样本答案和所述样本问题对所述基础机器阅读理解模型进行训练，获得预设机器阅读理解模型。

优选地，所述根据所述样本段落和所述样本答案生成样本问题，包括：

将所述样本段落和所述样本答案以向量形式进行表示，获得所述样本段落对应的段落词向量和所述样本答案对应的答案词向量；

将所述段落词向量与预设二维特征拼接，获得输入段落词向量，所述预设二维特征向量表示段落单词是否在所述样本答案中出现；

将所述答案词向量与位置向量进行拼接，获得输入答案词向量，所述位置向量为表示所述样本答案在所述样本段落中的位置；

通过编码器解码器注意力模型中的编码器对所述输入段落词向量和所述输入答案词向量进行编码，获得注释段落词向量和注释答案词向量；

根据所述注释段落词向量和所述注释答案词向量计算所述编码器解码器注意力模型中解码器的初始状态；

根据所述解码器的初始状态、所述注释段落词向量和所述注释答案词向量，经过所述编码器解码器注意力模型中解码器进行解码，获得样本问题。

优选地，所述将所述预测答案范围发送至目标终端之后，所述机器阅读理解方法还包括：

获取多个待选句子选项，计算各待选句子选项与所述预测答案范围之间的相似度，选取所述相似度最高的待选句子选项作为目标选项；

将所述目标选项发送至所述目标终端。

此外，为实现上述目的，本发明还提出一种机器阅读理解设备，所述机器阅读理解设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机器阅读理解程序，所述机器阅读理解程序配置为实现如上文所述的机器阅读理解方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有机器阅读理解程序，所述机器阅读理解程序被处理器执行时实现如上文所述的机器阅读理解方法的步骤。

此外，为实现上述目的，本发明还提出一种机器阅读理解装置，所述机器阅读理解装置包括：

获取模块，用于获取待理解段落及对应的多个目标问题；

交互模块，用于将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义；

筛选模块，用于将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量；

预测模块，用于所述有价值句子向量经过所述预设机器阅读理解模型的回答层，获得各所述目标问题的预测答案范围；

发送模块，用于将所述预测答案范围发送至目标终端。

本发明中，获取待理解段落及对应的多个目标问题，将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义，基于人工智能，将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量，所述有价值句子向量经过所述预设机器阅读理解模型的回答层，获得各所述目标问题的预测答案范围，通过预设机器阅读理解模型进行答案预测，提高预测答案的准确率和效率，将所述预测答案范围发送至目标终端，提升用户体验。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的机器阅读理解设备的结构示意图；

图2为本发明机器阅读理解方法第一实施例的流程示意图；

图3为本发明机器阅读理解方法第二实施例的流程示意图；

图4为本发明机器阅读理解方法第三实施例的流程示意图；

图5为本发明机器阅读理解装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的机器阅读理解设备结构示意图。

如图1所示，该机器阅读理解设备可以包括：处理器1001，例如中央处理器(Central Processing Unit，CPU)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)，可选用户接口1003还可以包括标准的有线接口、无线接口，对于用户接口1003的有线接口在本发明中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity，Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory，RAM)存储器，也可以是稳定的存储器(Non-volatileMemory，NVM)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对机器阅读理解设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及机器阅读理解程序。

在图1所示的机器阅读理解设备中，网络接口1004主要用于连接后台服务器，与所述后台服务器进行数据通信；用户接口1003主要用于连接用户设备；所述机器阅读理解设备通过处理器1001调用存储器1005中存储的机器阅读理解程序，并执行本发明实施例提供的机器阅读理解方法。

基于上述硬件结构，提出本发明机器阅读理解方法的实施例。

参照图2，图2为本发明机器阅读理解方法第一实施例的流程示意图，提出本发明机器阅读理解方法第一实施例。

在第一实施例中，所述机器阅读理解方法包括以下步骤：

步骤S10：获取待理解段落及对应的多个目标问题。

应理解的是，本实施例的执行主体是所述机器阅读理解设备，其中，所述机器阅读理解设备可为智能手机、个人电脑或服务器等电子设备，本实施例对此不加以限制。所述待理解段落为需要进行语义理解的段落，可以是一个设备的使用说明书，对于用户问出的多个所述目标问题，从所述使用说明书中找到对应的答案。所述目标问题为针对所述待理解段落提出的语义理解相关的问题，通过所述预设阅读理解模型对所述待理解段落进行语义分析，从而查找与所述目标问题对应的答案。

步骤S20：将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义。

可理解的是，所述多线程处理器可同时对多个所述目标问题进行并行处理，从而提高处理效率。所述预设机器阅读理解模型的第一层为嵌入(embedding)层，将所述待理解段落及对应的所述目标问题输入所述预设机器阅读理解模型，经过所述嵌入层，实现将所述待理解段落及对应的所述目标问题映射为向量表示。

在具体实现中，所述预设机器阅读理解模型的第二层是编码(encoder)层，对所述待理解段落的向量表示及所述目标问题的向量表示进行编码，获得包含上下文的语义表示，即所述待理解段落对应的段落语义及所述目标问题对应的问题语义。

应理解的是，所述预设机器阅读理解模型的第三层是交互(interaction)层，该层捕捉paragraph和question的交互关系并输出交互信息语义表示，类似人类带着问题反复阅读原文，从而获得所述待理解段落与所述目标问题之间的交互信息语义。

步骤S30：将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量。

需要说明的是，在所述交互层之后，增加筛选有价值句子(gated answervaluable sentences selection)层，即所述筛选层，该筛选层分为两部分实现，第一部分为信息过滤门限(gated info filter)，第二部分是与所述目标问题做注意力(attention)分析，具体算法描述如下：

1、计算门过滤概率g_i。2、将所述待理解段落中的每个句子向量表示与所述门过滤概率点乘，获得过滤后的向量表示f_i，公式为：f_i＝g_i⊙h_i，其中，h_i为所述待理解段落中句子i的向量表示，g_i为所述门过滤概率。3、将f_i与h_q进行注意力交互，获得筛选后的向量p_q，h_q为问题的向量表示。4、用p_q表示与所述目标问题关联性较强的有价值句子，将所述有价值句子作为所述预设机器阅读理解模型的回答层的输入，从而进行答案范围的预测。

步骤S40：所述有价值句子向量经过所述预设机器阅读理解模型的回答层，获得各所述目标问题的预测答案范围。

应理解的是，所述预设机器阅读理解模型的回答(answer)层，根据所述有价值句子进行答案预测，获得预测答案范围。可用于对一列列的数据进行机器阅读理解，获得需要的内容。每一列都是一组类型的属性，比如姓名，证件号码，地址等，系统是要识别哪一列是地址，哪一列是身份证，比如地址中含有省市县等关键字，身份证也有它的规则，根据这些规则识别每一列的属性，将需要的内容识别出来并上传到系统，应用常见就是农险投保，整个村或者镇投保，把农户怎么快速的从纸质上复制到系统中。还可应用于智能问答系统，比如，用户在使用电器时，针对电器的使用说明有疑问，问出问题，则可通过对所述说明书进行机器阅读理解，预测出用户问题对应的答案。

步骤S50：将所述预测答案范围发送至目标终端。

可理解的是，所述目标终端为用户的终端设备，比如智能手机或者个人计算机等，通过所述目标终端查看所述预测答案范围。

本实施例中，获取待理解段落及对应的多个目标问题，将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义，基于人工智能，将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量，所述有价值句子向量经过所述预设机器阅读理解模型的回答层，获得各所述目标问题的预测答案范围，通过预设机器阅读理解模型进行答案预测，提高预测答案的准确率和效率，将所述预测答案范围发送至目标终端，提升用户体验。

参照图3，图3为本发明机器阅读理解方法第二实施例的流程示意图，基于上述图2所示的第一实施例，提出本发明机器阅读理解方法的第二实施例。

在第二实施例中，所述步骤S20，包括：

步骤S201：将所述待理解段落及对应的多个所述目标问题进行多线程处理，经过预设机器阅读理解模型的嵌入层，获得待理解段落的向量表示及各目标问题的向量表示。

应理解的是，所述预设机器阅读理解模型的第一层为嵌入(embedding)层，将所述待理解段落及对应的所述目标问题输入所述预设机器阅读理解模型，经过所述嵌入层，实现将所述待理解段落及对应的所述目标问题映射为向量表示。

可理解的是，嵌入层实现逻辑：将带段落文本和问题文本分别映射为字符身份标识号(Identity document，缩写id)组合，位置id组合；将段落文本和问题文本的字符id组合拼接起来；将段落文本和问题文本的位置id组合拼接起来；将字符id组合映射到字符表中的向量表示；将位置id组合映射到位置表中的向量表示；将字符向量表示和位置向量表示做累加，然后做层次归一化(LayerNormalization)和随机失活(dropout)得到最终的向量表示。

步骤S202：所述待理解段落的向量表示及各所述目标问题的向量表示经过所述预设机器阅读理解模型的编码层，获得所述待理解段落对应的段落语义及各所述目标问题对应的问题语义。

需要说明的是，所述预设机器阅读理解模型的第二层是编码(encoder)层，对所述待理解段落的向量表示及所述目标问题的向量表示进行编码，获得包含上下文的语义表示。所述编码层可采用一个循环神经网络(Recurrent Neural Network，RNN)网络对所述待理解段落的向量表示及各所述目标问题的向量表示进行编码，RNN编码顺着所述待理解段落和目标问题的步长逐层进行，RNN的最后一层能够包含整个句子的特征，即所述待理解段落对应的段落语义及所述目标问题对应的问题语义。

步骤S203：所述段落语义及各所述问题语义经过所述预设机器阅读理解模型的交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义。

在具体实现中，所述预设机器阅读理解模型的第三层是交互(interaction)层，该层捕捉paragraph和question的交互关系并输出交互信息语义表示，类似人类带着问题反复阅读原文，从而获得所述待理解段落与所述目标问题之间的交互信息语义。第二层与第三层基于BERT(Bidirectional Encoder Representations from Transformers)模型实现，为12层的双向自注意力模型，每层实现逻辑如下：

将嵌入层输出的隐层向量表示分别作为自注意力的问题(query)、答案(key)和权重(value)，query和key计算自注意力分数(attention score)，将归一化的attentionscore与value向量表示相乘得到包含段落自注意力表示、问题自注意力表示、段落-问题的注意力表示和问题-段落的注意力表示的隐层向量表示；将上步的隐层向量表示经过一层全连接层和层次归一化(Layer Normalization)得到经过上下文自注意力和段落问题交互注意力后的段落和问题的每个字符的向量表示。

进一步地，所述步骤S30，包括：

应理解的是，在所述交互层之后，增加筛选有价值句子(gated answer valuablesentences selection)层，即所述筛选层，该筛选层分为两部分实现，第一部分为信息过滤门限(gated info filter)，第二部分是与所述目标问题做注意力(attention)分析，具体算法描述如下：

1、计算门过滤概率，所述门过滤概率公式为：

为所述待理解段落的集中资源的向量表示，b_g为偏置项。

2、将所述待理解段落中的每个句子向量表示与所述门过滤概率点乘，获得过滤后的向量表示f_i，公式为：

f_i＝g_i⊙h_i；其中，h_i为所述待理解段落中句子i的向量表示，g_i为所述门过滤概率。点乘，也叫数量积，结果是一个向量在另一个向量方向上投影的长度，是一个标量。

3、将f_i与h_q进行注意力交互，获得筛选后的向量p_q，h_q为问题的向量表示，所述预设交互公式为：

φ(f_i,h_q)＝v^Ttanh(W_ff_i+W_hh_q+b)；

其中，b为偏置项，φ(f_i,h_q)为f_i和h_q的attention score，f_i为待理解段落中每个句子经过门过滤后向量表示，h_q为问题的向量表示，v为待学习参数，中T表示矩阵转置，W_f为待学习参数，W_h为待学习参数，

是归一化处理，归一化函数为softmax函数，从而得到段落中每个句子的attention权重，p_q即为段落中所有句子的带attention权重的向量表示的加权求和。

4、用p_q表示与所述目标问题关联性较强的有价值句子，将所述有价值句子作为所述预设机器阅读理解模型的回答层的输入，从而进行答案范围的预测。

在本实施例中，将所述待理解段落及对应的多个所述目标问题进行注意力交互，将所述待理解段落中每个句子的向量表示与所述门过滤概率点乘，获得所述待理解段落中每个句子门过滤后的向量表示，根据所述交互信息语义，将所述待理解段落中每个句子门过滤后的向量表示与各所述目标问题的向量表示通过预设交互公式进行注意力交互，获得与各所述目标问题关联性较强的有价值句子向量，提高预测答案的准确性。

参照图4，图4为本发明机器阅读理解方法第三实施例的流程示意图，基于上述第一实施例或第二实施例，提出本发明机器阅读理解方法的第三实施例。本实施例中，基于第一实施例进行说明。

在第三实施例中，所述步骤S10之前，还包括：

步骤S01：从预设数据库获取开放数据，对所述开放数据进行数据抽取，获得样本段落。

应理解的是，所述预设数据库可以是维基(wiki)数据库，从所述wiki数据库中下载开放wiki数据，即所述开放数据。可通过Gensim中的数据的抽取处理类维基百科(WikiCorpus)对所述开放wiki数据进行抽取，Gensim是一个主题模型Python工具包，提供了wiki数据的抽取处理类WikiCorpus。由于所述开放wiki数据包含繁体字及不规范字符，需要进行繁体转简体，以及字符编码转换。同时为了后续工作，需要对语料进行分词处理。繁体转简体可使用开源简繁转换工具OpenCC，将所述开放wiki数据中的繁体字转换为简体字。字符编码转换，可使用iconv命令将文件转换成utf-8编码，linux shell配置文件中默认的字符集编码为UTF-8，UTF-8是unicode的一种表达方式，gb2312是和unicode都是字符的编码方式，在LINUX上进行编码转换时，可以利用iconv命令实现，这是针对文件的，即将指定文件从一种编码转换为另一种编码，获得所述样本段落。

步骤S02：对所述样本段落进行关键词提取，获得所述样本段落对应的关键词。

可理解的是，对所述样本段落进行分词处理，使用jieba分词工具包，命令行分词，获得所述样本段落的所有词语，计算所有词语的词频-逆文档频率(Term Frequency-Inverse Document Frequency，TF-TDF)值，当一个词在文档频率越高并且新鲜度高，即普遍度低，其TF-IDF值越高，可将词语按照TF-IDF值从大到小进行排序，获取排在前面的预设数量的词作为所述样本段落对应的关键词，所述预设数量可根据经验值进行设置。

步骤S03：根据所述关键词生成样本答案。

需要说明的是，从所述样本段落中查找包含所述关键词的句子，将包含的关键词数量较多的句子作为所述样本答案。还可以是基于文档生成所述样本答案，学习文档中的关键词，包括文章中可作为常见问题答案的关键知识点、命名实体或语义概念，由于答案是文档的片段，所以看做序列标注任务。答案合成模块(Answer Synthesis Module)，序列标注问题，训练了一个IOB tagger(4种标记：start,mid,end,none)来预测段落里的每个单词是不是答案。通过双向长短时记忆(Bi-directional Long Short-Term Memory，BiLSTM)层对所述关键词的词向量进行编码，然后加两个全连接层(Fully Connected layer，FC)和一个归一化指数函数(Softmax)产生每个单词的标签相似性(tag likelihoods)，选择连续的范围(span)作为候选答案块(candidate answer chunks)，输入问题生成模块，生成所述样本答案。

步骤S04：根据所述样本段落和所述样本答案生成样本问题。

在具体实现中，基于所述样本段落和所述样本答案，生成自然语言的完整问句，作为生成任务，问题生成(Question Generation，QG)模型可以是编码-解码+注意力(encoder-decoder+attention)模型，输入是答案句子(answer sentence)，即输入所述样答案，用双向门控循环统一(bidirectional Gated Recurrent Unity，BiGRU)进行编码，连接两个方向的最后隐藏状态(last hidden state)作为编码器的输出以及解码器的初始状态。对注意力层做了改进，希望问题生成模型能记住所述样答案中哪些内容被使用过了，在产生问题关键词时就不再重复使用，从而生成所述样本问题。

进一步地，所述步骤S04，包括：

应理解的是，将所述样本段落和所述样本答案以向量形式进行表示，将所述段落词向量与预设二维特征拼接，所述预设二维特征表示文档单词是否在答案中出现，接着对所述答案词向量进行编码，根据所述答案词向量所述样本段落的位置找到对应的位置向量，然后把所述位置向量和所述答案词向量拼接起来，通过编码器解码器注意力模型中的编码器，用BiGRU对所述输入段落词向量和所述输入答案词向量进行编码，获得注释段落词向量和注释答案词向量，为了在问句中直接产生文档中的一些短语和实体，在解码的时候采用了选点归一化指数函数(pointer-softmax)，也就是两个输出层，供最后挑选归一化指数函数shortlist softmax和定位归一化指数函数(location softmax)，shortlistsoftmax就是传统的softmax，产生预定义输出词汇表(predefined output vocabulary)，对应复制网络copynet中的生成模式(generate-mode)，location softmax则表示某个词在输入端的位置，对应copynet中的复制模式(copy-mode)，对两个softmax输出进行加权和拼接得到所述样本问题。

步骤S05：建立基础机器阅读理解模型。

应理解的是，所述基础机器阅读理解模型可以是适应-长短期记忆(Match-Long-Short Term Memory，Match-LSTM)模型，Match-LSTM模型包括嵌入Embedding层、LSTM层和Match-LSTM层，Embedding层对段落和问题进行单词嵌入，LSTM层将段落和问题带入BiLSTM层，获取所有隐藏状态，使得段落和问题都带有上下文信息，Match-LSTM层主要作用是获取段落和问题的交互信息。

步骤S06：根据所述样本段落、所述样本答案和所述样本问题对所述基础机器阅读理解模型进行训练，获得预设机器阅读理解模型。

可理解的是，所述样本段落、所述样本答案和所述样本问题作为训练样本数据，对Match-LSTM模型进行训练，获得预设机器阅读理解模型，训练获得的所述预设机器阅读理解模型能够根据所述待理解段落及对应的目标问题进行答案预测。

进一步地，所述步骤S50之后，还包括：

将所述目标选项发送至所述目标终端。

需要说明的是，在进行阅读理解习题练习时，若一个问题存在ABCD四个待选句子选项，可对各待选句子选项与所述预测答案范围，句子从分词，列出所有词，对分词进行编码，计算词频，得出各待选句子选项与所述预测答案范围分别对应的词频向量之后，计算各待选句子选项与所述预测答案范围对应的向量之间夹角的余弦值，值越大相似度越高。

在具体实现中，本方案的机器阅读理解方法，还可应用于智能问答系统，比如，用户在使用电器时，针对电器的使用说明有疑问，问出问题，则可通过对所述说明书进行机器阅读理解，预测出用户问题对应的答案。

本实施例中，通过从数据库中获取开放数据，根据开放数据生成样本段落和样本答案，扩大了训练样本集的数量，根据大量的样本答案和样本问题对所述基础机器阅读理解模型进行训练，从而获得预测准确率更高的预设机器阅读理解模型。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有机器阅读理解程序，所述机器阅读理解程序被处理器执行时实现如上文所述的机器阅读理解方法的步骤。

此外，参照图5，本发明实施例还提出一种机器阅读理解装置，所述机器阅读理解装置包括：

获取模块10，用于获取待理解段落及对应的多个目标问题。

应理解的是，所述待理解段落为需要进行语义理解的段落，可以是一个设备的使用说明书，对于用户问出的多个所述目标问题，从所述使用说明书中找到对应的答案。所述目标问题为针对所述待理解段落提出的语义理解相关的问题，通过所述预设阅读理解模型对所述待理解段落进行语义分析，从而查找与所述目标问题对应的答案。

交互模块20，用于将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义。

筛选模块30，用于将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量。

预测模块40，用于所述有价值句子向量经过所述预设机器阅读理解模型的回答层，获得各所述目标问题的预测答案范围。

发送模块50，用于将所述预测答案范围发送至目标终端。

在一实施例中，所述交互模块20，还用于将所述待理解段落及对应的多个所述目标问题进行多线程处理，经过预设机器阅读理解模型的嵌入层，获得待理解段落的向量表示及各目标问题的向量表示；所述待理解段落的向量表示及各所述目标问题的向量表示经过所述预设机器阅读理解模型的编码层，获得所述待理解段落对应的段落语义及各所述目标问题对应的问题语义；所述段落语义及各所述问题语义经过所述预设机器阅读理解模型的交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义。

在一实施例中，所述筛选模块30，还用于经过所述预设机器阅读理解模型的筛选层，根据所述待理解段落的向量表示，通过门过滤概率公式计算门过滤概率；将所述待理解段落中每个句子的向量表示与所述门过滤概率点乘，获得所述待理解段落中每个句子门过滤后的向量表示；根据所述交互信息语义，将所述待理解段落中每个句子门过滤后的向量表示与各所述目标问题的向量表示通过预设交互公式进行注意力交互，获得与各所述目标问题关联性较强的有价值句子向量。

在一实施例中，所述门过滤概率公式为：

为所述待理解段落的集中资源的向量表示，b_g为偏置项。

在一实施例中，所述机器阅读理解装置还包括：

数据抽取模块，用于从预设数据库获取开放数据，对所述开放数据进行数据抽取，获得样本段落；

关键词提取模块，用于对所述样本段落进行关键词提取，获得所述样本段落对应的关键词；

生成模块，用于根据所述关键词生成样本答案；

所述生成模块，还用于根据所述样本段落和所述样本答案生成样本问题；

建立模块，用于建立基础机器阅读理解模型；

训练模块，用于根据所述样本段落、所述样本答案和所述样本问题对所述基础机器阅读理解模型进行训练，获得预设机器阅读理解模型。

在一实施例中，所述生成模块，还用于将所述样本段落和所述样本答案以向量形式进行表示，获得所述样本段落对应的段落词向量和所述样本答案对应的答案词向量；将所述段落词向量与预设二维特征拼接，获得输入段落词向量，所述预设二维特征向量表示段落单词是否在所述样本答案中出现；将所述答案词向量与位置向量进行拼接，获得输入答案词向量，所述位置向量为表示所述样本答案在所述样本段落中的位置；通过编码器解码器注意力模型中的编码器对所述输入段落词向量和所述输入答案词向量进行编码，获得注释段落词向量和注释答案词向量；根据所述注释段落词向量和所述注释答案词向量计算所述编码器解码器注意力模型中解码器的初始状态；根据所述解码器的初始状态、所述注释段落词向量和所述注释答案词向量，经过所述编码器解码器注意力模型中解码器进行解码，获得样本问题。

在一实施例中，所述机器阅读理解装置还包括：

计算模块，用于获取多个待选句子选项，计算各待选句子选项与所述预测答案范围之间的相似度，选取所述相似度最高的待选句子选项作为目标选项；

所述发送模块50，还用于将所述目标选项发送至所述目标终端。

本发明所述机器阅读理解装置的其他实施例或具体实现方式可参照上述各方法实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序，可将这些词语解释为标识。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如只读存储器镜像(Read Only Memory image，ROM)/随机存取存储器(Random AccessMemory，RAM)、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种机器阅读理解方法，其特征在于，所述机器阅读理解方法包括以下步骤：

获取待理解段落及对应的多个目标问题；

将所述预测答案范围发送至目标终端。

2.如权利要求1所述的机器阅读理解方法，其特征在于，所述将所述待理解段落及对应的多个所述目标问题进行多线程处理，依次经过预设机器阅读理解模型的嵌入层、编码层和交互层，获得所述待理解段落与各所述目标问题之间的交互信息语义，包括：

3.如权利要求2所述的机器阅读理解方法，其特征在于，所述将所述交互信息语义经过所述预设机器阅读理解模型的筛选层，获得与各所述目标问题关联性较强的有价值句子向量，包括：

4.如权利要求3所述的机器阅读理解方法，其特征在于，所述门过滤概率公式为：

为所述待理解段落的集中资源的向量表示，b_g为偏置项。

5.如权利要求1所述的机器阅读理解方法，其特征在于，所述获取待理解段落及对应的多个目标问题之前，所述机器阅读理解方法还包括：

根据所述关键词生成样本答案；

根据所述样本段落和所述样本答案生成样本问题；

建立基础机器阅读理解模型；

6.如权利要求5所述的机器阅读理解方法，其特征在于，所述根据所述样本段落和所述样本答案生成样本问题，包括：

7.如权利要求1-6中任一项所述的机器阅读理解方法，其特征在于，所述将所述预测答案范围发送至目标终端之后，所述机器阅读理解方法还包括：

将所述目标选项发送至所述目标终端。

8.一种机器阅读理解设备，其特征在于，所述机器阅读理解设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机器阅读理解程序，所述机器阅读理解程序被所述处理器执行时实现如权利要求1至7中任一项所述的机器阅读理解方法的步骤。

9.一种存储介质，其特征在于，所述存储介质上存储有机器阅读理解程序，所述机器阅读理解程序被处理器执行时实现如权利要求1至7中任一项所述的机器阅读理解方法的步骤。

10.一种机器阅读理解装置，其特征在于，所述机器阅读理解装置包括：

获取模块，用于获取待理解段落及对应的多个目标问题；

发送模块，用于将所述预测答案范围发送至目标终端。