CN110532374B

CN110532374B - 保险信息的处理方法及装置

Info

Publication number: CN110532374B
Application number: CN201910834137.XA
Authority: CN
Inventors: 陈健; 柳岸
Original assignee: Shenzhen Huize Times Technology Co ltd
Current assignee: Shenzhen Huize Times Technology Co ltd
Priority date: 2019-09-04
Filing date: 2019-09-04
Publication date: 2022-05-10
Anticipated expiration: 2039-09-04
Also published as: CN110532374A

Abstract

本申请提供了一种保险信息的处理方法及装置，通过获取用户输入的问题；将用户输入的问题输入至意图识别模型，判断用户输入的问题是否为保险常见问题；若用户输入的问题为保险常见问题，则将用户输入的问题输入至槽值提取模型，确定出用户输入的问题中的关键信息；根据用户输入的问题中的关键信息，查询得到与用户输入的问题相对应的答案，将与用户输入的问题相对应的答案发送至用户。本申请通过将用户输入的问题输入至意图识别模型、槽值提取模型后，确定出用户输入问题中的关键信息，进而查询得到与用户输入的问题相对应的答案，实现对用户的自动答复，提高了保险销售客服的答复效率。

Description

保险信息的处理方法及装置

技术领域

本发明涉及保险信息处理领域，尤其涉及一种保险信息的处理方法及装置。

背景技术

随着互联网的发展，越来越多保险行业的销售客服采用互联网通信方式与客户进行交流，为客户提供保险产品的相关服务。由于互联网通信方式的沟通效率较高，保险行业的销售客服面对的客户群体非常庞大，客服需要答复的问题数量也非常多。

保险行业的销售客服在实际工作的过程中，即使面对的是重复性较高的常见问题，也需要进行相关的查找、复制、粘贴等工作来对每一位客户进行答复，这也造成销售客服在工作过程中进行了很多次重复性的回答，答复效率较低。

发明内容

基于上述现有技术的不足，本申请提出了一种保险信息的处理方法及装置，能够实现自动答复用户输入的保险常见问题。

为解决上述问题，现提出的方案如下：

本发明第一方面公开了一种保险信息的处理方法，包括：

获取用户输入的问题；

将所述用户输入的问题输入至意图识别模型，判断所述用户输入的问题是否为保险常见问题；其中，所述保险常见问题为具有保险购买意图的问题；

若所述用户输入的问题为保险常见问题，则将所述用户输入的问题输入至槽值提取模型，确定出所述用户输入的问题中的关键信息；其中，所述关键信息为所述用户输入的问题中的与保险相关的信息；

根据所述用户输入的问题中的关键信息，查询得到与所述用户输入的问题相对应的答案，将与所述用户输入的问题相对应的答案发送至所述用户。

可选地，在上述保险信息的处理方法中，所述意图识别模型的创建方法，包括：

构建训练语料集；其中，所述训练语料集中包括从多个用户的聊天记录中提取出的用户提出的问题；

任意选取所述训练语料集中的部分问题，作为意图识别训练的语料；

采用第一类标签标记所述意图识别训练的语料中的所述保险常见问题；

将标记后的意图识别训练的语料使用神经网络进行训练，得到所述意图识别模型。

可选地，在上述保险信息的处理方法中，所述采用第一标签标记所述意图识别训练的语料中的所述保险常见问题之前，还包括：

将保险相关词依据保险的特征属性进行分类，形成多个专有词典；其中，每一个所述专有词典对应保险的其中一种特征属性；

将所述训练语料集中的问题输入所述多个专有词典中，将所述训练语料集中属于所述专有词典的词标记为对应特征属性的标签；

其中，所述任意选取所述训练语料集中的部分问题，作为意图识别训练的语料，包括：

任意选取标记后的训练语料集中的部分问题，作为意图识别训练的语料。

可选地，在上述保险信息的处理方法中，所述槽值提取模型的创建方法，包括：

任意选取所述标记后的训练语料集中的部分问题，作为槽值提取训练的语料；

采用第二类标签标记所述槽值提取训练的语料中具有所述关键信息的词；

将标记后的槽值提取训练的语料使用预训练模型进行训练，得到所述槽值提取模型。

可选地，在上述保险信息的处理方法中，所述得到所述意识识别模型和所述槽值提取模型之后，还包括：

构建测试语料集；其中，所述测试语料集中包括从多个用户的聊天记录中提取出的用户提出的问题，和/或，依据预设的规则生成的问题；

对所述测试语料集进行预标记处理；

将未进行预标记处理的测试语料集输入至所述意图识别模型，得到意图识别标记后的测试语料集；

将所述未进行预标记处理的测试语料集输入至所述槽值提取模型，得到槽值提取标记后的测试语料集；

依据所述意图识别标记后的测试语料集与所述进行预标记处理的测试语料集，得到所述意图识别模型的准确率；

依据所述槽值提取标记后的测试语料集与所述进行预标记处理的测试语料集，得到所述槽值提取模型的准确率；

判断所述意图识别模型的准确率是否小于第一阈值；

若所述意图识别模型的准确率小于所述第一阈值，则返回至所述构建训练语料集步骤中；

判断所述槽值提取模型的准确率是否小于第二阈值；

若所述槽值提取模型的准确率小于所述第二阈值，则返回至所述构建训练语料集的步骤中。

可选地，在上述保险信息的处理方法中，所述对所述测试语料集进行预标记处理，包括：

采用所述第一类标签标记所述测试语料集中的所述保险常见问题；

采用所述第二类标签标记所述测试语料集中具有所述关键信息的词。

本发明第二方面公开了一种保险信息的处理装置，包括：

获取单元，用于获取用户输入的问题；

第一判断单元，用于将所述用户输入的问题输入至意图识别模型，判断所述用户输入的问题是否为保险常见问题；其中，所述保险常见问题为具有保险购买意图的问题；

确定单元，用于若所述用户输入的问题为保险常见问题，则将所述用户输入的问题输入至槽值提取模型，确定出所述用户输入的问题中的关键信息；其中，所述关键信息为所述用户输入的问题中的与保险相关的信息；

发送单元，用于根据所述用户输入的问题中的关键信息，查询得到与所述用户输入的问题相对应的答案，将与所述用户输入的问题相对应的答案发送至所述用户。

可选地，在上述保险信息的处理装置中，还包括：

第一构建单元，用于构建训练语料集；其中，所述训练语料集中包括从多个用户的聊天记录中提取出的用户提出的问题；

第一选取单元，用于任意选取所述训练语料集中的部分问题，作为意图识别训练的语料；

第一标记单元，用于采用第一类标签标记所述意图识别训练的语料中的所述保险常见问题；

第一训练单元，用于将标记后的意图识别训练的语料使用神经网络进行训练，得到所述意图识别模型。

可选地，在上述保险信息的处理装置中，还包括：

分类单元，用于将保险相关词依据保险的特征属性进行分类，形成多个专有词典；其中，每一个所述专有词典对应保险的其中一种特征属性；

第二标记单元，用于将所述训练语料集中的问题输入所述多个专有词典中，将所述训练语料集中属于所述专有词典的词标记为对应特征属性的标签；

其中，所述第一选取单元执行任意选取所述训练语料集中的部分问题，作为意图识别训练的语料时，用于：

可选地，在上述保险信息的处理装置中，还包括：

第二选取单元，用于任意选取所述标记后的训练语料集中的部分问题，作为槽值提取训练的语料；

第三标记单元，用于采用第二类标签标记所述槽值提取训练的语料中具有所述关键信息的词；

第二训练单元，用于将标记后的槽值提取训练的语料使用预训练模型进行训练，得到所述槽值提取模型。

可选地，在上述保险信息的处理装置中，还包括：

第二构建单元，用于构建测试语料集；其中，所述测试语料集中包括从多个用户的聊天记录中提取出的用户提出的问题，和/或，依据预设的规则生成的问题；

预标记单元，用于对所述测试语料集进行预标记处理；

第四标记单元，用于将未进行预标记处理的测试语料集输入至所述意图识别模型，得到意图识别标记后的测试语料集；

第五标记单元，用于将所述未进行预标记处理的测试语料集输入至所述槽值提取模型，得到槽值提取标记后的测试语料集；

第一测试单元，用于依据所述意图识别标记后的测试语料集与所述进行预标记处理的测试语料集，得到所述意图识别模型的准确率；

第二测试单元，用于依据所述槽值提取标记后的测试语料集与所述进行预标记处理的测试语料集，得到所述槽值提取模型的准确率；

第二判断单元，用于判断所述意图识别模型的准确率是否小于第一阈值；

若所述第二判断单元判断出所述意图识别模型的准确率小于所述第一阈值，则返回至所述第一构建单元中；

第三判断单元，用于判断所述槽值提取模型的准确率是否小于第二阈值；若所述第三判断单元判断出所述槽值提取模型的准确率小于所述第二阈值，则返回至所述第一构建单元中。

可选地，在上述保险信息的处理装置中，所述预标记单元，包括：

第一预标记子单元，用于采用所述第一类标签标记所述测试语料集中的所述保险常见问题；

第二预标记子单元，用于采用所述第二类标签标记所述测试语料集中具有所述关键信息的词。

从上述技术方案可以看出，本申请提供的保险信息的处理方法中，通过获取用户输入的问题；将用户输入的问题输入至意图识别模型，判断用户输入的问题是否为保险常见问题；其中，保险常见问题为具有保险购买意图的问题。若用户输入的问题为保险常见问题，则将用户输入的问题输入至槽值提取模型，确定出用户输入的问题中的关键信息。其中，关键信息为用户输入的问题中的与保险相关的信息。根据用户输入的问题中的关键信息，查询得到与用户输入的问题相对应的答案，将与用户输入的问题相对应的答案发送至用户。本申请通过将用户输入的问题输入至意图识别模型、槽值提取模型后，确定出用户输入问题中的关键信息，进而查询得到与用户输入的问题相对应的答案，实现对用户的自动答复，提高了保险销售客服的答复效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例公开的一种保险信息的处理方法的流程示意图；

图2为本发明实施例公开的一种意图识别模型的创建方法的流程示意图；

图3为本发明实施例公开一种采用专有词典标记训练语料集的方法的流程示意图；

图4为本发明实施例公开的一种槽值提取模型的创建方法的流程示意图；

图5为本发明实施例公开的一种测试意图识别模型以及槽值提取模型的准确率的方法的流程示意图；

图6为本发明实施例公开的一种测试语料集预标记处理方法的流程示意图；

图7为本发明实施例公开的一种保险销售信息的处理装置。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，本申请实施例公开了一种保险信息的处理方法，具体包括以下步骤：

S101、获取用户输入的问题。

其中，用户输入的问题指的是用户向保险销售客服人员发送的信息。这些信息中可能是与保险相关的信息，例如“帮我介绍一下保险”、“我想购买保险”等，也可能是与保险不相关的信息，例如“在吗”、“你好吗”等。需要说明的是，步骤S101中所指的问题并不特指问句形式的语句，用户向保险销售人员发送的信息均属于用户输入的问题。

可选地，在本申请一具体实施例中，执行完步骤S101之后，还可以对用户输入的问题进行清洗、校对等操作。具体地，可以将用户输入的文字的编码格式进行统一、对用户输入的特殊符号进行删除或者进行替换成标准符号的处理、对用户输入的文字中的错别字进行校对，替换成正确的文字等。将经过清洗、校对后的用户输入的问题会更便于进行语义识别。

S102、将用户输入的问题输入至意图识别模型，判断用户输入的问题是否为保险常见问题。

其中，保险常见问题为具有保险购买意图的问题。具有保险购买意图的问题中包括询问保险产品信息的问题、询问保险细则的问题、咨询某一类险种的问题等与保险相关的问题。例如，“我想购买保险”、“我想购买车险”、“重疾险包括哪些疾病”等等。而不具备购买意图的问题，例如“在吗”、“你好吗”、“收到我的订单了吗”等等，则不属于保险常见问题。当意图识别模型识别出用户输入问题的意图，即识别出用户输入的问题的目的性之后，即可判断出用户输入的问题是否具有保险购买意图。需要说明的是，若执行完步骤S101之后，还有对用户输入的问题进行了校对、清洗等操作，那么用户输入的问题输入至意图识别模型后，识别出用户的具体意图的速率以及准确率会更高。

当步骤S102判断出用户输入的问题为保险常见问题后，则执行步骤S103；当步骤S102判断出用户输入的问题不是保险常见问题后，则结束处理，不对该问题进行自动答复，而是交给保险销售客服进行相应的解答。

可选地，参阅图2，在本申请一具体实施例中，意图识别模型的创建方法，具体包括以下步骤：

S201、构建训练语料集。

其中，训练语料集中包括从多个用户的聊天记录中提取出的用户提出的问题。用户的聊天记录指的是实际应用场景中用户与保险销售客服的聊天记录。通过选用用户与保险销售客服实际应用场景下的聊天记录中的问题作为语料集，可提高训练出的意图识别模型在实际应用场景中识别问题的准确率。其中，训练语料集是用于训练意图识别模型的语料集，训练语料集中的语料越多，即提取出的用户问题样本越多，训练出的意图识别模型的准确率也就越高。还需要说明的是，训练语料集中既可以包含从聊天记录中提取到的保险常见问题，也可以包含一些非保险常见问题的问题，具体可根据训练出的意图识别模型的准确率，调整训练语料集中保险常见问题与非保险常见问题的比例。

S202、任意选取训练语料集中的部分问题，作为意图识别训练的语料。

作为意图识别训练的语料越多，训练出的意图识别模型就会越准确，因此步骤S202中的选取的问题的数量，可以根据实际应用中意图识别模型的准确性进行调整。若意图识别模型识别准确率较低，可以返回至步骤S201中重新构建训练语料集，也可以增加步骤S201中训练语料集中的问题数量，还可以在执行步骤S202时增加作为意图识别训练的语料的数量等。

S203、采用第一类标签标记意图识别训练的语料中的保险常见问题。

其中，第一类标签用于标记意图识别训练的语料中具有保险购买意图的问题。具体的，具有保险购买意图的问题包括询问某一类保险产品相关信息的问题、询问某一险种的实施细则的问题、不包含任何保险产品信息的保险相关问题等等，这些具有保险购买意图的问题都可以采用第一类标签进行标记。可选地，不具有保险购买意图的问题，可以采用区别于第一类标签的标签进行标记。例如，对于具有保险购买意图的问题，可以在该问题上标记“保险常见问题”，对于不具有保险购买意图的问题，则可以在该问题上标记为“其他问题”。需要说明的是，对于不具有保险购买意图的问题，也可以不进行任何标记，这样可以通过是否具有第一类标签来区分开是否为保险常见问题。

可选地，在本申请一具体实施例中，第一类标签可以包括根据保险具体意图划分的多个标签。由于属于保险购买意图的问题可以根据具体意图细分为多个不同的类别，因此可以识别出问题的具体意图后，标上代表识别出的具体意图的标签。例如，“我想买保险”、“帮我推荐个保险”、“我想给父母买保险”等属于不包含任何保险产品信息的保险常见问题，可以用“普通类”标签进行标记；“我想买重疾险”、“帮我推荐一款重疾险”等属于包含了保险产品信息的保险常见问题，可以用“产品类”标签进行标记；“我想了解下疾病细则”、“介绍一下保险疾病报销的内容”等属于咨询保险细则的保险常见问题，可以用“细则类”标签进行标记；“介绍一下某保险产品的豁免权”、“某保险产品的门诊包括哪些”等属于即包含了产品又包含了有关该产品的具体细则的问题，可以用“产品和细则类”标签进行标记。而上述提到的“普通类”、“产品类”、“细则类”以及“产品和细则类”都属于第一类标签，即都属于保险常见问题。其中，第一类标签的具体划分方式包括但不仅限于本申请实施例提出的具体实施方式。

通过将第一类标签根据保险具体意图划分成多个标签，即把保险常见问题分类得更细后，可提高后续使用槽值提取模型进行标记的效率。

可选地，参阅图3，在本申请一具体实施例中，执行步骤S203之前，还包括：

S301、将保险相关词依据保险的特征属性进行分类，形成多个专有词典。

其中，每一个专有词典对应保险的其中一种特征属性。保险的特征属性具体包括保险产品名称、保险实施细则、险种、疾病等。保险相关词根据保险的特征属性划分成多个类别，例如，将属于保险产品名称的保险相关词整合起来，形成保险产品名称专有词典；将属于保险报销范围的疾病整合起来，形成疾病专有词典；将保险的险种进行整合，形成险种专有词典等等。当出现了新的保险产品之后，还需要将与新的保险产品相关的保险相关词加入到相应的专有词典中，更新专有词典。

S302、将训练语料集中的问题输入多个专有词典中，将训练语料集中属于专有词典的词标记为对应特征属性的标签。

其中，将训练语料集中属于专有词典的词标记为对应特征属性的标签，指的是将训练语料集中属于专有词典的词直接替换为对应特征属性的标签。

具体地，给每一个保险的特征属性分配一个标签，并用该标签来标记属于这一特征属性的词。例如有关保险产品名称这一属性可分配“名称(Name)”作为标签、疾病这一属性可分配“疾病(Sick)”作为标签、险种这一属性可分配“保险(Insure)”作为标签等。给每一个保险的特征属性分配好对应的标签后，将训练语料集中的问题输入多个专有词典中，将训练语料集中属于专有词典的词标记为对应特征属性的标签。例如，训练语料集中的其中一个问题为“我想买重疾险”，问题中的“重疾险”属于险种特征属性的专有词典中的词，因此可将语料中的“重疾险”替换成对应特征属性的标签，即把“我想买重疾险”替换成了“我想买Insure”，同样的，如果训练语料集中的问题是“我想买车险”，“车险”也同样是险种特征属性的词，因此也会被替换成“我想买Insure”。

其中，执行步骤S202时，包括：任意选取标记后的训练语料集中的部分问题，作为意图识别训练的语料。

将标记后的训练语料集中的部分问题作为意图识别训练的语料，可以在执行步骤S203时，加快采用第一类标签标记的效率。由于意图识别训练的语料中，属于同一保险特征属性的词都采用了相同的标签进行过标记，因此采用第一类标签进行标记时，可以不先对语料的具体语义进行识别，而是先识别对应特征属性的标签，即可知道具体的语义，因此加快了采用第一类标签进行标记的效率。

需要说明的是，执行步骤S302时，也可以不对整个训练语料集都进行标记，也可以只将步骤S202中作为意图识别训练的语料输入到多个专有词典中，将作为意图识别训练的语料中属于专有词典的词标记为对应特征属性的标签。

还需要说明的是，在图1示出的实施例中，在执行步骤S102之前，即将用户输入的问题输入至意图识别模型之前，也可以执行步骤S302。将步骤S101中得到的用户输入的问题输入至多个专有词典中，将问题中属于专有词典的词标记为对应特征属性的标签，然后再将进行了标记后的问题输入到意图识别模型中，即执行步骤S102。通过多个专有词典对用户输入的问题进行标记，可以提高意图识别模型对用户输入的问题的识别速率，意图识别模型可以直接对标记了的词进行识别，进而可以更快地确认出用户输入的问题是否是保险常见问题。

S204、将标记后的意图识别训练的语料使用神经网络进行训练，得到意图识别模型。

执行完步骤S203之后，意图识别训练的语料中的保险常见问题均采用了第一类标签进行了标记。将标记后的意图识别训练的语料送入至神经网络中进行训练，最终得到意图识别模型。意图识别模型可对未使用第一类标签进行过标记处理的语料进行意图识别，然后用第一类标签对语料进行标记。得到的意图识别模型可用于执行步骤S102，判断出用户输入的问题是否为保险常见问题，如果是保险常见问题，意图识别模型会采用第一类标签进行标记。

具体地，根据步骤S203中采用了第一类标签进行标记的语料以及步骤S202中的未使用第一类标签进行标记的意图识别训练的语料，可得到意图识别模型。步骤S203中采用了第一类标签进行标记的语料相当于意图识别模型的输出，而步骤S202中的未使用第一类标签进行标记的意图识别训练的语料相当于是意图识别模型的输入。根据已知的输入以及与输入相对应的输出，通过神经网络训练，即可得到意图识别模型。

S103、将用户输入的问题输入至槽值提取模型，确定出用户输入的问题中的关键信息。

其中，关键信息为用户输入的问题中的与保险相关的信息。与保险相关的信息词包括保险名称、保险细则、保险险种等等。通过槽值提取模型识别出用户输入的问题的具体语义，然后从中识别出与保险信息相关的词，将保险相关的信息词确定为关键信息词。具体地，槽值提取模型可采用特定的标签对用户输入的问题中的保险关键信息进行标记。需要说明的是，槽值提取模型标记关键信息的标签可以是统一的标签，也可以是依据具体的关键信息的内容分配的不同的标签。例如，对于输入问题中的关键信息词，槽值提取模型可以统一采用“关键”标签进行标记。也可以将关键信息词简单划分为产品和细则两大类，把产品名称、险种等这类与保险产品相关的信息词归为产品类，标记为“产品(Product)”标签；而各种疾病类词语等涉及到保险细则的词，标记为“细则(Detail)”标签。槽值提取模型标记关键信息的具体形式很多，包括但不仅限于本申请实施例中提出的内容。

还需要说明的是，若在执行步骤S103之前，将步骤S101中得到的用户输入的问题输入至多个专有词典中，将问题中属于专有词典的词标记为对应特征属性的标签，那么再将进行了标记后的问题输入到意图识别模型识别出保险常见问题后，再输入至槽值提取模型中时，即执行步骤S103，那么槽值提取模型确定出关键信息的效率会得到提高。

可选地，参阅图4，在本申请一具体实施例中，槽值提取模型的创建方法，具体包括以下步骤：

S401、任意选取标记后的训练语料集中的部分问题，作为槽值提取训练的语料。

其中，训练语料集指的是图2示出的步骤S201中构建的训练语料集。在进行槽值提取模型的创建的过程中，可以和图2示出的意图识别模型创建方法采用相同的训练语料集，也可以重新执行步骤S201，重新构建一个训练语料集用于训练槽值提取模型。标记后的训练语料集指的是经过图3示出的方法处理后的训练语料集。需要说明的是，槽值提取训练的语料可以不从标记后的训练语料集中选取，也可以直接从步骤S201中构建的未经过专有词典标记的训练语料集中选取。但经过专有词典进行标记后的训练语料集，在进行槽值提取训练时的效率会更高。

S402、采用第二类标签标记槽值提取训练的语料中具有关键信息的词。

其中，第二类标签可以只包括一种标签，即将槽值提取训练的语料中的所有关键信息词全部采用统一的标签进行标记。而对于语料中不是关键信息词的词，则可以不标记或者采用区别于第二类标签的标签进行标记。例如，未经标记的训练语料集中的其中一个问题为“我想买重疾险，介绍下它的疾病细则”，经过图3示出的方法处理后，这个问题就被标记成了“我想买Insure，介绍下它的Sick细则”。通过图3的处理后，我们可以很容易看到关键信息的词就是“Insure”和“Sick”。因此，参阅表一，可以将“Insure”和“Sick”采用统一的“关键”标签做标记。其他不是关键信息的词则用“O”来标记。

表一：

第二类标签还可以包括多个标签。其中，多个标签代表着关键信息划分成的多个类别。例如，可以将关键信息中与保险产品相关的信息词都归为产品类别，采用“Product”标签进行标记。险种、保险产品名称等均属于产品类。将关键信息中与保险细则相关的信息词都归为细则类，采用“Detail”标签进行标记。至于其他不是关键信息的词，则可以用区别于第二类标签的标签做标记，或者不进行任何标记。例如，未经标记的训练语料集中的其中一个问题为“我想买重疾险，介绍下它的疾病细则”，经过图3示出的方法处理后，这个问题就被标记成了“我想买Insure，介绍下它的Sick细则”。通过图3的处理后，我们可以很容易看到关键信息的词就是“Insure”和“Sick”。其中，“Insure”是保险信息中的产品类的关键词，“Sick”是保险信息中的细则类的词。因此，参阅表二，将“Insure”采用“Product”标签进行标记，将“Sick”采用“Detail”标签进行标记。其他的不是关键信息的词则都用“O”进行标记。

表二：

S403、将标记后的槽值提取训练的语料使用预训练模型进行训练，得到槽值提取模型。

将步骤S402中得到的标记后的槽值提取训练的语料使用预训练模型进行训练，得到槽值提取模型。通过步骤S403得到的槽值提取模型，可对未采用第二类标签进行过标记处理的语料进行槽值提取，然后用第二类标签对语料进行标记。得到的槽值提取模型可用于执行步骤S103，确定出用户输入的问题中的关键信息，采用第二类标签标记出问题汇总的关键信息

具体地，根据步骤S402中采用了第二类标签进行标记的语料以及步骤S401中的未使用第二类标签进行标记的槽值提取训练的语料，可通过预训练模型的训练得到槽值提取模型。步骤S402中采用了第二类标签进行标记的语料相当于槽值提取模型的输出，而步骤S401中的未使用第二类标签进行标记的槽值提取训练的语料相当于是槽值提取模型的输入。根据已知的输入以及与输入相对应的输出，通过预训练模型的训练，即可得到槽值提取模型。

可选地，参阅图5，在本申请一具体实施例中，通过图2示出的方法得到了意图识别模型以及通过图4示出的方法得到槽值提取模型之后，还可以包括以下步骤：

S501、构建测试语料集。

其中，测试语料集中包括从多个用户的聊天记录中提取出的用户提出的问题，和/或，依据预设的规则生成的问题。预设的规则指的是符合正常询问语句，即具备主语、谓语以及宾语的问题。从多个用户的聊天记录中提取出的用户提出的问题可以是与保险相关的问题，也可以是与保险无关的问题。同样的，根据预设规则生成的问题可以是与保险相关的问题，也可以是与保险无关的问题。而测试语料集中与保险相关的问题以及与保险无关问题所占的比重则可根据实际应用情况进行调整。

需要说明的是，执行步骤S501可以在通过图2示出的方法得到了意图识别模型以及通过图4示出的方法得到槽值提取模型之后再执行，也可以在得到这两个模型之前的任意时刻执行，不影响本申请实施例的实现。

S502、对测试语料集进行预标记处理。

对测试语料集进行预标记处理，就是在未使用意图识别模型前，就预标记出测试语料集中的保险常见问题，且在未使用槽值提取模型前，就预标记出测试语料集中的保险常见问题的关键信息。

可选地，参阅图6，在本申请一具体实施例中，执行步骤S502的一种方式，包括：

S601、采用第一类标签标记测试语料集中的保险常见问题。

其中，步骤S601标记的过程以及执行原理与图2示出的步骤S203是相同的，可参见，此处不再赘述。

S602、采用第二类标签标记测试语料集中具有关键信息的词。

需要说明的是，执行步骤S601与执行步骤S602的先后顺序不影响本申请实施例的实现。

其中，步骤S602标记的过程以及执行原理与图4示出的步骤S402是相同的，可参见，此处不再赘述。

S503、将未进行预标记处理的测试语料集输入至意图识别模型，得到意图识别标记后的测试语料集。

其中，未进行预标记处理的测试语料集指的是步骤S501中构建的测试语料集，而输入的意图识别模型则是由图2示出的方法得到的意图识别模型。将未进行预标记处理的测试语料集输入至意图识别模型后，意图识别模型会对语料进行意图识别，将属于保险常见问题的语料用第一类标签进行标记，得到意图识别标记后的测试语料集。

S504、依据意图识别标记后的测试语料集与进行预标记处理的测试语料集，得到意图识别模型的准确率。

将步骤S503得到的意图识别标记后的测试语料集与步骤S502中进行预标记处理的测试语料集进行比对，看意图识别标记后的测试语料集与预标记处理的是否一致，计算出标记一致的语料占总的测试语料集的比例值，即计算出意图识别模型的准确率。

S505、判断意图识别模型的准确率是否小于第一阈值。

其中，第一阈值为预设的意图识别模型的准确率的一个标准值，可依据实际情况进行更改。若意图识别模型的准确率小于第一阈值，则认为训练出的意图识别模型不合格，需要执行步骤S506，重新构建训练语料集。即返回至图2示出的步骤S201中，然后再依据重新构建的语料集重新执行图2示出的方法，重新训练意图识别模型。若意图识别模型的准确率不小于第一阈值，则结束测试，认为该意图识别模型合格，可使用该意图识别模型执行图1示出的步骤S102。

S506、重新构建训练语料集。

步骤S506构建训练语料集的执行原理及过程与图2示出的步骤S201一致，重新构建的训练语料集用来执行图2示出的方法。

S507、将未进行预标记处理的测试语料集输入至槽值提取模型，得到槽值提取标记后的测试语料集。

其中，未进行预标记处理的测试语料集指的是步骤S501中构建的测试语料集，而输入的槽值提取模型则是由图4示出的方法得到的槽值提取模型。将未进行预标记处理的测试语料集输入至槽值提取模型后，槽值提取模型会对测试语料集中的语料进行槽值提取，将测试语料集中的关键信息用第二类标签进行标记，得到槽值提取标记后的测试语料集。

需要说明的是，步骤S507可在步骤S501之后的任意时刻执行，均不影响本申请实施例的实现。

S508、依据槽值提取标记后的测试语料集与进行预标记处理的测试语料集，得到槽值提取模型的准确率。

将步骤S507得到的槽值提取标记后的测试语料集与步骤S508中进行预标记处理的测试语料集进行比对，看槽值提取标记的测试语料集与预标记处理的是否一致，计算出标记一致的语料占总的测试语料集的比例值，即计算出槽值提取模型的准确率。

S509、判断槽值提取模型的准确率是否小于第二阈值。

其中，第二阈值为预设的槽值提取模型的准确率的一个标准值，可依据实际情况进行更改。若槽值提取模型的准确率小于第二阈值，则认为图4训练出的槽值提取模型不合格，需要执行步骤S510，即重新构建训练语料集，然后使用重新构建的训练语料集执行图4示出的方法，即重新训练槽值提取模型。若槽值提取模型的准确率不小于第二阈值，则结束测试，认为该槽值提取模型合格，可使用该槽值提取模型执行图1示出的步骤S103。

S510、重新构建训练语料集。

步骤S510构建训练语料集的执行原理及过程与图2示出的步骤S201一致，将步骤S510重新构建的训练语料集用来执行图4示出的方法。

经过图5示出的方法，可检验出图2训练出的意图识别模型是否合格，以及检验出图4训练出的槽值提取模型是否合格，如果不合格，则重新进行模型训练。通过图5示出的方法所最终确认的意图识别模型，在执行步骤S102时标记的准确率较高，通过图5示出的方法所最终确认的槽值提取模型，在执行步骤S103时标记的准确率也较高。

S104、根据用户输入的问题中的关键信息，查询得到与用户输入的问题相对应的答案，将与用户输入的问题相对应的答案发送至用户。

具体地，保险常见问题的答案存储于知识库中，根据步骤S103确定出的关键信息，对知识库进行查询，将查询到的答案发送至用户，实现自动答复。其中，保险常见问题的问题以及对应的答案可以采用表三示出的表的方式存储的知识库中，也可以采用别的形式进行存储，均不影响本申请实施例的实现。

表三：

问题	回答
		我想买保险	您好，请提供被保险人的姓名、年龄....
....	....

还需要说明的是，对于步骤S102中判断出的不属于保险常见问题的问题，知识库也可进行收集存储，便于后续进行数据分析和研究。

本申请提供的保险信息的处理方法中，通过获取用户输入的问题；将用户输入的问题输入至意图识别模型，判断用户输入的问题是否为保险常见问题；其中，保险常见问题为具有保险购买意图的问题。若用户输入的问题为保险常见问题，则将用户输入的问题输入至槽值提取模型，确定出用户输入的问题中的关键信息。其中，关键信息为用户输入的问题中的与保险相关的信息。根据用户输入的问题中的关键信息，查询得到与用户输入的问题相对应的答案，将与用户输入的问题相对应的答案发送至用户。本申请通过将用户输入的问题输入至意图识别模型、槽值提取模型后，确定出用户输入问题中的关键信息，进而查询得到与用户输入的问题相对应的答案，实现对用户的自动答复，提高了保险销售客服的答复效率。

基于上述本申请实施例提供的保险信息的处理方法，本申请实施例对应公开了一种保险信息的处理装置，参阅图7，保险信息的处理装置包括：获取单元701、第一判断单元702、确定单元703以及发送单元704。

获取单元701，用于获取用户输入的问题。

第一判断单元702，用于将用户输入的问题输入至意图识别模型，判断用户输入的问题是否为保险常见问题。

其中，保险常见问题为具有保险购买意图的问题。

可选地，在本申请一具体实施例中，还可以包括：第一构建单元、第一选取单元、第一标记单元以及第一训练单元。

第一构建单元，用于构建训练语料集。其中，训练语料集中包括从多个用户的聊天记录中提取出的用户提出的问题。

第一选取单元，用于任意选取训练语料集中的部分问题，作为意图识别训练的语料。

第一标记单元，用于采用第一类标签标记意图识别训练的语料中的所述保险常见问题。

第一训练单元，用于将标记后的意图识别训练的语料使用神经网络进行训练，得到意图识别模型。

确定单元703，用于若用户输入的问题为保险常见问题，则将用户输入的问题输入至槽值提取模型，确定出用户输入的问题中的关键信息。

其中，关键信息为用户输入的问题中的与保险相关的信息。

可选地，在本申请一具体实施例中，还可以包括：分类单元、第二标记单元。

分类单元，用于将保险相关词依据保险的特征属性进行分类，形成多个专有词典。其中，每一个专有词典对应保险的其中一种特征属性。

第二标记单元，用于将训练语料集中的问题输入所个专有词典中，将训练语料集中属于专有词典的词标记为对应特征属性的标签。

其中，第一选取单元执行任意选取训练语料集中的部分问题，作为意图识别训练的语料时，用于：

可选地，在本申请一具体实施例中，还可以包括：第二构建单元、预标记单元、第四标记单元、第五标记单元、第一测试单元、第二测试单元、第二判断单元以及第三判断单元。

第二构建单元，用于构建测试语料集。其中，测试语料集中包括从多个用户的聊天记录中提取出的用户提出的问题，和/或，依据预设的规则生成的问题。

预标记单元，用于对测试语料集进行预标记处理。

可选地，在本申请一具体实施例中，预标记单元，包括：第一预标记子单元和第二预标记子单元。

第一预标记子单元，用于采用第一类标签标记测试语料集中的保险常见问题。

第二预标记子单元，用于采用第二类标签标记测试语料集中具有关键信息的词。

第四标记单元，用于将未进行预标记处理的测试语料集输入至意图识别模型，得到意图识别标记后的测试语料集。

第五标记单元，用于将未进行预标记处理的测试语料集输入至槽值提取模型，得到槽值提取标记后的测试语料集。

第一测试单元，用于依据意图识别标记后的测试语料集与进行预标记处理的测试语料集，得到意图识别模型的准确率。

第二测试单元，用于依据槽值提取标记后的测试语料集与进行预标记处理的测试语料集，得到槽值提取模型的准确率。

第二判断单元，用于判断意图识别模型的准确率是否小于第一阈值。

若第二判断单元判断出意图识别模型的准确率小于第一阈值，则返回至第一构建单元中。

第三判断单元，用于判断槽值提取模型的准确率是否小于第二阈值。若第三判断单元判断出槽值提取模型的准确率小于第二阈值，则返回至第一构建单元中。

发送单元704，用于根据用户输入的问题中的关键信息，查询得到与用户输入的问题相对应的答案，将与用户输入的问题相对应的答案发送至用户。

上述本申请实施例公开的保险信息的处理装置中的具体的原理和执行过程，与上述本申请实施例公开的保险信息的处理方法相同，可参见上述本申请实施例公开的保险信息的处理方法中相应的部分，这里不再进行赘述。

本申请提供的保险信息的处理装置中，通过获取单元701获取用户输入的问题；又通过第一判断单元702将用户输入的问题输入至意图识别模型，判断用户输入的问题是否为保险常见问题；其中，保险常见问题为具有保险购买意图的问题。若用户输入的问题为保险常见问题，则确定单元703将用户输入的问题输入至槽值提取模型，确定出用户输入的问题中的关键信息。其中，关键信息为用户输入的问题中的与保险相关的信息。发送单元704根据用户输入的问题中的关键信息，查询得到与用户输入的问题相对应的答案，将与用户输入的问题相对应的答案发送至用户。本申请通过将用户输入的问题输入至意图识别模型、槽值提取模型后，由确定单元703确定出用户输入问题中的关键信息，进而由发送单元704查询得到与用户输入的问题相对应的答案，实现对用户的自动答复，提高了保险销售客服的答复效率。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种保险信息的处理方法，其特征在于，包括：

获取用户输入的问题；

若所述用户输入的问题为保险常见问题，则将所述用户输入的问题输入至槽值提取模型，确定出所述用户输入的问题中的关键信息；其中，所述关键信息为所述用户输入的问题中的与保险相关的信息；根据所述用户输入的问题中的关键信息，查询得到与所述用户输入的问题相对应的答案，将与所述用户输入的问题相对应的答案发送至所述用户；

所述槽值提取模型的创建方法，包括：任意选取标记后的训练语料集中的部分问题，作为槽值提取训练的语料；采用第二类标签标记所述槽值提取训练的语料中具有所述关键信息的词；将标记后的槽值提取训练的语料使用预训练模型进行训练，得到所述槽值提取模型。

2.根据权利要求1所述的方法，其特征在于，所述意图识别模型的创建方法，包括：

3.根据权利要求2所述的方法，其特征在于，所述采用第一标签标记所述意图识别训练的语料中的所述保险常见问题之前，还包括：

4.根据权利要求2所述的方法，其特征在于，所述得到所述意图识别模型和所述槽值提取模型之后，还包括：

对所述测试语料集进行预标记处理；

将未进行预标记处理的测试语料集输入至意图识别模型，得到意图识别标记后的测试语料集；

判断所述意图识别模型的准确率是否小于第一阈值；

若所述意图识别模型的准确率小于所述第一阈值，则返回至所述构建测试语料集步骤中；

判断所述槽值提取模型的准确率是否小于第二阈值；

若所述槽值提取模型的准确率小于所述第二阈值，则返回至所述构建测试语料集的步骤中。

5.根据权利要求4所述的方法，其特征在于，所述对所述测试语料集进行预标记处理，包括：

6.一种保险信息的处理装置，其特征在于，包括：

获取单元，用于获取用户输入的问题；

发送单元，用于根据所述用户输入的问题中的关键信息，查询得到与所述用户输入的问题相对应的答案，将与所述用户输入的问题相对应的答案发送至所述用户；

第二选取单元，用于任意选取标记后的训练语料集中的部分问题，作为槽值提取训练的语料；

7.根据权利要求6所述的装置，其特征在于，还包括：

8.根据权利要求7所述的装置，其特征在于，还包括：

9.根据权利要求7所述的装置，其特征在于，还包括：

预标记单元，用于对所述测试语料集进行预标记处理；

第二判断单元，用于判断所述意图识别模型的准确率是否小于第一阈值；若所述第二判断单元判断出所述意图识别模型的准确率小于所述第一阈值，则返回至所述第一构建单元中；

10.根据权利要求9所述的装置，其特征在于，所述预标记单元，包括：