CN104809103A

CN104809103A - 一种人机对话的语义分析方法及系统

Info

Publication number: CN104809103A
Application number: CN201510213919.3A
Authority: CN
Inventors: 陶玮
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2015-04-29
Filing date: 2015-04-29
Publication date: 2015-07-29
Anticipated expiration: 2035-04-29
Also published as: CN104809103B

Abstract

本发明公开一种人机对话的语义分析方法及系统，方法包括：获取训练语料，通过所述训练语料训练出情感函数，所述情感函数对输入的语句计算对应的情感值；获取用户输入语句，将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值；从与所述用户输入语句相关的多个回答答案中，选择满足所述用户情感值的回答答案作为语义分析答案，显示所述语义分析答案。本发明通过函数训练得到计算情感值的情感函数，从而能够将用户输入语句计算出相应的情感值，从与所述用户输入语句相关的多个回答答案中，选择满足所述用户情感值的回答答案作为语义分析答案，从而能够更好地回答用户的输入。

Description

一种人机对话的语义分析方法及系统

技术领域

本发明涉及人机对话相关技术领域，特别是一种人机对话的语义分析方法及系统。

背景技术

现在的人机对话问答系统中，当用户输入问题后，识别用户所要询问的意图是整个问答系统中核心的部分，意图识别正确但准确率太低，会造成后期给用户返回答案时，答案太多而无法选择最优答案的问题；意图识别错误会造成无法理解用户的意思，从而会给用户提供其不想要的答案或者直接无法给出答案。现有的技术做法是：

模型预测：该方法主要是先由人工进行分类和语料的标注，然后通过决策树或者分类算法来训练出一个模型，当用户输入一句话后，进行分词、实体抽取和向量转化后，把处理后的信息输入到模型中来进行预测判断，给出一个用户意图预测的结果。

现有意图识别的方法都是基于人工标注大量的语料来进行训练和预测，由于需要大量的人工标注，会存在很多的不可控因素，比如每个标注人员对于语料理解的不同会导致不同的标注结果，对相同的问题会有重复标注的结果，以及不同的分类标注里有相同语料的标注；而且当需要添加新的意图分类的时候，必须由相关人员进行商讨、确定，再培训标注人员才能开始进行标注工作，机器无法自动添加新的分类。在整个训练模型的过程中会消耗大量的人力物力，并且由于诸多的不可控因素会影响函数训练的速度和进度。

在实际过程中模型预测也很难区分用户是在询问问题还是和问答系统进行聊天，用户在实际使用时是不会提示机器自己的意图是什么，所以需要问答系统来识别和区分，如果光靠模型的预测就需要在语料里加入大量的聊天语料来进行训练，大量聊天语料的存在势必会造成其他分类语料权重的降低，从而影响其他意图分类的准确性，而不加入聊天语料则又会影响到意图识别的最终效果。最终整个系统的效果也会大打折扣。

发明内容

基于此，有必要针对现有技术中无法对用户进行语义分析，从而对用户的意图识别不准确的技术问题，提供一种人机对话的语义分析方法及系统。

一种人机对话的语义分析方法，包括：

函数训练步骤，包括：获取包括多个训练语句的训练语料，通过所述训练语料训练出情感函数，所述情感函数对输入的语句计算对应的情感值；

情感值计算步骤，包括：获取用户输入语句，将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值；

情感执行步骤，包括：从与所述用户输入语句相关的多个回答答案中，选择满足所述用户情感值的回答答案作为语义分析答案，显示所述语义分析答案。

一种人机对话的语义分析系统，包括：

函数训练模块，用于：获取包括多个训练语句的训练语料，通过所述训练语料训练出情感函数，所述情感函数对输入的语句计算对应的情感值；

情感值计算模块，用于：获取用户输入语句，将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值；

情感执行模块，用于：从与所述用户输入语句相关的多个回答答案中，选择满足所述用户情感值的回答答案作为语义分析答案，显示所述语义分析答案。

本发明通过函数训练得到计算情感值的情感函数，从而能够将用户输入语句计算出相应的情感值，并根据情感值选择回答用户的方式，从而能够更好地回答用户的输入。

附图说明

图1为本发明一种人机对话的语义分析方法的工作流程图；

图2为本发明最佳实施例的工作流程图；

图3为本发明一种人机对话的语义分析系统的结构模块图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步详细的说明。

如图1所示为本发明一种人机对话的语义分析方法的工作流程图，包括：

步骤S101，包括：获取包括多个训练语句的训练语料，通过所述训练语料训练出情感函数，所述情感函数对输入的语句计算对应的情感值；

步骤S102，包括：获取用户输入语句，将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值；

步骤S103，包括：从与所述用户输入语句相关的多个回答答案中，选择满足所述用户情感值的回答答案作为语义分析答案，显示所述语义分析答案。

用户的各种意图识别其实也是用模型去拟合用户的问题，语义分析就是用函数拟合出合适的模型的方式，最后可以得到的可以比较意图类别的情感函数，则可以直接得出用户的意图。

本发明通过步骤S101训练情感函数，并在步骤S102对用户输入语句在情感函数中计算得到对应的用户情感值。在步骤S103中，根据用户情感值选择对应的回答答案并显示。

本发明由于采用训练模型获取用户情感值，因此使实体识别的准确率得到了明显提高，并且也大大提高了模型迭代速度和节省了人力成本；更重要的是当用户量大的时候，对于同一个问题会有多种的问法，当初始训练的样本不足时，可能无法得到用户的意图，然而通过不断的训练则可以提高获取用户意图的可能性。经过一段时间后，可以将获得的用户输入语句对情感函数进行输入，从而对算法的参数和语料进行自动的补充和调优。

计算情感值，可以通过在训练语料中，预先对每个训练语句设定相应的情感值，然后通过函数拟合的方式，拟合出一条能对输入的语句计算出相应的情感值的函数。然而，采用预先设定情感值的方式，需要人工大量的打分，因此会导致出现比较大量的主观判断，从而影响实际的语义分析结果。

在其中一个实施例中：

所述步骤101，具体包括：获取包括多个训练语句的训练语料，每个训练语句与一种情感类型关联，对所述训练语料进行训练，得到用于对情感类型进行分类的情感函数，所述情感值用于表示输入情感函数的语句所属的情感类型；

所述步骤102，具体包括：根据所述用户情感值确定对应的情感类型为用户情感类型，从与所述用户输入语句相关的多个回答答案中，选择所述用户情感类型所对应的回答答案作为语义分析答案，显示所述语义分析答案。

本实施例中情感函数是对情感类型进行分类，因此无需对训练语句进行打分，只要预先将训练语句进行分类，使得最终的语义分析结果更加具有客观性。

在其中一个实施例中：

所述步骤S101，还包括：将所述训练语句进行向量化处理得到训练向量值，对多个所述训练向量值进行训练得到情感函数，所述训练向量值包括多个维度，且每个维度与一个单词关联，在所述训练向量值中将所述训练语句所包括的单词所对应的维度置1；

所述步骤S102，还包括：将所述用户输入语句进行向量化处理得到用户输入向量值，，所述用户输入向量值包括多个维度，且每个维度与一个单词关联，在所述用户输入向量值中将所述用户输入语句所包括的单词所对应的维度置1。

在其中一个实施例中：

所述情感类型包括第一情感类型和第二情感类型，所述训练语料包括第一训练语料和第二训练语料，所述第一训练语料包括多个预先选定的与第一情感类型关联的第一训练语句，所述第二训练语料包括多个预先选定的与第二情感类型关联的第二训练语句；

所述步骤S101中，分别对第一训练语料进行训练得到第一情感函数，对第二训练语料进行训练得到第二情感函数；

所述第一情感函数采用进行训练，所述第二情感函数采用进行训练，其中，所述w_i'为第一情感函数中第i个单词的权重，所述w_i”为第二情感函数中第i个单词的权重，x_i'为第一训练语句对应的训练向量值的第i个维度的值，x_i”为第二训练语句对应的训练向量值的第i个维度的值，所述W_p'为第一情感函数中所有权重之和，所述W_p”为第二情感函数中所有权重之和，y'为第一训练情感值，y”为第二训练情感值，n'为第一训练语料不同单词的个数，n”为第二训练语料不同单词的个数，且设定当x_i'＝0时，当x_i”＝0时，

\log \frac{{w_{i}}^{''} {x_{i}}^{''}}{{W_{p}}^{''}} = 0;

所述步骤S102中，将用户输入语句根据第一情感函数的单词顺序向量化为第一用户输入向量，将用户输入语句根据第二情感函数的单词顺序向量化为第二用户输入向量，分别计算第一用户情感值和第二用户情感值，所述第一用户情感值y₁和所述第二用户情感值y₂分别为：

y_{1} = \frac{1}{1 + \exp (Σ_{i = 1}^{n^{''}} (\log \frac{{w_{i}}^{''} x_{2 i}}{{W_{p}}^{''}}) - Σ_{i = 1}^{n^{'}} (\log \frac{{w_{i}}^{'} x_{1 i}}{{W_{p}}^{'}}))}

和

y_{2} = \frac{1}{1 + \exp (Σ_{i = 1}^{n^{'}} (\log \frac{{w_{i}}^{'} x_{1 i}}{{W_{p}}^{'}}) - Σ_{i = 1}^{n^{''}} (\log \frac{{w_{i}}^{''} x_{2 i}}{{W_{p}}^{''}}))},

其中x_1i为第一用户输入向量的第i个维度的值，x_2i为第一用户输入向量的第i个维度的值；

所述步骤S103中，如果y₁>y₂，且y₁与y₂的差值的绝对值大于或等于预设第一阈值，则用户情感类型为第一情感类型，如果y₁<y₂，且y₁与y₂的差值的绝对值大于或等于预设第二阈值，则用户情感类型为第二情感类型。

步骤S101，通过多个第一训练语句训练出w_i'，通过多个第二训练语句训练出w_i”，然后在S102，输入第一用户输入向量和第二用户输入向量计算得到第一用户情感值y₁和第二用户情感值y₂。上述公式中，第一训练语句对应的训练向量值与第一情感函数的单词顺序相同，即w_i'所对应的单词与x_i'所对应的单词相同，第二训练语句对应的训练向量值与第二情感函数的单词顺序相同，即w_i”所对应的单词与x_i”所对应的单词相同，第一情感函数的单词顺序与第一用户输入向量的单词顺序相同，即w_i'所对应的单词与x_1i所对应的单词相同，第二情感函数的单词顺序与第二用户输入向量的单词顺序相同，即w_i”所对应的单词与x_2i所对应的单词相同。

优选地，如果y₁>y₂，且y₁与y₂的差值的绝对值小于预设第一阈值，则用户情感类型为第三情感类型，如果y₁<y₂，且y₁与y₂的差值的绝对值小于预设第二阈值，则用户情感类型为第三情感类型。

优选地，第一训练语料为积极情感语料，第二训练语料为消极情感语料，第一情感类型为积极情感类型，第二情感类型为消极情感类型，第三情感类型为中性情感类型。所述积极情感语料包括多个预先选定的具有积极情感词的情感语句，所述消极情感语料包括多个预先选定的具有消极情感词的情感语句。

预先设定积极情感语料和消极情感语料，当计算得到用户情感类型为积极情感类型，则表示用户的情感积极，此时可以选择与积极情感类型对应的回答，例如向用户推荐商品或对用户进行赞美等的回答，当计算得到用户情感类型为消极情感类型，则表示用户的情感消极，此时可以选择与消极情感类型对应的回答，例如对用户进行安慰或鼓励等的回答。

如图2所示为本发明最佳实施例的工作流程图，包括：

步骤S201，通过大量的训练语料训练情感函数，基于进行训练得到情感函数。然后输入已有的积极语料和消极语料，训练关于积极语料的积极情感函数和关于消极语料的消极情感函数。

步骤202，通过分词算法对用户输入的语句进行切割，去除停用词和其他多余的标点符号。保证词的细粒度和准确性。

步骤S203，在接收到所有的分词后，对词和不准确的词进行二次切割和语料的填充，把词的隐含信息进行补全，从而来提高后期的准确率。比如“他是哪国人”，分词后会变成“他/是/哪/国人”，在信息补充后会变成“他/是/哪个/国家/人”。这样就可以避免由于分词的不准而造成的干扰。

步骤S204，在接收到词后，对所有的词进行替换，判断哪些是姓名、哪些是商品、哪些是数字等等，为语义分析进行再一次的过滤。

步骤S205，在用户输入的语句时会潜在隐含一些情感的信息，如高兴、愤怒、激动、生气等等，在接收到实体的信息后，对所有的信息进行向量化处理，并分别采用积极情感函数的权重和消极情感函数的权重进行计算积极情感值和消极情感值。向量化处理是指将用户输入的语句中所包括的词语对应的维度设为1，例如“我想去北京”，则对于一个向量(X1，X2，X3，X4，X5，X6，X7)来说，其向量值则为(1，0，1，1，0，1，0)，其中X1对应“我”，X2对应“你”，X3对应“想”，X4对应“去”，X5对应“回”，X6对应“北京”，X7对应“天津”。上述只是一个例子，实际上的向量值的维度数量并不限于七个。

积极情感值和消极情感值的例子如下所示：

比如输入一句话“今天天气不错啊”，分词后得到“今天”，“天气”，“不错”，“啊”，其中“啊”因为是停用词，所以会被去掉，进入一步的时候只剩下了“今天”，“天气”，“不错”这三个字了。

接着这三个词会采用积极情感函数的权重进行计算，生成向量，“今天”在积极情感函数里面的权重为202，“天气”在积极情感函数里面的权重是23，“不错”在积极情感函数里的权重是5754；

然后计算其中W_p'为514407是积极情感函数里所有权重的总数，将上述数据代入得到：

sum1＝log(0.000393)+log(0.000045)+log(0.011186)＝-25.347032

接着将上述三个词在消极训练函数的权重进行计算，“今天”在消极情感函数里面的权重为145，“天气”在消极情感函数里面的权重为48，“不错”在消极情感函数里面的权重为918。

然后计算其中W_p”为465577是消极情感函数里所有权重的总数，将上述数据代入得到：

sum2＝log(0.000311)+log(0.000103)+log(0.001972)＝-26.665772。

最后来计算积极情感值pos_score和消极情感值neg_score:

pos_score＝1.0/(1.0+exp(sum2–sum1))＝0.7889

neg_score＝1.0/(1.0+exp(sum1–sum2))＝0.21102

步骤S206，根据积极情感值和消极情感值确定情感类型，采用相应的回答答案以回答用户的输入。

对于上述例子由于pos_score>neg_score且两者的差值的绝对值大于预设阈值0.1，因此得到的这句话的情感类型是积极情感类型，然后就可以从回答的答案中选择出属于积极情感类型的答案，比如赞同用户的观点，或者询问他是否想要今天出去郊游、娱乐等等。

如图3所示为本发明一种人机对话的语义分析系统的结构模块图，包括：

函数训练模块301，用于：获取训练语料，通过所述训练语料训练出情感函数，所述情感函数对输入的语句计算对应的情感值；

情感值计算模块302，用于：获取用户输入语句，将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值；

情感执行模块303，用于：从与所述用户输入语句相关的多个回答答案中，选择满足所述用户情感值的回答答案作为语义分析答案，显示所述语义分析答案。

在其中一个实施例中：

所述函数训练模块，具体包括：获取包括多个训练语句的训练语料，每个训练语句与一种情感类型关联，对所述训练语料进行训练，得到用于对情感类型进行分类的情感函数，所述情感值用于表示输入情感函数的语句所属的情感类型；

所述情感执行模块，具体包括：根据所述用户情感值确定对应的情感类型为用户情感类型，从与所述用户输入语句相关的多个回答答案中，选择所述用户情感类型所对应的回答答案作为语义分析答案，显示所述语义分析答案。

在其中一个实施例中：

所述函数训练模块，还包括：将所述训练语句进行向量化处理得到训练向量值，对多个所述训练向量值进行训练得到情感函数，所述训练向量值包括多个维度，且每个维度与一个单词关联，在所述训练向量值中将所述训练语句所包括的单词所对应的维度置1；

所述情感值计算模块，还包括：将所述用户输入语句进行向量化处理得到用户输入向量值，，所述用户输入向量值包括多个维度，且每个维度与一个单词关联，在所述用户输入向量值中将所述用户输入语句所包括的单词所对应的维度置1。

在其中一个实施例中：

所述函数训练模块中，分别对第一训练语料进行训练得到第一情感函数，对第二训练语料进行训练得到第二情感函数；

\log \frac{{w_{i}}^{''} {x_{i}}^{''}}{{W_{p}}^{''}} = 0;

所述情感值计算模块中，将用户输入语句根据第一情感函数的单词顺序向量化为第一用户输入向量，将用户输入语句根据第二情感函数的单词顺序向量化为第二用户输入向量，分别计算第一用户情感值和第二用户情感值，所述第一用户情感值y₁和所述第二用户情感值y₂分别为：

y_{1} = \frac{1}{1 + \exp (Σ_{i = 1}^{n^{''}} (\log \frac{{w_{i}}^{''} x_{2 i}}{{W_{p}}^{''}}) - Σ_{i = 1}^{n^{'}} (\log \frac{{w_{i}}^{'} x_{1 i}}{{W_{p}}^{'}}))}

和

y_{2} = \frac{1}{1 + \exp (Σ_{i = 1}^{n^{'}} (\log \frac{{w_{i}}^{'} x_{1 i}}{{W_{p}}^{'}}) - Σ_{i = 1}^{n^{''}} (\log \frac{{w_{i}}^{''} x_{2 i}}{{W_{p}}^{''}}))},

所述情感执行模块中，如果y₁>y₂，且y₁与y₂的差值的绝对值大于或等于预设第一阈值，则用户情感类型为第一情感类型，如果y₁<y₂，且y₁与y₂的差值的绝对值大于或等于预设第二阈值，则用户情感类型为第二情感类型。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种人机对话的语义分析方法，其特征在于，包括：

2.根据权利要求1所述的人机对话的语义分析方法，其特征在于：

所述函数训练步骤，具体包括：获取包括多个训练语句的训练语料，每个训练语句与一种情感类型关联，对所述训练语料进行训练，得到用于对情感类型进行分类的情感函数，所述情感值用于表示输入情感函数的语句所属的情感类型；

所述情感执行步骤，具体包括：根据所述用户情感值确定对应的情感类型为用户情感类型，从与所述用户输入语句相关的多个回答答案中，选择所述用户情感类型所对应的回答答案作为语义分析答案，显示所述语义分析答案。

3.根据权利要求2所述的人机对话的语义分析方法，其特征在于：

所述函数训练步骤，还包括：将所述训练语句进行向量化处理得到训练向量值，对多个所述训练向量值进行训练得到情感函数，所述训练向量值包括多个维度，且每个维度与一个单词关联，在所述训练向量值中将所述训练语句所包括的单词所对应的维度置1；

所述情感值计算步骤，还包括：将所述用户输入语句进行向量化处理得到用户输入向量值，，所述用户输入向量值包括多个维度，且每个维度与一个单词关联，在所述用户输入向量值中将所述用户输入语句所包括的单词所对应的维度置1。

4.根据权利要求3所述的人机对话的语义分析方法，其特征在于：

所述函数训练步骤中，分别对第一训练语料进行训练得到第一情感函数，对第二训练语料进行训练得到第二情感函数；

\log = \frac{{w_{i}}^{''} {x_{i}}^{''}}{{W_{p}}^{''}} = 0;

所述情感值计算步骤中，将用户输入语句根据第一情感函数的单词顺序向量化为第一用户输入向量，将用户输入语句根据第二情感函数的单词顺序向量化为第二用户输入向量，分别计算第一用户情感值和第二用户情感值，所述第一用户情感值y₁和所述第二用户情感值y₂分别为：

y_{1} = \frac{1}{1 + \exp (Σ_{i = 1}^{n^{''}} (\log \frac{{w_{i}}^{''} x_{2 i}}{{W_{p}}^{''}}) - Σ_{i = 1}^{n^{'}} (\log \frac{{w_{i}}^{'} x_{1 i}}{{W_{p}}^{'}}))}

和

y_{2} = \frac{1}{1 + \exp (Σ_{i = 1}^{n^{'}} (\log \frac{{w_{i}}^{'} x_{1 i}}{{W_{p}}^{'}}) - Σ_{i = 1}^{n^{''}} (\log \frac{{w_{i}}^{''} x_{2 i}}{{W_{p}}^{''}}))},

所述情感执行步骤中，如果y₁>y₂，且y₁与y₂的差值的绝对值大于或等于预设第一阈值，则用户情感类型为第一情感类型，如果y₁<y₂，且y₁与y₂的差值的绝对值大于或等于预设第二阈值，则用户情感类型为第二情感类型。

5.根据权利要求4所述的人机对话的语义分析方法，其特征在于，如果y₁>y₂，且y₁与y₂的差值的绝对值小于预设第一阈值，则用户情感类型为第三情感类型，如果y₁<y₂，且y₁与y₂的差值的绝对值小于预设第二阈值，则用户情感类型为第三情感类型。

6.一种人机对话的语义分析系统，其特征在于，包括：

7.根据权利要求6所述的人机对话的语义分析系统，其特征在于：

8.根据权利要求7所述的人机对话的语义分析系统，其特征在于：

9.根据权利要求8所述的人机对话的语义分析系统，其特征在于：

\log = \frac{{w_{i}}^{''} {x_{i}}^{''}}{{W_{p}}^{''}} = 0;

y_{1} = \frac{1}{1 + \exp (Σ_{i = 1}^{n^{''}} (\log \frac{{w_{i}}^{''} x_{2 i}}{{W_{p}}^{''}}) - Σ_{i = 1}^{n^{'}} (\log \frac{{w_{i}}^{'} x_{1 i}}{{W_{p}}^{'}}))}

和

y_{2} = \frac{1}{1 + \exp (Σ_{i = 1}^{n^{'}} (\log \frac{{w_{i}}^{'} x_{1 i}}{{W_{p}}^{'}}) - Σ_{i = 1}^{n^{''}} (\log \frac{{w_{i}}^{''} x_{2 i}}{{W_{p}}^{''}}))},

10.根据权利要求9所述的人机对话的语义分析系统，其特征在于，如果y₁>y₂，且y₁与y₂的差值的绝对值小于预设第一阈值，则用户情感类型为第三情感类型，如果y₁<y₂，且y₁与y₂的差值的绝对值小于预设第二阈值，则用户情感类型为第三情感类型。