CN106844512B

CN106844512B - 智能问答方法及系统

Info

Publication number: CN106844512B
Application number: CN201611233970.1A
Authority: CN
Inventors: 简仁贤; 叶茂; 杨亮
Original assignee: Emotibot Technologies Ltd
Current assignee: Emotibot Technologies Ltd
Priority date: 2016-12-28
Filing date: 2016-12-28
Publication date: 2020-06-19
Anticipated expiration: 2036-12-28
Also published as: CN106844512A

Abstract

本发明提供了一种智能回答方法及系统，方法为：获取知识库中存储问题及对应回答，根据人称模型计算问题的施动和受动人称；计算用户问题的关键词与知识库中问题的关键词的相似度，得到第一问题集合，并在知识库中得到第一问题集合中问题对应的施动和受动人称；计算用户的问题对应的施动和受动人称；将与用户的问题对应的施动和受动人称不一致的问题去除，得到第二问题集合；随机取得第二问题集合中的一个问题作为匹配问题，其对应的回答为用户的问题的回答。本发明通过人称模型计算用户提出问题中的施动和受动人称，去除与用户提出的问题的施动和受动人称不一致的问题，匹配到相似的问题，给出准确的回答。

Description

智能问答方法及系统

技术领域

本发明涉及电数字数据处理和人工智能技术领域，尤其涉及一种智能问答方法及系统。

背景技术

在智能对话系统中，通常使用问题和问题匹配的方法寻找答案。在知识库中保存问题和相应的回答，当用户询问一个问题A时，从知识库中找到与问题A相似的问题B，然后将问题B的答案返回给用户。通常通过关键词比较计算两个问题的相似度，即基于问题A和问题B的关键词计算其相似度。为了提高召回率，通常不要求关键词完全匹配，然而，这种方法这可能会引入错误。因为两个问题中提取的关键词可能有很高的相似度，但两个问题中包含的人称在句子中的顺序不同，即施动人称和受动人称不同，问题A中的施动人称为X1，受动人称为Y1，而问题B中的施动人称为X2，受动人称为Y2，因此，如果忽略问题中包含的施动人称和受动人称不同问题，很可能给出问题的回答是不准确的。例如，例如，question A：我喜欢你question B：你喜欢我，这两个question的关键词都是“我”“喜欢”“你”，因此会有很高的相似度，但是由于两个句子中的施动人称和受动人称不同，导致其语义完全不同，因此很可能给出问题的回答不准确。

因此，现有技术中的缺陷是，在智能对话系统中，无法根据问题中包含的施动人称和受动人称进行语义分析，导致给出的回答不准确。

发明内容

针对上述技术问题，本发明提供一种智能回答方法及系统，通过人称模型计算用户提出问题中的施动人称和受动人称，根据知识库中保存的问题及其施动人称和受动人称，在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题，进而匹配到与用户提出问题相似的问题，并给出准确的回答。

为解决上述技术问题，本发明提供的技术方案是：

第一方面，本发明提供一种智能回答方法，包括：

步骤S1，获取知识库，所述知识库中存储问题及对应回答，根据预先建立的人称模型计算所述问题的施动人称和受动人称，存入所述知识库；

步骤S2，获取用户的问题，计算所述用户问题的关键词；

步骤S3，计算所述用户问题的关键词与所述知识库中问题的关键词的相似度，在所述知识库中得到所述相似度为预设阈值的第一问题集合，并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称；

步骤S4，根据所述用户的问题，通过所述人称模型计算所述用户的问题对应的施动人称和受动人称；

步骤S5，将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较，将与所述用户的问题对应的施动人称和受动人称不一致的问题去除，得到第二问题集合；

步骤S6，根据所述第二问题集合，随机取得一个问题作为匹配问题，所述匹配问题对应的回答为所述用户的问题的回答。

本发明的智能回答方法的技术方案为：获取知识库，所述知识库中存储问题及对应回答，根据预先建立的人称模型计算所述问题的施动人称和受动人称，存入所述知识库；获取用户的问题，计算所述用户问题的关键词；计算所述用户问题的关键词与所述知识库中问题的关键词的相似度，在所述知识库中得到所述相似度为预设阈值的第一问题集合，并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称；

根据所述用户的问题，通过所述人称模型计算所述用户的问题对应的施动人称和受动人称；将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较，将与所述用户的问题对应的施动人称和受动人称不一致的问题去除，得到第二问题集合；根据所述第二问题集合，随机取得一个问题作为匹配问题，所述匹配问题对应的回答为所述用户的问题的回答。

本发明的智能问答方法，通过人称模型计算用户提出问题中的施动人称和受动人称，根据知识库中保存的问题及其施动人称和受动人称，首先根据问题中的关键词相似度得到第一问题集合，然后在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题，得到第二问题集合，在第二问题集合中匹配到相似的问题，并给出准确的回答。

进一步地，所述语义模型的建立，具体为：

所述人称模型的建立，具体为：

获取训练语料，所述训练语料包括句子、施动人称和受动人称；

通过最大熵模型对所述训练语料进行训练，得到人称模型。

进一步地，通过最大熵模型对所述训练语料进行训练，得到人称模型，具体为：

获取训练语料中的特征，所述特征为从所述句子、所述施动人称和受动人称中得到的特征序列；

对所述特征序列进行训练，得到人称模型。

进一步地，所述特征包括二元特征，所述二元特征为句子中前后两个字符形成的特征序列；句首的两个字符，句尾的两个字符，句首的三个字符，句尾的三个字符，句子中的第2个和第3个字符，句子中的倒数第2个和倒数第3个字符，句子中的字符被，句子中的字符把，句子中的字符跟、和、与、同，句首的人称词语，句子的分词序列，句子的分词及其词性序列。

第二方面，本发明提供一种智能问答系统，包括：

知识库获取模块，用于获取知识库，所述知识库中存储问题及对应回答，根据预先建立的人称模型计算所述问题的施动人称和受动人称，存入所述知识库；

关键词获取模块，获取用户的问题，计算所述用户问题的关键词；

第一问题集合模块，用于计算所述用户问题的关键词与所述知识库中问题的关键词的相似度，在所述知识库中得到所述相似度为预设阈值的第一问题集合，并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称；

人称模型计算模块，用于根据所述用户的问题，通过所述人称模型计算所述用户的问题对应的施动人称和受动人称；

第二问题集合模块，用于将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较，将与所述用户的问题对应的施动人称和受动人称不一致的问题去除，得到第二问题集合；

回答获取模块，用于根据所述第二问题集合，随机取得一个问题作为匹配问题，所述匹配问题对应的回答为所述用户的问题的回答。

本发明的智能问答系统的技术方案为：先通过知识库获取模块，用于获取知识库，所述知识库中存储问题及对应回答，根据预先建立的人称模型计算所述问题的施动人称和受动人称，存入所述知识库；接着通过关键词获取模块，获取用户的问题，计算所述用户问题的关键词；然后通过第一问题集合模块，用于计算所述用户问题的关键词与所述知识库中问题的关键词的相似度，在所述知识库中得到所述相似度为预设阈值的第一问题集合，并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称；

接着通过人称模型计算模块，用于根据所述用户的问题，通过所述人称模型计算所述用户的问题对应的施动人称和受动人称；然后通过第二问题集合模块，用于将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较，将与所述用户的问题对应的施动人称和受动人称不一致的问题去除，得到第二问题集合；最后通过回答获取模块，用于根据所述第二问题集合，随机取得一个问题作为匹配问题，所述匹配问题对应的回答为所述用户的问题的回答。

本发明的智能问答系统，通过人称模型计算用户提出问题中的施动人称和受动人称，根据知识库中保存的问题及其施动人称和受动人称，首先根据问题中的关键词相似度得到第一问题集合，然后在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题，得到第二问题集合，在第二问题集合中匹配到相似的问题，并给出准确的回答。

进一步地，还包括人称模型建立模块，用于：

通过最大熵模型对所述训练语料进行训练，得到人称模型。

进一步地，所述人称模型建立模块，具体用于：

对所述特征序列进行训练，得到人称模型。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。

图1示出了本发明实施例所提供的一种智能问答方法的流程图；

图2示出了本发明实施例所提供的一种智能问答系统的示意图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案，因此只是作为示例，而不能以此来限制本发明的保护范围。

实施例一

图1示出了本发明实施例所提供的一种智能问答方法的流程图；如图1所示实施例一提供的一种智能问答方法，包括：

步骤S1，获取知识库，知识库中存储问题及对应回答，根据预先建立的人称模型计算问题的施动人称和受动人称，存入知识库；

步骤S2，获取用户的问题，计算用户问题的关键词；

计算用户问题的关键词有两种方法，一种方法是：

根据用户的问题，对用户的问题进行分词和词性标注，得到指定词；

将指定词作为关键词。

其中，指定词包括动词、名词和人称代词；

另一种方法是：

根据用户的问题，获得用户的问题中的分词结果、词性和依存句法；

根据分词结果、词性和依存句法，进行分析，得到分析结果；

根据分析结果，提取特征并训练最大熵模型，通过最大熵模型标注关键词。

步骤S3，计算用户问题的关键词与知识库中问题的关键词的相似度，在知识库中得到相似度为预设阈值的第一问题集合，并在知识库中得到第一问题集合中问题对应的施动人称和受动人称；

步骤S4，根据用户的问题，通过人称模型计算用户的问题对应的施动人称和受动人称；

步骤S5，将用户的问题对应的施动人称和受动人称与第一问题集合中问题对应的施动人称和受动人称进行比较，将与用户的问题对应的施动人称和受动人称不一致的问题去除，得到第二问题集合；

步骤S6，根据第二问题集合，随机取得一个问题作为匹配问题，匹配问题对应的回答为用户的问题的回答。

本发明的智能回答方法的技术方案为：获取知识库，知识库中存储问题及对应回答，根据预先建立的人称模型计算问题的施动人称和受动人称，存入知识库；获取用户的问题，计算用户问题的关键词；计算用户问题的关键词与知识库中问题的关键词的相似度，在知识库中得到相似度为预设阈值的第一问题集合，并在知识库中得到第一问题集合中问题对应的施动人称和受动人称；

根据用户的问题，通过人称模型计算用户的问题对应的施动人称和受动人称；将用户的问题对应的施动人称和受动人称与第一问题集合中问题对应的施动人称和受动人称进行比较，将与用户的问题对应的施动人称和受动人称不一致的问题去除，得到第二问题集合；根据第二问题集合，随机取得一个问题作为匹配问题，匹配问题对应的回答为用户的问题的回答。

需要说明的是，知识库中存储大量的问题，及问题对应的回答，只有存储的问题足够多，才可以给用户提供更准确的回答。

具体地，语义模型的建立，具体为：

人称模型的建立，具体为：

获取训练语料，训练语料包括句子、施动人称和受动人称；

通过最大熵模型对训练语料进行训练，得到人称模型。

具体地，通过最大熵模型对训练语料进行训练，得到人称模型，具体为：

获取训练语料中的特征，特征为从句子、施动人称和受动人称中得到的特征序列；

对特征序列进行训练，得到人称模型。

通过最大熵模型将训练语料中表示受动人称和施动人称的特征进行提取训练，得到人称模型，最大熵模型的优点为：建模时，试验者只需集中精力选择特征，而不需要花费精力考虑如何使用这些特征；特征选择灵活，且不需要额外的独立假定或者内在约束；模型应用在不同领域时的可移植性强；可结合更丰富的信息。因此本发明中选用最大熵模型对训练语料进行训练，得到人称模型。

具体地，特征包括二元特征，二元特征为句子中前后两个字符形成的特征序列；句首的两个字符，句尾的两个字符，句首的三个字符，句尾的三个字符，句子中的第2个和第3个字符，句子中的倒数第2个和倒数第3个字符，句子中的字符被，句子中的字符把，句子中的字符跟、和、与、同，句首的人称词语，句子的分词序列，句子的分词及其词性序列。

具体地，预设阈值为60％。经验证，在预设阈值为60％时，即相似度为60％时，在知识库中得到的第一问题集合中的问题与用户提出的问题相似。

图2示出了本发明实施例所提供的一种智能问答系统的示意图，如图2所示，本发明实施例提供一种智能问答系统10，包括：

知识库获取模块101，用于获取知识库，知识库中存储问题及对应回答，根据预先建立的人称模型计算问题的施动人称和受动人称，存入知识库；

关键词获取模块102，获取用户的问题，计算用户问题的关键词；

计算用户问题的关键词有两种方法，一种方法是：

将指定词作为关键词。

其中，指定词包括动词、名词和人称代词；

另一种方法是：

第一问题集合模块103，用于计算用户问题的关键词与知识库中问题的关键词的相似度，在知识库中得到相似度为预设阈值的第一问题集合，并在知识库中得到第一问题集合中问题对应的施动人称和受动人称；

人称模型计算模块104，用于根据用户的问题，通过人称模型计算用户的问题对应的施动人称和受动人称；

第二问题集合模块105，用于将用户的问题对应的施动人称和受动人称与第一问题集合中问题对应的施动人称和受动人称进行比较，将与用户的问题对应的施动人称和受动人称不一致的问题去除，得到第二问题集合；

回答获取模块106，用于根据第二问题集合，随机取得一个问题作为匹配问题，匹配问题对应的回答为用户的问题的回答。

本发明的智能问答系统10的技术方案为：先通过知识库获取模块101，用于获取知识库，知识库中存储问题及对应回答，根据预先建立的人称模型计算问题的施动人称和受动人称，存入知识库；接着通过关键词获取模块102，获取用户的问题，计算用户问题的关键词；然后通过第一问题集合模块103，用于计算用户问题的关键词与知识库中问题的关键词的相似度，在知识库中得到相似度为预设阈值的第一问题集合，并在知识库中得到第一问题集合中问题对应的施动人称和受动人称；

接着通过人称模型计算模块104，用于根据用户的问题，通过人称模型计算用户的问题对应的施动人称和受动人称；然后通过第二问题集合模块105，用于将用户的问题对应的施动人称和受动人称与第一问题集合中问题对应的施动人称和受动人称进行比较，将与用户的问题对应的施动人称和受动人称不一致的问题去除，得到第二问题集合；最后通过回答获取模块106，用于根据第二问题集合，随机取得一个问题作为匹配问题，匹配问题对应的回答为用户的问题的回答。

本发明的智能问答系统10，通过人称模型计算用户提出问题中的施动人称和受动人称，根据知识库中保存的问题及其施动人称和受动人称，首先根据问题中的关键词相似度得到第一问题集合，然后在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题，得到第二问题集合，在第二问题集合中匹配到相似的问题，并给出准确的回答。

具体地，还包括人称模型建立模块，用于：

获取训练语料，训练语料包括句子、施动人称和受动人称；

通过最大熵模型对训练语料进行训练，得到人称模型。

具体地，人称模型建立模块，具体用于：

对特征序列进行训练，得到人称模型。

实施例二

基于实施例一中的智能问答方法和智能问答系统10，进行智能问答过程的具体说明：

1、将问题(question)和回答(answer)加入知识库，

例如：

2、通过关键词进行索引；同时，根据人称模型M计算question的施动人称和受动人称，存入知识库中；

以上question的关键词及施动人称和受动人称如下：

3、根据用户提供的问题question A“我喜欢你”，计算其关键词为“我喜欢你”；

4、根据关键词，从知识库中得到相似度为top n(预设阈值)的question集合CQS1(第一问题集合)。计算得到question A与知识库中question的相似度(根据相同关键词数/总关键词数计算)如下：

5、根据用户提供的问题question A“我喜欢你”，根据人称模型M计算其施动人称为第一人称，受动人称为第二人称；

6、利用question A的施动人称和受动人称，从集合CQS1(第一问题集合)中过滤施动人称和受动人称不一致的question，得到集合CQS2(第二问题集合)；CQS2集合如下：

相似的question 施动人称受动人称

我喜欢你第一人称第二人称

我非常喜欢你第一人称第二人称

7、对于集合CQS2中的每一个问题，将其对应的答案返回给用户，因此用户得到的答案是“我也喜欢你”或者“我也非常喜欢你”。

通过本发明的智能问答方法及系统进行智能回答，可根据问题的施动人称和受动人称，给用户提供更准确的回答。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims

1.智能问答方法，其特征在于，包括：

步骤S2，获取用户的问题，计算所述用户问题的关键词；

2.根据权利要求1所述的智能问答方法，其特征在于，

所述人称模型的建立，具体为：

通过最大熵模型对所述训练语料进行训练，得到人称模型。

3.根据权利要求2所述的智能问答方法，其特征在于，

通过最大熵模型对所述训练语料进行训练，得到人称模型，具体为：

对所述特征序列进行训练，得到人称模型。

4.根据权利要求3所述的智能问答方法，其特征在于，

所述特征包括二元特征，所述二元特征为句子中前后两个字符形成的特征序列；句首的两个字符，句尾的两个字符，句首的三个字符，句尾的三个字符，句子中的第2个和第3个字符，句子中的倒数第2个和倒数第3个字符，句子中的字符被，句子中的字符把，句子中的字符跟、和、与、同，句首的人称词语，句子的分词序列，句子的分词及其词性序列。

5.智能问答系统，其特征在于，包括：

6.根据权利要求5所述的智能问答系统，其特征在于，

还包括人称模型建立模块，用于：

通过最大熵模型对所述训练语料进行训练，得到人称模型。

7.根据权利要求6所述的智能问答系统，其特征在于，

所述人称模型建立模块，具体用于：

对所述特征序列进行训练，得到人称模型。

8.根据权利要求7所述的智能问答系统，其特征在于，