CN110888988A

CN110888988A - 一种生成问答信息的方法、装置和设备

Info

Publication number: CN110888988A
Application number: CN201810942928.XA
Authority: CN
Inventors: 汤传喜; 史军; 赵文琦; 王广平
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2018-08-17
Filing date: 2018-08-17
Publication date: 2020-03-17
Anticipated expiration: 2038-08-17
Also published as: CN110888988B

Abstract

本发明公开了一种生成问答信息的方法、装置和设备。该方法包括：从知识图谱的数据资源中获取目标实体，以及用于将目标实体与其他实体区分开的目标实体在目标属性组下的属性值，然后将所获取到的目标实体在目标属性组下的属性值形成问题信息，将目标实体形成正确答案信息，那么，以该问题信息和正确答案信息就可以形成目标问答信息。这样，解决了人工收集问答信息的方式存在耗费人工多、问答信息涉猎范围不够广泛、问答信息难以及时更新、问答信息的正确性难以快速准确验证等问题，借助知识图谱的数据资源自动生成问答信息，减少对人工的耗费，使生成的问答信息的涉猎范围更加广泛，并且生成的问答信息可以及时更新并得到快速准确的验证。

Description

一种生成问答信息的方法、装置和设备

技术领域

本发明涉及数据处理技术领域，特别是涉及一种生成问答信息的方法、装置和设备。

背景技术

目前，用户开始越来越多地使用基于问答的应用服务。其中，应用服务中提供的问答信息，主要是出题人员通过自己的知识经验储备或查阅资料手动收集并录入的。但是，这种人工收集问答信息的方式存在耗费人工多、问答信息涉猎范围不够广泛、问答信息难以及时更新、问答信息的正确性难以快速准确验证等问题。

发明内容

本发明所要解决的技术问题是，提供一种生成问答信息的问答方法、装置和设备，以从知识图谱的数据资源中提取出相对应的问题信息与答案信息并组成问答信息，从而实现了问答信息自动生成，减少了问答信息收集需要耗费的人工、使得问答信息能够涉猎更广泛的范围、及时更新并得到快速准确的验证。

第一方面，为解决上述技术问题，本发明实施例提供了一种生成问答信息的方法，包括：

从知识图谱的数据资源中获取目标实体和所述目标实体在目标属性组下的属性值，所述目标实体在目标属性组下的属性值可用于将所述目标实体与其他实体区分开；

基于所述目标实体在目标属性组下的属性值形成问题信息并基于所述目标实体形成正确答案信息；

以所述问题信息和所述正确答案信息形成目标问答信息。

可选地，所述目标问答信息包括至少两个答案选项信息，其中，所述正确答案信息为所述至少两个答案选项信息中的一个答案选项信息；

所述至少两个答案选项信息中除所述正确答案信息之外的其他答案选项信息是基于混淆实体形成的，所述混淆实体是从所述目标实体的相关推荐实体选取出来的。

可选地，所述混淆实体为，所述目标实体的相关推荐实体中与所述目标实体类型相同的实体。

可选地，该方法还包括：

根据所述目标实体的各相关推荐实体与所述目标实体的字面含义和/或在所述目标属性组下的属性值，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度；

根据所述目标实体的各相关推荐实体与所述目标实体之间的相似度，从所述目标实体的各相关推荐实体中选取出所述混淆实体。

可选地，该方法还包括：

验证所述混淆实体与所述目标实体在所述目标属性组下的属性值是否完全相同，若不完全相同则基于所述混淆实体形成所述其他答案选项信息。

可选地，该方法还包括：

按照针对所述目标实体的用户历史行为和/或所述目标实体对应的知识层次，为所述目标问答信息设置难度等级。

可选地，所述以所述问题信息和所述正确答案信息形成目标问答信息，包括：

若基于所述目标实体形成正确答案信息的问答信息的数量未超过预设阈值，以所述问题信息和所述正确答案信息形成目标问答信息。

可选地，该方法还包括：

按照所述目标实体的类型，为所述目标问答信息设置类别。

第二方面，本发明实施例还提供了一种生成问答信息的装置，包括：

获取单元，用于从知识图谱的数据资源中获取目标实体和所述目标实体在目标属性组下的属性值，所述目标实体在目标属性组下的属性值可用于将所述目标实体与其他实体区分开；

第一形成单元，用于基于所述目标实体在目标属性组下的属性值形成问题信息；

第二形成单元，用于基于所述目标实体形成正确答案信息；

第三形成单元，用于以所述问题信息和所述正确答案信息形成目标问答信息。

可选地，该装置还包括：

计算单元，用于根据所述目标实体的各相关推荐实体与所述目标实体的字面含义和/或在所述目标属性组下的属性值，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度；

选取单元，用于根据所述目标实体的各相关推荐实体与所述目标实体之间的相似度，从所述目标实体的各相关推荐实体中选取出所述混淆实体。

可选地，该装置还包括：

验证单元，用于验证所述混淆实体与所述目标实体在所述目标属性组下的属性值是否完全相同，若不完全相同则基于所述混淆实体形成所述其他答案选项信息。

可选地，该装置还包括：

第一设置单元，用于按照针对所述目标实体的用户历史行为和/或所述目标实体对应的知识层次，为所述目标问答信息设置难度等级。

可选地，所述第三形成单元，具体用于：

可选地，该装置还包括：

第二设置单元，用于按照所述目标实体的类型，为所述目标问答信息设置类别。

第三方面，本发明实施例还提供了一种生成问答信息的设备，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如前述第一方面所提供的方法。

第四方面，本发明实施例还提供了一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如前述第一方面所提供的方法。

与现有技术相比，本发明实施例具有以下优点：

在本发明实施例中，可以从知识图谱的数据资源中获取目标实体，以及可以用于将目标实体与其他实体区分开的目标实体在目标属性组下的属性值，然后将所获取到的目标实体在目标属性组下的属性值形成问题信息，将目标实体形成正确答案信息，那么，以所述问题信息和所述正确答案信息就可以形成目标问答信息。这样，解决了人工收集问答信息的方式存在耗费人工多、问答信息涉猎范围不够广泛、问答信息难以及时更新、问答信息的正确性难以快速准确验证等问题，借助知识图谱的数据资源自动生成问答信息，减少了对人工的耗费，使生成的问答信息的涉猎范围更加广泛，并且生成的问答信息可以及时更新并得到快速准确的验证。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一个示例性应用场景的框架示意图；

图2为本发明实施例中一种生成问答信息的方法的流程示意图；

图3为本发明实施例中生成问答信息的一界面显示效果图；

图4为本发明实施例中生成问答信息的另一界面显示效果图；

图5为本发明实施例中生成问答信息的又一界面显示效果图；

图6为本发明实施例中生成问答信息的再一界面显示效果图；

图7为本发明实施例中一种选取混淆实体的方法的流程示意图；

图8为本发明实施例中一种生成问答信息的装置的结构示意图；

图9为本发明实施例中一种生成问答信息的设备的结构示意图；

图10为本发明实施例中服务器的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

申请人经过研究发现，现有技术中，基于问答的应用服务中，主要出题方式为：出题人员通过自己的知识经验储备或查阅资料手动收集并录入问答信息。但是，这种人工收集问答信息的方式需要耗费大量的人力物力；而且由于受到出题人员知识面等因素的限制，人工收集的问答信息所涉猎的范围一般不够广泛，不能满足用户对该类应用服务中问答信息多样化的需求；再者，人工收集并录入问答信息的方式，操作比较繁琐耗时，也导致问答信息难以及时的更新、问答信息的正确性难以快速准确验证等问题。

为了解决上述问题，在本发明实施例中，当应用服务中需要生成问答信息时，可以从知识图谱的数据资源中提取出相对应的问题信息与答案信息并形成问答信息。这样，借助知识图谱的数据资源自动生成问答信息，解决了人工收集问答信息的方式存在的诸多问题，使生成的问答信息的涉猎范围更加广泛，减少了对人工的耗费，并且生成的问答信息可以及时更新并得到快速准确的验证，从而可以提升使用该方法生成问答信息的应用服务给用户体验。

举例说明，本发明实施例可以应用到如图1所示的场景。在该场景中，用户110可以在安装有问答类应用服务121的智能终端120上答题，而智能终端120上的问答类应用服务121中，问答信息是由服务器130自动生成的。其中，服务器130生成问答信息的方式可以是：首先，从知识图谱的数据资源中获取目标实体，以及可以用于将目标实体与其他实体区分开的目标实体在目标属性组下的属性值；然后，将所获取到的目标实体在目标属性组下的属性值形成问题信息，将目标实体形成正确答案信息；最后，以问题信息和正确答案信息形成目标问答信息。这样，该问答类应用服务121即可通过与服务器130的数据交互，从服务器130上及时、准确的获取到丰富的问答信息，从而为用户提供了更优的使用该问答类应用服务121进行答题的体验。

可以理解的是，在上述应用场景中，服务器130可以是某个问答类应用服务121对应的应用服务器，为该问答类应用服务121提供问答信息；该服务器130也可以是用于生成问答信息的专用服务器，可以为多个不同的问答类应用服务121提供问答信息；或者，该服务器130还可以是其他的具有生成问答信息功能的服务器。另外，本发明实施例在执行主体方面不受限制，只要执行了本发明实施方式所公开的动作即可，例如，本发明实施例的这些动作可以由服务器130执行。

需要注意的是，上述应用场景仅是为了便于理解本发明而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

下面结合附图，详细说明本发明的各种非限制性实施方式。

示例性方法

参见图2，示出了本发明实施例中的一种生成问答信息的方法。在本实施例中，该方法具体可以包括：

步骤201，从知识图谱的数据资源中获取目标实体和所述目标实体在目标属性组下的属性值，所述目标实体在目标属性组下的属性值可用于将所述目标实体与其他实体区分开。

其中，知识图谱，旨在描述客观世界的概念、实体、事件及它们之间的相互关联关系；而知识图谱的数据资源，包括知识图谱中描述实体的数据资源，以及，描述实体属性对应的属性值的数据资源。一般情况下，知识图谱的数据资源来自某网络百科，那么，知识图谱中的实体即为网络百科中的词条，而实体属性对应的属性值即为该词条属性对应的属性值信息。

可以理解的是，例如网络百科的知识图谱，是一个多人共同编纂的互联网产品，包括的多个实体(即词条)可以划分为不同的类型，如：城市、人物、科技等。根据实体的类型特点，每种类型的实体之间可以具有一部分相同的属性；而根据实体本身具有的特点，相同类型的实体之间也可以具有一部分不同的属性。

举例说明，在实体类型为“人物”的情况下，如果目标实体为“科比”，那么，其对应的目标属性可以包括“人物”通常都具有的属性：出生日期、国籍和身高等，还可以包括“科比”本身的特点对应的属性：曾效力球队、场上位置和球衣号码等。如果目标实体为“范冰冰”，那么，其对应的目标属性可以包括“人物”通常都具有的属性：出生日期、国籍和身高等，还可以包括“范冰冰”本身的特点对应的属性：代表作品和演艺经历等。

需要说明的是，对于不同的实体，对应的属性也可能完全相同，在此不再赘述。

具体实现时，在从知识图谱的数据资源中获取到目标实体后，可以确定该目标实体的所有属性以及所有属性对应的属性值，然后，可以从该目标实体的所有属性以及所有属性对应的属性值中，提取若干个属性组成该目标实体的目标属性组，并将提取的属性对应的属性值作为该目标实体在该目标属性组下的属性值。

可以理解的是，目标属性组可以包括该目标实体的部分或者全部属性。利用目标实体在目标属性组下的属性值即可将目标实体与其他实体区分开，是因为该目标实体在目标属性组中包括的属性对应的属性值，与其他实体在该目标属性组中包括的属性对应的属性值不同，即，根据目标属性组中的属性对应的属性值，可以唯一确定并指向该目标实体。

作为一种示例，目标属性组所包括的属性具体可以是在预设对应关系中，与目标实体的类型对应的属性。其中，预设对应关系，可以是预先设置的目标实体的类型与该类型的实体具有的属性之间的对应关系。例如：预设对应关系包括：“人物”——“出生日期”、“国籍”、“年龄”、“配偶”、“职业”、“主要事迹”和“爱好”之间的对应关系。此时，确定目标实体“范冰冰”的类型为“人物”，则在上述预设对应关系中，确定“人物”的属性，然后在上述7个属性中提取出可以唯一确定和指向“范冰冰”的属性，具体可以提取“年龄”、“职业”和“主要事迹”，那么，该目标实体的目标属性组可以是：{年龄，职业，主要事迹}。

执行步骤201，可以得到目标实体和目标实体在目标属性组下的属性值，举例说明，如果获取到的目标实体为“范冰冰”，那么，可以获取到该目标实体对应的目标属性组可以为{年龄，职业，主要事迹}，那么，“范冰冰”在该目标属性组下的属性值为：37岁、演员、主演《我不是潘金莲》和《观音山》。可以理解的是，通过查看该目标属性组下的属性值，即可唯一确定该目标实体为“范冰冰”。

需要说明的是，步骤201中，知识图谱的数据资源中的每个目标实体，对应至少一个目标属性组，可以唯一确定且指向目标实体。对于生成目标问答信息而言，目标属性组包括的属性数量越少，生成的目标问答信息中的问题信息越简洁明了，该目标问答信息给用户的体验越好。本实施例中，目标属性组指包括属性数量最少的目标属性组，当然，在该属性数量最少的目标属性组的基础上，以任意组合形式增加该目标实体的其他属性，也属于步骤201中获取的目标属性组。在本发明实施例中，为了更加方案的实用性和方案描述更加方便，以包括属性数量最少的目标属性组视作目标属性组进行描述，其他情况的实现方式参见属性数量最少的目标属性组，本实施例中不再赘述。

从知识图谱的数据资源中，根据步骤201获取到目标实体和目标实体在目标属性组下的属性值，为后续执行步骤202～步骤203，生成目标问答信息提供了数据基础。

步骤202，基于所述目标实体在目标属性组下的属性值形成问题信息并基于所述目标实体形成正确答案信息。

具体实现时，步骤202包括两个小步骤：S1、基于步骤201获取到的目标实体在目标属性组下的属性值形成问题信息；S2、基于目标实体形成正确答案信息。

作为一种示例，对于步骤S1，可以是将获取到的目标实体在目标属性组下的属性值，根据语法句式结构，整理为一条通顺的、容易理解的问题信息。例如，获取到的目标实体在目标属性组下的属性值包括：37岁、演员、主演《我不是潘金莲》和《观音山》，那么，根据语法句式结构，形成的问题信息可以是：主演过《我不是潘金莲》和《观音山》，今年37岁的演员是谁？

对于步骤S2，一种情况下，如果需要生成的问答信息为填空题，则，可以将目标实体作为正确答案信息；另一种情况下，如果需要生成的问答信息为选择题，可以将该目标实体直接作为正确答案信息，也可以将该目标实体以及对应的选项编号作为正确答案信息。例如，对于目标实体“范冰冰”，形成的正确答案信息可以是：范冰冰，也可以是：C、范冰冰。

步骤203，以所述问题信息和所述正确答案信息形成目标问答信息。

其中，目标问答信息中，包括步骤202中形成的问题信息和正确答案信息。例如，问题信息“主演过《我不是潘金莲》和《观音山》，今年37岁的演员是谁？”和正确答案信息“范冰冰”形成了目标问答信息。

需要说明的是，对于同一目标实体形成的正确答案信息，由于目标实体可以对应于多个目标属性组，在不同的目标属性组下的属性值都不相同，由不同的目标属性组下的属性值形成的问题信息也就不同，所以，一个正确答案信息可能对应不同的问题信息。这样，根据步骤203，就可以将同一个正确答案信息，生成多组问答信息，每组问答信息包括该正确答案信息和一个问题信息。

作为一些可能的实现方式，对于包括同一正确答案信息的多组问答信息的情况，如果对应于同一个正确答案信息的目标问答信息过多，则降低了目标问答信息的新鲜度，用户答题时会有重复答题的感觉。那么，为了提升用户体验，步骤203具体可以是：若基于所述目标实体形成正确答案信息的问答信息的数量未超过预设阈值，以所述问题信息和所述正确答案信息形成目标问答信息。

可以理解的是，预设阈值，即为预先设置的允许同一正确答案信息对应的问答信息的最大数量。如果基于目标实体形成正确答案信息的问答信息的数量未超过预设阈值，则，认为该正确答案信息对应的当前问答信息的数量在用户可接受的范围内，不会影响用户答题体验，那么，将多个不同的问题信息分别和正确答案信息形成目标问答信息。如果基于目标实体形成正确答案信息的问答信息的数量超过了预设阈值，则，认为该正确答案信息对应的当前问答信息的数量会影响用户的答题体验，降低题目的新鲜度，那么，可以从多个问题信息中选取预设阈值个问题信息，分别和正确答案信息形成预设阈值个目标问答信息。

例如，假设预设阈值为5，那么，如果某个目标实体形成的正确答案信息的问答信息的数量为3，则，可以将这3个问题信息和该正确答案信息形成3个不同的目标问答信息；如果某个目标实体形成的正确答案信息的问答信息的数量为6，则，可以从这6个问题信息中选取5个问题信息，分别和该正确答案信息形成5个不同的目标问答信息。

可见，通过本实施例，从知识图谱的数据资源中提取出相对应的问题信息与正确答案信息，并组成问答信息，从而实现了问答信息自动生成，减少了问答信息收集需要耗费的人工、使得问答信息能够涉猎更广泛的范围、及时更新并得到快速准确的验证。

在一些可能的实现方式中，为了让用户有更优的答题体验，可以根据自身的预期和知识储备，选择用户自己比较有把握的难度对应的问答题目，本实施例中生成问答题目的技术方案，在步骤203之后，还可以包括对生成的目标问答信息设置难度等级。作为一种示例，具体可以包括：按照针对所述目标实体的用户历史行为和/或所述目标实体对应的知识层次，为所述目标问答信息设置难度等级。

一种情况下，可以按照针对目标实体的用户历史行为，为所述目标问答信息设置难度等级。该用户历史行为，可以包括该目标实体对应的网页的访问量、点评数量和编辑次数等。具体实现时，当针对目标实体的用户历史行为越频繁，可以认为该目标实体被用户查看和了解的程度越深，那么，可以设置该目标问答信息的难度等级越低；反之，当针对目标实体的用户历史行为越少，可以认为该目标实体被用户查看和了解的程度越浅，那么，可以设置该目标问答信息的难度等级越高。例如，目标实体“范冰冰”对应的网页的访问量相当多，那么，设置对应的目标问答信息的难度等级为低；目标实体“发明专利”对应的网页的访问量很少，那么，设置对应的目标问答信息的难度等级为高。

另一种情况下，可以按照目标实体对应的知识层次，为所述目标问答信息设置难度等级。该目标实体对应的知识层次，可以包括该目标实体对应的技术或者产品被用户知晓和掌握的难易程度。具体实现时，当针对目标实体对应的知识层次较高，可以认为该目标实体被用户查看和了解的程度越浅，那么，可以设置该目标问答信息的难度等级越高；反之，当针对目标实体对应的知识层次较低，可以认为该目标实体被用户查看和了解的程度越深，那么，可以设置该目标问答信息的难度等级越低。例如，目标实体“黑洞”对应的知识层次较高，那么，设置对应的目标问答信息的难度等级为高；目标实体“地球”对应的知识层次较低，那么，设置对应的目标问答信息的难度等级为低。

再一种情况下，还可以按照针对目标实体的用户历史行为和目标实体对应的知识层次，综合的为所述目标问答信息设置难度等级。具体的设置方式可以参见上述两种情况的设置方式，这里不再赘述。需要说明的是，可以根据实际情况，为生成的目标问答信息设置多个难度等级，例如可以设置：易、偏易、适中、偏难和难5个难度等级。具体可以通过设置多个针对所述目标实体的用户历史行为阈值和/或所述目标实体对应的知识层次阈值，将生成的目标问答信息按照量化计算结果确定归类到不同的难度等级中。

在具体实现时，如图3所示，可以在答题之前，在问答类应用服务的显示界面上显示不同的难度等级，供用户按照自己的心理预期进行选择目标难度等级，从而对该目标难度等级对应的目标问答信息进行作答。当然，用户也可以选择“跳过”，不选择即将作答题目的难度等级，此时，该问答类应用服务可以随机为该用户显示所有目标问答题目中的部分题目，供用户作答。

在一些可能的实现方式中，为了让用户有更优的答题体验，可以根据自身的兴趣和擅长，选择用户自己需要作答的问答题目的类型，本实施例中生成问答题目的技术方案，在步骤203之后，还可以包括对生成的目标问答信息设置题目类别。作为一种示例，具体可以包括：按照所述目标实体的类型，为所述目标问答信息设置类别。

一般情况下，目标问答信息的类别例如可以包括：人物、影视、音乐、历史、地理和科技等。一种情况下，如果目标实体的类型和目标问答信息的类别一致，即，目标实体的类型例如也包括人物、影视、音乐、历史、地理和科技等，那么，可以将目标实体的类型直接设置为该目标问答信息的类别；另一种情况下，如果目标实体的类型和目标问答信息的类别不一致，例如，目标实体的类型可以包括人物、娱乐、文化和科技等，那么，可以将目标实体的类型进行细化并将细化后的类型设置为对应的目标问答信息的类别，将目标实体的“娱乐”类型的题目按照题目的特征，分别设置为“影视”和“音乐”类别的目标问答信息；将目标实体的“文化”类型的题目按照题目的特征，分别设置为“历史”和“地理”类别的目标问答信息；再例如，目标实体的类型可以包括体育明星、演员、歌手、电影、电视剧、综艺、音乐、历史、地理和科技等，那么，可以将目标实体的类型进行分析和汇总，将“体育明星”、“演员”和“歌手”的目标问答信息的类别设置为“人物”，将“电影”、“电视剧”和“综艺”的目标问答信息的类别设置为“影视”。

通过对目标问答信息进行类别设置，可以将不同类别的目标问答信息区别开来，保存在不同的类别空间下，也可以给每个目标问答题目信息增加类别标识，以便于响应用户的选择题目类别操作，为用户选择对应类型的目标问答信息，提升用户的答题体验。

在具体实现时，如图4所示，可以在答题之前，在问答类应用服务的显示界面上显示不同的目标问答信息的类别，供用户自行选择某个目标问答信息的类别，从而对该类别对应的目标问答信息进行作答。当然，用户也可以选择“跳过”，不选择即将作答题目的类别，此时，该问答类应用服务可以随机为该用户显示所有目标问答题目中的部分题目，供用户作答。

在该实施例中，问答类应用服务中常见的题目类型包括：选择题和填空题。下面对生成选择题和填空题类型的目标问答信息进行详细的说明。

对于填空题，如图5所示，问答类应用服务的显示界面上可能只显示目标问答信息中的问题信息，然后识别用户输入的文字信息或者语音信息作为答题信息，并判断该答题信息和正确答案信息是否一致，如果一致，则在预设位置显示该正确答案信息。例如，答题界面上显示问题信息：“主演过《我不是潘金莲》和《观音山》，今年37岁的演员是_______？”。

具体实现时，如图5所示，为了进一步提高用户的答题乐趣，还可以在填空题的问题信息附近设置“提示”按钮和“偷看”按钮。用户通过触发“提示”按钮，可以显示当前题目对应的目标实体，在目标属性组之外的属性对应的属性值，以帮助用户推测正确答案信息。根据预先设置，可以根据用户需要多次点击“提示”按钮，获得更多的提示信息。同时，为了答题的公平性，可以在每获得一个提示信息后，该当前题目答对时的得分减少预设的分数，例如，看一个提示，得分减少一分。用户通过触发“偷看”按钮，查看该问题信息对应的正确答案信息，那么，该当前题目的得分将记为0分。

对于选择题，如图6所示，问答类应用服务的显示界面上显示目标问答信息中的问题信息和至少两个答案选项信息，其中，所述正确答案信息为所述至少两个答案选项信息中的一个答案选项信息，而答案选项信息中除了正确答案信息之外的答案选项信息均为错误答案。举例说明，假设目标问答信息中包括问题信息：“主演过《我不是潘金莲》和《观音山》，今年37岁的演员是谁？”，以及四个答案选项信息“A范冰冰，B李冰冰，C高圆圆，D李小璐”，正确答案信息为“A范冰冰”，那么，答案选项信息“B李冰冰，C高圆圆，D李小璐”为错误答案。

在一些可能的实现方式中，所述至少两个答案选项信息中除所述正确答案信息之外的其他答案选项信息是基于混淆实体形成的，所述混淆实体是从所述目标实体的相关推荐实体选取出来的。

可以理解的是，在目标实体所在的知识图谱的数据资源中，存在与该目标实体关联的其他相关推荐实体，可以按照一定的规则从这些相关推荐实体中选取合适的混淆实体，并基于混淆实体形成其他答案选项信息，作为干扰项，增加用户作答时选项的数目，提高用户的作答难度。

可以理解的是，虽然在步骤201中获得的目标实体在目标属性组下的属性值，可以用于将目标实体与其他实体区分开，但是，为了避免同一问题信息中出现多个正确答案信息的问题，还可以对形成的其他答案选项信息的混淆实体进行验证。具体可以包括：验证所述混淆实体与所述目标实体在所述目标属性组下的属性值是否完全相同，若不完全相同则基于所述混淆实体形成所述其他答案选项信息。

具体实现时，可以判断混淆实体在目标属性组下的属性值和目标实体在目标属性组下的属性值是否完全相同，如果完全相同，则说明该混淆实体形成的其他答案选项信息也可以是基于该目标实体在目标属性组下的属性值形成的问题信息的正确答案。那么，为了保证生成的目标问答信息答案的唯一性，将不基于该混淆实体形成其他答案选项信息，或者，将基于该混淆实体形成其他答案选项信息删除。如果不完全相同，则说明该混淆实体形成的其他答案选项信息不是基于该目标实体在目标属性组下的属性值形成的问题信息的正确答案，那么，可以基于该混淆实体形成其他答案选项信息，作为目标问答信息的一部分。

通过对混淆实体的验证，可以排除同一个目标问答题目中出现两个正确答案的情况，确保了答案的唯一性，避免由于生成目标问答信息不当，给用户作答带来困惑，提升了用户体验。

在该实现方式的一种示例中，该混淆实体具体可以是目标实体的相关推荐实体中与所述目标实体类型相同的实体。避免出现目标实体的类型为“国家”，但选取的混淆实体为“城市”和“运动项目”等无关选项，降低用户的作答难度和作答体验。

举例来说，假设在网络百科中的词条(即目标实体)“西班牙”对应的网页中，该词条的相关推荐词条(即相关推荐实体)包括“葡萄牙”、“欧洲”、“巴塞罗那”、“斗牛”、“希腊”和“意大利”，那么，可以从这些相关推荐词条中选取类型为“国家”的混淆实体，包括：“葡萄牙”、“希腊”和“意大利”，然后将这3个混淆实体形成3个其他答案选项信息。将问题信息、3个其他答案选项信息和1个正确答案信息形成目标问答信息，供用户选择正确答案。

在该实现方式的另一种示例中，如图7所示，为了从相关推荐实体中更优的选取出混淆实体，选取混淆实体的方式可以还包括：

步骤701，根据所述目标实体的各相关推荐实体与所述目标实体的字面含义和/或在所述目标属性组下的属性值，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度；

步骤702，根据所述目标实体的各相关推荐实体与所述目标实体之间的相似度，从所述目标实体的各相关推荐实体中选取出所述混淆实体。

可以理解的是，对于步骤701，包括三种实现方式：

一种实现方式下，根据所述目标实体的各相关推荐实体与所述目标实体的字面含义，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度。具体可以是：获取目标实体的字面含义，以及相关推荐实体的字面含义，分别计算每个相关推荐实体的字面含义和目标实体的字面含义的相似度。

另一种实现方式下，根据所述目标实体的各相关推荐实体与所述目标实体在所述目标属性组下的属性值，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度。具体可以是：获取目标实体在所述目标属性组中每个属性下的属性值，以及相关推荐实体在该目标属性组中每个属性下对应的属性值，分别计算每组属性对应的属性值的相似度，然后综合求出目标属性组中所有属性的属性值的相似度，作为目标实体的各相关推荐实体与所述目标实体之间的相似度。

再一种实现方式下，根据所述目标实体的各相关推荐实体与所述目标实体的字面含义和在所述目标属性组下的属性值，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度。与上述两种计算方式相似，可以参见上述两种实现方式进行计算，这里不再赘述。

可以理解的是，对于步骤702，具体可以包括：将所述目标实体的各相关推荐实体与所述目标实体之间的相似度按照从大到小或者从小到大的方式进行排序，再从所述目标实体的各相关推荐实体中选取出相似度较大的前预设数量个相关推荐实体，作为混淆实体。

该示例中包括三种具体的选取混淆实体的方式，分别为：

一种情况下，可以根据所述目标实体的各相关推荐实体与所述目标实体的字面含义，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度，再根据所述目标实体的各相关推荐实体与所述目标实体之间的相似度，从所述目标实体的各相关推荐实体中选取出相似度较大的前预设数量个相关推荐实体。

另一种情况下，还可以根据所述目标实体的各相关推荐实体与所述目标实体在所述目标属性组下的属性值，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度，再根据所述目标实体的各相关推荐实体与所述目标实体之间的相似度，从所述目标实体的各相关推荐实体中选取出相似度较大的前预设数量个相关推荐实体。

再一种情况下，也可以根据所述目标实体的各相关推荐实体与所述目标实体的字面含义和在所述目标属性组下的属性值，计算所述目标实体的各相关推荐实体与所述目标实体之间的相似度，再根据所述目标实体的各相关推荐实体与所述目标实体之间的相似度，从所述目标实体的各相关推荐实体中选取出相似度较大的前预设数量个相关推荐实体。

当生成的目标问答信息的类型为选择题时，如图6所示，为了进一步提高用户的答题乐趣，还可以在选择题的附近设置“去掉一个错误答案”按钮和“偷看”按钮。用户通过触发“去掉一个错误答案”按钮，可以隐藏当前显示的答案选项信息中的一个其他答案选项信息，以提高用户作答出正确答案信息的概率。根据预先设置，可以根据用户需要多次点击“去掉一个错误答案”按钮，获得更高的作答正确概率。同时，为了答题的公平性，可以在每去掉一个错误答案后，该当前题目答对时的得分减少预设的分数，例如，去掉一个正确答案，得分减少一分。用户通过触发“偷看”按钮，查看该问题信息对应的正确答案信息，那么，该当前题目的得分将记为0分。

为了提高用户体验，无论是选择题还是填空题，都可以在生成问答信息后，获取该问答信息的答案详解，并保存在该目标问答信息中。当用户需要时，如图5和图6所示，该问答类的应用服务可以响应于用户的点击，查看“显示答案详解”，以及“隐藏答案详解”。为了提高用户体验，还可以答题后，通过语音或者文字的形式提示用户答题结果，比如显示“答对了，加5分”，或者，“很遗憾，答错了，加油哦”。

通过本实施例提供的生成问答信息的方法，可以借助知识图谱的数据资源，自动生成选择题和填空题等不同类型的目标问答信息。这样，解决了人工收集问答信息的方式存在耗费人工多、问答信息涉猎范围不够广泛、问答信息难以及时更新、问答信息的正确性难以快速准确验证等问题，不仅减少了对人工的耗费，使生成的问答信息的涉猎范围更加广泛，生成的问答信息可以及时更新并得到快速准确的验证；而且可以使采用该方式生成问答题目的问答类应用服务更加符合用户对该类应用服务的需求，提高了用户使用该类应用服务的体验，从而使更多的用户开始参与并喜欢上该类应用服务，丰富了用户的业余时间，提高用户的知识储备量。

示例性设备

参见图8，示出了本发明实施例中的一种生成问答信息的装置。在本实施例中，该装置包括：

获取单元810，用于从知识图谱的数据资源中获取目标实体和所述目标实体在目标属性组下的属性值，所述目标实体在目标属性组下的属性值可用于将所述目标实体与其他实体区分开；

第一形成单元820，用于基于所述目标实体在目标属性组下的属性值形成问题信息；

第二形成单元830，用于基于所述目标实体形成正确答案信息；

第三形成单元840，用于以所述问题信息和所述正确答案信息形成目标问答信息。

可选地，该装置还包括：

可选地，所述第三形成单元840，具体用于：

可选地，该装置还包括：

本实施例是上述生成问答信息的方法实施例对应的装置实施例，具体实现方式以及达到的技术效果，可以参考上述生成问答信息的方法实施例的描述，这里不再赘述。参照图9，装置900可以包括以下一个或多个组件：处理组件902，存储器904，电源组件906，多媒体组件906，音频组件910，输入/输出(I/O)的接口912，传感器组件914，以及通信组件916。

处理组件902通常控制装置900的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件902可以包括一个或多个处理器920来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件902可以包括一个或多个模块，便于处理组件902和其他组件之间的交互。例如，处理部件902可以包括多媒体模块，以方便多媒体组件906和处理组件902之间的交互。

存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理系统，一个或多个电源，及其他与为装置900生成、管理和分配电力相关联的组件。

多媒体组件906包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件906包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件910被配置为输出和/或输入音频信号。例如，音频组件910包括一个麦克风(MIC)，当装置900处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中，音频组件910还包括一个扬声器，用于输出音频信号。

I/O接口912为处理组件902和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件914包括一个或多个传感器，用于为装置900提供各个方面的状态评估。例如传感器组件914可以检测到设备900的打开/关闭状态，组件的相对定位，例如所述组件为装置900的显示器和小键盘，传感器组件914还可以检测装置900或装置900一个组件的位置改变，用户与装置900接触的存在或不存在，装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件914还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件916还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

具体地，本发明实施例提供了一种生成问答信息的设备，该设备可以具体为装置900，包括有存储器904，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器904中，且经配置以由一个或者一个以上处理器920执行所述一个或者一个以上程序包含用于进行以下操作的指令：

以所述问题信息和所述正确答案信息形成目标问答信息。

可选地，所述处理器920还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令：

按照所述目标实体的类型，为所述目标问答信息设置类别。本发明实施例还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器904，上述指令可由装置900的处理器920执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行一种生成问答信息的方法，所述方法包括：

以所述问题信息和所述正确答案信息形成目标问答信息。

可选地，该方法还包括：

按照所述目标实体的类型，为所述目标问答信息设置类别。

图10是本发明实施例中服务器的结构示意图。该服务器1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1022(例如，一个或一个以上处理器)和存储器1032，一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中，存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1022可以设置为与存储介质1030通信，在服务器1000上执行存储介质1030中的一系列指令操作。

服务器1000还可以包括一个或一个以上电源1026，一个或一个以上有线或无线网络接口1050，一个或一个以上输入输出接口1058，一个或一个以上键盘1056，和/或，一个或一个以上操作系统1041，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种生成问答信息的方法，其特征在于，包括：

以所述问题信息和所述正确答案信息形成目标问答信息。

2.根据权利要求1所述的方法，其特征在于，所述目标问答信息包括至少两个答案选项信息，其中，所述正确答案信息为所述至少两个答案选项信息中的一个答案选项信息；

3.根据权利要求2所述的方法，其特征在于，所述混淆实体为，所述目标实体的相关推荐实体中与所述目标实体类型相同的实体。

4.根据权利要求2所述的方法，其特征在于，还包括：

5.根据权利要求2所述的方法，其特征在于，还包括：

6.根据权利要求1所述的方法，其特征在于，还包括：

7.根据权利要求1所述的方法，其特征在于，所述以所述问题信息和所述正确答案信息形成目标问答信息，包括：

8.一种生成问答信息的装置，其特征在于，包括：

第二形成单元，用于基于所述目标实体形成正确答案信息；

9.一种生成问答信息的设备，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如前述权利要求1至7任意一项所述的方法。

10.一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如前述权利要求1至7任意一项所述的方法。