CN113010633B

CN113010633B - 一种信息交互方法及设备

Info

Publication number: CN113010633B
Application number: CN201911330884.6A
Authority: CN
Inventors: 邵星阳; 殷腾龙; 杨善松; 刘永霞
Original assignee: Hisense Visual Technology Co Ltd
Current assignee: Hisense Visual Technology Co Ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2023-01-31
Anticipated expiration: 2039-12-20
Also published as: CN113010633A

Abstract

本申请公开了一种信息交互方法及设备，包括：接收来自于智能设备的查询请求，根据所述查询请求获得用户查询语句文本；根据所述用户查询语句文本中包含的实体指称查询知识库，得到待消除歧义实体指称对应的候选实体集合，所述候选实体集合中包括至少两个候选实体；确定每个候选实体的特征向量，并确定不同候选实体两两组合的特征向量之差；利用所述不同候选实体两两组合的特征向量之差，按照与所述待消除歧义实体指称的相关度对所述候选实体进行排序，并从排序后的候选实体中选择与所述待消除歧义实体指称相关的实体；根据与所述用户查询语句文本中的实体指称相关的实体，响应所述查询请求，并向所述智能设备发送响应结果。

Description

一种信息交互方法及设备

技术领域

本申请涉及通信技术，尤其涉及一种信息交互方法及设备。

背景技术

实体链接是语义理解的基础技术，由于自然语言表达的多样性，要求智能设备能够准确理解含有待消除歧义实体指称的查询请求，提供对应的语义服务，从而提高用户体验。

然而，由于自然语言表达的多样性，同一实体可用不同的文本表达(多词一义)，而同一文本可能表达多个不同的实体(一词多义)，使得用户查询请求中的一个实体指称可能会链接到知识库中多个不同的实体，无法提供对应用户查询请求的语义服务。例如，用户发送查询请求″黄磊的身高″，其中，″黄磊″一词为待消除歧义的实体指称，在知识库中存在29个不同的实体(比如北京交通大学工程研究院常务副院长、教授黄磊，中国内地男演员、教师黄磊等)，如果智能设备无法准确理解实体指称相关的实体也就无法提供对应的语义服务，导致用户意图得不到正确响应。

目前，解决待消除歧义实体指称的链接问题大多采用标签标注加规则匹配的方法。首先基于词典枚举词语的全部标签(比如[小米-植物、公司、角色、小吃])；再解析使用标签之间的搭配规则进行标签消岐。该方法没有充分结合用户查询请求语义信息进行消岐，而且搭配规则难以穷举完成，不好设定规则间的优先级，导致无法准确进行实体链接。举例来说，″李克勤的红日″，后台标注有[李克勤-歌手、演员、主持人][红日-歌曲、电视剧、电影、小说]，而固定的搭配规则有：{歌手<->歌曲}{演员<->电影、电视剧}，运用以上规则，可以推出{歌手<->歌曲}{演员<->电影、电视剧}这两组标签均符合本句话的标签搭配，在缺少查询请求背景信息时，无法进一步确定对应的标签搭配以及对应的语义服务，降低了用户体验。

因此，需提供一种用于消除实体指称语义歧义、准确链接到知识库中相关实体的方法来优化信息交互过程。

发明内容

本申请提供了一种信息交互方法及设备，用以在交互过程中，响应用户查询请求时，通过知识图谱构建技术得到用户查询语句文本中待消除歧义的实体指称的候选实体集合，基于机器学习实体排序模型，利用候选实体的特征向量，从而准确链接查询语句文本中待消除歧义实体指称的相关实体，进而提供对应的语义服务，提升用户体验。

本申请实施例提供的一种信息交互方法，包括：

接收来自于智能设备的查询请求，根据所述查询请求获得用户查询语句文本，所述用户查询语句文本中包含至少一个实体指称；

根据所述用户查询语句文本中包含的实体指称查询知识库，得到待消除歧义实体指称对应的候选实体集合，所述候选实体集合中包括至少两个候选实体；

确定每个候选实体的特征向量，并确定不同候选实体两两组合的特征向量之差；其中，所述特征向量中包括至少一个用于表征所述候选实体与所述待消除歧义实体指称之间的相似度的特征值；

利用所述不同候选实体两两组合的特征向量之差，按照与所述待消除歧义实体指称的相关度对所述候选实体进行排序，并从排序后的候选实体中选择与所述待消除歧义实体指称相关的实体；

根据与所述用户查询语句文本中的实体指称相关的实体，响应所述查询请求，并向所述智能设备发送响应结果。

本申请实施例中，所述特征值包括以下之一或任意组合：

所述候选实体在知识库中的描述文本的语义向量，与所述用户查询语句文本的语义向量之间的相似度；

所述候选实体在知识库中的描述文本的语义向量，与所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体的语义向量之间的相似度；

所述候选实体的语义向量，与所述待消除歧义实体指称的语义向量之间的相似度；

所述候选实体的语义向量，与所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体的语义向量之间的相似度；

所述候选实体在知识库中的背景文本的语义向量，与所述待消除歧义实体指称的语义向量之间的相似度；

所述候选实体在知识库中的背景文本的语义向量，与所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体的语义向量之间的相似度。

可选的，所述特征值还包括：所述候选实体在知识库中的描述文本的主题，与所述待消除歧义实体指称在所述用户查询语句文本中的上下文的主题之间的相似度，该相似度用于表征所述候选实体与所述待消除歧义实体指称之间的主题相似度。

可选的，所述特征值还包括：所述候选实体的先验流行度。

可选的，所述特征值还包括：所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体是否出现在所述候选实体在知识库中的描述文本中，根据出现结果得到候选实体的名词实体重合特征值；所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体在所述候选实体在知识库中的描述文本中出现的次数，若所述待消除歧义实体指称在所述用户查询语句文本中的上下文存在多个名词实体，则特征值为多个名词实体出现的次数和。

可选的，所述特征值还包括：所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体与所述候选实体义项名的相似度。

可选的，所述特征值还包括：所述候选实体的词条标签，与所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体的相似度；所述候选实体的词条标签是否出现在所述待消除歧义实体指称所在用户查询语句文本的上下文中的特征值。

可选的，所述特征值还包括：所述待消除歧义实体指称，与所述候选实体在知识库中的描述文本的关键词的相似度。

本申请实施例提供的一种服务器，包括：

接收模块，用于接收来自于智能设备的查询请求；

处理模块，用于根据所述查询请求获取用户查询语句文本，所述用户查询语句文本中包含至少一个实体指称；

所述处理模块，还用于根据所述用户查询语句文本中包含的实体指称查询知识库，得到待消除歧义实体指称对应的候选实体集合，所述候选实体集合中包括至少两个候选实体；

所述处理模块，还用于确定每个候选实体的特征向量，并确定不同候选实体两两组合的特征向量之差；其中，所述特征向量中包括至少一个用于表征所述候选实体与所述待消除歧义实体指称之间的相似度的特征值；

排序模块，用于利用所述不同候选实体两两组合的特征向量之差，按照与所述待消除歧义实体指称的相关度对所述候选实体进行排序，并从排序后的候选实体中选择与所述待消除歧义实体指称相关的实体；

所述处理模块，还用于根据与所述用户查询语句文本中的实体指称相关的实体，响应所述查询请求；

发送模块，用于向所述智能设备发送响应结果。

本申请实施例提供的一种计算机存储介质，所述计算机存储介质中存储有计算机程序指令，当所述指令在计算机上运行时，使得所述计算机执行信息交互的方法。

本申请的上述实施例中，在响应用户查询请求时，一方面，基于机器学习实体排序模型，利用候选实体两两组合的特征向量之差对候选实体进行排序，并从排序后的候选实体中选择与待消除歧义实体指称相关的实体，与采用标签标注加规则匹配的方法相比，可以准确消除用户查询语句文本中实体指称的语义歧义，使得实体指称与知识库中的候选实体能够准确链接；另一方面，根据与用户查询语句文本中的实体指称相关的实体响应用户查询请求，充分利用了实体指称所在查询语句文本的上下文信息，使得智能设备能够准确理解用户的语义信息，进而提供对应的语义服务，提高了用户体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1中示例性示出了根据实施例中显示设备与控制装置之间操作场景的示意图；

图2a中示例性示出了根据实施例中排序问题转化为分类问题的原理图；

图2b中示例性示出了根据实施例中排序支持向量机模型的原理图；

图3中示例性示出了根据实施例中信息交互方法流程示意图；

图4示例性示出了根据实施例中显示设备200响应于用户查询请求后的用户界面。

具体实施方式

本申请实施例提供一种信息交互方法以及实现该方法的服务器，能够在人机交互场景中，响应用户查询请求时，消除用户查询语句文本中实体指称的语义歧义，与知识库中的实体准确进行实体链接，使得设备能够正确理解用户的查询语句，从而提供对应的语义服务，提升用户体验。

示例性地，人机交互场景的一个示例为：用户通过语音发送音频形式的用户查询语句，智能设备对该音频进行降噪等处理，并向服务器发送用户查询请求，其中携带降噪等处理后的音频，服务器对该音频进行识别得到用户查询语句文本，并基于知识库对该用户查询语句文本进行语义理解，根据理解的语义响应该用户查询请求，并向智能设备发送响应结果。

其中，本申请实施例中的设备可以是具有语音交互功能的显示设备，比如智能电视、智能手机等，该显示设备可以响应用户查询请求，并在用户界面显示查询请求的响应结果。本申请实施例中的设备也可以是具有语音交互功能的播放设备，比如智能音箱，该播放设备可以响应用户的查询请求，播放查询请求的响应结果。

为使本申请示例性实施例的目的、技术方案和优点更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施例中的技术方案进行清楚、完整地描述，显然，所描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

基于本申请中示出的示例性实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。此外，虽然本申请中公开内容按照示范性一个或几个实例来介绍，但应理解，可以就这些公开内容的各个方面也可以单独构成一个完整技术方案。

应当理解，本申请中说明书和权利要求书及上述附图中的术语″第一″、″第二″、″第三″等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。

此外，术语″包括″和″具有″以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的那些组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

本申请中使用的术语″模块″，是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

本申请中使用的术语″遥控器″，是指电子设备(如本申请中公开的显示设备)的一个组件，通常可在较短的距离范围内无线控制电子设备。一般使用红外线和/或射频(RF)信号和/或蓝牙与电子设备连接，也可以包括WiFi、无线USB、蓝牙、动作传感器等功能模块。例如：手持式触摸遥控器，是以触摸屏中用户界面取代一般遥控装置中的大部分物理内置硬键。

下面结合附图对本申请实施例进行详细描述，以下的部分实施例中，以信息交互设备为显示设备为例描述。

图1中示例性示出了根据实施例中显示设备与控制装置之间操作场景的示意图。如图1中示出，用户可通过移动终端300和控制装置100操作显示设备200。

其中，控制装置100可以遥控器，包括红外协议通信或蓝牙协议通信，及其他短距离通信方式等，通过无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键，语音输入、控制面板输入等输入用户指令，来控制显示设备200。如：用户可以通过遥控器上音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等输入相应控制指令，来实现控制显示设备200的功能。

在一些实施例中，也可以使用移动终端、平板电脑、计算机、笔记本电脑、和其他智能设备以控制显示设备200。例如，使用在智能设备上运行的应用程序控制显示设备200。该应用程序通过配置可以在与智能设备关联的屏幕上，在直观的用户界面(UI)中为用户提供各种控制。

示例的，移动终端300可与显示设备200安装软件应用，通过网络通信协议实现连接通信，实现一对一控制操作的和数据通信的目的。如：可以实现用移动终端300与显示设备200建立控制指令协议将遥控控制键盘同步到移动终端300上通过控制移动终端300上用户界面，实现控制显示设备200的功能。也可以将移动终端300上显示音视频内容传输到显示设备200上，实现同步显示功能。

如图1中还示出，显示设备200还与服务器400通过多种通信方式进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。示例的，显示设备200通过发送和接收信息，以及电子节目指南(EPG)互动，接收软件程序更新，或访问远程储存的数字媒体库。服务器400可以一组，也可以多组，可以一类或多类服务器。通过服务器400提供视频点播和广告服务等其他网络服务内容。

显示设备200，可以为智能电视、智能音箱。具体智能产品类型、设备型号等不作限定，本领技术人员可以理解的是，显示设备200可以根据需要做性能和配置上一些改变。

显示设备200除了提供广播接收电视功能之外，还可以附加提供计算机支持功能的智能网络电视功能。示例的包括，网络电视、智能电视、互联网协议电视(IPTV)等。

本申请的实施例中，服务器接收来自于智能设备的查询请求，识别得到查询语句文本中待消除歧义的实体指称，通过知识图谱相关技术，得到实体指称在知识库中的候选实体集合以及候选实体的特征向量，基于机器学习实体排序模型，利用候选实体的特征向量，得到知识库中的候选实体集合中一个与实体指称相关的实体，从而根据用户查询语句文本中的实体指称相关的实体响应用户语音查询请求。

为清楚说明本申请的实施例，下面给出一些语义分析相关的名词的相关解释。

实体：是指客观存在并可相互区别的事物，包括具体的人、事、物、机构、抽象的概念或联系。

实体指称：指代实体的一个名称。

知识库：知识根据它们的应用领域特征、背景特征、使用特征、属性特征等而被构成便于利用的、有结构的组织形式，称为知识库。比如，在实体链接研究中所使用的中文知识库包括百度百科、互动百科、中文维基百科等，英文知识库包括维基百科等。

其中，知识库包括实体的相关信息，比如描述文本、背景文本、义项名、词条标签等信息，描述文本可为百度百科、维基百科等对实体的描述信息，背景文本可为社交网站(比如微博)中实体的背景信息，义项名是对实体作明确识别，词条标签是用来描述一个词条所属属性或领域的词语，比如词条″融资″，其标签可为″术语″，表示″融资″的属性，其标签还可为″经济学″，表示″融资″的所属领域。

举例来说，用户查询请求语句为″中关村的苹果不错″，其中，″中关村″为实体，是一个客观存在的具体地点，其在知识库中对应于一个实体{中关村}，″苹果″也为实体指称，在知识库中，该实体指称对应多个实体，形成候选实体集合{果实，苹果产品公司}。

将用户查询语句中的实体指称关联到知识库中的相应实体，可称为实体链接。一个实体指称可能链接到知识库中的一个实体，比如上述例子中的″中关村″，一个实体指称也可能链接到知识库中的多个(即两个或两个以上)的实体，如上述例子中的″苹果″。如果一个实体指称链接到知识库中的多个实体，则该实体指称可称为″歧义实体指称″。对于歧义实体指称，在语义分析时需要对其进行歧义消除处理，使其仅链接到知识库中的一个实体。

本申请的实施例中，利用知识库中候选实体丰富的自身信息设计机器学习实体排序模型的特征，基于机器学习的实体排序模型，从歧义实体指称对应的候选实体集合中选择一个与用户查询请求相关的实体，使得在语义分析时能够正确理解用户的交互意图以便做出准确的响应。

本申请的实施例中，基于机器学习的实体排序模型可以使用排序支持向量机模型(Ranking Support Vector Machine，Ranking SVM)，也可以使用其它排序学习算法(比如Leaming to Rank，L2R)。图2a中示例性示出了根据实施例中排序问题转化为分类问题的原理图，图2b中示例性示出了根据实施例中排序支持向量机模型的示意图。排序支持向量机模型的主要思想为：给定查询语句，与其相关的对应文档为d₁＞d₂＞d₃(文档d₁比文档d₂相关，文档d₂比文档d₃相关，x₁，x₂，x₃分别是d₁，d₂，d₃的特征)，为使排序问题转化为分类问题，定义新的训练样本，令x₁-x₂，x₁-x₃，x₂-x₃为正样本，令x₂-x₁，x₃-x₁，x₃-x₂为负样本。

如图2a中所示，每个椭圆代表一个查询请求，椭圆内的点代表需要与查询请求计算相关度的文档，其中，三角形代表很相关，圆圈代表一般相关，叉号代表不想关。图2b为图2a中单个文档转换为文档对(d_i-d_j)的形式，其中，实心方块代表模型训练正样本(即d_i＞d_j)，空心方块代表模型训练负样本(即d_i＜d_j)，以此将排序问题转化为分类问题。

本申请的一些实施例使用Ranking SVM分类模型进行候选实体排序，公式为：

其中，m为特征向量维度，

为两个候选实体的特征向量，y_i为查询请求中实体指称与候选实体的相关性，ω为参数权重，ε_i为松弛变量并且ε_i≥0(i＝1，2，...，m)，系数C＞0。一个候选实体对应一个特征向量，其中包括至少一个特征值。

一个候选实体对应一个特征向量，其中包括至少一个特征值，特征值用于表征候选实体与待消除歧义实体指称之间的相似度。

可选的，本申请实施例中，用于表征候选实体与待消除歧义实体指称之间的相似度的特征值，可包括以下(1)至(11)中之一或任意组合：

(1)、候选实体在知识库中的描述文本的语义向量，与用户查询语句文本的语义向量之间的相似度。

可选地，候选实体在知识库中的描述文本的语义向量，以及用户查询语句文本的语义向量，可以采用句子向量模型(Doc2Vec算法)获得。句子向量模型也称paragraph2vec，sentence embeddings，是一种非监督式算法，可以获得句子、段落、文档的向量表达，是word2vec(句向量)算法的拓展。通过Doc2Vec算法学习得到候选实体在知识库中的描述文本的语义向量，以及用户查询语句文本的语义向量后，可通过计算向量间的距离来确定两者之间的相似度。

可选地，本申请的实施例中，候选实体在知识库中的描述文本的语义向量与待消除歧义实体指称所在用户查询语句文本的语义向量之间的相似度采用的是余弦相似度，余弦相似度计算公式如下：

其中，A_i为待消除歧义实体指称所在用户查询语句文本的语义向量B_i为待消除歧义实体指称对应的候选实体在知识库中的描述文本的语义向量，n为特征向量的维度。

余弦相似度的取值的范围在[-1，1]之间，值越接近于1，则A_i与B_i越相关(即候选实体在知识库中的描述文本与待消除歧义实体指称所在用户查询语句文本越相关)；余弦相似度的取值越趋近于-1，则A_i与B_i的方向越相反；余弦相似度的取值接近于0，表示A_i与B_i近乎于正交。

一些情况下，也可将余弦值归一化到[0，1]区间内，即按照上述公式[2]计算得到余弦相似度后，可按照以下公式进行归一化处理：cosineSIM＝0.5cosθ+0.5。

举例来说，用户查询语句文本为″我想听奶茶的歌″，基于知识库识别得到查询语句文本中的实体指称包括″奶茶″，其上下文名词实体包括″歌″。实体指称″奶茶″在知识库中的候选实体集合为{″刘若英″，″饮品奶茶″}，可见实体指称″奶茶″为歧义实体指称。表1示例性示出了本申请实施例中歧义实体指称″奶茶″在知识库中候选实体的描述信息。

表1、实体指称″奶茶″的候选实体在知识库中的描述信息

分别将用户查询语句文本″我想听奶茶的歌″、″刘若英″在知识库中的描述信息，以及候选实体″饮品奶茶″在知识库中的描述信息(描述文本)，输入训练好的doc2vec模型，得到用户查询语句文本的语义向量，以及该两个候选实体在知识库中的描述文本的语义向量，然后根据上述公式[1]计算得到以下余弦相似度：

相似度a₁＝cos(“我想听奶茶的歌”的语义向量，“刘若英”的描述文本的语义向量)

相似度b₁＝cos(“我想听奶茶的歌”的语义向量，“饮品奶茶”的描述文本的语义向量)

(2)、候选实体在知识库中的描述文本的语义向量，与待消除歧义实体指称在用户查询语句文本中的上下文名词实体的语义向量之间的相似度。

可选地，候选实体在知识库中的描述文本的语义向量，以及待消除歧义实体指称在用户查询语句文本中的上下文名词实体的语义向量，可以采用句子向量模型(Doc2Vec算法)获得。

可选地，本申请的实施例中，候选实体在知识库中的描述文本的语义向量与待消除歧义实体指称所在用户查询语句文本中的名词实体的语义向量之间的相似度采用的是余弦相似度。

举例来说，用户查询语句文本为″中关村的苹果不错″，基于知识库识别得到查询语句文本中的待消除歧义实体指称为″苹果″，其上下文名词实体为″中关村″。实体指称″苹果″在知识库中的候选实体集合为{″果实苹果″，″苹果产品公司″}，采用句子向量模型(Doc2Vec算法)获得用户查询语句文本中的上下文名词实体″中关村″的语义向量以及候选实体″果实苹果″、候选实体″苹果产品公司″在知识库中的描述文本的语义向量，然后得到以下余弦相似度：

相似度c₁＝cos(“中关村”的语义向量，“果实苹果”的描述文本的语义向量)

相似度d₁＝cos(“中关村”的语义向量，“苹果产品公司”的描述文本的语义向量)

(3)、候选实体的语义向量，与待消除歧义实体指称的语义向量之间的相似度；候选实体的语义向量，与待消除歧义实体指称在用户查询语句文本中的上下文名词实体的语义向量之间的相似度；候选实体在知识库中的背景文本的语义向量，与待消除歧义实体指称的语义向量之间的相似度；候选实体在知识库中的背景文本的语义向量，与待消除歧义实体指称在用户查询语句文本中的上下文名词实体的语义向量之间的相似度。

可选地，可采用词袋模型(Doc2Vec算法)获得候选实体的语义向量、待消除歧义实体指称的语义向量、待消除歧义实体指称在用户查询语句文本中的上下文名词实体的语义向量、候选实体在知识库中的背景文本的语义向量。

可选地，上述相似度采用的是余弦相似度。

举例来说，用户查询语句文本为″我想听奶茶的歌″，其中，实体指称为″奶茶″，上下文名词实体为″歌″，根据上述公式[1]计算得到以下余弦相似度：

相似度e₁＝cos(“实体指称“奶茶”的语义向量，候选实体“刘若英”的语义向量)

相似度e₂＝cos(“实体指称“奶茶”的语义向量，候选实体“饮品奶茶”的语义向量)

相似度f₁＝cos(“名词实体“歌”的语义向量，候选实体“刘若英”的语义向量)

相似度f₂＝cos(“名词实体“歌”的语义向量，候选实体“饮品奶茶″的语义向量)

相似度g₁＝cos(“实体指称“奶茶”的语义向量，候选实体“饮品奶茶”的背景文本向量)

相似度g₂＝cos(“实体指称“奶茶”的语义向量，候选实体“刘若英”的背景文本向量)

相似度h₁＝cos(“名词实体“歌”的语义向量，候选实体“刘若英”的背景文本向量)

相似度h₂＝cos(“名词实体“歌”的语义向量，候选实体“饮品奶茶”的背景文本向量)

可选地，在一些实施例中，上述候选实体的语义向量与待消除歧义实体指称的语义向量之间的相似度、候选实体的语义向量与待消除歧义实体指称在用户查询语句文本中的上下文名词实体的语义向量之间的相似度、候选实体在知识库中的背景文本的语义向量与待消除歧义实体指称的语义向量之间的相似度，以及候选实体在知识库中的背景文本的语义向量，与待消除歧义实体指称在用户查询语句文本中的上下文名词实体的语义向量之间的相似度，可以仅包含其一，也可以包含上述各种相似度的任意组合。

(4)、候选实体在知识库中的描述文本的主题，与待消除歧义实体指称在用户查询语句文本中的上下文的主题之间的相似度，该相似度用于表征候选实体与待消除歧义实体指称之间的主题相似度。

具体的，主题相似度可采用LDA(Latent Dirichlet Allocation，文档主题生成模型)确定。LDA将文档集中每篇文档的主题以概率分布的形式给出，通过分析文档确定文档主题后，根据主题进行主题聚类或文本分类。并且，LDA是一中典型的词袋模型，即每一篇文档是由一组词构成，词与词之间没有先后顺序的关系。

以上述实施例为例，候选实体″刘若英″的描述文本的主题是音乐，候选实体″饮品奶茶″的描述文本的主题是食品，候选实体″刘若英″的主题与待消除歧义实体指称在用户查询语句文本中的上下文的主题匹配度更高，即候选实体″刘若英″与用户查询语句文本中待消除歧义的实体指称″奶茶″更相关。

(5)、候选实体的先验流行度。

具体的，候选实体先验流行度与实体指称的关系为：流行程度越高的候选实体作为实体指称相关的实体的可能性越大。衡量候选实体先验流行度的方法包括候选实体在百度百科页面的描述文本长度、候选实体查询频度以及实体指称到实体候选实体的链接频度等。

举例来说，用户查询语句文本″黄磊的身高″，实体指称″黄磊″在百度百科中存在数十个候选实体，比如，″黄磊″既可以是一位影视演员，也可以是一位大学教授，二者相比，影视演员黄磊的知名度更高，涉及的用户查询请求也就更多，即任意用户查询请求中链接到候选实体″影视演员黄磊″的可能性就比链接到候选实体″大学教授黄磊″的可能性要大。

统计候选实体先验流行度大多依赖维基百科、百度百科这样的训练语料，得到的是训练语料上的候选实体先验流行度分布，而标注的语料的实体流行度分布却并不一定和训练语料一致。若仅根据候选实体先验流行度确定实体指称的链接结果，而不考虑用户查询请求的上下文信息，可能导致无论用户查询请求的上下文是什么，都会链接到流行程度最高的候选实体。

本申请实施例中，知识库中，一个实体的先验流行度可以预先确定，并可根据需要进行更新。

(6)、用于表征待消除歧义实体指称在用户查询语句文本中的上下文名词实体是否出现在候选实体在知识库中的描述文本中的特征值。该特征值可称为候选实体的名词实体重合特征值。

举例来说，根据上述实施例，用户查询语句文本″我想听奶茶的歌″，用户查询语句文本中的上下文名词实体″歌″与候选实体″刘若英″在知识库中的描述文本″刘若英(ReneLiu)，1970年6月1日出生于台湾省台北市，中国台湾女歌手、演员、导演、词曲创作者，毕业于美国加州州立大学音乐系″中具有一个重合名词实体″歌″，则候选实体″刘若英″的名词实体重合特征值为1，而与候选实体″饮品奶茶″在知识库中的描述文本″奶茶原为蒙古高原游牧民族的日常饮品，至今最少已有千年历史″中不具有重合名词实体，则候选实体″饮品奶茶″的与实体指称″歌″的名词实体重合特征值为0。

(7)、待消除歧义实体指称在用户查询语句文本中的上下文名词实体出现在候选实体在知识库中的描述文本中的情况下，待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体在所述候选实体在知识库中的描述文本中出现的次数。

可选的，若待消除歧义实体指称在用户查询语句文本中的上下文存在多个名词实体，则特征值为多个名词实体出现的次数和。

举例来说，根据上述实施例，用户查询语句文本″我想听奶茶的歌″，用户查询语句文本中的上下文名词实体″歌″，″歌″在候选实体″刘若英″在知识库中的描述文本″刘若英(Rene Liu)，1970年6月1日出生于台湾省台北市，中国台湾女歌手、演员、导演、词曲创作者，毕业于美国加州州立大学音乐系″中出现1次，而″歌″在候选实体″奶茶饮品″在知识库中的描述文本″奶茶原为蒙古高原游牧民族的日常饮品，至今最少已有千年历史″出现0次。

(8)、待消除歧义实体指称在用户查询语句文本中的上下文名词实体与候选实体义项名的相似度。

举例来说，用户查询语句文本″黄磊的身高″，表2示例性示出了歧义实体指称″黄磊″在知识库中候选实体的相关信息。

表2、实体指称″黄磊″的候选实体在知识库中的相关信息

根据表1可知，用户查询语句文本中的上下文名词实体为″身高″与知识库中候选实体″黄磊″的义项名″散打名将″相似度最高。

(9)、候选实体的词条标签，与待消除歧义实体指称在用户查询语句文本中的上下文名词实体的相似度。

举例来说，根据上述实施例，用户查询语句文本″我想听奶茶的歌″，候选实体″刘若英″在知识库中的词条标签为：演员、歌手、娱乐人物、人物，候选实体″奶茶饮品″在知识库中的词条标签为：饮品、食品、生活、特产，用户查询语句文本中的上下文名词实体″歌″与候选实体″刘若英″的词条标签相似度更高。

(10)、用于表征候选实体的词条标签是否出现在待消除歧义实体指称所在用户查询语句文本的上下文中的特征值。

举例来说，用户查询语句文本″演员黄磊的身高″，词条标签为″演员″的候选实体″黄磊″出现在用户查询语句文本，则该候选实体″黄磊″的特征值为1，其他候选实体″黄磊″的特征值为0。

(11)、待消除歧义实体指称，与候选实体在知识库中的描述文本中的关键词的相似度。

具体的，本申请实施例中采用基于TF-IDF(Term Frequency-Inverse DocumentFrequency，词频-逆文本频率指数)方法选取候选实体描述文本中的一个关键词，获取待消除歧义实体指称与该关键词的相似度，相似度可为余弦相似度。

TF-IDF是一种用于信息检索与数据挖掘的常用加权技术，用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。TF-IDF倾向于过滤掉常见的词语。TF-IDF中词频TF(Term Frequency)为某个词在文章中出现的次数IDF(Inverse Document Frequency)为逆文本频率指数。TF-IDF计算公式为：

TF-IDF＝TF*IDF..............................[5]

其中，一个词越常见，IDF越接近0，分母中的加1为避免所有文档都不包含该词的情况。在本申请实施例中，候选实体描述文本中的常见词即为选取的关键词。

本申请的实施例中，根据候选实体与待消除歧义实体指称之间的相似度的特征值确定候选实体的特征向量，基于机器学习实体排序模型，利用不同候选实体两两组合的特征向量之差，按照与待消除歧义实体指称的相关度对候选实体进行排序，并从排序后的候选实体中选择与待消除歧义实体指称相关的实体。

图3中示例性示出了根据实施例中信息交互方法流程示意图。如图3所示，该流程包括：

S301：服务器接收智能设备发送的查询指令，该查询指令包括用户查询语句文本或用户查询请求的音频数据，识别得到用户查询语句文本或用户查询请求的音频数据中待消除歧义的实体指称与上下文名词实体。

该步骤中，用户打开智能设备中的语音助手，通过语音助手发送语音请求。其中，语音助手可为智能手机、智能电视、智能音箱等智能设备的语音输入应用程序；智能设备可对语音请求进行去燥(包括去除回声和环境噪声)，得到干净的语音请求后向服务器发送查询指令，使得服务器对干净的语音请求进行后续处理。

S302：服务器根据用户查询语句文本中待消除歧义的实体指称查询知识库，得到待消除歧义实体指称对应的候选实体集合以及候选实体与待消除歧义实体指称之间的相似度的特征值。

该步骤中，特征值的种类以及计算方法，可参见前述实施例的相关描述。

S303：服务器根据特征值确定每个候选实体的特征向量，得到不同候选实体两两组合的特征向量之差。

该步骤中，特征向量中包括至少一个用于表征候选实体与待消除歧义实体指称之间的相似度的特征值。

举例来说，用户查询语句文本为″我想听奶茶的歌″，候选实体″刘若英″与待消除歧义实体指称″奶茶″之间的相似度的特征值包括上述实施例中的相似度e₁、f₁、g₁、h₁，该相似度组成候选实体″刘若英″的特征向量A，候选实体″饮品奶茶″与待消除歧义实体指称″奶茶″之间的相似度的特征值包括上述实施例中的相似度e₂、f₂、g₂、h₂，该相似度组成候选实体″刘若英″的特征向量B，其中特征向量A与特征向量B中的相似度等级不同，待消除歧义实体指称″奶茶″的候选实体的特征向量为A-B。

S304：服务器根据不同候选实体两两组合的特征向量之差，按照与待消除歧义实体指称的相关度对候选实体进行排序，并从排序后的候选实体中选择与待消除歧义实体指称相关的实体。

该步骤中，基于机器学习实体排序模型可采用Ranking SVM算法或者LambdaMART算法，也可以采用其它排序学习的算法，将实体排序任务转化为分类任务。对于不同的待消除歧义的实体指称，候选实体集合中的候选实体的个数不同，假定候选实体集合中只有一个候选实与待消除歧义的实体指称相关，其他的视为不相关，则候选实体集合按与实体指称相关与否分为两个等级，第一等级只有一个候选实体，即期望正确链接到知识库中对应的实体，第二等级包含其余的候选实体。对于期望正确连接到知识库中对应的实体的排名为1，其余候选实体排名并列第2。本申请的实施例中，可根据候选实体与待消除歧义实体指称之间的相似度的特征值确定第一等级与第二等级的候选实体。

模型训练阶段，确定候选实体集合中候选实体的相关度等级后，对同一个待消除歧义的实体指称的不同相关度等级的候选实体的特征向量进行组合，即第一等级中期望链接到候选实体的特征向量和第二等级中每个候选实体做差，形成新的特征向量：x_i-x_j并赋值新的标签。

第一等级中的期望链接到候选实体的特征向量减去第二等级中候选实体的特征向量被赋值为正样本标签，进一步的，第二等级中候选实体的特征向量减去第一等级中的期望链接到候选实体的特征向量被赋值为负样本标签。Ranking SVM模型将排序问题转化为分类问题，若第一等级中期望链接到候选实体是用户查询语句文本中待消除歧义的实体指称在知识库中的对应实体，则模型输出为1，否则为0。

举例来说，模型训练阶段，待消除歧义实体指称″奶茶″的候选实体″刘若英″为第一等级中的期望链接到的候选实体，候选实体″饮品奶茶″为第二等级中的候选实体，则候选实体″刘若英″的特征向量A减去候选实体″饮品奶茶″的特征B被赋值为正样本标签，候选实体″饮品奶茶″的特征向量B减去候选实体″刘若英″的特征A被赋值为负样本标签。

需注意的是，模型训练阶段组合形成新的特征向量，不能使用处于相同相似度等级的两个候选实体的特征向量，也不能使用不同待消除歧义实体指称的两个的候选实体的特征向量。

举例来说，用户查询请求文本″黄磊的身高″，待消除歧义指称″黄磊″的候选实体″哈尔滨工业大学教授黄磊″与候选实体″北京交通大学教授黄磊″的相似度等级相同，组合形成新的特征向量时不可选取候选实体″哈尔滨工业大学教授黄磊″与候选实体″北京交通大学教授黄磊″的特征向量做差。

再比如，用户查询请求文本″黄磊与奶茶的作品″，组合形成新的特征向量时不可选取待消除歧义指称″黄磊″的候选实体″哈尔滨工业大学教授黄磊″与待消除歧义指称″奶茶″的候选实体″刘若英″的特征向量做差。

S305：根据与用户查询语句文本中的实体指称相关的实体，响应用户语音请求，并向智能设备发送用户语音请求的处理结果。

该步骤中，用户查询语句文本中的实体指称相关的实体包括用户查询语句文本中的上下文名词实体以及链接到知识库中的对应实体。

以智能设备为智能电视为例，图4示例性示出了根据实施例中显示设备200响应于用户查询请求后的用户界面。如图所示，当用户输入的查询语句文本为″我想听奶茶的歌″后，服务器根据查询指令的响应用户查询请求的处理结果。其中，用户界面显示两个视图区域，第一视图区401显示当前用户查询语句文本和服务器响应用户查询请求的回复文本对应的业务领域为交通，第二视图区402显示响应用户查询请求的处理结果。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种信息交互方法，其特征在于，包括：

分别将所述不同候选实体两两组合的特征向量之差输入机器学习实体排序模型，根据所述机器学习实体排序模型的输出结果确定第一等级候选实体和第二等级候选实体，将所述第一等级候选实体确定为与所述待消除歧义实体指称相关的实体；其中，所述第一等级候选实体为所述候选实体集合中与所述待消除歧义实体指称相关度最高的候选实体，所述机器学习实体排序模型用于根据输入的两个不同候选实体的特征向量之差，输出用于指示所述两个不同候选实体与所述待消除歧义实体指称相关度排序的输出结果；

2.如权利要求1所述的方法，其特征在于，所述特征值包括以下之一或任意组合：

3.如权利要求2所述的方法，其特征在于，所述特征值还包括：

所述候选实体在知识库中的描述文本的主题，与所述待消除歧义实体指称在所述用户查询语句文本中的上下文的主题之间的相似度，该相似度用于表征所述候选实体与所述待消除歧义实体指称之间的主题相似度。

4.如权利要求2所述的方法，其特征在于，所述特征值还包括：所述候选实体的先验流行度。

5.如权利要求2所述的方法，其特征在于，所述特征值还包括：

候选实体的名词实体重合特征值，所述候选实体的名词实体重合特征值用于表征所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体是否出现在所述候选实体在知识库中的描述文本中；

所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体出现在所述候选实体在知识库中的描述文本中的情况下，所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体在所述候选实体在知识库中的描述文本中出现的次数。

6.如权利要求2所述的方法，其特征在于，所述特征值还包括：

所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体与所述候选实体义项名的相似度。

7.如权利要求2所述的方法，其特征在于，所述特征值还包括：

所述候选实体的词条标签，与所述待消除歧义实体指称在所述用户查询语句文本中的上下文名词实体的相似度；

用于表征所述候选实体的词条标签是否出现在所述待消除歧义实体指称所在用户查询语句文本的上下文中的特征值。

8.如权利要求2所述的方法，其特征在于，所述特征值还包括：

所述待消除歧义实体指称，与所述候选实体在知识库中的描述文本的关键词的相似度。

9.一种服务器，其特征在于，包括：

接收模块，用于接收来自于智能设备的查询请求；

排序模块，用于分别将所述不同候选实体两两组合的特征向量之差输入机器学习实体排序模型，根据所述机器学习实体排序模型的输出结果确定第一等级候选实体和第二等级候选实体，将所述第一等级候选实体确定为与所述待消除歧义实体指称相关的实体；其中，所述第一等级候选实体为所述候选实体集合中与所述待消除歧义实体指称相关度最高的候选实体，所述机器学习实体排序模型用于根据输入的两个不同候选实体的特征向量之差，输出用于指示所述两个不同候选实体与所述待消除歧义实体指称相关度排序的输出结果；

发送模块，用于向所述智能设备发送响应结果。

10.一种计算机存储介质，其特征在于，所述计算机存储介质中存储有计算机程序指令，当所述指令在计算机上运行时，使得所述计算机执行如权利要求1-7中任一项所述的方法。