CN110019750A

CN110019750A - 呈现两个以上标准文本问题的方法和装置

Info

Publication number: CN110019750A
Application number: CN201910009435.5A
Authority: CN
Inventors: 刘俊宏; 石志伟; 张望舒
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2019-01-04
Filing date: 2019-01-04
Publication date: 2019-07-16

Abstract

本发明涉及呈现两个以上标准文本问题的方法和装置，该方法包括：当接收到用户在任一场景下输入的问句片段时，根据所述问句片段，获取所述用户有可能想问的两个以上标准文本问题；获得所述两个以上标准文本问题各自的多个参数值，所述多个参数值包括表示被问到的频繁程度的热度值和涉及所述任一场景的参数值；根据所述两个以上标准文本问题各自的所述多个参数值，利用排序算法对所述两个以上标准文本问题进行排序；基于排序结果，向所述用户呈现所述两个以上标准文本问题。利用该方法和装置能够加快用户输入文本问题的速度。

Description

呈现两个以上标准文本问题的方法和装置

技术领域

本发明涉及计算机处理技术领域，尤其涉及呈现两个以上标准文本问题的方法和装置。

背景技术

智能客服机器人用于回答用户提出的文本问题。智能客服机器人预先存储有多个问答对，每一个问答对包括一个标准文本问题和相应的文本答案，其中，标准文本问题是从用户高频提出的文本问题中总结得到的问题。当接收到用户提出的文本问题时，智能客服机器人从所存储的问答对中找出其标准文本问题与用户提出的文本问题最相关的那个问答对，并将所找出的问答对中的文本答案呈现给用户。

为了便于用户在智能客服机器人中快速输入其想提出的文本问题，目前出现了基于热度的渐进提示方案，其基于表示被问到的频繁程度的热度值对用户有可能想问的标准文本问题进行排序，并按照排序的结果向用户呈现用户有可能想问的标准文本问题，以便用户选取其实际想问的标准文本问题，其中，热度值越高的标准文本问题被显示得越靠前。图1示出了现有的基于热度的渐进提示的一个例子。

按照基于热度的渐进提示推荐方案的设想，热度值越高的标准文本问题就是用户越想提出的文本问题，因此，将热度值越高的标准文本问题越靠前显示，用户就能越快找到并输入其想提出的文本问题。

然而，在实际中，用户往往发现智能客服机器人并没有将其想问的文本问题靠前显示，这影响了用户输入文本问题的速度。

发明内容

本发明的实施例提供呈现两个以上标准文本问题的方法和装置，其能够加快用户输入文本问题的速度。

按照本发明的实施例的一种呈现两个以上标准文本问题的方法，包括：当接收到用户在任一场景下输入的问句片段时，根据所述问句片段，获取所述用户有可能想问的两个以上标准文本问题；获得所述两个以上标准文本问题各自的多个参数值，所述多个参数值包括表示被问到的频繁程度的热度值和涉及所述任一场景的参数值；根据所述两个以上标准文本问题各自的所述多个参数值，利用排序算法对所述两个以上标准文本问题进行排序；以及，基于排序结果，向所述用户呈现所述两个以上标准文本问题。

按照本发明的实施例的一种呈现两个以上标准文本问题的装置，包括：获取模块，用于当接收到用户在任一场景下输入的问句片段时，根据所述问句片段，获取所述用户有可能想问的两个以上标准文本问题；获得模块，用于获得所述两个以上标准文本问题各自的多个参数值，所述多个参数值包括表示被问到的频繁程度的热度值和涉及所述任一场景的参数值；排序模块，用于根据所述两个以上标准文本问题各自的所述多个参数值，利用排序算法对所述两个以上标准文本问题进行排序；以及，呈现模块，用于基于排序结果，向所述用户呈现所述两个以上标准文本问题。

按照本发明的实施例的一种计算设备，包括：至少一个处理器；以及，存储器，其上存储有计算机可执行指令，其中，所述计算机可执行指令当被执行时使得所述至少一个处理器执行前述的方法。

按照本发明的实施例的一种计算机可读存储介质，其上存储有计算机可执行指令，其中，所述计算机可执行指令当被执行时使得计算机执行前述的方法。

从以上的描述可以看出，本发明的实施例的方案在渐进提示推荐时根据热度值和涉及用户提问时所处的场景的参数值来排序和呈现用户有可能想问的标准文本问题，这将使得用户实际想问的标准文本问题被更靠前显示，从而，用户花费较少的操作和时间就能发现其实际想问的标准文本问题，因此，与现有技术相比，本发明的实施例的方案能够加快用户输入文本问题的速度。

附图说明

本发明的特征和优点通过以下结合附图的描述将变得更加显而易见。

图1示出了现有的基于热度的渐进提示的一个例子。

图2示出了按照本发明的一个实施例的呈现两个以上标准文本问题的方法的总体流程图。

图3示出了按照本发明的一个实施例的呈现两个以上标准文本问题的方法的流程图。

图4示出了按照本发明的一个实施例的呈现两个以上标准文本问题的装置的示意图。

图5示出了按照本发明的一个实施例的计算设备的硬件结构图。

具体实施方式

现在将参考示例实施方式讨论本文描述的主题。应该理解，讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题，并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下，对所讨论的元素的功能和排列进行改变。各个示例可以根据需要，省略、替代或者添加各种过程或组件。例如，所描述的方法可以按照与所描述的顺序不同的顺序来执行，以及各个步骤可以被添加、省略或者组合。另外，相对一些示例所描述的特征在其它例子中也可以进行组合。

如本文中使用的，术语“包括”及其变型表示开放的术语，含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义，无论是明确的还是隐含的。除非上下文中明确地指明，否则一个术语的定义在整个说明书中是一致的。

发明人经过大量的研究发现，用户想在智能客服机器人中输入的文本问题不但于与热度有关，也与用户提问时所处的场景有关。基于这个发现，本发明的实施例的方案在渐进提示时基于热度值和涉及场景的参数值来排序和呈现用户有可能想问的标准文本问题。

图2示出了按照本发明的一个实施例的呈现两个以上标准文本问题的方法的总体流程图。在图2的方法200可以执行之前，预先统计所存储的所有应答对所包括的各个标准文本问题各自的热度值、多个第一参数值P1和多个第二参数值P2，其中，每一个参数值P1表示在多个场景的其中一个场景下被问到的概率，以及，每一个第二参数值P2表示在该多个场景的其中一个场景下被呈现给用户且被用户点击的概率。该多个第一参数值P1和该多个第二参数值P2属于涉及场景的参数值。此外，还预先收集和存储多个问句问题对，其中，每一个问句问题对包括用户曾经在智能客服机器人中输入的一个问句片段和被用户选取为与该问句片段相应的标准文本问题。

如图2所示，在方框202，智能客服机器人接收用户在某一场景S下输入的问句片段F。

在方框206，智能客服机器人从所存储的各个应答对所包括的所有标准文本问题中，检索出与所接收的问句片段F相关的两个以上标准文本问题M，作为用户有可能想问的标准文本问题。

在方框210，智能客服机器人从所存储的各个标准文本问题的热度值、该多个第一参数值P1和该多个第二参数值P2中，提取出该两个以上标准文本问题M各自的热度值、表示在该场景S下被问到的概率的第一参数值P1和表示在该场景S下被呈现给用户且被用户点击的概率的第二参数值P2，以及，计算该两个以上标准文本问题M中的每一个标准文本问题Mi与问句片段F的文本长度差L、分词后的杰卡德(Jaccard)距离D1、n-元(n-Gram)杰卡德距离D2、词移距离(WMD)D3、余弦相似度SS和映射概率G。这里，文本长度差L、分词后的杰卡德距离D1、n-元杰卡德距离D2、词移距离D3、余弦相似度SS和映射概率G都属于涉及与问句片段的关系的参数值。

其中，标准文本问题Mi与问句片段F的文本长度差L表示问句片段F的字词数量与标准文本问题Mi的字词数量的差值的绝对值。标准文本问题Mi与问句片段F的分词后的杰卡德距离D1表示被分词后的问句片段F与被分词后的标准文本问题Mi的杰卡德距离。这里，文本长度差L、分词后的杰卡德距离D1、n-元杰卡德距离D2、词移距离D3和余弦相似度SS的计算对本领域技术人员来说是公知的，在此省略对其的详细描述。

标准文本问题Mi与问句片段F的映射概率G表示问句片段F被映射到标准文本问题Mi的概率。下面以问句片段F是“花呗怎么还钱”为例，详细描述如何计算问句片段F与标准文本问题Mi的映射概率G。第一步，对问句片段F进行分词处理，得到三个词语“花呗”、“怎么”和“还钱”。第二步，对分词得到的词语进行同义词归一化，例如“还钱”、“还债”等均会归一化为“还款”。第三步，对同义词归一化的词语进行业务词过滤，以过滤掉跟业务无关的词语并仅得到跟业务有关的词语，例如，过滤掉跟业务无关的词语“怎么”，仅得到跟业务有关的词语“花呗”&“还款”。第四步，从所存储的问句问题对中，检索出其问句片段包含有所得到的跟业务有关的词语的那些问句问题对。第五步，确定标准文本问题Mi的数量，其等于所检索的问句问题对中的其标准文本问题与标准文本问题Mi相同的那些问句问题对的数量。第六步，计算所确定的标准文本问题Mi的数量与所检索的问句问题对的数量的商，作为问句片段F与标准文本问题Mi的映射概率G。

在方框214，智能客服机器人利用该两个以上标准文本问题M各自的热度值、表示在该场景S下被问到的概率的第一参数值P1和表示在该场景S下被呈现给用户且被用户点击的概率的第二参数值P2，以及，该两个以上标准文本问题M各自与问句片段F的文本长度差L、分词后的杰卡德距离D1、n-元杰卡德距离D2、词移距离D3、余弦相似度SS和映射概率G作为输入参数，使用LambdaMart排序算法对该两个以上标准文本问题M进行排序。LambdaMart排序算法结合了LambdaRank排序算法和Mart算法，其由于结合了Mart算法可以利用多种特征/参数来进行排序，从而可以得到更准确的排序结果。

在方框218，智能客服机器人按照排序结果向用户呈现该两个以上标准文本问题M，以便用户选择其实际想问的标准文本问题。

从以上的描述可以看出，本实施例的方案在渐进提示推荐时根据热度值和涉及用户提问时所处的场景的参数值来排序和呈现用户有可能想问的标准文本问题，这将使得用户实际想问的标准文本问题被更靠前显示，从而，用户花费较少的操作和时间就能发现其实际想问的标准文本问题，因此，本实施例的方案能够加快用户输入文本问题的速度。

其它变型

本领域技术人员将理解，虽然在上面的实施例中，在对标准文本问题排序时使用到的涉及与问句片段的关系的参数值包括文本长度差L、分词后的杰卡德距离D1、n-元杰卡德距离D2、词移距离D3、余弦相似度SS和映射概率G，然而，本发明并不局限于此。在本发明的其它一些实施例中，在对标准文本问题排序时使用到的涉及与问句片段的关系的参数值可以仅包括文本长度差L、分词后的杰卡德距离D1、n-元杰卡德距离D2、词移距离D3、余弦相似度SS和映射概率G中的一部分。或者，在对标准文本问题排序时使用到的涉及与问句片段的关系的参数值可以包括一个或多个其它类型的涉及与问句片段的关系的参数值，以及，文本长度差L、分词后的杰卡德距离D1、n-元杰卡德距离D2、词移距离D3、余弦相似度SS和映射概率G中的一部分。或者，在对标准文本问题排序时使用到的涉及与问句片段的关系的参数值可以包括除了文本长度差L、分词后的杰卡德距离D1、n-元杰卡德距离D2、词移距离D3、余弦相似度SS和映射概率G之外的一个或多个其它类型的涉及与问句片段的关系的参数值。

本领域技术人员将理解，虽然在上面的实施例中，在对标准文本问题排序时使用涉及与问句片段的关系的参数值，但是，本发明并不局限于此。在本发明的其它一些实施例中，在对标准文本问题排序时也可以不使用涉及与问句片段的关系的参数值。

本领域技术人员将理解，虽然在上面的实施例中，在对标准文本问题排序时使用到的涉及场景的参数值包括第一参数值P1和第二参数值P2，但是，本发明并不局限于此。在本发明的其它一些实施例中，在对标准文本问题排序时使用到的涉及场景的参数值可以仅包括第一参数值P1和第二参数值P2的其中一个。或者，在对标准文本问题排序时使用到的涉及场景的参数值可以包括一个或多个其它类型的涉及场景的参数值，以及，第一参数值P1和第二参数值P2中的至少一个。或者，在对标准文本问题排序时使用到的涉及场景的参数值可以包括除了第一参数值P1和第二参数值P2之外的一个或多个其它类型的涉及场景的参数值。

本领域技术人员将理解，虽然在上面的实施例中，使用LambdaMart排序算法对文本问题进行排序，但是，本发明并不局限于此。在本发明的其它一些实施例中，也可以利用除了LambdaMart排序算法之外的其它类型的排序算法对文本问题进行排序，该其它类型的排序算法例如但不局限于可以是LambdaRank排序算法或RankNet排序算法等。

图3示出了按照本发明的一个实施例的呈现两个以上标准文本问题的方法的流程图。图3所示的方法可以在任何具有计算能力的计算设备上实现，该计算设备可以是例如但不局限于台式计算机、笔记本电脑、平板电脑或智能手机等。

如图3所示，方法300可以包括，在方框302，当接收到用户在任一场景下输入的问句片段时，根据所述问句片段，获取所述用户有可能想问的两个以上标准文本问题。

方法300还可以包括，在方框304，获得所述两个以上标准文本问题各自的多个参数值，所述多个参数值包括表示被问到的频繁程度的热度值和涉及所述任一场景的参数值。

方法300还可以包括，在方框306，根据所述两个以上标准文本问题各自的所述多个参数值，利用排序算法对所述两个以上标准文本问题进行排序。

方法300还可以包括，在方框308，基于排序结果，向所述用户呈现所述两个以上标准文本问题。

在一个方面，所述涉及所述任一场景的参数值包括以下的至少一个：表示在所述任一场景下被问到的概率的参数值，以及，表示在所述任一场景下被呈现给用户且被用户点击的概率的参数值。

在另一个方面，所述多个参数值还包括涉及与所述问句片段的关系的参数值。

在又一个方面，涉及与所述问句片段的关系的参数值包括以下的至少一个：所述标准文本问题与所述问句片段的文本长度差，所述标准文本问题与所述问句片段在分词后的杰卡德距离，所述标准文本问题与所述问句片段的n-元杰卡德距离，所述标准文本问题与所述问句片段的词移距离，所述标准文本问题与所述问句片段的余弦相似度，以及，所述问句片段被映射到所述标准文本问题的概率。

图4示出了按照本发明的一个实施例的呈现两个以上标准文本问题的装置的示意图。图4所示的装置400可以利用软件、硬件或软硬件结合的方式来实现。

如图4所示，装置400可以包括获取模块402、获得模块404、排序模块406和呈现模块408。获取模块402用于当接收到用户在任一场景下输入的问句片段时，根据所述问句片段，获取所述用户有可能想问的两个以上标准文本问题。获得模块404用于获得所述两个以上标准文本问题各自的多个参数值，所述多个参数值包括表示被问到的频繁程度的热度值和涉及所述任一场景的参数值。排序模块406用于根据所述两个以上标准文本问题各自的所述多个参数值，利用排序算法对所述两个以上标准文本问题进行排序。呈现模块408用于基于排序结果，向所述用户呈现所述两个以上标准文本问题。

如上参照图1到图4，对根据本发明的实施例的呈现两个以上标准文本问题的方法和呈现两个以上标准文本问题的装置进行了描述。

图5示出了按照本发明的一个实施例的计算设备的硬件结构图。如图5所示，计算设备500可以包括至少一个处理器502、存储器504、内存506和通信接口508，并且至少一个处理器502、存储器504、内存506和通信接口508经由总线510连接在一起。至少一个处理器502执行在存储器504中存储或编码的至少一个计算机可执行指令(即，上述以软件形式实现的元素)。

在一个实施例中，在存储器504中存储计算机可执行指令，其当被执行时使得至少一个处理器502执行以下操作：当接收到用户在任一场景下输入的问句片段时，根据所述问句片段，获取所述用户有可能想问的两个以上标准文本问题；获得所述两个以上标准文本问题各自的多个参数值，所述多个参数值包括表示被问到的频繁程度的热度值和涉及所述任一场景的参数值；根据所述两个以上标准文本问题各自的所述多个参数值，利用排序算法对所述两个以上标准文本问题进行排序；以及，基于排序结果，向所述用户呈现所述两个以上标准文本问题。

本发明的实施例还提供一种计算机可读存储介质，其上存储有计算机可执行指令，其中，所述计算机可执行指令当被执行时使得计算机执行前述的方法。

上面结合附图阐述的具体实施方式描述了示例性实施例，但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”，并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的，具体实施方式包括具体细节。然而，可以在没有这些具体细节的情况下实施这些技术。在一些实例中，为了避免对所描述的实施例的概念造成难以理解，公知的结构和装置以框图形式示出。

本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说，对本公开内容进行的各种修改是显而易见的，并且，也可以在不脱离本公开内容的保护范围的情况下，将本文所定义的一般性原理应用于其它变型。因此，本公开内容并不限于本文所描述的示例和设计，而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims

1.一种呈现两个以上标准文本问题呈现的方法，包括：

当接收到用户在任一场景下输入的问句片段时，根据所述问句片段，获取所述用户有可能想问的两个以上标准文本问题；

获得所述两个以上标准文本问题各自的多个参数值，所述多个参数值包括表示被问到的频繁程度的热度值和涉及所述任一场景的参数值；

根据所述两个以上标准文本问题各自的所述多个参数值，利用排序算法对所述两个以上标准文本问题进行排序；以及

基于排序结果，向所述用户呈现所述两个以上标准文本问题。

2.如权利要求1所述的方法，其中，

所述涉及所述任一场景的参数值包括以下的至少一个：表示在所述任一场景下被问到的概率的参数值，以及，表示在所述任一场景下被呈现给用户且被用户点击的概率的参数值。

3.如权利要求1所述的方法，其中，

所述多个参数值还包括涉及与所述问句片段的关系的参数值。

4.如权利要求3所述的方法，其中

涉及与所述问句片段的关系的参数值包括以下的至少一个：所述标准文本问题与所述问句片段的文本长度差，所述标准文本问题与所述问句片段在分词后的杰卡德距离，所述标准文本问题与所述问句片段的n-元杰卡德距离，所述标准文本问题与所述问句片段的词移距离，所述标准文本问题与所述问句片段的余弦相似度，以及，所述问句片段被映射到所述标准文本问题的概率。

5.一种用于呈现两个以上标准文本问题的装置，包括：

获取模块，用于当接收到用户在任一场景下输入的问句片段时，根据所述问句片段，获取所述用户有可能想问的两个以上标准文本问题；

获得模块，用于获得所述两个以上标准文本问题各自的多个参数值，所述多个参数值包括表示被问到的频繁程度的热度值和涉及所述任一场景的参数值；

排序模块，用于根据所述两个以上标准文本问题各自的所述多个参数值，利用排序算法对所述两个以上标准文本问题进行排序；以及

呈现模块，用于基于排序结果，向所述用户呈现所述两个以上标准文本问题。

6.如权利要求5所述的装置，其中，

7.如权利要求5所述的装置，其中，

8.如权利要求7所述的装置，其中

9.一种计算设备，包括：

至少一个处理器；以及

存储器，其上存储有可执行指令，所述可执行指令当被执行时使得所述至少一个处理器执行权利要求1-4中的任意一个所述的方法。

10.一种计算机可读存储介质，其上存储有计算机可执行指令，所述计算机可执行指令当被执行时使得计算机执行权利要求1-4中的任意一个所述的方法。