CN110532565A

CN110532565A - 语句处理方法及装置、以及电子设备

Info

Publication number: CN110532565A
Application number: CN201910822368.9A
Authority: CN
Inventors: 史欣然; 胡长健
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2019-08-30
Filing date: 2019-08-30
Publication date: 2019-12-03
Anticipated expiration: 2039-08-30
Also published as: CN110532565B

Abstract

本公开提供了一种语句处理方法，该方法包括：获取当前输入语句；识别当前输入语句，得到当前输入语句的话题信息；确定话题信息是否属于候选话题集；以及在话题信息属于候选话题集的情况下，输出针对话题信息的答复语句。其中，候选话题集包括根据当前输入语句的前一输入语句的话题信息确定的至少一个候选话题信息。本公开还提供了一种语句处理装置及一种电子设备。

Description

语句处理方法及装置、以及电子设备

技术领域

本公开涉及一种语句处理方法及装置、以及电子设备。

背景技术

随着电子技术的快速发展，为了提高用户体验，用于快速答复用户问题的智能客服系统应运而生。

在相关技术中，智能客服系统具有处理和管理多轮对话和讨论多个话题的功能。其中，多轮对话是指在用户依次提出多个问题之后，智能客服系统能够依次给出该多个问题的答案或依次给出解决该多个问题的相关流程，直至用户不再提出新的问题。在该多轮对话中，用户可能会提出与多个话题相关的问题，为了确定在用户提出与当前话题不相同的另一话题时是否切换话题，智能客服系统往往会输出一个话题无关话术。但在另一话题为与当前话题关联的话题时，若智能客服系统输出该话题无关话术时会给用户智能客服系统智能性较差的感受，并因此会降低用户体验。

发明内容

本发明的一个方面提供了一种语句处理方法，包括：获取当前输入语句；识别当前输入语句，得到当前输入语句的话题信息；确定话题信息是否属于候选话题集；以及在话题信息属于候选话题集的情况下，输出针对话题信息的答复语句。其中，候选话题集包括根据当前输入语句的前一输入语句的话题信息确定的至少一个候选话题信息。

可选地，上述语句处理方法还包括：根据话题信息，获取与话题信息关联的至少一个相关话题信息；以及根据至少一个相关话题信息更新候选话题集。

可选地，上述获取与话题信息关联的至少一个相关话题信息包括：从数据库中获取与话题信息的相似度大于预定相似度的预存话题信息，得到至少一个相关话题信息；并且/或者，根据话题信息，确定逻辑关系库中与话题信息具有逻辑关系的话题信息，得到至少一个相关话题信息。其中，逻辑关系库中存储有多个话题信息对，每个话题信息对包括具有逻辑关系的两个话题信息。

可选地，获取与话题信息的相似度大于预定相似度的预存话题信息包括：确定数据库存储的多个预存话题信息中每个预存话题信息与话题信息的相似度，得到针对每个预存话题信息的第一相似度；确定针对每个预存话题信息的答复语句与针对话题信息的答复语句的相似度，得到针对每个预存话题信息的第二相似度；根据针对每个预存话题信息的第一相似度和针对每个预存话题信息的第二相似度，得到每个预存话题信息与话题信息的相似度；以及确定多个预存话题信息中与话题信息的相似度大于预定相似度的预存话题信息。

可选地，上述得到当前输入语句的话题信息包括：确定当前输入语句是否为与预定业务相关的输入语句；以及在确定当前输入语句为与预定业务相关的输入语句的情况下，将当前输入语句输入分类模型，分类得到当前输入语句的话题信息。

可选地，上述语句处理方法还包括：在话题信息不属于候选话题集的情况下，输出预定语句。

可选地，上述输出预定语句包括：输出第一预定询问语句；获取第一预定询问语句的反馈语句，该反馈语句用于表征是否答复完成前一输入语句；以及在反馈语句表征未答复完成前一输入语句的情况下，输出第二预定询问语句。其中，第一预定询问语句包括前一输入语句，第二预定询问语句包括当前输入语句。

可选地，上述输出预定语句还包括：在反馈语句表征答复完成前一输入语句的情况下，输出针对话题信息的答复语句。

本公开的另一方面提供了一种语句处理装置，该装置包括输入语句获取模块、语句识别模块、确定模块和答复语句输出模块。其中，输入语句获取模块用于获取当前输入语句；语句识别模块用于识别当前输入语句，得到当前输入语句的话题信息；确定模块用于确定话题信息是否属于候选话题集；答复语句输出模块用于在话题信息属于候选话题集的情况下，输出针对话题信息的答复语句。其中，候选话题集包括根据当前输入语句的前一输入语句的话题信息确定的至少一个候选话题信息。

本公开的另一方面提供了一种电子设备，包括一个或多个处理器；以及存储装置，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行上述的语句处理方法。

本公开的另一方面提供了一种计算机可读存储介质，存储有计算机可执行指令，该指令被处理器执行时使处理器执行上述的语句处理方法。

本公开的另一个方面提供了一种计算机程序，该计算机程序包括计算机可执行指令，所述指令在被执行时用于实现如上所述的语句处理方法。

附图说明

为了更完整地理解本公开及其优势，现在将参考结合附图的以下描述，其中：

图1示意性示出了根据本公开实施例的语句处理方法及装置、以及电子设备的应用场景；

图2示意性示出了根据本公开示例性实施例一的语句处理方法的流程图；

图3示意性示出了根据本公开示例性实施例二的语句处理方法的流程图；

图4示意性示出了根据本公开实施例的得到当前输入语句的话题信息的流程图；

图5示意性示出了根据本公开实施例的输出预定语句的流程图；

图6示意性示出了根据本公开示例性实施例三的语句处理方法的流程图；

图7示意性示出了根据本公开实施例的获取与话题信息的相似度大于预定相似度的预存话题信息的流程图；

图8示意性示出了根据本公开实施例的语句处理装置的结构框图；以及

图9示意性示出了根据本公开实施例的适于执行语句处理方法的电子设备的结构框图。

具体实施方式

以下，将参照附图来描述本公开的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本公开的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本公开实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

附图中示出了一些方框图和/或流程图。应理解，方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外，本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式，该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。

本公开的实施例提供了一种语句处理方法，该方法包括：先获取当前输入语句；然后识别当前输入语句，得到当前输入语句的话题信息；然后确定所述话题信息是否属于候选话题集；最后在话题信息属于候选话题集的情况下，输出针对话题信息的答复语句。其中，候选话题集包括根据当前输入语句的前一输入语句的话题信息确定的至少一个候选话题信息。

本公开实施例的语句处理方法，通过维护根据前一输入语句确定的候选话题集，可以在当前输入语句为与前一输入语句相关的询问语句时，直接向用户反馈当前输入语句的答复语句，而并非反馈话题无关话术。因此，可以在一定程度上提高答复用户的效率，并因此提高用户体验。

图1示意性示出了根据本公开实施例的语句处理方法及装置、以及电子设备的应用场景100。需要注意的是，图1所示仅为可以应用本公开实施例的场景的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。

如图1所示，本公开实施例的应用场景100例如可以包括终端设备101、102、103，网络104和第一数据库105。网络用于在终端设备101、102、103与第一数据库105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线和/或无线通信链路等等。

其中，终端设备101、102、103可以是具有语音采集功能及处理功能的各种电子设备，包括但不限于台式计算机、膝上型便携计算机、平板电脑、智能手机、智能家居设备或智能影音设备等等。

根据本公开的实施例，终端设备101、102、103可以安装有各种客户端应用，例如可以安装有智能客服系统，以实现与用户的语音交互，向用户提供智能客服服务。该终端设备101、102、103例如还可以具有语音采集功能，以用于采集用户的语音输入，并根据采集的语音输入，确定输入语句。还可以用于处理得到该输入语句的话题信息。并在确定该话题信息属于候选话题集的情况下，通过网络104从第一数据库105中获取针对该话题信息的答复语句，以便于反馈给用户。

其中，第一数据库105中维护有话题信息与答复语句的映射关系，终端设备101、102、103通过该映射关系获取针对话题信息的答复语句。

根据本公开的实施例，如图1所示，本公开实施例的应用场景100还可以包括第二数据库106，该第二数据库106中预存有大量的预存话题信息。前述的候选话题集例如可以由终端设备101、102、103将从第二数据库106中获取的至少一个预存话题信息作为候选话题信息组成。至少一个候选话题信息是与获取当前输入语句之前获取的前一输入语句相关的候选话题信息。

根据本公开的实施例，该第一数据库105中存储的答复语句与第二数据库106中存储的预存话题信息例如可以存储于同一数据库的不同存储空间中。

可以理解的是，本公开实施例的语句处理方法可以由终端设备101、102、103执行。相应地，本公开实施例所提供的语句处理装置可以设置于终端设备101、102、103中。

应该理解，图1中的终端设备101、102、103，网络104、第一数据库105和第二数据库106的类型仅仅是示意性的。根据实现需要，可以具有任意类型的终端设备101、102、103，网络104、第一数据库105和第二数据库106。

图2示意性示出了根据本公开示例性实施例一的语句处理方法的流程图。

如图2所示，本公开实施例的语句处理方法包括操作S210～操作S240。该操作S210～操作S240例如可以为终端设备101、102、103中安装的智能语音系统来执行。

在操作S210，获取当前输入语句。

根据本公开的实施例，输入语句例如可以是通过识别终端设备101、102、103采集的语音输入得到的，或者可以是通过识别外接的语音采集设备采集的语音输入得到的。其中，识别语音输入得到输入语句时可以采用终端设备101、102、103中安装的用于将语音转换为文字的各种插件或应用程序等实现，本公开对此不作限定。

根据本公开的实施例，该当前输入语句例如可以根据用户咨询终端设备101、102、103中的智能语音系统提供的业务时的语音输入得到或根据其他任意语音输入得到，例如，该当前输入语句可以为询问语句或其他任意类型的语句。例如，该当前输入语句可以为“Icannot reboot my phone”(我的手机无法重启)。

在操作S220，识别当前输入语句，得到当前输入语句的话题信息。

根据本公开的实施例，该操作S220例如可以是采用自然语言处理技术中的文本分类技术和信息抽取技术，来得到当前输入语句的话题信息。其中，该话题信息例如可以为当前语音输入的关键字，或者可以是根据对当前输入语句的理解确定的能够表征该输入语句的语义的信息。例如，若当前输入语句为“I cannot reboot my phone”，得到的话题信息例如可以包括“cannot power on(无法上电)。可以理解的是，上述得到话题信息的方法仅作为实例以利于理解本公开，本公开对此不作限定。该操作S220例如还可以通过图4描述的操作S421～操作S422来执行，在此不再详述。

在操作S230，确定话题信息是否属于候选话题集。

其中，候选话题集可以包括根据当前输入语句的前一输入语句的话题信息确定的至少一个候选话题信息。该前一输入语句即为与当前输入语句在时间上相隔最小的输入语句。候选话题信息与操作S220得到的话题信息类似。

根据本公开的实施例，该至少一个候选话题信息例如可以包括：第二数据库106中预存的多个预存话题信息中，与前一输入语句的话题信息的相似度大于预定相似度的话题信息。并且/或者，该至少一个候选话题信息还可以是预先设定的与前一输入语句的话题信息具有逻辑关系的话题信息。例如，逻辑关系可以是候选话题信息为前一输入语句的分支语句的话题信息，候选话题信息为前一输入语句的延伸语句的话题信息等。该至少一个候选话题信息的获取方法可以参考图6中操作S660获取相关话题信息的方法，在此不再详述。

根据本公开的实施例，在前一输入语句为“My phone shuts down randomly”(我的手机随机关机)时，通过类似于操作S220描述的方法可以得到前一输入语句的话题信息为“random shutdown”(随机关机)。相应地，所述的候选话题集例如可以包括以下候选话题信息“cannot power on”(无法上电)、“battery discharge”(电池不充电)和“systembecomes slow”(系统变慢)，。

根据本公开的实施例，在当前输入语句的话题信息属于候选话题集时，可以说明该当前输入语句与前一输入语句具有关联关系，从而可以确定与当前输入语句对应的语音输入是用户根据在前一输入语句的基础上确定的个人需求而表述的，而并非刻意的转移话题。此种情况下，为了提高答复用户的效率，可以直接输出答复语句。因此执行操作S240，在话题信息属于候选话题集的情况下，输出针对话题信息的答复语句。

根据本公开的实施例，该针对话题信息的答复语句可以是预先定义好并存储于第一数据库105中的。因此，该操作S240可以包括：根据话题信息自第一数据库105中加载与话题信息具有映射关系的答复语句。然后再输出答复语句。为了进一步提高响应效率，根据话题信息自第一数据库105中加载与话题信息具有映射关系的答复语句还可以在通过操作S220得到话题信息后就执行，以将答复语句预先缓存于终端设备101、102、103本地。

根据本公开的实施例，在话题信息为“random shutdown”时，输出的答复语句例如可以包括“Reboot the phone”(重启手机)、“Install available updates”(安装可用更新)和/或“Reset the phone”(重置手机)等。

综上可知，本公开实施例的语句处理方法，在当前输入语句的话题信息为与前一输入语句的话题信息具有关联关系的候选话题信息时，可以直接输出针对当前输入语句的话题信息的答复语句。而无需通过返回一个话题无关话术“请问…问题尚未解决，请问您是否想要跳转到…问题？”来确定用户是否需要转移话题。因此可以提高语音输入的答复效率，提高用户体验。

根据本公开的实施例，在话题信息不属于候选话题集时，为了准确确定用户是否需要转移话题，则可以输出预定语句。该预定语句例如可以为话题无关话术或其他预定语句等。

如图3所示，本公开实施例的语句处理方法可以包括操作S210～操作S240外，还可以包括在话题信息不属于候选话题集的情况下执行的操作S350。其中，操作S230可以执行为操作S330，判断话题信息是否属于候选话题集。操作S240可以执行为操作S340，输出针对话题信息的答复语句。该操作S340在操作S330得到的判断结果为话题信息属于候选话题集时执行。操作S350在操作S330得到的判断结果为话题信息不属于候选话题集时执行。

在操作S350，输出预定语句。

根据本公开的实施例，考虑到在当前输入语句的话题信息不属于候选话题集的情况下，可以说明该当前输入语句与前一输入语句不相关，为话题不同的两个语句。则为了便于用户确定是否转换话题，该预定语句例如可以为话题无关话术，以用于使用户响应于该话题无关话术，确定是否将话题由前一输入语句表述的话题转换为当前属于语句表述的话题。

根据本公开的实施例，该操作S350例如可以通过图5描述的流程来执行，在此不再详述。

根据本公开的实施例，为了避免输入语句为无意义的输入语句，在识别当前输入语句之前，还可以对当前输入语句进行判断，确定当前输入语句是否涉及到智能语音系统提供的预定业务。对于不涉及预定业务的输入语句，例如简单的问候语句“你好”，“再见”等，由于没有对应的话题信息，则无需进行复杂的判断处理过程，只需直接输出对应的答复语句即可。

图4示意性示出了根据本公开实施例的得到当前输入语句的话题信息的流程图。

根据本公开的实施例，如图4所示，得到当前输入语句的话题信息的操作S220例如可以包括操作S421～操作S422，以在得到话题信息之前对当前输入语句进行筛选，从而仅对与预定业务相关的输入语句进行识别。

在操作S421，确定当前输入语句是否为与预定业务相关的输入语句。

根据本公开的实施例，对于不同的应用场景，可以设置不同的预定业务。例如，在涉及到手机售后的智能客服系统的应用场景中，设置的预定业务例如可以包括：“无法充电”、“查询订单”、“维修请求”等，以便于确定当前输入语句是否为涉及到手机售后业务的输入语句。

根据本公开的实施例，该操作S421例如可以包括：先提取当前输入语句的关键词，然后确定该关键词中是否包括与预定业务对应的关键词，若包括，则确定当前输入语句为与预定业务相关的输入语句。其中，智能客服系统例如可以维护有预定业务与关键词的映射表，从而根据关键词来确定涉及的预定业务。

在确定当前输入语句为与预定业务相关的输入语句时，可通过执行操作S422来得到当前输入语句的话题信息。在确定当前输入语句为与预定业务不相关的输入语句时，则直接输出与当前输入语句对应的答复语句。例如，若当前输入语句为“你好”时，输出的答复语句可以包括“您好，请问有什么能帮助到您的”。

在操作S422，在确定当前输入语句为与预定业务相关的输入语句的情况下，将当前输入语句输入分类模型，分类得到当前输入语句的话题信息。

根据本公开的实施例，所述的分类模型例如可以是以具有标签的输入语句作为样本，训练SVM(支持向量机)、LSTM(长短时记忆网络)或CNN(卷积神经网络)等机器学习模型得到。该操作S422可以包括：将当前输入语句以向量形式输入分类模型中，经由分类模型处理后输出得到当前输入语句的话题信息。

综上可知，通过采用分类模型识别输入语句得到话题信息，随着语料的增多，分类模型得到的话题信息的准确率会不断提高，泛化能力会不断增强。因此可以更深层次的理解用户的话题，更智能地判断用户的真正需求，从而提高语句识别准确率和用户体验。

图5示意性示出了根据本公开实施例的输出预定语句的流程图。

根据本公开的实施例，如图5所示，输出预定语句的操作S350可以包括操作S551～操作S553，以确定前一输入语句是否答复完成。

在操作S551，输出第一预定询问语句。

根据本公开的实施例，该第一预定询问语句包括前一输入语句，以用于询问用户前一输入语句是否答复完成。该第一预定询问语句例如可以为“请问A是否成功解决”，其中，A即为前一输入语句。

在操作S552，获取第一预定询问语句的反馈语句。

根据本公开的实施例，该反馈语句例如可以为用户根据第一预定询问语句反馈的语音输入识别得到的输入语句。由于第一预定询问语句是用于询问用户前一输入语句是否答复完成的语句，因此，反馈得到的反馈语句能够用于表征是否答复完成前一输入语句。通过识别分析该反馈语句，可以执行操作S553，判断该反馈语句是否表征答复完成前一输入语句。

在判断结果为反馈语句表征答复完成前一输入语句的情况下，则可以确定用户输入当前输入语句对应的语音输入是为了转移话题。因此，操作S350还包括在判断结果为反馈语句表征答复完成前一输入语句的情况下执行的操作S554，输出针对当前输入语句的话题信息的答复语句。从而较为快速的向用户反馈答复。此种情况下，针对当前输入语句的话题信息的答复语句即为操作S350中所述的预定语句。

在判断结果为反馈语句表征未答复完成前一输入语句的情况下，则无法用户输入当前输入语句对应的语音输入是为了转移话题，还是误操作的输入。因此，为了进一步确定用户是否需要转移话题，操作S350还包括在判断结果为反馈语句表征未答复完成前一输入语句的情况下执行的操作S555，输出第二预定询问语句。

其中，第二预定询问语句包括当前输入语句，以用于确定是否转移话题至当前输入语句表述的话题。根据本公开的实施例，该第二预定询问语句例如可以为“请问您是否想要跳转到B”。其中，B即为当前输入语句。此种情况下，第二预定询问语句为操作S350所述的预定语句。根据用户对该第二预定询问语句的答复，可以确定用户是否想要转移话题。

综上可知，本公开实施例的输出预定语句的方法，可以提高智能客服系统的判断准确性，并因此可以提高用户体验。

根据本公开的实施例，为了便于准确确定当前输入语句后的其他输入语句是否与当前输入语句相关联，还需要在获取到当前输入语句后，根据与该当前输入语句的话题信息相关的候选话题信息来更新候选话题集，使得候选话题集中的候选话题信息为与当前输入语句的话题信息相似或具有逻辑关系的话题信息。

图6示意性示出了根据本公开示例性实施例三的语句处理方法的流程图。

本公开实施例的语句处理方法除了操作S210～操作S240外，如图6所示，还包括操作S660～操作S670，以对候选话题集进行更新。

在操作S660，根据话题信息，获取与话题信息关联的至少一个相关话题信息。

根据本公开的实施例，操作S660例如可以包括：从数据库中获取与话题信息的相似度大于预定相似度的预存话题信息，得到所述至少一个相关话题信息。即，从第二数据库106中获取预存的与话题信息的相似度大于预定相似度的预存话题信息。根据本公开的实施例，该操作S660例如可以通过图7描述的流程来实现，在此不再详述。

根据本公开的实施例，操作S660例如可以包括：根据话题信息，确定逻辑关系库中与话题信息具有逻辑关系的话题信息，得到至少一个相关话题信息。

根据本公开的实施例，逻辑关系库可以为与第二数据库106类似的数据库，或者可以由第二数据库106中的某个存储子空间构成。逻辑关系库中存储有多个话题信息对，每个话题信息对包括具有逻辑关系的两个话题信息。或者，该逻辑关系库中可以存储有与话题信息为索引的多个话题信息集合，每个话题信息集合中包括与作为索引的话题信息具有逻辑关系的至少一个话题信息。例如，以话题信息“random shutdown”为索引的话题信息集合例如可以表示为{<cannot power on>，<battery discharge>}，此时，操作S660中得到的至少一个相关话题信息即为以话题信息为索引的话题信息集合中包括的话题信息。该逻辑关系库例如可以由智能客服系统的工作人员维护，逻辑关系与前述的逻辑关系相似，在此不再赘述。

根据本公开的实施例，逻辑关系库例如可以根据业务知识和用户体验感等进行逻辑关系的增加和修正，从而便于更精准地体现话题之间的实际关系，使得智能客服系统具有良好的实用性和有效性。

在得到当前输入语句的话题信息的至少一个相关话题信息后，即可更新候选话题集。因此执行操作S670，根据至少一个相关话题信息更新候选话题集。该操作S670例如可以包括：将候选话题集中的候选话题信息删除，并将至少一个相关话题信息作为候选话题信息写入候选话题集中。

综上可知，本公开实施例的语句处理方法，通过根据与当前输入语句的话题信息关联的至少一个相关话题信息来更新候选话题集，可以准确地确定是否直接输出与下一输入语句对应的答复语句，并因此可以提高语句处理的准确率，提高用户体验。

图7示意性示出了根据本公开实施例的获取与话题信息的相似度大于预定相似度的预存话题信息的流程图。

如图7所示，上述获取与话题信息的相似度大于预定相似度的预存话题信息的操作S660例如可以包括操作S761及操作S764。

在操作S761，确定数据库存储的多个预存话题信息中每个预存话题信息与话题信息的相似度，得到针对每个预存话题信息的第一相似度。

根据本公开的实施例，该操作S761例如可以包括：采用TF-IDF(term frequency-inverse document frequency，词频-逆文本频率)的统计方法来统计每个预存话题信息及话题信息的重要程度，然后根据该每个预存话题信息与话题信息的重要程度的比值来确定第一相似度。

根据本公开的实施例，该操作S761例如可以包括：先根据每个预存话题信息确定针对该每个预存话题信息的词/句向量，根据话题信息确定针对话题信息的词/句向量。然后通过聚类等技术确定针对每个预存话题信息的词/句向量与针对话题信息的词/句向量的相似度，得到第一相似度。

在确定完第一相似度后，可以将该第一相似度作为操作S660中预存话题信息与话题信息的相似度，并根据该相似度确定相关话题信息。因此执行操作S764，确定多个预存话题信息中与话题信息的相似度大于所述预定相似度的预存话题信息。其中，预定相似度的取值例如可以为大于0.5的任意值，该预定相似度的具体可以根据实际需求进行设定，本公开对此不作限定。

根据本公开的实施例，为了使得相似度的计算更为准确，在计算预定话题信息与当前输入语句的话题信息的相似度时，不仅可以考虑话题信息自身的相似度，还可以考虑针对话题信息的答复语句的相似度。因此，如图7所示，上述获取与话题信息的相似度大于预定相似度的预存话题信息的操作S660除了操作S761及操作S764外，例如还可以包括操作S762～操作S763，该操作S762～操作S763可以在操作S761与操作S764之间执行，也可以与操作S761同时执行。

在操作S762，确定针对每个预存话题信息的答复语句与针对话题信息的答复语句的相似度，得到针对每个预存话题信息的第二相似度。

根据本公开的实施例，该操作S762例如可以包括：先确定针对每个预存话题信息的第一答复语句，以及针对话题信息的第二答复语句。然后采用类似于操作S761中确定第一相似度的方式，确定每个第一答复语句与第二答复语句的相似度，并以该相似度作为针对每个预存话题信息的第二相似度。

在操作S763，根据针对每个预存话题信息的第一相似度和针对每个预存话题信息的第二相似度，得到每个预存话题信息与话题信息的相似度。

根据本公开的实施例，操作S763例如可以包括：先为第一相似度与第二相似度分配权重，例如，为第一相似度分配权重0.7，为第二相似度分配权重0.3。然后再根据第一相似度、第二相似度、为第一相似度分配的权重以及为第二相似度分配的权重，来计算得到每个预存话题信息与话题信息的相似度。可以理解的是，上述通过为第一相似度和第二相似度分配权重计算相似度的方法，及分配的权重值仅作为示例以利于理解本公开，本公开对此不作限定。

综上可知，本公开提供的语句处理方法，通过上下轮话题的相关性识别和相关话题信息的存储，可以优化智能客服系统的对话流程，避免复杂机械的交互流程，因此可以使得人机交互更流畅。图8示意性示出了根据本公开实施例的语句处理装置的结构框图。

如图8所示，本公开实施例的语句处理装置800包括输入语句获取模块810、语句识别模块820、确定模块830和答复语句输出模块840。

输入语句获取模块810用于获取当前输入语句(操作S210)。

语句识别模块820用于识别当前输入语句，得到当前输入语句的话题信息(操作S220)。

确定模块830用于确定话题信息是否属于候选话题集(操作S230)。其中，候选话题集包括根据当前输入语句的前一输入语句的话题信息确定的至少一个候选话题信息。

答复语句输出模块840用于在话题信息属于候选话题集的情况下，输出针对话题信息的答复语句(操作S240)。

根据本公开的实施例，上述语句处理装置800还包括相关话题信息获取模块850和候选话题集更新模块860。相关话题信息获取模块850用于根据话题信息，获取与话题信息关联的至少一个相关话题信息(操作S660)。候选话题集更新模块860用于根据至少一个相关话题信息更新候选话题集(操作S670)。

根据本公开的实施例，上述相关话题信息获取模块850例如可以用于从数据库中获取与话题信息的相似度大于预定相似度的预存话题信息，得到至少一个相关话题信息。并且/或者，相关话题信息获取模块850例如可以用于根据话题信息，确定逻辑关系库中与话题信息具有逻辑关系的话题信息，得到至少一个相关话题信息。其中，逻辑关系库中存储有多个话题信息对，每个话题信息对包括具有逻辑关系的两个话题信息。

根据本公开的实施例，如图8所示，上述相关话题信息获取模块850例如可以包括第一相似度确定子模块851、第二相似度确定子模块852、第三相似度确定子模块853和话题信息确定子模块854。第一相似度确定子模块851用于确定数据库存储的多个预存话题信息中每个预存话题信息与话题信息的相似度，得到针对每个预存话题信息的第一相似度(操作S761)。第二相似度确定子模块852用于确定针对每个预存话题信息的答复语句与针对话题信息的答复语句的相似度，得到针对每个预存话题信息的第二相似度(操作S762)。第三相似度确定子模块853用于根据针对每个预存话题信息的第一相似度和针对每个预存话题信息的第二相似度，得到每个预存话题信息与话题信息的相似度(操作S763)。话题信息确定子模块854用于确定多个预存话题信息中与话题信息的相似度大于预定相似度的预存话题信息(操作S764)。

根据本公开的实施例，如图8所示，上述语句识别模块820包括输入语句确定子模块821和话题信息分类子模块822。输入语句确定子模块821用于确定当前输入语句是否为与预定业务相关的输入语句(操作S421)。话题信息分类子模块822用于在确定当前输入语句为与预定业务相关的输入语句的情况下，将当前输入语句输入分类模型，分类得到当前输入语句的话题信息(操作S422)。

根据本公开的实施例，如图8所示，上述语句处理装置800还包括预定语句输出模块870，用于在话题信息不属于候选话题集的情况下，输出预定语句(操作S350)。

根据本公开的实施例，上述预定语句输出模块870例如可以用于：先输出第一预定询问语句(操作S551)；再获取第一预定询问语句的反馈语句(操作S552)，该反馈语句用于表征是否答复完成前一输入语句；并在反馈语句表征未答复完成前一输入语句的情况下，输出第二预定询问语句(操作S555)。其中，第一预定询问语句包括前一输入语句，第二预定询问语句包括当前输入语句。

根据本公开的实施例，上述预定语句输出模块870例如还可以用于：在反馈语句表征答复完成前一输入语句的情况下，输出针对话题信息的答复语句(操作S554)。

根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

例如，输入语句获取模块810、语句识别模块820、确定模块830、答复语句输出模块840、相关话题信息获取模块850、候选话题集更新模块860、预定语句输出模块870、输入语句确定子模块821、话题信息分类子模块822、第一相似度确定子模块851、第二相似度确定子模块852、第三相似度确定子模块853以及话题信息确定子模块854中的任意多个可以合并在一个模块中实现，或者其中的任意一个模块可以被拆分成多个模块。或者，这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合，并在一个模块中实现。根据本公开的实施例，输入语句获取模块810、语句识别模块820、确定模块830、答复语句输出模块840、相关话题信息获取模块850、候选话题集更新模块860、预定语句输出模块870、输入语句确定子模块821、话题信息分类子模块822、第一相似度确定子模块851、第二相似度确定子模块852、第三相似度确定子模块853以及话题信息确定子模块854中的至少一个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，输入语句获取模块810、语句识别模块820、确定模块830、答复语句输出模块840、相关话题信息获取模块850、候选话题集更新模块860、预定语句输出模块870、输入语句确定子模块821、话题信息分类子模块822、第一相似度确定子模块851、第二相似度确定子模块852、第三相似度确定子模块853以及话题信息确定子模块854中的至少一个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

图9示意性示出了根据本公开实施例的适于执行语句处理方法的电子设备的结构框图。图9示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图9所示，电子设备900包括处理器910和计算机可读存储介质920。该电子设备900可以执行根据本公开实施例的方法。

具体地，处理器910例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))，等等。处理器910还可以包括用于缓存用途的板载存储器。处理器910可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

计算机可读存储介质920，例如可以是非易失性的计算机可读存储介质，具体示例包括但不限于：磁存储装置，如磁带或硬盘(HDD)；光存储装置，如光盘(CD-ROM)；存储器，如随机存取存储器(RAM)或闪存；等等。

计算机可读存储介质920可以包括计算机程序921，该计算机程序921可以包括代码/计算机可执行指令，其在由处理器910执行时使得处理器910执行根据本公开实施例的方法或其任何变形。

计算机程序921可被配置为具有例如包括计算机程序模块的计算机程序代码。例如，在示例实施例中，计算机程序921中的代码可以包括一个或多个程序模块，例如包括921A、模块921B、……。应当注意，模块的划分方式和个数并不是固定的，本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合，当这些程序模块组合被处理器910执行时，使得处理器910可以执行根据本公开实施例的方法或其任何变形。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的；也可以是单独存在，而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

根据本公开的实施例，计算机可读存储介质可以是非易失性的计算机可读存储介质，例如可以包括但不限于：便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

尽管已经参照本公开的特定示例性实施例示出并描述了本公开，但是本领域技术人员应该理解，在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下，可以对本公开进行形式和细节上的多种改变。因此，本公开的范围不应该限于上述实施例，而是应该不仅由所附权利要求来进行确定，还由所附权利要求的等同物来进行限定。

Claims

1.一种语句处理方法，包括：

获取当前输入语句；

识别所述当前输入语句，得到所述当前输入语句的话题信息；

确定所述话题信息是否属于候选话题集；以及

在所述话题信息属于所述候选话题集的情况下，输出针对所述话题信息的答复语句，

其中，所述候选话题集包括根据所述当前输入语句的前一输入语句的话题信息确定的至少一个候选话题信息。

2.根据权利要求1所述的方法，还包括：

根据所述话题信息，获取与所述话题信息关联的至少一个相关话题信息；以及

根据所述至少一个相关话题信息更新所述候选话题集。

3.根据权利要求2所述的方法，其中，获取与所述话题信息关联的至少一个相关话题信息包括：

从数据库中获取与所述话题信息的相似度大于预定相似度的预存话题信息，得到所述至少一个相关话题信息；并且/或者

根据所述话题信息，确定逻辑关系库中与所述话题信息具有逻辑关系的话题信息，得到所述至少一个相关话题信息；其中，所述逻辑关系库中存储有多个话题信息对，每个话题信息对包括具有逻辑关系的两个话题信息。

4.根据权利要求3所述的方法，其中，获取与所述话题信息的相似度大于预定相似度的预存话题信息包括：

确定所述数据库存储的多个预存话题信息中每个预存话题信息与所述话题信息的相似度，得到针对所述每个预存话题信息的第一相似度；

确定针对所述每个预存话题信息的答复语句与针对所述话题信息的答复语句的相似度，得到针对所述每个预存话题信息的第二相似度；

根据针对所述每个预存话题信息的第一相似度和针对所述每个预存话题信息的第二相似度，得到所述每个预存话题信息与所述话题信息的相似度；以及

确定所述多个预存话题信息中与所述话题信息的相似度大于所述预定相似度的预存话题信息。

5.根据权利要求1所述的方法，其中，得到所述当前输入语句的话题信息包括：

确定所述当前输入语句是否为与预定业务相关的输入语句；以及

在确定所述当前输入语句为与所述预定业务相关的输入语句的情况下，将所述当前输入语句输入分类模型，分类得到所述当前输入语句的话题信息。

6.根据权利要求1所述的方法，还包括：

在所述话题信息不属于所述候选话题集的情况下，输出预定语句。

7.根据权利要求6所述的方法，其中，输出预定语句包括：

输出第一预定询问语句；

获取所述第一预定询问语句的反馈语句，所述反馈语句用于表征是否答复完成所述前一输入语句；以及

在所述反馈语句表征未答复完成所述前一输入语句的情况下，输出第二预定询问语句，

其中，所述第一预定询问语句包括所述前一输入语句，所述第二预定询问语句包括所述当前输入语句。

8.根据权利要求7所述的方法，其中，输出预定语句还包括：

在所述反馈语句表征答复完成所述前一输入语句的情况下，输出针对所述话题信息的答复语句。

9.一种语句处理装置，包括：

输入语句获取模块，用于获取当前输入语句；

语句识别模块，用于识别所述当前输入语句，得到所述当前输入语句的话题信息；

确定模块，用于确定所述话题信息是否属于候选话题集；以及

答复语句输出模块，用于在所述话题信息属于所述候选话题集的情况下，输出针对所述话题信息的答复语句，

10.一种电子设备，包括：

一个或多个处理器；以及

存储装置，用于存储一个或多个程序，

其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行权利要求1～8中任一项所述的语句处理方法。