CN111858913A

CN111858913A - 一种自动生成文本摘要的方法和系统

Info

Publication number: CN111858913A
Application number: CN202010652062.6A
Authority: CN
Inventors: 陈坦访; 潘慧; 王伟玮; 李奘
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2020-07-08
Filing date: 2020-07-08
Publication date: 2020-10-30

Abstract

本申请提供了一种自动生成文本摘要的方法和系统。所述方法包括：获取文本数据；利用抽取式的方式，从所述文本数据中抽取至少一个关键句；利用生成式的方式，对所述至少一个关键句进行处理，得到文本摘要。本申请可以使用快速思考模型或BERT模型对长文本进行句向量的提炼，并使用TextRank算法抽取其中的关键句，可以将文本数据缩短并丢弃文本数据中无用的信息，降低了编码‑解码模型和注意力模型进行文本摘要的难度，提高了生成文本摘要时的性能和效果。另外，通过引入预设词表，可以在快速思考模型、编码‑解码模型和注意力模型处理文本数据时，解决了未登录词导致的句子语义不清楚的问题。

Description

一种自动生成文本摘要的方法和系统

技术领域

本申请涉及数据处理领域，特别涉及一种自动生成文本摘要的方法和系统。

背景技术

在线服务场景下，通常需要对一段文本数据进行概括，例如，生成新闻标题、摘要，或者提取对话文本中的重要信息。若进行人工概括，将耗时耗力。而对于长文本来说，采用传统的seq2seq方法，又会造成难以处理或者耗时严重的情况。

因此，需要提供一种自动生成文本摘要的方法和系统。

发明内容

本申请实施例之一提供一种自动生成文本摘要的方法。所述方法包括：获取文本数据；利用抽取式的方式，从所述文本数据中抽取至少一个关键句；利用生成式的方式，对所述至少一个关键句进行处理，得到文本摘要。

本申请实施例之一提供一种自动生成文本摘要的系统。所述系统包括：第一获取模块，用于获取文本数据；抽取模块，用于利用抽取式的方式，从所述文本数据中抽取至少一个关键句；生成模块，用于利用生成式的方式，对所述至少一个关键句进行处理，得到文本摘要。

本申请实施例之一提供一种自动生成文本摘要的装置。所述装置包括处理器以及存储器；所述存储器用于存储指令，其特征在于，当所述指令被所述处理器执行时，所述装置实现如本申请任一实施例所述的自动生成文本摘要的方法对应的操作。

本申请实施例之一提供一种自动生成工单描述的方法。所述方法包括：获取用户与客服的对话数据；基于所述对话数据，通过如本申请任一实施例所述的自动生成文本摘要的方法生成第一工单描述。

在一些实施例中，所述方法还可以包括基于所述对话数据,通过分类器的方式得到第二工单描述，所述第二工单描述包括所述用户对所述解决方案的认可情况；以及汇总所述第一工单描述和所述第二工单描述，得到完整工单描述。

本申请实施例之一提供一种自动生成工单描述的系统，其特征在于，所述系统包括：第二获取模块，用于获取用户与客服的对话数据；第一工单描述生成模块，用于基于对话数据，通过本申请任一实施例所述的文本摘要的方法生成第一工单描述。

在一些实施例中，第一工单描述包括对工单所涉事件的描述和对工单所涉事件的解决方案，所述系统还可以包括：第二工单描述生成模块，用于基于所述对话数据,通过分类器的方式得到第二工单描述，所述第二工单描述包括所述用户对所述解决方案的认可情况；以及汇总模块，用于汇总所述第一工单描述和所述第二工单描述，得到完整工单描述。

本申请实施例之一提供一种自动生成工单描述的装置，所述装置包括处理器以及存储器；所述存储器用于存储指令，当所述指令被所述处理器执行时，所述装置实现如本申请任一实施例所述的自动生成工单描述的方法对应的操作。

本申请实施例之一提供一种计算机可读存储介质，所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机执行如本申请任一实施例所述的自动生成工单描述的方法对应的操作。

附图说明

本申请将以示例性实施例的方式进一步说明，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1为根据本说明书一些实施例所示的自动生成文本摘要系统的应用场景图；

图2是根据本申请一些实施例所示的自动生成文本摘要系统的模块图；

图3是根据本申请一些实施例所示的自动生成工单描述系统的模块图；

图4是根据本申请一些实施例所示的自动生成文本摘要的方法的示例性流程图；

图5是根据本申请一些实施例所示的编码-解码和注意力模型的结构图；以及

图6是根据本申请一些实施例所示的自动生成工单描述的方法的示例性流程图。

具体实施方式

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本申请的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换所述词语。

如本申请和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。

本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

图1为根据本说明书一些实施例所示的自动生成文本摘要系统的应用场景图。该自动生成文本摘要的方法可以应用于生成新闻摘要、事件描述、新闻标题、客服对话工单描述等场景。下面以生成客服对话工单描述为例进行阐述。

该自动生成文本摘要系统100可以包括服务器110、网络120、用户终端130、客服终端140以及存储设备150。

服务器110可以处理来自系统100的至少一个其他组件的数据和/或信息。例如，服务器110可以从用户终端130、客服终端140获取对话数据，并基于所述对话数据自动生成工单描述。

在一些实施例中，服务器110可以是单个处理设备，也可以是处理设备组。处理设备组可以是经由接入点连接到网络120的集中式处理设备组，或者经由至少一个接入点分别连接到网络120的分布式处理设备组。在一些实施例中，服务器110可以本地连接到网络120或者与网络120远程连接。例如，服务器110可以经由网络120访问存储在用户终端130、客服终端140和/或存储设备150中的信息和/或数据。又例如，存储设备150可以用作服务器110的后端数据存储器。

网络120可以促进信息和/或数据的交换。在一些实施例中，场景100下的至少一个组件(例如，服务器110、用户终端130、客服终端140、存储设备150)可以经由网络120将信息和/或数据发送到其他组件。例如，用户终端130可以通过网络120将用户的对话数据发送给服务器110，客服终端140可以通过网络120将客服的对话数据发送给服务器110。又例如，用户终端130可以通过网络120将用户的对话数据发送给存储设备150进行存储，客服终端140可以通过网络120将客服的对话数据发送给存储设备150进行存储。

用户可以通过用户终端130发起与客服的对话。例如，用户可以通过用户终端130发起投诉，并与客服进行对话。用户可以通过用户终端130输入对话内容，输入的方式包括但不限于打字输入、手写输入、选择输入、语音输入、扫描输入等一种或多种的任意组合。用户终端130可以包括移动设备130-1、平板计算机130-2、膝上型计算机130-3等，或其任何组合。进一步的，用户终端130可以是智能手机、收款设备等。

客服可以通过客服终端140与用户进行对话。客服可以通过客服终端140输入对话内容，输入的方式包括但不限于打字输入、手写输入、选择输入、语音输入、扫描输入等一种或多种的任意组合。客服终端140可以是与用户终端130类型相同的设备，也可以是类型不同的设备。例如，客服终端140可以包括移动设备140-1、平板计算机140-2、膝上型计算机140-3等，或其任何组合。

存储设备150可以储存数据和/或指令。例如，可以存储用户与客服的对话数据等。在一些实施例中，存储设备150可以存储服务器110可以执行的数据和/或指令，服务器110可以通过执行或使用所述数据和/或指令以实现本说明书描述的示例性方法。在一些实施例中，存储设备150可包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等或其任意组合。在一些实施例中，所述存储设备150可在云平台上实现。仅作为示例，所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。应当注意的是，上述对自动生成工单描述系统100的描述仅仅是为了示例和说明，而不限定本说明书的适用范围。对于本领域技术人员来说，在本说明书的指导下可以对该系统100进行各种修正和改变。然而，这些修正和改变仍在本说明书的范围之内。

图2是根据本申请一些实施例所示的自动生成文本摘要系统的模块图。在一些实施例中，自动生成文本摘要系统200可以在服务器110上实现。

如图2所示，自动生成文本摘要系统200可以包括第一获取模块201、抽取模块203以及生成模块205。

第一获取模块201可以用于获取文本数据。关于获取文本数据的详细描述可以参见图4，在此不再赘述。

在一些实施例中，自动生成文本摘要系统200还可以包括分解模块207。在一些实施例中，分解模块207可以用于对未登录词进行分解。关于对未登录词进行分解的详细描述可以参见图4，在此不再赘述。

抽取模块203可以用于利用抽取式的方式，从文本数据中抽取至少一个关键句。关于从文本数据中抽取至少一个关键句的详细描述可以参见图4，在此不再赘述。

生成模块205可以用于利用生成式的方式，对至少一个关键句进行处理，得到文本摘要。关于对至少一个关键句进行处理，得到文本摘要的详细描述可以参见图4，在此不再赘述。

应当理解，图2所示的系统及其模块可以利用各种方式来实现。例如，在一些实施例中，系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

需要注意的是，以上对于自动生成文本摘要系统及其模块的描述，仅为描述方便，并不能把本申请限制在所举实施例范围之内。可以理解，对于本领域的技术人员来说，在了解该系统的原理后，可能在不背离这一原理的情况下，对各个模块进行任意组合，或者构成子系统与其他模块连接。上述模块中的两个或以上模块可以合并为单个模块，所述单个模块可执行所合并的模块相应的各种功能；上述某一模块也可拆分为不同模块，拆分后的模块可分别执行不同功能。例如，在一些实施例中，图2中披露的第一获取模块201、抽取模块203和生成模块205可以是系统中的不同模块，也可以是一个模块实现上述两个或以上模块的功能。又例如，第一获取模块和抽取模块可以是两个模块，也可以是一个模块同时具有获取和抽取功能。再例如，各个模块可以共用一个存储模块，各个模块也可以分别具有各自的存储模块。诸如此类的变形，均在本申请的保护范围之内。

图3是根据本申请一些实施例所示的自动生成工单描述系统的模块图。在一些实施例中，自动生成工单描述系统300可以在服务器110上实现。

如图3所示，自动生成工单描述系统300可以包括第二获取模块301、第一工单描述生成模块303、第二工单描述生成模块305以及汇总模块307。

第二获取模块301可以用于获取用户与客服的对话数据。关于获取用户与客服的对话数据的详细描述可以参见图6，在此不再赘述。

第一工单描述生成模块303可以用于基于所述对话数据，通过自动生成文本摘要的方法生成第一工单描述，所述第一工单描述包括对工单所涉事件的描述和对工单所涉事件的解决方案。关于基于所述对话数据，通过自动生成文本摘要的方法生成第一工单描述的详细描述可以参见图6，在此不再赘述。

第二工单描述生成模块305可以用于基于所述对话数据,通过分类器的方式得到第二工单描述，所述第二工单描述包括所述用户对所述解决方案的认可情况。关于基于所述对话数据,通过分类器的方式得到第二工单描述的详细描述可以参见图6，在此不再赘述。

汇总模块307可以用于汇总所述第一工单描述和所述第二工单描述，得到完整工单描述。关于汇总所述第一工单描述和所述第二工单描述，得到完整工单描述的详细描述可以参见图6，在此不再赘述。

应当理解，图3所示的系统及其模块可以利用各种方式来实现。例如，在一些实施例中，系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

需要注意的是，以上对于自动生成工单描述系统及其模块的描述，仅为描述方便，并不能把本申请限制在所举实施例范围之内。可以理解，对于本领域的技术人员来说，在了解该系统的原理后，可能在不背离这一原理的情况下，对各个模块进行任意组合，或者构成子系统与其他模块连接。上述模块中的两个或以上模块可以合并为单个模块，所述单个模块可执行所合并的模块相应的各种功能；上述某一模块也可拆分为不同模块，拆分后的模块可分别执行不同功能。例如，在一些实施例中，图3中披露的第二获取模块301、第一工单描述生成模块303、第二工单描述生成模块305和汇总模块307可以是系统中的不同模块，也可以是一个模块实现上述两个或以上模块的功能。又例如，获取模块和生成模块可以是两个模块，也可以是一个模块同时具有获取和生成功能。再例如，各个模块可以共用一个存储模块，各个模块也可以分别具有各自的存储模块。诸如此类的变形，均在本申请的保护范围之内。

图4是根据本申请一些实施例所示的自动生成文本摘要的方法的示例性流程图。该流程400包括：

步骤401，获取文本数据。具体的，步骤401可以由第一获取模块201实现。

在一些实施例中，文本数据可以包括新闻文本、对话文本或文章。第一获取模块201可以直接从用户终端130或客户终端140中获取文本数据，也可以通过网络接口获取其他终端设备中的文本数据。

在一些实施例中，文本数据可以是经过未登录词分解后的文本数据。未登录词为不存在于预设词表内的词。未登录词可以为新出现的流行词，例如，共享、雨女无瓜、四脚吞金兽等。在一些实施例中，预设词表可以为基于训练语料，利用BPE(Byte Pair Encoding，双字节编码)算法生成的词表。训练语料可以来自语料库。语料库的类型可以包括异质语料库、同质语料库、系统语料库和专用语料库。

在一些实施例中，分解模块207可以对未登录词进行分解。具体地，可以基于预设词表确定文本数据中的未登录词，然后对任一未登录词，将其拆分成至少两个字符，并对非末尾字符进行标记，以指示该字符与其后的字符关联。例如，文本数据为“小孩子真是个四角吞金兽呀”，预设词表中没有“四脚吞金兽”这个词，因此可以将“四脚吞金兽”确定为未登录词，并将其拆分为五个字符并标记为“四@脚@吞@金@兽”，可以表示“四脚吞金兽”是一个有关联的词。

步骤403，利用抽取式的方式，从文本数据中抽取至少一个关键句。具体的，步骤403可以由抽取模块203实现。

抽取式的方式可以指从文本数据中抽取一部分关键语句形成文本描述且不改变语义的方式。

在一些实施例中，抽取式的方式可以包括使用模型或者算法抽取，例如，可以从原文本中100个句子中抽取得到20个关键句，由于关键句只是用逗号、句号进行简单切分，所以用抽取式得到的关键句不流畅。

在一些实施例中，可以先确定所述对话数据的句向量，再根据所述句向量确定关键句。具体的，可以使用模型处理文本数据，得到至少一个句向量。传统的生成句向量的方式如word2vec等，是先训练得到词向量，然后加权求平均得到一句话的句向量，此种方式下得到的句向量不能清晰表达句子的语义，而通过文本嵌入模型得到的句向量表达句子语义的效果更好。在一些实施例中，文本嵌入模型可以包括快速思考模型或BERT模型。通过快速思考模型或BERT模型处理文本数据，可以得到句向量。快速思考模型(Quick Thoughts)是一种无监督学习模型。BERT(Bidirectional Encoder Representation fromTransformers)模型，即双向Transformer的Encoder，可以通过左、右两侧上下文来预测当前词和通过当前句子预测下一个句子。快速思考模型模型训练时，可以与分类器组成组合模型进行训练。其中，快速思考模型用于处理句子文本，以生成句子向量。分类器用于处理句子向量，以对句子进行分类。在一些实施例中，组合模型的训练语料可以为对话数据或新闻文本。具体地，可以选取包括目标句子在内的若干句子作为组合模型的输入，将所述若干句子中目标句子的下一句作为正样本、其他句子(可以随机从训练语料中选取)作为负样本，对组合模型进行训练，使组合模型能够对从输入中识别出目标句子的下一句(或者识别出正负样本)。训练完成后可以得到训练好的组合模型，此时也意味着快速思考模型能够处理句子文本，输出更能表征句子特征的句子向量。在使用模型处理文本数据得到至少一个句向量时，仅使用训练好的快速思考模型，而不使用该分类器。通过文本嵌入模型可以将文本数据转化为对应的至少一个句向量，便于对文本数据进行抽取。

在一些实施例中，可以基于至少一个句向量，通过文本排名算法抽取得到关键句。具体地，可以通过文本排名算法处理至少一个句向量，抽取得到至少一个关键句向量，然后基于至少一个关键句向量获取至少一个关键句。文本排名算法(TextRank)是一种用于文本的基于图的排序算法，可以用于提取关键词、关键句、短语以及自动生成文本摘要。在一些实施例中，可以将若干个句向量作为节点构建图。在一些实施例中，可以计算任意两个句向量之间的相似度。两个句向量之间的相似度可以作为两个句向量构成的边的权值。可以通过多种方法计算两个句向量之间的相似度，例如余弦相似度、最长公共子序列等。在一些实施例中，可以根据TextRank公式迭代权重计算各个句向量的得分。在一些实施例中，可以对句向量得分进行顺序或倒序排序，抽取得分最高的N个句向量对应的句子作为关键句，其中N为大于等于1的自然数。

抽取模块203可以利用文本嵌入模型和文本排名算法结合的方式，从文本数据中抽取至少一个关键句。通过文本嵌入模型和文本排名算法结合来抽取文本数据中的关键句，可以将长文本概括为短文本，便于后续生成文本摘要。

步骤405，利用生成式的方式，对至少一个关键句进行处理，得到文本摘要。具体的，步骤405可以由生成模块205实现。

生成式的方式可以指根据文本数据的语义生成流畅描述且不改变语义的方式。生成式的方式可以理解文本语义，生成文本摘要。在一些实施例中，可以使用编码-解码和注意力模型对关键句进行处理，得到文本摘要。

在一些实施例中，编码-解码和注意力模型(Encoder-Decoder+Attention模型)为transformer结构。图5是根据本申请一些实施例所示的编码-解码和注意力模型的结构图。如图5所示，图中左边为Encoder部分，右边为Decoder部分，这两个部分都由transformer结构堆叠组成。Encoder部分和Decoder部分可以分别包括多层(如，6层)。Encoder部分可以包括多头Attention层、前馈网络层、norm(标准化)层和残差连接。Decoder部分与Encoder部分相似，多了一层多头Attention层。步骤403抽取的关键句可以输入Encoder部分，Encoder部分的输出结果进入Decoder部分，Decoder部分的输出可以经过线性输出层和softmax层最终得到输出词及其概率，进而得到文本摘要的输出结果。可以理解，transformer类似循环神经网络，在对关键句进行处理的过程中，上一次Decoder部分的输出可以与Encoder部分的输出结果一起作为下一次Decoder部分的输入，从而可以使Decoder部分上一次的输出可以影响下一次的输出，进而使得到的文本摘要更加流畅。

在一些实施例中，可以将关键句输入到Encoder-Decoder+Attention模型中，输出语义正确的流畅语句。例如，输入语句为：提现认证错误，师傅请问是银行卡绑定失败吗，显示要我认证，师傅请问多次认证失败吗，之前绑定的，提现都没问题，师傅不用资料的，这边会帮您提交到相关部门人工核实您的这个情况的，要几个工作日，师傅最迟需要7天。输出的流畅语句为：提现银行卡一直认证失败。

在一些实施例中，Encoder-Decoder+Attention模型可以是提前用大规模的语料(如，新闻语料库)进行预训练得到的。在一些实施例中，Encoder-Decoder+Attention模型的训练语料可以为LCSTS新闻语料库和对话数据。具体地，可以获取多个样本对Encoder-Decoder+Attention模型进行训练，每个样本对包括一段文本和与该文本对应的摘要。在训练时，以该文本为Encoder部分的输入，以对应摘要为模型的最终输出结果，对模型进行训练。在一些实施例中，可以基于Encoder-Decoder+Attention模型输出的文本摘要与训练样本中的摘要的差异构建损失函数，调节Encoder-Decoder+Attention模型的参数，以使损失函数最小化。当满足一定条件时(如损失函数的值达到设定值，或训练所用样本对的数量达到设定数量等)，停止训练，得到训练好的Encoder-Decoder+Attention模型。在一些实施例中，可以将训练样本中的摘要中对应当前次(Encoder-Decoder+Attention模型中的)Decoder部分输出的词或字符之前的内容代替上一次Decoder部分的输出，作为当前次Decoder部分的部分输入，如此可以提高模型的预测准确度同时提高模型训练效率。

通常情况下，文本数据长度较长，使用快速思考模型或BERT模型进行句向量的提炼，使用TextRank算法抽取其中的关键句，可以将文本数据缩短并在一定程度上丢弃无用的信息。从而使输入至编码-解码和注意力模型的文本长度可控，降低后续编码-解码和注意力模型进行文本摘要的难度，保证了生成文本摘要时的性能和效果。另外，在快速思考模型、编码-解码和注意力模型处理文本数据时引入预设词表，可以解决未登录词导致的句子语义不清楚的问题。

应当注意的是，上述有关流程400的描述仅仅是为了示例和说明，而不限定本申请的适用范围。对于本领域技术人员来说，在本申请的指导下可以对流程400进行各种修正和改变。然而，这些修正和改变仍在本申请的范围之内。例如，对未登陆词进行拆分还可以通过其他标记符进行标记，比如“#”、“$”或“&”等或其任意组合，可以标记为“四#脚#吞#金#兽”、“四$脚$吞$金$兽”、“四&脚&吞&金&兽”或“四#脚$吞&金#兽”。

图6是根据本申请一些实施例所示的自动生成工单描述的方法的示例性流程图。该流程600包括：

步骤601，获取用户与客服的对话数据。具体的，步骤601可以由第二获取模块301实现。

对话数据可以指用户与客服沟通产生的沟通对话。例如，用户针对某一应用、产品进行咨询客服，或者用户向客服进行投诉。在一些实施例中，对话数据可以包括语音对话数据和/或文本对话数据。在一些实施例中，用户与客服之间进行语音进行沟通，通过录音设备录制上述对话内容，第二获取模块301可以从录音设备中获取该语音对话数据，然后将语音对话数据转化为文本对话数据。具体地，可以采用自动语音识别技术(Automatic SpeechRecognition)将语音对话数据转化为文本对话数据。在一些实施例中，用户与客服之间通过文字进行对话，则第二获取模块301可以直接获取该文本对话数据。

步骤603，基于对话数据，通过文本摘要的方法生成第一工单描述。具体的，步骤603可以由第一工单描述生成模块303实现。

在一些实施例中，第一工单描述可以是预先设置的文本内容。具体的，第一工单描述可以包括对工单所涉事件的描述和对工单所涉事件的解决方案。在一些实施例中，第一工单描述生成模块303可以基于对话数据，通过文本摘要的方法生成对工单所涉事件的描述和对工单所涉事件的解决方案。可以理解，在用户与客服的对话数据中，对工单所涉事件的描述是根据用户与客服的对话数据概括出来的，因此，可以通过自动生成文本摘要的方法处理用户与客服的对话数据，生成对工单所涉事件的描述。而对工单所涉事件的解决方案是由客服提出的，解决方案包含在客服的语句中。因此，可以从对话数据中提取客服的语句，通过自动生成文本摘要的方法处理客服的语句，生成对工单所涉事件的解决方案。关于自动生成文本摘要的方法可以参见图4的详细描述，在此不做赘述。

仍以上述例子为例，例如，用户与客服的对话数据为：提现认证错误，师傅请问是银行卡绑定失败吗，显示要我认证，师傅请问多次认证失败吗，之前绑定的，提现都没问题，师傅不用资料的，这边会帮您提交到相关部门人工核实您的这个情况的，要几个工作日，师傅最迟需要7天。通过自动生成文本摘要的方法，得到的对工单所涉事件的描述可以为：提现银行卡一直认证失败。从对话数据中提取客服的语句可以为：师傅请问是银行卡绑定失败吗，师傅请问多次认证失败吗，师傅不用资料的，这边会帮您提交到相关部门人工核实您的这个情况的，要几个工作日，师傅最迟需要7天。通过自动生成文本摘要的方法，得到的对工单所涉事件的解决方案可以为：客服帮用户提交资料到相关部门进行人工核实，需要等几个工作日。

步骤605，基于对话数据，通过分类器的方式得到第二工单描述。具体的，步骤605可以由第二工单描述生成模块305实现。

在一些实施例中，第二工单描述可以是预先设置的文本内容。具体的，第二工单描述可以包括用户对解决方案的认可情况。认可情况可以包括认可、不认可或未确定。在一些实施例中，用户对解决方案的认可情况可以用文字表示，或者也可以用数字表示。例如，若用户对解决方案认可可以表示为“认可”或“0”，若用户对解决方案不认可可以表示为“不认可”或“1”，若未确定用户对解决方案是否认可可以表示为“未确定”或“2”。

分类器可以是对数据进行分类的模型。分类器可以包括基于卷积神经网络的文本分类模型。基于卷积神经网络的文本分类(Text CNN)模型是利用卷积神经网络对文本进行分类的算法模型。在一些实施例中，第二工单描述生成模块305可以基于对话数据，通过分类器的方式得到第二工单描述。例如，根据用户与客服对话可知：用户是共享车辆平台的司机，客服建议司机前往热点区域接单，司机同意前往热点区域接单，则“司机同意”即为用户认可客服提出的“建议司机前往热点区域接单”的解决方案。例如，“司机同意”在第二工单描述上可以表示为“认可”或“0”。

在一些实施例中，可以使用历史用户与客服的对话数据对Text CNN模型进行训练，模型的输入可以是历史用户与客服的对话数据，模型的输出可以用户是否认可该解决方案。在一些实施例中，Text CNN模型的训练过程如下：获取多个样本对，每个样本对包括对话文本和与该对话文本对应的用户对解决方案的认可情况(可通过人工进行标注)；以对话文本为模型的输入，用户对解决方案的认可情况为正确标准(Ground Truth)，对模型进行训练；当满足一定条件(如损失函数的值达到设定值，或训练所用样本对的数量达到设定数量等)时，停止训练，得到训练好的Text CNN模型。

步骤607，汇总第一工单描述和第二工单描述，得到完整工单描述。具体的，步骤607可以由汇总模块307实现。

汇总的方式可以为多种多样。在一些实施例中，可以预先获取完整工单描述的格式，根据该格式进行汇总。例如，完整工单描述的格式为表格，其中第一列为对工单所涉事件的描述，第二列为对工单所涉事件的解决方案，第三列为用户对该解决方案的认可情况，则可按照该表格对第一工单描述和第二工单描述进行汇总。又例如，完整工单描述的格式为文本格式，其中第一段为对工单所涉事件的描述，第二段为对工单所涉事件的解决方案，第三段为用户对该解决方案的认可情况，则可按照该文本格式对第一工单描述和第二工单描述进行汇总。

应当注意的是，上述有关流程600的描述仅仅是为了示例和说明，而不限定本申请的适用范围。对于本领域技术人员来说，在本申请的指导下可以对流程600进行各种修正和改变。然而，这些修正和改变仍在本申请的范围之内。例如，步骤601和步骤603可以合并为一个步骤，可以获取用户与客服的对话数据，并且基于对话数据，通过文本摘要的方法生成第一工单描述。又例如，步骤605和步骤607可以合并为一个步骤，基于对话数据,通过分类器的方式得到第二工单描述，汇总所述第一工单描述和所述第二工单描述，得到完整工单描述。又例如，若完整工单只有第一工单描述，则可以删除步骤605和步骤607。

本申请实施例可能带来的有益效果包括但不限于：(1)使用快速思考模型或BERT模型对长文本进行句向量的提炼，使用TextRank算法抽取其中的关键句，可以将文本数据缩短并丢弃文本数据中无用的信息；(2)抽取关键句后的文本数据的长度可控，降低了编码-解码模型和注意力模型进行文本摘要的难度，提高了生成文本摘要时的性能和效果。(3)引入预设词表，可以在快速思考模型、编码-解码模型和注意力模型处理文本数据时，解决未登录词导致的句子语义不清楚的问题；(4)通过自动生成文本摘要的方法生成客服工单，提高了客服工单的生成效率。需要说明的是，不同实施例可能产生的有益效果不同，在不同的实施例里，可能产生的有益效果可以是以上任意一种或几种的组合，也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本申请的限定。虽然此处并没有明确说明，本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议，所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。

同时，本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外，本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，本领域技术人员可以理解，本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号，例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式，包括电磁形式、光形式等，或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质，该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播，包括无线电、电缆、光纤电缆、RF、或类似介质，或任何上述介质的组合。

本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写，包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等，常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP，动态编程语言如Python、Ruby和Groovy，或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)，或连接至外部计算机(例如通过因特网)，或在云计算环境中，或作为服务使用如软件即服务(SaaS)。

此外，除非权利要求中明确说明，本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的服务器或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本申请披露的表述，从而帮助对一个或多个发明实施例的理解，前文对本申请实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字，应当理解的是，此类用于实施例描述的数字，在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明，“大约”、“近似”或“大体上”表明所述数字允许有±20％的变化。相应地，在一些实施例中，说明书和权利要求中使用的数值参数均为近似值，该近似值根据个别实施例所需特点可以发生改变。在一些实施例中，数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值，在具体实施例中，此类数值的设定在可行范围内尽可能精确。

针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外，对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是，如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方，以本申请的描述、定义和/或术语的使用为准。

最后，应当理解的是，本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此，作为示例而非限制，本申请实施例的替代配置可视为与本申请的教导一致。相应地，本申请的实施例不仅限于本申请明确介绍和描述的实施例。

Claims

1.一种自动生成文本摘要的方法，其特征在于，所述方法包括：

获取文本数据；

利用抽取式的方式，从所述文本数据中抽取至少一个关键句；

利用生成式的方式，对所述至少一个关键句进行处理，得到文本摘要。

2.根据权利要求1所述的方法，其特征在于，所述利用抽取式的方式，从所述文本数据中抽取至少一个关键句包括：

使用文本嵌入模型处理所述文本数据，得到至少一个句向量；以及

基于所述至少一个句向量，抽取得到所述至少一个关键句。

3.根据权利要求2所述的方法，其特征在于，所述文本嵌入模型包括快速思考模型或BERT模型；

所述基于所述至少一个句向量，抽取得到所述至少一个关键句，包括：

通过文本排名算法处理所述至少一个句向量，抽取得到至少一个关键句向量；基于至少一个关键句向量获取至少一个关键句。

4.根据权利要求1所述的方法，其特征在于，所述利用生成式的方式，对所述至少一个关键句进行处理，得到文本摘要包括：

使用编码-解码模型和注意力模型对所述关键句进行处理，得到所述文本摘要。

5.根据权利要求1所述的方法，其特征在于，所述文本数据是经过未登录词分解后的文本数据；所述未登录词为不存在于预设词表内的词。

6.根据权利要求5所述的方法，其特征在于，所述未登录词分解包括：

基于所述预设词表确定所述文本数据中的未登录词；

对任一未登录词：

拆分成至少两个字符；

对非末尾字符进行标记，以指示该字符与其后的字符关联。

7.根据权利要求5所述的方法，其特征在于，所述预设词表基于训练语料，利用BPE算法生成。

8.一种自动生成文本摘要的系统，其特征在于，所述系统包括：

第一获取模块，用于获取文本数据；

抽取模块，用于利用抽取式的方式，从所述文本数据中抽取至少一个关键句；

生成模块，用于利用生成式的方式，对所述至少一个关键句进行处理，得到文本摘要。

9.一种自动生成文本摘要的装置，所述装置包括处理器以及存储器；所述存储器用于存储指令，其特征在于，当所述指令被所述处理器执行时，所述装置实现如权利要求1～7中任一项所述的自动生成文本摘要的方法对应的操作。

10.一种自动生成工单描述的方法，其特征在于，所述方法包括：

获取用户与客服的对话数据；

基于所述对话数据，通过如权利要求1～7任一项所述的自动生成文本摘要的方法生成第一工单描述。

11.根据权利要求10所述的方法，其特征在于，所述对话数据包括：

语音对话数据和/或文本对话数据。

12.根据权利要求10所述的方法，其特征在于，所述第一工单描述包括对工单所涉事件的描述和对工单所涉事件的解决方案；

所述基于所述对话数据，通过文本摘要的方式生成第一工单描述包括：

通过如权利要求1～7任一项所述的自动生成文本摘要的方法处理所述对话数据，生成所述对工单所涉事件的描述；

从所述对话数据中提取所述客服的语句；以及

通过如权利要求1～7任一项所述的自动生成文本摘要的方法处理所述客服的语句，生成所述对工单所涉事件的解决方案。

13.根据权利要求12所述的方法，其特征在于，所述方法还包括：

基于所述对话数据,通过分类器的方式得到第二工单描述，所述第二工单描述包括所述用户对所述解决方案的认可情况；以及

汇总所述第一工单描述和所述第二工单描述，得到完整工单描述。

14.根据权利要求10所述的方法，其特征在于，所述分类器包括：

基于卷积神经网络的文本分类模型。

15.一种自动生成工单描述的系统，其特征在于，所述系统包括：

第二获取模块，用于获取用户与客服的对话数据；

第一工单描述生成模块，用于基于所述对话数据，通过如权利要求1～7任一项所述的自动生成文本摘要的方法生成第一工单描述。

16.根据权利要求15所述的系统，其特征在于，所述第一工单描述包括对工单所涉事件的描述和对工单所涉事件的解决方案，所述系统还包括：

第二工单描述生成模块，用于基于所述对话数据,通过分类器的方式得到第二工单描述，所述第二工单描述包括所述用户对所述解决方案的认可情况；以及

汇总模块，用于汇总所述第一工单描述和所述第二工单描述，得到完整工单描述。

17.一种自动生成工单描述的装置，所述装置包括处理器以及存储器；所述存储器用于存储指令，其特征在于，当所述指令被所述处理器执行时，所述装置实现如权利要求10～14中任一项所述的自动生成工单描述的方法对应的操作。

18.一种计算机可读存储介质，其特征在于，所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机运行如权利要求10～14中任一项所述的自动生成工单描述的方法对应的操作。