CN112989046A

CN112989046A - 实时话术预判方法、装置、计算机设备和存储介质

Info

Publication number: CN112989046A
Application number: CN202110291939.8A
Authority: CN
Inventors: 赵亮; 尹曦
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2021-03-18
Filing date: 2021-03-18
Publication date: 2021-06-18
Anticipated expiration: 2041-03-18
Also published as: CN112989046B

Abstract

本申请实施例属于人工智能中的语义识别领域，应用于智慧城市领域中，涉及一种实时话术预判方法，包括若接收到第一用户的第一话术，通过话术转换器将所述第一话术转化为第一话术向量；基于前向矩阵得到至少一个第二用户根据所述第一话术发送的第二话术的话术概率；根据所述话术概率对至少一个所述第二话术排序，将话术概率大于第一阈值的第二话术作为异议话术；并将至少一个异议话术输入到标注模型中，得到话术预判结果。本申请还提供一种实时话术预判装置、计算机设备及存储介质。此外，本申请还涉及区块链技术，所述话术数据还存储于区块链中。采用本方法可以提前预判对话中的问题。

Description

实时话术预判方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能领域中的自然语言处理领域，特别是涉及一种实时话术预判方法、装置、计算机设备和存储介质。

背景技术

在当前信息时代，基于自然语言处理能力的对话系统会对金融、互联网等领域有着非常显著的帮助。例如，当当前用户与别的用户通过手机终端沟通交谈某一话题，传统的AI辅助人工问答技术的主要以KBQA、FAQ或者知识卡片等方式偏向被动地回复提醒的技术，这些相关技术的主要功能作用是当当前用户对该话题下某一具体问题涉及到的相关领域知识不熟悉，或者话术组织不佳时进行相关的提醒。但这种传统对话辅助技术偏向于解决用户已经产生的问题，无法对问题进行预判。

发明内容

基于此，针对上述技术问题，本申请提供一种实时话术预判方法、装置、计算机设备及存储介质，以解决现有技术中无法在实时对话对问题进行预判的技术问题。

一种实时话术预判方法，所述方法包括：

若接收到第一用户的第一话术，通过话术转换器将所述第一话术转化为第一话术向量；

基于前向矩阵得到至少一个第二用户根据所述第一话术发送的第二话术的话术概率，其中，所述前向矩阵为根据历史语料中第二用户的各第一问题的第一文本集聚类得到的向量集，所述第一文本集为文本位置在各所述第一问题前的第一文本的集合；

根据所述话术概率对至少一个所述第二话术排序，将话术概率大于第一阈值的第二话术作为异议话术；并

将至少一个异议话术输入到标注模型中，得到话术预判结果。

一种实时话术预判装置，所述装置包括：

转化模块，用于若接收到第一用户的第一话术，通过话术转换器将所述第一话术转化为第一话术向量；

计算模块，用于基于前向矩阵得到至少一个第二用户根据所述第一话术发送的第二话术的话术概率，其中，所述前向矩阵为根据历史语料中第二用户的各第一问题的第一文本集聚类得到的向量集，所述第一文本集为文本位置在各所述第一问题前的第一文本的集合；

排序模块，用于根据所述话术概率对至少一个所述第二话术排序，将话术概率大于第一阈值的第二话术作为异议话术；以及

预判模块，用于将至少一个异议话术输入到标注模型中，得到话术预判结果。

一种计算机设备，包括存储器和处理器，以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现上述实时话术预判方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令被处理器执行时实现上述实时话术预判方法的步骤。

上述实时话术预判方法、装置、计算机设备和存储介质，通过在接收到当前的第一用户的第一话术后，根据前向矩阵得到至少一个第二用户根据第一话术发送的第二话术的话术概率，并根据该话术概率确定第二用户最有可能回复的第二话术，作为异议话术输入到训练后的标注模型中，得到最终的话术预判结果发送给第一用户进行参考。本申请采用文本向量的转化、矩阵关联、知识图谱的融合和应用等技术，将AI辅助人工对话的能力从简单的被动提示扩展到主动的引导，提前一步洞察第二用户的潜在问题，并可以及时提供最优质量的话术作为参考，通过本申请的技术方案改进之后的对话系统，特别是电话销售辅助系统具备优秀的异议问题预判和话题主动引导的能力解决了现有技术中无法对第二用户的问题进行预判的技术问题。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为实时话术预判方法的应用环境示意图；

图2为实时话术预判方法的流程示意图；

图3为实时话术预判装置的示意图；

图4为一个实施例中计算机设备的示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本申请的目的、技术方案及优点更加清楚明白，下面结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的实时话术预判方法，可以应用于如图1所示的应用环境中。其中，该应用环境可以包括终端102、网络以及服务端104，网络用于在终端102和服务端104之间提供通信链路介质，网络可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端102通过网络与服务端104交互，以接收或发送消息等。终端102上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端102可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group AudioLayer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务端104可以是提供各种服务的服务器，例如对终端102上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的实时话术预判方法一般由服务端/终端执行，相应地，实时话术预判装置一般设置于服务端/终端设备中。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本申请可应用于智慧城市领域中，特别是智慧银行、智慧企业等领域中，从而推动智慧城市的建设。

应该理解，图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

其中，终端102通过网络与服务端104进行通信。服务端104通过检测或者接收终端102发送的第一用户的第一话术，并在检测或者接收到之后，根据话术转化器将其转化为第一话术向量，并基于前向矩阵得到至少一个第二用户根据第一话术发送的第二话术的话术概率，并根据话术概率得到最有可能的至少一个异议话术输入到训练后的标注模型中，得到话术预判结果，发送给终端102的第一用户。其中，终端102和服务端104之间通过网络进行连接，该网络可以是有线网络或者无线网络，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种实时话术预判方法，以该方法应用于图1中的服务端为例进行说明，包括以下步骤：

步骤202，若接收到第一用户的第一话术，通过话术转换器将第一话术转化为第一话术向量。

本申请提出一种具备对话预判和话术引导功能的聊天辅助方式，可以根据当前用户的当前话术预测与之交谈的用户可能的回复，并根据该回复为当前用户生成至少一个应答话术。

可选地，本申请的技术方案还可以应用于微信、QQ、淘宝旺旺聊天、line、Facebook等即时聊天系统中，用于在用户的输入界面生成具有引导、方向性预测的应答话术，以解决现有技术中无法对与当前用户聊天的用户的聊天方向进行预判的技术问题，并且可以在用户的聊天界面生成话术预判结果，以供当前用户进行参考或者直接点击选择，具有提高聊天效率的效果。

可选地，本申请的技术方案还可以应用于输入法中，在获得用户的授权后，根据用户的当前输入进行话术预判。

本申请的技术方案的应用场景优选以上的场景，但是不仅限于以上场景。

具体地，本申请的技术方案可以应用于保险或者金融领域代理人与客户之间的对话系统中，对未发生的对话进行方向性的预判，并由此来最优化响应话术的生成和回复算法。现有技术中没有或者极少考虑后续对话的方向性，本申请针对该点进行改进：

其中，第一用户可以指当前对话中的当前用户，第二用户可以指代与该第一用户进行即时对话的其他用户，第一话术是指当前用户的当前话术；话术转化器可以指将当前用户的当前话术或者其他对话数据转化为向量或者矩阵化的转化网络。具体地，获取对应的应用场景下的历史语料，历史语料包括至少两个人之间的对话数据，该对话数据可以包括问答数据。

进一步地，在通过话术转化器将第一话术转化为第一话术向量之前，还包括：

获取历史语料，其中，历史语料包括第一用户与第二用户的对话数据；基于历史语料，通过tf-idf算法训练得到基于词频的文本转向量的话术转化器。

具体地，该对话数据一般是指第一用户与第二用户围绕某话题的对话，例如，第一用户与第二用户围绕“保险”进行交谈；第一用户说“保险其实可以防范生活中大多数意外，你可以试着买点。”第二用户说“这种事情，我还要和家里人商量一下，特别是老婆大人。”第二用户还可能会说“我已经有社保了，还需要购买保险吗？”诸如此类。

进一步地，为了得到业务场景下的话术转化器，还需要对历史语料进行适配训练，具体地，适配训练是指使用自然语言处理领域通用的tf-id方式将文本转化为向量，主要是基于语料集、统计词频以及逆文档频率指数，将词汇至语句转化为向量表示的过程。

即，通过对历史语料进行tf-idf文本转向量的适配训练，通过对全部历史语料的统计分析得到了当前场景下基于词频的一个文本转向量的话术转化器t。tf-idf可以直接无监督地将文本转为向量，有相应的python模块会基于一个固定的文本集G对一句话中每个在文本集G中出现过的词计算对应的tf-idf值，然后组成一个稀疏向量，这个基于G的转化可以理解为适配。

具体地，对历史语料进行分词处理，得到多个分词文本；计算各分词文本在历史语料中的第一词频，得到第一词频字典；并基于第一词频字典，计算历史语料中各句子文本中各分词文本的TF-IDF值，作为第一词频特征；基于第一词频字典和第一词频特征的特征生成算法，构造得到基于历史语料的稀疏矩阵，作为话术转化器。

优选地，分词处理可以采用常用的结巴分词。

特征生成算法为第一词频特征的生成算法。

具体地，统计历史语料每个分词文本的出现次数，得到字典D＝{word1：次数20，word2：次数34，......}，作为第一词频字典；在对历史语料中的任何一句话进行分词后，针对第一词频字典D计算每个分词文本的TF-IDF值，作为特征，即第一词频特征(大多数字典中的词没有在本句出现就为0)。例如，如果第一词频字典总长度为2000，每句话就得到一个2000维的向量。这样比如一个新的语料集包含500个句子，就得到500*2000的一个稀疏矩阵。

其中，TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。在一份给定的文件里，词频(term frequency，TF)指的是某一个给定的词语在该文件中出现的频率，这个数字是对词数(term count)的归一化，以防止它偏向长的文件。

步骤204，基于前向矩阵得到至少一个第二用户根据第一话术发送的第二话术的话术概率，其中，前向矩阵为根据历史语料中第二用户的各第一问题的第一文本集聚类得到的向量集，第一文本集为文本位置在各第一问题前的第一文本的集合。

在一些实施例中，本申请的技术方案可以应用于保险销售场景中的电话销售系统中。

首先，进一步地，在基于前向矩阵得到第二用户根据第一话术发送的至少一类第二话术的话术概率之前，还需要得到前向矩阵：

从历史语料中获取第一问题集合，其中，第一问题集合中包括多个第一问题；通过话术转化器将各第一问题的第一文本集转化为第一文本向量，其中，第一文本向量包括各第一文本对应的第一向量；根据密度聚类算法对第一文本集中的第一向量进行聚类，并计算聚类后包含第一向量最多的向量簇的中心向量，将中心向量作为对应的第一向量的前向向量；拼接第一问题的前向向量，得到前向向量集，并将各前向向量集拼接后作为前向矩阵。

具体地，针对保险销售场景，需要生成一个第二用户常见问题集合，即从历史语料中获取第一问题集，其中，第一问题集中包括多个第一问题。

Q＝{Q₁，Q₂，Q₃，...，Q_m}

其中，Q指第一问题集的向量，Q_m指各第一问题的向量。在本实施例中，对历史语料中每个文本位置在第一问题前的2-3轮第一用户的话术进行采集，得到第一问题的前序文本集

S＝{{Q₁-＞S₁，S₂，S₃，...，S_n}，{Q₂-＞S₁，S₂，S₃，...，S_n}，...，{...}}

可以将该前序文本集S作为第一文本集，其中，第一文本集中包括多个第一文本；由此针对每个第一问题可以得到所有前序文本集，将其命名为第一问题Q的前向话术集。在本实施例中，每个前向话术集大致收集200-500条句子。

然后，针对每个第一问题的下文语料同样做相关的收集工作，并将其命名为第一问题Q的后项话术集BS，即，第二文本集，每个第二文本集大致收集50-100条句子。

因为，第一文本集主要为了将语句引导至第一问题，而第二文本集是为了提供参考例句，二者用途不同，所以第一文本集中句子的数量与第二文本集中句子的数量不同。

然后使用前面训练得到的话术转化器将第一文本集转化成向量的结合：

V＝{V₁，V₂，V₃，...，V_n}

其中，V指第一文本集的向量，V_n指第一文本集中各第一话术。

然后，再通过DBSCAN密度聚类算法将向量聚合V聚类成多个簇，并计算包含向量个数最多的簇的中心向量Vs。其中，簇J的中心向量是指簇J的中心点，由簇中所有向量各个纬度求算数平均数得到的，然后将中心向量Vs作为对应的第一问题的前向向量。具体地，包含向量最多的簇被认为最具代表性的，因为簇中包含向量越多证明相近表达的次数越多，中心向量则是整个簇中各个语义维度的中心值，距离同类型表达的各个向量的距离和最小，所以具有一定的代表性。

然后，将每个第一问题的前向向量集中在一起，构成前向向量的集合：

{Va1，Va2，...，Vam}

最后，再把每个问题的前向向量的集合拼接在一起作为一个相关的矩阵，得到上述的前向矩阵。

在本实施例中，通过基于前向矩阵得到第二用户根据第一话术发送的至少一类第二话术的话术概率，可以由第一用户表达的话术快速关联计算出后续第二用户可能的对照的问题类型。

步骤206，根据话术概率对至少一个第二话术排序，将话术概率大于第一阈值的第二话术作为异议话术。

上述可能的对照的问题类型是指，第二用户根据第一用户的第一话术可能会返回的异议问题，通过上述步骤可以得到各异议问题，即第二话术的话术概率，得到的每一个异议问题，即第二话术都有对应的话术概率，然后根据话术概率的大小对第二话术进行排序，并将排名在前三的3个第二话术的话术概率与第一阈值进行对比。在本实施例中，也不一定要限定在只取前三，可以根据具体应用场景和需要进行调整。

若存在大于第一阈值的第一话术则进行输出，得到第二用户根据第一话术可能会反馈的第二话术，然后将得到的第二话术作为异议话术，进行下一步处理。

具体地，每当第一用户输入一句第一话术，使用上述训练好的话术转化器t将该第一话术sen转化成第一话术向量Vt，将第一话术向量Vt与得到的前向矩阵M做乘法得到列向量Vl，Vl表示第一用户说出第一话术sen后第二用户提出各种异议的可能性或者反馈各种第二话术的可能性。将异议的问题可能性进行排序，提出可能性最大的三个问题并与预先设定好的第一阈值Y进行对照，如果提出相应异议问题的可能性大于Y则进行相应的输出，将其作为异议话术。

进一步地，第一阈值的取值范围在0.1-0.3之间，理论取值范围在(0，1)。

步骤208，将至少一个异议话术输入到标注模型中，得到话术预判结果。

进一步地，在将至少一个异议话术输入到标注模型中之前，还包括：

从话术预判图谱中获取历史语料中第一用户的第一话术中的各实体关键词与第二文本集中各第二文本的实体关键词的关联跳数，其中，第二文本集为文本位置在各第一问题后的第二文本的集合；将关联跳数输入到训练后的基于NN神经网络的标注模型中，得到话术预判结果。

具体地，话术预判图谱是基于历史语料得到的实体关键词网络图谱，用于标识第一用户的话术与第二用户话术中的实体关键词之间的关联关系。

将历史语料中第一用户的第一话术中的实体关键词与第二文本集中各第二文本的实体关键词，在话术预判图谱中的关联跳数作为一个特征F。例如，第一用户的第一话术中关键词是(保险、重疾险、家庭，……)，与第二文本集中的第二文本的关键词(保险、财产、规划，……)，则该特征F为(保险-保险，0；保险-财产，2；……)。

其中，0和2指对应的实体关键词之间的关联跳数，关联跳数是指在话术预判图谱中最少通过几个边可以建立两个点(实体关键词)之间的连接。

具体地，标注模型的训练步骤为：将关联跳数经过至少4层NN神经网络，并通过优化器算法，利用返回模式优化各NN神经网络中的参数直到收敛，得到训练后的标注模型。

具体地，构建特征：将每个第一话术中实体关键词与第二文本中关键词在话术预判图谱中的关联跳数进行拼接组成向量。人工标注结果作为标签：对第一话术与对应的第二文本集中的文本是否属于较恰当的回复进行评判，标注为1表明恰当，标注为0表明不恰当。

特征输入网络：以上述特征输入到4层NN神经网络，使用SGD优化器利用反馈模式优化神经网络中的参数直到训练收敛，最终得到最优的标注模型。

使用：使用过程中对新输入的第一话术和第二文本集以相同的方式构建特征，输入到训练好的神经网络中，得到话术是否恰当的似然度，从而选择最高似然度的话术进行输出。

在一些实施例中，本申请的训练是指，将该特征F输入到NN神经网络中，然后不断调整网络参数，直到收敛，得到训练后的标注模型。通过该方式，对每个输出的异议问题在对应的后向话术集BS中搜寻最适合的话术，以用于提示第一用户。

进一步地，在训练标注模型之前，还需要构建预判图谱，包括：

基于各第一问题、第一文本集和第二文本集，通过远程监督算法建立基于历史语料的历史领域图谱；将历史领域图谱与通用领域图谱结合得到话术预判图谱，其中，话术预判图谱中包括多个试图关键词之间的关联跳数。

具体地，通过大量的历史语料，使用远程监督的方式建立针对历史会话的领域图谱，并与外部通用图谱相结合形成新的综合知识图谱G。该综合知识图谱G即话术预判图谱，该话术预判图谱中主要包含常见关键实体词之间的关联关系，或者关联跳数。

其中，外部通用图谱，即通用领域图谱是指使用的XLORE通用常识图谱，XLORE通用常识图谱是对所有通用知识的涵盖，对应的业务领域的历史领域图谱是针对当前场景的知识的图谱；将二者结合后，可以在通用知识和专业知识两方面都有所包含。

关联关系是指词汇之间的语义关联，譬如“微软”和“联想”之间有直接的语义关联，所以二者的关联跳数可以是0；而“烤鸭”和“联想”没有语义关联，甚至需要许多中间的实体关键词才能使二者之间具备关联关系。

具体地，提取各第一问题、各文本中的实体关键词，然后提取各问题各文本对应的实体关键词，并以各实体关键词为节点，根据关联关系将各第一问题、第一文本集和第二文本集中的文本进行连接，得到基于历史语料的历史领域图谱。

综上，当第一用户输入第一话术为：“保险其实可以防范生活中的大多数意外”，服务端通过前向向量矩阵计算关联到，第二用户可能的异议问题a“我已经有社保了，还需要购买么？”，问题b“我还需要和家人商量一下？”，然后服务端针对问题a，根据后向话术的关联为第一用户找到“商业保险和社保可以互为补充，这样才会保障全面”，针对问题b，找到“您的保障意识会帮助到家庭，也一定会得到家人的支持。”的话术预判结果。让第一用户可以提前根据提醒决定相应的话术引导方向，达到更好的与人交谈的目的。

可选地，当本申请的技术方案应用到实时聊天场景中，例如微信或者qq聊天场景中，或者淘宝购物旺旺聊天场景中，本申请的技术方案可以应用于系统输入法上，也可以应用于第三方输入法上，还可以应用于第三方AI聊天辅助工具中。具体的，以应用于输入法上为例进行说明：

当第一用户输入第一话术，输入法得到用户授权检测到该第一话术，则通过话术转化器将该第一话术转化为第一话术向量，并基于前向矩阵得到与第一用户聊天的第二用户可能根据第一话术会回复的第二话术，该第二话术可以是多个，每一个第二话术都不一样，且有第二用户回复各第二话术的话术概率；然后根据第一阈值从第二话术中获取异议话术，并将得到的至少一个异议话术输入到训练后的标注模型中，得到话术预判结果。该话术预判结果即第一用户根据第二用户可能的异议回复做出的对应的回复的参考话术。通过这种话术预判方式，可以提前预判对方可能回复话术，并为第一用户，即当前用户推荐根据该回复话术对应的至少一个话术预判结果作为参考。

需要强调的是，为进一步保证上述用户信息的私密和安全性，上述话术数据信息还可以存储于一区块链的节点中。

上述实时话术预判方法中，通过在接收到当前的第一用户的第一话术后，根据前向矩阵得到至少一个第二用户根据第一话术发送的第二话术的话术概率，并根据该话术概率确定第二用户最有可能回复的第二话术，作为异议话术输入到训练后的标注模型中，得到最终的话术预判结果发送给第一用户进行参考。本申请采用文本向量的转化、矩阵关联、知识图谱的融合和应用等技术，将AI辅助人工对话的能力从简单的被动提示扩展到主动的引导，提前一步洞察第二用户的潜在问题，并可以及时提供最优质量的话术作为参考，通过本申请的技术方案改进之后的对话系统，特别是电话销售辅助系统具备优秀的异议问题预判和话题主动引导的能力解决了现有技术中无法对第二用户的问题进行预判的技术问题。

应该理解的是，虽然图2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图3所示，提供了一种实时话术预判装置，该实时话术预判装置与上述实施例中实时话术预判方法一一对应。该实时话术预判装置包括：

转化模块302，用于若接收到第一用户的第一话术，通过话术转换器将所述第一话术转化为第一话术向量；

计算模块304，用于基于前向矩阵得到至少一个第二用户根据所述第一话术发送的第二话术的话术概率，其中，所述前向矩阵为根据历史语料中第二用户的各第一问题的第一文本集聚类得到的向量集，所述第一文本集为文本位置在各所述第一问题前的第一文本的集合；

排序模块306，用于根据所述话术概率对至少一个所述第二话术排序，将话术概率大于第一阈值的第二话术作为异议话术；以及

预判模块308，用于将至少一个异议话术输入到标注模型中，得到话术预判结果。

进一步地，在转化模块302之前，还包括：

语料获取模块，用于获取历史语料，其中，所述历史语料包括第一用户与第二用户的对话数据；

转化器训练模块，用于基于所述历史语料，通过tf-idf算法训练得到基于词频的文本转向量的话术转化器。

进一步地，转化器训练模块，包括：

分词子模块，用于对所述历史语料进行分词处理，得到多个分词文本；

词频计算子模块，用于计算各所述分词文本在所述历史语料中的第一词频，得到第一词频字典；并

特征构建子模块，用于基于所述第一词频字典，计算所述历史语料中各句子文本中各分词文本的TF-IDF值，作为第一词频特征；

转化器构造子模块，用于基于所述第一词频字典和所述第一词频特征的特征生成算法，构造得到基于所述历史语料的稀疏矩阵，作为所述话术转化器。

进一步地，在计算模块304之前，还包括：

集合获取模块，用于从所述历史语料中获取第一问题集合，其中，所述第一问题集合中包括多个所述第一问题；

向量转化模块，用于通过所述话术转化器将各所述第一问题的第一文本集转化为第一文本向量，其中，所述第一文本向量包括各第一文本对应的第一向量；

向量聚类模块，用于根据密度聚类算法对所述第一文本集中的第一向量进行聚类，并计算聚类后包含第一向量最多的向量簇的中心向量，将所述中心向量作为对应的第一向量的前向向量；

矩阵拼接模块，用于拼接所述第一问题的前向向量，得到前向向量集，并将各所述前向向量集拼接后作为所述前向矩阵。

进一步地，在预判模块308之前，还包括：

特征获取模块，用于从话术预判图谱中获取所述历史语料中第一用户的第一话术中的各实体关键词与第二文本集中各第二文本的实体关键词的关联跳数，其中，所述第二文本集为所述文本位置在各所述第一问题后的第二文本的集合；

模型训练模块，用于将所述关联跳数输入到基于NN神经网络的标注模型中，得到训练后的标注模型。

进一步地，模型训练模块，包括：

参数调整子模块，用于将所述关联跳数经过至少4层NN神经网络，并通过优化器算法，利用返回模式优化各所述NN神经网络中的参数直到收敛，得到训练后的标注模型。

进一步地，在特征获取模块，之前，还包括：

第一图谱构建模块，用于基于各所述第一问题、所述第一文本集和所述第二文本集，通过远程监督算法建立基于所述历史语料的历史领域图谱；

第二图谱构建模块，将所述历史领域图谱与通用领域图谱结合得到所述话术预判图谱，其中，所述话术预判图谱中包括多个试图关键词之间的关联跳数。

上述实时话术预判装置，通过在接收到当前的第一用户的第一话术后，根据前向矩阵得到至少一个第二用户根据第一话术发送的第二话术的话术概率，并根据该话术概率确定第二用户最有可能回复的第二话术，作为异议话术输入到训练后的标注模型中，得到最终的话术预判结果发送给第一用户进行参考。本申请采用文本向量的转化、矩阵关联、知识图谱的融合和应用等技术，将AI辅助人工对话的能力从简单的被动提示扩展到主动的引导，提前一步洞察第二用户的潜在问题，并可以及时提供最优质量的话术作为参考，通过本申请的技术方案改进之后的对话系统，特别是电话销售辅助系统具备优秀的异议问题预判和话题主动引导的能力解决了现有技术中无法对第二用户的问题进行预判的技术问题。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储用户的话术数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种实时话术预判方法。

在本实施例，通过在接收到当前的第一用户的第一话术后，根据前向矩阵得到至少一个第二用户根据第一话术发送的第二话术的话术概率，并根据该话术概率确定第二用户最有可能回复的第二话术，作为异议话术输入到训练后的标注模型中，得到最终的话术预判结果发送给第一用户进行参考。本申请采用文本向量的转化、矩阵关联、知识图谱的融合和应用等技术，将AI辅助人工对话的能力从简单的被动提示扩展到主动的引导，提前一步洞察第二用户的潜在问题，并可以及时提供最优质量的话术作为参考，通过本申请的技术方案改进之后的对话系统，特别是电话销售辅助系统具备优秀的异议问题预判和话题主动引导的能力解决了现有技术中无法对第二用户的问题进行预判的技术问题。

其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机可读指令，计算机可读指令被处理器执行时实现上述实施例中实时话术预判方法的步骤，例如图2所示的步骤202至步骤208，或者，处理器执行计算机可读指令时实现上述实施例中实时话术预判装置的各模块/单元的功能，例如图3所示模块302至模块308的功能。

本实施例通过在接收到当前的第一用户的第一话术后，根据前向矩阵得到至少一个第二用户根据第一话术发送的第二话术的话术概率，并根据该话术概率确定第二用户最有可能回复的第二话术，作为异议话术输入到训练后的标注模型中，得到最终的话术预判结果发送给第一用户进行参考。本申请采用文本向量的转化、矩阵关联、知识图谱的融合和应用等技术，将AI辅助人工对话的能力从简单的被动提示扩展到主动的引导，提前一步洞察第二用户的潜在问题，并可以及时提供最优质量的话术作为参考，通过本申请的技术方案改进之后的对话系统，特别是电话销售辅助系统具备优秀的异议问题预判和话题主动引导的能力解决了现有技术中无法对第二用户的问题进行预判的技术问题。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形、改进或者对部分技术特征进行等同替换，而这些修改或者替换，并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴，都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种实时话术预判方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述通过话术转换器将所述第一话术转化为第一话术向量之前，还包括：

获取历史语料，其中，所述历史语料包括第一用户与第二用户的对话数据；

基于所述历史语料，通过tf-idf算法训练得到基于词频的文本转向量的话术转化器。

3.根据权利要求2所述的方法，其特征在于，所述基于所述历史语料，通过tf-idf算法训练得到基于词频的文本转向量的话术转化器，包括：

对所述历史语料进行分词处理，得到多个分词文本；

计算各所述分词文本在所述历史语料中的第一词频，得到第一词频字典；并

基于所述第一词频字典，计算所述历史语料中各句子文本中各分词文本的TF-IDF值，作为第一词频特征；

基于所述第一词频字典和所述第一词频特征的特征生成算法，构造得到基于所述历史语料的稀疏矩阵，作为所述话术转化器。

4.根据权利要求1所述的方法，其特征在于，在所述基于前向矩阵得到至少一个第二用户根据所述第一话术发送的第二话术的话术概率之前，还包括：

从所述历史语料中获取第一问题集合，其中，所述第一问题集合中包括多个所述第一问题；

通过所述话术转化器将各所述第一问题的第一文本集转化为第一文本向量，其中，所述第一文本向量包括各第一文本对应的第一向量；

根据密度聚类算法对所述第一文本集中的第一向量进行聚类，并计算聚类后包含第一向量最多的向量簇的中心向量，将所述中心向量作为对应的第一向量的前向向量；

拼接所述第一问题的前向向量，得到前向向量集，并将各所述前向向量集拼接后作为所述前向矩阵。

5.根据权利要求1所述的方法，其特征在于，在所述将至少一个异议话术输入到标注模型中，得到话术预判结果之前，还包括：

从话术预判图谱中获取所述历史语料中第一用户的第一话术中的各实体关键词与第二文本集中各第二文本的实体关键词的关联跳数，其中，所述第二文本集为所述文本位置在各所述第一问题后的第二文本的集合；

将所述关联跳数输入到基于NN神经网络的标注模型中，得到训练后的标注模型。

6.根据权利要求5所述的方法，其特征在于，所述将所述关联跳数输入到基于NN神经网络的标注模型中，得到训练后的标注模型，包括：

将所述关联跳数经过至少4层NN神经网络，并通过优化器算法，利用返回模式优化各所述NN神经网络中的参数直到收敛，得到训练后的标注模型。

7.根据权利要求5所述的方法，其特征在于，在所述从话术预判图谱中获取所述历史语料中第一用户的第一话术中的各实体关键词与第二文本集中各第二文本的实体关键词的关联跳数之前，还包括：

基于各所述第一问题、所述第一文本集和所述第二文本集，通过远程监督算法建立基于所述历史语料的历史领域图谱；

将所述历史领域图谱与通用领域图谱结合得到所述话术预判图谱，其中，所述话术预判图谱中包括多个试图关键词之间的关联跳数。

8.一种实时话术预判装置，其特征在于，包括：

排序模块，用于根据所述话术概率对至少一个所述第二话术排序，将话术概率大于第一阈值的第二话术作为异议话术；并

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。