CN111339309B - 一种用户意图的语料扩展方法和系统 - Google Patents

一种用户意图的语料扩展方法和系统 Download PDF

Info

Publication number
CN111339309B
CN111339309B CN202010440488.5A CN202010440488A CN111339309B CN 111339309 B CN111339309 B CN 111339309B CN 202010440488 A CN202010440488 A CN 202010440488A CN 111339309 B CN111339309 B CN 111339309B
Authority
CN
China
Prior art keywords
corpus
user
service
utterance
expansion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010440488.5A
Other languages
English (en)
Other versions
CN111339309A (zh
Inventor
金春祥
刘佳
崔恒斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010440488.5A priority Critical patent/CN111339309B/zh
Publication of CN111339309A publication Critical patent/CN111339309A/zh
Application granted granted Critical
Publication of CN111339309B publication Critical patent/CN111339309B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本说明书的实施例公开了一种用户意图的语料扩展方法,该方法包括:获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。

Description

一种用户意图的语料扩展方法和系统
技术领域
本申请涉及数据处理领域,特别涉及一种用户意图的语料扩展方法和系统。
背景技术
随着人工智能的发展,机器可以通过对人类语言进行分析,识别语句的含义,实现人机交互。问答为人机交互的一种典型应用场景,机器需要识别出提用户说的话的意图,才能准确的给出后续的对话。
用户意图可以通过建立自然语言模型来预测。然而,模型的建立需要大量的训练语料,在训练模型的语料数量有限的情况下,需要挖掘更多的用户语料,做数据增强,提升模型对用户意图的识别效果。因此,亟需一种用户意图的语料扩展方法和系统。
发明内容
本说明书一个方面提供一种用户意图的语料扩展方法,所述方法包括:获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
本说明书另一个方面提供一种用户意图的语料扩展系统,所述系统包括:第一获取模块,用于获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;第一确定模块,用于从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;第二确定模块,用于确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;第三确定模块,用于从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
本说明书另一个方面提供一种用户意图的语料扩展装置,包括至少一个存储介质和至少一个处理器;所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现用户意图的语料扩展方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的用户意图的语料扩展系统的示例性应用场景示意图;
图2是根据本说明书一些实施例所示的用户意图的语料扩展方法的示例性示意图;
图3是根据本说明书一些实施例所示的确定第三服务话术方法的示例性示意图;
图4是根据本说明书一些实施例所示的确定目标扩展语料的示例性示意图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是根据本说明书一些实施例所示的用户意图的语料扩展系统的示例性应用场景示意图。
用户意图的语料扩展系统100可以应用于各个服务平台(例如,购物平台等)的智能对话服务中。例如,用户意图的语料扩展系统100可以用于确定智能对话中用户的话所代表的意图,进一步的,根据意图确定后续机器人的对话策略,其中,可以基于系统100扩展的语料和已有的语料训练意图分类模型,确定智能对话中用户的话的意图。示例的,智能外呼场景中,需要运营人员根据业务流程配置多阶段的机器人话术,并为每个阶段的机器人话术配置意图分类模型。
如图1所示,本说明书所涉及的应用场景可以包括网络110、存储设备120、用户终端130和计算系统140。
用户终端130可以是带有数据获取、存储和/或发送功能的设备。在一些实施例中,用户终端130的使用者可以是智能对话中的用户。在一些实施例中,用户终端130可以包括但不限于移动设备130-1、平板电脑130-2、笔记本电脑130-3等或其任意组合。示例性的移动设备130-1可以包括但不限于智能手机、个人数码助理(Personal Digital Assistance,PDA)、掌上游戏机、智能手表、可穿戴设备、虚拟显示设备、显示增强设备等或其任意组合。
在一些实施例中,用户终端130可以将获取到的数据发送至计算系统140。其中,用户终端130获取的数据可以是用户在用户终端130输入的对第一服务话术的回答。在一些实施例中,用户终端130还可以接收计算系统140返回的意图分类结果。例如,计算系统140基于意图分类模型确定输入的用户回答的意图。
计算系统140可用于处理与扩展用户意图的语料过程中相关联的信息和/或数据,或/和用于处理基于意图分类模型确定用户回答的意图过程中相关联的信息和/或数据,来执行在本说明书揭示的一个或者多个功能。在一些实施例中,计算系统140可以基于对话记录中第二服务话术与第一服务话术的相似度,确定第三服务话术;计算系统140可以基于用户意图的用户语料与候选扩展语料的相似度,确定是否将该候选扩展语料作为用户意图的扩展语料。在一些实施例中,计算系统140可以基于第一服务话术对应的用户意图的用户语料训练意图分类模型,也可以基于用户意图的扩展语料更新训练该意图分类模型。在一些实施例中,计算系统140可以基于意图分类模型确定对第一服务话术的用户回答的意图。
在一些实施例中,计算系统140可以包括一个或多个处理引擎(例如,单核心处理引擎或多核心处理器)。仅作为范例,计算系统140可以包括中央处理器(CPU)、特定应用集成电路(ASIC)、专用指令集处理器(ASIP)、图像处理器(GPU)、物理运算处理单元(PPU)、数字信号处理器(DSP)、现场可程序门阵列(FPGA)、可程序逻辑装置(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等中的一种或多种组合。
存储设备120可以存储数据和/或指令。在一些实施例中,存储设备120可以存储对话记录、第一服务话术、第一服务话术的语料库、第一服务话术对应的用户意图或/和第一服务话术对应的用户意图的用户语料等。在一些实施例中,存储设备120可以存储计算系统140生成的数据。例如,第三服务话术、候选扩展语料或意图分类模型参数等。在一些实施例中,存储设备120可以存储供计算系统140执行或使用的数据和/或指令,计算系统140可以通过执行或使用所述数据和/或指令以实现本说明书中的示例性方法。在一些实施例中,存储设备150可以是计算系统140的一部分。在一些实施例中,存储设备120可以包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等或其任意组合。在一些实施例中,存储设备120可以在云平台上实现。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
网络110可以连接系统的各组成部分和/或连接系统与外部资源部分。网络110使得各组成部分之间,以及与系统之外其他部分之间可以进行通讯,促进数据和/或信息的交换。在一些实施例中,网络110可以是有线网络或无线网络中的任意一种或多种。例如,网络110可以包括电缆网络、光纤网络、电信网络、互联网、局域网络(LAN)、广域网络(WAN)、无线局域网络(WLAN)等或其任意组合。各部分之间的网络连接可以是采用上述一种方式,也可以是采取多种方式。在一些实施例中,网络可以是点对点的、共享的、中心式的等各种拓扑结构或者多种拓扑结构的组合。在一些实施例中,网络110可以包括一个或以上网络接入点。例如,网络110可以包括有线或无线网络接入点,例如基站和/或网络交换点110-1、110-2、…,通过这些进出点系统100的一个或多个组件可连接到网络110上以交换数据和/或信息。
在一些实施例中,该计算系统110中可以包括第一获取模块、第一确定模块、第二确定模块以及第三确定模块。
第一获取模块,可以用于获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图。更多细节可以参见步骤202,此处不再赘述。
第一确定模块,可以用于从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术。所述第二服务话术为对话记录中的服务话术。更多细节可以参见步骤204,此处不再赘述。
第二确定模块,可以用于确定至少一条候选扩展语料。所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语。更多细节可以参见步骤206,此处不再赘述。
第三确定模块,可以用于从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。更多细节可以参见步骤208和图4的相关说明,此处不再赘述。
在一些实施例中,第一确定模块还可以用于基于第一编码模型对所述第一服务话术,以及所述至少一条第二服务话术进行向量表示;计算所述第一服务话术的向量与所述第二服务话术的向量之间的第一距离;将所述第一距离小于第一阈值的第二服务话术作为所述第三服务话术。更多细节可以参见图3相关说明,此处不再赘述。
在一些实施例中,第三确定模块还可以用于获取所述用户意图的至少一条用户语料;将与所述至少一条用户语料的相似度满足第二预设条件的候选扩展语料,作为所述目标扩展语料。更多细节可以参见步骤208和图4的相关说明,此处不再赘述。
在一些实施例中,第三确定模块还可以用于基于第二编码模型对所述至少一条用户语料,以及所述至少一条候选扩展语料进行向量表示;判断所述至少一条用户语料中是否存在与所述候选扩展语料的向量距离小于第二阈值的语料;是则将所述候选扩展语料作为所述目标扩展语料。更多细节可以参见图4相关说明,此处不再赘述。
在一些实施例中,第一确定模块还可以用于通过匹配模型,确定所述第一服务话术和所述第二服务话术之间的相似度,或/和,所述第三确定模块还可以用于:通过所述匹配模型,确定所述用户语料和所述候选扩展语料之间的相似度。更多细节可以参见图2和图4相关说明,此处不再赘述。
在一些实施例中,计算系统110中还可以包括第二获取模块和第四确定模块。
第二获取模块,可以用于获取用户对所述第一服务话术的回答话语。
第四确定模块,可以用于将所述回答话语输入意图分类模型,确定所述用户的意图;所述意图分类模型基于所述至少一条用户语料和/或所述至少一条目标扩展语料训练得到。更多细节可以参见步骤208,此处不再赘述。
图2是根据本说明书一些实施例所示的用户意图的语料扩展方法的示例性示意图。如图2所示,该用户意图的语料扩展方法200可以包括:
步骤202,获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图。具体地,该步骤202可以由第一获取模块执行。
第一服务话术可以是人机对话中智能机器人说的话。例如,智能机器人询问用户“请问您是在购买商品吗”为第一服务话术。
用户意图可以是指回答第一服务话术的话语所代表的意图,意图可以理解为回答的话语所想要表达的想法。例如,沿用上述示例,若回答的话语为“我在买手机”,则对应的用户意图可以为“购买商品”。又例如,若回答的话语为“我在给别人转账”,则对应的用户意图可以为“转账”。
同一个用户意图用户可以通过多种话语表达。例如,表达用户意图“购买商品”可以是:话语“我在买东西”、话语“我在买手机”、话语“我在买口罩”等。其中,可以将表达用户意图的话语称为该用户意图的用户语料。
可以理解,用户意图和第一服务话术之间存在对应关系,不同的第一服务话术,对应的用户意图可以存在差异。例如,若第一服务话术为“请问您是在购买商品吗”,对应的用户意图可以是“购买商品”和“转账”等;若第一服务话术为“请问您现在有时间吗”,对应的用户意图可以是“有时间”、“忙”等。
第一服务话术对应至少一个用户意图,一个用户意图至少对应一条用户语料。在一些实施例中,可以基于第一服务话术对应的所有用户意图和所有用户意图对应的所有用户语料,建立语料库,该语料库中包含多条用户语料,且每条用户语料包含其代表的用户意图标签。
在一些实施例中,可以基于语料库,确定回答第一服务话术的话语的用户意图。例如,基于语料库训练多标签分类模型,将训练好的分类模型命名为意图分类模型,该意图分类模型可以预测回答第一服务话术的话语的意图,具体的,将回答的话语输入意图分类模型,输出该回答的话语的意图。又例如,可以将回答的话语与语料库中的语料进行匹配,将匹配的用户语料的用户意图作为回答话语的用户意图。可以理解,不同的第一服务话术可以存在对应的语料库或意图分类模型。
在一些实施例中,意图分类模型可以为常见的分类模型,例如,神经网络、逻辑回归,决策树,随机森林,梯度提升树,支持向量机,朴素贝叶斯等。
在一些实施例中,第一获取模块可以直接从数据库(例如,存储设备120中)读取第一服务话术和用户意图,也可以通过调用相关接口或其他方式获取第一服务话术和用户意图。
步骤204,从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术。具体地,该步骤204可以由第一确定模块执行。
第二服务话术可以是指对话记录中客服说的话。对话记录是已经发生的客服与用户的对话,对话记录可以来自于历史服务日志,也可以通过模拟实现的对话得到。其中,客服可以是机器人客服或人工客服,用户可以是真实的用户,也可以是模拟的用户。
在一些实施例中,第一确定模块可以从对话记录中直接提取得到第二服务话术。
第三服务话术是指与第一服务话术的相似度满足第一预设条件的第二服务话术。第一预设条件可以是相似度大于预设阈值等,也可以是相似度排名Top N,即,在所有第二服务话术和第一服务话术的相似度中,排名Top N。
在一些实施例中,第一服务话术和第二服务话术的相似度可以通过语义相似度或/和关键词匹配程度等衡量。其中,语义相似度可以通过第一服务话术和第二服务话术的向量距离衡量。关于基于向量距离确定第一服务话术和第二服务话术的相似度以及确定第三服务话术的更多细节参见图3及其相关描述,此处不再赘述。
在一些实施例中,第一确定模块可以通过匹配模型,确定第一服务话术和第二服务话术之间的相似度。具体地,匹配模型的输入可以是第一服务话术和第二服务话术组成的文本对,输出可以是第一服务话术和第二服务话术的相似度。
在一些实施例中,匹配模型可以对输入的文本对进行向量表示,并基于向量确定相似度。在一些实施例中,匹配模型可以采用神经网络模型,例如,Bi-LSTM、BERT、textCNN等。示例地,匹配模型可以使用BERT模型。BERT模型的输入可以是第一服务话术和第二服务话术构成的文本对,输出可以是第一服务话术和第二服务话术的相似度。在一些实施例中,第一服务话术和第二服务话术的文本对可以通过如下方式获取:在第一服务话术和第二服务话术之间添加分隔符[SEP],以区分第一服务话术和第二服务话术;在拼接后第一服务话术和第二服务话术之前添加[CLS],表示文本对的特征向量的输出位置。例如,基于第一服务话术“请问您是在购买商品吗”和第二服务话术“请问您在购买商品还是转账”,获取的文本对为“[CLS]请问您是在购买商品吗[SEP]请问您在购买商品还是转账”。具体地,BERT模型先基于文本对分别得到对应的文本对向量和位置向量,再将文本对向量和位置向量拼接得到输入向量。进一步地,BERT模型基于Transformers的双向编码器,可以对输入向量进行编码,基于在[CLS]位置输出的向量得到第一服务话术和第二服务话术的相似度。
在一些实施例中,匹配模型还可以是由文本编码模型和相似度计算模型组成。其中,相似度计算模型可以是逻辑回归模型(例如,全连接层等)、ESIM(Enhanced SequentialInference Model),文本编码模型可以BiLSTM、Transformer或其它文本编码模型。
可以理解,若至少一条第二服务话术中,有多条第二服务话术与第一服务话术之间的相似度满足第一预设条件,则可以确定多个第三服务话术。
步骤206,确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语。具体地,该步骤206可以由第二确定模块执行。
候选扩展语料可以是指对话记录中用户回答第三服务话术的话语。
在一些实施例中,第二确定模块可以从对话记录中直接提取用户回答第三服务话术的话语作为候选扩展语料,即,直接提取紧随第三服务话术后面的用户说的话即可。
如前所述,第三服务话术可以是多个,因此,候选扩展语料也可以是多个。而且,客服可以使用同一条第三服务话术与多个用户对话,因此,包含第三服务话术的对话记录可以有多个,回答第三服务话术的话语也可以有多个,即候选扩展语料可以是多个。
步骤208,从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。具体地,该步骤208可以由第三确定模块执行。
目标扩展语料可以是所代表的意图与用户意图相同或相近的话语。目标扩展语料能够作为用户意图的扩展语料,用户意图的扩展语料是指除了用户意图已有的用户语料外,其他的用户语料,换言之,是指除了已有的用于表达用户意图的话语外,新的可以表达用户意图的话语。可以理解,扩展语料可以在已有话语基础上,增强对用户意图的表达。
在一些实施例中,目标扩展语料从候选扩展语料中确定,即,将意图与用户意图相同或相近的候选扩展语料作为目标扩展语料。例如,候选扩展语料包括“我在买东西”和“我在买手机”,前者表达的意图为“购买商品”,后者表达的意图为“购买手机”,前者的意图与用户意图相同,后者的意图与用户意图相近,因此,候选扩展语料“我在买东西”和“我在买手机”均为目标扩展语料,可以作为用户意图“购买商品”的扩展语料。
如前所述,一个用户意图至少对应一条用户语料,在一些实施例中,第三确定模块可以将与用户意图的至少一条用户语料的相似度满足第二预设条件的候选扩展语料,作为目标扩展语料。例如,只要有一条用户语料与候选扩展语料的相似度满足第二预设条件,则可以将候选扩展语料作为目标扩展语料。第二预设条件可以是相似度大于预设阈值等。
在一些实施例中,相似度可以通过关键词匹配程度或/和语义相似度衡量。其中,语义相似度可以通过用户语料和候选扩展语料的向量距离衡量。关于基于向量距离确定用户语料和候选扩展语料的相似度更多细节可以参见图4及其相关描述,此处不再赘述。
在一些实施例中,第三确定模块可以通过匹配模型来确定用户语料与候选扩展语料的相似度。匹配模型的具体内容参加步骤204,此处不再赘述。
本实施例通过两个匹配阶段确定用户意图的扩展语料,具体的,先对将机器人说的话(第一服务话术)和对话记录中的客服说的话(第二服务话术)进行匹配,得到与机器人说的话表达相似的话(第三服务话术),并将对该相似的话(第三服务话术)的用户回复作为候选扩展语料,进一步地,基于用户意图的用户语料,确定该候选扩展语料是否为用户意图的扩展语料。可以理解,上述方式通过第一个阶段可以筛选需要与用户语料进行匹配的用户回复。该筛选一方面可以减少后续匹配的量,降低运营人员审核的工作量;另一方面,同时因为筛选后的用户回复和用户语料均是对相似或相同的客服的话的回答,因此可以提高用户意图语料扩展的准确率,间接地提升了意图分类模型的准确率。
例如,第一服务话术为“请问您愿意支付这笔公益基金吗”,用户意图为“愿意”,用户意图的用户语料包含“我愿意”。若在不进行上述筛选的情况下,语料“我愿意去”因为与“我愿意”相似度很高,则会将“我愿意去”作为该第一服务话术对应的用户意图“愿意”的扩展语料;若进行了上述筛选的情况,即,因为“我愿意去”是对第二服务话术“请问您明天愿意去公园吗”的回答,该第二服务话术与第一服务话术的语义不相似,因此,“我愿意去”不会成为候选扩展语料,也不可能成为用户意图“愿意”的扩展语料。
在一些实施例中,确定了目标扩展语料之后,可以将目标扩展语料作为用户意图的扩展语料,换言之,将目标扩展语料作为用户意图新的用户语料。
如步骤202所述,第一服务话术存在对应的语料库或意图分类模型,当确定了目标扩展语料之后,可以将目标扩展语料添加至第一服务话术的语料库,更新该语料库。其中,目标扩展语料的标签为其扩展的用户意图。例如,目标扩展语料“购买手机”的标签为“购买商品”。
进一步地,基于更新后的语料库,可以确定回答第一服务话术的话语的意图。例如,基于更新后的语料库训练得到意图分类模型(关于意图分类模型的更多细节参见步骤202),并基于意图分类模型,确定回答的话语的意图。因为更新后的语料库中,对于被扩展的用户意图而言,其用户语料更丰富,换言之,表达该用户意图的话语或方式更多,则训练得到的意图分类模型分类效果更好,确定回答的话语的意图更准确。
图3是根据本说明书一些实施例所示的确定第三服务话术方法的示例性示意图。如图3所示,确定第三服务话术的方法300可以包括:
步骤302,基于第一编码模型对所述第一服务话术,以及所述至少一条第二服务话术进行向量表示。具体地,该步骤302可以由第一确定模块执行。
在一些实施例中,第一编码模型31可以是机器学习模型,用于对输入的话术进行编码,生成该话术的向量。
在一些实施例中,第一编码模型的输入为第一服务话术或第二服务话术,输出为所述第一服务话术或第二服务话术的向量。如图3所示,将第一服务话术1输入至第一编码模型编码后可以得到第一服务话术的向量1’;将第二服务话术2-1输入至第一编码模型编码后可以得到第二服务话术2-1的向量2-1’;将第二服务话术2-n输入至第一编码模型编码后可以得到第二服务话术2-n的向量2-n’。
关于第一服务话术和第二服务话术的更多细节,可以参见图2及其相关描述。
在一些实施例中,第一编码模型可以是BERT模型、LSTM(Long-Short TermMemory,长短记忆网络)模型或TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆向文件频率)模型等。
步骤304,计算所述第一服务话术的向量与所述第二服务话术的向量之间的第一距离。具体地,该步骤304可以由第一确定模块执行。
第一距离可以是指第一服务话术的向量与第二服务话术的向量之间距离。距离与相似度负相关,距离越小,相似度越大。
在一些实施例中,距离可以是欧式距离、余弦距离、切比雪夫距离或曼哈顿距离等,相应的,不同类型的距离可以通过对应的距离算法公式计算得到。
在一些实施例中,距离还可以通过机器学习模型确定,例如,逻辑回归模型或相似度计算模型(如ESIM)等。该模型的训练样本是不同文本对的向量表示,标签代表文本对的相似度或是否相似。
如图3所示,基于第一服务话术的向量1’和第二服务话术2-1的向量2-1’可以得到第一距离1,基于第一服务话术的向量1’和第二服务话术的向量2-n’可以得到第一距离n。
步骤306,将所述第一距离小于第一阈值的第二服务话术作为所述第三服务话术。具体地,该步骤306可以由第一确定模块执行。
该过程是一个判断过程,判断第一距离与第一阈值的大小,进一步胸第二服务话术中确定第三服务话术。
在一些实施例中,第一阈值可以是设定的值,该阈值可以自定义。例如,第一阈值可以是0.2、0.15、0.1、0.05等。
如图3所示,若第一距离1小于第一阈值,则可以将第二服务话术2-1作为所述第三服务话术。
关于第三服务话术的更多细节,可以参见步骤204中的相关描述,此处不再赘述。
图4是根据本说明书一些实施例所示的确定目标扩展语料的示例性示意图。如图4所示,所述确定目标扩展语料的方法400可以包括:
步骤402,基于第二编码模型对所述至少一条用户语料,以及所述至少一条候选扩展语料进行向量表示。具体地,该步骤402可以由第三确定模块执行。
在一些实施例中,第二编码模型41可以是机器学习模型,用于对输入的语料进行编码,生成该语料的向量。
在一些实施例中,第二编码模型的输入为用户语料或候选扩展语料,输出为所述用户语料的向量或候选扩展语料的向量。
关于用户语料和候选扩展语料的更多细节,可以参见图2及其相关描述。
在一些实施例中,第二编码模型的类型可以与第一编码模型的相同或不同,编码模型的类型具体可以参见图3及其相关描述。在一些实施例中,第一编码模型和第二编码模型可以共用一个编码模型。
步骤404,判断所述至少一条用户语料中是否存在与所述候选扩展语料的向量距离小于第二阈值的语料。具体地,该步骤404可以由第三确定模块执行。
在一些实施例中,第三确定模块可以基于第二编码模型输出的用户语料的向量和候选扩展语料的向量,计算两个向量之间的向量距离,进一步地,判断用户意图的至少一条用户语料中,是否存在与候选扩展语料的向量距离小于第二阈值的用户语料,若存在,则进入步骤406,即,将该候选扩展语料作为目标扩展语料。其中,关于向量距离参见图3及其相关描述,此处不在赘述。
第二阈值可以是设定的值,可以自定义。例如,第二阈值可以是0.2、0.15、0.1、0.05等。
步骤406,将所述候选扩展语料作为所述目标扩展语料。具体地,该步骤406可以由第三确定模块执行。
例如,假设候选扩展语料1与用户意图的用户语料Y1的向量距离小于第二阈值,则可以将候选扩展语料1作为目标扩展语料,换言之,将候选扩展语料1作为该用户意图的扩展语料。进一步的,可以将候选扩展语料1加入语料库中,且候选扩展语料1的标签为该用户意图。
本说明书实施例还提供一种用户意图的语料扩展装置,包括至少一个存储介质和至少一个处理器;所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现用户意图的语料扩展方法。所述方法可以包括:获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran2003、Perl、COBOL2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的处理设备或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims (13)

1.一种用户意图的语料扩展方法,包括:
获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图,所述第一服务话术是人机对话中智能机器人说的话;
从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术是对话记录中客服说的话;
确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;
从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
2.如权利要求1所述的方法,所述从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,包括:
获取所述用户意图的至少一条用户语料;
将与所述至少一条用户语料的相似度满足第二预设条件的候选扩展语料,作为所述目标扩展语料。
3.如权利要求1所述的方法,所述从至少一条第二服务话术中,确定与所述第一服务话术之间的相似度满足第一预设条件的至少一条第三服务话术,包括:
基于第一编码模型对所述第一服务话术,以及所述至少一条第二服务话术进行向量表示;
计算所述第一服务话术的向量与所述第二服务话术的向量之间的第一距离;
将所述第一距离小于第一阈值的第二服务话术作为所述第三服务话术。
4.如权利要求2所述的方法,所述将与所述至少一条用户语料的相似度满足第二预设条件的候选扩展语料,作为所述目标扩展语料,包括:
基于第二编码模型对所述至少一条用户语料,以及所述至少一条候选扩展语料进行向量表示;
判断所述至少一条用户语料中是否存在与所述候选扩展语料的向量距离小于第二阈值的语料;
是则将所述候选扩展语料作为所述目标扩展语料。
5.如权利要求2所述的方法,通过匹配模型,确定所述第一服务话术和所述第二服务话术之间的相似度,或/和确定所述用户语料和所述候选扩展语料之间的相似度。
6.如权利要求2所述的方法,所述方法还包括:
获取用户对所述第一服务话术的回答话语;
将所述回答话语输入意图分类模型,确定所述用户的意图;所述意图分类模型基于所述至少一条用户语料和/或所述至少一条目标扩展语料训练得到。
7.一种用户意图的语料扩展系统,包括:
第一获取模块,用于获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图,所述第一服务话术是人机对话中智能机器人说的话;
第一确定模块,用于从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术是对话记录中客服说的话;
第二确定模块,用于确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;
第三确定模块,用于从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
8.如权利要求7所述的系统,所述第三确定模块还用于:
获取所述用户意图的至少一条用户语料;
将与所述至少一条用户语料的相似度满足第二预设条件的候选扩展语料,作为所述目标扩展语料。
9.如权利要求7所述的系统,所述第一确定模块还用于:
基于第一编码模型对所述第一服务话术,以及所述至少一条第二服务话术进行向量表示;
计算所述第一服务话术的向量与所述第二服务话术的向量之间的第一距离;
将所述第一距离小于第一阈值的第二服务话术作为所述第三服务话术。
10.如权利要求8所述的系统,所述第三确定模块还用于:
基于第二编码模型对所述至少一条用户语料,以及所述至少一条候选扩展语料进行向量表示;
判断所述至少一条用户语料中是否存在与所述候选扩展语料的向量距离小于第二阈值的语料;
是则将所述候选扩展语料作为所述目标扩展语料。
11.如权利要求8所述的系统,所述第一确定模块还用于:通过匹配模型,确定所述第一服务话术和所述第二服务话术之间的相似度;或/和
所述第三确定模块还用于:通过所述匹配模型,确定所述用户语料和所述候选扩展语料之间的相似度。
12.如权利要求8所述的系统,所述系统还包括:
第二获取模块,用于获取用户对所述第一服务话术的回答话语;
第四确定模块,用于将所述回答话语输入意图分类模型,确定所述用户的意图;所述意图分类模型基于所述至少一条用户语料和/或所述至少一条目标扩展语料训练得到。
13.一种用户意图的语料扩展装置,包括至少一个存储介质和至少一个处理器,所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现如权利要求1~6任一项所述的方法。
CN202010440488.5A 2020-05-22 2020-05-22 一种用户意图的语料扩展方法和系统 Active CN111339309B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010440488.5A CN111339309B (zh) 2020-05-22 2020-05-22 一种用户意图的语料扩展方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010440488.5A CN111339309B (zh) 2020-05-22 2020-05-22 一种用户意图的语料扩展方法和系统

Publications (2)

Publication Number Publication Date
CN111339309A CN111339309A (zh) 2020-06-26
CN111339309B true CN111339309B (zh) 2020-09-04

Family

ID=71183013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010440488.5A Active CN111339309B (zh) 2020-05-22 2020-05-22 一种用户意图的语料扩展方法和系统

Country Status (1)

Country Link
CN (1) CN111339309B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256855B (zh) * 2020-11-13 2023-06-27 泰康保险集团股份有限公司 用户意图的识别方法和装置
CN112527989A (zh) * 2020-12-15 2021-03-19 深圳市优必选科技股份有限公司 一种训练方法、训练装置及智能设备
CN113539245B (zh) * 2021-07-05 2024-03-15 思必驰科技股份有限公司 语言模型自动训练方法及系统
US11803778B2 (en) * 2021-08-04 2023-10-31 Watsco Ventures Llc Actionable alerting and diagnostic system for water metering systems

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951428A (zh) * 2014-03-26 2015-09-30 阿里巴巴集团控股有限公司 用户意图识别方法及装置
CN106503175A (zh) * 2016-11-01 2017-03-15 上海智臻智能网络科技股份有限公司 相似文本的查询、问题扩展方法、装置及机器人
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN110188204A (zh) * 2019-06-11 2019-08-30 腾讯科技(深圳)有限公司 一种扩展语料挖掘方法、装置、服务器及存储介质
CN110457475A (zh) * 2019-07-25 2019-11-15 阿里巴巴集团控股有限公司 一种用于文本分类体系构建和标注语料扩充的方法和系统
CN111061847A (zh) * 2019-11-22 2020-04-24 中国南方电网有限责任公司 对话生成及语料扩充方法、装置、计算机设备和存储介质
CN111125323A (zh) * 2019-11-21 2020-05-08 腾讯科技(深圳)有限公司 一种聊天语料标注方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951428A (zh) * 2014-03-26 2015-09-30 阿里巴巴集团控股有限公司 用户意图识别方法及装置
CN106503175A (zh) * 2016-11-01 2017-03-15 上海智臻智能网络科技股份有限公司 相似文本的查询、问题扩展方法、装置及机器人
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN110188204A (zh) * 2019-06-11 2019-08-30 腾讯科技(深圳)有限公司 一种扩展语料挖掘方法、装置、服务器及存储介质
CN110457475A (zh) * 2019-07-25 2019-11-15 阿里巴巴集团控股有限公司 一种用于文本分类体系构建和标注语料扩充的方法和系统
CN111125323A (zh) * 2019-11-21 2020-05-08 腾讯科技(深圳)有限公司 一种聊天语料标注方法、装置、电子设备及存储介质
CN111061847A (zh) * 2019-11-22 2020-04-24 中国南方电网有限责任公司 对话生成及语料扩充方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111339309A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN111339309B (zh) 一种用户意图的语料扩展方法和系统
CN110704641B (zh) 一种万级意图分类方法、装置、存储介质及电子设备
CN111212190B (zh) 一种基于话术策略管理的对话管理方法、装置和系统
CN110990547B (zh) 一种话术生成方法和系统
CN111428010B (zh) 人机智能问答的方法和装置
CN111160514B (zh) 一种对话的方法和系统
CN111582500A (zh) 一种提高模型训练效果的方法和系统
CN113094481A (zh) 意图识别方法、装置、电子设备及计算机可读存储介质
CN111950295A (zh) 一种训练自然语言处理模型的方法和系统
CN111309887A (zh) 一种训练文本关键内容提取模型的方法和系统
CN110019304A (zh) 扩展问答知识库的方法及存储介质、终端
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质
CN115510194A (zh) 问答语句检索方法、装置、电子设备及存储介质
CN110489730A (zh) 文本处理方法、装置、终端及存储介质
CN111353290B (zh) 一种自动响应用户询问的方法和系统
CN113420136A (zh) 一种对话方法、系统、电子设备、存储介质和程序产品
CN117520497A (zh) 大模型交互处理方法、系统、终端、设备及介质
CN117520498A (zh) 基于虚拟数字人交互处理方法、系统、终端、设备及介质
CN116561284A (zh) 智能应答方法、装置、电子设备及介质
CN111651582B (zh) 一种模拟用户发言的方法和系统
CN114398868A (zh) 基于意图识别的人机对话方法、装置、设备及存储介质
CN114546326A (zh) 一种虚拟人手语生成方法和系统
CN113688222A (zh) 基于上下文语义理解的保险销售任务话术推荐方法、系统以及设备
CN111914077A (zh) 定制化话术推荐方法、装置、计算机设备及存储介质
CN111414468A (zh) 话术选择方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant