CN112559697A - 识别话术意图的方法和装置 - Google Patents

识别话术意图的方法和装置 Download PDF

Info

Publication number
CN112559697A
CN112559697A CN201910919908.5A CN201910919908A CN112559697A CN 112559697 A CN112559697 A CN 112559697A CN 201910919908 A CN201910919908 A CN 201910919908A CN 112559697 A CN112559697 A CN 112559697A
Authority
CN
China
Prior art keywords
dialect
user
dialogs
intervention
speaking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910919908.5A
Other languages
English (en)
Inventor
高志群
赵喆子健
王世强
曾兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201910919908.5A priority Critical patent/CN112559697A/zh
Publication of CN112559697A publication Critical patent/CN112559697A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种识别话术意图的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从干预话术集为用户话术匹配干预话术,并计算用户话术与匹配的干预话术的话术相似度;若话术相似度大于干预阈值,则根据匹配的干预话术的话术规则识别用户话术的话术意图;若话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别用户话术的话术意图;根据识别的话术意图更新干预话术集、模版规则话术集或识别模型。该实施方式能够快速准确地识别话术意图,以及对常用的话术进行快速响应;在实现识别用户话术的同时,对数据进行更新,使数据在迭代的过程中得到充分利用,减少了数据标注工作量。

Description

识别话术意图的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种识别话术意图的方法和装置。
背景技术
随着人工智能技术的发展,人机对话系统已经成为人工智能领域研究的一个关键技术。站在用户的角度,按照对话系统的指引,完成特定领域预先设定的任务,可以降低沟通成本,提升购物体验。站在京东业务的角度,将特定领域的用户行为,总结归纳为一系列的任务。不但可以让用户获得更佳的人机交互体验,还可以节约客服等人力成本。
现有的特定领域意图识别和槽值抽取的办法一般遵循如下流程:
1.应用意图识别方法,识别用户意图;通过预先定义的意图,对用户话术进行识别,并映射到某个预先定义的意图。
2.应用槽值抽取方法,抽取有用槽值;槽值抽取的主要任务是在特定领域和意图的前提下,从用户话术中尽量的抽取预先定义好的信息对应的槽位。即从用户话术中抽取有意义的信息。
3.将意图和槽值交给业务系统,执行业务动作。在正确识别用户意图与槽值抽取的基础上,按照预先定义的业务逻辑执行相应的业务动作。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
1.过度依赖预先定义的意图与槽值,可迭代性差;
2.无法针对识别错误的话术进行快速的反馈。
发明内容
有鉴于此,本发明实施例提供一种识别话术意图的方法和装置,能够快速准确地识别话术意图,以及对常用的话术进行快速响应;在实现识别用户话术的同时,对数据进行更新,使数据在迭代的过程中得到充分利用,减少了数据标注工作量。
为实现上述目的,根据本发明实施例的一个方面,提供了一种识别话术意图的方法。
本发明实施例的一种识别话术意图的方法包括:从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度;若所述话术相似度大于干预阈值,则根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图;若所述话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别所述用户话术的话术意图;根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型。
可选地,从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度,包括:对所述用户话术进行分词,得到话术分词;基于所述话术分词从干预话术集为所述用户话术匹配干预话术;其中,所述干预话术集包括干预话术及其话术规则;计算所述用户话术与匹配的干预话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的干预话术的话术相似度;以及根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图之后,还包括:根据所述匹配的干预话术的话术规则提取所述用户话术的槽值。
可选地,所述识别模型包括意图识别模型和槽值抽取模型,利用模版规则话术集或识别模型识别所述用户话术的话术意图,包括:基于所述话术分词从模版规则话术集为所述用户话术匹配模版规则话术;其中,所述模版规则话术集包括模版规则话术及其话术规则;计算所述用户话术与匹配的模版规则话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的模版规则话术的话术相似度;若所述话术相似度大于模版阈值,则根据所述匹配的模版规则话术的话术规则确定所述用户话术的话术意图,并提取所述用户话术的槽值;若所述话术相似度小于或等于模版阈值,则利用所述意图识别模型确定所述用户话术的话术意图,以及利用所述槽值抽取模型提取所述用户话术的槽值。
可选地,从干预话术集为用户话术匹配干预话术之前,还包括:从历史数据筛选出能够与所述模版规则话术匹配的已知话术,为所述已知话术添加话术标注,并添加到训练数据集;从历史数据筛选出无匹配的所述模版规则话术、且所述识别模型的无法识别的未知话术;若所述未知话术是常见话术,则为所述未知话术设置话术规则,并添加到所述干预话术集;其中,所述话术规则包括话术意图和槽值位置。
可选地,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,包括:从历史数据中获取训练话术,为所述训练话术、所述干预话术和所述模版规则话术添加话术标注,并添加到所述训练数据集;利用所述训练数据集训练学习模型;计算学习模型在测试话术集和所述训练数据集中的准确率和召回率;若所述准确率大于或等于预设准确率且所述召回率大于或等于预设召回率,则通过训练,根据所述学习模型更新所述意图识别模型和所述槽值抽取模型;若所述准确率小于预设准确率或所述召回率小于预设召回率,则重新训练。
可选地,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,还包括:利用通过训练的所述学习模型对添加话术标注的所述未知话术和所述训练话术进行回归测试;将通过测试的所述未知话术和所述训练话术添加到所述测试话术集;基于未通过的所述未知话术和所述训练话术对所述模版规则话术集进行更新。
可选地,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,还包括:利用所述模版规则话术集对所述已知话术进行回归测试;将通过测试的所述已知话术添加到所述测试话术集;将未通过测试的所述已知话术记录为调整话术;基于所述调整话术对所述干预话术集进行更新。
为实现上述目的,根据本发明实施例的另一方面,提供了一种识别话术意图的装置。
本发明实施例的一种识别话术意图的装置包括:匹配单元,用于从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度;第一识别单元,用于若所述话术相似度大于干预阈值,则根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图;第二识别单元,用于若所述话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别所述用户话术的话术意图;更新单元,用于根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型。
可选地,所述匹配单元还用于:对所述用户话术进行分词,得到话术分词;基于所述话术分词从干预话术集为所述用户话术匹配干预话术;其中,所述干预话术集包括干预话术及其话术规则;计算所述用户话术与匹配的干预话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的干预话术的话术相似度;以及所述第一识别单元还用于:根据所述匹配的干预话术的话术规则提取所述用户话术的槽值。
可选地,所述识别模型包括意图识别模型和槽值抽取模型,所述第二识别单元还用于:基于所述话术分词从模版规则话术集为所述用户话术匹配模版规则话术;其中,所述模版规则话术集包括模版规则话术及其话术规则;计算所述用户话术与匹配的模版规则话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的模版规则话术的话术相似度;若所述话术相似度大于模版阈值,则根据所述匹配的模版规则话术的话术规则确定所述用户话术的话术意图,并提取所述用户话术的槽值;若所述话术相似度小于或等于模版阈值,则利用所述意图识别模型确定所述用户话术的话术意图,以及利用所述槽值抽取模型提取所述用户话术的槽值。
可选地,还包括训练单元,用于:从历史数据筛选出能够与所述模版规则话术匹配的已知话术,为所述已知话术添加话术标注,并添加到训练数据集;从历史数据筛选出无匹配的所述模版规则话术、且所述识别模型的无法识别的未知话术;若所述未知话术是常见话术,则为所述未知话术设置话术规则,并添加到所述干预话术集;其中,所述话术规则包括话术意图和槽值位置。
可选地,所述更新单元还用于:从历史数据中获取训练话术,为所述训练话术、所述干预话术和所述模版规则话术添加话术标注,并添加到所述训练数据集;利用所述训练数据集训练学习模型;计算学习模型在测试话术集和所述训练数据集中的准确率和召回率;若所述准确率大于或等于预设准确率且所述召回率大于或等于预设召回率,则通过训练,根据所述学习模型更新所述意图识别模型和所述槽值抽取模型;若所述准确率小于预设准确率或所述召回率小于预设召回率,则重新训练。
可选地,所述更新单元进一步用于:利用通过训练的所述学习模型对添加话术标注的所述未知话术和所述训练话术进行回归测试;将通过测试的所述未知话术和所述训练话术添加到所述测试话术集;基于未通过的所述未知话术和所述训练话术对所述模版规则话术集进行更新。
可选地,所述更新单元进一步用于:利用所述模版规则话术集对所述已知话术进行回归测试;将通过测试的所述已知话术添加到所述测试话术集;将未通过测试的所述已知话术记录为调整话术;基于所述调整话术对所述干预话术集进行更新。
为实现上述目的,根据本发明实施例的又一方面,提供了一种识别话术意图的电子设备。
本发明实施例的一种识别话术意图的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种识别话术意图的方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读存储介质。
本发明实施例的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种识别话术意图的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用从干预话术集为用户话术匹配干预话术,并计算用户话术与匹配的干预话术的话术相似度;若话术相似度大于干预阈值,则根据匹配的干预话术的话术规则识别用户话术的话术意图;若话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别用户话术的话术意图;根据识别的话术意图更新干预话术集、模版规则话术集或识别模型的技术手段,所以克服了过度依赖预先定义的意图与槽值,可迭代性差;无法针对识别错误的话术进行快速的反馈的技术问题,进而达到快速准确地识别话术意图,以及对常用的话术进行快速响应;在实现识别用户话术的同时,对数据进行更新,使数据在迭代的过程中得到充分利用,减少了数据标注工作量的技术效果。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是现有的意图识别和槽值抽取的方法流程;
图2是根据本发明实施例的识别话术意图的方法的主要步骤的示意图;
图3是根据本发明实施例的识别话术意图的方法的实现框架的示意图;
图4是可参考的深度学习训练方法的示意图;
图5是根据本发明实施例的识别话术意图的装置的主要模块的示意图;
图6是本发明实施例可以应用于其中的示例性系统架构图;
图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要指出的是,在不冲突的情况下,本发明的实施例以及实施例中的技术特征可以相互结合。
如图1所示,现有的意图识别和槽值抽取的方法流程包括:
1.应用意图识别方法,识别用户意图;通过预先定义的意图,对用户话术进行识别,并映射到某个预先定义的意图。目前意图识别的主要方法有:基于预先定义词典与模版的规则意图识别;基于统计方法的意图识别;以及基于深度学习的意图识别;例如CNN、LSTM等深度学习方法。
2.应用槽值抽取方法,抽取有用槽值;槽值抽取的主要任务是在特定领域和意图的前提下,从用户话术中尽量的抽取预先定义好的信息对应的槽位。即从用户话术中抽取有意义的信息。例如在购物领域的槽值抽取中,通常抽取品牌和商品。目前主要的方法有:基于预先定义的词典和槽值类型的规则匹配方法;以及基于序列标准的深度学习的方法等。
3.将意图和槽值交给业务系统,执行业务动作;在正确识别用户意图与槽值抽取的基础上,按照预先定义的业务逻辑执行相应的业务动作。例如在购物领域中,用户意图为购物,槽值抽取为手机时,业务系统将会执行购买手机的业务动作。
上述方法存在以下缺点:
1.过度依赖预先定义的意图与槽值,可迭代性差
这种方法需要将特定领域的话术统一进行收集和标注。需要分析师根据以往的工作经验,预先定义意图与槽值。并按照预先定义好的意图与槽值总结相应的规则或者进行深度学习方法的训练。当用户新增意图或槽值类型时,往往无法识别或识别错误。
2.无法针对错误进行快速的反馈
这种方法是的更新往往伴随着数据的回归与重新标注,需要重新定义意图与槽值类型,更新一次的时间往往需要一周甚至更长的时间。对于用户经常说的一些话术,缺少必要的热修复手段。即使有一定的热修复手段,也无法将该修复体现在意图槽值提取方法的迭代的过程中。
在人工智能快速发展和应用的时代背景下。人机交互系统与人们的日常生活越来越紧密,已应用于购物,出行等多个领域。一个好的意图识别与槽值提取方法能够带给用户良好的用户体验,从而方便用户行为,同时节约企业与用户沟通成本。在传统的意图识别与槽值提取流程中,缺少对于识别错误的话术快速响应的方法。同时,方法的迭代需要大量人力、耗费时间。本发明针对传统意图识别与槽值提取的缺点,提出了一种可迭代的特定领域意图识别和槽值提取方法,对于特定领域人机交互系统的开发与迭代具有重要的意义。
为此,本发明提出了一种可迭代的特定领域意图识别及槽值提取通用办法。该通用方法可帮助将一系列的用户行为归纳总结为特定的任务,并随着用户与系统的交互与反馈,不断的进行自我发展与演进。该发明对于提升用户在特定领域的人机交互体验以及对京东降低客服等与客户进行直接沟通相关人力成本都具有重大的意义。
本发明的关键点是提出了一种快速响应和可迭代的意图识别和槽值提取框架。本发明提供了意图与槽值干预录入模块,能够实现对于用户常用话术的快速响应。在深度学习算法意图槽值提取训练模块中,训练数据的来源为三个部分,包括意图槽值标注模块标注的新的数据,规则模版匹配话术暂存模块和意图与槽值干预话术暂存模块的数据。
在训练出一个可用的模型后,本发明采用一种链式更新机制,更新规则模版和意图槽值干预模块,实现了各个模块的迭代,有助于维持服务的轻量化。
本发明通过该迭代-更新机制,实现了数据在快速响应及反馈迭代系统的流转,从而实现了整个意图识别及槽值抽取系统的快速响应和迭代。
本发明提出了一种可迭代的特定领域识别及槽值抽取框架。应用这个框架,能够快速的搭建特定领域的意图识别和槽值抽取服务。并且为该服务提供了快速响应和迭代的解决方法。本发明通过提供人工干预模块,实现对用户高频话术的快速响应,避免了传统模块需要更新服务才能修复问题。此外,在各个模块中,提供了数据暂存功能,能够将数据在迭代的过程中得到充分利用,减少了数据标注工作量。更新模型往往伴随着规则模版和意图与槽值干预的更新,避免了数据膨胀,有利于服务的维护。
图2是根据本发明实施例的识别话术意图的方法的主要步骤的示意图。如图2所示,本发明实施例的识别话术意图的方法主要包括以下步骤:
步骤S201:从干预话术集为用户话术匹配干预话术,并计算用户话术与匹配的干预话术的话术相似度。
干预话术集包括干预话术及其话术规则,干预话术是指无法匹配到模版规则话术且识别模型无法识别的常见话术,每个干预话术对应有固定的话术规则。话术相似度用于衡量用户话术与相关干预话术的相似程度,可以采用欧几里得距离、皮尔逊相关系数、杰卡德系数(Jaccard相似系数)或余弦相似度等计算话术相似度。
为了实现对用户话术进行快速响应,可以采用干预处理的方式对某些特定话术按预设规则进行响应,即在接收到用户话术后,先在干预话术集查询是否存在相似的话术,从而直接干预掉无法匹配到模版规则话术且识别模型无法识别的用户话术。
在本发明实施例中,步骤S201可以通过以下方式实现:对用户话术进行分词,得到话术分词;基于话术分词从干预话术集为用户话术匹配干预话术;其中,干预话术集包括干预话术及其话术规则;计算用户话术与匹配的干预话术的词向量和词频逆文本频率;根据词向量和词频逆文本频率计算用户话术与匹配的干预话术的话术相似度。
在计算话术相似度时,可以在干预话术集中对用户话术的话术分词进行检索,得到相关干预话术,计算用户话术与相关干预话术的话术相似度,如果有多个相关干预话术则分别计算用户话术与每个相关干预话术的话术相似度,具体地,先计算用户话术与相关干预话术的词向量和词频逆文本频率,再根据词向量和词频逆文本频率计算话术相似度,该话术相似度可以为词向量相似度和余弦相似度的加权平均值,也可以对词向量相似度和余弦相似度采用其它计算方式得到。
本发明实施例的识别话术意图的方法还可以包括:从历史数据筛选出能够与模版规则话术匹配的已知话术,为已知话术添加话术标注,并添加到训练数据集;从历史数据筛选出无匹配的模版规则话术、且识别模型的无法识别的未知话术;若未知话术是常见话术,则为未知话术设置话术规则,并添加到干预话术集。
其中,已知话术是能够与模版规则话术匹配的用户话术。未知话术是与相关干预话术的话术相似度小于或等于预设阈值、且深度学习模型的无法识别的用户话术。已知话术和未知话术可以从历史数据中得到,例如日志或识别记录等数据。分析历史数据筛选出无法匹配到模版规则话术且深度学习模型无法识别的话术,对于该话术需要采取不同策略,如果话术为用户常见话术,需要快速响应修正,则可以为其设置话术规则并添加干预话术集,这部话术可能是用户常用并有固定模式的话术,但是数量不多,可以将该类话术总结为干预话术;如果是其他话术,则为其添加话术标注,这部话术可能是用户常用的聚集于某一领域话术,可以在添加标注后作为训练数据,提供给识别模型进行训练。话术规则包括话术意图和槽值位置。话术意图可以是查看、听、咨询、收藏或购买等通过话术表达的意愿。槽值位置是关键信息在话术中的位置,例如干预话术“我想买「商品名」”中,商品名所在位置是槽位,则话术“我想买电视”中,“电视”是抽取出的槽值。
步骤S202:若话术相似度大于干预阈值,则根据匹配的干预话术的话术规则识别用户话术的话术意图。
用户话术与相关干预话术的话术相似度大于干预阈值时,表示用户话术与相关干预话术相同或相似,即可以使用相同的话术规则,此时,可以根据相关干预话术的话术规则来识别用户话术的话术意图。干预阈值可以根据实际需要等确定。
本发明实施例的识别话术意图的方法,在识别用户话术的话术意图之后,还可以进一步根据匹配的干预话术的话术规则提取用户话术的槽值,基于该槽值可以进一步给出针对用户话术的答复、建议或相关推荐等。
步骤S203:若话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别用户话术的话术意图。
用户话术与相关干预话术的话术相似度不大于干预阈值时,表示用户话术与相关干预话术无关,可以进一步利用模版规则话术集或识别模型来识别用户话术的话术意图,此情况下,可以先利用模版规则话术集来识别,也可以先利用识别模型的顺序来识别。模版规则话术集包括模版规则话术及其话术规则,模版规则话术是指预先定义了话术规则的话术,每个模版规则话术对应有固定的话术规则。识别模型可以是卷积神经网络(CNN)、长短时记忆网络(LSTM)、条件随机场(CRF)、基于注意力的循环神经网络(attention-basedRNN)或词向量与文本分类工具(fsstText)等,且可以具体细分为意图识别模型和槽值抽取模型,其中,意图识别模型用于识别用户话术的话术意图,槽值抽取模型用于提取用户话术的槽值。作为一种优选的实施方式,意图识别模型可以是CNN,槽值抽取模型可以是双向LSTM结合CRF。
作为一种优选的实施方式,先利用模版规则话术集来识别用户话术,在模版规则话术集中未匹配到模版规则话术时,再利用识别模型的顺序来识别用户话术。
在本发明实施例中,步骤S203可以通过以下方式实现:基于话术分词从模版规则话术集为用户话术匹配模版规则话术;计算用户话术与匹配的模版规则话术的词向量和词频逆文本频率;根据词向量和词频逆文本频率计算用户话术与匹配的模版规则话术的话术相似度;若话术相似度大于模版阈值,则根据匹配的模版规则话术的话术规则确定用户话术的话术意图,并提取用户话术的槽值;若话术相似度小于或等于模版阈值,则利用意图识别模型确定用户话术的话术意图,以及利用槽值抽取模型提取用户话术的槽值。
与步骤S201类似,本步骤可以先在模版规则话术集查询是否存在与用户话术匹配的模版规则话术,同样采用话术相似度确定用户话术与相关模版话术是否匹配,即是否可以使用相同的话术规则,如果话术相似度大于模版阈值,则表示存在与用户话术匹配的模版规则话术,此时,可以根据模版规则话术的话术规则确定用户话术的话术意图,并提取用户话术的槽值;如果话术相似度小于或等于模版阈值,则表示不存在与用户话术匹配的模版规则话术,此时,可以利用意图识别模型和槽值抽取模型,确定用户话术的话术意图并提取用户话术的槽值。模版阈值可以根据实际需要等确定。
需要说明的是,意图识别模型和槽值抽取模型是深度学习模型,作为一种优选的实施方式,意图识别模型可以选用CNN,槽值抽取模型可以选用双向LSTM结合CRF,对于意图识别和槽值抽取的功能实现,可以采用现有的实施方式,此处不予赘述。
步骤S204:根据识别的话术意图更新干预话术集、模版规则话术集或识别模型。
在本发明实施例中,步骤S204可以通过以下方式实现:从历史数据中获取训练话术,为训练话术、干预话术和模版规则话术添加话术标注,并添加到训练数据集;利用训练数据集训练学习模型;计算学习模型在测试话术集和训练数据集中的准确率和召回率;若准确率大于或等于预设准确率且召回率大于或等于预设召回率,则通过训练,根据学习模型更新意图识别模型和槽值抽取模型;若准确率小于预设准确率或召回率小于预设召回率,则重新训练。
除了利用添加了话术标注的未知话术对意图识别模型和槽值抽取模型进行训练之外,还可以从历史数据中获取训练话术,在为训练话术添加话术标注后,用于意图识别模型和槽值抽取模型的训练。除了日志或识别记录之外,历史数据还包括聊天记录或评论等数据。对于意图识别模型或槽值抽取模型的训练,可以选择添加话术标注的训练话术、添加话术标注的未知话术、干预话术和模版规则话术作为样本进行训练,对于训练后的意图识别模型或槽值抽取模型的评估,可以基于其准确率和召回率,在准确率大于或等于预设准确率且召回率大于或等于预设召回率时,表示意图识别模型或槽值抽取模型通过训练。其中,准确率是指正确识别的样本在所有样本所占比例,召回率是指正样本被正确识别的样本数占所有被识别模型预测为正样本的比例,准确率和召回率能够体现算法的精确性。
在本发明实施例中,步骤S204还可以通过以下方式实现:利用通过训练的学习模型对添加话术标注的未知话术和训练话术进行回归测试;将通过测试的未知话术和训练话术添加到测试话术集;基于未通过的未知话术和训练话术对模版规则话术集进行更新。
在本发明实施例中,步骤S204还可以通过以下方式实现:利用模版规则话术集对已知话术进行回归测试;将通过测试的已知话术添加到测试话术集;将未通过测试的已知话术记录为调整话术;基于调整话术对干预话术集进行更新。
对于用于训练意图识别模型和槽值抽取模型的训练话术或未知话术,在其通过回归测试后可以添加到测试话术集,供模型训练使用,丰富了训练数据,同时利用未通过测试的训练话术或未知话术更新模版规则话术集,实现对模版规则话术进行删除、增加或替换等更新,保证数据能够适应信息的变化,提高识别的准确性。
根据本发明实施例的识别话术意图的方法可以看出,因为采用从干预话术集为用户话术匹配干预话术,并计算用户话术与匹配的干预话术的话术相似度;若话术相似度大于干预阈值,则根据匹配的干预话术的话术规则识别用户话术的话术意图;若话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别用户话术的话术意图;根据识别的话术意图更新干预话术集、模版规则话术集或识别模型的技术手段,所以克服了过度依赖预先定义的意图与槽值,可迭代性差;无法针对识别错误的话术进行快速的反馈的技术问题,进而达到快速准确地识别话术意图,以及对常用的话术进行快速响应;在实现识别用户话术的同时,对数据进行更新,使数据在迭代的过程中得到充分利用,减少了数据标注工作量的技术效果。
如图3所示,本发明实施例的识别话术意图的方法可以基于意图识别及槽值抽取系统和反馈迭代系统实现,其中,意图识别及槽值抽取系统主要对外提供意图识别和槽值抽取功能,反馈迭代系统主要提供历史数据收集、数据标注与录入、深度模型训练等功能,通过一系列的数据录入与迭代等过程,实现了对意图识别及槽值抽取部分的快速干预与迭代更新。
意图识别及槽值抽取系统
该系统主要由三个模块构成,分别是意图与槽值干预模块、模版规则意图槽值提取模块和深度学习算法意图槽值提取模块,其中:
1.意图与槽值干预模块
该模块提供对用户话术意图与槽值干预的功能,主要目的是为了对用户话术进行快速响应,前置用于直接干预掉模版规则匹配意图槽值提取模块及深度学习算法意图槽值提取模块无法准确或错误处理的用户话术。该模块接受意图与槽值干预更新模块的更新;
该模块可以采用全文搜索引擎(ElasticSearch)等数据库存储干预话术集,对于用户话术的基本响应流程如下:
对用户话术进行分词,按照分词结果(即得到的话术分词)进入ElasticSearch进行检索;
从ElasticSearch中检索出预设数量的最相关的话术(即与用户话术匹配的干预话术),分别计算匹配的干预话术与用户话术的话术相似度;
按照相话术似度对匹配的干预话术排序,并基于干预阈值进行过滤;
若话术相似度均低于干预阈值,则没有干预结果,将用户话术交给模版规则意图槽值提取模块进行处理;
否则,则认为干预成功,根据话术相似度最高的干预话术的话术规则识别用户话术的话术意图并提取槽值作为结果返回。
2.模版规则意图槽值提取模块
该模块按照预先定义的模版规则话术,对用户话术进行匹配,根据匹配到的模版规则话术,识别用户话术的话术意图并提取槽值作为结果返回;
需要说明的是,该模块接受规则模版迭代更新模块的更新,新增或删除模版规则话术。例如某模版规则话术如下:
{
pattern:($I_WANT_TO_BUY_MATCHER?(?$PRODUCT$PRODUCT_MATCHER)),
result:Format("%s;product:%s","SEARCH_PRODUCT",Join("",$PRODUCT.word))
}
该模版规则话术可以匹配“我要买(商品名)”和“我想买(商品名)”等话术,话术意图为查询商品,槽值为商品名。
3.深度学习算法意图槽值提取模块
该模块通过深度学习模型(识别模型),识别话术意图及提取槽值,其中,意图识别采用的深度学习模型为CNN,槽值抽取采用的深度学习模型为双向LSTM结合CRF;
需要说明的是,该模块接受深度学习算法评估模块的迭代与更新。
快速响应及反馈迭代系统
快速响应及反馈迭代系统同样由多个子模块构成,具体地:
1.日志收集模块
该模块负责收集意图识别及槽值抽取系统的输入与输出,并将其作为日志记录下来。运营人员及其他人员可通过对日志收集模块收集的日志(即历史数据)进行分析,筛选出意图识别及槽值抽取系统不能识别或识别错误的未知话术,对该部分话术可以采取不同的策略,如果未知话术为常见话术,需要快速响应修正,该类话术可能是用户经常使用并有固定模式的话术,但是数据量不大的话术,可以将该类话术进行总结,可通过意图与槽值干预录入模块录入干预话术,实现对常见话术的快速响应;如果未知话术是其他话术(即常见话术),该类话术可能聚集于某一领域话术,可录入意图槽值标注模块进行标注,以作为训练数据提供给深度学习模型进行训练。
该模块可以采用Hadoop分布式文件系统(HDFS)等存储结构存储日志。
2.其他数据源收集模块
该模块负责收集其他来源的历史数据,例如客服聊天记录或商品评论等数据,从中获取训练话术,并将训练话术录入意图槽值标注模块进行标注。
3.意图槽值标注模块
该模块提供对日志收集模块和其他数据源收集模块导入的未知话术和训练话术添加话术标注的功能,例如话术“我要买牛奶”经意图槽值标注模块标注后,标注的话术意图为SEARCH_PRODUCT,抽取的槽值为牛奶。标注后的数据采用统一的格式,以便于后续迭代使用。
4.深度学习算法意图槽值提取训练模块
该模块用于训练深度学习模型,其中,意图识别采用的深度学习模型为CNN模型,槽值抽取采用的深度学习模型为双向LSTM结合CRF的模型。训练深度学习模型的训练数据的来源主要有:意图槽值标注模块标注的未知话术和训练话术、规则模版匹配话术暂存模块存储的能够被模版规则话术匹配的已知话术、以及意图与槽值干预话术暂存模块暂存的干预话术等。
需要注意的是,深度学习模型采取的训练方法遵循一般的深度学习训练方法流程。此外,用于训练深度学习模型的数据是需要标注过的数据,且提供给深度学习模型进行训练的数据,应该标注为某个特定的领域之内,如果一个话术超过了预先设定的领域,需要对深度学习模型预先设定的领域进行重新定义,并重新训练深度学习模型。干预话术集和模版规则话术集的数据可能没有添加标注,如果这部分数据在深度学习模型的领域之内,在意图槽值标注模块添加标注后可以供深度模型训练使用,实现可迭代。
5.深度学习算法评估模块
深度学习算法意图槽值提取训练模块训练出的学习模型,交给深度学习算法评估模块进行评估,其中,深度学习算法评估模块涉及的内容主要有:
算法评估优化
算法评估优化一般只关注在当前训练数据和验证数据情况下,该算法是否得到了提升。算法评估优化的指标主要有,准确率、召回率,新训练的学习模型只有在模块维护的测试话术集中以及新标注的数据集中准确率指标和召回率指标都优于线上运行模型(即识别模型)时,才会认为通过算法评估优化。准确率是指预测正确的样本在所有样本所占比例。召回率是指正样本被预测正确的样本书占所有模型预测为正样本的比例。准确率和召回率共同体现算法的精确性。
业务评估优化
在本发明中,业务评估优化主要是指新训练的学习模型识别常用的用户话术的准确率和召回率不应低于线上运行模型。此外,基于学习模型更新深度学习模型后,用户体验感不能有下降。业务评估需要考虑学习模型的上线是否导致线上运行模型真实表现,可能存在着数据标注偏差,导致模型在线上真实业务中表现不佳的情况,此时应对当前模型进行评估,指出标注的训练数据是否存在偏差。
模型更新与数据分流
在深度学习算法评估模块中,没有通过算法评估优化和业务评估优化的模型将会交回深度学习算法意图槽值提取训练模块进行调参,并重新训练。对于通过算法评估优化和业务评估优化的模型,将进行如下操作:
用新模型对未知话术和训练话术进行回归测试,测试后,正确识别的部分将会添加到深度学习算法评估模块维护的测试话术集中,未正确识别的部分,将会交给规则模版迭代更新模块进行处理;
更新线上模型。
6.规则模版迭代更新模块
该模块用于删除、增加和更新模版规则话术集。该模块接受深度学习算法评估模块分流的学习模型无法匹配的话术,对这部分行处理、统计和归纳总结,去除不再需要的模版规则话术,新增或更新模版规则话术。
以及,该模块对已知话术进行回归测试,对规则模版意图槽值提取模块的回归测试是指,在更新了模版规则话术之后,原能够被正确识别的话术,是否仍能够被正确识别其话术意图,并提取正确的槽值。能被识别的已知话术将会暂存于规则模板匹配话术暂存模块,这部分已知话术用于供深度学习意图槽值提取训练模块迭代使用;不能被识别的已知话术将会交给意图与槽值干预更新模块。
规则模版匹配话术暂存模块
该模块负责存储能够被模版规则话术匹配的已知话术,作为深度学习算法意图槽值提取训练模块的训练数据提供者之一,为深度学习模型和规则模版提供反馈,从而实现迭代。例如采用如下格式记录存储已知话术:
{
“userSpeech”:
{
"text":"我想听周某某的稻香",
"domain":"music",
“intent”:“MUSIC_GENERAL_PLAY”,
“labeledResult”:“我想听<SINGER>周某某</SINGER>的<MUSIC_NAME>稻香</MUSIC_NAME>”
}
}
8.意图与槽值干预录入模块:
该模块提供意图与槽值干预录入功能,对于意图识别及槽值抽取系统无法正确识别或识别不准确的话术,需要快速响应时,可通过该模块将需要干预的话术录入。该模块将录入数据交给意图与槽值干预更新模块,实时更新意图槽值与干预模块,从而实现对用户话术的快速响应。
9.意图与槽值干预更新模块:
该模块接受意图与槽值干预录入模块录入的干预话术、以及规则模版迭代更新模块的调整话术,并将接收的数据存放到意图与槽值干预话术暂存模块中,实现对意图槽值干预模块的实时更新。
10.意图与槽值干预话术暂存模块
该模块功能与规则模板匹配话术暂存模块功能类似,储存的数据为意图与槽值干预模块能够正确处理的相关数据。
本发明实施例的识别话术意图的方法,文本相似度的计算方法为计算词向量、tf-idf的余弦相似度的加权平均值。
在本发明中,相似度计算的主要流程为:
1.计算词向量:
词向量的计算可以通过神经网络的语言模型训练获得,也可以通过当前Bert等开源模型获取。在本发明中,采取神经网络对训练语料进行预训练获得。词向量的训练采取业界通用的N-gram语言模型进行训练。
2.计算词频逆文本频率:
词频逆文本频率(TF-IDF)的计算结果以向量的形式给出。TF是指文档频率,出现频率越高的词项,重要性越高。IDF是指逆文本频率指数,词项在多个文档中出现,重要性越低。
3.计算话术相似度:
余弦相似度计算遵照以下公式给出:
Figure BDA0002217246160000191
其中A,B分别代表两句话术向量化的结果,在本发明中,为词向量和TF-IDF向量
话术相似度由TF-IDF余弦相似度与词向量余弦相似度的加权值获取。如下:
Similarity=w1*Similarity(TF-IDF)+w2*Similarity(w2vec);其中,w1和w2分别是TF-IDF余弦相似度与词向量余弦相似度的权重,Similarity(TF-IDF)是TF-IDF余弦相似度,Similarity(w2vec)是词向量余弦相似度。
本发明实施例的识别话术意图的方法,CNN进行意图识别的流程为:将用户话术转换为词向量,用于后续处理;将词向量输入卷积层中,进行特征提取。为避免过拟合,卷积层的输出将会通过抽样层,又被称为池化层,一般池化有平均值池化和最大值池化两种。在本发明中采用最大值池化作为池化层。池化层的输出的特征将会在全连接层中汇集,并且通过softmax进行归一化,得到最终的概率。
本发明实施例的识别话术意图的方法,双向LSTM结合CRF进行槽值抽取的流程为:
对于关键词,可以预先设定一些标签,例如对于话术“我想听某歌手的某音乐”,标签化为“我(O)想(O)听(O)某(O-SINGER)歌(I-SINGER)手(I-SINGER)的(O)某(B-SONG)音(I-SONG)乐(I-SONG)”,其中有(O,B-SONG,I-SONG,B-SINGER,I-SINGER)5种标签;对于用户的输入话术,转化为词向量,用于后续处理;将词向量输入LSTM层中,进行训练,LSTM层中的输出即是各个标签的概率值;将LSTM层输出的标签概率通过CRF,计算出整个句子标签可能性最大的序列。在“我想听某歌手的某音乐”这句话术中,某歌手将会被作为SINGER关键词,某音乐将为被作为SONG关键词提出。
卷积网络的本质是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对卷积网络加以训练,网络就具有输入输出对之间的映射能力。卷积网络执行的是有监督训练,所以其样本集是由形如:(输入向量,理想输出向量)的向量对构成的。所有这些向量对,都应该是来源于网络即将模拟的系统的实际“运行”结果。它们可以是从实际运行系统中采集来的。在开始训练前,所有的权都应该用一些不同的小随机数进行初始化。“小随机数”用来保证网络不会因权值过大而进入饱和状态,从而导致训练失败;“不同”用来保证网络可以正常地学习。实际上,如果用相同的数去初始化权矩阵,则网络无能力学习。
本发明实施例的识别话术意图的方法,对于意图识别模型和槽值抽取模型的训练采用现有的训练方法。如图4所示,卷积神经网络的训练过程与传统神经网络类似,也是参照了反向传播算法。
第一阶段,向前传播阶段:
a)从样本集中取一个样本(X,Yp),将X输入网络;
b)计算相应的实际输出Op。
在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中,网络执行的是计算(实际上就是输入与每层的权值矩阵相点乘,得到最后的输出结果):
Op=Fn(…(F2(F1(XpW(1))W(2))…)W(n))
第二阶段,向后传播阶段
a)算实际输出Op与相应的理想输出Yp的差;
b)按极小化误差的方法反向传播调整权矩阵。
图5是根据本发明实施例的识别话术意图的装置的主要模块的示意图。如图5所示,本发明实施例的识别话术意图的装置500包括:匹配单元501、第一识别单元502、第二识别单元503和更新单元504。
其中,匹配单元501,用于从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度;
第一识别单元502,用于若所述话术相似度大于干预阈值,则根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图;
第二识别单元503,用于若所述话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别所述用户话术的话术意图;
更新单元504,用于根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型。
在本发明实施例中,所述匹配单元501还用于:对所述用户话术进行分词,得到话术分词;基于所述话术分词从干预话术集为所述用户话术匹配干预话术;其中,所述干预话术集包括干预话术及其话术规则;计算所述用户话术与匹配的干预话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的干预话术的话术相似度。
在本发明实施例中,所述第一识别单元502还用于:根据所述匹配的干预话术的话术规则提取所述用户话术的槽值。
此外,所述识别模型包括意图识别模型和槽值抽取模型。
在本发明实施例中,所述第二识别单元503还用于:基于所述话术分词从模版规则话术集为所述用户话术匹配模版规则话术;其中,所述模版规则话术集包括模版规则话术及其话术规则;计算所述用户话术与匹配的模版规则话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的模版规则话术的话术相似度;若所述话术相似度大于模版阈值,则根据所述匹配的模版规则话术的话术规则确定所述用户话术的话术意图,并提取所述用户话术的槽值;若所述话术相似度小于或等于模版阈值,则利用所述意图识别模型确定所述用户话术的话术意图,以及利用所述槽值抽取模型提取所述用户话术的槽值。
在本发明实施例中,识别话术意图的装置500还包括训练单元(图中并未示出),用于:从历史数据筛选出能够与所述模版规则话术匹配的已知话术,为所述已知话术添加话术标注,并添加到训练数据集;从历史数据筛选出无匹配的所述模版规则话术、且所述识别模型的无法识别的未知话术;若所述未知话术是常见话术,则为所述未知话术设置话术规则,并添加到所述干预话术集;其中,所述话术规则包括话术意图和槽值位置。
在本发明实施例中,所述更新单元504还用于:从历史数据中获取训练话术,为所述训练话术、所述干预话术和所述模版规则话术添加话术标注,并添加到所述训练数据集;利用所述训练数据集训练学习模型;计算学习模型在测试话术集和所述训练数据集中的准确率和召回率;若所述准确率大于或等于预设准确率且所述召回率大于或等于预设召回率,则通过训练,根据所述学习模型更新所述意图识别模型和所述槽值抽取模型;若所述准确率小于预设准确率或所述召回率小于预设召回率,则重新训练。
在本发明实施例中,所述更新单元504进一步用于:利用通过训练的所述学习模型对添加话术标注的所述未知话术和所述训练话术进行回归测试;将通过测试的所述未知话术和所述训练话术添加到所述测试话术集;基于未通过的所述未知话术和所述训练话术对所述模版规则话术集进行更新。
在本发明实施例中,所述更新单元504进一步用于:利用所述模版规则话术集对所述已知话术进行回归测试;将通过测试的所述已知话术添加到所述测试话术集;将未通过测试的所述已知话术记录为调整话术;基于所述调整话术对所述干预话术集进行更新。
根据本发明实施例的识别话术意图的装置可以看出,因为采用从干预话术集为用户话术匹配干预话术,并计算用户话术与匹配的干预话术的话术相似度;若话术相似度大于干预阈值,则根据匹配的干预话术的话术规则识别用户话术的话术意图;若话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别用户话术的话术意图;根据识别的话术意图更新干预话术集、模版规则话术集或识别模型的技术手段,所以克服了过度依赖预先定义的意图与槽值,可迭代性差;无法针对识别错误的话术进行快速的反馈的技术问题,进而达到快速准确地识别话术意图,以及对常用的话术进行快速响应;在实现识别用户话术的同时,对数据进行更新,使数据在迭代的过程中得到充分利用,减少了数据标注工作量的技术效果。
图6示出了可以应用本发明实施例的识别话术意图的方法或识别话术意图的装置的示例性系统架构600。
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息)反馈给终端设备。
需要说明的是,本发明实施例所提供的识别话术意图的方法一般由服务器605执行,相应地,识别话术意图的装置一般设置于服务器605中。
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括匹配单元、第一识别单元、第二识别单元和更新单元。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,更新单元还可以被描述为“根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:步骤S201:从干预话术集为用户话术匹配干预话术,并计算用户话术与匹配的干预话术的话术相似度;步骤S202:若话术相似度大于干预阈值,则根据匹配的干预话术的话术规则识别用户话术的话术意图;步骤S203:若话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别用户话术的话术意图;步骤S204:根据识别的话术意图更新干预话术集、模版规则话术集或识别模型。
根据本发明实施例的技术方案,因为采用从干预话术集为用户话术匹配干预话术,并计算用户话术与匹配的干预话术的话术相似度;若话术相似度大于干预阈值,则根据匹配的干预话术的话术规则识别用户话术的话术意图;若话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别用户话术的话术意图;根据识别的话术意图更新干预话术集、模版规则话术集或识别模型的技术手段,所以克服了过度依赖预先定义的意图与槽值,可迭代性差;无法针对识别错误的话术进行快速的反馈的技术问题,进而达到快速准确地识别话术意图,以及对常用的话术进行快速响应;在实现识别用户话术的同时,对数据进行更新,使数据在迭代的过程中得到充分利用,减少了数据标注工作量的技术效果。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种识别话术意图的方法,其特征在于,包括:
从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度;
若所述话术相似度大于干预阈值,则根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图;
若所述话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别所述用户话术的话术意图;
根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型。
2.根据权利要求1所述的方法,其特征在于,从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度,包括:
对所述用户话术进行分词,得到话术分词;
基于所述话术分词从干预话术集为所述用户话术匹配干预话术;其中,所述干预话术集包括干预话术及其话术规则;
计算所述用户话术与匹配的干预话术的词向量和词频逆文本频率;
根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的干预话术的话术相似度;
以及
根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图之后,还包括:
根据所述匹配的干预话术的话术规则提取所述用户话术的槽值。
3.根据权利要求2所述的方法,其特征在于,所述识别模型包括意图识别模型和槽值抽取模型,利用模版规则话术集或识别模型识别所述用户话术的话术意图,包括:
基于所述话术分词从模版规则话术集为所述用户话术匹配模版规则话术;其中,所述模版规则话术集包括模版规则话术及其话术规则;
计算所述用户话术与匹配的模版规则话术的词向量和词频逆文本频率;
根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的模版规则话术的话术相似度;
若所述话术相似度大于模版阈值,则根据所述匹配的模版规则话术的话术规则确定所述用户话术的话术意图,并提取所述用户话术的槽值;
若所述话术相似度小于或等于模版阈值,则利用所述意图识别模型确定所述用户话术的话术意图,以及利用所述槽值抽取模型提取所述用户话术的槽值。
4.根据权利要求1所述的方法,其特征在于,从干预话术集为用户话术匹配干预话术之前,还包括:
从历史数据筛选出能够与所述模版规则话术匹配的已知话术,为所述已知话术添加话术标注,并添加到训练数据集;
从历史数据筛选出无匹配的所述模版规则话术、且所述识别模型的无法识别的未知话术;
若所述未知话术是常见话术,则为所述未知话术设置话术规则,并添加到所述干预话术集;其中,所述话术规则包括话术意图和槽值位置。
5.根据权利要求4所述的方法,其特征在于,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,包括:
从历史数据中获取训练话术,为所述训练话术、所述干预话术和所述模版规则话术添加话术标注,并添加到所述训练数据集;
利用所述训练数据集训练学习模型;
计算学习模型在测试话术集和所述训练数据集中的准确率和召回率;
若所述准确率大于或等于预设准确率且所述召回率大于或等于预设召回率,则通过训练,根据所述学习模型更新所述意图识别模型和所述槽值抽取模型;
若所述准确率小于预设准确率或所述召回率小于预设召回率,则重新训练。
6.根据权利要求5所述的方法,其特征在于,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,还包括:
利用通过训练的所述学习模型对添加话术标注的所述未知话术和所述训练话术进行回归测试;
将通过测试的所述未知话术和所述训练话术添加到所述测试话术集;
基于未通过的所述未知话术和所述训练话术对所述模版规则话术集进行更新。
7.根据权利要求5所述的方法,其特征在于,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,还包括:
利用所述模版规则话术集对所述已知话术进行回归测试;
将通过测试的所述已知话术添加到所述测试话术集;
将未通过测试的所述已知话术记录为调整话术;
基于所述调整话术对所述干预话术集进行更新。
8.一种识别话术意图的装置,其特征在于,包括:
匹配单元,用于从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度;
第一识别单元,用于若所述话术相似度大于干预阈值,则根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图;
第二识别单元,用于若所述话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别所述用户话术的话术意图;
更新单元,用于根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型。
9.一种识别话术意图的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201910919908.5A 2019-09-26 2019-09-26 识别话术意图的方法和装置 Pending CN112559697A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910919908.5A CN112559697A (zh) 2019-09-26 2019-09-26 识别话术意图的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910919908.5A CN112559697A (zh) 2019-09-26 2019-09-26 识别话术意图的方法和装置

Publications (1)

Publication Number Publication Date
CN112559697A true CN112559697A (zh) 2021-03-26

Family

ID=75030317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910919908.5A Pending CN112559697A (zh) 2019-09-26 2019-09-26 识别话术意图的方法和装置

Country Status (1)

Country Link
CN (1) CN112559697A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326373A (zh) * 2021-05-19 2021-08-31 武汉大学 一种融合会话场景信息的微信群聊天记录识别方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326373A (zh) * 2021-05-19 2021-08-31 武汉大学 一种融合会话场景信息的微信群聊天记录识别方法及系统
CN113326373B (zh) * 2021-05-19 2022-08-05 武汉大学 一种融合会话场景信息的微信群聊天记录识别方法及系统

Similar Documents

Publication Publication Date Title
CN107491534B (zh) 信息处理方法和装置
CN108897867B (zh) 用于知识问答的数据处理方法、装置、服务器和介质
CN107256267A (zh) 查询方法和装置
CN108628830B (zh) 一种语义识别的方法和装置
CN110019742B (zh) 用于处理信息的方法和装置
CN108027814B (zh) 停用词识别方法与装置
US20220335936A1 (en) Method and apparatus of verifying information based on a voice interaction, device, and computer storage medium
CN114840671A (zh) 对话生成方法、模型的训练方法、装置、设备及介质
US20210042470A1 (en) Method and device for separating words
CN112035626A (zh) 一种大规模意图的快速识别方法、装置和电子设备
CN112988753B (zh) 一种数据搜索方法和装置
CN113326702B (zh) 语义识别方法、装置、电子设备及存储介质
CN113553414A (zh) 智能对话方法、装置、电子设备和存储介质
CN113268560A (zh) 用于文本匹配的方法和装置
CN111651994B (zh) 一种信息抽取方法、装置、电子设备和存储介质
CN115688920A (zh) 知识抽取方法、模型的训练方法、装置、设备和介质
CN113609847B (zh) 信息抽取方法、装置、电子设备及存储介质
CN111078855A (zh) 信息处理方法、装置、电子设备及存储介质
CN112148958A (zh) 用于信息推荐的方法、设备和计算机存储介质
CN111538817A (zh) 人机交互方法和装置
CN112749238A (zh) 搜索排序方法、装置、电子设备以及计算机可读存储介质
CN112559697A (zh) 识别话术意图的方法和装置
CN114647739B (zh) 实体链指方法、装置、电子设备及存储介质
CN114417974B (zh) 模型训练方法、信息处理方法、装置、电子设备和介质
CN116048463A (zh) 基于标签管理的需求项内容智能推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination