CN113377933B - 多轮对话的意图分类方法及装置 - Google Patents

多轮对话的意图分类方法及装置 Download PDF

Info

Publication number
CN113377933B
CN113377933B CN202110458561.6A CN202110458561A CN113377933B CN 113377933 B CN113377933 B CN 113377933B CN 202110458561 A CN202110458561 A CN 202110458561A CN 113377933 B CN113377933 B CN 113377933B
Authority
CN
China
Prior art keywords
dialogue
round
text
dialog
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110458561.6A
Other languages
English (en)
Other versions
CN113377933A (zh
Inventor
黄林
黎华清
宋维林
赵航
张海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202110458561.6A priority Critical patent/CN113377933B/zh
Publication of CN113377933A publication Critical patent/CN113377933A/zh
Application granted granted Critical
Publication of CN113377933B publication Critical patent/CN113377933B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供一种多轮对话的意图分类方法及装置,该方法包括:获取多轮对话的对话文本;将对话文本输入词向量模型,以输出多轮对话的对话文本词向量;提取出多轮对话中每一轮对话的对话文本词向量的特征向量;根据多轮对话中每一轮对话的特征向量,得到多轮对话的意图分类信息。与现有技术相比,本申请通过提取多轮对话中每一轮对话的特征向量,根据每一轮对话的特征向量得到意图分类信息的方法,既可以得到每一轮对话的特征,又可以结合上下文信息,提高了多轮对话的意图分类准确率。

Description

多轮对话的意图分类方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种多轮对话的意图分类方法及装置。
背景技术
意图分类是机器学习的一个重要领域。目前,智能客服会话的难点是进行用户意图匹配,只有明确了意图,才能给出针对性的回答。
目前,进行对话意图分类的方式有:用卡方检验选择特征词,然后计算特征词权重和关键句权重,然后通过分类器进行意图分类;采用卷积神经网络进行对话意图分类。
但是,通过卡方检验选择特征词然后通过分类器进行分类的方式,只是计算词在句子中的重要性,并未考虑词对分类结果的重要性,分类的准确率低;通过卷积神经网络进行对话意图分类的方法,可以很好的把握局部重要信息,但是缺乏上下文信息,意图分类的准确率低。因此,现有的技术方案存在多轮对话的意图分类的准确率低的问题。
发明内容
本申请实施例提供一种多轮对话的意图分类方法及装置,以解决现有技术中多轮对话的意图分类的准确率低的问题。
本申请的第一方面提供一种多轮对话的意图分类方法,包括:
获取多轮对话的对话文本;
将所述对话文本输入词向量模型,以输出所述多轮对话的对话文本词向量;
提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量;
根据所述多轮对话中每一轮对话的特征向量,得到所述多轮对话的意图分类信息。
在一种可选的实施方式中,所述提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量,包括:
将所述多轮对话中每一轮对话的对话文本词向量输入特征向量提取模型,以输出每一轮对话的特征向量。
在一种可选的实施方式中,所述将所述多轮对话中每一轮对话的对话文本词向量输入特征向量提取模型,以输出每一轮对话的特征向量,包括:
根据所述多轮对话的对话文本词向量得到所述多轮对话的对话文本矩阵;
将所述对话文本矩阵输入卷积神经网络模型,以输出的所述多轮对话中每一轮对话的特征向量。
在一种可选的实施方式中,所述根据所述多轮对话的对话文本词向量得到所述多轮对话的对话文本矩阵,包括:
根据所述多轮对话的对话次数、所述对话文本的句长以及所述对话文本词向量的向量维度,将所述多轮对话的对话文本词向量转换为所述多轮对话的对话文本矩阵,所述句长表征所述多轮对话中每一轮对话的长度。
在一种可选的实施方式中,所述根据所述多轮对话中每一轮对话的特征向量,得到所述多轮对话的意图分类信息,包括:
将所述多轮对话中每一轮对话的特征向量输入循环神经网络模型,以输出所述多轮对话的意图向量;
根据所述意图向量确定所述多轮对话的意图分类信息。
在一种可选的实施方式中,在所述获取多轮对话的对话文本之前,所述方法还包括:
获取所述多轮对话的待处理对话文本;
对所述多轮对话的待处理对话文本进行过滤,得到所述多轮对话的第一对话文本;
将所述多轮对话的第一对话文本输入分词模型,以输出的所述多轮对话的第二对话文本;
删除所述多轮对话的第二对话文本中的停用词,得到所述对话文本。
在一种可选的实施方式中,所述对所述多轮对话的待处理对话文本进行过滤,得到所述多轮对话的第一对话文本,包括:
删除所述多轮对话的待处理对话文本中的预设目标句;
根据正则表达式,去除所述多轮对话的待处理对话文本中的图片、网址以及表情符,得到所述第一对话文本。
在一种可选的实施方式中,所述删除所述多轮对话的第二对话文本中的停用词,得到所述对话文本,包括:
计算所述第二对话文本中每个词在所述第二对话文本中的权重;
若所述权重小于预设阈值,则确定所述权重对应的所述第二对话文本中的词为停用词;
在所述多轮对话的第二对话文本中将所述停用词删除,得到所述多轮对话的对话文本。
本申请的第二方面提供一种多轮对话的意图分类装置,所述装置包括:
获取模块,用于获取多轮对话的对话文本;
处理模块,用于将所述对话文本输入词向量模型,以输出所述多轮对话的对话文本词向量;提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量;
分类模块,用于根据所述多轮对话中每一轮对话的特征向量,得到所述多轮对话的意图分类信息。
在一种可选的实施方式中,所述处理模块,还用于将所述多轮对话中每一轮对话的对话文本词向量输入特征向量提取模型,以输出每一轮对话的特征向量。
在一种可选的实施方式中,所述处理模块,具体用于根据所述多轮对话的对话文本词向量得到所述多轮对话的对话文本矩阵;将所述对话文本矩阵输入卷积神经网络模型,以输出的所述多轮对话中每一轮对话的特征向量。
在一种可选的实施方式中,所述处理模块,具体用于根据所述多轮对话的对话次数、所述对话文本的句长以及所述对话文本词向量的向量维度,将所述多轮对话的对话文本词向量转换为所述多轮对话的对话文本矩阵,所述句长表征所述多轮对话中每一轮对话的长度。
在一种可选的实施方式中,所述分类模块,具体用于将所述多轮对话中每一轮对话的特征向量输入循环神经网络模型,以输出所述多轮对话的意图向量;根据所述意图向量确定所述多轮对话的意图分类信息。
在一种可选的实施方式中,所述获取模块,还用于获取所述多轮对话的待处理对话文本;
所述处理模块,还用于对所述多轮对话的待处理对话文本进行过滤,得到所述多轮对话的第一对话文本;将所述多轮对话的第一对话文本输入分词模型,以输出的所述多轮对话的第二对话文本;删除所述多轮对话的第二对话文本中的停用词,得到所述对话文本。
在一种可选的实施方式中,所述处理模块,具体用于删除所述多轮对话的待处理对话文本中的预设目标句;根据正则表达式,去除所述多轮对话的待处理对话文本中的图片、网址以及表情符,得到所述第一对话文本。
在一种可选的实施方式中,所述处理模块,具体用于计算所述第二对话文本中每个词在所述第二对话文本中的权重;若所述权重小于预设阈值,则确定所述权重对应的所述第二对话文本中的词为停用词;在所述多轮对话的第二对话文本中将所述停用词删除,得到所述多轮对话的对话文本。
本申请的第三方面提供一种电子设备,包括:处理器与存储器;
所述存储器用于存储计算机程序;
所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如第一方面所述的方法。
本申请的第四方面提供一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
本申请的第五方面提供一种计算机程序产品,包括计算机程序,该计算机程序使得计算机执行如第一方面所述的方法。
本申请实施例提供的多轮对话的意图分类方法及装置,首先获取多轮对话的对话文本,然后将对话文本输入词向量模型,以输出多轮对话的对话文本词向量,之后提取出多轮对话中每一轮对话的对话文本词向量的特征向量;最后根据多轮对话中每一轮对话的特征向量,得到多轮对话的意图分类信息。与现有技术相比,本申请通过提取多轮对话中每一轮对话的特征向量,根据每一轮对话的特征向量得到意图分类信息的方法,既可以得到每一轮对话的特征,又可以结合上下文信息,提高了多轮对话的意图分类准确率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种多轮对话的意图分类方法的应用场景示意图;
图2为本申请实施例提供的一种多轮对话的意图分类方法的流程示意图;
图3为本申请实施例提供的一种待处理对话文本的示意图;
图4为本申请实施例提供的过滤后的待处理对话文本的示意图;
图5为本申请实施例提供的一种权重计算结果的示意图;
图6为本申请实施例提供的一种文本处理结果的示意图;
图7为本申请实施例提供的一种矩阵转换的示意图;
图8为本申请实施例提供的一种卷积神经网络模型的逻辑示意图;
图9为本申请实施例提供的一种循环神经网络模型的示意图;
图10为本申请实施例提供的另一种多轮对话的意图分类方法的流程示意图;
图11为本申请实施例提供的再一种多轮对话的意图分类方法的流程示意图;
图12为本申请提供的一种多轮对话的意图分类装置的结构示意图;
图13为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
意图分类是机器学习的一个重要领域。目前,智能客服会话的难点是进行用户意图匹配,只有明确了意图,才能给出针对性的回答。目前,进行对话意图分类的方式有:用卡方检验选择特征词,然后计算特征词权重和关键句权重,然后通过分类器进行意图分类;采用卷积神经网络进行对话意图分类。
然而,通过卡方检验选择特征词然后通过分类器进行分类的方式,只是计算词在句子中的重要性,并未考虑词对分类结果的重要性,分类的准确率低;通过卷积神经网络进行对话意图分类的方法,可以很好的把握局部重要信息,但是缺乏上下文信息,意图分类的准确率低。
为解决上述问题,本申请提供了一种多轮对话的意图分类方法及装置,首先提取出多轮对话的每一论对话的特征向量,然后根据所有的特征向量得到多轮对话的意图分类,从而提高了多轮对话的意图分类的准确率。
下面对本申请的应用场景进行说明。
图1为本申请实施例提供的一种多轮对话的意图分类方法的应用场景示意图。如图1所示,包括:终端设备001、服务器002。用户将获取到的多轮对话的对话文本,发送给终端设备001,通过终端设备001对的对话文本进行处理,得到对话文本的意图分类信息,然后输出给用户,之后终端设备001将多轮对话的对话文本发送到服务器002的数据库中,由数据库002进行存储,用户根据得到的对话文本的意图分类信息可以获取对话文本的意图分类。
其中,终端可以是带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端设备、增强现实(augmented reality,AR)终端设备、手机(mobile phone)、平板电脑(pad)、工业控制(industrial control)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、智慧家庭(smart home)中的无线终端等。
本申请实施例中,用于实现多轮对话的意图分类的功能的装置可以是终端设备或者服务器,也可以是能够支持实现该功能的装置,例如芯片系统,该装置可以被安装在终端设备或者服务器中。本申请实施例中,芯片系统可以由芯片构成,也可以包括芯片和其他分立器件。
需要说明的是,本申请技术方案的应用场景可以是图1中的场景,但并不限于此,还可以应用于其他需要进行多轮对话的意图分类的场景。
可以理解,上述多轮对话的意图分类方法可以通过本申请实施例提供的多轮对话的意图分类装置实现,多轮对话的意图分类装置可以是某个设备的部分或全部,例如为上述终端设备或者服务器或者终端设备的芯片。
下面以集成或安装有相关执行代码的多轮对话的意图分类装置为例,以具体地实施例对本申请实施例的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请实施例提供的一种多轮对话的意图分类方法的流程示意图,本实施例的执行主体是终端设备,涉及的是多轮对话的意图分类的具体过程。如图2所示,该方法包括:
S101、获取多轮对话的对话文本。
其中,对话文本为多轮对话形成的文本。
本申请中对于多轮对话的对话形式不做限制,示例性的,可以为人机对话、也可以为电话语音、也可以为在客服界面的文字沟通。
本申请中对于对话文本的获取方式也不做限制,示例性的,可以获取文本形式的对话文本,也可以通过语音识别获取对话文本。
可选的,终端设备获取多轮对话的待处理对话文本;对多轮对话的待处理对话文本进行过滤,得到多轮对话的第一对话文本;将多轮对话的第一对话文本输入分词模型,以输出的多轮对话的第二对话文本,删除多轮对话的第二对话文本中的停用词,得到对话文本。终端设备对获取的待处理对话文本进行预处理,去除待处理对话文本中无效的词。
其中,终端设备对多轮对话的待处理对话文本进行过滤,以去除待处理对话文本中高频句和图片网址、表情符。
示例性的,终端设备删除多轮对话的待处理对话文本中的预设目标句,根据正则表达式,去除多轮对话的待处理对话文本中的图片、网址以及表情符,得到第一对话文本。
其中,预设目标句为在对话中出现的次数较多的词。本申请中对于预设目标句不做具体的限制,可以根据具体的情况进行设置,示例性的,当终端设备需要处理的多轮对话的对话文本为手机客服处理网络问题时的对话文本,则终端设备可以根据手机客服处理网络问题对应的高频词库,设置预设目标句为高频词库中前30%或者50%的词;或者,终端设备可以根据对话习惯,对话的第一句为问候语句,删除对话中的第一句。
例如,图3为本申请实施例提供的一种待处理对话文本的示意图,图4为本申请实施例提供的过滤后的待处理对话文本的示意图,终端设备对图3中的待处理对话文本,去除待处理对话文本中高频句和图片网址、表情符后,得到的第一对话文本如图4所示。
本申请中对于分词模型不做限制,示例性的,可以为结巴(Jieba)分词模型。
本申请中对于删除停用词的方式不做限制,示例性的,计算第二对话文本中每个词在第二对话文本中的权重;若权重小于预设阈值,则确定权重对应的第二对话文本中的词为停用词;在多轮对话的第二对话文本中将停用词删除,得到多轮对话的对话文本。
其中,终端设备根据轻量级梯度直升机算法(Light Gradient BoostingMachine,LightGBM)计算第二对话文本中每个词在第二对话文本中的权重。
本申请中对于预设阈值的设置不做限制,示例性的,可以根据权重对第二对话文本中的词进行排序,将权重值低的100个词,设置为停用词,相应的设置停用词中权重最高的为预设阈值。
可选的,终端设备获取对话文本的训练样本,计算训练样本中每个词在训练样本中的权重,根据每个词的权重选取停用词得到停用词库,将停用词库在发送到服务器的数据库中。
下面对于终端设备删除停用词的情况进行说明。
示例性的,给出A和B两个句子。
A:麻烦帮我看看我现在的收费套餐。
B:上不了网了,帮我看看是怎么回事。
通过分词模型进行分词后,得到:
A:麻烦帮我看看我现在的收费套餐
B:上不了网了帮我看看是怎么回事
然后,根据每句话中是否包含该词,对分词后的结果,构建的向量。示例性的,通过多分类标签(One-hot向量)构建向量,表1为本申请实施例提供的向量构建的结果。
表1
麻烦 看看 现在 收费 套餐 怎么 回事
A 1 1 1 1 1 0 0 1 1 1 0 0 0 0
B 0 1 0 0 0 1 1 1 1 0 1 1 1 1
最后,终端设备将构建的向量输入LightGBM算法,计算第二对话文本中每个词在第二对话文本中的权重,根据每个词的权重,确定停用词。图5为本申请实施例提供的一种权重计算结果的示意图,如图5所示,横轴为每个词,纵轴为每个词对应的权重。通过上面删除停用词的方法,可以降低停用词库的维护成本,以及提高停用词选取的准确性。
S102、将对话文本输入词向量模型,以输出多轮对话的对话文本词向量。
在本步骤中,终端设备将对话文本转换成向量形式。
本申请中对于词向量模型的类型不做限制,示例性的,可以为词向量(Word2Vec)。
S103、提取出多轮对话中每一轮对话的对话文本词向量的特征向量。
其中,特征向量为可以表征每一轮对话的对话文本词向量的特征的向量。
本申请中对于提取特征向量的方式不做限制,示例性的,终端设备将多轮对话中每一轮对话的对话文本词向量输入特征向量提取模型,以输出每一轮对话的特征向量。
具体的,终端设备根据多轮对话的对话文本词向量得到多轮对话的对话文本矩阵;将对话文本矩阵输入卷积神经网络模型,以输出的多轮对话中每一轮对话的特征向量。
其中,终端设备根据多轮对话的对话次数、对话文本的句长以及对话文本词向量的向量维度,将多轮对话的对话文本词向量转换为多轮对话的对话文本矩阵,句长表征多轮对话中每一轮对话的长度。
图6为本申请实施例提供的一种文本处理结果的示意图,图7为本申请实施例提供的一种矩阵转换的示意图。如图6所示为经过处理后得到的对话文本,终端设备将图6中的对话文本转换成对话文本词向量,然后将对话文本词向量转换成M×N×D的三维矩阵,其中,M为多轮对话的对话次数,N为对话文本的句长,D为对话文本词向量的向量维度;M,N通过填充分别保持相同的长度,示例性的,M为15,N为10,D为5,可以解决现有拼接方法中因客服与用户对话长度差异较大导致的权重不相同的问题。如图7所示为将图6中的对话文本对应的对话文本词向量转换为对话文本矩阵后得到的三维矩阵,图7中的矩阵包含15个面,每个面中有10×5个格子,每个格子代表数字0或者1,横着的5个格子代表一个词的向量,一个10×5的面代表一轮对话的向量,为了便于画图,图7中为给出每个词对应的词向量,用每个词代表其对应的词向量。
在得到图7中的对话文本矩阵后,将对话文本矩阵输入卷积神经网络模型,以输出的多轮对话中每一轮对话的特征向量。
具体的,卷积神经网络对对话文本矩阵中N×D所在的面进行M次卷积,其中,N×D所在的面对应一轮对话的对话文本矩阵,得到多轮对话中每一轮对话的特征向量。图8为本申请实施例提供的一种卷积神经网络模型的逻辑示意图,如图8所示,S1表示卷积神经网络模型,将句长乘向量维度为10x5的矩阵,输入卷积神经网络,得到3中不同大小的卷积核,每种卷积核有两个,对每种卷积核进行卷积运算和均值池化,得到3个2x1的向量,然后将3个2x1的向量拼接,得到一个6x1的向量,即为对应的一轮对话的特征向量。
S104、根据多轮对话中每一轮对话的特征向量,得到多轮对话的意图分类信息。
在本步骤中,当终端设备提取出多轮对话中每一轮对话的对话文本词向量的特征向量后,则根据多轮对话中每一轮对话的特征向量,得到多轮对话的意图分类信息。
本申请中对于终端设备根据多轮对话中每一轮对话的特征向量,得到多轮对话的意图分类信息的方式不做限制,示例性的,可以通过循环神经网络模型得到多轮对话的意图分类信息。
可选的,将多轮对话中每一轮对话的特征向量输入循环神经网络模型,以输出多轮对话的意图向量,根据意图向量确定多轮对话的意图分类信息。
本申请对于循环神经网络模型的选择不做限制,示例性的,可以是长短期记忆人工神经网络(Long Short-Term Memory,LSTM)。图9为本申请实施例提供的一种循环神经网络模型的示意图,如图9所示,终端设备将多轮对话的对话文本矩阵输入卷积层,由卷积神经网络模型(S1)对每一轮对话进行卷积计算,提取出每一轮对话的特征向量,然后将每一轮对话的特征向量输入循环层,得到多轮对话的意图向量,根据意图向量确定多轮对话的意图分类信息。
其中,输入卷积层的对话文本矩阵的大小为多轮对话的对话次数乘对话文本的句长乘对话文本词向量的向量维度,示例性的,可以为15×10×5。
可以理解的是,卷积神经网络模型是起源于图像分类,图像可以任意转换角度,而多轮对话只可以从左往右、从上往下读,因此,对于M×N×D的对话文本矩阵,在卷积神经网络模型做卷积计算时,只在N×D上做卷积,不能在M×N上做卷积。从图9中可以看出,卷积神经网络模型只在每轮对话中做卷积,LSTM只在每轮对话间根据特征向量预测,符合从左往右、从上往下的处理顺序。而且LSTM的输入长度等于对话次数,使得LSTM层的训练速度提高句长(N)倍,解决了将多轮对话输入LSTM层时,由于LSTM记忆力不足,而不能获取多轮对话的所有特征的问题。
进一步的,本申请采用迭代训练的方法,初始样本中,保证每个分类样本数量为200个以上,初始模型搭建完成后嵌入标注平台,由业务人员线上测试,由于初始模型样本量较低,分类数量较多,业务相对比较复杂,而且标注样本并非同一个业务人员打标,每个人对业务理解不一致,存在某些样本会对应两种或多种意图。复杂业务中训练样本存在一对多的分类,针对此问题,在后续标注过程中,假如样本A的分类可以为C或者D(不同业务人员理解不同),而模型预测为C,则业务人员需统一标注为C。原则是优先以模型结果为准,经过多次迭代后,则可解决一个样本存在两个或者多个分类的问题。当标注平台积累一定数量的新样本则调用模型自训练接口,迭代训练。
本申请实施例提供的多轮对话的意图分类方法,首先获取多轮对话的对话文本,然后将对话文本输入词向量模型,以输出多轮对话的对话文本词向量,之后提取出多轮对话中每一轮对话的对话文本词向量的特征向量;最后根据多轮对话中每一轮对话的特征向量,得到多轮对话的意图分类信息。与现有技术相比,本申请通过提取多轮对话中每一轮对话的特征向量,根据每一轮对话的特征向量得到意图分类信息的方法,既可以得到每一轮对话的特征,又可以结合上下文信息,提高了多轮对话的意图分类准确率。
在上述实施例的基础上,下面对于通过多轮对话中每一轮对话的特征向量得到多轮对话的意图分类信息的情况进行说明。图10为本申请实施例提供的另一种多轮对话的意图分类方法的流程示意图,如图10所示,该方法包括:
S201、获取多轮对话的对话文本。
S202、将对话文本输入词向量模型,以输出多轮对话的对话文本词向量。
S203、根据多轮对话的对话文本词向量得到多轮对话的对话文本矩阵。
S204、将对话文本矩阵输入卷积神经网络模型,以输出的多轮对话中每一轮对话的特征向量。
S205、将多轮对话中每一轮对话的特征向量输入循环神经网络模型,以输出多轮对话的意图向量。
S206、根据意图向量确定多轮对话的意图分类信息。
S201-S206的技术名词、技术效果、技术特征,以及可选实施方式,可参照图2所示的S101-S104理解,对于重复的内容,在此不再累述。
在上述实施例的基础上,图11为本申请实施例提供的再一种多轮对话的意图分类方法的流程示意图,如图11所示,该方法包括:
S301、获取多轮对话的待处理对话文本。
其中,待处理对话文本为未
S302、对多轮对话的待处理对话文本进行过滤,得到多轮对话的第一对话文本。
S303、将多轮对话的第一对话文本输入分词模型,以输出的多轮对话的第二对话文本。
S304、删除多轮对话的第二对话文本中的停用词,得到对话文本。
S301-S304的技术名词、技术效果、技术特征,以及可选实施方式,可参照图2所示的S101-S104理解,对于重复的内容,在此不再累述。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例还提供的一种多轮对话的意图分类装置,图12为本申请提供的一种多轮对话的意图分类装置的结构示意图,该多轮对话的意图分类装置可以通过软件、硬件或者两者的结合实现。如图12所示,该多轮对话的意图分类装置400包括:获取模块401、处理模块402和分类模块403。
获取模块401,用于获取多轮对话的对话文本;
处理模块402,用于将对话文本输入词向量模型,以输出多轮对话的对话文本词向量;提取出多轮对话中每一轮对话的对话文本词向量的特征向量;
分类模块403,用于根据多轮对话中每一轮对话的特征向量,得到多轮对话的意图分类信息。
在一种可选的实施方式中,处理模块402,还用于将多轮对话中每一轮对话的对话文本词向量输入特征向量提取模型,以输出每一轮对话的特征向量。
在一种可选的实施方式中,处理模块402,具体用于根据多轮对话的对话文本词向量得到多轮对话的对话文本矩阵;将对话文本矩阵输入卷积神经网络模型,以输出的多轮对话中每一轮对话的特征向量。
在一种可选的实施方式中,处理模块402,具体用于根据多轮对话的对话次数、对话文本的句长以及对话文本词向量的向量维度,将多轮对话的对话文本词向量转换为多轮对话的对话文本矩阵,句长表征多轮对话中每一轮对话的长度。
在一种可选的实施方式中,分类模块403,具体用于将多轮对话中每一轮对话的特征向量输入循环神经网络模型,以输出多轮对话的意图向量;根据意图向量确定多轮对话的意图分类信息。
在一种可选的实施方式中,获取模块401,还用于获取多轮对话的待处理对话文本;
处理模块402,还用于对多轮对话的待处理对话文本进行过滤,得到多轮对话的第一对话文本;将多轮对话的第一对话文本输入分词模型,以输出的多轮对话的第二对话文本;删除多轮对话的第二对话文本中的停用词,得到对话文本。
在一种可选的实施方式中,处理模块402,具体用于删除多轮对话的待处理对话文本中的预设目标句;根据正则表达式,去除多轮对话的待处理对话文本中的图片、网址以及表情符,得到第一对话文本。
在一种可选的实施方式中,处理模块402,具体用于计算第二对话文本中每个词在第二对话文本中的权重;若权重小于预设阈值,则确定权重对应的第二对话文本中的词为停用词;在多轮对话的第二对话文本中将停用词删除,得到多轮对话的对话文本。
需要说明的,本申请实施例提供的多轮对话的意图分类装置,可用于执行上述任意实施例所提供的方法,具体实现方式和技术效果类似,这里不再进行赘述。
图13为本申请实施例提供的一种电子设备的结构示意图。如图13所示,该电子设备可以包括:至少一个处理器501和存储器502。图13示出的是以一个处理器为例的电子设备。
存储器502,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器502可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器501用于执行存储器502存储的计算机执行指令,以实现上述多轮对话的意图分类方法;
其中,处理器501可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选的,在具体实现上,如果通信接口、存储器502和处理器501独立实现,则通信接口、存储器502和处理器501可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口、存储器502和处理器501集成在一块芯片上实现,则通信接口、存储器502和处理器501可以通过内部接口完成通信。
本申请实施例还提供了一种芯片,包括处理器和接口。其中接口用于输入输出处理器所处理的数据或指令。处理器用于执行以上方法实施例中提供的方法。该芯片可以应用于多轮对话的意图分类装置中。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序信息,程序信息用于上述多轮对话的意图分类方法。
本申请实施例还提供一种程序,该程序在被处理器执行时用于执行以上方法实施例提供的多轮对话的意图分类方法。
本申请实施例还提供一种程序产品,例如计算机可读存储介质,该程序产品中存储有指令,当其在计算机上运行时,使得计算机执行上述方法实施例提供的多轮对话的意图分类方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种多轮对话的意图分类方法,其特征在于,所述方法包括:
获取多轮对话的对话文本;
将所述对话文本输入词向量模型,以输出所述多轮对话的对话文本词向量;
提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量;
根据所述多轮对话中每一轮对话的特征向量,得到所述多轮对话的意图分类信息;
所述提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量,包括:
根据所述多轮对话的对话次数、所述对话文本的句长以及所述对话文本词向量的向量维度,将所述多轮对话的对话文本词向量转换为所述多轮对话的对话文本矩阵,所述句长表征所述多轮对话中每一轮对话的长度;
将所述对话文本矩阵输入卷积神经网络模型,以输出的所述多轮对话中每一轮对话的特征向量。
2.根据权利要求1所述的多轮对话的意图分类方法,其特征在于,所述根据所述多轮对话中每一轮对话的特征向量,得到所述多轮对话的意图分类信息,包括:
将所述多轮对话中每一轮对话的特征向量输入循环神经网络模型,以输出所述多轮对话的意图向量;
根据所述意图向量确定所述多轮对话的意图分类信息。
3.根据权利要求1所述的多轮对话的意图分类方法,其特征在于,在所述获取多轮对话的对话文本之前,所述方法还包括:
获取所述多轮对话的待处理对话文本;
对所述多轮对话的待处理对话文本进行过滤,得到所述多轮对话的第一对话文本;
将所述多轮对话的第一对话文本输入分词模型,以输出的所述多轮对话的第二对话文本;
删除所述多轮对话的第二对话文本中的停用词,得到所述对话文本。
4.根据权利要求3所述的多轮对话的意图分类方法,其特征在于,所述对所述多轮对话的待处理对话文本进行过滤,得到所述多轮对话的第一对话文本,包括:
删除所述多轮对话的待处理对话文本中的预设目标句;
根据正则表达式,去除所述多轮对话的待处理对话文本中的图片、网址以及表情符,得到所述第一对话文本。
5.根据权利要求3或4所述的多轮对话的意图分类方法,其特征在于,所述删除所述多轮对话的第二对话文本中的停用词,得到所述对话文本,包括:
计算所述第二对话文本中每个词在所述第二对话文本中的权重;
若所述权重小于预设阈值,则确定所述权重对应的所述第二对话文本中的词为停用词;
在所述多轮对话的第二对话文本中将所述停用词删除,得到所述多轮对话的对话文本。
6.一种多轮对话的意图分类装置,其特征在于,所述装置包括:
获取模块,用于获取多轮对话的对话文本;
处理模块,用于将所述对话文本输入词向量模型,以输出所述多轮对话的对话文本词向量;提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量;
分类模块,用于根据所述多轮对话中每一轮对话的特征向量,得到所述多轮对话的意图分类信息;
所述提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量,包括:
根据所述多轮对话的对话次数、所述对话文本的句长以及所述对话文本词向量的向量维度,将所述多轮对话的对话文本词向量转换为所述多轮对话的对话文本矩阵,所述句长表征所述多轮对话中每一轮对话的长度;
所述处理模块,具体用于将所述对话文本矩阵输入卷积神经网络模型,以输出的所述多轮对话中每一轮对话的特征向量。
7.一种电子设备,其特征在于,包括:处理器与存储器;
所述存储器用于存储计算机程序;
所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如权利要求1-5中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序使得计算机执行如权利要求1-5中任一项所述的方法。
CN202110458561.6A 2021-04-27 2021-04-27 多轮对话的意图分类方法及装置 Active CN113377933B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110458561.6A CN113377933B (zh) 2021-04-27 2021-04-27 多轮对话的意图分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110458561.6A CN113377933B (zh) 2021-04-27 2021-04-27 多轮对话的意图分类方法及装置

Publications (2)

Publication Number Publication Date
CN113377933A CN113377933A (zh) 2021-09-10
CN113377933B true CN113377933B (zh) 2023-05-30

Family

ID=77570270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110458561.6A Active CN113377933B (zh) 2021-04-27 2021-04-27 多轮对话的意图分类方法及装置

Country Status (1)

Country Link
CN (1) CN113377933B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777013A (zh) * 2016-12-07 2017-05-31 科大讯飞股份有限公司 对话管理方法和装置
WO2018102240A1 (en) * 2016-12-02 2018-06-07 Microsoft Technology Licensing, Llc Joint language understanding and dialogue management
CN108829667A (zh) * 2018-05-28 2018-11-16 南京柯基数据科技有限公司 一种基于记忆网络的多轮对话下的意图识别方法
CN109902175A (zh) * 2019-02-20 2019-06-18 上海方立数码科技有限公司 一种基于神经网络结构模型的文本分类方法及分类系统
CN110083693A (zh) * 2019-04-28 2019-08-02 腾讯科技(深圳)有限公司 机器人对话回复方法及装置
CN111597339A (zh) * 2020-05-22 2020-08-28 北京慧闻科技(集团)有限公司 文档级多轮对话意图分类方法、装置、设备及存储介质
CN111813899A (zh) * 2020-08-31 2020-10-23 腾讯科技(深圳)有限公司 基于多轮会话的意图识别方法及装置
CN112069302A (zh) * 2020-09-15 2020-12-11 腾讯科技(深圳)有限公司 会话意图识别模型的训练方法、会话意图识别方法及装置
CN112182191A (zh) * 2020-10-16 2021-01-05 西北师范大学 多轮口语理解的结构化记忆图网络模型
WO2021042543A1 (zh) * 2019-09-04 2021-03-11 平安科技(深圳)有限公司 基于长短期记忆网络的多轮对话语义分析方法和系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018102240A1 (en) * 2016-12-02 2018-06-07 Microsoft Technology Licensing, Llc Joint language understanding and dialogue management
CN106777013A (zh) * 2016-12-07 2017-05-31 科大讯飞股份有限公司 对话管理方法和装置
CN108829667A (zh) * 2018-05-28 2018-11-16 南京柯基数据科技有限公司 一种基于记忆网络的多轮对话下的意图识别方法
CN109902175A (zh) * 2019-02-20 2019-06-18 上海方立数码科技有限公司 一种基于神经网络结构模型的文本分类方法及分类系统
CN110083693A (zh) * 2019-04-28 2019-08-02 腾讯科技(深圳)有限公司 机器人对话回复方法及装置
WO2021042543A1 (zh) * 2019-09-04 2021-03-11 平安科技(深圳)有限公司 基于长短期记忆网络的多轮对话语义分析方法和系统
CN111597339A (zh) * 2020-05-22 2020-08-28 北京慧闻科技(集团)有限公司 文档级多轮对话意图分类方法、装置、设备及存储介质
CN111813899A (zh) * 2020-08-31 2020-10-23 腾讯科技(深圳)有限公司 基于多轮会话的意图识别方法及装置
CN112069302A (zh) * 2020-09-15 2020-12-11 腾讯科技(深圳)有限公司 会话意图识别模型的训练方法、会话意图识别方法及装置
CN112182191A (zh) * 2020-10-16 2021-01-05 西北师范大学 多轮口语理解的结构化记忆图网络模型

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
dialogue intent classification with character CNN BGRU networks;yufan Wang等;multimedia tools and applications;4553-4572 *
人机对话系统中意图识别方法综述;刘娇;李艳玲;林民;;计算机工程与应用;第55卷(第12期);1-7+43 *
智能对话系统研究综述;贾熹滨;李让;胡长建;陈军成;;北京工业大学学报;第43卷(第09期);1344-1356 *

Also Published As

Publication number Publication date
CN113377933A (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
CN108021806B (zh) 一种恶意安装包的识别方法和装置
CN108197652B (zh) 用于生成信息的方法和装置
US10929610B2 (en) Sentence-meaning recognition method, sentence-meaning recognition device, sentence-meaning recognition apparatus and storage medium
CN110738102A (zh) 一种人脸识别方法及系统
CN111104954A (zh) 一种对象分类的方法与装置
CN110288085B (zh) 一种数据处理方法、装置、系统及存储介质
CN113360700B (zh) 图文检索模型的训练和图文检索方法、装置、设备和介质
CN110969172A (zh) 一种文本的分类方法以及相关设备
CN108268936B (zh) 用于存储卷积神经网络的方法和装置
CN114299304A (zh) 一种图像处理方法及相关设备
CN113377933B (zh) 多轮对话的意图分类方法及装置
CN111967478A (zh) 一种基于权重翻转的特征图重构方法、系统、存储介质及终端
CN114117062A (zh) 文本向量表示方法、装置及电子设备
CN116266394A (zh) 多模态的情绪识别方法、设备及存储介质
CN114782720A (zh) 文案的配图确定方法、装置、电子设备、介质及程序产品
CN114842482A (zh) 一种图像分类方法、装置、设备和存储介质
CN113158801A (zh) 用于训练人脸识别模型以及识别人脸的方法以及相关装置
CN109003223B (zh) 图片处理方法和装置
CN111460214A (zh) 分类模型训练方法、音频分类方法、装置、介质及设备
CN117392260B (zh) 一种图像生成方法及装置
CN115471893B (zh) 训练人脸识别模型、人脸识别的方法和装置
US20230247103A1 (en) Electronic apparatus and method for controlling thereof
CN110362809B (zh) 文本分析方法及装置
CN116417001A (zh) 一种声纹识别方法、装置、终端及存储介质
CN117975210A (zh) 基于局部特征的点云数据处理方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant