CN110321564B - 一种多轮对话意图识别方法 - Google Patents

一种多轮对话意图识别方法 Download PDF

Info

Publication number
CN110321564B
CN110321564B CN201910605719.0A CN201910605719A CN110321564B CN 110321564 B CN110321564 B CN 110321564B CN 201910605719 A CN201910605719 A CN 201910605719A CN 110321564 B CN110321564 B CN 110321564B
Authority
CN
China
Prior art keywords
model
dialogue
intention
corpus
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910605719.0A
Other languages
English (en)
Other versions
CN110321564A (zh
Inventor
曹斌
叶铱雷
范菁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910605719.0A priority Critical patent/CN110321564B/zh
Publication of CN110321564A publication Critical patent/CN110321564A/zh
Application granted granted Critical
Publication of CN110321564B publication Critical patent/CN110321564B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种多轮对话意图识别方法,包括如下步骤:1)根据应用场景确定要识别的对话意图,并获取大量对话数据,人工找出对话数据中的对话块以及其对应的意图,进行语料标注;2)根据人工整理好的停用词表去除对话数据中的停用词;3)构建用于意图识别的句向量模型、BiLSTM‑CRF模型及StarSpace模型;4)由句向量模型、BiLSTM‑CRF模型和StarSpace模型实时获取对话数据,进行意图识别,输出最佳意图。本发明的有益效果是:意图识别高效,准确率高,泛化能力强,人工标注语料成本低。

Description

一种多轮对话意图识别方法
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种多轮对话意图识别方法。
背景技术
如今人类进入了人工智能时代,众多企业都在开发自己的客服机器人。这不仅方便用户24小时咨询问题,也减轻了企业雇佣客服人员的成本,然而目前多数客服机器人并没有非常智能,不能满足用户的实际需求,例如,目前,客服机器人对话意图识别方式类型主要有三种:
第一种采用规则模板的方法。即通过收集大量用户语料,人工整理出用户咨询问题模板,然后机器人根据模板匹配结果回答用户问题。这种方式准确率较高,适合小规模的客服机器人。
第二种采用传统机器学习的方法。即将意图识别问题看成分类问题,通过支持向量机、随机森林等分类方法,在基于用户标注语料训练下得到分类模型,然后机器人根据模型预测用户意图,进而回答用户问题。这种方式节省了大量人工整理用户问题模板时间,而且机器人泛化能力较强。
第三种采用深度学习的方法。即采用当下最热门的深度学习模型,如长短期记忆网络、双向长短期记忆网络等方法,在基于巨大量的用户标注语料下得到深度学习模型,然后机器人根据模型预测用户意图,进而回答用户问题。这种方式考虑到了用户对话信息的上下文联系,而且机器人泛化能力强,适合于大规模的客服机器人。
比较三种方法,方案一的缺点是,需要大量人工去整理用户语料,形成用户问题模板,然后对客服机器人进行配置。对于那些没有整理配置的问题,机器人无法进行回答,泛化能力很差。方案二,虽然也需要人工标注语料,但是标注难度比方案一小很多,并且可以采用模型辅助进行语料标注。客服机器人的泛化能力也有所提升。方案三,需要投入大量的人工去标注语料,其语料标注规模是前两种方案的几十倍甚至百倍,但正因如此方案三从中很好地学习了用户对话与意图间的转化关系,极大地提高了意图识别的准确率和机器人的泛化能力。
发明内容
为了解决现有客服机器人意图识别的不足之处,本发明提供了一种多轮对话意图识别方法,该方法基于人工标注用户对话语料,通过采用双向长短期记忆网络-条件随机场(BiLSTM-CRF)模型联系对话上下文,采用StarSpace模型进行意图分类,根据意图分类模型计算得到的意图置信度进行排序过滤,输出最佳意图。
本发明的技术方案如下:
一种多轮对话意图识别方法,其特征在于,包括如下步骤:
1)根据应用场景确定要识别的对话意图,并获取大量对话数据,人工找出对话数据中的对话块以及其对应的意图,进行语料标注;
2)根据人工整理好的停用词表去除对话数据中的停用词;
3)构建用于意图识别的句向量模型、BiLSTM-CRF模型及StarSpace模型;
4)由句向量模型、BiLSTM-CRF模型和StarSpace模型实时获取对话数据,进行意图识别,输出最佳意图。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤2)具体为:
2.1)将对话数据使用分词工具进行分词;
2.2)将分词结果中的每个词与停用词表中的词进行判断,若分词结果中的词在停用词表中存在,则去除该词,否则保留;
2.3)将2.2)得到的结果拼接为句子。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤3)中句向量模型构建步骤具体为:
3.1)获取去除停用词后的人工标注语料,将语料中的每句话按字符拆分为List,最终得到整个语料的List列表;
3.2)设置sentence2vec算法的预设参数,句子嵌入向量空间的维度n和语料总共使用的次数epoch;
3.3)将3.1)中得到的语料List列表作为sentence2vec的输入,进行句向量模型训练;
3.4)将3.3)训练得到的句向量模型存储到磁盘上。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤3)中BiLSTM-CRF模型构建步骤具体为:
3.5)获取去除停用词后的人工标注语料,首先使用句向量模型将对话转化为句向量,然后根据对话块标注块标签,其中,B表示块开始位置,I表示块中位置,E表示块结束位置,O表示其他位置;
3.6)设置BiLSTM-CRF模型预设参数,模型隐藏层大小hidden_size、随机失活率dropout、语料总共使用的次数epoch、每批次大小batch_size;
3.7)将3.5)进行块标注后的语料作为BiLSTM-CRF模型的输入,进行BiLSTM-CRF模型训练;
3.8)将3.7)训练得到的BiLSTM-CRF模型存储到磁盘上。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤3)中StarSpace模型构建步骤具体为:
3.9)获取去除停用词后的人工标注语料,只取有意图的对话块,将对话块中的句子拼接起来,与其对应的意图形成key-value对,存储在List中。
3.10)设置StarSpace模型预设参数,对话嵌入粒度、模型隐藏层大小hidden_size、语料总共使用的次数epoch、每批次大小batch_size。
3.11)将3.9)得到的存有key-value对的List作为StarSpace模型的输入,进行StarSpace模型训练;
3.12)将3.11)训练得到的StarSpace模型存储到磁盘上。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤4)具体为:
4.1)从对话数据中获取一句对话;
4.2)根据停用词表去除对话中的停用词;
4.3)将对话输入句向量模型中,得到对话的句向量;
4.4)将对话及其句向量存储到对话列表中;
4.5)使用BiLSTM-CRF模型对对话列表进行对话分块;
4.6)根据4.5)得到的对话分块结果,若结果末端为一个对话块,则进入4.7),否则跳转到4.1);
4.7)将4.6)得到的对话块中的句子拼接起来,使用StarSpace模型进行意图分类;
4.8)根据意图分类结果,若意图分类结果置信度大于预设置置信度阈值C,则输出意图,否则该意图分类结果被过滤;
4.9)输出最佳意图,若存在未处理的对话数据,则跳转到4.1),否则算法结束。
本发明的有益效果是:
1)本发明采用了深度学习的方法,克服了背景技术方案一泛化能力差的问题。将联系用户对话上下文看作序列标注问题,采用序列标注方法进行对话分块,很好的解决了方案二没有考虑上下文联系的问题。
2)由于本发明将意图识别抽象为了序列标注问题和分类问题,采用两个深度学习模型分别负责语义联系和意图分类,与方案三采用一个深度学习模型同时负责这两个功能相比,本发明所需的语料远低于方案三所需的语料,在保证准确率和泛化能力的前提下,采用本发明的方法大大降低了人工标注语料的成本,克服了方案三语料标注成本高的问题。
3)本发明意图识别高效,准确率高,泛化能力强,人工标注语料成本低。
附图说明
图1表示本发明方案的模型构建流程图;
图2表示本发明方案的意图识别流程图。
具体实施方法
下面结合说明书附图,并结合实施例来说明本发明的算法实施方法。
一种多轮对话意图识别方法,包括如下步骤:
步骤1:根据应用场景确定要识别的对话意图,并获取大量对话数据,人工找出对话数据中的对话块以及其对应的意图,进行语料标注;
人们通常会用连续几句话来表达同一个意图,我们称之为对话块。在语料标注之前,首先根据客服机器人应用场景确定机器人想要识别的意图名称。然后,取一通完整的对话数据,人工找出对话中的对话块以及其对应的意图,进行标注,最后,我们将标注好的对话数据存储到磁盘上。本发明采用了三个深度学习模型(句向量模型、BiLSTM-CRF模型、StarSpace模型),它们都由多层神经网络构成。因此,需要通过大量人工标注语料来训练优化模型参数。
步骤2:根据人工整理好的停用词表去除对话数据中的停用词;
由于人们在对话中会使用大量的虚词、语气词等停用词,而这些词频繁出现,不仅影响意图识别的准确率,还极大的造成了存储空间的浪费,所以根据人工整理好的停用词表去除对话数据中的停用词。
S1)将对话数据使用分词工具(如:jieba分词)进行分词;
S2)将分词结果中的每个词与停用词表中的词进行判断,若分词结果中的词在停用词表中存在,则去除该词,否则保留;
S3)将S2得到的结果拼接为句子。
步骤3:构建用于意图识别的句向量模型、BiLSTM-CRF模型及StarSpace模型,为之后意图识别提供底层模型支撑。
构建句向量模型:
该模型可以将句子嵌入到向量空间中。模型有两个参数需要预先设定:1)句子嵌入向量空间的维度n;2)模型训练过程中,语料总共使用的次数epoch。
S1)获取去除停用词后的人工标注语料,将语料中的每句话按字符拆分为List,最终得到整个语料的List列表;
S2)设置sentence2vec算法的预设参数,句子嵌入向量空间的维度n和语料总共使用的次数epoch;
S3)将S1中得到的语料List列表作为sentence2vec的输入,进行句向量模型训练;
S4)将S3训练得到的句向量模型存储到磁盘上。
构建BiLSTM-CRF模型:
该模型可以进行对话分块,用于联系对话上下文。模型需要预先设定参数:1)块标签,通常为[B,I,E,O];2)模型隐藏层大小hidden_size;3)随机失活率dropout;4)模型训练过程中,语料总共使用的次数epoch;5)模型训练过程中,每批次大小batch_size。
S1)获取去除停用词后的人工标注语料,首先使用句向量模型将对话转化为句向量,然后根据对话块标注块标签,其中,B表示块开始位置,I表示块中位置,E表示块结束位置,O表示其他位置;
S2)设置BiLSTM-CRF模型预设参数,模型隐藏层大小hidden_size、随机失活率dropout、语料总共使用的次数epoch、每批次大小batch_size;
S3)将S1进行块标注后的语料作为BiLSTM-CRF模型的输入,进行BiLSTM-CRF模型训练;
S4)将S3训练得到的BiLSTM-CRF模型存储到磁盘上。
构建StarSpace模型:
该模型可以进行意图分类,并输出意图置信度。模型需要预先设定参数:1)对话嵌入粒度,字符或词;2)模型隐藏层大小hidden_size;3)模型训练过程中,语料总共使用的次数epoch;4)模型训练过程中,每批次大小batch_size。
S1)获取去除停用词后的人工标注语料,只取有意图的对话块,将对话块中的句子拼接起来,与其对应的意图形成key-value对,存储在List中;
S2)设置StarSpace模型预设参数,对话嵌入粒度、模型隐藏层大小hidden_size、语料总共使用的次数epoch、每批次大小batch_size;
S3)将S1得到的存有key-value对的List作为StarSpace模型的输入,进行StarSpace模型训练;
S4)将S3训练得到的StarSpace模型存储到磁盘上。
步骤4:由句向量模型、BiLSTM-CRF模型和StarSpace模型实时获取对话数据,进行意图识别,输出最佳意图。
该部分的目的是根据实时对话数据,高效准确地进行意图识别,为客服机器人提供意图识别能力。在意图识别流程中需要设置置信度阈值C,用于过滤意图分类结果,只输出意图分类置信度大于阈值C的意图,提高意图识别准确率。
由第一部分构建模型得到了句向量模型、BiLSTM-CRF模型和StarSpace模型。它们为意图识别提供了基础能力。算法实时获取对话数据,进行意图识别,输出最佳意图,具体步骤如下:
S1)从对话数据中获取一句对话;
S2)根据停用词表去除对话中的停用词;
S3)将对话输入句向量模型中,得到对话的句向量;
S4)将对话及其句向量存储到对话列表中;
S5)使用BiLSTM-CRF模型对对话列表进行对话分块;
S6)根据S5得到的对话分块结果,若结果末端为一个对话块,则进入S7,否则跳转到S1;
S7)将S6得到的对话块中的句子拼接起来,使用StarSpace模型进行意图分类;
S8)根据意图分类结果,若意图分类结果置信度大于预设置置信度阈值C,则输出意图,否则该意图分类结果被过滤;
S9)输出最佳意图,若存在未处理的对话数据,则跳转到S1,否则算法结束。
本发明的实施例:
由于模型训练需要大量的人工标注语料,我们以标注一则对话为例。假设现有一则对话,如表1所示。
表1
角色 内容
坐席 31552号话务员为您服务
客户 我想查询一下话费
坐席 请问您想查询哪个月的话费
客户 上个月的
坐席 您上个月话费总共58元
客户 我想办理宽带
坐席 好的,为您推荐融合宽带
客户 好的,谢谢
在标注之前,我们需要预先确定意图名称,以举例意图识别场景为例,有“查话费”、“办理宽带”两个意图。经人工标注后,结果如表2所示。
表2
角色 内容 块序号 意图
坐席 31552号话务员为您服务 1
客户 我想查询一下话费 2 查话费
坐席 请问您想查询哪个月的话费 2
客户 上个月的 2
坐席 您上个月话费总共58元 3
客户 我想办理宽带 4 办理宽带
坐席 好的,为您推荐融合宽带 5
客户 好的,谢谢 6
其中,连续几句话表达同一意图的对话被标记为同一块序号,对于在意图识别场景有意义的对话块,标注上对应意图名称。
在构建模型之前需要去除标注语料中的停用词,如“请问您想查询哪个月的话费”去除停用词后为“查询哪月话费”。同样,根据停用词表得到其他对话去停用词后的结果,如表3所示。
表3
角色 内容 块序号 意图
坐席 话务员服务 1
客户 查询话费 2 查话费
坐席 查询哪月话费 2
客户 上月 2
坐席 上月话费总共58元 3
客户 办理宽带 4 办理宽带
坐席 推荐融合宽带 5
客户 6
构建句向量模型,首先将语料转换为句向量模型训练格式,将表3内容列每行按字符拆分,存储到List中,得到句List,再将句List存储在整个对话的List中,转换完成后部分结果如下所示[[“话”,“务”,“员”,“服”,“务”],[“查”,“询”,“话”,“费”]]。设置sentence2vec算法的预设参数,句子嵌入向量空间的维度n=5和语料总共使用的次数epoch=500,将转换后结果采用sentence2vec算法进行句向量模型训练,将训练好的句向量模型存储到磁盘上。
构建BiLSTM-CRF模型,首先将语料转换为BiLSTM-CRF模型训练格式。规定块标签为[B,I,E,O]。其中,B表示块开始位置,I表示块中位置,E表示块结束位置,O表示其他位置。每句话采用句向量模型转为句向量。将表3转换成模型训练格式,如表4所示。
表4
Figure BDA0002120724390000081
Figure BDA0002120724390000091
设置BiLSTM-CRF模型预设参数,模型隐藏层大小hidden_size=128、随机失活率dropout=0.5、语料总共使用的次数epoch=150、每批次大小batch_size=20。将转换后的结果采用BiLSTM-CRF进行模型训练,将训练好的BiLSTM-CRF模型存储到磁盘上。
构建StarSpace模型,首先将语料转换为StarSpace模型训练格式。将同一对话块的句子进行拼接,并和对应的意图组成key-value进行存储。将表3转换成模型训练格式,结果如下{“查询话费查询哪月话费上月”:“查话费”,“办理宽带”:“办理宽带”}。设置StarSpace模型预设参数,对话嵌入粒度=“char”、模型隐藏层大小hidden_size=[128,256]、语料总共使用的次数epoch=300、每批次大小batch_size=20。将转换后的结果采用StarSpace进行模型训练,将训练好的StarSpace模型存储到磁盘上。
为叙述方便,意图识别对话数据仍然使用表1,实际中,对话数据和构建模型数据不相同。预先设定意图分类置信度阈值C=0.9。假设意图识别流程已经处理完对话数据前3句,开始处理第4句。算法获取第4句对话“上个月的”,根据停用词表去除停用词后为“上月”。然后采用句向量模型将对话转为句向量[0.61,-0.23,0.93,0.43,0.32],存储到对话列表中,此时对话列表如表5所示。
表5
角色 内容 句向量
坐席 话务员服务 [0.32,0.56,0.12,-0.64,0.88]
客户 查询话费 [0.11,0.87,0.33,0.45,0.91]
坐席 查询哪月话费 [-0.22,1.03,0.56.0.76,0.02]
客户 上月 [0.61,-0.23,0.93,0.43,0.32]
将表5句向量组成的List使用BiLSTM-CRF模型进行对话分块,结果为[O,B,I,E]。算法发现分块结果末端为一个对话块,所以将对话块中的句子进行拼接,结果为“查询话费查询哪月话费上月”。若此阶段算法没有发现分块结果末端为一个对话块,则获取下一句对话数据,开始下一轮意图识别。
得到拼接完成的对话后,使用StarSpace模型进行意图分类,得到分类结果。其中,包含意图名称和意图置信度{“name”:“查话费”,“confidence”:0.91672}。根据分类结果发现意图分类置信度0.91672大于预先设定的意图分类置信度阈值C=0.9,算法认为意图分类结果是准确的,于是输出此意图。若此阶段意图分类置信度小于预先设定的意图分类置信度阈值C,则认为该对话块不足以形成一个意图输出。
同样的,对话数据中的剩余对话都按照上述流程进行意图识别。若对话数据被全部处理完,则算法结束。

Claims (3)

1.一种多轮对话意图识别方法,其特征在于,包括如下步骤:
1)根据应用场景确定要识别的对话意图,并获取大量对话数据,人工找出对话数据中的对话块以及其对应的意图,进行语料标注;
2)根据人工整理好的停用词表去除对话数据中的停用词;
3)构建用于意图识别的句向量模型、BiLSTM-CRF模型及StarSpace模型;
所述步骤3)中句向量模型构建步骤具体为:
3.1)获取去除停用词后的人工标注语料,将语料中的每句话按字符拆分为List,最终得到整个语料的List列表;
3.2)设置sentence2vec算法的预设参数,句子嵌入向量空间的维度n和语料总共使用的次数epoch;
3.3)将3.1)中得到的语料List列表作为sentence2vec的输入,进行句向量模型训练;
3.4)将3.3)训练得到的句向量模型存储到磁盘上;
所述步骤3)中BiLSTM-CRF模型构建步骤具体为:
3.5)获取去除停用词后的人工标注语料,首先使用句向量模型将对话转化为句向量,然后根据对话块标注块标签,其中,B表示块开始位置,I表示块中位置,E表示块结束位置,O表示其他位置;
3.6)设置BiLSTM-CRF模型预设参数,模型隐藏层大小hidden_size、随机失活率dropout、语料总共使用的次数epoch、每批次大小batch_size;
3.7)将3.5)进行块标注后的语料作为BiLSTM-CRF模型的输入,进行BiLSTM-CRF模型训练;
3.8)将3.7)训练得到的BiLSTM-CRF模型存储到磁盘上;
所述步骤3)中StarSpace模型构建步骤具体为:
3.9)获取去除停用词后的人工标注语料,只取有意图的对话块,将对话块中的句子拼接起来,与其对应的意图形成key-value对,存储在List中;
3.10)设置StarSpace模型预设参数,对话嵌入粒度、模型隐藏层大小hidden_size、语料总共使用的次数epoch、每批次大小batch_size;
3.11)将3.9)得到的存有key-value对的List作为StarSpace模型的输入,进行StarSpace模型训练;
3.12)将3.11)训练得到的StarSpace模型存储到磁盘上;
4)由句向量模型、BiLSTM-CRF模型和StarSpace模型实时获取对话数据,进行意图识别,输出最佳意图。
2.根据权利要求1所述的一种多轮对话意图识别方法,其特征在于,所述步骤2)具体为:
2.1)将对话数据使用分词工具进行分词;
2.2)将分词结果中的每个词与停用词表中的词进行判断,若分词结果中的词在停用词表中存在,则去除该词,否则保留;
2.3)将2.2)得到的结果拼接为句子。
3.根据权利要求1所述的一种多轮对话意图识别方法,其特征在于,所述步骤4)具体为:
4.1)从对话数据中获取一句对话;
4.2)根据停用词表去除对话中的停用词;
4.3)将对话输入句向量模型中,得到对话的句向量;
4.4)将对话及其句向量存储到对话列表中;
4.5)使用BiLSTM-CRF模型对对话列表进行对话分块;
4.6)根据4.5)得到的对话分块结果,若结果末端为一个对话块,则进入4.7),否则跳转到4.1);
4.7)将4.6)得到的对话块中的句子拼接起来,使用StarSpace模型进行意图分类;
4.8)根据意图分类结果,若意图分类结果置信度大于预设置置信度阈值C,则输出意图,否则该意图分类结果被过滤;
4.9)输出最佳意图,若存在未处理的对话数据,则跳转到4.1),否则算法结束。
CN201910605719.0A 2019-07-05 2019-07-05 一种多轮对话意图识别方法 Active CN110321564B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910605719.0A CN110321564B (zh) 2019-07-05 2019-07-05 一种多轮对话意图识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910605719.0A CN110321564B (zh) 2019-07-05 2019-07-05 一种多轮对话意图识别方法

Publications (2)

Publication Number Publication Date
CN110321564A CN110321564A (zh) 2019-10-11
CN110321564B true CN110321564B (zh) 2023-07-14

Family

ID=68122943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910605719.0A Active CN110321564B (zh) 2019-07-05 2019-07-05 一种多轮对话意图识别方法

Country Status (1)

Country Link
CN (1) CN110321564B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111552805B (zh) * 2020-04-16 2021-07-09 重庆大学 一种问答系统问句意图识别方法
US11562028B2 (en) * 2020-08-28 2023-01-24 International Business Machines Corporation Concept prediction to create new intents and assign examples automatically in dialog systems
CN112183098B (zh) * 2020-09-30 2022-05-06 完美世界(北京)软件科技发展有限公司 会话的处理方法和装置、存储介质、电子装置
CN112270182B (zh) * 2020-11-12 2022-11-08 佰聆数据股份有限公司 一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质
CN112784024B (zh) * 2021-01-11 2023-10-31 软通动力信息技术(集团)股份有限公司 一种人机对话的方法、装置、设备以及存储介质
CN113111159A (zh) * 2021-04-21 2021-07-13 康键信息技术(深圳)有限公司 问答记录生成方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292696A (zh) * 2017-04-27 2017-10-24 深圳虫门科技有限公司 一种汽车智能导购系统以及实现方法
CN109241255A (zh) * 2018-08-20 2019-01-18 华中师范大学 一种基于深度学习的意图识别方法
CN109697679A (zh) * 2018-12-27 2019-04-30 厦门智融合科技有限公司 知识产权服务导引方法及系统
CN109753565A (zh) * 2018-12-27 2019-05-14 厦门智融合科技有限公司 知识产权智能服务方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292696A (zh) * 2017-04-27 2017-10-24 深圳虫门科技有限公司 一种汽车智能导购系统以及实现方法
CN109241255A (zh) * 2018-08-20 2019-01-18 华中师范大学 一种基于深度学习的意图识别方法
CN109697679A (zh) * 2018-12-27 2019-04-30 厦门智融合科技有限公司 知识产权服务导引方法及系统
CN109753565A (zh) * 2018-12-27 2019-05-14 厦门智融合科技有限公司 知识产权智能服务方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
StarSpace: Embed All The Things!;Ledell Wu 等;《The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI-18)》;20180427;第32卷(第1期);第5569-5577页 *

Also Published As

Publication number Publication date
CN110321564A (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN110321564B (zh) 一种多轮对话意图识别方法
CN111339281B (zh) 一种多视角融合的阅读理解选择题的答案选择方法
CN114722839B (zh) 人机协同对话交互系统及方法
CN106844344B (zh) 用于对话的贡献度计算方法及主题抽取方法和系统
CN109325780A (zh) 一种面向电子政务领域的智能客服系统的交互方法
CN111159375A (zh) 一种文本处理方法及装置
CN112069781B (zh) 一种评语生成方法、装置、终端设备及存储介质
CN111429157A (zh) 投诉工单的评价处理方法、装置、设备及存储介质
CN115643341A (zh) 人工智能客服应答系统
CN114997181A (zh) 一种基于用户反馈修正的智能问答方法及系统
CN117076693A (zh) 一种数字人教师多模态大语言模型预训练学科语料库的构建方法
CN116910220A (zh) 多轮对话交互处理方法、装置、设备和存储介质
CN116010569A (zh) 在线答疑方法、系统、电子设备及存储介质
CN113297365B (zh) 一种用户意向判定方法、装置、设备及存储介质
CN114003700A (zh) 一种对话信息的处理方法、系统、电子设备及存储介质
CN110517672A (zh) 用户意图识别方法、用户指令执行方法、系统及设备
CN113486174A (zh) 模型训练、阅读理解方法、装置、电子设备及存储介质
CN110362828B (zh) 网络资讯风险识别方法及系统
CN117171314A (zh) 基于大模型的多模态政务问答方法
CN111091826A (zh) 基于深度学习和有限状态机的智能语音机器人系统
CN115688758A (zh) 一种语句意图识别方法、装置和存储介质
CN115687581A (zh) 一种基于注意力机制的电力客服交互式问答方法及装置
CN110472032A (zh) 医疗自定义实体词词性标签的多分类智能问答检索方法
CN112749556B (zh) 多语言模型的训练方法和装置、存储介质和电子设备
CN113408287A (zh) 实体识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant