CN110321564B - 一种多轮对话意图识别方法 - Google Patents
一种多轮对话意图识别方法 Download PDFInfo
- Publication number
- CN110321564B CN110321564B CN201910605719.0A CN201910605719A CN110321564B CN 110321564 B CN110321564 B CN 110321564B CN 201910605719 A CN201910605719 A CN 201910605719A CN 110321564 B CN110321564 B CN 110321564B
- Authority
- CN
- China
- Prior art keywords
- model
- dialogue
- intention
- corpus
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种多轮对话意图识别方法,包括如下步骤:1)根据应用场景确定要识别的对话意图,并获取大量对话数据,人工找出对话数据中的对话块以及其对应的意图,进行语料标注;2)根据人工整理好的停用词表去除对话数据中的停用词;3)构建用于意图识别的句向量模型、BiLSTM‑CRF模型及StarSpace模型;4)由句向量模型、BiLSTM‑CRF模型和StarSpace模型实时获取对话数据,进行意图识别,输出最佳意图。本发明的有益效果是:意图识别高效,准确率高,泛化能力强,人工标注语料成本低。
Description
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种多轮对话意图识别方法。
背景技术
如今人类进入了人工智能时代,众多企业都在开发自己的客服机器人。这不仅方便用户24小时咨询问题,也减轻了企业雇佣客服人员的成本,然而目前多数客服机器人并没有非常智能,不能满足用户的实际需求,例如,目前,客服机器人对话意图识别方式类型主要有三种:
第一种采用规则模板的方法。即通过收集大量用户语料,人工整理出用户咨询问题模板,然后机器人根据模板匹配结果回答用户问题。这种方式准确率较高,适合小规模的客服机器人。
第二种采用传统机器学习的方法。即将意图识别问题看成分类问题,通过支持向量机、随机森林等分类方法,在基于用户标注语料训练下得到分类模型,然后机器人根据模型预测用户意图,进而回答用户问题。这种方式节省了大量人工整理用户问题模板时间,而且机器人泛化能力较强。
第三种采用深度学习的方法。即采用当下最热门的深度学习模型,如长短期记忆网络、双向长短期记忆网络等方法,在基于巨大量的用户标注语料下得到深度学习模型,然后机器人根据模型预测用户意图,进而回答用户问题。这种方式考虑到了用户对话信息的上下文联系,而且机器人泛化能力强,适合于大规模的客服机器人。
比较三种方法,方案一的缺点是,需要大量人工去整理用户语料,形成用户问题模板,然后对客服机器人进行配置。对于那些没有整理配置的问题,机器人无法进行回答,泛化能力很差。方案二,虽然也需要人工标注语料,但是标注难度比方案一小很多,并且可以采用模型辅助进行语料标注。客服机器人的泛化能力也有所提升。方案三,需要投入大量的人工去标注语料,其语料标注规模是前两种方案的几十倍甚至百倍,但正因如此方案三从中很好地学习了用户对话与意图间的转化关系,极大地提高了意图识别的准确率和机器人的泛化能力。
发明内容
为了解决现有客服机器人意图识别的不足之处,本发明提供了一种多轮对话意图识别方法,该方法基于人工标注用户对话语料,通过采用双向长短期记忆网络-条件随机场(BiLSTM-CRF)模型联系对话上下文,采用StarSpace模型进行意图分类,根据意图分类模型计算得到的意图置信度进行排序过滤,输出最佳意图。
本发明的技术方案如下:
一种多轮对话意图识别方法,其特征在于,包括如下步骤:
1)根据应用场景确定要识别的对话意图,并获取大量对话数据,人工找出对话数据中的对话块以及其对应的意图,进行语料标注;
2)根据人工整理好的停用词表去除对话数据中的停用词;
3)构建用于意图识别的句向量模型、BiLSTM-CRF模型及StarSpace模型;
4)由句向量模型、BiLSTM-CRF模型和StarSpace模型实时获取对话数据,进行意图识别,输出最佳意图。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤2)具体为:
2.1)将对话数据使用分词工具进行分词;
2.2)将分词结果中的每个词与停用词表中的词进行判断,若分词结果中的词在停用词表中存在,则去除该词,否则保留;
2.3)将2.2)得到的结果拼接为句子。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤3)中句向量模型构建步骤具体为:
3.1)获取去除停用词后的人工标注语料,将语料中的每句话按字符拆分为List,最终得到整个语料的List列表;
3.2)设置sentence2vec算法的预设参数,句子嵌入向量空间的维度n和语料总共使用的次数epoch;
3.3)将3.1)中得到的语料List列表作为sentence2vec的输入,进行句向量模型训练;
3.4)将3.3)训练得到的句向量模型存储到磁盘上。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤3)中BiLSTM-CRF模型构建步骤具体为:
3.5)获取去除停用词后的人工标注语料,首先使用句向量模型将对话转化为句向量,然后根据对话块标注块标签,其中,B表示块开始位置,I表示块中位置,E表示块结束位置,O表示其他位置;
3.6)设置BiLSTM-CRF模型预设参数,模型隐藏层大小hidden_size、随机失活率dropout、语料总共使用的次数epoch、每批次大小batch_size;
3.7)将3.5)进行块标注后的语料作为BiLSTM-CRF模型的输入,进行BiLSTM-CRF模型训练;
3.8)将3.7)训练得到的BiLSTM-CRF模型存储到磁盘上。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤3)中StarSpace模型构建步骤具体为:
3.9)获取去除停用词后的人工标注语料,只取有意图的对话块,将对话块中的句子拼接起来,与其对应的意图形成key-value对,存储在List中。
3.10)设置StarSpace模型预设参数,对话嵌入粒度、模型隐藏层大小hidden_size、语料总共使用的次数epoch、每批次大小batch_size。
3.11)将3.9)得到的存有key-value对的List作为StarSpace模型的输入,进行StarSpace模型训练;
3.12)将3.11)训练得到的StarSpace模型存储到磁盘上。
所述的一种多轮对话意图识别方法,其特征在于,所述步骤4)具体为:
4.1)从对话数据中获取一句对话;
4.2)根据停用词表去除对话中的停用词;
4.3)将对话输入句向量模型中,得到对话的句向量;
4.4)将对话及其句向量存储到对话列表中;
4.5)使用BiLSTM-CRF模型对对话列表进行对话分块;
4.6)根据4.5)得到的对话分块结果,若结果末端为一个对话块,则进入4.7),否则跳转到4.1);
4.7)将4.6)得到的对话块中的句子拼接起来,使用StarSpace模型进行意图分类;
4.8)根据意图分类结果,若意图分类结果置信度大于预设置置信度阈值C,则输出意图,否则该意图分类结果被过滤;
4.9)输出最佳意图,若存在未处理的对话数据,则跳转到4.1),否则算法结束。
本发明的有益效果是:
1)本发明采用了深度学习的方法,克服了背景技术方案一泛化能力差的问题。将联系用户对话上下文看作序列标注问题,采用序列标注方法进行对话分块,很好的解决了方案二没有考虑上下文联系的问题。
2)由于本发明将意图识别抽象为了序列标注问题和分类问题,采用两个深度学习模型分别负责语义联系和意图分类,与方案三采用一个深度学习模型同时负责这两个功能相比,本发明所需的语料远低于方案三所需的语料,在保证准确率和泛化能力的前提下,采用本发明的方法大大降低了人工标注语料的成本,克服了方案三语料标注成本高的问题。
3)本发明意图识别高效,准确率高,泛化能力强,人工标注语料成本低。
附图说明
图1表示本发明方案的模型构建流程图;
图2表示本发明方案的意图识别流程图。
具体实施方法
下面结合说明书附图,并结合实施例来说明本发明的算法实施方法。
一种多轮对话意图识别方法,包括如下步骤:
步骤1:根据应用场景确定要识别的对话意图,并获取大量对话数据,人工找出对话数据中的对话块以及其对应的意图,进行语料标注;
人们通常会用连续几句话来表达同一个意图,我们称之为对话块。在语料标注之前,首先根据客服机器人应用场景确定机器人想要识别的意图名称。然后,取一通完整的对话数据,人工找出对话中的对话块以及其对应的意图,进行标注,最后,我们将标注好的对话数据存储到磁盘上。本发明采用了三个深度学习模型(句向量模型、BiLSTM-CRF模型、StarSpace模型),它们都由多层神经网络构成。因此,需要通过大量人工标注语料来训练优化模型参数。
步骤2:根据人工整理好的停用词表去除对话数据中的停用词;
由于人们在对话中会使用大量的虚词、语气词等停用词,而这些词频繁出现,不仅影响意图识别的准确率,还极大的造成了存储空间的浪费,所以根据人工整理好的停用词表去除对话数据中的停用词。
S1)将对话数据使用分词工具(如:jieba分词)进行分词;
S2)将分词结果中的每个词与停用词表中的词进行判断,若分词结果中的词在停用词表中存在,则去除该词,否则保留;
S3)将S2得到的结果拼接为句子。
步骤3:构建用于意图识别的句向量模型、BiLSTM-CRF模型及StarSpace模型,为之后意图识别提供底层模型支撑。
构建句向量模型:
该模型可以将句子嵌入到向量空间中。模型有两个参数需要预先设定:1)句子嵌入向量空间的维度n;2)模型训练过程中,语料总共使用的次数epoch。
S1)获取去除停用词后的人工标注语料,将语料中的每句话按字符拆分为List,最终得到整个语料的List列表;
S2)设置sentence2vec算法的预设参数,句子嵌入向量空间的维度n和语料总共使用的次数epoch;
S3)将S1中得到的语料List列表作为sentence2vec的输入,进行句向量模型训练;
S4)将S3训练得到的句向量模型存储到磁盘上。
构建BiLSTM-CRF模型:
该模型可以进行对话分块,用于联系对话上下文。模型需要预先设定参数:1)块标签,通常为[B,I,E,O];2)模型隐藏层大小hidden_size;3)随机失活率dropout;4)模型训练过程中,语料总共使用的次数epoch;5)模型训练过程中,每批次大小batch_size。
S1)获取去除停用词后的人工标注语料,首先使用句向量模型将对话转化为句向量,然后根据对话块标注块标签,其中,B表示块开始位置,I表示块中位置,E表示块结束位置,O表示其他位置;
S2)设置BiLSTM-CRF模型预设参数,模型隐藏层大小hidden_size、随机失活率dropout、语料总共使用的次数epoch、每批次大小batch_size;
S3)将S1进行块标注后的语料作为BiLSTM-CRF模型的输入,进行BiLSTM-CRF模型训练;
S4)将S3训练得到的BiLSTM-CRF模型存储到磁盘上。
构建StarSpace模型:
该模型可以进行意图分类,并输出意图置信度。模型需要预先设定参数:1)对话嵌入粒度,字符或词;2)模型隐藏层大小hidden_size;3)模型训练过程中,语料总共使用的次数epoch;4)模型训练过程中,每批次大小batch_size。
S1)获取去除停用词后的人工标注语料,只取有意图的对话块,将对话块中的句子拼接起来,与其对应的意图形成key-value对,存储在List中;
S2)设置StarSpace模型预设参数,对话嵌入粒度、模型隐藏层大小hidden_size、语料总共使用的次数epoch、每批次大小batch_size;
S3)将S1得到的存有key-value对的List作为StarSpace模型的输入,进行StarSpace模型训练;
S4)将S3训练得到的StarSpace模型存储到磁盘上。
步骤4:由句向量模型、BiLSTM-CRF模型和StarSpace模型实时获取对话数据,进行意图识别,输出最佳意图。
该部分的目的是根据实时对话数据,高效准确地进行意图识别,为客服机器人提供意图识别能力。在意图识别流程中需要设置置信度阈值C,用于过滤意图分类结果,只输出意图分类置信度大于阈值C的意图,提高意图识别准确率。
由第一部分构建模型得到了句向量模型、BiLSTM-CRF模型和StarSpace模型。它们为意图识别提供了基础能力。算法实时获取对话数据,进行意图识别,输出最佳意图,具体步骤如下:
S1)从对话数据中获取一句对话;
S2)根据停用词表去除对话中的停用词;
S3)将对话输入句向量模型中,得到对话的句向量;
S4)将对话及其句向量存储到对话列表中;
S5)使用BiLSTM-CRF模型对对话列表进行对话分块;
S6)根据S5得到的对话分块结果,若结果末端为一个对话块,则进入S7,否则跳转到S1;
S7)将S6得到的对话块中的句子拼接起来,使用StarSpace模型进行意图分类;
S8)根据意图分类结果,若意图分类结果置信度大于预设置置信度阈值C,则输出意图,否则该意图分类结果被过滤;
S9)输出最佳意图,若存在未处理的对话数据,则跳转到S1,否则算法结束。
本发明的实施例:
由于模型训练需要大量的人工标注语料,我们以标注一则对话为例。假设现有一则对话,如表1所示。
表1
角色 | 内容 |
坐席 | 31552号话务员为您服务 |
客户 | 我想查询一下话费 |
坐席 | 请问您想查询哪个月的话费 |
客户 | 上个月的 |
坐席 | 您上个月话费总共58元 |
客户 | 我想办理宽带 |
坐席 | 好的,为您推荐融合宽带 |
客户 | 好的,谢谢 |
在标注之前,我们需要预先确定意图名称,以举例意图识别场景为例,有“查话费”、“办理宽带”两个意图。经人工标注后,结果如表2所示。
表2
角色 | 内容 | 块序号 | 意图 |
坐席 | 31552号话务员为您服务 | 1 | |
客户 | 我想查询一下话费 | 2 | 查话费 |
坐席 | 请问您想查询哪个月的话费 | 2 | |
客户 | 上个月的 | 2 | |
坐席 | 您上个月话费总共58元 | 3 | |
客户 | 我想办理宽带 | 4 | 办理宽带 |
坐席 | 好的,为您推荐融合宽带 | 5 | |
客户 | 好的,谢谢 | 6 |
其中,连续几句话表达同一意图的对话被标记为同一块序号,对于在意图识别场景有意义的对话块,标注上对应意图名称。
在构建模型之前需要去除标注语料中的停用词,如“请问您想查询哪个月的话费”去除停用词后为“查询哪月话费”。同样,根据停用词表得到其他对话去停用词后的结果,如表3所示。
表3
角色 | 内容 | 块序号 | 意图 |
坐席 | 话务员服务 | 1 | |
客户 | 查询话费 | 2 | 查话费 |
坐席 | 查询哪月话费 | 2 | |
客户 | 上月 | 2 | |
坐席 | 上月话费总共58元 | 3 | |
客户 | 办理宽带 | 4 | 办理宽带 |
坐席 | 推荐融合宽带 | 5 | |
客户 | 6 |
构建句向量模型,首先将语料转换为句向量模型训练格式,将表3内容列每行按字符拆分,存储到List中,得到句List,再将句List存储在整个对话的List中,转换完成后部分结果如下所示[[“话”,“务”,“员”,“服”,“务”],[“查”,“询”,“话”,“费”]]。设置sentence2vec算法的预设参数,句子嵌入向量空间的维度n=5和语料总共使用的次数epoch=500,将转换后结果采用sentence2vec算法进行句向量模型训练,将训练好的句向量模型存储到磁盘上。
构建BiLSTM-CRF模型,首先将语料转换为BiLSTM-CRF模型训练格式。规定块标签为[B,I,E,O]。其中,B表示块开始位置,I表示块中位置,E表示块结束位置,O表示其他位置。每句话采用句向量模型转为句向量。将表3转换成模型训练格式,如表4所示。
表4
设置BiLSTM-CRF模型预设参数,模型隐藏层大小hidden_size=128、随机失活率dropout=0.5、语料总共使用的次数epoch=150、每批次大小batch_size=20。将转换后的结果采用BiLSTM-CRF进行模型训练,将训练好的BiLSTM-CRF模型存储到磁盘上。
构建StarSpace模型,首先将语料转换为StarSpace模型训练格式。将同一对话块的句子进行拼接,并和对应的意图组成key-value进行存储。将表3转换成模型训练格式,结果如下{“查询话费查询哪月话费上月”:“查话费”,“办理宽带”:“办理宽带”}。设置StarSpace模型预设参数,对话嵌入粒度=“char”、模型隐藏层大小hidden_size=[128,256]、语料总共使用的次数epoch=300、每批次大小batch_size=20。将转换后的结果采用StarSpace进行模型训练,将训练好的StarSpace模型存储到磁盘上。
为叙述方便,意图识别对话数据仍然使用表1,实际中,对话数据和构建模型数据不相同。预先设定意图分类置信度阈值C=0.9。假设意图识别流程已经处理完对话数据前3句,开始处理第4句。算法获取第4句对话“上个月的”,根据停用词表去除停用词后为“上月”。然后采用句向量模型将对话转为句向量[0.61,-0.23,0.93,0.43,0.32],存储到对话列表中,此时对话列表如表5所示。
表5
角色 | 内容 | 句向量 |
坐席 | 话务员服务 | [0.32,0.56,0.12,-0.64,0.88] |
客户 | 查询话费 | [0.11,0.87,0.33,0.45,0.91] |
坐席 | 查询哪月话费 | [-0.22,1.03,0.56.0.76,0.02] |
客户 | 上月 | [0.61,-0.23,0.93,0.43,0.32] |
将表5句向量组成的List使用BiLSTM-CRF模型进行对话分块,结果为[O,B,I,E]。算法发现分块结果末端为一个对话块,所以将对话块中的句子进行拼接,结果为“查询话费查询哪月话费上月”。若此阶段算法没有发现分块结果末端为一个对话块,则获取下一句对话数据,开始下一轮意图识别。
得到拼接完成的对话后,使用StarSpace模型进行意图分类,得到分类结果。其中,包含意图名称和意图置信度{“name”:“查话费”,“confidence”:0.91672}。根据分类结果发现意图分类置信度0.91672大于预先设定的意图分类置信度阈值C=0.9,算法认为意图分类结果是准确的,于是输出此意图。若此阶段意图分类置信度小于预先设定的意图分类置信度阈值C,则认为该对话块不足以形成一个意图输出。
同样的,对话数据中的剩余对话都按照上述流程进行意图识别。若对话数据被全部处理完,则算法结束。
Claims (3)
1.一种多轮对话意图识别方法,其特征在于,包括如下步骤:
1)根据应用场景确定要识别的对话意图,并获取大量对话数据,人工找出对话数据中的对话块以及其对应的意图,进行语料标注;
2)根据人工整理好的停用词表去除对话数据中的停用词;
3)构建用于意图识别的句向量模型、BiLSTM-CRF模型及StarSpace模型;
所述步骤3)中句向量模型构建步骤具体为:
3.1)获取去除停用词后的人工标注语料,将语料中的每句话按字符拆分为List,最终得到整个语料的List列表;
3.2)设置sentence2vec算法的预设参数,句子嵌入向量空间的维度n和语料总共使用的次数epoch;
3.3)将3.1)中得到的语料List列表作为sentence2vec的输入,进行句向量模型训练;
3.4)将3.3)训练得到的句向量模型存储到磁盘上;
所述步骤3)中BiLSTM-CRF模型构建步骤具体为:
3.5)获取去除停用词后的人工标注语料,首先使用句向量模型将对话转化为句向量,然后根据对话块标注块标签,其中,B表示块开始位置,I表示块中位置,E表示块结束位置,O表示其他位置;
3.6)设置BiLSTM-CRF模型预设参数,模型隐藏层大小hidden_size、随机失活率dropout、语料总共使用的次数epoch、每批次大小batch_size;
3.7)将3.5)进行块标注后的语料作为BiLSTM-CRF模型的输入,进行BiLSTM-CRF模型训练;
3.8)将3.7)训练得到的BiLSTM-CRF模型存储到磁盘上;
所述步骤3)中StarSpace模型构建步骤具体为:
3.9)获取去除停用词后的人工标注语料,只取有意图的对话块,将对话块中的句子拼接起来,与其对应的意图形成key-value对,存储在List中;
3.10)设置StarSpace模型预设参数,对话嵌入粒度、模型隐藏层大小hidden_size、语料总共使用的次数epoch、每批次大小batch_size;
3.11)将3.9)得到的存有key-value对的List作为StarSpace模型的输入,进行StarSpace模型训练;
3.12)将3.11)训练得到的StarSpace模型存储到磁盘上;
4)由句向量模型、BiLSTM-CRF模型和StarSpace模型实时获取对话数据,进行意图识别,输出最佳意图。
2.根据权利要求1所述的一种多轮对话意图识别方法,其特征在于,所述步骤2)具体为:
2.1)将对话数据使用分词工具进行分词;
2.2)将分词结果中的每个词与停用词表中的词进行判断,若分词结果中的词在停用词表中存在,则去除该词,否则保留;
2.3)将2.2)得到的结果拼接为句子。
3.根据权利要求1所述的一种多轮对话意图识别方法,其特征在于,所述步骤4)具体为:
4.1)从对话数据中获取一句对话;
4.2)根据停用词表去除对话中的停用词;
4.3)将对话输入句向量模型中,得到对话的句向量;
4.4)将对话及其句向量存储到对话列表中;
4.5)使用BiLSTM-CRF模型对对话列表进行对话分块;
4.6)根据4.5)得到的对话分块结果,若结果末端为一个对话块,则进入4.7),否则跳转到4.1);
4.7)将4.6)得到的对话块中的句子拼接起来,使用StarSpace模型进行意图分类;
4.8)根据意图分类结果,若意图分类结果置信度大于预设置置信度阈值C,则输出意图,否则该意图分类结果被过滤;
4.9)输出最佳意图,若存在未处理的对话数据,则跳转到4.1),否则算法结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910605719.0A CN110321564B (zh) | 2019-07-05 | 2019-07-05 | 一种多轮对话意图识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910605719.0A CN110321564B (zh) | 2019-07-05 | 2019-07-05 | 一种多轮对话意图识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110321564A CN110321564A (zh) | 2019-10-11 |
CN110321564B true CN110321564B (zh) | 2023-07-14 |
Family
ID=68122943
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910605719.0A Active CN110321564B (zh) | 2019-07-05 | 2019-07-05 | 一种多轮对话意图识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110321564B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111552805B (zh) * | 2020-04-16 | 2021-07-09 | 重庆大学 | 一种问答系统问句意图识别方法 |
US11562028B2 (en) * | 2020-08-28 | 2023-01-24 | International Business Machines Corporation | Concept prediction to create new intents and assign examples automatically in dialog systems |
CN112183098B (zh) * | 2020-09-30 | 2022-05-06 | 完美世界(北京)软件科技发展有限公司 | 会话的处理方法和装置、存储介质、电子装置 |
CN112270182B (zh) * | 2020-11-12 | 2022-11-08 | 佰聆数据股份有限公司 | 一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质 |
CN112784024B (zh) * | 2021-01-11 | 2023-10-31 | 软通动力信息技术(集团)股份有限公司 | 一种人机对话的方法、装置、设备以及存储介质 |
CN113111159A (zh) * | 2021-04-21 | 2021-07-13 | 康键信息技术(深圳)有限公司 | 问答记录生成方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292696A (zh) * | 2017-04-27 | 2017-10-24 | 深圳虫门科技有限公司 | 一种汽车智能导购系统以及实现方法 |
CN109241255A (zh) * | 2018-08-20 | 2019-01-18 | 华中师范大学 | 一种基于深度学习的意图识别方法 |
CN109697679A (zh) * | 2018-12-27 | 2019-04-30 | 厦门智融合科技有限公司 | 知识产权服务导引方法及系统 |
CN109753565A (zh) * | 2018-12-27 | 2019-05-14 | 厦门智融合科技有限公司 | 知识产权智能服务方法及系统 |
-
2019
- 2019-07-05 CN CN201910605719.0A patent/CN110321564B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292696A (zh) * | 2017-04-27 | 2017-10-24 | 深圳虫门科技有限公司 | 一种汽车智能导购系统以及实现方法 |
CN109241255A (zh) * | 2018-08-20 | 2019-01-18 | 华中师范大学 | 一种基于深度学习的意图识别方法 |
CN109697679A (zh) * | 2018-12-27 | 2019-04-30 | 厦门智融合科技有限公司 | 知识产权服务导引方法及系统 |
CN109753565A (zh) * | 2018-12-27 | 2019-05-14 | 厦门智融合科技有限公司 | 知识产权智能服务方法及系统 |
Non-Patent Citations (1)
Title |
---|
StarSpace: Embed All The Things!;Ledell Wu 等;《The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI-18)》;20180427;第32卷(第1期);第5569-5577页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110321564A (zh) | 2019-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110321564B (zh) | 一种多轮对话意图识别方法 | |
CN111339281B (zh) | 一种多视角融合的阅读理解选择题的答案选择方法 | |
CN114722839B (zh) | 人机协同对话交互系统及方法 | |
CN106844344B (zh) | 用于对话的贡献度计算方法及主题抽取方法和系统 | |
CN109325780A (zh) | 一种面向电子政务领域的智能客服系统的交互方法 | |
CN111159375A (zh) | 一种文本处理方法及装置 | |
CN112069781B (zh) | 一种评语生成方法、装置、终端设备及存储介质 | |
CN111429157A (zh) | 投诉工单的评价处理方法、装置、设备及存储介质 | |
CN115643341A (zh) | 人工智能客服应答系统 | |
CN114997181A (zh) | 一种基于用户反馈修正的智能问答方法及系统 | |
CN117076693A (zh) | 一种数字人教师多模态大语言模型预训练学科语料库的构建方法 | |
CN116910220A (zh) | 多轮对话交互处理方法、装置、设备和存储介质 | |
CN116010569A (zh) | 在线答疑方法、系统、电子设备及存储介质 | |
CN113297365B (zh) | 一种用户意向判定方法、装置、设备及存储介质 | |
CN114003700A (zh) | 一种对话信息的处理方法、系统、电子设备及存储介质 | |
CN110517672A (zh) | 用户意图识别方法、用户指令执行方法、系统及设备 | |
CN113486174A (zh) | 模型训练、阅读理解方法、装置、电子设备及存储介质 | |
CN110362828B (zh) | 网络资讯风险识别方法及系统 | |
CN117171314A (zh) | 基于大模型的多模态政务问答方法 | |
CN111091826A (zh) | 基于深度学习和有限状态机的智能语音机器人系统 | |
CN115688758A (zh) | 一种语句意图识别方法、装置和存储介质 | |
CN115687581A (zh) | 一种基于注意力机制的电力客服交互式问答方法及装置 | |
CN110472032A (zh) | 医疗自定义实体词词性标签的多分类智能问答检索方法 | |
CN112749556B (zh) | 多语言模型的训练方法和装置、存储介质和电子设备 | |
CN113408287A (zh) | 实体识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |