CN108334891B - 一种任务型意图分类方法及装置 - Google Patents
一种任务型意图分类方法及装置 Download PDFInfo
- Publication number
- CN108334891B CN108334891B CN201711352983.5A CN201711352983A CN108334891B CN 108334891 B CN108334891 B CN 108334891B CN 201711352983 A CN201711352983 A CN 201711352983A CN 108334891 B CN108334891 B CN 108334891B
- Authority
- CN
- China
- Prior art keywords
- intention
- unit
- vector
- classified
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种任务型意图分类方法及装置,所述方法包括:接收用户输入的待分类表述;对所述待分类表述进行预处理,得到待分类表述文本;根据已训练的意图分类模型,为所述待分类表述文本生成对应的向量;计算生成的所述向量与意图向量集合中所有意图向量的相似度;选取相似度最高意图向量,作为所述待分类表述的意图类别。本发明实施例中,将分类问题转换为待分类表述文本和意图向量之间的相似度计算问题,从已训练的数据中学习相似性向量,并用学习得到的向量去匹配和分类未知类别的样本,从而解决了在训练更新意图分类模型时需要投入大量的人力物力的问题,降低成本,提高了模型更新效率。同时也为用户带来了人性化的服务体验。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种任务型意图分类方法及装置。
背景技术
随着软硬件技术的快速发展,智能助手作为一种结合机器智能和对话的新型产品形态,以用户意图理解为基础,帮助用户完成特定任务,为用户带来了人性化的服务体验。
其中,任务型意图分类技术是用户意图理解的重要基础之一。任务型意图通常指的是用户期望对某个领域的对象采用特定类型的操作,完成特定任务。然而,目前的意图分类技术往往局限于特定的领域,且依赖于人工标注的语料训练模型。在实际应用中,由于产品迭代的需要,分类模型需要不断更新以支持新的领域及意图,不同的产品需要识别的意图不同,比如,一种产品需要识别的意图包括:“下载游戏”,“推荐视频”,“搜索游戏”,“预测股票价格”等,而另一种产品需要识别的意图包括:“下载视频”,“搜索视频”,“推荐债券”,“预测期权价格”等。如果在短期之内获取大规模高质量口语语料,快速训练更新模型,满足产品需求,则需要投入大量的人力、物力,代价高昂。
因此,如何在减少人力和物力的前提下,提高训练更新意图分类模型的效率是目前有待解决的技术问题。
发明内容
本发明实施例所要解决的技术问题是提供一种任务型意图分类方法,以解决现有技术中在训练更新意图分类模型时需要投入大量的人力和物力,导致成本增加,模型更新效率低的术问题。
相应的,本发明实施例还提供了一种任务型意图分类装置,用以保证上述方法的实现及应用。
为了解决上述问题,本发明是通过如下技术方案实现的:
第一方面提供一种任务型意图分类方法,所述方法包括:
接收用户输入的待分类表述;
对所述待分类表述进行预处理,得到待分类表述文本;
根据已训练的意图分类模型,为所述待分类表述文本生成对应的向量;
计算生成的所述向量与意图分类模型中已有意图向量的相似度;
选取相似度最高意图向量,作为所述待分类表述的意图类别。
可选的,所述方法还包括:
获取用户意图和已标注分类的表述样本;
将所述用户意图和已标注分类的表述样本输入神经网络模型进行训练,以映射到同一个语义空间;
在训练结束后,得到每个意图对应的意图向量,组合所有意图向量,得到意图向量集合;
将所述意图向量集合存储到意图分类模型中。
可选的,所述方法还包括:
获取用户的新意图;
计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度;
判断所述结构相似度是否大于设定阈值;
如果所述结构相似度大于设定阈值,则将所述新意图输入到已训练的意图分类模型中;
根据已训练的所述意图分类模型为所述新意图生成对应的向量;
将所述新意图对应的向量更新到意图分类模型对应的意图向量集合中。
可选的,所述计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度,包括:
根据所述新意图及意图初始种子词计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度。
可选的,所述方法还包括:
定义任务型意图的通用模式:描述用户的操作类型和描述用户需要操作的特定领域对象;
初始化训练集对应的任务型意图的映射表、行为列表和领域对象列表;
根据所述任务型意图映射表,行为列表和领域对象列表,建立领域对象的分布式表示模型。
可选的,所述方法还包括:
如果所述结构相似度不大于设定阈值,则挖掘训练语料,根据所述训练语料重新训练意图分类模型。
可选的,
所述挖掘训练语料包括:以意图初始种子词为搜索词来搜索互联网站,得到对应的结果列表;选取所述结果列表中的前k个问题,其中,k为大于零的整数;
所述重新训练意图分类模型包括:将所述前k个问题作为训练样本,重新训练所述意图分类模型,得到对应的意图向量;
或者
所述挖掘训练语料包括:基于搜索引擎点击日志,查找所述意图初始种子词对应的相似查询;选取点击同一个文本且相似度高于设定阀值的查询结果;
所述重新训练意图分类模型包括:将所述查询结果作为训练样本,重新训练所述意图分类模型,得到对应的意图向量。
第二方面提供一种任务型意图分类装置,所述装置包括:
接收单元,用于接收用户输入的待分类表述;
预处理单元,用于对所述待分类的表述进行预处理,得到待分类表述文本;
第一生成单元,用于根据已训练的意图分类模型,为所述待分类表述文本生成对应的向量;
第一计算单元,用于计算所述第一生成单元生成的所述向量与意图向量集合中所有意图向量的相似度;
确定单元,用于取相似度最高意图向量,作为所述待分类表述的意图类别。
所述装置还包括:
第一获取单元,用于获取用户意图和已标注分类的表述样本;
训练单元,用于将所述用户意图和已标注分类的表述样本输入神经网络模型进行训练,以映射到同一个语义空间;
组合单元,用于在所述训练单元训练结束后,得到每个意图对应的意图向量,组合所有意图向量,得到意图向量集合;
存储单元,用于将所述意图向量集合存储到意图分类模型中。
可选的,所述训练单元包括:
第二获取单元,用于获取用户的新意图;
第二计算单元,用于计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度;
判断单元,用于判断所述结构相似度是否大于设定阈值;
输入单元,用于在所述判断单元判定所述结构相似度大于设定阈值时,将所述新意图输入到已训练的意图分类模型中;
第二生成单元,用于根据已训练的所述意图分类模型为所述新意图生成对应的向量;
更新单元,用于将所述新意图对应的向量更新到所述意图分类模型对应的意图向量集合中。
可选的,所述第二计算单元,具体用于根据所述新意图及意图初始种子词计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度。
可选的,所述装置还包括:
定义单元,用于定义任务型意图的通用模式:描述用户的操作类型和描述用户需要操作的特定领域对象;
初始化单元,用于初始化训练集对应的任务型意图的映射表,行为列表和领域对象列表;
建立单元,用于根据所述任务型意图映射表,行为列表和领域对象列表,建立领域对象的分布式表示模型。
可选的,所述装置还包括:
挖掘单元,用于在所述判断单元判定所述结构相似度不大于设定阈值时,挖掘训练语料;
重新训练单元,用于根据挖掘的所述训练语料重新训练意图分类模型。
可选的,所述挖掘单元包括:第一搜索单元和第一选取单元,和/或,第二搜索单元和第二选取单元,其中,
所述第一搜索单元,用于以意图初始种子词为搜索词来搜索互联网站,得到对应的结果列表;
所述第一选取单元,用于选取所述结果列表中的前k个问题,其中,k为大于零的整数;
所述第二搜索单元,用于基于搜索引擎点击日志,查找所述意图初始种子词对应的相似查询;
所述第二选取单元,用于选取点击同一个文本且相似度高于设定阀值的查询结果;
所述重新训练单元,具体用于将所述前k个问题作为训练样本,重新训练所述意图分类模型,得到对应的意图向量;和/或者,将所述查询结果作为训练样本,重新训练所述意图分类模型,得到对应的意图向量。
与现有技术相比,本发明实施例包括以下优点:
本发明实施例中,将分类问题转换为待分类表述文本和意图向量之间的相似度计算问题,从已训练的数据中学习相似性向量,并用学习得到的向量去匹配和分类未知类别的样本。从而解决了在训练更新意图分类模型时需要投入大量的人力和物力,降低成本,提高了模型更新效率。同时也为用户带来了人性化的服务体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
图1是本发明实施例提供的一种任务型意图分类方法的流程图;
图2是本发明实施例提供的一种训练意图分类模型的流程图;
图3是本发明实施例提供的一种建立领域对象表示模型的流程图;
图4是本发明实施例提供的一种任务型意图分类方法的另一流程图;
图5是本发明实施例提供的一种任务型意图分类装置的结构示意图;
图6是本发明实施例提供的一种训练意图分类模型结构示意图;
图7是本发明实施例提供的一种任务型意图分类装置的另一结构示意图;
图8是本发明实施例提供的一种建立领域对象的分布式表示模型结构示意图;
图9是本发明实施例提供的一种任务型意图分类装置的另一结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
请参阅图1,为本发明实施例提供的一种任务型意图分类方法的流程图所述方法可以包括步骤:
步骤101:接收用户输入的待分类表述(utterance);
该步骤中,后台服务器接收用户输入的待分类表述,其中,待分类表述可以是一条语音信息,也可以是一个字、词、词组、短语,或者是一句话,一段文字等。本实施例不作限制。
步骤102:对所述待分类表述进行预处理,得到待分类表述文本;
该步骤中,后台服务器对所述待分类表述进行预处理,得到待分类表述文本。其中,预处理的方式可以包括语音识别,也可以是直接使用等,其与输入的待分类表述有关,也就是说,如果输入的待分类表述是语音信息,则需要通过语音识别,将其转换为文字;如果输入的待分类表述是文字,则直接得到待分类表述文本。
步骤103:根据已训练的意图分类模型,为所述待分类表述文本生成对应的向量;
该步骤中,就是将得到的待分类表述文本输入已训练的意图分类模型,输出的就是所述待分类表述文本生成对应的向量。
步骤104:计算生成的所述向量与意图分类模型中已有意图向量的相似度;
该步骤中,可以基于欧氏距离或余弦距离来计算所述向量与意图向量集合中所有意图向量的相似度;其具体的计算过程对于本领域技术人员来说,已是熟知技术,在此不再赘述。
步骤105:选取相似度最高意图向量,作为所述待分类表述的意图类别。
该步骤中,后台服务器选取相似度最高的意图向量,作为该待分类表述对应的意图类别。
本发明实施例中,先将用户输入的待分类表述转换为待分类表述文本,然后,基于已训练的意图分类模型,为所述待分类表述文本生成对应的向量,再后,计算该向量与所有意图向量之间的相似度,并选取相似度最高的向量作为待分类表述的意图类别。也就是说,本发明实施例中,将分类问题转换为待分类表述文本和意图向量之间的相似度计算问题,从已训练的意图分类模型中学习相似性向量,并用学习得到的向量去匹配和分类未知类别的样本,从而解决了在训练更新意图分类模型时需要投入大量的人力和物力,降低成本,提高了模型更新效率。同时也为用户带来了人性化的服务体验。
还请参阅图2,为本发明实施例提供的一种训练意图分类模型的流程图,该实施例与上述实施例的不同之处在于,训练意图分类模型。在具体实现方式中,可以使用siamese结构的神经网络模型,将<intent,utterance>成对输入神经网络模型训练,模型的训练目标是优化交叉熵损失函数。神经网络模型结构可以包括但不限于此:向量层、卷积层、池化层,拼接层、隐藏层和softmax层。其具体包括:
步骤201:获取用户意图和已标注分类的表述样本;
后台服务器获取用户意图,以及与该用户意图对应的已标注分类的表示样本。
步骤202:将所述用户意图和待分类表述样本输入神经网络模型进行训练,以映射到同一个语义空间;
其中,语义空间,即语言意义的世界,一般来说,信息是意义和符号的统一体,内在的意义只有通过一定的外在形式(如动作、表情、文字、音声、图画、影像等符号)才能表达出来。因此,每一种符号体系在广义上都是传达意义的语言,它们所表达的意义构成了特定的语义空间。
该实施例中,首先,将用户意图(intent)和待分类表述(utterance)样本分别映射到双通道卷积神经网络(CNN,Convolutional NeuralNetwork),双通道CNN将其映射到卷积神经网络模型的向量层,即学习输入的用户意图(问题)和待分类表述样本(答案)的句子向量表述;经由卷积层和池化层分别输出对应的向量表示,然后对这两个向量计算相似度,再后,将这两个向量表示和相似度作为拼接层的输入,进行拼接,再经过隐藏层进行非线性变换,最后经由全连接(softmax)层,输出该utterance从属于该intent类别的概率。即输出候选答案被预测为正确或者错误的概率。
步骤203:在训练结束后,得到每个意图对应的意图向量,组合所有意图向量,得到意图向量集合;
模型训练结束后,得到每个intent对应的向量表示,该向量表示为:V1,…,Vn。
步骤204:将所述意图向量集合存储到意图分类模型中。
本发明实施例中,将分类问题转换为待分类表述文本和意图向量之间的相似度计算问题,从已训练的意图分类模型中学习相似性向量,并用学习得到的向量去匹配和分类未知类别的样本,从而解决了在训练更新意图分类模型时需要投入大量的人力和物力,降低成本,提高了模型更新效率。同时也为用户带来了人性化的服务体验。
还请参阅图3,为本发明实施例提供的一种建立领域对象表示模型的流程图,该实施例与上述实施例的不同之处在于,在接收用户输入的新意图之前,先建立所述领域对象表示模型,具体包括:
301:定义任务型意图通用模式:描述用户的操作类型和描述用户需要操作的特定领域对象;
其中,该实施例中,任务型意图可以理解为:用户希望采用特定类型的操作访问特定领域的对象。因此,本实施例中可以将任务型意图定义为以下通用模式:
ACTION_WORD+DOMAIN_OBJECT_WORD。其中,ACTION_WORD描述用户的操作类型,DOMAIN_OBJECT_WORD描述用户需要操作的特定领域对象。
例如,任务型意图为:“期权行权”,则ACTION_WORD为“行权”,DOMAIN_OBJECT_WORD为“期权”。
步骤302:初始化训练集对应的任务型意图映射表、行为列表和领域对象列表;
其中,任务型意图映射表(Intent_map)的每一项对应着一个意图键值对<intent_name,intent_init_query>,即<意图名,意图初始种子词>。例如,<buy_options,“购买期权”>;<search_video,“搜索视频”>;<download_game,“下载游戏”>;<recommend_stock,“推荐股票”>等;
行为列表(action_list)对应的是<“购买”,“搜索”,“下载”,“推荐”>等;
领域对象列表(domain_object_list)对应的是<“视频”,“游戏”,“股票”,“期权”>等。
步骤303:根据所述任务型意图映射表、行为列表和领域对象列表,生成领域对象的分布式表示模型。
该步骤中,具有相似属性的领域对象在语义空间中的距离相对更为接近。生成的领域对象的分布式表示模型具体可以采用word2vec等。模型的输入每一行格式为:
DOMAIN_OBJECT_WORD PROPERTY_1……PROPERTY_n
例如:
视频名字主创ID导演;
游戏名字主创ID解说;
明星名字生日星座血型;
角色名字扮演者星座血型;
股票公司当天开盘价当天收盘价市盈率;
期权公司当天开盘价当天收盘价隐含波动率。
领域对象表示模型建立后,每个DOMAIN_OBJECT_WORD被映射到一个低维稠密实数向量。
还请参阅图4,为本发明实施例提供的一种任务型意图分类方法的另一流程图,该实施例与上述实施例的不同之处在于,在接收用户输入的新意图时,基于图3实施例建立的所述领域对象表示模型,对于已经训练完成的意图分类模型,若需要支持新意图(intent),还需要先计算新意图(intent)和领域对象的分布式表示模型中已有意图的结构相似度,然后根据相似度的结果进行判断,具体包括:
步骤401:获取用户的新意图;
后台服务器获取用户的新意图。
步骤402:计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度;
一种计算方式为:根据所述新意图及意图初始种子词计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度。其中,意图初始种子词的结构形如:action_word+object_word。其具体的计算公式为:
Similarity<intent,intent'>=α*Similarity<action_word,action_word'>+β*Similarity<object_word,object_word'>
+γ*Distributed_Similarity<object_word,object_word'>
其中,Similarity<action_word,action_word'>,Similarity<object_word,object_word'>的词语相似度基于包含上下文及同义词的语义词典(如:同义词词林、HowNet)计算得到,如:“衍生品”和“期权”属于上下位关系。基于步骤203中生成的领域对象对应的向量,计算距离得到。距离计算方法可以采取欧氏距离或余弦距离等。α,β,γ为权重因子,可以根据实验调节经验值。
步骤403:判断所述结构相似度是否大于设定阈值;如果大于,执行步骤404;否则,执行步骤406;
后台服务器判断结构相似度是否大于设定阈值;其判断的方式为:如果意图集合中不存在所述新意图,且按上式计算的结构相似度大于指定阀值,则执行步骤404;如果意图集合中不存在所述新意图,且按上式计算的结构相似度小于等于(或不大于)指定阀值,就执行步骤406。
步骤404:将所述新意图输入到已训练的意图分类模型中,为所述新意图生成对应的向量;
该步骤中,如果后台服务器判定该意图集合中不存在新意图,且计算的结构相似度大于设定阀值,则基于已训练的意图分类模型,为该intent生成对应的向量。
步骤405:将所述新意图对应的向量更新到所述意图分类模型对应的意图向量集合中;
后台服务器将该向量加入意图模型对应的所有意图向量集合中。
步骤406:挖掘训练语料,根据所述训练语料重新训练意图分类模型。
该步骤中,如果后台服务器判定该意图集合中不存在新意图,且计算的结构相似度小于等于设定阀值,则挖掘训练语料,根据所述训练语料重新训练意图分类模型。
其中,下面以两种挖掘训练语料,根据所述训练语料重新训练意图分类模型的方式为例来说,但在实际应用中并不限于此:
第一种方式:以意图初始种子词为搜索词来搜索互联网站,得到对应的结果列表;选取所述结果列表中的前k个问题,其中,k为大于零的整数;将所述前k个问题作为训练样本,重新训练所述意图分类模型,得到对应的意图向量。
也就是说,后台服务器利用互联网QA网站数据资源,如百度知道,搜狗问答,知乎,新浪爱问等等,以该意图初始种子词作为搜索词,搜索对应的问答对结果,选取结果列表中的前(top)k个问题作为训练样本,重新训练所述意图分类模型。本实施例中,k可以取前100个,当然,还可以其前200个等,具体的取值可以根据实际需要来确定。
第二种方式:基于搜索引擎点击日志,查找所述意图初始种子词对应的相似查询;选取点击同一个文本doc且相似度高于设定阀值的查询(query)结果;将所述查询结果作为训练样本,重新训练所述意图分类模型,得到对应的意图向量。
也就是说,后台服务器基于搜索引擎点击日志,查找该意图初始种子词对应的相似query,选取点击了同一个doc且相似度高于指定阀值的query(相似度计算方法可以采取编辑距离等)作为训练样本,重新训练模型,得到对应的intent向量。
本发明实施例中,将分类问题转换为待分类表述文本和意图向量之间的相似度计算问题,从已训练的数据中学习相似性向量,并用学习得到的向量去匹配和分类未知类别的样本。从而解决了在训练更新意图分类模型时需要投入大量的人力和物力,降低成本,提高了跨领域细粒度的任务型意图分类模型更新效率。同时也为用户带来了人性化的服务体验。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
还请参阅图5,为本发明实施例提供的一种任务型意图分类装置的结构示意图,所述装置包括:接收单元51,预处理单元52,第一生成单元53,第一计算单元54和确定单元55,其中,
接收单元51,用于接收用户输入的待分类表述(utterance);
预处理单元52,用于对所述待分类的表述进行预处理,得到待分类表述文本;
第一生成单元53,用于根据已训练的意图分类模型,为所述待分类表述文本生成对应的向量;
第一计算单元54,用于计算所述第一生成单元53生成的所述向量与意图向量集合中所有意图向量的相似度;
确定单元55,用于取相似度最高意图向量,作为所述待分类表述的意图类别。
可选的,在另一实施例中,该实施例在上述实施例的基础上,所述装置还可以包括训练意图分类模型60,所述训练意图分类模型60包括:第一获取单元61,训练单元62、组合单元63和存储单元64,其结构示意图如图6所示,图6为本发明实施例提供的一种训练意图分类模型的结构示意图,具体包括:
第一获取单元61,用于获取用户意图和已标注分类的表述样本;
训练单元62,用于将所述用户意图和已标注分类的表述样本输入神经网络模型进行训练,以映射到同一个语义空间;
组合单元63,用于在所述训练单元62训练结束后,得到每个意图对应的意图向量,组合所有意图向量,得到意图向量集合;
存储单元64,用于将所述意图向量集合存储到意图分类模型中。
可选的,在另一实施例中,该实施例在上述实施例的基础上,所述装置还可以包括:第二获取单元71、第二计算单元72,判断单元73,输入单元74、第二生成单元75和更新单元76,其结构示意图如图7所示,图7以在图6的基础上为例。其中,
第二获取单元71,用于获取用户的新意图;
第二计算单元72,用于计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度;具体用于根据所述新意图及意图初始种子词计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度。
判断单元73,用于判断所述结构相似度是否大于设定阈值;
输入单元74,用于在所述判断单元73判定所述结构相似度大于设定阈值时,将所述新意图输入到已训练的意图分类模型中;
第二生成单元75,用于根据已训练的所述意图分类模型为所述新意图生成对应的向量;
更新单元76,用于将所述新意图对应的向量更新到所述意图分类模型对应的意图向量集合中。
可选的,在另一实施例中,该实施例在上述实施例的基础上,所述装置还可以包括建立领域对象的分布式表示模型80,所述将建立领域对象的分布式表示模型80包括:定义单元81,初始化单元82和建立单元83,其结构示意图如图8所示,图8为本发明实施例提供的一种建立领域对象的分布式表示模型的结构示意图,具体包括:
定义单元81,用于定义任务型意图的通用模式:描述用户的操作类型和描述用户需要操作的特定领域对象;
初始化单元82,用于初始化训练集对应的任务型意图映射表,行为列表和领域对象列表;
建立单元83,用于根据所述任务型意图映射表,行为列表和领域对象列表,建立领域对象的分布式表示模型。
可选的,在另一实施例中,该实施例在上述实施例的基础上,所述装置还可以包括:挖掘单元91和重新训练单元92,其结构示意图如图9所示,图9以在图7的基础上为例。其中,
挖掘单元91,用于在所述判断单元73判定所述结构相似度不大于设定阈值时,挖掘训练语料;
重新训练单元92,用于根据挖掘的所述训练语料重新训练意图分类模型。
可选的,在另一实施例中,该实施例在上述实施例的基础上,所述挖掘单元包括:第一搜索单元和第一选取单元,和/或,第二搜索单元和第二选取单元(图中未示),其中,
所述第一搜索单元,用于以意图初始种子词为搜索词来搜索互联网站,得到对应的结果列表;
所述第一选取单元,用于选取所述结果列表中的前k个问题,其中,k为大于零的整数;
所述第二搜索单元,用于基于搜索引擎点击日志,查找所述意图初始种子词对应的相似查询;
所述第二选取单元,用于选取点击同一个文本doc且相似度高于设定阀值的查询query结果;
所述重新训练单元,具体用于将所述前k个问题作为训练样本,重新训练所述意图分类模型,得到对应的意图向量;和/或者,将所述查询结果作为训练样本,重新训练所述意图分类模型,得到对应的意图向量。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种任务型意图分类方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种任务型意图分类方法,其特征在于,包括:
接收用户输入的待分类表述;
对所述待分类表述进行预处理,得到待分类表述文本;
根据已训练的意图分类模型,为所述待分类表述文本生成对应的向量;
计算生成的所述向量与意图分类模型中已有意图向量的相似度;
选取相似度最高意图向量,作为所述待分类表述的意图类别;
获取用户的新意图;
计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度;
判断所述结构相似度是否大于设定阈值;
如果所述结构相似度大于设定阈值,则将所述新意图输入到已训练的意图分类模型中;
根据已训练的所述意图分类模型为所述新意图生成对应的向量;
将所述新意图对应的向量更新到意图分类模型对应的意图向量集合中。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户意图和已标注分类的表述样本;
将所述用户意图和已标注分类的表述样本输入神经网络模型进行训练,以映射到同一个语义空间;
在训练结束后,得到每个意图对应的意图向量,组合所有意图向量,得到意图向量集合;
将所述意图向量集合存储到意图分类模型中。
3.根据权利要求1所述的方法,其特征在于,所述计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度,包括:
根据所述新意图及意图初始种子词计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
定义任务型意图的通用模式:描述用户的操作类型和描述用户需要操作的特定领域对象;
初始化训练集对应的任务型意图的映射表、行为列表和领域对象列表;
根据所述任务型意图映射表,行为列表和领域对象列表,建立领域对象的分布式表示模型。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
如果所述结构相似度不大于设定阈值,则挖掘训练语料,根据所述训练语料重新训练意图分类模型。
6.根据权利要求5所述的方法,其特征在于,
所述挖掘训练语料包括:以意图初始种子词为搜索词来搜索互联网站,得到对应的结果列表;选取所述结果列表中的前k个问题,其中,k为大于零的整数;
所述重新训练意图分类模型包括:将所述前k个问题作为训练样本,重新训练所述意图分类模型,得到对应的意图向量;
或者
所述挖掘训练语料包括:基于搜索引擎点击日志,查找所述意图初始种子词对应的相似查询;选取点击同一个文本且相似度高于设定阀值的查询结果;
所述重新训练意图分类模型包括:将所述查询结果作为训练样本,重新训练所述意图分类模型,得到对应的意图向量。
7.一种任务型意图分类装置,其特征在于,包括:
接收单元,用于接收用户输入的待分类表述;
预处理单元,用于对所述待分类的表述进行预处理,得到待分类表述文本;
第一生成单元,用于根据已训练的意图分类模型,为所述待分类表述文本生成对应的向量;
第一计算单元,用于计算所述第一生成单元生成的所述向量与意图分类模型中已有意图向量的相似度;
确定单元,用于取相似度最高意图向量,作为所述待分类表述的意图类别;
第二获取单元,用于获取用户的新意图;
第二计算单元,用于计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度;
判断单元,用于判断所述结构相似度是否大于设定阈值;
输入单元,用于在所述判断单元判定所述结构相似度大于设定阈值时,将所述新意图输入到已训练的意图分类模型中;
第二生成单元,用于根据已训练的所述意图分类模型为所述新意图生成对应的向量;
更新单元,用于将所述新意图对应的向量更新到所述意图分类模型对应的意图向量集合中。
8.根据权利要求7所述的装置,其特征在于,还包括:
第一获取单元,用于获取用户意图和已标注分类的表述样本;
训练单元,用于将所述用户意图和已标注分类的表述样本输入神经网络模型进行训练,以映射到同一个语义空间;
组合单元,用于在所述训练单元训练结束后,得到每个意图对应的意图向量,组合所有意图向量,得到意图向量集合;
存储单元,用于将所述意图向量集合存储到意图分类模型中。
9.根据权利要求7所述的装置,其特征在于,所述第二计算单元,具体用于根据所述新意图及意图初始种子词计算所述新意图与领域对象的分布式表示模型中已有意图的结构相似度。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
定义单元,用于定义任务型意图的通用模式:描述用户的操作类型和描述用户需要操作的特定领域对象;
初始化单元,用于初始化训练集对应的任务型意图的映射表,行为列表和领域对象列表;
建立单元,用于根据所述任务型意图映射表,行为列表和领域对象列表,建立领域对象的分布式表示模型。
11.根据权利要求7至10任一项所述的装置,其特征在于,所述装置还包括:
挖掘单元,用于在所述判断单元判定所述结构相似度不大于设定阈值时,挖掘训练语料;
重新训练单元,用于根据挖掘的所述训练语料重新训练意图分类模型。
12.根据权利要求11所述的装置,其特征在于,所述挖掘单元包括:第一搜索单元和第一选取单元,和/或,第二搜索单元和第二选取单元,其中,
所述第一搜索单元,用于以意图初始种子词为搜索词来搜索互联网站,得到对应的结果列表;
所述第一选取单元,用于选取所述结果列表中的前k个问题,其中,k为大于零的整数;
所述第二搜索单元,用于基于搜索引擎点击日志,查找所述意图初始种子词对应的相似查询;
所述第二选取单元,用于选取点击同一个文本且相似度高于设定阀值的查询结果;
所述重新训练单元,具体用于将所述前k个问题作为训练样本,重新训练所述意图分类模型,得到对应的意图向量;和/或者,将所述查询结果作为训练样本,重新训练所述意图分类模型,得到对应的意图向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711352983.5A CN108334891B (zh) | 2017-12-15 | 2017-12-15 | 一种任务型意图分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711352983.5A CN108334891B (zh) | 2017-12-15 | 2017-12-15 | 一种任务型意图分类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108334891A CN108334891A (zh) | 2018-07-27 |
CN108334891B true CN108334891B (zh) | 2021-01-05 |
Family
ID=62922709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711352983.5A Active CN108334891B (zh) | 2017-12-15 | 2017-12-15 | 一种任务型意图分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108334891B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111292752B (zh) * | 2018-12-06 | 2023-05-12 | 北京嘀嘀无限科技发展有限公司 | 一种用户意图识别方法、装置、电子设备及存储介质 |
CN109615009B (zh) * | 2018-12-12 | 2021-03-12 | 广东小天才科技有限公司 | 一种学习内容推荐方法及电子设备 |
CN109727598A (zh) * | 2018-12-28 | 2019-05-07 | 浙江省公众信息产业有限公司 | 大噪音语境下的意图识别方法 |
CN109829478B (zh) * | 2018-12-29 | 2024-05-07 | 平安科技(深圳)有限公司 | 一种基于变分自编码器的问题分类方法和装置 |
CN109871446B (zh) * | 2019-01-31 | 2023-06-06 | 平安科技(深圳)有限公司 | 意图识别中的拒识方法、电子装置及存储介质 |
CN109933663A (zh) * | 2019-02-26 | 2019-06-25 | 上海凯岸信息科技有限公司 | 基于embedding方法的意图识别算法 |
CN109885671B (zh) * | 2019-02-28 | 2022-10-14 | 重庆邮电大学 | 基于多任务学习的问答方法 |
US11681923B2 (en) * | 2019-04-19 | 2023-06-20 | Samsung Electronics Co., Ltd. | Multi-model structures for classification and intent determination |
CN110704627B (zh) * | 2019-10-15 | 2022-02-15 | 支付宝(杭州)信息技术有限公司 | 一种训练分类模型的方法及系统 |
CN111046667B (zh) * | 2019-11-14 | 2024-02-06 | 深圳市优必选科技股份有限公司 | 一种语句识别方法、语句识别装置及智能设备 |
CN111046654B (zh) * | 2019-11-14 | 2023-12-29 | 深圳市优必选科技股份有限公司 | 一种语句识别方法、语句识别装置及智能设备 |
CN111046653B (zh) * | 2019-11-14 | 2023-12-29 | 深圳市优必选科技股份有限公司 | 一种语句识别方法、语句识别装置及智能设备 |
CN111191028A (zh) * | 2019-12-16 | 2020-05-22 | 浙江大搜车软件技术有限公司 | 样本标注方法、装置、计算机设备和存储介质 |
CN111340148B (zh) * | 2020-05-22 | 2020-09-22 | 支付宝(杭州)信息技术有限公司 | 一种业务分类模型的训练方法、业务分类方法以及终端 |
CN111931512A (zh) * | 2020-07-01 | 2020-11-13 | 联想(北京)有限公司 | 语句意图的确定方法及装置、存储介质 |
CN112148874A (zh) * | 2020-07-07 | 2020-12-29 | 四川长虹电器股份有限公司 | 可自动新增用户潜在意图的意图识别方法及系统 |
CN113361274B (zh) * | 2021-06-29 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 基于标签向量的意图识别方法、装置、电子设备及介质 |
CN114238579B (zh) * | 2021-12-20 | 2023-02-10 | 北京聆心智能科技有限公司 | 文本分析方法、装置、介质和计算设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8341157B2 (en) * | 2009-07-31 | 2012-12-25 | Yahoo! Inc. | System and method for intent-driven search result presentation |
CN102880723B (zh) * | 2012-10-22 | 2015-08-05 | 深圳市宜搜科技发展有限公司 | 一种识别用户检索意图的搜索方法和系统 |
US20170308519A1 (en) * | 2013-06-20 | 2017-10-26 | Google Inc. | Learning semantic parsing |
CN107315731A (zh) * | 2016-04-27 | 2017-11-03 | 北京京东尚科信息技术有限公司 | 文本相似度计算方法 |
CN107229684B (zh) * | 2017-05-11 | 2021-05-18 | 合肥美的智能科技有限公司 | 语句分类方法、系统、电子设备、冰箱及存储介质 |
-
2017
- 2017-12-15 CN CN201711352983.5A patent/CN108334891B/zh active Active
Non-Patent Citations (3)
Title |
---|
"Automatic extraction of user’s search intention from web search logs";K. Park等;《Multimedia Tools and Applications》;20121231;第61卷;全文 * |
"Research of Chinese Text Classification Methods Based on Semantic Vector and Semantic Similarity";X. Song等;《2009 International Forum on Computer Science-Technology and Applications》;20100119;全文 * |
"Text Clustering Based on the User Search Intention";Wenjing Liu等;《Physics Procedia》;20111231;第22卷;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108334891A (zh) | 2018-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108334891B (zh) | 一种任务型意图分类方法及装置 | |
CN110717017B (zh) | 一种处理语料的方法 | |
CN110110062B (zh) | 机器智能问答方法、装置与电子设备 | |
CN110516253B (zh) | 中文口语语义理解方法及系统 | |
US11144587B2 (en) | User drawing based image search | |
US11113479B2 (en) | Utilizing a gated self-attention memory network model for predicting a candidate answer match to a query | |
Qiu et al. | DGeoSegmenter: A dictionary-based Chinese word segmenter for the geoscience domain | |
CN108932342A (zh) | 一种语义匹配的方法、模型的学习方法及服务器 | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN111753060A (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
US20200372025A1 (en) | Answer selection using a compare-aggregate model with language model and condensed similarity information from latent clustering | |
US11544470B2 (en) | Efficient determination of user intent for natural language expressions based on machine learning | |
CN111368049A (zh) | 信息获取方法、装置、电子设备及计算机可读存储介质 | |
CN110502610A (zh) | 基于文本语义相似度的智能语音签名方法、装置及介质 | |
CN111539197A (zh) | 文本匹配方法和装置以及计算机系统和可读存储介质 | |
WO2023207096A1 (zh) | 一种实体链接方法、装置、设备及非易失性可读存储介质 | |
Li et al. | UD_BBC: Named entity recognition in social network combined BERT-BiLSTM-CRF with active learning | |
CN111079418A (zh) | 命名体识别方法、装置、电子设备和存储介质 | |
CN111563158A (zh) | 文本排序方法、排序装置、服务器和计算机可读存储介质 | |
CN117688163B (zh) | 基于指令微调和检索增强生成的在线智能问答方法及装置 | |
US20230094730A1 (en) | Model training method and method for human-machine interaction | |
CN112434142A (zh) | 一种标记训练样本的方法、服务器、计算设备及存储介质 | |
CN113988071A (zh) | 一种基于金融知识图谱的智能对话方法及装置、电子设备 | |
Liu et al. | Cross-domain slot filling as machine reading comprehension: A new perspective |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |