CN111159358A - 多意图识别训练和使用方法及装置 - Google Patents
多意图识别训练和使用方法及装置 Download PDFInfo
- Publication number
- CN111159358A CN111159358A CN201911421640.9A CN201911421640A CN111159358A CN 111159358 A CN111159358 A CN 111159358A CN 201911421640 A CN201911421640 A CN 201911421640A CN 111159358 A CN111159358 A CN 111159358A
- Authority
- CN
- China
- Prior art keywords
- sentence
- intention
- representative
- sentence vector
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明公开多意图识别训练和使用方法及装置,其中,一种多意图识别训练方法,包括:将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
Description
技术领域
本发明属于语义理解技术领域,尤其涉及多意图识别训练和使用方法及装置。
背景技术
现有技术中,存在以下技术:基于多分类的意图识别方法、基于few shotlearning的意图识别方法以及基于one-vs-all多标签分类的意图识别方法。
其中,在基于多分类的意图识别方法中,对用户的每一句话标注一个意图,如“是的,我要寄快递”标注为“寄快递”意图,将对话系统中的意图识别问题转换为一个多分类问题,然后使用经典的分类算法如支持向量机(SVMs,Support Vector Machines),随机森林,梯度树和深度学习等训练一个多分类器来识别意图。
在基于one-vs-all多标签分类的意图识别方法中,对用户的每一句话标注出所有合理意图,如“是的,我要寄快递”标注为“确认”和“寄快递”两个意图,将对话系统中的意图识别问题转换为一个多标签分类问题,然后采用one-vs-all的形式,使用经典的分类算法训练多个二分类器来识别意图。
基于few shot learning的意图识别方法,主要是为了解决标注数据较少时意图识别准确率较低的问题,在训练阶段将数据集分为多个原任务,然后学习意图类别变化时模型泛化的能力,在预测阶段,对于新的意图类别(通常数据量较少),仅需要少量的标注数据就可以学习到对这类样本的分类能力。
发明人在实现本申请的过程中发现,现有方案至少存在以下缺陷:
基于多分类的意图识别方法假设了用户每句话只有一个意图,但是实际的对话系统中用户经常会一次表达多个意图,比如在快递客服中,机器人问用户需要什么服务时,用户可能会回答“我要寄快递,但是我想先查下寄件费用”,用户同时表达了“寄快递”和“查询费用”两个意图,体验优良的对话系统应该为用户先进行查询费用流程,完成后进入下单流程,这是基于多分类的意图识别方法无法解决的。
基于one-vs-all多标签分类的意图识别方法,直接将输入文本映射到意图空间中,没有使用额外的数据信息以及不同意图标注数据之间的关系,识别准确率偏低。
基于few shot learning的意图识别方法,目前和基于多分类的意图识别方法的一样基于用户每句话只有一个意图的假设,因此有着相同的缺陷
发明内容
本发明实施例提供一种多意图识别训练和使用方法及装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种多意图识别训练方法,包括:将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;以及将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
第二方面,本发明实施例提供一种多意图识别训练方法,包括:基于第一方面所述的方法训练后的句向量编码器和分类器对待检测文本的意图进行实时预测;将所述待检测文本先经过训练后的句向量编码器转换成句向量,然后将得到的所述句向量与意图类别的句向量进行一一拼接;以及将拼接后的向量发送给所述分类器判断是否相似。
第三方面,本发明实施例提供一种多意图识别训练装置,包括:数据转化模块,配置为将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;句向量编码模块,配置为句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;以及相似判断训练模块,将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
第四方面,本发明实施例提供一种多意图识别使用装置,包括实时预测模块,配置为基于第一方面任一项所述的方法训练后的句向量编码器和分类器对待检测文本的意图进行实时预测;转换拼接模块,配置为将所述待检测文本先经过训练后的句向量编码器转换成句向量,然后将得到的所述句向量与意图类别的句向量进行一一拼接;以及分类模块,配置为将拼接后的向量发送给所述分类器判断是否相似。
第五方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的多意图识别训练或使用方法的步骤。
第六方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施例的多意图识别训练或使用方法的步骤。
本申请的方法和装置提供的方案能够基于原始的意图标注数据形成句子对数据,进而用于多意图识别训练装置中的句向量编码器和分类器的训练,从而可以训练出能够识别出多个意图的网络。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种多意图识别训练方法的流程图;
图2为本发明一实施例提供的一种多意图识别使用方法的流程图;
图3为本发明一实施例提供一个具体实施例的训练阶段流程图;
图4为本发明一实施例提供的一具体实施例的推理阶段流程图;
图5为本发明一实施例提供的一种多意图识别训练装置的框图;
图6为本发明一实施例提供的一种多意图识别使用装置的框图;
图7是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其示出了本申请的多意图识别训练方法一实施例的流程图,本实施例的多意图识别训练方法可以适用于需要对用户意图进行识别及语义理解的场景,包括语音识别语义理解时理解用户的意图。
如图1所示,在步骤101中,将原始的意图标注数据转化为句子对数据;
在步骤102中,句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;
在步骤103中,将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
在本实施例中,对于步骤101,多意图识别训练装置将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;从而可以通过原始意图标注数据形成大量的训练文本,而原始意图标注数据通常都可以从用户处或者由开发人员整理而获得,来源广泛易于获得。
之后,对于步骤102中,多意图识别训练装置经由句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;最后,对于步骤103,多意图识别训练装置将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
本申请实施例的方法能够基于原始的意图标注数据形成句子对数据,进而用于多意图识别训练装置中的句向量编码器和分类器的训练,从而可以训练出能够识别出多个意图的网络。
在一些可选的实施例中,所述对所述句向量编码器和所述分类器的训练包括:将每一条意图标注数据与所述意图标注数据所包含的意图类别的代表句组成正例样本,将每一条意图标注数据与所述意图标注数据不包含的意图类别的代表句组成负例样本;以及基于所述正例样本和所述负例样本对所述向量编码器和所述分类器进行训练。通过基于原始的意图标注数据形成正例样本和负例样本,之后用于网络的训练,可以训练出鲁棒性较好的多意图识别系统。
在进一步可选的实施例中,所述向量编码器包括双向长短时记忆网络句向量编码器;所述对所述句向量编码器和所述分类器的训练包括利用反向传播算法完成对所述句向量编码器和所述分类器的训练。从而采用双向长短时记忆网络和反向传播算法,能够训练出更好的多意图识别系统,进而更好地识别出用户的多个意图。
请参考图2,其示出了本申请一实施例提供的一种多意图识别使用方法,该方法可以适用于需要对用户意图进行识别的设备中,包括智能音箱等智能语音设备,在此不再赘述。
如图2所示,在步骤201中,基于前述实施例中任一项所述的方法训练后的句向量编码器和分类器对待检测文本的意图进行实时预测;
在步骤202中,将所述待检测文本先经过训练后的句向量编码器转换成句向量,然后将得到的所述句向量与意图类别的句向量进行一一拼接;
在步骤203中,将拼接后的向量发送给所述分类器判断是否相似。
本实施例的方法通过将待检测文本输入至经过前述实施例训练后的句向量编码器和分类器中,通过句向量编码器对待检测文本对应的句向量和意图类别的句向量进行拼接,之后将拼接后的向量发送至分类器判断是否相似,之后如果与多个意图类别相似,就可以识别出多种意图。
在一些可选的实施例中,所述意图类别的句向量包括采用以下方式获得:将所有意图类别通过所述句向量编码器转换为句向量。由于句向量编码器的参数已经固定,因此可以离线进行上述意图类别的转换,避免对实时资源的过多占用。
下面对通过描述发明人在实现本发明的过程中遇到的一些问题和对最终确定的方案的一个具体实施例进行说明,以使本领域技术人员更好地理解本申请的方案。
发明人在实现本申请的过程中发现,相关技术中存在的以上缺陷主要是由于以下内容导致的:基于多分类的意图识别方法和基于few shot learning的意图识别方法主要做了不恰当的假设,而基于one-vs-all多标签分类的意图识别方法则是没有充分使用数据集中的信息和外部数据。
本领域技术人员在面对上述现有技术的缺陷时,比较容易想到的方案如下:
1、增加标注数据量,这是最常采用的方法,简单但是耗费人力和时间较多。
2、将基于few shot learning的意图识别方法的思想应用至基于one-vs-all多标签分类的意图识别方法中,以提升标注数据较少时的识别准确性,目前主流的基于fewshot learning的意图识别方法与基于one-vs-all多标签分类的意图识别方法的实现形式不匹配,技术难度较大。
3、采用BERT(Bidirectional Encoder Representation from Transformers)等使用海量无标注数据训练的预训练模型微调,但由于BERT参数量巨大,计算资源要求高,在实时性要求较高的对话系统中部署成本高。
意图识别问题最直观的解决方法是使用自然语言理解领域中的文本分类任务的研究成果。句子相似度计算通常作为自然语言理解领域的另一类独立任务--相似句子匹配中的一个问题进行研究,不容易想到将其应用到意图识别的问题解决中。
本申请实施例的一个具体示例中,对每一个意图类别设置一组代表句,通过计算用户说的句子与代表句的相似性来决定用户是否表达了该类意图,比如对于“我要寄快递,但是我想先查下寄件费用”,将其与寄快递类别中的代表句“我想寄快递”和查询寄件费用中的代表句“查询寄件价格”计算相似性,如果相似性较高则说明包含了寄快递和查询寄件费的意图,同理与其他类别中的代表句计算相似度,如果相似性较低则说明不包含其他意图。假设一共有k类意图,每一个类别的代表句数量为b,上述做法可以将一条标注文本,转换为约kb条句子对样本,增加了大量的标注样本,也充分利用了数据集中文本之间的关系信息。
代表句由人类根据理解编写一部分,引入外部知识。
请参考图3,其示出了训练阶段流程图。
图3描述了整个训练阶段流程,主要流程可以分为:
1、将原始的意图标注数据转化为句子对数据,句子对数据的形式为(目标句,代表句,0/1),,其中1表示目标句和代表句相似,称为正例样本,0表示目标句和代表句不相似,称为负例样本。目标句是原始的意图标注数据中的句子,代表句有三种:
1)意图类别名,如寄快递,查询寄件费用。
2)人为定义的典型例句,如我想寄快递,我要下单。
3)从意图标注数据中随机抽取的一部分句子,对于每一个意图类别,尽量抽取只包含该意图的句子作为代表句。
准备好每个类别的代表句后,将每一条意图标注数据与其包含的意图类别下的代表句,一一组成正例样本,同时与其不包含的意图类别下的代表句组成负例样本。假设有A和B两个意图类别,每个意图类别有两个代表句,如表1所示。有q1和q2两个意图标注数据,q1包含A和B两个意图,q2包含B意图,可以构建表2中的句子对数据。
表1意图类别和代表句示例
意图类别 | 代表句 |
A | a1,a2 |
B | b1,b2 |
表2句子对数据示例
句子对 | 是否相似 |
q1,a1 | 1 |
q1,a2 | 1 |
q1,b1 | 1 |
q1,b2 | 1 |
q2,a1 | 0 |
q2,a2 | 0 |
q2,b1 | 1 |
q2,b2 | 1 |
生成句子对数据后,使用双向长短时记忆网络(BiLSTM,Bidirectional Long-Short Term Memory Network)对目标句和代表句进行编码,转换为2个d维的句子向量,即目标句句向量和代表句句向量。
最后将目标句句向量和代表句句向量拼接后,通过分类器判断句子对是否相似,利用反向传播算法完成句向量编码器和分类器的训练。
请参考图,其示出了本申请一实施例提供的推理流程。
图4示出了推理阶段流程。
图4描述了整个推理阶段流程,主要流程可以分为:
1、将所有意图类别名通过句向量编码器转换为句向量,因为训练完成后,句向量编码器的参数已经固定,这一步可以离线完成。
2、对用户说的句子的意图进行实时预测,待预测的文本先经过句向量编码器转换为句向量,然后将得到的句向量与事先计算得到的所有意图类别名的句向量一一拼接,最后将拼接后的向量给分类器判断是否相似,根据判断结果输出识别的意图类别。
验证实验
实验数据来源于快递领域的客服对话系统,共包含48种意图,训练集大小为38452,测试集大小为6025。采用基于one-vs-all多标签分类的意图识别方法作为基线方法,基线方法和本文方法中的句向量编码器都使用一层BiLSTM,分类器都使用两层全连接的神经网络,使用F1分值作为评价指标。在测试集上结果如下:
表3性能对比
F1 | 推理速度 | |
基线方法 | 89.39 | 22毫秒/每条文本 |
基于文本相似度的方法 | 89.81 | 34毫秒/每条文本 |
从实验结果可以发现,由于新训练任务的设计,基于文本相似度的方法相对于基线方法识别性能有了较大提升。因为推理阶段需要实时计算句子向量的文本仍是一条,整体的推理速度只有小幅下降,仍能满足对话系统中意图识别的实时性需求。
请参考图5,其示出了本发明一实施例提供的一种多意图识别训练装置的框图。
如图5所示,多意图识别训练装置500,包括数据转化模块510、句向量编码模块520和相似判断训练模块530。
其中,数据转化模块510,配置为将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;句向量编码模块520,配置为句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;以及相似判断训练模块530,将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
在一些可选的实施例中,相似判断训练模块进一步配置为:将每一条意图标注数据与所述意图标注数据所包含的意图类别的代表句组成正例样本,将每一条意图标注数据与所述意图标注数据不包含的意图类别的代表句组成负例样本;以及基于所述正例样本和所述负例样本对所述向量编码器和所述分类器进行训练。
请参考图6,其示出了本发明一实施例提供的一种多意图识别使用装置的框图。
如图6所示,多意图识别使用装置600包括实时预测模块610、转换拼接模块620和分类模块630。
其中,实时预测模块610,配置为基于权利要求1-3中任一项所述的方法训练后的句向量编码器和分类器对待检测文本的意图进行实时预测;转换拼接模块620,配置为将所述待检测文本先经过训练后的句向量编码器转换成句向量,然后将得到的所述句向量与意图类别的句向量进行一一拼接;分类模块630,配置为将拼接后的向量发送给所述分类器判断是否相似。
应当理解,图5和图6中记载的诸模块与参考图1和图2中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图5和图6中的诸模块,在此不再赘述。
值得注意的是,本申请的实施例中的模块并不用于限制本申请的方案,例如特征提取模块可以描述为响应于接收到的文本序列,对所述文本序列进行特征提取得到文本特征序列的模块。另外,还可以通过硬件处理器来实现相关功能模块,例如分词模块也可以用处理器实现,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的多意图识别训练和使用方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;
句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;
将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据多意图识别训练和使用装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至多意图识别训练和使用装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项多意图识别训练和使用方法。
图7是本发明实施例提供的电子设备的结构示意图,如图7所示,该设备包括:一个或多个处理器710以及存储器720,图7中以一个处理器710为例。多意图识别训练和使用方法的设备还可以包括:输入装置730和输出装置740。处理器710、存储器720、输入装置730和输出装置740可以通过总线或者其他方式连接,图7中以通过总线连接为例。存储器720为上述的非易失性计算机可读存储介质。处理器710通过运行存储在存储器720中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例多意图识别训练和使用方法。输入装置730可接收输入的数字或字符信息,以及产生与多意图识别训练和使用装置的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于多意图识别训练和使用装置中,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;
句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;
将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种多意图识别训练方法,包括:
将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;
句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;
将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
2.根据权利要求1所述的方法,其中,所述对所述句向量编码器和所述分类器的训练包括:
将每一条意图标注数据与所述意图标注数据所包含的意图类别的代表句组成正例样本,将每一条意图标注数据与所述意图标注数据不包含的意图类别的代表句组成负例样本;
基于所述正例样本和所述负例样本对所述向量编码器和所述分类器进行训练。
3.根据权利要求1或2所述的方法,其中,所述向量编码器包括双向长短时记忆网络句向量编码器;
所述对所述句向量编码器和所述分类器的训练包括利用反向传播算法完成对所述句向量编码器和所述分类器的训练。
4.一种多意图识别使用方法,包括:
基于权利要求1-3中任一项所述的方法训练后的句向量编码器和分类器对待检测文本的意图进行实时预测;
将所述待检测文本先经过训练后的句向量编码器转换成句向量,然后将得到的所述句向量与意图类别的句向量进行一一拼接;
将拼接后的向量发送给所述分类器判断是否相似。
5.根据权利要求4所述的方法,其中,所述意图类别的句向量包括采用以下方式获得:
将所有意图类别通过句所述向量编码器转换为句向量。
6.一种多意图识别训练装置,包括:
数据转化模块,配置为将原始的意图标注数据转化为句子对数据,其中,所述句子对数据中至少包含所述原始的意图标注数据中的目标句、所述意图标注数据所包含的意图类别的代表句组成的句子对以及所述目标句和所述代表句的相似度;
句向量编码模块,配置为句向量编码器对所述目标句和所述代表句进行编码,形成与所述目标句对应的目标句向量和与所述代表句对应的代表句向量;
相似判断训练模块,将所述目标句向量和所述代表句向量进行向量拼接后,输入分类器以判断所述句子对是否相似,对所述句向量编码器和所述分类器的训练。
7.根据权利要6所述的装置,其中,相似判断训练模块进一步配置为:
将每一条意图标注数据与所述意图标注数据所包含的意图类别的代表句组成正例样本,将每一条意图标注数据与所述意图标注数据不包含的意图类别的代表句组成负例样本;
基于所述正例样本和所述负例样本对所述向量编码器和所述分类器进行训练。
8.一种多意图识别使用装置,包括:
实时预测模块,配置为基于权利要求1-3中任一项所述的方法训练后的句向量编码器和分类器对待检测文本的意图进行实时预测;
转换拼接模块,配置为将所述待检测文本先经过训练后的句向量编码器转换成句向量,然后将得到的所述句向量与意图类别的句向量进行一一拼接;
分类模块,配置为将拼接后的向量发送给所述分类器判断是否相似。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至5任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至5任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911421640.9A CN111159358A (zh) | 2019-12-31 | 2019-12-31 | 多意图识别训练和使用方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911421640.9A CN111159358A (zh) | 2019-12-31 | 2019-12-31 | 多意图识别训练和使用方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111159358A true CN111159358A (zh) | 2020-05-15 |
Family
ID=70560674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911421640.9A Withdrawn CN111159358A (zh) | 2019-12-31 | 2019-12-31 | 多意图识别训练和使用方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111159358A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111666755A (zh) * | 2020-06-24 | 2020-09-15 | 深圳前海微众银行股份有限公司 | 一种复述句识别的方法及装置 |
CN111738017A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种意图识别方法、装置、设备及存储介质 |
CN112347760A (zh) * | 2020-11-16 | 2021-02-09 | 北京京东尚科信息技术有限公司 | 意图识别模型的训练方法及装置、意图识别方法及装置 |
CN112507704A (zh) * | 2020-12-15 | 2021-03-16 | 中国联合网络通信集团有限公司 | 多意图识别方法、装置、设备及存储介质 |
CN112541079A (zh) * | 2020-12-10 | 2021-03-23 | 杭州远传新业科技有限公司 | 多意图识别方法、装置、设备及介质 |
CN112765356A (zh) * | 2021-01-29 | 2021-05-07 | 苏州思必驰信息科技有限公司 | 多意图识别模型的训练方法及系统 |
CN114357973A (zh) * | 2021-12-10 | 2022-04-15 | 马上消费金融股份有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN115359786A (zh) * | 2022-08-19 | 2022-11-18 | 思必驰科技股份有限公司 | 多意图语义理解模型训练和使用方法以及装置 |
-
2019
- 2019-12-31 CN CN201911421640.9A patent/CN111159358A/zh not_active Withdrawn
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111666755A (zh) * | 2020-06-24 | 2020-09-15 | 深圳前海微众银行股份有限公司 | 一种复述句识别的方法及装置 |
CN111738017A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种意图识别方法、装置、设备及存储介质 |
CN112347760A (zh) * | 2020-11-16 | 2021-02-09 | 北京京东尚科信息技术有限公司 | 意图识别模型的训练方法及装置、意图识别方法及装置 |
CN112541079A (zh) * | 2020-12-10 | 2021-03-23 | 杭州远传新业科技有限公司 | 多意图识别方法、装置、设备及介质 |
CN112507704A (zh) * | 2020-12-15 | 2021-03-16 | 中国联合网络通信集团有限公司 | 多意图识别方法、装置、设备及存储介质 |
CN112507704B (zh) * | 2020-12-15 | 2023-10-03 | 中国联合网络通信集团有限公司 | 多意图识别方法、装置、设备及存储介质 |
CN112765356A (zh) * | 2021-01-29 | 2021-05-07 | 苏州思必驰信息科技有限公司 | 多意图识别模型的训练方法及系统 |
CN114357973A (zh) * | 2021-12-10 | 2022-04-15 | 马上消费金融股份有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN115359786A (zh) * | 2022-08-19 | 2022-11-18 | 思必驰科技股份有限公司 | 多意图语义理解模型训练和使用方法以及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112685565B (zh) | 基于多模态信息融合的文本分类方法、及其相关设备 | |
CN111159358A (zh) | 多意图识别训练和使用方法及装置 | |
CN112100349B (zh) | 一种多轮对话方法、装置、电子设备及存储介质 | |
CN110516253B (zh) | 中文口语语义理解方法及系统 | |
JP6677419B2 (ja) | 音声対話方法及び装置 | |
CN112732911A (zh) | 基于语义识别的话术推荐方法、装置、设备及存储介质 | |
CN114357973B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN111081280B (zh) | 与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法 | |
US11947920B2 (en) | Man-machine dialogue method and system, computer device and medium | |
CN111344717A (zh) | 交互行为预测方法、智能装置和计算机可读存储介质 | |
CN112541068A (zh) | 语音对话的意图识别方法、系统、设备及存储介质 | |
CN112632244A (zh) | 一种人机通话的优化方法、装置、计算机设备及存储介质 | |
CN113505198A (zh) | 关键词驱动的生成式对话回复方法、装置及电子设备 | |
CN113342948A (zh) | 一种智能问答方法及装置 | |
CN110597958B (zh) | 文本分类模型训练和使用方法及装置 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
CN114817478A (zh) | 基于文本的问答方法、装置、计算机设备及存储介质 | |
CN114357164A (zh) | 情感-原因对抽取方法、装置、设备及可读存储介质 | |
CN116522905B (zh) | 文本纠错方法、装置、设备、可读存储介质及程序产品 | |
CN112765356B (zh) | 多意图识别模型的训练方法及系统 | |
CN116051151A (zh) | 基于机器阅读理解的客户画像确定方法、系统和电子设备 | |
CN111680514A (zh) | 信息处理和模型训练方法、装置、设备及存储介质 | |
CN115168544A (zh) | 信息提取方法及电子设备和存储介质 | |
CN115222047A (zh) | 一种模型训练方法、装置、设备及存储介质 | |
CN110399615B (zh) | 交易风险监控方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant after: Sipic Technology Co.,Ltd. Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant before: AI SPEECH Ltd. |
|
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200515 |