CN113076758B - 一种面向任务型对话的多域请求式意图识别方法 - Google Patents

一种面向任务型对话的多域请求式意图识别方法 Download PDF

Info

Publication number
CN113076758B
CN113076758B CN202110296459.0A CN202110296459A CN113076758B CN 113076758 B CN113076758 B CN 113076758B CN 202110296459 A CN202110296459 A CN 202110296459A CN 113076758 B CN113076758 B CN 113076758B
Authority
CN
China
Prior art keywords
sample
entity
domain
codebook
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110296459.0A
Other languages
English (en)
Other versions
CN113076758A (zh
Inventor
谢洪途
林奕全
王国倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202110296459.0A priority Critical patent/CN113076758B/zh
Publication of CN113076758A publication Critical patent/CN113076758A/zh
Application granted granted Critical
Publication of CN113076758B publication Critical patent/CN113076758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种面向任务型对话的多域请求式意图识别方法,该方法通过将请求式意图识别任务建模为配对排序任务,使用简单的双编码器框架及基于多层级相似度的困难负样本挖掘策略,有效提升了该场景下的识别效率及准确率。实验结果表明,本发明提出的方法相较基线(Baseline)检索模型于DSTC9‑Track1测试集上,识别效率及可见域Top1/Top5准确率有较大提升。此外,该方法兼容基于语义空间的域自适应(Domain Adaption)技术,便于后续对小样本场景的扩展使用。

Description

一种面向任务型对话的多域请求式意图识别方法
技术领域
本发明涉及对话意图识别和信息检索领域,更具体地,涉及一种面向任务型对话的多域请求式意图识别方法。
背景技术
对话意图识别又称对话状态跟踪,是任务型对话系统关键模块,旨在理解当前对话的用户意图从而辅助系统回复生成。在任务型对话中,对话状态通常定义为当前激活的用户意图槽值(Slot-Values)。用户意图插槽又可分为信息槽(Informable Slot)和请求槽(Requestable Slot),信息槽用于记录用户要求的属性条件用于实体搜索,而请求槽记录了用户对指定实体的附加信息请求,用于调用API链接外部知识库(Knowledge Base,KB)。为在任务型对话中更高效地链接外部知识库,本发明更关注请求式意图,即(是否请求,请求域,请求实体)的三元组的识别任务。
此前对话意图识别的相关工作(Hung Le等)通常建模为多分类任务,不适用于资源受限(Low Resource)的场景。对此,Chien-Sheng Wu等提出基于指针网络(PointerNetwork)进行跨域的迁移学习(Transfer Learning),但由于其没有利用特征空间的语义信息进行迁移,于小样本(Few-Shot)场景下的迁移学习能力仍有待提升。因而,如何学习有效的对话意图语义表征成为小样本迁移的关键。
度量学习(Metric learning)是一种高效的表征学习方法,其通过神经网络将输入样本对映射到特征空间,并利用三元组损失函数(Triplet Loss)或对比损失函数(Contrastive Loss)拉近特征空间中的相似样本并拉开相异样本,从而得到高可辨的样本表征。度量学习因高效、高可辨表征的学习能力,广泛用于人脸识别、行人重识别等计算机视觉及小样本学习领域(LukaszKaiser等)。在自然语言领域,DanielGillick等、VladimirKarpukhin等和TianchengZhao等的工作也分别将其用于实体链接(Entity Link,EL)、文档检索和对话生成等任务。
请求式意图识别中也涉及请求实体的检测,因而DanielGillick等将度量学习用于实体链接的工作与本发明的应用场景最为近似。实体链接是将文本中的提及(Mention)链接到知识库中的实体的自然语言理解技术,其通常分为候选实体生成——消歧(Candidate Entity Generation-Entity Disambiguation,CEG-ED)两阶段实现。DanielGillick等根据CEG需要人工构建的别名字典生成、易漏检实体的缺点,选择跳过CEG阶段,基于度量学习技术直接根据提及的上下文进行实体检索。
本发明受DanielGillick等的工作启发,将双编码器(Bi-Encoder)及在线困难负样本挖掘(Online Hard Negative Mining)的度量学习框架应用于多域请求式意图识别,在提升其性能的同时,该方法也兼容基于语义空间的域自适应(Domain Adaption)技术。需要指出DanielGillick等实体检索的工作与请求实体识别存在下述差异:一,自然语言理解程度不同,两者均需从存在共指(Coreference)的文本进行实体抽取,但实体链接的输出的是请求实体的子集,因而需要更强的上下文化编码器(Contextualized Encoder)提取文本特征;二,实体链接任务需要数据集预先提供提及块(Mention Span)标注或通过启发式方法提取,如别名字典模糊匹配(Chao-HongTan等),且实体链接任务中存在较多难分辨的实体,需通过额外的实体描述进行实体消歧。
发明内容
本发明提供一种准确率较好的面向任务型对话的多域请求式意图识别方法。
为了达到上述技术效果,本发明的技术方案如下:
一种面向任务型对话的多域请求式意图识别方法,包括以下步骤:
S1:获取对话数据,从对话数据中获取实体ID集合E={1,2,…,C}和对话历史U={u1,u2,…,ut},并对对话历史进行分词;
S2:随机采样一批步骤S1已分词的对话历史,与实体ID构成样本对,通过双编码器模型分别对对话历史及实体ID进行特征提取,得到正样本i对应的查询表征及实体ID的码本表征分别为qi=E(Ui)∈Rd和Z={z1,z2,…,zC}∈R|E|×d
S3:通过步骤S2得到的批样本对的高维表征,根据实体级层级标签计算样本对重要性,并进行实体级表征三元组的挖掘:
Triplesi,local={(qi,zi,qi,1 -),(qi,zi,qi,2 -),…,(qi,zi,qi,M -)}
其中,qi为正样本i对应的查询表征,qi,M -为样本i的第M个负样本对应的查询表征,zi为正样本i锚定的码本表征,最后计算实体级局部损失函数
Figure GDA0003989837400000021
S4:通过步骤S2得到的批样本对的高维表征,根据域级层级标签计算样本对重要性,并进行域级表征三元组的挖掘:
Triplesglobal={(q1,z1,q1 -),(q2,z2,q2 -),…,(qN,zN,qN -)}
其中,qN -为度量空间中与zN相似度最高的异域样本表征,最后计算域级全局损失函数
Figure GDA0003989837400000031
S5:计算总损失函数,
Figure GDA0003989837400000032
其中,β、γ为可调参数,
Figure GDA0003989837400000033
为码本损失函数,用于对码本嵌入进行更新,最后,通过总损失函数优化双编码器模型,重复步骤S2-S5直至达到设定的最大迭代次数;
S6:停止迭代双编码器模型,并用于请求式意图识别。
进一步地,步骤S2中的输入对话历史U={u1,u2,…,ut}包含多轮交互,每轮交互由用户及发言者的对话语句构成,待识别的意图即为实体ID集合E={1,2,…,C};
步骤S3-S4中,对于由输入对话历史和实体ID中构成的样本对,定义度量相似度为两者于度量空间的L2距离,查询表征在度量空间与相应的码本表征进行最近邻匹配:
sim(qi,qj)=||qi-qj||2
Figure GDA0003989837400000034
其中,qi,qj为样本对(i,j)对应的查询表征,ze为实体e∈E对应的码本表征;步骤S2的过程为:
实体ID通过码本嵌入矩阵映射为高维表征zc=Ee(c)∈Rd,对于正样本i,其对话历史通过Transformer映射为对应的查询表征qi=E(Ui)∈Rd
给定对于样本对(i,j)及相应的层级标签llocal=(isRequestable,domainID,entityID),用于标注的多层级的相似度函数f:
Figure GDA0003989837400000035
其中|l|表示标签的层级,li,k表示样本i的第k层标签信息,lj,k表示样本j的第k层标签信息,isRequestable表示是否请求,domainID表示域ID,entityID表示实体ID;
对于批样本集合B={1,2,…,N},样本对(i,j)的标注相似度排序由函数f定义的距离空间下的降序排列给出,而度量相似度排序由sim函数给出。
进一步地,步骤S3中,给定样本对(i,j),根据实体级层级标签llocal=(isRequestable,domainID,entityID),可计算多层级相似度及样本对重要性:
Figure GDA0003989837400000041
其中,Dij=relativePosij为逆序对于度量排序与标定排序的相对位置差,反应了样本对(i,j)的逆序程度;在线训练时,每个样本都有局部与全局两个尺度且固定大小的三元组缓冲区,对于样本对定义其重要性并进行排序,样本对依据其重要性大小依次存入三元组缓冲区;所述步骤S3通过局部缓冲区中的三元组计算实体级局部损失函数:
Figure GDA0003989837400000042
其中,α为最大间隔,sg(·)为梯度截断算子,(qi,zi,qi,m -)∈Triplesi,local
进一步地,所述步骤S4通过全局缓冲区中的三元组计算域级全局损失函数:
Figure GDA0003989837400000043
α为最大间隔,sg(·)为梯度截断算子,(qi,zi,qi -)∈Triplesglobal
进一步地,所述步骤S5通过码本损失函数对码本嵌入进行更新:
Figure GDA0003989837400000044
其中qi为样本i于度量空间中的查询表征,zi为其对应的码本表征。
其中,所有输入对话历史均通过步骤S1进行分词处理;步骤S1中,对输入的对话进行WordPiece分词。
进一步地,步骤S6的过程是,输入对话历史和实体ID通过步骤S2-S5训练好的模型,分别映射为查询表征和码表征,通过最近邻算法进行码本匹配。
与现有技术相比,本发明技术方案的有益效果是:
本发明将一种简单的双编码器框架和基于配对法的困难负样本在线挖掘策略用于请求式意图识别,该方法通过将请求式意图识别任务建模为配对排序任务,有效提升了该场景下的识别效率及准确率。实验结果表明,本发明提出的方法相较基线(Baseline)检索模型于DSTC9-Track1测试集上,识别效率及可见域Top1/Top5准确率有较大提升。此外,该方法兼容基于语义空间的域自适应(Domain Adaption)技术,便于后续对小样本场景的扩展使用。
附图说明
图1为本发明方法流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
方法流程如图1所示,一种面向任务型对话的多域请求式意图识别方法,包括以下步骤:
设待匹配的实体ID集合为E={1,2,…,C},作为查询的对话历史为U={u1,u2,…,ut}。为应用度量学习的方法,定义码本嵌入矩阵(Embedding Matrix)为Z={z1,z2,…,zC}∈R|E|×d,其中d为嵌入维度,zC代表第C个实体对应的码本表征。实体ID通过码本嵌入矩阵映射为高维表征。对于正样本i,其对话历史通过Transformer映射为对应的查询表征qi=E(Ui)∈Rd。上述定义码本表征和查询表征共享同一度量空间。
对于样本对(i,j),定义相似度为两者于度量空间的L2距离,
sim(qi,qj)=||qi-qj||2
其中,qi,qj为(i,j)于度量空间中的表征。查询表征通过以下最近邻算法进行码本匹配,
Figure GDA0003989837400000051
记zi为样本i对应的码本表征,
Figure GDA0003989837400000052
对于批样本集合B={1,2,…,N},样本对(i,j)的标注相似度排序(Ground-TruthRanking)由函数f定义的距离空间下的降序排列给出,而度量相似度排序(Learned Metricranking)由上述定义的sim函数给出。根据以上定义,本发明通过度量学习的方法使度量排序逼近给定的标注排序。本发明的具体内容如下:
第一步:获取对话数据,从对话数据中获取实体ID集合E={1,2,…,C}和对话历史U={u1,u2,…,ut},并对对话历史进行WordPiece分词;
第二步:随机采样一批第一步已分词的对话历史,与实体ID构成样本对,通过双编码器模型分别对对话历史及实体ID进行特征提取,得到正样本i对应的查询表征及实体ID的码本表征分别为qi=E(Ui)∈Rd和Z={z1,z2,…,zC}∈R|E|×d
第三步:通过第二步得到的批样本对的高维表征,根据实体级层级标签计算样本对重要性,并进行实体级表征三元组的挖掘:
给定样本对(i,j),根据实体级层级标签llocal=(isRequsestable,domainID,entityID)计算多层级相似度及样本对重要性
Figure GDA0003989837400000061
Figure GDA0003989837400000062
逆序对依据其重要性排序依次存入样本对应的三元组缓冲区。记N为批大小,M为缓冲区大小,则批内样本i对应的实体级三元组如下:
Triplesi,local={(qi,zi,qi,1 -),(qi,zi,qi,2 -),…,(qi,zi,qi,M -)}
其中,qi为正样本i对应的查询表征,qi,M -为样本i的第M个负样本对应的查询表征,zi为正样本i锚定的码本表征。
对应的实体级局部损失函数可由下式算得:
Figure GDA0003989837400000063
where(qi,zi,qi,m -)∈Triplesi,local
其中,α为最大间隔,sg(·)为梯度截断算子;
第四步:通过第二步得到的批样本对的高维表征,根据域级层级标签计算样本对重要性,并进行域级表征三元组的挖掘:
给定域级层级标签为(isRequestable,domainID),样本i对应的三元组如下,
Triplesglobal={(qi,qi -),(q2,q2 -),…,(qN,qN -)},
其中,qN -为度量空间中与zN相似度最高的异域样本表征。
类似的,对应的域级全局损失函数可由下式算得:
Figure GDA0003989837400000071
where(qi,zi,qi -)∈Triplesglobal
第五步:计算总损失函数并优化模型,重复重复第二步到第五步直至达到设定的最大迭代次数,码本损失函数为:
Figure GDA0003989837400000072
总损失函数为,
Figure GDA0003989837400000073
其中,β、γ为可调参数。
第六步,停止迭代,将模型用于请求式意图识。即输入对话历史和实体ID通过第二步到第五步训练好的模型,分别映射为查询表征和码表征,并通过最近邻算法进行码本匹配。
发明于DSTC9-Track1测试集上的对比实验结果如下表1:
表1本发明于DSTC9-Track1测试集上的对比实验结果
Figure GDA0003989837400000074
实验环境:Intel Xeon E5-2678 v3s(CPU),NVIDIA Tesla V100(GPU),在实验中基线检索模型使用单核CPU而本发明则使用单卡GPU进行推理。
实验参数:训练参数方面,损失函数α=1,β=γ=1,批大小N=128,使用5e-5到0的学习率衰减及1.0最大范数梯度裁剪策略。模型方面,码本使用标准正态分布进行随机初始化,Transformer使用GPT2前两层的网络结构,分词器则使用GPT2对应的WordPiece子词模型,对话历史截断为128字。
基线检索模型:基于Chao-HongTan等提出的基线检索模型进行改进,为提高基线模型的实体检索准确率及效率,直接过滤待检索实体中的特殊符号而非使用别名字典,使用基于动态规划实现的最长公共子序列(Longest Common Sequence,LCS)而非暴力算法进行实体匹配。此外,为将此基线检索模型用于请求式意图识别,实验中对所有检出的实体按照对话轮数、模型匹配分数及实体出现的位置进行排序。
实验结果分析:对比实验结果表明,本发明提出的方法于可见域上有更高的Top-1/Top-5准确率及更快的样本推理速度,但由于使用实体ID进行检索,无法用于不可见域,于测试集上效果明显低于基线检索模型,仍需后续基于语义空间进行迁移学习或与基线检索模型进行模型融合;由于子词序列没有明显的词边界,基于WordPiece分词的对话历史和待检索实体容易丢失实体词信息,导致模糊匹配准确率明显下降。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种面向任务型对话的多域请求式意图识别方法,其特征在于,包括以下步骤:
S1:获取对话数据,从对话数据中获取实体ID集合E={1,2,…,C}和对话历史U={u1,u2,…,ut},并对对话历史进行分词;
S2:随机采样一批步骤S1已分词的对话历史,与实体ID构成样本对,通过双编码器模型分别对对话历史及实体ID进行特征提取,得到正样本i对应的查询表征及实体ID的码本表征分别为qi=E(Ui)∈Rd和Z={z1,z2,…,zC}∈R|E|×d
S3:通过步骤S2得到的批样本对的高维表征,根据实体级层级标签计算样本对重要性,并进行实体级表征三元组的挖掘:
Triplesi,local={(qi,zi,qi,1 -),(qi,zi,qi,2 -),…,(qi,zi,qi,M -)}
其中,qi为正样本i对应的查询表征,q,M -为样本i的第M个负样本对应的查询表征,zi为正样本i锚定的码本表征,最后计算实体级局部损失函数
Figure FDA0003989837390000014
S4:通过步骤S2得到的批样本对的高维表征,根据域级层级标签计算样本对重要性,并进行域级表征三元组的挖掘:
Triplesglobal=q1,z1,q1 -,q2,z2,q2 -,…,qN,zN,qN -}}
其中,qN -为度量空间中与zN相似度最高的异域样本表征,最后计算域级全局损失函数
Figure FDA0003989837390000011
S5:计算总损失函数,
Figure FDA0003989837390000012
其中,β、γ为可调参数,
Figure FDA0003989837390000013
为码本损失函数,用于对码本嵌入进行更新,最后,通过总损失函数优化双编码器模型,重复步骤S2-S5直至达到设定的最大迭代次数;
S6:停止迭代双编码器模型,并用于请求式意图识别。
2.根据权利要求1所述的面向任务型对话的多域请求式意图识别方法,其特征在于,步骤S2中的输入对话历史U={u1,u2,…,ut}包含多轮交互,每轮交互由用户及发言者的对话语句构成,待识别的意图即为实体ID集合E={1,2,…,C}。
3.根据权利要求1所述的面向任务型对话的多域请求式意图识别方法,其特征在于,步骤S3-S4中,对于由输入对话历史和实体ID中构成的样本对,定义度量相似度为两者于度量空间的L2距离,查询表征在度量空间与相应的码本表征进行最近邻匹配:
sim(qi,qj)=||qi-qj||2
Figure FDA0003989837390000021
其中,qi,qj为样本对(i,j)对应的查询表征,ze为实体e∈E对应的码本表征。
4.根据权利要求1所述的面向任务型对话的多域请求式意图识别方法,其特征在于,步骤S2的过程为:
实体ID通过码本嵌入矩阵映射为高维表征zc=Ee(c)∈Rd,对于正样本i,其对话历史通过Transformer映射为对应的查询表征qi=E(Ui)∈Rd
给定对于样本对(i,j)及相应的层级标签llocal=(isRequestable,domainID,entityID),用于标注的多层级的相似度函数f:
Figure FDA0003989837390000022
其中|l|表示标签的层级,li,k表示样本i的第k层标签信息,lj,k表示样本j的第k层标签信,isRequestable表示是否请求,domainID表示域ID,entityID表示实体ID;
对于批样本集合B={1,2,…,N},样本对(i,j)的标注相似度排序由函数f定义的距离空间下的降序排列给出,而度量相似度排序由sim函数给出。
5.根据权利要求4所述的面向任务型对话的多域请求式意图识别方法,其特征在于,步骤S3中,给定样本对(i,j),根据实体级层级标签llocal=(isRequestable,domainID,entityID),可计算多层级相似度及样本对重要性:
Figure FDA0003989837390000023
其中,Dij为逆序对于度量排序与标定排序的相对位置差,反应了样本对(i,j)的逆序程度。
6.根据权利要求5所述的面向任务型对话的多域请求式意图识别方法,其特征在于,步骤S3中,在线训练时,每个样本都有局部与全局两个尺度且固定大小的三元组缓冲区,对于逆序样本对定义其重要性并进行排序,逆序样本对依据其重要性大小依次存入三元组缓冲区。
7.根据权利要求6所述的面向任务型对话的多域请求式意图识别方法,其特征在于,所述步骤S3通过局部缓冲区中的三元组计算实体级局部损失函数:
Figure FDA0003989837390000031
其中,α为最大间隔,sg(·)为梯度截断算子,(qi,zi,qi,m -)∈Triplesi,local
8.根据权利要求7所述的面向任务型对话的多域请求式意图识别方法,其特征在于,所述步骤S4通过全局缓冲区中的三元组计算域级全局损失函数:
Figure FDA0003989837390000032
α为最大间隔,sg(·)为梯度截断算子,(qi,zi,qi -)∈Triplesglobal
9.根据权利要求8所述的面向任务型对话的多域请求式意图识别方法,其特征在于,所述步骤S5通过码本损失函数对码本嵌入进行更新:
Figure FDA0003989837390000033
其中qi为样本i于度量空间中的查询表征,zi为其对应的码本表征。
10.根据权利要求1-9任一项所述的面向任务型对话的多域请求式意图识别方法,其特征在于,所有输入对话历史均通过步骤S1进行分词处理。
CN202110296459.0A 2021-03-19 2021-03-19 一种面向任务型对话的多域请求式意图识别方法 Active CN113076758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110296459.0A CN113076758B (zh) 2021-03-19 2021-03-19 一种面向任务型对话的多域请求式意图识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110296459.0A CN113076758B (zh) 2021-03-19 2021-03-19 一种面向任务型对话的多域请求式意图识别方法

Publications (2)

Publication Number Publication Date
CN113076758A CN113076758A (zh) 2021-07-06
CN113076758B true CN113076758B (zh) 2023-03-14

Family

ID=76612853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110296459.0A Active CN113076758B (zh) 2021-03-19 2021-03-19 一种面向任务型对话的多域请求式意图识别方法

Country Status (1)

Country Link
CN (1) CN113076758B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656556B (zh) * 2021-08-20 2023-08-15 广州天宸健康科技有限公司 一种文本特征抽取方法及知识图谱构建方法
CN113516209B (zh) * 2021-09-14 2021-12-17 中国人民解放军国防科技大学 一种用于少样本意图识别的对比任务适应学习方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN111125331A (zh) * 2019-12-20 2020-05-08 京东方科技集团股份有限公司 语义识别方法、装置、电子设备及计算机可读存储介质
CN111639171A (zh) * 2020-06-08 2020-09-08 吉林大学 一种知识图谱问答方法及装置
CN112417132A (zh) * 2020-12-17 2021-02-26 南京大学 一种利用谓宾信息筛选负样本的新意图识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7095254B2 (ja) * 2017-10-10 2022-07-05 トヨタ自動車株式会社 対話システムおよびドメイン決定方法
US20200066267A1 (en) * 2018-06-08 2020-02-27 Nuance Communications, Inc. Dialog Manager for Supporting Multi-Intent Dialogs
US11514915B2 (en) * 2018-09-27 2022-11-29 Salesforce.Com, Inc. Global-to-local memory pointer networks for task-oriented dialogue
US11138285B2 (en) * 2019-03-07 2021-10-05 Microsoft Technology Licensing, Llc Intent encoder trained using search logs
CN110209793A (zh) * 2019-06-18 2019-09-06 佰聆数据股份有限公司 一种用于智能识别文本语义的方法
CN112131359A (zh) * 2020-09-04 2020-12-25 交通银行股份有限公司太平洋信用卡中心 一种基于图形化编排智能策略的意图识别方法及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN111125331A (zh) * 2019-12-20 2020-05-08 京东方科技集团股份有限公司 语义识别方法、装置、电子设备及计算机可读存储介质
CN111639171A (zh) * 2020-06-08 2020-09-08 吉林大学 一种知识图谱问答方法及装置
CN112417132A (zh) * 2020-12-17 2021-02-26 南京大学 一种利用谓宾信息筛选负样本的新意图识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented Dialogue;Chien-ShengWu et al.;《arXiv》;20201001;第1-13页 *
任务型对话系统研究综述;赵阳洋 等;《计算机学报》;20201031;第43卷(第10期);第1862-1896页 *

Also Published As

Publication number Publication date
CN113076758A (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN109918673B (zh) 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN107085585B (zh) 用于图像搜索的准确的标签相关性预测
US11816888B2 (en) Accurate tag relevance prediction for image search
US20180150561A1 (en) Searching method and searching apparatus based on neural network and search engine
US11663280B2 (en) Search engine using joint learning for multi-label classification
CN113076758B (zh) 一种面向任务型对话的多域请求式意图识别方法
CN113297360B (zh) 基于弱监督学习和联合学习机制的法律问答方法及设备
CN113239071B (zh) 面向科技资源学科及研究主题信息的检索查询方法及系统
CN111666766A (zh) 数据处理方法、装置和设备
CN112101040A (zh) 一种基于知识图谱的古代诗词语义检索方法
CN112818091A (zh) 基于关键词提取的对象查询方法、装置、介质与设备
CN111538846A (zh) 基于混合协同过滤的第三方库推荐方法
CN112101029B (zh) 一种基于bert模型的高校导师推荐管理方法
CN114328800A (zh) 文本处理方法、装置、电子设备和计算机可读存储介质
CN113961666A (zh) 关键词识别方法、装置、设备、介质及计算机程序产品
CN112699685A (zh) 基于标签引导的字词融合的命名实体识别方法
CN116644148A (zh) 关键词识别方法、装置、电子设备及存储介质
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质
CN114298047A (zh) 基于笔画卷积和词向量的中文命名实体识别方法及系统
CN111061939B (zh) 基于深度学习的科研学术新闻关键字匹配推荐方法
CN116226320A (zh) 一种预测下文信息的方法、装置、电子设备及存储介质
CN113656429A (zh) 一种关键词提取方法、装置、计算机设备和存储介质
CN113536790A (zh) 基于自然语言处理的模型训练方法及装置
Xie et al. New word detection in ancient Chinese literature
CN116089586B (zh) 基于文本的问题生成方法及问题生成模型的训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant