CN116776870B - 意图识别方法、装置、计算机设备及介质 - Google Patents

意图识别方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN116776870B
CN116776870B CN202311081927.8A CN202311081927A CN116776870B CN 116776870 B CN116776870 B CN 116776870B CN 202311081927 A CN202311081927 A CN 202311081927A CN 116776870 B CN116776870 B CN 116776870B
Authority
CN
China
Prior art keywords
intention recognition
parameter
intention
model
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311081927.8A
Other languages
English (en)
Other versions
CN116776870A (zh
Inventor
于菲
邓知龙
饶孟良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202311081927.8A priority Critical patent/CN116776870B/zh
Publication of CN116776870A publication Critical patent/CN116776870A/zh
Application granted granted Critical
Publication of CN116776870B publication Critical patent/CN116776870B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例公开了一种意图识别方法、装置、计算机设备及介质,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,该方法包括:获取针对待识别文本的多个意图识别任务中每个意图识别任务的任务标识;从模型参数集合中获取针对多个任务标识分别对应的目标子参数;模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;调用多意图识别模型基于多个目标子参数及共享参数,对待识别文本进行意图识别,得到待识别文本的多个意图;共享参数为在完成每个意图识别任务时共享的模型参数,共享参数以及一个目标子参数用于完成一个意图识别任务;可实现文本中多个意图的识别,提高意图识别准确性。

Description

意图识别方法、装置、计算机设备及介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种意图识别方法、装置、计算机设备及介质。
背景技术
在智能客服系统中,通常需要利用对象输入的文本或语音识别转写的文本,预测对象的意图,并基于对象的意图提供相应的服务以解决客户的需求。而在智能客服系统中,不同对象的意图或需求可能是不同的,则需要对对象的不同意图进行预测并提供相应的服务。但是现有技术通常只能识别出文本中的一个意图。因此如何有效的识别出文本所包含的多个意图成为了当前研究热点。
发明内容
本申请实施例提供了一种意图识别方法、装置、计算机设备及介质,可实现文本中多个意图的识别,提高意图识别准确性。
第一方面,本申请实施例提供了一种意图识别方法,包括:
获取待识别文本,并获取针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务用于指示识别所述待识别文本中不同的意图;
从模型参数集合中获取针对所述多个任务标识分别对应的目标子参数;所述模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数;
调用多意图识别模型基于多个目标子参数以及共享参数,对所述待识别文本进行意图识别,得到所述待识别文本的多个意图结果;所述共享参数为在完成每个意图识别任务时共享的模型参数,所述共享参数以及一个目标子参数用于完成一个意图识别任务。
第二方面,本申请实施例提供了一种意图识别装置,包括:
获取单元,用于获取待识别文本,并获取针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务用于指示识别所述待识别文本中不同的意图;
所述获取单元,还用于从模型参数集合中获取针对所述多个任务标识分别对应的目标子参数;所述模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数;
识别单元,用于调用多意图识别模型基于多个目标子参数以及共享参数,对所述待识别文本进行意图识别,得到所述待识别文本的多个意图结果;所述共享参数为在完成每个意图识别任务时共享的模型参数,所述共享参数以及一个目标子参数用于完成一个意图识别任务。
第三方面,本申请实施例提供了一种计算机设备,该计算机设备包括处理器和存储器,其中,存储器用于存储计算机程序,该计算机程序包括程序指令,处理器被配置用于调用该程序指令,执行上述方法中的部分或全部步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时,用于执行上述方法中的部分或全部步骤。
第五方面,本申请实施例还提供了一种计算机程序产品或者计算机程序,该计算机程序产品或计算机程序包括程序指令,该程序指令被处理器执行时可实现上述方法中的部分或全部步骤。
本申请实施例,可以获取待识别文本,并可以获取针对待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务用于指示识别待识别文本中不同的意图;然后,可以从模型参数集合中获取针对多个任务标识分别对应的目标子参数;模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数;进而可以调用多意图识别模型基于多个目标子参数以及共享参数,对待识别文本进行意图识别,得到待识别文本的多个意图结果;共享参数为在完成每个意图识别任务时共享的模型参数,共享参数以及一个目标子参数用于完成一个意图识别任务。通过实施上述方法,可以实现对文本的多个意图的识别,以有效还原文本中原始意图;并且,在进行多个意图识别时,整个识别过程只需要通过一次模型预测即可完成,相比于传统的一个意图需进行一次模型预测,本申请可以大大减少模型预测的次数,提高预测效率和响应速度,并可有效提高意图识别智能化。并且,在预测过程中,通过参数共享,进行不同的意图预测时可以共享参数,可以避免重复计算和冗余参数,减少了计算复杂度,加速推理过程,从而有效提高了推理效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种意图识别系统的架构示意图;
图2是本申请实施例提供的一种意图识别方法的流程示意图;
图3a是本申请实施例提供的一种利用多意图识别模型进行意图识别的结构示意图;
图3b是本申请实施例提供的另一种利用多意图识别模型进行意图识别的结构示意图;
图4是本申请实施例提供的另一种意图识别方法的流程示意图;
图5a是本申请实施例提供的一种对多意图识别模型进行训练的结构示意图;
图5b是本申请实施例提供的另一种对多意图识别模型进行训练的结构示意图;
图6是本申请实施例提供的一种意图识别装置的结构示意图;
图7是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
下述首先对本申请实施例所涉及到的相关术语及概念进行简要介绍:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大意图识别技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
基于上述人工智能技术中所提及的自然语言处理、机器学习技术等技术,本申请实施例提出了一种意图识别方案,以实现对文本中多个意图的识别。具体的,该方案原理如下:可以获取针对待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务可以用于指示识别待识别文本中不同的意图;进而可以调用多意图识别模型基于多个任务标识对待识别文本进行意图识别,得到待识别文本的多个意图。在一个实施例中,可以从模型参数集合中获取针对多个任务标识分别对应的目标子参数;该模型参数集合中可以包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数;然后,再调用多意图识别模型基于多个目标子参数以及共享参数,对待识别文本进行意图识别,得到待识别文本的多个意图结果。其中,共享参数为在完成每个意图识别任务时共享的模型参数,共享参数以及一个目标子参数可以用于完成一个意图识别任务。
在具体实现中,上述所提及的意图识别方案的执行主体可以是计算机设备,该计算机设备可以是终端或者服务器。此处所提及的终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等;服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,等等。
需要说明的是,当计算机设备为服务器时,本申请实施例提供了一种意图识别系统,如图1所示,该意图识别系统包括至少一个终端和至少一个服务器;终端可以获取待识别文本,并将获取到的待识别文本上传至服务器(即计算机设备),以使计算机设备可以获取待识别文本,并基于意图识别方案对该待识别文本进行意图识别,以得到该待识别文本的多个意图结果。
经实践表明,本申请实施例所提出的意图识别方案可具有如下有益效果:可以实现对文本的多个意图的识别,以有效还原文本中原始意图;并且,在进行多个意图识别时,整个识别过程只需要通过一次模型预测即可完成,相比于传统的一个意图需进行一次模型预测,本申请可以大大减少模型预测的次数,提高预测效率和响应速度,并可有效提高意图识别智能化。并且,在预测过程中,通过参数共享,进行不同的意图预测时可以共享参数,可以避免重复计算和冗余参数,减少了计算复杂度,加速推理过程,从而有效提高了推理效率。
基于上述所提供的意图识别方案,本申请实施例提供了一种意图识别方法,该意图识别方法可由上述所提及的计算机设备执行,本实施例主要描述利用多意图识别模型进行多意图识别的具体实现过程,请参阅图2,该意图识别方法包括但不限于以下步骤:
S201,获取待识别文本,并获取针对待识别文本的多个意图识别任务中每个意图识别任务的任务标识。
其中,不同的意图识别任务可以用于指示识别待识别文本中不同的意图;不同的任务标识可以用于指示不同的意图识别任务。
其中,待识别文本可以是任意存在意图识别需求的业务场景中的文本;如该业务场景可以是外呼场景、会话语义场景、搜索场景等等;该文本可以是原始的文本,也可以是语音转换后的文本。
例如,在外呼场景中,该待识别文本可以是指:外呼机器人与外呼对象的对象终端的通话过程中,外呼对象的通话音频对应的文本。如该外呼场景具体可以是电销场景下的外呼等等。示例性的,外呼对象在通话过程中说出“不好意思听不清”,则可以将该通话音频转换为文本,而转换的文本即可以作为待识别文本,以识别出外呼对象说出这句话的意图。
又如,在会话语义场景中,该待识别文本可以是指:多个会话对象在使用各自的对象终端进行会话的过程中,任一会话对象输出的文本。如该会话语义场景具体可以是金融场景下的会话、3C场景下的会话(3C场景下的会话是一种针对客户关系管理的会话系统,能够有效帮助企业更好的管理客户资源,提高销售效率)、汽车客服场景下的会话、酒店预订房间场景下的会话等等。示例性的,以会话语义场景为酒店预订房间场景为例,多个会话对象可以包括客户以及酒店的智能客服(或问答机器人),如客户在通过智能客服预订房间时,客户可输入一个信息:请帮我预订在3月3号到5号的一个标间,则可以将该信息作为待识别文本,以识别出客户的会话意图。
又如,在搜索场景中,该待识别文本可以是指对象在搜索系统输入的问题。可以理解的是,对象可以在搜索系统进行相关搜索,如对象可以在搜索系统中语音输入或手动输入一个问题,而该问题可以作为一个待识别文本。示例性的,对象输入的问题是“账号密码丢失,如何找回”,则这个问题可以作为待识别文本,以识别出该问题所存在的搜索意图。
可以理解的是,在实际的应用中,如在智能客服系统中,通常需要基于对象输入的文本或语音识别转写的结果(即将语音转换得到的文本),预测出对象的意图,以解决对象的需求,则在这一过程中,智能客服系统需要具有高效、准确、快速的意图识别能力。通常,每个对象的意图和需求都是不同的,或者,一个对象在所说出的一句话中,也可能存在多个意图,那么需要对这些意图和需求进行预测并提供相应的服务,则在实际的应用中,一个系统通常会存在针对多个意图预测的需求,如需要对对象的不同意图进行预测。而在不同的业务场景下,需识别的意图可能存在区别,为了加快意图识别速度,可以缩小意图识别的范围,则可以基于业务场景确定一个文本需进行意图识别的大致范围,即可以基于不同的业务场景确定一个文本所需识别的意图。
基于此可知,可以预先设置参考意图识别场景与参考任务标识之间的映射关系,其中,一个参考任务标识可以用于唯一指示一个意图识别任务,而一个意图识别任务可以用于指示识别文本中的一个意图,那么,通过该映射关系,可以了解到每个意图识别场景下需进行哪些意图的识别,以便于后续可以针对性的获取所需要的模型参数进行意图的预测。此处的意图识别场景与业务场景可以作同样理解。
基于上述描述可知,步骤S201中关于确定待识别文本所包含的任务标识的具体实现可以是:先获取待识别文本的意图识别场景,并可以获取预设的参考意图识别场景与参考任务标识之间的映射关系;进一步的,可以基于意图识别场景以及映射关系中确定针对待识别文本的多个意图识别任务中每个意图识别任务的任务标识。例如,可以将与意图识别场景所匹配到的参考意图识别场景对应的参考任务标识,作为待识别文本所具有的任务标识。示例性的,待识别文本的意图识别场景为场景A,在场景A下所对应的参考任务标识为标识1、标识2、标识3,则该待识别文本的任务标识为标识1、标识2、标识3,即该待识别文本所具有的意图识别任务包括针对标识1、标识2以及标识3分别指示的意图识别任务。
S202,从模型参数集合中获取针对多个任务标识分别对应的目标子参数。
其中,模型参数集合中可以包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数。这些子参数可以是多意图识别模型进行多意图识别所需的模型参数,且是已完成训练的模型参数。其中,多意图识别模型的模型参数可以包括:用于完成n个意图识别任务中每个意图识别任务分别对应的子参数、以及针对在完成每个意图识别任务时共享的参数(如可以称之为是共享参数);共享参数可以理解为在识别任意一个意图时,均需要利用到的参数。在一个实施例中,共享参数以及一个意图识别任务对应的子参数可以用于完成一个意图识别任务。
需理解的是,此处的共享参数可以是指预训练语言模型的模型参数,而该预训练语言模型为已完成训练(即预训练)的模型,则此处的共享参数也可以是指已完成训练的模型参数,或者说对预训练语言模型训练后所得到的模型参数;n个意图识别任务分别对应的子参数是在对训练后的预训练语言模型进行再次训练(即微调),并在再次训练过程中保持共享参数不变时所得到的。
其中,微调(fine-tune)可以是指在使用经过预训练的预训练语言模型(如Transformer模型)中的权重(即模型参数)作为初始权重后,针对具体的下游任务(如本申请中的意图识别任务)再对这些权重进行一次重新训练。相比于从头训练一个任务专用的神经网络模型,针对预训练语言模型的微调可以用较少的标注数据达到更高的精度和更快的训练速度,则在预训练语言模型的基础上针对下游任务进行微调,并利用微调后的预训练语言模型来实现下游任务可以达到更高的训练效果。
在一个实施例中,在训练得到n个意图识别任务分别对应的子参数,或者说训练得到用于识别每个意图的子参数之后,可以将这些子参数进行存储,以便于可以在存在对应意图识别任务的意图识别需求时,从存储中获取相应的子参数进行意图识别。如前所述,上述提及的模型参数集合可以存储在预设存储区域,且该模型参数集合中的各个子参数可以与相应的意图识别任务的任务标识进行关联存储,则在确定待识别文本对应的多个任务标识之后,可以从该模型参数集合中获取待识别文本针对多个任务标识分别对应的子参数,如可以将此处的子参数称之为目标子参数。即在对待识别文本进行意图识别时,可以从该模型参数集合中调用这些目标子参数进行多意图识别,从而得到针对待识别文本的多个意图。
其中,预训练语言模型可以是BERT模型、Transformer模型等可应用在自然语言处理领域中的模型;本申请实施例以预训练语言模型为Transformer模型为例进行相关阐述,例如,上述提及的共享参数可以是指Transformer模型在完成预训练后的模型参数。Transformer模型是一种基于自注意力机制的神经网络模型,经实践表明,Transformer模型在微调方面表现出了优异的性能,在不同的下游任务上,只需用少量的标注数据进行微调,就可以获得显著的性能提升。则在本申请实施例中,可以以Transformer模型作为预训练语言模型,以有效保证意图识别的准确性以及可靠性。
其中,每个意图识别任务对应的子参数可以包括第一参数和第二参数,第一参数的输入维度与共享参数的输入维度相同,第二参数的输出维度与共享参数的输出维度相同,第一参数的输出维度与第二参数的输入维度相同,且第一参数的输出维度小于共享参数的输入维度以及输出维度。在对预训练语言模型再次训练(即微调)的过程中,仅对各个意图识别任务对应的子参数进行训练(或者理解为更新)。即在对这些子参数进行训练的过程中,共享参数是不训练的或者说不更新的;换言之,预训练语言模型在再次训练的过程中,共享参数是保持不变的。在这种训练策略下,可以有效避免已经训练好的预训练语言模型被影响,从而有效保持了模型的连续性和稳定性,也提高了模型的可迁移性和应用性。
在一个实施例中,对于各个意图识别任务的子参数中的第一参数以及第二参数可以进行区分存储。例如,可以以一个意图识别任务进行存储,即每个意图识别任务与对应的子参数中的第一参数以及第二参数是关联存储的。又如,对于各个意图识别任务中的第一参数可以存储在一个集合(列表)中,对于各个意图识别任务中的第二参数可以存储在另一个集合(列表)中,而这两个集合中的各个参数分别与对应的意图识别任务进行关联。
可以理解的是,针对神经网络模型中的模型参数通常是矩阵级的,则此处所提出训练策略可以理解为利用两个低秩矩阵的乘去近似原矩阵的过程,此处的两个低秩矩阵是指第一参数对应的矩阵以及第二参数对应的矩阵,原矩阵是指共享参数对应的矩阵;通过上述对第一参数以及第二参数输入维度以及输出维度的理解可知,此处的第一参数和第二参数的参数量是远远小于原始参数(即共享参数)的参数量,而参数量的减少,可以有效减少模型在训练过程中的计算复杂度,从而可以加快训练效率,进而可以有效降低学习成本。
例如,本申请实施例所提出的多意图识别模型的模型结构可如图3a所示,如图3a中的X和Y可分别表示多意图识别模型的输入和输出;W可表示多意图识别模型中的共享参数;A1和B1分别表示第1个意图识别任务对应的子参数中的第一参数以及第二参数,A2和B2分别表示第2个意图识别任务对应的子参数中的第一参数以及第二参数,以此类推,An和Bn分别表示第n个意图识别任务对应的子参数中的第一参数以及第二参数。其中,对于各个意图识别任务中的第一参数可以存储在一个列表中,如可以将该列表记为A_List;对于各个意图识别任务中的第二参数可以存储在另一个列表中,如可以将该列表记为B_List。
S203,调用多意图识别模型基于多个目标子参数以及共享参数,对待识别文本进行意图识别,得到待识别文本的多个意图结果。
其中,共享参数为在完成每个意图识别任务时可共享的模型参数,即在完成每一个意图识别任务时,均需利用共享参数;共享参数以及一个目标子参数可以用于完成一个意图识别任务。可见,在本申请实施例中,利用了参数同享这种方式进行多意图识别;在这种参数同享方式下,可以支持不同意图之间的参数同享,以避免多个意图分类(意图识别)之间重复的参数,让每个意图分类共享部分参数,在不影响准确率的情况下可以大大减少参数数量。
在一种实现方式中,步骤S203的具体实现可以是:先将共享参数分别与多个目标子参数中的每个目标子参数进行组合,得到用于完成多个意图识别任务中每个意图识别任务的总参数。即完成一个意图识别任务,所需要的模型参数包括:该意图识别任务对应的目标子参数以及共享参数。
例如,预训练语言模型中原有的模型参数(即共享参数)为W,多个意图识别任务中的第一个意图识别任务的目标子参数为W1,第二个意图识别任务的目标子参数为W2,则完成第一个意图识别任务的总参数W’=W+W1,完成第二个意图识别任务的总参数W’=W+W2。其中,目标子参数为W1可表示为A1×B1,W2可表示为A2×B2,则完成第一个意图识别任务的总参数W’=W+A1×B1,完成第一个意图识别任务的总参数W’=W+A2×B2。
而在确定每个意图识别任务的总参数之后,则可以分别基于每个意图识别任务的总参数对待识别文本进行相应意图识别任务的意图识别,即对待识别文本进行多个意图的预测,得到待识别文本在每个意图识别任务下的意图结果。
在具体应用场景中,在外呼场景中,待识别文本可以是:外呼机器人与外呼对象的对象终端的通话过程中,外呼对象的通话音频对应的文本;则待识别文本的多个意图结果可以为外呼对象的多个通话意图。在这种情况下,在得到外呼对象的多个通话意图之后,即可以基于外呼对象的多个通话意图确定响应数据,以使外呼机器人可以利用响应数据与外呼对象的对象终端进行通话。
在一个实施例中,可以从参考话术集合中获取多个通话意图中每个通话意图对象的目标话术,以基于获取到的目标话术确定外呼机器人对外呼对象的响应数据。其中,参考话术集合中存储有大量通话意图对应的话术,则在确定外呼对象的通话意图之后,可以从该参考话术集合中获取外呼对象的多个通话意图中每个通话意图对应的话术,而所获取到的话术即可以称之为是目标话术。
其中,参考话术集合中一个通话意图对应的话术的数量可以为一个或多个,在通话意图对应的话术的数量为多个的情况下,可以从这多个话术中随机选择一个话术作为目标话术,也可以按照预设的选择规则从多个话术中选择出目标话术。例如,该选择规则可以是基于特征参数进行选择的规则,该特征参数可以是历史选择次数等等;示例性的,可以将历史选择次数最高的话术作为目标话术。
可将,在外呼场景中,通过多意图识别模型全面的识别出外呼对象的通话意图,可以利用不同意图对应的话术更加针对性的与外呼对象进行通话,以有效提高外呼机器人的沟通效率;同时,由于外呼机器人有效率的沟通,也可以有效分担人工外呼的工作量,从而降低因人工外呼所产生的外呼成本。
在会话语义场景中,待识别文本可以是:多个会话对象在使用各自的对象终端进行会话的过程中,任一会话对象输出的文本;则待识别文本的多个意图结果可以为会话对象的多个会话意图。在这种情况下,在得到会话对象的多个会话意图之后,即可以基于会话对象的多个会话意图确定响应数据,以使其他会话对象(如智能客服或问答机器人等)可以利用响应数据与会话对象的对象终端进行沟通。此处响应数据的确定原理与上述在外呼场景中响应数据的确定原理可以是一致的,此处对响应数据的确定过程不再赘述。可见,通过多意图识别模型的多意图识别功能,可以尽可能识别出会话对象所包含的所有会话意图,以保证会话对象双方可以进行高效的会话,避免因会话意图的遗漏而导致过多重复且无效的会话。
在搜索场景中,待识别文本可以是:对象输入的问题;则待识别文本的多个意图结果可以为对象的多个搜索意图。在这种情况下,在得到对象的多个搜索意图之后,搜索系统可以基于这些搜索意图从资源库中搜索对应的搜索结果,并将搜索结果展示给对象。可见,通过多意图识别模型的多意图识别功能,可以尽可能识别出对象所包含的所有搜索意图,以避免在存在多个搜索意图但仅识别出一个搜索意图的情况下,导致展示给对象的搜索结果不完整,使得对象搜索体验差较差,而是为对象提供更为准确以及丰富的搜索结果,并有效提高对象的搜索体验感。
例如,如图3b所示,对于一个待识别文本(如不好意思听不清),需要对该待识别文本进行多个意图的预测时,可以将待识别文本以及针对该待识别文本的多个任务标识输入多意图识别模型(或称之为是联合意图模型),以使得该多意图识别模型可以输出在各个任务标识所指示的意图识别任务下的意图结果。例如,假设多个任务标识包括意图1、意图2、…、意图n,则通过该多意图识别模型可以输出在意图1下的意图结果、意图2下的意图结果、…、意图n下的意图结果。
可见,在本申请实施例中,对于存在多个意图的文本,可以将所需预测的每个意图和文本组合成一个batch(批处理),整个预测过程只需要通过一次模型预测即可完成对文本的多个意图的识别。相比于传统的多意图识别模型的部署方法(即为每一个意图部署一个意图识别模型),本申请实施例的这种方法可以大大减少模型预测的次数,传统的多意图识别模型中是需要针对每一个意图进行一次模型预测。那么针对多个意图,则需要进行多次模型预测,而本申请实施例所提出的多意图识别模型仅需要进行一次模型预测,从而可以有效提高预测效率和响应速度。并且,通过参数共享,在进行不同意图的识别时可以共享参数,避免重复计算和冗余参数,从而可以有效加速推理过程。
在本申请实施例中,可以获取待识别文本,并可以获取针对待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务用于指示识别待识别文本中不同的意图;然后,可以从模型参数集合中获取针对多个任务标识分别对应的目标子参数;该模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;进而可以调用多意图识别模型基于多个目标子参数以及共享参数,对待识别文本进行意图识别,得到待识别文本的多个意图结果。通过这种方式,可以实现对文本的多个意图的识别,以有效还原文本中原始意图;并且,在进行多个意图识别时,仅需要进行一次模型预测,相比于传统的一个意图需进行一次模型预测,本申请可以有效提高预测效率和响应速度。另外,在进行多个不同意图的识别时可以共享参数,从而可以避免重复计算和冗余参数,从而可以有效加速预测(推理)过程。
基于上述实施例,本申请实施例提供了另一种意图识别方法,该意图识别方法可由上述所提及的计算机设备执行,本实施例主要描述多意图识别模型的训练过程,请参阅图4,该意图识别方法包括但不限于以下步骤:
S401,获取预训练语言模型。
其中,预训练语言模型可以包括共享参数,预训练语言模型是已完成训练(预训练)的模型,需理解的是,此处的共享参数可以是指预训练语言模型的模型参数,且此处的共享参数是指已完成训练(更新)的模型参数。其中,预训练语言模型可以是BERT模型、Transformer模型等可应用在自然语言处理领域中的模型。
S402,对n个意图识别任务中的每个意图识别任务构建子参数。
其中,n个意图识别任务中不同的意图识别任务用于识别文本中不同的意图。
需要理解的是,在传统的多意图识别方案中,在利用神经网络模型来完成多意图识别时,通常是需要针对每一个意图部署一个神经网络模型,即存在针对多个意图的识别时,需要部署多个神经网络模型,即针对每个功能或者意图需要单独部署一个模型。例如,参见如图5a所示,为了进行多意图识别,需要在系统中部署意图模型1、意图模型2、…、意图模型n,其中,意图模型1是进行意图1的输出、意图模型2是进行意图2的输出、…、意图模型n是进行意图n的输出。因此,当随着系统中需识别的意图数量的增加,需要部署的模型数量也会增多,这就会严重地增加部署的成本,由于模型数量的增多,则针对模型的存储空间也会变大。且为实现针对多意图识别的任务时,需要对每个神经网络模型进行微调,而每个神经网络模型中的模型参数的参数量是非常大的,则为训练得到可进行多个意图识别的模型,需要花费大量的训练成本进行训练,从而导致模型的训练效率较低,学习成本也较大。
基于上述考虑,本申请实施例提出了一种基于参数同享表示的多意图识别模型,仅利用一个模型就可以实现对多个意图的识别,在这种情况下,可以将部署在系统的模型从多个降低到一个,有效减少部署成本以及部署复杂度,也可以有效降低系统的复杂度和维护难度。其中,本申请实施例所提出的多意图识别模型的基本思想是将多个模型的共性部分进行参数同享表示,仅对一部分模型参数进行差异化训练,这样就可以将具有不同意图识别功能的模型保存为同一个模型,也就可以大大减少模型数量和部署成本,并且可以在保证识别准确率和推理速度的前提下,大大降低系统的复杂度和维护难度。基于此,为使得一个模型可以实现对多个意图的识别,可以在预训练语言模型的基础上,先构建针对n个意图识别任务中每个意图识别任务的子参数,这些子参数不同于预训练语言模型原有的模型参数(即共享参数),且在对预训练语言模型的微调中,仅对这些子参数进行更新,保持共享参数不作更新。
在一种实现方式中,在构建每个意图识别任务对应的子参数时,可以引入LoRA(Low-Rank Adaptation,低秩适配)技术,以在LoRA技术的思想下构建子参数。其中,LoRA是一种针对预训练语言模型的微调技术,LoRA的基本思想是:在保持预训练语言模型的原有权重(即模型参数)不变的情况下,注入可训练的秩分解矩阵,从而大大减少下游任务的可训练参数。例如,在预训练语言模型为Transformer模型的情况下,可以为Transformer模型中每一层的Transformer结构注入可训练的秩分解矩阵。
相比于从头开始训练或完全微调一个模型,利用LoRA技术进行微调可以减少训练时间和计算资源的消耗,同时,LoRA不会增加推理时延,与其他微调方法如适配器(Adapter)或前缀微调(Prefix-Tuning)相比具有优势。LoRA允许通过优化适应过程中密集层变化的秩分解矩阵,来间接训练神经网络中的一些密集层,同时保持预先训练的权重不变。
如前所示,LoRA技术中涉及秩分解矩阵,可以理解的是,神经网络模型中的模型参数可以以矩阵形式进行表示,如可以将上述的共享参数称之为原矩阵,则此处的秩分解矩阵也就是将原矩阵拆解为两个低秩矩阵,以利用这两个低秩矩阵去近似原矩阵。也就是说,可以将共享参数拆解为两个参数,并对这两个参数进行训练。
基于此可知,每个意图识别任务对应的子参数可以包括两个参数,如可以分别称之为是第一参数和第二参数。其中,第一参数的输入维度与共享参数的输入维度相同,第二参数的输出维度与共享参数的输出维度相同,第一参数的输出维度与第二参数的输入维度相同,且第一参数的输出维度小于共享参数的输入维度以及输出维度。例如,假设共享参数的矩阵形式表示为K×L,则第一参数的矩阵形式表示为K×M,第二参数的矩阵形式表示为M×L;这样,第一参数和第二参数的乘积也是一个K×L的参数矩阵;其中,M是小于K和L的。需要说明的是,对于形如a×b的矩阵形式表示,a表示输入维度(即矩阵的行),b表示输出维度(即矩阵的列),如上述的针对共享参数中的K和L,K表示共享参数的输入维度,L表示共享参数的输出维度。
在一种实现方式中,可训练的秩分解矩阵(即第一参数和第二参数)以旁路形式出现,例如,参见图3a或图5b所示,可以在原始的预训练语言模型再增加一个旁路,这样所构建的模型可以理解为本申请实施例所提出的多意图识别模型,该旁路是针对子参数的旁路,在该旁路需要做一个降维再升维的操作,来模拟预训练语言模型中的原矩阵(即上述的共享参数)。例如,图5b中的W表示共享参数,A表示第一参数,B表示第二参数;示例性的,如W的参数大小可为768×768,则A的参数大小可为768×8,B的参数大小可为8×768,这样,A和B的乘积也是一个768×768的矩阵。在训练时,固定原始的模型参数(共享参数)不同,训练旁路上的子参数。
可见,此处的第一参数和第二参数的参数量通常远远小于原有参数(即共享参数)的参数量,而在再次训练的过程中,仅是对子参数包括的第一参数以及第二参数进行训练,则相比于训练预训练语言模型中的原有参数,需训练的参数量可以大大减少,而由于参数量的减少,也可以有效减少训练过程中的计算复杂度,从而可以有效降低学习成本。
例如,以预训练语言模型为BERT模型、Transformer模型来说,这些模型涉及自注意力机制,且在自注意力机制中包含注意力参数,如键向量序列K、查询向量序列Q、值向量序列V;其中,K=WKX,Q=WQX,V=WVX,X表示模型的输入,WK、WQ、WV分别是指模型中可学习的参数矩阵,则对于这些注意力参数(如具体可以是WK、WQ、WV等中的一种或多种)也可以引入第一参数以及第二参数。示例性的,对于BERT中的参数Q,引入Q_A(可理解为第一参数)、Q_B(可理解为第二参数),即将参数Q拆解为Q_A和Q_B这两个参数;对于参数V引入V_A(可理解为第一参数)、V_B(可理解为第二参数),即将参数V拆解为V_A和V_B这两个参数。
S403,基于预训练语言模型中的共享参数以及每个意图识别任务对应的子参数,构建多意图识别模型。
其中,多意图识别模型的模型参数可以包括共享参数以及n个意图识别任务中每个意图识别任务对应的子参数。例如,该多意图识别模型可以参见图3a或图5b。
S404,对多意图识别模型进行训练,得到训练后的多意图识别模型。
需要说明的是,在多意图识别模型的训练中使用了如下的参数更新策略。具体地,对于预训练语言模型而言,只有新增的子参数会在再次训练(微调)过程中被更新,而其他参数(即共享参数)在每个意图的训练中时保持不变,即不做更新。这种参数更新策略可具有如下好处:支持不同意图之间的参数同享,大大减少了参数数量,提高了模型的训练效率和推理速度;并且,可以避免已经训练好的预训练语言模型中原始的模型参数(共享参数)被影响,保持了模型的连续性和稳定性,提高了模型的可迁移性和应用性。这种参数更新策略不仅适用于当前模型,也具有广泛的适用性和应用前景,对于以后的模型优化和扩展也会发挥积极的作用。
基于上述的参数更新策略可知,需要分别对所构建的各个意图识别任务的子参数进行训练,以使得可以利用这些训练后的子参数完成后续的意图识别任务。各个意图识别任务的子参数是可以分开训练的,即在训练的过程中,可以将对一个意图识别任务对应的子参数的训练作为一个训练任务,那么针对多意图识别模型的训练,也就是需完成多个训练任务。在一个训练任务中,多意图识别模型的训练结构中的模型参数包括共享参数以及一个意图识别任务对应的子参数。可选的,这多个训练任务可以并行执行,也可以串行执行,对此不作限定;在串行执行的过程中,多个训练任务的执行顺序不作具体限定。
基于上述描述可知,步骤S404的具体实现可以是:可先获取针对n个意图识别任务中每个意图识别任务的样本文本集,以分别基于每个意图识别任务的样本文本集,对多意图识别模型中每个意图识别任务的子参数进行训练,得到每个意图识别任务对应的训练后的子参数,并且,在对每个意图识别任务的子参数进行训练时,共享参数保持不变,即在训练过程中,仅对子参数进行更新,并不对共享参数进行更新。在完成对每个意图识别任务的子参数的训练之后,即可以由共享参数以及每个意图识别任务对应的训练后的子参数,构建多意图识别模型的模型参数,以得到训练后的多意图识别模型。
考虑到对每个意图识别任务的子参数的训练原理是一样的,则下述以n个意图识别任务中的任一意图识别任务为例对子参数的训练进行具体阐述。其中,任一意图识别任务的样本文本集可以包括样本文本以及样本文本的样本标注信息,该样本标注信息可以用于指示样本文本包含的意图。此处样本文本集所包括的样本文本的数量可以为一个或多个,此处以一个为例进行相关描述。
基于此可知,在对任一意图识别任务的子参数的训练的具体过程可以是:基于共享参数、任一意图识别任务的子参数以及样本文本,得到样本文本的预测标注信息;该预测标注信息可以用于指示在共享参数以及任一意图识别任务的子参数的作用下,所预测得到的针对样本文本的意图;在得到该预测标注信息之后,即可以基于样本标注信息以及预测标注信息对任一意图识别任务的子参数进行训练,得到任一意图识别任务对应的训练后的子参数。可选的,可以基于样本标注信息以及预测标注信息计算模型损失值,以基于模型损失值对任一意图识别任务的子参数进行训练,得到训练后的子参数,如可以按照减少模型损失值的方向,优化任一意图识别任务的子参数,以得到训练后的子参数。在一个实施例中,可以采用模型损失函数基于样本标注信息以及预测标注信息计算模型损失值,该模型损失函数可以是交叉熵损失函数等,对此不作限定。
上述方法实施例都是对本申请的方法的举例说明,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。例如,训练得到多意图识别模型之后,即可获取待识别文本,以基于多意图识别模型实现对待识别文本的多个意图的识别,此处不赘述。
在一种实现方式中,为验证本申请实施例所提出的多意图识别模型的可行性以及有效性,对本申请实施例中的多意图识别模型和传统方案中的多意图识别模型在客服系统中进行了性能比较。此处本申请实施例中的多意图识别模型是结合LoRA技术训练得到的,传统方案中的多意图识别模型是采用分别训练的方式进行训练得到的(如图5a所示的多意图识别模型结构)。其中,在客服系统中的外呼场景和会话语义场景中的表现可以如下表1以及表2所示,表1展示的是在外呼场景下两种训练模式下多意图识别模型的性能比较,表2展示的是在会话语义场景下两种训练模式下多意图识别模型的性能比较;且在每种场景下,对不同领域下进行了多意图识别模型的性能比较,如在外呼场景中,涉及关于电销领域中的多意图识别,在会话语义场景中,涉及关于金融领域、3C领域、汽车客户侧以及汽车客服侧的多意图识别。其中,进行性能比较所利用到的性能参数为F1,F1可以用于衡量多意图识别模型在进行多个意图识别的精确率和召回率的平衡。表1和表2可参见如下所示:
表1
表2
通过上述表1和表2中的数据可知,本申请实施例所提出的训练模型下的多意图识别模型在多个领域中的识别准确率以及推理速度的水平,可以达到甚至超过传统方案下的多意图识别模型的识别准确率以及推理速度的水平,但本申请实施例中训练模式下的多意图识别模型相比于传统的训练模式的多意图识别模型,可以减少模型数量和部署成本。综上可知,本申请实施例可以在保证识别准确率和推理速度的前提下,大大提高模型的训练效率以及推理效率,同时也可以有效降低系统的复杂度和维护难度。在一个实施例中,本申请实施例可以应用在基于预训练语言模型(如Transformer模型)的各个领域,如在命名实体识别(NER)序列标注、生成等。在大模型迅速发展的背景下,模型规模迅速增长,本申请实施例提出的模型的训练以及部署方式尤其有重要的价值。
为更加理解本申请实施例所提出的多意图识别方法,下述对该上述提及的多意图识别模型的训练以及应用进一步阐述。其中,以预训练语言模型为Transformer模型为例进行相关描述。
例如,参见图3a或图5b所示,在训练过程中,对于已完成预训练的Transformer模型,可以先构建针对n个意图识别任务中每个意图识别任务对应的子参数,以基于Transformer模型中的原有参数(即共享参数)以及每个意图识别任务对应的子参数构建多意图识别模型。具体地,假设Transformer模型中的原有参数为W,则可以引入第一参数A以及第二参数B,且针对每一个意图识别任务均需引入第一参数以及第二参数,如上述描述的对于第1个意图识别任务的第一参数可记为A1,第二参数可记为B1,依次类推,对于第n个意图识别任务的第一参数可记为An,第二参数可记为Bn。
在多意图识别模型的模型训练中使用如下的参数更新策略。具体地,只有新增的子参数(即各个意图识别任务对应的第一参数和第二参数)会在训练(微调)过程中被更新,而其他参数(即共享参数)在对每个意图进行训练时保持不变,即不做更新。其中,多意图识别模型的训练过程具体可参见上述描述,此次不再赘述。在这种参数更新策略下,可以支持不同意图之间的参数同享,即可在训练中共享模型参数,大大减少了参数数量,有效地减少了模型之间的冗余,并使得训练过程更加高效,并可以避免已经训练好的共享参数被影响,保持了模型的连续性和稳定性,提高了模型的可迁移性和应用性。
在完成多意图识别模型的训练之后,可以对各个意图识别任务对应的子参数进行合并处理。具体地,针对拆分的参数W,可以引入参数列表,分别用于存储每个意图识别任务的新增参数(如第一参数A和第二参数B)。例如,当多意图识别模型需要支持n个意图识别时,如图3a所示,参数列表A_List中存储了每个意图识别任务对应的第一参数A,参数列表B_List中存储了每个意图识别任务对应的第二参数B。对于模型中的其他参数(即共享参数W),在多意图识别模型部署时仅保留一份,每个不同的意图不做重复部署。
可见,在采用上述多意图识别模型的训练以及部署方式下,在训练阶段,可以实现对每个意图识别时的参数同享,并减少多意图识别模型的参数数量,从而提高多意图识别模型的维护性和性能效率。并且,通过参数同享,可以避免多个意图分类(识别)模型之间重复的参数,让每个意图分类模型共享部分参数,在不影响准确率的情况下可以大大减少参数数量。在部署阶段,可以将训练后的多个模型压缩成一个参数共享的模型,从而显著降低了模型所需存储空间,而且可在各种计算平台上进行高效部署。相比于传统的Transformer模型在训练时需要较大的存储和计算资源的问题,本申请所提出的Transformer模型的训练方式,可以进一步提高Transformer模型的训练效率和存储利用率。
在多意图识别模型的推理阶段,相比于针对Transformer模型原有的模型输入,本申请实施例修改了原有的模型输入,来适配新的具有参数共享功能的多意图识别模型。除了Transformer模型原有模型输入(如input_id(输入标识符),attention_mask(注意力掩码)和segment_id(句子标识符)等)外,额外传入了task_id字段(可理解为上述的任务标识)。在需要进行意图预测时,可以基于task_id字段从A_List取出对应的参数矩阵A,从B_List取出对应的参数矩阵B,以利用这些参数完成意图的预测,如在推理时将原有的参数矩阵W替换为W’=W+A×B,以完成推理。
例如,参见图3b所示,对于一个给定的输入文本,当需要对该输入文本进行多个意图的预测时,可以将所需预测的每个意图和输入文本组合成一个batch,整个预测过程只需要通过一次模型预测即可完成。相比于传统的多意图识别模型的部署方案(如图5a的部署),本申请实施例可以大大减少模型预测的次数,提高预测效率和响应速度,通过参数共享,不同的意图分类模型可以共享参数,避免重复计算和冗余参数,加速推理过程。总的来说,针对一个输入文本和所需预测的意图1、意图2、…、意图n,基于参数共享表示的多模型高效训练和部署方案,可以有效地提升推理效率;并且在通过降低部署模型数量至一个的方式下也可以有效保证每个意图识别的准确率不会降低,并且推理速度也不会受到影响。可见,本申请实施例所提出的一种基于Transformer的多意图多模型分类算法,可以有效提高意图识别和情绪识别的准确性和性能效率,而将这种多意图识别模型应用在智能客服产品中,也可以使得智能客服产品具有高效、准确、快速的意图识别和情绪识别能力。
在本申请实施例中,可以在多意图识别模型的训练过程中支持不同意图之间的参数同享,大大减少了参数数量,有效地减少了模型之间的冗余,并使得训练过程更加高效。并且,可以避免已经训练好的共享参数被影响,保持了模型的连续性和稳定性,提高了模型的可迁移性和应用性。在后续进行模型部署时,可以将训练后的多个模型压缩成一个参数共享的模型,从而显著降低了模型所需存储空间,从而可在各种计算平台上进行高效部署。在进行多个意图预测时,整个预测过程只需要通过一次模型预测即可完成,相比于传统的部署方案,本申请可以大大减少模型预测的次数,提高预测效率和响应速度。并且,在预测过程中,通过参数共享,进行不同的意图预测时可以共享参数,避免重复计算和冗余参数,减少了计算复杂度,加速推理过程,从而有效提高了推理效率。
上述详细阐述了本申请实施例的方法,为了便于更好地实施本申请实施例的上述方案,相应地,下面提供了本申请实施例的装置。
图6示出了本申请一个示例性实施例提供的一种意图识别装置的结构示意图;该意图识别装置可以用于是运行于计算机设备中的一个计算机程序(包括程序代码),例如该意图识别装置可以是计算机设备中的应用程序;该意图识别装置可以用于执行图2和图4所示的方法实施例中的部分或全部步骤。请参见图6,该意图识别装置包括如下单元:
获取单元601,用于获取待识别文本,并获取针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务用于指示识别所述待识别文本中不同的意图;
所述获取单元601,还用于从模型参数集合中获取针对所述多个任务标识分别对应的目标子参数;所述模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数;
识别单元602,用于调用多意图识别模型基于多个目标子参数以及共享参数,对所述待识别文本进行意图识别,得到所述待识别文本的多个意图结果;所述共享参数为在完成每个意图识别任务时共享的模型参数,所述共享参数以及一个目标子参数用于完成一个意图识别任务。
在一种实现方式中,所述识别单元602,具体用于:
将共享参数分别与多个目标子参数中的每个目标子参数进行组合,得到用于完成所述多个意图识别任务中每个意图识别任务的总参数;
分别基于所述每个意图识别任务的总参数对所述待识别文本进行相应意图识别任务的意图识别,得到所述待识别文本在每个意图识别任务下的意图结果。
在一种实现方式中,所述装置还包括训练单元603,具体用于:
获取预训练语言模型;所述预训练语言模型包括共享参数,所述预训练语言模型是已完成训练的模型;
对n个意图识别任务中的每个意图识别任务构建子参数;每个意图识别任务对应的子参数包括第一参数和第二参数,所述第一参数的输入维度与所述共享参数的输入维度相同,所述第二参数的输出维度与所述共享参数的输出维度相同,所述第一参数的输出维度与所述第二参数的输入维度相同,且所述第一参数的输出维度小于所述共享参数的输入维度以及输出维度;
基于所述预训练语言模型中的共享参数以及所述每个意图识别任务对应的子参数,构建多意图识别模型;所述多意图识别模型的模型参数包括所述共享参数以及所述n个意图识别任务中每个意图识别任务对应的子参数;
对所述多意图识别模型进行训练,得到训练后的多意图识别模型。
在一种实现方式中,所述训练单元603,具体用于:
获取针对所述n个意图识别任务中每个意图识别任务的样本文本集;
分别基于所述每个意图识别任务的样本文本集,对所述多意图识别模型中每个意图识别任务的子参数进行训练,得到所述每个意图识别任务对应的训练后的子参数;在对每个意图识别任务的子参数进行训练时,所述共享参数保持不变;
由所述共享参数以及每个意图识别任务对应的训练后的子参数,构建所述多意图识别模型的模型参数,以得到训练后的多意图识别模型。
在一种实现方式中,任一意图识别任务的样本文本集包括样本文本以及所述样本文本的样本标注信息,所述样本标注信息用于指示所述样本文本包含的意图;所述训练单元603,具体用于:
针对所述n个意图识别任务中的任一意图识别任务,基于所述共享参数、所述任一意图识别任务的子参数以及所述样本文本,得到所述样本文本的预测标注信息;
基于所述样本标注信息以及所述预测标注信息对所述任一意图识别任务的子参数进行训练,得到所述任一意图识别任务对应的训练后的子参数。
在一种实现方式中,所述获取单元601,具体用于:
获取所述待识别文本的意图识别场景,并获取预设的参考意图识别场景与参考任务标识之间的映射关系;
基于所述意图识别场景以及所述映射关系确定针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识。
在一种实现方式中,所述待识别文本是外呼机器人与外呼对象的对象终端的通话过程中,所述外呼对象的通话音频对应的文本,所述待识别文本的多个意图结果为所述外呼对象的多个通话意图;所述识别单元602,还用于:
从参考话术集合中获取所述多个通话意图中每个通话意图对象的目标话术;
基于获取到的目标话术确定外呼机器人对外呼对象的响应数据,以使所述外呼机器人利用所述响应数据与所述外呼对象的对象终端进行通话。
可以理解,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。本申请实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
请参见图7,图7为本申请实施例提供的一种计算机设备的结构示意图。如图7所示,该计算机设备包括:至少一个处理器701、存储器702。可选的,该计算机设备还可以包括网络接口703。其中,处理器701、存储器702以及网络接口703之间可以交互数据,网络接口703受处理器701的控制用于收发消息,存储器702用于存储计算机程序,该计算机程序包括程序指令,处理器701用于执行存储器702存储的程序指令。其中,处理器701被配置用于调用该程序指令执行上述方法。
其中,存储器702可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器702也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory)、固态硬盘(solid-state drive,SSD)等;存储器702还可以包括上述两种或两种以上种类的存储器的组合。
其中,处理器701可以是中央处理器(central processing unit,CPU)。在一个实施例中,处理器701还可以是图形处理器(Graphics Processing Unit,GPU)。处理器701也可以是由CPU和GPU的组合。
在一个可能的实施方式中,存储器702用于存储程序指令,处理器701可以调用该程序指令,执行以下步骤:
获取待识别文本,并获取针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务用于指示识别所述待识别文本中不同的意图;
从模型参数集合中获取针对所述多个任务标识分别对应的目标子参数;所述模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数;
调用多意图识别模型基于多个目标子参数以及共享参数,对所述待识别文本进行意图识别,得到所述待识别文本的多个意图结果;所述共享参数为在完成每个意图识别任务时共享的模型参数,所述共享参数以及一个目标子参数用于完成一个意图识别任务。
在一种实现方式中,所述处理器701,具体用于:
将共享参数分别与多个目标子参数中的每个目标子参数进行组合,得到用于完成所述多个意图识别任务中每个意图识别任务的总参数;
分别基于所述每个意图识别任务的总参数对所述待识别文本进行相应意图识别任务的意图识别,得到所述待识别文本在每个意图识别任务下的意图结果。
在一种实现方式中,所述处理器701,还用于:
获取预训练语言模型;所述预训练语言模型包括共享参数,所述预训练语言模型是已完成训练的模型;
对n个意图识别任务中的每个意图识别任务构建子参数;每个意图识别任务对应的子参数包括第一参数和第二参数,所述第一参数的输入维度与所述共享参数的输入维度相同,所述第二参数的输出维度与所述共享参数的输出维度相同,所述第一参数的输出维度与所述第二参数的输入维度相同,且所述第一参数的输出维度小于所述共享参数的输入维度以及输出维度;
基于所述预训练语言模型中的共享参数以及所述每个意图识别任务对应的子参数,构建多意图识别模型;所述多意图识别模型的模型参数包括所述共享参数以及所述n个意图识别任务中每个意图识别任务对应的子参数;
对所述多意图识别模型进行训练,得到训练后的多意图识别模型。
在一种实现方式中,所述处理器701,具体用于:
获取针对所述n个意图识别任务中每个意图识别任务的样本文本集;
分别基于所述每个意图识别任务的样本文本集,对所述多意图识别模型中每个意图识别任务的子参数进行训练,得到所述每个意图识别任务对应的训练后的子参数;在对每个意图识别任务的子参数进行训练时,所述共享参数保持不变;
由所述共享参数以及每个意图识别任务对应的训练后的子参数,构建所述多意图识别模型的模型参数,以得到训练后的多意图识别模型。
在一种实现方式中,任一意图识别任务的样本文本集包括样本文本以及所述样本文本的样本标注信息,所述样本标注信息用于指示所述样本文本包含的意图;所述处理器701,具体用于:
针对所述n个意图识别任务中的任一意图识别任务,基于所述共享参数、所述任一意图识别任务的子参数以及所述样本文本,得到所述样本文本的预测标注信息;
基于所述样本标注信息以及所述预测标注信息对所述任一意图识别任务的子参数进行训练,得到所述任一意图识别任务对应的训练后的子参数。
在一种实现方式中,所述处理器701,具体用于:
获取所述待识别文本的意图识别场景,并获取预设的参考意图识别场景与参考任务标识之间的映射关系;
基于所述意图识别场景以及所述映射关系确定针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识。
在一种实现方式中,所述待识别文本是外呼机器人与外呼对象的对象终端的通话过程中,所述外呼对象的通话音频对应的文本,所述待识别文本的多个意图结果为所述外呼对象的多个通话意图;所述处理器701,还用于:
从参考话术集合中获取所述多个通话意图中每个通话意图对象的目标话术;
基于获取到的目标话术确定外呼机器人对外呼对象的响应数据,以使所述外呼机器人利用所述响应数据与所述外呼对象的对象终端进行通话。
具体实现中,上述所描述的装置、处理器、存储器等可执行上述方法实施例所描述的实现方式,也可执行本申请实施例所描述的实现方式,在此不再赘述。
本申请实施例中还提供一种计算机(可读)存储介质,该计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令被处理器执行时,使处理器可执行上述方法实施例中所执行的部分或全部步骤。可选的,该计算机存储介质可以是易失性的,也可以是非易失性的。计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括程序指令,该程序指令被处理器执行时可实现上述意图识别方法中的部分或全部步骤。可选地,该程序指令可以存储在计算机可读存储介质中,计算机设备如计算机设备的处理器从计算机可读存储介质读取该程序指令,处理器执行该程序指令,使得该计算机设备执行上述提供的意图识别方法。
本领域普通技术人员可以意识到,结合本申请中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用,使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个程序指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程设备。程序指令可以存储在计算机可读存储介质中,或者通过计算机可读存储介质进行传输。
程序指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如,同轴电缆、光纤、数字用户线(Digital Subscriber Line,DSL))或无线(例如,红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如,固态硬盘(Solid State Disk,SSD))等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种意图识别方法,其特征在于,所述方法包括:
获取预训练语言模型;所述预训练语言模型包括共享参数,所述预训练语言模型是已完成训练的模型;
对n个意图识别任务中的每个意图识别任务构建子参数;每个意图识别任务对应的子参数包括第一参数和第二参数,所述第一参数的输入维度与所述共享参数的输入维度相同,所述第二参数的输出维度与所述共享参数的输出维度相同,所述第一参数的输出维度与所述第二参数的输入维度相同,且所述第一参数的输出维度小于所述共享参数的输入维度以及输出维度;
基于所述预训练语言模型中的共享参数以及所述每个意图识别任务对应的子参数,构建多意图识别模型;所述多意图识别模型的模型参数包括所述共享参数以及所述n个意图识别任务中每个意图识别任务对应的子参数;
对所述多意图识别模型进行训练,得到训练后的多意图识别模型;
获取待识别文本,并获取针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务用于指示识别所述待识别文本中不同的意图;
从模型参数集合中获取针对所述多个任务标识分别对应的目标子参数;所述模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数;
调用多意图识别模型基于多个目标子参数以及共享参数,对所述待识别文本进行意图识别,得到所述待识别文本的多个意图结果;所述共享参数为在完成每个意图识别任务时共享的模型参数,所述共享参数以及一个目标子参数用于完成一个意图识别任务。
2.根据权利要求1所述的方法,其特征在于,所述调用多意图识别模型基于多个目标子参数以及共享参数,对所述待识别文本进行意图识别,得到所述待识别文本的多个意图结果,包括:
将共享参数分别与多个目标子参数中的每个目标子参数进行组合,得到用于完成所述多个意图识别任务中每个意图识别任务的总参数;
分别基于所述每个意图识别任务的总参数对所述待识别文本进行相应意图识别任务的意图识别,得到所述待识别文本在每个意图识别任务下的意图结果。
3.根据权利要求1所述的方法,其特征在于,所述对所述多意图识别模型进行训练,得到训练后的多意图识别模型,包括:
获取针对所述n个意图识别任务中每个意图识别任务的样本文本集;
分别基于所述每个意图识别任务的样本文本集,对所述多意图识别模型中每个意图识别任务的子参数进行训练,得到所述每个意图识别任务对应的训练后的子参数;在对每个意图识别任务的子参数进行训练时,所述共享参数保持不变;
由所述共享参数以及每个意图识别任务对应的训练后的子参数,构建所述多意图识别模型的模型参数,以得到训练后的多意图识别模型。
4.根据权利要求3所述的方法,其特征在于,任一意图识别任务的样本文本集包括样本文本以及所述样本文本的样本标注信息,所述样本标注信息用于指示所述样本文本包含的意图;所述分别基于所述每个意图识别任务的样本文本集,对所述多意图识别模型中每个意图识别任务的子参数进行训练,得到所述每个意图识别任务对应的训练后的子参数,包括:
针对所述n个意图识别任务中的任一意图识别任务,基于所述共享参数、所述任一意图识别任务的子参数以及所述样本文本,得到所述样本文本的预测标注信息;
基于所述样本标注信息以及所述预测标注信息对所述任一意图识别任务的子参数进行训练,得到所述任一意图识别任务对应的训练后的子参数。
5.根据权利要求1所述的方法,其特征在于,所述获取针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识,包括:
获取所述待识别文本的意图识别场景,并获取预设的参考意图识别场景与参考任务标识之间的映射关系;
基于所述意图识别场景以及所述映射关系确定针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识。
6.根据权利要求1所述的方法,其特征在于,所述待识别文本是外呼机器人与外呼对象的对象终端的通话过程中,所述外呼对象的通话音频对应的文本,所述待识别文本的多个意图结果为所述外呼对象的多个通话意图;还包括:
从参考话术集合中获取所述多个通话意图中每个通话意图对象的目标话术;
基于获取到的目标话术确定外呼机器人对外呼对象的响应数据,以使所述外呼机器人利用所述响应数据与所述外呼对象的对象终端进行通话。
7.一种意图识别装置,其特征在于,包括:
训练单元,用于获取预训练语言模型;所述预训练语言模型包括共享参数,所述预训练语言模型是已完成训练的模型;
所述训练单元,还用于对n个意图识别任务中的每个意图识别任务构建子参数;每个意图识别任务对应的子参数包括第一参数和第二参数,所述第一参数的输入维度与所述共享参数的输入维度相同,所述第二参数的输出维度与所述共享参数的输出维度相同,所述第一参数的输出维度与所述第二参数的输入维度相同,且所述第一参数的输出维度小于所述共享参数的输入维度以及输出维度;
所述训练单元,还用于基于所述预训练语言模型中的共享参数以及所述每个意图识别任务对应的子参数,构建多意图识别模型;所述多意图识别模型的模型参数包括所述共享参数以及所述n个意图识别任务中每个意图识别任务对应的子参数;
所述训练单元,还用于对所述多意图识别模型进行训练,得到训练后的多意图识别模型;
获取单元,用于获取待识别文本,并获取针对所述待识别文本的多个意图识别任务中每个意图识别任务的任务标识;不同的意图识别任务用于指示识别所述待识别文本中不同的意图;
所述获取单元,还用于从模型参数集合中获取针对所述多个任务标识分别对应的目标子参数;所述模型参数集合中包括用于完成n个意图识别任务中每个意图识别任务对应的子参数;n为大于1的正整数;
识别单元,用于调用多意图识别模型基于多个目标子参数以及共享参数,对所述待识别文本进行意图识别,得到所述待识别文本的多个意图结果;所述共享参数为在完成每个意图识别任务时共享的模型参数,所述共享参数以及一个目标子参数用于完成一个意图识别任务。
8.一种计算机设备,其特征在于,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令被执行时,用于实现如权利要求1-6任一项所述的方法。
CN202311081927.8A 2023-08-26 2023-08-26 意图识别方法、装置、计算机设备及介质 Active CN116776870B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311081927.8A CN116776870B (zh) 2023-08-26 2023-08-26 意图识别方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311081927.8A CN116776870B (zh) 2023-08-26 2023-08-26 意图识别方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN116776870A CN116776870A (zh) 2023-09-19
CN116776870B true CN116776870B (zh) 2023-11-14

Family

ID=88013806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311081927.8A Active CN116776870B (zh) 2023-08-26 2023-08-26 意图识别方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN116776870B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704388A (zh) * 2021-03-05 2021-11-26 腾讯科技(深圳)有限公司 多任务预训练模型的训练方法、装置、电子设备和介质
CN113850078A (zh) * 2021-09-29 2021-12-28 平安科技(深圳)有限公司 基于机器学习的多意图识别方法、设备及可读存储介质
CN114582329A (zh) * 2022-03-03 2022-06-03 北京有竹居网络技术有限公司 语音识别方法、装置、计算机可读介质及电子设备
CN116187308A (zh) * 2023-02-27 2023-05-30 阳光保险集团股份有限公司 意图识别方法、装置、电子设备和计算机可读存储介质
CN116244412A (zh) * 2022-12-20 2023-06-09 北京航天云路有限公司 多意图识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230127907A1 (en) * 2021-10-22 2023-04-27 International Business Machines Corporation Intention identification in dialogue system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704388A (zh) * 2021-03-05 2021-11-26 腾讯科技(深圳)有限公司 多任务预训练模型的训练方法、装置、电子设备和介质
CN113850078A (zh) * 2021-09-29 2021-12-28 平安科技(深圳)有限公司 基于机器学习的多意图识别方法、设备及可读存储介质
CN114582329A (zh) * 2022-03-03 2022-06-03 北京有竹居网络技术有限公司 语音识别方法、装置、计算机可读介质及电子设备
CN116244412A (zh) * 2022-12-20 2023-06-09 北京航天云路有限公司 多意图识别方法及装置
CN116187308A (zh) * 2023-02-27 2023-05-30 阳光保险集团股份有限公司 意图识别方法、装置、电子设备和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
融合多约束条件的意图和语义槽填充联合识别;侯丽仙 等;《计算机科学与探索》(第9期);第1545-1553页 *

Also Published As

Publication number Publication date
CN116776870A (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
US20210150355A1 (en) Training machine learning models using task selection policies to increase learning progress
CN111602148B (zh) 正则化神经网络架构搜索
WO2020177282A1 (zh) 一种机器对话方法、装置、计算机设备及存储介质
CN112732911B (zh) 基于语义识别的话术推荐方法、装置、设备及存储介质
US11449744B2 (en) End-to-end memory networks for contextual language understanding
US11610064B2 (en) Clarification of natural language requests using neural networks
WO2020155619A1 (zh) 带情感的机器聊天方法、装置、计算机设备及存储介质
JP7488871B2 (ja) 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム
WO2019084558A1 (en) SELECTING RESPONSE INTERVALS FROM ELECTRONIC DOCUMENTS USING AUTOMATIC APPRENTICESHIP
CN113569017A (zh) 一种模型处理方法、装置、电子设备及存储介质
CN112101042A (zh) 文本情绪识别方法、装置、终端设备和存储介质
CN117971420A (zh) 任务处理、交通任务处理以及任务处理模型训练方法
CN117575008A (zh) 训练样本生成方法、模型训练方法、知识问答方法及设备
CN116776870B (zh) 意图识别方法、装置、计算机设备及介质
CN116521832A (zh) 对话交互方法、装置及系统、电子设备和存储介质
CN117217278A (zh) 模型训练方法、文本召回方法、设备、介质及程序产品
WO2023279921A1 (zh) 神经网络模型的训练方法、数据处理的方法及装置
CN111091011B (zh) 领域预测方法、领域预测装置及电子设备
CN112149426B (zh) 阅读任务处理方法及相关设备
CN117972222B (zh) 基于人工智能的企业信息检索方法及装置
CN116822632B (zh) 一种文本数据的推理方法、装置、存储介质和电子设备
CN117521674B (zh) 对抗信息的生成方法、装置、计算机设备和存储介质
US20240291777A1 (en) Chatbot to receive first notice of loss
CN113782022B (zh) 基于意图识别模型的通信方法、装置、设备及存储介质
CN113343668B (zh) 选择题解题方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant