CN112100368A - 对话交互意图的识别方法和装置 - Google Patents

对话交互意图的识别方法和装置 Download PDF

Info

Publication number
CN112100368A
CN112100368A CN202010704472.0A CN202010704472A CN112100368A CN 112100368 A CN112100368 A CN 112100368A CN 202010704472 A CN202010704472 A CN 202010704472A CN 112100368 A CN112100368 A CN 112100368A
Authority
CN
China
Prior art keywords
vertical field
round
belongs
vertical
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010704472.0A
Other languages
English (en)
Other versions
CN112100368B (zh
Inventor
杨志明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deep Thinking Of Artificial Intelligence Technology Shanghai Co ltd
Original Assignee
Deep Thinking Of Artificial Intelligence Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deep Thinking Of Artificial Intelligence Technology Shanghai Co ltd filed Critical Deep Thinking Of Artificial Intelligence Technology Shanghai Co ltd
Priority to CN202010704472.0A priority Critical patent/CN112100368B/zh
Publication of CN112100368A publication Critical patent/CN112100368A/zh
Application granted granted Critical
Publication of CN112100368B publication Critical patent/CN112100368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种对话交互意图的识别方法和装置,其中方法包括:对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语句。本申请易于实现,且可以提高识别效率和用户体验。

Description

对话交互意图的识别方法和装置
技术领域
本发明涉及人工智能技术,特别是涉及一种对话交互意图的识别方法和装 置。
背景技术
随着人工智能技术的快速发展,人机对话技术近年来受到学术界和工业界 的广泛关注。各种各样的智能机器人层出不穷,已经在医疗、军事、汽车、商 业等领域获得了成功的应用,并逐渐对我们的生活产生重大影响。典型的智能 对话交互机器人框架都是分模块串行处理对话任务的,每个模块负责特定的任 务,并将生成的结果传递给下一个模块。图1为现有的面向任务的对话系统框 架示意图,如1所示,整个交互框架通常由自然语言理解(Natural Language Understanding,NLU),对话状态跟踪(Dialogue State Tracking,DST),对话策略 学习(Dialogue Policy Learning,DPL),自然语言生成(NaturalLanguage Generation,NLG)四个部分构成。
人机对话系统的一个关键任务就是:如何让聊天机器人理解用户的问句意 图、将用户的输入正确地分类到相应的领域中。该任务的实现将直接影响特定 领域的人机对话质量。因此,图1中的NLU模块是整个人机交互过程中比较核 心的部分,该模块的主要任务就是把用户输入的自然语言语句映射成为机器可 读的结构化语义表述,这种结构化的语义表述通常包含两部分内容,一部分是 获取用户的意图,另一部分是提取自然语言问句的槽值。自然语言理解是人工 智能的AI-Hard问题,也是当前智能交互的核心难题,因为机器要理解用户的自 然语言问句,要面临语言的多样性、多义性、知识依赖和上下文依赖等诸多挑 战。
发明人在实现本发明的过程中发现,上述现有针对多轮对话的对话意图识 别方案存在实现复杂,效率低以及对用户参与的依赖性强等问题。具体分析如 下:
在现有的对话意图识别方案中,需要预先针对意图不完整问句单独设置一 类(比如select类),然后,将该类语句作为语料,进行多标签分类模型训练, 得到一个多标签分类模型。在人机对话过程中,如果会话过程中存在属于上述 不完整问句所在类的问句,为了明确这些问句具体属于哪个垂直领域,首先, 通过多标签分类模型获得多个标签指示的多个可能的垂直领域,然后,再利用 上下文信息决策当前问句的垂直领域,如果利用上下文还不能够明确问句属于 哪个垂直领域,就需要再与用户进行新一轮的交互,在交互中通过反问用户, 再基于用户的回答进行垂直领域的识别,如果基于该轮回答还不能明确问句属 于哪个垂直领域,将会再触发新一轮的交互。
可见,上述对话意图方案是基于预设的多标签分类模型进行识别的。而利 用多标签分类模型所识别出的是多个可能的垂直领域,并不是一个明确的垂直 领域,之后,还需要从这些多个可能的垂直领域中,确认出不完整自然语言问 句真正所属的垂直领域,此时,需要再利用上下文进行决策,极端情况下还需 要一轮一轮地向用户询问。因此,上述现有的对话意图方案需要结合上下文决 策、与用户交互等手段,实现复杂。另外,与用户之间的交互确认,一方面会 增加处理时延,另一方面,增加了用户的对话轮数,从而降低了用户体验。
发明内容
有鉴于此,本发明的主要目的在于提供一种对话交互意图的识别方法和装 置,该方法易于实现,且可以提高识别效率和用户体验。
为了达到上述目的,本发明提出的技术方案为:
一种对话交互意图的识别方法,包括:
对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直 领域进行识别;
对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语 句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是 上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮 对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直 领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语 句。
较佳地,利用所述多分类模型,对一轮对话语句所属的垂直领域进行识别 包括:
利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失 败,则利用所述多分类模型,识别对话语句所属的垂直领域。
较佳地,所述判断该轮对话语句所属的垂直领域是否是上一轮对话语句所 属的垂直领域包括:
利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语 句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域 对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句 所属的垂直领域。
较佳地,所述多分类模型采用K折交叉验证的方式训练得到。
一种对话交互意图的识别设备,包括:处理器,所述处理器用于:
对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直 领域进行识别;
对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语 句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是 上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮 对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直 领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语 句。
较佳地,所述处理器,具体用于利用所述多分类模型,对一轮对话语句所 属的垂直领域进行识别,包括:
利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失 败,则利用所述多分类模型,识别对话语句所属的垂直领域。
较佳地,所述处理器,具体用于判断该轮对话语句所属的垂直领域是否是 上一轮对话语句所属的垂直领域,包括:
利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语 句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域 对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句 所属的垂直领域。
较佳地,所述多分类模型采用K折交叉验证的方式训练得到。
一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存 储指令,其特征在于,所述指令在由处理器执行时使得所述处理器执行如上文 所述的对话交互意图的识别方法的步骤。
一种电子设备,包括如上文所述的非易失性计算机可读存储介质、以及可 访问所述非易失性计算机可读存储介质的所述处理器。
由上述技术方案可见,本发明提出的一种对话交互意图的识别方法和装 置,引入了预先训练的一个多分类模型以及各垂直领域的二分类模型,并区 分首轮对话语句和非首轮对话语句采用不同的识别方式,对每轮对话语句所 属的垂直领域进行识别。对于首轮对话语句,直接利用多分类模型,识别出 其所属的垂直领域;而对于首轮对话语句之外的其他各轮对话语句,则需要 先采用最近一次识别出的垂直领域的二分类模型,判断该轮对话语句所属的 垂直领域是否就是最近一次识别出的垂直领域,如果不是,再通过多分类模型识别出其所属的垂直领域。由于各垂直领域的二分类模型在训练时所采用 的语料包含了不完整语句,而在实际对话过程中,不完整语句的垂直领域往 往是与上一轮对话语句的垂直领域相同,因此,对于非首轮对话语句,先利 用最近一次识别出的垂直领域的二分类模型,判断该轮对话语句所属的垂直 领域是否就是最近一次识别出的垂直领域,可以对包含不完整语句的对话语 句所属的垂直领域进行准确识别,且不需要与用户之间的反复交互,因此, 可以减少不完整语句对对话语句所属垂直领域的识别效率以及用户体验的影响,并且利用基于各垂直领域的语料训练得到的多分类模型,也可以确保对 对话语句所属垂直领域进行准确判断。由此可见,本申请提出的对话交互意 图的识别方案,有效简化了对话交互意图的识别过程,提高了识别效率和用 户体验。
附图说明
图1为现有的面向任务的对话系统框架示意图;
图2为本发明实施例的方法流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体 实施例对本发明作进一步地详细描述。
图2为本发明实施例的流程示意图,如图2所示,该实施例实现的对话 交互意图的识别方法主要包括:
步骤201、对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所 属的垂直领域进行识别。
本步骤中,对于首轮对话语句(即第一轮对话语句),需要利用多分类模型 对其所属的垂直领域进行识别。这里,由于多分类模型是预先根据预设的多个 垂直领域的语料进行训练得到,而且不同于多标签分类模型,多分类模型输出 结果的标签只有一个,因此,利用多分类模型即可确定出首轮对话语句具体所 属的垂直领域。另外,考虑到只有语意完整语句的语料对应的垂直领域具有唯 一性,在预先对多分类模型训练时,为了确保所训练的多分类模型识别结果的 准确性,需要以语意完整的语句作为语料进行模型训练。
在实际应用中,本领域技术人员可以根据实际需要确定用于训练该多分类 模型的语料所涉及到的垂直领域,例如可以是天气类、音乐类、飞机票类、美 食类等27个垂直领域。
具体地,可以使用卷积神经网络(Convolutional Neural Networks,CNN), 循环神经网络(Recurrent Neural Network,RNN),fastText等模型作为多分类模型 的分类器。
较佳地,为了提高多分类模型输出结果的准确性,所述多分类模型采用K 折交叉验证的方式训练得到。即具体如下:
在对多分类模型进行训练时,第一步使用不重复抽样将原始数据随机分割 成k份,第二步从k份中取出一份数据用于测试模型,将剩下的k-1份数据用于 模型的训练,第三步,利用当前用于训练的k-1份数据进行模型训练,利用当前 用于测试的一份数据,第四步,如果当前k份数据中还存在至少一份数据未被 取出用于模型测试,则取出一份未被取出用于模型测试的数据用于模型训练, 将剩下的k-1份数据用于模型的训练,返回第三步执行。这样,就可以得到k 个模型和相应的评估结果。在使用的过程中,把训练得到的k个模型的预测结 果进行融合作为最终的预测结果,可以大大提高多分类模型预测结果的准确性。
较佳地,为了进一步提高对首轮对话语句所属垂直领域进行识别的准确性 和效率,本步骤中,可以先利用多领域先验知识进行识别,以充分利用先验知 识对自然语言对话意图识别的精准优势,只有当基于先验知识识别失败时,再 利用所述多分类模型,对对话语句所属的垂直领域进行识别,具体如下:
利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失 败,则利用所述多分类模型,识别对话语句所属的垂直领域。
所述多领域先验知识具体包括预设的多个垂直领域的关键词词典和句子词 典。其中所涉及的垂直领域可根据实际需要确定,例如,可以涉及天气类、音 乐类、飞机票类和美食类等27个垂直领域。所述关键词词典和句子词典,具体 可由本领域技术人员预先设置。
步骤202、对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一 轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领 域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型, 对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相 应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不 完整语句。
本步骤,用于对首轮对话语句之后的对话语句所属的垂直领域进行识别。 这里,引入了各垂直领域对应的二分类模型。用于训练某个垂直领域的二分类 模型的数据包括两类,一类是该垂直领域的语料,另一类是非该垂直领域的语 料。具体地训练时,可以使用CNN、fastText作为分类器。
考虑到此前已为其上文确定出垂直领域,上下文属于相同垂直领域的可能 性很大,而且,相比于多分类模型,二分类模型的识别效率高一些,因此,这 里为了提高识别效率,优先利用相邻的上一轮对话语句所属的垂直领域的二分 类模型,来识别当前轮的对话语句所属的垂直领域是否为其上一轮对话语句所 属的垂直领域,如果不是,再利用步骤201中的多分类模型对其所属垂直领域 进行识别。另外,由于二分类模型训练时所使用的相应垂直领域的语料和不属 于相应垂直领域的语料中均包括不完整语句(语意关键信息省略的语句),因此, 利用上一轮对话语句所属垂直领域的二分类模型,可以对相同垂直领域的不完 整语句进行准确判断。该效果是多分类模型所无法实现的,因为多分类模型涉及的领域多,会存在同一个不完整语句可以应用于多个领域的情况,此时,将 无法确定其所属的垂直领域。
由此可见,本步骤中综合利用二分类模型和多分类模型,对非首轮对话语 句所属的垂直领域进行识别,可以支持多轮跨垂直领域的语句对话的识别,提 高了识别的效率、准确性和智能化,且避免了对与用户交互的依赖,进而减少 了用户的参与,有效改善了用户体验。
具体地,本步骤中利用多分类模型,对对话语句所属的垂直领域进行识别 的方法同步骤201,在此不再赘述。
较佳地,为了进一步提高本步骤对非首轮对话语句处理的准确性,可以先 利用上一轮对话语句所属垂直领域对应的先验知识,对非首轮对话语句所属垂 直领域进行识别,在识别失败时,再利用上一轮对话语句所属垂直领域对应的 二分类模型进行处理,具体如下:
利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语 句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域 对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句 所属的垂直领域。
这里,上一轮对话语句所属垂直领域对应的先验知识即包括相应垂直领域 的关键词词典和句子词典,具体可由本领域技术人员预先设置。
通过上述技术方案可以看出,本发明可以在多轮对话交互中,对用户的交 互意图(即与用户之间的每轮对话语句的垂直领域)进行准确、快速地智能识 别,且可以获得较好的用户体验。当每轮对话语句的垂直领域准确识别出来后, 则可以执行后续的语句处理操作如容错、补全、槽位抽取等NLP领域的其他工 作内容。
在实际应用中,上述实施例中的二分类模型和多分类模型训练时所使用的 语料可通过分析交互日志数据集得到,但不限于此。可以从交互日志数据集中 选取部分数据集,涉及到订票类、天气类、音乐类、美食类等27个领域。每个 领域的数据标签,以及对应的标签解释、样本举例如下表1所示。
Figure RE-GDA0002783527870000091
Figure RE-GDA0002783527870000101
表1数据类别和样例
对日志数据进行标注,用于支持多分类模型和2分类模型的训练,在标注 的过程中,对于意图不明确的自然语言问句(那后天呢、明天吧、那去韩国等) 需要根据上下文的意图来确定这些不完整语料可能属于的领域来完成标注的任 务。最终会从标注数据中选取意图比较完整的语料用于训练多分类模型。根据 上下文对语料标注的样例如下表2所示。
Figure BDA0002594161370000102
Figure BDA0002594161370000111
表2标注数据样例
与上述方法相对应,本发明还提供了一种对话交互意图的识别设备,包括: 处理器,所述处理器用于:
对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直 领域进行识别;
对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语 句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是 上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮 对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直 领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语 句。
较佳地,所述处理器,具体用于利用所述多分类模型,对一轮对话语句所 属的垂直领域进行识别,包括:
利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失 败,则利用所述多分类模型,识别对话语句所属的垂直领域。
较佳地,所述处理器,具体用于判断该轮对话语句所属的垂直领域是否是 上一轮对话语句所属的垂直领域,包括:
利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语 句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域 对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句 所属的垂直领域。
较佳地,所述多分类模型采用K折交叉验证的方式训练得到。
本发明还提供了一种非易失性计算机可读存储介质,存储用于使一机器 执行如本申请所述的对话交互意图的识别方法的指令。具体地,可以提供配 有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一 实施方式的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或 MPU)读出并执行存储在存储介质中的程序代码。此外,还可以通过基于程 序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操 作。还可以将从存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后 基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分 和全部实际操作,从而实现上述实施方式中任一实施方式的功能。
用于提供程序代码的存储介质实施方式包括软盘、硬盘、磁光盘、光盘 (如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、 DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络 从服务器计算机或云上下载程序代码。
本发明还提供了一种电子设备,包括如上文所述的非易失性计算机可读存 储介质、以及可访问所述非易失性计算机可读存储介质的所述处理器。
在本文中,“示意性”表示“充当实例、例子或说明”,不应将在本文 中被描述为“示意性”的任何图示、实施方式解释为一种更优选的或更具优 点的技术方案。为使图面简洁,各图中的只示意性地表示出了与本发明相关 部分,而并不代表其作为产品的实际结构。另外,以使图面简洁便于理解, 在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或 仅标出了其中的一个。在本文中,“一个”并不表示将本发明相关部分的数量限制为“仅此一个”,并且“一个”不表示排除本发明相关部分的数量“多 于一个”的情形。在本文中,“上”、“下”、“前”、“后”、“左”、 “右”、“内”、“外”等仅用于表示相关部分之间的相对位置关系,而非 限定这些相关部分的绝对位置。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护 范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等, 均应包含在本发明的保护范围之内。

Claims (10)

1.一种对话交互意图的识别方法,其特征在于,包括:
对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;
对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语句。
2.根据权利要求1所述的方法,其特征在于,利用所述多分类模型,对一轮对话语句所属的垂直领域进行识别包括:
利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失败,则利用所述多分类模型,识别对话语句所属的垂直领域。
3.根据权利要求1所述的方法,其特征在于,所述判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域包括:
利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域。
4.根据权利要求1所述的方法,其特征在于,所述多分类模型采用K折交叉验证的方式训练得到。
5.一种对话交互意图的识别设备,其特征在于,包括:处理器,所述处理器用于:
对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;
对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语句。
6.根据权利要求5所述的设备,其特征在于,所述处理器,具体用于利用所述多分类模型,对一轮对话语句所属的垂直领域进行识别,包括:
利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失败,则利用所述多分类模型,识别对话语句所属的垂直领域。
7.根据权利要求5所述的设备,其特征在于,所述处理器,具体用于判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,包括:
利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域。
8.根据权利要求5所述的设备,其特征在于,所述多分类模型采用K折交叉验证的方式训练得到。
9.一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储指令,其特征在于,所述指令在由处理器执行时使得所述处理器执行如权利要求1至4中任一项所述的对话交互意图的识别方法的步骤。
10.一种电子设备,其特征在于,包括如权利要求9所述的非易失性计算机可读存储介质、以及可访问所述非易失性计算机可读存储介质的所述处理器。
CN202010704472.0A 2020-07-21 2020-07-21 对话交互意图的识别方法和装置 Active CN112100368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010704472.0A CN112100368B (zh) 2020-07-21 2020-07-21 对话交互意图的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010704472.0A CN112100368B (zh) 2020-07-21 2020-07-21 对话交互意图的识别方法和装置

Publications (2)

Publication Number Publication Date
CN112100368A true CN112100368A (zh) 2020-12-18
CN112100368B CN112100368B (zh) 2024-01-26

Family

ID=73749480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010704472.0A Active CN112100368B (zh) 2020-07-21 2020-07-21 对话交互意图的识别方法和装置

Country Status (1)

Country Link
CN (1) CN112100368B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220828A (zh) * 2021-04-28 2021-08-06 平安科技(深圳)有限公司 意图识别模型处理方法、装置、计算机设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060070605A (ko) * 2004-12-21 2006-06-26 한국전자통신연구원 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법
CN107766559A (zh) * 2017-11-06 2018-03-06 第四范式(北京)技术有限公司 对话模型的训练方法、训练装置、对话方法及对话系统
CN108108340A (zh) * 2017-11-28 2018-06-01 北京光年无限科技有限公司 用于智能机器人的对话交互方法及系统
CN108388553A (zh) * 2017-12-28 2018-08-10 广州索答信息科技有限公司 对话消除歧义的方法、电子设备及面向厨房的对话系统
CN109165284A (zh) * 2018-08-22 2019-01-08 重庆邮电大学 一种基于大数据的金融领域人机对话意图识别方法
CN109815492A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 一种基于识别模型的意图识别方法、识别设备及介质
CN109918673A (zh) * 2019-03-14 2019-06-21 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN111191030A (zh) * 2019-12-20 2020-05-22 北京淇瑀信息科技有限公司 基于分类的单句意图识别方法、装置和系统
CN111191016A (zh) * 2019-12-27 2020-05-22 车智互联(北京)科技有限公司 一种多轮对话处理方法、装置及计算设备
CN111241255A (zh) * 2019-12-27 2020-06-05 深圳市优必选科技股份有限公司 智能会话管理方法及智能终端、存储介质
CN111414195A (zh) * 2019-02-03 2020-07-14 北京邮电大学 通用可配置、兼容多模型、领域可迁移的多轮对话系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060070605A (ko) * 2004-12-21 2006-06-26 한국전자통신연구원 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법
CN107766559A (zh) * 2017-11-06 2018-03-06 第四范式(北京)技术有限公司 对话模型的训练方法、训练装置、对话方法及对话系统
CN108108340A (zh) * 2017-11-28 2018-06-01 北京光年无限科技有限公司 用于智能机器人的对话交互方法及系统
CN108388553A (zh) * 2017-12-28 2018-08-10 广州索答信息科技有限公司 对话消除歧义的方法、电子设备及面向厨房的对话系统
CN109165284A (zh) * 2018-08-22 2019-01-08 重庆邮电大学 一种基于大数据的金融领域人机对话意图识别方法
CN109815492A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 一种基于识别模型的意图识别方法、识别设备及介质
CN111414195A (zh) * 2019-02-03 2020-07-14 北京邮电大学 通用可配置、兼容多模型、领域可迁移的多轮对话系统
CN109918673A (zh) * 2019-03-14 2019-06-21 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN111191030A (zh) * 2019-12-20 2020-05-22 北京淇瑀信息科技有限公司 基于分类的单句意图识别方法、装置和系统
CN111191016A (zh) * 2019-12-27 2020-05-22 车智互联(北京)科技有限公司 一种多轮对话处理方法、装置及计算设备
CN111241255A (zh) * 2019-12-27 2020-06-05 深圳市优必选科技股份有限公司 智能会话管理方法及智能终端、存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XINYU ZHOU 等: "Short-Spoken Language Intent Classification with Conditional Sequence Generative Adversarial Network", 2019 IEEE 31ST INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE (ICTAI), pages 1753 - 1756 *
付博 等: "社会媒体中用户的隐式消费意图识别", 软件学报, pages 2843 - 2854 *
杨志明 等: "深度学习算法在问句意图分类中的应用研究", 计算机工程与应用, pages 154 - 160 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220828A (zh) * 2021-04-28 2021-08-06 平安科技(深圳)有限公司 意图识别模型处理方法、装置、计算机设备及存储介质
CN113220828B (zh) * 2021-04-28 2023-07-21 平安科技(深圳)有限公司 意图识别模型处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN112100368B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN109918673B (zh) 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN108763510B (zh) 意图识别方法、装置、设备及存储介质
CN108304468B (zh) 一种文本分类方法以及文本分类装置
CN107688803B (zh) 字符识别中识别结果的校验方法和装置
CN108710704B (zh) 对话状态的确定方法、装置、电子设备及存储介质
CN111739520B (zh) 一种语音识别模型训练方法、语音识别方法、装置
CN113326702B (zh) 语义识别方法、装置、电子设备及存储介质
CN115525753A (zh) 面向任务的基于1+n的多轮对话方法及系统
CN111738018A (zh) 一种意图理解方法、装置、设备及存储介质
CN111782793A (zh) 智能客服处理方法和系统及设备
CN113486178A (zh) 文本识别模型训练方法、文本识别方法、装置以及介质
CN113282701A (zh) 作文素材生成方法、装置、电子设备及可读存储介质
CN116127015A (zh) 基于人工智能自适应的nlp大模型分析系统
CN115080750A (zh) 基于融合提示序列的弱监督文本分类方法、系统和装置
CN112036186A (zh) 语料标注方法、装置、计算机存储介质及电子设备
CN114416991A (zh) 一种基于prompt的文本情感原因分析方法和系统
CN112100368B (zh) 对话交互意图的识别方法和装置
CN112528653A (zh) 短文本实体识别方法和系统
CN115577109A (zh) 文本分类方法、装置、电子设备及存储介质
CN114298032A (zh) 文本标点检测方法、计算机设备及存储介质
CN114254622A (zh) 一种意图识别方法和装置
CN114462418A (zh) 事件检测方法、系统、智能终端及计算机可读存储介质
Ribeiro et al. Automatic recognition of the general-purpose communicative functions defined by the ISO 24617-2 standard for dialog act annotation
CN110543560A (zh) 基于卷积神经网络的长文本分类识别方法、装置及介质
CN113722465B (zh) 一种意图识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant