CN111414195B - 通用可配置、兼容多模型、领域可迁移的多轮对话系统 - Google Patents

通用可配置、兼容多模型、领域可迁移的多轮对话系统 Download PDF

Info

Publication number
CN111414195B
CN111414195B CN201910108762.6A CN201910108762A CN111414195B CN 111414195 B CN111414195 B CN 111414195B CN 201910108762 A CN201910108762 A CN 201910108762A CN 111414195 B CN111414195 B CN 111414195B
Authority
CN
China
Prior art keywords
model
dialogue
module
user
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910108762.6A
Other languages
English (en)
Other versions
CN111414195A (zh
Inventor
鄂海红
宋美娜
陈忠富
牛佩晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201910108762.6A priority Critical patent/CN111414195B/zh
Publication of CN111414195A publication Critical patent/CN111414195A/zh
Application granted granted Critical
Publication of CN111414195B publication Critical patent/CN111414195B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/76Adapting program code to run in a different environment; Porting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种通用可配置、兼容多模型、领域可迁移的多轮对话系统,包括:可配置模块用于根据当前所在领域的专业知识进行自定义的配置;对话理解模块用于通过对话理解对用户语句进行语义编码,并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取;对话状态跟踪模块用于获取当前多轮历史的对话状态信息;策略学习模块,用于通过对话策略模型进行动作决策;对话生成模块用于根据相应的动作进行对话生成;在线训练模块用于作为用户模拟器提供给开发人员,并进行模型的在线迭代更新和生成可用的数据。该系统整体架构模块通用,适应不同应用场景,各字段参数通用可配置,可随意接受语料,对话理解、对话策略模型可灵活扩展更换。

Description

通用可配置、兼容多模型、领域可迁移的多轮对话系统
技术领域
本发明涉及信息技术及数据业务技术领域,特别涉及一种通用可配置、兼容多模型、领域可迁移的多轮对话系统。
背景技术
目前任务导向多轮对话系统以流水线架构为主,其目的一般是针对特定领域的任务完成一系列内部模块的设计,由于其目的相关性,大量内部规则与特定适用与其关联,导致其系统单一性,无法在多领域内适用,固定的业务规则与系统混杂,指定字段不可更改,且内部模型唯一,无法更新,各模块之间协调脆弱,更改内部模型结构需要大量的人工成本,其系统的字段固定化、应用单一性、模型固化制约了其在不同领域的应用与发展。通用性、多兼容性、可迁移性仍是制约任务导向多轮对话系统发展的重大难题。
现有的任务导向多轮对话系统多是面向特定领域内容,完成相应的任务,通过对特定领域用户的语句进行意图理解,结合相应信息为用户选定动作和回复。比如,一种面向出行领域的人机多轮对话方法,该方法对用户短文本语句进行理解,采用相应的模型,提取出意图信息和槽位信息,将历史的槽位信息和当前问句的槽位信息作为输入,确定当前的对话状态信息,并结合当前问句的意图信息确定下一步的回复策略;根据确定的回复策略选择对应的模板回复给用户,达到在多轮对话中感知用户目的并回复的功能。另外,一个结合闲聊与多轮对话的框架,接收用户的输入信息;确定所述输入信息的状态;根据所述状态生成一个或多个动作概念,其中,所述一个或多个动作概念分别包括生成一句话或调用一个应用程序接口;以及执行所述一个或多个动作概念。其本质在于对对话理解中感知用户的多个意图并向用户提供多个服务,这种方式提供一种泛任务式的对话理解。
发明内容
本申请是基于发明人对以下问题的认识和发现作出的:
上述技术仅考虑到了特定领域的应用场景,系统所有的模块围绕着固定的领域展开,无法适用于其它领域,改变系统领域需要重新定义整个系统。且其模型固定化,无法对现有模型进行不断的迭代更新,导致模型效果无法提升,改变需要变换大量逻辑,且字段需要重新定义,消耗了大量的人工成本。而在任务导向多轮对话系统的应用场景中,为了让系统可以适用于多个领域,节约成本并提高系统重用率,需要使系统具有良好的通用性、兼容性和可迁移性,即使系统可以灵活配置相应参数字段、兼容不同模型并可以迁移到不同领域中使用。
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的目的在于提出一种通用可配置、兼容多模型、领域可迁移的多轮对话系统,系统整体架构模块通用,适应不同应用场景,各字段参数通用可配置,可随意接受语料,对话理解、对话策略模型可灵活扩展更换,系统可迁移到多个领域,扩展应用领域。
为达到上述目的,本发明实施例提出了一种通用可配置、兼容多模型、领域可迁移的多轮对话系统,包括:可配置模块,用于根据当前所在领域的专业知识进行自定义的配置,以配置完成后得到训练好的模型;对话理解模块,用于通过对话理解对用户语句进行语义编码,并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取;对话状态跟踪模块,用于获取当前多轮历史的对话状态信息;策略学习模块,用于通过对话策略模型进行动作决策,其中,所述对话策略模型包括可兼容更换的模型和存储记忆模块,并对所述可兼容更换的模型和所述存储记忆模块进行置信度比较,以选取最佳的策略动作;对话生成模块,用于根据相应的动作进行对话生成,其包括自定义的模版回复和需要通过自定义动作业务逻辑和在线知识库API交互的回复,以完成一轮对话,直至用户在多轮对话中完成最终目的需求;在线训练模块,用于作为用户模拟器提供给开发人员,并进行模型的在线迭代更新和生成可用的数据。
本发明实施例的通用可配置、兼容多模型、领域可迁移的多轮对话系统,采用流水线任务型多轮对话系统方式,实现了可以自定义配置,定义自己领域所需要的字段信息,可以随意接受预料;对话理解模型和对话策略模型可以兼容多种模型,支持模型扩展更新;可以在多个领域中迁移,不仅限于单一领域;从通用型、可迁移性、兼容性角度出发,形成了自定义任务导向多轮对话系统;从而系统整体架构模块通用,适应不同应用场景,各字段参数通用可配置,可随意接受语料,对话理解、对话策略模型可灵活扩展更换,系统可迁移到多个领域,扩展应用领域。
另外,根据本发明上述实施例的通用可配置、兼容多模型、领域可迁移的多轮对话系统还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述可配置模块包括:领域信息配置子模块:用于配置领域的意图、槽值、实体、动作、回复模版中的一项或多项信息;自定义动作配置子模块,用于配置用户自定义的动作处理逻辑、返回数据、槽改变信息中的一项或多项信息;语料子模块,用于配置对话理解语料和对话管理语料。
进一步地,在本发明的一个实施例中,所述对话理解模块包括:对话语义编码子模块,用于对用户语句进行语义编码;意图识别子模块,用于对编码信息进行意图分类;槽值提取子模块,用于对编码信息进行命名实体识别。
进一步地,在本发明的一个实施例中,所述对话状态跟踪模块包括:状态信息获取跟踪子模块,用于跟踪当前对话状态信息,以获取所有状态信息。
进一步地,在本发明的一个实施例中,所述策略学习模块包括:可兼容模型子模块,用于通过模型对结合多轮历史状态进行策略动作进行选取;记忆存储子模块,用于为每个状态策略保存唯一id,以key-value存储对话策略选取信息。
进一步地,在本发明的一个实施例中,所述对话生成模块包括:模版回复子模块,用于根据预设的回复模版进行回复;在线知识库API交互子模块,用于通过预设动作业务逻辑和在线知识库进行API交互,以获取相应回复信息生成回复。
进一步地,在本发明的一个实施例中,所述在线训练模块包括:用户机器交互子模块,用于根据用户语句机器与用户进行在线的交互;用户选择子模块,用于每轮次交互中,提供选项让用户进行符合需求的选择;在线模型更新子模块,用于在用户选择完成后,根据选择动态更新对话理解模型或对话管理模型;在线数据存储子模块,用于在对话完成时,若所有对话均可用,则将对话管理数据进行存储,对话理解数据仅用户认为对话理解出错模型更新完成后存储。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的通用可配置、兼容多模型、领域可迁移的多轮对话系统的结构示意图;
图2为根据本发明一个实施例的通用可配置、兼容多模型、领域可迁移的多轮对话系统的结构示意图;
图3为根据本发明一个具体实施例的通用可配置、兼容多模型、领域可迁移的多轮对话系统的结构示意图;
图4为根据本发明实施例的自定义可配置选项示意图;
图5为根据本发明实施例的领域信息配置图;
图6为根据本发明实施例的对话理解语料配置图;
图7为根据本发明实施例的对话管理语料配置图;
图8为根据本发明实施例的自定义动作配置图;
图9为根据本发明实施例的模型可替换图;
图10为根据本发明实施例的可迁移领域图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明实施例提出的通用可配置、兼容多模型、领域可迁移的多轮对话系统。
图1是本发明一个实施例的通用可配置、兼容多模型、领域可迁移的多轮对话系统的结构示意图。
如图1所示,该通用可配置、兼容多模型、领域可迁移的多轮对话系统10包括:可配置模块100、对话理解模块200、对话状态跟踪模块300、策略学习模块400、对话生成模块500和在线训练模块600。
其中,可配置模块100用于根据当前所在领域的专业知识进行自定义的配置,以配置完成后得到训练好的模型。对话理解模块200用于通过对话理解对用户语句进行语义编码,并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取。对话状态跟踪模块300用于获取当前多轮历史的对话状态信息。策略学习模块400用于通过对话策略模型进行动作决策,其中,对话策略模型包括可兼容更换的模型和存储记忆模块,并对可兼容更换的模型和存储记忆模块进行置信度比较,以选取最佳的策略动作。对话生成模块500用于根据相应的动作进行对话生成,其包括自定义的模版回复和需要通过自定义动作业务逻辑和在线知识库API交互的回复,以完成一轮对话,直至用户在多轮对话中完成最终目的需求。在线训练模块600用于作为用户模拟器提供给开发人员,并进行模型的在线迭代更新和生成可用的数据。本发明实施例的系统10整体架构模块通用,适应不同应用场景,各字段参数通用可配置,可随意接受语料,对话理解、对话策略模型可灵活扩展更换,系统可迁移到多个领域,扩展应用领域。
可以理解的是,通用可配置、兼容多模型、领域可迁移的多轮对话系统架构图如图2所示,具体地,这里首先根据自身所在领域的专业知识进行自定义的配置,配置完成后,获得训练好的模型。用户语句通过对话理解进行语义编码,通过可以替换兼容的对话理解模型进行意图识别和槽值对的联合提取,完成后,对话状态跟踪器获取当前多轮历史的对话状态信息,包括意图、动作、槽值等,通过对话策略模型进行动作决策,其中对话策略模型包括可兼容更换的模型和存储记忆模块,两者进行置信度比较选取最佳的策略动作,机器根据相应的动作进行对话生成,包括自定义的模版回复,和需要通过自定义动作业务逻辑和在线知识库API交互的回复,最终完成一轮对话,类似,用户在多轮对话中完成自己的最终目的需求。在线训练模块作为用户模拟器提供给开发人员,进行模型的在线迭代更新和生成可用的数据。
下面将结合图3对通用可配置、兼容多模型、领域可迁移的多轮对话系统10进行进一步详细阐述。
进一步地,在本发明的一个实施例中,可配置模块100包括:领域信息配置子模块、自定义动作配置子模块和语料子模块。
其中,领域信息配置子模块用于配置领域的意图、槽值、实体、动作、回复模版中的一项或多项信息。自定义动作配置子模块用于配置用户自定义的动作处理逻辑、返回数据、槽改变信息中的一项或多项信息。语料子模块用于配置对话理解语料和对话管理语料。
具体而言,如图3所示,可配置模块100为自定义配置模块:通过简单易用的配置操作迁移到所需领域,包括:(1)领域信息配置模块:包括领域的意图、槽值、实体、动作、回复模版等信息;(2)自定义动作配置模块:包括用户自定义的动作处理逻辑(外接API(Application Programming Interface,应用程序编程接口))、返回数据、槽改变信息;(3)语料模块:包括对话理解语料和对话管理语料。
进一步地,在本发明的一个实施例中,对话理解模块200包括:对话语义编码子模块、意图识别子模和槽值提取子模块。
其中,对话语义编码子模块,用于对用户语句进行语义编码;意图识别子模块,用于对编码信息进行意图分类;槽值提取子模块,用于对编码信息进行命名实体识别。
具体而言,如图3所示,对话理解模块200可以为可兼容意图槽值联合提取模块:模型可兼容,可以被扩展和替换,联合意图识别和槽值提取建模,包含三个子模块:(1)对话语义编码模块:对用户语句进行语义编码;(2)意图识别模块:对编码信息进行意图分类;(3)槽值提取模块:对编码信息进行命名实体识别。
进一步地,在本发明的一个实施例中,对话状态跟踪模块300包括:状态信息获取跟踪子模块。其中,状态信息获取跟踪子模块,用于跟踪当前对话状态信息,以获取所有状态信息。
具体而言,如图3所示,状态信息获取跟踪模块:跟踪当前对话状态信息,包括意图、槽值、实体、历史、领域等信息,能通过该模块获取所有状态信息
进一步地,在本发明的一个实施例中,策略学习模块400包括:可兼容模型子模块和记忆存储子模块。
其中,可兼容模型子模块,用于通过模型对结合多轮历史状态进行策略动作进行选取。记忆存储子模块,用于为每个状态策略保存唯一id,以key-value存储对话策略选取信息。
具体而言,如图3所示,策略模型模块:模型根据对话状态决定当前机器反应动作,在可兼容模型模块和记忆存储模块中做置信度比较选取动作,具体包括:(1)可兼容模型模块:通过模型对结合多轮历史状态进行策略动作选取,模型可扩展更换,包括但不限于卷积神经网络,递归神经网路,深度强化学习等;(2)记忆存储模块:为每个状态策略保存唯一id,以key-value存储对话策略选取信息,保证已有策略稳定精确。
进一步地,在本发明的一个实施例中,对话生成模块500包括:模版回复子模块和在线知识库API交互子。
其中,模版回复子模块,用于根据预设的回复模版进行回复;在线知识库API交互子模块,用于通过预设动作业务逻辑和在线知识库进行API交互,以获取相应回复信息生成回复。
具体而言,如图3所示,模版回复模块:根据用户自定义的回复模版进行回复,可以保证简单回复准确性;在线知识库API交互模块:通过用户自定义动作业务逻辑,和在线知识库进行API交互,获取相应回复信息生成回复。
进一步地,在本发明的一个实施例中,在线训练模块600包括:用户机器交互子模块、用户选择子模块、在线模型更新子模块和在线数据存储子模块。
其中,用户机器交互子模块,用于根据用户语句机器与用户进行在线的交互;用户选择子模块,用于每轮次交互中,提供选项让用户进行符合需求的选择;在线模型更新子模块,用于在用户选择完成后,根据选择动态更新对话理解模型或对话管理模型;在线数据存储子模块,用于在对话完成时,若所有对话均可用,则将对话管理数据进行存储,对话理解数据仅用户认为对话理解出错模型更新完成后存储。
具体而言,如图3所示,用户机器交互模块:根据用户语句机器与用户进行在线的交互。用户选择模块:每轮次交互中,机器提供选项让用户进行符合需求的选择。在线模型更新模块:用户选择完成,根据选择动态更新对话理解模型,或对话管理模型。在线数据存储模块:当对话完成时,若所有对话均可用,则将对话管理数据进行存储,对话理解数据仅用户认为对话理解出错模型更新完成后存储。
除了上述有别于其它系统的设计模块,本部分内容主要阐述本系统在三个方面的特性,通过通用可配置、兼容多模型、领域可迁移三个维度,形成自定义领域任务导向多轮对话系统。下面将进行具体阐述。
1、通用可配置
首先根据业务需求完成相应领域的配置要求,用户需要根据相关领域的专业知识简单完成领域知识的配置。通用自定义配置如下图4所示:
1)图4领域需要自定义配置的可用选项,包括意图、动作、槽值、实体、回复模版这类专业领域知识所需要的信息配置,配置可以通过yaml文件格式,简单易用。其中,领域信息配置图如图5所示,包括:
Figure GDA0003370154780000071
Figure GDA0003370154780000081
2)其次系统能随意接受对话理解训练数据和对话管理训练数据,两种数据格式不随着领域的迁移而改变,具有普适应性,根据相应的语料分别完成对话理解模型的训练和对话管理模型的训练,对话理解的语料可以通过json文件格式配置,对话理解通过称之为story的文件格式进行配置。对话理解语料配置图如图6所示,包括:
Figure GDA0003370154780000082
Figure GDA0003370154780000091
进一步地,对话管理语料配置图如图7所示,包括:
Figure GDA0003370154780000092
Figure GDA0003370154780000101
3)用户可以通过自定义动作文件代码进行本身所需要自定义动作以处理相关的业务逻辑的配置,包括与在线知识库API交互的逻辑,获取当前各种对话状态信息的逻辑,改变槽值的逻辑,生成的回复逻辑等。其中,自定义动作配置图如图8所示,包括:
Figure GDA0003370154780000102
Figure GDA0003370154780000111
领域信息配置、自定义动作配置、语料配置,与系统本身代码逻辑分离,用户只需要对三个方面的配置进行操作,即可随意更换到自己所需要的领域。
2、兼容多模型
该系统能够扩展更换对话理解与对话管理的模型,做到模型的扩展可更换,如图9所示。
对话理解模型包括意图识别模型和槽值提取模型,两者可以联合建模也可以分开建模,对话策略模型包括对话策略通用模型和记忆存储模型,两者在针对同一个对话状态做决定时会进行置信度比较,决定最优策略动作。其中对话理解模型和对话策略模型都可以支持模型的可扩展替换,比如它们都可以被包括但不限于注意力递归网络、双向递归网络、卷积+门递归网络、卷积神经网络、长短期记忆网络、快速分类器、门递归网络等各种模型替换扩展和更新,它们本身也可以进行自身独立的更新,对话理解模型除意图识别和槽值提取模型单独建模之外,也可以通过对两者进行联合的建模更好满足速度和精度的需求,策略模型可以通过强化学习模型进行更新以满足策略动作选取的进一步优化。只需要用户定义好相应的模型类文件,即可随意替换对话理解和对话管理的模型。
对话理解模型和对话管理模型可以通过模型可替换性进行不断更新替换,以满足模型的不断优化、适应于不同的新场景,为整个对话系统在新的环境,新的需求下提供更好的普适应性。
3、领域可迁移
如图10所示,本方案能够方便简易地迁移到其它应用场景,作为通用的任务导向多轮对话系统。只需要用户提供摸个领域的专业知识背景,即用户拥有某个领域的数据库,如机票数据库、火车票数据库、电影数据库、音乐数据库、餐馆数据库等。该系统可以广泛应用于商场、影院、超市、网购平台等垂直领域的应用,能够极大地减少相关行业的人力需求、提升生产效益,符合网购平台、线下服务平台、旅游业等行业的利益需求。
该任务导向多轮对话系统,通过领域信息配置、自定义动作配置、语料配置三方面即可简单易用的转移到任意需要的领域,体现了该系统稳健的领域可迁移性。
综上,本发明实施例具有以下优点:(1)本方案采用流水线式任务导向多轮对话系统方式,实现了完全自定义的多轮对话系统框架。可配置各种字段参数,包括意图、动作、槽值、实体、对话回复模版等信息,可随意接受对话理解语料和对话管理语料训练,实现了通用性;对话理解与对话策略模型不仅限于一种模型,可用其它模型扩展和替换,实现了兼容性;针对不同业务场景,本方案可以无缝迁移到多个领域,实现了可迁移性。从通用性、兼容性、可迁移性三个方面体现了本方案的自定义化可适用能力。(2)本方案实现模块独立,各个模块做到了相对分离,用户在改变其中一个模块时,能做到不影响其它模块的功能。在实现的过程中,采用多种先进方法,改善系统的准确性、稳定性,保证系统在具体应用场景中的稳定可用能力,且使用简单,各模块功能清晰,用户不需要过多复杂的操作即可完成整个多轮对话系统的自定义。体现了本方案的简介易用性。
根据本发明实施例提出的通用可配置、兼容多模型、领域可迁移的多轮对话系统,采用流水线任务型多轮对话系统方式,实现了可以自定义配置,定义自己领域所需要的字段信息,可以随意接受预料;对话理解模型和对话策略模型可以兼容多种模型,支持模型扩展更新;可以在多个领域中迁移,不仅限于单一领域;从通用型、可迁移性、兼容性角度出发,形成了自定义任务导向多轮对话系统;从而系统整体架构模块通用,适应不同应用场景,各字段参数通用可配置,可随意接受语料,对话理解、对话策略模型可灵活扩展更换,系统可迁移到多个领域,扩展应用领域。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (5)

1.一种通用可配置、兼容多模型、领域可迁移的多轮对话系统,其特征在于,包括:
可配置模块,用于根据当前所在领域的专业知识进行自定义的配置,以配置完成后得到训练好的模型;
对话理解模块,用于通过对话理解对用户语句进行语义编码,并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取;
对话状态跟踪模块,用于获取当前多轮历史的对话状态信息;
策略学习模块,用于通过对话策略模型进行动作决策,其中,所述对话策略模型包括可兼容更换的模型和存储记忆模块,并对所述可兼容更换的模型和所述存储记忆模块进行置信度比较,以选取最佳的策略动作,其中,所述策略模型包括:模型根据对话状态决定当前机器反应动作,在可兼容模型模块和记忆存储模块中做置信度比较选取动作,具体包括:所述可兼容模型模块,用于通过模型对结合多轮历史状态进行策略动作选取,模型可扩展更换,包括卷积神经网络或递归神经网路或深度强化学习,所述记忆存储模块,用于为每个状态策略保存唯一id,以key-value存储对话策略选取信息,所述对话理解模型包括意图识别模型和槽值提取模型,所述对话策略模型包括对话策略通用模型和记忆存储模型,两者在针对同一个对话状态做决定时会进行置信度比较,决定最优策略动作,其中对话理解模型和对话策略模型都可以支持模型的可扩展替换,策略模型可以通过强化学习模型进行更新以满足策略动作选取的进一步优化;
对话生成模块,用于根据相应的动作进行对话生成,其包括自定义的模版回复和需要通过自定义动作业务逻辑和在线知识库API交互的回复,以完成一轮对话,直至用户在多轮对话中完成最终目的需求;以及
在线训练模块,用于作为用户模拟器提供给开发人员,并进行模型的在线迭代更新和生成可用的数据,其中,所述在线训练模块包括:用户机器交互子模块,用于根据用户语句机器与用户进行在线的交互;用户选择子模块,用于每轮次交互中,提供选项让用户进行符合需求的选择;在线模型更新子模块,用于在用户选择完成后,根据选择动态更新对话理解模型或对话管理模型;在线数据存储子模块,用于在对话完成时,若所有对话均可用,则将对话管理数据进行存储,对话理解数据仅用户认为对话理解出错模型更新完成后存储。
2.根据权利要求1所述的系统,其特征在于,所述可配置模块包括:
领域信息配置子模块,用于配置领域的意图、槽值、实体、动作、回复模版中的一项或多项信息;
自定义动作配置子模块,用于配置用户自定义的动作处理逻辑、返回数据、槽改变信息中的一项或多项信息;
语料子模块,用于配置对话理解语料和对话管理语料。
3.根据权利要求1所述的系统,其特征在于,所述对话理解模块包括:
对话语义编码子模块,用于对用户语句进行语义编码;
意图识别子模块,用于对编码信息进行意图分类;
槽值提取子模块,用于对编码信息进行命名实体识别。
4.根据权利要求1所述的系统,其特征在于,所述对话状态跟踪模块包括:
状态信息获取跟踪子模块,用于跟踪当前对话状态信息,以获取所有状态信息。
5.根据权利要求1所述的系统,其特征在于,所述对话生成模块包括:
模版回复子模块,用于根据预设的回复模版进行回复;
在线知识库API交互子模块,用于通过预设动作业务逻辑和在线知识库进行API交互,以获取相应回复信息生成回复。
CN201910108762.6A 2019-02-03 2019-02-03 通用可配置、兼容多模型、领域可迁移的多轮对话系统 Active CN111414195B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910108762.6A CN111414195B (zh) 2019-02-03 2019-02-03 通用可配置、兼容多模型、领域可迁移的多轮对话系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910108762.6A CN111414195B (zh) 2019-02-03 2019-02-03 通用可配置、兼容多模型、领域可迁移的多轮对话系统

Publications (2)

Publication Number Publication Date
CN111414195A CN111414195A (zh) 2020-07-14
CN111414195B true CN111414195B (zh) 2022-03-25

Family

ID=71493950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910108762.6A Active CN111414195B (zh) 2019-02-03 2019-02-03 通用可配置、兼容多模型、领域可迁移的多轮对话系统

Country Status (1)

Country Link
CN (1) CN111414195B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100368B (zh) * 2020-07-21 2024-01-26 深思考人工智能科技(上海)有限公司 对话交互意图的识别方法和装置
CN111930912A (zh) * 2020-08-13 2020-11-13 携程计算机技术(上海)有限公司 对话管理方法及系统、设备和存储介质
CN112000787B (zh) * 2020-08-17 2021-05-14 上海小鹏汽车科技有限公司 语音交互方法、服务器和语音交互系统
CN112199486A (zh) * 2020-10-21 2021-01-08 中国电子科技集团公司第十五研究所 一种办公场景的任务型多轮对话方法及系统
CN112364147A (zh) * 2020-12-01 2021-02-12 四川长虹电器股份有限公司 一种基于知识图谱的跨领域多轮对话方法及实现系统
CN112632254B (zh) * 2020-12-28 2024-05-28 平安科技(深圳)有限公司 对话状态确定方法、终端设备及存储介质
CN112800195B (zh) * 2021-01-18 2024-04-16 南京奥拓电子科技有限公司 一种对话机器人的配置方法及系统
CN113821620B (zh) * 2021-09-18 2023-12-12 亿咖通(湖北)技术有限公司 多轮对话任务处理方法、装置及电子设备
CN115017919B (zh) * 2022-08-08 2022-11-11 杭州实在智能科技有限公司 用于支持训练数据快速构建和流程自定义的多场景对话系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017092380A1 (zh) * 2015-12-03 2017-06-08 华为技术有限公司 用于人机对话的方法、神经网络系统和用户设备
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN107369443A (zh) * 2017-06-29 2017-11-21 北京百度网讯科技有限公司 基于人工智能的对话管理方法及装置
CN107750360A (zh) * 2015-06-15 2018-03-02 微软技术许可有限责任公司 通过利用语言理解的上下文语言生成
CN109063035A (zh) * 2018-07-16 2018-12-21 哈尔滨工业大学 一种面向出行领域的人机多轮对话方法
CN109241250A (zh) * 2018-07-25 2019-01-18 南京瓦尔基里网络科技有限公司 一种策略规则对话推进以及意向判别方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107750360A (zh) * 2015-06-15 2018-03-02 微软技术许可有限责任公司 通过利用语言理解的上下文语言生成
WO2017092380A1 (zh) * 2015-12-03 2017-06-08 华为技术有限公司 用于人机对话的方法、神经网络系统和用户设备
CN107369443A (zh) * 2017-06-29 2017-11-21 北京百度网讯科技有限公司 基于人工智能的对话管理方法及装置
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN109063035A (zh) * 2018-07-16 2018-12-21 哈尔滨工业大学 一种面向出行领域的人机多轮对话方法
CN109241250A (zh) * 2018-07-25 2019-01-18 南京瓦尔基里网络科技有限公司 一种策略规则对话推进以及意向判别方法及系统

Also Published As

Publication number Publication date
CN111414195A (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
CN111414195B (zh) 通用可配置、兼容多模型、领域可迁移的多轮对话系统
CN110059170B (zh) 基于用户交互的多轮对话在线训练方法及系统
CN111738016B (zh) 多意图识别方法及相关设备
CN111090728B (zh) 一种对话状态跟踪方法、装置及计算设备
JP2020537777A (ja) 発言のユーザ意図を識別するための方法および装置
EP3709195B1 (en) System and method for interoperable communication between entities with different structures
CN109684456B (zh) 基于物联网能力知识图谱的场景能力智能问答系统
CN110502739B (zh) 结构化输入的机器学习模型的构建
CN115064167B (zh) 语音交互方法、服务器和存储介质
US11521080B2 (en) Declarative rule-based decision support system
CN111222647A (zh) 联邦学习系统优化方法、装置、设备及存储介质
CN110096516B (zh) 自定义的数据库交互的对话生成方法及系统
US11537448B1 (en) Adapting application programming interfaces with schema mappings
CN105354180A (zh) 一种实现开放式语义交互服务的方法及系统
CN112199477A (zh) 对话管理方案和对话管理语料的构建方法
CN112364147A (zh) 一种基于知识图谱的跨领域多轮对话方法及实现系统
CN116644168A (zh) 一种交互数据构建方法、装置、设备及存储介质
Malode Benchmarking public large language model
CN116433799B (zh) 一种基于语义相似度和子图匹配的流程图生成方法和装置
CN111414460A (zh) 通用结合记忆存储和神经网络的多轮对话管理方法及装置
CN112579733A (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN113689851B (zh) 调度专业语言理解系统及方法
CN112990292B (zh) 基于神经网络的对话状态的生成方法及装置
CN112905765A (zh) 一种信息处理方法及装置
CN113705180A (zh) 一种文档编审方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant