CN110008319A - 基于对话模板的模型训练方法和装置 - Google Patents

基于对话模板的模型训练方法和装置 Download PDF

Info

Publication number
CN110008319A
CN110008319A CN201910144645.5A CN201910144645A CN110008319A CN 110008319 A CN110008319 A CN 110008319A CN 201910144645 A CN201910144645 A CN 201910144645A CN 110008319 A CN110008319 A CN 110008319A
Authority
CN
China
Prior art keywords
template
dialog
dialog template
word
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910144645.5A
Other languages
English (en)
Other versions
CN110008319B (zh
Inventor
田凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910144645.5A priority Critical patent/CN110008319B/zh
Publication of CN110008319A publication Critical patent/CN110008319A/zh
Application granted granted Critical
Publication of CN110008319B publication Critical patent/CN110008319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种基于对话模板的模型训练方法和装置,包括:根据用户输入的信息设置对话模板,该对话模板中包括对话意图和至少一个模板片段,该至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,词槽和特征词分别对应一个词典,词典中包括多个类型相同的词语。该方法通过一个对话模板就可以识别同一对话意图的多种不同表达方式的语句,用户只需要设置对话模板即可,而现有技术用户需要标注大量的训练样本,从而提高了对话模型的训练效率,降低了训练成本。

Description

基于对话模板的模型训练方法和装置
技术领域
本发明涉及数据挖掘领域,尤其涉及一种基于对话模板的模型训练方法和装置。
背景技术
智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型,这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本。
现有技术中,使用自然语言处理(Natural Language Processing,NLP)技术与机器学习技术对大量的语料进行训练,为了使机器更智能的理解人的目的和实现该目的的关键信息,需要人工标注大量(上万至百万)的语料,标出每一条训练语料中人的目的和关键信息,让机器从这些标注好的训练语料中学习规律,拟合出可以预测相同领域的对话目的和关键信息,从而实现机器对人类语言的理解。
但是,人工标注大量的训练语料,耗费时间长,且效率极低。
发明内容
本发明提供一种基于对话模板的模型训练方法和装置,提高了对话模型的训练效率,降低了训练成本。
本发明第一方面提供一种基于对话模板的模型训练方法,包括:
根据用户输入的信息设置对话模板,所述对话模板中包括对话意图和至少一个模板片段,所述至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,所述词槽和所述特征词分别对应一个词典,所述词典中包括多个类型相同的词语,所述词槽用于描述实现所述对话意图的关键信息,所述特征词用于描述表达所述对话意图的特征,所述固定文本包括识别所述对话意图的表达方式必须包括的词语;
使用所述对话模板训练对话模型;
使用所述对话模型对对话语句进行识别。
可选的,所述对话模板中还包括所述至少一个模板片段的顺序,所述至少一个模板片段的顺序用于指示在语句识别时的匹配顺序。
可选的,所述对话模板中还包括所述至少一个模板片段中每个模板片段的匹配选项,所述匹配选项用于选择对应的模板片段是否为必须匹配。
可选的,所述对话模板中还包括匹配阈值,使用所述对话模型对对话语句进行识别,包括:
将所述对话语句与所述对话模板进行匹配;
计算所述对话语句与所述对话模板的匹配度;
当所述对话语句与所述对话模板的匹配度小于所述匹配阈值时,确定所述对话语句匹配失败;
当所述对话语句与所述对话模板的匹配度大于或等于所述匹配阈值时,确定所述对话语句匹配成功。
可选的,所述对话模板中还包括词槽值的返回选项,所述返回选项用于选择是否返回识别出的语句的所有词槽值;
使用所述对话模型对对话语句进行识别之后,还包括:
输出并保存所述对话语句的所有词槽值,所述所有词槽值包括所述对话模板中不存在的词槽值。
可选的,使用所述对话模板训练对话模型之前,还包括:
接收用户输入的验证指令,根据所述验证指令验证所述对话模板是否有效,并显示验证结果;
所述使用所述对话模板训练对话模型,包括:
当所述对话模板有效时,使用所述对话模板训练对话模型。
本发明第二方面提供一种基于对话模板的模型训练装置,包括:
设置模块,用于根据用户输入的信息设置对话模板,所述对话模板中包括对话意图和至少一个模板片段,所述至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,所述词槽和所述特征词分别对应一个词典,所述词典中包括多个类型相同的词语,所述词槽用于描述实现所述对话意图的关键信息,所述特征词用于描述表达所述对话意图的特征,所述固定文本包括识别所述对话意图的表达方式必须包括的词语;
训练模块,用于使用所述对话模板训练对话模型;
识别模块,用于使用所述对话模型对对话语句进行识别。
可选的,所述对话模板中还包括所述至少一个模板片段的顺序,所述至少一个模板片段的顺序用于指示在语句识别时的匹配顺序。
可选的,所述对话模板中还包括所述至少一个模板片段中每个模板片段的匹配选项,所述匹配选项用于选择对应的模板片段是否为必须匹配。
可选的,所述对话模板中还包括匹配阈值,所述识别模块具体用于:
将所述对话语句与所述对话模板进行匹配;
计算所述对话语句与所述对话模板的匹配度;
当所述对话语句与所述对话模板的匹配度小于所述匹配阈值时,确定所述对话语句匹配失败;
当所述对话语句与所述对话模板的匹配度大于或等于所述匹配阈值时,确定所述对话语句匹配成功。
可选的,所述对话模板中还包括词槽值的返回选项,所述返回选项用于选择是否返回识别出的语句的所有词槽值;
还包括:
输出模块,用于输出所述对话语句的所有词槽值,所述所有词槽值包括所述对话模板中不存在的词槽值;
保存模块,用于保存所述对话语句的所有词槽值。
可选的,还包括:
接收模块,用于接收用户输入的验证指令,根据所述验证指令验证所述对话模板是否有效,并显示验证结果;
所述训练模块具体用于:
当所述对话模板有效时,使用所述对话模板训练对话模型。
本发明第三方面提供一种电子设备,包括处理器、存储器和收发器,所述存储器用于存储指令,所述收发器用于和其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如本发明第一方面以及各可选方式所述的方法。
本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有指令,当所述指令被执行时,使得计算机执行如本发明第一方面以及各可选方式所述的方法。
本发明提供的基于对话模板的模型训练方法和装置,包括:根据用户输入的信息设置对话模板,该对话模板中包括对话意图和至少一个模板片段,该至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,词槽和特征词分别对应一个词典,词典中包括多个类型相同的词语,词槽用于描述实现对话意图的关键信息,特征词用于描述表达对话意图的特征,该固定文本包括识别所述对话意图的表达方式必须包括的词语,使用对话模板训练对话模型,使用该对话模型对对话语句进行识别。该方法通过一个对话模板就可以识别同一对话意图的多种不同表达方式的语句,用户只需要设置对话模板即可,而现有技术用户需要标注大量的训练样本,从而提高了对话模型的训练效率,降低了训练成本。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明实施例一提供的基于对话模板的模型训练方法的流程图;
图2为建立对话模板的页面示意图;
图3为设置对话模板的对话意图的一种示意图;
图4为标注对话模板的模板片段的示意图;
图5为创建对话模板的特征词的一种示意图;
图6为添加特征词的一种示意图;
图7为设置对话模板的匹配选项的示意图;
图8为对话模板的模板片段的顺序的一种示意图;
图9为设置对话模板的匹配阈值和词槽值的返回选项的示意图;
图10为对话模板的有效性验证的示意图;
图11为本发明实施例二提供的基于对话模板的模型训练装置的结构示意图;
图12为本发明实施例三提供的电子设备的结构示意图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的基于对话模板的模型训练方法的流程图,本实施例的方法可以应用在对话系统中,该对话系统应用在电子设备上,该电子设备可以为电脑、手机、智能音箱等能够用于人机对话的设备,如图1所示,本实施例提供的方法包括以下步骤:
步骤S101、根据用户输入的信息设置对话模板,该对话模板中包括对话意图和至少一个模板片段,该至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,该词槽和特征词分别对应一个词典,词典中包括多个类型相同的词语。
该对话意图例如为查询天气、查询日期、查询商品价格等。
该词槽用于描述实现该对话意图的关键信息,例如,当对话意图为查询天气时,词槽可以为时间和地点。不同的对话意图对应不同的词槽,例如,当对话意图为查询日期时,词槽可以为时间。当对话意图为查询商品价格时,词槽可以为商品名称、商品类型以及时间。
该特征词用于描述表达对话意图的特征,特征词属于语句中经常变化但又不属于词槽的部分,特征词用于辅助描述对话意图。例如,当对话意图为查询天气时,特征词可以为“明天北京天气如何”中的“如何”,以及意思和“如何”类似的一些其他词语,例如“怎么样”、“好不好”、“冷不冷”、“热不热”等。
固定文本包括识别该对话意图的表达方式必须包括的词语,一种对话意图可以包括多种表达方式。如果对话模板中包括固定文本,那么后续进行语句识别时,待识别的对话语句中必须包括该固定文本,该待识别的对话语句才能识别成功。例如,当对话意图为查询天气时,该固定文本可以为“天气”,相应的,对话语句中必须包括天气才可能识别成功。
一个模板片段中可能包括一个或者多个词槽,每个词槽对应一个词典,该词典中包括多个类型相同的词语,词槽对应的词典中的词语可以根据需要增加和删除。
例如,当词槽为时间时,时间对应的词典中可以包括以下用于描述时间的词语:明天、今天、后天、昨天、下午、周一、周二、周末、XX日等。当词槽为地点时,地点对应的词典中可以包括以下用于描述地点的词语:XX省、XX市、XX县、XX区、本地、东北、西北、华为、南方、北方等。
一个模板片段中可能包括一个或者多个特征词,每个特征词对应一个词典,该词典中包括多个类型相同的词语,特征词对应的词典中包括的多个词语的用于表达相同的意思。例如,特征词对应的词典中包括以下词语:如何、怎么样、咋样、好不好等,特征词对应的词典中词语可以根据需要增加和删除。
可选的,模板片段中还包括通配符,通配符可以为一个匹配指定长度的任意字符串的表达式,比如[W:0-10]可以匹配0到10个任意字符(一个汉字为两个字符,即可以匹配任意5个汉字)。在一些场景中,有些词可能与对话意图无关,但是这部分词也需要匹配,可以通过通配符实现。
通过上述描述可知,词槽和特征词为对话语句中可以变化的词语,而固定文本为对话语句中必须包含的词语。
可选的,该对话模板包括以下信息中的一个或者多个:该至少一个模板片段的顺序,该至少一个模板片段的顺序用于指示在语句识别时的匹配顺序;该至少一个模板片段中每个模板片段的匹配选项,该匹配选项用于选择对应的模板片段是否必须匹配;词槽值的返回选项,该返回选项用于选择是否返回识别出的语句的所有词槽值;匹配阈值。
人们表达需求的语句中,一些词槽在语句中出现的顺序在有些情况下是可以颠倒顺序的,甚至有些词槽的内容可以出现在一句话的任何位置,因此,本实施例中定义了该至少一个模板片段的顺序。当对话模板中包括多个模板片段时,多个模板片段的顺序可以相同,也可以不同,或者,部分模板片段的顺序相同。
例如,对话模板共有四个模板片段,四个模板片段的顺序可以相同,模板片段的顺序相同可以理解为在匹配时模板片段对应的内容可以出现在语句的任何位置。该四个模板片段的顺序也可以不相同,当四个模板片段的顺序不相同时,在匹配时模板片段对应的内容必须按照该顺序出现先语句中。
对于一个对话模板,有些模板片段是必须匹配的,有些模板片段不是必须匹配的,本实施例中通过模板片段的匹配选项指示模板片段是否为必须匹配的片段。对于必须匹配的模板片段,在使用该对话模板识别语句时,该语句中必须包括该模板片段对应的词语,才能识别出该语句,否则识别失败。对于不是必须匹配的模板片段(也可以称为可选的模板片段),在使用该对话模板识别语句时,该语句中可以不包括该模板片段对应的词语。
在一些对话场景中有的业务系统会需要知道对话语句中所有的词槽信息,这些词槽信息即使没有在对话模板中标注出来,也需要知道,方便在业务系统中使用这些词槽去查询业务系统并给对话的人提供更个性化的服务,此时就需要设置该返回选项的取值为是。
一个对话模板可由多个模板片段组成,它可以来规则的表达人们各种需求语句的句式、特征,当使用对话模板去匹配用户输入的对话语句时,可以计算对话模板与对话语句的匹配度,匹配度越高说明对话语句对应的意图与对话模板标注的对话意图越相近。该匹配度即匹配阈值,该匹配阈值可以调整,匹配阈值设置的越高,识别的对话意图就越准确,相应的,能够识别的语句就会越少。相反匹配阈值设置的越低,能够识别的语句就越多,但准确率就会越低。
需要说明是,该对话模板中包括的模板片段的内容、顺序、匹配选项、对话模板的词槽值的返回选项、对话模板的匹配阈值均可以根据需要进行他调整。
本实施例以设置用于查询天气的对话模板为例,说明设置对话模板的过程。
用户先新建一个对话模板,图2为建立对话模板的页面示意图,如图2所示,在页面上有一个添加对话模板的控件,用户点击该控件后,新添加一个对话模板,该对话模板上包括以下条目:选择意图(即选择对话意图)、模板片段、阈值(即匹配阈值)、解析返回所有词槽、确定和取消提交的按钮。对于模板片段还包括必须匹配的选项以及模板片段的顺序。
以查询天气的对话模板为例,选择意图的下拉菜单中包括多个对话意图,用户从多个对话意图中要创建的对话模板的对话意图。图3为设置对话模板的对话意图的一种示意图,如图3所示,用户选择的对话意图为天气(WEATHER)。
在选择对话意图后,标注模板片段,以对话语句为“明天北京天气如何”为例,将该对话语句拆分成三个模板片段,其中“明天”用词槽“时间(user-time)”代替,作为查询天气的时间,“北京”用词槽“地点(user-loc)”代替,“天气”(固定文本)可以直接作为一个模板片段。图4为标注对话模板的模板片段的示意图,如图4所示,对话模板中共有三个模板片段,分别为:词槽“时间”、词槽“地点”以及固定文本“天气”。
创建特征词并添加到模板片段中,比如“明天北京天气如何”中的“如何”,有的人可能会说“怎么样”、“好不好”、“冷不冷”等等,这时就可以创建一个特征词,把这些不同人的对于了解天气的辅助词定义为特征词。
图5为创建对话模板的特征词的一种示意图,如图5所示,在创建特征词时要先定义特征词的名称,如图中“怎样(kw_how)”为特征词的名称,然后添加对特征词的描述和词典值,特征词的描述用于描述特征词的作用,特征词的词典值中包括特征词的所有可能取值。在创建完特征词后,点击确定按钮进行提交,特征词创建成功。
其中,特征词的名称和特征词的词典值为必填项,特征词的描述为可选项,图中通过“*”表示特征词的名称和词典值为必填项,描述为可填项。
新建特征词时可以把能想到的能表达该对话意图词语都加入到词典值中(如图5所示),后续当想到或听到其他人的更多表达方式时,再将新的词语增加到词典值中。
新建完特征词后需要把特征词插入到一个合适的模板片段中,并插入到合适的位置。图6为添加特征词的一种示意图,如图6所示,将“特征词1”添加到了第三个模板片段中,该特征词1可以为“kw_how”,即将“天气”和特征词1添加到了同一个模板片段,并且特征词“kw_how”位于“天气”之后,以表明该特征词用于描述天气。
对话模板的每个模板片段用于匹配用户表达需求的语句中的一部分,例如“地点”模板片段用于匹配人们问天气语句中的地点信息,而“时间”模板片段用于匹配人们问天气语句中的时间信息。因为人们表达一个需求的时候不一定一次性会把一些关键信息(对应词槽)说全,可以分多次来表达。
比如询问天气,人们可以直接说“天气怎么样”,而先不说时间地点,可以在后续的对话中再说出来。所以可以把时间和地点两个词槽对应的模板片段的“必须匹配”的属性设为“否”。而在一个对话模板中有些片段是能体现用户对话意图的,这个片段应该设为必须匹配,如上图中“天气[怎样]”模板片段的必须匹配的属性设为“是”。
人们表达需求的语句中,一些词槽在语句中出现的顺序在有些情况下是可以颠倒顺序的,甚至有些词槽的内容可以出现在一句话的任何位置。比如“明天北京天气如何”也可以说“北京明天如何”,该语句中时间、地点是不需要设定固定的顺序,因此,在设置对话模板时可以把对应模板片段的顺序设为0。
图7为设置对话模板的匹配选项的示意图,如图7所示,地点对应的模板片段的必须匹配的取值为“否”,时间对应的模板片段的必须匹配的取值为“否”,天气和特征词1对应的模板片段的必须匹配的取值为“是”。
图8为对话模板的模板片段的顺序的一种示意图,如图8所示,三个模板片段的顺序均为0。模板片段的顺序为0时表示对应模板片段的内容在匹配时可以出现对话语句中的任何位置。
如果需要设定几个模板片段的顺序,只需要把顺序值调为1、2、3、4……等,这样就可以通过固定顺序来匹配对话语句。其中,有顺序的多个模板片段中也可以设置两个模板片段的顺序值是一样的,比如共有五个模板片段,顺序依次是1、2、2、3、4,顺序为2的两个模板片段的顺序可以任意调换。
图9为设置对话模板的匹配阈值和词槽值的返回选项的示意图,如图9所示,对话模板的匹配阈值为0.7,匹配阈值可以调整,用户可以通过点击增加按钮和减少按钮(图9中阈值项对应的“+”和“-”)调整匹配阈值。解析返回所有词槽值的返回选项的取值用户选择了“是”。
用户设置完对话模板的所有参数后,点击“确定”按钮提交该对话模板。
可选的,在设置完成之后,接收用户输入的验证指令,根据该验证指令验证对话模板是否有效,并显示验证结果。用户在输入验证指令之前,要先输入验证语句。
图10为对话模板的有效性验证的示意图,如图10所示,用户点击页面上的测试按钮输入验证指令。验证结果中包括验证语句“明天北京天气怎么样”,还包括验证动作、意图以及词槽,通过该验证语句得到的验证动作为天气满足(weather-satisfy),意图为天气(WEATHER),词槽包括:地址-北京,时间-明天。
步骤S102、使用对话模板训练对话模型。
示例性,根据对话模板生成匹配规则,该匹配规则和对话模板组成对话模型。
步骤S103、使用对话模型对对话语句进行识别。
示例性的,将用户输入的对话语句与对话模板进行匹配,计算对话语句与对话模板的匹配度,当对话语句与对话模板的匹配度小于匹配阈值时,确定对话语句匹配失败,当对话语句与对话模板的匹配度大于或等于匹配阈值时,确定对话语句匹配成功。
示例性的,将对话语句与对话模板进行匹配,包括:将对话语句进行分词,判断每个分词是否属于对话模板的片段对应的内容。示例性的,判断对话语句中的每个词是否属于词槽对应的词典,或者,是否属于特征词对应的词典,或者,是否与固定文本相同。还要判断各个分词的顺序是否满足该至少一个模板片段的顺序。
示例性的,计算对话语句与对话模板的匹配度可以为:计算对话语句匹配到的模板片段中词槽、特征词以及口语化词(例如语气助词请、恩、吗等)的总字数个数占对对话语句总字数的比例。例如,对话语句是10个字,被对话模板各模板片段匹配的词槽与特征词及口语化词的总字数为8,则匹配度为8/10=0.8。
如果词槽值的返回选项中选择了返回识别出的语句的所有词槽值,则在使用对话模板对输入的对话语句进行识别之后,输出并保存对话语句的所有词槽值,该所有词槽值包括对话模板中不存在的词槽值。
还可以进一步根据识别到的对话语句进行查询,得到对话语句对应的查询结果,并输出对话语句对应的查询结果。该对话语句可以是用户通过语音或者文字输入的,相应的,可以通过语音或者文字方式输出查询结果。
本实施例中,根据用户输入的信息设置对话模板,该对话模板中包括对话意图和至少一个模板片段,该至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,词槽和特征词分别对应一个词典,词典中包括多个词语,词槽用于描述实现对话意图的关键信息,特征词用于描述表达对话意图的特征,固定文本包括识别对话意图的表达方式必须包括的词语;使用对话模板训练对话模型,使用对话模型对对话语句进行识别。该方法通过一个对话模板就可以识别同一对话意图的多种不同表达方式的语句,用户只需要设置对话模板即可,而现有技术用户需要标注大量的训练样本,从而提高了对话模型的训练效率,降低了训练成本。
本发明的方法还可以对对话模板进行修改,当没有识别到语句或者识别错误的情况下,可以对对话模板进行修改。在对话系统遇到需要升级的情况下只要针对新增的对话意图快速配置相应的对话模板,重新训练对话模型后就可以快速识别新的对话意图,实现对话系统的快速升级、迭代,可以快速响应业务的升级变化。
图11为本发明实施例二提供的基于对话模板的模型训练装置的结构示意图,如图11所示,本实施例提供的装置包括以下模块:
设置模块11,用于根据用户输入的信息设置对话模板,所述对话模板中包括对话意图和至少一个模板片段,所述至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,所述词槽和所述特征词分别对应一个词典,所述词典中包括多个类型相同的词语,所述词槽用于描述实现所述对话意图的关键信息,所述特征词用于描述表达所述对话意图的特征,所述固定文本包括识别所述对话意图的表达方式必须包括的词语;
训练模块12,用于使用所述对话模板对训练对话模型;
识别模块13,用于使用所述对话模型对对话语句进行识别。
可选的,所述对话模板中还包括所述至少一个模板片段的顺序,所述至少一个模板片段的顺序用于指示在语句识别时的匹配顺序。
可选的,所述对话模板中还包括所述至少一个模板片段中每个模板片段的匹配选项,所述匹配选项用于选择对应的模板片段是否为必须匹配。
可选的,所述对话模板中还包括匹配阈值,所述识别模块具体用于:
将所述对话语句与所述对话模板进行匹配;
计算所述对话语句与所述对话模板的匹配度;
当所述对话语句与所述对话模板的匹配度小于所述匹配阈值时,确定所述对话语句匹配失败;
当所述对话语句与所述对话模板的匹配度大于或等于所述匹配阈值时,确定所述对话语句匹配成功。
可选的,所述对话模板中还包括词槽值的返回选项,所述返回选项用于选择是否返回识别出的语句的所有词槽值;
还包括:
输出模块,用于输出所述对话语句的所有词槽值,所述所有词槽值包括所述对话模板中不存在的词槽值;
保存模块,用于保存所述对话语句的所有词槽值。
可选的,还包括:
接收模块,用于接收用户输入的验证指令,根据所述验证指令验证所述对话模板是否有效,并显示验证结果;
所述训练模块具体用于:
当所述对话模板有效时,使用所述对话模板训练对话模型。
本实施例的装置,可用于执行实施例一的方法,具体实现方式和技术效果类似,这里不再赘述。
图12为本发明实施例三提供的电子设备的结构示意图,如图12所示,本实施例提供的电子设备包括处理器21、存储器22和收发器23,存储器22、收发器23通过总线与处理器21连接并通信,所述存储器22用于存储指令,所述收发器23用于和其他设备通信,所述处理器21用于执行所述存储器22中存储的指令,以使所述智能电视执行如实施例一所述的方法,这里不再赘述。
其中,该处理器21可以是微控制单元(Microcontroller Unit,简称MCU),MCU又称单片微型计算机(Single Chip Microcomputer)或者单片机,该处理器21还可以是中央处理器(Central Process Unit,简称CPU)、数字信号处理器(digital signal processor,简称DSP)、专用集成电路(application specific integrated circuit,简称ASIC)、现成可编程门阵列(field programmable gate array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件。
存储器22可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random-Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable read only memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
收发器23可以和其他设备之间建立有线或无线通信链路,使得智能设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,收发器23还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本发明实施例四提供一种计算机可读存储介质,所述计算机可读存储介质存储有指令,当所述指令被执行时,使得计算机执行如实施例一所述方法。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (14)

1.一种基于对话模板的模型训练方法,其特征在于,包括:
根据用户输入的信息设置对话模板,所述对话模板中包括对话意图和至少一个模板片段,所述至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,所述词槽和所述特征词分别对应一个词典,所述词典中包括多个类型相同的词语,所述词槽用于描述实现所述对话意图的关键信息,所述特征词用于描述表达所述对话意图的特征,所述固定文本包括识别所述对话意图的表达方式必须包括的词语;
使用所述对话模板训练对话模型;
使用所述对话模型对对话语句进行识别。
2.根据权利要求1所述的方法,其特征在于,所述对话模板中还包括所述至少一个模板片段的顺序,所述至少一个模板片段的顺序用于指示在语句识别时的匹配顺序。
3.根据权利要求2所述的方法,其特征在于,所述对话模板中还包括所述至少一个模板片段中每个模板片段的匹配选项,所述匹配选项用于选择对应的模板片段是否为必须匹配。
4.根据权利要求3所述的方法,其特征在于,所述对话模板中还包括匹配阈值,使用所述对话模型对对话语句进行识别,包括:
将所述对话语句与所述对话模板进行匹配;
计算所述对话语句与所述对话模板的匹配度;
当所述对话语句与所述对话模板的匹配度小于所述匹配阈值时,确定所述对话语句匹配失败;
当所述对话语句与所述对话模板的匹配度大于或等于所述匹配阈值时,确定所述对话语句匹配成功。
5.根据权利要求4所述的方法,其特征在于,所述对话模板中还包括词槽值的返回选项,所述返回选项用于选择是否返回识别出的语句的所有词槽值;
使用所述对话模型对对话语句进行识别之后,还包括:
输出并保存所述对话语句的所有词槽值,所述所有词槽值包括所述对话模板中不存在的词槽值。
6.根据权利要求1-5任一项所述的方法,其特征在于,使用所述对话模板训练对话模型之前,还包括:
接收用户输入的验证指令,根据所述验证指令验证所述对话模板是否有效,并显示验证结果;
所述使用所述对话模板训练对话模型,包括:
当所述对话模板有效时,使用所述对话模板训练对话模型。
7.一种基于对话模板的模型训练装置,其特征在于,包括:
设置模块,用于根据用户输入的信息设置对话模板,所述对话模板中包括对话意图和至少一个模板片段,所述至少一个模板片段包括以下内容中的一个或者多个:词槽、特征词和固定文本,所述词槽和所述特征词分别对应一个词典,所述词典中包括多个类型相同的词语,所述词槽用于描述实现所述对话意图的关键信息,所述特征词用于描述表达所述对话意图的特征,所述固定文本包括识别所述对话意图的表达方式必须包括的词语;
训练模块,用于使用所述对话模板训练对话模型;
识别模块,用于使用所述对话模型对对话语句进行识别。
8.根据权利要求7所述的装置,其特征在于,所述对话模板中还包括所述至少一个模板片段的顺序,所述至少一个模板片段的顺序用于指示在语句识别时的匹配顺序。
9.根据权利要求8所述的装置,其特征在于,所述对话模板中还包括所述至少一个模板片段中每个模板片段的匹配选项,所述匹配选项用于选择对应的模板片段是否为必须匹配。
10.根据权利要求9所述的装置,其特征在于,所述对话模板中还包括匹配阈值,所述识别模块具体用于:
将所述对话语句与所述对话模板进行匹配;
计算所述对话语句与所述对话模板的匹配度;
当所述对话语句与所述对话模板的匹配度小于所述匹配阈值时,确定所述对话语句匹配失败;
当所述对话语句与所述对话模板的匹配度大于或等于所述匹配阈值时,确定所述对话语句匹配成功。
11.根据权利要求10所述的装置,其特征在于,所述对话模板中还包括词槽值的返回选项,所述返回选项用于选择是否返回识别出的语句的所有词槽值;
还包括:
输出模块,用于输出所述对话语句的所有词槽值,所述所有词槽值包括所述对话模板中不存在的词槽值;
保存模块,用于保存所述对话语句的所有词槽值。
12.根据权利要求7-11任一项所述的装置,其特征在于,还包括:
接收模块,用于接收用户输入的验证指令,根据所述验证指令验证所述对话模板是否有效,并显示验证结果;
所述训练模块具体用于:
当所述对话模板有效时,使用所述对话模板训练对话模型。
13.一种电子设备,其特征在于,包括处理器、存储器和收发器,所述存储器用于存储指令,所述收发器用于和其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如权利要求1-6任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,使得计算机执行如权利要求1-6任一项所述的方法。
CN201910144645.5A 2019-02-27 2019-02-27 基于对话模板的模型训练方法和装置 Active CN110008319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910144645.5A CN110008319B (zh) 2019-02-27 2019-02-27 基于对话模板的模型训练方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910144645.5A CN110008319B (zh) 2019-02-27 2019-02-27 基于对话模板的模型训练方法和装置

Publications (2)

Publication Number Publication Date
CN110008319A true CN110008319A (zh) 2019-07-12
CN110008319B CN110008319B (zh) 2021-06-29

Family

ID=67166068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910144645.5A Active CN110008319B (zh) 2019-02-27 2019-02-27 基于对话模板的模型训练方法和装置

Country Status (1)

Country Link
CN (1) CN110008319B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532361A (zh) * 2019-08-09 2019-12-03 深圳追一科技有限公司 用户意图的识别方法、装置、计算机设备和存储介质
CN110704592A (zh) * 2019-09-27 2020-01-17 北京百度网讯科技有限公司 语句分析处理方法、装置、计算机设备和存储介质
CN110866100A (zh) * 2019-11-07 2020-03-06 北京声智科技有限公司 一种话术泛化方法、装置及电子设备
CN111241255A (zh) * 2019-12-27 2020-06-05 深圳市优必选科技股份有限公司 智能会话管理方法及智能终端、存储介质
CN111597808A (zh) * 2020-04-24 2020-08-28 北京百度网讯科技有限公司 仪表盘绘制处理方法、装置、电子设备和存储介质
CN112256851A (zh) * 2020-10-23 2021-01-22 大连东软教育科技集团有限公司 一种教育机器人对话数据集的生成方法、装置及存储介质
CN112799658A (zh) * 2021-04-12 2021-05-14 北京百度网讯科技有限公司 模型训练方法、模型训练平台、电子设备和存储介质
CN113590750A (zh) * 2021-07-30 2021-11-02 北京小米移动软件有限公司 人机对话方法、装置、电子设备及存储介质
CN113935306A (zh) * 2021-09-14 2022-01-14 有米科技股份有限公司 广告文案模板处理方法及装置
CN115965018A (zh) * 2023-01-04 2023-04-14 北京百度网讯科技有限公司 信息生成模型的训练方法、信息生成方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528531A (zh) * 2016-10-31 2017-03-22 北京百度网讯科技有限公司 基于人工智能的意图分析方法及装置
CN107045496A (zh) * 2017-04-19 2017-08-15 畅捷通信息技术股份有限公司 语音识别后文本的纠错方法及纠错装置
CN107301227A (zh) * 2017-06-21 2017-10-27 北京百度网讯科技有限公司 基于人工智能的搜索信息解析方法及装置
CN108874917A (zh) * 2018-05-30 2018-11-23 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质
CN108984679A (zh) * 2018-06-29 2018-12-11 北京百度网讯科技有限公司 对话生成模型的训练方法和装置
CN109063221A (zh) * 2018-11-02 2018-12-21 北京百度网讯科技有限公司 基于混合策略的查询意图识别方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528531A (zh) * 2016-10-31 2017-03-22 北京百度网讯科技有限公司 基于人工智能的意图分析方法及装置
CN107045496A (zh) * 2017-04-19 2017-08-15 畅捷通信息技术股份有限公司 语音识别后文本的纠错方法及纠错装置
CN107301227A (zh) * 2017-06-21 2017-10-27 北京百度网讯科技有限公司 基于人工智能的搜索信息解析方法及装置
CN108874917A (zh) * 2018-05-30 2018-11-23 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质
CN108984679A (zh) * 2018-06-29 2018-12-11 北京百度网讯科技有限公司 对话生成模型的训练方法和装置
CN109063221A (zh) * 2018-11-02 2018-12-21 北京百度网讯科技有限公司 基于混合策略的查询意图识别方法和装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532361A (zh) * 2019-08-09 2019-12-03 深圳追一科技有限公司 用户意图的识别方法、装置、计算机设备和存储介质
CN110704592A (zh) * 2019-09-27 2020-01-17 北京百度网讯科技有限公司 语句分析处理方法、装置、计算机设备和存储介质
CN110704592B (zh) * 2019-09-27 2021-06-04 北京百度网讯科技有限公司 语句分析处理方法、装置、计算机设备和存储介质
CN110866100B (zh) * 2019-11-07 2022-08-23 北京声智科技有限公司 一种话术泛化方法、装置及电子设备
CN110866100A (zh) * 2019-11-07 2020-03-06 北京声智科技有限公司 一种话术泛化方法、装置及电子设备
CN111241255A (zh) * 2019-12-27 2020-06-05 深圳市优必选科技股份有限公司 智能会话管理方法及智能终端、存储介质
CN111597808A (zh) * 2020-04-24 2020-08-28 北京百度网讯科技有限公司 仪表盘绘制处理方法、装置、电子设备和存储介质
CN112256851A (zh) * 2020-10-23 2021-01-22 大连东软教育科技集团有限公司 一种教育机器人对话数据集的生成方法、装置及存储介质
CN112799658A (zh) * 2021-04-12 2021-05-14 北京百度网讯科技有限公司 模型训练方法、模型训练平台、电子设备和存储介质
CN113590750A (zh) * 2021-07-30 2021-11-02 北京小米移动软件有限公司 人机对话方法、装置、电子设备及存储介质
CN113935306A (zh) * 2021-09-14 2022-01-14 有米科技股份有限公司 广告文案模板处理方法及装置
CN115965018A (zh) * 2023-01-04 2023-04-14 北京百度网讯科技有限公司 信息生成模型的训练方法、信息生成方法和装置
CN115965018B (zh) * 2023-01-04 2024-04-26 北京百度网讯科技有限公司 信息生成模型的训练方法、信息生成方法和装置

Also Published As

Publication number Publication date
CN110008319B (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
CN110008319A (zh) 基于对话模板的模型训练方法和装置
CN106649825B (zh) 语音交互系统及其创建方法和装置
CN112100349B (zh) 一种多轮对话方法、装置、电子设备及存储介质
TWI746690B (zh) 自然語言問句答案的產生方法、裝置及伺服器
CN111708869B (zh) 人机对话的处理方法及装置
CN106776936B (zh) 智能交互方法和系统
WO2021003819A1 (zh) 基于知识图谱的人机对话方法及人机对话装置
CN111191016A (zh) 一种多轮对话处理方法、装置及计算设备
WO2020073530A1 (zh) 客服机器人会话文本分类方法及装置、电子设备、计算机可读存储介质
CN111212190B (zh) 一种基于话术策略管理的对话管理方法、装置和系统
CN111090728A (zh) 一种对话状态跟踪方法、装置及计算设备
CN109885810A (zh) 基于语义解析的人机问答方法、装置、设备和存储介质
CN111261151B (zh) 一种语音处理方法、装置、电子设备及存储介质
CN109616096A (zh) 多语种语音解码图的构建方法、装置、服务器和介质
WO2020073532A1 (zh) 客服机器人对话状态识别方法及装置、电子设备、计算机可读存储介质
CN112579733B (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN109840276A (zh) 基于文本意图识别的智能对话方法、装置和存储介质
CN109670166A (zh) 基于语音识别的催收辅助方法、装置、设备和存储介质
CN111737990B (zh) 一种词槽填充方法、装置、设备及存储介质
CN108304424A (zh) 文本关键词提取方法及文本关键词提取装置
CN109637529A (zh) 基于语音的功能定位方法、装置、计算机设备及存储介质
CN110797012A (zh) 一种信息提取方法、设备及存储介质
CN111399629A (zh) 一种终端设备的操作引导方法、终端设备及存储介质
CN114860938A (zh) 一种语句意图识别方法和电子设备
CN112818096A (zh) 对话生成方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant