CN115345177A - 意图识别模型训练方法和对话方法及装置 - Google Patents
意图识别模型训练方法和对话方法及装置 Download PDFInfo
- Publication number
- CN115345177A CN115345177A CN202110524066.0A CN202110524066A CN115345177A CN 115345177 A CN115345177 A CN 115345177A CN 202110524066 A CN202110524066 A CN 202110524066A CN 115345177 A CN115345177 A CN 115345177A
- Authority
- CN
- China
- Prior art keywords
- information
- text information
- original
- question
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种意图识别模型训练方法和对话方法及装置,所述意图识别模型训练方法包括:获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练;其中一个上位概念实体信息对应同一类型的不同原始实体信息。从而可以使对话程序能够对没有训练过的实体信息进行意图识别,提高意图识别准确率和与用户交互的鲁棒性。
Description
技术领域
本发明涉及机器学习技术领域,尤指一种意图识别模型训练方法和对话方法及装置。
背景技术
智能语音对话系统是通过语音实时地与人类进行智能对话的系统。智能语音对话系统是语音识别、自然语言理解、对话管理、自然语言生成以及语音合成技术的集大成者,是语音识别技术走向实用阶段的一个重要研究领域。语音交互式的智能对话系统可以让用户通过自然语言直接发问,系统可以返回精确的答案,给用户更加智能的用户体验。
在智能语音对话系统中,目前的技术难点在于如何准确地识别用户提问的信息中所包含的意图信息。传统的意图识别算法直接从提问信息中提取实体信息来确定意图信息。但是若使用智能语音对话系统时,从用户提问信息中提取的实体信息没有在对系统中的模型的训练过程中训练过,将会导致意图识别准确率不高,与用户交互的鲁棒性较差的问题。
发明内容
本发明实施例提供一种意图识别模型训练方法和对话方法及装置,用以解决现有技术中存在的对话系统的模型对没有训练过的实体信息的意图识别准确率不高,与用户交互的鲁棒性较差的问题。
本发明实施例提供了一种意图识别模型训练方法,包括:
获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;
将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练,直至满足训练结束条件时结束训练;
其中一个上位概念实体信息对应同一类型的不同原始实体信息。
可选地,根据所述训练数据中相同意图信息对应的原始提问文本信息,提取出能够表征意图信息的摘要文本信息,作为所述意图信息对应的提问模板;
或者,对表征意图信息的不同自然语言文本信息进行语法分析,去除与意图表征无关的实体信息得到摘要文本信息,对所述摘要文本信息中的词语进行同义词替换,变换所述文本信息的句式,得到所述意图信息对应的提问模板。
可选地,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,包括:
使用人工智能标记语言AIML模板匹配算法,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中的原始实体信息转化为上位概念实体信息,得到转化文本信息。
可选地,将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息,包括:
确定所述原始提问文本信息除目标提问模板外的原始实体信息,解析所述原始实体信息在所述原始提问文本信息中的语句成分;
使用AIML模板匹配算法,从预设的数据库中或互联网中查找所述原始实体信息对应的所述上位概念实体信息;
根据所述语句成分,将所述上位概念实体信息与所述目标提问模板组合,得到转化文本信息,所述语句成分包括主语和/或宾语。
可选地,将所述原始提问文本信息与不同的提问模板进行匹配,包括:
使用模糊匹配算法,将所述原始提问文本信息与不同的提问模板进行匹配。
基于同一发明构思,本发明实施例还提供了一种对话方法,包括:
获取用户的原始提问文本信息;
将所述原始提问文本信息与不同提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
将所述原始提问文本信息除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
将所述转化文本信息输入意图识别模型,得到对应的意图信息;
根据所述意图信息确定最终回答文本信息并输出。
基于同一发明构思,本发明实施例还提供了一种意图识别模型训练装置,包括:
训练数据获取模块,用于获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;
训练数据处理模块,用于将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
训练数据转化模块,用于将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
模型训练模块,用于利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练,直至满足训练结束条件时结束训练;
其中一个上位概念实体信息对应同一类型的不同原始实体信息。
基于同一发明构思,本发明实施例还提供了一种对话装置,包括:
问题获取模块,用于获取用户的原始提问文本信息;
问题处理模块,用于将所述原始提问文本信息与不同提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
问题转化模块,用于将所述原始提问文本信息除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
意图识别模块,用于将所述转化文本信息输入意图识别模型,得到对应的意图信息;
回答模块,用于根据所述意图信息确定最终回答文本信息并输出。
基于同一发明构思,本发明实施例还提供了一种电子设备,包括:处理器和用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现所述的意图识别模型训练方法,或者实现所述的对话方法。
基于同一发明构思,本发明实施例还提供了一种存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被用于实现所述的意图识别模型训练方法,或者实现所述的对话方法。
本发明有益效果如下:
本发明实施例提供的意图识别模型训练方法和对话方法及装置,通过使用上位概念实体信息替换提问信息中的原始实体信息,利用转化文本信息对所述意图识别模型进行训练,从而能够使意图识别模型能够学习到上位概念实体信息与意图信息之间的关联关系,而不局限于有限的下位概念实体信息与意图信息之间的关联关系。在对话过程中,将原始提问信息中的原始实体信息转化为上位概念实体信息,利用所述意图识别模型根据所述上位概念实体信息识别意图信息,可以使对话程序能够对没有在意图识别模型训练过程中训练过的实体信息进行意图识别,从而提高对话系统的意图识别准确率和与用户交互的鲁棒性。
附图说明
图1为本发明实施例中意图识别模型训练方法的流程图;
图2为本发明实施例中对话方法的流程图;
图3为本发明实施例中意图识别模型训练装置的结构示意图;
图4为本发明实施例中对话装置的结构示意图;
图5为本发明实施例中电子设备的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更为明显易懂,下面将结合附图和实施例对本发明做进一步说明。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本发明更全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。本发明中所描述的表达位置与方向的词,均是以附图为例进行的说明,但根据需要也可以做出改变,所做改变均包含在本发明保护范围内。本发明的附图仅用于示意相对位置关系不代表真实比例。
需要说明的是,在以下描述中阐述了具体细节以便于充分理解本发明。但是本发明能够以多种不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广。因此本发明不受下面公开的具体实施方式的限制。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
下面结合附图,对本发明实施例提供的意图识别模型训练方法和对话方法及装置进行具体说明。
本发明实施例提供了一种意图识别模型训练方法,如图1所示,包括:
S101、获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;
S102、将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
S103、将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
S104、利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练,直至满足训练结束条件时结束训练;
其中一个上位概念实体信息对应同一类型的不同原始实体信息。
在具体实施过程中,所述意图识别模型可以为传统机器学习模型、深度学习模型等,在此不作限定。例如,所述意图识别模型可以为快速文本(FastText)模型。
在具体实施过程中,所述实体信息指的是词性为名词,且在语义上具有唯一指代的性质的词语,例如“汽车”、“电脑”等。所述上位概念是表达同一类型的共性概念,与下位概念相对。而下位概念表达的是具体事物的特点,反映个别对象的个性。在本发明中,所述原始实体信息是所述上位概念实体信息的下位概念信息。例如,金属是铁的上位概念,动物是狗的上位概念,家人是爸爸的上位概念。那么,若通过所述步骤S101获取的其中一个原始提问文本信息为“爸爸去哪里了?”,所述步骤S102匹配的所述目标提问模板为“**去哪里了?”,是步骤S103将会把所述原始提问文本信息中的原始实体信息“爸爸”转化为对应的上位概念实体信息“家人”,并与所述目标提问模板组合得到转化文本信息“家人去哪了?”,之后所述步骤S104将会使用所述转化文本信息“家人去哪里了?”和对应的意图信息“找人”对所述意图识别模型进行训练。
这样,通过使用上位概念实体信息替换提问信息中的原始实体信息,利用转化文本信息对所述意图识别模型进行训练,从而能够使意图识别模型能够学习到上位概念实体信息与意图信息之间的关联关系,而不局限于有限的下位概念实体信息与意图信息之间的关联关系。
可选地,所述提问模板可以通过如下任一种方式设置:
方式一、根据所述训练数据中相同意图信息对应的原始提问文本信息,提取出能够表征意图信息的摘要文本信息,作为所述意图信息对应的提问模板。
例如,对于同一个意图信息“找人”对应的多个原始提问文本信息“爸爸去哪了?”、“妈妈在哪?”、“警察叔叔在哪里?”,通过去除其中的原始实体信息“爸爸”、“妈妈”、“警察叔叔”,能够得到表征意图信息的摘要文本信息“**去哪了?”、“**在哪?”、“**在哪里?”,将所述摘要文本信息作为所述意图信息“找人”的提问模板。
方式二、对表征意图信息的不同自然语言文本信息进行语法分析,去除与意图表征无关的实体信息得到摘要文本信息,对所述摘要文本信息中的词语进行同义词替换,变换所述文本信息的句式,得到所述意图信息对应的提问模板。
例如,对于某一个意图信息,首先确定表征该意图信息的自然语言文本信息是“找人”,去除其中与意图表征无关的实体信息“人”得到摘要文本信息“找*”,之后对所述摘要文本信息中的词语进行同义词替换,变换所述文本信息的句式得到多个提问模板“*在哪里?”、“*的位置在哪?”等。
可选地,所述步骤S103中,将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,包括:
使用人工智能标记语言(Artificial Intelligence Markup Language,AIML)模板匹配算法,将所述原始提问文本信息中的原始实体信息转化为上位概念实体信息,得到转化文本信息。
例如,对于原始提问文本信息“爸爸去哪了?”,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息,可以对AIML模板匹配算法设置如下程序:
<aiml>
<category>
<pattern>*去哪了</pattern>
<template>Find_person%家人去哪了</template>
</category>
</aiml>
通过AIML模板匹配算法,可以对原始提问文本信息“爸爸去哪了?”直接匹配出对应的提问模板“*去哪了”,并将其中的原始实体信息“爸爸”转化为“家人”,得到转化文本信息“家人去哪了”。
可选地,将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息,包括:
确定所述原始提问文本信息除目标提问模板外的原始实体信息,解析所述原始实体信息在所述原始提问文本信息中的语句成分;
使用AIML模板匹配算法,从预设的数据库中或互联网中查找所述原始实体信息对应的所述上位概念实体信息;
根据所述语句成分,将所述上位概念实体信息与所述目标提问模板组合,得到转化文本信息,所述语句成分包括主语和/或宾语。
例如,对于原始提问文本信息“爸爸去哪了?”,通过AIML模板匹配算法确定了对应的目标提问模板“**去哪了”,确定需要转化的原始实体信息是所述原始提问文本信息中的主语,将主语“爸爸”利用预设的数据库或通过互联网搜索确定对应的上位概念实体信息为“家人”,将“家人”与“**去哪了”进行组合,得到转化文本信息“家人去哪了”。
可选地,所述步骤S102中,将所述原始提问文本信息与不同的提问模板进行匹配,包括:
使用模糊匹配算法,将所述原始提问文本信息与不同的提问模板进行匹配。
例如,设置的提问模板中包括“**去哪了”、“**在哪呢”,若所述原始提问文本信息为“爸爸在哪里”,通过模糊匹配算法可以将“**在哪呢”匹配为目标提问模板。
在实施过程中,如果使用python语言实现所述意图识别模型的训练方法,那么程序可以为如下所示:
import aiml
Find_person=aiml.Kernel()
Find_person.learn('semantic_cloud/Find_person.aiml')
Find_person.respond(”.join(re_str))
其中,aiml是python自带的AIML模板匹配算法模块,Find_person.aiml表示要学习的模板库文件名,re_str是所述原始提问文本信息,Find_person.respond()可以得到相应的所述转化文本信息。上述可以实现的aiml模板匹配算法自学习,成功匹配以后根据参数调用相应的功能函数并返回所述转化文本信息。
本发明实施例提供的意图识别模型训练方法,可以应用于RASA对话系统中。RASA对话系统是一种开源机器学习框架,用于构建上下文人工智能助手和聊天机器人。RASA对话系统中主要包括自然语言理解(Natural Language Understanding,NLU)模块和对话管理模块两个功能模块。所述NLU模块主要用于根据用户的提问信息确定其中的意图信息intents,所述对话关联模块用于根据确定的意图信息intents确定对应的回答信息并输出给用户。上文所述的意图识别模型是NLU模块中重要组成部分,而所述对话管理模块中可以设置一个对话关联模型来实现根据意图信息intents确定对应的回答信息。那么,在完成对所述意图识别模型的训练后,还可以对所述对话管理模型进行训练。其中作为一种可选的实施方式,结束对所述意图识别模型的训练后,还包括:
获取对话训练数据,所述对话训练数据包括意图信息intents、故事stories和定义域domain;
利用所述意图信息intents、所述故事stories和所述定义域domain对所述对话管理模型进行训练,直至满足训练结束条件时结束训练。
其中,所述故事stories中设置有所述意图信息intents及与所述意图信息intents对应的动作信息actions,而定义域domain中设置有所述动作信息actions对应的回答文本信息。
基于同一发明构思,本发明实施例还提供了一种对话方法,如图2所示,包括:
S201、获取用户的原始提问文本信息;
S202、将所述原始提问文本信息与不同提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
S203、将所述原始提问文本信息除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
S204、将所述转化文本信息输入意图识别模型,得到对应的意图信息;
S205、根据所述意图信息确定最终回答文本信息并输出。
在具体实施过程中,所述意图识别模型可以为上文所述的意图识别模型训练方法训练得到的,也可以为使用现有技术训练得到的,在此不作限定。
在具体实施过程中,所述步骤S202、S203的具体实施方式与所述步骤S102、S103的具体实施方式基本相同,可以参见上文所述内容,此处不再赘述。
这样,通过将原始提问信息中的原始实体信息转化为上位概念实体信息,利用所述意图识别模型根据所述上位概念实体信息识别意图信息,可以使对话程序能够对没有在意图识别模型训练过程中训练过的实体信息进行意图识别(例如,对意图识别模型仅使用包含“爸爸”、“妈妈”、“爷爷”、“奶奶”的实体信息的提问文本信息进行训练,对话系统仍可以正确识别出包含“舅舅”、“表婶”的实体信息的提问文本信息对应的意图信息并正确回答),从而提高对话系统的意图识别准确率和与用户交互的鲁棒性。
可选地,所述步骤S201、获取用户的原始提问文本信息,包括:
获取用户的提问语音信息,将所述提问语音信息转换为原始提问文本信息。
可选地,所述步骤S205、根据所述意图信息确定最终回答文本信息并输出,包括:
根据所述意图信息确定最终回答文本信息,将所述最终回答文本信息转换为回答语音信息并输出。
对于RASA对话系统,可选地,所述步骤S205中,根据所述意图信息确定最终回答文本信息,包括:
将所述意图信息intents输入对话管理模型,从所述故事stories中查询与所述意图信息intents对应的动作信息actions;
根据所述动作信息actions从所述定义域domain对中查询对应的回答文本信息;
根据所述回答文本信息确定对应的所述最终回答文本信息。
例如,对于用户语音输入的“爸爸去哪了?”,首先将语音提问文本信息使用语音识别算法转换为原始提问文本信息,之后匹配出目标提问模板“**去哪了”,将所述原始提问文本信息中的原始实体信息“爸爸”转化为上位概念实体信息“家人”,得到转化文本信息“家人去哪了”,输入所述意图识别模型确定对应的意图信息intents为“find_person”,将其输入所述对话管理模型,从所述故事stories中查询到对应的动作信息actions为“position”,从所述定义域domain中查询到“position”对应的回答文本信息为“**的位置在**。”,根据对应的其它程序确定“爸爸”目前位于“门口”,最终确定所述最终回答文本信息“爸爸的位置在门口。”,将其使用语音合成算法转换为回答语音信息并输出。
基于同一发明构思,本发明实施例还提供了一种意图识别模型训练装置,如图3所示,包括:
训练数据获取模块M101,用于获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;
训练数据处理模块M102,用于将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
训练数据转化模块M103,用于将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
模型训练模块M104,用于利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练,直至满足训练结束条件时结束训练;
其中一个上位概念实体信息对应同一类型的不同原始实体信息。
可选地,根据所述训练数据中相同意图信息对应的原始提问文本信息,提取出能够表征意图信息的摘要文本信息,作为所述意图信息对应的提问模板;
或者,对表征意图信息的不同自然语言文本信息进行语法分析,去除与意图表征无关的实体信息得到摘要文本信息,对所述摘要文本信息中的词语进行同义词替换,变换所述文本信息的句式,得到所述意图信息对应的提问模板。
可选地,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,包括:
使用人工智能标记语言AIML模板匹配算法,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中的原始实体信息转化为上位概念实体信息,得到转化文本信息。
可选地,将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息,包括:
确定所述原始提问文本信息除目标提问模板外的原始实体信息,解析所述原始实体信息在所述原始提问文本信息中的语句成分;
使用AIML模板匹配算法,从预设的数据库中或互联网中查找所述原始实体信息对应的所述上位概念实体信息;
根据所述语句成分,将所述上位概念实体信息与所述目标提问模板组合,得到转化文本信息,所述语句成分包括主语和/或宾语。
可选地,将所述原始提问文本信息与不同的提问模板进行匹配,包括:
使用模糊匹配算法,将所述原始提问文本信息与不同的提问模板进行匹配。
基于同一发明构思,本发明实施例还提供了一种对话装置,如图4所示,包括:
问题获取模块M201,用于获取用户的原始提问文本信息;
问题处理模块M202,用于将所述原始提问文本信息与不同提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
问题转化模块M203,用于将所述原始提问文本信息除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
意图识别模块M204,用于将所述转化文本信息输入意图识别模型,得到对应的意图信息;
回答模块M205,用于根据所述意图信息确定最终回答文本信息并输出。
由于所述意图识别模型训练装置和所述对话装置解决问题的原理与对应的方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
基于同一发明构思,本发明实施例还提供了一种电子设备,如图5所示,包括:处理器110和用于存储所述处理器110可执行指令的存储器120;
其中,所述处理器110被配置为执行所述指令,以实现所述的意图识别模型训练方法,或者实现所述的对话方法。
在具体实施过程中,所述设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器110和存储器120,一个或一个以上存储应用程序131或数据132的存储介质130。其中,存储器120和存储介质130可以是短暂存储或持久存储。存储在存储介质130的应用程序131可以包括一个或一个以上所述单元(图5中未示出),每个模块可以包括对意图识别模型训练装置或对话装置中的一系列指令操作。更进一步地,处理器110可以设置为与存储介质130通信,在所述设备上执行存储介质130中的一系列指令操作。所述设备还可以包括一个或一个以上电源(图5中未示出);一个或一个以上收发器140,所述收发器140包括有线网络接口141和/或无线网络接口142,一个或一个以上输入输出接口143;和/或,一个或一个以上操作系统133,例如Windows、Mac OS、Linux、IOS、Android、Unix、FreeBSD等。
基于同一发明构思,本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被用于实现所述的意图识别模型训练方法,或者实现所述的对话方法。
本发明实施例提供的意图识别模型训练方法和对话方法及装置,通过使用上位概念实体信息替换提问信息中的原始实体信息,利用转化文本信息对所述意图识别模型进行训练,从而能够使意图识别模型能够学习到上位概念实体信息与意图信息之间的关联关系,而不局限于有限的下位概念实体信息与意图信息之间的关联关系。在对话过程中,将原始提问信息中的原始实体信息转化为上位概念实体信息,利用所述意图识别模型根据所述上位概念实体信息识别意图信息,可以使对话程序能够对没有在意图识别模型训练过程中训练过的实体信息进行意图识别,从而提高对话系统的意图识别准确率和与用户交互的鲁棒性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种意图识别模型训练方法,其特征在于,包括:
获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;
将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练,直至满足训练结束条件时结束训练;
其中一个上位概念实体信息对应同一类型的不同原始实体信息。
2.如权利要求1所述的方法,其特征在于,
根据所述训练数据中相同意图信息对应的原始提问文本信息,提取出能够表征意图信息的摘要文本信息,作为所述意图信息对应的提问模板;
或者,对表征意图信息的不同自然语言文本信息进行语法分析,去除与意图表征无关的实体信息得到摘要文本信息,对所述摘要文本信息中的词语进行同义词替换,变换所述文本信息的句式,得到所述意图信息对应的提问模板。
3.如权利要求1所述的方法,其特征在于,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,包括:
使用人工智能标记语言AIML模板匹配算法,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中的原始实体信息转化为上位概念实体信息,得到转化文本信息。
4.如权利要求3所述的方法,其特征在于,将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息,包括:
确定所述原始提问文本信息除目标提问模板外的原始实体信息,解析所述原始实体信息在所述原始提问文本信息中的语句成分;
使用AIML模板匹配算法,从预设的数据库中或互联网中查找所述原始实体信息对应的所述上位概念实体信息;
根据所述语句成分,将所述上位概念实体信息与所述目标提问模板组合,得到转化文本信息,所述语句成分包括主语和/或宾语。
5.如权利要求1所述的方法,其特征在于,将所述原始提问文本信息与不同的提问模板进行匹配,包括:
使用模糊匹配算法,将所述原始提问文本信息与不同的提问模板进行匹配。
6.一种对话方法,其特征在于,包括:
获取用户的原始提问文本信息;
将所述原始提问文本信息与不同提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
将所述原始提问文本信息除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
将所述转化文本信息输入意图识别模型,得到对应的意图信息;
根据所述意图信息确定最终回答文本信息并输出。
7.一种意图识别模型训练装置,其特征在于,包括:
训练数据获取模块,用于获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;
训练数据处理模块,用于将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
训练数据转化模块,用于将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
模型训练模块,用于利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练,直至满足训练结束条件时结束训练;
其中一个上位概念实体信息对应同一类型的不同原始实体信息。
8.一种对话装置,其特征在于,包括:
问题获取模块,用于获取用户的原始提问文本信息;
问题处理模块,用于将所述原始提问文本信息与不同提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;
问题转化模块,用于将所述原始提问文本信息除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;
意图识别模块,用于将所述转化文本信息输入意图识别模型,得到对应的意图信息;
回答模块,用于根据所述意图信息确定最终回答文本信息并输出。
9.一种电子设备,其特征在于,包括:处理器和用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-5任一项所述的意图识别模型训练方法,或者实现如权利要求6所述的对话方法。
10.一种存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被用于实现如权利要求1-5任一项所述的意图识别模型训练方法,或者实现如权利要求6所述的对话方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110524066.0A CN115345177A (zh) | 2021-05-13 | 2021-05-13 | 意图识别模型训练方法和对话方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110524066.0A CN115345177A (zh) | 2021-05-13 | 2021-05-13 | 意图识别模型训练方法和对话方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115345177A true CN115345177A (zh) | 2022-11-15 |
Family
ID=83977612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110524066.0A Pending CN115345177A (zh) | 2021-05-13 | 2021-05-13 | 意图识别模型训练方法和对话方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115345177A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116933800A (zh) * | 2023-09-12 | 2023-10-24 | 深圳须弥云图空间科技有限公司 | 一种基于模版的生成式意图识别方法及装置 |
CN117235237A (zh) * | 2023-11-10 | 2023-12-15 | 腾讯科技(深圳)有限公司 | 一种文本生成方法及相关装置 |
-
2021
- 2021-05-13 CN CN202110524066.0A patent/CN115345177A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116933800A (zh) * | 2023-09-12 | 2023-10-24 | 深圳须弥云图空间科技有限公司 | 一种基于模版的生成式意图识别方法及装置 |
CN116933800B (zh) * | 2023-09-12 | 2024-01-05 | 深圳须弥云图空间科技有限公司 | 一种基于模版的生成式意图识别方法及装置 |
CN117235237A (zh) * | 2023-11-10 | 2023-12-15 | 腾讯科技(深圳)有限公司 | 一种文本生成方法及相关装置 |
CN117235237B (zh) * | 2023-11-10 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 一种文本生成方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107291783B (zh) | 一种语义匹配方法及智能设备 | |
KR102316063B1 (ko) | 오디오 중의 키 프레이즈를 인식하기 위한 방법과 장치, 기기 및 매체 | |
CN111368049A (zh) | 信息获取方法、装置、电子设备及计算机可读存储介质 | |
CN111046656A (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN115345177A (zh) | 意图识别模型训练方法和对话方法及装置 | |
CN106548777B (zh) | 一种用于智能机器人的数据处理方法及装置 | |
CN112667796B (zh) | 一种对话回复方法、装置、电子设备及可读存储介质 | |
CN116523031B (zh) | 语言生成模型的训练方法、语言生成方法及电子设备 | |
CN114238373A (zh) | 一种自然语言问题转换为结构化查询语句的方法及装置 | |
CN115599901A (zh) | 基于语义提示的机器问答方法、装置、设备及存储介质 | |
CN114218375A (zh) | 基于图谱的对话引导方法、装置、设备及介质 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN112989008A (zh) | 一种多轮对话改写方法、装置和电子设备 | |
CN110489744B (zh) | 一种语料的处理方法、装置、电子设备和存储介质 | |
CN114860938A (zh) | 一种语句意图识别方法和电子设备 | |
Saunders et al. | Towards using prosody to scaffold lexical meaning in robots | |
CN112818096A (zh) | 对话生成方法及其装置 | |
CN117391095A (zh) | 一种自然语言解析方法、装置、电子设备及存储介质 | |
CN116881470A (zh) | 一种生成问答对的方法及装置 | |
CN110750632B (zh) | 一种改进的中文alice智能问答方法及系统 | |
CN117009478A (zh) | 一种基于软件知识图谱问答问句解析过程的算法融合方法 | |
CN110188190B (zh) | 对话解析方法、装置、服务器及可读存储介质 | |
CN116821290A (zh) | 面向多任务对话的大语言模型训练方法和交互方法 | |
CN112015921B (zh) | 一种基于学习辅助知识图谱的自然语言处理方法 | |
CN115600595A (zh) | 一种实体关系抽取方法、系统、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |