CN113065364A - 意图识别方法、装置、电子设备及存储介质 - Google Patents
意图识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113065364A CN113065364A CN202110337257.6A CN202110337257A CN113065364A CN 113065364 A CN113065364 A CN 113065364A CN 202110337257 A CN202110337257 A CN 202110337257A CN 113065364 A CN113065364 A CN 113065364A
- Authority
- CN
- China
- Prior art keywords
- corpus
- intention
- recognized
- matching
- linguistic data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本申请提供一种意图识别方法、装置、电子设备及存储介质,涉及意图识别技术领域。该方法包括:获取待识别语料;将待识别语料输入意图识别模型,获取输出的意图识别结果,意图识别模型包括匹配子模型和意图多分类子模型,其中,匹配子模型包括多个预匹配语料,用于获取与待识别语料匹配的语料;意图多分类子模型根据多个训练语料训练获取,用于获取待识别语料对应的意图,应用本申请实施例,可以充分利用匹配子模型和意图多分类子模型各自的特点,其中,通过匹配子模型可以有效缩短意图识别模型的响应时间,而在匹配子模型无法匹配成功的情况下,则可以通过意图多分类子模型获取输出待识别语料的意图识别结果,提高效率也提升用户体验。
Description
技术领域
本申请涉及意图识别技术领域,特别涉及一种意图识别方法、装置、电子设备及存储介质。
背景技术
意图识别也即对待识别的文本等进行识别,以识别其表达的语义内容,可以被应用于各种智能机器人中,比如,对话机器人,以判断用户的对话意图。
现有的在进行意图识别时,大多都是依赖于文本分类模型,通过文本分类给出最终的意图识别结果。
但由于文本分类模型在识别时需要进行多次分类,因此,现有的意图识别方法存在响应时间较长的问题。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种意图识别方法、装置、电子设备及存储介质,可以缩短意图识别模型的响应时间。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本发明提供一种意图识别方法,包括:
获取待识别语料;
将所述待识别语料输入意图识别模型,获取输出的意图识别结果,所述意图识别模型包括匹配子模型和意图多分类子模型,其中,所述匹配子模型包括多个预匹配语料,用于获取与所述待识别语料匹配的语料,每个所述预匹配语料标注有意图标签;所述意图多分类子模型根据多个训练语料训练获取,用于获取所述待识别语料对应的意图,每个所述训练语料标注有意图标签。
在可选的实施方式中,所述将所述待识别语料输入意图识别模型,获取输出的意图识别结果,包括:
将所述待识别语料输入所述匹配子模型,获取所述预匹配语料中与所述待识别语料匹配的目标语料;
将所述目标语料对应的意图标签作为所述待识别语料的意图识别结果。
在可选的实施方式中,所述方法还包括:
若所述预匹配语料中不存在与所述待识别语料匹配的语料,将所述待识别语料输入所述意图多分类子模型;
通过所述意图多分类子模型对所述待识别语料进行多分类识别,输出所述待识别语料的意图识别结果。
在可选的实施方式中,所述通过所述意图多分类子模型对所述待识别语料进行多分类识别,输出所述待识别语料的意图识别结果,包括:
通过所述意图多分类子模型对所述待识别语料进行多分类识别,获取所述待识别语料与各意图标签匹配的概率;
根据所述待识别语料与各意图标签匹配的概率,确定所述待识别语料的意图识别结果。
在可选的实施方式中,所述方法还包括:
响应于语料更新请求,分别更新所述预匹配语料和所述训练语料,所述语料更新请求包括:至少一个待更新语料,所述待更新语料包括纯文本语料和/或正则表达式,所述待更新语料标注有意图标签。
在可选的实施方式中,所述响应于语料更新请求,分别更新所述预匹配语料和所述训练语料之前,所述方法还包括:
获取初始待更新语料,所述初始待更新语料为满足预设要求的文本语料;
根据预设扩写规则对所述初始待更新语料进行扩写,获取所述待更新语料。
在可选的实施方式中,所述方法还包括:
根据更新后的多个所述训练语料,训练新的意图多分类子模型,将所述新的意图多分类子模型的模型数据保存至预设位置,并生成模型更新请求;
根据所述模型更新请求,更新所述意图多分类子模型。
在可选的实施方式中,多个所述预匹配语料包括:至少一个纯文本语料和至少一个正则表达式,所述将所述待识别语料输入所述匹配子模型,获取所述预匹配语料中与所述待识别语料匹配的目标语料,包括:
将所述待识别语料输入所述匹配子模型,获取所述待识别语料与每个所述纯文本语料的匹配结果;
若所述待识别语料与每个所述纯文本语料的匹配结果均指示匹配失败,则获取所述待识别语料与每个所述正则表达式的匹配结果。
在可选的实施方式中,所述获取待识别语料,包括:
获取初始语音语料;
采用预设算法将所述初始语音语料转换为文本语料,并将所述文本语料作为所述待识别语料。
第二方面,本发明提供一种意图识别装置,包括:
获取模块,用于获取待识别语料;
输出模块,用于将所述待识别语料输入意图识别模型,获取输出的意图识别结果,所述意图识别模型包括匹配子模型和意图多分类子模型,其中,所述匹配子模型包括多个预匹配语料,用于获取与所述待识别语料匹配的语料,每个所述预匹配语料标注有意图标签;所述意图多分类子模型根据多个训练语料训练获取,用于获取所述待识别语料对应的意图,每个所述训练语料标注有意图标签。
在可选的实施方式中,所述输出模块,具体用于将所述待识别语料输入所述匹配子模型,获取所述预匹配语料中与所述待识别语料匹配的目标语料;
将所述目标语料对应的意图标签作为所述待识别语料的意图识别结果。
在可选的实施方式中,所述输出模块,还用于若所述预匹配语料中不存在与所述待识别语料匹配的语料,将所述待识别语料输入所述意图多分类子模型;
通过所述意图多分类子模型对所述待识别语料进行多分类识别,输出所述待识别语料的意图识别结果。
在可选的实施方式中,所述输出模块,具体用于通过所述意图多分类子模型对所述待识别语料进行多分类识别,获取所述待识别语料与各意图标签匹配的概率;
根据所述待识别语料与各意图标签匹配的概率,确定所述待识别语料的意图识别结果。
在可选的实施方式中,所述意图识别模块,还包括:响应模块,用于响应于语料更新请求,分别更新所述预匹配语料和所述训练语料,所述语料更新请求包括:至少一个待更新语料,所述待更新语料包括纯文本语料和/或正则表达式,所述待更新语料标注有意图标签。
在可选的实施方式中,所述响应模块,还用于获取初始待更新语料,所述初始待更新语料为满足预设要求的文本语料;
根据预设扩写规则对所述初始待更新语料进行扩写,获取所述待更新语料。
在可选的实施方式中,所述意图识别模块,还包括:更新模块,用于根据更新后的多个所述训练语料,训练新的意图多分类子模型,将所述新的意图多分类子模型的模型数据保存至预设位置,并生成模型更新请求;
根据所述模型更新请求,更新所述意图多分类子模型。
在可选的实施方式中,多个所述预匹配语料包括:至少一个纯文本语料和至少一个正则表达式,所述输出模块,具体用于将所述待识别语料输入所述匹配子模型,获取所述待识别语料与每个所述纯文本语料的匹配结果;
若所述待识别语料与每个所述纯文本语料的匹配结果均指示匹配失败,则获取所述待识别语料与每个所述正则表达式的匹配结果。
在可选的实施方式中,所述获取模块,具体用于获取初始语音语料;
采用预设算法将所述初始语音语料转换为文本语料,并将所述文本语料作为所述待识别语料。
第三方面,本发明提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如前述实施方式任一所述意图识别方法的步骤。
第四方面,本发明提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如前述实施方式任一所述意图识别方法的步骤。
本申请的有益效果是:
本申请实施例提供的意图识别方法、装置、电子设备及存储介质中,通过获取待识别语料;将待识别语料输入意图识别模型,获取输出的意图识别结果,意图识别模型包括匹配子模型和意图多分类子模型,其中,匹配子模型包括多个预匹配语料,用于获取与待识别语料匹配的语料,每个预匹配语料标注有意图标签;意图多分类子模型根据多个训练语料训练获取,用于获取待识别语料对应的意图,每个训练语料标注有意图标签,应用本申请实施例,可以充分利用匹配子模型和意图多分类子模型各自的特点,通过匹配子模型可以有效缩短意图识别模型的响应时间,而在匹配子模型无法匹配成功的情况下,则可以通过意图多分类子模型获取输出待识别语料的意图识别结果,提高效率同时也提升用户体验。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种意图识别方法的流程示意图;
图2为本申请实施例提供的另一种意图识别方法的流程示意图;
图3为本申请实施例提供的又一种意图识别方法的流程示意图;
图4为本申请实施例提供的另一种意图识别方法的流程示意图;
图5为本申请实施例提供的又一种意图识别方法的流程示意图;
图6为本申请实施例提供的另一种意图识别方法的流程示意图;
图7为本申请实施例提供的又一种意图识别方法的流程示意图;
图8为本申请实施例提供的一种意图识别装置的功能模块示意图;
图9为本申请实施例提供的另一种意图识别装置的功能模块示意图;
图10为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
意图识别也即对待识别的内容抽取它所表达的意图,意图识别作为对话机器人中的一个基础模块,可以用于判断用户的对话意图,引导后续的处理逻辑。现有意图识别的主流方法是依赖于文本分类模型,但通过文本分类模型进行意图识别时,需要一定程度的计算量,模型耗费在分类上的时间较长,因此,现有的意图识别模型存在响应时间较长的问题,特别是对于一些时间敏感的应用场景,现有的意图识别模型将难以满足应用需求。
此外,现有文本分类模型的训练往往需要一定数目的标注语料,且耗时比较长,文本分类模型存在易用性较差、扩展性较差的问题。比如,对于意图识别业务方来说,一般不希望花太多的时间准备标注语料,因此,想要快速实现意图识别显得比较困难,因此,现有的文本分类模型存在易用性较差的问题;再者,用户的需求是动态变化的,因此,存在业务意图变化比较频繁的情况(比如,意图或意图语料增、删、改等),则每次变动都需要重新训练文本分类模型,而文本分类模型的训练时间视语料规模、模型大小、类别数量等因素的影响,往往比较长,这将导致业务方不能即时验证文本分类模型的效果,因此,现有的文本分类模型存在扩展性较差的问题。
有鉴于此,本申请提供一种意图识别方法,通过该方法可以有效缩短意图识别模型的响应时间,且可以增强意图识别模型的易用性和扩展性。
图1为本申请实施例提供的一种意图识别方法的流程示意图,该方法的执行主体可以是计算机、服务器、处理器、移动终端以及其他一些智能电子设备,该智能电子设备可以包括但不限于:智能手表、智能车载终端、智能机器人、智能音响、智能电视等,其中,本申请在此以移动终端为例进行说明。如图1所示,该意图识别方法可以包括:
S101、获取待识别语料。
可选地,用户可以基于触摸显示屏以文本输入方式生成待识别语料,又或者,可以基于话筒功能以语音输入方式生成待识别语料,所生成的待识别语料可以包括一句话、多句话等,本申请在此并不限定待识别语料的语料长短。在一些实施例中,待识别语料也可以通过文件导入的方式从其他设备导入,或通过网络获取,在此不作限定。
S102、将待识别语料输入意图识别模型,获取输出的意图识别结果,意图识别模型包括匹配子模型和意图多分类子模型。
其中,匹配子模型包括多个预匹配语料,用于获取与待识别语料匹配的语料,每个预匹配语料标注有意图标签;意图多分类子模型根据多个训练语料训练获取,用于获取待识别语料对应的意图,每个训练语料标注有意图标签。可选地,若待识别语料为待识别语音语料时,预匹配语料也可以是预匹配语音语料,训练语料也可以是训练语音语料,在此不作限定。
可选地,上述多个预匹配语料可以与多个训练语料全部相同或部分相同,如此,可以实现标注语料的重复利用,提高意图识别模型的构建效率。在获取到待识别语料后,则可以将其输入意图识别模型中,通过该意图识别模型输出其对应的意图识别结果,也即输出待识别语料所表达的意图。其中,对于对不同的待识别语料,将输出相应的意图识别结果,可选地,以售票场景为例,对于某待识别语料,且对应的意图识别结果可以包括但不限于:查天气、查机票、退机票、订座位等,在此不作限定。
可以理解的是,意图识别模型包括匹配子模型和意图多分类子模型,待识别语料输入意图识别模型后,则可以通过匹配子模型和意图多分类子模型两者的结合,获取输出待识别语料的意图识别结果。
其中,对于意图多分类子模型来说,其根据多个训练语料训练获取,每个训练语料标注有意图标签,可以理解的是,通过意图多分类子模型获取待识别语料对应的意图时,由于需要对待识别语料进行多分类处理,因此耗时较长;对于匹配子模型来说,其包括多个预匹配语料,每个预匹配语料标注有意图标签,则可以通过该匹配子模型获取与待识别语料匹配的语料,进而根据该匹配的语料可以获取输出待识别语料对应的意图识别结果,可以理解的是,在此过程中,由于匹配子模型无需进行多分类,因此,意图识别模型包括匹配子模型时,匹配子模型的匹配过程相较于意图多分类子模型的多分类过程具有耗时短、匹配更准确的特点,将有效缩短意图识别模型的响应时间;而对于匹配子模型无法匹配的待识别语料,则可以通过意图多分类子模型获取输出待识别语料的意图识别结果,因此,应用本申请实施例,可以充分利用匹配子模型和意图多分类子模型各自的特点,有效缩短意图识别模型的响应时间,提高用户体验。
综上,本申请实施例提供的意图识别方法,包括:获取待识别语料;将待识别语料输入意图识别模型,获取输出的意图识别结果,意图识别模型包括匹配子模型和意图多分类子模型,其中,匹配子模型包括多个预匹配语料,用于获取与待识别语料匹配的语料,每个预匹配语料标注有意图标签;意图多分类子模型根据多个训练语料训练获取,用于获取待识别语料对应的意图,每个训练语料标注有意图标签,应用本申请实施例,可以充分利用匹配子模型和意图多分类子模型各自的特点,其中,通过匹配子模型可以有效缩短意图识别模型的响应时间,而在匹配子模型无法匹配成功的情况下,则可以通过意图多分类子模型获取输出待识别语料的意图识别结果,提高效率也提升用户体验。
图2为本申请实施例提供的另一种意图识别方法的流程示意图。可选地,如图2所示,上述将待识别语料输入意图识别模型,获取输出的意图识别结果,可以包括:
S201、将待识别语料输入匹配子模型,获取预匹配语料中与待识别语料匹配的目标语料。
S202、将目标语料对应的意图标签作为待识别语料的意图识别结果。
其中,匹配子模型可以位于意图识别模型的匹配路径前端,意图多分类子模型可以位于意图识别模型的匹配路径后端,具体进行意图识别时,可以将待识别语料输入匹配子模型,匹配子模型包括多个预匹配语料,每个预匹配语料标注有意图标签,则可以获取预匹配语料中与待识别语料匹配的目标语料,可选地,与待识别语料匹配的目标语料可以是与待识别语料完全相同的语料,又或者,可以包括待识别语料的关键语料,在此并不限定匹配方式,在匹配到目标语料后,则可以获取该目标语料对应的意图标签,进而可以将该目标语料对应的意图标签作为待识别语料的意图识别结果。
比如,匹配子模型包括如下多个预匹配语料:“今天的天气”、“今日的天气”“今天天气怎么样”、“今天天气如何”、“明天会下雨不”,且该多个预匹配语料的意图标签均为“询问天气”,则若待识别语料为“今天天气怎么样”,通过匹配可知,预匹配语料中与待识别语料匹配的目标语料为“今天天气怎么样”,则该待识别语料的意图识别结果为“询问天气”,当然,实际应用场景并不以此为限。
应用本申请实施例,匹配子模型的匹配过程相较于意图多分类子模型的多分类过程具有耗时短、匹配更准确的特点,可以有效缩短意图识别模型的响应时间;且在意图识别模型中意图多分类子模型不可用的情况下,通过匹配子模型也可以实现意图识别,方便用户进行逻辑验证,增强了意图识别模型的易用性。
图3为本申请实施例提供的又一种意图识别方法的流程示意图。可选地,如图3所示,上述将待识别语料输入意图识别模型,获取输出的意图识别结果,包括:
S301、若预匹配语料中不存在与待识别语料匹配的语料,将待识别语料输入意图多分类子模型。
S302、通过意图多分类子模型对待识别语料进行多分类识别,输出待识别语料的意图识别结果。
基于上述实施例的基础上,由于待识别语料的多样性,当然也存在预匹配语料中不存在与待识别语料匹配的语料,而将意图多分类子模型可以位于意图识别模型的匹配路径后端,此时,则可以将该待识别语料输入意图多分类子模型中,通过意图多分类子模型对待识别语料进行多分类识别,输出待识别语料的意图识别结果。应用本申请实施例,使得对于任意待识别语料均可输出该待识别语料的意图识别结果,提高意图识别方法的适用性。
可选地,上述意图多分类子模型可以基于多层感知机(multilayer perceptron,MLP)、逻辑回归算法、卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent Neural Network,RNN)、Transformer模型又或者其它模型实现,在此不作限定,根据实际的应用场景,也可以基于多种模型的结合实现。
图4为本申请实施例提供的另一种意图识别方法的流程示意图。可选地,如图4所示,上述通过意图多分类子模型对待识别语料进行多分类识别,输出待识别语料的意图识别结果,包括:
S401、通过意图多分类子模型对待识别语料进行多分类识别,获取待识别语料与各意图标签匹配的概率。
S402、根据待识别语料与各意图标签匹配的概率,确定待识别语料的意图识别结果。
其中,可以通过意图多分类子模型对待识别语料进行多分类识别,获取该待识别语料与各意图标签匹配的概率,该概率可以是0~1之间的任意值,对该待识别语料与各意图标签匹配的概率进行排序,获取概率最高的意图标签作为待识别语料的意图识别结果。
在一些实施例中,通过意图多分类子模型对待识别语料进行多分类识别时,可以基于词频-逆文本频率指数(Term Frequency–Inverse Document Frequency,TF-IDF)技术、Word2vec模型、预训练语言模型等对待识别语料进行编码,比如,可以通过预训练语言模型对待识别语料进行编码,得到固定长度的向量,进而基于固定长度的向量可以进行多分类识别,但实际应用场景并不以此为限。
可选地,上述方法还包括:
响应于语料更新请求,分别更新预匹配语料和训练语料,语料更新请求包括:至少一个待更新语料,待更新语料包括纯文本语料和/或正则表达式,待更新语料标注有意图标签。
其中,语料更新请求用于对上述的预匹配语料和训练语料进行更新,可以是用户输入或指示的,具体在进行更新时,可以是预匹配语料和训练语料内容的增加、删除或修改,又或者,可以是预匹配语料和训练语料所标注的意图标签的增加、删除、修改等,本申请在此并不限定具体的更新内容。
可以理解的是,响应于语料更新请求,更新预匹配语料后,由于匹配子模型无需训练,因此,相较于意图多分类子模型的训练更新过程,应用本申请实施,可以实现匹配子模型的实时更新,使得用户通过匹配子模型几乎能够实时体验语料更新后的意图识别效果,增强意图识别模型的扩展性。
图5为本申请实施例提供的又一种意图识别方法的流程示意图。可选地,响应于语料更新请求,分别更新预匹配语料和训练语料之前,如图5所示,上述方法还包括:
S501、获取初始待更新语料,初始待更新语料为满足预设要求的文本语料。
预设要求可以是预设编辑要求,通过该预设要求可以方便用户基于初始待更新语料扩展出更多的待更新语料。比如,预设要求可以是初始待更新语料中的语料表达应当包括(A1|A2)或[A1|A2],其中,A1和A2为相同意思的不同表述语料(即近义表示),(A1|A2)表示语料A1或A2为必选语料(关键语料),[A1|A2]表示语料A1或A2的语料为可选语料,当然,实际预设要求并不以此为限,根据实际的应用场景可以灵活调整。
在一些实施例中,用户可以基于图形用户界面的预设要求模板快捷编辑生成初始待更新语料,比如,图形用户界面中可以预先包括(A1|A2)或[A1|A2]语料模板,用户在编辑时,可以通过替换方式快捷替换语料模板中的A1或A2,如此,可以提高初始待更新语料的编辑效率。
S502、根据预设扩写规则对初始待更新语料进行扩写,获取待更新语料。
在获取到初始待更新语料后,则可以根据与预设要求对应的预设扩写规则对该初始待更新语料进行扩写,获取待更新语料,如此,即减轻了用户编写待更新语料的负担,也能扩展出较丰富的待更新语料,进而也就可以保证预匹配语料和训练语料的多样性,提高意图识别模型的适用性。
比如,某初始待更新语料为“(今天|今日)的天气[怎么样|如何]”,其对应的意图标签“询问天气”,则经过扩写之后的待更新语料可以包括:“今天的天气”、“今日的天气”、“今天的天气怎么样”、“今天的天气如何”、“今日的天气怎么样”、“今日的天气如何”,这些待更新语料对应的意图标签可以与初始待更新语料对应的意图标签相同,也即均为“询问天气”,应用本申请实施例,可以减轻用户编写待更新语料的负担,实现待更新语料的多样性。
图6为本申请实施例提供的另一种意图识别方法的流程示意图。可选地,如图6所示,上述方法还包括:
S601、根据更新后的多个训练语料,训练新的意图多分类子模型,将新的意图多分类子模型的模型数据保存至预设位置,并生成模型更新请求。
S602、根据模型更新请求,更新意图多分类子模型。
其中,基于上述实施例的基础上,在对训练语料进行更新后,则可以根据该更新后的多个训练语料,训练新的意图多分类子模型,将该新的意图多分类子模型的模型数据保存至预设位置,并触发生成模型更新请求,其中,该模型数据可以包括但不限于:模型标识、模型文件名称、模型训练开始时间、模型训练结束时间、模型中网络结构的多种参数等;模型更新请求可以包括模型标识、预设位置标识,但不以此为限。在生成模型更新请求后,可选地,可以根据该模型更新请求在预设位置获取新的意图多分类子模型的模型数据,根据该新的意图多分类子模型的模型数据对意图识别模型中的意图多分类子模型进行更新。当然,本申请在此并不限定具体的更新方式,可以是对整个意图多分类子模型进行替换更新,又或者,可以是对意图多分类子模型中发生变化的部分参数进行更新,如此可以实现意图多分类子模型的热更新,也即在不重启意图识别模型的情况下可以实现意图多分类子模型的更新。
应该本申请实施例,实现了对匹配子模型和意图多分类子模型的异步更新,其中,通过训练新的意图多分类子模型,实现了对意图识别模型中已有意图多分类子模型的更新,而在训练新的意图多分类子模型、以及更新意图识别模型中已有意图多分类子模型时,还可以通过意图识别模型中优先完成更新的匹配子模型进行意图识别,避免用户需要等待意图多分类子模型训练完成后才能验证意图识别效果,提高用户体验。
图7为本申请实施例提供的又一种意图识别方法的流程示意图。可选地,多个预匹配语料包括:至少一个纯文本语料和至少一个正则表达式,如图7所示,上述将待识别语料输入匹配子模型,获取预匹配语料中与待识别语料匹配的目标语料,可以包括:
S701、将待识别语料输入匹配子模型,获取待识别语料与每个纯文本语料的匹配结果。
S702、若待识别语料与每个纯文本语料的匹配结果均指示匹配失败,则获取待识别语料与每个正则表达式的匹配结果。
其中,纯文本语料也即由纯文本组成的语料,正则表达式也即事先定义好的一些特定字符、通过这些特定字符和预设语料组合,组成一个“规则语料串”,这个“规则语料串”可以用来表达对待识别语料的一种过滤逻辑。比如,询问天气场景下,该预匹配语料的正则表达式可以为“^(今天|今日)的天气(怎么样|如)何?$”,该正则表达式可以用于匹配“今天的天气”、“今日的天气”、“今天的天气怎么样”、“今天的天气如何”、“今日的天气怎么样”、“今日的天气如何”等多种待识别语料,当然正则表示式的设置不以此为限。
可选地,多个预匹配语料包括:至少一个纯文本语料和至少一个正则表达式时,可以将待识别语料输入匹配子模型,获取该待识别语料与每个纯文本语料的匹配结果,也即是否匹配成功,其中,若匹配成功,也即存在与待识别语料匹配的纯文本语料,则可以将该纯文本语料对应的意图标签作为待识别语料的意图识别结果,提高意图识别结果的准确性。
若待识别语料与每个纯文本语料的匹配结果均指示匹配失败,则可以获取该待识别语料与每个正则表达式的匹配结果,若存在与待识别语料匹配的正则表达式,可以将该正则表达式对应的意图标签作为待识别语料的意图识别结果,若不存在与待识别语料匹配的正则表达式,则可以将该待识别语料输入意图多分类子模型,关于该部分内容可参见前述的相关说明,本申请在此不再赘述。
可选地,上述获取待识别语料,可以包括:
获取初始语音语料;采用预设算法将初始语音语料转换为文本语料,并将文本语料作为待识别语料。
其中,用户可以通过话筒功能生成初始语音语料,可选地,待识别语料可以是待识别文本语料,也即上述意图识别模型用于对待识别文本语料进行意图识别,则在获取到该初始语音语料后,可以采用预设算法将该初始语音语料转换为文本语料,如此,可以将该文本语料作为待识别语料输入上述意图识别模型进行意图识别,具体可参见前述的相关说明,本申请在此不再赘述。
可选地,预设算法可以基于隐马尔可夫模型(Hidden Markov Model,HMM)、人工神经网络等实现,本申请在此不作限定,根据实际的应用场景可以灵活选择。
图8为本申请实施例提供的一种意图识别装置的功能模块示意图,该装置基本原理及产生的技术效果与前述对应的方法实施例相同,为简要描述,本实施例中未提及部分,可参考方法实施例中的相应内容。如图8所示,该意图识别装置100包括:
获取模块110,用于获取待识别语料;
输出模块120,用于将待识别语料输入意图识别模型,获取输出的意图识别结果,意图识别模型包括匹配子模型和意图多分类子模型,其中,匹配子模型包括多个预匹配语料,用于获取与待识别语料匹配的语料,每个预匹配语料标注有意图标签;意图多分类子模型根据多个训练语料训练获取,用于获取待识别语料对应的意图,每个训练语料标注有意图标签。
在可选的实施方式中,输出模块120,具体用于将待识别语料输入匹配子模型,获取预匹配语料中与待识别语料匹配的目标语料;将目标语料对应的意图标签作为待识别语料的意图识别结果。
在可选的实施方式中,输出模块120,还用于若预匹配语料中不存在与待识别语料匹配的语料,将待识别语料输入意图多分类子模型;通过意图多分类子模型对待识别语料进行多分类识别,输出待识别语料的意图识别结果。
在可选的实施方式中,输出模块120,具体用于通过意图多分类子模型对待识别语料进行多分类识别,获取待识别语料与各意图标签匹配的概率;根据待识别语料与各意图标签匹配的概率,确定待识别语料的意图识别结果。
图9为本申请实施例提供的另一种意图识别装置的功能模块示意图。在可选的实施方式中,如图9所示,意图识别装置100,还包括:响应模块130,用于响应于语料更新请求,分别更新预匹配语料和训练语料,语料更新请求包括:至少一个待更新语料,待更新语料包括纯文本语料和/或正则表达式,待更新语料标注有意图标签。
在可选的实施方式中,响应模块130,还用于获取初始待更新语料,初始待更新语料为满足预设要求的文本语料;根据预设扩写规则对初始待更新语料进行扩写,获取待更新语料。
在可选的实施方式中,意图识别模块,还包括:更新模块,用于根据更新后的多个训练语料,训练新的意图多分类子模型,将新的意图多分类子模型的模型数据保存至预设位置,并生成模型更新请求;根据模型更新请求,更新意图多分类子模型。
在可选的实施方式中,多个预匹配语料包括:至少一个纯文本语料和至少一个正则表达式,输出模块,具体用于将待识别语料输入匹配子模型,获取待识别语料与每个纯文本语料的匹配结果;若待识别语料与每个纯文本语料的匹配结果均指示匹配失败,则获取待识别语料与每个正则表达式的匹配结果。
在可选的实施方式中,获取模块,具体用于获取初始语音语料;采用预设算法将初始语音语料转换为文本语料,并将文本语料作为待识别语料。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(Digital Signal Processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图10为本申请实施例提供的一种电子设备结构示意图。如图10所示,该电子设备可以包括:处理器210、存储介质220和总线230,存储介质220存储有处理器210可执行的机器可读指令,当电子设备运行时,处理器210与存储介质220之间通过总线230通信,处理器210执行机器可读指令,以执行上述方法实施例的步骤。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述方法实施例的步骤。具体实现方式和技术效果类似,这里不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (12)
1.一种意图识别方法,其特征在于,包括:
获取待识别语料;
将所述待识别语料输入意图识别模型,获取输出的意图识别结果,所述意图识别模型包括匹配子模型和意图多分类子模型,其中,所述匹配子模型包括多个预匹配语料,用于获取与所述待识别语料匹配的语料,每个所述预匹配语料标注有意图标签;所述意图多分类子模型根据多个训练语料训练获取,用于获取所述待识别语料对应的意图,每个所述训练语料标注有意图标签。
2.根据权利要求1所述的意图识别方法,其特征在于,所述将所述待识别语料输入意图识别模型,获取输出的意图识别结果,包括:
将所述待识别语料输入所述匹配子模型,获取所述预匹配语料中与所述待识别语料匹配的目标语料;
将所述目标语料对应的意图标签作为所述待识别语料的意图识别结果。
3.根据权利要求2所述的意图识别方法,其特征在于,所述将所述待识别语料输入意图识别模型,获取输出的意图识别结果,包括:
若所述预匹配语料中不存在与所述待识别语料匹配的语料,将所述待识别语料输入所述意图多分类子模型;
通过所述意图多分类子模型对所述待识别语料进行多分类识别,输出所述待识别语料的意图识别结果。
4.根据权利要求3所述的意图识别方法,其特征在于,所述通过所述意图多分类子模型对所述待识别语料进行多分类识别,输出所述待识别语料的意图识别结果,包括:
通过所述意图多分类子模型对所述待识别语料进行多分类识别,获取所述待识别语料与各意图标签匹配的概率;
根据所述待识别语料与各意图标签匹配的概率,确定所述待识别语料的意图识别结果。
5.根据权利要求1所述的意图识别方法,其特征在于,所述方法还包括:
响应于语料更新请求,分别更新所述预匹配语料和所述训练语料,所述语料更新请求包括:至少一个待更新语料,所述待更新语料包括纯文本语料和/或正则表达式,所述待更新语料标注有意图标签。
6.根据权利要求5所述的意图识别方法,其特征在于,所述响应于语料更新请求,分别更新所述预匹配语料和所述训练语料之前,所述方法还包括:
获取初始待更新语料,所述初始待更新语料为满足预设要求的文本语料;
根据预设扩写规则对所述初始待更新语料进行扩写,获取所述待更新语料。
7.根据权利要求5或6所述的意图识别方法,其特征在于,所述方法还包括:
根据更新后的多个所述训练语料,训练新的意图多分类子模型,将所述新的意图多分类子模型的模型数据保存至预设位置,并生成模型更新请求;
根据所述模型更新请求,更新所述意图多分类子模型。
8.根据权利要求2所述的意图识别方法,其特征在于,多个所述预匹配语料包括:至少一个纯文本语料和至少一个正则表达式,所述将所述待识别语料输入所述匹配子模型,获取所述预匹配语料中与所述待识别语料匹配的目标语料,包括:
将所述待识别语料输入所述匹配子模型,获取所述待识别语料与每个所述纯文本语料的匹配结果;
若所述待识别语料与每个所述纯文本语料的匹配结果均指示匹配失败,则获取所述待识别语料与每个所述正则表达式的匹配结果。
9.根据权利要求1所述的意图识别方法,其特征在于,所述获取待识别语料,包括:
获取初始语音语料;
采用预设算法将所述初始语音语料转换为文本语料,并将所述文本语料作为所述待识别语料。
10.一种意图识别装置,其特征在于,包括:
获取模块,用于获取待识别语料;
输出模块,用于将所述待识别语料输入意图识别模型,获取输出的意图识别结果,所述意图识别模型包括匹配子模型和意图多分类子模型,其中,所述匹配子模型包括多个预匹配语料,用于获取与所述待识别语料匹配的语料,每个所述预匹配语料标注有意图标签;所述意图多分类子模型根据多个训练语料训练获取,用于获取所述待识别语料对应的意图,每个所述训练语料标注有意图标签。
11.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1-9任一所述意图识别方法的步骤。
12.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-9任一所述意图识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110337257.6A CN113065364A (zh) | 2021-03-29 | 2021-03-29 | 意图识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110337257.6A CN113065364A (zh) | 2021-03-29 | 2021-03-29 | 意图识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113065364A true CN113065364A (zh) | 2021-07-02 |
Family
ID=76564595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110337257.6A Pending CN113065364A (zh) | 2021-03-29 | 2021-03-29 | 意图识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113065364A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115408509A (zh) * | 2022-11-01 | 2022-11-29 | 杭州一知智能科技有限公司 | 一种意图识别方法、系统、电子设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110377911A (zh) * | 2019-07-23 | 2019-10-25 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
CN111061853A (zh) * | 2019-12-26 | 2020-04-24 | 竹间智能科技(上海)有限公司 | 一种快速获取faq模型训练语料的方法 |
CN111737436A (zh) * | 2020-06-24 | 2020-10-02 | 网易(杭州)网络有限公司 | 语料的意图识别方法及装置、电子设备、存储介质 |
-
2021
- 2021-03-29 CN CN202110337257.6A patent/CN113065364A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110377911A (zh) * | 2019-07-23 | 2019-10-25 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
CN111061853A (zh) * | 2019-12-26 | 2020-04-24 | 竹间智能科技(上海)有限公司 | 一种快速获取faq模型训练语料的方法 |
CN111737436A (zh) * | 2020-06-24 | 2020-10-02 | 网易(杭州)网络有限公司 | 语料的意图识别方法及装置、电子设备、存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115408509A (zh) * | 2022-11-01 | 2022-11-29 | 杭州一知智能科技有限公司 | 一种意图识别方法、系统、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112100349B (zh) | 一种多轮对话方法、装置、电子设备及存储介质 | |
US11482212B2 (en) | Electronic device for analyzing meaning of speech, and operation method therefor | |
CN109829039B (zh) | 智能聊天方法、装置、计算机设备及存储介质 | |
US9740677B2 (en) | Methods and systems for analyzing communication situation based on dialogue act information | |
CN111191016A (zh) | 一种多轮对话处理方法、装置及计算设备 | |
CN110008319B (zh) | 基于对话模板的模型训练方法和装置 | |
CN110910903B (zh) | 语音情绪识别方法、装置、设备及计算机可读存储介质 | |
CN112215008B (zh) | 基于语义理解的实体识别方法、装置、计算机设备和介质 | |
WO2021204017A1 (zh) | 文本意图识别方法、装置以及相关设备 | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
CN113505591A (zh) | 一种槽位识别方法及电子设备 | |
CN114239547A (zh) | 一种语句生成方法及电子设备、存储介质 | |
CN111368130A (zh) | 客服录音的质检方法、装置、设备及存储介质 | |
CN111581375A (zh) | 对话意图类型识别方法、多轮对话方法、装置及计算设备 | |
CN111223476B (zh) | 语音特征向量的提取方法、装置、计算机设备和存储介质 | |
CN111368066B (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
CN113836303A (zh) | 一种文本类别识别方法、装置、计算机设备及介质 | |
CN113326702A (zh) | 语义识别方法、装置、电子设备及存储介质 | |
CA3155717A1 (en) | Method of realizing configurable intelligent voice robot, device and storage medium | |
CN114242047A (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN113012687B (zh) | 一种信息交互方法、装置及电子设备 | |
CN113065364A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN113051384A (zh) | 基于对话的用户画像抽取方法及相关装置 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN111402864A (zh) | 语音处理方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |