CN111783425A - 基于句法分析模型的意图识别方法及相关装置 - Google Patents
基于句法分析模型的意图识别方法及相关装置 Download PDFInfo
- Publication number
- CN111783425A CN111783425A CN202010600775.8A CN202010600775A CN111783425A CN 111783425 A CN111783425 A CN 111783425A CN 202010600775 A CN202010600775 A CN 202010600775A CN 111783425 A CN111783425 A CN 111783425A
- Authority
- CN
- China
- Prior art keywords
- intention
- syntactic
- type
- sentence
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及人工智能技术领域,提供了一种基于句法分析模型的意图识别方法,该方法包括:获取待进行意图识别的输入语句;根据所述输入语句所属的领域类型,确定针对所述领域类型所预设的至少一种意图类型,并获取每种意图类型对应的关键词和关键句法关系,所述关键句法关系用于表征所述关键词之间具有的句法关系;根据每种意图类型对应的关键词以及关键句法关系,将所述输入语句与每种意图类型进行匹配,获得所述输入语句与每种意图类型之间的匹配度;将匹配度最高的意图类型确定为所述输入语句对应的目标意图。此外,本申请还涉及区块链技术,各种领域类型下的不同意图类型对应的样本语句可存储在区块链节点中。
Description
技术领域
本申请涉及人工智能技术领域,特别涉及一种基于句法分析模型的意图识别方法及装置、电子设备、计算机可读存储介质。
背景技术
意图识别是通过分类的方法将语句划分为相应的意图种类,在搜索引擎和智能问答等应用场景中起到十分重要的作用。例如,在智能问答场景中,通过意图识别获得用户问题对应的意图类型,然后根据识别得到的意图类型匹配用户问题对应的回答语句,能够明显提升用户问题的匹配准确度。
目前,意图识别系统通常采用有监督的意图分类模型,此意图分类模型需要基于大量的标注样本进行训练得到,但由于针对新出现的技术领域获取标注样本的难度很大,导致意图分类模型由于标注样本稀疏容易出现意图分类准确度较低的问题。
因此,如何提升意图识别的准确度,是现有技术中还有待解决的技术问题。
发明内容
为了解决上述技术问题,本申请提供一种基于句法分析模型的意图识别方法及装置、电子设备、计算机可读存储介质。
本申请所揭示的技术方案包括:
一种基于句法分析模型的意图识别方法,包括:获取待进行意图识别的输入语句;根据所述输入语句所属的领域类型,确定针对所述领域类型所预设的至少一种意图类型,并获取每种意图类型对应的关键词和关键句法关系,所述关键句法关系用于表征所述关键词之间具有的句法关系;根据每种意图类型对应的关键词以及关键句法关系,将所述输入语句与每种意图类型进行匹配,获得所述输入语句与每种意图类型之间的匹配度;将匹配度最高的意图类型确定为所述输入语句对应的目标意图。
在一个示例性实施例中,获取每种意图类型对应的关键词和关键句法关系,包括:分别获取每种意图类型对应的样本语句;对所述样本语句进行句法分析,获得所述样本语句对应的句法分析结果,所述句法分析结果中含有所述样本语句对应的各个分词,以及所述分词之间具有的句法关系;将指定句法关系下的各个分词提取为所述样本语句所对应意图类型中的关键词,并将所述指定句法关系提取为所述关键词对应的关键句法关系。
在一个示例性实施例中,对所述样本语句进行句法分析,获得所述样本语句对应的句法分析结果,包括:对所述样本语句进行分词处理,获得所述样本语句对应的分词集合;对所述分词集合中的每个分词进行词性标注;根据所述分词的词性,确定所述样本语句中任意两个分词之间的句法关系,获得所述句法分析结果。
在一个示例性实施例中,所述匹配度包括所述输入语句与所述意图类型之间的句法匹配度;根据每种意图类型对应的关键词以及关键句法关系,将所述输入语句与每种意图类型进行匹配,包括:对所述输入语句进行句法分析,获得所述输入语句中含有的分词之间具备的句法关系;根据所述输入语句所具备的句法关系,分别与每种意图类型所含有的句法关系进行匹配,获得所述输入语句与每种意图类型之间的句法匹配度。
在一个示例性实施例中,所述匹配度还包括所述输入语句与所述意图类型之间的语义匹配度;所述方法还包括:获取所述输入语句中含有的各个分词对应的语义向量,以及每种意图类型下的关键词对应的语义向量;根据所述分词对应的语义向量以及所述关键词对应的语义向量,计算所述输入语句与每种意图类型之间的语义相似度,以将所述语义相似度和所述句法匹配度之和作为所述输入语句与所述意图类型之间的匹配度。
在一个示例性实施例中,所述方法还包括:对所述输入语句进行分词处理,获得所述输入语句对应的分词集合;如果所述输入语句对应的分词集合中含有疑问词,则根据所述疑问词以及所述输入语句中与所述疑问词构成指定句法关系的目标分词确定所述输入语句对应的目标意图;否则,根据所述输入语句所属的领域类型确定所述目标意图。
在一个示例性实施例中,根据所述疑问词以及所述输入语句中与所述疑问词构成指定句法关系的目标分词确定所述输入语句对应的目标意图,包括:针对所述输入语句进行句法分析,获得所述输入语句中含有的分词之间具备的句法关系;获取与所述疑问词形成指定句法关系的目标分词,将所述目标分词和所述疑问词组成的语句作为所述输入语句对应的目标意图。
一种基于句法分析模型的意图识别装置,包括:输入语句获取模块,用于获取待进行意图识别的输入语句;类型信息获取模块,用于根据所述输入语句所属的领域类型,确定针对所述领域类型所预设的至少一种意图类型,并获取每种意图类型对应的关键词和关键句法关系,所述关键句法关系用于表征所述关键词之间具有的句法关系;类型信息匹配模块,用于根据每种意图类型对应的关键词以及关键句法关系,将所述输入语句与每种意图类型进行匹配,获得所述输入语句与每种意图类型之间的匹配度;目标意图确定模块,用于将匹配度最高的意图类型确定为所述输入语句对应的目标意图。
一种电子设备,包括处理器和存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前任一项所述的基于句法分析模型的意图识别方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前任一项所述的基于句法分析模型的意图识别方法。
本申请实施例提供的技术方案可以包括以下有益效果:
在上述技术方案中,针对待识别的输入语句,根据输入语句所属的领域类型确定该领域类型下预设的意图类型,并根据这些意图类型对应的关键词和关键词之间具有的句法关系,将输入语句与这些意图类型进行匹配,最后将匹配度最高的意图类型确定为输入语句对应的目标意图,因此本申请对输入语句进行意图识别是采用无监督的方式实现的,无需使用大量的标注样本进行意图分类模型的训练,即使是针对新出现的技术领域,也能够准确进行意图识别。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种基于句法分析模型的意图识别方法的流程图;
图2是图1所示实施例中步骤120在一个实施例的流程图;
图3是根据一示例性实施例示出的依存句法图;
图4图1所示实施例中步骤130在一个实施例的流程图;
图5图1所示实施例中步骤130在另一个实施例的流程图;
图6是根据一示例性实施例示出的一种基于句法分析模型的意图识别装置的框图;
图7是根据一示例性实施例所示出的一种电子设备的硬件示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
请参阅图1,图1是根据一示例性实施例示出的一种基于句法分析模型的意图识别方法的流程图,该方法用于实现输入语句的意图识别,适用于搜索引擎、智能问答等应用场景。
如图1所示,在一示例性的实施例中,该基于句法分析模型的意图识别方法至少包括如下步骤:
步骤110,获取待进行意图识别的输入语句。
首先需要说明的是,输入语句是待进行意图识别的文本内容,通过对输入语句所含有的文本内容进行识别,以得到输入语句表达的语义,基于输入语句的语义即可得到输入语句对应的意图。
输入语句可以从预先设定的意图识别界面中获取得到,例如在搜索引擎所关联的搜索页面中,通过获取用户在的搜索框中输入的文本信息,即可相应得到由用户输入的输入语句。
输入语句还可以通过语音识别等方式得到,例如在问答机器人与用户进行交流的智能问答场景中,问答机器人通过识别用户语音获得用户问题对应的文本内容,然后基于本实施例提供的方法识别用户问题对应的目标意图,从而根据识别得到的目标意图在预设的知识库中匹配用于问题对应的回答语句。
应当理解的是,在不同的应用场景中,获取输入语句的方法可能相互不同,本实施例并不对输入语句的具体获取方式进行任何限制。
步骤120,根据输入语句所属的领域类型,确定针对该领域类型所预设的至少一种意图类型,并获取每种意图类型对应的关键词和关键句法关系。
在本实施例中,预先构建有知识库,该知识库包含了不同类型的应用领域,即包含了不同的领域类型,并针对每种类型的应用领域收集有不同意图类型对应的样本语句。例如,针对保险行业所对应的领域类型,其所包含的意图类型则可以对应于保险行业的各个下属领域,具体可以包括不同类型的保险名称以及各个下属领域中常用的术语。
举例来说,保险通常被划分为人身保险和财产保险两个大类,每个大类下又被划分为不同的类别,例如人身保险通常包括意外险、医疗险、寿险、养老险等类别,这些大类以及小类均可以称为保险领域的下属领域。各个下属领域中常用的术语包括投保、保单、理赔等,通过对各个下属领域对应的保险名称以及术语进行组合,即得到不同的意图类型,例如“意外险投保”、“寿险理赔”等。在实际应用中,各个下属领域对应的保险名称通常由不同的经营方经营,因此意图类型中还可以包含经营方的名称,以对意图类型进行更加准确的描述。
意图类型对应的样本语句则含有意图类型对应的具体语义表达,例如样本语句可以是针描述意图类型的具体内容的语句,例如包括“寿险如何理赔”、“寿险的理赔条件是怎样的”等语句,本处不一一列举。
并且,为进一步保证上述知识库中含有的不同的领域类型,以及针对每种领域所收集的不同意图类型对应的样本语句的私密和安全性,上述不同领域类型下的不同意图类型对应的样本语句还可以存储于一区块链的节点中。
输入语句所属的领域类型可以根据输入语句的获取来源相应确定,例如服务于保险机构的问答机器人获取的输入语句必然属于保险领域。而在其它的一些实施例中,输入语句中还含有能够直接表达领域类型的词汇,例如“保险”、“理赔”等,基于这些词汇也可以确定输入语句所属的领域类型。
由此,基于输入语句所属的领域类型,即可从知识库中查询该领域类型下的若干意图类型,并获得各个意图类型对应的样本语句。
关键句法关系是指关键词之间具有的句法关系,例如,通过对样本语句进行句法分析,即可获得样本语句中含有的分词之间的句法关系,将这些句法关系下的分词作为样本语句所属的意图类型对应的关键词,这些句法关系则相应称为该意图类型对应的关键句法关系。
其中,对样本语句进行句法分析可以是通过句法分析模型实现的,该句法分析模型具体执行下述实施例中描述的步骤来获得输入语句所属的领域类型下的各种意图类型对应的关键词和关键句法关系,本处不进行赘述。
步骤130,根据每种意图类型对应的关键词以及关键句法关系,将输入语句与每种意图类型进行匹配,获得输入语句与每种意图类型之间的匹配度。
其中,输入语句与每种意图类型之间的匹配,实质上是输入语句的语义与每种意图类型所含有的关键词的语义之间的匹配,如果二者语义匹配度越高,则表示输入语句所表达的语义对应为该种意图类型的可能性就越高。
如前所述的,关键句法关系用于表征关键词之间具有的句法关系,因此意图类型对应的关键句法关系反映了关键词之间的语义联系,从而能够加强意图类型的语义表达。
基于此,根据每种意图类型对应的关键词以及关键句法关系对输入语句与每种意图类型进行匹配,即能够准确地得到输入语句与每种意图之间匹配度,从而能够确定输入语句对应于每种意图的可能性。因此,匹配度最高的意图类型为输入语句对应的意图的可能性也最大,因此将匹配度最高的意图类型确定为输入语句对应的目标意图。
步骤140,将匹配度最高的意图类型确定为输入语句对应的目标意图。
基于上述内容可知,本申请对输入语句进行意图识别是采用无监督的方式实现的,与现有技术中采取有监督的意图分类模型进行的意图识别相比,本申请无需使用大量的标注样本进行意图分类模型的训练,只需预先收集可能涉及意图识别的应用领域,并针对这些应用领域进行意图类型的区分,以及针对不同的意图类型收集样本语句。
即使是针对新出现的技术领域,对这些技术领域进行意图类型的区分以及不同意图类型的样本语句获取都是比较容易实现的,因此本实施例能够针对新出现的技术领域准确进行意图识别。
图2是图1所示实施例中步骤120在一个实施例的流程图。如图2所示,在一示例性实施例中,获取每种意图类型对应的关键词和关键句法关系的过程具体包括如下步骤:
步骤121,分别获取每种意图类型对应的样本语句。
如前所述的,由于预先收集各种意图类型对应的样本语句,因此根据输入语句所属的领域类型即可直接获取到意图类型对应的样本语句。
每种意图类型可以含有多个样本语句,并且各个样本语句均与相应意图类型关联存储,因此在基于输入语句所述的领域类型确定该领域类型下的各个意图类型后,即可相应获得与各个意图类型关联存储的样本语句,并基于这些样本语句获取各个意图类型对应的关键词和关键句法关系。
步骤122,对样本语句进行句法分析,获得样本语句对应的句法分析结果,句法分析结果中含有样本语句对应的各个分词,以及分词之间具有的句法关系。
其中,句法是研究句子的组成部分和它们的排列顺序,对样本语句进行句法分析也即是对样本语句中的词语语法功能进行分析,从而获得样本语句中的词语之间具有的句法关系。
在一个实施例中,对样本语句进行句法分析的过程包括如下步骤:
对样本语句进行分词处理,获得样本语句对应的分词集合;
对分词集合中的每个分词进行词性标注;
根据分词的词性,确定样本语句中任意两个分词之间的句法关系,获得句法分析结果。
其中,对样本语句进行分词处理具体可以采用分词算法实现,样本语句对应的分词集合中则含有样本语句含有的各个分词。对分词进行词性标注包括将动词标记为“v”、将名词标记为“n”等,通过对每个分词的词性标注,由此获得样本语句的词性标注结果。基于样本语句的词性标注结果,即可分析任意两个分词之间在句法上的依存关系,例如分析任意两个分词之间是否具有主谓关系、动宾关系、定中关系等句法关系,由此即可得到样本语句中分词之间具有的句法关系。
在其它的实施例中,在获得样本语句对应的句法分析结果之后,还根据句法分析结果构建样本语句对应的依存句法图。例如,针对样本语句“怎么邀请别人下载口袋e行销”进行句法分析,并根据得到的句法分析结果构建如图3所示的依存句法图。基于所构建依存句法图,即可以准确地确定样本语句中的各个分词、各个分词对应词性以及分词之间具有的句法关系。
需要说明的是,在图3所示的依存句法图中,“Root”表示句法根节点,具体是指进行语法分析的样本语句,句法根节点与样本语句中的核心词之间形成核心关系,也即是指整个样本语句的核心。分词之间所标注的字母为句法关系类型对应的简称,例如核心关系的简称为“HED”,主谓关系的简称为“SBV”,动宾关系的简称为“VOB”,定中关系的简称为“ATT”,在此不一一进行列举。
步骤123,将指定句法关系下的各个分词提取为样本语句所对应意图类型中的关键词,并将指定句法关系提取为关键词对应的关键句法关系。
其中,指定句法关系是预先设置的能够在较大程度上表示样本语句所对应的意图类型的句法关系,例如,由于核心关系是指整个样本语句的核心,因此可以将核心关系作为指定句法关系,或者还可以包括主谓关系、动宾关系和定中关系,本实施例不进行限制。
因此,本实施例提取得到的意图类型对应的关键词,以及关键词对应的关键句法关系能够在较大程度上表达相应的意图类型,后续基于意图类型对应的关键词以及关键句法与输入语句进行匹配,能够得到输入语句与各种意图类型之间的匹配度,通过将匹配度最高的意图类型确定为输入语句对应的目标意图,即能够准确识别输入语句的意图。
图4图1所示实施例中步骤130在一个实施例的流程图。
如图4所示,在一示例性实施例中,输入语句与意图类型之间的匹配度具体包括句法匹配度,根据意图类型对应的关键词以及关键句法关系,将输入语句与每种意图类型进行匹配的过程,具体包括如下步骤:
步骤131,对输入语句进行句法分析,获得输入语句中含有的分词之间具备的句法关系。
首先需要说明的是,在本实施例中,输入语句和意图类型之间的匹配度具体通过句法上的匹配程度体现,因此需要对输入语句进行句法分析,以获得输入语句中含有的分词之间具备的句法关系。
对输入语句进行句法分析的过程与上述实施例中对样本语句进行语法分析的过程相同,在对输入语句进行分词处理得到输入语句对应的分词集合之后,标注每个分词的词性,然后基于分词的词性分析分词之间的句法关系,由此即可得到输入语句所含有分词之间具备的句法关系。
步骤132,根据输入语句所具备的句法关系,与意图类型所含有的句法关系进行匹配,获得输入语句与意图类型之间的句法匹配度。
其中,对输入语句与意图类型之间的句法匹配度进行计算的过程具体为:针对输入语句中具有的每种句法关系,都与意图类型对应的关键句法关系进行匹配,如果意图类型对应的关键句法关系中包含有输入语句中的句法关系,则将输入语句中的这种句法关系赋值为1,反之则赋值为0,最后计算输入语句的累计得分即可得到输入语句与意图类型之间的句法匹配度。
由此,输入语句与意图类型之间的句法匹配度是通过对输入语句与意图类型所含有的句法关系一一匹配得到的,因此能够准确体现输入语句与意图类型之间的匹配度,从而便于后续准确地进行输入语句的目标意图的确定。
而在另外的实施例中,如图5所示,输入语句与意图类型之间的匹配度除了包括句法匹配度之外,还包括输入语句与意图类型之间的语义匹配度,根据意图类型对应的关键词以及关键句法关系,将输入语句与每种意图类型进行匹配的过程,还包括如下步骤:
步骤210,获取输入语句中含有的各个分词对应的语义向量,以及意图类型下的关键词对应的语义向量。
在本实施例中,输入语句与意图类型之间的匹配度由输入语句与意图类型之间的句法匹配度和语义匹配度共同体现,进一步提升了基于输入语句与意图类型之间的匹配度确定输入语句的目标意图的准确性。
为计算输入语句与意图类型之间的语义匹配度,需要提取输入语句中含有的各个分词对应的语义向量,以及意图类型下的关键词对应的语义向量。其中,本实施例进行的语义向量提取具体可以采用word2vec、glove、ELMo、BERT等词向量提取模型实现。
需要说明的是,本实施例需采用同一词向量提取模型进行输入语句中含有的各个分词对应的语义向量的提取,以及进行意图类型下的关键词对应的语义向量的提取,以使相似的词语得到相似的向量表达,以使得后续进行语义匹配度的计算是准确的。
步骤220,根据输入语句中含有的各个分词对应的语义向量以及关键词对应的语义向量,计算输入语句与意图类型之间的语义相似度,以将语义相似度和句法匹配度之和作为输入语句与意图类型之间的匹配度。
其中,本实施例计算输入语句与意图类型之间的语义相似度的过程具体为:针对输入语句中的每个分词,分别计算该分词与意图类型中的每个关键词之间的向量相似值,然后将所有的向量相似值相加即得到输入语句与意图类型之间的语义相似度。
并且,在最终确定输入语句与意图类型之间的匹配度时,将输入语句与意图类型之间的语义相似度与句法匹配度相加即可,以使的后续基于输入语句与意图类型之间的匹配度确定输入语句的目标意图的准确性得以进一步提升。
在本申请的另一示例性实施例中,考虑到用户问题所表达的用户意图通常能够通过疑问词直接体现,因此在本实施例中,通过对输入语句进行分词处理,获得输入语句对应的分词集合,然后确定该分词集合中是否含有疑问词。
其中,对分词集合中疑问词的判断具体可以使用疑问词词典,该疑问词词典中含有预先收集的若干疑问词,通过将分词集合中的每个分词与疑问词词典一一进行匹配,即可确定分词集合中的疑问词。
如果该分词集合中含有疑问词,则根据疑问词以及输入语句中与疑问词构成指定句法关系的目标分词确定输入语句对应的目标意图。例如,如果输入语句为“如果在理财软件上买的理财产品怎么退保”,该输入语句含有的疑问词为“怎么”,“怎么退保”即反映了输入语句的意图,因此将与疑问词“怎么”组成状中句法关系的分词“退保”确定为目标分词,然后将疑问词“怎么”与目标分词“退保”组成的语句确定为输入语句对应的目标意图。
如果输入语句对应的分词集合中不含有疑问词,则表示无法根据输入语句的文本内容直接确定输入语句的目标意图,因此使用前述实施例中提供的方法,根据输入语句所属的领域类型确定输入语句的目标意图。
或者在另一实施例中,如果输入语句对应的分词集合中不含有疑问词,也可以直接根据输入语句所具备的句法关系确定输入语句的目标意图。例如对输入语句进行句法分析将获得输入语句中的分词之间具有的句法关系,通过获取核心关系“HED”下的第一分词,以及获取与第一分词形成定中关系“ATT”或者动宾关系“VOB”的第二分词,将第一分词和第二分词组成的语句作为输入语句的目标意图。
因此,本实施例提供的方法包含多种用于识别输入语句的目标意图的方式,在具体应用中,则可以根据输入语句的具体句法结构选择具体的识别方式,以快速获得输入语句的目标意图。
图6是根据一示例性实施例示出的一种基于句法分析模型的意图识别装置的框图,该装置具体包括输入语句获取模块310、类型信息获取模块320、类型信息匹配模块330和目标意图确定模块340。
其中,输入语句获取模块310用于获取待进行意图识别的输入语句。类型信息获取模块320用于根据输入语句所属的领域类型,确定针对领域类型所预设的至少一种意图类型,并获取每种意图类型对应的关键词和关键句法关系,关键句法关系用于表征关键词之间具有的句法关系。类型信息匹配模块330用于根据每种意图类型对应的关键词以及关键句法关系,将输入语句与每种意图类型进行匹配,获得输入语句与每种意图类型之间的匹配度。目标意图确定模块340用于将匹配度最高的意图类型确定为输入语句对应的目标意图。
在另一示例性实施例中,信息获取模块320包括样本语句获取单元、样本语句分析单元和关键信息获取单元。样本语句获取单元用于分别获取每种意图类型对应的样本语句。样本语句分析单元用于对样本语句进行句法分析,获得样本语句对应的句法分析结果,句法分析结果中含有样本语句对应的各个分词,以及分词之间具有的句法关系。关键信息获取单元用于将指定句法关系下的各个分词提取为样本语句所对应意图类型中的关键词,并将指定句法关系提取为关键词对应的关键句法关系。
在另一示例性实施例中,样本语句分析单元包括分词子单元、词性标注子单元和句法分析子单元。分词子单元用于对样本语句进行分词处理,获得样本语句对应的分词集合。词性标注子单元用于对分词集合中的每个分词进行词性标注。句法分析子单元用于根据分词的词性,确定样本语句中任意两个分词之间的句法关系,获得句法分析结果。
在另一示例性实施例中,输入语句与意图类型之间的匹配度包括句法匹配度,类型信息匹配模块330包括输入语句分析单元和句法关系匹配单元。输入语句分析单元用于对输入语句进行句法分析,获得输入语句中含有的分词之间具备的句法关系。句法关系匹配单元用于根据输入语句所具备的句法关系,分别与每种意图类型所含有的句法关系进行匹配,获得输入语句与每种意图类型之间的句法匹配度。
在另一示例性实施例中,输入语句与意图类型之间的匹配度还包括语义向量提取单元和语义匹配单元。语义向量提取单元用于获取输入语句中含有的各个分词对应的语义向量,以及每种意图类型下的关键词对应的语义向量。语义匹配单元用于根据分词对应的语义向量以及关键词对应的语义向量,计算输入语句与每种意图类型之间的语义相似度,以将语义相似度和所述句法匹配度之和作为输入语句与意图类型之间的匹配度。
在另一示例性实施例中,该装置还包括疑问词判别模块,用于判断输入语句的分词集合中是否含有疑问词,如果含有疑问词,则根据疑问词以及输入语句中与疑问词构成指定句法关系的目标分词确定输入语句对应的目标意图,否则根据输入语句所属的领域类型确定输入语句的目标意图。
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
在一示例性的实施例中,本申请还提供一种电子设备,该设备包括处理器和存储器,该存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时,实现如前所述的基于句法分析模型的意图识别方法。
图7是根据一示例性实施例所示出的一种电子设备的硬件示意图。
需要说明的是,该电子设备只是一个适配于本申请的示例,不能认为是提供了对本申请的使用范围的任何限制。该电子设备也不能解释为需要依赖于或者必须具有图7中示出的示例性的电子设备中的一个或者多个组件。
该电子设备的硬件结构可因配置或者性能的不同而产生较大的差异,如图7所示,电子设备包括:电源510、接口530、至少一存储器550、以及至少一中央处理器(CPU,CentralProcessing Units)570。
其中,电源510用于为电子设备上的各硬件设备提供工作电压。
接口530包括至少一有线或无线网络接口531、至少一串并转换接口533、至少一输入输出接口535以及至少一USB接口537等,用于与外部设备通信。
存储器550作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统551、应用程序553或者数据555等,存储方式可以是短暂存储或者永久存储。
其中,操作系统551用于管理与控制电子设备上的各硬件设备以及应用程序553,以实现中央处理器570对海量数据555的计算与处理,其可以是Windows ServerTM、Mac OSXTM、UnixTM、LinuxTM等。应用程序553是基于操作系统551之上完成至少一项特定工作的计算机程序,其可以包括至少一模块(图7中未示出),每个模块都可以分别包含有对电子设备的一系列计算机可读指令。数据555可以是存储于磁盘中的http协议数据等。
中央处理器570可以包括一个或多个以上的处理器,并设置为通过总线与存储器550通信,用于运算与处理存储器550中的海量数据555。
如上面所详细描述的,适用本申请的电子设备将通过中央处理器570读取存储器550中存储的一系列计算机可读指令的形式来完成前述实施例所述的基于句法分析模型的意图识别方法。
此外,通过硬件电路或者硬件电路结合软件指令也能同样实现本申请,因此实现本申请并不限于任何特定硬件电路、软件以及两者的组合。
在一示例性的实施例中,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如前所述的基于句法分析模型的意图识别方法。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
应当理解的是,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
还应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (10)
1.一种基于句法分析模型的意图识别方法,其特征在于,包括:
获取待进行意图识别的输入语句;
根据所述输入语句所属的领域类型,确定针对所述领域类型所预设的至少一种意图类型,并获取每种意图类型对应的关键词和关键句法关系,所述关键句法关系用于表征所述关键词之间具有的句法关系;
根据每种意图类型对应的关键词以及关键句法关系,将所述输入语句与每种意图类型进行匹配,获得所述输入语句与每种意图类型之间的匹配度;
将匹配度最高的意图类型确定为所述输入语句对应的目标意图。
2.根据权利要求1所述的方法,其特征在于,获取每种意图类型对应的关键词和关键句法关系,包括:
分别获取每种意图类型对应的样本语句;
对所述样本语句进行句法分析,获得所述样本语句对应的句法分析结果,所述句法分析结果中含有所述样本语句对应的各个分词,以及所述分词之间具有的句法关系;
将指定句法关系下的各个分词提取为所述样本语句所对应意图类型中的关键词,并将所述指定句法关系提取为所述关键词对应的关键句法关系。
3.根据权利要求2所述的方法,其特征在于,对所述样本语句进行句法分析,获得所述样本语句对应的句法分析结果,包括:
对所述样本语句进行分词处理,获得所述样本语句对应的分词集合;
对所述分词集合中的每个分词进行词性标注;
根据所述分词的词性,确定所述样本语句中任意两个分词之间的句法关系,获得所述句法分析结果。
4.根据权利要求1所述的方法,其特征在于,所述匹配度包括所述输入语句与所述意图类型之间的句法匹配度;根据每种意图类型对应的关键词以及关键句法关系,将所述输入语句与每种意图类型进行匹配,包括:
对所述输入语句进行句法分析,获得所述输入语句中含有的分词之间具备的句法关系;
根据所述输入语句所具备的句法关系,分别与每种意图类型所含有的句法关系进行匹配,获得所述输入语句与每种意图类型之间的句法匹配度。
5.根据权利要求4所述的方法,其特征在于,所述匹配度还包括所述输入语句与所述意图类型之间的语义匹配度;所述方法还包括:
获取所述输入语句中含有的各个分词对应的语义向量,以及每种意图类型下的关键词对应的语义向量;
根据所述分词对应的语义向量以及所述关键词对应的语义向量,计算所述输入语句与每种意图类型之间的语义相似度,以将所述语义相似度和所述句法匹配度之和作为所述输入语句与所述意图类型之间的匹配度。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述输入语句进行分词处理,获得所述输入语句对应的分词集合;
如果所述输入语句对应的分词集合中含有疑问词,则根据所述疑问词以及所述输入语句中与所述疑问词构成指定句法关系的目标分词确定所述输入语句对应的目标意图;
否则,根据所述输入语句所属的领域类型确定所述目标意图。
7.根据权利要求6所述的方法,其特征在于,根据所述疑问词以及所述输入语句中与所述疑问词构成指定句法关系的目标分词确定所述输入语句对应的目标意图,包括:
针对所述输入语句进行句法分析,获得所述输入语句中含有的分词之间具备的句法关系;
获取与所述疑问词形成指定句法关系的目标分词,将所述目标分词和所述疑问词组成的语句作为所述输入语句对应的目标意图。
8.一种基于句法分析模型的意图识别装置,其特征在于,包括:
输入语句获取模块,用于获取待进行意图识别的输入语句;
类型信息获取模块,用于根据所述输入语句所属的领域类型,确定针对所述领域类型所预设的至少一种意图类型,并获取每种意图类型对应的关键词和关键句法关系,所述关键句法关系用于表征所述关键词之间具有的句法关系;
类型信息匹配模块,用于根据每种意图类型对应的关键词以及关键句法关系,将所述输入语句与每种意图类型进行匹配,获得所述输入语句与每种意图类型之间的匹配度;
目标意图确定模块,用于将匹配度最高的意图类型确定为所述输入语句对应的目标意图。
9.一种电子设备,其特征在于,包括:
存储器,存储有计算机可读指令;
处理器,读取存储器存储的计算机可读指令,以执行权利要求1-7中的任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1-7中的任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010600775.8A CN111783425B (zh) | 2020-06-28 | 2020-06-28 | 基于句法分析模型的意图识别方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010600775.8A CN111783425B (zh) | 2020-06-28 | 2020-06-28 | 基于句法分析模型的意图识别方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783425A true CN111783425A (zh) | 2020-10-16 |
CN111783425B CN111783425B (zh) | 2023-04-18 |
Family
ID=72761501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010600775.8A Active CN111783425B (zh) | 2020-06-28 | 2020-06-28 | 基于句法分析模型的意图识别方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783425B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012687A (zh) * | 2021-03-05 | 2021-06-22 | 北京嘀嘀无限科技发展有限公司 | 一种信息交互方法、装置及电子设备 |
CN114281952A (zh) * | 2021-08-16 | 2022-04-05 | 海信视像科技股份有限公司 | 一种用户意图分析方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528531A (zh) * | 2016-10-31 | 2017-03-22 | 北京百度网讯科技有限公司 | 基于人工智能的意图分析方法及装置 |
CN108304466A (zh) * | 2017-12-27 | 2018-07-20 | 中国银联股份有限公司 | 一种用户意图识别方法以及用户意图识别系统 |
CN110765759A (zh) * | 2019-10-21 | 2020-02-07 | 普信恒业科技发展(北京)有限公司 | 意图识别方法及装置 |
-
2020
- 2020-06-28 CN CN202010600775.8A patent/CN111783425B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528531A (zh) * | 2016-10-31 | 2017-03-22 | 北京百度网讯科技有限公司 | 基于人工智能的意图分析方法及装置 |
CN108304466A (zh) * | 2017-12-27 | 2018-07-20 | 中国银联股份有限公司 | 一种用户意图识别方法以及用户意图识别系统 |
CN110765759A (zh) * | 2019-10-21 | 2020-02-07 | 普信恒业科技发展(北京)有限公司 | 意图识别方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012687A (zh) * | 2021-03-05 | 2021-06-22 | 北京嘀嘀无限科技发展有限公司 | 一种信息交互方法、装置及电子设备 |
CN113012687B (zh) * | 2021-03-05 | 2022-05-13 | 北京嘀嘀无限科技发展有限公司 | 一种信息交互方法、装置及电子设备 |
CN114281952A (zh) * | 2021-08-16 | 2022-04-05 | 海信视像科技股份有限公司 | 一种用户意图分析方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111783425B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110781276A (zh) | 文本抽取方法、装置、设备及存储介质 | |
CN110929125B (zh) | 搜索召回方法、装置、设备及其存储介质 | |
US20140180728A1 (en) | Natural Language Processing | |
CN113656547B (zh) | 文本匹配方法、装置、设备及存储介质 | |
CN111538816B (zh) | 基于ai识别的问答方法、装置、电子设备及介质 | |
CN111767714B (zh) | 一种文本通顺度确定方法、装置、设备及介质 | |
CN113282711B (zh) | 一种车联网文本匹配方法、装置、电子设备及存储介质 | |
CN111274822A (zh) | 语义匹配方法、装置、设备及存储介质 | |
CN113704623B (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
US10902342B2 (en) | System and method for scoring the geographic relevance of answers in a deep question answering system based on geographic context of an input question | |
US10552461B2 (en) | System and method for scoring the geographic relevance of answers in a deep question answering system based on geographic context of a candidate answer | |
CN111783425B (zh) | 基于句法分析模型的意图识别方法及相关装置 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN111401034B (zh) | 文本的语义分析方法、语义分析装置及终端 | |
CN114676705B (zh) | 一种对话关系处理方法、计算机及可读存储介质 | |
CN112487154B (zh) | 一种基于自然语言的智能搜索方法 | |
CN113157887B (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN114330483A (zh) | 数据处理方法及模型训练方法、装置、设备、存储介质 | |
Braun et al. | Automatic relation extraction for building smart city ecosystems using dependency parsing | |
CN109660621A (zh) | 一种内容推送方法及服务设备 | |
CN117216214A (zh) | 一种问答抽取的生成方法、装置、设备及介质 | |
CN115115432B (zh) | 基于人工智能的产品信息推荐方法及装置 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN113627186B (zh) | 基于人工智能的实体关系检测方法及相关设备 | |
CN115712713A (zh) | 一种文本匹配方法、装置、系统以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |