CN109376847A - 用户意图识别方法、装置、终端及计算机可读存储介质 - Google Patents
用户意图识别方法、装置、终端及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109376847A CN109376847A CN201811014931.1A CN201811014931A CN109376847A CN 109376847 A CN109376847 A CN 109376847A CN 201811014931 A CN201811014931 A CN 201811014931A CN 109376847 A CN109376847 A CN 109376847A
- Authority
- CN
- China
- Prior art keywords
- customer problem
- intention
- user
- intended
- logical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000014509 gene expression Effects 0.000 claims abstract description 34
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 238000013507 mapping Methods 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000009472 formulation Methods 0.000 abstract description 6
- 239000000203 mixture Substances 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种用户意图识别方法、装置、终端及计算机可读存储介质,该方法包括:将用户问题中的各个词语转化为对应的逻辑符号,以确定用户问题对应的逻辑表达式;将用户问题对应的逻辑表达式与各个预设策略中的预设规则进行匹配,确定预设规则中与用户问题匹配的目标规则,目标规则包含逻辑表达式中的所有逻辑符号,每个预设策略包括一个意图以及该意图对应的至少一个预设规则;将目标规则对应的意图作为用户问题对应的用户意图。本申请实施例通过预设策略识别用户问题对应的用户意图,且每个预设策略包含多条规则,以便尽可能地涵盖某一意图下的多种提问方式,以提高了意图识别的准确度。
Description
技术领域
本申请涉及人工智能技术领域,具体而言,本发明涉及一种用户意图识别方法、装置、终端及计算机可读存储介质。
背景技术
在传统的实现方式下,商家用户一般需要雇佣客服人员来专门完成在线沟通服务,人工成本会比较高,并且在出现多个买家同时发来咨询消息的情况下,经常会造成买家用户的排队等待现象。为了解决该问题,一些电子商务平台提供了“智能机器人”服务,通过该服务可以由计算机自动解答买家用户发送来的各种问题,例如,用户会提出“投资项目A回报率是多少?”、“申请贷款项目B的条件是什么?”等等问题,这就需要计算机快速准确地识别出用户真正的意图,以此来给出恰当的答复。
因此,如何使得计算机系统更准确地识别出用户的真正意图,是迫切需要本领域技术人员解决的技术问题。
发明内容
本申请提供了用于意图识别方法、装置、终端及计算机可读存储介质,可以解决如何准确地识别出用户真正的意图的问题。所述技术方案如下:
第一方面,本申请提供了一种用户意图识别方法,该方法包括:
将用户问题中的各个词语转化为对应的逻辑符号,以确定用户问题对应的逻辑表达式;
将用户问题对应的逻辑表达式与各个预设策略中的预设规则进行匹配,确定预设规则中与用户问题匹配的目标规则,目标规则包含逻辑表达式中的所有逻辑符号,每个预设策略包括一个意图以及该意图对应的至少一个预设规则;
将目标规则对应的意图作为用户问题对应的用户意图。
第二方面,本申请提供了一种用户意图识别装置,该装置包括:
逻辑符号转化模块,用于将用户问题中的各个词语转化为对应的逻辑符号,以确定用户问题对应的逻辑表达式;
规则匹配模块,用于将用户问题对应的逻辑表达式与各个预设策略中的预设规则进行匹配,确定预设规则中与用户问题匹配的目标规则,目标规则包含逻辑表达式中的所有逻辑符号,每个预设策略包括一个意图以及该意图对应的至少一个预设规则;
意图识别模块,用于将目标规则对应的意图作为用户问题对应的用户意图。
第三方面,本申请提供了一种用户意图识别终端,该终端包括:一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个应用程序配置用于:执行本申请第一方面所示的用户意图识别方法。
第四方面,提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行本申请第一方面所示的用户意图识别方法。
本申请实施例提供的技术方案带来的有益效果是:
与现有技术相比,本申请的技术方案,预先设置了识别意图的策略,通过将用户问题转化为机器能够识别的逻辑表达式,以便将用户问题与预设策略中的预设规则进行匹配,以找到用户问题对应的规则,最终确定用户问题对应的用户意图,且每个预设策略包含多条规则,以便尽可能地涵盖某一意图下的多种提问方式,以提高了意图识别的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种用户意图识别方法的流程示意图;
图2为本申请实施例提供的一种用户意图识别装置的结构示意图;
图3为本申请实施例提供的另一种用户意图识别装置的结构示意图;
图4为本申请实施例提供的一种用户意图识别终端的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种用户意图识别的方法,如图1所示,该方法包括步骤S101、步骤S102和步骤S103:
步骤S101、将用户问题中的各个词语转化为对应的逻辑符号,以确定用户问题对应的逻辑表达式。
其中,为了快速地将用户问题中的各个词语转化为逻辑符号,预先配置好了表示逻辑符号与各个词语之间映射关系的逻辑映射列表,逻辑符号采用LIST语言编写。例如,逻辑映射列表中记录有与逻辑符号“$LoanAction”对应的词语,包括“借”、“贷”等表示借贷的动词。在此基础上,步骤S201具体包括:基于预设的逻辑映射列表将用户问题中的各个词语转化为对应的逻辑符号。例如:对用户问题进行分词处理,以得到多个词语,通过逻辑映射列表查询到各个词语对应的逻辑符号,按序串联各个词语对应的逻辑符号即可得到用户问题对应的逻辑表达式。此处,可通过现有的分词工具实现对用户问题的分词处理,具体过程不再赘述。
步骤S102、将用户问题对应的逻辑表达式与各个预设策略中的预设规则进行匹配,确定预设规则中与用户问题匹配的目标规则,目标规则包含逻辑表达式中的所有逻辑符号,每个预设策略包括一个意图以及该意图对应的至少一个预设规则。
其中,每条预设规则包含由逻辑符号组成的逻辑表达式。预设策略与意图具有一一对应的关系,而一个预设策略中可包含一条或多条规则。例如,以贷款业务为例,目前已配置好的预设规则总数有654条,可匹配贷款产品的40个意图(即对应有40个预设策略),例如询问贷款金额、询问贷款条件以及询问贷款状态等等意图。以意图“询问贷款金额”为例,其对应的规则为:
(rule$HiddenProporty($LoanAction$HowMuchMoney)(ConstantFnfb.propoprty.context.Amount))
其中,“(rule$HiddenProporty($LoanAction$HowMuchMoney)”为规则的逻辑表达式,“$LoanAction”为预定义的借贷动词,“$HowMuchMoney”为询问数量的短语,“fb.propoprty.context.Amount”为预定义的意图“询问贷款金额”。利用预设规则匹配用户问题时,将用户问题的逻辑表达式与预设规则的逻辑表达式进行匹配,首先会匹配到预定义短语,然后以自底向上类似树的顺序匹配整个问题,最终匹配到问题对应的预设规则,匹配到的预设规则的逻辑表达式中应包含用户问题的逻辑表达式中的所有逻辑符号。
其中,使用SEMPRE框架进行规则配置,SEMPRE是一个工具包,通过SEMPRE工具包可以很容易地开发新任务的语义解析器,例如,从一组话语指示对中学习一个特征丰富的判别式语义解析器。
步骤S103、将目标规则对应的意图作为用户问题对应的用户意图。
通过以下例子进一步解释步骤S101、步骤S102、步骤S103的执行过程:输入的用户问题为“应急钱包能贷多少钱?”,利用逻辑映射表将用户问题中的“贷”转化为“$LoanAction”,“多少钱”转化为“$HowMuchMoney”,最终得到用户问题的逻辑表达式为($LoanAction$HowMuchMoney)。然后,去各个预设策略中查询包含“$LoanAction”和“$HowMuchMoney”这两个逻辑符号的预设规则,匹配到的预设规则为:(rule$HiddenProporty($LoanAction$HowMuchMoney)(ConstantFn fb.propoprty.context.Amount))。提取匹配到的预设规则对应的意图“fb.propoprty.context.Amount”,该意图为“询问贷款金额”,即得到用户问题“应急钱包能贷多少钱?”对应的意图为“询问贷款金额”。
本实施例的用户意图识别方法,预先设置了识别意图的策略,通过将用户问题转化为机器能够识别的逻辑表达式,以便将用户问题与预设策略中的预设规则进行匹配,以找到用户问题对应的规则,最终确定用户问题对应的用户意图,且每个预设策略包含多条规则,以便尽可能地涵盖某一意图下的多种提问方式,以提高了意图识别的准确度。
实施例二
本申请实施例提供了另一种可能的实现方式,在实施例一的基础上,还包括实施例二所示的方法。
每个预设策略中的预设规则都需要人为设置,当需要识别的意图过多时,规则库需要存储大量的规则模板,这种情况下很容易产生规则冲突,即识别到与用户问题匹配的多个目标规则,导致无法准确地识别用户的真实意图。
进一步地,为了解决上述产生规则冲突的问题,步骤S103具体包括:若匹配到的目标规则仅对应一个预设策略,则将匹配到的目标规则对应的预设策略的意图作为所述用户问题对应的用户意图。
其中,当仅匹配到一个目标规则,则确定该用户意图适用将该匹配到的目标规则对应预设策略,将该预设策略的意图作为用户问题对应的用户意图。当匹配到多个目标规则,且该多个目标规则对应同一预设策略时,由于一个预设策略只对应一个意图,因此,将该预设策略的意图作为用户问题对应的用户意图。
进一步地,本实施例的步骤S103还包括:若匹配到的目标规则对应多个预设策略,则将用户问题输入预先训练的意图识别模型,确定用户问题在各个意图类别上的概率分布;将匹配到的目标规则对应多个预设策略的意图作为候选意图,依据概率分布,将概率值最高的候选意图作为用户问题对应的用户意图。
当预设规则数量增加到一定程度时,容易产生意图冲突,即出现匹配到多个预设规则,且匹配到的多个预设规则属于不同的预设策略的情况。为了解决上述情况,本实施例的方法基于机器学习中的线性分类方法,预先训练了一个意图识别模型,通过意图识别模型从匹配到的多个目标规则对应的意图中选择一个概率值最高的意图,作为用户问题对应的用户意图,解决了因匹配到多个预设规则导致的意图识别冲突问题。
其中,意图识别模型的训练过程具体包括:定义好意图类别,为预先采集到的每个问题标注意图,形成“问题-意图对”,对“问题-意图对”中的问题进行向量化处理得到问题向量x;将x输入概率函数,例如f(x,W,b)=Wx+b,得到对意图的预测值f(x,W,b),该预测值为问题向量x在各个意图类别上的概率分布;通过Hinge Loss(铰链损失)函数计算预测值f(x,W,b)与“问题-意图对”中标注的“意图”Y的差异度,采用随机梯度下降(SGD,stochasticgradient descent)的方法不断优化概率函数的参数W和b,使得概率函数输出的预测值与标注的意图的差异度最小。
其中,概率函数f(x,W,b)=Wx+b为描述“问题”和“意图”之间映射关系的函数,矩阵W被称为权重(weights),向量b被称为偏差向量(bias vector)。W大小为[K×V]的矩阵,b的大小为[K×1]的向量,K为意图类别的数量,V为问题向量x的维度。
其中,所有用于训练的“问题-意图对”会被分为不重合的训练集和测试集。例如,训练集占总样本数量的85%,测试集占总样本数的15%。通过训练集训练概率函数,以优化概率函数的参数,通过测试集对训练好的概率函数进行测试,通过测试后的概率函数即可作为意图识别模型,该意图识别模型可根据输入的问题得到该问题在各个意图类别上的概率分布。
进一步地,在步骤S101之前,本实施例的用户意图识别方法还包括以下步骤:根据预设的近义词列表,将用户问题中未出现在逻辑映射列表中的词语替换为逻辑映射列表中的词语,该近义词列表中包括逻辑映射列表中各个词语对应的近义词。
在将问题转化为逻辑符号时,若逻辑映射列表中不存在问题中的某个词语,可利用近义词列表,将该词语转换为逻辑映射列表中的词语,进而转换为对应的逻辑符号。通过近义词列表,本实施例的方法能够识别更多的问题,扩大了意图识别范围。
虽然,通过预设策略能够很好地匹配语法复杂的句子,但前提是,需要用户提出的问题与预设的规则模板完全匹配,且匹配过程依赖于规则数据库检索,灵活度较低。并且,实际应用中用户会提出符合预设规则以外的问题,这种情况下,显然无法匹配到合适的预设规则,也就无法识别用户意图,以作出合理的回复。
为解决上述问题,本实施例的用户意图识别方法还包括步骤S104、若无法通过预设策略识别用户意图,则通过预先训练的神经网络识别所述用户问题对应的用户意图。
本实施例的用户意图识别方法,预先设置好了多个预设策略,每个预设策略包括一个意图以及该意图对应的至少一个预设规则。识别意图时,将用户问题与各个预设策略中的预设规则进行匹配,当用户问题与某一预设规则匹配时,该预设规则对应的意图即为用户问题对应的用户意图。由于规则可以根据应用场景的真实需求预先配置,所以,利用规则可以识别句法结构复杂的问题包含的用户意图。但是,规则的设置和维护需要付出大量的精力,且无法涵盖所有可能的问题,因此,本实施的用户意图识别方法,预先训练好用来识别用户意图的神经网络,在无法通过预设的规则识别用户意图时,通过预先训练的神经网络识别用户问题对应的用户意图,训练好的神经网络在识别句法结构简单的问题的意图时,具有较高的识别精度。
与现有技术相比,本实施例的用户意图识别方法,利用规则去匹配及推理句法结构复杂的用户问题包含的用户意图,利用神经网络识别句法结构简单的用户问题包含的用户意图,通过结合规则推理和深度学习两者的优点,使得得到的意图识别结果更准确。此外,本实施例的用户意图识别方法,使得意图识别不再依赖数据库检索,省去了大量数据库创建和维护的工作量。
其中,步骤S104具体包括:通过预先训练的孪生神经网络分别计算数据库中预存的各个标准问题与用户问题的相似度;将与用户问题的相似度最高的标准问题所对应的标准意图作为用户问题对应的用户意图。
其中,孪生神经网络包括两个相同的子网络,每个子网络都包括一个正向LSTM层和一个反向LSTM层,正向LSTM层和反向LSTM层均包含50个隐含节点,子网络的输入为300维。该孪生神经网络的输入为两个句子,将两个句子分别输入两个子网络,然后将两个子网络的输出结果作余弦相似度计算,该孪生神经网络的输出为余弦相似度计算结果,该余弦相似度计算结果表示两个输入之间的相似度。
上述孪生神经网络的训练过程包括步骤S1和步骤S2:
步骤S1、对采集到的问题语料做数据增强处理,得到训练样本。具体包括:标注各个问题语料对应的意图,并根据标记的意图对问题语料进行分组;将同组的问题语料两两组合作为正样本,正样本的标签为“1”,将不同组的问题语料两两组合作为负样本,负样本的标签为“0”。通过对问题语料的数据增强处理,最大限度地利用现有的问题语料扩充样本数据。
步骤S2、利用训练样本训练孪生神经网络。具体包括:对训练样本中的两个问题进行分词处理,通过现有的词向量库将问题中的每个词转化为词向量;将转化为词向量的两个问题同时输入到孪生神经网络中,前向传播得到两个问题的句子向量,然后计算两个句子向量的相似度,若相似度高于阈值,孪生神经网络的输出结果为“1”,若相似度低于阈值,孪生神经网络的输出结果为“0”;接着,根据孪生神经网络的输出结果与输入的训练样本的标签,通过损失函数计算孪生神经网络的损失值,本实施例中采用的损失函数为contrastive loss,这种对比损失函数可以很好地表达成对样本的匹配程度;通过Adam优化算法更新,基于训练样本迭代地更新孪生神经网络的权重参数,以降低孪生神经网络的损失值,得到识别精度更高的模型。
数据库中预先存储有大量的“标准问题-标准意图”对。进行意图识别时,将用户问题与数据库中的一个标准问题同时输入训练好的孪生神经网络,孪生神经网络计算输入的用户问题与标注问题的相似度;若孪生神经网络的输出为“1”,则表示用户问题与该标准问题相似,该标准问题对应的标准意图作为该用户问题的用户意图;若生神经网络的输出为“0”,则表示用户问题与该标准问题不相似,从数据库中获取下一个标准问题进行比对。
当业务人员在使用过程中发现用户有新的意图产生时,只需要提供一些与该意图对应的问题,即可根据业务人员提供的问题和意图自动生成多个“问题-意图对”作为训练样本,对孪生神经网络再次进行训练,训练后的孪生神经网络即可识别新增的意图。因此,本实施例的方法可便捷快速地增加模型识别意图的类别,提高模型识别意图的能力,降低了投入的研发成本。
实施例三
本申请实施例提供了一种用户意图识别装置,如图2所示,该用户意图识别装置20可以包括:
逻辑符号转化模块201,用于将用户问题中的各个词语转化为对应的逻辑符号,以确定用户问题对应的逻辑表达式;
规则匹配模块202,用于将用户问题对应的逻辑表达式与各个预设策略中的预设规则进行匹配,确定预设规则中与用户问题匹配的目标规则,目标规则包含逻辑表达式中的所有逻辑符号,每个预设策略包括一个意图以及该意图对应的至少一个预设规则;
意图识别模块203,用于将目标规则对应的意图作为用户问题对应的用户意图。。
本实施例的用户意图识别装置,预先设置了识别意图的策略,通过将用户问题转化为机器能够识别的逻辑表达式,以便将用户问题与预设策略中的预设规则进行匹配,以找到用户问题对应的规则,最终确定用户问题对应的用户意图,且每个预设策略包含多条规则,以便尽可能地涵盖某一意图下的多种提问方式,以提高了意图识别的准确度。
进一步地,逻辑符号转化模块201具体用于:根据预设的逻辑映射列表将用户问题中的各个词语转化为对应的逻辑符号,以确定用户问题对应的逻辑表达式。
本实施例的装置,通过预设的逻辑映射列表,可以更快速地将用户问题中的各个词语转化为逻辑符号。
进一步地,意图识别模块203还用于:若匹配到的目标规则仅对应一个预设策略,则将匹配到的目标规则对应的预设策略的意图作为所述用户问题对应的用户意图。
进一步地,意图识别模块203还用于:匹配到的目标规则对应多个预设策略,则将用户问题输入预先训练的意图识别模型,确定用户问题在各个意图类别上的概率分布;将匹配到的目标规则对应多个预设策略的意图作为候选意图,依据概率分布,将概率值最高的候选意图作为用户问题对应的用户意图。
当预设的规则数量增加到一定程度时,容易产生意图冲突,即出现匹配到多个规则的情况。为了解决上述情况,本实施例中,基于机器学习中线性分类方法,预先训练了一个的意图识别模型,通过意图识别模型从匹配到的多个意图中选择一个概率值最高的意图,作为用户问题对应的用户意图,解决了因匹配到多个规则导致的意图识别冲突问题。
进一步地,本实施例的用户意图识别装置20还包括近义词转换模块204,该近义词转换模块204用于:根据预设的近义词列表,将用户问题中未出现在逻辑映射列表中的词语替换为逻辑映射列表中的词语,近义词列表中包括逻辑映射列表中各个词语对应的近义词。
在将问题转化为逻辑符号时,若逻辑映射列表中不存在问题中的某个词语,可利用近义词列表,将该词语进行转换为逻辑映射列表中的词语,进而转换为对应的逻辑符号。通过预设的近义词列表,本实施例的装置能够识别更多的问题,扩大意图识别范围。
本实施例的用户意图识别装置20还包括模型识别模块205,该模型识别模块205用于:若无法通过预设策略识别用户意图,则通过预先训练的神经网络识别所述用户问题对应的用户意图。
本实施例的用户意图识别装置20,利用规则去匹配及推理句法结构复杂的用户问题包含的用户意图,利用神经网络识别句法结构简单的用户问题包含的用户意图,通过结合规则推理和深度学习两者的优点,使得得到的意图识别结果更准确。此外,本实施例的用户意图识别装置20,使得意图识别不再依赖数据库检索,省去了大量数据库创建和维护的工作量。
进一步地,模型识别模块205具体用于:通过预先训练的孪生神经网络分别计算数据库中预存的各个标准问题与用户问题的相似度;将与用户问题的相似度最高的标准问题所对应的标准意图作为用户问题对应的用户意图。
本实施例的装置,可便捷快速地增加模型识别意图的类别,提高模型识别意图的能力,降低了投入的研发成本。
本实施的用户意图识别装置采用了与实施例一、二的用户意图识别方法相同的发明构思,能够取得相同的技术效果,在此不再赘述。
实施例四
本申请实施例提供了一种用户意图识别终端,如图4所示,用户意图识别终端40包括:处理器401和存储器403。其中,处理器401和存储器403相连,如通过总线402相连。可选地,用户意图识别终端40还可以包括收发器404。需要说明的是,实际应用中收发器404不限于一个,该用户意图识别终端40的结构并不构成对本申请实施例的限定。
其中,处理器401应用于本申请实施例中,用于实现图2所示的规则匹配模块、模型识别模块的功能。收发器404包括接收机和发射机。
处理器401可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器401也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线402可包括一通路,在上述组件之间传送信息。总线402可以是PCI总线或EISA总线等。总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器403可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选地,存储器403用于存储执行本申请方案的应用程序代码,并由处理器401来控制执行。处理器401用于执行存储器403中存储的应用程序代码,以实现图2所示实施例提供的用户意图识别装置的动作。
与现有技术相比,本申请实施例提供的用户意图识别终端,预先设置了识别意图的策略,通过将用户问题转化为机器能够识别的逻辑表达式,以便将用户问题与预设策略中的预设规则进行匹配,以找到用户问题对应的规则,最终确定用户问题对应的用户意图,且每个预设策略包含多条规则,以便尽可能地涵盖某一意图下的多种提问方式,以提高了意图识别的准确度。
可选地,处理器401用于执行存储器403中存储的应用程序代码,以实现图3所示实施例提供的用户意图识别装置的动作,在此不再赘述。
实施例五
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现实施例一所示的方法。
本申请实施例提供了一种计算机可读存储介质,与现有技术相比,预先设置了识别意图的策略,通过将用户问题转化为机器能够识别的逻辑表达式,以便将用户问题与预设策略中的预设规则进行匹配,以找到用户问题对应的规则,最终确定用户问题对应的用户意图,且每个预设策略包含多条规则,以便尽可能地涵盖某一意图下的多种提问方式,以提高了意图识别的准确度。
可选地,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现实施例二、三所示的方法,在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种用户意图识别方法,其特征在于,包括如下步骤:
将用户问题中的各个词语转化为对应的逻辑符号,以确定所述用户问题对应的逻辑表达式;
将所述用户问题对应的逻辑表达式与各个预设策略中的预设规则进行匹配,确定所述预设规则中与所述用户问题匹配的目标规则,所述目标规则包含所述逻辑表达式中的所有逻辑符号,每个预设策略包括一个意图以及该意图对应的至少一个预设规则;
将所述目标规则对应的意图作为所述用户问题对应的用户意图。
2.根据权利要求1所述的方法,其特征在于,所述将匹配到的目标规则对应的意图作为所述用户问题对应的用户意图,包括:
若匹配到的目标规则仅对应一个预设策略,则将匹配到的目标规则对应的预设策略的意图作为所述用户问题对应的用户意图。
3.根据权利要求1所述的方法,其特征在于,所述将匹配到的目标规则对应的意图作为所述用户问题对应的用户意图,包括:
若匹配到的目标规则对应多个预设策略,则将所述用户问题输入预先训练的意图识别模型,确定所述用户问题在各个意图类别上的概率分布;
将匹配到的目标规则对应多个预设策略的意图作为候选意图,依据所述概率分布,将概率值最高的候选意图作为所述用户问题对应的用户意图。
4.根据权利要求1所述的方法,其特征在于,所述将用户问题中的各个词语转化为对应的逻辑符号,包括:
根据预设的逻辑映射列表将用户问题中的各个词语转化为对应的逻辑符号。
5.根据权利要求1所述的方法,其特征在于,所述根据预设的逻辑映射列表将用户问题中的各个词语转化对应的逻辑符号之前,所述方法还包括:
根据预设的近义词列表,将所述用户问题中未出现在所述逻辑映射列表中的词语替换为所述逻辑映射列表中的词语,所述近义词列表中包括所述逻辑映射列表中各个词语对应的近义词。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:若无法通过预设策略识别用户意图,则通过预先训练的神经网络识别所述用户问题对应的用户意图。
7.根据权利要求6所述的方法,其特征在于,所述通过预先训练的神经网络识别所述用户问题对应的用户意图,包括:
通过预先训练的孪生神经网络分别计算数据库中预存的各个标准问题与所述用户问题的相似度;
将与所述用户问题的相似度最高的标准问题所对应的标准意图作为所述用户问题对应的用户意图。
8.一种用户意图识别装置,其特征在于,包括:
逻辑符号转化模块,用于将用户问题中的各个词语转化为对应的逻辑符号,以确定所述用户问题对应的逻辑表达式;
规则匹配模块,用于将所述用户问题对应的逻辑表达式与各个预设策略中的预设规则进行匹配,确定所述预设规则中与所述用户问题匹配的目标规则,所述目标规则包含所述逻辑表达式中的所有逻辑符号,每个预设策略包括一个意图以及该意图对应的至少一个预设规则;
意图识别模块,用于将所述目标规则对应的意图作为所述用户问题对应的用户意图。
9.一种用户意图识别终端,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于:执行根据权利要求1~7中任一项所述的用户意图识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至7中任一项所述的用户意图识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811014931.1A CN109376847A (zh) | 2018-08-31 | 2018-08-31 | 用户意图识别方法、装置、终端及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811014931.1A CN109376847A (zh) | 2018-08-31 | 2018-08-31 | 用户意图识别方法、装置、终端及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109376847A true CN109376847A (zh) | 2019-02-22 |
Family
ID=65404249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811014931.1A Pending CN109376847A (zh) | 2018-08-31 | 2018-08-31 | 用户意图识别方法、装置、终端及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109376847A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119353A (zh) * | 2019-04-18 | 2019-08-13 | 上海蔚来汽车有限公司 | 测试数据生成方法、装置以及控制器和介质 |
CN110334340A (zh) * | 2019-05-06 | 2019-10-15 | 北京泰迪熊移动科技有限公司 | 基于规则融合的语义分析方法、装置以及可读存储介质 |
CN110377911A (zh) * | 2019-07-23 | 2019-10-25 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
CN111177186A (zh) * | 2019-12-20 | 2020-05-19 | 北京淇瑀信息科技有限公司 | 基于问题检索的单句意图识别方法、装置和系统 |
CN111177349A (zh) * | 2019-12-20 | 2020-05-19 | 厦门快商通科技股份有限公司 | 问答匹配方法、装置、设备及存储介质 |
CN111611781A (zh) * | 2020-05-27 | 2020-09-01 | 北京妙医佳健康科技集团有限公司 | 数据标注方法、问答方法、装置及电子设备 |
CN112052953A (zh) * | 2020-07-21 | 2020-12-08 | 清华大学 | 用于神经推理系统的可嵌入级连逻辑系统及其推理方法 |
CN112328748A (zh) * | 2020-11-11 | 2021-02-05 | 上海昌投网络科技有限公司 | 一种用于保险配置意图识别的方法 |
CN112765993A (zh) * | 2021-01-20 | 2021-05-07 | 上海德拓信息技术股份有限公司 | 语义解析方法、系统、设备及可读存储介质 |
CN113205091A (zh) * | 2021-04-30 | 2021-08-03 | 作业帮教育科技(北京)有限公司 | 题目识别方法、装置、设备及介质 |
CN113688323A (zh) * | 2021-09-03 | 2021-11-23 | 支付宝(杭州)信息技术有限公司 | 构建意图触发策略以及意图识别的方法和装置 |
CN113807082A (zh) * | 2020-06-15 | 2021-12-17 | 北京搜狗科技发展有限公司 | 一种目标用户确定方法、装置和用于确定目标用户的装置 |
WO2023029513A1 (zh) * | 2021-08-30 | 2023-03-09 | 康键信息技术(深圳)有限公司 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
WO2023109594A1 (zh) * | 2021-12-17 | 2023-06-22 | 华为技术有限公司 | 一种意图合法性检查方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130103668A1 (en) * | 2011-10-21 | 2013-04-25 | Telcordia Technologies, Inc. | Question conversion for information searching |
US20160364377A1 (en) * | 2015-06-12 | 2016-12-15 | Satyanarayana Krishnamurthy | Language Processing And Knowledge Building System |
CN106776936A (zh) * | 2016-12-01 | 2017-05-31 | 上海智臻智能网络科技股份有限公司 | 智能交互方法和系统 |
CN106919542A (zh) * | 2015-12-24 | 2017-07-04 | 北京国双科技有限公司 | 规则匹配方法及装置 |
CN107256258A (zh) * | 2017-06-12 | 2017-10-17 | 上海智臻智能网络科技股份有限公司 | 语义表达式生成方法及装置 |
CN108170739A (zh) * | 2017-12-18 | 2018-06-15 | 深圳前海微众银行股份有限公司 | 问题匹配方法、终端和计算机可读存储介质 |
CN108446286A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
-
2018
- 2018-08-31 CN CN201811014931.1A patent/CN109376847A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130103668A1 (en) * | 2011-10-21 | 2013-04-25 | Telcordia Technologies, Inc. | Question conversion for information searching |
US20160364377A1 (en) * | 2015-06-12 | 2016-12-15 | Satyanarayana Krishnamurthy | Language Processing And Knowledge Building System |
CN106919542A (zh) * | 2015-12-24 | 2017-07-04 | 北京国双科技有限公司 | 规则匹配方法及装置 |
CN106776936A (zh) * | 2016-12-01 | 2017-05-31 | 上海智臻智能网络科技股份有限公司 | 智能交互方法和系统 |
CN108446286A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
CN107256258A (zh) * | 2017-06-12 | 2017-10-17 | 上海智臻智能网络科技股份有限公司 | 语义表达式生成方法及装置 |
CN108170739A (zh) * | 2017-12-18 | 2018-06-15 | 深圳前海微众银行股份有限公司 | 问题匹配方法、终端和计算机可读存储介质 |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119353B (zh) * | 2019-04-18 | 2023-10-10 | 上海蔚来汽车有限公司 | 测试数据生成方法、装置以及控制器和介质 |
CN110119353A (zh) * | 2019-04-18 | 2019-08-13 | 上海蔚来汽车有限公司 | 测试数据生成方法、装置以及控制器和介质 |
CN110334340A (zh) * | 2019-05-06 | 2019-10-15 | 北京泰迪熊移动科技有限公司 | 基于规则融合的语义分析方法、装置以及可读存储介质 |
CN110334340B (zh) * | 2019-05-06 | 2021-08-03 | 北京泰迪熊移动科技有限公司 | 基于规则融合的语义分析方法、装置以及可读存储介质 |
CN110377911B (zh) * | 2019-07-23 | 2023-07-21 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
CN110377911A (zh) * | 2019-07-23 | 2019-10-25 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
CN111177186A (zh) * | 2019-12-20 | 2020-05-19 | 北京淇瑀信息科技有限公司 | 基于问题检索的单句意图识别方法、装置和系统 |
CN111177349A (zh) * | 2019-12-20 | 2020-05-19 | 厦门快商通科技股份有限公司 | 问答匹配方法、装置、设备及存储介质 |
CN111177349B (zh) * | 2019-12-20 | 2022-05-17 | 厦门快商通科技股份有限公司 | 问答匹配方法、装置、设备及存储介质 |
CN111177186B (zh) * | 2019-12-20 | 2024-04-23 | 北京淇瑀信息科技有限公司 | 基于问题检索的单句意图识别方法、装置和系统 |
CN111611781A (zh) * | 2020-05-27 | 2020-09-01 | 北京妙医佳健康科技集团有限公司 | 数据标注方法、问答方法、装置及电子设备 |
CN111611781B (zh) * | 2020-05-27 | 2023-08-18 | 北京妙医佳健康科技集团有限公司 | 数据标注方法、问答方法、装置及电子设备 |
CN113807082A (zh) * | 2020-06-15 | 2021-12-17 | 北京搜狗科技发展有限公司 | 一种目标用户确定方法、装置和用于确定目标用户的装置 |
CN112052953B (zh) * | 2020-07-21 | 2022-09-09 | 清华大学 | 用于神经推理系统的可嵌入级连逻辑系统及其推理方法 |
CN112052953A (zh) * | 2020-07-21 | 2020-12-08 | 清华大学 | 用于神经推理系统的可嵌入级连逻辑系统及其推理方法 |
CN112328748A (zh) * | 2020-11-11 | 2021-02-05 | 上海昌投网络科技有限公司 | 一种用于保险配置意图识别的方法 |
CN112765993A (zh) * | 2021-01-20 | 2021-05-07 | 上海德拓信息技术股份有限公司 | 语义解析方法、系统、设备及可读存储介质 |
CN113205091A (zh) * | 2021-04-30 | 2021-08-03 | 作业帮教育科技(北京)有限公司 | 题目识别方法、装置、设备及介质 |
WO2023029513A1 (zh) * | 2021-08-30 | 2023-03-09 | 康键信息技术(深圳)有限公司 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
CN113688323A (zh) * | 2021-09-03 | 2021-11-23 | 支付宝(杭州)信息技术有限公司 | 构建意图触发策略以及意图识别的方法和装置 |
WO2023109594A1 (zh) * | 2021-12-17 | 2023-06-22 | 华为技术有限公司 | 一种意图合法性检查方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109376847A (zh) | 用户意图识别方法、装置、终端及计算机可读存储介质 | |
CN111581395B (zh) | 一种基于深度学习的模型融合三元组表示学习系统及方法 | |
CN109635117A (zh) | 一种基于知识图谱识别用户意图方法及装置 | |
CN107766511A (zh) | 智能问答方法、终端及存储介质 | |
CN110795913B (zh) | 一种文本编码方法、装置、存储介质及终端 | |
CN110222162A (zh) | 一种基于自然语言处理和知识图谱的智能问答方法 | |
CN110825827B (zh) | 一种实体关系识别模型训练、实体关系识别方法及装置 | |
CN109857846B (zh) | 用户问句与知识点的匹配方法和装置 | |
CN111353033B (zh) | 一种训练文本相似度模型的方法和系统 | |
CN111897944B (zh) | 基于语义空间共享的知识图谱问答系统 | |
CN109145168A (zh) | 一种专家服务机器人云平台 | |
CN113408284A (zh) | 文本处理模型的训练方法、装置、电子设备及存储介质 | |
CN109684354A (zh) | 数据查询方法和装置 | |
CN115526236A (zh) | 一种基于多模态对比学习的文本网络图分类方法 | |
CN111368544A (zh) | 命名实体识别方法及装置 | |
CN110032736A (zh) | 一种文本分析方法、装置及存储介质 | |
CN116010581A (zh) | 一种基于电网隐患排查场景的知识图谱问答方法及系统 | |
Ye et al. | Automated conversion of engineering rules: Towards flexible manufacturing collaboration | |
CN112836030B (zh) | 一种智能对话系统及方法 | |
CN117112767A (zh) | 问答结果生成方法和商业查询大模型训练方法、及装置 | |
CN109902215A (zh) | 一种交易匹配的方法及系统 | |
CN117009478A (zh) | 一种基于软件知识图谱问答问句解析过程的算法融合方法 | |
CN115905187B (zh) | 一种面向云计算工程技术人员认证的智能化命题系统 | |
CN114116975A (zh) | 一种多意图识别方法及系统 | |
CN108415896A (zh) | 深度学习模型训练方法、分词方法、训练系统和分词系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40002603 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190222 |