CN108304466A - 一种用户意图识别方法以及用户意图识别系统 - Google Patents
一种用户意图识别方法以及用户意图识别系统 Download PDFInfo
- Publication number
- CN108304466A CN108304466A CN201711441613.9A CN201711441613A CN108304466A CN 108304466 A CN108304466 A CN 108304466A CN 201711441613 A CN201711441613 A CN 201711441613A CN 108304466 A CN108304466 A CN 108304466A
- Authority
- CN
- China
- Prior art keywords
- user view
- user
- parameter
- word
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及用户意图识别方法以及系统。该方法包括:关键实体识别步骤,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及用户意图判断步骤,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系,并且仅在存在所述依存关系的情况下输出用户意图识别结果。根据本发明,能够更准确和全面地识别用户意图。
Description
技术领域
本发明涉及数据处理分析技术,具体涉及一种用户意图识别方法以及用户意图识别系统。
背景技术
现阶段有关对话式语义理解技术的实现方案主要分为面向泛用场景和面向特定场景。前者主要以知识图谱为数据基础,针对用户文字形式的检索需求,通过命名实体识别、实体链接等自然语言处理技术获取意图参数,辅以意图识别关键词匹配(什么、哪、怎么等)的方式进行知识图谱检索并反馈相应答案;后者则以专业知识库为数据基础,通过规则模板的形式扩写已有知识点,针对用户业务意图进行模式匹配,辅以业务关键词匹配的方式进行专业知识库检索并反馈相应答案。
无论是泛用场景或是特定场景的对话式语义理解技术,都有其缺陷。面向泛用场景的对话式人工智能,可以同用户进行闲聊,但无法理解用户的业务需求,往往将用户对话信息诉诸网络获取答案;另一方面,面向特定场景虽然可以应付业务需求,却又需要大量人力分析用户对话特征以构建规则模板,针对多业务场景所需要的工作量呈直线上升,模型的可延展性并不好。
发明内容
鉴于所述问题,本发明旨在提出一种能够以轻量级的解决方案提供一种能够对于用户对话进行准确分析的用户意图识别方法以及用户意图识别系统。
本发明的用户意图识别方法,其特征在于,包括下述步骤:
关键实体识别步骤,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及
用户意图判断步骤,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间是否存在依存关系,并且仅在存在依存关系的情况下输出用户意图识别结果。
可选地,在所述用户意图判断步骤之后进一步包括:
意图参数补全步骤,判断所述用户意图判断步骤中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行意图参数补全动作。
可选地,所述关键实体识别步骤包括:
对用户对话文字作为自然语言处理方法以词为单位进行分词、词性标注和命名实体识别;
根据词性标注和命名实体识别结果得到用户意图参数候选;以及
将用户意图参数标准化。
可选地,所述用户意图判断步骤包括:
将所述用户对话文字以句为单位进行依存句法分析并得到依存句法分析结果;
根据预设的用户意图关键词候选集,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词匹配结果;以及
根据所述依存句法分析结果和所述意图关键词匹配结果,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系;以及
若两者之间存在依存关系,则输出用户意图识别结果。
可选地,所述意图参数补全步骤包括:
判断所述用户意图判断步骤中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行下述步骤;
根据预设的介词词表,在所述用户对话中检索是否出现相关介词;
根据所述用户意图判断步骤得到的所述依存语法分析结果,分析所述介词所对应的宾语并作为补全意图参数的可选项。
可选地,所述自然语言处理技术通过LTP工具包、或者Stanford Parser工具包实现,所述依存语法分析通过LTP工具包、或者Stanford Parser工具包实现,
所述深度学习方法通过Wordvec工具包、或者GloVe工具包实现。
本发明的用户意图识别系统,其特征在于,包括:
关键实体识别模块,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及
用户意图判断模块,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别模块获得的所述用户意图参数候选之间是否存在依存关系,并且仅在存在依存关系的情况下输出用户意图识别结果。
可选地,进一步包括:
意图参数补全模块,判断所述用户意图判断模块中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行意图参数补全动作。
可选地,所述关键实体识别模块包括:
命名实体识别子模块,对用户对话文字作为自然语言处理方法以词为单位进行分词、词性标注和命名实体识别;
意图参数获取子模块,根据词性标注和命名实体识别结果得到用户意图参数候选;以及
标准化子模块,将用户意图参数候选标准化。
可选地,所述用户意图判断模块包括:
依存句法分析子模块,将所述用户对话文字以句为单位进行依存句法分析并得到依存句法分析结果;
模糊匹配子模块,根据预设的用户意图关键词候选集,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词匹配结果;以及
第一判断子模块,根据所述依存句法分析结果和所述意图关键词候选匹配结果,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系;以及
输出子模块,若两者之间存在依存关系,则输出用户意图识别结果。
可选地,所述意图参数补全模块包括:
第二判断子模块,判断所述用户意图判断模块中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行下述步骤;
检索子模块,根据预设的介词词表,在所述用户对话中检索是否出现相关介词;
补全意图参数子模块,根据所述用户意图判断模块得到的所述依存语法分析结果,分析所述介词所对应的宾语并作为补全意图参数的可选项。
可选地,所述自然语言处理技术通过LTP工具包、或者Stanford Parser工具包实现,所述依存语法分析通过LTP工具包、或者Stanford Parser工具包实现,
所述深度学习方法通过Wordvec工具包、或者GloVe工具包实现。
本发明的计算机可读介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现上述的用户意图识别方法。
本发明的计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述的用户意图识别方法的步骤。
如上所述,根据本发明本方案的用户意图识别方法以及用户意图识别系统,能够解决现有方法不能高效应对不同用户针对同一业务需求的不同问询方式,通过关键实体识别和依存句法分析能够更加准确、更加全面地识别用户意图。
附图说明
图1是表示本发明的用户意图识别方法的示意图。
图2是表示本发明的一个具体实施方式的用户意图识别方法的流程图。
图3是表示本发明的用户意图识别系统的示意图。
如上所述,根据本发明本方案的用户意图识别方法以及用户意图识别系统,能够解决现有方法不能高效应对不同用户针对同一业务需求的不同问询方式,通过关键实体识别和依存句法分析能够更加准确、更加全面地识别用户意图。
具体实施方式
下面介绍的是本发明的多个实施例中的一些,旨在提供对本发明的基本了解。并不旨在确认本发明的关键或决定性的要素或限定所要保护的范围。
本发明针对现有的对话式语义理解技术无法兼顾面向特定场景和模型化分析流程的问题,即解决现有方法不能高效应对不同用户针对同一业务需求的不同问询方式,有待人工构建冗长的规则模板的问题,提出一种基于关键实体识别和依存句法分析的用户意图识别方法。
为实现上述目的,本发明的主要技术构思在于,首先,将命名实体识别同关键词模糊匹配相结合,以提升意图参数的识别率,其次基于依存句法分析技术获得命名实体和关键词之间的依存关系,将其作为用户意图判断的依据。
在此基础上,作为更优选的方式,在识别出意图的基础上,通过命名实体和介词间依存关系获得未补全的意图参数,将上述意图和意图参数反馈给业务处理程序,实现用户意图的语义理解。
图1是表示本发明的用户意图识别方法的示意图。
如图1所示,如图1所示本发明的一实施方式的用户意图识别方包括下述步骤:
关键实体识别步骤S100:对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及
用户意图判断步骤S200:对于用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断意图关键词与关键实体识别步骤S100获得的用户意图参数候选之间的依存关系,并且仅在存在所述依存关系的情况下输出用户意图识别结果;以及
意图参数补全步骤S300:判断用户意图判断步骤S200中输出的用户意图识别结果中意图参数是否已全,若参数已全,则输出用户意图识别结果,否则进行意图参数补全动作。
这里,利用关键实体识别步骤S100以及用户意图判断步骤S200就能够完成用户意图识别,因此,意图参数补全步骤S300并不是必须的步骤,意图参数补全步骤S300是为了更全面、准确地识别用户意图而增加的优选步骤。
接着,对于本发明的一个具体实施方式的用户意图识别方法进行说明。
图2是表示本发明的一个具体实施方式的用户意图识别方法的流程图。
本发明的一个具体实施方式的用户意图识别方法包括以下步骤:
(一)步骤一“关键实体识别”,具体包括:
步骤1.1将用户对话文字以词为单位进行分词、词性标注和命名实体识别(步骤S10),其中,上述自然语言处理方法可以使用LTP工具包实现;
步骤1.2根据步骤1.1中词性标注和命名实体识别结果,获得对应的用户意图参数候选(步骤S11),其中,用户意图参数候选包括但不限于国家(country)、地区(location)、币种(currency)、时间(time)、金钱(money)、疑问词(ques_tag);以及
步骤1.3将步骤1.2输出的用户意图参数候选标准化(步骤S12)。
(二)步骤二“用户意图判断”,具体包括:
步骤2.1将用户对话文字以句为单位进行依存句法分析(步骤S13),其中,依存句法分析可以使用LTP工具包实现;
步骤2.2根据预设的用户意图关键词候选集,使用模糊匹配的方法,获得对应的意图关键词,其中,用户意图关键词候选集是由所需识别的用户意图人工生成的动词集合,关键词模糊匹配使用到word2vec深度学习模型训练得到的词向量文件,匹配的规则为cosine相似度(步骤S14);
步骤2.3根据步骤2.1中的依存句法分析结果和步骤2.2中的关键词匹配结果,判断步骤一所识别出的用户意图参数,是否和关键词具有依存关系(步骤S15);以及
步骤2.4根据步骤2.3岁所具有的依存关系,给出用户意图识别结果,若没有依存关系,则得到无用户意图(步骤S16),若有依存关系,则进入步骤三。
(三)步骤三“意图参数补全”具体包括:
步骤3.1根据步骤二所识别出的用户意图,判断意图参数是否完整(步骤S17),若完整则无需补全,则输出用户意图(步骤S18),若不完整则进入步骤3.2即补充参数(步骤S20);
步骤3.2根据事先整理出的介词词表,在用户对话文字中检索是否出现相关介词(步骤S21);
步骤3.3通过步骤2.1中的依存句法分析结果,分析步骤3.2所得介词对应宾语,作为补全意图参数的可选项并输出用户意图(步骤S18);
至此,从步骤一到步骤三,完成了一种基于关键实体识别和依存句法分析的用户意图识别方法。
以上对于本发明的用户意图识别方法进行了介绍,接着,对于本发明的用户意图识别方法的几个实施例进行一一说明。实施例是叙述了基于本发明的用户意图识别方法而在一台PC机上运行基于关键实体识别和依存句法分析的用户意图识别方法的流程,具体对应方案内容中的上述步骤一到步骤三。
实施例1
本实施例主要涉及转账场景,例如,“给我老爸转一百块钱”。
(一)步骤一:关键实体识别,实现步骤如下:
1.1分词、词性标注、命名实体识别:
给/p我/r老爸/n转/v一百/m块/q钱/n,命名实体集合为空。
1.2获得意图参数候选:
由分词和词性标注结果可知,一百块钱为数词m+量词q+名词n组合,且该名词“钱”归于金钱意图参数,则可置money=一百块钱。
1.3意图参数候选标准化:
鉴于命名实体集合中并未出现国家、币种等意图参数,则默认money的币种为人民币,置money=100人民币。
(二)步骤二:用户意图判断,实现步骤如下:
2.1依存句法分析:
0:给/p 3:ADV 1:我/r 2:ATT 2:老爸/n 0:POB 3:转/v-1:HED 4:一百/m 5:ATT 5:块/q 6:ATT 6:钱/n 3:VOB。
2.2获得意图关键词:
将整理出的转账意图关键词(例如“转账”)同用户对话文字的分词结果进行cosine相似度比较,计算可得cosine(转,转账)=1.89,符合相似要求,将“转”作为意图关键词。
2.3依存关系判断:
由依存句法分析的结果可知,意图参数money和意图关键词“转”之间存在依存关系(转,钱,VOB),可以得出用户意图为“转账”。
(三)步骤三:意图参数补全,实现步骤如下:
3.1鉴于转账意图需要转账金额和转账对象两个参数,而意图参数仅有money一项,则需要进行意图参数补全。
3.2关键介词检索:
在整理出的介词词表同用户对话文字的分词结果进行比较,得到关键介词“给”。
3.3获得意图参数补全可选项
由依存句法分析的结果可知,名词“老爸”和关键介词“给”之间存在依存关系(给,老爸,POB),可以将“老爸”作为转账对象参数的可选项。
至此,用户意图识别完毕,可知用户意图为“转账”,转账金额为“100人民币”,转账对象为“老爸”。
实施例2
实施例2涉及汇率查询业务场景:用户提出需求“我在加拿大取了1000加元,今天比昨天扣得多,我想查一下汇率?”。
(一)步骤一:关键实体识别,实现步骤如下:
1.1分词、词性标注、命名实体识别:
我/r在/p 2:加拿大/ns取/v了/u 1000/m块/q,/wp今天/nt比/p昨天/nt扣/v得/u多/a,/wp我/r想/v查/v一下/m汇率/n?/wp;
命名实体集合为{加拿大/S-Ns}。
1.2获得意图参数候选:
由分词和词性标注结果可知,1000块为数词m+量词q组合,且该量词“块”归于金钱意图参数,则可置money=1000块;
“今天”和“昨天”的词性标注为nt,归于时间意图参数,可置time=[今天,昨天];
“汇率”作为汇率查询的意图参数保存;
命名实体集合为{加拿大/S-Ns},归于国家意图参数,可置country=加拿大。
1.3意图参数候选标准化:
鉴于命名实体集合中出现国家意图参数,且金额意图参数并无具体币种类型,则将money的币种视为加元,置money=1000加元;
将time中的“今天”、“昨天”转换为对应日期。
(二)步骤二:用户意图判断,实现步骤如下:
2.1依存句法分析:
0:我/r 3:SBV 1:在/p 3:ADV 2:加拿大/ns 1:POB 3:取/v-1:HED 4:了/u 3:RAD 5:1000/m 6:ATT 6:加元/q 3:VOB 7:,/wp 3:WP 8:今天/nt 11:ADV 9:比/p 11:ADV 10:昨天/nt 9:POB 11:扣/v 3:COO 12:得/u 11:RAD 13:多/a 11:CMP 14:,/wp 11:WP 15:我/r16:SBV 16:想/v 11:COO 17:查/v 16:VOB 18:一下/m 17:CMP 19:汇率/n 17:VOB 20:?/wp 3:WP。
2.2获得意图关键词:
将整理出的汇率查询意图关键词(例如“查询”)同用户对话文字的分词结果进行cosine相似度比较,计算可得cosine(查,查询)=2.92,符合相似要求,将“查”作为意图关键词。
2.3依存关系判断:
由依存句法分析的结果可知,意图参数“汇率”和意图关键词“查”之间存在依存关系(查,汇率,VOB),可以得出用户意图为“汇率查询”。
(三)步骤三:意图参数补全,实现步骤如下:
3.1鉴于汇率查询需要源金额、目标金额、时间三个参数,而意图参数有money和time两项,则需要进行意图参数补全。
3.2关键介词检索:
在整理出的介词词表同用户对话文字的分词结果进行比较,没有获得关键介词。
3.3获得意图参数补全可选项:
鉴于关键介词为空,则对意图参数进行默认补全,置目标金额为人民币;
至此,用户意图识别完毕,可知用户意图为“汇率查询”,源金额为“1000加元”、目标金额为“人民币”、时间为“今天”,“昨天”对应日期。
实施例3
实施例3涉及优惠活动介绍业务场景:用户提出需求“银联卡在韩国首尔机场和仁川机场有什么优惠活动?”。
(一)步骤一:关键实体识别,实现步骤如下:
1.1分词、词性标注、命名实体识别:
银联卡/n在/p韩国/ns首尔/ns机场/n和/c仁川/ns机场/n有/v什么/r优惠/v活动/v?/wp;
命名实体集合为空{韩国首尔机场/Ns,仁川机场/Ns}。
1.2获得意图参数候选:
由分词和词性标注结果可知,“什么”作为疑问词,可置ques_tag=什么;
“优惠”“活动”作为优惠活动介绍的意图参数保存;
命名实体集合为{韩国首尔机场/Ns,仁川机场/Ns},归于地区意图参数,可置location=[韩国首尔机场,仁川机场];
1.3意图参数候选标准化:
鉴于意图参数均较为规整,故无需进行标准化。
(二)步骤二:用户意图判断,实现步骤如下:
2.1依存句法分析:
0:银联卡/n 8:SBV 1:在/p 8:ADV 2:韩国/ns 3:ATT 3:首尔/ns 4:ATT 4:机场/n 1:POB 5:和/c 7:LAD 6:仁川/ns 7:ATT 7:机场/n 4:COO 8:有/v-1:HED 9:什么/r 11:ATT10:优惠/v 11:ATT 11:活动/v 8:VOB 12:?/wp 8:WP。
2.2获得意图关键词:
将整理出的优惠活动介绍意图关键词(例如“有”)同用户对话文字的分词结果进行比较,将“有”作为意图关键词。
2.3依存关系判断:
由依存句法分析的结果可知,意图参数“活动”和意图关键词“有”之间存在依存关系(有,活动,VOB),可以得出用户意图为“优惠活动介绍”。
(三)步骤三:意图参数补全,实现步骤如下:
鉴于优惠活动介绍需要地点、时间、商户、询问类型四个参数,而意图参数仅有location和ques_tag两项,剩余项未出现在用户对话文字中,则对意图参数进行默认补全,置时间和商户参数为空;
至此,用户意图识别完毕,可知用户意图为“优惠活动介绍”,地点为“韩国首尔机场”、“仁川机场”,时间为空,商户为空,疑问词为“什么”。
变化例
其中,分词、词性标注、命名实体识别属于自然语言处理方法范畴,可以使用诸如LTP、StanfordParser等工具包实现。
其中,训练词向量的方法,可以使用诸如Wordvec、GloVe等工具包实现。
以上对于本发明的用户意图识别方法进行了说明。接着,对于本发明的用户意图识别系统进行说明。
图3是表示本发明的用户意图识别系统的示意图。
如图3所示,本发明的用户意图识别系统包括:
关键实体识别模块100,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;
用户意图判断模块200,对于所述用户对话文字进行依存语法分析并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别模块获得的所述用户意图参数候选之间的依存关系,并且仅在存在所述依存关系的情况下输出用户意图识别结果,其中,用户意图关键词候选集是由所需识别的用户意图人工生成的动词集合;以及
意图参数补全模块300,判断所述用户意图判断模块中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行意图参数补全动作。
其中,利用关键实体识别模块100以及用户意图判断模块200就能够完成用户意图识别,因此,意图参数补全模块300并不是必须的步骤,意图参数补全模块300是为了更全面、准确地识别用户意图而增加的优选模块。
关键实体识别模块100包括:
命名实体识别子模块110,对用户对话文字作为自然语言处理方法以词为单位进行分词、词性标注和命名实体识别;
意图参数获取子模块120,根据词性标注和命名实体识别结果得到用户意图参数候选;以及
标准化子模块130,将用户意图参数候选标准化。
其中,用户意图判断模块200包括:
依存句法分析子模块210,将所述用户对话文字以句为单位进行依存句法分析并得到依存句法分析结果;
模糊匹配子模块220,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词匹配结果;
第一判断子模块230,根据所述依存句法分析结果和所述意图关键词匹配结果,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系;以及
输出子模块240,若两者之间存在依存关系,则输出用户意图识别结果。
意图参数补全模块300包括:
第二判断子模块310,判断所述用户意图判断模块中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行下述步骤;
检索子模块320,根据预设的介词词表,在所述用户对话中检索是否出现相关介词;
补全意图参数子模块330,根据所述用户意图判断模块得到的所述依存语法分析结果,分析所述介词所对应的宾语并作为补全意图参数的可选项。
如上所述,根据本发明本方案的用户意图识别方法以及用户意图识别系统,能够解决现有方法不能高效应对不同用户针对同一业务需求的不同问询方式,通过关键实体识别和依存句法分析能够更加准确、更加全面地识别用户意图。
进一步,本发明还提供一种计算机可读介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现上述用户意图识别方法。
再者,本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述用户意图识别方法的步骤。
以上例子主要说明了本发明的用户意图识别方法以及用户意图识别系统。尽管只对其中一些本发明的具体实施方式进行了描述,但是本领域普通技术人员应当了解,本发明可以在不偏离其主旨与范围内以许多其他的形式实施。因此,所展示的例子与实施方式被视为示意性的而非限制性的,在不脱离如所附各权利要求所定义的本发明精神及范围的情况下,本发明可能涵盖各种的修改与替换。
Claims (14)
1.一种用户意图识别方法,其特征在于,包括下述步骤:
关键实体识别步骤,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及
用户意图判断步骤,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系,并且仅在存在所述依存关系的情况下输出用户意图识别结果。
2.如权利要求1所述的用户意图识别方法,其特征在于,
在所述用户意图判断步骤之后进一步包括:
意图参数补全步骤,判断所述用户意图判断步骤中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行意图参数补全动作。
3.如权利要求1或2所述的用户意图识别方法,其特征在于,
所述关键实体识别步骤包括:
对用户对话文字作为自然语言处理方法以词为单位进行分词、词性标注和命名实体识别;
根据词性标注和命名实体识别结果得到用户意图参数候选;以及
将用户意图参数标准化。
4.如权利要求1或2所述的用户意图识别方法,其特征在于,
所述用户意图判断步骤包括:
将所述用户对话文字以句为单位进行依存句法分析并得到依存句法分析结果;
根据预设的用户意图关键词候选集,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词匹配结果;以及
根据所述依存句法分析结果和所述意图关键词匹配结果,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系;以及
若两者之间存在依存关系,则输出用户意图识别结果。
5.如权利要求3所述的用户意图识别方法,其特征在于,
所述意图参数补全步骤包括:
判断所述用户意图判断步骤中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行下述步骤;
根据预设的介词词表,在所述用户对话中检索是否出现相关介词;
根据所述用户意图判断步骤得到的所述依存语法分析结果,分析所述介词所对应的宾语并作为补全意图参数的可选项。
6.如权利要求3所述的用户意图识别方法,其特征在于,
所述自然语言处理技术通过LTP工具包、或者Stanford Parser工具包实现,
所述依存语法分析通过LTP工具包、或者Stanford Parser工具包实现,
所述深度学习方法通过Wordvec工具包、或者GloVe工具包实现。
7.一种用户意图识别系统,其特征在于,包括:
关键实体识别模块,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及
用户意图判断模块,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别模块获得的所述用户意图参数候选之间的依存关系,并且仅在存在所述依存关系的情况下输出用户意图识别结果。
8.如权利要求7所述的用户意图识别系统,其特征在于,进一步包括:
意图参数补全模块,判断所述用户意图判断模块中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行意图参数补全动作。
9.如权利要求7或8所述的用户意图识别方法,其特征在于,
所述关键实体识别模块包括:
命名实体识别子模块,对用户对话文字作为自然语言处理方法以词为单位进行分词、词性标注和命名实体识别;
意图参数获取子模块,根据词性标注和命名实体识别结果得到用户意图参数候选;以及
标准化子模块,将用户意图参数候选标准化。
10.如权利要求7或8所述的用户意图识别系统,其特征在于,
所述用户意图判断模块包括:
依存句法分析子模块,将所述用户对话文字以句为单位进行依存句法分析并得到依存句法分析结果;
模糊匹配子模块,根据预设的用户意图关键词候选集,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词匹配结果;以及
第一判断子模块,根据所述依存句法分析结果和所述意图关键词候选匹配结果,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系;以及
输出子模块,若两者之间存在依存关系,则输出用户意图识别结果。
11.如权利要求10所述的用户意图识别方法,其特征在于,
所述意图参数补全模块包括:
第二判断子模块,判断所述用户意图判断模块中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行下述步骤;
检索子模块,根据预设的介词词表,在所述用户对话中检索是否出现相关介词;
补全意图参数子模块,根据所述用户意图判断模块得到的所述依存语法分析结果,分析所述介词所对应的宾语并作为补全意图参数的可选项。
12.如权利要求10所述的用户意图识别方法,其特征在于,
所述自然语言处理技术通过LTP工具包、或者Stanford Parser工具包实现,
所述依存语法分析通过LTP工具包、或者Stanford Parser工具包实现,
所述深度学习方法通过Wordvec工具包、或者GloVe工具包实现。
13.一种计算机可读介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1~6中任意一项所述的用户意图识别方法。
14.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~6中任意一项所述的用户意图识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711441613.9A CN108304466B (zh) | 2017-12-27 | 2017-12-27 | 一种用户意图识别方法以及用户意图识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711441613.9A CN108304466B (zh) | 2017-12-27 | 2017-12-27 | 一种用户意图识别方法以及用户意图识别系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108304466A true CN108304466A (zh) | 2018-07-20 |
CN108304466B CN108304466B (zh) | 2022-01-11 |
Family
ID=62867510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711441613.9A Active CN108304466B (zh) | 2017-12-27 | 2017-12-27 | 一种用户意图识别方法以及用户意图识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108304466B (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063221A (zh) * | 2018-11-02 | 2018-12-21 | 北京百度网讯科技有限公司 | 基于混合策略的查询意图识别方法和装置 |
CN109214417A (zh) * | 2018-07-25 | 2019-01-15 | 百度在线网络技术(北京)有限公司 | 用户意图的挖掘方法及装置、计算机设备及可读介质 |
CN109543012A (zh) * | 2018-10-25 | 2019-03-29 | 苏宁易购集团股份有限公司 | 一种基于Word2Vec和RNN的用户意图识别方法及装置 |
CN109992651A (zh) * | 2019-03-14 | 2019-07-09 | 广州智语信息科技有限公司 | 一种问题目标特征自动识别和抽取方法 |
CN110069631A (zh) * | 2019-04-08 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN110083284A (zh) * | 2019-05-06 | 2019-08-02 | 三角兽(北京)科技有限公司 | 候选信息处理装置、候选信息显示方法、存储介质及电子设备 |
CN110113492A (zh) * | 2019-05-06 | 2019-08-09 | 三角兽(北京)科技有限公司 | 基于通知信息的信息显示方法及装置 |
CN110334347A (zh) * | 2019-06-27 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 基于自然语言识别的信息处理方法、相关设备及存储介质 |
CN110427611A (zh) * | 2019-06-26 | 2019-11-08 | 深圳追一科技有限公司 | 文本处理方法、装置、设备及存储介质 |
CN110648653A (zh) * | 2019-09-27 | 2020-01-03 | 安徽咪鼠科技有限公司 | 基于智能语音鼠标的字幕实现方法、装置、系统和存储介质 |
CN110765759A (zh) * | 2019-10-21 | 2020-02-07 | 普信恒业科技发展(北京)有限公司 | 意图识别方法及装置 |
CN111737973A (zh) * | 2020-06-29 | 2020-10-02 | 北京明略软件系统有限公司 | 自然语言检索语句解析方法、装置、设备和存储介质 |
CN111783425A (zh) * | 2020-06-28 | 2020-10-16 | 中国平安人寿保险股份有限公司 | 基于句法分析模型的意图识别方法及相关装置 |
WO2020211008A1 (zh) * | 2019-04-17 | 2020-10-22 | 深圳市欢太科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN112035630A (zh) * | 2020-03-27 | 2020-12-04 | 北京来也网络科技有限公司 | 结合rpa和ai的对话交互方法、装置、设备及存储介质 |
CN112396444A (zh) * | 2019-08-15 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 一种智能机器人应答方法及装置 |
CN113128202A (zh) * | 2020-01-10 | 2021-07-16 | 中国科学院软件研究所 | 一种面向物联网服务的智能编排方法和装置 |
CN113205817A (zh) * | 2021-07-06 | 2021-08-03 | 明品云(北京)数据科技有限公司 | 语音语义识别方法、系统、设备及介质 |
CN113407739A (zh) * | 2021-07-14 | 2021-09-17 | 海信视像科技股份有限公司 | 信息标题中概念的确定方法、装置和存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510221A (zh) * | 2009-02-17 | 2009-08-19 | 北京大学 | 一种用于信息检索的查询语句分析方法与系统 |
CN102298635A (zh) * | 2011-09-13 | 2011-12-28 | 苏州大学 | 事件信息融合方法和系统 |
CN102880631A (zh) * | 2012-07-05 | 2013-01-16 | 湖南大学 | 一种基于双层分类模型的中文作者识别方法及其装置 |
US20130262364A1 (en) * | 2010-12-10 | 2013-10-03 | Koninklijke Philips Electronics N.V. | Clinical Documentation Debugging Decision Support |
US20130262104A1 (en) * | 2012-03-28 | 2013-10-03 | Subhash Makhija | Procurement System |
CN104516949A (zh) * | 2014-12-10 | 2015-04-15 | 北京百度网讯科技有限公司 | 网页数据处理方法和装置、查询处理方法及问答系统 |
CN104573028A (zh) * | 2015-01-14 | 2015-04-29 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和系统 |
CN105938495A (zh) * | 2016-04-29 | 2016-09-14 | 乐视控股(北京)有限公司 | 实体关系识别方法及装置 |
CN107391575A (zh) * | 2017-06-20 | 2017-11-24 | 浙江理工大学 | 一种基于词向量模型的隐式特征识别方法 |
CN107491556A (zh) * | 2017-09-04 | 2017-12-19 | 湖北地信科技集团股份有限公司 | 时空全要素语义查询服务系统及其方法 |
-
2017
- 2017-12-27 CN CN201711441613.9A patent/CN108304466B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510221A (zh) * | 2009-02-17 | 2009-08-19 | 北京大学 | 一种用于信息检索的查询语句分析方法与系统 |
US20130262364A1 (en) * | 2010-12-10 | 2013-10-03 | Koninklijke Philips Electronics N.V. | Clinical Documentation Debugging Decision Support |
CN102298635A (zh) * | 2011-09-13 | 2011-12-28 | 苏州大学 | 事件信息融合方法和系统 |
US20130262104A1 (en) * | 2012-03-28 | 2013-10-03 | Subhash Makhija | Procurement System |
CN102880631A (zh) * | 2012-07-05 | 2013-01-16 | 湖南大学 | 一种基于双层分类模型的中文作者识别方法及其装置 |
CN104516949A (zh) * | 2014-12-10 | 2015-04-15 | 北京百度网讯科技有限公司 | 网页数据处理方法和装置、查询处理方法及问答系统 |
CN104573028A (zh) * | 2015-01-14 | 2015-04-29 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和系统 |
CN105938495A (zh) * | 2016-04-29 | 2016-09-14 | 乐视控股(北京)有限公司 | 实体关系识别方法及装置 |
CN107391575A (zh) * | 2017-06-20 | 2017-11-24 | 浙江理工大学 | 一种基于词向量模型的隐式特征识别方法 |
CN107491556A (zh) * | 2017-09-04 | 2017-12-19 | 湖北地信科技集团股份有限公司 | 时空全要素语义查询服务系统及其方法 |
Non-Patent Citations (4)
Title |
---|
LOREDANA CARUCCIO等: "understanding user intent on the web through interaction mining", 《JOURNAL OF VISUAL LANGUAGES AND COMPUTING》 * |
付博等: "基于用户自然标注的微博文本的消费意图识别", 《中文信息学报》 * |
伍大勇等: "融合多类特征的Web查询意图识别", 《模式识别与人工智能》 * |
冶忠林: "智能问答系统的研究与实现", 《中国中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109214417A (zh) * | 2018-07-25 | 2019-01-15 | 百度在线网络技术(北京)有限公司 | 用户意图的挖掘方法及装置、计算机设备及可读介质 |
CN109543012A (zh) * | 2018-10-25 | 2019-03-29 | 苏宁易购集团股份有限公司 | 一种基于Word2Vec和RNN的用户意图识别方法及装置 |
CN109063221A (zh) * | 2018-11-02 | 2018-12-21 | 北京百度网讯科技有限公司 | 基于混合策略的查询意图识别方法和装置 |
CN109992651A (zh) * | 2019-03-14 | 2019-07-09 | 广州智语信息科技有限公司 | 一种问题目标特征自动识别和抽取方法 |
CN109992651B (zh) * | 2019-03-14 | 2024-01-02 | 广州智语信息科技有限公司 | 一种问题目标特征自动识别和抽取方法 |
CN110069631A (zh) * | 2019-04-08 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN110069631B (zh) * | 2019-04-08 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
WO2020211008A1 (zh) * | 2019-04-17 | 2020-10-22 | 深圳市欢太科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN110083284A (zh) * | 2019-05-06 | 2019-08-02 | 三角兽(北京)科技有限公司 | 候选信息处理装置、候选信息显示方法、存储介质及电子设备 |
CN110113492A (zh) * | 2019-05-06 | 2019-08-09 | 三角兽(北京)科技有限公司 | 基于通知信息的信息显示方法及装置 |
CN110427611A (zh) * | 2019-06-26 | 2019-11-08 | 深圳追一科技有限公司 | 文本处理方法、装置、设备及存储介质 |
CN110334347A (zh) * | 2019-06-27 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 基于自然语言识别的信息处理方法、相关设备及存储介质 |
CN112396444A (zh) * | 2019-08-15 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 一种智能机器人应答方法及装置 |
CN112396444B (zh) * | 2019-08-15 | 2024-08-13 | 阿里巴巴集团控股有限公司 | 一种智能机器人应答方法及装置 |
CN110648653A (zh) * | 2019-09-27 | 2020-01-03 | 安徽咪鼠科技有限公司 | 基于智能语音鼠标的字幕实现方法、装置、系统和存储介质 |
CN110765759A (zh) * | 2019-10-21 | 2020-02-07 | 普信恒业科技发展(北京)有限公司 | 意图识别方法及装置 |
CN113128202A (zh) * | 2020-01-10 | 2021-07-16 | 中国科学院软件研究所 | 一种面向物联网服务的智能编排方法和装置 |
CN113128202B (zh) * | 2020-01-10 | 2022-05-17 | 中国科学院软件研究所 | 一种面向物联网服务的智能编排方法和装置 |
CN112035630A (zh) * | 2020-03-27 | 2020-12-04 | 北京来也网络科技有限公司 | 结合rpa和ai的对话交互方法、装置、设备及存储介质 |
CN111783425A (zh) * | 2020-06-28 | 2020-10-16 | 中国平安人寿保险股份有限公司 | 基于句法分析模型的意图识别方法及相关装置 |
CN111783425B (zh) * | 2020-06-28 | 2023-04-18 | 中国平安人寿保险股份有限公司 | 基于句法分析模型的意图识别方法及相关装置 |
CN111737973A (zh) * | 2020-06-29 | 2020-10-02 | 北京明略软件系统有限公司 | 自然语言检索语句解析方法、装置、设备和存储介质 |
CN113205817A (zh) * | 2021-07-06 | 2021-08-03 | 明品云(北京)数据科技有限公司 | 语音语义识别方法、系统、设备及介质 |
CN113407739A (zh) * | 2021-07-14 | 2021-09-17 | 海信视像科技股份有限公司 | 信息标题中概念的确定方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108304466B (zh) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304466A (zh) | 一种用户意图识别方法以及用户意图识别系统 | |
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答系统 | |
CN110765257A (zh) | 一种知识图谱驱动型的法律智能咨询系统 | |
US6886007B2 (en) | Taxonomy generation support for workflow management systems | |
CN117271767B (zh) | 基于多智能体的运维知识库的建立方法 | |
CN104298658B (zh) | 获取搜索结果的方法和装置 | |
CN112069298A (zh) | 基于语义网和意图识别的人机交互方法、设备及介质 | |
CN106777013A (zh) | 对话管理方法和装置 | |
WO2021208444A1 (zh) | 电子病例自动生成方法、装置、设备及存储介质 | |
CN112765974B (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
CN111159381B (zh) | 数据搜索方法及装置 | |
CN109492081A (zh) | 文本信息搜索和信息交互方法、装置、设备及存储介质 | |
CN108959529A (zh) | 问题答案类型的确定方法、装置、设备及存储介质 | |
CA3153056A1 (en) | Intelligently questioning and answering method, device, computer, equipment and storage medium | |
CN113157859A (zh) | 一种基于上位概念信息的事件检测方法 | |
CN111091009A (zh) | 一种基于语义分析的文档关联审核方法 | |
CN115470338A (zh) | 一种基于多路召回的多场景智能问答方法和系统 | |
CN111651569B (zh) | 一种电力领域的知识库问答方法及系统 | |
CN115526171A (zh) | 一种意图识别方法、装置、设备及计算机可读存储介质 | |
CN113157887B (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
Ma et al. | Scenario-based microservice retrieval using Word2Vec | |
CN116090450A (zh) | 一种文本处理方法及计算设备 | |
Kanteev et al. | Multi-agent meta-search engine based on domain ontology | |
CN114328903A (zh) | 基于文本聚类的客服日志回流方法及装置 | |
CN111209375A (zh) | 一种通用的条款与文档匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |