CN104951433A - 基于上下文进行意图识别的方法和系统 - Google Patents
基于上下文进行意图识别的方法和系统 Download PDFInfo
- Publication number
- CN104951433A CN104951433A CN201510351843.0A CN201510351843A CN104951433A CN 104951433 A CN104951433 A CN 104951433A CN 201510351843 A CN201510351843 A CN 201510351843A CN 104951433 A CN104951433 A CN 104951433A
- Authority
- CN
- China
- Prior art keywords
- user
- training
- module
- daily record
- corpus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种基于上下文进行意图识别的方法和系统。所述方法包括:基于用户历史咨询日志,对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注;对每一个问题执行特征提取,以生成训练语料;根据监督学习算法,对所生成的训练语料进行模型训练,以获得训练模型;以及基于所获得的训练模型,对当前的问题进行预估并获得预估后的用户意图识别结果。
Description
技术领域
本发明涉及人工智能领域,特别涉及基于上下文进行意图识别的方法和系统。
背景技术
意图识别是识别一种行为的意图。例如,在问答对话中,提问者每句话都带有一定的意图,应答方根据对方的意图进行回答。
相关问题在搜索引擎、聊天机器人等场景下有广泛的应用。尤其在聊天机器人中,意图识别是整个系统的核心模块。在回答用户的问题时,就是通过分析用户意图,在了解用户想问什么之后给出相应的答案。
现有技术中进行意图识别的方法主要是获取一批数据,然后对每条数据的意图进行人工标注,从而得到训练数据。通过训练数据结合特定的算法训练出模型,并使用所得到的模型对新的语料进行意图识别。然而,当前意图识别大多是基于单句对话的,但是人的对话都是在一定的上下文中进行的,同一句话在不同的上下文中可能表述的意思完全不一样。如果仅仅使用单句进行意图识别完全违背了自然语言的形式,很多意图是无法区分出来的。
例如,在京东客服日常咨询的问题中有售后运费(退货产生的费用)和售前运费(商家寄给客户商品产生的费用)两种。如果用户询问“运费谁出”,仅仅根据这句话无法区分用户是咨询售前运费还是售后运费。当将这句话放到上下文场景中时就很容易区分:如果用户先咨询“我要退货”,再问“运费谁出”,很明显是售后运费;如果先咨询“现在下单什么时候到”,再问“运费谁出”,则是售前运费。
由此,可以看到仅仅根据单句的信息进行意图识别存在一些缺陷。一方面,在对训练语料进行人工标注时无法区分很多问题中用户的真实意图,导致不同人标注的结果不一样,从而影响训练数据质量。另一方面,训练出来的模型对同样的话预测的意图永远是一致的,不会根据不同的上下文变化,从而导致预测错误。
因此,需要一种能够基于上下文进行意图识别的方法和系统。
发明内容
根据本发明的一个实施例,提供了一种基于上下文进行意图识别的方法,包括:基于用户历史咨询日志,对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注;对每一个问题执行特征提取,以生成训练语料;根据监督学习算法,对所生成的训练语料进行模型训练,以获得训练模型;以及基于所获得的训练模型,对当前的问题进行预估并获得预估后的用户意图识别结果。
优选地,对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注进一步包括:按照会话对所获取的用户历史咨询日志进行划分,并逐句对所述用户历史咨询日志进行人工标注。
优选地,对所生成的训练语料进行模型训练进一步包括:对每一个问题添加上文意图分类信息;提取每一个问题的位置信息;以及将每一个问题转化为特征向量作为所述训练语料。
优选地,对所生成的训练语料进行模型训练进一步包括:对特征提取后的所有数据进行分词,并根据增益来获取增益最大的预定数目个分词作为特征词典;基于所述特征词典,将每个训练数据转化为训练向量;以及将所述训练向量作为所述监督学习算法的输入,执行所述监督学习算法以获得训练模型。
优选地,对当前的问题进行预估进一步包括:获取当前问题和用户信息;根据用户ID获取用户的历史信息,得到本句问题在会话中的位置信息以及上文意图分类信息;对所述当前问题执行特征提取以获得特征向量;以及基于训练模型,输入所述特征向量以获得对当前的问题的预估结果。
根据本发明的另一个实施例,提供了一种基于上下文进行意图识别的系统,包括:人工标注模块,所述人工标注模块被配置成基于用户历史咨询日志,对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注;特征提取模块,所述特征提取模块被配置成对每一个问题执行特征提取,以生成训练语料;模型训练模块,所述模型训练模块被配置成根据监督学习算法,对所生成的训练语料进行模型训练,以获得训练模型;以及线上预估模块,所述线上预估模块被配置成基于所获得的训练模型,对当前的问题进行预估并获得预估后的用户意图识别结果。
优选地,所述人工标注模块进一步被配置成按照会话对所获取的用户历史咨询日志进行划分,并逐句对所述用户历史咨询日志进行人工标注。
优选地,所述特征提取模块进一步被配置成:对每一个问题添加上文意图分类信息;提取每一个问题的位置信息;以及将每一个问题转化为特征向量作为所述训练语料。
优选地,所述模型训练模块进一步被配置成:对特征提取后的所有数据进行分词,并根据增益来获取增益最大的预定数目个分词作为特征词典;基于所述特征词典,将每个训练数据转化为训练向量;以及将所述训练向量作为所述监督学习算法的输入,执行所述监督学习算法以获得训练模型。
优选地,所述线上预估模块进一步被配置成:获取当前问题和用户信息;根据用户ID获取用户的历史信息,得到本句问题在会话中的位置信息以及上文意图分类信息;对所述当前问题执行特征提取以获得特征向量;以及基于训练模型,输入所述特征向量以获得对当前的问题的预估结果。
根据本公开和附图的下面的详细描述,对本领域的普通技术人员来说其它的目的、特征、以及优点将是显而易见的。
附图说明
附图图示了本发明的实施例,并与说明书一起用于解释本发明的原理。在附图中:
图1图示了根据本发明实施例的基于上下文进行意图识别的系统的示意图。
图2图示了根据本发明实施例的人工标注模块的处理流程图。
图3图示了根据本发明实施例的特征提取模块的处理流程图。
图4图示了根据本发明实施例的模型训练模块的处理流程图。
图5图示了根据本发明实施例的线上预估模块的处理流程图。
具体实施方式
根据本发明的实施例公开了一种基于上下文进行意图识别的方法和系统。在以下描述中,为了说明的目的,阐述了多个具体细节以提供对本发明的实施例的全面理解。然而,对于本领域技术人员显而易见的是,本发明的实施例可以在没有这些具体细节的情况下实现。
如在此所使用的术语“机器学习”是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。常见的机器学习方法可以分为监督学习、半监督学习和无监督学习。
如在此所使用的术语“监督学习”指的是从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是人工标注的。
如在此所使用的术语“词袋”是一种文本表示方法。例如假定存在以下一个词典:{"John":1,"likes":2,"to":3,"watch":4,"movies":5,"also":6,"football":7,"games":8,"Mary":9,"too":10},并且存在一个文本:“John likes to watch movies.Mary likes too.”。在这种情况下,1根据以上词典,可以将该文本转换成如下向量:[1,1,1,1,1,0,0,0,1,1],其中“1”表示词典中的词出现过,“0”表示没有出现。
图1图示了根据本发明实施例的基于上下文进行意图识别的系统100的示意图。如图1所示,基于上下文进行意图识别的系统100包括人工标注模块101、特征提取模块103、模型训练模块105和线上预估模块107。根据本发明的实施例,人工标注模块101、特征提取模块103和模型训练模块105属于线下模块,用来生成特征词典、模型。线上预估模块107属于线上模块,通过所生成的特征词典、模型对实时问题进行分类评估。下面以京东客服回答用户咨询问题为场景对每个模块进行说明。
人工标注模块
京东客服回答的问题可以分为不同的业务点,用户的每个问题可以对应到这些业务点。这里直接将这些业务点看作用户意图,常见的业务点例如有:退货、换货、配送、运费等。
图2图示了根据本发明实施例的人工标注模块101的处理流程图。如图2所示,人工标注模块101首先获取用户历史咨询日志,并对所获取的用户历史咨询日志按照会话进行划分,然后逐句地对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注。
在本发明的实施例中,一个会话是由同一个对话场景中的连续的问题组成。例如,会话划分方法可以如下:将所获取的用户历史咨询日志按照用户咨询时间进行排序,如果咨询的用户或回答问题的客服不同,则将连续的问题划分到不同的会话中。而且,如果用户和客服一致,但相邻两句话的时间间隔大于预定时间(例如,半小时),则也将该对话划分为不同的会话。
在用户历史咨询日志按会话划分完成之后,将数据交由人工对每句话进行标注。这样,人工标注过程不再仅根据单句,而是根据这句话在整个会话中的意图进行标注,更准确地说,是根据这句话的上下文进行标注。因为在实际对话时,我们只能获取或知道用户之前所说的话,而无法获取他接下来会说什么。表1示出了在示例场景1的情况下会话标注完成后的效果。
问题 | 标注结果 |
你好 | 闲聊 |
我之前买的衣服小了,可以退货吗 | 退货条件 |
运费谁出 | 售后运费 |
可以寄邮政吗 | 退货方式 |
收货地址是什么 | 返回地址 |
好的,谢谢 | 闲聊 |
表1 场景1情况下的标注效果
可以看出,如果使用单句标注的方案,“运费谁出”是无法区分出用户咨询的是售前还是售后运费。同样,“可以寄邮政吗”也无法区分出是发货方式还是退货方式。然而,例如以上的这两句话放在整个会话中看是没有任何歧义的。
特征提取模块
图3图示了根据本发明实施例的特征提取模块103的处理流程图。如图3所示,特征提取模块103被配置成对每一个问题执行特征提取,以生成训练语料。具体地,特征提取模块103首先针对每句话或每个问题添加上文意图分类信息,提取每句话或每个问题的位置信息,并将每一个问题转化为特征向量作为所述训练语料。
在所有数据标注完成之后,每句话需要加入上下文信息,最终使用“词袋”方式将每句话转化为一个向量作为模型训练的输入。在此,所加入的上下文信息有两种:一种是上文的意图(即,上文的标注结果),这里只取最近一条非“闲聊”的标注结果;另一种是本句话在整个会话中的位置信息,即,本句话是整个会话中的第几句。
上文意图信息的添加规则是:距离当前问题最近,且标注结果不是闲聊问题的标注结果。这里需要说明的是,用户在咨询过程中会加入很多闲聊话语,或者说意图不明显的话语,并且这些话语将那些意图明显的语句分隔开来。因此,如果仅仅看上一句的分类结果,则很可能上文的标注结果是一致的。例如,表2和表3所示的场景2和场景3情况下的标注效果。
问题 | 标注结果 |
你好 | 闲聊 |
我之前买的衣服小了,可以退货吗 | 退货条件 |
太好了 | 闲聊 |
运费谁出 | 售后运费 |
表2 场景2情况下的标注效果
问题 | 标注结果 |
你好 | 闲聊 |
现在下单什么时候到 | 配送周期 |
好吧 | 闲聊 |
运费谁出 | 售前运费 |
表3 场景3情况下的标注效果
如场景2和场景3所示,“运费谁出”的上一句都是闲聊,没有明显意图。如果只根据上一句话来看无法区分当前句的含义。进一步,这里参照的上文也不能太多,用户最开始说的话和当前句较远时,意图很可能已经不一样了,这种情况下没有参考价值。因此,根据本发明的技术方案,选择在当前话语之前的若干话语作为参考,例如可以选择最近三句话作为参考。如果最近三句话都是闲聊,则上文结果为空。
问题位置信息是特征提取的重要部分。例如,一个会话刚开始往往是“你好”、“在吗”之类的语气词。同样的话语由于出现在会话中的位置不同会造成不同的标注结果。例如,如果“不行”这句话出现在会话的最开始,则由于没有上文信息而会将这句话标注为“闲聊”。如果这句话出现在后面,则由于已经进入特定场景,所以这句话会带有一定的意图,而不会被标注为“闲聊”。这与上文信息是互相辅助的。
以场景2中的“运费谁出”为例,经过特征提取模块103处理之后变为“4退货条件运费谁出”,其中,“4”为位置信息,“退货条件”为上文意图分类信息,“运费谁出”为用户的问题。
此外,用户的问题中可包含大量数据。为了区分用户输入的数字内容,将这里的位置信息变为“index”+位置,上文意图分类信息也转化为“cate”+分类id(每个分类对应一个唯一的数字id)。
这里,不使用上文意图分类信息明文。原因如下:例如有一个分类为“退换货保修返修政策”,如果用户的第一句话被划分为该分类,接着用户的下一句话是“好”。由于第二句只有一个字,所以如果加入上文意图信息的明文信息,则变为“退换货保修返修政策好”。在这种情况下,第二句话中的“好”的信息完全被上文意图信息所掩盖,导致这句话应该是闲聊,但肯定会预测为“退换货保修返修政策”。然而,如果将上文意图分类信息替换为诸如“cate1”的标识,则不会出现这种情况。
因此,特征提取模块103最终将场景2中原始的“运费谁出”变为“index4cate2运费谁出”。特征提取模块103最后将处理后的问题进行分词,然后转化为特征向量作为最终的训练语料。例如可以通过上文所述的“词袋”的方式转化为特征向量。本领域技术人员可以理解,可以采用本领域已知的任何其他方式来转化为特征向量。
模型训练模块
图4图示了根据本发明实施例的模型训练模块105的处理流程图。如图4所示,模型训练模块105被配置成根据监督学习算法,对所生成的训练语料进行模型训练,以获得训练模型。
首先,模型训练模块105对由特征提取模块103处理后的所有数据进行分词,并根据增益来获取增益最大的预定数目个分词作为特征词典,例如前20000个分词作为特征词典。本领域技术人员理解,可以选择采用其他数目的分词,即,特征词典的大小是可自由调整的。
然后,模型训练模块105对每条样本进行分词,根据所生成的特征词典以及上文提到的“词袋”方法,将每条训练数据转化为训练向量。所述训练向量例如是用0、1表示的训练向量。
接着,模型训练模块105将所述训练向量作为监督学习算法的输入,从而得到最终的训练模型。如本领域技术人员已知的,可以采用任何合适的监督学习算法。例如,在一个实施例中,采用逻辑回归LR(Logistic Regression)算法。
线上预估模块
图5图示了根据本发明实施例的线上预估模块107的处理流程图。在线上预估处理中,线上预估模块107对当前问题和用户信息进行特征提取以生成特征向量,并使用由模型训练模块105训练好的模型对输入的特征向量进行预估,并输出最终的意图预测结果。其中,特征提取与上文参照特征提取模块103所描述的方法一致。
如图5所示,首先,线上预估模块107获取当前问题和用户信息,然后根据用户ID获取该用户的历史信息,得到本句问题在会话中的位置信息以及上文意图分类信息。然后,线上预估模块107对所述当前问题执行特征提取。具体地,线上预估模块107基于获得的位置信息和上文意图分类信息对当前问题进行处理以得到最终的训练语料,并根据模型训练模块105的训练方法将用户问题转化为特征向量。然后,线上预估模块107基于模型训练模块105训练好的模型,输入所述特征向量并获得预估的最终结果。最后,线上预估模块107记录本次咨询信息。
根据本发明的技术方案,用户在标注数据过程中,由于能够参考上文信息,所以能够更明显地看出用户的意图,使标注效率更高、标注中歧义更少、标注数据的质量更高,从而使最终预测结果更准确。
与传统方法相比较,根据本发明的技术方案使用上下文信息进行意图识别,准确率有较大提升。而且,同样的问题在不同的上下文场景中能够预估出不同的意图,更符合自然语言的应用场景,从而能够解决传统方法无法解决的问题。
上述实施例仅是本发明的优选实施例,并不用于限制本发明。对本领域技术人员显而易见的是,在不脱离本发明精神和范围的情况下,可以对本发明的实施例进行各种修改和改变。因此,本发明意在涵盖落入如权利要求所限定的本发明的范围之内的所有的修改或变型。
Claims (10)
1.一种基于上下文进行意图识别的方法,包括:
基于用户历史咨询日志,对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注;
对每一个问题执行特征提取,以生成训练语料;
根据监督学习算法,对所生成的训练语料进行模型训练,以获得训练模型;以及
基于所获得的训练模型,对当前的问题进行预估并获得预估后的用户意图识别结果。
2.根据权利要求1所述的方法,其中,对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注进一步包括:按照会话对所获取的用户历史咨询日志进行划分,并逐句对所述用户历史咨询日志进行人工标注。
3.根据权利要求1所述的方法,其中,对所生成的训练语料进行模型训练进一步包括:
对每一个问题添加上文意图分类信息;
提取每一个问题的位置信息;以及
将每一个问题转化为特征向量作为所述训练语料。
4.根据权利要求1或3所述的方法,其中,对所生成的训练语料进行模型训练进一步包括:
对特征提取后的所有数据进行分词,并根据增益来获取增益最大的预定数目个分词作为特征词典;
基于所述特征词典,将每个训练数据转化为训练向量;以及
将所述训练向量作为所述监督学习算法的输入,执行所述监督学习算法以获得训练模型。
5.根据权利要求1或3所述的方法,其中,对当前的问题进行预估进一步包括:
获取当前问题和用户信息;
根据用户ID获取用户的历史信息,得到本句问题在会话中的位置信息以及上文意图分类信息;
对所述当前问题执行特征提取以获得特征向量;以及
基于训练模型,输入所述特征向量以获得对当前的问题的预估结果。
6.一种基于上下文进行意图识别的系统,包括:
人工标注模块,所述人工标注模块被配置成基于用户历史咨询日志,对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注;
特征提取模块,所述特征提取模块被配置成对每一个问题执行特征提取,以生成训练语料;
模型训练模块,所述模型训练模块被配置成根据监督学习算法,对所生成的训练语料进行模型训练,以获得训练模型;以及
线上预估模块,所述线上预估模块被配置成基于所获得的训练模型,对当前的问题进行预估并获得预估后的用户意图识别结果。
7.根据权利要求6所述的系统,其中,所述人工标注模块进一步被配置成按照会话对所获取的用户历史咨询日志进行划分,并逐句对所述用户历史咨询日志进行人工标注。
8.根据权利要求6所述的系统,其中,所述特征提取模块进一步被配置成:
对每一个问题添加上文意图分类信息;
提取每一个问题的位置信息;以及
将每一个问题转化为特征向量作为所述训练语料。
9.根据权利要求6或8所述的系统,其中,所述模型训练模块进一步被配置成:
对特征提取后的所有数据进行分词,并根据增益来获取增益最大的预定数目个分词作为特征词典;
基于所述特征词典,将每个训练数据转化为训练向量;以及
将所述训练向量作为所述监督学习算法的输入,执行所述监督学习算法以获得训练模型。
10.根据权利要求6或8所述的系统,其中,所述线上预估模块进一步被配置成:
获取当前问题和用户信息;
根据用户ID获取用户的历史信息,得到本句问题在会话中的位置信息以及上文意图分类信息;
对所述当前问题执行特征提取以获得特征向量;以及
基于训练模型,输入所述特征向量以获得对当前的问题的预估结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510351843.0A CN104951433B (zh) | 2015-06-24 | 2015-06-24 | 基于上下文进行意图识别的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510351843.0A CN104951433B (zh) | 2015-06-24 | 2015-06-24 | 基于上下文进行意图识别的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104951433A true CN104951433A (zh) | 2015-09-30 |
CN104951433B CN104951433B (zh) | 2018-01-23 |
Family
ID=54166096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510351843.0A Active CN104951433B (zh) | 2015-06-24 | 2015-06-24 | 基于上下文进行意图识别的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104951433B (zh) |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105590225A (zh) * | 2015-12-22 | 2016-05-18 | 成都小多科技有限公司 | 基于客户问题识别销售阶段的方法及装置 |
CN106372132A (zh) * | 2016-08-25 | 2017-02-01 | 北京百度网讯科技有限公司 | 基于人工智能的查询意图预测方法和装置 |
WO2017071474A1 (zh) * | 2015-10-27 | 2017-05-04 | 中兴通讯股份有限公司 | 一种语料处理方法和装置及语料分析方法和装置 |
CN106779817A (zh) * | 2016-11-29 | 2017-05-31 | 竹间智能科技(上海)有限公司 | 基于多维度信息的意图识别方法及系统 |
CN106777013A (zh) * | 2016-12-07 | 2017-05-31 | 科大讯飞股份有限公司 | 对话管理方法和装置 |
WO2017118333A1 (zh) * | 2016-01-08 | 2017-07-13 | 阿里巴巴集团控股有限公司 | 一种基于数据驱动预测用户问题的方法及装置 |
CN106951422A (zh) * | 2016-01-07 | 2017-07-14 | 腾讯科技(深圳)有限公司 | 网页训练的方法和装置、搜索意图识别的方法和装置 |
CN106997342A (zh) * | 2017-03-27 | 2017-08-01 | 上海奔影网络科技有限公司 | 基于多轮交互的意图识别方法和装置 |
CN107273357A (zh) * | 2017-06-14 | 2017-10-20 | 北京百度网讯科技有限公司 | 基于人工智能的分词模型的修正方法、装置、设备和介质 |
CN107273870A (zh) * | 2017-07-07 | 2017-10-20 | 郑州航空工业管理学院 | 一种监控场景下融合上下文信息的行人位置检测方法 |
CN107291775A (zh) * | 2016-04-11 | 2017-10-24 | 北京京东尚科信息技术有限公司 | 错误样本的修复语料生成方法和装置 |
CN107315731A (zh) * | 2016-04-27 | 2017-11-03 | 北京京东尚科信息技术有限公司 | 文本相似度计算方法 |
CN107765970A (zh) * | 2017-03-27 | 2018-03-06 | 三角兽(北京)科技有限公司 | 信息处理装置及信息处理方法 |
CN108038208A (zh) * | 2017-12-18 | 2018-05-15 | 深圳前海微众银行股份有限公司 | 上下文信息识别模型的训练方法、装置和存储介质 |
CN108292305A (zh) * | 2015-12-04 | 2018-07-17 | 三菱电机株式会社 | 用于处理语句的方法 |
CN108351890A (zh) * | 2015-11-24 | 2018-07-31 | 三星电子株式会社 | 电子装置及其操作方法 |
WO2018157700A1 (zh) * | 2017-03-02 | 2018-09-07 | 腾讯科技(深圳)有限公司 | 对话生成方法、装置及存储介质 |
CN108694164A (zh) * | 2017-04-10 | 2018-10-23 | 普天信息技术有限公司 | 一种分词训练方法及装置 |
CN108734296A (zh) * | 2017-04-21 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 优化监督学习的训练数据的方法、装置、电子设备和介质 |
CN108829667A (zh) * | 2018-05-28 | 2018-11-16 | 南京柯基数据科技有限公司 | 一种基于记忆网络的多轮对话下的意图识别方法 |
CN108845560A (zh) * | 2018-05-30 | 2018-11-20 | 国网浙江省电力有限公司宁波供电公司 | 一种电力调度日志故障分类方法 |
CN109145153A (zh) * | 2018-07-02 | 2019-01-04 | 北京奇艺世纪科技有限公司 | 意图类别的识别方法和装置 |
CN109543012A (zh) * | 2018-10-25 | 2019-03-29 | 苏宁易购集团股份有限公司 | 一种基于Word2Vec和RNN的用户意图识别方法及装置 |
CN109710941A (zh) * | 2018-12-29 | 2019-05-03 | 上海点融信息科技有限责任公司 | 基于人工智能的用户意图识别方法和装置 |
CN109857841A (zh) * | 2018-12-05 | 2019-06-07 | 厦门快商通信息技术有限公司 | 一种faq问句文本相似度计算方法及系统 |
CN109977209A (zh) * | 2019-03-22 | 2019-07-05 | 深圳狗尾草智能科技有限公司 | 多轮人机交互方法、系统、计算机及介质 |
CN110046346A (zh) * | 2019-03-18 | 2019-07-23 | 广东小天才科技有限公司 | 一种语料意图监控的方法和装置、终端设备 |
CN110188281A (zh) * | 2019-05-31 | 2019-08-30 | 三角兽(北京)科技有限公司 | 展示推荐信息的方法、装置、电子设备及可读存储介质 |
CN110196963A (zh) * | 2018-02-27 | 2019-09-03 | 北京京东尚科信息技术有限公司 | 模型生成、语义识别的方法、系统、设备及存储介质 |
CN110663231A (zh) * | 2017-05-25 | 2020-01-07 | 微软技术许可有限责任公司 | 使用共享对话上下文的任务识别和跟踪 |
TWI682292B (zh) * | 2018-08-24 | 2020-01-11 | 內秋應智能科技股份有限公司 | 遞迴式整合對話之智能語音裝置 |
CN110704618A (zh) * | 2019-09-20 | 2020-01-17 | 阿里巴巴集团控股有限公司 | 确定对话数据对应的标准问题的方法及装置 |
CN110765346A (zh) * | 2018-07-10 | 2020-02-07 | 阿里巴巴集团控股有限公司 | 用户意图挖掘方法、装置以及设备 |
CN111241255A (zh) * | 2019-12-27 | 2020-06-05 | 深圳市优必选科技股份有限公司 | 智能会话管理方法及智能终端、存储介质 |
CN111309889A (zh) * | 2020-02-27 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 用于文本处理的方法和装置 |
CN111373391A (zh) * | 2017-11-29 | 2020-07-03 | 三菱电机株式会社 | 语言处理装置、语言处理系统和语言处理方法 |
CN111881272A (zh) * | 2020-07-09 | 2020-11-03 | 普强时代(珠海横琴)信息技术有限公司 | 一种电话服务实时预警系统和预警方法 |
CN114444488A (zh) * | 2022-01-26 | 2022-05-06 | 中国科学技术大学 | 一种少样本机器阅读理解方法、系统、设备及存储介质 |
TWI771284B (zh) * | 2017-01-23 | 2022-07-21 | 香港商阿里巴巴集團服務有限公司 | 基於資料驅動預測使用者問題的方法及裝置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050256717A1 (en) * | 2004-05-11 | 2005-11-17 | Fujitsu Limited | Dialog system, dialog system execution method, and computer memory product |
US20060206481A1 (en) * | 2005-03-14 | 2006-09-14 | Fuji Xerox Co., Ltd. | Question answering system, data search method, and computer program |
CN103412882A (zh) * | 2013-07-18 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 一种识别消费意图的方法及装置 |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答系统 |
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
-
2015
- 2015-06-24 CN CN201510351843.0A patent/CN104951433B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050256717A1 (en) * | 2004-05-11 | 2005-11-17 | Fujitsu Limited | Dialog system, dialog system execution method, and computer memory product |
US20060206481A1 (en) * | 2005-03-14 | 2006-09-14 | Fuji Xerox Co., Ltd. | Question answering system, data search method, and computer program |
CN103412882A (zh) * | 2013-07-18 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 一种识别消费意图的方法及装置 |
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答系统 |
Non-Patent Citations (3)
Title |
---|
DEREK HAO HU等: "《Context-Aware Online Commercial Intention Detection》", 《SPRINGER-VERLAG BERLIN HEIGELBERG》 * |
伍大勇等: "《融合多类特征的Web查询意图识别》", 《模式识别与人工智能》 * |
陆伟等: "《查询意图研究综述》", 《中国图书馆学报 》 * |
Cited By (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017071474A1 (zh) * | 2015-10-27 | 2017-05-04 | 中兴通讯股份有限公司 | 一种语料处理方法和装置及语料分析方法和装置 |
CN108351890B (zh) * | 2015-11-24 | 2022-04-12 | 三星电子株式会社 | 电子装置及其操作方法 |
CN108351890A (zh) * | 2015-11-24 | 2018-07-31 | 三星电子株式会社 | 电子装置及其操作方法 |
CN108292305A (zh) * | 2015-12-04 | 2018-07-17 | 三菱电机株式会社 | 用于处理语句的方法 |
CN105590225A (zh) * | 2015-12-22 | 2016-05-18 | 成都小多科技有限公司 | 基于客户问题识别销售阶段的方法及装置 |
CN106951422A (zh) * | 2016-01-07 | 2017-07-14 | 腾讯科技(深圳)有限公司 | 网页训练的方法和装置、搜索意图识别的方法和装置 |
WO2017118333A1 (zh) * | 2016-01-08 | 2017-07-13 | 阿里巴巴集团控股有限公司 | 一种基于数据驱动预测用户问题的方法及装置 |
US11928617B2 (en) | 2016-01-08 | 2024-03-12 | Alibaba Group Holding Limited | Data-driven method and apparatus for handling user inquiries using collected data |
CN106960248A (zh) * | 2016-01-08 | 2017-07-18 | 阿里巴巴集团控股有限公司 | 一种基于数据驱动预测用户问题的方法及装置 |
US11481698B2 (en) | 2016-01-08 | 2022-10-25 | Alibaba Group Holding Limited | Data-driven method and apparatus for handling user inquiries using collected data |
CN107291775B (zh) * | 2016-04-11 | 2020-07-31 | 北京京东尚科信息技术有限公司 | 错误样本的修复语料生成方法和装置 |
CN107291775A (zh) * | 2016-04-11 | 2017-10-24 | 北京京东尚科信息技术有限公司 | 错误样本的修复语料生成方法和装置 |
CN107315731A (zh) * | 2016-04-27 | 2017-11-03 | 北京京东尚科信息技术有限公司 | 文本相似度计算方法 |
CN106372132A (zh) * | 2016-08-25 | 2017-02-01 | 北京百度网讯科技有限公司 | 基于人工智能的查询意图预测方法和装置 |
CN106779817A (zh) * | 2016-11-29 | 2017-05-31 | 竹间智能科技(上海)有限公司 | 基于多维度信息的意图识别方法及系统 |
CN106777013B (zh) * | 2016-12-07 | 2020-09-11 | 科大讯飞股份有限公司 | 对话管理方法和装置 |
CN106777013A (zh) * | 2016-12-07 | 2017-05-31 | 科大讯飞股份有限公司 | 对话管理方法和装置 |
TWI771284B (zh) * | 2017-01-23 | 2022-07-21 | 香港商阿里巴巴集團服務有限公司 | 基於資料驅動預測使用者問題的方法及裝置 |
WO2018157700A1 (zh) * | 2017-03-02 | 2018-09-07 | 腾讯科技(深圳)有限公司 | 对话生成方法、装置及存储介质 |
CN107765970B (zh) * | 2017-03-27 | 2019-03-12 | 三角兽(北京)科技有限公司 | 信息处理装置、信息处理方法以及存储介质 |
CN107765970A (zh) * | 2017-03-27 | 2018-03-06 | 三角兽(北京)科技有限公司 | 信息处理装置及信息处理方法 |
CN106997342A (zh) * | 2017-03-27 | 2017-08-01 | 上海奔影网络科技有限公司 | 基于多轮交互的意图识别方法和装置 |
CN108694164A (zh) * | 2017-04-10 | 2018-10-23 | 普天信息技术有限公司 | 一种分词训练方法及装置 |
CN108734296A (zh) * | 2017-04-21 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 优化监督学习的训练数据的方法、装置、电子设备和介质 |
US11593769B2 (en) | 2017-05-25 | 2023-02-28 | Microsoft Technology Licensing, Llc | Task identification from electronic user communications using a shared conversational context |
CN110663231A (zh) * | 2017-05-25 | 2020-01-07 | 微软技术许可有限责任公司 | 使用共享对话上下文的任务识别和跟踪 |
CN107273357B (zh) * | 2017-06-14 | 2020-11-10 | 北京百度网讯科技有限公司 | 基于人工智能的分词模型的修正方法、装置、设备和介质 |
CN107273357A (zh) * | 2017-06-14 | 2017-10-20 | 北京百度网讯科技有限公司 | 基于人工智能的分词模型的修正方法、装置、设备和介质 |
US10664659B2 (en) | 2017-06-14 | 2020-05-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method for modifying segmentation model based on artificial intelligence, device and storage medium |
CN107273870A (zh) * | 2017-07-07 | 2017-10-20 | 郑州航空工业管理学院 | 一种监控场景下融合上下文信息的行人位置检测方法 |
CN111373391A (zh) * | 2017-11-29 | 2020-07-03 | 三菱电机株式会社 | 语言处理装置、语言处理系统和语言处理方法 |
CN111373391B (zh) * | 2017-11-29 | 2023-10-20 | 三菱电机株式会社 | 语言处理装置、语言处理系统和语言处理方法 |
CN108038208B (zh) * | 2017-12-18 | 2022-01-11 | 深圳前海微众银行股份有限公司 | 上下文信息识别模型的训练方法、装置和存储介质 |
CN108038208A (zh) * | 2017-12-18 | 2018-05-15 | 深圳前海微众银行股份有限公司 | 上下文信息识别模型的训练方法、装置和存储介质 |
CN110196963A (zh) * | 2018-02-27 | 2019-09-03 | 北京京东尚科信息技术有限公司 | 模型生成、语义识别的方法、系统、设备及存储介质 |
CN108829667A (zh) * | 2018-05-28 | 2018-11-16 | 南京柯基数据科技有限公司 | 一种基于记忆网络的多轮对话下的意图识别方法 |
CN108845560B (zh) * | 2018-05-30 | 2021-07-13 | 国网浙江省电力有限公司宁波供电公司 | 一种电力调度日志故障分类方法 |
CN108845560A (zh) * | 2018-05-30 | 2018-11-20 | 国网浙江省电力有限公司宁波供电公司 | 一种电力调度日志故障分类方法 |
CN109145153A (zh) * | 2018-07-02 | 2019-01-04 | 北京奇艺世纪科技有限公司 | 意图类别的识别方法和装置 |
CN110765346A (zh) * | 2018-07-10 | 2020-02-07 | 阿里巴巴集团控股有限公司 | 用户意图挖掘方法、装置以及设备 |
CN110765346B (zh) * | 2018-07-10 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 用户意图挖掘方法、装置以及设备 |
TWI682292B (zh) * | 2018-08-24 | 2020-01-11 | 內秋應智能科技股份有限公司 | 遞迴式整合對話之智能語音裝置 |
CN109543012A (zh) * | 2018-10-25 | 2019-03-29 | 苏宁易购集团股份有限公司 | 一种基于Word2Vec和RNN的用户意图识别方法及装置 |
CN109857841A (zh) * | 2018-12-05 | 2019-06-07 | 厦门快商通信息技术有限公司 | 一种faq问句文本相似度计算方法及系统 |
CN109710941A (zh) * | 2018-12-29 | 2019-05-03 | 上海点融信息科技有限责任公司 | 基于人工智能的用户意图识别方法和装置 |
CN110046346B (zh) * | 2019-03-18 | 2023-07-25 | 广东小天才科技有限公司 | 一种语料意图监控的方法和装置、终端设备 |
CN110046346A (zh) * | 2019-03-18 | 2019-07-23 | 广东小天才科技有限公司 | 一种语料意图监控的方法和装置、终端设备 |
CN109977209A (zh) * | 2019-03-22 | 2019-07-05 | 深圳狗尾草智能科技有限公司 | 多轮人机交互方法、系统、计算机及介质 |
CN110188281A (zh) * | 2019-05-31 | 2019-08-30 | 三角兽(北京)科技有限公司 | 展示推荐信息的方法、装置、电子设备及可读存储介质 |
CN110704618B (zh) * | 2019-09-20 | 2023-06-27 | 创新先进技术有限公司 | 确定对话数据对应的标准问题的方法及装置 |
CN110704618A (zh) * | 2019-09-20 | 2020-01-17 | 阿里巴巴集团控股有限公司 | 确定对话数据对应的标准问题的方法及装置 |
CN111241255A (zh) * | 2019-12-27 | 2020-06-05 | 深圳市优必选科技股份有限公司 | 智能会话管理方法及智能终端、存储介质 |
CN111309889A (zh) * | 2020-02-27 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 用于文本处理的方法和装置 |
CN111309889B (zh) * | 2020-02-27 | 2023-04-14 | 支付宝(杭州)信息技术有限公司 | 用于文本处理的方法和装置 |
CN111881272A (zh) * | 2020-07-09 | 2020-11-03 | 普强时代(珠海横琴)信息技术有限公司 | 一种电话服务实时预警系统和预警方法 |
CN114444488A (zh) * | 2022-01-26 | 2022-05-06 | 中国科学技术大学 | 一种少样本机器阅读理解方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104951433B (zh) | 2018-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104951433B (zh) | 基于上下文进行意图识别的方法和系统 | |
CN109146610B (zh) | 一种智能保险推荐方法、装置及智能保险机器人设备 | |
CN106570496B (zh) | 情绪识别方法和装置以及智能交互方法和设备 | |
CN109800306B (zh) | 意图分析方法、装置、显示终端及计算机可读存储介质 | |
CN106328147B (zh) | 语音识别方法和装置 | |
CN111222305A (zh) | 一种信息结构化方法和装置 | |
CN105183717B (zh) | 一种基于随机森林和用户关系的osn用户情感分析方法 | |
CN111666761B (zh) | 细粒度情感分析模型训练方法及装置 | |
KR101713558B1 (ko) | 소셜 네트워크 서비스 상의 사용자 게시글 감정 분류 방법 | |
CN112163079B (zh) | 一种基于阅读理解模型的智能对话方法及系统 | |
CN107315731A (zh) | 文本相似度计算方法 | |
CN110955750A (zh) | 评论区域和情感极性的联合识别方法、装置、电子设备 | |
CN113297365B (zh) | 一种用户意向判定方法、装置、设备及存储介质 | |
Razzaq et al. | Text sentiment analysis using frequency-based vigorous features | |
KR20230171234A (ko) | 사용자 참여 기반의 질의응답 서비스 제공방법 및 이를 위한 장치 | |
CN111026840A (zh) | 文本处理方法、装置、服务器和存储介质 | |
CN108733652B (zh) | 基于机器学习的影评情感倾向性分析的测试方法 | |
Yamaguchi et al. | Dialogue act-based breakdown detection in negotiation dialogues | |
Athindran et al. | Comparative analysis of customer sentiments on competing brands using hybrid model approach | |
CN110059178A (zh) | 问题派发方法及装置 | |
CN117235213A (zh) | 一种交互式客服方法及系统 | |
CN116340511B (zh) | 结合深度学习与语言逻辑推理的舆情分析方法 | |
CN108804416B (zh) | 基于机器学习的影评情感倾向性分析的训练方法 | |
Garain | Humor Analysis based on Human Annotation (HAHA)-2019: Humor Analysis at Tweet Level using Deep Learning. | |
KR20190104745A (ko) | 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |