CN104809103A - 一种人机对话的语义分析方法及系统 - Google Patents

一种人机对话的语义分析方法及系统 Download PDF

Info

Publication number
CN104809103A
CN104809103A CN201510213919.3A CN201510213919A CN104809103A CN 104809103 A CN104809103 A CN 104809103A CN 201510213919 A CN201510213919 A CN 201510213919A CN 104809103 A CN104809103 A CN 104809103A
Authority
CN
China
Prior art keywords
value
emotion
user
prime
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510213919.3A
Other languages
English (en)
Other versions
CN104809103B (zh
Inventor
陶玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201510213919.3A priority Critical patent/CN104809103B/zh
Publication of CN104809103A publication Critical patent/CN104809103A/zh
Application granted granted Critical
Publication of CN104809103B publication Critical patent/CN104809103B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开一种人机对话的语义分析方法及系统,方法包括:获取训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。本发明通过函数训练得到计算情感值的情感函数,从而能够将用户输入语句计算出相应的情感值,从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,从而能够更好地回答用户的输入。

Description

一种人机对话的语义分析方法及系统
技术领域
本发明涉及人机对话相关技术领域,特别是一种人机对话的语义分析方法及系统。
背景技术
现在的人机对话问答系统中,当用户输入问题后,识别用户所要询问的意图是整个问答系统中核心的部分,意图识别正确但准确率太低,会造成后期给用户返回答案时,答案太多而无法选择最优答案的问题;意图识别错误会造成无法理解用户的意思,从而会给用户提供其不想要的答案或者直接无法给出答案。现有的技术做法是:
模型预测:该方法主要是先由人工进行分类和语料的标注,然后通过决策树或者分类算法来训练出一个模型,当用户输入一句话后,进行分词、实体抽取和向量转化后,把处理后的信息输入到模型中来进行预测判断,给出一个用户意图预测的结果。
现有意图识别的方法都是基于人工标注大量的语料来进行训练和预测,由于需要大量的人工标注,会存在很多的不可控因素,比如每个标注人员对于语料理解的不同会导致不同的标注结果,对相同的问题会有重复标注的结果,以及不同的分类标注里有相同语料的标注;而且当需要添加新的意图分类的时候,必须由相关人员进行商讨、确定,再培训标注人员才能开始进行标注工作,机器无法自动添加新的分类。在整个训练模型的过程中会消耗大量的人力物力,并且由于诸多的不可控因素会影响函数训练的速度和进度。
在实际过程中模型预测也很难区分用户是在询问问题还是和问答系统进行聊天,用户在实际使用时是不会提示机器自己的意图是什么,所以需要问答系统来识别和区分,如果光靠模型的预测就需要在语料里加入大量的聊天语料来进行训练,大量聊天语料的存在势必会造成其他分类语料权重的降低,从而影响其他意图分类的准确性,而不加入聊天语料则又会影响到意图识别的最终效果。最终整个系统的效果也会大打折扣。
发明内容
基于此,有必要针对现有技术中无法对用户进行语义分析,从而对用户的意图识别不准确的技术问题,提供一种人机对话的语义分析方法及系统。
一种人机对话的语义分析方法,包括:
函数训练步骤,包括:获取包括多个训练语句的训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;
情感值计算步骤,包括:获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;
情感执行步骤,包括:从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。
一种人机对话的语义分析系统,包括:
函数训练模块,用于:获取包括多个训练语句的训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;
情感值计算模块,用于:获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;
情感执行模块,用于:从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。
本发明通过函数训练得到计算情感值的情感函数,从而能够将用户输入语句计算出相应的情感值,并根据情感值选择回答用户的方式,从而能够更好地回答用户的输入。
附图说明
图1为本发明一种人机对话的语义分析方法的工作流程图;
图2为本发明最佳实施例的工作流程图;
图3为本发明一种人机对话的语义分析系统的结构模块图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细的说明。
如图1所示为本发明一种人机对话的语义分析方法的工作流程图,包括:
步骤S101,包括:获取包括多个训练语句的训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;
步骤S102,包括:获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;
步骤S103,包括:从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。
用户的各种意图识别其实也是用模型去拟合用户的问题,语义分析就是用函数拟合出合适的模型的方式,最后可以得到的可以比较意图类别的情感函数,则可以直接得出用户的意图。
本发明通过步骤S101训练情感函数,并在步骤S102对用户输入语句在情感函数中计算得到对应的用户情感值。在步骤S103中,根据用户情感值选择对应的回答答案并显示。
本发明由于采用训练模型获取用户情感值,因此使实体识别的准确率得到了明显提高,并且也大大提高了模型迭代速度和节省了人力成本;更重要的是当用户量大的时候,对于同一个问题会有多种的问法,当初始训练的样本不足时,可能无法得到用户的意图,然而通过不断的训练则可以提高获取用户意图的可能性。经过一段时间后,可以将获得的用户输入语句对情感函数进行输入,从而对算法的参数和语料进行自动的补充和调优。
计算情感值,可以通过在训练语料中,预先对每个训练语句设定相应的情感值,然后通过函数拟合的方式,拟合出一条能对输入的语句计算出相应的情感值的函数。然而,采用预先设定情感值的方式,需要人工大量的打分,因此会导致出现比较大量的主观判断,从而影响实际的语义分析结果。
在其中一个实施例中:
所述步骤101,具体包括:获取包括多个训练语句的训练语料,每个训练语句与一种情感类型关联,对所述训练语料进行训练,得到用于对情感类型进行分类的情感函数,所述情感值用于表示输入情感函数的语句所属的情感类型;
所述步骤102,具体包括:根据所述用户情感值确定对应的情感类型为用户情感类型,从与所述用户输入语句相关的多个回答答案中,选择所述用户情感类型所对应的回答答案作为语义分析答案,显示所述语义分析答案。
本实施例中情感函数是对情感类型进行分类,因此无需对训练语句进行打分,只要预先将训练语句进行分类,使得最终的语义分析结果更加具有客观性。
在其中一个实施例中:
所述步骤S101,还包括:将所述训练语句进行向量化处理得到训练向量值,对多个所述训练向量值进行训练得到情感函数,所述训练向量值包括多个维度,且每个维度与一个单词关联,在所述训练向量值中将所述训练语句所包括的单词所对应的维度置1;
所述步骤S102,还包括:将所述用户输入语句进行向量化处理得到用户输入向量值,,所述用户输入向量值包括多个维度,且每个维度与一个单词关联,在所述用户输入向量值中将所述用户输入语句所包括的单词所对应的维度置1。
在其中一个实施例中:
所述情感类型包括第一情感类型和第二情感类型,所述训练语料包括第一训练语料和第二训练语料,所述第一训练语料包括多个预先选定的与第一情感类型关联的第一训练语句,所述第二训练语料包括多个预先选定的与第二情感类型关联的第二训练语句;
所述步骤S101中,分别对第一训练语料进行训练得到第一情感函数,对第二训练语料进行训练得到第二情感函数;
所述第一情感函数采用进行训练,所述第二情感函数采用进行训练,其中,所述wi'为第一情感函数中第i个单词的权重,所述wi”为第二情感函数中第i个单词的权重,xi'为第一训练语句对应的训练向量值的第i个维度的值,xi”为第二训练语句对应的训练向量值的第i个维度的值,所述Wp'为第一情感函数中所有权重之和,所述Wp”为第二情感函数中所有权重之和,y'为第一训练情感值,y”为第二训练情感值,n'为第一训练语料不同单词的个数,n”为第二训练语料不同单词的个数,且设定当xi'=0时,当xi”=0时, log w i ′ ′ x i ′ ′ W p ′ ′ = 0 ;
所述步骤S102中,将用户输入语句根据第一情感函数的单词顺序向量化为第一用户输入向量,将用户输入语句根据第二情感函数的单词顺序向量化为第二用户输入向量,分别计算第一用户情感值和第二用户情感值,所述第一用户情感值y1和所述第二用户情感值y2分别为:
y 1 = 1 1 + exp ( Σ i = 1 n ′ ′ ( log w i ′ ′ x 2 i W p ′ ′ ) - Σ i = 1 n ′ ( log w i ′ x 1 i W p ′ ) ) y 2 = 1 1 + exp ( Σ i = 1 n ′ ( log w i ′ x 1 i W p ′ ) - Σ i = 1 n ′ ′ ( log w i ′ ′ x 2 i W p ′ ′ ) ) , 其中x1i为第一用户输入向量的第i个维度的值,x2i为第一用户输入向量的第i个维度的值;
所述步骤S103中,如果y1>y2,且y1与y2的差值的绝对值大于或等于预设第一阈值,则用户情感类型为第一情感类型,如果y1<y2,且y1与y2的差值的绝对值大于或等于预设第二阈值,则用户情感类型为第二情感类型。
步骤S101,通过多个第一训练语句训练出wi',通过多个第二训练语句训练出wi”,然后在S102,输入第一用户输入向量和第二用户输入向量计算得到第一用户情感值y1和第二用户情感值y2。上述公式中,第一训练语句对应的训练向量值与第一情感函数的单词顺序相同,即wi'所对应的单词与xi'所对应的单词相同,第二训练语句对应的训练向量值与第二情感函数的单词顺序相同,即wi”所对应的单词与xi”所对应的单词相同,第一情感函数的单词顺序与第一用户输入向量的单词顺序相同,即wi'所对应的单词与x1i所对应的单词相同,第二情感函数的单词顺序与第二用户输入向量的单词顺序相同,即wi”所对应的单词与x2i所对应的单词相同。
优选地,如果y1>y2,且y1与y2的差值的绝对值小于预设第一阈值,则用户情感类型为第三情感类型,如果y1<y2,且y1与y2的差值的绝对值小于预设第二阈值,则用户情感类型为第三情感类型。
优选地,第一训练语料为积极情感语料,第二训练语料为消极情感语料,第一情感类型为积极情感类型,第二情感类型为消极情感类型,第三情感类型为中性情感类型。所述积极情感语料包括多个预先选定的具有积极情感词的情感语句,所述消极情感语料包括多个预先选定的具有消极情感词的情感语句。
预先设定积极情感语料和消极情感语料,当计算得到用户情感类型为积极情感类型,则表示用户的情感积极,此时可以选择与积极情感类型对应的回答,例如向用户推荐商品或对用户进行赞美等的回答,当计算得到用户情感类型为消极情感类型,则表示用户的情感消极,此时可以选择与消极情感类型对应的回答,例如对用户进行安慰或鼓励等的回答。
如图2所示为本发明最佳实施例的工作流程图,包括:
步骤S201,通过大量的训练语料训练情感函数,基于进行训练得到情感函数。然后输入已有的积极语料和消极语料,训练关于积极语料的积极情感函数和关于消极语料的消极情感函数。
步骤202,通过分词算法对用户输入的语句进行切割,去除停用词和其他多余的标点符号。保证词的细粒度和准确性。
步骤S203,在接收到所有的分词后,对词和不准确的词进行二次切割和语料的填充,把词的隐含信息进行补全,从而来提高后期的准确率。比如“他是哪国人”,分词后会变成“他/是/哪/国人”,在信息补充后会变成“他/是/哪个/国家/人”。这样就可以避免由于分词的不准而造成的干扰。
步骤S204,在接收到词后,对所有的词进行替换,判断哪些是姓名、哪些是商品、哪些是数字等等,为语义分析进行再一次的过滤。
步骤S205,在用户输入的语句时会潜在隐含一些情感的信息,如高兴、愤怒、激动、生气等等,在接收到实体的信息后,对所有的信息进行向量化处理,并分别采用积极情感函数的权重和消极情感函数的权重进行计算积极情感值和消极情感值。向量化处理是指将用户输入的语句中所包括的词语对应的维度设为1,例如“我想去北京”,则对于一个向量(X1,X2,X3,X4,X5,X6,X7)来说,其向量值则为(1,0,1,1,0,1,0),其中X1对应“我”,X2对应“你”,X3对应“想”,X4对应“去”,X5对应“回”,X6对应“北京”,X7对应“天津”。上述只是一个例子,实际上的向量值的维度数量并不限于七个。
积极情感值和消极情感值的例子如下所示:
比如输入一句话“今天天气不错啊”,分词后得到“今天”,“天气”,“不错”,“啊”,其中“啊”因为是停用词,所以会被去掉,进入一步的时候只剩下了“今天”,“天气”,“不错”这三个字了。
接着这三个词会采用积极情感函数的权重进行计算,生成向量,“今天”在积极情感函数里面的权重为202,“天气”在积极情感函数里面的权重是23,“不错”在积极情感函数里的权重是5754;
然后计算其中Wp'为514407是积极情感函数里所有权重的总数,将上述数据代入得到:
sum1=log(0.000393)+log(0.000045)+log(0.011186)=-25.347032
接着将上述三个词在消极训练函数的权重进行计算,“今天”在消极情感函数里面的权重为145,“天气”在消极情感函数里面的权重为48,“不错”在消极情感函数里面的权重为918。
然后计算其中Wp”为465577是消极情感函数里所有权重的总数,将上述数据代入得到:
sum2=log(0.000311)+log(0.000103)+log(0.001972)=-26.665772。
最后来计算积极情感值pos_score和消极情感值neg_score:
pos_score=1.0/(1.0+exp(sum2–sum1))=0.7889
neg_score=1.0/(1.0+exp(sum1–sum2))=0.21102
步骤S206,根据积极情感值和消极情感值确定情感类型,采用相应的回答答案以回答用户的输入。
对于上述例子由于pos_score>neg_score且两者的差值的绝对值大于预设阈值0.1,因此得到的这句话的情感类型是积极情感类型,然后就可以从回答的答案中选择出属于积极情感类型的答案,比如赞同用户的观点,或者询问他是否想要今天出去郊游、娱乐等等。
如图3所示为本发明一种人机对话的语义分析系统的结构模块图,包括:
函数训练模块301,用于:获取训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;
情感值计算模块302,用于:获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;
情感执行模块303,用于:从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。
在其中一个实施例中:
所述函数训练模块,具体包括:获取包括多个训练语句的训练语料,每个训练语句与一种情感类型关联,对所述训练语料进行训练,得到用于对情感类型进行分类的情感函数,所述情感值用于表示输入情感函数的语句所属的情感类型;
所述情感执行模块,具体包括:根据所述用户情感值确定对应的情感类型为用户情感类型,从与所述用户输入语句相关的多个回答答案中,选择所述用户情感类型所对应的回答答案作为语义分析答案,显示所述语义分析答案。
在其中一个实施例中:
所述函数训练模块,还包括:将所述训练语句进行向量化处理得到训练向量值,对多个所述训练向量值进行训练得到情感函数,所述训练向量值包括多个维度,且每个维度与一个单词关联,在所述训练向量值中将所述训练语句所包括的单词所对应的维度置1;
所述情感值计算模块,还包括:将所述用户输入语句进行向量化处理得到用户输入向量值,,所述用户输入向量值包括多个维度,且每个维度与一个单词关联,在所述用户输入向量值中将所述用户输入语句所包括的单词所对应的维度置1。
在其中一个实施例中:
所述情感类型包括第一情感类型和第二情感类型,所述训练语料包括第一训练语料和第二训练语料,所述第一训练语料包括多个预先选定的与第一情感类型关联的第一训练语句,所述第二训练语料包括多个预先选定的与第二情感类型关联的第二训练语句;
所述函数训练模块中,分别对第一训练语料进行训练得到第一情感函数,对第二训练语料进行训练得到第二情感函数;
所述第一情感函数采用进行训练,所述第二情感函数采用进行训练,其中,所述wi'为第一情感函数中第i个单词的权重,所述wi”为第二情感函数中第i个单词的权重,xi'为第一训练语句对应的训练向量值的第i个维度的值,xi”为第二训练语句对应的训练向量值的第i个维度的值,所述Wp'为第一情感函数中所有权重之和,所述Wp”为第二情感函数中所有权重之和,y'为第一训练情感值,y”为第二训练情感值,n'为第一训练语料不同单词的个数,n”为第二训练语料不同单词的个数,且设定当xi'=0时,当xi”=0时, log w i &prime; &prime; x i &prime; &prime; W p &prime; &prime; = 0 ;
所述情感值计算模块中,将用户输入语句根据第一情感函数的单词顺序向量化为第一用户输入向量,将用户输入语句根据第二情感函数的单词顺序向量化为第二用户输入向量,分别计算第一用户情感值和第二用户情感值,所述第一用户情感值y1和所述第二用户情感值y2分别为:
y 1 = 1 1 + exp ( &Sigma; i = 1 n &prime; &prime; ( log w i &prime; &prime; x 2 i W p &prime; &prime; ) - &Sigma; i = 1 n &prime; ( log w i &prime; x 1 i W p &prime; ) ) y 2 = 1 1 + exp ( &Sigma; i = 1 n &prime; ( log w i &prime; x 1 i W p &prime; ) - &Sigma; i = 1 n &prime; &prime; ( log w i &prime; &prime; x 2 i W p &prime; &prime; ) ) , 其中x1i为第一用户输入向量的第i个维度的值,x2i为第一用户输入向量的第i个维度的值;
所述情感执行模块中,如果y1>y2,且y1与y2的差值的绝对值大于或等于预设第一阈值,则用户情感类型为第一情感类型,如果y1<y2,且y1与y2的差值的绝对值大于或等于预设第二阈值,则用户情感类型为第二情感类型。
优选地,如果y1>y2,且y1与y2的差值的绝对值小于预设第一阈值,则用户情感类型为第三情感类型,如果y1<y2,且y1与y2的差值的绝对值小于预设第二阈值,则用户情感类型为第三情感类型。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种人机对话的语义分析方法,其特征在于,包括:
函数训练步骤,包括:获取包括多个训练语句的训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;
情感值计算步骤,包括:获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;
情感执行步骤,包括:从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。
2.根据权利要求1所述的人机对话的语义分析方法,其特征在于:
所述函数训练步骤,具体包括:获取包括多个训练语句的训练语料,每个训练语句与一种情感类型关联,对所述训练语料进行训练,得到用于对情感类型进行分类的情感函数,所述情感值用于表示输入情感函数的语句所属的情感类型;
所述情感执行步骤,具体包括:根据所述用户情感值确定对应的情感类型为用户情感类型,从与所述用户输入语句相关的多个回答答案中,选择所述用户情感类型所对应的回答答案作为语义分析答案,显示所述语义分析答案。
3.根据权利要求2所述的人机对话的语义分析方法,其特征在于:
所述函数训练步骤,还包括:将所述训练语句进行向量化处理得到训练向量值,对多个所述训练向量值进行训练得到情感函数,所述训练向量值包括多个维度,且每个维度与一个单词关联,在所述训练向量值中将所述训练语句所包括的单词所对应的维度置1;
所述情感值计算步骤,还包括:将所述用户输入语句进行向量化处理得到用户输入向量值,,所述用户输入向量值包括多个维度,且每个维度与一个单词关联,在所述用户输入向量值中将所述用户输入语句所包括的单词所对应的维度置1。
4.根据权利要求3所述的人机对话的语义分析方法,其特征在于:
所述情感类型包括第一情感类型和第二情感类型,所述训练语料包括第一训练语料和第二训练语料,所述第一训练语料包括多个预先选定的与第一情感类型关联的第一训练语句,所述第二训练语料包括多个预先选定的与第二情感类型关联的第二训练语句;
所述函数训练步骤中,分别对第一训练语料进行训练得到第一情感函数,对第二训练语料进行训练得到第二情感函数;
所述第一情感函数采用进行训练,所述第二情感函数采用进行训练,其中,所述wi'为第一情感函数中第i个单词的权重,所述wi”为第二情感函数中第i个单词的权重,xi'为第一训练语句对应的训练向量值的第i个维度的值,xi”为第二训练语句对应的训练向量值的第i个维度的值,所述Wp'为第一情感函数中所有权重之和,所述Wp”为第二情感函数中所有权重之和,y'为第一训练情感值,y”为第二训练情感值,n'为第一训练语料不同单词的个数,n”为第二训练语料不同单词的个数,且设定当xi'=0时,当xi”=0时, log = w i &prime; &prime; x i &prime; &prime; W p &prime; &prime; = 0 ;
所述情感值计算步骤中,将用户输入语句根据第一情感函数的单词顺序向量化为第一用户输入向量,将用户输入语句根据第二情感函数的单词顺序向量化为第二用户输入向量,分别计算第一用户情感值和第二用户情感值,所述第一用户情感值y1和所述第二用户情感值y2分别为:
y 1 = 1 1 + exp ( &Sigma; i = 1 n &prime; &prime; ( log w i &prime; &prime; x 2 i W p &prime; &prime; ) - &Sigma; i = 1 n &prime; ( log w i &prime; x 1 i W p &prime; ) ) y 2 = 1 1 + exp ( &Sigma; i = 1 n &prime; ( log w i &prime; x 1 i W p &prime; ) - &Sigma; i = 1 n &prime; &prime; ( log w i &prime; &prime; x 2 i W p &prime; &prime; ) ) , 其中x1i为第一用户输入向量的第i个维度的值,x2i为第一用户输入向量的第i个维度的值;
所述情感执行步骤中,如果y1>y2,且y1与y2的差值的绝对值大于或等于预设第一阈值,则用户情感类型为第一情感类型,如果y1<y2,且y1与y2的差值的绝对值大于或等于预设第二阈值,则用户情感类型为第二情感类型。
5.根据权利要求4所述的人机对话的语义分析方法,其特征在于,如果y1>y2,且y1与y2的差值的绝对值小于预设第一阈值,则用户情感类型为第三情感类型,如果y1<y2,且y1与y2的差值的绝对值小于预设第二阈值,则用户情感类型为第三情感类型。
6.一种人机对话的语义分析系统,其特征在于,包括:
函数训练模块,用于:获取包括多个训练语句的训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;
情感值计算模块,用于:获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;
情感执行模块,用于:从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。
7.根据权利要求6所述的人机对话的语义分析系统,其特征在于:
所述函数训练模块,具体包括:获取包括多个训练语句的训练语料,每个训练语句与一种情感类型关联,对所述训练语料进行训练,得到用于对情感类型进行分类的情感函数,所述情感值用于表示输入情感函数的语句所属的情感类型;
所述情感执行模块,具体包括:根据所述用户情感值确定对应的情感类型为用户情感类型,从与所述用户输入语句相关的多个回答答案中,选择所述用户情感类型所对应的回答答案作为语义分析答案,显示所述语义分析答案。
8.根据权利要求7所述的人机对话的语义分析系统,其特征在于:
所述函数训练模块,还包括:将所述训练语句进行向量化处理得到训练向量值,对多个所述训练向量值进行训练得到情感函数,所述训练向量值包括多个维度,且每个维度与一个单词关联,在所述训练向量值中将所述训练语句所包括的单词所对应的维度置1;
所述情感值计算模块,还包括:将所述用户输入语句进行向量化处理得到用户输入向量值,,所述用户输入向量值包括多个维度,且每个维度与一个单词关联,在所述用户输入向量值中将所述用户输入语句所包括的单词所对应的维度置1。
9.根据权利要求8所述的人机对话的语义分析系统,其特征在于:
所述情感类型包括第一情感类型和第二情感类型,所述训练语料包括第一训练语料和第二训练语料,所述第一训练语料包括多个预先选定的与第一情感类型关联的第一训练语句,所述第二训练语料包括多个预先选定的与第二情感类型关联的第二训练语句;
所述函数训练模块中,分别对第一训练语料进行训练得到第一情感函数,对第二训练语料进行训练得到第二情感函数;
所述第一情感函数采用进行训练,所述第二情感函数采用进行训练,其中,所述wi'为第一情感函数中第i个单词的权重,所述wi”为第二情感函数中第i个单词的权重,xi'为第一训练语句对应的训练向量值的第i个维度的值,xi”为第二训练语句对应的训练向量值的第i个维度的值,所述Wp'为第一情感函数中所有权重之和,所述Wp”为第二情感函数中所有权重之和,y'为第一训练情感值,y”为第二训练情感值,n'为第一训练语料不同单词的个数,n”为第二训练语料不同单词的个数,且设定当xi'=0时,当xi”=0时, log = w i &prime; &prime; x i &prime; &prime; W p &prime; &prime; = 0 ;
所述情感值计算模块中,将用户输入语句根据第一情感函数的单词顺序向量化为第一用户输入向量,将用户输入语句根据第二情感函数的单词顺序向量化为第二用户输入向量,分别计算第一用户情感值和第二用户情感值,所述第一用户情感值y1和所述第二用户情感值y2分别为:
y 1 = 1 1 + exp ( &Sigma; i = 1 n &prime; &prime; ( log w i &prime; &prime; x 2 i W p &prime; &prime; ) - &Sigma; i = 1 n &prime; ( log w i &prime; x 1 i W p &prime; ) ) y 2 = 1 1 + exp ( &Sigma; i = 1 n &prime; ( log w i &prime; x 1 i W p &prime; ) - &Sigma; i = 1 n &prime; &prime; ( log w i &prime; &prime; x 2 i W p &prime; &prime; ) ) , 其中x1i为第一用户输入向量的第i个维度的值,x2i为第一用户输入向量的第i个维度的值;
所述情感执行模块中,如果y1>y2,且y1与y2的差值的绝对值大于或等于预设第一阈值,则用户情感类型为第一情感类型,如果y1<y2,且y1与y2的差值的绝对值大于或等于预设第二阈值,则用户情感类型为第二情感类型。
10.根据权利要求9所述的人机对话的语义分析系统,其特征在于,如果y1>y2,且y1与y2的差值的绝对值小于预设第一阈值,则用户情感类型为第三情感类型,如果y1<y2,且y1与y2的差值的绝对值小于预设第二阈值,则用户情感类型为第三情感类型。
CN201510213919.3A 2015-04-29 2015-04-29 一种人机对话的语义分析方法及系统 Active CN104809103B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510213919.3A CN104809103B (zh) 2015-04-29 2015-04-29 一种人机对话的语义分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510213919.3A CN104809103B (zh) 2015-04-29 2015-04-29 一种人机对话的语义分析方法及系统

Publications (2)

Publication Number Publication Date
CN104809103A true CN104809103A (zh) 2015-07-29
CN104809103B CN104809103B (zh) 2018-03-30

Family

ID=53693934

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510213919.3A Active CN104809103B (zh) 2015-04-29 2015-04-29 一种人机对话的语义分析方法及系统

Country Status (1)

Country Link
CN (1) CN104809103B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224603A (zh) * 2015-09-01 2016-01-06 北京京东尚科信息技术有限公司 训练语料获取方法及装置
CN105631022A (zh) * 2015-12-29 2016-06-01 上海智臻智能网络科技股份有限公司 信息处理方法及装置
CN105760362A (zh) * 2016-02-04 2016-07-13 北京光年无限科技有限公司 一种面向智能机器人的问答评价方法及装置
CN105893344A (zh) * 2016-03-28 2016-08-24 北京京东尚科信息技术有限公司 基于用户语义情感分析的应答方法和装置
CN105929964A (zh) * 2016-05-10 2016-09-07 海信集团有限公司 人机交互方法及装置
CN106055662A (zh) * 2016-06-02 2016-10-26 竹间智能科技(上海)有限公司 基于情感的智能对话方法及系统
CN106202270A (zh) * 2016-06-28 2016-12-07 广州幽联信息技术有限公司 基于自然语言的人机对话方法及装置
CN106227740A (zh) * 2016-07-12 2016-12-14 北京光年无限科技有限公司 一种面向对话系统的数据处理方法及装置
WO2017020794A1 (zh) * 2015-07-31 2017-02-09 北京奇虎科技有限公司 一种交互系统的语音识别方法和装置
CN106599998A (zh) * 2016-12-01 2017-04-26 竹间智能科技(上海)有限公司 基于情感特征调整机器人回答的方法及系统
WO2017071474A1 (zh) * 2015-10-27 2017-05-04 中兴通讯股份有限公司 一种语料处理方法和装置及语料分析方法和装置
CN106991124A (zh) * 2017-03-02 2017-07-28 竹间智能科技(上海)有限公司 基于多互动情境编辑的回答方法及系统
CN107825429A (zh) * 2016-09-15 2018-03-23 富士施乐株式会社 对话装置和方法
CN108268450A (zh) * 2018-02-27 2018-07-10 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108388944A (zh) * 2017-11-30 2018-08-10 中国科学院计算技术研究所 Lstm神经网络芯片及其使用方法
CN108536681A (zh) * 2018-04-16 2018-09-14 腾讯科技(深圳)有限公司 基于情感分析的智能问答方法、装置、设备及存储介质
CN108874972A (zh) * 2018-06-08 2018-11-23 青岛里奥机器人技术有限公司 一种基于深度学习的多轮情感对话方法
CN109002498A (zh) * 2018-06-29 2018-12-14 北京百度网讯科技有限公司 人机对话方法、装置、设备及存储介质
CN109074363A (zh) * 2016-05-09 2018-12-21 华为技术有限公司 数据查询方法、数据查询系统确定方法和装置
CN109815321A (zh) * 2018-12-26 2019-05-28 出门问问信息科技有限公司 问答方法、装置、设备及存储介质
CN109977201A (zh) * 2019-01-28 2019-07-05 平安科技(深圳)有限公司 带情感的机器聊天方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125371A1 (en) * 2007-08-23 2009-05-14 Google Inc. Domain-Specific Sentiment Classification
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
CN102200969A (zh) * 2010-03-25 2011-09-28 日电(中国)有限公司 基于句子顺序的文本情感极性分类系统和方法
CN104008091A (zh) * 2014-05-26 2014-08-27 上海大学 一种基于情感值的网络文本情感分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125371A1 (en) * 2007-08-23 2009-05-14 Google Inc. Domain-Specific Sentiment Classification
CN102200969A (zh) * 2010-03-25 2011-09-28 日电(中国)有限公司 基于句子顺序的文本情感极性分类系统和方法
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
CN104008091A (zh) * 2014-05-26 2014-08-27 上海大学 一种基于情感值的网络文本情感分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
葛丽萍: "交互式问答系统中的待改进问题自动识别方法", 《中国优秀硕士学位论文全文数据库》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017020794A1 (zh) * 2015-07-31 2017-02-09 北京奇虎科技有限公司 一种交互系统的语音识别方法和装置
CN105224603A (zh) * 2015-09-01 2016-01-06 北京京东尚科信息技术有限公司 训练语料获取方法及装置
CN105224603B (zh) * 2015-09-01 2018-04-10 北京京东尚科信息技术有限公司 训练语料获取方法及装置
WO2017071474A1 (zh) * 2015-10-27 2017-05-04 中兴通讯股份有限公司 一种语料处理方法和装置及语料分析方法和装置
CN105631022A (zh) * 2015-12-29 2016-06-01 上海智臻智能网络科技股份有限公司 信息处理方法及装置
CN105631022B (zh) * 2015-12-29 2019-03-05 上海智臻智能网络科技股份有限公司 信息处理方法及装置
CN105760362A (zh) * 2016-02-04 2016-07-13 北京光年无限科技有限公司 一种面向智能机器人的问答评价方法及装置
CN105760362B (zh) * 2016-02-04 2018-07-27 北京光年无限科技有限公司 一种面向智能机器人的问答评价方法及装置
CN105893344A (zh) * 2016-03-28 2016-08-24 北京京东尚科信息技术有限公司 基于用户语义情感分析的应答方法和装置
CN109074363A (zh) * 2016-05-09 2018-12-21 华为技术有限公司 数据查询方法、数据查询系统确定方法和装置
CN105929964A (zh) * 2016-05-10 2016-09-07 海信集团有限公司 人机交互方法及装置
CN106055662A (zh) * 2016-06-02 2016-10-26 竹间智能科技(上海)有限公司 基于情感的智能对话方法及系统
CN106202270A (zh) * 2016-06-28 2016-12-07 广州幽联信息技术有限公司 基于自然语言的人机对话方法及装置
CN106227740A (zh) * 2016-07-12 2016-12-14 北京光年无限科技有限公司 一种面向对话系统的数据处理方法及装置
CN107825429B (zh) * 2016-09-15 2022-09-20 富士胶片商业创新有限公司 对话装置和方法
CN107825429A (zh) * 2016-09-15 2018-03-23 富士施乐株式会社 对话装置和方法
CN106599998B (zh) * 2016-12-01 2019-02-01 竹间智能科技(上海)有限公司 基于情感特征调整机器人回答的方法及系统
CN106599998A (zh) * 2016-12-01 2017-04-26 竹间智能科技(上海)有限公司 基于情感特征调整机器人回答的方法及系统
CN106991124A (zh) * 2017-03-02 2017-07-28 竹间智能科技(上海)有限公司 基于多互动情境编辑的回答方法及系统
CN108388944B (zh) * 2017-11-30 2019-10-18 中国科学院计算技术研究所 一种基于深度神经网络的自动聊天方法和机器人
CN108388944A (zh) * 2017-11-30 2018-08-10 中国科学院计算技术研究所 Lstm神经网络芯片及其使用方法
CN108268450A (zh) * 2018-02-27 2018-07-10 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108536681B (zh) * 2018-04-16 2023-05-30 腾讯科技(深圳)有限公司 基于情感分析的智能问答方法、装置、设备及存储介质
CN108536681A (zh) * 2018-04-16 2018-09-14 腾讯科技(深圳)有限公司 基于情感分析的智能问答方法、装置、设备及存储介质
CN108874972B (zh) * 2018-06-08 2021-10-19 合肥工业大学 一种基于深度学习的多轮情感对话方法
CN108874972A (zh) * 2018-06-08 2018-11-23 青岛里奥机器人技术有限公司 一种基于深度学习的多轮情感对话方法
CN109002498A (zh) * 2018-06-29 2018-12-14 北京百度网讯科技有限公司 人机对话方法、装置、设备及存储介质
CN109815321A (zh) * 2018-12-26 2019-05-28 出门问问信息科技有限公司 问答方法、装置、设备及存储介质
CN109977201A (zh) * 2019-01-28 2019-07-05 平安科技(深圳)有限公司 带情感的机器聊天方法、装置、计算机设备及存储介质
CN109977201B (zh) * 2019-01-28 2023-09-22 平安科技(深圳)有限公司 带情感的机器聊天方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN104809103B (zh) 2018-03-30

Similar Documents

Publication Publication Date Title
CN104809103A (zh) 一种人机对话的语义分析方法及系统
CN105447206B (zh) 基于word2vec算法的新评论对象识别方法及系统
CN111666761B (zh) 细粒度情感分析模型训练方法及装置
CN106776538A (zh) 企业非标准格式文档的信息提取方法
CN106897559A (zh) 一种面向多数据源的症状体征类实体识别方法及装置
CN107301165A (zh) 一种试题难度分析方法及系统
CN102043774A (zh) 机器翻译测评装置和方法
CN105468468A (zh) 面向问答系统的数据纠错方法及装置
CN110781663A (zh) 文本分析模型的训练方法及装置、文本分析方法及装置
CN106527757A (zh) 一种输入纠错方法及装置
CN110992988B (zh) 一种基于领域对抗的语音情感识别方法及装置
CN107977676A (zh) 文本相似度计算方法及装置
CN106909573A (zh) 一种评价问答对质量的方法和装置
CN107291775A (zh) 错误样本的修复语料生成方法和装置
CN105609116A (zh) 一种语音情感维度区域的自动识别方法
CN104778283A (zh) 一种基于微博的用户职业分类方法及系统
CN112560451A (zh) 一种自动生成训练数据的错别字校对方法及装置
CN106933802A (zh) 一种面向多数据源的社保类实体识别方法及装置
CN107766560A (zh) 客服服务流程的评价方法和系统
CN103473356B (zh) 一种篇章级情感分类方法及装置
CN113486174B (zh) 模型训练、阅读理解方法、装置、电子设备及存储介质
CN111046674A (zh) 语义理解方法、装置、电子设备和存储介质
CN106502988A (zh) 一种目标属性抽取的方法和设备
CN102237089A (zh) 一种减少文本无关说话人识别系统误识率的方法
CN111008531B (zh) 语句选词模型的训练方法及装置、语句选词方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant