CN105631022B - 信息处理方法及装置 - Google Patents

信息处理方法及装置 Download PDF

Info

Publication number
CN105631022B
CN105631022B CN201511019484.5A CN201511019484A CN105631022B CN 105631022 B CN105631022 B CN 105631022B CN 201511019484 A CN201511019484 A CN 201511019484A CN 105631022 B CN105631022 B CN 105631022B
Authority
CN
China
Prior art keywords
answer
information
user
standard
feedback information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201511019484.5A
Other languages
English (en)
Other versions
CN105631022A (zh
Inventor
张磊
曾永梅
白杨
朱频频
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Original Assignee
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhizhen Intelligent Network Technology Co Ltd filed Critical Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority to CN201511019484.5A priority Critical patent/CN105631022B/zh
Publication of CN105631022A publication Critical patent/CN105631022A/zh
Application granted granted Critical
Publication of CN105631022B publication Critical patent/CN105631022B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Abstract

一种信息处理方法及装置,所述方法包括:获取问答日志数据,每条问答日志包括用户请求信息以及对应的答案信息,所述用户请求信息至少包括第一问题,所述答案信息至少包括与所述第一问题对应的第一答案;当所述用户请求信息还包括反馈信息时,对所述反馈信息进行情感分析,获取用户对所述第一答案的情感信息;所述反馈信息为用户针对所述第一答案所反馈的信息;当所述情感信息为贬义,且检测到用户再次提出所述第一问题时,通过搜索处理从知识库中选取第二答案并提供给用户。采用所述方法及装置,以提高用户体验。

Description

信息处理方法及装置
技术领域
本发明涉及信息交互领域,尤其涉及一种信息处理方法及装置。
背景技术
现今生活中,越来越多的用户通过网络进行购物或者办理业务。一些购物网站或者服务网站采用智能问答系统或人工客服系统来与用户进行信息交互。用户在对话框中输入咨询的问题,智能问答系统或人工客服系统根据用户输入的问题给出相应的答案。
在与智能问答系统或人工客服系统进行信息交互的过程中,用户可能会针对智能问答系统或人工回复的内容进行评价。现有技术中,只是直接地将交互内容添加到问答日志中。
然而,目前仍然难以了解用户对智能问答系统或人工回复的内容是否满意,只能通过让用户选择对本次对话内容是否满意进行评价,这会给用户增加不便,尤其是在用户对对话内容不满意时,还会进一步降低用户体验。
发明内容
本发明解决的技术问题是对于客服系统,如何提高用户的体验。
为解决上述技术问题,本发明实施例提供一种信息处理方法,包括:
获取问答日志数据,每条问答日志包括用户请求信息以及对应的答案信息,所述用户请求信息至少包括第一问题,所述答案信息至少包括与所述第一问题对应的第一答案;
当所述用户请求信息还包括反馈信息时,对所述反馈信息进行情感分析,获取用户对所述第一答案的情感信息;所述反馈信息为用户针对所述第一答案所反馈的信息;
当所述情感信息为贬义,且检测到用户再次提出所述第一问题时,通过搜索处理从知识库中选取第二答案并提供给用户。
可选的,当所述情感信息为贬义时,还包括:对所述知识库进行分析处理,并判断所述第一答案对应的第一标准问与所述第一问题的语义是否相同。
可选的,当所述第一答案对应的第一标准问与所述第一问题的语义相同时,将所述知识库中所述第一标准问对应的第一答案调整为第二答案。
可选的,当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与所述知识库中第二标准问的语义相同时,将所述第二标准问对应的答案作为第二答案。
可选的,当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与知识库中其它标准问的语义也不同时,在所述知识库中增加新的知识点,所述知识点包括:与所述第一问题的语义相同的第三标准问、扩展问及与所述第三标准问对应的第三答案。
可选的,所述对所述反馈信息进行情感分析包括:根据所述反馈信息中的标点符号对所述反馈信息进行分段;将各个分段与预设的情感值词典进行匹配,获取各个分段各自对应的情感值;将各个分段的情感值相加,得到所述反馈信息的情感值;对所述反馈信息的情感值分别与预设的贬义情感阈值以及褒义情感阈值进行比较,以确定所述反馈信息的情感信息。
可选的,所述对所述反馈信息进行情感分析包括:对所述反馈信息进行预处理操作,所述预处理操作包括:分句、分词、词性标注以及语法分析;对所述预处理后的反馈信息进行特征提取,将所述反馈信息向量化;将所述向量化的反馈信息输入至预设的情感分析模型中,确定所述向量化的反馈信息的情感信息。
可选的,所述信息处理方法还包括:当所述情感信息为褒义时,将所述问答日志添加至正确日志库。
可选的,所述当所述情感信息为贬义,且检测到用户再次提出所述第一问题时,还包括:将与所述用户的会话切换至人工客服端。
为解决上述问题,本发明实施例还提供了一种信息处理装置,包括:
问答日志数据获取单元,用于获取问答日志数据,所述问答日志数据中的每条问答日志包括用户请求信息以及对应的答案信息,所述用户请求信息至少包括第一问题,所述答案信息至少包括与所述第一问题对应的第一答案;
反馈信息提取单元,用于当所述用户请求信息还包括反馈信息时,从所述用户请求信息中提取所述反馈信息;所述反馈信息为用户针对所述第一答案所反馈的信息;
情感分析单元,用于对所述反馈信息进行情感分析,获取用户对所述第一答案的情感信息;
第二答案确定单元,用于当所述情感信息为贬义时,且检测到用户再次提出所述第一问题时,通过搜索处理从知识库中选取第二答案并提供给用户。
可选的,所述信息处理装置还包括:判断单元,用于当所述情感信息为贬义时,对所述知识库进行分析处理,并判断所述第一答案对应的第一标准问与所述第一问题的语义是否相同。
可选的,所述第二答案确定单元用于:当所述第一答案对应的第一标准问与所述第一问题的语义相同时,将所述知识库中所述第一标准问对应的第一答案调整为第二答案。
可选的,所述第二答案确定单元用于:当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与所述知识库中第二标准问的语义相同时,将所述第二标准问对应的答案作为第二答案。
可选的,所述信息处理装置还包括:知识点增加单元,用于当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与知识库中其它标准问的语义也不同时,在所述知识库中增加新的知识点,所述知识点包括:与所述第一问题的语义相同的第三标准问、扩展问及与所述第三标准问对应的第三答案。
可选的,所述情感分析单元用于:根据所述反馈信息中的标点符号对所述反馈信息进行分段;将各个分段与预设的情感值词典进行匹配,获取各个分段各自对应的情感值;将各个分段的情感值相加,得到所述反馈信息的情感值;对所述反馈信息的情感值分别与预设的贬义情感阈值以及褒义情感阈值进行比较,以确定所述反馈信息的评价语义。
可选的,所述情感分析单元用于:对所述反馈信息进行预处理操作,所述预处理操作包括:分句、分词、词性标注以及语法分析;对所述预处理后的反馈信息进行特征提取,将所述反馈信息向量化;将所述向量化的反馈信息输入至预设的情感分析模型中,确定所述向量化的反馈信息的评价语义。
可选的,所述信息处理装置还包括:正确日志库更新单元,用于当所述情感信息为褒义时,将所述问答日志添加至正确日志库。
可选的,所述信息处理装置还包括:切换单元,用于当检测到用户再次提出所述第一问题时,将与所述用户的会话切换至人工客服端。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
从问答日志数据中获取用户的反馈信息,对用户的反馈信息进行情感分析,来获知用户对回复的答案信息是否满意。当用户对第一答案的情感信息为贬义时,说明用户对回复的第一答案并不满意,也即回复的第一答案并不是用户想要的。当检测到用户再次提出的第一问题时,向用户提供第二答案,从而避免因继续向用户提供第一答案而导致用户不满意的情况再次发生,提升用户的体验。
进一步,在会话过程中,当情感信息为贬义,且检测到有用户再次提出第一问题时,则可以将会话切换至人工客服端,由人工客服对第一问题进行解答,可以提高用户满意度,提升用户体验。
此外,当获知用户对第一答案的情感信息为褒义时,表明用户对第一答案比较满意。此时,可以将问答日志添加到正确日志库中,从而利于后续的信息分析。
附图说明
图1是本发明实施例中的一种信息处理方法的流程图;
图2是本发明实施例中的一种信息处理装置的结构示意图。
具体实施方式
文本情感分析又称意见挖掘,是对带有情感色彩的主观性文本进行分析、处理归纳和推理的过程。情感分析对应的评价语义是词语所反映出来的说话人对所指对象的肯定或否定的感情态度,通常包括褒义和贬义两种。
现有技术中,在与智能问答系统或人工客服系统进行信息交互的过程中,用户可能会针对智能问答系统或人工回复的内容进行评价,评价内容以及用户提出的问题、回复的答案共同生成问答日志。
例如,用户向智能问答系统询问“我当前还有多少积分”,智能问答系统回复“您当前还有2000积分”,用户在获知自己的积分后,可以输入评价内容“好的,谢谢啊”。问题“我当前还有多少积分”、答案“您当前还有2000积分”、评价内容“好的,谢谢啊”共同生成这次会话对应的问答日志。
然而,目前仍然难以了解用户对智能问答系统或人工回复的内容是否满意,只能通过让用户选择对本次对话内容是否满意进行评价,例如,在会话结束时,提示用户给出对本次会话的满意程度,用户在“非常满意”、“一般”以及“不满意”这三个选项中选择一个来进行评价,这会给用户增加不便,尤其是在用户对对话内容不满意时,还会进一步降低用户体验。
在本发明实施例中,从问答日志数据中获取用户的反馈信息,对用户的反馈信息进行情感分析,来获知用户对回复的答案信息是否满意。当用户对第一答案的情感信息为贬义时,说明用户对回复的第一答案并不满意,也即回复的第一答案并不是用户想要的。当检测到用户再次提出的第一问题时,向用户提供第二答案,从而避免因继续向用户提供第一答案而导致用户不满意的情况再次发生,提升用户的体验。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种信息处理方法,参照图1,以下通过具体步骤进行详细说明。
步骤S101,获取问答日志数据。
在具体实施中,问答日志数据可以包括多条问答日志,一条问答日志可以包括一次会话过程中用户与智能问答系统或人工客服系统的全部会话内容。会话内容可以包括用户请求信息以及对应的答案信息,用户请求信息可以包括用户在会话窗口中输入的信息,例如,用户向智能问答系统或人工客服系统提出的问题;对应的答案信息可以包括智能问答系统或人工客服系统针对用户提出的问题所做出的回答。
在本发明实施例中,用户请求信息至少包括第一问题。相应地,答案信息中至少包括与第一问题对应的第一答案。
例如,在一次会话过程中,用户向智能问答系统提问“我当前还有多少余额?”,智能问答系统回复“您当前余额为500元”,则第一问题为“我当前还有多少余额?”,对应的第一答案为“您当前余额为500元”。
问答日志数据可以保存在智能问答系统或人工客服系统对应的服务器中。运行维护人员可以定期从服务器中获取某一时间段内的所有问答日志数据。例如,运行维护人员每天凌晨1:00,从服务器中获取昨天0:00~今天0:00内的所有问答日志数据。
在获取到问答日志数据后,可以执行步骤S102。
步骤S102,当所述用户请求信息还包括反馈信息时,对所述反馈信息进行情感分析,获取用户对所述第一答案的情感信息。
在实际应用中,用户在与智能问答系统或者人工客服系统进行会话时,在获知自己想要咨询的问题的答案后,可能会针对智能问答系统或者人工客服系统回复的答案给出自己的反馈。例如,用户在会话窗口中输入针对回复的答案的反馈信息。用户在会话窗口中输入的反馈信息可以是用户请求信息中的一部分,也就是说,用户请求信息可以包括用户输入的想要咨询的问题以及针对回复的答案输入的反馈信息。
例如,用户向智能问答系统提问“我当前还有多少余额?”,智能问答系统回复“您当前余额为500元”,则第一问题为“我当前还有多少余额?”,对应的第一答案为“您当前余额为500元”。用户在获知自己的余额后,继续在会话窗口中输入“好的,我知道了,谢谢啊”之类的反馈信息。本次会话中,用户请求信息包括“我当前还有多少余额?”、“好的,我知道了,谢谢啊”等信息。
用户在获知自己想要咨询的问题的答案后,也可能不在会话窗口中输入信息,直接关闭会话窗口,结束本次会话。在这种情况下,本次会话中,用户请求信息只包括用户输入的想要咨询的问题。
继续参照上述实例,用户在获知自己的余额后,关闭会话窗口,结束本次会话,则本次会话中,用户请求信息只包括“我当前还有多少余额?”。
也就是说,在会话过程中,用户有可能会针对回复的答案输入反馈信息,也有可能没有输入反馈信息。
因此,在本发明实施例中,可以先判断每一条问答日志中的用户请求信息是否包括反馈信息,该反馈信息为用户针对第一答案所反馈的信息。当用户请求信息中包括反馈信息时,可以对反馈信息进行情感分析,以获取用户对第一答案的情感信息。
在具体实施中,反馈信息可以是文本格式的,例如,用户通过键盘输入的反馈文本。反馈信息也可以是语音格式的,例如,用户通过麦克风输入的语音。反馈信息还可以是图片格式的,例如,用户选择表情图片作为反馈信息。
在本发明一实施例中,当反馈信息为文本格式时,采用如下步骤对反馈信息进行情感分析:
S21,根据反馈信息中的标点符号对反馈信息进行分段。
通常情况下,反馈信息为文本格式时,文本中可能会出现一些标点符号,例如逗号、句号、问号、感叹号等等,可以按照标点符号对反馈信息进行分段处理。
例如,用户输入的反馈信息为“好的,谢谢啊,再见”,则可以根据标点符号将用户输入的反馈信息分成“好的”、“谢谢啊”、“再见”三个分段。
S22,将各个分段与情感值词典进行匹配,获取各个分段各自对应的情感值。
在具体实施中,可以预先定义不同的情感值词典,包括以下四种类型情感词典:权值词典、负面词词典、程度词词典以及姓氏词典。以权值词典为主,负面词词典、程度词词典以及姓氏词典为辅助词典对分段进行情感值匹配。对权值词典的匹配拥有最高优先级,其次为负面词词典和程度词词典,姓氏词典用作特殊用途,在匹配权值词典后进行姓名排除。
将所有分段匹配的结果按顺序存储,作为中间结果。对中间结果进行处理,分析所有可能出现的句式结果,选取最优结果。选取最优结果的方法为挑选最佳句式匹配的方法,对于句式相近的多结果匹配,则根据程度词与情感词之间的距离判断,获取距离最小的一种句式作为结果。利用权值词典、负面词词典以及程度词词典中的情感值和权重,进行情感值计算。
根据情感值匹配结果,对分段的情感词赋值。根据中文句法构成,分析分段的组成结构,将负面词、权重词以及情感词进行排列以进行情感值计算,从而获取各个分段对应的情感值。
S23,将各个分段的情感值相加,得到所述反馈信息的情感值。
在获取到各个分段各自对应的情感值之后,可以将各个分段对应的情感值相加,得到的和值即可作为反馈信息的情感值。
S24,将反馈信息的情感值分别与预设的贬义情感阈值以及褒义情感阈值进行比较,以确定反馈信息的情感信息。
例如,贬义情感阈值为X1,褒义情感阈值为X2,且X2>X1。当反馈信息的情感值X0小于或等于贬义情感阈值X1时,判定反馈信息的情感信息为贬义;当反馈信息的情感值X0大于或等于褒义情感阈值X2时,判定反馈信息的情感信息为褒义;当反馈信息的情感值X0处于X1与X2之间时,判定反馈信息的情感信息为中性。
在本发明另一实施例中,当反馈信息为文本格式时,采用如下步骤对反馈信息进行情感分析:
S31,对反馈信息进行预处理操作。
在具体实施中,预处理操作可以包括分句、分词、词性标注以及语法分析等操作。
S32,对预处理后的反馈信息进行特征提取,将反馈信息向量化。
将反馈信息向量化,是为了将预处理后的反馈信息转化为情感分析模型训练器能够处理的格式。情感分析模型训练器可以定期对情感分析模型进行训练。情感分析模型可以根据预设的算法构建,例如,采用支持向量机(Support Vector Machine)或者逻辑回归(Logistic Regression)构建情感分析模型。
S33,将向量化的反馈信息输入至预设的情感分析模型中,确定所述向量化的反馈信息的情感信息。
将向量化的反馈信息输入至训练好的情感分析模型中,即可获知向量化的反馈信息对应的情感信息,也即可以获知用户的反馈信息的情感信息是褒义、贬义还是中性。
在实际应用中,还可以采用其他的文本情感分析方法对反馈信息进行情感分析,此处不做赘述。当反馈信息为语音格式或者图片格式时,也可以采用相对应的情感分析方法进行情感分析。
可以理解的是,用户输入的反馈信息还可能是第一问题的同义问,即用户有可能在接收到第一答案后,发现第一答案与自己提出的第一问题不相关,认为智能问答系统没有理解第一问题的语义,因此重新提出了一个与第一问题语义相同的问题。而情感分析算法对同义问进行情感分析后,得到的情感分析可能是中性的,但实质上用户对第一答案是不满意的。
因此,在本发明实施例中,当用户的请求信息不仅包括第一问题,还在收到第一答案时,又提出第一问题的同义问时,可以判定用户对第一答案并不满意,此时可以将该同义问作为反馈信息,且情感分析得出情感信息为贬义。
步骤S103,当所述情感信息为贬义,且检测到用户再次提出所述第一问题时,通过搜索处理从知识库中选取第二答案并提供给用户。
当获知用户对第一答案的情感信息为贬义时,表明用户可能对第一答案并不满意,第一答案可能是错误的答案,或者第一答案答非所问。当检测到有其他用户再次提出与第一答案对应的第一问题时,若仍继续向用户发送第一答案,则用户在获取到第一答案后,可能仍会对第一答案不满意。若多个用户多次都对第一答案不满意,若不及时进行修正,则可能会造成用户投诉量增加,甚至造成用户流失。
在本发明实施例中,为避免上述情况的发生,在检测到用户再次提出第一问题时,可以通过搜索处理,从知识库中选取第二答案并提供给用户,第一答案与第二答案为不同的答案。
也就是说,在获知用户对第一答案的情感信息为贬义,即用户对第一答案不满意时,若检测到有其他用户再次提出了第一问题,则可以将与第一答案不同的第二答案发送给用户,即向用户提供一个不同的答案,从而避免因继续向用户提供第一答案而导致用户不满意的情况再次发生,提高用户的体验。
在本发明实施例中,出现用户对第一答案的情感信息为贬义的原因包括以下几种:
1)在知识库中选取到的第一标准问的语义与第一问题的语义不同;
2)在知识库中选取到的第一标准问的答案为错误答案;
3)在知识库中不存在与第一问题语义相同的标准问。
知识库中包括多个知识点,每个知识点包括一个标准问、一个或多个扩展问以及与标准问对应的一个答案。所述标准问是用来表示某个知识点的文字,主要目标是表达清晰,便于维护,如“彩铃的资费”就是表达清晰的标准问描述。所述扩展问是用来表示某个知识点语义的语义表达式和自然语句集合,其与标准问的语义相同。
在实际应用中,在用户与智能问答系统进行会话时,智能问答系统在接收到用户输入的第一问题后,可以根据预设的匹配算法在服务器预设的知识库中查找与第一问题的相似度大于预设阈值的标准问。当存在多个与第一问题的相似度大于预设阈值的标准问时,从中选取与第一问题的相似度最大的标准问作为第一标准问。选取第一标准问对应的答案作为第一问题的答案,也即第一答案,并将第一答案发送给用户。
然而,匹配算法的精度存在一定的限制,无法保证每一次查找到的第一标准问的语义都与第一问题完全相同,可能出现第一标准问的语义与第一问题存在较大差异的情况。
由于第一标准问的语义与第一问题不同,因此第一标准问对应的答案很可能就不是用户想要获知的答案。用户在获知第一答案后,由于第一答案答非所问,可能会认为智能问答系统没有理解自己的意思,因此可能会输入诸如“你傻啊,你回答的这是什么!”、“你怎么这么弱智,这个问题你都回答不对”等等的反馈信息。或者用户可能会重新输入第一问题或者第一问题的同义问,重新向智能问答系统提问。
在本发明实施例中,针对原因1),可以在相似度大于预设阈值的标准问中,选择与第一问题的相似度仅低于第一标准问的第二标准问,将第二标准问作为与第一问题语义相同的标准问,并将第二标准问对应的答案作为第二答案发送给用户。
例如,用户输入的第一问题是“请帮我查一下尾号为2292的银行卡还有多少钱”。匹配算法计算得到的第一标准问为“尾号为2292的银行卡的信用额度”,得到的第二标准问为“尾号为2292的银行卡的余额”。智能问答系统在接收到第一问题后,在知识库中查找到第一标准问,第一标准问对应的答案为“尾号为2292的银行卡的信用额度为10000元”,因此发送给用户的第一答案为“尾号为2292的银行卡的信用额度为10000元”。
用户在接收到第一答案后,发现自己想要咨询的是银行卡的余额,而智能问答系统给出的答案却是银行卡的信用额度,智能问答系统明显的答非所问,可能会输入“你傻啊,你回答的这是什么!”的反馈信息,反馈信息以及第一问题、第一答案生成问答日志。
在获取到问答日志数据后,发现用户对第一答案的情感信息为贬义。当再次接收到有用户发送第一问题“请帮我查一下尾号为XXXX的银行卡还有多少钱”时,将第二标准问作为与第一问题的语义相同的标准问,第二标准问对应的答案为“尾号为XXXX的银行卡余额为XXXX元”,将第二标准问对应的答案作为第二答案并发送给用户。
在本发明实施例中,针对原因2),选取的第一标准问与第一问题的语义是相同的,但是与第一标准问对应的答案是错误的答案。因此,可以将第一标准问重新与正确的答案进行关联,正确的答案即为第二答案。
例如,用户输入的第一问题是“请帮我查一下尾号为2292的银行卡还有多少钱”。匹配算法计算得到的第一标准问为“尾号为2292的银行卡的余额”。智能问答系统在接收到第一问题后,在知识库中查找到第一标准问,第一标准问对应的答案为“尾号为2292的银行卡的信用额度为10000元”,因此发送给用户的第一答案为“尾号为2292的银行卡的信用额度为10000元”。
用户在接收到第一答案后,由于第一答案是错误的答案,因此对第一答案的情感信息为贬义。因此,在获取到问答日志数据后,发现用户对第一答案的情感信息为贬义。出现这种情况的原因是与第一标准问对应的答案为错误答案,因此可以将第一标准问重新进行答案关联,关联到正确答案,正确答案为“尾号为XXXX的银行卡余额为XXXX元”。当再次接收到有用户发送第一问题“请帮我查一下尾号为XXXX的银行卡还有多少钱”时,将正确答案“尾号为XXXX的银行卡余额为XXXX元”发送给用户。
在本发明实施例中,针对原因3),有可能是因为知识库中尚未存储与第一问题的关联度大于预设阈值的标准问,即知识库中没有存储与第一问题语义相同的标准问。此时,可以通过运行维护人员对知识库进行更新,在知识库中添加新的知识点,新的知识点可以包括:与第一问题的语义相同的第三标准问、扩展问以及第三标准问对应的答案。
例如,用户输入的第一问题为“你觉得《火星救援》这部电影怎么样”。由于知识库中没有存储与电影《火星救援》相关的标准问,因此智能问答系统可能无法回复用户,或者查找到与电影《火星救援》无关的内容回复给用户。在这种情况下,用户要么没有收到智能问答系统的回复,要么收到的回复是答非所问,通常用户会给一个贬义的反馈。
当获知是因为知识库中不存在与第一问题的关联度大于预设阈值的标准问,而导致用户的反馈信息对应的情感信息为贬义时,在知识库中建立第三标准问,第三标准问为“《火星救援》评价”,扩展问可以包括“你对《火星救援》怎么看”、“《火星救援》的观后感”等等,第三标准问对应的答案即可为《火星救援》的相关影评。
由此可见,从问答日志数据中获取用户的反馈信息,对用户的反馈信息进行情感分析,来获知用户对回复的答案信息是否满意。当用户对第一答案的情感信息为贬义时,说明用户对回复的第一答案并不满意,也即回复的第一答案并不是用户想要的。当检测到用户再次提出的第一问题时,向用户提供第二答案,从而避免因继续向用户提供第一答案而导致用户不满意的情况再次发生,提升用户的体验。
在具体实施中,当用户的反馈信息对应的情感信息为贬义时,若检测到有其他用户再次提出第一问题时,除了将第一问题对应的答案调整为第二答案外,还可以将当前与该用户的会话切换到人工客服端,由人工客服来对第一问题进行解答,也可以避免因继续向用户提供第一答案而导致用户不满意的情况再次发生,可以提高用户满意度,提升用户体验。
例如,用户输入的第一问题是“请帮我查一下尾号为2292的银行卡还有多少钱”。匹配算法计算得到的第一标准问为“尾号为2292的银行卡的余额”。智能问答系统在接收到第一问题后,在知识库中查找到第一标准问,第一标准问对应的答案为“尾号为2292的银行卡的信用额度为10000元”,因此发送给用户的第一答案为“尾号为2292的银行卡的信用额度为10000元”。用户在接收到第一答案后,由于第一答案是错误的答案,因此对第一答案的情感信息为贬义。
在获知用户对第一答案并不满意时,若再次接收到有其他用户发送第一问题“请帮我查一下尾号为XXXX的银行卡还有多少钱”时,将会话切换到人工客服端,由人工客服来为用户解答第一问题,从而可以提升用户的体验。
在具体实施中,当获知用户对第一答案的情感信息为褒义时,表明用户对第一答案比较满意。此时,可以将问答日志添加到正确日志库中,从而简单准确地实现对问答日志的分析处理,此外在之后接收到用户输入的第一问题时,可以直接从正确日志库中选择正确的标准问及对应的正确答案,可以提高智能问答系统回复的正确率。
例如,用户输入的第一问题是“请帮我查一下尾号为XXXX的银行卡还有多少钱”,智能问答系统回复的第一答案“尾号为XXXX的银行卡余额为XXXX元”,用户在获知银行卡的余额后,输入“好的,谢谢啊”等表征褒义的反馈信息,即可判定“请帮我查一下尾号为XXXX的银行卡还有多少钱”对应的答案“尾号为XXXX的银行卡余额为XXXX元”为正确答案。因此,可以将问题“请帮我查一下尾号为XXXX的银行卡还有多少钱”及对应的答案“尾号为XXXX的银行卡余额为XXXX元”添加到正确日志库中。
参照图2,本发明实施例提供了一种信息处理装置,包括:问答日志数据获取单元201、反馈信息提取单元202、情感分析单元203以及第二答案确定单元204,其中:
问答日志数据获取单元201,用于获取问答日志数据,所述问答日志数据中的每条问答日志包括用户请求信息以及对应的答案信息,所述用户请求信息至少包括第一问题,所述答案信息至少包括与所述第一问题对应的第一答案;
反馈信息提取单元202,用于当所述用户请求信息还包括反馈信息时,从所述用户请求信息中提取所述反馈信息;所述反馈信息为用户针对所述第一答案所反馈的信息;
情感分析单元203,用于对所述反馈信息进行情感分析,获取用户对所述第一答案的情感信息;
第二答案确定单元204,用于当所述情感信息为贬义时,且检测到用户再次提出所述第一问题时,通过搜索处理从知识库中选取第二答案并提供给用户。
在具体实施中,所述信息处理装置还可以包括:判断单元205,用于当所述情感信息为贬义时,对所述知识库进行分析处理,并判断所述第一答案对应的第一标准问与所述第一问题的语义是否相同。
在具体实施中,所述第二答案确定单元204可以用于:当所述第一答案对应的第一标准问与所述第一问题的语义相同时,将所述知识库中所述第一标准问对应的第一答案调整为第二答案。
在具体实施中,所述第二答案确定单元204可以用于:当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与所述知识库中第二标准问的语义相同时,将所述第二标准问对应的答案作为第二答案。
在具体实施中,所述信息处理装置还可以包括:知识点增加单元206,用于:当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与知识库中其它标准问的语义也不同时,在所述知识库中增加新的知识点,所述知识点包括:与所述第一问题的语义相同的第三标准问、扩展问及与所述第三标准问对应的第三答案。
在具体实施中,所述情感分析单元203可以用于:根据所述反馈信息中的标点符号对所述反馈信息进行分段;将各个分段与预设的情感值词典进行匹配,获取各个分段各自对应的情感值;将各个分段的情感值相加,得到所述反馈信息的情感值;对所述反馈信息的情感值分别与预设的贬义情感阈值以及褒义情感阈值进行比较,以确定所述反馈信息的评价语义。
在具体实施中,所述情感分析单元203可以用于:对所述反馈信息进行预处理操作,所述预处理操作包括:分句、分词、词性标注以及语法分析;对所述预处理后的反馈信息进行特征提取,将所述反馈信息向量化;将所述向量化的反馈信息输入至预设的情感分析模型中,确定所述向量化的反馈信息的评价语义。
在具体实施中,所述信息处理装置还可以包括:正确日志库更新单元207,用于当所述情感信息为褒义时,将所述问答日志添加至正确日志库。
在具体实施中,所述信息处理装置还可以包括:切换单元,用于当检测到用户再次提出所述第一问题时,将与所述用户的会话切换至人工客服端。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (18)

1.一种信息处理方法,其特征在于,包括:
获取问答日志数据,每条问答日志包括用户请求信息以及对应的答案信息,所述用户请求信息至少包括第一问题,所述答案信息至少包括与所述第一问题对应的第一答案;所述第一答案通过以下方式获得:在接收到用户输入的第一问题后,根据预设的匹配算法在预设的知识库中查找与第一问题的相似度大于预设阈值的标准问,当存在多个与第一问题的相似度大于预设阈值的标准问时,从中选取与第一问题的相似度最大的标准问作为第一标准问,选取第一标准问对应的答案作为第一答案;
当所述用户请求信息还包括反馈信息时,对所述反馈信息进行情感分析,获取用户对所述第一答案的情感信息;所述反馈信息为用户针对所述第一答案所反馈的信息,所述反馈信息不包括通过提示用户给出本次会话的满意程度得到的信息;
当所述情感信息为贬义,且检测到用户再次提出所述第一问题时,通过搜索处理从知识库中选取第二答案并提供给用户。
2.如权利要求1所述的信息处理方法,其特征在于,当所述情感信息为贬义时,还包括:对所述知识库进行分析处理,并判断所述第一答案对应的第一标准问与所述第一问题的语义是否相同。
3.如权利要求2所述的信息处理方法,其特征在于,当所述第一答案对应的第一标准问与所述第一问题的语义相同时,将所述知识库中所述第一标准问对应的第一答案调整为第二答案。
4.如权利要求2所述的信息处理方法,其特征在于,当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与所述知识库中第二标准问的语义相同时,将所述第二标准问对应的答案作为第二答案。
5.如权利要求2所述的信息处理方法,其特征在于,当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与知识库中其它标准问的语义也不同时,在所述知识库中增加新的知识点,所述知识点包括:与所述第一问题的语义相同的第三标准问、扩展问及与所述第三标准问对应的第三答案。
6.如权利要求1所述的信息处理方法,其特征在于,所述对所述反馈信息进行情感分析包括:
根据所述反馈信息中的标点符号对所述反馈信息进行分段;
将各个分段与预设的情感值词典进行匹配,获取各个分段各自对应的情感值;将各个分段的情感值相加,得到所述反馈信息的情感值;
对所述反馈信息的情感值分别与预设的贬义情感阈值以及褒义情感阈值进行比较,以确定所述反馈信息的情感信息。
7.如权利要求1所述的信息处理方法,其特征在于,所述对所述反馈信息进行情感分析包括:
对所述反馈信息进行预处理操作,所述预处理操作包括:分句、分词、词性标注以及语法分析;
对所述预处理后的反馈信息进行特征提取,将所述反馈信息向量化;
将所述向量化的反馈信息输入至预设的情感分析模型中,确定所述向量化的反馈信息的情感信息。
8.如权利要求1所述的信息处理方法,其特征在于,还包括:当所述情感信息为褒义时,将所述问答日志添加至正确日志库。
9.如权利要求1所述的信息处理方法,其特征在于,所述当所述情感信息为贬义,且检测到用户再次提出所述第一问题时,还包括:将与用户的会话切换至人工客服端。
10.一种信息处理装置,其特征在于,包括:
问答日志数据获取单元,用于获取问答日志数据,所述问答日志数据中的每条问答日志包括用户请求信息以及对应的答案信息,所述用户请求信息至少包括第一问题,所述答案信息至少包括与所述第一问题对应的第一答案;所述第一答案通过以下方式获得:在接收到用户输入的第一问题后,根据预设的匹配算法在预设的知识库中查找与第一问题的相似度大于预设阈值的标准问,当存在多个与第一问题的相似度大于预设阈值的标准问时,从中选取与第一问题的相似度最大的标准问作为第一标准问,选取第一标准问对应的答案作为第一答案;
反馈信息提取单元,用于当所述用户请求信息还包括反馈信息时,从所述用户请求信息中提取所述反馈信息;所述反馈信息为用户针对所述第一答案所反馈的信息,所述反馈信息不包括通过提示用户给出本次会话的满意程度得到的信息;
情感分析单元,用于对所述反馈信息进行情感分析,获取用户对所述第一答案的情感信息;
第二答案确定单元,用于当所述情感信息为贬义时,且检测到用户再次提出所述第一问题时,通过搜索处理从知识库中选取第二答案并提供给用户。
11.如权利要求10所述的信息处理装置,其特征在于,还包括:判断单元,用于当所述情感信息为贬义时,对所述知识库进行分析处理,并判断所述第一答案对应的第一标准问与所述第一问题的语义是否相同。
12.如权利要求11所述的信息处理装置,其特征在于,所述第二答案确定单元用于:当所述第一答案对应的第一标准问与所述第一问题的语义相同时,将所述知识库中所述第一标准问对应的第一答案调整为第二答案。
13.如权利要求11所述的信息处理装置,其特征在于,所述第二答案确定单元用于:当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与所述知识库中第二标准问的语义相同时,将所述第二标准问对应的答案作为第二答案。
14.如权利要求11所述的信息处理装置,其特征在于,还包括:知识点增加单元,用于当所述第一答案对应的第一标准问与所述第一问题的语义不同,且与知识库中其它标准问的语义也不同时,在所述知识库中增加新的知识点,所述知识点包括:与所述第一问题的语义相同的第三标准问、扩展问及与所述第三标准问对应的第三答案。
15.如权利要求10所述的信息处理装置,其特征在于,所述情感分析单元用于:根据所述反馈信息中的标点符号对所述反馈信息进行分段;将各个分段与预设的情感值词典进行匹配,获取各个分段各自对应的情感值;将各个分段的情感值相加,得到所述反馈信息的情感值;对所述反馈信息的情感值分别与预设的贬义情感阈值以及褒义情感阈值进行比较,以确定所述反馈信息的评价语义。
16.如权利要求10所述的信息处理装置,其特征在于,所述情感分析单元用于:对所述反馈信息进行预处理操作,所述预处理操作包括:分句、分词、词性标注以及语法分析;对所述预处理后的反馈信息进行特征提取,将所述反馈信息向量化;将所述向量化的反馈信息输入至预设的情感分析模型中,确定所述向量化的反馈信息的评价语义。
17.如权利要求10所述的信息处理装置,其特征在于,还包括:
正确日志库更新单元,用于当所述情感信息为褒义时,将所述问答日志添加至正确日志库。
18.如权利要求10所述的信息处理装置,其特征在于,还包括:切换单元,用于当检测到用户再次提出所述第一问题时,将与用户的会话切换至人工客服端。
CN201511019484.5A 2015-12-29 2015-12-29 信息处理方法及装置 Active CN105631022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511019484.5A CN105631022B (zh) 2015-12-29 2015-12-29 信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511019484.5A CN105631022B (zh) 2015-12-29 2015-12-29 信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN105631022A CN105631022A (zh) 2016-06-01
CN105631022B true CN105631022B (zh) 2019-03-05

Family

ID=56045955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511019484.5A Active CN105631022B (zh) 2015-12-29 2015-12-29 信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN105631022B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764480B (zh) * 2016-08-23 2020-07-07 上海智臻智能网络科技股份有限公司 一种信息处理的系统
CN106682224B (zh) * 2017-01-04 2020-08-28 上海智臻智能网络科技股份有限公司 一种数据录入方法、系统及数据库
CN107315772B (zh) * 2017-05-24 2019-08-16 北京邮电大学 基于深度学习的问题匹配方法以及装置
CN107423440B (zh) * 2017-08-04 2020-09-01 逸途(北京)科技有限公司 一种基于情感分析的问答上下文切换与强化选择方法
CN110033281B (zh) * 2018-01-11 2023-07-21 中兴通讯股份有限公司 一种智能客服至人工客服转换的方法及装置
CN108491519A (zh) * 2018-03-26 2018-09-04 上海智臻智能网络科技股份有限公司 人机交互方法及装置、存储介质、终端
CN108536807B (zh) * 2018-04-04 2022-03-25 联想(北京)有限公司 一种信息处理方法及装置
CN108664469B (zh) * 2018-05-07 2021-11-19 首都师范大学 一种情感类别确定方法、装置及服务器
CN108920530B (zh) * 2018-06-08 2022-01-28 泰康保险集团股份有限公司 一种信息处理方法、装置、存储介质及电子设备
CN108898435A (zh) * 2018-06-28 2018-11-27 北京京东尚科信息技术有限公司 会话数据处理方法及系统、计算机系统及可读存储介质
CN110879837B (zh) * 2018-09-06 2022-01-14 华为技术有限公司 一种信息处理方法及装置
CN109213847A (zh) * 2018-09-14 2019-01-15 广州神马移动信息科技有限公司 答案的分层方法及其装置、电子设备、计算机可读介质
CN112182181B (zh) * 2018-11-01 2023-08-29 百度在线网络技术(北京)有限公司 智能交互方法和装置
US11494566B2 (en) * 2020-04-28 2022-11-08 Avaya Management L.P. Systems and methods for adaptive emotion based automated emails and/or chat replies
CN111767382A (zh) * 2020-06-30 2020-10-13 平安国际智慧城市科技股份有限公司 生成反馈信息的方法、装置及终端设备
CN111930908A (zh) * 2020-08-10 2020-11-13 腾讯科技(深圳)有限公司 基于人工智能的答案识别方法及装置、介质、电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682124A (zh) * 2012-05-16 2012-09-19 苏州大学 一种文本的情感分类方法及装置
CN103544321A (zh) * 2013-11-06 2014-01-29 北京国双科技有限公司 用于微博情感信息的数据处理方法和装置
CN104699708A (zh) * 2013-12-09 2015-06-10 中国移动通信集团北京有限公司 一种客服机器人的自学习方法及装置
CN104809103A (zh) * 2015-04-29 2015-07-29 北京京东尚科信息技术有限公司 一种人机对话的语义分析方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040249796A1 (en) * 2003-06-06 2004-12-09 Microsoft Corporation Query classification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682124A (zh) * 2012-05-16 2012-09-19 苏州大学 一种文本的情感分类方法及装置
CN103544321A (zh) * 2013-11-06 2014-01-29 北京国双科技有限公司 用于微博情感信息的数据处理方法和装置
CN104699708A (zh) * 2013-12-09 2015-06-10 中国移动通信集团北京有限公司 一种客服机器人的自学习方法及装置
CN104809103A (zh) * 2015-04-29 2015-07-29 北京京东尚科信息技术有限公司 一种人机对话的语义分析方法及系统

Also Published As

Publication number Publication date
CN105631022A (zh) 2016-06-01

Similar Documents

Publication Publication Date Title
CN105631022B (zh) 信息处理方法及装置
CN106790004B (zh) 基于人工智能的客服辅助实时提示系统
CN110555095B (zh) 人机对话方法和装置
JP2020537777A (ja) 発言のユーザ意図を識別するための方法および装置
CN111708869B (zh) 人机对话的处理方法及装置
WO2021017612A1 (zh) 基于语音分析的问答方法、装置、设备及存储介质
WO2020086234A1 (en) Machine learning tool for navigating a dialogue flow
US20190124202A1 (en) Call center system having reduced communication latency
CN109189898A (zh) 一种智能应答方法和系统
US11210286B2 (en) Facet-based conversational search
CN110879837B (zh) 一种信息处理方法及装置
CN105868179A (zh) 一种智能问答方法及装置
CN110019729B (zh) 智能问答方法及存储介质、终端
CN113076423A (zh) 数据处理方法及装置、数据查询方法及装置
JP2019139574A (ja) 情報提供装置、情報提供方法、およびプログラム
CN111581360A (zh) 一种辅助客服的方法、系统和设备
CN113641805A (zh) 结构化问答模型的获取方法、问答方法及对应装置
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
WO2020219750A1 (en) Management of annotation jobs
CN111400479B (zh) 针对多轮对话的问题识别方法和装置
CN106021532A (zh) 关键词的显示方法和装置
JP6797382B1 (ja) 質問回答表示サーバ、質問回答表示方法及び質問回答表示プログラム
CN116484880A (zh) 信息处理方法、装置、电子设备及存储介质
CN114546326A (zh) 一种虚拟人手语生成方法和系统
Anamalamudi et al. Smarty: An intelligent voice response system model for indian local languages

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20160601

Assignee: Chiyun Intelligent Equipment (Shanghai) Co.,Ltd.

Assignor: SHANGHAI XIAOI ROBOT TECHNOLOGY Co.,Ltd.

Contract record no.: X2022310000161

Denomination of invention: Information processing method and device

Granted publication date: 20190305

License type: Common License

Record date: 20221108

EE01 Entry into force of recordation of patent licensing contract