CN104598579A - 一种自动问答方法及系统 - Google Patents
一种自动问答方法及系统 Download PDFInfo
- Publication number
- CN104598579A CN104598579A CN201510017562.1A CN201510017562A CN104598579A CN 104598579 A CN104598579 A CN 104598579A CN 201510017562 A CN201510017562 A CN 201510017562A CN 104598579 A CN104598579 A CN 104598579A
- Authority
- CN
- China
- Prior art keywords
- user
- keyword
- behavior
- described user
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种自动问答方法和系统,该方法包括:在用户咨询的问题中提取关键词;根据所述用户的历史访问数据和所述关键词确定用户行为,所述用户行为表示用户进行业务咨询或者用户进行非业务咨询;针对所述用户咨询的问题生成符合所述用户行为的答案。在本发明实施例中,通过在用户咨询的问题中提取关键词和用户的历史访问数据确定出用户行为,即识别出该用户是否在进行业务咨询,作为回答用户咨询问题的基础,使得生成的答案符合用户行为,提高了自动问答系统的灵活度与准确率。另外,符合用户行为的答案还能够更好地吸引用户,从而增加用户粘合度。
Description
技术领域
本发明实施例涉及计算机技术领域,并且更具体地,涉及一种自动问答方法及系统。
背景技术
随着智能机器人应用范围越来越广泛,现在互联网或其它产业也使用智能机器人代替人工来处理一些事情,如提供自动问答功能。
传统的自动问答系统都是按照设计者设定好的技术流程回答用户通过用户设备提出的问题。具体地,分析用户提出的问题,通过提取并组装用户语言的特征(如关键词),将用户的问题与当前已设置好的问题进行匹配,然后根据现有的语料规则生成答案反馈给用户。但是,仅基于特征提取来识别用户的问题,具有一定的局限性,并不能有效地识别用户行为而做出针对性的回答,因此,降低了灵活度和准确率。
发明内容
本发明实施例提供一种自动问答方法及系统,能够提高了自动问答系统的灵活度与准确率,并增加用户粘合度。
第一方面,提供了一种自动问答方法,该方法包括:在用户咨询的问题中提取关键词;根据所述用户的历史访问数据和所述关键词确定用户行为,所述用户行为表示用户进行业务咨询或者用户进行非业务咨询;针对所述用户咨询的问题生成符合所述用户行为的答案。
结合第一方面,在一种可能的实现方式中,所述根据所述用户的历史访问数据和所述关键词确定用户行为,包括:在词库中匹配所述关键词,根据词库中关键词与权重的对应关系获得与所述关键词对应的权重,其中与所述关键词对应的权重是由所述用户的历史访问数据确定的;根据所述关键词和所述与所述关键词对应的权重获得行为值;根据所述行为值确定所述用户行为。
结合第一方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,在所述在词库中匹配所述关键词之前,所述方法还包括:根据所述用户的历史访问数据确定用户类型;所述根据词库中关键词与权重的对应关系获得与所述关键词对应的权重,包括:根据所述用户类型在词库中选择与所述关键词对应的权重。
结合第一方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,针对相同的关键词,为不同的用户类型所设置的权重不同。
结合第一方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述在词库中匹配所述关键词,包括:采用自然语言处理NLP中的字符串匹配的分词方法在词库中匹配所述关键词。
结合第一方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述根据所述关键词和所述与所述关键词对应的权重获得行为值,包括:采用朴素贝叶斯算法计算所述关键词和所述与所述关键词对应的权重获得行为值。
结合第一方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述根据所述行为值确定所述用户行为,包括:当所述行为值落在第一阈值区间时,则确定所述用户行为表示用户进行业务咨询;当所述行为值落在第二阈值区间时,则确定所述用户行为表示用户进行非业务咨询;其中所述第一阈值区间和所述第二阈值区间互不相交。
结合第一方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,在所述根据所述用户咨询的问题生成符合所述用户行为的答案之前,所述方法还包括:对所述用户咨询的问题进行预处理,所述预处理包括去除所述用户咨询的问题中的特殊字符。
结合第一方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述用户的历史访问数据包括下列至少之一:所述用户的聊天日志,所述用户对服务的评价行为,所述用户的活跃度评分,所述用户的产品消费能力,所述用户的年龄,所述用户的职业。
第二方面,提供一种自动问答系统,该系统包括:提取模块,用于在用户咨询的问题中提取关键词;确定模块,用于根据所述用户的历史访问数据和所述提取模块提取的所述关键词确定用户行为,所述用户行为表示用户进行业务咨询或者用户进行非业务咨询;生成模块,用于针对所述用户咨询的问题生成符合所述确定模块确定的所述用户行为的答案。
结合第二方面,在一种可能的实现方式中,所述确定模块进一步用于:在词库中匹配所述关键词,根据词库中关键词与权重的对应关系获得与所述关键词对应的权重,其中与所述关键词对应的权重是由所述用户的历史访问数据确定的;根据所述关键词和所述与所述关键词对应的权重获得行为值;根据所述行为值确定所述用户行为。
结合第二方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述确定模块还用于:根据所述用户的历史访问数据确定用户类型;根据所述用户类型在词库中选择与所述关键词对应的权重。
结合第二方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,针对相同的关键词,为不同的用户类型所设置的权重不同。
结合第二方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述确定模块进一步用于:采用自然语言处理NLP中的字符串匹配的分词方法在词库中匹配所述关键词。
结合第二方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述确定模块进一步用于:采用朴素贝叶斯算法计算所述关键词和所述与所述关键词对应的权重获得行为值。
结合第二方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述确定模块进一步用于:当所述行为值落在第一阈值区间时,则确定所述用户行为表示用户进行业务咨询,当所述行为值落在第二阈值区间时,则确定所述用户行为表示用户进行非业务咨询,其中所述第一阈值区间和所述第二阈值区间互不相交。
结合第二方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述系统还包括预处理模块,所述预处理模块,用于在所述生成单元根据所述用户咨询的问题生成符合所述用户行为的答案之前,对所述用户咨询的问题进行预处理,所述预处理包括去除所述用户咨询的问题中的特殊字符。
结合第二方面或其上述实现方式中的任一种实现方式,在另一种可能的实现方式中,所述用户的历史访问数据包括下列至少之一:所述用户的聊天日志,所述用户对服务的评价行为,所述用户的活跃度评分,所述用户的产品消费能力,所述用户的年龄,所述用户的职业。
在本发明实施例中,通过在用户咨询的问题中提取关键词和用户的历史访问数据确定出用户行为,即识别出该用户是否在进行业务咨询,作为回答用户咨询问题的基础,使得生成的答案符合用户行为,提高了自动问答系统的灵活度与准确率。另外,符合用户行为的答案还能够更好地吸引用户,从而增加用户粘合度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的自动问答方法的过程的示意性流程图。
图2是本发明另一个实施例的自动问答方法的过程的示意性流程图。
图3是本发明一个实施例的自动问答系统的示意性结构框图。
图4是本发明另一个实施例的自动问答系统的示意性结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
图1是本发明一个实施例的自动问答方法的过程的示意性流程图。图1的方法可以由自动问答系统(如JIMI系统)执行,包括:
步骤101,在用户咨询的问题中提取关键词。
步骤102,根据用户的历史访问数据和关键词确定用户行为,用户行为表示用户进行业务咨询或者用户进行非业务咨询。
步骤103,针对用户咨询的问题生成符合用户行为的答案。
其中,用户的历史访问数据可以是用户的基本资料(如用户的年龄、职业,和/或住址等),也可以是用户的行为信息(如用户对服务的评价行为,用户的活跃度评分,和/或用户的聊天日志等),或者,还可以是其他与用户相关联的信息(如用户的产品消费能力或者用户的历史咨询会话长度/咨询次数等)。应理解,本发明实施例对用户的历史访问数据不限于此。
还应理解,从用户咨询的问题中提取的关键词,可以是一个,也可以是多个,本发明实施例对提取的关键词数目不做限制。为了便于理解,本发明实施例将以一个关键词为例进行说明。
还需要说明的是,本发明对自动问答系统的产品化实现也不做限制,除了JIMI系统,还可以是其它产品。
在本发明实施例中,通过在用户咨询的问题中提取关键词和用户的历史访问数据确定出用户行为,即识别出该用户是否在进行业务咨询,作为回答用户咨询问题的基础,使得生成的答案符合用户行为,提高了自动问答系统的灵活度与准确率。另外,符合用户行为的答案还能够更好地吸引用户,从而增加用户粘合度。
可选地,作为一个实施例,可以在词库(如数据库)中存储历史咨询问题中的一些关键词,这些关键词分别对应权重。可选地,在步骤102中,可以包括如下步骤:
步骤1021,在该词库中匹配当前用户咨询问题中提取的关键词,根据词库中关键词与权重的对应关系获得与提取的关键词对应的权重。
具体地,可以由用户的历史访问数据确定用户类型,根据用户类型在词库中选择与关键词对应的权重。其中用户类型可以包括性格易怒用户和性格温和用户,或者用户类型可以包括恶意用户和非恶意用户,或者用户类型可以包括忠诚用户和非忠诚用户,等等。应理解,本发明实施例对于如何划分用户类型不做限制。另外,用户类型可以被划分成两类或两类以上。为了便于理解,本发明将以用户类型划分成两类进行说明。
例如,词库中存储有某个关键词Keyword1,针对恶意用户,该关键词对应的权重为a1,针对非恶意用户,该对应的权重为b1。当用户咨询问题时,在问题中提取关键词是Keyword1,在词库中匹配到该关键词,且从用户的历史访问数据中查询到该用户对于大多数服务给出差评,言论不实(如恶意诽谤)等情况,可以将该用户定义为恶意用户,因此,选择的权重为b1。
又例如,词库中存储有某个关键词Keyword2,针对忠诚用户,该关键词对应的权重为a2,针对非忠诚用户,该对应的权重为b2。当用户咨询问题时,在问题中提取关键词是Keyword2,在词库中匹配到该关键词,且从用户的历史访问数据中查询到该用户持续关注并购买某个商家的产品(如关注年限超过某个年限阈值或者购买数据超过某个数目阈值等情况),可以将该用户定义为忠诚用户,因此,选择的权重为a2。
应理解,上述例子仅仅是示例性的,而非要限制本发明的保护范围。
需要说明的是,为了便于理解,本发明权重取值范围可以是[0,1],当然,本发明也可以采用其它数值来对应关键词。具体地,针对不同的用户类型,相同的关键词,分别对应不同的数值,例如针对非恶意用户采用正数,而针对恶意用户采用某个负数。本发明对于数值类型和数值范围不做限制。
在本发明实施例中,优选地,针对相同的关键词,为不同的用户类型所设置的权重不同,即上述例子中a1和b1不同,或者a2和b2不同,当然,针对相同的关键词,为不同的用户类型所设置的权重也可以是相同的。优选地,可以采用NLP(Natural Language Processing,自然语言处理)中的字符串匹配的分词方法在词库中匹配关键词。字符串匹配的分词方法可以参考现有技术,此处不再赘述,应理解,本发明对此不做限制,可以采用其它算法或规则在词库中匹配关键词。
步骤1022,根据关键词和与关键词对应的权重获得行为值,根据行为值来确定用户行为。
可选地,可以采用朴素贝叶斯算法计算关键词和关键词对应的权重来获得行为值。本发明采用行为值来区分用户行为,除了本发明示例的朴素贝叶斯算法,当然,也可以采用其它算法来计算关键词和关键词对应的权重来获得行为值,本发明对此并不做限制。
可选地,当所述行为值落在第一阈值区间时,则确定所述用户行为表示用户进行业务咨询。当所述行为值落在第二阈值区间时,则确定所述用户行为表示用户进行非业务咨询,第一阈值区间和第二阈值区间互不相交。
例如,假设在用户咨询问题中提取了某个关键词是Keyword0并在步骤1021中获得了Keyword0对应的权重(假设为a0),对Keyword0和a0采用朴素贝叶斯算法进行计算得到行为值为value0,朴素贝叶斯算法可以参考现有技术,此处不再赘述。假设第一阈值区间为[value1min,value1max],第二阈值区间为[value2min,value2max],当行为值value0落在第一阈值区间时,则确定该用户是在进行业务咨询,当行为值value0落在第二阈值区间时,则确定该用户是在进行非业务咨询。非业务咨询可以是用户咨询一些非业务的问题,也可以是调戏系统,甚至可以是恶意攻击等,本发明对于非业务咨询的形式不做限制。
应理解,本发明对于如何设置阈值区间不做限制,例如第一阈值区间可能是[1,2],第二阈值区间是[0,1);或者,第一阈值区间为正数,第二阈值区间为负数。第一阈值区间的数值可以大于第二阈值区间的数值,也可以小于第二阈值区间的数值。可选地,如果计算出行为值未落在预设的任一阈值区间内,可以将用户行为确定为该用户是在进行业务咨询或者是进行非业务咨询,也可以按现有技术的方式生成答案,还可以不做出回答或者返回预设的特定形式的回答。
可选地,作为另一个实施例,在步骤103中,通过提取特征(如关键词)可以识别出用户的话语意思,结合确定的用户行为,给出符合用户行为的答案。例如,当识别用户的话语中具有调戏的意思,且确定的用户行为是进行非业务咨询时,系统可以生成相应的调戏语气词或者可以生成是一个链接网址(如某个笑话或某首歌曲等)或者生成俏皮话等作为答案返给用户。又例如,当识别用户的话语中具有调戏的意思,且确定的用户行为是进行业务咨询时,系统可以生成相应的业务回答并结合相应的调戏语气。当然,系统还可以针对业务问题,制定特殊文字或词语,或设置语气词等。
另外,在步骤103之前,可以对用户咨询的问题进行预处理,例如,去除用户咨询的问题中的特殊字符(如空格,繁体,和/或图文符号等)。这样,能够快速从用户咨询的问题中提取特征,有效地识别用户话语意思。
下面结合图2的实施例描述本发明。
步骤201,用户咨询自动问答系统。
步骤202,对用户咨询的问题进行预处理。
例如,去除用户咨询的问题中的一些特殊字符,这些特殊字符可以是空间,图文符号和/或数学符号等。
步骤203,从用户咨询的问题中提取特征。
例如,在去除了某些特殊字符的话语中提取一个或多个关键词,由此识别用户的话语意思。
步骤204,查询用户的历史访问数据。
可选地,可以查询该用户的基本资料,用户的行为信息和/或其它与用户相关的信息,具体例子可以参考上述,此处不再赘述。
步骤205,在词库中匹配关键值并获取与该关键值对应的权重。
步骤206,根据用户的历史访问数据和关键词确定用户行为。
具体地,由用户的历史访问数据确定用户类型,可以采用NLP算法中的字符串匹配的分词方法中在词库中匹配从当前用户咨询问题中提取的关键词,根据用户类型选择与关键词对应的权重,采用朴素贝叶斯算法计算关键词和关键词对应的权重来获得行为值,当行为值落在第一阈值区间时,则确定用户行为表示用户进行业务咨询,当行为值落在第二阈值区间时,则确定用户行为表示用户进行非业务咨询,第一阈值区间和第二阈值区间互不相交。
需要说明的是,本发明实施例可以在对用户咨询的问题进行预处理的同时查询用户的历史访问数据,即对于执行步骤202和204的顺序并不限定。
步骤207,针对用户咨询的问题和用户行为生成答案。
具体地,在步骤203中通过提取特征(如关键词)可以识别出用户的话语意思,结合步骤206中确定的用户行为,给出符合用户行为的答案。
更详细的例子可以参考上述,此处不再重复。
通过上述方案,在用户咨询的问题中提取关键词和用户的历史访问数据确定出用户行为,即识别出该用户是否在进行业务咨询,作为回答用户咨询问题的基础,使得生成的答案符合用户行为,提高了自动问答系统的灵活度与准确率。另外,符合用户行为的答案还能够更好地吸引用户,从而增加用户粘合度。
图3是本发明一个实施例的自动问答系统的示意性结构框图。自动问答系统300包括提取模块301,确定模块302和生成模块303。
提取模块301,用于在用户咨询的问题中提取关键词。
确定模块302,用于根据用户的历史访问数据和提取模块301提取的关键词确定用户行为,用户行为表示用户进行业务咨询或者用户进行非业务咨询。
生成模块303,用于针对用户咨询的问题生成符合确定模块302确定的用户行为的答案。
在本发明实施例中,通过在用户咨询的问题中提取关键词和用户的历史访问数据确定出用户行为,即识别出该用户是否在进行业务咨询,作为回答用户咨询问题的基础,使得生成的答案符合用户行为,提高了自动问答系统的灵活度与准确率。另外,符合用户行为的答案还能够更好地吸引用户,从而增加用户粘合度。
自动问答系统300可实现上述方法实施例,因此为避免重复,不再详细描述。
可选地,作为一个实施例,确定模块302可以进一步用于:在词库中匹配关键词,根据词库中关键词与权重的对应关系获得与关键词对应的权重,其中与关键词对应的权重是由用户的历史访问数据确定的;根据关键词和与关键词对应的权重获得行为值;根据行为值确定用户行为。具体地,确定模块302还可以用于:根据用户的历史访问数据确定用户类型;根据用户类型在词库中选择与关键词对应的权重。可选地,针对相同的关键词,为不同的用户类型所设置的权重不同;其中用户类型可以包括性格易怒用户和性格温和用户,或者用户类型可以包括恶意用户和非恶意用户,或者用户类型可以包括忠诚用户和非忠诚用户,等等。应理解,本发明实施例对于如何划分用户类型不做限制。另外,用户类型可以被划分成两类或两类以上。为了便于理解,本发明将以用户类型划分成两类进行说明。
可选地,确定模块302可以进一步用于:采用自然语言处理NLP中的字符串匹配的分词方法在词库中匹配关键词。
可选地,确定模块302可以进一步用于:采用朴素贝叶斯算法计算关键词和与关键词对应的权重获得行为值。
可选地,确定模块302可以进一步用于:当行为值落在第一阈值区间时,则确定用户行为表示用户进行业务咨询,当行为值落在第二阈值区间时,则确定用户行为表示用户进行非业务咨询,其中第一阈值区间和所述第二阈值区间互不相交。
可选地,作为另一个实施例,自动问答系统300还可以包括预处理模块304。预处理模块304用于在生成单元根据用户咨询的问题生成符合用户行为的答案之前,对用户咨询的问题进行预处理,预处理包括去除用户咨询的问题中的特殊字符。
上述本发明实施例揭示的方法可以应用图4所示的自动问答系统400来实现。自动问答系统400包括处理器401和存储器402。处理器401控制设备400的操作。存储器402可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器402的一部分还可以包括非易失行随机存取存储器(NVRAM)。处理器401,存储器402通过总线系统410耦合在一起,其中总线系统410除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图中将各种总线都标为总线系统410。
其中,处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。处理器401可以是通用处理器,包括CPU(中央处理器,Central Processing Unit)、NP(网络处理器,NetworkProcessor)等;还可以是DSP(数字信号处理器,Digital Signal Processing)、ASIC(专用集成电路,Application Specific Integrated Circuit)、FPGA(现成可编程门阵列,Field Programmable Gate Array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明实施例中,处理器401通过存储器402存储的指令或数据执行如下步骤:
在用户咨询的问题中提取关键词;根据用户的历史访问数据和关键词确定用户行为,其中用户行为表示用户进行业务咨询或者用户进行非业务咨询;根据用户咨询的问题生成符合用户行为的答案。
具体的例子可以参考图1的实施例,此处不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的子系统及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述子系统的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子系统或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
另外,在本发明各个实施例中的各功能子系统可以集成在一个处理单元中,也可以是各个子系统单独物理存在,也可以两个或两个以上子系统集成在一个子系统中。
所述功能如果以软件功能的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM(Read-OnlyMemory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (18)
1.一种自动问答方法,其特征在于,包括:
在用户咨询的问题中提取关键词;
根据所述用户的历史访问数据和所述关键词确定用户行为,所述用户行为表示用户进行业务咨询或者用户进行非业务咨询;
针对所述用户咨询的问题生成符合所述用户行为的答案。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户的历史访问数据和所述关键词确定用户行为,包括:
在词库中匹配所述关键词,根据词库中关键词与权重的对应关系获得与所述关键词对应的权重,其中与所述关键词对应的权重是由所述用户的历史访问数据确定的;
根据所述关键词和所述与所述关键词对应的权重获得行为值;
根据所述行为值确定所述用户行为。
3.根据权利要求2所述的方法,其特征在于,在所述在词库中匹配所述关键词之前,所述方法还包括:
根据所述用户的历史访问数据确定用户类型;
所述根据词库中关键词与权重的对应关系获得与所述关键词对应的权重,包括:
根据所述用户类型在词库中选择与所述关键词对应的权重。
4.根据权利要求3所述的方法,其特征在于,针对相同的关键词,为不同的用户类型所设置的权重不同。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述在词库中匹配所述关键词,包括:
采用自然语言处理中的字符串匹配的分词方法在词库中匹配所述关键词。
6.根据权利要求2-4任一项所述的方法,其特征在于,所述根据所述关键词和所述与所述关键词对应的权重获得行为值,包括:
采用朴素贝叶斯算法计算所述关键词和所述与所述关键词对应的权重获得行为值。
7.根据权利要求2-4任一项所述的方法,其特征在于,所述根据所述行为值确定所述用户行为,包括:
当所述行为值落在第一阈值区间时,则确定所述用户行为表示用户进行业务咨询;
当所述行为值落在第二阈值区间时,则确定所述用户行为表示用户进行非业务咨询;
其中所述第一阈值区间和所述第二阈值区间互不相交。
8.根据权利要求1-4任一项所述的方法,其特征在于,在所述根据所述用户咨询的问题生成符合所述用户行为的答案之前,所述方法还包括:
对所述用户咨询的问题进行预处理,所述预处理包括去除所述用户咨询的问题中的特殊字符。
9.根据权利要求1-4任一项所述的方法,其特征在于,所述用户的历史访问数据包括下列至少之一:所述用户的聊天日志、所述用户对服务的评价行为、所述用户的活跃度评分、所述用户的产品消费能力、所述用户的年龄、所述用户的职业。
10.一种自动问答系统,其特征在于,包括:
提取模块,用于在用户咨询的问题中提取关键词;
确定模块,用于根据所述用户的历史访问数据和所述提取模块提取的所述关键词确定用户行为,所述用户行为表示用户进行业务咨询或者用户进行非业务咨询;
生成模块,用于针对所述用户咨询的问题生成符合所述确定模块确定的所述用户行为的答案。
11.根据权利要求10所述的系统,其特征在于,
所述确定模块进一步用于:
在词库中匹配所述关键词,根据词库中关键词与权重的对应关系获得与所述关键词对应的权重,其中与所述关键词对应的权重是由所述用户的历史访问数据确定的;
根据所述关键词和所述与所述关键词对应的权重获得行为值;
根据所述行为值确定所述用户行为。
12.根据权利要求11所述的系统,其特征在于,
所述确定模块还用于:
根据所述用户的历史访问数据确定用户类型;
根据所述用户类型在词库中选择与所述关键词对应的权重。
13.根据权利要求12所述的系统,其特征在于,针对相同的关键词,为不同的用户类型所设置的权重不同。
14.根据权利要求11-13任一项所述的系统,其特征在于,
所述确定模块进一步用于:
采用自然语言处理中的字符串匹配的分词方法在词库中匹配所述关键词。
15.根据权利要求11-13任一项所述的系统,其特征在于,
所述确定模块进一步用于:
采用朴素贝叶斯算法计算所述关键词和所述与所述关键词对应的权重获得行为值。
16.根据权利要求11-13任一项所述的系统,其特征在于,
所述确定模块进一步用于:
当所述行为值落在第一阈值区间时,则确定所述用户行为表示用户进行业务咨询,当所述行为值落在第二阈值区间时,则确定所述用户行为表示用户进行非业务咨询,其中所述第一阈值区间和所述第二阈值区间互不相交。
17.根据权利要求10-13任一项所述的系统,其特征在于,所述系统还包括预处理模块,
所述预处理模块,用于在所述生成单元根据所述用户咨询的问题生成符合所述用户行为的答案之前,对所述用户咨询的问题进行预处理,所述预处理包括去除所述用户咨询的问题中的特殊字符。
18.根据权利要求10-13任一项所述的系统,其特征在于,所述用户的历史访问数据包括下列至少之一:所述用户的聊天日志,所述用户对服务的评价行为,所述用户的活跃度评分,所述用户的产品消费能力,所述用户的年龄,所述用户的职业。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510017562.1A CN104598579B (zh) | 2015-01-14 | 2015-01-14 | 一种自动问答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510017562.1A CN104598579B (zh) | 2015-01-14 | 2015-01-14 | 一种自动问答方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104598579A true CN104598579A (zh) | 2015-05-06 |
CN104598579B CN104598579B (zh) | 2018-07-03 |
Family
ID=53124364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510017562.1A Active CN104598579B (zh) | 2015-01-14 | 2015-01-14 | 一种自动问答方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104598579B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105141787A (zh) * | 2015-08-14 | 2015-12-09 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
CN105187674A (zh) * | 2015-08-14 | 2015-12-23 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
CN106682642A (zh) * | 2017-01-06 | 2017-05-17 | 竹间智能科技(上海)有限公司 | 多面向语言行为识别方法及系统 |
CN107402923A (zh) * | 2016-05-18 | 2017-11-28 | 平安科技(深圳)有限公司 | 智能处理问题数据的方法和系统 |
CN107480154A (zh) * | 2016-06-08 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 一种数据处理的方法及装置 |
CN107784051A (zh) * | 2016-12-15 | 2018-03-09 | 平安科技(深圳)有限公司 | 在线客服应答系统及方法 |
CN107847806A (zh) * | 2016-05-31 | 2018-03-27 | 松下知识产权经营株式会社 | 机器人 |
CN107886876A (zh) * | 2017-12-08 | 2018-04-06 | 江苏飞视文化发展有限公司 | 一种景区移动式环保广告车的服务方法 |
CN108228622A (zh) * | 2016-12-15 | 2018-06-29 | 平安科技(深圳)有限公司 | 业务问题的分类方法及装置 |
CN109710745A (zh) * | 2018-12-28 | 2019-05-03 | 北京猎户星空科技有限公司 | 信息处理方法、装置及电子设备 |
CN110008318A (zh) * | 2019-02-12 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 问题派发方法及装置 |
CN110019700A (zh) * | 2017-09-13 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 数据处理方法和设备 |
CN110059178A (zh) * | 2019-02-12 | 2019-07-26 | 阿里巴巴集团控股有限公司 | 问题派发方法及装置 |
CN110459284A (zh) * | 2019-08-16 | 2019-11-15 | 南开大学 | 一种面向治疗方案的访问控制方法 |
CN111274380A (zh) * | 2020-01-16 | 2020-06-12 | 平安银行股份有限公司 | 基于大数据的咨询投诉信息处理方法及相关装置 |
CN109189897B (zh) * | 2018-07-27 | 2020-07-31 | 什伯(上海)智能技术有限公司 | 一种基于数据内容匹配的聊天方法及聊天装置 |
CN108959483B (zh) * | 2018-06-21 | 2021-06-01 | 广东小天才科技有限公司 | 一种基于搜索的学习辅助方法及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050256700A1 (en) * | 2004-05-11 | 2005-11-17 | Moldovan Dan I | Natural language question answering system and method utilizing a logic prover |
CN102411596A (zh) * | 2010-09-21 | 2012-04-11 | 阿里巴巴集团控股有限公司 | 一种信息推荐方法及系统 |
-
2015
- 2015-01-14 CN CN201510017562.1A patent/CN104598579B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050256700A1 (en) * | 2004-05-11 | 2005-11-17 | Moldovan Dan I | Natural language question answering system and method utilizing a logic prover |
CN102411596A (zh) * | 2010-09-21 | 2012-04-11 | 阿里巴巴集团控股有限公司 | 一种信息推荐方法及系统 |
Non-Patent Citations (1)
Title |
---|
孙凯: ""自动答疑系统中的问句理解与个性化推荐算法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105141787A (zh) * | 2015-08-14 | 2015-12-09 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
CN105187674A (zh) * | 2015-08-14 | 2015-12-23 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
CN105187674B (zh) * | 2015-08-14 | 2020-02-14 | 上海银赛计算机科技有限公司 | 服务录音的合规检查方法及装置 |
CN107402923B (zh) * | 2016-05-18 | 2020-06-19 | 平安科技(深圳)有限公司 | 智能处理问题数据的方法和系统 |
CN107402923A (zh) * | 2016-05-18 | 2017-11-28 | 平安科技(深圳)有限公司 | 智能处理问题数据的方法和系统 |
CN107847806A (zh) * | 2016-05-31 | 2018-03-27 | 松下知识产权经营株式会社 | 机器人 |
CN107847806B (zh) * | 2016-05-31 | 2021-01-26 | 松下知识产权经营株式会社 | 机器人 |
CN107480154A (zh) * | 2016-06-08 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 一种数据处理的方法及装置 |
CN107480154B (zh) * | 2016-06-08 | 2021-12-17 | 阿里巴巴集团控股有限公司 | 一种数据处理的方法及装置 |
CN108228622A (zh) * | 2016-12-15 | 2018-06-29 | 平安科技(深圳)有限公司 | 业务问题的分类方法及装置 |
CN107784051A (zh) * | 2016-12-15 | 2018-03-09 | 平安科技(深圳)有限公司 | 在线客服应答系统及方法 |
CN106682642A (zh) * | 2017-01-06 | 2017-05-17 | 竹间智能科技(上海)有限公司 | 多面向语言行为识别方法及系统 |
CN110019700A (zh) * | 2017-09-13 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 数据处理方法和设备 |
CN110019700B (zh) * | 2017-09-13 | 2023-01-17 | 阿里巴巴集团控股有限公司 | 数据处理方法和设备 |
CN107886876A (zh) * | 2017-12-08 | 2018-04-06 | 江苏飞视文化发展有限公司 | 一种景区移动式环保广告车的服务方法 |
CN108959483B (zh) * | 2018-06-21 | 2021-06-01 | 广东小天才科技有限公司 | 一种基于搜索的学习辅助方法及电子设备 |
CN109189897B (zh) * | 2018-07-27 | 2020-07-31 | 什伯(上海)智能技术有限公司 | 一种基于数据内容匹配的聊天方法及聊天装置 |
CN109710745A (zh) * | 2018-12-28 | 2019-05-03 | 北京猎户星空科技有限公司 | 信息处理方法、装置及电子设备 |
CN110008318A (zh) * | 2019-02-12 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 问题派发方法及装置 |
CN110059178A (zh) * | 2019-02-12 | 2019-07-26 | 阿里巴巴集团控股有限公司 | 问题派发方法及装置 |
CN110459284A (zh) * | 2019-08-16 | 2019-11-15 | 南开大学 | 一种面向治疗方案的访问控制方法 |
CN110459284B (zh) * | 2019-08-16 | 2022-02-22 | 南开大学 | 一种面向治疗方案的访问控制方法 |
CN111274380A (zh) * | 2020-01-16 | 2020-06-12 | 平安银行股份有限公司 | 基于大数据的咨询投诉信息处理方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104598579B (zh) | 2018-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104598579A (zh) | 一种自动问答方法及系统 | |
US11687811B2 (en) | Predicting user question in question and answer system | |
CN110276023B (zh) | Poi变迁事件发现方法、装置、计算设备和介质 | |
CN108875059B (zh) | 用于生成文档标签的方法、装置、电子设备和存储介质 | |
US11106687B2 (en) | Sentiment normalization using personality characteristics | |
CN115630640B (zh) | 一种智能写作方法、装置、设备及介质 | |
CN104866478A (zh) | 恶意文本的检测识别方法及装置 | |
US20200082204A1 (en) | Dynamic intent classification based on environment variables | |
CN111597309A (zh) | 相似企业推荐方法、装置、电子设备及介质 | |
CN111090753A (zh) | 分类模型的训练方法、分类方法、装置、计算机存储介质 | |
US10963501B1 (en) | Systems and methods for generating a topic tree for digital information | |
CN109726290B (zh) | 投诉分类模型的确定方法及装置、计算机可读存储介质 | |
CN110968702B (zh) | 一种事理关系提取方法及装置 | |
US9946765B2 (en) | Building a domain knowledge and term identity using crowd sourcing | |
US11899910B2 (en) | Multi-location copying and context based pasting | |
CN111382385A (zh) | 网页所属行业分类方法及装置 | |
CN110705258A (zh) | 文本实体识别方法及装置 | |
CN107656627B (zh) | 信息输入方法和装置 | |
CN113434630B (zh) | 客服服务评估方法、装置、终端设备及介质 | |
US12014142B2 (en) | Machine learning for training NLP agent | |
US11934434B2 (en) | Semantic disambiguation utilizing provenance influenced distribution profile scores | |
CN113792232A (zh) | 页面特征计算方法、装置、电子设备、介质及程序产品 | |
Vojtek et al. | Comparing natural language identification methods based on Markov processes | |
CN113342932A (zh) | 目标词向量的确定方法、装置、存储介质和电子装置 | |
CN112632229A (zh) | 文本聚类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |