CN106445905B - 问答数据处理、自动问答方法及装置 - Google Patents

问答数据处理、自动问答方法及装置 Download PDF

Info

Publication number
CN106445905B
CN106445905B CN201510472769.8A CN201510472769A CN106445905B CN 106445905 B CN106445905 B CN 106445905B CN 201510472769 A CN201510472769 A CN 201510472769A CN 106445905 B CN106445905 B CN 106445905B
Authority
CN
China
Prior art keywords
knowledge point
answer
database
question
business object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510472769.8A
Other languages
English (en)
Other versions
CN106445905A (zh
Inventor
王雄威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Tmall Technology Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510472769.8A priority Critical patent/CN106445905B/zh
Publication of CN106445905A publication Critical patent/CN106445905A/zh
Application granted granted Critical
Publication of CN106445905B publication Critical patent/CN106445905B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了问答数据处理、自动问答方法及装置,其中,问答数据处理方法包括:收集对业务对象的进行咨询过程中产生的问答数据;根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;所述业务对象标签包括业务对象名称、类目或品牌;根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对所述问答数据库进行更新。通过本申请实施例,有利于提高自动问答系统的准确性以及效率。

Description

问答数据处理、自动问答方法及装置
技术领域
本申请涉及信息自动化处理技术领域,特别是涉及问答数据处理、自动问答方法及装置。
背景技术
电商系统作为网上交易的平台,通常会至少面对两种用户:买家与卖家,其中,买家包括使用电商平台接口应用购买商品的用户,例如通过浏览器访问电商网站,或使用电商移动应用等实施业务对象购买相关行为的用户。卖家可以包括提供交易平台的电商本身,以及在电商系统中租用一定资源来出售商品或服务的用户。电商系统可以看作是买家与卖家之间的桥梁,在两者之间提供商品服务信息的交互,是电商系统的一项基本功能。
在买家与卖家交互的信息中,包括大量对业务对象的咨询信息,其中常常包括买家咨询的问题,以及卖家给出的对应解答,例如,业务对象售前对优惠信息,功效,使用方法等的咨询问答;业务对象售后对业务对象使用问题的咨询问答等等。在现有技术中,电商系统大多为买卖双方提供类似功能的服务信息交互工具,例如内置于网页中的在线交互工具等等,这些交互工具可以使双方很方便的交流商品服务信息。但是,随着用户以及业务对象数量的迅速增加,商品服务器信息的咨询数量也随之增加,仅仅依靠人工回复的方式,很难满足大量用户对于商品服务信息的咨询需求,当信息咨询量较大时,人工回复很难满足提供商品服务信息的时效性需求。
随着计算机服务技术的发展,在一些应用系统中出现了自动问答系统,这些自动问答系统可以根据预置的问答数据库,其中保存有多个知识点,以及各自对应的答案,这样,对用户提出的问题,可以自动与知识点进行匹配,并给出对应的答案,这样可以在一定程度上提高信息咨询效率,降低卖家的人力成本。但其缺点在于,自动问答系统只能在预置的问题范围内满足用户的咨询需求,在电商系统中涉及业务对象的数量较大时,需要维护的问答数据库数据量巨大,尤其是对于一些诸如优惠信息,产品更新信息等变化较为频繁的信息,其数据维护难度更高,最终导致自动问答系统在业务对象咨询的自动化应用中效率较低,难以满足大量用户以及大量业务对象条件下的咨询需求。
综上,需要本领域技术人员解决的问题就在于,如何更好的满足用户对于业务对象信息的咨询需求。
发明内容
本申请提供了问答数据处理、自动问答方法及装置,有利于提高自动问答系统的准确性以及效率。
本申请提供了如下方案:
一种问答数据处理方法,包括:
收集对业务对象的进行咨询过程中产生的问答数据;
根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;
根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;
根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对所述问答数据库进行更新。
一种自动问答方法,包括:
预先建立问答数据库,所述问答数据库中包括公共知识点以及非公共知识点,所述公共知识点的问题中不带有业务对象标签,所述非公共知识点的问题中带有业务对象标签;
接收第一用户端的问题文本;
判断所述问题文本中是否存在业务对象标签;
如果存在,则利用所述非公共知识点与所述问题文本进行匹配;
如果利用非公共知识点匹配失败,将所述问题文本中的业务对象标签去掉,与所述公共知识点进行匹配;
如果与某公共知识点匹配成功,则提供该公共知识点对应的答案。
一种问答数据处理装置,包括:
问答数据收集单元,用于收集对业务对象的进行咨询过程中产生的问答数据;
合并问题确定单元,用于根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;
合并知识点确定单元,用于根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;
第一推荐信息提供单元,用于根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对所述问答数据库进行更新。
一种自动问答装置,包括:
问答数据库提供单元,用于预先建立问答数据库,所述问答数据库中包括公共知识点以及非公共知识点,所述公共知识点的问题中不带有业务对象标签,所述非公共知识点的问题中带有业务对象标签;
问题文本接收单元,用于接收第一用户端的问题文本;
判断单元,用于判断所述问题文本中是否存在业务对象标签;
第一匹配单元,用于如果存在,则利用所述非公共知识点与所述问题文本进行匹配;
第二匹配单元,用于如果利用非公共知识点匹配失败,将所述问题文本中的业务对象标签去掉,与所述公共知识点进行匹配;
答案提供单元,用于如果与某公共知识点匹配成功,则提供该公共知识点对应的答案。
根据本申请提供的具体实施例,本申请公开了以下技术效果:
通过本申请实施例,可以利用历史问答记录,向第二用户提供用于对问答数据库进行优化的推荐信息,具体的,可以将一些具有相同答案,只有标签不同的问题进行合并,生成合并后的知识点,对于答案不同的知识点可以单独进行维护,这样,有利于减小问答数据库的规模,提高自动问答系统的准确性以及效率。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的方法的流程图;
图2是本申请实施例提供的另一种方法的流程图;
图3是本申请实施例提供的装置的流程图;
图4是本申请实施例提供的另一装置的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例中,将交易平台的用户划分为第一用户以及第二用户,其中,第一用户主要是指买家用户等,第二用户主要是指卖家用户或者商家用户,等等。
实施例一
本申请发明人在实现本申请的过程中发现,一个第二用户一般售卖多种业务对象(而且可能会上新的业务对象),在第一用户的咨询中,大部分是关于业务对象怎么买(买一送一等),如何使用(吃),效果如何等等相关的问题,这一类的咨询占咨询的50%以上。第二用户将第一用户常见的问题维护成一个个知识点,一个知识点包括问题和对应的回答。例如知识点1“维c主要有些什么功效呢”。当客户问题1“维c有些什么功效”,自动问答系统就可以使用文本相似度技术发现知识点1“维c主要有些什么功效呢”跟客户的问题很相似,于是就可以使用自动问答技术帮助商家自动回复客户的咨询。
但是,现有技术中这种仅依据文本相似度进行判断的方式,可能会产生错误现象。例如,当第一用户的问题为“维b主要有些什么功效呢”,因为第一用户的问题与前述知识点1中的问题只差一个字,所以也可能会匹配到知识点1,但显然,维c的功效与维b的功效是不同的,以至于给出错误的答案。
因此,为了避免上述这种情况的发生,现有技术中的问答数据库,往往会针对各个业务对象分别设置对应的知识点,采用精确匹配的方式给出问题的答案,以至于现有的问答数据库的规模非常大,需要占用大量的存储资源,查询、匹配等过程效率低下,需要耗费较长的时间。
并且,本申请发明人发现,实际上,对于同一第二用户销售的各个业务对象而言,大部分的业务对象使用、购买规则可能都是一样的,只是某些特别的商品可能不一样。例如,某第二用户针对店内的业务对象包括维生素b、维生素c以及维生素e等,其中大部分业务对象都有固定的营销折扣,如,维b、维c、维e均享受买一送一的优惠等。但是,现有的问答数据库中,却可能会分别为三种业务对象维护关于营销折扣方面的知识点,例如:
知识点1:问题为“维b折扣”,对应答案为“买一送一”;
知识点2:问题为“维c折扣”,对应答案为“买一送一”;
知识点3:问题为“维e折扣”,对应答案为“买一送一”。
显然,这部分知识点实际上是可以合并的,例如,统一合并为“折扣”,对应答案为“买一送一”,等等。当然,也可能有个别的业务对象,在销售折扣上与其他业务对象不同,例如,假设,维b与维e都是可以无条件享受买一送一的折扣,但是,维c则需要在符合某购买条件(比如一次购买量,或者购买时间等限制)的情况下才能享受该折扣。此时,就不应该将维c一起进行合并,而是,可以独立维护知识点2“维c折扣”,对应答案为“一次购买满某某元时,买一送一”。
总之,本申请实施例中,可以将现有的问答数据库进行优化,将其中能够合并的知识点进行合并,不能合并的单独维护,从而降低问答数据库的规模,提高效率。
当然,在具体实现时,由于现有的自动问答系统中已经存在分别对应各个第二用户的问答数据库,如果由第二用户通过手动的方式对问答数据库进行优化,则意味着第二用户可能需要消耗较多的人力成本。
因此,在本申请实施例中,可以首先提供一种第二用户端的解决方案,在该方案中,可以自动对咨询过程中产生的问答数据进行统计分析,从中得到一些可以合并的问题,并以此推荐给第二用户端,这样,第二用户端就可以根据这种推荐信息,对其问答数据库进行优化整理,包括对一些问题进行合并,等等,使得问题系统能够为第一用户提供更高效更准确的咨询服务。
具体的,该实施例一提供了一种问答数据处理方法,参见图1,该方法可以包括以下步骤:
S101:收集对业务对象的进行咨询过程中产生的问答数据;
第一用户在使用浏览器、移动终端应用程序等对销售平台中的业务对象信息进行浏览、购买等操作的过程中,如果有问题需要咨询,例如,包括业务对象的功效、使用方法等等。在此过程中,如果第一用户选择使用自动问答系统,则可以通过预先建立的问答数据库中包含的知识点,与第一用户提出的问题进行匹配,给出对应问题的答案。如果某第一用户提出的问题没有命中问答数据库中的知识点,则还可以由第二用户的客服人员等针对该第一用户的用户做出相应的解答,也即给出对应的答案。
也就是说,在收集问答数据时,收集到的问题数据,一般主要可以包括第一用户在咨询过程中提出的问题,或者,还可以包括第二用户的问答数据库中各个知识点中包含的问题等;而收集到的答案数据,可以包括在第一用户提出的问题命中问答数据库中某知识点时,该问答数据库自动给出的答案,以及,在第一用户提出的问题未命中问答数据库中的知识点时,由第二用户手动输入的答案。
S102:根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;
在收集到问答数据后,可以对其进行分析。在本申请实施例中,这种分析可以基于问答数据中包含的业务对象标签进行。其中,所谓的业务对象标签,可以是指业务对象的名称、类目、品牌等等。可以预先建立业务对象标签识别规则(例如,对销售平台在中划分的业务对象类目、第二用户销售的常见业务对象品牌等进行穷举等)的方式,从收集到的问答数据中,识别业务对象标签,然后进行后续的分析操作。
具体在进行分析时,首先可以针对第二用户已有的问答数据库中包含的知识点进行分析。具体的,可以针对问答数据库的知识点,确定出相同/相似的答案对应的不同问题,如果问题中均包含业务对象标签,则将问题中包含的业务对象标签信息去掉,比较各问题中剩余部分的相似性,如果相似性符合预置条件,则将这些问题确定为可合并的问题。进而,还可以根据问题中的剩余部分确定合并后的问题,并根据所述相同/相似的答案确定所述合并后的问题对应的答案。例如,在某第二用户的问答数据库中,存在以下知识点:
知识点1:{问题:维B优惠活动;答案:买一送一}
知识点2:{问题:维C优惠活动;答案:买一送一}
可见,上述知识点1与知识点2的答案是相同的,知识点1的问题中包括的业务对象标签为“维B”,知识点2的问题中包含的业务对象标签为“维C”,此时,就可以将知识点1的问题中包含的“维B”去掉,知识点2的问题中包含的“维C”去掉,比较两个问题中的剩余部分,由于均为“优惠活动”,相似性很高,因此,可以将这两个问题确定为可合并的问题。合并之后得到一个新的知识点,可以添加到问答数据库中。其中,合并后的知识点中,问题可以为“优惠活动”,答案为“买一送一”,并且,还可以将前述知识点1以及知识点2从问答数据库中删除。
前文所述为对问答数据库内部的知识点进行优化,或者,在另一种情况下,还可以结合第二用户手动输入的答案对问答数据库进行优化。具体的,自动问答系统可以利用业务对象标签精确匹配的方式给出问题的答案,也即,如果某第一用户提出的问题中包含业务对象标签,则可以首先在问答数据库中查找包含有该业务对象标签的知识点问题,然后再进行其他部分问题内容的相似性比对。这样,避免出现以下情况:在第一用户提出关于业务对象A的问题时,将用于回答关于业务对象B的答案提供给第一用户。这样,也就是说,如果某第一用户提出的第一目标问题未命中问答数据库中的知识点,则可以证明问答数据库中尚未有关于该业务对象A在这方面的知识点。
进而,针对上述情况,在第二用户提供了手动输入的答案后,则可以将第二用户手动输入的答案与所述问答数据库中的各个答案进行比对,如果所述问答数据库中存在相同/相似的答案,则可以将该第一目标问题与问答数据库中该答案对应的第二目标问题进行比对,具体的比对过程可以为:如果第一目标问题以及第二目标问题中均存在业务对象标签,则将业务对象标签去掉后,比对第一目标问题与所述第二目标问题剩余部分的相似性,如果相似性符合预置条件,则将该第一目标问题与第二目标问题确定为可合并的问题。
例如,某第一用户提出的问题为“维C有何优惠活动”,问答数据库中自动问答系统在利用问答数据库进行比对后,没有查找到与该问题相匹配的知识点,于是通过手动输入答案的方式给出答案为“买一送一”。针对该问答情况,可以将该手动输入的答案“买一送一”与问答数据库中各个知识点中的答案进行比对,取出与该答案相同的知识点,例如,发现某知识点中答案也是“买一送一”,对应的问题是“维B有何优惠活动”,并且,将其中的“维B”、“维C”等标签去掉之后,问题中的其他部分具有很高的相似性,因此,就可以将当前第一用户提出的问题“维C有何优惠活动”与问答数据库中该知识点中的问题“维B有何优惠活动”进行合并,合并后的问题可以为“优惠活动”,答案可以为“买一送一”,等等。
当然,如果所述问答数据库中不存在与所述第二用户手动输入的答案相同/相似的答案,则可以将该目标问题以及对应的答案确定为该新知识点,利用该新的知识点向第二用户提供第二推荐信息。
S103:根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;
S104:根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对所述问答数据库进行更新。
对于合并后的问题以及答案,可以生成合并后的知识点,并且可以作为推荐信息提供给第二用户,在得到第二用户的确认后,可以替换问答数据库中原来的知识点。
需要说明的是,在实际应用中,上述对问答数据库进行优化的过程可以是随着第一用户对问答系统的使用而不断进行的。并且,为了进一步提高自动问答系统的效率以及准确性,还可以向第一用户提供用于提交满意度信息的操作选项,这样,第一用户通过一段时间对自动问答系统的使用,则可以将其满意程度信息通过该操作选项上传到服务器,这样,服务器可以收集到这种信息,并对第一用户不满意的问答情况进行聚类,并且可以将聚类的结果提供给第二用户客户端,第二客户端可以基于这些反馈,对其问答数据库进行手动的修改等操作。
总之,通过前述实施例一,可以利用历史问答记录,向第二用户提供用于对问答数据库进行优化的推荐信息,具体的,可以将一些具有相同答案,只有标签不同的问题进行合并,生成合并后的知识点,对于答案不同的知识点可以单独进行维护,这样,有利于减小问答数据库的规模,提高自动问答系统的准确性以及效率。
实施例二
在使用前述方式对问答数据库进行优化的基础上,本申请实施例还提供了一种自动问答方法,参见图2,该方法可以包括以下步骤:
S201:预先建立问答数据库,所述问答数据库中包括公共知识点以及非公共知识点,所述公共知识点的问题中不带有业务对象标签,所述非公共知识点的问题中带有业务对象标签,所述业务对象标签包括业务对象名称、类目或品牌;
S202:接收第一用户端的问题文本;
S203:判断所述问题文本中是否存在第一业务对象标签;
S204:如果存在,则利用所述非公共知识点与所述问题文本进行匹配;
如果所述问题文本中不包括业务对象标签,则利用所述公共知识点与所述问题文本进行匹配。
S205:如果利用非公共知识点匹配失败,将所述问题文本中的第一业务对象标签去掉,与所述公共知识点进行匹配;
S206:如果与某公共知识点匹配成功,则提供该公共知识点对应的答案。
其中,在述利用非公共知识点与问题文本进行匹配时,具体可以通过以下方式进行:
首先,判断第一业务对象标签与非公共知识点中包括的第二业务对象标签是否相同;如果相同,则利用所述问题文本以及所述非公共知识点中去掉业务对象标签的部分进行相似性比较,如果符合预置条件,则匹配成功。
可见,在本申请实施例中,问题数据库中可以包括公共知识点以及非公共知识点,在将第一用户的问题文本与问答数据库中的知识点进行比对时,可以首先判断问题文本中是否存在业务对象标签,如果存在,则首先利用非公共知识点与该问题文本进行匹配,如果匹配成功,则利用该非公共知识点给出对应的答案。否则,如果匹配不成功,则将问题文本中的业务对象标签去掉,之后再与公共知识点进行匹配,如果与某公共知识点匹配成功,则可以利用该公共知识点提供对应的答案。由于将问答数据库中的知识点区分为公共知识点以及非公共知识点,因此,可以使得问答数据库的规模得到控制,提高系统的效率,并且,也有利于提高结果的准确性。
与本申请实施例一提供的问答数据处理方法相对应,本申请实施例还提供了一种问答数据处理装置,参见图3,该装置具体可以包括:
问答数据收集单元301,用于收集对业务对象的进行咨询过程中产生的问答数据;
合并问题确定单元302,用于根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;所述业务对象标签包括业务对象名称、类目或品牌;
合并知识点确定单元303,用于根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;
第一推荐信息提供单元304,用于根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对所述问答数据库进行更新。
具体实现时,所述问答数据收集单元包括:
在第一用户提出的问题命中所述问答数据库中某知识点时,所述问答数据库自动给出的答案,以及,在第一用户提出的问题未命中所述问答数据库中的知识点时,由第二用户手动输入的答案。
其中,所述合并问题确定单元包括:
相似答案确定子单元,用于确定所述问答数据库的知识点中,相同/相似的答案对应的不同问题;
相似度比对子单元,用于如果所述问题中均包含业务对象标签,则将所述问题中包含的业务对象标签信息去掉,比较各问题中剩余部分的相似性;
问题确定子单元,用于如果相似性符合预置条件,则将所述问题确定为可合并的问题;
所述知识点合并单元具体用于:
根据所述问题中的剩余部分确定合并后的问题,并根据所述相同/相似的答案确定所述合并后的问题对应的答案。
或者,在另一种实现方式下,所述合并问题确定单元包括:
答案比对子单元,用于如果第一用户提出的第一目标问题未命中所述问答数据库中的知识点,则将所述第二用户手动输入的答案与所述问答数据库中的各个答案进行比对;
问题比对子单元,用于如果所述问答数据库中存在相同/相似的答案,则将该第一目标问题与问答数据库中该答案对应的第二目标问题进行比对;
其中,所述问题比对子单元具体用于:
如果所述第一目标问题以及所述第二目标问题中均存在业务对象标签,则将所述业务对象标签去掉后,比对第一目标问题与所述第二目标问题剩余部分的相似性;如果相似性符合预置条件,则将该第一目标问题与所述第二目标问题确定为可合并的问题;
所述知识点合并单元具体用于:
根据所述第一目标问题文本与所述第二目标问题中剩余部分的文本确定合并后的问题,并根据所述相同/相似的答案确定所述合并后的答案。
另外,该装置还可以包括:
新知识点确定单元,用于如果所述问答数据库中不存在与所述第二用户手动输入的答案相同/相似的答案,则将该目标问题以及对应的答案确定为该新知识点;
第二推荐信息提供单元,用于利用所述新的知识点提供第二推荐信息。
满意度信息接收单元,用于接收第一用户对问答过程的满意程度信息;
聚类单元,用于针对不满意的问答情况进行聚类,并将聚类结果提供给所述第二用户端,以便所述第二用户端对所述问答数据库进行修改。
与实施例二提供的自动问答方法相对应,本申请实施例还提供了一种自动问答装置,参见图4,该装置具体可以包括:
问答数据库提供单元401,用于预先建立问答数据库,所述问答数据库中包括公共知识点以及非公共知识点,所述公共知识点的问题中不带有业务对象标签,所述非公共知识点的问题中带有业务对象标签,所述业务对象标签包括业务对象名称、类目或品牌;
问题文本接收单元402,用于接收第一用户端的问题文本;
判断单元403,用于判断所述问题文本中是否存在业务对象标签;
第一匹配单元404,用于如果存在,则利用所述非公共知识点与所述问题文本进行匹配;
第二匹配单元405,用于如果利用非公共知识点匹配失败,将所述问题文本中的业务对象标签去掉,与所述公共知识点进行匹配;
答案提供单元406,用于如果与某公共知识点匹配成功,则提供该公共知识点对应的答案。
其中,所述第一匹配单元包括:
标签判断子单元,用于判断所述问题文本中的业务对象标签与所述非公共知识点中包括的业务对象标签是否相同;
其他部分判断子单元,用于如果相同,利用所述问题文本以及所述非公共知识点中去掉业务对象标签的部分进行相似性比较,如果符合预置条件,则匹配成功。
另外,该装置还可以包括:
第三匹配单元,用于如果所述问题文本中不包括业务对象标签,则利用所述公共知识点与所述问题文本进行匹配。
通过前述实施例,可以利用历史问答记录,向第二用户提供用于对问答数据库进行优化的推荐信息,具体的,可以将一些具有相同答案,只有标签不同的问题进行合并,生成合并后的知识点,对于答案不同的知识点可以单独进行维护,这样,有利于减小问答数据库的规模,提高自动问答系统的准确性以及效率。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本申请所提供的问答数据处理、自动问答方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本申请的限制。

Claims (16)

1.一种问答数据处理方法,其特征在于,包括:
收集对业务对象的进行咨询过程中产生的问答数据;
根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;
根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;
根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对问答数据库进行更新;
其中,根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定第二用户问答数据库中可合并的问题,包括:
确定所述问答数据库的知识点中,相同或相似的答案对应的不同问题;
如果所述问题中均包含业务对象标签,则将所述问题中包含的业务对象标签信息去掉,比较各问题中剩余部分的相似性;
如果相似性符合预置条件,则将所述问题确定为可合并的问题;
根据所述可合并的问题确定合并后的知识点文本包括:
根据所述问题中的剩余部分确定合并后的问题,并根据所述相同或相似的答案确定所述合并后的问题对应的答案。
2.根据权利要求1所述的方法,其特征在于:
收集的问答数据包括:
在第一用户提出的问题命中所述问答数据库中某知识点时,所述问答数据库自动给出的答案,以及,在第一用户提出的问题未命中所述问答数据库中的知识点时,由第二用户手动输入的答案。
3.根据权利要求1所述的方法,其特征在于,根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定第二用户问答数据库中可合并的问题,包括:
如果第一用户提出的第一目标问题未命中所述问答数据库中的知识点,则将第二用户手动输入的答案与所述问答数据库中的各个答案进行比对;
如果所述问答数据库中存在相同或相似的答案,则将该第一目标问题与问答数据库中该答案对应的第二目标问题进行比对;
其中,所述将该第一目标问题与问答数据库中该答案对应的第二目标问题进行比对,包括:
如果所述第一目标问题以及所述第二目标问题中均存在业务对象标签,则将所述业务对象标签去掉后,比对第一目标问题与所述第二目标问题剩余部分的相似性;
如果相似性符合预置条件,则将该第一目标问题与所述第二目标问题确定为可合并的问题;
根据所述可合并的问题确定合并后的知识点文本包括:
根据所述第一目标问题文本与所述第二目标问题中剩余部分的文本确定合并后的问题,并根据所述相同或相似的答案确定合并后的答案。
4.根据权利要求3所述的方法,其特征在于,还包括:
如果所述问答数据库中不存在与所述第二用户手动输入的答案相同或相似的答案,则将该目标问题以及对应的答案确定为新知识点;
利用所述新知识点提供第二推荐信息。
5.根据权利要求1所述的方法,其特征在于,还包括:
接收第一用户对问答过程的满意程度信息;
针对不满意的问答情况进行聚类,并将聚类结果提供给所述第二用户端,以便所述第二用户端对所述问答数据库进行修改。
6.一种自动问答方法,其特征在于,包括:
预先建立问答数据库,所述问答数据库中包括公共知识点以及非公共知识点,所述公共知识点的问题中不带有业务对象标签,所述非公共知识点的问题中带有业务对象标签;
接收第一用户端的问题文本;
判断所述问题文本中是否存在业务对象标签;
如果存在,则利用所述非公共知识点与所述问题文本进行匹配;
如果利用非公共知识点匹配失败,将所述问题文本中的业务对象标签去掉,与所述公共知识点进行匹配;
如果与某公共知识点匹配成功,则提供该公共知识点对应的答案。
7.根据权利要求6所述的方法,其特征在于,所述利用所述非公共知识点与所述问题文本进行匹配,包括:
判断所述问题文本中的业务对象标签与所述非公共知识点中包括的业务对象标签是否相同;
如果相同,利用所述问题文本以及所述非公共知识点中去掉业务对象标签的部分进行相似性比较,如果符合预置条件,则匹配成功。
8.根据权利要求6所述的方法,其特征在于,还包括:
如果所述问题文本中不包括业务对象标签,则利用所述公共知识点与所述问题文本进行匹配。
9.一种问答数据处理装置,其特征在于,包括:
问答数据收集单元,用于收集对业务对象的进行咨询过程中产生的问答数据;
合并问题确定单元,用于根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;
合并知识点确定单元,用于根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;
第一推荐信息提供单元,用于根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对问答数据库进行更新;
其中,所述合并问题确定单元包括:
相似答案确定子单元,用于确定所述问答数据库的知识点中,相同或相似的答案对应的不同问题;
相似度比对子单元,用于如果所述问题中均包含业务对象标签,则将所述问题中包含的业务对象标签信息去掉,比较各问题中剩余部分的相似性;
问题确定子单元,用于如果相似性符合预置条件,则将所述问题确定为可合并的问题;
知识点合并单元,用于根据所述问题中的剩余部分确定合并后的问题,并根据所述相同或相似的答案确定所述合并后的问题对应的答案。
10.根据权利要求9所述的装置,其特征在于:
所述问答数据收集单元包括:
在第一用户提出的问题命中所述问答数据库中某知识点时,所述问答数据库自动给出的答案,以及,在第一用户提出的问题未命中所述问答数据库中的知识点时,由第二用户手动输入的答案。
11.根据权利要求9所述的装置,其特征在于,所述合并问题确定单元包括:
答案比对子单元,用于如果第一用户提出的第一目标问题未命中所述问答数据库中的知识点,则将第二用户手动输入的答案与所述问答数据库中的各个答案进行比对;
问题比对子单元,用于如果所述问答数据库中存在相同或相似的答案,则将该第一目标问题与问答数据库中该答案对应的第二目标问题进行比对;
其中,所述问题比对子单元具体用于:
如果所述第一目标问题以及所述第二目标问题中均存在业务对象标签,则将所述业务对象标签去掉后,比对第一目标问题与所述第二目标问题剩余部分的相似性;如果相似性符合预置条件,则将该第一目标问题与所述第二目标问题确定为可合并的问题;
所述知识点合并单元具体用于:
根据所述第一目标问题文本与所述第二目标问题中剩余部分的文本确定合并后的问题,并根据所述相同或相似的答案确定合并后的答案。
12.根据权利要求11所述的装置,其特征在于,还包括:
新知识点确定单元,用于如果所述问答数据库中不存在与所述第二用户手动输入的答案相同或相似的答案,则将该目标问题以及对应的答案确定为新知识点;
第二推荐信息提供单元,用于利用所述新知识点提供第二推荐信息。
13.根据权利要求9所述的装置,其特征在于,还包括:
满意度信息接收单元,用于接收第一用户对问答过程的满意程度信息;
聚类单元,用于针对不满意的问答情况进行聚类,并将聚类结果提供给所述第二用户端,以便所述第二用户端对所述问答数据库进行修改。
14.一种自动问答装置,其特征在于,包括:
问答数据库提供单元,用于预先建立问答数据库,所述问答数据库中包括公共知识点以及非公共知识点,所述公共知识点的问题中不带有业务对象标签,所述非公共知识点的问题中带有业务对象标签;
问题文本接收单元,用于接收第一用户端的问题文本;
判断单元,用于判断所述问题文本中是否存在业务对象标签;
第一匹配单元,用于如果存在,则利用所述非公共知识点与所述问题文本进行匹配;
第二匹配单元,用于如果利用非公共知识点匹配失败,将所述问题文本中的业务对象标签去掉,与所述公共知识点进行匹配;
答案提供单元,用于如果与某公共知识点匹配成功,则提供该公共知识点对应的答案。
15.根据权利要求14所述的装置,其特征在于,所述第一匹配单元包括:
标签判断子单元,用于判断所述问题文本中的业务对象标签与所述非公共知识点中包括的业务对象标签是否相同;
其他部分判断子单元,用于如果相同,利用所述问题文本以及所述非公共知识点中去掉业务对象标签的部分进行相似性比较,如果符合预置条件,则匹配成功。
16.根据权利要求14所述的装置,其特征在于,还包括:
第三匹配单元,用于如果所述问题文本中不包括业务对象标签,则利用所述公共知识点与所述问题文本进行匹配。
CN201510472769.8A 2015-08-04 2015-08-04 问答数据处理、自动问答方法及装置 Active CN106445905B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510472769.8A CN106445905B (zh) 2015-08-04 2015-08-04 问答数据处理、自动问答方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510472769.8A CN106445905B (zh) 2015-08-04 2015-08-04 问答数据处理、自动问答方法及装置

Publications (2)

Publication Number Publication Date
CN106445905A CN106445905A (zh) 2017-02-22
CN106445905B true CN106445905B (zh) 2019-05-21

Family

ID=59216603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510472769.8A Active CN106445905B (zh) 2015-08-04 2015-08-04 问答数据处理、自动问答方法及装置

Country Status (1)

Country Link
CN (1) CN106445905B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423326B (zh) * 2017-04-11 2020-01-24 广州亿码科技有限公司 一种基于回答方式的推荐及结果查询方法及系统
CN108766421B (zh) * 2017-04-20 2020-09-15 杭州萤石网络有限公司 语音交互的方法及装置
CN107301229B (zh) * 2017-06-22 2019-10-01 美味不用等(上海)信息科技股份有限公司 基于语义分析的反馈指派方法及系统
CN107644012B (zh) * 2017-08-29 2019-03-01 平安科技(深圳)有限公司 电子装置、问题识别确认方法和计算机可读存储介质
CN107748795B (zh) * 2017-11-03 2021-09-10 深圳市中润四方信息技术有限公司 一种构建知识库的方法、系统及装置
CN108984658A (zh) * 2018-06-28 2018-12-11 阿里巴巴集团控股有限公司 一种智能问答数据处理方法及装置
CN109145084B (zh) * 2018-07-10 2022-07-01 创新先进技术有限公司 数据处理方法、数据处理装置和服务器
CN110046235B (zh) * 2019-03-18 2023-06-02 创新先进技术有限公司 一种知识库评估方法、装置及设备
CN113570380A (zh) * 2020-04-28 2021-10-29 中国移动通信集团浙江有限公司 基于语义分析的业务投诉处理方法、装置、设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049433A (zh) * 2012-12-11 2013-04-17 微梦创科网络科技(中国)有限公司 自动问答方法、自动问答系统及构建问答实例库的方法
US8473499B2 (en) * 2011-10-17 2013-06-25 Microsoft Corporation Question and answer forum techniques
CN103455535A (zh) * 2013-05-08 2013-12-18 深圳市明唐通信有限公司 基于历史咨询数据构建知识库的方法
CN104809197A (zh) * 2015-04-24 2015-07-29 同程网络科技股份有限公司 基于智能机器人的在线问答方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8473499B2 (en) * 2011-10-17 2013-06-25 Microsoft Corporation Question and answer forum techniques
CN103049433A (zh) * 2012-12-11 2013-04-17 微梦创科网络科技(中国)有限公司 自动问答方法、自动问答系统及构建问答实例库的方法
CN103455535A (zh) * 2013-05-08 2013-12-18 深圳市明唐通信有限公司 基于历史咨询数据构建知识库的方法
CN104809197A (zh) * 2015-04-24 2015-07-29 同程网络科技股份有限公司 基于智能机器人的在线问答方法

Also Published As

Publication number Publication date
CN106445905A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
CN106445905B (zh) 问答数据处理、自动问答方法及装置
CN107609058B (zh) 一种销售方法、机器人客服端、人工客服端及用户端
CN108960992A (zh) 一种信息推荐方法以及相关设备
CN106127525A (zh) 一种基于分类算法的电视购物商品推荐方法
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN108228559A (zh) 一种用于用户业务的人机交互实现方法及系统
CN107862530A (zh) 建立用户人际关系信息的方法及装置
CN108090807B (zh) 信息推荐方法及装置
CN112784039A (zh) 一种分配在线客服的方法、装置和存储介质
US10445813B2 (en) Tap walls that recommend products based on in-store and out-of-store interactions of anonymous users
EP3543943A1 (en) Purchase information utilization system, purchase information utilization method, and program
CN111428131A (zh) 信息推送方法、装置及系统
CN111027838A (zh) 一种众包任务推送方法、装置、设备及其存储介质
KR20210032691A (ko) 네트워크 기반 상품 추천 방법 및 장치
CN113792134B (zh) 一种基于数字孪生技术的用户服务方法及系统
CN116127184A (zh) 产品的推荐方法及装置、非易失性存储介质、电子设备
KR101026544B1 (ko) 인공지능에 기반한 랭킹 분석 방법, 이를 기록한 기록 매체, 그 장치
CN111177581A (zh) 一种基于多平台的社交电商网站商品推荐方法及装置
CN112995256B (zh) 行为数据处理方法及相关设备
CN113159963A (zh) 一种供应链金融方案匹配方法及装置
CN116132749B (zh) 一种和直播带货结合的广告营销方法
CN108510302A (zh) 一种营销决策方法及交易服务器
CN115880077A (zh) 基于客户标签的推荐方法及其装置、电子设备及存储介质
CN114996579A (zh) 信息推送方法、装置、电子设备和计算机可读介质
CN108647327A (zh) 一种商品购买决策方法、系统及设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211109

Address after: Room 507, floor 5, building 3, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Patentee after: ZHEJIANG TMALL TECHNOLOGY Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.