CN107545003B - 自动问答方法及系统 - Google Patents
自动问答方法及系统 Download PDFInfo
- Publication number
- CN107545003B CN107545003B CN201610490478.6A CN201610490478A CN107545003B CN 107545003 B CN107545003 B CN 107545003B CN 201610490478 A CN201610490478 A CN 201610490478A CN 107545003 B CN107545003 B CN 107545003B
- Authority
- CN
- China
- Prior art keywords
- user
- question
- answer
- path
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明实施例提供一种自动问答方法及系统,从产品与服务数据中为用户问题生成答案数据,针对每一产品与服务数据集合对应一个路径,针对每一路径设置一个权值向量得到路径和权值对应关系表;当收到用户下发的用户问题后,则将该用户问题编码成特征向量,然后将特征向量与路径和权值对应关系表中的各权值向量进行匹配,在特征向量与其中一个权值向量匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。基于涵盖所有服务数据以及所有用户服务数据的产品与服务数据进行路径和权值向量设置,而不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种自动问答方法及系统。
背景技术
目前自动问答系统根据其知识的来源分为开放域和封闭域。前者的知识来源比较广泛,包括互联网、领域知识文档等等,典型的系统如IBM的Watson。后者的知识来源仅包括某个特殊的领域,例如电信领域的客服机器人,它仅仅回答与公司或者行业产品相关的知识。
目前在封闭域的自动问答系统中,传统的自动问答系统实现方法是基于标准问题的,它通过人工的方法对用户可能提出的问题进行提炼生成一个标准问题库StdQ={Qesi,Ansi},其中Qesi表示一个标准问题,Ansi表示标准问题Qesi 所对应标准答案。当用户提问问题时,将用户问题与每一个标准问题进行匹配,若匹配到合适的问题,则将该问题所对应的答案返回给用户。但这种方法存在一些弊端,例如生成的标准问题无法覆盖用户的查询问题,一方面,由于产品以及服务的更新会导致用户查询内容的变化,另一方面,用户是使用自然语言进行查询的,而每个人的语言习惯是不完全相同的,以至于一些用户问题难以匹配到标准问题。
发明内容
本发明实施例提供的自动问答方法及系统,主要解决的技术问题是:解决现有自动问答系统中采用标准问题库导致不能很好的覆盖用户问题,进而容易导致对用户问题解答识别,降低用户体验满意度的问题。
为解决上述技术问题,本发明实施例提供一种自动问答方法,包括:
获取用户下发的用户问题;
将所述用户问题编码成特征向量;
在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
本发明实施例还提供一种自动问答系统,问题交互模块,问题解析模块、答案处理模块;
所述问题交互模块用于获取用户下发的用户问题;
所述问题解析模块用于将所述用户问题编码成特征向量;
所述答案处理模块用于在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行前述的自动问答方法。
本发明的有益效果是:
根据本发明实施例提供的自动问答方法、系统以及计算机存储介质,由于产品与服务数据是存储在数据库中的,本发明实施例从产品与服务数据中按问题分类出对应的数据作为各类问题的答案数据,针对每一答案数据集合对应一个路径,针对每一路径设置一个权值向量得到路径和权值对应关系表;当收到用户下发的用户问题后,则将该用户问题编码成特征向量,然后将特征向量与路径和权值对应关系表中的各权值向量进行匹配,在特征向量与其中一个权值向量匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。本发明实施例实现自动问答是基于数据库中的产品与服务数据(涵盖运营商提供的所有服务数据以及所有用户服务数据)进行路径和权值向量设置,并不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。且本发明实施例中当出现新的服务内容或用户数据内容时,则需要对应增加新的路径和权值向量即可,并不需要对整个模型进行更新,更新更为灵活使用,适应性更好。
附图说明
图1为本发明实施例一中的自动问答流程示意图;
图2为本发明实施例一中的循环神经网络算法示意图;
图3为本发明实施例二中的自动问答系统结构示意图;
图4为本发明实施例二中的自动问答系统分布式设置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明中一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
各运营商的产品与服务数据是存储在数据库中的。例如,对于用户的话费余额、话费详单、流量余额、流量详单、剩余分钟数等产品数据都是针对每个用户分别存储在数据库中的。又例如对于电信火车、电信积木、电信飞机、电信旅游等服务的套餐内容、办理流程等数据也都存储在数据中。因此用户查询时本质是使用自然语言来搜索数据库中对应那部分的数据内容。以电信领域为例,用户查询的问题一般分为两类:一类是与用户自身相关的产品与服务数据,例如“我的流量还剩多少”、“我的话费还剩多少”、“我的通话分钟数还剩多少”、“我这月的话费怎么使用的”;另一类则是针对电信运营商所能提供的服务进行查询,例如“电信电视业务怎么开通”、“我的手机还可以参与哪些优惠活动”等。
因此,本实施例产品与服务数据使用路径进行标记,针对每一路径生成一个权值向量得到路径和权值对应关系表。例如:产品与服务数据库中包含了各用户(不同用户可以用不同号码表示)的话费余额、话费详单、流量余额、流量详单,还包括了各种套餐业务(例如电信飞机)怎么开通、套餐业务内容等数据。对于用户的查询权限只限于他自己的数据,则使用路径表示一类数据,例如“用户.话费详单”、“用户.流量余额”、“用户.流量详单”;而对于不限权限的数据,则使用路径表示每一条数据,例如“电信飞机.套餐内容”、“电信飞机. 办理流程”。经过上述过程对于每类问题从数据库中划分出对应的数据并设置好唯一路径之后,再为每个路径设置权值向量生成路径和权值对应关系表。通过历史的问答记录数据,生成一个问题到路径的样本集合。基于该样本集合,使用机器学习(包括神经网络)的方法来训练得到各路径的权值向量。
本实施例汇总机器学习方法其过程可以参考正样例调整权值的过程。基于足够大数据量的历史问答记录而生成的向量可以很好的表述用户的意图特征,提升问题回答的准确率。
基于上述设置,本实施例中当收到用户下发的用户问题后,实现自动问答的流程参见图1所示,包括:
S101:获取用户下发的用户问题;
S102:将用户问题编码成特征向量;
S103:在特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。
本实施例中,由于用户用的都是自然语言,每个用户所用的语言习惯不同会导致:用户问题中可能存在冗余字段、指代消解、缺失主语等问题,用户输入可能会出现错别字。因此,本实施例中,在收到用户问题之后,将用户问题编码成特征向量之前,还包括对所述用户问题进行以下至少一种初始化处理:
对用户问题中的冗余字段进行过滤,例如,“你好”等;
对用户问题中的错别字进行校正,例如将用户输入的“点心积木套餐”纠正为“电信积木套餐”;
对用户问题中的名称内容进行标准化处理,例如将“积木套餐”标准化为“电信积木套餐”;
对用户问题中上下文的指代进行消解处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“这个套餐怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”;
对用户问题上下文的省略进行恢复处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”。
上述S102中,将用户问题编码成特征向量,该特征向量与权值向量的纬度相同。
本实施例中,具体可以使用神经网络算法将用户问题编码成一个特征向量。且本实施例中的神经网络算法包括但不限于循环神经网络算法、卷积神经网络算法等等。图2所示为一种循环神经网络的网络结构示意图。其中X1到Xn表示用户问题的自然语言输入,H1到Hn表示循环神经网络的隐藏层,Xi与Hi 之间通过相应的加权值进行换算,i大于等于1,小于等于n,O表示输出。
本实施例中,将特征向量与路径和权值对应关系表中的各权值向量进行匹配包括:分别计算特征向量与各权值向量的相似度值,并获取得到的多个相似度值中的最大相似度值。
本实施例中计算特征向量与权值向量的相似度可以采用各种相似度计算方法,例如可以采用以下余弦相似度算法:
上式中x和y分别用来表示特征向量与权值向量。
判断特征向量是否与其中一个权值向量匹配成功包括:判断最大相似度值是否大于预设相似度阈值,如是,判定与最大相似度值对应的权值向量匹配成功,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。本实施例中,从某一权值向量对应路径的答案数据中提取用户问题的答案反馈给用户时,具体根据该用户的权限,从答案数据中提取与该用户对应的数据作为答案进行封装后反馈给用户。例如,当用户提的问题是“我的话费余额”时,匹配到的路径是“用户.话费余额”,则从数据库中所有用户的话费余额中提取该用户问题的用户的话费余额,对于其他用户的数据该用户无权查看。
本实施例中存在以下两种情况:
上述相似度计算得到的最大相似度值小于等于预设相似度阈值,此时匹配失败,也就不能自动生成答案,此时可以切换至人工服务,通过人工服务为用户解答该用户问题,并可将人工服务提供的用户问题-答案(含路径)作为一个正例样本对相应路径的权值向量进行更新。例如,将正例样本的正例相似度标准值设置为1,然后从人工服务提供的用户问题-答案的答案中提取待校正路径,并提取待校正路径当前的相似度值,根据所述正例相似度标准值与待校正路径当前的相似度值之差,反向对待校正路径对应的权值向量进行校正更新。其中正例相似度标准值的取值可以根据实际应用场景灵活设定。
另外一种情况是,匹配到的答案并反馈给用户了,但该答案并不能解决用户的问题,此时用户可以主动转入人工服务。因此本实施例在将答案反馈给所述用户后,检测到启用人工服务为用户解答所述用户问题时,就表明出现了上述情况。此时将自动生成的问题-答案(含路径)作为一个反例样本,人工服务生成的问题-答案作为一个正例样本进行对相应路径的权值向量进行更新。例如,可以根据上述计算得到的最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。具体反例相似度标准值可以取0,根据上述计算得到的最大相似度值与反例相似度标准值之差,反向对上述最大相似度值路径对应的权值向量进行校正更新。其中反例相似度标准值的取值也可以根据实际应用场景灵活设定。
当然根据实际应用场景也可以灵活设定。
本实施例中,当在数据库中新增了产品及其服务数据时,可以按照上述划分方式对应为其设置路径,并基于神经网络算法为其分配一个初始的权值向量。当数据库中删除某一产品及其服务数据时,对应的删除相应路径及其权值向量。也即本实施例中当有新增数据以及删除数据时,可以对路径和权值对应关系表进行对应的局部更新即可,并不需要对整个模型重新进行更新。可以提升资源利用率以及更新效率。
本实施例实现自动问答是基于数据库中的产品与服务数据进行路径和权值向量设置,并不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。且本中当出现新的服务内容或用户数据内容时,则需要对应增加新的路径和权值向量即可,并不需要对整个模型进行更新,更新更为灵活使用,适应性更好。
实施例二:
本实施例提供了一种自动问答系统,请参见图3所示,包括问题交互模块 31,问题解析模块32、答案处理模块33;
问题交互模块31用于获取用户下发的用户问题;
问题解析模块32用于将用户问题编码成特征向量;
答案处理模块33用于在特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
具体的,答案处理模块33包括答案映射子模块331和答案处理子模块332;答案映射子模块331用于分别计算所述特征向量与所述各权值向量的相似度值,并从得到的多个相似度值中选择出最大相似度值,判断所述最大相似度值是否大于预设相似度阈值,如是,判定与所述最大相似度值对应的权值向量匹配成功。答案处理子模块332用于在匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户。
本实施例中的上述问题交互模块31,问题解析模块32、答案处理模块33 的各功能可以通过网元节点实现,且一个模块可以通过一个网元节点实现,也可以一个网元节点实现上述功能模块中的至少两个。本实施例中,为了实现集群规模的扩展来增加系统性能,将问题交互模块31,问题解析模块32以及答案处理模块33中至少两个模块设置在分布式通信系统的不同通信节点上。例如,参见图4所示,问题交互模块31和问题解析模块32被置于一个节点上,它们是基于用户问题实现并行的,将多个用户问题分发给不同的节点进行并行处理,每个节点独立的处理其中一部分问题。答案映射子模块331是根据路径实现分布式并行的,每个节点只负责处理一部分路径。答案处理子模块332的工作负载比较小,一般可放在一个节点上完成,如果发生负载高的情况,它也可以基于用户问题分布式的实施到多个节点上。
本实施例中,由于用户用的都是自然语言,每个用户所用的语言习惯不同会导致:用户问题中可能存在冗余字段、前后指代不同、缺失主语等问题,用户自带的口音也可能会导致识别到错别字。因此,本实施例中,问题交互模块 31在收到用户问题之后,发给问题解析模块32之前,还包括对用户问题进行以下至少一种初始化处理:
对用户问题中的冗余字段进行过滤,例如,“你好”等;
对用户问题中的错别字进行校正,例如将用户输入的“点心积木套餐”纠正为“电信积木套餐”;
对用户问题中的名称内容进行标准化处理,例如将“积木套餐”标准化为“电信积木套餐”;
对用户问题中上下文的指代进行消解处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“这个套餐怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”;
对用户问题上下文的省略进行恢复处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”。
问题解析模块32将用户问题编码成的特征向量与权值向量的纬度相同。本实施例中,问题解析模块32具体可以使用神经网络算法将用户问题编码成一个特征向量。且本实施例中的神经网络算法包括但不限于循环神经网络算法、卷积神经网络算法等等。
本实施例中,从某一权值向量对应路径的答案数据中提取用户问题的答案反馈给用户时,具体根据该用户的权限,从答案数据中提取与该用户对应的数据作为答案进行封装后反馈给用户。
本实施例中,答案处理模块33还用于在最大相似度值小于等于预设相似度阈值时,切换至人工服务,并从人工服务对所述用户问题解答的答案中提取路径,根据正例标准值对提取的路径的权值向量进行更新。例如,将正例样本的正例相似度标准值设置为1,然后从人工服务提供的用户问题-答案的答案中提取待校正路径,并提取待校正路径当前的相似度值,根据所述正例相似度标准值与待校正路径当前的相似度值之差,反向对待校正路径对应的权值向量进行校正更新。其中正例相似度标准值的取值可以根据实际应用场景灵活设定。
答案处理模块33还用于在将答案反馈给用户后,检测到启用人工服务为用户解答用户问题时,根据最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。
本实施例中,当在数据库中新增了产品及其服务数据时,答案处理模块33 可以按照上述划分方式对应为其设置路径,并基于神经网络算法为其分配一个初始的权值向量。当数据库中删除某一产品及其服务数据时,答案处理模块33 对应的删除相应路径及其权值向量。也即本实施例中当有新增数据以及删除数据时,可以对路径和权值对应关系表进行对应的局部更新即可,并不需要对整个模型重新进行更新。可以提升资源利用率以及更新效率。
为了更好的理解本发明,下面结合两种具体的情况对本发明做进一步示例说明。
假设电信运营商存储的用户表和产品与服务表分别见表1和表2:
表1
名字 | 手机号 | 话费余额 | 话费详单 | 流量余额 | 流量详单 |
张三 | 13012345001 | 128.60 | …… | 685M | …… |
李四 | 13012345002 | 86.30 | …… | 18M | …… |
王五 | 13012345003 | 18.00 | …… | 248M | …… |
表2
名字 | 标志 | 套餐内容 | 办理流程 |
电信积木 | 000101 | …… | …… |
电信火车 | 000102 | …… | …… |
答案映射模块33中的路径与权值对应关系表见表3:
表3
示例1,自动问答过程:
输入:来自于李四(13012345002)的问题:“查一下话费。”
步骤1,问题交互模块对问题初始化,处理结果为:“查一下话费。”
步骤2:问题解析模块的处理结果是:问题的特征向量为<0.9,0.2>。
步骤3:答案映射模块使用问题的特征向量为<0.9,0.2>与每一个路径向量计算余弦相似度,预设相似度阈值为0.95,各路径的计算结果如下:
用户.话费余额:<0.8,0.2>:
用户.话费详单:<0.7,0.3>:
用户.流量余额<0.6,0.8>:
用户.流量详单<0.6,0.9>:
电信积木.标志<0.3,0.4>:
电信积木.套餐内容<0.2,0.4>:
电信积木.办理流程<0.3,0.3>:
电信火车.标志<0.5,0.4>:
电信火车.套餐内容<0.6,0.4>:
电信火车.办理流程<0.5,0.5>:
从这10个结果中选取最大值0.999及其所对应的路径“用户.话费余额”发送给答案处理模块。
步骤4:由于0.999超过相似度阈值0.95,答案处理模块根据用户的手机号码(13012345002)到用户表中查询对应的余额,返回结果为86.30元,然后将该结果封装为“您的余额是86.30元”并返回给用户。
示例2,增量更新过程:
假设产品与服务表(套餐)发生了变化(更新),变化后的表见表4所示:
表4
名字 | 标志 | 套餐内容 | 办理流程 |
电信积木 | 000101 | …… | …… |
电信火车 | 000102 | …… | …… |
电信飞机 | 000103 | …… | …… |
答案映射模块中的路径与权值对应表也会发生更新,将表5所示:
表5
输入:来自于用户张三(13012345001)的问题:“问一下,肥鸡套餐怎么办理?”
步骤1,问题交互模块对问题初始化,处理结果为:“问一下,电信飞机套餐怎么办理?”。
步骤2:问题解析模块的处理结果是:问题的特征向量为<0.1,0.9>。
步骤3:答案映射模块使用问题的特征向量为<0.1,0.9>与每一个路径向量计算余弦相似度,给定阈值为0.95,各路径的计算结果如下:
用户.话费余额:<0.8,0.2>:
用户.话费详单:<0.7,0.3>:
用户.流量余额<0.6,0.8>:
用户.流量详单<0.6,0.9>:
电信积木.标志<0.3,0.4>:
电信积木.套餐内容<0.2,0.4>:
电信积木.办理流程<0.3,0.3>:
电信火车.标志<0.5,0.4>:
电信火车.套餐内容<0.6,0.4>:
电信火车.办理流程<0.5,0.5>:
电信飞机.标志<0.4,0.7>:
电信飞机.套餐内容<0.8,0.5>:
电信飞机.办理流程<0.6,0.9>:
从这10个结果中选取最大值0.938及其所对应的路径“电信积木.套餐内容”发送给答案处理装模块。
步骤4:由于0.938没有超过阈值0.95,答案处理模块将问题转交给人工服务,通过人工的方式来生成答案并返回给用户,形如:“电信飞机的办理流程如下:......”。这是一个从问题到路径“电信飞机.办理流程”的正例样本,它被用来更新答案映射模块中路径“电信飞机.办理流程”的权值,更新结果例如<0.4, 0.9>。
答案映射模块中的路径及其权值表发生更新的表6所示:
表6
路径 | 权值 |
用户.话费余额 | <0.8,0.2> |
用户.话费详单 | <0.7,0.3> |
用户.流量余额 | <0.6,0.8> |
用户.流量详单 | <0.6,0.9> |
电信积木.标志 | <0.3,0.4> |
电信积木.套餐内容 | <0.2,0.4> |
电信积木.办理流程 | <0.3,0.3> |
电信火车.标志 | <0.5,0.4> |
电信火车.套餐内容 | <0.6,0.4> |
电信火车.办理流程 | <0.5,0.5> |
电信飞机.标志 | <0.4,0.7> |
电信飞机.套餐内容 | <0.8,0.5> |
电信飞机.办理流程 | <0.4,0.9> |
本发明实施例实现自动问答是基于数据库中的产品与服务数据(涵盖运营商提供的所有服务数据以及所有用户服务数据)进行路径和权值向量设置,并不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。且本发明实施例中当出现新的服务内容或用户数据内容时,则需要对应增加新的路径和权值向量即可,并不需要对整个模型进行更新,更新更为灵活使用,适应性更好。另外本发明中的各模块可以方便的部署于不同的节点上,从而可以通过集群规模的扩展来增加系统性能。
以上内容是结合具体的实施方式对本发明实施例所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (11)
1.一种自动问答方法,包括:
获取用户下发的用户问题;
将所述用户问题编码成特征向量;
在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
2.如权利要求1所述的自动问答方法,其特征在于,将所述特征向量与路径和权值对应关系表中的各权值向量进行匹配包括:分别计算所述特征向量与所述各权值向量的相似度值,并获取得到的多个相似度值中的最大相似度值;
判断所述特征向量是否与其中一个权值向量匹配成功包括:判断所述最大相似度值是否大于预设相似度阈值,如是,判定与所述最大相似度值对应的权值向量匹配成功。
3.如权利要求2所述的自动问答方法,其特征在于,所述最大相似度值小于等于所述预设相似度阈值时,切换至人工服务,并从人工服务对所述用户问题解答的答案中提取路径,根据正例相似度标准值对提取的路径的权值向量进行更新。
4.如权利要求2所述的自动问答方法,其特征在于,将所述答案反馈给所述用户后,检测到启用人工服务为所述用户解答所述用户问题时,根据所述最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。
5.如权利要求1-4任一项所述的自动问答方法,其特征在于,将所述用户问题编码成特征向量之前,还包括对所述用户问题进行以下至少一种初始化处理:
对所述用户问题中的冗余字段进行过滤;
对所述用户问题中的错别字进行校正;
对所述用户问题中的名称内容进行标准化处理;
对所述用户问题中上下文的指代进行消解处理;
对所述用户问题上下文的省略进行恢复处理。
6.如权利要求1-4任一项所述的自动问答方法,其特征在于,从所述权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户包括:
根据所述用户的权限,从所述答案数据中提取与该用户对应的数据作为答案进行封装后反馈给用户。
7.一种自动问答系统,包括问题交互模块,问题解析模块、答案处理模块;
所述问题交互模块用于获取用户下发的用户问题;
所述问题解析模块用于将所述用户问题编码成特征向量;
所述答案处理模块用于在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
8.如权利要求7所述的自动问答系统,其特征在于,所述答案处理模块包括答案映射子模块,用于分别计算所述特征向量与所述各权值向量的相似度值,并从得到的多个相似度值中选择出最大相似度值,判断所述最大相似度值是否大于预设相似度阈值,如是,判定与所述最大相似度值对应的权值向量匹配成功。
9.如权利要求8所述的自动问答系统,其特征在于,所述答案处理模块还用于在所述最大相似度值小于等于所述预设相似度阈值时,切换至人工服务,并从人工服务对所述用户问题解答的答案中提取路径,根据正例相似度标准值对提取的路径的权值向量进行更新。
10.如权利要求8所述的自动问答系统,其特征在于,所述答案处理模块还用于在将所述答案反馈给所述用户后,检测到启用人工服务为所述用户解答所述用户问题时,根据所述最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。
11.如权利要求7-10任一项所述的自动问答系统,其特征在于,问题交互模块,问题解析模块、答案映射模块以及答案处理模块中至少两个模块设置在分布式通信系统的不同通信节点上。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610490478.6A CN107545003B (zh) | 2016-06-28 | 2016-06-28 | 自动问答方法及系统 |
PCT/CN2017/089581 WO2018001169A1 (zh) | 2016-06-28 | 2017-06-22 | 自动问答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610490478.6A CN107545003B (zh) | 2016-06-28 | 2016-06-28 | 自动问答方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107545003A CN107545003A (zh) | 2018-01-05 |
CN107545003B true CN107545003B (zh) | 2022-03-04 |
Family
ID=60786559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610490478.6A Active CN107545003B (zh) | 2016-06-28 | 2016-06-28 | 自动问答方法及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107545003B (zh) |
WO (1) | WO2018001169A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597966A (zh) * | 2018-05-23 | 2019-12-20 | 北京国双科技有限公司 | 自动问答方法及装置 |
CN108920543B (zh) * | 2018-06-13 | 2020-07-10 | 珠海格力电器股份有限公司 | 查询和交互的方法及装置、计算机装置、存储介质 |
CN109033221A (zh) * | 2018-06-29 | 2018-12-18 | 上海银赛计算机科技有限公司 | 答案生成方法、装置及服务器 |
CN109033342B (zh) * | 2018-07-24 | 2023-01-31 | 北京京东尚科信息技术有限公司 | 应用于服务系统的服务提供方法、装置和服务模型 |
CN111177328B (zh) * | 2018-11-12 | 2023-04-28 | 阿里巴巴集团控股有限公司 | 问答匹配系统和方法及问答处理设备和介质 |
CN110413730B (zh) * | 2019-06-27 | 2024-06-07 | 平安科技(深圳)有限公司 | 文本信息匹配度检测方法、装置、计算机设备和存储介质 |
CN110674276A (zh) * | 2019-09-23 | 2020-01-10 | 深圳前海微众银行股份有限公司 | 机器人自学习方法、机器人终端、装置及可读存储介质 |
CN111930905B (zh) * | 2020-07-13 | 2024-06-07 | 上海明略人工智能(集团)有限公司 | 用于问答训练的方法、装置、系统和计算机可读存储介质 |
CN113887246A (zh) * | 2021-10-19 | 2022-01-04 | 京东科技信息技术有限公司 | 客服领域人机方案一致性检测的方法、装置及存储介质 |
CN115424622A (zh) * | 2022-11-04 | 2022-12-02 | 之江实验室 | 一种人机语音智能交互方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850539A (zh) * | 2015-05-28 | 2015-08-19 | 宁波薄言信息技术有限公司 | 一种自然语言理解方法及基于该方法的旅游问答系统 |
CN105512349A (zh) * | 2016-02-23 | 2016-04-20 | 首都师范大学 | 一种用于学习者自适应学习的问答方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070083589A1 (en) * | 2005-09-26 | 2007-04-12 | Olsen Luke M | Method and apparatus for multi-user generation of domain specific knowledge and adjunct interface |
CN101251862B (zh) * | 2008-03-25 | 2010-06-09 | 北京百问百答网络技术有限公司 | 一种基于内容的问题自动分类方法及其系统 |
CN104050256B (zh) * | 2014-06-13 | 2017-05-24 | 西安蒜泥电子科技有限责任公司 | 基于主动学习的问答方法及采用该方法的问答系统 |
-
2016
- 2016-06-28 CN CN201610490478.6A patent/CN107545003B/zh active Active
-
2017
- 2017-06-22 WO PCT/CN2017/089581 patent/WO2018001169A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850539A (zh) * | 2015-05-28 | 2015-08-19 | 宁波薄言信息技术有限公司 | 一种自然语言理解方法及基于该方法的旅游问答系统 |
CN105512349A (zh) * | 2016-02-23 | 2016-04-20 | 首都师范大学 | 一种用于学习者自适应学习的问答方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2018001169A1 (zh) | 2018-01-04 |
CN107545003A (zh) | 2018-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107545003B (zh) | 自动问答方法及系统 | |
CN109145290B (zh) | 基于字向量与自注意力机制的语义相似度计算方法 | |
CN106372107B (zh) | 自然语言文句库的生成方法及装置 | |
CN109325132A (zh) | 专家知识推荐方法、装置、计算机设备及存储介质 | |
CN107886949A (zh) | 一种内容推荐方法及装置 | |
CN111680147A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
CN109063935A (zh) | 一种预测任务处理时间的方法、装置及存储介质 | |
Pustova | Investigation of call centers as retrial queuing systems | |
CN108509493A (zh) | 一种ar视觉搜索推荐服务方法 | |
CN107247753B (zh) | 一种相似用户选取方法及装置 | |
JP2007241331A (ja) | スキル値算出プログラムおよびスキル値算出装置 | |
CN110225210A (zh) | 基于通话摘要自动填写工单方法及系统 | |
CN110427604A (zh) | 表格整合方法和装置 | |
CN115456043A (zh) | 分类模型处理、意图识别方法、装置和计算机设备 | |
CN111581486B (zh) | 一种信息分配方法及装置 | |
CN108230121B (zh) | 一种基于循环神经网络的产品设计方法 | |
CN114281984A (zh) | 一种风险检测方法、装置、设备及计算机可读存储介质 | |
CN114462582A (zh) | 基于卷积神经网络模型的数据处理方法及装置、设备 | |
CN108415971B (zh) | 采用知识图谱推荐供求信息的方法和装置 | |
CN110572524A (zh) | 一种用户呼叫处理方法、装置、存储介质和服务器 | |
CN109558882A (zh) | 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置 | |
CN107590279A (zh) | 一种智慧旅游推荐系统 | |
CN111353001B (zh) | 对用户进行分类的方法和装置 | |
CN109657950B (zh) | 层次分析方法、装置、设备及计算机可读存储介质 | |
CN114896294A (zh) | 产品测试数据表生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |