CN110704589A - 一种数据查询方法、装置、设备及计算机可读存储介质 - Google Patents
一种数据查询方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110704589A CN110704589A CN201910919164.7A CN201910919164A CN110704589A CN 110704589 A CN110704589 A CN 110704589A CN 201910919164 A CN201910919164 A CN 201910919164A CN 110704589 A CN110704589 A CN 110704589A
- Authority
- CN
- China
- Prior art keywords
- feature vector
- library
- similarity
- knowledge base
- matched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据查询方法,包括接收用户终端发送的待解答问题;利用预建立的深度语义匹配模型提取待解答问题的特征向量,得到待匹配特征向量;分别计算待匹配特征向量与各库特征向量的相似度;各库特征向量为对用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取目标特征向量对应的问题组的目标答案数据;将目标答案数据返回给用户终端。本发明提升了用户体验,较大地降低了采购和维护成本,节约资源。本发明还公开了一种数据查询装置、设备及存储介质,具有相应技术效果。
Description
技术领域
本发明涉及智能客服技术领域,特别是涉及一种数据查询方法、装置、设备及计算机可读存储介质。
背景技术
企业客服部门是企业与用户重要的交流渠道,客服人员每天面对大量重复的用户问题,工作繁重效率低下。为了降低客服成本,提升服务效率,智能客服系统已被企业广泛的采用。为了解决用户常见的重复问题,一般的智能客服系统通过整理常见问题知识库,并配置相应的答案,采用信息检索或者自然语言处理技术进行实现。
对于一般企业而言,一套智能客服系统通常就可以满足它们的业务需求,然而对于某些大型企业或政府部门,由于各部门或分支机构所处的地理位置、处理的业务等可能存在较大的差异,如果只采用一套智能客服系统,知识库通常难以维护,比较明显的例子有:对于同一个用户问题比如产品价格、地方政策咨询等,在不同的地理区域内进行提问,对应的答案可能是不同的。并且有些问题很可能不能得到很好的解答,用户体验差。用户可能提问大量的共性问题,如果各机构及部门都单独的配置一整套智能客服系统分别对各用户的问题进行一一解答,则智能客服的采购及维护成本会大大增加,资源浪费严重。
综上所述,如何有效地解决用户问题不能得到很好的解答,用户体验差,采购及维护成本高,资源浪费严重等问题,是目前本领域技术人员急需解决的问题。
发明内容
本发明的目的是提供一种数据查询方法,该方法提升用户了体验,较大地降低了采购和维护成本,节约资源;本发明的另一目的是提供一种数据查询装置、设备及计算机可读存储介质。
为解决上述技术问题,本发明提供如下技术方案:
一种数据查询方法,包括:
接收用户终端发送的待解答问题;
利用预建立的深度语义匹配模型提取所述待解答问题的特征向量,得到待匹配特征向量;
分别计算所述待匹配特征向量与各库特征向量的相似度;其中,各所述库特征向量为利用所述深度语义匹配模型对所述用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用所述深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;
将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取所述目标特征向量对应的问题组的目标答案数据;
将所述目标答案数据返回给所述用户终端。
在本发明的一种具体实施方式中,将各相似度中的最大值对应的库特征向量确定为目标特征向量,包括:
判断所述目标服务者知识库中是否存在与所述待匹配特征向量的相似度大于等于第一预设值的库特征向量;
若是,则将所述目标服务者知识库中与所述待匹配特征向量相似度最大的库特征向量确定为所述目标特征向量;
若否,则当确定所述通用知识库中存在与所述待匹配特征向量的相似度大于等于所述第一预设值的库特征向量时,将所述通用知识库中与所述待匹配特征向量相似度最大的库特征向量确定为所述目标特征向量。
在本发明的一种具体实施方式中,
当确定所述通用知识库中不存在与所述待匹配特征向量的相似度大于等于所述第一预设值的库特征向量时,还包括:
计算所述待匹配特征向量与寒暄库中各库特征向量的相似度,并判断所述寒暄库中是否存在与所述待匹配特征向量的相似度大于等于第一预设值的库特征向量;
若是,则将所述寒暄库中与所述待匹配特征向量相似度最大的库特征向量确定为所述目标特征向量;其中,所述寒暄库中的各所述库特征向量为利用所述深度语义匹配模型对各寒暄问题组进行特征提取得到的。
在本发明的一种具体实施方式中,当确定所述寒暄库中不存在与所述待匹配特征向量的相似度大于等于所述第一预设值的库特征向量时,还包括:
判断计算出的所述待匹配特征向量与所述目标服务者知识库、所述通用知识库、以及所述寒暄库中各所述库特征向量的相似度中,是否存在大于等于所述第二预设值的相似度;其中,所述第二预设值小于所述第一预设值;
若是,则将大于所述第二预设值的各所述相似度进行大小排序,将数值大的一端的前预设数量个相似度对应的库特征向量的问题返回给所述用户终端,以供用户选择;
若否,则输出改变问题提问方式的问法变更提示信息。
在本发明的一种具体实施方式中,若连续输出预设次数所述问法变更提示信息,计算得到的各所述相似度中的最大值仍小于所述第二预设值,还包括:
输出转人工服务提示信息。
在本发明的一种具体实施方式中,还包括:
分别计算各所述服务者知识库中各所述服务问题组与所述通用知识库中各所述通用问题组的相似度;
将相似度大于等于第三预设值的服务问题组合并至所述通用知识库。
在本发明的一种具体实施方式中,还包括:
将相似度小于所述第三预设值的服务问题组同步至所述通用知识库。
一种数据查询装置,包括:
问题接收模块,用于接收用户终端发送的待解答问题;
特征向量提取模块,用于利用预建立的深度语义匹配模型提取所述待解答问题的特征向量,得到待匹配特征向量;
相似度计算模块,用于分别计算所述待匹配特征向量与各库特征向量的相似度;其中,各所述库特征向量为利用所述深度语义匹配模型对所述用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用所述深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;
数据获取模块,用于将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取所述目标特征向量对应的问题组的目标答案数据;
数据返回模块,用于将所述目标答案数据返回给所述用户终端。
一种数据查询设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如前所述数据查询方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述数据查询方法的步骤。
本发明提供了一种数据查询方法:接收用户终端发送的待解答问题;利用预建立的深度语义匹配模型提取待解答问题的特征向量,得到待匹配特征向量;分别计算待匹配特征向量与各库特征向量的相似度;其中,各库特征向量为利用深度语义匹配模型对用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取目标特征向量对应的问题组的目标答案数据;将目标答案数据返回给用户终端。
通过上述技术方案可知,通过预先建立各服务者知识库,并建立与各服务者知识库均建立有通信连接的通用知识库,在接收到待解答问题之后,利用深度语义匹配模型提取待解答问题的特征向量,通过将待解答问题的特征向量与利用深度语义匹配模型预先提取到的各服务问题组及各通用问题组分别对应的库特征向量进行相似度计算,将相似度最大值对应的问题组的目标答案数据返回给发送待解答问题的用户终端。不需要将用户可能提问的所有问题组及对应答案在各服务者知识库中整套配置,充分利用与各服务者知识库建立有通信连接的通用知识库,使得用户的问题得以更好的解答,提升用户了体验,较大地降低了采购和维护成本,节约资源。
相应的,本发明实施例还提供了与上述数据查询方法相对应的数据查询装置、设备和计算机可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中数据查询方法的一种实施流程图;
图2为本发明实施例中数据查询方法的另一种实施流程图;
图3为本发明实施例中一种客服系统的结构框图;
图4为本发明实施例中一种数据查询装置的结构框图;
图5为本发明实施例中一种数据查询设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
参见图1,图1为本发明实施例中数据查询方法的一种实施流程图,该方法可以包括以下步骤:
S101:接收用户终端发送的待解答问题。
当用户需要询问地方政策、某企业的产品价格等问题时,可以利用用户终端向客服服务系统发送待解答问题。客服服务系统接收用户终端发送的待解答问题。
用户终端可以是手机、平板电脑等。待解答问题可以是用户通过用户终端提问的语音问题。
S102:利用预建立的深度语义匹配模型提取待解答问题的特征向量,得到待匹配特征向量。
可以采用网络爬虫技术及人员整理编辑的方式构建专业领域内的通用知识库,并通过对寒暄语句的整理构建寒暄库,使得通用知识库及寒暄库中包含多组相似问题及对应的答案。以通用知识库及寒暄库中相似问题组为训练样本,采用卷积网络或其它网络模型作为深度语义匹配的基本模型,根据训练样本训练建立深度语义匹配模型。这里较优的选择CNN+Attention机制作为深度语义匹配的基本模型,具体的训练模型为在基本模型后加入全连接层,并采用交叉熵作为损失函数,训练以相似问题组为类别的分类模型,能够提升提取到的特征向量的语义效果。在接收到用户终端发送的待解答问题之后,可以利用预建立的深度语义匹配模型提取待解答问题的特征向量,得到待匹配特征向量。
S103:分别计算待匹配特征向量与各库特征向量的相似度。
其中,各库特征向量为利用深度语义匹配模型对用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到。
可以预先利用深度语义匹配模型对用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,并深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取,得到各库特征向量。在提取得到待解答问题的待匹配特征向量之后,可以分别计算待匹配特征向量与各库特征向量的相似度,如对待匹配特征向量与各库特征向量进行两两的余弦相似度计算。
用户终端与服务者知识库之间的对应关系可以是通过终端区号、产品类型等进行确定。如当用户需要询问地方政策时,则可以根据用户终端的区号自动首先匹配到区号对应的地方政策,当用户需要询问某企业某一产品的性能时,会利用用户终端中预先部署的APP,或者通过WEB网页以文本的形式向对应的服务者知识库发送问题,或发送语音问题。当然本发明实施例对用户终端与服务者知识库之间的对应关系的确定并不局限于上述两种方式,还可以根据实际情况采用其他的方式。
S104:将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取目标特征向量对应的问题组的目标答案数据。
通用知识库中预先存储有各通用问题组对应的答案,各服务者知识库中预先存储有各服务问题组对应的答案。在分别计算待匹配特征向量与各库特征向量的相似度之后,由于相似度越大,说明该库特征向量对应的问题组与待解答问题越接近,相应的问题组对应的答案对待解答问题能够成功解答的概率更大,因此可以将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取目标特征向量对应的问题组的目标答案数据。
S105:将目标答案数据返回给用户终端。
在获取到目标特征向量对应的问题组的目标答案数据之后,可以将目标答案数据返回给用户终端,与用户进行有效会话,从而使得待解答问题得以成功的解答。即本发明实施例所涉及的数据查询即为对用户终端发送的待解答问题对应的答案的查询。解决了大型企业及政府部门中各分支机构或部门对于共享智能客服的需求,减少了独立采用智能客服系统的成本及后续的维护成本。使得大型企业或政府部门能够及时了解分支机构或部门的服务情况、用户满意度、产品的缺陷等,提升自身的服务质量。
通过上述技术方案可知,通过预先建立各服务者知识库,并建立与各服务者知识库均建立有通信连接的通用知识库,在接收到待解答问题之后,利用深度语义匹配模型提取待解答问题的特征向量,通过将待解答问题的特征向量与利用深度语义匹配模型预先提取到的各服务问题组及各通用问题组分别对应的库特征向量进行相似度计算,将相似度最大值对应的问题组的目标答案数据返回给发送待解答问题的用户终端。不需要将用户可能提问的所有问题组及对应答案在各服务者知识库中整套配置,充分利用与各服务者知识库建立有通信连接的通用知识库,使得用户的问题得以更好的解答,提升了用户体验,较大地降低了采购和维护成本,节约资源。
需要说明的是,基于上述实施例一,本发明实施例还提供了相应的改进方案。在后续实施例中涉及与上述实施例一中相同步骤或相应步骤之间可相互参考,相应的有益效果也可相互参照,在下文的改进实施例中不再一一赘述。
实施例二:
参见图2,图2为本发明实施例中数据查询方法的另一种实施流程图,该方法可以包括以下步骤:
S201:接收用户终端发送的待解答问题。
S202:利用预建立的深度语义匹配模型提取待解答问题的特征向量,得到待匹配特征向量。
S203:分别计算待匹配特征向量与各库特征向量的相似度。
其中,各库特征向量为利用深度语义匹配模型对用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到。
S204:判断目标服务者知识库中是否存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量,若是,则执行步骤S205和步骤S206,若否,则执行步骤S207或步骤S208。
可以预先设置待匹配特征向量与各库特征向量的相似度的第一预设值。在分别计算待匹配特征向量与各库特征向量的相似度之后,可以判断目标服务者知识库中是否存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量,若是,则说明目标服务器者知识库中存在能够对待解答问题进行有效解答的答案,可以继续执行步骤S205和步骤S206。若否,则说明目标服务器者知识库中的答案均不能够对待解答问题进行有效解答,在这种情况下,可以继续执行步骤S207或步骤S208。通过优先判断目标服务者知识库中是否存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量,保证了在目标服务者知识库中存在待解答问题的答案时,优先从目标服务者知识库中获取到相应的答案,直接返回给用户终端,在这种情况下,若通用知识库与目标服务者知识库处于异地分布,且用户终端与目标服务者知识库处于同一地区,则可以节省网络资源带宽。
S205:将目标服务者知识库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量。
在确定目标服务者知识库中存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,可以将目标服务者知识库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量。
S206:获取目标特征向量对应的问题组的目标答案数据,将目标答案数据返回给用户终端。
S207:当确定通用知识库中存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,将通用知识库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量,并执行步骤S205和步骤S206。
在确定目标服务者知识库中不存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,可以判断通用知识库中是否存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量,当确定通用知识库中存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,将通用知识库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量,并执行步骤S205和步骤S206。
S208:当确定通用知识库中不存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,计算待匹配特征向量与寒暄库中各库特征向量的相似度。
其中,寒暄库中的各库特征向量为利用深度语义匹配模型对各寒暄问题组进行特征提取得到的。
可以预先利用深度语义匹配模型对寒暄库中的各寒暄问题组进行特征提取,得到寒暄库中的各库特征向量。当确定目标服务者知识库和通用知识库中均不存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,可以计算待匹配特征向量与寒暄库中各库特征向量的相似度。
S209:判断寒暄库中是否存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量,若是,则执行步骤S210,若否,则执行步骤S211。
在计算得到待匹配特征向量与寒暄库中各库特征向量的相似度之后,可以判断寒暄库中是否存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量。
S210:将寒暄库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量,并执行步骤S205和步骤S206。
在确定寒暄库中存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,可以将寒暄库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量,并执行步骤S205和步骤S206。
S211:判断计算出的待匹配特征向量与目标服务者知识库、通用知识库、以及寒暄库中各库特征向量的相似度中,是否存在大于等于第二预设值的相似度,若是,则执行步骤S212,若否,则执行步骤S213。
其中,第二预设值小于第一预设值。
可以预先设置待匹配特征向量与各库特征向量的相似度的第二预设值。在计算得到待匹配特征向量与各库特征向量的相似度之后,可以判断计算出的待匹配特征向量与目标服务者知识库、通用知识库、以及寒暄库中各库特征向量的相似度中,是否存在大于等于第二预设值的相似度,若是,则可以继续执行步骤S212。若否,则可以继续执行步骤S213。
S212:将大于第二预设值的各所述相似度进行大小排序,将数值大的一端的前预设数量个相似度对应的库特征向量的问题返回给用户终端,以供用户选择。
在确定待匹配特征向量与各库特征向量的相似度中存在大于等于第二预设值的相似度时,可以将大于所述第二预设值的各所述相似度进行大小排序,可以按照从大到小排序,也可以按照从小到大排序,将数值大的一端的前预设数量个相似度对应的库特征向量的问题返回给所述用户终端,以供用户选择。如可以挑选匹配度最优的前N个问题供用户进行选择,如果待解答问题匹配到的问题总数不足N个,则返回匹配到的所有问题供用户选择,N通常取值为三或者五。
S213:输出改变问题提问方式的问法变更提示信息。
在确定待匹配特征向量与寒暄库中的各库特征向量的相似度中的最大值小于第二预设值时,说明可能是用户当前所提问题的问法有问题,在这种情况下,可以输出改变问题提问方式的问法变更提示信息。
S214:若连续输出预设次数问法变更提示信息,计算得到的各相似度中的最大值仍小于第二预设值,则输出转人工服务提示信息。
可以预先设定在各库中均不存在对当前带解答问题的有效答案时输出问法变更提示信息的次数,若连续输出预设次数问法变更提示信息,对新提取得到的待匹配特征向量计算得到的各相似度中的最大值仍小于第二预设值,则输出转人工服务提示信息。
需要说明的是,预设次数可以根据实际情况进行设定和调整,本发明实施例对此不做限定,如可以设定为2。
在本发明的一种具体实施方式中,该方法还可以包括以下步骤:
步骤一:分别计算各服务者知识库中各服务问题组与通用知识库中各通用问题组的相似度;
步骤二:将相似度大于等于第三预设值的服务问题组合并至通用知识库。
为方便描述,可以将上述两个步骤结合起来进行说明。
可以预先设置各服务者知识库中各服务问题组与通用知识库中各通用问题组相似度的第三预设值,分别计算各服务者知识库中各服务问题组与通用知识库中各通用问题组的相似度,将相似度大于等于第三预设值的服务问题组合并至通用知识库。通过将各服务者知识库中与通用知识库中通用问题组相似度较大的服务问题组合并到通用知识库中,使得服务者知识库得以一定程度的释放,能够有效地降低对服务者知识库的维护成本,节约了资源。
对于两个问题组中各问题的相似性预判,可以设置对应的相似度,当大于等于该相似度时,确定两个问题相似。
需要说明的是,第三预设值可以根据实际情况进行设定和调整,本发明实施例对此不做限定。如可以设置为80%,假设两个问题组中均有10个问题,存在8对问题的相似值超过预设的相似度,则认为两个问题组相似。
在本发明的一种具体实施方式中,该方法还可以包括以下步骤:
将相似度小于第三预设值的服务问题组同步至通用知识库。
承接上述实施例,在计算得到各服务者知识库中各服务问题组与通用知识库中各通用问题组的相似度之后,可以将相似度小于第三预设值的服务问题组同步至通用知识库。可以使得通用知识库得到更新,保证用户提出的有效问题能够得到全面解答。在对问题组进行合并同步操作的过程中,还可以使得深度语义匹配模型得以迭代更新。各分支机构或部门可以在不配置自己知识库的情况下,及时的对用户提供服务。通过整合所有服务者知识库,能够有效的迭代模型,提高智能客服的服务质量。
在具体实例应用中,如图3所示,图3为本发明实施例中一种客服系统的结构框图。对于服务者知识库A的用户客服系统中配置有服务者知识库A,并分配有服务者A提供人工服务。对于服务者知识库B的用户客服系统中配置有服务者知识库B,并分配有服务者B提供人工服务。……对于服务者知识库N的用户客服系统中配置有服务者知识库N,并分配有服务者N提供人工服务。并分别建立各服务者知识库与通用知识库和寒暄库之间的通信连接,实现智能客服的共享,并为各库部署深度语义匹配模型,用于对从待解答问题中提取得到的待匹配特征向量和预先提取得到的库特征向量的相似度计算。不需要将用户可能提问的所有问题组及对应答案在各服务者知识库中整套配置,充分利用与各服务者知识库建立有通信连接的通用知识库,使得用户终端发送的待解答问题得以有效解答,提升用户体验,较大地降低了采购和维护成本,节约资源。
相应于上面的方法实施例,本发明实施例还提供了一种数据查询装置,下文描述的数据查询装置与上文描述的数据查询方法可相互对应参照。
参见图4,图4为本发明实施例中一种数据查询装置的结构框图,该装置可以包括:
问题接收模块41,用于接收用户终端发送的待解答问题;
特征向量提取模块42,用于利用预建立的深度语义匹配模型提取待解答问题的特征向量,得到待匹配特征向量;
相似度计算模块43,用于分别计算待匹配特征向量与各库特征向量的相似度;其中,各库特征向量为利用深度语义匹配模型对用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;
数据获取模块44,用于将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取目标特征向量对应的问题组的目标答案数据;
数据返回模块45,用于将目标答案数据返回给用户终端。
通过上述技术方案可知,通过预先建立各服务者知识库,并建立与各服务者知识库均建立有通信连接的通用知识库,在接收到待解答问题之后,利用深度语义匹配模型提取待解答问题的特征向量,通过将待解答问题的特征向量与利用深度语义匹配模型预先提取到的各服务问题组及各通用问题组分别对应的库特征向量进行相似度计算,将相似度最大值对应的问题组的目标答案数据返回给发送待解答问题的用户终端。不需要将用户可能提问的所有问题组及对应答案在各服务者知识库中整套配置,充分利用与各服务者知识库建立有通信连接的通用知识库,使得用户的问题得以更好的解答,提升了用户体验,较大地降低了采购和维护成本,节约资源。
在本发明的一种具体实施方式中,数据获取模块44包括特征向量确定子模块,特征向量确定子模块包括:
判断单元,用于判断目标服务者知识库中是否存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量;
特征向量确定单元,用于在确定目标服务者知识库中存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,将目标服务者知识库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量;在确定目标服务者知识库中不存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量,并确定通用知识库中存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,将通用知识库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量。
在本发明的一种具体实施方式中,相似度计算模块43,还用于计算待匹配特征向量与寒暄库中各库特征向量的相似度;
该装置还可以包括:
判断模块,用于判断寒暄库中是否存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量;
特征向量确定子模块具体为当确定寒暄库中存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,将寒暄库中与待匹配特征向量相似度最大的库特征向量确定为目标特征向量的模块;其中,寒暄库中的各库特征向量为利用深度语义匹配模型对各寒暄问题组进行特征提取得到的。
在本发明的一种具体实施方式中,判断模块,还用于当确定寒暄库中不存在与待匹配特征向量的相似度大于等于第一预设值的库特征向量时,判断计算出的待匹配特征向量与目标服务者知识库、通用知识库、以及寒暄库中各库特征向量的相似度中,是否存在大于等于第二预设值的相似度;其中,第二预设值小于第一预设值;
该装置还可以包括:
问题返回模块,用于当确定计算出的待匹配特征向量与目标服务者知识库、通用知识库、以及寒暄库中各库特征向量的相似度中,存在大于等于第二预设值的相似度时,将大于第二预设值的各相似度进行大小排序,将数值大的一端的前预设数量个相似度对应的库特征向量的问题返回给用户终端,以供用户选择;
信息输出模块,用于当确定计算出的待匹配特征向量与目标服务者知识库、通用知识库、以及寒暄库中各库特征向量的相似度中,均不存在大于等于第二预设值的相似度时,输出改变问题提问方式的问法变更提示信息。
在本发明的一种具体实施方式中,信息输出模块,还用于在连续输出预设次数问法变更提示信息,计算得到的各相似度中的最大值仍小于第二预设值时,输出转人工服务提示信息。
在本发明的一种具体实施方式中,相似度计算模块43,还用于分别计算各服务者知识库中各服务问题组与通用知识库中各通用问题组的相似度;
还包括问题组合并模块,用于将相似度大于等于第三预设值的服务问题组合并至通用知识库。
在本发明的一种具体实施方式中,该装置还可以包括:
问题组同步模块,用于将相似度小于第三预设值的服务问题组同步至通用知识库。
相应于上面的方法实施例,参见图5,图5为本发明所提供的数据查询设备的示意图,该设备可以包括:
存储器51,用于存储计算机程序;
处理器52,用于执行上述存储器51存储的计算机程序时可实现如下步骤:
接收用户终端发送的待解答问题;利用预建立的深度语义匹配模型提取待解答问题的特征向量,得到待匹配特征向量;分别计算待匹配特征向量与各库特征向量的相似度;其中,各库特征向量为利用深度语义匹配模型对用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取目标特征向量对应的问题组的目标答案数据;将目标答案数据返回给用户终端。
对于本发明提供的设备的介绍请参照上述方法实施例,本发明在此不做赘述。
相应于上面的方法实施例,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
接收用户终端发送的待解答问题;利用预建立的深度语义匹配模型提取待解答问题的特征向量,得到待匹配特征向量;分别计算待匹配特征向量与各库特征向量的相似度;其中,各库特征向量为利用深度语义匹配模型对用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取目标特征向量对应的问题组的目标答案数据;将目标答案数据返回给用户终端。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置、设备及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种数据查询方法,其特征在于,包括:
接收用户终端发送的待解答问题;
利用预建立的深度语义匹配模型提取所述待解答问题的特征向量,得到待匹配特征向量;
分别计算所述待匹配特征向量与各库特征向量的相似度;其中,各所述库特征向量为利用所述深度语义匹配模型对所述用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用所述深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;
将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取所述目标特征向量对应的问题组的目标答案数据;
将所述目标答案数据返回给所述用户终端。
2.根据权利要求1所述的数据查询方法,其特征在于,将各相似度中的最大值对应的库特征向量确定为目标特征向量,包括:
判断所述目标服务者知识库中是否存在与所述待匹配特征向量的相似度大于等于第一预设值的库特征向量;
若是,则将所述目标服务者知识库中与所述待匹配特征向量相似度最大的库特征向量确定为所述目标特征向量;
若否,则当确定所述通用知识库中存在与所述待匹配特征向量的相似度大于等于所述第一预设值的库特征向量时,将所述通用知识库中与所述待匹配特征向量相似度最大的库特征向量确定为所述目标特征向量。
3.根据权利要求2所述的数据查询方法,其特征在于,当确定所述通用知识库中不存在与所述待匹配特征向量的相似度大于等于所述第一预设值的库特征向量时,还包括:
计算所述待匹配特征向量与寒暄库中各库特征向量的相似度,并判断所述寒暄库中是否存在与所述待匹配特征向量的相似度大于等于第一预设值的库特征向量;
若是,则将所述寒暄库中与所述待匹配特征向量相似度最大的库特征向量确定为所述目标特征向量;其中,所述寒暄库中的各所述库特征向量为利用所述深度语义匹配模型对各寒暄问题组进行特征提取得到的。
4.根据权利要求3所述的数据查询方法,其特征在于,当确定所述寒暄库中不存在与所述待匹配特征向量的相似度大于等于所述第一预设值的库特征向量时,还包括:
判断计算出的所述待匹配特征向量与所述目标服务者知识库、所述通用知识库、以及所述寒暄库中各所述库特征向量的相似度中,是否存在大于等于所述第二预设值的相似度;其中,所述第二预设值小于所述第一预设值;
若是,则将大于所述第二预设值的各所述相似度进行大小排序,将数值大的一端的前预设数量个相似度对应的库特征向量的问题返回给所述用户终端,以供用户选择;
若否,则输出改变问题提问方式的问法变更提示信息。
5.根据权利要求4所述的数据查询方法,其特征在于,若连续输出预设次数所述问法变更提示信息,计算得到的各所述相似度中的最大值仍小于所述第二预设值,还包括:
输出转人工服务提示信息。
6.根据权利要求1至5任一项所述的数据查询方法,其特征在于,还包括:
分别计算各所述服务者知识库中各所述服务问题组与所述通用知识库中各所述通用问题组的相似度;
将相似度大于等于第三预设值的服务问题组合并至所述通用知识库。
7.根据权利要求6所述的数据查询方法,其特征在于,还包括:
将相似度小于所述第三预设值的服务问题组同步至所述通用知识库。
8.一种数据查询装置,其特征在于,包括:
问题接收模块,用于接收用户终端发送的待解答问题;
特征向量提取模块,用于利用预建立的深度语义匹配模型提取所述待解答问题的特征向量,得到待匹配特征向量;
相似度计算模块,用于分别计算所述待匹配特征向量与各库特征向量的相似度;其中,各所述库特征向量为利用所述深度语义匹配模型对所述用户终端对应的目标服务者知识库中的各服务问题组进行特征提取,以及利用所述深度语义匹配模型对与各服务者知识库建立有通信连接的通用知识库中的各通用问题组进行特征提取得到;
数据获取模块,用于将各相似度中的最大值对应的库特征向量确定为目标特征向量,并获取所述目标特征向量对应的问题组的目标答案数据;
数据返回模块,用于将所述目标答案数据返回给所述用户终端。
9.一种数据查询设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述数据查询方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述数据查询方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910919164.7A CN110704589A (zh) | 2019-09-26 | 2019-09-26 | 一种数据查询方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910919164.7A CN110704589A (zh) | 2019-09-26 | 2019-09-26 | 一种数据查询方法、装置、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110704589A true CN110704589A (zh) | 2020-01-17 |
Family
ID=69197333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910919164.7A Pending CN110704589A (zh) | 2019-09-26 | 2019-09-26 | 一种数据查询方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110704589A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789496A (zh) * | 2012-07-13 | 2012-11-21 | 携程计算机技术(上海)有限公司 | 智能应答的实现方法及系统 |
CN104978360A (zh) * | 2014-04-11 | 2015-10-14 | 俞志晨 | 一种带账户身份的问答系统的实现方法 |
CN105630938A (zh) * | 2015-12-23 | 2016-06-01 | 深圳市智客网络科技有限公司 | 一种智能问答系统 |
-
2019
- 2019-09-26 CN CN201910919164.7A patent/CN110704589A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789496A (zh) * | 2012-07-13 | 2012-11-21 | 携程计算机技术(上海)有限公司 | 智能应答的实现方法及系统 |
CN104978360A (zh) * | 2014-04-11 | 2015-10-14 | 俞志晨 | 一种带账户身份的问答系统的实现方法 |
CN105630938A (zh) * | 2015-12-23 | 2016-06-01 | 深圳市智客网络科技有限公司 | 一种智能问答系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110162611B (zh) | 一种智能客服应答方法及系统 | |
CN106874134B (zh) | 工单类型的处理方法、装置及系统 | |
CN104951544A (zh) | 用户数据处理方法、用户数据的提供方法和系统 | |
CN108650428B (zh) | 案件申诉举报处理方法及系统、应用装置 | |
CN107784033A (zh) | 一种基于会话进行推荐的方法和装置 | |
CN111027838B (zh) | 一种众包任务推送方法、装置、设备及其存储介质 | |
CN110570215A (zh) | 智能客服系统 | |
CN105279168A (zh) | 支持自然语言的数据查询方法、开放平台及用户终端 | |
CN111178820A (zh) | 协同工作的处理方法、装置、终端及存储介质 | |
CN110796348A (zh) | 一种满意度调查的方法和装置 | |
CN104216896A (zh) | 一种查找联系人信息的方法及装置 | |
CN109508367A (zh) | 自动提取问答语料的方法、在线智能客服系统及电子设备 | |
CN110704589A (zh) | 一种数据查询方法、装置、设备及计算机可读存储介质 | |
CN114491010A (zh) | 信息抽取模型的训练方法及装置 | |
CN111046145A (zh) | 交互意图路径的挖掘方法以及装置 | |
KR20210009007A (ko) | 상담 내용을 요약하는 서버, 방법 및 상담 내용의 요약을 요청하는 상담원 단말 | |
CN116401271A (zh) | 数据库表查询方法、计算机设备及计算机存储介质 | |
CN113573029B (zh) | 一种基于iot的多方音视频交互方法及系统 | |
CN103390065A (zh) | 一种基于通讯群组的数据提取方法和装置 | |
CN112163066B (zh) | 人工智能模型训练方法、知识点推送方法、装置和介质 | |
CN106125956A (zh) | 一种基于输入法的信息推送方法及系统 | |
CN112163075A (zh) | 一种信息推荐方法、装置、计算机设备和存储介质 | |
CN113807912A (zh) | 动态匹配用户和经纪人连接的方法及计算机程序产品 | |
CN108932283B (zh) | 客户信息筛选方法、系统、计算机设备和存储介质 | |
CN112307075A (zh) | 用户关系识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200117 |
|
RJ01 | Rejection of invention patent application after publication |