CN108446322B - 一种智能问答系统的实现方法和装置 - Google Patents
一种智能问答系统的实现方法和装置 Download PDFInfo
- Publication number
- CN108446322B CN108446322B CN201810137795.9A CN201810137795A CN108446322B CN 108446322 B CN108446322 B CN 108446322B CN 201810137795 A CN201810137795 A CN 201810137795A CN 108446322 B CN108446322 B CN 108446322B
- Authority
- CN
- China
- Prior art keywords
- question
- user
- content
- template
- key data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000015654 memory Effects 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/185—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast with management of multicast group membership
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/216—Handling conversation history, e.g. grouping of messages in sessions or threads
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及计算机技术领域,提供了一种智能问答系统的实现方法和装置。其中方法包括获取第一用户的问题内容,抽取问题内容中的关键数据;根据关键数据生成模板问题,并将模板问题划分为预设的问题意图中;获取用户当前输入的问题内容,根据当前问题内容中携带的关键数据,确定当前问题内容中缺失槽位信息;确定当前问题内容的问题意图;从相应问题意图中所包含的各模板问题中,确认与当前问题内容匹配度达到预设阈值的至少一个模板问题;并将至少一个模板问题中的关键信息填充到槽位信息中,得到填充版本的当前问题内容。本发明实现了对输入问题的意图识别与对话状态跟踪功能,使得系统可以结合上下文语境生成相应的回答。
Description
【技术领域】
本发明涉及计算机技术领域,特别是涉及一种智能问答系统的实现方法和装置。
【背景技术】
在移动互联网时代,线上沟通方式越来越普及与流行,客户对及时服务的要求越来越高。然而,通过人工提供7*24小时的成本非常高,有限的人力资源也很难支撑越来越庞大的用户群体,因此对自动化的智能客服系统的需求越来越急迫。
相比人工客服,目前智能客服系统处理上下文和多轮对话的能力普遍偏弱,多数系统只能进行简单的一问一答,从而降低了智能客服系统服务的体验。并且,在用户采用代词或者缩略语阐述问题的时候,会发生服务器无法有效识别的问题。另外,现有的智能服务器系统通常都是死板的提供问题类型选择给用户,而实际情况则是用户很难从相应的服务器中有效的找到自己所需的答案。
鉴于此,克服该现有技术所存在的缺陷是本技术领域亟待解决的问题。
【发明内容】
本发明要解决的技术问题是现有技术中,所提供的问答客服(机器人客服)系统只能提供一问一答的死板流程,一旦用户并发输入较多信息,现有的问答客服系统便无法应对,因此,现有的问答客服系统的效率低、交互过程冗余度高。
进一步,本发明所要解决的技术问题是现有技术中的问答系统只有单纯的用户与机器人客服,以及用户与人工客服两种方式,并且,在每一次用户接入人工客服的时候,不仅需要繁琐的流程而且经常会遇到占线等待接通的情况,极大的影响了问题内容被解答的效率。
本发明采用如下技术方案:
第一方面,本发明提供了一种智能问答系统的实现方法,方法包括:
获取第一用户的一个或者多个问题内容,抽取问题内容中的关键数据;
根据所述关键数据生成一个或者多个模板问题,并将所述模板问题划分为一个或者多个预设的问题意图中;
获取用户当前输入的问题内容,根据当前问题内容中携带的关键数据,确定所述当前问题内容中缺失槽位信息;
确定所述当前问题内容的问题意图;从相应问题意图中所包含的各模板问题中,确认与当前问题内容匹配度达到预设阈值的至少一个模板问题;并将所述至少一个模板问题中的关键信息填充到所述槽位信息中,得到填充版本的当前问题内容,以便服务器根据所述填充版本的当前问题内容确定答案内容。
优选的,由问题意图与模板问题构建KNN分类器,其中问题内容与模板问题均用词向量表示成n维向量;所述KNN分类器的距离度量采用余弦相似度;则所述当前问题内容经过预处理之后,进入所述KNN分类器,由所述KNN分类器进行当前问题的意图检测与识别。
优选的,服务器对于每个用户维护其上下文相关问题内容数据,存储自对话开始以来检测到的所有问题内容,根据所述问题内容生成问题模板和提取相关可作为槽位信息的关键数据,并为所述问题模板增设问题意图作为分组标识。
优选的,服务器接收到当前问题内容后,若检测到属于某一问题意图,则服务器从上下文数据中获取该问题意图中与当前问题内容相似度最高的模板问题,及其关键数据;确认当前问题内容中的槽位信息,并将所述模板问题中对应的关键数据填充到当前问题内容的相应槽位。若未检测到意图,则沿用最近一轮对话的问题意图。
优选的,所述方法还包括:若当前问题内容的槽位已全部填充,则根据填充版本的当前问题内容生成输出答案;若未全部填充,则根据缺失槽位信息生成相关询问语句。
优选的,确定对应于相应问题意图的问题个数阈值;若检测到的一时间段内第一用户反馈的问题内容的个数大于所述问题个数阈值后,还接收到第一用户对应于同一问题意图的问题内容,则根据所述问题意图所包含的关键数据,匹配出与所述第一用户相似度达到预设阈值的第二用户;
向所述第一用户和第二用户推送建立问答服务群组的请求。
优选的,在建立包括第一用户和第二用户的问答服务群组后,所述方法还包括:
获取第一用户和第二用户在所述问答服务群组中的聊天记录,并根据聊天记录中的关键数据更新归属于所述问题意图的关键数据;
根据所述更新各自的问题意图,向所述第一用户和/或第二用户发送问题答案。
优选的,所述匹配出与所述第一用户相似度达到预设阈值的第二用户,具体包括:
匹配出与所述第一用户相似度达到预设阈值的,且历史上使用所述智能问答系统,并被记录有相应关键数据、问题内容、问题答案、问题意图中的一项或者多项数据的第二用户;或者,
匹配出与所述第一用户相似度达到预设阈值的,且当前正在使用所述智能问答系统的第二用户。
优选的,所述确定对应于相应问题意图的问题个数阈值,具体为:
不同的问题意图所对应的问题个数阈值是动态的,其中,对于问题答复复杂度较高的问题意图,相应的问题个数阈值为6-10个;对于问题答复复杂度较低的问题意图,相应的问题个数阈值为2-5个。
所述问题答复复杂度指代问题意图所对应的答案内容中,包含的涉及用户选择的节点的数量多少;或者,问题答复复杂度指代问题意图所能够对应的答案内容数量。
优选的,采用基于trie树的字符串匹配算法实现对输入问题的关键数据识别,具体的:
利用关键数据词汇表构建trie树;
对输入的一个或者多个问题内容进行匹配,得到问题内容包含的关键数据;
用获得的关键数据填充对应于提问用户所提出问题内容中的槽位信息。
优选的,对于每个用户建立一个数组存储所有得到答案内容正确反馈的历史问题意图和关键数据;则每当获取请求终端发送的问题内容,并根据关键数据匹配出问题意图后;确认所述问题意图已经在数组中存在,则直接提取对应于该问题意图的问题内容反馈给相应请求终端。
优选的,所述方法还包括:在第一用户反馈问题内容得到有效解决时,服务器存储对应于本轮问题内容答复过程中所搜集的关键数据,并建立所述关键数据、问题意图和问题内容之间的映射关系。
第二方面,本发明还提供了一种智能问答系统的实现终端,用于实现第一方面所述的智能问答系统的实现方法,所述装置包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被程序设置为执行第一方面所述的智能问答系统的实现方法。
第三方面,本发明还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,用于完成第一方面所述的智能问答系统的实现方法。
本发明提出了一种支持多轮对话的智能客服系统的实现方案,其核心点在于实现了对输入问题的意图识别与对话状态跟踪功能,使得系统可以结合上下文语境生成相应的回答。
本发明还提供了一种根据问题意图相似度进行提问用户群组建立的方法,从而利用用户之间的讨论内容更快的定位到答案内容上去。
进一步的,本发明定义了一套对话模板框架,对于不同场景的应用,只需提供相应的配置模板即可让系统支持相关问答,从而使系统具有良好的通用性和可扩展性。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种智能问答系统的实现方法流程示意图;
图2是本发明实施例提供的改进的一种智能问答系统的实现方法流程示意图;
图3是本发明实施例提供的改进的一种智能问答系统的实现方法流程示意图;
图4是本发明实施例提供的一种关键数据的抽取方法流程图;
图5是本发明实施例提供的一种智能问答系统的实现装置的结构示意图。
【具体实施方式】
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明的描述中,术语“内”、“外”、“纵向”、“横向”、“上”、“下”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明而不是要求本发明必须以特定的方位构造和操作,因此不应当理解为对本发明的限制。
此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例1:
本发明实施例1提供了一种智能问答系统的实现方法,在本发明实施例中,所述问题内容可以是用户通过智能终端发送给服务器的,所述智能终端包括但不限于:移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等;超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad;其他具有连接互联网功能的电子设备。如图1所示,方法包括:
在步骤201中,获取第一用户的一个或者多个问题内容,抽取问题内容中的关键数据。
其中,抽取问题中的关键数据可以是通过语义识别来实现,即对于语义中的主语、宾语等关键数据进行抽取。
在步骤202中,根据所述关键数据生成一个或者多个模板问题,并将所述模板问题划分为一个或者多个预设的问题意图中。
在步骤203中,获取用户当前输入的问题内容,根据当前问题内容中携带的关键数据,确定所述当前问题内容中缺失槽位信息。
在步骤204中,确定所述当前问题内容的问题意图。
在步骤205中,从相应问题意图中所包含的各模板问题中,确认与当前问题内容匹配度达到预设阈值的至少一个模板问题;并将所述至少一个模板问题中的关键信息填充到所述槽位信息中,得到填充版本的当前问题内容,以便服务器根据所述填充版本的当前问题内容确定答案内容。
本发明实施例提出了一种支持多轮对话的智能客服系统的实现方案,其核心点在于实现了对输入问题的意图识别与对话状态跟踪功能,使得系统可以结合上下文语境生成相应的回答。
结合本发明实施例,还存提供了一种意图检测与识别的方法,具体的,由问题意图与模板问题构建KNN分类器,其中问题内容与模板问题均用词向量表示成n维向量;所述KNN分类器的距离度量采用余弦相似度;则所述当前问题内容经过预处理之后,进入所述KNN分类器,由所述KNN分类器进行当前问题的意图检测与识别。其中,所述预处理包括大小写转换、繁简体转换,停用词去除等等。
结合本发明实施例,还存在一种优选的实现方式,服务器对于每个用户维护其上下文相关问题内容数据,存储自对话开始以来检测到的所有问题内容,根据所述问题内容生成问题模板和提取相关可作为槽位信息的关键数据,并为所述问题模板增设问题意图作为分组标识。
结合本发明实施例,还存在一种优选的实现方式,服务器接收到当前问题内容后,若检测到属于某一问题意图,则服务器从上下文数据中获取该问题意图中与当前问题内容相似度最高的模板问题,及其关键数据;确认当前问题内容中的槽位信息,并将所述模板问题中对应的关键数据填充到当前问题内容的相应槽位。若未检测到意图,则沿用最近一轮对话的问题意图。
结合本发明实施例,还存在一种优选的实现方式,所述方法还包括:若当前问题内容的槽位已全部填充,则根据填充版本的当前问题内容生成输出答案;若未全部填充,则根据缺失槽位信息生成相关询问语句。
结合本发明实施例,还存在一种优选的实现方式,其针对于用户已经发送了多个问题内容,却仍旧为找到其目标答案内容的时候触发,如图2所示,所述方法还包括:
在步骤206中,确定对应于相应问题意图的问题个数阈值;若检测到的一时间段内第一用户反馈的问题内容的个数大于所述问题个数阈值后,还接收到第一用户对应于同一问题意图的问题内容,则根据所述问题意图所包含的关键数据,匹配出与所述第一用户相似度达到预设阈值的第二用户。
其中,所述匹配出与所述第一用户相似度达到预设阈值的第二用户,具体包括:匹配出与所述第一用户相似度达到预设阈值的,且历史上使用所述智能问答系统,并被记录有相应关键数据、问题内容、问题答案、问题意图中的一项或者多项数据的第二用户;或者,匹配出与所述第一用户相似度达到预设阈值的,且当前正在使用所述智能问答系统的第二用户。
在步骤207中,向所述第一用户和第二用户推送建立问答服务群组的请求。
其中,所述问答服务群组可以是类似QQ讨论群组的界面形式,其中,第一用户和第二用户所发送的问题内容均可被对方观察到,同时也被服务器所采集,用于抽取相应个关键数据。优选的,为了提高问题意图的更新和最终答案内容提供的准确性,对于问答服务群组中涉及的第一用户和第二用户之间的@消息也进行类似问题内容的关键数据抽取。
本发明实施例通过扩展步骤206-207其实现了根据问题意图相似度进行提问用户群组建立的方法,从而利用用户之间的讨论内容更快的定位到答案内容上去。
进一步的,本发明实施例还定义了一套对话模板框架,对于不同场景(例如:不同APP应用场景)的应用,只需提供相应的配置模板即可让系统支持相关问答,从而使系统具有良好的通用性和可扩展性。
结合本发明实施例,在建立包括第一用户和第二用户的问答服务群组后,如图3所示,所述方法还包括:
在步骤208中,获取第一用户和第二用户在所述问答服务群组中的聊天记录,并根据聊天记录中的关键数据更新归属于所述问题意图的关键数据。
在步骤209中,根据所述更新各自的问题意图,向所述第一用户和/或第二用户发送问题答案。
在具体实现过程中,有智能问答系统分析出来的对应于第一用户和第二用户的问题意图是存在动态变化的,会因为关键数据的不同而更新。而在本发明实施例中,所述问题意图不仅用于寻找到最终的答案内容;也被应用于寻找到指向最终答案内容的各节点上的交互内容,所述交互内容通常被表现为向第一用户和/或第二用户发送的问答消息;还被应用于匹配相似度达到预设阈值的第三方用户,用于建立问答服务群组,利用用户之间的互动性,进一步提高获取到最终答案内容的效率。
其中,步骤209仅仅表述了最终一环的步骤,而在具体实现过程中,对于步骤208至步骤209之间,还可以进行多次的智能问答系统的与第一用户和/或第二用户之间的问题答复交流,其中,所述问题答复交流包括第一用户和/或第二用户发送的多级问题内容(之所以用多级来描述,是想表达问题内容之间的时间连续性和问题内容逐级向答案内容靠近的含义),以及智能问答系统的回复给第一用户和/或第二用户的阶段性的答案内容(在本发明实施例中也被称为交互内容),所述阶段性的答案内容包括指向最终答案内容的中间节点(例如:需要用户做选择的一些指向最终答案内容的路径节点)。
在本发明实施例中,在不同的问题意图所对应的问题个数阈值是动态的,例如:对于问题答复复杂度较高的问题意图,相应的问题个数阈值为6-10个;对于问题答复复杂度较低的问题意图,相应的问题个数阈值为2-5个。之所以设置所述问题个数阈值,是为了区分智能问答系统的自身就能解决的简单问题和智能问答系统的自身无法有效解决的复杂问题,一定程度上,问题个数阈值和第一用户所输入的问题内容次数是成正比的,而当关键数据个数超过所述问题个数阈值的时候,就表明第一用户所提出的问题内容没有很好的被智能问答系统的所解析,或者,智能问答系统所反馈的交互内容没有被用户正确的理解,此时,调用本发明实施例所提出的利用其他用户资源的能力便是最有效的解决手段之一。对于多并发的问题内容来说,建立问答服务群组不仅有助于用户之间分享自身的解决问题经验,而且有利于发展用户之间的友谊。
在本发明实施例中,所述问题答复复杂度指代问题意图所对应的答案内容中,包含的涉及用户选择的节点的数量多少;或者,问题答复复杂度指代问题意图所能够对应的答案内容数量。
结合本发明实施例还提供了一种关键数据的抽取方法,采用基于trie树的字符串匹配算法实现对输入问题的关键数据识别,如图4所示,具体包括:
在步骤301中,利用关键数据词汇表构建trie树。
在步骤302中,对输入的一个或者多个问题内容进行匹配,得到问题内容包含的关键数据。
在步骤303中,用获得的关键数据填充对应于提问用户所提出问题内容中的槽位信息。
在本发明实施例具体实现方式中,通常对于每个用户建立一个数组存储所有得到答案内容正确反馈的历史问题意图和关键数据;则每当获取请求终端发送的问题内容,并根据关键数据匹配出问题意图后;确认所述问题意图已经在数组中存在,则直接提取对应于该问题意图的问题内容反馈给相应请求终端。
为了实现上述历史问题内容和对应答案内容,以及相关的问题意图、槽位数据对于未来其他用户解决类似问题的帮助,结合本发明实施例还存在一种优选的实现方式,所述方法还包括:
在第一用户反馈问题内容得到有效解决时,服务器存储对应于本轮问题内容答复过程中所搜集的关键数据,并建立所述关键数据、问题意图和问题内容之间的映射关系。
实施例2:
请参阅图5,是本发明实施例的智能问答系统的装置的架构示意图。本实施例的智能问答系统的装置包括一个或多个处理器21以及存储器22。其中,图5中以一个处理器21为例。
处理器21和存储器22可以通过总线或者其他方式连接,图5中以通过总线连接为例。
存储器22作为一种智能问答系统的实现方法和装置非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如实施例1中的智能问答系统的实现方法。处理器21通过运行存储在存储器22中的非易失性软件程序、指令以及模块,从而执行智能问答系统的装置的各种功能应用以及数据处理。
存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器22可选包括相对于处理器21远程设置的存储器,这些远程存储器可以通过网络连接至处理器21。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本领域普通技术人员可以理解实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种智能问答系统的实现方法,其特征在于,方法包括:
获取第一用户的一个或者多个问题内容,抽取问题内容中的关键数据;
根据所述关键数据生成一个或者多个模板问题,并将所述模板问题划分为一个或者多个预设的问题意图中;
获取用户当前输入的问题内容,根据当前问题内容中携带的关键数据,确定所述当前问题内容中缺失槽位信息;
确定所述当前问题内容的问题意图;从相应问题意图中所包含的各模板问题中,确认与当前问题内容匹配度达到预设阈值的至少一个模板问题;并将所述至少一个模板问题中的关键信息填充到所述槽位信息中,得到填充版本的当前问题内容,以便服务器根据所述填充版本的当前问题内容确定答案内容;
确定对应于相应问题意图的问题个数阈值;若检测到的一时间段内第一用户反馈的问题内容的个数大于所述问题个数阈值后,还接收到第一用户对应于同一问题意图的问题内容,则根据所述问题意图所包含的关键数据,匹配出与所述第一用户相似度达到预设阈值的第二用户;
向所述第一用户和第二用户推送建立问答服务群组的请求。
2.根据权利要求1所述的智能问答系统的实现方法,其特征在于,由问题意图与模板问题构建KNN分类器,其中问题内容与模板问题均用词向量表示成n维向量;所述KNN分类器的距离度量采用余弦相似度;则所述当前问题内容经过预处理之后,进入所述KNN分类器,由所述KNN分类器进行当前问题的意图检测与识别。
3.根据权利要求1所述的智能问答系统的实现方法,其特征在于,服务器对于每个用户维护其上下文相关问题内容数据,存储自对话开始以来检测到的所有问题内容,根据所述问题内容生成问题模板和提取相关可作为槽位信息的关键数据,并为所述问题模板增设问题意图作为分组标识。
4.根据权利要求1所述的智能问答系统的实现方法,其特征在于,服务器接收到当前问题内容后,若检测到属于某一问题意图,则服务器从上下文数据中获取该问题意图中与当前问题内容相似度最高的模板问题,及其关键数据;确认当前问题内容中的槽位信息,并将所述模板问题中对应的关键数据填充到当前问题内容的相应槽位。
5.根据权利要求4所述的智能问答系统的实现方法,其特征在于,所述方法还包括:若当前问题内容的槽位已全部填充,则根据填充版本的当前问题内容生成输出答案;若未全部填充,则根据缺失槽位信息生成相关询问语句。
6.根据权利要求1所述的智能问答系统的实现方法,其特征在于,在建立包括第一用户和第二用户的问答服务群组后,所述方法还包括:
获取第一用户和第二用户在所述问答服务群组中的聊天记录,并根据聊天记录中的关键数据更新归属于所述问题意图的关键数据;
更新各自的问题意图,向所述第一用户和/或第二用户发送问题答案。
7.根据权利要求6所述的智能问答系统的实现方法,其特征在于,所述匹配出与所述第一用户相似度达到预设阈值的第二用户,具体包括:
匹配出与所述第一用户相似度达到预设阈值的,且历史上使用所述智能问答系统,并被记录有相应关键数据、问题内容、问题答案、问题意图中的一项或者多项数据的第二用户;或者,
匹配出与所述第一用户相似度达到预设阈值的,且当前正在使用所述智能问答系统的第二用户。
8.根据权利要求6所述的智能问答系统的实现方法,其特征在于,所述确定对应于相应问题意图的问题个数阈值,具体为:
不同的问题意图所对应的问题个数阈值是动态的,其中,对于问题答复复杂度较高的问题意图,相应的问题个数阈值为6-10个;对于问题答复复杂度较低的问题意图,相应的问题个数阈值为2-5个。
9.一种智能问答系统的实现终端,其特征在于,包括至少一个处理器和存储器,所述至少一个处理器和存储器之间通过数据总线连接,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令在被所述处理器执行后,用于完成权利要求1-8任一所述的智能问答系统的实现方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810137795.9A CN108446322B (zh) | 2018-02-10 | 2018-02-10 | 一种智能问答系统的实现方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810137795.9A CN108446322B (zh) | 2018-02-10 | 2018-02-10 | 一种智能问答系统的实现方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108446322A CN108446322A (zh) | 2018-08-24 |
CN108446322B true CN108446322B (zh) | 2022-03-25 |
Family
ID=63192276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810137795.9A Active CN108446322B (zh) | 2018-02-10 | 2018-02-10 | 一种智能问答系统的实现方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108446322B (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376228B (zh) * | 2018-11-30 | 2021-04-16 | 北京猎户星空科技有限公司 | 一种信息推荐方法、装置、设备及介质 |
CN109614468A (zh) * | 2018-11-30 | 2019-04-12 | 神思电子技术股份有限公司 | 一种自然语言对话系统知识数据调度方法 |
CN109857841A (zh) * | 2018-12-05 | 2019-06-07 | 厦门快商通信息技术有限公司 | 一种faq问句文本相似度计算方法及系统 |
CN109829038A (zh) * | 2018-12-11 | 2019-05-31 | 平安科技(深圳)有限公司 | 基于深度学习的问答反馈方法、装置、设备及存储介质 |
CN109753436A (zh) * | 2019-01-09 | 2019-05-14 | 中国联合网络通信集团有限公司 | 智能客服系统的测试方法、装置及存储介质 |
CN109783510A (zh) * | 2019-01-22 | 2019-05-21 | 深圳追一科技有限公司 | 客服辅助机器人、方法及系统 |
CN109933654A (zh) * | 2019-01-30 | 2019-06-25 | 神思电子技术股份有限公司 | 一种基于状态树的对话管理方法 |
CN109829036A (zh) * | 2019-02-12 | 2019-05-31 | 浙江核新同花顺网络信息股份有限公司 | 一种对话管理方法及相关装置 |
CN109933655A (zh) * | 2019-02-15 | 2019-06-25 | 深圳前海道己社文化有限公司 | 基于社交应用程序的资源智能对接方法、装置及终端设备 |
CN110032627A (zh) * | 2019-04-23 | 2019-07-19 | 上海智臻智能网络科技股份有限公司 | 售后服务信息的提供方法、装置、计算机设备和存储介质 |
CN110211001A (zh) * | 2019-05-17 | 2019-09-06 | 深圳追一科技有限公司 | 一种酒店助理客服系统、数据处理方法及相关设备 |
CN110175223A (zh) * | 2019-05-29 | 2019-08-27 | 北京搜狗科技发展有限公司 | 一种实现问题生成的方法及装置 |
CN110399473B (zh) * | 2019-06-28 | 2023-08-29 | 创新先进技术有限公司 | 为用户问题确定答案的方法和装置 |
CN110444292B (zh) * | 2019-07-29 | 2022-04-08 | 北京爱医生智慧医疗科技有限公司 | 信息问答方法及系统 |
CN110442697B (zh) * | 2019-08-06 | 2023-09-12 | 中电金信软件(上海)有限公司 | 一种人机交互方法、系统、计算机设备和存储介质 |
CN110532374B (zh) * | 2019-09-04 | 2022-05-10 | 深圳市慧择时代科技有限公司 | 保险信息的处理方法及装置 |
CN110909137A (zh) * | 2019-10-12 | 2020-03-24 | 平安科技(深圳)有限公司 | 基于人机交互的信息推送方法、装置和计算机设备 |
CN110727783B (zh) * | 2019-10-23 | 2021-03-02 | 支付宝(杭州)信息技术有限公司 | 一种基于对话系统对用户问句提出反问的方法和装置 |
CN111127040A (zh) * | 2019-12-19 | 2020-05-08 | 联想(北京)有限公司 | 数据处理的方法、智能客服系统、电子设备和介质 |
CN110825865A (zh) * | 2020-01-09 | 2020-02-21 | 浩鲸云计算科技股份有限公司 | 一种基于专有词纠正和冷启动的多轮对话智能客服系统 |
CN111353027B (zh) * | 2020-02-17 | 2023-07-28 | 深圳数联天下智能科技有限公司 | 聊天机器人中的答案反馈方法、装置、计算机设备和介质 |
CN111680141B (zh) * | 2020-05-28 | 2023-09-08 | 泰康保险集团股份有限公司 | 一对多智能问答的响应方法、装置、设备及可读存储介质 |
CN111723559B (zh) * | 2020-06-19 | 2023-06-23 | 思必驰科技股份有限公司 | 一种实时信息抽取方法及装置 |
CN112084313A (zh) * | 2020-07-30 | 2020-12-15 | 联想(北京)有限公司 | 一种信息处理方法、装置及设备 |
CN112307774A (zh) * | 2020-11-05 | 2021-02-02 | 北京有竹居网络技术有限公司 | 对话理解方法、装置、可读介质及电子设备 |
CN112948549A (zh) * | 2021-02-04 | 2021-06-11 | 北京淇瑀信息科技有限公司 | 一种基于上下文指代的对话应答方法、装置和系统 |
CN113377934B (zh) * | 2021-05-21 | 2022-07-05 | 海南师范大学 | 一种实现智能客服的系统及方法 |
CN117725189B (zh) * | 2024-02-18 | 2024-04-16 | 国家超级计算天津中心 | 专业领域的生成式问答方法及电子设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9047567B2 (en) * | 2011-07-15 | 2015-06-02 | International Business Machines Corporation | Utilizing failures in question and answer system responses to enhance the accuracy of question and answer systems |
CN108984650B (zh) * | 2014-03-26 | 2020-10-16 | 上海智臻智能网络科技股份有限公司 | 计算机可读记录介质及计算机设备 |
CN106357942A (zh) * | 2016-10-26 | 2017-01-25 | 广州佰聆数据股份有限公司 | 基于上下文对话语义识别的智能应答方法及系统 |
CN106790004B (zh) * | 2016-12-12 | 2021-02-02 | 北京易掌云峰科技有限公司 | 基于人工智能的客服辅助实时提示系统 |
-
2018
- 2018-02-10 CN CN201810137795.9A patent/CN108446322B/zh active Active
Non-Patent Citations (1)
Title |
---|
智能问答系统中问句相似度计算方法;董自涛;《武汉理工大学学报(信息与管理工程版)》;20100504;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108446322A (zh) | 2018-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108446322B (zh) | 一种智能问答系统的实现方法和装置 | |
CN110334201B (zh) | 一种意图识别方法、装置及系统 | |
US20200301954A1 (en) | Reply information obtaining method and apparatus | |
CN108664472B (zh) | 自然语言处理方法、装置及其设备 | |
CN107609056B (zh) | 一种基于图片识别的问答处理方法与设备 | |
CN107623621B (zh) | 聊天语料收集方法和装置 | |
CN104715752A (zh) | 语音识别方法、装置及系统 | |
CN108446321B (zh) | 一种基于深度学习的自动问答方法 | |
CN111159380B (zh) | 交互方法、装置、计算机设备及存储介质 | |
CN111831795B (zh) | 多轮对话处理方法、装置、电子设备及存储介质 | |
CN109766422A (zh) | 信息处理方法、装置及系统、存储介质、终端 | |
CN111178081B (zh) | 语义识别的方法、服务器、电子设备及计算机存储介质 | |
CN108306813B (zh) | 会话消息的处理方法、服务器及客户端 | |
CN104424352A (zh) | 向用户终端提供代理服务的系统和方法 | |
US11294962B2 (en) | Method for processing random interaction data, network server and intelligent dialog system | |
CN111243604A (zh) | 支持多唤醒词的说话人识别神经网络模型的训练方法、说话人识别方法及系统 | |
CN107623620B (zh) | 随机性交互数据的处理方法、网络服务器及智能对话系统 | |
CN108415983B (zh) | 一种基于交互的智能问题解决方法和装置 | |
US11240186B2 (en) | Identification of converged conversation threads | |
CN117421416B (zh) | 交互检索方法、装置和电子设备 | |
CN117708601B (zh) | 一种相似度计算模型训练方法、装置、设备及存储介质 | |
CN115203420B (zh) | 实体关系分类模型训练方法、实体关系分类方法及装置 | |
CN112765196B (zh) | 数据处理及数据识别方法、装置、电子设备及存储介质 | |
CN111553171B (zh) | 语料处理方法、装置及存储介质 | |
CN114333806A (zh) | 会话处理方法、装置、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 430000 No.1 (3), Taichung Avenue, Gaoqiao Industrial Park, Taiwan investment zone, Dongxihu District, Wuhan City, Hubei Province Patentee after: Lighthouse Technology Co.,Ltd. Country or region after: China Address before: 430000 No.1 (3), Taichung Avenue, Gaoqiao Industrial Park, Taiwan investment zone, Dongxihu District, Wuhan City, Hubei Province Patentee before: DENGTA FINANCIAL INFORMATION CO.,LTD. Country or region before: China |