CN113064980A - 一种智能问答方法、装置、计算机设备及存储介质 - Google Patents
一种智能问答方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113064980A CN113064980A CN202110304689.7A CN202110304689A CN113064980A CN 113064980 A CN113064980 A CN 113064980A CN 202110304689 A CN202110304689 A CN 202110304689A CN 113064980 A CN113064980 A CN 113064980A
- Authority
- CN
- China
- Prior art keywords
- question
- current user
- result
- word segmentation
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims abstract description 126
- 230000011218 segmentation Effects 0.000 claims abstract description 94
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000013145 classification model Methods 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 26
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一种智能问答方法、装置、计算机设备及存储介质,该方法包括:对接收到的当前用户发出的问题语句进行分词处理,获取问题语句的分词结果,根据预设决策模型以及预设规则确定问题语句的问答场景,当操作场景为问答场景时,利用预设的分类模型以及分词结果识别问题语句的当前用户意图以及当前业务场景,将识别结果与当前用户进行关联保存,并根据识别结果确定问题语句的目标计算规则,根据目标计算规则对问题语句的分词结果进行相应计算,获取计算结果,根据计算结果生成预设格式的结果数据,以便当前用户查看。本发明通过,通过综合考虑问题语句的业务场景和用户意图,提高了回答问题的准确度,从而提升用户体验。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种智能问答方法、装置、计算机设备及存储介质。
背景技术
随着金融业务的快速发展,客服业务部门对人员的需求也越来越大,而客服业务人员每天处理的问题,无论是用户咨询的问题还是业务人员回答的话术基本上都是固定的或者类似的,这些对业务人员来说都是重复机械性的工作,并且需要提供高额的人员费用。
近年来,随着人工智能的出现,很多耗费人力的工作都能通过计算机实现,人工智能的发展不仅是科学界的热点,同样也是各个互联网公司的追求。利用人工智能技术辅助乃至替代人工工作,从公司发展角度,不仅节约了成本,同时也是信息化、智能化的进步。例如,机器人问答系统就可以很好的辅助客服业务人员进行工作,完善的问答机器人能够根据用户提出的问题快速给出准确的答案。但是,目前市场上商用客服机器人大多是基于知识库、单轮对话、缺乏上下文关联的,工作效率较低、回答问题的准确度较低,从而导致用户体验一般。
因此,亟需提出一种新的智能问答方法,以解决上述问题。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种智能问答方法、装置、计算机设备以及存储介质,以克服现有技术中的智能问答技术中存在的缺乏上下文关联、回答问题的准确度较低等问题。
为解决上述一个或多个技术问题,本发明采用的技术方案是:
第一方面,提供了一种智能问答方法,该方法包括如下步骤:
对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句中的分词结果;
根据预设决策模型以及预设规则确定所述问题语句的操作场景;
当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则;
根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
进一步的,所述根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果包括:
根据所述分词结果计算所述问题语句与预设问答库中候选句子的相似度。
进一步的,当识别结果中不存在当前业务场景但存在当前用户意图时,所述方法还包括:
查询所述当前用户是否存在历史业务场景,若存在,则判断所述历史业务场景与所述当前用户意图是否相关。
进一步的,当识别结果中不存在当前业务场景但存在当前用户意图,且所述当前用户不存在历史业务场景或所述历史业务场景与所述当前用户意图不相关时,所述根据识别结果确定所述问题语句的目标计算规则包括:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前用户意图相关的多个候选业务场景反馈给所述当前用户进行选择,并根据所述当前用户选择的候选业务场景确定所述问题语句的目标计算规则。
进一步的,当识别结果中存在当前业务场景且存在当前用户意图,或当识别结果中不存在当前业务场景但存在当前用户意图,且所述历史业务场景与所述当前用户意图相关时,所述根据识别结果确定所述问题语句的目标计算规则包括:
确定目标计算规则为计算所述问题语句的分词结果与预设问答库中候选句子的相似度。
进一步的,当识别结果中存在当前业务场景但不存在当前用户意图时,所述方法还包括:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前业务场景相关的多个候选用户意图反馈给所述当前用户进行选择,并根据所述当前用户选择的候选用户意图确定所述问题语句的目标计算规则。
进一步的,当识别结果中不存在当前业务场景且不存在当前用户意图时,所述方法还包括:
将预设的热点问题推送给所述当前用户,以供当前用户选择。
第二方面,提供了一种智能问答装置,所述装置包括:
数据处理模块,用于对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果;
第一识别模块,用于根据预设决策模型以及预设规则确定所述问题语句的操作场景;
第二识别模块,用于当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,并根据识别结果确定所述问题语句的目标计算规则;
数据计算模块,用于根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
结果输出模块,用于根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
第三方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果;
根据预设决策模型以及预设规则确定所述问题语句的操作场景;
当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则;
根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如下步骤:
对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果;
根据预设决策模型以及预设规则确定所述问题语句的操作场景;
当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则;
根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
本发明实施例提供的技术方案带来的有益效果是:
本发明实施例提供的智能问答方法、装置、计算机设备及存储介质,通过对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果,根据预设决策模型以及预设规则确定所述问题语句的操作场景,当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则,根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果,根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看,通过分别识别问题语句的业务场景和用户意图,提高了回答问题的准确度,从而提升用户体验;
本发明实施例提供的智能问答方法、装置、计算机设备及存储介质,在利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景后,通过将识别结果与所述当前用户进行关联保存,使得用户在咨询问题发出问题语句缺乏业务场景时,调用保存的识别结果作为参考,进一步提高回答问题的准确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的智能问答方法的流程图;
图2是根据一示例性实施例示出的智能问答装置的结构示意图;
图3是根据一示例性实施例示出的计算机设备的内部结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如背景技术所述,通常为了满足金融业务等的发展,降低人力成本、提高客服效率及用户满意度,需要智能客服机器人和人工客服协同工作。但是,目前市场上商用客服机器人大多是基于知识库、单轮对话、缺乏上下文关联的,回答问题的准确度较低、工作效率及客服体验一般。
为解决上述问题,本发明实施例中预先结合自然语言处理技术、机器学习技术、深度学习技术、知识图谱技术等技术构建了一种完整的具有意图识别、上下文关联、图谱检索、相似问匹配等功能的金融业务智能问答机器人系统。具体实施时,该智能问答机器人系统可以基于问答知识库和知识图谱构建,作为一种较优的示例,知识库采用ES知识库,知识库构建包括金融专业问答库、闲聊问答库、热点问题库、用户日志库、场景意图关系库。知识图谱可以根据金融专业问答库中数据构建金融问答图谱。
基于该系统可以实现本发明实施例提出的智能问答方法,该方法针对用户发出的问题语句的操作场景为问答场景时,进一步识别该问题语句的当前用户意图以及当前业务场景,一方面,结合识别到的当前用户意图以及当前业务场景确定目标计算规则对问题语句进行相应计算,然后根据计算结果生成预设格式的结果数据反馈给当前用户,从而提高回答问题的准确度,另一方面,将识别结果与当前用户进行关联保存,使得当用户在进行对轮会话时,当后续发出的问题语句缺乏业务场景等情况时,调用保存的识别结果作为参考,进一步提高回答问题的准确度。
图1是根据一示例性实施例示出的智能问答方法的流程图,参照图1所示,该方法包括如下步骤:
S1:对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果。
具体的,通常对于进入智能问答机器人系统的数据需要首先进行一些预处理,以提高后续计算的准确度。本发明实施例中,预处理操作除了包括对接收到的问题语句进行分词处理以获取问题语句中的分词结果外,还可以包括字符纯化、分词、纠错等操作,这里不做限制,用户可以根据实际需求进行设置。
以基于金融业务的智能问答机器人系统为例,可以预先构建属于金融业务领域的自定义词典,用于对当前用户发出的问题语句进行分词处理,也可以预先构建属于金融业务领域的自定义纠错词典,用于对当前用户发出的问题语句进行纠错处理。
S2:根据预设决策模型以及预设规则确定所述问题语句的操作场景,
具体的,通常来说,用户咨询的问题会分为多种操作场景。本发明实施例中,在提取出问题语句的分词结果后,将利用预设决策模型以及预设规则对该关键词进行识别,确定问题语句对应的具体操作场景,即将用户问题划分到具体操作场景来针对性解决。其中,预设规则包括但不限于预设关键词规则,如,预先为不同的操作场景设置不同的关键词,将分词结果与预设关键词进行匹配,匹配结果符合预设要求的,即将该问题语句划分为该关键词对应的操作场景.具体实施时,预设决策模型可以利用关键词规则和机器学习模型预先训练得到。这里需要说明的是,本发明实施例中,业务场景包括但不限于任性贷、任性付、零钱宝等,用户意图包括但不限于还款、注销、修改密码等。
同样以金融业务为例,本发明实施例中,可以预先将操作场景主要划分为以下几类:人工场景、闲聊场景、订单场景、自助操作、问答场景以及相似问点击场景等。其中,人工场景用于解决由用户主动提出转人工或系统根据设定的规则识别为此问题必须由人工解决的问题,关键词可以由前台业务人员配置转人工涉及的关键词及需要转人工处理的意图。闲聊场景采用构建庞大的闲聊知识库,来解决用户在咨询过程中涉及的问候、夸赞、表情等闲聊问题。订单场景解决用户在支付过程中可能涉及的问题,然后调取用户近期的订单给用户。自助操作通过提供操作链接来解决一些需要一系列操作完成的问题。问答系统在一次问答后返回的可能不是答案,而是相似问供用户选择,这些相似问是已经在知识库中存在的,当用户点击后可以直接检索返回答案,相似问点击场景解决的就是此类问题。
当预设决策模型识别出问题语句的操作场景为人工、订单、自助操作等场景时,直接进入输出模块,并输出各自标识;当预设决策模型识别出问题语句的操作场景为闲聊场景时,进入知识库匹配给出答案;当预设决策模型识别出问题语句的操作场景为问答场景时,则进入金融机器人问答场景,继续后续流程。
S3:当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则。
具体的,本发明实施例提供的方法主要为解决用户发出的问答场景下的问题而提出的,由于通常问题中基本包含两个要素:业务场景和用户意图,因而当识别出问题语句的操作场景为问答场景时,需要进一步识别该问题语句的用户意图以及具体的业务场景,然后根据识别结果确定问题语句的目标计算规则。
具体的,意图识别模块是问答机器人最核心的部分,对用户问题的意图识别直接影响问答效果,为了提高问答的准确性,本发明实施例中,利用两个独立的深度学习分类器进行意图识别,一个分类器用来识别问题的业务场景,一个分类器用来识别问题涉及的意图。具体实施时,可以利用一个混淆阈值及某些特定规则来判断分类器结果是否可信,满足设定的条件认为分类结果混淆,即分类器无法提取到正确的业务场景或用户意图,反之,则不混淆,即分类器能够提取到正确的业务场景或用户意图。
具体的,用户在咨询问题的时候,通常大多直接说出意图,而缺少场景,因此用户在多次的问答过程时,经过意图识别模块时,会将当前模型识别的场景与当前用户进行关联保存下来,作为下个问答场景的参考数据。
S4:根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果。
具体的,利用预设的分类模型以及分词结果识别问题语句的当前用户意图以及当前业务场景得到的识别结果可能会包含多种情况,本发明实施施例中,针对不同的识别结果设置不同的后续操作,以提高回答问题的准确性,具体实施方式下文会一一阐述。
S5:根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
具体的,为了提高用户体验,本发明实施例中,在得到计算结果后,可以将计算结果整理前端需要的各种形式反馈给当前用户。例如,对于第一识别模块返回的带有具体特殊标识的问题,整理成带有特殊标识的结果返回;对于第二识别模块返回的请求热点问题的,检索热点问题整理成相似问链接形式返回;对于图谱匹配模块返回的多个选项,选取概率排序前几的整理成槽位候选项返回;对于数据计算模块返回的计算结果,如果是答案,将答案整理返回,如果是多个相似问,整理成相似问链接形式返回;对于知识库匹配模块返回的如果是闲聊问题的答案,将答案整理返回,如果为数据计算模块返回的相似问,将相似问整理成相似问链接形式返回等,这里不再一一列举。
作为一种较优的实施方式,本发明实施例中,所述根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果包括:
根据所述分词结果计算所述问题语句与预设问答库中候选句子的相似度。
具体的,当前用户发出的问题语句在具有完整的业务场景和用户意图这两个要素后,会进入数据计算模块进行计算。作为一种较优的示例,本发明实施中,对分词结果的计算包括相似度计算。具体实施时,通过分词结果计算当前用户的问题语句和预设问答库(包括但不限于金融专业问答库)的问题(即候选句子)的相似度。相似度模型可以基于阿里的文本匹配模型(SETM)进行修改,以满足金融问答库中数据。相似度模型输出的是候选句子及其相似度得分。
作为一种较优的实施方式,本发明实施例中,可以预先设定两个筛选阈值,一个为标准问阈值,满足该阈值的问题(即候选句子)即判定当前用户发出的问题语句就是该问题,将该问题答案作为计算结果;一个为相似问阈值,满足该阈值的问题(即候选句子)即可以作为当前用户发出的问题语句的候选相似问题,将候选相似问题作为计算结果。也就是说,数据计算模块返回的计算结果有两种情况,一种为问题答案,一种为经过相似度排序后的多个相似问。
作为一种较优的实施方式,本发明实施例中,当识别结果中不存在当前业务场景但存在当前用户意图时,所述方法还包括:
查询所述当前用户是否存在历史业务场景,若存在,则判断所述历史业务场景与所述当前用户意图是否相关。
具体的,为提高问答的准确性,本发明实施例中,当识别出当前用户发出的问题语句缺乏业务场景时,会去查询当前用户是否存在历史业务场景,这里的历史业务场景包括但不限于在当前用户进行多次的问答过程中,第二识别模块对问题语句的当前用户意图以及当前业务场景进行识别得到的识别结果中包含的业务场景数据。若查询到当前用户存在关联的历史业务场景,则进一步判断该历史业务场景与当前用户意图是否相关。
作为一种较优的实施方式,本发明实施例中,当识别结果中不存在当前业务场景但存在当前用户意图,且所述当前用户不存在历史业务场景或所述历史业务场景与所述当前用户意图不相关时,所述根据识别结果确定所述问题语句的目标计算规则包括:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前用户意图相关的多个候选业务场景反馈给所述当前用户进行选择,并根据所述当前用户选择的候选业务场景确定所述问题语句的目标计算规则。
具体的,当识别出当前用户意图,但是识别不出当前业务场景且当前用户不存在历史业务场景时,或者当前用户存在历史业务场景但是历史业务场景与当前用户意图不相关时,则利用预设的图谱匹配模型以及分词结果检索当前用户意图涉及的多个候选业务场景,然后将多个候选业务场景反馈给当前用户进行选择,根据当前用户点击选择的候选业务场景结合前述步骤获取的当前用户意图确定关键词的目标计算规则,这里的目标计算规则包括但不限于计算关键词与预设问答库中候选句子的相似度。
具体实施时,以金融业务为例,可以利用金融专业问答库中的问题构建金融问答知识图谱,以金融问题的中场景和意图作为图谱的节点。知识图谱主要用来在识别出当前用户发出的问题语句的业务场景或者用户意图不完整的时候,利用知识图谱根据识别出的业务场景或者用户意图进行检索,提供可能性较高的多个候选业务场景或者用户意图返回给当前用户进行选择。
作为一种较优的示例,本发明实施例中,还可以将候选业务场景或用户意图作为计算结果输入到结果输出模块,然后整理成预设格式的结果数据反馈给当前用户进行选择。
作为一种较优的实施方式,本发明实施例中,当识别结果中存在当前业务场景且存在当前用户意图,或当识别结果中不存在当前业务场景但存在当前用户意图,且所述历史业务场景与所述当前用户意图相关时,所述根据识别结果确定所述问题语句的目标计算规则包括:
确定目标计算规则为计算所述问题语句的分词结果与预设问答库中候选句子的相似度。
具体的,当识别出当前用户意图且识别出当前业务场景时,或者当识别出当前用户意图,但是识别不出当前业务场景但是当前用户存在历史业务场景且历史业务场景与当前用户意图相关时,此时,则可以直接确定目标计算规则为计算问题语句的分词结果与预设问答库中候选句子的相似度。
作为一种较优的实施方式,本发明实施例中,当识别结果中存在当前业务场景但不存在当前用户意图时,所述方法还包括:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前业务场景相关的多个候选用户意图反馈给所述当前用户进行选择,并根据所述当前用户选择的候选用户意图确定所述问题语句的目标计算规则。
具体的,当识别出当前业务场景但识别不出当前用户意图时,此时利用预设的图谱匹配模型以及分词结果检索当前业务场景涉及的多个候选用户意图,然后将多个候选用户意图反馈给当前用户进行选择,并根据当前用户点击选择的候选用户意图结合上述当前业务场景确定关键词的目标计算规则,这里的目标计算规则包括但不限于计算分词结果与预设问答库中候选句子的相似度,即计算问题语句与预设问答库中候选句子的相似度。
作为一种较优的实施方式,本发明实施例中,当识别结果中不存在当前业务场景且不存在当前用户意图时,所述方法还包括:
将预设的热点问题推送给所述当前用户,以供当前用户选择。
具体的,当问题语句涉及的当前业务场景与当前用户意图均识别不出时,此时无法判断当前用户的具体想要问的问题,此时可以将预设的热点问题推送给当前用户,以供当前用户选择。这里需要说明的是,本发明实施例中预设的热点问题会预先标记其业务场景与用户意图,若是当前用户选择了某一热点问题,则直接给当前用户反馈该热点问题的答案。
作为一种较优的实施方式,本发明实施例中,还预先构建了知识库。当识别出问题语句的操作场景为闲聊场景时,通过知识库匹配直接检索出答案,将答案输入到结果输出模块。或者具有完整业务场景及用户意图的问题语句在经过数据计算模块计算之后,可能存在未找到一条满足最低相似问阈值的情况。这种情况可能是因为业务人员更新了金融问答库,或者此问题语句相似度模型的确无法识别。为了解决此类问题,本发明实施例中,在数据计算模块之后再利用ES检索和基于词移距离(WMD)的算法进行分析。先利用ES自带的排序检索功能检索金融专业问答库返回50条数据,利用WMD算法计算用户问题和返回的数据之间的相似度,并排序,通过预先设定的一个阈值,满足此阈值的问题即可作为候选相似问,进入到结果输出模块。
图2是根据一示例性实施例示出的智能问答装置的结构示意图,参照图2所示,该装置包括:
数据处理模块,用于对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果;
第一识别模块,用于根据预设决策模型以及预设规则确定所述问题语句的操作场景;
第二识别模块,用于当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,并根据识别结果确定所述问题语句的目标计算规则;
数据计算模块,用于根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
结果输出模块,用于根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
作为一种较优的实施方式,本发明实施例中,所述数据计算模块具体用于:
根据所述分词结果计算所述问题语句与预设问答库中候选句子的相似度。
作为一种较优的实施方式,本发明实施例中,所述第二识别模块还用于:
查询所述当前用户是否存在历史业务场景,若存在,则判断所述历史业务场景与所述当前用户意图是否相关。
作为一种较优的实施方式,本发明实施例中,所述装置还包括:
图谱匹配模块,用于利用预设的图谱匹配模型以及所述分词结果检索出与所述当前用户意图相关的多个候选业务场景反馈给所述当前用户进行选择;
所述第二识别模块具体用于根据所述当前用户选择的候选业务场景确定所述问题语句的目标计算规则。
作为一种较优的实施方式,本发明实施例中,所述第二识别模块具体用于:
确定目标计算规则为计算所述问题语句的分词结果与预设问答库中候选句子的相似度。
作为一种较优的实施方式,本发明实施例中,所述图谱匹配模块还用于:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前业务场景相关的多个候选用户意图反馈给所述当前用户进行选择;
所述第二识别模块具体用于根据所述当前用户选择的候选用户意图确定所述问题语句的目标计算规则。
作为一种较优的实施方式,本发明实施例中,所述结果输出模块还用于:
将预设的热点问题推送给所述当前用户,以供当前用户选择。
图3是根据一示例性实施例示出的计算机设备的内部结构示意图,参照图3所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种执行计划的优化方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
作为一种较优的实施方式,本发明实施例中,计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果;
根据预设决策模型以及预设规则确定所述问题语句的操作场景;
当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则;
根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
根据所述分词结果计算所述问题语句与预设问答库中候选句子的相似度。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
查询所述当前用户是否存在历史业务场景,若存在,则判断所述历史业务场景与所述当前用户意图是否相关。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前用户意图相关的多个候选业务场景反馈给所述当前用户进行选择,并根据所述当前用户选择的候选业务场景确定所述问题语句的目标计算规则。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
确定目标计算规则为计算所述问题语句的分词结果与预设问答库中候选句子的相似度。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前业务场景相关的多个候选用户意图反馈给所述当前用户进行选择,并根据所述当前用户选择的候选用户意图确定所述问题语句的目标计算规则。
作为一种较优的实施方式,本发明实施例中,处理器执行计算机程序时还实现以下步骤:
将预设的热点问题推送给所述当前用户,以供当前用户选择。
本发明实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如下步骤:
对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果;
根据预设决策模型以及预设规则确定所述问题语句的操作场景;
当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则;
根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
作为一种较优的实施方式,本发明实施例中,所述计算机程序被处理器执行时,还实现如下步骤:
根据所述分词结果计算所述问题语句与预设问答库中候选句子的相似度。
作为一种较优的实施方式,本发明实施例中,所述计算机程序被处理器执行时,还实现如下步骤:
查询所述当前用户是否存在历史业务场景,若存在,则判断所述历史业务场景与所述当前用户意图是否相关。
作为一种较优的实施方式,本发明实施例中,所述计算机程序被处理器执行时,还实现如下步骤:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前用户意图相关的多个候选业务场景反馈给所述当前用户进行选择,并根据所述当前用户选择的候选业务场景确定所述问题语句的目标计算规则。
作为一种较优的实施方式,本发明实施例中,所述计算机程序被处理器执行时,还实现如下步骤:
确定目标计算规则为计算所述问题语句的分词结果与预设问答库中候选句子的相似度。
作为一种较优的实施方式,本发明实施例中,所述计算机程序被处理器执行时,还实现如下步骤:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前业务场景相关的多个候选用户意图反馈给所述当前用户进行选择,并根据所述当前用户选择的候选用户意图确定所述问题语句的目标计算规则。
作为一种较优的实施方式,本发明实施例中,所述计算机程序被处理器执行时,还实现如下步骤:
将预设的热点问题推送给所述当前用户,以供当前用户选择。
综上所述,本发明实施例提供的技术方案带来的有益效果是:
本发明实施例提供的智能问答方法、装置、计算机设备及存储介质,通过对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果,根据预设决策模型以及预设规则确定所述问题语句的操作场景,当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则,根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果,根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看,通过综合考虑问题语句的业务场景和用户意图,提高了回答问题的准确度,从而提升用户体验;
本发明实施例提供的智能问答方法、装置、计算机设备及存储介质,在利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景后,通过将识别结果与所述当前用户进行关联保存,使得用户在咨询问题发出问题语句缺乏业务场景时,调用保存的识别结果作为参考,进一步提高回答问题的准确度。
需要说明的是:上述实施例提供的智能问答装置在触发问答业务时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的智能问答装置与智能问答方法实施例属于同一构思,即该装置是基于该智能问答方法的,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种智能问答方法,其特征在于,所述方法包括如下步骤:
对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果;
根据预设决策模型以及预设规则确定所述问题语句的操作场景;
当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,将识别结果与所述当前用户进行关联保存,并根据所述识别结果确定所述问题语句的目标计算规则;
根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
2.根据权利要求1所述的智能问答方法,其特征在于,所述根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果包括:
根据所述分词结果计算所述问题语句与预设问答库中候选句子的相似度。
3.根据权利要求1或2所述的智能问答方法,其特征在于,当识别结果中不存在当前业务场景但存在当前用户意图时,所述方法还包括:
查询所述当前用户是否存在历史业务场景,若存在,则判断所述历史业务场景与所述当前用户意图是否相关。
4.根据权利要求3所述的智能问答方法,其特征在于,当识别结果中不存在当前业务场景但存在当前用户意图,且所述当前用户不存在历史业务场景或所述历史业务场景与所述当前用户意图不相关时,所述根据识别结果确定所述问题语句的目标计算规则包括:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前用户意图相关的多个候选业务场景反馈给所述当前用户进行选择,并根据所述当前用户选择的候选业务场景确定所述问题语句的目标计算规则。
5.根据权利要求3所述的智能问答方法,其特征在于,当识别结果中存在当前业务场景且存在当前用户意图,或当识别结果中不存在当前业务场景但存在当前用户意图,且所述历史业务场景与所述当前用户意图相关时,所述根据识别结果确定所述问题语句的目标计算规则包括:
确定目标计算规则为计算所述问题语句的分词结果与预设问答库中候选句子的相似度。
6.根据权利要求1或2所述的智能问答方法,其特征在于,当识别结果中存在当前业务场景但不存在当前用户意图时,所述方法还包括:
利用预设的图谱匹配模型以及所述分词结果检索出与所述当前业务场景相关的多个候选用户意图反馈给所述当前用户进行选择,并根据所述当前用户选择的候选用户意图确定所述问题语句的目标计算规则。
7.根据权利要求1或2所述的智能问答方法,其特征在于,当识别结果中不存在当前业务场景且不存在当前用户意图时,所述方法还包括:
将预设的热点问题推送给所述当前用户,以供当前用户选择。
8.一种智能问答装置,其特征在于,所述装置包括:
数据处理模块,用于对接收到的当前用户发出的问题语句进行分词处理,获取所述问题语句的分词结果;
第一识别模块,用于根据预设决策模型以及预设规则确定所述问题语句的操作场景;
第二识别模块,用于当所述操作场景为问答场景时,利用预设的分类模型以及所述分词结果识别所述问题语句的当前用户意图以及当前业务场景,并根据识别结果确定所述问题语句的目标计算规则;
数据计算模块,用于根据所述目标计算规则对所述问题语句的分词结果进行相应计算,获取计算结果;
结果输出模块,用于根据所述计算结果生成预设格式的结果数据,以便所述当前用户查看。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110304689.7A CN113064980A (zh) | 2021-03-22 | 2021-03-22 | 一种智能问答方法、装置、计算机设备及存储介质 |
CA3153056A CA3153056A1 (en) | 2021-03-22 | 2022-03-22 | Intelligently questioning and answering method, device, computer, equipment and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110304689.7A CN113064980A (zh) | 2021-03-22 | 2021-03-22 | 一种智能问答方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113064980A true CN113064980A (zh) | 2021-07-02 |
Family
ID=76562820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110304689.7A Pending CN113064980A (zh) | 2021-03-22 | 2021-03-22 | 一种智能问答方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113064980A (zh) |
CA (1) | CA3153056A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705186A (zh) * | 2021-07-22 | 2021-11-26 | 上海原圈网络科技有限公司 | 一种留言语义分析下的自动回复方法和装置 |
CN113779210A (zh) * | 2021-07-30 | 2021-12-10 | 深圳市思为软件技术有限公司 | 信息介绍方法及相关装置和计算机可读存储介质 |
CN116226356A (zh) * | 2023-05-08 | 2023-06-06 | 深圳市拓保软件有限公司 | 一种基于nlp的智能客服交互方法及系统 |
CN117057430A (zh) * | 2023-10-08 | 2023-11-14 | 清华大学 | 基于规则累积的模型推理方法、装置及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110162611A (zh) * | 2019-04-23 | 2019-08-23 | 苏宁易购集团股份有限公司 | 一种智能客服应答方法及系统 |
CN112328808A (zh) * | 2020-11-03 | 2021-02-05 | 四川长虹电器股份有限公司 | 基于知识图谱的问答方法、装置、电子设备及存储介质 |
CN112380853A (zh) * | 2020-11-16 | 2021-02-19 | 中国平安人寿保险股份有限公司 | 业务场景交互方法、装置、终端设备及存储介质 |
-
2021
- 2021-03-22 CN CN202110304689.7A patent/CN113064980A/zh active Pending
-
2022
- 2022-03-22 CA CA3153056A patent/CA3153056A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110162611A (zh) * | 2019-04-23 | 2019-08-23 | 苏宁易购集团股份有限公司 | 一种智能客服应答方法及系统 |
CN112328808A (zh) * | 2020-11-03 | 2021-02-05 | 四川长虹电器股份有限公司 | 基于知识图谱的问答方法、装置、电子设备及存储介质 |
CN112380853A (zh) * | 2020-11-16 | 2021-02-19 | 中国平安人寿保险股份有限公司 | 业务场景交互方法、装置、终端设备及存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705186A (zh) * | 2021-07-22 | 2021-11-26 | 上海原圈网络科技有限公司 | 一种留言语义分析下的自动回复方法和装置 |
CN113705186B (zh) * | 2021-07-22 | 2023-12-22 | 上海原圈网络科技有限公司 | 一种留言语义分析下的自动回复方法和装置 |
CN113779210A (zh) * | 2021-07-30 | 2021-12-10 | 深圳市思为软件技术有限公司 | 信息介绍方法及相关装置和计算机可读存储介质 |
CN116226356A (zh) * | 2023-05-08 | 2023-06-06 | 深圳市拓保软件有限公司 | 一种基于nlp的智能客服交互方法及系统 |
CN116226356B (zh) * | 2023-05-08 | 2023-07-04 | 深圳市拓保软件有限公司 | 一种基于nlp的智能客服交互方法及系统 |
CN117057430A (zh) * | 2023-10-08 | 2023-11-14 | 清华大学 | 基于规则累积的模型推理方法、装置及电子设备 |
CN117057430B (zh) * | 2023-10-08 | 2024-01-09 | 清华大学 | 基于规则累积的模型推理方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CA3153056A1 (en) | 2022-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110162611B (zh) | 一种智能客服应答方法及系统 | |
CN109241251B (zh) | 一种会话交互方法 | |
CN111222305B (zh) | 一种信息结构化方法和装置 | |
CN109685056B (zh) | 获取文档信息的方法及装置 | |
CN113064980A (zh) | 一种智能问答方法、装置、计算机设备及存储介质 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN110162780B (zh) | 用户意图的识别方法和装置 | |
CN112069298A (zh) | 基于语义网和意图识别的人机交互方法、设备及介质 | |
CN109299245B (zh) | 知识点召回的方法和装置 | |
CN111291172B (zh) | 用于处理文本的方法和装置 | |
CN112100354A (zh) | 人机对话方法、装置、设备及存储介质 | |
CN115470338B (zh) | 一种基于多路召回的多场景智能问答方法和系统 | |
CN112765974B (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
CN111400340B (zh) | 一种自然语言处理方法、装置、计算机设备和存储介质 | |
CN110890088A (zh) | 语音信息反馈方法、装置、计算机设备和存储介质 | |
CN110399473B (zh) | 为用户问题确定答案的方法和装置 | |
CN110209790A (zh) | 问答匹配方法和装置 | |
CN113821605A (zh) | 一种事件抽取方法 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN112989829B (zh) | 一种命名实体识别方法、装置、设备及存储介质 | |
CN114139543A (zh) | 实体链接语料标注方法和装置 | |
CN111782792A (zh) | 用于信息处理的方法和装置 | |
CN116304046A (zh) | 对话数据的处理方法、装置、存储介质及电子设备 | |
CN111104422A (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN116150353A (zh) | 意图特征提取模型训练方法、意图识别方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210702 |