CN116069917A - 一种智能回答方法、装置及存储介质 - Google Patents
一种智能回答方法、装置及存储介质 Download PDFInfo
- Publication number
- CN116069917A CN116069917A CN202310182223.3A CN202310182223A CN116069917A CN 116069917 A CN116069917 A CN 116069917A CN 202310182223 A CN202310182223 A CN 202310182223A CN 116069917 A CN116069917 A CN 116069917A
- Authority
- CN
- China
- Prior art keywords
- answer
- entity
- text
- question
- text content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000013598 vector Substances 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 17
- 238000013515 script Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 230000009191 jumping Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 9
- 230000008569 process Effects 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 10
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 101100322920 Danio rerio gpt2l gene Proteins 0.000 description 2
- 101150079757 GPT2 gene Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种智能回答方法、装置及存储介质,通过获取用户输入的文本内容,并对文本内容进行实体识别,当实体识别结果表征存在实体,将实体与内存中的问题文本进行匹配,匹配过程利用内存中的内容因此有利于提高效率;当匹配到至少一候选问题,对实体进行关系识别,确定文本内容中实体存在的第一关系,当第一关系与候选问题中存在的第二关系相同,根据第一关系从知识图谱中获取最终回答,基于实体识别以及关系识别确定最终回答,有利于提高准确度和适应性;当匹配失败,通过语言模型输出闲聊回答作为最终回答,有利于提高最终回答的趣味性、用户体验以及用户粘性。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种智能回答方法、装置及存储介质。
背景技术
目前的已有智能问答系统存在缺陷,例如:1)、仅限于固定的知识领域,只能回答固定知识领域的问题,对于用户的其他问题难以回答的,导致系统的趣味性降低,让用户觉得仅仅是问答系统只是一个没有情感的机器,影响用户体验,降低了用户的粘性;2)、问答系统的检索知识库都是基于硬盘数据库的,检索效率低;3)、对于问题文本的匹配都是基于分词关键字进行的,但是很多专业领域的词是很难通过默认分词器去分好的,并且分词后的结果,很难确定哪个词是用户询问的重点词等,准确度和适应性差。
发明内容
基于此,本发明的目的在于解决上述问题中的至少之一,提供一种智能回答方法、装置及存储介质,提高检索效率和用户体验。
本发明实施例提供了一种智能回答方法,包括:
获取用户输入的文本内容,并对所述文本内容进行实体识别;
当实体识别结果表征存在实体,将所述实体与内存中的问题文本进行匹配;
当匹配到至少一候选问题,对所述实体进行关系识别,确定所述文本内容中所述实体存在的第一关系,当所述第一关系与所述候选问题中存在的第二关系相同,根据所述第一关系从知识图谱中获取最终回答;
或者,
当匹配失败,通过语言模型输出闲聊回答作为最终回答。
进一步,所述获取用户输入的文本内容,并对所述文本内容进行实体识别,包括:
通过社交应用程序获取用户输入的文本内容并对所述文本内容进行加密;
将加密后的所述文本内容转发至智能问答服务器,触发所述智能问答服务器启动微型框架;
通过所述微型框架对加密后的所述文本内容进行解密,并对所述文本内容进行实体识别。
进一步,所述智能回答方法还包括:
当所述第一关系与所述候选问题中存在的第二关系不相同,从所述内存中获取所述候选问题的问题向量;
通过文本处理模型对所述文本内容进行处理,得到文本向量;
计算所述文本向量与所述问题向量的相似度;
确定根据相似度由大至小进行排列后,排名靠前的预设数量个相似度的问题向量对应的目标候选问题;
根据所述目标候选问题对应的回答作为最终回答。
进一步,所述根据所述目标候选问题对应的回答作为最终回答,包括:
根据所述目标候选问题生成搜索系统的链接;
响应于用户的链接点击指令,进行跳转并输出所述目标候选问题对应的回答作为最终回答。
进一步,所述知识图谱的构建步骤包括:
获取专业知识数据;
对所述专业知识数据进行知识抽取,确定若干个多元组;每一个多元组包括属性、关系以及回答;所述属性与所述实体对应;
根据若干个所述多元组通过脚本写入第一预设数据库中,构建知识图谱。
进一步,所述内存通过以下步骤得到:
在所述对所述文本内容进行实体识别之前,将第二预设数据库中的内容存入所述内存中;
其中,所述第二预设数据库通过以下步骤得到:
获取搜索系统问答页的问题文本;所述问题文本的对应的回答为所述多元组中的回答;
通过文本处理模型对所述问题文本进行处理,得到问题向量;
将所述问题文本以及所述问题向量存储至第二预设数据库。
进一步,所述智能回答方法还包括:
当所述实体识别结果表征不存在实体,通过所述语言模型输出闲聊回答作为最终回答。
本发明实施例还提供一种智能回答装置,包括:
获取模块,用于获取用户输入的文本内容,并对所述文本内容进行实体识别;
匹配模块,用于当实体识别结果表征存在实体,将所述实体与第一预设数据库中的问题文本进行匹配;
输出模块,用于当匹配到至少一候选问题,对所述实体进行关系识别,确定所述文本内容中所述实体存在的第一关系,当所述第一关系与所述候选问题中存在的第二关系相同,根据所述第一关系从知识图谱中获取最终回答;或者,当匹配失败,通过语言模型输出闲聊回答作为最终回答。
本发明实施例还提供一种智能回答装置,所述智能回答装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现所述方法。
本发明实施例还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现所述方法。
本发明的有益效果是:
通过获取用户输入的文本内容,并对所述文本内容进行实体识别,当实体识别结果表征存在实体,将所述实体与内存中的问题文本进行匹配,匹配过程利用内存中的内容因此有利于提高效率;当匹配到至少一候选问题,对所述实体进行关系识别,确定所述文本内容中所述实体存在的第一关系,当所述第一关系与所述候选问题中存在的第二关系相同,根据所述第一关系从知识图谱中获取最终回答,基于实体识别以及关系识别确定最终回答,有利于提高准确度和适应性;当匹配失败,通过语言模型输出闲聊回答作为最终回答,有利于提高最终回答的趣味性、用户体验以及用户粘性。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本发明智能回答方法的步骤流程示意图;
图2为本发明具体实施例问答页的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
如图1所示,本发明实施例提供一种智能回答方法,包括步骤S100-S300:
S100、获取用户输入的文本内容,并对文本内容进行实体识别。
本发明实施例中,步骤S100可以包括步骤S110-S130:
S110、通过社交应用程序获取用户输入的文本内容并对文本内容进行加密。
可选地,社交应用程序包括但不限于微信、企业微信、QQ、微博等等具有社交沟通功能的应用程序,本发明实施例以企业微信为例进行说明,不构成具体限定。具体地,本发明实施例按照企业微信的官方说明创建一个自建应用,获取相关参数(例如企业id,应用id等),建立应用的消息接收服务器(智能问答服务器)的配置(需要公网ip)等,旨在通过该应用实现智能问答的功能,方便用户使用。具体地,当用户通过企业微信输入文本内容时,企业微信内的该自建应用获取到用户输入的文本内容,企业微信的后台就会对此文本内容进行加密。
S120、将加密后的文本内容转发至智能问答服务器,触发智能问答服务器启动微型框架。
具体地,自建应用会将加密后的文本内容转发到已经配置好的带公网IP的智能问答服务器中,通过智能问答服务器的80端口接收,从而触发智能问答服务器启动微型框架。需要说明的是,为了充分利用智能问答服务器的资源并提高并发和体验,实现Nginx负载均衡,使用nginx制作反向代理服务器,监听80端口来自企业微信的文本内容,转发给后台并通过轮询方式向若干个微型框架转发请求以启动微型框架。可选地,微型框架包括但不限于flask应用,后台为flask后台。
S130、通过微型框架对加密后的文本内容进行解密,并对文本内容进行实体识别。
本发明实施例中,通过微型框架对加密后的文本内容进行解密,并且通过微型框架实现文本内容的实体识别、步骤S200、S300等所有数据处理功能,以输出最终回答。可选地,利用命名实体识别的模型对文本内容进行实体识别NER,基于词性判断的方式进行实体提取,例如各类名词等都认为是实体,即实体识别结果表征存在实体。可选地,命名实体识别的模型包括但不限于LAC模型,LAC模型支持预先自定义实体词,事先将专业知识相关的实体词作为自定义实体词字典进行加入。
S200、当实体识别结果表征存在实体,将实体与内存中的问题文本进行匹配。
需要说明的是,本发明实施例的智能回答方法还包括事先构建数据库以及知识图谱的步骤。
可选地,知识图谱的构建步骤包括S11-S13:
S11、获取专业知识数据。
需要说明的是,专业知识数据包括但不限于业务内容或者某些领域的知识、流程等内容,与闲聊内容作区分。例如,专业知识数据可以为产品手册/文档、操作手册/文档、流程文档等等的内容。
S12、对专业知识数据进行知识抽取,确定若干个多元组;每一个多元组包括属性、关系以及回答。
可选地,采用python脚本或者人工提取等方式进行知识抽取,例如对于结构化比较明确的使用手册,采用python脚本的方式对其提取知识,比如专有名词,产品有哪些功能,每个功能有哪些子功能,某功能的操作步骤等,构成多元组,或者进一步通过筛选确定多元组。对于结构化不明确的PPT文件,我们采取人工提取知识三元组的方式,比如会议室在哪预定,谁负责,怎么预定,源文件在哪等。需要说明的是,例如产品手册中有告警中心的产品介绍和操作步骤,此时多元组可以为属性:告警中心,关系:介绍,回答:告警中心的产品介绍;以及多元组可以为属性:告警中心,关系:操作,回答:告警中心的操作步骤。需要说明的是,多元组中的属性为名词,属性与实体对应。
S13、根据若干个多元组通过脚本写入第一预设数据库中,构建知识图谱。
本发明实施例中,对于整理好的多元组,按照设定的格式通过python脚本写入第一预设数据库中,构建知识图谱。其中,第一预设数据库包括但不限于Neo4j图数据库。
可选地,数据库的构建步骤,具体为第二预设数据库的构建步骤包括S21-S23:
S21、获取搜索系统问答页的问题文本;问题文本的对应的回答为多元组中的回答。
本发明实施例中,以搜索系统为FAQ为例进行说明,不构成具体限定。具体地,由于企业产品交付或者日常流程会有经常被问到的问题,对于这些问题,事先在FAQ知识库的wiki页建立的FAQ问答知识页(即问答页)。例如形式可以为树状的形式,如图2所示。其中,问答页中可以设置多个问题文本,可以通过爬虫的方式搜索访问问答页子节点上的FAQ的问题以获取问题文本,而问题文本的对应的回答为多元组中的回答,可以从知识图谱中得到。
需要说明的是,FAQ知识库中的内容可以通过设置定时执行脚本进行周期性录入以及更新;同时,当问题文本含有客户及项目信息等敏感信息时,可以对问题文本进行预处理,去除这些无用词和一些停用词,保证文本只保留问题原义,进行后续操作。
S22、通过文本处理模型对问题文本进行处理,得到问题向量。
可选地,文本处理处理模型包括但不限于SimCSE模型。本发明实施例中,通过SimCSE模型对问题文本进行词向量化处理,SimCSE模型具有很好的义向量化的能力,可以得到效果好的问题向量。
S23、将问题文本以及问题向量存储至第二预设数据库。
具体地,将问题文本以及问题向量存储于第二预设数据库中,第一预设数据库包括但不限于mysql。
需要说明的是,本发明实施例中,在启动微型框架flask应用时,将第一预设数据库中的内容如问题文本以及问题向量存入至内存中,
例如,在对文本内容进行实体识别之前或者对文本内容进行实体识别时,将第二预设数据库中的内容如问题文本以及问题向量存入内存中。本发明实施例中,将问题文本以及问题向量存入内存中,用于后续匹配过程,相比现有问答系统的检索知识库基于硬盘数据库的方案,有利于提高匹配效率从而提高生成最终答案的效率。
需要说明的是,本发明实施例中通过模糊匹配的方式将实体与内存中的问题文本进行匹配,以确定所有的候选问题。例如,用户输入的文本内容为“告警中心的介绍”,此时识别到实体为告警中心,搜索到的问题文本可以为:告警中心的产品介绍,告警中心的操作步骤,这两个问题文本即为候选问题。
需要说明的是,当实体识别结果表征不存在实体,此时说明当前的问题为闲聊问题,用户的目的是闲聊,此时通过语言模型输出闲聊回答作为最终回答。
可选地,语言模型包括但不限于gpt模型,例如gpt2、gpt3模型等,通过语言模型输出闲聊回答作为最终回答,从而提高趣味性。
S300、当匹配到至少一候选问题,对实体进行关系识别,确定文本内容中实体存在的第一关系,当第一关系与候选问题中存在的第二关系相同,根据第一关系从知识图谱中获取最终回答;或者,当匹配失败,通过语言模型输出闲聊回答作为最终回答。
可选地,当匹配到至少一候选问题,对实体进行关系识别,确定文本内容中实体存在的第一关系,例如例用户输入的文本内容为“告警中心的介绍”,此时识别到实体为告警中心,识别到第一关系为介绍。需要说明的是,候选问题中存在的第二关系可以事先识别得到,第二关系指的是多元组中的关系,表征属性的对应关系。具体地,当第一关系与候选问题中存在的第二关系相同,根据第一关系从知识图谱中获取最终回答。例如,第一关系与第二关系均为介绍,此时说明知识图谱中存在对应的回答,根据第一关系或者第二关系从知识图谱中找到目标多元组:属性:告警中心,关系:介绍,回答:告警中心的产品介绍,将回答即告警中心的产品介绍作为最终回答。
可选地,当匹配失败,即未匹配到候选问题时,说明当前的问题为闲聊问题,用户的目的是闲聊,此时通过语言模型输出闲聊回答作为最终回答。
同样地,语言模型包括但不限于gpt模型,例如gpt2、gpt3模型等,通过语言模型输出闲聊回答作为最终回答,从而提高趣味性。例如,以下为一个闲聊的例子:
用户输入的文本内容:“如何拒绝客户需求,客户反驳该怎么办”
语言模型输出闲聊回答作为最终回答:
“首先,要表达自己的同情心,表明自己能理解客户的需求,温柔地表明自己不能满足客户的要求;
其次,要准确说明拒绝客户的原因,不能只靠说“不”,而是要给出有理有据,说明问题的具体原因;
最后,不要义正言辞,可以找到一种替代的解决方案,即使没有取悦客户,也至少能尽量给客户最大的利益。如果客户反驳,要积极主动地与客户沟通,尽力调和双方利益,多展示理解态度,有时可以让客户可以有一些折中的解决办法”。
本发明实施例中的S300中当第一关系与候选问题中存在的第二关系不相同时,还包括步骤S310-S330:
S310、当第一关系与候选问题中存在的第二关系不相同,从内存中获取候选问题的问题向量。
S320、通过文本处理模型对文本内容进行处理,得到文本向量。
同样地,文本处理模型包括但不限于SimCSE模型,通过SimCSE模型对文本内容进行处理,得到文本向量。
S330、计算文本向量与问题向量的相似度。
可选地,相似度计算可以利用基于距离的相似度计算方法或者夹角余弦等方式进行计算,不作具体限定。
S340、确定根据相似度由大至小进行排列后,排名靠前的预设数量个相似度的问题向量对应的目标候选问题。
需要说明的是,预设数量可以根据实际需要设定,例如预设数量可以为10,此时相当于将相似度由大至小进行排列后,将前10个相似度的问题向量所对应的候选问题作为目标候选问题。
S350、根据目标候选问题对应的回答作为最终回答。
可选地,步骤S350可以包括步骤S3501-S3502:
S3501、根据目标候选问题生成搜索系统的链接。
S3502、响应于用户的链接点击指令,进行跳转并输出目标候选问题对应的回答作为最终回答。
例如,假设目标候选问题具有多个,每一个目标候选问题生成一个搜索系统对应的链接,该链接可供用户点击,当用户点击链接时,响应于用户的链接点击指令,进行跳转并输出目标候选问题对应的回答作为最终回答。例如,链接的形式可以为:
“根据您的问题,您可以查看以下结果:
1.统一告警中心saas后台报错找不到告警源插件(可点击跳转)
2.告警中心推送告警,返回404找不到页面(可点击跳转)
3.客户想删除告警中心15天之前的告警数据(可点击跳转)
4.告警中心告警丢失可点击跳转5.监控中心告警推送不到告警中心的问题(可点击跳转)
6.统一告警中心批量监控屏蔽后依然报警问题(可点击跳转)
7.告警中心监控平台告警插件没有同步到告警数据(可点击跳转)
8.统一告警中心V2后台数据查询方法(可点击跳转)
9.告警中心拉取告警不全10.告警源重名问题处理(可点击跳转)”
需要说明的是,本发明实施例的最终回答会在社交应用程序中返回给用户。
相对于现有技术,本发明实施例的智能回答方法,能够同时回答专业知识相关问题以及闲聊问题,提高最终回答的趣味性、用户体验以及用户粘性,更加人性化;相较于传统的知识检索更为集中和有序的存储了知识,且利用了NLP技术大大提高了对于相同语义问题的检索效率,与通过自建应用与社交应用程序如企业微信的集成减少了用户再去另开应用的麻烦,在企业微信上实现智能问答的功能,更加便捷;实体的问题文本匹配基于内存进行,相较于现今硬盘上的数据库检索,效率更高。另外,相较于现今全量搜索,应用了基于命名实体识别技术确定实体,将实体与内存中的问题文本进行匹配,更精准且更高效率。
本发明实施例还提供一种智能回答装置,包括:
获取模块,用于获取用户输入的文本内容,并对文本内容进行实体识别;
匹配模块,用于当实体识别结果表征存在实体,将实体与第一预设数据库中的问题文本进行匹配;
输出模块,用于当匹配到至少一候选问题,对实体进行关系识别,确定文本内容中实体存在的第一关系,当第一关系与候选问题中存在的第二关系相同,根据第一关系从知识图谱中获取最终回答;或者,当匹配失败,通过语言模型输出闲聊回答作为最终回答。
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同,不再赘述。
本发明实施例还提供了另一种智能回答装置,该智能回答装置包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现前述实施例的智能回答方法。可选地,该智能回答装置包括但不限于手机、平板电脑、电脑及车载电脑等。
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同,不再赘述。
本发明实施例还提供一种计算机可读存储介质,存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现前述实施例的智能回答方法。
本发明实施例还提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前述实施例的智能回答方法。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在的三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种智能回答方法,其特征在于,包括:
获取用户输入的文本内容,并对所述文本内容进行实体识别;
当实体识别结果表征存在实体,将所述实体与内存中的问题文本进行匹配;
当匹配到至少一候选问题,对所述实体进行关系识别,确定所述文本内容中所述实体存在的第一关系,当所述第一关系与所述候选问题中存在的第二关系相同,根据所述第一关系从知识图谱中获取最终回答;
或者,
当匹配失败,通过语言模型输出闲聊回答作为最终回答。
2.根据权利要求1所述智能回答方法,其特征在于:所述获取用户输入的文本内容,并对所述文本内容进行实体识别,包括:
通过社交应用程序获取用户输入的文本内容并对所述文本内容进行加密;
将加密后的所述文本内容转发至智能问答服务器,触发所述智能问答服务器启动微型框架;
通过所述微型框架对加密后的所述文本内容进行解密,并对所述文本内容进行实体识别。
3.根据权利要求1所述智能回答方法,其特征在于:所述智能回答方法还包括:
当所述第一关系与所述候选问题中存在的第二关系不相同,从所述内存中获取所述候选问题的问题向量;
通过文本处理模型对所述文本内容进行处理,得到文本向量;
计算所述文本向量与所述问题向量的相似度;
确定根据相似度由大至小进行排列后,排名靠前的预设数量个相似度的问题向量对应的目标候选问题;
根据所述目标候选问题对应的回答作为最终回答。
4.根据权利要求3所述智能回答方法,其特征在于:所述根据所述目标候选问题对应的回答作为最终回答,包括:
根据所述目标候选问题生成搜索系统的链接;
响应于用户的链接点击指令,进行跳转并输出所述目标候选问题对应的回答作为最终回答。
5.根据权利要求1所述智能回答方法,其特征在于:所述知识图谱的构建步骤包括:
获取专业知识数据;
对所述专业知识数据进行知识抽取,确定若干个多元组;每一个多元组包括属性、关系以及回答;所述属性与所述实体对应;
根据若干个所述多元组通过脚本写入第一预设数据库中,构建知识图谱。
6.根据权利要求5所述智能回答方法,其特征在于:所述内存通过以下步骤得到:
在所述对所述文本内容进行实体识别之前,将第二预设数据库中的内容存入所述内存中;
其中,所述第二预设数据库通过以下步骤得到:
获取搜索系统问答页的问题文本;所述问题文本的对应的回答为所述多元组中的回答;
通过文本处理模型对所述问题文本进行处理,得到问题向量;
将所述问题文本以及所述问题向量存储至第二预设数据库。
7.根据权利要求1所述智能回答方法,其特征在于:所述智能回答方法还包括:
当所述实体识别结果表征不存在实体,通过所述语言模型输出闲聊回答作为最终回答。
8.一种智能回答装置,其特征在于,包括:
获取模块,用于获取用户输入的文本内容,并对所述文本内容进行实体识别;
匹配模块,用于当实体识别结果表征存在实体,将所述实体与第一预设数据库中的问题文本进行匹配;
输出模块,用于当匹配到至少一候选问题,对所述实体进行关系识别,确定所述文本内容中所述实体存在的第一关系,当所述第一关系与所述候选问题中存在的第二关系相同,根据所述第一关系从知识图谱中获取最终回答;或者,当匹配失败,通过语言模型输出闲聊回答作为最终回答。
9.一种智能回答装置,其特征在于:所述智能回答装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-7中任一项所述方法。
10.一种计算机可读存储介质,其特征在于:所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1-7中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310182223.3A CN116069917A (zh) | 2023-03-01 | 2023-03-01 | 一种智能回答方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310182223.3A CN116069917A (zh) | 2023-03-01 | 2023-03-01 | 一种智能回答方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116069917A true CN116069917A (zh) | 2023-05-05 |
Family
ID=86182024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310182223.3A Pending CN116069917A (zh) | 2023-03-01 | 2023-03-01 | 一种智能回答方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116069917A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109885660A (zh) * | 2019-02-22 | 2019-06-14 | 上海乐言信息科技有限公司 | 一种知识图谱赋能的基于信息检索的问答系统和方法 |
CN111914099A (zh) * | 2020-07-24 | 2020-11-10 | 吉林大学珠海学院 | 一种交通优化策略的智能问答方法、系统、装置及介质 |
CN115292457A (zh) * | 2022-06-30 | 2022-11-04 | 腾讯科技(深圳)有限公司 | 知识问答方法、装置、计算机可读介质及电子设备 |
US20230039496A1 (en) * | 2020-09-27 | 2023-02-09 | Boe Technology Group Co., Ltd. | Question-and-answer processing method, electronic device and computer readable medium |
-
2023
- 2023-03-01 CN CN202310182223.3A patent/CN116069917A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109885660A (zh) * | 2019-02-22 | 2019-06-14 | 上海乐言信息科技有限公司 | 一种知识图谱赋能的基于信息检索的问答系统和方法 |
CN111914099A (zh) * | 2020-07-24 | 2020-11-10 | 吉林大学珠海学院 | 一种交通优化策略的智能问答方法、系统、装置及介质 |
US20230039496A1 (en) * | 2020-09-27 | 2023-02-09 | Boe Technology Group Co., Ltd. | Question-and-answer processing method, electronic device and computer readable medium |
CN115292457A (zh) * | 2022-06-30 | 2022-11-04 | 腾讯科技(深圳)有限公司 | 知识问答方法、装置、计算机可读介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11899681B2 (en) | Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium | |
US11670288B1 (en) | Generating predicted follow-on requests to a natural language request received by a natural language processing system | |
US10650311B2 (en) | Suggesting resources using context hashing | |
CN106874467B (zh) | 用于提供搜索结果的方法和装置 | |
US10332012B2 (en) | Knowledge driven solution inference | |
US11475053B1 (en) | Providing completion recommendations for a partial natural language request received by a natural language processing system | |
CN108073587B (zh) | 一种自动问答方法、装置及电子设备 | |
CA2865186A1 (en) | Method and system relating to sentiment analysis of electronic content | |
WO2012126259A1 (zh) | 一种具有信息发布和搜索功能的系统及信息发布方法 | |
US20200349180A1 (en) | Detecting and processing conceptual queries | |
CN111552788B (zh) | 基于实体属性关系的数据库检索方法、系统与设备 | |
US10901992B2 (en) | System and method for efficiently handling queries | |
US11568344B2 (en) | Systems and methods for automated pattern detection in service tickets | |
CN110245357B (zh) | 主实体识别方法和装置 | |
US11841852B2 (en) | Tenant specific and global pretagging for natural language queries | |
CN117312518A (zh) | 一种智能问答方法、装置、计算机设备及存储介质 | |
CN111488386A (zh) | 数据查询方法和装置 | |
Jiang et al. | A semantic-based approach to service clustering from service documents | |
CN113010664B (zh) | 一种数据处理方法、装置及计算机设备 | |
CN112615774B (zh) | 即时通讯信息处理方法、装置、即时通讯系统及电子设备 | |
CN116069917A (zh) | 一种智能回答方法、装置及存储介质 | |
CN115269862A (zh) | 一种基于知识图谱的电力问答与可视化系统 | |
CN114093447A (zh) | 数据资产推荐方法、装置、计算机设备及存储介质 | |
CN111046151B (zh) | 一种消息处理方法及装置 | |
CN112182177A (zh) | 一种用户问题处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |