CN117056480A - 知识问答方法、系统及计算机可存储介质 - Google Patents
知识问答方法、系统及计算机可存储介质 Download PDFInfo
- Publication number
- CN117056480A CN117056480A CN202310988577.7A CN202310988577A CN117056480A CN 117056480 A CN117056480 A CN 117056480A CN 202310988577 A CN202310988577 A CN 202310988577A CN 117056480 A CN117056480 A CN 117056480A
- Authority
- CN
- China
- Prior art keywords
- question
- knowledge
- answer
- questions
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 33
- 238000000605 extraction Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 10
- 238000012805 post-processing Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims 1
- 230000015654 memory Effects 0.000 description 12
- 230000002452 interceptive effect Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000005294 ferromagnetic effect Effects 0.000 description 1
- 230000005291 magnetic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种知识问答系统,该知识问答系统可以接收用户提出的待解答问题,并可以自动确定该解答问题对应答案的目标位置,并从目标位置对应的知识内容中检索获得问题的答案。本公开的知识问答系统,首先锁定答案的目标位置,然后从目标位置对应的内容中检索获得相应的答案,可以提高答案的准确性和可靠性。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种知识问答方法、系统及计算机可存储介质。
背景技术
随着大语言模型(LLM,Large Language Model)技术(如ChatGPT)的应用和技术革新,国内外越来越多的企业开展大语言模型项目的探索和研究。目前大语言模型广泛地应用于聊天机器人领域,业界大部分聊天机器人使用大语言模型技术对用户的问题进行处理,并根据处理后的问题进行搜索获得相应的答案。目前的聊天机器人回答问题的准确性还有待提高。
发明内容
基于现有的技术,本申请提供了一种知识问答方法、系统及计算机可存储介质,该知识问答系统能够提高答案的准确性和可靠性。
本公开提供了一种知识问答系统,所述系统包括:
问题获取模块,用于获取待解答问题;
答案定位模块,用于确定所述待解答问题的答案的目标位置;
答案生成模块,用于通过预先训练的问答模型,从所述目标位置对应的知识内容中检索获得所述待解答问题的答案。
本公开还提供了一种知识问答方法,应用于上述的知识问答系统,所述方法包括:
获取待解答问题;
确定所述待解答问题的答案对应的目标位置;
通过预先训练的问答模型,从所述目标位置对应的知识内容中检索获得所述待解答问题的答案。
本公开还提供了一种计算机可存储介质,其中,所述计算机可存储介质中存储的计算机程序被至少一个处理器执行时,实现如下方法步骤:
获取待解答问题;
确定所述待解答问题的答案对应的目标位置;
通过预先训练的问答模型,从所述目标位置对应的知识内容中检索获得所述待解答问题的答案。
本公开提供的知识问答方法、系统及计算机可存储介质,通过第一趟检索锁定目标位置,之后使用大语言模型进行第二趟检索,从目标位置指示的相关知识内容中检索待解答问题的答案,可以提高答案的准确性和可靠性。同时,本公开的知识问答系统使用关键词进行检索,相比于现有技术使用向量检索的方式,可以提高待解答问题的解答速度,处理效率较高。
附图说明
图1为一个实施例提供的知识问答系统的结构框图;
图2为另一个实施例提供的知识问答系统的结构框图;
图3为一个实施例中应用上述知识问答系统的聊天应用的示意图;
图4为另一实施例中应用上述知识问答系统的聊天应用的示意图;
图5为另一实施例提供的知识问答系统的结构框图;
图6为一个实施例的数据库中知识库的生成过程示意图;
图7为一个实施例中知识问答方法的流程示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的相同的字段,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本申请实施例中可能采用术语第一、第二、第三等来描述预设范围等,但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如,在不脱离本申请实施例范围的情况下,第一预设范围也可以被称为第二预设范围,类似地,第二预设范围也可以被称为第一预设范围。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
随着大语言模型(LLM,Large Language Model)技术(如ChatGPT)的应用和技术革新,国内外越来越多的企业开展大语言模型项目的探索和研究。目前大语言模型广泛地应用于聊天机器人领域,业界大部分聊天机器人使用大语言模型技术对用户的问题进行处理,并根据处理后的问题进行搜索获得相应的答案。一般地做法是从用户的问题中提取特征向量,并基于特征向量进行搜索获得相应的答案,但是基于特征向量进行搜索的做法速度较慢,且准确性有待提高。例如,当用户的问题为事实性问题时,现有的聊天机器人的回答可靠性及准确性均较低。
基于此,本公开旨在提供一种知识问答系统,其可以通过交互界面接收用户提出的问题,并可以自动确定用户提出问题对应答案的目标位置,该目标位置是可以包含该答案的知识内容,从而该知识问答系统可以从目标位置对应的知识内容中检索获得问题的答案。
如图1所示,本公开提供了一种知识问答系统100,该知识问答系统100可以包括问题获取模块110、答案定位模块120和答案生成模块130。
其中,问题获取模块110用于获取待解答问题。该待解答问题可以是用户通过交互界面输入的,该待解答问题可以是文本、语音等多种形式,此处不做具体限定。
答案定位模块120用于确定待解答问题的答案的目标位置。其中,目标位置可以用于指示与该待解答问题的关键词相关的知识内容。知识内容可以是指可能包含答案的内容,该知识内容可以是文本、语音或图片等。可选地,上述的知识内容可以存储于一知识库中。本公开的答案定位模块120可以根据用户提出的待解答问题定位为答案在相关知识内容中的目标位置。
答案生成模块130用于通过预先训练的问答模型,从目标位置对应的知识内容中检索获得待解答问题的答案。具体地,答案生成模块130可以使用预先训练好的问答模型,如预先训练好的、针对自然语言处理的大语言模型,进行推理运算,从目标位置指示的相关知识内容中检索获得待解答问题的答案。
本公开的知识问答系统,通过第一趟检索锁定目标位置,之后使用大语言模型进行第二趟检索,从目标位置指示的相关知识内容中检索待解答问题的答案,可以提高答案的准确性和可靠性。
在一个实施例中,本公开的知识问答系统可以实施为终端,也可以实施为服务器,还可以实施为终端和服务器组成的系统。可选地,上述的知识问答系统可以是运行在终端上的聊天应用,该聊天应用可以具有一用于与用户进行交互的交互界面,知识问答系统可以通过该交互界面获得用户输入的待解答问题。其中,终端包括但不限于笔记本电脑、平板电脑、台式计算机、移动电话、便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备,智能机器人,智能家电和智能车载设备等。
例如,待解答问题可以是文本,知识库中的知识内容为文本内容。如图3所示,图3示出了应用该知识问答系统的聊天应用的交互界面。用户可以通过该知识问答系统的交互界面中的信息输入框310输入待解答问题320,从而问题获取模块可以获取待解答问题。之后,答案定位模块可以自动确定待解答问题的目标位置。答案生成模块通过预先训练的问答模型和上述的目标位置获得待解答问题的答案。该待解答问题的答案可以通过交互界面可视化的呈现给用户,如图中呈现的答案330。
再如,待解答问题可以是文本,知识库中的知识内容可以为文本内容,该文本内容可以为程序接口(API,Application Programming Interface)相关内容。如图4所示,图4示出了应用该知识问答系统的聊天应用的交互界面。用户可以通过交互界面中的信息输入框410输入待解答问题420,从而问题获取模块可以获取待解答问题,该待解答问题涉及程序接口。答案定位模块可以自动确定该待解答问题的目标位置,答案生成模块通过预先训练的问答模型和上述的目标位置,获得待解答问题的答案。该待解答问题的答案可以通过交互界面可视化的呈现给用户,如图中呈现的答案430。进一步地,由于程序接口的特殊性,本公开实施例的问答模型可以是采用规则算法对初始问答模型进行训练获得的,从而使得该问答模型能够支持程序接口的推理运算,获得相应的答案。具体可参见下文的描述。
在一个实施例中,继续参见图1,答案生成模块130还用于对待解答问题的答案进行后处理,其中,后处理包括但不限于待解答问题的答案的去重、汇总中的至少一种。本公开实施例通过对待解答问题的答案进行后处理,可以进一步提高答案的准确性和可靠性。
在一个实施例中,该知识问答系统还可以包括问题提取模块。如图2所示,该知识问答系统200包括问题获取模块210、问题提取模块220、答案定位模块230和答案生成模块240。其中,问题获取模块210、答案定位模块230和答案生成模块240的功能如上述实施例所示。
问题提取模块220用于从待解答问题中提取关键词,该关键词可以用于确定待解答问题的答案的目标位置。具体地,问题提取模块220可以对该待解答问题进行解析,从待解答问题中提取关键词。可选地,问题提取模块220可以使用一问答模型来提取关键词,该问答模型可以是预先训练好的神经网络模型,例如可以是针对自然语言处理的大语言模型。问题提取模块220可以从问题获取模块获得待解答问题,并将该待解答问题输入到问答模型,问答模型通过推理运算后获得该待解答问题对应的关键词。其中,关键词可以是一个或多个。
可选地,问题提取模块220使用的问答模型与上述答案生成模块240使用的是同一问答模型,从而可以简化知识问答系统的结构。在其他实施例中,问题提取模块220和答案生成模块240可以使用不同的大语言模型,不同的大语言模型分别训练获得。
在一个实施例中,本公开的知识问答系统还支持上下文交互的功能,其可以通过用户输入的历史问题及其对应的关键词,扩充待解答问题的关键词,以提高该知识问答系统的答案的准确性及可靠性。其中,上述历史问题及其对应的关键词可以对应存储在历史数据库中。具体地,上述问题提取模块220还用于根据待解答问题查询历史相关问题,获得历史相关问题对应的关键词;根据历史相关问题对应的关键词更新待解答问题的关键词,获得更新后的关键词,以根据更新后的关键词确定待解答问题的答案对应的目标位置。
可选地,问题提取模块220可以根据该待解答问题的关键词,从历史数据库中查询该待解答问题的历史相关问题,并获得该历史相关问题对应的关键词。之后,问题提取模块220可以更新该待解答问题的关键词,将问答模型推理获得的关键词和历史相关问题对应的关键词作为更新后的关键词,以使得答案定位模块根据该更新后的关键词确定目标位置。
例如,问题提取模块220通过问答模型推理获得该待解答问题的关键词为A、B、C;且历史相关问题对应的关键词为D和E,则该更新后的关键词可以为A、B、C、D和E。其中,上述关键词D、E与关键词A、B、C之间可以具有一定的映射关系,例如两者之间可以是近义词、等同替换词等等,此处不做具体限定。这样,答案定位模块240利用该更新后的关键词确定目标位置时,准确性和可靠性更高,进而可以提高待解答问题的答案的准确性和可靠性。
可选地,上述的问题提取模块220还可以对待解答问题进行预处理,并根据预处理后的待解答问题进行解析,获得关键词。其中,预处理可以包括但不限于错别字纠错、语义歧义消除中的至少一个。可选地,上述的问题提取模块220还可以对上述更新后的关键词进行清洗,比如对重复的关键词进行去重处理,以减少检索压力,提高检索速度。
在一个实施例中,答案定位模块可以将数据库检索技术和大模型推理技术相结合,以确定待解答问题的答案的目标位置。其中,数据库检索技术是指使用上述关键词从存储有知识内容的知识库中确定答案位置的技术,大模型推理技术是指使用大模型自动推理运算获得答案位置的技术。如图5所示,上述的答案定位模块520可以包括第一分析单元521、第二分析单元522和目标位置确定单元523。其中,
第一分析单元521用于通过问答模型推理获得待解答问题的答案对应的第一位置。其中,上述的问答模型可以是预先训练好的大语言模型,第一分析单元521可以直接使用上述的问答模型推理获得该待解答问题的答案所属的第一位置。上述第一位置可以用于指示待解答问题的答案所属的知识内容。
可选地,上述问答模型与上述问题提取模块510和答案生成模块530使用的问答模型可以为同一问答模型,这样可以简化该知识问答系统的结构。如图5所示,问题提取模块510可以使用问答模型从待解答问题中提取待解答问题的关键词。答案生成模块530可以使用问答模型,根据目标位置推理模块待解答问题的答案。在其他实施例中,上述的问题提取模块510、答案定位模块520和答案生成模块530也可以使用不同的大语言模型。
第二分析单元522用于根据待解答问题的关键词,从知识库中搜索获得待解答问题的答案对应的至少一个第二位置。其中,待解答问题的关键词可以是上述更新后的关键词。第二分析单元522可以使用上述更新后的关键词搜索知识库,获得待解答问题的答案所属的第二位置。该第二位置可以用于指示待解答问题的答案所属的知识内容,其与第一位置的区别仅在于两者获得的方式不同。本公开的知识问答系统使用关键词进行检索,相比于现有技术使用向量检索的方式,可以提高待解答问题的解答速度,处理效率较高。
该第二位置可以是多个,其数量可以在预设的范围内。例如,该第二位置可以是3~5个。本公开实施例的第二分析单元通过控制第二位置的数量,可以有效的控制信噪比,提高问题解答的准确性和效率。
目标位置确定单元523用于根据第一位置和至少一个第二位置,确定目标位置。该目标位置确定单元可以将上述的第一位置分别与至少一个第二位置进行比较,确定该待解答问题的答案最相关的位置,并将该最相关的位置作为目标位置。
可选地,目标位置确定单元523具体用于分别计算第一位置与至少一个第二位置之间的余弦相似度,确定第一位置和至少一个第二位置的相关性;根据相关性确定目标位置。可选地,本公开实施例可以对上述的第一位置和第二位置进行编码,并根据编码后的位置计算余弦相似度,以确定第一位置和第二位置的相关性。
其中,余弦相似度是指用余弦函数来评价两个相似对象之间关系,其计算公式如下:
其中,A可以用于表示第一位置,B可以用于表示第二位置,cosθ可以用于表示第一位置和第二位置的相关性。
目标位置确定单元523可以根据上述公式计算出第一位置与至少一个第二位置之间的相关性,并对上述计算获得的相关性按照相关性的高低进行排序,并将与第一位置相关性最高的第二位置作为目标位置。
例如,该知识内容为包含5个章节的文本内容,每个章节包括章节目录和各个章节的知识内容。第一分析单元可以根据待解答问题推理获得第一位置为第1个章节。第二分析单元根据该待解答问题的关键词,从知识库中可以获得至少一个第二位置,如第二位置为第3章节和第5章节。之后,目标位置确定单元可以分别确定第一位置和两个第二位置的相关性,如第3章节与第1章节的相关性为cosθ1,第5章节与第1章节的相关性为cosθ2,且cosθ1的值大于cosθ2,则可以将第3章节作为目标位置。之后,答案生成模块可以根据该目标位置,从第3章节对应的知识内容中检索获得待解答问题的答案。其中,上述的相关性可以是指章节内容的相关性。
再如,该知识内容为包括n个文档的文本内容,每个文档具有标题和具体的知识内容。第一分析单元可以根据待解答问题推理获得第一位置为第m个文档。第二分析单元根据该待解答问题的关键词,从知识库中可以获得至少一个第二位置,如第二位置为第k个文档和第j个文档。之后,目标位置确定单元可以分别确定第一位置和两个第二位置的相关性,即分别确定第m个文档与第k个文档的相关性为cosθ1,第m个文档与第j个文档的相关性为cosθ2,且cosθ1的值小于cosθ2,则可以将第j个文档作为目标位置。之后,答案生成模块可以根据该目标位置,从第j个文档对应的知识内容中检索获得待解答问题的答案。其中,上述的相关性可以是指文档的文本内容的相关性。
本公开实施例的目标位置确定单元使用第一位置对多个第二位置进行二次检索,确定最相关的目标位置。其中,第一位置是通过大语言模型推理获得的,多个第二位置是从知识库中搜索获得的。相比于现有技术直接使用大语言模型检索待解答问题的答案的方式,本公开的知识问答系统的二级检索方式可以保证答案的准确性和可靠性。
在一个实施例中,如图5所示,上述的知识问答系统还可以包括数据库,该数据库进一步可以分为历史数据库和知识库(图中未示出)。其中,历史数据库用于存储用户输入的历史问题以及该历史问题对应的关键词,其中,历史问题及其对应的关键词一一对应存储,例如采用字典的方式。
知识库用于存储各种知识内容,该知识内容可以是文本、语音或图片等各种形式。为了便于检索,每个知识内容包括多个知识片段,知识片段可以包含关键词,从而可以通过待解答问题的关键词锁定相关的知识片段,并从该相关的知识片段中搜索获得待解答问题的答案。例如,知识库采用字典的方式存储多个知识片段,其中,字典的键用于表示知识片段在整个知识内容中的位置,字典的值用于表示该知识片段对应的内容。
其中,知识片段是按照预设的分割方式,从知识内容中拆解获得的。可选地,该知识片段可以是按照知识内容的长度或该知识内容对应的令牌(token)长度对知识内容进行分割获得的。本公开实施例中,用户可以根据不同的模型要求选择对应的分割方式。例如,该知识内容为文本,则可以根据文本的长度或文本对应的token长度对该文本进行分割。再如,该知识内容为语音,则可以按照语音的时长对该语言进行分割。
进一步地,在确定知识内容的知识片段之后,本公开还可以获得每个知识片段在相关知识内容中的位置,并对该位置进行编码,然后将该编码和对应知识片段进行存储。可选地,上述编码方式可是词嵌入方式。可选地,知识库以字典的形式存储上述编码和对应的知识片段。其中,知识片段的位置与知识片段具有一一映射关系。其中,知识片段的位置可以包含有特定的关键词,当上述知识片段的位置中包含待解答问题的关键词时,上述知识片段可以是待解答问题的答案所属的知识片段,即上述字典中的编码可以表示第二位置。
例如,该知识内容可以为文档,该文档可以包含5个章节的文本内容,如图6所示,该知识内容可以是包含多个章节的文档。该知识内容根据其章节被分割为5个知识片段,每个知识片段可以包含章节目录和该章节的知识内容。然后,上述的知识片段可以通过词嵌入的方式进行编码,其中,章节目录可以用于表示该章节在整个知识内容中的位置,该章节目录可以作为其字典的键,其中包含待解答问题的关键词;每个章节的内容可以作为字典的值。当答案定位模块根据待解答问题的关键词搜索知识库时,答案定位模块可以确定包含上述关键词的章节目录,并将该章节目录作为待解答问题的第二位置,以便答案生成模块可以从相应的目标位置中检索获得待解答问题的答案。
在一个实施例中,上述的知识问答系统还可以包括问答模型训练模块,问答模型训练模块用于获得样本数据集;通过初始问答模型对样本数据集进行处理,获得预训练后的问答模型;对预训练后的问题模型进行微调,获得问答模型。
其中,样本数据集可以是通过特定领域的知识内容获得的。例如,上述特定领域的知识内容可以被拆分为多个知识片段,该多个知识片段可以存储于知识库中。本公开的模型训练模块可以使用上述的样本数据集对初始问答模型进行预训练和微调训练。其中,初始问答模型可以是神经网络模型。
本领域的技术人员可知的是,神经网络模型的训练一般可以包括两个阶段:正向运算阶段、反向运算阶段。其中,
正向运算阶段:初始问答模型根据用户输入的待解答问题进行正向运算,获得该待解答问题的答案。问题模型训练模块可以评估该待解答问题的答案的准确度,并在该准确度小于预设指标时,开启反向运算。
反向运算阶段:初始问答模型可以更新其网络模型的权值。
本公开实施例中,问题模型训练模块可以将正向运算获得的答案与预设答案比较来确定其准确度。其中,各个待解答问题对应的预设答案可以是通过大语言模型或规则算法获得的。规则算法基于规则(例如预设的模板),将前提条件(已知的事实)与规则进行匹配,从而推导出结论。进一步地,当本公开的待解答问题涉及API接口函数时,则模型训练模块可以通过规则算法获得该待解答问题对应的预设答案。
本公开实施例中,模型训练模块采用样本数据集对问答模型采取两次模型训练,可以提高问答模型推理运算的精度,这样使得本公开的知识问答系统在使用该问答模型进行推理运算时的准确性,进而保证该知识问答系统获得的答案的准确性和可靠性。
本公开实施例还提供了一种知识问答方法,应用于上述的知识问答系统中,如图7所示,该方法可以包括:
S710、获取待解答问题;
S720、确定待解答问题的答案对应的目标位置;
S730、通过预先训练的问答模型,从目标位置对应的知识内容中检索获得待解答问题的答案。
在一个实施例中,上述方法还可以包括:
从所述待解答问题中提取关键词,所述关键词能够用于确定所述待解答问题的答案的目标位置。
在一个实施例中,上述方法还包括:
对所述待解答问题进行预处理,得到预处理后的待解答问题。
在一个实施例中,上述方法还包括:
对所述待解答问题的答案进行后处理,其中,所述后处理包括所述待解答问题的答案的去重、汇总中的至少一种。
在一个实施例中,从待解答问题中提取关键词,还包括:
通过所述问答模型对所述待解答问题进行分析,获得所述待解答问题的关键词。
在一个实施例中,所述方法还包括:
根据所述待解答问题查询历史相关问题,获得所述历史相关问题对应的关键词;
根据所述历史相关问题对应的关键词更新所述待解答问题的关键词,获得更新后的关键词,以根据所述更新后的关键词获得所述待解答问题的答案对应的目标位置。
在一个实施例中,根据关键词获得待解答问题的答案对应的目标位置,包括:
通过所述问答模型推理获得所述待解答问题的答案对应的第一位置;
根据所述待解答问题的关键词,从知识库中搜索获得待解答问题的答案对应的至少一个第二位置;
根据所述第一位置和所述至少一个第二位置,确定所述目标位置。
在一个实施例中,根据所述第一位置和所述至少一个第二位置,确定所述目标位置,还包括:
分别计算所述第一位置与所述至少一个第二位置之间的余弦相似度,确定所述第一位置和所述至少一个第二位置的相关性;
根据所述相关性确定所述目标位置。
在一个实施例中,所述知识内容包括多个知识片段;所述知识片段是按照预设的分割方式,从所述知识内容中拆解获得的。
所述系统还包括知识库,所述知识库用于以字典的形式存储所述知识片段在所述知识内容中的位置与所述知识片段的内容之间的映射关系,其中,所述字典的键用于表示所述知识片段在所述知识内容中的位置,所述字典的值用于表示所述知识片段的内容;
其中,所述知识片段在所述知识内容中的位置中包含所述待解答问题的关键词。
在一个实施例中,上述方法还包括:
获得样本数据集;
通过初始问答模型对所述样本数据集进行处理,获得预训练后的问答模型;
对所述预训练后的问题模型进行微调,获得所述预先训练的问答模型。
上述知识问答方法的实现流程与上述知识问答系统的工作原理基本一致,具体可参见上述实施例的描述,此处不再赘述。
本公开实施例还提供了一种计算机可存储介质,其中,计算机可存储介质中存储的计算机程序被至少一个处理器执行时,实现上述知识问答方法中的执行流程,具体地,可以实现如下方法步骤:
获取待解答问题;
确定待解答问题的答案对应的目标位置;
通过预先训练的问答模型,从目标位置对应的知识内容中检索获得待解答问题的答案。
上述知识问答方法的实现流程与上述知识问答系统的工作原理基本一致,具体可参见上述实施例的描述,此处不再赘述。
其中,存储介质可以是计算机可读存储介质,例如,铁电存储器(FRAM,Ferromagnetic Random Access Memory)、只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read Only Memory)、带电可擦可编程只读存储器(EEPROM,Electrically Erasable Programmable Read Only Memory)、闪存、磁表面存储器、光盘、或光盘只读存储器(CD-ROM,Compact Disk-Read Only Memory)等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种知识问答系统,其特征在于,所述系统包括:
问题获取模块,用于获取待解答问题;
答案定位模块,用于确定所述待解答问题的答案的目标位置;
答案生成模块,用于通过预先训练的问答模型,从所述目标位置对应的知识内容中检索获得所述待解答问题的答案。
2.根据权利要求1所述的系统,其特征在于,所述系统还包括:
问题提取模块,用于从所述待解答问题中提取关键词,所述关键词能够用于确定所述待解答问题的答案的目标位置。
3.根据权利要求2所述的系统,其特征在于,所述问题提取模块还用于:
通过所述问答模型对所述待解答问题进行分析,获得所述待解答问题的关键词。
4.根据权利要求2或3所述的系统,其特征在于,所述问题提取模块还用于:
根据所述待解答问题查询历史相关问题,获得所述历史相关问题对应的关键词;
根据所述历史相关问题对应的关键词更新所述待解答问题的关键词,获得更新后的关键词,所述更新后的关键词用于确定所述待解答问题的答案对应的目标位置。
5.根据权利要求1-4任一项所述的系统,其特征在于,所述答案定位模块包括:
第一分析单元,用于通过所述问答模型推理获得所述待解答问题的答案对应的第一位置;
第二分析单元,用于根据所述待解答问题的关键词,从知识库中搜索获得待解答问题的答案对应的至少一个第二位置;
目标位置确定单元,用于根据所述第一位置和所述至少一个第二位置,确定所述目标位置。
6.根据权利要求5所述的系统,其特征在于,所述目标位置确定单元具体用于:
分别计算所述第一位置与所述至少一个第二位置之间的余弦相似度,确定所述第一位置和所述至少一个第二位置的相关性;
根据所述相关性确定所述目标位置。
7.根据权利要求1所述的系统,其特征在于,所述知识内容包括多个知识片段;
所述系统还包括知识库,所述知识库用于以字典的形式存储所述知识片段在所述知识内容中的位置与所述知识片段的内容之间的映射关系,其中,所述字典的键用于表示所述知识片段在所述知识内容中的位置,所述字典的值用于表示所述知识片段的内容;
其中,所述知识片段在所述知识内容中的位置中包含所述待解答问题的关键词。
8.根据权利要求7所述的系统,其特征在于,所述知识片段是按照预设的分割方式,从所述知识内容中拆解获得的。
9.根据权利要求1所述的系统,其特征在于,所述系统还包括问答模型训练模块,所述问答模型训练模块用于:
获得样本数据集;
通过初始问答模型对所述样本数据集进行处理,获得预训练后的问答模型;
对所述预训练后的问题模型进行微调,获得所述预先训练的问答模型。
10.根据权利要求1所述的系统,其特征在于,所述问题提取模块还用于对所述待解答问题进行预处理,得到预处理后的待解答问题;
所述答案生成模块还用于对所述待解答问题的答案进行后处理,其中,所述后处理包括所述待解答问题的答案的去重、汇总中的至少一种。
11.一种知识问答方法,其特征在于,应用于上述权利要求1-10任一项所述的知识问答系统,所述方法包括:
获取待解答问题;
确定所述待解答问题的答案对应的目标位置;
通过预先训练的问答模型,从所述目标位置对应的知识内容中检索获得所述待解答问题的答案。
12.一种计算机可存储介质,其中,所述计算机可存储介质中存储的计算机程序被至少一个处理器执行时,实现如下方法步骤:
获取待解答问题;
确定所述待解答问题的答案对应的目标位置;
通过预先训练的问答模型,从所述目标位置对应的知识内容中检索获得所述待解答问题的答案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310988577.7A CN117056480A (zh) | 2023-08-07 | 2023-08-07 | 知识问答方法、系统及计算机可存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310988577.7A CN117056480A (zh) | 2023-08-07 | 2023-08-07 | 知识问答方法、系统及计算机可存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117056480A true CN117056480A (zh) | 2023-11-14 |
Family
ID=88660076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310988577.7A Pending CN117056480A (zh) | 2023-08-07 | 2023-08-07 | 知识问答方法、系统及计算机可存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117056480A (zh) |
-
2023
- 2023-08-07 CN CN202310988577.7A patent/CN117056480A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112035730B (zh) | 一种语义检索方法、装置及电子设备 | |
CN110096567B (zh) | 基于qa知识库推理的多轮对话回复选择方法、系统 | |
CN110502738A (zh) | 中文命名实体识别方法、装置、设备和查询系统 | |
CN111159359B (zh) | 文档检索方法、装置及计算机可读存储介质 | |
CN111078837A (zh) | 智能问答信息处理方法、电子设备及计算机可读存储介质 | |
CN113220864B (zh) | 智能问答数据处理系统 | |
CN112581327B (zh) | 基于知识图谱的法律推荐方法、装置和电子设备 | |
CN110727769B (zh) | 语料库生成方法及装置、人机交互处理方法及装置 | |
CN116662502A (zh) | 基于检索增强的金融问答文本生成方法、设备及存储介质 | |
CN117708309A (zh) | 检索问答方法、系统、设备及介质 | |
CN118245564B (zh) | 一种支持语义查重查新的特征比对库构建方法及装置 | |
CN117743390B (zh) | 针对金融信息的查询方法和系统、存储介质 | |
CN116150306A (zh) | 问答机器人的训练方法、问答方法及装置 | |
CN110728135A (zh) | 文本主题标引方法、装置、电子设备及计算机存储介质 | |
Kannadasan et al. | Personalized query auto-completion through a lightweight representation of the user context | |
Ye et al. | A sentiment based non-factoid question-answering framework | |
CN109684357B (zh) | 信息处理方法及装置、存储介质、终端 | |
US20090234836A1 (en) | Multi-term search result with unsupervised query segmentation method and apparatus | |
CN117056480A (zh) | 知识问答方法、系统及计算机可存储介质 | |
CN112199461B (zh) | 基于块索引结构的文档检索方法、装置、介质和设备 | |
CN110806861B (zh) | 一种结合用户反馈信息的api推荐方法及终端 | |
CN111177316A (zh) | 一种基于主题词过滤的智能问答方法及系统 | |
CN111159366A (zh) | 一种基于正交主题表示的问答优化方法 | |
Jiang et al. | Towards improving the performance of vector space model for Chinese frequently asked question answering | |
Lin et al. | Domain Independent Key Term Extraction from Spoken Content Based on Context and Term Location Information in the Utterances |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |