CN117874210B - 自主交互问答方法、系统、设备及介质 - Google Patents
自主交互问答方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN117874210B CN117874210B CN202410277589.3A CN202410277589A CN117874210B CN 117874210 B CN117874210 B CN 117874210B CN 202410277589 A CN202410277589 A CN 202410277589A CN 117874210 B CN117874210 B CN 117874210B
- Authority
- CN
- China
- Prior art keywords
- query text
- answer
- query
- text
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 31
- 239000013598 vector Substances 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 abstract description 8
- 230000003993 interaction Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000011176 pooling Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种自主交互问答方法、系统、设备及介质,属于检索问答的技术领域。相较于传统的信息检索方法,可以实现对查询文本的自主改写,不需要当前使用检索问答系统的用户手动调整查询文本后重新输入新的查询文本;当查询文本语义复杂时,也不需要用户多次手动调整查询文本才能得到较为准确的回答结果,而是通过自动确定新的查询文本以重新生成查询文本的回答结果,直至得到正确回答。以上,在本申请的自主交互问答方法中,通过改写得到准确的查询文本,精简检索问答过程。最终,提高检索问答的问答效率。
Description
技术领域
本申请涉及检索问答的技术领域,尤其涉及一种自主交互问答方法、检索问答系统、自主交互问答设备及计算机可读存储介质。
背景技术
检索问答服务往往基于文档向量表示的向量模型对文档进行表示并基于相似度打分,再基于信息检索系统针对用户提问生成答案。参照图2,图2为常规信息检索系统示意图。当前常规的信息检索系统主要包含查询改写器(Rewriter)、文档检索器(Retriever)、重排序器(Reranker)和答案生成器(Reader)等模块。
目前,在通过检索问答系统进行检索问答时,通过向检索问答系统输入查询文本,得到检索问答系统输出的回答结果。但是,传统的信息检索系统在实现检索问答时,难以实现对查询文本的自主改写,需要当前使用检索问答系统的用户手动调整查询文本后重新输入新的查询文本;当查询文本语义复杂时,甚至需要多次调整查询文本后才能得到较为准确的回答结果。以上,在常规的检索问答方法中,由于查询文本不够准确,导致检索问答过程繁琐,效率低下。
发明内容
本申请的主要目的在于提供一种自主交互问答方法、检索问答系统、自主交互问答设备及计算机可读存储介质,旨在提高检索问答的问答效率。
为实现上述目的,本申请提供一种自主交互问答方法,所述方法包括:
将输入的至少一条查询语句,处理成查询文本;
基于所述查询文本,生成所述查询文本的回答结果;
在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果;
在所述查询文本的回答结果为错误回答或拒绝回答时,确定新的查询文本,返回执行生成查询文本的回答结果的步骤,直至在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果。
示例性的,所述生成所述查询文本的回答结果的步骤,包括:
确定所述查询文本的语义表示;
通过所述查询文本的语义表示,检索得到与所述查询文本匹配的候选文档;
以所述查询文本和与所述查询文本匹配的候选文档组成提示词,生成所述查询文本的回答结果。
示例性的,所述确定新的查询文本,包括:
若通过所述查询文本的语义表示未检索得到与所述查询文本匹配的候选文档,对所述查询文本至少进行一次自主改写,以确定所述新的查询文本。
示例性的,所述确定新的查询文本的步骤,包括:
根据至少一条查询语句、所述候选文档和任务指令,全部或部分组成提示词并输入预设大模型中,生成所述新的查询文本。
示例性的,所述生成所述查询文本的回答结果的步骤之后,包括:
若通过所述查询文本的语义表示未检索得到与所述查询文本匹配的候选文档,则确定所述查询文本的回答结果为拒绝回答。
示例性的,所述生成所述查询文本的回答结果的步骤之后,包括:
判断所述查询文本的回答结果是否存在幻觉;
若所述查询文本的回答结果不存在幻觉,则所述查询文本的回答结果为正确回答;
若所述查询文本的回答结果存在幻觉,则所述查询文本的回答结果为错误回答。
示例性的,所述判断所述查询文本的回答结果是否存在幻觉的步骤,包括:
根据所述查询文本生成至少两个回答结果;
通过集束搜索保留所述查询文本的回答结果中概率最高的预设采样数量的序列,作为待定答案;
对预设采样数量的待定答案进行编码,得到各待定答案的语义向量;
计算预设采样数量的各待定答案的语义向量的一致性;
若待定答案的语义向量的一致性大于预设阈值,则确定所述查询文本的回答结果不存在幻觉,所述查询文本的回答结果为正确回答;
若待定答案的语义向量的一致性不大于预设阈值,则确定所述查询文本的回答结果存在幻觉,所述查询文本的回答结果为错误回答。
示例性的,所述确定新的查询文本的步骤,包括:
统计对查询文本进行改写的改写次数;
若改写次数不大于预设改写次数,则将至少一条历史查询文本、与所述历史查询文本匹配的候选文档和任务指令,全部或部分组成提示词并输入预设大模型中,生成所述历史查询文本对应的新的查询文本。
示例性的,所述确定新的查询文本的步骤,包括:
统计对查询文本进行改写的改写次数;
若改写次数大于预设改写次数,则基于已回答的历史查询文本和历史查询文本的历史回答答案,生成询问问题;获取基于所述询问问题反馈并输入的至少一条回答语句,或者,获取基于所述询问问题、所述历史查询文本和所述历史回答答案反馈并输入的至少一条回答语句;根据所述回答语句重写输入的至少一条查询语句,得到至少一条新的查询语句;根据至少一条新的查询语句,提取得到新的查询文本。
本申请还提供一种检索问答系统,所述检索问答系统包括:
矩阵表示模型,用于确定查询文本的语义表示;
检索引擎,用于通过所述查询文本的语义表示,检索得到与所述查询文本匹配的候选文档;
答案生成模型,用于生成所述查询文本的回答结果;
控制器,用于判断是否输出所述查询文本的回答结果;
生成器,用于生成历史查询文本对应的新的查询文本,或者,基于已回答的历史查询文本和历史查询文本的历史回答答案生成询问问题。
本申请还提供一种自主交互问答设备,所述自主交互问答设备包括:存储器、处理器、及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的自主交互问答方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的自主交互问答方法的步骤。
本申请实施例提出的一种自主交互问答方法、检索问答系统、自主交互问答设备及计算机可读存储介质。将输入的至少一条查询语句,处理成查询文本;基于所述查询文本,生成所述查询文本的回答结果;在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果;在所述查询文本的回答结果为错误回答或拒绝回答时,确定新的查询文本,返回执行生成查询文本的回答结果的步骤,直至在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果。
在本申请中,在查询文本的回答结果为正确回答时,直接输出查询文本的回答结果;在查询文本的回答结果为错误回答或拒绝回答时,自动确定新的查询文本,重新生成查询文本的回答结果,直至查询文本的回答结果为正确回答并输出查询文本的正确回答结果。
以此,相较于传统的信息检索方法,可以实现对查询文本的自主改写,不需要当前使用检索问答系统的用户手动调整查询文本后重新输入新的查询文本;当查询文本语义复杂时,也不需要用户多次手动调整查询文本才能得到较为准确的回答结果,而是通过自动确定新的查询文本以重新生成查询文本的回答结果,直至得到正确回答。以上,在本申请的自主交互问答方法中,通过改写得到准确的查询文本,精简检索问答过程。最终,提高检索问答的问答效率。
附图说明
图1是本申请实施例方案涉及的硬件运行环境的运行设备的结构示意图;
图2为常规信息检索系统示意图;
图3为本申请实施例方案涉及的自主交互问答方法一实施例的流程示意图;
图4为本申请实施例方案涉及的自主交互问答方法一实施例的系统示意图;
图5为本申请实施例方案涉及的自主交互问答方法一实施例的应用示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,图1为本申请实施例方案涉及的硬件运行环境的运行设备结构示意图。
如图1所示,该运行设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对运行设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及计算机程序。
在图1所示的运行设备中,网络接口1004主要用于与其他设备进行数据通信;用户接口1003主要用于与用户进行数据交互;本申请运行设备中的处理器1001、存储器1005可以设置在运行设备中,所述运行设备通过处理器1001调用存储器1005中存储的计算机程序,并执行以下操作:
将输入的至少一条查询语句,处理成查询文本;
基于所述查询文本,生成所述查询文本的回答结果;
在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果;
在所述查询文本的回答结果为错误回答或拒绝回答时,确定新的查询文本,返回执行生成查询文本的回答结果的步骤,直至在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果。
在一实施例中,处理器1001可以调用存储器1005中存储的计算机程序,还执行以下操作:
所述生成所述查询文本的回答结果的步骤,包括:
确定所述查询文本的语义表示;
通过所述查询文本的语义表示,检索得到与所述查询文本匹配的候选文档;
以所述查询文本和与所述查询文本匹配的候选文档组成提示词,生成所述查询文本的回答结果。
在一实施例中,处理器1001可以调用存储器1005中存储的计算机程序,还执行以下操作:
所述确定新的查询文本,包括:
若通过所述查询文本的语义表示未检索得到与所述查询文本匹配的候选文档,对所述查询文本至少进行一次自主改写,以确定所述新的查询文本。
在一实施例中,处理器1001可以调用存储器1005中存储的计算机程序,还执行以下操作:
所述确定新的查询文本的步骤,包括:
根据至少一条查询语句、所述候选文档和任务指令,全部或部分组成提示词并输入预设大模型中,生成所述新的查询文本。
在一实施例中,处理器1001可以调用存储器1005中存储的计算机程序,还执行以下操作:
所述生成所述查询文本的回答结果的步骤之后,包括:
若通过所述查询文本的语义表示未检索得到与所述查询文本匹配的候选文档,则确定所述查询文本的回答结果为拒绝回答。
在一实施例中,处理器1001可以调用存储器1005中存储的计算机程序,还执行以下操作:
所述生成所述查询文本的回答结果的步骤之后,包括:
判断所述查询文本的回答结果是否存在幻觉;
若所述查询文本的回答结果不存在幻觉,则所述查询文本的回答结果为正确回答;
若所述查询文本的回答结果存在幻觉,则所述查询文本的回答结果为错误回答。
在一实施例中,处理器1001可以调用存储器1005中存储的计算机程序,还执行以下操作:
所述判断所述查询文本的回答结果是否存在幻觉的步骤,包括:
根据所述查询文本生成至少两个回答结果;
通过集束搜索保留所述查询文本的回答结果中概率最高的预设采样数量的序列,作为待定答案;
对预设采样数量的待定答案进行编码,得到各待定答案的语义向量;
计算预设采样数量的各待定答案的语义向量的一致性;
若待定答案的语义向量的一致性大于预设阈值,则确定所述查询文本的回答结果不存在幻觉,所述查询文本的回答结果为正确回答;
若待定答案的语义向量的一致性不大于预设阈值,则确定所述查询文本的回答结果存在幻觉,所述查询文本的回答结果为错误回答。
在一实施例中,处理器1001可以调用存储器1005中存储的计算机程序,还执行以下操作:
所述确定新的查询文本的步骤,包括:
统计对查询文本进行改写的改写次数;
若改写次数不大于预设改写次数,则将至少一条历史查询文本、与所述历史查询文本匹配的候选文档和任务指令,全部或部分组成提示词并输入预设大模型中,生成所述历史查询文本对应的新的查询文本。
在一实施例中,处理器1001可以调用存储器1005中存储的计算机程序,还执行以下操作:
所述确定新的查询文本的步骤,包括:
统计对查询文本进行改写的改写次数;
若改写次数大于预设改写次数,则基于已回答的历史查询文本和历史查询文本的历史回答答案,生成询问问题;获取基于所述询问问题反馈并输入的至少一条回答语句,或者,获取基于所述询问问题、所述历史查询文本和所述历史回答答案反馈并输入的至少一条回答语句;根据所述回答语句重写输入的至少一条查询语句,得到至少一条新的查询语句;根据至少一条新的查询语句,提取得到新的查询文本。
本申请实施例提供了一种自主交互问答方法,参照图3,在自主交互问答方法的一实施例中,所述方法包括:
步骤S10:将输入的至少一条查询语句,处理成查询文本;
本申请涉及计算机、人工智能、信息检索、智能问答(question answering)等领域,尤其涉及检索问答领域,可广泛应用于法律、金融、电子商务、企业培训等知识搜索和问答的场景。
在本实施例中,可以从键盘、语音识别转文字等各类设备获得用户的查询语句。查询语句可以是用户与检索问答系统对话的历史、各种形式的包含查询的文本、多次或单次的查询文本等。
在一实施例中,若用户输入的查询语句是首次输入,首次输入的查询语句即为查询文本;若非首次输入,例如用户第二次输入的查询语句,或者用户与检索问答系统对话中第二次输入的查询语句,则经过各种处理,将查询语句处理成查询文本,其中,处理方法不限,例如使用大模型总结生成查询文本、文本抽取模型从查询语句中抽取以生成查询文本等。
步骤S20:基于所述查询文本,生成所述查询文本的回答结果;
在根据查询文本生成查询文本的回答结果时,首先进行文本预处理,对查询文本进行词法分析、词干提取、停用词过滤等预处理操作,以便提取出关键信息。然后进行文本向量化,将查询文本转换成向量表示,常用的方法包括词袋模型(Bag of Words)和词嵌入(Word Embedding),这样可以方便计算文本之间的相似度。接着,在检索阶段根据查询文本的向量表示,在文档库中检索与之相似的文档或数据,通常使用一些检索算法(如余弦相似度匹配)来找到相似度较高的文本。最后,根据检索到的文档或数据,从中抽取出最相关的部分作为回答结果,可以是整个文本片段、句子或者关键信息。进一步的,还可以进行结果展示,将生成的回答结果呈现给用户,可以是直接展示文本、链接到相应文档或进行格式化排版展示。
示例性的,所述生成所述查询文本的回答结果的步骤,包括:
以所述查询文本和与所述查询文本匹配的候选文档组成提示词,生成所述查询文本的回答结果。
在一实施例中,所述生成所述查询文本的回答结果的步骤,包括:
确定所述查询文本的语义表示;
通过所述查询文本的语义表示,检索得到与所述查询文本匹配的候选文档;
以所述查询文本的语义表示和与所述查询文本匹配的候选文档组成提示词,生成所述查询文本的回答结果。
查询文本的语义表示通常是向量或者矩阵。向量可以是传统的独热(one-hot)向量,也可以是使用模型进行编码得到的稠密的向量,例如使用Bert进行编码得到的向量。若使用向量表示,则取其中的某个特殊token的向量表示或全句的向量进行池化,如平均池化、最大池化等。若使用矩阵表示,则对各个词的向量表示进行拼接。
在一实施例中,检索引擎通过各种匹配算法,如相似度计算等,在知识库中检索得到与查询文本最匹配的前K个文档,作为候选文档。其中,在知识库中,保存着检索问答需要检索的大量文本数据,也就是说,从知识库中保存的文本数据中检索得到与查询文本匹配的候选文档。
在一实施例中,将查询文本、候选文档按照某种格式拼接,作为提示词,基于提示词生成查询文本的回答结果(包括正确回答或者错误回答)或拒绝回答。进一步的,将查询文本、候选文档和指令(可以是用户输入的任务指令,也可以是用户预设的任务指令,用于指示模型需要做什么任务,有什么要求。)按照某种格式拼接,作为提示词,基于提示词生成查询文本的回答结果(包括正确回答或者错误回答)或拒绝回答。
示例性的,所述确定新的查询文本,包括:
若通过所述查询文本的语义表示未检索得到与所述查询文本匹配的候选文档,对所述查询文本至少进行一次自主改写,以确定所述新的查询文本。
在确定新的查询文本时,如果通过查询文本的语义表示没有检索得到与该查询文本匹配的候选文档,则对该查询文本进行至少一次自主改写,以此确定新的查询文本。
示例性的,所述确定新的查询文本的步骤,包括:
根据至少一条查询语句、所述候选文档和任务指令,全部或部分组成提示词并输入预设大模型中,生成所述新的查询文本。
在一实施例中,根据需要将查询文本、与查询文本匹配的候选文档和指令(可以是用户输入的任务指令,也可以是用户预设的任务指令,用于指示模型需要做什么任务,有什么要求)的全部或部分,组成提示词,输入一生成器,让生成器生成语义相近但表述不同的新的查询文本。
在一实施例中,由于查询文本和对应返回的候选文档很多,为了减少输入,通常会只输入最后一次的候选文档和多次的查询。也有一些方式是全部输入,但是指令不同,要求模型先总结、推理然后再生成新的查询。具体是部分还是全部使用要根据各个场景的效果而定,例如法律、金融问答等文档较长的使用第一种,候选文本较短的情况可以使用后一种。
示例性的,所述生成所述查询文本的回答结果的步骤之后,包括:
若通过所述查询文本的语义表示未检索得到与所述查询文本匹配的候选文档,则确定所述查询文本的回答结果为拒绝回答。
目前,对搜索结果文档中无答案、回答存在幻觉或错误的场景,当前的检索问答系统没有进行判断和自主重新查询的机制,需要用户自行改写查询,影响用户体验。
在本实施例中,在生成查询文本的回答结果时,如果通过查询文本的语义表示未检索得到与查询文本匹配的候选文档,则确定查询文本的回答结果为拒绝回答。进一步的,拒绝回答时输出“无答案”的提示,如“无法回答”,“没有找到答案”,“没有找到相关信息”等表述。
在一实施例中,若生成的回答结果包含敏感信息,则拒绝回答。
示例性的,所述生成所述查询文本的回答结果的步骤之后,包括:
判断所述查询文本的回答结果是否存在幻觉;
若所述查询文本的回答结果不存在幻觉,则所述查询文本的回答结果为正确回答;
若所述查询文本的回答结果存在幻觉,则所述查询文本的回答结果为错误回答。
在当前的检索问答系统中,会把检索结果直接输入大模型,之后并没有判断和控制机制,大模型可能会产生幻觉,造成严重后果。
在本实施例中,在生成查询文本的回答结果之后,还需要判断该回答结果是否为正确答案或者错误答案。如果查询文本的回答结果不存在幻觉,则查询文本的回答结果为正确回答;如果查询文本的回答结果存在幻觉,则查询文本的回答结果为错误回答。
在一实施例中,通过一模型生成查询文本的回答结果,获取该模型的特定层的激活值向量,根据该模型的特定层的激活值向量,判断该模型的输出答案(即该模型生成的查询文本的回答结果)为是否存在幻觉,若存在幻觉则回答错误,否则回答正确。
示例性的,所述判断所述查询文本的回答结果是否存在幻觉的步骤,包括:
根据所述查询文本生成至少两个回答结果;
通过集束搜索保留所述查询文本的回答结果中概率最高的预设采样数量的序列,作为待定答案;
对预设采样数量的待定答案进行编码,得到各待定答案的语义向量;
计算预设采样数量的各待定答案的语义向量的一致性;
若待定答案的语义向量的一致性大于预设阈值,则确定所述查询文本的回答结果不存在幻觉,所述查询文本的回答结果为正确回答;
若待定答案的语义向量的一致性不大于预设阈值,则确定所述查询文本的回答结果存在幻觉,所述查询文本的回答结果为错误回答。
在一实施例中,通过一模型生成查询文本的回答结果。进一步的,输入查询文本的回答结果,并得到该模型多个采样生成的答案。具体地,预先设定预设采样数量N,该模型使用Beam-search集束搜索算法,保留概率最高的N个序列作为N个不同的待定答案。该模型将N个不同的待定答案进行编码后,计算各个待定答案的语义向量的一致性,根据一致性判断是否存在幻觉。若语义一致性较高,即待定答案的语义向量的一致性大于预设阈值,如两两之间余弦相似度高于阈值或字面的重合度高于阈值,则不存在幻觉,查询文本的回答结果为正确回答;否则存在幻觉,即回答错误。
步骤S30:在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果;
在查询文本的回答结果为正确回答时,输出查询文本的回答结果。进一步的,可以将生成的回答结果按照需要的形式进行处理,然后输出,如文字输出、文字转语音等等。此时,对于输入的查询文本的检索问答流程结束。
步骤S40:在所述查询文本的回答结果为错误回答或拒绝回答时,确定新的查询文本,返回执行生成查询文本的回答结果的步骤,直至在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果。
目前的检索问答系统不能自主改写查询,当检索返回的候选文档没有正确结果时,当查询文本的回答结果为错误回答或拒绝回答时,不会自主进行多次检索。因此,在本实施例中,如果查询文本的回答结果为错误回答或拒绝回答,则需要确定新的查询文本,重新生成新的查询文本的回答结果,直至在查询文本的回答结果为正确回答时,输出查询文本的回答结果。
示例性的,所述确定新的查询文本的步骤,包括:
统计对查询文本进行改写的改写次数;
若改写次数不大于预设改写次数,则将至少一条历史查询文本、与所述历史查询文本匹配的候选文档和任务指令,全部或部分组成提示词并输入预设大模型中,生成所述历史查询文本对应的新的查询文本。
在一实施例中,若改写次数不大于预设改写次数,则获取通过所述查询文本的语义表示检索得到与所述查询文本匹配的候选文档;通过所述查询文本和与所述查询文本匹配的候选文档,重写查询文本,得到新的查询文本。
目前,当前的查询重写模块无法被自主调用,并且一次问答仅进行一次重写,重写时需要用户干预,不能智能自动多次重写查询。在本实施例中,在确定新的查询文本时,如果对查询文本进行改写的改写次数没有达到预设改写次数,则下一步需要对查询文本进行重写,得到新的查询文本。
在一实施例中,根据需要将查询文本、与查询文本匹配的候选文档和指令(可以是用户输入的任务指令,也可以是用户预设的任务指令,用于指示模型需要做什么任务,有什么要求)的全部或部分,组成提示词,输入一生成器,让生成器生成语义相近但表述不同的新的查询文本。
示例性的,所述确定新的查询文本的步骤,包括:
统计对查询文本进行改写的改写次数;
若改写次数大于预设改写次数,则基于已回答的历史查询文本和历史查询文本的历史回答答案,生成询问问题;获取基于所述询问问题反馈并输入的至少一条回答语句,或者,获取基于所述询问问题、所述历史查询文本和所述历史回答答案反馈并输入的至少一条回答语句;根据所述回答语句重写输入的至少一条查询语句,得到至少一条新的查询语句;根据至少一条新的查询语句,提取得到新的查询文本。
在一实施例中,若改写次数不大于预设改写次数,则基于已回答的历史查询文本和历史查询文本的历史回答答案,生成询问问题;展示所述询问问题,或者,展示所述询问问题、所述历史查询文本和所述历史回答答案;获取基于所述询问问题反馈的回答文本,或者,获取基于所述询问问题、所述历史查询文本和所述历史回答答案反馈的回答文本;通过所述回答文本重写查询文本,得到新的查询文本。
在本实施例中,在确定新的查询文本时,如果对查询文本进行改写的改写次数已达到预设改写次数,则下一步需要询问用户、引到用户多次输入查询语句以明确问题,并根据用户历史输入查询语句进行总结,再以此重写查询文本,得到新的查询文本。
目前,对于用户查询不明确的情况,检索问答系统并不能识别并主动与用户交互,会返回不满意的结果,而用户也只能看到不满意的结果后自行调整查询。也就是说,目前,在用户表述的查询不明确时,目前的检索问答系统无法通过对话进一步得到用户的更多信息和更明确的需求,导致用户需要多次调整查询。
在一实施例中,将到目前为止多次查询文本、及对应的回答结果和指令(可以是用户输入的任务指令,也可以是用户预设的任务指令,用于指示模型需要做什么任务,有什么要求),部分或全部组成提示词,一起输入生成器,生成器生成一个更具体的问题来询问用户、让用户回答。例如,用户的查询语句是“绿洲地产的利润率是多少”,返回的结果包含了“2023年利润率”“2022年利润率”等,需要向用户询问是哪一年的,是净利润率、毛利润率还是扣非净利润率。此时模型生成问题“请问您是想询问哪一年的利润率?是净利润率、毛利润率还是扣非利润率呢?”,并和历史查询语句、最近一轮检索结果一同输出给用户。生成的问题及历史查询会返回给用户,让用户回答,并通过用户的反馈总结出新的查询“绿洲地产2023年的扣非净利润率是多少”,开始新的一轮检索问答。
也就是说,若首次查询,查询语句即为查询文本;若与系统进行对话,则查询语句为对话历史,包含各次查询语句、生成器给用户的输出及用户本次输入,此时需使用大模型总结出新的查询语句。
此外,本申请实施例还提供一种自主交互问答系统,所述自主交互问答系统包括:
矩阵表示模型,用于确定查询文本的语义表示;
检索引擎,用于通过所述查询文本的语义表示,检索得到与所述查询文本匹配的候选文档;
答案生成模型,用于生成所述查询文本的回答结果;
控制器,用于判断是否输出所述查询文本的回答结果;
生成器,用于生成历史查询文本对应的新的查询文本,或者,基于已回答的历史查询文本和历史查询文本的历史回答答案生成询问问题。
在一实施例中,参照图4,在图4中,矩阵表示模型为确定查询文本的语义表示的模型A,答案生成模型为生成查询文本的回答结果的模型B。
在本申请一种自主交互问答方法的应用场景中,提出一种自主交互的多轮知识问答系统。在该系统中,参照图4和图5,对于用户的查询(query)语句,首先使用模型A进行编码,得到它的语义表示(向量或矩阵表示),然后通过检索引擎从数据库及索引中检索到到最匹配的前K个候选文档。将候选文档与查询语句一起输入到模型B,生成查询语句的答案(answer),或者输出“无答案”的提示。接着,控制器根据查询、答案,综合判断是否需要查询改写查询,或与用户对话。如果不需要改写查询,则直接输出回答;如果“无答案”或控制器判断答案不正确,且改写次数少于预定义的次数,则将查询query和答案输入生成器,生成器根据控制器的指令、查询和模型B生成的答案,改写得到新的查询并进行新一轮检索问答;如果“无答案”或控制器判断答案不正确,改写次数达到或超过预定义的次数,则将查询query和答案、控制器输出的指令等组成提示词,输入生成器,生成器生成与用户对话的语句,用户回答后再进行新一轮检索问答。在本框架中,检索系统包含模型A、检索引擎、及模型B,也可以使用不同的方案,最后只需输出答案及是否无答案即可。生成器、控制器可以使用大模型,也可以使用其他方式实现。
本申请提出的知识问答系统,1、可以解决因为用户查询不明确而检索结果不满意的问题,知识问答系统可以自主改写查询query并与用户交互,直到得到相关答案。而当前的技术方案只能用户自己根据查询结果进行调整。2、对于用户查询不明确的情况,约20%的查询可能存在这个问题。本申请对于多次自主改写查询依然没有正确答案的情况(次数可以自行设定,如3次),生成器生成问题询问用户,获得用户更明确的查询,因此可以缩减用户得到正确结果的时间,体验可以大幅提升。3、在生成答案之后,如果存在答案,控制器若判断正确,才输出回答。相比于生成答案后直接输出的常规手段,极大地减少了由于大模型幻觉而产生似是而非的错误回答的情况,提高了准确率。
此外,本申请实施例还提供一种自主交互问答设备,所述自主交互问答设备包括:存储器、处理器、及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的自主交互问答方法的步骤。
此外,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的自主交互问答方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。在本文中,术语“生成”是指通过大模型处理生成,
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对常规技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光 盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (8)
1.一种自主交互问答方法,其特征在于,所述方法包括:
将输入的至少一条查询语句,处理成查询文本;
基于所述查询文本,生成所述查询文本的回答结果;
在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果;
在所述查询文本的回答结果为错误回答或拒绝回答时,确定新的查询文本,返回执行生成查询文本的回答结果的步骤,直至在所述查询文本的回答结果为正确回答时,输出所述查询文本的回答结果;
所述生成所述查询文本的回答结果的步骤之后,包括:
判断所述查询文本的回答结果是否存在幻觉;
若所述查询文本的回答结果不存在幻觉,则所述查询文本的回答结果为正确回答;
若所述查询文本的回答结果存在幻觉,则所述查询文本的回答结果为错误回答;
所述判断所述查询文本的回答结果是否存在幻觉的步骤,包括:
根据所述查询文本生成至少两个回答结果;
通过集束搜索保留所述查询文本的回答结果中概率最高的预设采样数量的序列,作为待定答案;
对预设采样数量的待定答案进行编码,得到各待定答案的语义向量;
计算预设采样数量的各待定答案的语义向量的一致性;
若待定答案的语义向量的一致性大于预设阈值,则确定所述查询文本的回答结果不存在幻觉,所述查询文本的回答结果为正确回答;
若待定答案的语义向量的一致性不大于预设阈值,则确定所述查询文本的回答结果存在幻觉,所述查询文本的回答结果为错误回答;
所述确定新的查询文本的步骤,包括:
统计对查询文本进行改写的改写次数;
若改写次数不大于预设改写次数,则将至少一条历史查询文本、与所述历史查询文本匹配的候选文档和任务指令,全部或部分组成提示词并输入预设大模型中,生成所述历史查询文本对应的新的查询文本;
若改写次数大于预设改写次数,则基于已回答的历史查询文本和历史查询文本的历史回答答案,生成询问问题;获取基于所述询问问题反馈并输入的至少一条回答语句,或者,获取基于所述询问问题、所述历史查询文本和所述历史回答答案反馈并输入的至少一条回答语句;根据所述回答语句重写输入的至少一条查询语句,得到至少一条新的查询语句;根据至少一条新的查询语句,提取得到新的查询文本。
2.如权利要求1所述的自主交互问答方法,其特征在于,所述生成所述查询文本的回答结果的步骤,包括:
确定所述查询文本的语义表示;
通过所述查询文本的语义表示,检索得到与所述查询文本匹配的候选文档;
以所述查询文本和与所述查询文本匹配的候选文档组成提示词,生成所述查询文本的回答结果。
3.如权利要求2所述的自主交互问答方法,其特征在于,所述确定新的查询文本,包括:
若通过所述查询文本的语义表示未检索得到与所述查询文本匹配的候选文档,对所述查询文本至少进行一次自主改写,以确定所述新的查询文本。
4.如权利要求2所述的自主交互问答方法,其特征在于,所述确定新的查询文本的步骤,包括:
根据至少一条查询语句、所述候选文档和任务指令,全部或部分组成提示词并输入预设大模型中,生成所述新的查询文本。
5.如权利要求2所述的自主交互问答方法,其特征在于,所述生成所述查询文本的回答结果的步骤之后,包括:
若通过所述查询文本的语义表示未检索得到与所述查询文本匹配的候选文档,则确定所述查询文本的回答结果为拒绝回答。
6.一种自主交互问答系统,其特征在于,所述自主交互问答系统应用如权利要求1所述的方法,包括:
矩阵表示模型,用于确定查询文本的语义表示;
检索引擎,用于通过所述查询文本的语义表示,检索得到与所述查询文本匹配的候选文档;
答案生成模型,用于生成所述查询文本的回答结果;
控制器,用于判断是否输出所述查询文本的回答结果;
生成器,用于生成历史查询文本对应的新的查询文本,或者,基于已回答的历史查询文本和历史查询文本的历史回答答案生成询问问题。
7.一种自主交互问答设备,其特征在于,所述自主交互问答设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5任一项所述的自主交互问答方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的自主交互问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410277589.3A CN117874210B (zh) | 2024-03-12 | 2024-03-12 | 自主交互问答方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410277589.3A CN117874210B (zh) | 2024-03-12 | 2024-03-12 | 自主交互问答方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117874210A CN117874210A (zh) | 2024-04-12 |
CN117874210B true CN117874210B (zh) | 2024-06-14 |
Family
ID=90579727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410277589.3A Active CN117874210B (zh) | 2024-03-12 | 2024-03-12 | 自主交互问答方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117874210B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115455158A (zh) * | 2022-08-24 | 2022-12-09 | 阿里巴巴(中国)有限公司 | 智能聊天的信息处理方法、装置、电子设备及存储设备 |
CN116451646A (zh) * | 2023-04-25 | 2023-07-18 | 上海市卫生健康统计中心 | 一种标准草案检测方法、系统、电子设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10540440B2 (en) * | 2017-06-05 | 2020-01-21 | International Business Machines Corporation | Relation extraction using Q and A |
US11861320B1 (en) * | 2023-02-27 | 2024-01-02 | Casetext, Inc. | Text reduction and analysis interface to a text generation modeling system |
-
2024
- 2024-03-12 CN CN202410277589.3A patent/CN117874210B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115455158A (zh) * | 2022-08-24 | 2022-12-09 | 阿里巴巴(中国)有限公司 | 智能聊天的信息处理方法、装置、电子设备及存储设备 |
CN116451646A (zh) * | 2023-04-25 | 2023-07-18 | 上海市卫生健康统计中心 | 一种标准草案检测方法、系统、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117874210A (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018214675B2 (en) | Systems and methods for automatic semantic token tagging | |
EP3696810B1 (en) | Training encoder model and/or using trained encoder model to determine responsive action(s) for natural language input | |
CN112800170A (zh) | 问题的匹配方法及装置、问题的回复方法及装置 | |
CN109344242B (zh) | 一种对话问答方法、装置、设备及存储介质 | |
CN112100354A (zh) | 人机对话方法、装置、设备及存储介质 | |
CN111625621B (zh) | 一种文档检索方法、装置、电子设备及存储介质 | |
CN111259130B (zh) | 用于在对话中提供答复语句的方法及装置 | |
CN109522397B (zh) | 信息处理方法及装置 | |
US11461613B2 (en) | Method and apparatus for multi-document question answering | |
CN111858854A (zh) | 一种基于历史对话信息的问答匹配方法及相关装置 | |
CN117520523B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN110717021A (zh) | 人工智能面试中获取输入文本和相关装置 | |
CN109033082B (zh) | 语义模型的学习训练方法、装置及计算机可读存储介质 | |
CN113343692B (zh) | 搜索意图的识别方法、模型训练方法、装置、介质及设备 | |
CN117708309A (zh) | 检索问答方法、系统、设备及介质 | |
CN114153995A (zh) | 医学术语的处理方法、装置、计算机设备和存储介质 | |
CN110413750B (zh) | 根据用户问句召回标准问句的方法和装置 | |
CN117874210B (zh) | 自主交互问答方法、系统、设备及介质 | |
CN108959327B (zh) | 一种业务处理方法、装置及计算机可读存储介质 | |
CN113672804B (zh) | 推荐信息生成方法、系统、计算机设备及存储介质 | |
CN114756655A (zh) | 数据查询方法、装置、设备及存储介质 | |
CN106682221B (zh) | 问答交互的响应方法、装置及问答系统 | |
CN118051602B (zh) | 面向信息安全领域的智能问答方法及系统、介质、设备 | |
CN111680136B (zh) | 一种口语语义匹配的方法及装置 | |
CN115437620B (zh) | 一种自然语言编程方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |