CN117972038A - 一种智能问答方法、装置及计算机可读介质 - Google Patents
一种智能问答方法、装置及计算机可读介质 Download PDFInfo
- Publication number
- CN117972038A CN117972038A CN202311822994.0A CN202311822994A CN117972038A CN 117972038 A CN117972038 A CN 117972038A CN 202311822994 A CN202311822994 A CN 202311822994A CN 117972038 A CN117972038 A CN 117972038A
- Authority
- CN
- China
- Prior art keywords
- answer
- vectorized
- question
- query
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000005457 optimization Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims description 33
- 239000012634 fragment Substances 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 abstract description 4
- 238000012512 characterization method Methods 0.000 abstract 1
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种智能问答方法、装置及计算机可读介质,该方法应用于服务端,包括:首先,对接收的查询问题进行向量化处理,生成向量化问题;其次,从知识数据库中查询与向量化问题对应的向量化答案,得到第一查询结果;之后,若第一查询结果表征向量化答案存在,则基于向量化答案,利用大语言模型进行优化处理,生成与查询问题对应的问答结果;若第一查询结果表征向量化答案不存在,则基于查询问题,利用大语言模型进行答案预测,生成与查询问题对应的问答结果。由此,本实施例将服务端本地知识数据库和大语言模型相结合,能够快速应对特定业务场景中的各种问答,从而提高了客服系统的应答效率和应答质量,进而提高了用户的体验性。
Description
技术领域
本发明属于自然语言处理技术领域,尤其涉及一种智能问答方法、装置及计算机可读介质。
背景技术
现有的客服跟单主要依赖于人工客服通过建立微信群的方式进行问题解答,效率比较低,并且严重依赖于客服的人工能力,用户体验性不佳。
为了解决人工客服体验差的问题,现阶段也出现了很多用于问答的人工智能模型,但是这些模型训练所需要的海量数据大部分是来源于网络数据,因此将基于网络数据训练的模型用于企业内部具体业务场景中的问答是不适用的;而且针对一些特定的业务场景,相对于模型训练数据,业务数据也没有那么专业,更无法提供海量的训练数据;因此,针对一些特定业务场景,想基于模型训练进行问答在现阶段是很难实现的。
发明内容
针对现有技术存在的上述问题,本发明实施例提供了一种智能问答方法、装置及计算机可读介质,能够针对具体业务场景提供智能问答,解决了现有技术中由于人工客服效率低导致用户体验性差的问题。
根据本发明实施例第一方面,提供一种智能问答方法,所述方法应用于服务端,包括:对接收的查询问题进行向量化处理,生成向量化问题;从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;若所述第一查询结果表征所述向量化答案存在,则基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;若所述第一查询结果表征所述向量化答案不存在,则基于所述查询问题,利用大语言模型进行答案预测,生成与所述查询问题对应的问答结果。
可选的,所述基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;包括:获取向量化答案对应的文本片段;调用语音生成模板对所述文本片段进行转化处理,生成语音对话;利用大语言模型对所述语音对话进行优化处理,生成与所述查询问题对应的问答结果。
可选的,所述方法还包括:针对本地加载的任一目标文档:将所述目标文档解析成文本内容;通过文本切割器对所述文本内容进行切割处理,生成若干文本片段;针对任一所述文本片段:对所述文本片段进行向量化处理,生成向量化文本;将所述向量化文本与所述文本片段建立映射关系,并进行存储,构建知识数据库。
可选的,所述从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;包括:基于所述向量化问题,从知识数据库中查询向量化答案,得第二查询结果;若所述第二查询结果表征存在至少一个向量化答案,则针对任一所述向量化答案:计算所述向量化问题与所述向量化答案之间的相似度;从至少一个向量化答案中查询是否存在满足预设相似度要求的向量化答案,得到第一查询结果。
可选的,所述方法还包括:将目标文档作为训练样本;其中,所述目标文档用于指示与业务场景相关的文档;基于所述训练样本,利用ChatGLM2-6B模型进行模型训练,得到训练结果;基于若干所述训练结果,利用P-Tuning v2对所述ChatGLM2-6B模型进行微调,生成大语言模型。
根据本发明实施例第二方面,还提供一种智能问答装置,应用于服务端,包括:向量化处理模块,用于对接收的查询问题进行向量化处理,生成向量化问题;查询模块,用于从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;优化模块,用于若所述第一查询结果表征所述向量化答案存在,则基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;预测模块,用于若所述第一查询结果表征所述向量化答案不存在,则基于所述查询问题,利用大语言模型进行答案预测,生成与所述查询问题对应的问答结果。
可选的,优化模块包括:获取单元,用于获取向量化答案对应的文本片段;语音转化单元,用于调用语音生成模板对所述文本片段进行转化处理,生成语音对话;优化处理单元,用于利用大语言模型对所述语音对话进行优化处理,生成与所述查询问题对应的问答结果。
可选的,所述的装置还包括:文本转化模块,用于针对本地加载的任一目标文档:将所述目标文档解析成文本内容;通过文本切割器对所述文本内容进行切割处理,生成若干文本片段;存储模块,用于针对任一所述文本片段:对所述文本片段进行向量化处理,生成向量化文本;将所述向量化文本与所述文本片段建立映射关系,存储于知识数据库中。
可选的,查询模块包括:第二查询单元,用于基于所述向量化问题,从知识数据库中查询向量化答案,得第二查询结果;相似度计算单元,用于若所述第二查询结果表征存在至少一个向量化答案,则针对任一所述向量化答案:计算所述向量化问题与所述向量化答案之间的相似度;第一查询单元,用于从至少一个向量化答案中查询是否存在满足预设相似度要求的向量化答案,得到第一查询结果。
根据本发明实施例第三方面,还提供一种电子设备,所述电子设备包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面所述的方法。
根据本发明实施例第四方面,还提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的方法。
本发明实施例提供一种智能问答方法,该方法应用于服务端,包括:首先,对接收的查询问题进行向量化处理,生成向量化问题;其次,从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;之后,若所述第一查询结果表征所述向量化答案存在,则基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;若所述第一查询结果表征所述向量化答案不存在,则基于所述查询问题,利用大语言模型进行答案预测,生成与所述查询问题对应的问答结果。由此,本实施例将服务端本地知识数据库和大语言模型相结合,能够快速应对特定业务场景中的各种问答,从而提高了客服系统的应答效率和应答质量,进而提高了用户的体验性。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本发明的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
图1为本发明一实施例提供的智能问答方法的流程示意图;
图2为本发明一实施例中构建知识数据库的流程示意图;
图3为本发明另一实施例提供的智能问答方法的流程示意图;
图4为本发明一实施例提供的智能问答装置的结构示意图。
具体实施方式
如图1所示,为本发明一实施例提供的智能问答方法的流程示意图。
一种智能问答方法,应用于服务端,至少包括如下步骤:
S101,对接收的查询问题进行向量化处理,生成向量化问题;
S102,从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;
S103,若所述第一查询结果表征所述向量化答案存在,则基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;
S104,若所述第一查询结果表征所述向量化答案不存在,则基于所述查询问题,利用大语言模型进行答案预测,生成与所述查询问题对应的问答结果。
在S101中,利用向量化工具对查询问题进行向量化处理,生成向量化问题。对向量化工具不作任何限定,只要能够对查询问题实现向量化转化就可以。优选的,向量化工具例如:向量化插件text2vec-large-chinese,因为text2vec-large-chinese能够提供简单易用的API接口,从而方便地集成到知识数据库中。
在S102至S104中,基于相似度匹配的方法从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;若所述第一查询结果表征存在与所述向量化问题对应的向量化答案,则对所述向量化答案进行语音转化处理,并将语音转化处理结果输送至大语言模型,大语言模型对语音转化处理结果进行优化处理,生成与查询问题对应的问答结果;若所述第一查询结果表征不存在与所述向量化问题对应的向量化答案,则将所述查询问题输入大语言模型进行答案预测,生成与所述查询问题对应的问答结果。
在这里,大语言模型可以是开源大语言模型,也可以对开源大语言模型经过微调处理后的模型。例如:大语言模型可以为开源ChatGLM2-6B模型。开源ChatGLM2-6B模型是一种基于混合目标函数的预训练语言模型,它能够对用户的问题和要求提供适当的答复和支持。该模型是基于GLM-130B模型开发的,具有超过1300亿参数,使用了清华大学KEG实验室和智谱AI公司于2023年共同训练的语言模型。ChatGLM2-6B模型在语言理解和生成方面表现出色,能够处理多种自然语言处理任务,如问答、对话生成、文本分类等。
本实施例将服务端本地知识数据库和大语言模型相结合,能够快速应对特定业务场景中的各种问答,从而提高了客服系统的应答效率和应答质量,进而提高了用户的体验性。
在优选的实施方式中,大语言模型通过如下方法获得:将目标文档作为训练样本;其中,所述目标文档用于指示与业务场景相关的文档;基于所述训练样本,利用ChatGLM2-6B模型进行模型训练,得到训练结果;基于若干所述训练结果,利用P-Tuning v2对所述ChatGLM2-6B模型进行微调,生成大语言模型。
在这里,P-Tuning v2是一种针对自然语言处理任务的预训练模型,它可以在不同规模的模型和任务上实现与精调方法相媲美的迁移效果。相比于传统的预训练模型,P-Tuning v2采用了深度提示调优的方法,即对预训练变压器的每一层输入应用连续提示,从而提高了大语言模型的泛化能力和性能。
由于业务场景中业务数据不是海量的,因此无法单独利用算法进行模型训练,本实施例将业务数据作为训练样本,利用ChatGLM2-6B模型进行模型训练,并利用P-Tuningv2对模型参数进行微调;由此,能够提高大语言模型在业务场景中对业务问题所对应问答结果预测的准确率,同时使得大语言模型能够对知识数据库的查询结果进行快速优化,提高了智能问答系统的应答效率。
如图2所示,为本发明一实施例中构建知识数据库的流程示意图。
构建知识数据库,至少包括如下步骤:
S201,针对本地加载的任一目标文档:将所述目标文档解析成文本内容;通过文本切割器对所述文本内容进行切割处理,生成若干文本片段;
S202,针对任一所述文本片段:对所述文本片段进行向量化处理,生成向量化文本;将所述向量化文本与所述文本片段建立映射关系,并进行存储,构建知识数据库。
本实施例基于Langchain-Chatchat与text2vec-large-chinese搭建的本地知识数据库补充,由此能够大大提高智能客服系统的工作效率和回答质量,提升了用户的体验性。
如图3所示,为本发明另一实施例提供的智能问答方法的流程示意图。
一种智能问答方法,应用于服务端,至少包括如下步骤:
S301,对接收的查询问题进行向量化处理,生成向量化问题;
S302,基于向量化问题,从知识数据库中查询向量化答案,得第二查询结果;
S303,若第二查询结果表征存在至少一个向量化答案,则针对任一向量化答案:计算向量化问题与向量化答案之间的相似度;
S304,从至少一个向量化答案中查询是否存在满足预设相似度要求的向量化答案,得到第一查询结果;
S305,若第一查询结果表征存在满足预设相似度要求的向量化答案,则将该向量化答案作为与向量化问题对应的向量化答案;并获取向量化答案对应的文本片段;调用语音生成模板对文本片段进行转化处理,生成语音对话;利用大语言模型对语音对话进行优化处理,生成与查询问题对应的问答结果;
S306,若第一查询结果表征不存在满足预设相似度要求的向量化答案,则基于查询问题,利用大语言模型进行答案预测,生成与查询问题对应的问答结果。
下面结合具体应用对本实施例方案进行详细说明。
LangChain-Chatchat将服务端各个插件连接起来,相当于提供一个平台或者一个通道,这个平台能让模型和向量化插件组装一块。
首先,服务端基于用户请求通过非结构化加载器将若干个目标文档加载进来;针对任一目标文档:服务端将目标文档转化为文本,之后经过文本切割器切割为文本片段,利用text2vec-large-chinese插件对每个文本片段进行向量化处理,得到向量化文本;最后将向量化文本与文本片段建立映射关系,存储于知识数据库。
其次,服务端接收到客户端发送的查询问题,基于本地知识数据库进行查询;如果查到了就用本地知识数据库的答案,并通过大语言模型输出问答结果;如果本地知识数据库没有查询到,则大语言模型针对查询问题进行预测,输出问答结果。
例如:查询问题经过向量化插件text2vec-large-chinese进行向量化处理,得到向量化问题,然后与知识数据库进行相似度匹配,得到对应的文本片段;之后文本片段经过语音生成模板转化成语音对话,最后将语音对话输送到大语言模型,进行优化处理,输出与查询问题对应的问答结果。
再例如,ChatGLM2-6B模型的回答是通用的答案,很泛;比如:“我要贷款需要什么手续”查询问题,ChatGLM2-6B模型通常是从网上搜索比较常见的贷款流程,但是企业内部可能有些限制条件,比如只做车贷,不做房贷,如果本地知识数据库有的话,大语言模型就会输出“只支持车贷不支持房贷”的问答结果。虽然实际ChatGLM2-6B模型给出答案也很流畅,但并不是用户想要的,因此不符合用户所需要的应用场景。
再例如,将“今天天气怎么样”的查询问题输入没有微调的ChatGLM2-6B模型,ChatGLM2-6B模型可能会输出“你在哪个城市”问答结果或者“没有联网”的问答结果;但是经过本地知识数据库和微调后的大语言模型,大语言模型会回答的更专业些,因为业务场景中的问答不是通用的,比如报错信息,业务流程信息等。开源ChatGLM2-6B模型是回答不了的,它只能回答比较连贯或者专业的信息。
从知识数据库查询到的文本片段所形成的语音对话有可能不是一个,例如:你问天气怎么样,智能问答系统可能输出10个结果;但是经过大语言模型优化后输出一个问答结果;然而,有时候知识数据库可能搜不到匹配的文本片段,这时候大语言模型需要根据查询问题预测对应的问答结果。
将大语言模型部署在服务端时,需要对大语言模型参数进行配置。问答结果输出几个是由问题、答案数量以及模型配置参数共同决定的。
本实施例智能问答系统利用预训练模型P-Tuning v2对语言对话模型ChatGLM2-6进行微调处理,并使用Langchain-Chatchat和text2vec-large-chinese搭建本地知识数据库来对微调后的大语言模型做数据补充,使该智能客服系统更智能、专业、可靠,极大的提高智能客服系统的效率和回答质量。
如图4所示,为本发明一实施例提供的智能问答装置的结构示意图。
一种智能问答装置,应用于服务端,该装置400包括:向量化处理模块401,用于对接收的查询问题进行向量化处理,生成向量化问题;查询模块402,用于从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;优化模块403,用于若所述第一查询结果表征所述向量化答案存在,则基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;预测模块404,用于若所述第一查询结果表征所述向量化答案不存在,则基于所述查询问题,利用大语言模型进行答案预测,生成与所述查询问题对应的问答结果。
在优选的实施方式中,优化模块包括:获取单元,用于获取向量化答案对应的文本片段;语音转化单元,用于调用语音生成模板对所述文本片段进行转化处理,生成语音对话;优化处理单元,用于利用大语言模型对所述语音对话进行优化处理,生成与所述查询问题对应的问答结果。
在优选的实施方式中,所述装置还包括:文本转化模块,用于针对本地加载的任一目标文档:将所述目标文档解析成文本内容;通过文本切割器对所述文本内容进行切割处理,生成若干文本片段;存储模块,用于针对任一所述文本片段:对所述文本片段进行向量化处理,生成向量化文本;将所述向量化文本与所述文本片段建立映射关系,存储于知识数据库中。
在优选的实施方式中,查询模块包括:第二查询单元,用于基于所述向量化问题,从知识数据库中查询向量化答案,得第二查询结果;相似度计算单元,用于若所述第二查询结果表征存在至少一个向量化答案,则针对任一所述向量化答案:计算所述向量化问题与所述向量化答案之间的相似度;第一查询单元,用于从至少一个向量化答案中查询是否存在满足预设相似度要求的向量化答案,得到第一查询结果。
在优选的实施方式中,所述装置还包括:训练样本模块,用于将目标文档作为训练样本;其中,所述目标文档用于指示与业务场景相关的文档;模型训练模块,用于基于所述训练样本,利用ChatGLM2-6B模型进行模型训练,得到训练结果;微调模块,用于基于若干所述训练结果,利用P-Tuning v2对所述ChatGLM2-6B模型进行微调,生成大语言模型。
上述装置可执行本发明一实施例所提供的一种智能问答方法,具备执行智能问答方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明一实施例所提供的一种智能问答方法。
本发明还提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本发明所述的一种智能问答方法。
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请如下各实施例的方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种智能问答方法,其特征在于,应用于服务端,包括:
对接收的查询问题进行向量化处理,生成向量化问题;
从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;
若所述第一查询结果表征所述向量化答案存在,则基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;
若所述第一查询结果表征所述向量化答案不存在,则基于所述查询问题,利用大语言模型进行答案预测,生成与所述查询问题对应的问答结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;包括:
获取向量化答案对应的文本片段;
调用语音生成模板对所述文本片段进行转化处理,生成语音对话;
利用大语言模型对所述语音对话进行优化处理,生成与所述查询问题对应的问答结果。
3.根据权利要求1所述的方法,其特征在于,还包括:
针对本地加载的任一目标文档:将所述目标文档解析成文本内容;通过文本切割器对所述文本内容进行切割处理,生成若干文本片段;
针对任一所述文本片段:对所述文本片段进行向量化处理,生成向量化文本;将所述向量化文本与所述文本片段建立映射关系,并进行存储,构建知识数据库。
4.根据权利要求1所述的方法,其特征在于,所述从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;包括:
基于所述向量化问题,从知识数据库中查询向量化答案,得第二查询结果;
若所述第二查询结果表征存在至少一个向量化答案,则针对任一所述向量化答案:计算所述向量化问题与所述向量化答案之间的相似度;
从至少一个向量化答案中查询是否存在满足预设相似度要求的向量化答案,得到第一查询结果。
5.根据权利要求1所述的方法,其特征在于,还包括:
将目标文档作为训练样本;其中,所述目标文档用于指示与业务场景相关的文档;
基于所述训练样本,利用ChatGLM2-6B模型进行模型训练,得到训练结果;
基于若干所述训练结果,利用P-Tuning v2对所述ChatGLM2-6B模型进行微调,生成大语言模型。
6.一种智能问答装置,其特征在于,应用于服务端,包括:
向量化处理模块,用于对接收的查询问题进行向量化处理,生成向量化问题;
查询模块,用于从知识数据库中查询与所述向量化问题对应的向量化答案,得到第一查询结果;
优化模块,用于若所述第一查询结果表征所述向量化答案存在,则基于所述向量化答案,利用大语言模型进行优化处理,生成与所述查询问题对应的问答结果;
预测模块,用于若所述第一查询结果表征所述向量化答案不存在,则基于所述查询问题,利用大语言模型进行答案预测,生成与所述查询问题对应的问答结果。
7.根据权利要求6所述的装置,其特征在于,优化模块包括:
获取单元,用于获取向量化答案对应的文本片段;
语音转化单元,用于调用语音生成模板对所述文本片段进行转化处理,生成语音对话;
优化处理单元,用于利用大语言模型对所述语音对话进行优化处理,生成与所述查询问题对应的问答结果。
8.根据权利要求6所述的装置,其特征在于,还包括:
文本转化模块,用于针对本地加载的任一目标文档:将所述目标文档解析成文本内容;通过文本切割器对所述文本内容进行切割处理,生成若干文本片段;
存储模块,用于针对任一所述文本片段:对所述文本片段进行向量化处理,生成向量化文本;将所述向量化文本与所述文本片段建立映射关系,存储于知识数据库中。
9.根据权利要求6所述的装置,其特征在于,查询模块包括:
查询单元,用于基于所述向量化问题,从知识数据库中查询向量化答案,得第二查询结果;
相似度计算单元,用于若所述第二查询结果表征存在至少一个向量化答案,则针对任一所述向量化答案:计算所述向量化问题与所述向量化答案之间的相似度;
选取单元,用于从至少一个向量化答案中查询是否存在满足预设相似度要求的向量化答案,得到第一查询结果。
10.一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如权利要求1-5任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311822994.0A CN117972038A (zh) | 2023-12-27 | 2023-12-27 | 一种智能问答方法、装置及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311822994.0A CN117972038A (zh) | 2023-12-27 | 2023-12-27 | 一种智能问答方法、装置及计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117972038A true CN117972038A (zh) | 2024-05-03 |
Family
ID=90848655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311822994.0A Pending CN117972038A (zh) | 2023-12-27 | 2023-12-27 | 一种智能问答方法、装置及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117972038A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118133971A (zh) * | 2024-05-06 | 2024-06-04 | 支付宝(杭州)信息技术有限公司 | 基于大语言模型的医疗问答方法和装置 |
-
2023
- 2023-12-27 CN CN202311822994.0A patent/CN117972038A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118133971A (zh) * | 2024-05-06 | 2024-06-04 | 支付宝(杭州)信息技术有限公司 | 基于大语言模型的医疗问答方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111428010B (zh) | 人机智能问答的方法和装置 | |
CN116775847B (zh) | 一种基于知识图谱和大语言模型的问答方法和系统 | |
KR20200110400A (ko) | 학습 데이터 증강 정책 | |
CN109933602B (zh) | 一种自然语言与结构化查询语言的转换方法及装置 | |
US11580299B2 (en) | Corpus cleaning method and corpus entry system | |
CN110795913B (zh) | 一种文本编码方法、装置、存储介质及终端 | |
JP6605672B2 (ja) | マルチラウンド入力によるサーチ方法、システム及び端末機器 | |
CN117972038A (zh) | 一种智能问答方法、装置及计算机可读介质 | |
JP6733809B2 (ja) | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム | |
CN109344242B (zh) | 一种对话问答方法、装置、设备及存储介质 | |
US20190228297A1 (en) | Artificial Intelligence Modelling Engine | |
CN117216227A (zh) | 基于知识图谱与大语言模型的烟草企业智能信息问答方法 | |
CN110059174B (zh) | 问询指引方法及装置 | |
CN113239698A (zh) | 基于rpa及ai的信息提取方法、装置、设备及介质 | |
CN109656952B (zh) | 查询处理方法、装置及电子设备 | |
CN117290478A (zh) | 一种知识图谱问答方法、装置、设备和存储介质 | |
CN114926701A (zh) | 一种模型训练方法、目标检测方法、以及相关设备 | |
JP2006072477A (ja) | 対話戦略学習方法、対話戦略学習プログラム、記憶媒体、および、対話戦略学習装置 | |
CN114328961A (zh) | 客服领域知识图谱构建方法、装置、计算机设备及介质 | |
CN112395402A (zh) | 基于深度模型的推荐话术生成方法、装置和计算机设备 | |
CN113326359A (zh) | 一种对话应答及应答策略匹配模型的训练方法和装置 | |
CN117312535B (zh) | 基于人工智能的问题数据处理方法、装置、设备及介质 | |
US20220335227A1 (en) | Machine translation guided by reference documents | |
CN118070925B (zh) | 模型训练方法、装置、电子设备、存储介质及程序产品 | |
CN111506701B (zh) | 一种智能查询方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |