CN116821318B - 基于大语言模型的业务知识推荐方法、装置及存储介质 - Google Patents

基于大语言模型的业务知识推荐方法、装置及存储介质 Download PDF

Info

Publication number
CN116821318B
CN116821318B CN202311096260.9A CN202311096260A CN116821318B CN 116821318 B CN116821318 B CN 116821318B CN 202311096260 A CN202311096260 A CN 202311096260A CN 116821318 B CN116821318 B CN 116821318B
Authority
CN
China
Prior art keywords
knowledge
language model
business
information
large language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311096260.9A
Other languages
English (en)
Other versions
CN116821318A (zh
Inventor
胡庆杰
孟斌
潘端端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Shipbuilding Orlando Wuxi Software Technology Co ltd
Original Assignee
China Shipbuilding Orlando Wuxi Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Shipbuilding Orlando Wuxi Software Technology Co ltd filed Critical China Shipbuilding Orlando Wuxi Software Technology Co ltd
Priority to CN202311096260.9A priority Critical patent/CN116821318B/zh
Publication of CN116821318A publication Critical patent/CN116821318A/zh
Application granted granted Critical
Publication of CN116821318B publication Critical patent/CN116821318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及智能推荐技术领域,具体公开了一种基于大语言模型的业务知识推荐方法、装置及存储介质,包括:接收用户输入的业务知识需求信息;对所述业务知识需求信息进行意图识别以获得用户意图识别信息;根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点;根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果;向用户输出所述知识推荐结果。本发明提供的基于大语言模型的业务知识推荐方法能够实现业务知识的自动化和智能化推荐。

Description

基于大语言模型的业务知识推荐方法、装置及存储介质
技术领域
本发明涉及智能推荐技术领域,尤其涉及一种基于大语言模型的业务知识推荐方法、基于大语言模型的业务知识推荐装置及存储介质。
背景技术
工业领域是人类社会的重要组成部分,涉及到航空航天、船舶、兵器等多个重要的行业和领域。工业领域的发展需要大量的业务知识,如科学研究、技术开发、产品创新等,这些业务知识是工程师、设计师、研发人员等的重要支撑和指导。工业领域的业务知识具有以下几个特点:
(一)数据庞大、格式繁多
工业领域的业务知识包含了多种类型和层次的数据,如文本、图像、表格等,这些数据分散在不同的数据源和数据平台中,难以进行统一的管理和利用。
(二)专业性强、保密性高
工业领域的业务知识涉及到多个专业学科和领域,如航空航天、船舶、兵器等,这些领域的知识需要具备相应的专业背景和技能才能理解和应用。同时,工业领域的业务知识也具有较高的保密性和敏感性,不适合进行公开的传播和共享。
(三)更新速度快、应用复杂
工业领域的业务知识随着科技的进步和市场的变化而不断更新和变化,需要及时地捕捉和反映最新的研发动态和创新成果。同时,工业领域的业务知识也需要根据不同的用户需求和应用场景进行灵活地选择和组合,以实现最优的解决方案和产品。
因此,如何有效地获取、管理、利用工业领域的业务知识,是一个亟待解决的问题。传统的方法主要依靠人工的方式来进行知识的收集、整理、存储、检索等操作,这些操作不仅耗时耗力,而且容易出现错误和遗漏。随着人工智能技术的发展,智能推荐技术作为一种利用人工智能技术,根据用户的偏好、行为、需求等,为用户提供个性化的信息或服务的技术 ,在工业领域也逐渐引起了关注和应用。然而,当前的智能推荐技术在工业领域也面临着很多挑战和困难:
(1)知识获取难度大,由于工业领域的数据庞大、格式繁多、专业性强、保密性高等特点,导致从数据中提取有价值的知识非常困难。(2)知识应用效果差,由于工业领域的知识更新速度快、应用复杂等特点,导致对知识的应用需要考虑多种因素,如用户的专业背景、任务目标、场景限制等。(3)知识推荐评估困难,由于工业领域的知识涉及到多种类型和层次的信息或服务,如文本、图像、表格等,导致对知识推荐效果的评估需要考虑多种指标,如准确性、覆盖率、多样性、新颖性等。
因此,如何提供一种智能获取知识的推荐方法成为本领域技术人员亟待解决的技术问题。
发明内容
本发明提供了一种基于大语言模型的业务知识推荐方法、基于大语言模型的业务知识推荐装置及存储介质,解决相关技术中存在的无法对业务知识进行智能推荐的问题。
作为本发明的第一个方面,提供一种基于大语言模型的业务知识推荐方法,其中,包括:
接收用户输入的业务知识需求信息;
对所述业务知识需求信息进行意图识别以获得用户意图识别信息;
根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点;
根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果;
向用户输出所述知识推荐结果;
其中,根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点,包括:
根据多模态知识图谱对所述用户意图识别信息进行特征关联分析以获得图谱推理相关业务知识;
根据所述用户意图识别信息通过记忆库进行检索以获得业务知识点和待匹配问题,并将所述业务知识点和待匹配问题作为大语言模型的输入提示信息;
将所述图谱推理相关业务知识和大语言模型的输入提示信息作为数据驱动相关知识点。
进一步地,根据多模态知识图谱对所述用户意图识别信息进行特征关联分析以获得图谱推理相关业务知识,包括:
从多模态知识图谱中选择与所述用户意图识别信息关联的业务知识内容,所述业务知识内容包括业务知识实体、业务知识关系和业务知识属性;
对与所述用户意图识别信息关联的业务知识内容进行深度分析,以从所述多模态知识图谱中提取与所述用户意图识别信息存在关联的关系信息,其中所述关联关系包括因果关系、相关关系和干扰关系;
根据所述关系信息对所述用户意图识别信息进行挖掘和推理以获得图谱推理相关业务知识。
进一步地,根据所述用户意图识别信息通过记忆库进行检索以获得业务知识点和待匹配问题,并将所述业务知识点和待匹配问题作为大语言模型的输入提示信息输入至大语言模型以获得大语言模型的相关知识点答复信息,包括:
根据所述用户意图识别信息中的关键词或实体在所述记忆库中检索相关知识点;
将所述业务知识需求信息在所述记忆库中进行相似性检索,以获得待匹配问题;
将所述相关知识点和所述待匹配问题组合后获得输入提示信息。
进一步地,根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果,包括:
将所述数据驱动相关知识点输入至所述大语言模型,以获得知识推荐结果,其中所述大语言模型能够根据输入提示信息以及所述用户意图识别信息的相关知识点进行推理分析获得知识推荐结果。
进一步地,所述大语言模型能够根据输入提示信息以及所述用户意图识别信息的相关知识点进行推理分析获得知识推荐结果,包括:
根据包括所述输入提示信息在内的交互历史进行实体和关系的抽取,获得实体和关系;
对所述实体和关系进行整合和推理,以获得实体和关系的隐含知识;
根据所述实体和关系的隐含知识以及所述知识库中与所述用户意图识别信息关联的相关知识点进行知识推理,获得与所述用户意图识别信息对应的解决方案;
将与所述用户意图识别信息对应的解决方案确定为知识推荐结果并输出所述知识推荐结果。
进一步地,所述基于大语言模型的业务知识推荐方法,还包括:
将所述知识推荐结果添加至所述知识库中以实现多模态知识图谱补充。
进一步地,所述基于大语言模型的业务知识推荐方法,还包括:
接收所述用户对所述知识推荐结果的反馈信息;
根据所述反馈信息重复执行生成知识推荐结果的过程。
作为本发明的另一个方面,提供一种基于大语言模型的业务知识推荐装置,其中,包括:
接收模块,用于接收用户输入的业务知识需求信息;
意图识别模块,用于对所述业务知识需求信息进行意图识别以获得用户意图识别信息;
分析与检索模块,用于根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点;
生成模块,用于根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果;
输出模块,用于向用户输出所述知识推荐结果。
作为本发明的另一个方面,提供一种存储介质,其中,包括计算机指令,所述计算机指令被处理器加载并执行时实现前文所述的基于大语言模型的业务知识推荐方法。
作为本发明的另一个方面,提供一种电子设备,其中,包括存储器和处理器,所述存储器和处理器通信连接,所述存储器用于存储计算机指令,所述处理器用于加载并执行所述计算机指令以实现前文所述的基于大语言模型的业务知识推荐方法。
本发明提供的基于大语言模型的业务知识推荐方法,通过对业务知识需求信息进行意图识别获得用户意图识别信息,进而通过知识库的分析检索获得数据驱动相关知识点,最后结合大语言模型对数据驱动相关知识点进行处理,获得知识推荐结果。这种基于大语言模型的业务知识推荐方法,能够实现业务知识的自动化和智能化推荐,且通过将多模态知识图谱中与用户输入相关的子图转换为自然语言文本,并利用大语言模型对其进行编码、解码、检索、生成等操作,通过将知识图谱中的实体和关系以及记忆库中的相关知识点作为大语言模型的输入或输出的一部分,实现了数据和知识驱动的双向推理,提高了推荐方法的准确性和可解释性,解决了工业领域知识应用效果差的问题。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。
图1为本发明提供的基于大语言模型的业务知识推荐方法的流程图。
图2为本发明提供的对用户的意图进行识别的过程示意图。
图3为本发明提供的获得数据驱动相关知识点的流程图。
图4为本发明提供的获得图谱推理相关业务知识的流程图。
图5为本发明提供的通过记忆库进行检索获得业务知识点和待匹配问题的流程图。
图6为本发明提供的根据输入提示信息获得输出结果的示意图。
图7为本发明提供的大语言模型根据输入提示信息推理出的解决方案和预防措施的示意图。
图8为本发明提供的基于本发明的推荐方法进行业务知识推荐的示意图。
图9a为本发明提供的Bing AI针对问题1的结果示意图。
图9b为本发明提供的KDDIRM-LLM针对问题1的结果示意图。
图10a为本发明提供的Bing AI针对问题2的结果示意图。
图10b为本发明提供的KDDIRM-LLM针对问题2的结果示意图。
图11为本发明提供的基于大语言模型的业务知识推荐装置的架构图。
图12为图11的具体架构的工作流程图。
图13为本发明提供的电子设备的结构框图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互结合。下面将参考附图并结合实施例来详细说明本发明。
为了使本领域技术人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包括,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本实施例中提供了一种基于大语言模型的业务知识推荐方法,图1是根据本发明实施例提供的基于大语言模型的业务知识推荐方法的流程图,如图1所示,包括:
S100、接收用户输入的业务知识需求信息;
在本发明实施例中,用户可以通过自然语言或者多模态方式提出业务知识需求或兴趣,例如关键词、问题以及话题等等。
S200、对所述业务知识需求信息进行意图识别以获得用户意图识别信息;
在本发明实施例中,在接收到用户的业务知识需求信息时,需要首先对用户的业务知识需求信息进行理解,以便于识别得到用户意图识别信息,在本发明实施例中,所述用户意图识别信息具体可以包括用户意图和主要对象。
如图2所示,为对用户的意图进行识别的过程。为了方便后续的处理和分析,将用户输入的业务知识需求信息转换为自然语言文本,并在意图识别时进行数据分类和标记,以确定用户意图和主要对象,以及其包含的关键词或实体。
例如,用户输入的业务知识需求信息为:“总装测试时,助推模块气瓶充气阀低压下漏率超标。请问这一现象的故障原因可能是什么?”
这个用户输入可以被分类和标记为:
领域:故障;
主要对象:气瓶充气阀;
关键词或实体:总装测试、助推模块、气瓶充气阀、低压、漏率超标。
S300、根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点;
在本发明实施例中,所述知识库具体可以包括多模态知识图谱和记忆库,根据用户意图识别信息从多模态知识图谱中的业务知识中挖掘出更多有价值的信息,以及根据用户意图识别信息从记忆库中检索出与之对应的知识点信息,基于多模态知识图谱中挖掘的信息以及记忆库中检索出的知识点信息形成数据驱动相关知识点,该数据驱动相关知识点用于实现数据驱动推理。
S400、根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果;
在本发明实施例中,基于大语言模型对所述数据驱动相关知识点进行处理,即利用知识本身的结构和语义只对用户评价较好的推荐结果进行知识抽取,进而进行融合推理获得知识推荐结果。
S500、向用户输出所述知识推荐结果。
本发明提供的基于大语言模型的业务知识推荐方法,通过对业务知识需求信息进行意图识别获得用户意图识别信息,进而通过知识库的分析检索获得数据驱动相关知识点,最后结合大语言模型对数据驱动相关知识点进行处理,获得知识推荐结果。这种基于大语言模型的业务知识推荐方法,能够实现业务知识的自动化和智能化推荐,且通过将多模态知识图谱中与用户输入相关的子图转换为自然语言文本,并利用大语言模型对其进行编码、解码、检索、生成等操作,通过将知识图谱中的实体和关系以及记忆库中的相关知识点作为大语言模型的输入或输出的一部分,实现了数据和知识驱动的双向推理,提高了推荐方法的准确性和可解释性,解决了工业领域知识应用效果差的问题。
关于本发明实施例中的多模态知识图谱,具体为一种将不同类型(如文本、图像、视频等)和层次(如概念、实例、属性等)的业务知识整合在一起的结构化表示方式。多模态知识图谱可以用一个有向图G=(V,E)来表示,其中V是节点集合,E是边集合。节点可以表示实体、关系或属性,边可以表示实体之间或实体与属性之间的关联。每个节点或边可以有一个或多个类型标签,表示其所属的数据类型或领域类别。每个节点或边还可以有一个或多个多模态数据,表示其所对应的文本、图像、视频等信息。
在本发明实施例中,具体可以使用Richpedia作为基础的多模态知识图谱,Richpedia是一个基于多个领域和数据源构建的大规模多模态知识图谱,具体包含了超过1000万个实体、1亿个关系和1亿个属性,以及与之对应的图像、视频等多模态数据。Richpedia涵盖了多个领域和数据源,如科学研究、技术开发、产品创新等,并定期更新和扩展,以保证其与最新的研发领域保持一致。
另外,关于本发明实施例中的大语言模型具体可以用一个函数f(x)来表示,其中x是输入文本,f(x)是输出文本或输出概率。该大语言模型具体可以有效地捕捉文本中的语法、语义、逻辑等信息,并提供强大的文本生成和文本理解能力。
本发明实施例中,使用llama2作为大语言模型,其为一个基于编码器-解码器架构的大语言模型,可以同时进行文本生成和文本理解。llama2根据不同的任务和领域来选择或训练合适的预训练语料、预训练目标、预训练参数,并在此基础上调整大语言模型,以提高其在特定场景下的表现。
大语言模型的训练过程具体可以包括以下几个主要步骤:
(1)预训练语料选择或构建:从不同的领域和数据源中选择或构建合适的预训练语料,如维基百科、新闻、社交媒体等。
(2)预训练目标设计或选择:设计或选择合适的预训练目标,如掩码语言建模、下一句预测、自回归语言建模、文本到文本转换等。
(3)预训练参数设置或优化:设置或优化合适的预训练参数,如网络结构、网络层数、隐藏单元数、注意力头数、学习率、批次大小等。
(4)预训练过程执行或监控:执行或监控预训练过程,如数据加载、数据处理、数据喂入、梯度计算、梯度更新、损失函数计算、评估指标计算等。
(5)预训练模型保存或加载:保存或加载预训练模型,如模型权重、模型配置、模型词典等。
在本发明实施例中,根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点,如图3所示,包括:
S310、根据多模态知识图谱对所述用户意图识别信息进行特征关联分析以获得图谱推理相关业务知识;
应当理解的是,首先是通过多模态知识图谱对用户意图识别信息通过图谱推理过程获得图谱相关业务知识。
进一步具体地,如图4所示,根据多模态知识图谱对所述用户意图识别信息进行特征关联分析以获得图谱推理相关业务知识,包括:
S311、从多模态知识图谱中选择与所述用户意图识别信息关联的业务知识内容,所述业务知识内容包括业务知识实体、业务知识关系和业务知识属性;
在本发明实施例中,根据意图识别的结果,从多模态知识图谱中选择与之相关或相似的业务知识实体、关系、属性等,以获得图谱推理相关业务知识,并将其作为数据驱动推理的输入数据。
例如上文的示例:
领域:故障;
主要对象:气瓶充气阀;
关键词或实体:总装测试、助推模块、气瓶、充气阀、低压、漏率超标。
基于该示例,可以从多模态知识图谱中选择与“充气阀”、“故障”相关或相似的实体、关系、属性等,如“气密漏率超标”、“压力不稳”、“温度过高”、“开关失灵”等都是“充气阀”的“故障模式”。
S312、对与所述用户意图识别信息关联的业务知识内容进行深度分析,以从所述多模态知识图谱中提取与所述用户意图识别信息存在关联的关系信息,其中所述关联关系包括因果关系、相关关系和干扰关系;
在本发明实施例中,对选择的数据进行深度分析,发现其中的特征、规律、关联、趋势等,从而提取出有价值的信息。
例如,可以对“气瓶充气阀”的“故障模式”进行分类、聚类、关联分析等,找出其与其他实体或属性的关系,如“气密漏率超标”与“壳体活门座损伤”、“阀芯密封面损伤”等有因果关系,“压力不稳”与“阀芯弹簧弹力不足”、“电磁线圈损坏”等有相关关系,“温度过高”与“阀体与气瓶连接处密封不良”、“气体泄漏”等有影响关系,“开关失灵”与“电磁线圈老化”、“静电干扰”等有干扰关系等。
S313、根据所述关系信息对所述用户意图识别信息进行挖掘和推理以获得图谱推理相关业务知识。
在本发明实施例中,利用数据分析得到的信息,进行进一步的挖掘和推理,从而生成新的业务知识或解决方案。
例如,可以根据“气瓶充气阀”的“故障模式”和“故障原因”,推导出相应的“纠正措施”和“技术准则或禁忌”,如“气密漏率超标”的“纠正措施”是“去相交孔毛刺时保护活门座位置”,“技术准则或禁忌”是“去毛刺前保护活门座、加强检查”等。
通过上述图谱推理过程,将分析和挖掘后得到的图谱推理相关业务知识以可视化或可解释化的方式输出,如图表、报告、摘要等,并将其作为数据驱动推理的输出结果。
根据上文意图识别的结果,用户需要得到的是可能的故障原因,因此可以通过生成如下的表格,显示当前故障现象所属故障模式的概率,以及可能的故障原因等。
表1 图谱推理结果表
S320、根据所述用户意图识别信息通过记忆库进行检索以获得业务知识点和待匹配问题,并将所述业务知识点和待匹配问题作为大语言模型的输入提示信息;
需要说明的是,记忆库中存储着由大量业务知识形成“知识点”或“待匹配问题”,此处分别用向量检索和关键词检索两种方式从记忆库中检索相关的“知识点”和“待匹配问题”。
具体地,如图5所示,根据所述用户意图识别信息通过记忆库进行检索以获得业务知识点和待匹配问题,并将所述业务知识点和待匹配问题作为大语言模型的输入提示信息输入至大语言模型以获得大语言模型的相关知识点答复信息,包括:
S321、根据所述用户意图识别信息中的关键词或实体在所述记忆库中检索相关知识点;
在本发明实施例中,根据意图识别的结果中的“关键词或实体:总装测试、助推模块、气瓶充气阀、低压、漏率超标”在记忆库中检索相关的知识点。
例如,在记忆库中存在一个由《xxxx故障分析报告》总结出的一个知识点:“总装测试时,助推模块气瓶充气阀低压下漏率超标,无法用气泡法检漏。经过分析,我们发现壳体活门座处存在机械性损伤,机械损伤痕迹边缘尖锐,导致阀芯密封面接触部位发生损伤。在充放气过程中,挤压痕损伤边缘应力集中区域在高压气体的冲刷下,逐渐发生破损,活门座与非金属成线形接触,无法弥补上述缺陷,当破损区域横跨密封压痕时发生泄漏失效”。
S322、将所述业务知识需求信息在所述记忆库中进行相似性检索,以获得待匹配问题;
将用户输入的问题向量化后,在记忆库中进行“待匹配问题”的相似性检索。
例如,记忆库中存在一条待匹配问题“出现气密漏率超标的具体原因是什么?答:壳体活门座处存在机械性损伤,导致阀芯密封面接触部位发生损伤。”与用户输入的问题相似度较高。
S323、将所述相关知识点和所述待匹配问题组合后获得输入提示信息。
将检索到的相关“知识点”和“待匹配问题”组合成一个输入提示信息交给大语言模型。输入提示信息的结构如下:
“相关知识点:“xxxxx”
待匹配问题:“xxxxx”
请根据相关知识点和待匹配问题,回答用户的提问:xxxxxx”。
图6所示,为将上述输入提示信息输入至大语言模型后获得输出结果的示例图。
S330、将所述图谱推理相关业务知识和大语言模型的输入提示信息作为数据驱动相关知识点。
应当理解的是,可以根据前文图谱推理获得的图谱推理相关业务知识以及当前大语言模型的输入提示信息作为数据驱动相关知识点,以便基于此获得知识推荐结果。
具体地,根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果,包括:
将所述数据驱动相关知识点输入至所述大语言模型,以获得知识推荐结果,其中所述大语言模型能够根据输入提示信息以及所述用户意图识别信息的相关知识点进行推理分析获得知识推荐结果。
在本发明实施例中,所述大语言模型能够根据输入提示信息以及所述用户意图识别信息的相关知识点进行推理分析获得知识推荐结果,包括:
1)根据包括所述输入提示信息在内的交互历史进行实体和关系的抽取,获得实体和关系;
利用经过专业训练的大语言模型对用户的交互历史进行分析,得到其中的一些包含实体和关系的语句,然后在这些语句中抽取出实体和关系。
例如,“总装测试时,助推模块气瓶充气阀低压下漏率超标,无法用气泡法检漏。经过分析,我们发现壳体活门座处存在机械性损伤,机械损伤痕迹边缘尖锐,导致阀芯密封面接触部位发生损伤。在充放气过程中,挤压痕损伤边缘应力集中区域在高压气体的冲刷下,逐渐发生破损,活门座与非金属成线形接触,无法弥补上述缺陷,当破损区域横跨密封压痕时发生泄漏失效。”这段话中能够得到下面4个包含实体和关系的语句:
“助推模块气瓶充气阀低压下漏率超标,无法用气泡法检漏。”
“壳体活门座处存在机械性损伤,机械损伤痕迹边缘尖锐。”
“活门座与非金属成线形接触,无法弥补上述缺陷。”
“破损区域横跨密封压痕时发生泄漏失效。”。
以“助推模块气瓶充气阀低压下漏率超标,无法用气泡法检漏。”这句话为例,能够从中抽取出以下知识:
实体:助推模块、气瓶、充气阀;
三元组:{h:“助推模块”,t:“气瓶”,r:“组成”};
三元组:{h:“气瓶”,t:“充气阀”,r:“组成”};
三元组:{h:“充气阀”,t:“低压下漏率超标,无法用气泡法检漏。”,r:“故障现象”}。
2)对所述实体和关系进行整合和推理,以获得实体和关系的隐含知识;
利用大语言模型对抽取后的知识进行整合及推理,从而发现其中的隐含的知识。
例如,可以将{h:“助推模块”,t:“气瓶”,r:“组成”}、{h:“气瓶”,t:“充气阀”,r:“组成”}三元组进行融合,从而发现新的实体,如“助推模块气瓶”、“气瓶充气阀”和“助推模块气瓶充气阀”等。
3)根据所述实体和关系的隐含知识以及所述知识库中与所述用户意图识别信息关联的相关知识点进行知识推理,获得与所述用户意图识别信息对应的解决方案;
利用大语言模型的善于推理的特点,结合故障原因和记忆库中的相关知识点,可以推理出相应的解决方案和预防措施。图7所示为大语言模型根据输入提示信息推理出的解决方案和预防措施。
4)将与所述用户意图识别信息对应的解决方案确定为知识推荐结果并输出所述知识推荐结果。
在本发明实施例中,为了能够提升推荐结果的准确性,所述基于大语言模型的业务知识推荐方法,还包括:
将所述知识推荐结果添加至所述知识库中以实现多模态知识图谱补充。
具体地,将上述知识推荐结果加入到多模态知识图谱中,如“助推模块气瓶”、“气瓶充气阀”和“助推模块气瓶充气阀”等,并补充实体间的关系如:
三元组:{h:“助推模块气瓶”,t:“气瓶”,r:“同义”};
三元组:{h:“气瓶充气阀”,t:“充气阀”,r:“同义”};
三元组:{h:“助推模块气瓶充气阀”,t:“气瓶充气阀”,r:“同义”}。
然后,将“助推模块气瓶充气阀”的故障现象,以及故障现象对应的故障原因、解决方案、预防措施等,补充进多模态知识图谱。
假如,《xxxx故障分析报告》总结出的知识点下,还存在描述“助推模块气瓶充气阀”和“助推模块气瓶充气阀低压下漏率超标”的图片。这些图片也会补充进多模态知识图谱,将图片与“助推模块气瓶充气阀”实体和“助推模块气瓶充气阀低压下漏率超标”故障现象建立关系。后续使用时,只需要上传“助推模块气瓶充气阀”照片,就能知道是“助推模块气瓶充气阀”相关的问题。
另外,为了不断对推荐结果进行优化,以提升推荐结果的准确性,还包括:
接收所述用户对所述知识推荐结果的反馈信息;
根据所述反馈信息重复执行生成知识推荐结果的过程。
应当理解的是,通过接收用户的反馈信息,并根据用户的反馈信息反复迭代上述步骤S100至S500,实现结果的优化处理。
在本发明实施例中,上述利用数据驱动(主要是多模态知识图谱和记忆库)和知识驱动(主要是大语言模型)的双向推理来提高最终推荐结果的准确性和可解释性的具体原理和技术细节,具体可以使用以下公式来表示这一过程:
其中,表示用户输入和子图中的文本,/>表示编码器类型的大语言模型对/>进行编码的结果,/>表示仅编码器类型的大语言模型对/>进行检索的结果,表示仅解码器类型或编码器-解码器类型的大语言模型对/>进行解码或生成的结果,/>表示输出的业务知识摘要或概述,/>表示数据驱动推理对/>进行数据分析和数据挖掘的结果,/>表示知识驱动推理对/>进行知识抽取和知识融合的结果,/>表示对/>进行业务知识推荐的结果。
图8所示为基于上述推荐方法进行业务知识推荐的示意图。
从图8中可以看出,基于大语言模型的智能推荐方法完成业务知识推荐的步骤如下:
步骤1:用户输入的需求/问题,可以是图片、文字。图8中所示例子为图片+文字的多模态输入。
步骤2:利用意图识别模型,识别用户的意图。
步骤3:利用数据驱动推理,从多模态知识图谱中检索相似度最高的n个图片和实体,从而推理出用户输入的主要对象的含义。例如图8所示例子,在多模态知识图谱中检索出了2张相似度最高的图片,分别是“助推模块气瓶充气阀”实体和“助推模块气瓶充气阀低压下漏率超标”,可以推理出用户输入的是“助推模块气瓶充气阀”相关的故障。
步骤4:将多模态知识图谱中推理出的结果组织成自然语言,然后利用数据驱动推理从记忆库中检索相关的“知识点”和“待匹配问题”。
步骤5:将相关“知识点”和“待匹配问题”组成输入提示信息,交给大语言模型进行推理,满足用户的意图。例如图8所示例子,用户意图为可能的故障原因,因此会根据用户意图给出可能的故障原因。当可能的故障原因有多条时,会以列表的形式展示可能的故障原因,以及对应的概率,并会给出相关的参考文献(“知识点”和“待匹配问题”的来源)。
步骤6:在给出推荐结果后,根据当前的对话记录,生成一些相关的问题引导用户继续进行交互。例如:
“如何解决气瓶充气阀低压下漏率超标的问题?”
“如何预防气瓶充气阀漏率超标的问题?”
“如何检查和维护阀门的密封性能?”
步骤7:接收用户反馈,用户可以在给出推荐结果后对推荐结果进行反馈,如点赞、不喜欢、重新生成、修正。
步骤8:提供用户反馈结果,对交互历史利用知识驱动推理进行知识抽取和融合。
基于上述推荐方法,可以形成推荐装置KDDIRM-LLM实现。
在发明实施例中,基于上述推荐方法在相同场景下与微软的Bing AI对比的结果,以验证本发明的推荐方法在工业领域业务知识推荐方面的有效性和优越性。
Bing AI是微软的聊天模式搜索引擎,是当前互联网中最先进的智能系统,它融合了Bing搜索引擎和ChatGPT的能力,相当于整个互联网都是Bing AI的知识库。Bing AI可以根据用户的输入,快速地从互联网上搜索和返回相关的信息,并交给ChatGPT作为回答的依据。
实验设置:
使用两个问题,分别对Bing AI和KDDIRM-LLM进行业务知识推荐。然后将推荐的结果交给专业的设计师,从满意度、可信度、可解释性3个方面进行评判。
问题1:总装测试时,助推模块气瓶充气阀低压下漏率超标。请问这一现象的故障原因可能是什么?
问题2:“总装测试时,助推模块气瓶充气阀低压下漏率超标,无法用气泡法检漏。经过分析,我们发现壳体活门座处存在机械性损伤,机械损伤痕迹边缘尖锐,导致阀芯密封面接触部位发生损伤。在充放气过程中,挤压痕损伤边缘应力集中区域在高压气体的冲刷下,逐渐发生破损,活门座与非金属成线形接触,无法弥补上述缺陷,当破损区域横跨密封压痕时发生泄漏失效。”请根据以上故障描述信息,推理出相应的解决方案和预防措施。
将本发明实施例的结果与Bing AI的结果进行了比较,其中图9a为Bing AI针对问题1的结果,图9b为本发明的KDDIRM-LLM针对问题1的结果,图10a为Bing AI针对问题2的结果,图10b为本发明的KDDIRM-LLM针对问题2的结果。
表2显示了本发明的KDDIRM-LLM与Bing AI在不同场景下的实验结果,从中可以看出,KDDIRM-LLM在所有场景和指标上都优于Bing AI,说明本发明的推荐方法可以有效地利用多模态知识图谱和大语言模型的优势,实现工业领域业务知识的自动化和智能化的推荐。
表2 实验结果
作为本发明的另一实施例,提供一种基于大语言模型的业务知识推荐装置,其中,包括:
接收模块,用于接收用户输入的业务知识需求信息;
意图识别模块,用于对所述业务知识需求信息进行意图识别以获得用户意图识别信息;
分析与检索模块,用于根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点;
生成模块,用于根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果;
输出模块,用于向用户输出所述知识推荐结果。
具体地,在本发明实施例中,如图11所示,为基于大语言模型的业务知识推荐装置的架构图,图12为图11的具体架构的工作流程图。根据该架构图中可知,基于大语言模型的业务知识推荐装置利用多模态知识图谱整合不同类型和层次的业务知识,利用大语言模型对其进行摘要、检索、生成和评价,从而实现业务知识的自动化和智能化的推荐。
基于大语言模型的业务知识推荐装置的主要组成部分有以下几个:
用户输入:用户输入是用户通过自然语言或多模态方式向该推荐装置提出的业务知识需求或兴趣,如关键词、问题、话题等。
意图识别模型:意图识别模型是用来理解用户的需求,将用户输入转换成为用户意图和主要对象。
多模态知识图谱:多模态知识图谱是推荐装置的知识源之一,它包含了不同类型和层次的业务知识,如概念、实例、属性等,以及与之对应的多模态数据,如文本、图像、视频等。本发明中通过知识和数据双驱动,可以持续对多模态知识图谱进行补充。
记忆库:记忆库是业务知识的主要来源,通过大语言模型自动学习企业私域数据进行不断的完善。本发明可以自动将企业积累的大量文档按照段落和图表的形式进行切分,并利用大语言模型对每个段落进行提问和总结等知识化操作,形成“知识点”或“待匹配问题”并存入记忆库中。
大语言模型:大语言模型是推荐装置的核心组件,它可以对多模态知识图谱和记忆库中的业务知识进行编码、解码、检索、生成等操作,从而实现业务知识的摘要、检索、生成和评价。
知识与数据双驱动:知识与数据双驱动是一种结合了知识驱动和数据驱动的方法,一方面可以利用数据驱动可以从多模态知识图谱中挖掘更多的知识点,另一方面可以利用知识驱动对多模态知识图谱进行补全。
用户输出:用户输出是推荐装置根据数据驱动推理和知识驱动推理的结果,利用大语言模型生成并返回给用户的业务知识推荐结果,如摘要、列表、文本等。
关于本发明提供的基于大语言模型的业务知识推荐装置的具体工作原理可以参照前文的基于大语言模型的业务知识推荐方法的描述,此处不再赘述。
作为本发明的另一实施例,提供一种电子设备,其中,包括存储器和处理器,所述存储器和处理器通信连接,所述存储器用于存储计算机指令,所述处理器用于加载并执行所述计算机指令以实现前文所述的基于大语言模型的业务知识推荐方法。
如图13所示,该电子设备80可以包括:至少一个处理器81,例如CPU(CentralProcessing Unit,中央处理器),至少一个通信接口83,存储器84,至少一个通信总线82。其中,通信总线82用于实现这些组件之间的连接通信。其中,通信接口83可以包括显示屏(Display)、键盘(Keyboard),可选通信接口83还可以包括标准的有线接口、无线接口。存储器84可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器84可选的还可以是至少一个位于远离前述处理器81的存储装置。其中,存储器84中存储应用程序,且处理器81调用存储器84中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线82可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线82可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器84可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器84还可以包括上述种类的存储器的组合。
其中,处理器81可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器81还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:genericarraylogic, 缩写:GAL)或其任意组合。
可选地,存储器84还用于存储程序指令。处理器81可以调用程序指令,实现如本发明图1实施例中所示的基于大语言模型的业务知识推荐方法。
作为本发明的另一实施例,提供一种存储介质,其中,包括计算机指令,所述计算机指令被处理器加载并执行时实现前文所述的基于大语言模型的业务知识推荐方法。
在本发明实施例中,提供了一种非暂态计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于大语言模型的业务知识推荐方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (9)

1.一种基于大语言模型的业务知识推荐方法,其特征在于,包括:
接收用户输入的业务知识需求信息;
对所述业务知识需求信息进行意图识别以获得用户意图识别信息;
根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点;
根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果;
向用户输出所述知识推荐结果;
其中,根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点,包括:
根据多模态知识图谱对所述用户意图识别信息进行特征关联分析以获得图谱推理相关业务知识;
根据所述用户意图识别信息通过记忆库进行检索以获得业务知识点和待匹配问题,并将所述业务知识点和待匹配问题作为大语言模型的输入提示信息;
将所述图谱推理相关业务知识和大语言模型的输入提示信息作为数据驱动相关知识点;
根据所述用户意图识别信息通过记忆库进行检索以获得业务知识点和待匹配问题,并将所述业务知识点和待匹配问题作为大语言模型的输入提示信息输入至大语言模型以获得大语言模型的相关知识点答复信息,包括:
根据所述用户意图识别信息中的关键词或实体在所述记忆库中检索相关知识点;
将所述业务知识需求信息在所述记忆库中进行相似性检索,以获得待匹配问题;
将所述相关知识点和所述待匹配问题组合后获得输入提示信息;
所述记忆库用于存储由业务知识形成的知识点和待匹配问题。
2.根据权利要求1所述的基于大语言模型的业务知识推荐方法,其特征在于,根据多模态知识图谱对所述用户意图识别信息进行特征关联分析以获得图谱推理相关业务知识,包括:
从多模态知识图谱中选择与所述用户意图识别信息关联的业务知识内容,所述业务知识内容包括业务知识实体、业务知识关系和业务知识属性;
对与所述用户意图识别信息关联的业务知识内容进行深度分析,以从所述多模态知识图谱中提取与所述用户意图识别信息存在关联的关系信息,其中所述关联关系包括因果关系、相关关系和干扰关系;
根据所述关系信息对所述用户意图识别信息进行挖掘和推理以获得图谱推理相关业务知识。
3.根据权利要求1或2所述的基于大语言模型的业务知识推荐方法,其特征在于,根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果,包括:
将所述数据驱动相关知识点输入至所述大语言模型,以获得知识推荐结果,其中所述大语言模型能够根据输入提示信息以及所述用户意图识别信息的相关知识点进行推理分析获得知识推荐结果。
4.根据权利要求3所述的基于大语言模型的业务知识推荐方法,其特征在于,所述大语言模型能够根据输入提示信息以及所述用户意图识别信息的相关知识点进行推理分析获得知识推荐结果,包括:
根据包括所述输入提示信息在内的交互历史进行实体和关系的抽取,获得实体和关系;
对所述实体和关系进行整合和推理,以获得实体和关系的隐含知识;
根据所述实体和关系的隐含知识以及所述知识库中与所述用户意图识别信息关联的相关知识点进行知识推理,获得与所述用户意图识别信息对应的解决方案;
将与所述用户意图识别信息对应的解决方案确定为知识推荐结果并输出所述知识推荐结果。
5.根据权利要求4所述的基于大语言模型的业务知识推荐方法,其特征在于,所述基于大语言模型的业务知识推荐方法,还包括:
将所述知识推荐结果添加至所述知识库中以实现多模态知识图谱补充。
6.根据权利要求1或2所述的基于大语言模型的业务知识推荐方法,其特征在于,所述基于大语言模型的业务知识推荐方法,还包括:
接收所述用户对所述知识推荐结果的反馈信息;
根据所述反馈信息重复执行生成知识推荐结果的过程。
7.一种基于大语言模型的业务知识推荐装置,用于实现权利要求1至6中任意一项所述的基于大语言模型的业务知识推荐方法,其特征在于,包括:
接收模块,用于接收用户输入的业务知识需求信息;
意图识别模块,用于对所述业务知识需求信息进行意图识别以获得用户意图识别信息;
分析与检索模块,用于根据所述用户意图识别信息通过知识库进行分析与检索以获得与所述用户意图识别信息对应的数据驱动相关知识点;
生成模块,用于根据大语言模型对所述数据驱动相关知识点进行处理以生成知识推荐结果;
输出模块,用于向用户输出所述知识推荐结果。
8.一种存储介质,其特征在于,包括计算机指令,所述计算机指令被处理器加载并执行时实现权利要求1至6中任意一项所述的基于大语言模型的业务知识推荐方法。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器和处理器通信连接,所述存储器用于存储计算机指令,所述处理器用于加载并执行所述计算机指令以实现权利要求1至6中任意一项所述的基于大语言模型的业务知识推荐方法。
CN202311096260.9A 2023-08-29 2023-08-29 基于大语言模型的业务知识推荐方法、装置及存储介质 Active CN116821318B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311096260.9A CN116821318B (zh) 2023-08-29 2023-08-29 基于大语言模型的业务知识推荐方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311096260.9A CN116821318B (zh) 2023-08-29 2023-08-29 基于大语言模型的业务知识推荐方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN116821318A CN116821318A (zh) 2023-09-29
CN116821318B true CN116821318B (zh) 2024-01-02

Family

ID=88126050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311096260.9A Active CN116821318B (zh) 2023-08-29 2023-08-29 基于大语言模型的业务知识推荐方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN116821318B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117371973A (zh) * 2023-12-06 2024-01-09 武汉科技大学 基于知识图谱检索增强的语言模型毕业生就业服务系统
CN117667979B (zh) * 2023-12-08 2024-07-05 暨南大学 基于大语言模型的数据挖掘方法、装置、设备及介质
CN117690604A (zh) * 2023-12-08 2024-03-12 浙江大学 一种基于大语言模型的糖尿病健康宣教和用药推荐系统
CN117407595B (zh) * 2023-12-14 2024-03-08 江西财经大学 融合大语言模型与动态对话意图的家装设计师推荐方法
CN117609433A (zh) * 2024-01-19 2024-02-27 深圳市活力天汇科技股份有限公司 信息推荐方法、装置、电子设备和计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210349925A1 (en) * 2020-05-08 2021-11-11 International Business Machines Corporation System and Method for Retrieving Results and Responses with Context Based Exclusion Criteria
CN116303980A (zh) * 2023-05-19 2023-06-23 无码科技(杭州)有限公司 一种大语言模型知识增强方法、系统、电子设备及介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210349925A1 (en) * 2020-05-08 2021-11-11 International Business Machines Corporation System and Method for Retrieving Results and Responses with Context Based Exclusion Criteria
CN116303980A (zh) * 2023-05-19 2023-06-23 无码科技(杭州)有限公司 一种大语言模型知识增强方法、系统、电子设备及介质

Also Published As

Publication number Publication date
CN116821318A (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
CN116821318B (zh) 基于大语言模型的业务知识推荐方法、装置及存储介质
CN109034203B (zh) 表情推荐模型的训练、表情推荐方法、装置、设备及介质
CN111708703A (zh) 测试案例集生成方法、装置、设备及计算机可读存储介质
CN110929038A (zh) 基于知识图谱的实体链接方法、装置、设备和存储介质
CN110909539A (zh) 语料库的词语生成方法、系统、计算机设备和存储介质
CN112100377B (zh) 文本分类方法、装置、计算机设备和存储介质
CN111563384A (zh) 面向电商产品的评价对象识别方法、装置及存储介质
CN116719520B (zh) 代码生成方法及装置
CN114722833B (zh) 一种语义分类方法及装置
CN118171149B (zh) 标签分类方法、装置、设备、存储介质和计算机程序产品
CN113505583A (zh) 基于语义决策图神经网络的情感原因子句对提取方法
CN115186085A (zh) 回复内容处理方法以及媒体内容互动内容的交互方法
CN116186237A (zh) 一种基于事件因果推断的实体关系的联合抽取方法
Rajanak et al. Language detection using natural language processing
CN112084788B (zh) 一种影像字幕隐式情感倾向自动标注方法及系统
CN113051910A (zh) 一种用于预测人物角色情绪的方法和装置
CN117077679A (zh) 命名实体识别方法和装置
CN117009516A (zh) 换流站故障策略模型训练方法、推送方法及装置
JP2007241881A (ja) 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
CN117216617A (zh) 文本分类模型训练方法、装置、计算机设备和存储介质
CN116975275A (zh) 多语种文本分类模型训练方法、装置和计算机设备
CN115203206A (zh) 数据内容搜索方法、装置、计算机设备及可读存储介质
US11605006B2 (en) Deep-learning model catalog creation
CN114254622A (zh) 一种意图识别方法和装置
CN113869043A (zh) 内容标注方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant