CN117591663A - 一种基于知识图谱的大模型prompt生成方法 - Google Patents

一种基于知识图谱的大模型prompt生成方法 Download PDF

Info

Publication number
CN117591663A
CN117591663A CN202410079312.XA CN202410079312A CN117591663A CN 117591663 A CN117591663 A CN 117591663A CN 202410079312 A CN202410079312 A CN 202410079312A CN 117591663 A CN117591663 A CN 117591663A
Authority
CN
China
Prior art keywords
entity
user
entities
model
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410079312.XA
Other languages
English (en)
Other versions
CN117591663B (zh
Inventor
周毅喆
李齐
唐小清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huayuan Technology Co ltd
Original Assignee
Beijing Huayuan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huayuan Technology Co ltd filed Critical Beijing Huayuan Technology Co ltd
Priority to CN202410079312.XA priority Critical patent/CN117591663B/zh
Publication of CN117591663A publication Critical patent/CN117591663A/zh
Application granted granted Critical
Publication of CN117591663B publication Critical patent/CN117591663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于计算机技术领域,本发明公开了一种基于知识图谱的大模型prompt生成方法;通过用户输入信息获取用户真实意图;根据用户真实意图生成系统响应文本,提取出用户输入信息的关键实体;将知识图谱中与关键实体匹配成功的实体标记为匹配实体;知识图谱包括实体、实体属性信息、实体间关系以及实体类型;根据实体间关系,获取知识图谱中与匹配实体存在实体间关系的实体,并标记为关系实体;再通过关系推理,获取知识图谱中与关系实体存在实体间关系的实体;不仅提高了大模型的性能,还使得其在不同领域和场景中具有更广泛的适用性。

Description

一种基于知识图谱的大模型prompt生成方法
技术领域
本发明涉及计算机技术领域,更具体地说,本发明涉及一种基于知识图谱的大模型prompt生成方法。
背景技术
随着人工智能和自然语言处理技术的快速发展,大语言模型在各领域的应用日益广泛;大语言模型通过对海量文本数据的学习,能够生成准确、流畅的自然语言文本,广泛用于对话系统、智能客服、文本摘要等领域;然而,传统的大语言模型在生成提示时仅局限于语言模式匹配,缺乏对语义和逻辑的深层理解,在生成提示时缺乏对常识的推理能力,并且难以做出符合实际逻辑和常识的提示,同时容易陷入信息孤岛,无法利用跨领域的知识进行提示生成;
当然也存在将知识图谱与大语言模型结合的智能方法,例如公开号为CN117056493A的专利公开了基于病历知识图谱的大语言模型医疗问答系统,包括网站爬取电子病历数据;从初始病历数据中提取出关键实体及其之间的关系;构建病历知识图谱;对用户的提问进行意图识别;在获取查询的实体信息后,将查询获得的实体与病历知识图谱中的结点信息进行匹配;通过意图识别确定决策方式;将得到的关键信息和用户的提问作为输入,共同提供给大语言模型,再利用prompt工程生成具有个性化风格的答复;通过集成大语言模型和知识图谱的方式,全面提升医疗问答系统的准确性和流畅性;
但上述技术意图识别能力较弱,仅能识别初诊、复诊、建议、查询这类意图,存在一定的限制性;并且在生成答复时,仅根据用户意图与知识图谱中的匹配节点的相关信息,导致答复的完整性不足以及知识的深度不足,无法根据用户意图作出详细和全面的答复;
鉴于此,本发明提出一种基于知识图谱的大模型prompt生成方法以解决上述问题。
发明内容
为了克服现有技术的上述缺陷,为实现上述目的,本发明提供如下技术方案:一种基于知识图谱的大模型prompt生成方法,包括:
步骤S1:通过用户输入信息获取用户真实意图;
步骤S2:根据用户真实意图生成系统响应文本,提取出用户输入信息的关键实体;
步骤S3:将提取出的关键实体与知识图谱中的实体进行匹配,将知识图谱中匹配成功的实体标记为匹配实体;知识图谱包括实体、实体属性信息、实体间关系以及实体类型;
步骤S4:根据实体间关系,获取知识图谱中与匹配实体存在实体间关系的实体,并标记为关系实体;再通过关系推理,获取知识图谱中与关系实体存在实体间关系的实体,并标记为次关系实体;
步骤S5:构建prompt模板,prompt模板包括用户真实意图、关键实体、实体间关系、关系实体以及次关系实体;
步骤S6:将构建的prompt模板输入预选的大模型,获取答复用户真实意图的答复数据。
进一步地,所述获取用户真实意图的方法包括:
步骤S101:对用户输入信息进行处理;
步骤S102:将用户输入信息进行多模态融合,将多模态融合后的用户输入信息标记为融合信息;
步骤S103:根据融合信息获取用户真实意图。
进一步地,所述用户输入信息包括文本数据、图像数据以及音频数据;
对文本数据进行处理的方法包括:
将文本数据进行分词操作;对词语进行停用词去除操作;对完成停用词去除操作后的词语进行词形还原,将不同形态的词汇还原为原始基本形式;
对图像数据进行处理的方法包括:
使用训练好的图像处理模型对图像数据进行分类和检测,获取有关图像内容的高级语义信息;高级语义信息包括物体识别、场景理解、物体之间的关系以及存在的情感;其中图像处理模型为卷积神经网络模型;通过卷积神经网络模型中的卷积和激活函数操作,将图像数据转换为中间层激活,将中间层激活作为特征向量;
对音频数据进行处理的方法包括:
使用训练好的音频处理模型将音频数据转换为文本数据,音频处理模型为循环神经网络模型;通过信号处理技术和音频分析算法提取音频数据中特征数据。
进一步地,所述多模态融合的方法包括:
步骤1:将文本数据、图像数据与音频数据进行对齐;
步骤2:将处理后的文本数据、图像数据对应的特征向量以及音频数据对应的特征数据进行特征融合,创建一个包含文本数据、图像数据以及音频数据的统一表示,即将文本数据、图像数据对应的特征向量以及音频数据对应的特征数据转换为一个统一的表示形式;
步骤3:分析文本数据、图像数据与音频数据之间的关联性。
进一步地,所述根据融合信息获取用户真实意图的方法包括:
将融合信息输入训练好的意图分析模型,获取用户真实意图;其中意图分析模型为支持向量机模型;用户真实意图为用户与系统交互时真正所要表达的意思或目的。
进一步地,所述系统响应文本包括系统对于用户真实意图的回答、建议和解决方案;
所述系统响应文本包括系统对于用户真实意图的回答、建议和解决方案;系统为与用户进行交互的系统;
使用自然语言生成技术根据用户真实意图生成系统响应文本;
自然语言生成技术由模版驱动或基于预训练的语言模型驱动,自然语言生成技术为NLG,NLG的原理包括:
模版驱动的NLG:
选择模版,,其中T为选择的模版,/>表示要选择的是使得概率/>最大的模版,I为用户真实意图,t为提供的t个模版;
填充模版,将用户真实意图通过填充函数填充进上述选择的模版,生成对应的系统响应文本,为,其中/>为系统响应文本,FillTemplate为填充函数,填充函数根据所使用的NLG工具和开发环境确定;
基于预训练语言模型驱动的NLG:
生成序列,,其中/>为用户真实意图下,生成文本序列的概率,XL为文本序列,/>为生成的文本序列中的第i个词,/>为生成的文本序列中第1个词到第i-1个词的子序列,/>为在用户真实意图和已生成子序列的条件下,预测下一个词/>出现的概率,n为文本序列中词的数量;
Top-k采样或束搜索,,其中/>表示要选择的是使得概率/>最大的文本序列作为系统响应文本。
进一步地,所述提取出用户输入信息的关键实体的方法包括:
步骤S201:将用户输入信息进行预处理;
步骤S202:将预处理后的用户输入信息输入训练好的实体提取模型,提取出用户输入信息的关键实体;
实体提取模型为BERT模型,BERT模型的原理为:
对于一个输入文本,首先将其分解为词语,然后将每个词语转化为其对应的嵌入向量;嵌入向量包括嵌入单词和嵌入句子位置;
嵌入单词Et为;其中/>为单词的嵌入矩阵,/>为原始单词的词向量;
嵌入句子位置Es为;其中/>为位置的嵌入矩阵,/>为原始单词在句子中的位置编码;
最终的输入表示为
BERT的核心是Transformer Encoder,由多个注意力头组成;输入表示Einput被输入到Transformer Encoder中,经过多层的自注意力机制和前馈网络,得到上下文丰富的输出表示;
为了适应特定任务,在BERT的输出上添加一个任务特定层;对于实体提取任务,可以使用一个全连接层Wner来预测每个单词是否是命名实体:并且根据任务要求,定义规则来标记和提取关键实体;
用户输入信息输入实体提取模型后,获取每个词语的标签,从标签中提取出带有实体标签的词语,标记为关键实体。
进一步地,知识图谱包括实体、实体属性信息、实体间关系以及实体类型;实体属性信息为描述实体属性的标签;实体间关系表示不同实体之间的语义联系,描述知识图谱中实体间的各种关联和相互作用;实体类型定义了实体所属的类别,并定义实体间的通用属性和关系;
将提取出的关键实体与知识图谱中的实体进行匹配的方法包括字符串匹配和语义匹配;字符串匹配包括精确匹配和近似匹配,精确匹配为将提取出的关键实体对应的字符串与知识图谱中实体对应的字符串进行对比,若完全相同,则进行匹配;近似匹配为使用字符串相似度算法,计算关键实体对应的字符串与知识图谱中实体对应的字符串之间的相似度,将相似度最高对应知识图谱中的实体与关键实体进行匹配;语义匹配为使用词嵌入方式;词嵌入方式通过词嵌入模型,将关键实体和知识图谱中的实体转换为向量形式,通过计算向量之间的相似性进行匹配;
匹配成功后,将两种方法获取到的匹配实体进行合并,并从知识图谱中获取匹配实体对应的实体属性信息。
进一步地,关系推理的方法包括规则推理、图算法推理以及模型推理;
规则推理为利用预先定义好的规则,通过逻辑推理发现新的关系;
图算法推理为使用图算法发现实体之间的潜在关系;
模型推理为使用图神经网络模型,从知识图谱中学习并推理出新的实体间关系;图神经网络模型的原理包括:
图结构表示:
对于一个图,其中V为节点集合,E为边集合,对于每一个节点/>都存在一个特征向量表示节点的特征信息;
消息传递:
图神经网络模型的核心是通过消息传递机制,使节点能够聚合相邻节点的信息,对于节点,接收到相邻节点/>的消息,更新节点/>对应的特征向量;
消息传递的过程包括两部分:以及/>,其中/>为节点/>在图神经网络中第/>个卷积层的特征向量,/>为节点/>的相邻节点集合,/>为连接节点/>和/>的边的特征向量,包括边的权重与类型信息;/>为聚合函数,将节点/>相邻节点的信息进行聚合,包括求和与平均,具体选择取决于任务和网络设计,/>为激活函数,/>为连接节点/>和/>的边在图神经网络中第/>个卷积层的特征向量;
节点的特征向量在图神经网络中每一个卷积层都进行更新,经过多个卷积层的消息传递获得包含多个节点对应的信息和上下文联系的特征向量;
关系推理:
通过学习到节点的特征向量和连接节点对应边的特征向量,进行关系推理。
进一步地,所述构建prompt模板的方法包括:
通过用户真实意图,以确定用户的主要意图或查询主题,并根据用户真实意图定制prompt模板;将用户输入信息中的关键实体整合到prompt模板中;在prompt模板中为实体间关系、关系实体和次关系实体引入占位符,占位符用于表示实体间关系、关系实体和次关系实体。
进一步地,大模型为大语言模型,支持与用户通过自然语言对话进行交互,处理多种自然语言任务;
将实体间关系、关系实体和次关系实体替换prompt模板中对应的占位符;在将构建的prompt模板输入预选的大模型前,保留与上下文相关的信息,包括在本次用户输入之前的用户输入信息以及对应的系统响应文本;在将构建的prompt模板输入预选的大模型后,根据用户真实意图调整temperature参数、top-k参数以及top-p参数;
对大模型生成的答复数据进行解码,包括处理答复数据的格式和去除不必要的词汇;将解码后的答复数据反馈给用户。
一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的一种基于知识图谱的大模型prompt生成方法。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被执行时实现所述的一种基于知识图谱的大模型prompt生成方法。
本发明一种基于知识图谱的大模型prompt生成方法的技术效果和优点:
通过知识图谱的支持,大模型能够更深入地理解用户提出的问题或需求,从而提供更准确、有针对性的答案或建议;利用知识图谱中的丰富信息,使得生成的Prompt更具专业性和权威性,满足用户对高质量信息的需求;通过与知识图谱的紧密结合,大模型的提示生成不仅局限于语言模式匹配,还能基于知识图谱的推理能力提供更有深度的提示,使得模型在处理复杂问题时能够更全面地考虑多个方面的知识;为了提高用户体验,生成的提示模板可以根据用户的反馈进行动态调整,以更好地满足用户的期望和需求;该方法不仅提高了大模型的性能,还使得其在不同领域和场景中具有更广泛的适用性,为用户提供更全面、个性化的服务;综合考虑用户的输入、知识图谱的丰富信息以及上下文的变化,使得生成的提示更具智能性和灵活性,能够更好地应对复杂多变的用户需求。
附图说明
图1为本发明实施例1的一种基于知识图谱的大模型prompt生成方法示意图;
图2为本发明实施例1的用户真实意图获取示意图;
图3为本发明实施例1的知识图谱实体匹配示意图;
图4为本发明实施例2的电子设备示意图;
图5为本发明实施例3的存储介质示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
请参阅图1所示,本实施例所述一种基于知识图谱的大模型prompt生成方法,包括:
步骤S1:通过用户输入信息获取用户真实意图;
请参阅图2所示,获取用户真实意图的方法包括:
步骤S101:对用户输入信息进行处理;
用户输入信息包括文本数据、图像数据以及音频数据;
对文本数据进行处理的方法包括:
将文本数据进行分词操作,将文本数据分解成独立的词语;对词语进行停用词去除操作,排除在语境中无实际意义的常见词语,以便关注更具有实际信息含量的词语;对完成停用词去除操作后的词语进行词形还原,将不同形态的词汇还原为原始基本形式,以便在后续分析中保持一致性;示例性的,将跑过还原为跑、将苹果们还原为苹果、将更大的还原为大;最后对词语进行词性标注,标注每个词语的词性,例如名词、动词、形容词等,有助于深入理解文本数据;
对图像数据进行处理的方法包括:
使用训练好的图像处理模型对图像数据进行分类和检测,获取有关图像内容的高级语义信息;高级语义信息包括物体识别、场景理解、物体之间的关系以及存在的情感;其中图像处理模型具体为卷积神经网络模型,卷积神经网络模型为现有技术,因此图像处理模型的训练过程在此不作过多赘述;通过卷积神经网络模型中的卷积和激活函数操作,将图像数据转换为中间层激活,将中间层激活作为特征向量,将特征向量进行提取有助于提高图像处理模型效率,能够更好的理解图像数据的内容,并且有助于将图像数据与整体语境进行嵌套,以理解整体场景和语境;
对音频数据进行处理的方法包括:
使用训练好的音频处理模型将音频数据转换为文本数据,音频处理模型具体为循环神经网络模型,循环神经网络模型为现有技术,因此音频处理模型的训练过程在此不作过多赘述;并且通过信号处理技术和音频分析算法提取音频数据中特征数据,例如音调、语速、频率等,有助于获取用户情感和语音特性的信息;信号处理技术为使用信号处理算法对音频信号进行数字化、滤波、编码解码、降噪提取等操作;音频分析算法例如傅里叶变换、时频分析、梅尔频率倒谱系数等;
步骤S102:将用户输入信息进行多模态融合,将多模态融合后的用户输入信息标记为融合信息;
多模态融合的方法包括:
步骤1:将文本数据、图像数据与音频数据进行对齐,确保在时间和语境上相互匹配;对齐的方法例如将文本数据中的时间戳、图像数据和音频数据中的时间标签进行对齐;
步骤2:将处理后的文本数据、图像数据对应的特征向量以及音频数据对应的特征数据进行特征融合,创建一个包含文本数据、图像数据以及音频数据的统一表示,即将文本数据、图像数据对应的特征向量以及音频数据对应的特征数据转换为一个统一的表示形式;特征融合的方法例如连接、组合、加权组合、特征映射等;
步骤3:分析文本数据、图像数据与音频数据之间的关联性,以了解潜在关系,例如文本数据中提到的实体是否在图像数据中可见,音频数据中的声音是否与图像数据中的场景相符等;实体为文本数据中具有特定意义和指代的实际对象和概念,例如人、地点、组织、日期、时间等,示例性的,句子“比尔盖茨是微软公司的创始人”,其中“比尔盖茨”和“微软公司”都是实体,“比尔盖茨”是人名实体,“微软公司”是组织机构实体;
步骤S103:根据融合信息获取用户真实意图;
将融合信息输入训练好的意图分析模型,获取用户真实意图;其中意图分析模型具体为支持向量机模型,支持向量机模型为现有技术,因此意图分析模型的训练过程在此不作过多赘述;用户真实意图即为用户与系统交互时真正所要表达的意思或目的,获取用户真实意图以便系统能够正确地响应和满足用户的需求,例如用户输入“预定餐厅”,真实意图可能是想要找到一个合适的餐厅并进行预订,通过意图分析模型,系统可以识别用户的真实意图并满足用户的需求;
步骤S2:根据用户真实意图生成系统响应文本,提取出用户输入信息的关键实体;
系统响应文本包括系统对于用户真实意图的回答、建议和解决方案;系统为与用户进行交互的系统;
使用自然语言生成技术根据用户真实意图生成系统响应文本;
自然语言生成技术可以由模版驱动或基于预训练的语言模型驱动,自然语言生成(NLG)技术的原理包括:
模版驱动的NLG:
选择模版,,其中T为选择的模版,/>表示要选择的是使得概率/>最大的模版,I为用户真实意图,t为提供的t个模版;
填充模版,将用户真实意图通过填充函数填充进上述选择的模版,生成对应的系统响应文本,具体为,其中/>为系统响应文本,FillTemplate为填充函数,具体的填充函数根据所使用的NLG工具和开发环境确定;
基于预训练语言模型驱动的NLG:
生成序列,,其中/>为用户真实意图下,生成文本序列的概率,XL为文本序列,/>为生成的文本序列中的第i个词,/>为生成的文本序列中第1个词到第i-1个词的子序列,/>为在用户真实意图和已生成子序列的条件下,预测下一个词/>出现的概率,n为文本序列中词的数量;
Top-k采样或束搜索,,其中/>表示要选择的是使得概率/>最大的文本序列作为系统响应文本;
提取关键实体的方法包括:
步骤S201:将用户输入信息进行预处理,预处理包括分词、词性标注等操作;
步骤S202:将预处理后的用户输入信息输入训练好的实体提取模型,提取出用户输入信息的关键实体;
实体提取模型具体为BERT模型,BERT模型的原理为:
对于一个输入文本,首先将其分解为词语,然后将每个词语转化为其对应的嵌入向量;嵌入向量包括嵌入单词和嵌入句子位置;
嵌入单词Et为;其中/>为单词的嵌入矩阵,/>为原始单词的词向量;
嵌入句子位置Es为;其中/>为位置的嵌入矩阵,/>为原始单词在句子中的位置编码;
最终的输入表示为
BERT的核心是Transformer Encoder,由多个注意力头组成;输入表示Einput被输入到Transformer Encoder中,经过多层的自注意力机制和前馈网络,得到上下文丰富的输出表示;
为了适应特定任务,在BERT的输出上添加一个任务特定层,例如全连接层;对于实体提取任务,可以使用一个全连接层Wner来预测每个单词是否是命名实体:并且根据任务的特定要求,定义规则来标记和提取关键实体,例如日期通常具有特定的格式,可以通过正则表达式进行匹配;
用户输入信息输入实体提取模型后,获取每个词语的标签,从标签中提取出带有实体标签的词语,标记为关键实体;
BERT模型为现有技术,因此实体提取模型的训练过程在此不作过多赘述;
步骤S3:将提取出的关键实体与知识图谱中的实体进行匹配,将知识图谱中匹配成功的实体标记为匹配实体;
知识图谱包括实体、实体属性信息、实体间关系以及实体类型;实体属性信息为描述实体属性的标签,例如以电影《Inception》作为实体,对应的属性信息为导演是Christopher Nolan、上映日期是2010年等;实体间关系表示不同实体之间的语义联系,描述了知识图谱中实体间的各种关联和相互作用,例如实体1为电影《Inception》,实体2为演员Leonardo DiCaprio,两个实体间的关系表示Leonardo DiCaprio是电影《Inception》的主演,建立了电影和演员间的关系;实体类型定义了实体所属的类别,用于组织知识图谱中的实体,并定义实体间的通用属性和关系,例如电影、演员、导演等;
知识图谱为现有技术,知识图谱的构建过程在此就不作过多赘述;
请参阅图3所示,将提取出的关键实体与知识图谱中的实体进行匹配的方法包括字符串匹配和语义匹配;字符串匹配包括精确匹配和近似匹配,精确匹配为将提取出的关键实体对应的字符串与知识图谱中实体对应的字符串进行对比,若完全相同,则进行匹配;近似匹配为使用字符串相似度算法(例如编辑距离、Jaccard相似度等)计算关键实体对应的字符串与知识图谱中实体对应的字符串之间的相似度,将相似度最高对应知识图谱中的实体与关键实体进行匹配;语义匹配为使用词嵌入方式;词嵌入方式通过词嵌入模型(例如Word2Vec、Glove)将关键实体和知识图谱中的实体转换为向量形式,通过计算向量之间的相似性进行匹配;
匹配成功后,将两种方法获取到的匹配实体进行合并,并从知识图谱中获取匹配实体对应的实体属性信息;
步骤S4:根据实体间关系,获取知识图谱中与匹配实体存在实体间关系的实体,并标记为关系实体;再通过关系推理,获取知识图谱中与关系实体存在实体间关系的实体,并标记为次关系实体;
关系推理的方法包括规则推理、图算法推理以及模型推理;
规则推理为利用预先定义好的规则,通过逻辑推理发现新的关系,例如A和B有相同的朋友,B和C也有相同的朋友,那么A和C之间也存在关系;
图算法推理为使用图算法发现实体之间的潜在关系,例如图遍历算法、最短路径算法等,最短路径算法又例如使用深度优先搜索或广度优先搜索获取两个实体间的最短路径,最短路径可以揭示实体之间最短通信或最短连接方式,从而表示实体之间的关系紧密程度;
模型推理为使用图神经网络模型,从知识图谱中学习并推理出新的实体间关系;图神经网络模型的原理包括:
图结构表示:
对于一个图,其中V为节点集合,E为边集合,对于每一个节点/>都存在一个特征向量表示节点的特征信息;
消息传递:
图神经网络模型的核心是通过消息传递机制,使节点能够聚合相邻节点的信息,对于节点,接收到相邻节点/>的消息,更新节点/>对应的特征向量;
消息传递的过程包括两部分:以及/>,其中/>为节点/>在图神经网络中第/>个卷积层的特征向量,/>为节点/>的相邻节点集合,/>为连接节点/>和/>的边的特征向量,包括边的权重与类型信息;/>为聚合函数,将节点/>相邻节点的信息进行聚合,包括求和与平均,具体选择取决于任务和网络设计,/>为激活函数,/>为连接节点/>和/>的边在图神经网络中第/>个卷积层的特征向量;
节点的特征向量在图神经网络中每一个卷积层都进行更新,经过多个卷积层的消息传递获得包含多个节点对应的信息和上下文联系的特征向量;
关系推理:
通过学习到节点的特征向量和连接节点对应边的特征向量,进行关系推理,例如进行分类、回归等任务;
需要说明的是,进行关系推理以获取更为完整的语境,用于提供更深入的响应,更好地满足用户需求;
步骤S5:构建prompt模板,prompt模板包括用户真实意图、关键实体、实体间关系、关系实体以及次关系实体;
构建prompt模板的方法包括:
通过用户真实意图,以确定用户的主要意图或查询主题,例如天气查询、事件了解等,并根据用户真实意图定制prompt模板,例如若用户真实意图为天气查询,则prompt模板可以包含时间、地点等信息;若用户真实意图为事件了解,则prompt模板可以包含事件名称、事件、地点等信息;将用户输入信息中的关键实体整合到prompt模板中,以保留用户输入信息中的语境和信息;在prompt模板中为实体间关系、关系实体和次关系实体引入占位符,占位符用于表示实体间关系、关系实体和次关系实体;
prompt模板是一种结构化的输入形式,用于引导语言模型执行特定任务,生成特定类型的文本输出;在自然语言处理中,特定任务的prompt模板通常用于向模型提供输入,以促使其生成符合特定要求的文本;对话系统中的prompt模板可能更加复杂,可以包括上下文对话历史、用户意图、系统先前的答复等信息,以引导模型生成自然而连贯的回复;
步骤S6:将构建的prompt模板输入预选的大模型,获取答复用户真实意图的答复数据;
大模型为大语言模型,支持与用户通过自然语言对话进行交互,处理多种自然语言任务;例如对话聊天、智能问答、创作文章、创作剧本、事件抽取、生成代码等;预选的大模型例如Chatglm、Baichuan等,这些大模型能够很好地处理自然语言生成任务;
将实体间关系、关系实体和次关系实体替换prompt模板中对应的占位符,例如将占位符{city}替换为实际的城市名称;在将构建的prompt模板输入预选的大模型前,保留与上下文相关的信息,包括在本次用户输入之前的用户输入信息以及对应的系统响应文本;在将构建的prompt模板输入预选的大模型后,根据用户真实意图调整temperature参数、top-k参数以及top-p参数,较高的temperature参数会使得大模型生成的答复数据更加多样化,而较低的temperature参数则会使得大模型生成的答复数据更加保守;top-k参数和top-p参数可以控制生成的答复数据中词汇的选择范围;
对大模型生成的答复数据进行解码,包括处理答复数据的格式、去除不必要的词汇等;将解码后的答复数据反馈给用户,以对用户真实意图进行答复及建议;
需要说明的是,在每次用户与大模型进行交互时,prompt模板中包括的用户真实意图,关键实体、实体间关系、关系实体以及次关系实体都是动态更新的,以确保与用户的对话保持一致,并根据用户的反馈不断优化生成的答复数据;
本实施例通过知识图谱的支持,大模型能够更深入地理解用户提出的问题或需求,从而提供更准确、有针对性的答案或建议;利用知识图谱中的丰富信息,使得生成的Prompt更具专业性和权威性,满足用户对高质量信息的需求;通过与知识图谱的紧密结合,大模型的提示生成不仅局限于语言模式匹配,还能基于知识图谱的推理能力提供更有深度的提示,使得模型在处理复杂问题时能够更全面地考虑多个方面的知识;为了提高用户体验,生成的提示模板可以根据用户的反馈进行动态调整,以更好地满足用户的期望和需求;该方法不仅提高了大模型的性能,还使得其在不同领域和场景中具有更广泛的适用性,为用户提供更全面、个性化的服务;综合考虑用户的输入、知识图谱的丰富信息以及上下文的变化,使得生成的提示更具智能性和灵活性,能够更好地应对复杂多变的用户需求。
实施例2:
请参阅图4所示,根据本申请的又一方面还提供了电子设备500。该电子设备500可包括一个或多个处理器以及一个或多个存储器。其中,存储器中存储有计算机可读代码,计算机可读代码当由一个或多个处理器运行时,可以执行如上所述的一种基于知识图谱的大模型prompt生成方法。
根据本申请实施方式的方法或系统也可以借助于图4所示的电子设备的架构来实现。如图4所示,电子设备500可包括总线501、一个或多个CPU502、只读存储器(ROM)503、随机存取存储器(RAM)504、连接到网络的通信端口505、输入/输出506、硬盘507等。电子设备500中的存储设备,例如ROM503或硬盘507可存储本申请提供的一种基于知识图谱的大模型prompt生成方法。进一步地,电子设备500还可包括用户界面508。当然,图4所示的架构只是示例性的,在实现不同的设备时,根据实际需要,可以省略图4示出的电子设备中的一个或多个组件。
实施例3:
请参阅图5所示,是根据本申请一个实施方式的计算机可读存储介质600。计算机可读存储介质600上存储有计算机可读指令。当计算机可读指令由处理器运行时,可执行参照以上附图描述的根据本申请实施方式的一种基于知识图谱的大模型prompt生成方法。存储介质600包括但不限于例如易失性存储器和/或非易失性存储器。易失性存储器例如可包括随机存取存储器(RAM)和高速缓冲存储器(cache)等。非易失性存储器例如可包括只读存储器(ROM)、硬盘、闪存等。
另外,根据本申请的实施方式,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请提供了非暂时性机器可读存储介质,所述非暂时性机器可读存储介质存储有机器可读指令,所述机器可读指令能够由处理器运行以执行与本申请提供的方法步骤对应的指令,例如:一种基于知识图谱的大模型prompt生成方法。在该计算机程序被中央处理单元(CPU)执行时,执行本申请的方法中限定的上述功能。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线网络或无线网络方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本发明中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种基于知识图谱的大模型prompt生成方法,其特征在于,包括:
步骤S1:通过用户输入信息获取用户真实意图;
步骤S2:根据用户真实意图生成系统响应文本,提取出用户输入信息的关键实体;
步骤S3:将提取出的关键实体与知识图谱中的实体进行匹配,将知识图谱中匹配成功的实体标记为匹配实体;知识图谱包括实体、实体属性信息、实体间关系以及实体类型;
步骤S4:根据实体间关系,获取知识图谱中与匹配实体存在实体间关系的实体,并标记为关系实体;再通过关系推理,获取知识图谱中与关系实体存在实体间关系的实体,并标记为次关系实体;
步骤S5:构建prompt模板,prompt模板包括用户真实意图、关键实体、实体间关系、关系实体以及次关系实体;
步骤S6:将构建的prompt模板输入预选的大模型,获取答复用户真实意图的答复数据。
2.根据权利要求1所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,所述获取用户真实意图的方法包括:
步骤S101:对用户输入信息进行处理;
步骤S102:将用户输入信息进行多模态融合,将多模态融合后的用户输入信息标记为融合信息;
步骤S103:根据融合信息获取用户真实意图。
3.根据权利要求2所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,所述用户输入信息包括文本数据、图像数据以及音频数据;
对文本数据进行处理的方法包括:
将文本数据进行分词操作;对词语进行停用词去除操作;对完成停用词去除操作后的词语进行词形还原,将不同形态的词汇还原为原始基本形式;
对图像数据进行处理的方法包括:
使用训练好的图像处理模型对图像数据进行分类和检测,获取有关图像内容的高级语义信息;高级语义信息包括物体识别、场景理解、物体之间的关系以及存在的情感;其中图像处理模型为卷积神经网络模型;通过卷积神经网络模型中的卷积和激活函数操作,将图像数据转换为中间层激活,将中间层激活作为特征向量;
对音频数据进行处理的方法包括:
使用训练好的音频处理模型将音频数据转换为文本数据,音频处理模型为循环神经网络模型;通过信号处理技术和音频分析算法提取音频数据中特征数据。
4.根据权利要求3所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,所述多模态融合的方法包括:
步骤1:将文本数据、图像数据与音频数据进行对齐;
步骤2:将处理后的文本数据、图像数据对应的特征向量以及音频数据对应的特征数据进行特征融合,创建一个包含文本数据、图像数据以及音频数据的统一表示,即将文本数据、图像数据对应的特征向量以及音频数据对应的特征数据转换为一个统一的表示形式;
步骤3:分析文本数据、图像数据与音频数据之间的关联性。
5.根据权利要求4所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,所述根据融合信息获取用户真实意图的方法包括:
将融合信息输入训练好的意图分析模型,获取用户真实意图;其中意图分析模型为支持向量机模型;用户真实意图为用户与系统交互时真正所要表达的意思或目的。
6.根据权利要求5所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,所述系统响应文本包括系统对于用户真实意图的回答、建议和解决方案;
系统为与用户进行交互的系统;
使用自然语言生成技术根据用户真实意图生成系统响应文本;
自然语言生成技术由模版驱动或基于预训练的语言模型驱动,自然语言生成技术为NLG,NLG的原理包括:
模版驱动的NLG:
选择模版,,其中T为选择的模版,/>表示要选择的是使得概率/>最大的模版,I为用户真实意图,t为提供的t个模版;
填充模版,将用户真实意图通过填充函数填充进所述选择的模版,生成对应的系统响应文本,为,其中/>为系统响应文本,FillTemplate为填充函数,填充函数根据所使用的NLG工具和开发环境确定;
基于预训练语言模型驱动的NLG:
生成序列,,其中/>为用户真实意图下,生成文本序列的概率,XL为文本序列,/>为生成的文本序列中的第i个词,/>为生成的文本序列中第1个词到第i-1个词的子序列,/>为在用户真实意图和已生成子序列的条件下,预测下一个词/>出现的概率,n为文本序列中词的数量;
Top-k采样或束搜索,,其中/>表示要选择的是使得概率/>最大的文本序列作为系统响应文本。
7.根据权利要求6所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,所述提取出用户输入信息的关键实体的方法包括:
步骤S201:将用户输入信息进行预处理;
步骤S202:将预处理后的用户输入信息输入训练好的实体提取模型,提取出用户输入信息的关键实体;
实体提取模型为BERT模型,BERT模型的原理为:
对于一个输入文本,首先将其分解为词语,然后将每个词语转化为其对应的嵌入向量;嵌入向量包括嵌入单词和嵌入句子位置;
嵌入单词Et为;其中/>为单词的嵌入矩阵,/>为原始单词的词向量;
嵌入句子位置Es为;其中/>为位置的嵌入矩阵,/>为原始单词在句子中的位置编码;
最终的输入表示为
BERT的核心是Transformer Encoder,由多个注意力头组成;输入表示Einput被输入到Transformer Encoder中,经过多层的自注意力机制和前馈网络,得到上下文丰富的输出表示;
为了适应特定任务,在BERT的输出上添加一个任务特定层;对于实体提取任务,使用一个全连接层Wner来预测每个单词是否是命名实体,并且根据任务要求,定义规则来标记和提取关键实体;
用户输入信息输入实体提取模型后,获取每个词语的标签,从标签中提取出带有实体标签的词语,标记为关键实体。
8.根据权利要求7所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,知识图谱包括实体、实体属性信息、实体间关系以及实体类型;实体属性信息为描述实体属性的标签;实体间关系表示不同实体之间的语义联系,描述知识图谱中实体间的各种关联和相互作用;实体类型定义了实体所属的类别,并定义实体间的通用属性和关系;
将提取出的关键实体与知识图谱中的实体进行匹配的方法包括字符串匹配和语义匹配;字符串匹配包括精确匹配和近似匹配,精确匹配为将提取出的关键实体对应的字符串与知识图谱中实体对应的字符串进行对比,若完全相同,则进行匹配;近似匹配为使用字符串相似度算法,计算关键实体对应的字符串与知识图谱中实体对应的字符串之间的相似度,将相似度最高对应知识图谱中的实体与关键实体进行匹配;语义匹配为使用词嵌入方式;词嵌入方式通过词嵌入模型,将关键实体和知识图谱中的实体转换为向量形式,通过计算向量之间的相似性进行匹配;
匹配成功后,将两种方法获取到的匹配实体进行合并,并从知识图谱中获取匹配实体对应的实体属性信息。
9.根据权利要求8所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,关系推理的方法包括规则推理、图算法推理以及模型推理;
规则推理为利用预先定义好的规则,通过逻辑推理发现新的关系;
图算法推理为使用图算法发现实体之间的潜在关系;
模型推理为使用图神经网络模型,从知识图谱中学习并推理出新的实体间关系;图神经网络模型的原理包括:
图结构表示:
对于一个图,其中V为节点集合,E为边集合,对于每一个节点/>都存在一个特征向量表示节点的特征信息;
消息传递:
图神经网络模型的核心是通过消息传递机制,使节点能够聚合相邻节点的信息,对于节点,接收到相邻节点/>的消息,更新节点/>对应的特征向量;
消息传递的过程包括两部分:以及/>,其中/>为节点/>在图神经网络中第/>个卷积层的特征向量,/>为节点/>的相邻节点集合,/>为连接节点/>和/>的边的特征向量,包括边的权重与类型信息;/>为聚合函数,将节点/>相邻节点的信息进行聚合,包括求和与平均,具体选择取决于任务和网络设计,/>为激活函数,/>为连接节点/>和/>的边在图神经网络中第/>个卷积层的特征向量;
节点的特征向量在图神经网络中每一个卷积层都进行更新,经过多个卷积层的消息传递获得包含多个节点对应的信息和上下文联系的特征向量;
关系推理:
通过学习到节点的特征向量和连接节点对应边的特征向量,进行关系推理。
10.根据权利要求9所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,所述构建prompt模板的方法包括:
通过用户真实意图,以确定用户的主要意图或查询主题,并根据用户真实意图定制prompt模板;将用户输入信息中的关键实体整合到prompt模板中;在prompt模板中为实体间关系、关系实体和次关系实体引入占位符,占位符用于表示实体间关系、关系实体和次关系实体。
11.根据权利要求10所述的一种基于知识图谱的大模型prompt生成方法,其特征在于,大模型为大语言模型,支持与用户通过自然语言对话进行交互,处理多种自然语言任务;
将实体间关系、关系实体和次关系实体替换prompt模板中对应的占位符;在将构建的prompt模板输入预选的大模型前,保留与上下文相关的信息,包括在本次用户输入之前的用户输入信息以及对应的系统响应文本;在将构建的prompt模板输入预选的大模型后,根据用户真实意图调整temperature参数、top-k参数以及top-p参数;
对大模型生成的答复数据进行解码,将解码后的答复数据反馈给用户。
12.一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-11任一项所述的一种基于知识图谱的大模型prompt生成方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被执行时实现权利要求1-11任一项所述的一种基于知识图谱的大模型prompt生成方法。
CN202410079312.XA 2024-01-19 2024-01-19 一种基于知识图谱的大模型prompt生成方法 Active CN117591663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410079312.XA CN117591663B (zh) 2024-01-19 2024-01-19 一种基于知识图谱的大模型prompt生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410079312.XA CN117591663B (zh) 2024-01-19 2024-01-19 一种基于知识图谱的大模型prompt生成方法

Publications (2)

Publication Number Publication Date
CN117591663A true CN117591663A (zh) 2024-02-23
CN117591663B CN117591663B (zh) 2024-05-17

Family

ID=89913785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410079312.XA Active CN117591663B (zh) 2024-01-19 2024-01-19 一种基于知识图谱的大模型prompt生成方法

Country Status (1)

Country Link
CN (1) CN117591663B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114064931A (zh) * 2021-11-29 2022-02-18 新疆大学 一种基于多模态知识图谱的急救知识问答方法及系统
CN114491077A (zh) * 2022-02-15 2022-05-13 平安科技(深圳)有限公司 文本生成方法、装置、设备及介质
CN115982337A (zh) * 2023-02-07 2023-04-18 北京智谱华章科技有限公司 一种在线对话中面向事务办理的意图识别方法
CN116821373A (zh) * 2023-07-07 2023-09-29 平安科技(深圳)有限公司 基于图谱的prompt推荐方法、装置、设备及介质
CN117056493A (zh) * 2023-09-07 2023-11-14 四川大学 基于病历知识图谱的大语言模型医疗问答系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114064931A (zh) * 2021-11-29 2022-02-18 新疆大学 一种基于多模态知识图谱的急救知识问答方法及系统
CN114491077A (zh) * 2022-02-15 2022-05-13 平安科技(深圳)有限公司 文本生成方法、装置、设备及介质
CN115982337A (zh) * 2023-02-07 2023-04-18 北京智谱华章科技有限公司 一种在线对话中面向事务办理的意图识别方法
CN116821373A (zh) * 2023-07-07 2023-09-29 平安科技(深圳)有限公司 基于图谱的prompt推荐方法、装置、设备及介质
CN117056493A (zh) * 2023-09-07 2023-11-14 四川大学 基于病历知识图谱的大语言模型医疗问答系统

Also Published As

Publication number Publication date
CN117591663B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
CN108984683B (zh) 结构化数据的提取方法、系统、设备及存储介质
US20230015665A1 (en) Multi-turn dialogue response generation with template generation
CN110301117B (zh) 用于在会话中提供响应的方法和装置
WO2019153737A1 (zh) 用于对评论进行评估的方法、装置、设备和存储介质
US11425064B2 (en) Customized message suggestion with user embedding vectors
CN110414004B (zh) 一种核心信息提取的方法和系统
CN113836277A (zh) 用于数字助理的机器学习系统
CN110442859B (zh) 标注语料生成方法、装置、设备及存储介质
CN111738016A (zh) 多意图识别方法及相关设备
CN113704460B (zh) 一种文本分类方法、装置、电子设备和存储介质
CN111462752B (zh) 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN110795913A (zh) 一种文本编码方法、装置、存储介质及终端
CN116304748A (zh) 一种文本相似度计算方法、系统、设备及介质
US20230350929A1 (en) Method and system for generating intent responses through virtual agents
CN113705207A (zh) 语法错误识别方法及装置
CN116595994A (zh) 基于提示学习的矛盾信息预测方法、装置、设备及介质
CN117591663B (zh) 一种基于知识图谱的大模型prompt生成方法
CN116127013A (zh) 一种个人敏感信息知识图谱查询方法和装置
CN114722832A (zh) 一种摘要提取方法、装置、设备以及存储介质
CN114281948A (zh) 一种纪要确定方法及其相关设备
Windiatmoko et al. Mi-Botway: A deep learning-based intelligent university enquiries chatbot
Adewumi Vector representations of idioms in data-driven chatbots for robust assistance
CN117874261B (zh) 基于课程学习的问答式事件抽取方法以及相关设备
US11934794B1 (en) Systems and methods for algorithmically orchestrating conversational dialogue transitions within an automated conversational system
CN111368526B (zh) 一种序列标注方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant