CN116821373A - 基于图谱的prompt推荐方法、装置、设备及介质 - Google Patents
基于图谱的prompt推荐方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116821373A CN116821373A CN202310834806.XA CN202310834806A CN116821373A CN 116821373 A CN116821373 A CN 116821373A CN 202310834806 A CN202310834806 A CN 202310834806A CN 116821373 A CN116821373 A CN 116821373A
- Authority
- CN
- China
- Prior art keywords
- node
- promt
- atlas
- map
- prompt
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000001228 spectrum Methods 0.000 claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000005457 optimization Methods 0.000 claims abstract description 20
- 239000013598 vector Substances 0.000 claims description 81
- 230000015654 memory Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 9
- 239000004973 liquid crystal related substance Substances 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 206010011224 Cough Diseases 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 241000220259 Raphanus Species 0.000 description 2
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 206010062717 Increased upper airway secretion Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 208000026435 phlegm Diseases 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Abstract
本发明涉及人工智能及数字医疗技术,揭露了一种基于图谱的prompt推荐方法,包括:根据预设prompt提示库及预训练语言模型集构建图谱集;将外部知识数据转换为预设格式知识信息,利用预设格式知识信息对图谱集进行知识增强,得到增强图谱集;对增强图谱集进行图谱学习,得到优化图谱集;根据用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。本发明还提出一种基于图谱的prompt推荐装置、电子设备以及存储介质。本发明可以提高医疗领域问诊平台中医疗问答模型对应的prompt生成和优化质量及效率。
Description
技术领域
本发明涉及人工智能及数字医疗技术领域,尤其涉及一种基于图谱的prompt推荐方法、装置、电子设备及计算机可读存储介质。
背景技术
prompt学习是一种利用预训练语言模型(Pre-trained Language Model,简称PLM)来完成不同任务的方法,无需对PLM进行重新训练或微调,prompt学习的核心是设计合适的prompt,prompt为一种特定的输入格式,用于引导PLM产生期望的输出,例如在医疗问诊平台的在线问诊功能中,由于专业医生资源有限,大部分医疗问题集中在如感冒发烧等常见问题,这些常见医疗问题已有回答非常具有参考意义,通过分析已有的医疗问答数据来对患者提出的问题做出一个快速反馈回答以供患者参考,可以利用预训练语言模型(PLM)来完成,利用prompt学习的方法减少模型的训练成本和数据需求。
目前已经有一些开源框架和工具提供了prompt学习的实现和支持,如OpenPrompt等,这些框架和工具通常提供了一些预定义或手工制作的prompt,以供用户选择或修改,也通常提供了一些方法或接口来自动或半自动地生成或优化prompt,如基于梯度下降、强化学习、元学习等,当前这些方式生成和优化prompt的方法不够智能化和灵活化,导致prompt的质量和生成效率不高。
发明内容
本发明提供一种基于图谱的prompt推荐方法、装置及计算机可读存储介质,其主要目的在于解决医疗领域问诊平台中医疗问答模型对应的prompt生成和优化质量及效率较低的问题。
为实现上述目的,本发明提供的一种基于图谱的prompt推荐方法,包括:
获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;
获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;
对所述增强图谱集进行图谱学习,得到优化图谱集;
获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。
可选地,所述根据所述预设prompt提示库及所述预训练语言模型集构建图谱集,包括:
将所述预设prompt提示库中prompt作为prompt节点;
将语言模型集中预训练语言模型作为PLM节点;
提取所述prompt节点对应的prompt与所述PLM节点对应的PLM关系,将所述prompt与所述PLM关系作为prompt-PLM边;
提取各个prompt节点之间的关系,并将各个prompt节点之间的关系的作为prompt-prompt边;
根据所述prompt节点、所述PLM节点、所述prompt-PLM边及所述prompt-prompt边,利用预设图谱绘制工具构建图谱集。
可选地,所述将所述外部知识数据转换为预设格式知识信息,包括:
从所述知识数据中提取与预设prompt提示库中prompt相关的文本信息;
抽取所述文本信息中的实体词汇、实体词汇属性、关系词汇及关系词汇属性;
将所述实体词汇、所述实体词汇属性、所述关系词汇及所述关系词汇属性构建为预设格式为三元组的知识信息。
可选地,所述利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集,包括:
将所述预设格式知识信息中的所述实体词汇、所述实体词汇属性与所述图谱集中的节点及节点对应的属性进行匹配,得到实体匹配度及属性匹配度;
将所述实体匹配度及所述属性匹配度大于或等于预设匹配阈值的实体词汇及实体词汇属性与所述图谱集中的节点进行对齐;
将所述实体匹配度及所述属性匹配度小于所述预设匹配阈值的实体词汇及实体词汇属性作为所述图谱集中对应图谱的新节点,并将所述实体词汇对应的所述关系词汇、所述关系词汇属作为新边添加到对应图谱中,得到增强图谱集。
可选地,所述对所述增强图谱集进行图谱学习,得到优化图谱集,包括:
对所述增强图谱集中各个图谱对应边及节点进行编码,得到节点特征向量集及边特征向量集;
随机选取所述节点特征向量集中一个节点特征向量作为第一起始节点特征向量,根据所述第一起始节点特征向量对应的边特征向量,对所述第一起始节点特征向量进行信息传递,得到动态向量特征;
利用所述动态向量特征更新与所述边特征向量对应的下一节点特征向量,直至对应图谱中所有节点特征向量更新完毕,得到更新图谱;
随机选取所述更新图谱中一个节点特征向量作为第二起始特征向量,根据所述第二起始特征向量、对应的节点属性及对应的边特征向量预测下一节点的属性及对应边的属性,直至对应图谱中所有节点及边的属性预测完毕,得到优化图谱。
可选地,所述根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt,包括:
计算所述用户输入信息与所述优化图谱集的节点及边的语义相似度,得到节点相似度得分及边相似度得分;
根据所述用户输入信息及所述优化图谱集中节点及边的属性,构建图查询语句,根据图查询语句查询查询所述优化图谱集,得到prompt候选集;
识别所述用户输入信息的需求及偏好;
根据所述需求、所述偏好、所述节点相似度得分及所述边相似度得分对所述prompt候选集进行排序,得到prompt排序集;
对所述用户输入信息进行意图识别,得到所述用户的目标,根据所述目标从所述prompt排序集中匹配最优prompt。
可选地,所述计算所述用户输入信息与所述优化图谱集的节点语义相似度,得到节点相似度得分,包括:
对所述用户输入信息进行分词,得到输入分词序列;
将所述输入分词序列进行向量转换,得到用户特征向量序列;
提取所述优化图谱集中各个节点的节点特征向量;
计算所述用户特征向量序列中各个用户特征向量与所述节点特征向量的语义相似度,得到节点相似度得分。
为了解决上述问题,本发明还提供一种基于图谱的prompt推荐装置,所述装置包括:
图谱构建模块,用于获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;
图谱增强模块,用于获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;
图谱优化模块,用于对所述增强图谱集进行图谱学习,得到优化图谱集;
图谱推荐模块,用于获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的基于图谱的prompt推荐方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于图谱的prompt推荐方法。
本发明实施例通过根据所述预设prompt提示库及所述预训练语言模型集构建图谱集,将prompt、预训练语言模型(PLM)表示为节点,将prompt之间的关系、prompt与PLM之间的关系表示为边,prompt与预训练语言模型(PLM)关联性强,使得推荐的prompt质量更高;进一步,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集,实现图谱集的扩充,丰富了图谱集的prompt及相关属性的内容及表达,使得prompt更加完善、质量更高;更进一步,对所述增强图谱集进行图谱学习,得到优化图谱集,使得图谱更加准确,提高在线问诊功能的预训练语言模型对应的prompt及相关属性的质量及效率;最后,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt,快速为用户提供合适的prompt及对应属性,提升了prompt获取的效率。因此本发明提出的基于图谱的prompt推荐方法、装置、电子设备及计算机可读存储介质,可以解决医疗领域问诊平台中医疗问答模型对应的prompt生成和优化质量及效率较低的问题。
附图说明
图1为本发明一实施例提供的基于图谱的prompt推荐方法的流程示意图;
图2为图1所示基于图谱的prompt推荐方法中其中一个步骤的详细实施流程示意图;
图3为图1所示基于图谱的prompt推荐方法中其中另一个步骤的详细实施流程示意图;
图4为本发明一实施例提供的基于图谱的prompt推荐装置的功能模块图;
图5为本发明一实施例提供的实现所述基于图谱的prompt推荐方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于图谱的prompt推荐方法。所述基于图谱的prompt推荐方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于图谱的prompt推荐方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于图谱的prompt推荐方法的流程示意图。在本实施例中,所述基于图谱的prompt推荐方法包括:
S1、获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集。
本发明实施例中,所述预设prompt提示库为文本分类、文本生成、文本摘要等自然语言处理任务对应的prompt。
本发明实施例中,所述预训练语言模型是在大规模语料库上以自监督方式进行训练语言模型。所述预训练语言模型可以用于文本分类、文本生成、文本摘要、问答系统等,可以利用prompt学习的方式减少模型的训练成本和数据需求。
详细地,S1中所述根据所述预设prompt提示库及所述预训练语言模型集构建图谱集,包括:
将所述预设prompt提示库中prompt作为prompt节点;
将语言模型集中预训练语言模型作为PLM节点;
提取所述prompt节点对应的prompt与所述PLM节点对应的PLM关系,将所述prompt与所述PLM关系作为prompt-PLM边;
提取各个prompt节点之间的关系,并将各个prompt节点之间的关系的作为prompt-prompt边;
根据所述prompt节点、所述PLM节点、所述prompt-PLM边及所述prompt-prompt边,利用预设图谱绘制工具构建图谱集。
本发明实施例中,所述图谱集中图谱由节点及边构成,包括prompt节点、PLM节点、prompt-PLM边及prompt-prompt边。
本发明其中一实施例中,所述prompt节点表示一个特定的prompt,包含但不限于如下属性:(1)id,即表示该prompt节点在图中的唯一标识符。(2)task_type,即表示该prompt所对应的任务类型,如在医疗问诊平台中分析已有的医疗问答数据来对患者提出的问题做出一个快速反馈回答以供患者参考的问答任务类型等。(3)domain,即表示该prompt所对应的领域或主题,如自然语言处理、计算机视觉、医疗健康等。(4)template,即表示该prompt所采用的输入格式或模式,可以是固定或动态的。例如,“What is the capitalof[MASK]?”就是一个固定的模板,“[MASK]is a type of[MASK].”就是一个动态的模板。(5)initialization,即表示该prompt所采用的初始化策略或方法,可以是随机或有监督的。例如,“[CLS][MASK][SEP]”就是一个随机的初始化,“[CLS]The answer is[MASK].[SEP]”就是一个有监督的初始化。(6)verbalization,即表示该prompt所采用的语义化策略或方法,可以是显式或隐式的。例如,“[CLS]The answer is[MASK].[SEP]”就是一个显式的语义化,“[CLS][MASK][SEP]”就是一个隐式的语义化。
本发明其中一实施例中,所述PLM节点表示一个特定的预训练语言模型,包含但不限于如下属性(1)id,即表示该PLM节点在图中的唯一标识符。(2)name,即表示该PLM节点所对应的PLM名称或代号,如BERT,GPT-3,XLNet等。(3)size,即表示该PLM节点所对应的PLM的规模或参数量,如base,large,xlarge等。(4)architecture,即表示该PLM节点所对应的PLM的架构或模型类型,如Transformer,RNN,CNN等。(5)pretraining_data,即表示该PLM节点所对应的PLM的预训练数据来源或类型,如Wikipedia,Common Crawl,BooksCorpus等。(6)pretraining_objective,即表示该PLM节点所对应的PLM的预训练目标或损失函数,如Masked Language Modeling,Next Sentence Prediction,Causal Language Modeling等。
本发明其中一实施例中,所述prompt-PLM边表示一个特定的prompt与一个特定的PLM之间的关系,包含但不限于如下属性:(1)id,即表示该prompt-PLM边在图中的唯一标识符。(2)source,即表示该prompt-PLM边的源节点,即prompt节点。(3)target,即表示该prompt-PLM边的目标节点,即PLM节点。(4)compatibility,即表示该prompt与该PLM之间的兼容性或适配性,可以是二元或连续的。例如,“1”表示完全兼容,“0”表示完全不兼容,“0.8”表示较高兼容性。(5)performance,即表示该prompt在该PLM上的性能或表现,可以是多种指标或评价方法。例如,“0.9”表示准确率,“0.8”表示F1分数,“0.7”表示BLEU分数等。
本发明其中一实施例中,所述prompt-prompt边表示两个特定的prompt之间的关系,包含但不限于以下属性:(1)id,即表示该prompt-prompt边在图中的唯一标识符。(2)source,即表示该prompt-prompt边的源节点,即prompt节点。(3)target,即表示该prompt-prompt边的目标节点,即prompt节点。(4)similarity,即表示两个prompt之间的相似度或距离,可以是多种度量或计算方法。例如,“0.9”表示余弦相似度,“0.8”表示欧氏距离,“0.7”表示编辑距离等。(5)transformability,即表示两个prompt之间的转换性或可变性,可以是多种规则或算法。例如,“[MASK]is a type of[MASK].”.可以通过替换“is”为“are”来转换为“[MASK]are a type of[MASK].”。
本发明实施例中,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集,将prompt、预训练语言模型(PLM)表示为节点,将prompt之间的关系、prompt与PLM之间的关系表示为边,prompt与预训练语言模型(PLM)关联性强,使得推荐的prompt质量更高。
S2、获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集。
本发明实施例中,所述外部知识数据可以为百科、文献中与医疗问答相关的数据。
本发明实施例中,预设格式知识信息可以三元组格式或键值对格式等格式的知识信息。
详细地,S2中所述将所述外部知识数据转换为预设格式知识信息,包括:
从所述知识数据中提取与预设prompt提示库中prompt相关的文本信息;
抽取所述文本信息中的实体词汇、实体词汇属性、关系词汇及关系词汇属性;
将所述实体词汇、所述实体词汇属性、所述关系词汇及所述关系词汇属性构建为预设格式为三元组的知识信息。
进一步地,参阅图2所示,S2中所述利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集,包括:
S21、将所述预设格式知识信息中的所述实体词汇、所述实体词汇属性与所述图谱集中的节点及节点对应的属性进行匹配,得到实体匹配度及属性匹配度;
S22、将所述实体匹配度及所述属性匹配度大于或等于预设匹配阈值的实体词汇及实体词汇属性与所述图谱集中的节点进行对齐;
S23、将所述实体匹配度及所述属性匹配度小于所述预设匹配阈值的实体词汇及实体词汇属性作为所述图谱集中对应图谱的新节点,并将所述实体词汇对应的所述关系词汇、所述关系词汇属作为新边添加到对应图谱中,得到增强图谱集。
本发明其中一实施例中,所述实体词汇为“咳嗽”、“白萝卜”所述实体词汇属性为“有痰”、关系词汇为“建议的食物”及关系词汇属性“有益”。所述实体词汇为“咳嗽”可以添加到“感冒”对应图谱中作为新的节点,“咳嗽”与“白萝卜”的边为“建议的食物”,边属性为“有益”。
本发明实施例中,利用外部知识数据对所述图谱集进行知识增强,实现图谱集的扩充,丰富了图谱集的prompt及相关属性的内容及表达,使得prompt更加完善、质量更高。
S3、对所述增强图谱集进行图谱学习,得到优化图谱集。
详细地,参阅图3所示,所述S3包括:
S31、对所述增强图谱集中各个图谱对应边及节点进行编码,得到节点特征向量集及边特征向量集;
S32、随机选取所述节点特征向量集中一个节点特征向量作为第一起始节点特征向量,根据所述第一起始节点特征向量对应的边特征向量,对所述第一起始节点特征向量进行信息传递,得到动态向量特征;
S33、利用所述动态向量特征更新与所述边特征向量对应的下一节点特征向量,直至对应图谱中所有节点特征向量更新完毕,得到更新图谱;
S34、随机选取所述更新图谱中一个节点特征向量作为第二起始特征向量,根据所述第二起始特征向量、对应的节点属性及对应的边特征向量预测下一节点的属性及对应边的属性,直至对应图谱中所有节点及边的属性预测完毕,得到优化图谱。
本发明实施例中,可以利用深度神经网络(deep neural network),如图卷积网络(graph convolutional network)、图注意力网络(graph attention network)、图变分自编码器(graph variational autoencoder)等机器学习的方法对所述增强图谱集中各个图谱对应边及节点进行编码,得到节点特征向量集及边特征向量集。
本发明实施例中,可以利用深度神经网络(deep neural network),如循环神经网络(recurrent neural network)、长短期记忆网络(long short-term memory network)、门控循环单元网络(gated recurrent unit network)等机器学习的方法,对图谱(graph)中的节点(node)和边(edge)进行信息传递和状态更新,得到动态向量特征,进一步可以将所述动态向量特征与所述边特征向量对应的下一节点特征向量进行拼接,更新下一节点特征向量。
本发明实施例中,可以利用利用深度神经网络(deep neural network),如多层感知器(multilayer perceptron)、全连接网络(fully connected network)、残差网络(residual network)等机器学习的方法,根据所述第二起始特征向量、对应的节点属性及对应的边特征向量预测下一节点的属性及对应边的属性。
本发明实施例中,对于PLM节点,可以预测PLM节点的名称、规模、架构、预训练数据、预训练目标等属性;对于prompt-PLM边,可以预测其兼容性、性能等关系;对于prompt-prompt边,可以预测其相似度、转换性等属性。
本发明实施例中,对所述增强图谱集进行节点(node)和边(edge)进行编码、更新及预测的图谱学习,得到优化图谱集,提高在线问诊功能的预训练语言模型对应的prompt及相关属性的质量及效率。
S4、获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。
本发明实施例中,所述用户输入信息为用户根据自身需求输入的信息,包括但不限于任务描述、数据样例等。
详细地,S4中所述根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt,包括:
计算所述用户输入信息与所述优化图谱集的节点及边的语义相似度,得到节点相似度得分及边相似度得分;
根据所述用户输入信息及所述优化图谱集中节点及边的属性,构建图查询语句,根据图查询语句查询查询所述优化图谱集,得到prompt候选集;
识别所述用户输入信息的需求及偏好;
根据所述需求、所述偏好、所述节点相似度得分及所述边相似度得分对所述prompt候选集进行排序,得到prompt排序集;
对所述用户输入信息进行意图识别,得到所述用户的目标,根据所述目标从所述prompt排序集中匹配最优prompt。
本发明实施例中,可以利用意图识别模型识别用户输入信息的需求及偏好,所述意图识别模型可以基于规则模板或者深度学习等方法构建。
进一步地,所述计算所述用户输入信息与所述优化图谱集的节点语义相似度,得到节点相似度得分,包括:
对所述用户输入信息进行分词,得到输入分词序列;
将所述输入分词序列进行向量转换,得到用户特征向量序列;
提取所述优化图谱集中各个节点的节点特征向量;
计算所述用户特征向量序列中各个用户特征向量与所述节点特征向量的语义相似度,得到节点相似度得分。
本发明实施例中,可以利用余弦相似度计算所述用户特征向量序列中各个用户特征向量与所述节点特征向量的语义相似度,得到节点相似度得分。
本发明实施例中,将所述用户输入信息与所述优化图谱集进行匹配,并对图谱中的节点、边进行查询或排序,从排序结果中推荐最优的prompt,快速的为医疗领域问诊平台中医疗问答模型提供合适的prompt及对应属性。
本发明实施例通过根据所述预设prompt提示库及所述预训练语言模型集构建图谱集,将prompt、预训练语言模型(PLM)表示为节点,将prompt之间的关系、prompt与PLM之间的关系表示为边,prompt与预训练语言模型(PLM)关联性强,使得推荐的prompt质量更高;进一步,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集,实现图谱集的扩充,丰富了图谱集的prompt及相关属性的内容及表达,使得prompt更加完善、质量更高;更进一步,对所述增强图谱集进行图谱学习,得到优化图谱集,使得图谱更加准确,提高在线问诊功能的预训练语言模型对应的prompt及相关属性的质量及效率;最后,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt,快速为模型提供合适的prompt及对应属性,提升了prompt获取的效率。因此本发明提出的基于图谱的prompt推荐方法,可以解决医疗领域问诊平台中医疗问答模型对应的prompt生成和优化质量及效率。
如图4所示,是本发明一实施例提供的基于图谱的prompt推荐装置的功能模块图。
本发明所述基于图谱的prompt推荐装置100可以安装于电子设备中。根据实现的功能,所述基于图谱的prompt推荐装置100可以包括图谱构建模块101、图谱增强模块102、图谱优化模块103及图谱推荐模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述图谱构建模块101,用于获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;
所述图谱增强模块102,用于获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;
所述图谱优化模块103,用于对所述增强图谱集进行图谱学习,得到优化图谱集;
所述图谱推荐模块104,用于获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。
详细地,本发明实施例中所述基于图谱的prompt推荐装置100中所述的各模块在使用时采用与上述图1至图3中所述的基于图谱的prompt推荐方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图5所示,是本发明一实施例提供的实现基于图谱的prompt推荐方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于图谱的prompt推荐程序。
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing Unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行基于图谱的prompt推荐程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于图谱的prompt推荐程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线12可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
所述通信接口13用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于图谱的prompt推荐程序是多个指令的组合,在所述处理器10中运行时,可以实现:
获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;
获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;
对所述增强图谱集进行图谱学习,得到优化图谱集;
获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;
获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;
对所述增强图谱集进行图谱学习,得到优化图谱集;
获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于图谱的prompt推荐方法,其特征在于,所述方法包括:
获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;
获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;
对所述增强图谱集进行图谱学习,得到优化图谱集;
获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。
2.如权利要求1所述的基于图谱的prompt推荐方法,其特征在于,所述根据所述预设prompt提示库及所述预训练语言模型集构建图谱集,包括:
将所述预设prompt提示库中prompt作为prompt节点;
将语言模型集中预训练语言模型作为PLM节点;
提取所述prompt节点对应的prompt与所述PLM节点对应的PLM关系,将所述prompt与所述PLM关系作为prompt-PLM边;
提取各个prompt节点之间的关系,并将各个prompt节点之间的关系的作为prompt-prompt边;
根据所述prompt节点、所述PLM节点、所述prompt-PLM边及所述prompt-prompt边,利用预设图谱绘制工具构建图谱集。
3.如权利要求1所述的基于图谱的prompt推荐方法,其特征在于,所述将所述外部知识数据转换为预设格式知识信息,包括:
从所述知识数据中提取与预设prompt提示库中prompt相关的文本信息;
抽取所述文本信息中的实体词汇、实体词汇属性、关系词汇及关系词汇属性;
将所述实体词汇、所述实体词汇属性、所述关系词汇及所述关系词汇属性构建为预设格式为三元组的知识信息。
4.如权利要求3所述的基于图谱的prompt推荐方法,其特征在于,所述利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集,包括:
将所述预设格式知识信息中的所述实体词汇、所述实体词汇属性与所述图谱集中的节点及节点对应的属性进行匹配,得到实体匹配度及属性匹配度;
将所述实体匹配度及所述属性匹配度大于或等于预设匹配阈值的实体词汇及实体词汇属性与所述图谱集中的节点进行对齐;
将所述实体匹配度及所述属性匹配度小于所述预设匹配阈值的实体词汇及实体词汇属性作为所述图谱集中对应图谱的新节点,并将所述实体词汇对应的所述关系词汇、所述关系词汇属作为新边添加到对应图谱中,得到增强图谱集。
5.如权利要求1所述的基于图谱的prompt推荐方法,其特征在于,所述对所述增强图谱集进行图谱学习,得到优化图谱集,包括:
对所述增强图谱集中各个图谱对应边及节点进行编码,得到节点特征向量集及边特征向量集;
随机选取所述节点特征向量集中一个节点特征向量作为第一起始节点特征向量,根据所述第一起始节点特征向量对应的边特征向量,对所述第一起始节点特征向量进行信息传递,得到动态向量特征;
利用所述动态向量特征更新与所述边特征向量对应的下一节点特征向量,直至对应图谱中所有节点特征向量更新完毕,得到更新图谱;
随机选取所述更新图谱中一个节点特征向量作为第二起始特征向量,根据所述第二起始特征向量、对应的节点属性及对应的边特征向量预测下一节点的属性及对应边的属性,直至对应图谱中所有节点及边的属性预测完毕,得到优化图谱。
6.如权利要求1所述的基于图谱的prompt推荐方法,其特征在于,所述根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt,包括:
计算所述用户输入信息与所述优化图谱集的节点及边的语义相似度,得到节点相似度得分及边相似度得分;
根据所述用户输入信息及所述优化图谱集中节点及边的属性,构建图查询语句,根据图查询语句查询查询所述优化图谱集,得到prompt候选集;
识别所述用户输入信息的需求及偏好;
根据所述需求、所述偏好、所述节点相似度得分及所述边相似度得分对所述prompt候选集进行排序,得到prompt排序集;
对所述用户输入信息进行意图识别,得到所述用户的目标,根据所述目标从所述prompt排序集中匹配最优prompt。
7.如权利要求6所述的基于图谱的prompt推荐方法,其特征在于,所述计算所述用户输入信息与所述优化图谱集的节点语义相似度,得到节点相似度得分,包括:
对所述用户输入信息进行分词,得到输入分词序列;
将所述输入分词序列进行向量转换,得到用户特征向量序列;
提取所述优化图谱集中各个节点的节点特征向量;
计算所述用户特征向量序列中各个用户特征向量与所述节点特征向量的语义相似度,得到节点相似度得分。
8.一种基于图谱的prompt推荐装置,其特征在于,所述装置包括:
图谱构建模块,用于获取预设prompt提示库及对应的预训练语言模型集,根据所述预设prompt提示库及所述预训练语言模型集构建图谱集;
图谱增强模块,用于获取外部知识数据,将所述外部知识数据转换为预设格式知识信息,利用所述预设格式知识信息对所述图谱集进行知识增强,得到增强图谱集;
图谱优化模块,用于对所述增强图谱集进行图谱学习,得到优化图谱集;
图谱推荐模块,用于获取用户输入信息,根据所述用户输入信息从所述优化图谱集中匹配出所述用户输入信息对应的最优prompt。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于图谱的prompt推荐方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于图谱的prompt推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310834806.XA CN116821373A (zh) | 2023-07-07 | 2023-07-07 | 基于图谱的prompt推荐方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310834806.XA CN116821373A (zh) | 2023-07-07 | 2023-07-07 | 基于图谱的prompt推荐方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116821373A true CN116821373A (zh) | 2023-09-29 |
Family
ID=88120119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310834806.XA Pending CN116821373A (zh) | 2023-07-07 | 2023-07-07 | 基于图谱的prompt推荐方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116821373A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117591663A (zh) * | 2024-01-19 | 2024-02-23 | 北京华源技术有限公司 | 一种基于知识图谱的大模型prompt生成方法 |
-
2023
- 2023-07-07 CN CN202310834806.XA patent/CN116821373A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117591663A (zh) * | 2024-01-19 | 2024-02-23 | 北京华源技术有限公司 | 一种基于知识图谱的大模型prompt生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020258487A1 (zh) | 一种问答关系排序方法、装置、计算机设备及存储介质 | |
CN113378970B (zh) | 语句相似性检测方法、装置、电子设备及存储介质 | |
CN114077841A (zh) | 基于人工智能的语义提取方法、装置、电子设备及介质 | |
CN113705191A (zh) | 样本语句的生成方法、装置、设备及存储介质 | |
CN113821622B (zh) | 基于人工智能的答案检索方法、装置、电子设备及介质 | |
CN115730597A (zh) | 多级语义意图识别方法及其相关设备 | |
CN116821373A (zh) | 基于图谱的prompt推荐方法、装置、设备及介质 | |
CN113360654B (zh) | 文本分类方法、装置、电子设备及可读存储介质 | |
CN113344125B (zh) | 长文本匹配识别方法、装置、电子设备及存储介质 | |
CN114840684A (zh) | 基于医疗实体的图谱构建方法、装置、设备及存储介质 | |
CN112395432B (zh) | 课程推送方法、装置、计算机设备及存储介质 | |
CN113918704A (zh) | 基于机器学习的问答方法、装置、电子设备及介质 | |
CN116662488A (zh) | 业务文档检索方法、装置、设备及存储介质 | |
CN116450829A (zh) | 医疗文本分类方法、装置、设备及介质 | |
CN116628162A (zh) | 语义问答方法、装置、设备及存储介质 | |
CN114548114B (zh) | 文本情绪识别方法、装置、设备及存储介质 | |
CN116340516A (zh) | 实体关系的聚类提取方法、装置、设备及存储介质 | |
CN116450916A (zh) | 基于定段分级的信息查询方法、装置、电子设备及介质 | |
CN113722477B (zh) | 基于多任务学习的网民情绪识别方法、系统及电子设备 | |
CN112529743B (zh) | 合同要素抽取方法、装置、电子设备及介质 | |
CN113419951B (zh) | 人工智能模型优化方法、装置、电子设备及存储介质 | |
CN115309865A (zh) | 基于双塔模型的交互式检索方法、装置、设备及存储介质 | |
CN113157865B (zh) | 跨语言词向量生成方法、装置、电子设备及存储介质 | |
CN113656703B (zh) | 基于新上线课程的智能推荐方法、装置、设备及存储介质 | |
CN116451647A (zh) | 文本的标点修正方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |