CN116450867B - 一种基于对比学习和大语言模型的图数据语义搜索方法 - Google Patents
一种基于对比学习和大语言模型的图数据语义搜索方法 Download PDFInfo
- Publication number
- CN116450867B CN116450867B CN202310706047.9A CN202310706047A CN116450867B CN 116450867 B CN116450867 B CN 116450867B CN 202310706047 A CN202310706047 A CN 202310706047A CN 116450867 B CN116450867 B CN 116450867B
- Authority
- CN
- China
- Prior art keywords
- text
- graph
- graph data
- data
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 239000013598 vector Substances 0.000 claims abstract description 75
- 238000012549 training Methods 0.000 claims abstract description 43
- 230000004927 fusion Effects 0.000 claims abstract description 21
- 238000004590 computer program Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012423 maintenance Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于对比学习和大语言模型的图数据语义搜索方法。该方法包括:获取用户问题的关键文本;基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据;利用大语言模型对所述目标图数据进行文本重构,得到所述目标图数据的重构文本;所述重构文本和所述目标图数据的语义相同;将所述重构文本确定为所述用户问题的语义搜索结果;其中,所述多模语义相似模型通过对比学习的训练方法,对多模态的图向量和文本向量融合训练得到。本发明实施例可以降低运维难度,提高答案搜索的准确性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于对比学习和大语言模型的图数据语义搜索方法。
背景技术
很多企业由于业务积累都有很多的图数据存在图数据库中,而这些积累的图数据都可以作为业务经验,在未来遇到相关业务问题时提供帮助,但如何对图数据进行语义问答一直是一个热门的研究问题。
当前的一些解决方案都是通过机器学习模型结合规则将用户问题进行处理后,对图数据进行检索得到答案,但由于文字的博大精深,用户输入问题的用词和话术是千奇百怪的,这时就会存在准确率变低的问题。
发明内容
本发明提供了一种基于对比学习和大语言模型的图数据语义搜索方法,以降低运维难度,提高答案搜索的准确性。
根据本发明的一方面,提供了一种基于对比学习和大语言模型的图数据语义搜索方法,包括:
获取用户问题的关键文本;
基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据;
利用大语言模型对所述目标图数据进行文本重构,得到所述目标图数据的重构文本;所述重构文本和所述目标图数据的语义相同;
将所述重构文本确定为所述用户问题的语义搜索结果;
其中,所述多模语义相似模型通过对比学习的训练方法,对多模态的图向量和文本向量融合训练得到。
根据本发明的另一方面,提供了一种基于对比学习和大语言模型的图数据语义搜索装置,包括:
关键文本获取模块,用于获取用户问题的关键文本;
目标图数据获取模块,用于基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据;
重构文本确定模块,用于利用大语言模型对所述目标图数据进行文本重构,得到所述目标图数据的重构文本;所述重构文本和所述目标图数据的语义相同;
第一答案确定模块,用于将所述重构文本确定为所述用户问题的语义搜索结果;
其中,所述多模语义相似模型通过对比学习的训练方法,对多模态的图向量和文本向量融合训练得到。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的基于对比学习和大语言模型的图数据语义搜索方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的基于对比学习和大语言模型的图数据语义搜索方法。
本发明实施例通过大语言模型和多模语义相似模型配合使用,来从图数据库中确定用户问题的语义搜索结果,语义搜索系统架构简单,降低运维难度;同时预先训练多模语义相似模型,当用户问题输入到多模语义相似模型后就会得到目标图数据,这样当用户输入问题的话术变更后也能准确找到相关的答案,解决了输入问题话术调整导致的答案不准确问题。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是根据本发明一实施例提供的一种基于对比学习和大语言模型的图数据语义搜索方法的流程图;
图1B是根据本发明一实施例提供的一种多模语义相似模型训练过程的示意图;
图1C是根据本发明一实施例提供的一种多模语义相似模型训练数据的构建流程图;
图1D是根据本发明一实施例提供的一实施例提供的多模语义相似模型使用过程的示意图;
图2A是根据本发明又一实施例提供的一种基于对比学习和大语言模型的图数据语义搜索方法的流程图;
图2B是根据本发明又一实施例提供的一种语义搜索系统的示意图;
图3是根据本发明又一实施例提供的一种基于对比学习和大语言模型的图数据语义搜索装置的结构示意图;
图4是实现本发明实施例的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为进一步明确本发明的技术效果,在引入具体实施例之前,对现有技术进一步做如下说明。
现有技术通常会包含多个步骤,并且系统设计的十分复杂,比如包含步骤:分析查询、确定查询意图、查询知识图谱、推理与排序。每一步骤都是一个复杂的系统,如分析查询通常涉及到对查询进行分词、词性标注、句法分析和语义分析等处理,确定查询意图是核心部分,通常会利用深度学习的方法和规则结合识别出查询的意图。查询知识图谱这一步骤主要是对识别得到的查询意图转换为可执行的查询语句并检索出查询结果。在获得了查询结果之后,搜索引擎可以使用推理技术根据查询结果中实体之间的关系,生成更多的相关实体和关系。然后,搜索引擎可以对查询结果进行排序,以便将最相关的结果展示给用户。推理和排序可以使用多种算法和技术来实现,包括规则库、机器学习和基于知识图谱的推理等。
相应的缺点一是由于涉及的模块较多,运维复杂,牵一发而动全身,当数据发生改动时需要调整多个模块;二是无法应对任意不同话术的问题,有时可能仅几个字的改动就会导致无法得到准确的结果。
而本发明一方面语义搜索系统架构简单,仅包含大语言模型和多模语义相似模型两大模块,所以相应的运维变得简单,难度下降;另一方面通过设计多模语义相似模型,令文本语义向量空间和图向量空间互相融合,互相包含了语义信息和图结构信息,当用户问题输入到多模语义相似模型后就会得到相关的图数据,这样当用户输入问题的话术变更后也能准确找到相关的答案,即解决了输入问题话术调整导致的答案不准确问题。
图1A为本发明一实施例提供的一种基于对比学习和大语言模型的图数据语义搜索方法的流程图,本实施例可适用于对任意问法的用户问题,在图数据库中搜索匹配的目标图数据,并重构为自然语言的形式返答案给用户情况,该方法可以由基于对比学习和大语言模型的图数据语义搜索装置来执行,该装置可以采用硬件和/或软件的形式实现,该装置可配置于具备相应输出能力的电子设备中,如语义搜索系统。如图1A所示,该方法包括:
S110、获取用户问题的关键文本。
S120、基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据。
其中,多模语义相似模型通过对比学习的训练方法,对多模态的图向量和文本向量融合训练得到,实质为提前训练好的机器学习模型。对比学习为一种深度学习方法,本发明中利用对比学习的训练方法做结构化图数据(图向量)和非结构化文本数据(文本向量)之间的融合训练。
具体的,用户输入问题后,对用户问题的完整文本信息进行关键信息抽取,得到关键文本,关键文本可以为一个或多个搜索关键词。将关键文本输入多模语义相似模型,多模语义相似模型对关键文本进行语义分析,并从图数据库中确定一个或多个与关键文本语义相似的图数据,作为目标图数据输出。
可选的,所述关键文本为一个或多个搜索关键词。
具体的,为降低多模语义相似模型对用户问题的语义分析难度,可以通过大语言模型等方式,获取用户问题的一个或多个搜索关键词,作为关键文本输入多模语义相似模型。
S130、利用大语言模型对所述目标图数据进行文本重构,得到所述目标图数据的重构文本;
S140、将所述重构文本确定为所述用户问题的语义搜索结果。
其中,重构文本和目标图数据的语义相同。大语言模型(Large LanguageModelsAn lntroduction,LLM)指包括chatGPT在内的语言模型,这类模型能够辅助很多自然语言处理的相关任务。
具体的,图数据的数据形式决定了目标图数据不适合直接作为用户问题的语义搜索结果,返回给用户。为此,将目标图数据输入大语言模型,并在输入前向大语言模型给出文本重构提示,大语言模型根据文本重构提示,将被输入的目标图数据重构为自然流畅的重构文本,并将重构文本作为输出结果输出,重构文本和目标图数据的语义始终一致。重构文本作为自然流畅的文本内容,便于用户明确搜索结果,因而将重构文本作为用户问题的语义搜索结果,来返回给用户,该语义搜索结果通常经过简单处理后,便可作为用户问题的答案。
本发明实施例通过大语言模型和多模语义相似模型配合使用,来从图数据库中确定用户问题的语义搜索结果,语义搜索系统架构简单,降低运维难度;同时预先训练多模语义相似模型,当用户问题输入到多模语义相似模型后就会得到目标图数据,这样当用户输入问题的话术变更后也能准确找到相关的答案,解决了输入问题话术调整导致的答案不准确问题。
可选的,所述获取用户问题的关键文本之后,还包括:
若基于多模语义相似模型,未从图数据库获取到与所述关键文本匹配的目标图数据,则根据所述大语言模型确定所述用户问题的语义搜索结果。
具体的,对于用户问题,如果其关键文本与图数据库中的各候选图数据的相似度都难以满足匹配标准,便可确定图数据库不存在用户问题的对应答案。这种情况下,可以直接将用户问题或其关键文本输入大语言模型,并通过问题回答提示,使大语言模型自行确定并输出用户问题的语义搜索结果。
可选的,基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据之前,还包括:
获取图数据库中的样本图数据的推测问题;将所述样本图数据和对应的所述推测问题的文本数据确定为正样本,并将所述样本图数据和其他样本图数据的推测问题确定为负样本;通过所述正样本和所述负样本对图编码器和文本编码器融合训练,得到多模语义相似模型。
其中,多模语义相似模型的结构包括文本编码器和图编码器,文本数据都可以通过文本编码器得到文本向量,图数据都可以通过图编码器得到图向量。
具体的,获取样本图数据,并推测可能以样本图数据作为问题答案的推测问题。对于每一个样本图数据,均进行上述流程,得到各样本图数据的推测问题,每个样本图数据对应的推测问题数量为一个或多个。对于任一图数据,将该图数据和该图数据对应推测问题的文本数据确定为正样本,将该图数据和其他图数据对应推测问题的文本数据确定为负样本。如图1B所述的多模语义相似模型训练过程的示意图,训练过程的训练目标是令正样本的图向量和文本向量的相似度最大,负样本的图向量和文本向量的相似度最小,以该训练目标来联合训练文本编码器和图编码器的参数,实现图编码器和文本编码器的互相融合,这即为本发明对比学习的训练方法。训练结束后,图编码器得到的图向量不仅包含图结构信息还包含文本语义信息,文本编码器得到的文本向量不仅包含文本语义信息,还包含了图结构的信息,并且互为正样本的图数据和文本数据进行编码后得到的图向量和文本向量计算相似度后相似度最大,互为负样本的图数据和文本数据进行编码后得到的图向量和文本向量计算相似度后相似度最小。
可选的,所述获取图数据库中的样本图数据的推测问题包括:
基于预设的问题推测提示,将样本图数据输入大语言模型,推测得到以所述样本图数据为答案的推测问题。
其中,Prompt(Prompting,提示)是大语言模型使用上的重要组成部分。Prompt是一种输入方式,它将大语言模型的输入限制在一个特定的范围内,从而更好地控制模型的输出。在大语言模型中,Prompt技术可用于对大语言模型进行微调和优化,从而使其更适合某些特定的任务。
具体的,如图1C所示的多模语义相似模型训练数据的构建流程图,对于样本图数据对应推测问题的生成,可以借助大语言模型实现。将所有的图数据和图模式数据分别输入给大语言模型,并向大语言模型给出问题推测提示,如“当用户提了一个问题,搜索引擎返回数据是[样本图数据1],那么请给出10个可能的提问”,以借助大语言模型生成相关的问题或关键词,大模型输出的10个预测问题的文本数据与样本图数据1是正样本,与其余样本图数据(样本图数据2、…、样本图数据N)都是负样本。其中,图模式数据也被称为图的元数据或图的schema(模式)。作为图数据库中一类特殊的数据,图模式数据可视为抽象意义上的图数据,来参与多模语义相似模型训练数据的样本数据生成和训练。
图1D是根据本发明一实施例提供的多模语义相似模型使用过程的示意图。其中,将输入的文本转换成文本向量(T)后与所有的候选图向量(G1、G2、…、GN)计算相似度,得到相似度TG1、TG2、…、TGN。TG1-TGN中TG2最大,因此图向量G2对应的候选图数据即是目标图数据,从而可以得到多个目标图数据作为备选答案。
图2A为本发明又一实施例提供的一种基于对比学习和大语言模型的图数据语义搜索方法的流程图,本实施例在上述实施例的基础上进行了优化改进。如图2A所示,该方法包括:
S210、基于预设的文本抽取提示,将用户问题输入大语言模型,抽取得到所述用户问题的关键文本。
具体的,当用户向大语言模型输入问题后,利用大语言模型对输入问题进行搜索关键词抽取,大语言模型的文本抽取提示如:“若要对下述用户问题在搜索引擎中进行搜索,请给出10个搜索关键词。[用户问题]”。
S220、基于所述多模语义相似模型中的文本编码器,获取所述关键文本的关键文本向量;
S240、基于所述多模语义相似模型中的图编码器,获取图数据库中的各候选图数据的候选图向量;
S250、根据各候选图向量与所述关键文本向量的相似度,从候选图数据中确定与所述关键文本匹配的目标图数据。
具体的,将图数据库中的图数据均作为候选图数据,利用图编码器获取各候选图数据的候选图向量,将各候选图数据的候选图向量与关键文本的关键文本向量逐一比对,以确定各候选图向量与关键文本向量的相似度。根据预设的匹配标准,将与关键文本向量的相似度满足匹配标准的候选图向量所对应的候选图数据,作为目标图数据,匹配标准可以是相似度大于预设的阈值。
S250、基于预设的文本重构提示,将所述目标图数据输入所述大语言模型,重构得到所述目标图数据的重构文本。
具体的,利用大语言模型对目标图数据进行语言重构,文本重构提示中除用于提示大语言模型对目标图数据进行语言重构外,还可用于提示大语言模型输出的重构文本中不能添加目标图数据之外的其他数据。文本重构提示的模板类似于:“下列数据为问题[用户问题]答案的相关信息,请将下列数据重构为自然流畅的文本内容作为答案返回。返回的答案仅从下列数据中采集信息,不要添加额外信息。[目标图数据]”。
S260、将所述重构文本确定为所述用户问题的语义搜索结果。
示例性的,图2B是根据本发明又一实施例提供的一种语义搜索系统的示意图。其中,当用户输入一个用户问题时,将其输入大语言模型,大语言模型给出其相关的几个搜索关键词。然后将每个搜索关键词通过多模语义相似模型得到与其相关的目标图数据,然后将目标图数据通过大语言模型进行文本重构,得到重构文本作为用户问题的返回结果。
本发明实施例通过借助系统中已有的大语言模型完成关键词抽取等文本重构之外的其他任务,无需在系统中再额外增设其他模块,进一步降低了系统的复杂度。
图3为本发明又一实施例提供的一种基于对比学习和大语言模型的图数据语义搜索装置的结构示意图。如图3所示,该装置包括:
关键文本获取模块310,用于获取用户问题的关键文本;
目标图数据获取模块320,用于基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据;
重构文本确定模块330,用于利用大语言模型对所述目标图数据进行文本重构,得到所述目标图数据的重构文本;所述重构文本和所述目标图数据的语义相同;
第一答案确定模块340,用于将所述重构文本确定为所述用户问题的语义搜索结果;
其中,所述多模语义相似模型通过对比学习的训练方法,对多模态的图向量和文本向量融合训练得到。
本发明实施例所提供的基于对比学习和大语言模型的图数据语义搜索装置可执行本发明任意实施例所提供的基于对比学习和大语言模型的图数据语义搜索方法,具备执行方法相应的功能模块和有益效果。
可选的,目标图数据获取模块320包括:
文本向量获取单元,用于基于所述多模语义相似模型中的文本编码器,获取所述关键文本的关键文本向量;
图向量获取单元,用于基于所述多模语义相似模型中的图编码器,获取图数据库中的各候选图数据的候选图向量;
目标图数据确定单元,用于根据各候选图向量与所述关键文本向量的相似度,从候选图数据中确定与所述关键文本匹配的目标图数据。
可选的,所述装置还包括:
推测问题获取单元,用于获取图数据库中的样本图数据的推测问题;
训练样本确定单元,用于将所述样本图数据和对应的所述推测问题的文本数据确定为正样本,并将所述样本图数据和其他样本图数据的推测问题确定为负样本;
编码器融合训练单元,用于通过所述正样本和所述负样本对图编码器和文本编码器融合训练,得到多模语义相似模型。
可选的,所述推测问题获取单元具体用于基于预设的问题推测提示,将样本图数据输入大语言模型,推测得到以所述样本图数据为答案的推测问题。
可选的,所述关键文本获取模块310具体用于基于预设的文本抽取提示,将用户问题输入大语言模型,抽取得到所述用户问题的关键文本。
可选的,所述重构文本确定模块330具体用于基于预设的文本重构提示,将所述目标图数据输入所述大语言模型,重构得到所述目标图数据的重构文本。
可选的,所述装置还包括:
第二答案确定模块,用于若基于多模语义相似模型,未从图数据库获取到与所述关键文本匹配的目标图数据,则根据所述大语言模型确定所述用户问题的语义搜索结果。
可选的,所述关键文本为一个或多个搜索关键词。
进一步说明的基于对比学习和大语言模型的图数据语义搜索装置也可执行本发明任意实施例所提供的基于对比学习和大语言模型的图数据语义搜索方法,具备执行方法相应的功能模块和有益效果。
图4示出了可以用来实施本发明的实施例的电子设备40的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备40包括至少一个处理器41,以及与至少一个处理器41通信连接的存储器,如只读存储器(ROM)42、随机访问存储器(RAM)43等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器41可以根据存储在只读存储器(ROM)42中的计算机程序或者从存储单元48加载到随机访问存储器(RAM)43中的计算机程序,来执行各种适当的动作和处理。在RAM 43中,还可存储电子设备40操作所需的各种程序和数据。处理器41、ROM 42以及RAM 43通过总线44彼此相连。输入/输出(I/O)接口45也连接至总线44。
电子设备40中的多个部件连接至I/O接口45,包括:输入单元46,例如键盘、鼠标等;输出单元47,例如各种类型的显示器、扬声器等;存储单元48,例如磁盘、光盘等;以及通信单元49,例如网卡、调制解调器、无线通信收发机等。通信单元49允许电子设备40通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器41可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器41的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器41执行上文所描述的各个方法和处理,例如基于对比学习和大语言模型的图数据语义搜索方法。
在一些实施例中,基于对比学习和大语言模型的图数据语义搜索方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元48。在一些实施例中,计算机程序的部分或者全部可以经由ROM 42和/或通信单元49而被载入和/或安装到电子设备40上。当计算机程序加载到RAM 43并由处理器41执行时,可以执行上文描述的基于对比学习和大语言模型的图数据语义搜索方法的一个或多个步骤。备选地,在其他实施例中,处理器41可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于对比学习和大语言模型的图数据语义搜索方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种基于对比学习和大语言模型的图数据语义搜索方法,其特征在于,所述方法包括:
获取用户问题的关键文本;
基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据;
利用大语言模型对所述目标图数据进行文本重构,得到所述目标图数据的重构文本;所述重构文本和所述目标图数据的语义相同;
将所述重构文本确定为所述用户问题的语义搜索结果;
其中,所述多模语义相似模型通过对比学习的训练方法,对多模态的图向量和文本向量融合训练得到;
其中,所述基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据之前,还包括:
获取图数据库中的样本图数据的推测问题;
将所述样本图数据和对应的所述推测问题的文本数据确定为正样本,并将所述样本图数据和其他样本图数据的推测问题确定为负样本;
通过所述正样本和所述负样本对图编码器和文本编码器融合训练,得到多模语义相似模型;
其中,融合训练的训练目标是令正样本的图向量和文本向量的相似度最大,负样本的图向量和文本向量的相似度最小,以该训练目标来联合训练文本编码器和图编码器的参数,实现图编码器和文本编码器的互相融合;融合训练结束后,图编码器得到的图向量不仅包含图结构信息还包含文本语义信息,文本编码器得到的文本向量不仅包含文本语义信息,还包含了图结构的信息,且互为正样本的图数据和文本数据进行编码后得到的图向量和文本向 量计算相似度后相似度最大,互为负样本的图数据和文本数据进行编码后得到的图向量和文本向量计算相似度后相似度最小。
2.根据权利要求1所述的方法,其特征在于,所述基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据包括:
基于所述多模语义相似模型中的文本编码器,获取所述关键文本的关键文本向量;
基于所述多模语义相似模型中的图编码器,获取图数据库中的各候选图数据的候选图向量;
根据各候选图向量与所述关键文本向量的相似度,从候选图数据中确定与所述关键文本匹配的目标图数据。
3.根据权利要求2所述的方法,其特征在于,所述获取图数据库中的样本图数据的推测问题包括:
基于预设的问题推测提示,将样本图数据输入大语言模型,推测得到以所述样本图数据为答案的推测问题。
4.根据权利要求1所述的方法,其特征在于,所述获取用户问题的关键文本包括:
基于预设的文本抽取提示,将用户问题输入大语言模型,抽取得到所述用户问题的关键文本。
5.根据权利要求4所述的方法,其特征在于,所述利用大语言模型对所述目标图数据进行文本重构,得到所述目标图数据的重构文本包括:
基于预设的文本重构提示,将所述目标图数据输入所述大语言模型,重构得到所述目标图数据的重构文本。
6.根据权利要求1所述的方法,其特征在于,所述获取用户问题的关键文本之后,还包括:
若基于多模语义相似模型,未从图数据库获取到与所述关键文本匹配的目标图数据,则根据所述大语言模型确定所述用户问题的语义搜索结果。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述关键文本为一个或多个搜索关键词。
8.一种基于对比学习和大语言模型的图数据语义搜索装置,其特征在于,所述装置包括:
关键文本获取模块,用于获取用户问题的关键文本;
目标图数据获取模块,用于基于多模语义相似模型,从图数据库获取与所述关键文本匹配的目标图数据;
重构文本确定模块,用于利用大语言模型对所述目标图数据进行文本重构,得到所述目标图数据的重构文本;所述重构文本和所述目标图数据的语义相同;
第一答案确定模块,用于将所述重构文本确定为所述用户问题的语义搜索结果;
推测问题获取模块,用于获取图数据库中的样本图数据的推测问题;
训练样本确定模块,用于将所述样本图数据和对应的所述推测问题的文本数据确定为正样本,并将所述样本图数据和其他样本图数据的推测问题确定为负样本;
编码器融合训练模块,用于通过所述正样本和所述负样本对图编码器和文本编码器融合训练,得到多模语义相似模型;
其中,所述多模语义相似模型通过对比学习的训练方法,对多模态的图向量和文本向量融合训练得到;
其中,融合训练的训练目标是令正样本的图向量和文本向量的相似度最大,负样本的图向量和文本向量的相似度最小,以该训练目标来联合训练文本编码器和图编码器的参数,实现图编码器和文本编码器的互相融合;融合训练结束后,图编码器得到的图向量不仅包含图结构信息还包含文本语义信息,文本编码器得到的文本向量不仅包含文本语义信息,还包含了图结构的信息,且互为正样本的图数据和文本数据进行编码后得到的图向量和文本向 量计算相似度后相似度最大,互为负样本的图数据和文本数据进行编码后得到的图向量和文本向量计算相似度后相似度最小。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的基于对比学习和大语言模型的图数据语义搜索方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的基于对比学习和大语言模型的图数据语义搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310706047.9A CN116450867B (zh) | 2023-06-15 | 2023-06-15 | 一种基于对比学习和大语言模型的图数据语义搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310706047.9A CN116450867B (zh) | 2023-06-15 | 2023-06-15 | 一种基于对比学习和大语言模型的图数据语义搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116450867A CN116450867A (zh) | 2023-07-18 |
CN116450867B true CN116450867B (zh) | 2023-08-18 |
Family
ID=87120575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310706047.9A Active CN116450867B (zh) | 2023-06-15 | 2023-06-15 | 一种基于对比学习和大语言模型的图数据语义搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116450867B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116720786B (zh) * | 2023-08-01 | 2023-10-03 | 中国科学院工程热物理研究所 | 一种融合kg和plm的装配质量稳定性预测方法、系统及介质 |
CN117076661B (zh) * | 2023-08-17 | 2024-05-31 | 天津大学 | 面向预训练大语言模型调优的立法规划意图识别方法 |
CN117218498B (zh) * | 2023-11-08 | 2024-02-23 | 苏州大学 | 基于多模态编码器的多模态大语言模型训练方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625641A (zh) * | 2020-07-30 | 2020-09-04 | 浙江大学 | 一种基于多维度语义交互表征模型的对话意图识别方法及系统 |
CN112069290A (zh) * | 2020-07-27 | 2020-12-11 | 中国科学院计算机网络信息中心 | 基于图局部结构和文本语义相似性的学术论文推荐方法 |
CN114942981A (zh) * | 2022-04-07 | 2022-08-26 | 中国科学技术信息研究所 | 问答查询方法、装置、电子设备及计算机可读存储介质 |
CN115270900A (zh) * | 2022-03-22 | 2022-11-01 | 中国平安人寿保险股份有限公司 | 一种用户意图识别方法和装置、电子设备、存储介质 |
CN116059646A (zh) * | 2023-04-06 | 2023-05-05 | 深圳尚米网络技术有限公司 | 一种交互式专家指导系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625635B (zh) * | 2020-05-27 | 2023-09-29 | 北京百度网讯科技有限公司 | 问答处理方法、装置、设备及存储介质 |
-
2023
- 2023-06-15 CN CN202310706047.9A patent/CN116450867B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112069290A (zh) * | 2020-07-27 | 2020-12-11 | 中国科学院计算机网络信息中心 | 基于图局部结构和文本语义相似性的学术论文推荐方法 |
CN111625641A (zh) * | 2020-07-30 | 2020-09-04 | 浙江大学 | 一种基于多维度语义交互表征模型的对话意图识别方法及系统 |
CN115270900A (zh) * | 2022-03-22 | 2022-11-01 | 中国平安人寿保险股份有限公司 | 一种用户意图识别方法和装置、电子设备、存储介质 |
CN114942981A (zh) * | 2022-04-07 | 2022-08-26 | 中国科学技术信息研究所 | 问答查询方法、装置、电子设备及计算机可读存储介质 |
CN116059646A (zh) * | 2023-04-06 | 2023-05-05 | 深圳尚米网络技术有限公司 | 一种交互式专家指导系统 |
Non-Patent Citations (1)
Title |
---|
Question Answering over Knowledge Graphs via Machine Reading Comprehension;Weidong Han 等;《International Conference on Database Systems for Advanced Applications》;第577–594页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116450867A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116450867B (zh) | 一种基于对比学习和大语言模型的图数据语义搜索方法 | |
CN110222045B (zh) | 一种数据报表获取方法、装置及计算机设备、存储介质 | |
CN114549874B (zh) | 多目标图文匹配模型的训练方法、图文检索方法及装置 | |
CN113590645B (zh) | 搜索方法、装置、电子设备及存储介质 | |
CN112100354B (zh) | 人机对话方法、装置、设备及存储介质 | |
CN110737758A (zh) | 用于生成模型的方法和装置 | |
CN112905768B (zh) | 一种数据交互方法、装置及存储介质 | |
CN114861889B (zh) | 深度学习模型的训练方法、目标对象检测方法和装置 | |
CN112487173A (zh) | 人机对话方法、设备和存储介质 | |
US20230094730A1 (en) | Model training method and method for human-machine interaction | |
CN116401345A (zh) | 智能问答方法、装置、存储介质和设备 | |
CN116467461A (zh) | 应用于配电网的数据处理方法、装置、设备及介质 | |
CN117633194A (zh) | 大模型提示数据处理方法、装置、电子设备及存储介质 | |
CN117436480A (zh) | 一种Mindspore框架下的大模型及推荐方法 | |
CN117271884A (zh) | 确定推荐内容的方法、装置、电子设备及存储介质 | |
CN116226533A (zh) | 基于关联性预测模型的新闻关联推荐方法、装置及介质 | |
CN116049370A (zh) | 信息查询方法和信息生成模型的训练方法、装置 | |
CN116090438A (zh) | 主题处理方法、装置、电子设备及存储介质 | |
CN115563242A (zh) | 汽车信息筛选方法、装置、电子设备及存储介质 | |
CN117112773B (zh) | 一种基于nlp的适航非结构化数据的搜索方法及装置 | |
CN115034388B (zh) | 排序模型的量化参数的确定方法、装置及电子设备 | |
CN116244432B (zh) | 语言模型的预训练方法、装置及电子设备 | |
CN118093805A (zh) | 一种问答方法、装置、电子设备及存储介质 | |
CN117669585A (zh) | 用户检索意图识别方法、装置、电子设备和存储介质 | |
CN117609418A (zh) | 文档处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |