CN117009599A - 数据检索方法、装置、处理器及电子设备 - Google Patents
数据检索方法、装置、处理器及电子设备 Download PDFInfo
- Publication number
- CN117009599A CN117009599A CN202310988576.2A CN202310988576A CN117009599A CN 117009599 A CN117009599 A CN 117009599A CN 202310988576 A CN202310988576 A CN 202310988576A CN 117009599 A CN117009599 A CN 117009599A
- Authority
- CN
- China
- Prior art keywords
- data
- target
- retrieval
- determining
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000013507 mapping Methods 0.000 claims abstract description 28
- 230000004044 response Effects 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims description 132
- 230000006870 function Effects 0.000 claims description 98
- 238000012549 training Methods 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 14
- 238000003860 storage Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/908—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据检索方法、装置、处理器及电子设备。涉及计算机技术领域,该方法包括:响应对目标检索数据的检索请求,执行下述检索步骤:提取目标检索数据的初始数据特征;映射初始数据特征,得到目标数据特征;依据目标数据特征,确定目标检索哈希值;确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;依据相似指数,确定与目标检索数据对应的目标检索结果。本发明解决了相关技术中,对与目标数据相似的数据进行检索时,存在的检索准确度低的技术问题。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种数据检索方法、装置、处理器及电子设备。
背景技术
目前,主流的跨模态哈希检索方法,主要是通过投影矩阵或者深度学习网络参数,将拥有不同特征维度的多模态数据映射到同一维度的公共空间中,通过计算特征之间的汉明距离,来衡量多模态数据之间的相似性,从而推荐给用户排序后的检索结果。但是,采用相关技术中提供的方法,对与目标数据相似的数据进行检索时,存在的检索准确度低的问题。
针对所述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据检索方法、装置、处理器及电子设备,以至少解决相关技术中,对与目标数据相似的数据进行检索时,存在的检索准确度低的技术问题。
根据本发明实施例的一个方面,提供了一种数据检索方法,包括:响应对目标检索数据的检索请求,执行下述检索步骤,其中,所述检索请求用于请求检索与所述目标检索数据相似的数据:提取所述目标检索数据的初始数据特征,其中,所述初始数据特征对应的维度数为初始维度数;映射所述初始数据特征,得到目标数据特征,其中,所述目标数据特征对应的维度数为目标维度数;依据所述目标数据特征,确定目标检索哈希值;确定所述目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;依据所述相似指数,确定与所述目标检索数据对应的目标检索结果。
可选地,所述响应对目标检索数据的检索请求,执行下述检索步骤,包括:响应于所述检索请求,将所述目标检索数据输入至目标检索模型中,所述目标检索模型执行所述检索步骤,其中,所述目标检索模型通过样本数据训练初始模型得到,所述样本数据包括,样本检索数据,与样本检索数据对应的样本检索结果。
可选地,所述方法还包括:采用以下方式对所述样本数据进行训练,得到所述目标检索模型:在所述样本检索数据包括图像样本检索数据与文本样本检索数据的情况下,获取初始模型,以及构造用于模型训练的损失函数,其中,所述损失函数包括第一损失函数项,第二损失函数项以及第三损失函数项,所述第一损失函数项用于保持所述图像样本检索数据对应的第一样本数据特征与联合数据特征之间的相似性,所述第二损失函数项用于保持所述文本样本检索数据对应的第二样本数据特征与所述联合数据特征之间的相似性,以及所述第三损失函数项用于保持所述联合数据特征与真实相似性矩阵之间的相似性;基于所述损失函数,采用所述样本数据对所述初始模型进行训练,得到所述目标检索模型。
可选地,确定所述联合数据特征,包括:确定所述图像样本检索数据与所述图像样本检索数据之间的第一特征项,确定所述文本样本检索数据与所述文本样本检索数据之间的第二特征项,确定所述图像样本检索数据与文本样本检索数据之间的第三特征项,确定所述文本样本检索数据与所述图像样本检索数据之间的第四特征项;依据所述第一特征项,所述第二特征项,所述第三特征项与所述第四特征项,构建组合特征;将所述组合特征代入至预定线性激活函数中,得到所述联合数据特征。
可选地,所述确定所述图像样本检索数据与所述图像样本检索数据之间的第一特征项,确定所述文本样本检索数据与所述文本样本检索数据之间的第二特征项,确定所述图像样本检索数据与文本样本检索数据之间的第三特征项,确定所述文本样本检索数据与所述图像样本检索数据之间的第四特征项,包括:确定所述图像样本检索数据对应的第一查询向量,与所述图像样本检索数据对应的第二查询向量的转置向量的乘积,与所述目标维度数的比例,得到第一比例,并确定所述文本样本检索数据对应的第一查询向量,与所述文本样本检索数据对应的第二查询向量的转置向量的乘积,与所述目标维度数的比例,得到第二比例,并确定所述图像样本检索数据对应的第一查询向量,与所述文本样本检索数据对应的第二查询向量的转置向量的乘积,与所述目标维度数的比例,得到第三比例,并确定所述文本样本检索数据对应的第一查询向量,与所述图像样本检索数据对应的第二查询向量的转置向量的乘积,与所述目标维度数的比例,得到第四比例;将所述第一比例、第二比例、第三比例与第四比例分别输入至预定概率分布转换函数中,得到分别对应的第一结果、第二结果、第三结果与第四结果;确定第一结果与所述图像样本检索数据对应的第三查询向量的乘积为所述第一特征项,所述第二结果与所述文本样本检索数据对应的第三查询向量的乘积为所述第二特征项,第一结果与所述图像样本检索数据对应的第三查询向量的乘积为所述第三特征项,第一结果与所述文本样本检索数据对应的第三查询向量的乘积为所述第四特征项。
可选地,所述方法还包括:采用以下方式获取所述样本数据:确定与所述预定数据库中数据分别对应的检索结果;将所述预定数据库中数据,以及与所述预定数据库中数据分别对应的检索结果作为所述样本数据。
可选地,所述依据所述目标数据特征,确定目标检索哈希值,包括:确定所述目标数据特征中每个特征值与预定阈值的大小关系,得到预定大小关系;将所述预定大小关系中,对应的特征值大于预定阈值的特征值更新为第一预定值,对应的特征值小于或等于所述预定阈值的特征值更新为第二预定值,得到所述目标检索哈希值,其中,所述第一预定值高于所述第二预定值。
根据本发明实施例的一个方面,提供了一种数据检索装置,包括:执行模块,用于响应对目标检索数据的检索请求,执行下述检索步骤,其中,所述检索请求用于请求检索与所述目标检索数据相似的数据:提取模块,用于提取所述目标检索数据的初始数据特征,其中,所述初始数据特征对应的维度数为初始维度数;映射模块,用于映射所述初始数据特征,得到目标数据特征,其中,所述目标数据特征对应的维度数为目标维度数;第一确定模块,用于依据所述目标数据特征,确定目标检索哈希值;第二确定模块,用于确定所述目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;第三确定模块,用于依据所述相似指数,确定与所述目标检索数据对应的目标检索结果。
根据本发明实施例的一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的方法。
根据本发明实施例的一个方面,提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项所述的方法。
在本发明实施例中,响应对目标检索数据的检索请求,执行下述检索步骤,其中,检索请求用于请求检索与目标检索数据相似的数据:提取目标检索数据的初始数据特征,其中,初始数据特征对应的维度数为初始维度数。映射初始数据特征,得到目标数据特征,其中,目标数据特征对应的维度数为目标维度数。依据目标数据特征,确定目标检索哈希值;确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数,达到依据相似指数,确定与目标检索数据对应的目标检索结果的目的,由于目标数据特征是通过映射初始数据特征得到的,从而实现了确保目标数据特征表示的一致性和目标维度数的一致性,在一定程度上可以提高目标数据特征匹配和目标检索数据匹配的准确性的技术效果。进而解决了相关技术中,对与目标数据相似的数据进行检索时,存在的检索准确度低的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的数据检索方法的流程图;
图2是根据本申请实施例提供的数据检索装置的结构框图;
图3是本发明实施例提供的电子设备的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的数据检索方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,响应对目标检索数据的检索请求,执行下述检索步骤,其中,检索请求用于请求检索与目标检索数据相似的数据:
在该实施例中,上述目标检索数据可以是图像数据,也可以是文本数据,即,获取用户的检索请求,可以是图像数据,文本数据或者其他形式的特征数据,在此不作限定,可根据具体的场景与应用进行自定义设置。
需要说明的是,响应对上述目标检索数据的检索请求,并执行以下相关的检索步骤,包括:根据相似度,对目标检索数据进行排序,获取与检索请求数据最相似的数据,即上述检索与目标检索数据相似的数据。
步骤S102,提取目标检索数据的初始数据特征,其中,初始数据特征对应的维度数为初始维度数;
在该实施例中,上述所提取的初始数据特征可以根据目标检索数据类型的不同而不同,比如目标检索数据为图像数据时,可以采用特征提取的方法进行特征提取,提取出图像数据的一些初始数据特征,比如:颜色特征、纹理特征、形状特征,以及深度学习特征等特征,也可以是通过神经网络提取后的特征表示,不同种类的图像具有不同的特征,并基于类似这些数据特征,确定出图像数据的初始数据特征对应的初始维度数;目标检索数据位文本数据时,可以使用词袋模型、文本统计特征等方法,将文本表示为向量形式,提取文本数据的一些初始数据特征,比如:词级特征,句法特征,文档级特征等特征,也可以是通过词袋模型提取后的特征表示,不同种类的文本具有不同的特征,并基于类似这些数据特征,确定出文本数据的初始数据特征对应的初始维度数。上述数据特征可以根据不同的数据特征进行确定,不作限定。
需要说明的是,提取初始数据特征,并确定其对应的目标维度数,这一步骤,可以有效提高目标检索数据检索的准确性,其合适的维度数可以保留目标检索数据的特征信息,能够更准确地检索和匹配到与目标检索数据相似的数据。
步骤S103,映射初始数据特征,得到目标数据特征,其中,目标数据特征对应的维度数为目标维度数;
在该实施例中,依据前面上述步骤中所提取的初始数据特征,根据其目标检索数据的数据类型和应用要求,选择合适的映射方法,比如,例如,在图像数据中可以使用卷积神经网络进行特征映射,而在文本数据中可以使用词嵌入模型进行特征映射。即,将初始数据特征映射到目标数据特征空间中,映射过程将原始特征转换为新的特征表示,通常会改变特征的维度,为了确保目标数据特征的维度数符合目标维度数的要求,可以进行维度的扩展或压缩,以使目标数据特征的维度与预期的目标维度数一致。在实际应用中,选择合适的映射方法和目标维度数需要根据数据的特性和任务需求进行选择和调整。
需要说明的是,通过映射初始数据特征以获取目标数据特征,并确定目标数据特征的维度数,不仅可以提高目标数据特征表示的一致性和目标维度数的一致性,还可以提高目标数据特征匹配和目标检索数据匹配的准确性。
步骤S104,依据目标数据特征,确定目标检索哈希值;
在该实施例中,上述目标检索哈希值是指代表待检索数据的哈希值,对于待检索的数据,将其转换为哈希值,以便与预定数据库中的哈希值进行比较,目标检索哈希值的计算通常采用哈希函数将数据映射为固定长度的二进制码,即,哈希函数可以将目标数据特征映射到一个固定大小的哈希码空间,并且具备一定的冲突避免能力,即不同的目标数据特征尽可能映射到不同的哈希码。即,将目标数据特征输入选择的哈希函数中,并获取对应的目标检索哈希值。
需要说明的是,选择适当的哈希函数对于目标检索哈希值的质量和性能至关重要,不同的哈希函数可能适用于不同的数据类型和应用场景,因此需要根据具体情况进行选择和评估。利用给定的目标搜索哈希值,在一定程度上能够提高目标检索数据的存储、处理和检索效率,同时,能够快速检索到具有相似数据特征的目标数据,实现对目标检索数据的高效的相似性检索。
步骤S105,确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;
在该实施例中,上述多个数据哈希值的相似指数可以是指对比目标检索哈希值与数据库中每个数据哈希值之间的相似程度,相似指数可以采用不同的度量方法,来表示目标检索哈希值与数据库中数据哈希值之间的相似性程度,相似指数的确定方法,在此不作限定,可以根据具体的应用场景和需求进行自定义选择。
按照前面上述步骤,假设目标检索数据为图像数据,则会预先建立一个数据库,其中包含多个图像的哈希值,对于每个图像,将其通过哈希函数转换为哈希值,并将其存储在数据库中;依据所提取的图像数据的数据特征,确定目标检索哈希值,然后将目标检索哈希值与数据库中每个图像的哈希值进行比较,并计算相似指数,通过比较相似指数,可以找到与目标图像相似的图像,并返回给用户进行检索。
需要说明的是,上述所确定的相似指数,可以评估目标检索数据对应的目标检索哈希值与预定数据库中的多个哈希值之间的相似度和匹配程度,有助于提供更精确、更有针对性的数据检索结果,提升用户体验和数据分析的准确性。
步骤S106,依据相似指数,确定与目标检索数据对应的目标检索结果。
在该实施例中,按照前面上述步骤中所确定的相似指数,即,将目标检索数据对应的哈希值与预定数据库中的每个哈希值之间进行比较,得到相似指数的过程,然后依据此相似指数对目标检索结果进行排序,根据排序结果,可以确定与目标检索数据相似度最高的数据作为目标检索结果。
需要说明的是,依据相似指数确定与目标检索数据对应的目标检索结果,不仅可以提供与目标检索数据准确的匹配结果,还可以提高对目标检索数据的检索效率。
通过上述步骤S101-S106,响应对目标检索数据的检索请求,执行下述检索步骤,其中,检索请求用于请求检索与目标检索数据相似的数据:提取目标检索数据的初始数据特征,其中,初始数据特征对应的维度数为初始维度数。映射初始数据特征,得到目标数据特征,其中,目标数据特征对应的维度数为目标维度数;依据目标数据特征,确定目标检索哈希值。确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数,达到依据相似指数,确定与目标检索数据对应的目标检索结果的目的,由于目标数据特征是通过映射初始数据特征得到的,从而实现了确保目标数据特征表示的一致性和目标维度数的一致性,在一定程度上可以提高目标数据特征匹配和目标检索数据匹配的准确性的技术效果。进而解决了相关技术中,对与目标数据相似的数据进行检索时,存在的检索准确度低的技术问题。
作为一种可选的实施例,响应对目标检索数据的检索请求,执行下述检索步骤,包括:响应于检索请求,将目标检索数据输入至目标检索模型中,目标检索模型执行检索步骤,其中,目标检索模型通过样本数据训练初始模型得到,样本数据包括,样本检索数据,与样本检索数据对应的样本检索结果。
在该实施例中,上述目标检索模型时是通过样本数据进行训练初始模型得到的,其具有一定的学习能力,能够根据输入的目标检索数据检索相应的检索结果,其样本数据包括:样本检索数据和样本检索结果,样本检索数据是用于训练目标检索模型的数据,样本检索结果可以是与样本数据对应的预期输出结果。
响应对目标检索数据的检索请求,将目标检索数据输入至目标检索模型中,这个目标检索数据可能是用户提供的待搜索数据。目标检索模型根据输入的目标检索数据,执行检索步骤并生成检索结果,将目标检索模型生成的目标检索结果与样本检索结果进行比较,这样可以评估模型在检索任务上的性能,并进行结果的验证,将经过验证的目标检索结果返回给用户。
需要说明的是,目标检索模型的性能和准确性与样本数据密切相关,因此,在训练初始模型时,应确保样本数据具有足够的多样性和丰富性,能够很好地覆盖预期的检索场景和需求。
作为一种可选的实施例,在样本检索数据包括图像样本检索数据与文本样本检索数据的情况下,获取初始模型,以及构造用于模型训练的损失函数,其中,损失函数包括第一损失函数项,第二损失函数项以及第三损失函数项,第一损失函数项用于保持图像样本检索数据对应的第一样本数据特征与联合数据特征之间的相似性,第二损失函数项用于保持文本样本检索数据对应的第二样本数据特征与联合数据特征之间的相似性,以及第三损失函数项用于保持联合数据特征与真实相似性矩阵之间的相似性;基于损失函数,采用样本数据对初始模型进行训练,得到目标检索模型。
在该实施例中,上述第一损失函数项,用于保持图像样本检索数据对应的第一样本数据特征与联合数据特征之间的相似性,可以使用一种度量指标(如余弦相似度)来计算它们之间的相似性,并将其作为损失函数的一部分。
上述第二损失函数项,用于保持文本样本检索数据对应的第二样本数据特征与联合数据特征之间的相似性,同样,可以使用一种度量指标来计算它们之间的相似性,并将其作为损失函数的一部分。
上述第三损失函数项,用于保持联合数据特征与真实相似性矩阵之间的相似性,真实相似性矩阵反映样本数据之间的真实相似性关系,可以使用一种度量指标(如交叉熵损失)将联合数据特征与真实相似性矩阵进行比较,并将其作为损失函数的一部分。
需要说明的是,首先获取一个初始模型,初始模型可以是先前训练过的模型,也可以是从头开始构建的模型,然后针对样本检索数据中的图像样本检索数据和文本样本检索数据,构造用于模型训练的损失函数,损失函数包括三个部分,即第一损失函数项、第二损失函数项和第三损失函数项,基于构造的损失函数,使用样本数据对初始模型进行训练。通过优化损失函数,调整模型的权重和参数,以使得目标检索模型能够更好地捕捉样本数据特征之间的相似性。在模型训练完成后,对目标检索模型进行评估。可以使用测试数据集来评估模型在检索任务上的性能,并根据评估结果对模型进行调整和优化。通过这样的训练过程,可以得到一个针对图像样本检索数据和文本样本检索数据的目标检索模型,该模型能够通过联合数据特征来捕捉样本数据之间的相似性关系。
作为一种可选的实施例,确定联合数据特征,包括:确定图像样本检索数据与图像样本检索数据之间的第一特征项,确定文本样本检索数据与文本样本检索数据之间的第二特征项,确定图像样本检索数据与文本样本检索数据之间的第三特征项,确定文本样本检索数据与图像样本检索数据之间的第四特征项;依据第一特征项,第二特征项,第三特征项与第四特征项,构建组合特征;将组合特征代入至预定线性激活函数中,得到联合数据特征。
在该实施例中,上述第一特征项,这可以是基于图像的特征表示方法,例如使用卷积神经网络(CNN)提取的图像特征向量;上述第二特征项可以是基于文本的特征表示方法,例如使用自然语言处理技术将文本转换为向量表示;上述第三特征项可以是通过将图像和文本数据进行结合,利用跨模态表达方法,例如使用图像和文本的共享空间编码的方式来获得的特征;上述第四特征项可以是通过将图像和文本数据进行结合所得到的特征,可以采用与第三特征项类似的方法。此步骤中第一特征项,第二特征项,第三特征项,以及第四特征项的确定方法,在此不作限定,可根据具体的场景与应用进行自定义设置。
按照上述第一、第二、第三和第四特征项,将它们组合在一起构建出一个综合的联合数据特征表示,这可以通过简单的拼接、加权求和或者其他组合方式来完成,然后将构建好的组合特征代入预定的线性激活函数中进行处理,线性激活函数可以是线性变换或其他变换,在特征空间中对组合特征进行进一步的映射,最后通过对组合特征应用预定的线性激活函数,得到最终的联合数据特征表示,这个特征表示将图像样本检索数据和文本样本检索数据的信息进行了融合。
需要说明的是,通过以上步骤,可以得到描述图像样本检索数据和文本样本检索数据之间关系的联合数据特征,这个联合数据特征可以在后续的训练和检索过程中起到重要作用。
作为一种可选的实施例,确定图像样本检索数据与图像样本检索数据之间的第一特征项,确定文本样本检索数据与文本样本检索数据之间的第二特征项,确定图像样本检索数据与文本样本检索数据之间的第三特征项,确定文本样本检索数据与图像样本检索数据之间的第四特征项,包括:确定图像样本检索数据对应的第一查询向量,与图像样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第一比例,并确定文本样本检索数据对应的第一查询向量,与文本样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第二比例,并确定图像样本检索数据对应的第一查询向量,与文本样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第三比例,并确定文本样本检索数据对应的第一查询向量,与图像样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第四比例;将第一比例、第二比例、第三比例与第四比例分别输入至预定概率分布转换函数中,得到分别对应的第一结果、第二结果、第三结果与第四结果;确定第一结果与图像样本检索数据对应的第三查询向量的乘积为第一特征项,第二结果与文本样本检索数据对应的第三查询向量的乘积为第二特征项,第一结果与图像样本检索数据对应的第三查询向量的乘积为第三特征项,第一结果与文本样本检索数据对应的第三查询向量的乘积为第四特征项。
在该实施例中,在确定出前面上述步骤中的第一特征项,第二特征项,第三特征项以及第四特征项的过程中,还需要确定出第一比例,第二比例,第三比例以及第四比例,上述第一比例是通过计算图像样本检索数据对应的第一查询向量与图像样本检索数据对应的第二查询向量的转置向量的乘积,并与目标维度数进行比例计算得到的;上述第二比例是通过计算文本样本检索数据对应的第一查询向量与文本样本检索数据对应的第二查询向量的转置向量的乘积,并与目标维度数进行比例计算得到的;上述第三比例是通过计算图像样本检索数据对应的第一查询向量与文本样本检索数据对应的第二查询向量的转置向量的乘积,并与目标维度数进行比例计算得到的。上述第四比例是通过计算文本样本检索数据对应的第一查询向量与图像样本检索数据对应的第二查询向量的转置向量的乘积,并与目标维度数进行比例计算得到的。
通过上述步骤所确定的第一比例、第二比例、第三比例和第四比例,将其分别输入至预定概率分布转换函数中进行处理,得到分别对应的第一结果、第二结果、第三结果与第四结果,然后确定第一结果与图像样本检索数据对应的第三查询向量的乘积为第一特征项,第二结果与文本样本检索数据对应的第三查询向量的乘积为第二特征项,第一结果与图像样本检索数据对应的第三查询向量的乘积为第三特征项,第一结果与文本样本检索数据对应的第三查询向量的乘积为第四特征项。通过上述步骤所确定出的特征项能够更好地反应出其对应的特征,使得后续确定出的检索数据更为准确。
作为一种可选的实施例,方法还包括:采用以下方式获取样本数据:确定与预定数据库中数据分别对应的检索结果;将预定数据库中数据,以及与预定数据库中数据分别对应的检索结果作为样本数据。
在该实施例中,响应对目标检索数据的检索请求,通过使用预定的目标检索模型和数据库中的数据,进行检索操作,得到每个数据对应的检索结果。其中,目标检索模型是利用样本数据训练初始模型得到的,样本数据可以是预定数据库中的数据,以及与预定数据库中数据分别对应的检索结果,其中,样本数据可以是预定数据库中的数据,这些数据可以包括图像样本检索数据和文本样本检索数据,然后根据具体应用和需求选择合适的数据类型,样本数据也可以是与数据库中的数据对应的检索结果作为样本检索结果,这些结果可以是预定的相关性或相似度得分,或者是特定类别或标签的信息,根据具体任务的需求来确定,最后使用构建好的样本数据,对初始模型进行训练,进而得到目标检索模型。
需要说明的是,通过以上方式,可以获取包含与预定数据库中数据对应的检索结果的样本数据,这样的样本数据在模型训练过程中,有助于初始模型可以学习到数据和检索结果之间的关联性,可以进一步地判断初始模型的性能和效果,为后续的目标检索模型的优化提供了反馈和参考,从而使目标检索模型能够更好地理解和处理检索任务。
作为一种可选的实施例,依据目标数据特征,确定目标检索哈希值,包括:确定目标数据特征中每个特征值与预定阈值的大小关系,得到预定大小关系;将预定大小关系中,对应的特征值大于预定阈值的特征值更新为第一预定值,对应的特征值小于或等于预定阈值的特征值更新为第二预定值,得到目标检索哈希值,其中,第一预定值高于第二预定值。
在该实施例中,确定每个特征值与预定阈值的大小关系,即,对目标数据特征中的每个特征值,判断其与预定阈值的大小关系,可以是通过比较特征值与阈值的大小来确定的,根据每个特征值与预定阈值的大小关系,得到预定的大小关系,例如,可以将特征值大于阈值的情况视为“大于”,特征值小于或等于阈值的情况视为“小于或等于”;根据预定大小关系,将目标数据特征对应的特征值进行更新操作,如:如果某个特征值大于预定阈值,可以将该特征值更新为第一预定值,如果某个特征值小于或等于预定阈值,可以将该特征更新为第二预定值。通过将更新后的第一预定值,第二预定值组合在一起,通过哈希函数,得到目标检索哈希值,确保第一预定值高于第二预定值,这样可以为目标数据建立不同级别的哈希编码,反映不同特征的重要程度。
需要注意的是,目标检索哈希值确定过程可以根据具体的需求和任务进行调整和优化,通过这样的步骤,可以将目标数据特征转化为目标检索哈希值,以便在检索任务中进行快速和高效的匹配和筛选。
基于所述实施例及可选实施例,提供了一种可选实施方式,下面具体说明。
在相关技术中,对与目标数据相似的数据进行检索时,存在的检索准确度低的技术问题,举例说明,相关技术中,采用相关方法对目标数据相似的数据进行检索时,有以下问题:忽略了由于目标数据的模态,可能存在以下问题:
1)提取的数据特征不完整,不准确的问题;
2)不同模态目标数据的数据特征之间相似性与关联性无法确定;上述忽略目标数据的模态所存在的两个问题,均会导致检索准确度较低。
鉴于此,本发明可选实施方式中提供了一种数据检索方法,下面对本申请可选实施方式进行详细说明。
S1、响应对图像检索数据,以及文本检索数据的检索请求,并执行下面检索步骤,其中,检索请求用于检索与图像检索数据,以及文本检索数据分别相似的数据;
需要说明的是,响应于检索请求,将图像检索数据,以及文本检索数据输入至目标检索模型中,目标检索模型执行检索步骤,其中,目标检索模型通过样本数据训练初始模型得到,样本数据包括,样本检索数据,与样本检索数据对应的样本检索结果。
S2、提取图像检索数据,以及文本检索数据分别对应的初始数据特征,并映射分别对应的初始数据特征,得到图像检索数据,以及文本检索数据分别对应的目标数据特征,以及目标数据特征对应的目标维度数;
需要说明的是,上述对图像检索数据,以及文本检索数据分别对应的初始数据特征是不一样的,下面分情况说明:
1)对于图像检索数据对应的初始数据特征的提取:可以采用卷积神经网络CNN进行图像特征的提取,其中,CNN是目前深度学习领域中最具有代表性的图像特征提取网络,CNN的工作机制是直接将原始图像输入到网络中,通过卷积、池化、全连接、归一化指数函数Softmax处理等操作后,提取到的图像特征,即为初始数据特征,CNN的网络参数相对较少,大大提高了模型的训练速度。
2)对于文本检索数据对应的初始数据特征的提取:可以采用词袋模型BOW进行文本特征的提取,其中,词袋模型BOW是自然语言处理中最常用的文本表示形式,给定两个文本数据,统计所有出现过的词汇,构建成数据字典,通过BOW模型对初始文本数据进行转化,生成两个一维向量,其中向量的每个值表示单词在文本检索数据中的出现次数。
在提取到初始数据特征之后,还需要确定初始数据特征对应的维度数,即初始维度数,可以通过以下方式进行确定:将上述例子中的CNN和BOW模型提取后的特征,即图像检索数据对应的初始数据特征表示为U,文本检索数据对应的初始数据特征表示为V,即,图像检索数据对应的初始数据特征对应的初始维度数可以为512,以及文本检索数据对应的初始数据特征的初始维度数可以为20,即可以表示为:图像维度数为dU=512,文本维度数为dV=20。
进一步地,将通过图像特征对应的矩阵ωx、文本特征对应的矩阵ωy映射到维度为64的公共空间中,得到目标数据特征对应的目标维度数,即,目标维度数dhash=64。
S3、确定目标数据特征中每个特征值与预定阈值的大小关系,并依据目标数据特征,确定目标检索哈希值;
需要说明的是,上述步骤中将确定的大小关系作为预定大小关系,然后结合目标数据特征,确定目标检索哈希值,其确定过程为:经过函数,将实数特征转化为目标检索哈希值,即包括:图像哈希码X和文本哈希码Y,该步骤中的符号函数sgn(x),可以将预定大小关系中,对应的特征值大于预定阈值的特征值更新为第一预定值,对应的特征值小于或等于预定阈值的特征值更新为第二预定值,得到所述目标检索哈希值,第一预定值高于第二预定值,第一预定值可以为1,第二预定值可以为0,进一步地,可以将确定出的目标哈希值输入到注意力机制神经网络中,提取更深层的数据特征。
S4、确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数,并依据相似指数,确定与目标检索数据对应的目标检索结果。
需要说明的是,依据前面上述步骤中的目标检索模型,即,是利用样本数据进行训练初始模型得到的,样本数据包括:样本检索数据,即,图像样本检索数据与文本样本检索数据,以及与样本检索数据对应的样本检索结果,基于上述样本数据,获取初始模型,以及构造用于模型训练的损失函数,在构造损失函数之前,需要先确定出联合数据特征,此步骤中用到了注意力机制神经网络,其步骤如下:
依据前面上述步骤,X可以表示图像哈希码,Y可以表示文本哈希码,下面公式的下角标x表示图像特征的参数矩阵,y表示文本特征的参数矩阵,右上角的T表示向量或矩阵的转置。下面以图像-图像为例,其中均为图像特征的查询向量,/>为查询图像的向量(Query向量),/>为图像的关键点的向量(Key向量),/>为图像的亮度向量(Value向量),Qx为图像哈希码变换后对应的查询图像的向量,Kx为图像哈希码变换后对应的图像的关键点向量,Vx为图像哈希码变换后对应的图像的亮度向量,通过矩阵的内积,计算图像特征X之间的相关度,然后利用相关度矩阵、Vx进行矩阵相乘,得到图像-图像Attention(Qx,Kx,Vx),以此类推文本-文本Attention(Qy,Ky,Vy)、图像-文本特征Attention(Qx,Ky,Vx)、文本-图像特征Attention(Qy,Kx,Vy),其中,Qy为文本啊哈希码变换后对应的查询文本的向量,Ky为文本哈希码变换后对应的文本的关键点向量,Vy为文本哈希码变换后对应的文本的亮度向量,Attention()为线性激活函数,/>即:
根据图像-图像特征,以得到:
上述公式中,为图像样本检索数据与所述图像样本检索数据之间的第一特征项。
根据文本-文本特征,可以得到:
/>
上述公式中,为文本样本检索数据与所述文本样本检索数据之间的第二特征项。
根据图像-文本特征,可以得到:
上述公式中,为图像样本检索数据与文本样本检索数据之间的第三特征项。
根据文本-图像特征,可以得到:
上述公式中,为文本样本检索数据与所述图像样本检索数据之间的第四特征项。
依据上述内容,以图像特征为例,其中Q=XWQ、K=XWK、V=XWV,依据第一特征项,第二特征项,第三特征项与第四特征项,构建组合特征Z,如下:
Z=Attention(Qx,Kx,Vx)+Attention(Qy,Ky,Vy)+Attention(Qx,Ky,Vx)+Attention(Qy,Kx,Vy);
将Z输入到线性激活函数f(Z)=ZW+b中,得到提取后的特征M,即为联合数据特征M。
在确定出联合数据特征M后,可以构造损失函数,其构造的损失函数公式如下:
上述公式中,minLoss为最小损失函数,X为表示图像哈希码,Y为文本哈希码,M为联合数据特征,||X-M||2为第一损失函数项,||Y-M||2为第二损失函数项,为第三损失函数项。
在上述实现步骤中,基于损失函数,采用样本数据对初始模型进行训练,得到目标检索模型。
通过所述可选实施方式,可以达到至少以下几点有益效果:
(1)由于目标检索哈希值是通过目标数据特征中每个特征值与预定阈值的预定大小关系而确定的,即,目标检索哈希值确定过程可以根据具体的需求和任务进行调整和优化,通过这样的步骤,可以将目标数据特征转化为目标检索哈希值,以便在检索任务中进行快速和高效的匹配和筛选;
(2)由于目标联合数据特征可以描述图像样本检索数据和文本样本检索数据之间关系数据特征,这个特征表示将图像样本检索数据和文本样本检索数据的信息进行了融合,在一定程度上可以提高目标数据特征匹配和目标检索数据匹配的准确性;
(3)由于损失函数是基于联合数据特征进行建立的,是用来在训练模型时,不断更新模型参数,直至模型收敛,最终确定最优的目标检索模型的,即,通过构建的最小化损失函数,可以使训练模型在给定的任务上更加准确和优化。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据所述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
根据本发明实施例,还提供了一种用于实施上述数据检索方法的装置,图2是根据本申请实施例提供的数据检索装置的结构框图,如图2所示,该装置包括:执行模块201,提取模块202,映射模块203,第一确定模块204,第二确定模块205和第三确定模块206,下面对该装置进行详细说明。
执行模块201,用于响应对目标检索数据的检索请求,执行下述检索步骤,其中,检索请求用于请求检索与目标检索数据相似的数据:
提取模块202,连接于上述执行模块201,用于提取目标检索数据的初始数据特征,其中,初始数据特征对应的维度数为初始维度数;
映射模块203,连接于上述提取模块202,用于映射初始数据特征,得到目标数据特征,其中,目标数据特征对应的维度数为目标维度数;
第一确定模块204,连接于上述映射模块203,用于依据目标数据特征,确定目标检索哈希值;
第二确定模块205,连接于上述第一确定模块204,用于确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;
第三确定模块206,连接于上述第二确定模块205,用于依据相似指数,确定与目标检索数据对应的目标检索结果。
此处需要说明的是,所述执行模块201,提取模块202,映射模块203,第一确定模块204,第二确定模块205和第三确定模块206对应于实施数据检索方法中的步骤S101至步骤S106,多个模块与对应的步骤所实现的实例和应用场景相同,但不限于所述实施例所公开的内容。
本申请实施例提供的数据检索装置,可以实现响应对目标检索数据的检索请求,执行下述检索步骤,其中,检索请求用于请求检索与目标检索数据相似的数据:提取目标检索数据的初始数据特征,其中,初始数据特征对应的维度数为初始维度数;映射初始数据特征,得到目标数据特征,其中,目标数据特征对应的维度数为目标维度数;依据目标数据特征,确定目标检索哈希值;确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;达到依据相似指数,确定与目标检索数据对应的目标检索结果的目的,由于目标数据特征是通过映射初始数据特征得到的,从而实现了确保目标数据特征表示的一致性和目标维度数的一致性,在一定程度上可以提高目标数据特征匹配和目标检索数据匹配的准确性的技术效果。进而解决了相关技术中,对与目标数据相似的数据进行检索时,存在的检索准确度低的技术问题。
所述数据检索装置包括处理器和存储器,所述多个模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的所述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决了相关技术中,对与目标数据相似的数据进行检索时,存在的检索准确度低的技术问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(lashRAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现数据检索方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时数据检索方法。
图3是本发明实施例提供的电子设备的示意图,如图3所示,本发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:响应对目标检索数据的检索请求,执行下述检索步骤,其中,检索请求用于请求检索与目标检索数据相似的数据:提取目标检索数据的初始数据特征,其中,初始数据特征对应的维度数为初始维度数;映射初始数据特征,得到目标数据特征,其中,目标数据特征对应的维度数为目标维度数;依据目标数据特征,确定目标检索哈希值;确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;依据相似指数,确定与目标检索数据对应的目标检索结果。
可选地,响应对目标检索数据的检索请求,执行下述检索步骤,包括:响应于检索请求,将目标检索数据输入至目标检索模型中,目标检索模型执行检索步骤,其中,目标检索模型通过样本数据训练初始模型得到,样本数据包括,样本检索数据,与样本检索数据对应的样本检索结果。
可选地,方法还包括:采用以下方式对样本数据进行训练,得到目标检索模型:在样本检索数据包括图像样本检索数据与文本样本检索数据的情况下,获取初始模型,以及构造用于模型训练的损失函数,其中,损失函数包括第一损失函数项,第二损失函数项以及第三损失函数项,第一损失函数项用于保持图像样本检索数据对应的第一样本数据特征与联合数据特征之间的相似性,第二损失函数项用于保持文本样本检索数据对应的第二样本数据特征与联合数据特征之间的相似性,以及第三损失函数项用于保持联合数据特征与真实相似性矩阵之间的相似性;基于损失函数,采用样本数据对初始模型进行训练,得到目标检索模型。
可选地,确定联合数据特征,包括:确定图像样本检索数据与图像样本检索数据之间的第一特征项,确定文本样本检索数据与文本样本检索数据之间的第二特征项,确定图像样本检索数据与文本样本检索数据之间的第三特征项,确定文本样本检索数据与图像样本检索数据之间的第四特征项;依据第一特征项,第二特征项,第三特征项与第四特征项,构建组合特征;将组合特征代入至预定线性激活函数中,得到联合数据特征。
可选地,确定图像样本检索数据与图像样本检索数据之间的第一特征项,确定文本样本检索数据与文本样本检索数据之间的第二特征项,确定图像样本检索数据与文本样本检索数据之间的第三特征项,确定文本样本检索数据与图像样本检索数据之间的第四特征项,包括:确定图像样本检索数据对应的第一查询向量,与图像样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第一比例,并确定文本样本检索数据对应的第一查询向量,与文本样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第二比例,并确定图像样本检索数据对应的第一查询向量,与文本样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第三比例,并确定文本样本检索数据对应的第一查询向量,与图像样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第四比例;将第一比例、第二比例、第三比例与第四比例分别输入至预定概率分布转换函数中,得到分别对应的第一结果、第二结果、第三结果与第四结果;确定第一结果与图像样本检索数据对应的第三查询向量的乘积为第一特征项,第二结果与文本样本检索数据对应的第三查询向量的乘积为第二特征项,第一结果与图像样本检索数据对应的第三查询向量的乘积为第三特征项,第一结果与文本样本检索数据对应的第三查询向量的乘积为第四特征项。
可选地,方法还包括:采用以下方式获取样本数据:确定与预定数据库中数据分别对应的检索结果;将预定数据库中数据,以及与预定数据库中数据分别对应的检索结果作为样本数据。
可选地,依据目标数据特征,确定目标检索哈希值,包括:确定目标数据特征中每个特征值与预定阈值的大小关系,得到预定大小关系;将预定大小关系中,对应的特征值大于预定阈值的特征值更新为第一预定值,对应的特征值小于或等于预定阈值的特征值更新为第二预定值,得到目标检索哈希值,其中,第一预定值高于第二预定值。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:响应对目标检索数据的检索请求,执行下述检索步骤,其中,检索请求用于请求检索与目标检索数据相似的数据:提取目标检索数据的初始数据特征,其中,初始数据特征对应的维度数为初始维度数;映射初始数据特征,得到目标数据特征,其中,目标数据特征对应的维度数为目标维度数;依据目标数据特征,确定目标检索哈希值;确定目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;依据相似指数,确定与目标检索数据对应的目标检索结果。
可选地,响应对目标检索数据的检索请求,执行下述检索步骤,包括:响应于检索请求,将目标检索数据输入至目标检索模型中,目标检索模型执行检索步骤,其中,目标检索模型通过样本数据训练初始模型得到,样本数据包括,样本检索数据,与样本检索数据对应的样本检索结果。
可选地,方法还包括:采用以下方式对样本数据进行训练,得到目标检索模型:在样本检索数据包括图像样本检索数据与文本样本检索数据的情况下,获取初始模型,以及构造用于模型训练的损失函数,其中,损失函数包括第一损失函数项,第二损失函数项以及第三损失函数项,第一损失函数项用于保持图像样本检索数据对应的第一样本数据特征与联合数据特征之间的相似性,第二损失函数项用于保持文本样本检索数据对应的第二样本数据特征与联合数据特征之间的相似性,以及第三损失函数项用于保持联合数据特征与真实相似性矩阵之间的相似性;基于损失函数,采用样本数据对初始模型进行训练,得到目标检索模型。
可选地,确定联合数据特征,包括:确定图像样本检索数据与图像样本检索数据之间的第一特征项,确定文本样本检索数据与文本样本检索数据之间的第二特征项,确定图像样本检索数据与文本样本检索数据之间的第三特征项,确定文本样本检索数据与图像样本检索数据之间的第四特征项;依据第一特征项,第二特征项,第三特征项与第四特征项,构建组合特征;将组合特征代入至预定线性激活函数中,得到联合数据特征。
可选地,确定图像样本检索数据与图像样本检索数据之间的第一特征项,确定文本样本检索数据与文本样本检索数据之间的第二特征项,确定图像样本检索数据与文本样本检索数据之间的第三特征项,确定文本样本检索数据与图像样本检索数据之间的第四特征项,包括:确定图像样本检索数据对应的第一查询向量,与图像样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第一比例,并确定文本样本检索数据对应的第一查询向量,与文本样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第二比例,并确定图像样本检索数据对应的第一查询向量,与文本样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第三比例,并确定文本样本检索数据对应的第一查询向量,与图像样本检索数据对应的第二查询向量的转置向量的乘积,与目标维度数的比例,得到第四比例;将第一比例、第二比例、第三比例与第四比例分别输入至预定概率分布转换函数中,得到分别对应的第一结果、第二结果、第三结果与第四结果;确定第一结果与图像样本检索数据对应的第三查询向量的乘积为第一特征项,第二结果与文本样本检索数据对应的第三查询向量的乘积为第二特征项,第一结果与图像样本检索数据对应的第三查询向量的乘积为第三特征项,第一结果与文本样本检索数据对应的第三查询向量的乘积为第四特征项。
可选地,方法还包括:采用以下方式获取样本数据:确定与预定数据库中数据分别对应的检索结果;将预定数据库中数据,以及与预定数据库中数据分别对应的检索结果作为样本数据。
可选地,依据目标数据特征,确定目标检索哈希值,包括:确定目标数据特征中每个特征值与预定阈值的大小关系,得到预定大小关系;将预定大小关系中,对应的特征值大于预定阈值的特征值更新为第一预定值,对应的特征值小于或等于预定阈值的特征值更新为第二预定值,得到目标检索哈希值,其中,第一预定值高于第二预定值。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(lashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种数据检索方法,其特征在于,包括:
响应对目标检索数据的检索请求,执行下述检索步骤,其中,所述检索请求用于请求检索与所述目标检索数据相似的数据:
提取所述目标检索数据的初始数据特征,其中,所述初始数据特征对应的维度数为初始维度数;
映射所述初始数据特征,得到目标数据特征,其中,所述目标数据特征对应的维度数为目标维度数;
依据所述目标数据特征,确定目标检索哈希值;
确定所述目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;
依据所述相似指数,确定与所述目标检索数据对应的目标检索结果。
2.根据权利要求1所述的方法,其特征在于,所述响应对目标检索数据的检索请求,执行下述检索步骤,包括:
响应于所述检索请求,将所述目标检索数据输入至目标检索模型中,所述目标检索模型执行所述检索步骤,其中,所述目标检索模型通过样本数据训练初始模型得到,所述样本数据包括,样本检索数据,与样本检索数据对应的样本检索结果。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:采用以下方式对所述样本数据进行训练,得到所述目标检索模型:
在所述样本检索数据包括图像样本检索数据与文本样本检索数据的情况下,获取初始模型,以及构造用于模型训练的损失函数,其中,所述损失函数包括第一损失函数项,第二损失函数项以及第三损失函数项,所述第一损失函数项用于保持所述图像样本检索数据对应的第一样本数据特征与联合数据特征之间的相似性,所述第二损失函数项用于保持所述文本样本检索数据对应的第二样本数据特征与所述联合数据特征之间的相似性,以及所述第三损失函数项用于保持所述联合数据特征与真实相似性矩阵之间的相似性;
基于所述损失函数,采用所述样本数据对所述初始模型进行训练,得到所述目标检索模型。
4.根据权利要求3所述的方法,其特征在于,确定所述联合数据特征,包括:
确定所述图像样本检索数据与所述图像样本检索数据之间的第一特征项,确定所述文本样本检索数据与所述文本样本检索数据之间的第二特征项,确定所述图像样本检索数据与文本样本检索数据之间的第三特征项,确定所述文本样本检索数据与所述图像样本检索数据之间的第四特征项;
依据所述第一特征项,所述第二特征项,所述第三特征项与所述第四特征项,构建组合特征;
将所述组合特征代入至预定线性激活函数中,得到所述联合数据特征。
5.根据权利要求4所述的方法,其特征在于,所述确定所述图像样本检索数据与所述图像样本检索数据之间的第一特征项,确定所述文本样本检索数据与所述文本样本检索数据之间的第二特征项,确定所述图像样本检索数据与文本样本检索数据之间的第三特征项,确定所述文本样本检索数据与所述图像样本检索数据之间的第四特征项,包括:
确定所述图像样本检索数据对应的第一查询向量,与所述图像样本检索数据对应的第二查询向量的转置向量的乘积,与所述目标维度数的比例,得到第一比例,并确定所述文本样本检索数据对应的第一查询向量,与所述文本样本检索数据对应的第二查询向量的转置向量的乘积,与所述目标维度数的比例,得到第二比例,并确定所述图像样本检索数据对应的第一查询向量,与所述文本样本检索数据对应的第二查询向量的转置向量的乘积,与所述目标维度数的比例,得到第三比例,并确定所述文本样本检索数据对应的第一查询向量,与所述图像样本检索数据对应的第二查询向量的转置向量的乘积,与所述目标维度数的比例,得到第四比例;
将所述第一比例、第二比例、第三比例与第四比例分别输入至预定概率分布转换函数中,得到分别对应的第一结果、第二结果、第三结果与第四结果;
确定第一结果与所述图像样本检索数据对应的第三查询向量的乘积为所述第一特征项,所述第二结果与所述文本样本检索数据对应的第三查询向量的乘积为所述第二特征项,第一结果与所述图像样本检索数据对应的第三查询向量的乘积为所述第三特征项,第一结果与所述文本样本检索数据对应的第三查询向量的乘积为所述第四特征项。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:采用以下方式获取所述样本数据:
确定与所述预定数据库中数据分别对应的检索结果;
将所述预定数据库中数据,以及与所述预定数据库中数据分别对应的检索结果作为所述样本数据。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述依据所述目标数据特征,确定目标检索哈希值,包括:
确定所述目标数据特征中每个特征值与预定阈值的大小关系,得到预定大小关系;
将所述预定大小关系中,对应的特征值大于预定阈值的特征值更新为第一预定值,对应的特征值小于或等于所述预定阈值的特征值更新为第二预定值,得到所述目标检索哈希值,其中,所述第一预定值高于所述第二预定值。
8.一种数据检索装置,其特征在于,包括:
执行模块,用于响应对目标检索数据的检索请求,执行下述检索步骤,其中,所述检索请求用于请求检索与所述目标检索数据相似的数据:
提取模块,用于提取所述目标检索数据的初始数据特征,其中,所述初始数据特征对应的维度数为初始维度数;
映射模块,用于映射所述初始数据特征,得到目标数据特征,其中,所述目标数据特征对应的维度数为目标维度数;
第一确定模块,用于依据所述目标数据特征,确定目标检索哈希值;
第二确定模块,用于确定所述目标检索哈希值分别与预定数据库中多个数据哈希值的相似指数;
第三确定模块,用于依据所述相似指数,确定与所述目标检索数据对应的目标检索结果。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310988576.2A CN117009599A (zh) | 2023-08-07 | 2023-08-07 | 数据检索方法、装置、处理器及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310988576.2A CN117009599A (zh) | 2023-08-07 | 2023-08-07 | 数据检索方法、装置、处理器及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117009599A true CN117009599A (zh) | 2023-11-07 |
Family
ID=88570771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310988576.2A Pending CN117009599A (zh) | 2023-08-07 | 2023-08-07 | 数据检索方法、装置、处理器及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117009599A (zh) |
-
2023
- 2023-08-07 CN CN202310988576.2A patent/CN117009599A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021082953A1 (zh) | 机器阅读理解方法、设备、存储介质及装置 | |
CN108875074B (zh) | 基于交叉注意力神经网络的答案选择方法、装置和电子设备 | |
CN111274811B (zh) | 地址文本相似度确定方法以及地址搜索方法 | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN111159485B (zh) | 尾实体链接方法、装置、服务器及存储介质 | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
CN110795527B (zh) | 候选实体排序方法、训练方法及相关装置 | |
CN110990596B (zh) | 一种基于自适应量化多模态哈希检索方法及系统 | |
CN106033426A (zh) | 一种基于潜在语义最小哈希的图像检索方法 | |
US11461613B2 (en) | Method and apparatus for multi-document question answering | |
CN113297410A (zh) | 一种图像检索方法、装置、计算机设备及存储介质 | |
CN111309878B (zh) | 检索式问答方法、模型训练方法、服务器及存储介质 | |
CN115062134B (zh) | 知识问答模型训练及知识问答方法、装置和计算机设备 | |
CN112214623A (zh) | 一种面向图文样本的高效监督图嵌入跨媒体哈希检索方法 | |
CN114547267A (zh) | 智能问答模型的生成方法、装置、计算设备和存储介质 | |
CN111090765B (zh) | 一种基于缺失多模态哈希的社交图像检索方法及系统 | |
CN112668608A (zh) | 一种图像识别方法、装置、电子设备及存储介质 | |
CN114239805A (zh) | 跨模态检索神经网络及训练方法、装置、电子设备、介质 | |
CN116932730B (zh) | 基于多叉树和大规模语言模型的文档问答方法及相关设备 | |
CN113761124A (zh) | 文本编码模型的训练方法、信息检索方法及设备 | |
US11755671B2 (en) | Projecting queries into a content item embedding space | |
CN116150306A (zh) | 问答机器人的训练方法、问答方法及装置 | |
CN117009599A (zh) | 数据检索方法、装置、处理器及电子设备 | |
CN114692715A (zh) | 一种样本标注方法及装置 | |
CN117938951B (zh) | 信息推送方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |