CN110674331A - 信息处理方法、相关设备及计算机存储介质 - Google Patents
信息处理方法、相关设备及计算机存储介质 Download PDFInfo
- Publication number
- CN110674331A CN110674331A CN201810627600.9A CN201810627600A CN110674331A CN 110674331 A CN110674331 A CN 110674331A CN 201810627600 A CN201810627600 A CN 201810627600A CN 110674331 A CN110674331 A CN 110674331A
- Authority
- CN
- China
- Prior art keywords
- information
- feature
- processing
- queried
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 17
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 192
- 238000013139 quantization Methods 0.000 claims description 52
- 238000000034 method Methods 0.000 claims description 48
- 238000004891 communication Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 description 30
- 230000000875 corresponding effect Effects 0.000 description 29
- 238000000605 extraction Methods 0.000 description 21
- 238000004422 calculation algorithm Methods 0.000 description 15
- 238000013507 mapping Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- XXQCMVYBAALAJK-UHFFFAOYSA-N ethyl n-[4-[benzyl(2-phenylethyl)amino]-2-(2-phenylethyl)-1h-imidazo[4,5-c]pyridin-6-yl]carbamate Chemical compound N=1C=2C(N(CCC=3C=CC=CC=3)CC=3C=CC=CC=3)=NC(NC(=O)OCC)=CC=2NC=1CCC1=CC=CC=C1 XXQCMVYBAALAJK-UHFFFAOYSA-N 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/908—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Abstract
本发明实施例公开了一种信息处理方法,包括:获取待查询信息的初始特征信息;将所述待查询信息的初始特征信息进行特征处理,以获得所述待查询信息的目标特征信息,所述特征处理至少包括特征维度处理,用于将所述待查询信息的初始特征信息的数据维度处理为预设维度;根据所述待查询信息的目标特征信息,对m个候选信息进行第一检索操作,以获得第一检索结果;根据所述待查询信息的初始特征信息,对所述第一检索结果进行第二检索操作,以获得所述待查询信息对应的结果信息。采用本发明实施例,能够快捷、高效地实现信息检索。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及信息处理方法、相关设备及计算机存储介质。
背景技术
随着互联网技术的快速发展,人人网、微信以及微博等社交媒体的日益兴起,使得图像、文字等海量数据的共享成为可能。在互联网中,每时每刻都存在大量数据的传输和处理。以图像数据为例,据某市公安部门统计,公共场所中安装有两万个监控摄像头,每年将产生大约1400亿图像数据。
在如此海量图像数据中,如何快速、准确检索出用户所需查询的图像数据是目前的一个热门研究问题。
发明内容
本发明实施例公开了信息处理方法、相关设备及计算机存储介质,能够快捷、高效地实现信息检索。
第一方面,本发明实施例公开提供了一种信息处理方法,所述方法包括:
获取待查询信息的初始特征信息;
将所述待查询信息的初始特征信息进行特征处理,以获得所述待查询信息的目标特征信息,所述特征处理至少包括特征维度处理,所述特征维度处理用于将所述待查询信息的初始特征信息的数据维度处理为预设维度;
根据所述待查询信息的目标特征信息,对m个候选信息进行第一检索操作,以获得第一检索结果,m为正整数;
根据所述待查询信息的初始特征信息,对第一检索结果进行第二检索操作,以获得所述待查询信息对应的结果信息。
在一些可能的实施方式中,每个所述候选信息包括所述候选信息的初始特征信息和所述候选信息的目标特征信息,所述候选信息的目标特征信息与所述待查询信息的目标特征信息的数据维度相同;
所述第一检索操作具体包括:
根据所述待查询信息的目标特征信息对所述m个候选信息的目标特征信息进行检索,以获得第一检索结果,所述第一检索结果包括n个候选信息,n为小于m的正整数;
所述第二检索操作具体包括:
根据所述待查询信息的初始特征信息,对所述n个候选信息的初始特征信息进行检索,以获得所述待查询信息对应的结果信息。
在一些可能的实施例中,所述根据所述待查询信息的目标特征信息对所述m个候选信息的目标特征信息进行检索,以获得第一检索结果包括:将所述待查询信息的目标特征信息和所述m个候选信息的目标特征信息进行相似度对比,以获得所述第一检索结果,所述第一检索结果包括所述m个候选信息中相似度大于或等于第一阈值的n个候选信息;
所述根据所述待查询信息的初始特征信息,对所述n个候选信息的初始特征信息进行检索,以获得所述待查询信息对应的结果信息包括:将所述待查询信息的初始特征信息和所述n个候选信息的初始特征信息进行相似度对比,以获得所述待查询信息对应的结果信息,所述结果信息为所述n个候选信息中相似度大于或等于第二阈值的信息。
在一些可能的实施方式中,每个所述候选信息的目标特征信息是根据所述候选信息的初始特征信息获得的。
在一些可能的实施例中,所述候选信息的目标特征信息为将所述候选信息的初始特征信息进行特征处理后获得的,所述特征处理至少包括特征维度处理,所述特征维度处理用于将所述待查询信息的初始特征信息的数据维度处理为预设维度。
在一些可能的实施方式中,所述特征维度处理包括升维处理、降维处理以及等维处理中的任一项,
在所述待查询信息的初始特征信息的数据维度大于所述预设维度的情况下,所述特征维度处理为降维处理;
在所述待查询信息的初始特征信息的数据维度小于所述预设维度的情况下,所述特征维度处理为升维处理;
在所述待查询信息的初始特征信息的数据维度等于所述预设维度的情况下,所述特征维度处理为等维处理。
在一些可能的实施方式中,所述特征处理还包括特征均衡处理,所述特征均衡处理用于将第一特征信息进行特征均衡化,其中,均衡化后的第一特征信息按照预设规则分布,所述第一特征信息为所述特征维度处理后获得的特征信息。具体的,在对所述待查询信息进行特征处理时,所述第一特征信息为将所述待查询信息的初始特征信息进行所述特征维度处理后获得的特征信息。在对所述候选信息进行特征处理时,所述第一特征信息可为将所述候选信息的初始特征信息进行所述特征维度处理后获得的特征信息。
在一些可能的实施方式中,所述特征处理还包括特征量化处理,所述量化特征信息用于将第二特征信息进行特征量化,使得量化后的第二特征信息的存储空间小于或等于所述第二特征信息的存储空间,所述第二特征信息为所述特征维度处理后获得的特征信息。具体的,在对所述待查询信息进行特征处理时,所述第二特征信息为将所述待查询信息的初始特征信息进行所述特征维度处理后获得的特征信息。在对所述候选信息进行特征处理时,所述第二特征信息为将所述候选信息的初始特征信息进行所述特征维度处理后获得的特征信息。
在一些可能的实施方式中,所述特征处理还包括特征量化处理,所述量化特征信息用于将第三特征信息进行特征量化,使得量化后的第三特征信息的存储空间小于或等于所述第三特征信息的存储空间,所述第三特征信息为所述特征均衡处理后获得的特征信息。具体的,在对所述待查询信息进行特征处理时,所述第三特征信息为将所述待查询信息的初始特征信息进行所述特征均衡处理后获得的特征信息。在对所述候选信息进行特征处理时,所述第三特征信息为将所述候选信息的初始特征信息进行所述特征均衡处理后获得的特征信息。
在一些可能的实施方式中,每个所述候选信息的目标特征信息为非量化特征信息,每个所述候选信息还包括所述候选信息的索引信息,所述索引信息为量化特征信息,所述待查询信息的目标特征信息为非量化特征信息,
所述根据所述待查询信息的目标特征信息,对m个候选信息进行第一检索操作之前,所述方法还包括:根据所述m个候选信息的索引信息,获得所述m个候选信息的目标特征信息;
所述第一检索操作具体包括:根据所述待查询信息的非量化特征信息对所述m个候选信息的非量化特征信息进行检索,以获得第一检索结果,所述第一检索结果包括n个候选信息,n为小于m的正整数。
在一些可能的实施方式中,每个所述候选信息的目标特征信息为量化特征信息,所述待查询信息的目标特征信息为量化特征信息;
所述第一检索操作具体包括:根据所述待查询信息的量化特征信息对所述m个候选信息的量化特征信息进行检索,以获得第一检索结果,所述第一检索结果包括n个候选信息,n为小于m的正整数。
第二方面,本发明实施例提供了又一种终端设备,所述终端设备包括用于执行如上第一方面所述方法的功能单元。
第三方面,本发明实施例提供了又一种终端设备,包括存储器及与所述存储器耦合的处理器;所述存储器用于存储指令,所述处理器用于执行所述指令;其中,所述处理器执行所述指令时执行上述第一方面所描述的方法。
在一些可能的实施方式中,所述终端设备还包括与所述处理器耦合的显示器,所述显示器用于在所述处理器的控制下显示信息(具体可为待查询信息、候选信息、结果信息以及特征信息等)。
在一些可能的实施方式中,所述终端设备还包括通信接口,所述通信接口与所述处理器通信,所述通信接口用于在所述处理器的控制下与其他设备(如网络设备等)进行通信。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储了用于业务切换处理的程序代码。所述程序代码包括用于执行上述第一方面所描述的方法的指令。
通过实施本发明实施例,能够解决现有技术中图像检索时难以保证检索的高效性、便捷性以及通用性不高等问题,从而能够快捷、高效、准确地实现信息检索。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1是现有技术提供的一种图像查询系统的示意框图。
图2是本发明实施例提供的一种网络架构示意图。
图3是本发明实施例提供的一种信息处理方法的流程示意图。
图4是本发明实施例提供的另一种信息处理方法的流程示意图。
图5A和5B是本发明实施例提供的两种终端设备的结构示意图。
具体实施方式
下面将结合本发明的附图,对本发明实施例中的技术方案进行详细描述。
首先,介绍本申请涉及的一些技术术语。
初始特征信息:也名深度特征信息。指使用特征提取算法对指定信息进行特征提取后获得的特征信息。通常,所述初始特征信息用n0*1的矩阵/向量表示。n0表示数据维度,为正整数。
所述指定信息包括但不限于图像信息、文本信息以及语音信息等等。所述特征提取算法可为用户侧或系统侧自定义设置的,例如卷积神经网络等深度学习算法。其中,不同特征提取算法对应获得的初始特征信息的数据维度可不相同。
匹配特征信息:指对初始特征信息进行特征维度处理(特征匹配)后获得的信息。由于不同特征提取算法获得的初始特征信息的数据维度不相同,可能导致信息处理的通用性不好。因此可对所述初始特征信息进行特征维度处理,以获得数据维度为预设维度的匹配特征信息。即,输入不同数据维度的初始特征信息,可获得对应相同数据维度的匹配特征信息,具体将在下文进行详述。
以图像A和B各自的初始特征信息为例,初始特征信息A的数据维度大于初始特征信息B的数据维度。对初始特征信息A和初始特征信息B分别进行特征维度处理后,可获得初始特征信息A对应的匹配特征信息以及初始特征信息B对应的匹配特征信息,且两个图像的匹配特征信息具有相同的数据维度。关于如何进行特征维度处理具体在本申请下文进行阐述,这里不再赘述。
均衡特征信息:指对特征信息(具体可为初始特征信息或匹配特征信息)进行特征均衡处理后获得的信息。由于信息特征提取后或特征匹配后获得的特征信息,各维度数据分布不均匀。可理解为各维度上所包括/指示的信息不相同,一些维度上数据偏大,一些维度上数据偏小,即特征分布不均匀。这将导致信息处理的精度不高。因此,本申请可对特征信息进行特征均衡处理,以便后续利用均衡特征信息进行相关处理。关于如何实现特征均衡将在本申请下文进行阐述,这里不再赘述。
量化特征信息:指对特征信息(具体可为初始特征信息、匹配特征信息以及均衡特征信息中的任一项)进行特征量化处理后获得的信息。在海量数据处理过程中,由于数据量的庞大导致内存空间占用较大,为实现信息处理的高效性以及降低内存空间的占用率,本申请可对特征信息进行特征量化,以便后续利用量化特征信息进行相关的信息处理,具体在本申请下文进行阐述,这里不再赘述。
非量化特征信息:指未经过特征量化处理的特征信息,其具体可为所述匹配特征信息或者所述均衡特征信息。
哈希码:利用哈希函数将数据打乱混合,重新创建出的数值称为哈希码。哈希函数可把信息或数据压缩成摘要,使得数据量变小,同时固定了数据的格式。
海明距离:两个码字中对应比特位置上取值不同的比特数,可称为这两个码字的海明距离。以哈希码10101和0110为例,从左到右,有第一位、第四位以及第五位上的比特数不同,则这两个码字之间的海明距离为3。
余弦距离:利用如下公式(1)可计算两个信息x和y之间的余弦距离d。其中,信息x和信息y可用向量表示。
申请人在提出本申请的过程中发现:在海量数据的情况下,如何快速、准确地查询出用户所需查询的数据是一个热点研究的问题。以图像查询为例,如图1示出现有技术提供的一种图像查询的示意框图。
如图1,用户输入一张查询图像到图像查询系统中,可利用特征提取器11对查询图像10进行特征提取,以获得该查询图像的特征信息(图示为查询图像特征14)。相应地,该图像查询系统中预先配置有图像数据库12,该图像数据库中包括有多张候选图像。将图像数据库中的候选图像输入特征提取器中进行特征提取,以获得对应的图像特征库13。该图像特征库中包括有每张候选图像的特征信息(也可称为候选图像特征)。进一步地,再通过相似度检索15,从图像特征库中查询出与所述查询图像特征相似度排列前n1位的候选图像特征,进而输出前n1位的候选图像的索引(或标识)。将前n1位的候选图像作为最终的查询结果16,输出并展示给用户查看。其中,n1可为用户侧或系统侧自定义设置的正整数。
在实践中发现,特征提取器通常利用深度学习网络来提取图像的特征信息。为保证处理精度,通常特征信息的数据维度较高,一般不低于256维。由于图像数据库中存在海量的图像,相应地图像特征库中存在海量图像的特征信息,其所占用的内存空间较大。且,在相似度检索过程中,将面对巨大的计算量,一般中央处理器CPU的计算能力无法胜任,需使用图像处理器GPU等加速设备来完成,但也很难保证图像查询的高效、便捷性。
此外,图像查询系统的通用性不佳。为保障相似度检索的可实现性,系统中特征提取器支持单一的特征提取算法,使得查询图像的特征信息和候选图像的特征信息具有相同的数据维度;而不适应/支持多种特征提取算法,由于不同特征提取算法对应计算的图像特征信息的数据维度可不相同,无法很好地实现相似度的快速检索。
为解决上述问题,本申请提出一种信息处理方法以及所述方法适用的终端设备。首先参见图2,本申请提出一种可能的终端设备的网络架构示意图。如图2,该网络架构示意图由硬件部分100和软件部分组成200。所述硬件部分包括信息通道102、硬盘(主机存储)104以及内存106。所述软件部分200包括特征提取单元202、特征处理单元204以及二次检索单元206。其中,
所述信息通道102,用于获取目标信息(例如待查询信息以及候选信息等)。所述目标信息具体可为图像信息、文本信息以及语音信息等,本申请不做限定。以所述目标信息为图像信息为例,所述信息通道可为摄像头、或者其他用于获得该图像信息的获取通道或元件。
所述硬盘104,用于存储所述目标信息的初始特征信息和/或所述目标信息。示例性地,当所述目标信息的数量为多个,可将多个目标信息各自的初始特征信息存入初始特征数据库中,并存放在设备硬盘中。
所述内存106,用于存储所述目标信息的目标特征信息,例如候选信息或待查询信息的量化特征信息、均衡特征信息以及匹配特征信息等。在所述目标信息的数量为多个时,可将多个目标信息各自的目标特征信息存入目标特征数据库中,并存放在设备内存中。便于信息检索时的高速并行计算,可提升信息检索的效率。所述内存具体可为图形处理器(graphics processing unit,GPU)、现场可编程门阵列(field-programmable gatearray,FPGA)以及专用芯片等等。
所述特征提取单元202,可用于对获得的所述目标信息进行特征提取,以获得该目标信息的初始特征信息,例如待查询信息的初始特征信息以及候选信息的初始特征信息等等。可选的,所述特征提取单元可将所述目标信息的初始特征信息存储至硬盘中。关于如何实现信息的特征提取,将在本申请下文进行详述。
所述特征处理单元204,可用于对目标信息的初始特征信息进行特征处理,以获得所述目标特征的目标特征信息。进一步地,可将所述目标特征信息的目标特征信息存储至所述内存中。关于所述特征处理以及所述目标特征信息具体将在本申请下文进行详述。
所述二次检索单元206,用于根据信息(具体可为候选信息和待查询信息)各自的目标特征信息和初始特征信息进行二次检索,以获得最终的检索结果信息。关于所述二次检索的具体将在本申请下文进行详述。
基于前述实施例,请参见图3是本发明实施例提供的一种信息处理方法。如图3所示的方法包括如下实施步骤:
步骤S102、终端设备获取待查询信息的初始特征信息。
终端设备可获取待查询信息,所述获取待查询信息的方式不做限定。例如,终端设备可从本地数据库中获取待查询信息,也可通过网络从其他设备中获取待查询信息等。所述待查询信息具体可为图像信息、文本信息以及语音信息等等,本申请不做限定。
步骤S104、终端设备将所述待查询信息的初始特征信息进行特征处理,以获得所述待查询信息的目标特征信息;所述特征处理至少包括特征维度处理,用于将所述待查询信息的初始特征信息的数据维度处理为预设维度。
所述特征处理还可包括特征均衡处理和/或特征量化处理。其中,所述特征均衡处理用于将特征信息进行特征均衡化,使得均衡化后的特征信息按照预设规则分布。所述特征量化处理用于将特征信息进行特征量化,使得量化后的特征信息的存储空间(或数据维度)小于量化前的特征信息的存储空间(或数据维度)。关于所述特征维度处理、所述特征均衡处理以及所述特征量化处理具体将在本申请下文进行详述。
步骤S106、终端设备根据所述待查询信息的目标特征信息,对m个候选信息进行第一检索操作,以获得第一检索结果,m为正整数。
步骤S108、终端设备根据所述待查询信息的初始特征信息,对所述第一检索结果进行第二检索操作,以获得所述待查询信息对应的结果信息。
终端设备可根据m个候选信息和所述待查询信息各自的目标特征信息以及初始特征信息进行二次检索,以获得所述待查询信息对应的结果信息;所述结果信息为所述m个候选信息中的信息,所述m个候选信息各自的目标特征信息为根据所述m个候选信息各自的初始特征信息获得的。
下面介绍本申请涉及的一些具体实施例和可选实施例。
步骤S102中,终端设备获得所述待查询信息后,可利用特征提取算法对所述待查询信息进行特征提取,从而获得所述待查询信息的初始特征信息。其中,不同厂商采用的特征提取算法可不同,相应地获得的所述待查询信息的初始特征信息的数据维度也可不同。所述特征提取算法为用于实现特征提取的算法,例如深度残差网络(resnet)、谷歌卷积神经网络(GoogLeNet)、感知器神经网络(perceptron neural network,PNN)、Hopfield网络、径向基(radial basis function,RBF)神经网络、反馈神经网络等深度学习算法。
所述待查询信息具体可为图像信息、文本信息、语音信息、或者其他形式的信息等,本申请不做限定。
步骤S104中,为适应不同厂商的信息检索系统,在获得所述待查询信息的初始特征信息后,还可对所述待查询信息的初始特征信息进行特征维度处理,以将所述初始特征信息的数据维度处理为预设维度。可选的,可将所述特征维度处理后获得的特征信息作为所述目标特征信息。即,将不同厂商提取获得的所述待查询信息的初始特征信息处理为预设维度的待查询信息的初始特征信息。所述预设维度可为用户侧或系统侧自定义设置的,其可为正整数,本申请不做限定。
具体的,终端设备可使用预存的特征匹配矩阵对所述待查询信息的初始特征信息进行特征维度处理,以将该待查询信息的初始特征信息的数据维度处理为预设维度。其中,所述特征匹配矩阵为系统侧预先使用第一样本信息训练获得的。所述第一样本信息可为小样本信息,例如所述第一样本信息的数量小于或等于预设数量等,关于如何使用所述第一样本信息训练本申请这里不做详述。
在一些实施例中,所述特征维度处理包括以下中的任一项:升维处理、降维处理以及等维处理。其中,当所述初始特征信息的数据维度大于预设维度的情况下,所述特征维度处理为降维处理;当所述初始特征信息的数据维度等于预设维度的情况下,所述特征维度处理为等维处理;当所述初始特征信息的数据维度小于预设维度的情况下,所述特征维度处理为升维处理。
具体的,在所述初始特征信息的数据维度大于预设维度时,所述终端设备可使用降维矩阵对所述待查询信息的初始特征信息进行降维处理,以获得预设维度的所述待查询信息的初始特征信息。在所述初始特征信息的数据维度等于预设维度时,所述终端设备可使用等维矩阵对所述待查询信息的初始特征信息进行等维处理,以获得预设维度的所述待查询信息的初始特征信息。在所述初始特征信息的数据维度小于预设维度时,所述终端设备可使用升维矩阵对所述待查询信息的初始特征信息进行升维处理,以获得预设维度的所述待查询信息的初始特征信息。其中,所述升维矩阵、所述降维矩阵以及所述等维矩阵具体可为终端设备预先训练获得的。
示例性地,终端设备在获得所述待查询信息的初始特征信息后,可将该初始特征信息的数据维度D与预设维度Dn比较。如果D=Dn,则特征匹配矩阵A为等维矩阵,例如该等维矩阵可为构建的单位矩阵I,即A=I。如果D>Dn,则特征匹配矩阵A为降维矩阵,例如本申请可随机选取小样本数据,利用主成分分析法计算获得降维矩阵A,关于如何利用主成分分析获得降维矩阵,本申请这里不做详述。如果D<Dn,则特征匹配矩阵A为升维矩阵,例如可采用预设的特征升维技术构建所述升维矩阵,如下公式(2)示出一种可能的升维矩阵。
其中,A为D×Dn的矩阵(或矩阵块),I为D×D的矩阵,0为对应维度的零矩阵。
在一些实施例中,所述特征处理还可包括特征均衡处理。所述特征均衡处理用于将第一特征信息进行特征均衡化,使得均衡化后的第一特征信息可按照预设规则分布。所述第一特征信息为所述特征维度处理后获得的所述待查询信息的特征信息,本申请也可称为匹配特征信息。可选的,可将所述特征均衡处理后获得的特征信息作为所述目标特征信息。
具体的,在所述特征维度处理后,终端设备还可使用特征均衡矩阵将第一特征信息(也为匹配特征信息)进行特征均衡化,使得均衡化后的第一特征信息(本申请也可称为均衡特征信息)可按照预设规则分布。其中,所述预设规则和所述特征均衡化的方式/手段关联,其可为用户侧或系统侧自定义设置的。例如,终端设备可采用随机投影、方差均衡、高斯均衡等技术来构建所述特征均衡矩阵。以高斯均衡为例,均衡化后的第一特征信息可呈高斯分布。
可选的,所述特征均衡矩阵可为终端设备预先使用第二样本信息进行训练获得的。所述第二样本信息可为小样本信息,具体可参见前述实施例中的相关阐述。所述第二样本信息和所述第一样本信息可以相同,也可不同。关于如何训练所述第二样本信息获得所述特征均衡矩阵,本申请这里不做详述。
示例性地,终端设备可采用高斯分布随机序列编码(Marsaglia polar)方法生成Dn×Dn个相互独立且服从标准正太分布的随机数,并将其排列为Dn×Dn的随机矩阵。进一步地,利用正交三角QR分解法分解该随机矩阵,得到随机正交矩阵以作为特征均衡矩阵R。进一步地,终端设备可利用该特征均衡矩阵R左乘所述特征维度处理后获得的匹配特征信息,可获得对应的均衡特征信息。
在一些实施例中,所述特征处理还可包括特征量化处理。所述特征量化处理用于将第二特征信息进行特征量化处理,使得量化后的第二特征信息(本申请也可称量化特征信息)的存储空间小于或等于第二特征信息的存储空间,或者,使得量化后的第二特征信息的数据维度小于或等于第二特征信息的数据维度。所述第二特征信息为所述特征维度处理后获得的特征信息(即前文的匹配特征信息)。或者,所述第二特征信息可为所述特征均衡处理后获得的特征信息(即前文的均衡特征信息)。可选的,可将所述特征量化处理后获得的特征信息作为所述目标特征信息。
具体的,终端设备可使用预设的特征量化模型对第二特征信息(具体可为匹配特征信息或均衡特征信息)进行特征量化,以获得对应的量化特征信息。所述量化特征信息的数据维度明显小于或等于量化前的特征信息的数据维度,这样可减少内存的存储空间。也就是说,所述量化特征信息的存储空间小于或等于量化前的特征信息的存储空间。所述特征量化模型具体可为用户侧或系统侧自定义设置的,也可为终端设备预先使用第三样本信息进行训练获得的。所述第三样本信息也可为小样本信息,其可与所述第一样本信息和所述第二样本信息相同,也可不同,本申请不做限定。
示例性地,以所述特征量化模型为哈希编码准则量化为例,如下公式(3)给出一种哈希编码准则:
其中,x为第二特征信息,具体可为特征信息中各维度的特征值。y为量化后的第二特征信息。以所述第二特征信息为8维特征信息为例,其具体为x=(-0.1,0.2,0.5,-1,1.7,0.8,-0.9,0.4)。相应地,利用上述哈希编码准则量化后获得的y=(0,1,1,0,1,1,0,1)。
在一些实施例中,本申请上述涉及的特征处理可被封装为特征处理模型。即,将所述待查询信息的初始特征信息输入所述特征处理模型中,进行相应的特征处理,以获得所述待查询信息的目标特征信息。其中,所述特征处理模型中至少包括特征维度处理,可选的还可包括特征均衡处理以及特征量化处理等操作,具体可参见前述实施例中的相关阐述,这里不再赘述。
步骤S106以及步骤S108为终端设备进行二次检索以检索获得所述待查询信息对应的结果信息的实施步骤,下面阐述S106以及S108中涉及的相关实施例。
步骤S106中,终端设备可根据所述待查询信息的目标特征信息对所述m个候选信息各自的目标特征信息进行检索,以获得第一检索结果,所述第一检索结果包括n个候选信息,n为小于m的正整数。进一步地,S108中终端设备可根据所述待查询信息的初始特征信息对所述第一检索结果中n个候选信息各自的初始特征信息进行检索,以获得所述待查询信息对应的结果信息。
其中,所述待查询信息的目标特征信息和每个所述候选信息的目标特征信息的数据维度相同。所述m个候选信息可为信息数据库中预存的信息。所述m个候选信息各自的目标特征信息是根据所述m个候选信息各自的初始特征信息获得的,具体将在本申请下文进行详述。
所述m个候选信息各自的目标特征信息可为信息特征数据库中预存的特征信息,所述候选信息的初始特征信息和所述候选信息的目标特征信息一一对应,其均可用同一所述候选信息的标识/索引来区分,本申请这里不做详述。
具体的,终端设备可先利用所述m个候选信息各自的目标特征信息和所述待查询信息的目标特征信息进行相似度对比,以获得n个候选信息。所述n个候选信息为所述m个候选信息中相似度大于或等于第一阈值的信息。可选的,n和m呈正相关,且均为正整数。进一步地,所述终端设备还可利用所述n个候选信息各自的初始特征信息和所述待查询信息的初始特征信息进行相似度对比,以获得对应的结果信息。所述结果信息为所述n个筛选信息中相似度大于或等于第二阈值的信息。所述第一阈值和所述第二阈值均为用户侧或系统侧自定义设置的,它们可以相同,也可不同,本申请不做限定。
所述相似度对比的具体实现方式有多种,例如可采用海明距离、余弦距离以及欧拉距离等方式来进行相似度的计算,进而实现相似度对比。以海明距离和余弦距离计算相似度为例,所述目标特征信息为采用哈希编码准则量化后获得的,则终端设备可利用m个候选信息各自的目标特征信息分别计算和所述待查询信息的目标特征信息之间的海明距离H,进而对获得的m个海明距离按照从低到高的顺序排列,选取前n个海明距离对应的候选信息的索引,作为所述n个筛选信息的索引。其中,n与m成正比,且小于等于m。
进一步地,终端设备根据所述n个候选信息的索引,获得所述n个候选信息各自的初始特征信息。进而,利用所述n个候选信息各自的初始特征信息分别计算和所述待查询信息的初始特征信息之间的余弦距离,进而将获得的n个余弦距离按照从高到低的顺序排列,选取前k个余弦距离对应的候选信息的索引,作为所述结果信息的索引。进而,根据获得的k个结果信息的索引,从信息数据库中获得与该索引对应的k个结果信息。可选的,可将k个结果信息展示给用户查看。其中,k和n(或者m)成正比。且,k小于等于n,并远远小于m。k为正整数。
在实际应用中,本申请可支持多信息并发检索。采用二次检索可更准确地实现信息检索。本申请涉及的初始特征信息可存储至初始特征数据库中,其可具体存储在终端设备的硬盘中。本申请涉及的目标特征信息(具体可为匹配特征信息、均衡特征信息以及量化特征信息)可存储至目标特征数据库中,其可具体存储在终端设备的内存中,例如图像处理器GPU、中央处理器CPU以及专用芯片等等。这样可避免信息检索时,存在大量数据的输入输出IO操作,有利于提高信息检索的效率,提高信息检索的响应时间。
在一些实施例中,下面示出步骤S106的几种可能实施方式:
在一些实施方式中,所述候选信息的目标特征信息以及所述待查询信息的目标特征信息均为匹配特征信息,则S106的具体实施方式为:终端设备可将所述待查询信息的匹配特征信息和所述m个候选信息各自的匹配特征信息进行相似度对比,以获得包括n个候选信息在内的第一检索结果。
其中,这里的相似度对比的实现方式可通过计算两种信息各自的匹配特征信息之间的余弦距离、欧式距离等方式实现,本申请这里不做详述。
在又一些实施方式中,所述候选信息的目标特征信息以及所述待查询信息的目标特征信息均为量化特征信息,则S106的具体实施方式为:终端设备可将所述待查询信息的量化特征信息和所述m个量化特征信息各自的量化特征信息进行相似度对比,以获得包括n个候选信息在内的第一检索结果。这里的相似度对比的实现方式可通过计算两种信息各自的量化特征信息之间的海明距离、余弦距离等方式来实现,这里不做详述。
在又一些实施方式中,所述候选信息还包括索引信息,所述索引信息为量化特征信息。所述候选信息的目标特征信息为非量化特征信息,所述待查询信息的目标特征信息为非量化特征信息,则在步骤S106之前,终端设备可根据所述m个候选信息各自的索引信息,获得所述m个候选信息各自的非量化特征信息。相应地S106的具体实施方式为:终端设备可将所述待查询信息的非量化特征信息和所述m个待查询信息各自的非量化特征信息进行相似度对比,以获得包括n个候选信息在内的第一检索结果。关于所述相似度对比可参见前述实施中你的相关阐述,这里不再赘述。
具体的,所述候选信息的量化特征信息(索引信息)可为预先存储在特征数据库中的特征信息。终端设备可根据预设映射表,根据所述候选信息的量化特征信息获得所述候选信息的非量化信息。其中,所述预设映射表为用户侧或系统侧自定义设置的。所述预设映射表中至少存储有所述候选信息的量化特征信息(即索引信息)和非量化特征信息(即目标特征信息)之间的映射关系。在实际应用中,为节省内存资源以及提升终端设备的信息处理效率,所述预设映射表可预先存储在终端设备的硬盘中,或者存储在其他设备(如服务器)中。当其需要被使用时,再读取/获取所述预设映射表。
具体实现时,存在以下两种具体实现方式:
第一种实施方式中,所述待查询信息的非量化特征信息为匹配特征信息,所述候选信息的索引信息为量化特征信息,所述候选信息的非量化特征信息为匹配特征信息。相应地,在S106之前,终端设备可根据预设映射表以及所述m个候选信息各自的量化特征信息,获得所述m个候选信息各自的匹配特征信息。进而在S106中,终端设备可根据所述待查询信息的匹配特征信息和所述m个候选信息各自的匹配特征信息,进行相似度对比,以获得包括n个候选信息在内的第一检索结果。其中,所述预设映射表中至少存储有所述m个候选信息各自对应的量化特征信息以及匹配特征信息之间的映射/关联关系,其中每个候选信息的量化特征信息和匹配特征信息一一对应,本申请这里不做详述。
第二种实施方式中,所述待查询信息的非量化特征信息为均衡特征信息,所述候选信息的索引信息为量化特征信息,所述候选信息的非量化特征信息为均衡特征信息。相应地,在S106之前,终端设备可根据预设映射表以及所述m个候选信息各自的量化特征信息,获得所述m个候选信息各自的均衡特征信息。进而在S106中,终端设备可根据所述待查询信息的均衡特征信息和所述m个候选信息各自的均衡特征信息,进行相似度对比,以获得包括n个候选信息在内的第一检索结果。其中,所述预设映射表中至少存储有所述m个候选信息各自对应的量化特征信息以及均衡特征信息之间的映射/关联关系,其中每个候选信息的量化特征信息和均衡特征信息一一对应,本申请这里不做详述。
在一些实施例中,S106之前终端设备还可获得所述m个候选信息各自的目标特征信息。所述m个候选信息各自的目标特征信息可为第一设备(具体可为终端设备或者其他设备)根据所述m个候选信息各自的初始特征信息获得的。可选的,在获得所述m个候选信息各自的目标特征信息后,可将其预先存储到信息特征数据库中,便于步骤S106执行时获取。
下面以终端设备处理获得所述m个候选信息各自的目标特征信息为例,具体如图4示出另一种信息处理方法的流程示意图。如图4所示的方法,可包括如下实施步骤:
步骤S202、终端设备获取m个候选信息各自的初始特征信息。
步骤S204、终端设备对所述m个候选信息各自的初始特征信息进行特征处理,以获得所述m个候选信息各自的目标特征信息。
步骤S202中,终端设备可先获取m个候选信息,然后对所述m个候选信息进行特征提取,以获得所述m个候选信息各自的初始特征信息。所述m个候选信息可为预设的信息数据库中的信息,所述信息具体可为图像信息、文本信息以及语音信息等等,本申请不做限定。所述m个候选信息获取的方式有多种,例如从本地数据库中获取、通过网络从其他设备中获取等方式,本申请不做详述。
步骤S204中,针对所述m个候选信息中的任一候选信息的初始特征信息进行特征处理时,所述特征处理可至少包括特征维度处理,所述特征维度处理用于将所述任一候选信息的初始特征信息的数据维度处理为预设维度。可选的,所述特征处理还可包括特征均衡处理和/或特征量化处理,关于所述特征处理具体可参见前述实施例中的相关阐述,这里不再赘述。
在实际应用中,针对所述待查询信息的初始特征信息的特征处理和针对所述任一候选信息的初始特征信息的特征处理可以相同,也可不同,其具体可由用户侧或系统侧配置。具体的,所述待查询信息的初始特征信息可利用第一特征处理模型进行对应的特征处理,所述任一候选信息的初始特征信息可利用第二特征处理模型进行对应的特征处理。所述第一特征模型和所述第二特征模型各自设置的特征操作处理可以相同,也可不同。
示例性地,以所述第一特征处理模型包括特征维度处理以及特征均衡处理,所述第二特征处理模型包括特征维度处理、特征均衡处理以及特征量化处理为例。将所述待查询信息的初始特征信息输入所述第一特征处理模型后,可依次进行特征维度处理以及特征均衡处理,从而获得所述待查询信息的目标特征信息。换句话说,此时所述待查询信息的目标特征信息为将所述待查询信息的初始特征信息依次进行特征维度处理以及特征均衡处理后获得的特征信息。相应地,对于所述m个候选信息中的任一候选信息的目标特征信息而言,其可为将所述任一候选信息的初始特征信息输入所述第二特征处理模型后,依次进行特征维度处理、特征均衡处理以及特征量化处理后获得的特征信息,本申请这里不做详述。
通过实施本发明实施例,能够解决现有技术中图像检索时难以保证检索的高效性、便捷性以及通用性不高等问题,从而能够快捷、高效、准确地实现信息检索。
上述主要从终端设备的角度出发对本发明实施例提供的方案进行了介绍。可以理解的是,终端设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。结合本发明中所公开的实施例描述的各示例的单元及算法步骤,本发明实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的技术方案的范围。
本发明实施例可以根据上述方法示例对终端设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本发明实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用集成的单元的情况下,图5A示出了上述实施例中所涉及的终端设备的一种可能的结构示意图。终端设备700包括:处理单元702和通信单元703。处理单元702用于对终端设备700的动作进行控制管理。示例性地,处理单元702用于支持终端设备700执行图3中步骤S104-S108,图4中步骤S204,和/或用于执行本文所描述的技术的其它步骤。通信单元703用于支持终端设备700与其它设备的通信,例如,通信单元703用于支持终端设备700执行图3中步骤S102,图4中步骤S202,和/或用于执行本文所描述的技术的其它步骤。可选的,终端设备700还可以包括存储单元701,用于存储终端设备700的程序代码和数据。
其中,处理单元702可以是处理器或控制器,例如可以是中央处理器(英文:Central Processing Unit,CPU),通用处理器,数字信号处理器(英文:Digital SignalProcessor,DSP),专用集成电路(英文:Application-Specific Integrated Circuit,ASIC),图形处理器(graphics processing unit,GPU),现场可编程门阵列(英文:FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信单元703可以是通信接口、收发器、收发电路等,其中,通信接口是统称,可以包括一个或多个接口,例如终端设备与其他设备之间的接口。存储单元701可以是存储器。
可选的,所述终端设备700还可包括显示单元(图未示)。所述显示单元可用于预览或显示信息,例如使用显示单元显示待查询信息、结果信息以及候选信息等。在实际应用中,所述显示单元可为显示器或播放器等,本申请不做限定。
可选的,当本申请涉及的信息为图像信息时,所述终端设备700还可包括摄像单元,可用于拍摄获得所述待查询信息以及候选信息等。在实际应用中,所述摄像单元可为摄像模组、摄像头等,本申请不做限定。
可选的,当本申请涉及的信息为语音信息时,所述终端设备700还可包括听筒、麦克风等音频元件,其可用于采集用户输入的语音信息(即待查询信息或候选信息等),本申请这里不做详述。
当处理单元702为处理器,通信单元703为通信接口,存储单元701为存储器时,本发明实施例所涉及的终端设备可以为图5B所示的终端设备。
参阅图5B所示,该终端设备710包括:处理器712、通信接口713、存储器77。可选地,终端设备710还可以包括总线714。其中,通信接口713、处理器712以及存储器77可以通过总线714相互连接;总线714可以是外设部件互连标准(英文:Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(英文:Extended Industry StandardArchitecture,简称EISA)总线等。所述总线714可以分为地址总线、数据总线、控制总线等。为便于表示,图5B中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
上述图5A或图5B所示的终端设备的具体实现还可以对应参照前述方法实施例的相应描述,此处不再赘述。
结合本发明实施例公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于随机存取存储器(英文:Random Access Memory,RAM)、闪存、只读存储器(英文:Read Only Memory,ROM)、可擦除可编程只读存储器(英文:ErasableProgrammable ROM,EPROM)、电可擦可编程只读存储器(英文:Electrically EPROM,EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于终端设备中。当然,处理器和存储介质也可以作为分立组件存在于终端设备中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (17)
1.一种信息处理方法,其特征在于,所述方法包括:
获取待查询信息的初始特征信息;
将所述待查询信息的初始特征信息进行特征处理,以获得所述待查询信息的目标特征信息,所述特征处理至少包括特征维度处理,所述特征维度处理用于将所述待查询信息的初始特征信息的数据维度处理为预设维度;
根据所述待查询信息的目标特征信息,对m个候选信息进行第一检索操作,以获得第一检索结果,m为正整数;
根据所述待查询信息的初始特征信息,对所述第一检索结果进行第二检索操作,以获得所述待查询信息对应的结果信息。
2.根据权利要求1所述方法,其特征在于,每个所述候选信息包括所述候选信息的初始特征信息和所述候选信息的目标特征信息,所述候选信息的目标特征信息与所述待查询信息的目标特征信息的数据维度相同;
所述第一检索操作具体包括:
根据所述待查询信息的目标特征信息对所述m个候选信息的目标特征信息进行检索,以获得第一检索结果,所述第一检索结果包括n个候选信息,n为小于m的正整数;
所述第二检索操作具体包括:
根据所述待查询信息的初始特征信息,对所述n个候选信息的初始特征信息进行检索,以获得所述待查询信息对应的结果信息。
3.根据权利要求1或2所述的方法,其特征在于,所述特征处理还包括特征均衡处理,所述特征均衡处理用于将第一特征信息进行特征均衡化,其中,均衡化后的第一特征信息按照预设规则分布,所述第一特征信息为所述待查询信息的初始特征信息进行所述特征维度处理后获得的特征信息。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述特征处理还包括特征量化处理,所述特征量化处理用于将第二特征信息进行特征量化,使得量化后的第二特征信息的存储空间小于或等于所述第二特征信息的存储空间,所述第二特征信息为将所述待查询信息的初始特征信息进行所述特征维度处理后获得的特征信息。
5.根据权利要求3中所述的方法,其特征在于,所述特征处理还包括特征量化处理,所述特征量化处理用于将第三特征信息进行特征量化,使得量化后的第三特征信息的存储空间小于或等于所述第三特征信息的存储空间,所述第三特征信息为将所述待查询信息的初始特征信息进行所述特征均衡处理后获得的特征信息。
6.根据权利要求1-3中任一项所述的方法,其特征在于,每个所述候选信息的目标特征信息为非量化特征信息,每个所述候选信息还包括所述候选信息的索引信息,所述索引信息为量化特征信息,
所述根据所述待查询信息的目标特征信息,对m个候选信息进行第一检索操作之前,所述方法还包括:
根据所述m个候选信息的索引信息,获得所述m个候选信息的目标特征信息。
7.根据权利要求4或5所述的方法,其特征在于,每个所述候选信息的目标特征信息为量化特征信息,所述待查询信息的目标特征信息为量化特征信息。
8.一种终端设备,其特征在于,包括通信单元以及处理单元;其中,
所述通信单元,用于获取待查询信息的初始特征信息;
所述处理单元,用于将所述待查询信息的初始特征信息进行特征处理,以获得所述待查询信息的目标特征信息,所述特征处理至少包括特征维度处理,所述特征维度处理用于将所述待查询信息的初始特征信息的数据维度处理为预设维度;
所述处理单元,还用于根据所述待查询信息的目标特征信息,对m个候选信息进行第一检索操作,以获得第一检索结果,m为正整数;
所述处理单元,还用于根据所述待查询信息的初始特征信息,对所述第一检索结果进行第二检索操作,以获得所述待查询信息对应的结果信息。
9.根据权利要求8所述的终端设备,其特征在于,每个所述候选信息包括所述候选信息的初始特征信息和所述候选信息的目标特征信息,所述候选信息的目标特征信息与所述待查询信息的目标特征信息的数据维度相同;
所述处理单元,具体用于根据所述待查询信息的目标特征信息对所述m个候选信息的目标特征信息进行检索,以获得第一检索结果,所述第一检索结果包括n个候选信息,n为小于m的正整数;
所述处理单元,还用于根据所述待查询信息的初始特征信息,对所述n个候选信息的初始特征信息进行检索,以获得所述待查询信息对应的结果信息。
10.根据权利要求8或9所述的终端设备,其特征在于,所述特征处理还包括特征均衡处理,所述特征均衡处理用于将第一特征信息进行特征均衡化,其中,均衡化后的第一特征信息按照预设规则分布,所述第一特征信息为所述特征维度处理后获得的所述待查询信息的特征信息。
11.根据权利要求8-10中任一项所述的终端设备,其特征在于,所述特征处理还包括特征量化处理,所述特征量化处理用于将第二特征信息进行特征量化,使得量化后的第二特征信息的存储空间小于或等于所述第二特征信息的存储空间,所述第二特征信息为将所述待查询信息的初始特征信息进行所述特征维度处理后获得的特征信息。
12.根据权利要求10所述的终端设备,其特征在于,所述特征处理还包括特征量化处理,所述特征量化处理用于将第三特征信息进行特征量化,使得量化后的第三特征信息的存储空间小于或等于所述第三特征信息的存储空间,所述第三特征信息为将所述待查询信息的初始特征信息进行所述特征均衡处理后获得的特征信息。
13.根据权利要求8-10中任一项所述的终端设备,其特征在于,每个所述候选信息的目标特征信息为非量化特征信息,每个所述候选信息还包括所述候选信息的索引信息,所述索引信息为量化特征信息,所述处理单元还用于根据所述待查询信息的目标特征信息,对m个候选信息进行第一检索操作之前,
所述处理单元还用于根据所述m个候选信息的索引信息,获得所述m个候选信息的目标特征信息。
14.根据权利要求11或12所述的终端设备,其特征在于,每个所述候选信息的目标特征信息为量化特征信息,所述待查询信息的目标特征信息为量化特征信息。
15.一种终端设备,其特征在于,包括存储器及与所述存储器耦合的处理器;所述存储器用于存储指令,所述处理器用于执行所述指令;其中,所述处理器执行所述指令时执行如上权利要求1-7中任一项所述的方法。
16.根据权利要求15所述的终端设备,其特征在于,还包括与所述处理器耦合的显示器,所述显示器用于在所述处理器的控制下显示信息。
17.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810627600.9A CN110674331A (zh) | 2018-06-15 | 2018-06-15 | 信息处理方法、相关设备及计算机存储介质 |
PCT/CN2019/091306 WO2019238125A1 (zh) | 2018-06-15 | 2019-06-14 | 信息处理方法、相关设备及计算机存储介质 |
EP19819377.3A EP3783503A4 (en) | 2018-06-15 | 2019-06-14 | INFORMATION PROCESSING METHODS, ASSOCIATED DEVICE AND COMPUTER STORAGE MEDIUM |
US17/070,738 US11734341B2 (en) | 2018-06-15 | 2020-10-14 | Information processing method, related device, and computer storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810627600.9A CN110674331A (zh) | 2018-06-15 | 2018-06-15 | 信息处理方法、相关设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110674331A true CN110674331A (zh) | 2020-01-10 |
Family
ID=68842758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810627600.9A Pending CN110674331A (zh) | 2018-06-15 | 2018-06-15 | 信息处理方法、相关设备及计算机存储介质 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11734341B2 (zh) |
EP (1) | EP3783503A4 (zh) |
CN (1) | CN110674331A (zh) |
WO (1) | WO2019238125A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111813964A (zh) * | 2020-09-14 | 2020-10-23 | 平安国际智慧城市科技股份有限公司 | 基于生态环境的数据处理方法及相关设备 |
CN112364009A (zh) * | 2020-12-03 | 2021-02-12 | 四川长虹电器股份有限公司 | 一种用于检索目标对象相似数据的方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339343A (zh) * | 2020-02-12 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 图像检索方法、装置、存储介质及设备 |
KR20230069763A (ko) * | 2021-11-12 | 2023-05-19 | 서울대학교산학협력단 | 신경망 네트워크의 셀프 어텐션 연산을 가속하는 장치 |
CN114707560B (zh) * | 2022-05-19 | 2024-02-09 | 北京闪马智建科技有限公司 | 数据信号的处理方法及装置、存储介质、电子装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150154229A1 (en) * | 2013-11-29 | 2015-06-04 | Canon Kabushiki Kaisha | Scalable attribute-driven image retrieval and re-ranking |
CN106033549A (zh) * | 2015-03-16 | 2016-10-19 | 北京大学 | 一种车辆检索中的重排序方法及装置 |
CN106886599A (zh) * | 2017-02-28 | 2017-06-23 | 北京京东尚科信息技术有限公司 | 图像检索方法以及装置 |
CN106886553A (zh) * | 2016-12-27 | 2017-06-23 | 浙江宇视科技有限公司 | 一种图像检索方法及服务器 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9035939B2 (en) * | 2010-10-04 | 2015-05-19 | Qualcomm Incorporated | 3D video control system to adjust 3D video rendering based on user preferences |
US8948518B2 (en) * | 2011-07-14 | 2015-02-03 | Futurewei Technologies, Inc. | Scalable query for visual search |
CN103425640A (zh) * | 2012-05-14 | 2013-12-04 | 华为技术有限公司 | 一种多媒体问答系统及方法 |
CN104125509B (zh) * | 2013-04-28 | 2015-09-30 | 腾讯科技(深圳)有限公司 | 节目识别方法、装置及服务器 |
CN104093079B (zh) * | 2014-05-29 | 2015-10-07 | 腾讯科技(深圳)有限公司 | 基于多媒体节目的交互方法、终端、服务器和系统 |
CN104023249B (zh) * | 2014-06-12 | 2015-10-21 | 腾讯科技(深圳)有限公司 | 电视频道识别方法和装置 |
CN104820696B (zh) | 2015-04-29 | 2018-06-05 | 山东大学 | 一种基于多标签最小二乘哈希算法的大规模图像检索方法 |
CN104881486A (zh) * | 2015-06-05 | 2015-09-02 | 腾讯科技(北京)有限公司 | 一种信息查询方法、终端设备及系统 |
US10516891B2 (en) * | 2015-11-20 | 2019-12-24 | Intel Corporation | Method and system of reference frame caching for video coding |
CN105512273A (zh) | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
CN105574506B (zh) | 2015-12-16 | 2020-03-17 | 深圳市商汤科技有限公司 | 基于深度学习和大规模集群的智能人脸追逃系统及方法 |
WO2018090367A1 (en) * | 2016-11-21 | 2018-05-24 | Intel Corporation | Method and system of video coding with reduced supporting data sideband buffer usage |
CN106778526B (zh) * | 2016-11-28 | 2019-11-12 | 中通服公众信息产业股份有限公司 | 一种基于汉明距离的大规模高效人脸识别方法 |
US10374765B2 (en) * | 2016-12-15 | 2019-08-06 | Qualcomm Incorporated | Quantized K-resource element row-column interleaver |
CN106875422B (zh) * | 2017-02-06 | 2022-02-25 | 腾讯科技(上海)有限公司 | 人脸跟踪方法和装置 |
CN114490630A (zh) * | 2017-04-25 | 2022-05-13 | 华为技术有限公司 | 一种查询处理方法、数据源注册方法及查询引擎 |
US10727996B2 (en) * | 2017-06-13 | 2020-07-28 | Qualcomm Incorporated | Null resource elements for dynamic and bursty inter-cell interference measurement in new radio |
CN107423398B (zh) * | 2017-07-26 | 2023-04-18 | 腾讯科技(上海)有限公司 | 交互方法、装置、存储介质和计算机设备 |
CN107679250B (zh) * | 2017-11-01 | 2020-12-01 | 浙江工业大学 | 一种基于深度自编码卷积神经网络的多任务分层图像检索方法 |
US11475351B2 (en) * | 2017-11-15 | 2022-10-18 | Uatc, Llc | Systems and methods for object detection, tracking, and motion prediction |
CN109089133B (zh) * | 2018-08-07 | 2020-08-11 | 北京市商汤科技开发有限公司 | 视频处理方法及装置、电子设备和存储介质 |
-
2018
- 2018-06-15 CN CN201810627600.9A patent/CN110674331A/zh active Pending
-
2019
- 2019-06-14 EP EP19819377.3A patent/EP3783503A4/en active Pending
- 2019-06-14 WO PCT/CN2019/091306 patent/WO2019238125A1/zh unknown
-
2020
- 2020-10-14 US US17/070,738 patent/US11734341B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150154229A1 (en) * | 2013-11-29 | 2015-06-04 | Canon Kabushiki Kaisha | Scalable attribute-driven image retrieval and re-ranking |
CN106033549A (zh) * | 2015-03-16 | 2016-10-19 | 北京大学 | 一种车辆检索中的重排序方法及装置 |
CN106886553A (zh) * | 2016-12-27 | 2017-06-23 | 浙江宇视科技有限公司 | 一种图像检索方法及服务器 |
CN106886599A (zh) * | 2017-02-28 | 2017-06-23 | 北京京东尚科信息技术有限公司 | 图像检索方法以及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111813964A (zh) * | 2020-09-14 | 2020-10-23 | 平安国际智慧城市科技股份有限公司 | 基于生态环境的数据处理方法及相关设备 |
CN112364009A (zh) * | 2020-12-03 | 2021-02-12 | 四川长虹电器股份有限公司 | 一种用于检索目标对象相似数据的方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2019238125A1 (zh) | 2019-12-19 |
EP3783503A4 (en) | 2021-07-28 |
US20210026891A1 (en) | 2021-01-28 |
US11734341B2 (en) | 2023-08-22 |
EP3783503A1 (en) | 2021-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674331A (zh) | 信息处理方法、相关设备及计算机存储介质 | |
CN106445939B (zh) | 图像检索、获取图像信息及图像识别方法、装置及系统 | |
CN110751224B (zh) | 视频分类模型的训练方法、视频分类方法、装置及设备 | |
CN105718502B (zh) | 用于高效特征匹配的方法和设备 | |
CN111242119B (zh) | 车辆图像的处理方法、装置、电子设备和计算机可读介质 | |
US11714921B2 (en) | Image processing method with ash code on local feature vectors, image processing device and storage medium | |
US8571255B2 (en) | Scalable media fingerprint extraction | |
CN114330565A (zh) | 一种人脸识别方法及装置 | |
CN112910890B (zh) | 基于时间卷积网络的匿名网络流量指纹识别方法及设备 | |
JP6042778B2 (ja) | 画像に基づくバイナリ局所特徴ベクトルを用いた検索装置、システム、プログラム及び方法 | |
CN112231516A (zh) | 视频摘要生成模型的训练方法、视频摘要生成方法及装置 | |
CN116977336A (zh) | 摄像头缺陷检测方法、装置、计算机设备及存储介质 | |
CN112307243A (zh) | 用于检索图像的方法和装置 | |
CN115359400A (zh) | 视频识别方法、装置、介质及电子设备 | |
CN111143619B (zh) | 视频指纹生成方法、检索方法、电子设备及介质 | |
CN110826365A (zh) | 一种视频指纹生成方法和装置 | |
CN109947728B (zh) | 一种日志文件的处理方法及装置 | |
CN114372169A (zh) | 一种同源视频检索的方法、装置以及存储介质 | |
CN112989093A (zh) | 检索方法、装置和电子设备 | |
CN113065530B (zh) | 人脸识别方法和装置、介质、设备 | |
CN115860783B (zh) | 一种基于人工智能的电商平台用户反馈分析方法及系统 | |
CN114077681B (zh) | 一种图像数据处理方法、装置、计算机设备及存储介质 | |
CN117475136A (zh) | 目标对象的图像确定方法及装置 | |
CN116204602A (zh) | 字码映射方法、装置、存储介质以及终端 | |
CN114943073A (zh) | 加密流量的通用对称加密协议脱壳方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |