CN105550368A - 一种高维数据的近似最近邻检索方法及检索系统 - Google Patents
一种高维数据的近似最近邻检索方法及检索系统 Download PDFInfo
- Publication number
- CN105550368A CN105550368A CN201610045628.2A CN201610045628A CN105550368A CN 105550368 A CN105550368 A CN 105550368A CN 201610045628 A CN201610045628 A CN 201610045628A CN 105550368 A CN105550368 A CN 105550368A
- Authority
- CN
- China
- Prior art keywords
- point
- data
- point set
- candidate
- high dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9027—Trees
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种高维数据的近似最近邻检索方法及检索系统,其中,方法包括:步骤1,建立初始化索引,以及高维数据库点集的最近邻表;步骤2,根据初始化索引,获得待检索数据点若干个最邻近点构成的初始候选点集;步骤3,构造临时点集,在最近邻表中查询初始候选点集中各数据点的若干个近邻点,并添加至临时点集中;步骤4,将临时点集中距离待检索数据点距离最小的若干个数据点作为新的候选点集;步骤5,将新的候选点集作为初始候选点集;重复步骤3~步骤5,直至候选点集中的数据点不再更新或者迭代次数达到预定值。利用本发明可以大大提高精度,候选最邻近点集具有指数级收敛速度,大大加快了检索速度,提高了高维数据最近邻点的检索效率。
Description
技术领域
本发明涉及数据检索技术领域,具体涉及一种高维数据的近似最近邻检索方法及检索系统。
背景技术
近年来,最近邻检索技术在计算机视觉、文本和图像检索、数据聚类等需要处理大规模高维数据的领域中扮演着十分重要的角色。最近邻检索讨论的对象是大规模高维数据点,要求能快速地在这些数据点中找到距离某个检索点最近的若干数据点。
最近邻检索的最基本方法是线性扫描所有数据点与检索点的距离,并最终返回其中距离检索点最近的若干数据点。面对大规模高维数据,每一次计算两个数据点之间的原始度量都是非常耗费计算能力的过程,因而线性扫描的方法是十分低效、不切实际的。为了提高最近邻检索的效率,学者们提出了一些近似最近邻检索方法,这些检索方法的基本思路是通过牺牲一定精度,来提高检索效率。
常见的近似最近邻检索方法主要包括如下两类:
1)基于树结构的方法。首先对所有数据点进行分层次的划分,然后在检索时,从最高层的划分节点开始到最底层的划分节点进行比较和剪枝。经典的树结构有:KD树、R树和层次化Kmeans树等。
2)基于哈希的方法。首先用数据点来学习哈希函数,然后应用这些哈希函数将所有数据点编码成哈希编码来替代表示原来的高维数据内容,最后在最近邻检索时比较检索点和数据点在编码后的哈希编码之间的海明距离,选择其中海明距离最近的若干个点作为最终的最近邻点。为了进一步加速检索,可以使用哈希表来存储所有数据点;另一方面,为了提高检索精度,使用海明距离来选择最近邻点的候选点,然后再比较候选点和检索点之间的实际距离,并返回实际距离最近的若干候选点作为最近邻结果。
由于实际应用中数据的复杂性,在处理许多高维数据时,现有方法难以获得良好的效果。基于树结构的方法对高维数据进行最近邻检索时,面临着维度灾难带来的一些问题。而基于哈希的方法,若哈希编码较短,存在着精度低的问题;若哈希编码较长,则无法使用哈希表来剪枝检索。
发明内容
本发明提供了一种高维数据的近似最近邻检索方法,能够提高对高维数据进行最近邻检索时的效率。
一种高维数据的近似最近邻检索方法,包括:
步骤1,采用初始化检索方法对高维数据库点集,建立初始化索引,并建立所述高维数据库点集的最近邻表;
步骤2,根据初始化索引,获得待检索数据点在所述高维数据库点集中的若干个最邻近点,若干个最邻近点构成初始候选点集;
步骤3,构造临时点集,针对初始候选点集中的每个数据点,在最近邻表中查询该数据点的若干个近邻点,并将查到的各近邻点以及初始候选点添加至临时点集中;
步骤4,计算临时点集中所有数据点与待检索数据点的距离,将距离最小的若干个数据点作为新的候选点集;
步骤5,将新的候选点集作为初始候选点集;
步骤6,重复步骤3~步骤5,直至候选点集中的数据点不再更新或者迭代次数达到预定值,输出候选点集中距离待检索数据点最近的若干数据点作为近似最近邻数据点进行。
步骤1中的初始化检索方法可以采用现有技术中的任意一种,作为优选,所述初始化检索方法为层次化Kmeans树算法、随机化KD树算法、局部敏感哈希算法、哈希算法中的一种。
本发明中输入为待检索点和高维数据库点集,输出为待检索数据点在高维数据库点集中最邻近点。
本发明还提供了一种高维数据的近似最近邻检索系统,包括:
初始化模块,用于采用初始化检索方法对高维数据库点集,建立初始化索引,并建立所述高维数据库点集的最近邻表;
初始化检索模块,用于根据初始化索引,获得待检索数据点在所述高维数据库点集中的若干个最邻近点,若干个最邻近点构成初始候选点集;
临时点集更新模块,用于构造临时点集,针对初始候选点集中的每个数据点,在最近邻表中查询该数据点的若干个近邻点,并将查到的各近邻点添加至临时点集中;
候选点集更新模块,用于计算临时点集中所有数据点与待检索数据点的距离,将距离最小的若干个数据点作为新的候选点集;
检索结果输出模块,用于将新的候选点集作为初始候选点集,依次调用临时点集更新模块和候选点集更新模块,直至候选点集中的数据点不再更新或者迭代次数达到预定值,输出候选点集中距离待检索数据点最近的若干数据点作为近似最近邻数据点进行。
作为优选,所述初始化检索方法为层次化Kmeans树算法、随机化KD树算法、局部敏感哈希算法、其它各种增强版本哈希算法中的一种。
本发明提供的高维数据的近似最近邻检索方法通过初始化检索算法得到初始化候选点集,通过最近邻表扩展该初始化候选点集(将初始化候选点集中点的若干近邻点加入到候选点集中);计算候选点集中各候选点与所述检索点的实际距离,根据与待检索点的距离从所述候选近邻点中得出更好的近邻候选点集,反复迭代得到所述检索点的最近邻点集。
利用本发明可以大大提高精度,候选最邻近点集具有指数级收敛速度,大大加快了检索速度,提高高维数据最近邻点的检索效率。
附图说明
图1为本发明高维数据的近似最近邻检索方法的流程示意图;
图2为k取值1时,通过本发明与其他传统方式得到的recall值和检索时间比较图;
图3为k取值50时,通过本发明与其他传统方式得到的与通过其他传统方式得到的recall值和检索时间比较图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,高维数据的近似最近邻检索方法包括离线阶段和在线检索阶段,在离线阶段,对高维数据库点集建立最邻近表,同时采用初始化检索方法对高维数据库点集建立初始化索引。在线检索阶段包括步骤S101至步骤S104如下:
S101,对待检索数据点调用初始化检索方法,利用已经建立好的高维数据库点集初始化索引,在高维数据库内查找待检索数据点对应的p个最近邻点,p个最近邻点构成初始候选点集,在后续步骤中对于初始候选点集进行进一步优化,p为预先设定值。
初始化检索方法可以采用现有技术中的各种检索方法,例如,层次化Kmeans树算法(hierarchicalKmeanstree)、随机化KD树算法(randomisedKD-tree)、局部敏感哈希算法(LocalitySensitiveHashing,LSH)以及各种增强版本哈希算法。
初始化检索的目的在于给出一个初步的检索结果,即使初始化检索的结果与最终所需要的检索结果相去甚远,也不影响本发明后续步骤的进行,以及最终输出理想的结果。
S102,对初始候选点集中的每个数据点,用建立好的最近邻表查找到每个数据点对应的m个最邻近点,将找到的m个最邻近点以及初始候选点全部添加到临时点集内,m为设定值。临时点集为后续步骤找到更优的最邻近点提供参考。
S103,计算临时点集内的每个数据点与待检索数据点的距离,并按照距离大小进行升序排序,得到的排序结果中,选取前p个点进行候选点集的更新。
得到的新的候选点集内的p个点将比原来的p个点从直观上离待检索数据点更接近,迭代进行S102到S103步骤,候选点集内的数据点会渐渐稳定,当候选点集内的数据点不再更新或达到迭代次数上限则停止迭代,迭代次数上限为预先设定值。
S104,选取候选点集内部的,到待检索点距离最小的前k个点作为输出结果,也就是检索得到的最邻近点集,k为预先设定值。
为了更直观的描述得到的待检索点的最近邻点的精确度,对所述精确度进行量化,具体地,采用平均召回率量描述所述最近邻点的准确度,平均召回率的计算公式如下:
其中,q为待检索点的数量,k为每个检索点的最近邻点的数量,recall为所述最近邻点的平均精度,pi,j表示第i个待检索点的第j个最近邻点是否是准确的最近邻点,若是,pi,j为1,若否,pi,j为0。
由上述高维数据的近似最近邻检索方法可知,利用初始化索引得到初始化候选点集,通过最近邻表扩展该候选点集(将初始化候选点集中数据点的若干近邻点加入到候选点集中),计算候选点集中各候选点与检索点的实际距离,根据与待检索点的距离从候选近邻点中得出更好的近邻候选点集,反复迭代得到检索点的最近邻点集。
本发明充分利用了最近邻表法的快速收敛特性,并利用初始候选点集提供了很好的初始参数,大大提高了高维数据最近邻点的检索效率。
以下为本发明高维数据的近似最近邻检索方法的一个较佳的实现方式,具体过程如下:
以GIST图像特征数据为例对本实现方式作进一步的详细说明,如表1的GIST数据集信息表。
表1
数据集 | 基础集数据点数目 | 测试集数据点数目 | 维度 |
GIST | 1000000 | 10000 | 960 |
离线阶段,使用GIST数据集中的测试集(不同于基础集的数据点)的10000个数据点作为检索点,基础集的1000000个数据点为数据库点集。
步骤a、在GIST数据库集中建立随机KD树作为初始化索引,假设使用的随机KD树的个数为4,最大检查叶子节点的个数为128;
步骤b、计算出GIST数据基础集中每个数据点在基础集中的e个最近邻点,假设e的取值为10,以基础集中各个数据点的ID及其10个最近邻点ID建立最近邻表T。
检索阶段,使用以下步骤获得与待检索点距离最近的若干候选近邻点:
步骤1、设输入为待检索点,输出为该检索点在数据库中的k个最邻近点组成的集合R,k为预先设定值;构建待检索点的候选近邻点集合C,设定候选近邻点集合C的初始状态为空集,最大集合大小为p;
步骤2、使用随机KD树算法,根据建立好的数据库点集的KD树索引,对待检索点进行一次检索,获得待检索数据点的p个最邻近点,放入候选近邻点集合C中,作为初始候选近邻点集;
步骤3、构建临时点集M,初始化临时点集M为空集合,用作容纳初始候选点集C中的数据点对应的所有候选近邻点;
步骤4、根据最近邻表T获得候选邻近点集C中每个数据点的m个近邻点,以及候选近邻点集合C中的所有数据点,共得到(m+1)*p个点放入临时点集M中,m为设定值;
步骤5、计算临时点集M中每个数据点与对应的待检索点的距离,按照距离大小进行升序排序,得到距离最小的前p个点放入候选邻近点集C中替换之前的数据点,作为下一次迭代的新的候选邻近点集C;
步骤6、循环迭代执行步骤4至步骤5,直至达到设定的迭代次数,或者候选邻近点集C中的元素不再更新;
步骤7、将候选邻近点集C中与待检索点的距离最近的前k个点添加到集合R,得到待检索点的最近邻点集合。
采用平均召回率量计算k个最近邻点的准确度为:
其中,q为检索点的数量,取值为10000,k为每个检索点的最近邻点的数量,recall为最近邻点的平均精度,pi,j表示第i个检索点的第j个最近邻点是否是准确的最近邻点,若是,pi,j为1,若否,pi,j为0。
根据上述公式,计算得到最近邻点检索结果的recall值和消耗时间。在同样的数据集下测试局部敏感哈希算法、随机KD树算法的检索结果的recall值和检索时间。统计在最近邻点的数量k=1和k=50的情况下,通过本实施例得到的检索结果的recall值和消耗时间、以及局部敏感哈希算法、随机KD树算法得到的检索结果的recall值和检索时间。
图2是k取值1时,本实施例与其他传统算法检索时的recall值和检索时间的比较,图3为k取值50时,本实施例与其他传统算法检索时的recall值和检索时间比较。由图2和图3可知,检索时间相同的情况下,本实施例得到的检索结果的recall值明显高于局部敏感哈希算法和随机KD树算法的检索结果的recall值,因此,本发明提供的高维数据的近似最近邻检索方法的检索效率较高。
如图4所示,一种高维数据的近似最近邻检索系统,包括:
初始化模块,用于采用初始化检索方法对高维数据库点集,建立初始化索引,并建立所述高维数据库点集的最近邻表;
初始化检索模块,用于根据初始化索引,获得待检索数据点在所述高维数据库点集中的若干个最邻近点,若干个最邻近点构成初始候选点集;
临时点集更新模块,用于构造临时点集,针对初始候选点集中的每个数据点,在最近邻表中查询该数据点的若干个近邻点,并将查到的各近邻点添加至临时点集中;
候选点集更新模块,用于计算临时点集中所有数据点与待检索数据点的距离,将距离最小的若干个数据点作为新的候选点集;
检索结果输出模块,用于将新的候选点集作为初始候选点集,依次调用临时点集更新模块和候选点集更新模块,直至候选点集中的数据点不再更新或者迭代次数达到预定值,输出候选点集中距离待检索数据点最近的若干数据点作为近似最近邻数据点进行。
以上实施例的初始化检索算法可以任意替换,各种技术特征可以任意组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,例如除了实施例中提到的KD树算法以外,用任何其他近似最邻近检索算法作为初始化检索算法,都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (4)
1.一种高维数据的近似最近邻检索方法,其特征在于,包括:
步骤1,采用初始化检索方法对高维数据库点集,建立初始化索引,并建立所述高维数据库点集的最近邻表;
步骤2,根据初始化索引,获得待检索数据点在所述高维数据库点集中的若干个最邻近点,若干个最邻近点构成初始候选点集;
步骤3,构造临时点集,针对初始候选点集中的每个数据点,在最近邻表中查询该数据点的若干个近邻点,并将查到的各近邻点以及初始候选点添加至临时点集中;
步骤4,计算临时点集中所有数据点与待检索数据点的距离,将距离最小的若干个数据点作为新的候选点集;
步骤5,将新的候选点集作为初始候选点集;
步骤6,重复步骤3~步骤5,直至候选点集中的数据点不再更新或者迭代次数达到预定值,输出候选点集中距离待检索数据点最近的若干数据点作为近似最近邻数据点进行。
2.如权利要求1所述的高维数据的近似最近邻检索方法,其特征在于,所述初始化检索方法为层次化Kmeans树算法、随机化KD树算法、局部敏感哈希算法、其它各种增强版本哈希算法中的一种。
3.一种高维数据的近似最近邻检索系统,其特征在于,包括:
初始化模块,用于采用初始化检索方法对高维数据库点集,建立初始化索引,并建立所述高维数据库点集的最近邻表;
初始化检索模块,用于根据初始化索引,获得待检索数据点在所述高维数据库点集中的若干个最邻近点,若干个最邻近点构成初始候选点集;
临时点集更新模块,用于构造临时点集,针对初始候选点集中的每个数据点,在最近邻表中查询该数据点的若干个近邻点,并将查到的各近邻点以及初始候选点添加至临时点集中;
候选点集更新模块,用于计算临时点集中所有数据点与待检索数据点的距离,将距离最小的若干个数据点作为新的候选点集;
检索结果输出模块,用于将新的候选点集作为初始候选点集,依次调用临时点集更新模块和候选点集更新模块,直至候选点集中的数据点不再更新或者迭代次数达到预定值,输出候选点集中距离待检索数据点最近的若干数据点作为近似最近邻数据点进行。
4.如权利要求3所述的高维数据的近似最近邻检索系统,其特征在于,所述初始化检索方法为层次化Kmeans树算法、随机化KD树算法、局部敏感哈希算法、其它各种增强版本哈希算法中的一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610045628.2A CN105550368A (zh) | 2016-01-22 | 2016-01-22 | 一种高维数据的近似最近邻检索方法及检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610045628.2A CN105550368A (zh) | 2016-01-22 | 2016-01-22 | 一种高维数据的近似最近邻检索方法及检索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105550368A true CN105550368A (zh) | 2016-05-04 |
Family
ID=55829557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610045628.2A Pending CN105550368A (zh) | 2016-01-22 | 2016-01-22 | 一种高维数据的近似最近邻检索方法及检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105550368A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126571A (zh) * | 2016-06-20 | 2016-11-16 | 山东理工大学 | n维点集的增量式k近邻查询方法 |
CN106156281A (zh) * | 2016-06-25 | 2016-11-23 | 南京理工大学 | 基于Hash‑Cube空间层次划分结构的最近邻点集快速检索方法 |
CN106897366A (zh) * | 2017-01-12 | 2017-06-27 | 华南理工大学 | 基于人脸卷积神经网络和随机kd‑树森林的图像检索方法 |
CN107341210A (zh) * | 2017-06-26 | 2017-11-10 | 西安理工大学 | Hadoop平台下的C‑DBSCAN‑K聚类算法 |
CN108256058A (zh) * | 2018-01-16 | 2018-07-06 | 山东理工大学 | 一种基于微型计算平台的实时响应大媒体近邻检索方法 |
CN109299097A (zh) * | 2018-09-27 | 2019-02-01 | 宁波大学 | 一种基于哈希学习的在线高维数据最近邻查询方法 |
CN109889840A (zh) * | 2019-03-20 | 2019-06-14 | 北京大学深圳研究生院 | 点云编码和解码的方法、编码设备和解码设备 |
CN110134804A (zh) * | 2019-05-20 | 2019-08-16 | 北京达佳互联信息技术有限公司 | 图像检索方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080033937A1 (en) * | 2000-02-25 | 2008-02-07 | Guang-Ho Cha | Indexing system and method for nearest neighbor searches in high dimensional data spaces |
CN103279551A (zh) * | 2013-06-06 | 2013-09-04 | 浙江大学 | 一种基于欧氏距离的高维数据准确近邻快速检索方法 |
CN104081435A (zh) * | 2014-04-29 | 2014-10-01 | 中国科学院自动化研究所 | 一种基于级联二值编码的图像匹配方法 |
-
2016
- 2016-01-22 CN CN201610045628.2A patent/CN105550368A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080033937A1 (en) * | 2000-02-25 | 2008-02-07 | Guang-Ho Cha | Indexing system and method for nearest neighbor searches in high dimensional data spaces |
CN103279551A (zh) * | 2013-06-06 | 2013-09-04 | 浙江大学 | 一种基于欧氏距离的高维数据准确近邻快速检索方法 |
CN104081435A (zh) * | 2014-04-29 | 2014-10-01 | 中国科学院自动化研究所 | 一种基于级联二值编码的图像匹配方法 |
Non-Patent Citations (3)
Title |
---|
JINGDONG WANG 等: "Query-driven iterated neighborhood graph search for large scale indexing", 《PROCEEDINGS OF THE 20TH ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA》 * |
KIANA HAJEBI 等: "Fast Approximate Nearest-Neighbor Search with k-Nearest Neighbor Graph", 《PROCEEDINGS OF THE 22ND INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE》 * |
金仲明: "基于哈希算法的海量多媒体数据检索研究", 《中国博士学位论文全文数据库信息科技辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126571B (zh) * | 2016-06-20 | 2019-07-12 | 山东理工大学 | 实物表面采样数据的增量式k近邻查询方法 |
CN106126571A (zh) * | 2016-06-20 | 2016-11-16 | 山东理工大学 | n维点集的增量式k近邻查询方法 |
CN106156281A (zh) * | 2016-06-25 | 2016-11-23 | 南京理工大学 | 基于Hash‑Cube空间层次划分结构的最近邻点集快速检索方法 |
CN106897366A (zh) * | 2017-01-12 | 2017-06-27 | 华南理工大学 | 基于人脸卷积神经网络和随机kd‑树森林的图像检索方法 |
CN106897366B (zh) * | 2017-01-12 | 2019-11-15 | 华南理工大学 | 基于人脸卷积神经网络和随机kd-树森林的图像检索方法 |
CN107341210A (zh) * | 2017-06-26 | 2017-11-10 | 西安理工大学 | Hadoop平台下的C‑DBSCAN‑K聚类算法 |
CN108256058A (zh) * | 2018-01-16 | 2018-07-06 | 山东理工大学 | 一种基于微型计算平台的实时响应大媒体近邻检索方法 |
CN108256058B (zh) * | 2018-01-16 | 2021-05-07 | 山东理工大学 | 一种基于微型计算平台的实时响应大媒体近邻检索方法 |
CN109299097A (zh) * | 2018-09-27 | 2019-02-01 | 宁波大学 | 一种基于哈希学习的在线高维数据最近邻查询方法 |
CN109889840A (zh) * | 2019-03-20 | 2019-06-14 | 北京大学深圳研究生院 | 点云编码和解码的方法、编码设备和解码设备 |
CN109889840B (zh) * | 2019-03-20 | 2022-11-22 | 北京大学深圳研究生院 | 点云编码和解码的方法、编码设备和解码设备 |
CN110134804A (zh) * | 2019-05-20 | 2019-08-16 | 北京达佳互联信息技术有限公司 | 图像检索方法、装置及存储介质 |
CN110134804B (zh) * | 2019-05-20 | 2021-09-17 | 北京达佳互联信息技术有限公司 | 图像检索方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105550368A (zh) | 一种高维数据的近似最近邻检索方法及检索系统 | |
CN111327377B (zh) | 场强预测方法、装置、设备及存储介质 | |
CN102810113B (zh) | 一种针对复杂网络的混合型聚类方法 | |
CN102722531B (zh) | 一种云环境中基于分片位图索引的查询方法 | |
JP6784780B2 (ja) | 大規模再生可能エネルギーのデータについて確率モデルを構築する方法 | |
CN103116639A (zh) | 基于用户-物品二分图模型的物品推荐方法及系统 | |
US20190095461A1 (en) | Columnar database compression | |
CN104298778A (zh) | 一种基于关联规则树的轧钢产品质量的预测方法及系统 | |
CN107766433A (zh) | 一种基于Geo‑BTree的范围查询方法及装置 | |
Froese et al. | The border k-means clustering algorithm for one dimensional data | |
CN109840551B (zh) | 一种用于机器学习模型训练的优化随机森林参数的方法 | |
CN106203494A (zh) | 一种基于内存计算的并行化聚类方法 | |
CN103345496A (zh) | 多媒体信息检索方法和系统 | |
CN108549696B (zh) | 一种基于内存计算的时间序列数据相似性查询方法 | |
CN103455531A (zh) | 一种支持高维数据实时有偏查询的并行索引方法 | |
CN102722554A (zh) | 位置敏感哈希随机性减弱方法 | |
CN115795131B (zh) | 基于人工智能的电子档案分类方法、装置及电子设备 | |
CN105045806A (zh) | 一种面向分位数查询的概要数据动态分裂与维护方法 | |
Uguz et al. | A new algorithm based on artificial bee colony algorithm for energy demand forecasting in Turkey | |
Huan et al. | K-means text dynamic clustering algorithm based on KL divergence | |
CN101510315B (zh) | 产品stl模型的空间索引结构建立方法 | |
CN113326343B (zh) | 基于多级网格和文件索引的路网数据存储方法及系统 | |
CN104991741A (zh) | 一种基于键值模型的情境适配电网大数据存储方法 | |
CN114742593A (zh) | 一种物流仓储中心优化选址方法及系统 | |
WO2016112618A1 (zh) | 一种基于距离的求解二维空间中代表性节点集的算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160504 |
|
RJ01 | Rejection of invention patent application after publication |