CN112597155A - 数据搜索优化方法、设备、介质及计算机程序产品 - Google Patents

数据搜索优化方法、设备、介质及计算机程序产品 Download PDF

Info

Publication number
CN112597155A
CN112597155A CN202011475125.1A CN202011475125A CN112597155A CN 112597155 A CN112597155 A CN 112597155A CN 202011475125 A CN202011475125 A CN 202011475125A CN 112597155 A CN112597155 A CN 112597155A
Authority
CN
China
Prior art keywords
value
hash
hash code
binary
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011475125.1A
Other languages
English (en)
Inventor
吴锦和
范力欣
刘畅
张天豫
鞠策
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202011475125.1A priority Critical patent/CN112597155A/zh
Publication of CN112597155A publication Critical patent/CN112597155A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据搜索优化方法、设备、介质及计算机程序产品,所述数据搜索优化方法包括:获取三值哈希编码索引,并对所述三值哈希编码索引进行二值表示,获得二值哈希编码索引,获取预设三值哈希编码值对应的二值形式表示值,并基于所述二值哈希编码索引与所述二值形式表示值,计算所述三值哈希编码索引与所述预设三值哈希编码值之间的三值哈希编码距离,基于所述三值哈希编码距离,定位所述三值哈希编码索引对应的目标搜索数据。本申请解决了数据搜索的实现效果差的技术问题。

Description

数据搜索优化方法、设备、介质及计算机程序产品
技术领域
本申请涉及金融科技(Fintech)的计算机技术领域,尤其涉及一种数据 搜索优化方法、设备、介质及计算机程序产品。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如 分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要 求,如对金融业对应待办事项的分发也有更高的要求。
随着计算机技术的不断发展,计算机技术的应用也越来越广泛,计算机 为了便于进行数据搜索,通常会为存储的数据生成索引,目前,为了搜索加 速,通常将索引设置为二值哈希编码值,进而当进行数据搜索时,计算机通 过快速比对二值哈希编码值即可实现待搜索数据的定位,例如,在搜索猫的 图片时,首先将一张猫的图片哈希为猫图片类型对应的目标二值哈希编码值, 进而通过将该目标二值哈希编码值与预存储的二值哈希编码值进行比对,即 可找出所有已经存储的猫图片,但是,由于二值哈希编码仍然存在一定的误差,进而导致数据搜索的实现效果较差。
发明内容
本申请的主要目的在于提供一种数据搜索优化方法、设备、介质及计算 机程序产品,旨在解决现有技术中数据搜索的实现效果差的技术问题。
为实现上述目的,本申请提供一种数据搜索优化方法,所述数据搜索优 化方法应用于数据搜索优化设备,所述数据搜索优化方法包括:
获取三值哈希编码索引,并对所述三值哈希编码索引进行二值表示,获 得二值哈希编码索引;
获取预设三值哈希编码值对应的二值形式表示值,并基于所述二值哈希 编码索引与所述二值形式表示值,计算所述三值哈希编码索引与所述预设三 值哈希编码值之间的三值哈希编码距离;
基于所述三值哈希编码距离,定位所述三值哈希编码索引对应的目标搜 索数据。
本申请还提供一种数据搜索优化装置,所述数据搜索优化装置为虚拟装 置,且所述数据搜索优化装置应用于数据搜索优化设备,所述数据搜索优化 装置包括:
二值表示模块,用于获取三值哈希编码索引,并对所述三值哈希编码索 引进行二值表示,获得二值哈希编码索引;
距离计算模块,用于获取预设三值哈希编码值对应的二值形式表示值, 并基于所述二值哈希编码索引与所述二值形式表示值,计算所述三值哈希编 码索引与所述预设三值哈希编码值之间的三值哈希编码距离;
定位搜索模块,用于基于所述三值哈希编码距离,定位所述三值哈希编 码索引对应的目标搜索数据。
本申请还提供一种数据搜索优化设备,所述数据搜索优化设备为实体设 备,所述数据搜索优化设备包括:存储器、处理器以及存储在所述存储器上 并可在所述处理器上运行的所述数据搜索优化方法的程序,所述数据搜索优 化方法的程序被处理器执行时可实现如上述的数据搜索优化方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有实现数据 搜索优化方法的程序,所述数据搜索优化方法的程序被处理器执行时实现如 上述的数据搜索优化方法的步骤。
本申请还提供一计算机程序产品,包括计算机程序,所述计算机程序被 处理器执行时实现如上述的数据搜索优化方法的步骤。
本申请提供了一种数据搜索优化方法、设备、介质及计算机程序产品, 相比于现有技术采用的通过将索引设置为二值哈希编码值,进而当进行数据 搜索时,计算机通过快速比对二值哈希编码值即可实现待搜索数据的定位的 技术手段,其中,需要说明的是,三值哈希编码相比于二值哈希编码存在模 糊边界位表示不确定的比特位,进而三值哈希编码比二值哈希编码更加准确, 但在二值哈希编码由于只存在0和1,进而在电路上更容易实现,本申请首先 获取三值哈希编码索引,也即,将三值哈希编码作为索引,进而获取预设三值哈希编码值对应的二值形式表示值,并基于所述二值哈希编码索引与所述 二值形式表示值,计算所述三值哈希编码索引与所述预设三值哈希编码值之 间的三值哈希编码距离,进而实现了在二值机器上计算三值哈希编码之间的 距离的目的,进而基于所述三值哈希编码距离,即可定位所述三值哈希编码 索引对应的目标搜索数据,进而在数据搜索时,在基于三值哈希编码保证数 据搜索的准确性的前提下,在二值机器上实现了三值哈希编码之间的三值哈 希编码距离的计算,使得基于三值哈希编码的数据搜索更容易在电路上实现, 而由于目前的计算机大多数为二值机器,进而提高了基于三值哈希编码的数 据搜索在电路上实现时的便捷性,进一步提升了数据搜索的实现效果,所以, 克服了由于二值哈希编码仍然存在一定的误差,进而导致数据搜索的效果较 差的技术缺陷,所以,提高了数据搜索的实现效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申 请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于 本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这 些附图获得其他的附图。
图1为本申请数据搜索优化方法第一实施例的流程示意图;
图2为本申请数据搜索优化方法第二实施例的流程示意图;
图3为本申请实施例方案涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说 明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定 本申请。
本申请实施例提供一种数据搜索优化方法,在本申请数据搜索优化方法 的第一实施例中,参照图1,所述数据搜索优化方法包括:
步骤S10,获取三值哈希编码索引,并对所述三值哈希编码索引进行二值 表示,获得二值哈希编码索引;
在本实施例中,需要说明的是,所述数据搜索优化方法应用于搜索系统, 所述三值哈希编码索引为由三值哈希编码值构成的搜索索引,其中,所述三 值哈希编码值由三种取值类型的比特位值构成的哈希编码值,其中,所述比 特位值为所述三值哈希编码值中比特位上的取值,例如,所述比特位值对应 的三种取值类型可设置为1、0和-1,其中,1表示“是”,“-1”表示“不 是”,“0”表示“不确定”。
获取三值哈希编码索引,并对所述三值哈希编码索引进行二值表示,获 得二值哈希编码索引,具体地,获取三值哈希编码索引,并对所述三值哈希 编码索引中各比特位上的比特位值进行二值表示,以将所述三值哈希编码索 引转换为二值形式的哈希编码值,获得二值哈希编码索引,其中,所述二值 哈希编码索引为使用二值表示的三值哈希编码索引,例如,假设所述三值哈 希编码索引为(0,1,-1),设置二值分别为1和0,则使用00表示三值哈希 编码索引中的0,使用01表示三值哈希编码索引中的-1,使用10表示三值哈 希编码索引中的1,进而所述二值哈希编码索引为001001。
步骤S20,获取预设三值哈希编码值对应的二值形式表示值,并基于所述 二值哈希编码索引与所述二值形式表示值,计算所述三值哈希编码索引与所 述预设三值哈希编码值之间的三值哈希编码距离;
在本实施例中,需要说明的是,所述预设三值哈希编码值为预先存储于 搜索系统的三值哈希编码值,用于标识搜索系统中的数据,其中,所述预设 三值哈希编码值与搜索系统中的数据一一对应,确定搜索系统中的数据对应 的预设三值哈希编码值,即可实现数据的定位搜索。所述二值形式表示值为 使用二值表示的预设三值哈希编码值。
获取预设三值哈希编码值对应的二值形式表示值,并基于所述二值哈希 编码索引与所述二值形式表示值,计算所述三值哈希编码索引与所述预设三 值哈希编码值之间的三值哈希编码距离,具体地,获取预设三值哈希编码值, 并对所述预设三值哈希编码值上各比特位上的比特位值进行二值表示,获得 预设三值哈希编码值对应的二值形式表示值,进而当使用预设第一类型三值 距离计算方法计算三值哈希编码距离时,通过对所述二值哈希编码索引对应 的第一相异哈希编码与所述二值形式表示值对应的第二相异哈希编码进行异 或操作,计算中间哈希编码值,并通过对所述二值哈希编码索引与所述二值 形式表示值进行逻辑位运算,计算中间辅助哈希编码值,进而基于所述中间 哈希编码值的汉明重量与所述中间辅助哈希编码值的汉明重量,确定所述三 值哈希编码索引与所述预设三值哈希编码值之间的三值哈希编码距离,其中, 所述第一相异哈希编码为与所述二值哈希编码索引中各比特位值对应的相反 比特位值构成的哈希编码值,所述第二相异哈希编码为与所述二值形式表示 值中各比特位值对应的相反比特位值构成的哈希编码值,其中,所述比特位 值与该比特位比特位值对应所述相异比特位值为构成二值哈希编码值的两个值,例如,假设构成二值哈希编码值的两个值为0和1,则0的相异比特位值 为1,1的相异比特位值为0。
其中,所述三值哈希编码距离包括第一类型距离,
所述基于所述二值哈希编码索引与所述二值形式表示值,计算所述三值 哈希编码索引与所述预设三值哈希编码值之间的三值哈希编码距离的步骤包 括:
步骤S21,对所述二值哈希编码索引中各比特位和所述二值形式表示值中 各比特位进行非逻辑运算,获得相异二值哈希编码索引和相异二值形式表示 值;
在本实施例中,需要说明的是,所述第一类型距离为基于预设第一类型 三值哈希编码距离计算方式计算的距离,其中,所述预设第一类型三值哈希 编码距离计算方式包括Bochvar方式和Kleene方式等,且当使用预设第一类 型三值哈希编码距离计算方式,且三值哈希编码值对应的三值分别为0,-1 和1时,-1与-1,以及1与1之间的距离记为0;0与-1,0与0,以及0与 1之间的距离记为为0.5;1与-1之间的距离记为1。
对所述二值哈希编码索引中各比特位和所述二值形式表示值中各比特位 进行非逻辑运算,获得相异二值哈希编码索引和相异二值形式表示值,具体 地,对所述二值哈希编码索引中各比特位和所述二值形式表示值中各比特位 进行非逻辑运算,以将所述二值哈希编码索引中各比特位值均转换为对应的 相异比特位值,以及将所述二值形式表示值中各比特位值均转换为对应的相 异比特位值,获得所述二值哈希编码索引对应的相异二值哈希编码索引和所 述二值形式表示值对应的相异二值形式表示值。
步骤S22,对所述相异二值哈希编码索引和所述相异二值形式表示值进行 异或操作,获得中间哈希编码值;
在本实施例中,对所述相异二值哈希编码索引和所述相异二值形式表示 值进行异或操作,获得中间哈希编码值,具体地,对所述相异二值哈希编码索 引中各比特位和所述相异二值形式表示值中各比特位进行异或操作,获得中 间哈希编码值。
步骤S23,对所述二值哈希编码索引和所述二值形式表示值进行逻辑位运 算,获得中间辅助哈希编码值;
在本实施例中,对所述二值哈希编码索引和所述二值形式表示值进行逻 辑位运算,获得中间辅助哈希编码值,具体地,对所述二值哈希编码索引和 所述二值形式表示值进行比特位拆分,获得所述二值哈希编码索引对应的第 一拆分部分和对应的第二拆分部分,以及所述二值形式表示值对应的第三拆 分部分和对应的第四拆分部分,进而对所述第一拆分部分、第二拆分部分、 第三拆分部分和第四拆分部分进行或逻辑运算,以在所述第一拆分部分、第 二拆分部分、第三拆分部分和第四拆分部分选取目标拆分部分,其中,所述目标拆分部分为各拆分部分中具备目标比特位值最多的拆分部分,其中,所 述目标比特位值可设置为1,进而对所述目标拆分部分进行非逻辑运算,获得 所述中间辅助哈希编码值。
其中,所述逻辑位运算包括非逻辑运算以及或逻辑运算,
所述对所述二值哈希编码索引和所述二值形式表示值进行逻辑位运算, 获得中间辅助哈希编码值的步骤包括:
步骤S231,若所述三值哈希编码索引属于预设多比特位哈希编码类型, 则对所述二值哈希编码索引和所述二值形式表示值进行比特位拆分,获得所 述二值哈希编码索引对应的第一拆分部分和对应的第二拆分部分,以及所述 二值形式表示值对应的第三拆分部分和对应的第四拆分部分;
在本实施例中,若所述三值哈希编码索引属于预设多比特位哈希编码类 型,则对所述二值哈希编码索引和所述二值形式表示值进行比特位拆分,获 得所述二值哈希编码索引对应的第一拆分部分和对应的第二拆分部分,以及 所述二值形式表示值对应的第三拆分部分和对应的第四拆分部分,具体地, 若所述三值哈希编码索引属于预设多比特位哈希编码类型,则证明所述三值 哈希编码索引中存在多个比特位,进而在所述三值哈希编码索引的每一比特 位在所述二值哈希编码索引中对应的比特位值组中取第一位比特位值构成所 述第一拆分部分;在所述三值哈希编码索引的每一比特位在所述二值哈希编 码索引中对应的比特位值组中取第二位比特位值构成所述第二拆分部分;在 所述预设三值哈希编码值的每一比特位在所述二值形式表示值中对应的比特 位值组中取第一位比特位值构成所述第三拆分部分;在所述预设三值哈希编 码值的每一比特位在所述二值形式表示值中对应的比特位值组中取第二位比 特位值构成所述第四拆分部分,其中,所述比特位组为三值哈希编码转化为 二值哈希编码时,三值哈希编码中一比特位值转化的具备排列顺序的二值哈 希编码中的两个值,例如假设三值哈希编码中一比特位值为1,转化为对应的 二值哈希编码时,需将1转化为01,则01即为所述比特位组,进而假设所述 三值哈希编码索引为(1,1,1),则对应的所述二值哈希编码索引为(01, 01,01),进而第一拆分部分为000,第二拆分部分为111。
步骤S232,对所述第一拆分部分、所述第二拆分部分、所述第三拆分部 分和各所述第四拆分部分进行或逻辑运算以及非逻辑运算,获得所述中间辅 助哈希编码值。
在本实施例中,对所述第一拆分部分、所述第二拆分部分、所述第三拆 分部分和各所述第四拆分部分进行或逻辑运算以及非逻辑运算,获得所述中 间辅助哈希编码值,具体地,对所述第一拆分部分、所述第二拆分部分、所 述第三拆分部分和各所述第四拆分部分依次进行或逻辑运算以及非逻辑运 算,以通过或逻辑运算在所述第一拆分部分、第二拆分部分、第三拆分部分 和第四拆分部分选取目标拆分部分,其中,所述目标拆分部分为各拆分部分 中具备目标比特位值最多的拆分部分,其中,所述目标比特位值可设置为1, 通过非逻辑运算将所述目标拆分部分中各比特位值转换为对应的相异比特位 值,获得中间辅助哈希编码值。
其中,所述逻辑位运算包括非逻辑运算以及或逻辑运算,
所述对所述二值哈希编码索引和所述二值形式表示值进行逻辑位运算, 获得中间辅助哈希编码值的步骤还包括:
步骤A10,若所述三值哈希编码索引属于预设单比特位哈希编码类型,则 对所述二值哈希编码索引中各第一比特位值和所述二值形式表示值中各第二 比特位值进行或逻辑运算以及非逻辑运算,获得所述中间辅助哈希编码值。
在本实施例中,若所述三值哈希编码索引属于预设单比特位哈希编码类 型,则对所述二值哈希编码索引中各第一比特位值和所述二值形式表示值中 各第二比特位值进行或逻辑运算以及非逻辑运算,获得所述中间辅助哈希编 码值,具体地,若所述三值哈希编码索引属于预设单比特位哈希编码类型, 则证明所述三值哈希编码只具备一个比特位,进而对所述相异二值哈希编码 索引中各第一比特位值和所述相异二值形式表示值中各第二比特位值依次进 行或逻辑运算以及非逻辑运算,以通过或逻辑运算在各所述第一比特位值和 各所述第二比特位值中选取最大比特位值,其中,由于二值哈希编码中的二 值为0和1,进而或逻辑运算的过程即为当各所述第一比特位值和各所述第二 比特位值全为0时,则所述最大比特位值为0,当各所述第一比特位值和各所 述第二比特位值不全为0时,则所述最大比特位值为1,并通过非逻辑运算将 所述最大比特位值转换为对应的相异比特位值,获得中间辅助哈希编码值。
步骤S24,基于所述中间辅助哈希编码值的汉明重量和所述中间哈希编码 值的汉明重量,计算所述第一类型距离。
在本实施例中,基于所述中间辅助哈希编码值的汉明重量和所述中间哈 希编码值的汉明重量,计算所述第一类型距离,具体地,计算所述中间辅助 哈希编码值的汉明重量和所述中间哈希编码值的汉明重量之和,获得汉明重 量和,并取所述汉明重量和的一半作为所述第一类型距离,也即,将所述汉 明重量和除以2,获得所述第一类型距离。
其中,所述三值哈希编码距离包括第二类型距离,
所述基于所述二值哈希编码索引与所述二值形式表示值,计算所述三值 哈希编码索引与所述预设三值哈希编码值之间的三值哈希编码距离的步骤包 括:
步骤B10,对所述二值哈希编码索引与所述二值形式表示值进行异或操 作,获得异或操作编码值;
在本实施例中,需要说明的是,所述第二类型距离为基于预设第二类型 三值哈希编码距离计算方式计算的距离,其中,所述预设第二类型三值哈希 编码距离计算方式包括Lukasiewicz方式等,且当使用预设第二类型三值哈 希编码距离计算方式,且三值哈希编码值对应的三值分别为0,-1和1时, -1与-1,0与0,以及1与1之间的距离记为0;0与-1,以及0与1之间的 距离记为为0.5;1与-1之间的距离记为1。
对所述二值哈希编码索引与所述二值形式表示值进行异或操作,获得异 或操作编码值,具体地,对所述二值哈希编码索引中各比特位值与所述二值 形式表示值中各比特位值进行异或操作,获得异或操作编码值。
步骤B20,基于所述异或操作编码值的汉明重量,生成所述第二类型距离。
在本实施例中,基于所述异或操作编码值的汉明重量,生成所述第二类 型距离,具体地,取所述异或操作编码值的汉明重量的一半作为所述第二类 型距离。
步骤S30,基于所述三值哈希编码距离,定位所述三值哈希编码索引对应 的目标搜索数据。
在本实施例中,基于所述三值哈希编码距离,定位所述三值哈希编码索 引对应的目标搜索数据,具体地,若所述三值哈希编码距离小于预设三值哈 希编码距离阈值,则判定所述三值哈希编码索引与所述预设三值哈希编码值 相同,进而将所述预设三值哈希编码值在搜索系统对应的数据作为所述三值 哈希编码索引对应的目标搜索数据。
其中,所述基于所述三值哈希编码距离,定位所述三值哈希编码索引对 应的目标搜索数据的步骤包括:
步骤S31,判断所述三值哈希编码距离是否小于预设三值哈希编码距离阈 值;
步骤S32,若是,则将所述预设三值哈希编码值对应的数据作为所述目标 搜索数据;
在本实施例中,判断所述三值哈希编码距离是否小于预设三值哈希编码 距离阈值,则判定所述三值哈希编码索引与所述预设三值哈希编码值相同, 进而将所述预设三值哈希编码值在搜索系统对应的数据作为所述三值哈希编 码索引对应的目标搜索数据。
步骤S33,若否,则返回获取预设三值哈希编码值对应的二值形式表示值 的步骤。
在本实施例中,若否,则返回获取预设三值哈希编码值对应的二值形式 表示值的步骤,直至在搜索系统中查询到与所述三值哈希编码索引之间的三 值哈希编码距离小于预设三值哈希编码距离阈值的预设三值哈希编码值。
本申请实施例提供了一种数据搜索优化方法,相比于现有技术采用的通 过将索引设置为二值哈希编码值,进而当进行数据搜索时,计算机通过快速 比对二值哈希编码值即可实现待搜索数据的定位的技术手段,其中,需要说 明的是,三值哈希编码相比于二值哈希编码存在模糊边界位表示不确定的比 特位,进而三值哈希编码比二值哈希编码更加准确,但在二值哈希编码由于 只存在0和1,进而在电路上更容易实现,本申请实施例首先获取三值哈希编 码索引,也即,将三值哈希编码作为索引,进而获取预设三值哈希编码值对 应的二值形式表示值,并基于所述二值哈希编码索引与所述二值形式表示值, 计算所述三值哈希编码索引与所述预设三值哈希编码值之间的三值哈希编码 距离,进而实现了在二值机器上计算三值哈希编码之间的距离的目的,进而 基于所述三值哈希编码距离,即可定位所述三值哈希编码索引对应的目标搜 索数据,进而在数据搜索时,在基于三值哈希编码保证数据搜索的准确性的 前提下,在二值机器上实现了三值哈希编码之间的三值哈希编码距离的计算, 使得基于三值哈希编码的数据搜索更容易在电路上实现,而由于目前的计算 机大多数为二值机器,进而提高了基于三值哈希编码的数据搜索在电路上实 现时的便捷性,进一步提升了数据搜索的实现效果,所以,克服了由于二值 哈希编码仍然存在一定的误差,进而导致数据搜索的效果较差的技术缺陷, 所以,提高了数据搜索的实现效果。
进一步地,参照图2,基于本申请中第一实施例,在本申请的另一实施例 中,所述获取三值哈希编码索引的步骤包括:
步骤S11,获取待处理数据,并将所述待处理数据输入预设哈希编码模型, 以基于所述待处理数据对应的类别特征信息,对所述待处理数据进行极化哈 希,获得哈希结果;
在本实施例中,需要说明的是,所述预设哈希编码模型包括深度极化网 络,其中,所述深度极化网络为基于预设类别信息和极化损失函数优化的深 度学习模型,且对属于同一样本类别的输入样本,所述预设哈希编码模型均 能输出相同的哈希向量,所述极化损失函数为用于优化所述深度极化网络的 损失函数,所述待处理数据为与目标搜索数据属于同一类别的数据,用于生 成三值哈希编码索引。
另外地,需要说明的是,所述深度极化网络包括隐藏层和哈希层,其中, 所述隐藏层为所述预设深度极化网络的数据处理层,用于进行卷积处理和池 化处理等数据处理过程,且所述隐藏层为基于深度学习训练好的一层或者多 层神经网络,所述哈希层为所述预设深度极化网络的输出层,用于对所述待 处理数据进行哈希,并输出对应的哈希结果,且所述哈希层为基于深度学习 训练好的一层或者多层神经网络,所述待处理数据可用矩阵或者向量进行表 示,所述类别特征信息为所述深度极化网络的隐藏层输出的数据特征表示矩 阵,其中,所述数据特征表示矩阵包括所述待处理数据对应的数据类别的特 征信息。
获取待处理数据,并将所述待处理数据输入预设哈希编码模型,以基于 所述待处理数据对应的类别特征信息,对所述待处理数据进行极化哈希,获 得哈希结果,具体地,从预设存储数据库中提取所述待处理数据,并将所述 待处理数据对应的待处理数据表示矩阵输入所述深度极化网络的隐藏层,对 所述待处理数据表示矩阵进行特征提取,以提取所述待处理数据对应的类别 特征,获得所述数据表示矩阵对应的类别特征表示矩阵,其中,所述类别特 征表示矩阵为所述类别特征信息的矩阵表示形式,进而将所述类别特征表示矩阵输入所述哈希层,对所述类别特征表示矩阵进行全连接,获得全连接向 量,进而对所述全连接向量进行极化,获得所述全连接向量对应的哈希向量, 并将所述哈希向量作为所述哈希结果。
其中,所述预设哈希编码模型包括隐藏层和哈希层,
所述将所述待处理数据输入预设哈希编码模型,以基于所述待处理数据 对应的类别特征信息,对所述待处理数据进行极化哈希,获得哈希结果的步 骤包括:
步骤S111,将所述待处理数据输入所述隐藏层,对所述待处理数据进行 特征提取,获得所述类别特征信息;
在本实施例中,将所述待处理数据输入所述隐藏层,对所述待处理数据 进行特征提取,获得所述类别特征信息,具体地,将所述待处理数据对应的 待处理数据表示矩阵输入所述隐藏层,对所述待处理数据表示矩阵进行预设 次数的卷积和池化交替处理,以提取所述待处理数据对应的类别特征,获得 所述待处理数据表示矩阵对应的类别特征表示矩阵,并将所述类别特征表示 矩阵作为所述类别特征信息。
步骤S112,将所述类别特征信息输入所述哈希层,对所述类别特征信息 进行特定比特位的极化哈希,获得所述哈希结果。
在本实施例中,将所述类别特征信息输入所述哈希层,对所述类别特征 信息进行特定比特位的极化哈希,获得所述哈希结果,具体地,将所述类别 特征表示矩阵输入所述哈希层,对所述类别特征表示矩阵进行全连接,获得 全连接向量,进而将全连接向量中每一比特位上的特征值与预设特征值取值 范围进行比对,以将在所述预设特征值取值范围之外的特征值对应的比特位 作为特定比特位,将在所述预设特征值取值范围之内的特征值对应的比特位 作为非特定比特位,进而为各所述特定比特位匹配对应的极化输出通道,以 基于各所述极化输出通道,分别对各所述特定比特位上的特征值进行极化, 获得各所述特定比特位对应的极化特征值,并同时为各所述非特定比特位匹 配输出通道,以直接输出各所述非特定比特位上的特征值,获得非极化特征 值,进而基于各所述特定比特位和各所述非特定比特位在所述全连接向量中 的位置,将各所述极化特征值和各所述非极化特征值组合为哈希向量,并将 所述哈希向量作为所述哈希结果,其中,所述极化输出通道为对特定比特位 进行极化的模型输出通道。
步骤S12,基于所述哈希结果的各比特位特征值和预设特征值取值范围, 生成所述待处理数据对应的所述三值哈希编码索引。
在本实施例中,基于所述哈希结果的各比特位特征值和预设特征值取值 范围,生成所述待处理数据对应的三值哈希编码索引,具体地,基于预设特 征值取值范围,对所述哈希向量中的各比特位特征值进行分类,获得各所述 比特位特征值对应的特征值分类结果,基于各所述特征值分类结果,分别为 各所述比特位特征值匹配对应的目标编码值,基于各所述目标编码值和各所 述比特位特征值在所述哈希向量中的位置顺序,生成各所述目标编码值对应 的三值哈希编码索引。
另外地,需要说明的是,若对所述全连接向量中的每一比特位上的特征 值均进行了极化,则基于所述预设特征值取值范围,在所述哈希向量的各比 特位中筛选极化失败比特位,其中,所述极化失败比特位为哈希向量上的比 特位特征值在所述预设特征值取值范围之内的比特位,进而将极化失败比特 位作为第一类型比特位,将哈希向量中比特位特征值大于0且极化成功的比 特位作为第二类型比特位,将哈希向量中比特位特征值小于0且极化成功的 比特位作为第三类型比特位,进而分别为各所述第一类型比特位、各第二类型比特位和各第三类型比特位匹配对应的目标编码值,获得三值哈希编码索 引。
另外地,需要说明的是,所述比特位特征值包括极化特征值和非极化特 征值,若对所述全连接向量中进行特定比特位的极化,则将不大于所述下阈 值的极化特征值作为所述第一类型特征值,将大于所述下阈值且小于所述上 阈值的非极化特征值作为所述第二类型特征值,将不小于所述上阈值的极化 特征值作为所述第三类型特征值,进而分别为各所述第一类型特征值、各第 二类型特征值和各第三类型特征值匹配对应的目标编码值,获得三值哈希编 码索引。
其中,所述哈希结果包括哈希向量,
所述基于所述哈希结果的各比特位特征值和预设特征值取值范围,生成 所述待处理数据对应的三值哈希编码索引的步骤包括:
步骤S121,基于所述预设特征值取值范围,对各所述比特位特征值进行 三值划分,获得特征值类型划分结果;
在本实施例中,基于所述预设特征值取值范围,对各所述比特位特征值 进行三值划分,获得特征值类型划分结果,具体地,将各所述比特位特征值 分别与所述预设特征值取值范围进行比对,获得各所述比特位特征值对应的 比对结果,基于各所述比对结果,分别对各所述比对结果对应的比特位特征 值进行三值划分,获得特征值类型划分结果。
其中,所述预设特征值取值范围包括上阈值和下阈值,所述特征值类型 划分结果包括第一类型特征值、第二类型特征值和第三类型特征值,
所述基于所述预设特征值取值范围,对各所述比特位特征值进行三值划 分,获得特征值类型划分结果的步骤包括:
步骤C10,将不大于所述下阈值的所述比特位特征值作为所述第一类型特 征值;
步骤C20,将大于所述下阈值且小于所述上阈值的所述比特位特征值作为 所述第二类型特征值;
步骤C30,将不小于所述上阈值的所述比特位特征值作为所述第三类型特 征值。
在本实施例中,具体地,通过将各所述比特位特征值与所述预设特征值 取值范围进行比对,在各所述比特位特征值中分别确定不大于所述下阈值的 第一类型特征值、确定大于所述下阈值且小于所述上阈值的第二类型特征值 以及确定不小于所述上阈值的第三类型特征值。
步骤S122,基于所述特征值类型划分结果和各所述比特位特征值在所述 哈希向量中的位置,生成所述三值哈希编码索引。
在本实施例中,需要说明的是,所述特征值类型划分结果包括划分为第 一类型特征值、划分为第二类型特征值和划分为第三类型特征值。
基于所述特征值类型划分结果和各所述比特位特征值在所述哈希向量中 的位置,生成所述三值哈希编码索引,具体地,基于所述特征值类型划分结 果,获取各所述比特位特征值对应的特征值类型,进而生成划分为所述第一 特征值类型的各比特位特征值对应的第一目标编码值和生成划分为所述第二 特征值类型的各比特位特征值对应的第二目标编码值,以及生成划分为所述 第三特征值类型的各比特位特征值对应的第三目标编码值,进而基于各所述 第一目标编码值、各所述第二目标编码值和各所述第三目标编码值以及各所 述比特位特征值在所述哈希向量中的位置,生成所述三值哈希编码索引,其 中,优选地,可将所述第一目标编码值设定为-1,所述第二目标编码值设定 为0,所述第三目标编码值设定为1,例如,假设所述哈希向量为(3,2,0.001, -0.001,-5),所述预设特征值取值范围为(-0.1,0.1),则特征值3对应 的第三目标编码为1,特征值2对应的第三目标编码为1,特征值0.001对应 的第二目标编码为0,特征值-0.001对应的第二目标编码为0,特征值-5对 应的第一目标编码为-1,进而所述三值输出哈希编码值为1100-1。
另外地,需要说明的是,对所述全连接向量进行特定比特位的极化的方 式相比于对全连接向量中每一比特位均进行极化的方式,对所述全连接向量 进行特定比特位的极化的方式减少了对部分比特位进行极化的计算过程,进 而减少了极化时的计算量,进而提高了进行哈希编码时的计算效率,也即, 提高了哈希编码效率。
另外地,需要说明的是,本实施例中基于预设特征值取值范围,生成三 值哈希编码索引的方式,相比于基于特征值的正负进行哈希编码的方式,使 得哈希编码时具备了模糊边界,进而避免了使用不准确或者模糊的比特位上 的特征值进行哈希编码,且消除了比特位极化失败时,导致该极化失败比特 位的编码值不准确的风险,进而提高了哈希编码的准确性。
本实施例提供了一种基于深度极化网络进行三值哈希编码的方法,相比 于二值哈希编码更加准确,基于三值哈希编码索引进行的数据搜索更加准确, 进而在通过三值哈希编码获得三值哈希编码索引之后,即可获取预设三值哈 希编码值对应的二值形式表示值,并基于所述二值哈希编码索引与所述二值 形式表示值,计算所述三值哈希编码索引与所述预设三值哈希编码值之间的 三值哈希编码距离,进而实现了在二值机器上计算三值哈希编码之间的距离 的目的,进而基于所述三值哈希编码距离,即可定位所述三值哈希编码索引 对应的目标搜索数据,进而在数据搜索时,在基于三值哈希编码保证数据搜 索的准确性的前提下,在二值机器上实现了三值哈希编码之间的三值哈希编 码距离的计算,使得基于三值哈希编码的数据搜索更容易在电路上实现,而 由于目前的计算机大多数为二值机器,进而提高了基于三值哈希编码的数据 搜索在电路上实现时的便捷性,进一步提升了数据搜索的实现效果,所以, 为克服了由于二值哈希编码仍然存在一定的误差,进而导致数据搜索的效果 较差的技术缺陷奠定了基础。
参照图3,图3是本申请实施例方案涉及的硬件运行环境的设备结构示意 图。
如图3所示,该数据搜索优化设备可以包括:处理器1001,例如CPU, 存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和 存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以 是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005 可选的还可以是独立于前述处理器1001的存储设备。
可选地,该数据搜索优化设备还可以包括矩形用户接口、网络接口、摄 像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等 等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘 (Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。 网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的数据搜索优化设备结构并不构成 对数据搜索优化设备的限定,可以包括比图示更多或更少的部件,或者组合 某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系 统、网络通信模块以及数据搜索优化程序。操作系统是管理和控制数据搜索 优化设备硬件和软件资源的程序,支持数据搜索优化程序以及其它软件和/或 程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以 及与数据搜索优化系统中其它硬件和软件之间通信。
在图3所示的数据搜索优化设备中,处理器1001用于执行存储器1005 中存储的数据搜索优化程序,实现上述任一项所述的数据搜索优化方法的步 骤。
本申请数据搜索优化设备具体实施方式与上述数据搜索优化方法各实施 例基本相同,在此不再赘述。
本申请实施例还提供一种数据搜索优化装置,所述数据搜索优化装置应 用于数据搜索优化设备,所述数据搜索优化装置包括:
二值表示模块,用于获取三值哈希编码索引,并对所述三值哈希编码索 引进行二值表示,获得二值哈希编码索引;
距离计算模块,用于获取预设三值哈希编码值对应的二值形式表示值, 并基于所述二值哈希编码索引与所述二值形式表示值,计算所述三值哈希编 码索引与所述预设三值哈希编码值之间的三值哈希编码距离;
定位搜索模块,用于基于所述三值哈希编码距离,定位所述三值哈希编 码索引对应的目标搜索数据。
可选地,所述距离计算模块还用于:
对所述二值哈希编码索引中各比特位和所述二值形式表示值中各比特位 进行非逻辑运算,获得相异二值哈希编码索引和相异二值形式表示值;
对所述相异二值哈希编码索引和所述相异二值形式表示值进行异或操 作,获得中间哈希编码值;
对所述二值哈希编码索引和所述二值形式表示值进行逻辑位运算,获得 中间辅助哈希编码值;
基于所述中间辅助哈希编码值的汉明重量和所述中间哈希编码值的汉明 重量,计算所述第一类型距离。
可选地,所述距离计算模块还用于:
若所述三值哈希编码索引属于预设多比特位哈希编码类型,则对所述二 值哈希编码索引和所述二值形式表示值进行比特位拆分,获得所述二值哈希 编码索引对应的第一拆分部分和对应的第二拆分部分,以及所述二值形式表 示值对应的第三拆分部分和对应的第四拆分部分;
对所述第一拆分部分、所述第二拆分部分、所述第三拆分部分和各所述 第四拆分部分进行或逻辑运算以及非逻辑运算,获得所述中间辅助哈希编码 值。
可选地,所述距离计算模块还用于:
若所述三值哈希编码索引属于预设单比特位哈希编码类型,则对所述二 值哈希编码索引中各第一比特位值和所述二值形式表示值中各第二比特位值 进行或逻辑运算以及非逻辑运算,获得所述中间辅助哈希编码值。
可选地,所述距离计算模块还用于:
对所述二值哈希编码索引与所述二值形式表示值进行异或操作,获得异 或操作编码值;
基于所述异或操作编码值的汉明重量,生成所述第二类型距离。
可选地,所述定位搜索模块还用于:
判断所述三值哈希编码距离是否小于预设三值哈希编码距离阈值;
若是,则将所述预设三值哈希编码值对应的数据作为所述目标搜索数据;
若否,则返回获取预设三值哈希编码值对应的二值形式表示值的步骤。
可选地,所述数据搜索优化装置还用于:
获取待处理数据,并将所述待处理数据输入预设哈希编码模型,以基于 所述待处理数据对应的类别特征信息,对所述待处理数据进行极化哈希,获 得哈希结果;
基于所述哈希结果的各比特位特征值和预设特征值取值范围,生成所述 待处理数据对应的所述三值哈希编码索引。
本申请数据搜索优化装置的具体实施方式与上述数据搜索优化方法各实 施例基本相同,在此不再赘述。
本申请实施例提供了一种可读存储介质,且所述可读存储介质存储有一 个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上 的处理器执行以用于实现上述任一项所述的数据搜索优化方法的步骤。
本申请可读存储介质具体实施方式与上述数据搜索优化方法各实施例基 本相同,在此不再赘述。
本申请实施例提供了一种计算机程序产品,且所述计算机程序产品包括 有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被 一个或者一个以上的处理器执行以用于实现上述任一项所述的数据搜索优化 方法的步骤。
本申请计算机程序产品具体实施方式与上述数据搜索优化方法各实施例 基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是 利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间 接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (10)

1.一种数据搜索优化方法,其特征在于,所述数据搜索优化方法包括:
获取三值哈希编码索引,并对所述三值哈希编码索引进行二值表示,获得二值哈希编码索引;
获取预设三值哈希编码值对应的二值形式表示值,并基于所述二值哈希编码索引与所述二值形式表示值,计算所述三值哈希编码索引与所述预设三值哈希编码值之间的三值哈希编码距离;
基于所述三值哈希编码距离,定位所述三值哈希编码索引对应的目标搜索数据。
2.如权利要求1所述数据搜索优化方法,其特征在于,所述三值哈希编码距离包括第一类型距离,
所述基于所述二值哈希编码索引与所述二值形式表示值,计算所述三值哈希编码索引与所述预设三值哈希编码值之间的三值哈希编码距离的步骤包括:
对所述二值哈希编码索引中各比特位和所述二值形式表示值中各比特位进行非逻辑运算,获得相异二值哈希编码索引和相异二值形式表示值;
对所述相异二值哈希编码索引和所述相异二值形式表示值进行异或操作,获得中间哈希编码值;
对所述二值哈希编码索引和所述二值形式表示值进行逻辑位运算,获得中间辅助哈希编码值;
基于所述中间辅助哈希编码值的汉明重量和所述中间哈希编码值的汉明重量,计算所述第一类型距离。
3.如权利要求2所述数据搜索优化方法,其特征在于,所述逻辑位运算包括非逻辑运算以及或逻辑运算,
所述对所述二值哈希编码索引和所述二值形式表示值进行逻辑位运算,获得中间辅助哈希编码值的步骤包括:
若所述三值哈希编码索引属于预设多比特位哈希编码类型,则对所述二值哈希编码索引和所述二值形式表示值进行比特位拆分,获得所述二值哈希编码索引对应的第一拆分部分和对应的第二拆分部分,以及所述二值形式表示值对应的第三拆分部分和对应的第四拆分部分;
对所述第一拆分部分、所述第二拆分部分、所述第三拆分部分和各所述第四拆分部分进行或逻辑运算以及非逻辑运算,获得所述中间辅助哈希编码值。
4.如权利要求2所述数据搜索优化方法,其特征在于,所述逻辑位运算包括非逻辑运算以及或逻辑运算,
所述对所述二值哈希编码索引和所述二值形式表示值进行逻辑位运算,获得中间辅助哈希编码值的步骤包括:
若所述三值哈希编码索引属于预设单比特位哈希编码类型,则对所述二值哈希编码索引中各第一比特位值和所述二值形式表示值中各第二比特位值进行或逻辑运算以及非逻辑运算,获得所述中间辅助哈希编码值。
5.如权利要求1所述数据搜索优化方法,其特征在于,所述三值哈希编码距离包括第二类型距离,
所述基于所述二值哈希编码索引与所述二值形式表示值,计算所述三值哈希编码索引与所述预设三值哈希编码值之间的三值哈希编码距离的步骤包括:
对所述二值哈希编码索引与所述二值形式表示值进行异或操作,获得异或操作编码值;
基于所述异或操作编码值的汉明重量,生成所述第二类型距离。
6.如权利要求1所述数据搜索优化方法,其特征在于,所述基于所述三值哈希编码距离,定位所述三值哈希编码索引对应的目标搜索数据的步骤包括:
判断所述三值哈希编码距离是否小于预设三值哈希编码距离阈值;
若是,则将所述预设三值哈希编码值对应的数据作为所述目标搜索数据;
若否,则返回获取预设三值哈希编码值对应的二值形式表示值的步骤。
7.如权利要求1所述数据搜索优化方法,其特征在于,所述获取三值哈希编码索引的步骤包括:
获取待处理数据,并将所述待处理数据输入预设哈希编码模型,以基于所述待处理数据对应的类别特征信息,对所述待处理数据进行极化哈希,获得哈希结果;
基于所述哈希结果的各比特位特征值和预设特征值取值范围,生成所述待处理数据对应的所述三值哈希编码索引。
8.一种数据搜索优化设备,其特征在于,所述数据搜索优化设备包括:存储器、处理器以及存储在存储器上的用于实现所述数据搜索优化方法的程序,
所述存储器用于存储实现数据搜索优化方法的程序;
所述处理器用于执行实现所述数据搜索优化方法的程序,以实现如权利要求1至7中任一项所述数据搜索优化方法的步骤。
9.一种介质,所述介质为可读存储介质,其特征在于,所述可读存储介质上存储有实现数据搜索优化方法的程序,所述实现数据搜索优化方法的程序被处理器执行以实现如权利要求1至7中任一项所述数据搜索优化方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述数据搜索优化方法的步骤。
CN202011475125.1A 2020-12-15 2020-12-15 数据搜索优化方法、设备、介质及计算机程序产品 Pending CN112597155A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011475125.1A CN112597155A (zh) 2020-12-15 2020-12-15 数据搜索优化方法、设备、介质及计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011475125.1A CN112597155A (zh) 2020-12-15 2020-12-15 数据搜索优化方法、设备、介质及计算机程序产品

Publications (1)

Publication Number Publication Date
CN112597155A true CN112597155A (zh) 2021-04-02

Family

ID=75195524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011475125.1A Pending CN112597155A (zh) 2020-12-15 2020-12-15 数据搜索优化方法、设备、介质及计算机程序产品

Country Status (1)

Country Link
CN (1) CN112597155A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190065539A1 (en) * 2017-08-30 2019-02-28 Ebay Inc. Smaller proximate search index
CN111680489A (zh) * 2020-06-10 2020-09-18 腾讯科技(深圳)有限公司 目标文本的匹配方法和装置、存储介质及电子设备
CN111988614A (zh) * 2020-08-14 2020-11-24 深圳前海微众银行股份有限公司 哈希编码优化方法、设备及可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190065539A1 (en) * 2017-08-30 2019-02-28 Ebay Inc. Smaller proximate search index
CN111680489A (zh) * 2020-06-10 2020-09-18 腾讯科技(深圳)有限公司 目标文本的匹配方法和装置、存储介质及电子设备
CN111988614A (zh) * 2020-08-14 2020-11-24 深圳前海微众银行股份有限公司 哈希编码优化方法、设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SANTIAGO, LEANDRO ET AL.: "Hardware-Accelerated Similarity Search with Multi-Index Hashing", IEEE 17TH INT CONF ON DEPENDABLE, AUTONOM AND SECURE COMP / IEEE 17TH INT CONF ON PERVAS INTELLIGENCE AND COMP / IEEE 5TH INT CONF ON CLOUD AND BIG DATA COMP / IEEE 4TH CYBER SCIENCE AND TECHNOLOGY CONGRESS (DASC/PICOM/CBDCOM/CYBERSCITECH), 4 November 2019 (2019-11-04), pages 733 - 740 *
刘昊淼;王瑞平;山世光;陈熙霖;: "基于离散优化的哈希编码学习方法", 计算机学报, no. 05, 27 March 2019 (2019-03-27), pages 223 - 234 *

Similar Documents

Publication Publication Date Title
CN109936561B (zh) 用户请求的检测方法、装置、计算机设备及存储介质
CN110263938B (zh) 用于生成信息的方法和装置
CN108959370B (zh) 一种基于知识图谱中实体相似度的社区发现方法及装置
CN109992601B (zh) 待办事项信息的推送方法、装置和计算机设备
CN111626408B (zh) 哈希编码方法、装置、设备及可读存储介质
CN111967609B (zh) 模型参数验证方法、设备及可读存储介质
CN111988614B (zh) 哈希编码优化方法、设备及可读存储介质
US11586838B2 (en) End-to-end fuzzy entity matching
CN112966755A (zh) 电感缺陷检测方法、设备及可读存储介质
CN111128307A (zh) 代谢路径预测方法、装置、终端设备及可读存储介质
CN113688986A (zh) 纵向联邦预测优化方法、设备、介质及计算机程序产品
Noje et al. IoT devices signals processing based on Shepard local approximation operators defined in Riesz MV-algebras
CN114492601A (zh) 资源分类模型的训练方法、装置、电子设备及存储介质
CN114490762A (zh) 用于决策引擎的数据源取数方法、装置、介质和设备
CN112529102B (zh) 特征拓展方法、设备、介质及计算机程序产品
US20230229896A1 (en) Method and computing device for determining optimal parameter
CN112597155A (zh) 数据搜索优化方法、设备、介质及计算机程序产品
CN111950712A (zh) 模型网络参数处理方法、设备及可读存储介质
CN113468345B (zh) 基于知识图谱的实体共指检测数据处理系统
CN111723122A (zh) 数据间关联规则的确定方法、装置、设备及可读存储介质
CN111612159A (zh) 特征重要性测量方法、设备及可读存储介质
US20210056449A1 (en) Causal relation estimating device, causal relation estimating method, and causal relation estimating program
CN116383883B (zh) 一种基于大数据的数据管理权限处理方法及系统
CN115801338B (zh) 基于加密流量控制网关的数据处理方法及系统
CN114077681B (zh) 一种图像数据处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination