CN117009404A - 一种搜索方法、装置、计算机设备及存储介质 - Google Patents

一种搜索方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN117009404A
CN117009404A CN202210470801.9A CN202210470801A CN117009404A CN 117009404 A CN117009404 A CN 117009404A CN 202210470801 A CN202210470801 A CN 202210470801A CN 117009404 A CN117009404 A CN 117009404A
Authority
CN
China
Prior art keywords
information
index string
stored
searched
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210470801.9A
Other languages
English (en)
Inventor
吴龙飞
张广伟
夏泽
潘福江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youzhuju Network Technology Co Ltd
Original Assignee
Beijing Youzhuju Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youzhuju Network Technology Co Ltd filed Critical Beijing Youzhuju Network Technology Co Ltd
Priority to CN202210470801.9A priority Critical patent/CN117009404A/zh
Publication of CN117009404A publication Critical patent/CN117009404A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Storage Device Security (AREA)

Abstract

本公开实施例公开了一种搜索方法、装置、计算机设备及存储介质,该方法包括:确定所接收待搜索信息对应的待查索引串;根据待查索引串,确定与待查索引串匹配的目标组合信息,目标组合信息包括参照索引串及相关联的密文数据信息;将目标组合信息中的密文数据信息,作为待搜索信息的搜索结果。利用该方法,以索引串作为中间项,基于参照索引串将明文数据与密文数据信息建立关联;当进行搜索时,先确定待搜索信息对应的待查索引串,再确定与待查索引串匹配的参照索引串,根据匹配的参照索引串对应的目标组合信息中的密文数据信息,即可以确定搜索结果,实现了对密文数据进行搜索,且提高了搜索效率和准确度。

Description

一种搜索方法、装置、计算机设备及存储介质
技术领域
本公开实施例涉及信息安全技术领域,尤其涉及一种搜索方法、装置、计算机设备及存储介质。
背景技术
为了数据的安全性,通常会在存储数据前对明文数据进行加密处理,然后在数据库中存储加密后的密文数据。目前很多场景中,需要通过模糊搜索来获得相关的数据信息。如在电商场景下,通过输入买家手机号,来查找该买家相关的订单信息,以进行售后处理。
可以看出,基于已知的输入数据信息,在明文数据存储时通过模糊搜索就可以获取与输入数据相关的数据信息。然而,对于密文存储的数据,加密后存储的密文数据与输入数据信息并不存在直接关联,因此,无法直接对所存储的密文数据进行模糊搜索,由此影响了模糊搜索的搜索效率和准确度。
发明内容
本公开实施例提供了一种搜索方法、装置、计算机设备及存储介质,实现了直接对所存储的密文数据进行搜索,同时也提高了搜索效率和准确度。
第一方面,本公开实施例提供了一种搜索方法,该方法包括:
确定所接收待搜索信息对应的待查索引串;
根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息;
将所述目标组合信息中的密文数据信息,作为所述待搜索信息的搜索结果。
第二方面,本公开实施例还提供了一种搜索装置,该装置包括:
待查索引串确定模块,用于确定所接收待搜索信息对应的待查索引串;
目标组合信息确定模块,用于根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息;
搜索结果确定模块,用于将所述目标组合信息中的密文数据信息,作为所述待搜索信息的搜索结果。
第三方面,本公开实施例还提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本公开任意实施例所提供的搜索方法。
第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本公开任意实施例所提供的搜索方法。
本公开实施例的技术方案,具体公开了一种搜索方法、装置、计算机设备及存储介质,该搜索方法包括:确定所接收待搜索信息对应的待查索引串;根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息;将所述目标组合信息中的密文数据信息,作为所述待搜索信息的搜索结果。上述技术方案,以索引串作为中间项,基于参照索引串将明文数据与密文数据信息建立关联;当进行搜索时,先确定待搜索信息对应的待查索引串,然后确定与待查索引串匹配的参照索引串,根据匹配的参照索引串对应的目标组合信息中的密文数据信息,即可以确定模糊搜索结果。相比于现有技术中在不对密文数据进行解密的情况下不能直接对密文数据进行搜索,本技术方案可以实现直接对所存储的密文数据进行搜索,且提高了搜索效率和准确度。
附图说明
为了更加清楚地说明本公开示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本公开所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本公开实施例一所提供的一种搜索方法的流程示意图;
图2为本公开实施例二所提供的一种搜索方法的流程示意图;
图2a为本公开实施例二所提供搜索方法的示例流程图;
图3为本公开实施例三所提供的一种搜索装置的结构示意图;
图4为本公开实施例四所提供的一种计算机设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
实施例一
图1为本公开实施例一所提供的一种搜索方法的流程示意图,本实施例可适用于直接对所存储的密文数据进行搜索的情况,该方法可以由搜索装置来执行,该装置可以通过软件和/或硬件来实现,可配置于终端和/或服务器中来实现本公开实施例中的搜索方法。
需要说明的是,搜索可以理解为输入关键词,系统能够自动进行同义词搜索,或者允许搜索词与被搜索信息之间存在一定差异。基于已知的输入数据信息,在明文数据存储时通过搜索可以获取与输入数据相关的数据信息。然而,对于密文存储的数据,加密后存储的密文数据与输入数据信息并不存在直接关联,因此,在不解密的情况下,无法直接对所存储的密文数据进行搜索。而对于很多场景,为了提高数据的安全性,通常会在存储数据前对明文数据进行加密处理,然后在数据库中存储加密后的密文数据。
为了使密文数据的存储与查询之间存在包含关系,可以采用加密算法对待存储信息进行分组加密并存储,并在接收到待搜索信息时采用相同的加密算法对其分组加密,然后采用分组加密后的结果与所存储的结果进行匹配,进而将相匹配的存储信息作为搜索结果。
上述所提供的搜索方式,如果对要存储的明文信息全部进行分组加密存储至密文数据库中,会至少带来两个问题:密文长度过长问题:密文分组越大密文长度膨胀越大,会增加传输和存储成本;安全性问题:如果要实现检索,就要确保同一明文生成的密文必须不可变,因此不能更换密钥或者修改加密算法,不然会检索不到变更前的密文。但这就造成明文和密文存在一对一的映射关系,安全性大大降低。因此,需要提供一种能够实现对密文数据进行搜索的方法。
如图1所示,本实施例一提供的一种搜索方法具体可包括:
S101、确定所接收待搜索信息对应的待查索引串。
本实施例提供的搜索方法,可以应用于用户对密文数据进行搜索,也可以应用于系统本身对密文数据进行搜索。示例性的,在电商场景下,电商开放平台返回的订单信息中,收件人信息属于敏感信息,往往会加密返回。若商家需要检索该收件人相关的订单信息用于售后处理,则可以通过本方案的搜索方法进行搜索以获得想要的信息。此应用场景为用户对密文数据进行搜索。又比如,目前网站的登录密码,大都是直接加密后存储密文,且不可以进行解密。但当用户需要修改登录密码的时候,如果新密码和旧密码相似度太高,需要给用户进行提醒。此应用场景为系统本身实现对密文数据进行搜索。
考虑到常规的加密算法是对明文数据进行整体加密,这样存在包含关系的明文数据在加密后,密文数据不会存在包含关系,进而无法实现检索。因此,本实施例中对明文数据进行分组加密,同样的,对待搜索信息也进行分组加密后,再进行搜索。
需要知道的是,为了保证通过待查索引串可以在密文数据库中搜索到与之关联的密文数据,待搜索信息的分组加密方式应与密文数据对应索引串的分组加密方式保持一致。示例性的,若密文数据对应索引串按照每2个字符进行分组且将分组后的数据进行哈希加密,将分组加密后的索引串及密文数据存储到密文数据库中;则待搜索信息也应按照每2个字符进行分组且将分组后的待搜索信息进行哈希加密,再进行搜索。
示例性的,假设明文数据为“AB市CD区”,按照2个字符进行分组,分组后表示为:“AB”、“B市”、“市C”、“CD”、“D区”;对于分组后的明文数据进行加密,加密后表示为(encrypt表示一种加密算法,“|”为分隔符,无特殊含义,下同):
encrypt("AB")|encrypt("B市")|encrypt("市C")|encrypt("CD")|encrypt("D区");
假设检索词为“AB市”,首先进行分组,分组后表示为:“AB”、“B市”;对于分组后的待搜索信息进行加密,加密后表示为:
encrypt("AB")|encrypt("B市"),可以看到分组加密后的检索词,包含在密文中,可以进行检索。
其中,待搜索信息可以是多个关键字,可以是关键词,也可以是身份标识,如手机号,身份证号、登录账号等,也可以是包括关键字、关键词和身份标识中的一个或多个,此处不一一列举。待查索引串可以理解为将待搜索信息进行分组加密后得到的字符串。
本步骤中,在接收待搜索信息时,可以确定待搜索信息中包含的字符,将所有字符构成一个序列。然后按照设定拆分规则对该序列进行分组,得到一组或多组字符分组。字符分组的多少与待搜索信息中包含的字符多少以及设定拆分规则有关。对每个字符分组进行设定加密算法处理,可以得到各个字符分组对应的加密值,将所有加密值按顺序进行组合,构成待搜索信息的待查字符串。
S102、根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息。
本实施例中,将明文数据进行加密存储时,需要将明文数据经过处理获得组合信息,组合信息包括参照索引串及相关联密文数据信息。其中,参照索引串可以是由明文数据中部分关键信息经过设定算法处理后得到的结果,用于检索。密文数据信息是指将明文数据进行加密后生成的密文数据,可以支持解密,是用户想要获得的信息。
可以理解的是,参照索引串的确定过程是将明文数据的部分关键信息经过分组加密生成,而步骤S101中是对待搜索信息进行分组加密,确定待查索引串。也就是说参照索引串与待查索引串生成方式是相同的,这样可以保证待查索引串和参照索引串之间可能存在包含关系,从而可以对密文数据进行搜索。
本实施例中,在接收待存储信息时,可以提取待存储信息中的关键信息,确定关键信息包含的字符,将所有字符构成一个序列。然后按照设定拆分规则对该序列进行分组,得到一组或多组字符分组。字符分组的多少与待存储信息中包含的字符多少以及设定拆分规则有关。对每个字符分组进行设定加密算法处理,可以得到各个字符分组对应的加密值,将所有加密值按顺序进行组合,构成待存储信息的参照索引串。
需要说明的是,参照索引串的生成规则与待搜索索引串的生成规则是一样的,即分组方式以及加密算法是一致的。生成参照索引串的过程可以是,提取明文数据中关键信息,对关键信息按照设定规则进行分组加密,将每一组加密后的加密值按顺序进行组合,构成参照索引串。示例性的,提取关键信息可以是:对于手机号可以截取后6位或8位;对于身份证信息可以截取后6位;对于地址信息可以忽略省市区,截取后面的部分。
当然,考虑到为了进一步降低索引串的长度,我们可以在对每个分组(分组大小记为m)的加密运算结果再进行截取(比如截取后n位),但会出现一定的碰撞概率。分组包含字符越大,碰撞概率越小。分组大小m和截取的长度n可以在具体实践中根据实际情况进行权衡调整。
对待存储信息按照设定算法进行加密处理,可以获得加密后的密文数据信息,将参照索引串与密文数据信息进行绑定关联,从而构成一条组合信息。需要说明的是,明文数据加密可以使用单独的加密算法,也可以理解成与生成参照索引串的加密算法不同。这样设计可以保证对于密文数据信息来说,在更换密钥或者升级加密算法时而不影响检索,提高了密文数据信息整体的安全性。
具体的,密文数据库中包含组合信息,由于每个组合信息均包含参照索引串,可以根据待查索引串,将待查索引串与参照索引串进行比对;若参照索引串与待查索引串匹配,可以表征该组合信息是与待查索引串关联,则将该参照索引串对应的组合信息确定为目标组合信息。同样,需要将密文数据库中包含的所有组合信息对应的参照索引串与待查索引串进行比对,进而确定所有与待查索引串匹配的所有参照索引串,并将所有匹配的参照索引串对应的组合信息,作为目标组合信息。
可以知道的是,在将待查索引串与参照索引串进行对比时,对比结果可能是参照索引串与待查索引串匹配,则确定该参照索引串对应的组合信息为目标组合信息,再继续进行其他组合信息中参照索引串与待查索引串的比对;也可能是参照索引串与待查索引串不匹配,则继续进行其他组合信息中参照索引串与待查索引串的比对。当密文数据库中,所有组合信息中的参照索引串均与待查索引串进行比对过,则表示搜索结束。
S103、将所述目标组合信息中的密文数据信息,作为所述待搜索信息的搜索结果。
本实施中,组合信息中包含索引串和对应的密文数据信息。当确定出目标组合信息之后,可以确定目标组合信息中的密文数据信息。密文数据信息即为模糊搜索想要查看的关联信息,目标索引串对应的密文数据信息作为所述待搜索信息的搜索结果。
本公开实施例公开了一种搜索方法,该方法包括:先确定所接收待搜索信息对应的待查索引串;根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息;最后将所述目标组合信息中的密文数据信息作为所述待搜索信息的搜索结果。利用该方法,以索引串作为中间项,基于参照索引串将明文数据与密文数据信息建立关联;当进行搜索时,先确定待搜索信息对应的待查索引串,然后确定与待查索引串匹配的参照索引串,根据匹配的参照索引串对应的目标组合信息中的密文数据信息,即可以确定模糊搜索结果。相比于现有技术中在不对密文数据进行解密的情况下不能直接对密文数据进行搜索,本技术方案可以实现直接对所存储的密文数据进行搜索,且提高了搜索效率和准确度。
作为本实施例一的可选实施例,本可选实施例在上述实施例的基础上,所述目标组合信息记录在密文数据库中,所述密文数据库中所记录组合信息的确定步骤可以包括:
a)确定所接收待存储信息对应的待存索引串。
可以理解的是,在对密文数据存储之前,先对待存储的明文数据按照设定规则进行处理,得到参照索引串和密文数据信息,将参照索引串与对应的密文数据信息进行关联并保存至密文数据库中,以供用户进行查询获取相关信息。
其中,密文数据库存储有至少一条参照索引串及相应密文数据信息的组合信息。本实施例中,可以针对不同用户创建各自对应的加密数据库。比如针对不同的用户,使用用户身份标识号(Identity document,ID)进行加密处理,即每个用户可以拥有各自的密文数据库,各密文数据库之间是独立的、隔离的,可以一定程度上提高安全性。示例性的,比如某电商平台,由于电商平台货品存储量、交易量等数据量较大,如果把所有电商的相关数据都按照设定规则进行分组加密存储到一个密文数据库中,这样进行搜索时,耗费的时间及占用空间都较大。针对此问题,可以为每个电商用户都独立创建一个密文数据库,密文数据库中存储的参照索引串是由对应电商用户的ID进行加密处理获得的,这样保证数据之间隔离存储,当某电商用户需要进行搜索时根据用户的ID确定对应用户ID的密文数据库进行搜索,各用户之间数据并不共享,从而保证了数据安全性,且提高了搜索效率。
本实施例中,是将参照索引串及相应密文数据信息构成组合信息存储在密文数据库中。因此,在存储之前,需要先根据明文数据确定出参照索引串和相关联的密文数据信息。其中,参照索引串的确定过程可以是:确定待存储信息包含的所有字符组成一个字符序列;然后将字符序列按照设定规则进行分组,形成一个或多个组合;将组合按照设定算法进行处理,如哈希算法,将所有的处理值组合构成待存索引串。
进一步地,所述确定所接收待存储信息对应的待存索引串,包括:
a1)基于所述待存储信息包含的字符确定待存字符序列。
具体的,确定每条待存储信息包含的所有字符,可以将所有字符构成待存字符序列或者选择关键字符构成待存字符序列。
优选地,所述基于所述待存储信息包含的字符确定待存字符序列,包括:
a11)基于所述待存储信息包含的字符,获得初始字符序列。
具体的,确定每条待存储信息包含的所有字符,所有字符构成初始字符序列。
a12)确定所述待存储信息归属的信息类型,并获得所述信息类型对应的至少一个关键字符位。
本步骤中,确定待存储信息归属的信息类型,其中信息类型可能是手机号或身份证信息、地址信息等,此处不做具体限制。不同的信息类型对应不同的关键字符位。例如,对于手机号这类信息类型,可以设定截取后6位或8位作为关键字符位、身份证信息可以截取后6位作为关键字符位;对于地址信息这类信息类型,可以忽略省市区,截取后面的部分作为关键字符位。具体的,在确定待存储信息归属的信息类型后,可以根据设定的关键字符位选取方式,确定信息类型对应的字符位选取方式,获得信息类型对应的至少一个关键字符位。
a13)从所述初始字符序列中查找各所述关键字符位对应的关键字符,并基于各所述关键字符构成待存字符序列。
具体的,由于初始字符序列中包含有待存储信息包含的所有字符,在已确定关键字符位的情况下,可以从初始字符序列中查找出各关键字符位对应的关键字符,并将查找出的各关键字符构成待存字符序列。
示例性的,假设待存储信息是存储某货品编号为123456789,则可以确定初始字符序列为123456789;假设对应货品编号这类信息类型,是截取后6位作为关键字符位;因此查找初始字符序列的后6位对应的关键字符构成待存字符序列为456789。
a2)按照设定拆分规则对所述待存字符序列中字符进行分组,获得至少一组第二字符分组。
其中,设定拆分规则是根据具体实践中实际情况确定的。所述设定拆分规则可以表述为:将当前待拆分的字符序列记为待拆分序列,所述待拆分序列为待存字符序列;将所述待拆分序列中的前第一设定个数的字符分别作为目标字符;针对所述待拆分序列的每个目标字符,以所述目标字符为起点,沿所述待拆分序列的正方向,顺序选取第二设定个数的字符,形成所述目标字符对应的字符分组;其中,所述第二设定个数小于待拆分序列的长度值;所述第一设定个数根据所述长度值及所述第二设定个数确定。
其中,对待存字符序列进行拆分,则把待存字符序列作为待拆分序列。可以选择待拆分序列中的前几位字符分别作为目标字符。前几位字符可以表示为前第一设定个数的字符,第一设定个数的取值可以根据用户需求设定或者根据经验值设定。针对待拆分序列的每个目标字符,以目标字符为起点,沿待拆分序列的正方向,顺序选取几位字符,形成目标字符对应的字符分组。顺序选取的几位字符可以表示为顺序选取第二设定个数的字符。第一设定个数应该小于或等于待拆分序列的长度值。第二设定个数决定了每个字符分组中包含字符数量,因此,第一设定个数的选择应该保证每个字符分组中包含第二设定个数的字符数量。
示例性的,假设待拆分序列为456789,假设第一设定个数为5,第二设定个数为2,将待拆分序列中的前5个字符分别作为目标字符,可以看出目标字符分别是“4”、“5”、“6”、“7”、“8”,以各目标字符为起点,沿待拆分序列的正方向,顺序选取2个字符,形成目标字符对应的字符分组,字符分组分别表示为‘45’、‘56’、“67”、“78”、“89”。
需要说明的是,对于待搜索信息和待存字符序列所对应的设定拆分规则是相同的,这样可以保证待搜索信息对应的待搜索引串,与待存字符序列对应的参照索引串才有可能存在包含关系,才能进行搜索。
a3)对各所述第二字符分组进行哈希处理,得到各第二字符分组分别对应的第二哈希值。
其中,哈希处理可以理解为对第二字符分组按照哈希算法进行加密。需要知道的是,在生成待搜索引串过程中使用的加密算法与待存索引串使用的加密算法相同,都是同一个哈希加密算法。这与使用同样的设定拆分规则用处相同,都是为了保证待搜索信息对应的待查索引串,与待存字符序列对应的参照索引串有可能存在包含关系,才能进行搜索。
需要说明的是,为了保证数据的安全性,可以根据用户ID使用不同的哈希函数,创建各自的密文数据库,从而保障各自数据库存储隔离,提高了数据安全性。当然,对于同一个目标数据库,也可以理解成同一个用户ID,存储和查询要保证哈希算法相同。
具体的,依据哈希函数,对各第二字符分组进行哈希处理,可以得到一个或多个第二哈希值,将所有哈希值进行组合构成待存储信息的待存索引串。示例性的,假设获得第二字符分组为:‘45’、‘56’、“67”、“78”、“89”,则进行哈希加密后(其中,encrypt表示一种加密算法),得到:encrypt("45")、encrypt("56")、encrypt("67")、encrypt("78")、encrypt("89")。
a4)根据各所述第二哈希值,确定所述待存储信息的待存索引串。
具体的,将所有第二哈希值按照对应拆分第二字符分组的顺序进行组合构成待存储信息的待存索引串。继续接上述示例进行描述,待存索引串可以表示为:encrypt("45")|encrypt("56")|encrypt("67")|encrypt("78")|encrypt("89")(其中,encrypt表示一种加密算法,|表示分割,无实际含义)。
b)对所述待存储信息进行加密处理,获得所述待存储信息的密文数据信息。
本步骤中,根据设定的加密策略对待存储信息进行加密处理,可以获得相应的密文数据信息。其中,所用到的加密算法应该是可逆的,从而保证后续搜索到密文数据信息后,可以对密文数据信息进行解密获得用户想要的明文数据。需要说明的是,明文数据加密可以使用单独的加密算法,也可以理解成与生成参照索引串的加密算法不同。这样设计可以保证对于密文数据信息来说,在更换密钥或者升级加密算法时而不影响检索,提高了密文数据信息整体的安全性。
c)基于所述待存索引串确定参照索引串,并将所述参照索引串与所述密文数据信息相关联,构成一条组合信息并存储至所述密文数据库中。
本步骤中,在确定出待存索引串后,可以直接将待存索引串作为参照索引串,也可以截取部分待存索引串作为参照索引串。考虑到为了进一步降低索引串的长度,可以在对每个分组(分组大小记为m)的加密运算结果再进行截取(比如截取后n位),但会出现一定的碰撞概率。分组包含字符越大,碰撞概率越小。分组大小m和截取的长度n可以在具体实践中根据实际情况进行权衡调整。
具体的,在确定参照索引串后,将参照索引串与密文数据信息相关联,构成一条组合信息并存储至密文数据库中。示例性的,假设待存储信息为“AB省CD市EF区G中心”,其中,以“G中心”关键信息进行2字符分组且哈希运算生成待存索引串作为参照索引串:hash("G中")|hash("中心"),待存储信息进行加密运算得到:encrypt("AB省CD市EF区G中心");组合信息可以表示为:hash("G中")|hash("中心")+encrypt("AB省CD市EF区G中心"),存储至密文数据库中,其中hash代表一种哈希算法,encrypt表示一种加密算法,|表示分割,无实际含义。可以知道的是密文数据库中可以包含多条组合信息。其中参照索引串用于后续搜索,密文数据信息为用户想要的数据信息。
进一步地,所述基于所述待存索引串确定参照索引串,包括:将所述待存索引串直接作为参照索引串;或者,从所述待存索引串中选取子索引串,作为参照索引串。
本实施例中,可以将待存索引串直接作为参照索引串。考虑到为了进一步降低索引串的长度,也可以对每个分组的加密运算结果再进行截取,获得子索引串,将子索引串作为参照索引串。比如选取前n位、或者选取中间n位、或者选取后n位(n可以为任一小于每组长度的整数),选取方式可以是由用户预先设定的。可以理解的是,选取部分索引串可能会出现一定的碰撞概率。每组长度包含字符越大,碰撞概率越小。因此,每组分组长度和截取的长度可以在具体实践中根据实际情况进行权衡调整。
示例性的,假设设定选取方式为:选取每个分组的加密运算结果的后2位作为子索引串。假设分组为‘456’、‘567’、“678”、“789”,对应的加密结果为:encrypt("456")、encrypt("567")、encrypt("678")、encrypt("789"),其中,encrypt表示一种加密算法,|表示分割,无实际含义。分别截取加密结果的后2位作为子索引串,将截取获得的所有子索引串组合构成参照索引串。
作为本实施例一的另一个可选实施例,本可选实施例在上述实施例的基础上,进一步优化增加了:解密所述搜索结果,将解密后的搜索结果反馈至客户端的搜索界面上。
在本可选实施例中,进一步给出了确定搜索结果后,解密搜索结果,即解密密文数据信息。由于明文数据加密成密文数据信息的加密算法是可逆的,则可以将密文数据信息按照加密逆运算进行解密,并将解密后的搜索结果反馈至客户端的搜索界面上,以供用户查看。
本实施例上述可选实施例,给出了基于本实施例在确定出搜索结果后,实现对搜索结果的反馈。可以看出,相比于现有技术无法对密文数据进行直接搜索,本可选实施例能够直接通过在前已确定的搜索结果,进行解密反馈至客户端的搜索界面上,实现了对密文数据的直接搜索,提高了搜索效率和准确度。
实施例二
图2给出了本公开实施例所提供的一种搜索方法的流程示意图,本实施例为上述实施例的进一步优化,在本实施例中,进一步将确定所接收待搜索信息对应的待查索引串具体化为:按照设定拆分规则对所述待搜索信息中字符进行分组,获得至少一组第一字符分组;对各所述第一字符分组进行哈希处理,得到各第一字符分组分别对应的第一哈希值;根据各所述第一哈希值,确定所述待搜索信息的待查索引串。
同时,本实施例将根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息具体化为:针对预先存储的每个组合信息,将所述待查索引串与所述组合信息中参照索引串相比对,得到索引串比对结果;将索引串比对结果满足比对条件的组合信息作为与所述待查索引串匹配的目标组合信息;其中,比对条件设定为:待查索引串为组合信息中参照索引串的子串;或者,组合信息中参照索引串为所述待查索引串的子串。
如图2所示,本实施例二提供的一种搜索方法,具体包括如下步骤:
S201、按照设定拆分规则对所述待搜索信息中字符进行分组,获得至少一组第一字符分组。
具体的,当接收到待搜索信息时,如果待搜索信息是文字或数字等字符形式组成的,则确定待搜索信息中包含的所有字符,将待搜索信息作为待搜索字符序列。示例性的,欲搜索手机尾号为1234的关联信息,则可以确定待搜字符序列为“1234”。如果待搜索信息是语音或图片形式,则需要先将语音或图片转换成字符形式表示,再将转换后的待搜索信息中包含的字符构成待搜字符序列。
本步骤中待搜索信息对应的设定拆分规则应与密文数据库中存储的参照索引串对应的设定拆分规则一致。这样可以保证待搜索信息对应的待搜索引串,与待存字符序列对应的参照索引串才有可能存在包含关系,才能进行搜索。具体的,按照拆分规则从待搜索信息中所有字符进行分组完成,可以获得一组或多组第一字符分组。
进一步地,所述设定拆分规则包括:
将当前待拆分的字符序列记为待拆分序列,所述待拆分序列为待搜索信息;将所述待拆分序列中的前第一设定个数的字符分别作为目标字符;针对所述待拆分序列的每个目标字符,以所述目标字符为起点,沿所述待拆分序列的正方向,顺序选取第二设定个数的字符,形成所述目标字符对应的字符分组;其中,所述第二设定个数小于待拆分序列的长度值;所述第一设定个数根据所述长度值及所述第二设定个数确定。
设定拆分规则可详见实施例一中的描述,此处不再阐述。
S202、对各所述第一字符分组进行哈希处理,得到各第一字符分组分别对应的第一哈希值。
其中,哈希处理可以理解为对第一字符分组基于哈希加密算法进行处理。需要知道的是,在生成待查索引串过程中使用的加密算法与待存索引串使用的加密算法相同。这与使用同样的设定拆分规则用处相同,都是为了保证待搜字符序列对应的待查索引串,与待存字符序列对应的参考索引串有可能存在包含关系,才能进行搜索。
需要说明的是,对于同一个数据库,也可以理解成对于同一个用户ID,存储和查询对应的索引串要保证使用相同的哈希算法。
具体的,依据设定的哈希函数,对各第一字符分组进行哈希处理,可以得到一个或多个第一哈希值。
S203、根据各所述第一哈希值,确定所述待搜索信息的待查索引串。
将所有哈希值按照对应拆分第一字符分组的顺序进行组合构成待搜索信息的待查索引串。
S204、针对预先存储的每个组合信息,将所述待查索引串与所述组合信息中参照索引串相比对,得到索引串比对结果。
具体的,遍历密文数据库中的组合信息,将待查索引串与每个组合信息中参照索引串相比对,当密文数据库中的所有组合信息均被遍历完后,搜索才会结束。可以理解的是,比对结果可能是待查索引串为组合信息中参照索引串的子串、或者组合信息中参照索引串为待查索引串的子串、或者待查索引串与组合信息中参照索引串中的参照索引串完全不关联。
对于每个组合信息,待查索引串与其比对结果均有可能为以上三种结果中的一种。当密文数据库中所有组合信息均与待查索引串比对过,则搜索结束。
S205、将索引串比对结果满足比对条件的组合信息作为与所述待查索引串匹配的目标组合信息。
其中,比对条件设定为:待查索引串为组合信息中参照索引串的子串;或者,组合信息中参照索引串为所述待查索引串的子串。
示例性的,假设待查索引串为:encrypt("45")|encrypt("56")(其中,encrypt表示一种加密算法,|表示分割,无实际含义),A组合信息中的参照索引串为:encrypt("45")|encrypt("56")|encrypt("67")|encrypt("78");B组合信息中的参照索引串为encrypt("56"),根据该比对条件,可以判断:待查索引串encrypt("45")|encrypt("56")为A组合信息中的参照索引串encrypt("45")|encrypt("56")|encrypt("67")|encrypt("78")的子串,索引串比对结果满足比对条件。B组合信息中的参照索引串encrypt("56")为待查索引串encrypt("45")|encrypt("56")的子串,索引串对比结果满足比对条件。
具体的,如果待查索引串为组合信息中参照索引串的子串;或者,组合信息中参照索引串为待查索引串的子串,则表明该参照索引串与待查索引串关联,参照索引串的组合信息是用户想要获得的,将参照索引串的组合信息作为目标组合信息,并继续将密文数据库中的其它组合信息中的参照索引串与待查索引串进行比对。当密文数据库中的组合信息均遍历过,则遍历结束。
如果待查索引串不为组合信息中参照索引串的子串;并且,组合信息中参照索引串也不为待查索引串的子串,则表明该参照索引串与待查索引串不关联,参照索引串的组合信息不是用户想要获得的,则继续将密文数据库中的其它组合信息,并继续将密文数据库中的其它组合信息中的参照索引串与待查索引串进行比对。当密文数据库中的组合信息均遍历过,则遍历结束。
S206、将所述目标组合信息中的密文数据信息作为所述待搜索信息的搜索结果。
具体的,根据上述步骤确定索引串比对结果满足比对条件后,可以知道目标组合信息中的密文数据信息是用户想要获得的信息,则目标组合信息中的密文数据信息作为待搜索信息的搜索结果。
为了更清楚的表述本公开实施例,以电商应用场景为例进行进一步举例描述。由于某电商开放平台返回的订单信息中,收件人信息属于敏感信息,会加密处理。该电商开放平台的数据库中存储有收件人的订单信息,其中收件人手机号的部分位数进行哈希加密获得参照索引串,该手机号对应的订单信息进行加密获得密文数据信息。加密后的手机号与关联的加密后订单信息作为组合信息存储在数据库中。当商家有需要检索需求时,比如根据收件人手机号查询该手机号相关的订单信息用于售后处理。例如,商家想要查询收件人手机尾号后四位为“1234”的相关订单信息,则将“1234”为待搜索字符。假设设定拆分规则为取手机尾号后四位的前三位为首字符,每两个字符为一组。搜索的步骤包括:1、按照设定拆分规则对待搜索信息“1234”中字符进行分组,获得三组第一字符分组“12”、“23”、“34”;2、对第一字符分组“12”、“23”、“34”进行哈希处理,得到各第一字符分组分别对应的第一哈希值hash("12")、hash("23")、hash("34"),其中,假设hash为哈希算法;3、根据各第一哈希值hash("12")、hash("23")、hash("34"),确定待搜索信息的待查索引串为hash("12")|hash("23")|hash("34");4、针对预先存储的每个组合信息,将待查索引串hash("12")|hash("23")|hash("34")与组合信息中参照索引串相比对,得到索引串比对结果;5、将索引串比对结果满足待查索引串为参照索引串的子串或者,参照索引串为待查索引串的子串,则将参照索引串关联的组合信息作为与待查索引串匹配的目标组合信息;6、将目标组合信息中的加密后的订单信息作为待搜索信息的搜索结果。7、解密订单信息,将解密后的订单信息反馈至客户端的搜索界面上,商家可以查看搜索界面中的搜索结果,获取收件人手机号后四位为“1234”的关联订单信息。
本实施例二提供的一种搜索方法,给出了确定所接收待搜索信息对应的待查索引串的具体实现,还给出了确定根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息的具体实现。利用本实施例提供的方法,当需要进行搜索时,先将待搜索信息按照与生成参照索引串相同的方式进行分组加密,生成待查检索串;从而保障待查索引串与参照索引串有包含关系,通过待查索引串与参照索引串进行比对,就可以确定与待查索引串匹配的参照索引串,将参照索引串对应的组合信息作为目标组合信息,将目标组合信息中的密文数据信息作为搜索的结果。相比于现有技术中在不对密文数据进行解密的情况下不能直接对密文数据进行搜索,本技术方案实现直接对所存储的密文数据进行搜索,且提高了搜索效率和准确度。
为便于更好理解本实施例所提供的方法,图2a为本公开实施例二所提供搜索方法的示例流程图,如图2a所示,下述给出一个示例性流程来说明搜索方法在实际应用中的执行过程:
S1、接收待存储信息。
S2、基于待存储信息包含的字符,获得初始字符序列。
S3、根据待存储信息归属的信息类型,获得关键字符位。
S4、从初始字符序列中查找各关键字符位对应的关键字符,并基于各关键字符构成待存字符序列。
S5、对待存字符序列中字符进行分组,获得第二字符分组;
S6、对各第二字符分组进行哈希处理,得到各第二字符分组分别对应的第二哈希值;
S7、根据各第二哈希值,确定待存储信息的待存索引串;
S8、对待存储信息进行加密处理,获得待存储信息的密文数据信息;
S9、基于待存索引串确定参照索引串,并将参照索引串与密文数据信息相关联,构成一条组合信息存储至密文数据库中。
以上步骤S1~S9,是在接收到待存储信息后执行的,其中,步骤S1~S7与步骤S8执行顺序不做具体限制。以下步骤S10~S17是在接收到搜索信息后执行的,是搜索的具体流程。
S10、接收待搜索信息;
S11、按照设定拆分规则对待搜索信息中字符进行分组,获得第一字符分组;
S12、对各第一字符分组进行哈希处理,得到各第一字符分组分别对应的第一哈希值;
S13、根据各所述第一哈希值,确定待搜索信息的待查索引串;
S14、针对预先存储的每个组合信息,将待查索引串与组合信息中参照索引串相比对,得到索引串比对结果;
S15、将索引串比对结果满足比对条件的组合信息作为与待查索引串匹配的目标组合信息;
S16、将目标组合信息中的密文数据信息,作为待搜索信息的搜索结果;
S17、解密搜索结果,将解密后的搜索结果反馈至客户端的搜索界面上。
实施例三
图3为本公开实施例三所提供的一种搜索装置的结构示意图,本实施例可适用于直接对所存储的密文数据进行搜索的情况,该装置可以通过软件和/或硬件来实现,可配置于终端和/或服务器中来实现本公开实施例中的搜索方法。该装置具体可包括:待查索引串确定模块31、目标组合信息确定模块32、以及搜索结果确定模块33。
其中,待查索引串确定模块31,用于确定所接收待搜索信息对应的待查索引串;
目标组合信息确定模块32,用于根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息;
搜索结果确定模块33,用于将所述目标组合信息中的密文数据信息作为所述待搜索信息的搜索结果。
本实施例三提供的一种搜索装置,集成在执行设备中,先确定所接收待搜索信息对应的待查索引串;然后根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息;最后将所述目标组合信息中的密文数据信息作为所述待搜索信息的搜索结果。利用该方法,以索引串作为中间项,基于参照索引串将明文数据与密文数据信息建立关联;当进行搜索时,先确定待搜索信息对应的待查索引串,然后确定与待查索引串匹配的参照索引串,根据匹配的参照索引串对应的目标组合信息中的密文数据信息,即可以确定搜索结果,实现了对密文数据进行模糊搜索,且提高了搜索效率和准确度。
在本公开实施例中任一可选技术方案的基础上,可选地,待查索引串确定模块31具体可用于:
按照设定拆分规则对所述待搜字符序列中字符进行分组,获得至少一组第一字符分组;
对各所述第一字符分组进行哈希处理,得到各第一字符分组分别对应的第一哈希值;
根据各所述第一哈希值,确定所述待搜索信息的待查索引串。
在本公开实施例中任一可选技术方案的基础上,可选地,所述目标组合信息记录在密文数据库中,该装置还包括组合信息确定模块,组合信息确定模块具体可以包括:
待存索引串确定单元,用于确定所接收待存储信息对应的待存索引串;
密文数据信息获得单元,用于对所述待存储信息进行加密处理,获得所述待存储信息的密文数据信息;
组合信息构成单元,用于基于所述待存索引串确定参照索引串,并将所述参照索引串与所述密文数据信息相关联,构成一条组合信息存储至所述密文数据库中。
在本公开实施例中任一可选技术方案的基础上,可选地,待存索引串确定单元具体可以用于:
基于所述待存储信息包含的字符确定待存字符序列;
按照设定拆分规则对所述待存字符序列中包含的字符进行分组,获得至少一组第二字符分组;
对各所述第二字符分组进行哈希处理,得到各第二字符分组分别对应的第二哈希值;
根据各所述第二哈希值,确定所述待存储信息的待存索引串。
进一步地,所述设定拆分规则包括:
将当前待拆分的字符序列记为待拆分序列,所述待拆分序列为待搜索信息或待存字符序列;
将所述待拆分序列中的前第一设定个数的字符分别作为目标字符;
针对所述待拆分序列的每个目标字符,以所述目标字符为起点,沿所述待拆分序列的正方向,顺序选取第二设定个数的字符,形成所述目标字符对应的字符分组;
其中,所述第二设定个数小于待拆分序列的长度值;所述第一设定个数根据所述长度值及所述第二设定个数确定。
在本公开实施例中任一可选技术方案的基础上,可选地,待存索引串确定单元用于基于所述待存储信息包含的字符确定待存字符序列的步骤具体可以表述为:
基于所述待存储信息包含的字符,获得初始字符序列;
确定所述待存储信息归属的信息类型,并获得所述信息类型对应的至少一个关键字符位;
从所述初始字符序列中查找各所述关键字符位对应的关键字符,并基于各所述关键字符构成待存字符序列。
在本公开实施例中任一可选技术方案的基础上,可选地,所述组合信息构成单元用于基于所述待存索引串确定参照索引串的步骤可以表述为:
将所述待存索引串直接作为参照索引串;或者,
从所述待存索引串中选取子索引串并作为参照索引串。
在本公开实施例中任一可选技术方案的基础上,可选地,目标组合信息确定模块32具体可以用于:
针对预先存储的每个组合信息,将所述待查索引串与所述组合信息中参照索引串相比对,得到索引串比对结果;
将索引串比对结果满足比对条件的组合信息作为与所述待查索引串匹配的目标组合信息;
其中,比对条件设定为:待查索引串为组合信息中参照索引串的子串;或者,组合信息中参照索引串为所述待查索引串的子串。
在本公开实施例中任一可选技术方案的基础上,可选地,该装置还包括解密模块,用于:
解密所述搜索结果,将解密后的搜索结果反馈至客户端的搜索界面上。
上述装置可执行本公开任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开实施例的保护范围。
实施例四
图4为本公开实施例四所提供的一种计算机设备的结构示意图。下面参考图4,其示出了适于用来实现本公开实施例的计算机设备(例如图4中的终端设备或服务器)40的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的计算机设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备40可以包括处理装置(例如中央处理器、图形处理器等)41,其可以根据存储在只读存储器(ROM)42中的程序或者从存储装置48加载到随机访问存储器(RAM)43中的程序而执行各种适当的动作和处理。在RAM 43中,还存储有计算机设备40操作所需的各种程序和数据。处理装置41、ROM 42以及RAM 43通过总线45彼此相连。编辑/输出(I/O)接口44也连接至总线45。
通常,以下装置可以连接至I/O接口44:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置46;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置47;包括例如磁带、硬盘等的存储装置48;以及通信装置49。通信装置49可以允许计算机设备40与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的计算机设备40,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置49从网络上被下载和安装,或者从存储装置48被安装,或者从ROM 42被安装。在该计算机程序被处理装置41执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开实施例提供的计算机设备与上述实施例提供的搜索方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
实施例五
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的搜索方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述计算机设备中所包含的;也可以是单独存在,而未装配入该计算机设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该计算机设备执行时,使得该计算机设备:
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
在本公开实施例中,计算机存储介质中所包含的计算机可执行指令在由计算机处理器执行时用于执行上述提及的搜索方法对应的所有实施例。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了如果干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (12)

1.一种搜索方法,其特征在于,包括:
确定所接收待搜索信息对应的待查索引串;
根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息;
将所述目标组合信息中的密文数据信息,作为所述待搜索信息的搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述确定所接收待搜索信息对应的待查索引串,包括:
按照设定拆分规则对所述待搜索信息中字符进行分组,获得至少一组第一字符分组;
对各所述第一字符分组进行哈希处理,得到各第一字符分组分别对应的第一哈希值;
根据各所述第一哈希值,确定所述待搜索信息的待查索引串。
3.根据权利要求1所述的方法,其特征在于,所述目标组合信息记录在密文数据库中,所述密文数据库中所记录组合信息的确定步骤包括:
确定所接收待存储信息对应的待存索引串;
对所述待存储信息进行加密处理,获得所述待存储信息的密文数据信息;
基于所述待存索引串确定参照索引串,并将所述参照索引串与所述密文数据信息相关联,构成一条组合信息存储至所述密文数据库中。
4.根据权利要求3所述的方法,其特征在于,所述确定所接收待存储信息对应的待存索引串,包括:
基于所述待存储信息包含的字符确定待存字符序列;
按照设定拆分规则对所述待存字符序列中包含的字符进行分组,获得至少一组第二字符分组;
对各所述第二字符分组进行哈希处理,得到各第二字符分组分别对应的第二哈希值;
根据各所述第二哈希值,确定所述待存储信息的待存索引串。
5.根据权利要求2或4所述的方法,其特征在于,所述设定拆分规则包括:
将当前待拆分的字符序列记为待拆分序列,所述待拆分序列为待搜索信息或待存字符序列;
将所述待拆分序列中的前第一设定个数的字符分别作为目标字符;
针对所述待拆分序列的每个目标字符,以所述目标字符为起点,沿所述待拆分序列的正方向,顺序选取第二设定个数的字符,形成所述目标字符对应的字符分组;
其中,所述第二设定个数小于待拆分序列的长度值;所述第一设定个数根据所述长度值及所述第二设定个数确定。
6.根据权利要求4所述的方法,其特征在于,所述基于所述待存储信息包含的字符确定待存字符序列,包括:
基于所述待存储信息包含的字符,获得初始字符序列;
确定所述待存储信息归属的信息类型,并获得所述信息类型对应的至少一个关键字符位;
从所述初始字符序列中查找各所述关键字符位对应的关键字符,并基于各所述关键字符构成待存字符序列。
7.根据权利要求3所述的方法,其特征在于,所述基于所述待存索引串确定参照索引串,包括:
将所述待存索引串直接作为参照索引串;或者,
从所述待存索引串中选取子索引串,作为参照索引串。
8.根据权利要求1所述的方法,其特征在于,所述根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,包括:
针对预先存储的每个组合信息,将所述待查索引串与所述组合信息中参照索引串相比对,得到索引串比对结果;
将索引串比对结果满足比对条件的组合信息作为与所述待查索引串匹配的目标组合信息;
其中,比对条件设定为:待查索引串为组合信息中参照索引串的子串;或者,组合信息中参照索引串为所述待查索引串的子串。
9.根据权利要求1-8任一项所述的方法,其特征在于,还包括:
解密所述搜索结果,将解密后的搜索结果反馈至客户端的搜索界面上。
10.一种搜索装置,其特征在于,包括:
待查索引串确定模块,用于确定所接收待搜索信息对应的待查索引串;
目标组合信息确定模块,用于根据所述待查索引串,确定与所述待查索引串匹配的目标组合信息,所述目标组合信息包括参照索引串及相关联的密文数据信息;
搜索结果确定模块,用于将所述目标组合信息中的密文数据信息,作为所述待搜索信息的搜索结果。
11.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的搜索方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的搜索方法。
CN202210470801.9A 2022-04-28 2022-04-28 一种搜索方法、装置、计算机设备及存储介质 Pending CN117009404A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210470801.9A CN117009404A (zh) 2022-04-28 2022-04-28 一种搜索方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210470801.9A CN117009404A (zh) 2022-04-28 2022-04-28 一种搜索方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN117009404A true CN117009404A (zh) 2023-11-07

Family

ID=88571526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210470801.9A Pending CN117009404A (zh) 2022-04-28 2022-04-28 一种搜索方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN117009404A (zh)

Similar Documents

Publication Publication Date Title
US11477006B2 (en) Secure analytics using an encrypted analytics matrix
CN107209787B (zh) 提高专用加密数据的搜索能力
CN106971121B (zh) 数据处理方法、装置、服务器及存储介质
US20130238646A1 (en) Partial-Match Searches of Encrypted Data Sets
US9197613B2 (en) Document processing method and system
CN109766707B (zh) 基于区块链的数据处理方法、装置、设备和介质
CN113254982B (zh) 一种支持关键词查询的匿踪查询方法及系统
CN105827582A (zh) 一种通信加密方法、装置和系统
CN114428972A (zh) 支持外包计算的隐私保护查询方法、装置及相关设备
CN116502254B (zh) 可查得统计的匿踪查询方法及装置
CN116502276B (zh) 匿踪查询方法及装置
CN110062941B (zh) 消息发送系统及方法、通信终端、服务器装置、记录介质
CN112818371A (zh) 资源访问控制方法、系统、装置、设备及介质
US11101987B2 (en) Adaptive encryption for entity resolution
CN116010678B (zh) 一种匿踪查询方法、装置及设备
US20210224242A1 (en) Systems and methods for indexing and searching data
US11133926B2 (en) Attribute-based key management system
CN110765238A (zh) 数据加密查询方法及装置
US11106740B2 (en) Search device, search system, search method, and computer readable medium
CN117009404A (zh) 一种搜索方法、装置、计算机设备及存储介质
CN112580087B (zh) 加密数据搜索方法及装置、存储介质、电子设备
CN114661793A (zh) 模糊查询方法、装置、电子设备及存储介质
Handa et al. Keyword binning-based efficient search on encrypted cloud data
EP4193290B1 (en) Multi-key information retrieval
CN110619218B (zh) 用于生成信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination