CN112199420A - 一种房产隐私字段信息模糊搜索方法 - Google Patents
一种房产隐私字段信息模糊搜索方法 Download PDFInfo
- Publication number
- CN112199420A CN112199420A CN202011109715.2A CN202011109715A CN112199420A CN 112199420 A CN112199420 A CN 112199420A CN 202011109715 A CN202011109715 A CN 202011109715A CN 112199420 A CN112199420 A CN 112199420A
- Authority
- CN
- China
- Prior art keywords
- plaintext
- privacy data
- privacy
- index value
- property
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Fuzzy Systems (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种房产隐私字段信息模糊搜索方法,包括以下步骤:确定隐私数据的字符范围,对明文隐私数据按照单个字符进行拆分;按照顺序进行消息摘要计算,使用特定分隔符拼接计算出的消息摘要值获得最终索引值并存放在单独的隐私字段内;获取模糊搜索查询关键字,按照单个字符进行拆分并采用相同的消息摘要算法对查询关键字的单字符进行摘要计算,使用特定的分隔符拼接摘要计算结果获得查询关键字的最终索引值;根据查询关键字的最终索引值到数据库中查询,获得与匹配的加密房产隐私明文数据并进行解密,获得最终房产明文隐私数据。本方案能实现在不暴露隐私信息的情况下,利用数据库标准语言完成隐私信息查找,提升隐私数据安全性。
Description
技术领域
本发明涉及信息检索技术领域,尤其涉及一种房产隐私字段信息模糊搜索方法。
背景技术
模糊匹配本质是一种数据加工技术,它能为风控业务提供多种维度的拓展数据。房产信息一般是指产证号,产证日期,产权人,面积,房龄,户型图,是不是属于房改售房,开发商信息、预售证信息等一系列基本信息。
现有的房产隐私字段信息搜索技术存在以下问题:
一、个人隐私数据直接明文存储,这样的设计机制,让获取隐私数据的成本变低,非常容易造成隐私数据泄露。
二、个人隐私数据仅加密存储,这样的设计,虽然解决了隐私数据的可见性,但是无法实现模糊匹配的需求。
三、个人隐私数据加密存储,然后存在一个明文到密文的映射,这样的设计,虽然解决了隐私数据的模糊匹配问题,但是依然把明文数据暴露出去,不能实现真正实现隐私数据不可见。
发明内容
本发明的目的在于克服现有技术的不足,提供一种房产隐私字段信息模糊搜索方法,方法能实现在不暴露隐私信息的情况下,利用数据库标准语言完成隐私信息查找,提升隐私数据安全性。
本发明的目的是通过以下技术方案来实现的:
一种房产隐私字段信息模糊搜索方法,其特征在于,包括以下步骤:
S1,确定隐私数据的字符范围,使用字符分割算法对明文隐私数据按照单个字符进行拆分;
S2,利用消息摘要算法对明文隐私数据按照单字符顺序进行消息摘要计算,使用特定分隔符拼接计算出的消息摘要值,获得明文隐私数据的最终索引值并存放在单独的隐私字段内,同时将隐私字段存储到数据库中;
S3,隐私字段信息模糊搜索,获取模糊搜索输入的隐私字段查询关键字,使用字符分割算法按照单个字符进行拆分并采用步骤S2中相同的消息摘要算法对查询关键字的单字符顺序进行摘要计算,使用特定的分隔符拼接摘要计算出的结果值,获得查询关键字的最终索引值;
S4,搜索结果匹配,根据查询关键字的最终索引值到数据库中进行模糊查询匹配,获得与查询关键字最终索引值匹配的房产明文隐私数据的最终索引值;
S5,分配共享密钥,将匹配的房产明文隐私数据的最终索引值按照查询结果中查询关键字出现的词频从高到低排序,获取词频最高的房产明文隐私数据的最终索引值对应的加密房产明文隐私数据,使用共享密钥对加密房产明文隐私数据进行解密,获得最终房产明文隐私数据。
进一步的,所述步骤S1中明文隐私数据按照单个字符进行拆分过程具体包括;
S101,获取明文隐私数据和预设分隔符,并将明文隐私数据转换为字符串的形式;
S102,调用字符串分割函数,按照隐私数据的字符范围,将明文隐私字符串以预设分隔符进行单个字符分割,获得单个字符的明文隐私数据。
进一步的,所述步骤S2中对明文隐私数据按照单字符顺序进行消息摘要计算过程具体包括:
S201,获取明文隐私数据的单个字符,利用消息摘要算法按照单字符顺序对每个单字符的内容进行计算,获得单个字符的消息摘要;
S202,对明文隐私数据中每个字符串的消息摘要进行散列运算,生成加密后的消息摘要值;
S203,使用特定分隔符拼接加密后的消息摘要值,生成明文隐私数据的最终索引值并存放在数据库的单独隐私字段中。
进一步的,所述步骤S4中搜索结果匹配过程具体包括以下步骤:
S401,将查询关键字的最终索引值设定为模糊查询的范围,利用查询SQL语句中的LIKE关键字在数据库存储的隐私字段中进行字符匹配;
S402,将数据库中所有与查询关键字最终索引值匹配的房产明文隐私数据的最终索引值。
进一步的,所述步骤S2还包括房产明文隐私数据的共享密钥生成步骤:获取房产明文隐私数据,使用文本加密算法对其进行加密,生成共享密钥,并获得加密后的房产明文隐私数据,并将加密后的房产明文隐私数据与房产明文隐私数据的最终索引值建立映射关系。
本发明的有益效果:本方案首先对明文隐私信息按照单个字符进行拆分,然后依次对单字符采用合适的的摘要算法计算摘要信息,然后保持循序按照单字符加分隔符方式组合成最终字符,存放在单独的字段中,模糊搜索时,采用相同的策略计算出明文关键字的摘要信息,然后利用标准数据库模糊查询语言进行模糊查询。这种方法能实现在不暴露隐私信息的情况下,利用数据库标准语言完成隐私信息查找,提升隐私数据安全性。
附图说明
图1是本发明的方法流程图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式。
本实施例中,如图1所示,一种房产隐私字段信息模糊搜索方法,其特征在于,包括以下步骤:
S1,确定隐私数据的字符范围,使用字符分割算法对明文隐私数据按照单个字符进行拆分;
S2,利用消息摘要算法对明文隐私数据按照单字符顺序进行消息摘要计算,使用特定分隔符拼接计算出的消息摘要值,获得明文隐私数据的最终索引值并存放在单独的隐私字段内,同时将隐私字段存储到数据库中;
S3,隐私字段信息模糊搜索,获取模糊搜索输入的隐私字段查询关键字,使用字符分割算法按照单个字符进行拆分并采用步骤S2中相同的消息摘要算法对查询关键字的单字符顺序进行摘要计算,使用特定的分隔符拼接摘要计算出的结果值,获得查询关键字的最终索引值;
S4,搜索结果匹配,根据查询关键字的最终索引值到数据库中进行模糊查询匹配,获得与查询关键字最终索引值匹配的房产明文隐私数据的最终索引值;
S5,分配共享密钥,将匹配的房产明文隐私数据的最终索引值按照查询结果中查询关键字出现的词频从高到低排序,获取词频最高的房产明文隐私数据的最终索引值对应的加密房产明文隐私数据,使用共享密钥对加密房产明文隐私数据进行解密,获得最终房产明文隐私数据。
进一步的,所述步骤S1中明文隐私数据按照单个字符进行拆分过程具体包括;
S101,获取明文隐私数据和预设分隔符,并将明文隐私数据转换为字符串的形式;
S102,调用字符串分割函数,按照隐私数据的字符范围,将明文隐私字符串以预设分隔符进行单个字符分割,获得单个字符的明文隐私数据。
进一步的,所述步骤S2中对明文隐私数据按照单字符顺序进行消息摘要计算过程具体包括:
S201,获取明文隐私数据的单个字符,利用消息摘要算法按照单字符顺序对每个单字符的内容进行计算,获得单个字符的消息摘要;
S202,对明文隐私数据中每个字符串的消息摘要进行散列运算,生成加密后的消息摘要值;
S203,使用特定分隔符拼接加密后的消息摘要值,生成明文隐私数据的最终索引值并存放在数据库的单独隐私字段中。
进一步的,所述步骤S4中搜索结果匹配过程具体包括以下步骤:
S401,将查询关键字的最终索引值设定为模糊查询的范围,利用查询SQL语句中的LIKE关键字在数据库存储的隐私字段中进行字符匹配;
S402,将数据库中所有与查询关键字最终索引值匹配的房产明文隐私数据的最终索引值。
进一步的,所述步骤S2还包括房产明文隐私数据的共享密钥生成步骤:获取房产明文隐私数据,使用文本加密算法对其进行加密,生成共享密钥,并获得加密后的房产明文隐私数据,并将加密后的房产明文隐私数据与房产明文隐私数据的最终索引值建立映射关系。
本发明首先对明文隐私信息按照单个字符进行拆分,然后依次对单字符采用合适的的摘要算法计算摘要信息,然后保持循序按照单字符加分隔符方式组合成最终字符,存放在单独的字段中,模糊搜索时,采用相同的策略计算出明文关键字的摘要信息,然后利用标准数据库模糊查询语言进行模糊查询。这种方法能实现在不暴露隐私信息的情况下,利用数据库标准语言完成隐私信息查找,提升隐私数据安全性。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。
Claims (5)
1.一种房产隐私字段信息模糊搜索方法,其特征在于,包括以下步骤:
S1,确定隐私数据的字符范围,使用字符分割算法对明文隐私数据按照单个字符进行拆分;
S2,利用消息摘要算法对明文隐私数据按照单字符顺序进行消息摘要计算,使用特定分隔符拼接计算出的消息摘要值,获得房产明文隐私数据的最终索引值并存放在单独的隐私字段内,同时将隐私字段存储到数据库中;
S3,隐私字段信息模糊搜索,获取模糊搜索输入的隐私字段查询关键字,使用字符分割算法按照单个字符进行拆分并采用步骤S2中相同的消息摘要算法对查询关键字的单字符顺序进行摘要计算,使用特定的分隔符拼接摘要计算出的结果值,获得查询关键字的最终索引值;
S4,搜索结果匹配,根据查询关键字的最终索引值到数据库中进行模糊查询匹配,获得与查询关键字最终索引值匹配的房产明文隐私数据的最终索引值;
S5,分配共享密钥,将匹配的房产明文隐私数据的最终索引值按照查询结果中查询关键字出现的词频从高到低排序,获取词频最高的房产明文隐私数据的最终索引值对应的加密房产明文隐私数据,使用共享密钥对加密房产明文隐私数据进行解密,获得最终房产明文隐私数据。
2.根据权利要求1所述的一种房产隐私字段信息模糊搜索方法,其特征在于,所述步骤S1中明文隐私数据按照单个字符进行拆分过程具体包括;
S101,获取明文隐私数据和预设分隔符,并将明文隐私数据转换为字符串的形式;
S102,调用字符串分割函数,按照隐私数据的字符范围,将明文隐私字符串以预设分隔符进行单个字符分割,获得单个字符的明文隐私数据。
3.根据权利要求1所述的一种房产隐私字段信息模糊搜索方法,其特征在于,所述步骤S2中对明文隐私数据按照单字符顺序进行消息摘要计算过程具体包括:
S201,获取明文隐私数据的单个字符,利用消息摘要算法按照单字符顺序对每个单字符的内容进行计算,获得单个字符的消息摘要;
S202,对明文隐私数据中每个字符串的消息摘要进行散列运算,生成加密后的消息摘要值;
S203,使用特定分隔符拼接加密后的消息摘要值,生成明文隐私数据的最终索引值并存放在数据库的单独隐私字段中。
4.根据权利要求1所述的一种房产隐私字段信息模糊搜索方法,其特征在于,所述步骤S4中搜索结果匹配过程具体包括以下步骤:
S401,将查询关键字的最终索引值设定为模糊查询的范围,利用查询SQL语句中的LIKE关键字在数据库存储的隐私字段中进行字符匹配;
S402,将数据库中所有与查询关键字最终索引值匹配的房产明文隐私数据的最终索引值。
5.根据权利要求1所述的一种房产隐私字段信息模糊搜索方法,其特征在于,所述步骤S2还包括房产明文隐私数据的共享密钥生成步骤:获取房产明文隐私数据,使用文本加密算法对其进行加密,生成共享密钥,并获得加密后的房产明文隐私数据,并将加密后的房产明文隐私数据与房产明文隐私数据的最终索引值建立映射关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011109715.2A CN112199420A (zh) | 2020-10-16 | 2020-10-16 | 一种房产隐私字段信息模糊搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011109715.2A CN112199420A (zh) | 2020-10-16 | 2020-10-16 | 一种房产隐私字段信息模糊搜索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112199420A true CN112199420A (zh) | 2021-01-08 |
Family
ID=74010451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011109715.2A Pending CN112199420A (zh) | 2020-10-16 | 2020-10-16 | 一种房产隐私字段信息模糊搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112199420A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113076562A (zh) * | 2021-05-08 | 2021-07-06 | 北京炼石网络技术有限公司 | 基于gcm加密模式的数据库加密字段模糊检索方法 |
CN113179161A (zh) * | 2021-04-22 | 2021-07-27 | 平安消费金融有限公司 | 一种秘钥更换的方法、装置、计算机设备及存储介质 |
CN115691732A (zh) * | 2022-09-22 | 2023-02-03 | 海南星捷安科技集团股份有限公司 | 一种用于互联网医院的病例管理系统 |
WO2023093607A1 (zh) * | 2021-11-23 | 2023-06-01 | 天翼数字生活科技有限公司 | 一种离线数据模糊搜索方法、装置、设备和介质 |
CN116756760A (zh) * | 2023-08-21 | 2023-09-15 | 合肥安永信息科技有限公司 | 一种可搜索的数据库加密系统及其方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101436208A (zh) * | 2008-12-09 | 2009-05-20 | 北京交通大学 | 一种密文数据库隐私保护查询方法 |
CN105637520A (zh) * | 2013-10-14 | 2016-06-01 | 飞索科技有限公司 | 数据库中为加密字段生成索引的方法和装置 |
CN106874401A (zh) * | 2016-12-30 | 2017-06-20 | 中安威士(北京)科技有限公司 | 一种面向数据库加密字段模糊检索的密文索引方法 |
CN108388807A (zh) * | 2018-02-28 | 2018-08-10 | 华南理工大学 | 一种支持偏好搜索和逻辑搜索的高效可验证的多关键字排序可搜索加密方法 |
US20200097452A1 (en) * | 2018-09-20 | 2020-03-26 | Hitachi, Ltd. | Data deduplication device, data deduplication method, and data deduplication program |
CN111475543A (zh) * | 2020-03-27 | 2020-07-31 | 深圳壹账通智能科技有限公司 | 一种模糊搜索方法、装置、计算机设备及存储介质 |
-
2020
- 2020-10-16 CN CN202011109715.2A patent/CN112199420A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101436208A (zh) * | 2008-12-09 | 2009-05-20 | 北京交通大学 | 一种密文数据库隐私保护查询方法 |
CN105637520A (zh) * | 2013-10-14 | 2016-06-01 | 飞索科技有限公司 | 数据库中为加密字段生成索引的方法和装置 |
CN106874401A (zh) * | 2016-12-30 | 2017-06-20 | 中安威士(北京)科技有限公司 | 一种面向数据库加密字段模糊检索的密文索引方法 |
CN108388807A (zh) * | 2018-02-28 | 2018-08-10 | 华南理工大学 | 一种支持偏好搜索和逻辑搜索的高效可验证的多关键字排序可搜索加密方法 |
US20200097452A1 (en) * | 2018-09-20 | 2020-03-26 | Hitachi, Ltd. | Data deduplication device, data deduplication method, and data deduplication program |
CN111475543A (zh) * | 2020-03-27 | 2020-07-31 | 深圳壹账通智能科技有限公司 | 一种模糊搜索方法、装置、计算机设备及存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113179161A (zh) * | 2021-04-22 | 2021-07-27 | 平安消费金融有限公司 | 一种秘钥更换的方法、装置、计算机设备及存储介质 |
CN113076562A (zh) * | 2021-05-08 | 2021-07-06 | 北京炼石网络技术有限公司 | 基于gcm加密模式的数据库加密字段模糊检索方法 |
WO2023093607A1 (zh) * | 2021-11-23 | 2023-06-01 | 天翼数字生活科技有限公司 | 一种离线数据模糊搜索方法、装置、设备和介质 |
CN115691732A (zh) * | 2022-09-22 | 2023-02-03 | 海南星捷安科技集团股份有限公司 | 一种用于互联网医院的病例管理系统 |
CN115691732B (zh) * | 2022-09-22 | 2024-03-26 | 海南星捷安科技集团股份有限公司 | 一种用于互联网医院的病例管理系统 |
CN116756760A (zh) * | 2023-08-21 | 2023-09-15 | 合肥安永信息科技有限公司 | 一种可搜索的数据库加密系统及其方法 |
CN116756760B (zh) * | 2023-08-21 | 2023-12-12 | 合肥安永信息科技有限公司 | 一种可搜索的数据库加密系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112199420A (zh) | 一种房产隐私字段信息模糊搜索方法 | |
Wang et al. | Searchable encryption over feature-rich data | |
Liu et al. | Verifiable Diversity Ranking Search Over Encrypted Outsourced Data. | |
Chen et al. | An efficient privacy-preserving ranked keyword search method | |
WO2020057022A1 (zh) | 关联推荐方法、装置、计算机设备和存储介质 | |
EP3168771B1 (en) | Poly-logarythmic range queries on encrypted data | |
US9197613B2 (en) | Document processing method and system | |
US8819408B2 (en) | Document processing method and system | |
CN112800088A (zh) | 基于双向安全索引的数据库密文检索系统及方法 | |
US20140281589A1 (en) | Secure database searching | |
CN115080537B (zh) | 多租户的数据分库方法、装置、存储介质、芯片装置及电子设备 | |
Peng et al. | LS-RQ: A lightweight and forward-secure range query on geographically encrypted data | |
Li et al. | Multi-keyword fuzzy search over encrypted cloud storage data | |
Mittal et al. | Privacy preserving synonym based fuzzy multi-keyword ranked search over encrypted cloud data | |
CN110674383B (zh) | 舆情查询方法、装置及设备 | |
CN113076562A (zh) | 基于gcm加密模式的数据库加密字段模糊检索方法 | |
US11977657B1 (en) | Method and system for confidential repository searching and retrieval | |
CN116821056A (zh) | 一种基于可信第三方的隐匿查询方法、系统、装置及存储介质 | |
US20240056427A1 (en) | Private search service | |
US11106740B2 (en) | Search device, search system, search method, and computer readable medium | |
CN114661793A (zh) | 模糊查询方法、装置、电子设备及存储介质 | |
WO2013046413A1 (ja) | 検索方法及び情報管理装置 | |
CN112148739A (zh) | 独立于加密数据库的密文索引方法及系统 | |
CN117278271B (zh) | 一种属性基加密的数据传输方法及系统 | |
CN114547647B (zh) | 一种基于差分隐私的模式保护动态可搜索加密方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210108 |
|
RJ01 | Rejection of invention patent application after publication |