JP6557338B2 - 類似性秘匿検索システム、類似性秘匿検索方法 - Google Patents
類似性秘匿検索システム、類似性秘匿検索方法 Download PDFInfo
- Publication number
- JP6557338B2 JP6557338B2 JP2017524187A JP2017524187A JP6557338B2 JP 6557338 B2 JP6557338 B2 JP 6557338B2 JP 2017524187 A JP2017524187 A JP 2017524187A JP 2017524187 A JP2017524187 A JP 2017524187A JP 6557338 B2 JP6557338 B2 JP 6557338B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- search
- similarity
- target data
- search target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09C—CIPHERING OR DECIPHERING APPARATUS FOR CRYPTOGRAPHIC OR OTHER PURPOSES INVOLVING THE NEED FOR SECRECY
- G09C1/00—Apparatus or methods whereby a given sequence of signs, e.g. an intelligible text, is transformed into an unintelligible sequence of signs by transposing the signs or groups of signs or by replacing them by others according to a predetermined system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
Description
図1は、本発明にかかる類似性秘匿検索システム、および類似性秘匿検索方法を適用した類似性秘匿検索システム1000の構成例を示す図である。図1に示すように、類似性秘匿検索システム1000は、複数のユーザ端末300〜500と、類似検索サーバ200とがネットワーク100を介して互いに接続された構成となっている。例えば、あるサービス提供形態では、類似検索サーバ200はクラウド事業者に設置され、一般的なコンピュータであるサーバ装置から構成される。また、クラウド事業者のサービスを利用するユーザが操作するユーザ端末300は、PCや携帯電話、スマートフォン等の一般的なコンピュータである情報処理装置から構成される。なお、図1では、本システムがユーザ端末300〜500の3台を含む構成として記載されているが、その台数は任意である。
次に、図2〜図8を参照して、類似性秘匿検索システム1000の第一実施形態を説明する。
図2は、第一実施形態に係る類似検索サーバ200の構成例を示す図である。図示するように、類似検索サーバ200は、データを処理する制御部210と、データを記憶する記憶部220と、情報の入力を受け付ける入力部201と、情報を出力する出力部202と、外部装置とのデータの送受信を行う通信部203とを備える。制御部210は、例えば、CPU(Central Processing Unit)等の演算装置から構成され、入力部210は、キーボード等の入力装置から構成され、出力部202は、LCD(Liquid Crystal Display)等の表示装置から構成され、通信部203は、NIC(Network Interface Controller)等の通信装置から構成される。 制御部210は、全体処理部211と、類似性判定計算処理部212と、を備える。
図3は、第一実施形態に係るユーザ端末300の構成例を示す図である。なお、各ユーザ端末の構成は同様の構成であるため、以下では、ユーザ端末300の構成例について示している。また、これらのユーザ端末は、暗号化を行わない場合には、暗号化処理部312と、復号化処理部313と、暗復号化鍵記憶部340、類似性判定処理部314、暗復号化鍵記憶部340等、暗復号化に必要な各部を備えなくてもよい。
図4は、ユーザ端末300が被検索対象データの中から検索する検索対象データを分類した表である。本システムで取り扱う検索対象データには、質的データを示す項目と量的データを示す項目とが含まれるため、以下、両者の分類について説明する。質的データとは、例えば、性別、住所、職種等、分類や種類を区別するためだけのデータであって、数値で演算できないデータである。また、量的データとは、例えば、病院での検査結果の数値データ、枚数、金額等、数値の大小に意味があり、数値で演算可能なデータである。
図5は、ユーザ端末300が、検索対象データにより、あらかじめ記憶されている被検索対象データの中から類似するデータを検索し、類似検索サーバ200が絞込みを行う処理の処理手順を示すフローチャートである。以下では、検索対象データを用いて被検索対象データの中から類似するデータを絞り込んで検索する例として、ある患者の検査データを検索対象データとし、その患者に類似する患者の検査データを被検索対象データとしている。また、検査対象データおよび被検索対象データは、1または複数の質的データを示す項目(例えば、患者の氏名、住所、性別、病名等)と、1または複数の量的データを示す項目(例えば、患者の年齢、検査値等)とを含んでいる。
図6は、図5に示したS503における線形分解処理の処理手順を示すフローチャートである。ユーザ端末300では、秘匿したい量的データ(S404)としてベクトルXを有している。ユーザ端末300の類似性判定処理部314は、まず、自然数mとtとを決定し(S601)、ベクトルXを構成する、m個の基底ベクトルによるt種類の線形分解をランダムに生成する(S602)。ここでいくつかのスカラーaijは0でもよい。
第一実施形態によれば、類似性判定するデータに含まれる質的データと、類似性判定されるデータに含まれる質的データとを暗号化したまま類似性判定し、所定の閾値以上のデータを抽出し、さらに、抽出されたデータに含まれる量的データと、類似性判定するデータに含まれる量的データとの内積値が所定の閾値以上のデータを絞り込み、その結果をクライアントに返す。したがって、ユーザ(複数でも可)が平文のままあるいは暗号化したデータを類似検索サーバに預託し、あるユーザ(ユーザ端末300)が自身の持つデータのうち一部を開示、残りを秘匿したまま効率的に類似検索することができる。すなわち、クラウドなど第三者に預託されている大量データに対し、ユーザ自身の持つデータを秘匿しつつ、効率的に類似のデータを検索することが可能になる。
次に、図7と図8を参照して、類似性秘匿検索システム1000の第二実施形態を説明する。
第二実施形態によれば、ユーザは量的データのうち秘匿したい部分についても事前の暗号化預託と、秘匿化したままでの絞込み手順を実施することで、絞込みを実施可能で、効率的な類似検索が可能となる。
200:類似検索サーバ
201:入力部
202:出力部
203:通信部
210:制御部
211:全体処理部
212:類似性判定計算処理部
220:記憶部
230:データ記憶部
231:データ
240:一時情報記憶部
300、400、500:ユーザ端末
301:入力部
302:出力部
303:通信部
310:制御部
311:全体処理部
312:暗号化処理部
313:復号化処理部
314:類似性判定処理部
320:記憶部
330:データ記憶部
340:暗復号化鍵記憶部
341:暗号化鍵
342:復号化鍵
350:一時情報記憶部。
Claims (8)
- 検索要求にしたがって秘匿化されている検索対象データに類似する被検索対象データを検索する類似性秘匿検索システムであって、
ユーザ端末は、
質的データまたは量的データを含む前記検索対象データの入力を受け付ける入力部と、
前記検索対象データに含まれる前記質的データを、一致不一致の判定が可能な暗号化方式で暗号化する暗号化処理部と、
前記検索対象データに含まれる前記量的データと前記被検索対象データに含まれる前記量的データとに基づいて、両者が一定以上の類似性を有するための条件を算出する類似性判定処理部と、
暗号化された前記質的データと前記条件とを、前記被検索対象データを検索するための類似検索サーバに送信する通信部と、を備え、
前記類似検索サーバは、
前記ユーザ端末から前記質的データと前記条件とを受信し、または前記検索対象データに類似すると判定された前記被検索対象データを前記ユーザ端末に送信するサーバ通信部と、
前記ユーザ端末から受信した質的データと、あらかじめ記憶部に記憶された前記被検索対象データに含まれる質的データとに基づいて両者が類似しているか否かを判定し、両者が類似していると判定した場合、類似していると判定した前記被検索対象データの中から前記条件を満たす量的データを含む被検索対象データを前記検索対象データに類似するデータとして出力する類似性判定計算処理部と、
を備えることを特徴とする類似性秘匿検索システム。 - 請求項1に記載の類似性秘匿検索システムであって、
前記ユーザ端末の前記類似性判定処理部は、前記量的データをベクトルとみなして当該ベクトルを構成する1または複数の基底ベクトルとスカラー値との組を生成し、生成した前記基底ベクトルと、前記検索対象データと前記被検索対象データとが類似していると判定するために前記基底ベクトルが満たすべき内積値を前記条件として算出し、
前記類似検索サーバの前記類似性判定計算処理部は、質的データに基づいて類似していると判定した前記被検索対象データのうち前記内積値を満たす前記量的データを含む被検索対象データを前記データとして出力する、
ことを特徴とする類似性秘匿検索システム。 - 請求項2に記載の類似性秘匿検索システムであって、
前記ユーザ端末の前記類似性判定処理部は、前記検索対象データに含まれる前記量的データをベクトルとみなして当該ベクトルに対して直交変換およびアフィン変換し、前記各変換後のベクトルと、前記検索対象データと前記被検索対象データとが類似していると判定するために前記変換後のベクトルが満たすべき内積値を前記条件として算出し、
前記類似検索サーバの前記類似性判定計算処理部は、質的データに基づいて類似していると判定した前記被検索対象データのうち前記内積値を満たす前記量的データを含む被検索対象データを前記データとして出力する、
ことを特徴とする類似性秘匿検索システム。 - 請求項1に記載の類似性秘匿検索システムであって、
前記入力部は、秘匿化されていない平文を含む前記質的データまたは前記量的データの入力を受け付け、
前記暗号化処理部は、前記質的データが前記平文である場合には処理を実行せず、
前記類似性判定処理部は、前記検索対象データに含まれる前記平文の前記量的データと前記被検索対象データに含まれる前記量的データとに基づいて、両者が一定以上の類似性を有するための条件を算出する、
ことを特徴とする類似性秘匿検索システム。 - 検索要求にしたがって秘匿化されている検索対象データに類似する被検索対象データを検索する類似性秘匿検索方法であって、
ユーザ端末の入力部が、質的データまたは量的データを含む前記検索対象データの入力を受け付ける入力ステップと、
前記ユーザ端末の暗号化処理部が、前記検索対象データに含まれる前記質的データを、一致不一致の判定が可能な暗号化方式で暗号化する暗号化処理ステップと、
前記ユーザ端末の類似性判定処理部が、前記検索対象データに含まれる前記量的データと前記被検索対象データに含まれる前記量的データとに基づいて、両者が一定以上の類似性を有するための条件を算出する類似性判定処理ステップと、
前記ユーザ端末の通信部が、暗号化された前記質的データと前記条件とを、前記被検索対象データを検索するための類似検索サーバに送信する送信ステップと、
前記類似検索サーバのサーバ通信部が、前記ユーザ端末から前記質的データと前記条件とを受信する受信ステップと、
前記類似検索サーバの類似性判定計算処理部が、前記ユーザ端末から受信した質的データと、あらかじめ記憶部に記憶された前記被検索対象データに含まれる質的データとに基づいて両者が類似しているか否かを判定する判定ステップと、
前記類似検索サーバの類似性判定計算処理部が、両者が類似していると判定した場合、類似していると判定した前記被検索対象データの中から前記条件を満たす量的データを含む被検索対象データを前記検索対象データに類似するデータとして出力する類似性判定計算処理ステップと、
前記類似検索サーバのサーバ通信部が、前記検索対象データに類似すると判定された前記被検索対象データを前記ユーザ端末に送信するサーバ送信ステップと、
を含むことを特徴とする類似性秘匿検索方法。 - 請求項5に記載の類似性秘匿検索方法であって、
前記類似性判定処理ステップでは、前記ユーザ端末の類似性判定処理部が、前記量的データをベクトルとみなして当該ベクトルを構成する1または複数の基底ベクトルとスカラー値との組を生成し、生成した前記基底ベクトルと、前記検索対象データと前記被検索対象データとが類似していると判定するために前記基底ベクトルが満たすべき内積値を前記条件として算出し、
前記類似性判定計算処理ステップでは、前記類似検索サーバの類似性判定計算処理部が、質的データに基づいて類似していると判定した前記被検索対象データのうち前記内積値を満たす前記量的データを含む被検索対象データを前記データとして出力する、
ことを特徴とする類似性秘匿検索方法。 - 請求項6に記載の類似性秘匿検索方法であって、
前記類似性判定処理ステップでは、前記ユーザ端末の類似性判定処理部が、前記検索対象データに含まれる前記量的データをベクトルとみなして当該ベクトルに対して直交変換およびアフィン変換し、前記各変換後のベクトルと、前記検索対象データと前記被検索対象データとが類似していると判定するために前記変換後のベクトルが満たすべき内積値を前記条件として算出し、
前記類似性判定計算処理ステップでは、前記類似検索サーバの類似性判定計算処理部が、質的データに基づいて類似していると判定した前記被検索対象データのうち前記内積値を満たす前記量的データを含む被検索対象データを前記データとして出力する、
ことを特徴とする類似性秘匿検索方法。 - 請求項5に記載の類似性秘匿検索方法であって、
前記入力ステップでは、前記ユーザ端末の入力部が、秘匿化されていない平文を含む前記質的データまたは前記量的データの入力を受け付け、
前記暗号化処理ステップでは、前記ユーザ端末の暗号化処理部が、前記質的データが前記平文である場合には処理を実行せず、
前記類似性判定処理ステップでは、前記ユーザ端末の類似性判定処理部が、前記検索対象データに含まれる前記平文の前記量的データと前記被検索対象データに含まれる前記量的データとに基づいて、両者が一定以上の類似性を有するための条件を算出する、
ことを特徴とする類似性秘匿検索方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/067362 WO2016203555A1 (ja) | 2015-06-16 | 2015-06-16 | 類似性秘匿検索システム、類似性秘匿検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016203555A1 JPWO2016203555A1 (ja) | 2018-02-15 |
JP6557338B2 true JP6557338B2 (ja) | 2019-08-07 |
Family
ID=57545649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017524187A Active JP6557338B2 (ja) | 2015-06-16 | 2015-06-16 | 類似性秘匿検索システム、類似性秘匿検索方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6557338B2 (ja) |
WO (1) | WO2016203555A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232367B (zh) * | 2020-09-10 | 2022-06-21 | 山东师范大学 | 一种网络行为相似性判断方法及系统 |
JPWO2022201235A1 (ja) * | 2021-03-22 | 2022-09-29 | ||
AU2021436355A1 (en) * | 2021-03-22 | 2023-09-28 | Nippon Telegraph And Telephone Corporation | Secure search method, system thereof, apparatus thereof, encryption apparatus, searcher terminal, and program |
JP2023019432A (ja) * | 2021-07-29 | 2023-02-09 | 株式会社日立製作所 | 情報処理システム及び情報処理方法 |
CN114638002B (zh) * | 2022-03-21 | 2023-04-28 | 华南理工大学 | 支持相似性检索的压缩图像加密方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7552327B2 (en) * | 2003-11-13 | 2009-06-23 | International Business Machines Corporation | Method and apparatus for conducting a confidential search |
JP2009271584A (ja) * | 2008-04-30 | 2009-11-19 | Tokyo Metropolitan Univ | 類似情報検索システムおよび類似情報検索プログラム |
WO2011086687A1 (ja) * | 2010-01-15 | 2011-07-21 | 三菱電機株式会社 | 秘匿検索システム及び暗号処理システム |
WO2013005505A1 (ja) * | 2011-07-05 | 2013-01-10 | 日本電気株式会社 | 暗号化装置、暗号文比較システム、暗号文比較方法、および暗号文比較プログラム |
WO2013038698A1 (ja) * | 2011-09-14 | 2013-03-21 | 独立行政法人産業技術総合研究所 | 検索システム、検索方法、およびプログラム |
JP5720536B2 (ja) * | 2011-11-10 | 2015-05-20 | 富士通株式会社 | 秘匿化データの検索のための情報処理方法及び装置 |
JP5948060B2 (ja) * | 2012-01-13 | 2016-07-06 | 株式会社日立製作所 | 暗号化データの高速な類似検索処理システム |
WO2013190810A1 (ja) * | 2012-06-18 | 2013-12-27 | 日本電気株式会社 | 情報処理装置、及び、情報匿名化方法 |
-
2015
- 2015-06-16 WO PCT/JP2015/067362 patent/WO2016203555A1/ja active Application Filing
- 2015-06-16 JP JP2017524187A patent/JP6557338B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2016203555A1 (ja) | 2016-12-22 |
JPWO2016203555A1 (ja) | 2018-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10489604B2 (en) | Searchable encryption processing system and searchable encryption processing method | |
JP6557338B2 (ja) | 類似性秘匿検索システム、類似性秘匿検索方法 | |
JP6180177B2 (ja) | プライバシーを保護することができる暗号化データの問い合わせ方法及びシステム | |
JP5412414B2 (ja) | 検索可能暗号処理システム | |
US9021259B2 (en) | Encrypted database system, client terminal, encrypted database server, natural joining method, and program | |
KR100903599B1 (ko) | 내적을 이용한 암호화된 데이터 검색 방법 및 이를 위한단말 장치와 서버 | |
CN110326253A (zh) | 用于对加密数据进行模糊关键字搜索的方法和系统 | |
EP2624498B1 (en) | Encrypted database system, client terminal, encrypted database server, natural joining method, and program | |
US20170039487A1 (en) | Support vector machine learning system and support vector machine learning method | |
US10095719B2 (en) | Method and system to perform secure Boolean search over encrypted documents | |
Buyrukbilen et al. | Secure similar document detection with simhash | |
US11764940B2 (en) | Secure search of secret data in a semi-trusted environment using homomorphic encryption | |
EP3511845B1 (en) | Encrypted message search method, message transmission/reception system, server, terminal and programme | |
Rane et al. | Multi-user multi-keyword privacy preserving ranked based search over encrypted cloud data | |
JP2022151535A (ja) | データ共有システム、データ共有方法、およびデータ共有プログラム | |
US10594473B2 (en) | Terminal device, database server, and calculation system | |
Taric et al. | A survey on privacy preserving data mining techniques | |
JP2020086116A (ja) | 情報処理装置および情報処理方法 | |
CN109255248A (zh) | 一种基于加解密算法的全文检索方法 | |
Sheng et al. | Privacy preserving inner product of vectors in cloud computing | |
CN113779597B (zh) | 加密文档的存储和相似检索方法、装置、设备及介质 | |
US20220309178A1 (en) | Private searchable database | |
Guo et al. | A privacy preserving Markov model for sequence classification | |
Jin et al. | Privacy-preserving mining of association rules for horizontally distributed databases based on FP-tree | |
EP3264289B1 (en) | System and method for searching over encrypted data using a boolean search query |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181204 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190711 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6557338 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |