JP2016148693A - 秘匿パターンマッチング装置、端末装置、それらの方法、およびプログラム - Google Patents

秘匿パターンマッチング装置、端末装置、それらの方法、およびプログラム Download PDF

Info

Publication number
JP2016148693A
JP2016148693A JP2015023887A JP2015023887A JP2016148693A JP 2016148693 A JP2016148693 A JP 2016148693A JP 2015023887 A JP2015023887 A JP 2015023887A JP 2015023887 A JP2015023887 A JP 2015023887A JP 2016148693 A JP2016148693 A JP 2016148693A
Authority
JP
Japan
Prior art keywords
pattern
character
determination result
condition
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015023887A
Other languages
English (en)
Other versions
JP6274669B2 (ja
Inventor
直人 桐淵
Naoto Kiribuchi
直人 桐淵
浩気 濱田
Hiroki Hamada
浩気 濱田
大 五十嵐
Masaru Igarashi
大 五十嵐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015023887A priority Critical patent/JP6274669B2/ja
Publication of JP2016148693A publication Critical patent/JP2016148693A/ja
Application granted granted Critical
Publication of JP6274669B2 publication Critical patent/JP6274669B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】文字集合の特定の真部分集合を指定して行うパターンマッチングを秘密計算で行う。
【解決手段】対象文字集合情報が、対象文字が文字集合の特定の真部分集合に対応することを表し、かつ、パターン文字集合情報が、パターン文字が前記真部分集合に対応することを表す、という第1条件を満たすか否かを表す第1判定結果、および、前記対象文字に対応する対象符号と前記パターン文字に対応するパターン符号とが一致するという第2条件を満たすか否かを表す第2判定結果、が秘匿化された秘匿化判定結果を得、(1)前記第1条件を満たし、かつ、特殊符号と前記パターン符号とが一致するか、または、(2)前記第2条件を満たし、かつ、前記特殊符号と前記パターン符号とが異なる、という第3条件を満たすか否かを表す第3判定結果に応じた秘匿化情報を得る。
【選択図】図2

Description

本発明は、暗号応用技術に関し、特に入力データを明かすことなくデータ処理を行う秘密計算技術に関する。
秘匿された文字列に対するパターンマッチング技術として非特許文献1に記載された手法がある。この手法では、パターンマッチングの対象文字列とパターンの両方を秘匿した状態でパターンマッチングを行い、秘匿化されたパターンマッチングの結果を得る。この手法では任意の文字に対応したワイルドカードを使うこともできる。
濱田浩気,桐淵直人,五十嵐大,"ラウンド効率のよい秘密計算パターンマッチング",Computer Security Symposium 2014.
しかしながら、従来手法は、文字集合の特定の真部分集合を指定して行うパターンマッチングに適応していない。
本発明の課題は、文字集合の特定の真部分集合を指定して行うパターンマッチングを秘密計算で行うことである。
対象文字集合情報が、対象文字が文字集合の特定の真部分集合に対応することを表し、かつ、パターン文字集合情報が、パターン文字が前記真部分集合に対応することを表す、という第1条件を満たすか否かを表す第1判定結果、および、前記対象文字に対応する対象符号と前記パターン文字に対応するパターン符号とが一致するという第2条件を満たすか否かを表す第2判定結果、が秘匿化された秘匿化判定結果を得、(1)前記第1条件を満たし、かつ、特殊符号と前記パターン符号とが一致するか、または、(2)前記第2条件を満たし、かつ、前記特殊符号と前記パターン符号とが異なる、という第3条件を満たすか否かを表す第3判定結果に応じた秘匿化情報を得る。
これにより、文字集合の特定の真部分集合を指定して行うパターンマッチングを秘密計算で実現できる。
図1は実施形態の秘匿パターンマッチングシステムの構成を例示したブロック図である。 図2は実施形態の秘匿パターンマッチング装置の機能構成を例示したブロック図である。 図3Aは実施形態の端末装置の機能構成を例示したブロック図であり、図3Bは実施形態のデータベース装置の機能構成を例示したブロック図である。 図4Aは実施形態の端末装置の処理を例示するためのフロー図であり、図4Bは実施形態の秘匿パターンマッチング装置の処理を例示するためのフロー図である。 図5は、対象文字またはパターン文字と、対象文字種別情報またはパターン文字種別情報の例(大文字フラグおよび小文字フラグ)と、対象文字集合情報またはパターン文字種別情報の例(数字フラグ)と、対象符号およびパターン符号の例(符号点)との関係を例示するための図である。 図6Aは、第1判定結果の例(判定結果X)を例示した図である。図6Bは、第2判定結果の例(一致判定結果Y)を例示した図である。 図7Aは、第1判定結果の例(判定結果X)を例示した図である。図7Bは、第2判定結果の例(一致判定結果Y)を例示した図である。 図8Aは、第1判定結果の例(判定結果X)を例示した図である。図8Bは、第2判定結果の例(一致判定結果Y)を例示した図である。第2判定結果の例(一致判定結果Y)を例示した図である。 図9Aは、第1判定結果の例(判定結果X)を例示した図である。図9Bは、第2判定結果の例(一致判定結果Y)を例示した図である。第2判定結果の例(一致判定結果Y)を例示した図である。 図10Aは、第1判定結果の例(判定結果X)を例示した図である。図10Bは、第2判定結果の例(一致判定結果Y)を例示した図である。 図11Aおよび図11Bは、各文字の結果に基づくパターンマッチング結果を例示した図である。 図12Aは、第2実施形態の秘匿一致判定部の機能構成を例示したブロック図である。図12Bは、第2実施形態の秘匿一致判定部の処理を例示するためのフロー図である。 図13Aは、対象符号およびパターン符号の例(変換後の符号点)を示した図である。図13Bは、対象文字またはパターン文字と、対象文字種別情報またはパターン文字種別情報の例(大文字フラグおよび小文字フラグ)と、対象文字集合情報またはパターン文字種別情報の例(数字フラグ)と、対象符号およびパターン符号の例(変換後の符号点)との関係を例示するための図である。 図14Aおよび図14Bは、対象文字種別情報とパターン文字種別情報とが一致し、かつ、対象符号とパターン符号とが一致する、という条件を満たすか否かを表す結果II(x)を示した図である。図14Cおよび図14Dは、対象符号とパターン符号とが一致するという条件を満たすか否かを表す結果III(y)を示した図である。 図15Aおよび図15Bは、対象文字種別情報とパターン文字種別情報とが一致し、かつ、対象符号とパターン符号とが一致する、という条件を満たすか否かを表す結果II(x)を示した図である。図15Cおよび図15Dは、対象符号とパターン符号とが一致するという条件を満たすか否かを表す結果III(y)を示した図である。
以下、図面を参照して本発明の実施形態を説明する。
[用語]
各実施形態で使用する用語を定義する。
「文字」とは、可視的表現を持ち、符号化表現が可能な記号を意味する。「文字」は、言語を伝達し記録するために線や点を使って形作られた記号(非図形文字)であってもよいし、それに準ずる記号(図形文字)であってもよい。「文字」の例は、文字コード規格で定められた符号化文字である。
「パターンマッチング」とは、「対象文字列(対象情報)」が「パターン文字列(パターン情報)」の条件を満たすかを判定する演算を意味する。「対象文字列」および「パターン文字列」は、ともに1個または2個以上の文字を含む。「対象文字列」に含まれる各文字を「対象文字」と呼び、「パターン文字列」に含まれる各文字を「パターン文字」と呼ぶ。「対象文字」はテキストデータ(文書データ、数値データなど)に含まれた「通常の文字」であるが、「パターン文字」は「通常の文字」または「特殊文字」である。「特殊文字」とは、「文字集合の特定の真部分集合」に属するか否かのパターンマッチングを行うことを表すために特別に割り当てられた文字である。
「文字集合」とは、定義された文字の集合を意味する。「文字集合」の例は、特定の文字コード規格で定められた全ての符号化文字を要素とする集合である。「文字集合の特定の真部分集合」は、特定の文字クラス(単数または複数の文字クラス)の文字を要素とする集合であってもよいし、特定の文字コードの範囲(例えば、半角文字の範囲、または全角文字の範囲など)の文字を要素とする集合であってもよいし、その他の特定の範囲の文字を要素とする集合であってもよい。「文字クラス」とは文字の分類を意味し、その例は、数字、アルファベット、ギリシャ文字、漢字、図形文字等である。「対象文字集合情報」とは、対象文字が文字集合の特定の真部分集合に対応するか否か表す情報(フラグ)を意味する。対象文字が特定の真部分集合に対応する場合、その「対象文字集合情報」の値は真(T)(有効)であり、対象文字が特定の真部分集合に対応しない場合、その「対象文字集合情報」の値は偽(F)(無効)である。「対象文字が特定の真部分集合に対応する」とは、例えば、「対象文字」が「特定の真部分集合」に属することであってもよいし、「対象文字」が「特定の真部分集合」を表すことであってもよい。例えば、「特定の真部分集合」が「数字」である場合、対象文字「5」の「対象文字集合情報」の値は真(T)(有効)であり、対象文字「A」の「対象文字集合情報」の値は偽(F)(無効)である。「パターン文字集合情報」とは、パターン文字が文字集合の特定の真部分集合に対応するか否か表す情報(フラグ)である。パターン文字が文字集合の特定の真部分集合に対応する場合、その「パターン文字集合情報」の値は真(T)(有効)であり、パターン文字が文字集合の特定の真部分集合に対応しない場合、その「パターン文字集合情報」の値は偽(F)(無効)である。「パターン文字が特定の真部分集合に対応する」とは、例えば、「パターン文字」が「特定の真部分集合」に属することであってもよいし、「対象文字」が「特定の真部分集合」を表すことであってもよい。例えば、「特定の真部分集合」が「数字」である場合、パターン文字「5」の「パターン文字集合情報」の値は真(T)(有効)である。また「数字」という範囲を表すパターン文字の「パターン文字集合情報」の値も真(T)(有効)であり、パターン文字「A」の「パターン文字集合情報」の値は偽(F)(無効)である。
「種別(クラス)」とは、文字の表記の種別を意味する。例えば、「種別」の例は大文字、小文字、半角、全角、特定のフォントなどである。「文字種別情報」とは、文字の表記が特定の種別に該当するか否かを表す情報(フラグ)を意味する。文字の表記が特定の種別に該当する場合、その「文字種別情報」の値は真(T)(有効)であり、文字の表記が特定の種別に該当しない場合、その「文字種別情報」の値は偽(F)(無効)である。例えば、文字「A」の場合、「大文字」という文字種別情報は真(T)(有効)であり、「小文字」という文字種別情報は偽(F)(無効)である。「対象文字」の「文字種別情報」を「対象文字種別情報」と呼び、「パターン文字」の「文字種別情報」を「パターン文字種別情報」と呼ぶ。
「対象符号」とは「対象文字」に対応する符号であり、「パターン符号」とは「パターン文字」に対応する符号である。「対象符号」は「対象文字」自体を表す。一方、「パターン符号」は「パターン文字」自体を表すか、「文字集合の特定の真部分集合」に属するか否かのパターンマッチングを行うことを表すために特別に割り当てられた「特殊符号」である。「特殊符号」は「特殊文字」に対応する。「特殊符号」は、「特定の真部分集合」を識別するもの(「特定の真部分集合」に対応する「特殊符号」、すなわち「特定の真部分集合」を表す符号)であってもよいし、「特定の真部分集合」を識別しないもの(「特定の真部分集合」を表さず、「特定の真部分集合」に属するか否かのパターンマッチングを行うことのみを表す符合)であってもよい。
「文字の内容」とは「文字」が表す概念を意味する。例えば、大文字の「A」と小文字の「a」とは同じ概念(アルファベットの最初の文字)を表し、「A」の内容と「a」の内容とは同一である。
[第1実施形態]
以下、第1実施形態を説明する。
<構造>
図1に例示するように、本形態の秘匿パターンマッチングシステム1は、端末装置12、秘匿パターンマッチング装置11−11、およびデータベース装置13−13を有する。ただし、Nは1以上の整数である。例えば、本システムで秘密分散方式や秘匿回路方式に基づく秘密計算を行う場合にはN≧2であり、準同型性暗号方式に基づく秘密計算を行う場合にはN=1である。
図2に例示するように、本形態の秘匿パターンマッチング装置11(ただし、n∈{1,・・・,N})は、入力部111、秘匿論理積演算部112−s(ただし、s∈{1,・・・,S}、Sは2以上の整数)、秘匿論理和演算部113、秘匿一致判定部114,115、秘匿論理演算部116、秘匿論理積演算部117、出力部118、および制御部119を有する。ここで、秘匿論理積演算部112−s、秘匿論理和演算部113、および秘匿一致判定部114,115は、第1演算部の例であり、秘匿論理演算部116は第2演算部の例である。説明の便宜上、各部を独立な部位として記述しているが、それらが独立の部位である必要はない。例えば、秘匿論理積演算部112−1,・・・,112−Sが同一の部位であってもよいし、秘匿一致判定部114,115が同一の部位であってもよい。
図3Aに例示するように、本形態の端末装置12は、入力部121,127、文字種別情報取得部122、文字集合情報取得部123(第1処理部)、符号点設定部124(第2処理部)、秘匿化部125(第3処理部)、出力部126、復元部128、および制御部129を有する。図3Bに例示するように、本形態のデータベース装置13(ただし、n∈{1,・・・,N})は、記憶部131、抽出部132、出力部133、入力部134、復元部135、および制御部136を有する。
各装置は、例えば、通信器やCPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)やRAM(random-access memory)・ROM(read-only memory)等のメモリ等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される。このコンピュータは1個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めROM等に記録されていてもよい。また、CPUのようにプログラムが読み込まれることで機能構成を実現する電子回路(circuitry)ではなく、プログラムを用いることなく処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。1個の装置を構成する電子回路が複数のCPUを含んでいてもよい。また、各装置はそれぞれの制御部119,129,136の制御に基づいて各処理を行う。
<事前処理>
事前処理では、テキストデータの暗号文Cのデータベースと、これらの各テキストデータに含まれた「対象文字列」に対応する「秘匿化データベース」がデータベース装置13(図3B)の記憶部131に格納される。「秘匿化データベース」は、単数または複数の秘匿化レコード[d]を含む。秘匿化レコード[d]は、対象文字列(対象情報)d=(d,・・・,d)(ただし、Mは正の整数)に含まれた各対象文字d(ただし、m∈{1,・・・,M})と、当該対象文字dの表記が特定の種別に該当するか否かを表す対象文字種別情報(フラグ)dfm,k∈{T,F}(ただし、k∈{1,・・・,K}、Kは1以上S未満の整数)と、対象文字dが文字集合の特定の真部分集合に対応するか否か(属するか否か)を表す対象文字集合情報(フラグ)dfm,i∈{T,F}(ただし、i∈{K+1,・・・,S})と、当該対象文字dに対応する対象符号dcと、が対応付けられたデータ構造の秘匿化情報である。対象文字種別情報dfm,kおよび対象文字集合情報dfm,iの構成に限定はない。例えばK=2、S=3とし、対象文字dが大文字であるか否かを表す対象文字種別情報を大文字フラグdfm,1∈{T,F}とし、小文字であるか否かを表す対象文字種別情報を小文字フラグdfm,2∈{T,F}とし、対象文字dが数字であるか否かを表す対象文字集合情報を数字フラグdfm,3∈{T,F}する。例えば、「A」の大文字フラグdfm,1は「T」、小文字フラグdfm,2は「F」、数字フラグdfm,3は「F」であり、「a」の大文字フラグdfm,1は「F」、小文字フラグdfm,2は「T」、数字フラグdfm,3は「F」であり、「B」の大文字フラグdfm,1は「T」、小文字フラグdfm,2を「F」、数字フラグdfm,3は「F」であり、「b」の大文字フラグdfm,1は「F」、小文字フラグdfm,2は「T」、数字フラグdfm,3は「F」であり、「5」大文字フラグdfm,1は「F」、小文字フラグdfm,2を「F」、数字フラグdfm,3は「T」である(図5)。対象符号dcの構成にも限定はない。対象符号dcが表記の種別の違いにかかわらず対象文字dの内容のみに対応するものであってもよいし、対象符号dcが対象文字dの内容および表記の種別の両方に対応するものであってもよい。対象符号dcの例はユニコード等の符号点である。例えば、「A」「a」「B」「b」「5」の対象符号dcは、それぞれ「U+0041」「U+0061」「U+0042」「U+0062」「U+0035」である(図5)。また、各対象文字種別情報dfm,k,対象文字集合情報dfm,i,対象符号dcについて秘密計算が可能なのであれば、対象文字種別情報dfm,k,対象文字集合情報dfm,i,対象符号dcが個々に独立して秘匿化されてもよいし、これらがまとめて秘匿化されていてもよいし、その他の単位でまとめて秘匿化されてもよい。秘匿化方式にも限定はなく、秘密計算による一致判定(等号判定)および論理演算(論理和、論理積、論理否定)が可能であれば、秘密分散方式(Shamir秘密分散方式等)、秘匿回路方式、準同型性暗号方式など、どのような方式が用いられてもよい。例えば、非特許文献1や参考文献1(Damgard, I., Fitzi, M., Kiltz, E., Nielsen, J. B., & Toft, T. (2006), “Unconditionally secure constant-rounds multi-party computation for equality, comparison, bits and exponentiation,” In Theory of Cryptography (pp. 285-304). Springer Berlin Heidelberg.)などに記載された方式を用いてもよい。
<パターンマッチング処理>
図4Aに例示するように、端末装置12(図3A)の入力部121に、パターン文字列(パターン情報)p=(p,・・・,p)が入力される。パターン文字列pはM個のパターン文字p,・・・,pを含む。パターン文字p(ただし、m∈{1,・・・,M})は、「通常の文字」であってもよいし、「特殊文字」であってもよい。例えば、パターン文字pは、「A」「a」「B」「b」「5」のような「通常の文字」であってもよいし、「[:digit:]」のような「文字集合の特定の真部分集合(この例では『数字』)」に対応する特殊文字であってもよい(図5)。パターン文字列pは、文字種別情報取得部122、文字集合情報取得部123、および符号点設定部124に送られる(ステップS121)。
文字種別情報取得部122は、パターン文字列pが含む各パターン文字p(ただし、m∈{1,・・・,M})の表記が特定の種別に該当するか否かを表すパターン文字種別情報(フラグ)pfm,k∈{T,F}(ただし、k∈{1,・・・,K})を得て出力する。パターン文字種別情報pfm,kは対象文字種別情報dfm,kと同じ基準(図5)に従って生成される。例えばK=2とし、パターン文字pが大文字であるか否かを表すパターン文字種別情報を大文字フラグpfm,1∈{T,F}とし、小文字であるか否かを表すパターン文字種別情報を小文字フラグpfm,2∈{T,F}とする(ステップS122)。
文字集合情報取得部123は、パターン文字列pが含む各パターン文字p(ただし、m∈{1,・・・,M})が文字集合の特定の真部分集合に対応するか否か表すパターン文字集合情報(フラグ)pfm,i∈{T,F}(ただし、i∈{K+1,・・・,S})を得て出力する。パターン文字pが「通常の文字」の場合、パターン文字集合情報pfm,iは対象文字集合情報dfm,iと同じ基準に従って生成される。例えばK=2、S=3とし、パターン文字pが数字であるか否かを表すパターン文字集合情報を数字フラグpfm,3∈{T,F}する。例えば、「A」の数字フラグpfm,3は「F」であり、「5」の数字フラグpfm,3は「T」である(図5)。一方、パターン文字pが「特殊文字」の場合、パターン文字pが「文字集合の特定の真部分集合」に対応するか否か表す情報(フラグ)をパターン文字集合情報pfm,iとする。例えば、パターン文字pが数字に対応するか否か表すパターン文字集合情報を数字フラグpfm,3∈{T,F}する。例えば、パターン文字「[:digit:]」の数字フラグpfm,3は「T」である(図5)(ステップS123)。
符号点設定部124は、パターン文字列pが含む各パターン文字p(ただし、m∈{1,・・・,M})に対応するパターン符号pcを得て出力する。パターン文字pが「通常の文字」の場合、パターン符号pcは対象符号dcと同じ基準に従って生成される。例えば、「A」「a」「B」「b」「5」のパターン符号pcは、それぞれ「U+0041」「U+0061」「U+0042」「U+0062」「U+0035」である(図5)。一方、パターン文字pが「特殊文字」の場合、「特殊符号」がパターン符号pcとして生成される。例えば、パターン文字「[:digit:]」に対しては特殊符号「P([:digit:])」が生成される(ステップS124)。
秘匿化部125は、前述の「秘匿化データベース」と同じ秘匿化方法を用い、各パターン文字p(ただし、m∈{1,・・・,M})のパターン文字種別情報pfm,1,・・・,pfm,K、パターン文字集合情報pfm,K+1,・・・,pfm,S、およびパターン符号pcに対応する、秘匿化情報を含む秘匿化クエリ[p]を得て出力する。各パターン文字種別情報pfm,k,パターン文字集合情報pfm,i,パターン符号pcについて秘密計算が可能なのであれば、パターン文字種別情報pfm,k,パターン文字集合情報pfm,i,パターン符号pcが個々に独立して秘匿化されてもよいし、これらがまとめて秘匿化されていてもよいし、その他の単位でまとめて秘匿化されてもよい(ステップS124)。
秘匿化クエリ[p]は出力部126に送られ、出力部126は秘匿化クエリ[p]を、秘匿パターンマッチング装置11(ただし、n∈{1,・・・,N})に送信する(ステップS126)。
図4Bに例示するように、秘匿化クエリ[p]は、秘匿パターンマッチング装置11(図2)の入力部111に入力される(ステップS110)。制御部119は、秘匿化レコードの送信要求を生成して出力部118から送信する。送信要求はデータベース装置13(図3B)の入力部134に入力され、抽出部132に送られる。抽出部132は、記憶部131から秘匿化データベースの何れかの秘匿化レコード[d]を抽出し、出力部133から送信する。秘匿化レコード[d]は、秘匿パターンマッチング装置11(図2)の入力部111に入力される(ステップS111)。
秘匿化クエリ[p]および秘匿化レコード[d]は、秘匿パターンマッチング装置11(図2)の秘匿論理積演算部112−s(ただし、s∈{1,・・・,S})、および秘匿一致判定部114,115に送られる。秘匿論理積演算部112−s(ただし、s∈{1,・・・,S})、秘匿論理和演算部113、秘匿一致判定部114,115、および秘匿論理演算部116は、m∈{1,・・・,M}について、以下のステップS112〜S116の処理を実行する。これらの処理は各mについて順番に実行されてもよいし、複数のmについて同時に実行されてもよい。
≪S112
秘匿論理積演算部112−s(ただし、s∈{1,・・・,S})は、秘密計算による論理積演算により、dfm,sとpfm,sとの論理積(dfm,s)AND(pfm,s)である判定結果rfm,s∈{T,F}の秘匿化情報[rfm,sを得て出力する。「AND」は論理積を表す。例えばT=1であり、かつ、F=0であり、このような秘密計算による論理積演算は、非特許文献1等に記載された方法によって実現できる(ステップS112)。
≪S113
秘匿論理和演算部113は、判定結果rfm,s(ただし、s∈{1,・・・,S})を入力とし、秘密計算による論理和演算により、rfm,1,・・・,rfm,Sの論理和(rfm,1)OR・・・OR(rfm,S)である判定結果X∈{T,F}の秘匿化情報[Xを得て出力する。「OR」は論理和を表す。判定結果Xは「対象文字集合情報が、『対象文字が文字集合の特定の真部分集合に対応する』ことを表し、かつ、パターン文字集合情報が、『パターン文字が真部分集合に対応すること』を表す、という第1条件を満たすか否かを表す第1判定結果」に相当し、第1判定結果は、第1条件を満たす場合に真となり、第1条件を満たさない場合に偽となる。図6Aの例では、対象文字d=「5」について、大文字フラグdfm,1=F、小文字フラグdfm,2=F、数字フラグdfm,3=Tであり、パターン文字p=「[:digit:]」について、大文字フラグpfm,1=F、小文字フラグpfm,2=F、数字フラグpfm,3=Tであるため、rfm,1=F、rfm,2=F、rfm,3=Tとなり、X=Tとなる。図7Aの例では、対象文字d=「A」について、大文字フラグdfm,1=T、小文字フラグdfm,2=F、数字フラグdfm,3=Fであり、パターン文字p=「b」について、大文字フラグpfm,1=F、小文字フラグpfm,2=T、数字フラグpfm,3=Fであるため、rfm,1=F、rfm,2=F、rfm,3=Fとなり、X=Fとなる。図8Aの例では、対象文字d=「b」について、大文字フラグdfm,1=F、小文字フラグdfm,2=T、数字フラグdfm,3=Fであり、パターン文字p=「b」について、大文字フラグpfm,1=F、小文字フラグpfm,2=T、数字フラグpfm,3=Fであるため、rfm,1=F、rfm,2=T、rfm,3=Fとなり、X=Tとなる。図9Aの例では、対象文字d=「a」について、大文字フラグdfm,1=F、小文字フラグdfm,2=T、数字フラグdfm,3=Fであり、パターン文字p=「b」について、大文字フラグpfm,1=F、小文字フラグpfm,2=T、数字フラグpfm,3=Fであるため、rfm,1=F、rfm,2=T、rfm,3=Fとなり、X=Tとなる。図10Aの例では、対象文字d=「A」について、大文字フラグdfm,1=T、小文字フラグdfm,2=F、数字フラグdfm,3=Fであり、パターン文字p=「[:digit:]」について、大文字フラグpfm,1=F、小文字フラグpfm,2=F、数字フラグpfm,3=Tであるため、rfm,1=F、rfm,2=F、rfm,3=Fとなり、X=Fとなる。例えばT=1であり、かつ、F=0であり、このような秘密計算による論理和演算は、非特許文献1等に記載された方法によって実現できる(ステップS113)。
≪S114
秘匿一致判定部114は、秘密計算による一致判定(等号判定)により、対象符号dcとパターン符号pcとが一致する場合(dc=pc)に真(T)となり、一致しない場合(dc≠pc)に偽(F)となる一致判定結果Y∈{T,F}の秘匿化情報[Yを得て出力する。一致判定結果Yは、「対象文字に対応する対象符号とパターン文字に対応するパターン符号とが一致するという第2条件を満たすか否かを表す第2判定結果」に相当する。第2判定結果は、第2条件を満たす場合に真となり、第2条件を満たさない場合に偽となる。図6Bの例では、dc=「U+0035」であり、pc=P([:digit:])であるため、Y=Fとなる。図7Bの例では、dc=「U+0041」であり、pc=「U+0062」であるため、Y=Fとなる。図8Bの例では、dc=「U+0062」であり、pc=「U+0062」であるため、Y=Tとなる。図9Bの例では、dc=「U+0061」であり、pc=「U+0062」であるため、Y=Fとなる。図10Bの例では、dc=「U+0041」であり、pc=P([:digit:])であるため、Y=Fとなる。例えばT=1であり、かつ、F=0である場合、dcとpcとの一致判定は、dcとpcとの排他的論理和の否定となる。このような秘密計算による一致判定は、例えば、参考文献1等に記載された方法によって実現できる(ステップS114)。
≪S115
秘匿一致判定部115は、秘密計算による一致判定により、特殊符号P([:digit:])とパターン符号pcとが一致する場合(P([:digit:]=pc)に真(T)となり、一致しない場合(P([:digit:]≠pc)に偽(F)となる一致判定結果Z∈{T,F}の秘匿化情報[Zを得て出力する。一致判定結果Zは「第5判定結果」に相当し、特殊符号とパターン符号とが一致する場合に真となり、特殊符号とパターン符号とが異なる場合に偽となる。例えば、図6Aの例ではZ=Tであり、図7Aの例ではZ=Fである(ステップS115)。
≪S116
秘匿論理演算部116は[X、[Y、および[Zを入力とし、秘密計算による論理演算により、{(X=T)AND(Z=T)}OR{(Y=T)AND(Z=F)}のときに真(T)となり、それ以外の場合に偽(F)となる判定結果W∈{T,F}の秘匿化情報[Wを得て出力する。判定結果W∈{T,F}は、「(1)第1条件を満たし、かつ、特殊符号とパターン符号とが一致するか、または、(2)第2条件を満たし、かつ、特殊符号とパターン符号とが異なる、という第3条件を満たすか否かを表す第3判定結果」に相当し、(3)第1判定結果が真であり、かつ、第5判定結果が真であるか、または、(4)第2判定結果が真であり、かつ、第5判定結果が偽である場合に真となり、それ以外の場合に偽となる。また、秘匿化情報[Wは「第3判定結果に応じた秘匿化情報」に相当する。図6Aおよび図6Bの例では、X=T、Y=F、Z=Tであるため、W=Tとなる。図7Aおよび図7Bの例では、X=F、Y=F、Z=Fであるため、W=Fとなる。図8Aおよび図8Bの例では、X=T、Y=T、Z=Fであるため、W=Tとなる。図9Aおよび図9Bの例では、X=T、Y=F、Z=Fであるため、W=Fとなる。図10Aおよび図10Bの例では、X=F、Y=F、Z=Tであるため、W=Fとなる。例えばT=1であり、かつ、F=0である場合、W=(X AND Z)OR(Y AND (1−Z))となる。このような秘密計算による論理演算は、非特許文献1等に記載された方法によって実現できる(ステップS116)。
m∈{1,・・・,M}について、以下のステップS112〜S116の処理が終了すると、秘匿論理積演算部117は[W(ただし、m∈{1,・・・,M})を入力とし、秘密計算による論理積演算により、W,・・・,Wの論理積であるパターンマッチングの結果R∈{T,F}の秘匿化情報[R]を得て出力する。図11Aおよび図11BはM=3の例である。図11Aの例では、W=W=W=Tであり、R=Tとなる。図11Aの例では、W=W=TかつW=Fであり、R=Fとなる(ステップS117)。[R]は出力部118から送信される(ステップS118)。
[R]は何れかのデータベース装置13に送信され、データベース装置13(図3B)の入力部134に入力される。[R]は復元部135に送られて復元値Rが得られる。復元値Rは抽出部132に送られる。R=Tであった場合、復元値RはステップS111で抽出された秘匿化レコード[d]に対応するテキストデータの暗号文Cを記憶部131から抽出し、出力部133から送信する。暗号文Cは、端末装置12の入力部127に入力され、復元部128でテキストデータmに復元されて出力される。一方、R=Fであった場合、復元値Rは記憶部131から新たな秘匿化レコード[d]を抽出し、前述のステップS111以降の処理が繰り返される。記憶部131に新たな秘匿化レコード[d]が存在しない場合にはエラーメッセージを返してもよい。
以上のように、本形態では文字集合の特定の真部分集合を指定して行うパターンマッチングを行うことができ、また各処理は秘密計算による一致判定や論理演算によって実現できる。これにより、文字集合の特定の真部分集合を指定して行うパターンマッチングを秘密計算で実現できる。
[第2実施形態]
本形態は第1実施形態の変形であり、さらに表記の種別の区別の有無を指定可能なものである。以下では、第1実施形態との相違点を中心に説明し、すでに説明した事項については上述と同じ参照番号を引用して説明を簡略化する。
<構造>
図1に例示するように、本形態の秘匿パターンマッチングシステム2は、端末装置22、秘匿パターンマッチング装置21−21、およびデータベース装置23を有する。
図2に例示するように、本形態の秘匿パターンマッチング装置21(ただし、n∈{1,・・・,N})は、入力部211、秘匿論理積演算部112−s(ただし、s∈{1,・・・,S}、Sは2以上の整数)、秘匿論理和演算部113、秘匿一致判定部214,115、秘匿論理演算部116、秘匿論理積演算部117、出力部118、および制御部119を有する。図12Aに例示するように、秘匿一致判定部214は、秘匿一致判定部2141−k(ただし、k∈{1,・・・,K}、秘匿一致判定部2142、秘匿論理積演算部2143、および秘匿論理演算部2144を有する。ここで、秘匿論理積演算部112−s、秘匿論理和演算部113、および秘匿一致判定部214,115は、第1演算部の例であり、秘匿論理演算部116は第2演算部の例である。説明の便宜上、各部を独立な部位として記述しているが、それらが独立の部位である必要はない。例えば、秘匿論理積演算部112−1,・・・,112−Sが同一の部位であってもよいし、秘匿一致判定部214,115が同一の部位であってもよい。
図3Aに例示するように、本形態の端末装置22は、入力部221,127、文字種別情報取得部122、文字集合情報取得部123(第1処理部)、符号点設定部224(第2処理部)、秘匿化部225(第3処理部)、出力部226、復元部128、および制御部129を有する。図3Bに例示するように、本形態のデータベース装置23は、記憶部231、抽出部132、出力部133、入力部134、復元部135、および制御部136を有する。
各装置は、例えば、前述のコンピュータが所定のプログラムを実行することで構成されてもよいし、電子回路を用いて一部またはすべての処理部が構成されてもよい。
<事前処理>
事前処理では、テキストデータの暗号文Cのデータベースと、これらの各テキストデータに含まれた「対象文字列」に対応する「秘匿化データベース」がデータベース装置23(図3B)の記憶部231に格納される。「秘匿化データベース」は、単数または複数の秘匿化レコード[d]を含む。[d]の構成は、対象符号dcが対象文字dの内容を表す符号である以外、第1実施形態と同じである。対象文字dの内容を表す符号である限り、対象符号dcの構成に限定はない。例えば、対象文字dが小文字である場合、その元の符号点(ユニコード等)をその大文字の符号点(変換後符号点)に変換し、その「変換後符号点」を対象符号dcにする。また例えば、対象文字dが大文字である場合、その元の符号点をそのまま「変換後符号点」として対象符号dcにする。また、大文字および小文字の区別がない文字についても、その元の符号点をそのまま「変換後符号点」として対象符号dcにする。例えば、「A」の元の符号点「U+0041」を「A」および「a」の対象符号dcとし、「B」の元の符号点「U+0042」を「B」および「b」の対象符号dcとし、「5」の符号点「U+0035」を対象符号dcとする(図13Aおよび図13B)。
<パターンマッチング処理>
図4Aに例示するように、端末装置22(図3A)の入力部121に、記の種別を区別するか否かを表す判定条件a∈{T,F}、およびパターン文字列(パターン情報)p=(p,・・・,p)が入力される。判定条件aは「表記の種別を区別する」ことを表す「真(T)」であるか、「表記の種別を区別しない」ことを表す「偽(F)」である。判定条件aは、秘匿化部225に送られ、パターン文字列pは、文字種別情報取得部122、文字集合情報取得部123、および符号点設定部224に送られる(ステップS221)。
その後、第1実施形態で説明したステップS122およびS123の処理が実行される。次に、符号点設定部224は、パターン文字列pが含む各パターン文字p(ただし、m∈{1,・・・,M})に対応するパターン符号pcを得て出力する。パターン文字pが「通常の文字」の場合、パターン符号pcは対象符号dcと同じ基準に従って生成される。すなわち、パターン符号pcはパターン文字pの内容を表す。例えば、「A」「a」「B」「b」「5」のパターン符号pcは、それぞれ「U+0041」「U+0041」「U+0042」「U+0042」「U+0035」である(図13Aおよび図13B)。一方、パターン文字pが「特殊文字」の場合、「特殊符号」がパターン符号pcとして生成される。例えば、パターン文字「[:digit:]」に対しては特殊符号「P([:digit:])」が生成される(ステップS224)。
秘匿化部225は、前述の「秘匿化データベース」と同じ秘匿化方法を用い、判定条件aに対応する秘匿化情報(判定条件aが秘匿化された秘匿化判定条件)[a]、ならびに、各パターン文字p(ただし、m∈{1,・・・,M})のパターン文字種別情報pfm,1,・・・,pfm,K、パターン文字集合情報pfm,K+1,・・・,pfm,S、およびパターン符号pcに対応する秘匿化情報[p]を含む秘匿化クエリ[a],[p]を得て出力する(ステップS225)。
秘匿化クエリ[a],[p]は出力部226に送られ、出力部226は秘匿化クエリ[a],[p]を、秘匿パターンマッチング装置21(ただし、n∈{1,・・・,N})に送信する(ステップS226)。
図4Bに例示するように、秘匿化クエリ[a],[p]は、秘匿パターンマッチング装置21(図2)の入力部211に入力される(ステップS210)。制御部119は、秘匿化レコードの送信要求を生成して出力部118から送信する。送信要求はデータベース装置23(図3B)の入力部134に入力され、抽出部132に送られる。抽出部132は、記憶部231から秘匿化データベースの何れかの秘匿化レコード[d]を抽出し、出力部133から送信する。秘匿化レコード[d]は、秘匿パターンマッチング装置21(図2)の入力部211に入力される(ステップS211)。
[p]および[d]は、秘匿パターンマッチング装置11(図2)の秘匿論理積演算部112−s(ただし、s∈{1,・・・,S})、および秘匿一致判定部214,115に送られ、[a]は秘匿一致判定部214に送られる。秘匿論理積演算部112−s(ただし、s∈{1,・・・,S})、秘匿論理和演算部113、秘匿一致判定部214,115、および秘匿論理演算部116は、m∈{1,・・・,M}について、ステップS112,S113,S214,S115,S116の処理を実行する。
≪S112,S113
S112,S113は第1実施形態と同じである。
≪S214
図12に例示するように、ステップS2141はS2141−S2144を有する。
≪S2141
秘匿一致判定部2141−k(ただし、k∈{1,・・・,K})は、秘密計算による一致判定により、dfm,kとpfm,kとが一致する場合(dfm,k=pfm,k)に真(T)となり、一致しない場合(dfm,k≠pfm,k)に偽(F)となる一致判定結果afm,k∈{T,F}の秘匿化情報[afm,kを得て出力する。図14Aの例では、対象文字d=「A」について、大文字フラグdfm,1=T、小文字フラグdfm,2=Fであり、パターン文字p=「a」について、大文字フラグpfm,1=F、小文字フラグpfm,2=Tであるため、afm,1=F、afm,2=Fとなる。図14Bの例では、対象文字d=「a」について、大文字フラグdfm,1=F、小文字フラグdfm,2=Tであり、パターン文字p=「a」について、大文字フラグpfm,1=F、小文字フラグpfm,2=Tであるため、afm,1=T、afm,2=Tとなる。図15Aの例では、対象文字d=「B」について、大文字フラグdfm,1=T、小文字フラグdfm,2=Fであり、p=「a」について、大文字フラグpfm,1=F、小文字フラグpfm,2=Tであるため、afm,1=F、afm,2=Fとなる(結果I)。図15Bの例では、d=「b」について、大文字フラグdfm,1=F、小文字フラグdfm,2=Tであり、パターン文字p=「a」について、大文字フラグpfm,1=F、小文字フラグpfm,2=Tであるため、afm,1=T、afm,2=Tとなる(結果I)。
秘匿一致判定部2142は、秘密計算による一致判定により、対象符号dcとパターン符号pcとが一致する場合(dc=pc)に真(T)となり、一致しない場合(dc≠pc)に偽(F)となる一致判定結果y∈{T,F}の秘匿化情報[yを得て出力する。ただし、本形態では、対象符号dcは対象文字dの内容を表し、パターン符号pcはパターン文字pの内容または特殊符号を表す。対象符号dcとパターン符号pcとが同じ内容を表すとき、それらは互いに同一である。一方、たとえ「種別」が同一であっても、対象符号dcとパターン符号pcとが異なる内容を表すとき、それらは互いに異なる。図14A−図14Dの例では、dc=pc=「U+0041」となるため、y=Tとなる(結果I)。図15A−図15Dの例では、dc=「U+0042」であり、pc=「U+0041」となるため、y=Fとなる(結果Iおよび結果III)。一致判定結果yは「対象文字の内容を表す対象符号とパターン文字の内容を表すパターン符号とが一致するという第2条件を満たすか否かを表す第2判定結果」に相当する(ステップS2141)。
《S2142
秘匿論理積演算部2143は、[afm,k(ただし、k∈{1,・・・,K})および[yを入力とし、秘密計算による論理積により、(afm,1=T)AND(afm,2=T)AND・・・AND(afm,K=T)AND(y=T)のときに真(T)となり、そうでない場合に偽(F)となる判定結果x∈{T,F}の秘匿化情報[x(ただし、m∈{1,・・・,M})を得て出力する。図14Aの例ではx=Fとなり、図14Bの例ではx=Tとなり、図15Aの例ではx=Fとなり、図15Bの例ではx=Fとなる(結果II)。例えば「T」を1とし、「F」を0とすると、x=(afm,1)AND(afm,2)AND・・・AND(afm,K)AND(y)となる。判定結果xは「対象文字の表記が特定の種別に該当するか否かを表す対象文字種別情報とパターン文字の表記が特定の種別に該当するか否かを表すパターン文字種別情報とが一致し、かつ、対象符号とパターン符号とが一致する、という第4条件を満たすか否かを表す第4判定結果」に相当する(ステップS2142)。
《S2143
秘匿論理演算部2144は、[a],[x,[yを入力とし、秘密計算による論理演算により、判定条件a=Tの場合(表記の種別を区別することを表す場合)にxに基づき、判定条件a=Fの場合(表記の種別を区別しないことを表す場合)にyに基づく結果rに応じた秘匿化情報[rを得て出力する。例えば、判定条件a=Tの場合にr=xとなり、判定条件a=Fの場合にr=yとなる結果rが秘匿化された秘匿化情報[r]を得て出力する。例えば、秘匿論理演算部2144は、{(x=T)AND(a=T)}OR{(y=T)AND(a=F)}のときに真(T)となり、そうでない場合に偽(F)となる論理演算値r∈{T,F}が秘匿化された秘匿化情報[rを得て出力する。例えば「T」を1とし、「F」を0とすると、r=(x AND a)OR(y AND (1−a))となり、[r=[(x AND a) OR (y AND (1−a))]となる(ステップS2143)。
《S2144
秘匿論理演算部2144は、[Y=[rとして出力する(ステップS2144
≪S115,S116
S115,S116は第1実施形態と同じである。ただし秘匿論理演算部116は、[X、[Y=[r、および[Zを入力とし、秘密計算による論理演算により、{(X=T)AND(Z=T)}OR{(Y=T)AND(Z=F)}のときに真(T)となり、それ以外のときに偽(F)となる判定結果Wの秘匿化情報[Wを得て出力する。ここで、Yは{(x=T)AND(a=T)}OR{(y=T)AND(a=F)}のときに真(T)となり、そうでない場合に偽(F)となる論理演算値rである。そのため、本形態では、文字集合の特定の真部分集合を指定して行うパターンマッチングを行うことができるだけではなく、判定条件aによって表記の種別の区別の有無を指定してパターンマッチングを行うこともできる。また各処理は秘密計算による一致判定や論理演算によって実現できる。これにより、文字集合の特定の真部分集合の指定や表記の種別の区別の有無を指定したパターンマッチングを秘密計算で実現できる。
なお[Xは、秘匿論理和演算部113から出力されたものであり、「対象文字集合情報が、対象文字が文字集合の特定の真部分集合に対応することを表し、かつ、パターン文字集合情報が、パターン文字が真部分集合に対応することを表す、という第1条件を満たすか否かを表す第1判定結果」の秘匿化情報に相当する。また判定結果Wは「(1)第1条件を満たし、かつ、特殊符号とパターン符号とが一致するか、または、(2)第6条件を満たし、かつ、特殊符号とパターン符号とが異なる、という第3条件を満たすか否かを表す第3判定結果」に相当する。またY=Tとなることが「第6条件」を満たすことに相当する。前述のようにY=T(すなわちr=T)となるのは、{(x=T)AND(a=T)}OR{(y=T)AND(a=F)}のときである。すなわち第6条件は、(3)第4条件を満たし(x=T)、かつ、判定条件が表記の種別を区別することを表す(a=T)か、または、(4)第2条件を満たし(y=T)、かつ、判定条件が表記の種別を区別しないことを表す(a=F)場合に満たされる。第1判定結果Xは、第1条件を満たす場合に真(X=T)となり、第1条件を満たさない場合に偽(X=F)となり、第2判定結果yは、第2条件を満たす場合に真(y=T)となり、第2条件を満たさない場合に偽(y=F)となり、第4判定結果xは、第4条件を満たす場合に真(x=T)となり、第4条件を満たさない場合に偽(x=F)となり、判定条件aは、表記の種別を区別する場合に真(a=T)となり、表記の種別を区別しない場合に偽(a=F)となり、第6判定結果Yが、(3)第4判定結果が真(x=T)であり、かつ、判定条件が真(a=T)であるか、または、(4)第2判定結果が真(y=T)であり、かつ、判定条件が偽(a=F)である場合に真(Y=T)となり、それ以外の場合に偽(Y=F)となり、第5判定結果Zが、特殊符号とパターン符号とが一致する場合に真(Z=T)となり、特殊符号とパターン符号とが異なる場合に偽(Z=F)となり、第3判定結果Wは、(1)第1判定結果が真(X=T)であり、かつ、第5判定結果が真(Z=T)であるか、または、(2)第6判定結果が真(Y=T)であり、かつ、第5判定結果が偽(Z=F)である場合に真(W=T)となり、それ以外の場合に偽(W=F)となる。
[その他の変形例等]
なお、本発明は上述の実施の形態に限定されるものではない。例えば、上述の実施形態では、秘密計算によって、テキストデータに含まれた対象文字列d=(d,・・・,d)とパターン文字列p=(p,・・・,p)とのパターンマッチングを行った。すなわち、テキストデータの全部または部分である対象文字列dとパターン文字列pとのパターンマッチングを行った。この変形例として、テキストデータの全部または部分である文字列と、パターン文字および特殊記号を含むパターンと、のパターンマッチングを行ってもよい。特殊記号とは、前述の「特殊文字」とは異なる概念であり、どのような対象文字もマッチすることにするものである。特殊記号の例は、1個の任意の対象文字にマッチすることにする「ワイルドカード」や、0個以上の任意の対象文字にマッチすることにする「無限長ギャップ」などである。このようなパターンマッチングは、特殊記号を含むパターンでパターンマッチングを行う公知手法(例えば、非特許文献1等)でのパターン文字との一致判定を、文字ごと(M=1)のステップS112−S116の処理に置換することで実現できる。
第1実施形態においてk=0とし、対象文字種別情報dfm,kおよびパターン文字種別情報pfm,kを省略してもよい。この場合には、秘匿論理積演算部112−1〜112−Kが不要となる。
M=1の場合、秘匿論理積演算部117を省略し、秘匿論理演算部116で得られた[Wをそのまま[R]としてもよい。
第2実施形態では、パターン文字列p=(p,・・・,p)に対して1個の判定条件aが設定されたが、パターン文字pごとに判定条件a∈{T,F}が設定されてもよい。この場合には判定条件aをaに置換した処理を行えばよい。また{p,・・・,p}の部分集合sub⊂{1,・・・,M}(ただし、jは2以上の整数)ごとに判定条件a(sub)∈{T,F}が設定されてもよい。この場合には、m∈subについて判定条件aをa(sub)に置換した処理を行えばよい。
判定条件a、パターン文字列p=(p,・・・,p)、および対象文字列d=(d,・・・,d)の組が複数組存在し、各組について上述の処理を行ってもよい。または、それぞれの組についての結果rの論理演算結果(論理積など)が秘匿化された秘匿化情報が出力されてもよい。各組の判定条件aやMは同一であってもよいし、異なっていてもよい。
パターン文字列pおよび対象文字列dの両方が互いに同一または異なるテキストデータに含まれたものであってもよい。パターン文字列pおよび対象文字列dの両方が入力テキストであってもよい。上述のようなテキストを抽出するためではなく、テキストからパターン文字列pにマッチングする対象文字列dを抽出するために本方式が用いられてもよい。
各実施形態では、データベース装置13および23が復元部135を含み、入力された[R]から復元値Rを復元し、復元値Rに応じ、新たな秘匿化レコード[d]またはテキストデータの暗号文Cを抽出した。しかしながら、データベース装置13または23が復元部135を持たず、記憶部131または231が、テキストデータの暗号文Cに代え、秘密計算可能なテキストデータの秘匿化情報を保持していてもよい。この場合には抽出部132が[R]をそのまま用い、秘密計算によって新たな秘匿化レコード[d]またはテキストデータの秘匿化情報を抽出してもよい。
各装置がネットワークを通じて情報をやり取りするのではなく、少なくとも一部の組の装置が可搬型記録媒体を介して情報をやり取りしてもよい。或いは、少なくとも一部の組の装置が非可搬型の記録媒体を介して情報をやり取りしてもよい。すなわち、これらの装置の一部からなる組み合わせが、同一の装置であってもよい。例えば、端末装置とデータベース装置とが同一の装置であってもよいし、データベース装置と秘匿パターンマッチング装置とが同一の装置であってもよい。
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。
対象文字が文字集合の特定の真部分集合に対応するか否かを表す対象文字集合情報と当該対象文字に対応する対象符号とが対応付けられた情報の秘匿化情報を含むデータ構造を流通させてもよい。この流通は可搬型記録媒体を販売、譲渡、貸与等したり、ネットワークを介して転送したりすることによって行う。このようなデータ構造は、第1演算部において、対象文字集合情報が、対象文字が文字集合の特定の真部分集合に対応することを表し、かつ、パターン文字集合情報が、パターン文字が前記真部分集合に対応することを表す、という第1条件を満たすか否かを表す第1判定結果、および、前記対象文字に対応する対象符号と前記パターン文字に対応するパターン符号とが一致するという第2条件を満たすか否かを表す第2判定結果、が秘匿化された秘匿化判定結果を得、第2演算部において、(1)前記第1条件を満たし、かつ、特殊符号と前記パターン符号とが一致するか、または、(2)前記第2条件を満たし、かつ、前記特殊符号と前記パターン符号とが異なる、という第3条件を満たすか否かを表す第3判定結果に応じた秘匿化情報を得るために用いられる。
上記実施形態では、コンピュータ上で所定のプログラムを実行させて本装置の処理機能が実現されたが、これらの処理機能の少なくとも一部がハードウェアで実現されてもよい。
上述した技術は、例えば、クラウド上での秘密計算によるデータベース検索などに利用できる。
1,2 秘匿パターンマッチングシステム
11,21 秘匿パターンマッチング装置
12,22 端末装置
13,23 データベース装置

Claims (8)

  1. 対象文字集合情報が、対象文字が文字集合の特定の真部分集合に対応することを表し、かつ、パターン文字集合情報が、パターン文字が前記真部分集合に対応することを表す、という第1条件を満たすか否かを表す第1判定結果、および、前記対象文字に対応する対象符号と前記パターン文字に対応するパターン符号とが一致するという第2条件を満たすか否かを表す第2判定結果、が秘匿化された秘匿化判定結果を得る第1演算部と、
    (1)前記第1条件を満たし、かつ、特殊符号と前記パターン符号とが一致するか、または、(2)前記第2条件を満たし、かつ、前記特殊符号と前記パターン符号とが異なる、という第3条件を満たすか否かを表す第3判定結果に応じた秘匿化情報を得る第2演算部と、
    を有する秘匿パターンマッチング装置。
  2. 請求項1の秘匿パターンマッチング装置であって、
    前記第1判定結果は、前記第1条件を満たす場合に真となり、前記第1条件を満たさない場合に偽となり、
    前記第2判定結果は、前記第2条件を満たす場合に真となり、前記第2条件を満たさない場合に偽となり、
    第5判定結果が、前記特殊符号と前記パターン符号とが一致する場合に真となり、前記特殊符号と前記パターン符号とが異なる場合に偽となり、
    前記第3判定結果は、(3)前記第1判定結果が真であり、かつ、前記第5判定結果が真であるか、または、(4)前記第2判定結果が真であり、かつ、前記第5判定結果が偽である場合に真となり、それ以外の場合に偽となる、秘匿パターンマッチング装置。
  3. 対象文字集合情報が、対象文字が文字集合の特定の真部分集合に対応することを表し、かつ、パターン文字集合情報が、パターン文字が前記真部分集合に対応することを表す、という第1条件を満たすか否かを表す第1判定結果、前記対象文字の内容を表す対象符号と前記パターン文字の内容を表すパターン符号とが一致するという第2条件を満たすか否かを表す第2判定結果、および、前記対象文字の表記が特定の種別に該当するか否かを表す対象文字種別情報と前記パターン文字の表記が前記特定の種別に該当するか否かを表すパターン文字種別情報とが一致し、かつ、前記対象符号と前記パターン符号とが一致する、という第4条件を満たすか否かを表す第4判定結果、が秘匿化された秘匿化判定結果を得る第1演算部と、
    (1)前記第1条件を満たし、かつ、特殊符号と前記パターン符号とが一致するか、または、(2)第6条件を満たし、かつ、前記特殊符号と前記パターン符号とが異なる、という第3条件を満たすか否かを表す第3判定結果に応じた秘匿化情報を得る第2演算部と、を有し、
    前記第6条件は、(3)前記第4条件を満たし、かつ、判定条件が表記の種別を区別することを表すか、または、(4)前記第2条件を満たし、かつ、前記判定条件が表記の種別を区別しないことを表す場合に満たされる、秘匿パターンマッチング装置。
  4. 請求項3の秘匿パターンマッチング装置であって、
    前記第1判定結果は、前記第1条件を満たす場合に真となり、前記第1条件を満たさない場合に偽となり、
    前記第2判定結果は、前記第2条件を満たす場合に真となり、前記第2条件を満たさない場合に偽となり、
    前記第4判定結果は、前記第4条件を満たす場合に真となり、前記第4条件を満たさない場合に偽となり、
    前記判定条件は、表記の種別を区別する場合に真となり、表記の種別を区別しない場合に偽となり、
    第6判定結果が、(3)前記第4判定結果が真であり、かつ、前記判定条件が真であるか、または、(4)前記第2判定結果が真であり、かつ、前記判定条件が偽である場合に真となり、それ以外の場合に偽となり、
    第5判定結果が、前記特殊符号と前記パターン符号とが一致する場合に真となり、前記特殊符号と前記パターン符号とが異なる場合に偽となり、
    前記第3判定結果は、(1)前記第1判定結果が真であり、かつ、前記第5判定結果が真であるか、または、(2)前記第6判定結果が真であり、かつ、前記第5判定結果が偽である場合に真となり、それ以外の場合に偽となる、秘匿パターンマッチング装置。
  5. パターン文字が文字集合の特定の真部分集合に対応するか否か表すパターン文字集合情報を得る第1処理部と、
    前記パターン文字に対応するパターン符号を得る第2処理部と、
    前記パターン文字集合情報および前記パターン符号に対応する秘匿化情報を得る第3処理部と、を有し、
    前記パターン符号は、前記パターン文字自体を表す符号か、または、前記真部分集合に対応する特殊符号である、端末装置。
  6. 第1演算部において、対象文字集合情報が、対象文字が文字集合の特定の真部分集合に対応することを表し、かつ、パターン文字集合情報が、パターン文字が前記真部分集合に対応することを表す、という第1条件を満たすか否かを表す第1判定結果、および、前記対象文字に対応する対象符号と前記パターン文字に対応するパターン符号とが一致するという第2条件を満たすか否かを表す第2判定結果、が秘匿化された秘匿化判定結果を得るステップと、
    第2演算部において、(1)前記第1条件を満たし、かつ、特殊符号と前記パターン符号とが一致するか、または、(2)前記第2条件を満たし、かつ、前記特殊符号と前記パターン符号とが異なる、という第3条件を満たすか否かを表す第3判定結果に応じた秘匿化情報を得るステップと、
    を有する秘匿パターンマッチング方法。
  7. 第1処理部において、パターン文字が文字集合の特定の真部分集合に対応するか否か表すパターン文字集合情報を得るステップと、
    第2処理部において、前記パターン文字に対応するパターン符号を得るステップと、
    第3処理部において、前記パターン文字集合情報および前記パターン符号に対応する秘匿化情報を得るステップと、を有し、
    前記パターン符号は、前記パターン文字自体を表す符号か、または、前記真部分集合に対応する特殊符号である、秘匿パターンマッチング方法。
  8. 請求項1から4の何れかの秘匿パターンマッチング装置、または請求項5の端末装置としてコンピュータを機能させるためのプログラム。
JP2015023887A 2015-02-10 2015-02-10 秘匿パターンマッチング装置、端末装置、それらの方法、およびプログラム Active JP6274669B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015023887A JP6274669B2 (ja) 2015-02-10 2015-02-10 秘匿パターンマッチング装置、端末装置、それらの方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015023887A JP6274669B2 (ja) 2015-02-10 2015-02-10 秘匿パターンマッチング装置、端末装置、それらの方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2016148693A true JP2016148693A (ja) 2016-08-18
JP6274669B2 JP6274669B2 (ja) 2018-02-07

Family

ID=56691680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015023887A Active JP6274669B2 (ja) 2015-02-10 2015-02-10 秘匿パターンマッチング装置、端末装置、それらの方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6274669B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019124134A1 (ja) * 2017-12-19 2019-06-27 日本電信電話株式会社 検索装置、検索方法、プログラム、および記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130067226A1 (en) * 2011-09-14 2013-03-14 Morgan Stanley Secure wildcad searchable database

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130067226A1 (en) * 2011-09-14 2013-03-14 Morgan Stanley Secure wildcad searchable database

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
原田弘毅ほか: "多項式時間・領域秘密正規表現照合アルゴリズム", 2014年 暗号と情報セキュリティシンポジウム概要集, JPN6017046149, 21 January 2014 (2014-01-21), JP, pages 1 - 8, ISSN: 0003693855 *
原田弘毅ほか: "準同型性暗号を用いた拡張文字列の秘匿パターン照合", コンピュータセキュリティシンポジウム2013論文集, vol. 第2013巻,第4号, JPN6017046147, 14 October 2013 (2013-10-14), JP, pages 801 - 808, ISSN: 0003693853 *
濱田浩気ほか: "ラウンド効率のよい秘密計算パターンマッチング", コンピュータセキュリティシンポジウム2014 論文集, vol. 第2014巻,第2号, JPN6017046148, 15 October 2014 (2014-10-15), JP, pages 674 - 681, ISSN: 0003693854 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019124134A1 (ja) * 2017-12-19 2019-06-27 日本電信電話株式会社 検索装置、検索方法、プログラム、および記録媒体
CN111712868A (zh) * 2017-12-19 2020-09-25 日本电信电话株式会社 检索装置、检索方法、程序以及记录介质
CN111712868B (zh) * 2017-12-19 2023-08-08 日本电信电话株式会社 检索装置、检索方法、以及记录介质

Also Published As

Publication number Publication date
JP6274669B2 (ja) 2018-02-07

Similar Documents

Publication Publication Date Title
Enayatifar et al. Image encryption using a synchronous permutation-diffusion technique
Al Etaiwi Encryption algorithm using graph theory
Sharma et al. Analysis of different text steganography techniques: a survey
US10541982B1 (en) Techniques for protecting electronic data
Alkhudaydi et al. Securing data via cryptography and arabic text steganography
CN102782692A (zh) 网络上传送数据的加密和解密的系统、装置和方法
CN109977684A (zh) 一种数据传输方法、装置及终端设备
CN105359155A (zh) 使用压缩破坏口令攻击
CN112437060B (zh) 一种数据传输方法、装置、计算机设备及存储介质
Alanazi et al. Involving spaces of unicode standard within irreversible Arabic text steganography for practical implementations
Patiburn et al. Text steganography using daily emotions monitoring
CN114818000A (zh) 隐私保护的集合混淆求交方法、系统及相关设备
CN112948895A (zh) 数据的水印嵌入方法、水印溯源方法及装置
CN111475690B (zh) 字符串的匹配方法和装置、数据检测方法、服务器
JP6274669B2 (ja) 秘匿パターンマッチング装置、端末装置、それらの方法、およびプログラム
CN116055067B (zh) 一种弱口令检测的方法、装置、电子设备及介质
Din et al. Evaluation review on effectiveness and security performances of text steganography technique
JP6305946B2 (ja) 秘匿パターンマッチング装置、その方法、およびプログラム
CN105678185B (zh) 一种数据安全保护方法以及智能终端管理系统
Nechta Steganography in social networks
CN115758432A (zh) 一种基于机器学习算法的全方位数据加密方法及系统
Hussein et al. Encryption of Association Rules Using Modified Dynamic Mapping and Modified (AES) Algorithm
KR102208082B1 (ko) 서버 장치, 정보관리 시스템, 정보관리 방법 및 컴퓨터 프로그램을 저장한 기록매체
Anirudh et al. A new cryptosystem for secured data communications in plagiarism checking process using blockchain technology
CN112559497A (zh) 一种数据处理方法、一种信息传输方法、装置及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180105

R150 Certificate of patent or registration of utility model

Ref document number: 6274669

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150