JP4395611B2 - Encrypted database search device and method, and encrypted database search program - Google Patents
Encrypted database search device and method, and encrypted database search program Download PDFInfo
- Publication number
- JP4395611B2 JP4395611B2 JP2003367534A JP2003367534A JP4395611B2 JP 4395611 B2 JP4395611 B2 JP 4395611B2 JP 2003367534 A JP2003367534 A JP 2003367534A JP 2003367534 A JP2003367534 A JP 2003367534A JP 4395611 B2 JP4395611 B2 JP 4395611B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- search
- encrypted
- score
- encrypted database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、文書が暗号化され蓄積された暗号化データベースを備え、当該暗号化データベースを暗号化されたままで検索する、暗号化データベース検索装置および方法ならびに暗号化データベース検索プログラムに関する。 The present invention relates to an encrypted database search apparatus and method, and an encrypted database search program, which includes an encrypted database in which documents are encrypted and stored, and searches the encrypted database while being encrypted.
近年、様々なデータを電子データに変換し、オンラインで保管および管理することによって作業を効率化する試みが多くの企業でなされている。
それに伴い、「データセンター」事業と称される、データベースに必要な資材および環境を提供するサービスも出現している。このような形態において、データベース環境を管理する管理者と実際にデータベースを利用する利用者とが異なることから、管理者によって利用者の機密情報が盗聴されることを防ぐために、利用者が保存するデータを暗号化することが考えられる。
In recent years, many companies have attempted to improve work efficiency by converting various data into electronic data and storing and managing them online.
Along with this, a service called “data center” business that provides materials and environment necessary for databases has also appeared. In such a form, since the administrator who manages the database environment is different from the user who actually uses the database, the user stores it to prevent the confidential information of the user from being intercepted by the administrator. It is conceivable to encrypt the data.
ところで、上記した利用形態において、「頻度分析」と称される古典的な攻撃が脅威となる。「頻度分析」とは、データベース等から多数の暗号文を収集し、暗号化された各単語の出現頻度を集計して一般的な出現頻度との比較を行うことによりって平文を推定する分析方法である。
上記した古典的な頻度分析に対し、平文には存在しないダミーデータを挿入することにより、その頻度を攪乱するデータ暗号化方法およびシステムが存在する(例えば、特許文献1参照)。
In contrast to the classic frequency analysis described above, there exists a data encryption method and system that disturbs the frequency by inserting dummy data that does not exist in the plaintext (see, for example, Patent Document 1).
上記した特許文献1に開示された技術によれば、コンピュータに格納されたデータが理解され盗用されることはなくなるが、頻度攪乱のためにダミーデータを多数挿入することからデータベースのデータサイズが増加する欠点がある。
一方、上記した攻撃に対処するために暗号化されたままの状態で文書を検索する方法も存在するが、必要な文書を探すときには全文検索が必須とされるため、処理速度の面で問題があった。これに対し、使用頻度の高いキーワードをキャッシュするインデックス作成処理によって検索処理を高速化する手法も存在するが、文書が暗号化されたままの状態で検索を行うことのできる検索システムにはそのまま適用できないといった不都合を有していた。
According to the technique disclosed in
On the other hand, there is a method for searching a document in an encrypted state in order to cope with the above-mentioned attack, but a full-text search is essential when searching for a necessary document. there were. On the other hand, there is a technique to speed up the search process by indexing process that caches frequently used keywords, but it is applied as it is to the search system that can perform the search with the document still encrypted. It had the inconvenience that it was not possible.
本発明は上記事情に鑑みてなされたものであり、暗号化データベースに蓄積された文書を暗号化したままで検索する検索システムに適用可能なインデックス作成処理を行い、当該暗号化データベースの検索処理の高速化をはかった、暗号化データベース検索装置および方法ならびに暗号化データベース検索プログラムを提供することを目的とする。 The present invention has been made in view of the above circumstances, and performs an index creation process applicable to a search system that searches documents stored in an encrypted database while encrypting them. An object of the present invention is to provide an encrypted database search apparatus and method, and an encrypted database search program, which are accelerated.
上記した課題を解決するために本発明に係る暗号化データベース検索装置は、文書が暗号化され蓄積された暗号化データベースを備え、当該暗号化データベースを暗号化されたままで検索する暗号化データベース検索装置であって、キーワードと、当該キーワードを含む暗号化された文書名、および前記キーワードが検索された日付が格納されるインデックス記憶部と、暗号化されたキーワードを含む検索要求を受信し、前記キーワードが前記インデックス記憶部に存在する場合に前記文書名を送信し、存在しない場合に前記暗号化データベースを全文検索して前記文書名を送信する検索処理部と、前記検索処理が実行される毎、その検索の頻度、及びキーワードの重要度からスコアを生成して逐次更新するスコア演算部と、前記スコア演算部によって更新されたスコアに基づき、前記インデックス記憶部に格納される内容を更新するインデックス更新管理部と、を備え、前記スコア演算部は、前記検索頻度につき、検索された日付の新しいキーワード順にスコアを高く設定し、且つ、前記キーワードの重要度につき、前記キーワードが前記蓄積された文書に占める割合と、特定の文書に出現する割合を計測し、当該割合が高い順にスコアを高く設定する、ことを特徴とする。
本発明に係る暗号化データベース検索装置において、前記インデックス更新管理部は、最もスコアの低いキーワードを前記インデックス記憶部から削除し、新たに検索されたキーワードを前記インデックス記憶部に配置することを特徴とする。
In order to solve the above problems, an encrypted database search apparatus according to the present invention includes an encrypted database in which documents are encrypted and stored, and an encrypted database search apparatus that searches the encrypted database as it is encrypted An index storage unit storing a keyword, an encrypted document name including the keyword, and a date when the keyword is searched; and a search request including the encrypted keyword; When the search processing is executed, a search processing unit that transmits the document name when the document name is present in the index storage unit, and transmits the document name by searching the encrypted database in a full text when it does not exist, and score computing unit the frequency of the search, and to generate a score from the importance of the keyword sequentially updated, the score computing Based on the updated score by, and an index update management unit to update the contents stored in the index storage unit, the score computing unit, per the search frequency, the scores in the new keyword order of the retrieved date Set a high value, and measure the ratio of the keyword in the accumulated document and the ratio of appearance in a specific document for the importance of the keyword, and set the score higher in order of increasing the ratio. Features.
In the encrypted database search device according to the present invention, the index update management unit deletes a keyword having the lowest score from the index storage unit and places a newly searched keyword in the index storage unit. To do.
上記した課題を解決するために本発明に係る暗号化データベース検索方法は、文書が暗号化され蓄積された暗号化データベースを備え、当該暗号化データベースを暗号化されたままで検索する暗号化データベース検索装置における暗号化データベース検索方法であって、前記暗号化データベース検索装置は、検索処理部とスコア演算部とインデックス更新管理部を備え、前記検索処理部が、暗号化されたキーワードを含む検索要求を受信するステップと、前記検索処理部が、前記キーワードが、キーワードと、当該キーワードを含む暗号化された文書名、および前記キーワードが検索された日付が格納されるインデックスに存在する場合に前記文書名を送信し、存在しない場合に前記暗号化データベースを全文検索して前記文書名を送信するステップと、前記スコア演算部が、前記検索処理が実行される毎、その検索の頻度、及びキーワードの重要度からスコアを生成して逐次更新するステップと、前記インデックス更新管理部が、前記更新されたスコアに基づき、前記インデックスに格納される内容を更新するステップと、を有し、前記スコア演算部が、前記検索頻度につき、検索された日付の新しいキーワード順にスコアを高く設定し、且つ、前記キーワードの重要度につき、前記キーワードが前記蓄積された文書に占める割合と、特定の文書に出現する割合を計測し、当該割合が高い順にスコアを高く設定する、ことを特徴とする。 In order to solve the above-described problems, an encrypted database search method according to the present invention includes an encrypted database in which documents are encrypted and stored, and an encrypted database search device that searches the encrypted database while being encrypted The encrypted database search apparatus includes a search processing unit, a score calculation unit, and an index update management unit, and the search processing unit receives a search request including an encrypted keyword. a step of, the retrieval processing unit, the keyword, and keywords, the document name when the encrypted document name includes the keyword, and the date when the keyword is searched is present in the index that is stored Send and search for the full text of the encrypted database and send the document name if it does not exist And step, the score calculation unit, each time the search processing is executed, the steps of sequentially updating to generate a score from the importance of the frequency of the search, and keyword, the index update management unit, is the updated based on the score, have a, and updating the contents stored in the index, the score computing unit, per the search frequency, setting a high score to the new keyword order of the searched date and the For the importance of the keyword, the ratio of the keyword to the accumulated document and the ratio of the keyword appearing in the specific document are measured, and the score is set higher in the order of the ratio .
上記した課題を解決するために本発明に係る暗号化データベース検索プログラムは、文書が暗号化され蓄積された暗号化データベースを備え、当該暗号化データベースを暗号化されたままで検索する暗号化データベース検索装置に用いられるプログラムであって、暗号化されたキーワードを含む検索要求を受信する処理と、前記キーワードが、キーワードと、当該キーワードを含む暗号化された文書名、および前記キーワードが検索された日付が格納されるインデックスに存在する場合に前記文書名を送信し、存在しない場合に前記暗号化データベースを全文検索して前記文書名を送信する処理と、前記検索処理が実行される毎、その検索の頻度およびキーワードの重要度からスコアを生成して逐次更新するスコア演算処理と、前記更新されたスコアに基づき、前記インデックスに格納される内容を更新する処理と、をコンピュータに実行させるプログラムであり、前記スコア演算処理は、前記検索頻度につき、検索された日付の新しいキーワード順にスコアを高く設定し、且つ、前記キーワードの重要度につき、前記キーワードが前記蓄積された文書に占める割合と、特定の文書に出現する割合を計測し、当該割合が高い順にスコアを高く設定する、ことを特徴とする。
In order to solve the above-described problem, an encrypted database search program according to the present invention includes an encrypted database in which documents are encrypted and stored, and an encrypted database search device that searches the encrypted database while being encrypted A search request including an encrypted keyword, the keyword being a keyword, an encrypted document name including the keyword, and a date when the keyword was searched A process for transmitting the document name when it exists in the stored index, a process for transmitting the document name by searching the encrypted database in a full text when it does not exist, and a search process each time the search process is executed. and score computing process of sequentially updating and generates a score from the frequency and keyword importance, is the updated Based on the score, the process of updating the contents stored in the index, there is provided a program for causing a computer to execute the said score calculation process, per the search frequency, high set a score to the new keyword order of the retrieved date In addition, with respect to the importance of the keyword, the ratio of the keyword to the accumulated document and the ratio of the keyword appearing in a specific document are measured, and the score is set to be higher in the descending order of the ratio. .
本発明によれば、キーワードと、そのキーワードを含む暗号化された文書名、およびそのキーワードを検索された日付順にソートしてインデックス記憶部に格納し、検索要求されたキーワードがインデックス記憶部に存在する場合、直ちに回答することで検索処理の高速化をはかることができる。
また、インデックス記憶部には、なるべく検索される可能性が高いキーワードを格納する必要があるため、検索処理が行われる毎に、検索頻度とキーワードの重要度の観点からインデックスおよび新たに検索されたキーワードについて採点(スコア演算)を行い、当該スコアが最も低いものをインデックス記憶部から除去し、新たに検索されたキーワードをインデックス記憶部に配置し、インデックス記憶部を更新する処理を実行することで、検索頻度とキーワードの重要度の観点からインデックス記憶部をベストの状態で維持管理できる。このことにより、安全で検索処理の高速化をはかった暗号化DB検索システムを構築できる。
According to the present invention, the keyword, the encrypted document name including the keyword, and the keyword are sorted in the order of the searched date and stored in the index storage unit, and the keyword requested for search exists in the index storage unit. If this is done, the search process can be speeded up by responding immediately.
In addition, since it is necessary to store keywords that are highly likely to be searched in the index storage unit, every time a search process is performed, an index and a new search are performed from the viewpoint of search frequency and keyword importance. By scoring (score calculation) for keywords, removing the lowest score from the index storage unit, placing the newly searched keywords in the index storage unit, and executing processing to update the index storage unit The index storage unit can be maintained and managed in the best state from the viewpoint of search frequency and keyword importance. This makes it possible to construct an encrypted DB search system that is safe and speeds up the search process.
図1は、本発明の暗号化データベース検索装置(以下、暗号化DB検索装置21aという)の適用システム(暗号化DB検索システム)を説明するために引用した図である。ここでは、ある会社が社内の重要文書のデータベース管理をデータセンターに委託する場合を想定している。
利用者端末12には暗号化データ作成のためのプログラム(ここでは暗号化モジュール124)がインストールされており、LAN(Local Area Network)13経由で社内の管理サーバ11に接続されている。また、管理サーバ11は、インターネット30等の公衆回線を経由してデータセンター20の暗号化DB22に接続されている。
FIG. 1 is a diagram cited for explaining an application system (encrypted DB search system) of an encrypted database search apparatus (hereinafter referred to as an encrypted DB search apparatus 21a) of the present invention. Here, it is assumed that a company entrusts database management of important documents in the company to a data center.
The user terminal 12 is installed with a program (
利用者が、利用者I/F122を用いてデータを作成し保存したい場合、暗号化モジュール124を起動してそのデータを暗号化し、通信モジュール123、そしてインターネット30を経由してデータセンター20をアクセスし、暗号化DB検索登録モジュール21を介して暗号化DB22にアップロードする。
一方、検索を行う場合、利用者は、検索したいキーワードを暗号化してインターネット30経由でデータセンター20へ送信する。データセンター2ではDB検索登録モモジュール21を起動し、このDB検索登録モモジュール21は、暗号化DB22を検索して暗号化された状態でマッチング処理を行い、一致したデータを抽出して返信する。利用者端末12は、返信されてきたデータを復号化モジュール125により復号化して利用者へ提供する。
When a user wants to create and store data using the user I /
On the other hand, when performing a search, the user encrypts the keyword to be searched and transmits it to the
図2は、本発明の暗号化DB検索装置の内部構成を機能展開して示したブロック図であり、図1に示すDB検索登録モジュール21の一部として構築される。
本発明の暗号化DB検索装置21aは、検索要求受信部211と、検索処理部212と、インデックス記憶部213と、スコア演算部214と、インデックス更新管理部215と、検索要求回答部216で構成される。
FIG. 2 is a block diagram showing the functional expansion of the internal configuration of the encrypted DB search apparatus of the present invention, and is constructed as a part of the DB
The encrypted DB search device 21a of the present invention includes a search
検索要求受信部211はキーワードを含む検索要求を受信して検索処理部312へ転送する。検索処理部212は、検索要求受信部211からキーワードを含む検索要求を受信し、受信したキーワードがインデックス記憶部213に存在する場合に文書名を送信し、存在しない場合に暗号化DB22を全文検索し、検索要求回答部126を介して文書名を送信する機能を持つ。
なお、インデックス記憶部21には、キーワードと、当該キーワードを含む暗号化された文書名、およびキーワードが検索された日付が、その日付順ニソートされ格納されている。
The search
The
一方、スコア演算部214は、検索処理部212で検索処理が実行される毎、その検索の頻度、もしくはキーワードの重要度からスコアを生成して逐次更新する機能を持つ。スコア演算部214は、検索頻度につき、後述するように、検索された日付の新しいキーワード順にスコアボイントを高く設定し、また、キーワードの重要度につき、キーワードが蓄積された文書に占める割合と、特定の文書に出現する割合を計測し、当該割合が高い順にスコアを高く設定する。
インデックス更新管理部215は、スコア演算部214によって更新されたスコアに基づき、インデックス記憶部214に格納される内容を更新する機能を持ち、詳しくは、検索処理が実行される毎、最もスコアの低いキーワードをインデックス記憶部213から削除し、新たに検索されたキーワードをインデックス記憶部213に追加する、いわゆるロールイン・アウトの処理を実行する。新たに検索されたキーワードのスコアが最も低かった場合にはインデックス記憶部213を更新しない。
On the other hand, each time the
The index
図3は、本発明実施形態の動作を説明するために引用したフローチャートであり、本発明の暗号化DB検索プログラムの処理手順も示している。
以下、図3に示すフローチャートを参照しながら、図1、図2に示す本発明の暗号化DB検索装置の動作について詳細に説明する。
FIG. 3 is a flowchart cited for explaining the operation of the embodiment of the present invention, and also shows the processing procedure of the encrypted DB search program of the present invention.
The operation of the encrypted DB search device of the present invention shown in FIGS. 1 and 2 will be described in detail below with reference to the flowchart shown in FIG.
まず、暗号化DB検索装置21aは、利用者端末12からインターネット30を経由して送信される暗号化されたキーワードを検索要求受信部211で受信する(S31)。検索要求受信部211からそのキーワードが供給された検索処理部312は、インデックス記憶部213を参照し(S32)、受信したキーワードがインデックス記憶部213に存在することが確認されたら(HIT)、インデックス記憶部213から該当する文書名を読み出し、検索要求回答部216を介して要求のあった利用者端末12へ回答する(S34)。一方、存在しなかった場合は(MISS HIT)、従来通り暗号化DB22からキーワードに該当する文書名を読み出し、検索要求回答部216を介して要求のあった利用者端末12へ回答する(S35)。いずれも更なる文書取得要求があった場合には暗号化DB212を参照して該当文書を取得し送信する。
なお、検索処理部212で上記した処理を実行するのとほぼ並行してスコア演算部214では、HITしたキーワードに基づくスコアの計算が行われる(S36)。
First, the encrypted DB search device 21a receives an encrypted keyword transmitted from the user terminal 12 via the Internet 30 by the search request receiving unit 211 (S31). The search processing unit 312 to which the keyword is supplied from the search
Note that the
すなわち、スコア演算部214では、検索頻度を推定するために検索日付を利用し、最も新しい日付が着いたキーワードに高い点数を与える。また、キーワードが、暗号化DB22に蓄積されている文書全体に占める割合や、特定の文書において複数回出現する割合を計測することにより、キーワードとしての重要度を決定し、その割合が高いキーワードに高い点数を与える処理を実行する。
具体的に、S36で以下の演算式(1)を実行することによりある単語(w)に対するスコアs(w)を計算することとする。
That is, the
Specifically, the score s (w) for a certain word (w) is calculated by executing the following arithmetic expression (1) in S36.
s(w)=Prw(k≧m|k≧n)〜dfm(w)/dfn(w) …(1)
ここで、Prw(k≧m|k≧n)は、ある文書に単語wがn回以上含まれているときに、ある文書に単語wがm回以上含まれる条件確率であり、m>nである。dfm(w)は、単語wをm回以上含む文書の数を、dfn(w)は、単語wをn回以上含む文書の数を表す。ここで、m、nは任意に設定可能とする。ここで近似され、計算されたスコアと、検索日時で昇順に並べた場合(古いものから順に)の順位Qt(w)から、以下の(2)式を演算することで総合スコアS(w)を計算する。ここで、Nは、インデックス記憶部213に登録されている単語の総数である。また、α、βに関しては、DB検索システムを適用する環境を考慮して設定することとする。
s (w) = Pr w (k ≧ m | k ≧ n) to df m (w) / df n (w) (1)
Here, Pr w (k ≧ m | k ≧ n) is a conditional probability that when a word w is included n times or more in a certain document, the word w is included m times or more in a certain document, and m> n. df m (w) represents the number of documents including the word w m times or more, and df n (w) represents the number of documents including the word w n times or more. Here, m and n can be arbitrarily set. The total score S (w) is calculated by calculating the following equation (2) from the approximated and calculated scores and the ranking Qt (w) in the ascending order of search date and time (in order from the oldest). Calculate Here, N is the total number of words registered in the
S(w)=αqt(w)/N+βs(w) …(2)
動的インデックスには、暗号化された状態の単語とその単語が含まれる文書名、そして、その単語が検索された日付情報が一定数登録され、全文検索に優先して検索対象となる。初期状態では、インダックス記憶部213に何も登録されていないため、全文検索においてHITした単語を順次登録して蓄積することとする。
また、インデックス内の検索において、HITした単語については日時情報のみ更新する。そして、一定数に達してはじめて上記した総合スコアS(w)を計算し、インデックス更新管理部215は、最もスコアの低いキーワード(検索文字列)をインデックス記憶部213から削除する(S37)。
S (w) = αqt (w) / N + βs (w) (2)
In the dynamic index, an encrypted word, a document name including the word, and a fixed number of date information on which the word is searched are registered, and the search target is given priority over the full-text search. In the initial state, nothing is registered in the
In the search in the index, only the date information is updated for the hit word. Then, the total score S (w) described above is calculated only after reaching a certain number, and the index
以上説明のように本発明は、暗号化されたキーワードと、そのキーワードを含む暗号化された文書名、およびそのキーワードを検索された日付順にソートしてインデックス記憶部213に格納し、検索要求されたキーワードがインデックス記憶部213に存在する場合、直ちに回答することで検索処理の高速化をはかるものである。
このとき、インデックス記憶部213には、なるべく検索される可能性が高いキーワードを格納する必要があるため、検索処理が行われる毎に、検索頻度とキーワードの重要度の観点からインデックスおよび新たに検索されたキーワードについて採点(スコア演算)を行い、当該スコアが最も低いものをインデックス記憶部213から除去し、新たに検索されたキーワードをインデックス記憶部213に配置し、インデックス記憶部213を更新する処理を実行する。このことにより、検索頻度とキーワードの重要度の観点からインデックス記憶部213をベストの状態で維持管理する。従って、安全で検索処理の高速化をはかった暗号化DB検索システムを構築できる。
As described above, the present invention sorts the encrypted keywords, the encrypted document names including the keywords, and the keywords in the order of the retrieved date, stores them in the
At this time, since it is necessary to store keywords that are highly likely to be searched in the
なお、図2に示す検索要求受信部211と、検索処理部212と、スコア演算部214と、インデックス更新管理部215と、検索要求回答部216のそれぞれで実行される手順をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによっても本発明の暗号化DB検索装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺機器等のハードウェアを含む。
Note that the computer-readable recording of the procedures executed by each of the search
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。 The embodiments of the present invention have been described in detail with reference to the drawings. However, the specific configuration is not limited to the embodiments, and includes designs and the like that do not depart from the gist of the present invention.
12…利用者端末、20…データセンター、21…DB検索登録モジュール、21a…暗号化DB検索装置、22…暗号化DB、211…検索要求受信部、212…検索処理部、213…インデックス記憶部、214…スコア演算部、215…インデックス更新管理部、216…検索要求回答部
DESCRIPTION OF SYMBOLS 12 ... User terminal, 20 ... Data center, 21 ... DB search registration module, 21a ... Encrypted DB search device, 22 ... Encrypted DB, 211 ... Search request receiving part, 212 ... Search processing part, 213 ... Index storage part , 214 ... Score calculation unit, 215 ... Index update management unit, 216 ... Search request answering unit
Claims (4)
キーワードと、当該キーワードを含む暗号化された文書名、および前記キーワードが検索された日付が格納されるインデックス記憶部と、
暗号化されたキーワードを含む検索要求を受信し、前記キーワードが前記インデックス記憶部に存在する場合に前記文書名を送信し、存在しない場合に前記暗号化データベースを全文検索して前記文書名を送信する検索処理部と、
前記検索処理が実行される毎、その検索の頻度、及びキーワードの重要度からスコアを生成して逐次更新するスコア演算部と、
前記スコア演算部によって更新されたスコアに基づき、前記インデックス記憶部に格納される内容を更新するインデックス更新管理部と、を備え、
前記スコア演算部は、
前記検索頻度につき、検索された日付の新しいキーワード順にスコアを高く設定し、且つ、
前記キーワードの重要度につき、前記キーワードが前記蓄積された文書に占める割合と、特定の文書に出現する割合を計測し、当該割合が高い順にスコアを高く設定する、
ことを特徴とする暗号化データベース検索装置。 An encrypted database search device comprising an encrypted database in which documents are encrypted and stored, and searching the encrypted database while being encrypted,
An index storage unit for storing a keyword, an encrypted document name including the keyword, and a date on which the keyword was searched;
When a search request including an encrypted keyword is received, the document name is transmitted when the keyword exists in the index storage unit, and when the keyword does not exist, the document name is transmitted by performing a full text search on the encrypted database. A search processing unit to
Each time the search process is executed, a score calculation unit that generates a score from the frequency of the search and the importance of the keyword and sequentially updates it,
An index update management unit that updates the content stored in the index storage unit based on the score updated by the score calculation unit ,
The score calculation unit
For the search frequency, set a higher score in order of new keywords on the searched date, and
For the importance of the keyword, measure the ratio of the keyword in the accumulated document and the ratio of appearance in a specific document, and set the score higher in the order of the ratio,
An encrypted database search device characterized by the above.
前記暗号化データベース検索装置は、検索処理部とスコア演算部とインデックス更新管理部を備え、
前記検索処理部が、暗号化されたキーワードを含む検索要求を受信するステップと、
前記検索処理部が、前記キーワードが、キーワードと、当該キーワードを含む暗号化された文書名、および前記キーワードが検索された日付が格納されるインデックスに存在する場合に前記文書名を送信し、存在しない場合に前記暗号化データベースを全文検索して前記文書名を送信するステップと、
前記スコア演算部が、前記検索処理が実行される毎、その検索の頻度、及びキーワードの重要度からスコアを生成して逐次更新するステップと、
前記インデックス更新管理部が、前記更新されたスコアに基づき、前記インデックスに格納される内容を更新するステップと、を有し、
前記スコア演算部が、
前記検索頻度につき、検索された日付の新しいキーワード順にスコアを高く設定し、且つ、
前記キーワードの重要度につき、前記キーワードが前記蓄積された文書に占める割合と、特定の文書に出現する割合を計測し、当該割合が高い順にスコアを高く設定する、
ことを特徴とする暗号化データベース検索方法。 An encrypted database search method in an encrypted database search device that includes an encrypted database in which documents are encrypted and stored, and searches the encrypted database while being encrypted ,
The encrypted database search device includes a search processing unit, a score calculation unit, and an index update management unit,
The search processing unit receiving a search request including an encrypted keyword;
The search processing unit transmits the document name when the keyword exists in an index storing a keyword, an encrypted document name including the keyword, and a date when the keyword is searched, and exists. If not, full-text searching the encrypted database and sending the document name;
Each time the score calculation unit executes the search process, a step of generating a score from the frequency of the search and the importance of the keyword and sequentially updating the score,
The index update management unit, based on the updated score, have a, and updating the contents stored in the index,
The score calculation unit is
For the search frequency, set a higher score in order of new keywords on the searched date, and
For the importance of the keyword, measure the ratio of the keyword in the accumulated document and the ratio of appearance in a specific document, and set the score higher in the order of the ratio,
An encrypted database search method characterized by the above.
暗号化されたキーワードを含む検索要求を受信する処理と、
前記キーワードが、キーワードと、当該キーワードを含む暗号化された文書名、および前記キーワードが検索された日付が格納されるインデックスに存在する場合に前記文書名を送信し、存在しない場合に前記暗号化データベースを全文検索して前記文書名を送信する処理と、
前記検索処理が実行される毎、その検索の頻度およびキーワードの重要度からスコアを生成して逐次更新するスコア演算処理と、
前記更新されたスコアに基づき、前記インデックスに格納される内容を更新する処理と、をコンピュータに実行させるプログラムであり、
前記スコア演算処理は、
前記検索頻度につき、検索された日付の新しいキーワード順にスコアを高く設定し、且つ、
前記キーワードの重要度につき、前記キーワードが前記蓄積された文書に占める割合と、特定の文書に出現する割合を計測し、当該割合が高い順にスコアを高く設定する、
ことを特徴とする暗号化データベース検索プログラム。 A program for use in an encrypted database search apparatus that includes an encrypted database in which documents are encrypted and stored, and that searches the encrypted database while being encrypted,
Receiving a search request including the encrypted keyword;
If the keyword is present in an index in which the keyword, the encrypted document name including the keyword, and the date when the keyword was searched are stored, the document name is transmitted. If the keyword is not present, the encryption is performed. Processing to search the database for the full text and sending the document name;
Each time the search process is executed, a score calculation process for generating and sequentially updating a score from the frequency of the search and the importance of the keyword;
A program for causing a computer to execute processing for updating the content stored in the index based on the updated score ,
The score calculation process is:
For the search frequency, set a higher score in order of new keywords on the searched date, and
For the importance of the keyword, measure the ratio of the keyword in the accumulated document and the ratio of appearance in a specific document, and set the score higher in the order of the ratio,
An encrypted database search program characterized by that .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003367534A JP4395611B2 (en) | 2003-10-28 | 2003-10-28 | Encrypted database search device and method, and encrypted database search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003367534A JP4395611B2 (en) | 2003-10-28 | 2003-10-28 | Encrypted database search device and method, and encrypted database search program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005134990A JP2005134990A (en) | 2005-05-26 |
JP4395611B2 true JP4395611B2 (en) | 2010-01-13 |
Family
ID=34645513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003367534A Expired - Fee Related JP4395611B2 (en) | 2003-10-28 | 2003-10-28 | Encrypted database search device and method, and encrypted database search program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4395611B2 (en) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4256897B2 (en) | 2006-06-16 | 2009-04-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Apparatus, method and program for providing matching service |
KR100737359B1 (en) * | 2006-10-04 | 2007-07-10 | (주)이글로벌시스템 | Method to create Indexes for encrypted column |
US20080097954A1 (en) * | 2006-10-20 | 2008-04-24 | Microsoft Corporation | Ranged lookups |
WO2010026561A2 (en) * | 2008-09-08 | 2010-03-11 | Confidato Security Solutions Ltd. | An appliance, system, method and corresponding software components for encrypting and processing data |
JP5420085B2 (en) | 2011-01-13 | 2014-02-19 | 三菱電機株式会社 | Data processing device and data storage device |
EP2680251B1 (en) | 2011-02-22 | 2016-05-25 | Mitsubishi Electric Corporation | Search system, search method for search system, information processing device, search program, corresponding keyword management device and corresponding keyword management system |
US8806223B2 (en) * | 2011-05-03 | 2014-08-12 | Douglas Norman Crowe | System and method for management of encrypted data |
WO2013018683A1 (en) | 2011-07-29 | 2013-02-07 | 日本電気株式会社 | System for generating index resistant against divulging of information, index generation device, and method therefor |
JP6048414B2 (en) * | 2011-11-11 | 2016-12-21 | 日本電気株式会社 | Database apparatus, method and program |
KR101388724B1 (en) | 2011-11-11 | 2014-04-25 | 닛본 덴끼 가부시끼가이샤 | Database encryption system, method, and computer-readable recording medium |
WO2013111284A1 (en) | 2012-01-25 | 2013-08-01 | 三菱電機株式会社 | Data search device, data search method, data search program, data registration device, data registration method, data registration program and information processing device |
EP2833274A4 (en) | 2012-03-29 | 2015-12-23 | Nec Corp | Encrypted database system, client terminal, database server, data linking method, and program |
JP6137173B2 (en) | 2012-04-24 | 2017-05-31 | 日本電気株式会社 | Encrypted database system, client terminal and database server, combining method and program |
JP5599853B2 (en) * | 2012-09-21 | 2014-10-01 | ヤフー株式会社 | Advertisement distribution device |
JP5963936B2 (en) | 2013-02-25 | 2016-08-03 | 三菱電機株式会社 | Server device, secret search program, recording medium, and secret search system |
JP5899286B2 (en) * | 2014-08-12 | 2016-04-06 | ヤフー株式会社 | Advertisement distribution device |
KR102245886B1 (en) * | 2015-08-20 | 2021-04-28 | 에스케이텔레콤 주식회사 | Analytics center and control method thereof, and service providing device and control method thereof in co-operational privacy protection communication environment |
US10673614B2 (en) | 2015-10-09 | 2020-06-02 | Mitsubishi Electric Corporation | Secret search system, management device, secret search method and computer readable medium |
WO2017122326A1 (en) | 2016-01-14 | 2017-07-20 | 三菱電機株式会社 | Confidential search system, confidential search method and confidential search program |
US11005645B2 (en) | 2016-01-15 | 2021-05-11 | Mitsubishi Electric Corporation | Encryption device, encryption method, computer readable medium, and storage device |
WO2018198192A1 (en) | 2017-04-25 | 2018-11-01 | 三菱電機株式会社 | Search device, search system, search method, and search program |
US20210081562A1 (en) | 2017-09-12 | 2021-03-18 | Mitsubishi Electric Corporation | Data processing apparatus, data processing method, and computer readable medium |
JP7384740B2 (en) * | 2020-04-27 | 2023-11-21 | 株式会社日立製作所 | Search system, search device, and search method |
-
2003
- 2003-10-28 JP JP2003367534A patent/JP4395611B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005134990A (en) | 2005-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4395611B2 (en) | Encrypted database search device and method, and encrypted database search program | |
Fu et al. | Toward efficient multi-keyword fuzzy search over encrypted outsourced data with accuracy improvement | |
Fu et al. | Enabling central keyword-based semantic extension search over encrypted outsourced data | |
US9552492B2 (en) | Secure application access system | |
EP3674928A1 (en) | Full-text fuzzy retrieval method for similar chinese characters in ciphertext domain | |
US9047480B2 (en) | Secure application access system | |
US7519835B2 (en) | Encrypted table indexes and searching encrypted tables | |
JP5306356B2 (en) | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM USING PUBLIC SEARCH ENGINE | |
JP5419886B2 (en) | Information processing apparatus, document search system, document search method, and program | |
JP6449093B2 (en) | Concealed database system and concealed data management method | |
CN103955537A (en) | Method and system for designing searchable encrypted cloud disc with fuzzy semantics | |
Awad et al. | Chaotic searchable encryption for mobile cloud storage | |
US7930560B2 (en) | Personal information management system, personal information management program, and personal information protecting method | |
JP6089881B2 (en) | Data search method, data addition / update method, data search program, and relay device | |
CN109493017A (en) | Credible outsourcing storage method based on block chain | |
CN112231752B (en) | Ciphertext insertion query deletion method without interactive frequency hiding | |
JP2003108419A5 (en) | Electronic album publishing system, electronic album management apparatus, electronic album management method and program | |
CN118132545A (en) | Chinese semantic expansion query method based on Doc2Vec model | |
CN110928980A (en) | Ciphertext data storage and retrieval method for mobile cloud computing | |
JP2009282733A (en) | Device, method and program for retrieving confidential file | |
JP4011383B2 (en) | Data search method, data search system, search keyword generation device, and computer program | |
CN110324402B (en) | Trusted cloud storage service platform based on trusted user front end and working method | |
JP4552044B2 (en) | Encrypted data creation device and method, and program thereof | |
US11308233B2 (en) | Method for information retrieval in an encrypted corpus stored on a server | |
JP5017405B2 (en) | Regulation management device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061027 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20061027 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090915 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090925 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121030 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |