JP2013008175A - Conversion processing method, device and program and restoration processing method, device and program - Google Patents
Conversion processing method, device and program and restoration processing method, device and program Download PDFInfo
- Publication number
- JP2013008175A JP2013008175A JP2011140070A JP2011140070A JP2013008175A JP 2013008175 A JP2013008175 A JP 2013008175A JP 2011140070 A JP2011140070 A JP 2011140070A JP 2011140070 A JP2011140070 A JP 2011140070A JP 2013008175 A JP2013008175 A JP 2013008175A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- value
- attribute value
- storage unit
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本技術は、データ秘匿化技術に関する。 The present technology relates to data concealment technology.
例えば、図1A乃至図1Cに示すように、大学の工学部、薬学部及び商学部の各学生について、複数の属性項目(例えば、性別、学年の高低、体力点数及び疾患の有無(1=あり、0=なし))の各々の属性値が保持されている場合を検討する。さらに、このようなデータ全体(ここでは大学全体)について、特定の属性項目の属性値毎に、当該属性値が出現するレコード群を特定して、当該レコード群における、他の属性項目の属性値の出現回数を算出するクロス集計を行う場合を考える。 For example, as shown in FIG. 1A to FIG. 1C, for each student in the university's engineering department, pharmacy department, and commerce department, there are a plurality of attribute items (for example, gender, grade level, physical fitness score, and presence or absence of disease (1 = Yes, 0 = (None)) Consider a case where each attribute value is retained. Further, for such entire data (here, the entire university), for each attribute value of the specific attribute item, the record group in which the attribute value appears is specified, and the attribute value of the other attribute item in the record group Consider the case of performing cross tabulation to calculate the number of occurrences of.
例えば、図1A乃至図1Cに示すようなデータをそのままクロス集計を実施する集計者に渡してしまうと個人が特定されてしまうので、プライバシ情報の漏洩を防止するため、簡単な方法として一部の属性項目について暗号化またはハッシュ関数による秘匿化を行う場合がある。例えば、性別という属性項目について暗号化を行う場合、例えばM(男性)をabcに暗号化し、F(女性)をdefに暗号化した場合には、図2A乃至図2Cのようなデータが得られる。このようなデータであれば、このデータのみからは個人が特定できるわけではない。なお、性別と疾患についてクロス集計を実施すれば、図3に示すような集計結果が得られる。 For example, if the data as shown in FIGS. 1A to 1C is passed to the tabulator who performs the cross tabulation as it is, an individual is specified. Therefore, in order to prevent leakage of privacy information, some simple methods are used. The attribute item may be encrypted or concealed using a hash function. For example, when encrypting the attribute item of gender, for example, when M (male) is encrypted to abc and F (female) is encrypted to def, data as shown in FIGS. 2A to 2C is obtained. . With such data, an individual cannot be identified from this data alone. In addition, if cross tabulation is implemented about sex and a disease, a tabulation result as shown in FIG. 3 will be obtained.
しかしながら、例えば工学部は女性が少ないという背景知識があったり、薬学部は男性が少ないという背景知識があったりすれば、abc=M(男性)、def=F(女性)であることが集計者側には分かってしまう。さらに、個人も特定できてしまい、その個人について疾患の有無というセンシティブな情報も特定されてしまう可能性もある。これは、値そのものが秘匿されても、秘匿前の値と秘匿後の値とが一対一対応であれば、値の分布も秘匿化前後で全く変化しないために生ずる問題である。 However, for example, if the engineering department has a background knowledge that there are few women, or the pharmacy department has a background knowledge that there are few men, it is on the tabulator side that abc = M (male) and def = F (female). Will understand. Furthermore, an individual can be specified, and sensitive information about the presence or absence of a disease may be specified for the individual. This is a problem that occurs even if the value itself is concealed, if the value before concealment and the value after concealment have a one-to-one correspondence, the distribution of values does not change at all before and after concealment.
なお、文字や数字をそれとの恣意的な対応が規定された数字や記号列に変換する手法では、同じ数字や記号列の暗号文中における出現の規則性により、容易に解読されてしまうという危険性について考慮した従来技術が存在している。この従来技術では、秘匿後の文字列として既にあらわれた文字列と同じ場合に、変換規則を一部改変することで、変換規則の判別を困難にするものである。しかしながら、秘匿化後のデータの分布や秘匿化した後のクロス集計などの集計処理については考慮されていない。 In addition, there is a risk that the method of converting letters and numbers into numbers and symbol strings with arbitrary correspondence with them will be easily deciphered due to the regularity of appearance of the same numbers and symbol strings in the ciphertext. There is a conventional technique that considers the above. In this conventional technique, when a character string that has already appeared as a character string after concealment is the same, the conversion rule is partially modified to make it difficult to determine the conversion rule. However, the distribution of the data after concealment and the summarization processing such as cross tabulation after concealment are not considered.
また、変換処理対象として指定された電子文書中の文字列を、他の文字列に変換する技術も存在している。具体的には、予め変換文字と、各変換文字を一意に識別する識別子とを定義した文字リストを保持しておき、変換指示の入力を受け付け、変換対象としての文字列に含まれる各文字を文字リストから検索して、当該文字リストから変換対象文字に付与された識別子に基づき、予め定義された変換規則に従って文字リスト中の他の文字に変換する。一方、復元指示の入力を受け付け、変換後の文字を、変換規則に対応した復元規則により、文字リストに含まれる変換対象文字に復元する。しかしながら、秘匿化後のデータの分布やクロス集計などの集計処理については考慮されていない。 There is also a technique for converting a character string in an electronic document designated as a conversion processing target into another character string. Specifically, a character list that defines conversion characters and identifiers that uniquely identify each conversion character is held in advance, an input of a conversion instruction is accepted, and each character included in the character string to be converted is A search is performed from the character list, and the character list is converted into another character in the character list according to a predefined conversion rule based on the identifier assigned to the character to be converted from the character list. On the other hand, the input of the restoration instruction is accepted, and the converted character is restored to the conversion target character included in the character list by the restoration rule corresponding to the conversion rule. However, aggregation processing such as distribution of data after concealment and cross tabulation is not considered.
さらに、ファイル中の機密情報部分は保護しつつ、それ以外の部分は容易に一般に開示できるようにすると共に、管理者が元のファイルを復元できるようにする技術も存在している。この技術では、置換対象文字に対する置換後文字を、ファイル内に存在しない文字の中から選択し、当該選択した置換後文字と置換対象文字との対応関係を示す置換マップを作成し、置換マップに基づいてファイル内に存在する変換対象文字列中の置換対象文字を置換後文字に置き換える。また、置換マップに基づいてファイル内に存在する置換後文字を置換対象文字に戻す。しかしながら、秘匿化後のデータの分布やクロス集計などの集計処理については考慮されていない。 Further, there is a technique for protecting the confidential information portion in the file while allowing other portions to be easily disclosed to the general public and allowing the administrator to restore the original file. In this technology, a replacement character for a replacement target character is selected from characters that do not exist in the file, a replacement map indicating the correspondence between the selected replacement character and the replacement target character is created, and the replacement map is created. Based on this, the replacement target character in the conversion target character string existing in the file is replaced with the replaced character. Further, the replaced character existing in the file is returned to the replacement target character based on the replacement map. However, aggregation processing such as distribution of data after concealment and cross tabulation is not considered.
また、暗号強度を強化又は保持する目的で、順序関係を保持したまま、確率暗号で1つの値を複数に散らすという技術も存在している。しかしながら、秘匿化後のデータの分布やクロス集計などの集計処理について考慮したものではない。 In addition, for the purpose of strengthening or maintaining the encryption strength, there is a technique in which one value is scattered into a plurality of values by the probability encryption while maintaining the order relation. However, it does not take into account the aggregation processing such as the distribution of data after concealment and cross tabulation.
従って、本技術の目的は、一側面によれば、データの分布からデータ漏洩が生ずることを防止するための技術を提供することである。 Therefore, the objective of this technique is to provide the technique for preventing that a data leak arises from distribution of data according to one side surface.
本技術の第1の態様に係る変換処理方法は、(A)第1データ格納部に格納されており且つ各々複数の属性項目について属性値を有する複数のレコードについて、複数の属性項目のうち特定の属性項目について出現する属性値の出現頻度についての第1の分布を検出するステップと、(B)第1の分布を当該第1の分布とは異なる第2の分布となるように、上記属性値のうち少なくとも一部の属性値の各々を、予め定められた第1のルールに従って特定される複数の第2の属性値のいずれかに変換するステップとを含む。 The conversion processing method according to the first aspect of the present technology includes: (A) identifying a plurality of attribute items among a plurality of records stored in the first data storage unit and having attribute values for each of the plurality of attribute items. Detecting the first distribution of the appearance frequency of the attribute value appearing for the attribute item, and (B) the attribute so that the first distribution is a second distribution different from the first distribution. Converting each of at least some of the attribute values into one of a plurality of second attribute values specified according to a predetermined first rule.
本技術の第2の態様に係る復元処理方法は、(A)集計対象の複数のレコードにおける第1の属性項目について出現する第1属性値から、予め定められたルールに従って複数の第2属性値を生成するステップと、(B)第1の属性項目について出現した第3属性値の各々について第2の属性項目の属性値の計数値又は属性値の合計値を含む集計結果を格納する第1データ格納部において、複数の第2属性値の各々について、当該第2の属性値と一致する第3属性値が存在するか判断し、存在すれば当該第3属性値に対応付けられている第2の属性項目の属性値毎の計数値又は属性値の合計値を第1データ格納部から読み出し、当該第2の属性項目の属性値毎に累計し又は当該第2の属性項目の属性値を累計し、累計結果を前記第2の属性値に対応付けて第2データ格納部に格納するステップとを含む。 The restoration processing method according to the second aspect of the present technology includes (A) a plurality of second attribute values according to a predetermined rule from a first attribute value that appears for a first attribute item in a plurality of records to be counted. And (B) a first result storing a count result including a count value of attribute values of the second attribute item or a total value of attribute values for each of the third attribute values that appear for the first attribute item. In the data storage unit, for each of the plurality of second attribute values, it is determined whether there is a third attribute value that matches the second attribute value. If there is a second attribute value, the second attribute value is associated with the third attribute value. The count value for each attribute value of the two attribute items or the total value of the attribute values is read from the first data storage unit and accumulated for each attribute value of the second attribute item, or the attribute value of the second attribute item is Accumulate the accumulated result to the second attribute value And storing in the second data storage unit with response.
データの分布からデータ漏洩が生ずることを防止できるようになる。 It is possible to prevent data leakage from the data distribution.
図4に、本実施の形態に係るシステム構成例を示す。インターネットなどのネットワーク1には、クロス集計などの集計処理を実施する集計サーバ300と、集計サーバ300に対してデータ提供を行ったり集計結果を利用する処理を実施する複数の情報処理装置(図4では情報処理装置A乃至C)とが接続されている。集計サーバ300は、情報処理装置から集計対象のデータを受信するデータ受信部310と、データ受信部310により受信された集計対象のデータを格納するデータ格納部320と、情報処理装置からの集計要求に応じてクロス集計などの集計処理を実施して要求元の情報処理装置に集計結果を返信する集計処理部330とを有する。集計サーバ300の処理内容は従来と変わらないので、これ以上述べない。
FIG. 4 shows a system configuration example according to the present embodiment. In the
図5に、情報処理装置の機能ブロック図を示す。情報処理装置は、提供データ格納部101と、分布検出部102と、分布データ格納部103と、分布変換データ生成部104と、ルール格納部105と、分布変換データ格納部106と、変換処理部107と、変換済データ格納部108と、暗号化処理部109と、キー格納部110と、暗号化データ格納部111と、送信部112と、集計要求処理部121と、集計結果格納部122と、復元処理部123と、属性値生成部124と、復元集計結果格納部126とを有する。なお、情報処理装置は、各属性項目について出現する属性値のデータを格納する属性値格納部125を有する場合もある。
FIG. 5 shows a functional block diagram of the information processing apparatus. The information processing apparatus includes a provided
なお、情報処理装置には、他のネットワークを介して当該情報処理装置を管理する管理者等が操作する端末装置が接続されており、当該端末装置からの指示に従って情報処理装置は処理を行う。例えば、端末装置から送られてきた提供データを受信すると、提供データ格納部101に格納する。
Note that a terminal device operated by an administrator or the like who manages the information processing apparatus is connected to the information processing apparatus via another network, and the information processing apparatus performs processing according to an instruction from the terminal apparatus. For example, when the provision data sent from the terminal device is received, the provision data is stored in the provision
提供データ格納部101は、集計サーバ300に送信すべきデータである提供データを格納する。分布検出部102は、提供データ格納部101に格納されている複数のレコードに対して、例えば管理者により指定された特定の属性項目について各属性値について出現頻度を計数する処理、属性値を合計する処理などを実施して、処理結果を分布データ格納部103に格納する。
The provided
分布変換データ生成部104は、ルール格納部105に格納されているルールデータに従って、分布データ格納部103に格納されている分布データを処理することで、提供データに含まれる複数のレコードにおける特定の属性項目の属性値を変換するためのデータを生成し、分布変換データ格納部106に格納する。変換処理部107は、分布変換データ格納部106に格納されているデータに従って、提供データ格納部101に格納されている複数のレコードにおける特定の属性項目についての属性値を変換して、変換後のデータを変換済データ格納部108に格納する。
The distribution conversion
暗号化処理部109は、キー格納部110に格納されているキーと所定のハッシュ関数に従って、変換済データ格納部108に格納されている複数のレコードにおける特定の属性項目についての属性値を暗号化する処理を実施し、処理結果を暗号化データ格納部111に格納する。送信部112は、暗号化データ格納部111に格納されているデータを、集計サーバ300に送信する。
The
集計要求処理部121は、情報処理装置のユーザからの指示に応じて集計要求を集計サーバ300に送信し、集計サーバ300から集計結果を受信し、集計結果格納部122に格納する。復元処理部123は、属性値生成部124と連携して集計結果格納部122に格納されている集計結果のうち暗号化されており且つ属性値の変換が行われている属性項目の属性値を復元する処理を実施し、処理結果を復元集計結果格納部126に格納する。属性値生成部124は、分布データ格納部103(又は属性値格納部125)に格納されている特定の属性項目の属性値をルール格納部105に格納されているルールデータに従って変換すると共に、キー格納部110に格納されているキーと所定のハッシュ関数で暗号化することによって暗号化した変換済属性値を生成して、復元処理部123に出力する。
The aggregation
図5の例では、情報処理装置は、提供データを集計サーバ300に送信するための処理を行う部分と、集計サーバ300から集計結果を受信して復元するための処理を行う部分とを含む。しかし、それらが別の装置に設けられるようにしても良い。キー格納部110に格納されているキーとハッシュ関数とについては、集計結果を共用する者又は会社で共有される。また、属性値格納部125については、集計結果を共用する者又は会社で、特定の属性項目について出現する可能性のある属性値のバリエーションを共通して格納するものである。これに用いることで自らの提供データには含まれない属性値が集計結果に出現しても対処することができるようになる。同様に、ルール格納部105についても、集計結果を共用する者又は会社で、共通のルールデータが格納されている。
In the example of FIG. 5, the information processing apparatus includes a portion that performs processing for transmitting provided data to the
次に、図6乃至図25を用いて、情報処理装置の処理内容について説明する。なお、既に提供データについては提供データ格納部101に格納されているものとする。まず、分布検出部102は、提供データ格納部101に格納されている提供データである複数のレコードにおいて、処理の対象である特定の属性項目の属性値毎に出現頻度を計数し、出現頻度の平均値(場合によっては最小値など)を算出し、分布データ格納部103に格納する(図6:ステップS1)。
Next, processing contents of the information processing apparatus will be described with reference to FIGS. It is assumed that the provided data is already stored in the provided
例えば図7のような提供データが提供データ格納部101に格納されている場合には、特定の属性項目が「性別」であれば図8に示すようなデータが得られる。図8の例では、属性値「M」の出現頻度と、属性値「F」の出現頻度と、それらの平均値が含まれる。平均値は、出現頻度の偏りを判断するための基準値として用いられる。なお、最小値を、基準値として用いる場合もある。
For example, when provision data as shown in FIG. 7 is stored in the provision
次に、分布変換データ生成部104は、分布変換データ生成処理を実施する(ステップS3)。分布変換データ生成処理については、図9乃至図10Cを用いて説明する。
Next, the distribution conversion
分布変換データ生成部104は、分布データ格納部103に格納されている分布データにおいて未処理の属性値を1つ特定する(図9:ステップS11)。そして、分布変換データ生成部104は、特定された属性値の出現頻度が基準値未満であるか判断する(ステップS13)。例えば平均値を基準値として用いる場合について説明すると、図8の場合、属性値「M」の場合には、平均値以上の出現頻度が得られており、属性値「F」の場合には、平均値未満の出現頻度が得られている。
The distribution conversion
特定された属性値の出現頻度が基準値未満であれば(ステップS13:Yesルート)、分布変換データ生成部104は、ルール格納部105に格納されているルールデータに従って変換後属性値を1つ生成し、当該変換後属性値及び変換確率「100%」を含むレコードを生成して、分布変換データ格納部106に格納する(ステップS15)。そしてステップS23に移行する。
If the appearance frequency of the identified attribute value is less than the reference value (step S13: Yes route), the distribution conversion
ルール格納部105に格納されているルールデータは、例えば変換前の属性値にシリアルに番号を付加することで変換後属性値を生成するというルールを表すデータであるとすると、属性値「F」の場合、変換後属性値は「F1」となる。なお、ルールデータが、例えば変換前の属性値に、所定範囲内の整数値をランダムに選択するようなルールを表すデータである場合もある。このようなルールは一例であって、規則的に変換できればどのようなルールであってもよい。
If the rule data stored in the
図8の例では、図10Aに示すように変換前の属性値「F」に対応付けて変換後の属性値「F1」及び確率「100」が格納される。 In the example of FIG. 8, as shown in FIG. 10A, the attribute value “F1” after conversion and the probability “100” are stored in association with the attribute value “F” before conversion.
一方、特定された属性値の出現頻度が基準値以上であれば(ステップS13:Noルート)、分布変換データ生成部104は、展開数(分割数とも言う)を算出する(ステップS17)。例えば、特定された属性値の出現頻度を、基準値を下回るまで「2」で割り算を行い、展開数=2N(Nは割り算の回数)というように算出するようにしても良い。また、特定された属性値の出現頻度を、基準値を下回るまで基準値で引き算してゆき、引き算の回数を展開数とするようにしてもよい。さらに、特定された属性値の出現頻度を基準値で割り算した場合の解(余りがある場合には、+1)を、展開数とするようにしてもよい。
On the other hand, if the appearance frequency of the identified attribute value is equal to or higher than the reference value (step S13: No route), the distribution conversion
図8の例で、変換前属性値「M」については、出現頻度「10」及び平均値「6.5」が得られているので、「2」で割り算する方法でも、基準値で引き算を行う方法でも、基準値で割り算する方法でも、展開数は「2」と算出される。 In the example of FIG. 8, the appearance frequency “10” and the average value “6.5” are obtained for the pre-conversion attribute value “M”. Therefore, even with the method of dividing by “2”, subtraction is performed with the reference value. The number of expansions is calculated to be “2” regardless of the method used or the method of dividing by the reference value.
そして、分布変換データ生成部104は、ルール格納部105に格納されているルールデータに従って算出された展開数に応じた個数の変換後属性値を生成し、当該変換後属性値を含むレコードを展開数だけ生成し、分布変換データ格納部106に格納する(ステップS19)。図8の例では、展開数が「2」であるので、変換後属性値「M1」「M2」が生成され、それらについてレコードが生成され、分布変換データ格納部106に格納する。さらに、分布変換データ生成部104は、生成したレコードに、変換確率を設定する(ステップS21)。変換確率は、「100」を展開数で除することで均一な値を設定するようにしても良い。図10Bに示すように、展開数が「2」であれば「50」が設定される。なお、変換確率は全て加算すると100になればよく、51と49といったように揺らぎを持たせるようにしても良い。不自然に均一な分布にならないようにするためである。
The distribution conversion
このように変換確率は「50」%であれば、属性値「M1」は出現頻度が「5」となり、属性値「M2」は出現頻度が「5」となり、属性値「F」は出現頻度が「3」である。そうすると、図10Cに示すように、属性値「M」に偏った分布が、是正されていることが分かる。すなわち、図10Cの左側に示すように、変換前で属性値「M」の出現頻度が突出しているが、図10Cの右側に示すように、変換後では、全ての属性値の出現頻度が、平均値を下回っており、出現頻度の差が少なくなっている。 Thus, when the conversion probability is “50”%, the attribute value “M1” has the appearance frequency “5”, the attribute value “M2” has the appearance frequency “5”, and the attribute value “F” has the appearance frequency. Is “3”. Then, as shown in FIG. 10C, it can be seen that the distribution biased toward the attribute value “M” is corrected. That is, as shown on the left side of FIG. 10C, the appearance frequency of the attribute value “M” is prominent before conversion, but as shown on the right side of FIG. 10C, the appearance frequency of all the attribute values is The average value is below, and the difference in appearance frequency is small.
その後、分布変換データ生成部104は、未処理の属性値が存在しているか判断する(ステップS23)。未処理の属性値が存在している場合にはステップS11に戻る。一方、未処理の属性値が存在していない場合には呼び出し元の処理に戻る。
Thereafter, the distribution conversion
このような処理を実施すれば、図10Bに示すような分布変換データが生成される。この分布変換データによって、特定の属性項目について属性値の出現頻度の分布を、秘匿化という目的において適切に変換することができるようになる。 By performing such processing, distribution conversion data as shown in FIG. 10B is generated. With this distribution conversion data, the distribution of the appearance frequency of attribute values for a specific attribute item can be appropriately converted for the purpose of concealment.
図6の処理の説明に戻って、変換処理部107及び暗号化処理部109は、変換処理を実施する(ステップS5)。変換処理については、図11乃至図13Bを用いて説明する。
Returning to the description of the processing in FIG. 6, the
まず、変換処理部107は、提供データ格納部101に格納されている提供データに含まれる複数のレコードのうち未処理のレコードを1つ特定する(図11:ステップS31)。そして、変換処理部107は、特定されたレコードにおける処理の対象である特定の属性項目の属性値から、分布変換データの該当部分を特定する(ステップS33)。図7に示すようなデータの最初のレコードにおける属性項目「性別」の属性値「M」の場合には、図10Bの分布変換データであれば、変換前の属性値「M」の行を特定する。
First, the
そして、変換処理部107は、分布変換データの該当部分に規定されている確率に応じて、特定されたレコードにおける特定の属性項目の属性値を、変換後属性値に変換し、処理後のレコードを変換済データ格納部108に格納する(ステップS35)。変換後属性値が複数でそれらの確率が均一の場合には、ラウンドロビンで順番に変換後属性値を採用するようにしても良い。また、乱数を発生させて、確率値に応じて変換後属性値をその都度選択するようにしても良い。
Then, the
例えば図7のような提供データの場合、図10Bの分布変換データに従えば、ステップS35を実施すると、例えば図12に示すようなデータが得られる。性別の属性値「M」に対しては「M1」と「M2」が均一に発生するように変換が行われる。また、性別の属性値「F」は「F1」に変換される。 For example, in the case of provided data as shown in FIG. 7, according to the distribution conversion data shown in FIG. 10B, when step S35 is performed, data as shown in FIG. 12 is obtained. The gender attribute value “M” is converted so that “M1” and “M2” are uniformly generated. The gender attribute value “F” is converted to “F1”.
その後、暗号化処理部109は、キー格納部110に格納されているキーkと所定のハッシュ関数Hとで、変換済データ格納部108に格納されているレコードにおける特定の属性項目の変換後属性値を暗号化して、処理後のレコードを暗号化データ格納部111に格納する(ステップS37)。例えば、変換後属性値が「M1」であればH(M1,k)の演算を実施する。図12のようなデータが得られた場合には、図13Aに模式的に示すような演算を実施して、図13Bに示すような暗号化データを生成する。図13Bからも分かるように、「M1」であれば「abc25432」が生成される。なお、「M1」が出現する全てのレコードについて「abc25432」が生成されるので、クロス集計を実施しても、「M1」について疾患有「1」のレコード数及び疾患無「0」のレコード数を計数することができる。但し、「M2」に対応する「awe34565」との関連は、暗号化データにおいては不明であるから、「abc25432」と「awe34565」とが同一視されることはない。
Thereafter, the
そして、変換処理部107は、未処理のレコードが存在するか判断する(ステップS39)。未処理のレコードが存在する場合にはステップS31に戻る。一方、未処理のレコードが存在しない場合には、呼び出し元の処理に戻る。
Then, the
このような処理を実施すれば、特定の属性項目において属性値の出現頻度の分布を、異なった分布に変換し、さらに秘匿化されたデータが生成できたことになる。 By performing such processing, the distribution of the appearance frequency of the attribute value in a specific attribute item is converted into a different distribution, and further concealed data can be generated.
図6の処理の説明に戻って、送信部112は、暗号化データ格納部111に格納されているデータを集計サーバ300に送信する(ステップS7)。
Returning to the description of the processing in FIG. 6, the
集計サーバ300における処理については、上で述べたように、暗号化されたデータを受信して、データ格納部320に格納し、要求に応じて又は自動的に所定の集計処理(例えばクロス集計)を実施する。
As for the processing in the totaling
例えば、図1Aのようなデータ(一部)の場合、性別「M」を「M1」乃至「M6」に展開し、性別「F」を「F1」に変換するという分布変換データが生成されたとする。そうすると、例えば図14Aに示すようなデータが得られる。さらに、図1Bのようなデータ(一部)の場合、性別「M」を「M1」に変換し、性別「F」を「F1」乃至「F5」に展開するという分布変換データが生成されたとする。そうすると、例えば図14Bに示すようなデータが得られる。さらに、図1Cのようなデータ(一部)の場合、性別「M」を「M1」乃至「M3」に展開し、性別「F」を「F1」乃至「F3」に展開するという分布変換データが生成されたとする。そうすると、例えば図14Cに示すようなデータが得られる。さらに、キーkとハッシュ関数Hとで暗号化を行うと、図14Aのデータは図15Aのようになり、図14Bのデータは図15Bのようになり、図14Cのデータは図15Cのようになる。図15A、図15B及び図15Cのデータが、集計サーバ300に送信され、データ受信部310によりデータ格納部320に格納されるものとする。
For example, in the case of data (partly) as shown in FIG. 1A, it is assumed that distribution conversion data is generated in which gender “M” is expanded from “M1” to “M6” and gender “F” is converted to “F1”. To do. Then, for example, data as shown in FIG. 14A is obtained. Further, in the case of data (partial) as shown in FIG. 1B, distribution conversion data is generated in which gender “M” is converted to “M1” and gender “F” is expanded to “F1” to “F5”. To do. Then, for example, data as shown in FIG. 14B is obtained. Further, in the case of data (partial) as shown in FIG. 1C, distribution conversion data in which gender “M” is expanded from “M1” to “M3” and gender “F” is expanded from “F1” to “F3”. Is generated. Then, for example, data as shown in FIG. 14C is obtained. Further, when encryption is performed using the key k and the hash function H, the data in FIG. 14A becomes as shown in FIG. 15A, the data in FIG. 14B becomes as in FIG. 15B, and the data in FIG. 14C becomes as shown in FIG. Become. 15A, 15B, and 15C are transmitted to the
その後、集計処理部330は、自動的に又は要求に応じて、データ格納部320に格納されているデータに対して例えば性別毎に疾患の発生状況を集計するクロス集計を実施するとする。そうすると、図16A乃至図16Dに示すような集計結果が得られる。図16Aの例では、各学部について、性別毎に疾患の属性値「0」の出現頻度及び属性値「1」の出現頻度を計数した結果を示している。また、図16Bの例では、各学部について、性別毎に疾患の属性値「1」の出現頻度を計数した結果を示している。さらに、図16Cの例では、学部に関係なく全学部について、性別毎に疾患の属性値「0」の出現頻度及び属性値「1」の出現頻度を計数した結果を示している。さらに、図16Dの例では、学部に関係なく全学部について、性別毎に属性値「1」の出現頻度を計数した結果を示している。
Thereafter, the
なお、上でも述べたように展開数を算出する場合の基準値については出現頻度の最小値を採用するようにしてもよい。例えば図8の場合には、最小値「3」を基準値として、属性値「M」については出現頻度「10」から上で述べたような方法で展開数を算出すると、図17に示すように展開数「4」が得られる。一方、属性値「F」については出現頻度「3」から上で述べたようなで展開数を算出すると、展開数「0」が得られる。このような展開数の場合には、属性値「M」については属性値「M1」乃至「M4」に展開し、属性値「F」を属性値「F1」に変換する。すなわち、図18に示すような分布変換データが生成される。なお、出現頻度「10」で変換確率「25」%の場合であっても、変換後属性値は整数回出現するので、例えば「M1」が3回、「M2」が2回、「M3」が3回、「M4」が2回出現する。 As described above, the minimum value of the appearance frequency may be adopted as the reference value for calculating the number of expansions. For example, in the case of FIG. 8, when the minimum value “3” is used as a reference value and the number of expansions is calculated for the attribute value “M” from the appearance frequency “10” by the method described above, as shown in FIG. The expansion number “4” is obtained. On the other hand, for the attribute value “F”, when the number of expansions is calculated as described above from the appearance frequency “3”, the number of expansions “0” is obtained. In the case of such an expansion number, the attribute value “M” is expanded into attribute values “M1” to “M4”, and the attribute value “F” is converted into the attribute value “F1”. That is, distribution conversion data as shown in FIG. 18 is generated. Even if the appearance frequency is “10” and the conversion probability is “25”%, the converted attribute value appears an integer number of times, so “M1” is three times, “M2” is two times, “M3”, for example. Appears three times and “M4” appears twice.
すなわち、図19に示すように、出現頻度の偏りが少なくなるように、出現頻度の分布が変換されている。すなわち、図19の左側のような分布から、図19の右側のように、出現頻度が基準値である最小値以下になるように、分布の変換が行われている。 That is, as shown in FIG. 19, the appearance frequency distribution is converted so that the appearance frequency is less biased. That is, the distribution is converted from the distribution shown on the left side of FIG. 19 so that the appearance frequency is equal to or lower than the minimum value that is the reference value, as shown on the right side of FIG.
なお、上で述べた例では、出現頻度がフラットになる方向で分布の変換を行う例を示したが、変換後の分布から変換前の分布が推定できなくなればよいので、例えば、変換前に正規分布でない分布が得られた場合に、正規分布になるように変換を行うようにしても良い。 In the example described above, an example is shown in which the distribution is converted in a direction in which the appearance frequency becomes flat. However, it is only necessary that the distribution before conversion cannot be estimated from the distribution after conversion. When a distribution that is not a normal distribution is obtained, conversion may be performed so that a normal distribution is obtained.
また、上で述べた例では処理対象の属性項目については、予め指定される例を示したが、属性値の出現頻度の分布から処理対象の属性項目を特定するようにしても良い。例えば、分布検出部102が、平均値だけではなく、標準偏差σを算出する。そして、分布変換データ生成部104が、平均値からプラスマイナス3σの範囲を超えるような出現頻度の属性値が存在するか確認し、このような属性値が存在すれば当該属性値の属性項目を処理の対象として選択する。
Further, in the example described above, an example in which an attribute item to be processed is specified in advance is shown, but the attribute item to be processed may be specified from the distribution of the appearance frequency of attribute values. For example, the
次に、集計結果を集計サーバ300から取得した際の処理について図20乃至図24を用いて説明する。集計要求処理部121は、例えば集計サーバ300に、例えばユーザからの要求に従って特定の集計処理を要求する集計要求を送信する。集計サーバ300の集計処理部330は、当該集計要求に従って集計処理を実施し、集計結果を、要求元の情報処理装置に返信する。
Next, processing when the totaling result is acquired from the totaling
そうすると、集計要求処理部121は、集計サーバ300から集計結果を受信し、集計結果格納部122に格納する(図20:ステップS41)。次に、属性値生成部124は、集計要求処理部121からの指示に応じて、分布データ格納部103又は属性値格納部125に格納されている、処理対象の特定の属性項目における未処理の属性値を1つ特定する(ステップS43)。また、属性値生成部124は、カウンタNを1に初期化する(ステップS45)。
Then, the aggregation
属性値生成部124は、ルール格納部105に格納されているルールデータから、特定された属性値からN番目の変換後属性値を決定する(ステップS47)。例えば、性別で、特定された属性値が「M」であれば、ルールデータに従えば「M1」が最初に決定される。
The attribute
その後、属性値生成部124は、N番目の変換後属性値に対して、キー格納部110に格納されているキーk及び所定のハッシュ関数Hから暗号化された変換後属性値を算出する(ステップS49)。例えば図21Aに示すように、属性値「M」について「M1」が生成されると、H(M1,k)という演算を実施して、暗号化された変換後属性値を算出する。属性値「F」についても同様に、図21Bに示すように、「F1」が生成されると、H(F1,k)という演算を実施して、暗号化された変換後属性値を算出する。属性値生成部124は、このような暗号化された変換後属性値を復元処理部123に出力する。
Thereafter, the attribute
復元処理部123は、集計結果格納部122に格納されている集計結果を、暗号化された変換後属性値で検索を実施する(ステップS51)。例えば、図16Cに示すような集計結果が取得された場合には、図16Cに示すような集計結果を、例えば「M1」に対応する「abc25432」で検索する。そうすると、1件目がヒットする。
The
そして、復元処理部123は、集計結果に暗号化された変換後属性値が存在するか判断し(ステップS53)、集計結果に暗号化された変換後属性値が存在する場合には、ステップS43で特定された属性値のカウントを集計値だけ増分する(ステップS55)。計算結果については、復元集計結果格納部126に格納する。例えば図16Cの最初のレコードが特定された場合には、属性値「M」について、疾患「0」のカウント値に「2」を加算し、疾患「1」のカウント値に「1」を加算する。ここでは初期的にはカウント値が「0」であるから、疾患「0」のカウント値は「2」になり、疾患「1」のカウント値は「1」となる。そして、属性値生成部124は、Nを1インクリメントして(ステップS57)ステップS47に戻る。
Then, the
例えば、属性値「M」の場合には、次に「M2」が変換後属性値として決定され、図21Aに示すように、暗号化された変換後属性値「awe34565」が算出される。そして、図16Cの集計結果を「awe34565」で検索する。そうすると、2行目のレコードが特定され、疾患「0」のカウント値に「2」を加算して「4」が得られ、疾患「1」のカウント値に「1」を加算して「2」が得られる。 For example, in the case of the attribute value “M”, “M2” is then determined as the converted attribute value, and the encrypted converted attribute value “away 34565” is calculated as shown in FIG. 21A. Then, the search result of FIG. 16C is searched with “away 34565”. Then, the record in the second row is specified, and “2” is added to the count value of the disease “0” to obtain “4”, and “1” is added to the count value of the disease “1” to obtain “2”. Is obtained.
一方、集計結果に暗号化された変換後属性値が存在していない場合には、端子Aを介して図22の処理に移行する。 On the other hand, if the converted attribute value encrypted in the aggregation result does not exist, the process proceeds to the process of FIG.
図22の処理の説明に移行して、属性値生成部124は、Nが、予め定められたNの最大値以上であるか判断する(ステップS59)。NがNの最大値以上でない場合には、属性値生成部124は、Nを1インクリメントして(ステップS61)、端子Bを介して図20のステップS47に戻る。一方、NがNの最大値以上である場合には、属性値生成部124は、分布データ格納部103又は属性値格納部125において未処理の属性値が存在するか判断する(ステップS63)。未処理の属性値が存在する場合には、端子Cを介して図20のステップS43に戻る。
Moving to the description of the processing in FIG. 22, the attribute
一方、未処理の属性値が存在しない場合には、例えば復元処理部123は、情報処理装置のユーザの端末などに、復元集計結果格納部126に格納されている復元集計結果を送信する(ステップS65)。
On the other hand, when there is no unprocessed attribute value, for example, the
このような処理を実施すれば、図16Cについては、図23に示すような結果が得られる。図23に示すように、属性項目「性別」の属性値「M」及び「F」について、疾患「0」の計数値及び疾患「1」の計数値が得られるようになる。同様に、図16Bについて処理を行えば、図24に示すような結果が得られる。図24の例では、学部毎に疾患「1」の計数値が、性別「M」及び「F」について計数された結果が得られるようになる。 When such processing is performed, the result shown in FIG. 23 is obtained for FIG. 16C. As shown in FIG. 23, for attribute values “M” and “F” of the attribute item “sex”, a count value of disease “0” and a count value of disease “1” are obtained. Similarly, when processing is performed on FIG. 16B, the result shown in FIG. 24 is obtained. In the example of FIG. 24, the result of counting the count value of the disease “1” for each faculty for the sexes “M” and “F” is obtained.
以上のような処理を実施すれば、集計サーバ300においては、暗号化もされているし、分布も変更されているので、元のデータを推定することは不可能であるが、集計結果については正しい結果を情報処理装置において復元することができる。よって、集計サーバ300にセンシティブな情報であっても登録しておき、クロス集計などの集計処理を実施させる。そして、情報処理装置においてクロス集計などの集計結果を復元して有効に活用することができるようになる。
If the processing as described above is performed, the
以上本技術の実施の形態を説明したが、本技術はこれらの実施の形態に限定されるわけではない。例えば、図5の機能ブロック図については、実際のプログラムモジュール構成は一致しない場合もある。また、処理フローについても、処理結果が変わらないかぎり、処理順番を入れ替えたり、並列実行するようにしても良い。例えば、ループを分割したり、ループを統合したりしても処理結果が変わらない場合には問題ない。例えば図20及び図22の処理フローにおいて、先に暗号化された変換後属性値を全て算出してから、集計結果の検索を実施するようにしても良い。同様に、図11の処理において、暗号化処理をループから外すようにしても良い。 Although the embodiments of the present technology have been described above, the present technology is not limited to these embodiments. For example, in the functional block diagram of FIG. 5, the actual program module configuration may not match. As for the processing flow, as long as the processing result does not change, the processing order may be changed or the processing flow may be executed in parallel. For example, there is no problem if the processing result does not change even if the loop is divided or the loops are integrated. For example, in the processing flow of FIG. 20 and FIG. 22, the calculation result may be searched after all the converted attribute values encrypted previously are calculated. Similarly, in the process of FIG. 11, the encryption process may be removed from the loop.
また、シリアルに番号を属性値に付加して変換後属性値を生成する場合には、ステップS59及びS61を設けないような処理フローであってもよい。 In addition, when a converted attribute value is generated by serially adding a number to the attribute value, the processing flow may be such that steps S59 and S61 are not provided.
また、分布変換データ格納部106に、暗号化された変換後属性値を登録して、変換前の属性値から直接暗号化された変換後属性値を抽出できるようにしてもよい。例えば図18のような分布変換データを、図25に示すように、暗号化された変換後属性値まで登録しておき、変換処理部107で直接暗号化された変換後属性値を、提供データ中の各レコードに割り当てるようにしても良い。
Alternatively, the encrypted attribute value after conversion may be registered in the distribution conversion
なお、上で述べた例では、全ての情報処理装置A乃至Cが、同一の属性項目について分布の変換を行うような場合を説明したが、場合によっては一部の情報処理装置のみが特定の属性項目について分布の変換を実施したり、しなかったりする場合もある。従って、復元処理部123は、集計結果格納部122に処理がなされなかったレコードが残っている場合には、そのレコードをそのまま復元集計処理結果格納部126に格納するようにする。
In the example described above, the case where all the information processing apparatuses A to C perform distribution conversion on the same attribute item has been described. However, in some cases, only some information processing apparatuses are specified. In some cases, distribution conversion may or may not be performed for attribute items. Therefore, when there is a record that has not been processed in the aggregation
また、全ての情報処理装置A乃至Cで特定の属性項目について同一の属性値セットが出現しない可能性もある。その場合には、分布データ格納部103をベースに属性値生成部124が処理を行うと、未知の属性値については暗号化された変換後属性値を生成できない。このような場合にも、集計結果格納部122に処理がなされなかったレコードが残るので、そのレコードをそのまま復元集計処理結果格納部126に格納するようにする。但し、属性値格納部125に、情報処理装置A乃至Cで用いられる可能性のある全ての属性値を格納しておき、このデータを属性値生成部124が用いることにすれば、このような問題は生じない。
In addition, the same attribute value set may not appear for a specific attribute item in all the information processing apparatuses A to C. In this case, if the attribute
なお、上で述べた情報処理装置及び集計サーバ300は、コンピュータ装置であって、図26に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
The information processing apparatus and the
以上述べた本実施の形態をまとめると、以下のようになる。 The above-described embodiment can be summarized as follows.
本実施の形態の第1の側面に係る変換処理方法は、(A)第1データ格納部に格納されており且つ各々複数の属性項目について属性値を有する複数のレコードについて、複数の属性項目のうち特定の属性項目について出現する属性値の出現頻度についての第1の分布を検出する第1処理と、(B)第1の分布を当該第1の分布とは異なる第2の分布となるように、属性値のうち少なくとも一部の属性値の各々を、予め定められた第1のルールに従って特定される複数の第2の属性値のいずれかに変換する第2処理とを含む。 In the conversion processing method according to the first aspect of the present embodiment, (A) a plurality of attribute items for a plurality of records stored in the first data storage unit and having attribute values for a plurality of attribute items, respectively. Of these, (B) a first process for detecting a first distribution of the appearance frequency of an attribute value that appears for a specific attribute item, and (B) the first distribution to be a second distribution different from the first distribution. And a second process for converting each of at least some of the attribute values into one of a plurality of second attribute values specified according to a predetermined first rule.
このようにすれば、処理後のデータを見ても分布から元のデータを推定することが難しくなるので、データ漏洩を防止又は抑制することができる。 In this way, it is difficult to estimate the original data from the distribution even if the processed data is viewed, so that data leakage can be prevented or suppressed.
また、上で述べた第2処理は、(b1)属性値の出現頻度についての第1の分布において所定基準以上の偏りを有する属性値を予め定められた第2のルールに従って複数の第2属性値に展開し、当該所定基準以上の偏りを有する属性値と複数の第2属性値との対応関係を第2データ格納部に格納する第3処理と、(b2)第2データ格納部に格納されている対応関係に従って、複数のレコードにおける特定の属性項目についての属性値を、複数の第2属性値のうちのいずれかの第2属性値に変換する第4処理とを含むようにしてもよい。このように出現頻度に偏りを有する属性値を複数の属性値のいずれかに変換すれば、出現頻度の偏りを是正して、分布の特徴を消すことができるようになる。すなわち、分布からのデータ漏洩を防止又は抑制できるようになる。 In the second process described above, (b1) a plurality of second attributes according to a second rule in which attribute values having a bias greater than or equal to a predetermined reference in the first distribution of attribute value appearance frequencies are determined. A third process that expands the value and stores a correspondence relationship between the attribute value having a bias equal to or greater than the predetermined reference and the plurality of second attribute values in the second data storage unit; and (b2) stores in the second data storage unit According to the correspondence relationship, a fourth process for converting an attribute value for a specific attribute item in a plurality of records into a second attribute value of any of the plurality of second attribute values may be included. If an attribute value having a bias in appearance frequency is converted into any one of a plurality of attribute values in this way, the bias in the appearance frequency can be corrected and the distribution feature can be eliminated. That is, data leakage from the distribution can be prevented or suppressed.
また、上で述べた第2処理は、複数のレコードにおける特定の属性項目についての第2属性値を暗号化する第5処理をさらに含むようにしてもよい。上記対応関係において暗号化後の第2属性値も対応付けられている場合もあれば、このようにレコードについて暗号化処理を実施するようにしても良い。暗号化については、キーとハッシュ関数であってもよいし、他の暗号化手法を用いても良い。 The second process described above may further include a fifth process for encrypting the second attribute value for a specific attribute item in the plurality of records. In some cases, the second attribute value after encryption is also associated with the correspondence, and the encryption process may be performed on the record in this way. As for encryption, a key and a hash function may be used, or another encryption method may be used.
さらに、上で述べた第3処理が、特定の属性項目について出現する属性値のうち出現頻度が基準値を上回る属性値について、当該属性値の出現頻度及び基準値に基づき展開数を算出し、第2のルールに従って出現頻度が基準値を上回る属性値について展開数の第2属性値を生成するようにしてもよい。例えば第2属性値が均一に出現するように分布の変換を実施する場合には、出現頻度が基準値を下回るよう展開数を算出するようにしても良い。このようにすれば、出現頻度が突出した属性値を、見かけ上なくすことができるようになる。 Furthermore, the third process described above calculates the number of expansions based on the appearance frequency of the attribute value and the reference value for the attribute value whose appearance frequency exceeds the reference value among the attribute values that appear for the specific attribute item, According to the second rule, the second attribute value of the expansion number may be generated for the attribute value whose appearance frequency exceeds the reference value. For example, when the distribution is converted so that the second attribute value appears uniformly, the number of expansions may be calculated so that the appearance frequency is lower than the reference value. In this way, it is possible to apparently eliminate the attribute value with a prominent appearance frequency.
また、上で述べた第3処理が、展開数に応じて第2の属性値の各々について出現確率を算出し、対応関係に関連付けて第2データ格納部に格納する処理を含むようにしてもよい。その場合、上で述べた第4処理において、対応関係及び出現確率に従って、複数のレコードにおける特定の属性項目についての属性値を、複数の第2属性値のうちのいずれかの第2属性値に変換するようにしてもよい。出現確率を設定することで、柔軟に第2属性値を選択できるようになる。例えば、出現頻度が自然な形に揺らぐように出現確率を振れさせることで、分布の変換を第三者からわかりにくくすることができるようになる。 Further, the third process described above may include a process of calculating an appearance probability for each of the second attribute values in accordance with the number of expansions and storing the probability of association in the second data storage unit. In that case, in the fourth process described above, the attribute value for the specific attribute item in the plurality of records is changed to any one of the plurality of second attribute values according to the correspondence and the appearance probability. You may make it convert. By setting the appearance probability, the second attribute value can be selected flexibly. For example, by changing the appearance probability so that the appearance frequency fluctuates in a natural manner, the conversion of the distribution can be made difficult to understand by a third party.
さらに、本実施の形態の第1の側面において、第1の処理を行った後の複数のレコードを、集計処理を行うコンピュータに送信する処理をさらに含むようにしても良い。このように、集計処理を行うコンピュータでは様々な装置から得られたデータに対して総合した集計処理を実施することができる。 Furthermore, in the first aspect of the present embodiment, a process of transmitting a plurality of records after the first process to the computer that performs the aggregation process may be further included. As described above, the computer that performs the totaling process can perform the totaling process on the data obtained from various devices.
本実施の形態の第2の側面に係る復元処理方法は、(A)集計対象の複数のレコードにおける第1の属性項目について出現する第1属性値から、予め定められたルールに従って複数の第2属性値を生成する第1処理と、(B)第1の属性項目について出現した第3属性値の各々について第2の属性項目の属性値毎の計数値又は属性値の合計値を含む集計結果を格納する第1データ格納部において、複数の第2属性値の各々について、当該第2の属性値と一致する第3属性値が存在するか判断し、存在すれば当該第3属性値に対応付けられている第2の属性項目の属性値毎の計数値又は属性値の合計値を第1データ格納部から読み出し、当該第2の属性項目の属性値毎に累計し又は当該第2の属性項目の属性値を累計し、累計結果を第2の属性値に対応付けて第2データ格納部に格納する第2処理とを含む。このようにすれば、特定の属性項目の属性値が複数の属性値に分けられている場合においても、その結果を集約することで、元々の集計結果を復元できるようになる。 The restoration processing method according to the second aspect of the present embodiment includes: (A) a plurality of second attributes according to a predetermined rule from a first attribute value that appears for a first attribute item in a plurality of records to be counted. A first result for generating an attribute value; and (B) a total result including a count value for each attribute value of the second attribute item or a total value of the attribute values for each of the third attribute values that appear for the first attribute item. In each of the plurality of second attribute values, it is determined whether there is a third attribute value that matches the second attribute value, and if it exists, it corresponds to the third attribute value The count value for each attribute value of the attached second attribute item or the total value of the attribute values is read from the first data storage unit, and accumulated for each attribute value of the second attribute item, or the second attribute The attribute value of the item is accumulated and the accumulated result is the second attribute. And a second process of storing the second data storage unit in association with. In this way, even when the attribute value of a specific attribute item is divided into a plurality of attribute values, the original aggregation result can be restored by aggregating the results.
なお、上で述べた第1処理が、予め定められた第2のルールに従って、第1属性値を複数の第4属性値に展開する処理と、複数の第4属性値の各々を暗号化することで、複数の第2属性値を生成する処理とを含むようにしてもよい。 The first process described above is a process of expanding the first attribute value into a plurality of fourth attribute values according to a predetermined second rule, and encrypts each of the plurality of fourth attribute values. Thus, a process of generating a plurality of second attribute values may be included.
なお、上で述べたような処理をコンピュータに実施させるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブル・ディスク、CD−ROMなどの光ディスク、光磁気ディスク、半導体メモリ(例えばROM)、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。なお、処理途中のデータについては、RAM等の記憶装置に一時保管される。 It is possible to create a program for causing a computer to carry out the processing described above, such as a flexible disk, an optical disk such as a CD-ROM, a magneto-optical disk, and a semiconductor memory (for example, ROM). Or a computer-readable storage medium such as a hard disk or a storage device. Note that data being processed is temporarily stored in a storage device such as a RAM.
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。 The following supplementary notes are further disclosed with respect to the embodiments including the above examples.
(付記1)
第1データ格納部に格納されており且つ各々複数の属性項目について属性値を有する複数のレコードについて、前記複数の属性項目のうち特定の属性項目について出現する属性値の出現頻度についての第1の分布を検出する第1処理と、
前記第1の分布を当該第1の分布とは異なる第2の分布となるように、前記属性値のうち少なくとも一部の属性値の各々を、予め定められた第1のルールに従って特定される複数の第2の属性値のいずれかに変換する第2処理と、
を、コンピュータに実行させるための変換処理プログラム。
(Appendix 1)
A plurality of records stored in the first data storage unit and having attribute values for each of the plurality of attribute items, the first of the appearance frequency of the attribute value appearing for a specific attribute item among the plurality of attribute items A first process for detecting a distribution;
Each of at least some of the attribute values is specified according to a predetermined first rule so that the first distribution becomes a second distribution different from the first distribution. A second process for converting into any of a plurality of second attribute values;
Is a conversion processing program for causing a computer to execute.
(付記2)
前記第2処理は、
前記属性値の出現頻度についての第1の分布において所定基準以上の偏りを有する属性値を予め定められた第2のルールに従って複数の第2属性値に展開し、当該所定基準以上の偏りを有する属性値と前記複数の第2属性値との対応関係を第2データ格納部に格納する第3処理と、
前記第2データ格納部に格納されている前記対応関係に従って、前記複数のレコードにおける前記特定の属性項目についての属性値を、前記複数の第2属性値のうちのいずれかの第2属性値に変換する第4処理と、
を含む付記1記載の変換処理プログラム。
(Appendix 2)
The second process includes
An attribute value having a bias greater than or equal to a predetermined reference in the first distribution of the appearance frequency of the attribute value is developed into a plurality of second attribute values according to a predetermined second rule, and has a bias greater than or equal to the predetermined reference A third process for storing a correspondence relationship between an attribute value and the plurality of second attribute values in a second data storage unit;
In accordance with the correspondence relationship stored in the second data storage unit, an attribute value for the specific attribute item in the plurality of records is changed to any one of the plurality of second attribute values. A fourth process to convert;
A conversion processing program according to
(付記3)
前記第2処理は、
前記複数のレコードにおける前記特定の属性項目についての前記第2属性値を暗号化する第5処理
をさらに含む付記2記載の変換処理プログラム。
(Appendix 3)
The second process includes
The conversion processing program according to
(付記4)
前記第3処理が、
前記特定の属性項目について出現する属性値のうち出現頻度が基準値を上回る属性値について、当該属性値の出現頻度及び前記基準値に基づき展開数を算出し、
前記第2のルールに従って前記出現頻度が基準値を上回る属性値について前記展開数の第2属性値を生成する
処理を含む付記2又は3記載の変換処理プログラム。
(Appendix 4)
The third process includes
Of the attribute values that appear for the specific attribute item, for the attribute value whose appearance frequency exceeds the reference value, calculate the number of expansions based on the appearance frequency of the attribute value and the reference value,
The conversion processing program according to
(付記5)
前記第3処理が、
前記展開数に応じて前記第2の属性値の各々について出現確率を算出し、前記対応関係に関連付けて前記第2データ格納部に格納する処理
を含み、
前記第4処理において、前記対応関係及び出現確率に従って、前記複数のレコードにおける前記特定の属性項目についての属性値を、前記複数の第2属性値のうちのいずれかの第2属性値に変換する
付記4記載の変換処理プログラム。
(Appendix 5)
The third process includes
A process of calculating an appearance probability for each of the second attribute values according to the number of expansions, and storing it in the second data storage unit in association with the correspondence relationship;
In the fourth process, an attribute value for the specific attribute item in the plurality of records is converted into a second attribute value of any of the plurality of second attribute values according to the correspondence relationship and the appearance probability. The conversion processing program according to
(付記6)
前記第1の処理を行った後の前記複数のレコードを、集計処理を行うコンピュータに送信する処理
をさらに前記コンピュータに実行させるための付記1乃至5のいずれか1つ記載の変換処理プログラム。
(Appendix 6)
The conversion processing program according to any one of
(付記7)
集計対象の複数のレコードにおける第1の属性項目について出現する第1属性値から、予め定められたルールに従って複数の第2属性値を生成する第1処理と、
前記第1の属性項目について出現した第3属性値の各々について第2の属性項目の属性値毎の計数値又は属性値の合計値を含む集計結果を格納する第1データ格納部において、前記複数の第2属性値の各々について、当該第2の属性値と一致する第3属性値が存在するか判断し、存在すれば当該第3属性値に対応付けられている前記第2の属性項目の属性値毎の計数値又は属性値の合計値を前記第1データ格納部から読み出し、当該第2の属性項目の属性値毎に累計し又は当該第2の属性項目の属性値を累計し、累計結果を前記第2の属性値に対応付けて第2データ格納部に格納する第2処理と、
を、コンピュータに実行させるための復元処理プログラム。
(Appendix 7)
A first process for generating a plurality of second attribute values according to a predetermined rule from a first attribute value that appears for a first attribute item in a plurality of records to be counted;
In the first data storage unit for storing a count result for each attribute value of the second attribute item or a total result of the attribute values for each of the third attribute values that appear for the first attribute item, the plurality of For each of the second attribute values, it is determined whether there is a third attribute value that matches the second attribute value. If there is, the second attribute value associated with the third attribute value is determined. The count value for each attribute value or the total value of the attribute values is read from the first data storage unit, accumulated for each attribute value of the second attribute item, or the attribute value of the second attribute item is accumulated, and accumulated A second process for storing the result in the second data storage unit in association with the second attribute value;
Is a restoration processing program for causing a computer to execute.
(付記8)
前記第1処理が、
予め定められた第2のルールに従って、前記第1属性値を複数の第4属性値に展開する処理と、
前記複数の第4属性値の各々を暗号化することで、前記複数の第2属性値を生成する処理と、
を含む付記7記載の復元処理プログラム。
(Appendix 8)
The first process includes
A process of expanding the first attribute value into a plurality of fourth attribute values according to a predetermined second rule;
A process of generating the plurality of second attribute values by encrypting each of the plurality of fourth attribute values;
The restoration processing program according to
(付記9)
第1データ格納部に格納されており且つ各々複数の属性項目について属性値を有する複数のレコードについて、前記複数の属性項目のうち特定の属性項目について出現する属性値の出現頻度についての第1の分布を検出する第1処理と、
前記第1の分布を当該第1の分布とは異なる第2の分布となるように、前記属性値のうち少なくとも一部の属性値の各々を、予め定められた第1のルールに従って特定される複数の第2の属性値のいずれかに変換する第2処理と、
を、コンピュータが実行する変換処理方法。
(Appendix 9)
A plurality of records stored in the first data storage unit and having attribute values for each of the plurality of attribute items, the first of the appearance frequency of the attribute value appearing for a specific attribute item among the plurality of attribute items A first process for detecting a distribution;
Each of at least some of the attribute values is specified according to a predetermined first rule so that the first distribution becomes a second distribution different from the first distribution. A second process for converting into any of a plurality of second attribute values;
A conversion processing method executed by a computer.
(付記10)
集計対象の複数のレコードにおける第1の属性項目について出現する第1属性値から、予め定められたルールに従って複数の第2属性値を生成する第1処理と、
前記第1の属性項目について出現した第3属性値の各々について第2の属性項目の属性値毎の計数値又は属性値の合計値を含む集計結果を格納する第1データ格納部において、前記複数の第2属性値の各々について、当該第2の属性値と一致する第3属性値が存在するか判断し、存在すれば当該第3属性値に対応付けられている前記第2の属性項目の属性値毎の計数値又は属性値の合計値を前記第1データ格納部から読み出し、当該第2の属性項目の属性値毎に累計し又は当該第2の属性項目の属性値を累計し、累計結果を前記第2の属性値に対応付けて第2データ格納部に格納する第2処理と、
を、コンピュータが実行する復元処理方法。
(Appendix 10)
A first process for generating a plurality of second attribute values according to a predetermined rule from a first attribute value that appears for a first attribute item in a plurality of records to be counted;
In the first data storage unit for storing a count result for each attribute value of the second attribute item or a total result of the attribute values for each of the third attribute values that appear for the first attribute item, the plurality of For each of the second attribute values, it is determined whether there is a third attribute value that matches the second attribute value. If there is, the second attribute value associated with the third attribute value is determined. The count value for each attribute value or the total value of the attribute values is read from the first data storage unit, accumulated for each attribute value of the second attribute item, or the attribute value of the second attribute item is accumulated, and accumulated A second process for storing the result in the second data storage unit in association with the second attribute value;
A restoration processing method executed by the computer.
(付記11)
第1データ格納部に格納されており且つ各々複数の属性項目について属性値を有する複数のレコードについて、前記複数の属性項目のうち特定の属性項目について出現する属性値の出現頻度についての第1の分布を検出する分布検出部と、
前記第1の分布を当該第1の分布とは異なる第2の分布となるように、前記属性値のうち少なくとも一部の属性値の各々を、予め定められた第1のルールに従って特定される複数の第2の属性値のいずれかに変換する変換処理部と、
を有する情報処理装置。
(Appendix 11)
A plurality of records stored in the first data storage unit and having attribute values for each of the plurality of attribute items, the first of the appearance frequency of the attribute value appearing for a specific attribute item among the plurality of attribute items A distribution detector for detecting the distribution;
Each of at least some of the attribute values is specified according to a predetermined first rule so that the first distribution becomes a second distribution different from the first distribution. A conversion processing unit for converting into any of a plurality of second attribute values;
An information processing apparatus.
(付記12)
集計対象の複数のレコードにおける第1の属性項目について出現する第1属性値から、予め定められたルールに従って複数の第2属性値を生成する属性値生成部と、
前記第1の属性項目について出現した第3属性値の各々について第2の属性項目の属性値毎の計数値又は属性値の合計値を含む集計結果を格納する第1データ格納部において、前記複数の第2属性値の各々について、当該第2の属性値と一致する第3属性値が存在するか判断し、存在すれば当該第3属性値に対応付けられている前記第2の属性項目の属性値毎の計数値又は属性値の合計値を前記第1データ格納部から読み出し、当該第2の属性項目の属性値毎に累計し又は当該第2の属性項目の属性値を累計し、累計結果を前記第2の属性値に対応付けて第2データ格納部に格納する復元処理部と、
を有する情報処理装置。
(Appendix 12)
An attribute value generation unit that generates a plurality of second attribute values according to a predetermined rule from a first attribute value that appears for a first attribute item in a plurality of records to be counted;
In the first data storage unit for storing a count result for each attribute value of the second attribute item or a total result of the attribute values for each of the third attribute values that appear for the first attribute item, the plurality of For each of the second attribute values, it is determined whether there is a third attribute value that matches the second attribute value. If there is, the second attribute value associated with the third attribute value is determined. The count value for each attribute value or the total value of the attribute values is read from the first data storage unit, accumulated for each attribute value of the second attribute item, or the attribute value of the second attribute item is accumulated, and accumulated A restoration processing unit that stores a result in the second data storage unit in association with the second attribute value;
An information processing apparatus.
101 提供データ格納部
102 分布検出部
103 分布データ格納部
104 分布変換データ生成部
105 ルール格納部
106 分布変換データ格納部
107 変換処理部
108 変換済データ格納部
109 暗号化処理部
110 キー格納部
111 暗号化データ格納部
112 送信部
121 集計要求処理部
122 集計結果格納部
123 復元処理部
124 属性値生成部
125 属性値格納部
126 復元集計結果格納部
101 Provided
Claims (12)
前記第1の分布を当該第1の分布とは異なる第2の分布となるように、前記属性値のうち少なくとも一部の属性値の各々を、予め定められた第1のルールに従って特定される複数の第2の属性値のいずれかに変換する第2処理と、
を、コンピュータに実行させるための変換処理プログラム。 A plurality of records stored in the first data storage unit and having attribute values for each of the plurality of attribute items, the first of the appearance frequency of the attribute value appearing for a specific attribute item among the plurality of attribute items A first process for detecting a distribution;
Each of at least some of the attribute values is specified according to a predetermined first rule so that the first distribution becomes a second distribution different from the first distribution. A second process for converting into any of a plurality of second attribute values;
Is a conversion processing program for causing a computer to execute.
前記属性値の出現頻度についての第1の分布において所定基準以上の偏りを有する属性値を予め定められた第2のルールに従って複数の第2属性値に展開し、当該所定基準以上の偏りを有する属性値と前記複数の第2属性値との対応関係を第2データ格納部に格納する第3処理と、
前記第2データ格納部に格納されている前記対応関係に従って、前記複数のレコードにおける前記特定の属性項目についての属性値を、前記複数の第2属性値のうちのいずれかの第2属性値に変換する第4処理と、
を含む請求項1記載の変換処理プログラム。 The second process includes
An attribute value having a bias greater than or equal to a predetermined reference in the first distribution of the appearance frequency of the attribute value is developed into a plurality of second attribute values according to a predetermined second rule, and has a bias greater than or equal to the predetermined reference A third process for storing a correspondence relationship between an attribute value and the plurality of second attribute values in a second data storage unit;
In accordance with the correspondence relationship stored in the second data storage unit, an attribute value for the specific attribute item in the plurality of records is changed to any one of the plurality of second attribute values. A fourth process to convert;
The conversion processing program according to claim 1 including:
前記複数のレコードにおける前記特定の属性項目についての前記第2属性値を暗号化する第5処理
をさらに含む請求項2記載の変換処理プログラム。 The second process includes
The conversion processing program according to claim 2, further comprising: a fifth process for encrypting the second attribute value for the specific attribute item in the plurality of records.
前記特定の属性項目について出現する属性値のうち出現頻度が基準値を上回る属性値について、当該属性値の出現頻度及び前記基準値に基づき展開数を算出し、
前記第2のルールに従って前記出現頻度が基準値を上回る属性値について前記展開数の第2属性値を生成する
処理を含む請求項2又は3記載の変換処理プログラム。 The third process includes
Of the attribute values that appear for the specific attribute item, for the attribute value whose appearance frequency exceeds the reference value, calculate the number of expansions based on the appearance frequency of the attribute value and the reference value,
4. The conversion processing program according to claim 2, further comprising: generating a second attribute value of the number of expansions for an attribute value whose appearance frequency exceeds a reference value according to the second rule. 5.
前記展開数に応じて前記第2の属性値の各々について出現確率を算出し、前記対応関係に関連付けて前記第2データ格納部に格納する処理
を含み、
前記第4処理において、前記対応関係及び出現確率に従って、前記複数のレコードにおける前記特定の属性項目についての属性値を、前記複数の第2属性値のうちのいずれかの第2属性値に変換する
請求項4記載の変換処理プログラム。 The third process includes
A process of calculating an appearance probability for each of the second attribute values according to the number of expansions, and storing it in the second data storage unit in association with the correspondence relationship;
In the fourth process, an attribute value for the specific attribute item in the plurality of records is converted into a second attribute value of any of the plurality of second attribute values according to the correspondence relationship and the appearance probability. The conversion processing program according to claim 4.
をさらに前記コンピュータに実行させるための請求項1乃至5のいずれか1つ記載の変換処理プログラム。 The conversion processing program according to any one of claims 1 to 5, further causing the computer to execute a process of transmitting the plurality of records after the first process to a computer that performs an aggregation process.
前記第1の属性項目について出現した第3属性値の各々について第2の属性項目の属性値毎の計数値又は属性値の合計値を含む集計結果を格納する第1データ格納部において、前記複数の第2属性値の各々について、当該第2の属性値と一致する第3属性値が存在するか判断し、存在すれば当該第3属性値に対応付けられている前記第2の属性項目の属性値毎の計数値又は属性値の合計値を前記第1データ格納部から読み出し、当該第2の属性項目の属性値毎に累計し又は当該第2の属性項目の属性値を累計し、累計結果を前記第2の属性値に対応付けて第2データ格納部に格納する第2処理と、
を、コンピュータに実行させるための復元処理プログラム。 A first process for generating a plurality of second attribute values according to a predetermined rule from a first attribute value that appears for a first attribute item in a plurality of records to be counted;
In the first data storage unit for storing a count result for each attribute value of the second attribute item or a total result of the attribute values for each of the third attribute values that appear for the first attribute item, the plurality of For each of the second attribute values, it is determined whether there is a third attribute value that matches the second attribute value. If there is, the second attribute value associated with the third attribute value is determined. The count value for each attribute value or the total value of the attribute values is read from the first data storage unit, accumulated for each attribute value of the second attribute item, or the attribute value of the second attribute item is accumulated, and accumulated A second process for storing the result in the second data storage unit in association with the second attribute value;
Is a restoration processing program for causing a computer to execute.
予め定められた第2のルールに従って、前記第1属性値を複数の第4属性値に展開する処理と、
前記複数の第4属性値の各々を暗号化することで、前記複数の第2属性値を生成する処理と、
を含む請求項7記載の復元処理プログラム。 The first process includes
A process of expanding the first attribute value into a plurality of fourth attribute values according to a predetermined second rule;
A process of generating the plurality of second attribute values by encrypting each of the plurality of fourth attribute values;
The restoration processing program according to claim 7 including:
前記第1の分布を当該第1の分布とは異なる第2の分布となるように、前記属性値のうち少なくとも一部の属性値の各々を、予め定められた第1のルールに従って特定される複数の第2の属性値のいずれかに変換する第2処理と、
を、コンピュータが実行する変換処理方法。 A plurality of records stored in the first data storage unit and having attribute values for each of the plurality of attribute items, the first of the appearance frequency of the attribute value appearing for a specific attribute item among the plurality of attribute items A first process for detecting a distribution;
Each of at least some of the attribute values is specified according to a predetermined first rule so that the first distribution becomes a second distribution different from the first distribution. A second process for converting into any of a plurality of second attribute values;
A conversion processing method executed by a computer.
前記第1の属性項目について出現した第3属性値の各々について第2の属性項目の属性値毎の計数値又は属性値の合計値を含む集計結果を格納する第1データ格納部において、前記複数の第2属性値の各々について、当該第2の属性値と一致する第3属性値が存在するか判断し、存在すれば当該第3属性値に対応付けられている前記第2の属性項目の属性値毎の計数値又は属性値の合計値を前記第1データ格納部から読み出し、当該第2の属性項目の属性値毎に累計し又は当該第2の属性項目の属性値を累計し、累計結果を前記第2の属性値に対応付けて第2データ格納部に格納する第2処理と、
を、コンピュータが実行する復元処理方法。 A first process for generating a plurality of second attribute values according to a predetermined rule from a first attribute value that appears for a first attribute item in a plurality of records to be counted;
In the first data storage unit for storing a count result for each attribute value of the second attribute item or a total result of the attribute values for each of the third attribute values that appear for the first attribute item, the plurality of For each of the second attribute values, it is determined whether there is a third attribute value that matches the second attribute value. If there is, the second attribute value associated with the third attribute value is determined. The count value for each attribute value or the total value of the attribute values is read from the first data storage unit, accumulated for each attribute value of the second attribute item, or the attribute value of the second attribute item is accumulated, and accumulated A second process for storing the result in the second data storage unit in association with the second attribute value;
A restoration processing method executed by the computer.
前記第1の分布を当該第1の分布とは異なる第2の分布となるように、前記属性値のうち少なくとも一部の属性値の各々を、予め定められた第1のルールに従って特定される複数の第2の属性値のいずれかに変換する変換処理部と、
を有する情報処理装置。 A plurality of records stored in the first data storage unit and having attribute values for each of the plurality of attribute items, the first of the appearance frequency of the attribute value appearing for a specific attribute item among the plurality of attribute items A distribution detector for detecting the distribution;
Each of at least some of the attribute values is specified according to a predetermined first rule so that the first distribution becomes a second distribution different from the first distribution. A conversion processing unit for converting into any of a plurality of second attribute values;
An information processing apparatus.
前記第1の属性項目について出現した第3属性値の各々について第2の属性項目の属性値毎の計数値又は属性値の合計値を含む集計結果を格納する第1データ格納部において、前記複数の第2属性値の各々について、当該第2の属性値と一致する第3属性値が存在するか判断し、存在すれば当該第3属性値に対応付けられている前記第2の属性項目の属性値毎の計数値又は属性値の合計値を前記第1データ格納部から読み出し、当該第2の属性項目の属性値毎に累計し又は当該第2の属性項目の属性値を累計し、累計結果を前記第2の属性値に対応付けて第2データ格納部に格納する復元処理部と、
を有する情報処理装置。 An attribute value generation unit that generates a plurality of second attribute values according to a predetermined rule from a first attribute value that appears for a first attribute item in a plurality of records to be counted;
In the first data storage unit for storing a count result for each attribute value of the second attribute item or a total result of the attribute values for each of the third attribute values that appear for the first attribute item, the plurality of For each of the second attribute values, it is determined whether there is a third attribute value that matches the second attribute value. If there is, the second attribute value associated with the third attribute value is determined. The count value for each attribute value or the total value of the attribute values is read from the first data storage unit, accumulated for each attribute value of the second attribute item, or the attribute value of the second attribute item is accumulated, and accumulated A restoration processing unit that stores a result in the second data storage unit in association with the second attribute value;
An information processing apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011140070A JP5655718B2 (en) | 2011-06-24 | 2011-06-24 | Conversion processing method, apparatus and program, restoration processing method, apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011140070A JP5655718B2 (en) | 2011-06-24 | 2011-06-24 | Conversion processing method, apparatus and program, restoration processing method, apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013008175A true JP2013008175A (en) | 2013-01-10 |
JP5655718B2 JP5655718B2 (en) | 2015-01-21 |
Family
ID=47675481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011140070A Expired - Fee Related JP5655718B2 (en) | 2011-06-24 | 2011-06-24 | Conversion processing method, apparatus and program, restoration processing method, apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5655718B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014192707A (en) * | 2013-03-27 | 2014-10-06 | International Business Maschines Corporation | Name identification system for name identification of anonymous data, method thereof and computer program |
JP2016157454A (en) * | 2016-03-29 | 2016-09-01 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Computer-assisted name identification system for identifying name of anonymization data, and method computer program thereof |
CN110569666A (en) * | 2019-09-03 | 2019-12-13 | 深圳前海微众银行股份有限公司 | data statistics method and device based on block chain |
JP2020109592A (en) * | 2019-01-07 | 2020-07-16 | 株式会社東芝 | Information processing system, information processing device, information processing method and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005301978A (en) * | 2004-03-19 | 2005-10-27 | Hitachi Ltd | Name sorting control method |
JP2008109308A (en) * | 2006-10-24 | 2008-05-08 | Nippon Telegr & Teleph Corp <Ntt> | Cross totaling method and device for keeping individual information secret, and program |
JP2009087160A (en) * | 2007-10-01 | 2009-04-23 | Fuji Xerox Co Ltd | Logging system, and encrypted log generating device and program |
-
2011
- 2011-06-24 JP JP2011140070A patent/JP5655718B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005301978A (en) * | 2004-03-19 | 2005-10-27 | Hitachi Ltd | Name sorting control method |
JP2008109308A (en) * | 2006-10-24 | 2008-05-08 | Nippon Telegr & Teleph Corp <Ntt> | Cross totaling method and device for keeping individual information secret, and program |
JP2009087160A (en) * | 2007-10-01 | 2009-04-23 | Fuji Xerox Co Ltd | Logging system, and encrypted log generating device and program |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014192707A (en) * | 2013-03-27 | 2014-10-06 | International Business Maschines Corporation | Name identification system for name identification of anonymous data, method thereof and computer program |
US9497170B2 (en) | 2013-03-27 | 2016-11-15 | International Business Machines Corporation | Computer assisted name-based aggregation system for identifying names of anonymized data |
JP2016157454A (en) * | 2016-03-29 | 2016-09-01 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Computer-assisted name identification system for identifying name of anonymization data, and method computer program thereof |
JP2020109592A (en) * | 2019-01-07 | 2020-07-16 | 株式会社東芝 | Information processing system, information processing device, information processing method and program |
CN110569666A (en) * | 2019-09-03 | 2019-12-13 | 深圳前海微众银行股份有限公司 | data statistics method and device based on block chain |
CN110569666B (en) * | 2019-09-03 | 2023-09-08 | 深圳前海微众银行股份有限公司 | Block chain-based data statistics method and device |
Also Published As
Publication number | Publication date |
---|---|
JP5655718B2 (en) | 2015-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103384980B (en) | The search method of searching system, searching system, information processor and corresponding keyword managing device | |
US7822206B2 (en) | Systems and methods for management and auto-generation of encryption keys | |
JP6180177B2 (en) | Encrypted data inquiry method and system capable of protecting privacy | |
US20200357085A1 (en) | Method and apparatus for identifying authenticity of two parties? evidence based on blockchain ledger | |
US11551319B2 (en) | Method and apparatus for determining evidence authenticity based on blockchain ledger | |
JPWO2016120975A1 (en) | Data aggregation analysis system and method | |
CN112989400B (en) | Privacy transaction processing method, device, electronic equipment and medium | |
JP5655718B2 (en) | Conversion processing method, apparatus and program, restoration processing method, apparatus and program | |
US20200204560A1 (en) | Blockchain user account data | |
CN113498602B (en) | Computer-implemented method, storage medium, apparatus and system for preventing fraud | |
US20190036679A1 (en) | Encryption device, encryption method, computer readable medium, and storage device | |
US20190260715A1 (en) | Computer system, connection apparatus, and processing method using transaction | |
WO2022072146A1 (en) | Privacy preserving centroid models using secure multi-party computation | |
CN112199697A (en) | Information processing method, device, equipment and medium based on shared root key | |
CN114223175A (en) | Generating a sequence of network data while preventing acquisition or manipulation of time data | |
JP5668549B2 (en) | Confidential analysis processing method, program, and apparatus | |
US10592682B2 (en) | Data storage apparatus, data processing method, and computer readable medium adding a user attribute of a revoked user to an embedded decryption condition while encrypted data remains in an encrypted state | |
US20180225475A1 (en) | Encrypted database management device, encrypted database management method, encrypted database management program, and encrypted database management system | |
JP2022177209A (en) | Preventing data manipulation by using multiple aggregation servers | |
CN114817954A (en) | Image processing method, system and device | |
CN115292729A (en) | Privacy-protecting multi-party data processing method, device and equipment | |
KR102123435B1 (en) | Encryption method for supporting equality query in multi-client environment and apparatus using the same | |
CN115088005A (en) | Securing access to information in content distribution using secure MPC and vector computation | |
CN111090752A (en) | Data processing method, device and computer readable storage medium | |
JP2018097625A (en) | Database system, encrypted data search method, and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140304 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140930 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141028 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5655718 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |