JP2012113606A - Protection object information masking device, protection object information masking method, and protection object information masking program - Google Patents

Protection object information masking device, protection object information masking method, and protection object information masking program Download PDF

Info

Publication number
JP2012113606A
JP2012113606A JP2010263566A JP2010263566A JP2012113606A JP 2012113606 A JP2012113606 A JP 2012113606A JP 2010263566 A JP2010263566 A JP 2010263566A JP 2010263566 A JP2010263566 A JP 2010263566A JP 2012113606 A JP2012113606 A JP 2012113606A
Authority
JP
Japan
Prior art keywords
character string
mask
target information
protection target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010263566A
Other languages
Japanese (ja)
Other versions
JP5358549B2 (en
Inventor
Masahiro Yuguchi
昌宏 湯口
Akimichi Tanaka
明通 田中
Takashi Sato
隆 佐藤
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010263566A priority Critical patent/JP5358549B2/en
Publication of JP2012113606A publication Critical patent/JP2012113606A/en
Application granted granted Critical
Publication of JP5358549B2 publication Critical patent/JP5358549B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)

Abstract

PROBLEM TO BE SOLVED: To estimate a wrong conversion place without referring to source data before masking even if wrong masking processing is performed when an electronic document (text) including protection object information is suitably masked.SOLUTION: A protection object information masking device includes a personal information dictionary DB 10 storing personal information to be protected; personal information detection means 20 for inputting a text having the personal information as a source text, and detecting a character string corresponding to the personal information stored in the personal information dictionary DB 10 as a character string to be masked from the input text; personal information mask generation means 30 for finding a character string length of the character string to be masked detected by the personal information detection means 20, and generating a character string for mask including the character string length; and personal information replacement means 40 for replacing the character string to be masked detected by the personal information detection means 20 with the character string for mask generated by the personal information mask generation means 30.

Description

本発明は、姓名、住所などの個人情報を含むテキストに対して、個人情報の保護を目的として個人情報を検出しその部分をマスクする保護対象情報マスクシステムに関し,特に、個人情報でない部分を誤ってマスクしてしまった可能性が高い場合でも、マスク前の状態を推測可能な個人情報マスクシステムに関する。   The present invention relates to a protected information masking system for detecting personal information for the purpose of protecting personal information and masking the portion of the text including personal information such as first name, last name, and address, and in particular, erroneously identifies a portion that is not personal information. The present invention relates to a personal information mask system that can estimate the state before masking even when the possibility of masking is high.

個人情報保護の重要性が増すなか、姓名、住所等の個人情報を含むテキストに対して、個人情報部分をマスクして読めなくする技術への期待が高まっている。   As the importance of protecting personal information increases, there is an increasing expectation for a technique that masks the personal information part and makes it unreadable for texts containing personal information such as first and last names and addresses.

個人情報部分をマスキングする既存技術としては、文字列変換を実施する手法(特許文献1)などがある。   As an existing technique for masking the personal information part, there is a technique for performing character string conversion (Patent Document 1).

特開2007−102540号公報JP 2007-102540 A

しかしながら、既存技術では、電子文書内における一般名称などであっても、個人情報辞書データ内に登録されている文言についてはマスキング対象とされてしまい、誤ってマスキングされてしまう可能性があった。例えば、ブランド名として「Junko Koshino」について人名として間違われてマスキングされてしまうことがあり、該当のブランド名箇所の文字列が暗号化されてしまうことや、「*** ***」のような文字列に置き換えられてしまうことがあった。   However, in the existing technology, even a general name or the like in an electronic document, the wording registered in the personal information dictionary data is subject to masking and may be masked by mistake. For example, “Junko Koshino” as a brand name may be mistaken as a personal name and masked, and the character string of the corresponding brand name part may be encrypted, or “******” It was sometimes replaced with a string of characters.

これらの場合、誤ってマスキングされた箇所と正しくマスキングされた箇所とを区別することは困難であるため、マスキング結果データだけでは正しくマスキングされたかを確認することは難しいため、マスキング前の元データを参照する必要が発生する。   In these cases, it is difficult to distinguish between the wrongly masked part and the correctly masked part, so it is difficult to check whether the masking result data is correctly masked. It needs to be referenced.

しかしながら、そもそも文書データにマスキングを適用する目的としては、個人情報の保護のために個人情報箇所を隠すことが主となる。よって、極力元データを参照することは避けることが望ましい。よって、マスキング前の元データを参照することなく、誤ってマスキングされてしまった文字列を推定可能なマスキング技術が必要となる。   However, in the first place, the main purpose of applying masking to document data is to hide personal information portions in order to protect personal information. Therefore, it is desirable to avoid referring to the original data as much as possible. Therefore, there is a need for a masking technique that can estimate a character string that has been masked by mistake without referring to the original data before masking.

本発明はこの課題を解決するための保護対象情報マスキング装置、方法、プログラムを提供することを目的とする。   An object of the present invention is to provide a protection target information masking apparatus, method, and program for solving this problem.

前記課題を解決するために本発明では、保護対象の情報が格納された保護対象情報辞書データベースと、保護対象の情報を有するテキストを元テキストとして入力し、該入力されたテキストから、前記保護対象情報辞書データベースに格納された保護対象情報に該当する文字列をマスク対象文字列として検出する保護対象情報検出手段と、前記保護対象情報検出手段により検出されたマスク対象文字列の文字列長を求め、該文字列長を含むマスク用文字列を生成する保護対象情報マスク生成手段と、前記保護対象情報検出手段により検出されたマスク対象文字列を、前記保護対象情報マスク生成手段により生成されたマスク用文字列に置き換える保護対象情報置き換え手段と、を備えたことを特徴としている。   In order to solve the above problems, in the present invention, a protection target information dictionary database storing protection target information and a text having protection target information are input as original text, and the protection target is input from the input text. A protection target information detecting means for detecting a character string corresponding to the protection target information stored in the information dictionary database as a mask target character string, and obtaining a character string length of the mask target character string detected by the protection target information detection means; , A protection target information mask generation unit that generates a mask character string including the character string length, and a mask generated by the protection target information mask generation unit using the mask target character string detected by the protection target information detection unit. And a protection target information replacement means for replacing with a character string.

本発明によれば、保護対象情報を含む電子文書(テキスト)を適切にマスキングする際、誤ってマスキング処理された場合であっても、マスキング前の元データを参照することなく、誤変換箇所の推定を行うことができる。   According to the present invention, when appropriately masking an electronic document (text) including information to be protected, even if the masking process is erroneously performed, an erroneous conversion location can be determined without referring to the original data before masking. Estimation can be performed.

これにより、本発明によりマスキングされたデータを利用することで、保護対象情報、例えば個人情報の保護を実現しつつ、統計情報の抽出などを実現することが可能となる。   Thus, by using the data masked according to the present invention, it is possible to realize extraction of statistical information and the like while realizing protection of information to be protected, for example, personal information.

本発明の一実施形態例を示す全体構成図。1 is an overall configuration diagram showing an embodiment of the present invention. 本発明の一実施形態例における個人情報マスク生成手段の処理を示すフローチャート。The flowchart which shows the process of the personal information mask production | generation means in the example of 1 embodiment of this invention. 本発明の他の実施形態例における全体の処理を示すフローチャート。The flowchart which shows the whole process in the other embodiment of this invention. 本発明の個人情報マスク処理の適用例を示す説明図。Explanatory drawing which shows the example of application of the personal information mask process of this invention. 本発明をマーケティングデータ抽出に利用した実施例の説明図。Explanatory drawing of the Example which utilized this invention for marketing data extraction. 本発明を機密文書マスキングに利用した実施例の説明図。Explanatory drawing of the Example using this invention for confidential document masking.

以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。   Hereinafter, embodiments of the present invention will be described with reference to the drawings, but the present invention is not limited to the following embodiments.

尚、以下の図1〜図5で説明する実施形態例は、保護対象情報が個人情報である場合の実施形態を示している。   Note that the exemplary embodiments described with reference to FIGS. 1 to 5 below show exemplary embodiments where the protection target information is personal information.

図1は本発明の実施形態における全体構成を示している。図1において、個人情報マスキング装置100は、保護の対象とする個人情報が格納された個人情報辞書DB(データベース)10(本発明の保護対象情報辞書データベース)と、電子文書などの元テキストを入力とし、該テキストから個人情報辞書DB10に含まれる個人情報部分を文字列として検出する個人情報検出手段20(本発明の保護対象情報検出手段)と、前記検出された個人情報文字列に対して、個人情報箇所をマスクするための文字列を生成する個人情報マスク生成手段30(本発明の保護対象情報マスク生成手段)と、前記個人情報検出手段20によって検出された個人情報部分を、前記個人情報マスク生成手段30により生成された文字列に置き換えて、個人情報マスク後テキスト(電子文書)を出力する個人情報置き換え手段40(本発明の保護対象情報置き換え手段)とを備えている。   FIG. 1 shows the overall configuration of an embodiment of the present invention. In FIG. 1, a personal information masking apparatus 100 inputs a personal information dictionary DB (database) 10 (protection target information dictionary database of the present invention) storing personal information to be protected and an original text such as an electronic document. And personal information detection means 20 (protection target information detection means of the present invention) for detecting a personal information part contained in the personal information dictionary DB 10 from the text as a character string, and for the detected personal information character string, The personal information mask generating means 30 (protection target information mask generating means of the present invention) for generating a character string for masking the personal information portion, and the personal information portion detected by the personal information detecting means 20 The personal information place which outputs the text (electronic document) after the personal information mask in place of the character string generated by the mask generating means 30 E means 40 is provided with a (protected information replacement means of the present invention) and.

個人情報マスキング装置100は、例えばコンピュータにより構成され、通常のコンピュータのハードウェアリソース、例えばROM、RAM、CPU、入力装置、出力装置、通信インターフェース、ハードディスク、記録媒体およびその駆動装置を備えている。   The personal information masking device 100 is configured by a computer, for example, and includes hardware resources of a normal computer such as a ROM, a RAM, a CPU, an input device, an output device, a communication interface, a hard disk, a recording medium, and a driving device thereof.

このハードウェアリソースとソフトウェアリソース(OS、アプリケーションなど)との協働の結果、個人情報マスキング装置100は、図1に示すように、個人情報辞書DB10、個人情報検出手段20、個人情報マスク生成手段30、個人情報置き換え手段40を実装する。   As a result of the cooperation between the hardware resource and the software resource (OS, application, etc.), the personal information masking apparatus 100 has a personal information dictionary DB 10, personal information detection means 20, personal information mask generation means as shown in FIG. 30. The personal information replacement means 40 is implemented.

前記個人情報マスク生成手段30は、後述する、ハッシュ値の先頭からの文字数bが設定された文字数設定情報DB31(図2)と、マスク用文字列およびマスク対象文字列位置情報を保存するマスク文字列情報DB32(図3)とを備えており、これら文字数設定情報DB31、マスク文字列情報DB32と前記個人情報辞書DB10は、ハードディスクあるいはRAMなどの保存手段・記憶手段に構築されているものとする。   The personal information mask generator 30 stores a character number setting information DB 31 (FIG. 2) in which the number of characters b from the beginning of the hash value, which will be described later, and a mask character for storing a mask character string and mask target character string position information. Column information DB 32 (FIG. 3), and the number-of-characters setting information DB 31, the mask character string information DB 32 and the personal information dictionary DB 10 are constructed in storage means / storage means such as a hard disk or RAM. .

上記のように構成された装置において、個人情報マスキング装置100に個人情報を有する電子文書(元テキスト)が入力されると、個人情報検出手段20は、電子文書中の文字列に対し個人情報辞書DB10を元に、個人情報の対象となる文字列を検出する。   In the apparatus configured as described above, when an electronic document (original text) having personal information is input to the personal information masking apparatus 100, the personal information detecting means 20 applies the personal information dictionary to the character string in the electronic document. Based on the DB 10, a character string that is a target of personal information is detected.

個人情報辞書DB10にて保存されるデータとしては、例えば、個人情報保護対象とすべき文字列(氏名、住所、電話番号)などのデータが保存される。   As data stored in the personal information dictionary DB 10, for example, data such as a character string (name, address, telephone number) to be protected for personal information is stored.

個人情報検出手段20では、個人情報辞書DB10に保存された個人情報データをキーとして、入力された電子文書(テキスト)データ中に個人情報に該当する文字列が存在するか検索を行い、該当する文字列をマスク対象文字列として検出する。   The personal information detection means 20 searches the input electronic document (text) data for a character string corresponding to the personal information by using the personal information data stored in the personal information dictionary DB 10 as a key, and applies the corresponding information. A character string is detected as a mask target character string.

この際、例えば、個人情報辞書DB10において、氏名データが「姓」「名」として保存されている場合、「姓」、「名」をそれぞれキーとして検索するだけでなく、それぞれを組み合わせた「姓名」をキーとして検索を行ってもよい。   At this time, for example, in the personal information dictionary DB 10, when the name data is stored as “first name” and “first name”, not only “first name” and “first name” are searched for as keys, but also “first name and last name” combined with each other. "May be used as a key.

個人情報マスク生成手段30では、個人情報検出手段20にて抽出(検出)された個人情報対象文字列(マスク対象文字列)に対し、その文字列長とハッシュ値の一部からなるマスク用文字列を生成する。   In the personal information mask generation means 30, a mask character consisting of a part of the character string length and hash value of the personal information target character string (mask target character string) extracted (detected) by the personal information detection means 20. Generate a column.

ここで、個人情報マスク生成手段30が行なう処理を図2を用いて説明する。図2において、ステップS101では、前記個人情報検出手段20によって抽出された個人情報データが、個人情報マスク生成手段30にマスク対象文字列として入力される。   Here, the process performed by the personal information mask generating means 30 will be described with reference to FIG. In FIG. 2, in step S <b> 101, the personal information data extracted by the personal information detection unit 20 is input to the personal information mask generation unit 30 as a mask target character string.

ステップS102では、入力されたマスク対象文字列の文字数をカウントし文字列長(a)を求める。例えば、マスク対象文字列が「Hanako」の場合、文字列長は6であり、a=6となる。   In step S102, the number of characters in the input mask target character string is counted to obtain the character string length (a). For example, when the mask target character string is “Hanako”, the character string length is 6 and a = 6.

ステップS103では、入力されたマスク対象文字列の分類(文字種類判定)を行う。この際、マスク対象文字列が数値のみで構成される数値列であるか、または、数字以外の文字を含む文字列であるかを判定する。   In step S103, the input mask target character string is classified (character type determination). At this time, it is determined whether the mask target character string is a numerical string composed only of numerical values or a character string including characters other than numerals.

例えば、マスク対象文字列が電話番号の場合は数字のみの数値列であると分類され、住所情報であれば文字列として分類される。   For example, if the character string to be masked is a telephone number, it is classified as a numerical string consisting only of numbers, and if it is address information, it is classified as a character string.

ステップS103にてマスク対象文字列が文字列として判定された場合は、ステップS104以降のマスク用文字列を生成するための処理ステップに遷移する。   If it is determined in step S103 that the mask target character string is a character string, the process proceeds to a processing step for generating a mask character string after step S104.

ステップS104では、マスク対象文字列を元に、ハッシュ値を生成する。マスク対象文字列に対し、ランダムな文字列を加えたものから、ハッシュ値を求める。   In step S104, a hash value is generated based on the mask target character string. A hash value is obtained from a character string to be masked plus a random character string.

例えば、マスク対象文字列が「hanako」の場合では、ランダムな文字列(ex.rKRotFVB)+hanakoから、Sha1(Secure hash algorithm 1)のようなハッシュ値を求めた場合、下記のようなハッシュ値が得られる。   For example, when the mask target character string is “hanako”, when a hash value such as Sha1 (Secure hash algorithm 1) is obtained from a random character string (ex.rKRotFVB) + hanako, the following hash value is obtained. can get.

EA1A9CF54F0DDB2065D2DAA9022B7F10875AF643
尚、このハッシュ値の生成の際には、Sha1以外にもハッシュ値を生成可能な手段であれば良いものとする。また、マスク対象文字列に加えるランダム文字列は、出力されたハッシュ値から元のマスク対象文字列を推定困難なものとするための値である。
EA1A9CF54F0DDB2065D2DAA9022B7F10875AF643
In addition, when generating the hash value, any means capable of generating a hash value other than Sha1 may be used. The random character string added to the mask target character string is a value for making it difficult to estimate the original mask target character string from the output hash value.

ステップS105では、マスク用文字列の生成を行う。ここでは個人情報文字列(マスク対象文字列)の箇所をマスクするための文字列を生成する。すなわち、ステップS104にて生成したハッシュ値に対し、先頭b文字(bは正の任意数)をとり、前記ステップS102で求めた文字列長aと組み合わせ、
「開始記号」+「文字列長a」+「区切記号」+「ハッシュ値部分列b」+「終端記号」
の順に文字列を結合したマスク用文字列を生成する。
In step S105, a mask character string is generated. Here, a character string for masking a portion of the personal information character string (mask target character string) is generated. That is, for the hash value generated in step S104, the first b characters (b is a positive arbitrary number) are combined with the character string length a obtained in step S102,
“Start symbol” + “character string length a” + “delimiter symbol” + “hash value subsequence b” + “terminal symbol”
A mask character string is generated by combining character strings in the order of.

前記開始記号、終端記号はマスク箇所を発見しやすくするためのものであり、「*」などの記号を用いるものとし、区切記号としては、「:」などの記号を用いるものとする。   The start symbol and the end symbol are for making it easy to find a mask location. Symbols such as “*” are used, and symbols such as “:” are used as delimiters.

例えば、マスク対象文字列「hanako」の場合、文字列長は6であることからa=6となり、b=4とした場合は、マスク用文字列は「*6:EA1A*」となる。   For example, in the case of the mask target character string “hanako”, since the character string length is 6, a = 6, and when b = 4, the mask character string is “* 6: EA1A *”.

この時、マスク用文字列として利用する、前記ハッシュ値の先頭からの文字数bは、文字数設定情報DB31(データ記憶領域)に保存された値であり、個人情報マスク生成処理開始時に設定する値とする。   At this time, the number of characters b from the head of the hash value used as a mask character string is a value stored in the character number setting information DB 31 (data storage area), and is a value set at the start of the personal information mask generation process. To do.

なお、マスク用文字列として利用するハッシュ値の文字列については、一定位置の文字列であれば良いものとする。例えば、先頭から10文字後の連続するb文字でも良いものとする。   Note that the character string of the hash value used as the mask character string may be a character string at a fixed position. For example, it may be a continuous b character 10 characters after the beginning.

尚、マスク対象文字列の文字列長aをマスク用文字列に組み入れることにより、例えば姓、名などの文字列の場合、同一の電子文書内における文字列長の変動が少ないため、文字列長aを付与しても、元の個人情報データを絞り込む効果は少ない(マスク前文字列を推定しやすくならない)が、ブランド名などの一般名称の場合は、文字列長がさまざまなものが存在しており、文字列長aを指定することにより、絞り込みの効果が発生する。その分、ハッシュ値文字列長bを小さくしても、マスク前文字列を推定することが可能となる。   By incorporating the character string length a of the mask target character string into the mask character string, for example, in the case of a character string such as a surname or first name, there is little variation in the character string length in the same electronic document. Even if a is given, there is little effect of narrowing down the original personal information data (it is not easy to estimate the pre-mask character string), but there are various character string lengths for general names such as brand names. By specifying the character string length a, a narrowing effect is generated. Accordingly, even if the hash value character string length b is reduced, the pre-mask character string can be estimated.

よって、マスク対象文字列長aの値を付与することにより、同一の電子文書中において、姓、名であるか、または一般名称であるかを推定することが可能となる。   Therefore, by assigning the value of the mask target character string length a, it is possible to estimate whether it is a surname, a first name, or a general name in the same electronic document.

尚、開始記号、終端記号の「*」を用いてマスク用文字列を生成する目的は、マスク変換箇所を他の箇所と区別するためのものであり、電子文書の特徴に応じ、「*」が多数含まれるなどの場合は、他の記号(例えば「#」など)を利用しても良い。   The purpose of generating the mask character string using the start symbol and the end symbol “*” is to distinguish the mask conversion portion from other portions, and “*” according to the characteristics of the electronic document. May be used, other symbols (for example, “#”, etc.) may be used.

前記ステップS103にて、マスク対象文字列が数値列として分類(判定)された場合は、ステップS106にて数値用のマスク用文字列を生成する。   When the mask target character string is classified (determined) as a numerical string in step S103, a numerical mask character string is generated in step S106.

尚、マスク対象文字列が数値列の場合は、文字列の場合に比べ、ハッシュ値のパターン数が少なく、元の値の推定可能性が高くなる為、ハッシュ値は利用せず、固定値「N」を利用するものとする。よって、マスク対象文字列が文字数aの場合、マスク用文字列は、
「開始記号」+「文字列長a」+「区切記号」+「固定値N」+「終端記号」
の順に統合し、「*a:N*」として表示される。
Note that when the mask target character string is a numeric string, the number of hash value patterns is smaller and the possibility of estimating the original value is higher than in the case of a character string, so the hash value is not used and the fixed value “ N "shall be used. Therefore, when the mask target character string is the number of characters a, the mask character string is
“Start symbol” + “character string length a” + “separator” + “fixed value N” + “terminal symbol”
And are displayed as “* a: N *”.

例えば、3桁の数値列がマスク対象文字列の場合は、マスク用文字列は「*3:N*」となる。   For example, when a 3-digit numerical string is a mask target character string, the mask character string is “* 3: N *”.

従って、電話番号「012−345‐6789」がマスク対象文字列である場合は、マスク用文字列は「*3:N*−*3:N*−*4:N*」となる。   Therefore, when the telephone number “012-345-6789” is a character string to be masked, the mask character string is “* 3: N * − * 3: N * − * 4: N *”.

以上のステップを通じ、マスク用文字列が生成され、個人情報マスク生成手段30から出力される(ステップS107)。   Through the above steps, a mask character string is generated and output from the personal information mask generating means 30 (step S107).

その後、個人情報置き換え手段40では、個人情報の対象となる文字列(個人情報検出手段20の出力;マスク対象文字列)を、前記個人情報マスク生成手段30にて生成されたマスク用文字列に置き換える処理を行い、個人情報マスク後の電子文書(テキスト)として出力する。   Thereafter, in the personal information replacement means 40, the character string that is the target of personal information (the output of the personal information detection means 20; the mask target character string) is converted into the mask character string generated by the personal information mask generation means 30. A replacement process is performed, and an electronic document (text) after personal information masking is output.

次に、個人情報辞書DB10に登録されているデータが複数の種別を持つ場合にマスキングを行う実施例について、装置全体の処理の流れを表す図3を用いて説明する。   Next, an embodiment in which masking is performed when data registered in the personal information dictionary DB 10 has a plurality of types will be described with reference to FIG.

マスキング対象として、電話番号、携帯、カード、郵便番号、メールアドレス、ハンドル名、住所、カード名義、氏名、氏名カナ、などの個人情報が複数同時に存在する電子文書(元テキスト)について、個人情報箇所をマスクする場合は、各マスキング対象の文字列に対し、優先順位を設定したうえで、マスク対象文字列の抽出、及び、変換を実施する必要がある。   Personal information location for electronic documents (original texts) that contain multiple personal information such as phone numbers, mobile phones, cards, postal codes, e-mail addresses, handle names, addresses, card names, names, names, etc. In the case of masking, it is necessary to set the priority order for each character string to be masked and extract and convert the character string to be masked.

図3における個人情報辞書DB10には、電話番号、携帯電話番号、クレジットカード番号、郵便番号、メールアドレス、Webハンドル名、住所等の複数の種類の個人情報文字列とそれらの文字列長のデータが格納されている(尚、文字列長が格納されていない個人情報文字列も存在するものとする)。   The personal information dictionary DB 10 in FIG. 3 includes a plurality of types of personal information character strings such as telephone numbers, mobile phone numbers, credit card numbers, postal codes, e-mail addresses, Web handle names, and addresses, and data of their character string lengths. (Note that there is also a personal information character string in which the character string length is not stored).

まずステップS201では、前述した個人情報が複数同時に存在する電子文書(元テキスト)が個人情報検出手段20に入力される。   First, in step S <b> 201, an electronic document (original text) in which a plurality of the aforementioned personal information exists simultaneously is input to the personal information detection means 20.

ステップS202では、個人情報検出手段20が、個人情報辞書DB10中の複数の個人情報文字列について、文字列長が格納されている場合はその文字列長を採用し、文字列長が格納されていない場合はその文字列の文字数を算出する。 そしてステップS203では、個人情報検出手段20が、前記算出又は採用された各個人情報文字列の文字数を元に、検出優先順位の設定を行う。   In step S202, the personal information detection means 20 adopts the character string length when a character string length is stored for a plurality of personal information character strings in the personal information dictionary DB 10, and stores the character string length. If not, calculate the number of characters in the string. In step S203, the personal information detection means 20 sets a detection priority based on the number of characters of each personal information character string calculated or adopted.

すなわち、例えば、個人情報文字列のうち、文字列長が長いものを優先的に検出するものとする。これは、メールアドレスの一部に氏名のアルファベット表記の一部が使用されているなどの場合、文字列長が短いものから検出を行ってしまうと、本来検出すべきメールアドレスが検出することができないなど、誤った検出処理を避けるためである。また、文字列長が同じ場合は、数値列を優先し検出するものとし、検出優先順位を設定する。   That is, for example, a personal information character string having a long character string length is preferentially detected. This means that if a part of the alphabet of the name is used as part of the e-mail address, the e-mail address that should be detected may be detected if it is detected from a short character string length. This is to avoid erroneous detection processing such as being impossible. When the character string lengths are the same, the numerical string is preferentially detected and the detection priority is set.

その後ステップS204およびS205において、個人情報検出手段20は、前記設定された検出優先順位順に、個人情報辞書DB10内のすべての個人情報文字列について、前記入力されたテキストから個人情報辞書DB10内の個人情報文字列に該当する文字列をマスク対象文字列として検出する。   Thereafter, in steps S204 and S205, the personal information detection means 20 performs the personal information in the personal information dictionary DB 10 from the input text for all personal information character strings in the personal information dictionary DB 10 in the order of the detection priority set. A character string corresponding to the information character string is detected as a mask target character string.

尚、この際、検出優先順位が高く、先に検出された文字列箇所については、再度、検出対象としないものとする。例えば、抽出(検出)された箇所については、入力データ中の該当箇所を空白に置き換えるなどにより、重複して検出対象とされることを避けるものとしても良い。   At this time, the detection priority is high, and the previously detected character string portion is not detected again. For example, the extracted (detected) portion may be prevented from being duplicated as a detection target by replacing the corresponding portion in the input data with a blank.

次にステップS206では、個人情報マスク生成手段30が、前記ステップS205の処理によって検出され個人情報検出手段20から順次入力されるマスク対象文字列の文字列長(a)を求める。   Next, in step S206, the personal information mask generation means 30 obtains the character string length (a) of the mask target character strings that are detected by the processing in step S205 and sequentially input from the personal information detection means 20.

ここでは、前記個人情報辞書DB10に該当する文字列の文字列長が格納されている場合は、その文字列長を採用し、格納されていない場合は前記図2のステップS102と同様に、入力されたマスク対象文字列の文字数をカウントして文字列長を求める。   Here, if the character string length of the corresponding character string is stored in the personal information dictionary DB 10, the character string length is adopted, and if not stored, as in step S102 of FIG. The number of characters in the masked character string is counted to obtain the character string length.

次にステップS207〜S210では、個人情報マスク生成手段30が、個人情報検出手段20から順次入力されるマスク対象文字列をマスクするためのマスク用文字列を、前記図2のステップS103〜S106の処理と同様の処理により生成する。   Next, in steps S207 to S210, the personal information mask generation means 30 uses the mask character strings for masking the mask target character strings sequentially input from the personal information detection means 20 in steps S103 to S106 of FIG. It is generated by the same process as the process.

すなわちステップS207では該当の文字列種類について判定を行い、数値のみの場合はステップS210にて数値用のマスク用文字列を生成する。ステップS207にて数値以外を含む文字列として判定された場合は、ステップS208にて該当文字列のハッシュ値を生成の上、ステップS209にて対象文字列数の値とハッシュ値を元にマスク用文字列を生成する。   That is, in step S207, the corresponding character string type is determined, and in the case of only a numerical value, a numerical mask character string is generated in step S210. If it is determined in step S207 that the character string includes a value other than a numerical value, a hash value of the corresponding character string is generated in step S208, and then in step S209, the character string is masked based on the value of the target character string and the hash value. Generate a string.

次にステップS211では、前記生成されたマスク用文字列と、該マスク用文字列に対応する、前記個人情報検出手段20により検出されたマスク対象文字列の位置情報とを、マスク文字列情報DB32に保存する。   Next, in step S211, the generated mask character string and the position information of the mask target character string detected by the personal information detecting means 20 corresponding to the mask character string are displayed in the mask character string information DB 32. Save to.

その後、すべての検出対象文字列についてステップS203にて規定された検出優先順位の順に、ステップS204〜S211の処理を繰り返し実施する。   Thereafter, the processing of steps S204 to S211 is repeatedly performed in the order of detection priority order defined in step S203 for all detection target character strings.

次に、ステップS204にてすべての検出対象文字列について検出が終了したと判定された場合、ステップS212において、個人情報置き換え手段40が、前記マスク文字列情報DB32内に保存された情報を元にマスク対象文字列を、該マスク対象文字列に対応するマスク用文字列に置換し、ステップS213においてマスク処理が行われたテキストを出力する。   Next, when it is determined in step S204 that the detection has been completed for all the detection target character strings, in step S212, the personal information replacing unit 40 is based on the information stored in the mask character string information DB 32. The mask target character string is replaced with a mask character string corresponding to the mask target character string, and the text subjected to the mask processing in step S213 is output.

尚、前記ステップS205の文字列検出処理において、郵便番号と電話番号などの複数の数値列がハイフン「−」などの記号により組み合わされ構成されている文字列を検出する場合は、ハイフン「−」などの記号により組み合わされる部分数値列の全てが抽出対象とする電子文書(入力されたテキスト)内に存在する場合に検出処理を実施するものとする。   In the character string detection process in step S205, when a character string formed by combining a plurality of numerical strings such as a zip code and a telephone number with a symbol such as a hyphen "-" is detected, a hyphen "-" is used. It is assumed that the detection process is performed when all of the partial numeric strings combined by symbols such as are present in the electronic document (input text) to be extracted.

これにより、ECサイトなどの場合、郵便番号や電話番号の一部の文字列が金額表示の数値列と一致する場合であっても、誤ってマスキングされることを防ぐことが可能となる。   As a result, in the case of an EC site or the like, even if a part of a character string of a postal code or a telephone number matches a numerical value string of money display, it can be prevented from being erroneously masked.

例えば、郵便番号が「234−0847」の場合、「234円」として金額表示されている場合であっても、「0847」も電子文書(入力されたテキスト)内に存在する場合のみ、マスキングを行うことになり、誤ったマスキングを避けることが可能となる。   For example, when the postal code is “234-0847”, even if the amount is displayed as “234 yen”, masking is performed only when “0847” is also present in the electronic document (input text). Doing so makes it possible to avoid false masking.

以上のマスキング処理によって、本発明を個人情報に適用した例を示す図4のように、保護対象である図4(a)の個人情報が図4(b)のように各々マスキングされる。   By the above masking process, the personal information of FIG. 4A to be protected is masked as shown in FIG. 4B as shown in FIG. 4 showing an example in which the present invention is applied to personal information.

図4によれば、開始記号「*」の次の数字(文字列長a)から、そのマスキングされた文字の字数を推定することができ、また、終端記号「*」の一つ手前に「N」が存在することから、そのマスキングされた文字が数値のみで成り立っていることを推定することができる。   According to FIG. 4, the number of characters of the masked character can be estimated from the number next to the start symbol “*” (character string length a), and “1” before the end symbol “*”. Since “N” exists, it can be estimated that the masked character is composed only of numerical values.

また、本発明をWebページのアクセスログ分析システムとして活用することにより、マーケティング情報の抽出を行うことが可能となる。例えば、ユーザがどのWebサイトで、どのようなブランドの商品を購入したか、という情報を収集することにより、購買情報を収集することが可能となる。この、本発明を利用してアクセスログ分析システムを構築した実施例について、図5を用いて説明する。   Further, by utilizing the present invention as a Web page access log analysis system, it is possible to extract marketing information. For example, it is possible to collect purchase information by collecting information on which Web site the user has purchased and what brand of product the user has purchased. An embodiment in which an access log analysis system is constructed using the present invention will be described with reference to FIG.

図5において、200はユーザが使用するユーザ端末(複数存在する)であり、本発明の個人情報マスキング装置100を各々具備している。   In FIG. 5, reference numeral 200 denotes a user terminal (a plurality of user terminals) used by the user, each equipped with the personal information masking device 100 of the present invention.

201は、ユーザ端末200上でWebページにアクセスした情報中に含まれる個人情報を図1〜図4で述べた処理と同様の処理によりマスキングしたWebアクセスデータを示している。   Reference numeral 201 denotes Web access data obtained by masking personal information included in information accessed on the Web page on the user terminal 200 by the same process as described with reference to FIGS.

202は、インターネットを介して入力された前記Webアクセスデータ201が格納されたWebアクセスデータDBである。   A web access data DB 202 stores the web access data 201 input via the Internet.

203は、ブランド名と、ブランド名の文字列長と、ブランド名に対して予め本発明の図1〜図4で述べたマスキング処理を施した結果のマスキングデータ(b=4)とを対応させて格納したブランド名リストDBである。   203 corresponds to the brand name, the character string length of the brand name, and the masking data (b = 4) obtained as a result of performing the masking process previously described with reference to FIGS. This is the brand name list DB stored.

図5のアクセスログ分析システムによって、ユーザの端末上でWebページのアクセス情報中に含まれる個人情報に関わる文字列をマスキングする機能を実現することにより、個人情報をマスキングしたアクセスログを収集することが可能となる。   Collecting access logs masking personal information by realizing a function of masking character strings related to personal information included in access information of Web pages on the user's terminal by the access log analysis system of FIG. Is possible.

尚、ブランド名については、個人名が利用されたものが存在するため、ブランド名についてもマスキングが行われる可能性があるが、事前にブランド名に関するマスキング結果データを作成し、ブランド名リストDB203のように辞書データとして保持することにより、Webアクセスデータを分析する際に、WebアクセスデータDB202とブランド名リストDB203を比較することにより、ブランド名に関する分析を行うことが可能となる。   As for the brand name, there is a possibility that the personal name is used. Therefore, there is a possibility that the brand name is masked. However, masking result data on the brand name is created in advance, and the brand name list DB 203 By storing the data as dictionary data as described above, it is possible to analyze the brand name by comparing the Web access data DB 202 and the brand name list DB 203 when analyzing the Web access data.

また、本発明を、機密情報や重要情報のマスキングシステムとして活用することにより、機密情報や重要情報の漏洩を防ぐことができる。   Further, by using the present invention as a masking system for confidential information and important information, leakage of confidential information and important information can be prevented.

通常、企業内の重要情報や機密情報などを含んだ機密文書については、閲覧権限が厳密に管理され、閲覧可能な利用者、環境が限られている。しかしながら、業務都合上、このような重要電子文書などを社外からアクセスする必要が発生する場合がある。例えば、契約文書を緊急的に確認するため、社外からリモートアクセスし、電子文書を閲覧・編集する場合がある。このような場合、部外者により覗き見られることで、重要情報が漏洩する可能性がある。   Normally, browsing authority is strictly managed for confidential documents including important information and confidential information in a company, and the users and environments that can be viewed are limited. However, for business reasons, it may be necessary to access such important electronic documents from outside the company. For example, in order to confirm the contract document urgently, there is a case where the electronic document is viewed / edited by remote access from outside the company. In such a case, important information may be leaked by being peeped by outsiders.

そこで本発明のマスキング機能を活用することにより、顧客名などに対しマスキングを行うことが可能となる。この、本発明を利用して機密文書マスキングシステムを構築した実施例について図6を用いて説明する。   Therefore, by using the masking function of the present invention, it is possible to mask a customer name or the like. An embodiment in which a confidential document masking system is constructed using the present invention will be described with reference to FIG.

図6において300は、各種社内システム、ファイルサーバ等から成り、機密情報や重要情報などを含んだ機密文書(電子文書)を保持しているテキストサーバである。   In FIG. 6, reference numeral 300 denotes a text server that includes various in-house systems, file servers, and the like, and holds confidential documents (electronic documents) including confidential information and important information.

301は、機密情報や重要情報の文字列とその文字列長などのデータが、前記図3の個人情報辞書DB10と同様に辞書として格納された重要情報辞書DBである。   301 is an important information dictionary DB in which data such as character strings of confidential information and important information and their character string lengths are stored as a dictionary, similar to the personal information dictionary DB 10 of FIG.

302は、テキストサーバ300の機密文書に含まれる機密情報や重要情報について、重要情報辞書DB301を利用して、図1〜図4で述べた処理と同様の処理によりマスキングを行なう重要情報マスキングサーバである。   Reference numeral 302 denotes an important information masking server that masks confidential information and important information included in the confidential document of the text server 300 by using the important information dictionary DB 301 by the same process as described with reference to FIGS. is there.

これらテキストサーバ300、重要情報辞書DB301、重要情報マスキングサーバ302は社内ネットワークで接続されている。   The text server 300, the important information dictionary DB 301, and the important information masking server 302 are connected via an in-house network.

303は、社外ネットワークで接続された複数のリモートアクセス端末である。   Reference numeral 303 denotes a plurality of remote access terminals connected via an external network.

304は、重要情報マスキングサーバ302とリモートアクセス端末303の間に設けられたファイアーウォールである。   A firewall 304 is provided between the important information masking server 302 and the remote access terminal 303.

上記のように構成されたシステムにおいて、社外のリモートアクセス端末303から社内のネットワークにアクセスがあったとき、重要情報マスキングサーバ302が、テキストサーバ300の機密文書中の機密情報、重要情報に対してマスキングを行なって、マスキング処理後の機密情報、重要情報を出力することにより、機密情報、重要情報の漏洩を防ぐことが可能となる。   In the system configured as described above, when there is an access to an internal network from an external remote access terminal 303, the important information masking server 302 applies to the confidential information and important information in the confidential document of the text server 300. By performing masking and outputting confidential information and important information after the masking process, it becomes possible to prevent leakage of confidential information and important information.

また、本実施形態の保護対象情報マスキング装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、本実施形態の保護対象情報マスキング方法における手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えばFD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R、CD−RW、HDD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。   Further, the present invention can be realized by configuring some or all of the functions of each means in the protection target information masking apparatus of the present embodiment with a computer program and executing the program using the computer. It goes without saying that the procedure in the form of the protection target information masking method can be configured by a computer program and the program can be executed by the computer, and the program for realizing the function by the computer can be read by the computer. Media such as FD (Floppy (registered trademark) Disk), MO (Magneto-Optical disk), ROM (Read Only Memory), memory card, CD (Compact Disk) -ROM, DVD (Digit) al Versatile Disk) -ROM, CD-R, CD-RW, HDD, removable disk, etc., and can be stored or distributed. It is also possible to provide the above program through a network such as the Internet or electronic mail.

10…個人情報辞書DB
20…個人情報検出手段
30…個人情報マスク生成手段
31…文字数設定情報DB
32…マスク文字列情報DB
40…個人情報置き換え手段
100…個人情報マスキング装置
200…ユーザ端末
202…WebアクセスデータDB
203…ブランド名リストDB
300…テキストサーバ
301…重要情報辞書DB
302…重要情報マスキングサーバ
303…リモートアクセス端末
304…ファイアーウォール
10 ... Personal Information Dictionary DB
20 ... Personal information detection means 30 ... Personal information mask generation means 31 ... Character number setting information DB
32 ... Mask character string information DB
40 ... Personal information replacement means 100 ... Personal information masking device 200 ... User terminal 202 ... Web access data DB
203 ... Brand name list DB
300 ... text server 301 ... important information dictionary DB
302 ... Important information masking server 303 ... Remote access terminal 304 ... Firewall

Claims (7)

保護対象の情報を有するテキストに対して保護対象情報部分を検出してマスキングを行う情報マスキング装置であって、
保護対象の情報が格納された保護対象情報辞書データベースと、
保護対象の情報を有するテキストを元テキストとして入力し、該入力されたテキストから、前記保護対象情報辞書データベースに格納された保護対象情報に該当する文字列をマスク対象文字列として検出する保護対象情報検出手段と、
前記保護対象情報検出手段により検出されたマスク対象文字列の文字列長を求め、該文字列長を含むマスク用文字列を生成する保護対象情報マスク生成手段と、
前記保護対象情報検出手段により検出されたマスク対象文字列を、前記保護対象情報マスク生成手段により生成されたマスク用文字列に置き換える保護対象情報置き換え手段と、
を備えたことを特徴とする保護対象情報マスキング装置。
An information masking device that performs masking by detecting a protection target information portion for text having protection target information,
A protection target information dictionary database in which protection target information is stored;
Protection target information for inputting a text having protection target information as an original text and detecting a character string corresponding to the protection target information stored in the protection target information dictionary database as a mask target character string from the input text Detection means;
A protection target information mask generation unit that obtains a character string length of the mask target character string detected by the protection target information detection unit, and generates a mask character string including the character string length;
Protection target information replacement means for replacing the mask target character string detected by the protection target information detection means with the mask character string generated by the protection target information mask generation means;
A protection target information masking device characterized by comprising:
前記保護対象情報辞書データベースは、複数種類の保護対象の情報と、それら情報の文字列長のデータとが格納され、
前記保護対象情報検出手段は、前記保護対象情報辞書データベース内の各保護対象情報の文字数を元に、保護対象情報の検出優先順位を設定し、該設定した検出優先順位順に、前記入力されたテキストから前記保護対象情報辞書データベース内の保護対象情報に該当する文字列をマスク対象文字列として検出し、
前記保護対象情報マスク生成手段は、前記保護対象情報検出手段により順次検出されたマスク対象文字列の文字列長を求め、該文字列長を含むマスク用文字列を順次生成し、該生成されたマスク用文字列と、該マスク用文字列に対応する、前記保護対象情報検出手段により検出されたマスク対象文字列の位置情報とを保存し、
前記保護対象情報置き換え手段は、前記保存された位置情報を元に、前記保護対象情報検出手段により検出されたマスク対象文字列を、該マスク対象文字列に対応するマスク用文字列に置き換えることを特徴とする請求項1に記載の保護対象情報マスキング装置。
The protection target information dictionary database stores a plurality of types of protection target information and character string length data of the information,
The protection target information detection means sets the detection priority of protection target information based on the number of characters of each protection target information in the protection target information dictionary database, and the input text in the set detection priority order. To detect a character string corresponding to the protection target information in the protection target information dictionary database as a mask target character string,
The protection target information mask generation unit obtains a character string length of the mask target character string sequentially detected by the protection target information detection unit, sequentially generates a mask character string including the character string length, and the generated Storing the mask character string and the position information of the mask target character string detected by the protection target information detection means corresponding to the mask character string;
The protection target information replacement unit replaces the mask target character string detected by the protection target information detection unit with a mask character string corresponding to the mask target character string based on the stored position information. The protection target information masking device according to claim 1, wherein
前記保護対象情報マスク生成手段は、前記マスク対象文字列が数値以外の文字で構成されている場合、マスク対象文字列を元にハッシュ値を求め、該ハッシュ値の部分列を含むマスク用文字列を生成することを特徴とする請求項1又は2に記載の保護対象情報マスキング装置 The protection target information mask generation means obtains a hash value based on the mask target character string when the mask target character string is composed of characters other than numeric values, and a mask character string including a partial sequence of the hash value The protection object information masking device according to claim 1 or 2, wherein 保護対象の情報を有するテキストに対して保護対象情報部分を検出してマスキングを行う情報マスキング方法であって、
保護対象情報検出手段が、保護対象の情報を有するテキストを元テキストとして入力し、該入力されたテキストから、保護対象の情報が格納された保護対象情報辞書データベースに格納された保護対象情報に該当する文字列をマスク対象文字列として検出する保護対象情報検出ステップと、
保護対象情報マスク生成手段が、前記保護対象情報検出手段により検出されたマスク対象文字列の文字列長を求め、該文字列長を含むマスク用文字列を生成する保護対象情報マスク生成ステップと、
保護対象情報置き換え手段が、前記保護対象情報検出手段により検出されたマスク対象文字列を、前記保護対象情報マスク生成手段により生成されたマスク用文字列に置き換える保護対象情報置き換えステップと、
を備えたことを特徴とする保護対象情報マスキング方法。
An information masking method for performing masking by detecting a protection target information part for text having protection target information,
Corresponding to the protection target information stored in the protection target information dictionary database storing the protection target information from the input text, the protection target information detection means inputs the text having the protection target information as the original text Protection target information detecting step for detecting a character string to be masked as a character string to be masked;
A protection target information mask generation unit that obtains a character string length of the mask target character string detected by the protection target information detection unit, and generates a mask character string including the character string length;
A protection target information replacement unit that replaces the mask target character string detected by the protection target information detection unit with the mask character string generated by the protection target information mask generation unit;
A method of masking information to be protected, comprising:
前記保護対象情報辞書データベースは、複数種類の保護対象の情報と、それら情報の文字列長のデータとが格納され、
前記保護対象情報検出ステップは、前記保護対象情報辞書データベース内の各保護対象情報の文字数を元に、保護対象情報の検出優先順位を設定し、該設定した検出優先順位順に、前記入力されたテキストから前記保護対象情報辞書データベース内の保護対象情報に該当する文字列をマスク対象文字列として検出し、
前記保護対象情報マスク生成ステップは、前記保護対象情報検出手段により順次検出されたマスク対象文字列の文字列長を求め、該文字列長を含むマスク用文字列を順次生成し、該生成されたマスク用文字列と、該マスク用文字列に対応する、前記保護対象情報検出手段により検出されたマスク対象文字列の位置情報とを保存し、
前記保護対象情報置き換えステップは、前記保存された位置情報を元に、前記保護対象情報検出手段により検出されたマスク対象文字列を、該マスク対象文字列に対応するマスク用文字列に置き換えることを特徴とする請求項4に記載の保護対象情報マスキング方法。
The protection target information dictionary database stores a plurality of types of protection target information and character string length data of the information,
The protection target information detection step sets a detection priority of protection target information based on the number of characters of each protection target information in the protection target information dictionary database, and the input text in the set detection priority order. To detect a character string corresponding to the protection target information in the protection target information dictionary database as a mask target character string,
The protection target information mask generation step obtains a character string length of the mask target character string sequentially detected by the protection target information detection means, sequentially generates a mask character string including the character string length, and the generated Storing the mask character string and the position information of the mask target character string detected by the protection target information detection means corresponding to the mask character string;
The protection target information replacement step replaces the mask target character string detected by the protection target information detection means with a mask character string corresponding to the mask target character string based on the stored position information. The protection target information masking method according to claim 4, wherein the protection target information is masked.
前記保護対象情報マスク生成ステップは、前記マスク対象文字列が数値以外の文字で構成されている場合、マスク対象文字列を元にハッシュ値を求め、該ハッシュ値の部分列を含むマスク用文字列を生成することを特徴とする請求項4又は5に記載の保護対象情報マスキング方法。 In the protection target information mask generation step, when the mask target character string is composed of characters other than numerical values, a hash value is obtained based on the mask target character string, and a mask character string including a substring of the hash value 6. The protection target information masking method according to claim 4 or 5, wherein: コンピュータを請求項1ないし3のいずれか1項に記載の各手段として機能させる保護対象情報マスキングプログラム。 A protection target information masking program for causing a computer to function as each means according to any one of claims 1 to 3.
JP2010263566A 2010-11-26 2010-11-26 Protection target information masking apparatus, protection target information masking method, and protection target information masking program Active JP5358549B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010263566A JP5358549B2 (en) 2010-11-26 2010-11-26 Protection target information masking apparatus, protection target information masking method, and protection target information masking program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010263566A JP5358549B2 (en) 2010-11-26 2010-11-26 Protection target information masking apparatus, protection target information masking method, and protection target information masking program

Publications (2)

Publication Number Publication Date
JP2012113606A true JP2012113606A (en) 2012-06-14
JP5358549B2 JP5358549B2 (en) 2013-12-04

Family

ID=46497738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010263566A Active JP5358549B2 (en) 2010-11-26 2010-11-26 Protection target information masking apparatus, protection target information masking method, and protection target information masking program

Country Status (1)

Country Link
JP (1) JP5358549B2 (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101282705B1 (en) * 2012-07-30 2013-08-23 주식회사 한글과컴퓨터 Apparatus and method for preventing disclosure of personal information contained in electronic document
JP2014109773A (en) * 2012-12-03 2014-06-12 Inst For Information Industry Electronic digital data concealment inspection device, method, and computer-readable memory medium therefor
KR101612893B1 (en) * 2015-08-28 2016-04-15 주식회사 컴트루테크놀로지 Privacy information scanning system and scanning method
CN105630765A (en) * 2015-12-21 2016-06-01 浙江万里学院 Place name address identifying method
JP2017016420A (en) * 2015-07-01 2017-01-19 日本電信電話株式会社 Mask processing system, mask processing method, user terminal, and server
JP2017068677A (en) * 2015-09-30 2017-04-06 キヤノンマーケティングジャパン株式会社 Information processing device, information processing method, and program
KR101742041B1 (en) 2015-08-20 2017-05-31 한국과학기술정보연구원 an apparatus for protecting private information, a method of protecting private information, and a storage medium for storing a program protecting private information
KR20180113295A (en) * 2017-04-06 2018-10-16 닉스테크 주식회사 Security system and method for protecting personal information of file stored in external storage device
WO2021060016A1 (en) * 2019-09-25 2021-04-01 ソニー株式会社 Image processing device, image processing method, program, and image processing system
WO2024070153A1 (en) * 2022-09-28 2024-04-04 富士フイルム株式会社 Confidential information processing device, method for operating same, and data transmission/reception system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185730A (en) * 1997-09-08 1999-03-30 Dainippon Screen Mfg Co Ltd Character filling method
JP2005070939A (en) * 2003-08-21 2005-03-17 Sharp Corp Character string processor, character string processing method, program, and recording medium
JP2006172259A (en) * 2004-12-17 2006-06-29 Ricoh Co Ltd Information masking device
JP2006221560A (en) * 2005-02-14 2006-08-24 Nomura Research Institute Ltd Data substitution device, data substitution method, and data substitution program
JP2008033411A (en) * 2006-07-26 2008-02-14 Nipponkoa Insurance Co Ltd Personal information masking system and method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185730A (en) * 1997-09-08 1999-03-30 Dainippon Screen Mfg Co Ltd Character filling method
JP2005070939A (en) * 2003-08-21 2005-03-17 Sharp Corp Character string processor, character string processing method, program, and recording medium
JP2006172259A (en) * 2004-12-17 2006-06-29 Ricoh Co Ltd Information masking device
JP2006221560A (en) * 2005-02-14 2006-08-24 Nomura Research Institute Ltd Data substitution device, data substitution method, and data substitution program
JP2008033411A (en) * 2006-07-26 2008-02-14 Nipponkoa Insurance Co Ltd Personal information masking system and method

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101282705B1 (en) * 2012-07-30 2013-08-23 주식회사 한글과컴퓨터 Apparatus and method for preventing disclosure of personal information contained in electronic document
JP2014109773A (en) * 2012-12-03 2014-06-12 Inst For Information Industry Electronic digital data concealment inspection device, method, and computer-readable memory medium therefor
JP2017016420A (en) * 2015-07-01 2017-01-19 日本電信電話株式会社 Mask processing system, mask processing method, user terminal, and server
KR101742041B1 (en) 2015-08-20 2017-05-31 한국과학기술정보연구원 an apparatus for protecting private information, a method of protecting private information, and a storage medium for storing a program protecting private information
KR101612893B1 (en) * 2015-08-28 2016-04-15 주식회사 컴트루테크놀로지 Privacy information scanning system and scanning method
JP2017068677A (en) * 2015-09-30 2017-04-06 キヤノンマーケティングジャパン株式会社 Information processing device, information processing method, and program
CN105630765A (en) * 2015-12-21 2016-06-01 浙江万里学院 Place name address identifying method
KR20180113295A (en) * 2017-04-06 2018-10-16 닉스테크 주식회사 Security system and method for protecting personal information of file stored in external storage device
KR102008668B1 (en) * 2017-04-06 2019-08-08 주식회사 한류에이아이센터 Security system and method for protecting personal information of file stored in external storage device
WO2021060016A1 (en) * 2019-09-25 2021-04-01 ソニー株式会社 Image processing device, image processing method, program, and image processing system
CN114424519A (en) * 2019-09-25 2022-04-29 索尼集团公司 Image processing apparatus, image processing method, program, and image processing system
WO2024070153A1 (en) * 2022-09-28 2024-04-04 富士フイルム株式会社 Confidential information processing device, method for operating same, and data transmission/reception system

Also Published As

Publication number Publication date
JP5358549B2 (en) 2013-12-04

Similar Documents

Publication Publication Date Title
JP5358549B2 (en) Protection target information masking apparatus, protection target information masking method, and protection target information masking program
US10552462B1 (en) Systems and methods for tokenizing user-annotated names
CA2906475C (en) Method and apparatus for substitution scheme for anonymizing personally identifiable information
KR101282705B1 (en) Apparatus and method for preventing disclosure of personal information contained in electronic document
Walls et al. Forensic Triage for Mobile Phones with {DEC0DE}
US20200412740A1 (en) Methods, devices and systems for the detection of obfuscated code in application software files
JP5731361B2 (en) Character string conversion method and character string conversion program
Grosvald et al. Free from the Cover Text: A Human-generated Natural Language Approach to Text-based Steganography.
De La Torre-Abaitua et al. On the application of compression-based metrics to identifying anomalous behaviour in web traffic
Benavides-Astudillo et al. Comparative study of deep learning algorithms in the detection of phishing attacks based on HTML and text obtained from web pages
JP5676522B2 (en) Character string conversion method and program
US20200019605A1 (en) File fingerprint generation
CN110532805B (en) Data desensitization method and device
CN116055067B (en) Weak password detection method, device, electronic equipment and medium
Mastjik et al. Comparison of pattern matching techniques on identification of same family malware
JP4807364B2 (en) Information management device
CN113688240B (en) Threat element extraction method, threat element extraction device, threat element extraction equipment and storage medium
JP5513953B2 (en) Masking data generation apparatus and program for testing
CN108664792A (en) A kind of source tracing method of Android malware
Kazmi et al. Unihach: unicode and hash function supported with counting and frequency recurrence of Arabic characters for Quranic text watermarking
Mosquera et al. On detecting messaging abuse in short text messages using linguistic and behavioral patterns
Jeyaseeli et al. Design of an Efficient Smart Phone Data Extraction Tool Using Aho-Corasick Algorithm.
US11847244B1 (en) Private information detector for data loss prevention
Rowe Finding and rating personal names on drives for forensic needs
CN114004604B (en) Method and device for detecting URL data in mail and electronic equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130827

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130902

R150 Certificate of patent or registration of utility model

Ref document number: 5358549

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350