JP2013073277A - 個人情報マスク方法、個人情報マスク装置、個人情報マスクプログラム - Google Patents

個人情報マスク方法、個人情報マスク装置、個人情報マスクプログラム Download PDF

Info

Publication number
JP2013073277A
JP2013073277A JP2011209893A JP2011209893A JP2013073277A JP 2013073277 A JP2013073277 A JP 2013073277A JP 2011209893 A JP2011209893 A JP 2011209893A JP 2011209893 A JP2011209893 A JP 2011209893A JP 2013073277 A JP2013073277 A JP 2013073277A
Authority
JP
Japan
Prior art keywords
mask
character string
personal information
target
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011209893A
Other languages
English (en)
Inventor
Masakatsu Aoki
政勝 青木
Akimichi Tanaka
明通 田中
Masahiro Yuguchi
昌宏 湯口
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011209893A priority Critical patent/JP2013073277A/ja
Publication of JP2013073277A publication Critical patent/JP2013073277A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】Web閲覧履歴を利用するにあたってマスクされた文字列を修正する作業を軽減し、データ収集作業の時間やコストの抑制に貢献する。
【解決手段】個人情報マスク装置1のデータ読込部2は入力データD1を読み込む。マスク対象指定部3は、マスク対象辞書DB8の辞書を用いて入力データD1内でマスク処理するマスク対象範囲を指定する。個人情報検出部4は、個人情報辞書DB9の個人情報辞書に含まれる文字列を前記指定部3で指定されたマスク対象範囲から検出する。個人情報マスク生成部5は、前記検出部4の検出文字列をマスクするためのマスク文字列を生成し、マスク文字列DB10に格納する。個人情報置換部6は、前記検出部4の検出文字列を前記DB10のマスク文字列に置換する。データ出力部7は、置換されたマスク文字列を出力する。
【選択図】図1

Description

本発明は、入力データ中から姓名や住所などの個人情報の部分を検出し、検出された部分をマスク(マスキング)する技術に関する。
インターネット上の情報は容易に拡大し、半永久的に残ることがあり、特に個人情報の流出はプライバシー侵害となるおそれもある。そこで、個人情報保護の観点から姓名や住所などの個人情報を含むデータ中の個人情報の部分を検出し、検出された部分の文字列を読解不能のマスク文字などに置換してマスクする技術が提案されている。
例えば特許文献1の文字列変換装置は、指定されたマスク範囲に含まる文字が変換文字リストの各テーブルに含まれる文字と一致するか否かを判定し、一致すれば個人情報として予め定義された変換規則にしたがってマスク文字などに変換している。
特開2007−102540
しかしながら、特許文献1の文字列変換装置は、マスクしようとする個人情報の文字列と一致した文字列が前記テーブル内にあれば、一般名称であっても誤ってマスクされる問題がある。例えば「コシノジュンコ(登録商標)」などのアパレルブランド名が個人情報の人名と誤ってマスクされてしまうこともある。
このときWeb閲覧履歴を活用してマーケッティングデータを収集する場合などには個人情報保護の観点から履歴データにマスク処理を施すものの、データ解析に必要な箇所、例えばブランド名などの一般名称が誤ってマスクされると人手で正しいデータに修正しなければならない。これではデータ収集作業などの時間やコストの抑制において有利ではない。
本発明は、上述のような従来技術の問題点を解決するためになされたものであり、Web閲覧履歴を活用するにあたって誤ってマスクされた文字列を修正する作業を軽減し、データ収集作業の時間やコストの抑制に貢献することを解決課題としている。
そこで、本発明は、マスク処理をするにあたってマスクする個人情報のほかにマスク対象外となりうる汎用的な文字列と、マスク対象となりうる汎用的な文字列とを利用してマスク処理を実行するマスク対象範囲を限定し、一般名称に対する誤ったマスク処理を抑制する。
例えばブランド名などは事前にマスク対象外の対象外指定文字列として登録し、その文字列から任意文字数の範囲を強制的なマスク対象外範囲とする。このときWebサイト中の「ようこそ」のように個人情報につながる可能性の高い文字列を事前にマスク対象の対象指定文字列に登録し、その文字列から任意文字数の範囲を強制的にマスク対象範囲に再設定する。このマスク対象範囲で個人情報をマスクする。
本発明の一態様は、入力された電子文書中から個人情報の部分を検出し、検出された部分の文字列にマスク処理を施してマスク文字に置換し、置換されたマスク文字列を出力する個人情報マスク装置であって、マスク対象を識別する辞書を用いて前記電子文書内でマスク処理を施すマスク対象範囲を指定するマスク対象指定手段と、個人情報を保持する個人情報辞書に含まれる文字列をマスク対象指定手段で指定されたマスク対象範囲から検出する個人情報検出手段と、個人情報検出手段の検出した文字列をマスクするためのマスク文字列を生成するマスク生成手段と、個人情報検出手段の検出した文字列をマスク生成手段の生成したマスク文字列に置換する置換手段と、を備える。
本発明の他の態様は、入力された電子文書中から個人情報の部分を検出し、検出された部分の文字列にマスク処理を施してマスク文字に置換し、置換されたマスク文字列を出力する装置の実行する個人情報マスク方法であって、マスク対象を識別する辞書を用いて前記電子文書内でマスク処理を施すマスク対象範囲を指定するマスク対象指定ステップと、個人情報を保持する個人情報辞書に含まれる文字列をマスク対象指定手段で指定されたマスク対象範囲から検出する個人情報検出ステップと、個人情報検出手段の検出した文字列をマスクするためのマスク文字列を生成するマスク生成ステップと、個人情報検出手段の検出した文字列をマスク生成手段の生成したマスク文字列に置換する置換ステップと、を有する。
前記各態様において、前記電子文書内から前記辞書に保持された対象外指定文字列の位置を検出し、検出された対象外指定文字列から任意文字数をマスク対象外範囲と設定してマスク対象範囲から除外する一方、前記電子文書内から前記辞書に保持された対象指定文字列の位置を検出し、検出された対象指定文字列から任意文字数の範囲を加えてマスク対象範囲を確定させてもよい。このとき検出された対象指定文字列から任意文字数の範囲がマスク対象外範囲と重複していれば重複範囲をマスク対象範囲に再設定することができる。
なお、本発明は、前記装置としてコンピュータを機能させるプログラムの態様としてもよい。このプログラムは、ネットワークや記録媒体などを通じて提供することができる。
本発明によれば、誤ってマスクされた文字列を修正する作業が軽減され、Web閲覧履歴を活用するにあたってデータ収集作業の時間やコストの抑制に貢献できる。
本発明の実施形態に係る個人情報マスク装置の構成図。 同 処理フロー図。
≪構成例≫
図1に基づき本発明の実施形態に係る個人情報マスク装置を説明する。このマスク装置1は、ユーザが端末(PC.携帯電話など)のWebブラウザにて閲覧したWebページ(電子文書)の閲覧ログを収集するにあたって、閲覧ログに含まれるWebページ中の個人情報をマスクする。
前記マスク装置1は、Webサイトのサーバ群に構成され、通常のコンピュータのハードウェアリソース、例えばCPU.メモリ(RAM)やハードディスクドライブ装置などの記憶装置を備える。このハードウェアリソースとソフトウェアリソース(OS.アプリケーションなど)との協働の結果、前記マスク装置1は、データ読込部2.マスク対象指定部3.個人情報検出部4.個人情報マスク生成部5.個人情報置換部6.データ出力部7.マスク対象辞書DB8.個人情報辞書DB9.マスク文字列DB10を実装する。この各DB8〜10は、前記記憶装置に構築されている。このうち前記DB8にはマスキング対象を識別する辞書が保持され、前記DB9には個人情報から構成される個人情報辞書が保持されている。
前記読込部2は、ユーザのWeb閲覧ログデータ、即ちマスク対象の元データのWebページを入力データD1として読み込む。また、前記対象指定部3は、前記DB8を参照して入力データD1内でマスクする範囲、即ちマスク対象範囲を設定する。
このとき前記対象指定部3は、入力データD1のすべての範囲をマスク対象範囲とする。その後に前記DB8の辞書に保持された対象外指定文字列と一致する文字列を入力データ内から抽出し、抽出された文字列から任意文字数の範囲を強制的にマスク対象外範囲と設定し、マスク対象範囲から除去する。
また、前記DB8の辞書に保持された対象指定文字列と一致する文字列を入力データD1内から抽出する。抽出された文字列から任意文字数の範囲をマスク対象範囲に加えてマスク対象範囲を確定する。ここで加えられる範囲は、マスク対象外範囲と重複していても強制的にマスク対象範囲とされる。この意味で強制力がマスク対象外範囲よりも強く、本実施形態では強制的マスク対象範囲と称する。
前記検出部4は、前記DB9の個人情報辞書に含まれる個人情報の文字列を入力データD1のマスク対象範囲から検出する。また、前記マスク生成部5は、前記検出部4が検出した個人情報の文字列をマスクするマスク文字列を生成する。このマスク文字列は、第三者が当該文字列を可読できないような文字列とする。生成されたマスク文字列は前記DB10に格納される。
前記置換部6は、前記DB10を参照して前記マスク生成部5の生成したマスク文字列で前記検出部4が検出した個人情報の文字列を置換する。また、前記出力部7は、前記置換部6にて置換されたマスク文字列を閲覧ログデータ、即ち出力データD2として出力する。
≪処理内容≫
図2に基づき前記マスク装置1の具体的な処理内容を説明する。ここでは一例として閲覧ログがマーケッティング用データとして利用されるケース、即ちユーザのEC(electronic commerce)サイトにおける購買行動の閲覧ログを中心に収集し、該閲覧ログを解析するケースに基づき説明する。
この閲覧ログをマーケッティング用データとして利用する場合、特にECサイトにおける消費説明において、ユーザがどのような商品の詳細ページを閲覧したかを抽出し、解析することが重要となる。そのため、個人情報のマスク処理によって、商品の説明文の文字列(例えばブランド名など)の一部が誤ってマスクされると、解析が困難となる場合が生じる。このような場合を回避すべく、前記マスク装置1では、マスク範囲の適正化を図っている。
(1)事前処理
前記マスク装置1のマスク処理にあたっては事前に前記DB8.9に辞書内容を登録しておく必要がある。すなわち、前記DB8のマスク対象辞書に対象外指定文字列と対象指定文字列とを登録する。この対象外指定文字列は、マスク処理に相応しくない文字列、例えば商品名・ブランド・価格・商品説明などの文字列とする。この文字列はECサイト内のWebページから収集すればよい。また、マスク対象外範囲を指定する文字数、即ち対象外指定文字列に後続する文字数を登録しておくものとする。この文字数はパラメータ変数とし、ここでは一例として200文字に登録されているものとする。
対象指定文字列は、マスク処理すべき個人情報の文字列を表す用語、例えば氏名・住所・電話番号などの項目名が該当する。また、ECサイトのトップページなどで氏名の前に挿入される文言の文字列、例えば「ようこそ」や「こんにちは」なども該当する。ここでも強制的マスク対象範囲を指定する文字数、即ち対象指定文字列に後続する文字数を登録しておくものとする。この文字数もパラメータ変数とし、ここでは一例として50文字と登録されているものとする。
また、前記DB9の個人情報辞書には、ユーザが自身の個人情報となりうる氏名・住所・電話番号などを登録しておくものとする。このとき氏名として「姓」と「名」に分けて登録したり、カタカナ文字やアルファベット表記の文字、ハンドル名の文字などを指定することもできる。
(2)マスク処理
事前処理が完了していることを前提に前記マスク装置1のマスク処理が開始されるものとする。このマスク処理の順序は、(a)マスク対象範囲の確定(図2中のS01〜S04)、(b)マスク対象範囲のマスク処理(図2中のS05〜S08)の順で実行する。
S01:処理が開始されると前記読込部2にて入力データD1、即ち閲覧ログ中の各Webページをテキストデータとして読み込んで、前記マスク装置1に取り込む。ここでは取り込む閲覧ログは、ECサイトのサーバに蓄積されているものとする。
S02:前記対象指定部3は、初期設定として入力データD1内のすべての文字をマスク対象範囲D1´に設定する(S02)。この初期設定のマスク対象範囲D1´に対してS03.S04の処理が施される。
S03:前記対象指定部3は、前記DB8のマスク対象辞書から対象外指定文字列を抽出し、抽出された対象外指定文字列が入力データD1中に存在するか否かの検出処理を実行する。この結果、対象外指定文字列が検出されれば、検出された文字列から指定する文字数の範囲、即ち該文字列から200文字の位置までをマスク対象外範囲に設定する。
この処理(S03)をマスク対象辞書に対象外指定文字列として登録されたすべての文字列について実行する。このとき文字列毎に処理してもよく、各文字列を並行して処理してもよいものとする。なお、入力データD1から対象外指定文字列が検出されなければ、マスク対象外範囲は設定されない。
S04:前記対象指定部3は、前記DB8のマスク対象辞書から対象指定文字列を抽出し、抽出された対象指定文字列が入力データD1中に存在するか否かの検出処理を実行する。この検出処理をマスク対象辞書に対象指定文字列として登録されたすべての文字列について実行する。この処理も文字列毎に処理してもよく、各文字列を並行して処理してもよいものとする。
この結果、対象指定文字列が検出されれば、検出された文字列から指定する文字数の範囲、即ち該文字列から50文字の位置を検出する。この検出位置がS03で設定したマスク対象外範囲に含まれている場合、即ちマスク対象外範囲と強制的マスク対象範囲とが重複する場合は、その位置までの重複範囲をマスク対象範囲D1´に再設定する。
一方、対象指定文字列が検出できない場合や、対象指定文字列から50文字の位置がマスク対象外範囲に含まれていない場合、あるいはS03で対象外範囲が設定されていない場合にはマスク対象範囲D1´の再設定は行われない。
なお、S01〜S04によってマスク対象範囲D1´の設定が確定され、該確定されたマスク対象範囲D1´にてS05以降のマスク処理が行われる。
S05:前記検出部4は、入力データD1のマスク対象範囲D1´に対して前記DB9の個人情報辞書に登録された各文字列が含まれているか否かの検出処理を実行し、登録された文字列が含まれていれば、その文字列を抽出する。なお、図2中では省略されているが、該文字列が含まれていなければマスク処理の必要が無いため処理を終了する。
S06:前記マスク生成部5は、S05で抽出された各文字列について、その文字列をマスクするためのマスク文字列を生成する。このマスク文字列としては、「*」のような伏文字でもよく、あるいは文字列長と文字列とのハッシュ値とを利用した「*6:EA1A*」のような文字列でもよく、マスク文字列の生成方法は制限しないものとする。
S07.S08:前記置換部6は、S05で抽出された各文字列をS06で生成されたマスク文字列で置換する(S07)。その後に前記出力部7は、S07でマスク文字列に置換されたテキストデータD2をマスク処理済の閲覧ログとしてモニタなどに出力する(S08)。ここで出力された閲覧ログは、ユーザの購買行動の解析のためのマーケッティング用データと利用される。
このように前記マスク装置1によれば、S03で対象外指定文字列から指定文字数の範囲(該文字列から200文字の位置まで)がマスク対象外範囲に設定されるため、従来よりもマスクされる範囲が限定される。すなわち、商品の説明文の文字列(例えばブランド名など)をS05以降のマスク処理の対象外に設定できるため、該商品説明の文字列などに対する誤ったマスクを回避できる。したがって、誤ってマスクされた文字列を修正する作業が軽減され、Web閲覧履歴を活用するにあたってデータ収集作業の時間やコストの抑制に貢献できる。
このときマスク対象外範囲にS04の検出位置が含まる場合、即ち強制的マスク対象範囲とマスク対象外範囲とが重複する場合は、その位置までがマスク対象範囲D1´に再設定される。この結果、S03のマスク対象外範囲に個人情報が含まれていても、S04でマスク対象範囲D1´に再設定され、この点で個人情報保護は尊重されている。
≪S03.S04の処理例≫
以下、前記マスク装置1の主要処理、即ちS03.S04にてマスク対象範囲を確定する処理例を説明する。ここではS03にて対象外指定文字列が複数検出され、S04の処理段階にて対象指定文字列がマスク対象外範囲に存在しているものとする。
具体的には、この処理例では
(a)対象外指定文字列を「商品名」「ブランド名」とする。
(b)指定対象文字列を「氏名」とする。
(c)E1=”商品名”、E2=”ブランド名”、W1=”氏名”
とする。
また、入力データD1として閲覧ログのテキストデータを用いる。ここでは該テキストデータに1500文字数あるとし、該テキストデータ内のE1,E2,W1が出現する位置をそれぞれ検出する。この検出結果は、
Pos_E1=(10,562,768)
Pos_E2=(821)
Pos_W1=(37,1023)
とする。
(1)マスク対象外範囲の設定
対象外指定文字列の位置から一定文字数分を加算し、マスク対象外範囲として範囲の終点の位置を算出する(S03)。このとき各対象外指定文字列に対し、同一の文字数を加算してもよいし、対象外指定文字列毎に加算する文字数を変更しても構わない。本例では、E1に対する範囲文字数を300,E2に対する範囲文字数を200とする。そして、マスク対象外範囲の始点と終点の組み合わせを以下のように算出する。
ar_E1=(10,309),(562,861),(768,1067)
ar_E2=(821,1020)
この算出後にマスク対象外範囲の統合を行う。すなわち、一方のマスク対象外範囲の始点が他方のマスク対象外範囲の終点よりも小さい場合に二つの範囲を統合する。例えば始点a.終点bのマスク対象範囲と始点c.終点dのマスク対象範囲との統合にあたっては、始点cよりも終点bが大きければ終点bを終点dに置き換え、始点cと終点dの範囲は削除する。このとき終点b<終点dの場合にのみ置き換え、終点b>終点dの場合は置き換えない。
前述したar_E1とar_E2の組合例によれば、ar_E1の2番目と3番目、およびar_E2がそれぞれ重なるため、統合することができる。この統合にあたっては、
ar_E1の2番目の終点(861)とar_E1の3番目の始点(768)とを比較し、
ar_E1の2番目の終点(861)>ar_E1の3番目の始点(768)で、
ar_E1の2番目の終点(861)<ar_E1の3番目の終点(1067)であるので、
ar_E1の2番目の終点(861)をar_E1の3番目の終点(1067)で置き換え、「ar_E1」の3番目の範囲は削除する。
つぎにar_S1の2番目の終点(上記の例では1067に置き換えた後)とar_E2の始点(821)とを比較する。この場合は、
ar_E1の2番目の終点(1067)>ar_E2の始点(821)であり
ar_E1の2番目の終点(1067)>ar_E2の終点(1020)であるため、
ar_E2の範囲はar_E1の2番目の範囲に含まれるため、これに吸収されることになる。このような操作によりマスク対象外範囲は、
ex_area=(10,309),(562,1067)
と算出される。
(2)強制的マスク対象範囲の設定
続いて対象指定文字列により強制的マスク対象範囲の設定を行う(S04)。ここでは対象指定文字列W1の出現位置と範囲を指定する文字数を加算して強制的マスク対象範囲を算出する。このとき対象指定外文字列と同様に範囲の文字数を一定値としてもよく、文字列毎に文字数を変更してもよい。ここでは対象指定文字列は一つだけなので、範囲文字数を50とする。前述の例によれば、強制的マスク対象範囲の始点と終点の組み合わせは、
ar_W1=(37,86),(1023,1072)
と算出される。
(3)マスク対象範囲の再設定
さらにマスク対象範囲D1´の再設定を行う(S04)。すなわち、マスク対象外範囲内に上記で求めた強制的マスク対象範囲が含まれる場合は、その範囲をマスク対象外範囲から除外する。このとき強制的マスク対象範囲の始点がマスク対象外範囲の始点と終点の間にあるかどうかを判定し、マスク対象外範囲を見直していく。
ここでは前述の例から各マスク対象外範囲の始点と終点は、
ex_area[0].start=10
ex_area[0].end=309
ex_area[1].start=562
ex_area[1].end=1067
である一方、
強制マスク対象範囲の始点と終点は、
ar_W1[0].start=37
ar_W1[0].end=86
ar_W1[1].start=1023
ar_W1[1].end=1072
であるとし、
ar_W1の各始点・各終点とex_areaの各始点・各終点とをそれぞれ比較していく。
その結果、
ex_area[0].start<ar_W1[0].start
ar_W1[0].start<ex_area[0].end
かつ
ar_W1[0].end<ex_area[0].end
であるため、
ar_W1[0]の範囲はex_area[0]に含まれることが分かる。この場合、マスク対象外範囲ex_area[0]を分割する。
ここではマスク対象外範囲の終点を強制マスク対象範囲の始点に置き換え、強制マスク対象範囲の終点からマスク対象外範囲の終点までのマスク対象外範囲を一つ追加する。すなわち、
ex_area[0].start=10
ex_area[0].end=36
ex_area[2].start=87
ex_area[2].end=309
このとき、添字は要素数から加算して追加する。また、置き換える際の位置は置き換え元から1少ない文字数としている。
続いて、2つ目の要素に対して比較し、
ex_area[1].start<ar_W1[1].start
ar_W1[1].start<ex_area[1].end
かつ
ar_W1[1].end>ex_area[1].end
であるため、
ar_W1[1]は、ex_area[1]の一部に重なることがわかる。この場合、マスク対象外範囲ex_area[1]の一部を削除する。ここではマスク対象外範囲の終点を強制マスク対象範囲の始点に置き換える。
すなわち、
ex_area[1].start=562
ex_area[1].end=1022
とする。この場合も置き換える際の位置は置き換えもとから1少ない文字数としている。
以上から、マスク対象外範囲を再設定でき、この逆数的範囲をマスク対象範囲D1´に確定する。すなわち、マスク対象外範囲は昇順で整列することで、
ex_area=(10,36),(87,309),(562,1022)
となるので、その逆数的範囲を算出し、
msk_area=(1,9),(37,86),(310,561),(1023,1500)を確定されたマスク対象範囲D1´に設定する。
≪プログラムなど≫
本発明は、前記マスク装置1の各部2〜10の一部もしくは全部として、コンピュータを機能させる個人情報マスクプログラムとして構成することもできる。このプログラムによれば、S01〜S08の一部あるいは全部をコンピュータに実行させることが可能となる。
前記プログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,BD−ROM,BD−R,BD−REなどの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。
1…個人情報マスク装置
2…データ読込部
3…マスク対象指定部
4…個人情報検出部
5…個人情報マスク生成部
6…個人情報置換部
7…データ出力部
8…マスク対象辞書DB
9…個人情報辞書DB
10…マスク文字列DB

Claims (7)

  1. 入力された電子文書中から個人情報の部分を検出し、検出された部分の文字列にマスク処理を施してマスク文字に置換し、置換されたマスク文字列を出力する個人情報マスク装置であって、
    マスク対象を識別する辞書を用いて前記電子文書内でマスク処理を施すマスク対象範囲を指定するマスク対象指定手段と、
    個人情報を保持する個人情報辞書に含まれる文字列をマスク対象指定手段で指定されたマスク対象範囲から検出する個人情報検出手段と、
    個人情報検出手段の検出した文字列をマスクするためのマスク文字列を生成するマスク生成手段と、
    個人情報検出手段の検出した文字列をマスク生成手段の生成したマスク文字列に置換する置換手段と、
    を備えることを特徴とする個人情報マスク装置。
  2. マスク対象指定手段は、前記電子文書内から前記辞書に保持された対象外指定文字列の位置を検出し、検出された対象外指定文字列から任意文字数をマスク対象外範囲と設定してマスク対象範囲から除外する一方、
    前記電子文書内から前記辞書に保持された対象指定文字列の位置を検出し、検出された対象指定文字列から任意文字数の範囲を加えてマスク対象範囲を確定する
    ことを特徴とする請求項1記載の個人情報マスク装置。
  3. マスク対象指定手段は、検出された対象指定文字列から任意文字数の範囲がマスク対象外範囲と重複していれば重複範囲をマスク対象範囲に再設定する
    ことを特徴とする請求項2記載の個人情報マスク装置。
  4. 入力された電子文書中から個人情報の部分を検出し、検出された部分の文字列にマスク処理を施してマスク文字に置換し、置換されたマスク文字列を出力する装置の実行する個人情報マスク方法であって、
    マスク対象を識別する辞書を用いて前記電子文書内でマスク処理を施すマスク対象範囲を指定するマスク対象指定ステップと、
    個人情報を保持する個人情報辞書に含まれる文字列をマスク対象指定手段で指定されたマスク対象範囲から検出する個人情報検出ステップと、
    個人情報検出手段の検出した文字列をマスクするためのマスク文字列を生成するマスク生成ステップと、
    個人情報検出手段の検出した文字列をマスク生成手段の生成したマスク文字列に置換する置換ステップと、
    を有することを特徴とする個人情報マスク方法。
  5. マスク対象指定ステップにおいて、前記電子文書内から前記辞書に保持された対象外指定文字列の位置を検出し、検出された対象外指定文字列から任意文字数をマスク対象外範囲と設定してマスク対象範囲から除外する一方、
    前記電子文書内から前記辞書に保持された対象指定文字列の位置を検出し、検出された対象指定文字列から任意文字数の範囲を加えてマスク対象範囲を確定する
    ことを特徴とする請求項4記載の個人情報マスク方法。
  6. マスク対象指定ステップにおいて、検出された対象指定文字列から任意文字数の範囲がマスク対象外範囲と重複していれば重複範囲をマスク対象範囲に再設定する
    ことを特徴とする請求項5記載の個人情報マスク装置。
  7. 請求項1〜3のいずれか1項に記載の個人情報マスク装置の各手段としてコンピュータを機能させることを特徴とする個人情報マスクプログラム。
JP2011209893A 2011-09-26 2011-09-26 個人情報マスク方法、個人情報マスク装置、個人情報マスクプログラム Pending JP2013073277A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011209893A JP2013073277A (ja) 2011-09-26 2011-09-26 個人情報マスク方法、個人情報マスク装置、個人情報マスクプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011209893A JP2013073277A (ja) 2011-09-26 2011-09-26 個人情報マスク方法、個人情報マスク装置、個人情報マスクプログラム

Publications (1)

Publication Number Publication Date
JP2013073277A true JP2013073277A (ja) 2013-04-22

Family

ID=48477772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011209893A Pending JP2013073277A (ja) 2011-09-26 2011-09-26 個人情報マスク方法、個人情報マスク装置、個人情報マスクプログラム

Country Status (1)

Country Link
JP (1) JP2013073277A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017027143A (ja) * 2015-07-16 2017-02-02 富士ゼロックス株式会社 表示制御装置及びプログラム
JP2018026037A (ja) * 2016-08-12 2018-02-15 株式会社リコー 情報処理装置、情報処理システム、プログラムおよび情報処理方法
WO2024070153A1 (ja) * 2022-09-28 2024-04-04 富士フイルム株式会社 機密情報処理装置、その作動方法、及びデータ送受信システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058380A (ja) * 2005-08-23 2007-03-08 Hitachi Software Eng Co Ltd 電子文書マスキングシステム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058380A (ja) * 2005-08-23 2007-03-08 Hitachi Software Eng Co Ltd 電子文書マスキングシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017027143A (ja) * 2015-07-16 2017-02-02 富士ゼロックス株式会社 表示制御装置及びプログラム
JP2018026037A (ja) * 2016-08-12 2018-02-15 株式会社リコー 情報処理装置、情報処理システム、プログラムおよび情報処理方法
WO2024070153A1 (ja) * 2022-09-28 2024-04-04 富士フイルム株式会社 機密情報処理装置、その作動方法、及びデータ送受信システム

Similar Documents

Publication Publication Date Title
WO2017076188A1 (zh) 一种用于处理服务调用信息的方法与设备
Riadi Forensic investigation technique on android's blackberry messenger using nist framework
JP5358549B2 (ja) 保護対象情報マスキング装置、保護対象情報マスキング方法および保護対象情報マスキングプログラム
CN107395650B (zh) 基于沙箱检测文件识别木马回连方法及装置
JP6282217B2 (ja) 不正プログラム対策システムおよび不正プログラム対策方法
WO2017206476A1 (zh) 一种cpu占用的检测方法、装置及设备
CN106611029B (zh) 提高网站站内搜索效率的方法和装置
JP2013073277A (ja) 個人情報マスク方法、個人情報マスク装置、個人情報マスクプログラム
JP6237632B2 (ja) テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム
CN111666101A (zh) 软件同源分析方法及装置
CN106484746B (zh) 网站转化事件的分析方法及装置
JP2013114287A (ja) 文字列変換装置、文字列変換方法及び文字列変換プログラム
JP5676522B2 (ja) 文字列変換方法及びプログラム
JP6438346B2 (ja) 操作支援装置、操作支援プログラムおよび操作支援方法
CN112463533A (zh) 日志数据解析方法、装置、电子装置和存储介质
JP6623128B2 (ja) ログ分析システム、ログ分析方法及びログ分析装置
JP2018506783A (ja) 要素識別子の生成
RU2583712C2 (ru) Система и способ обнаружения вредоносных файлов определенного типа
WO2017054731A1 (zh) 处理被劫持浏览器的方法及设备
WO2013143362A1 (zh) 一种为文本添加超级链接的方法,装置以及计算机存储介质
CN110598115A (zh) 一种基于人工智能多引擎的敏感网页识别方法及系统
JP6194180B2 (ja) 文章マスク装置及び文章マスクプログラム
JP2016057715A (ja) 図形式プログラム解析装置
CN114157734A (zh) 数据解析方法、装置、电子设备及存储介质
JP2009199172A (ja) 情報処理システム、プログラム中の類似箇所特定方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140624