JP4206466B2 - 個人情報探索プログラム - Google Patents
個人情報探索プログラム Download PDFInfo
- Publication number
- JP4206466B2 JP4206466B2 JP2007321701A JP2007321701A JP4206466B2 JP 4206466 B2 JP4206466 B2 JP 4206466B2 JP 2007321701 A JP2007321701 A JP 2007321701A JP 2007321701 A JP2007321701 A JP 2007321701A JP 4206466 B2 JP4206466 B2 JP 4206466B2
- Authority
- JP
- Japan
- Prior art keywords
- personal information
- character
- character string
- information file
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
また、個人情報の洗い出しに漏れがあると、上記義務を果たせなくなるだけでなく、そ
の個人情報の状態を管理できず、個人情報の不用意な流出・漏洩や個人情報の不正利用を招くおそれもある。
本発明は、このような状況に鑑み創案されたもので、個人情報ファイルを効率よく短時間で確実に探索できるようにすることを目的としている。
本発明の個人情報探索プログラム(請求項2)は、記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させるものであって、前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴としている。
本発明の個人情報探索プログラム(請求項3)は、記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させるものであって、前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII(American Standard Code for Information
Interchange)文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定するとともに、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致することを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴としている。
本発明の個人情報探索プログラム(請求項4)は、記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させるものであって、前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定するとともに、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴としている。
本発明の個人情報探索プログラム(請求項5)は、記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させるものであって、前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するとともに、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致することを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴としている。
本発明の個人情報探索プログラム(請求項6)は、記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させるものであって、前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するとともに、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴としている。
本発明の個人情報探索プログラム(請求項7)は、記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させるものであって、前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定し、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するとともに、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致することを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴としている。
本発明の個人情報探索プログラム(請求項8)は、記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させるものであって、前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定し、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するとともに、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴としている。
〔1〕本実施形態の個人情報管理システムの構成
図1は本発明の一実施形態としての個人情報管理システムの構成を示すブロック図で、この図1に示すように、本実施形態の個人情報管理システム1は、複数のクライアント端末10のほかに個人情報管理サーバ20およびファイルアクセス管理サーバ30をそなえて構成され、これらの端末10およびサーバ20,30がネットワーク〔例えば、社内LAN(Local Area Network)〕40を介して相互に通信可能に接続されている。
照しながら後述するような機能構成を有している。
個人情報管理サーバ20は、複数のクライアント端末10およびファイルアクセス管理サーバ30とネットワーク40を介して相互に通信可能に接続され、各クライアント端末10における個人情報ファイルを管理するもので、図4を参照しながら後述するような機能構成を有している。
図2は本実施形態の各クライアント端末10の機能構成を示すブロック図で、この図2に示すように、本実施形態のクライアント端末(個人情報管理機能付き情報処理装置)10は、各種処理を実行するCPU(Central Processin Unit;演算処理部)10aと、個人情報等のデータ集合体(電子ファイル)を保持しうる記憶部10bとをそなえるほか、個人情報管理サーバ20から提供される検疫テーブル10cや、記憶部10bに保持されるデータ集合体(電子ファイル)のPマーク(プライバシレベルマーク;個人情報ファイルである可能性の高さを示すレベルで、後述する判定値によって決定されるレベル)を保持するPマークテーブル10dをそなえて構成されている。
)をログ(ローカルキャッシュデータベース)に書き出すものである。また、本実施形態では、この個人情報探索手段11で得られた探索結果(判定値)に基づいて決定されたPマークがPマークテーブル10dに登録される。この個人情報探索手段11の機能構成の詳細については、図3を参照しながら後述する。
制御手段14は、個人情報管理サーバ20からインストールされる個人情報探索プログラムを実行することにより図7および図8を参照しながら後述するごとく動作するもので、CPU使用率監視手段12によって監視されているCPU10aの使用率が所定閾値以下である場合に個人情報探索手段11を作動させる一方、その使用率が所定閾値を超えている場合に個人情報探索手段11の動作を停止させるほか、入出力監視手段13によって入出力動作の発生を検知した時点で個人情報探索手段11を作動させるものである。特に、本実施形態の制御手段14は、CPU10aの使用率が所定閾値(最低閾値)を下回ると個人情報探索手段11を作動させ、CPU10aの使用率が所定閾値(最高閾値)を上回ると個人情報探索手段11をアイドル状態(探索ホール状態)にするもので、個人情報探索手段11をスクリーンセーバー的に動作させる。
図3は本実施形態の各クライアント端末10における個人情報探索手段11の詳細な機能構成を示すブロック図で、この図3に示すように、本実施形態の個人情報探索手段11は、抽出手段111,切出手段112,第1判定手段113,文字判定手段114,照合手段115および第2判定手段116としての機能を有しており、これらの機能も、CPU10aが、後述するごとく個人情報管理サーバ20からインストールされた個人情報探索プログラムを実行することによって実現される。
格納するもので、前記テキスト抽出エンジンとして機能するものである。なお、上記ファイルバッファには、2バイトコード文字(全角文字)がファイルバッファの終端で欠けないように取り込まれる。また、切出手段112によってファイルバッファから後述するデータ整形用バッファ(図示略)へデータが切り出されて取り込まれると、その分だけデータが上記ファイルバッファに取り込まれるようになっている。
ここで、上記所定の区切り位置としては、予め設定された区切り文字の出現位置、もしくは、1バイトコード文字と2バイトコード文字との境界位置(半角文字/ASCII文字のあとに全角文字が続く部分もしくは全角文字のあとに半角文字/ASCII文字が続く部分)、もしくは、全角算用数字「0」〜「9」と全角算用数字およびハイフンを除く文字との境界位置が含まれている。また、区切り文字は、データの区切りであるデリミタ(delimiter)、具体的には、半角スペース,半角カンマ(半角カンマ+半角スペースも
半角カンマと見なす),タブ文字(半角),CR(Carrige Return),LF(Line Feed
)のほか、「:(コロン)」,「;(セミコロン)」,「>」,「}」,「]」とする。
」+「一文字以上のASCII」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることとする。この場合、最短の電子メールアドレスは例えば「a@a.a」となり、また、例えば「123@45.67」のごとく英字以外の文字(例えば数字)で終わるような文字列は電子メールアドレスでないと判定されることになる。なお、上記電子メールアドレス判定条件によれば、5バイトに満たないデータは電子メールアドレスの判定対象にならず、判定処理を行なわない。
、上記所定範囲は、氏名の文字数として一般的(適切)な数の範囲、例えば2以上6以下に設定される。より具体的には、文字判定手段114による判定条件は、上記文字列が、4バイト〜12バイトの2バイトコード文字であり、且つ、0x889F〜0xEEECの範囲内のデータ(Shift-JISの漢字領域)であり、且つ、第2バイトは0x40〜0x7Eまたは0x80〜0xFC
(Shift-JISの仕様)であり、先頭文字が、日本人に多い苗字上位3000個に属する苗
字の頭文字と一致することである。上位3000個の苗字を対象とすることで、日本人の8割以上を網羅することができる。
図4は本実施形態の個人情報管理サーバ20の機能構成を示すブロック図で、この図4に示すように、本実施形態の個人情報管理サーバ20は、各種処理を実行するCPU20aと、各クライアント端末10からのログ情報や個人情報ファイルなどを格納・保存するデータベース(RDB:Relational DataBase)20bと、このデータベース20bに保
存されたログ情報や個人情報を含む各種情報を表示する表示部20cとをそなえて構成されている。
トールするものである。
管理コンソール24は、各クライアント端末10に対して指示する判定条件(上記検疫テーブル10cや、個人情報ファイルやPマークを判定するために必要になる所定閾値など)を設定して管理するものである。検疫テーブル10cには、上述した電話番号判定条件,電子メールアドレス判定条件,住所判定条件,文字判定条件(上記所定範囲)や不適切文字/不適切文字列が設定される。
表示制御手段26は、表示部20cに各種情報を表示させるべく表示部20cの表示状態を制御するものであり、送受信手段27は、ネットワーク40を介して各クライアント端末10との間で各種情報を送受信するものである。
図5は本実施形態のファイルアクセス管理サーバ30の機能構成を示すブロック図で、この図5に示すように、本実施形態のファイルアクセス管理サーバ30は、例えば、個人情報管理サーバ20(個人情報管理手段25)から指示された個人情報ファイル(Pマー
クのランクが“P4”の個人情報ファイル)を管理対象とするもので、各種処理を実行するCPU30aと、後述するごとく暗号鍵や復号鍵などを保存する記憶部30bとをそなえて構成されている。なお、ここでは、Pマークのランクが“P4”の個人情報ファイルを管理対象としているが、Pマークのランクに関係なく、個人情報探索手段11によって個人情報ファイルであると判定された全ての電子ファイルをファイルアクセス管理サーバ30の管理対象としてもよい。
個人情報ファイル受信手段31aは、個人情報管理サーバ20からネットワーク30経由で管理対象の個人情報ファイルを受信するものである。
暗号化ファイル送信手段31bは、暗号化手段33によって暗号化(鍵掛け)されたファイル(以下、暗号化ファイルという)を、ネットワーク40経由で個人情報管理サーバ20に送信するものである。
あることをファイルアクセス管理サーバ30で判定・認証するために必要な情報であり、ファイルアクセス管理サーバ30によるサービスの利用者についてこのファイルアクセス管理サーバ30(記憶部30b)に予め登録されたユーザIDおよびパスワードを含んでいる。これらのユーザIDおよびパスワードは、暗号化ファイルを開く際に利用者がキーボードやマウスを操作することにより入力される。
次に、図6〜図10を参照しながら、上述のごとく構成された本実施形態の個人情報管理システム1の動作について説明する。
本実施形態の個人情報探索手段11では、以下のように、電話番号,電子メールアドレス,住所および氏名の出現頻度をそれぞれ数値化し、個人情報ファイルの特定・探索を行なっている。その際、切出手段112によって切り出された文字区間に、個人情報において出現し得ない文字/文字列として予め設定された不適切文字/不適切文字列が含まれている場合、その文字区間は、個人情報要素(本実施形態では氏名)には該当しないものと見なされて除外される一方、切出手段112によって切り出された文字区間に、個人情報において出現し得ない文字/文字列として予め設定された不適切文字/不適切文字列が含まれていない場合、その文字区間は、個人情報をなす個人情報要素に該当するものと見なされて、つまり個人情報要素が出現したものと見なされ、出現回数のカウントアップを行なっている。
グラムがインストールされる。
」+「.(ドット)」+「一文字以上のASCII」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であれば、上記文字列が電子メールアドレスに該
当するものと判定され(ステップS107のYESルート)、その旨が第2判定手段116に通知され、この第2判定手段116において、電子メールアドレスの出現回数に対応する計数値が1だけカウントアップされ(ステップS108)、ステップS114の処理へ移行する。
もに、Pマークのランク付け(本実施形態では“P1”〜“P4”の4つ)が行なわれる(ステップS116)。個人情報ファイルの判定結果やPマークのランク付けの結果は、Pマークテーブル10dに登録されるとともに、送受信手段16およびネットワーク40を介して、個人情報管理サーバ20にも送信され(ステップS117)、個人情報管理サーバ20において、収集手段23によりデータベース20bに保存される(図9のステップS404参照)。
次に、図7および図8を参照しながら、個人情報探索手段11(個人情報探索プログラム)の作動タイミングについて説明する。ここで、図7および図8は本実施形態の各クライアント端末10における制御手段14の動作を説明するためのフローチャートである。
本実施形態の制御手段14は、図7に示すフローチャート(ステップS21〜S27)に従うCPU使用率による作動制御と、図8に示すフローチャート(ステップS31〜S33)に従う入出力動作(I/O動作)による作動制御とを実行するようになっている。
また、各クライアント端末10においては、アクセス監視手段15により、Pマークを付与された電子ファイル(個人情報探索手段11で個人情報ファイルであると判定された電子ファイル)が監視され、その電子ファイルに対するアクセス(例えば、リネイム,コピー,消去,移動などによるデータ変更)が生じた場合には、その旨が、ログ情報として
書き出され、送受信手段16およびネットワーク40を介して個人情報管理サーバ20に送信され、個人情報管理サーバ20において、収集手段23によりデータベース20bに保存される。
次に、個人情報管理サーバ20の動作について、図9に示すフローチャート(ステップS401〜S413)に従って説明する。
前述した通り、本実施形態の個人情報管理システム1を構築する際には、まず、個人情報管理サーバ20として機能すべきコンピュータに個人情報管理サーバ用プログラムをインストールし、そのコンピュータが個人情報管理サーバ用プログラムを実行することにより個人情報管理サーバ20としての機能(クライアント情報収集手段21,インストール手段22,収集手段23,管理コンソール24,個人情報管理手段25,表示制御手段26および送受信手段27)を果たす。
まず、Pマークレベル“P1”の個人情報ファイルの有無が判定され(ステップS405)、Pマークレベル“P1”の個人情報ファイルがある場合(ステップS405のYESルート)、その旨がログとしてデータベース20bに記録される(ステップS406)。
通知されるとともに、その個人情報ファイルの返却が利用者に指示される(ステップS410)。
次に、図10および図11を参照しながら、ファイルアクセス管理サーバ30の動作について説明する。
まず、図10に示すフローチャート(ステップS51〜S54)に従って、本実施形態のファイルアクセス管理サーバ30によるファイル変換動作を説明する。
クライアント端末10の利用者や個人情報管理サーバ20の利用者(管理者)が、暗号化ファイルの内容を閲覧しようとする場合、その利用者によって認証情報が入力されファイルアクセス管理サーバ30へ送信される。そして、その認証情報がネットワーク40経由で認証情報受信手段31cにより受信されると(ステップS61のYESルート)、判定手段34は、認証情報に含まれるユーザIDによって記憶部30bを検索し、そのユーザIDに対応する登録パスワードを記憶部30bから読み出し、認証情報に含まれるパスワードと、記憶部30bから読み出された登録パスワードとを比較し、これらのパスワードが一致するか否かの判定(クライアント認証;ステップS62)を行なう。
YESルート)、復号鍵送信手段31dにより、暗号化ファイルを復号化するための復号鍵が記憶部30bから読み出され、そのクライアント端末10もしくは個人情報管理サーバ20にネットワーク40経由で送信される(ステップS64)。
このように、本発明の一実施形態としての個人情報探索プログラムをコンピュータ(CPU10a)において実行することによって実現される個人情報探索手段11によれば、第2判定手段116において、電話番号,電子メールアドレス,住所のいずれにも該当せず且つ不適切文字/不適切文字列を含む文字区間は、個人情報に関するものではないと見なされる一方、電話番号,電子メールアドレス,住所のいずれにも該当せず且つ不適切文字/不適切文字列を含まない文字区間は、氏名に関するものであると見なされる。
また、第2判定手段116において不適切文字/不適切文字列を含まない文字区間を全て氏名に該当するものと見なすので、氏名についての不適切文字/不適切文字列を含まない電子ファイル、即ち、氏名情報を含む可能性が高く個人情報ファイルである可能性の高い電子ファイルを確実に探索することが可能になる。つまり、本実施形態によって個人情報ファイルであると判定される電子ファイルの数は、従来手法よりも多くなり、個人情報ファイルである可能性の高い電子ファイル(疑わしい電子ファイル)を確実に洗い出すことができる。
による照合対象の文字区間が、より氏名の可能性の高い文字区間に絞り込まれることになり、氏名の照合精度を向上させることができるとともに、氏名の照合処理を高速に行なうことができる。また、文字数が6を超える長い文字区間が、照合手段115による照合対象から除外されるので、氏名の照合処理のさらなる高速化、つまりは個人情報ファイルの探索処理のさらなる高速化に寄与することになる。
マーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のAS
CII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを設定することにより、「@(アットマーク)」を単価や単位の表示に用いて
いる文字列であって、「@(アットマーク)」のあとに「一文字以上の半角数字」+「.(ドット)」+「一文字以上の半角数字」となる数字列(例えば「123@45.67」)を、電子
メールアドレスとして誤って判定することを確実に防止することができる。従って、電子メールアドレスなどの個人情報要素の判定を確実に行なえるようになり、個人情報ファイルを効率よく短時間で確実に探索することができる。
個当たりの値段や重さを表示する際、“@100.00”とか“@10.55”というように“@”を用いる場合がある。このため、電子メールアドレス判定条件が、単に判定対象の文字区間における文字列に「一文字以上のASCII文字」+「@(アットマーク)」+「一文字以
上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字
列が含まれていることとすると、上記のような“@100.00”や“@10.55”を含む文字列も
電子メールアドレスとして誤って認識してしまうことになるが、文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件に追加することで、上述のような数字列“@100.00”や“@10.55”を含む文字列を電子メールアドレスとして誤認識するのを確
実に防止することができるのである。
間の先頭文字と47都道府県名もしくは市区郡名の頭文字との一致をみることで、「市」,「区」,「郡」を途中に含む文字列であるが住所とは全く関係の無い文字列を誤って住所として判定することがなくなり、47都道府県名もしくは市区郡名の完全一致を判定する場合に比べ極めて短時間で、住所としての確度の高い文字区間を効率よく確実に探索することができる。
理者のみがアクセス可能なフォルダに格納したり、個人情報ファイルに対するアクセスをファイルアクセス管理サーバ30に管理させたりすることが可能で、個人情報の不用意な流出・漏洩や個人情報の不正利用などをより確実に防止することができる。
上述した実施形態では、クライアント−サーバ構成を採用した個人情報管理システム1について説明したが、クライアント−サーバシステムを構築することなく、図12に示すような構成のシステム(個人情報管理システム1A)によっても、上述した実施形態と同様の個人情報の管理を行なうことができる。ここで、図12は本発明の個人情報管理システムの変形例(個人情報管理システム1A)の構成を示すブロック図である。
端末50は、上述したクライアント端末10と同様、企業等の社内において各社員(利用者)によって使用されるパーソナルコンピュータ(PC)等の端末装置であり、個人情報管理対象となるものである。
(Internet Protocol)アドレスなど〕が、インベントリ情報としてエージェントレスで
収集される。そして、収集されたインベントリ情報に基づいて、指定されたセグメント(アドレスブロック)の中に何台の端末(PC)50が存在するかを、管理端末60で把握することができる。これにより、図12に示すような一般的な構成のシステムに本発明の個人情報管理システム1Aを導入する際に、クライアントプログラムのインストールを行なうことなく、個人情報管理対象とすべき端末50の台数や識別情報(IPアドレス等)を把握することが可能になる。
ータに基づいて、個人情報管理システム1Aの導入時に、上述した個人情報探索プログラムを、後述する配布手段によって配布するための配布計画が作成される。この配布計画は、管理端末60上で自動的に作成されてもよいし、管理端末60での表示もしくは管理端末60からの印刷出力を参照したオペレータ等によって作成されてもよい。
の電子メール機能を用いて、後述する配布手段および収集手段としての機能が実現されている。
上述のようにして各端末50に配布された上記個人情報探索プログラムは、管理端末60から絶対パスを通じて、そのプログラムを指定して実行されるようになっている。
結果を添付した電子メールを上記管理者指定の場所に送信することにより、上記自己探索の結果が上記管理者指定の場所に収集されるようになっている。
まず、ネットワーク40に管理端末60を接続して、管理端末60のWMIにより各端末50からインベントリ情報を収集する(ステップS71;図14の矢印A1参照)。これにより、前述した通り、クライアントプログラムのインストールを行なうことなく、指定されたセグメント(アドレスブロック;同一ネットワーク)内における個人情報管理対象の端末50の台数およびIPアドレスが把握される。
に添付され、管理者指定の場所(例えば管理端末60の記憶部等)に送信されて収集され(ステップS76)、その収集結果に基づいて、上述した実施形態と同様にして個人情報ファイルの管理が行なわれることになる。
なお、本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上述した実施形態では、個人情報ファイルを探索・管理する場合について説明したが、本発明は、企業内等で守秘情報(守秘義務のある情報)を探索・管理する場合にも上述と同様に適用され、上記実施形態と同様の作用効果を得ることができ、守秘情報の不用意な流出・漏洩や守秘情報の不正利用などを確実に防止することができる。その場合、不適切文字や不適切文字列としては、その守秘情報において出現し得ない文字もしくは文字列を設定することになる。
監視手段15,送受信手段16,クライアント情報収集手段21,インストール手段22,収集手段23,管理コンソール24,個人情報管理手段25,表示制御手段26および送受信手段27としての機能を実現させるプログラムコードを含んでいる。また、その機能の一部は、アプリケーションプログラムではなくOSによって実現されてもよい。
(付記1)
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
前記所定の区切り位置として、予め設定された区切り文字の出現位置、もしくは、1バイトコード文字と2バイトコード文字との境界位置が含まれていることを特徴とする、個人情報探索プログラム。
前記所定の区切り位置として、全角算用数字と全角算用数字およびハイフンを除く文字との境界位置がさらに含まれていることを特徴とする、付記1記載の個人情報探索プログラム。
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII(American Standard Code for Information Interchange)文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定することを特徴とする、個人情報探索プログラム。
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定することを特徴とする、個人情報探索プログラム。
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。
前記所定の区切り位置として、予め設定された区切り文字の出現位置、もしくは、1バイトコード文字と2バイトコード文字との境界位置が含まれていることを特徴とする、付記3〜付記5のいずれか一項に記載の個人情報探索プログラム。
(付記7)
前記所定の区切り位置として、全角算用数字と全角算用数字およびハイフンを除く文字との境界位置がさらに含まれていることを特徴とする、付記6記載の個人情報探索プログラム。
該個人情報ファイル判定手段として該コンピュータを機能させる際、
該切出手段によって切り出された文字区間における文字列が、予め設定された電話番号
判定条件,電子メールアドレス判定条件および住所判定条件のいずれか一つを満たすか否かの判定を行なうことにより、氏名以外の個人情報要素である電話番号,電子メールアドレスおよび住所のうちのいずれか一つに該当するか否かを判定する第1判定手段、
該第1判定手段によって電話番号,電子メールアドレス,住所のいずれにも該当しないと判定された文字区間における文字の数が所定範囲内であり且つ同文字区間における文字が漢字であるか否かを判定する文字判定手段、
該文字判定手段によって前記所定範囲内であり且つ漢字であると判定された文字区間について、当該文字区間に含まれる文字もしくは文字列と氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列とを照合することにより、当該文字区間が前記の不適切文字もしくは不適切文字列を含むか否かを判定する照合手段、および、
該第1判定手段によって電話番号,電子メールアドレスおよび住所のうちのいずれか一つに該当すると判定された文字区間の数と該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間の数とをそれぞれ計数し、その計数結果に基づいて、当該データ集合体が個人情報ファイルであるか否かを判定する第2判定手段として、該コンピュータを機能させることを特徴とする、付記1〜付記4のいずれか一項に記載の個人情報探索プログラム。
該文字判定手段が、さらに、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致するか否かを判定し、
該照合手段が、該文字判定手段によって前記所定範囲内であり且つ漢字であり且つ前記先頭文字が日本人に多い苗字上位所定数に属する苗字の頭文字と一致すると判定された文字区間について、前記の不適切文字もしくは不適切文字列との照合を行なうことを特徴とする、付記8記載の個人情報探索プログラム。
該第2判定手段が、該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間における文字列を氏名に該当する個人情報要素と見なして、当該データ集合体が個人情報ファイルであるか否かを判定することを特徴とする、付記8または付記9に記載の個人情報探索プログラム。
該第2判定手段が、前記計数結果に基づいて、該第1判定手段によって電話番号,電子メールアドレスおよび住所のうちのいずれか一つに該当すると判定された文字区間の数と該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間の数とが多いほど大きくなる判定値を算出し、算出された判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定することを特徴とする、付記8〜付記10のいずれか一項に記載の個人情報探索プログラム。
該第1判定手段において、該切出手段によって切り出された文字区間における文字列が、電話番号に該当するか否かを判定し、電話番号に該当しない場合に電子メールアドレスに該当するか否かを判定し、電子メールアドレスに該当しない場合に住所に該当するか否かを判定し、電話番号,電子メールアドレス,住所のうちのいずれか一つに該当すると判定された時点で、当該文字列についての判定処理を終了することを特徴とする、付記8〜付記11のいずれか一項に記載の個人情報探索プログラム。
複数のクライアント端末と、
該複数のクライアント端末とネットワークを介して相互に通信可能に接続され、該複数のクライアント端末の記憶部における個人情報ファイルを管理する個人情報管理サーバとをそなえ、
該個人情報管理サーバが、
該ネットワークを介して、各クライアント端末に、個人情報ファイルの自己探索を実行させるべく付記1〜付記12のいずれか一項に記載された個人情報探索プログラムをインストールするインストール手段と、
該ネットワークを介して、各クライアント端末で実行された自己探索の結果を受信し、データベースに格納する収集手段とをそなえて構成されるとともに、
該複数のクライアント端末のそれぞれが、
該個人情報管理サーバからインストールされた前記個人情報探索プログラムを実行することにより、各クライアント端末の該記憶部におけるデータの中から個人情報ファイルを探索する個人情報探索手段と、
該ネットワークを介して該個人情報探索手段による自己探索の結果を該個人情報管理サーバへ送信する送信手段とをそなえて構成されていることを特徴とする、個人情報管理システム。
該個人情報管理サーバが、該収集手段によって受信された探索結果に基づいて、該個人情報探索手段で探索された個人情報ファイルを管理する個人情報管理手段をさらにそなえて構成されていることを特徴とする、付記13記載の個人情報管理システム。
該複数のクライアント端末のそれぞれが、自端末における該個人情報ファイルを監視し、自端末において該個人情報ファイルに対するアクセスが生じた場合にはその旨を該送信手段によって該個人情報管理サーバに送信させるアクセス監視手段をさらにそなえて構成されていることを特徴とする、付記14記載の個人情報管理システム。
該個人情報管理手段が、該個人情報ファイルの利用者に警告情報を通知することを特徴とする、付記14または付記15に記載の個人情報管理システム。
(付記17)
該個人情報管理手段が、該個人情報ファイルを保存しているクライアント端末から該個人情報ファイルを強制的に回収することを特徴とする、付記14〜付記16のいずれか一項に記載の個人情報管理システム。
該個人情報管理手段が、該個人情報ファイルを保存しているクライアント端末から該個人情報ファイルが外部へ出力されるのを強制的に禁止することを特徴とする、付記14〜付記16のいずれか一項に記載の個人情報管理システム。
(付記19)
該個人情報管理手段が、該個人情報ファイルを管理者のみがアクセス可能なフォルダに格納することを特徴とする、付記17または付記18に記載の個人情報管理システム。
該個人情報管理サーバと相互に通信可能に接続され、電子ファイルに対するアクセスを管理するファイルアクセス管理サーバをさらにそなえ、
該個人情報管理手段が、該個人情報ファイルに対するアクセスを該ファイルアクセス管理サーバに管理させることを特徴とする、付記14〜付記19のいずれか一項に記載の個人情報管理システム。
複数のクライアント端末とネットワークを介して相互に通信可能に接続され、該複数のクライアント端末における個人情報ファイルを管理する個人情報管理サーバであって、
該ネットワークを介して、各クライアント端末に、個人情報ファイルの自己探索を実行させるべく付記1〜付記12のいずれか一項に記載された個人情報探索プログラムをインストールするインストール手段と、
該ネットワークを介して、各クライアント端末で実行された自己探索の結果を受信し、データベースに格納する収集手段とをそなえて構成されていることを特徴とする、個人情報管理サーバ。
個人情報管理サーバの管理対象として、該個人情報管理サーバとネットワークを介して相互に通信可能に接続された情報処理装置であって、
付記1〜付記12のいずれか一項に記載された個人情報探索プログラムを実行することにより、該情報処理装置の記憶部におけるデータの中から個人情報ファイルを探索する個人情報探索手段と、
該ネットワークを介して該個人情報探索手段による自己探索の結果を該個人情報管理サーバへ送信する送信手段とをそなえて構成されていることを特徴とする、個人情報管理機能付き情報処理装置。
該情報処理装置での処理を実行する演算処理部の使用率を監視する使用率監視手段と、
該使用率監視手段によって監視されている前記使用率が所定閾値以下である場合に該個人情報探索手段を作動させる一方、前記使用率が所定閾値を超えている場合に該個人情報探索手段の動作を停止させる制御手段とをさらにそなえて構成されていることを特徴とする、付記22記載の個人情報管理機能付き情報処理装置。
該情報処理装置の該記憶部におけるデータの入出力動作を監視する入出力監視手段と、
該入出力監視手段によって前記入出力動作の発生を検知した時点で該個人情報探索手段を作動させる制御手段とをさらにそなえて構成されていることを特徴とする、付記22または付記23に記載の個人情報管理機能付き情報処理装置。
該個人情報探索手段で探索された個人情報ファイルを監視し、当該個人情報ファイルに対するアクセスが生じた場合にはその旨を該送信手段によって該個人情報管理サーバに送信させるアクセス監視手段をさらにそなえて構成されていることを特徴とする、付記22〜付記24のいずれか1項に記載の個人情報管理機能付き情報処理装置。
ネットワークを介して相互に通信可能に接続された複数のクライアント端末における個人情報ファイルを管理する個人情報管理サーバとして、コンピュータを機能させるプログラムであって、
付記1〜付記12のいずれか一項に記載された個人情報探索プログラムを含むとともに、
該ネットワークを介して、各クライアント端末に、個人情報ファイルの自己探索を実行させるべく前記個人情報探索プログラムをインストールするインストール手段、および、
該ネットワークを介して、各クライアント端末で実行された自己探索の結果を受信し、データベースに格納する収集手段として、該コンピュータを機能させることを特徴とする
、個人情報管理サーバ用プログラム。
複数の端末と通信可能に接続され、該複数の端末からインベントリ情報をエージェントレスで収集する情報収集機能を有する管理端末と、
該管理端末の該情報収集機能によって収集された前記インベントリ情報に基づき、該複数の端末のうちの一部もしくは全部に、個人情報ファイルの自己探索を実行させるべく付記1〜付記12のいずれか一項に記載された個人情報探索プログラムを配布する配布手段とをそなえて構成されたことを特徴とする、個人情報管理システム。
該管理端末が、該情報収集機能によって収集された前記インベントリ情報を、CSV(Comma Separated Value)形式のファイルデータとして出力し、
該配布手段が、前記ファイルデータに基づいて作成された該個人情報探索プログラムの配布計画に従って、該個人情報探索プログラムを配布することを特徴とする、付記27記載の個人情報管理システム。
前記配布計画が、前記ファイルデータに含まれる各端末のリソース情報に基づいて作成されていることを特徴とする、付記28記載の個人情報管理システム。
(付記30)
該配布手段が、電子メールを用いて該個人情報探索プログラムを配布することを特徴とする、付記27〜付記29のいずれか一項に記載の個人情報管理システム。
該複数の端末における資産を管理する資産管理サーバが該配布手段としてそなえられ、該資産管理サーバが該個人情報探索プログラムを配布することを特徴とする、付記27〜付記29のいずれか一項に記載の個人情報管理システム。
(付記32)
該管理端末が、該複数の端末の一部もしくは全部に配布されてインストールされた該個人情報探索プログラムを実行させることを特徴とする、付記27〜付記31のいずれか一項に記載の個人情報管理システム。
該複数の端末の一部もしくは全部において該個人情報探索プログラムを実行することによって行なわれた自己探索の結果を管理者指定の場所に収集する収集手段をさらにそなえて構成されたことを特徴とする、付記27〜付記32のいずれか一項に記載の個人情報管理システム。
電子メールが、該収集手段として用いられることを特徴とする、付記33記載の個人情報管理システム。
10 クライアント端末(個人情報管理機能付き情報処理装置)
10a CPU(演算処理部)
10b 記憶部
10c 検疫テーブル
10d Pマークテーブル
11 個人情報探索手段(探索エンジン,テキスト抽出エンジン)
111 抽出手段
112 切出手段
113 第1判定手段
113a 電話番号判定手段
113b 電子メールアドレス判定手段
113c 住所判定手段
114 文字判定手段
115 照合手段
116 第2判定手段(判定手段)
12 CPU使用率監視手段
13 入出力監視手段
14 制御手段
15 アクセス監視手段
16 送受信手段(送信手段)
20 個人情報管理サーバ
20a CPU
20b データベース
20c 表示部
21 クライアント情報収集手段
22 インストール手段
23 収集手段
24 管理コンソール
25 個人情報管理手段
26 表示制御手段
27 送受信手段
30 ファイルアクセス管理サーバ
30a CPU
30b 記憶部
31 送受信手段
31a 個人情報ファイル受信手段
31b 暗号化ファイル送信手段
31c 認証情報受信手段
31d 復号鍵送信手段
32 変換手段
33 暗号化手段
34 判定手段
40 ネットワーク(社内LAN)
50 個人情報管理対象の端末(PC)
60 管理端末(PC)
Claims (8)
- 記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致することを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。 - 記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。 - 記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII(American Standard Code for Information
Interchange)文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定するとともに、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致することを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。 - 記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII(American Standard Code for Information
Interchange)文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定するとともに、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。 - 記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するとともに、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致することを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。 - 記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するとともに、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。 - 記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII(American Standard Code for Information
Interchange)文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定し、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するとともに、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致することを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。 - 記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のASCII(American Standard Code for Information
Interchange)文字」+「@(アットマーク)」+「一文字以上のASCII文字」+「.(ドット)」+「一文字以上のASCII文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定し、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」+「市」または「区」または「郡」+「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における47都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するとともに、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007321701A JP4206466B2 (ja) | 2007-12-13 | 2007-12-13 | 個人情報探索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007321701A JP4206466B2 (ja) | 2007-12-13 | 2007-12-13 | 個人情報探索プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007134499A Division JP4139919B2 (ja) | 2007-05-21 | 2007-05-21 | 個人情報探索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008090867A JP2008090867A (ja) | 2008-04-17 |
JP4206466B2 true JP4206466B2 (ja) | 2009-01-14 |
Family
ID=39374880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007321701A Expired - Fee Related JP4206466B2 (ja) | 2007-12-13 | 2007-12-13 | 個人情報探索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4206466B2 (ja) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091983A (ja) * | 2000-09-13 | 2002-03-29 | Net Village Co Ltd | 地図情報付加装置及び方法並びにシステム |
JP4648657B2 (ja) * | 2004-07-06 | 2011-03-09 | 三菱スペース・ソフトウエア株式会社 | データ検査装置、データ検査方法 |
JP3705439B1 (ja) * | 2004-11-08 | 2005-10-12 | クオリティ株式会社 | 個人情報探索プログラム,個人情報管理システムおよび個人情報管理機能付き情報処理装置 |
JP2006178603A (ja) * | 2004-12-21 | 2006-07-06 | Fujitsu Social Science Laboratory Ltd | 個人情報検索プログラム、処理方法および処理装置、個人情報管理プログラム、ならびに個人情報管理システム |
JP4747591B2 (ja) * | 2005-01-31 | 2011-08-17 | 日本電気株式会社 | 機密文書検索システム、機密文書検索方法、および機密文書検索プログラム |
JP2006330870A (ja) * | 2005-05-24 | 2006-12-07 | Matsushita Electric Ind Co Ltd | 情報処理装置、情報処理システムおよびプログラム |
JP4082520B2 (ja) * | 2005-10-07 | 2008-04-30 | クオリティ株式会社 | 個人情報探索プログラム |
JP4139919B2 (ja) * | 2007-05-21 | 2008-08-27 | クオリティ株式会社 | 個人情報探索プログラム |
-
2007
- 2007-12-13 JP JP2007321701A patent/JP4206466B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008090867A (ja) | 2008-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3959441B2 (ja) | 管理システム,管理サーバおよび管理プログラム | |
US8312553B2 (en) | Mechanism to search information content for preselected data | |
US20040225645A1 (en) | Personal computing device -based mechanism to detect preselected data | |
JP3814655B1 (ja) | ファイル管理システム,情報処理装置およびファイル管理プログラム | |
JP3705439B1 (ja) | 個人情報探索プログラム,個人情報管理システムおよび個人情報管理機能付き情報処理装置 | |
JP3918023B2 (ja) | 個人情報管理システム | |
JP3762935B1 (ja) | 情報処理装置,ファイル管理システムおよびファイル管理プログラム | |
JP4903386B2 (ja) | 事前選択されたデータに関し探索可能な情報コンテンツ | |
JP3878975B1 (ja) | 管理サーバおよび管理プログラム | |
JP4206459B2 (ja) | 個人情報管理端末および個人情報管理システムならびに個人情報管理プログラム | |
JP3909362B1 (ja) | 個人情報管理システム,個人情報管理サーバおよび個人情報管理プログラム | |
JP4082520B2 (ja) | 個人情報探索プログラム | |
JP4175578B1 (ja) | 管理システムおよび管理プログラム | |
JP4168188B2 (ja) | 管理システムおよび管理サーバならびに管理プログラム | |
JP3799379B1 (ja) | 情報処理システム | |
JP3799479B1 (ja) | 個人情報管理システム,個人情報管理サーバおよび個人情報管理プログラム | |
JP3890367B1 (ja) | 管理システムおよび管理プログラム | |
JP3855022B1 (ja) | 電子メールシステム,電子メール送受信プログラムおよび電子メールシステム用プログラム | |
JP4058467B1 (ja) | 電子メールシステムおよび電子メール送受信プログラム | |
JP4251369B2 (ja) | 個人情報管理システムおよび個人情報管理プログラム | |
JP4139919B2 (ja) | 個人情報探索プログラム | |
JP2007128387A (ja) | 電子回覧システム | |
JP4206466B2 (ja) | 個人情報探索プログラム | |
JP4175575B2 (ja) | 個人情報探索プログラム | |
JP3823168B1 (ja) | 管理サーバおよび管理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080221 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080407 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20080407 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20080423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080519 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080819 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080918 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |