JP4082520B2

JP4082520B2 - 個人情報探索プログラム

Info

Publication number: JP4082520B2
Application number: JP2005294949A
Authority: JP
Inventors: 邦夫飯島; 琢司渋谷
Original assignee: クオリティ株式会社
Priority date: 2005-10-07
Filing date: 2005-10-07
Publication date: 2008-04-30
Anticipated expiration: 2025-10-07
Also published as: JP2007102685A

Description

本発明は、特定の個人を識別可能な個人情報を含むデータ集合体（電子ファイル）を個人情報集合体（個人情報ファイル）として探索する技術、および、探索された個人情報集合体を管理する技術に関し、特に、例えば、企業内において複数のクライアント端末（パーソナルコンピュータ等）に分散して保存されている個人情報集合体（個人情報ファイル）を、自動的に探索して、サーバの管理下に置くことを可能にした技術に関する。

近年、個人情報の保護の意識の高まりに伴い、個人情報の不用意な流出・漏洩や個人情報の不正利用などを確実に防止することが望まれている。また、個人情報保護法の施行に伴って、個人情報取扱事業者は、個人情報の流出・漏洩や不正利用を防止しながら、各個人から個人情報の開示要求や訂正要求を受けた場合にその個人情報の開示や訂正を行なうことが義務付けられている。

ここで、個人情報とは、単体もしくは組合せによって特定の個人を識別することのできる情報で、例えば氏名，生年月日，連絡先（住所，居所，電話番号，電子メールアドレス）などが含まれる。各種企業内で保存されて取り扱われる顧客情報，取引先情報などが個人情報に該当する場合が多く、今後、このような個人情報を多数取り扱う企業は、個人情報取扱事業者として上述のような義務を果たさなければならない。

上述のような義務を果たすためには、個人情報のための集中管理システムを導入して個人情報の一元化をはかることが必要不可欠となる。しかしながら、現実には、企業内において、顧客情報，取引先情報などの個人情報は、社員個人のパーソナルコンピュータ（以下、ＰＣと略記する場合がある）や各部署のサーバに、ばらばらに分散して存在している場合が多い。より具体的には、個々の社員が各自の業務都合で自分のＰＣに個人情報（顧客情報等）を保存していたり、中央データベース、あるいは、各社員によって独自に収集された個人情報のサブセットが複数のＰＣにまちまちに存在していたりする。

このため、上記集中管理システムを構築する場合や分散状態のままで上記義務を果たそうとする場合、いずれの場合であっても、管理者は、まず最初に、企業内にばらばらに存在する個人情報の洗い出しを行ない、企業内のどこにどのような個人情報が存在しているかを把握する必要があるが、現状、個人情報の洗い出しは、管理者が各社員に指示し人間対人間で全社・全部門の人的な協力を得て行なわれることになる。

なお、例えば、下記特許文献１においては、個人情報保護法の施行に伴い、個人情報の流出・漏洩や不正利用を防止する個人情報保護サービスを提供するための技術「個人情報保護サービス事業の処理方法および装置」が提案・開示されている。しかし、下記特許文献１には、上述したような個人情報の洗い出しに関する技術については何ら開示されていない。
特開２００２−１８３３６７号公報

しかしながら、各社員からの申告といった人的な協力のもとで個人情報の洗い出しを行なうと、手間がかかるだけでなく全ての個人情報を確実に漏れなく洗い出すのは困難になる。特に、個人情報の分散化が進んでいると、個人情報の洗い出しは極めて困難になる。
また、個人情報の洗い出しに漏れがあると、上記義務を果たせなくなるだけでなく、その個人情報の状態を管理できず、個人情報の不用意な流出・漏洩や個人情報の不正利用を招くおそれもある。

従って、企業内に分散して存在する全ての個人情報を確実に探索し管理可能な状態に置くことが望まれている。このような状況に伴い、多数の個人情報を含む電子ファイル（個人情報集合体／個人情報ファイル）を効率よく短時間で確実に探索する技術の開発が望まれている。
本発明は、このような状況に鑑み創案されたもので、個人情報ファイルを効率よく短時間で確実に探索できるようにすることを目的としている。

上記目的を達成するために、本発明の個人情報探索プログラム（請求項１）は、記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させるものであって、前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、前記所定の区切り位置として、予め設定された区切り文字の出現位置、および、１バイトコード文字と２バイトコード文字との境界位置が含まれていることを特徴としている。このとき、前記所定の区切り位置として、全角算用数字と全角算用数字およびハイフンを除く文字との境界位置がさらに含まれていてもよい（請求項２）。

なお、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のＡＳＣＩＩ（American Standard Code for Information Interchange）文字」＋「@（アットマーク）」＋「一文字以上のＡＳＣＩＩ文字」＋「.（ドット）」＋「一文字以上のＡＳＣＩＩ文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定するように構成してもよい（請求項３）。

また、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」＋「市」または「区」または「郡」＋「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における４７都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定するように構成してもよい（請求項４）。

さらに、該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定するように構成してもよい（請求項５）。

ここで、該個人情報ファイル判定手段として該コンピュータを機能させる際、該切出手段によって切り出された文字区間における文字列が、予め設定された電話番号判定条件，電子メールアドレス判定条件および住所判定条件のいずれか一つを満たすか否かの判定を行なうことにより、氏名以外の個人情報要素である電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当するか否かを判定する第１判定手段、該第１判定手段によって電話番号，電子メールアドレス，住所のいずれにも該当しないと判定された文字区間における文字の数が所定範囲内であり且つ同文字区間における文字が漢字であるか否かを判定する文字判定手段、該文字判定手段によって前記所定範囲内であり且つ漢字であると判定された文字区間について、当該文字区間に含まれる文字もしくは文字列と氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列とを照合することにより、当該文字区間が前記の不適切文字もしくは不適切文字列を含むか否かを判定する照合手段、および、該第１判定手段によって電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当すると判定された文字区間の数と該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間の数とをそれぞれ計数し、その計数結果に基づいて、当該データ集合体が個人情報ファイルであるか否かを判定する第２判定手段として、該コンピュータを機能させてもよい（請求項６）。

このとき、該文字判定手段が、さらに、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致するか否かを判定し、該照合手段が、該文字判定手段によって前記所定範囲内であり且つ漢字であり且つ前記先頭文字が日本人に多い苗字上位所定数に属する苗字の頭文字と一致すると判定された文字区間について、前記の不適切文字もしくは不適切文字列との照合を行なってもよい（請求項７）。

そして、該第２判定手段が、該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間における文字列を氏名に該当する個人情報要素と見なして、当該データ集合体が個人情報ファイルであるか否かを判定してもよい（請求項８）。

また、該第２判定手段が、前記計数結果に基づいて、該第１判定手段によって電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当すると判定された文字区間の数と該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間の数とが多いほど大きくなる判定値を算出し、算出された判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定してもよい（請求項９）。

さらに、該第１判定手段において、該切出手段によって切り出された文字区間における文字列が、電話番号に該当するか否かを判定し、電話番号に該当しない場合に電子メールアドレスに該当するか否かを判定し、電子メールアドレスに該当しない場合に住所に該当するか否かを判定し、電話番号，電子メールアドレス，住所のうちのいずれか一つに該当すると判定された時点で、当該文字列についての判定処理を終了してもよい（請求項１０）。

上述した本発明の個人情報探索プログラムによれば、テキストデータから判定対象の文字区間として切り出す際、テキストデータ内の要素が明確な区切り文字によって区切られていない場合であっても、１バイトコード文字と２バイトコード文字との境界位置、つまり半角文字と全角文字との境界位置（半角文字のあとに全角文字が続く部分もしくは全角文字のあとに半角文字が続く部分）でテキストデータを区切って文字区間として切り出すことができる。これにより、全角文字で記載された住所や氏名などと、半角文字で記載された電話番号や電子メールアドレスなどの文字列とがテキストデータにおいて区切り文字によって区切られることなく混在する場合であっても、住所，氏名，電話番号，電子メールアドレスなどの個人情報要素毎に文字区間を切り出すことが可能になる。従って、住所，氏名，電話番号，電子メールアドレスなどの個人情報要素の判定を確実に行なえるようになり、個人情報ファイルを効率よく短時間で確実に探索することができる。

このとき、全角算用数字と全角算用数字およびハイフンを除く文字との境界位置でテキストデータを区切って文字区間として切り出すことにより、全角文字で記載された住所や氏名などと、全角文字で記載された電話番号などの数字列とがテキストデータにおいて区切り文字によって区切られることなく混在する場合も、住所，氏名，電話番号などの個人情報要素毎に文字区間を切り出すことが可能になる。従って、住所，氏名，電話番号などの個人情報要素の判定を確実に行なえるようになり、個人情報ファイルを効率よく短時間で確実に探索することができる。

また、本発明の個人情報探索プログラムによれば、電子メールアドレス判定条件として、判定対象の文字区間における文字列に「一文字以上のＡＳＣＩＩ文字」＋「@（アットマーク）」＋「一文字以上のＡＳＣＩＩ文字」＋「.（ドット）」＋「一文字以上のＡＳＣＩＩ文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを設定することにより、「@（アットマーク）」を単価や単位の表示に用いている文字列であって、「@（アットマーク）」のあとに「一文字以上の半角数字」＋「.（ドット）」＋「一文字以上の半角数字」となる数字列を、電子メールアドレスとして誤って判定することを確実に防止することができる。従って、個人情報要素としての電子メールアドレスの判定を確実に行なえるようになり、個人情報ファイルを効率よく短時間で確実に探索することができる。

さらに、本発明の個人情報探索プログラムによれば、住所判定条件として、判定対象の文字区間における文字列に「一文字以上の全角文字」＋「市」または「区」または「郡」＋「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が４７都道府県名もしくは市区郡名の頭文字と一致することを設定することにより、その住所判定条件を満たす文字区間が住所（個人情報要素）であると判定される。このとき、判定対象の文字区間の先頭文字と４７都道府県名もしくは市区郡名の頭文字との一致をみることで、「市」，「区」，「郡」を途中に含む文字列であるが住所とは全く関係の無い文字列を誤って住所として判定することがなくなり、４７都道府県名もしくは市区郡名の完全一致を判定する場合に比べ極めて短時間で、住所としての確度の高い文字区間を効率よく確実に探索することができる。

またさらに、本発明の個人情報探索プログラムによれば、氏名判定条件として、判定対象の文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数（例えば上位３０００種類）に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを設定することにより、上記氏名判定条件を満たす文字区間が氏名（個人情報要素）であると判定される。このとき、判定対象の文字区間の先頭文字と日本人に多い苗字上位所定数（例えば上位３０００種類）に属する苗字の頭文字との一致をみることで、苗字の完全一致を判定する場合に比べ極めて短時間で、氏名としての確度の高い文字区間を効率よく確実に探索することができる。

ここで、氏名以外の個人情報要素に該当せず且つ不適切文字もしくは不適切文字列を含む文字区間は個人情報に関するものではないと見なされる一方、氏名以外の個人情報要素に該当せず且つ不適切文字もしくは不適切文字列を含まない文字区間は個人情報、特に氏名に関するものであると見なされるように構成することで、氏名以外の個人情報要素（電話番号，電子メールアドレス，住所のいずれか一つ）に該当すると判定された文字区間については、その判定がなされた時点で判定処理を終了し、氏名以外の個人情報要素に該当しないと判定された文字区間についてのみ不適切文字もしくは不適切文字列との照合処理が行なわれ、不適切文字もしくは不適切文字列が一つでも文字区間に含まれると判定された時点でその照合処理を終了させることができるので、氏名リストに含まれる全ての氏名文字列との照合を行なう手法に比べ、氏名の照合処理を高速に行なえ、つまりは個人情報ファイルの探索処理を高速に行なうことが可能になる。また、不適切文字もしくは不適切文字列を含まない文字区間を全て氏名に該当するものと見なすので、氏名についての不適切文字もしくは不適切文字列を含まないデータ集合体、即ち、氏名情報を含む可能性が高く個人情報ファイルである可能性の高いデータ集合体を確実に探索することが可能になる。

なお、上記文字判定手段をさらにそなえることで、氏名以外の個人情報要素に該当せず且つ不適切文字もしくは不適切文字列を含まない文字区間であって、その文字区間における文字の数が所定範囲内であるものを、さらには、その文字区間における文字が漢字であるものを、氏名に関する情報であると見なすことが可能になり、氏名の照合精度を向上させることができるとともに、氏名の照合処理を高速に行なうことができる。このとき、前記所定範囲を、氏名の文字数として一般的（適切）な数の範囲、例えば２以上６以下に設定することで、氏名の照合精度をより向上させることができるとともに、氏名の照合処理をより高速に行なうことができる。また、上記所定範囲を超える長い文字区間を照合手段による照合対象から除外することができるので、氏名の照合処理のさらなる高速化、つまりは個人情報ファイルの探索処理のさらなる高速化に寄与することになる。

以下、図面を参照して本発明の実施の形態を説明する。
〔１〕本実施形態の個人情報管理システムの構成
図１は本発明の一実施形態としての個人情報管理システムの構成を示すブロック図で、この図１に示すように、本実施形態の個人情報管理システム１は、複数のクライアント端末１０のほかに個人情報管理サーバ２０およびファイルアクセス管理サーバ３０をそなえて構成され、これらの端末１０およびサーバ２０，３０がネットワーク〔例えば、社内ＬＡＮ（Local Area Network）〕４０を介して相互に通信可能に接続されている。

各クライアント端末１０は、企業等の社内において各社員（利用者）によって使用されるパーソナルコンピュータ（ＰＣ）等の端末装置によって構成され、図２および図３を参照しながら後述するような機能構成を有している。
個人情報管理サーバ２０は、複数のクライアント端末１０およびファイルアクセス管理サーバ３０とネットワーク４０を介して相互に通信可能に接続され、各クライアント端末１０における個人情報ファイルを管理するもので、図４を参照しながら後述するような機能構成を有している。

本実施形態において、個人情報ファイル（個人情報集合体）は、個人情報を含むレコードを所定数以上保有しているものであり、個人情報は、前述した通り、単体もしくは組合せによって特定の個人を識別することのできる情報（各種個人情報要素）、例えば氏名，生年月日，連絡先（住所，居所，電話番号，メールアドレス）などを含むものである。なお、個人情報としては、これら以外に、役職名，住民基本台帳番号，口座番号，クレジットカード番号，免許証番号，パスポート番号なども挙げられる。

ファイルアクセス管理サーバ３０は、複数のクライアント端末１０および個人情報管理サーバ２０とネットワーク４０を介して相互に通信可能に接続され、電子ファイル（データ集合体；特に本実施形態では個人情報ファイル）に対するアクセスを管理するもので、図５を参照しながら後述するような機能構成を有している。

〔１−１〕本実施形態のクライアント端末の機能構成
図２は本実施形態の各クライアント端末１０の機能構成を示すブロック図で、この図２に示すように、本実施形態のクライアント端末（個人情報管理機能付き情報処理装置）１０は、各種処理を実行するＣＰＵ（Central Processin Unit；演算処理部）１０ａと、個人情報等のデータ集合体（電子ファイル）を保持しうる記憶部１０ｂとをそなえるほか、個人情報管理サーバ２０から提供される検疫テーブル１０ｃや、記憶部１０ｂに保持されるデータ集合体（電子ファイル）のＰマーク（プライバシレベルマーク；個人情報ファイルである可能性の高さを示すレベルで、後述する判定値によって決定されるレベル）を保持するＰマークテーブル１０ｄをそなえて構成されている。

ここで、記憶部１０ｂは、クライアント端末１０に内蔵されるハードディスクや、クライアント端末１０に接続・外付けされる記憶装置、例えばフレキシブルディスク，ＣＤ（ＣＤ−ＲＯＭ，ＣＤ−Ｒ，ＣＤ−ＲＷなど），ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−ＲＡＭ，ＤＶＤ−Ｒ，ＤＶＤ−ＲＷ，ＤＶＤ＋Ｒ，ＤＶＤ＋ＲＷなど），磁気ディスク，光ディスク，光磁気ディスクのほかＩＣカード，ＲＯＭカートリッジ，磁気テープなどの記録媒体を用いる記憶装置である。なお、上述した検疫テーブル１０ｃおよびＰマークテーブル１０ｄは、クライアント端末１０を構成するＲＡＭ（Random Access Memory）やハードディスク等に保持される。

ＣＰＵ１０ａは、個人情報探索手段１１，ＣＰＵ使用率監視手段１２，入出力監視手段１３，制御手段１４，アクセス監視手段１５および送受信手段１６としての機能を果たすもので、これらの機能は、ＣＰＵ１０ａが、後述するごとく個人情報管理サーバ２０からインストールされた個人情報探索プログラムを実行することによって実現される。

個人情報探索手段１１は、個人情報管理サーバ２０からインストールされる個人情報探索プログラムを実行することにより、記憶部１０ｂに保存されている電子ファイル（対象ファイル）をテキストファイルにするテキスト抽出エンジンとして機能するとともに、検疫テーブル１０ｃを用いて記憶部１０ｂにおけるデータの中から個人情報ファイルを探索する探索エンジンとして機能するものである。つまり、個人情報探索手段１１は、個人情報管理サーバ２０から指示された条件（検疫テーブル１０ｃ）に従って、クライアント端末１０の記憶部１０ｂに存在する各種電子ファイル（データ集合体）を参照して個人情報ファイルの探索を行ない、対象ファイル（個人情報ファイルであると判定されたファイル）をログ（ローカルキャッシュデータベース）に書き出すものである。また、本実施形態では、この個人情報探索手段１１で得られた探索結果（判定値）に基づいて決定されたＰマークがＰマークテーブル１０ｄに登録される。この個人情報探索手段１１の機能構成の詳細については、図３を参照しながら後述する。

ＣＰＵ使用率監視手段１２は、本クライアント端末１０で各種処理を実行するＣＰＵ１０ａの使用率を監視するものであり、入出力監視手段１３は、記憶部１０ｂにおけるデータの入出力動作（Ｉ／Ｏ動作）を監視するものである。
制御手段１４は、個人情報管理サーバ２０からインストールされる個人情報探索プログラムを実行することにより図７および図８を参照しながら後述するごとく動作するもので、ＣＰＵ使用率監視手段１２によって監視されているＣＰＵ１０ａの使用率が所定閾値以下である場合に個人情報探索手段１１を作動させる一方、その使用率が所定閾値を超えている場合に個人情報探索手段１１の動作を停止させるほか、入出力監視手段１３によって入出力動作の発生を検知した時点で個人情報探索手段１１を作動させるものである。特に、本実施形態の制御手段１４は、ＣＰＵ１０ａの使用率が所定閾値（最低閾値）を下回ると個人情報探索手段１１を作動させ、ＣＰＵ１０ａの使用率が所定閾値（最高閾値）を上回ると個人情報探索手段１１をアイドル状態（探索ホール状態）にするもので、個人情報探索手段１１をスクリーンセーバー的に動作させる。

アクセス監視手段１５は、個人情報探索手段１１で個人情報ファイルであると判定された電子ファイル（Ｐマークを付与された電子ファイル）を監視し、その電子ファイルに対するアクセス（例えば、リネイム，コピー，消去，移動などによるデータ変更）が生じた場合にはその旨をログ情報として書き出し送受信手段１６によって個人情報管理サーバ２０に送信させるものである。

送受信手段１６は、ネットワーク４０を介して個人情報管理サーバ２０（もしくはファイルアクセス管理サーバ３０）との間で各種情報を送受信するもので、個人情報探索手段１１による自己探索の結果を個人情報管理サーバ２０へ送信する送信手段として機能するものである。送受信手段１６が上記送信手段として機能する際、探索結果（個人情報ファイルのリンク先情報や判定値など）を、前回送信した探索結果との差分を得て、その差分を個人情報管理サーバ２０へ送信するほか、送信すべき情報を暗号化するようになっている。

〔１−２〕本実施形態の個人情報探索手段の詳細な機能構成
図３は本実施形態の各クライアント端末１０における個人情報探索手段１１の詳細な機能構成を示すブロック図で、この図３に示すように、本実施形態の個人情報探索手段１１は、抽出手段１１１，切出手段１１２，第１判定手段１１３，文字判定手段１１４，照合手段１１５および第２判定手段１１６としての機能を有しており、これらの機能も、ＣＰＵ１０ａが、後述するごとく個人情報管理サーバ２０からインストールされた個人情報探索プログラムを実行することによって実現される。

ここで、第１判定手段１１３，文字判定手段１１４，照合手段１１５および第２判定手段１１６が、個人情報ファイル判定手段として機能する。本実施形態の個人情報ファイル判定手段は、後述するごとく、切出手段１１２によって後述するごとく切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数（計数結果）に基づいて判定対象のデータ集合体が個人情報ファイルであるか否かを判定するものである。

抽出手段１１１は、記憶部１０ｂにおける電子ファイルのテキストデータ〔例えばＣＳＶ（Comma Separated Value）形式のデータ〕を抽出し、ファイルバッファ（図示略）に格納するもので、前記テキスト抽出エンジンとして機能するものである。なお、上記ファイルバッファには、２バイトコード文字（全角文字）がファイルバッファの終端で欠けないように取り込まれる。また、切出手段１１２によってファイルバッファから後述するデータ整形用バッファ（図示略）へデータが切り出されて取り込まれると、その分だけデータが上記ファイルバッファに取り込まれるようになっている。

切出手段１１２は、抽出手段１１１によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出して、判定対象／照合対象として後述するバッファ（図示略）に順次書き出すものである。
ここで、上記所定の区切り位置としては、予め設定された区切り文字の出現位置、もしくは、１バイトコード文字と２バイトコード文字との境界位置（半角文字／ＡＳＣＩＩ文字のあとに全角文字が続く部分もしくは全角文字のあとに半角文字／ＡＳＣＩＩ文字が続く部分）、もしくは、全角算用数字「０」〜「９」と全角算用数字およびハイフンを除く文字との境界位置が含まれている。また、区切り文字は、データの区切りであるデリミタ（delimiter）、具体的には、半角スペース，半角カンマ（半角カンマ＋半角スペースも半角カンマと見なす），タブ文字（半角），ＣＲ（Carrige Return），ＬＦ（Line Feed）のほか、「：（コロン）」，「；（セミコロン）」，「＞」，「｝」，「］」とする。

切出手段１１２は、ファイルバッファからテキストデータをデータ整形用バッファへ１文字ずつ切り出して取り込み、上述した区切り位置が出現すると、その区切り位置で取り込みを終了する。このときも２バイトコード文字（全角文字）がデータ整形用バッファの終端で欠けないようにデータ取込みを行なう。これにより、本実施形態では、例えば「佐藤太郎09012341234東京都港区」や「佐藤太郎sato@xxxx.com東京都港区」のごとく全角文字で記載された住所や氏名などと半角文字で記載された電話番号や電子メールアドレスなどの文字列とがテキストデータにおいて区切り文字によって区切られることなく混在する場合や、例えば「佐藤太郎０９０１２３４１２３４東京都港区」のごとく全角文字で記載された住所や氏名などと全角文字で記載された電話番号などの数字列とがテキストデータにおいて区切り文字によって区切られることなく混在する場合であっても、住所，氏名，電話番号，電子メールアドレスなどの個人情報要素毎に文字区間「佐藤太郎」，「09012341234」，「東京都港区」，「sato@xxxx.com」，「０９０１２３４１２３４」を切り出すことが可能になる。

このようにデータ整形用バッファに取り込まれたデータ（判定対象の文字区間）は、データ整形用バッファからデータ解析用バッファ（図示略）へ取り込まれるが、その際、その文字区間からは、英数文字，カタカナ，ひらがな，漢字以外の記号等が取り除かれる。このとき除去されるもの（不要文字）としては、例えば、半角スペース，全角スペースのほか、半角ハイフン，全角ハイフン，アンダバー，括弧記号，！，＃，＄，％，＝，＋，＊，？，￥，／，｜などの記号文字が定義される。本実施形態では、切出手段１１２が、上述のような不要文字を除去する機能を有しているものとする。

第１判定手段１１３は、上記データ解析用バッファに取り込まれた文字列、つまり、切出手段１１２によって切り出され不要文字を除去された文字区間における文字列（以下、単に文字列という）が、氏名以外の個人情報要素（具体的に本実施形態では電話番号，電子メールアドレス，住所のうちのいずれか一つ）に該当するか否かを判定すべく、電話番号判定手段１１３ａ，電子メールアドレス判定手段１１３ｂおよび住所判定手段１１３ｃとしての機能をそなえている。なお、本実施形態の第１判定手段１１３では、判定処理の負荷の軽いものから順に、つまり電話番号，電子メールアドレス，住所の順で、上記文字列の判定処理を行なっている。また、第１判定手段１１３は、上記データ解析用バッファに取り込まれたデータのサイズをチェックし、そのサイズが３バイト以下の場合、そのデータを個人情報と判断せず、判定処理を行なわないようにしてもよい。

電話番号判定手段１１３ａは、上記文字列が電話番号に該当するか否かを判定するもので、上記文字列が検疫テーブル１０ｃに設定されている電話番号判定条件を満たす場合、上記文字列が電話番号に該当するものと判定し、その旨を第２判定手段１１６に通知し、上記文字列に対する第１判定手段１１３による判定処理を終了させるものである。本実施形態において、電話番号判定条件は、上記文字列が９〜１１桁の半角数字もしくは全角数字の連続であり、且つ、１文字目（先頭文字）が「０」で２文字目が「０」以外であることとする。

電子メールアドレス判定手段１１３ｂは、電話番号判定手段１１３ａによって上記文字列が電話番号に該当しないと判定された場合に、上記文字列が電話メールアドレスに該当するか否かを判定するもので、上記文字列が検疫テーブル１０ｃに設定されている電子メールアドレス判定条件を満たす場合、上記文字列が電子メールアドレスに該当するものと判定し、その旨を第２判定手段１１６に通知し、上記文字列に対する第１判定手段１１３による判定処理を終了させるものである。

本実施形態において、電子メールアドレス判定条件は、上記文字列中に「一文字以上のＡＳＣＩＩ」＋「@（アットマーク）」＋「一文字以上のＡＳＣＩＩ」＋「．（ドット）」＋「一文字以上のＡＳＣＩＩ」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることとする。この場合、最短の電子メールアドレスは例えば「a@a.a」となり、また、例えば「123@45.67」のごとく英字以外の文字（例えば数字）で終わるような文字列は電子メールアドレスでないと判定されることになる。なお、上記電子メールアドレス判定条件によれば、５バイトに満たないデータは電子メールアドレスの判定対象にならず、判定処理を行なわない。

住所判定手段１１３ｃは、電子メールアドレス判定手段１１３ｂによって上記文字列が電子メールアドレスに該当しないと判定された場合に、上記文字列が住所（居所）に該当するか否かを判定するもので、上記文字列が検疫テーブル１０ｃに設定されている住所判定条件を満たす場合、上記文字列が住所に該当するものと判定し、その旨を第２判定手段１１６に通知するものである。

本実施形態において、住所判定条件は、上記文字列中に「１文字以上１３文字以下の全角文字」＋「市」または「区」または「郡」＋「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における４７都道府県名もしくは市区郡名の頭文字と一致することとする。これにより、例えば「受入区分名」といった「区」を途中に含む文字列であるが住所とは全く関係の無い文字列を誤って住所として判定することがなくなる。このとき、ＣＰＵ１０ａの演算処理能力が十分に高い場合には、上記文字列に加え、郵便番号に対応する７桁の数字が含まれていることを住所判定条件に加えてもよい。なお、上記住所判定条件によれば、５バイトに満たないデータは電子メールアドレスの判定対象にならず、判定処理を行なわない。

文字判定手段１１４は、第１判定手段１１３によって上記文字列が電話番号，電子メールアドレス，住所のうちのいずれにも該当しないと判定された場合に、その文字列が、検疫テーブル１０ｃに設定されている文字判定条件を満たすか否か、具体的には、上記文字列における文字の数が所定範囲内であり且つその文字列における文字が全て漢字であるか否か、さらに、上記文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致するか否かを判定するものである。

本実施形態において、文字判定条件は、上述したように、上記文字列における文字の数が所定範囲内であり且つその文字列における文字が全て漢字であることであるが、ここで、上記所定範囲は、氏名の文字数として一般的（適切）な数の範囲、例えば２以上６以下に設定される。より具体的には、文字判定手段１１４による判定条件は、上記文字列が、４バイト〜１２バイトの２バイトコード文字であり、且つ、0x889F〜0xEEECの範囲内のデータ（Shift-JISの漢字領域）であり、且つ、第２バイトは0x40〜0x7Eまたは0x80〜0xFC（Shift-JISの仕様）であり、先頭文字が、日本人に多い苗字上位３０００個に属する苗字の頭文字と一致することである。上位３０００個の苗字を対象とすることで、日本人の８割以上を網羅することができる。

照合手段１１５は、第１判定手段１１３によって電話番号，電子メールアドレス，住所のうちのいずれにも該当しないと判定された文字区間であって、さらに文字判定手段１１４によって上記所定範囲内であり且つ全ての文字が漢字であると判定された文字区間について、当該文字区間に含まれる文字／文字列と氏名において出現し得ない文字／文字列として予め設定された不適切文字／不適切文字列とを照合することにより、当該文字区間が不適切文字／不適切文字列を含むか否かを判定し、その照合判定結果を第２判定手段１１６に通知するものである。

ここで、不適切文字／不適切文字列は、検疫テーブル１０ｃに予め設定されており、例えば、東京，大阪，名古屋，横浜，九州，北海道，京都，首都，個人，学園，店，株，県，大学，学院，東証，研究，管理，総務，経理，営業，統括，製薬，販売，学校，教育，専門，建築，機械，法人，工場，製，技術，商，図書，不明，次長，公開，出版，広告，放送，対象，卸売，小売，企画，人事，情報，部門，社長，取締，部長，課長，係長，役員，本社，支社，事業，業務，教務，精密，石油，運輸，経営，戦略，資材，技師，電気，生産，税務，広報，運送，主任，電算，財務，事務，開発，政策，制作，経済，産業，金融，銀行，調査，英語，品質，保証，設備，担当，主席，主事，監査，支援，設計，保険，金庫，事業，代表，交通，第一，第二，第三，第四，第五，第六，第七，第八，第九，特販，施設，氏名，郵便，名前，名称，市役，所属，特色，幼稚，基督，協会，教会，組合，教団，商工，全国，支部，連絡，議会，生活，消費，推進，市役所，区役所，総合，修正，機能，概要，構成，企業，組織，関連，削除，文書，期限，有効，整備といった、一般的な氏名において出現し得ない文字／文字列、つまり、氏名としては不適切な文字／文字列である。

第２判定手段（判定手段）１１６は、第１判定手段１１３における電話番号判定手段１１３ａ，電子メールアドレス判定手段１１３ｂおよび住所判定手段１１３ｃによる判定結果と照合手段１１５による照合判定結果とに基づいて、対象ファイルが個人情報ファイルであるか否かを判定するものである。

より具体的に説明すると、第２判定手段１１６は、電話番号判定手段１１３ａ，電子メールアドレス判定手段１１３ｂおよび住所判定手段１１３ｃからの判定結果の通知を受け電話番号，電子メールアドレス，住所のそれぞれに該当すると見なされた文字区間の数を計数するとともに、照合手段１１５からの照合判定結果を受け、照合手段１１５によって不適切文字／不適切文字列を含まないと判定された文字区間を氏名に該当するものと見なし、その数を計数する。

そして、第２判定手段１１６は、電話番号，電子メールアドレス，住所，氏名のそれぞれについての計数結果（４つの計数値；電話番号数，電子メールアドレス数，住所数，氏名数）に基づいて、これらの計数値が大きくなるほど大きくなる判定値を算出する。例えば、第２判定手段１１６は、４つの計数値の総和を上記判定値として算出してもよいし、電話番号，電子メールアドレス，住所，氏名のそれぞれについて重み係数を予め設定しておき、各個人情報要素についての重み係数と計数値との乗算結果の総和を上記判定値として算出してもよく、上記判定値の算出手法は種々考えられる。

上述のような判定値が算出されると、第２判定手段１１６は、その判定値に基づいて、対象ファイルが個人情報ファイルであるか否かを判定する。具体的には、前記判定値が所定閾値を超えた場合に対象ファイルが個人情報ファイルであると判定する。このような判定を行なう際に、第２判定手段１１６は、さらに、判定値の大きさに応じたＰマーク（プライベートレベルマーク）を、対象ファイルに付与して、Ｐマークテーブル１０ｄに設定・登録し、ランク付けを行なう。このＰマークは、前述した通り、対象ファイルが個人情報ファイルである可能性の高さを示すレベルであり、判定値が大きいほどＰマークは高いランクに設定される。

例えば、前記判定値が１０以上となった場合、対象ファイルが個人情報ファイルであると判定する。また、前記判定値が１０以上１００未満である場合、Ｐマークとして“Ｐ１”を付与し、前記判定値が１００以上１０００未満である場合、Ｐマークとして“Ｐ２”を付与し、前記判定値が１０００以上１００００未満である場合、Ｐマークとして“Ｐ３”を付与し、前記判定値が１００００以上である場合、Ｐマークとして“Ｐ４”を付与する。なお、個人情報ファイルを判定するための所定閾値やＰマークを決定するための基準値は、個人情報管理サーバ２０（後述する管理コンソール２４）から適宜設定される。また、ここではＰマークを“Ｐ１”〜“Ｐ４”の４つにランク分けしているが、ランク分けの数はこれに限定されるものではない。

上述のように対象ファイルに付与されたＰマーク（Ｐマークテーブル１０ｄ）は、送受信手段１６およびネットワーク４０を介して個人情報管理サーバ２０へ送信され、図４を参照しながら後述するごとく、収集手段２３によりデータベース２０ｂに保存される。そして、Ｐマークを付与された電子ファイルは、そのＰマークのランクに応じて、個人情報管理サーバ２０（後述する個人情報管理手段２５）により個人情報ファイルとして後述するごとく管理される。

〔１−３〕本実施形態の個人情報管理サーバの機能構成
図４は本実施形態の個人情報管理サーバ２０の機能構成を示すブロック図で、この図４に示すように、本実施形態の個人情報管理サーバ２０は、各種処理を実行するＣＰＵ２０ａと、各クライアント端末１０からのログ情報や個人情報ファイルなどを格納・保存するデータベース（ＲＤＢ：Relational DataBase）２０ｂと、このデータベース２０ｂに保存されたログ情報や個人情報を含む各種情報を表示する表示部２０ｃとをそなえて構成されている。

ＣＰＵ２０ａは、クライアント情報収集手段２１，インストール手段２２，収集手段２３，管理コンソール２４，個人情報管理手段２５，表示制御手段２６および送受信手段２７としての機能を果たすもので、これらの機能は、ＣＰＵ２０ａが、個人情報管理サーバ用プログラムを実行することによって実現される。

クライアント情報収集手段２１は、個人情報ファイルの探索・管理を開始する際に、ネットワーク４０を介して通信可能に接続された複数のクライアント端末１０からクライアント情報（ホスト情報）を収集し、個人情報ファイルの探索・管理対象のクライアント端末１０（もしくは上述した個人情報探索プログラムをインストールされていないクライアント端末１０）を認識するものである。

インストール手段２２は、ネットワーク４０を介して、各クライアント端末１０に、個人情報の自己探索を実行させる個人情報探索プログラム（クライアント端末１０に個人情報探索手段１１，ＣＰＵ使用率監視手段１２，入出力監視手段１３，制御手段１４，アクセス監視手段１５および送受信手段１６としての機能を実行させるプログラム）をインストールするものである。

収集手段２３は、ネットワーク４０および送受信手段２７を介して、各クライアント端末１０で実行された自己探索の結果（個人情報ファイルのリンク先情報，判定値，Ｐマークなど）を受信・収集し、データベース２０ｂに格納するものである。
管理コンソール２４は、各クライアント端末１０に対して指示する判定条件（上記検疫テーブル１０ｃや、個人情報ファイルやＰマークを判定するために必要になる所定閾値など）を設定して管理するものである。検疫テーブル１０ｃには、上述した電話番号判定条件，電子メールアドレス判定条件，住所判定条件，文字判定条件（上記所定範囲）や不適切文字／不適切文字列が設定される。

個人情報管理手段２５は、収集手段２３によって収集されデータベース２０ｂに格納された探索結果に基づいて、各クライアント端末１０における個人情報ファイルを管理するもので、各クライアント端末１０の個人情報探索手段１１で個人情報ファイルであると判定された電子ファイル（Ｐマークの付与された電子ファイル；以下、個人情報ファイルという）を管理対象としている。

この個人情報管理手段２５は、各クライアント端末１０から送信されてきた個人情報ファイルの判定値（またはＰマーク）に応じて、個人情報ファイルの利用者（保有者）に注意情報／警告情報を通知したり、個人情報ファイルを、その個人情報ファイルを保存しているクライアント端末１０から強制的に捕獲・回収したり、その個人情報ファイルがクライアント端末１０から外部へ出力されるのを強制的に禁止したり、その個人情報ファイルを管理者のみがアクセス可能なフォルダ（図示略）に格納したり、個人情報ファイルに対するアクセスをファイルアクセス管理サーバ３０に管理させたりするものである。

例えば、Ｐマークのランクが“Ｐ１”である場合、警告情報によるリコメンドは行なわないが“Ｐ１”の個人情報ファイルが存在することをログとして記録する。Ｐマークのランクが“Ｐ２”である場合、その個人情報ファイルの利用者に対して注意を促すべくポップアップ表示による注意情報を通知する。Ｐマークのランクが“Ｐ３”である場合、その個人情報ファイルを保管している利用者が存在する旨を、システム管理者に対し警告情報としてメール等により通知するとともに、その個人情報ファイルの返却を利用者に指示する。Ｐマークのランクが“Ｐ４”である場合、その個人情報ファイルをクライアント端末１０から強制的に捕獲・回収したり、個人情報ファイルがクライアント端末１０から外部へ出力されるのを強制的に禁止したり、個人情報ファイルを管理者のみがアクセス可能なフォルダに格納したり、個人情報ファイルに対するアクセスをファイルアクセス管理サーバ３０に管理させたりする。なお、Ｐマークのランクが“Ｐ４”でなくても、“Ｐ３”の個人情報ファイルが所定日数放置された場合には、その個人情報ファイルに対して、Ｐマークのランクが“Ｐ４”である場合と同様の処置を実行するようにしてもよい。

また、個人情報管理手段２５は、各クライアント端末１０もしくはデータベース２０ｂに格納された個人情報ファイルを種々の確度で探索する機能や、表示制御手段２６によってその探索結果等を表示部２０ｃに表示させる機能を有している。
表示制御手段２６は、表示部２０ｃに各種情報を表示させるべく表示部２０ｃの表示状態を制御するものであり、送受信手段２７は、ネットワーク４０を介して各クライアント端末１０との間で各種情報を送受信するものである。

〔１−４〕本実施形態のファイルアクセス管理サーバの機能構成
図５は本実施形態のファイルアクセス管理サーバ３０の機能構成を示すブロック図で、この図５に示すように、本実施形態のファイルアクセス管理サーバ３０は、例えば、個人情報管理サーバ２０（個人情報管理手段２５）から指示された個人情報ファイル（Ｐマークのランクが“Ｐ４”の個人情報ファイル）を管理対象とするもので、各種処理を実行するＣＰＵ３０ａと、後述するごとく暗号鍵や復号鍵などを保存する記憶部３０ｂとをそなえて構成されている。なお、ここでは、Ｐマークのランクが“Ｐ４”の個人情報ファイルを管理対象としているが、Ｐマークのランクに関係なく、個人情報探索手段１１によって個人情報ファイルであると判定された全ての電子ファイルをファイルアクセス管理サーバ３０の管理対象としてもよい。

ＣＰＵ３０ａは、後述する送受信手段３１，変換手段３２，暗号化手段３３および判定手段３４としての機能を果たすもので、これらの機能は、ＣＰＵ３０ａが、ファイルアクセス管理サーバ用のプログラムを実行することによって実現される。また、記憶部３０ｂは、後述するごとく、個人情報ファイルを暗号化するための暗号鍵や、暗号化された個人情報ファイルを復号化するための復号鍵や、暗号化された個人情報ファイルに対するアクセス権限（後述）や、予め登録されている利用者〔暗号化ファイルの閲覧を許可された登録者（社員）〕のユーザＩＤ／パスワードなどを保存するもので、例えばハードディスクやＲＡＭによって構成されている。

送受信手段３１は、ファイルアクセス管理サーバ３０が本来有している通信機能によって実現されるものであって、後述する個人情報ファイル受信手段３１ａ，暗号化ファイル送信手段３１ｂ，認証情報受信手段３１ｃおよび復号鍵送信手段３１ｄとしての機能を果たす。
個人情報ファイル受信手段３１ａは、個人情報管理サーバ２０からネットワーク３０経由で管理対象の個人情報ファイルを受信するものである。

変換手段３２は、個人情報ファイル受信手段３１ａによって受信された管理対象の個人情報ファイルを、改竄操作の困難なＰＤＦ（Portable Document Format）ファイル等の完成文書ファイルに変換するものである。この変換手段３２は例えばＰＤＦドライバによって実現され、このＰＤＦドライバを起動することにより、個人情報ファイルがＰＤＦ化され、完成文書ファイルとしてのＰＤＦファイルが生成されるようになっている。

暗号化手段３３は、変換手段３２で得られたＰＤＦファイルを、所定の暗号鍵を用いて暗号化するものである。
暗号化ファイル送信手段３１ｂは、暗号化手段３３によって暗号化（鍵掛け）されたファイル（以下、暗号化ファイルという）を、ネットワーク４０経由で個人情報管理サーバ２０に送信するものである。

なお、ファイルアクセス管理サーバ３０による管理に際しては、上述のような暗号化手段３３による暗号化時に、ポリシー設定によって、各暗号化ファイルに対する各種アクセス権限（閲覧，印刷，コピー等の権限）が利用者毎や暗号化ファイル毎に設定される。その際、システム運用を簡易化すべく１種類のポリシを設定し、そのポリシ設定によって、全ての暗号化ファイルに対する各クライアント端末１０でのアクセス権限〔例えば、本システム１を導入している社内の全社員／全利用者（ファイルアクセス管理サーバ３０に登録されている全登録者）のアクセス権限〕として、閲覧権限のみを自動的（強制的）に設定・付与し、閲覧以外のアクセス、例えば印刷，コピー，別名保存，画面キャプチャ（スクリーンショット）などのアクセスを一切行なえないようにしてもよい。。

認証情報受信手段３１ｃは、クライアント端末１０もしくは個人情報管理サーバ２０での暗号化ファイルに対するアクセス時にクライアント端末１０もしくは個人情報管理サーバ２０からネットワーク４０経由で送信されてくる認証情報を受信するものである。ここで、認証情報は、暗号化ファイルを開こうとしているクライアント端末１０もしくは個人情報管理サーバ２０の利用者がその暗号化ファイルの正当な送信先（利用者／登録者）であることをファイルアクセス管理サーバ３０で判定・認証するために必要な情報であり、ファイルアクセス管理サーバ３０によるサービスの利用者についてこのファイルアクセス管理サーバ３０（記憶部３０ｂ）に予め登録されたユーザＩＤおよびパスワードを含んでいる。これらのユーザＩＤおよびパスワードは、暗号化ファイルを開く際に利用者がキーボードやマウスを操作することにより入力される。

判定手段３４は、認証情報受信手段３１ｃによって受信された認証情報に基づいて、認証情報を送信したクライアント端末１０／個人情報管理サーバ２０が暗号化ファイルの正当な送信先であるか否かを判定するもので、実際には、利用者によって入力されたユーザＩＤおよびパスワードが、ファイルアクセス管理サーバ３０の記憶部３０ｂに予め登録・保存されているユーザＩＤおよびパスワードと一致するか否かを判定することにより、その利用者が正当な登録者であるか否かを判定・認証するものである。

復号鍵送信手段３１ｄは、判定手段３４によって利用者が正当な登録者であることが認証された場合に、暗号化ファイルを復号化するための復号鍵を記憶部３０ｂから読み出してクライアント端末１０もしくは個人情報管理サーバ２０にネットワーク４０経由で送信するものである。

そして、クライアント端末１０もしくは個人情報管理サーバ２０においては、ファイルアクセス管理サーバ３０から復号鍵を受信すると、その復号鍵を用いて暗号化ファイルの復号化を行ない元の個人情報ファイルを復元し、復元された個人情報ファイルに対し、与えられたアクセス権限に応じたアクセス（例えば閲覧）が行なわれるようになる。

〔２〕本実施形態の個人情報管理システムの動作
次に、図６〜図１０を参照しながら、上述のごとく構成された本実施形態の個人情報管理システム１の動作について説明する。

〔２−１〕クライアント端末における個人情報探索手段の動作
本実施形態の個人情報探索手段１１では、以下のように、電話番号，電子メールアドレス，住所および氏名の出現頻度をそれぞれ数値化し、個人情報ファイルの特定・探索を行なっている。その際、切出手段１１２によって切り出された文字区間に、個人情報において出現し得ない文字／文字列として予め設定された不適切文字／不適切文字列が含まれている場合、その文字区間は、個人情報要素（本実施形態では氏名）には該当しないものと見なされて除外される一方、切出手段１１２によって切り出された文字区間に、個人情報において出現し得ない文字／文字列として予め設定された不適切文字／不適切文字列が含まれていない場合、その文字区間は、個人情報をなす個人情報要素に該当するものと見なされて、つまり個人情報要素が出現したものと見なされ、出現回数のカウントアップを行なっている。

本実施形態の各クライアント端末１０において、上述した個人情報探索手段１１（個人情報探索プログラム）によって実行される個人情報ファイルの探索動作の一連の手順を、図６に示すフローチャート（ステップＳ１０１〜Ｓ１１８）に従って説明する。

本実施形態の個人情報管理システム１を構築する際には、まず、個人情報管理サーバ２０として機能すべきコンピュータに個人情報管理サーバ用プログラムをインストールし、そのコンピュータが個人情報管理サーバ用プログラムを実行することにより個人情報管理サーバ２０としての機能を果たす。そして、個人情報ファイルの探索・管理を開始する際には、図９（ステップＳ４０１〜Ｓ４０３）を参照しながら後述するごとく、個人情報管理サーバ２０により、個人情報ファイルの探索・管理対象のクライアント端末１０が認識され、認識されたクライアント端末１０に対しネットワーク４０経由で個人情報探索プログラムがインストールされる。

このようにインストールされた個人情報探索プログラムをクライアント端末１０のＣＰＵ１０ａで実行することにより、ＣＰＵ１０ａが個人情報探索手段１１，ＣＰＵ使用率監視手段１２，入出力監視手段１３，制御手段１４，アクセス監視手段１５および送受信手段１６としての機能を果たす。なお、個人情報探索プログラムをインストールする際には、検疫テーブル１０ｃも併せて送信される。また、個人情報探索プログラムは、個人情報管理サーバ用プログラムに予め含まれている。

クライアント端末１０においては、図７および図８を参照しながら後述するタイミングで個人情報探索手段１１が作動すると、Ｐマークテーブル１０ｄおよび記憶部１０ｂが参照され、この記憶部１０ｂにおけるＰマーク未設定の電子ファイルの有無が判定される（ステップＳ１０１）。

Ｐマーク未設定の電子ファイルが存在する場合（ステップＳ１０１のＹＥＳルート）、記憶部１０ｂからＰマーク未設定の電子ファイルが対象ファイルとして一つ選択されて読み出され（ステップＳ１０２）、その対象ファイルから抽出手段（テキスト抽出エンジン）１１１によりテキストデータが抽出され、上記ファイルバッファに取り込まれる（ステップＳ１０３）。

このようにファイルバッファに取り込まれたテキストからは、切出手段１１２により、文字区間が、上述した所定の区切り位置で区切られて切り出され、判定対象／照合対象として上記データ整形用バッファを経由して上記データ解析用バッファに順次書き出される（ステップＳ１０４）。文字区間の切り出しに際し、前述したように、切出手段１１２により、文字区間からは、英数文字，カタカナ，ひらがな，漢字以外の不要文字、例えば半角スペース，全角スペースのほか、半角ハイフン，全角ハイフン，アンダバー，括弧記号，！，＃，＄，％，＝，＋，＊，？，￥，／，｜などの記号文字が除去される。

そして、切出手段１１２によって切り出され記号文字を除去された文字区間における文字列（以下、単に文字列という）が、電話番号，電子メールアドレス，住所のうちのいずれか一つに該当するか否かを、電話番号判定手段１１３ａ，電子メールアドレス判定手段１１３ｂおよび住所判定手段１１３ｃによって順次判定する（ステップＳ１０５，Ｓ１０７，Ｓ１０９）。

まず、電話番号判定手段１１３ａにより、上記文字列が電話番号に該当するか否かが判定される（ステップＳ１０５）。その際、上記文字列が検疫テーブル１０ｃに設定されている電話番号判定条件を満たしていれば、つまり上記文字列が９〜１１桁の半角数字もしくは全角数字の連続であり、且つ、１文字目（先頭文字）が「０」で２文字目が「０」以外であれば、上記文字列が電話番号に該当するものと判定され（ステップＳ１０５のＹＥＳルート）、その旨が第２判定手段１１６に通知され、この第２判定手段１１６において、電話番号の出現回数に対応する計数値が１だけカウントアップされ（ステップＳ１０６）、ステップＳ１１４の処理へ移行する。

上記文字列が電話番号に該当しないと判定された場合（ステップＳ１０５のＮＯルート）、電子メールアドレス判定手段１１３ｂにより、上記文字列が電話メールアドレスに該当するか否かが判定される（ステップＳ１０７）。その際、上記文字列が検疫テーブル１０ｃに設定されている電子メールアドレス判定条件を満たしていれば、つまり上記文字列中に「一文字以上のＡＳＣＩＩ」＋「@（アットマーク）」＋「一文字以上のＡＳＣＩＩ」＋「．（ドット）」＋「一文字以上のＡＳＣＩＩ」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であれば、上記文字列が電子メールアドレスに該当するものと判定され（ステップＳ１０７のＹＥＳルート）、その旨が第２判定手段１１６に通知され、この第２判定手段１１６において、電子メールアドレスの出現回数に対応する計数値が１だけカウントアップされ（ステップＳ１０８）、ステップＳ１１４の処理へ移行する。

上記文字列が電子メールアドレスに該当しないと判定された場合（ステップＳ１０７のＮＯルート）、住所判定手段１１３ｃにより、上記文字列が住所（居所）に該当するか否かが判定される（ステップＳ１０９）。その際、上記文字列が検疫テーブル１０ｃに設定されている住所判定条件を満たしていれば、つまり上記文字列中に「１文字以上１３文字以下の全角文字」＋「市」または「区」または「郡」＋「一文字以上の全角文字または半角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における４７都道府県名もしくは市区郡名の頭文字と一致していれば、上記文字列が住所に該当するものと判定され（ステップＳ１０９のＹＥＳルート）、その旨が第２判定手段１１６に通知され、この第２判定手段１１６において、住所（居所）の出現回数に対応する計数値が１だけカウントアップされ（ステップＳ１１０）、ステップＳ１１４の処理へ移行する。

上記文字列が住所に該当しないと判定された場合（ステップＳ１０９のＮＯルート）、つまり第１判定手段１１３によって上記文字列が電話番号，電子メールアドレス，住所のうちのいずれにも該当しないと判定された場合、文字判定手段１１４により、その文字列が、検疫テーブル１０ｃに設定されている文字判定条件（文字数が２以上６以下であり且つ全ての文字が漢字であり且つ上記文字列の先頭文字が日本人に多い苗字上位所定数に属する苗字の頭文字と一致すること）を満たすか否かが判定される（ステップＳ１１１）。この文字判定条件を満たさない場合（ステップＳ１１１のＮＯルート）、ステップＳ１１４の処理へ移行する。

一方、この文字判定条件を満たす場合（ステップＳ１１１のＹＥＳルート）、照合手段１１５により、当該文字区間（上記文字列）に含まれる文字／文字列と検疫テーブル１０ｃに設定されている氏名についての不適切文字／不適切文字列とが照合され、当該文字区間に不適切文字／不適切文字列が含まれるか否かが判定される（ステップＳ１１２）。当該文字区間に、一つでも不適切文字／不適切文字列と一致する文字／文字列が存在した場合（ステップＳ１１２のＹＥＳルート）には、その時点で不適切文字／不適切文字列との照合処理を直ちに終了し、ステップＳ１１４の処理へ移行する。

また、当該文字区間に不適切文字／不適切文字列が含まれていない場合（ステップＳ１１２のＮＯルート）、その照合判定結果が第２判定手段１１６に通知され、この第２判定手段１１６において、当該文字区間が氏名に該当するものと見なされ、氏名の出現回数に対応する計数値が１だけカウントアップされ（ステップＳ１１３）、ステップＳ１１４の処理へ移行する。

ステップＳ１１４では、対象ファイルから抽出されたテキストデータから未だ切り出されていない文字区間の有無が判定され、有る場合（ＹＥＳルート）には、ステップＳ１０４に戻り、上述と同様の処理（ステップＳ１０４〜Ｓ１１３）を繰り返し実行する。このようにして全ての文字区間がテキストデータから切り出され全ての文字区間に対する判定処理，照合処理，計数処理等を終了すると（ステップＳ１１４のＮＯルート）、第２判定手段１１６において、電話番号，電子メールアドレス，住所，氏名のそれぞれについての計数値に基づいて、上述した判定値が算出される（ステップＳ１１５）。

そして、第２判定手段１１６においては、ステップＳ１１５で算出された判定値に基づいて、上述したように、対象ファイルが個人情報ファイルであるか否かが判定されるとともに、Ｐマークのランク付け（本実施形態では“Ｐ１”〜“Ｐ４”の４つ）が行なわれる（ステップＳ１１６）。個人情報ファイルの判定結果やＰマークのランク付けの結果は、Ｐマークテーブル１０ｄに登録されるとともに、送受信手段１６およびネットワーク４０を介して、個人情報管理サーバ２０にも送信され（ステップＳ１１７）、個人情報管理サーバ２０において、収集手段２３によりデータベース２０ｂに保存される（図９のステップＳ４０４参照）。

この後、再度、記憶部１０ｂにおけるＰマーク未設定の電子ファイルの有無を判定し（ステップＳ１１８）、他にＰマーク未設定の電子ファイルが存在する場合（ステップＳ１１８のＹＥＳルート）、ステップＳ１１２に戻り上述と同様の処理を実行する一方、Ｐマーク未設定の電子ファイルが存在しない場合（ステップＳ１１８のＮＯルート）、個人情報ファイルの探索動作を終了する。

〔２−２〕クライアント端末における制御手段およびアクセス監視手段の動作
次に、図７および図８を参照しながら、個人情報探索手段１１（個人情報探索プログラム）の作動タイミングについて説明する。ここで、図７および図８は本実施形態の各クライアント端末１０における制御手段１４の動作を説明するためのフローチャートである。
本実施形態の制御手段１４は、図７に示すフローチャート（ステップＳ２１〜Ｓ２７）に従うＣＰＵ使用率による作動制御と、図８に示すフローチャート（ステップＳ３１〜Ｓ３３）に従う入出力動作（Ｉ／Ｏ動作）による作動制御とを実行するようになっている。

ＣＰＵ使用率による作動制御では、ＣＰＵ使用率監視手段１２によりＣＰＵ１０ａの使用率を監視し（ステップＳ２１）、その使用率が所定閾値以下であるか否かを判定し（ステップＳ２２）、使用率が所定閾値以下である場合（ステップＳ２２のＹＥＳルート）、個人情報探索手段１１を作動させる（ステップＳ２３）。作動後、探索を終了したか否かを判定し（ステップＳ２４）、終了していない場合（ステップＳ２４のＮＯルート）、ステップＳ２１に戻る。ステップＳ２４で探索を終了したと判定された場合（ＹＥＳルート）、探索結果の通知後（ステップＳ２５）、ステップＳ２１に戻る。

ステップＳ２２で使用率が所定閾値よりも大きいと判定された場合（ＮＯルート）、個人情報探索手段１１が作動中か否かを判定し（ステップＳ２６）、作動中でなければ（ステップＳ２６のＮＯルート）、ステップＳ２１に戻る一方、作動中であれば（ステップＳ２６のＹＥＳルート）、個人情報探索手段１１による探索動作を中断させてから（ステップＳ２７）、ステップＳ２１に戻る。このようにして、個人情報探索手段１１をスクリーンセーバー的に動作させることができる。

入出力動作による作動制御では、入出力監視手段１３により、記憶部１０ｂにおけるデータの入出力動作（Ｉ／Ｏ動作）を監視し（ステップＳ３１）、入出力動作の発生を検知した場合（ステップＳ３１のＹＥＳルート）、直ちに個人情報探索手段１１を作動させ（ステップＳ３２）、探索結果の通知後（ステップＳ３３）、ステップＳ３１に戻る。このとき、入出力対象の電子ファイルを上記対象ファイルとして、この対象ファイルが個人情報ファイルであるか否かの判定処理（図６のステップＳ１０３〜Ｓ１１７の処理）のみを行なってもよい。

なお、上述した２種類のタイミングによる作動制御は、両方とも採用して同時並列的に実行してもよいし、いずれか一方のみを採用して実行してもよい。
また、各クライアント端末１０においては、アクセス監視手段１５により、Ｐマークを付与された電子ファイル（個人情報探索手段１１で個人情報ファイルであると判定された電子ファイル）が監視され、その電子ファイルに対するアクセス（例えば、リネイム，コピー，消去，移動などによるデータ変更）が生じた場合には、その旨が、ログ情報として書き出され、送受信手段１６およびネットワーク４０を介して個人情報管理サーバ２０に送信され、個人情報管理サーバ２０において、収集手段２３によりデータベース２０ｂに保存される。

〔２−３〕個人情報管理サーバの動作
次に、個人情報管理サーバ２０の動作について、図９に示すフローチャート（ステップＳ４０１〜Ｓ４１３）に従って説明する。
前述した通り、本実施形態の個人情報管理システム１を構築する際には、まず、個人情報管理サーバ２０として機能すべきコンピュータに個人情報管理サーバ用プログラムをインストールし、そのコンピュータが個人情報管理サーバ用プログラムを実行することにより個人情報管理サーバ２０としての機能（クライアント情報収集手段２１，インストール手段２２，収集手段２３，管理コンソール２４，個人情報管理手段２５，表示制御手段２６および送受信手段２７）を果たす。

そして、個人情報ファイルの探索・管理を開始する際には、クライアント情報収集手段２１により、ネットワーク４０を介して通信可能に接続された複数のクライアント端末１０からクライアント情報が収集され（ステップＳ４０１）、個人情報ファイルの探索・管理対象のクライアント端末１０、もしくは、個人情報探索プログラムを未だインストールされていないクライアント端末１０の有無が認識され（ステップＳ４０２）、そのようなクライアント端末１０が存在する場合（ステップＳ４０２のＹＥＳルート）、そのクライアント端末１０に対し、インストール手段２２により、ネットワーク４０経由で個人情報探索プログラムがインストールされる（ステップＳ４０３）。

個人情報探索プログラムのインストール後、もしくは、上述のようなクライアント端末１０が存在しない場合（ステップＳ４０２のＮＯルート）、各クライアント端末１０において個人情報探索プログラムを実行することにより行なわれた個人情報ファイルの自己検索の結果（個人情報ファイルのリンク先情報，判定値，Ｐマークなど）が、収集手段２３により、ネットワーク４０および送受信手段２７を介して受信・収集され、データベース２０ｂに格納される（ステップＳ４０４）。

この後、収集された個人情報ファイルの自己検索結果〔ここではＰマークレベル（ランク）〕に応じて、個人情報管理手段２５により、各個人情報ファイルに対する管理・操作が以下のように行なわれる（ステップＳ４０５〜Ｓ４１３）。
まず、Ｐマークレベル“Ｐ１”の個人情報ファイルの有無が判定され（ステップＳ４０５）、Ｐマークレベル“Ｐ１”の個人情報ファイルがある場合（ステップＳ４０５のＹＥＳルート）、その旨がログとしてデータベース２０ｂに記録される（ステップＳ４０６）。

Ｐマークレベル“Ｐ１”の個人情報ファイルがない場合（ステップＳ４０５のＮＯルート）、もしくは、ステップＳ４０６でのログ記録後、Ｐマークレベル“Ｐ２”の個人情報ファイルの有無が判定され（ステップＳ４０７）、Ｐマークレベル“Ｐ２”の個人情報ファイルがある場合（ステップＳ４０７のＹＥＳルート）、その個人情報ファイルの利用者に対して注意を促すべくポップアップ表示による注意情報が通知される（ステップＳ４０８）。

Ｐマークレベル“Ｐ２”の個人情報ファイルがない場合（ステップＳ４０７のＮＯルート）、もしくは、ステップＳ４０８での注意情報通知後、Ｐマークレベル“Ｐ３”の個人情報ファイルの有無が判定され（ステップＳ４０９）、Ｐマークレベル“Ｐ３”の個人情報ファイルがある場合（ステップＳ４０９のＹＥＳルート）、その個人情報ファイルを保管している利用者が存在する旨が、システム管理者に対し警告情報としてメール等により通知されるとともに、その個人情報ファイルの返却が利用者に指示される（ステップＳ４１０）。

Ｐマークレベル“Ｐ３”の個人情報ファイルがない場合（ステップＳ４０９のＮＯルート）、もしくは、ステップＳ４１０で警報情報通知および返却指示を行なった後、Ｐマークレベル“Ｐ４”の個人情報ファイルの有無が判定され（ステップＳ４１１）、Ｐマークレベル“Ｐ４”の個人情報ファイルがある場合（ステップＳ４１１のＹＥＳルート）、その個人情報ファイルがクライアント端末１０から強制的に捕獲・回収され（ステップＳ４１２）、さらに、その個人情報ファイルをファイルアクセス管理サーバ３０の管理下に置き、その個人情報ファイルに対するアクセスをファイルアクセス管理サーバ３０に管理させる（ステップＳ４１３）。Ｐマークレベル“Ｐ４”の個人情報ファイルがない場合（ステップＳ４１１のＮＯルート）、もしくは、ステップＳ４１３での処理終了後、ステップＳ４０１に戻る。

なお、前述した通り、Ｐマークレベル“Ｐ４”の個人情報ファイルについては、その個人情報ファイルがクライアント端末１０から外部へ出力されるのを強制的に禁止したり、個人情報ファイルを管理者のみがアクセス可能なフォルダに格納したりしてもよい。また、Ｐマークレベル“Ｐ３”の個人情報ファイルが所定日数放置された場合、Ｐマークレベル“Ｐ４”の個人情報ファイルと同様の処置を実行してもよい。さらに、Ｐマークレベル“Ｐ１”〜“Ｐ４”の個人情報ファイルの全てをファイルアクセス管理サーバ３０の管理下に置くようにしてもよい。

〔２−４〕ファイルアクセス管理サーバの動作
次に、図１０および図１１を参照しながら、ファイルアクセス管理サーバ３０の動作について説明する。
まず、図１０に示すフローチャート（ステップＳ５１〜Ｓ５４）に従って、本実施形態のファイルアクセス管理サーバ３０によるファイル変換動作を説明する。

ファイルアクセス管理サーバ３０において、ファイルアクセス管理サーバ３０の管理下に置くように指示された個人情報ファイル（管理対象の電子ファイル）が、個人情報管理サーバ２０（個人情報管理手段２５）からネットワーク４０経由で個人情報ファイル受信手段３１ａにより受信されると（ステップＳ５１のＹＥＳルート）、その個人情報ファイルが、変換手段３２によりＰＤＦファイルに変換され（ステップＳ５２）、さらに暗号化手段３３により、所定の暗号鍵を用いて暗号化処理（鍵掛け処理）が行なわれる（ステップＳ５３）。そして、暗号化ファイルは、暗号化ファイル送信手段３１ｂによりネットワーク４０経由で個人情報管理サーバ２０に送信される（ステップＳ５４）。

ついで、図１１に示すフローチャート（ステップＳ６１〜Ｓ６５）に従って、本実施形態のファイルアクセス管理サーバ３０による認証動作について説明する。
クライアント端末１０の利用者や個人情報管理サーバ２０の利用者（管理者）が、暗号化ファイルの内容を閲覧しようとする場合、その利用者によって認証情報が入力されファイルアクセス管理サーバ３０へ送信される。そして、その認証情報がネットワーク４０経由で認証情報受信手段３１ｃにより受信されると（ステップＳ６１のＹＥＳルート）、判定手段３４は、認証情報に含まれるユーザＩＤによって記憶部３０ｂを検索し、そのユーザＩＤに対応する登録パスワードを記憶部３０ｂから読み出し、認証情報に含まれるパスワードと、記憶部３０ｂから読み出された登録パスワードとを比較し、これらのパスワードが一致するか否かの判定（クライアント認証；ステップＳ６２）を行なう。

これらのパスワードが一致し、クライアント端末１０もしくは個人情報管理サーバ２０の利用者が正当な登録者（正当な送信先）であることが認証されると（ステップＳ６３のＹＥＳルート）、復号鍵送信手段３１ｄにより、暗号化ファイルを復号化するための復号鍵が記憶部３０ｂから読み出され、そのクライアント端末１０もしくは個人情報管理サーバ２０にネットワーク４０経由で送信される（ステップＳ６４）。

そして、クライアント端末１０もしくは個人情報管理サーバ２０において、復号鍵が受信されると、その復号鍵を用いて暗号化ファイルが復号化されて元の個人情報ファイルが復元され、その個人情報ファイルに対し、予め与えられたアクセス権限に応じたアクセスが実行される。例えば、前述したようにアクセス権限として閲覧権限のみが与えられている場合、利用者は、復元された個人情報ファイルの内容を閲覧することはできるが、閲覧以外のアクセス、例えばプリンタによる印刷出力や他の記録媒体へのコピーや画面コピー（画面キャプチャ）や別名保存などのアクセスは一切行なうことができない。

一方、ファイルアクセス管理サーバ３０の判定手段３４によりパスワードが不一致であると判定された場合、もしくは、ユーザＩＤに対応する登録パスワードが記憶部３０ｂに登録されていなかった場合には、利用者が正当な登録者（正当な送信先）ではないと判定され（ステップＳ６３のＮＯルート）、ファイルアクセス管理サーバ３０からクライアント端末１０もしくは個人情報管理サーバ２０にネットワーク４０経由でエラー通知が行なわれる（ステップＳ６５）。

〔３〕本実施形態の個人情報探索プログラムおよび個人情報管理システムの効果
このように、本発明の一実施形態としての個人情報探索プログラムをコンピュータ（ＣＰＵ１０ａ）において実行することによって実現される個人情報探索手段１１によれば、第２判定手段１１６において、電話番号，電子メールアドレス，住所のいずれにも該当せず且つ不適切文字／不適切文字列を含む文字区間は、個人情報に関するものではないと見なされる一方、電話番号，電子メールアドレス，住所のいずれにも該当せず且つ不適切文字／不適切文字列を含まない文字区間は、氏名に関するものであると見なされる。

従って、第１判定手段１１３において電話番号，電子メールアドレス，住所のいずれか一つに該当すると判定された文字区間については、その判定がなされた時点で判定処理を終了し、電話番号，電子メールアドレス，住所のいずれにも該当しないと判定された文字区間についてのみ不適切文字／不適切文字列との照合処理が行なわれ、さらに、照合手段１１５において不適切文字／不適切文字列が一つでも文字区間に含まれると判定された時点で、その照合処理を終了させることができるので、氏名リストに含まれる全ての氏名文字列との照合を行なう従来手法に比べ、氏名の照合処理を高速に行なえ、つまりは個人情報ファイルの探索処理を高速に行なうことが可能になる。

このとき、第１判定手段１１３において、判定処理の負荷の軽いものから順に、つまり電話番号，電子メールアドレス，住所の順で文字区間における文字列の判定処理を行なうことで、判定処理をより高速に効率良く実行することが可能になる。
また、第２判定手段１１６において不適切文字／不適切文字列を含まない文字区間を全て氏名に該当するものと見なすので、氏名についての不適切文字／不適切文字列を含まない電子ファイル、即ち、氏名情報を含む可能性が高く個人情報ファイルである可能性の高い電子ファイルを確実に探索することが可能になる。つまり、本実施形態によって個人情報ファイルであると判定される電子ファイルの数は、従来手法よりも多くなり、個人情報ファイルである可能性の高い電子ファイル（疑わしい電子ファイル）を確実に洗い出すことができる。

さらに、本実施形態では、文字判定手段１１４により、文字区間の文字数が１以上６以下であって且つその文字区間の文字が全て漢字であるか否かを判定し、この文字判定条件を満たす文字区間のみを照合手段１１５による照合対象としているので、照合手段１１５による照合対象の文字区間が、より氏名の可能性の高い文字区間に絞り込まれることになり、氏名の照合精度を向上させることができるとともに、氏名の照合処理を高速に行なうことができる。また、文字数が６を超える長い文字区間が、照合手段１１５による照合対象から除外されるので、氏名の照合処理のさらなる高速化、つまりは個人情報ファイルの探索処理のさらなる高速化に寄与することになる。

特に、本実施形態の個人情報探索プログラムによれば、切出手段１１２によりテキストデータから判定対象の文字区間として切り出す際、テキストデータ内の要素が明確な区切り文字によって区切られていない場合であっても、１バイトコード文字と２バイトコード文字との境界位置つまり半角文字と全角文字との境界位置（半角文字のあとに全角文字が続く部分もしくは全角文字のあとに半角文字が続く部分）や、全角算用数字と全角算用数字およびハイフンを除く文字との境界位置で、テキストデータが区切られて文字区間として切り出されることになる。

これにより、全角文字で記載された住所や氏名などと半角文字で記載された電話番号や電子メールアドレスなどの文字列とがテキストデータにおいて区切り文字によって区切られることなく混在する場合や、全角文字で記載された住所や氏名などと全角文字で記載された電話番号などの数字列とがテキストデータにおいて区切り文字によって区切られることなく混在する場合であっても、住所，氏名，電話番号，電子メールアドレスなどの個人情報要素毎に文字区間を切り出すことができる。従って、住所，氏名，電話番号，電子メールアドレスなどの個人情報要素の判定を確実に行なえるようになり、個人情報ファイルを効率よく短時間で確実に探索することができる。

また、電子メールアドレス判定手段１１３ｂによる電子メールアドレス判定条件として、判定対象の文字区間における文字列に「一文字以上のＡＳＣＩＩ文字」＋「@（アットマーク）」＋「一文字以上のＡＳＣＩＩ文字」＋「.（ドット）」＋「一文字以上のＡＳＣＩＩ文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを設定することにより、「@（アットマーク）」を単価や単位の表示に用いている文字列であって、「@（アットマーク）」のあとに「一文字以上の半角数字」＋「.（ドット）」＋「一文字以上の半角数字」となる数字列（例えば「123@45.67」）を、電子メールアドレスとして誤って判定することを確実に防止することができる。従って、電子メールアドレスなどの個人情報要素の判定を確実に行なえるようになり、個人情報ファイルを効率よく短時間で確実に探索することができる。

電子メールアドレスにおいて“@”以降の最後の「.（ドット）」以降の文字列は、現在のところ、必ず、例えば“com”，“net”，“jp”などの英字列になっている。また、“@”は、一般に、単価や単位の表示に用いられることが多々ある。例えば、ある物品の１個当たりの値段や重さを表示する際、“@100.00”とか“@10.55”というように“@”を用いる場合がある。このため、電子メールアドレス判定条件が、単に判定対象の文字区間における文字列に「一文字以上のＡＳＣＩＩ文字」＋「@（アットマーク）」＋「一文字以上のＡＳＣＩＩ文字」＋「.（ドット）」＋「一文字以上のＡＳＣＩＩ文字」となる文字列が含まれていることとすると、上記のような“@100.00”や“@10.55”を含む文字列も電子メールアドレスとして誤って認識してしまうことになるが、文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件に追加することで、上述のような数字列“@100.00”や“@10.55”を含む文字列を電子メールアドレスとして誤認識するのを確実に防止することができるのである。

さらに、住所判定手段１１３ｃによる住所判定条件として、判定対象の文字区間における文字列に「一文字以上の全角文字」＋「市」または「区」または「郡」＋「一文字以上の全角文字または半角文字」となる文字列が含まれていることに加え、判定対象の文字区間の先頭文字と４７都道府県名もしくは市区郡名の頭文字との一致をみることで、「市」，「区」，「郡」を途中に含む文字列であるが住所とは全く関係の無い文字列を誤って住所として判定することがなくなり、４７都道府県名もしくは市区郡名の完全一致を判定する場合に比べ極めて短時間で、住所としての確度の高い文字区間を効率よく確実に探索することができる。

またさらに、文字判定手段１１４による文字判定条件（氏名判定条件）に、判定対象の文字列の先頭文字が、日本人に多い苗字上位所定数（例えば上位３０００種類）に属する苗字の頭文字と一致することを追加することにより、苗字の完全一致を判定する場合に比べ極めて短時間で、氏名としての確度の高い文字区間を効率よく確実に探索することができる。

一方、本発明の一実施形態としての個人情報管理システム１によれば、各クライアント端末１０において上述した個人情報探索プログラムを実行することで、個人情報ファイルを自動的に特定して探索することができるので、人的な協力を得ることなく且つ担当者に特別な負荷をかけることなく、例えば企業内等において分散して存在する個人情報ファイル（個人情報ファイルである可能性の高い電子ファイル）を確実に探索して洗い出し管理可能な状態に置くことができる。従って、個人情報の開示要求や訂正要求に確実に対応することができるとともに、個人情報の不用意な流出・漏洩や個人情報の不正利用などを確実に防止することができる。

このとき、各クライアント端末１０においてＣＰＵ１０ａの使用率（使用負荷）を監視し、その使用率が所定閾値以下である場合に個人情報探索手段（探索エンジン）１１を作動させることにより、ＣＰＵ１０ａに負荷を掛けることなく個人情報ファイルの洗い出しを行なうことができる。

また、各クライアント端末１０において記憶部１０ｂに対するデータの入出力動作（Ｉ／Ｏ動作）を監視し、入出力動作の発生時に個人情報探索手段（探索エンジン）１１を作動させることにより、クライアント端末１０における記憶部１０ｂに新たなデータが入力される場合や、クライアント端末１０における記憶部１０ｂからデータが出力される場合（例えば、データをメールに添付すべく記憶部１０ｂから出力する場合だけでなく、データをＣＤ，ＤＶＤ，磁気ディスク，光ディスク，光磁気ディスクなどの外部記憶媒体へ書き込むべく記憶部１０ｂから出力する場合など）に、その入出力データに含まれる電子ファイルが個人情報ファイルであるか否かを判定して、個人情報ファイルの移動を監視することができるので、個人情報の不用意な流出・漏洩をより確実に防止することができる。

さらに、各クライアント端末１０においてアクセス監視手段１５により個人情報ファイルであると判定された電子ファイル（本実施形態ではＰマークを付与されたファイル）が監視され、その電子ファイルに対するアクセス（例えば、リネイム，コピー，消去，移動などによるデータ変更）が生じた場合にはその旨がログ情報として個人情報管理サーバ２０に送信されるので、個人情報ファイルである可能性の高い電子ファイルに対するアクセス（操作・変更履歴）が、個人情報管理サーバ２０で追跡管理（トラッキング）されることになり、個人情報の不正利用をより確実に防止することができる。

また、個人情報探索手段１１によって探索された個人情報ファイルは、各個人情報ファイルに付与されたＰマーク（ランク／レベル）に応じ、個人情報管理サーバ２０（個人情報管理手段２５）によって管理され、個人情報ファイルの利用者（保有者）やシステム管理者に注意情報／警告情報を通知したり、個人情報ファイルをクライアント端末１０（記憶部１０ｂ）から強制的に捕獲・回収したり、個人情報ファイルがクライアント端末１０（記憶部１０ｂ）から外部へ出力されるのを強制的に禁止したり、個人情報ファイルを管理者のみがアクセス可能なフォルダに格納したり、個人情報ファイルに対するアクセスをファイルアクセス管理サーバ３０に管理させたりすることが可能で、個人情報の不用意な流出・漏洩や個人情報の不正利用などをより確実に防止することができる。

〔４〕変形例
上述した実施形態では、クライアント−サーバ構成を採用した個人情報管理システム１について説明したが、クライアント−サーバシステムを構築することなく、図１２に示すような構成のシステム（個人情報管理システム１Ａ）によっても、上述した実施形態と同様の個人情報の管理を行なうことができる。ここで、図１２は本発明の個人情報管理システムの変形例（個人情報管理システム１Ａ）の構成を示すブロック図である。

図１２に示すシステム１Ａは、複数の端末（ＰＣ）５０と、これらの端末５０とネットワーク（社内ＬＡＮ）４０を介して通信可能に接続された管理端末（ＰＣ）６０とをそなえて構築されている。
端末５０は、上述したクライアント端末１０と同様、企業等の社内において各社員（利用者）によって使用されるパーソナルコンピュータ（ＰＣ）等の端末装置であり、個人情報管理対象となるものである。

管理端末６０は、ネットワーク４０を介して複数の端末５０からインベントリ情報をエージェントレスで収集する情報収集機能を有するものである。この情報収集機能は、例えばＷＭＩ〔Windows（登録商標） Management Instrumentation〕によって実現されるもので、このＷＭＩを用いることにより、各端末〔具体的には、ＮＡＴ（Network Address Translator）越えの無い同一ネットワーク内のWindows（登録商標）ＰＣ〕５０から、各端末５０を特定しうる識別情報〔例えば、ホスト名，ＭＡＣ（Medium Access Control）アドレス，ＩＰ（Internet Protocol）アドレスなど〕が、インベントリ情報としてエージェントレスで収集される。そして、収集されたインベントリ情報に基づいて、指定されたセグメント（アドレスブロック）の中に何台の端末（ＰＣ）５０が存在するかを、管理端末６０で把握することができる。これにより、図１２に示すような一般的な構成のシステムに本発明の個人情報管理システム１Ａを導入する際に、クライアントプログラムのインストールを行なうことなく、個人情報管理対象とすべき端末５０の台数や識別情報（ＩＰアドレス等）を把握することが可能になる。

そして、管理端末６０は、上述のごとくＷＭＩによって収集されたインベントリ情報をＣＳＶ（Comma Separated Value）形式のファイルデータとして出力し、そのファイルデータに基づいて、個人情報管理システム１Ａの導入時に、上述した個人情報探索プログラムを、後述する配布手段によって配布するための配布計画が作成される。この配布計画は、管理端末６０上で自動的に作成されてもよいし、管理端末６０での表示もしくは管理端末６０からの印刷出力を参照したオペレータ等によって作成されてもよい。

また、インベントリ情報として、各端末５０のリソース情報（ＣＰＵの性能，記憶部の空き容量，ソフトウエア情報やそのバージョン情報など）を収集し上記ファイルデータに上記リソース情報が含まれている場合、そのリソース情報を加味して配布計画を作成することもできる。この場合、例えば、そのリソース情報に基づいて、端末５０の環境（ＣＰＵの性能，記憶部の空き容量，ソフトウエア情報やそのバージョン情報など）が、上記個人情報探索プログラムのインストールや実行に適しているか否かを判断し、適した環境を有している端末５０に上記個人情報探索プログラムの配布を行なうように配布計画を作成する。

さらに、図１２に示すシステム１Ａでは、一般的な電子メール機能によって、各端末５０や管理端末６０の相互間で電子メールのやり取りを行なうことが可能になっており、この電子メール機能を用いて、後述する配布手段および収集手段としての機能が実現されている。

ここで、配布手段は、上述のごとく作成された配布計画に従って、複数の端末５０のうちの一部もしくは全部に、個人情報ファイルの自己探索を実行させるべく上記個人情報探索プログラムを配布するためのもので、図１２に示すシステム１Ａでは、上記個人情報探索プログラムを添付した電子メールを送信することにより、上記個人情報端末プログラムが各端末５０に配布されるようになっている。

上記個人情報探索プログラムを添付した電子メールは、管理端末６０から送信してもよいし、複数の端末５０における資産（リソース）を管理する資産管理サーバ（図示省略）を、配布手段の一部として、ネットワーク４０に接続してそなえ、この資産管理サーバから上記個人情報探索プログラムを配布してもよい。
上述のようにして各端末５０に配布された上記個人情報探索プログラムは、管理端末６０から絶対パスを通じて、そのプログラムを指定して実行されるようになっている。

また、収集手段は、各端末５０において上記個人情報探索プログラムを実行することによって行なわれた自己探索の結果を管理者指定の場所（例えば管理端末６０の記憶部等）に収集するためのもので、図１２に示すシステム１Aでは、各端末５０が上記自己探索の結果を添付した電子メールを上記管理者指定の場所に送信することにより、上記自己探索の結果が上記管理者指定の場所に収集されるようになっている。

次に、図１２に示すようなシステムに本発明の個人情報管理システム１Ａを導入する手順について、図１３に示すフローチャート（ステップＳ７１〜Ｓ７６）に従い、図１４を参照しながら説明する。
まず、ネットワーク４０に管理端末６０を接続して、管理端末６０のＷＭＩにより各端末５０からインベントリ情報を収集する（ステップＳ７１；図１４の矢印Ａ１参照）。これにより、前述した通り、クライアントプログラムのインストールを行なうことなく、指定されたセグメント（アドレスブロック；同一ネットワーク）内における個人情報管理対象の端末５０の台数およびＩＰアドレスが把握される。

このようにして収集されたインベントリ情報は、ＣＳＶ形式のファイルデータとして出力され（ステップＳ７２）、そのファイルデータ（インベントリ情報）に基づいて、セグメント内における個人情報管理対象の端末５０を特定し、上記個人情報探索プログラムの配布計画が作成される（ステップＳ７３）。なお、上述のごとく収集・出力されたファイルデータを、数世代分、蓄積・保管し、新たに取得したインベントリ情報のファイルデータと蓄積・保管されたファイルデータとを比較し、新規導入端末や削除端末といった差分リストデータを配布計画として出力してもよい。

この後、一般的な電子メール機能を用い、上述のごとく作成された配布計画に従って、個人情報管理対象の端末５０に対し、上記個人情報探索プログラムを添付した電子メールを送信することにより、上記個人情報端末プログラムが個人情報管理対象の端末５０に配布される（ステップＳ７４；図１４の矢印Ａ２参照）。このとき、端末５０における資産（リソース）を管理する資産管理サーバがネットワーク４０に接続されている場合には、この資産管理サーバから上記個人情報探索プログラムを配布することもできる。

そして、個人情報管理対象の端末５０に配布された上記個人情報探索プログラムは、管理端末６０から絶対パスを通じて、そのプログラムを指定して実行される（ステップＳ７５；図１４の矢印Ａ３参照）。個人情報探索プログラムが起動されると、上述と同様にして各端末５０における個人情報ファイルの探索が行なわれ、その探索結果は、電子メールに添付され、管理者指定の場所（例えば管理端末６０の記憶部等）に送信されて収集され（ステップＳ７６）、その収集結果に基づいて、上述した実施形態と同様にして個人情報ファイルの管理が行なわれることになる。

このように、図１２に示すシステム１Ａによれば、管理端末６０のＷＭＩにより各端末５０のインベントリ情報がエージェントレスで収集され、そのインベントリ情報に基づいて個人情報探索プログラムが配布されるので、クライアント−サーバシステムを構築することなく、極めて簡易な構成で個人情報探索プログラムを各端末５０に配布し、各端末５０における個人情報ファイルを管理することができる。

このとき、各端末５０から収集されたインベントリ情報に基づいて作成された配布計画に従って、個人情報探索プログラムを配布することにより、個人情報探索プログラムの配布を効率的に行なうことができる。その際、各端末５０のリソース情報（ＣＰＵの性能，記憶部の空き容量，ソフトウエア情報やそのバージョン情報など）に基づいて、配布計画を作成することで、個人情報探索プログラムを実行することが可能な環境をもつ端末５０に対して個人情報探索プログラムを配布することができ、個人情報探索プログラムを実行した際にリソース上の問題によりトラブルが発生するような事態を未然に防止することができる。

そして、管理端末６０により個人情報探索プログラムを各端末５０で実行させるとともに、各端末５０で個人情報探索プログラムを実行することによって行なわれた自己探索の結果を、電子メールによって管理者指定の場所に収集することにより、クライアント−サーバシステムを構築することなく、極めて簡易な構成で、各端末５０における自己探索の実行させ、その自己探索の結果を収集することができる。従って、上述した個人情報管理システム１と同様、人的な協力を得ることなく且つ担当者に特別な負荷をかけることなく、例えば企業内等において分散して存在する個人情報ファイルを確実に探索して洗い出し管理可能な状態に置くことができる。従って、個人情報の開示要求や訂正要求に確実に対応することができるとともに、個人情報の不用意な流出・漏洩や個人情報の不正利用などを確実に防止することができる。

〔５〕その他
なお、本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上述した実施形態では、個人情報ファイルを探索・管理する場合について説明したが、本発明は、企業内等で守秘情報（守秘義務のある情報）を探索・管理する場合にも上述と同様に適用され、上記実施形態と同様の作用効果を得ることができ、守秘情報の不用意な流出・漏洩や守秘情報の不正利用などを確実に防止することができる。その場合、不適切文字や不適切文字列としては、その守秘情報において出現し得ない文字もしくは文字列を設定することになる。

また、上述した実施形態では、氏名の判定条件に、氏名において出現し得ない漢字／漢字列として予め設定された不適切文字／不適切文字列を判定対象の文字区間に含まないことを設定しているが、住所判定条件にも、住所において出現し得ない漢字／漢字列として予め設定された不適切文字／不適切文字列を判定対象の文字区間に含まないことをさらに追加してもよい。

さらに、上述した実施形態では、氏名以外の個人情報要素が、電話番号，電子メールアドレス，住所の３要素である場合について説明したが、本発明は、これに限定されるものでなく、氏名以外の個人情報要素としては、例えば、生年月日，住民基本台帳番号，口座番号，クレジットカード番号，免許証番号，パスポート番号などを用いてもよい。

またさらに、各クライアント端末１０の個人情報探索手段１１による探索（記憶部１０ｂに保存されている全ての電子ファイルに対する探索）を完了しない間は、そのクライアント端末１０の記憶部１０ｂにおける電子ファイルに対するアクセス（例えば、リネイム，コピー，消去，移動などによるデータ変更など；より具体的には、外部記録媒体への出力，メール添付など）を禁止するように構成してもよい。この場合、個人情報ファイルであると判定される電子ファイルの有無が確認され、個人情報ファイルであると判定された電子ファイルを個人情報管理サーバ２０（もしくはファイルアクセス管理サーバ３０）の管理下に置くまでは、そのクライアント端末１０の記憶部１０ｂにおける電子ファイルに対するアクセスが禁止されることになるので、より確実に個人情報の流出・漏洩を防止することが可能になる。

また、上述した実施形態では、各クライアント端末１０で個人情報探索プログラムを実行することにより各クライアント端末１０における個人情報ファイルを自己探索させているが、個人情報管理サーバ２０が、各クライアント端末１０に格納されているデータを吸い上げ、個人情報管理サーバ２０で個人情報探索プログラムを実行することにより、吸い上げたデータにおける個人情報ファイルを探索するように構成することもでき、この場合も上述した実施形態と同様の作用効果を得ることができる。

ところで、各クライアント端末１０における、上述した個人情報探索手段１１，ＣＰＵ使用率監視手段１２，入出力監視手段１３，制御手段１４，アクセス監視手段１５および送受信手段１６としての機能（各手段の全部もしくは一部の機能）は、上述した通り、コンピュータ（ＣＰＵ，情報処理装置，各種端末を含む）が、個人情報管理サーバ２０からインストールされた所定のアプリケーションプログラム（個人情報探索プログラム）を実行することによって実現される。

また、個人情報管理サーバ２０における、上述したクライアント情報収集手段２１，インストール手段２２，収集手段２３，管理コンソール２４，個人情報管理手段２５，表示制御手段２６および送受信手段２７としての機能（各手段の全部もしくは一部の機能）は、上述した通りコンピュータ（ＣＰＵ，情報処理装置，各種端末を含む）が所定のアプリケーションプログラム（個人情報管理サーバ用プログラム）を実行することによって実現される。

個人情報探索プログラムを含む個人情報管理サーバ用プログラムは、例えばフレキシブルディスク，ＣＤ（ＣＤ−ＲＯＭ，ＣＤ−Ｒ，ＣＤ−ＲＷなど），ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−ＲＡＭ，ＤＶＤ−Ｒ，ＤＶＤ−ＲＷ，ＤＶＤ＋Ｒ，ＤＶＤ＋ＲＷなど）等のコンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体から個人情報管理サーバ用プログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク，光ディスク，光磁気ディスク等の記憶装置（記録媒体）に記録しておき、その記憶装置から通信回線を介してコンピュータに提供するようにしてもよい。

ここで、コンピュータとは、ハードウエアとＯＳ（オペレーティングシステム）とを含む概念であり、ＯＳの制御の下で動作するハードウエアを意味している。また、ＯＳが不要でアプリケーションプログラム単独でハードウェアを動作させるような場合には、そのハードウェア自体がコンピュータに相当する。ハードウエアは、少なくとも、ＣＰＵ等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とをそなえている。上記個人情報探索プログラムや上記個人情報管理サーバ用プログラムとしてのアプリケーションプログラムは、上述のようなコンピュータに、個人情報探索手段１１，ＣＰＵ使用率監視手段１２，入出力監視手段１３，制御手段１４，アクセス監視手段１５，送受信手段１６，クライアント情報収集手段２１，インストール手段２２，収集手段２３，管理コンソール２４，個人情報管理手段２５，表示制御手段２６および送受信手段２７としての機能を実現させるプログラムコードを含んでいる。また、その機能の一部は、アプリケーションプログラムではなくＯＳによって実現されてもよい。

さらに、本実施形態における記録媒体としては、上述したフレキシブルディスク，ＣＤ，ＤＶＤ，磁気ディスク，光ディスク，光磁気ディスクのほか、ＩＣカード，ＲＯＭカートリッジ，磁気テープ，パンチカード，コンピュータの内部記憶装置（ＲＡＭやＲＯＭ等のメモリ），外部記憶装置等や、バーコードなどの符号が印刷された印刷物等の、コンピュータ読取可能な種々の媒体を利用することもできる。

〔６〕付記
（付記１）
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
前記所定の区切り位置として、予め設定された区切り文字の出現位置、もしくは、１バイトコード文字と２バイトコード文字との境界位置が含まれていることを特徴とする、個人情報探索プログラム。

（付記２）
前記所定の区切り位置として、全角算用数字と全角算用数字およびハイフンを除く文字との境界位置がさらに含まれていることを特徴とする、付記１記載の個人情報探索プログラム。

（付記３）
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上のＡＳＣＩＩ（American Standard Code for Information Interchange）文字」＋「@（アットマーク）」＋「一文字以上のＡＳＣＩＩ文字」＋「.（ドット）」＋「一文字以上のＡＳＣＩＩ文字」となる文字列が含まれており、且つ、当該文字列の最後の文字が半角の英字であることを電子メールアドレス判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての電子メールアドレスであるか否かを判定することを特徴とする、個人情報探索プログラム。

（付記４）
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字列に「一文字以上の全角文字」＋「市」または「区」または「郡」＋「一文字以上の全角文字」となる文字列が含まれており、且つ、当該文字列の先頭文字が日本全国における４７都道府県名もしくは市区郡名の頭文字と一致することを住所判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての住所であるか否かを判定することを特徴とする、個人情報探索プログラム。

（付記５）
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、所定の区切り位置で区切られた文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が個人情報要素であるか否かを判定し、個人情報要素であると判定された文字列の数に基づいて当該データ集合体が個人情報ファイルであるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させ、
該個人情報ファイル判定手段が、該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定することを特徴とする、個人情報探索プログラム。

（付記６）
前記所定の区切り位置として、予め設定された区切り文字の出現位置、もしくは、１バイトコード文字と２バイトコード文字との境界位置が含まれていることを特徴とする、付記３〜付記５のいずれか一項に記載の個人情報探索プログラム。
（付記７）
前記所定の区切り位置として、全角算用数字と全角算用数字およびハイフンを除く文字との境界位置がさらに含まれていることを特徴とする、付記６記載の個人情報探索プログラム。

（付記８）
該個人情報ファイル判定手段として該コンピュータを機能させる際、
該切出手段によって切り出された文字区間における文字列が、予め設定された電話番号判定条件，電子メールアドレス判定条件および住所判定条件のいずれか一つを満たすか否かの判定を行なうことにより、氏名以外の個人情報要素である電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当するか否かを判定する第１判定手段、
該第１判定手段によって電話番号，電子メールアドレス，住所のいずれにも該当しないと判定された文字区間における文字の数が所定範囲内であり且つ同文字区間における文字が漢字であるか否かを判定する文字判定手段、
該文字判定手段によって前記所定範囲内であり且つ漢字であると判定された文字区間について、当該文字区間に含まれる文字もしくは文字列と氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列とを照合することにより、当該文字区間が前記の不適切文字もしくは不適切文字列を含むか否かを判定する照合手段、および、
該第１判定手段によって電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当すると判定された文字区間の数と該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間の数とをそれぞれ計数し、その計数結果に基づいて、当該データ集合体が個人情報ファイルであるか否かを判定する第２判定手段として、該コンピュータを機能させることを特徴とする、付記１〜付記４のいずれか一項に記載の個人情報探索プログラム。

（付記９）
該文字判定手段が、さらに、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致するか否かを判定し、
該照合手段が、該文字判定手段によって前記所定範囲内であり且つ漢字であり且つ前記先頭文字が日本人に多い苗字上位所定数に属する苗字の頭文字と一致すると判定された文字区間について、前記の不適切文字もしくは不適切文字列との照合を行なうことを特徴とする、付記８記載の個人情報探索プログラム。

（付記１０）
該第２判定手段が、該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間における文字列を氏名に該当する個人情報要素と見なして、当該データ集合体が個人情報ファイルであるか否かを判定することを特徴とする、付記８または付記９に記載の個人情報探索プログラム。

（付記１１）
該第２判定手段が、前記計数結果に基づいて、該第１判定手段によって電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当すると判定された文字区間の数と該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間の数とが多いほど大きくなる判定値を算出し、算出された判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定することを特徴とする、付記８〜付記１０のいずれか一項に記載の個人情報探索プログラム。

（付記１２）
該第１判定手段において、該切出手段によって切り出された文字区間における文字列が、電話番号に該当するか否かを判定し、電話番号に該当しない場合に電子メールアドレスに該当するか否かを判定し、電子メールアドレスに該当しない場合に住所に該当するか否かを判定し、電話番号，電子メールアドレス，住所のうちのいずれか一つに該当すると判定された時点で、当該文字列についての判定処理を終了することを特徴とする、付記８〜付記１１のいずれか一項に記載の個人情報探索プログラム。

（付記１３）
複数のクライアント端末と、
該複数のクライアント端末とネットワークを介して相互に通信可能に接続され、該複数のクライアント端末の記憶部における個人情報ファイルを管理する個人情報管理サーバとをそなえ、
該個人情報管理サーバが、
該ネットワークを介して、各クライアント端末に、個人情報ファイルの自己探索を実行させるべく付記１〜付記１２のいずれか一項に記載された個人情報探索プログラムをインストールするインストール手段と、
該ネットワークを介して、各クライアント端末で実行された自己探索の結果を受信し、データベースに格納する収集手段とをそなえて構成されるとともに、
該複数のクライアント端末のそれぞれが、
該個人情報管理サーバからインストールされた前記個人情報探索プログラムを実行することにより、各クライアント端末の該記憶部におけるデータの中から個人情報ファイルを探索する個人情報探索手段と、
該ネットワークを介して該個人情報探索手段による自己探索の結果を該個人情報管理サーバへ送信する送信手段とをそなえて構成されていることを特徴とする、個人情報管理システム。

（付記１４）
該個人情報管理サーバが、該収集手段によって受信された探索結果に基づいて、該個人情報探索手段で探索された個人情報ファイルを管理する個人情報管理手段をさらにそなえて構成されていることを特徴とする、付記１３記載の個人情報管理システム。

（付記１５）
該複数のクライアント端末のそれぞれが、自端末における該個人情報ファイルを監視し、自端末において該個人情報ファイルに対するアクセスが生じた場合にはその旨を該送信手段によって該個人情報管理サーバに送信させるアクセス監視手段をさらにそなえて構成されていることを特徴とする、付記１４記載の個人情報管理システム。

（付記１６）
該個人情報管理手段が、該個人情報ファイルの利用者に警告情報を通知することを特徴とする、付記１４または付記１５に記載の個人情報管理システム。
（付記１７）
該個人情報管理手段が、該個人情報ファイルを保存しているクライアント端末から該個人情報ファイルを強制的に回収することを特徴とする、付記１４〜付記１６のいずれか一項に記載の個人情報管理システム。

（付記１８）
該個人情報管理手段が、該個人情報ファイルを保存しているクライアント端末から該個人情報ファイルが外部へ出力されるのを強制的に禁止することを特徴とする、付記１４〜付記１６のいずれか一項に記載の個人情報管理システム。
（付記１９）
該個人情報管理手段が、該個人情報ファイルを管理者のみがアクセス可能なフォルダに格納することを特徴とする、付記１７または付記１８に記載の個人情報管理システム。

（付記２０）
該個人情報管理サーバと相互に通信可能に接続され、電子ファイルに対するアクセスを管理するファイルアクセス管理サーバをさらにそなえ、
該個人情報管理手段が、該個人情報ファイルに対するアクセスを該ファイルアクセス管理サーバに管理させることを特徴とする、付記１４〜付記１９のいずれか一項に記載の個人情報管理システム。

（付記２１）
複数のクライアント端末とネットワークを介して相互に通信可能に接続され、該複数のクライアント端末における個人情報ファイルを管理する個人情報管理サーバであって、
該ネットワークを介して、各クライアント端末に、個人情報ファイルの自己探索を実行させるべく付記１〜付記１２のいずれか一項に記載された個人情報探索プログラムをインストールするインストール手段と、
該ネットワークを介して、各クライアント端末で実行された自己探索の結果を受信し、データベースに格納する収集手段とをそなえて構成されていることを特徴とする、個人情報管理サーバ。

（付記２２）
個人情報管理サーバの管理対象として、該個人情報管理サーバとネットワークを介して相互に通信可能に接続された情報処理装置であって、
付記１〜付記１２のいずれか一項に記載された個人情報探索プログラムを実行することにより、該情報処理装置の記憶部におけるデータの中から個人情報ファイルを探索する個人情報探索手段と、
該ネットワークを介して該個人情報探索手段による自己探索の結果を該個人情報管理サーバへ送信する送信手段とをそなえて構成されていることを特徴とする、個人情報管理機能付き情報処理装置。

（付記２３）
該情報処理装置での処理を実行する演算処理部の使用率を監視する使用率監視手段と、
該使用率監視手段によって監視されている前記使用率が所定閾値以下である場合に該個人情報探索手段を作動させる一方、前記使用率が所定閾値を超えている場合に該個人情報探索手段の動作を停止させる制御手段とをさらにそなえて構成されていることを特徴とする、付記２２記載の個人情報管理機能付き情報処理装置。

（付記２４）
該情報処理装置の該記憶部におけるデータの入出力動作を監視する入出力監視手段と、
該入出力監視手段によって前記入出力動作の発生を検知した時点で該個人情報探索手段を作動させる制御手段とをさらにそなえて構成されていることを特徴とする、付記２２または付記２３に記載の個人情報管理機能付き情報処理装置。

（付記２５）
該個人情報探索手段で探索された個人情報ファイルを監視し、当該個人情報ファイルに対するアクセスが生じた場合にはその旨を該送信手段によって該個人情報管理サーバに送信させるアクセス監視手段をさらにそなえて構成されていることを特徴とする、付記２２〜付記２４のいずれか１項に記載の個人情報管理機能付き情報処理装置。

（付記２６）
ネットワークを介して相互に通信可能に接続された複数のクライアント端末における個人情報ファイルを管理する個人情報管理サーバとして、コンピュータを機能させるプログラムであって、
付記１〜付記１２のいずれか一項に記載された個人情報探索プログラムを含むとともに、
該ネットワークを介して、各クライアント端末に、個人情報ファイルの自己探索を実行させるべく前記個人情報探索プログラムをインストールするインストール手段、および、
該ネットワークを介して、各クライアント端末で実行された自己探索の結果を受信し、データベースに格納する収集手段として、該コンピュータを機能させることを特徴とする、個人情報管理サーバ用プログラム。

（付記２７）
複数の端末と通信可能に接続され、該複数の端末からインベントリ情報をエージェントレスで収集する情報収集機能を有する管理端末と、
該管理端末の該情報収集機能によって収集された前記インベントリ情報に基づき、該複数の端末のうちの一部もしくは全部に、個人情報ファイルの自己探索を実行させるべく付記１〜付記１２のいずれか一項に記載された個人情報探索プログラムを配布する配布手段とをそなえて構成されたことを特徴とする、個人情報管理システム。

（付記２８）
該管理端末が、該情報収集機能によって収集された前記インベントリ情報を、ＣＳＶ（Comma Separated Value）形式のファイルデータとして出力し、
該配布手段が、前記ファイルデータに基づいて作成された該個人情報探索プログラムの配布計画に従って、該個人情報探索プログラムを配布することを特徴とする、付記２７記載の個人情報管理システム。

（付記２９）
前記配布計画が、前記ファイルデータに含まれる各端末のリソース情報に基づいて作成されていることを特徴とする、付記２８記載の個人情報管理システム。
（付記３０）
該配布手段が、電子メールを用いて該個人情報探索プログラムを配布することを特徴とする、付記２７〜付記２９のいずれか一項に記載の個人情報管理システム。

（付記３１）
該複数の端末における資産を管理する資産管理サーバが該配布手段としてそなえられ、該資産管理サーバが該個人情報探索プログラムを配布することを特徴とする、付記２７〜付記２９のいずれか一項に記載の個人情報管理システム。
（付記３２）
該管理端末が、該複数の端末の一部もしくは全部に配布されてインストールされた該個人情報探索プログラムを実行させることを特徴とする、付記２７〜付記３１のいずれか一項に記載の個人情報管理システム。

（付記３３）
該複数の端末の一部もしくは全部において該個人情報探索プログラムを実行することによって行なわれた自己探索の結果を管理者指定の場所に収集する収集手段をさらにそなえて構成されたことを特徴とする、付記２７〜付記３２のいずれか一項に記載の個人情報管理システム。

（付記３４）
電子メールが、該収集手段として用いられることを特徴とする、付記３３記載の個人情報管理システム。

本発明の一実施形態としての個人情報管理システムの構成を示すブロック図である。本実施形態のクライアント端末（個人情報管理機能付き情報処理装置）の機能構成を示すブロック図である。本実施形態のクライアント端末（個人情報管理機能付き情報処理装置）における個人情報探索手段の詳細な機能構成を示すブロック図である。本実施形態の個人情報管理サーバの機能構成を示すブロック図である。本実施形態のファイルアクセス管理サーバの機能構成を示すブロック図である。本実施形態の各クライアントにおける個人情報探索手段の動作を説明するためのフローチャートである。本実施形態の各クライアントにおける制御手段の動作を説明するためのフローチャートである。本実施形態の各クライアントにおける制御手段の動作を説明するためのフローチャートである。本実施形態の個人情報管理サーバの動作を説明するためのフローチャートである。本実施形態のファイルアクセス管理サーバによるファイル変換動作を説明するためのフローチャートである。本実施形態のファイルアクセス管理サーバによる認証動作を説明するためのフローチャートである。本発明の個人情報管理システムの変形例の構成を示すブロック図である。図１２に示す個人情報管理システムの導入手順を説明するためのフローチャートである。図１２に示す個人情報管理システムの導入手順を説明するための図である。

符号の説明

１，１Ａ個人情報管理システム
１０クライアント端末（個人情報管理機能付き情報処理装置）
１０ａＣＰＵ（演算処理部）
１０ｂ記憶部
１０ｃ検疫テーブル
１０ｄＰマークテーブル
１１個人情報探索手段（探索エンジン，テキスト抽出エンジン）
１１１抽出手段
１１２切出手段
１１３第１判定手段
１１３ａ電話番号判定手段
１１３ｂ電子メールアドレス判定手段
１１３ｃ住所判定手段
１１４文字判定手段
１１５照合手段
１１６第２判定手段（判定手段）
１２ＣＰＵ使用率監視手段
１３入出力監視手段
１４制御手段
１５アクセス監視手段
１６送受信手段（送信手段）
２０個人情報管理サーバ
２０ａＣＰＵ
２０ｂデータベース
２０ｃ表示部
２１クライアント情報収集手段
２２インストール手段
２３収集手段
２４管理コンソール
２５個人情報管理手段
２６表示制御手段
２７送受信手段
３０ファイルアクセス管理サーバ
３０ａＣＰＵ
３０ｂ記憶部
３１送受信手段
３１ａ個人情報ファイル受信手段
３１ｂ暗号化ファイル送信手段
３１ｃ認証情報受信手段
３１ｄ復号鍵送信手段
３２変換手段
３３暗号化手段
３４判定手段
４０ネットワーク（社内ＬＡＮ）
５０個人情報管理対象の端末（ＰＣ）
６０管理端末（ＰＣ）

Claims

記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、予め設定された区切り文字の出現位置、および、１バイトコード文字と２バイトコード文字との境界位置で文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字の数が所定範囲内であり、且つ、同文字区間における文字が漢字であり、且つ、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致し、且つ、氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列を同文字区間に含まないことを氏名判定条件として、該切出手段によって切り出された文字区間における文字列が前記個人情報要素としての氏名であるか否かを判定する個人情報ファイル判定手段として、該コンピュータを機能させることを特徴とする、個人情報探索プログラム。
記憶部におけるデータの中から、特定の個人を識別可能な個人情報要素を所定数以上保有している個人情報ファイルを探索する個人情報探索機能をコンピュータに実現させる個人情報探索プログラムであって、
前記データに含まれるデータ集合体のテキストデータを抽出する抽出手段、
該抽出手段によって抽出されたテキストデータから、予め設定された区切り文字の出現位置、および、１バイトコード文字と２バイトコード文字との境界位置で文字区間を切り出す切出手段、および、
該切出手段によって切り出された文字区間における文字列が、予め設定された電話番号判定条件，電子メールアドレス判定条件および住所判定条件のいずれか一つを満たすか否かの判定を行なうことにより、氏名以外の個人情報要素である電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当するか否かを判定する第１判定手段、
該第１判定手段によって電話番号，電子メールアドレス，住所のいずれにも該当しないと判定された文字区間における文字の数が所定範囲内であり且つ同文字区間における文字が漢字であるか否かを判定する文字判定手段、
該文字判定手段によって前記所定範囲内であり且つ漢字であると判定された文字区間について、当該文字区間に含まれる文字もしくは文字列と氏名において出現し得ない漢字もしくは漢字列として予め設定された不適切文字もしくは不適切文字列とを照合することにより、当該文字区間が前記の不適切文字もしくは不適切文字列を含むか否かを判定する照合手段、および、
該第１判定手段によって電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当すると判定された文字区間の数と該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間の数とをそれぞれ計数し、その計数結果に基づいて、当該データ集合体が個人情報ファイルであるか否かを判定する第２判定手段として、該コンピュータを機能させることを特徴とする、個人情報探索プログラム。
該文字判定手段が、さらに、同文字区間における文字列の先頭文字が、日本人に多い苗字上位所定数に属する苗字の頭文字と一致するか否かを判定し、
該照合手段が、該文字判定手段によって前記所定範囲内であり且つ漢字であり且つ前記先頭文字が日本人に多い苗字上位所定数に属する苗字の頭文字と一致すると判定された文字区間について、前記の不適切文字もしくは不適切文字列との照合を行なうことを特徴とする、請求項２記載の個人情報探索プログラム。
該第２判定手段が、該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間における文字列を氏名に該当する個人情報要素と見なして、当該データ集合体が個人情報ファイルであるか否かを判定することを特徴とする、請求項２または請求項３に記載の個人情報探索プログラム。
該第２判定手段が、前記計数結果に基づいて、該第１判定手段によって電話番号，電子メールアドレスおよび住所のうちのいずれか一つに該当すると判定された文字区間の数と該照合手段によって前記の不適切文字もしくは不適切文字列を含まないと判定された文字区間の数とが多いほど大きくなる判定値を算出し、算出された判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定することを特徴とする、請求項２〜請求項４のいずれか一項に記載の個人情報探索プログラム。
該第１判定手段において、該切出手段によって切り出された文字区間における文字列が、電話番号に該当するか否かを判定し、電話番号に該当しない場合に電子メールアドレスに該当するか否かを判定し、電子メールアドレスに該当しない場合に住所に該当するか否かを判定し、電話番号，電子メールアドレス，住所のうちのいずれか一つに該当すると判定された時点で、当該文字列についての判定処理を終了することを特徴とする、請求項２〜請求項５のいずれか一項に記載の個人情報探索プログラム。