JP3743783B1 - Personal information management system, personal information management server, and personal information management server program - Google Patents
Personal information management system, personal information management server, and personal information management server program Download PDFInfo
- Publication number
- JP3743783B1 JP3743783B1 JP2004260205A JP2004260205A JP3743783B1 JP 3743783 B1 JP3743783 B1 JP 3743783B1 JP 2004260205 A JP2004260205 A JP 2004260205A JP 2004260205 A JP2004260205 A JP 2004260205A JP 3743783 B1 JP3743783 B1 JP 3743783B1
- Authority
- JP
- Japan
- Prior art keywords
- personal information
- client
- search
- information management
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005540 biological transmission Effects 0.000 claims abstract description 25
- 238000009434 installation Methods 0.000 claims abstract description 15
- 238000012544 monitoring process Methods 0.000 claims description 37
- 230000004913 activation Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 11
- 238000013480 data collection Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims 2
- 230000003213 activating effect Effects 0.000 claims 1
- 238000012937 correction Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 33
- 238000000034 method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000010365 information processing Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 241000219995 Wisteria Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】人的な協力を得ることなく且つ担当者に特別な負荷をかけることなく、例えば企業内等において分散して存在する個人情報を確実に探索し管理可能な状態に置けるようにして、個人情報の開示要求や訂正要求に確実に対応できるようにするとともに、個人情報の不用意な流出・漏洩や個人情報の不正利用などを確実に防止する。
【解決手段】個人情報管理サーバ20が、各クライアント10に個人情報検索プログラムをインストールするインストール手段と、各クライアント10で実行された自己検索の結果を受信しデータベースに格納する収集手段とをそなえて構成されるとともに、各クライアント10が、前記個人情報検索プログラムを実行することにより記憶部におけるデータの中から個人情報の集合体を特定して検索する個人情報検索手段と、自己検索の結果を個人情報検索サーバ20へ送信する送信手段とをそなえて構成されている。
【選択図】図1
[PROBLEMS] To ensure that personal information distributed in a company or the like can be searched and managed in a manageable manner without obtaining human cooperation and without placing a special burden on the person in charge. We will ensure that we can respond to requests for disclosure and correction of personal information, and we will prevent the inadvertent leakage and leakage of personal information and unauthorized use of personal information.
A personal information management server includes an installation unit that installs a personal information search program in each client, and a collection unit that receives a result of a self-search executed by each client and stores the result in a database. And a personal information search means for each client 10 executing a personal information search program to identify and search a collection of personal information from the data in the storage unit, A transmission means for transmitting to the information search server 20 is provided.
[Selection] Figure 1
Description
本発明は、特定の個人を識別可能な個人情報を探索して管理するための技術に関し、特に、例えば、企業内において複数のクライアント(パーソナルコンピュータ等)に分散して保存されている個人情報を、自動的に探索して、サーバの管理下に置くことを可能にした技術に関する。 The present invention relates to a technique for searching and managing personal information that can identify a specific individual, and in particular, for example, personal information distributed and stored in a plurality of clients (such as personal computers) in a company. The present invention relates to a technology that can automatically search and put a server under management.
近年、個人情報の保護の意識の高まりに伴い、個人情報の不用意な流出・漏洩や個人情報の不正利用などを確実に防止することが望まれている。また、個人情報保護法の施行に伴って、個人情報取扱事業者は、個人情報の流出・漏洩や不正利用を防止しながら、各個人から個人情報の開示要求や訂正要求を受けた場合にその個人情報の開示や訂正を行なうことが義務付けられている。 In recent years, with an increase in awareness of protection of personal information, it has been desired to reliably prevent inadvertent leakage and leakage of personal information and unauthorized use of personal information. In addition, along with the enforcement of the Personal Information Protection Law, a business operator handling personal information receives a request for disclosure or correction of personal information from each individual while preventing the leakage, leakage or unauthorized use of personal information. It is obliged to disclose and correct personal information.
ここで、個人情報とは、単体もしくは組合せによって特定の個人を識別することのできる情報で、例えば氏名,生年月日,連絡先(住所,居所,電話番号)などが含まれる。各種企業内で保存されて取り扱われる顧客情報,取引先情報などが個人情報に該当する場合が多く、今後、このような個人情報を多数取り扱う企業は、個人情報取扱事業者として上述のような義務を果たさなければならない。 Here, the personal information is information that can identify a specific individual by itself or in combination, and includes, for example, a name, date of birth, contact information (address, address, telephone number) and the like. Customer information, business partner information, etc. stored and handled in various companies often fall under the category of personal information, and in the future, companies that handle a lot of such personal information will be obligated as above as a personal information handling business operator. Must be fulfilled.
上述のような義務を果たすためには、個人情報のための集中管理システムを導入して個人情報の一元化をはかることが必要不可欠となる。しかしながら、現実には、企業内において、顧客情報,取引先情報などの個人情報は、社員個人のパーソナルコンピュータ(以下、PCと略記する場合がある)や各部署のサーバに、ばらばらに分散して存在している場合が多い。より具体的には、個々の社員が各自の業務都合で自分のPCに個人情報(顧客情報等)を保存していたり、中央データベース、あるいは、各社員によって独自に収集された個人情報のサブセットが複数のPCにまちまちに存在していたりする。 In order to fulfill the obligations described above, it is essential to centralize personal information by introducing a central management system for personal information. However, in reality, personal information such as customer information and business partner information is dispersed in a company's personal computer (hereinafter sometimes abbreviated as PC) and servers in each department. Often exists. More specifically, individual employees store their personal information (customer information, etc.) on their PCs for their own work, or a central database or a subset of personal information collected by each employee. It exists in various PCs.
このため、上記集中管理システムを構築する場合や分散状態のままで上記義務を果たそうとする場合、いずれの場合であっても、管理者は、まず最初に、企業内にばらばらに存在する個人情報の洗い出しを行ない、企業内のどこにどのような個人情報が存在しているかを把握する必要があるが、現状、個人情報の洗い出しは、管理者が各社員に指示し人間対人間で全社・全部門の人的な協力を得て行なわれることになる。 For this reason, when constructing the centralized management system or attempting to fulfill the above obligations in a distributed state, the administrator must first separate the personal information that is scattered within the company. It is necessary to identify what kind of personal information exists in the company, but at present, the personal information is identified by the manager instructing each employee to be a company-wide It will be carried out with the cooperation of the department.
なお、例えば、下記特許文献1においては、個人情報保護法の施行に伴い、個人情報の流出・漏洩や不正利用を防止する個人情報保護サービスを提供するための技術「個人情報保護サービス事業の処理方法および装置」が提案・開示されている。しかし、下記特許文献1には、上述したような個人情報の洗い出しに関する技術については何ら開示されていない。
しかしながら、各社員からの申告といった人的な協力のもとで個人情報の洗い出しを行なうと、手間がかかるだけでなく全ての個人情報を確実に漏れなく洗い出すのは困難になる。特に、個人情報の分散化が進んでいると、個人情報の洗い出しは極めて困難になる。
また、個人情報の洗い出しに漏れがあると、上記義務を果たせなくなるだけでなく、その個人情報の状態を管理できず、個人情報の不用意な流出・漏洩や個人情報の不正利用を招くおそれもある。
However, when personal information is identified with human cooperation such as reporting from each employee, not only is it time-consuming, but it is difficult to reliably identify all personal information without omission. In particular, when personal information is increasingly distributed, it is extremely difficult to identify personal information.
In addition, if there is an omission in the identification of personal information, not only the above obligations can be fulfilled, but the status of the personal information cannot be managed, and there is a risk of inadvertent leakage or leakage of personal information or unauthorized use of personal information. is there.
従って、企業内に分散して存在する全ての個人情報を確実に探索し管理可能な状態に置くことが望まれている。
本発明は、このような状況に鑑み創案されたもので、人的な協力を得ることなく且つ担当者に特別な負荷をかけることなく、例えば企業内等において分散して存在する個人情報の集合体を確実に探索し管理可能な状態に置けるようにして、個人情報の開示要求や訂正要求に確実に対応できるようにするとともに、個人情報の不用意な流出・漏洩や個人情報の不正利用などを確実に防止することを目的としている。
Therefore, it is desirable to ensure that all personal information distributed in the company is searched and managed.
The present invention was devised in view of such circumstances, and is a collection of personal information that exists in a distributed manner, for example, within a company without obtaining human cooperation and without placing a special load on the person in charge. By ensuring that the body can be searched and managed, it will be possible to respond to requests for disclosure and correction of personal information, and inadvertent leakage / leakage of personal information and unauthorized use of personal information. The purpose is to reliably prevent this.
上記目的を達成するために、本発明の個人情報管理システムは、複数のクライアントと、該複数のクライアントとネットワークを介して相互に通信可能に接続され、該複数のクライアントにおける個人情報ファイルを管理する個人情報管理サーバとをそなえ、該個人情報管理サーバが、該ネットワークを介して、各クライアントに、個人情報の自己検索を実行させる個人情報検索プログラムをインストールするインストール手段と、該ネットワークを介して、各クライアントで実行された自己検索の結果を受信し、データベースに格納する収集手段とをそなえて構成されるとともに、該複数のクライアントのそれぞれが、該個人情報管理サーバからインストールされた前記個人情報検索プログラムを実行することにより、各クライアントの記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索手段と、該ネットワークを介して該個人情報検索手段による自己検索の結果を該個人情報管理サーバへ送信する送信手段とをそなえて構成され、該個人情報検索手段が、各クライアントの該記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索機能を各クライアントに実現させるものであって、前記データに含まれるデータ集合体毎に、当該データ集合体に含まれる文字もしくは文字列と個人情報において特徴的に出現する文字もしくは文字列として、氏名,生年月日,住所,居所,電話番号,電子メールアドレス,役職,個人識別情報のうちの少なくとも一つに係るものとを照合して、前記特徴文字もしくは前記特徴文字列が当該データ集合体において出現する回数を計数し、該計数結果に基づいて、前記特徴文字もしくは前記特徴文字列の出現率が高いほど大きくなる判定値を算出し、前記判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定するように、各クライアントを動作させることを特徴としている。 In order to achieve the above object, a personal information management system of the present invention is connected to a plurality of clients so as to be able to communicate with each other via a network, and manages personal information files in the plurality of clients. A personal information management server, and the personal information management server installs a personal information search program for causing each client to perform a personal search of personal information via the network, and via the network, The personal information search is configured to include a collection unit that receives a result of the self-search executed by each client and stores the result in a database, and each of the plurality of clients is installed from the personal information management server. By running the program, you can record each client Includes personal information searching means for searching to identify the personal information file from the data in section, and transmitting means for transmitting the results of the self-retrieval by said individual information retrieval means via said network to said individual information management server The personal information search means is configured to cause each client to implement a personal information search function for specifying and searching for a personal information file from the data in the storage unit of each client, and is included in the data For each data aggregate , the name, date of birth, address, residence, telephone number, e-mail address, etc. as characters or character strings included in the data aggregate and characters or character strings that appear characteristically in personal information Title, by matching to that according to at least one of the personal identification information, the characteristic character or the feature character string is the Counts the number of occurrences in over data collection, based on the regimen counting results, calculates the feature character or judgment value occurrence rate becomes higher increase of the characteristic character string, the judgment value exceeds a predetermined threshold value In this case, each client is operated so as to determine that the data aggregate is a personal information file .
また、本発明の個人情報管理サーバは、上記個人情報管理システムにおける個人情報管理サーバとして機能するものである。 The personal information management server of the present invention functions as a personal information management server in the personal information management system.
そして、本発明の個人情報管理サーバ用プログラムは、ネットワークを介して相互に通信可能に接続された複数のクライアントにおける個人情報ファイルを管理する個人情報管理サーバとして、コンピュータを機能させるプログラムであって、
各クライアントに、個人情報の自己検索を実行させる個人情報検索プログラムを含むとともに、
該ネットワークを介して、各クライアントに、前記個人情報検索プログラムをインストールするインストール手段、および、
該ネットワークを介して、各クライアントで実行された自己検索の結果を受信し、データベースに格納する収集手段として、該コンピュータを機能させ、
該インストール手段によって各クライアントにインストールされる前記個人情報検索プログラムが、
各クライアントの該記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索機能を各クライアントに実現させるものであって、
前記データに含まれるデータ集合体毎に、当該データ集合体に含まれる文字もしくは文字列と個人情報において特徴的に出現する文字もしくは文字列として、氏名,生年月日,住所,居所,電話番号,電子メールアドレス,役職,個人識別情報のうちの少なくとも一つに係るものとを照合し、前記特徴文字もしくは前記特徴文字列が当該データ集合体において出現する回数を計数する計数ステップと、
該計数ステップにおいて、前記特徴文字もしくは前記特徴文字列の出現率が高いほど大きくなる判定値を算出し、
前記判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定する判定ステップとを、該クライアントに実行させるものであることを特徴としている。
The personal information management server program of the present invention is a program that causes a computer to function as a personal information management server that manages personal information files in a plurality of clients connected to each other via a network.
Includes a personal information search program that allows each client to perform a personal search for personal information,
Installation means for installing the personal information search program on each client via the network; and
Via the network, the result of self-search performed by each client is received, and the computer is functioned as a collecting means for storing in a database,
The personal information retrieval program installed in each client by the installation means is:
Each client realizes a personal information search function for specifying and searching a personal information file from data in the storage unit of each client,
For each data aggregate included in the data, characters, character strings included in the data aggregate, and characters or character strings that appear characteristically in personal information, such as name, date of birth, address, residence, telephone number, A counting step of collating with at least one of an e-mail address, a title, and personal identification information, and counting the number of times the characteristic character or the characteristic character string appears in the data aggregate;
In the counting step, a determination value that increases as the appearance rate of the characteristic character or the characteristic character string increases,
When the determination value exceeds a predetermined threshold, the determination step of determining that the data aggregate is a personal information file is executed by the client.
上述した本発明によれば、記憶部におけるデータ集合体毎に、特徴文字や特徴文字列の出現回数に基づく判定値によって、そのデータ集合体が個人情報の集合体であるか否かが判定され、個人情報の集合体を自動的に特定して検索することができるので、人的な協力を得ることなく且つ担当者に特別な負荷をかけることなく、例えば企業内等において分散して存在する個人情報の集合体(個人情報の集合体である可能性の高いデータ集合体)を確実に探索して洗い出し管理可能な状態に置くことができる。従って、個人情報の開示要求や訂正要求に確実に対応することができるとともに、個人情報の不用意な流出・漏洩や個人情報の不正利用などを確実に防止することができる。 According to the present invention described above, for each data aggregate in the storage unit, whether or not the data aggregate is a collection of personal information is determined based on a determination value based on the number of appearances of characteristic characters and characteristic character strings. Since it is possible to automatically identify and search a collection of personal information, it exists in a distributed manner, for example, within a company, without human cooperation and without placing a special burden on the person in charge. A collection of personal information (a data collection that is highly likely to be a collection of personal information) can be reliably searched for and put into a state where it can be managed. Accordingly, it is possible to reliably respond to requests for disclosure and correction of personal information, and to reliably prevent inadvertent leakage and leakage of personal information and unauthorized use of personal information.
このとき、各クライアント(個人情報管理機能付き情報処理装置)において演算処理部の使用率(使用負荷)を監視し、その使用率が所定閾値以下である場合に個人情報検索手段(検索エンジン)を起動することにより、演算処理部に負荷を掛けることなく個人情報の集合体の洗い出しを行なうことができる。 At this time, the usage rate (usage load) of the arithmetic processing unit is monitored in each client (information processing apparatus with a personal information management function), and if the usage rate is equal to or less than a predetermined threshold, the personal information search means (search engine) is By starting, it is possible to identify a collection of personal information without imposing a load on the arithmetic processing unit.
また、各クライアント(個人情報管理機能付き情報処理装置)において記憶部に対するデータの入出力動作を監視し、入出力動作の発生時に個人情報検索手段(検索エンジン)を起動することにより、クライアントにおける記憶部に新たなデータが入力される場合やクライアントにおける記憶部からデータが出力される場合(例えば、データをメールに添付すべく出力する場合のほかデータを外部記憶媒体へ書き込むべく出力する場合など)に、入出力データに含まれるデータ集合体が個人情報の集合体であるか否かを判定して、個人情報の集合体の移動を監視することができるので、個人情報の不用意な流出・漏洩をより確実に防止することができる。 Each client (information processing apparatus with a personal information management function) monitors the data input / output operation for the storage unit, and activates personal information search means (search engine) when the input / output operation occurs, thereby storing the data in the client. When new data is input to the storage unit or when data is output from the storage unit in the client (for example, when outputting data to be attached to an e-mail, or when writing data to an external storage medium) In addition, since it is possible to determine whether the data aggregate included in the input / output data is a collection of personal information and to monitor the movement of the personal information aggregate, Leakage can be prevented more reliably.
さらに、個人情報の集合体であると判定されたデータ集合体を監視し、そのデータ集合体に対するアクセス(例えば、リネイム,コピー,消去,移動などによるデータ変更)が生じた場合にはその旨を個人情報管理サーバに送信することにより、個人情報の集合体である可能性の高いデータ集合体に対するアクセス(操作・変更履歴)が、個人情報管理サーバで追跡管理(トラッキング)されることになり、個人情報の不正利用をより確実に防止することができる。 Furthermore, the data aggregate determined to be a collection of personal information is monitored, and if access to the data aggregate (for example, data change by renaming, copying, erasing, moving, etc.) occurs, that fact is indicated. By sending to the personal information management server, the access (operation / change history) to the data aggregate that is likely to be a collection of personal information is tracked and managed (tracked) by the personal information management server. Unauthorized use of personal information can be prevented more reliably.
また、各データ集合体を各データ集合体について算出された判定値に応じて管理することにより、例えば、判定値が大きければ、そのデータ集合体の利用者(保有者)やシステム管理者に注意情報/警告情報を通知したりそのデータ集合体をクライアントから強制的に捕獲・回収したりすることが可能で、個人情報の不用意な流出・漏洩や個人情報の不正利用などをより確実に防止することができる。 In addition, by managing each data aggregate according to the determination value calculated for each data aggregate, for example, if the determination value is large, be careful of the user (owner) of the data aggregate and the system administrator. It is possible to notify information / warning information and forcibly capture and collect the data aggregate from the client, and more reliably prevent inadvertent leakage and leakage of personal information and unauthorized use of personal information. can do.
以下、図面を参照して本発明の実施の形態を説明する。
〔1〕本実施形態の個人情報管理システムの構成
図1は本発明の第1実施形態としての個人情報管理システムの機能構成を示すブロック図で、この図1に示す個人情報管理システム1は、複数のクライアント(個人情報管理機能付き情報処理装置;パーソナルコンピュータ等の端末装置)10と、これらのクライアント10とネットワーク〔例えばLAN(Local Area Network)〕30を介して相互に通信可能に接続されこれらのクライアント10における個人情報ファイルを管理する個人情報管理サーバ20とをそなえて構成されている。
Embodiments of the present invention will be described below with reference to the drawings.
[1] Configuration of Personal Information Management System of this Embodiment FIG. 1 is a block diagram showing a functional configuration of a personal information management system as a first embodiment of the present invention. The personal information management system 1 shown in FIG. A plurality of clients (information processing apparatus with a personal information management function; a terminal device such as a personal computer) 10 and these
本実施形態において、個人情報ファイル(個人情報の集合体)は、個人情報を含むレコードを所定数以上保有しているものであり、個人情報は、前述した通り、単体もしくは組合せによって特定の個人を識別することのできる情報、例えば氏名,生年月日,連絡先(住所,居所,電話番号,メールアドレス)などを含むものである。なお、個人情報としては、これら以外に、役職名,住民基本台帳番号,口座番号,クレジットカード番号,免許証番号,パスポート番号なども挙げられる。 In the present embodiment, the personal information file (collection of personal information) holds a predetermined number or more of records including personal information. As described above, the personal information includes a specific individual by a single unit or a combination. Information that can be identified includes, for example, name, date of birth, contact information (address, address, telephone number, e-mail address). In addition to these, personal information includes titles, basic resident register numbers, account numbers, credit card numbers, license numbers, passport numbers, and the like.
〔1−1〕本実施形態のクライアントの構成
図2は本実施形態の各クライアント10の機能構成を示すブロック図で、この図2に示すクライアント10は、各種処理を実行するCPU(演算処理部)10aと、個人情報等のデータ集合体(ファイル)を保持しうる記憶部10bとをそなえるほか、個人情報管理サーバ20から提供される検疫テーブル10cや、記憶部10bに保持されるデータ集合体(データファイル)のPマーク(プライバシレベルマーク;個人情報ファイルである可能性の高さを示すレベルであり、後述する判定値によって決定されるレベル)を保持するPマークテーブル10dをそなえて構成されている。
[1-1] Configuration of Client of this Embodiment FIG. 2 is a block diagram showing the functional configuration of each
ここで、記憶部10bは、クライアント10に内蔵されるハードディスクや、クライアント10に接続・外付けされる記憶装置、例えばフレキシブルディスク,CD−ROM,CD−R,CD−RW,DVD,磁気ディスク,光ディスク,光磁気ディスクのほかICカード,ROMカートリッジ,磁気テープなどの記録媒体を用いる記憶装置である。
また、検疫テーブル10cおよびPマークテーブル10dは、クライアント10を構成するRAM(Random Access Memory)やハードディスク等に保持される。
Here, the
Further, the quarantine table 10c and the P mark table 10d are held in a RAM (Random Access Memory), a hard disk or the like constituting the
CPU10aは、個人情報検索手段11,CPU使用率監視手段12,入出力監視手段13,起動制御手段14,アクセス監視手段15および送受信手段16としての機能を果たすもので、これらの機能は、CPU10aが、後述するごとく個人情報管理サーバ20からインストールされた個人情報検索プログラムを実行することによって実現される。
The
個人情報検索手段11は、個人情報管理サーバ20からインストールされる個人情報検索プログラムを実行することにより図6を参照しながら後述するごとく動作するもので、記憶部10bに保存されているデータファイル(対象ファイル)をテキストファイルにするテキスト抽出エンジンとして機能するとともに、検疫テーブル10cを用いて記憶部10bにおけるデータの中から個人情報ファイルを特定して検索する検索エンジンとして機能するものである。つまり、個人情報検索手段11は、個人情報管理サーバ20から指示された条件(検疫テーブル10c)に従って、クライアント10の記憶部10bに存在する各種ファイル(データ集合体)に対する検索を行ない、対象ファイル(個人情報ファイルであると判定されたファイル)をログ(ローカルキャッシュデータベース)に書き出すものである。この個人情報検索手段11で得られた検索結果(判定値)に基づいて決定されたPマークがPマークテーブル10dに登録される。この個人情報検索手段11の機能の詳細については後述する。
The personal information search means 11 operates as described later with reference to FIG. 6 by executing a personal information search program installed from the personal
CPU使用率監視手段12は、本クライアント10で各種処理を実行するCPU10aの使用率を監視するものであり、入出力監視手段13は、記憶部10bにおけるデータの入出力動作(I/O動作)を監視するものである。
起動制御手段14は、個人情報管理サーバ20からインストールされる個人情報検索プログラムを実行することにより図7および図8を参照しながら後述するごとく動作するもので、CPU使用率監視手段12によって監視されているCPU10aの使用率が所定閾値以下である場合に個人情報検索手段11を起動させる一方、その使用率が所定閾値を超えている場合に個人情報検索手段11の動作を停止させるほか、入出力監視手段13によって入出力動作の発生を検知した時点で個人情報検索手段11を起動させるものである。つまり、起動制御手段14は、基本的には、最低閾値で個人情報検索手段11を起動し、最高使用率で個人情報検索手段11をアイドル状態(検索ホールド)にするもので、個人情報検索手段11をスクリーンセーバー的に動作させる。
The CPU usage
The
アクセス監視手段15は、個人情報検索手段11で個人情報ファイルであると判定されたデータファイル(Pマークを付与されたデータファイル)を監視し、そのデータファイルに対するアクセス(例えば、リネイム,コピー,消去,移動などによるデータ変更)が生じた場合にはその旨をログ情報として書き出し送受信手段16によって個人情報管理サーバ20に送信させるものである。
The
送受信手段16は、ネットワーク30を介して個人情報管理サーバ20との間で各種情報を送受信するもので、個人情報検索手段11による自己検索の結果を個人情報検索サーバ20へ送信する送信手段として機能するものである。送受信手段16が上記送信手段として機能する際、検索結果(個人情報ファイルのリンク先情報や判定値など)を、前回送信した検索結果との差分を得て、その差分を個人情報管理サーバ20へ送信するほか、送信すべき情報を暗号化するようになっている。
The transmission /
〔1−2〕本実施形態の個人情報管理サーバの構成
図3は本実施形態の個人情報管理サーバ20の機能構成を示すブロック図で、この図3に示す個人情報管理サーバ20は、各種処理を実行するCPU20aと、各クライアント10からのログ情報や個人情報ファイルなどを格納・保存するデータベース(RDB:Relational DataBase)20bと、このデータベース20bに保存されたログ情報や個人情報を含む各種情報を表示する表示部20cとをそなえて構成されている。
[1-2] Configuration of Personal Information Management Server of this Embodiment FIG. 3 is a block diagram showing the functional configuration of the personal
CPU20aは、クライアント情報収集手段21,インストール手段22,収集手段23,管理コンソール24,個人情報管理手段25,表示制御手段26および送受信手段27としての機能を果たすもので、これらの機能は、CPU20aが、個人情報管理サーバ用プログラムを実行することによって実現される。
クライアント情報収集手段21は、個人情報の検索・管理を開始する際に、ネットワーク30を介して通信可能に接続された複数のクライアント10からクライアント情報(ホスト情報)を収集し、個人情報の検索・管理対象のクライアント10を認識するものである。
The
The client information collecting means 21 collects client information (host information) from a plurality of
インストール手段22は、ネットワーク30を介して、各クライアント10に、個人情報の自己検索を実行させる個人情報検索プログラムをインストールするものである。
収集手段23は、ネットワーク30および送受信手段27を介して、各クライアント10で実行された自己検索の結果(個人情報ファイルのリンク先情報や判定値など)を受信・収集し、データベース20bに格納するものである。
The
The
管理コンソール24は、各クライアント10に対して指示する検索条件(上記検疫テーブル10cや、個人情報ファイルやPマークを判定するために必要になる所定閾値など)を設定して管理するものである。検疫テーブル10cは、個人情報において特徴的に出現する文字もしくは文字列である特徴文字もしくは特徴文字列を指定するためのもので、その詳細については図4を参照しながら後述する。
The management console 24 sets and manages search conditions (such as the quarantine table 10c, a predetermined threshold necessary for determining a personal information file and a P mark) to be instructed to each
個人情報管理手段25は、収集手段23によって収集されデータベース20bに格納された検索結果に基づいて、各クライアント10における個人情報ファイルを管理するもので、各クライアント10の個人情報検索手段11で個人情報ファイルの可能性があると判定されたデータファイル(Pマークの付与されたデータファイル)を管理対象としている。この個人情報管理手段25は、具体的には後述するごとく、各データファイルの判定値(またはPマーク)に応じて、データファイルの利用者(保有者)に注意情報/警告情報を通知したり、データファイルを、そのデータファイルを保存しているクライアント10から強制的に捕獲・回収したりする。また、個人情報管理手段25は、各クライアント10もしくはデータベース20bに格納された個人情報ファイルを種々の確度で検索する機能や、表示制御手段26によってその検索結果等を表示部20cに表示させる機能を有している。
The personal information management means 25 manages personal information files in each
表示制御手段26は、表示部20cに各種情報を表示させるべく表示部20cの表示状態を制御するものである。
送受信手段27は、ネットワーク30を介して各クライアント10との間で各種情報を送受信するものである。
The display control means 26 controls the display state of the
The transmission / reception means 27 transmits / receives various information to / from each
〔2〕本実施形態の個人情報管理システムの動作
次に、図4〜図8を参照しながら、上述のごとく構成された本実施形態の個人情報管理システム1(クライアント&サーバ)の動作について説明する。
まず、本実施形態の個人情報検索手段11(個人情報検索プログラム)による、個人情報ファイルの検索手法について、図4〜図6を参照しながら説明する。ここで、図4は本実施形態の検疫テーブル10cの例を示す図、図5はタイトルヘッダの具体例を示す図、図6は本実施形態の各クライアント10における個人情報検索手段11の動作を説明するためのフローチャートである。
[2] Operation of Personal Information Management System of the Present Embodiment Next, the operation of the personal information management system 1 (client & server) of the present embodiment configured as described above will be described with reference to FIGS. To do.
First, a personal information file search method by the personal information search means 11 (personal information search program) of this embodiment will be described with reference to FIGS. 4 is a diagram showing an example of the quarantine table 10c of this embodiment, FIG. 5 is a diagram showing a specific example of the title header, and FIG. 6 is an operation of the personal information search means 11 in each
本実施形態の個人情報検索手段11では、以下のように、住所,電話番号,メールアドレス,氏名の出現頻度を数値化し、個人情報ファイルの特定を行なっている。
より具体的には、個人情報検索手段11によって実行される計数ステップにおいて、まず、データファイルに含まれる文字もしくは文字列と個人情報において特徴的に出現する文字/文字列として予め設定された特徴文字/特徴文字列とを照合し、特徴文字/特徴文字列がデータファイルにおいて出現する回数を計数している。ただし、本実施形態では、文字列による照合・認識を行なうとCPU10aにかかる負荷が極めて大きくなるので、1文字ずつの照合・認識を行なうものとする。従って、検疫テーブル10cには、図4を参照しながら後述するごとく、特徴文字が1文字ずつ設定されている。なお、CPU10aの演算処理能力が十分に高い場合には文字列による照合・認識を行なってもよい。
In the personal information search means 11 of this embodiment, the appearance frequency of an address, a telephone number, an e-mail address, and a name is quantified and the personal information file is specified as follows.
More specifically, in the counting step executed by the personal information search means 11, first, a character or character string included in the data file and a characteristic character preset as a character / character string characteristically appearing in the personal information / Feature character string is collated and the number of times the characteristic character / feature character string appears in the data file is counted. However, in the present embodiment, when collation / recognition using character strings is performed, the load on the
そして、対象ファイル(テキストファイル)から抽出された文字を、1文字ずつ、検疫テーブル10cにおける特徴文字と照合し、これらが一致する場合には、その特徴文字が出現したものと判断して、その特徴文字のカウント値を“1”カウントアップする。このようにして対象ファイルに含まれる全ての文字における、特徴文字の出現回数を計数してから、その計数結果に基づいて個人情報ファイルの特定(対象ファイルが個人情報ファイルであるか否かの判定)を行なっている。 Then, characters extracted from the target file (text file) are collated one by one with the characteristic characters in the quarantine table 10c, and if they match, it is determined that the characteristic characters have appeared, The count value of the characteristic character is incremented by “1”. After counting the number of appearances of characteristic characters in all characters included in the target file in this way, the personal information file is identified based on the count result (determination of whether the target file is a personal information file) ).
ここで、検疫テーブル10cに予め設定される特徴文字について具体的に説明する。
一般的な個人情報では、通常、住所が必須となる。そこで、図4に示すように、日本国内の住所において特徴的に出現する文字を特徴文字として検疫テーブル10cに設定登録しておく。例えば、住所情報には“都”,“道”,“府”,“県”,“市”,“区”,“町”,“村”,“郡”などが含まれている可能性が高く、“東京都”の場合、“東”,“京”の文字は通常文書中にも出現するが住所情報の場合、“都”と組合わせて出現することになるので、“都”の出現回数を住所数として見なすことが可能になる。同様に“府”や“県”や“道”も住所の見なし情報となるほか、“@”についてはメールアドレスの見なし情報として用いることが可能になる。
Here, the characteristic characters preset in the quarantine table 10c will be specifically described.
In general personal information, an address is usually required. Therefore, as shown in FIG. 4, characters that characteristically appear at addresses in Japan are set and registered in the quarantine table 10c as characteristic characters. For example, the address information may include “city”, “road”, “fu”, “prefecture”, “city”, “ward”, “town”, “village”, “county”, etc. In the case of “Tokyo”, the characters “East” and “Kyo” appear in ordinary documents, but in the case of address information, they will appear in combination with “City”. It becomes possible to regard the number of appearances as the number of addresses. Similarly, “prefecture”, “prefecture”, and “road” are considered as address information, and “@” can be used as e-mail address information.
図4に示す検疫テーブル10cでは、以下のような特徴文字およびポイントが設定されている。
(1)住所の見なし情報(特徴文字)として“東”,“京”,“都”,“大”,“阪”,“府”,“北”,“海”,“道”が設定され、これらの特徴文字の計数値の合計が住所ポイント1として計数・算出される。
(2)住所の見なし情報(特徴文字)として、住所ポイント1以外の府県名、つまり“山”,“形”,“神”,“奈”,“川”,“埼”,“玉”,…,“福”,“岡”,“県”などが設定され、これらの特徴文字の計数値の合計が住所ポイント2として計数・算出される。
(3)住所の見なし情報(特徴文字)として“市”,“区”,“町”,“村”,“郡”が設定され、これらの特徴文字の計数値の合計が住所ポイント3として算出される。
In the quarantine table 10c shown in FIG. 4, the following characteristic characters and points are set.
(1) “East”, “Kyo”, “Metro”, “Large”, “Osaka”, “Fu”, “North”, “Sea”, “Road” are set as address information (characters). The total of the count values of these characteristic characters is counted / calculated as the address point 1.
(2) As presumed address information (characteristics), prefecture names other than address point 1, that is, “mountain”, “form”, “god”, “na”, “river”, “saki”, “tama”, ..., "Fuku", "Oka", "Prefecture", etc. are set, and the total of the count values of these characteristic characters is counted and calculated as address point 2.
(3) “City”, “District”, “Town”, “Village” and “County” are set as address disregard information (characteristic characters), and the total of the count values of these characteristic characters is calculated as address point 3 Is done.
(4)メールアドレスの見なし情報(特徴文字)として“@”が設定され、この“@”の計数値がメールアドレスポイントとして用いられる。
(5)電話番号の見なし情報(特徴文字列)として、“N”(数字,ハイフンからなる所定桁数の数字列)が設定され、その計数値が電話番号ポイントとして用いられる。より具体的には、電話番号は“090-XXXX-XXXX”,“03-XXXX-XXXX”,“048-XXX-XXXX”というように、携帯電話局番や市外局番に対応する特定の数字列“090”,“03”,“048”の後に8桁もしくは7桁の数字列が連続する構成となっており、このような数字列が出現した場合に電話番号ポイントを“1”カウントアップする。このとき、数字列中におけるハイフンの有無に関係なくカウントアップを行なう。
(4) “@” is set as the mail address deemed information (characteristic character), and the count value of “@” is used as the mail address point.
(5) “N” (numeric string with a predetermined number of digits consisting of numerals and hyphens) is set as the telephone number deemed information (characteristic character string), and the counted value is used as the telephone number point. More specifically, the phone number is a specific number string corresponding to the mobile phone area code or area code, such as “090-XXXX-XXXX”, “03-XXXX-XXXX”, “048-XXX-XXXX”. It consists of “090”, “03”, “048” followed by an 8-digit or 7-digit numeric string. When such a numeric string appears, the telephone number point is incremented by “1”. . At this time, the count-up is performed regardless of the presence or absence of a hyphen in the numeric string.
(6)氏名の見なし情報(特徴文字)として、例えば日本国内における苗字のベスト50に含まれる文字“佐”,“藤”,“田”,“中”,“高”,“橋”,…,“山”,“田”が設定され、これらの特徴文字の計数値の合計が氏名ポイントとして算出される。
(7)検疫合計ポイントとして、上述した項目(1)〜(6)の各ポイントの合計値が計数・算出される。
ここで、図4中において、「」には、各特徴文字の出現回数を示す計数値、もしくは、各ポイント(出現回数の合計値)が書き込まれ、最大、例えば1千万程度まで計数可能になっている。
(6) As name disregard information (characters), for example, the characters “sa”, “wisteria”, “da”, “middle”, “high”, “bridge”, etc. included in the best 50 of last names in Japan. , “Mountain”, and “field” are set, and the sum of the count values of these characteristic characters is calculated as a name point.
(7) As the quarantine total points, the total value of each point of the items (1) to (6) described above is counted and calculated.
Here, in FIG. 4, a count value indicating the number of appearances of each characteristic character or each point (total value of the number of appearances) is written in “”, and can be counted up to, for example, about 10 million. It has become.
また、上述のような検疫テーブル10cを用いて得られた計数結果(出現回数)に基づいて各都道府県名の出現率を算出する際に、重複文字が存在する場合の取扱について説明する。例えば“東京都”と“京都府”とがテキストファイルに混在する場合、“都”が重複するため、“都”の計数値には“東京都”の計数値に“京都府”のカウントが混ざることになる。“京都府”の“府”は“大阪府”の“府”と重複するので、まず“大阪”の出現率を算定し、その出現率を“府”の出現率から減算すれば、“京都府”の出現率を予測することが可能になる。このようにして予測された“京都府”の出現率を“都”の出現率から減算することにより、“東京都”の出現率とすることができる。また、県名と市名とが重複するような場合(例えば大阪府大阪市)、“大阪”の出現率が2倍になるが、郵政省管理で公開されている日本の住所録に基づいて都道府県名別の重複率を算定し、算定された重複率に基づいて出現率の調整を行なうことにより、実際の出現率を推定することが可能である。 Moreover, when calculating the appearance rate of each prefecture name based on the counting result (number of appearances) obtained using the quarantine table 10c as described above, handling in the case where duplicate characters exist will be described. For example, if “Tokyo” and “Kyoto Prefecture” are mixed in a text file, “Metropolitan” is duplicated. Therefore, the “Metropolitan” count is the same as the “Tokyo” count. It will be mixed. Since “Fu” in “Kyoto” overlaps with “Fu” in “Osaka”, first calculate the appearance rate of “Osaka” and subtract that appearance rate from the appearance rate of “Fu”. It is possible to predict the appearance rate of “fu”. The appearance rate of “Tokyo” can be obtained by subtracting the appearance rate of “Kyoto Prefecture” predicted in this manner from the appearance rate of “Miyako”. If the prefecture name and city name overlap (for example, Osaka City, Osaka Prefecture), the appearance rate of “Osaka” will double, but based on the Japanese address book published by the Ministry of Posts and Telecommunications. It is possible to estimate the actual appearance rate by calculating the duplication rate for each prefecture name and adjusting the appearance rate based on the calculated duplication rate.
さらに、都道府県表示が無い場合の取扱について説明する。データファイルにおいて、都道府県名について図5に示すようなタイトルヘッダを用いる場合や、政令指定都市の住所表示や郵便番号を使用した住所表示では、“都”,“道”,“府”,“県”の出現率が極端に低下することになる。その代わり県名等の名称出現率が高くなるので、名称出現率から、データファイルが住所情報を含む個人情報ファイルであることの特定を行なうことが可能になる。 Furthermore, the handling when there is no state display will be described. In the data file, when the title header as shown in FIG. 5 is used for the prefecture name, or in the address display using the decree-designated city or the postal code, “city”, “road”, “prefecture”, “ The appearance rate of “prefecture” will be extremely reduced. Instead, since the name appearance rate such as the prefecture name becomes high, it is possible to specify that the data file is a personal information file including address information from the name appearance rate.
なお、上述した検疫テーブル10cでは、住所,メールアドレス,電話番号,氏名において特徴的に出現する文字/文字列を特徴文字/特徴文字列として設定しているが、本発明は、これらに限定されるものでなく、生年月日,役職名,個人識別情報(例えば、住民基本台帳番号,口座番号,クレジットカード番号,免許証番号,パスポート番号など)において特徴的に出現する文字/文字列を特徴文字/特徴文字列として設定してもよい。 In the quarantine table 10c described above, characters / character strings that appear characteristically in addresses, e-mail addresses, telephone numbers, and names are set as feature characters / character strings, but the present invention is not limited to these. Characters / character strings that appear characteristically in the date of birth, title, personal identification information (for example, Basic Resident Register Number, Account Number, Credit Card Number, License Number, Passport Number, etc.) It may be set as a character / characteristic character string.
そして、個人情報検索手段11によって実行される算出ステップにおいて、上述した検疫テーブル10cを用いて得られた計数結果に基づき、対象ファイルが個人情報ファイルである度合いを示す判定値が算出される。その判定値としては、(a)検疫テーブル10cの検疫合計ポイント(上記項目(7)参照)の値をそのまま用いてもよいし、(b)特徴文字/特徴文字列の出現率が高いほど大きくなる判定ポイントを前記判定値として算出してもよいし、(c)特徴文字/特徴文字列毎に得られた計数結果に基づいて対象ファイルにおける特徴文字/特徴文字列の出現パターンを求め、求められた出現パターンと特徴文字/特徴文字列の出現パターンとして予め設定された特徴出現パターンとの一致の度合いを示す一致度を前記判定値として算出してもよいし、(d)これら3種類の判定値のうちの2以上を組み合わせ、2以上の判定値を所定関数に代入して算出された値を前記判定値として用いてもよい。 Then, in the calculation step executed by the personal information search means 11, a determination value indicating the degree to which the target file is a personal information file is calculated based on the counting result obtained using the quarantine table 10c described above. As the determination value, (a) the value of the quarantine total point (see item (7) above) of the quarantine table 10c may be used as it is, or (b) the larger the appearance rate of feature characters / feature character strings, the larger the value. The determination point may be calculated as the determination value, or (c) the appearance pattern of the characteristic character / characteristic character string in the target file is obtained based on the count result obtained for each characteristic character / characteristic character string. The degree of coincidence indicating the degree of coincidence between the appearance pattern and the characteristic appearance pattern preset as the appearance pattern of the characteristic character / characteristic character string may be calculated as the determination value, or (d) these three types Two or more of the determination values may be combined and a value calculated by substituting two or more determination values into a predetermined function may be used as the determination value.
このとき、対象ファイルに複数種類の情報(例えば住所,メールアドレス,電話番号,氏名の4種類)に係る特徴文字/特徴文字列が存在している場合、対象ファイル中に1種類の情報に係る特徴文字/特徴文字列が存在している場合よりも、前記判定値が大きくなるように、計数結果に対する重み付けを行なう。つまり、データファイル中に、個人を特定しうる複数種類の情報が含まれている場合には、そのデータファイルが個人情報ファイルである可能性は、個人を特定しうる情報が1種類だけ含まれている場合よりも高いと考えられるので、そのデータファイルについての判定値(重要度)が大きくなるように重み付けを行なう。また、その情報の種類数が多いほど、判定値が大きくなるように重み付けを行なうようにしてもよい。これにより、より確実に個人情報ファイルを特定することが可能になる。 At this time, when there are characteristic characters / characteristic character strings related to plural types of information (for example, four types of address, e-mail address, telephone number, and name) in the target file, the target file relates to one type of information. The count result is weighted so that the determination value is larger than when a characteristic character / characteristic character string exists. In other words, when a data file includes a plurality of types of information that can identify an individual, the possibility that the data file is a personal information file includes only one type of information that can identify an individual. Therefore, weighting is performed so that the determination value (importance) for the data file becomes large. Further, weighting may be performed so that the determination value increases as the number of types of information increases. This makes it possible to specify the personal information file more reliably.
上述のような判定値が算出されると、個人情報検索手段11によって実行される判定ステップにおいて、その判定値に基づいて、対象ファイルが個人情報ファイルであるか否かを判定する。例えば、前記判定値が所定閾値を超えた場合に対象ファイルが個人情報ファイルであると判定する。このような判定を行なう際に、本実施形態では、さらに、判定値の大きさに応じたPマーク(プライベートレベルマーク)を対象ファイルに付与してPマークテーブル10dに設定・登録し、ランク付けを行なっている。このPマークは、前述した通り、対象ファイルが個人情報ファイルである可能性の高さを示すレベルであり、判定値が大きいほどPマークは高いランクに設定される。 When the determination value as described above is calculated, it is determined in the determination step executed by the personal information search means 11 based on the determination value whether the target file is a personal information file. For example, if the determination value exceeds a predetermined threshold, it is determined that the target file is a personal information file. When making such a determination, in this embodiment, a P mark (private level mark) corresponding to the size of the determination value is added to the target file, set and registered in the P mark table 10d, and ranked. Is doing. As described above, the P mark is a level indicating the high possibility that the target file is a personal information file. The larger the determination value, the higher the P mark is set.
例えば、前記判定値が10以上となった場合、対象ファイルが個人情報ファイルであると判定する。また、前記判定値が10以上100未満である場合、Pマークとして“P1”を付与し、前記判定値が100以上1000未満である場合、Pマークとして“P2”を付与し、前記判定値が1000以上10000未満である場合、Pマークとして“P3”を付与し、前記判定値が10000以上である場合、Pマークとして“P4”を付与する。なお、個人情報ファイルを判定するための所定閾値やPマークを決定するための基準値は、個人情報管理サーバ20の管理コンソール24によって適宜設定される。また、ここではPマークを“P1”〜“P4”の4つにランク分けしているが、ランク分けの数はこれに限定されるものではない。
For example, when the determination value is 10 or more, it is determined that the target file is a personal information file. When the determination value is 10 or more and less than 100, “P1” is assigned as the P mark, and when the determination value is 100 or more and less than 1000, “P2” is assigned as the P mark. When it is 1000 or more and less than 10,000, “P3” is assigned as the P mark, and when the determination value is 10000 or more, “P4” is assigned as the P mark. The predetermined threshold for determining the personal information file and the reference value for determining the P mark are appropriately set by the management console 24 of the personal
上述のように対象ファイルに付与されたPマーク(Pマークテーブル10d)は、送受信手段16およびネットワーク30を介して個人情報管理サーバ20へ送信され、収集手段23によりデータベース20bに保存される。そして、Pマークを付与されたデータファイルは、そのPマークのランクに応じて、個人情報管理サーバ20(個人情報管理手段25)により個人情報ファイルとして以下のように管理される。
As described above, the P mark (P mark table 10 d) assigned to the target file is transmitted to the personal
例えば、Pマークのランクが“P1”である場合、警告情報によるリコメンドは行なわないが“P1”のデータファイルが存在することをログとして記録する。Pマークのランクが“P2”である場合、そのデータファイルの利用者に対して注意を促すべくポップアップ表示による注意情報を通知する。Pマークのランクが“P3”である場合、そのデータファイルを保管している利用者が存在する旨を、システム管理者に対し警告情報としてメール等により通知するとともに、そのデータファイルの返却を指示する。Pマークのランクが“P4”である場合、そのデータファイルをクライアント10から強制的に捕獲・回収する。なお、Pマークのランクが“P4”でなくても、“P3”のデータファイルが所定日数放置された場合には、そのデータファイルをクライアント10から強制的に捕獲・回収する。
For example, when the rank of the P mark is “P1”, the recommendation based on the warning information is not performed, but the fact that the data file of “P1” exists is recorded as a log. When the rank of the P mark is “P2”, notice information in a pop-up display is notified to alert the user of the data file. When the rank of the P mark is “P3”, the system administrator is notified by e-mail as warning information that there is a user storing the data file, and the return of the data file is instructed. To do. When the rank of the P mark is “P4”, the data file is forcibly captured and collected from the
上述した個人情報検索手段11によって実行される個人情報検索(個人情報ファイル特定)の一連の手順を、図6に示すフローチャート(ステップS11〜S18)に従って説明する。
本実施形態の個人情報管理システム1を構築する際には、まず、個人情報管理サーバ20として機能すべきコンピュータに個人情報管理用プログラムをインストールし、そのコンピュータが個人情報管理用プログラムを実行することにより個人情報管理サーバ20としての機能(クライアント情報収集手段21,インストール手段22,収集手段23,管理コンソール24,個人情報管理手段25,表示制御手段26および送受信手段27)を果たす。そして、個人情報の検索・管理を開始する際に、クライアント情報収集手段21により、ネットワーク30を介して通信可能に接続された複数のクライアント10からクライアント情報が収集され、個人情報の検索・管理対象のクライアント10が認識され、個人情報の検索・管理対象として認識されたクライアント10に、インストール手段22により、ネットワーク30を介して個人情報検索プログラムがインストールされる。この個人情報検索プログラムをクライアント10のCPU10aで実行することにより、CPU10aが個人情報検索手段11,CPU使用率監視手段12,入出力監視手段13,起動制御手段14,アクセス監視手段15および送受信手段16としての機能を果たす。なお、個人情報検索プログラムをインストールする際には、検疫テーブル10cも併せて送信される。また、個人情報検索プログラムは、個人情報管理用プログラムに予め含まれている。
A series of procedures for personal information search (personal information file specification) executed by the personal information search means 11 will be described with reference to the flowchart (steps S11 to S18) shown in FIG.
When constructing the personal information management system 1 of the present embodiment, first, a personal information management program is installed in a computer that should function as the personal
クライアント10においては、図7および図8を参照しながら後述するタイミングで個人情報検索手段11が起動されると、Pマークテーブル10dおよび記憶部10bが参照され、この記憶部10bにおけるPマーク未設定のデータファイルの有無が判定される(ステップS11)。Pマーク未設定のデータファイルが存在する場合(ステップS11のYESルート)、記憶部10bからPマーク未設定のデータファイルが対象ファイルとして一つ選択されて読み出され(ステップS12)、その対象ファイルが、テキスト抽出エンジンによりテキストファイルに変換される(ステップS13)。
In the
そして、テキストファイルから抽出された文字を、1文字ずつ、検疫テーブル10cにおける特徴文字と照合し、これらが一致する場合には、その特徴文字が出現したものと判断して、その特徴文字のカウント値を“1”カウントアップする(ステップS14;計数ステップ)。このようにして対象ファイルに含まれる全ての文字における、特徴文字の出現回数を計数してから、その計数結果に基づいて、対象ファイルが個人情報ファイルである度合いを示す判定値(例えば上記項目(a)〜(d)参照)を算出する(ステップS15;算出ステップ)。 Then, the characters extracted from the text file are collated one by one with the characteristic characters in the quarantine table 10c, and if they match, it is determined that the characteristic characters have appeared, and the characteristic characters are counted. The value is incremented by “1” (step S14; counting step). In this way, after counting the number of appearances of characteristic characters in all characters included in the target file, based on the count result, a determination value indicating the degree to which the target file is a personal information file (for example, the above item ( a) to (d)) is calculated (step S15; calculation step).
ステップS15で算出された判定値に基づいて、上述したように、対象ファイルが個人情報ファイルであるか否かの判定を行なうとともにPマークのランク付けを行なう(ステップS16;判定ステップ)。個人情報ファイルの判定結果やPマークのランク付けの結果は、Pマークテーブル10dに登録されるとともに、送受信手段16およびネットワーク30を介して、個人情報管理サーバ20にも送信され(ステップS17)、個人情報管理サーバ20において、収集手段23によりデータベース20bに保存される。
Based on the determination value calculated in step S15, as described above, it is determined whether or not the target file is a personal information file and ranks the P mark (step S16; determination step). The personal information file determination result and the P mark ranking result are registered in the P mark table 10d, and also transmitted to the personal
この後、再度、記憶部10bにおけるPマーク未設定のデータファイルの有無を判定し(ステップS18)、他にPマーク未設定のデータファイルが存在する場合(ステップS18のYESルート)、ステップS12に戻り上述と同様の処理を実行する一方、Pマーク未設定のデータファイルが存在しない場合(ステップS18のNOルート)、個人情報の検索動作を終了する。
Thereafter, it is determined again whether or not there is a data file in which the P mark is not set in the
次に、図7および図8を参照しながら、個人情報検索手段11(個人情報検索プログラム)の起動タイミングについて説明する。ここで、図7および図8は本実施形態の各クライアント10における起動制御手段14の動作を説明するためのフローチャートである。
本実施形態の起動制御手段14は、図7に示すフローチャート(ステップS21〜S27)に従うCPU使用率による起動制御と、図8に示すフローチャート(ステップS31〜S33)に従う入出力動作(I/O動作)による起動制御とを実行するようになっている。
Next, the activation timing of the personal information search means 11 (personal information search program) will be described with reference to FIGS. Here, FIG. 7 and FIG. 8 are flowcharts for explaining the operation of the
The activation control means 14 of the present embodiment includes activation control based on the CPU usage rate according to the flowchart (steps S21 to S27) shown in FIG. 7, and input / output operation (I / O operation) according to the flowchart (steps S31 to S33) shown in FIG. ) Start control.
CPU使用率による起動制御では、CPU使用率監視手段12によりCPU10aの使用率を監視し(ステップS21)、その使用率が所定閾値以下であるか否かを判定し(ステップS22)、使用率が所定閾値以下である場合(ステップS22のYESルート)、個人情報検索手段11を起動する(ステップS23)。起動後、検索を終了したか否かを判定し(ステップS24)、終了していない場合(ステップS24のNOルート)、ステップS21に戻る。ステップS24で検索を終了したと判定された場合(YESルート)、検索結果の通知後(ステップS25)、ステップS21に戻る。
In the activation control based on the CPU usage rate, the CPU usage
ステップS22で使用率が所定閾値よりも大きいと判定された場合(NOルート)、個人情報検索手段11が起動中か否かを判定し(ステップS26)、起動中でなければ(ステップS26のNOルート)、ステップS21に戻る一方、起動中であれば(ステップS26のYESルート)、個人情報検索手段11による検索動作を中断させてから(ステップS27)、ステップS21に戻る。このようにして、個人情報検索手段11をスクリーンセーバー的に動作させることができる。 If it is determined in step S22 that the usage rate is greater than the predetermined threshold (NO route), it is determined whether or not the personal information search means 11 is activated (step S26), and if not activated (NO in step S26). On the other hand, if it is activated (YES route in step S26), the search operation by the personal information search means 11 is interrupted (step S27), and then the process returns to step S21. In this way, the personal information search means 11 can be operated like a screen saver.
入出力動作による起動制御では、入出力監視手段13により、記憶部10bにおけるデータの入出力動作(I/O動作)を監視し(ステップS31)、入出力動作の発生を検知した場合(ステップS31のYESルート)、直ちに個人情報検索手段11を起動させ(ステップS32)、検索結果の通知後(ステップS33)、ステップS31に戻る。
なお、上述した2種類のタイミングによる起動制御は、両方とも採用して同時並列的に実行してもよいし、いずれか一方のみを採用して実行してもよい。
In the start control by the input / output operation, the input / output monitoring means 13 monitors the data input / output operation (I / O operation) in the
It should be noted that the activation control based on the two types of timings described above may be adopted and executed simultaneously in parallel, or only one of them may be adopted and executed.
また、各クライアント10においては、アクセス監視手段15により、Pマークを付与されたデータファイル(個人情報検索手段11で個人情報ファイルであると判定されたデータファイル)が監視され、そのデータファイルに対するアクセス(例えば、リネイム,コピー,消去,移動などによるデータ変更)が生じた場合には、その旨が、ログ情報として書き出され、送受信手段16およびネットワーク30を介して個人情報管理サーバ20に送信され、個人情報管理サーバ20において、収集手段23によりデータベース20bに保存される。
In each
〔3〕本実施形態の個人情報管理システムの効果
このように、本発明の一実施形態としての個人情報管理システム1(クライアント10および個人情報管理サーバ20)によれば、各クライアント10の記憶部10bにおけるデータファイル毎に、特徴文字や特徴文字列の出現回数に基づく判定値によって、そのデータファイルが個人情報ファイルであるか否かが判定され、個人情報ファイルを自動的に特定して検索することができるので、人的な協力を得ることなく且つ担当者に特別な負荷をかけることなく、例えば企業内等において分散して存在する個人情報ファイル(個人情報ファイルである可能性の高いデータファイル)を確実に探索して洗い出し管理可能な状態に置くことができる。従って、個人情報の開示要求や訂正要求に確実に対応することができるとともに、個人情報の不用意な流出・漏洩や個人情報の不正利用などを確実に防止することができる。
[3] Effects of the Personal Information Management System of the Present Embodiment As described above, according to the personal information management system 1 (
このとき、各クライアント10においてCPU10aの使用率(使用負荷)を監視し、その使用率が所定閾値以下である場合に個人情報検索手段(検索エンジン)11を起動することにより、CPU10aに負荷を掛けることなく個人情報ファイルの洗い出しを行なうことができる。
At this time, the usage rate (usage load) of the
また、各クライアント10において記憶部10bに対するデータの入出力動作(I/O動作)を監視し、入出力動作の発生時に個人情報検索手段(検索エンジン)11を起動することにより、クライアント10における記憶部10bに新たなデータが入力される場合や、クライアント10における記憶部10bからデータが出力される場合(例えば、データをメールに添付すべく記憶部10bから出力する場合だけでなく、データを、CD−R,CD−RW,DVD,磁気ディスク,光ディスク,光磁気ディスクなどの外部記録媒体へ書き込むべく記憶部10bから出力する場合)に、その入出力データに含まれるデータファイルが個人情報ファイルであるか否かを判定して、個人情報ファイルの移動を監視することができるので、個人情報の不用意な流出・漏洩をより確実に防止することができる。
Each
さらに、個人情報ファイルであると判定されたデータファイル(本実施形態ではPマークを付与されたファイル)を監視し、そのデータファイルに対するアクセス(例えば、リネイム,コピー,消去,移動などによるデータ変更)が生じた場合にはその旨をログ情報として個人情報管理サーバ20に送信することにより、個人情報ファイルである可能性の高いデータファイルに対するアクセス(操作・変更履歴)が、個人情報管理サーバ20で追跡管理(トラッキング)されることになり、個人情報の不正利用をより確実に防止することができる。
Further, a data file determined to be a personal information file (a file given a P mark in this embodiment) is monitored, and access to the data file (for example, data change by renaming, copying, erasing, moving, etc.) If this occurs, the fact is transmitted to the personal
また、各データファイルを、各データファイルに付与されたPマークに応じて管理することにより、例えば、Pマークのランク(判定値の大きさ)によって、そのデータファイルの利用者やシステム管理者に注意情報/警告情報を通知したりそのデータファイルをクライアント10(記憶部10b)から強制的に捕獲・回収したりすることが可能になり、個人情報の不用意な流出・漏洩や個人情報の不正利用などをより確実に防止することができる。
In addition, by managing each data file according to the P mark given to each data file, for example, depending on the rank of the P mark (the size of the judgment value), the user of the data file or the system administrator It is possible to notify caution information / warning information and to forcibly capture and collect the data file from the client 10 (
〔4〕その他
なお、本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上述した実施形態では、個人情報を検索・管理する場合について説明したが、本発明は、企業内等で守秘情報(守秘義務のある情報)を検索・管理する場合にも上述と同様に適用され、上記実施形態と同様の作用効果を得ることができ、守秘情報の不用意な流出・漏洩や守秘情報の不正利用などを確実に防止することができる。その場合、特徴文字や特徴文字列(キーワード)としては、その守秘情報において特徴的に出現する文字もしくは文字列を設定するとともに、特徴出現パターンとしては、その守秘情報において特徴文字もしくは特徴文字列の出現パターンを設定することになる。
[4] Others The present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the present invention.
For example, in the above-described embodiment, the case of searching / managing personal information has been described. However, the present invention also applies to the case of searching / managing confidential information (information with confidentiality obligation) in a company or the like. It can be applied to obtain the same operational effects as in the above-described embodiment, and can reliably prevent inadvertent outflow / leakage of confidential information and unauthorized use of confidential information. In that case, a character or character string that appears characteristically in the confidential information is set as the characteristic character or characteristic character string (keyword), and a characteristic character or characteristic character string in the confidential information is set as the characteristic appearance pattern. An appearance pattern will be set.
また、各クライアント10の個人情報検索手段11による検索(記憶部10bに保存されている全てのデータファイルに対する検索)を完了しない間は、そのクライアント10の記憶部10bにおけるデータファイルに対するアクセス(例えば、リネイム,コピー,消去,移動などによるデータ変更など;より具体的には、外部記録媒体への出力,メール添付など)を禁止するように構成してもよい。この場合、個人情報ファイルであると判定されるデータファイルの有無が確認され個人情報ファイルである可能性の高いデータファイルを個人情報管理サーバ20の管理下に置くまでは、そのクライアント10の記憶部10bにおけるデータファイルに対するアクセスが禁止されることになるので、より確実に個人情報の流出・漏洩を防止することが可能になる。
Further, while the search by the personal information search means 11 of each client 10 (search for all data files stored in the
さらに、各クライアント10における、上述した個人情報検索手段11,CPU使用率監視手段12,入出力監視手段13,起動制御手段14,アクセス監視手段15および送受信手段16としての機能(各手段の全部もしくは一部の機能)は、上述した通り、コンピュータ(CPU,情報処理装置,各種端末を含む)が、個人情報管理サーバ20からインストールされた所定のアプリケーションプログラム(個人情報検索プログラム)を実行することによって実現される。
Furthermore, the functions as the above-described personal information search means 11, CPU usage rate monitoring means 12, input / output monitoring means 13, activation control means 14, access monitoring means 15 and transmission / reception means 16 in each client 10 (all or As described above, a part of the functions) is performed by a computer (including a CPU, an information processing apparatus, and various terminals) executing a predetermined application program (personal information search program) installed from the personal
また、個人情報管理サーバ20における、上述したクライアント情報収集手段21,インストール手段22,収集手段23,管理コンソール24,個人情報管理手段25,表示制御手段26および送受信手段27としての機能(各手段の全部もしくは一部の機能)は、上述した通りコンピュータ(CPU,情報処理装置,各種端末を含む)が所定のアプリケーションプログラム(個人情報管理サーバ用プログラム)を実行することによって実現される。 In addition, the functions of the client information collection means 21, installation means 22, collection means 23, management console 24, personal information management means 25, display control means 26, and transmission / reception means 27 in the personal information management server 20 (each of the means) All or some of the functions are realized by a computer (including a CPU, an information processing apparatus, and various terminals) executing a predetermined application program (a program for a personal information management server) as described above.
個人情報検索プログラムを含む個人情報管理サーバ用プログラムは、例えばフレキシブルディスク,CD−ROM,CD−R,CD−RW,DVD等のコンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体から個人情報管理サーバ用プログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信回線を介してコンピュータに提供するようにしてもよい。 The personal information management server program including the personal information search program is provided in a form recorded on a computer-readable recording medium such as a flexible disk, CD-ROM, CD-R, CD-RW, or DVD. In this case, the computer reads the personal information management server program from the recording medium, transfers it to the internal storage device or the external storage device, and uses it. Further, the program may be recorded in a storage device (recording medium) such as a magnetic disk, an optical disk, or a magneto-optical disk, and provided from the storage device to a computer via a communication line.
ここで、コンピュータとは、ハードウエアとOS(オペレーティングシステム)とを含む概念であり、OSの制御の下で動作するハードウエアを意味している。また、OSが不要でアプリケーションプログラム単独でハードウェアを動作させるような場合には、そのハードウェア自体がコンピュータに相当する。ハードウエアは、少なくとも、CPU等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とをそなえている。上記個人情報検索プログラムや上記個人情報管理サーバ用プログラムとしてのアプリケーションプログラムは、上述のようなコンピュータに、個人情報検索手段11,CPU使用率監視手段12,入出力監視手段13,起動制御手段14,アクセス監視手段15,送受信手段16,クライアント情報収集手段21,インストール手段22,収集手段23,管理コンソール24,個人情報管理手段25,表示制御手段26および送受信手段27としての機能を実現させるプログラムコードを含んでいる。また、その機能の一部は、アプリケーションプログラムではなくOSによって実現されてもよい。 Here, the computer is a concept including hardware and an OS (operating system), and means hardware operating under the control of the OS. Further, when the OS is unnecessary and the hardware is operated by the application program alone, the hardware itself corresponds to the computer. The hardware includes at least a microprocessor such as a CPU and means for reading a computer program recorded on a recording medium. The personal information search program and the application program as the personal information management server program are stored in the computer as described above on the personal information search means 11, the CPU usage rate monitoring means 12, the input / output monitoring means 13, the activation control means 14, Program codes for realizing the functions as the access monitoring means 15, transmission / reception means 16, client information collection means 21, installation means 22, collection means 23, management console 24, personal information management means 25, display control means 26 and transmission / reception means 27. Contains. Also, some of the functions may be realized by the OS instead of the application program.
さらに、本実施形態における記録媒体としては、上述したフレキシブルディスク,CD−ROM,CD−R,CD−RW,DVD,磁気ディスク,光ディスク,光磁気ディスクのほか、ICカード,ROMカートリッジ,磁気テープ,パンチカード,コンピュータの内部記憶装置(RAMやROM等のメモリ),外部記憶装置等や、バーコードなどの符号が印刷された印刷物等の、コンピュータ読取可能な種々の媒体を利用することもできる。 Further, the recording medium in the present embodiment includes the above-mentioned flexible disk, CD-ROM, CD-R, CD-RW, DVD, magnetic disk, optical disk, magneto-optical disk, IC card, ROM cartridge, magnetic tape, Various computer-readable media such as punch cards, computer internal storage devices (memory such as RAM and ROM), external storage devices, and printed materials on which codes such as bar codes are printed can also be used.
1 個人情報管理システム
10 クライアント(個人情報管理機能付き情報処理装置)
10a CPU(演算処理部)
10b 記憶部
10c 検疫テーブル
10d Pマークテーブル
11 個人情報検索手段(検索エンジン,テキスト抽出エンジン)
12 CPU使用率監視手段
13 入出力監視手段
14 起動制御手段
15 アクセス監視手段
16 送受信手段(送信手段)
20 個人情報管理サーバ
20a CPU
20b データベース
20c 表示部
21 クライアント情報収集手段
22 インストール手段
23 収集手段
24 管理コンソール
25 個人情報管理手段
26 表示制御手段
27 送受信手段
30 ネットワーク(LAN)
1 personal
10a CPU (arithmetic processing unit)
12 CPU usage rate monitoring means 13 Input / output monitoring means 14 Startup control means 15 Access monitoring means 16 Transmission / reception means (transmission means)
20 Personal
Claims (18)
該複数のクライアントとネットワークを介して相互に通信可能に接続され、該複数のクライアントにおける個人情報ファイルを管理する個人情報管理サーバとをそなえ、
該個人情報管理サーバが、
該ネットワークを介して、各クライアントに、個人情報の自己検索を実行させる個人情報検索プログラムをインストールするインストール手段と、
該ネットワークを介して、各クライアントで実行された自己検索の結果を受信し、データベースに格納する収集手段とをそなえて構成されるとともに、
該複数のクライアントのそれぞれが、
該個人情報管理サーバからインストールされた前記個人情報検索プログラムを実行することにより、各クライアントの記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索手段と、
該ネットワークを介して該個人情報検索手段による自己検索の結果を該個人情報管理サーバへ送信する送信手段とをそなえて構成され、
該個人情報検索手段が、各クライアントの該記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索機能を各クライアントに実現させるものであって、
前記データに含まれるデータ集合体毎に、当該データ集合体に含まれる文字もしくは文字列と個人情報において特徴的に出現する文字もしくは文字列として、氏名,生年月日,住所,居所,電話番号,電子メールアドレス,役職,個人識別情報のうちの少なくとも一つに係るものとを照合して、前記特徴文字もしくは前記特徴文字列が当該データ集合体において出現する回数を計数し、
該計数結果に基づいて、前記特徴文字もしくは前記特徴文字列の出現率が高いほど大きくなる判定値を算出し、
前記判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定するように、各クライアントを動作させることを特徴とする、個人情報管理システム。 Multiple clients,
A personal information management server that is communicably connected to the plurality of clients via a network and manages personal information files in the plurality of clients;
The personal information management server
Installation means for installing a personal information search program for causing each client to perform a self-search of personal information via the network;
The network is configured to include a collection unit that receives the result of the self-search performed by each client via the network and stores the result in a database.
Each of the plurality of clients
A personal information search means for specifying and searching a personal information file from data in the storage unit of each client by executing the personal information search program installed from the personal information management server;
A transmission unit configured to transmit a result of self-search by the personal information search unit to the personal information management server via the network;
The personal information search means causes each client to implement a personal information search function for specifying and searching for a personal information file from data in the storage unit of each client,
For each data aggregate included in the data, characters, character strings included in the data aggregate, and characters or character strings that appear characteristically in personal information, such as name, date of birth, address, residence, telephone number, e-mail address, title, by matching to that according to at least one of the personal identification information, counts the number of times the feature character or the feature character string appears in the data collection,
Based on the counting result, a determination value that increases as the appearance rate of the characteristic character or the characteristic character string increases,
A personal information management system , wherein each client is operated to determine that the data aggregate is a personal information file when the determination value exceeds a predetermined threshold .
該複数のクライアントとネットワークを介して相互に通信可能に接続され、該複数のクライアントにおける個人情報ファイルを管理する個人情報管理サーバとをそなえ、 A personal information management server that is communicably connected to the plurality of clients via a network and manages personal information files in the plurality of clients;
該個人情報管理サーバが、 The personal information management server
該ネットワークを介して、各クライアントに、個人情報の自己検索を実行させる個人情報検索プログラムをインストールするインストール手段と、 Installation means for installing a personal information search program for causing each client to perform a self-search of personal information via the network;
該ネットワークを介して、各クライアントで実行された自己検索の結果を受信し、データベースに格納する収集手段とをそなえて構成されるとともに、 The network is configured to include a collection unit that receives the result of the self-search performed by each client via the network and stores the result in a database.
該複数のクライアントのそれぞれが、 Each of the plurality of clients
該個人情報管理サーバからインストールされた前記個人情報検索プログラムを実行することにより、各クライアントの記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索手段と、 A personal information search means for specifying and searching a personal information file from data in the storage unit of each client by executing the personal information search program installed from the personal information management server;
該ネットワークを介して該個人情報検索手段による自己検索の結果を該個人情報管理サーバへ送信する送信手段とをそなえて構成され、 A transmission unit configured to transmit a result of self-search by the personal information search unit to the personal information management server via the network;
該個人情報検索手段が、各クライアントの該記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索機能を各クライアントに実現させるものであって、 The personal information search means causes each client to implement a personal information search function for specifying and searching for a personal information file from data in the storage unit of each client,
前記データに含まれるデータ集合体毎に、当該データ集合体に含まれる文字もしくは文字列と個人情報において特徴的に出現する文字もしくは文字列として、氏名,生年月日,住所,居所,電話番号,電子メールアドレス,役職,個人識別情報のうちの少なくとも一つに係るものとを照合して、前記特徴文字もしくは前記特徴文字列が当該データ集合体において出現する回数を計数し、 For each data aggregate included in the data, characters, character strings included in the data aggregate, and characters or character strings that appear characteristically in personal information, such as name, date of birth, address, residence, telephone number, Collating with at least one of e-mail address, job title, and personal identification information, and counting the number of times the feature character or the feature character string appears in the data aggregate,
前記特徴文字毎もしくは前記特徴文字列毎に得られた前記計数結果に基づいて当該データ集合体における前記特徴文字もしくは前記特徴文字列の出現パターンを求め、求められた出現パターンと前記特徴文字もしくは前記特徴文字列の出現パターンとして予め設定された特徴出現パターンとの一致の度合いを示す一致度を判定値として算出し、Based on the count result obtained for each feature character or each feature character string, an appearance pattern of the feature character or the feature character string in the data aggregate is obtained, and the obtained appearance pattern and the feature character or the A degree of coincidence indicating a degree of coincidence with a feature appearance pattern set in advance as a feature character string appearance pattern is calculated as a determination value,
前記一致度が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定するように、各クライアントを動作させることを特徴とする、個人情報管理システム。 A personal information management system, wherein each client is operated to determine that the data aggregate is a personal information file when the degree of coincidence exceeds a predetermined threshold.
各クライアントでの処理を実行する演算処理部の使用率を監視する使用率監視手段と、
該使用率監視手段によって監視されている前記使用率が所定閾値以下である場合に該個人情報検索手段を起動させる一方、前記使用率が所定閾値を超えている場合に該個人情報検索手段の動作を停止させる起動制御手段とをさらにそなえて構成されていることを特徴とする、請求項1または請求項2に記載の個人情報管理システム。 Each of the plurality of clients
Usage rate monitoring means for monitoring the usage rate of the arithmetic processing unit that executes processing in each client;
When the usage rate monitored by the usage rate monitoring unit is less than or equal to a predetermined threshold, the personal information search unit is activated, and when the usage rate exceeds the predetermined threshold, the operation of the personal information search unit The personal information management system according to claim 1 or 2, further comprising activation control means for stopping the operation.
各クライアントの該記憶部におけるデータの入出力動作を監視する入出力監視手段と、
該入出力監視手段によって前記入出力動作の発生を検知した時点で該個人情報検索手段を起動させる起動制御手段とをさらにそなえて構成されていることを特徴とする、請求項1〜請求項3のいずれか1項に記載の個人情報管理システム。 Each of the plurality of clients
Input / output monitoring means for monitoring data input / output operations in the storage unit of each client;
Characterized in that it further includes a configuration and activation control means for activating the said individual information retrieval means upon detection of a generation of the input and output operations by said input power monitoring means, claims 1 to 3 The personal information management system according to any one of the above.
該複数のクライアントのそれぞれが、該個人情報検索手段で個人情報ファイルとして検索されたデータ集合体を監視し、当該データ集合体に対するアクセスが生じた場合にはその旨を該送信手段によって該個人情報管理サーバに送信させるアクセス監視手段をさらにそなえて構成されていることを特徴とする、請求項6記載の個人情報管理システム。 The personal information management means manages the data aggregate searched as a personal information file by the personal information search means,
Each of the plurality of clients monitors the data aggregate retrieved as the personal information file by the personal information retrieval means, and when access to the data aggregate occurs, the transmission means informs that fact. 7. The personal information management system according to claim 6 , further comprising access monitoring means for transmitting to the management server.
該ネットワークを介して、各クライアントに、個人情報の自己検索を実行させる個人情報検索プログラムをインストールするインストール手段と、
該ネットワークを介して、各クライアントで実行された自己検索の結果を受信し、データベースに格納する収集手段とをそなえて構成され、
該個人情報検索手段が、各クライアントの該記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索機能を各クライアントに実現させるものであって、
前記データに含まれるデータ集合体毎に、当該データ集合体に含まれる文字もしくは文字列と個人情報において特徴的に出現する文字もしくは文字列として、氏名,生年月日,住所,居所,電話番号,電子メールアドレス,役職,個人識別情報のうちの少なくとも一つに係るものとを照合して、前記特徴文字もしくは前記特徴文字列が当該データ集合体において出現する回数を計数し、
該計数結果に基づいて、前記特徴文字もしくは前記特徴文字列の出現率が高いほど大きくなる判定値を算出し、
前記判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定するように、該クライアントに実行させるものであることを特徴とする、個人情報管理サーバ。 A personal information management server connected to a plurality of clients via a network so as to be able to communicate with each other and managing personal information files in the plurality of clients,
Installation means for installing a personal information search program for causing each client to perform a self-search of personal information via the network;
It comprises a collection means for receiving the result of the self-search performed by each client via the network and storing it in a database,
The personal information search means causes each client to implement a personal information search function for specifying and searching for a personal information file from data in the storage unit of each client,
For each data aggregate included in the data, characters, character strings included in the data aggregate, and characters or character strings that appear characteristically in personal information, such as name, date of birth, address, residence, telephone number, e-mail address, title, by matching to that according to at least one of the personal identification information, counts the number of times the feature character or the feature character string appears in the data collection,
Based on the counting result, a determination value that increases as the appearance rate of the characteristic character or the characteristic character string increases,
A personal information management server, which causes the client to execute so that the data aggregate is determined to be a personal information file when the determination value exceeds a predetermined threshold .
各クライアントに、個人情報の自己検索を実行させる個人情報検索プログラムを含むとともに、
該ネットワークを介して、各クライアントに、前記個人情報検索プログラムをインストールするインストール手段、および、
該ネットワークを介して、各クライアントで実行された自己検索の結果を受信し、データベースに格納する収集手段として、該コンピュータを機能させ、
該インストール手段によって各クライアントにインストールされる前記個人情報検索プログラムが、
各クライアントの該記憶部におけるデータの中から個人情報ファイルを特定して検索する個人情報検索機能を各クライアントに実現させるものであって、
前記データに含まれるデータ集合体毎に、当該データ集合体に含まれる文字もしくは文字列と個人情報において特徴的に出現する文字もしくは文字列として、氏名,生年月日,住所,居所,電話番号,電子メールアドレス,役職,個人識別情報のうちの少なくとも一つに係るものとを照合し、前記特徴文字もしくは前記特徴文字列が当該データ集合体において出現する回数を計数する計数ステップと、
該計数ステップにおいて、前記特徴文字もしくは前記特徴文字列の出現率が高いほど大きくなる判定値を算出し、
前記判定値が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定する判定ステップとを、該クライアントに実行させるものであることを特徴とする、個人情報管理サーバ用プログラム。 A program that causes a computer to function as a personal information management server that manages personal information files in a plurality of clients connected to each other via a network,
Includes a personal information search program that allows each client to perform a personal search for personal information,
Installation means for installing the personal information search program on each client via the network; and
Via the network, the result of self-search performed by each client is received, and the computer is functioned as a collecting means for storing in a database,
The personal information retrieval program installed in each client by the installation means is:
Each client realizes a personal information search function for specifying and searching a personal information file from data in the storage unit of each client,
For each data aggregate included in the data, characters, character strings included in the data aggregate, and characters or character strings that appear characteristically in personal information, such as name, date of birth, address, residence, telephone number, A counting step of collating with at least one of an e-mail address, a title, and personal identification information, and counting the number of times the characteristic character or the characteristic character string appears in the data aggregate;
In the counting step, a determination value that increases as the appearance rate of the characteristic character or the characteristic character string increases,
A program for a personal information management server, which causes the client to execute a determination step of determining that the data aggregate is a personal information file when the determination value exceeds a predetermined threshold value .
該算出ステップにおいて、前記特徴文字毎もしくは前記特徴文字列毎に得られた前記計数結果に基づいて当該データ集合体における前記特徴文字もしくは前記特徴文字列の出現パターンを求め、求められた出現パターンと前記特徴文字もしくは前記特徴文字列の出現パターンとして予め設定された特徴出現パターンとの一致の度合いを示す一致度を前記判定値として算出し、
該判定ステップにおいて、前記一致度が所定閾値を超えた場合に当該データ集合体が個人情報ファイルであると判定するように、各クライアントを動作させることを特徴とする、請求項12記載の個人情報管理サーバ用プログラム。 The personal information retrieval program is
In the calculating step, an appearance pattern of the feature character or the feature character string in the data set is obtained based on the count result obtained for each feature character or each feature character string, and the obtained appearance pattern A degree of coincidence indicating a degree of coincidence with a feature appearance pattern preset as an appearance pattern of the feature character or the feature character string is calculated as the determination value;
In the determination step, as the data collection when the degree of coincidence exceeds a predetermined threshold value is determined to be a personal information file, and wherein the operating the respective client, No placement claim 1 2 Symbol Program for personal information management server.
各クライアントでの処理を実行する演算処理部の使用率を監視する使用率監視手段、および、
該使用率監視手段によって監視されている前記使用率が所定閾値以下である場合に該個人情報検索手段を起動させる一方、前記使用率が所定閾値を超えている場合に該個人情報検索手段の動作を停止させる起動制御手段として、各クライアントを機能させることを特徴とする、請求項12〜請求項14のいずれか1項に記載の個人情報管理サーバ用プログラム。 The personal information retrieval program is
Usage rate monitoring means for monitoring the usage rate of the arithmetic processing unit that executes processing in each client, and
When the usage rate monitored by the usage rate monitoring unit is less than or equal to a predetermined threshold, the personal information search unit is activated, and when the usage rate exceeds the predetermined threshold, the operation of the personal information search unit The personal information management server program according to any one of claims 12 to 14 , wherein each client is caused to function as an activation control means for stopping the personal information.
各クライアントの該記憶部におけるデータの入出力動作を監視する入出力監視手段、および、
該入出力監視手段によって前記入出力動作の発生を検知した時点で該個人情報検索手段を起動させる起動制御手段として、各クライアントを機能させることを特徴とする、請求項12〜請求項14のいずれか1項に記載の個人情報管理サーバ用プログラム。 The personal information retrieval program is
Input / output monitoring means for monitoring data input / output operations in the storage unit of each client; and
As the start control means by said input power monitoring means activates the said individual information retrieval means upon detection of a generation of the input and output operations, characterized in that to function each client, any claim 12 to claim 14 or personal information management server for the program described in (1).
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004260205A JP3743783B1 (en) | 2004-09-07 | 2004-09-07 | Personal information management system, personal information management server, and personal information management server program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004260205A JP3743783B1 (en) | 2004-09-07 | 2004-09-07 | Personal information management system, personal information management server, and personal information management server program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005113331A Division JP3799383B2 (en) | 2005-04-11 | 2005-04-11 | Customer information management system and information processing apparatus with customer information management function |
Publications (2)
Publication Number | Publication Date |
---|---|
JP3743783B1 true JP3743783B1 (en) | 2006-02-08 |
JP2006079216A JP2006079216A (en) | 2006-03-23 |
Family
ID=35906988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004260205A Expired - Fee Related JP3743783B1 (en) | 2004-09-07 | 2004-09-07 | Personal information management system, personal information management server, and personal information management server program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3743783B1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4731443B2 (en) * | 2006-10-13 | 2011-07-27 | 中国電力株式会社 | Information management system and information management method |
JP5046634B2 (en) * | 2006-12-15 | 2012-10-10 | 中国電力株式会社 | Information retrieval system |
JP2017162138A (en) | 2016-03-09 | 2017-09-14 | 富士ゼロックス株式会社 | Information processing device and information processing program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3170095B2 (en) * | 1993-04-14 | 2001-05-28 | 富士通株式会社 | Information retrieval system |
JPH10171879A (en) * | 1996-12-06 | 1998-06-26 | Purosupaa Kurieiteibu:Kk | Merchandise sales system, and information communication method and storage medium for the same system |
JP2001357047A (en) * | 2000-06-13 | 2001-12-26 | Nec Corp | Method for providing personal information using personal data warehouse |
JP2003132159A (en) * | 2001-10-23 | 2003-05-09 | Zenrin Co Ltd | Personal information management device |
-
2004
- 2004-09-07 JP JP2004260205A patent/JP3743783B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006079216A (en) | 2006-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3814655B1 (en) | File management system, information processing apparatus, and file management program | |
JP3918023B2 (en) | Personal information management system | |
JP3705439B1 (en) | Personal information search program, personal information management system, and information processing apparatus with personal information management function | |
JP3840529B1 (en) | Personal information management system, personal information management server, and program for personal information management server | |
JP3762935B1 (en) | Information processing apparatus, file management system, and file management program | |
JP3840647B1 (en) | Personal information management system, personal information management server, and program for personal information management server | |
JP4168188B2 (en) | Management system, management server and management program | |
JP4082520B2 (en) | Personal information search program | |
JP3928006B2 (en) | Customer information management system | |
JP3743783B1 (en) | Personal information management system, personal information management server, and personal information management server program | |
JP4700322B2 (en) | Simple medium use management system, simple medium use management method, simple medium use management program, and simple medium use program | |
JP3799383B2 (en) | Customer information management system and information processing apparatus with customer information management function | |
JP3890367B1 (en) | Management system and management program | |
JP3994126B1 (en) | Information management system, information management server, and program for information management server | |
JP4236008B2 (en) | Information management system, information management server, and program for information management server | |
JP2009080823A (en) | Information management system, information management server, and program therefor | |
JP4175576B1 (en) | Information management system, information management server, and information management server program | |
JP2008186473A (en) | System and program for managing personal information | |
JP4139919B2 (en) | Personal information search program | |
JP4058490B1 (en) | Information management system, information management server, and program for information management server | |
JP4370536B2 (en) | Management system and management program | |
JP2010003304A (en) | Information management system, information management server, and program therefor | |
JP5005805B2 (en) | Simple medium use management system, computer, simple medium use management program, and simple medium use program | |
JP4175575B2 (en) | Personal information search program | |
JP4206466B2 (en) | Personal information search program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051020 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091202 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091202 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091202 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101202 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101202 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111202 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |