JP4284328B2 - Personal information inspection program, personal information inspection method, and personal information inspection system - Google Patents

Personal information inspection program, personal information inspection method, and personal information inspection system Download PDF

Info

Publication number
JP4284328B2
JP4284328B2 JP2006061929A JP2006061929A JP4284328B2 JP 4284328 B2 JP4284328 B2 JP 4284328B2 JP 2006061929 A JP2006061929 A JP 2006061929A JP 2006061929 A JP2006061929 A JP 2006061929A JP 4284328 B2 JP4284328 B2 JP 4284328B2
Authority
JP
Japan
Prior art keywords
character
personal information
personal
characters
inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006061929A
Other languages
Japanese (ja)
Other versions
JP2007241580A (en
Inventor
修 青木
裕晃 河野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intelligent Wave Inc
Original Assignee
Intelligent Wave Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intelligent Wave Inc filed Critical Intelligent Wave Inc
Priority to JP2006061929A priority Critical patent/JP4284328B2/en
Publication of JP2007241580A publication Critical patent/JP2007241580A/en
Application granted granted Critical
Publication of JP4284328B2 publication Critical patent/JP4284328B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、プリントアウト、外部メディアへの書き出し、メール送信等の対象となるファイルに個人情報が含まれているかを検査するための個人情報検査プログラム、個人情報検査方法及び個人情報検査システムに関するものである。   The present invention relates to a personal information inspection program, a personal information inspection method, and a personal information inspection system for inspecting whether or not personal information is contained in a file to be printed, written to an external medium, or sent by e-mail. It is.

企業等が保有する個人情報の漏洩事件が相次いでいることや、個人情報保護法の施行もあって、顧客情報等の個人情報の保護が企業等にとって近年特に重要な課題となっている。個人情報の漏洩は、記憶媒体等の持ち出しや、ネットワークへの不正アクセス等による電子データの流出や、電子データをプリントアウトした書類の流出によって発生することが多いため、企業等の組織内で使用するコンピュータからの情報漏洩対策が検討されるようになっている。   In recent years, the protection of personal information such as customer information has become a particularly important issue for corporations due to the continual disclosure of personal information held by corporations and the enforcement of the Personal Information Protection Law. Leakage of personal information is often caused by outflow of electronic data due to storage media, unauthorized access to the network, etc., or outflow of documents printed out of electronic data. Countermeasures against information leakage from computers are being considered.

コンピュータに記憶された個人情報の漏洩を防止するためには、個人情報が含まれる文書ファイルの書き出しやプリントアウト、個人情報が含まれる電子メールの送信等を監視して、適切な対処を行うことが好ましい。そのためには、対象となるファイルに個人情報が含まれるか否かを効率的に検査する技術が必要になる。   To prevent the leakage of personal information stored in the computer, take appropriate measures by monitoring the writing and printing out of document files containing personal information, sending e-mails containing personal information, etc. Is preferred. For this purpose, a technique for efficiently inspecting whether or not personal information is included in the target file is required.

このような課題に対処するために、コンピュータに記憶されているファイルのうち、個人情報要素を効率的に計数し、計数結果に基づいて個人情報が含まれるファイルを探索する発明が開示されている(特許文献1参照。)。   In order to deal with such a problem, an invention is disclosed in which personal information elements are efficiently counted among files stored in a computer, and a file including personal information is searched based on the counting result. (See Patent Document 1).

特許第3705439号公報Japanese Patent No. 3705439

対象となるファイルに個人情報が含まれるか否かの検査においては、特許文献1にも開示されているように、電話番号、電子メールアドレス、住所、氏名が所定の条件を満たす程度に含まれているか否かから、個人情報を含むファイルであることを判定することが可能である。この場合、電話番号、電子メールアドレス、住所については、文字列の形式に一定のパターンがあるため、これらの要素を識別することが比較的容易である。一方、個人(日本人)の氏名については、比較的文字数の少ない漢字やカナにより構成されるため、氏名以外の情報とどのように識別するかが問題になる。   In the inspection of whether or not personal information is included in the target file, as disclosed in Patent Document 1, the telephone number, e-mail address, address, and name are included to the extent that the predetermined condition is satisfied. It is possible to determine whether the file includes personal information. In this case, regarding the telephone number, the e-mail address, and the address, since there is a certain pattern in the character string format, it is relatively easy to identify these elements. On the other hand, the name of an individual (Japanese) is composed of kanji and kana with a relatively small number of characters, so how to distinguish it from information other than the name becomes a problem.

氏名である文字列を識別する方法として、日本人の一般的な氏名に用いられる文字列を氏名リストとして登録しておき、ファイルに含まれる文字列を氏名リストと対比する方法が考えられる。しかしながら、この方法によって精度の高い処理を行うためには、氏名リストの数をなるべく多くすることが必要であるが、氏名リストの数が多くなるほど照合処理の負担が重くなるという問題が生じる(特許文献1、5ページ1行目〜11行目参照。)。   As a method of identifying a character string that is a name, a method of registering a character string used for a general Japanese name as a name list and comparing the character string included in the file with the name list is conceivable. However, in order to perform highly accurate processing by this method, it is necessary to increase the number of name lists as much as possible. However, as the number of name lists increases, there is a problem that the burden of collation processing increases. (Refer to Reference 1, page 5, lines 1 to 11.)

特許文献1記載の発明では、かかる問題に対応して、例えば「東京」「学校」「社長」といった、一般的な氏名においては出現し得ない文字列を不適切文字列として登録しておき、ファイルに含まれる文字列を不適切文字列と照合し、不適切文字列に該当しない文字列を氏名と判定することとしている。このような方法によって、氏名リストを登録して照合する場合に比べて、効率的な処理が可能になることとされている。   In the invention described in Patent Document 1, in response to such a problem, for example, a character string that cannot appear in a general name such as “Tokyo”, “school”, and “president” is registered as an inappropriate character string, A character string included in the file is collated with an inappropriate character string, and a character string not corresponding to the inappropriate character string is determined as a name. By such a method, it is supposed that more efficient processing is possible compared with the case where a name list is registered and collated.

しかしながら、特許文献1記載の不適切文字列を用いる方法においても、不適切文字列の登録が予め必要であることに相違はない。漢字で数文字の文字列であっても、氏名に該当し得ない文字列の数は膨大に存在することものと考えら得るが、精緻な判定を行うためには、なるべく多くの不適切文字列を登録しなければならないことにも相違はなく、精度を上げようとすると、結局のところ氏名リスト方式と同様に照合処理の負担が重くなることが予想される。   However, even in the method using an inappropriate character string described in Patent Document 1, there is no difference that registration of an inappropriate character string is necessary in advance. Even if it is a character string of several characters in Kanji, it can be considered that there are a huge number of character strings that cannot be matched with full names, but in order to make precise judgments, as many inappropriate characters as possible There is no difference in the need to register the columns, and if it is attempted to increase the accuracy, it is expected that the burden of collation processing will become heavy as in the case of the name list method.

本発明は、このような課題に対応するためになされたものであり、企業等の組織内から個人情報が漏洩することを防止するために、プリントアウト、外部メディアへの書き出し、メール送信等の対象となるファイルに個人情報が含まれているかを検査するための個人情報検査プログラム、個人情報検査方法及び個人情報検査システムであって、特にファイルに含まれる個人名(氏のみ、又は氏と名の組み合わせを含む)を効率的に識別することが可能な個人情報検査プログラム、個人情報検査方法及び個人情報検査システム提供することを目的とするものである。   The present invention has been made in order to cope with such problems, and in order to prevent leakage of personal information from within an organization such as a company, printout, writing to external media, mail transmission, etc. A personal information inspection program, a personal information inspection method, and a personal information inspection system for inspecting whether or not personal information is included in a target file, and in particular, an individual name included in the file (Mr. It is an object of the present invention to provide a personal information inspection program, a personal information inspection method, and a personal information inspection system.

このような課題を解決するために、本発明は、検査対象となるファイルに、個人名を含む所定の個人情報が含まれるかを検査するための個人情報検査プログラムであって、漢字1文字について個人名と判定する漢字を記憶する第1の記憶部と、2文字以上n文字(nは2以上の自然数)以下の文字列において2文字目にある場合に個人名と判定する漢字を記憶する第2の記憶部と、を備えるコンピュータに、前記ファイルに含まれる所定のセパレータで区切られた文字又は文字列を識別する識別ステップと、前記識別ステップで識別した文字又は文字列のうち、1文字以上n文字以下の文字又は文字列を選択する選択ステップと、前記選択ステップにおいて選択した文字又は文字列が1文字の場合、第1の記憶部に記憶された文字と対比して、一致する漢字がある場合には個人名と判定する第1の判定ステップと、前記選択ステップにおいて選択した文字又は文字列が2文字以上n文字以下の場合、前記文字列の2文字目の漢字を第2の記憶部に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第2の判定ステップと、前記第1の判定ステップ及び前記第2の判定ステップにおいて個人名と判定された件数をカウントする個人名カウントステップと、前記個人名カウントステップでカウントした個人名の件数を含む前記ファイルに含まれる個人情報の件数が、所定の条件に合致するかを検査する検査ステップと、を実行させることを特徴とする。   In order to solve such a problem, the present invention is a personal information inspection program for inspecting whether a file to be inspected includes predetermined personal information including a personal name, wherein A first storage unit for storing a kanji character to be determined as a personal name and a kanji character to be determined as a personal name when there is a second character in a character string of 2 to n characters (n is a natural number of 2 or more) An identification step of identifying a character or character string delimited by a predetermined separator included in the file, and one character out of the character or character string identified in the identification step The selection step of selecting a character or character string of n characters or less, and when the character or character string selected in the selection step is one character, in contrast to the character stored in the first storage unit If there is a matching kanji character, a first determination step for determining as a personal name, and if the character or character string selected in the selection step is not less than 2 characters and not more than n characters, the second character of the character string is In contrast to the kanji stored in the second storage unit, if there is a matching kanji, a second determination step for determining an individual name, an individual in the first determination step, and the second determination step A personal name counting step for counting the number of cases determined to be a name, and checking whether the number of personal information included in the file including the number of personal names counted in the personal name counting step meets a predetermined condition And an inspection step.

本発明においては、対象となるファイルに個人情報が含まれるかの検査において、個人情報としてカウントすべき個人名(氏のみ又は氏名)を識別するために、1文字については当該文字と1文字からなる氏として用いられやすい漢字とを、2文字以上の文字列については2文字目に着目して、2文字目の文字と2文字以上からなる氏において2文字目に用いられやすい漢字とを照合することによって、効率的な処理を可能にしている。   In the present invention, in the inspection of whether or not personal information is included in a target file, in order to identify a personal name (only a name or a name) to be counted as personal information, for each character, the character and one character are used. Compare Kanji that is easy to use as Mr. Naru, and focus on the second character for strings of two or more characters, and collate the second character with Kanji that is easy to use for the second character in Mr. By doing so, efficient processing is enabled.

また、本発明は、前記コンピュータは、メールアドレスと判定する文字又は文字列を記憶する第3の記憶部と、住所と判定する文字又は文字列を記憶する第4の記憶部と、電話番号と判定する文字又は文字列を記憶する第5の記憶部と、を備えていて、前記コンピュータに、前記識別ステップで識別した文字又は文字列を、前記第3の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合にはメールアドレスと判定する第3の判定ステップと、前記識別ステップで識別した文字又は文字列を、前記第4の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合には住所と判定する第4の判定ステップと、前記識別ステップで識別した文字又は文字列を、前記第5の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合には電話番号と判定する第5の判定ステップと、前記第3の判定ステップにおいてメールアドレスと判定された件数をカウントするメールアドレスカウントステップと、前記第4の判定ステップにおいて住所と判定された件数をカウントする住所カウントステップと、前記第5の判定ステップにおいて電話番号と判定された件数をカウントする電話番号カウントステップと、を実行させ、前記検査ステップにおいては、前記個人名カウントステップでカウントした個人名の件数、前記メールアドレスカウントステップでカウントしたメールアドレスの件数、前記住所カウントステップでカウントした住所の件数、前記電話番号カウントステップでカウントした電話番号の件数から個人情報の件数をカウントし、所定の条件に合致するかを検査することを特徴としてもよい。   Further, according to the present invention, the computer stores a third storage unit that stores characters or character strings to be determined as mail addresses, a fourth storage unit that stores characters or character strings to be determined as addresses, a telephone number, A fifth storage unit that stores a character or character string to be determined, and the character or character string identified in the identification step is stored in the third storage unit in the computer. In contrast to the column, if there is a matching character or character string, a third determination step for determining an email address and the character or character string identified in the identification step are stored in the fourth storage unit. If there is a matching character or character string, the fourth determination step for determining an address when there is a matching character or character string, and the character or character string identified in the identification step are the fifth storage unit Remembered A fifth determination step for determining a telephone number when there is a matching character or character string as compared with a character or a character string, and a mail for counting the number of cases determined as a mail address in the third determination step An address counting step, an address counting step for counting the number of cases determined as an address in the fourth determination step, and a telephone number counting step for counting the number of cases determined as a telephone number in the fifth determination step. In the inspection step, the number of personal names counted in the personal name counting step, the number of email addresses counted in the email address counting step, the number of addresses counted in the address counting step, the telephone number count Number of phone numbers counted in the step Counting the number of Luo personal information may also be characterized by examining whether satisfies a predetermined condition.

対象となるファイルに含まれる個人情報は、個人名に限られず、メールアドレス、住所、電話番号も該当し得るものであるので、これらを個人情報として検査の対象に加えるよう構成することによって、精度の高い検査が可能になる。   The personal information included in the target file is not limited to the personal name, but can also be an email address, address, and telephone number. High inspection is possible.

さらに、本発明は、前記コンピュータに、前記ファイルのデータサイズを特定し、前記データサイズが予め設定されたサイズを超過するかを判定するデータサイズ判定ステップを実行させ、前記コンピュータは、前記データサイズ判定ステップにおいて前記データサイズが予め設定されたサイズを超過すると判定された場合には、前記予め設定されたサイズを上限に検査を実行するか、又は個人情報の検査を実行しないことを特徴としてもよい。   Further, the present invention causes the computer to specify a data size of the file, and to execute a data size determination step of determining whether the data size exceeds a preset size. When it is determined in the determination step that the data size exceeds a preset size, the inspection is performed with the preset size as an upper limit, or the personal information inspection is not performed. Good.

本発明によって、プリントアウトや外部メディアへの書き出し等が行われる全てのファイルを検査対象とすると、データサイズの大きいファイルについては処理に長時間を要することとなり、コンピュータにかかる負担が過大となる可能性がある。このように構成すると、コンピュータのユーザが処理負担と情報保全の必要性のバランスを考慮したデータサイズを設定することによって、効率的な検査が可能になる。   According to the present invention, if all files to be printed out or written to an external medium are subject to inspection, a file with a large data size will take a long time to process, and the burden on the computer may be excessive. There is sex. With this configuration, the computer user sets the data size in consideration of the balance between the processing burden and the necessity of information maintenance, thereby enabling efficient inspection.

さらに、本発明は、前記コンピュータは、ファイルのデータサイズに対応して先頭から読み飛ばすデータサイズを記憶する第6の記憶部を備えていて、前記コンピュータに、前記ファイルのデータサイズを特定し、前記第6の記憶部を参照して前記ファイルについて先頭から読み飛ばすデータサイズを特定する特定ステップを実行させ、前記コンピュータは、前記ファイルのうち、前記特定ステップにおいて特定されたデータサイズを読み飛ばした残りのデータを対象に、個人情報の検査を実行することを特徴としてもよい。   Further, according to the present invention, the computer includes a sixth storage unit that stores a data size to be skipped from the top corresponding to the data size of the file, and specifies the data size of the file in the computer, The computer is caused to execute a specifying step for specifying a data size to be skipped from the beginning of the file with reference to the sixth storage unit, and the computer skips the data size specified in the specifying step among the files. It may be characterized in that an examination of personal information is performed on the remaining data.

コンピュータへの処理負担を軽減する方法として、このようにファイルサイズに応じた読み飛ばし部分を設定するように構成すると、ヘッダー情報等が記述されて比較的個人情報が含まれる可能性が低い先頭部分から所定のサイズを読み飛ばすことによって、検査の精度を著しく損なうことなく、検査にかかる処理負担を軽減することが可能になる。   As a way to reduce the processing burden on the computer, if you configure the skip part according to the file size in this way, the head part where header information etc. is described and the possibility of relatively containing personal information is relatively low By skipping the predetermined size, the processing load on the inspection can be reduced without significantly impairing the inspection accuracy.

さらに、本発明は、本発明にかかる個人情報検査プログラムにより実行される個人情報検査方法として特定することもできる。   Furthermore, the present invention can be specified as a personal information inspection method executed by the personal information inspection program according to the present invention.

つまり、本発明にかかる個人情報検査方法は、検査対象となるファイルに、個人名を含む所定の個人情報が含まれるかを検査するための個人情報検査方法であって、漢字1文字について個人名と判定する漢字を記憶する第1の記憶部と、2文字以上n文字(nは2以上の自然数)以下の文字列において2文字目にある場合に個人名と判定する漢字を記憶する第2の記憶部と、を備えるコンピュータが、前記ファイルに含まれる所定のセパレータで区切られた文字又は文字列を識別する識別ステップと、前記コンピュータが、前記識別ステップで識別した文字又は文字列のうち、1文字以上n文字以下の文字又は文字列を選択する選択ステップと、前記コンピュータが、前記選択ステップにおいて選択した文字又は文字列が1文字の場合、第1の記憶部に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第1の判定ステップと、前記コンピュータが、前記選択ステップにおいて選択した文字又は文字列が2文字以上n文字以下の場合、前記文字列の2文字目の文字を第2の記憶部に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第2の判定ステップと、前記コンピュータが、前記第1の判定ステップ及び前記第2の判定ステップにおいて個人名と判定された件数をカウントする個人名カウントステップと、前記コンピュータが、前記個人名カウントステップでカウントした個人名の件数を含む前記ファイルに含まれる個人情報の件数が、所定の条件に合致するかを検査する検査ステップと、を有することを特徴とする。   That is, the personal information inspection method according to the present invention is a personal information inspection method for inspecting whether or not a file to be inspected includes predetermined personal information including a personal name. A first storage unit for storing a kanji character to be determined as a second character, and a second storage unit for storing a kanji character to be determined as an individual name when the second character is in a character string of 2 or more and n characters (n is a natural number of 2 or more) An identification step of identifying a character or a character string delimited by a predetermined separator included in the file, and among the characters or the character string identified by the computer in the identification step, A selection step of selecting a character or a character string of 1 character or more and n characters or less; and when the computer selects one character or character string in the selection step, the first A first determination step of determining a personal name when there is a matching Chinese character compared to the Chinese character stored in the storage unit, and the computer selects two or more characters or character strings in the selection step a second determination step of determining a personal name when there is a matching kanji character by comparing the second character of the character string with the kanji character stored in the second storage unit when there are n characters or less; The personal name counting step in which the computer counts the number of personal names determined in the first determination step and the second determination step, and the computer counts the personal names counted in the personal name counting step. And an inspection step for inspecting whether or not the number of personal information included in the file including the number of cases meets a predetermined condition.

また、本発明にかかる個人情報検査方法は、前記コンピュータは、メールアドレスと判定する文字又は文字列を記憶する第3の記憶部と、住所と判定する文字又は文字列を記憶する第4の記憶部と、電話番号と判定する文字又は文字列を記憶する第5の記憶部と、を備えていて、前記コンピュータが、前記識別ステップで識別した文字又は文字列を、前記第3の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合にはメールアドレスと判定する第3の判定ステップと、前記コンピュータが、前記識別ステップで識別した文字又は文字列を、前記第4の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合には住所と判定する第4の判定ステップと、前記コンピュータが、前記識別ステップで識別した文字又は文字列を、前記第5の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合には電話番号と判定する第5の判定ステップと、前記コンピュータが、前記第3の判定ステップにおいてメールアドレスと判定された件数をカウントするメールアドレスカウントステップと、前記コンピュータが、前記第4の判定ステップにおいて住所と判定された件数をカウントする住所カウントステップと、前記コンピュータが、前記第5の判定ステップにおいて電話番号と判定された件数をカウントする電話番号カウントステップと、を有していて、前記検査ステップにおいては、前記コンピュータが、前記個人名カウントステップでカウントした個人名の件数、前記メールアドレスカウントステップでカウントしたメールアドレスの件数、前記住所カウントステップでカウントした住所の件数、前記電話番号カウントステップでカウントした電話番号の件数から個人情報の件数をカウントし、所定の条件に合致するかを検査することを特徴とすることもできる。   In the personal information inspection method according to the present invention, the computer stores a third storage unit that stores characters or character strings that are determined as mail addresses, and a fourth storage that stores characters or character strings that are determined as addresses. And a fifth storage unit for storing a character or character string to be determined as a telephone number, and the computer identifies the character or character string identified in the identification step in the third storage unit. In contrast to the stored character or character string, if there is a matching character or character string, a third determination step of determining an email address, and the computer identifies the character or character string identified in the identification step A fourth determination step of determining an address when there is a matching character or character string compared to the character or character string stored in the fourth storage unit; and Fifth determination step of determining the character or character string identified in the step as a telephone number when there is a matching character or character string compared with the character or character string stored in the fifth storage unit A mail address counting step in which the computer counts the number of mail addresses determined in the third determination step; and an address in which the computer counts the number of addresses determined in the fourth determination step. A counting step and a telephone number counting step in which the computer counts the number of telephone numbers determined in the fifth determination step. In the inspection step, the computer The number of personal names counted in the counting step, the email address counting step The number of personal information is counted from the number of e-mail addresses counted in the group, the number of addresses counted in the address counting step, and the number of telephone numbers counted in the telephone number counting step. It can also be characterized.

さらに、本発明にかかる個人情報検査方法は、前記コンピュータが、前記ファイルのデータサイズを特定し、前記データサイズが予め設定されたサイズを超過するかを判定するデータサイズ判定ステップを有していて、前記データサイズ判定ステップにおいて前記データサイズが予め設定されたサイズを超過すると判定された場合には、前記コンピュータは、個人情報の検査を実行しないことを特徴としてもよい。   The personal information inspection method according to the present invention further includes a data size determination step in which the computer specifies a data size of the file and determines whether the data size exceeds a preset size. When the data size determination step determines that the data size exceeds a preset size, the computer may not perform the personal information inspection.

さらに、本発明にかかる個人情報検査方法は、前記コンピュータは、ファイルのデータサイズに対応して先頭から読み飛ばすデータサイズを記憶する第6の記憶部を備えていて、前記コンピュータが、前記ファイルのデータサイズを特定し、前記第6の記憶部を参照して前記ファイルについて先頭から読み飛ばすデータサイズを特定する特定ステップを有していて、前記コンピュータは、前記ファイルのうち、前記特定ステップにおいて特定されたデータサイズを読み飛ばした残りのデータを対象に、個人情報の検査を実行することを特徴としてもよい。   Furthermore, in the personal information inspection method according to the present invention, the computer includes a sixth storage unit that stores a data size to be skipped from the top corresponding to the data size of the file. A specifying step of specifying a data size and specifying a data size to be skipped from the beginning of the file with reference to the sixth storage unit, wherein the computer specifies the file in the specifying step; The personal information may be inspected for the remaining data obtained by skipping the read data size.

さらに、本発明は、本発明にかかる個人情報検査プログラムを備えた個人情報検査システムとして特定することもできる。   Furthermore, this invention can also be specified as a personal information inspection system provided with the personal information inspection program concerning this invention.

つまり、本発明にかかる個人情報検査システムは、検査対象となるファイルに、個人名を含む所定の個人情報が含まれるかを検査するための個人情報検査システムであって、漢字1文字について個人名と判定する漢字を記憶する第1の記憶手段と、2文字以上n文字(nは2以上の自然数)以下の文字列において2文字目にある場合に個人名と判定する漢字を記憶する第2の記憶手段と、前記ファイルに含まれる所定のセパレータで区切られた文字又は文字列を識別する識別手段と、前記識別手段が識別した文字又は文字列のうち、1文字以上n文字以下の文字又は文字列を選択する選択手段と、前記選択手段が選択した文字又は文字列が1文字の場合、第1の記憶手段に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第1の判定手段と、前記選択手段において選択した文字又は文字列が2文字以上n文字以下の場合、前記文字列の2文字目の文字を第2の記憶手段に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第2の判定手段と、前記第1の判定手段及び前記第2の判定手段において個人名と判定された件数をカウントする個人名カウント手段と、前記個人名カウント手段がカウントした個人名の件数を含む前記ファイルに含まれる個人情報の件数が、所定の条件に合致するかを検査する検査手段と、を備えることを特徴とする。   That is, the personal information inspection system according to the present invention is a personal information inspection system for inspecting whether or not a file to be inspected includes predetermined personal information including a personal name. A first storage means for storing a kanji character to be determined as a second character, and a second storage for storing a kanji character that is determined as an individual name when it is the second character in a character string of 2 to n characters (n is a natural number of 2 or more) Storage means; identification means for identifying a character or character string delimited by a predetermined separator included in the file; and one or more characters of the character or character string identified by the identification means A selection means for selecting a character string, and if the character or character string selected by the selection means is a single character, the personal name if there is a matching Chinese character compared with the kanji stored in the first storage means And And when the character or character string selected by the selection means is 2 characters or more and n characters or less, the second character of the character string is compared with the kanji stored in the second storage means. When there is a matching kanji character, the second determination means for determining the personal name, and the personal name count for counting the number of cases determined as the personal name by the first determination means and the second determination means Means and inspection means for inspecting whether or not the number of personal information included in the file including the number of personal names counted by the personal name counting means meets a predetermined condition.

また、本発明にかかる個人情報検査システムは、メールアドレスと判定する文字又は文字列を記憶する第3の記憶手段と、住所と判定する文字又は文字列を記憶する第4の記憶部と、電話番号と判定する文字又は文字列を記憶する第5の記憶手段部と、前記識別手段が識別した文字又は文字列を、前記第3の記憶手段に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合にはメールアドレスと判定する第3の判定手段と、前記識別手段が識別した文字又は文字列を、前記第4の記憶手段に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合には住所と判定する第4の判定手段と、前記識別手段が識別した文字又は文字列を、前記第5の記憶手段に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合には電話番号と判定する第5の判定手段と、前記第3の判定手段においてメールアドレスと判定された件数をカウントするメールアドレスカウント手段と、前記第4の判定手段において住所と判定された件数をカウントする住所カウント手段と、前記第5の判定手段において電話番号と判定された件数をカウントする電話番号カウント手段と、を備えていて、前記検査手段は、前記個人名カウントステップでカウントした個人名の件数、前記メールアドレスカウントステップでカウントしたメールアドレスの件数、前記住所カウントステップでカウントした住所の件数、前記電話番号カウントステップでカウントした電話番号の件数から個人情報の件数をカウントし、所定の条件に合致するかを検査することを特徴とすることもできる。   The personal information inspection system according to the present invention includes a third storage unit that stores characters or character strings to be determined as mail addresses, a fourth storage unit that stores characters or character strings to be determined as addresses, and a telephone. The fifth storage means for storing the character or character string to be determined as a number, and the character or character string identified by the identification means are compared with the character or character string stored in the third storage means, When there is a matching character or character string, a third determination unit that determines an email address, and the character or character string identified by the identification unit is a character or character string stored in the fourth storage unit. In contrast, if there is a matching character or character string, a fourth determination unit that determines an address and a character or character string that is identified by the identification unit are stored in the fifth storage unit. Matches against a string If there is a character or character string, a fifth determination means for determining a telephone number, a mail address counting means for counting the number of cases determined as a mail address in the third determination means, and a fourth determination means Address counting means for counting the number of cases determined as addresses in the telephone, and telephone number counting means for counting the number of cases determined as telephone numbers in the fifth determination means. Personal information from the number of personal names counted in the name counting step, the number of email addresses counted in the email address counting step, the number of addresses counted in the address counting step, and the number of phone numbers counted in the telephone number counting step It is a feature to check whether the specified condition is met. It can also be a.

本発明によって、企業等の組織内から個人情報が漏洩することを防止するために、プリントアウト、外部メディアへの書き出し、メール送信等の対象となるファイルに個人情報が含まれているかを検査する場合に、特にファイルに含まれる個人名(氏又は氏と名の組み合わせを含む)を効率的に識別することによって、コンピュータにかかる処理負担を軽減することが可能になる。   According to the present invention, in order to prevent personal information from leaking from within an organization such as a company, it is inspected whether personal information is included in a target file for printout, writing to an external medium, mail transmission, etc. In particular, it is possible to reduce the processing burden on the computer by efficiently identifying personal names (including names or combinations of names and names) included in the file.

本発明を実施するための最良の形態について、図面を用いて以下に詳細に説明する。尚、以下の説明は本発明によって個人情報を検査する場合の一例を示したものであって、本発明はかかる実施形態に限定されるものではない。   The best mode for carrying out the present invention will be described below in detail with reference to the drawings. The following description shows an example in which personal information is inspected according to the present invention, and the present invention is not limited to such an embodiment.

図1は、本発明にかかる個人情報検査プログラムの機能を示す図である。図2は、本発明にかかる個人情報検査システムの実施例を示す図である。図3は、本発明にかかる個人情報検査システムの構成を示すブロック図である。図4は、本発明にかかる個人情報検査プログラムにおいて用いられる検査対象イベントテーブルの一例を示す図である。図5は、本発明にかかる個人情報検査プログラムにおいて用いられる検査レベルに関する個人情報検査ルールの一例を示す図である。図6は、本発明にかかる個人情報検査プログラムにおいて用いられるデータ読み飛ばしに関する個人情報検査ルールの一例を示す図である。図7は、本発明にかかる個人情報検査プログラムにおいて用いられる個人名に関する個人情報検査ルールの一例を示す図である。図8は、本発明にかかる個人情報検査プログラムによって、個人名を検査する例を示す図である。図9〜図11は、本発明にかかる個人情報検査プログラムによる個人情報検査の処理フローを示す、それぞれ第1〜第3のフローチャートである。図12、図13は、本発明にかかる個人情報検査プログラムによる個人名をカウントする処理フローを示す、それぞれ第1、第2のフローチャートである。   FIG. 1 is a diagram showing functions of a personal information inspection program according to the present invention. FIG. 2 is a diagram showing an embodiment of the personal information inspection system according to the present invention. FIG. 3 is a block diagram showing the configuration of the personal information inspection system according to the present invention. FIG. 4 is a diagram showing an example of an inspection target event table used in the personal information inspection program according to the present invention. FIG. 5 is a diagram showing an example of a personal information inspection rule relating to an inspection level used in the personal information inspection program according to the present invention. FIG. 6 is a diagram showing an example of a personal information inspection rule regarding data skipping used in the personal information inspection program according to the present invention. FIG. 7 is a diagram showing an example of a personal information inspection rule relating to an individual name used in the personal information inspection program according to the present invention. FIG. 8 is a diagram showing an example of inspecting an individual name by the personal information inspection program according to the present invention. 9 to 11 are first to third flowcharts, respectively, showing the processing flow of the personal information inspection by the personal information inspection program according to the present invention. FIGS. 12 and 13 are first and second flowcharts, respectively, showing processing flows for counting personal names by the personal information inspection program according to the present invention.

図1を用いて、本発明にかかる個人情報検査プログラムの機能と利用形態について説明する。企業等の組織内において使用されているコンピュータに、顧客名簿等の個人情報を含むファイルAと、社内報など個人情報を含まないファイルBが記憶されているとする。ここで、ファイルAとファイルBそれぞれについて、外部記憶媒体への書き出し命令が行われると、外部記憶媒体への書き出し処理を実行する前に、個人情報検査プログラムによって書き出し処理の対象であるファイルに個人情報が含まれるかの検査が行われる。   With reference to FIG. 1, functions and usage forms of the personal information inspection program according to the present invention will be described. It is assumed that a file A including personal information such as a customer list and a file B not including personal information such as an in-house newsletter are stored in a computer used in an organization such as a company. Here, for each of file A and file B, when a write command to the external storage medium is issued, before executing the write process to the external storage medium, the personal information inspection program assigns the individual files to the target file for the write process. A check is made to see if the information is included.

個人情報検査プログラムによる検査では、個人情報に該当する情報が予め定義されていて、検査対象であるファイルに含まれる個人情報を検出し、検出した個人情報の件数等が所定のルールに該当する場合には、当該ファイルは個人情報の漏洩を防止するための対処が必要なファイルであると判定される。図1の例では、ファイルAは個人情報の漏洩を防止するための対処が必要と判定されるため、外部記憶媒体への書き出しが禁止されるが、ファイルBは対処が必要ないと判定され、外部記憶媒体への書き出し処理が実行される。   In the inspection by the personal information inspection program, when the information corresponding to the personal information is defined in advance, the personal information contained in the file to be inspected is detected, and the number of detected personal information corresponds to the predetermined rule The file is determined to be a file that needs to be dealt with in order to prevent leakage of personal information. In the example of FIG. 1, since it is determined that the file A needs to be handled to prevent the leakage of personal information, writing to the external storage medium is prohibited, but the file B is determined not to need to be handled, Write processing to the external storage medium is executed.

尚、個人情報検査プログラムによる検査が必要となるのは、図1の例に示したファイルの外部記憶媒体への書き出しに限られず、ファイルのプリントアウト、添付ファイルを付した電子メールの送信、ファイルの新規作成や更新など、様々なイベントを実行する際に検査を行って、個人情報の漏洩を防止するように構成することができる。   The inspection by the personal information inspection program is not limited to the writing of the file shown in the example of FIG. 1 to the external storage medium, but the file is printed out, the e-mail is sent with the attached file, and the file It is possible to make a configuration so as to prevent leakage of personal information by performing inspection when various events such as new creation or update are executed.

図2は、本発明にかかる個人情報検査システムを、企業等の組織内のネットワークにおいて活用する実施例を示す図である。図2に示した社内LAN等のネットワークには、組織の構成員が利用するユーザ端末の他、ファイルサーバ、ネットワークプリンタやメールサーバ等が接続されていて、ゲートウェイサーバを介してインターネットに接続されている。ユーザ端末を操作することによって、ユーザ端末やファイルサーバに記憶されたファイルをユーザ端末と接続されたプリンタへの出力、外部メディアへの書き出し等が行える他、ネットワークプリンタへの印刷、電子メールの送受信、Webページの閲覧等を行うことが可能となっている。   FIG. 2 is a diagram showing an embodiment in which the personal information inspection system according to the present invention is utilized in a network in an organization such as a company. In addition to user terminals used by members of the organization, a file server, a network printer, a mail server, etc. are connected to the network such as the in-house LAN shown in FIG. 2 and are connected to the Internet via a gateway server. Yes. By operating the user terminal, files stored in the user terminal and file server can be output to a printer connected to the user terminal, written to external media, etc., printed on a network printer, and sent and received by e-mail It is possible to browse web pages.

本発明にかかる個人情報検査プログラムは、各々のユーザ端末に記憶されている。ユーザ端末において、ファイルのプリントアウトや書き出し命令、メールの送信命令などを受け付けると、個人情報検査プログラムによって対象となるファイルに個人情報が含まれているかの検査が実行される。検査の対象となるファイルは、ユーザ端末に記憶されたファイルであってもよいし、ネットワークで共有されるファイルサーバに記憶されたファイルであってもよい。   The personal information inspection program according to the present invention is stored in each user terminal. When the user terminal receives a file printout or write command, a mail transmission command, or the like, the personal information check program checks whether the target file contains personal information. The file to be inspected may be a file stored in a user terminal or a file stored in a file server shared on a network.

個人情報の検査は、対象となるファイルから、ユーザ端末に記憶された個人情報を定義した条件に該当する文字や文字列を検出することによって行われる。個人情報を定義した条件としては、個人名、住所、電話番号、メールアドレスなどに含まれる文字や文字列が定められている。このような条件は、各々のユーザ端末に記憶されているが、モニタサーバにおいて設定された条件をユーザ端末に配信するように構成することによって、端末間の検査の精度のばらつきを防止し、各々のユーザ端末に記憶された条件が最新の状態に維持されることとなる。   The inspection of personal information is performed by detecting characters and character strings that meet the conditions defining the personal information stored in the user terminal from the target file. As conditions for defining personal information, characters and character strings included in personal names, addresses, telephone numbers, mail addresses, and the like are determined. Such conditions are stored in each user terminal, but by configuring the conditions set in the monitor server to be distributed to the user terminals, it is possible to prevent variations in inspection accuracy between terminals, The conditions stored in the user terminal are maintained in the latest state.

ユーザ端末において個人情報の検査が行われ、個人情報に該当する文字や文字列が所定の条件に合致する場合には、個人情報の漏洩を防止するための対処が実行される。対処の方法は特に限定されるものではないが、例えば、プリントアウトや書き出し、メール送信などのユーザ端末で受け付けたイベントの停止の他、ユーザ端末やモニタサーバへの警告表示などが含まれる。   The personal information is inspected in the user terminal, and if the character or character string corresponding to the personal information meets a predetermined condition, a countermeasure for preventing leakage of the personal information is executed. The handling method is not particularly limited, and includes, for example, stoppage of events received at the user terminal such as printout, writing, and mail transmission, and warning display on the user terminal and the monitor server.

このような個人情報の検査は、ユーザによる操作を受け付けるユーザ端末において行うことが好ましいが、ユーザ端末からの命令を受けて処理を実行するファイルサーバ、メールサーバ、ゲートウェイサーバ等に本発明にかかる個人情報検査プログラムを記憶させ、検査を実行させることとしてもよい。   Such inspection of personal information is preferably performed at a user terminal that accepts an operation by the user. However, the personal server according to the present invention may be applied to a file server, a mail server, a gateway server, or the like that executes processing in response to an instruction from the user terminal. An information inspection program may be stored and an inspection may be executed.

図3〜図8を用いて、本発明にかかる個人情報検査プログラムによって実行されるコンピュータの動作と、個人情報検査の具体的な方法について説明する。図3は、本発明にかかる個人情報検査プログラムを動作させるためのコンピュータの構成の一例を示したものである。   The operation of the computer executed by the personal information inspection program according to the present invention and a specific method of the personal information inspection will be described with reference to FIGS. FIG. 3 shows an example of the configuration of a computer for operating the personal information inspection program according to the present invention.

本発明にかかる個人情報検査プログラムによって個人情報の検査を行うユーザ端末10には、CPU11、RAM12、ROM13、HDD14、NIC15、外部接続バス16が備えられている。HDD14に記憶されたアプリケーションプログラムを実行する場合には、ROM13に記憶された入力制御や出力制御などのハードウェア制御のための基本的な各種プログラムを起動し、HDD14に記憶されたアプリケーションプログラムを読み出して、RAM12をワークエリアとして機能させながら、CPU11により演算処理を実行する。   The user terminal 10 that inspects personal information by the personal information inspection program according to the present invention is provided with a CPU 11, RAM 12, ROM 13, HDD 14, NIC 15, and external connection bus 16. When executing an application program stored in the HDD 14, basic various programs for hardware control such as input control and output control stored in the ROM 13 are started, and the application program stored in the HDD 14 is read out. Thus, the CPU 11 executes arithmetic processing while functioning the RAM 12 as a work area.

HDD14には個人情報検査プログラム141が記憶されていて、ファイルのプリントアウトや書き出しなどの検査対象イベント記憶部142に定められた所定のイベントの実行が受け付けられると、HDD14から個人情報検査プログラム141が読み出され、対象となるファイルに個人情報が含まれるかの検査が行われる。個人情報の検査は、個人情報検査ルール記憶部143に記憶された条件を基準にして行われる。   A personal information inspection program 141 is stored in the HDD 14. When an execution of a predetermined event set in the inspection target event storage unit 142 such as printout or writing of a file is received, the personal information inspection program 141 is received from the HDD 14. It is read out and a check is made to see if the target file contains personal information. The personal information inspection is performed based on the conditions stored in the personal information inspection rule storage unit 143.

尚、検査対象イベント記憶部142に記憶される検査対象イベントや、個人情報検査ルール記憶部143に記憶される個人情報の検査ルールなどの個人情報ポリシーについては、モニタサーバ50において設定され、ユーザ端末10に配信されるように構成することができる。これによって、ユーザ端末10ではモニタサーバ50に設定されたより精度の高いルールの適用を受けることが可能になるが、検査対象イベントや、個人情報の検査ルールのうち検査レベルなど一部のルールについては、ユーザ端末でユーザが各々設定できるよう構成してもよい。   The personal information policy such as the inspection target event stored in the inspection target event storage unit 142 and the personal information inspection rule stored in the personal information inspection rule storage unit 143 is set in the monitor server 50, and the user terminal 10 can be configured to be distributed. As a result, the user terminal 10 can be applied with more accurate rules set in the monitor server 50. However, some rules such as the inspection level among the inspection target events and the inspection rules for personal information are not applicable. The user terminal may be configured so that each user can make settings.

ユーザ端末10が、入力装置20から様々な処理命令を受け付けると、個人情報検査プログラム141によって、受け付けた命令が個人情報の検査を要するものであるか否かについて、検査対象イベント記憶部142を参照して判断される。図4は、検査対象イベント記憶部142に記憶された検査対象イベントテーブルの一例であるが、外部メディアへの書き出し、印刷、メールの送信、Webの閲覧、ファイルの新規作成、更新、削除、ファイル名変更等のイベント毎に、検査対象であるかが設定されている。この例では、メールの送信とファイル名の変更は検査対象にはならないが、それ以外のイベントについては、全て個人情報の検査が行われることとなっている。   When the user terminal 10 receives various processing instructions from the input device 20, the personal information inspection program 141 refers to the inspection target event storage unit 142 as to whether the received instruction requires inspection of personal information. To be judged. FIG. 4 is an example of an inspection target event table stored in the inspection target event storage unit 142, and includes writing to an external medium, printing, sending an email, browsing the Web, creating a new file, updating, deleting a file, Whether it is an inspection target is set for each event such as name change. In this example, mail transmission and file name change are not subject to inspection, but personal information is inspected for all other events.

このような検査対象の設定については、ユーザ端末10を使用するユーザが各々行うこととしてもよいが、システム管理者等がモニタサーバ50において設定した検査対象を、各々のユーザ端末に配信することとしてもよい。   Such setting of the inspection target may be performed by each user using the user terminal 10, but the inspection target set by the system administrator or the like in the monitor server 50 is distributed to each user terminal. Also good.

ユーザ端末10が受け付けた操作が、検査対象イベント記憶部142において検査対象となるイベントであると定義されていた場合は、受け付けた操作において出力や書き出しの対象となっているファイル等の個人情報の検査対象となるファイルを取得する。尚、メールの送信を検査する場合については、メール本文には発信者の署名が含まれることが多いため、全てが個人情報と判定されて送信が停止されてしまう恐れがある。従って、メールを検査する場合については、メール本文を検査対象からは除外し、添付ファイルのみを検査することとしてもよい。   If the operation received by the user terminal 10 is defined as an event to be inspected in the inspection object event storage unit 142, the personal information such as a file that is the target of output or writing in the received operation Get the file to be inspected. Note that in the case of checking the transmission of mail, since the signature of the sender is often included in the mail text, there is a possibility that all will be judged as personal information and the transmission will be stopped. Therefore, in the case of inspecting the mail, the mail text may be excluded from the inspection target and only the attached file may be inspected.

続いて、取得したファイルのデータサイズを確認する。データサイズを個人情報検査ルール記憶部143に記憶されたルールと対比して、データサイズが検査対象から除外されているものである場合には、検査は行われずに受け付けた操作がそのまま実行される。   Subsequently, the data size of the acquired file is confirmed. When the data size is excluded from the inspection target in comparison with the rule stored in the personal information inspection rule storage unit 143, the received operation is executed as it is without performing the inspection. .

図5は、個人情報検査ルール記憶部143に記憶されに記憶された検査レベルに関する個人情報検査ルールの一例を示したものであるが、検査対象として定められたデータサイズに対応する部分についてのみ個人情報の検査を行い、データサイズを超える部分については検査の対象外とする。尚、ファイルのどの部分を検査対象とするかについては、先頭から所定のサイズまで、末尾から所定のサイズまでなどを設定することが可能であるが、特に限定されるものではない。又は、検査対象として定められたデータサイズ以下のファイルについてのみ個人情報の検査を行い、定められたデータサイズを超えるがファイルについては検査を行わないこととしてもよい。データサイズが大きいものについて検査を行うと、コンピュータへの処理負担が増大し、処理にかかる時間も要することになるため、ユーザ端末10を使用するユーザ毎に与えられた権限や使用状況に応じて、検査レベルを設定することができることとなっている。   FIG. 5 shows an example of the personal information inspection rule relating to the inspection level stored and stored in the personal information inspection rule storage unit 143, but only the part corresponding to the data size determined as the inspection target is personal. Information is inspected, and portions exceeding the data size are not subject to inspection. Note that which part of the file is to be inspected can be set from the beginning to a predetermined size, from the end to a predetermined size, and the like, but is not particularly limited. Alternatively, the personal information may be inspected only for a file having a data size equal to or smaller than the data size determined as the inspection target, and the file may not be inspected for exceeding the predetermined data size. If an inspection is performed on a large data size, the processing burden on the computer increases and the time required for the processing also increases. Therefore, depending on the authority and usage status given to each user who uses the user terminal 10 The inspection level can be set.

このような検査レベルの設定については、ユーザ端末10を使用するユーザが各々行うこととしてもよいが、システム管理者等がモニタサーバ50において設定した検査レベルを、各々のユーザ端末に配信することとしてもよい。   Such setting of the inspection level may be performed by each user using the user terminal 10, but the inspection level set by the system administrator or the like in the monitor server 50 is distributed to each user terminal. Also good.

また、検査対象として取得したファイルのデータサイズに応じて、検査を行わない読み飛ばし部分を設定することもできる。取得したファイルのデータサイズを確認し、個人情報検査ルール記憶部143を参照して、データサイズに対応する読み飛ばしサイズを読み飛ばした後の部分から、個人情報の検査を実行する。   Also, it is possible to set a skip portion that is not inspected according to the data size of the file acquired as the inspection target. The data size of the acquired file is confirmed, and the personal information inspection rule storage unit 143 is referred to, and the personal information is inspected from the portion after skipping the skip size corresponding to the data size.

図6は、個人情報検査ルール記憶部143に記憶されに記憶されたデータ読み飛ばしに関する個人情報検査ルールの一例を示したものであるが、取得したファイルのデータサイズに対応するデータ読み飛ばしサイズを特定し、特定されたデータ読み飛ばしサイズ分をファイルの先頭から読み飛ばした後のデータについて、個人情報の検査を実行する。   FIG. 6 shows an example of a personal information inspection rule related to data skipping stored and stored in the personal information inspection rule storage unit 143. The data skipping size corresponding to the data size of the acquired file is shown in FIG. The personal information is inspected for the data after the specified data skipping size has been skipped from the beginning of the file.

このようなデータ読み飛ばしサイズの設定については、ユーザ端末10を使用するユーザが各々行うこととしてもよいが、システム管理者等がモニタサーバ50において設定したデータ読み飛ばしサイズを、各々のユーザ端末に配信することとしてもよい。また、全てのファイルについてデータ読み飛ばしを行わず、ファイルの全てのデータを検査するように設定することとしてもよい。   Such setting of the data skipping size may be performed by each user using the user terminal 10, but the data skipping size set by the system administrator or the like in the monitor server 50 is set in each user terminal. It is good also as delivering. Alternatively, it may be set so that all data in the file is inspected without skipping data reading for all the files.

検査対象となったファイルのうち、読み飛ばし部分の後の検査対象となるデータについては、以下のような処理によって個人情報が含まれるか否かの検査が行われる。まず、スペースやカンマなどの所定のセパレータによって区切られた文字又は文字列(以下の説明において、文字には数字や符号を、文字列には数字列や符号列及び文字、数字、符号の組合せを含むこととする)を、個人情報であるかを判定する対象として切り出す。切り出した文字又は文字列が、個人情報検査ルール記憶部143に記憶された個人名、メールアドレス、住所、電話番号等に含まれる文字等を定義したルールに該当するかを判定し、該当する場合には個人情報として件数がカウントされる。   In the file to be inspected, the data to be inspected after the skipped portion is inspected as to whether personal information is included by the following processing. First, a character or character string delimited by a predetermined separator such as a space or a comma (in the following explanation, a character is a number or a code, a character string is a number string or a code string, and a combination of a character, a number, or a code. Is included as a target for determining whether it is personal information. If the extracted character or character string corresponds to a rule that defines characters included in the personal name, email address, address, telephone number, etc. stored in the personal information inspection rule storage unit 143, and The number of cases is counted as personal information.

尚、ここで判定の対象となる文字又は文字列を切り出す方法は特に限定されるものではなく、セパレータについても、スペースやカンマの他に、>、<、改行、セミコロン、読点などのように文字や文字列を区切る様々な符号等を採用することが可能であり、ここに挙げた例に特に限定されるものではない。   Note that the method for cutting out the character or character string to be determined here is not particularly limited, and for the separator, in addition to spaces and commas, characters such as>, <, line feed, semicolon, punctuation marks, etc. It is possible to adopt various codes or the like for separating the character strings, and the present invention is not particularly limited to the examples given here.

カウントされた個人情報の件数が所定の条件に該当する場合には、対象となったファイルについては、個人情報の漏洩を防止するための対処が必要なものであると判断され、プリンタ30へのプリントアウトや外部メディア40への書き出しの停止、モニタサーバ50への警告などの処理が実行される。ここで定められる条件について特に限定されるものではないが、カウントされた個人情報の絶対数を条件とする場合は、対処のための処理を要求する件数のレベルによって、個人情報の漏洩のための強度を調整することができる。このような条件については、個人情報検査ルール記憶部143に検査ルールの一部として記憶される。   If the counted number of personal information satisfies a predetermined condition, it is determined that the target file needs to be dealt with in order to prevent leakage of personal information, and is sent to the printer 30. Processing such as printout, stop of writing to the external medium 40, and warning to the monitor server 50 is executed. There are no particular restrictions on the conditions set here, but if the absolute number of personal information counted is a condition, depending on the level of the number of requests for processing, it may The strength can be adjusted. Such conditions are stored in the personal information inspection rule storage unit 143 as part of the inspection rules.

個人情報検査ルール記憶部143に記憶された個人情報を定義したルールについては、メールアドレスであれば、例えば、アットマーク(@)やドット(.)を含む文字列であること等を定めることができる。住所であれば、例えば、区、市、などの文字を含むこと等を定めることができる。電話番号であれば、例えば、半角9〜17文字であること、ハイフン(−)を含むこと等を定めることができる。   For a rule that defines personal information stored in the personal information inspection rule storage unit 143, for example, if it is an email address, it may be determined that the character string includes an at sign (@) or a dot (.). it can. If it is an address, for example, it can be determined that characters such as a ward and a city are included. In the case of a telephone number, for example, it can be determined that it is 9 to 17 single-byte characters and includes a hyphen (-).

一方、個人名であるかの判断については、メールアドレス、住所、電話番号等に比べて汎用的なルールを設定することが難しく、通常は個人名に該当する氏や氏名を定めた氏名リストを登録し、切り出された文字や文字列が氏名リストに登録された文字又は文字列に該当するかの対比が行われる。しかしながら、精度の高い判定を行うためには、氏名リストに登録する件数をなるべく多くしなければならず、氏名リストの件数が多くなるほど照合処理の負担が重くなり、通常の操作に支障が生じやすくなってしまう。   On the other hand, it is difficult to set general-purpose rules compared to email addresses, addresses, telephone numbers, etc., to determine whether it is an individual name. Usually, a name list that specifies names and names corresponding to individual names is used. A comparison is made as to whether the registered character or character string corresponds to the character or character string registered in the name list. However, in order to make a highly accurate judgment, the number of registrations in the name list must be increased as much as possible. The greater the number of names in the name list, the greater the burden of collation processing, and the more likely it is to hinder normal operations. turn into.

そこで、本発明においては、図7の例に示したようなルールを設定することによって、少ない登録件数で検査の精度を高めて、コンピュータの処理負担を著しく軽減することを可能にしている。この例では、セパレータにより切り出された文字又は文字列のうち、全角1〜6文字の文字又は文字列を対象に、全角1文字の場合は当該文字がリストに登録された文字であるか否か、全角2〜6文字の場合は2文字目の文字がリストに登録された文字であるか否かによって、切り出した文字列が個人名であるか否かを判定することとしている。尚、検査の対象となる文字列の文字数の上限は6文字に限定されるものではなく、2文字以上であれば何文字であってもよいが、日本人の氏名の一般的な文字数を考慮すると、6文字に設定することが好ましい。   Therefore, in the present invention, by setting a rule as shown in the example of FIG. 7, it is possible to increase the accuracy of the inspection with a small number of registrations and remarkably reduce the processing load on the computer. In this example, among characters or character strings cut out by the separator, for characters or character strings of 1 to 6 full-width characters, if the character is a double-byte character, whether or not the character is registered in the list In the case of 2 to 6 double-byte characters, it is determined whether or not the extracted character string is a personal name depending on whether or not the second character is a character registered in the list. The upper limit of the number of characters in the character string to be inspected is not limited to 6 characters, but any number of characters can be used as long as it is 2 characters or more, but the general number of characters in the Japanese name is considered. Then, it is preferable to set to 6 characters.

セパレータにより切り出された文字又は文字列については、まず全角1文字の文字であるか否かが確認される。全角1文字の場合には、図7の例に示したように、日本人の1文字の氏に多く使われる「林、森、島、谷、原」等の文字が検査文字として登録されたリストと照合される。いずれかの検査文字と一致する場合には、個人名であると判定される。   For the character or character string cut out by the separator, it is first confirmed whether or not it is a single-byte character. In the case of one full-width character, as shown in the example of FIG. 7, characters such as “Hayashi, Mori, Shima, Tani, Hara” that are often used by one Japanese character are registered as inspection characters. Matches against a list. If it matches any of the check characters, it is determined to be a personal name.

全角1文字の文字に該当しない場合には、全角2〜6文字の文字列であるか否かが確認される。全角2〜6文字の漢字の場合には、図7の例に示したように、日本人の2文字以上の氏の2文字目に多く使われる「藤、木、橋、中、辺、本、村、林、田」等の文字が検査文字として登録されたリストと照合される。いずれかの検査文字と一致する場合には、個人名であると判定される。   If it does not correspond to a single-byte character, it is confirmed whether or not it is a character string of 2 to 6 double-byte characters. In the case of 2 to 6 full-pitch kanji characters, as shown in the example of FIG. 7, “Wisteria, Wood, Bridge, Middle, Side, Book” , Village, forest, rice field, etc. are collated with a list registered as inspection characters. If it matches any of the check characters, it is determined to be a personal name.

日本人の氏名においては、2文字目に使用される漢字の種類が比較的限定されているため、このように2文字以上の文字列を対象にする場合には、2文字目の対比のみを行うことによって、リストに登録する文字の数を抑制しながら、比較的精度の高い検査を行うことが可能になる。また、リストに登録して照合する文字が1文字のみとなるため、2文字以上の氏名を登録する場合に比べて、照合の対象となる文字コードの数が著しく削減されて、コンピュータの処理負担を軽減することが可能になる。   In Japanese names, the type of kanji used for the second character is relatively limited. Therefore, when targeting two or more character strings in this way, only the second character is compared. By doing so, it becomes possible to perform inspection with relatively high accuracy while suppressing the number of characters registered in the list. In addition, since only one character is registered and collated in the list, the number of character codes to be collated is remarkably reduced as compared with the case of registering a name with two or more characters, and the processing burden on the computer is reduced. Can be reduced.

図8は、本発明によって行われる個人名の検査の具体例を示している。1行目からは、スペースをセパレータとして、「001」、「原」、「一郎」、「03−1234−5678・・・」という文字又は文字列が切り出され、このうち全角1〜6文字の文字又は文字列である「原」、「一郎」が個人名の検査の対象となる。「原」は1文字であるため、1文字の場合の検査文字と照合し、検査文字には「原」が含まれているため個人名であると判定され、個人情報が1件存在しているとカウントされる。「一郎」については2文字の文字列であるため、2文字目の「郎」と、2文字の場合の検査文字とを照合し、検査文字には「郎」が含まれていないため、個人情報にはカウントされない。   FIG. 8 shows a specific example of the examination of the personal name performed by the present invention. From the first line, the characters or character strings “001”, “Hara”, “Ichiro”, “03-1234-5678... Characters or character strings “Hara” and “Ichiro” are subject to personal name inspection. Since “original” is one character, it is compared with the inspection character in the case of one character, and since “original” is included in the inspection character, it is determined to be a personal name, and there is one piece of personal information. Is counted. Since “Ichiro” is a two-character string, the second character “Buro” is compared with the inspection character in the case of two characters, and the inspection character does not include “Buro”. It is not counted in the information.

2行目についても同様に、「佐藤」、「二郎」について、それぞれ2文字目の「藤」と「郎」と、2文字の場合の検査文字との照合が行われ、「佐藤」については、検査文字には「藤」が含まれているため個人名であると判定され、個人情報が1件存在しているとカウントされる。「二郎」については、検査文字には「郎」が含まれていないため、個人情報にはカウントされない。   Similarly, for the second line, for “Sato” and “Jiro”, the second character “Fuji” and “Buro” are compared with the inspection character in the case of two characters, and for “Sato” Since the inspection character includes “wisteria”, it is determined that the character is a personal name, and one personal information is counted. Since “Jiro” is not included in the inspection character, “Jiro” is not counted in the personal information.

3行目については、氏と名の間にスペースが設けられていないため、「田中三郎」の4文字の文字列が切り出されて、2文字目の「中」と、2文字の場合の検査文字との照合が行われ、検査文字には「中」が含まれているため個人名であると判定され、個人情報が1件存在しているとカウントされる。   For the third line, there is no space between the name and the name, so the four-character string “Saburo Tanaka” is cut out, and the second character “middle” and the second character are inspected. The character is collated, and since “inspection” includes “middle”, it is determined to be a personal name, and it is counted that one piece of personal information exists.

尚、本発明においては、氏のみでなく、名についても同様に、1文字目と2文字目に用いられやすい文字を登録して検査を行うこととしてもよいが、氏、名、それぞれについて検査を行うこととすると、氏と名がスペースにおいて区切られていた場合に、1人の氏名を2件としてカウントしてしまう可能性が生じる。そうすると、同じ人数の個人情報が含まれるファイルであっても、氏のみのリストと氏名のリストではカウントされる件数が著しく異なることとなってしまうため、いずれか一方を基準にしてカウントすることが好ましい。その場合、名のみで個人名を特定するケースに比べて、氏のみで個人名を特定するケースが多いこと、名を基準にすると氏名をスペースなしで記載した場合に何番目の文字を検査するかが特定し難いことから、氏のみを基準に検査を行うことが好適である。   In the present invention, not only the name but also the name may be similarly registered and inspected with characters that are easily used for the first and second characters. If a name and a name are separated by a space, there is a possibility that one name will be counted as two. Then, even if the file contains personal information of the same number of people, the number of cases counted in the list of only names and the list of names will be significantly different. preferable. In that case, compared to the case where the personal name is specified only by the name, there are more cases where the personal name is specified only by the name, and based on the name, what number character is inspected when the name is described without a space. Since it is difficult to specify, it is preferable to perform the inspection based on only Mr ..

このように個人名の件数のカウントが行われると、メールアドレス、住所、電話番号等の件数と合わせて検査対象となるファイルに含まれる個人情報の件数が集計され、個人情報の漏洩を防止するための対処を行う条件に合致するかが確認される。この条件については特に限定されるものではなく、全ての合計件数を基準にしてもよいし、各々の要素について基準値を設定して条件を定めることとしてもよく、個人情報の漏洩を防止する必要性とコンピュータにかかる処理負担等のバランスを考慮して、ユーザやシステム管理者が個別に設定できることとしてもよい。   When the number of personal names is counted in this way, the number of personal information contained in the file to be inspected is counted together with the number of email addresses, addresses, telephone numbers, etc., and leakage of personal information is prevented. It is confirmed whether or not the conditions for performing the countermeasure are met. This condition is not particularly limited, it may be based on the total number of all cases, or may be determined by setting a standard value for each element, and it is necessary to prevent leakage of personal information In consideration of the balance between performance and the processing load on the computer, the user or system administrator may be able to make individual settings.

所定の条件に合致した場合に行われる対処としては、例えばプリンタ30へのプリントアウトや外部メディア40への書き出しの停止、モニタサーバ50への警告、NIC15を介してネットワークに発信されるメールの送信停止等を行うこととすればよい。   As countermeasures to be taken when a predetermined condition is met, for example, printing out to the printer 30 or writing to the external medium 40 is stopped, a warning is given to the monitor server 50, and a mail transmitted to the network via the NIC 15 is transmitted. What is necessary is just to stop.

図9〜図11のフローチャートを用いて、本発明にかかる個人情報検査プログラムによる個人情報検査の処理フローについて説明する。図9は対象イベントであるかを判定するフローを、図10は検査対象となるデータを特定するフローを、図11は個人情報をカウントして必要な場合は個人情報の漏洩を防止するための対処を実行するフローを、それぞれ示している。   A personal information inspection processing flow by the personal information inspection program according to the present invention will be described with reference to the flowcharts of FIGS. FIG. 9 is a flow for determining whether the event is a target event, FIG. 10 is a flow for specifying data to be inspected, and FIG. 11 is a counter for counting personal information and preventing leakage of personal information when necessary. The flow for executing the countermeasure is shown.

まず、本発明にかかる個人情報検査プログラムが動作するコンピュータにおいて、ファイルのプリントアウトやメール送信等のイベントの実行を受け付けると(S01)、個人情報の検査対象を指定した検査対象イベントテーブルを参照して(S02)、受け付けたイベントが個人情報の検査対象であるかを判定する(S03)。検査対象に該当しない場合は、個人情報の検査を終了し、受け付けたイベントを実行する処理に移行する。   First, in the computer on which the personal information inspection program according to the present invention operates, when the execution of an event such as file printout or mail transmission is accepted (S01), the inspection object event table specifying the inspection object of personal information is referred to. (S02), it is determined whether the received event is a subject of personal information inspection (S03). If it does not fall under the inspection target, the personal information inspection is terminated, and the process proceeds to a process of executing the accepted event.

個人情報の検査対象であると判定された場合には、個人情報を検査する対象となるファイルを取得する(S04)。検査対象となるファイルは、プリントアウトや書き出しの対象として指定されたファイルや、送信されるメールの添付ファイル等である。取得したファイルのデータサイズを読み取って(S05)、検査対象として検査ルールに設定された所定のサイズ以下のファイルであるかを確認する(S06)。   If it is determined that the personal information is to be inspected, a file to be inspected for personal information is acquired (S04). The file to be inspected is a file designated as a printout or export target, an attached file of a mail to be transmitted, or the like. The data size of the acquired file is read (S05), and it is confirmed whether the file is smaller than the predetermined size set in the inspection rule as the inspection target (S06).

所定のサイズを超過する場合には、定められたデータサイズを上限として、検査の対象となるファイルのうち、検査対象となる部分を特定する(S09)。ここでファイルのどの部分を検査対象として特定するかについては、特に限定されるものではない。所定のサイズ以下である場合は、ファイル全体が検査対象となるが、いずれのケースにおいても、続いてデータサイズに応じて検査ルールとして設定された読み飛ばしサイズを取得し(S07)、読み飛ばしサイズを読み飛ばした後以降の検査対象データを特定する(S08)。   When the predetermined size is exceeded, the portion to be inspected is specified in the file to be inspected with the predetermined data size as the upper limit (S09). Here, which part of the file is specified as the inspection target is not particularly limited. If the size is equal to or smaller than the predetermined size, the entire file is to be inspected. In any case, the skip size set as the inspection rule is subsequently acquired according to the data size (S07), and the skip size is acquired. The inspection object data after the reading is skipped is specified (S08).

続いて、検査対象データに含まれる個人情報として、個人名の件数のカウント(S10)、メールアドレスの件数のカウント(S11)、住所の件数のカウント(S12)、電話番号の件数のカウント(S13)が行われる。これらの件数が、検査ルールとして設定された個人情報の漏洩を防止するための対処を実行するための所定の条件に合致するかを確認し(S14)、対処が必要と認定された場合には(S15)、プリントアウトの停止やメールの送信停止などの個人情報の漏洩を防止するための対処が実行される(S16)。所定の条件に合致しない場合は、対処を必要としないものと判断されて、個人情報の検査を終了し、受け付けたイベントを実行する処理に移行する。   Subsequently, as personal information included in the inspection target data, the count of the number of personal names (S10), the count of the number of e-mail addresses (S11), the count of the number of addresses (S12), the count of the number of phone numbers (S13) ) Is performed. It is confirmed whether or not the number of cases matches a predetermined condition for executing a countermeasure for preventing leakage of personal information set as an inspection rule (S14). (S15), measures are taken to prevent leakage of personal information such as printout stop or mail transmission stop (S16). If the predetermined condition is not met, it is determined that no action is required, the personal information inspection is terminated, and the process proceeds to a process of executing the accepted event.

図12、図13のフローチャートを用いて、本発明にかかる個人情報検査プログラムによる個人名をカウントする処理フローについて説明する。図12は1文字が個人名であるかを判定するフローを、図13は2文字以上の文字列が個人名であるかを判定するフローを、それぞれ示している。   A processing flow for counting personal names by the personal information inspection program according to the present invention will be described with reference to the flowcharts of FIGS. FIG. 12 shows a flow for determining whether one character is a personal name, and FIG. 13 shows a flow for determining whether a character string of two or more characters is a personal name.

個人名のカウントにおいては、検査対象のデータから、セパレータによって区切られた所定の文字又は文字列(例えば全角1〜6文字の文字又は文字列)が切り出される(S091)。切り出された文字列が1文字であるかを判定し(S092)、1文字である場合には、その文字が検査文字として検査ルールに登録された文字のいずれかと合致するかを確認する(S093)。   In counting the personal name, a predetermined character or character string (for example, a character or character string of 1 to 6 full-width characters) separated by a separator is cut out from the data to be inspected (S091). It is determined whether the extracted character string is one character (S092), and if it is one character, it is confirmed whether the character matches any of the characters registered in the inspection rule as the inspection character (S093). ).

検査文字に合致する場合には、個人名が1件存在したとしてカウントし(S094)、次の文字列があるかを確認する(S095)。検査文字に合致しない場合には、個人名にはカウントされずに、次の文字列があるかを確認する(S095)。   If it matches the inspection character, it is counted that there is one personal name (S094), and it is confirmed whether there is a next character string (S095). If it does not match the inspection character, it is not counted as a personal name, and it is confirmed whether there is a next character string (S095).

切り出された文字列が1文字でない場合は、文字列の2文字目の文字を特定する(S096)。2文字目の文字が検査文字として検査ルールに登録された文字のいずれかと合致するかを確認し(S097)、検査文字に合致する場合には、個人名が1件存在したとしてカウントし(S094)、次の文字列があるかを確認する(S095)。検査文字に合致しない場合には、個人名にはカウントされずに、次の文字列があるかを確認する(S095)。   If the extracted character string is not one character, the second character of the character string is specified (S096). It is confirmed whether the second character matches one of the characters registered in the inspection rule as the inspection character (S097), and if it matches the inspection character, it is counted that one individual name exists (S094). ), It is confirmed whether there is a next character string (S095). If it does not match the inspection character, it is not counted as a personal name, and it is confirmed whether there is a next character string (S095).

これらの処理は、切り出された全ての文字列について検査が行われるまで繰り返され、検査対象のデータに含まれる個人名の合計件数が算出される。個人名の合計件数が算出されると、図11に示したように、メールアドレスをカウントする処理に移行する。   These processes are repeated until all the extracted character strings are inspected, and the total number of personal names included in the inspection target data is calculated. When the total number of personal names is calculated, as shown in FIG. 11, the process proceeds to a process of counting mail addresses.

尚、個人名の件数のカウントについては、これまでの例に説明したように検査対象となるデータ全体を検査して合計件数を算出することとしてもよいが、予め設定された個人情報の漏洩を防止するための対処が必要な件数を超過した時点において検査を打ち切り、直ちに対処を行うこととしてもよい。個人名の件数に限らず、メールアドレス、住所等のカウントに移行してから所定の件数を超過した時点において、同様の処理を行うこととしてもよい。   As for the count of the number of personal names, as described in the previous examples, the total number of cases may be calculated by inspecting the entire data to be inspected. The inspection may be aborted when the number of necessary countermeasures for prevention is exceeded, and the countermeasures may be taken immediately. Not only the number of personal names but also the same processing may be performed when a predetermined number is exceeded after shifting to the counting of e-mail addresses, addresses, and the like.

本発明にかかる個人情報検査プログラムの機能を示す図である。It is a figure which shows the function of the personal information inspection program concerning this invention. 本発明にかかる個人情報検査システムの実施例を示す図である。It is a figure which shows the Example of the personal information test | inspection system concerning this invention. 本発明にかかる個人情報検査システムの構成を示すブロック図である。It is a block diagram which shows the structure of the personal information test | inspection system concerning this invention. 本発明にかかる個人情報検査プログラムにおいて用いられる検査対象イベントテーブルの一例を示す図である。It is a figure which shows an example of the test object event table used in the personal information inspection program concerning this invention. 本発明にかかる個人情報検査プログラムにおいて用いられる検査レベルに関する個人情報検査ルールの一例を示す図である。It is a figure which shows an example of the personal information test | inspection rule regarding the test | inspection level used in the personal information test | inspection program concerning this invention. 本発明にかかる個人情報検査プログラムにおいて用いられるデータ読み飛ばしに関する個人情報検査ルールの一例を示す図である。It is a figure which shows an example of the personal information inspection rule regarding the data skipping used in the personal information inspection program concerning this invention. 本発明にかかる個人情報検査プログラムにおいて用いられる個人名に関する個人情報検査ルールの一例を示す図である。It is a figure which shows an example of the personal information inspection rule regarding the personal name used in the personal information inspection program concerning this invention. 本発明にかかる個人情報検査プログラムによって、個人名を検査する例を示す図である。It is a figure which shows the example which test | inspects a personal name with the personal information test | inspection program concerning this invention. 本発明にかかる個人情報検査プログラムによる個人情報検査の処理フローを示す第1のフローチャートである。It is a 1st flowchart which shows the processing flow of a personal information test | inspection by the personal information test | inspection program concerning this invention. 本発明にかかる個人情報検査プログラムによる個人情報検査の処理フローを示す第2のフローチャートである。It is a 2nd flowchart which shows the processing flow of a personal information test | inspection by the personal information test | inspection program concerning this invention. 本発明にかかる個人情報検査プログラムによる個人情報検査の処理フローを示す第3のフローチャートである。It is a 3rd flowchart which shows the processing flow of a personal information test | inspection by the personal information test | inspection program concerning this invention. 本発明にかかる個人情報検査プログラムによる個人名をカウントする処理フローを示す第1のフローチャートである。It is a 1st flowchart which shows the processing flow which counts the personal name by the personal information test | inspection program concerning this invention. 本発明にかかる個人情報検査プログラムによる個人名をカウントする処理フローを示す第2のフローチャートである。It is a 2nd flowchart which shows the processing flow which counts the personal name by the personal information test | inspection program concerning this invention.

符号の説明Explanation of symbols

10 ユーザ端末
11 CPU
12 RAM
13 ROM
14 HDD
141 個人情報検査プログラム
142 検査対象イベント記憶部
143 個人情報検査ルール記憶部
15 NIC
16 外部接続バス
20 入力装置
30 プリンタ
40 外部メディア
50 モニタサーバ
10 User terminal 11 CPU
12 RAM
13 ROM
14 HDD
141 Personal information inspection program 142 Inspection object event storage unit 143 Personal information inspection rule storage unit 15 NIC
16 External connection bus 20 Input device 30 Printer 40 External media 50 Monitor server

Claims (6)

検査対象となるファイルに、個人名を含む所定の個人情報が含まれるかを検査するための個人情報検査プログラムであって、漢字1文字について個人名と判定する漢字を記憶する第1の記憶部と、2文字以上n文字(nは2以上の自然数)以下の文字列において2文字目にある場合に個人名と判定する漢字を記憶する第2の記憶部と、を備えるコンピュータに、
前記ファイルに含まれる所定のセパレータで区切られた文字又は文字列を識別する識別ステップと、
前記識別ステップで識別した文字又は文字列のうち、1文字以上n文字以下の文字又は文字列を選択する選択ステップと、
前記選択ステップにおいて選択した文字又は文字列が1文字の場合、第1の記憶部に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第1の判定ステップと、
前記選択ステップにおいて選択した文字又は文字列が2文字以上n文字以下の場合、前記文字列の2文字目の文字を第2の記憶部に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第2の判定ステップと、
前記第1の判定ステップ及び前記第2の判定ステップにおいて個人名と判定された件数をカウントする個人名カウントステップと、
前記個人名カウントステップでカウントした個人名の件数を含む前記ファイルに含まれる個人情報の件数が、所定の条件に合致するかを検査する検査ステップと、
を実行させることを特徴とする個人情報検査プログラム。
A personal information inspection program for inspecting whether predetermined personal information including a personal name is included in a file to be inspected, a first storage unit for storing a Chinese character that determines a single Chinese character as a personal name And a second storage unit that stores a kanji character that is determined as a personal name when it is the second character in a character string of 2 characters or more and n characters (n is a natural number of 2 or more),
An identification step for identifying characters or character strings delimited by a predetermined separator included in the file;
A selection step of selecting one or more characters or character strings from the characters or character strings identified in the identification step;
A first determination step in which, when the character or character string selected in the selection step is one character, in contrast to the kanji stored in the first storage unit, if there is a matching kanji, it is determined as an individual name; ,
If the character or character string selected in the selection step is not less than 2 characters and not more than n characters, the second character of the character string is compared with the kanji stored in the second storage unit and there is a matching kanji A second determination step for determining a personal name in the case,
A personal name counting step of counting the number of cases determined as personal names in the first determination step and the second determination step;
An inspection step for inspecting whether the number of personal information included in the file including the number of personal names counted in the personal name counting step meets a predetermined condition;
A personal information inspection program characterized in that
前記コンピュータは、メールアドレスと判定する文字又は文字列を記憶する第3の記憶部と、住所と判定する文字又は文字列を記憶する第4の記憶部と、電話番号と判定する文字又は文字列を記憶する第5の記憶部と、を備えていて、前記コンピュータに、
前記識別ステップで識別した文字又は文字列を、前記第3の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合にはメールアドレスと判定する第3の判定ステップと、
前記識別ステップで識別した文字又は文字列を、前記第4の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合には住所と判定する第4の判定ステップと、
前記識別ステップで識別した文字又は文字列を、前記第5の記憶部に記憶された文字又は文字列と対比して、一致する文字又は文字列がある場合には電話番号と判定する第5の判定ステップと、
前記第3の判定ステップにおいてメールアドレスと判定された件数をカウントするメールアドレスカウントステップと、
前記第4の判定ステップにおいて住所と判定された件数をカウントする住所カウントステップと、
前記第5の判定ステップにおいて電話番号と判定された件数をカウントする電話番号カウントステップと、を実行させ、
前記検査ステップにおいては、前記個人名カウントステップでカウントした個人名の件数、前記メールアドレスカウントステップでカウントしたメールアドレスの件数、前記住所カウントステップでカウントした住所の件数、前記電話番号カウントステップでカウントした電話番号の件数から個人情報の件数をカウントし、所定の条件に合致するかを検査すること
を特徴とする請求項1記載の個人情報検査プログラム。
The computer includes a third storage unit that stores characters or character strings to be determined as mail addresses, a fourth storage unit that stores characters or character strings to be determined as addresses, and characters or character strings to be determined as telephone numbers. A fifth storage unit for storing
The character or character string identified in the identification step is compared with the character or character string stored in the third storage unit, and if there is a matching character or character string, a third address is determined. A determination step;
Fourth determination for determining the character or character string identified in the identification step as an address when there is a matching character or character string in comparison with the character or character string stored in the fourth storage unit Steps,
The character or character string identified in the identification step is compared with the character or character string stored in the fifth storage unit. A determination step;
An e-mail address counting step for counting the number of e-mail addresses determined in the third determining step;
An address counting step of counting the number of cases determined to be addresses in the fourth determination step;
A telephone number counting step of counting the number of cases determined as telephone numbers in the fifth determination step,
In the inspection step, the number of personal names counted in the personal name counting step, the number of email addresses counted in the email address counting step, the number of addresses counted in the address counting step, counted in the telephone number counting step 2. The personal information inspection program according to claim 1, wherein the personal information inspection program counts the number of personal information from the number of telephone numbers and checks whether or not a predetermined condition is met.
前記コンピュータに、
前記ファイルのデータサイズを特定し、前記データサイズが予め設定されたサイズを超過するかを判定するデータサイズ判定ステップを実行させ、
前記コンピュータは、前記データサイズ判定ステップにおいて前記データサイズが予め設定されたサイズを超過すると判定された場合には、前記予め設定されたサイズを上限に検査を実行するか、又は個人情報の検査を実行しないこと
を特徴とする請求項1又は2記載の個人情報検査プログラム。
In the computer,
Specifying the data size of the file, causing the data size determination step to determine whether the data size exceeds a preset size,
If it is determined in the data size determination step that the data size exceeds a preset size, the computer performs an inspection up to the preset size or performs an inspection of personal information. 3. The personal information inspection program according to claim 1, wherein the personal information inspection program is not executed.
前記コンピュータは、ファイルのデータサイズに対応して先頭から読み飛ばすデータサイズを記憶する第6の記憶部を備えていて、前記コンピュータに、
前記ファイルのデータサイズを特定し、前記第6の記憶部を参照して前記ファイルについて先頭から読み飛ばすデータサイズを特定する特定ステップを実行させ、
前記コンピュータは、前記ファイルのうち、前記特定ステップにおいて特定されたデータサイズを読み飛ばした残りのデータを対象に、個人情報の検査を実行すること
を特徴とする請求項1乃至3いずれかに記載の個人情報検査プログラム。
The computer includes a sixth storage unit that stores a data size to be skipped from the beginning corresponding to the data size of the file.
Specify the data size of the file, and execute a specifying step of specifying the data size skipped from the beginning of the file with reference to the sixth storage unit,
The said computer performs the test | inspection of personal information for the remaining data which skipped the data size specified in the said specific step among the said files. Personal information inspection program.
検査対象となるファイルに、個人名を含む所定の個人情報が含まれるかを検査するための個人情報検査方法であって、
漢字1文字について個人名と判定する漢字を記憶する第1の記憶部と、2文字以上n文字(nは2以上の自然数)以下の文字列において2文字目にある場合に個人名と判定する漢字を記憶する第2の記憶部と、を備えるコンピュータが、前記ファイルに含まれる所定のセパレータで区切られた文字又は文字列を識別する識別ステップと、
前記コンピュータが、前記識別ステップで識別した文字又は文字列のうち、1文字以上n文字以下の文字又は文字列を選択する選択ステップと、
前記コンピュータが、前記選択ステップにおいて選択した文字又は文字列が1文字の場合、第1の記憶部に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第1の判定ステップと、
前記コンピュータが、前記選択ステップにおいて選択した文字又は文字列が2文字以上n文字以下の場合、前記文字列の2文字目の文字を第2の記憶部に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第2の判定ステップと、
前記コンピュータが、前記第1の判定ステップ及び前記第2の判定ステップにおいて個人名と判定された件数をカウントする個人名カウントステップと、
前記コンピュータが、前記個人名カウントステップでカウントした個人名の件数を含む前記ファイルに含まれる個人情報の件数が、所定の条件に合致するかを検査する検査ステップと、
を有することを特徴とする個人情報検査方法。
A personal information inspection method for inspecting whether a file to be inspected includes predetermined personal information including a personal name,
A first storage unit that stores a kanji character that is determined to be an individual name for one kanji character and a character name that is the second character in a character string that is not less than 2 characters and not more than n characters (n is a natural number not less than 2) is determined as an individual name An identification step for identifying a character or a character string delimited by a predetermined separator included in the file;
A selection step in which the computer selects one or more characters or character strings from the characters or character strings identified in the identification step;
When the character or character string selected in the selection step is one character, the computer compares the kanji stored in the first storage unit, and if there is a matching kanji, the computer determines a first personal name. A determination step of
If the character or character string selected by the computer in the selecting step is not less than 2 characters and not more than n characters, the second character of the character string is compared with the kanji stored in the second storage unit and matched. A second determination step for determining a personal name when there is a Chinese character to be
A personal name counting step in which the computer counts the number of cases determined as personal names in the first determination step and the second determination step;
An inspection step in which the computer inspects whether the number of personal information included in the file including the number of personal names counted in the personal name counting step meets a predetermined condition;
A personal information inspection method characterized by comprising:
検査対象となるファイルに、個人名を含む所定の個人情報が含まれるかを検査するための個人情報検査システムであって、
漢字1文字について個人名と判定する漢字を記憶する第1の記憶手段と、
2文字以上n文字(nは2以上の自然数)以下の文字列において2文字目にある場合に個人名と判定する漢字を記憶する第2の記憶手段と、
前記ファイルに含まれる所定のセパレータで区切られた文字又は文字列を識別する識別手段と、
前記識別手段が識別した文字又は文字列のうち、1文字以上n文字以下の文字又は文字列を選択する選択手段と、
前記選択手段が選択した文字又は文字列が1文字の場合、第1の記憶手段に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第1の判定手段と、
前記選択手段において選択した文字又は文字列が2文字以上n文字以下の場合、前記文字列の2文字目の文字を第2の記憶手段に記憶された漢字と対比して、一致する漢字がある場合には個人名と判定する第2の判定手段と、
前記第1の判定手段及び前記第2の判定手段において個人名と判定された件数をカウントする個人名カウント手段と、
前記個人名カウント手段がカウントした個人名の件数を含む前記ファイルに含まれる個人情報の件数が、所定の条件に合致するかを検査する検査手段と、
を備えることを特徴とする個人情報検査システム。
A personal information inspection system for inspecting whether a file to be inspected includes predetermined personal information including a personal name,
First storage means for storing a kanji character that is determined as an individual name for one kanji character;
A second storage means for storing a kanji character that is determined as an individual name when it is the second character in a character string of two or more and n characters (n is a natural number of 2 or more)
An identification means for identifying a character or a character string delimited by a predetermined separator included in the file;
A selection means for selecting one or more characters or character strings from among the characters or character strings identified by the identification means;
A first determination unit that determines a personal name when there is a matching kanji character in contrast to the kanji stored in the first storage unit when the character or character string selected by the selection unit is one character; ,
When the character or character string selected by the selection means is not less than 2 characters and not more than n characters, the second character of the character string is compared with the kanji stored in the second storage means and there is a matching kanji. A second determination means for determining a personal name in the case;
Personal name counting means for counting the number of cases determined as personal names in the first determination means and the second determination means;
Inspection means for inspecting whether the number of personal information included in the file including the number of personal names counted by the personal name counting means meets a predetermined condition;
A personal information inspection system comprising:
JP2006061929A 2006-03-07 2006-03-07 Personal information inspection program, personal information inspection method, and personal information inspection system Active JP4284328B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006061929A JP4284328B2 (en) 2006-03-07 2006-03-07 Personal information inspection program, personal information inspection method, and personal information inspection system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006061929A JP4284328B2 (en) 2006-03-07 2006-03-07 Personal information inspection program, personal information inspection method, and personal information inspection system

Publications (2)

Publication Number Publication Date
JP2007241580A JP2007241580A (en) 2007-09-20
JP4284328B2 true JP4284328B2 (en) 2009-06-24

Family

ID=38587074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006061929A Active JP4284328B2 (en) 2006-03-07 2006-03-07 Personal information inspection program, personal information inspection method, and personal information inspection system

Country Status (1)

Country Link
JP (1) JP4284328B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9569528B2 (en) * 2008-10-03 2017-02-14 Ab Initio Technology Llc Detection of confidential information
JP5659505B2 (en) * 2010-03-02 2015-01-28 凸版印刷株式会社 Authentication apparatus and authentication method
JP5743822B2 (en) * 2011-09-21 2015-07-01 日本電気株式会社 Information leakage prevention device and restriction information generation device

Also Published As

Publication number Publication date
JP2007241580A (en) 2007-09-20

Similar Documents

Publication Publication Date Title
US9025890B2 (en) Information classification device, information classification method, and information classification program
US9036180B2 (en) Apparatus and method for securing confidential information of printed document in cloud computing environment
US9766840B2 (en) Non-transitory computer readable medium, information processing apparatus, and information processing method setting character recognition accuracy
US8269999B2 (en) Information processing apparatus, information processing system, and method of controlling such information processing apparatus
CN102257487B (en) Analyzing events
WO2012095971A1 (en) Classification rule generation device, classification rule generation method, classification rule generation program and recording medium
US9001365B2 (en) Conflict resolution and optimization for job definition format instructions
US20100153581A1 (en) Method and system for optimizing network transmission of rendered documents
JP2006236220A (en) Device, method, program and storage medium for forming test data file
JP2007257552A (en) Security management system by means of print log and print data storage
JP4284328B2 (en) Personal information inspection program, personal information inspection method, and personal information inspection system
US8136120B2 (en) Methods and systems of reconciling sources of print job processing information in a print processing environment
US8817278B2 (en) Information processing apparatus, information processing method and computer-readable medium for job settings for device functions
US20140279933A1 (en) Hashing Schemes for Managing Digital Print Media
JP2009146402A (en) Information processing system, information processor, its control method, communication apparatus, its control method and program
JP2007072609A (en) Print control unit, print control method, print control program, and recording medium
JP7206735B2 (en) Information processing device and program
US10558403B2 (en) Information processing apparatus and information processing method for providing notification about job executed by execution apparatus, and storage medium
JP2007299093A (en) Document management system
JP2018527673A (en) Merging print data and metadata for print jobs processed in the print workflow
JP5630193B2 (en) Operation restriction management program, operation restriction management apparatus, and operation restriction management method
US9535908B2 (en) Auto-retrieving to avoid data binding
US20220201130A1 (en) Information processing device and non-transitory computer readable medium
JP4139919B2 (en) Personal information search program
JP4457725B2 (en) Form sorting device and program

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090313

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090323

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4284328

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120327

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130327

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140327

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250