JP4272690B1 - 個人情報ファイル判定システム - Google Patents

個人情報ファイル判定システム Download PDF

Info

Publication number
JP4272690B1
JP4272690B1 JP2008042017A JP2008042017A JP4272690B1 JP 4272690 B1 JP4272690 B1 JP 4272690B1 JP 2008042017 A JP2008042017 A JP 2008042017A JP 2008042017 A JP2008042017 A JP 2008042017A JP 4272690 B1 JP4272690 B1 JP 4272690B1
Authority
JP
Japan
Prior art keywords
personal information
file
information
determined
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008042017A
Other languages
English (en)
Other versions
JP2009199461A (ja
Inventor
稔 和仁
Original Assignee
Sky株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sky株式会社 filed Critical Sky株式会社
Priority to JP2008042017A priority Critical patent/JP4272690B1/ja
Application granted granted Critical
Publication of JP4272690B1 publication Critical patent/JP4272690B1/ja
Publication of JP2009199461A publication Critical patent/JP2009199461A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】
コンピュータ端末で管理しているファイルについて、そのファイルが個人情報ファイルであるかどうかを判定する個人情報ファイル判定システムを提供することを目的とする。
【解決手段】
処理対象となったファイルからそこに含まれている情報を抽出し、抽出した情報が個人情報であるかを判定し、前記個人情報であると判定した各情報について規則性があるか否かを判定することで、前記処理対象となったファイルが個人情報ファイルであるかを判定する個人情報ファイル判定部と、を有する個人情報ファイル判定システムである。
【選択図】 図1

Description

本発明は、コンピュータ端末で管理しているファイルについて、そのファイルが個人情報ファイルであるかどうかを判定する個人情報ファイル判定システムに関する。
近年、企業などの組織で管理する個人情報の漏洩が相次いだことにより、個人情報を含むファイルの徹底管理が求められるようになっている。しかし個人情報を大量に含むファイルは非常に多数あることから、すべてのファイルをチェックして、個人情報を大量に含むファイルを特定するのは容易ではない。
そこで下記特許文献1乃至特許文献4に記載のように、記憶しているファイルの内容を検索することで、自動的に個人情報を含むファイルであるかを判定し、それを特定するシステムが存在する。
特開2006−178603号公報 特開2007−200276号公報 特開2007−241580号公報 特許第3705439号公報
上記の各特許文献に記載のシステムを利用することにより、個人情報を含むファイルを特定することは出来る。しかし企業などの組織で使用するファイルの場合、そのほとんどのファイルに何らかの個人情報を含んでいることが通常である。例えば電子メールであれば、電子メールの本文に署名として発信者の氏名、勤務先の住所、電話番号、電子メールアドレスなどが含まれていたり、書類などのファイルであっても、氏名や住所などの個人情報が含まれていることがほとんどである。
もちろんこれらの個人情報は漏洩しても良いということではないが、各特許文献に記載のシステムを用いた場合では、単に、ファイルの内容に、「名前」、「住所」、「電話番号」などの情報が含まれているかを判定しているだけであるので、コンピュータ端末で記憶しているファイルのほとんどが個人情報ファイルであるとして特定される可能性が極めて高い。そのため、ほとんどのファイルに対して、個人情報ファイルであることを示すフラグが付されたり、セキュリティ設定が行われてしまう可能性がある。
しかし企業などの組織においてもっとも重要なことは、名簿や顧客情報のように、個人情報を大量に含むファイルが漏洩することであり、それらのファイルについては徹底的に機密扱いとされなければならない。
ところが上記各特許文献のシステムを用いたとしても、個人情報を含むファイルであるかどうかを特定することは出来ても、そのファイルが本当に機密扱いとされなければならない個人情報を含むファイル(名簿や顧客情報などのファイル)であるか、を特定することは出来ず、単に文書の一部に個人情報を含んでいるファイルと、大量に個人情報を含むファイルとの切り分けをすることが出来ていない。
従って、特定したファイルに個人情報が含まれていることはわかっても、名簿や顧客情報のファイルなどの、個人情報を大量に含むファイルであるかどうかは、管理者が別途、ファイルを開いたり、ファイル名などから推測することで、特定しなければならない。しかしこのような作業は、上述のように、従来の特許文献のシステムでは、コンピュータ端末で記憶するファイルのほとんどのファイルが個人情報を含むファイルとして判定されてしまうので、実際にはその労力は膨大となってしまう。
そこで、名簿や顧客情報などのように、個人情報を大量に含むファイルだけを、コンピュータ端末に記憶するファイルから特定することで、真に保護されるべき個人情報ファイルを特定することが出来るシステムが求められている。
本発明者は上記課題に鑑み、個人情報を大量に含むファイルだけをコンピュータ端末に記憶するファイルから特定することが可能な個人情報ファイル判定システムを発明した。なお本願明細書において、個人情報ファイルとは、そのファイルの内容のほとんど(一定割合以上、例えば90%以上、95%以上など)が個人情報であるファイルのことであり、またその個人情報が一定の規則性(例えば周期性)をもって含まれているファイル、例えば名簿ファイル、顧客情報ファイルなどを示す。
第1の発明は、ファイルが個人情報ファイルであるかを判定する個人情報ファイル判定システムであって、前記個人情報ファイル判定システムは、処理対象となった表形式のファイルから、行方向及び列方向に配列された文字情報を抽出する文字情報抽出部と、前記抽出した各文字情報について、予め定められた文字列の配列条件を備えるかを判定することにより前記抽出した文字情報のうち個人情報である文字情報を判定し、個人情報であると判定した文字情報がどの項目の個人情報に該当するかを判定する個人情報判定部と、前記個人情報判定を行った、前記表形式の行方向及び列方向に配列された各文字情報に対して、同一の列方向の各個人情報の項目のうち、同一種類の項目の個人情報が一定割合以上含まれているかを、少なくとも二以上の列について判定することにより、その配列に規則性を有するかを判定する規則性判定部と、前記規則性判定部において前記個人情報であると判定した各文字情報の配列が規則性を有すると判定した場合に、前記処理対象となったファイルを個人情報ファイルとして判定するファイル判定部と、前記ファイル判定部における判定結果に基づいて制御処理を実行する制御処理部と、を有する個人情報ファイル判定システムである。
上述のように、企業などで特に保護されるべきは個人情報を大量に含むファイル(個人情報ファイル)であるが、従来のシステムでは、個人情報を少しでも含んでいるだけでそのファイルを特定してしまう問題点があり、実際に使用する際には不便であった。そこで本発明のように、個人情報を大量に含むファイルでは、個人情報が規則性を持って配列されている点に着目し、単に個人情報を含むファイルというだけではなく、規則性に則って個人情報を配列しているかを判定することで、個人情報ファイルかどうかを的確に判定することが可能となる。これによって、企業などでもっとも保護されるべき個人情報ファイルを容易に特定でき、また実際に使用する際の利便性も向上する。
一般的に個人情報ファイルは表形式のファイルで構成されていることが多い。そのため、列方向に同一種類の項目の個人情報が一定割合以上配置されているかを判定することで、規則性の判定が可能となる。
上記発明における個人情報ファイル判定システムは、本発明の個人情報ファイル判定プログラムをコンピュータ端末に読み込み、実行させることで実現できる。すなわち、コンピュータ端末を、所定の記憶領域に記憶されている、処理対象となった表形式のファイルから、行方向及び列方向に配列された文字情報を抽出する文字情報抽出部、前記抽出した各文字情報について、予め定められた文字列の配列条件を備えるかを判定することにより前記抽出した文字情報のうち個人情報である文字情報を判定し、個人情報であると判定した文字情報がどの項目の個人情報に該当するかを判定する個人情報判定部、前記個人情報判定を行った、前記表形式の行方向及び列方向に配列された各文字情報に対して、同一の列方向の各個人情報の項目のうち、同一種類の項目の個人情報が一定割合以上含まれているかを、少なくとも二以上の列について判定することにより、その配列に規則性を有するかを判定する規則性判定部、前記規則性判定部において前記個人情報であると判定した各文字情報の配列が規則性を有すると判定した場合に、前記処理対象となったファイルを個人情報ファイルとして判定するファイル判定部、前記ファイル判定部における判定結果に基づいて制御処理を実行する制御処理部、として機能させる個人情報ファイル判定プログラムである。
本発明の個人情報ファイル判定システムによって、個人情報を大量に含むファイルだけを、コンピュータ端末に記憶するファイルから特定することが可能となる。一般的に、名簿や顧客情報として使用されるファイルには、氏名、住所、電話番号など、様々な種別のデータが含まれている。そのような場合、本発明の個人情報ファイル判定システムを用いることによって、従来よりも精度良く、個人情報のファイルとして判定することができる。
本発明の個人情報ファイル判定システム1のシステム構成の一例を図1に示す。
本発明の個人情報ファイル判定システム1は、図1では一台のコンピュータ端末で実施される場合を示しているが、この各機能が複数のコンピュータ端末に各機能が分散して配置されており、複数のコンピュータ端末やサーバ(以下、これらを総称して、「コンピュータ端末」という場合もある)によりその処理が実現されても良い。
コンピュータ端末は、プログラムの演算処理を実行するCPUなどの演算装置20と、情報を記憶するRAMやハードディスクなどの記憶装置21とを少なくとも有している。コンピュータ端末上で実現する各機能(各手段)は、その処理を実行する手段(プログラムやモジュールなど)が演算装置20に読み込まれることでその処理が実行される。各機能は、記憶装置21に記憶した情報をその処理において使用する場合には、該当する情報を当該記憶装置21から読み出し、読み出した情報を適宜、演算装置20における処理に用いる。また、当該コンピュータ端末には、演算装置20の処理結果や記憶装置21に記憶する情報をインターネットやLANなどのネットワークを介して送受信する通信装置24、ディスプレイなどの表示装置22、キーボードやマウスやテンキーなどの入力装置23を有していても良い。図2にコンピュータ端末のハードウェア構成の一例を模式的に示す。
本発明における各手段は、その機能が論理的に区別されているのみであって、物理上あるいは事実上は同一の領域を為していても良い。
個人情報ファイル判定システム1は、ファイル記憶部2と個人情報ファイル判定部3と制御処理部4とを有する。
ファイル記憶部2は、当該コンピュータ端末において、ファイルを記憶している。ここで記憶しているファイルの種類には様々なものがあり、文書ファイル、表計算ファイル、テキストファイル、プレゼンテーションファイル、画像ファイルなどその制限はない。
個人情報ファイル判定部3は、ファイル記憶部2に記憶するファイルについて、個人情報ファイルであるかを特定する。個人情報ファイルとは、上述のように、ファイルの主な内容が個人情報そのものであり、その個人情報を一定の規則性のもとに、大量に含んでいるファイルである。例えば名簿や顧客情報のファイルが該当する。また個人情報とは、氏名、住所、電話番号、電子メールアドレス、年齢、性別などの属性情報を示す。なお個人のほかにも、法人などの組織体の属性情報であってもよく、本明細書では、「個人」との記載にはそれらも含まれる。
個人情報ファイル判定部3は、文字情報抽出部31と個人情報判定部32と規則性判定部33とファイル判定部34とを有する。
個人情報ファイルには、大量に個人情報が含まれているため、一般的には、無秩序に各個人情報が含まれているのではなく、何らかの規則性(例えば周期性)により含まれていることがほとんどである。例えば、図4に示すように、「ID」、「氏名」、「都道府県」、「住所」、「電話番号」、「特記事項」などのように、各個人情報が予め定められた配列で記されている。
そこで個人情報ファイル判定部3は、処理対象としたファイルから文字情報を抽出し、その文字情報が個人情報に特有の文字情報であるかを判定したのち、個人情報に特有の文字情報として判定した文字情報について、それらの規則性(例えば周期性)を判定することで、個人情報ファイルであるかを判定する。
そのため個人情報ファイル判定部3は、文字情報抽出部31と個人情報判定部32と規則性判定部33とファイル判定部34とを有する。
文字情報抽出部31は、ファイル記憶部2に記憶するファイルのうち、個人情報ファイルであるかを判定するファイルについて、そのファイルに含まれる文字情報を抽出する。この文字情報の抽出の際に、所定の記号(カンマ、コンマ、セミコロンなど)、空白、改行などの区切り記号を、抽出する文字情報の区切りとして認識して、抽出することが好ましい。文字情報同士の区切りのために、これらが使用されることが多いからである。また文字情報には、文字のほか、数字、記号なども含まれる。なお、処理対象のファイルが画像ファイルなどの場合には、そのままでは文字情報を抽出できないので、当該画像ファイルから、文字認識処理(OCR処理)などを実行することで、文字情報を抽出する。
個人情報判定部32は、文字情報抽出部31が抽出した、ファイルに含まれる各文字情報について、その文字情報が個人情報に特有の文字情報であるかを判定する。またその個人情報がどのような項目の個人情報(「名前」「住所」「都道府県」「電話番号」「数値」など)であるのかを判定する。文字情報が個人情報であるか、そしてどの項目の個人情報であるかは、以下のように判定する。
まず氏名であれば「姓」「名」で構成されており、所定の文字数内(例えば8文字以内など)であれば氏名として判定する。また氏名として明らかに使われることがない文字、例えば数字などが含まれていればそれは氏名ではないと判定しても良い。また「姓」「名」の間に区切り記号が設けられている場合には、区切り記号の前の「姓」、後を「名」として判定する。
次に「都道府県名」などは47都道府県に該当する文字列であるかを判定する。更に住所についても、都道府県名、市区町村名などの順番で配置されているので、それらの名称を記憶する保存部(図示せず)を備えておき、文字情報列の判定の際に、その保存部に記憶する情報との一致性を判定することで行える。
また電話番号は数字が所定の桁数で並んでいれば(記号「−」が所定の桁に位置されていることを判定しても良い。また記憶されている市外局番などが先頭の所定桁数に含まれているかを判定しても良い)、電話番号であると判定できる。
更に電子メールアドレスは英数字と「@」「.」を含み、その最後が「co.jp」、「com」、「ac.jp」などの所定の英字列(予め定められたドメイン名の文字列)になっていれば電子メールアドレスであると判定できる。
生年月日は、元号の後に所定桁数の数字、または2桁か4桁の数字があり、その後、「年」、所定桁数の数字、「月」、所定桁数の数字、「日」と並んでいれば生年月日であると判定できる。
このように、個人情報については「氏名」、「住所」、「電話番号」、「電子メールアドレス」、「生年月日」など定型的に構成される属性情報がほとんどである。そのため上記以外の属性情報、例えば「郵便番号」、「血液型」、「家族構成」、「所有資産金額」などもそれぞれの配列規則と一致しているかを判定することで、文字情報抽出部31が抽出した文字情報について、個人情報であるかを個人情報判定部32が判定することが出来る。なお個人情報判定部32は、文字情報抽出部31が抽出した文字情報について、区切り記号で区切られた文字情報を一つの文字情報として処理し、その文字情報が個人情報であるかを判定する。
規則性判定部33は、処理対象となったファイルの文字情報について、個人情報判定部32で個人情報の文字情報であるかの判定を行ったのち、個人情報判定部32で個人情報として判定した各文字情報について、あるいは文字情報抽出部31で抽出した各文字情報について、規則性に(例えば周期性)従って含まれているか、を判定する。なお以下の説明では規則性の一例として周期性の場合を示すが、周期性以外の規則性であっても良い。
周期性の判定には様々な方法がある。
第一の方法としては、区切り記号に応じた周期性を判定する方法である。一般的に名簿や顧客情報などは、表形式であることが多い。そこで行方向、あるいは列方向に各項目、例えば「氏名」、「住所」などが設定されており、その項目毎に各個人情報が含まれていることが多い。
そこで行方向、列方向の各項目に、同一種類の個人情報が含まれているかを判定することで、周期性があるかを判定する。図5にこの場合の周期性の判定方法の一例を模式的に示す。図5(a)では、図4のファイルがCSV形式の場合を示しており、区切り記号としてカンマが使用されている。従って各文字情報はカンマによって区切られている。これを行、列ごとにそろえたのが図5(b)である。
図5(b)に示すように、第一の方法では、行方向、列方向のそれぞれに、あるいはいずれか一方向の各項目毎の文字情報について、同一種類の個人情報が含まれているかを判定し、一定割合以上が同一種類の個人情報であれば、それは周期性があると判定する。
例えば図5(b)の場合、列方向に周期性を検索することで、「氏名」、「都道府県」、「住所」、「電話番号」の種類の個人情報がそれぞれ含まれていると判定できるので、周期性があると判定する。なお一部の文字情報は個人情報の種類について、誤認識もあり得るので、同一種類として判定した個人情報が一定割合以上、各列、各行に含まれていれば、周期性があると判定することが好ましい。
第二の方法としては、予め各アプリケーションプログラムに応じた周期性のパターンを所定の記憶部(図示せず)に記憶させておき、そのパターンと各文字情報とを比較させ、もっとも一致率が高かったものの周期として判定する。
企業などで使用される個人情報ファイルとしては、それぞれ定められたフォーマットで作成されていることが多い。例えば顧客情報ファイルや社員名簿ファイルなどは、予め定められた項目の順にデータが配置されている。そこで個人情報ファイルとして使用される可能性のあるファイルの各項目配列のパターンをパターン辞書として記憶部に記憶させておき、文字情報抽出部31が抽出した文字情報、あるいは個人情報判定部32で判定した文字情報について、このパターン辞書における項目の配列パターンと、同一であるかを逐次、判定する。そしてそれらの一致率が最も高いパターンについて、その周期性で各文字情報が配列されていると判定できる。
例えば顧客情報ファイルの項目の配列パターンが「氏名」、「会社名」、「会社住所」、「会社電話番号」、「電子メールアドレス」、「役職」の順であり、社員名簿ファイルが「社員番号」、「氏名」、「所属部署」、「役職」、「電子メールアドレス」の順である場合に、これらの項目の並び順がパターン辞書に記憶されている。そして、規則性判定部33は、文字情報抽出部31で抽出した文字情報について、あるいは個人情報判定部32で判定した文字情報について、各文字情報ごとに順番に、同一種類の個人情報であるかを判定する。まず先頭の文字情報と、顧客情報ファイルのパターン辞書の最初の項目「氏名」とを比較し、次に、2つめの文字情報と、顧客情報ファイルのパターン辞書の2番目の項目「会社名」とを比較する。そして3番目の文字情報と、顧客情報ファイルのパターン辞書の3番目の項目「会社住所」とを比較する。これを最後の文字情報まで繰り返して比較する。
顧客情報ファイルのパターン辞書との一致を終えると、次に、先頭の文字情報と、社員名簿ファイルのパターン辞書の最初の項目「社員番号」とを比較し、次に、2つめの文字情報と、社員名簿ファイルのパターン辞書の2番目の項目「氏名」とを比較する。そして3番目の文字情報と、社員名簿ファイルのパターン辞書の3番目の項目「所属部署」とを比較する。これを最後の文字情報まで繰り返して比較する。
このように最後のパターン辞書まで比較すると、そのうち、当該処理対象のファイルに含まれる文字情報は、もっとも一致率が高かったパターン辞書の並び方(周期性)であると判定する。例えば顧客情報ファイルとの一致率が1%であり、社員名簿ファイルとの一致率が98%であったとすると、当該ファイルに含まれる個人情報は、社員名簿ファイルの周期性で構成されていると判定できる。
なおすべてのパターン辞書との比較の結果、最も高い一致率の値が所定値以下(または所定値未満)の場合には、それはいずれとも一致しなかったとして判定し、すなわち、当該ファイルについて、周期性はないと判定する。
第三の判定方法としては、以下のような処理がある。個人情報判定部32が個人情報として判定した文字情報について、その各文字情報からなるデータ列のうち、所定範囲のデータの項目を抽出する。例えば先頭から5番目までのデータの項目を抽出する。そして抽出したデータの項目と、各文字情報からなるデータ列の項目とを逐次比較し、一致した回数が所定回数以上(所定回数より多い)ならば規則性があると判定し、所定回数未満(所定回数以下)ならば規則性がないと判定する。これを模式的に示すのが図26である。
所定範囲のデータの項目と、データ列の項目とが一致すればその部分は同じ並び方であることから、規則性があると考えられる。従って、このような方法により、規則性があるかを判定することができる。
第四の周期性の判定方法としては、以下のような方法がある。
まず個人情報判定部32で個人情報であると判定した各文字情報について、一連のデータ列とし、判定した個人情報の項目で、所定のコードにコード化する。例えば、個人情報であると判定した各文字情報の各項目について、項目「名前」は「01h」、項目「都道府県」は「11h」、項目「住所」は「12h」、項目「電話番号」は「13h」、項目「数値」は「00h」、項目「不明(文字)」は「F0h」、項目「不明(英数字)」は「F1h」、項目「不明(空白)」は「FFh」とのように、予め項目ごとに定められたコードに基づいて、個人情報であると判定した各文字情報について、コード化する。これを模式的に示すのが図6である。
この時点ではコード化されたデータの周期性はわかっていない。そのため基準となる項目(任意に設定可能)と周期性の仮サイズ(仮に設定した周期性の値)を設定する。基準項目としては、例えば先頭の項目、あるいはデータにおいて最も多い項目などを基準項目として設定する。また周期性の仮サイズとしては2以上の任意の値とすることが良い。初期値が大きくなれば処理回数が少なくなるので高速化した処理が期待されるが、周期性のサイズが仮サイズより小さい場合には結果を求めることが出来ない。そのため適切な大きさが求められ、仮サイズを2とすることによって、結果を求められる可能性は高まる。なお周期性の仮サイズに、後述するデータをシフトした回数を加えた値が周期性のサイズとなる。
ここでは、基準項目として「数値」(コードでは「00h」)とし、周期性の仮サイズとして3を設定したとする。そうすると、まず規則性判定部33は、基準項目までデータをシフトする。そうすると、ここでは基準項目が先頭の「数値」であるのでそのまま処理可能となる。基準項目までシフトしたデータは、例えば配列(これを配列Aとする)などに逐次格納する。なお配列処理はポインタ処理によっても同様のことが実現できる。
そして、基準項目から、周期性の仮サイズの次の項目までシフトする。このシフトしたデータについても、例えば配列(これを配列Bとする)などに逐次格納する。そして配列Aの先頭項目と、配列Bの先頭項目とを比較し、一致するか判定する。これを模式的に示すのが図7である。
図7の場合、配列Aの先頭項目のコードは「00h」であり、配列Bの先頭項目のコードは「12h」であるから一致しない。一致しない場合には、配列Bについて、更に、一つ項目をシフトする(シフトした回数を記録しておく。この時点ではシフト回数=1)。そしてシフトさせた状態で、上述と同様に、配列Aの先頭項目と配列Bの先頭項目とを比較し、一致するか判定する。これを模式的に示すのが図8である。
図8の場合、配列Aの先頭項目のコードは「00h」であり、一つシフトした配列Bの先頭項目のコードは「13h」であるから一致しない。一致しない場合には、配列Bについて、更に、一つ項目をシフトする(シフト回数=2)。そしてシフトさせた状態で、上述と同様に、配列Aの先頭項目と配列Bの先頭項目とを比較し、一致するか判定する。これを模式的に示すのが図9である。
図9の場合、配列Aの先頭項目のコードは「00h」であり、一つシフトした配列Bの先頭項目のコードは「F0h」であるから一致しない。一致しない場合には、配列Bについて、更に、一つ項目をシフトする(シフト回数=3)。そしてシフトさせた状態で、上述と同様に、配列Aの先頭項目と配列Bの先頭項目とを比較し、一致するか判定する。これを模式的に示すのが図10である。
図10の場合、配列Aの先頭項目のコード「00h」と、配列Bの先頭項目のコード「00h」とが一致する。そうすると配列Aの2つめの項目のコード「01h」と配列Bの2つめの項目のコード「01h」、配列Aの3つめの項目のコード「11h」と配列Bの3つめの項目のコード「02h」とを比較する。そうすると周期性の仮サイズのすべての項目が一致する。
この場合、配列Aと配列Bとの項目を順番に比較する。そうすると4つめの項目は配列Aと配列Bはともに「12h」で一致し、5つめの項目は配列Aと配列Bはともに「13h」で一致する。そして6つめの項目は配列Aが「F0h」、配列Bが「F0h」となる。
このように順番に処理をしていくと、すべての配列が一致すると判定できる。これは、一周期を経て、データが一致したことを示している。このようにすべての配列が一致すると、配列Bのデータをウィンドウの仮サイズから3回シフトさせれば配列Aと配列Bのデータが一致することが判定できるので、周期性の仮サイズ(=3)とシフト回数(=3)とを加算して、周期性のサイズは「6」であると判定できる。つまり6つのデータで一周期であることを規則性判定部33は判定する。これを模式的に示すのが図11である。
なおこのような処理を配列Bの最後まで繰り返しても周期性を判定できなかった場合には、規則性判定部33は、周期性がないと判定する。
以上のようにして規則性判定部33は、周期性を判定する。
なお第四の判定方法では、すべての個人情報が正確に判定できていることが望ましいが、実際には、文字情報抽出部31、個人情報判定部32で誤認識をする可能性もある。そのため上記とは異なり、周期性のサイズのデータがすべて一致しなくても、一致率が所定値以上(例えば98%以上など)であれば、その時点で周期性の仮サイズとシフト回数とを加算して、周期性のサイズを判定しても良い。
この場合の第五の判定方法について説明する。
図6について一部の情報を誤認識した場合の例を図12に示す。図12の網掛け部分が誤認識した部分である。この方法の場合でも上述の判定方法と同様に、まずコード化する(図12の下方)。なお一致率の閾値として60%とする(本明細書ではデータ数が少ないので閾値を60%と低く設定したが、実際にはデータ数は多くなるので閾値を80%、85%、90%、95%、98%など、適宜設定することが好ましい。誤認識率が多いと想定される場合には閾値を低く設定し、誤認識率が少ないと想定される場合には閾値を高く設定すればよい。またデータ数によっても設定を変更しても良い)。
例えば上述では、図7において、配列Aと配列Bの先頭項目のみを比較していたが、先頭項目のみを比較するのではなく、配列Aと配列Bのすべての項目(ただし配列Aについては配列Bの項目の長さまで)を比較し、データの一致率を算出する。これを模式的に示すのが、図13である。そして、この一致率が所定値以上(所定値より大きい)であればその時点で周期性があると判定し、所定値未満(所定値以下)であれば配列Bのデータを一つシフトする。
図13の場合には、15のデータのうち一致している項目が0なので一致率は0%である。従って、配列Bのデータを一つシフトする(シフト回数=1)。そしてシフトした場合にも同様に処理を実行する。これを模式的に示すのが図14である。
図14の場合には、14のデータのうち一致している項目が2なので一致率は14%である。従って、配列Bのデータを更に一つシフトする(シフト回数=2)。そしてシフトした場合にも同様に処理を実行する。これを模式的に示すのが図15である。
図15の場合には、13のデータのうち一致している項目が0なので一致率は0%である。従って、配列Bのデータを更に一つシフトする(シフト回数=3)。そしてシフトした場合にも同様に処理を実行する。これを模式的に示すのが図16である。
図16の場合には、12のデータのうち一致している項目が8なので一致率は67%である。従って、周期性があると判定できる。そしてその周期性のサイズは、周期性の仮サイズ(=3)とシフト回数(=3)とを加算して「6」であると判定する。
なお上述では配列Bのすべてのデータと配列Aとを比較した場合を説明したが、データ数がきわめて多い場合、配列Bのすべてのデータと比較すると処理時間を要する場合がある。そのため配列Bのうちの一部のデータとそれに対応する配列Aとを比較するようにしても良い。
更に認識の結果、不明を示すコードと比較する場合には、その項目は一致した項目としてカウントする、あるいは比較を行わなくても良い。また上述の第五の判定方法において、すべてのデータをシフトしても一致率を充足しなかった場合には周期性がないと判定する。
第六の規則性の判定方法としては、以下のような処理を行うことができる。個人情報として抽出した文字情報のデータ列の一例を図17に示す。まず規則性判定部33は、図17のデータ列の一部または全部(処理対象となるデータ列)を抽出し、そのデータ列について、上述の各場合と同様にコード化する。そしてコード化したデータ列を半分に分ける。そして先頭から半分までを第1のデータ列(配列A)、半分以降を第2のデータ列(配列B)とする。図17に対して、この処理を行った状態を図18に示す。なおここでは2つのデータ列を生成する際に半分の位置で第1のデータ列、第2のデータ列としたが、半分の位置ではなく、任意の位置で区切り、第1のデータ列、第2のデータ列とすることもできる。
そして配列Aと配列Bの各項目を比較し、データの一致率を算出する。そして算出した一致率が所定値以上(所定値より大きい)であればその時点で周期性があると判定し、所定値未満(所定値以下)であれば配列Aまたは配列Bのデータを一つシフトする。
図18の場合には配列Aと配列Bの各項目のデータは一致していないので、一致率は0%であることから、配列Bのデータを一つシフトする。この状態を示すのが図19である。
図19の場合には、14のデータのうち一致している項目が1なので一致率は7%である。従って、配列Bのデータを一つシフトする。これを模式的に示すのが図20である。
図20の場合には、13のデータのうち一致している項目が0なので一致率は0%であることから、配列Bのデータを一つシフトする。この状態を示すのが図21である。
図21の場合には、12のデータのうち一致している項目が11なので一致率は92%であることから、所定値以上である(閾値が80%として設定されていた場合)。つまり、図21の状態において、配列Aと配列Bとで比較した各項目は(ほぼ)一致するデータの並び方であることから、ここに周期性があると考えられる。
以上のようにして規則性判定部33は、規則性を判定しても良い。また第五の判定方法の場合と同様に、データ数がきわめて多い場合、配列Bのすべてのデータと比較すると処理時間を要する場合がある。そのため配列Bのうちの一部のデータとそれに対応する配列Aとを比較するようにしても良い。
更に認識の結果、不明を示すコードと比較する場合には、その項目は一致した項目としてカウントする、あるいは比較を行わなくても良い。また上述の第六の判定方法において、すべてのデータをシフトしても一致率を充足しなかった場合には周期性がないと判定する。
以上のように、第一の判定方法乃至第六の判定方法のいずれか一以上を用いて、規則性判定部33は、個人情報判定部32で個人情報として判定した各文字情報について、あるいは文字情報抽出部31で抽出した各文字情報について、周期性を判定する。
ファイル判定部34は、規則性判定部33において、処理対象となったファイルについて周期性があると判定すると、そのファイルは個人情報ファイルであると判定する。また規則性判定部33において、周期性がないと判定する、あるいは周期性があると判定できなかった場合には、そのファイルは個人情報ファイルではないと判定する。
制御処理部4は、個人情報ファイル判定部3において、処理対象となったファイルが個人情報ファイルであると判定すると、当該ファイルに対して所定の制御処理を実行する。例えば当該ファイルに対して、個人情報ファイルであることを示すフラグを付したり、当該ファイルを個人情報ファイルを記録している所定のデータベースやサーバに登録させるなどの処理がある。また当該ファイルに対するセキュリティレベルを高いレベルに設定するなどのセキュリティに対する処理を行っても良い。
次に本発明の個人情報ファイル判定システム1を用いた処理プロセスの一例を、図3のフローチャートを用いて説明する。なおここで処理対象とするファイルとして図22及び図23のファイルの場合を説明する。なお図22は名簿ファイルの一例、図23は文書ファイルの一例である。
図22及び図23のファイルはファイル記憶部2に記憶されている。そのためまず個人情報ファイル判定部3は、ファイル記憶部2から処理対象とする図22の名簿ファイルを抽出し(S100)、文字情報抽出部31がそのファイルから文字情報を抽出する(S110)。
そうすると、「○山○男」「○○市○○町1−1−1」「012−3456−7890」「●本●蔵」「●●市●●町2−2−2」「098−7654−3210」「□川□子」「□□市□□町3−3−3」「111−1111−1111」を文字情報として抽出できる。なお区切り記号として、空白、句読点、改行を使用した場合を示している。
個人情報判定部32は、文字情報抽出部31で抽出した各文字情報に対して、その文字情報が個人情報であるかを判定し、その個人情報がどの項目の個人情報であるのかを判定する(S120)。そうすると、「○山○男」は「名前」、「○○市○○町1−1−1」は「住所」、「012−3456−7890」は「電話番号」、「●本●蔵」は「名前」、「●●市●●町2−2−2」は「住所」、「098−7654−3210」は「電話番号」、「□川□子」は名前、「□□市□□町3−3−3」は「住所」、「111−1111−1111」は「電話番号」のように判定する。
このように文字情報抽出部31で抽出した文字情報について個人情報であるかを判定したのち、規則性判定部33が、それらの文字情報(個人情報として判定した文字情報)が、周期性を備えて含まれているかを、上述の第一の判定方法乃至第六の判定方法のいずれか一以上により判定する(S130)。
そうするとこれらは周期性を備えていると判定できるので、ファイル判定部34は、図22の名簿ファイルは個人情報ファイルであると判定する(S140)。これを模式的に示すのが図24である。そうすると制御処理部4は、ファイル判定部34において図22の名簿ファイルが個人情報ファイルであると判定したので(S150)、制御処理部4が、当該ファイルに対して所定の制御処理を実行する(S160)。
例えば図22の名簿ファイルに対して、個人情報ファイルであることを示すフラグを付したり、その名簿ファイルを個人情報ファイルを記録している所定のデータベースやサーバに登録させる(このデータベースやサーバには、高いセキュリティ処理が施されており、その操作ログなどが常に記録されていることが好ましい)。あるいは、図22の名簿ファイルのセキュリティ設定を高いレベル、例えば「コピー不可」、「印刷不可」、「添付不可」に変更するなどの処理をしても良い。また、判定した規則性(周期性など)を表示装置22で表示させるように処理しても良い。
一方、個人情報ファイル判定部3は、次に、ファイル記憶部2に記憶する図23の文書ファイルを抽出し(S100)、文字情報抽出部31がそのファイルから文字情報を抽出する(S110)。
そうすると、「○山○男」「様」「本件につきまして不明点等がありましたら、」「以下までご連絡ください。」「●本●蔵」「098−7654−3210」「●●市●●町2−2−2」を文字情報として抽出できる。
個人情報判定部32は、文字情報抽出部31で抽出した各文字情報に対して、その文字情報が個人情報であるかを判定し、その個人情報がどの項目の個人情報であるのかを判定する(S120)。そうすると、「○山○男」は「名前」、「様」は「不明(文字)」、「本件につきまして不明点等がありましたら、」は「不明(文字)」、「以下までご連絡ください。」は「不明(文字)」、「●本●蔵」は「名前」、「098−7654−3210」は「電話番号」、「●●市●●町2−2−2」は「住所」のように判定する。
このように文字情報抽出部31で抽出した文字情報について個人情報であるかを判定したのち、規則性判定部33が、それらの文字情報(個人情報として判定した文字情報)が、周期性を備えて含まれているかを、上述の第一の判定方法乃至第六の判定方法のいずれか一以上により判定する(S130)。
そうするとこれらは周期性を備えていないと判定できるので、ファイル判定部34は、図23の名簿ファイルは個人情報ファイルではないと判定する(S140)。これを模式的に示すのが図25である。そうすると制御処理部4は、ファイル判定部34において図23の文書ファイルが個人情報ファイルではないと判定したので(S150)、当該ファイルに対して所定の制御処理を実行しない。
なお上述では制御処理部4は個人情報ファイルと判定した場合に所定の制御処理を実行する場合を説明したが、個人情報ファイルではないと判定した場合に、個人情報ファイルであると判定した場合とは異なる制御処理、例えば個人情報ファイルではないことを示すフラグを付す、などを実行するように構成しても良い。
図22及び図23のファイルの場合、従来の個人情報の判定システムでは、いずれもそのファイルの内容に、名前、住所、電話番号などの情報を含んでいることから、個人情報ファイルであると判定してしまう。しかし本願発明の場合、図22の場合には個人情報ファイルであると判定するが、図23の場合には個人情報の並び方に周期性が存在しないため、個人情報ファイルではないと判定できる。このように本願発明では、名簿や顧客情報などのような個人情報が大量に含まれており、それが周期性を備えて含まれているファイルのみを個人情報ファイルとして判定することが出来る。そして現実的にも、実際に保護されるべきファイルは、このような大量の個人情報を含むファイルであり、実際の運用としても非常に有益なシステムとなる。
なお上述の実施例では規則性の一例として周期性を判定したが、それ以外の規則性であっても良い。つまり周期性がなくても、一定の規則性に従って個人情報がファイルに含まれている場合には、そのファイルを個人情報ファイルと判定することも出来る。
上述の実施例では、ファイルから文字情報を抽出して、その文字情報が個人情報であるかを判定して、更に規則性を有するかを判定する構成としていたが、ファイルに含まれる情報としては文字情報のほかにも、顔画像などのバイオメトリクス情報(生体情報)であっても良い。この場合、ファイルから、ファイルに含まれている画像情報を抽出し、その画像情報が顔画像であるかを判定する。この画像情報が顔画像であるかは、画像情報から特徴点(顔の各部位の特徴とする点など)を抽出し、その特徴点が顔画像の特徴点と一致するかを判定することにより、顔画像であるか否かの判定が可能である。そして顔画像であると判定した画像情報に対して、更に規則性を有するかを判定する処理(実施例1の処理)を実行することにより、個人情報ファイルであるかの判定処理を行うこともできる。
また画像情報と文字情報とが一つのファイルに含まれており、画像情報については顔画像(個人情報としての顔画像)であるかの判定処理、文字情報については個人情報であるかの判定処理を実行しても良い。この場合、顔画像情報として判定した画像情報、個人情報であると判定した文字情報について、規則性を有するかの判定処理(実施例1の処理)を実行することで、個人情報ファイルであるかの判定処理を行うこともできる。
なおバイオメトリクス情報としては、顔画像のほかに、指紋情報、掌紋情報、声紋情報、虹彩情報、静脈のパターン情報などいかなる情報であっても上記と同様の処理を実施することができるが、顔画像情報の場合には、誰でもが容易に視認することで認識することが可能なきわめて重要な情報であるので、特に顕著な技術的効果を発揮する。
上述の各実施例では一台のコンピュータ端末において個人情報ファイル判定システム1の処理が実行される場合を説明したが、これらの機能が複数のコンピュータ端末やサーバに分散していても良い。例えばファイル記憶部2はファイルサーバに備えられており、個人情報ファイル判定部3、制御処理部4が所定の管理サーバに備えられていても良い。
各機能の分散配置のバリエーションには様々なパターンがあり、如何なる配置形態であっても良い。分散配置の場合、コンピュータ端末における処理の際に、ほかのコンピュータ端末やサーバの各機能を利用する場合にはその問い合わせを当該ほかのコンピュータ端末やサーバに対して行い、その結果を当該コンピュータ端末における処理に用いる。そしてその処理結果をコンピュータ端末で実行することとなる。
本発明の個人情報ファイル判定システム1によって、個人情報を大量に含み、名簿や顧客情報などの個人情報ファイルだけを、コンピュータ端末に記憶するファイルから特定することが可能となる。一般的に、名簿や顧客情報として使用されるファイルには、氏名、住所、電話番号など、様々な種別のデータが含まれている。そのような場合、本発明の個人情報ファイル判定システム1を用いることによって、従来よりも精度良く、個人情報のファイルとして判定することができる。
本発明のシステム構成の一例の概念図である。 コンピュータ端末のハードウェア構成の一例の概念図である。 本発明の処理プロセスの一例を示すフローチャートである。 個人情報ファイルの一例を模式的に示す図である。 周期性の判定方法の一例を模式的に示す図である。 判定した個人情報について、項目ごとにコード化したことを模式的に示す図である。 第四の周期性の判定方法における処理を示す図である。 図7からデータをシフトした状態を模式的に示す図である。 図8からデータをシフトした状態を模式的に示す図である。 図9からデータをシフトした状態を模式的に示す図である。 周期性を判定した状態を模式的に示す図である。 判定した個人情報について、項目ごとにコード化したことを模式的に示す図である。 第五の周期性の判定方法における処理を示す図である。 図13からデータをシフトした状態を模式的に示す図である。 図14からデータをシフトした状態を模式的に示す図である。 図15からデータをシフトした状態を模式的に示す図である。 判定した個人情報について、項目ごとにコード化したことを模式的に示す図である。 第六の周期性の判定方法における処理を示す図である。 図18からデータをシフトした状態を模式的に示す図である。 図19からデータをシフトした状態を模式的に示す図である。 図20からデータをシフトした状態を模式的に示す図である。 名簿ファイルの一例である。 文書ファイルの一例である。 名簿ファイルに対して個人情報ファイルであるかの判定処理を実行した場合を模式的に示す図である。 文書ファイルに対して個人情報ファイルであるかの判定処理を実行した場合を模式的に示す図である。 第三の周期性の判定方法における処理を示す図である。
符号の説明
1:個人情報ファイル判定システム
2:ファイル記憶部
3:個人情報ファイル判定部
31:文字情報抽出部
32:個人情報判定部
33:規則性判定部
34:ファイル判定部
4:制御処理部
20:演算装置
21:記憶装置
22:表示装置
23:入力装置
24:通信装置

Claims (2)

  1. ファイルが個人情報ファイルであるかを判定する個人情報ファイル判定システムであって、
    前記個人情報ファイル判定システムは、
    処理対象となった表形式のファイルから、行方向及び列方向に配列された文字情報を抽出する文字情報抽出部と、
    前記抽出した各文字情報について、予め定められた文字列の配列条件を備えるかを判定することにより前記抽出した文字情報のうち個人情報である文字情報を判定し、個人情報であると判定した文字情報がどの項目の個人情報に該当するかを判定する個人情報判定部と、
    前記個人情報判定を行った、前記表形式の行方向及び列方向に配列された各文字情報に対して、同一の列方向の各個人情報の項目のうち、同一種類の項目の個人情報が一定割合以上含まれているかを、少なくとも二以上の列について判定することにより、その配列に規則性を有するかを判定する規則性判定部と、
    前記規則性判定部において前記個人情報であると判定した各文字情報の配列が規則性を有すると判定した場合に、前記処理対象となったファイルを個人情報ファイルとして判定するファイル判定部と、
    前記ファイル判定部における判定結果に基づいて制御処理を実行する制御処理部と、を有することを特徴とする個人情報ファイル判定システム。
  2. コンピュータ端末を、
    所定の記憶領域に記憶されている、処理対象となった表形式のファイルから、行方向及び列方向に配列された文字情報を抽出する文字情報抽出部、
    前記抽出した各文字情報について、予め定められた文字列の配列条件を備えるかを判定することにより前記抽出した文字情報のうち個人情報である文字情報を判定し、個人情報であると判定した文字情報がどの項目の個人情報に該当するかを判定する個人情報判定部、
    前記個人情報判定を行った、前記表形式の行方向及び列方向に配列された各文字情報に対して、同一の列方向の各個人情報の項目のうち、同一種類の項目の個人情報が一定割合以上含まれているかを、少なくとも二以上の列について判定することにより、その配列に規則性を有するかを判定する規則性判定部、
    前記規則性判定部において前記個人情報であると判定した各文字情報の配列が規則性を有すると判定した場合に、前記処理対象となったファイルを個人情報ファイルとして判定するファイル判定部、
    前記ファイル判定部における判定結果に基づいて制御処理を実行する制御処理部、
    として機能させることを特徴とする個人情報ファイル判定プログラム。
JP2008042017A 2008-02-22 2008-02-22 個人情報ファイル判定システム Active JP4272690B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008042017A JP4272690B1 (ja) 2008-02-22 2008-02-22 個人情報ファイル判定システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008042017A JP4272690B1 (ja) 2008-02-22 2008-02-22 個人情報ファイル判定システム

Publications (2)

Publication Number Publication Date
JP4272690B1 true JP4272690B1 (ja) 2009-06-03
JP2009199461A JP2009199461A (ja) 2009-09-03

Family

ID=40821521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008042017A Active JP4272690B1 (ja) 2008-02-22 2008-02-22 個人情報ファイル判定システム

Country Status (1)

Country Link
JP (1) JP4272690B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023096649A (ja) * 2021-12-27 2023-07-07 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6633009B2 (ja) * 2017-02-01 2020-01-22 日本電信電話株式会社 表データ分析プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023096649A (ja) * 2021-12-27 2023-07-07 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム
JP7428917B2 (ja) 2021-12-27 2024-02-07 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム

Also Published As

Publication number Publication date
JP2009199461A (ja) 2009-09-03

Similar Documents

Publication Publication Date Title
US7584188B2 (en) System and method for searching and matching data having ideogrammatic content
US9025890B2 (en) Information classification device, information classification method, and information classification program
KR101511656B1 (ko) 퍼스널 아이덴티티를 기술하는 데이터에 대한 액셔너블 속성의 애스클라이빙
CN111931489B (zh) 文本纠错方法、装置和设备
US11520835B2 (en) Learning system, learning method, and program
US9824139B2 (en) Method of searching for integrated multilingual consonant pattern, method of creating character input unit for inputting consonants, and apparatus for the same
CN108280197A (zh) 一种识别同源二进制文件的方法及系统
JP2013114287A (ja) 文字列変換装置、文字列変換方法及び文字列変換プログラム
JP4272690B1 (ja) 個人情報ファイル判定システム
CN106997320A (zh) 代码评审过程中的代码显示方法和装置
CN110580301A (zh) 一种高效商标检索方法、系统及平台
JP6677093B2 (ja) 表データ検索装置、表データ検索方法、及び表データ検索プログラム
JP4807364B2 (ja) 情報管理装置
CN116485512A (zh) 基于强化学习的银行数据分析方法及系统
Howard et al. Phonetic spelling algorithm implementations for R
CN112149402B (zh) 文档对比方法、装置、电子设备和计算机可读存储介质
CN115690821A (zh) 一种电子卷宗智能编目方法和计算机设备
EP3662393A1 (en) Automated reporting system
JP5513953B2 (ja) テスト用マスキングデータ生成装置及びプログラム
JP5550959B2 (ja) 文書処理システム、及びプログラム
JP2017123062A (ja) 関係情報生成方法、装置、及びプログラム
JP6250307B2 (ja) 画像情報処理装置及び画像情報処理方法
JPWO2020240820A1 (ja) ファイル管理装置、ファイル管理方法、及びプログラム
JP4922030B2 (ja) 文字列検索装置、方法及びプログラム
JP7428917B2 (ja) 情報処理装置、情報処理方法、プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090227

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4272690

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130306

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130306

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130306

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140306

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250