JP2008310426A - データファイル検出装置及びプログラム - Google Patents

データファイル検出装置及びプログラム Download PDF

Info

Publication number
JP2008310426A
JP2008310426A JP2007155388A JP2007155388A JP2008310426A JP 2008310426 A JP2008310426 A JP 2008310426A JP 2007155388 A JP2007155388 A JP 2007155388A JP 2007155388 A JP2007155388 A JP 2007155388A JP 2008310426 A JP2008310426 A JP 2008310426A
Authority
JP
Japan
Prior art keywords
detection
configuration information
data file
detection target
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007155388A
Other languages
English (en)
Other versions
JP4751855B2 (ja
Inventor
Toshiko Hashimoto
稔子 橋本
Daisuke Iwasaki
大祐 岩崎
Mitsuhide Fukushige
光秀 福重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone East Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone East Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Nippon Telegraph and Telephone East Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007155388A priority Critical patent/JP4751855B2/ja
Publication of JP2008310426A publication Critical patent/JP2008310426A/ja
Application granted granted Critical
Publication of JP4751855B2 publication Critical patent/JP4751855B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検査対象のデータの量に関わらず検査の高速化を実現する。
【解決手段】データファイル検出装置10において、検出対象となるデータファイルを構成する複数のファイル構成情報から予め選択される複数の検出対象ファイル構成情報と、その検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶部12と、上記検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定し、存在すると判定した場合、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、上記検出順に従う当該データファイルの次の検出対象ファイル構成情報に検出対象キーワードが存在するかを繰り返し判定する検出部14と、を備える。
【選択図】図1

Description

本発明は、データファイル検出装置及びプログラムに関する。
特許文献1には、検査対象のテキストデータに個人情報が含まれているか否かを検査するデータ検査装置が記載されている。このデータ検査装置は、テキストデータ内に、キーワード(具体的には、苗字、住所、メールアドレス、資産情報、蔵書の情報、商品の情報、顧客情報、ペットの情報、技術情報、医療情報、書籍情報、音楽情報、経済情報、事件情報等)が所定数以上含まれていることをもって、個人情報を含んでいると判定する。
特開2006−23865号公報
しかしながら、上記技術には、検査対象のテキストデータの量によっては、検査時間が極めて長くなってしまうという問題があった。
従って、本発明の課題は、検査対象のデータの量に関わらず検査の高速化を実現できるデータファイル検出装置及びプログラムを提供することにある。
上記課題を解決するための本発明にかかるデータファイル検出装置は、検出対象となるデータファイルを構成する複数のファイル構成情報から予め選択される複数の検出対象ファイル構成情報と、前記複数の検出対象ファイル構成情報の検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶手段と、前記検出対象ファイル構成情報記憶手段に記憶される検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定し、存在すると判定した場合、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、前記検出順に従う当該データファイルの次の検出対象ファイル構成情報に前記検出対象キーワードが存在するかを繰り返し判定する検出手段と、を備えたことを特徴とする。
また、本発明にかかるプログラムは、検出対象となるデータファイルを構成する複数のファイル構成情報から予め選択される複数の検出対象ファイル構成情報と、前記複数の検出対象ファイル構成情報の検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶手段、及び前記検出対象ファイル構成情報記憶手段に記憶される検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定し、存在すると判定した場合、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、前記検出順に従う当該データファイルの次の検出対象ファイル構成情報に前記検出対象キーワードが存在するかを繰り返し判定する検出手段、としてコンピュータを機能させるためのプログラムである。
本発明によれば、複数の検出対象ファイル構成情報について、順に検出対象キーワードが存在するか否かを判定し、存在すると判定した時点で、判定対象としたデータファイルに関する情報を出力しているので、この時点でそのデータファイルに関する処理を終了することができる。従って、検査対象のデータの量に関わらず検査の高速化を実現できる。
以下、本発明の実施形態について、図面を参照しながら説明する。図1は、本実施形態にかかるデータファイル検出装置10の機能ブロックを示す図である。データファイル検出装置10は企業内や家庭で使用されるパーソナルコンピュータであり、同図に示すように、ハードディスク等の、多数のデータファイルを記憶する記憶手段(ネットワークドライブにかかるものを含む)により構成される検出対象データファイル記憶部11と、検出部14によって実行されるプログラムを記憶する検出対象ファイル構成情報記憶部12(検出対象ファイル構成情報記憶手段)と、1又は複数のキーワードを格納するファイルを記憶するキーワード記憶部13と、検出対象ファイル構成情報記憶部12により記憶されるプログラムを読み出して実行する検出部14(検出手段)と、液晶ディスプレイ等の表示手段により構成される出力部15と、を備えている。
図2は、キーワード記憶部13が記憶するキーワードを格納したファイルの具体例である。同図は「関連会社」というタイトルのファイルであり、キーワードとして、多数の関連会社の名称が格納されている。このファイルに格納するキーワードを適宜変更することによって、会社情報(企業の取引先や関連企業に関する情報)や個人情報(個人の顧客や社員個人に関する情報)等、各種の情報を含むデータファイルを検出できるようになる。なお、図2では企業名をキーワードとしているが、サービス名や特定の拡張子をキーワードとして用いてもよい。
検出対象ファイル構成情報記憶部12が記憶するプログラムには、複数のファイル構成情報(プロパティ、ファイル名、拡張子、ファイル本文等、データファイルを構成する情報)から予め選択される複数の検出対象ファイル構成情報と、これら複数の検出対象ファイル構成情報の検出順の情報と、が組み込まれている。検出対象ファイル構成情報記憶部12は、このプログラムを記憶することによって、複数のファイル構成情報から予め選択される複数の検出対象ファイル構成情報と、複数の検出対象ファイル構成情報の検出順の情報とを対応付けて予め記憶する。
具体的なファイル構成情報として、ここでは、プロパティ、ファイル名、拡張子、ファイル本文の4つを用い、その検出順の情報として、プロパティ、ファイル名、拡張子、ファイル本文の順を示す情報を用いる。ファイル構成情報及び検出順の具体的内容はキーワードの種類によって適宜決定されるものであり、データファイルを確実に検出しつつ、検査速度ができるだけ高速になるよう決定される。例えば、キーワードが会社情報にかかるものである場合、プロパティにキーワードが含まれているデータファイルは会社情報を含むものである確立が極めて高く、また、プロパティ内のキーワードの検出は比較的高速に行えるので、まずプロパティ内のキーワードの検出から始めるようにすることが好適である。
検出部14は、検出対象ファイル構成情報記憶部12により記憶されるプログラムを実行することにより、上記検出順に従って、データファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定し、存在すると判定した場合、出力部15に判定対象としたデータファイルに関する情報を出力させ、存在しないと判定した場合、上記検出順に従う当該データファイルの次の検出対象ファイル構成情報に上記検出対象キーワードが存在するかを繰り返し判定する処理を行う。
図3及び図4は、上記プログラムに従って動作する検出部14の処理フローを示す図である。以下、これらの図を参照しながら、高速なデータファイル検査を行うための図1に示すデータファイル検出装置10の動作の説明を行う。
検出部14は、図示しない操作部におけるユーザ操作によって検査の開始が指示されると、検出処理を開始する。検出処理において、検出部14は、検出対象データファイル記憶部11に記憶されるデータファイルを1つずつ選択し、データファイルごとに、ステップS2からステップS18の処理を繰り返す(ステップS1及びS19)。
検出部14は、データファイルを選択するとまず、検出対象ファイル構成情報としてプロパティを選択する(ステップS2)。次に、検出部14は、キーワード記憶部13に記憶されるキーワードを順次選択し、選択データファイルの検出対象ファイル構成情報(プロパティ)に選択したキーワードが含まれるか否かを判定していく(ステップS3〜S5)。その結果、検出対象ファイル構成情報(プロパティ)に選択したキーワードが含まれていれば、検出部14は、ステップS3〜S5のループ処理を抜け、処理をステップS18に移す。ステップS18では、検出部14は、選択データファイルに関する情報(ファイル名、ハードディスク中の存在場所を示す情報(フルパス)、更新年月日等)を表示出力する処理を出力部15に行わせ、次のデータファイルを選択する。すなわち、検出対象ファイル構成情報(プロパティ)に選択したキーワードが含まれていれば、検出部14は、その時点で選択データファイルにかかる検出処理を中止し、次のデータファイルにかかる検出処理を開始する。
検出対象ファイル構成情報(プロパティ)に選択したキーワードが含まれていなければ、検出部14は、次に検出対象ファイル構成情報としてファイル名を選択する(ステップS6)。その後のステップS7〜S9の処理は、ステップS3〜S5の処理と同様である。
検出対象ファイル構成情報(ファイル名)にも選択したキーワードが含まれていなければ、検出部14は、次に検出対象ファイル構成情報として拡張子を選択する(ステップS10)。その後のステップS11〜S13の処理は、ステップS3〜S5の処理と同様である。
検出対象ファイル構成情報(拡張子)にも選択したキーワードが含まれていなければ、検出部14は、次に検出対象ファイル構成情報としてファイル本文を選択する(ステップS10)。その後のステップS15〜S17の処理は、ステップS3〜S5の処理と同様である。
以上説明したように、データファイル検出装置10は、複数の検出対象ファイル構成情報について、順に検出対象キーワードが存在するか否かを判定し、存在すると判定した時点で、判定対象としたデータファイルに関する情報を出力し、しかも、この時点でそのデータファイルに関する処理を終了している。従って、単純な全文検索を行う場合に比べ、検査対象のデータファイルのデータ量が大きくても、高速に検査処理を完了させることができる。
以上本発明の実施の形態について説明したが、本発明はこうした実施の形態に何等限定されるものではなく、本発明は、その要旨を逸脱しない範囲において、種々なる態様で実施され得ることは勿論である。
例えば、
また、データファイル検出装置10の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、上記各処理を行ってもよい。
ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、この「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに、「コンピュータ読み取り可能な記録媒体」には、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
さらに、上記プログラムは、上述した各機能の一部を実現するためのものであってもよい。さらに、上述した各機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
本発明の実施の形態にかかるデータファイル検出装置の機能ブロックを示す図である。 本発明の実施の形態にかかるキーワード記憶部が記憶するキーワードを格納したファイルの具体例を示す図である。 本発明の実施の形態にかかるプログラムに従って動作する検出部の処理フローを示す図である。 本発明の実施の形態にかかるプログラムに従って動作する検出部の処理フローを示す図である。
符号の説明
10 データファイル検出装置、11 検出対象データファイル記憶部、12 検出対象ファイル構成情報記憶部、13 キーワード記憶部、14 検出部、15 出力部。

Claims (2)

  1. 検出対象となるデータファイルを構成する複数のファイル構成情報から予め選択される複数の検出対象ファイル構成情報と、前記複数の検出対象ファイル構成情報の検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶手段と、
    前記検出対象ファイル構成情報記憶手段に記憶される検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定し、存在すると判定した場合、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、前記検出順に従う当該データファイルの次の検出対象ファイル構成情報に前記検出対象キーワードが存在するかを繰り返し判定する検出手段と、
    を備えたことを特徴とするデータファイル検出装置。
  2. 検出対象となるデータファイルを構成する複数のファイル構成情報から予め選択される複数の検出対象ファイル構成情報と、前記複数の検出対象ファイル構成情報の検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶手段、及び
    前記検出対象ファイル構成情報記憶手段に記憶される検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定し、存在すると判定した場合、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、前記検出順に従う当該データファイルの次の検出対象ファイル構成情報に前記検出対象キーワードが存在するかを繰り返し判定する検出手段、
    としてコンピュータを機能させるためのプログラム。
JP2007155388A 2007-06-12 2007-06-12 データファイル検出装置及びプログラム Expired - Fee Related JP4751855B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007155388A JP4751855B2 (ja) 2007-06-12 2007-06-12 データファイル検出装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007155388A JP4751855B2 (ja) 2007-06-12 2007-06-12 データファイル検出装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2008310426A true JP2008310426A (ja) 2008-12-25
JP4751855B2 JP4751855B2 (ja) 2011-08-17

Family

ID=40237996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007155388A Expired - Fee Related JP4751855B2 (ja) 2007-06-12 2007-06-12 データファイル検出装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4751855B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62151923A (ja) * 1985-12-25 1987-07-06 Casio Comput Co Ltd デ−タバンク装置
JPH07182291A (ja) * 1993-12-22 1995-07-21 Casio Comput Co Ltd データバンク装置
JP2004157628A (ja) * 2002-11-05 2004-06-03 Mitsubishi Electric Corp 文書検索方法及びその装置及びそのプログラム
JP2007087224A (ja) * 2005-09-22 2007-04-05 Toshiba Corp 構成管理システム、構成管理方法及び構成管理プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62151923A (ja) * 1985-12-25 1987-07-06 Casio Comput Co Ltd デ−タバンク装置
JPH07182291A (ja) * 1993-12-22 1995-07-21 Casio Comput Co Ltd データバンク装置
JP2004157628A (ja) * 2002-11-05 2004-06-03 Mitsubishi Electric Corp 文書検索方法及びその装置及びそのプログラム
JP2007087224A (ja) * 2005-09-22 2007-04-05 Toshiba Corp 構成管理システム、構成管理方法及び構成管理プログラム

Also Published As

Publication number Publication date
JP4751855B2 (ja) 2011-08-17

Similar Documents

Publication Publication Date Title
US9954964B2 (en) Content suggestion for posting on communication network
US8549434B2 (en) Method for graphical representation of a content collection
US9652118B2 (en) System and method for generating a color palette based on audio content
US7921375B2 (en) Integrating user interfaces from one application into another
US10025799B2 (en) Access and presentation of files based on semantic proximity to current interests
US9141627B2 (en) Providing a user access to data files distributed in a plurality of different types of user devices
KR101143048B1 (ko) 반-축소된 뷰를 갖는 축소가능 컨테이너
TWI416404B (zh) 使用時序關聯中繼資料與媒體物件
WO2016091095A1 (zh) 基于终端界面触控操作进行搜索的方法及系统
JP2004030526A (ja) 検索結果ランキング変更処理プログラム、検索結果ランキング変更処理プログラム記録媒体、およびコンテンツ検索処理方法
JP2005092879A5 (ja)
US20160342449A1 (en) Data exchange across multiple computing devices through a proactive intelligent clipboard
CN110851710A (zh) 一种小说推荐方法及设备
US20160321268A1 (en) Entity-driven logic for improved name-searching in mixed-entity lists
KR101674249B1 (ko) 컨텍스트-기반 아이템 북마킹
CN106354841B (zh) 推荐算法的测试方法及装置
JP2006285515A (ja) 電子メール宛先入力支援プログラム
US10762096B2 (en) Method for providing mail search result including at least one mail card, and mail service system for performing same
US9201951B2 (en) System and method for providing search results
US20180024999A1 (en) Knowledge Object And Collaboration Management System
JP4751855B2 (ja) データファイル検出装置及びプログラム
JP2018519592A (ja) 大規模ソースコードリポジトリにおける自動インポートおよびディペンデンシー
US10445416B2 (en) Digital note manipulation
JP2020123321A (ja) クリップボードデータに基づく検索処理方法および装置
CN108170496A (zh) 用于控制页面显示的方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110523

R150 Certificate of patent or registration of utility model

Ref document number: 4751855

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees