JP4751855B2 - Data file detection device and program - Google Patents

Data file detection device and program Download PDF

Info

Publication number
JP4751855B2
JP4751855B2 JP2007155388A JP2007155388A JP4751855B2 JP 4751855 B2 JP4751855 B2 JP 4751855B2 JP 2007155388 A JP2007155388 A JP 2007155388A JP 2007155388 A JP2007155388 A JP 2007155388A JP 4751855 B2 JP4751855 B2 JP 4751855B2
Authority
JP
Japan
Prior art keywords
file
detection
detection target
configuration information
data file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007155388A
Other languages
Japanese (ja)
Other versions
JP2008310426A (en
Inventor
稔子 橋本
大祐 岩崎
光秀 福重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone East Corp
Original Assignee
Nippon Telegraph and Telephone East Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone East Corp filed Critical Nippon Telegraph and Telephone East Corp
Priority to JP2007155388A priority Critical patent/JP4751855B2/en
Publication of JP2008310426A publication Critical patent/JP2008310426A/en
Application granted granted Critical
Publication of JP4751855B2 publication Critical patent/JP4751855B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データファイル検出装置及びプログラムに関する。   The present invention relates to a data file detection device and a program.

特許文献1には、検査対象のテキストデータに個人情報が含まれているか否かを検査するデータ検査装置が記載されている。このデータ検査装置は、テキストデータ内に、キーワード(具体的には、苗字、住所、メールアドレス、資産情報、蔵書の情報、商品の情報、顧客情報、ペットの情報、技術情報、医療情報、書籍情報、音楽情報、経済情報、事件情報等)が所定数以上含まれていることをもって、個人情報を含んでいると判定する。
特開2006−23865号公報
Patent Document 1 describes a data inspection apparatus that inspects whether or not personal information is included in text data to be inspected. This data inspection device uses keywords (specifically, last name, address, email address, asset information, collection information, product information, customer information, pet information, technical information, medical information, books in text data. Information, music information, economic information, case information, etc.) is determined to contain personal information.
JP 2006-23865 A

しかしながら、上記技術には、検査対象のテキストデータの量によっては、検査時間が極めて長くなってしまうという問題があった。   However, the above technique has a problem that the inspection time becomes very long depending on the amount of text data to be inspected.

従って、本発明の課題は、検査対象のデータの量に関わらず検査の高速化を実現できるデータファイル検出装置及びプログラムを提供することにある。   Accordingly, an object of the present invention is to provide a data file detection apparatus and program capable of realizing high-speed inspection regardless of the amount of data to be inspected.

上記課題を解決するための本発明にかかるデータファイル検出装置は、検出対象となるデータファイルを構成するプロパティ、ファイル名、拡張子、ファイル本文を含む複数のファイル構成情報のうちから予め選択される複数の検出対象ファイル構成情報と、当該検出対象ファイル構成情報に含まれるプロパティ、ファイル名、拡張子のいずれかをファイル本文よりも前に検出処理の対象とすることを示す検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶手段と、前記検出対象ファイル構成情報記憶手段に記憶される検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定する検出処理を行い、前記検索順においてファイル本文よりも前に検出処理の対象とすることが示されたプロパティ、ファイル名、拡張子のいずれかにおいて検出対象キーワードが存在すると判定した場合、前記ファイル本文に対する検出処理を行う前に、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、前記検出順に従う当該データファイルの次の検出対象ファイル構成情報に前記検出対象キーワードが存在するかを繰り返し判定する検出手段と、を備えたことを特徴とする。 Data file detecting apparatus according to the present invention for solving the above problems, is pre-selected from among a plurality of files configuration information including property constituting the data file to be detected, the file name, extension, file text A plurality of detection target file configuration information and detection order information indicating that any of the property, file name, and extension included in the detection target file configuration information is to be detected before the file body. In accordance with the detection order stored in the detection target file configuration information storage means associated with the detection target file configuration information and the detection order stored in the detection target file configuration information storage means, the detection target file configuration information corresponding to the detection order of the data file to be detected, performs detection processing predetermined be detected keyword to determine whether there, you in the search order Te properties that have been shown to be subjected to detection processing before the file body, file name, if it is determined that the detected keyword is present in any of the extension, before performing detection processing for the file body, Detection means for repeatedly determining whether the detection target keyword exists in the next detection target file configuration information of the data file according to the detection order when the information on the data file to be determined is output and it is determined that the data file does not exist; , Provided.

また、本発明に係るプログラムは、検出対象となるデータファイルを構成するプロパティ、ファイル名、拡張子、ファイル本文を含む複数のファイル構成情報のうちから予め選択される複数の検出対象ファイル構成情報と、当該検出対象ファイル構成情報に含まれるプロパティ、ファイル名、拡張子のいずれかをファイル本文よりも前に検出処理の対象とすることを示す検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶手段、及び前記検出対象ファイル構成情報記憶手段に記憶される検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定する検出処理を行い、前記検索順においてファイル本文よりも前に検出処理の対象とすることが示されたプロパティ、ファイル名、拡張子のいずれかにおいて検出対象キーワードが存在すると判定した場合、前記ファイル本文に対する検出処理を行う前に、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、前記検出順に従う当該データファイルの次の検出対象ファイル構成情報に前記検出対象キーワードが存在するかを繰り返し判定する検出手段、としてコンピュータを機能させるためのプログラムである。 Further, the program according to the present invention, the properties constituting the data file to be detected, the file name, extension, and a plurality of detection target file configuration information previously selected from among a plurality of file configuration information including the file body , A detection target that is stored in advance in association with detection order information indicating that any of the property, file name, and extension included in the detection target file configuration information is to be detected before the file body In accordance with the detection order stored in the file configuration information storage unit and the detection target file configuration information storage unit, a predetermined detection target keyword exists in the detection target file configuration information corresponding to the detection order of the data file to be detected It performs detection processing for determining whether or not, detected before the file body in the search order Information properties was shown to sense the object, the file name, if it is determined that the detected keyword is present in any of the extension, before performing detection processing for the file body, relates data file determination target , And a program for causing a computer to function as detection means for repeatedly determining whether or not the detection target keyword exists in the next detection target file configuration information of the data file according to the detection order when it is determined that it does not exist It is.

本発明によれば、複数の検出対象ファイル構成情報について、順に検出対象キーワードが存在するか否かを判定し、存在すると判定した時点で、判定対象としたデータファイルに関する情報を出力しているので、この時点でそのデータファイルに関する処理を終了することができる。従って、検査対象のデータの量に関わらず検査の高速化を実現できる。   According to the present invention, for a plurality of detection target file configuration information, it is determined whether or not a detection target keyword exists in order, and at the time when it is determined that the detection target keyword exists, information on the data file to be determined is output. At this point, the processing relating to the data file can be terminated. Therefore, it is possible to realize high-speed inspection regardless of the amount of data to be inspected.

以下、本発明の実施形態について、図面を参照しながら説明する。図1は、本実施形態にかかるデータファイル検出装置10の機能ブロックを示す図である。データファイル検出装置10は企業内や家庭で使用されるパーソナルコンピュータであり、同図に示すように、ハードディスク等の、多数のデータファイルを記憶する記憶手段(ネットワークドライブにかかるものを含む)により構成される検出対象データファイル記憶部11と、検出部14によって実行されるプログラムを記憶する検出対象ファイル構成情報記憶部12(検出対象ファイル構成情報記憶手段)と、1又は複数のキーワードを格納するファイルを記憶するキーワード記憶部13と、検出対象ファイル構成情報記憶部12により記憶されるプログラムを読み出して実行する検出部14(検出手段)と、液晶ディスプレイ等の表示手段により構成される出力部15と、を備えている。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing functional blocks of a data file detection apparatus 10 according to the present embodiment. The data file detection device 10 is a personal computer used in a company or at home, and as shown in the figure, comprises a storage means (including those related to a network drive) for storing a large number of data files such as a hard disk. Detection target data file storage unit 11, detection target file configuration information storage unit 12 (detection target file configuration information storage unit) that stores a program executed by the detection unit 14, and a file that stores one or more keywords , A keyword storage unit 13 that stores information, a detection unit 14 (detection unit) that reads and executes a program stored in the detection target file configuration information storage unit 12, and an output unit 15 that includes a display unit such as a liquid crystal display. It is equipped with.

図2は、キーワード記憶部13が記憶するキーワードを格納したファイルの具体例である。同図は「関連会社」というタイトルのファイルであり、キーワードとして、多数の関連会社の名称が格納されている。このファイルに格納するキーワードを適宜変更することによって、会社情報(企業の取引先や関連企業に関する情報)や個人情報(個人の顧客や社員個人に関する情報)等、各種の情報を含むデータファイルを検出できるようになる。なお、図2では企業名をキーワードとしているが、サービス名や特定の拡張子をキーワードとして用いてもよい。   FIG. 2 is a specific example of a file storing keywords stored in the keyword storage unit 13. This figure is a file titled “Affiliated company”, and names of many affiliated companies are stored as keywords. By appropriately changing the keywords stored in this file, data files containing various types of information such as company information (information about business partners and related companies) and personal information (information about individual customers and employees) can be detected. become able to. Although the company name is a keyword in FIG. 2, a service name or a specific extension may be used as a keyword.

検出対象ファイル構成情報記憶部12が記憶するプログラムには、複数のファイル構成情報(プロパティ、ファイル名、拡張子、ファイル本文等、データファイルを構成する情報)から予め選択される複数の検出対象ファイル構成情報と、これら複数の検出対象ファイル構成情報の検出順の情報と、が組み込まれている。検出対象ファイル構成情報記憶部12は、このプログラムを記憶することによって、複数のファイル構成情報から予め選択される複数の検出対象ファイル構成情報と、複数の検出対象ファイル構成情報の検出順の情報とを対応付けて予め記憶する。   The program stored in the detection target file configuration information storage unit 12 includes a plurality of detection target files selected in advance from a plurality of file configuration information (information constituting a data file such as properties, file names, extensions, file texts, etc.) The configuration information and the detection order information of the plurality of detection target file configuration information are incorporated. The detection target file configuration information storage unit 12 stores the program, so that a plurality of detection target file configuration information selected in advance from the plurality of file configuration information, information on the detection order of the plurality of detection target file configuration information, and Are stored in advance in association with each other.

具体的なファイル構成情報として、ここでは、プロパティ、ファイル名、拡張子、ファイル本文の4つを用い、その検出順の情報として、プロパティ、ファイル名、拡張子、ファイル本文の順を示す情報を用いる。ファイル構成情報及び検出順の具体的内容はキーワードの種類によって適宜決定されるものであり、データファイルを確実に検出しつつ、検査速度ができるだけ高速になるよう決定される。例えば、キーワードが会社情報にかかるものである場合、プロパティにキーワードが含まれているデータファイルは会社情報を含むものである確立が極めて高く、また、プロパティ内のキーワードの検出は比較的高速に行えるので、まずプロパティ内のキーワードの検出から始めるようにすることが好適である。   As specific file configuration information, here, four properties, file name, extension, and file body are used, and information indicating the order of property, file name, extension, and file body is used as the detection order information. Use. The specific contents of the file configuration information and the detection order are appropriately determined according to the type of keyword, and are determined so that the inspection speed is as high as possible while reliably detecting the data file. For example, if the keyword is related to company information, it is highly likely that a data file that contains the keyword in the property will contain company information, and the keyword in the property can be detected relatively quickly. It is preferable to start by detecting a keyword in the property.

検出部14は、検出対象ファイル構成情報記憶部12により記憶されるプログラムを実行することにより、上記検出順に従って、データファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定し、存在すると判定した場合、出力部15に判定対象としたデータファイルに関する情報を出力させ、存在しないと判定した場合、上記検出順に従う当該データファイルの次の検出対象ファイル構成情報に上記検出対象キーワードが存在するかを繰り返し判定する処理を行う。   The detection unit 14 executes a program stored in the detection target file configuration information storage unit 12, thereby detecting predetermined detection target keywords in the detection target file configuration information corresponding to the detection order of the data file according to the detection order. If it is determined that the data file exists, the output unit 15 outputs information on the data file to be determined. If it is determined that the data file does not exist, the next detection of the data file according to the above detection order is performed. A process of repeatedly determining whether the detection target keyword exists in the target file configuration information is performed.

図3及び図4は、上記プログラムに従って動作する検出部14の処理フローを示す図である。以下、これらの図を参照しながら、高速なデータファイル検査を行うための図1に示すデータファイル検出装置10の動作の説明を行う。   3 and 4 are diagrams illustrating a processing flow of the detection unit 14 that operates according to the program. The operation of the data file detection apparatus 10 shown in FIG. 1 for performing high-speed data file inspection will be described below with reference to these drawings.

検出部14は、図示しない操作部におけるユーザ操作によって検査の開始が指示されると、検出処理を開始する。検出処理において、検出部14は、検出対象データファイル記憶部11に記憶されるデータファイルを1つずつ選択し、データファイルごとに、ステップS2からステップS18の処理を繰り返す(ステップS1及びS19)。   When the start of the inspection is instructed by a user operation on an operation unit (not shown), the detection unit 14 starts detection processing. In the detection process, the detection unit 14 selects one data file stored in the detection target data file storage unit 11 one by one, and repeats the process from step S2 to step S18 for each data file (steps S1 and S19).

検出部14は、データファイルを選択するとまず、検出対象ファイル構成情報としてプロパティを選択する(ステップS2)。次に、検出部14は、キーワード記憶部13に記憶されるキーワードを順次選択し、選択データファイルの検出対象ファイル構成情報(プロパティ)に選択したキーワードが含まれるか否かを判定していく(ステップS3〜S5)。その結果、検出対象ファイル構成情報(プロパティ)に選択したキーワードが含まれていれば、検出部14は、ステップS3〜S5のループ処理を抜け、処理をステップS18に移す。ステップS18では、検出部14は、選択データファイルに関する情報(ファイル名、ハードディスク中の存在場所を示す情報(フルパス)、更新年月日等)を表示出力する処理を出力部15に行わせ、次のデータファイルを選択する。すなわち、検出対象ファイル構成情報(プロパティ)に選択したキーワードが含まれていれば、検出部14は、その時点で選択データファイルにかかる検出処理を中止し、次のデータファイルにかかる検出処理を開始する。   When selecting the data file, the detecting unit 14 first selects a property as the detection target file configuration information (step S2). Next, the detection unit 14 sequentially selects keywords stored in the keyword storage unit 13 and determines whether or not the selected keyword is included in the detection target file configuration information (property) of the selected data file ( Steps S3 to S5). As a result, if the selected keyword is included in the detection target file configuration information (property), the detection unit 14 exits the loop process of steps S3 to S5, and moves the process to step S18. In step S18, the detection unit 14 causes the output unit 15 to display and output information on the selected data file (file name, information indicating the location in the hard disk (full path), update date, etc.), Select the data file. That is, if the selected keyword is included in the detection target file configuration information (property), the detection unit 14 stops the detection process for the selected data file at that time and starts the detection process for the next data file. To do.

検出対象ファイル構成情報(プロパティ)に選択したキーワードが含まれていなければ、検出部14は、次に検出対象ファイル構成情報としてファイル名を選択する(ステップS6)。その後のステップS7〜S9の処理は、ステップS3〜S5の処理と同様である。   If the selected keyword is not included in the detection target file configuration information (property), the detection unit 14 next selects a file name as the detection target file configuration information (step S6). Subsequent steps S7 to S9 are the same as steps S3 to S5.

検出対象ファイル構成情報(ファイル名)にも選択したキーワードが含まれていなければ、検出部14は、次に検出対象ファイル構成情報として拡張子を選択する(ステップS10)。その後のステップS11〜S13の処理は、ステップS3〜S5の処理と同様である。   If the selected keyword is not included in the detection target file configuration information (file name), the detection unit 14 next selects an extension as the detection target file configuration information (step S10). Subsequent steps S11 to S13 are the same as steps S3 to S5.

検出対象ファイル構成情報(拡張子)にも選択したキーワードが含まれていなければ、検出部14は、次に検出対象ファイル構成情報としてファイル本文を選択する(ステップS10)。その後のステップS15〜S17の処理は、ステップS3〜S5の処理と同様である。   If the selected keyword is not included in the detection target file configuration information (extension), the detection unit 14 next selects the file text as the detection target file configuration information (step S10). Subsequent steps S15 to S17 are the same as steps S3 to S5.

以上説明したように、データファイル検出装置10は、複数の検出対象ファイル構成情報について、順に検出対象キーワードが存在するか否かを判定し、存在すると判定した時点で、判定対象としたデータファイルに関する情報を出力し、しかも、この時点でそのデータファイルに関する処理を終了している。従って、単純な全文検索を行う場合に比べ、検査対象のデータファイルのデータ量が大きくても、高速に検査処理を完了させることができる。   As described above, the data file detection device 10 determines whether or not a detection target keyword exists in order for a plurality of detection target file configuration information, and relates to the data file to be determined when it is determined that it exists. The information is output, and the processing related to the data file is finished at this point. Therefore, compared with a case where a simple full-text search is performed, the inspection process can be completed at high speed even if the data amount of the data file to be inspected is large.

以上本発明の実施の形態について説明したが、本発明はこうした実施の形態に何等限定されるものではなく、本発明は、その要旨を逸脱しない範囲において、種々なる態様で実施され得ることは勿論である。
例えば、
Although the embodiments of the present invention have been described above, the present invention is not limited to these embodiments, and the present invention can of course be implemented in various forms without departing from the scope of the present invention. It is.
For example,

また、データファイル検出装置10の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、上記各処理を行ってもよい。
ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、この「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに、「コンピュータ読み取り可能な記録媒体」には、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
さらに、上記プログラムは、上述した各機能の一部を実現するためのものであってもよい。さらに、上述した各機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
Further, by recording a program for realizing the function of the data file detection device 10 on a computer-readable recording medium, and causing the computer system to read and execute the program recorded on the recording medium, each of the above processes May be performed.
Here, the “computer system” may include an OS and hardware such as peripheral devices. Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, etc. This is a storage device.
Furthermore, the “computer-readable recording medium” includes a volatile memory (for example, DRAM (DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Dynamic Random Access Memory)), etc., which hold programs for a certain period of time.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
Further, the program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve each function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.

本発明の実施の形態にかかるデータファイル検出装置の機能ブロックを示す図である。It is a figure which shows the functional block of the data file detection apparatus concerning embodiment of this invention. 本発明の実施の形態にかかるキーワード記憶部が記憶するキーワードを格納したファイルの具体例を示す図である。It is a figure which shows the specific example of the file which stored the keyword which the keyword memory | storage part concerning embodiment of this invention memorize | stores. 本発明の実施の形態にかかるプログラムに従って動作する検出部の処理フローを示す図である。It is a figure which shows the processing flow of the detection part which operate | moves according to the program concerning embodiment of this invention. 本発明の実施の形態にかかるプログラムに従って動作する検出部の処理フローを示す図である。It is a figure which shows the processing flow of the detection part which operate | moves according to the program concerning embodiment of this invention.

符号の説明Explanation of symbols

10 データファイル検出装置、11 検出対象データファイル記憶部、12 検出対象ファイル構成情報記憶部、13 キーワード記憶部、14 検出部、15 出力部。   DESCRIPTION OF SYMBOLS 10 Data file detection apparatus, 11 Detection target data file storage part, 12 Detection target file structure information storage part, 13 Keyword storage part, 14 Detection part, 15 Output part

Claims (2)

検出対象となるデータファイルを構成するプロパティ、ファイル名、拡張子、ファイル本文を含む複数のファイル構成情報のうちから予め選択される複数の検出対象ファイル構成情報と、当該検出対象ファイル構成情報に含まれるプロパティ、ファイル名、拡張子のいずれかをファイル本文よりも前に検出処理の対象とすることを示す検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶手段と、
前記検出対象ファイル構成情報記憶手段に記憶される検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定する検出処理を行い、前記検索順においてファイル本文よりも前に検出処理の対象とすることが示されたプロパティ、ファイル名、拡張子のいずれかにおいて検出対象キーワードが存在すると判定した場合、前記ファイル本文に対する検出処理を行う前に、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、前記検出順に従う当該データファイルの次の検出対象ファイル構成情報に前記検出対象キーワードが存在するかを繰り返し判定する検出手段と、
を備えたことを特徴とするデータファイル検出装置。
Includes property constituting the data file to be detected, the file name, extension, and a plurality of detection target file configuration information previously selected from among a plurality of file configuration information including the file body, in the detection target file structure information A detection target file configuration information storage unit that stores in advance in association with detection order information indicating that any one of the property, file name, and extension to be detected before the file body is detected ;
According to the detection order to be stored in the detection target file configuration information storage unit, the detection target file structure information in accordance with the detection order of the data file to be detected, to determine whether there is a detection target keyword is predetermined If it is determined that a detection target keyword exists in any of the property, file name, or extension that is indicated to be the target of the detection process before the file body in the search order after performing the detection process , the file body If the information about the data file to be determined is output before it is detected and it is determined that it does not exist, the detection target keyword exists in the next detection target file configuration information of the data file according to the detection order. Detecting means for repeatedly determining whether or not
A data file detection apparatus comprising:
検出対象となるデータファイルを構成するプロパティ、ファイル名、拡張子、ファイル本文を含む複数のファイル構成情報のうちから予め選択される複数の検出対象ファイル構成情報と、当該検出対象ファイル構成情報に含まれるプロパティ、ファイル名、拡張子のいずれかをファイル本文よりも前に検出処理の対象とすることを示す検出順の情報とを対応付けて予め記憶する検出対象ファイル構成情報記憶手段、及び
前記検出対象ファイル構成情報記憶手段に記憶される検出順に従って、検出対象とするデータファイルの当該検出順に応じた検出対象ファイル構成情報に、予め定められる検出対象キーワードが存在するか否かを判定する検出処理を行い、前記検索順においてファイル本文よりも前に検出処理の対象とすることが示されたプロパティ、ファイル名、拡張子のいずれかにおいて検出対象キーワードが存在すると判定した場合、前記ファイル本文に対する検出処理を行う前に、判定対象としたデータファイルに関する情報を出力し、存在しないと判定した場合、前記検出順に従う当該データファイルの次の検出対象ファイル構成情報に前記検出対象キーワードが存在するかを繰り返し判定する検出手段、
としてコンピュータを機能させるためのプログラム。
Includes property constituting the data file to be detected, the file name, extension, and a plurality of detection target file configuration information previously selected from among a plurality of file configuration information including the file body, in the detection target file structure information Detection target file configuration information storage means for previously storing in association with detection order information indicating that any of the property, file name, and extension to be detected is subject to detection processing before the file body , and the detection according to the detection order to be stored in the target file configuration information storage unit, the detection target file structure information in accordance with the detection order of the data file to be detected, the detection process where the target keyword is predetermined to determine whether there In the search order before the main text of the file. When it is determined that the detection target keyword exists in any of the property, file name, and extension, before the detection processing for the file body is performed, information on the data file to be determined is output and it is determined that it does not exist Detecting means for repeatedly determining whether the detection target keyword exists in the next detection target file configuration information of the data file according to the detection order;
As a program to make the computer function as.
JP2007155388A 2007-06-12 2007-06-12 Data file detection device and program Expired - Fee Related JP4751855B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007155388A JP4751855B2 (en) 2007-06-12 2007-06-12 Data file detection device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007155388A JP4751855B2 (en) 2007-06-12 2007-06-12 Data file detection device and program

Publications (2)

Publication Number Publication Date
JP2008310426A JP2008310426A (en) 2008-12-25
JP4751855B2 true JP4751855B2 (en) 2011-08-17

Family

ID=40237996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007155388A Expired - Fee Related JP4751855B2 (en) 2007-06-12 2007-06-12 Data file detection device and program

Country Status (1)

Country Link
JP (1) JP4751855B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62151923A (en) * 1985-12-25 1987-07-06 Casio Comput Co Ltd Data bank device
JPH07182291A (en) * 1993-12-22 1995-07-21 Casio Comput Co Ltd Data bank device
JP2004157628A (en) * 2002-11-05 2004-06-03 Mitsubishi Electric Corp Document search method, device and program
JP2007087224A (en) * 2005-09-22 2007-04-05 Toshiba Corp Organization management system, organization management method, and organization management program

Also Published As

Publication number Publication date
JP2008310426A (en) 2008-12-25

Similar Documents

Publication Publication Date Title
US8549434B2 (en) Method for graphical representation of a content collection
US10025799B2 (en) Access and presentation of files based on semantic proximity to current interests
US9141627B2 (en) Providing a user access to data files distributed in a plurality of different types of user devices
US20160142500A1 (en) Content suggestion for posting on communication network
US8572076B2 (en) Location context mining
JP2005092879A5 (en)
US20170169498A1 (en) Identifying recommended electronic books with detailed comparisons
KR20060041883A (en) Collapsible container with a semi-collapsed view
US20160342449A1 (en) Data exchange across multiple computing devices through a proactive intelligent clipboard
CN110851710A (en) Novel recommendation method and device
CN107728983A (en) Double screen operating method and equipment
KR101674249B1 (en) Context-based item bookmarking
JP2006285515A (en) E-mail destination input support program
US9201951B2 (en) System and method for providing search results
CN108170496A (en) For the method and device that the page is controlled to show
JP4751855B2 (en) Data file detection device and program
CN102129454A (en) Method and system for processing encyclopaedia data based on cloud storage
US9424256B2 (en) Method and apparatus for performing type-aware change tracking in a document
CN109117434A (en) Judgement document's search method, device, storage medium and processor
JP2018519592A (en) Automatic import and dependency in large source code repositories
CN109213541B (en) APP application display interface method and device and electronic equipment
JP5408129B2 (en) Service combination support apparatus, service combination support method, and program
JP6419525B2 (en) Visualization means selection support system, visualization means selection support method, and visualization means selection support program
JP2006338508A (en) Relevant content searching device and method
CN103902178B (en) A kind of multimedia file processing method and processing device based on android system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110523

R150 Certificate of patent or registration of utility model

Ref document number: 4751855

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees