JP2018169981A - 情報処理装置、情報処理方法及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP2018169981A
JP2018169981A JP2017069251A JP2017069251A JP2018169981A JP 2018169981 A JP2018169981 A JP 2018169981A JP 2017069251 A JP2017069251 A JP 2017069251A JP 2017069251 A JP2017069251 A JP 2017069251A JP 2018169981 A JP2018169981 A JP 2018169981A
Authority
JP
Japan
Prior art keywords
file
keyword
file system
write
system area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017069251A
Other languages
English (en)
Other versions
JP6809338B2 (ja
Inventor
貴之 福谷
Takayuki Fukutani
貴之 福谷
山本 雅洋
Masahiro Yamamoto
雅洋 山本
禎秀 尾芦
Sadahide Biashi
禎秀 尾芦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2017069251A priority Critical patent/JP6809338B2/ja
Publication of JP2018169981A publication Critical patent/JP2018169981A/ja
Application granted granted Critical
Publication of JP6809338B2 publication Critical patent/JP6809338B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ファイル検索に要する時間を短縮する。
【解決手段】記憶媒体は、複数のファイルを複数のファイルシステム領域に区分して記憶する。記憶媒体へのファイルの書き込みの際に、書き込みファイルからキーワードを抽出し、抽出キーワードに対応するファイルシステム領域を書き込みファイルの書き込み先に決定する。キーワード検索の際に、検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルをキャッシュメモリに読み出し、キャッシュメモリに読み出されたファイルの中から検索キーワードを含むファイルを特定する。
【選択図】図1

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。特に、キーワード検索機能を備えた情報処理装置、情報処理方法及び情報処理プログラムに関する。
例えば、同一キーワードを有するなどの関連性を有する複数の文書ファイルを関連付けて格納するData Aware型文書データベースが存在する(特許文献1〜3)。また、ユーザが入力した検索キーワードを含む文書ファイルをこのような文書データベースから検索する技術も存在する(特許文献4)。
特許第6002832号公報 特開2009−277147号公報 特開2005−339156号公報 特開2003−178055号公報
以下の分析は、本発明の観点からなされたものである。なお、上記先行技術文献の各開示を、本書に引用をもって繰り込むものとする。
特許文献1、2に開示の技術には、ファイル検索に長時間を要するという問題点がある。
すなわち、特許文献1の文書データベースでは、例えば、関連文書ファイルに同一タグを付して、一次記憶媒体に格納する。ここで、一次記憶媒体は、通常、領域単位でデータを管理しており、1つの領域には複数の文書ファイルが格納される。そして、特許文献2の検索技術では、検索キーワードに対応するタグを特定し、特定したタグを付された文書ファイルを含む領域を一次記憶媒体からキャッシュメモリに読み出している。
ここで、一次記憶媒体からキャッシュメモリへ読み出される領域には、検索キーワードとは無関係の文書ファイルも含まれる。そのため、特許文献1、2に開示の技術では、検索キーワードと無関係の文書ファイルのデータ移行によってファイル検索に遅延が生じる。
そこで、本発明では、短時間でのファイル検索が可能な情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
本発明の第1の視点によれば、複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体と、
前記記憶媒体に記憶されたファイルを一時的に保持するキャッシュメモリと、
前記ファイルシステム領域と、前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、
前記記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出部と、
前記キーワード抽出部によって抽出された抽出キーワードと、前記キーワード管理テーブルとを突き合わせて、前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込処理部と、
検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルを前記キャッシュメモリに読み出す読出処理部と、
前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定部と、
を含む情報処理装置が提供される。
本発明の第2の視点によれば、複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出ステップと、
前記ファイルシステム領域と前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、前記キーワード抽出ステップによって抽出された抽出キーワードとを突き合わせて前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込ステップと、
検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルをキャッシュメモリに読み出す読出ステップと、
前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定ステップと、
を含む情報処理方法が提供される。
本発明の第3の視点によれば、複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出処理と、
前記ファイルシステム領域と前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、前記キーワード抽出処理によって抽出された抽出キーワードとを突き合わせて前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込処理と、
検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルをキャッシュメモリに読み出す読出処理と、
前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定処理と、
をコンピュータに実行させるプログラムが提供される。
本発明の各視点によれば、短時間でのファイル検索が可能な情報処理装置、情報処理方法及び情報処理プログラムが提供される。
一実施形態の概要を説明するための図である。 一実施形態の概要を説明するための図である。 一実施形態の概要を説明するための図である。 情報処理装置10の構成の一例を示した図である。 キーワード管理テーブル220に記憶される情報を示す図である。 キーワードリスト230の一例を示す図である。 ファイルの書き込みの際の処理の流れを示すフローチャートである。 ファイル検索処理の流れを示すフローチャートである。
本発明のとり得る好適な実施形態について図面を参照して詳細に説明する。なお、以下の記載に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、本発明を図示の態様に限定することを意図するものではない。また、各図におけるブロック間の接続線は双方向及び単方向の双方を含み、図面の明瞭化を目的として適宜図示又は削除される。
図1に示すように、情報処理装置10は、複数の文書ファイルを複数のファイルシステム領域に区分して記憶する一次記憶媒体100を有し、例えば、複数の物理メモリの各々に個別のファイルシステム領域(FS#1〜n)が割り当てられる。なお、本願開示において、ファイルシステム領域とは、記憶媒体において特定のファイルシステムにより初期化された領域であり、所謂、論理ボリュームである。
また情報処理装置10は、キャッシュメモリ210と、キーワード管理テーブル220とを有する。キャッシュメモリ210は、一次記憶媒体100に記憶された文書ファイルを一時的に保持する二次記憶媒体であり、キーワード管理テーブル220は、ファイルシステム領域と、ファイルシステム領域に格納された文書ファイルにおけるキーワードを対応付けて管理するテーブルである。
また、情報処理装置10は、キーワード抽出部310と、書込処理部320と、読出処理部330と、ファイル特定部340とを有する。キーワード抽出部310は、一次記憶媒体100へのファイルの書き込みの際に、書き込みファイルからキーワードを抽出する。書込処理部320は、抽出キーワードと、キーワード管理テーブル220とを突き合わせて、抽出キーワードに対応するファイルシステム領域を書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ書き込みファイルを書き込む。
読出処理部330は、検索キーワードを含むファイルを検索する際に、キーワード管理テーブル220を参照して、検索キーワードに対応付けられたファイルシステム領域を検出し、その領域に格納されたファイルをキャッシュメモリ210に読み出す。ファイル特定部340は、キャッシュメモリ210に読み出されたファイルの中から検索キーワードを含むファイルを特定する。
概念的に説明すると、図2、3に示すように、一のファイルシステム領域には複数のファイルが格納されており、キーワード管理テーブル220に記憶されたキーワードとタグによって関連付けられる。ファイルの書き込みの際には、図2に示すように、書き込みファイルからキーワードが抽出され、抽出されたキーワードと関連づけられたファイルシステム領域に書き込みファイルが書き込まれる。また、ファイル検索の際には、図3に示すように検索キーワードと関連付けられたファイルシステム領域に格納された全てのファイルをキャッシュメモリ210に一旦読み出し、読み出したファイルの中から、検索キーワードを含むファイルを特定する。
そのため、上記の情報処理装置10は、ファイル検索の際に、検索キーワードと関連性の高いファイルのデータをキャッシュメモリ210へ読み出すことになる。つまり、上記の情報処理装置10は、検索キーワードと無関係の文書ファイルのデータ移行を行わないため、その分ファイル検索に要する時間が短縮される。
以下では本発明のとり得る好適な実施形態について図面を参照して詳細に説明する。
[第1の実施形態]
図4に示すように、情報処理装置10は、ホスト端末20及び検索用端末30と接続され、一次記憶媒体100と、ファイル管理メモリ110と、記憶部200と、処理部300とを有する。ホスト端末20は、情報処理装置10に対して書き込みファイルを送信して、書き込み要求を行う端末である。検索用端末30は、情報処理装置10に対して検索キーワードを送信して、検索要求を行う端末である。
一次記憶媒体100は、複数のファイルを複数のファイルシステム領域(FS#1〜n)に区分して記憶する記憶媒体である。ここで、ファイルシステム領域は、各々個別の物理メモリに格納することもできるし、複数のファイルシステム領域を1個の物理メモリに格納することもできる。ファイル管理メモリ110は、ホスト端末20から受け付けた書き込みファイルを一時的に管理するための記憶媒体である。
記憶部200は、情報処理装置10における各種処理を実行するためのデータ、プログラムなどを記憶する記憶媒体であり、キャッシュメモリ210と、キーワード管理テーブル220と、キーワードリスト230とを有する。キャッシュメモリ210は、SRAM(Static Random Access Memory)などであり、一次記憶媒体100に記憶されたファイルを一時的に保持する。
キーワード管理テーブル220は、ファイルシステム領域と、ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するテーブルである。具体的な一例を挙げると、キーワード管理テーブル220は、図5に示すように、ファイルシステム領域の識別子(FS#1)などに対応付けて、キーワード(用語Aなど)とそのキーワードに関する閾値とを記憶する。なお、閾値とは、例えば、一のファイルにおけるキーワードの出現回数、抽出回数などであり、以下に記載のように、ファイルの書き込みの際の処理及び、ファイル検索処理に利用される。
キーワードリスト230は、図6に示すように、キーワードとそのキーワードに関する閾値とを対応付けたリストであり、情報処理装置10の管理者によって予め登録される。
処理部300は、記憶部200からデータ、プログラムなどを読み出して実行することで、情報処理装置10における処理を実行する。具体的には、処理部300は、図4に示すように、キーワード抽出部310と、書込処理部320と、読出処理部330と、ファイル特定部340とを有する。
キーワード抽出部310は、一次記憶媒体100へのファイルの書き込みの際に、書き込みファイルからキーワードを抽出する。具体的には、キーワード抽出部310は、ファイル管理メモリ110に書き込みファイルが格納されると、キーワードリスト230に列挙されたキーワードを書き込みファイルから抽出し、抽出回数が閾値以上のキーワードを特定する。
書込処理部320は、抽出されたキーワードと、キーワード管理テーブル220とを突き合わせて、書き込みファイルの書き込み先のファイルシステム領域を決定し、決定したファイルシステム領域へ書き込みファイルを書き込む。具体的には、書込処理部320は、キーワード抽出部310によって特定されたキーワードが、キーワード管理テーブル220に格納されているか否かを判定する。
ここで、キーワードが格納されている場合には、書込処理部320は、そのキーワードに対応するファイルシステム領域を書き込みファイルの書き込み先に決定する。そして書込処理部320は、ファイル管理メモリ110に格納された書き込みファイルを書き込み先に決定したファイルシステム領域へ書き込む。
一方で、キーワードが格納されていない場合には、書込処理部320は、キーワード管理テーブル220に新たなるファイルシステム領域のエントリを作成するとともに、そのファイルシステム領域を一次記憶媒体100の中に確保する。そして、書込処理部320は、抽出回数が閾値以上のキーワードと、その閾値を作成したエントリに登録するとともに、ファイル管理メモリ110に格納された書き込みファイルを新たに確保したファイルシステム領域に書き込む。
読出処理部330は、検索キーワードを含むファイルを検索する際に、キーワード管理テーブル220を参照して、検索キーワードに対応付けられたファイルシステム領域を検出し、その領域に格納されたファイルをキャッシュメモリ210に読み出す。具体的には、検索用端末30から検索キーワードを受け付けると、読出処理部330は、キーワード管理テーブル220を参照して、検索キーワードに対応付けられたファイルシステム領域を特定する。そして、読出処理部330は、特定したファイルシステム領域に格納されたファイルを一括して一次記憶媒体100から読み出して、キャッシュメモリ210に格納する。
ファイル特定部340は、キャッシュメモリ210に読み出されたファイルの中から検索キーワードを含むファイルを特定する。具体的には、ファイル特定部340は、キャッシュメモリ210にファイルが格納されると、格納されたファイルの中から検索キーワードを含むファイルを特定し、特定したファイルに関する情報(例えば、ファイル名)を検索用端末30に対して出力する。
以下では、図面を参照しつつ、情報処理装置10による一連の処理の流れ、及び各機能部による処理を説明する。
図7は、ファイルの書き込みの際の処理の流れを示すフローチャートである。ファイル管理メモリ110に書き込みファイルが格納されると(ステップS11、YES)、キーワード抽出部310は、書き込みファイルからキーワードを抽出して、抽出回数が閾値以上のキーワードを特定する(ステップS12)。そして、書込処理部320は、特定されたキーワードがキーワード管理テーブル220に格納されているか否かを判定する(ステップS13)。
ここで、キーワードが格納されている場合には(ステップS13、YES)、書込処理部320は、そのキーワードに対応するファイルシステム領域にファイル管理メモリ110に格納された書き込みファイルを書き込む(ステップS14)。一方で、キーワードが格納されていない場合には(ステップS13、NO)、書込処理部320は、新たなるファイルシステム領域を確保し、確保したファイルシステム領域に書き込みファイルを書き込む(ステップS15)。
図8は、ファイル検索処理の流れを示すフローチャートである。図8に示すように、読出処理部330は、検索キーワードを受け付けると(ステップS21、YES)、検索キーワードに対応付けられたファイルシステム領域に格納されたファイルを読み出してキャッシュメモリ210に格納する(ステップS22)。
そして、ファイル特定部340は、キャッシュメモリ210に格納されたファイルの中から検索キーワードを含むファイルを特定し(ステップS23)、特定したファイルに関する情報を検索用端末30に対して出力する(ステップS24)。
上述のように、第1の実施形態の情報処理装置10では、キーワードによって関連付けられるファイルが一のファイルシステム領域に格納される。そして、ファイル検索の際には、検索キーワードに対応するファイルシステム領域内のファイルがキャッシュメモリ210へ読み出される。つまり、第1の実施形態の情報処理装置10では、キャッシュメモリ210へ読み出されるファイルの中には、検索キーワードを含むファイルが多く含まれることになり、無駄なデータ移行が抑制され、その分ファイル検索に要する時間が短縮される。
[第2の実施形態]
上記の第1の実施形態では、キーワードは、情報処理装置10の管理者によってキーワードリスト230に予め登録される。ここで、ホスト端末20から受け付けた書き込みファイルからキーワードを抽出して、キーワードリスト230に追加することもできる。
例えば、キーワード抽出部310は、ファイル管理メモリ110に書き込みファイルが格納されると、書き込みファイルの中で所定回数以上の頻度で出現した用語を新規キーワードとして特定する。そして、キーワード抽出部310は、新規キーワードに関するエントリをキーワードリスト230に作成するとともに、その新規キーワードと、閾値とを登録する。ここで、新規キーワードの閾値は予め設定される値であっても良いし、出現回数に基づいて決定しても良い。また、新規キーワードの登録可否を、情報処理装置10の管理者が適宜選択できるようにしても良い。もちろん、キーワードリスト230に登録されたキーワードを情報処理装置10の管理者が削除できるようにしても良い。
また、所定回数以上かつ上位x個までという条件を新規キーワードの特定条件としても良い。なお、新規キーワードに関しては、上記の特許文献1をはじめとする自然言語処理による文章検索や画像のメタデータ検索など、公知の技術を用いた検索方法によって抽出しても良い。
[第3の実施形態]
上記の実施形態1、2には、種々の変化形態が考えられる。そこで、実施形態1、2の変化形態を第3の実施形態として以下に記載する。
(キーワード管理テーブル220へのキーワードの追加)
実施形態1では、書き込みファイルから複数のキーワードが閾値以上の抽出回数で抽出される時がある。この時に、キーワード管理テーブル220において、あるファイルシステム領域と一の抽出キーワードとが対応していても、そのファイルシステム領域と他の抽出キーワードとが対応していないことがある。このような場合に、キーワード管理テーブル220において、そのファイルシステム領域に対応付けて他の抽出キーワードを追加する。
具体的な一例を挙げて説明すると、書き込みファイルから用語Aと用語Zとが抽出された場合に、図5に示すキーワード管理テーブル220において、FS#1に対応付けて用語Zを追加する。このようにすれば、キーワード管理テーブル220にキーワードを自動的に追加することができる。
(ファイルの書き込みの際のファイルシステム領域の選択)
実施形態1では、書き込みファイルから複数のキーワードが閾値以上の抽出回数で抽出され、かつ、複数のファイルシステム領域の各々に対応する時がある。具体的な一例を挙げて説明すると、書き込みファイルから用語A及び用語bが各々の閾値以上の抽出回数で抽出される時がある。
この場合に、図5のキーワード管理テーブル220を参照した書込処理部320は、閾値が高い用語Aに対応するファイルシステム領域(FS#1)を書き込みファイルの書き込み先に決定する。あるいは、書込処理部320は、用語A及び用語bに対応する両ファイルシステム領域(FS#1、#2)を書き込みファイルの書き込み先に決定する。
(ファイル検索の際のファイルシステム領域の選択)
実施形態1では、キーワード管理テーブル220において、同一キーワードが複数のファイルシステム領域に対応付けて記憶され、ファイル検索の際に複数のファイルシステム領域が特定される時がある。この場合に、各ファイルシステム領域やキーワードに重みづけをしておき、キャッシュメモリ210にファイルが読みだされるファイルシステム領域の順序を決定しても良い。
なお、情報処理装置10における各種処理は、例えば、処理モジュールを搭載したコンピュータによって実現される。当該処理モジュールは、例えば、メモリに格納されたプログラムをCPUが実行することで実現される。また、そのプログラムは、ネットワークを介してダウンロードするか、あるいは、プログラムを記憶した記憶媒体を用いて、更新することができる。さらに、上記処理モジュールは、半導体チップにより実現されてもよい。即ち、上記処理モジュールが行う機能は、何らかのハードウェア及び/又はソフトウェアにより実現できればよい。
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
(付記1)
複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体と、
前記記憶媒体に記憶されたファイルを一時的に保持するキャッシュメモリと、
前記ファイルシステム領域と、前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、
前記記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出部と、
前記キーワード抽出部によって抽出された抽出キーワードと、前記キーワード管理テーブルとを突き合わせて、前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込処理部と、
検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルを前記キャッシュメモリに読み出す読出処理部と、
前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定部と、
を含む情報処理装置。
(付記2)
キーワードを列挙するキーワードリストを更に備え、
前記キーワード抽出部は、前記書き込みファイルから所定回数以上の頻度で抽出された用語を新規キーワードとして特定し、前記キーワードリストに書き込む付記1に記載の情報処理装置。
(付記3)
前記キーワード抽出部は、前記キーワードリストに列挙されたキーワードを書き込みファイルから抽出する付記2に記載の情報処理装置。
(付記4)
前記キーワード管理テーブルは、各キーワードに対応付けて抽出回数に関する閾値を記憶し、
前記書込処理部は、前記キーワード抽出部による抽出回数が前記閾値以上のキーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先として決定する付記1〜3のいずれか1つに記載の情報処理装置。
(付記5)
前記書込処理部は、前記キーワード抽出部による抽出回数が前記閾値以上のキーワードに対応するファイルシステム領域が存在しない場合には、前記記憶媒体内に新たなるファイルシステム領域を確保し、当該ファイルシステム領域を前記書き込みファイルの書き込み先として決定する付記4に記載の情報処理装置。
(付記6)
複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出ステップと、
前記ファイルシステム領域と前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、前記キーワード抽出ステップによって抽出された抽出キーワードとを突き合わせて前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込ステップと、
検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルをキャッシュメモリに読み出す読出ステップと、
前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定ステップと、
を含む情報処理方法。
(付記7)
複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出処理と、
前記ファイルシステム領域と前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、前記キーワード抽出処理によって抽出された抽出キーワードとを突き合わせて前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込処理と、
検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルをキャッシュメモリに読み出す読出処理と、
前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定処理と、
をコンピュータに実行させるプログラム。
なお、上記の特許文献の開示を、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素(各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
10 情報処理装置
20 ホスト端末
30 検索用端末
100 一次記憶媒体
110 ファイル管理メモリ
200 記憶部
210 キャッシュメモリ
220 キーワード管理テーブル
230 キーワードリスト
300 処理部
310 キーワード抽出部
320 書込処理部
330 読出処理部
340 ファイル特定部

Claims (7)

  1. 複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体と、
    前記記憶媒体に記憶されたファイルを一時的に保持するキャッシュメモリと、
    前記ファイルシステム領域と、前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、
    前記記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出部と、
    前記キーワード抽出部によって抽出された抽出キーワードと、前記キーワード管理テーブルとを突き合わせて、前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込処理部と、
    検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルを前記キャッシュメモリに読み出す読出処理部と、
    前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定部と、
    を含む情報処理装置。
  2. キーワードを列挙するキーワードリストを更に備え、
    前記キーワード抽出部は、前記書き込みファイルから所定回数以上の頻度で抽出された用語を新規キーワードとして特定し、前記キーワードリストに書き込む請求項1に記載の情報処理装置。
  3. 前記キーワード抽出部は、前記キーワードリストに列挙されたキーワードを書き込みファイルから抽出する請求項2に記載の情報処理装置。
  4. 前記キーワード管理テーブルは、各キーワードに対応付けて抽出回数に関する閾値を記憶し、
    前記書込処理部は、前記キーワード抽出部による抽出回数が前記閾値以上のキーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先として決定する請求項1〜3のいずれか1項に記載の情報処理装置。
  5. 前記書込処理部は、前記キーワード抽出部による抽出回数が前記閾値以上のキーワードに対応するファイルシステム領域が存在しない場合には、前記記憶媒体内に新たなるファイルシステム領域を確保し、当該ファイルシステム領域を前記書き込みファイルの書き込み先として決定する請求項4に記載の情報処理装置。
  6. 複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出ステップと、
    前記ファイルシステム領域と前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、前記キーワード抽出ステップによって抽出された抽出キーワードとを突き合わせて前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込ステップと、
    検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルをキャッシュメモリに読み出す読出ステップと、
    前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定ステップと、
    を含む情報処理方法。
  7. 複数のファイルを複数のファイルシステム領域に区分して記憶する記憶媒体へのファイルの書き込みの際に、当該書き込みファイルからキーワードを抽出するキーワード抽出処理と、
    前記ファイルシステム領域と前記ファイルシステム領域に格納されたファイルにおけるキーワードとを対応付けて管理するキーワード管理テーブルと、前記キーワード抽出処理によって抽出された抽出キーワードとを突き合わせて前記抽出キーワードに対応するファイルシステム領域を前記書き込みファイルの書き込み先に決定し、決定したファイルシステム領域へ前記書き込みファイルを書き込む書込処理と、
    検索キーワードを含むファイルを検索する際に、前記キーワード管理テーブルを参照して、前記検索キーワードに対応するファイルシステム領域を検出し、検出したファイルシステム領域に格納されたファイルをキャッシュメモリに読み出す読出処理と、
    前記キャッシュメモリに読み出されたファイルの中から前記検索キーワードを含むファイルを特定するファイル特定処理と、
    をコンピュータに実行させるプログラム。
JP2017069251A 2017-03-30 2017-03-30 情報処理装置、情報処理方法及び情報処理プログラム Active JP6809338B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017069251A JP6809338B2 (ja) 2017-03-30 2017-03-30 情報処理装置、情報処理方法及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017069251A JP6809338B2 (ja) 2017-03-30 2017-03-30 情報処理装置、情報処理方法及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2018169981A true JP2018169981A (ja) 2018-11-01
JP6809338B2 JP6809338B2 (ja) 2021-01-06

Family

ID=64017935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017069251A Active JP6809338B2 (ja) 2017-03-30 2017-03-30 情報処理装置、情報処理方法及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6809338B2 (ja)

Also Published As

Publication number Publication date
JP6809338B2 (ja) 2021-01-06

Similar Documents

Publication Publication Date Title
CN107273522B (zh) 面向多应用的数据存储系统和数据调用方法
US9886464B2 (en) Versioned bloom filter
CN111241389B (zh) 一种基于矩阵的敏感词过滤方法、装置、电子设备、存储介质
CN110109910A (zh) 数据处理方法及系统、电子设备和计算机可读存储介质
US20230205755A1 (en) Methods and systems for improved search for data loss prevention
CN112181902B (zh) 数据库的存储方法、装置及电子设备
CN109496292A (zh) 一种磁盘管理方法、磁盘管理装置及电子设备
CN109597707B (zh) 克隆卷数据拷贝方法、装置及计算机可读存储介质
CN102959548A (zh) 数据存储方法、查找方法及装置
JP5686893B2 (ja) データベース管理システム、装置及び方法
CN106484691B (zh) 移动终端的数据存储方法和装置
WO2015124086A1 (en) Virus signature matching method and apparatus
CN111090668A (zh) 数据检索方法及装置、电子设备和计算机可读存储介质
US9286349B2 (en) Dynamic search system
JP6194180B2 (ja) 文章マスク装置及び文章マスクプログラム
JP2018169981A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US8775746B2 (en) Information processing system and method
CN108132971B (zh) 数据库碎片文件的分析方法和装置
US11494515B2 (en) Data processing systems and methods for anonymizing data samples in classification analysis
KR101608061B1 (ko) 백업 파일 탐색 방법
US20210357438A1 (en) Computer-readable recording medium, index creation device, index creation method, computer-readable recording medium, search device, and search method
CN109582638B (zh) 快照卷数据拷贝方法、装置及计算机可读存储介质
JP7180128B2 (ja) 資料管理プログラム,資料管理システム及び資料管理方法
JP2010009414A (ja) 関連情報登録装置、関連情報登録方法および関連情報登録プログラム
JP2005267036A (ja) トレース出力制御方法およびトレースシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201123

R150 Certificate of patent or registration of utility model

Ref document number: 6809338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150