JP2000181927A - 電子ファイリングシステム及び同システムに適用するファイル検索方法 - Google Patents

電子ファイリングシステム及び同システムに適用するファイル検索方法

Info

Publication number
JP2000181927A
JP2000181927A JP10356016A JP35601698A JP2000181927A JP 2000181927 A JP2000181927 A JP 2000181927A JP 10356016 A JP10356016 A JP 10356016A JP 35601698 A JP35601698 A JP 35601698A JP 2000181927 A JP2000181927 A JP 2000181927A
Authority
JP
Japan
Prior art keywords
file
text
data
full
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10356016A
Other languages
English (en)
Inventor
Naoaki Kondo
修明 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10356016A priority Critical patent/JP2000181927A/ja
Priority to US09/461,283 priority patent/US6625606B1/en
Publication of JP2000181927A publication Critical patent/JP2000181927A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【課題】電子ファイリングシステムにおいて、登録した
イメージファイルや文書ファイルを検索する場合に、必
要とする検索結果を得る検索処理の効率を向上させるこ
とにある。 【解決手段】イメージファイルまたは文書ファイルを登
録するためのファイリング機能部10を備えて電子ファ
イリングシステムにおいて、イメージファイル又は文書
ファイルから抽出したテキストデータを、フルテキスト
検索機能部11に登録する。ファイリング機能部10
は、フルテキスト検索機能部11により検索されたフル
テキスト検索用データに基づいて指定のイメージファイ
ルまたは文書ファイルを検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、特にフルテキスト
検索機能を備えた電子ファイリングシステムに関する。
【0002】
【従来の技術】従来、例えばパーソナルコンピュータを
利用した電子ファイリングシステムが開発されている。
このシステムは、コンピュータ本体にセットされたアプ
リケーションプログラムによりファイリング機能を実行
し、スキャナから入力されたイメージデータまたは記録
媒体から読み込んだ文書データ(文字コードデータ)の
各ファイルを登録し、かつ登録ファイルから指定のファ
イルを検索する。ここで、記録媒体とは、ハードディス
クドライブ(HDD)のディスク媒体、または交換型デ
ィスク媒体である光ディスク(DVDやCD−ROMな
ど)やフロッピー(登録商標)ディスクなどを意味す
る。各ファイルは、システムにより制御されるHDDや
光ディスクドライブに格納されて管理される。以下、便
宜的にイメージデータからなるファイルをイメージファ
イルと表記し、また文書データからなるファイルを文書
ファイルと表記する場合がある。
【0003】ユーザは、システムに登録されているファ
イルを検索する場合には、登録時に入力されたキーワー
ド(ファイル名も含む)を検索条件として、キーボード
から入力している。当該キーワードを登録する場合に
も、通常ではキーボードから入力している。
【0004】
【発明が解決しようとする課題】従来の電子ファイリン
グシステムでは、登録したファイル群からイメージファ
イルや文書ファイルを検索する場合に、予め登録してい
るキーワード(ファイル名も含む)をキーボードから入
力することにより検索処理が実行されている。このよう
なキーワード検索方式は、キーワードの付け方により検
索条件が設定されるため、必要とする検索結果を得るこ
とが必ずしも容易ではない。換言すれば、必要とする検
索結果を得るために、適切なキーワードを設定すること
が困難であるため、検索処理の効率が十分ではない。
【0005】そこで、本発明の目的は、電子ファイリン
グシステムにおいて、登録したイメージファイルや文書
ファイルを検索する場合に、必要とする検索結果を得る
検索処理の効率を向上させることにある。
【0006】
【課題を解決するための手段】本発明は、例えばスキャ
ナにより入力されたイメージファイルまたは例えば記録
媒体から入力された文書ファイルを登録するためのファ
イリング機能を備えた電子ファイリングシステムであっ
て、ファイル検索機能としてフルテキスト検索機能を利
用するシステムである。即ち、本システムは、イメージ
ファイル又は文書ファイルから指定範囲のテキストデー
タを抽出する抽出手段と、フルテキスト検索手段とを備
えている。
【0007】フルテキスト検索手段は、抽出手段により
抽出されたテキストデータをフルテキスト検索用データ
として登録し、指定されたテキストに基づいて対応する
ファイルを登録ファイル群から検索する。
【0008】このような本発明の構成であれば、例えば
イメージファイルを記憶装置に登録すると共に、当該イ
メージファイルの指定範囲のテキストデータ(全文、指
定頁、指定頁内の文字列)をフルテキスト検索用データ
として登録する。そして、当該イメージファイルを検索
する場合には、登録したフルテキスト検索用データを使
用して検索することができる。従って、ファイルの登録
時に検索用のキーワードを設定する必要はなく、登録し
たフルテキスト検索用データに含まれるキーワードを入
力するだけで、該当するファイルを検索することができ
る。従って、キーワードの付け方による検索条件に依存
すること無く、必要とする検索結果を効率的に得ること
が可能となる。
【0009】
【発明の実施の形態】以下図面を参照して、本発明の実
施の形態を説明する。
【0010】図1は、第1の実施形態に関係する電子フ
ァイリングシステムの概念的構成を示すブロック図であ
る。図3は、各実施形態に関係する電子ファイリングシ
ステムをコンピュータシステムに適用した場合の構成を
示すブロック図である。 (電子ファイリングシステムの構成)本システムの本体
1は、図1に示すように、大別してファイリング機能部
10と、フルテキスト機能部11と、抄録抽出部12
と、ウインドウ表示機能部13と、エクスプローラ(E
xplorer)14と、ファイル格納部20〜22と
を有する。
【0011】ファイリング機能部10は、入力されたイ
メージファイルまたは文書ファイルをファイル格納部2
1に登録したり、ファイル格納部20に登録されたファ
イリング・データベース(DB)に基づいて登録したイ
メージファイルまたは文書ファイルから指定のファイル
を検索処理を実行する。更に、ファイリング機能部10
は、同実施形態に関係する機能として、フルテキスト機
能部11に対するフルテキスト検索データの登録機能
(登録要求などの処理を実行する機能)および当該フル
テキスト検索データを作成するためのテキスト抽出機能
(イメージデータから文字データに変換する文字認識機
能を含む)を有する。
【0012】ファイル格納部20には、ファイリング機
能部10による検索処理に必要な管理情報(ファイル名
やファイル格納部21のアドレスなど)なるファイリン
グDBが登録されている。これに対して、ファイル格納
部21には、イメージファイルまたは文書ファイルの実
データ(コンテンツ)が格納される。また、ファイル格
納部22には、フルテキスト機能部11により登録され
るフルテキスト検索データ(後述する)を格納する。
【0013】フルテキスト機能部11は、ファイリング
機能部10からの登録要求に応じて、テキスト抽出機能
により作成されたフルテキスト検索データをフルテキス
トDBとしてファイル格納部22に登録する。また、フ
ルテキスト機能部11は、ファイリング機能部10によ
る検索処理に関連して、入力される検索データ(キーワ
ード)によるフルテキストDBに対するフルテキスト検
索処理を実行する。
【0014】スキャナ2は、用紙上に記録された情報を
光電変換してイメージデータを生成し、システム本体1
に入力するための入力装置である。なお、抄録抽出部1
2、ウインドウ表示機能部13、及びエクスプローラ1
4については後述する。 (コンピュータシステムの構成)同実施形態の電子ファ
イリングシステムは、図3に示すように、例えばパーソ
ナルコンピュータからなるコンピュータシステムに適用
する場合を想定している。コンピュータシステムは、大
別してコンピュータ本体30と、入力装置31と、出力
装置32とから構成されている。コンピュータ本体30
は、オペレーティングシステム(OS)の制御に基づい
て、同実施形態のファイリング機能部10及びフルテキ
スト機能部11を実現するアプリケーションプログラム
を実行する。また、コンピュータ本体30は、前述のフ
ァイル格納部20〜22を実現するハードディスクドラ
イブ35を搭載している。
【0015】入力装置31は、前述のスキャナ2以外
に、検索キーワードなどを入力するためのキーボード3
と、表示画面上においてドラッグ・アンド・ドロップ操
作(GUIによる入力機能)やメニュ選択操作などを行
うためのマウス4とを有する。一方、出力装置32は、
前述のウインドウ表示機能部13及びエクスプローラ1
4による表示機能を実現するためのモニタ(ディスプレ
イ装置)を有する。 (ファイル検索処理)以下図1と図3と共に、図2(符
号〜)の概念図及び図4のフローチャートを参照し
て、同実施形態のファイル検索処理を説明する。
【0016】同実施形態はイメージファイルの検索処理
を想定する。検索対象が文書ファイルの場合も同様の処
理となるが、後述するテキスト抽出処理において、イメ
ージファイルの場合には文字認識処理を実行する点が相
違する。
【0017】まず、イメージファイルの登録処理を、図
4(A)及び図2(符号〜)を参照して説明する。
ファイリング機能部10は、スキャナ2により、例えば
用紙上に記録された文書や図をイメージデータに変換し
て読込む(ステップS1,)。ファイリング機能部1
0は、入力されたイメージデータからなるイメージファ
イル(コンテンツ)をファイル格納部21に登録し、か
つ当該イメージファイルの管理情報(ファイル名やアド
レスなど)をファイリングDBとしてファイル格納部2
0に登録する(ステップS2,)。
【0018】ここで、キーボード3またはマウス4を介
して、ユーザからフルテキスト検索機能を選択された場
合を想定する(ステップS3のYES)。但し、自動的
にフルテキスト検索機能に移行してもよい。ファイリン
グ機能部10は、文字認識機能によりイメージファイル
からテキストデータ(文字データ)を抽出する(ステッ
プS4)。このとき、ファイリング機能部10は、ユー
ザにより指定された頁などの指定範囲(全頁も含む)の
テキストデータを抽出する。ファイリング機能部10
は、抽出したテキストデータの登録要求を、フルテキス
ト機能部11に対して行う(ステップS5,)。フル
テキスト機能部11は、登録要求されたテキストデータ
を、フルテキスト検索データとしてフルテキストDB2
2に登録する(ステップS6,)。
【0019】登録したイメージファイルの検索処理を、
図4(B)及び図2(符号〜)を参照して説明す
る。先ず、モニタ32の表示画面上に、書類ウインドウ
13Aと呼ぶウインドウ表示を行うことにより、ファイ
ル検索処理を開始する(ステップS10,)。ここ
で、書類ウインドウ13Aとは、ファイリング機能部1
0により既に登録されたイメージファイル及び文書ファ
イル(以下これらのファイルを総称して書類ファイルと
呼ぶ)を検索するための操作画面である(図5を参
照)。
【0020】ファイリング機能部10は、書類ウインド
ウ13Aからユーザにより入力された検索キーワード
(フルテキスト検索用キーワード)をフルテキスト機能
部11に出力して、フルテキスト検索要求を行う(ステ
ップS11,)。フルテキスト機能部11はフルテキ
ストDB22を参照して、検索キーワードを含むフルテ
キスト検索データを検索する(ステップS12,)。
ファイリング機能部10は、フルテキスト機能部11か
ら検索結果を受取ると、該当する書類ファイル(ここで
はイメージファイル)を、ファイリングDB20を参照
して検索する(ステップS13,S14,)。ここ
で、検索結果とは、フルテキスト検索データに対応する
ファイル名などである。即ち、ファイリング機能部10
は、フルテキスト検索結果に基づいて、検索対象のファ
イル名をファイリングDB20から検索し、書類ウイン
ドウ13Aに表示する(図2の)。
【0021】以上のように本実施形態によれば、スキャ
ナ2により入力したイメージデータをイメージファイル
として登録すると共に、フルテキスト検索データをフル
テキスト機能部11に登録することができる。これによ
り、登録したイメージファイルを検索する場合に、検索
キーワードを入力すると、フルテキスト機能部11によ
るフルテキスト検索処理を実行する事ができる。フルテ
キスト検索処理では、登録したイメージファイルの指定
範囲(頁単位など)に対応するテキストデータがフルテ
キスト検索データとして登録されているため、入力され
た検索キーワードとの照合処理が効率的に実行される。
従って、ファイルの登録時に、検索条件を左右する検索
キーワードの付け方に依存すること無く、ファイルの検
索効率を向上させることができる。換言すれば、フルテ
キスト検索機能を利用することにより、登録したファイ
ル群から該当するファイルの検索確率を高めることがで
きる。なお、本実施形態では、イメージファイルについ
て説明したが、これに限ること無く、文書ファイルにつ
いても同様の処理手順となる。但し、前述したように、
文書ファイルに関しては文字認識処理によるテキスト抽
出処理は不要であり、通常の指定範囲におけるテキスト
データの抽出処理でよい。 (第2の実施形態)本発明の第2の実施形態は、パーソ
ナルコンピュータの標準機能であるエクスプローラ(E
xplorer)14及びドラッグ・アンド・ドロップ
機能を利用したファイル検索処理(登録処理を含む)に
関する。エクスプローラ14は、ファイルのコピー、移
動、削除などの処理を実行するためのファイル管理ユー
ティリティである。また、ドラッグ・アンド・ドロップ
機能は、いわゆるGUI(Graphical Use
r Interface)機能の一つであり、マウス4
により表示画面上のカーソルを移動させて処理内容を指
定するための操作機能である。図3において、ハードデ
ィスクドライブ35には、電子ファイリングシステムに
関するファイリングDB、イメージファイル、フルテキ
ストDB以外にその他のアプリケーションプログラムで
作成したファイル(文書ファイルやイメージファイル)
が保存されており、エクスプローラ14により、このフ
ァイルが処理できるようになっている。
【0022】以下、図7、図8、及び図9のフローチャ
ートを参照して、同実施形態の登録処理と検索処理を説
明する。先ず、図9(A)及び図8(符号〜)を参
照して登録処理を説明する。
【0023】先ず、エクスプローラ14を起動して、電
子ファイリングシステム以外のアプリケーションプログ
ラムで作成したファイル(文書ファイルやイメージファ
イル)の一覧を、モニタ画面上に表示する(図7を参
照)。そして、電子ファイリングシステムに登録して検
索対象としたい複数のファイル(例えば図7の70)
を、マウス4によるドラッグ・アンド・ドロップ操作に
よりファイリング機能10の処理に移行させる(ステッ
プS20,)。ファイリング機能部10は、指定され
たイメージファイルや文書ファイルをファイル格納部2
1に登録し、かつ当該複数ファイルの管理情報(ファイ
ル名やアドレスなど)をファイリングDBとしてファイ
ル格納部20に登録する(ステップS21,)。
【0024】このファイリング処理の終了後に、ファイ
リング機能部10は、文字認識機能によりイメージファ
イルから指定範囲のテキストデータを抽出し、また文書
ファイルからテキスト抽出フィルタ機能により指定範囲
のテキストデータを抽出する(ステップS22)。ファ
イリング機能部10は、抽出したテキストデータの登録
要求を、フルテキスト機能部11に対して行う(ステッ
プS23,)。フルテキスト機能部11は、登録要求
された各テキストデータを、フルテキスト検索データと
してフルテキストDB22に登録する(ステップS2
4,)。
【0025】このように複数ファイルを、1つの書類フ
ァイルとして一括登録した後に、前述のようなフルテキ
スト検索処理により検索することができる。以下、当該
書類ファイルの検索処理を、図9(B)及び図8(符号
〜)を参照して説明する。
【0026】先ず、モニタ32の表示画面上に書類ウイ
ンドウ13Aを表示することにより、ファイル検索処理
を開始する(ステップS30,)。ファイリング機能
部10は、書類ウインドウ13Aからユーザにより入力
された検索キーワード(フルテキスト検索用キーワー
ド)をフルテキスト機能部11に出力して、フルテキス
ト検索要求を行う(ステップS31,)。フルテキス
ト機能部11はフルテキストDB22を参照して、検索
キーワードを含むフルテキスト検索データを検索する
(ステップS32,)。ファイリング機能部10は、
フルテキスト機能部11から検索結果を受取ると、該当
する書類ファイルをファイリングDB20を参照して検
索する(ステップS33,)。ファイリング機能部1
0は、フルテキスト検索結果に基づいて、検索対象のフ
ァイル名をファイリングDB20から検索し、書類ウイ
ンドウ13Aに表示する(図8の)。
【0027】以上のように同実施形態によれば、エクス
プローラ14及びドラッグ・アンド・ドロップ機能を利
用して、イメージファイルや文書ファイルの複数ファイ
ルを1つの書類ファイルとして一括登録した後に、自動
的に当該書類ファイルをフルテキスト検索機能に登録す
ることができる。従って、フルテキスト検索機能を利用
して、一括登録した書類ファイルを効率的に検索するこ
とができる。 (第3の実施形態)第3実施形態は、電子ファイリング
システムに既に登録した書類ファイル(イメージファイ
ルまたは文書ファイル)を複数選択して、当該複数の書
類ファイルに対するフルテキスト検索処理に関する。
【0028】以下、図10及び図11のフローチャート
を参照して、同実施形態の登録処理と検索処理を説明す
る。先ず、図11(A)及び図10(符号〜)を参
照して登録処理を説明する。
【0029】モニタ32の書類ウインドウ13Aに、フ
ァイリング機能部10により登録済みの複数の書類ファ
イルの一覧を表示する(図5を参照)。そして、フルテ
キスト検索対象としたい複数の書類ファイルを、マウス
4の操作により選択する(ステップS40,)。ファ
イリング機能部10は、選択された複数の書類ファイル
の中で、イメージファイルについては文字認識機能によ
り指定範囲のテキストデータを抽出し、また文書ファイ
ルについてはテキスト抽出フィルタ機能により指定範囲
のテキストデータを抽出する。ファイリング機能部10
は、抽出したテキストデータの登録要求を、フルテキス
ト機能部11に対して行う(ステップS41,)。フ
ルテキスト機能部11は、登録要求された各テキストデ
ータを、フルテキスト検索データとしてフルテキストD
B22に登録する(ステップS42,)。
【0030】次に、選択した複数の書類ファイルの検索
処理を、図11(B)及び図10(符号〜)を参照
して説明する。
【0031】先ず、モニタ32の表示画面上に書類ウイ
ンドウ13Aを表示し、ファイル検索処理を開始する
(ステップS50,)。ファイリング機能部10は、
書類ウインドウ13Aからユーザにより入力された検索
キーワード(フルテキスト検索用キーワード)をフルテ
キスト機能部11に出力して、フルテキスト検索要求を
行う(ステップS51,)。フルテキスト機能部11
はフルテキストDB22を参照して、検索キーワードを
含むフルテキスト検索データを検索する(ステップS5
2,)。ファイリング機能部10は、フルテキスト機
能部11から検索結果を受取ると、該当する書類ファイ
ルをファイリングDB20を参照して検索する(ステッ
プS53,)。ファイリング機能部10は、フルテキ
スト検索結果に基づいて、検索対象のファイル名をファ
イリングDB20から検索し、書類ウインドウ13Aに
表示する(図10の)。
【0032】以上のように同実施形態によれば、既に登
録済みの書類ファイルの中から複数の書類ファイルを同
時に指定して、自動的にフルテキスト検索機能に登録す
ることができる。従って、フルテキスト検索機能を利用
して、一括指定した書類ファイルを効率的に検索するこ
とができる。 (第4の実施形態)第4の実施形態は、登録したイメー
ジファイルまたは文書ファイルの中で、ユーザが指定し
た頁データをフルテキスト検索対象として登録する機能
に関する。
【0033】以下、図12及び図13のフローチャート
を参照して、同実施形態の登録処理と検索処理を説明す
る。先ず、図13(A)及び図12(符号〜)を参
照して登録処理を説明する。
【0034】モニタ32の表示画面上に頁ウインドウ1
3Bを表示し、ファイリング機能部10を介して登録済
みのイメージファイルまたは文書ファイルの中からフル
テキスト検索対象としたい頁データを、マウス4の操作
により選択する(ステップS60,)。頁ウインドウ
13Bには、例えば図6に示すように、選択された頁に
記録されたデータが表示される。ユーザは、当該頁ウイ
ンドウ13Bの表示内容により、フルテキスト検索対象
として登録するフルテキスト検索データを確認すること
ができる。
【0035】ファイリング機能部10は、選択された頁
データがイメージデータの場合には文字認識機能により
テキストデータに変換し、また文字データの場合にはテ
キスト抽出フィルタ機能によりテキストデータに変換す
る。ファイリング機能部10は、生成したテキストデー
タの登録要求を、フルテキスト機能部11に対して行う
(ステップS61,)。フルテキスト機能部11は、
登録要求されたテキストデータ(頁データ)を、フルテ
キスト検索データとしてフルテキストDB22に登録す
る(ステップS62,)。
【0036】次に、指定した頁データに基づいた登録フ
ァイルの検索処理を、図13(B)及び図10(符号
〜)を参照して説明する。
【0037】先ず、モニタ32の表示画面上に書類ウイ
ンドウ13Aを表示し、ファイル検索処理を開始する
(ステップS70,)。ファイリング機能部10は、
書類ウインドウ13Aからユーザにより入力された検索
キーワード(フルテキスト検索用キーワード)をフルテ
キスト機能部11に出力して、フルテキスト検索要求を
行う(ステップS71,)。フルテキスト機能部11
はフルテキストDB22を参照して、検索キーワードを
含むフルテキスト検索データ(登録した頁データ)を検
索する(ステップS72,)。ファイリング機能部1
0は、フルテキスト機能部11から検索結果を受取る
と、該当する書類ファイル(イメージファイルまたは文
書ファイル)をファイリングDB20を参照して検索す
る(ステップS73,)。ファイリング機能部10
は、フルテキスト検索結果に基づいて、検索対象のファ
イル名をファイリングDB20から検索し、書類ウイン
ドウ13Aに表示する(図12の)。
【0038】以上のように同実施形態によれば、既に登
録済みの書類ファイルにおいて、ユーザが指定したイメ
ージファイルまたは文書ファイルの指定頁データを、フ
ルテキスト検索機能に登録することができる。これによ
り、フルテキスト検索機能を利用して、指定頁データに
含まれる検索データを入力するだけで、指定のイメージ
ファイルまたは文書ファイルを効率的に検索することが
できる。 (第5の実施形態)第5の実施形態は、前述した各実施
形態において、入力または登録したイメージファイルま
たは文書ファイルから抽出したテキストデータをフルテ
キスト検索対象として登録する場合に、当該テキストデ
ータから抄録データを抽出して登録する機能に関する。
【0039】以下、図14及び図15のフローチャート
を参照して、同実施形態の登録処理と検索処理を説明す
る。先ず、図15(A)及び図14(符号〜)を参
照して登録処理を説明する。
【0040】ファイリング機能部10は、指定されたイ
メージファイル又は文書ファイルからテキストデータの
抽出処理後に、抄録抽出部12に対して抽出処理の要求
を行う(ステップS80,)。テキストデータは、前
述したように、イメージデータの場合には文字認識機能
により抽出処理される。また、文字データの場合にはテ
キスト抽出フィルタ機能により抽出処理される。
【0041】抄録抽出部12は、抽出されたテキストデ
ータ(例えば指定頁データ)から例えば所定の重み付け
をされたキーワード群または所定量の文字列を抽出す
る。ファイリング機能部10は、抄録抽出部12により
抽出された抄録抽出結果の登録要求を、フルテキスト機
能部11に対して行う(ステップS81,)。フルテ
キスト機能部11は、登録要求された抄録データ(テキ
ストデータ)を、フルテキスト検索データとしてフルテ
キストDB22に登録する(ステップS82,)。
【0042】次に、登録した抄録データに基づいた登録
ファイルの検索処理を、図15(B)及び図14(符号
〜)を参照して説明する。
【0043】先ず、モニタ32の表示画面上に書類ウイ
ンドウ13Aを表示し、ファイル検索処理を開始する
(ステップS90,)。ファイリング機能部10は、
書類ウインドウ13Aからユーザにより入力された検索
キーワード(フルテキスト検索用キーワード)をフルテ
キスト機能部11に出力して、フルテキスト検索要求を
行う(ステップS91,)。フルテキスト機能部11
はフルテキストDB22を参照して、検索キーワードを
含むフルテキスト検索データ(登録した抄録データ)を
検索する(ステップS92,)。ファイリング機能部
10は、フルテキスト機能部11から検索結果を受取る
と、該当する書類ファイル(イメージファイルまたは文
書ファイル)をファイリングDB20を参照して検索す
る(ステップS93,)。ファイリング機能部10
は、フルテキスト検索結果に基づいて、検索対象のファ
イル名をファイリングDB20から検索し、書類ウイン
ドウ13Aに表示する(図14の)。
【0044】以上のように同実施形態によれば、入力ま
たは登録したイメージファイルまたは文書ファイルから
抽出した抄録データを、フルテキスト検索機能に登録す
ることができる。抄録データは、検索対象のファイルで
検索データとして適切なキーワードなどが含まれてい
る。このため、抄録データをフルテキスト検索機能に登
録すれば、指定のイメージファイルまたは文書ファイル
を高い精度で検索することが可能となる。
【0045】なお、前述の各実施形態は、記憶媒体に格
納されたソフトウエア(具体的にはパソコン用パッケー
ジソフトウエア)をCPUが実行することにより実現す
ることができる。記憶媒体は、メモリカード、ディスク
記憶媒体、ICメモリ(RAM,ROM,EEPROM
など)など、CPUが読取可能であればいずれでもよ
い。
【0046】
【発明の効果】以上詳述したように本発明によれば、電
子ファイリングシステムにおいて、フルテキスト検索機
能を利用することにより、ユーザ側の特別の工夫を要す
ること無く、結果的に検索の効率及び精度の高い検索デ
ータを登録することが可能となる。従って、登録したイ
メージファイルや文書ファイルを検索する場合に、必要
とする検索結果を得る検索処理の効率を向上させること
ができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に関係するファイリン
グシステムの概念図。
【図2】同実施形態の動作を説明するための概念図。
【図3】各実施形態に関係するコンピュータシステムの
要部を示すブロック図。
【図4】第1の実施形態の動作を説明するためのフロー
チャート。
【図5】各実施形態に関係する書類ウインドウの内容を
示す概念図。
【図6】各実施形態に関係する頁ウインドウの内容を示
す概念図。
【図7】各実施形態に関係するエクスプローラの起動画
面を示す概念図。
【図8】第2の実施形態に関係するファイリングシステ
ムの概念図。
【図9】第2の実施形態の動作を説明するためのフロー
チャート。
【図10】第3の実施形態に関係するファイリングシス
テムの概念図。
【図11】第3の実施形態の動作を説明するためのフロ
ーチャート。
【図12】第4の実施形態に関係するファイリングシス
テムの概念図。
【図13】第4の実施形態の動作を説明するためのフロ
ーチャート。
【図14】第5の実施形態に関係するファイリングシス
テムの概念図。
【図15】第5の実施形態の動作を説明するためのフロ
ーチャート。
【符号の説明】
1…システム本体 2…スキャナ 3…キーボード 4…マウス 10…ファイリング機能部 11…フルテキスト機能部 12…抄録抽出部 13…ウインドウ表示機能部 14…エクスプローラ(Explorer) 20…ファイル格納部(ファイリングDB) 21…ファイル格納部(イメージ又は文書ファイル) 22…ファイル格納部(フルテキストDB) 30…コンピュータ本体 31…入力装置 32…出力装置 35…ハードディスクドライブ

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力されたイメージデータからなるイメ
    ージファイルまたは文字コードデータからなる文書ファ
    イルを登録するためのファイル登録手段と、 前記イメージファイル又は前記文書ファイルから指定範
    囲のテキストデータを抽出する抽出手段と、 前記テキストデータをフルテキスト検索用データとして
    登録し、指定されたテキストに基づいて対応するファイ
    ルを前記ファイル登録手段から検索するフルテキスト検
    索手段とを具備したことを特徴とする電子ファイリング
    システム。
  2. 【請求項2】 イメージデータを入力するための入力手
    段と、 前記入力手段により入力されたイメージデータからなる
    イメージファイルを登録するためのファイル登録手段
    と、 文字認識機能により前記イメージファイルから指定範囲
    のテキストデータを抽出する抽出手段と、 前記テキストデータをフルテキスト検索用データとして
    登録し、指定されたテキストに基づいて対応するイメー
    ジファイルを前記ファイル登録手段から検索するフルテ
    キスト検索手段とを具備したことを特徴とする電子ファ
    イリングシステム。
  3. 【請求項3】 入力されたイメージデータからなるイメ
    ージファイルまたは文字コードデータからなる文書ファ
    イルを登録するためのファイル登録手段と、 このファイル登録手段に登録されていない記録媒体に記
    録された複数のファイルをウインドウ画面上の操作によ
    り指定して、1つの書類ファイルとして前記ファイル登
    録手段に登録するファイル操作手段と、 前記書類ファイルに含まれるイメージファイルまたは前
    記文書ファイルから指定範囲のテキストデータを抽出す
    る抽出手段と、 前記テキストデータをフルテキスト検索用データとして
    登録し、指定されたテキストに基づいて対応するファイ
    ルを前記ファイル登録手段から検索するフルテキスト検
    索手段とを具備したことを特徴とする電子ファイリング
    システム。
  4. 【請求項4】 前記ファイル操作手段は、前記ファイル
    登録手段に登録された複数の書類ファイルを選択して前
    記ファイル登録手段に登録する機能を有することを特徴
    とする請求項3記載の電子ファイリングシステム。
  5. 【請求項5】 前記ファイル登録手段により登録された
    イメージファイルまたは文書ファイルから前記フルテキ
    スト検索用データとして使用するための頁単位のデータ
    を選択する選択手段を有し、 前記フルテキスト検索手段は、前記選択された頁単位の
    データから前記抽出手段により抽出された前記フルテキ
    スト検索用データを登録することを特徴とする請求項1
    又は請求項2記載の電子ファイリングシステム。
  6. 【請求項6】 前記抽出手段により抽出されたテキスト
    データから抄録データを生成し、当該抄録データをフル
    テキスト検索用データとして前記フルテキスト検索手段
    に出力する抄録生成手段を特徴とする請求項1、請求項
    2、請求項3のいずれか記載の電子ファイリングシステ
    ム。
  7. 【請求項7】 入力されたイメージデータからなるイメ
    ージファイルまたは文字コードデータからなる文書ファ
    イルを登録するためのファイル登録手段を有する電子フ
    ァイリングシステムに適用するファイル検索方法であっ
    て、 前記イメージファイル又は前記文書ファイルから指定範
    囲のテキストデータを抽出する処理と、 前記テキストデータをフルテキスト検索用データとして
    登録する処理と、 指定されたテキストに基づいて対応するファイルを前記
    ファイル登録手段から検索する処理とからなることを特
    徴とするファイル検索方法。
  8. 【請求項8】 入力されたイメージデータからなるイメ
    ージファイルまたは文字コードデータからなる文書ファ
    イルを登録するためのファイル登録手段を有する電子フ
    ァイリングシステムに設けられたコンピュータにより読
    取可能な記憶媒体であって、 前記イメージファイル又は前記文書ファイルから指定範
    囲のテキストデータを抽出する処理と、 前記テキストデータをフルテキスト検索用データとして
    登録する処理と、 指定されたテキストに基づいて対応するファイルを前記
    ファイル登録手段から検索する処理とを、前記コンピュ
    ータが実行するように設定されたプログラムを記憶した
    記憶媒体。
JP10356016A 1998-12-15 1998-12-15 電子ファイリングシステム及び同システムに適用するファイル検索方法 Pending JP2000181927A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10356016A JP2000181927A (ja) 1998-12-15 1998-12-15 電子ファイリングシステム及び同システムに適用するファイル検索方法
US09/461,283 US6625606B1 (en) 1998-12-15 1999-12-15 System and method for filing/searching data having a full-text function and media for recording the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10356016A JP2000181927A (ja) 1998-12-15 1998-12-15 電子ファイリングシステム及び同システムに適用するファイル検索方法

Publications (1)

Publication Number Publication Date
JP2000181927A true JP2000181927A (ja) 2000-06-30

Family

ID=18446905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10356016A Pending JP2000181927A (ja) 1998-12-15 1998-12-15 電子ファイリングシステム及び同システムに適用するファイル検索方法

Country Status (2)

Country Link
US (1) US6625606B1 (ja)
JP (1) JP2000181927A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256476A (ja) * 2002-03-01 2003-09-12 Toshiba Corp 知識共有システム、知識共有システムに於ける検索結果表示方法および検索結果のコンテンツ評価方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7743061B2 (en) * 2002-11-12 2010-06-22 Proximate Technologies, Llc Document search method with interactively employed distance graphics display

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265242A (en) * 1985-08-23 1993-11-23 Hiromichi Fujisawa Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates
EP0382541B1 (en) * 1989-02-09 1996-09-25 Canon Kabushiki Kaisha Electronic filing apparatus and method of retrieving image information
JPH0744573A (ja) 1993-07-27 1995-02-14 Fujitsu Ltd 電子ファイリング装置
JPH07319903A (ja) 1994-05-24 1995-12-08 Toshiba Syst Kaihatsu Kk イメージデータ処理システム
US5745745A (en) * 1994-06-29 1998-04-28 Hitachi, Ltd. Text search method and apparatus for structured documents
US5907835A (en) * 1994-11-18 1999-05-25 Canon Kabushiki Kaisha Electronic filing system using different application program for processing drawing commands for printing
JPH08161350A (ja) 1994-12-02 1996-06-21 Canon Inc 電子ファイリング方法および装置
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
JPH10307846A (ja) * 1997-03-03 1998-11-17 Toshiba Corp ドキュメント情報管理システム、ドキュメント情報管理方法、及びドキュメント検索方法
JP3692764B2 (ja) * 1998-02-25 2005-09-07 株式会社日立製作所 構造化文書登録方法、検索方法、およびそれに用いられる可搬型媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256476A (ja) * 2002-03-01 2003-09-12 Toshiba Corp 知識共有システム、知識共有システムに於ける検索結果表示方法および検索結果のコンテンツ評価方法

Also Published As

Publication number Publication date
US6625606B1 (en) 2003-09-23

Similar Documents

Publication Publication Date Title
US20080162603A1 (en) Document archiving system
US20080162602A1 (en) Document archiving system
US20090183115A1 (en) Document searching apparatus, document searching method, and computer-readable recording medium
US20060143153A1 (en) Signal bearing medium bearing image display program and image display apparatus
US20100057770A1 (en) System and method of file management, and recording medium storing file management program
US20080104016A1 (en) Method and system for comparing data
US20110231430A1 (en) Content collecting apparatus, content collecting method, and non-transitory computer-readable recording medium encoded with content collecting program
JP5448412B2 (ja) 情報処理装置およびその方法、プログラム、記録媒体
JP2000155633A (ja) データ入力処理装置及び記録媒体
JP2012159917A (ja) 文書管理システム、文書管理方法、及びプログラム
JPH10289240A (ja) 画像処理装置及びその制御方法
JP7293780B2 (ja) 情報処理装置、文書管理システム及びプログラム
JP2008234078A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理プログラムを記録した記録媒体
CN113495874A (zh) 信息处理装置和计算机可读取介质
JP3994188B2 (ja) マルチメディアデータ検索システム、マルチメディア検索方法および該検索方法を実現するためのプログラム
JP2000181927A (ja) 電子ファイリングシステム及び同システムに適用するファイル検索方法
JP2016018279A (ja) 文書ファイル検索プログラム、文書ファイル検索装置、文書ファイル検索方法、文書情報出力プログラム、文書情報出力装置及び文書情報出力方法
KR20070051569A (ko) 웹 데이터 및 로컬 데이터에 대한 데이터 자동 태깅 방법및 데이터 자동 태깅 시스템
JP2006004062A (ja) 画像データベース作成装置および画像検索方法
JP2005339580A (ja) 文書データ管理装置およびプログラム
JP2009099090A (ja) 帳票キーワード登録装置、帳票キーワード登録方法、および、プログラム
JP2006004157A (ja) 画像検索プログラム、画像検索方法、画像検索装置及び記録媒体
JPH1139338A (ja) 文書検索装置、文書検索方法及び文書検索のためのプログラムを記録した媒体
JP7501255B2 (ja) 文書検索システム、文書検索方法およびプログラム
JP5298484B2 (ja) 文書処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080701