JPH04104367A - ファイルシステム - Google Patents

ファイルシステム

Info

Publication number
JPH04104367A
JPH04104367A JP2222197A JP22219790A JPH04104367A JP H04104367 A JPH04104367 A JP H04104367A JP 2222197 A JP2222197 A JP 2222197A JP 22219790 A JP22219790 A JP 22219790A JP H04104367 A JPH04104367 A JP H04104367A
Authority
JP
Japan
Prior art keywords
recognition result
image
recognition
similarity
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2222197A
Other languages
English (en)
Inventor
Yoji Maeda
前田 陽二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2222197A priority Critical patent/JPH04104367A/ja
Publication of JPH04104367A publication Critical patent/JPH04104367A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は例えば文書や図面などの情報を電子的にファ
イルするファイルシステムに関し、特にファイルすべき
文書や図面中の文字を検索用キワートに使用する場合の
キーワードの登録に関するものである。
〔従来の技術〕
第5図はこの種の従来のファイルシステムの要部構成を
示すブロック図である。第5図において、1は下記の各
構成要素をそれぞれ制御しシステJ、全体を制御する制
御手段、2はファイルとして登録すべき文書や図面など
の情報を読み取り光電変換して2値の画素信号(画像信
号)に変換するイメージリーグからなるイメージ入力手
段、3は上記画素信号になったイメージから文字を切り
出して認識し各文字イメージ毎に類似度の高い認識候補
文字を、文字イメージと各認識候補文字との類似度とと
もに出力する認識手段、4は認識手段3の出力である上
記認識結果を記憶する認識結果記憶手段、5は上記認識
結果を表示して、例えばオペレータが認識候補文字から
正しい文字を選択して、その候補文字の番号をキーホー
ドより入力する認識結果修正手段、6は修正された認識
結果を記憶する修正結果記イ、9手段、7は検索用キー
ワードを入力し、上記修正結果の中に検索用キーワード
と同し文字列があるかを調べる検索手段、8は修正結果
等を表示する表示手段、2oは」二記入カされたイメー
ジを記1.aするイメージ記憶手段である。
第6Mはファイルされている情報が記入されている用紙
を示す図であり、図において9は用紙である。第7図は
認識結果記憶手段4に記憶されている内容であって、図
中10は認識候補文字とその類似度である。類似度は0
〜1の値をとり、最も類似している場合、値は1となる
。第8図は検索手段7の検索処理について説明するだめ
の図であって、図中の11は修正結果である。
次に動作について説明する。
はじめに情報を登録する場合について説明する。
用紙9の内容は、イメージ入力手段2により2値信号に
変換され、他のイメージとともに、イメージ記1.9手
段20に記憶される。
次に認識手段3により上記2値信号から、文字イメージ
を切り出して認識し、第7図の認識結果10を出力し、
認識結果記憶手段4に記1意する。
次に、認識結果修正手段5でば表示手段8に表示された
認識結果10の候補文字の中より正しい文字を選択して
入力するごとにより修正結果11を得て、この修正され
た文章を1つのファイルとして修正結果記憶手段6に追
加する。
次に情報を検索する場合について説明する。検索手段7
では入力された検索用キーワード「化学」が文章中にあ
るファイルを検索するために、修正結果記憶手段6の各
ファイルの内容について、「化学」の文字があるかを調
べる。例えば第8図に示す1〜8の順に修正結果を調べ
、3の所で「化学」の文字があるごとが判明した場合、
このファイルの内容全て、又はこのファイルに対応する
イメージ記憶手段20の中のイメージを取り出して表示
手段8に表示する。
〔発明が解決しようとする課題〕
従来のファイルシステムは以上のように構成されている
ので、認識結果修正手段で認識結果を正しく修正する必
要があり、修正作業に必要以上の手間と時間を費ずとい
う問題点があった。
この発明は、上記のような問題点を解決するためになさ
れたもので、認識結果の修正作業を省くことの出来るフ
ァイルシステムを得ることを目的とする。
〔課題を解決するための手段〕
この発明に係るファイルシステムは、ファイルとして登
録すべき文書等の情報を読み取り画像信号に変換するイ
メージ入力手段2と、このイメージ人力手段2で画像信
号になったイメージから文字を切り出して認識し各文字
イメージ毎に類似度の高い認識候補文字を、文字イメー
ジと各認識候補文字とのiH以度とともに出力する認識
手段3と、この認識手段3の出力信号である認識結果を
記憶する認識結果記憶手段4と、入力された検索用キー
ワードと上記認識結果とを比較し検索用キーワードと同
じ文字列を上記認識結果から該類似度に基づいて検索す
る検索手段7aと、この検索手段7aで上記文書等の中
に検索用キーワードと同し文字列があると判断された場
合、その文書等のイメージ又は上記認識結果を表示手段
8に表示3−る制御等を行なう制御手段1とを備えたも
のである。
〔作用〕
イメージ入力手段2はファイルとして登録すべき文書等
の情報を読み取り画像信号に変換する。
認識手段3はイメージ入力手段2で画像信号になったイ
メージから文字を切り出して認識し各文字イメージ毎に
類似度の高い認識候補文字を、文字イメージと各認識候
補文字との類イ以度とともに出力する。認識結果記憶手
段4は認識手段3の出力信号である認識結果を記toす
る。検索手段7.3は入力された検索用キーワードと上
記認識結果とを比較し検索用キーワードと同し文字列を
上記認識結果から該類似度に基づいて検索する。制御手
段1は検索手段7aで上記文書等の中に検索用キワーl
と同じ文字列があると判断された場合、その文書等のイ
メージ又LJ」−記認識結果を表示手段8に表示する制
御等を行なう。
〔実施例〕
箇1図ばごの発明の一実施例に係るファイルシステムの
要部構成を示すブロック図である。第1図C乙ト旨1で
、第5図に示す構成要素に対応するものには同一・の符
号を付し、その説明を省略する。
第1図において、検索手段7aは図示しないキーボード
から人力された検索用キーワードと認識手段3による認
識結果とを比較し検索用キーワードと同じ文字列を上記
認識結果から該類似度に基づいて検索するものである。
即ち、この検索手段7aは認識候補文字と類似度とから
なる認識結果から類似度に基づいて直接に検索用キーワ
ード(と同じ文字列)を検索する。制御手段1は、検索
手段7aで文書等の中に検索用キーワードと同じ文字列
があると判断された場合、その文書等のイメージ又は認
識結果を表示手段8に表示する制御等を行なう。
第2図はこの実施例において登録の流れを示すフローチ
ャート、第3図はこの実施例において検索の流れを示す
フロートヤード、第4図はこの実施例において処理結果
を説明するための図である。
第4圓において、10は第7図に示す認識結果と同じも
のであり、12は検索された文字列、13は表示手段8
に表示する情報である。この情報13は認識結果記憶手
段4に記憶された各認識結果の第1位候補に対応してい
る。
次に第1M、第2図及び第4図を参照して登録の流れを
説明する。この登録処理は修正の部分を除き前述した従
来例と同一である。即ち、ステップSEIで用紙9をイ
メージ入力手段2に入力すると、ステップSE2ではイ
メージ入力手段2により用紙9のイメージは光電変換さ
れ、2植体号となり制御手段1に記憶され、続いてイメ
ージ記憶手段20に追加・記憶される。次にステップS
E3では、光電変換された2植体号から認識手段3では
文字部分を切り出して認識を行い、認識結果10を得る
。次にステップSB4では他の文書の認識結果とともに
、この認識結果10を認識結果記憶手段4に追加・記憶
する。
次に第1図、第3図及び第4図を参照して検索の流れに
ついて説明する。
ステップSRIでキーボードよりキーワード「化学」を
入力する。検索手段7aはステ・ノブSF?2において
、認識結果記憶手段4の中のファ、イルを順次ヂエック
する。例えば認識結果10の先頭文字から2文字毎に「
化学」の文字の組め合ね・lの有無を調べ、その組み合
ねセがある場合は総合類似度AR(類似度の平均)を求
める。
、二こでは、3回目に3文字目と4文字目の各候補文字
同士の9種1(3X3)の組合せの中から文字列I2が
検出され、そ゛の総合頻イ以度Arl!=(0,fii
o、8)/2=0.7であり、これがあらかじめ決めた
闇値を起え−(いるかを調べる(ステップS R3)。
闇値を起えている場合は、制御手段1はステップSR4
において、表示手段8に情報13を表示する。ファイル
中にキーワード「化学」がない場合、ステップSR5に
移り、次のファイルを5周べる。
なお、実施例では検索結果として、表示手段8に認識結
果を表示した場合について説明したが、イメージ記憶手
段20に記憶されている文書のイメージを表示してもよ
い。また、実施例では用紙として、文字しか記入されて
いないものについて説明したが、この発明はこれに限ら
ず文字列があれば、図面、カタログ、図書等のファイリ
ングについても同様の効果がある。
〔発明の効果〕
以上のように本発明によれば、検索手段により認識候補
文字と類似度とからなる認識結果から、その類似度に基
づいて直接に検索用キーワードと同じ文字列を検索する
ように構成したので、従来のように認識結果の修正作業
を省くことができ、ファイリング作業の効率が向上する
という効果が第1図はこの発明の一実施例に係るファイ
ルシステムの要部構成を示すブロック図、第2図はこの
実施例における登録の流れを示すフローチャート、第3
図みよこの実施例における検索の流れを示すフローチャ
ー1・、第4図(A)、 (B)、 (C)はこの実施
例において処理結果を説明するための図、第5図は従来
のファイルシステムの要部構成を示すブロック図、第6
図はファイルされている情報が記入されている用紙を示
す図、第7図は認識結果記憶手段に記憶されている内容
を示す図、第8図は従来例における検索処理を説明する
ための図である。
1・・・・・・制御手段、2・・・・・・イメージ入力
手段、3・・・・・・認識手段、4・・・・・・認識結
果記憶手段、7a・・・・・・検索手段、8・・・・・
・表示手段、20・・・・・・イメージ記憶手段。
代理人  弁理士  宮園 純− ■ C( rO 寸 ■

Claims (1)

    【特許請求の範囲】
  1. ファイルとして登録すべき文書等の情報を読み取り画像
    信号に変換するイメージ入力手段と、このイメージ入力
    手段で画像信号になったイメージから文字を切り出して
    認識し各文字イメージ毎に類似度の高い認識候補文字を
    、文字イメージと各認識候補文字との類似度とともに出
    力する認識手段と、この認識手段の出力信号である認識
    結果を記憶する認識結果記憶手段と、入力された検索用
    キーワードと上記認識結果とを比較し検索用キーワード
    と同じ文字列を上記認識結果から該類似度に基づいて検
    索する検索手段と、この検索手段で上記文書等の中に検
    索用キーワードと同じ文字列があると判断された場合、
    その文書等のイメージ又は上記認識結果を表示手段に表
    示する制御等を行なう制御手段とを備えたことを特徴と
    するファイルシステム。
JP2222197A 1990-08-23 1990-08-23 ファイルシステム Pending JPH04104367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2222197A JPH04104367A (ja) 1990-08-23 1990-08-23 ファイルシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2222197A JPH04104367A (ja) 1990-08-23 1990-08-23 ファイルシステム

Publications (1)

Publication Number Publication Date
JPH04104367A true JPH04104367A (ja) 1992-04-06

Family

ID=16778667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2222197A Pending JPH04104367A (ja) 1990-08-23 1990-08-23 ファイルシステム

Country Status (1)

Country Link
JP (1) JPH04104367A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736926A (ja) * 1993-06-28 1995-02-07 Nippon Telegr & Teleph Corp <Ntt> 不完全文字列と文字列の照合方法および装置
JPH08272813A (ja) * 1995-03-31 1996-10-18 Canon Inc ファイリング装置
US7756872B2 (en) 2005-07-14 2010-07-13 Seiko Epson Corporation Searching device and program product
JP2011034230A (ja) * 2009-07-30 2011-02-17 Rakuten Inc 画像検索エンジン

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736926A (ja) * 1993-06-28 1995-02-07 Nippon Telegr & Teleph Corp <Ntt> 不完全文字列と文字列の照合方法および装置
JPH08272813A (ja) * 1995-03-31 1996-10-18 Canon Inc ファイリング装置
US7756872B2 (en) 2005-07-14 2010-07-13 Seiko Epson Corporation Searching device and program product
JP2011034230A (ja) * 2009-07-30 2011-02-17 Rakuten Inc 画像検索エンジン

Similar Documents

Publication Publication Date Title
JPH087033A (ja) 情報処理方法及び装置
JPH04104367A (ja) ファイルシステム
JP3455643B2 (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JPH0492973A (ja) イメージ情報登録検索装置
JP2570784B2 (ja) 文書リーダ後処理装置
JPH0363895A (ja) 文字認識方式
JPH0484261A (ja) 誤り表記検索方式
Borpuzari et al. A Framework for Pre Processing, Recognizing and Distributed Proofreading of Assamese Printed Text
JP3466761B2 (ja) 文書処理装置及びその制御方法
JP2939945B2 (ja) ローマ字住所認識装置
JP2917310B2 (ja) 単語照合における単語辞書検索方式
JPH07160730A (ja) 全文検索装置
JPH05210635A (ja) 入力装置
JP4754889B2 (ja) 文字列抽出方法および装置
JPH0525139B2 (ja)
JP3774056B2 (ja) 文字処理装置
JPH08137860A (ja) 仮名漢字変換装置、および仮名漢字変換方法
JPH06223111A (ja) 電子ブックプレーヤ
JPH09259148A (ja) 符号照合装置及び符合照合方法
JPH08329186A (ja) 文書読取装置
JPH05324610A (ja) 住所表記漢字入力装置
JPH0863487A (ja) 文書検索方法及び文書検索装置
JPH06149889A (ja) 電子ファイリングシステム
JPH07334624A (ja) 文字認識装置
JPH0417085A (ja) 光学文字読取システム