JPH06325090A - 検索装置 - Google Patents

検索装置

Info

Publication number
JPH06325090A
JPH06325090A JP5115092A JP11509293A JPH06325090A JP H06325090 A JPH06325090 A JP H06325090A JP 5115092 A JP5115092 A JP 5115092A JP 11509293 A JP11509293 A JP 11509293A JP H06325090 A JPH06325090 A JP H06325090A
Authority
JP
Japan
Prior art keywords
character string
data
character
output
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5115092A
Other languages
English (en)
Inventor
Yoshinori Yamazaki
芳則 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5115092A priority Critical patent/JPH06325090A/ja
Publication of JPH06325090A publication Critical patent/JPH06325090A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 検索装置に関し、前方一致で検索された文字
列から検索対象の文字列を効率的に検出できることを目
的とし、 【構成】 検索元の文字列のうち、指定文字より前方の
文字列が一致し、且つ検索元の前記文字列の先頭からの
長さが一致する文字列をデータベースより検索し出力す
る検索装置であって、前記文字列を検索し取得するデー
タ取得部(1) と、検索元の文字列のうちの少なくとも前
記前方文字列を除く後方文字列を含む文字列と、前記取
得した文字列のうちの対応する文字列との一致不一致を
桁対応で照合する一致チェック部(2) と、取得した前記
文字列を、前記一致チェック部の照合に基づき、文字の
一致率の高い順に出力する出力優先順位判定部(3) とを
有するように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、OCR(光学式文字読
取り装置)における認識データを修正する場合等に使用
される検索装置に関する。
【0002】近年のOCR認識システムの導入に伴い、
認識不可能データおよび誤認識データの修正オペレーシ
ョンの簡易化が要求されている。
【0003】
【従来の技術および発明が解決しようとする課題】図8
は従来例の説明図である。金融システム等では、例え
ば、振込依頼伝票からの振込情報の入力を簡易化するた
め、図8に示すように、顧客の記入した依頼伝票10をO
CR11で読取る方法が採用されている。
【0004】このOCR11での文字認識率は、現状では
100%に達していないので、図8に示すように、OC
R11で認識された文字データ(認識データ)をイメージ
データとともに金融端末12に表示させ、オペレータが目
視でイメージデータと認識データとを比較して認識デー
タに修正を施した後、この修正データを確定データとし
て入力している。
【0005】ここで、修正オペレーションとしては、
(1) 認識不可能データ(図8の?)上にカーソルを自動
誘導する等、修正箇所を指定するためのカーソル移動操
作を簡易化する、(2) オペレータに文字列のうちの前方
の文字が一致している文字位置にカーソルを移動させ、
そのカーソル位置より前方の文字列が一致するデータを
データベースより検索し、且つ表示してオペレータに選
択させる、等の方法が考えられるが、(1) の方法は、誤
認識データ(例えば図8の項目2における数字3に対す
る認識データの数字8)は装置では識別不可能なため、
誤認識データが存在した時はオペレータがカーソルを移
動して修正を行わなければならない。
【0006】また(2) の方法は、前方文字列のみ検索対
象となるので抽出されるデータ数が場合によっては多く
なり、且つ通常検索順に表示されるから、所望のデータ
を見つけるのに時間を要するといった問題が生じる。
【0007】このため、従来では、OCR認識データの
誤認識データおよび認識不可能データの修正オペレーシ
ョンの簡易化が出来ず、一文字単位に修正しなければな
らないといった課題があった。
【0008】本発明は、上記課題に鑑み、前方一致文字
列のうち、所望の文字列がより早く出力される検索装置
を提供することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、本発明の検索装置は、図1の本発明の原理図に示す
ように、 (1) 検索元の文字列のうち、指定文字より前方の文字列
が一致し、且つ検索元の前記文字列の先頭からの長さが
一致する文字列をデータベースより検索し出力する検索
装置であって、前記文字列を検索し取得するデータ取得
部1と、検索元の文字列のうちの少なくとも前記前方文
字列を除く後方文字列を含む文字列と、前記取得した文
字列のうちの対応する文字列との一致不一致を桁対応で
照合する一致チェック部2と、取得した前記文字列を、
前記一致チェック部の照合に基づき、文字の一致率の高
い順に出力する出力優先順位判定部3とを有するように
構成する。 (2) 上記(1) において、出力優先順位判定部を、得られ
た文字列のうち、文字の一致率が所定値以上の文字列を
出力対象とするように構成する。 (3) 上記(1) または(2) において、出力対象となる文字
列を、決定された優先順序に基づき、所定表示域に順次
切り替え表示する単データ表示部を有するように構成す
る。 (4) 上記(1) または(2) において、出力対象となる文字
列を、決定された優先順序に基づき一覧表示する全デー
タ表示部を有するように構成する。 (5) 上記(1) または(2) において、出力対象となる文字
列を所定表示域に順次切り替え表示する単データ表示部
と、該文字列を決定された優先順序で一覧表示する全デ
ータ表示部と、出力対象となるデータ数により、所定表
示域へ順序切替え表示するか一覧表示するかを判定する
表示判定部とを有するように構成する。
【0010】
【作用】データ取得部1は、検索元文字列中の指定文字
より前方の文字列を検索キーワードとして、データベー
スより、検索元文字列と文字数が同一の前方一致文字列
を検索し取得する。
【0011】一致チェック部2は、検索元文字列のうち
の少なくとも前記前方文字列を除く後方文字列を含む文
字列と、取得した前方一致文字列のうちの対応する文字
列とを桁対応で一致不一致の照合を行い、出力優先順位
判定部3は、一致チェック部1で得られた文字の一致率
(ヒット率、一致する文字の数;ヒット数等でもよい)
の高い順に出力順を決定する。
【0012】以上のごとく、一致チェック部2の照合に
より、指定文字より後方の文字列の一致不一致の多少が
出力順序に反映されるので、所望の検索対象文字列が優
先的に出力されるようになる。
【0013】この際、所定一致率(以下出力許容ヒット
率)を設定し、この出力許容ヒット率より高いヒット率
のデータのみ出力するようにすると、前方一致ではある
が後方文字列が不一致の無駄なデータの出力を排除する
ことができ、検索が効率的となる。
【0014】従来例で示したOCR等の修正オペレーシ
ョンにおいては、単データ表示部により、出力対象とな
る文字列を、決定された優先順序に基づき所定表示域に
順次切り替え表示する。
【0015】図2の本発明(その1)の説明図は、OC
Rの認識データのうちの銀行名の修正を例として、単デ
ータ表示部による表示例を示したもので、文字指定方法
は、カーソル位置より前方(カーソル位置は除く)とし
ている。従って、図2では、検索キーワードは、(2) に
示すように、“ア”である。
【0016】データベースには取扱銀行名が格納されて
おり、先頭文字が“ア”で、且つ10文字の銀行名が検
索される。この結果、検索順に、“アサカ゛オキ゛ンコ
ウ”,“アシ゛サイキ゛ンコウ”,“アシ゛サイノウキ
ョウ”が得られたとすると、この取得データと図2の
(1) で示す認識データの“アシ゛サイキン?ニウ”とを
“ア”の次の文字(後方データ)から桁対応で照合す
る。
【0017】この結果、“アサカ゛オキ゛ンコウ”は3
文字ヒットし、“アシ゛サイキ゛ンコウ”は6文字ヒッ
トし、“アシ゛サイノウキョウ”は4文字ヒットするか
ら、検索元のOCR認識データの表示領域、ここでは
“アシ゛サイキン?ニウ”が表示された位置に検索キー
押下ごとにヒット数の多い順に切り替え表示する。
【0018】いまの場合、イメージデータで認識される
記入データは“アシ゛サイギンコウ”であるから、最初
に“アシ゛サイギンコウ”が表示された時点で、例えば
終了キーを押下した後、次の項目(例えば口座番号)の
修正オペレーションに進む。
【0019】以上のごとく、後方一致率順に出力順を決
定するため、カーソル位置を設定し所定キーを押下する
のみで、最も真のデータに近い順から表示されるように
なり、修正オペレーションが効率化される。
【0020】表示の方法として、前述した単データ表示
の代わりに、全データ表示部により出力対象となる全デ
ータを一致率による優先順序で表示し、オペレータによ
り選択させてもよい。
【0021】図3の本発明(その2)の説明図は、この
全データ表示例を示したもので、図2と同様にして前方
一致文字列を取得し、ヒット率の高い順に取得したデー
タを整列して一覧表示する。
【0022】これにより、オペレータは、一覧表示に付
された選択記号、ここでは"1" を入力する。これによ
り、“アシ゛サイキン?ニウ”の表示域に“アシ゛サイ
キ゛ンコウ”が表示される。
【0023】なお、単データを優先順序に従って切替え
表示するか、全データを一覧表示するかを出力対象デー
タ数によって決定するようにすれば、オペレーション時
間がさらに短縮される。
【0024】以上のごとく、複数個の前方一致文字列を
後方文字列のヒット率(ヒット数)で出力優先順位を判
定するようにしたため、検索対象の文字列に最も近い文
字列が優先的に出力されるようになり、効率的に検索で
きる。
【0025】
【実施例】図4は一実施例の構成図、図5は定義体例を
表す図、図6は動作(その1)フローチャート図、図7
は動作(その2)フローチャート図である。
【0026】図4は、図8で示したOCR11の認識デー
タを修正する金融端末装置12に適用した例を示したもの
で、項目(銀行名,氏名,口座番号等)ごとに出力許容
ヒット率を持ち、この出力許容ヒット率以上で出力対象
とされたデータ数が5以下の場合は単データ表示、6以
上の場合は一覧表示する例を示す。なお、出力許容ヒッ
ト率の設定は、OCR11の機種等により予め設定され
る。
【0027】図4において、20はインタフェース部で、
OCRとの間でデータのやりとりを行う。25はOCR制
御部で、図示省略したがOCR定義体を持ち、このOC
R定義体に基づいて伝票から読取る項目(銀行名,氏
名,口座番号等)ごとの位置情報,その項目が数字か文
字か等の文字種別,イメージデータ付きか否かの指示等
をOCRに指定し、OCRから受信したイメージデータ
および対応する認識データ(コード)をメモリ29に項目
別に格納する。なお、この格納アドレスは、これも図示
省略したが、表示される画面上の位置と対応付けされた
マッピング定義体に基づいて決定される。また、候補キ
ー23押下により前方一致検索部26を起動する。
【0028】30は表示制御部で、図示省略したが、イメ
ージデータおよび認識データの表示枠, 項目番号等を表
示する情報の集合体である表示定義体を持ち、この表示
定義体に基づいて、メモリ29に格納されたOCRからの
データを表示部32に出力し、図8に示すように、イメー
ジデータと認識データとを並べて画面上の所定位置に表
示する。また、前方一致検索部26で検索され、メモリ31
に格納された取得データ24を、単データ表示指示または
全データ表示指示に従って画面上の所定位置に表示す
る。
【0029】27は定義体で、図5に示すように、前方一
致のための制御パラメータ等が集合体としてファイルさ
れたものである。28はデータベースで、取扱銀行名,顧
客氏名,口座番号等のデータ(知識データ) の集合体で
あり、外部記憶装置等に格納されている。
【0030】26は前方一致検索部で、データ取得部33,
図示省略したが取得データ34を格納するメモリ領域, 一
致チェック部35, 表示判定部36等より構成される。ここ
で、データ取得部33は、候補キー23が押下されてOCR
制御部25より起動されたとき、レジスタ等に格納されて
いるカーソル位置情報24を読み取り、このカーソル位置
情報24に対応する認識データ(銀行名等の文字列、図2
ではアシ゛サイキ?ンニウ、以下図2,図3で説明す
る)をメモリ29より抽出し、カーソル位置より前方の文
字列、例えば“ア”を検索キーワードとしてデータベー
ス28を検索し、先頭文字が“ア”で10桁のデータを取
得する。なお、検索する際は、定義体27を参照し、カー
ソル位置に対応する項目のデータベース識別名を獲得し
て、対応するデータベースを検索する。
【0031】一致チェック部35は、データ取得部33で取
得した取得データ24と、メモリ29より読み取った認識デ
ータとを“ア”を除く後方文字列について桁対応で照合
し、一致不一致によりヒット率を演算し、取得データ24
のうち、出力許容ヒット率以上のデータをヒット率の高
い順に編集しメモリ31に格納する。
【0032】表示判定部36は、定義体27より、順次切り
替え表示か、全データ表示かのデータ数を獲得し、メモ
リ31に格納した取得データ24が5以下のときは、表示制
御部30に単データ指示(順次切り替え表示) を、6以上
のときは全データ表示を指示する。なお、表示形式はこ
こで編集される。
【0033】なお、21はカーソルキーで表示画面上のカ
ーソルの移動に使用される。22は検索キーで、単データ
表示のとき、表示切り替え時に押下される。23は候補キ
ーで、前方一致検索のときカーソル位置が決定したとき
押下される。その他図示省略したが、取消キー,終了キ
ー等を備える。
【0034】図5は定義体27の内容例を示したもので、
出力するか否かを決める項目別の出力許容ヒット率、表
示形式として単データか全データかを決定するデータ
数, 全データの場合は表示位置, サイズ, 得られた文字
列をどの項目に出力するかの対応情報であるデータ出力
項目情報、および入力項目番号で対応付けされたデータ
ベース識別名等が定義されている。
【0035】以上の構成において、OCRから各項目の
イメージデータと対応する認識データとを受信し、表示
部32に表示した以降の修正オペレーションおよび動作の
1例を、図6,図7を参照しつつ以下に説明する。
【0036】(S1)では、オペレータが前方一致入力を行
う箇所までカーソルを移動する。図2では、(3) に示す
ように、先頭文字“ア”を検索キーワードとするため、
次の文字“シ”にカーソルを移動している。なお、
“ア”がイメージデータと一致していない場合は、(2)
の状態で“ア”を入力して修正する。これにより、先頭
文字が修正されるとともに、カーソルが次文字に移動す
る。
【0037】(S2)では、オペレータが前方一致検索を行
うために候補キー23を押下する。これにより、前方一致
検索部26が起動される。(S3)では、カーソル位置より前
方のデータを、検索を行うためのキーワードとして取得
する。また、カーソル以降のデータ(後方データ) を出
力優先順位を決定する判断データとして保存しておく。
【0038】(S4)では、カーソル位置に対応する項目番
号に基づき、定義体27からアクセスすべきデータベース
識別名を取得する。(S5)では、検索キーワードとなる前
方データと桁数とに基づき、データベース28の検索を行
い、前方一致データを取得する。
【0039】(S6)では、データベース28よりデータを取
得できたか判断する。なお、取得できない場合は、デー
タなしのメッセージを表示し、初期状態に戻る。以上は
データ取得部33の動作であり、いまの場合、先頭文字が
“ア”で、且つ10桁の銀行名がデータベース28より取
得された。
【0040】(S7)では、データベース28より取得したデ
ータを出力対象とするか否かの情報である出力許容ヒッ
ト率を定義体27より取得する。(S8)では、データベース
28より取得したデータと、(S3)にて保存した後方データ
との間で桁単位に照合する。
【0041】(S9)では、照合結果、出力許容ヒット率を
越えたか否かを判断する。(S10) では、出力許容ヒット
率を越えたデータのみを有効としてヒット率の高い順に
メモリ31に格納する。
【0042】(S11) ではデータベース28より取得したデ
ータを全て処理したか否かを判断をする。(S12) では、
出力許容ヒット率を満足した出力対象データがあるか否
か判断する。
【0043】以上は、一致チェック部35の動作で、デー
タ取得部33により取得した前方一致データのうち、出力
許容ヒット率以上のデータが、メモリ31に優先順に格納
された。
【0044】(S13) では、各出力対象データをそれぞれ
表示する形式に編集する。(S14) では、得られたデータ
数から表示形式を単データ出力か全データ出力かを判断
する。
【0045】(S15) は、全データ表示の場合で、全デー
タを優先順位に従い画面に一覧表示を行う。(S16) で
は、一覧表示よりオペレータに選択を促す入力依頼を行
う。
【0046】(S17) では、オペレータが入力したデータ
の判断を行う。この際、誤って入力した場合等で図示省
略した取消キーが押下された場合は(S23) に移行する。
選択番号が入力された場合、(S18) に移行する。
【0047】(S18) では、当該項目の表示欄に選択され
た番号のデータを表示する。(S19) は、単データ出力の
場合で、出力許容ヒット率が最も高いものをその項目の
表示欄に出力する。同率の場合はデータベース28より検
出された順の早いものを表示出力する。また、入力依頼
を行い、次候補出力の準備を行う。
【0048】(S20) では、検索キー22が押下されたか否
か判断を行う。図示省略した終了キーが押下された場合
はデータは確定となる。検索キー22が押下された場合、
(S21) に移行する。
【0049】(S21) では、検索キー22が押下された時、
次のデータがあるか否かの判断を行う。次データがある
場合は(S22) に移行し、データが無い場合は(S23) に移
行する。
【0050】(S22) では、次優先のデータを表示出力
し、次候補出力の準備を行う。(S23) では、初期の検索
キー22押下した状態(ここの例ではOCR認識データ表
示状態)に移行する。(S23) では、検索キー22を押下を
したが、出力対象データがないとき、その旨の表示を行
う。
【0051】以上が表示判定部36の動作である。以上の
ごとく、前方一致で検索されたデータ数が6以上のとき
は優先順序に基づき一覧表示され、対応する番号を入力
することにより、データが確定して入力される。また、
データ数が5以下のときは、優先順に切替表示され、正
しいデータが表示されたとき終了キーを押下することに
より、データが確定して入力される。
【0052】以上説明したように、前方一致検索におい
て、後方データのヒット率により、検索された文字列の
出力優先順位を決定するので、検索対象の文字列の検出
が容易となり、従って検索効率が大幅に改善される。
【0053】
【発明の効果】以上説明した様に、本発明によれば前方
一致データのうち、後方データの一致率に基づいて優先
出力するものであるから、OCR認識データの修正オペ
レーション時等において、最小オペレーションにて認識
不可能データや誤認識データを修正できる効果を奏す
る。
【図面の簡単な説明】
【図1】 本発明の原理図
【図2】 本発明(その1)の説明図
【図3】 本発明(その2)の説明図
【図4】 一実施例の構成図
【図5】 定義体例を表す図
【図6】 動作(その1)フローチャート図
【図7】 動作(その2)フローチャート図
【図8】 従来例の説明図 1 データ取得部 2 一致チェッ
ク部 3 出力優先順位判定部 10 依頼伝票 11 OCR 20 インタフェ
ース 21 カーソルキー 22 検索キー 23 候補キー 24 カーソル位
置情報 25 OCR制御部 26 前方一致検
索部 27 定義体 28 データベー
ス 29 メモリ 30 表示制御部 31 メモリ 32 表示部 33 データ取得部 34 取得データ 35 一致チェック部 36 出力優先順
位判定部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 検索元の文字列のうち、指定文字より
    前方の文字列が一致し、且つ検索元の前記文字列の先頭
    からの長さが一致する文字列をデータベースより検索し
    出力する検索装置であって、 前記文字列を検索し取得するデータ取得部(1) と、 検索元の文字列のうちの少なくとも前記前方文字列を除
    く後方文字列を含む文字列と、前記取得した文字列のう
    ちの対応する文字列との一致不一致を桁対応で照合する
    一致チェック部(2) と、 取得した前記文字列を、前記一致チェック部の照合に基
    づき、文字の一致率の高い順に出力する出力優先順位判
    定部(3) とを有すること特徴とする検索装置。
  2. 【請求項2】 該出力優先順位判定部は、得られた文
    字列のうち、文字の一致率が所定値以上の文字列を出力
    対象とするものであることを特徴とする請求項1記載の
    検索装置。
  3. 【請求項3】 出力対象となる文字列を、文字の一致
    率に基づき決定された優先順序に従い、所定表示域に順
    次切り替え表示する単データ表示部を有することを特徴
    とする請求項1または請求項2記載の検索装置。
  4. 【請求項4】 出力対象となる文字列を、決定された
    優先順序に整列して一覧表示する全データ表示部を有す
    ることを特徴とする請求項1または請求項2記載の検索
    装置。
  5. 【請求項5】 出力対象となる文字列を順次所定表示
    域に切り替え表示する単データ表示部と、該文字列を優
    先順位に整列して一覧表示する全データ表示部と、出力
    対象となるデータ数により、切替表示するか一覧表示す
    るかを判定する表示判定部とを有することを特徴とする
    請求項1または請求項2記載の検索装置。
JP5115092A 1993-05-18 1993-05-18 検索装置 Withdrawn JPH06325090A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5115092A JPH06325090A (ja) 1993-05-18 1993-05-18 検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5115092A JPH06325090A (ja) 1993-05-18 1993-05-18 検索装置

Publications (1)

Publication Number Publication Date
JPH06325090A true JPH06325090A (ja) 1994-11-25

Family

ID=14654010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5115092A Withdrawn JPH06325090A (ja) 1993-05-18 1993-05-18 検索装置

Country Status (1)

Country Link
JP (1) JPH06325090A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010073174A (ja) * 2008-09-22 2010-04-02 Fuji Xerox Co Ltd 文書処理装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010073174A (ja) * 2008-09-22 2010-04-02 Fuji Xerox Co Ltd 文書処理装置及びプログラム

Similar Documents

Publication Publication Date Title
KR960002079A (ko) 이미지 인식장치 및 방법
JPH0916619A (ja) 情報処理方法及び装置
JPH087033A (ja) 情報処理方法及び装置
JP3230641B2 (ja) 文字列検索装置
JPH06325090A (ja) 検索装置
JP3673553B2 (ja) ファイリング装置
JP3376808B2 (ja) 単語入力装置並びに単語入力方法
JP2000331023A (ja) 情報検索装置及び情報検索処理プログラムを記憶した記憶媒体
JPH07302306A (ja) 文字入力装置
JP3383485B2 (ja) 情報検索装置
JP3505610B2 (ja) 文書検索システム
JP3071745B2 (ja) 文字認識結果の後処理方法
JP2001283150A (ja) データ入力方法およびイメージエントリシステム
JPH09160907A (ja) 文書処理装置及び方法
JPH064600A (ja) イメージ検索方法およびイメージ検索装置
JP2935533B2 (ja) 文字処理方法
JP3351039B2 (ja) 情報処理装置および方法
JPH04106663A (ja) 文書分類装置
JPH05233713A (ja) 学習形あいまい検索方法
JPH0355874B2 (ja)
JPH09161014A (ja) 文字認識装置
JPS5827268A (ja) 日本語処理装置
JP2000347995A (ja) データ複合識別方法およびその装置
JPH04230576A (ja) 項目選択装置
JPH05120493A (ja) 文字認識方法及びその装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000801