JPH0612521A - 光学文字読取システム - Google Patents

光学文字読取システム

Info

Publication number
JPH0612521A
JPH0612521A JP4166338A JP16633892A JPH0612521A JP H0612521 A JPH0612521 A JP H0612521A JP 4166338 A JP4166338 A JP 4166338A JP 16633892 A JP16633892 A JP 16633892A JP H0612521 A JPH0612521 A JP H0612521A
Authority
JP
Japan
Prior art keywords
word
character
candidate
words
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4166338A
Other languages
English (en)
Inventor
Takeyuki Sugimoto
建行 杉本
Hiroaki Shimokawabe
宏明 下川部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4166338A priority Critical patent/JPH0612521A/ja
Publication of JPH0612521A publication Critical patent/JPH0612521A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字読取結果に単語照合をして、読取精度を
向上する光学文字読取システムにおいて、読取結果を操
作者が修正する際、単語単位ないし連続する複数の単語
単位で修正候補の単語ないし単語列を表示し、かつこの
複数単語単位で一括修正することにより、修正操作を正
確にかつ短時間で行なう。 【構成】 帳票の記入文字パターン20が読取られ文字
認識部で認識され、その認識結果21と認識候補文字2
2が単語照合部へ送られる。単語照合の結果得られた候
補単語23は、その先頭文字位置毎に分類して(第1〜
第5カラム)格納される。表示部では、複数候補単語を
連続したものの組(カーソル指示された文字位置に先頭
文字が位置する候補単語例えば「電話料」と、この候補
単語の後に繋がる候補単語例えば「分割払い」との組)
を何組か作りこれらの組を同時に表示する。操作者は表
示された候補単語を組単位で一括選択して修正する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学文字読取システム
に係り、特に読取結果を単語単位で修正し、修正を容易
にするのに好適な光学文字読取システムに関する。
【0002】
【従来の技術】一般に、光学文字読取システムにおいて
は、読取不能文字が出現した場合、読取不能文字あるい
は読取不能文字を含むフィールドの画面をイメージ情報
として修正画面に表示し、操作者はこの表示画面にドッ
ト単位に表示された画像を見て、読取不能文字の判読を
行ない、キーボードなどから1文字単位に正解を入力す
ることで修正作業を遂行することが行なわれている。
【0003】また、文字読取装置により帳票上の文字列
を読取り、読取結果と単語辞書との照合を行ない読取精
度(読取率)を向上させる方法として、特開昭61−1
61588号公報に記載された方式がある。この方式
は、帳票から読取ったべた書きの(単語に分割されてい
ない)文の1文字毎に、その文字を先頭(または最終)
文字とする単語を単語辞書から抽出して候補単語群を作
り、更に重み計算回路及び整合度計算回路を用いて候補
単語群の中から最も整合度のよい単語を抽出するもので
あるが、修正方法については考慮されておらず、特に、
文を構成する連続するいくつかの単語間のつながり具合
を考慮して文全体を修正しようとする考えは、なにも示
されていない。
【0004】
【発明が解決しようとする課題】上記ドット単位に表示
された画像を見て1文字単位に修正を行なう方式では、
操作者は1文字毎に正解と思われる文字を入力しまたは
入力し直さなければならないので、その作業は極めて煩
雑で時間がかかり、また全体の文の正誤チェックを十分
に行なうことができない。
【0005】また、上記公開公報に示される従来技術で
は、単語の抽出は1文字毎に行なわれているので、仮に
この従来技術を修正技術に適用しようとする場合、例え
ば、経理伝票のような帳票などの住所・氏名または商品
名や適要欄等の項目の読取りにおいて、単語照合を実施
し修正を行なう場合には、文字単位にカーソルを動かし
て次々の候補単語の取捨選択を決めて行かなければなら
ず、操作者にとって作業が非常に煩雑であり、また修正
の途中では後に続く単語との繋がり具合も見通せないた
め、正しい単語を選ぶことが困難である。
【0006】従って、本発明の目的は、上記従来技術の
問題点を克服し、帳票の住所氏名,商品名,摘要欄等の
項目など一連の単語列からなる文の読取り修正を行なう
際に、単語単位で修正が行なわれるようにすると共に、
この文を構成する相続く複数の候補単語、すなわち、カ
ーソル等で指示される文字位置に先頭文字が位置してい
る候補単語及びこの候補単語の後ろに続く1または複数
の候補単語を同時に続けて表示することによって、操作
者が修正文全体の候補を見通した上で、単語単位の修正
を短時間に容易に正確に行なうことができる光学文字読
取システムを提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、帳票等の文書の文字パターンを読出して
1文字単位の文字認識をした後、単語辞書と照合して単
語照合結果を表示し、単語照合結果に基いて修正をする
光学文字読取システムにおいて、照合結果得られた候補
単語を候補単語の先頭文字位置毎に分類して格納する候
補単語格納手段と、操作者によりカーソル等により指示
された文字位置に先頭文字が位置する候補単語及びこの
候補単語の後ろに続く候補単語を連続して同時に表示し
選択する表示及び選択手段とを備えたことを特徴とす
る。
【0008】この表示手段は、また読取り結果の表示部
を有し、前記単語照合した単語単位に区切れがわかるよ
うにするため、この表示部で、単語毎にアンダライン等
の表示をすることができる。表示している候補単語を選
択し、読取り結果をこの選択した候補単語で置き換えた
とき、置き換えた単語単位の区切りがわかるように、読
取り結果の表示部の表示を変更することができる。
【0009】前記の、指示された文字位置に先頭文字が
位置する候補単語とこの候補単語の後ろに続く候補単語
とを連続して同時に表示し選択する表示及び選択手段に
おいて、1単語毎に候補単語を選択する手段と、複数の
連続する候補単語をまとめて選択する手段とを設けるこ
とができる。この場合、選択すべき各単語の区切りがわ
かるようにするため、各単語に仕切りを入れる等の表示
をすることができる。
【0010】
【作用】上記構成の基づく作用を説明する。
【0011】本発明によれば、経理伝票等の帳票類の文
書の文字パターンを読出して1文字単位で文字認識をし
た後、単語照合をして得られた候補単語を用いてこの文
書中の例えば氏名住所欄や摘要欄などのある項目の文を
修正する場合に、照合して得られた候補単語群を候補単
語の先頭文字位置毎に分類して格納しておき、更に、カ
ーソル等により指示される文字位置に先頭文字が位置す
る候補単語と合わせてこの候補単語の後ろに続く(繋が
る)候補単語も連続して同時にまとめて表示するように
したので、操作者はこれらの連続する複数の候補単語繋
がり具合を見通して正確な文を見つけることができる。
【0012】また、選択に際しては、このように続けて
表示した複数の候補単語を一度の操作でまとめて選択
し、読取結果表示部の内容をこの選択した複数の候補単
語でもって一挙に修正できるので、操作者は、修正作業
を簡便に正確にかつ迅速に(短時間に)遂行することが
可能となる。
【0013】
【実施例】以下に、本発明の実施例を図面により説明す
る。
【0014】図1は、本発明の一実施例である光学文字
読取システムの構成を示すブロック図、図2は修正操作
時の動作説明図である。
【0015】図1で1は光学文字読取装置、2はCRT
等の表示部、3は帳票、4は光電変換部、5は切出し
部、6は書式バッファ、7は制御部、8は認識部、9は
キーボード等の入力手段、10は単語照合部である。帳
票3は光電変換部4で光学的に走査されて読取られ、読
取られた文字は2値化パターンに変換されて、バッファ
メモリ(図示せず)に格納される。
【0016】ついで、バッファメモリに格納された帳票
1面分のパターンは切出し部5に送られ、ここで書式バ
ッファ6内に格納された書式に従い、文字パターンが切
出され、切出されたパターンは制御部7を通して認識部
8に渡される。認識部8は、1文字ずつこの切出しパタ
ーンの文字認識を行い認識結果を認識候補文字と共に制
御部7へ渡す。
【0017】制御部7では、認識結果および認識した文
字に対応した認識候補文字を単語照合部10へ渡す。単
語照合部10では、認識結果および候補文字より単語照
合を行い、照合結果および候補単語を制御部7へ渡す。
【0018】制御部7では、照合結果および候補単語を
CRT等の表示部2に出力し、オペレータは、キーボー
ド等の入力手段9を介して、候補単語の選択を行う。
【0019】修正操作の具体例を図2で説明する。帳票
3上に記入された文字20を認識部8が認識したとき、
認識結果21と認識候補文字22を出力したとする。単
語照合部10は認識結果21及び候補文字22を単語辞
書(単語単位の辞書)と照合してこの単語辞書から図2
の23に示すように候補単語をピックアップし、ピック
アップした候補単語23を制御部7へ渡す。このとき、
先頭に「電」の付く単語群,先頭に「話」の付く単語
群,先頭に「料」の付く単語群,先頭に「分」の付く単
語群,……のように1文字ずつしらべてピックアップし
て行く。またこのとき、候補単語23は、候補単語の先
頭文字位置毎に分類され且つ各々の分類内の候補単語は
優先順位順にソートされ、単語長が付加されて制御部7
へ渡される。本例では、第1カラムは全文の1文字目
「電」、第2カラムは全文の2文字目「話」、第3カラ
ムは全文の3文字目「料」、……のように対応してい
る。制御部7は、図3に示すように、候補単語23を表
示部2に表示する。この場合、連続する2つ以上の候補
単語を色々組合わせて表示する。図3の23の例では、
カラム1(全文の1文字目から始まる単語)中の3文字
の単語「電話料」とカラム4(全文中の4文字目から始
まる単語)中の4文字の単語「分割払い」とを組合せた
例1や、カラム1中の2文字の単語「電話」とカラム3
(全文中の3文字目から始まる単語)中の2文字の単語
「料金」とカラム5(全文中の5文字目から始まる単
語)中の3文字の単語「支払い」とを組合せた例2が示
される。オペレータは、それらの組合せ例を見比べて、
正しいと思われるものを選択する。
【0020】図8は、制御部7により候補単語23を表
示部2に表示する表示方法の一例を示すフローチャート
で、このフローによりいくつかの候補単語を繋いだもの
を作ることができる。図8のフローについて説明する。
aは現在着目しているカラムの番号である。Nは読取エ
リアの文字数である。L1は注目している単語の長さ、
jは注目しているカラム中の第j番目の候補、kは表示
出力される候補の表示順位(図3の23中の数字1,
2,…)を表わす。ステップ100では、単語列を作成
するエリアをクリアする。ステップ104では、カラム
aの処理対象候補単語が存在するかどうかをチェックす
る。ステップ105では、カラムaの既に処理された単
語と単語長の異なる単語を選び出している。初回はL1
=0なので、第1候補単語をメモリ上の単語列エリアに
マージする。ステップ108では、マージした単語長分
だけ処理カラムを進める。ステップ109では、処理カ
ラムが読取エリアの終了まできたかをチェックしてい
る。ステップ110で、カラムiの第1候補単語を単語
列エリアにマージしている。ステップ111では、マー
ジした単語長分だけ処理カラムを進める。ステップ11
0及び111は、読取エリアの終了まで行なわれる。こ
こまでの処理で第1候補単語列が作成される。次に、ス
テップ102に戻って、単語列エリアを第2候補単語列
エリアに変更するためkを+1する。ステップ103で
は、カラムaの未処理単語をサーチするためjを+1す
る。ステップ105では、前回と異なる単語長の単語を
選び出す。
【0021】以下、前回と同様の処理をカラムaの対象
単語がなくなるまで実行する。候補単語が図2の23の
場合は、単語列エリアに図3の23の1と2に示す2種
類の単語列ができる。
【0022】ここではオペレータは、表示部2に表示さ
れた候補単語をキー等により選択することにより、一度
のキー操作で複数の候補単語の繋がったものを一括して
選択し、読取り結果を修正することができる。図3の場
合、2のキーを押すことにより、3つの候補単語の繋が
った「電話料金支払い」で認識結果21を置換する。こ
のように、本実施例によれば、一度の操作で複数の単語
を選択し、認識結果を修正できるので、オペレータの負
担を軽減できる。
【0023】次に、認識結果と候補文字の表示選択方法
を各種説明する。図4は、照合結果をオペレータの介入
なしに置換した例であり、候補単語の区切りがわかるよ
うに、アンダーラインを分割して表示している。この表
示方法により、オペレータは読取結果の間違いを見つけ
易くなる。
【0024】図5は、候補単語を選択しなおしたときの
例であり、読取結果のアンダーラインが、選択し直した
候補単語の区切りに変化している。
【0025】図6は、候補単語の選択方法についての説
明であり、図6の候補単語列の先頭部分31をマウス等
で指定することにより、該当する行の単語列33,34
で構成される「電話料分割払い」を一括選択し、認識結
果を置換する。同様に、先頭部分32を指定すると該当
する行の単語列35,36,37で構成される「電話料
金支払い」が一括選択され、認識結果が置換される。ま
た、単語を単独で選択することもできる。例えば、単語
「料金」36をマウス等で指定することにより、認識結
果「電話料分支払い」21が「電話料金支払い」に修正
される。
【0026】図6,図7は候補単語の表示方法の例を示
したものであり、候補単語の区切り表示する方法(図
6)と、区切りを表示しない方法(図7)である。
【0027】なお、単語の区切りを示す方法として、ア
ンダーラインや罫線(枠)の例を示したが、他の方法と
して単語単位に色を変える方法も考えられる。
【0028】
【発明の効果】以上詳しく説明したように、本発明の光
学文字読取システムによれば、帳票等の文書の文字パタ
ーンを読出して修正をする場合に、修正のための候補単
語を表示する手段として、カーソル等により指示される
文字位置に先頭が位置する候補単語だけでなく、この候
補単語と合わせてこの候補単語の後ろに続く候補単語を
連続して同時に表示するようにしたので、操作者はこれ
らの候補単語の繋がり具合を見て、読取り結果の間違い
を容易に発見し正確な修正文を見出すことができる効果
がある。
【0029】また、選択修正に際しては、このように連
続表示した複数の候補単語を一度の操作でまとめて選択
して修正することができるので、操作者は、修正作業を
簡単に正確にかつ短時間に行なうことができる効果があ
る。
【図面の簡単な説明】
【図1】本発明の一実施例の光学文字読取システムの構
成を示すブロック図である。
【図2】修正操作時の動作説明図である。
【図3】表示部の表示画面の例を示す図である。
【図4】表示部の表示画面の例を示す図である。
【図5】表示部の表示画面の例を示す図である。
【図6】表示部の表示画面の例を示す図である。
【図7】表示部の表示画面の例を示す図である。
【図8】制御部により候補単語を表示部に表示する方法
の一例を示すフロー図である。
【符号の説明】
1 光学文字読取装置 2 表示部 3 帳票 4 光電変換部 5 切出し部 6 書式バッファ 7 制御部 8 認識部 9 入力手段 10 単語照合部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 帳票等の文書の文字パターンを読出して
    1文字単位の文字認識をした後、単語辞書と照合して単
    語照合結果を表示し、単語照合結果に基いて修正をする
    光学文字読取システムにおいて、照合結果得られた候補
    単語を候補単語の先頭文字位置毎に分類して格納する候
    補単語格納手段と、カーソル等により指示された文字位
    置に先頭文字が位置する候補単語及びこの候補単語の後
    ろに続く候補単語を連続して同時に表示し選択する表示
    及び選択手段とを備えたことを特徴とする光学文字読取
    システム。
JP4166338A 1992-06-24 1992-06-24 光学文字読取システム Pending JPH0612521A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4166338A JPH0612521A (ja) 1992-06-24 1992-06-24 光学文字読取システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4166338A JPH0612521A (ja) 1992-06-24 1992-06-24 光学文字読取システム

Publications (1)

Publication Number Publication Date
JPH0612521A true JPH0612521A (ja) 1994-01-21

Family

ID=15829519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4166338A Pending JPH0612521A (ja) 1992-06-24 1992-06-24 光学文字読取システム

Country Status (1)

Country Link
JP (1) JPH0612521A (ja)

Similar Documents

Publication Publication Date Title
US6341176B1 (en) Method and apparatus for character recognition
JPH0612521A (ja) 光学文字読取システム
JPH0689365A (ja) 文書画像処理装置
JP3405155B2 (ja) 文書検索装置
JPH0452509B2 (ja)
JP3071745B2 (ja) 文字認識結果の後処理方法
JPH03240183A (ja) 認識文字自動修正方式
JP2894305B2 (ja) 認識装置の候補修正方式
JP2687902B2 (ja) 文書画像認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JP2907947B2 (ja) 光学文字読取システム
JP2890241B2 (ja) 光学的文字認識装置
JPH06333083A (ja) 光学式文字読取装置
JPH06290308A (ja) 文字認識装置
JP4754889B2 (ja) 文字列抽出方法および装置
JPH117492A (ja) キー入力編集方法及び編集装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH05298489A (ja) 文字認識方式
JPH0620087A (ja) Ocr処理システムにおける漢字住所データ処理方法
JPH10261049A (ja) 文字認識装置
JP2878772B2 (ja) 光学的文字読取装置
JPH0458381A (ja) 光学的文字読取装置
JPH05282484A (ja) 光学的文字読取り装置
JPH0528323A (ja) 文字認識装置
JPH01134584A (ja) 文字認識装置