JPH0388086A - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JPH0388086A
JPH0388086A JP1225418A JP22541889A JPH0388086A JP H0388086 A JPH0388086 A JP H0388086A JP 1225418 A JP1225418 A JP 1225418A JP 22541889 A JP22541889 A JP 22541889A JP H0388086 A JPH0388086 A JP H0388086A
Authority
JP
Japan
Prior art keywords
word
character
image
document
display area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1225418A
Other languages
English (en)
Inventor
Akio Sannomiya
三宮 昭夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1225418A priority Critical patent/JPH0388086A/ja
Publication of JPH0388086A publication Critical patent/JPH0388086A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、英文等の一般文書の文字の読取りを行なう文
書読取装置に関する。
(従来の技術) 英文等の一般文書の各文字を読取る文書読取装置では、
認識結果として得られた文字を認識処理の後に確認修正
する機能が設けられている。これは、文書読取装置によ
る文字認識が完全でなく、誤認識、リジェクトされる文
字が発生することに起因している。近年では、文書中に
おける認識対象となる文字種の拡大と、文字記入方法の
自由度の拡大に伴って、認識処理後の確認修正する機能
がより重要なものとなっている。
従来、文書読取装置によって処理対象とされる帳票は、
文字記入位置等のフォーマットが予め設定されたものが
一般的となっていた。文書読取装置は、文字記入位置を
示す例えば枠内に記入された文字毎に認識処理を行って
いた。このため、認識結果についての確認修正する機能
も、文字単位で修正対象とする方式をとっていた。しか
しながら、フォーマットが設定されない一般文書を読取
ることを目的とした文書読取装置では、一般文書が内容
的に連続している等の理由から、文字単位での処理より
も単語単位で処理すべき場合が多かった。
また、従来の文書読取装置においては、フォーマットが
設定された帳票を処理対象としているため、帳票におけ
る読取るべき領域(文字が記入される領域)を示すフォ
ーマット情報を予め与えることにより、このフォーマッ
ト情報に基づいて文字の読取りを行なうように構成され
ていた。このため、認識結果を確認修正する場合、その
対象とする文字が記入された位置を容易に判断すること
ができた。しかしながら、一般文書を処理対象とする文
書読取装置においては、フォーマ・ントが異なる帳票を
混在させて処理を行なうことを想定しているため、従来
に比較して確認修正の対象とする文字の位置が容易に判
断することができなかった。
(発明が解決しようとする課題) このように、一般の文書を処理対象とする文書読取装置
においては、認識結果について確認修正を行なう場合に
、単語単位で扱うことができると共に、フォーマットが
異なる文書を混在させて処理を行なう際にも確認修正の
対象とする文字の文書中における位置を容易に判断でき
る方式(人間−マシンインターフェイス)が要求されて
いた。
本発明は前記のような点に鑑みてなされたもので、認識
処理の結果得られた文字の確認修正を行なう場合におい
て良好な人間−マシンインターフェイスを有する文書読
取装置を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、画像入力手段によって入力された文書の画像
データをもとに、文書中における文字が記入された文字
読取処理の対象とする読取領域、同読取領域内に含まれ
る各読取行、及び読取行内の各文字を検出する画像処理
手段と、この画像処理手段によって検出された文字につ
いて文字認識処理を行なう文字認識処理手段と、この文
字認識処理手段による文字認識処理によって得られた少
なくとも一つの文字認識結果を単語として扱い、この単
語について単語認識処理を行なって単語に類似した候補
単語を設定する単語認識処理部とを備えている。そして
、前記各手段によって得られた結果をもとにして、文字
認識結果、文書における読取領域、読取行1文字のレイ
アウト、確認修正の対象として任意に指定された単語の
画像、及び画像が表示された単語に対応する候補単語を
遼択的に表示を行ない、画像が表示された単語に含まれ
る文字の文字認識結果について修正を行なうように構成
するものである。
(作 用) このような構成によれば、一画面中に文字認識処理の結
果、文書のレイアウト、確認修正の対象とする単語の画
像、及び確認修正の対象とする単語に対応する候補単語
を選択的に表示させることができるので、文字認識結果
についての確認修正を行ない易くすることができる。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図(よ同実施例に係わる文書読取装置の構成を示すブ
ロック図である。同実施例においては、゛英文の一般文
書について文字読取処理を行なう場合を例にして説明す
る。同図において、lOは装置全体の制御を司る制御部
である。制御部10は、スキャナ制御部13、画像処理
部14、認識処理部15、単語処理部16、表示処理部
17、及び入力処理部19の制御を行なう。
スキャナ制御部13は、制御部10のもとにスキャナ部
23の制御を行なう。スキャナ部23は、文書を光学的
に走査し、文字等の画像を検出する。画像処理部14は
、スキャナ部23によって検出された画像データをもと
に、文書のサイズ、文書中の文字が記録された文字読取
処理の対象とする読取領域(文書ブロック)の検出、文
書ブロック内に含まれる各読取行の抽出、及び1文字毎
に文字の切出しを行なう。認識処理部15は、切出され
た文字の文字パターンについて、予め設定された辞書(
図示せず)を参照しながら、1文字毎に文字認識処理を
行なう。単語処理部16は、文字認識処理の結果と切出
された文字の位置等に基づいて単語を作成し、この単語
について予め設定された単語辞書(図示せず)を参照し
て単語認識処理(スペルチエラグ)等の処理を行なう。
そして、111語認識処理の結果に基づいて、作成され
た単語と類似した単語(候補単語)を求める。表示制御
部I7は、制御部10の制御のもとに、表示装置24の
表示制御を行なう。表示装置24は、装置の動作状態を
通知する人間−マシンインターフェイスの出力部分に相
当し、例えば認識結果についての確認修正を行なう処理
において第2図に示すような表示を行なう。
入力処理部19は、キーボード25.マウス26からの
入力情報を制御する。
30はメモリであり、画像格納領域31、レイアウト・
切出し情報格納領域32、認識情報格納領域33、単語
情報格納領域34が設けられている。画像格納領域31
は、スキャナ部23によって検出された画像データを格
納するためのものである。レイアウト・切出し情報格納
領域32は、画像処理部14における処理によって得ら
れた文書サイズ、文書中の文書ブロックのレイアウト(
位置)を示すレイアウト情報、及び文書中の各読取行、
各文字の位置を示す切出し情報を格納するためのもので
ある。認識情報格納領域33は、認識処理部15におけ
る処理によって得られた各文字についての文字認識結果
を格納するためのものである。単語情報格納領域34は
、単語処理部16における処理によって得られた単語認
識結果(候補単語)等を格納するためのものである。
次に、同実施例の動作を説明する。
まず、スキャナ制御部13の制御のもとにスキャナ部2
3において、文字読取処理の対象とする文書を光学的に
走査し、文書中の文字の文字パターンを含む画像データ
の検出が行われる。検出された画像データは、スキャナ
制御部i3を介して入力され、メモリ30の画像格納領
域3(に格納される。ここでは、画像格納領域31に、
1文書分の画像データが格納されるものとする。
スキャナ部23によって1文書の走査が終了すると、制
御部10は、画像処理部14に対して検出された画像デ
ータについて文書ブロックのレイアウト等の解析を指示
する。制御部10からの指示を受けると、画像処理部1
4は、画像格納領域31に格納され111文書の画像デ
ータをもとに、例えばX。
Y軸方向に射影をとることによって、文書サイズと、図
形、イラスト等が記録された領域を除いた文字パターン
が存在する文字読取処理の対象する読取領域(文書ブロ
ック)のみの抽出を行なう。
文書ブロックは、文書中の内容的なまとまりであり、所
定以上の行間隔、複数の行に渡る同一桁における文字間
隔によって区分されるものとする。
画像処理部14は、行間隔1文字間隔が所定以上あるか
否かによって文書ブロックを抽出し、各文書ブロックを
文書ブロック内の文字を全て含む矩形によって位置を表
すものとする。さらに、画像処理部14は、文書ブロッ
ク内に含まれる各読取行、及び読取行内の各文字の検出
切出しを行なう。これらの処理の結果得られた文書サイ
ズ、文書ブロック、読取行1文字の位置は、それぞれ矩
形枠の対角点(xstr、 ystr、 xend、 
yend)の画像上の座標点によって表され、レイアウ
ト・切出し情報格納領域32に格納される。例えば、文
書サイズをDOC(xstr、 ystr、 xend
、 yend)  i番目の文書ブロックをB L K
 i  (xstr、 ystr、 xend。
yend) 、文書ブロックi内のj行目の読取行をL
 I N E i j  (xstr、 ystr、 
xend、 yend) 、文書ブロックi内のj行目
の読取行内のに番目の文字をCHA Ri j k (
xstr、 ystr、 xend、 yend)とし
て、画像上の位置が座標によって格納される。
次に、制御部10は、認識処理部15に対して、文字認
識処理の実行を指示する。認識処理部15は、画像処理
部14によって切出された文字の文字パターンと、文字
毎の認識処理を行なうための辞書(図示せず)とを照合
することによって文字を認識する。各文字パターンにつ
いての文字認識処理の結果は、認識情報格納部33に格
納される。制御部IOは、例えば行単位で文字認識処理
が終了する毎に、単語処理部16に対して単語処理の実
行を指示する。
制御部lOによって単語処理の実行が指示されると、単
語処理部16は、レイアウト・切出し情報格納領域32
に格納された各読取行、各文字の位置を示す切出し情報
と、認識情報格納領域33に格納された認識処理の結果
をもとに単語を作成する。例えば、切出し情報から、同
一行の文字と文字との間に所定以上の間隔がある位置を
単語の区切りと判別し、この区切りによって統合される
文字認識処理結果の集合を一つの単語とするものである
単語処理部16は、作成した単語と、単語辞書とを照合
し単語認識処理(スペルチェック)を行なう。
こうして複数の文字が統合されて作成された単語の位置
は、文書ブロックi内のj行目の読取行内のg番目の単
語位置をWORD i j it  (xstr。
ystr、 xend、 yend)として、レイアウ
ト・切出し情報格納領域32に格納される。また、作成
された単語列と、同単語列と類似した単語認識処理によ
って得られる複数の候補単語が、単語情報格納領域34
に格納される。
次に、こうして得られた認識処理の結果に対して、確認
修正を行なう処理について説明する。例えば、認識結果
について確認修正の処理を指示する情報が例えばキーボ
ード25から入力処理部19を介して入力されると、制
御部10は、表示処理部17に対して表示装置24に第
2図に示すような画面を表示させる。
ここで、第2図に示す表示例について説明する。
同図において、表示画面には、文字認識結果を表示する
ためのテキスト表示域50、文書上のレイアウトを文書
ブロックや行単位に表示するためのレイアウト表示域6
0、確認修正の処理対象とする単語(以下、対象単語と
略称する)の画像を表示するための画像表示域70、及
び対象単語に対応する単語認識処理によって得られた候
補単語を表示するための候補単語表示域80が設けられ
ている。
テキスト表示域50には、単語情報格納領域34に格納
された単語認識処理の結果が読取行の1行毎に表示され
る。第2図中には、第1行目の単語列rThis  i
s  a  textof・・・・・・」と第5行目の
単語列rThecor?ection  of  th
e−−−−−−Jを例としてあげ、他の行については省
略している。また、第5行目の単語列中の「?」は、文
字認識処理においてリジェクトした文字を示している。
レイアウト表示域60には、処理対象とする文書の形状
、及び同文書中における文書ブロックの位置を矩形枠に
よって表示している。文書の形状。
文書ブロックを表わす矩形枠は、レイアウト・切出し情
報格納領域32に格納されたDOC。
BLK iをもとに、文書の形状枠がレイアウト表示域
60内において所定の大きさとなるように設定された表
示倍率を用いて表示画像が生成され表示される。
画像表示域70には、確認修正の対象としてカーソル9
0によって任意に指定された対象単語の画像が、画像格
納領域から読み出されて表示される。
同実施例においては、処理対象とする単語のみを反転表
示させ、この単語を中心とした上下・左右に余裕をとっ
た領域に含まれる他の単語の画像が表示されるようにし
ている。なお、対象単語を反転表示でなく、カラー等の
他の属性によって表示することも可能である。なお、レ
イアウト表示域60には、テキスト表示域50に表示さ
れた文字認識結果に対応する読取行の位置を示すLIN
Eijがレイアウト・切出し情報格納領域32から続出
され、これに基づいてレイアウト表示域60に行位置の
レイアウト(文書ブロック中における位置)が表示され
る。ここでは、テキスト表示域50に5行分の文字認識
結果が表示されるようにしているので、レイアウト表示
域60においても5行分のレイアウトが表示される。読
取行のレイアウトは、テキスト表示域50に表示される
内容がスクロールによって変更されると、それに応じて
変更される。
また、テキスト表示域50の表示内容をスクロールする
場合、カーソル90が常に最下行に位置するようにする
。これによって、レイアウト表示域60に表示された読
取行のレイアウト表示中の最下行に、確認修正の対象と
する単語が存在するものと判断できる。
候補小話表示域80には、画像表示域70に表示された
画像の単語に対応する候補単語が、単語情報格納領域3
4から読み出され(ここでは、三つの候補単語f1〜f
3)表示される。図中には、三つの候補単語fl rc
orrectionJ。
f2  rconnect  1onJf3 rcol
lectionJが表示された状態を示している。
さて、テキスト表示域50に表示された単語列に対して
修正が必要な場合には、例えば表示画面スクロール、キ
ーボード25のカーソルキーの操作によってカーソル9
0が移動され対象単語が指定される。制御部10は、カ
ーソル90によって指定された対象単語の位置を示すW
ORDijRをレイアウト・切出し情報格納領域32か
ら読出し、これに基づいて画像格納領域31に格納され
た画像データを画像表示域70に合わせて切出し表示さ
せる。
テキスト表示域50に表示された単語列の修正には、直
接キーボード25から文字情報をキー入力する方法と、
候補単語表示域80に表示された候補単語を選択して置
き換えを指定する方法がある。キーボード25を用いる
場合、修正変更すべき文字位置にカーソル90が移動さ
れ、文字の置換、挿入等の指示、及び文字情報が入力さ
れると、制御部IOは、認°識情報格納部33に格納さ
れたカーソル90によって指定された位置の認識結果に
ついて指示に応じて置換、挿入等の処理を行なう。例え
ば、リジェクトした文字を示す「?」にカーソル90を
合わせて、rrJをキー入力すると、「?」がrrJに
置き換えられる。一方、候補単語を選択して置き換えを
行なう場合、キーボード25のファンクションキー「f
l」〜「f3」が押下されると、制御部10は、選択さ
れたファンクションキーに対応する候補単語を、画像表
示域70に表示された画像に対応する文字認識結果に置
き換える。例えば、テキスト表示域50中の単語rco
r?ect 1onJが指定され、ファンクションキー
「fl」が押下されると、単語rco r?ec t 
1onJ全体がrcorrect tonJに置き換え
られる。
他のファンクションキーrf2J  rf3Jが押下さ
れた場合も、キーに応じて単語の置換えが行われる。
このように、認識結果について修正を行なう場合、単語
認識処理によって得られた複数の候補単語の中から任意
に選択して置換えを行なうことができる。また、確認修
正を行なう際に、確認修正の対象とする単語の画像が画
像表示域70に表示されているため、文字認識結果が何
であるべきかを、実際に処理に用いた文書を用いること
なく容易に確認することができる。さらに、レイアウト
表示域60に文書ブロック位置、行位置等を示す文書レ
イアウトが表示されるため、フォーマットが異なる文書
を混在させて処理を行なう場合であっても、確認修正の
対象とする単語9文字等が、文書中のどこに位置するか
を容易に認識することができる。
なお、前記実施例においては、1画面中にテキスト表示
域50、レイアウト表示域60、画像表示域70、及び
候補単語表示域80を設けて、同時に表示させるように
したが、テキスト表示域50以外の何れかを選択的に表
示させるようにしても良い。例えば、前記実施例におい
ては、画像表示域70にカーソル90によって指定され
た単語の画像を表示させるものとしたが、カーソル90
が対象単語の位置に移動され、さらに特定の機能キーが
押下されることによって画像を表示させるようにしても
良い。
また、候補単語表示域80においても、リジェクトを含
むような修正が必要な単語についてのみ、候補文字を表
示するようにしても良い。
また、前記実施例においては、カーソル90をテキスト
表示域50の最下行に位置するようにしたが、任意に位
置を移動するようにしても良い。この場合、カーソル9
0が存在する読取行に対応するレイアウト表示を、他の
レイアウト表示と異なる属性(色変え、輝度変化等)に
よって表示するようにして、対象文字の位置が容易に判
断できるようにする。両像表示域70については、例え
ば対象単語の近傍(例えば、対象単語の下行)に設ける
ようにして、文字認識結果(対象単語)と画像との比較
を容易にできるようにする。
また、確認修正の対象とする文字(単語)、候補単語を
、キーボード25のカーソルキーの操作によって移動制
御されるカーソル90によって指定されるものとしたが
、マウスz6を用いることも可能である。
さらに、レイアウト表示域601画像表示域70におけ
る表示形態、候補単語域80に表示される候補単語の数
は、前記実施例に限定されるものではない。
[発明の効果コ 以上のように本発明によれば、文字認識処理の結果につ
いて確認修正を行なう際に、文字認識結果を示す単語列
(テキスト)の他に文書レイアウト、確認修正の対象と
する文字(単語)の画像。
及び単語修正の際の候補となる単語群を表示し、良好な
人間−マシンインターフェイスを提供することができる
。このため、確認修正の対象とする文字(単語)の文書
中における位置を容易に判断できると共に、修正を簡単
かつ効率的に行なうことができる。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる文書読取装置の構成
を示すブロック図、第2図は認識処理の結果について確
認修正を行なう際の画面表示例を示す図である。 IO・・・制御部、13・・・スキャナ制御部、14・
・・画像処理部、15・・・認識処理部、16・・・単
語処理部、17・・・表示処理部、19・・・入力処理
部、23・・・スキャナ部、24・・・表示装置、25
・・・キーボード、26・・・マウス、30・・・メモ
リ、31・・・画像格納領域、32・・・レイアウト・
切出し情報格納領域、33・・・認識情報格納領域、3
4・・・単語情報格納領域

Claims (1)

  1. 【特許請求の範囲】 文書に記録された文字等の画像を入力する画像入力手段
    と、 前記画像入力手段によって入力された文書の画像データ
    をもとに、前記文書中における文字が記入された文字読
    取処理の対象とする読取領域、同読取領域内に含まれる
    各読取行、及び読取行内の各文字を検出する画像処理手
    段と、 前記画像処理手段によって検出された文字について文字
    認識処理を行なう文字認識処理手段と、前記文字認識処
    理手段による文字認識処理によって得られた少なくとも
    一つの文字認識結果を単語として扱い、前記単語につい
    て単語認識処理を行なって前記単語に類似した候補単語
    を設定する単語認識処理部と、 前記文字認識処理による文字認識結果を表示するための
    テキスト表示域、前記画像処理手段によって検出された
    前記読取領域、前記読取行、前記文字の前記文書におけ
    る位置を表示するためのレイアウト表示域、確認修正の
    対象として任意に指定された単語の画像を前記単語認識
    処理の対象とする単語毎に表示するための画像表示域、
    及び前記画像表示域に表示された単語に対応する前記単
    語認識処理によって得られた候補単語を表示するための
    候補単語表示域を選択的に設けて表示を行なう表示制御
    手段と、 前記画像表示域に表示された単語に含まれる文字の文字
    認識結果について修正を行なう修正手段と、 を具備したことを特徴とする文書読取装置。
JP1225418A 1989-08-31 1989-08-31 文書読取装置 Pending JPH0388086A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1225418A JPH0388086A (ja) 1989-08-31 1989-08-31 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1225418A JPH0388086A (ja) 1989-08-31 1989-08-31 文書読取装置

Publications (1)

Publication Number Publication Date
JPH0388086A true JPH0388086A (ja) 1991-04-12

Family

ID=16829062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1225418A Pending JPH0388086A (ja) 1989-08-31 1989-08-31 文書読取装置

Country Status (1)

Country Link
JP (1) JPH0388086A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162256A (ja) * 1992-06-19 1994-06-10 Toho Business Kanri Center:Kk Ocrシステム及びocr入力用紙作成方法
WO1996027947A1 (en) * 1995-03-08 1996-09-12 Telefonaktiebolaget Lm Ericsson (Publ) A method of selecting characters from a keypad, and a telephone set operating according to this method
JP2002049890A (ja) * 2000-08-01 2002-02-15 Minolta Co Ltd 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US6618504B1 (en) 1996-11-15 2003-09-09 Toho Business Management Center Business management system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162256A (ja) * 1992-06-19 1994-06-10 Toho Business Kanri Center:Kk Ocrシステム及びocr入力用紙作成方法
WO1996027947A1 (en) * 1995-03-08 1996-09-12 Telefonaktiebolaget Lm Ericsson (Publ) A method of selecting characters from a keypad, and a telephone set operating according to this method
US5991396A (en) * 1995-03-08 1999-11-23 Telefonaktiebolaget Lm Erisson Method of selecting characters from a keypad and a telephone set operating according to this method
US6618504B1 (en) 1996-11-15 2003-09-09 Toho Business Management Center Business management system
JP2002049890A (ja) * 2000-08-01 2002-02-15 Minolta Co Ltd 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体

Similar Documents

Publication Publication Date Title
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
EP0439951B1 (en) Data processing
JP2001101164A (ja) 文書画像処理装置及び文書画像処理方法
JPH04195692A (ja) 文書読取装置
JPH0554073A (ja) デジタル翻訳装置
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JPH0388087A (ja) 文書読取装置
JP2004038348A (ja) 表示制御方法、これを用いたプログラム、情報処理装置及び光学式文字読み取り装置
JPH0388086A (ja) 文書読取装置
EP0519713B1 (en) Character input method and apparatus
JPH02255964A (ja) 文書変更部分の自動識別装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH08221558A (ja) 文書ファイリング方法及び装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH07249098A (ja) 情報処理装置および情報処理方法
JPS60217483A (ja) 文字認識装置
JPH06223221A (ja) 文字認識装置
JP2887823B2 (ja) 文書認識装置
JP3717971B2 (ja) 認識文字とイメージデータの対応的表示方法及び文字認識装置
JP2001307020A (ja) 文字認識装置
JPH10143606A (ja) 文字認識装置および文字認識方法
JPH06348889A (ja) 文字認識装置
JPH09114824A (ja) 文書処理装置
JPH0581467A (ja) 画像処理方法及び装置
JPH0289190A (ja) 文字認識結果表示方法および装置