JPH06266889A - 文書認識装置 - Google Patents

文書認識装置

Info

Publication number
JPH06266889A
JPH06266889A JP5077764A JP7776493A JPH06266889A JP H06266889 A JPH06266889 A JP H06266889A JP 5077764 A JP5077764 A JP 5077764A JP 7776493 A JP7776493 A JP 7776493A JP H06266889 A JPH06266889 A JP H06266889A
Authority
JP
Japan
Prior art keywords
recognition
document
line
image
image blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5077764A
Other languages
English (en)
Inventor
Makoto Torigoe
真 鳥越
Sadamasa Hirogaki
節正 広垣
Naohiro Amamoto
直弘 天本
Yoshitaka Hamaguchi
佳孝 濱口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5077764A priority Critical patent/JPH06266889A/ja
Publication of JPH06266889A publication Critical patent/JPH06266889A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 文書を構成する複数のイメージブロック間の
認識順序が、段組み等がされているため自動検出できな
いとき、オペレータが文書の認識順序を簡単な手段で指
定できる。 【構成】 オペレータが表示部2に表示された文書イメ
ージ3を読み、その流れをつかむと、マウス等から成る
ライン入力部6を用いて画面上に認識順指定ライン4を
書き込む。装置は、この認識順指定ライン4と重なるイ
メージブロックを順に検出し、その順に文字認識を進め
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば書籍や新聞紙面
等に記載された文書イメージを光学的に読み取り、文書
イメージ中の文字を文のつながりを考慮しながら認識
し、データとして取り込む文書認識装置に関する。
【0002】
【従来の技術】各種の文書に記載された文字を読み取
り、これらを認識してデータベース化するために文字認
識装置が広く採用されている。ここで、例えば新聞紙面
のように写真や挿絵等を各所に配置した、いわゆる段組
みにより文書が記載された場合、文書を構成する各文字
の認識順序が問題となる。
【0003】図2に、認識対象となる文書イメージ例説
明図を示す。書籍や新聞等の紙面には、例えばこの図に
示すようなレイアウトで文書が記載され、これを文書認
識装置を用いて読み取る場合には、その文書イメージ
は、例えば図に示すように、複数のイメージブロックB
1〜B6に切り分けて処理される。なお、これらのイメ
ージブロックB1〜B6の間には、写真等のイメージブ
ロックF1、F2が配置されている。
【0004】文書認識装置は、例えばイメージブロック
B1を構成する文字1を順に認識して各文字を文字コー
ドに変換する。同様の処理を全てのイメージブロックB
1〜B6について行う。ここで、この文書は本来、B
1、B2、B3、B4、B5、B6という順に読まれる
よう記載されているものとする。この場合、文書認識装
置の側では、予めその順序を知ることができない。そこ
で、全ての文字を認識した後、各イメージブロックごと
に単語認識を行いながら、隣接するイメージブロック間
の文法的なつながりを調べる。こうして、各イメージブ
ロックの認識順序を決定し、データとして取り込む。こ
の結果はオペレータに通知され、オペレータはその認識
順序に誤りがあれば、その都度これを訂正する。従来
は、以上のような構成の文書認識装置が開発されている
(特開平4−163681号公報)。
【0005】
【発明が解決しようとする課題】ところで、文書の構造
やその記載の形式によっては、上記のような方法では容
易に各イメージブロック間の接続関係を自動検出できな
い場合がある。また、認識順序をオペレータが訂正する
場合の操作は、オペレータに負担をかけないよう、でき
るだけ容易であることが好ましい。即ち、図2の例の場
合、オペレータがキーボードを用いて認識順序をB1、
B2、B3…と入力するのでは作業が煩雑すぎる。本発
明は以上の点に着目してなされたもので、オペレータが
文書の認識順序を容易に指定することのできる構成の文
書認識装置を提供することを目的とするものである。
【0006】
【課題を解決するための手段】本発明の文書認識装置
は、光学的に読み取った文書イメージを任意のイメージ
ブロックに切り分けて文字認識を行なう文字認識部と、
表示部に表示された前記イメージブロックを順に通過す
るような認識順指定ラインを入力するライン入力部と、
前記認識順指定ラインと前記イメージブロックとの重な
りを検出して、その認識順指定ラインの始点から終点に
向かって、前記イメージブロックに順序付けを行なう認
識順序設定部と、この認識順序設定部の順序付けに従っ
て、前記イメージブロックの読み取りデータを配列し
て、文書の認識処理を実行する認識処理部とを備えたこ
とを特徴とするものである。
【0007】
【作用】この装置は、オペレータがディスプレイ等の表
示部に表示された文書を読み、その流れをつかむと、マ
ウス等から成るライン入力部を用いて画面上に認識順指
定ラインを書き込む。装置は、この認識順指定ラインの
始点から順に、これと重なるイメージブロックを検出
し、その順に文字認識を進める。なお、例えば、主走査
線方向に並んだ複数のイメージブロックは、指定がない
限りそのまま直接接続して配列する。認識順指定ライン
が複数あれば、例えば左側のラインについての処理が終
ると、それに続いて右側のラインと重なるイメージブロ
ックを配列する。
【0008】
【実施例】以下、本発明を図の実施例を用いて詳細に説
明する。図1は、本発明の文書認識装置実施例を示すブ
ロック図である。図に示すように、本発明の装置は、例
えばブラウン管ディスプレイ等から成る表示部2に表示
された図に示すような構造の文書イメージ3について、
読み取りと文字認識を行う。この文書イメージ3は、既
に従来技術で説明したと同様に、複数のイメージブロッ
クB1〜B6に切り分けられて認識されるものとする。
これらのイメージブロックB1〜B6の間には、写真や
挿絵等から成るイメージブロックF1、F2が挿入され
ている。各イメージブロックに記載された図示しない多
数の文字は、この装置により、従来よく知られた方法で
認識され符号化される。図に示す装置の文字認識部5
は、この文字認識と符号化を行う部分である。
【0009】本発明の装置には、この他に、ライン入力
部6、認識順序設定部7、認識順序バッファ8及び認識
処理部9が設けられている。ライン入力部6は、本発明
において新たに設けられたもので、マウス等のポインテ
ィングデバイスから構成される。このライン入力部6に
よって、表示部2に表示された文書イメージ3の上に認
識順指定ライン4が記入される構成となっている。この
実施例では、認識順指定ライン4がイメージブロックB
1、B2、B4、B5と重なるように1本記入され、更
に右側にもう1本の認識順指定ライン4がイメージブロ
ックB6と重なるように記入されている。
【0010】認識順序設定部7は、上記のような認識順
指定ライン4と各イメージブロックB1〜B6との重な
りを検出し、オペレータの指定した順序に従って各イメ
ージブロックの符号化データを認識順序バッファ8に配
列していく処理を行う部分である。認識処理部9は、認
識順序設定部7により配列されたイメージブロックのデ
ータを受け入れ、文書全体を文法的に解析し、その文字
認識等の後処理を進める部分である。
【0011】この図に示すような装置は、具体的には例
えば次のようなハードウェア構成により実現される。図
4に、本発明の装置実現のためのハードウェア例ブロッ
ク図を示す。この装置は、イメージリーダ13、ディス
プレイ14、外部記憶装置15、ポインティングデバイ
ス16を入出力インタフェース17を介して接続し、バ
スライン18に対しCPU19、RAM20、ROM2
1等を接続した構成のものである。CPU19は、この
装置全体の動作を制御するプロセッサであって、ROM
21には、後で説明するラインの入力処理や認識順序の
設定処理等を実行するためのプログラムが格納されてい
る。また、RAM20は、装置の動作パラメータ等を格
納するためのランダム・アクセス・メモリから構成され
る。
【0012】イメージリーダ13は、処理対象となる文
書の文書イメージを光学的に読み取るための装置であ
る。これは、図1に示す文字認識部5の一部を構成して
いる。また、ディスプレイ14は文書を表示し、オペレ
ータの操作を促すための装置である。外部記憶装置15
は、認識された文書に関する符号化データ等を格納する
ための記憶装置である。ポインティングデバイス16
は、図1に示すライン入力部6の一部を構成するもの
で、マウスやデジタイザ等から構成される。本発明の装
置は、具体的には、このようなハードウェアから構成さ
れる。図1に示す認識順序設定部7は、実質的にはRO
M21に格納されたプログラムにより構成され、認識順
序バッファ8はRAM20の一部に設定される。また、
認識処理部9は、ROM21に格納された認識処理のた
めのプログラムにより実現され、その結果が外部記憶装
置15に格納される構成となっている。
【0013】図3に、本発明の装置の前処理動作フロー
チャートを示す。まず、ステップS1において、装置は
文書を構成する全イメージブロックの読取りを行う。更
にステップS2において、これらの各イメージブロック
の文字認識を行う。次にステップS3において、各イメ
ージブロックごとの特徴単語の選択を行う。更にステッ
プS4において、その特徴単語のイメージブロック相互
間での比較分析を行う。即ち、例えばあるイメージブロ
ックを構成する末尾の部分の単語が、別のイメージブロ
ックを構成する先頭の単語とつながって意味のある単語
を構成するような場合、両イメージブロックは、直接接
続されるべきものと判断される。このような判断のため
の分析が行われる。
【0014】ステップS5において、上記のような観点
からイメージブロック間の接続関係を決定し、ステップ
S6において、その決定が表示され、オペレータによる
検査が行われる。もし、ステップS7において、正常認
識されていないと判断された場合には、ステップS8に
移り、オペレータによる認識順序の指定が行われる。ス
テップS1〜ステップS6の処理自体は、従来も実施さ
れていたものであるが、ステップS8における認識順序
の指定に本発明の特徴がある。
【0015】図5に、本発明の装置の主要動作フローチ
ャートを示す。本発明の装置においては、この図に示す
ような手順によって、容易にその認識順の指定が可能と
なる。まず、ステップS1において、図4に示した前処
理が実行される。そして、ステップS2において、認識
順指定が必要かどうかが判断される。正常認識されてい
れば、ステップS6の後処理にそのまま移る。しかしな
がら、認識順序の指定が必要な場合には、ステップS3
において、認識順指定ラインを入力する。この認識順指
定ラインは、先に説明したように、図1に示すようなラ
イン入力部6を用いて同図に示すような認識順指定ライ
ン4を始点11から終点12に向かって引くことにより
行われる。
【0016】次に、ステップS4において、認識順序設
定部7が動作する。この具体的な動作は後で説明する
が、認識順序設定部7の動作により、ステップS5にお
いて、全てのイメージブロックの読み取りデータを一定
の順序付けに従って配列する。配列結果は認識順序バッ
ファ8に格納される。その後、ステップS6に移り、認
識処理部9による後処理が実行される。文字認識のため
の後処理としては、例えば文書を先頭から順に単語単位
に区切り、各単語を単語辞書と照合して、文字認識等の
誤りを修正していく処理があげられる。このような処理
の結果、最終的に自動的に正しく認識された文書データ
が得られる。
【0017】図6に、上記の図5ステップS5における
認識順序設定部の動作フローチャートを示す。この図6
において、まずステップS1で認識順指定ラインの始点
から終点に向かってイメージブロックとの重なりを検出
する。即ち、図1に示す認識順指定ライン4の始点11
から終点12に向かう間、これと重なり合うイメージブ
ロックは、イメージブロックB1、B2、B4、B5と
いう順番になる。そこで、まず始めに、イメージブロッ
クB1を認識順序バッファ8に配列する(ステップS
2)。そして、次にステップS3において、検出された
イメージブロックの主走査線10の方向にある別のイメ
ージブロックの検出を行う。
【0018】即ち、イメージブロックB1の次に、イメ
ージブロックB2を認識順序バッファ8に配列した後、
そのイメージブロックB2を通る主走査線10の方向に
別のイメージブロックがないかどうかを検出する。この
例では、イメージブロックB2の右側にイメージブロッ
クB3が存在する。
【0019】通常、文書は上から下に、また左から右に
順に記載される。従って、この文書は、認識順指定ライ
ン4によって上から下に向かって順に読み込まれるべき
ものとした場合、たとえその認識順指定ライン4がイメ
ージブロックB3と重なり合っていなくても、一般的に
はイメージブロックB2の後にイメージブロックB3が
続くべきと考えられる。また、オペレータが、そのよう
な流れも認識順指定ライン4により指示しなければなら
ないとすれば、本発明の装置の操作が非常に複雑になっ
てしまう。従って、例えばオペレータが、この図に示す
ように、単に上から下に向かって認識順指定ライン4を
引いた場合には、自動的に主走査線10の方向にある別
のイメージブロックB3も、その配列に取り込むように
している。
【0020】しかしながら、もしオペレータが積極的に
その別のイメージブロックを別の順序で読むように指定
したとすれば、これを優先すべきである。従って、ステ
ップS4において、走査線10方向に検出された別のイ
メージブロックに別の認識順指定ラインが重なっている
かどうかを判断する。もし、重なっていなければステッ
プS5に移り、その別のイメージブロックも認識順序バ
ッファに配列してしまう。それ以外の場合には、その別
のイメージブロックを除外して、ステップS6に移る。
ステップS6では、認識順指定ラインの終点かどうかを
判断する。終点でなければ、再びステップS1に移る。
そして、同一の認識順指定ライン4と重なり合う別のイ
メージブロックを検出する。
【0021】また、ステップS6において、認識順指定
ラインの終点と判断された場合には、ステップS7に移
り、別の認識順指定ラインがあるかどうかが判断され
る。もし、別の認識順指定ラインがあれば、再びステッ
プS1に戻り、これまでの動作が繰り返される。なお、
特別の理由が無い限り、複数の認識順指定ラインがある
ときは、左側を優先させて処理する。従って、例えば2
本の認識順指定ラインに重なり合うイメージブロックが
あれば、左側の認識順指定ラインとの重なりにより認識
順序を決定する。
【0022】上記のような処理の結果、例えば図1の例
では、イメージブロックB1、B2、B3、B4、B5
の順に認識順序バッファ8にイメージブロックが配列さ
れ、更にその右側にある別の認識順指定ライン4と重な
り合うイメージブロックB6が最後に配列される。こう
して、全てのイメージブロックについての配列が終了す
ると、図1に示す認識処理部9が図5に示すステップS
6の後処理を実行する。
【0023】本発明は以上の実施例に限定されない。上
記実施例においては、ライン入力部6をマウス等により
構成したが、これは例えばディスプレイと一体化された
タッチパネル等から構成してもよい。また、認識順指定
ライン4は、必ずしも連続したラインでなくてよい。た
だし、その認識順指定ライン4の入力順は装置側におい
て認識し、その入力順や配置に従って解析を行い、イメ
ージブロックを配列することが好ましい。もちろん、文
字イメージの読み取りやイメージブロックへの切り分け
等の方法や順序は、従来知られたどのような方法を採用
しても差し支えない。
【0024】
【発明の効果】以上説明した本発明の文書認識装置は、
文書イメージが任意のイメージブロックにより切り分け
られるとき、表示部に表示された各イメージブロックを
順に通過するような認識順指定ラインをライン入力部に
より入力して、イメージブロックの順序付けを行うよう
にしたので、オペレータによるイメージブロックの順序
指定操作が極めて容易で、オペレータの負担が軽減され
る。
【図面の簡単な説明】
【図1】本発明の文書認識装置実施例を示すブロック図
である。
【図2】認識対象となる文書イメージ例説明図である。
【図3】本発明の装置実現のためのハードウェア例説明
図である。
【図4】本発明の装置の前処理動作フローチャートであ
る。
【図5】本発明の装置の主要動作フローチャートであ
る。
【図6】認識順序設定部の動作フローチャートである。
【符号の説明】
2 表示部 3 文書イメージ 4 認識順指定ライン 5 文字認識部 6 ライン入力部 7 認識順序設定部 8 認識順序バッファ 9 認識処理部 10 主走査線 11 始点 12 終点 B1〜B6 イメージブロック
フロントページの続き (72)発明者 濱口 佳孝 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 光学的に読み取った文書イメージを任意
    のイメージブロックに切り分けて文字認識を行なう文字
    認識部と、 表示部に表示された前記イメージブロックを順に通過す
    るような認識順指定ラインを入力するライン入力部と、 前記認識順指定ラインと前記イメージブロックとの重な
    りを検出して、その認識順指定ラインの始点から終点に
    向かって、前記イメージブロックに順序付けを行なう認
    識順序設定部と、 この認識順序設定部の順序付けに従って、前記イメージ
    ブロックの読み取りデータを配列して、文書の認識処理
    を実行する認識処理部とを備えたことを特徴とする文書
    認識装置。
JP5077764A 1993-03-11 1993-03-11 文書認識装置 Pending JPH06266889A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5077764A JPH06266889A (ja) 1993-03-11 1993-03-11 文書認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5077764A JPH06266889A (ja) 1993-03-11 1993-03-11 文書認識装置

Publications (1)

Publication Number Publication Date
JPH06266889A true JPH06266889A (ja) 1994-09-22

Family

ID=13643010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5077764A Pending JPH06266889A (ja) 1993-03-11 1993-03-11 文書認識装置

Country Status (1)

Country Link
JP (1) JPH06266889A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171356A (ja) * 2007-01-15 2008-07-24 Ricoh Co Ltd 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体
CN102141879A (zh) * 2010-02-03 2011-08-03 富士施乐株式会社 信息处理装置和信息处理方法
CN112463010A (zh) * 2019-09-06 2021-03-09 富士施乐株式会社 信息处理装置及记录媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171356A (ja) * 2007-01-15 2008-07-24 Ricoh Co Ltd 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体
CN102141879A (zh) * 2010-02-03 2011-08-03 富士施乐株式会社 信息处理装置和信息处理方法
JP2011159190A (ja) * 2010-02-03 2011-08-18 Fuji Xerox Co Ltd 情報処理装置及びプログラム
US8954873B2 (en) 2010-02-03 2015-02-10 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method and computer readable medium
CN112463010A (zh) * 2019-09-06 2021-03-09 富士施乐株式会社 信息处理装置及记录媒体

Similar Documents

Publication Publication Date Title
US6466694B2 (en) Document image processing device and method thereof
US5581752A (en) Electronic document retrieval and display system and method of retrieving electronically stored documents
JPH06266889A (ja) 文書認識装置
JPH08320914A (ja) 表認識方法および装置
JP4501731B2 (ja) 画像処理装置
JPH10207981A (ja) 帳票認識方法
JPH08202856A (ja) 画像処理方法
JP2803736B2 (ja) 文字認識方式
JP2856752B2 (ja) 文字認識結果修正方法
JPS6154569A (ja) 文書画像処理方式
JPH01292586A (ja) 文字認識支援装置
JP2682873B2 (ja) 表形式文書の認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP3345142B2 (ja) 罫線表示機能付き文書処理装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH04302070A (ja) 文字認識装置及び方法
WO1999024969A1 (en) Reading system that displays an enhanced image representation
JPH01292587A (ja) 画像処理方法
JPS63204486A (ja) 文字入力装置
JP2740506B2 (ja) 画像認識方法
JPH11316792A (ja) 情報処理装置及び帳表作成方法
JPH10134120A (ja) 表処理方法および表処理装置
JPS63108467A (ja) 画像文書編集装置
JPH06348889A (ja) 文字認識装置
JPH01134584A (ja) 文字認識装置