JPH0728946A - 文字認識装置及び方法 - Google Patents

文字認識装置及び方法

Info

Publication number
JPH0728946A
JPH0728946A JP5175153A JP17515393A JPH0728946A JP H0728946 A JPH0728946 A JP H0728946A JP 5175153 A JP5175153 A JP 5175153A JP 17515393 A JP17515393 A JP 17515393A JP H0728946 A JPH0728946 A JP H0728946A
Authority
JP
Japan
Prior art keywords
recognition
target area
document image
image data
recognition target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5175153A
Other languages
English (en)
Inventor
Mitsuru Sakaki
満 榊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Original Assignee
Hitachi Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP5175153A priority Critical patent/JPH0728946A/ja
Publication of JPH0728946A publication Critical patent/JPH0728946A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】文字認識処理の開始時期を早めると共に、行切
り出し処理以降の処理を並列化することで、文字認識処
理を高速、かつ、正確に行う文字認識装置及び方法を提
供する。 【構成】文書画像入力手段101より入力された文書画
像データ中の認識対象領域をオペレータが自ら認識対象
領域指定手段103により指定している間に、先に指定
された認識対象領域の画像データを順次認識演算手段1
04a、104b、104nに転送し、認識演算手段1
04a、104b、104nで各認識対象領域に対する
切り出し、認識、認識結果校正処理を並列に行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の認識演算手段
(プロセッサ等)により、並列に文字認識処理を行う文
字認識装置及び方法に関するものである。
【0002】
【従来の技術】従来の複数のプロセッサを用いた文字認
識装置の文字処理方法は、特開平2−202686号公
報に記載のように、ソフトウェア処理によって文字領域
を検知して取り出し、取り出した文字領域に対して行単
位に文字画像を切り出した後、文字切り出し処理から認
識処理までを各切り出し行ごとに複数の認識手段によっ
て並列に処理するものである。
【0003】
【発明が解決しようとする課題】前記従来の処理方法
は、ソフトウェア処理によって文書画像データからの文
字切り出し処理から認識処理までのすべてを、単一のプ
ロセッサ上で自動的に行うので、オペレータは文字切り
出しのための操作を必要としない。しかし、パーソナル
コンピュータ等の低速なコンピュータを用いて文字認識
を行う場合、単一プロセッサによる行切り出し処理は時
間がかかる。また認識対象領域の指定操作と認識処理が
並行して行われないため、認識処理の開始時期が遅くな
るという点について配慮がなされていない。
【0004】本発明の目的は、文字認識処理の開始時期
を早めると共に、行切り出し処理以降の処理を並列化す
ることで、文字認識処理を高速、かつ、正確に行う文字
認識装置及び方法を提供することにある。
【0005】
【課題を解決するための手段】前記目的を達成するため
に、本発明は、文書画像データを入力する文書画像入力
手段と、該文書画像入力手段より入力された前記文書画
像データを記憶する文書画像記憶手段と、該文書画像記
憶手段に記憶された前記文書画像データを画面上に表示
する映像出力手段と、該映像出力手段で画面表示された
前記文書画像データの文字認識の対象領域を指示する指
示デバイスとを有する文字認識装置において、前記指示
デバイスで指示された前記文字認識の対象領域を、認識
対象領域ごとに指定する認識対象領域指定手段と、前記
文書画像データを、前記認識対象領域指定手段で指定さ
れた認識対象領域ごとに、並列に処理する複数の認識演
算手段と、前記文書画像データを、前記認識対象領域指
定手段で指定された認識対象領域ごとに、前記認識演算
手段に転送する認識対象領域転送手段を備えることを特
徴とする文字認識装置を提供する。
【0006】
【作用】本発明に係る文字認識装置によれば、文書入力
手段は、光学的な方法によって文書を画像データとして
入力する。映像出力手段は、入力した文書画像データを
画面に表示し、オペレータが指示デバイスを用いて文書
画像データに対する処理の指定ができる対話的操作環境
を提供する。認識対象領域指定手段は、オペレータが映
像出力手段の画面上で指示デバイスによって指定した認
識対象となる文書画像データ内の部分領域を取り出す。
認識対象領域転送手段は、オペレータが指定するごとに
認識対象領域を認識演算手段へ転送し、認識対象領域を
転送している間でもオペレータは次の認識対象領域を指
定することができる。複数の認識演算手段は、単一の認
識対象領域に対して単一の認識演算手段が文字切り出
し、認識、認識結果校正までの一連の処理を行う。
【0007】
【実施例】以下、本発明の一実施例に係る文字認識装置
について説明する。
【0008】図1は、本発明の一実施例に係る文字認識
装置の基本構成を示す。文書画像入力手段101より取
り込んだ文書画像データは、文書画像記憶手段102に
て記憶保存される。文書画像記憶手段102に記憶保存
された文書画像データは、映像出力手段120の対話的
操作画面上に表示され、オペレータは対話的画面上で指
示デバイス105を用いて画像データ中の任意の位置を
指定または選択できる。認識対象領域指定手段103
は、文書画像データの中で指示デバイス105によって
指定された部分画像領域を認識対象領域とし、認識対象
領域の座標情報を認識対象領域転送手段106へ出力す
る。認識対象領域転送手段106は、認識対象領域指定
手段103によって認識対象領域が決定される度に認識
対象領域画像データ109と認識対象領域座標情報10
8からなる認識対象領域情報107を生成し、共有記憶
手段113中の認識処理管理テーブル114と認識対象
領域転送キュー115とから認識処理待ちとなっている
認識演算手段104a、104b、104nを探索し、
認識対象領域情報107を認識処理待ちとなっている認
識演算手段104a、104b、104nへ転送する。
認識処理を終了した認識演算手段104a、104b、
104nは、制御手段116に対し終了メッセージ11
0を発行し、認識対象領域座標情報108と認識結果文
字列112とからなる認識結果情報111を認識結果並
べ替え手段117へ出力する。認識結果並べ替え手段1
17は、内部に有する認識結果格納バッファ118に各
認識演算手段104a、104b、104nから転送さ
れてくる認識結果情報111を記憶保存する。また認識
結果並べ替え手段117は、認識結果格納バッファ11
8に保存されている認識結果情報111を、認識対象領
域座標情報108をもとに認識結果を正しい順序に並べ
替え、認識結果格納手段119へ出力する。認識結果格
納手段119は、並べ替えた認識結果を記憶保存する。
【0009】図2は、本発明の一実施例のデータ転送管
理部の構成を示す。(a)の認識処理管理テーブル11
4は、認識演算手段104a、104b、104n(図
1)の個数分のテーブルからなり、どの認識演算手段1
04a、104b、104n(図1)がどの認識対象領
域に対して認識処理を実行または終了しているかという
状態を保持する。認識処理管理テーブル114におい
て、処理領域201は当該認識演算手段104a、10
4b、104n(図1)の処理対象となっている認識対
象領域を記憶しており、ステータス領域202は当該認
識演算手段104a、104b、104n(図1)の認
識処理が実行中または終了かを記憶している。(b)の
認識対象領域転送キュー115は、指定された順に認識
対象領域座標情報108(図1)を保持しており、認識
対象領域を先入れ先出し方式(FIFO方式)で認識演
算手段104a、104b、104n(図1)へ転送す
るための待ち行列をつくる。(c)の認識結果格納バッ
ファ118は、認識結果並べ替え手段117(図1)が
認識結果を並べ替えるために一時的に認識結果情報を保
存する。
【0010】図3は、本発明の一実施例の転送データの
情報形式を示す。(a)において、認識対象領域情報1
07の情報形式は、認識対象領域座標情報108と認識
対象領域画像データ109とから構成されている。
(b)において、認識結果情報111の情報形式は、認
識対象領域座標情報108と認識結果文字列112とか
ら構成されている。(c)において、終了メッセージ1
10の情報形式は、その情報が終了メッセージであるこ
とを知らせるための終了フラグ301と、終了した認識
演算手段104a、104b、104n(図1)を識別
するための認識演算手段ID302とから構成されてい
る。
【0011】図4は、本発明の一実施例における制御手
段の処理フローチャートを示す。まず文書画像入力手段
101(図1)から文書画像を取り込む(ステップ40
1)。制御手段116(図1)は、認識処理管理テーブ
ル114(図2)を参照して終了メッセージ110(図
1)があるかを判断し、終了メッセージ110(図1)
があれば認識結果を受け取る(ステップ402、40
3)。次に、オペレータによって指定された認識対象領
域が残っているかを判断し(ステップ404)、認識対
象領域が残っている場合には、その認識対象領域を認識
対象領域転送キュー115(図2)に登録する(ステッ
プ405)。これを受けて認識対象領域転送手段106
(図1)は、認識処理管理テーブル114(図1)を参
照して処理を実行していない認識演算手段104(図
1)を探索し、認識対象領域情報107(図1)を転送
する。次に制御手段116(図1)は、認識対象領域の
指定操作を続行するのかどうかを判断し(406)、続
けるのであれば認識対象領域が指定されるのを待つ(ス
テップ407)。続けないのであれば認識演算手段10
4から全ての認識結果を受け取ったかを判断し(ステッ
プ408)、全て受け取った場合には認識結果の並べ替
えをおこなって(ステップ415)終了する。全認識結
果を受け取っていない場合は、ステップ402からの処
理を繰り返す。
【0012】図5は、本発明の一実施例における認識演
算手段の処理フローチャートを示す。認識演算手段10
4(図1)は、図5で転送された認識対象領域情報10
7を受け取ると(ステップ409)、切り出し処理(ス
テップ410)、認識処理(ステップ411)、校正処
理(ステップ412)、結果生成(ステップ413)、
認識結果転送(ステップ414)を実行し、終了する。
【0013】図6は、本発明の一実施例における映像出
力手段120の対話的操作画面を示す。オペレータが対
話的操作画面506に、指示デバイス105(図1)を
用いて5個の認識対象領域501、502、503、5
04、505を図の上方から順に指定した画面を示して
いる。
【0014】図7は、本発明の一実施例のハードウェア
概略構成を示す。光学的な方法で画像を入力する文書画
像入力手段101によって取り込まれた文書画像データ
は、文書画像記憶手段102にて記憶保存される。オペ
レータが、前述のように映像出力手段120に出力され
た対話的操作画面506(図6)上で指示デバイス10
5によって認識対象領域501、502、503、50
4、505(図6)を指定すると、認識対象領域座標情
報108(図1)が認識対象領域転送キュー115へ指
定された順に登録される。オペレータが認識対象領域の
指定操作を行なっている間に認識対象領域転送手段10
6は、認識対象領域転送キュー115の先頭に登録され
ている認識対象領域座標情報108(図1)から認識対
象領域を決定する。次に、認識対象領域転送手段106
は、認識対象領域画像データ109(図1)に認識対象
領域座標情報108(図1)を付加した認識対象領域情
報107(図1)を生成して認識演算手段104に転送
する。また、認識対象領域転送手段106は、転送した
認識対象領域に関する認識対象領域座標情報108(図
1)を認識対象領域転送キュー115から削除して、待
ち行列を更新する。更に、認識対象領域転送手段106
は、転送先となった認識演算手段104a、104b、
104c、104dが認識処理状態であることを示すた
めに、認識処理管理テーブル114において当該認識演
算手段104a、104b、104c、104dのステ
ータス領域202(図2)に処理中であることを示すフ
ラグを書き込む。画像データ用バス601には、認識演
算手段104a、104b、104c、104dが接続
されている。認識対象領域501(図6)に関する認識
対象領域情報107(図1)を認識演算手段104aが
受け取る。同様にして認識対象領域502(図6)につ
いては認識演算手段104bが受け取り、認識対象領域
504(図6)については認識演算手段104dが受け
取る。各認識演算手段104a、104b、104c、
104dは、認識対象領域情報107(図1)を受け取
った時点で直ちに、認識処理を開始する。認識処理を終
えた認識演算手段104a、104b、104c、10
4dは、認識演算手段104a、104b、104c、
104dを識別するための認識演算手段ID302(図
3)を含む終了メッセージ110(図1)を出力する準
備を行ない、制御手段116からの終了メッセージ要求
が来るまで終了メッセージ出力待ち状態となる。制御手
段116は、各認識演算手段104a、104b、10
4c、104dに対し、終了メッセージ110(図1)
を要求しており、終了メッセージ110(図1)に含ま
れる認識演算手段ID302(図3)によって、どの認
識演算手段104a、104b、104c、104dが
終了したのかを判断することができる。制御手段116
との間で終了メッセージ110(図1)の送受信が成立
した認識演算手段104a、104b、104c、10
4dは、認識対象領域座標情報108(図1)と認識結
果文字列112(図1)とからなる認識結果情報111
(図1)を認識結果用バス602へ出力する。制御手段
116は、認識結果用バス602を介して送られてくる
認識結果情報111(図1)を認識結果並べ替え手段1
17(図1)の中にある認識結果格納バッファ118へ
格納する。そして認識処理を終えた認識演算手段104
a、104b、104c、104dが処理待ち状態にあ
ることを示すために、認識処理管理テーブル114にお
いて当該認識演算手段104a、104b、104c、
104dのステータス領域202(図2)に処理待ち状
態を表すフラグを書き込む。認識対象領域501(図
6)に対する認識処理を行う認識演算手段104aが最
も早く処理を終了した場合、認識対象領域転送キュー1
15には認識対象領域505(図6)の認識対象領域座
標情報108(図1)が残っていることになる。その
為、認識対象領域転送手段106は、認識処理管理テー
ブル114を参照して認識演算手段104aが処理待ち
状態であることを知り、残っている認識対象領域505
(図6)の認識対象領域情報107(図1)を認識演算
手段104aへ転送し、認識処理が開始される。指定さ
れた認識対象領域に対する全ての認識処理が終了する
と、認識結果並べ替え手段117は、認識結果格納バッ
ファ118に保存されている認識結果を、認識結果情報
111(図1)中の認識対象領域座標情報108(図
1)を基に認識結果を正しい順序に並べ替え、認識結果
格納手段119へ出力する。並べ替えられた認識結果は
認識結果格納手段119にて記憶保存される。以上のよ
うに、本実施例にかかる文字認識装置によれば、早期に
文字認識処理を開始でき、また、一度に転送するデータ
量が多く、データ転送回数が少ないので処理効率が向上
し、高速な並列文字認識処理が実現できる。
【0015】
【発明の効果】本発明によれば、オペレータが認識対象
領域を指定している間に、先に指定された認識対象領域
情報が転送されるため、従来のソフトウェアによって認
識対象領域を取り出す方法よりも早く認識処理を始める
ことができる。また、図表を多く含みレイアウトが複雑
であるためにソフトウェア処理では認識対象領域の取り
出しが困難な文書であっても、オペレータが文書画像デ
ータを見ながら認識対象領域を指定するため、様々なレ
イアウトの文書を処理することができる。さらに、認識
対象領域ごとに並列に認識処理するため、オペレータが
最適な負荷分散となるよう認識対象領域を指定すること
ができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字認識装置の基本構
成を示すブロック図である。
【図2】本発明の一実施例のデータ転送管理部の構成を
示す図である。
【図3】本発明の一実施例の転送データの情報形式を示
す図である。
【図4】本発明の一実施例における制御手段の処理フロ
ーチャートを示す図である。
【図5】本発明の一実施例における認識演算手段の処理
フローチャートを示す図である。
【図6】本発明の一実施例における映像出力手段の対話
的操作画面を示す図である。
【図7】本発明の一実施例のハードウェア概略構成を示
す図である。
【符号の説明】
101…文書画像入力手段、102…文書画像記憶手
段、103…認識対象領域指定手段、104a、104
b、104n…認識演算手段、105…指示デバイス、
106…認識対象領域転送手段、107…認識対象領域
情報、108…認識対象領域座標情報、109…認識対
象領域画像データ、110…終了メッセージ、111…
認識結果情報、112…認識結果文字列、113…共有
記憶手段、114…認識処理管理テーブル、115…認
識対象領域転送キュー、116…制御手段、117…認
識結果並べ替え手段、118…認識結果格納バッファ、
119…認識結果格納手段、120…映像出力手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文書画像データを入力する文書画像入力手
    段と、該文書画像入力手段より入力された前記文書画像
    データを記憶する文書画像記憶手段と、該文書画像記憶
    手段に記憶された前記文書画像データを画面上に表示す
    る映像出力手段と、該映像出力手段で画面表示された前
    記文書画像データの文字認識の対象領域を指示する指示
    デバイスとを有する文字認識装置において、 前記指示デバイスで指示された前記文字認識の対象領域
    を、認識対象領域ごとに指定する認識対象領域指定手段
    と、前記文書画像データを、前期認識対象領域指定手段
    で指定された認識対象領域ごとに、並列に処理する複数
    の認識演算手段を備えることを特徴とする文字認識装
    置。
  2. 【請求項2】請求項1において、前記認識対象領域指定
    手段で前記指示デバイスの指示により認識対象領域を指
    定している間に、前記認識対象領域指定手段で先に指定
    された認識対象領域の文書画像データを、前記文書画像
    記憶手段から前記認識演算手段に転送する認識対象領域
    転送手段を備えたことを特徴とする文字認識装置。
  3. 【請求項3】文書画像データを入力する文書画像入力工
    程と、該文書画像入力工程で入力された前記文書画像デ
    ータを記憶する文書画像記憶工程と、該文書画像記憶工
    程で記憶された前記文書画像データを画面上に表示する
    映像出力工程と、該映像出力工程で画面表示された前記
    文書画像データの文字認識の対象領域を指示する指示工
    程とを有する文字認識方法において、 前記指示工程で指示された前記文字認識の対象領域を、
    認識対象領域ごとに指定する認識対象領域指定工程と、
    前記文書画像データを、前期認識対象領域指定工程で指
    定された認識対象領域ごとに、並列に処理する複数の認
    識演算工程と、前記認識演算工程の負荷分散に応じて認
    識対象領域を指定できる工程を有することを特徴とする
    文字認識方法。
JP5175153A 1993-07-15 1993-07-15 文字認識装置及び方法 Pending JPH0728946A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5175153A JPH0728946A (ja) 1993-07-15 1993-07-15 文字認識装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5175153A JPH0728946A (ja) 1993-07-15 1993-07-15 文字認識装置及び方法

Publications (1)

Publication Number Publication Date
JPH0728946A true JPH0728946A (ja) 1995-01-31

Family

ID=15991200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5175153A Pending JPH0728946A (ja) 1993-07-15 1993-07-15 文字認識装置及び方法

Country Status (1)

Country Link
JP (1) JPH0728946A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346707A (ja) * 2004-05-20 2005-12-15 Microsoft Corp カメラで取得されたドキュメント用の低解像度のocr
WO2013038872A1 (ja) * 2011-09-16 2013-03-21 Necカシオモバイルコミュニケーションズ株式会社 画像処理装置、画像処理方法、および画像処理プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346707A (ja) * 2004-05-20 2005-12-15 Microsoft Corp カメラで取得されたドキュメント用の低解像度のocr
JP4698289B2 (ja) * 2004-05-20 2011-06-08 マイクロソフト コーポレーション カメラで取得されたドキュメント用の低解像度のocr
KR101114135B1 (ko) * 2004-05-20 2012-02-20 마이크로소프트 코포레이션 카메라 입력된 문서들을 위한 저해상 ocr
WO2013038872A1 (ja) * 2011-09-16 2013-03-21 Necカシオモバイルコミュニケーションズ株式会社 画像処理装置、画像処理方法、および画像処理プログラム
JPWO2013038872A1 (ja) * 2011-09-16 2015-03-26 Necカシオモバイルコミュニケーションズ株式会社 画像処理装置、画像処理方法、および画像処理プログラム
US9396405B2 (en) 2011-09-16 2016-07-19 Nec Corporation Image processing apparatus, image processing method, and image processing program

Similar Documents

Publication Publication Date Title
US8004533B2 (en) Graphics input command stream scheduling method and apparatus
JPH0728946A (ja) 文字認識装置及び方法
EP0258650B1 (en) Parallel computer system capable of asynchronous data transmission
JP3006681B2 (ja) グラフィック描画装置および文字描画処理方法
JPH11184716A (ja) キュー管理方式
JP2765911B2 (ja) データ駆動型制御方法およびコンパイル装置
JP2000293151A (ja) グラフィックス表示装置及びディスプレイリストによるグラフィックス表示方法
JP2925239B2 (ja) 画像処理方法及び装置
JP2585333B2 (ja) 情報処理装置
JP2872714B2 (ja) 2値画像細線化および特徴抽出の方法とその処理装置
JPS63314644A (ja) デ−タ処理装置
JP2575761B2 (ja) ジョブ管理方法
JPH1185455A (ja) 図形描画処理方式
JP2509936B2 (ja) 出力制御装置
JPH05298003A (ja) データ処理装置
JPS6327942A (ja) メツセ−ジ入力装置
JPH0736829A (ja) トランザクション処理システム
JPH0329048A (ja) データ転送方式
JPS6118039A (ja) 並列ハツシユ装置
JP2830867B2 (ja) 宛名読取装置
JP2830239B2 (ja) 入力表示制御装置
JPH03296999A (ja) 高速遅延処理方法
JPS6258017B2 (ja)
JPH04367986A (ja) 矩形抽出方法及び矩形抽出装置
JPH0399322A (ja) 割込み処理時の命令先取り方式