JPH10269323A - 光学文字読取り装置及び文字分散認識システム - Google Patents

光学文字読取り装置及び文字分散認識システム

Info

Publication number
JPH10269323A
JPH10269323A JP9075743A JP7574397A JPH10269323A JP H10269323 A JPH10269323 A JP H10269323A JP 9075743 A JP9075743 A JP 9075743A JP 7574397 A JP7574397 A JP 7574397A JP H10269323 A JPH10269323 A JP H10269323A
Authority
JP
Japan
Prior art keywords
character recognition
recognition
character
unit
recognition processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9075743A
Other languages
English (en)
Inventor
Kazumi Suzuki
和美 鈴木
Koji Kobayashi
康二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9075743A priority Critical patent/JPH10269323A/ja
Publication of JPH10269323A publication Critical patent/JPH10269323A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 マルチCPU構成のPCにおいて、PCに搭
載しているCPU数まで同時に複数の領域に読取らせて
文字認識の処理性能を向上させること。 【解決手段】 読取り領域単位で文字認識処理を行う複
数の文字認識処理部232,233と、複数の文字認識
処理部を並行して動作させるように制御する認識制御部
231と、を備え、認識制御部は、入力された着信画像
から読取り領域単位の画像を切り出し、文字認識処理部
で読取り開始可能であるか否かを判定して、可能であれ
が前記単位画像を前記複数の文字認識処理部のいずれか
を選択し、単位画像を選択した文字認識処理部に転送
し、文字認識処理部は、複数のCPUにそれぞれ対応し
て単位画像の文字認識処理をソフトウエアでそれぞれ独
立して実行する光学文字読取り装置。また、ネットワー
クのPCへ領域単位の認識を分散することにより大幅に
OCRの処理性能を向上させる文字分散認識システム。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識部をパソ
コン(以下PCと称する)のソフトにて実現している光
学文字読取り装置(汎用のPCのCPUを用いてソフト
ウエアにて文字認識できる装置)に係り、特に、専用ハ
ード(PCに付加するPCカードのような、文字認識す
るための特殊な演算を行うハードウエア)を付加するこ
となく漢字文字等の認識処理を高速処理する光学文字読
取り装置に関する。
【0002】
【従来の技術】従来、文字認識の精度向上を図る上で、
一文字毎の切り出しの認識結果をその都度フィードバッ
クさせて一文字毎の切り出し処理を行っているため、文
字単位の認識部の複数ハード化(一文字認識をハードウ
エア上で複数個用意して処理する)の手法では処理高速
化は不可能であった。また、文字認識をハードウエアで
処理する手法はコスト低減の大きな障害となり、文字認
識部のソフト化が要求されて来ている。
【0003】現状ではPCの処理性能の大幅な向上がな
されたが高速タイプのOCRの性能を達成することは出
来ない状況である。
【0004】従来、文字認識処理の高速化としては下記
の方法が考えられている。
【0005】(1)文字認識処理をそれに応じた専用ハ
ードを設けて処理性能を向上させ、さらにパイプライン
制御を行って処理性能アップさせる。
【0006】(2)帳票イメージ内の読取りエリア単位
に複数プロセッサが独立で認識処理を行う。(特開昭6
3−26788号公報)PCのソフトで文字認識処理を
行うOCR装置(汎用のPCのCPUを用いて文字認識
処理を可能とするソフトウエアを備えたOCR装置)は
少なく、処理性能の低いものをターゲットとしていて処
理性能についてはPCの性能向上に頼り、高速化技術は
アルゴリズムの改良に止まっている状況である。また、
ネットワークのPCを利用した認識処理性能の向上を図
る技術についても有用な技術は見当たらない。
【0007】
【発明が解決しようとする課題】原価低減のため文字認
識部を汎用PCのソフトとして動作させる光学文字読取
装置においては、PCの処理性能がOCRとしての処理
性能に帰着してしまう。これでは、OCRスキャナ内に
文字認識のハードを備えた従来製品の中高速OCRの処
理性能を達成することは不可能であった。
【0008】また、文字認識処理は認識精度向上のため
年々複雑さを増して認識速度が犠牲となっており、アル
ゴリズムの高速化等に手間を掛けると認識精度の向上が
停滞してしまうことになる。
【0009】本発明は、文字認識速度の高速化を図ると
ともに、ネットワークを利用して前記高速化を図るよう
にすることである。
【0010】
【課題を解決するための手段】前記課題を解決するため
に、本発明は次のような構成を採用する。
【0011】複数のCPUを有するパソコンを用いてソ
フトウエアで文字認識を行う光学文字読取り装置におい
て、前記パソコンを光学文字読取り装置として動作させ
るOCR制御部と、読取り行または読取りフィールドを
読取り領域単位として文字認識処理を行う複数の文字認
識処理部と、前記複数の文字認識処理部を並行して動作
させるように制御する認識制御部と、を備え、前記認識
制御部は、入力された着信画像から読取り領域単位の画
像を切り出し、前記文字認識処理部で読取り開始可能で
あるか否かを判定して、可能であれば前記切り出した単
位画像を前記複数の文字認識処理部のいずれかを選択
し、前記切り出した単位画像を前記選択した文字認識処
理部に転送し、前記複数の文字認識処理部は、前記複数
のCPUにそれぞれ対応して前記単位画像の文字認識処
理をソフトウエアでそれぞれ独立して実行する光学文字
読取り装置。
【0012】また、前記光学文字読取り装置を備え、ネ
ットワークに接続された複数のパソコンに設けられた文
字認識処理部に前記単位画像をネットワーク経由で転送
して文字認識を行うことにより、文字認識処理をネット
ワーク上で分散させて高速で文字認識を可能にする文字
分散認識システム。
【0013】
【発明の実施の形態】図1〜図5により本発明の概略を
説明する。
【0014】図1は本発明の概略的な外観構成を図示し
たものである。図1の11はOCRスキャナである。こ
れは、OCR装置が文字を読み取る際に文字認識に最適
な画像を入力するためのものである。文字認識精度につ
いて言及しない場合は一般的なファイリング及びDTP
用のスキャナを用いてもよい。図1の12はOCR制御
装置でありハード構成は基本的には極く一般的な汎用パ
ソコン(以後PCと称する)である。このOCR制御装
置12はOCRスキャナの制御及びPC内に内蔵された
文字認識部の制御を行う。本発明では文字認識部はPC
上のソフトウエアで実現されるものである。
【0015】図2は、図1に示すOCR制御装置の内部
の基本構成図である。図2において、20は図1に示し
たOCR制御装置の全体構成である。21は全体構成2
0のハードウェア及びソフトウエアを統括制御するOS
である。22はOCR制御装置がOCRシステムとして
動作させるための制御ソフトである。23はOCR制御
装置内で文字認識するための認識部であり、ソフトにて
実現している。231は認識部23内の詳細部分で認識
制御部を示し、232及び233は読取り領域単位で文
字認識処理を行う認識処理部であり、認識制御部とは別
のプロセス又はスレッドとして独立に動作するものであ
る。
【0016】ここにおいて、マルチプロセッサのもとで
は、一つのプログラムはプロセスIDとしてOSが管理
していて、プロセスとして動作させている。また、或る
プログラムを高速で動作させるためにはプログラム内の
処理の流れを処理単位に複数起こし、個々に並行動作さ
せる。この処理の流れはスレッドと呼ばれ、スレッドN
oで管理される。
【0017】本実施形態ではOCR制御装置はデュアル
のCPUのマルチプロセッサ構成の汎用のパソコンを前
提とし、そのため読取り領域単位の認識処理は同時に最
大で2個動作させることが可能である。従って、認識処
理部232と233は同時に動作可能である。
【0018】図3は読取るべき帳票の読取り領域の定義
順と読取り順の関係を示す。30は、帳票全体の画像を
示す。31〜310は帳票画像30内の独立した読取り
領域を示す。この個々の読取り領域の左横に記入された
数字は読取り領域の定義順を示し、左上の数字は読取り
領域の座標位置により求めた読取り開始優先順位であ
り、同じ座標位置の場合は同じ優先順位とする。ここに
おいて、前記読取り開始優先順位1を表示した左右の読
取り領域31と32とを合わせた領域を読取り行とい
い、領域31または32の領域を読取りフィールドとい
う。読取り行または読取りフィールドが読取り領域単位
となる。左のフィールドを特定の人のコード番号を記入
した数字フィールドとし、右のフィールドを人名を記入
した漢字フィールドとすることもできる。
【0019】図4は、図3の帳票画像が図2で示した認
識部23に分割されて入力される場合の読取り領域の認
識処理のスケジューリング状況を示す。41は図5に示
す時間t1における画像入力完了スキャンを示し、42
は時間t2における画像入力完了スキャンを示し、43
は時間t3における画像入力完了スキャンを示す。
【0020】44は図2の読取り領域単位の認識処理部
232に処理される読取り領域の処理順を示す。45は
図2の読取り領域単位の認識処理部233に処理される
読取り領域の処理順を示す。
【0021】図5はシングルCPU構成とマルチCPU
構成の読取り領域単位の文字認識状況を時間軸を設けて
示している。
【0022】以上のように、OCR制御部22、文字認
識制御部231及び文字認識処理部232の動作の概略
は上述した通りであるが、それらの機能並びに動作の詳
細は、後述するように、図6〜図10に記載されてい
る。特に、認識制御部231については図7に記載され
ている。
【0023】次に図6〜図10を用いて処理の流れを示
す。
【0024】図6はOCR制御部、OCRスキャナ制御
部、OCRスキャナ部及び文字認識制御部の処理フロー
を示しており、図7は文字認識制御部の処理フローを示
している。また、図8は読取領域単位の文字認識処理の
処理フローを示している。各処理部への処理の遷移は関
数コール形式であり、データ渡しは引数渡でデータの受
けは関数の戻り値である。
【0025】(1)認識部初期化処理 図6のOCR制御部の処理BOX61で“認識部初期化
コマンド”を引数として文字認識制御部のエントリー関
数をコールする。すなわち、文字認識制御部に対して初
期化コマンドを出したことになる。一方、文字認識制御
部では、OCR制御部より引数で渡されたコマンドを解
析して“認識部初期化コマンド”であることを知る。
【0026】そして、図7の処理BOX71において文
字認識制御部の内部テーブルの初期化、文字認識辞書の
ロード、読取領域単位の読取りの文字認識部資源の確保
を行う。
【0027】自ホスト内に文字認識資源を保有する場合
に文字認識辞書はメモリ使用効率の面を考慮して共有メ
モリ上に設けて、文字認識辞書空間の確保、及び認識辞
書ファイルからメモリへのロードは、認識制御部が行
う。
【0028】次に、文字認識部の資源の確保について説
明する。まずOCRユーザーが文字認識をどのPC上で
行うかを決めておく必要がある。自ホストの文字認識の
場合は、このステップで文字認識スレッドまたは文字認
識プロセスを定義された個数分起動しておく。一般的に
は、PCに搭載されているCPUの数が最大個数であ
る。これ以上の文字認識部を起動した場合はパフォーマ
ンスは逆に低下する。
【0029】次に起動した文字認識部を文字認識制御部
が後に文字認識処理の振り分けを管理可能とするため、
図7に示す文字認識資源管理テーブル70を設けて、文
字認識部がどのホスト上にあるかを示すホスト名、文字
認識の種別(スレッド/プロセス)、プログラムID
(P.ID)、資源の使用/未使用、文字認識処理が起
動中か終了を示す終了、認識資源の性能等をテーブルに
保持している。
【0030】次に起動された文字認識スレッドまたは文
字認識プロセスの場合は、図8の読取領域単位文字認識
の処理BOX81でいつでも認識処理が開始出来るよう
にプログラムの初期化を行い文字認識制御部より認識起
動の要求を待つ。実際には、文字認識制御部からの読取
起動のメッセージ87を待っている。但し、メッセージ
による情報伝達はあまり効率が良くないのでシステムよ
っては、共有メモリをインターフェースとしたメモリポ
ーリング方式を採用しても良い。
【0031】(2)スキャナ部初期化処理 図6のOCR制御部の処理BOX62で“スキャナ部初
期化コマンド”を引数としてスキャナ制御部のエントリ
ー関数をコールする。すなわち、スキャナ制御部に対し
て初期化コマンドを出したことになる。一方、スキャナ
制御部では、OCR制御部より引数で渡されたコマンド
を解析して“スキャナ部初期化コマンド”であることを
知る。
【0032】そして図6の処理BOX63においてスキ
ャナ制御部の内部テーブルの初期化を行い、OCRスキ
ャナ部へスキャナデバイスレベルでの初期化コマンドを
出す。そして、OCRスキャナ部ではOCRスキャナ制
御部からの初期化コマンドを受け取りOCRスキャナ制
御部へレスポンスを返す。
【0033】次にOCRスキャナ制御部では、このレス
ポンスを判定してOCR制御部へOCRスキャナ制御部
としてのレスポンスを返す。
【0034】(3)読取開始 図6の処理BOX64では文字認識制御部へ読取り開始
コマンドを出す。図7の文字認識制御部では読取り開始
コマンドを受け取るとスレッド分岐点72で処理が二つ
に分岐して処理が並行処理される。一方は関数コールを
したOCR制御部へ制御が戻されOCR制御部では次の
処理BOX65へ処理が移行する。
【0035】もう一方では図7の文字認識制御部の処理
BOX73から処理が実行されることになる。
【0036】処理BOX73ではOCR制御部より転送
される帳票画像をチェックして転送が完了して文字認識
処理が実行可能な読取領域があるかどうか判定する。ま
だ、読取り領域がない場合は処理BOX712にてOC
R制御部より次の画像転送までウエイトする。このウエ
イト処理ではCPU時間の消費を最少にする工夫をすべ
きである。本実施形態では、OCR制御部からのメッセ
ージ待ちとする。
【0037】(4)スキャン開始 図6の処理BOX65ではOCRスキャナ制御部へ帳票
スキャンコマンドを出す。すると、OCRスキャナ制御
部の処理BOX66はOCRスキャナに対して帳票スキ
ャンコマンドを出す。
【0038】(5)帳票スキャン OCRスキャナは帳票をスキャン中にSCSIインター
フェースで転送するブロックサイズの画像がスキャン出
来た時点でOCRスキャナ制御部へ画像を転送する。
【0039】図6の処理BOX67〜69においてOC
Rスキャナ部およびOCRスキャナ制御部からの分割画
像を受信して文字認識制御部へ転送する。処理BOX6
7では分割画像の第1画像を転送し、処理BOX68で
は分割画像の第2画像を転送し、処理BOX69では分
割画像の最終画像である第3画像を転送する。
【0040】文字認識制御部への第1画像及び第2画像
の転送処理は単に画像のポインタとスキャン終了数を引
数とした文字認識制御部のエントリー関数の関数コール
であり文字認識制御部から即時にリターンする。しか
し、最終分割画像の転送である第3画像の転送では図7
の処理BOX713で帳票全体の文字認識の終了が終了
するまで待ち状態になるためリターン時には帳票1枚の
文字認識終了が終了したことになる。
【0041】(6)文字認識処理 図7の判定BOX73において着信完結した画像がある
場合は処理BOX74を実行する。処理BOX74では
処理BOX71で初期化された読取領域管理テーブルの
該当する読取領域に文字認識開始フラグをセットする。
これにより、文字認識の全領域を余すことなく読取領域
の位置順で読取ることが出来る。処理BOX713では
読取領域管理テーブルの文字認識終了フラグを判定す
る。この終了フラグは各文字認識資源が文字認識終了時
にセットするものである。
【0042】次に処理BOX75では図9に示す読取領
域フォーマットデータをもとに読取領域画像を切り出
す。処理BOX76では図7に示す文字認識資源管理テ
ーブル70より未使用の文字認識資源をサーチする。判
定BOX77において未使用文字認識資源がない場合、
処理BOX78で未使用の文字認識資源が出来るまで待
ち状態となる。未使用文字認識資源がある場合は処理B
OX79が実行される。処理BOX79では文字認識資
源管理テーブル70の該当文字認識資源の終了フラグを
削除し、使用中フラグをセットする。
【0043】次に処理BOX710では処理BOX75
で切り出した画像と図10に示す読取領域内文字認識フ
ォーマットデータを該当文字認識資源へ転送して読取起
動メッセージを送信する。ここで文字認識資源管理テー
ブル70に示しているように文字認識資源は自ホストで
ある必要はない。
【0044】図12及び図13に示す構成を採用して、
切り出した画像と読取領域内文字認識フォーマットデー
タを転送する手段、及び文字認識結果を取得する手段を
設ければネットワーク上の文字認識資源を設けて利用す
ることは容易である。
【0045】次に判定BOX711において読取領域の
文字認識起動を全て終了したかを判定し全部終了した場
合にスレッド分岐した子スレッドを終了する。
【0046】(7)読取領域単位文字認識処理 図8の処理BOX81では読取起動メッセージ87を待
っている。起動メッセージが到着したら次の処理を実行
する。まず処理BOX82では文字認識資源管理テーブ
ルの起動中/終了の項目を“起動中”にセットする。
【0047】処理BOX83においては文字認識制御部
から転送された画像と図10に示す文字認識フォーマッ
トデータに従って従来からある文字認識処理を行う。文
字認識処理が終了したら処理BOX84で文字認識資源
管理テーブルの起動中/終了の項目を“終了”にセット
する。次に処理BOX85では文字認識資源管理テーブ
ルの使用中の項目を“未使用”にセットする。最後に処
理BOX86では認識結果を起動元の文字認識制御に転
送して、文字認識制御部の読取領域管理テーブルの該当
領域の文字認識終了フラグをセットする。
【0048】以上の処理のフローにより帳票をスキャン
しながら複数の認識資源を利用して高速に文字認識を行
うことが可能となる。また、認識資源は同一PC上にあ
る必要がなく、処理能力の余ったPCをネットワークで
利用することも本実施形態では容易である。この概要を
次に示す。
【0049】読取り領域単位の認識処理部をネットワー
ク上の分散認識サーバーにも設けて、OCR制御装置が
シングルCPU構成のものでも、分散認識サーバーの両
方で同時に振り分けた読取り領域を認識することで図5
とほぼ同程度の認識性能が達成できる。これを図11に
より説明する。
【0050】図11の111はシングルCPU構成のO
CR制御装置であり領域単位の認識処理部は一つであ
り、図2で示した読取り領域単位の認識処理部233を
有しない構成であり、その代わりに図12に示す読取り
領域単位ネットワーク認識制御部121を有する。
【0051】つぎに分散認識サーバー115はシングル
CPU構成であり図13に示すネットワーク分散認識制
御部132と図2に示した読取り領域単位の認識処理部
232と同一のものから構成される。このネットワーク
分散認識制御部132が読取り領域単位の認識処理部2
32を制御する。
【0052】以上により認識処理状況はOCR制御装置
111で認識処理する領域画像は114となり、分散認
識サーバー115で処理する領域画像は116となり図
5と同じ性能が期待できる。また、分散認識サーバー1
15をマルチCPU構成にすれば図5よりも性能が上回
ることになる。
【0053】ところで分散認識サーバーは認識処理以外
にも処理サービスを行っている可能性があり、またハー
ド性能も異なるので読取り領域を振り分ける時に最適化
するために参照する性能比率テーブル113を設けて、
読取り中の性能を測定しながら常に最新の値にしてお
く。
【0054】以上が本発明の基本であるがネットワーク
上に複数のOCR制御装置及び複数の分散認識サーバー
が存在することが考えられる。これを図14に示す。分
散認識サーバー側ではOCR制御装置の認識要求をキュ
ーとして待ち行列を作り公平に認識サービスをする仕組
み設けることは当然である。
【0055】以上説明したように、本発明は次のような
構成と機能を奏するものである。
【0056】文字認識部においてはマルチプロセッサ構
成のPCでの認識処理の並列化の制御を行う認識制御部
と読取り領域単位の認識処理部とを設ける。領域単位の
認識処理部はPC内のスレッドまたはプロセスとして起
動して認識制御部とは独立して動作する。
【0057】ネットワークにおいてはOCR制御装置内
の認識部では読取り領域単位の認識処理部の代わりにネ
ットワーク認識制御部を設けて、認識処理をサービスす
る分散認識サーバーにおいてはネットワーク分散認識制
御部を設けて読取り領域単位の認識処理を制御する。
【0058】本発明によれば、専用の認識プロセッサを
用いず汎用のPC上の認識ソフトにおいても認識制御が
PC内の複数のプロセッサに対して読取り領域単位に認
識処理を分散させる制御をすることにより、従来の高速
タイプの処理性能を容易に達成する。また、プロセッサ
構成が複数でないPCにおいてはネットワークを通じて
別のPCに認識処理を分散させることによっても実現で
きる。
【0059】認識制御部は読取り領域単位に読取り開始
可能かどうか判定して開始可能であればあき認識資源の
中から領域単位の認識処理部を選択して読取り領域の画
像を転送し認識処理を開始させる。
【0060】認識資源とは認識処理部のことであり、同
一PC内では最大で搭載CPU台数分の領域単位の認識
処理部でありプロセスまたはスレッドとして起動され
る。プロセスとして起動するかスレッドとして起動する
かはPCの環境特にOSで異なる。従って、認識制御部
はスレッドとプロセスの両方を用いて処理性能を測定し
ながら効率良い方を主に起動するように制御を行う。
【0061】認識制御部はPC環境のテスト及びチェッ
ク機能を備えてマルチCPU構成及びOSのスケジュー
リング特性に合ったタスクの制御を自動的に行うため常
に最高の処理性能が得られる。たとえば、ある種のマル
チプロセッサ対応OSではマルチスレッドによる認識処
理の並列処理よりもマルチプロセスによる処理の並列化
の方が処理性能が高い特性があるためテストプログラム
を起動してハード構成及びソフト環境を把握して処理性
能が高くなる制御を行う。
【0062】更に、本発明は次に示すような構成例を含
むものである。
【0063】ネットワークに接続した読取り領域単位の
認識処理部において認識画像の転送元(読取りの要求
元)を記憶・識別する部位を設けて複数のPCからの認
識要求に答える構造とした文字分散認識システム。
【0064】パソコンの認識制御部はPC環境のテスト
及びチェック機能を備えてマルチCPU構成及びOSの
スケジューリング特性にあったタスクの制御を自動的に
行うことを可能にした文字分散認識システム。
【0065】
【発明の効果】本発明によれば、次に示す効果がある。
【0066】読取り領域の画像データのみ転送するため
データ転送にかかるコストが低減される。また、従来方
式では同時に画像データをアクセスするためCPUの増
設に対する処理能力の向上率が低かったが本発明はかな
りの向上が期待できる。従来手法では、同一の画像を複
数のプロセッサが同時にアクセスするため不必要なウエ
イトが発生してプロセッサが効率よく動作しない。
【0067】ネットワーク構成での分散認識では、マル
チ修正端末を分散認識サーバーに活用出来てシステム全
体の高速化が容易となる。また、遊休PCをネットワー
クを通じて利用することができ、OCRシステムの処理
能力が大幅にアップさせることができる。
【0068】認識制御部の制御は読取りフォーマットを
解析して画像入力量に対してフォーマット指定の順番に
囚われることなく認識可能になった領域を選択して読取
りを実行するため画像の入力待ちを最少にすることがで
きる。
【0069】認識制御部においてはPC環境のテスト及
びチェック機能を備えてマルチCPU構成及びOSのス
ケジューリング特性にあったタスクの制御を自動的に行
うため常に最高の処理性能が得られる。
【図面の簡単な説明】
【図1】本発明の実施形態のOCR装置構成図である。
【図2】OCR制御装置の構成図である。
【図3】OCRが読み取る帳票の画像のイメージであ
る。
【図4】画像が分割転送されて、複数の認識処理部で認
識される領域画像と処理順を示す図である。
【図5】本発明における処理性能の高速化を表現した図
である。
【図6】OCR制御部、OCRスキャナ制御部、OCR
スキャナ及び文字認識制御部におけるOCRの読取制御
フローを示す図である。
【図7】文字認識制御部におけるOCRの読取制御フロ
ーを示す図である。
【図8】領域単位文字認識部におけるOCRの読取制御
フローを示す図である。
【図9】読取領域フォーマットデータを示す図である。
【図10】読取領域内認識フォーマットデータを示す図
である。
【図11】図1の実施形態の認識処理部の1つをネット
ワーク分散認識サーバーとした図である。
【図12】図11のOCR制御装置の構成図である。
【図13】図11の分散認識サーバーの構成図である。
【図14】図11のOCR制御装置と分散認識サーバー
がそれぞれ複数存在する場合の概念図である。
【符号の説明】
11,25 OCRスキャナ 12,20 OCR制御装置 21 OCR制御装置を制御するOS 22 汎用PCをOCR制御装置として動作させる制御
ソフトであるOCR制御部 23 OCR制御装置内の文字認識処理部 231 文字認識処理部内の認識制御部 232,233 文字認識処理部内の読取り領域単位の
認識処理部 24 OCRスキャナを制御する制御ソフトであるOC
Rスキャナ制御部 30 OCRが読みとる帳票の画像のイメージ 31〜310 読取領域単位の画像 41 時刻t1での画像の入力終了位置 42 時刻t2での画像の入力終了位置 43 時刻t3での画像の入力終了位置 44 読取り領域単位の認識処理部232の読取る領域
画像とその読取り順 45 読取り領域単位の認識処理部233の読取る領域
画像とその読取り順 111 認識処理部の1つをネットワーク分散認識サー
バーとしたOCR制御装置 112 OCRスキャナ 113 ネットワーク上の分散認識サーバーの性能比率
を示すテーブル 115 ネットワーク分散認識制御部と読取り領域単位
の認識処理部のみを有する分散認識サーバー 116 分散認識サーバの読取る領域画像とその読取り
順 121 ネットワーク上の分散認識サーバーに画像を転
送して認識制御する読取り領域単位のネットワーク認識
制御部 122 ネットワークケーブル 130 分散認識サーバーの構成図 131 分散認識サーバーを制御するOS 132 汎用PCを分散認識サーバーとする制御ソフト
であるネットワーク分散認識制御

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数のCPUを有するパソコンを用いて
    ソフトウエアで文字認識を行う光学文字読取り装置にお
    いて、 前記パソコンを光学文字読取り装置として動作させるO
    CR制御部と、 読取り行または読取りフィールドを読取り領域単位とし
    て文字認識処理を行う複数の文字認識処理部と、 前記複数の文字認識処理部を並行して動作させるように
    制御する認識制御部と、を備え、 前記認識制御部は、入力された着信画像から読取り領域
    単位の画像を切り出し、前記文字認識処理部で読取り開
    始可能であるか否かを判定して、可能であれば前記切り
    出した単位画像を前記複数の文字認識処理部のいずれか
    を選択し、前記切り出した単位画像を前記選択した文字
    認識処理部に転送し、 前記複数の文字認識処理部は、前記複数のCPUにそれ
    ぞれ対応して前記単位画像の文字認識処理をソフトウエ
    アでそれぞれ独立して実行することを特徴とする光学文
    字読取り装置。
  2. 【請求項2】 請求項1に記載の光学文字読取り装置を
    備え、 ネットワークに接続された複数のパソコンに設けられた
    文字認識処理部に前記単位画像をネットワーク経由で転
    送して文字認識を行うことにより、 文字認識処理をネットワーク上で分散させて高速で文字
    認識を可能にすることを特徴とする文字分散認識システ
    ム。
  3. 【請求項3】 請求項2に記載の文字分散認識システム
    において、 OCRスキャナを備えたパソコンには、一つの読取り領
    域単位の文字認識処理部に代えて、ネットワークを介し
    て文字認識を処理するためのネットワーク認識制御部を
    設け、 文字認識処理をサービスする分散認識サーバには、ネッ
    トワーク分散認識制御部を設けて前記単位画像の認識処
    理を制御することを特徴とする文字分散認識システム。
JP9075743A 1997-03-27 1997-03-27 光学文字読取り装置及び文字分散認識システム Pending JPH10269323A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9075743A JPH10269323A (ja) 1997-03-27 1997-03-27 光学文字読取り装置及び文字分散認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9075743A JPH10269323A (ja) 1997-03-27 1997-03-27 光学文字読取り装置及び文字分散認識システム

Publications (1)

Publication Number Publication Date
JPH10269323A true JPH10269323A (ja) 1998-10-09

Family

ID=13585076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9075743A Pending JPH10269323A (ja) 1997-03-27 1997-03-27 光学文字読取り装置及び文字分散認識システム

Country Status (1)

Country Link
JP (1) JPH10269323A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003238800A (ja) * 2002-02-19 2003-08-27 Toray Ind Inc ポリアミド樹脂組成物
JP2007133701A (ja) * 2005-11-10 2007-05-31 Pfu Ltd 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム
US7305434B2 (en) 2001-05-22 2007-12-04 Risei Notsu Terminal group image recognition system
JP2016071892A (ja) * 2014-09-30 2016-05-09 キヤノンマーケティングジャパン株式会社 帳票システムと、その処理方法及びプログラム
CN111639634A (zh) * 2020-05-15 2020-09-08 广东小天才科技有限公司 一种ocr识别方法及电子设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7305434B2 (en) 2001-05-22 2007-12-04 Risei Notsu Terminal group image recognition system
JP2003238800A (ja) * 2002-02-19 2003-08-27 Toray Ind Inc ポリアミド樹脂組成物
JP2007133701A (ja) * 2005-11-10 2007-05-31 Pfu Ltd 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム
US7983483B2 (en) 2005-11-10 2011-07-19 Pfu Limited Automatic character recognition system and computer product
JP2016071892A (ja) * 2014-09-30 2016-05-09 キヤノンマーケティングジャパン株式会社 帳票システムと、その処理方法及びプログラム
CN111639634A (zh) * 2020-05-15 2020-09-08 广东小天才科技有限公司 一种ocr识别方法及电子设备
CN111639634B (zh) * 2020-05-15 2023-11-24 广东小天才科技有限公司 一种ocr识别方法及电子设备

Similar Documents

Publication Publication Date Title
US9792155B2 (en) Dynamic job processing based on estimated completion time and specified tolerance time
US5867704A (en) Multiprocessor system shaving processor based idle state detection and method of executing tasks in such a multiprocessor system
CN105579959B (zh) 硬件加速器虚拟化
KR100733852B1 (ko) 계산기 시스템
US20040083481A1 (en) System and method for transferring data between virtual machines or other computer entities
US5819014A (en) Parallel distributed printer controller architecture
EP0644486A2 (en) Management of data accesses in computer systems
JP2013047950A (ja) アプリケーションが決定したスケジューリングによる効率的なキャッシュの再利用
JP2008065713A (ja) マルチプロセッサシステム及び割込み制御方法
CN106959891A (zh) 一种实现gpu调度的集群管理方法和系统
AU2002250218A1 (en) Efficiently scheduled multiple raster image processors
EP1370929A2 (en) Efficiently scheduled multiple raster image processors
US9672063B2 (en) Scheduling, interpreting and rasterising tasks in a multi-threaded raster image processor
CN111274019A (zh) 一种数据处理方法、装置及计算机可读存储介质
CN112256414A (zh) 一种连接多种计算存储引擎的方法及系统
JPH10269323A (ja) 光学文字読取り装置及び文字分散認識システム
JPH10289066A (ja) 画像処理装置及びその方法
US5860026A (en) Information processing system for controlling operations of input/output devices of another clusters according to control instructions issued from a cluster
JP7054688B2 (ja) 同期制御システムおよび同期制御方法
JPH08292932A (ja) マルチプロセッサシステムおよびマルチプロセッサシステムにおいてタスクを実行する方法
JP2999516B2 (ja) 端末装置のための文字出力制御方法および装置
CN111310638A (zh) 一种数据处理方法、装置及计算机可读存储介质
JP2000215071A (ja) 仮想計算機システム
JPH11175485A (ja) 分散システムおよび並列演算制御方法
US20090019259A1 (en) Multiprocessing method and multiprocessor system