JPH0962772A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0962772A
JPH0962772A JP7217873A JP21787395A JPH0962772A JP H0962772 A JPH0962772 A JP H0962772A JP 7217873 A JP7217873 A JP 7217873A JP 21787395 A JP21787395 A JP 21787395A JP H0962772 A JPH0962772 A JP H0962772A
Authority
JP
Japan
Prior art keywords
character recognition
document image
shared memory
event
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7217873A
Other languages
English (en)
Inventor
Makoto Torigoe
真 鳥越
Yoshitaka Hamaguchi
佳孝 濱口
Masashi Ito
昌史 伊藤
Yoshiji Maeno
芳史 前野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7217873A priority Critical patent/JPH0962772A/ja
Publication of JPH0962772A publication Critical patent/JPH0962772A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 マルチタスク操作されるオペレーティングシ
ステム(OS)上の文字認識装置(OCR)の文書画像
の認識結果を効率良く処理する。 【解決手段】 コールバック関数登録部11は、マルチ
タスクOSからの各種イベントを処理するポインタを共
有メモリM内のデータ更新時のイベント受信用コールバ
ック関数として登録する。イベントループ部12は、コ
ールバック関数登録部11がコールバック関数を登録し
た後、共有メモリM内のデータ更新イベントを受信す
る。共有メモリMは、データを格納するとイベントを発
生し、コールバック関数であるイベント処理部13を呼
び出す。イベント処理部13は、共有メモリMから文書
画像を判定する。前処理部14はイベント処理部13が
判定した文書画像から文字領域の抽出を行い、文字認識
部15は前処理部14が抽出した文字領域に対して文字
認識を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マルチタスク操作
されるオペレーティングシステム(以下、OSという)
上での文書画像及び該文書画像の認識結果を処理する文
字認識装置(以下、OCRという)に関するものであ
る。
【0002】
【従来の技術】従来、OCRヘ文書画像を入力する手段
としては、そのOCRに対応したスキャナ又は文書画像
ファイル形式を用いなければならなかった。現在では、
マルチタスクOSの普及により、複数のアプリケーショ
ン間で、例えばRAM(Randam Access Memory)やディ
スクを用いたクリップボードで構成される共有メモリを
介したデータの受け渡しが一般化してきた。即ち、オペ
レータがクリップボードに切り取ったデータ又はコピー
したデータを貼り付け、スキャナや画像ファイルの他
に、該クリップボード内の文書画像を取り込むようにし
ている。
【0003】
【発明が解決しようとする課題】しかしながら、前記マ
ルチタスクOS上におけるOCRでは、次のような課題
があった。即ち、共有メモリ内の文書画像を取得するに
は、オペレータが[編集]メニューの[貼り付け] コマ
ンドを実行しなければならない。このため、オペレータ
による操作数が、OCRに対応したスキャナや画像ファ
イルからの文書画像を用いる場合と比較して1〜2ステ
ップ増加する。更に、オペレータの操作が必要なので、
例えばFAX-MODEM 等で受信した文書画像に対して自動的
に文字認識を行うことが困難であるという問題があっ
た。
【0004】
【課題を解決するための手段】第1の発明は、前記課題
を解決するために、複数の装置が該複数の装置で共有す
る共有メモリに該各装置に対応した各データをそれぞれ
格納し、該各装置が該各データに基づいてマルチタスク
操作されるOS上で動作するOCRにおいて、次のよう
な手段を設けている。即ち、ポインタにより動作を開始
し、前記マルチタスク操作されるOSからの各種指令で
あるイベントを受信し、該イベントに基づいて前記共有
メモリに文書画像データが格納されたか否かを判定する
イベント処理部と、前記マルチタスク操作されるOSが
前記イベント処理部の動作の開始を指令するための前記
ポインタを該OSに登録するコールバック関数登録部
と、前記共有メモリに文書画像データが格納されたと
き、前記ポインタにより動作を開始した前記イベント処
理部の指令に基づいて該文書画像データに対して文字認
識を実行して文字認識結果を該共有メモリへ格納する文
字認識部とを、設けている。第2の発明では、第1の発
明の文字認識部は、共有メモリに格納されている文書画
像データに対して該文書画像データと同一領域に文字認
識結果のデータを上書きするようにしている。第3の発
明では、第1の発明の文字認識部は、共有メモリに格納
されている文書画像データに対して該文書画像データと
異なる領域に文字認識結果のデータを追加するようにし
ている。
【0005】第1及び第2の発明によれば、以上のよう
にOCRを構成したので、コールバック関数登録部によ
り、イベント処理部の動作の開始を指令するためのポイ
ンタがマルチタスク操作されるOSに登録される。マル
チタスク操作されるOSからのイベントがイベント処理
部に入力され、該イベントと前記ポインタに基づいて共
有メモリに文書画像データが格納されたか否かが判定さ
れる。前記共有メモリに文書画像データが格納されたと
き、文字認識部により、該文書画像データに対して文字
認識が実行され、この文字認識結果が該共有メモリ中の
該文書画像データと同一領域に上書きされる。そのた
め、共有メモリへ入力された文書画像データが自動的に
テキスト文字列へ変換され、この間のオペレータの操作
は不要となる。第1及び第3の発明によれば、前記共有
メモリに文書画像データが格納されたとき、文字認識部
により、該文書画像データに対して文字認識が実行さ
れ、この文字認識結果が該共有メモリ中の該文書画像デ
ータと異なる領域に追加される。そのため、認識結果の
文字列を同じ共有メモリに格納した場合でも、既存の文
書画像データが損なわれることがない。従って、前記課
題を解決できるのである。
【0006】
【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示すOCRの構成ブ
ロック図である。このOCR10は、マルチタスク操作
されるOS上で動作するものであり、コールバック関数
登録部11を有している。コールバック関数登録部11
は、OCR10が起動されたとき、OSからの各種イベ
ント(即ち、命令や通知等)を処理するポインタ(本実
施形態ではコールバック関数の開始アドレス)を、共有
メモリM内のデータ更新時のイベント受信用コールバッ
ク関数として登録する機能を有している。ここで、コー
ルバック関数とは、下位関数(例えば、本実施形態では
OS)から呼び出される上位関数(例えば、本実施形態
ではOSに対して指令を出す装置)である。イベントル
ープ部12は、OS(即ち、下位関数)からのイベント
を、装置(即ち、上位関数)に対して転送する機能を有
し、本実施形態では、コールバック関数登録部11がコ
ールバック関数を登録した後、共有メモリM内のデータ
更新イベントを受信する機能を有している。共有メモリ
Mは、データを格納するとイベントを発生し、コールバ
ック関数であるイベント処理部13を呼び出す機能を有
している。イベント処理部13は、共有メモリMから文
書画像を取得し、前処理部14、文字認識部15を起動
する機能を有している。前処理部14は、イベント処理
部13が取得した文書画像から文字領域の抽出を行う機
能を有している。文字認識部15は、前処理部14が抽
出した文字領域に対して文字認識を行う機能を有してい
る。
【0007】図2は、図1中のイベント処理部13の動
作を説明するためのフローチャート1である。この図を
参照しつつ、イベント処理部13の動作を説明する。ス
テップs1において、イベント処理部13は、共有メモ
リM内のデータが画像データであるか否かを判別し、画
像データであればステップs2へ進む。この画像データ
の判別は、データオブジェクト(即ち、或る特定単位の
データ)の情報、或いはデータ内の画像ヘッダを検索す
ることにより行われる。ステップs2において、イベン
ト処理部13は、共有メモリM内のデータを文書画像と
して取り込む。ステップs3において、イベント処理部
13は、前処理部14に対して文書画像を走査すること
により該文書画像から文字領域の抽出を行うように指令
し、文字認識部15に対して前処理部14の文字領域の
抽出結果から文字認識を行うように指令する。ステップ
s4において、イベント処理部13は、文字認識が成功
したか否かを判定し、文字認識が成功して文字列を取得
できればステップs5へ進む。ステップs5では、イベ
ント処理部13は、ステップs4における認識文字列を
共有メモリMへ複写(本実施形態では上書き)すること
により、該共有メモリMのデータを更新する。イベント
処理部13の処理が終了すれば、次のイベント受信まで
待機する。
【0008】尚、前記ステップs1において、イベント
処理部13は、共有メモリM内のデータが画像データで
あるか否かを判別し、画像データでない場合は、次のイ
ベント受信まで待機する。又、前記ステップs4におい
て、文字認識が成功せず、文字列を取得できなければ、
イベント処理部13は、次のイベント受信まで待機す
る。以上のように、この第1の実施形態では、イベント
処理部13は、共有メモリM中のデータを更新すること
によって、該共有メモリMへ入力された文書画像を自動
的にテキスト文字列へ変換するので、この間におけるオ
ペレータの操作は不要となる。又、前処理部14及び文
字認識部15における処理が高速であるほど、オペレー
タは共有メモリM内のデータを常にテキスト文字列とし
て扱うことができる。更に、システムが提供する共有メ
モリMを介することで、同システム上で動作する他の装
置との親和性が高くなっている。即ち、特定の装置しか
使えないということがない。例えば、FAX MODEM が文書
画像を受信して共有メモリMへ格納するだけで、自動的
に文字認識結果を得ることが可能である。この時、FAX
MODEM側と文字認識装置側との間に細かい調整作業(例
えば、どのメーカか?どのFAXか?等の判定作業)は
不要であり、システム変更も個別に対応することができ
る。
【0009】第2の実施形態 図3は、本発明の第2の実施形態を示す図1中のイベン
ト処理部13の動作を説明するためのフローチャート2
であり、図2中の要素と共通の要素には共通の符号が付
されている。この図を参照しつつ、イベント処理部13
の動作を説明する。この図3では、図2中のステップs
5がステップs5Aになっている。このステップs5A
において、共有メモリMが複数のデータオブジェクトを
格納することが可能な場合は、認識結果の文字列を共有
メモリMへ追加する。そのため、既存の文書画像データ
が損なわれることがない。以上のように、この第2の実
施形態では、第1の実施形態のように共有メモリMを監
視して自動的に文字認識を行うシステムにおいて、認識
結果の文字列を共有メモリMへ追加するようにしたの
で、認識結果の文字列を同じ共有メモリMに格納した場
合でも、既存の文書画像データが損なわれることがな
い。従って、OCRをバックグラウンドで動作させた場
合、オペレータは共有メモリMに格納された文書画像に
対し、文書画像又は認識結果のいずれかを必要に応じて
取り出すことができる。尚、本発明は上記実施形態に限
定されず、例えば共有メモリMに同時に格納できるデー
タ数に制限がなければ、文書画像や文字認識結果の他
に、文書画像の解析結果と認識結果の文字列から文書を
構築して共有メモリMに追加してもよい。この文書に、
文書画像と同様の段落構成を保持させると、翻訳作業後
の文書編集を簡単に行うことができる。
【0010】
【発明の効果】以上詳細に説明したように、第1及び第
2の発明によれば、共有メモリに格納されている前記文
書画像データに対して該文書画像データと同一領域に前
記文字認識結果のデータを上書きすることによって、該
共有メモリへ入力された文書画像データを自動的にテキ
スト文字列へ変換するようにしたので、この間のオペレ
ータの操作は不要となる。更に、文字認識部の処理が高
速であるほど、オペレータは共有メモリ内のデータを常
にテキスト文字列として扱うことができる。第1及び第
3の発明によれば、共有メモリに格納されている文書画
像データに対して該文書画像データと異なる領域に文字
認識結果のデータを追加するようにしたので、認識結果
の文字列を同じ共有メモリに格納した場合でも、既存の
文書画像データが損なわれることがない。従って、文字
認識装置をバックグラウンドで動作させた場合、オペレ
ータは共有メモリへ格納された文書画像に対し、文書画
像又は認識結果のいずれかを必要に応じて取り出すこと
ができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示す文字認識装置の
構成ブロック図である。
【図2】図1のフローチャート1である。
【図3】図1のフローチャート2である。
【符号の説明】
10 OCR 11 コールバック関数登録
部 12 イベントループ部 13 イベント処理部 14 前処理部 15 文字認識部 M 共有メモリ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 前野 芳史 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数の装置が該複数の装置で共有する共
    有メモリに該各装置に対応した各データをそれぞれ格納
    し、該各装置が該各データに基づいてマルチタスク操作
    されるオペレーティングシステム上で動作する文字認識
    装置において、 ポインタにより動作を開始し、前記マルチタスク操作さ
    れるオペレーティングシステムからの各種指令であるイ
    ベントを受信し、該イベントに基づいて前記共有メモリ
    に文書画像データが格納されたか否かを判定するイベン
    ト処理部と、 前記マルチタスク操作されるオペレーティングシステム
    が前記イベント処理部の動作の開始を指令するための前
    記ポインタを該オペレーティングシステムに登録するコ
    ールバック関数登録部と、 前記共有メモリに文書画像データが格納されたとき、前
    記ポインタにより動作を開始した前記イベント処理部の
    判定結果に基づいて該文書画像データに対して文字認識
    を実行して文字認識結果を該共有メモリへ格納する文字
    認識部とを、 備えたことを特徴とする文字認識装置。
  2. 【請求項2】 前記文字認識部は、 前記共有メモリに格納されている前記文書画像データに
    対して該文書画像データと同一領域に前記文字認識結果
    のデータを上書きすることを特徴とする請求項1記載の
    文字認識装置。
  3. 【請求項3】 前記文字認識部は、 前記共有メモリに格納されている前記文書画像データに
    対して該文書画像データと異なる領域に前記文字認識結
    果のデータを追加することを特徴とする請求項1記載の
    文字認識装置。
JP7217873A 1995-08-25 1995-08-25 文字認識装置 Withdrawn JPH0962772A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7217873A JPH0962772A (ja) 1995-08-25 1995-08-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7217873A JPH0962772A (ja) 1995-08-25 1995-08-25 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0962772A true JPH0962772A (ja) 1997-03-07

Family

ID=16711115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7217873A Withdrawn JPH0962772A (ja) 1995-08-25 1995-08-25 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0962772A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023008008A1 (ja) * 2021-07-30 2023-02-02 株式会社ソフトギア 情報処理プログラム、情報処理装置及び情報処理方法
JP2023020150A (ja) * 2021-07-30 2023-02-09 株式会社ソフトギア 通信管理プログラム、情報処理装置及び通信管理方法
JP2023085797A (ja) * 2021-12-09 2023-06-21 株式会社ソフトギア 情報処理プログラム、情報処理装置及び情報処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023008008A1 (ja) * 2021-07-30 2023-02-02 株式会社ソフトギア 情報処理プログラム、情報処理装置及び情報処理方法
JP2023020150A (ja) * 2021-07-30 2023-02-09 株式会社ソフトギア 通信管理プログラム、情報処理装置及び通信管理方法
US11762663B2 (en) 2021-07-30 2023-09-19 SoftGear Co., Ltd. Information processing program, information processing device, and information processing method
JP2023085797A (ja) * 2021-12-09 2023-06-21 株式会社ソフトギア 情報処理プログラム、情報処理装置及び情報処理方法

Similar Documents

Publication Publication Date Title
EP1553517B1 (en) Character recognition processing device, character recognition processing method, and mobile terminal device
US7626743B2 (en) Image processing apparatus, image processing method and image processing program for rendering pixels transparent in circumscribed areas
JP2003078870A (ja) デジタル画像受付装置
JPH0962772A (ja) 文字認識装置
JP2006172284A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2000295406A (ja) 画像処理方法、装置及び記憶媒体
JP2633235B2 (ja) Ocrファクシミリ装置
JP2003134282A (ja) 像形成システム
US20020112024A1 (en) Scanner with direct data forwarding capacity
JP3882657B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH10255063A (ja) 画像処理システム
JP3882603B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2897708B2 (ja) 表示データ入力装置
JP3082790B2 (ja) イメージデータ処理装置および文書ファイリングシステム
JP3046478B2 (ja) 印刷装置および印刷方法
JP3703237B2 (ja) 撮像画像転送方法及び撮像装置
JPH07234917A (ja) 画像処理装置
JP3258157B2 (ja) 情報処理装置
JP2005176317A (ja) ドキュメント処理データ生成可能なスキャンサブシステム
JPH10254989A (ja) 画像処理システムおよびその方法
JP2783187B2 (ja) ファクシミリ装置
JP2002222195A (ja) 文書選別装置及び文書選別方法
JPH0575765A (ja) 画像データ転送装置
JP2000113098A (ja) 文書処理装置、文書処理システム、文書処理方法及び記憶媒体
JPS62134765A (ja) 漢和辞書の電子検索方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20021105