JPH05217018A - 文字自動認識装置 - Google Patents

文字自動認識装置

Info

Publication number
JPH05217018A
JPH05217018A JP4022363A JP2236392A JPH05217018A JP H05217018 A JPH05217018 A JP H05217018A JP 4022363 A JP4022363 A JP 4022363A JP 2236392 A JP2236392 A JP 2236392A JP H05217018 A JPH05217018 A JP H05217018A
Authority
JP
Japan
Prior art keywords
character
image data
image
character recognition
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4022363A
Other languages
English (en)
Inventor
Shingo Yukimoto
真吾 行本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4022363A priority Critical patent/JPH05217018A/ja
Publication of JPH05217018A publication Critical patent/JPH05217018A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識不能な画像データがあっても文字認
識の処理を中断しないようにし、その画像に対する正し
い文字入力をスムーズに行なえるようにする。 【構成】 スキャナ1から原稿の画像を読み取り、その
画像データをイメージメモリ3に展開し、イメージ処理
プロセッサ6が変倍処理や回転処理を施してOCR処理
装置7へ送る。そのOCR処理装置7は画像データの一
部領域又は全領域に対して文字認識の解析をし、文字認
識できない画像データがあると、その画像データに対し
て認識不能文字を示す認識不能文字番号を付与し、文字
認識できない画像データと共に内部のバッファに記憶す
る。そして、CPU11がバッファ内の文字コード群を
ファイルデータとして外部記憶装置8に記憶させ、その
文字コードに対する文字フォント展開データによってC
RT4に文字を表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、手書き又は印刷され
た原稿の画像データから文字,数字,記号等を認識し
て、それらに対応する文字コードを得て記憶する自動文
字認識装置に関する。
【0002】
【従来の技術】一般に、文字,数字,及び記号等(以下
「文字」と総称する)が手書き又は印刷された原稿の画
像を読み取って、その画像データから文字を認識し、そ
の認識した文字に対応する文字コードを取得して記憶す
る文字自動認識装置が知られている。このような文字自
動認識装置は、例えば各種画像データをファイル形式で
読み出し可能に記憶する電子ファイリングシステムや、
デスクトップパブリッシングシステム等の装置にも適用
されている。
【0003】従来、このような文字自動認識装置では、
読み取った画像データから文字を認識する解析処理を行
なった結果、ある程度以上の確からしさで文字認識がで
きなかった場合、その時点で処理を中断して文字認識不
能であることを通知し、オペレータによってキーボード
等の入力装置から文字認識不能であった画像データに対
する正しい文字の入力を行なわせたり、文字認識不能な
画像データに対してとりあえず空白文字を出力してお
き、一連の文字認識処理を終了した後にオペレータによ
ってキーボード等の入力装置から空白文字に対する正し
い文字の入力を行なわせるようにしていた。
【0004】また、このような文字自動認識装置のなか
には、セットした複数の原稿を連続して給紙するオート
ドキュメントフィーダ(ADF)を備え、複数の原稿の
画像を次々と読み取ってそれらの読み取った画像データ
に対する文字認識の処理を行なうようなものがあった。
【0005】
【発明が解決しようとする課題】しかしながら、上述の
ような文字自動認識装置では、文字認識不能な画像デー
タがある度に文字認識の処理を中断してしまうので、文
字認識処理の能率が低下するという問題があった。ま
た、文字認識不能な画像データに空白文字を出力する場
合も、オペレータがその空白文字に対する正しい文字を
入力作業を行なわなければならないので、文字認識処理
の能率が低下するという問題があった。
【0006】さらに、オートドキュメントフィーダを備
えた文字自動認識装置の場合、文字認識不能な画像デー
タがある度にオートドキュメントフィーダの連続給紙の
動作を止めなければならなくなり、文字認識処理の能率
が低下するという問題があった。そして、上述したいず
れの文字自動認識装置でも、オペレータは文字認識処理
中は常にその処理状況を監視して、文字認識不能な画像
データがあった場合にはそれに対する正しい文字入力の
操作等を行なわなければならないので、オペレータの作
業負担が増加するという問題もあった。
【0007】この発明は上記の点に鑑みてなされたもの
であり、文字認識不能な画像データがあっても文字認識
の処理を中断しないようにし、その認識不能な画像デー
タに対する正しい文字を入力する場合の作業をスムーズ
に行なえるようにすることを目的とする。
【0008】
【課題を解決するための手段】この発明は上記の目的を
達成するため、手書き又は印刷された原稿の画像を読み
取る手段と、その手段によって読み取った画像データか
ら文字を認識する文字認識手段と、その手段によって認
識した文字に対応する文字コードを取得して記憶する手
段とを備えた文字自動認識装置において、文字認識手段
によって文字認識できない画像データに認識不能文字で
あることを示す認識不能文字番号を付与して文字認識で
きない画像データと共に記憶する手段を設けたものであ
る。
【0009】あるいは、上記のような原稿の画像を読み
取り、その画像データから文字認識手段が文字を認識
し、その認識文字に対応する文字コードを取得して記憶
する文字自動認識装置において、文字認識手段によって
文字認識できない画像データを予め設定したサイズに変
倍する手段と、その手段によって変倍した画像データに
文字コードを付与して認識不能文字として外字登録する
手段とを設けてもよい。また、認識不能文字を外字登録
するか否かを選択させる手段を設けるとよい。
【0010】
【作用】この発明による文字自動認識装置は、手書き又
は印刷された原稿の画像を読み取り、文字認識手段が読
み取り画像データから文字を認識する。そのとき、文字
認識できない画像データに対しては、認識不能文字であ
ることを示す認識不能文字番号を付与して文字認識でき
ない画像データと共に記憶するので、その認識不能文字
番号によって文字認識できない画像データを呼び出して
解析結果として出力することが可能になり、文字認識処
理を継続することができる。
【0011】あるいは、文字認識手段によって文字認識
できない画像データに対して、その画像データを予め設
定したサイズに変倍し、それに文字コードを付与して認
識不能文字として外字登録すれば、文字認識できない画
像データの解析結果を外字として出力することが可能に
なり、文字認識処理を継続することができる。また、い
ずれの文字自動認識装置も認識不能な画像データを出力
可能なので、その認識不能な画像データに対する正しい
文字を入力するときの入力すべき文字の判断が容易にな
る。さらに、認識不能文字を外字登録するか否かを選択
させるようにすれば、オペレータが文字認識処理の継続
を優先するか否かを任意に選択することができる。
【0012】
【実施例】以下、この発明の実施例を図面に基づいて具
体的に説明する。図1は、この発明の一実施例である文
字自動認識装置を備えた電子ファイリング装置の構成を
示すブロック図である。この電子ファイリング装置は、
スキャナ1,スキャナインタフェース2,イメージメモ
リ3,CRT4,ビデオRAM5,イメージ処理プロセ
ッサ6,OCR処理装置7,外部記憶装置8,外部記憶
装置コントローラ9,プログラムメモリ10,CPU1
1,イメージバス12,及びCPUバス13とからな
る。
【0013】スキャナ1は、文字,数字,及び記号等が
手書き又は印刷された原稿の画像を読み取る原稿画像読
取装置であり、複数の原稿を一度にセットしてそれらを
順次連続して給紙するためのオートドキュメントフィー
ダ(ADF)の機能も備えている。スキャナインタフェ
ース2は、スキャナ1によって読み取った画像データを
イメージメモリ3へ送る処理を行なう。イメージメモリ
3は、読み取った画像データ又は各種の処理を施された
画像データを一時的に展開する記憶エリアである。
【0014】CRT4は、原稿から読み取った画像や外
部記憶装置8に記憶している画像データの画像等を表示
するためのディスプレイ装置である。ビデオRAM5
は、CRT4に表示させる画像データを展開する記憶エ
リアである。イメージ処理プロセッサ6は、イメージメ
モリ3に展開された画像データに対して変倍処理や回転
処理を施す。
【0015】OCR処理装置7は、イメージ処理プロセ
ッサ6で処理を施された画像データの一部領域又は全領
域について文字認識して対応する文字コードを取得する
処理と、文字認識できない画像データに認識不能文字で
あることを示す認識不能文字番号を付与してその文字認
識できない画像データと共に記憶させる処理、あるい
は、文字認識できない画像データを予め設定したサイズ
に変倍し、その変倍した画像データに文字コードを付与
して認識不能文字として外字登録させる処理等を行な
う。
【0016】外部記憶装置8は、ハードディスク装置又
はフロッピディスク装置等であり、文字コード等を記憶
する。外部記憶装置コントローラ9は、外部記憶装置8
にデータを記憶させたり、記憶されているデータを読み
出したりする制御処理を司る。プログラムメモリ10
は、この電子ファイリング装置を制御するための各種の
プログラムを記憶している。
【0017】CPU11は、プログラムメモリ10に記
憶されている各種のプログラムを読み出して動作させ、
この電子ファイリング装置全体の制御処理や各種の処理
等を行なう。イメージバス12及びCPUバス13はそ
れぞれデータを遣り取りするための通信線である。
【0018】次に、この電子ファイリング装置の処理に
ついて説明する。まず、スキャナ1によって文字が手書
きされている原稿の画像を読み取り、その読み取った画
像の画像データをスキャナインタフェース2を介してイ
メージメモリ3に展開する。そのイメージメモリ3に展
開された画像データに対して、イメージ処理プロセッサ
6が変倍処理や回転処理を施してOCR処理装置7へ送
り、そのOCR処理装置7がその画像データの一部領域
又は全領域に対して文字認識のための解析を行ない、そ
の解析結果である文字に対応する文字コードを内部のバ
ッファに蓄積する。
【0019】その後、読み取った画像データに対する文
字認識のための解析処理が終了すると、CPU11がO
CR処理装置7の内部のバッファに蓄積されている文字
コード群をファイルデータとして外部記憶装置コントロ
ーラ9を介して外部記憶装置8に記憶させる。また、イ
メージ処理プロセッサ6によって、そのバッファに蓄積
した文字コードに対応する文字フォントを展開し、その
文字フォント展開データをイメージメモリ3に転送し、
その文字フォント展開データをビデオRAM5を介して
CRT4に送って表示させる。
【0020】次に、OCR処理装置7において文字認識
できない画像データがあった場合の処理について説明す
る。OCR処理装置7は、文字認識できない画像データ
があると、その画像データに対して認識不能文字である
ことを示す認識不能文字番号を付与し、文字認識できな
い画像データと共に内部のバッファに記憶する。そし
て、その認識不能文字番号によって文字認識できない画
像データを呼び出してCRT4に表示させる。
【0021】したがって、読み取った画像データに対し
て文字認識不能の場合でも文字認識処理を中断すること
なく、文字認識処理を継続することができる。この認識
不能文字をリジェクト文字と称する。また、認識不能な
画像データを出力可能なので、その認識不能な画像デー
タに対する正しい文字を入力するときは、その出力され
た画像データによって入力すべき文字を容易に判断する
ことができ、その文字入力を素早く行なえる。
【0022】次に、OCR処理装置7において文字認識
できない画像データがあった場合の処理の他の実施例に
ついて説明する。この実施例では、文字認識手段によっ
て文字認識できない画像データに対して、その画像デー
タを予め設定したサイズに変倍し、それに文字コードを
付与して認識不能文字として外字登録する。この外字と
は、JIS等によって規定されている図形文字以外の図
形文字であり、外字コードに対応させて規定の図形文字
用符号表の空き領域に割り当てて記憶することができる
ものである。
【0023】図2は文字自動認識処理を示すフローチャ
ートである。文字自動認識処理を開始すると、読み取っ
た画像データに各種の処理を施して1文字分の画像デー
タを切り出し、この画像データに対して文字認識のため
の解析処理を行なう。この文字認識のための解析処理に
ついては、公知の技術を利用すればよいのでここではそ
の詳細な説明を省略する。
【0024】画像データに対して文字認識のための解析
処理を施した結果、文字認識が可能であったか否かを判
断し、認識可能ならその認識した文字に対応する文字コ
ードをバッファに書き込む。一方、解析対象文字の画像
データに何らかの不要情報が含まれていたり、解析対象
文字の画像データが不良であったような場合には、文字
を認識できないため文字認識が可能であったか否かの判
断でNOとなり、その認識不能文字の画像データに対し
て認識不能文字コードとしての外字コードを付与して登
録する。
【0025】その後、認識不能文字の画像データに対し
て変倍処理を行なって、予め設定したフォントサイズに
変倍し、それによって得られた変倍済画像データである
外字フォントデータを、その外字コードと共に外部記憶
装置に記憶することによって外字登録する。このとき、
外部記憶装置に代えて電子ファイリング装置内の空きメ
モリに設定したフォントファイルの該当する位置に外字
フォントデータを記憶するようにしてもよい。
【0026】このようにして、認識結果の文字コード又
は外字コードとそれに対応する外字フォントデータを記
憶した後、未解析文字の画像データがあるか否かを判断
し、あれば上述の処理を繰り返し、なければ文字自動認
識処理を終了する。したがって、この処理以後はフォン
ト展開処理のときに外字コードを用いて認識不能文字に
対応する画像データの外字フォントデータを生成して外
部記憶装置に記憶したりCRTに表示したりすることが
できるようになり、文字認識処理を中断してしまうよう
なことがなくなる。また、認識不能な画像データを外字
として出力可能なので、その認識不能な画像データに対
する正しい文字を入力するときに、その出力された外字
によって入力すべき文字を判断して素早く入力できる。
【0027】また、上述の実施例において、文字認識不
能な画像データがあった場合、その認識不能文字を外字
登録するか否かをオペレータに選択させるようにすれ
ば、オペレータが文字認識処理の継続を優先するか否か
に応じて文字認識処理を任意に選択することができる。
【0028】
【発明の効果】以上説明してきたように、この発明によ
る文字自動認識装置によれば、文字認識不能であった画
像データをそれに対応する認識不能文字番号を付与して
記憶するので、この認識不能文字番号によって文字認識
不能であった画像データを呼び出して出力することが可
能になる。あるいは、文字認識不能であった画像データ
を予め設定したサイズに変倍してそれに文字コード(外
字コード)を付与し、認識不能文字として外字登録する
ので、この文字コードによって文字認識不能であった画
像データを呼び出して出力することが可能になる。
【0029】したがって、文字認識不能な画像データが
ある度に文字認識の処理を中断してしまうことがなく、
文字認識処理の能率を低下させることがない。また、オ
ートドキュメントフィーダを利用した場合でも、文字認
識不能な画像データがある度にオートドキュメントフィ
ーダの連続給紙の動作を止める必要がなくなる。
【0030】さらに、文字認識処理が中断することなく
継続されるので、文字認識処理中の処理状況を監視した
り、文字認識不能な画像データがあった場合の正しい文
字入力の操作等を行なわなくてもよくなるので、オペレ
ータの作業負担を低下させることができる。さらにま
た、文字認識不能な画像データを出力可能なので、オペ
レータが正しい文字を入力するときには、その画像デー
タによって入力すべき文字を容易に判断することがで
き、その入力作業をスムーズに行なうことができる。そ
して、認識不能文字を外字登録するか否かを選択させる
ようにすれば、オペレータが文字認識処理の継続を優先
するか否かを任意に選択して実行させることができる。
【図面の簡単な説明】
【図1】この発明の一実施例である文字自動認識装置を
備えた電子ファイリング装置の構成を示すブロック図で
ある。
【図2】図1に示した電子ファイリング装置における文
字自動認識処理を示すフローチャートである。
【符号の説明】
1 スキャナ 2 スキャナイン
タフェース 3 イメージメモリ 4 CRT 5 ビデオRAM 6 イメージ処理
プロセッサ 7 OCR処理装置 8 外部記憶装置 9 外部記憶装置コントローラ 10 プログラム
メモリ 11 CPU 12 イメージバ
ス 13 CPUバス

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 手書き又は印刷された原稿の画像を読み
    取る手段と、該手段によって読み取った画像データから
    文字を認識する文字認識手段と、該手段によって認識し
    た文字に対応する文字コードを取得して記憶する手段と
    を備えた文字自動認識装置において、 前記文字認識手段によって文字認識できない画像データ
    に認識不能文字であることを示す認識不能文字番号を付
    与して前記文字認識できない画像データと共に記憶する
    手段を設けたことを特徴とする文字自動認識装置。
  2. 【請求項2】 手書き又は印刷された原稿の画像を読み
    取る手段と、該手段によって読み取った画像データから
    文字を認識する文字認識手段と、該手段によって認識し
    た文字に対応する文字コードを取得して記憶する手段と
    を備えた文字自動認識装置において、 前記文字認識手段によって文字認識できない画像データ
    を予め設定したサイズに変倍する手段と、該手段によっ
    て変倍した画像データに文字コードを付与して認識不能
    文字として外字登録する手段とを設けたことを特徴とす
    る文字自動認識装置。
  3. 【請求項3】 請求項2記載の自動文字認識装置におい
    て、前記認識不能文字を外字登録するか否かを選択させ
    る手段を設けたことを特徴とする自動文字認識装置。
JP4022363A 1992-02-07 1992-02-07 文字自動認識装置 Pending JPH05217018A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4022363A JPH05217018A (ja) 1992-02-07 1992-02-07 文字自動認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4022363A JPH05217018A (ja) 1992-02-07 1992-02-07 文字自動認識装置

Publications (1)

Publication Number Publication Date
JPH05217018A true JPH05217018A (ja) 1993-08-27

Family

ID=12080548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4022363A Pending JPH05217018A (ja) 1992-02-07 1992-02-07 文字自動認識装置

Country Status (1)

Country Link
JP (1) JPH05217018A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6264232B1 (en) 2000-02-08 2001-07-24 Siemens Automotive Corporation Air bag sensor module installation apparatus and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6264232B1 (en) 2000-02-08 2001-07-24 Siemens Automotive Corporation Air bag sensor module installation apparatus and method

Similar Documents

Publication Publication Date Title
US5563986A (en) Image processing system
JPH03248224A (ja) 印刷出力処理方式
EP1061460B1 (en) Partial image forming method and apparatus for filing documents
JPH05217018A (ja) 文字自動認識装置
JP3319203B2 (ja) 文書ファイリング方法及び装置
JP2007201752A (ja) 画像入力プログラム、画像入力装置、画像入力システムおよび画像入力方法
JP3458001B2 (ja) 画像ファイル装置
JPH041862A (ja) 図形選択方法
JP3796769B2 (ja) 出力装置
JPH06236408A (ja) 電子ファイル装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JP3339914B2 (ja) 電子ファイル装置
JPH04120670A (ja) 電子ファイル装置
JPH09330196A (ja) 文書読取装置
JPH1139465A (ja) 自動文書分割方式
JPS62134765A (ja) 漢和辞書の電子検索方法
JPH04348475A (ja) 画像情報検索方法及びその装置
JPH11345280A (ja) 画像処理方法及び装置、記憶媒体
JPH04205190A (ja) イメージデータ処理方式
JPH06274593A (ja) 電子ファイリング装置
JPH0273468A (ja) 電子ファイリングシステム
JPH07334611A (ja) 非認識文字の表示方法
JPH05135150A (ja) 画像処理装置
JPH09231309A (ja) 電子ファイリング装置
JPH0869519A (ja) 電子ファイリングシステム