JPS63143683A - 光学的文字読取り装置 - Google Patents

光学的文字読取り装置

Info

Publication number
JPS63143683A
JPS63143683A JP61289937A JP28993786A JPS63143683A JP S63143683 A JPS63143683 A JP S63143683A JP 61289937 A JP61289937 A JP 61289937A JP 28993786 A JP28993786 A JP 28993786A JP S63143683 A JPS63143683 A JP S63143683A
Authority
JP
Japan
Prior art keywords
resolution
characters
reading
recognition
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61289937A
Other languages
English (en)
Inventor
Toshio Seto
瀬戸 敏男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61289937A priority Critical patent/JPS63143683A/ja
Publication of JPS63143683A publication Critical patent/JPS63143683A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は光学的文字読取り装置に関し、特に読取り対象
の線密度に見合った解像度に設定を可能にして、常用速
度を低下させずに認識率を向上させるようにした光学的
文字読取り装置(以下、「OCR」という)に関する。
従来技術 従来のOCRにおいては、スキャナ部は一定の解像度で
読取ったデータを認識部に送るだけであり、認識率が低
くても原稿を拡大コピーして使用する等の対策しかなか
った。また、逆に、文字の大きさがかなり大きくても、
同一解像度で読取るため、読取り/認識時間を短縮する
ことができなかった。
以下、これについて具体的に説明する。
第3図は従来のOCRのスキャナの構成を示す図、第4
図はその動作の概要を示す図である。スキャナにより、
ライン単位で読取られたビット情報の画データは、細線
化、特徴抽出回路を経て認識文字コード発生部により、
文字コードとして出力される。特徴抽出回路において内
蔵する文字リストと対応がつかないものは、認識不能と
して特別なコードを割当てて出力する。
ここで、認識できない場合の原因としては、(1)内蔵
文字リストに対応する文字がない。
(2)原稿の文字品質が悪い(手書き、コピー品質の悪
さ、原稿の汚れ等)。
(3)文字の大きさがスキャナの解像能力ギリギリまた
は、それ以下である。
等の原因が考えられる。
このうち、(1)、(2)の原因については、対策も明
確であるが、(3)の原因に対しては、どんな文字でも
充分認識できるように高解像度スキャナを用いれば改善
されるものの、高解像にするためには読取ったビットイ
メージのデータ量が増大するため、読取り時間、データ
転送時間、認識処理時間のすべてが増加するという別の
問題を生ずる。
目     的 本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来のOCRにおける上述の如き問題を
解消し、上記(3)の原因による認識率の劣化を、常用
読取り速度を低下させることなく、また、認識時間を増
加させることなしに、必要部分のみ解像度を向上させる
ようにして解決するOCRを提供することにある。
構   成 本発明の上記目的は、ライン単位に原稿を読込んで、文
字認識を行い文字コードを発生させる光学的文字読取り
装置において、認識不能文字数を記憶する手段と、読取
り時の解像度の切換え手段とを設け、前記記憶手段に記
憶された認識不能文字数が予め定めた値に達した場合に
は、前記解像度切換え手段により解像度を上げて再読取
りを行う如く構成したことを特徴とする光学的文字読取
り装置によって達成される。
以下、本発明の構成を、実施例に基づいてより詳細に説
明する。
第1図は本発明の一実施例を示すOCRスキャナの構成
図である。図において、1はCCD等により構成される
1画情報をライン単位で読取るラインイメージセンサ、
2は該ラインイメージセンサ1出力(アナログ信号)の
増幅を行うビデオアンプ、3は上記ビデオアンプ2のア
ナログ信号を白黒の2値にディジタル化する2値化回路
、4は読取った画情報をビットイメージのまま複数ライ
ン分保持しておくメモリ(ラインバッファ)であり、最
低、文字の1行分(例えば、30ライン分)が必要であ
る。
また、5は読取られた文字の特徴抽出の前段階として、
文字の太さを無視するための処理を行う細線化回路、6
は1文字1文字の範囲を切出し、認識できる単位に区切
る文字切出し回路、7は文字の特徴を抽出した情報を蓄
えている認識用辞書回路、8は文字切出し回路6で切出
された1文字毎に、読取り文字の特徴をディジタル化し
て抽出する特徴抽出回路を示している。
また、9は特徴抽出回路で抽出された文字の特徴を上記
認識用辞書回路7と逐次比較して行き、合致するものを
探索する文字認識回路、lOはスキャナ部の機構の制御
、認識部のデータハンドリング制御等を行うマイクロプ
ロセッサ(以下、「制御部」という)、IIは上記認識
用辞書回路7と一致した文字に対応する文字コードを発
生させ、出力する文字コード発生回路、12は文字コー
ドパターンを記憶する文字コードパターン記憶回路を示
している。
また、13は外部接続機器との間のインタフェース(I
/F)回路、14は上記認識用辞書回路7との比較を行
っても一致するものがない場合に、その数をカウントす
る誤認文字数カウンタを示しており、本誤認文字数カウ
ンタ14は、カウントを“1”加える毎に認識不能コー
ドを出力する機能を有する。なお、15は上記ラインイ
メージセンサ1の画素数によって決まる読取り線密度を
、周囲画素の影響度を線形補間する方式で、情報量を低
減させるための線密度切換え回路を示している。
上述の如く構成された本実施例においては、ラインイメ
ージセンサ1の画素数によって決まる読取り線密度を、
回路上に線密度切換え回路15を設は情報量を落とすよ
うにすることにより、読取り線密度より低い線密度への
切換えを可能にしている。なお、線密度変換の方式は、
上述の方式に限定される必要はない。
第2図は本実施例の動作を示すフローチャートである。
以下、第1図、第2図に従って本実施例の動作を説明す
る。
通常の読取り操作においては、上述の線密度切換え回路
15は、低線密度(粗い方)にセットしておく(ステッ
プ21〜24)。これにより、読取りを行う場合、文字
認識回路9へ転送される画データの総量が、高線密度の
まま読取る場合より低減されるので、スキャナ部の1ペ
ージの読取り時間、データの転送時間、認識処理の処理
時間のすべてが低減でき、文字がある程度大きい場合は
高スループツトのOCRとなる(ステップ25〜30,
33.34)。
しかし、このままでは、認識不能の文字が増加する可能
性があるため、前述の認識用辞書回路7との比較を行っ
ても一致するものがない場合に、その数をカウントする
誤認文字数カウンタ14を設けて、認識できない文字の
数を行単位、または、列単位でカウントし、このカウン
ト値が設定値以上になった場合(ステップ28)には、
これを制御部10に伝え、同一の行を再度、線密度を変
えて認識し直す(ステップ31,32.25〜30)こ
とにより、認識不能な小さな文字、または、複雑な文字
を多く含んでいる領域のみ、高解像度で読込む。
上記実施例によれば、常用の読取り速度は高速度に維持
し、かつ、認識不能な文字を多く含んでいる領域につい
ては、自動的に解像度を向上させて読取ることが可能と
なり、この場合、速度の低下を最小限にして、認識率を
向上させることができるという効果がある。
上記実施例においては、認識文字の行単位で線密度を切
換えるように説明したが、これはページ単位としても良
い。例えば、スキャナを複写機タイプのスキャナとすれ
ば、走行体の往路で認識不能の文字の発生アドレスを記
憶し、復路で線密度を上げて上記認識不能文字の発生エ
リアを再読込みして、現路と復路のペアで1ページ読込
み・認識を完了するような方式である。
また、上記実施例においては、詳細には述べなかったが
、本発明は、漢字混じりの和文の如く、文字によって認
識に要する解像度が異なるような文字体系用の認識装置
に特に効果的である。
なお、線密度の切換えを3段階以上としたり、線密度切
換えを実施例に示した以外の方式によって行うこと等は
、当然本発明の範囲内に含まれるものである。
効   果 以上述べた如く、本発明によれば、ので、常用読取り速
度を低下させることなく、また、認識時間を増加させる
ことなしに、必要部分のみ解像度を向上させるようにし
て解決するOCRを実現できるという顕著な効果を奏す
るものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示すOCRスキャナの構成
図、第2図は本実施例の動作を示すフローチャート、第
3図は従来のOCRのスキャナの構成を示す図、第4図
はその動作の概要を示す図である。 1ニラインイメージセンサ、2:ビデオアンプ、3:2
値化回路、4ニラインバツフア、5:細線化回路、6:
文字切出し回路、7:認識用辞書回路、8:特徴抽出回
路、9:文字認識回路、10:制御部、11:文字コー
ド発生回路、12:文字コードパターン記憶回路、13
:I/F回路、14:誤認文字数カウンタ、15:線密
度切換え回路、21〜34:処理ステップ。

Claims (2)

    【特許請求の範囲】
  1. (1)ライン単位に原稿を読込んで、文字認識を行い文
    字コードを発生させる光学的文字読取り装置において、
    認識不能文字数を記憶する手段と、読取り時の解像度の
    切換え手段とを設け、前記記憶手段に記憶された認識不
    能文字数が予め定めた値に達した場合には、前記解像度
    切換え手段により解像度を上げて再読取りを行う如く構
    成したことを特徴とする光学的文字読取り装置。
  2. (2)前記解像度切換え手段による解像度変更と、これ
    による再読取りを、スキャナを往復動させて往路で認識
    できなかった領域について行うことを特徴とする特許請
    求の範囲第1項記載の光学的文字読取り装置。
JP61289937A 1986-12-05 1986-12-05 光学的文字読取り装置 Pending JPS63143683A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61289937A JPS63143683A (ja) 1986-12-05 1986-12-05 光学的文字読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61289937A JPS63143683A (ja) 1986-12-05 1986-12-05 光学的文字読取り装置

Publications (1)

Publication Number Publication Date
JPS63143683A true JPS63143683A (ja) 1988-06-15

Family

ID=17749674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61289937A Pending JPS63143683A (ja) 1986-12-05 1986-12-05 光学的文字読取り装置

Country Status (1)

Country Link
JP (1) JPS63143683A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008160810A (ja) * 2006-11-29 2008-07-10 Brother Ind Ltd 画像読取装置及び画像読取システム
JP2012222730A (ja) * 2011-04-13 2012-11-12 Mitsubishi Electric Building Techno Service Co Ltd 文書読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008160810A (ja) * 2006-11-29 2008-07-10 Brother Ind Ltd 画像読取装置及び画像読取システム
JP2012222730A (ja) * 2011-04-13 2012-11-12 Mitsubishi Electric Building Techno Service Co Ltd 文書読取装置

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
US4811412A (en) Method of a system for analyzing characters
US4584703A (en) Character recognition system and its use in an optical document reader
US20040179733A1 (en) Image reading apparatus
JPS63143683A (ja) 光学的文字読取り装置
JPH0291789A (ja) 文字認識方法
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JP3245449B2 (ja) 帳票読取装置
JPS6020785B2 (ja) 文字パタ−ンバツフア
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPS6336389A (ja) 文字読取装置
JPH0433074B2 (ja)
JP2595657Y2 (ja) 通帳読取装置
JP2917396B2 (ja) 文字認識方式
JP3031565B2 (ja) 表領域判定方法
JPS61281382A (ja) 文字位置情報作成回路
JPH01311390A (ja) 文字置換制御方式
JPS6095689A (ja) 光学的文字読取装置
JPS60225983A (ja) 文字読取装置
JPH07234917A (ja) 画像処理装置
JPS61221978A (ja) 多色図面読取装置
EP0471473A2 (en) Image recognition apparatus
JPS5914078A (ja) 帳票読取装置
JPS61285586A (ja) 分離文字を考慮した文字位置情報作成回路
JPS6115288A (ja) 光学的文字読取装置