JPH0877300A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH0877300A
JPH0877300A JP6207208A JP20720894A JPH0877300A JP H0877300 A JPH0877300 A JP H0877300A JP 6207208 A JP6207208 A JP 6207208A JP 20720894 A JP20720894 A JP 20720894A JP H0877300 A JPH0877300 A JP H0877300A
Authority
JP
Japan
Prior art keywords
character recognition
threshold value
image signal
image
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6207208A
Other languages
English (en)
Inventor
Michiko Hirayu
三知子 平湯
Kazuyoshi Suzuki
一可 鈴木
Yuka Nagai
由佳 長井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6207208A priority Critical patent/JPH0877300A/ja
Publication of JPH0877300A publication Critical patent/JPH0877300A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 簡単に効率良く濃度の異なる画像原稿から文
字を読み取る。 【構成】 スキャナ100から多値画像として読み取り
2値化した2値画像の1部を用いてテスト的に文字認識
回路105で文字認識を行なう。その結果得られる文字
認識の確実度(Ptest)を所定の閾値(P0)と比較す
る。ここで、Ptest≧P0であれば、読み込み2値化し
た画像全体について文字認識を実行する。これに対し
て、Ptest<P0であれば、2値化処理時の閾値(T
H)を微小量自動的に増減して変更し、Ptest≧P0と
なるまで、再度、2値化処理と文字認識のテストを行
う。このようにして、得られた2値画像を用いて画像全
体について文字認識を実行する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像処理装置に関し、特
に、画像原稿の文字を光学的に読み取って認識する画像
処理装置に関する。
【0002】
【従来の技術】従来のOCR(光学式文字読取装置)の
ような画像処理装置においては、画像原稿の読み取り
時、その画像原稿の印刷濃度が低い、或いは、高く文字
認識率が悪い場合には、ユーザのマニュアル操作により
再度画像原稿の読み込みを行ったり、または、画像原稿
を読み取って2値化する際の閾値を変えて、再認識させ
るのが一般的であった。
【0003】
【発明が解決しようとする課題】しかしながら上記従来
例では、画像原稿の濃度が薄い時、濃い時、或いは、そ
の濃度が薄い原稿と濃い原稿が混在していて、且つ、大
量に読み取り原稿が存在する場合には、ユーザが自分自
身で画像原稿の濃度を確認して、マニュアル操作によっ
て画像原稿に応じた濃度を設定したり、2値化の閾値を
変えるという煩雑な操作が頻繁に発生するので、画像の
読み取り効率が極めて悪いという問題があった。
【0004】本発明は上記従来例に鑑みてなされたもの
で、簡単に濃度が異なる画像原稿を効率良く読み取って
画像原稿に描かれた文字を認識できる画像処理装置を提
供することを目的としている。
【0005】
【課題を解決するための手段】上記目的を達成するため
に本発明の画像処理装置は、以下のような構成からな
る。即ち、画像原稿を多値画像信号として読み取る読み
取り手段と、前記多値画像信号を格納する第1記憶手段
と、前記多値画像信号を第1の閾値によって2値化する
2値化手段と、前記2値化手段によって2値化された2
値画像信号を用いて文字認識を行なう文字認識手段と、
前記2値画像信号の一部を試行的に文字認識を行なうテ
スト手段と、前記テスト手段によって得られた文字認識
結果を第2の閾値と比較する比較手段と、前記比較結果
に従って、良好な文字認識結果が得られるまで自動的に
前記第1の閾値を変更し、再度、前記第1記憶手段に格
納された多値画像信号を読みだして前記2値化手段によ
る2値化と前記テスト手段による試行的な文字認識とを
行なわせて、文字認識に最適な第1の閾値を求め、前記
求められた最適な第1の閾値に基づいて2値化された2
値画像信号全体にわたって、文字認識を行なわせるよう
制御する制御手段とを有することを特徴とする画像処理
装置を備える。
【0006】
【作用】以上の構成により本発明は、画像原稿を多値画
像信号として読み取り第1記憶手段に格納するととも
に、その多値画像信号を第1の閾値によって2値化し、
その2値化された2値画像信号の一部を試行的に文字認
識し、その文字認識結果を第2の閾値と比較し、その比
較結果に従って、良好な文字認識結果が得られるまで自
動的に前記第1の閾値を変更しながら、再度、第1記憶
手段に格納された多値画像信号を読みだして、2値化と
試行的な文字認識とを行なわせ、文字認識に最適な第1
の閾値を求め、その求められた最適な第1の閾値に基づ
いて2値化された2値画像信号全体にわたって文字認識
を行なわせる。
【0007】
【実施例】以下添付図面を参照して本発明の好適な実施
例を詳細に説明する。
【0008】図1は本発明の代表的な実施例の光学的文
字読み取り装置の構成を示すブロック図である。本実施
例の装置は、文字が描かれた画像原稿を光学的に多値画
像として読み取り、これを単純2値化処理によって2値
画像に変換し、その2値画像から文字を認識する装置で
ある。
【0009】図1において、100は画像原稿を光学的
に走査してその画像を読み取るスキャナ、101はスキ
ャナ100で読み取った画像を多値のデジタル画像信号
として入力する多値画像入力回路、102は入力された
多値画像信号を所定の閾値によって単純2値化し2値画
像信号に変換する2値化回路、103は2値画像信号を
格納するメモリ回路、104はスキャナ100で読み取
った画像原稿の濃度の濃淡を判定する判定回路、105
は2値画像信号に基づいて画像原稿に描かれた文字を認
識する文字認識回路、106は本装置の構成要素を接続
するシステムバス、107は多値画像入力回路101で
入力した多値画像を一時的に格納する多値画像のメモリ
回路、108は装置全体を制御するCPU、109はC
PU108が実行する制御プログラムを格納するRO
M、110は制御プログラム実行のために作業領域とし
て用いられるRAM、111は画像原稿読み取り指示等
を行なう操作パネルである。
【0010】2値化回路102で実行する単純2値化処
理の閾値は、後述する画像原稿読み取り処理の処理結果
に従って、CPU108によって自動的に変更される。
【0011】判定回路104は、文字認識回路105で
テスト的に実行したパターンマッチングの結果をフィー
ドバックして、スキャナ100で読み取った画像原稿の
濃度の濃淡を判定する。この点については後で詳細に説
明する。
【0012】また、文字認識回路105は、メモリ回路
103に格納された2値画像信号に基づいて、図2のフ
ローチャートに示すように、画像からの文字切り出し処
理を行う(ステップS201)。この切り出し処理で
は、1文字づつの文字画像の外接矩形を求められ、文字
画像1文字1文字が切り出される。その後、その切り出
された文字画像1文字1文字について、文字認識回路1
05内に備えられた辞書(不図示)を用いて文字認識を
行なう(ステップS202)。この文字認識処理では先
ず位置、傾き、線幅、濃度等の正規化処理を行い、更に
この正規化された切り出し文字画像データに対して輪郭
線特徴等に基づく特徴ベクトルの抽出を行う。そして、
予め用意された辞書に格納されているすべての認識対象
文字の標準パターンベクトルとのマッチングを取り、最
も確からしいとされた標準パターンに対応する文字コー
ドを認識結果として出力する。
【0013】次に上記構成の装置が実行する画像原稿読
み取り処理を図3に示すフローチャートを参照して説明
する。
【0014】まずステップS300では2値化回路10
2での単純2値化処理に用いる閾値(TH)を初期値
(TH0)にセットする。次に、ステップS305では
スキャナ100から画像原稿を読み取り、さらにステッ
プS310では読み取った多値画像信号を多値画像メモ
リ回路107に格納する。ステップS315ではセット
された閾値(TH)を用いて2値化回路102で読み込
まれた多値画像信号を単純2値化し、ステップS320
ではその2値画像信号をメモリ回路103に格納する。
【0015】次に処理はステップS325において、文
字認識回路105はメモリ回路103に格納された2値
画像信号の一部を読みだして文字切り出しを行ない、そ
してステップS330では辞書を参照して、その切り出
された文字画像の特徴ベクトルと辞書に格納された標準
パターンベクトルとのパターンマッチングを行なう。こ
のようなステップS325〜S330の2値画像信号の
一部を用いたパターンマッチングをパターンマッチング
テストという。ステップS335では、このようにして
行なわれたパターンマッチングから得られる特定の文字
との類似度(Ptest)を判定回路104に転送する。こ
こで、得られた類似度はレジスタに記憶され、後述する
処理のために保持される。
【0016】ステップS340では、判定回路104に
格納された所定の閾値(P0)と類似度(Ptest)とを
比較する。この所定の閾値(P0)とは標準的な濃度で
画像原稿が読み込まれパターンマッチングが行なわれた
ときに期待される類似度であり実験的或いは経験的に求
められる値である。ここで、Ptest≧P0であれば、読
み込まれ2値化された画像信号の濃度は文字認識を正し
く実行するのに適切であると判断して、処理はステップ
S375に進む。そして、ステップS375では読み込
まれた画像原稿全体の2値信号を用いて、文字切り出し
処理を実行し、ステップS380では切り出された文字
画像1文字1文字について文字認識処理を行なう。ステ
ップS385では、文字認識結果得られた文字コードを
出力する。
【0017】これに対して、Ptest<P0であれば、読
み込まれ2値化された画像信号の濃度は文字認識を正し
く実行するのに適切ではないと判断して、処理はステッ
プS345に進む。ステップS345ではステップS3
25〜S330で実行されたパターンマッチングテスト
が1回目であるかどうかを調べ、そのテストが1回目で
ある場合、処理はステップS350に進み、2値化回路
102の単純2値化処理で用いる閾値(TH)を変更す
る。この変更は今まで用いられてきた閾値にΔTHを加
えた値を新たに用いる閾値とする。この時のΔTHは初
期閾値(TH0)の数%程度の値とする。その後、処理
はステップS315に戻り、多値画像メモリ回路107
に格納されている多値画像信号を読みだして2値化処理
を再実行する。
【0018】一方、パターンマッチングテスト2回目以
降のものであった場合、処理はステップS355に進
み、今回得られた類似度(Ptest(NEW))と前回得られ
た類似度(Ptest(OLD))とを比較する。ここで、Ptes
t(OLD)≦Ptest(NEW)であれば、前回のパターンマッチ
ングテストよりも、類似度は十分に改善されていないも
ののかなりの改善があったとみなし処理はステップS3
50に進み、2値化回路102の単純2値化処理で用い
る閾値(TH)を変更する。これに対して、Ptest(OL
D)>Ptest(NEW)であれば、前回のパターンマッチング
テストよりも、類似度はさらに悪くなっており、処理は
ステップS360に進み、そのパターンマッチングテス
トが2回目であるかどうかを調べる。ここで、そのテス
トが2回目のものであれば、処理はステップS365に
進んで2値化回路102の単純2値化処理で用いる閾値
(TH)を前のテストで用いた値より2×ΔTHを減じ
た値を新たに用いる閾値とし、3回目以降のものであれ
ば、処理はステップS370に進んで2値化回路102
の単純2値化処理で用いる閾値(TH)を前のテストで
用いた値よりΔTHを減じた値を新たに用いる閾値とす
る。
【0019】ステップS365或いはステップS370
の処理後は、処理はステップS315に戻り、変更され
た閾値(TH)を用いて2値化処理を行なう。
【0020】従って本実施例に従えば、入力多値画像信
号から最初に得られた2値画像信号に基づいて、その一
部の画像信号を用いてテスト的に文字切り出しと文字認
識とを行ない、そのテストによって得られた類似度を所
定の閾値と比較し、その比較結果に従って、多値画像信
号を2値化するときの閾値を自動的に変化させ、良好な
類似度が得られる場合の2値化画像信号を用いて、入力
画像全体に対する文字切り出しと文字認識処理とを行な
うことができる。
【0021】これによって、最初に得られた2値画像信
号の画像濃度が高すぎたり、或いは、低すぎたりして良
好な文字認識が行なわれなくとも、自動的に2値化レベ
ルを調整して文字認識処理に最適な2値化画像が得られ
るので、ユーザが煩雑なマニュアル操作を行なうことな
く、最適な文字読み取りを行なうことができる。
【0022】なお多値画像信号から2値画像信号を得る
ための単純2値化処理に用いる閾値(TH)を変更する
ための処理は必ずしも本実施例のようにする必要はな
く、ΔTHの値として他の値をとることもできるし、閾
値(TH)の増減の制御についても+方向(増加)と−
方向(減少)で別の制御を行なうようにしても良いこと
は言うまでもない。
【0023】尚、本発明は、複数の機器から構成される
システムに適用しても良いし、1つの機器から成る装置
に適用しても良い。また、本発明は、システム或は装置
にプログラムを供給することによって達成される場合に
も適用できることはいうまでもない。
【0024】
【発明の効果】以上説明したように本発明によれば、画
像原稿を多値画像信号として読み取り第1記憶手段に格
納するとともに、その多値画像信号を第1の閾値によっ
て2値化し、その2値化された2値画像信号の一部を試
行的に文字認識し、その文字認識結果を第2の閾値と比
較し、その比較結果に従って、良好な文字認識結果が得
られるまで自動的に前記第1の閾値を変更しながら、再
度、第1記憶手段に格納された多値画像信号を読みだし
て、2値化と試行的な文字認識とを行なわせ、文字認識
に最適な第1の閾値を求め、その求められた最適な第1
の閾値に基づいて2値化された2値画像信号全体にわた
って文字認識を行なわせるので、煩雑な操作を行なうこ
となく、文字認識に最適な2値画像が得られ、かつ、そ
の2値画像に基づいて文字認識を行なうことができると
いう効果がある。
【図面の簡単な説明】
【図1】本発明の代表的な実施例である光学的文字読み
取り装置の構成を示すブロック図である。
【図2】文字認識回路105での処理を示すフローチャ
ートである。
【図3】文字読み取り処理を示すフローチャートであ
る。
【符号の説明】
100 スキャナ 101 多値画像入力回路 102 2値化回路 103 メモリ回路 104 判定回路 105 文字認識回路 106 システムバス 107 多値画像メモリ回路 108 CPU 109 ROM 110 RAM 111 操作パネル

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 画像原稿を多値画像信号として読み取る
    読み取り手段と、 前記多値画像信号を格納する第1記憶手段と、 前記多値画像信号を第1の閾値によって2値化する2値
    化手段と、 前記2値化手段によって2値化された2値画像信号を用
    いて文字認識を行なう文字認識手段と、 前記2値画像信号の一部を試行的に文字認識を行なうテ
    スト手段と、 前記テスト手段によって得られた文字認識結果を第2の
    閾値と比較する比較手段と、 前記比較結果に従って、良好な文字認識結果が得られる
    まで自動的に前記第1の閾値を変更し、再度、前記第1
    記憶手段に格納された多値画像信号を読みだして前記2
    値化手段による2値化と前記テスト手段による試行的な
    文字認識とを行なわせて、文字認識に最適な第1の閾値
    を求め、前記求められた最適な第1の閾値に基づいて2
    値化された2値画像信号全体にわたって、文字認識を行
    なわせるよう制御する制御手段とを有することを特徴と
    する画像処理装置。
  2. 【請求項2】 前記読み取り手段は、光学的スキャナで
    あることを特徴とする請求項1に記載の画像処理装置。
  3. 【請求項3】 前記文字認識手段は、前記2値画像信号
    から前記画像原稿に描かれた文字を1文字づつ切り出す
    切り出し手段と、 辞書を参照して、前記切り出し手段によって切り出され
    た文字を1文字づつパターンマッチングによって文字認
    識するマッチング手段とを含むことを特徴とする請求項
    1に記載の画像処理装置。
  4. 【請求項4】 前記第2の閾値は、前記パターンマッチ
    ングによって得られた前記辞書内に格納されている標準
    的な文字パターンとの類似度を表す指標であることを特
    徴とする請求項3に記載の画像処理装置。
JP6207208A 1994-08-31 1994-08-31 画像処理装置 Withdrawn JPH0877300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6207208A JPH0877300A (ja) 1994-08-31 1994-08-31 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6207208A JPH0877300A (ja) 1994-08-31 1994-08-31 画像処理装置

Publications (1)

Publication Number Publication Date
JPH0877300A true JPH0877300A (ja) 1996-03-22

Family

ID=16536033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6207208A Withdrawn JPH0877300A (ja) 1994-08-31 1994-08-31 画像処理装置

Country Status (1)

Country Link
JP (1) JPH0877300A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007188297A (ja) * 2006-01-13 2007-07-26 Nec Corp 郵便物区分機および宛名読取方法
US8014601B2 (en) 2005-11-29 2011-09-06 Nec Corporation Pattern recognizing apparatus, pattern recognizing method and pattern recognizing program
RU2718571C1 (ru) * 2019-10-25 2020-04-08 Общество С Ограниченной Ответственностью "Конструкторское Бюро "Дорс" (Ооо "Кб "Дорс") Способ бинаризации изображений символов на банкноте на основе гистограммы длины границ

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8014601B2 (en) 2005-11-29 2011-09-06 Nec Corporation Pattern recognizing apparatus, pattern recognizing method and pattern recognizing program
JP2007188297A (ja) * 2006-01-13 2007-07-26 Nec Corp 郵便物区分機および宛名読取方法
RU2718571C1 (ru) * 2019-10-25 2020-04-08 Общество С Ограниченной Ответственностью "Конструкторское Бюро "Дорс" (Ооо "Кб "Дорс") Способ бинаризации изображений символов на банкноте на основе гистограммы длины границ

Similar Documents

Publication Publication Date Title
JPH1139428A (ja) 文書映像の方向修正方法
JPH0877300A (ja) 画像処理装置
JP3884845B2 (ja) 情報処理装置及び方法
JPH02293989A (ja) 文字認識装置
JPH10222602A (ja) 光学式文字読取装置
JPH10171924A (ja) 文字認識装置
US20080225340A1 (en) Image processing apparatus, image processing method, and computer program product
JP2002157552A (ja) 光学式文字読取装置
JPH08221515A (ja) 画像処理装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP3121401B2 (ja) 認識辞書及び文字認識装置
JPH06231306A (ja) 文字認識装置
JPH05166009A (ja) 文字切出し・認識方法及び装置
JPS60122474A (ja) 正規化方法
CN117690139A (zh) 一种基于纸质图书阅览电子化后的图像前处理方法及系统
JP3957846B2 (ja) 通信システム及びその制御方法、コンピュータ可読メモリ
JPH07262311A (ja) 文字認識前処理装置
JPH04291479A (ja) 罫線認識方法及び表処理方法
JPH06282680A (ja) 文字認識処理装置
JPH03217993A (ja) 文字サイズ認識装置
JPH05182025A (ja) 文字認識装置
JPH0969139A (ja) 光学式文字読取方法とその装置
JPH05189604A (ja) 光学的文字読取装置
JPH1166240A (ja) 文書認識方法および文書認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20011106