JPH06195511A - 2値化しきい値決定装置 - Google Patents

2値化しきい値決定装置

Info

Publication number
JPH06195511A
JPH06195511A JP4342371A JP34237192A JPH06195511A JP H06195511 A JPH06195511 A JP H06195511A JP 4342371 A JP4342371 A JP 4342371A JP 34237192 A JP34237192 A JP 34237192A JP H06195511 A JPH06195511 A JP H06195511A
Authority
JP
Japan
Prior art keywords
value
threshold value
image
neural network
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4342371A
Other languages
English (en)
Other versions
JP3248965B2 (ja
Inventor
Toshio Miyazawa
利夫 宮澤
Hideaki Yamagata
秀明 山形
Ai Rebin Aaru
アイ レビン アール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP34237192A priority Critical patent/JP3248965B2/ja
Publication of JPH06195511A publication Critical patent/JPH06195511A/ja
Application granted granted Critical
Publication of JP3248965B2 publication Critical patent/JP3248965B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 2値化しきい値決定の精度を高めること。 【構成】 学習機能を持たせたニューラルネットワーク
10を用いて、文字認識装置2に対する入力画像として
多値画像を2値画像にするためのしきい値を決定する2
値化しきい値決定装置4において、前記多値画像の各画
素値から濃度ヒストグラムを作成する手段9を設け、前
記ニューラルネットワーク10に、各濃度における濃度
ヒストグラムの頻度値を入力とする入力層と、入力され
た前記多値画像に対する最適2値化しきい値を出力する
出力層と、濃度ヒストグラムを入力層に与えて出力層か
ら出力される値より算出した2値化しきい値を用いて2
値化した時の文字認識装置2の誤認識率をエラーとして
ニューラルネットワーク10の学習を行わせる学習制御
手段とを設けて、濃度ヒストグラム全体をニューラルネ
ットワーク10の入力として2値化しきい値を決定する
ようにした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば文字認識装置の
入力画像を得るために多値画像を2値化する際の2値化
しきい値を決定するために、学習機能を持つニューラル
ネットワークを用いた2値化しきい値決定装置に関す
る。
【0002】
【従来の技術】一般に、文字認識装置は2値画像を認識
対象としており、多値画像の場合には、これを2値化し
て入力させる必要がある。ここに、文字認識装置の認識
性能は、2値画像の品質に左右されるので、文字認識装
置の前段に品質のよい2値画像を得る2値化処理手段を
追加すれば、文字認識装置の性能を向上させ得るといえ
る。
【0003】そこで、多値画像を2値化するための2値
化しきい値を決定する手法として、従来、多くのものが
提案・発表されている。数例を挙げると、第1に、論文
「判別および最小2乗基準に基づく自動しきい値選定
法」(電子情報通信学会論文誌D Vol.J63 No.4 pp.3
49〜359) として発表された判別分析法がある。これ
は、しきい値選定の問題を一般的基本的枠組で捉え、分
離されるクラスの濃度レベルでの分離度を最大とする判
別基準の観点から、濃度ヒストグラムの0次と1次の累
積モーメントのみを用いるようにしたものであり、濃淡
画像の最小2乗近似の意味でも最適な手法として、多値
化の場合にも容易に拡張できるというものである。
【0004】第2に、論文「平均隣接数に着目したしき
い値決定法」(電子情報通信学会論文誌D−II Vol.J
73 No.3 pp.360〜366) として発表された平均隣接数に
よる方法がある。これは、濃淡画像(多値画像)につい
てしきい値を変えながら2値化した時の連結成分のまと
まりの良さを表す尺度として「平均隣接数」を定義し、
この尺度が極大となる値を適切なしきい値として決定す
るようにしたものである。この際、変化させるしきい値
の数に比例して演算量が増えないようにするため、ラン
クフィルタとヒストグラム処理の組合せにより、変化さ
せるしきい値の数に依存しない演算量で、平均隣接数を
高速に算出し得るような工夫もなされている。
【0005】第3に、論文「雑音の多い濃淡画像の新し
い2値化しきい値算出法(局所ヒストグラム差分法)の
提案」ないしは「雑音の多い濃淡画像のしきい値算出法
(局所ヒストグラム差分法)の特性」(1990年電子情報
通信学会秋季全国大会 D-365,366)として発表された
局所ヒストグラム差分法がある。これは、濃度の高い領
域と濃度の低い領域の単位面積当りのヒストグラム、即
ち、規格化ヒストグラムの差分を利用するものであり、
しきい値の計算に雑音の大きさやパターン率が関与せ
ず、真のしきい値を算出し得るというものである。
【0006】さらに、多値画像の2値化にニューラルネ
ットワークを用いた例として、論文「画像の最適2値化
を行う緩和型神経回路モデルとその並列コンピュータに
よる実現」(電子情報通信学会論文誌D−II Vol.J74
No.6 pp.678〜687) として発表された神経回路モデル
を用いた方法がある。これは、画像上の全ての局所近傍
系における画素の濃淡値と2値化画素間の誤差によって
定義されたエネルギー関数を最小化して、最適な2値化
を行うようにしたものである。
【0007】
【発明が解決しようとする課題】ところが、これらの方
法の場合、下記のような欠点がある。例えば、判別分析
法や局所ヒストグラム法では、文字認識装置の前処理と
しては2値化しきい値決定の精度が充分でなく、原稿に
よっては品質の悪い2値画像しか得られないことがあ
る。また、平均隣接数による方法では、各2値化しきい
値を用いて得られた2値化画像全てについて処理を行う
(適応しきい値法)ので、処理時間が長くかかってしま
う。さらに、神経回路モデルを用いた方法では、注目点
の近傍の数画素の値を入力としているため、1ドットの
ノイズなどが発生しやすく、文字認識装置の前処理とし
てはあまり適当ではない。
【0008】このように何れの手法によっても、文字認
識装置の前処理としては、未だ、不充分である。特に、
判別分析法や局所ヒストグラム法では、濃度ヒストグラ
ムから得られる情報の内、一部の情報しか利用していな
いため、2値化しきい値決定の精度が充分でないと考え
られる。
【0009】
【課題を解決するための手段】請求項1記載の発明で
は、学習機能を持たせたニューラルネットワークを用い
て、文字認識装置に対する入力画像として多値画像を2
値画像にするためのしきい値を決定する2値化しきい値
決定装置において、前記多値画像の各画素値から濃度ヒ
ストグラムを作成する手段を設け、前記ニューラルネッ
トワークに、各濃度における濃度ヒストグラムの頻度値
を入力とする入力層と、入力された前記多値画像に対す
る最適2値化しきい値を出力する出力層とを設けた。
【0010】加えて、請求項2記載の発明では、ニュー
ラルネットワークに、多値画像から作成された濃度ヒス
トグラムを入力層に与えて出力層から出力される値より
算出した2値化しきい値を用いて2値化した時の文字認
識装置の誤認識率をエラーとしてニューラルネットワー
クの学習を行わせる学習制御手段を設けた。
【0011】また、請求項3記載の発明では、多値画像
の各画素の濃度の平均値及び分散値を求める算出手段を
設け、ニューラルネットワークに、求められた濃度の平
均値及び分散値を入力とする入力層と、入力された多値
画像に対する最適2値化しきい値を出力する出力層とを
設けた。
【0012】加えて、請求項4記載の発明では、ニュー
ラルネットワークに、多値画像から求められた濃度の平
均値及び分散値を入力層に与えて出力層から出力される
値より算出した2値化しきい値を用いて2値化した時の
文字認識装置の誤認識率をエラーとしてニューラルネッ
トワークの学習を行わせる学習制御手段を設けた。
【0013】請求項5記載の発明では、多値画像の各画
素値から濃度ヒストグラムを作成する手段と、前記多値
画像の各画素の濃度の平均値及び分散値を求める算出手
段を設け、ニューラルネットワークに、これらの濃度ヒ
ストグラム、濃度の平均値及び分散値を入力とする入力
層と、入力された多値画像に対する最適2値化しきい値
を出力する出力層とを設けた。
【0014】加えて、請求項6記載の発明では、ニュー
ラルネットワークに、多値画像から作成された濃度ヒス
トグラム、求められた濃度の平均値及び分散値を入力層
に与えて出力層から出力される値より算出した2値化し
きい値を用いて2値化した時の文字認識装置の誤認識率
をエラーとしてニューラルネットワークの学習を行わせ
る学習制御手段を設けた。
【0015】さらに、請求項7記載の発明では、多値画
像の各画素の濃度と各画素の傾きに関する2次元のヒス
トグラムを作成する手段を設け、ニューラルネットワー
クに、作成された2次元のヒストグラムの各座標上での
頻度値を入力とする入力層と、入力された多値画像に対
する最適2値化しきい値を出力する出力層とを設けた。
【0016】加えて、請求項8記載の発明では、ニュー
ラルネットワークに、多値画像から作成された2次元の
ヒストグラムの各座標上での頻度値を入力層に与えて出
力層から出力される値より算出した2値化しきい値を用
いて2値化した時の文字認識装置の誤認識率をエラーと
してニューラルネットワークの学習を行わせる学習制御
手段を設けた。
【0017】請求項9記載の発明では、請求項1,2,
5又は6記載の発明に関し、濃度ヒストグラムを多値画
像の平均値及び分散値により正規化するようにした。
【0018】
【作用】請求項1,2記載の発明においては、濃度ヒス
トグラム全体をニューラルネットワークに入力させて2
値化しきい値を決定するので、濃度ヒストグラムからよ
り多くの情報を得るものとなり、精度の高い2値化しき
い値の決定が可能となる。また、請求項3,4記載の発
明においては、多値画像の各画素の濃度の平均値及び分
散値をニューラルネットワークに入力させて2値化しき
い値を決定するので、より多くの情報を得るものとな
り、精度の高い2値化しきい値の決定が可能となる。請
求項5,6記載の発明においては、これらの濃度ヒスト
グラム全体とともに多値画像の各画素の濃度の平均値及
び分散値をもニューラルネットワークに入力させて2値
化しきい値を決定するので、より精度の高い2値化しき
い値の決定が可能となる。請求項7,8記載の発明にお
いても、濃度ヒストグラムに各画素の傾き情報も加味し
た2次元のヒストグラムをニューラルネットワークに入
力させて2値化しきい値を決定するので、より精度の高
い2値化しきい値の決定が可能となる。請求項9記載の
発明においては、これらの発明で扱う濃度ヒストグラム
に関して、多値画像の平均値及び分散値により正規化す
るようにしたので、スキャナなどの違いによる濃度ヒス
トグラムのバラツキの少ないものとなる。
【0019】
【実施例】本発明の第一の実施例を図1ないし図3に基
づいて説明する。本実施例の処理装置は、画像読取装置
(スキャナ)1で読取られた多値画像情報を、2値化情
報に変換して文字認識装置2に与えるためのものであ
り、この2値化処理を行う2値化処理部3に対して2値
化のためのしきい値を出力する2値化しきい値決定装置
4として構成されている。まず、画像読取装置1は原稿
画像を例えば各画素を256階調なる多値画像情報とし
て読取るものである。読取られた多値画像情報は多値画
像メモリ5に保存される。2値化処理部3は2値化しき
い値決定装置4で決定された2値化しきい値を用いて多
値画像メモリ5上の多値画像を2値化するものである。
より具体的には、2値化しきい値より大きな画素値を持
つ画素を“1”、それ以外の画素を“0”とする2値画
像情報とし、文字認識装置2に出力する。文字認識装置
2では入力される2値画像情報に対して、行切出し、文
字切出し、マッチング、言語処理などを行い、2値画像
上の文字画像を文字コードに変換する処理を行うもので
ある。文字認識装置2による処理結果は、結果出力部6
を通して出力される。具体的には、ユーザが認識結果の
修正処理を行えるように、ディスプレイ7上に認識結果
を表示させたり、認識結果をファイル8に保存する。
【0020】しかして、本実施例の2値化しきい値決定
装置4は、濃度ヒストグラム作成部(作成手段)9と学
習機能を持つニューラルネットワーク10とにより構成
されている。濃度ヒストグラム作成部9は多値画像の各
画素値から濃度ヒストグラムを作成するものである。ニ
ューラルネットワーク10は作成された濃度ヒストグラ
ムに基づき2値化しきい値を求めるものである。
【0021】このニューラルネットワーク10の詳細を
図2を参照して説明する。このニューラルネットワーク
10は例えば入力層11、中間層12及び出力層13よ
りなる3層構造のもので、例えば各濃度値に対応して2
56個のニューロンユニット(○で示す)からなる入力
層11には濃度ヒストグラムの各濃度値における頻度値
が入力されるように設定されている。入力層11の各ニ
ューロンユニットと中間層12の5個のニューロンユニ
ットとは各々結合係数を持って結合されている。出力層
13は1個のニューロンユニットよりなり、所定の演算
結果として、最適2値化しきい値Thを出力するもので
ある。ここに、中間層12の各ニューロンユニットと出
力層13のニューロンユニットとは、同図中右側に示す
ようtanh(X)なる結合関数で結合されており、出力層
13からは−1〜1間の値が出力されるように設定され
ている。ここに、出力層13のアウトプットをout とす
ると、2値化しきい値Thは、 Th=128(out +1) ………(1) として求められる。
【0022】このような構成において、まず、ニューラ
ルネットワーク10の学習処理を行う必要がある。学習
データとしては、多値画像情報とこの多値画像情報を各
2値化しきい値で2値化した場合に文字認識装置2から
得られる誤認識率が用いられる。一般に、文字認識装置
2においては文字画像のかすれ、潰れの何れかを生じた
場合にも認識性能は劣化するので、2値化しきい値と文
字認識装置2で得られる誤認識率とは、図3に示すよう
な関係となる。
【0023】学習の際には、入力層11に濃度ヒストグ
ラムを入力させ、対応する多値画像から得られた図3に
示すような関数をエラー関数として(1)式を用いて出
力層13のアウトプットout からエラーを算出し、バッ
クプロパゲーション法によって、図2に示すような構成
のニューラルネットワーク10の学習を行う。このよう
な制御は、学習制御手段(図示せず)により行われる。
【0024】学習後のニューラルネットワーク10を用
いる場合、2値化処理すべき多値画像から得られた濃度
ヒストグラムを入力層11に入力させ、出力層13より
出力される値より、(1)式に従い2値化しきい値を決
定し、決定された2値化しきい値を用いて2値化処理部
3で2値化し、文字認識装置2に入力させることにな
る。
【0025】このように、本実施例によれば、ニューラ
ルネットワーク10において濃度ヒストグラム全体を入
力とさせて2値化しきい値を決定するようにしているの
で、濃度ヒストグラムから多くの情報を得ていることに
なり、精度の高い2値化しきい値の決定となり、そのた
めの処理速度も充分な速さで実現し得る。
【0026】つづいて、本発明の第二の実施例を図4に
より説明する。前記実施例で示した部分と同一部分は同
一符号を用いて示す(以下の実施例でも同様とする)。
本実施例は、2値化しきい値決定の精度をより向上させ
るようにしたものであり、前記実施例に加えて、多値画
像の各画素の濃度の平均値及び分散値情報も加味するよ
うに構成されている。このような平均値及び分散値は、
図1を参照すれば、濃度ヒストグラム作成部9部分にお
いて算出される。
【0027】本実施例のニューラルネットワーク10
は、濃度ヒストグラムとともに、これらの各画素の濃度
の平均値及び分散値情報も入力とするものであり、入力
層11はニューロンユニットが2個付加されて、合計2
58個のニューロンユニットにより構成されている。な
お、より具体的には、多値画像から得られる濃度ヒスト
グラムの平均値、分散値を求め、多値画像から得られた
濃度ヒストグラムの分布を正規分布と仮定し、平均値が
0、分散値が1の標準正規分布となるように変換を行う
ことにより、正規化された濃度ヒストグラムを入力させ
るようにしている。このような濃度ヒストグラムの正規
化処理により、画像読取装置1の違いなどによる濃度ヒ
ストグラムのバラツキをなくすことができる。
【0028】ここに、多値画像の各画素の濃度の平均値
及び分散値が2値化しきい値決定の精度に及ぼす影響が
大きいため、本実施例のニューラルネットワーク10で
は、濃度ヒストグラムとは別の階層のネットワークを形
成する構成とされている。即ち、出力層13にはバイア
ス値可変のバイアスyのみを加算する加算ユニット14
が結合され、この加算ユニット14の出力と分散値とを
乗算する乗算ユニット15が設けられ、平均値と可変結
合係数Xにより重み付けされたこの乗算ユニット15の
出力とを加算して2値化しきい値Thを出力する加算ユ
ニット16が設けられている。出力層13と加算ユニッ
ト14との間、加算ユニット14と乗算ユニット15と
の間、入力層11中の分散値用ユニットと乗算ユニット
15との間、入力層11中の平均値用ユニットと加算ユ
ニット16との間の結合重みは常に1とされている。
【0029】このような構成において、学習の際には、
入力層11に濃度ヒストグラム、濃度の平均値及び分散
値を入力し、対応する多値画像から得られた図3に示す
関数をエラー関数として、出力層13から出力される2
値化しきい値からエラーを算出し、バックプロパゲーシ
ョン法によって図4に示すような構成のニューラルネッ
トワーク10の学習を行う。
【0030】学習後のニューラルネットワーク10を用
いる場合、2値化処理すべき多値画像から得られた濃度
ヒストグラム、濃度の平均値及び分散値を入力層11に
入力させ、出力層13より出力される値より2値化しき
い値を決定し、決定された2値化しきい値を用いて2値
化処理部3で2値化し、文字認識装置2に入力させるこ
とになる。
【0031】さらに、本発明の第三の実施例を図5によ
り説明する。本実施例では、図1中に示した濃度ヒスト
グラム作成部9部分にて、多値画像の各画素の濃度と各
画素の傾きに関する図5に示すような2次元のヒストグ
ラムを作成するようにしたものである。また、本実施例
で用いるニューラルネットワーク10の構成は、基本的
には、図2に示したものに準ずるものであるが、このよ
うな2次元のヒストグラムの入力(各座標での頻度値)
を受ける入力層11は256×256=65536個の
ニューロンユニットにより構成されている。
【0032】即ち、本実施例では、2値化しきい値決定
の精度をより向上させるため、濃度ヒストグラムに加え
て、各画素の傾き情報を入力として用いるようにしたも
のであり、各画素について濃度値と傾きとを求め、2次
元のヒストグラムの対応する座標の頻度値をインクリメ
ントすることで、図5に示すような2次元のヒストグラ
ムを作成するようにしたものである。例えば、図5中の
座標aは、傾き130、濃度130の画素数が20個
(頻度値=20)であることを示す。各画素の傾きgは
画素の座標が(x,y)(画素の値f(x,y))の時
に上下左右の4画素の値(f(x,y−1)、f(x,
y+1)、f(x−1,y)、f(x+1,y))か
ら、 g=〔4f(x,y)−{f(x-1,y)+f(x+1,y)+f(x,y-1)+f(x,
y+1)}〕/8+128…………………………(2) なる式を用いて算出される。
【0033】このような構成において、学習の際には、
入力層11に2次元のヒストグラムを入力し、対応する
多値画像から得られた図3に示す関数をエラー関数とし
て、出力層13から出力される2値化しきい値からエラ
ーを算出し、バックプロパゲーション法によってニュー
ラルネットワーク10の学習を行う。
【0034】学習後のニューラルネットワーク10を用
いる場合、2次元のヒストグラムを入力層11に入力さ
せ、出力層13より出力される値より2値化しきい値を
決定し、決定された2値化しきい値を用いて2値化処理
部3で2値化し、文字認識装置2に入力させることにな
る。
【0035】
【発明の効果】請求項1,2記載の発明によれば、濃度
ヒストグラム全体をニューラルネットワークに入力させ
て2値化しきい値を決定するようにしたので、濃度ヒス
トグラムからより多くの情報が得られるものとなり、精
度の高い2値化しきい値の決定が可能となり、同様に、
請求項3,4記載の発明によれば、多値画像の各画素の
濃度の平均値及び分散値をニューラルネットワークに入
力させて2値化しきい値を決定するようにしたので、よ
り多くの情報が得られるものとなり、精度の高い2値化
しきい値の決定が可能となる。更に、請求項5,6記載
の発明によれば、これらの濃度ヒストグラム全体ととも
に多値画像の各画素の濃度の平均値及び分散値をもニュ
ーラルネットワークに入力させて2値化しきい値を決定
するようにしたので、より精度の高い2値化しきい値の
決定が可能となり、同様に、請求項7,8記載の発明に
よれば、濃度ヒストグラムに各画素の傾き情報も加味し
た2次元のヒストグラムをニューラルネットワークに入
力させて2値化しきい値を決定するようにしたので、よ
り精度の高い2値化しきい値の決定が可能となる。請求
項9記載の発明によれば、これらの発明で扱う濃度ヒス
トグラムに関して、多値画像の平均値及び分散値により
正規化するようにしたので、スキャナなどの違いによる
濃度ヒストグラムのバラツキの少ないものとなる。
【図面の簡単な説明】
【図1】本発明の第一の実施例を示すブロック図であ
る。
【図2】そのニューラルネットワーク構成を示す模式図
である。
【図3】2値化しきい値−誤認識率特性図である。
【図4】本発明の第二の実施例を示すニューラルネット
ワーク構成の模式図である。
【図5】本発明の第三の実施例を示す2次元のヒストグ
ラムの説明図である。
【符号の説明】
2 文字認識装置 9 作成手段ないしは算出手段 10 ニューラルネットワーク 11 入力層 13 出力層
フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 H04N 1/40 103 A 9068−5C

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 学習機能を持たせたニューラルネットワ
    ークを用いて、文字認識装置に対する入力画像として多
    値画像を2値画像にするためのしきい値を決定する2値
    化しきい値決定装置において、前記多値画像の各画素値
    から濃度ヒストグラムを作成する手段を設け、前記ニュ
    ーラルネットワークに、各濃度における濃度ヒストグラ
    ムの頻度値を入力とする入力層と、入力された前記多値
    画像に対する最適2値化しきい値を出力する出力層とを
    設けたことを特徴とする2値化しきい値決定装置。
  2. 【請求項2】 学習機能を持たせたニューラルネットワ
    ークを用いて、文字認識装置に対する入力画像として多
    値画像を2値画像にするためのしきい値を決定する2値
    化しきい値決定装置において、前記多値画像の各画素値
    から濃度ヒストグラムを作成する手段を設け、前記ニュ
    ーラルネットワークに、各濃度における濃度ヒストグラ
    ムの頻度値を入力とする入力層と、入力された前記多値
    画像に対する最適2値化しきい値を出力する出力層と、
    前記多値画像から作成された濃度ヒストグラムを前記入
    力層に与えて前記出力層から出力される値より算出した
    2値化しきい値を用いて2値化した時の前記文字認識装
    置の誤認識率をエラーとして前記ニューラルネットワー
    クの学習を行わせる学習制御手段とを設けたことを特徴
    とする2値化しきい値決定装置。
  3. 【請求項3】 学習機能を持たせたニューラルネットワ
    ークを用いて、文字認識装置に対する入力画像として多
    値画像を2値画像にするためのしきい値を決定する2値
    化しきい値決定装置において、前記多値画像の各画素の
    濃度の平均値及び分散値を求める算出手段を設け、前記
    ニューラルネットワークに、求められた濃度の平均値及
    び分散値を入力とする入力層と、入力された多値画像に
    対する最適2値化しきい値を出力する出力層とを設けた
    ことを特徴とする2値化しきい値決定装置。
  4. 【請求項4】 学習機能を持たせたニューラルネットワ
    ークを用いて、文字認識装置に対する入力画像として多
    値画像を2値画像にするためのしきい値を決定する2値
    化しきい値決定装置において、前記多値画像の各画素の
    濃度の平均値及び分散値を求める算出手段を設け、前記
    ニューラルネットワークに、求められた濃度の平均値及
    び分散値を入力とする入力層と、入力された多値画像に
    対する最適2値化しきい値を出力する出力層と、前記多
    値画像から求められた濃度の平均値及び分散値を前記入
    力層に与えて前記出力層から出力される値より算出した
    2値化しきい値を用いて2値化した時の前記文字認識装
    置の誤認識率をエラーとして前記ニューラルネットワー
    クの学習を行わせる学習制御手段とを設けたことを特徴
    とする2値化しきい値決定装置。
  5. 【請求項5】 学習機能を持たせたニューラルネットワ
    ークを用いて、文字認識装置に対する入力画像として多
    値画像を2値画像にするためのしきい値を決定する2値
    化しきい値決定装置において、前記多値画像の各画素値
    から濃度ヒストグラムを作成する手段と、前記多値画像
    の各画素の濃度の平均値及び分散値を求める算出手段と
    を設け、前記ニューラルネットワークに、これらの濃度
    ヒストグラム、濃度の平均値及び分散値を入力とする入
    力層と、入力された多値画像に対する最適2値化しきい
    値を出力する出力層とを設けたことを特徴とする2値化
    しきい値決定装置。
  6. 【請求項6】 学習機能を持たせたニューラルネットワ
    ークを用いて、文字認識装置に対する入力画像として多
    値画像を2値画像にするためのしきい値を決定する2値
    化しきい値決定装置において、前記多値画像の各画素値
    から濃度ヒストグラムを作成する手段と、前記多値画像
    の各画素の濃度の平均値及び分散値を求める算出手段と
    を設け、前記ニューラルネットワークに、これらの濃度
    ヒストグラム、濃度の平均値及び分散値を入力とする入
    力層と、入力された多値画像に対する最適2値化しきい
    値を出力する出力層と、前記多値画像から作成された濃
    度ヒストグラム、求められた濃度の平均値及び分散値を
    前記入力層に与えて前記出力層から出力される値より算
    出した2値化しきい値を用いて2値化した時の前記文字
    認識装置の誤認識率をエラーとして前記ニューラルネッ
    トワークの学習を行わせる学習制御手段とを設けたを設
    けたことを特徴とする2値化しきい値決定装置。
  7. 【請求項7】 学習機能を持たせたニューラルネットワ
    ークを用いて、文字認識装置に対する入力画像として多
    値画像を2値画像にするためのしきい値を決定する2値
    化しきい値決定装置において、前記多値画像の各画素の
    濃度と各画素の傾きに関する2次元のヒストグラムを作
    成する手段を設け、前記ニューラルネットワークに、作
    成された2次元のヒストグラムの各座標上での頻度値を
    入力とする入力層と、入力された多値画像に対する最適
    2値化しきい値を出力する出力層とを設けたことを特徴
    とする2値化しきい値決定装置。
  8. 【請求項8】 学習機能を持たせたニューラルネットワ
    ークを用いて、文字認識装置に対する入力画像として多
    値画像を2値画像にするためのしきい値を決定する2値
    化しきい値決定装置において、前記多値画像の各画素の
    濃度と各画素の傾きに関する2次元のヒストグラムを作
    成する手段を設け、前記ニューラルネットワークに、作
    成された2次元のヒストグラムの各座標上での頻度値を
    入力とする入力層と、入力された多値画像に対する最適
    2値化しきい値を出力する出力層と、前記多値画像から
    作成された2次元のヒストグラムの各座標上での頻度値
    を前記入力層に与えて前記出力層から出力される値より
    算出した2値化しきい値を用いて2値化した時の前記文
    字認識装置の誤認識率をエラーとして前記ニューラルネ
    ットワークの学習を行わせる学習制御手段とを設けたこ
    とを特徴とする2値化しきい値決定装置。
  9. 【請求項9】 濃度ヒストグラムを多値画像の平均値及
    び分散値により正規化するようにしたことを特徴とする
    請求項1,2,5又は6記載の2値化しきい値決定装
    置。
JP34237192A 1992-12-22 1992-12-22 2値化しきい値決定装置 Expired - Fee Related JP3248965B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34237192A JP3248965B2 (ja) 1992-12-22 1992-12-22 2値化しきい値決定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34237192A JP3248965B2 (ja) 1992-12-22 1992-12-22 2値化しきい値決定装置

Publications (2)

Publication Number Publication Date
JPH06195511A true JPH06195511A (ja) 1994-07-15
JP3248965B2 JP3248965B2 (ja) 2002-01-21

Family

ID=18353216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34237192A Expired - Fee Related JP3248965B2 (ja) 1992-12-22 1992-12-22 2値化しきい値決定装置

Country Status (1)

Country Link
JP (1) JP3248965B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765161A (ja) * 1993-08-30 1995-03-10 Nec Corp 画像処理装置
US7103221B2 (en) 1995-04-06 2006-09-05 Canon Kabushiki Kaisha Image processing apparatus and method
JP2008109203A (ja) * 2006-10-23 2008-05-08 Noritsu Koki Co Ltd 撮影画像補正用変換テーブル作成方法とこの方法を実施する写真プリント装置
JP2010164446A (ja) * 2009-01-16 2010-07-29 Angle Try Kk 検査対象品の外観検査方法及びプログラム
WO2021009804A1 (ja) * 2019-07-12 2021-01-21 Eizo株式会社 閾値の学習方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765161A (ja) * 1993-08-30 1995-03-10 Nec Corp 画像処理装置
US7103221B2 (en) 1995-04-06 2006-09-05 Canon Kabushiki Kaisha Image processing apparatus and method
US7424152B2 (en) 1995-04-06 2008-09-09 Canon Kabushiki Kaisha Image processing apparatus and method based on feature of a color image
JP2008109203A (ja) * 2006-10-23 2008-05-08 Noritsu Koki Co Ltd 撮影画像補正用変換テーブル作成方法とこの方法を実施する写真プリント装置
JP2010164446A (ja) * 2009-01-16 2010-07-29 Angle Try Kk 検査対象品の外観検査方法及びプログラム
WO2021009804A1 (ja) * 2019-07-12 2021-01-21 Eizo株式会社 閾値の学習方法
JPWO2021009804A1 (ja) * 2019-07-12 2021-01-21

Also Published As

Publication number Publication date
JP3248965B2 (ja) 2002-01-21

Similar Documents

Publication Publication Date Title
EP0622750B1 (en) Pattern recognition
Cheriet et al. A recursive thresholding technique for image segmentation
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
EP1091320A2 (en) Processing multiple digital images
US5668898A (en) Device for detecting the inclination of image
US5884296A (en) Network and image area attribute discriminating device and method for use with said neural network
EP0965943A2 (en) Optical character reading method and system for a document with ruled lines and their application
EP1081648B1 (en) Method for processing a digital image
JP2004086891A (ja) デジタル画像におけるオブジェクト検出方法
CN111652213A (zh) 一种基于深度学习的船舶水尺读数识别方法
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
Zhang et al. Recovery of distorted document images from bound volumes
JPH06195511A (ja) 2値化しきい値決定装置
CN112686143A (zh) 客观题填涂的识别方法、电子设备和存储介质
US6694059B1 (en) Robustness enhancement and evaluation of image information extraction
JPH10307889A (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
JPH04227581A (ja) 画像の2値化閾値算出装置
JP2988097B2 (ja) 濃淡画像の領域分割方法
JP2003123023A (ja) 文字認識方法及び文字認識装置、文字認識プログラム並びにそのプログラムを記録した記録媒体
JP2812619B2 (ja) 画像処理装置
Singh et al. level shape description by skeletonization in faded documents
JPH1070652A (ja) 画像領域属性判別装置
JP2001291056A (ja) 文書画像認識装置及び記録媒体
CN112183272A (zh) 一种基于svm分类器的拍照找料方法、系统及存储介质
JP3578247B2 (ja) 文字認識方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071109

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081109

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081109

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091109

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees