JPH07249101A - ニューロ利用の文字認識装置及び輝度正規化方法 - Google Patents

ニューロ利用の文字認識装置及び輝度正規化方法

Info

Publication number
JPH07249101A
JPH07249101A JP6037086A JP3708694A JPH07249101A JP H07249101 A JPH07249101 A JP H07249101A JP 6037086 A JP6037086 A JP 6037086A JP 3708694 A JP3708694 A JP 3708694A JP H07249101 A JPH07249101 A JP H07249101A
Authority
JP
Japan
Prior art keywords
brightness
value
luminance
histogram
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6037086A
Other languages
English (en)
Inventor
Shigeru Owada
茂 大和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Original Assignee
Hitachi Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP6037086A priority Critical patent/JPH07249101A/ja
Publication of JPH07249101A publication Critical patent/JPH07249101A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 ニューロネットワークを利用した文字認識装
置において、ニューロネットワークの入力層のサイズの
大きさに一致するように画像サイズの正規化を行う。こ
のサイズ正規化と共に画像の輝度の正規化を行う際に、
背景と文字との輝度との差別化をはかり文字の認識精度
を高めたい。 【構成】 サイズ正規化後の画像に対して、輝度ヒスト
グラムを求め、ヒストグラム中の上下限の雑音と思われ
る輝度を削除し、その削除後の上下限の輝度を最大輝度
値、最小輝度値とし、更にこの2つの輝度値内の最適し
きい値を求め、このしきい値を中心値として、上記最大
輝度値と最小輝度値との間の輝度の正規化をはかる。こ
の正規化された輝度の画像をニューロネットワークの入
力層に入力して文字認識を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ニューロネットワーク
を使用して文字(図形や記号等を含む)認識装置及びそ
れに好適な輝度正規化方法に関する。
【0002】
【従来の技術】ニューロネットワークは文字認識装置と
して使用できる。この場合、文字認識装置としては、入
力層と中間層と出力層とより成る構成とする例が多い。
ここで、入力層の数は多ければ多いほどよいが、余りに
大きいと学習時間が大となり、その収束も容易でない。
一方、文字画像のサイズ(縦×横の画素数)は数100
〜数1000にも達するが、入力層は数10〜百数10
の値であり文字サイズの方がはるかに大きい。そこで、
文字サイズを入力層のサイズに合うようにサイズ正規化
を行うことが必要になる。
【0003】サイズ正規化は、サイズ正規化単位の領域
を与えておき、この領域内の輝度平均値をこの領域の代
表値とするものである。従って、正規化後の画像の大き
さはその総領域数分であり、各代表値が画素輝度とな
る。
【0004】前記サイズ正規化画像中の各画素の輝度値
は、その切り出し文字画像の明るさに依存しており、全
体的に暗い画像はそのまま暗いままでサイズ正規化され
る。このままニューラルネットワークに入力したので
は、背景部と文字部の輝度差が少なく読み取りずらいと
いえる。そこで、新たに必要となる処理が輝度正規化処
理である。輝度正規化処理は、サイズ正規化画像の各輝
度値の上下限値をある固定の値にそろえる処理である。
【0005】図2に従来の輝度正規化処理例を示す。サ
イズ正規化後の画像の輝度別の頻度ヒストグラムを先ず
求める。図2で横軸が輝度別(最大255、最小0)の
区分を示し、縦横が各輝度別の頻度を示す。このヒスト
グラムで、頻度が1以上の値を持つ輝度の中から最大輝
度と最小輝度を選択する。そして、この最大輝度を輝度
255に割り当て、最小輝度を輝度0に割り当てる。最
大輝度と最小輝度との中間輝度は、0〜255の中間の
値にその大小に応じて割り当てる。かくして、0〜25
5で正規化された輝度値が得られたことになる。
【0006】
【発明が解決しようとする課題】従来例の輝度正規化処
理では、局所的に明るい所や暗い所(特に、刻印文字の
場合に、照明の具合いにより発生しやすい)が存在する
場合に、その値に引きずられて、結局背景部と文字部の
輝度差が少なくなる場合が考えられる。この結果、文字
そのものの認識度が低下するとの問題がある。
【0007】本発明の目的は、輝度の差の少ない画像の
輝度値の上下限を可変化して画像認識度を高めるように
するニューロネットワーク使用の文字認識装置及び輝度
正規化法を提供するものである。
【0008】
【課題を解決するための手段】本発明は、文字画像の輝
度ヒストグラムを求め、この輝度ヒストグラムから低す
ぎる輝度及び高すぎる輝度を除去し、この除去後の最大
輝度値と最小輝度値ではさまれた輝度ヒストグラムにつ
いて最適自動しきい値処理を行い、この処理で得たしき
い値を中心値として上記最大輝度値と最小輝度値ではさ
まれた輝度ヒストグラム中の輝度値を正規化して成る輝
度正規化方法を開示する。
【0009】更に本発明は、文字画像の輝度ヒストグラ
ムを求め、この輝度ヒストグラムについて最適自動しき
い値処理を行い、この処理で得たしきい値を中心値とし
て輝度ヒストグラム中の輝度値を正規化して成る輝度正
規化方法を開示する。
【0010】更に本発明は、ニューロネットワークより
成るニューロ利用の文字認識装置において、その入力層
のサイズに一致するように入力文字サイズの正規化処理
を行い、次いでこのサイズ正規化後の画像に対して輝度
正規化処理を行わせると共に、この輝度正規化処理で
は、サイズ正規化後の画像から輝度ヒストグラムを求
め、この輝度ヒストグラムから低すぎる輝度及び高すぎ
る輝度を除去し、この除去後の最大輝度値と最小輝度値
ではさまれた輝度ヒストグラムについて最適自動しきい
値処理を行い、この処理で得たしきい値を中心値として
上記最大輝度値と最小輝度値ではさまれた輝度ヒストグ
ラム中の輝度値を正規化し、この正規化後の画像をニュ
ーロネットワークの入力層への入力画像として与えるよ
うにしたニューロ利用の文字認識装置を開示する。
【0011】更に本発明は、ニューロネットワークより
成るニューロ利用の文字認識装置において、その入力層
のサイズに一致するように入力文字サイズの正規化処理
を行い、次いでこのサイズ正規化後の画像に対して輝度
正規化処理を行わせると共に、この輝度正規化処理で
は、サイズ正規化後の画像から輝度ヒストグラムを求
め、この輝度ヒストグラムについて最適自動しきい値処
理を行い、この処理で得たしきい値を中心値として輝度
ヒストグラム中の輝度値を正規化し、この正規化後の画
像をニューロネットワークの入力層への入力画像として
与えるようにしたニューロ利用の文字認識装置を開示す
る。
【0012】更に上記ニューロネットワークは、入力層
と中間層と出力層とより成る結合形ニューロネットワー
クとする。
【0013】
【作用】本発明によれば、輝度正規化に際し、上下の頻
度の低い輝度値を除去し、その後で最適自動しきい値処
理でしきい値を求め、このしきい値を中心値として正規
化処理を行うようにした。これにより、背景部と文字と
の差別化を一層はかることができる。
【0014】更に本発明によれば、ニューロネットワー
クの入力層のサイズに合うようなサイズ正規化処理を行
った際の、輝度正規化処理に適用する。これにより、ニ
ューロネットワークでの文字認識に際し、背景と文字と
の差別化が一層はかれ、文字認識精度の向上につなが
る。
【0015】
【実施例】図1は、本発明の輝度正規化処理を説明する
図である。この図は、図2と同様、輝度別−頻度のヒス
トグラムである。本実施例の輝度正規化処理の手順は以
下の通りである。 (1)、サイズ正規化画像の輝度ヒストグラムを算出す
る(図1。この処理は従来例と同じ)。 (2)、輝度ヒストグラムに対して以下の処理を行う。 (イ)、輝度ヒストグラム上の最大輝度(max)から
より小さい輝度値に向けて順次スキャンする。同時に、
輝度ヒストグラム上の最小輝度(min)からより大き
い輝度値に向けて順次スキャンする。 (ロ)、上記スキャンの過程で、以下の3つの条件を満
足する間、その輝度ヒストグラムを強制的に0にする。 ・ヒストグラムが1である。 ・ヒストグラムが2であり、その隣りのヒストグラムは
1である。 ・削除したヒストグラムは、全体の15%以下である。 (3)、最適自動しきい値処理を行う。 この(1)、(2)の手順のもとでの削除例を図1では
「削除」として併せて示している。(1)、(2)は輝
度値の中で、雑音と思われる画素を削除するために設け
たものである。かくして削除後の新しい輝度スクペクト
ルが得られ、この上限にある最大輝度値を新最大値とし
て与え、下限にある最小輝度値を新最小値として与え
る。この新最小値と新最大値は前記3つの条件に従って
得られるものであり、従来例の如き固定値ではなく、文
字毎に変わる変動値である。
【0016】次に、(3)の最適自動しきい値処理を実
行する。この処理対象は、前記(2)で得られた、新最
大値と新最小値とではさまれた輝度ヒストグラムであ
る。最適自動しきい値処理には種々あるが、ここでは、
新最大値と新最小値とではさまれた輝度ヒストグラムに
ついて頻度の総和値を求め、それの平均値を求め、この
平均値に相当する頻度値を与える輝度値を、しきい値と
して設定する。その他の種々のしきい値算出法であって
もよいことは当然である。
【0017】このしきい値となった輝度値を中心値とし
て、新最大値と新最小値とではさまれた輝度ヒストグラ
ムを、0〜255の間に正規化する。ここで中心値と
は、128の輝度値を指し、図1の例によれば、中心値
よりも低い輝度値側が0〜128の間に圧縮され、中心
値よりも高い輝度値側が128〜255の間に伸長され
た結果となっている。輝度値128よりも低い側が背景
の場合にこのような結果となり、画像自体と背景との差
別化を一層はかることができた。
【0018】以上「輝度正規化処理」のソフトウェア
は、サンプル生成/学習システムでのニューラルネット
ワーク作成時に指定可能とし、その情報をニューラルネ
ットワーク辞書内に格納する。文字認識システムでは、
現状ロードされているニューラルネットワーク辞書内の
輝度正規化処理の情報により、どの輝度正規化処理を実
行するか決定される。
【0019】図3には、本発明の処理手順を示し、サイ
ズ正規化処理と輝度正規化処理とをシーケンシャルに行
う例を示している。図4には、サイズ正規化処理の具体
例を示し、これは従来例と同じ手順である。即ち、正規
化用のサイズを切り出し、そのサイズの平均値を算出
し、この平均値をそのサイズの画素値とする。これの処
理を全サイズ数にわたって行う。かくして、1つのサイ
ズが1画素となるサイズ正規化画像が得られる。
【0020】図5には、輝度正規化処理の具体例を示
す。先ずサイズ正規化後の画像に対して輝度ヒストグラ
ムを算出する。次に前記3条件をもとに、「削除」を行
い、新最大値、新最小値を算出する。この後で、最適自
動しきい値処理を行い、最後に輝度を、このしきい値を
中心値として正規化する。
【0021】図6には、図3、図4、図5の処理を行う
処理システム図を示す。共通バス26に、CPU20、
主メモリ21、TVカメラ22、画像メモリ23、キー
ボード24、マウス25、補助メモリ29、を共通接続
する。更に画像メモリ23にはCRT27を接続する。
このシステムで、図3、図4、図5の処理ソフト補助メ
モリ29から主メモリ21に移して実行する。この際、
TVカメラ22は、刻印文字を撮像し、これを補助メモ
リ29に移しておき、CPU20により図3〜図5の処
理を主メモリ21を利用して行う。また表示に際しては
画像メモリ23に必要な画像を送りCRT27に表示す
る。更に、キーボード24、マウス25により画面をみ
ながらマンマシン対話型により図3〜図5の処理を行う
こともありうる。
【0022】図7は、結合形ニューロネットワークによ
る文字認識装置を示す。入力層40と中間層41と出力
層42とより成り、事前に基準文字から得られる教師デ
ータを用いて学習し、各層間を結ぶ重み付けを行ってお
く。その後で、図3〜図5で処理ずみの正規化画像を入
力して文字認識を行う。尚、中間層は、1つ以上を持つ
ものとする。
【0023】尚、前記3条件の具体例はあくまで1つの
数値例であり、本来は文字や認識精度や刻印状況によっ
て種々変更可能である。また、図6のシステムをニュー
ロネットワークで形成することもありうる。
【0024】
【発明の効果】本発明によれば、背景と文字とが区別し
にくいような例にあっても、両者を区分化でき、文字認
識精度の向上が可能となる。
【図面の簡単な説明】
【図1】本発明の輝度正規化処理を示す図である。
【図2】従来の輝度正規化処理を示す図である。
【図3】本発明の正規化処理手順を示す図である。
【図4】本発明のサイズ正規化処理手順を示す図であ
る。
【図5】本発明の輝度正規化処理を示す図である。
【図6】本発明の輝度正規化処理の実現をはかるシステ
ム図である。
【図7】本発明の文字認識装置を示す図である。
【符号の説明】
20 CPU 21 主メモリ 22 TVカメラ 23 画像メモリ 24 キーボード 25 マウス 26 共通バス 27 CRT 29 補助メモリ 40 入力層 41 中間層 42 出力層

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字画像の輝度ヒストグラムを求め、こ
    の輝度ヒストグラムから低すぎる輝度及び高すぎる輝度
    を除去し、この除去後の最大輝度値と最小輝度値ではさ
    まれた輝度ヒストグラムについて最適自動しきい値処理
    を行い、この処理で得たしきい値を中心値として上記最
    大輝度値と最小輝度値ではさまれた輝度ヒストグラム中
    の輝度値を正規化して成る輝度正規化方法。
  2. 【請求項2】 文字画像の輝度ヒストグラムを求め、こ
    の輝度ヒストグラムについて最適自動しきい値処理を行
    い、この処理で得たしきい値を中心値として輝度ヒスト
    グラム中の輝度値を正規化して成る輝度正規化方法。
  3. 【請求項3】 ニューロネットワークより成るニューロ
    利用の文字認識装置において、その入力層のサイズに一
    致するように入力文字サイズの正規化処理を行い、次い
    でこのサイズ正規化後の画像に対して輝度正規化処理を
    行わせると共に、 この輝度正規化処理では、サイズ正規化後の画像から輝
    度ヒストグラムを求め、この輝度ヒストグラムから低す
    ぎる輝度及び高すぎる輝度を除去し、この除去後の最大
    輝度値と最小輝度値ではさまれた輝度ヒストグラムにつ
    いて最適自動しきい値処理を行い、この処理で得たしき
    い値を中心値として上記最大輝度値と最小輝度値ではさ
    まれた輝度ヒストグラム中の輝度値を正規化し、この正
    規化後の画像をニューロネットワークの入力層への入力
    画像として与えるようにしたニューロ利用の文字認識装
    置。
  4. 【請求項4】 ニューロネットワークより成るニューロ
    利用の文字認識装置において、その入力層のサイズに一
    致するように入力文字サイズの正規化処理を行い、次い
    でこのサイズ正規化後の画像に対して輝度正規化処理を
    行わせると共に、 この輝度正規化処理では、サイズ正規化後の画像から輝
    度ヒストグラムを求め、この輝度ヒストグラムについて
    最適自動しきい値処理を行い、この処理で得たしきい値
    を中心値として輝度ヒストグラム中の輝度値を正規化
    し、この正規化後の画像をニューロネットワークの入力
    層への入力画像として与えるようにしたニューロ利用の
    文字認識装置。
  5. 【請求項5】 上記ニューロネットワークは、入力層と
    中間層と出力層とより成る結合形ニューロネットワーク
    とする請求項3又は4の文字認識装置。
JP6037086A 1994-03-08 1994-03-08 ニューロ利用の文字認識装置及び輝度正規化方法 Pending JPH07249101A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6037086A JPH07249101A (ja) 1994-03-08 1994-03-08 ニューロ利用の文字認識装置及び輝度正規化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6037086A JPH07249101A (ja) 1994-03-08 1994-03-08 ニューロ利用の文字認識装置及び輝度正規化方法

Publications (1)

Publication Number Publication Date
JPH07249101A true JPH07249101A (ja) 1995-09-26

Family

ID=12487753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6037086A Pending JPH07249101A (ja) 1994-03-08 1994-03-08 ニューロ利用の文字認識装置及び輝度正規化方法

Country Status (1)

Country Link
JP (1) JPH07249101A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7151566B2 (en) * 2002-02-01 2006-12-19 Nikon Corporation Electronic camera
JP2009110169A (ja) * 2007-10-29 2009-05-21 C Micro:Kk 薬剤監査装置および画像処理方法
US8108211B2 (en) 2007-03-29 2012-01-31 Sony Corporation Method of and apparatus for analyzing noise in a signal processing system
US8144985B2 (en) * 2007-12-21 2012-03-27 Sony Corporation Method of high dynamic range compression with detail preservation and noise constraints
US8711249B2 (en) 2007-03-29 2014-04-29 Sony Corporation Method of and apparatus for image denoising

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7151566B2 (en) * 2002-02-01 2006-12-19 Nikon Corporation Electronic camera
US8108211B2 (en) 2007-03-29 2012-01-31 Sony Corporation Method of and apparatus for analyzing noise in a signal processing system
US8711249B2 (en) 2007-03-29 2014-04-29 Sony Corporation Method of and apparatus for image denoising
JP2009110169A (ja) * 2007-10-29 2009-05-21 C Micro:Kk 薬剤監査装置および画像処理方法
US8144985B2 (en) * 2007-12-21 2012-03-27 Sony Corporation Method of high dynamic range compression with detail preservation and noise constraints

Similar Documents

Publication Publication Date Title
EP3916627A1 (en) Living body detection method based on facial recognition, and electronic device and storage medium
EP3989104A1 (en) Facial feature extraction model training method and apparatus, facial feature extraction method and apparatus, device, and storage medium
EP3772038A1 (en) Augmented reality display method of simulated lip makeup
EP3617991A1 (en) Learning device, image recognition device, learning method, and program
US5911013A (en) Character recognition method and apparatus capable of handling handwriting
US7715632B2 (en) Apparatus and method for recognizing an image
US20040081346A1 (en) Non-intrusive testing system and method
CN116468640B (zh) 一种用于互联网教学的视频图像增强方法
CN110473176B (zh) 图像处理方法及装置、眼底图像处理方法、电子设备
KR100553850B1 (ko) 얼굴인식/표정인식 시스템 및 방법
CN108665769B (zh) 基于卷积神经网络的网络教学方法以及装置
WO2018151043A1 (ja) 画像処理方法、及びコンピュータプログラム
JPH07249101A (ja) ニューロ利用の文字認識装置及び輝度正規化方法
CN110909568A (zh) 用于面部识别的图像检测方法、装置、电子设备及介质
US7519237B2 (en) Method for characterizing stored information
CN106682676A (zh) 一种图像测试方法及装置
CN109141457A (zh) 导航评估方法、装置、计算机设备和存储介质
JP2893948B2 (ja) ナンバープレート認識装置
JP3578321B2 (ja) 画像正規化装置
CN111438437B (zh) 激光加工控制方法及装置、激光加工设备、可读存储介质
CN111242047A (zh) 图像处理方法和装置、电子设备及计算机可读存储介质
CN112861854A (zh) 指甲语义分割中训练样本的生成方法、装置、设备及介质
JPH0935058A (ja) 画像認識方法
KR20050014072A (ko) 색분포 학습을 통한 얼굴영역 추출 방법
Belem et al. Automated video monitor screen extraction using semantic segmentation and cnn