JPH0554195A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0554195A
JPH0554195A JP3217793A JP21779391A JPH0554195A JP H0554195 A JPH0554195 A JP H0554195A JP 3217793 A JP3217793 A JP 3217793A JP 21779391 A JP21779391 A JP 21779391A JP H0554195 A JPH0554195 A JP H0554195A
Authority
JP
Japan
Prior art keywords
character
learning
data
neural network
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3217793A
Other languages
English (en)
Inventor
Shinya Nakao
真也 中尾
Noriaki Yugawa
典昭 湯川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3217793A priority Critical patent/JPH0554195A/ja
Publication of JPH0554195A publication Critical patent/JPH0554195A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 画像情報をもとに文字の判別を行う文字認識
装置において、読み取り対象である文字の位置ずれ、回
転、照明の変動によるにじみ、文字の欠け、かすれ等の
文字の変動に対して、少ない学習データで文字の変動の
影響が小さい判別を可能にする。 【構成】 文字を任意の方向に平行移動させる手段、回
転移動させる手段、文字およびその周辺近傍に乱数など
の手段を用いて発生させたノイズを加える手段、文字部
分より乱数などの手段を用いて発生させたノイズを差し
引く手段などの文字変動生成手段5を設けることによっ
て、少ない学習データで文字の変動の影響が小さい判別
を可能にする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像情報をもとに文字
の判別を行う文字認識装置に関するものである。
【0002】
【従来の技術】従来のニューラルネットワーク(神経回
路網)による文字認識装置の一例を図を参照しながら説
明する。
【0003】ニューラルネットワークによる文字認識装
置は、図1に示す通りのそれぞれのサンプリング位置の
濃度が入力され、ニューロンに対応する信号処理を行う
ユニットにより構成される入力層11と、入力層11の
各ユニットに結合され、ニューロンに対応する信号処理
を行うユニットより構成される中間層12と、中間層1
2の各ユニットに結合され、ニューロンに対応する信号
処理を行い、その出力が文字の判別結果を表すユニット
より構成される出力層13の、各層により構成されるニ
ューラルネットワークによる信号処理部を備えている。
【0004】上記文字認識装置に正しい文字の判別を行
わせるためには、ニューラルネットワークの学習が必要
である。従来は、図2に示すように、学習データ生成手
段14によって生成された文字データを対応する教師信
号とともに学習手段15に入力することによってニュー
ラルネットワークの学習を行っている。
【0005】学習手段15としては、判別する文字を入
力としたときのニューラルネットの出力と、正しい判別
結果より計算される誤差から各ユニット間の結合係数を
修正するバックプロパゲーション学習法、例えば Richa
rd P. Lippman,"An Introductionto Computing With Ne
ural Nets",IEEE ASSP MAGAZINE APRIL,pp.4-22(1987)
等が知られている。
【0006】
【発明が解決しようとする課題】しかしながら、上記の
従来の技術では、読み取り対象である文字の位置ずれ、
回転、照明の変動などによるにじみ、文字の欠け、かす
れ等の、文字の変動に対して正しい判別ができない場合
がある。そのような場合においても正しい判別ができる
ようにするには、変動した文字をニューラルネットワー
クに学習させてやればよいわけであるが、その場合変動
した文字を用意することが必要となる。また、既に学習
を行ったニューラルネットワークに対して、判別文字の
追加などの理由で、追加学習を行わせる場合、既に学習
されたデータと追加データの両方について学習を行わせ
なければならない。従って、既に学習されたデータの保
持が必要であり、この時変動した文字すべてを保持する
ために大きな記憶領域が必要となるという問題があっ
た。
【0007】そこで、本発明はニューラルネットワーク
を用いた文字認識装置において、少ない学習データで文
字の変動の影響が小さい判別を可能にすることを目的と
する。
【0008】
【課題を解決するための手段】本発明は、上記目的を達
成するために、学習手段への入力データ作成手段とし
て、学習させる文字を生成する学習データ生成手段と、
学習させる文字を任意の方向に平行移動させたり、任意
の角度だけ回転移動させたり、文字部分およびその周囲
近傍に乱数などの手段を用いて発生させたノイズを加え
たり、文字部分より乱数などの手段を用いて発生させた
ノイズを差し引いたりする文字変動生成手段とを設けた
ことを特徴とする。
【0009】
【作用】本発明によれば、読み取り対象である文字の位
置ずれ、回転、照明の変動などによるにじみ、文字の欠
け、かすれ等の文字の変動に対して、少ない学習データ
で文字の変動の影響の小さい正しい判別が可能となる。
【0010】
【実施例】以下、本発明の一実施例を図を参照しながら
説明する。
【0011】図4は、読み取り対象のドット文字を示
し、縦7、横5のドットで文字を表現している。判別す
る文字はアラビア数字の0から9までの10種類の文字
である。又、本実施例の文字認識装置にて用いられるニ
ューラルネットワークは、図5に示す通りの、それぞれ
に7×5の各ドットの濃度が入力され、ニューロンに対
応する信号処理を行う35個のユニットI0〜I34よ
り構成される入力層1と、入力層1の各ユニットに結合
され、ニューロンに対応する信号処理を行う20個のユ
ニットH0〜H19より構成される中間層2と、中間層
2の各ユニットに結合され、ニューロンに対応する信号
処理を行い、その出力が文字の判別結果を表す10個の
ユニットO1〜O9より構成される出力層3よりなる3
層構造のニューラルネットワークである。
【0012】又、入力される文字に対する教師信号を表
1に示す。
【0013】
【表1】
【0014】以下、文字を読み取る手順を示す。
【0015】(1) テレビカメラより入力された文字の画
像を画素分割してディジタル画像とし、それに前処理と
してマスク処理によるシェーディング補正を施すことに
より照明のむら等を除去する。さらに、2値化を行うこ
とでドット部分の濃度を1、それ以外の部分を0とす
る。
【0016】(2) 前処理を行った画像に対して縦、横の
各方向に投影値を計算し、投影値が連続して大きい部分
を文字部分であるとして文字に外接する矩形の切り出し
を行う。矩形の切り出しを行った例を図6に示す。
【0017】(3) 切り出された矩形を縦7、横5の小矩
形に分割する。小矩形に分割した例を図7に示す。
【0018】(4) 上記小矩形内の濃度の最大値をニュー
ラルネットの入力として計算を行い、判別結果としての
出力を得る。
【0019】上記 (3)で得られる小矩形の位置を縦、横
の座標で表現する。つまり、図8に示すように、縦の位
置をy(y=1〜7)、横の位置をx(x=1〜5)と
する。又、小矩形内の濃度の最大値を、x、yを用いて
f(x,y)と表現する。
【0020】上記 (4)の処理において、ニューラルネッ
トの入力に対して所望の出力結果が得られるようにする
ためには、ニューラルネットの学習を行わなければなら
ないわけである。そのために、図3に示すように学習デ
ータ生成手段4によって生成された文字データを文字変
動生成手段5にて種々に変動させたデータを対応する教
師信号とともに学習手段6に入力することによってニュ
ーラルネットワークの学習を行うように構成されてい
る。
【0021】以下、学習の4つの実例を分けて説明す
る。
【0022】図9は、位置ずれのない文字「1」を小矩
形に分割したものであり、これより得られる入力データ
を表2に示す。
【0023】
【表2】
【0024】第1の例においては、表2に示した入力デ
ータをもとに位置ずれをした文字を自動的に生成する。
上下左右に1ドットだけ平行移動させた時の入力データ
を表3〜表6に示す。
【0025】
【表3】
【0026】
【表4】
【0027】
【表5】
【0028】
【表6】
【0029】このようにして作成されたデータを入力と
し、教師信号を平行移動させる前の教師信号と同一とし
てニューラルネットワークの学習を行う。
【0030】第2の例においては、表2に示した入力デ
ータをもとに回転ずれをした文字を自動的に生成する。
文字がその中心(x=3、y=4)のまわりに時計まわ
り方向に角度θだけ回転した時の、回転後の各小矩形の
入力データをg(x,y)、(x=1〜5、y=1〜
7)とすると、g(x,y)はx、y、f(x,y)よ
り (1)式のようにして求められる。θ=10°としたと
きのこの変換による入力データを表7に示す。
【0031】
【数1】
【0032】
【表7】
【0033】このようにして作成されたデータを入力と
し、教師信号を回転移動させる前の教師信号と同一とし
てニュートラルネットワークの学習を行う。
【0034】第3の例においては、表2に示した入力デ
ータをもとに、にじみ等のノイズの加わった文字を自動
的に生成する。ノイズは例えば (2)式のように決定す
る。
【0035】
【数2】
【0036】(2)式中のnはノイズの値、c1、c2は
定数、rは0から1までの乱数、wはもととなる入力デ
ータのドット部分からの距離dに対応した重みであり、
例えば (3)式で表される。
【0037】
【数3】
【0038】(3)式中のc3は定数である。ドット部分
からの距離dは、注目する小矩形の中心に最も近いドッ
ト部分を含む小矩形の中心からの距離で、距離としてユ
ークリッド距離を用いた場合、図9に示される文字に対
して、各小矩形におけるdは表8のようになる。
【0039】
【表8】
【0040】c1=0、c2=0.2、c3=1とした
ときの、ノイズを表9、ノイズを付加した時の入力デー
タを表10に示す。
【0041】
【表9】
【0042】
【表10】
【0043】このようにして作成されたデータを入力と
し、教師信号をノイズを加える前の教師信号と同一とし
てニューラルネットワークの学習を行う。
【0044】第4の例においては、表2に示した入力デ
ータをもとに、文字部分からノイズを差し引くことによ
って欠けやかすれのある文字を自動的に生成する。ノイ
ズは例えば (4)式のように決定する。
【0045】
【数4】
【0046】(4)式中のnはノイズの値、c4、c5は
定数、rは0から1までの乱数である。c4=0.2、
c5=0.8としたときの、ノイズを表11、ノイズを
差し引いた時の入力データを表12に示す。尚、文字部
分以外のノイズは全て0とする。
【0047】
【表11】
【0048】
【表12】
【0049】このようにして作成されたデータを入力と
し、教師信号をノイズを加える前の教師信号と同一とし
てニューラルネットワークの学習を行う。
【0050】
【発明の効果】本発明によれば、以上のように、ある文
字から複数の変動した文字を自動的に発生させ、それを
学習データとしてニューラルネットワークの学習を行う
ことによって、少ない学習データで、文字の変動の影響
の小さい正しい判別ができる文字認識装置を実現するこ
とができる。
【図面の簡単な説明】
【図1】従来例の文字認識装置に用いられているニュー
ラルネットワークの構成図である。
【図2】従来例の学習機能の構成図である。
【図3】本発明の一実施例における学習機能の構成図で
ある。
【図4】本発明の一実施例における読み取り対象のドッ
ト文字の説明図である。
【図5】本発明の一実施例における文字認識装置に用い
られているニューラルネットワークの構成図である。
【図6】図4のドット文字を外接矩形にて切り出した状
態の説明図である。
【図7】図6のドット文字をさらに小矩形にて分割した
状態の説明図である。
【図8】小矩形の座標表現の説明図である。
【図9】位置ずれのない文字の説明図である。
【符号の説明】
1 入力層 2 中間層 3 出力層 4 学習データ生成手段 5 文字変動生成手段 6 学習手段

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字の画像情報より得られる複数の濃度
    情報を入力とし、文字の判別結果を出力とするニューラ
    ルネットワークの機構を備え、かつニューラルネットワ
    ークのユニット間の結合係数を最適化する学習手段を備
    えた文字認識装置において、学習手段への入力データ作
    成手段として、学習させる文字を作成する学習データ生
    成手段と、学習させる文字を変動させる文字変動生成手
    段とを設けたことを特徴とする文字認識装置。
  2. 【請求項2】 文字変動生成手段は、学習させる文字を
    任意の方向に平行移動させることを特徴とする請求項1
    記載の文字認識装置。
  3. 【請求項3】 文字変動生成手段は、学習させる文字を
    任意の角度だけ回転移動させることを特徴とする請求項
    1記載の文字認識装置。
  4. 【請求項4】 文字変動生成手段は、文字部分およびそ
    の周囲近傍に乱数などの手段を用いて発生させたノイズ
    を加えることを特徴とする請求項1記載の文字認識装
    置。
  5. 【請求項5】 文字変動生成手段は、文字部分より乱数
    などの手段を用いて発生させたノイズを差し引くことを
    特徴とする請求項1記載の文字認識装置。
JP3217793A 1991-08-29 1991-08-29 文字認識装置 Pending JPH0554195A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3217793A JPH0554195A (ja) 1991-08-29 1991-08-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3217793A JPH0554195A (ja) 1991-08-29 1991-08-29 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0554195A true JPH0554195A (ja) 1993-03-05

Family

ID=16709819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3217793A Pending JPH0554195A (ja) 1991-08-29 1991-08-29 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0554195A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164485A (ja) * 2013-02-25 2014-09-08 Toshiba Corp 画像処理装置、画像処理方法及びプログラム
KR20190103283A (ko) 2017-03-27 2019-09-04 가부시키가이샤 히다치 하이테크놀로지즈 화상 처리 시스템, 및 화상 처리를 행하기 위한 컴퓨터 프로그램
WO2020084720A1 (ja) * 2018-10-24 2020-04-30 富士通フロンテック株式会社 紙幣検査装置、紙幣検査方法及び紙幣検査プログラム
WO2020121661A1 (ja) * 2018-12-14 2020-06-18 株式会社シンクアウト 識別装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164485A (ja) * 2013-02-25 2014-09-08 Toshiba Corp 画像処理装置、画像処理方法及びプログラム
KR20190103283A (ko) 2017-03-27 2019-09-04 가부시키가이샤 히다치 하이테크놀로지즈 화상 처리 시스템, 및 화상 처리를 행하기 위한 컴퓨터 프로그램
KR20210111335A (ko) 2017-03-27 2021-09-10 주식회사 히타치하이테크 화상 처리 시스템, 및 화상 처리를 행하기 위한 컴퓨터 프로그램
US11176405B2 (en) 2017-03-27 2021-11-16 Hitachi High-Tech Corporation Image processing system and computer program for performing image processing
US11836906B2 (en) 2017-03-27 2023-12-05 Hitachi High-Tech Corporation Image processing system and computer program for performing image processing
WO2020084720A1 (ja) * 2018-10-24 2020-04-30 富士通フロンテック株式会社 紙幣検査装置、紙幣検査方法及び紙幣検査プログラム
JPWO2020084720A1 (ja) * 2018-10-24 2021-04-30 富士通フロンテック株式会社 紙幣検査装置、紙幣検査方法及び紙幣検査プログラム
US11423728B2 (en) 2018-10-24 2022-08-23 Fujitsu Frontech Limited Banknote inspection device, banknote inspection method, and banknote inspection program product
CN112840383B (zh) * 2018-10-24 2024-03-08 富士通先端科技株式会社 纸币检查装置、纸币检查方法及纸币检查程序
WO2020121661A1 (ja) * 2018-12-14 2020-06-18 株式会社シンクアウト 識別装置
JP2020095657A (ja) * 2018-12-14 2020-06-18 株式会社シンクアウト 識別装置
JP2022172102A (ja) * 2018-12-14 2022-11-15 株式会社シンクアウト 識別装置

Similar Documents

Publication Publication Date Title
CN104112128B (zh) 应用于票据影像字符识别的数字图像处理系统及方法
Davies Machine vision: theory, algorithms, practicalities
EP0063454B1 (en) Method for recognizing machine encoded characters
US5048107A (en) Table region identification method
US11341757B2 (en) Training language models using text corpora comprising realistic optical character recognition (OCR) errors
JPH0773329A (ja) 画像処理方法および装置
JPH0778818B2 (ja) セルフクロッキング記号形状コードを復号するための二値画像処理方法
CN109815931B (zh) 一种视频物体识别的方法、装置、设备以及存储介质
EP0604687B1 (en) Method for deriving character features in a character recognition system
Almansari et al. Recognition of isolated handwritten Arabic characters
JPH0554195A (ja) 文字認識装置
JPH0792820B2 (ja) 文字認識方法
JP2993007B2 (ja) 画像領域識別装置
JPS60126777A (ja) 文字切り出し方式
CN117474932B (zh) 对象分割方法和装置、电子设备及存储介质
JPH06231257A (ja) 学習データ生成装置
CN115409723A (zh) 用于去除文档图像中干扰信息的方法及相关产品
JP2613211B2 (ja) 画像入力装置
Choi et al. Biologically motivated trainable selective attention model using adaptive resonance theory network
JP2917353B2 (ja) 文字切り出し装置
Song et al. Vectorizing Building Blueprints
JP2771045B2 (ja) 文書画像の領域分割方法
CN116434238A (zh) 一种提高学生信息识别准确率的方法
CN116884014A (zh) 一种基于图像处理的乐谱数据集生成方法及系统
CN116563836A (zh) 文本识别方法