JPH08329195A - ニューラルネットワークを用いる文字認識装置 - Google Patents

ニューラルネットワークを用いる文字認識装置

Info

Publication number
JPH08329195A
JPH08329195A JP7133496A JP13349695A JPH08329195A JP H08329195 A JPH08329195 A JP H08329195A JP 7133496 A JP7133496 A JP 7133496A JP 13349695 A JP13349695 A JP 13349695A JP H08329195 A JPH08329195 A JP H08329195A
Authority
JP
Japan
Prior art keywords
data
pattern data
neural network
dots
normalized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7133496A
Other languages
English (en)
Inventor
Hiromitsu Kawajiri
博光 川尻
Takatoshi Yoshikawa
隆敏 吉川
Hiroshi Horii
洋 堀井
Junji Tanaka
田中  淳司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Sanyo Electric Co Ltd
Sanyo Electric Co Ltd
Original Assignee
Tokyo Sanyo Electric Co Ltd
Tottori Sanyo Electric Co Ltd
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Sanyo Electric Co Ltd, Tottori Sanyo Electric Co Ltd, Sanyo Electric Co Ltd filed Critical Tokyo Sanyo Electric Co Ltd
Priority to JP7133496A priority Critical patent/JPH08329195A/ja
Publication of JPH08329195A publication Critical patent/JPH08329195A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【構成】 ニューラルネットワーク12には、正規化回
路14からの8×8ドットの正規化パターンデータと、
特徴抽出回路16からのそれぞれが4×4ドットの4つ
の特徴パターンデータとが与えられる。したがって、ニ
ューラルネットワーク12は、正規化パターンデータお
よび特徴パターンデータに基づいて学習し、入力層12
aと中間層12bとの間の結合係数および中間層12b
と出力層12cとの間の結合係数が決定される。認識時
には、その結合係数に従ってニューラルネットワーク1
2が入力文字を認識する。 【効果】 特徴データの計算量が少なくてよいので高速
に、かつ正規化データもニューラルネットワークに入力
するので精度よく、文字を認識できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明はニューラルネットワー
クを用いた文字認識装置に関し、特にたとえば、ニュー
ラルネットワークの入力層にパターンデータを入力し、
そのニューラルネットワークの出力層から認識結果を出
力する文字認識装置に関する。
【0002】
【従来の技術】この種の文字認識装置では、たとえば8
×8ドットに正規化したパターンデータから、たとえば
4×4ドットの特徴パターンデータを求める。このよう
な特徴パターンデータを、たとえば8方向(水平,垂
直,右45°,左45°,右30°,左30°,右60
°,左60°)について求め、8方向の特徴パターンデ
ータ、すなわち128次元のデータをニューラルネット
ワークに入力する。ニューラルネットワークでは、入力
パターンデータと基準パターンデータとの類似度に従っ
てその文字の認識結果を出力する。
【0003】
【発明が解決しようとする課題】従来の文字認識装置で
は、正規化データから特徴データを求める際の計算量が
膨大になり、たとえば手書き文字のリアルタイム認識に
は不向きである。それゆえに、この発明の主たる目的
は、計算量を小さくして速く認識できる、ニューラルネ
ットワークを用いた文字認識装置を提供することであ
る。
【0004】
【課題を解決するための手段】この発明は、ニューラル
ネットワークの入力層にパターンデータを入力し、その
ニューラルネットワークの出力層から認識結果を出力す
る文字認識装置において、m1×n1ドットに正規化した第
1のパターンデータと、第1のパターンデータを複数方
向にフィルタ処理してm2×n2(m2<m1, n2<n1)ドット
に変換した複数の第2のパターンデータとを入力層に与
えるようにしたことを特徴とする、文字認識装置であ
る。
【0005】
【作用】第1のパターンデータは、m1×n1ドットたとえ
ば8×8ドットに正規化したパターンデータである。こ
の8×8ドットのパターンデータをたとえば4つの直線
成分フィルタで処理した後、それぞれぼかし圧縮フィル
タで処理して、それぞれm2×n2ドットたとえば4×4ド
ットの4つの第2のパターンデータを求める。したがっ
て、ニューラルネットワークには、たとえば128(=
64+4×16)次元のデータが入力される。
【0006】ニューラルネットワークでは、第1のパタ
ーンデータとそれに対応する第1の基準データとを比較
するとともに、第2のパターンデータととれに対応する
第2の基準データとを比較する。そして、この比較結果
に応じて、入力文字を同定する。
【0007】
【発明の効果】この発明によれば、第2のパターンデー
タすなわち特徴パターンデータの数が従来より少なくて
よいため、計算量を小さくでき、したがって、より高速
に文字認識が可能になる。他方、第1のパターンデータ
すなわち正規化データをそのままニューラルネットワー
クに入力するようにしているので、認識精度が低下する
ことはない。
【0008】たとえば英数字のように少ない種類の文字
を認識する場合には、文字の形状が或る程度限られてい
るので、少ない方向成分を用いても精度よく認識するこ
とができ、この発明の文字認識装置は、特に送信原稿上
に手書きされた宛先情報を認識して自動発信するファク
シミリ装置に好適する。この発明の上述の目的,その他
の目的,特徴および利点は、図面を参照して行う以下の
実施例の詳細な説明から一層明らかとなろう。
【0009】
【実施例】図1の機能ブロック図に示されるこの発明の
一実施例の文字認識装置10は、ニューラルネットワー
ク12を含み、このニューラルネットワーク12は入力
層12a,中間層12bおよび出力層12cを含む。入
力層12aと中間層12bとは結合係数Nih で結合され
ていて、中間層12bと出力層12cとは結合係数who
で結合されている。ニューラルネットワーク12の入力
層12aには、正規化回路14で作成したたとえば8×
8ドットの正規化パターンデータが入力されるととも
に、特徴抽出回路16で作成した4つの4×4ドットの
特徴パターンデータが入力される。
【0010】特徴抽出回路16は、図2に従って特徴パ
ターンデータを求める。すなわち、ステップS1では、
たとえば図3で示すように、8×8ドットの正規化パタ
ーンデータの周囲に1ドットの「0」を加え、10×1
0ドットのパターンデータに変換する。次いで、ステッ
プS2において、図4で示す4方向の直線成分フィルタ
を用いてフィルタ処理を実行する。すなわち、このステ
ップS2では、数1に従って、4つの8×8ドットのパ
ターンデータ(中間データHk(x,y) )を計算する。
【0011】
【数1】
【0012】数1において、中間データHk(x,y) の添
字x,yは図3における各ドット(座標)位置を示し、
(x+i-1,y+i-1) は入力データであり、fk(i,j) は直
線成分フィルタを示す。直線成分フィルタf1は、図4
に示すように、水平方向成分を抽出するためのフィルタ
であり、直線成分フィルタf2,f3およびf4は、そ
れぞれ、垂直成分,右45°成分および左45°成分を
抽出するフィルタである。
【0013】ただし、図3において最も外側の各ドット
の入力データは「0」として計算する。つまり、
【0014】
【数2】I(x,-1)=0 I(x,8) =0 I(-1,y)=0 I(8,y) =0 x=0,1,2,3,4,5,6,7 y=0,1,2,3,4,5,6,7 である。
【0015】数1に従って計算した中間データHk
(x,y) は max{Hk(x,y) }で割ることによって「0〜
1」の値に正規化する。次に、ステップS3で、ステッ
プS2において求めた4つの中間データ(8×8ドッ
ト)の周囲に1ドットの「0」を加え、4つの10×1
0ドットの中間データに変換する。
【0016】そして、ステップS4において、図5に示
すぼかし圧縮フィルタを用いたフィルタ処理を実行し、
特徴パターンデータを計算する。すなわち、数3に従っ
た出力データOk(p,q) を得る。
【0017】
【数3】
【0018】ただし、中間データの最も外側の各ドット
は「0」として計算する。つまり、
【0019】
【数4】Hk(x,-1)=0 Hk(x,8) =0 Hk(-1,y)=0 Hk(8,y) =0 x=0,1,2,3,4,5,6,7 y=0,1,2,3,4,5,6,7 である。
【0020】なお、図3においてgk(i,j) はぼかし圧
縮フィルタを示す。ぼかし圧縮フィルタg1は、図5に
示すように、水平方向成分を抽出するためのフィルタで
あり、ぼかし圧縮フィルタg2,g3およびg4は、そ
れぞれ、垂直成分,右45°成分および左45°成分を
抽出するフィルタである。そして、数3に従って計算し
た出力データOk(p,q) は max{Ok(p,q) }で割るこ
とによって「0〜1」の値に正規化する。このようにし
て、それぞれが4×4ドットである4方向の直線成分す
なわち特徴パターンデータが計算される。
【0021】図1に示す文字認識装置10において、学
習時には、このようにして入力される128(=64+
4×16)次元のデータに従って、結合係数Vih および
Whoが決定される。すなわち、教師用サンプルデータの
8×8ドットの正規化データおよびその正規化データに
従って得られるそれぞれ4×4ドットの特徴データが、
正規化回路14および特徴抽出回路16から入力層12
aに入力される。したがって、ニューラルネットワーク
18では、適宜の結合係数Vih およびWho に従って、出
力層12cから出力値を出力する。つまり、教師用サン
プルとの類似度に応じた出力値を出力する。
【0022】ニューラルネットワーク18からの上述の
出力値は誤差出力回路18に与えられる。この誤差出力
回路18には、また、教師信号出力回路20から、正解
出力値、すなわちそのとき学習させようとした文字に相
当する出力値をたとえば「0.9」とし、残余の文字に
相当する出力値をたとえば「0.2」とした教師信号が
与えられる。したがって、誤差出力回路18では、ニュ
ーラルネットワーク12からの出力値と教師信号出力回
路20からの教師信号との誤差を計算し、誤差データを
誤差総和回路22に与える。
【0023】誤差総和回路22は、誤差データの総和を
計算し、誤差総和が所定値たとえば「0.5」を超える
と、修正回路24に修正指令信号を与える。修正回路2
4では、修正指令信号を受けると、そのとき誤差出力回
路18から出力されている誤差データに基づいて、結合
係数Vih およびWho を修正する。つまり、バックプロパ
ゲーション法に従って結合係数Vih およびWho が修正さ
れる。
【0024】そして、図1の文字認識装置10で文字認
識を実行するときは、学習時に決定された結合係数Vih
およびWho を設定し、入力文字の8×8ドットの正規化
データおよびそれに対応する基準パターンデータと、4
つの4×4ドットの特徴データおよびそれぞれに対応す
る基準パターンデータとに従って、ニューラルネットワ
ーク18がその入力文字を同定する信号を出力する。し
かしながら、認識方法それ自体は従来の認識装置と変わ
るところがないため、ここでは詳細な説明は省略する。
【0025】図1実施例においては、特徴抽出回路16
において4つの特徴データ、すなわち方向成分データを
計算するだけでよいので、このときの計算量が少なくて
済むため、迅速に入力文字を認識することができる。ま
た、ニューラルネットワーク12には特徴データだけで
はなく正規化データも入力するようにしているため、特
徴データの数が少ないための認識精度の低下を抑えるこ
とができる。したがって、たとえば英数字のように文字
の形状が或る程度限られている場合には、高速かつ精度
よく認識することができる。そのため、実施例の文字認
識装置10は、特に、送信原稿上に手書きされた宛先情
報を認識して自動発信するファクシミリ装置の宛先情報
認識装置として好適する。
【図面の簡単な説明】
【図1】この発明の一実施例を示す機能ブロック図であ
る。
【図2】図1実施例の特徴抽出回路の動作を示すフロー
図である。
【図3】8×8ドットのパターンデータを10×10ド
ットのパターンデータに変換した状態の一例を示す図解
図である。
【図4】直線成分フィルタの一例を示す図解図である。
【図5】ぼかし圧縮フィルタの一例を示す図解図であ
る。
【符号の説明】
10 …文字認識装置 12 …ニューラルネットワーク 14 …正規化回路 16 …特徴抽出回路
───────────────────────────────────────────────────── フロントページの続き (72)発明者 堀井 洋 大阪府守口市京阪本通2丁目5番5号 三 洋電機株式会社内 (72)発明者 田中 淳司 鳥取県鳥取市南吉方3丁目201番地 鳥取 三洋電機株式会社内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】ニューラルネットワークの入力層にパター
    ンデータを入力し、そのニューラルネットワークの出力
    層から認識結果を出力する文字認識装置において、 m1×n1ドットに正規化した第1のパターンデータと、第
    1のパターンデータを複数方向にフィルタ処理してm2×
    n2(m2<m1, n2<n1)ドットに変換した複数の第2のパ
    ターンデータとを前記入力層に与えるようにしたことを
    特徴とする、文字認識装置。
JP7133496A 1995-05-31 1995-05-31 ニューラルネットワークを用いる文字認識装置 Pending JPH08329195A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7133496A JPH08329195A (ja) 1995-05-31 1995-05-31 ニューラルネットワークを用いる文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7133496A JPH08329195A (ja) 1995-05-31 1995-05-31 ニューラルネットワークを用いる文字認識装置

Publications (1)

Publication Number Publication Date
JPH08329195A true JPH08329195A (ja) 1996-12-13

Family

ID=15106134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7133496A Pending JPH08329195A (ja) 1995-05-31 1995-05-31 ニューラルネットワークを用いる文字認識装置

Country Status (1)

Country Link
JP (1) JPH08329195A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019194788A (ja) * 2018-05-02 2019-11-07 日本電信電話株式会社 学習装置、認識装置、学習方法及びコンピュータプログラム
WO2020084720A1 (ja) * 2018-10-24 2020-04-30 富士通フロンテック株式会社 紙幣検査装置、紙幣検査方法及び紙幣検査プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019194788A (ja) * 2018-05-02 2019-11-07 日本電信電話株式会社 学習装置、認識装置、学習方法及びコンピュータプログラム
WO2020084720A1 (ja) * 2018-10-24 2020-04-30 富士通フロンテック株式会社 紙幣検査装置、紙幣検査方法及び紙幣検査プログラム
JPWO2020084720A1 (ja) * 2018-10-24 2021-04-30 富士通フロンテック株式会社 紙幣検査装置、紙幣検査方法及び紙幣検査プログラム
US11423728B2 (en) 2018-10-24 2022-08-23 Fujitsu Frontech Limited Banknote inspection device, banknote inspection method, and banknote inspection program product
CN112840383B (zh) * 2018-10-24 2024-03-08 富士通先端科技株式会社 纸币检查装置、纸币检查方法及纸币检查程序

Similar Documents

Publication Publication Date Title
JP3163185B2 (ja) パターン認識装置およびパターン認識方法
US5243668A (en) Method and unit for binary processing in image processing unit and method and unit for recognizing characters
CN114399440B (zh) 图像处理方法、图像处理网络训练方法、装置及电子设备
CN111986117A (zh) 一种算术作业批改系统及方法
CN108710881B (zh) 神经网络模型、候选目标区域生成方法、模型训练方法
US11436432B2 (en) Method and apparatus for artificial neural network
EP0783226A3 (en) Image processing apparatus and method
JPH08329195A (ja) ニューラルネットワークを用いる文字認識装置
EP0471472A2 (en) Image processing method and apparatus therefor
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
CN110555462A (zh) 基于卷积神经网络的无固定多字符验证码识别方法
CN111402164B (zh) 矫正网络模型的训练方法和装置、文本识别方法和装置
CN110837816A (zh) 光学字符识别系统、边缘节点及系统
JP2004094644A (ja) 画像処理装置、画像処理方法、記憶媒体及びプログラム
JP2822792B2 (ja) 画像ノイズ除去装置
JPH06231257A (ja) 学習データ生成装置
JP2002056386A (ja) 画像処理方法、及び画像処理方法を実行するプログラムを記録した記録媒体
JPS6272085A (ja) 文字認識装置
JPH11120291A (ja) パタン認識システム
JP3324726B2 (ja) 画像認識装置
CN118172290A (zh) 一种基于多级自适应CNN与混合Transformer的唐卡图像修复方法、系统及存储介质
JPH07271907A (ja) アナログ画像の二値化装置
JPH09265530A (ja) 辞書作成方法およびカラー画像認識方法
JPH10187883A (ja) 文字認識装置及び文字認識方法
JP3249996B2 (ja) パターン識別装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030805