JP2701311B2 - 認識辞書作成機能を備えた文字認識装置 - Google Patents

認識辞書作成機能を備えた文字認識装置

Info

Publication number
JP2701311B2
JP2701311B2 JP63097239A JP9723988A JP2701311B2 JP 2701311 B2 JP2701311 B2 JP 2701311B2 JP 63097239 A JP63097239 A JP 63097239A JP 9723988 A JP9723988 A JP 9723988A JP 2701311 B2 JP2701311 B2 JP 2701311B2
Authority
JP
Japan
Prior art keywords
vector
matrix
value
feature
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63097239A
Other languages
English (en)
Other versions
JPH01267789A (ja
Inventor
博行 上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63097239A priority Critical patent/JP2701311B2/ja
Publication of JPH01267789A publication Critical patent/JPH01267789A/ja
Application granted granted Critical
Publication of JP2701311B2 publication Critical patent/JP2701311B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は認識対象ケテゴリの辞書作成機能を備えた文
字認識装置、特に特徴抽出と判定を非線形処理で行なう
文字認識装置における辞書作成手段の構成に関する。
(従来の技術) 文字認識として一般的な方法は、線形処理を使った方
法である文字画像から検出した測定量を要素とするベク
トルと認識辞書として予め用意したベクトルとの相関量
を求め最大相関量となる認識辞書のカテゴリ名を判定結
果とする方法(以下では線形処理法と呼ぶ)である。線
形処理法での認識辞書は、認識対象カテゴリの学習パタ
ーンからの観測量を要素とする学習ベクトルを主成分分
析や判別分析等の統計手法で求める方法が知られてい
る。例えば、主成分分析による方法は「パターン認識学
習装置」、特開昭62-73391号公報(文献1)、判別分析
による方法は「階層化法とその文字認識システムPC-OC
R」、電子通信学会パターン認識と理解研究会資料PRU86
-76(文献2)に記載されている。文献1と2の両方と
も、学習ベクトルから求めた共分散行列をK−L展開
し、得られる固有ベクトルあるいは固有ベクトル軸上で
の値を要素とするベクトルを辞書としている。この主成
分分析と判別分析との違いは、認識対象カテゴリごとに
解析するか、認識対象カテゴリ全てを同時に解析するか
にある。
一方、文字認識に非線形処理を導入した代表例とし
て、「ネオコグニトロンの原理を用いた手書き数字認
識」、情報処理学会コンピュータビジョン研究会報告、
No.41,pp.1−6(文献3)があり、認識対象のパターン
全体をサイクリックに与えることで認識論理が作成され
ていく。また非線形処理を使った神経回路モデルの学習
方法として、バックプロパゲーションによる学習、例え
ば“An Introduction to Computing With Neural Net
s",IEEE ASSP Magazine,April,pp.4−22(1987)(文献
4)に記載、が知られている。このバックプロパゲーシ
ョンによる学習で提案された3層構成を文字認識の構成
として利用した例として、“A Neural Network Digit R
ecognizer",IEEE Proc.Int.Conf.Cybern.Soc.Vol.2,pp.
1621-1625(1986)(文献5)がある。非線形処理を特
徴抽出や判定に利用した方法を、前記線形処理法に対
し、以下では非線形処理法と呼ぶことにする。
(発明が解決しようとする課題) 前記文献1や文献2のような線形処理法では、認識対
象のパターンから得られる観測量を要素とする特徴ベク
トルが写影される特徴空間において線形分離できない部
分は誤認識あるいは認識結果を決定できないという問題
がある。
また、文献3や5の非線形処理法では予め特徴を決
め、処理量の多い学習を行なう必要があるという問題が
ある。例えば、文献3にあるバックプロパゲーションに
よる学習では各層をつなぐ結合係数を全て更新する必要
があり、しかも少しずつ値を更新していくので多数回の
学習が必要であると言われている。
(課題を解決するための手段) 本願発明によれば、文字を含む画像を入力する画像入
力手段と、一文字づつの文字画像に分離する文字切り出
し手段と、一文字の画像から初期特徴量を求める初期特
徴検出手段と、複数個の初期特徴量と第一の定数値とを
初期特徴ベクトルとして記憶する初期特徴ベクトル記憶
手段と、初期特徴ベクトルを変換するための特徴変換行
列を記憶する特徴変換行列記憶手段と、ベクトルと行列
との積を計算する変換手段と、前記変換手段からの入力
値をシグモイド形の関係に対応づける値に変えるための
変換テーブルの各値を記憶する変換テーブル記憶手段
と、前記変換テーブルで前記変換手段からの入力値を変
換するテーブル変換手段と、前記テーブル変換手段から
の複数個の入力値と第二の定数値とを特徴ベクトルとし
て記憶する特徴ベクトル記憶手段と、判定用辞書となる
辞書行列を記憶する辞書行列記憶手段と、前記テーブル
記憶手段による前記特徴ベクトルと辞書行列との積の変
換により得られるベクトルを評価ベクトルとして記憶す
る評価ベクトル記憶手段と、前記評価ベクトルの各要素
である値を入力として最大値となる入力番号を検出する
最大値検出手段と、前記最大値検出手段からの入力値で
ある番号に対応する文字カテゴリ名を出力するカテゴリ
出力手段と、文字カテゴリごとの初期特徴量を要素とす
るベクトルを学習ベクトルとして記憶する学習ベクトル
記憶手段と、前記学習ベクトルの線形判別分析により前
記特徴変換行列値と辞書行列値の初期値とを求める統計
解析手段と、前記特徴変換行列と辞書行列の要素である
各値を記憶する行列記憶手段と、前記学習ベクトルに対
する特徴ベクトルと評価ベクトルと正解カテゴリ名より
前記特徴変換行列と辞書行列の要素である各値をバック
プロパゲーションによる学習手法を用いて更新する制御
手段とからなる辞書作成機能を備えた文字認識装置が得
られる。
(作用) 前記文献2の線形判別分析を利用した文字認識法で
は、予め特徴を決めずに観測量からなるベクトルの線形
判別変換により特徴ベクトルを得ている。この線形判別
写像用の行列は認識対象カテゴリの学習ベクトル全体を
一回解析することで求めることができる。また、ある特
定のカテゴリとそれ以外の全カテゴリという2クラスの
線形判別分析により特定カテゴリとそれ以外のカテゴリ
全てとを識別する線形判別写像用のベクトルと2クラス
を識別するためのいき値とが得られ、特定カテゴリ用の
認識辞書となる。すなわち、線形判別分析を用いると予
め特徴を決める必要がなく一回の解析で特徴ベクトル変
換用の行列を、また各カテゴリと残りのカテゴリ全体と
の線形判別分析とにより認識辞書行列の要素となるベク
トルを作成できる。
そこで、前述の非線形処理法での3層構造において、
第1層から第2層への結合係数からなる行列を上記文字
認識法での特徴ベクトル変換用行列にまた第2層から第
3層への結合係数からなる行列を認識辞書行列にみな
し、各結合係数の初期値を、学習ベクトルの線形判別分
析で得られる値とする。また第2層のいき値は0を、第
3層のいき値は2クラス識別のためのいき値を初期値と
する。その上で、一般には乱数で与えた値から開始する
バックプロパゲーションによる学習を線形では最適な上
記値から開始すると、速い収束、すなわち学習回数が少
なくてすむことになる。
第2図は文字画像と上記層間の関係を例示した図であ
る。文字画像上のリサンプリング点位置における局所特
徴値である入力層の要素101の出力は中間層200の要素20
1、202等の入力となり、また中間層200の各要素の出力
は出力層300の要素301等の入力となる。また要素間の結
合係数と各要素での非線形応答におけるいき値とを並べ
ると行列となる。従って、文字認識は入力層のベクトル
と行列との積で得られた値をシグモイド形のテーブルで
変換し、得られる各値を中間層のベクトルの要素とし、
次に中間層のベクトルと行列との積で得られた値をシグ
モイド形のテーブルで変換し得られる値の最大値を検出
し、最大値に対応するカテゴリ名を認識結果とすること
で行える。
上記のように、この文字認識方法では予め検出する特
徴を決めてない。
(実施例) 以下、本願の実施例を図面を参照して説明する。
第1図は本願発明の一実施例である文字認識装置のブ
ロック図である。図において、1は画像入力手段、2は
文字切り出し手段、3は初期特徴検出手段、4は初期特
徴ベクトル記憶手段、5は特徴変換行列記憶手段、6は
変換手段、7は変換テーブル記憶手段、8はテーブル変
換手段、9は特徴ベクトル記憶手段、10は辞書行列記憶
手段、11は評価ベクトル記憶手段、12は最大値検出手
段、13はカテゴリ出力手段、14は学習ベクトル記憶手
段、15は統計解析手段、16は行列記憶手段、17は制御手
段である。
第1図の文字認識装置での文字認識は次のようにして
行なわれる。認識対象の文字を含む画像を画像入力手段
1により求め、文字切り出し手段2は前記画像入力手段
1の出力である画像から一個づつ認識対象の文字画像を
決定し、その位置にある文字画像を順次出力する。以下
の処理は各文字画像ごとに行う。初期特徴検出手段3は
前記文字切り出し手段2からの文字画像よりリサンプリ
ング点における局所特徴値を初期特徴量として検出し、
前記初期特徴検出手段3の出力値は初期特徴ベクトルの
要素値として初期特徴ベクトル記憶手段4に記憶され
る。特徴変換行列記憶手段5には前述の入力層から中間
層への結合係数と中間層各要素のいき値とからなる行列
が記憶されている。ここで、前記初期特徴ベクトルは、
前記行列のサイズと一致するように、前記初期特徴検出
手段4からの入力値と第1の定数値からなる。変換手段
6は前記初期特徴ベクトル記憶手段4からの入力である
ベクトルと前記特徴変換行列記憶手段5からの入力であ
る行列との積を求め、行列の次元数と同数の値を順次出
力する。変換テーブル記憶手段7は非線形の入出力応答
を行なうためのシグモイド形のテーブル値を記憶してい
るので、テーブル変換手段8は前記変換手段6からの入
力値を前記変換テーブル記憶手段7のテーブルにより変
換し、変換値を出力する。前記テーブル変換手段8から
の出力値は、特徴ベクトル記憶手段9に順次記憶され
る。前記初期特徴ベクトルと特徴変換行列との積値が全
てテーブル変換されて前記特徴ベクトル記憶手段9に記
憶し終わると、次に前述の中間層から出力層への結合係
数及び出力層各要素のいき値とからなる行列を記憶して
いる辞書行列記憶手段10の行列と前記特徴ベクトル記憶
手段9のベクトルとが変換手段6の入力となる。特徴ベ
クトル記憶手段9の特徴ベクトルは、前記初期特徴ベク
トル記憶手段4の初期特徴ベクトルと同じく辞書行列と
の次元数と一致し、前記テーブル変換手段8からの入力
値と第2の定数値とからなる。そこで、変換手段6は前
記特徴ベクトル記憶手段9からの入力であるベクトルと
前記辞書行列記憶手段10からの入力である前述の行列と
の積を求め、辞書カテゴリ数と同数の値を順次出力す
る。テーブル変換手段8は前記変換手段6からの辞書カ
テゴリ数個の値を前記変換テーブル記憶手段7のテーブ
ルから読み出して変換し、変換値を評価ベクトル記憶手
段11に出力する。最大値検出手段12は前記評価ベクトル
記憶手段11からの辞書カテゴリの数だけ入力される値の
中で最大値となる入力番号を検出する。カテゴリ出力手
段13は前記最大値検出手段12から入力される番号に対応
するカテゴリ名を出力する。カテゴリ出力手段13からの
出力が前記初期特徴検出手段3に入力した文字画像の認
識結果となる。
上記の文字認識で使う特徴変換行列、辞書行列および
第一と第二の定数値は、以下の順序で作成する。
決められた順序の文字を含む画像を画像入力手段1に
より求め、文字切り出し手段2は前記画像入力手段1の
出力である画像から一個づつ認識対象の文字画像を決定
し、その位置にある文字画像を順次出力する。各文字画
像ごとに、初期特徴検出手段3は前記文字切り出し手段
2からの文字画像よりリサンプリング点における局所特
徴値を検出する。学習ベクトル記憶手段14は前記入力文
字の順序よりカテゴリ名を決定し、カテゴリごとに前記
初期特徴検出手段3の出力である局所特徴値を要素とす
るベクトルを学習ベクトルとして記憶する。統計解析手
段15は、まず前記学習ベクトルの各カテゴリを各クラス
名とする多クラスの線形判別分析により得られる行列と
ゼロベクトル(要素値がゼロであるベクトル。)からな
る行列を特徴変換行列とし行列記憶手段16に出力する。
つぎに統計解析手段15は、前期学習ベクトル記憶手段14
の学習ベクトルと前記行列記憶手段16の特徴変換行列と
の積で得られるベクトルを一時記憶する。全学習ベクト
ルに対する積を終了すると、最後に、統計解析手段15は
カテゴリ順に一つのカテゴリと残りのカテゴリ全部とを
クラス名とし2クラスの線形判別分析により得られる判
別写像用のベクトルと識別のいき値とからなるベクトル
を各カテゴリの辞書ベクトルとして行列記憶手段16に出
力する。制御手段17は、前述のバックプロパゲーション
での学習における初期値を前期行列記憶手段16に記憶さ
れている特徴変換行列、辞書ベクトルを要素とする辞書
行列およびいき値とし、前期学習ベクトルを入力、学習
ベクトルのカテゴリ名を教師として行列の各値を更新す
る。ここで、第一と第二の定数値は1とする。学習によ
る更新が終了すると、前期制御手段17は前期行列記憶手
段16に記憶されている特徴変換行列を前期特徴変換行列
記憶手段5に転送する。また、前期制御手段17は前期行
列記憶手段16に記憶されている辞書行列を転送する。以
上の処理により辞書作成が終了する。
(発明の効果) 以上説明したように本願発明によれば、バックプロパ
ゲーションによる学習の初期値を線形判別分析により求
めるので辞書作成を短縮できるという効果がある。また
認識に用いる特徴を予め与える必要がないことから、認
識対象カテゴリのパターン形状が限定されないという効
果がある。
【図面の簡単な説明】
第1図は本願発明の文字認識装置の一実施例、第2図は
文字画像と特徴抽出の中間層及び判定の出力層の関係を
例示する図である。 図において、1は画像入力手段、2は文字切り出し手
段、3は初期特徴抽出手段、4は初期特徴ベクトル記憶
手段、5は特徴変換行列記憶手段、6は変換手段、7は
変換テーブル記憶手段、8はテーブル記憶手段、9は特
徴ベクトル記憶手段、10は辞書行列記憶手段、11は評価
ベクトル記憶手段、12は最大値検出手段、13はカテゴリ
出力手段、14は学習ベクトル記憶手段、15は統計解析手
段、16は行列記憶手段、17は制御手段である。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】文字を含む画像を入力する画像入力手段
    と、一文字づつの文字画像に分離する文字切り出し手段
    と、一文字の画像から初期特徴量を求める初期特徴検出
    手段と、複数個の初期特徴量と第一の定数値とを初期特
    徴ベクトルとして記憶する初期特徴ベクトル記憶手段
    と、初期特徴ベクトルを変換するための特徴変換行列を
    記憶する特徴変換行列記憶手段と、ベクトルと行列との
    積を計算する変換手段と、前記変換手段からの入力値を
    シグモイド形の関係に対応づける値に変えるための変換
    テーブルの各値を記憶する変換テーブル記憶手段と、前
    記変換テーブルで前記変換手段からの入力値を変換する
    テーブル変換手段と、前記テーブル変換手段からの複数
    個の入力値と第二の定数値とを特徴ベクトルとして記憶
    する特徴ベクトル記憶手段と、判定用辞書となる辞書行
    列を記憶する辞書行列記憶手段と、前記テーブル変換手
    段による前記特徴ベクトルと辞書行列との積の変換によ
    り得られるベクトルを評価ベクトルとして記憶する評価
    ベクトル記憶手段と、前記評価ベクトルの各要素である
    値を入力として最大値となる入力番号を検出する最大値
    検出手段と、前記最大値検出手段からの入力値である番
    号に対応する文字カテゴリ名を出力するカテゴリ出力手
    段と、文字カテゴリごとの初期特徴量を要素とするベク
    トルを学習ベクトルとして記憶する学習ベクトル記憶手
    段と、前記学習ベクトルの統計解析により前記特徴変換
    行列と辞書行列の各初期値を求める統計解析手段と、前
    記特徴変換行列と辞書行列の要素である各値を記憶する
    行列記憶手段と、前記学習ベクトルに対する特徴ベクト
    ルと評価ベクトルと正解カテゴリ名より前記特徴変換行
    列と辞書行列の要素である各値を前記行列記憶手段の記
    憶場所を用いて更新する制御手段とからなる辞書作成機
    能を備えた文字認識装置。
  2. 【請求項2】統計解析手段の統計解析に線形判別分析を
    用いることを特長とする請求項(1)記載の文字認識装
    置。
  3. 【請求項3】制御手段における値の更新にはバックプロ
    パゲーションによる学習を用いることを特長とする請求
    項(1)又は(2)記載の文字認識装置。
JP63097239A 1988-04-19 1988-04-19 認識辞書作成機能を備えた文字認識装置 Expired - Lifetime JP2701311B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63097239A JP2701311B2 (ja) 1988-04-19 1988-04-19 認識辞書作成機能を備えた文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63097239A JP2701311B2 (ja) 1988-04-19 1988-04-19 認識辞書作成機能を備えた文字認識装置

Publications (2)

Publication Number Publication Date
JPH01267789A JPH01267789A (ja) 1989-10-25
JP2701311B2 true JP2701311B2 (ja) 1998-01-21

Family

ID=14187062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63097239A Expired - Lifetime JP2701311B2 (ja) 1988-04-19 1988-04-19 認識辞書作成機能を備えた文字認識装置

Country Status (1)

Country Link
JP (1) JP2701311B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03186986A (ja) * 1989-12-15 1991-08-14 Sharp Corp ニューラルネットを用いた文字認識装置
JP4701518B2 (ja) * 2001-03-02 2011-06-15 日本電気株式会社 パターン認識装置、パターン認識方法及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"階層化判別法とその文字認識システムPC−OCR",信学技報、PRU86−76、PP.49−55
"階層化判別法による文字認識",信学技報、PRU87−20、PP.21−27

Also Published As

Publication number Publication date
JPH01267789A (ja) 1989-10-25

Similar Documents

Publication Publication Date Title
JP3118725B2 (ja) 自動分類方法
JP3088171B2 (ja) 自己組織型パタ−ン分類システム及び分類方法
US5490223A (en) Pattern recognition apparatus
CN110287873A (zh) 基于深度神经网络的非合作目标位姿测量方法、系统及终端设备
JP2010134957A (ja) パターン認識方法
CN112364974B (zh) 一种基于激活函数改进的YOLOv3算法
JPH02238588A (ja) 文字認識装置
CN113312989A (zh) 一种基于聚合描述子与注意力的指静脉特征提取网络
CN110781970A (zh) 分类器的生成方法、装置、设备及存储介质
Tavakoli Seq2image: Sequence analysis using visualization and deep convolutional neural network
CN108960005B (zh) 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统
JP2701311B2 (ja) 認識辞書作成機能を備えた文字認識装置
JP3537949B2 (ja) パターン認識装置及び同装置における辞書修正方法
CN113987188B (zh) 一种短文本分类方法、装置及电子设备
CN109886105B (zh) 基于多任务学习的价格牌识别方法、系统及存储介质
CN113837008A (zh) 硬度识别方法、装置、电子设备及存储介质
JPH01321591A (ja) 文字認識装置
Bidwai et al. Bird Classification using Deep Learning
JP2605338B2 (ja) 文字認識装置
Priyadharsini et al. Performance Investigation of Handwritten Equation Solver using CNN for Betterment
CN111915437B (zh) 基于rnn的反洗钱模型的训练方法、装置、设备及介质
JP3925011B2 (ja) パターン認識装置及び認識方法
JP2605337B2 (ja) 文字認識装置
JPH1063632A (ja) 大規模ニューラルネットワーク構築方法及び大規模ニューラルネットワーク構築装置及びニューラルネットワーク装置
JPH06274633A (ja) 特徴検出器生成装置および方法