JPH11345338A - パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体 - Google Patents

パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体

Info

Publication number
JPH11345338A
JPH11345338A JP10164437A JP16443798A JPH11345338A JP H11345338 A JPH11345338 A JP H11345338A JP 10164437 A JP10164437 A JP 10164437A JP 16443798 A JP16443798 A JP 16443798A JP H11345338 A JPH11345338 A JP H11345338A
Authority
JP
Japan
Prior art keywords
dictionary
pattern dictionary
eigenvectors
category
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10164437A
Other languages
English (en)
Inventor
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10164437A priority Critical patent/JPH11345338A/ja
Publication of JPH11345338A publication Critical patent/JPH11345338A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 カテゴリの分布を考慮したパターン辞書の作
成において,より小規模の辞書を取得し,利用可能にす
ること。 【解決手段】 カテゴリの分布を考慮したパターン辞書
を作成するパターン辞書作成装置において,学習対象で
ある特徴ベクトルを入力する入力部101と,入力部1
01で入力された特徴ベクトルから固有値と固有ベクト
ルをカテゴリ毎に求める主成分分析部102と,主成分
分析102で求めた固有ベクトルを量子化する量子化部
103と,量子化部103で得られた代表固有ベクトル
を始めとする辞書情報を辞書に書き込む出力部104
と,出力部104による辞書情報を格納する辞書105
と,を備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,カテゴリの分布を
表現する固有ベクトル(主成分)を利用するパターン辞
書作成装置およびパターン辞書作成方法,並びにパター
ン辞書作成方法をコンピュータに記録した機械読み取り
可能な記録媒体に関する。
【0002】
【従来の技術】従来より,本発明に関連する参考技術文
献が,情報処理学会論文誌(Vol.24 No.1,
pp106〜112,1983)から『手書き文字認識
における投影距離法』として開示されている。この投影
距離法では,特に,カテゴリを超平面で近似しようとす
るもので,その手段として,カテゴリ毎の分散共分散行
列から固有値問題を解くことによって得られる固有ベク
トル(主成分)を利用している。
【0003】また,上記の方法の他にも,カテゴリ毎の
固有ベクトルを利用する文字認識手法として,上述の文
献でも触れられている複合類似度法や,疑似マハラノビ
ス距離,疑似ベイズ識別関数などやそれらを改良した方
法などが知られている。このように,固有ベクトルを用
いてカテゴリ毎の分布をより正確に近似するという方法
が数多く存在する。
【0004】
【発明が解決しようとする課題】しかしながら,上記に
示されるような従来の技術にあっては,辞書サイズがき
わめて大きなものとなりやすく,例えば,本来が128
次元の特徴ベクトルを用いて1カテゴリを表現するため
の固有ベクトルは,1次元あたり2バイトとしても,1
28×128×2=32768バイトを要することにな
る。これは,各カテゴリの平均ベクトルや固有値を取り
除いた値であり,それらを含めるとさらに大きな値とな
ってしまう。このため,固有ベクトルをそのままの状態
で利用すると,辞書の規模が増大するという問題点があ
った。
【0005】本発明は,上記に鑑みてなされたものであ
って,カテゴリの分布を考慮したパターン辞書の作成に
おいて,より小規模の辞書を取得し,利用可能にするこ
とを目的とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めに,請求項1に係るパターン辞書作成装置にあって
は,カテゴリの分布を考慮したパターン辞書を作成する
パターン辞書作成装置において,学習対象である特徴ベ
クトルを入力する入力手段と,前記入力手段で入力され
た特徴ベクトルから固有値と固有ベクトルをカテゴリ毎
に求める主成分分析手段と,前記主成分分析手段で求め
た固有ベクトルを量子化する量子化手段と,前記量子化
手段で得られた代表固有ベクトルを始めとする辞書情報
を辞書に書き込む出力手段と,前記出力手段による辞書
情報を格納する格納手段と,を備えたものである。
【0007】また,請求項2に係るパターン辞書作成装
置にあっては,カテゴリの分布を考慮したパターン辞書
を作成するパターン辞書作成方法において,学習対象で
ある特徴ベクトル数を入力する第1の工程と,前記第1
の工程で入力された特徴ベクトルからカテゴリ毎に主成
分分析を求める第2の工程と,前記第2の工程で求めた
固有ベクトルを量子化する第3の工程と,前記第3の工
程で得られた代表固有ベクトルを始めとする辞書情報を
辞書に書き込む第4の工程と,を含むものである。
【0008】また,請求項3に係る機械読み取り可能な
記録媒体にあっては,請求項2に記載されたパターン辞
書作成方法をコンピュータに実行させるプログラムを記
録したものである。
【0009】
【発明の実施の形態】以下,本発明のパターン辞書作成
装置およびパターン辞書作成方法,並びにパターン辞書
作成方法を文字入力方法をコンピュータに記録した機械
読み取り可能な記録媒体について添付図面を参照し,詳
細に説明する。
【0010】(システムの構成)図1は,本発明の実施
の形態に係るパターン辞書作成装置の概略構成を示すブ
ロックである。図において,101は学習対象である特
徴ベクトルを入力する入力手段としての入力部,102
は入力部101で入力された特徴ベクトルから固有値と
固有ベクトルをカテゴリ毎に求める主成分分析手段とし
ての主成分分析部,103は主成分分析部102で求め
た固有ベクトルを量子化する量子化手段としての量子化
部,104は量子化部103で得られた代表固有ベクト
ルを始めとする辞書情報を辞書に書き込む出力手段とし
ての出力部,105は出力部104による辞書情報を格
納する格納手段としての辞書である。
【0011】(システムの動作)次に,以上のように構
成されたパターン辞書作成装置の処理動作について説明
する。図2は,本発明の実施の形態に係るパターン辞書
作成装置を用いたパターン辞書作成処理方法を示すフロ
ーチャートである。
【0012】図2において,処理が開始されると,ま
ず,入力部101により特徴ベクトル数を入力する(S
201)。ここで,特徴ベクトルの次元数をnとし,カ
テゴリ数をNとする。さらに,この入力された特徴ベク
トルからカテゴリ毎に主成分分析部102により主成分
分析を行う(S202)。なお,ここで固有ベクトルは
ノルムが1になるように正規化されているものとする。
【0013】この処理によって,1カテゴリについてn
個の固有値とn個の固有ベクトル(n次元)が得られる
ことになる。したがって,全体では(n×N)個の固有
値と(n×N)個の固有ベクトルが得られる。例えば,
nを128としてNを3000とすると,38400個
の固有ベクトルが得られることになる。ところが,この
ままでは,辞書サイズの増大をもたらすことになる。
【0014】そこで,固有ベクトルの個数を減らし,近
似的に小数個のもの(これを代表固有ベクトルという)
で代用することを考えられる。つまり,カテゴリ毎に個
別に持っている固有ベクトルを,カテゴリの垣根を取り
払って全カテゴリ間で共有する代わりに,その数を減ら
して近似的に表現することにより,精度を維持しながら
圧縮を行うものである。
【0015】固有ベクトルの圧縮には,通常のクラスタ
リング手法を用いればよい。換言すれば,クラスタリン
グにより代表固有ベクトルを抽出する(S203)。こ
こでは,得られた代表固有ベクトルの数をMとすると,
固有ベクトルは,すべて対応するクラスの代表固有ベク
トルによって代用されることになるので,本来は(n×
N)個の固有ベクトルが必要であったものが,M個の代
表ベクトルと(n×N)個のクラス識別子で済むことに
なる。このクラス識別子は,ベクトルではなくスカラー
であるため,十分な圧縮を行うことができる。
【0016】ステップS203で得られた代表固有ベク
トルを出力し,引き続いてカテゴリ毎にその平均ベクト
ルと固有値および代表固有ベクトルを識別するためのク
ラス識別子を求める(S204)。そして,これらの出
力により,カテゴリの平均ベクトル辞書情報の出力を実
行し(S205),一連の処理を終了する。また,認識
時にはクラス識別子を参照し,代表固有ベクトルを取り
出した上で必要な計算を行えばよい。
【0017】さて,本発明は上述した実施の形態の他に
ソフトウェアによっても実現することができる。本発明
をソフトウェアによって実現する場合におけるコンピュ
ータシステムの構成例を図3に示す。
【0018】図3において,301は入力インターフェ
イス,302は制御プログラムに基づいてシステム全体
を制御するCPU,303は記憶装置,304は補助記
憶装置,305は出力インターフェイス,306はCD
−ROMなどの記録媒体307を駆動するドライブであ
る。
【0019】以上のように構成されたコンピュータシス
テムにおいて,先に述べたパターン辞書作成方法のプロ
グラムをCD−ROMなどの記録媒体307にあらかじ
め記録しておく。そして,ドライブ306を通じて補助
記憶装置304に読み込む。CPU302は,補助記憶
装置304や記憶装置303との間で情報のやり取りを
行いながら,プログラムの各ステップを実行する。
【0020】
【発明の効果】以上説明したように,本発明に係るパタ
ーン辞書作成装置(請求項1)によれば,入力した学習
対象の特徴ベクトルからカテゴリ単位に固有値と固有ベ
クトル(主成分)を求め,その固有ベクトルを量子化
し,近似的に少数個の代表固有ベクトルを取得し,カテ
ゴリの卑近ベクトル辞書情報の出力を行うため,より小
規模なパターン辞書を作成するパターン辞書作成装置を
提供することができる。
【0021】また,本発明に係るパターン辞書作成方法
(請求項2)によれば,入力した学習対象の特徴ベクト
ルからカテゴリ単位に固有値と固有ベクトル(主成分)
を求め,その固有ベクトルを量子化し,近似的に少数個
の代表固有ベクトルを取得し,カテゴリの卑近ベクトル
辞書情報の出力を行うため,より小規模なパターン辞書
を作成するパターン辞書作成方法を提供することができ
る。
【0022】また,本発明に係る機械読み取り可能な記
録媒体(請求項3)によれば,請求項2に記載されたパ
ターン辞書作成方法をコンピュータに実行させるプログ
ラムを記録したことにより,請求項2の動作をコンピュ
ータによって実現することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るパターン辞書作成装
置の概略構成を示すブロックである。
【図2】本発明の実施の形態に係るパターン辞書作成装
置を用いたパターン辞書作成処理方法を示すフローチャ
ートである。
【図3】本発明の実施の形態に係るコンピュータシステ
ムの構成例を示すブロック図である。
【符号の説明】
101 入力部 102 主成分分析部 103 量子化部 104 出力部 105 辞書

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 カテゴリの分布を考慮したパターン辞書
    を作成するパターン辞書作成装置において,学習対象で
    ある特徴ベクトルを入力する入力手段と,前記入力手段
    で入力された特徴ベクトルから固有値と固有ベクトルを
    カテゴリ毎に求める主成分分析手段と,前記主成分分析
    手段で求めた固有ベクトルを量子化する量子化手段と,
    前記量子化手段で得られた代表固有ベクトルを始めとす
    る辞書情報を辞書に書き込む出力手段と,前記出力手段
    による辞書情報を格納する格納手段と,を備えたことを
    特徴とするパターン辞書作成装置。
  2. 【請求項2】 カテゴリの分布を考慮したパターン辞書
    を作成するパターン辞書作成方法において,学習対象で
    ある特徴ベクトル数を入力する第1の工程と,前記第1
    の工程で入力された特徴ベクトルからカテゴリ毎に主成
    分分析を求める第2の工程と,前記第2の工程で求めた
    固有ベクトルを量子化する第3の工程と,前記第3の工
    程で得られた代表固有ベクトルを始めとする辞書情報を
    辞書に書き込む第4の工程と,を含むことを特徴とする
    パターン辞書作成方法。
  3. 【請求項3】 請求項2に記載されたパターン辞書作成
    方法をコンピュータに実行させるプログラムを記録した
    ことを特徴とする機械読み取り可能な記録媒体。
JP10164437A 1998-05-29 1998-05-29 パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体 Pending JPH11345338A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10164437A JPH11345338A (ja) 1998-05-29 1998-05-29 パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10164437A JPH11345338A (ja) 1998-05-29 1998-05-29 パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH11345338A true JPH11345338A (ja) 1999-12-14

Family

ID=15793158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10164437A Pending JPH11345338A (ja) 1998-05-29 1998-05-29 パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH11345338A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009276937A (ja) * 2008-05-13 2009-11-26 Fujitsu Ltd 辞書作成装置、認識装置、認識方法及び認識プログラム
JP2010170352A (ja) * 2009-01-23 2010-08-05 Fujitsu Ltd パターン認識辞書作成装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009276937A (ja) * 2008-05-13 2009-11-26 Fujitsu Ltd 辞書作成装置、認識装置、認識方法及び認識プログラム
US8379983B2 (en) 2008-05-13 2013-02-19 Fujitsu Limited Dictionary creating apparatus, recognizing apparatus, and recognizing method
JP2010170352A (ja) * 2009-01-23 2010-08-05 Fujitsu Ltd パターン認識辞書作成装置及びプログラム

Similar Documents

Publication Publication Date Title
CN112633419B (zh) 小样本学习方法、装置、电子设备和存储介质
US10565759B2 (en) Global signatures for large-scale image recognition
US7054468B2 (en) Face recognition using kernel fisherfaces
CN110348214B (zh) 对恶意代码检测的方法及系统
US20040022442A1 (en) Method and system for face detection using pattern classifier
EP2304649B1 (en) Frame based video matching
CN113378710B (zh) 图像文件的版面分析方法、装置、计算机设备和存储介质
JP2018502407A (ja) 等高線マッピングから導き出される移植可能な等高線メトリックを使用する学習型等高線識別システム
US20230123941A1 (en) Multiscale Quantization for Fast Similarity Search
US8023742B2 (en) Local image descriptors using linear discriminant embedding
KR102234013B1 (ko) 클러스터 중심 기반 컨벡스 헐을 사용한 데이터 포인트 분류 방법 및 장치
KR20220122455A (ko) 영상 데이터에 포함된 객체 분할 방법 및 이를 수행하는 장치
JPH1131226A (ja) 情報処理方法及び装置
CN113221570A (zh) 基于线上问诊信息的处理方法、装置、设备及存储介质
CN111640438B (zh) 音频数据处理方法、装置、存储介质及电子设备
JPH11345338A (ja) パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体
CN109902162B (zh) 基于数字指纹的文本相似性的识别方法、存储介质及装置
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
CN112766423B (zh) 人脸识别模型的训练方法、装置、计算机设备及存储介质
CN111199170B (zh) 配方文件识别方法及装置、电子设备、存储介质
KR20210092546A (ko) 평행 초평면을 이용한 데이터 포인트 분류 방법 및 장치
Smiatacz et al. Local texture pattern selection for efficient face recognition and tracking
CN115147458B (zh) 目标跟踪方法、装置、电子设备及存储介质
CN111045687B (zh) 一种人工智能应用的部署方法及相关装置
US20230281477A1 (en) Framework system for improving performance of knowledge graph embedding model and method for learning thereof