JPH07282258A

JPH07282258A - サイン認識装置

Info

Publication number: JPH07282258A
Application number: JP6073400A
Authority: JP
Inventors: Kenzo Obata; 賢三小幡; Takeshi Furuhashi; 武古橋; Shigeru Watanabe; 成渡辺; Yoshiki Uchikawa; 嘉樹内川
Original assignee: NipponDenso Co Ltd
Current assignee: Denso Corp
Priority date: 1994-04-12
Filing date: 1994-04-12
Publication date: 1995-10-27
Also published as: US5553156A

Abstract

(57)【要約】【目的】学習時における入力者の負担を軽減させ、同
時に学習時間を短縮させる機能を備えたサイン認識装置
を提供すること。【構成】本発明のサイン認識装置２０１は、主に、入
力手段２０２と、特徴抽出手段２０３と、サンプル発生
手段２０４と、ファジィネット手段２０９と、学習制御
手段２１５とから構成されており、サンプル発生手段２
０３が複数のサンプルデータを自発的に生成し、この生
成されたサンプルデータに基づいて、結合荷重係数を決
定するため、手書サインを登録希望するユーザの手間を
減少させることができる。また、ファジィネット手段２
０９内の出力層２１１には、学習時において、内部関数
として線形関数が設置されており、通常のニューラルネ
ットに使用される非線形関数（シグモイド関数）に比
べ、学習に要する時間を短縮することができるという優
れた効果がある。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明はニューラルネットの学
習、認識機能を利用したサイン認識装置に係り、詳細に
は、手書サインの特徴に応じて、正例（真サイン）及び
負例（偽サイン）を生成し、この生成した正例及び負例
に基づいて、ニューラルネットの学習を行うサイン認識
装置に関するものである。

【０００２】

【従来の技術】従来、ニューラルネットの学習、認識機
能を利用したサイン認識装置においては、図１０に示す
構成のものがある。図１０において、サイン認識装置１
０１は、手書サインを入力する入力手段１０２と、その
特徴を抽出する特徴抽出手段１０３と、ニューラルネッ
トにより文字を認識するニューラルネット手段１０４
と、文字認識を自動獲得する学習手段１０５と、学習に
よって得られた結合荷重係数αを保持する係数記憶手段
１０６と、ニューラルネット手段１０４からの出力結果
を表示する表示手段１０７とから構成されている。

【０００３】さらに詳細に説明すると、サイン認識装置
１０１においては、文字の形状の他に、筆圧、筆速等の
様々な情報を取り込んで手書サインを認識するオンライ
ン認識装置と、文字の形状のみを取り込んで手書サイン
を認識するオフライン認識装置とがある。まず、オンラ
イン認識装置に利用される入力手段１０２は、リアルタ
イムな手書サインデータを取り込む必要性からタブレッ
ト、あるいはディジタイザのようなものが使用され、筆
跡や筆圧情報が取り出せる構成となている。そして、こ
の入力手段１０２の出力は、特徴抽出手段１０３に接続
されており、この特徴抽出手段１０３は、入力手段１０
２からの出力をフーリエ変換及びスペクトル分析して、
ニューラルネット手段１０４に出力する。一方、オフラ
イン認識装置に利用される入力手段１０２は、ファクシ
ミリに代表されるようなイメージスキャナ装置が使用さ
れ、文字の形状を取り出すことができる構成となってい
る。また、特徴抽出手段１０３は、ストローク密度を求
める仕組になっており、その求めた結果をニューラルネ
ット手段１０４に出力する。

【０００４】次に、ニューラルネット手段１０４は、３
層構造のＢＰ（バックプロパゲーションモデル）が使用
されることが多く、ニューラルネットとは、その構成単
位であるニューロンの入出力がネットワークを構成した
ものである。そして、通常１つのニューロンは、複数の
結合荷重係数αと入力信号ｉの積の総和をシグモイド関
数で変換したものを出力としているため、実際には積和
演算となり、マイクロコンピュータやＤＳＰ（デジタル
シグナルプロセッサ）等のデバイスや専用プロセッサ等
で実現されている。

【０００５】また、学習手段１０５は、上記ニューラル
ネット手段１０４に学習を行わせるためのフィードバッ
クループを能動的に制御するためのものであり、１つの
方法としては、出力信号が期待値に対して最も誤差が少
なくなるように、１部あるいは全部の結合荷重係数αを
変化させ、結合荷重係数αがある値に収束するように制
御している。そして、こうした方法としては勾配法がよ
く知られている。なお、学習が行われたニューラルネッ
トは、それ自体に認識機能を有するため、一旦学習が行
われたならば、認識時には学習手段１０５が切り離され
ることが多い。また、学習によって得られた結合荷重係
数αは、係数記憶手段１０６に記憶保持されることにな
る。

【０００６】さらに、表示手段１０７は、ＬＣＤ（液晶
ディスプレイ）やＣＲＴ（ブラウン管）あるいはＬＥＤ
（発光ダイオード）等が使用され、認識結果の表示や操
作を円滑に行うためのガイダンス等の表示を行う。次に
上記構成の作用について簡単に説明する。まず、オンラ
イン認識装置の場合は、手書サインが入力手段１０２に
よってディジタイズされ、リアルタイムに取り込んでい
ることから、連続する座標データや筆圧データが得られ
る。こうして得られた連続するサインデータは、特徴抽
出手段１０３によってフーリエ変換がなされ、スペクト
ル分析が行われることで、手書サインの特徴をスペクト
ル分布と強度という形で表される。一方、オフライン認
識装置の場合は、イメージスキャナに取り込まれたデー
タのＸＹマップを多方面から走査し、データの存在する
量（ストローク密度）を求めることで、ストローク密度
を手書サインの特徴として捕らえる。

【０００７】そして、これら手書サインの特徴としての
データは、ニューラルネット手段１０４を介して学習手
段１０５によって学習がなされ、ニューラルネット手段
１０４の結合荷重係数αが定まってゆく。一方、認識時
には、学習手段１０５がニューラルネット手段１０４か
ら切り離され、ニューラルネット手段１０４が持つシグ
モイド関数にしたがって０〜１の値を出力し、この値が
大きいほど学習されたパターンに近い情報が入力された
ことになる。そして、こうして認識された結果は、表示
手段１０７によって表示されるか、あるいは同認識結果
を他のコンピュータ等に信号として伝達される場合があ
る。

【０００８】なお、以上の説明したように、ニューラル
ネット手段１０４は、１回の学習では１つの入力認識し
か行えない。そのため、係数記憶手段１０６によって様
々なパターンを記憶しておき、必要に応じて他の学習パ
ターンを呼び出したりすることで、様々なパターンに対
応している。また、オンライン認識装置とオフライン認
識装置の場合について説明したが、これは基本的には入
力手段１０２の違いと特徴抽出手段１０３におけるデー
タ処理の違いだけであり、その他の手段については同じ
ものであると考えてよい。（但し、ニューラルネットに
おける結合荷重係数αの持つ意味は異なる）

【０００９】

【発明が解決しようとする課題】ところが上述した従来
のものでは、１つのパターンを学習させる際に、少数の
正例（真のサイン）と複数の負例（偽のサイン）を学習
させねばならない。特に手書サインというものを認識さ
せるためには、本人のサインを登録するときの状態によ
ってサインの筆記状態がばらつく（文字変形が生じる）
ため、正例さえも５〜１０パターン程度の学習が必要で
あり、負例にいたってはその５〜１０倍程度の学習が必
要になる。もちろん、正例１、負例１パターンの学習の
みでも差し支えない。しかし、例えば「正例」と認識す
る場合、サインの変形具合の許容値が小さいものとなっ
てしまい、本人のサインであっても正しく認識しない恐
れがある。しかしながら、より正確に認識をさせるため
に学習させるには、多くの正例と負例のパターンを入力
して学習させる必要がある。また、学習手段について
は、一般に最急降下法による学習のため、学習終了まで
に多大な時間を必要とする。以上のように、手書サイン
を学習登録させる場合には、幾つもの正例や負例を必要
とし、また、それを学習させるのに事例数に比例した時
間を必要とする問題がある。

【００１０】そこで本発明は上記問題点に鑑みてなされ
たものであり、自動的に複数の正例と負例パターンを発
生させることで、学習時における入力者の負担を軽減さ
せるとともに、ニューラルネットにおける学習時間を短
縮させる機能を持たせることである。

【００１１】

【課題を解決するための手段】そのため、上記課題を達
成するために本発明に係るサイン認識装置は、手書され
た手書サインを取り込み、この取り込んだ手書サインに
対応した手書データを出力する入力手段と、この入力手
段から出力された前記手書データから特徴を抽出し、そ
の抽出した特徴から特徴手書データを出力する特徴抽出
手段と、前記特徴手書データを取り込み、この取り込ん
だ特徴手書データに対し、各々異なる所定係数を掛け合
わせることによって、本人の真の手書サインに相当する
真のサンプルデータ及び本人の真の手書サイン以外に相
当する偽のサンプルデータをそれぞれ複数生成するサン
プル発生手段と、本人の真の手書サインであるか否かに
対応して教師信号を出力する学習制御手段と、前記サン
プル発生手段で複数生成された前記サンプルデータを取
り込み、このサンプルデータと前記教師信号とを比較す
ることで、より好ましい結合荷重係数を学習し、この学
習によって決定した結合荷重係数に基づいて、新たに入
力された手書サインの特徴手書データが、前記本人の真
の手書サインであるか否かを判断するニューラルネット
手段とを採用するものである。

【００１２】また、本発明のサイン認識装置は、手書さ
れた手書サインを取り込み、この取り込んだ手書サイン
に対応した手書データを出力する入力手段と、この入力
手段から出力された前記手書データから特徴手書データ
を抽出し、その特徴手書データを出力する特徴抽出手段
と、本人の真の手書サイン及び真の手書サイン以外のサ
インに対応した教師信号を出力する学習制御手段と、前
記特徴手書データを取込み、この取込んだ特徴手書デー
タを所定の内部関数に基づいて演算する出力層を有し、
この出力層で演算されたデータと前記教師信号とを比較
することで学習し、この学習によって新たに入力された
手書サインの特徴手書データが、前記本人の真の手書サ
インであるか否かを判断するニューラルネット手段とを
備えたサイン認識装置において、前記ニューラルネット
手段が、前記学習を行う場合には、前記出力層の前記内
部関数を線形関数とし、前記新たに入力された手書サイ
ンの特徴データが前記本人の真のサインであるか否かを
判断する場合には、前記出力層の前記内部関数を非線形
関数に切り換えるように設定されている。

【００１３】

【作用および発明の効果】上記のサイン認識装置による
と、サンプル発生手段が、特徴抽出手段にて抽出された
特徴手書データを取り込み、この取り込んだ特徴手書デ
ータに所定係数を掛け合わせることによって、少しずつ
値の異なる複数のサンプルデータを生成する。そして、
ニューラルネット手段は、この生成された複数のサンプ
ルデータを取り込むことで学習し、この学習によって結
合荷重係数を決定する。さらに、このニューラルネット
手段は、上記決定した結合荷重係数に基づいて、今回入
力された手書サインが、前回取り込んだ本人の真のサイ
ンと同じであるか否かを判断する。つまり、ニューラル
ネット手段が学習する場合、サンプル発生手段がないの
であれば、手書サインを登録希望する本人が、何度も入
力手段に手書サインを入力しなければならないが、サン
プル発生手段が構成されているおかげで、自発的に複数
のサンプルデータが生成され、ニューラルネット手段が
学習していくため、手書サインを登録希望する本人の手
間を、減少させることができるという優れた効果があ
る。

【００１４】また、上述のサイン認識装置によると、ニ
ューラルネット手段が学習を行う場合には、出力層の内
部関数を線形関数（例えばＹ＝αＸ）としたうえで結合
荷重係数を決定し、この結合荷重係数を決定することに
より、本人の真のサインであるか否かを分離するための
境界域を設定する。そこで、この設定された境界域に対
応するように、例えば、非線形関数（例えばシグモイド
関数）を出力層に設置する。そして、この非線形関数が
出力層に設置された状態で、新たに入力されたサイン
が、本人の真のサインであるか否かの判断を行う。つま
り、学習時には、出力層の内部関数を線形関数とし、本
人の真のサインであるか否かを判断を行う認識時には、
出力層の内部関数を非線形関数として内部関数を置き換
えている。そして、通常、学習時において、出力層に設
定される内部関数は、線形関数であるほうが非線形関数
（シグモイド関数）であるよりも、本人の真のサインで
あるか否かを分離するための境界域を設定するうえで必
要とされる時間が短くて済む。したがって、上述のサイ
ン認識装置は、学習時に必要とされる時間を短縮するこ
とができる。

【００１５】

【実施例】以下、本発明を図に示す実施例に基づいて説
明する。図１は本発明の一実施例を表す構成図である。
図１において、サイン認識装置２０１は、大きく分けて
主に、ユーザの手書サインを取り込む入力手段２０２
と、その手書サインの特徴を抽出する特徴抽出手段２０
３と、自発的に上記手書サインのサンプルを生成するサ
ンプル発生手段２０４と、２層の単純パーセプトロン
（Ｐｅｒｃｅｐｔｏｒｏｎ）構成を使用したファジィネ
ット手段２０９と、このファジィネット手段２０９に学
習を行わせるため、フィードバックループを能動的に制
御するための学習制御手段２１５と、認識結果の表示や
操作を円滑に行うためのガイダンス等の表示を行う表示
手段２１６とから構成されている。

【００１６】さらに詳細に説明すると、入力手段２０２
においては、オンラインによるサイン認識装置として使
用する場合、リアルタイムな手書サインデータを取り込
む必要性からタブレット、あるいはディジタイザのうよ
うなものが使用され、筆跡や筆圧情報が取り出せる構成
になっている。一方、オフラインによるサイン認識装置
として使用する場合、入力手段２０２は、ファクシミリ
に代表されるようなイメージスキャナ装置が使用され、
文字の形状を取り出せる構成になっている。なお、いず
れの場合においても、入力手段２０２の出力は、特徴抽
出手段２０３に接続されており、この入力手段２０２に
取り込まれた手書データは、特徴抽出手段２０３に入力
されることになる。

【００１７】次に、上記特徴抽出手段２０３は、オンラ
インによる認識装置の場合、手書サイン入力によるデー
タの座標マッピング以外に、筆跡速度や筆圧情報のよう
なリアルタイムな連続データを取り込む。このとき、こ
の特徴抽出手段２０３は、フーリエ変換によって手書サ
インのスペクトラム分布と強度の情報を得る。なお、オ
ンラインによる特徴抽出の場合、このスペクトラム分布
と強度の情報を得ることは、手書サインの個人的特徴を
検出するうえで効率が良い。一方、オフラインによる認
識装置の場合、特徴抽出手段２０３は、入力手段２０２
から取り込んだ手書データを一旦メモリに記憶する。こ
のとき、メモリ内に記憶される手書データは、２次元上
のマップに配置されるように設定される。このとき、特
徴抽出手段２０３は、２次元上のマップに記憶された手
書データを多方面からアクセスし、データの存在個数を
求めることによりストローク密度を求める。なお、オフ
ラインによる特徴抽出の場合は、こうしたサインのスト
ローク密度を求めることが、手書サインの個人的特徴を
検出するうえで効率が良い。そして、以上のようにし
て、特徴抽出手段２０３にて得られた手書サインの情報
は、この特徴抽出手段２０３の出力側に接続された切換
手段２１８を介してサンプル発生手段２０４に取り込ま
れる。

【００１８】次に、サンプル発生手段２０４は、ランダ
ム係数発生手段２０５と、振れ幅選択発生手段２０６
と、掛け算手段２０７と、第１の記憶手段２０８とから
構成されており、学習手段２１５からの制御信号を取り
込むとともに、特徴抽出手段２０３からの出力信号を取
り込んで、正例（本人のサイン）、負例（本人以外のサ
イン）のサンプルを生成している。

【００１９】さらに詳細に説明すると、ランダム係数発
生手段２０５の出力は、振れ幅選択手段２０６に接続さ
れており、この振れ幅選択手段２０６は、ランダム係数
発生手段２０５から出力されるランダムな数値を、例え
ば、正例のサンプル（本人のサイン）を生成する場合に
は最大振幅値を基準にして振れ幅を５％以内に制限する
数値を選択する。一方、負例のサンプル（本人以外のサ
イン）を生成する場合には最大振幅値を基準にして振れ
幅を２０％〜２５％以内に制限する数値を選択する。そ
れ以外の場合（２５％を越える場合あるいは６〜１９％
の場合）には、そのランダムな数値を無効として使用し
ないというように、それぞれランダムな数値を状況に合
わせて選択している。さらに、振れ幅選択手段２０６の
出力に接続された掛け算手段２０７は、前述した特徴抽
出手段２０３から出力される手書サインの情報と上記振
れ幅選択手段２０６から出力されるランダム係数とを掛
け合わせ、人為的に複数のサンプルを生成するものであ
る。そして、この生成された複数のサンプルは、第１の
記憶手段２０８に出力され、第１の記憶手段２０８にお
いて逐次記憶されることになる。

【００２０】次に、ファジィネット手段２０９は、ファ
ジィ推論部（入力層を含む）２１０と、出力層２１１
と、比較部２１２と、係数積算部２１３とから構成され
ており、入力層から出力層２１１に一方向に向かってデ
ータに重み係数（結合荷重係数）を掛ける、２層Ｐｅｒ
ｃｅｐｔｏｒｏｎ構成を採用したファジィネットであ
る。なお、上記入力層はメンバシップ関数を内部関数に
持つファジィ化手段から成り、出力層２１１は推論規則
が設定された構成であることを特徴としている。さら
に、図１及び図２に基づいて詳細に説明すると、このフ
ァジィ推論部２１０は、その入力層にファジィ推論器３
０１が構成されており、このファジィ推論器３０１は、
図２に示すようなＳｍａｌｌ、Ｂｉｇの２つのルールか
らなるメンバーシップ関数を内部関数に有する。そし
て、入力層から取り込んだデータを、上記２つのメンバ
ーシップ関数の入力として、各々のメンバーシップ関数
に対応したグレード値を演算する。さらに、ファジィ推
論器３０１の出力側には、乗算手段３０２が構成されて
おり、この乗算手段３０２は、ファジー推論器３０１か
ら出力されたグレード値に結合荷重係数Ｗijを掛け合わ
せる演算を行う。また、乗算手段３０２の出力は、加算
手段３０３に接続されており、この加算手段３０３は、
各々の乗算手段３０２からの出力結果の総和を演算し、
出力層２１１に出力するよう構成されている。

【００２１】次に、出力層２１１においては、内部関数
が設定されており、ファジィ推論部２１０から出力され
てくる信号を、上記内部関数に応じて演算処理し、その
結果を比較部２１２に出力するように構成されている。
さらに、この比較部２１２は、出力層２１１の出力及び
学習制御手段２１５の出力がそれぞれ接続された構成で
あり、出力層２１１の出力信号及び学習制御手段２１５
からの教師信号を取り込んで、これらの差分を演算す
る。また、係数積算部２１３は、比較部２１２から出力
されてくる信号を取り込み、この取り込んだ信号に基づ
いて、結合荷重係数Ｗijの更新量を計算し、その更新量
を順次加算して、その加算した総和をファジィ推論部２
１０内部の乗算部３０２に出力する構成になっている。

【００２２】また、第２の記憶手段２１４は、学習時の
場合、決定された結合荷重係数Ｗijを、手書サインを登
録したユーザごとに記憶保持し、認識時の場合、学習制
御手段２１５からの信号に応じて学習時に記憶保持され
た結合荷重係数Ｗijを読出し、その読出した結合荷重係
数Ｗijをファジィネット手段２０９に出力する構成にな
っている。

【００２３】学習制御手段２１５は、振れ幅選択手段２
０６、第１の記憶手段２０８、比較部２１２、第２の記
憶手段２１４のそれぞれを、例えば、正例、負例を一致
させて制御しており、詳細については後述する。表示手
段２１６は、例えば、液晶表示器やＣＲＴが用いられる
ものであり、この実施例においては、手書データが本物
であるか偽物であるかの判定結果、あるいは、入力した
手書データを再生曲線として再生画像等を表示する。ま
た、ＩＤ入力手段２１７は、例えば、キーボード等の入
力手段である。

【００２４】切換手段２１８は、特徴抽出手段２０３と
サンプル発生手段２０４との間に設けられ、学習時には
サンプル発生手段２０４に手書データを伝達し、認識時
にはファジィネット手段２０９に手書データを伝達する
構成であり、サンプル発生手段２０４を接続したり、切
り離したりする作動を行っている。なお、上述した特徴
抽出手段２０３、サンプル発生手段２０４、ファジィネ
ット手段２０９、第２の記憶手段２１４、学習制御手段
２１５、のそれぞれは、ＣＰＵ２１９のプログラムによ
り制御され、動作が実現される。

【００２５】次に、以上のように構成されたサイン認識
装置においては、（１）学習モード、（２）認識モード
の２つの動作モードからなり、学習モードの動作後、認
識モードに移り、サイン認識装置として動作する。そこ
で、２つの動作モードについて各々以下に説明する。（１）学習モード学習モードにおける全体作動について、図３に示すフロ
ーチャートに基づき説明する。なお、図３はＣＰＵ２１
９の作動を示すフローチャートである。

【００２６】まず、ステップ１００においては、サイン
を登録希望するユーザがＩＤ（個人認識）コードをＩＤ
入力手段２１７から入力し、これによってＩＤ入力手段
２１７から発生するＩＤコード信号を取り込む。なお、
このＩＤ入力の処理は、登録を希望したユーザと、以下
の処理で入力される手書データとを、動作処理上で一致
させるための登録番号（ラベル）付与として機能する。

【００２７】ステップ１１０においては、ＩＤコードを
入力したユーザが入力手段２０２を使用して手書による
サインを行うことによって、入力手段２０２が手書サイ
ンに応じた手書データを出力する。ステップ１２０にお
いては、特徴抽出手段２０３が、入力手段２０２から出
力された手書データを取り込む。このとき、特徴抽出手
段２０３は、取り込んだ手書データから特徴部分を抽出
し、この抽出した各特徴部分を特徴手書データとして出
力する。なお、この特徴抽出手段２０３の詳細な作動に
ついては後述する。

【００２８】ステップ１３０においては、サンプル発生
手段２０４が、特徴抽出手段２０３から出力された特徴
手書データを取り込む。ここで、サンプル発生手段２０
４は、取り込んだ特徴手書データに基づいて、正例（本
人のサイン）、負例（本人以外のサイン）のサンプルを
自発的に生成し、この生成したサンプル情報を第１の記
憶手段２０８に逐次記憶させる。なお、このサンプル発
生手段２０４の詳細な作動についても後述する。

【００２９】ステップ１４０においては、ファジィネッ
ト手段２０９が、ステップ１３０にて逐次記憶されてい
た特徴手書データを取り込む。これにより、ファジィネ
ット手段２０９は、取り込んだ特徴手書データから個人
的な特徴を学習していき、正例（本人のサイン）、負例
（本人以外のサイン）の判断条件として必要な境界線を
得ることになる。なお、詳細な作動については後述す
る。

【００３０】ステップ１５０においては、第２の記憶手
段２１４が、ファジィネット手段２０９により決定され
た判断条件のデータを、前述したＩＤ（個人認識）コー
ドと共に記憶する。以上の作用によって、特定のＩＤコ
ードに対応した手書サインの学習がなされるが、次に、
上述した各々の詳細な作動について説明する。

【００３１】まず、ステップ１２０、すなわち特徴抽出
手段２０３の詳細な作動について説明する。図４は、特
徴抽出手段２０３の作動を示すフローチャートである。
なお、この作動の説明については、オフラインによる特
徴抽出（詳細には、特徴線分抽出法）の場合について説
明する。ステップ２００においては、入力手段２０２か
ら取り込んだ手書データをメモリ（図示されていない）
内に、１，０（点がある、ない）の画素情報として一時
的に記憶し、ここから細線化により線分情報を抽出す
る。このとき、上下左右各方向から画素情報を走査し、
この走査の際に生じる手書サインの影を、細線化情報と
して取り出している。なお、この細線化する手法は、デ
ータが簡単化されるため計算時間が少なくてすみ、かつ
手書サインの個人性特徴をほぼ保持できる。

【００３２】ステップ２１０においては、細線化して得
られた画像データから図５（ａ）に示すように端点を検
出し、端点から端点までを１つの線分として、線分デー
タを取り出す。ステップ２２０においては、この線分デ
ータに前述したＩＤコードを付加することによって、線
分データのラベリングを行う。

【００３３】ステップ２３０においては、細線化によっ
て得られた線分データから、次の要素を取り出す。取り
出す要素としては、重心位置（Ｘ，Ｙ）、長さ
（Ｌ）、曲がり（Ｓ_top，Ｓ_bottom）、傾き（θ）
等のパラメータである。ここで、曲がりは図５（ｂ）に
示すように線分の各端点を結ぶ直線ｌと線分データが囲
む面積により定義する。また、傾きθは、線分ｌと水平
線とのなす角度である。

【００３４】ステップ２４０においては、上記パラメー
タを以下の手法により正規化する。まず、重心の位置
Ｘ，Ｙは、それぞれ細線化して得られた手書サインの左
右・上下の幅（図５（ａ）；Ｘ_left〜Ｘ_right，Ｙ_top
〜Ｙ_bottom）で正規化し、長さＬは、その手書サインの
最大値（Ｌ_max）で正規化してそれぞれＸ，Ｙ，Ｌと表
す。また、曲がりは線分ｌの一部ａを斜辺にもつ直角二
等辺三角形（図５（ｂ）参照）の面積Ｓ_triangleで正規
化し、Ｓ_top，Ｓ_bottomとする。傾きは、−π／２〜π
／２で正規化し、θと表す。以上の処理により、１つの
線分データからの６つのパラメータ（Ｘ，Ｙ，Ｌ，Ｓ
_top，Ｓ_bottom，θ）を得ることができる。

【００３５】ステップ２５０においては、正規化が行わ
れた各要素の中から、ニューラルネットワークの規模に
応じて使用するものを選択する。これは、全てのパラメ
ータを認識に用いれば、高い認識率が得られることが期
待できるが、ニューラルネットワークの規模自体が大き
くなってしまうため、本実施例においては、このパラメ
ータの中から選択して使用する。

【００３６】次に、ステップ１３０、すなわちサンプル
発生手段２０４の詳細な作動について説明する。図６
は、サンプル発生手段２０４の作動を示すフローチャー
トである。まず、ステップ３００においては、特徴抽出
手段２０３から出力される特徴手書データ（特徴要素Ｉ
ｎ）を取り込む。これにより、ステップ３１０に移行
し、以下の処理を開始する。すなわち、学習制御手段２
１５からの制御信号に基づいて、正例（本人のサイ
ン）、負例（本人以外のサイン）のサンプルを自発的に
生成する処理を開始する。

【００３７】ステップ３１０においては、ランダム係数
発生手段２０５によって、乱数を発生させる。なお、こ
の乱数は、上記特徴手書データに掛け合わす係数であ
る。ステップ３２０においては、ランダム係数発生手段
２０５にて発生された乱数が振幅選択手段２０６に取り
込まれる。さらに、学習制御手段２１５からの制御信号
に基づいて、例えば、正例のサンプル生成の場合には、
振れ幅を最大振幅値の５％以内に制限する乱数を選択、
一方、負例のサンプル生成の場合には、振れ幅を最大振
幅値の２０〜２５％以内に制限する乱数を選択、という
ように振幅選択手段２０６に上記乱数の選択をさせる。
このとき、正例として処理する場合にはステップ３３０
に移行し、負例として処理する場合にはステップ３４０
に移行する。

【００３８】続いて、ステップ３３０においては、掛け
算手段２０７によって、振幅選択手段２０６にて選択さ
れたランダム係数（最大振幅値の５％以内に制限する係
数）と、特徴抽出手段２０３から取り込んだ特徴手書デ
ータとを取り込ませ、ランダム係数と特徴手書データと
を掛け合わせる。一方、ステップ３４０においては、負
例に対応したランダム係数（最大振幅値の２０〜２５％
以内に制御する係数）と特徴手書データとを掛け合わせ
る。

【００３９】ステップ３５０においては、ステップ３３
０、３４０にて掛け合わされた結果に対応した正例、負
例のサンプルデータを、第１の記憶手段２０８に逐次記
憶する。さらに、ステップ３６０においては、正例、負
例のサンプルデータが、必要とされるサンプルの個数分
あるか否かを判定し、必要個数分があると判定されるま
で、ステップ３１０〜３６０の処理を繰り返す。

【００４０】以上の処理を実行することによって、ユー
ザによる１つの手書サイン入力に対し、例えば、正例、
負例の発生を異なった係数で５回ずつ掛け合わせれば、
１０回分の手書サイン入力を行ったことと同じになる。
なお、ランダム係数を選択するうえで、例えば、正例の
サンプル生成の場合は振れ幅を最大振幅値の５％以内に
制限する乱数、一方、負例のサンプル生成の場合は振れ
幅を最大振幅値の２０〜２５％以内に制限する乱数とい
うように設定したが、これに限るものではない。しかし
ながら、乱数を設定する最低限の条件として、正例の係
数と負例の係数との間の設定値（例えば上述した実施例
であれば、６〜１９％の係数）は、本人及び本人以外を
判断するうえであいまいになるため採用しない。また、
著しく本人の手書サインと異なる場合（上述した実施例
であれば、２５パーセントより大きいランダム係数）
は、記憶しても判断するうえで無意味なため採用しな
い。

【００４１】次に、ステップ１４０、すなわちファジィ
ネット手段２０９の詳細な作動について説明する。な
お、このときの作動は、学習時の作動であって、本人及
び本人以外を判定する際の結合荷重係数Ｗijの設定に関
する処理である。図７は、ファジィネット手段２０９の
作動を示すフローチャートである。まず、ステップ４０
０においては、初期設定として結合荷重係数Ｗijをラン
ダムな数値に設定する。

【００４２】その後、ステップ４１０においては、第１
の記憶手段２０８に逐次記憶されていたサンプルデータ
を、ファジィネット手段２０９の入力層、すなわちファ
ジィ推論部２１０に取り込み、以下のようなファジィ推
論を行う。まず、このファジィ推論とは、同一人物でも
書く度に微妙に異なる手書サインのブレを吸収させるた
めに行われる処理であり、本実施例では、図２に示され
るファジィネットの構成を採用した。図２に示されるよ
うに、このファジィネットは、サンプルデータの各々の
パラメータ、例えば、重心位置、長さ、曲がり、傾き
（Ｘ，Ｙ，Ｌ，Ｓ_top，Ｓ_bottom，θ）をネットの入力
部Ｄ0 〜Ｄm から取り込み、この取り込んだサンプルデ
ータをファジィ推論器３０１に設定したＢｉｇ，Ｓｍａ
ｌｌの２つのルールからなるメンバーシップ関数の入力
として、各々に対応したグレード値を演算する。これに
よって、例えば、入力が０．８だったとして、Ｂｉｇで
あれば０．８＋ａ（ａ＞０）なる値を持ち、Ｓｍａｌｌ
であれば０．８−ｂ（ｂ＞０）なる値を持つことにな
る。これによって、０．８という入力値を中心値とし
て、ある所定の振幅（ａ＋ｂ）を持った形で演算処理が
行われる。そのため、同一人物でも書く度に微妙に異な
る手書サインのブレを吸収させることができる。次に、
この演算した双方のグレード値を乗算手段３０２に入力
し、双方のグレード値に結合荷重係数Ｗijを掛け合わせ
る。そして、加算手段３０３においては、その総和を演
算した後、出力ユニットである出力層２１１に伝送す
る。ここで、出力層２１１は、予め設定された内部関
数、例えば、Ｙ＝αＸ（０．０≦Ｘ≦１．０）なる線形
関数に基づいて、上述した正例及び負例に応じたデータ
値（０．０〜１．０）を演算し、この演算結果を比較部
２１２に入力する。

【００４３】以上の処理により、一般に従来技術として
使用される非線形関数（シグモイド関数等）に比べ、上
述したような線形関数は、正例及び負例に分割するうえ
で短時間で境界域を決定することができる。その理由を
以下に説明すると、学習時の初期設定として結合荷重係
数Ｗijはランダムな数値に設定されており、この状態で
結合荷重係数Ｗijが上述した正例、負例に応じたデータ
値（０．０〜１．０）に掛け合わされた場合、出力層２
１１に伝送されるデータ値は、図９８（ａ）に示される
シグモイド関数のｘ軸上で、一様にバラツキが生じる。
例えば、シグモイド関数のｘ軸上に設定されるデータ値
は、正例であったとしても０付近に設定されたり、負例
であったとしても１付近に設定されたりする。そして、
これらのデータ値は、結合荷重係数Ｗijが学習により変
化することで、いずれは正例であれば１付近、負例であ
れば０付近というように分けられる。しかしながら、図
９（ａ）に示されるようなシグモイド関数においては、
本発明のようなＹ＝αＸなる線形関数に比べ、０および
１付近にプレッシャが掛かっている（０および１付近の
変化量が小さい）。そのため、例えば、初期状態におい
て正例のデータ値が０付近に設定された場合、学習によ
って正例のデータ値を１付近まで変化させるまでに、そ
の変化量は、Ｙ＝αＸなる線形関数の方がシグモイド関
数に比べ少ない変化量ですむ。したがって、一般に従来
技術として使用される非線形関数（シグモイド関数等）
に比べ、本発明のような線形関数は、学習時において正
例及び負例に分割するうえで短時間で境界域を決定する
ことができる。

【００４４】次に、ステップ４２０においては、学習制
御手段２１５によって、もう１つの入力データである教
師信号Ｔ（正例の場合：１．０、負例の場合：０．０）
を、比較部２１２に与える。なお、この教師信号Ｔは、
前記第１の記憶手段２０８に逐次記憶されている正例、
負例のデータの出力に対応したものとなっている。即
ち、第１の記憶手段２０８から取り込んだサンプルデー
タが正例であれば、学習制御手段２１５から出力される
信号も正例の教師信号Ｔ（１．０）であり、取り込んだ
サンプルデータが負例であれば、学習制御手段２１５か
ら出力される信号も正例の教師信号Ｔ（１．０）である
ということである。

【００４５】ステップ４３０においては、比較部２１２
によって、出力層２１１からの出力と教師信号Ｔとの差
分が演算され、この差分が係数積算部２１３に入力され
る。ステップ４４０においては、係数積算部２１３によ
って、比較器２１２からの出力を用いてデルタルールに
より、結合荷重係数Ｗijの更新量を計算し、その更新量
を順次加算していく。なお、この結合荷重係数Ｗijの更
新量を決めるデルタルールは以下に示す数式１で表され
る。

【００４６】

【数１】ΔＷ（ｔ）＝η（ｔｅａｃｈ−Ｏ（ｔ））Ｙ’
＊Ｙ（ｔ）＋βΔＷ（ｔ−１）但し、ΔＷ（ｔ）：更新量、η：学習率、ｔｅａｃｈ：
教師信号、Ｏ（ｔ）：ファジィネット手段の出力Ｙ’：
線形関数の微分値、Ｙ（ｔ）：入力層の出力、β：慣性
係数ステップ４５０においては、全てのサンプルデータがデ
ルタルールにより計算されたと判断されるまで、ステッ
プ４１０〜４５０までの処理を繰り返す。その後、ステ
ップ４６０においては、ステップ４５０にて演算された
更新量の総和をΔＷijとし、新たな結合荷重係数Ｗij’
→Ｗij＋ΔＷijとして、結合荷重係数Ｗijを変更する。
なお、このような結合荷重係数Ｗijの変更の仕方をＥｐ
ｏｃｈモードといい、このＥｐｏｃｈ学習モードは、学
習の収束が確実に保証されている点で優れている。

【００４７】次に、ステップ４７０においては、以下に
説明する判断条件に基づいて、結合荷重係数Ｗijの更新
動作を終了し、その終了した時点の結合荷重係数Ｗij
を、手書サインを入力したユーザの結合荷重係数Ｗijと
して認識する。なお、終了する時の判断の基準は、新た
に結合荷重係数Ｗijを変更し、全てのデータが出力層２
１１から出力されたとき、正例に対応するデータ値の最
小値が、負例に対応するデータ値の最大値より、大きい
と判断された時を基準としている。つまり、結合荷重係
数Ｗijが変更され、更新されていく過程で、正例に対応
する出力及び負例に対応する出力の分布が、徐々に分か
れていき、上記基準を満たしたとき境界を持つことを意
味し、学習を終了する。即ち、こうした境界ができたと
きの結合荷重係数Ｗijが、正例及び負例を分けるときの
最適な結合荷重係数Ｗijであり、この最適な結合荷重係
数Ｗijが認識された時点で学習を終了する。

【００４８】ステップ４８０においては、こうして学習
が終了したときの結合荷重係数Ｗijを、第２の記憶手段
２１４に記憶させる。以上の処理が、ファジィネット手
段２０９の詳細な作動である。（２）認識モード次に、認識処理の作動について説明する。図８は、その
認識処理の作動を示すフローチャートである。

【００４９】まず、ステップ５００においては、学習時
と同様にユーザが入力手段２１７からＩＤ（個人認識）
コードを入力し、これにより、ＩＤ入力手段２１７から
出力されるＩＤコード信号を取り込む。ステップ５１０
においては、ステップ５００にて入力されたＩＤコード
に対応する結合荷重係数Ｗijを、第２の記憶手段２１４
から引出し、同結合荷重係数Ｗijをファジィネット手段
に設定する。

【００５０】ステップ５２０においては、出力層２１１
に設定されている内部関数を、線形関数（Ｙ＝αＸ）か
らシグモイド関数等の非線形関数に置き換える。このと
き、シグモイド関数の置き換え方としては、図９（ａ）
に示されるように、シグモイド関数の中心を学習時にお
ける正例データの出力値の最小値ｏ１と負例データの出
力値の最大値ｏ２との中点（（ｏ１＋ｏ２）／２）をあ
てはめる方法を使います。こうして認識の準備が整っ
たらステップ５３０に移行し、このステップ５３０にお
いては、ユーザが入力した手書サインを、入力手段２０
２から取り込む。

【００５１】ステップ５４０においては、入力手段２０
２から取り込んだ手書データを特徴抽出手段２０３に入
力し、この入力した手書データから特徴部分を抽出させ
る。なお、この特徴抽出手段２０３の作動は、前述した
学習時の作用と同一のものである。ステップ５５０にお
いては、特徴抽出手段２０３によって抽出されたサイン
の特徴要素を、切換手段２１８を切り換えることによっ
て、ファジィネット手段２０９に取り込ませる。ここ
で、ファジィネット手段２０９は、認識時の場合、ファ
ジィ推論部２１０（ファジィ推論器３０１、乗算器３０
２、加算手段３０３）と出力層２１１とから構成され、
係数積算部２１３と比較部２１２とは使用しない。そし
て、ファジィネット手段２０９に入力されたサインの特
徴要素は、ファジィ推論器３０１に入力され、手書サイ
ンの特徴手書データがファジィ推論機能によってＢｉ
ｇ，Ｓｍａｌｌの２つのグループに分けられ、前述した
学習時の場合と同様に、同一人物でも書く度に微妙に異
なる手書サインのブレが吸収される。次に、乗算手段３
０２によって、ファジィ推論器３０１からの出力は、第
２の記憶手段２１４から取り出した結合荷重係数Ｗijと
掛け合わされ、加算手段３０３でその総和が演算され
る。そして、加算手段３０３にて演算された総和は、出
力層２１１に設定された内部関数により演算が施され
る。なお、出力層２１１に設定された内部関数は、数式
２に示されるようなシグモイド関数であり、図９（ａ）
に示される非線形関数である。

【００５２】

【数２】Ｏ＝１／（１＋ｅ^-s）但し、Ｏ：出力、ｓ：入力上記シグモイド関数によれば、入力Ｓが大きいほど出力
Ｏは、１に近い値を取ることになる。したがって、サイ
ンの特徴手書データが入力され、それが正例として学習
されたものと近似であれば、ファジィネット手段２０９
からは１に近い値が出力され、それは、より真に近いこ
とを意味し、一方、負例として学習されたものと近似で
あれば、ファジィネット手段２０９からは０に近い値が
出力され、それはより偽に近いことを意味する。なお、
上記シグモイド関数の代わりに、図９（ｂ）に示すよう
な、シグモイド関数を直線で近似、あるいは補間したよ
うな関数で置き換えてもよい。

【００５３】こうして、ステップ５６０においては、フ
ァジィネット手段２０９で認識された結果を示す信号
が、表示手段２１６に伝達され、その真偽の結果やその
度合い等が表示されることで、サイン認識の処理動作を
終了する。なお、本実施例においては、２層のＰｅｒｃ
ｅｐｔｒｏｎ構成のニューラルネットを採用したが、こ
れに限るものでなく、例えば、３層のＢＰ（バックプロ
パゲーション）モデル等を採用しても良い。

【００５４】また、結合荷重係数Ｗijの更新について、
本実施例においては、Ｅｐｏｃｈモードを使用したが、
例えばＰａｔｔｅｒｎモードを使用しても良い。但し、
本実施例のように、学習の収束が保証されている点で
は、Ｅｐｏｃｈモードを使用することが望ましい。さら
に、ファジィ推論器３０１は、２つ以上のルールを保有
してもよい。

【図面の簡単な説明】

【図１】本発明の一実施例を示すブロック構成図であ
る。

【図２】図１に示すファジィ推論部の詳細なブロック構
成図である。

【図３】上記一実施例において学習時の作動を示すフロ
ーチャートである。

【図４】図１に示す特徴抽出手段の作動を示すフローチ
ャートである。

【図５】（ａ）及び（ｂ）は、特徴要素を抽出する方法
を示す説明図である。

【図６】図１に示すサンプル発生手段の作動を示すフロ
ーチャートである。

【図７】図１に示すファジィネット手段の作動を示すフ
ローチャートである。

【図８】上記一実施例において認識時の作動を示すフロ
ーチャートである。

【図９】（ａ）は図１に示すファジィネット手段の出力
層に設定されたシグモイド関数であり、（ｂ）は（ａ）
に示すシグモイド関数を直線で近似した関数である。

【図１０】従来技術を示すブロック構成図である。

【符号の説明】

２０２入力手段２０３特徴抽出手段２０４サンプル発生手段２０５ファジィネット手段２１５学習制御手段

Claims

【特許請求の範囲】

【請求項１】手書された手書サインを取り込み、この
取り込んだ手書サインに対応した手書データを出力する
入力手段と、この入力手段から出力された前記手書データから特徴を
抽出し、その抽出した特徴から特徴手書データを出力す
る特徴抽出手段と、前記特徴手書データを取り込み、この取り込んだ特徴手
書データに対し、各々異なる所定係数を掛け合わせるこ
とによって、本人の真の手書サインに相当する真のサン
プルデータ及び本人の真の手書サイン以外に相当する偽
のサンプルデータをそれぞれ複数生成するサンプル発生
手段と、本人の真の手書サインであるか否かに対応して教師信号
を出力する学習制御手段と、前記サンプル発生手段で複数生成された前記サンプルデ
ータを取り込み、このサンプルデータと前記教師信号と
を比較することで、より好ましい結合荷重係数を学習
し、この学習によって決定した結合荷重係数に基づい
て、新たに入力された手書サインの特徴手書データが、
前記本人の真の手書サインであるか否かを判断するニュ
ーラルネット手段と、を備えたことを特徴とするサイン認識装置。
【請求項２】前記サンプル発生手段は、前記各々異なる所定係数を形成する乱数を発生する乱数
発生手段と、この乱数発生手段で発生した乱数を選択する選択手段
と、前記特徴手書データを取り込む手段と、この取り込まれた特徴手書データと前記選択手段にて選
択された乱数とを掛け合わせることによって、前記複数
のサンプルデータを生成する掛け算手段と、を備えたことを特徴とする請求項１記載のサイン認識装
置。
【請求項３】前記選択手段は、前記真のサンプルデー
タを生成するための設定値及び前記偽のサンプルデータ
を生成するための設定値がそれぞれ設定されており、前
記学習制御手段からの教師信号に基づいて、いずれか一
方の設定値を判定し、この判定した設定値にしたがって
前記乱数を選択することを特徴とする請求項２記載のサ
イン認識装置。
【請求項４】前記サンプル発生手段は、前記掛け算手
段にて掛け合わせた結果を一時的に記憶する第１の記憶
手段を備えたことを特徴とする請求項２記載のサイン認
識装置。
【請求項５】前記ニューラルネット手段は、２層パー
セプトロン構成であることを特徴とする請求項１記載の
サイン認識装置。
【請求項６】前記ニューラルネット手段は、前記サンプルデータを所定の内部関数に基づいて演算す
る出力層を有し、前記学習を行う場合には、前記出力層
の前記内部関数を線形関数として、前記結合荷重係数を
学習して決定し、前記新たに入力された手書サインの特
徴データが、前記本人の真のサインであるか否かを判断
する場合には、前記出力層の前記内部関数を非線形関数
に切り換えることを特徴とする請求項１記載のサイン認
識装置。
【請求項７】前記非線形関数は、シグモイド関数が設
定されていることを特徴とする請求項６記載のサイン認
識装置。
【請求項８】前記ニューラルネット手段と前記サンプ
ル発生手段との間には、前記サンプル発生手段で生成さ
れた前記複数の前記サンプルデータを取り込んで、ファ
ジィ推論処理を行うファジィ推論部を備えたことを特徴
とするサイン認識装置。
【請求項９】前記特徴抽出手段から出力された前記特
徴データが、前記サンプル発生手段および前記ニューラ
ルネット手段のいずれか一方に入力されるように切り換
える切換手段を、前記特徴抽出手段と前記サンプル発生
手段並びに前記ニューラルネット手段との間に備えるこ
とを特徴とする請求項１記載のサイン認識装置。
【請求項１０】前記新たに入力された手書サインが本
人の真の手書サインであるか否かを表示するとともに、
前記本人の真の手書サインを再生して表示する表示手段
を備えることを特徴とする請求項１記載のサイン認識装
置。
【請求項１１】手書された手書サインを取り込み、こ
の取り込んだ手書サインに対応した手書データを出力す
る入力手段と、この入力手段から出力された前記手書データから特徴手
書データを抽出し、その特徴手書データを出力する特徴
抽出手段と、本人の真の手書サイン及び真の手書サイン以外のサイン
に対応した教師信号を出力する学習制御手段と、前記特徴手書データを取込み、この取込んだ特徴手書デ
ータを所定の内部関数に基づいて演算する出力層を有
し、この出力層で演算されたデータと前記教師信号とを
比較することで学習し、この学習によって新たに入力さ
れた手書サインの特徴手書データが、前記本人の真の手
書サインであるか否かを判断するニューラルネット手段
と、を備えたサイン認識装置において、前記ニューラルネット手段が、前記学習を行う場合に
は、前記出力層の前記内部関数を線形関数とし、前記新
たに入力された手書サインの特徴データが前記本人の真
のサインであるか否かを判断する場合には、前記出力層
の前記内部関数を非線形関数に切り換えるように設定す
る。
【請求項１２】前記非線形関数は、シグモイド関数が
設定されていることを特徴とする請求項１１記載のサイ
ン認識装置。