JPH06162268A - サイン認識装置 - Google Patents

サイン認識装置

Info

Publication number
JPH06162268A
JPH06162268A JP31360592A JP31360592A JPH06162268A JP H06162268 A JPH06162268 A JP H06162268A JP 31360592 A JP31360592 A JP 31360592A JP 31360592 A JP31360592 A JP 31360592A JP H06162268 A JPH06162268 A JP H06162268A
Authority
JP
Japan
Prior art keywords
fuzzy
data
unit
input
signature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP31360592A
Other languages
English (en)
Inventor
Kenzo Obata
賢三 小幡
Yoshiki Uchikawa
嘉樹 内川
Takeshi Furuhashi
武 古橋
Shigeru Watanabe
成 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
NipponDenso Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NipponDenso Co Ltd filed Critical NipponDenso Co Ltd
Priority to JP31360592A priority Critical patent/JPH06162268A/ja
Publication of JPH06162268A publication Critical patent/JPH06162268A/ja
Priority to US08/311,013 priority patent/US5528699A/en
Pending legal-status Critical Current

Links

Landscapes

  • Collating Specific Patterns (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 筆者の手書きによるサインをオンライン入力
で的確に認識すること。 【構成】 ペン202を用いてタブレット203上に手
書きされると、タブレット203では、ペン202の軌
跡がX−Yデータとして出力される。P形フーリエ変換
部205では、このデータに離散フーリエ変換を実行す
ることにより、余弦波成分および正弦波成分のスペクト
ルが出力される。そして入力ファジィ部207a,20
7bでは、スペクトル選択部206a,206bを介し
たスペクトル強度をファジィ密度に各々変換する。する
と、ファジィネット部208a,208bおよび出力フ
ァジィ部209では、この変換されたファジィ密度に基
づいて、サインデータの真偽判定を行う。したがって、
筆者の筆記速度のばらつきによりスペクトルデータに変
化が生じたとしても、このスペクトル強度に対してファ
ジィ推論処理を施すことにより、上述したばらつきを吸
収して、サインを的確に認識することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はサイン認識装置に関する
ものであり、例えば端末等に接続された筆記手段を使用
してオンライン入力で筆者の手により書かれたサインを
認識するための認識装置に用いられるものである。
【0002】
【従来の技術】従来、端末等に接続された筆記手段(ペ
ン等)を使用してオンライン入力で文字を認識する装置
は、図9に示す構成から成り立っている。
【0003】すなわち図9に示すオンライン入力型の手
書き文字認識装置1は、ペン2およびタブレット3から
なる手書き入力部4を介して文字をオンラインで入力,
認識している。その具体的作動を説明すると、まず筆者
がペン2を用いてタブレット3上に文字を手書きする。
一般的には、タブレット3の入力面には文字の大きさ及
び入力位置を指す枠11が表示されており、筆者は、こ
の枠11内に収まるように文字を書くことになる。
【0004】筆者がタブレット3上に文字を手書きする
と、タブレット3では、ペン2およびタブレット3の電
磁結合により、ペン2の軌跡(連続座標データ)とペン
タッチ情報(文字が書かれている状態にあるか否かを知
らしめるデータ)とを出力する。すると、この2つのデ
ータは特徴抽出部6に入力されて、一文字の区切りがい
ずれの場所であるかが判断される。
【0005】この特徴抽出部6にて一文字ごとの連続座
標データが区別されると、認識部7に設けられた比較部
9では、辞書部10に記憶された文字ストローク座標列
データと、上記連続座標データとが逐次比較される。こ
の文字ストローク座標列データは、例えばストロークご
との相対位置,一文字を構成する複数のストロークの発
生順序,ストロークの長さや方向(ストロークベクト
ル)等を有している。
【0006】ここで、比較部9における比較処理では、
入力された文字が手書き文字である関係上、手書き文字
からなる連続座標データと文字ストローク座標列データ
とが一致するケースは少ないので、比較部9では、最も
比較誤差の少ない文字ストローク座標列データを第1候
補として出力し、以後、順次、第2候補および第3候補
を出力する。
【0007】このようにして認識部7より認識結果が順
次出力されると、出力部8では、この認識結果を各々表
示する。すると、筆者によって、手書き入力部4により
入力した文字が表示された第1候補,第2候補,および
第3候補のいずれであるかを選択されることになる。
【0008】
【発明が解決しようとする課題】ところが上述した従来
の文字認識装置は、いわゆる活字として登録可能な文字
を認識対象とするものであるため、例えば、個人差ある
いは同一人物によるものでも書くごとに微妙に文字形態
が異なるサインのような文字については、文字ストロー
ク座標列データを一義的に設定することができないた
め、文字としての認識が困難であるという問題がある。
【0009】特に、オンライン入力の文字認識装置で
は、タブレット3を設けることによって、文字の大きさ
や書込み範囲が制限されたり、筆記速度のばらつきによ
り連続座標データに誤差が生じたりするので、活字とし
て登録されておらず、しかも一般には連続的に記載され
るサインのような文字については、認識が困難であると
いう問題がある。
【0010】そこで本発明は上記問題点に鑑みてなされ
たものであり、筆者の手書きによるサインをオンライン
入力で的確に認識することが可能なサイン認識装置を提
供することを目的とするものである。
【0011】
【課題を解決するための手段】そのため本発明は、オン
ライン入力で手書きのサインを認識するサイン認識装置
であって、前記サインをオンラインで入力して、前記サ
インに対応した情報信号を出力する入力手段と、この入
力手段からの情報信号に対してP形フーリエ変換処理を
施すことによって、前記サインのスペクトル強度を検出
する検出手段と、この検出手段により検出されたスペク
トル強度に対してファジィ推論処理を行うことにより、
前記スペクトル強度をデータ圧縮した、ファジィ密度に
変換する推論手段と、この推論手段により変換された前
記ファジィ密度に基づいて前記サインの真偽を判定する
判定手段と、を備えることを特徴とするサイン認識装置
を採用するものである。
【0012】
【作用】上記構成により、推論手段は、検出手段により
検出されたスペクトル強度に対してファジィ推論処理を
行うことにより、スペクトル強度をデータ圧縮した、フ
ァジィ密度に変換している。そして、判定手段は、この
ファジィ密度に基づいてサインの真偽を判定している。
【0013】したがって、推論手段におけるファジィ推
論処理によって、スペクトル強度はファジィ推論に基づ
くルール数に圧縮することができるので、データ量とし
て膨大となるスペクトル強度のデータを圧縮することが
できる。しかも、この作動によって、筆者の筆記過程で
の筆記速度のばらつきによるデータ変化をも吸収させる
ことができる。
【0014】
【実施例】以下、本発明を図に示す実施例に基づいて説
明する。図1は本発明の一実施例を表す概略構成図であ
る。
【0015】図1において、ペン202およびタブレッ
ト203を有する手書き入力部204(入力手段に相
当)は、ペン202およびタブレット203の電磁結合
によって、ペン2の軌跡(連続座標データ)とペンタッ
チ情報(文字が書かれている状態にあるか否かを知らし
めるデータ)とを検出し、このデータをサインデータと
して出力する。なお、この手書き入力部4は、ペン20
2のタブレット203への感圧を検出する方式のもので
もよい。
【0016】検出手段に相当するP形フーリエ変換部2
05は、以下の数式1に示す平面上の連続曲線CのP表
現と呼ばれる複素数値関数ωを用いて、以下の数式2に
示す平面上の連続曲線CのP形記述子と呼ばれる複素数
値関数ωの離散フーリエ変換を実行するものである。
【0017】
【数1】
【0018】
【数2】
【0019】なお、上記数式1において、a(j)は連
続曲線Cの点z(j)における偏角関数、θ(j)は全
曲率関数である。ここで、上述した数式1をω(j)に
ついて解くと、以下の数式3となる。
【0020】
【数3】
【0021】この数式3に示されているように、P形記
述子cと複素数値関数ωとは1対1に対応しているの
で、平面上の連続曲線Cは、P形記述子cと1対1に対
応することになる。そのため、このP形フーリエ記述子
は線図形の曲りの特徴をよく抽出でき、図形の平行移
動、拡大、縮小に関して不変である。なお、上述したP
形記述子については電子通信学会論文誌( '84/3 Vol.J
67-A No.3 p.166-173 )で発表された『開曲線にも適用
できる新しいフーリエ記述子』に述べられているので、
詳細な説明については省略するものとする。
【0022】そして、上述した手書き入力部204より
出力されたサインデータに対して上記フーリエ変換を実
行することにより、P形フーリエ変換部205からは、
図3(b)に示すような余弦波成分(cos)のパワー
スペクトルと、図3(c)に示すような正弦波成分(s
in)のパワースペクトルとが出力される。なお、図3
(b)および図3(c)に示す特性図は、図3(a)に
示す「Watanabe」というサインを手書き入力部
4で入力した場合の、余弦波成分および正弦波成分のパ
ワースペクトルである。そして、この余弦波成分および
正弦波成分パワースペクトルは、以後、各々別系統で処
理される。
【0023】スペクトル選択部206aは、P形フーリ
エ変換部205より出力された正弦波成分のパワースペ
クトルから不必要なパワースペクトルを除去して、必要
なパワースペクトルのみを抽出するものであり、この実
施例では64次以上の高周波成分を除去している。これ
は、64次以上のパワースペクトルのスペクトル強度が
非常に小さいため、この64次以上の高周波成分を除去
することにより、後述する演算処理の負担を軽減してい
る。
【0024】同様に、スペクトル選択部206bは、P
形フーリエ変換部205より出力された余弦波成分のパ
ワースペクトルから不必要なパワースペクトルを除去し
て、必要なパワースペクトルのみを抽出する。
【0025】推論手段に相当する入力ファジィ部207
a,207bは、三角形(Λ型)メンバシップ関数を内
部関数に有している。そして、このメンバシップ関数を
用いたファジィ推論を行うことにより、パワースペクト
ルの正弦波成分,余弦波成分ごとに、スペクトル強度を
ファジィ密度に各々変換して、選択されたパワースペク
トルのデータを圧縮すると共に、筆記速度のばらつきに
よるパワースペクトルの変動を吸収するためのものであ
る。なお、ファジィルールは三角形のメンバシップ関数
であり、1つのルールに対して1つの出力を有してい
る。このため、パワースペクトルのデータ数は、用意さ
れた複数のメンバシップ関数の数に集約される。
【0026】ファジィネット部208a,208bは、
図4に示すような2種類(Small,Big)のメン
バシップ関数と、図5に示す特性を有するシグモイド関
数Oを内部関数として有するものであり、入力ファジィ
部207a,207bにより変換されたパワースペクト
ルの正弦波成分,余弦波成分ごとのファジィ密度に対し
てさらにファジィ推論を行って、オンライン入力したサ
インデータの確からしさを出力するものである。なお、
この2種類のメンバシップ関数は、サインの筆跡におけ
る特徴の一つである線間の間隔を抽出するものであり、
同時に、このファジィネット部208a,208bにお
ける入力信号の線形化を行い、結合荷重係数の収束を保
証するものである。
【0027】学習部211a,211bは、ファジィネ
ット部208a,208bの学習時に動作するものであ
り、ファジィネット部208a,208bにおける結合
荷重係数αを設定し、学習を収束させるものである。こ
の学習部211a,211bの出力は結合荷重係数αと
してファジィネット部208a,208bに帰還されて
いる。
【0028】デファジィ部212a,212bは、結合
荷重係数αからi次の周波数成分の強度として、メンバ
シップ関数の重心c(i)、つまりスペクトル強度を求
めるためのものである。すなわち、入力ファジィ部20
7a,207bのメンバシップ関数のままではスペクト
ルの(0.0,1.0)付近の値を再生することができ
ないので、図8(a)に示す破線部分を加えた三角形型
のメンバシップ関数を生成し、結合荷重計数を掛け合わ
せたメンバシップ関数の重心c(i)を、ファジィ密度
の各パラメータ(n〜m)ごとに求めることになる。
【0029】ここで、メンバシップ関数の重心c(i)
を求める関係式は以下の数式4になる。
【0030】
【数4】c(i)=αi2/(αi1+αi2) こうして得られた各々のメンバシップ関数の重心c
(i)のデータは、P形逆フーリエ変換部213に入力
される。
【0031】P形逆フーリエ変換部213は、上述した
P形フーリエ変換部205の逆フーリエ変換を実行する
ものであり、P形フーリエ変換部205と同様に、P形
記述子による性質を備えているものである。そして、P
形逆フーリエ変換部213で変換された結果は表示部2
10に入力され、図8(c)に示す再生曲線が表示され
る。
【0032】判定手段に相当する出力ファジィ部209
は、入力ファジィ部207a,207bと同様の構成を
有するものであり、ファジィネット部208a,208
bからの出力結果(後述するシグモイド関数Oに代入し
て算出された確からしさ)に対して、出力ファジィ部2
09が有するファジィ推論を適用することにより手書き
入力部204で入力したサインデータが本物か偽物であ
るかを判別する。
【0033】この出力ファジィ部209には、ファジィ
ネット部208aより出力された、正弦波成分のパワー
スペクトルに関する確からしさと、ファジィネット部2
08bより出力された、余弦波成分のパワースペクトル
に関する確からしさという2つの入力に対して1つの出
力がなされるものである。この時、出力ファジィ部20
9では、両者の論理積を単純にとるのではなく、上述し
たように、ファジィネット部208a,208bの出力
に対して各々ファジィ推論を行い、正しいか偽りかを判
定させた後に、その出力の論理積をとっている。これに
よって、単純な論理積ではなく、正弦波成分と余弦波成
分とのバランスを考慮した結果を得ることができる。
【0034】また、上記のようにサインデータの真偽判
定にファジィ推論を適用するのは、例えばサインデータ
が本物であるという判定基準を0.9以上、偽物である
という判定基準を0.1と設定した場合、ファジィネッ
ト部208,208bからの出力結果が0.3あるいは
0.89であった場合には、わずかの数値差で真偽いず
れの判断かが行えないという状況が発生して、多少の矛
盾が生じてしまう。そのためファジィ推論を行うことに
より、閾い値的な判定を防止して、上記矛盾を極力除去
しようとする目的でサインデータの真偽判定にファジィ
推論を適用している。
【0035】表示部210は、例えばドットマトリクス
構成の液晶表示器やCRTが用いられるものであり、こ
の実施例においては、サインデータが本物であるか偽物
であるかの判定結果と共に、デファジィ部212a,2
12bおよびP形逆フーリエ変換部213の作動によっ
て、オンライン入力したサインを再生曲線として再生し
て表示する。
【0036】スイッチ214は、ファジィネット部20
8a,208bが学習モードとなっている時に、出力フ
ァジィ部209での入力サインの真偽の判断が正しいか
否かを筆者が判断して、この筆者がスイッチ214を操
作して学習部211a,211bへ伝えるものであり、
これにより、学習部211a,211bにおける結合荷
重係数αの設定変更の度合いが決定されている。
【0037】なお、上述したP形フーリエ変換部20
5、スペクトル選択部206a,206b、入力ファジ
ィ部207a,207b、ファジィネット部208a,
208b、学習部211a,211b、出力ファジィ部
209、P型逆フーリエ変換部213、およびデファジ
ィ部212a,212bは、CPU215のプログラム
により実現されている。
【0038】次に、上記構成における全体作動を説明す
る。図1において、ペン202を用いてタブレット20
3上に手書きされると、タブレット203では、ペン2
02の軌跡がX−Yデータ(ストローク座標列)として
出力され、かつペンタッチ情報がZデータとして出力さ
れる。このペンタッチ情報とは、ペン202がタブレッ
ト203に接した状態であるか否かを検出することによ
り入力可能か否かを判別するための情報であり、ペン2
02がタブレット203に接していない時に出力され
る。なお、サインの筆記中にサイン文字の不連続部分で
も同様な状態になることがあるが、その場合も同様にペ
ンタッチ情報が出力される。
【0039】また、手書き入力部204は入力を常にサ
ンプリングしており、筆記速度が早い時は少なく、遅い
時は多くのX−Yデータが出力されることになる。こう
して出力されたX−Yデータ(ストローク座標列)とZ
データ(ペンタッチ情報)とはP型フーリエ変換部20
5に入力される。そして、これ以後の処理はCPU21
5で行われる。
【0040】CPU215では、図11のCPU215
の作動を表すフローチャートに示すように、まずステッ
プS10において、数式1に示す複素数値関数ωの離散
フーリエ変換を実行することにより、余弦波成分のパワ
ースペクトルと正弦波成分のパワースペクトルとを出力
する。続いて、ステップS20では、P形フーリエ変換
部205より出力された正弦波成分および余弦波成分の
パワースペクトルから64次以上の高周波成分という不
必要なパワースペクトルを除去して、必要なパワースペ
クトルのみを抽出する。
【0041】そして、ステップS30では、ステップS
20により抽出されたパワースペクトルのスペクトル強
度をファジィ密度に各々変換する。なお、これは図1に
おける入力ファジィ部207a,207bの作動に相当
するものであるが、詳細な作動については後述する。
【0042】続くステップS40では、現在の装置の作
動が認識モードであるか学習モードであるかを図示され
ない選択部からの信号により判定しており、認識モード
である場合にはステップS90へ進み、学習モードであ
る場合にはステップS50へ進む。
【0043】ステップS40の判定で学習モードと判定
されると、ステップS50では、学習部211a,21
1bおよびファジィネット部208a,208bを各々
接続する。続いてステップS60では、ニューラルネッ
トワークによる学習制御を行って、結合荷重係数αの設
定変更を行う。これは、図1におけるファジィネット部
208a,208bおよび学習部211a,211bの
作動に相当するものであるが、詳細な作動については後
述する。
【0044】ステップS70では、この結合荷重係数α
の設定変更が収束方向、すなわち結合荷重係数αが所定
の値に固定されたか否かを判定しており、固定されてい
ない場合には上述したステップS60の処理を再度行
い、そうでない場合にはステップS80へ進む。
【0045】ステップS80では、ステップS70にて
収束したと判定された結合荷重係数αを固定値として、
後述するレジスタ313n〜313mに記憶させて、一
連の学習処理を終了させる。
【0046】一方、ステップS40で認識モードと判定
されると、ステップS90では、学習部211a,21
1bおよびファジィネット部208a,208bの接続
を遮断し、結合荷重係数αを変更しないようにする。こ
れは例えば学習ユニット307とレジスタ部313nと
を遮断しても良いし、あるいはレジスタ313nの結合
荷重係数αの書き替えを禁じるようにしてもよい。
【0047】続いて、ステップS100では、ニューラ
ルネットワークによる認識処理を行って、手書き入力部
204により入力したサインの確からしさを算出する。
これは、図1におけるファジィネット部208a,20
8bの作動に相当するものであるが、詳細な作動につい
ては後述する。
【0048】ステップS110では、ステップS100
にて算出された入力したサインの確からしさに対してフ
ァジィ推論を行って、入力したサインが正しいものか偽
りのものかを判定する。そして、ステップS120に
て、この判定結果に相当する表示信号を表示部210に
出力することにより表示部上でサインの真偽を表示させ
て、一連の認識処理を終了させる。
【0049】一方、ステップS110と平行して処理さ
れるステップS130では、手書き入力部204により
入力したサインを再生曲線として表示部210に表示せ
させるべく、結合荷重係数αからi次の周波数成分の強
度として、メンバシップ関数の重心c(i)、つまりス
ペクトル強度を求める。これは、図1におけるデファジ
ィ部212a,212bの作動に相当するものである
が、詳細な作動については後述する。
【0050】そしてステップS140では、ステップS
110で求められたスペクトル強度に対してP形逆フー
リエ変換を実行し、ステップS120にて、この変換結
果に相当する表示信号を表示部210に出力する。これ
により表示部210では、図8(c)に示すような入力
サインの再生曲線と、その入力サインの正偽判定結果と
が表示されて、一連の認識処理を終了させる。
【0051】以上述べた一連の作動が本実施例における
全体作動であるが、次に、上述した各々の詳細な作動に
ついて説明する。まず、ステップS30、すなわち入力
ファジィ部207a,207bの詳細な作動について説
明する。図12は入力ファジィ部207a,207bの
作動を示すフローチャートである。図12において、ス
テップS200では、メインルーチンにおけるステップ
S20、すなわちスペクトル選択部206a,206b
で選択されたスペクトル強度のデータを入力する。
【0052】続いて、ステップS210では、入力ファ
ジィ部207a,207b自身が内蔵する三角形メンバ
シップ関数(図10(b))を用いてスペクトル強度に
対してファジィ推論を行う。
【0053】このファジィ推論は、図10(a)〜図1
0(c)に示すように、パラメータ(Si)に対して三
角形メンバシップ関数を用いることによりX軸に対応し
た係数(gi)を求め、この係数(gi)とパラメータ
(Si)との積を各々のパラメータ(Si)ごとに算出
し、同一の三角形メンバシップ関数内で、各々を加算
(ΣSi・gi)する。この算出結果を各々の三角形メ
ンバシップ関数内ごとに行うことにより、スペクトル選
択部206a,206bで選択されたスペクトル強度
は、図10(c)に示すようなファジィ密度に変換され
る。
【0054】ここで、このファジィ推論処理は、以下に
述べる目的により行われている。すなわち、サインのよ
うに、一般に横長に書かれる手書き文字においては、特
にスペクトル強度のデータ数が著しく多くなってしまう
ので、以後の認識過程において処理速度を低下させる要
因になってしまう。さらに、スペクトル強度のデータの
特徴が微細なものである場合には、サインを行う筆者自
身が筆記過程において筆記速度に変化が生じた際、デー
タ変化が大きくなってしまって、以後の認識処理に大き
な負荷をかけてしまう可能性がある。
【0055】そこで、入力ファジィ部207a,207
bでは、1つのファジィルールに対し1つの出力が得ら
れるようにルールを設定する。そして、スペクトル選択
部206a,206bで選択された図10(a)に示す
スペクトル強度に対して、図10(b)に示す三角形メ
ンバシップ関数を用いたファジィ推論を行うことによ
り、多量のスペクトル強度のデータ数を入力ファジィ部
207a,207bにおけるファジィルールのルール数
に圧縮することができる。これにより、スペクトル強度
のデータ圧縮化を図ると共に、筆者の筆記過程での筆記
速度のばらつきによるデータ変化を吸収させたデータを
求めることができる。
【0056】そして、ステップS220では、ステップ
S210における算出結果をファジィネット部205へ
出力する。次に、ステップS60、すなわちファジィネ
ット部208a,208bおよび学習部211a,21
1bによる学習処理の詳細な作動について説明する。図
13はファジィネット部208a,208bおよび学習
部211a,211bによる学習処理の作動を示すフロ
ーチャートであり、図2はファジィネット部208a,
208bおよび学習部211a,211bの詳細な構成
を示すブロック図である。
【0057】図2および図13において、ステップS3
00では、上述した処理により入力ファジィ部207
a,207bで圧縮された、パワースペクトルのファジ
ィ密度を各々入力する。そして、ステップS310にて
レジスタ313n〜313mの各々を初期化(リセッ
ト)する。
【0058】ここで、図2に示すようにファジィネット
部208a,208bの入力層にはファジィ部301が
用意されており、続くステップS320では、入力した
ファジィ密度におけるパラメータ(n〜m)ごとに、フ
ァジィ部301に内蔵されたSmall,Bigの双方
のメンバシップ関数を用いて各々に対応した係数(g
i)を求める。
【0059】また、Small,Bigという2種類の
メンバシップ関数があるのは、サインの個人性が密度特
徴の大小いずれにあるのかを抽出するためであり、デー
タの密の部分だけでなく、粗の部分もデータとして有効
なため、粗/密の両データを有効に利用して認識を行い
たいがためである。
【0060】そして、ステップS330では、積算部3
03n〜303mにおいて双方の係数(gi)に対して
レジスタ313n〜313mに設定された結合荷重係数
αn〜αm を各々積算し、続くステップS340では各
々の積算値を加算部304にて加算する。なお、この加
算部304は、図4に示すような構成が採用されてい
る。
【0061】続いてステップS350では、この加算値
(Σ)を、以下に示す数式5および図5に示すような特
性曲線を有するシグモイド関数Oに代入して、対応する
確からしさを算出する。このシグモイド関数Oは出力部
305に内蔵されており、この関数による出力値は、図
5に示す特性図から明らかなように、0〜1の間で算出
されることになる。
【0062】
【数5】O=1/(1+exp-s) 但し、sは出力ユニットの入力の総和であり、Oはニュ
ーラルネットワークの出力である。
【0063】ここで、筆者は、入力のサインデータが本
物であるか否かの判断をスイッチ214により学習部2
11a,211bに伝送する。この際、入力したサイン
が本物である場合には、ネットワークの教示信号Tとし
て1を、偽物であれば教示信号Tとして0を伝送する。
そして、ステップS360では、この教示信号Tが入力
されたか否かを判定しており、入力された場合にはステ
ップS370へ進み、そうでない場合にはステップS3
80へ進む。
【0064】ステップS370では、差分器306によ
ってファジィネット部208a,208bの出力Oと教
示信号Tとの信号差分が取られ、この信号差分は、学習
ユニット307に入力される。すると、学習ユニット3
07の作動を示すステップS380では、公知の最急降
下法(デルタルール)を実現するように作用する。
【0065】この最急降下法とは、学習ユニット307
の出力である結合荷重係数αを、ファジィネット部20
8a,208bの出力Oと教示信号Tとの差が最小にな
るように作動するものである。本実施例では、結合荷重
係数αの初期値をすべて0として、学習を開始する。な
お、この学習の終了タイミングとしては、本物と偽物と
の例の出力誤差Eの2乗和が例えば0.1以下の時に終
了させればよい。
【0066】続いて、ステップS390では、学習ユニ
ット307により算出された結合荷重係数αn 〜αm
レジスタn〜mに設定する。これにより、例えば図7
(a)および図7(b)に示すような余弦波成分および
正弦波成分ごとの結合荷重係数の分布となる。そして、
図11に示すメインルーチンへリターンする。
【0067】なお、図2に示すように、ファジィネット
部208a,208bでは、特に入力層300と出力層
(出力部305)からなる2層パーセプトロン構成のネ
ットワークを使用している。これは、後述するデファジ
ィ部212a,212bで行われる、結合荷重係数αか
らスペクトル強度を求める過程を容易に行うことを目的
として上記構成を採用している。すなわち、2層パーセ
プトロン構成とすることにより結合荷重係数は1次元的
に設定されて、多数の結合荷重係数による相関関係を考
慮しなくてもよくなるため、この結合荷重係数からスペ
クトル強度を容易に求めることができる。
【0068】次に、ステップS100、すなわちファジ
ィネット部208a,208bによる認識処理の詳細な
作動について説明する。図14は、ファジィネット部2
08a,208bによる認識処理の作動を示すフローチ
ャートである。
【0069】図2および図14において、ステップS4
00では、上述した処理により入力ファジィ部207
a,207bで圧縮されたファジィ密度を各々入力す
る。ここで、図2に示すようにファジィネット部208
a,208bの入力層にはファジィ部301が用意され
ており、続くステップS410では、入力したファジィ
密度におけるパラメータ(n〜m)ごとに、ファジィ部
301に内蔵されたSmall,Bigの双方のメンバ
シップ関数を用いて各々に対応した係数(gi)を求め
ている。なお、Small,Bigという2種類のメン
バシップ関数があるのは、サインの個人性が密度特徴の
大小いずれにあるのかを抽出するためであり、データの
密の部分だけでなく、粗の部分もデータとして有効なた
め、粗/密の両データを有効に利用して認識を行いたい
がためである。
【0070】そして、ステップS420では、積算部3
03n〜303mにおいて双方の係数(gi)に対して
レジスタ313n〜313mに設定された結合荷重係数
αn〜αm (上述した学習制御により固定された結合荷
重係数)を各々積算し、続くステップS330では、各
々の積算値を加算部304にて加算する。なお、この加
算部は、図6に示すような構成が採用されている。
【0071】続いてステップS440では、この加算値
(Σ)を、数式5および図5に示すような特性曲線を有
するシグモイド関数Oに代入して、対応する確からしさ
を算出する。なお、このシグモイド関数Oは、出力部3
05に内蔵されている。そして、図11に示すメインル
ーチンへリターンする。
【0072】次に、ステップS130、すなわちデファ
ジィ212a,212bの詳細な作動について説明す
る。図15はデファジィ212a,212bの作動を示
すフローチャートである。
【0073】図15において、ステップS500では、
ファジィ密度のパラメータ(n)に対応した結合荷重係
数αi1,αi2(Small,Bigという2種類のメン
バシップ関数に対応した結合荷重係数)をレジスタ31
3n〜313mより各々読出す。そして、ステップS5
10では、図8(b)に示すように、各パラメータごと
に結合荷重係数αi1,αi2およびSmall,Bigと
いう2種類のメンバシップ関数とを掛け合わせて斜線部
に示すメンバシップ関数を生成する。
【0074】続いてステップS520では、図8(b)
に示す斜線部のメンバシップ関数の重心c(i)を算出
して、図11に示すメインルーチンへリターンする。以
上述べたように上記一実施例においては、手書きによる
サインのオンライン入力データをファジィ化することに
よって、多量のスペクトル強度のデータ数を入力ファジ
ィ部207a,207bにおけるファジィルールのルー
ル数に圧縮することができるので、スペクトル強度のデ
ータ圧縮化を図ると共に、筆者の筆記過程での筆記速度
の変化によるデータ変化を吸収させたデータを求めるこ
とができる。
【0075】さらに、得られたデータをもとにファジィ
ネットの学習機能を利用して認識処理を行うため、良好
な認識精度を得ることができる。また、手書き入力した
サインを再生曲線として表示する際、結合荷重係数αか
ら容易にスペクトル強度が求められるように、ファジィ
ネット部208a,208bの構成を2層パーセプトロ
ン構成として、結合荷重係数αを1次元化して、スペク
トル強度を容易に求めることができる。そして、ファジ
ィネット部208a,208bより出力されたサインの
確からしさに対してさらにファジィ処理を行うことによ
り、より確度の高い認識結果を得ることができる。
【0076】次に、他の実施例について説明する。上記
一実施例では、手書きサインを一筆書きで行うという前
提であったが、これはサインの区切りを明確にするため
であり、現実には筆記中にペン202はタブレット20
3から浮き上がってしまうことがある。この場合は、ペ
ンタッチ情報Zを監視し、ペンタッチ情報に関する信号
がオフになっている時間が短ければサインの筆記途中と
判断でき、長ければサイン終了であると判断できる。な
お、このペンタッチ情報に関する信号がオフの時間が短
ければ、サインの筆記途中であるという判断ができるの
で、この短いオフ時間の発生タイミングを個人性情報の
一つとして利用してもよい。
【0077】また、手書き入力部204は、上述したサ
イン認識装置に一体型である必要はなく、例えば遠隔地
でテレライティングのようなもので手書きサインデータ
をオンラインかつリアルタイムで読み込む装置に使用し
てもよい。
【0078】さらに、上記一実施例におけるファジィネ
ット部205のメンバシップ関数では、2種類(Sma
ll,Big)用意したが、ここでのメンバシップ関
数、つまりはファジィルール数は多いほどより判別能力
が高めることができる。
【0079】また、ファジィルールのメンバシップ関数
は三角形形状のものである必要はないが、上記実施例の
ような2層パーセプトロン構成のニューラルネットワー
クの場合、学習機能を保証するにはニューラルネットワ
ークの入力層のファジィ部を線形化手段として機能させ
る必要がある。
【0080】
【発明の効果】以上述べたように本発明においては、デ
ータ量として膨大となるスペクトル強度のデータを圧縮
することができるばかりでなく、筆者の筆記過程での筆
記速度のばらつきによるデータ変化をも吸収させること
ができるので、手書き、しかも書く文字が個人差あるい
は同一人物によるものでも書くごとに微妙に文字形態が
異なるようなサインであっても、推論手段でのファジィ
推論処理によるデータ圧縮によって、的確に手書きによ
るサインを認識し易いサインデータを得ることができる
という優れた効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を表す概略構成図である。
【図2】ファジィネット部および学習部の詳細な構成を
示すブロック図である。
【図3】P形フーリエ変換部より出力されるパワースペ
クトルの一例を説明するための説明図である。
【図4】上記ファジィネット部が有するメンバシップ関
数を示す特性図である。
【図5】上記ファジィネット部が有するシグモイド関数
Oの特性曲線を示す特性図である。
【図6】加算部の具体的構成を表す回路図である。
【図7】レジスタに記憶された、正弦波成分および余弦
波成分のパワースペクトルの結合荷重係数の分布を示す
分布図である。
【図8】デファジィ部で行われる、結合荷重係数よりス
ペクトル強度を算出する算出過程を説明するための説明
図である。
【図9】従来のオンライン入力式文字認識装置の概略構
成を示すブロック図である。
【図10】入力ファジィ部で行われるファジィ推論の処
理過程を説明するための説明図である。
【図11】CPUの作動を示すフローチャートである。
【図12】入力ファジィ部の作動を示すフローチャート
である。
【図13】ファジィネット部および学習部による学習処
理の作動を示すフローチャートである。
【図14】ファジィネットによる認識処理の作動を示す
フローチャートである。
【図15】デファジィ部によるスペクトル強度算出処理
の作動を示すフローチャートである。
【符号の説明】
204 手書き入力部 205 P形フーリエ変換部 207a,207b 入力ファジィ部 208a,208b ファジィネット部 209 出力ファジィ部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 オンライン入力で手書きのサインを認識
    するサイン認識装置であって、 前記サインをオンラインで入力して、前記サインに対応
    した情報信号を出力する入力手段と、 この入力手段からの情報信号に対してP形フーリエ変換
    処理を施すことによって、前記サインのスペクトル強度
    を検出する検出手段と、 この検出手段により検出されたスペクトル強度に対して
    ファジィ推論処理を行うことにより、前記スペクトル強
    度をデータ圧縮した、ファジィ密度に変換する推論手段
    と、 この推論手段により変換された前記ファジィ密度に基づ
    いて前記サインの真偽を判定する判定手段と、 を備えることを特徴とするサイン認識装置。
JP31360592A 1992-11-24 1992-11-24 サイン認識装置 Pending JPH06162268A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP31360592A JPH06162268A (ja) 1992-11-24 1992-11-24 サイン認識装置
US08/311,013 US5528699A (en) 1992-11-24 1994-09-23 Information medium recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31360592A JPH06162268A (ja) 1992-11-24 1992-11-24 サイン認識装置

Publications (1)

Publication Number Publication Date
JPH06162268A true JPH06162268A (ja) 1994-06-10

Family

ID=18043334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31360592A Pending JPH06162268A (ja) 1992-11-24 1992-11-24 サイン認識装置

Country Status (1)

Country Link
JP (1) JPH06162268A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015059930A1 (en) * 2013-10-25 2015-04-30 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-baseduser authentication, handwriting data generation, and handwriting data preservation
US9235748B2 (en) 2013-11-14 2016-01-12 Wacom Co., Ltd. Dynamic handwriting verification and handwriting-based user authentication
US10032065B2 (en) 2013-10-25 2018-07-24 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015059930A1 (en) * 2013-10-25 2015-04-30 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-baseduser authentication, handwriting data generation, and handwriting data preservation
US10032065B2 (en) 2013-10-25 2018-07-24 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation
US10496872B2 (en) 2013-10-25 2019-12-03 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation
US10846510B2 (en) 2013-10-25 2020-11-24 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation
US9235748B2 (en) 2013-11-14 2016-01-12 Wacom Co., Ltd. Dynamic handwriting verification and handwriting-based user authentication
US9747491B2 (en) 2013-11-14 2017-08-29 Wacom Co., Ltd. Dynamic handwriting verification and handwriting-based user authentication

Similar Documents

Publication Publication Date Title
EP0539749B1 (en) Handwriting recognition system and method
Perwej et al. Machine recognition of hand written characters using neural networks
US7068821B2 (en) Information processing method and apparatus
CN111126482A (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
WO2022105521A1 (zh) 弯曲文本图像的文字识别方法、装置及计算机设备
Elpeltagy et al. Multi‐modality‐based Arabic sign language recognition
Panyam et al. Modeling of palm leaf character recognition system using transform based techniques
US5528699A (en) Information medium recognition device
CN115456789A (zh) 基于交易模式识别的异常交易检测方法及其系统
CN110781970A (zh) 分类器的生成方法、装置、设备及存储介质
US6694054B1 (en) Pattern recognition process
CN114565959A (zh) 基于YOLO-SD-Tiny的目标检测方法及装置
Manandhar et al. Magic layouts: Structural prior for component detection in user interface designs
JP3013618B2 (ja) サイン認識装置
Durga et al. Ensemble deep learning to classify specific types of t and i patterns in graphology
JPH06162268A (ja) サイン認識装置
Kumar et al. RWIL: robust writer identification for Indic language
CN115761332A (zh) 烟雾和火焰检测方法、装置、设备及存储介质
CN112949384B (zh) 一种基于对抗性特征提取的遥感图像场景分类方法
CN110210410B (zh) 一种基于图像特征的手写数字识别方法
CN112686882A (zh) 用于已架设在管道支撑架上的管道的稳定情况的检测方法
Foggia et al. Character recognition by geometrical moments on structural decompositions
Surat et al. Fuzzy Hough transform and an MLP with fuzzy input/output for character recognition
Zhang et al. Multi-scale image recognition strategy based on convolutional neural network
WO2022190301A1 (ja) 学習装置、学習方法、及びコンピュータ可読媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20011002