JP2937729B2 - パターン認識方法及び装置及び辞書作成方法 - Google Patents

パターン認識方法及び装置及び辞書作成方法

Info

Publication number
JP2937729B2
JP2937729B2 JP5344690A JP34469093A JP2937729B2 JP 2937729 B2 JP2937729 B2 JP 2937729B2 JP 5344690 A JP5344690 A JP 5344690A JP 34469093 A JP34469093 A JP 34469093A JP 2937729 B2 JP2937729 B2 JP 2937729B2
Authority
JP
Japan
Prior art keywords
pattern
dictionary
elements
feature
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5344690A
Other languages
English (en)
Other versions
JPH07182453A (ja
Inventor
卓夫 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BAAZU JOHO KAGAKU KENKYUSHO KK
Original Assignee
BAAZU JOHO KAGAKU KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=18371229&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2937729(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by BAAZU JOHO KAGAKU KENKYUSHO KK filed Critical BAAZU JOHO KAGAKU KENKYUSHO KK
Priority to JP5344690A priority Critical patent/JP2937729B2/ja
Priority to PCT/JP1994/002160 priority patent/WO1995017734A1/ja
Priority to KR1019950703453A priority patent/KR100242458B1/ko
Priority to US08/500,995 priority patent/US5689584A/en
Priority to EP95903008A priority patent/EP0686933A4/en
Priority to CA002156521A priority patent/CA2156521A1/en
Publication of JPH07182453A publication Critical patent/JPH07182453A/ja
Publication of JP2937729B2 publication Critical patent/JP2937729B2/ja
Application granted granted Critical
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1912Selecting the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字や各種のパターン
を認識するパターン認識方法及び装置及びパターン認識
用の辞書作成方法に関するものである。文字,数字,各
種パターン等を認識する為のパターン認識は、標準のパ
ターンを格納した辞書を用い、読取ったパターンと辞書
のパターンとを照合する方法が一般的である。従って、
認識対象とする文字,数字,各種パターン等の種類が多
くなると、それらを格納する辞書が大型化し、それに伴
って認識処理時間が長くなる問題がある。そこで、パタ
ーン認識所要時間を短縮することが要望されている。
【0002】
【従来の技術】従来例のパターン認識方法は、パターン
照合による方法と、特徴点抽出による方法等があり、パ
ターン照合による方法は、例えば、印刷文字や手書き文
字等をスキャナー等により光学的に読取り、パターン認
識用の辞書に格納された複数の標準パターンと照合し、
類似度が最大となる標準パターンの名称を、入力パター
ンの名称と判定するものである。
【0003】又特徴点抽出による方法は、例えば、文字
の各部の垂直方向と水平方向との分布や、文字素片と隣
接文字素片との関係等を文字の特徴とした辞書を作成
し、読取った文字についても同様に特徴点を求め、それ
ぞれの特徴点を比較して、類似度が最大となる特徴点に
対応する文字を、読取文字と判定するものである。
【0004】又ニューロコンピュータを用いたパターン
認識方法も知られている。このパターン認識方法は、例
えば、認識すべき文字,数字,各種パターン等の二次元
パターンを構成するドットにそれぞれ対応するニューロ
からなる入力層と、認識出力に対応するニューロからな
る出力層と、それらの間の重みづけによる接続を行う中
間層とを有し、バックプロパゲーション則等によって中
間層等の重みづけを調整し、学習完了により、入力層に
入力したパターンに対して、出力層からパターン名称等
の認識出力を出力するものである。
【0005】
【発明が解決しようとする課題】従来例のパターン照合
による認識方法は、入力パターンと、辞書に格納されて
いる標準パターンとの大きさや位置等を同等とする為の
前処理を必要とし、且つ入力パターンと辞書に格納され
ている全標準パターンとを照合する必要があり、従っ
て、前処理と照合処理とに要する時間が長くなる欠点が
あった。又特徴点抽出による認識方法は、認識すべき文
字の総ての特徴点について比較する必要があり、又文
字,数字,各種パターンのそれぞれに対する特徴点は膨
大となるから、辞書が大型化する問題があり、又それに
よって、認識処理時間が長くなる欠点があった。
【0006】又文字,数字等の場合は、標準パターンと
共に、ゴシック体やイタリック体等を混在している場合
には、各文字種毎にパターン照合或いは特徴点の抽出,
比較を行う必要があり、同一文字名に対して文字種に対
応する倍数の照合,比較等の処理が増加するから、認識
に要する時間が長くなる欠点があった。又逐次比較を行
う代わりに、大分類を行って認識すべきパターン種類を
絞り込むことが考えられているが、認識率を低下させな
いように大分類を行う為の最適手段が実現されていな
い。又ニューロコンピュータを用いたパターン認識方法
は、学習を10〜数1000回繰り返す必要があり、且
つ認識可能のパターン数も少ないので、現在は実用化さ
れていない。本発明は、辞書作成時間を短縮し、多数の
文字種が混在するような場合でも認識処理を容易とし、
且つ認識率の向上を図ることを目的とする。
【0007】
【課題を解決するための手段】本発明のパターン認識方
法及び装置及び辞書作成方法は、図1を参照して説明す
ると、(1)パターン入力部1からの入力パターンを、
辞書2を参照してパターン認識処理部3により認識する
パターン認識方法に於いて、辞書2は、手本パターン対
応にN個の要素からなる特徴ベクトルを求め、この特徴
ベクトルのN個の要素の上位又は下位から順に選択組合
せを行って、1個〜(N−1)個の要素からなる特徴集
合を形成し、この特徴集合と文字名,数字名,各種パタ
ーン名等のカテゴリー名とを対応させた構成を有し、パ
ターン認識処理部3は、パターン入力部1からの入力パ
ターンについて、N個の要素からなる特徴ベクトルを求
め、この特徴ベクトルのN個の要素の上位又は下位から
順に選択組合せ行って、1個〜(N−1)個の要素か
らなる特徴集合を形成した後、この特徴集合と辞書2の
特徴集合との類似度をカテゴリー名対応に求め、この類
似度が最大となるカテゴリー名を、入力パターンのカテ
ゴリー名と判定するものである。
【0008】(2)又パターン認識装置は、パターンを
格納したメモリ或いはパターンの走査読取りを行うパタ
ーン入力部1と、文字名,数字名,各種パターン名等の
カテゴリー名のそれぞれに対して単一又は複数の手本パ
ターンを基に、各手本パターン対応に複数の要素からな
る特徴ベクトルを求め、この特徴ベクトルの複数の要素
の中の上位又は下位から順に選択組合せを行って特徴集
合を形成し、この特徴集合とカテゴリー名とを対応させ
てメモリに格納したパターン認識用の辞書2と、パター
ン入力部1からの入力パターンについて、複数の要素か
らなる特徴ベクトルを求め、この特徴ベクトルの複数の
要素の中の上位又は下位から順に選択組合せを行って特
徴集合を形成し、この特徴集合と、辞書2の特徴集合と
の類似度をカテゴリー名対応に求め、類似度が最大とな
るカテゴリー名を、パターン入力部1からの入力パター
ンのカテゴリー名と判定するパターン認識処理部3とを
備えている。
【0009】(3)又パターン認識用の辞書作成方法
は、パターン入力部1からの入力パターンをパターン認
識処理部3により認識する為の辞書2を作成する方法に
於いて、手本パターンよりN個の要素からなる特徴ベク
トルを求め、この特徴ベクトルのN個の要素の中の上位
又は下位から順に、上位又は下位の要素を含めて1個,
2個,・・・N−1個の要素の組合せからなる特徴集合
を形成し、この特徴集合と手本パターンのカテゴリー名
とを対応させてメモリに格納する処理を含むものであ
る。
【0010】(4)又パターン認識用の辞書作成方法
は、手本パターンの認識対象領域をN個の等面積に分割
し、このN個の分割領域に領域番号を付与し、このN個
の分割領域内のドットの値を合計し、この合計した値が
大きい順に領域番号を配列して特徴ベクトルとし、この
特徴ベクトルのN個の要素を構成する領域番号を、上位
又は下位から順に、上位又は下位を含めて1個,2個,
・・・N−1個の要素の組合せから特徴集合を形成し、
この特徴集合と手本パターンのカテゴリー名とを対応さ
せてメモリに格納する処理を含むものである。
【0011】(5)又パターン認識用の辞書作成方法
は、手本パターンの認識対象領域を、それぞれドット
の合計同一となるようにN個に分割して領域番号を付
与し、このN個の分割領域の面積が大きい順に前記領域
番号を配列して特徴ベクトルとし、この特徴ベクトルの
N個の要素を構成する領域番号を、上位又は下位から順
に、上位又は下位の要素を含めて1個〜(N−1)個の
要素の組合せからなる特徴集合を形成し、この特徴集合
と手本パターンのカテゴリー名とを対応させてメモリに
格納する処理を含むものである。
【0012】
【作用】
(1)パターン認識用の辞書2は、手本パターン対応に
N個の要素からなる特徴ベクトルを求め、その特徴ベク
トルのN個の要素を上位から順に配列し、例えば、最上
位の要素を1個、次にその最上位の要素と次の要素との
2個、次に、最上位の要素と次の要素と更にその次の要
素との3個、次に、それらを含めて次の要素の4個とい
うように、N−1個の要素の組合せを求めて特徴集合と
し、この特徴集合とカテゴリー名とを対応させて格納し
たものである。この場合、図1に於ける例として、特徴
集合{1,3}はカテゴリー名A,Bに対応し、特徴集
合{1,3,4}はカテゴリー名A,C,Dに対応する
ような場合を示している。又パターン認識処理部3は、
パターン入力部1からの入力パターンについて、辞書2
を作成する手順と同様にして特徴集合を求め、この特徴
集合と、辞書2の特徴集合との類似度をカテゴリー名対
応に求める。例えば、入力パターンの特徴集合が、
{1,3},{1,3,4},・・・・の場合、図示の
辞書2の特徴集合とカテゴリー名対応に類似度を求める
と、カテゴリー名Aの類似度が最大となる。そして、類
似度が最大となるカテゴリー名を入力パターンのカテゴ
リー名と判定する。
【0013】(2)パターン認識装置は、パターン入力
部1と、辞書2と、パターン認識処理部3とを有し、パ
ターン入力部1は、パターンを格納したメモリや光学的
にパターンを読取るスキャナー等により構成されてい
る。又パターン認識用の辞書2は、手本パターンから求
めた特徴集合とカテゴリー名と対応させてメモリに格納
した構成を有する。又パターン認識処理部3は、マイク
ロプロセッサ等の演算処理機能を用いて、パターン入力
部1からの入力パターンを、辞書2の作成時と同様な処
理によって特徴集合を求め、この入力パターンの特徴集
合と辞書2に格納された特徴集合との類似度をカテゴリ
ー名対応に求め、類似度が最大となるカテゴリー名を入
力パターンのカテゴリー名とする処理を行うものであ
る。
【0014】(3)又辞書作成方法は、先ず、手本パタ
ーンよりN個の要素からなる特徴ベクトルを求める。例
えば手本パターンの認識領域をN個に分割し、N個の
分割領域に対応した要素からなる特徴ベクトルを求め
る。このN個の要素の中の例えば、上位から順に配列す
る。そして、最上位の要素を1個,この最上位の要素と
次の要素との2個,これを含み,次の要素との3個とい
うように、N−1個の要素の組合せからなる特徴集合を
形成する。この特徴集合と本パターンのカテゴリー名と
を対応させてメモリに格納する。
【0015】(4)又辞書作成方法は、手本パターンの
認識領域を等面積にN個に分割し、分割領域内のドット
数(白地に黒のパターンの場合、黒ドット数)又は重み
づけした値を合計する。又分割領域に領域番号を付与す
る。そして、合計した値の大きいものから順に領域番号
を配列する。このN個の領域番号の配列から、上位又は
下位から順に、1個〜N−1個の要素の組合せを形成し
て特徴集合とする。又例えば、同一文字についての手書
き文字,印刷文字等の複数の文字種について手本パター
ンとすることもできる。即ち、1個のカテゴリー名につ
いて複数の手本パターンから特徴集合を求めて格納する
ことができる。
【0016】(5)又辞書作成方法は、手本パターンの
認識領域内のドット数又はドット重みづけした値を合
計し、その合計した値が同一の面積となるようにN個に
分割する。この場合、白の多い部分は大きい面積とな
り、又黒の多い部分は小さい面積となる。或いは、重み
づけの大きいドットが多く含まれる部分は小さい面積と
なる。そして、分割領域に領域番号を付与し、面積の大
きいものから順にN個の領域番号を配列する。このN個
の領域番号の配列から、上位又は下位から順に、上位又
は下位を含めて1個,2個,・・・N−1個の領域番号
(要素)の組合せからなる特徴集合を形成する。この特
徴集合と手本パターンのカテゴリー名とを対応させてメ
モリに格納する。
【0017】
【実施例】パターン認識装置は、図1に示すように、パ
ターン入力部1と、パターン認識用の辞書2と、パター
ン認識処理部3とから構成され、パターン入力部1は、
スキャナー等によるパターンの操作読取りを可能とする
構成又は画像データ等を格納したメモリにより構成され
る。又パターン認識用の辞書2は、片仮名,平仮名,漢
字等の文字名,数字名,星印等の各種パターン名等のカ
テゴリー名とその特徴集合とを対応付けてメモリに格納
した構成を有し、同一カテゴリー名についても、複数の
文字種について手本パターンから特徴集合を求めて格納
することができる。この手本パターンの追加がない場合
は、リードオンリメモリ(ROM)によって辞書2を形
成することも可能である。又パターン認識処理部3は、
マイクロプロセッサ等の演算処理機能を用いて構成され
る。
【0018】前述のパターン認識用の辞書2は、パター
ン入力部1又は他のスキャナー等からの手本パターンに
ついて、特徴集合を求めて、文字名,数字名,パターン
名等のカテゴリー名と対応してメモリに格納したもので
あり、この特徴集合は、特徴ベクトルから求めるもので
ある。この特徴ベクトルは、手本パターンの認識領域を
等面積,等ドット数等に従ってN個に分割し、各分割領
域のドット数や面積等を要素とするか、又は手本パター
ンよりN個の他の特徴量を求めて要素とするものであ
る。この特徴ベクトルVは、 V={v1 ,v2 ,v3 ,・・・vi ,・・vN } …(1) と表すことができる。
【0019】そして、特徴ベクトルVの複数の要素V
〜V上位(最大の数)から順に、或いは下位(最小
の数)から順に選択組合せを行って、N−1個の集合に
ついて、1の順番に並べた集合の列T,T,・・
・,TN−1を特徴集合列とするものである。例えば、
(1)式が大きいものから順に要素が配列(要素の上位
から順に配列)されている場合、I=1{v}、I
=2{v,v}、I=3{v,v,v
となり、I=N−1{v,v,v,・・・,v
N−1}となる。これらの各個を特徴集合と称するもの
である。この特徴集合と手本パターンのカテゴリー名
(文字名,数字名,パターン名等)とを対応させてメモ
リに格納することにより、パターン認識用の辞書2を作
成する。
【0020】例えば、図2の(A)に示す文字「A」に
ついて、認識領域がX(ドット)×Y(ドット)の構成
の場合、縦に4等分,横に4等分すると、16個の等面
積の分割領域が形成される。そして、各分割領域に領域
番号1〜16を付与し、文字部分を黒とすると、各分割
領域内の黒ドット数を計数する。この計数値をそれぞれ
1 〜v16とすると、(1)式の特徴ベクトルVが得ら
れる。そして、v1 〜v16の大きいもの順に、順次I
(=1〜N−1)個を選び、N−1(=16−1=1
5)個の集合を求め、これをIの順番に並べた集合の列
1 〜TN-1 (=T1 〜T15)を特徴集合列とする。
【0021】この文字「A」について、領域番号1〜1
6の分割領域内の黒ドット数が大きいものから順に並べ
た時、6,7,10,11,13,16,2,3,9,
12,5,8,1,4,14,15であるとすると、特
徴集合列T1 〜T15は、 T1 ={6} T2 ={6,7} T3 ={6,7,10} T4 ={6,7,10,11} T5 ={6,7,10,11,13} : : T15={6,7,10,11,13,・・・・・・5,
8,1,4,14} となる。従って、これをカテゴリー名Aとしてメモリに
格納する。
【0022】又図2の(B)は、1文字分の黒ドット数
が同一となるように1文字分の領域を分割した場合を示
し、分割領域の面積に大小の差が生じることになる。こ
の場合、例えば、1文字分の黒ドット数を総て計数し、
合計数をZとすると、縦に4分割,横に5分割する場
合、例えば、縦方向に走査して黒ドット数を計数し、順
次加算して(Z/4)の値と同一或いは近似した値とな
った時に、縦に分割した1縦分割領域が得られる。同様
に、縦方向に走査して黒ドット数を計数し、順次加算し
て(Z/4)の値と同一或いは近似した値となるよう
に、縦分割領域を順次形成する。そして、各縦分割領域
内を横方向に走査して黒ドット数を計数し、順次加算し
て〔(Z/4)/5〕の値と同一或いは近似した値とな
った時に、横にも分割した分割領域が得られる。これを
繰り返すことにより、黒ドット数が同一の分割領域を得
ることができる。そして、分割領域に番号1〜20を付
し、その番号1〜20の分割領域の面積をそれぞれv
〜v20とすると、(1)式の特徴ベクトルVが得られ
る。そして、面積の大きいものから順に(上位のものか
ら順に)、或いは、面積の小さいものから順に(下位の
ものから順に)、順次I(I=1〜N−1)個を選び、
N−1(=20−1=19)個の集合を、Iの順番に並
べた集合T〜TN−1(=T〜T19)を特徴集合
列とするものである。
【0023】又図2の(C)は、同心円と放射方向の線
とによってパターンの認識領域を分割し、分割領域内の
黒ドット数を計数し、一番外側の8個の領域について計
数値の一番大きいものの領域の番号を1とし、そこを基
準位置として順に領域番号2〜18を付与し、18個の
要素からなる特徴ベクトルを作成する。そして、上位又
は下位から順に、1個,2個,・・・17個の要素の組
合せによって特徴集合を形成することができる。これ
は、各種のパターンについて認識を行う場合に適用する
ことができる。
【0024】又図2の(A)に於いて、横のドット数を
Xとし、縦のドット数をYとしたX×Y(ドット)のパ
ターン認識領域について、 f(x,y)z ∈{0,1} …(2) と定義する。但し、0≦x<X,0≦y<Y、x,yは
整数である。従って、関数f(x,y)は格子点を表す
ことになる。
【0025】又(2)式を実数上に拡張すると、 f(x,y)R ∈{0,1} …(3) 但し、0≦x<X,0≦y<Y、x,yは実数である。
従って、関数f(x,y)は格子点間も表すことにな
る。
【0026】又点(x,y)を輪郭点とすると、その点
(x,y)の極く近くにf(x,y)≠f(x’,
y’)となる点(x’,y’)が存在する。即ち、極く
近い点(x,y),(x’,y’)についてf(x,
y)≠f(x’,y’)である点は輪郭点である。
【0027】又点(x0 ,y0 )から最も近い輪郭点ま
での距離をd(x0 ,y0 ,f)と表し、又区間〔0,
X),〔0,Y)をそれぞれnx ,ny 等分し、nx ×
y=N個の分割領域を形成し、特徴ベクトルVの要素
i を、 vi =∫∫(2・f(x,y)−1)×d(x,y,f))dxdy …(4) と表すことができる。但し、Riは長方形の分割領域
で、∫∫( )dxdyはその長方形の分割領域の面積
分を示す。又1≦i≦Nである。
【0028】又前述の(4)式の(2・f(x,y)−
1)は、f(x,y)が0又は1であるから、1の時は
1、0の時は−1となり、白から黒への輪郭点と黒から
白への輪郭点とに対して重み付けして特徴ベクトルVの
要素vi を求める場合を示すものである。そして、前述
のように、特徴ベクトルVを求め、要素vi の大きいも
のから順に、或いは小さいものから順に、順次I(=1
〜N−1)個を選び、N−1個の集合を、Iの順番に並
べた集合の列T1 〜TN-1 を特徴集合列とするものであ
る。
【0029】図3は特徴ベクトルの概要説明図であり、
(a),(b),(c)はそれぞれ次元Nを4とした特
徴ベクトルVの要素を示し、(1)〜(4)は領域番号
を示す。従って、特徴ベクトルVa,Vb,Vcは、 Va=(5000,100,200,−10) Vb=(30,29,28,27) Vc=(−3,−2,−1,−4) となる。
【0030】特徴ベクトルVaの中の大きいものから順
に、順次1〜N−1個、即ち、1個,2個,3個を選
び、特徴集合列Taを求めると、 Ta1 ={1} Ta2 ={1,3} Ta3 ={1,3,2} となる。又同様に、特徴ベクトルVbから特徴集合列T
bを求めると、 Tb1 ={1} Tb2 ={1,2} Tb3 ={1,2,3} となる。又特徴ベクトルVcから特徴集合列Tcを求め
ると、 Tc1 ={3} Tc2 ={3,2} Tc3 ={3,2,1} となる。
【0031】図4,図5は本発明の実施例の辞書作成の
フローチャートであり、特徴ベクトルVの次元数をNと
し、特徴集合テーブルTXとカテゴリー名LXとからな
る辞書のアドレスを示すカウンタCNTを最初にクリア
して「0」とする(A1)。次に、パターンファイルを
オープンし(A2)、そのファイル内が最終であるか否
かを判定する(FILE END?)(A3)。
【0032】最終でない場合は、手本パターンのパター
ンデータを1つ取り出す(A4)。そして、コード(C
ODE)には、カテゴリー名と1対1に対応する0〜L
−1の数値がセットされる。ここで、Lをカテゴリー名
数とする(A5)。そして、N個の要素からなる特徴ベ
クトルVの作成処理を行う(A6)。手本パターンの特
徴ベクトルが作成されると、Tを0とし(A7)、Iを
0とし(A8)、IがN−1に等しいか否かを判定する
(I:N−1)(A9)。
【0033】I=N−1となると、即ち、ステップ(A
17)に於いて、I+1した結果、I=N−1となる
と、ステップ(A3)に移行する。又I<N−1の場合
は、MAXJを0とし、且つJを1とし(A10)、J
がNに等しいか否かを判定する(A11)。J=Nの場
合はステップ(A15)に移行し、J<Nの場合はステ
ップ(A12)に移行する。このステップ(A12)に
於いては、特徴ベクトルVの要素V〔J〕が今までの最
大値V〔MAXJ〕と等しいか否かを判定し、V〔J〕
>V〔MAXJ〕の場合は、今回の要素V〔J〕が前回
までの最大値V〔MAXJ〕より大きいから、今回の要
素V〔J〕を最大値V〔MAXJ〕とする(A13)。
そして、J+1を次のJとし(A14)、ステップ(A
11)に移行する。
【0034】又ステップ(A15)に於いては、V〔M
AXJ〕を−1とし、1を〔MAXJ〕だけ左シフトし
て特徴集合Tとする(T+(1<<MAXJ→T)。
次のステップ(A16)に於いては、この特徴集合T
を、特徴集合テーブルTXの内容とし、又1をコードの
値だけ左シフトして、カテゴリー情報テーブルの内容と
する(1<<CODE→LX〔CNT〕)。そして、カ
ウンタの内容を+1する(CNT+1→CNT)。
【0035】次に、I+1を次のIとし(A17)、ス
テップ(A9)に移行する。即ち、特徴ベクトルVの要
素の大きい方から1個取り出し、次に特徴ベクトルVの
要素の大きい方から順に2個取り出し、次に特徴ベクト
ルVの要素の大きい方から順に3個取り出すことを順次
行い、N−1個取り出すまで行う。即ち、I=N−1と
なると、ステップ(A3)に移行する。そして、パター
ンファイル内に手本パターンが存在すれば、その中のパ
ターンデータを1つ取り出して、前述の処理を行う。
【0036】パターンファイルに格納されたパターンデ
ータについての前述の処理が終了すると、パターンファ
イルをクローズし(A18)、特徴集合TXのテーブル
とカテゴリー情報LXのテーブルとをソートし(A1
9)、それらをファイルに書き出す(A20)。以上の
処理によりパターン認識用の辞書が作成される。
【0037】図6は本発明の実施例の特徴ベクトル作成
のフローチャートであり、前述のフローチャートのステ
ップ(A6)に於ける処理の概要を示すものである。な
お、特徴ベクトル作成処理は、個々のパターン認識シス
テムの用途等応じて、各種の変形例を採用できるもの
であり、以下の実施例は、代表的特徴ベクトルの作成
処理を示す。即ち、パターンデータについて重みづけを
行うか否かを判定し(B1)、重みづけを行う場合は、
パターンデータのドットの重みづけ処理を行い(B
2)、その重みづけ処理によるドットの計測処理或いは
重みづけを行わない場合は、パターンデータのドットの
計測処理を行う(B3)。
【0038】図7乃至図11は重みづけ処理のフローチ
ャートを示し、図6のステップ(B2)に於ける処理の
一例を示す。先ず、I(認識領域内のドット位置を示
す)を0とし(C1)、入力パターンの認識領域の横の
ドット数をX、縦のドット数をYとし、I=X×Yか否
か、即ち、認識領域内の最終ドット位置か否かを判定す
る(I:X*Y)(C2)。I≧X×Yの場合はステッ
プ(C5)に移行し、I<X×Yの場合はステップ(C
3)に移行する。
【0039】ステップ(C3)に於いては、入力パター
ンP〔I〕に中間レベルを乗算して、重みづけパターン
Q〔I〕とする。この入力パターンP〔I〕は、例え
ば、白を“0”,黒を“1”としたものであり、又中間
レベルを「16」とすると、黒の“1”のドットが「1
6」の値に重みづけされる。そして、I+1を次のIと
してステップ(C2)に移行する。この初期値「16」
は、白(“0”)の領域に於いて重みづけの結果、負の
値とならないように選定すること演算処理上望ましい
ものであるが、それに限定されるものではない。
【0040】I=X×Y、即ち、全ドットについて前述
の処理が終了すると、ステップ(C5)(図8参照)に
移行し、中間レベルをJとし、Iを0、フラグを0とし
(C6)、I=X×Yか否かを判定し(C7)、I=X
×Yの場合はステップ(C19)に移行し、I<X×Y
の場合はステップ(C8)に移行する。ステップ(C
8)では、Q〔I〕=0か否かを判定し、Q〔I〕≠0
の場合はステップ(C18)に移行し、Q〔I〕=0の
場合はステップ(C9)に移行する。
【0041】ステップ(C9)では、I−X≧0か否か
を判定し、I−X<0の場合はステップ(C11)に移
行し、I−X≧0の場合はステップ(C10)に移行す
る。このステップ(C10)では、Q〔I−X〕=Jか
否かを判定し、Q〔I−X〕=Jの場合はステップ(C
17)に移行し、Q〔I−X〕≠Jの場合はステップ
(C11)に移行する。
【0042】ステップ(C11)では、I+X≧X×Y
か否かを判定し、I+X≧X×Yの場合はステップ(C
13)に移行し、I+X<X×Yの場合はステップ(C
12)に移行する。このステップ(C12)では、Q
〔I+X〕=Jか否かを判定し、Q〔I+X〕=Jの場
合はステップ(C17)に移行し、Q〔I+X〕≠Jの
場合はステップ(C13)に移行する。前述のステップ
(C9),(C10)により最上辺を識別し、ステップ
(C11),(C12)により最下辺を識別することに
なる。
【0043】又ステップ(C13)(図9参照)では、
I/Xの余りが0か否かを判定し(I%X:0)、余り
が0の場合はステップ(C15)に移行し、余りが0で
ない場合はステップ(C14)に移行する。ステップ
(C14)では、Q〔I−1〕=Jか否か(Q〔I〕の
左隣が中間レベルJと等しいか否か)を判定し、Q〔I
−1〕=Jの場合はステップ(C17)に移行し、Q
〔I−1〕≠Jの場合はステップ(C15)に移行す
る。
【0044】又ステップ(C15)では、I/Xの余り
がX−1に等しいか否かを判定し、等しい場合はステッ
プ(C18)に移行し、等しくない場合はステップ(C
16)に移行する。このステップ(C16)では、Q
〔I+1〕=Jか否か(Q〔I〕の右隣が中間レベルJ
と等しいか否か)を判定し、Q〔I+1〕=Jの場合は
ステップ(C17)に移行し、Q〔I+1〕≠Jの場合
はステップ(C18)に移行する。前述のステップ(C
13),(C14)により左辺を識別し、ステップ(C
15),(C16)により右辺を識別することになる。
【0045】又ステップ(C17)では、J−1をQ
〔I〕とし、且つフラグを“1”とする。即ち、入力パ
ターンの白,黒の境界線に隣接した白ドットの重みづけ
を、中間レベルを−1した値とすることを示す。又ステ
ップ(C18)では、I+1を次のIとして、ステップ
(C7)に移行する。又ステップ(C19)では、フラ
グが“0”か否かを判定し、フラグが“0”ならばステ
ップ(C21)に移行し、ステップ(C17)に於いて
フラグが“1”にされた場合はステップ(C20)に移
行する。このステップ(C20)では、J−1を次のJ
としてステップ(C6)に移行する。
【0046】ステップ(C21)(図10参照)では、
中間レベルをJとし、次のステップ(C22)ではXを
Iとし、フラグを“0”とする。そして、I=X×Y−
Xか否かを判定する(C23)。I=X×Y−Xの場合
はステップ(C33)に移行し、I<X×Y−Xの場合
はステップ(C24)に移行する。このステップ(C2
4)では、Q〔I〕=Jか否かを判定し、等しい場合は
ステップ(C25)に移行し、等しくない場合はステッ
プ(C32)に移行する。ステップ(C25)では、Q
〔I−X〕=Jか否か(Q〔I〕の一つ上のドットが中
間レベルJと等しいか否か)を判定し、Q〔I−X〕<
Jの場合はステップ(C32)に移行し、Q〔I−X〕
≧Jの場合はステップ(C26)に移行する。
【0047】ステップ(C26)では、Q〔I+X〕=
Jか否か(Q〔I〕の一つ下のドットが中間レベルJと
等しいか否か)を判定し、Q〔I+X〕<Jの場合はス
テップ(C32)に移行し、Q〔I+X〕≧Jの場合は
ステップ(C27)に移行する。ステップ(C27)で
は、I/Xの余りが0か否かを判定し、0の場合はステ
ップ(C32)に移行し、0でない場合はステップ(C
28)に移行する。
【0048】ステップ(C28)(図11参照)では、
Q〔I−1〕=Jか否かを判定し、Q〔I−1〕<Jの
場合はステップ(C32)に移行し、Q〔I−1〕≧J
の場合はステップ(C29)に移行する。ステップ(C
29)では、1/Xの余りがX−1か否かを判定し、等
しい場合はステップ(C32)に移行し、等しくない場
合はステップ(C30)に移行する。
【0049】ステップ(C30)では、Q〔I+1〕=
Jか否かを判定し、Q〔I+1〕<Jの場合はステップ
(C32)に移行し、Q〔I+1〕≧Jの場合はステッ
プ(C31)に移行する。ステップ(C31)では、J
+1をQ〔I〕とする。即ち、中間レベルJを「16」
とした時、次はJ=「17」とする。そして、フラグを
“1”とし、ステップ(C32)に移行する。ステップ
(C32)では、I+1=Iとして、ステップ(C2
3)に移行し、次のドットについて重みづけ処理を行
う。
【0050】又ステップ(C33)では、フラグが
“0”か否かを判定し、“0”の場合はスタートに戻
り、又“0”でない場合はJ+1をJとしてステップ
(C22)に移行する。前述の処理を繰り返すことによ
り、入力パターンP〔I〕について、白,黒の境界線か
らの距離に従って重みづけしたパターンQ〔I〕を得る
ことができる。
【0051】図12は入力パターンの説明図であり、英
字Tに相当する入力パターンP〔I〕を示すもので、
“1”は黒ドット、“0”は白ドットを示す。この入力
パターンP〔I〕を前述の重みづけ処理に於いて、最初
の中間レベルJを「16」とした時、重みづけ処理結果
は、図13に示すものとなる。即ち、入力パターンP
〔I〕の“1”の領域の境界からの距離に応じて17,
18,19の重みづけが行われ、又“0”の領域の境界
からの距離に応じて15,14,・・・7,6の重みづ
けが行われることになる。
【0052】次に特徴ベクトルを求める為に、認識領域
を複数に分割した分割領域内の黒のドット数又は重みづ
けしたドットの値の加算処理を行うもので、図14,図
15はその処理の一例を示す。先ず、Iを0とし(D
1)、IがN(N=特徴ベクトルの次元)か否かを判定
し(D2)、I=Nの場合はステップ(D5)に移行
し、I<Nの場合はステップ(D3)に移行する。
【0053】ステップ(D3)では、特徴ベクトルV
〔I〕を0とし、次のステップ(D4)では、I+1を
次のIとする。即ち、ステップ(D2),(D3),
(D4)により、特徴ベクトルV〔I〕を初期状態の0
とする。
【0054】ステップ(D5)では、Jを0とし、次の
ステップ(D6)では、J=Y×VYか否かを判定す
る。なお、VYは認識領域の縦の分割数、VXは横の分
割数を示し、従って、特徴ベクトルの次元Nは、N=V
X×VYとなる。J=Y×VYの場合はスタートに戻
り、J<Y×VYの場合は、Iを0とし(D7)、I=
X×VXか否かを判定し(D8)、I=X×VXの場合
はステップ(D11)に移行し、I<X×VXの場合は
ステップ(D9)に移行する。
【0055】ステップ(D9)では、V〔J/Y×VX
+I/X〕+Q〔J/VY×X+I/VX〕をV〔J/
Y×VX+I/X〕とする。これは、横のドット数Xを
横の分割数VXで割った時に整数とならない場合、及び
縦のドット数Yを縦の分割数VYで割った時に整数とな
らない場合について、加算する場合を考慮したものであ
る。
【0056】そして、ステップ(D10)では、I+1
を次のIとしてステップ(D8)に移行する。又ステッ
プ(D11)では、J+1を次のJとし、ステップ(D
6)に移行する。前述の処理により、分割数VX,VY
でX×Yの認識領域内を分割した分割領域のドット数又
は重みづけした値が加算される。
【0057】例えば、カテゴリー名「A」,「B」につ
いて、複数種類の印刷文字,手書き文字等のそれぞれ手
本パターンを4種類入力し、認識領域を6個に分割し
(特徴ベクトルの次元を6とし)、分割領域番号を1〜
6として、それぞれの分割領域のドット数を計数した結
果、次のようになった場合を仮定する。 領域番号 1 2 3 4 5 6 VA1=( 100, 90, 80, 70, 60, 50) VA2=( 40, 50, 45, 33, 35, 34) VA3=(1980, 12,2000, 1, 0, 2) VA4=( 96, 95, 94, 99, 98, 97) VB1=( 24, 22, 30, 32, 28, 26) VB2=( 24, 22, 64, 60, 52, 56) VB3=( 154,155, 175,174,165,164) VB4=( −60, −5, −4, −3, −2, −1)
【0058】特徴ベクトルVA1〜VA4,VB1〜V
B4から作成される特徴集合TA1〜TA4,TB1〜
TB4は、特徴ベクトルの要素の大きいものから順に、
1個,それと次の要素との2個というように、6個の要
素の中から順次要素1〜5個組み合わせるものであり、 TA1={1},{1,2},{1,2,3},{1,2,3,4},{1, 2.3.4.5} TA2={2},{2,3},{1,2,3},{1,2,3,5},{1, 2.3.5.6} TA3={3},{1,3},{1,2,3},{1,2,3,6},{1, 2.3.4.6} TA4={4},{4,5},{4,5,6},{1,4,5,6},{1, 2,4,5,6} TB1={4},{3,4},{3,4,5},{3,4,5,6},{1, 3.4.5.6} TB2={3},{3,4},{3,4,6},{3,4,5,6},{1, 3.4.5.6} TB3={3},{3,4},{3,4,5},{3,4,5,6},{2, 3.4.5.6} TB4={6},{5,6},{4,5,6},{3,4,5,6},{2, 3,4,5,6}
【0059】なお、分割領域番号1〜N(N=6)の場
合に、1個〜(N−1)個の要素の組合せを得るもの
で、この場合、1〜N個の要素による組合せとすると、
前述のTA1〜TA4は、N=6であるから、6個の要
素の組合せは、それぞれ同一の{1,2,3,4,5,
6}となる。従って、これは特徴集合としては意味をな
さないので、前述のように、1〜(N−1)個の組合せ
としているものである。そして、前述の特徴集合とカテ
ゴリー名とを対応させてメモリに格納して辞書を形成す
るものであり、図16は前述の例を用いた辞書の一例を
示す。例えば、特徴集合{3}は、カテゴリー名
「A」,「B」に共通の場合を示している。このよう
に、辞書は、手本パターンより特徴集合を作成し、カテ
ゴリー名と対応させて、特徴集合の順番に並べるもので
あり、又これらの特徴集合に対して複数のカテゴリー名
を対応させるものであるから、辞書作成に要する時間
は、手本パターン数に比例した時間で済み、辞書作成の
為の所要時間を従来例に比較して大幅に短縮することが
できる。又手本パターンを追加する時も、辞書の一部を
修正,追加するだけで済むから、簡単に追加することが
できる。又このような辞書構造を有するものであるか
ら、パターン認識処理に於ける所要時間を短縮すること
が可能となる。
【0060】図17は本発明の実施例の辞書データの説
明図であり、カテゴリー名をビット位置で表現した場合
に、前述のように、同一の特徴集合に対して、異なるカ
テゴリー名LX1 ,LX2 が対応する時、カテゴリー名
LX1 ,LX2 の論理和をとって辞書に格納するカテゴ
リー名LX’とすることができる。このような処理を行
うことにより、認識すべきカテゴリー名の個数のビット
数と特徴集合との組合せの辞書が作成されることにな
る。
【0061】従って、特徴集合TXとカテゴリー名LX
とを対応させた辞書は、例えば、TX=1は、カテゴリ
ー名LX=2(・・・0010)に対応して、この場合
は1個のカテゴリー名が対応し、TX=2は、カテゴリ
ー名LX=5(・・・0101)が対応し、“1”のビ
ット位置で示される二つのカテゴリー名が対応すること
になる。又特徴集合TXについても、前述の1〜6の要
素をそれぞれ6ビット構成のビット位置で表現すること
ができる。例えば、{3,4}は、“001100”と
表現することができる。又カテゴリー数が多く、カテゴ
リー名LXのビット数が多くなる場合は、各種のデータ
処理に適用されているデータの圧縮,復元の手段を適用
することができる。又特徴集合TXをアドレスによって
表現することができる。その場合、例えば、図17に於
けるTX=1,2,3,5,・・・1022を、アドレ
ス1,2,3,4,5,6,・・・1022として表現
し、アドレス1にはLX=2、アドレス2にはLX=5
というように格納し、又アドレス4に対するカテゴリー
名LXが無い場合は、アドレス4にはLX=0を格納す
ることができる。
【0062】図18,図19は本発明の実施例の入力パ
ターン認識処理のフローチャートであり、入力パターン
について前述の辞書作成に於ける場合と同様な特徴ベク
トルを作成する(E1)。そして、Iを0とし(E
2)、I=L(L=カテゴリー名数)か否かを判定する
(E3)。I=Lの場合はステップ(E6)に移行し、
I≠Lの場合はステップ(E4)に移行する。
【0063】ステップ(E4),(E5)によって初期
状態として辞書の特徴集合との類似度(スコア)を0と
する(0→SCORES〔I〕)。ステップ(E6)で
は、特徴集合Tを0とし、次のステップ(E7)ではI
を0とし、ステップ(E8)に移行する。ステップ(E
8)では、I=N−1か否かを判定し、I=N−1の場
合は、特徴ベクトルのN個の要素の中のN−1個につい
ての処理が終了したからスタートに戻る。又I<N−1
の場合は、ステップ(E9)に移行する。
【0064】ステップ(E8)〜(E14)により、前
述の特徴集合を求める処理と同様にして、特徴ベクトル
V〔J〕の大きいものから順に配列した状態とし、その
大きいものから順に、繰り返し1個,2個,・・・N−
1個を取り出して特徴集合Tを求める。そして、辞書サ
ーチ処理を行い(E15)、次にI+1を次のIとして
(E16)、ステップ(E8)に移行する。
【0065】図20,図21は本発明の実施例の辞書サ
ーチ処理のフローチャートを示し、前述のステップ(E
15)に於ける辞書サーチ処理の一例のフローチャート
を示す。先ず、ISTARTを0とし、且つTBLMA
XをIENDとて(F1)、初期設定する。次のステッ
プ(F2)では、ISTART=IENDか否かを判定
し、等しい場合はスタートに戻り、等しくない場合はス
テップ(F3)に移行する。
【0066】この実施例に於けるサーチ処理は2分割法
の場合を示し、(ISTART+IEND)/2をIW
とする(F3)。即ち、スタートアドレスとエンドアド
レスとの和の1/2を中間アドレスIWとした場合を示
す。そして、T=TX〔IW〕か否かを判定し(F
4)、T=TX〔IW〕の場合はステップ(F7)へ移
行し、T<TX〔IW〕の場合はステップ(F5)へ移
行し、T>TX〔IW〕の場合はステップ(F6)へ移
行する。
【0067】ステップ(F5)に於いては、IWをIE
NDとしてステップ(F2)へ移行する。又ステップ
(F6)に於いては、IW+1をISTARTとして、
ステップ(F2)へ移行する。ステップ(F7)に於い
てはIを0として、次のステップ(F8)へ移行する。
【0068】ステップ(F8)に於いては、I=Lか否
かを判定し、I=Lの場合は元に戻り、I<Lの場合は
ステップ(F9)へ移行し、LX〔IW〕と、1をIだ
け左シフトして論理積を求める(LX〔IW〕&(1<
<I))。結果が0であると、ステップ(F11)へ移
行し、結果が0でない場合はステップ(F10)へ移行
する。
【0069】ステップ(F10)に於いては、論理積が
0でない場合、スコアを+1する(SCORES〔I〕
+1→SCORES〔I〕)。そして、ステップ(F1
1)に於いてI+1とし、ステップ(F8)へ移行す
る。このステップ(F10)に於いて求めたスコアが最
大となるカテゴリーを、入力パターンに対するカテゴリ
ー名とする。
【0070】特徴集合と類似度とについて、カテゴリー
名毎の一つの手本パターンの特徴集合T1 (c) ,・・・
N-1 (c) (但し、1≦c≦L、L=カテゴリー名の総
数)を格納したパターン認識用の辞書を用い、特徴集合
1 * ,・・・TN-1 * を有する入力パターンと、c番
目のカテゴリー名の手本パターンの類似度S(c) を S(c) =〔1/(N−1)〕ΣI=1 N-1 φ(TI * ,TI (c) ) …(5) とする。但し、φ(T1 ,T2 )=0(T1 ≠T2 ),
又は1(T1 =T2 )とする。又ΣI=1 N-1 は、I=1
からI=N−1までの累算を示す。
【0071】これを、各カテゴリー名が、それぞれ異な
る書体等に対応した任意数の手本パターンの特徴集合を
持つ時、即ち、或るカテゴリー名(c)のm個の手本パ
ターンに対して、特徴集合のマトリクスは、 を有する場合、巾空間類似度として次のように定義する
ことができる。 S(c) =[1/(N-1)] ΣI=1 N-1 I × max{φ(TI * ,TiI (c) ) }m i=1 …(6) 但し、CI =定数で、通常は1とすることができる。又
iは1〜m、Iは1〜N−1の範囲を示す。
【0072】入力パターンから求めた特徴集合と、文字
認識用辞書に格納された特徴集合とについて、前述の
(6)式による巾空間類似度を計算し、最大の類似度と
なる手本パターンのカテゴリー名を、入力パターンのカ
テゴリー名と判定するものである。
【0073】例えば、未知のカテゴリー名の入力パター
ンPX1,PX2について、図16に示すパターン認識
用の辞書を用いて認識する場合、入力パターンPX1,
PX2の特徴ベクトルVX1,VX2が、 VX1=(6,888,9999,−55,77,−4
44) VX2=(25,16,34,61,52,43) であるとすると、入力パターンPX1の特徴ベクトルV
X1から作成される特徴集合は、{3},{2,3},
{2,3,5},{1,2,3,5},{1,2,3,
4,5}となり、入力パターンPX2の特徴ベクトルV
X2から作成される特徴集合は、{4},{4,5},
{4,5,6},{3,4,5,6},{1,3,4,
5,6}となる。
【0074】入力パターンPX1の特徴集合と、図16
の辞書の特徴集合とをみると、入力パターンPX1の特
徴集合{3}はカテゴリー名A,Bにリンクし、{2,
3}はA、{2,3,5}は何れにもリンクしていな
い。又{1,2,3,5}はA、{1,2,3,4,
5}はAにリンクしている。従って、前述のリンク1回
について1/5点を与えることとすると、入力パターン
PX1のカテゴリー名Aとの類似度は、4/5となり、
入力パターンPX1のカテゴリー名Bとの類似度は1/
5となる。
【0075】同様計算して、入力パターンPX2のカテ
ゴリー名Bとの類似度は3/5となり、入力パターンP
X2のカテゴリー名Bとの類似度は4/5となる。従っ
て、入力パターンPX1はカテゴリー名Aと認識し、入
力パターンPX2はカテゴリー名Bと認識するが、類似
度の順に認識候補カテゴリー名を表示することも可能で
ある。
【0076】又複数種類の類似度算出方法による類似
度、例えば、A方法とB方法とによる類似度SA(c)
SB(c) を求め、合成した類似度S(c) を、 S(c) =(SA(c) +SB(c) )(1/2) により求めることも可能である。又大分類,中分類,小
分類等の分類によって文字認識を行う場合、前述の認識
方法を任意の段階の分類に適用することも可能である。
これは、本発明が総てのカテゴリーについて類似度を算
出しているからであり、各種の応用が可能である。
【0077】
【発明の効果】以上説明したように、本発明は、パター
ン入力部1から入力した文字等の入力パターンを、パタ
ーン認識処理部3に於いてパターン認識用の辞書2を参
照して認識するものであり、入力パターンの特徴集合
と、辞書2の特徴集合との類似度を求めて、最大の類似
度のカテゴリー名を入力パターンのカテゴリー名と判定
するものであり、認識率が高いことが確認されている。
又類似度計算に於いては、辞書が特徴集合の順番に配列
し、例えば、2分割法等によってサーチすることによ
り、辞書の全部の特徴集合との間の類似度計算を行うこ
となく、その一部を参照すれば済むから、認識所要時間
を短縮できる利点がある。又類似度計算は、全カテゴリ
ー名に対して行うものであるから、パターン認識に於け
る大分類等に適用できる等の応用性にも優れている利点
がある。
【0078】実際に、ドットプリンタにより、半角文字
のアルファベットの大小52文字と、数字10文字とを
プリントアウトし、分解能300(dpi;ドット/イ
ンチ)のスキャナーにより読取って、辞書作成用の手本
パターンと、認識率測定用の入力パターンとした。その
場合、辞書に使用した文字数は62文字種×80セット
=4960文字、認識率測定用に入力した文字数は62
文字種×40セット=2480文字とした。その結果、
辞書作成に要する時間は、パーソナルコンピュータを使
用した場合、約1300秒、認識率は98.75%であ
った。この場合、大文字と小文字とが殆ど類似のパター
ンを有することにより、誤認識が生じたが、文字の大き
さの情報を入力することにより、認識率を99.75%
とすることができる。
【0079】又JIS第1水準の漢字2965文字種を
プリントアウトし、前述のスキャナーにより読取って辞
書作成用の手本パターン及び認識率測定用の入力パター
ンとした。その場合、認識率は、99.7%であった。
この場合の1文字当たりの認識所要時間は約0.14秒
であった。又0〜9及びA〜Xの手書き文字について辞
書作成及び認識率測定を行った。その場合、全文字数1
0994に対して、認識率は98.86%であった。即
ち、実用充分な認識率を得ることができた。
【0080】又パターン認識用の辞書2は、手本パター
ンよりN個の特徴量を抽出して特徴ベクトルとし、その
特徴ベクトルの要素の大きいものから或いは小さいもの
から順に、1個の要素,その要素と次の要素との2個,
その2個の要素と更に次の要素との3個というように、
N−1個の組合せを特徴集合とし、手本パターンのカテ
ゴリー名と対応させてメモリに格納するものであり、一
つの特徴集合に複数のカテゴリー名を対応させることが
できるので、手本パターン及びカテゴリー名が多数の場
合でも、辞書作成に要する時間は短くて済み、経済的に
辞書を作成することができる。更に、手本パターンを追
加する場合でも、辞書の一部を修正,追加すれば良いか
ら、簡単に追加することができる利点がある。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の実施例の特徴ベクトル抽出説明図であ
る。
【図3】特徴ベクトルの概要説明図である。
【図4】本発明の実施例の辞書作成のフローチャートで
ある。
【図5】本発明の実施例の辞書作成のフローチャートで
ある。
【図6】本発明の実施例の特徴ベクトル作成のフローチ
ャートである。
【図7】本発明の実施例の重みづけ処理のフローチャー
トである。
【図8】本発明の実施例の重みづけ処理のフローチャー
トである。
【図9】本発明の実施例の重みづけ処理のフローチャー
トである。
【図10】本発明の実施例の重みづけ処理のフローチャ
ートである。
【図11】本発明の実施例の重みづけ処理のフローチャ
ートである。
【図12】入力パターンの説明図である。
【図13】重みづけ処理後のパターンデータ説明図であ
る。
【図14】本発明の実施例の分割領域内の計測処理のフ
ローチャートである。
【図15】本発明の実施例の分割領域内の計測処理のフ
ローチャートである。
【図16】本発明の実施例のパターン認識用の辞書の説
明図である。
【図17】本発明の実施例の辞書データの説明図であ
る。
【図18】本発明の実施例の入力パターン認識処理のフ
ローチャートである。
【図19】本発明の実施例の入力パターン認識処理のフ
ローチャートである。
【図20】本発明の実施例の辞書サーチ処理のフローチ
ャートである。
【図21】本発明の実施例の辞書サーチ処理のフローチ
ャートである。
【符号の説明】
1 パターン入力部 2 パターン認識用の辞書 3 パターン認識処理部
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/46 G06K 9/62 G06T 7/00

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 パターン入力部(1)からの入力パター
    ンを、辞書(2)を参照してパターン認識処理部(3)
    により認識するパターン認識方法に於いて、 前記辞書(2)は、手本パターン対応にN個の要素から
    なる特徴ベクトルを求め、該特徴ベクトルのN個の要素
    の上位又は下位から順に選択組合せを行って、1個〜
    (N−1)個の要素からなる特徴集合を形成し、該特徴
    集合と文字名,数字名,各種パターン名等のカテゴリー
    名とを対応させた構成を有し、 前記パターン認識処理部(3)は、前記パターン入力部
    (1)からの入力パターンについて、N個の要素からな
    る特徴ベクトルを求め、該特徴ベクトルのN個の要素の
    上位又は下位から順に選択組合せを行って、1個〜(N
    −1)個の要素からなる特徴集合を形成した後、該特徴
    集合と前記辞書(2)の特徴集合との類似度を前記カテ
    ゴリー名対応に求め、該類似度が最大となるカテゴリー
    名を、前記入力パターンのカテゴリー名と判定すること
    を特徴とするパターン認識方法。
  2. 【請求項2】 パターンを格納したメモリ或いはパター
    ンの走査読取りを行うパターン入力部(1)と、 文字名,数字名,各種パターン名等のカテゴリー名のそ
    れぞれに対して単一又は複数の手本パターンを基に、各
    手本パターン対応にN個の要素からなる特徴ベクトルを
    求め、該特徴ベクトルの複数のN個の上位又は下位から
    順に選択組合せを行って、1個〜(N−1)個の要素か
    らなる特徴集合を形成し、該特徴集合と前記カテゴリー
    名とを対応させてメモリに格納したパターン認識用の辞
    書(2)と、 前記パターン入力部(1)からの入力パターンについ
    て、N個の要素からなる特徴ベクトルを求め、該特徴ベ
    クトルのN個の要素の上位又は下位から順に選択組合せ
    を行って、1個〜(N−1)個の要素からなる特徴集合
    を形成し、該特徴集合と、前記辞書(2)の特徴集合と
    の類似度を前記カテゴリー名対応に求め、該類似度が最
    大となるカテゴリー名を、前記パターン入力部(1)か
    らの入力パターンのカテゴリー名と判定するパターン認
    識処理部(3)とを備えたことを特徴とするパターン認
    識装置。
  3. 【請求項3】 パターン入力部(1)からの入力パター
    ンをパターン認識処理部(3)により認識する為の辞書
    (2)を作成する方法に於いて、 手本パターンよりN個の要素からなる特徴ベクトルを求
    め、該特徴ベクトルのN個の要素の中の上位又は下位か
    ら順に、該上位又は下位の要素を含めて1個〜(N−
    1)個の要素の組合せからなる特徴集合を形成し、該特
    徴集合と前記手本パターンのカテゴリー名とを対応させ
    てメモリに格納する処理を含むことを特徴とするパター
    ン認識用の辞書作成方法。
  4. 【請求項4】 パターン入力部(1)からの入力パター
    ンをパターン認識処理部(3)により認識する為の辞書
    (2)を作成する方法に於いて、 手本パターンの認識対象領域をN個の等面積に分割し、
    該N個の分割領域に領域番号を付与し、該N個の分割領
    域内のドットの合計を求め、該合計の値が大きい順に
    前記領域番号を配列して特徴ベクトルとし、該特徴ベク
    トルのN個の要素を構成する前記領域番号を、上位又は
    下位から順に、該上位又は下位の要素を含めて1個
    (N−1)個の要素の組合せから特徴集合を形成し、該
    特徴集合と前記手本パターンのカテゴリー名とを対応さ
    せてメモリに格納する処理を含むことを特徴とするパタ
    ーン認識用の辞書作成方法。
  5. 【請求項5】 パターン入力部(1)からの入力パター
    ンをパターン認識処理部(3)により認識する為の辞書
    (2)を作成する方法に於いて、 手本パターンの認識対象領域を、それぞれドットの合
    計が同一となるようにN個に分割して領域番号を付与
    し、該N個の分割領域の面積が大きい順に前記領域番号
    を配列して特徴ベクトルとし、該特徴ベクトルのN個の
    要素を構成する前記領域番号を、上位又は下位から順
    に、該上位又は下位の要素を含めて1個〜(N−1)
    の要素の組合せからなる特徴集合を形成し、該特徴集合
    と前記手本パターンのカテゴリー名とを対応させてメモ
    リに格納する処理を含むことを特徴とするパターン認識
    用の辞書作成方法。
JP5344690A 1993-12-21 1993-12-21 パターン認識方法及び装置及び辞書作成方法 Expired - Fee Related JP2937729B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP5344690A JP2937729B2 (ja) 1993-12-21 1993-12-21 パターン認識方法及び装置及び辞書作成方法
EP95903008A EP0686933A4 (en) 1993-12-21 1994-12-20 METHOD RECOGNIZING METHOD AND DEVICE AND METHOD FOR LEXICON COMPILATION FOR PATTERN RECOGNITION
KR1019950703453A KR100242458B1 (ko) 1993-12-21 1994-12-20 패턴인식 방법 및 장치와 패턴인식 사전을 작성하는 방법
US08/500,995 US5689584A (en) 1993-12-21 1994-12-20 Method of and apparatus for pattern recognition and method of creating pattern recognition dictionary
PCT/JP1994/002160 WO1995017734A1 (fr) 1993-12-21 1994-12-20 Procede et appareil destines a la reconnaissance de structures et procede de compilation d'un dictionnaire en vue de la reconnaissance de structures
CA002156521A CA2156521A1 (en) 1993-12-21 1994-12-20 Method and apparatus for pattern recognition, and method of creating pattern recognition dictionary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5344690A JP2937729B2 (ja) 1993-12-21 1993-12-21 パターン認識方法及び装置及び辞書作成方法

Publications (2)

Publication Number Publication Date
JPH07182453A JPH07182453A (ja) 1995-07-21
JP2937729B2 true JP2937729B2 (ja) 1999-08-23

Family

ID=18371229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5344690A Expired - Fee Related JP2937729B2 (ja) 1993-12-21 1993-12-21 パターン認識方法及び装置及び辞書作成方法

Country Status (6)

Country Link
US (1) US5689584A (ja)
EP (1) EP0686933A4 (ja)
JP (1) JP2937729B2 (ja)
KR (1) KR100242458B1 (ja)
CA (1) CA2156521A1 (ja)
WO (1) WO1995017734A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143613A (ja) * 1996-10-30 1998-05-29 Hewlett Packard Co <Hp> パタン認識方法
US6539115B2 (en) * 1997-02-12 2003-03-25 Fujitsu Limited Pattern recognition device for performing classification using a candidate table and method thereof
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
US6320985B1 (en) * 1998-07-31 2001-11-20 International Business Machines Corporation Apparatus and method for augmenting data in handwriting recognition system
JP2001160067A (ja) * 1999-09-22 2001-06-12 Ddi Corp 類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービスシステム
US7095894B2 (en) * 2002-09-04 2006-08-22 Lockheed Martin Corporation Method and computer program product for recognizing italicized text
US20050004915A1 (en) * 2003-05-21 2005-01-06 Jean-Philippe Hermand Method for generating names
EP1574988B1 (en) * 2004-03-08 2014-06-18 Siemens Product Lifecycle Management Software Inc. Determining and using geometric feature data
KR100923935B1 (ko) * 2007-11-28 2009-10-29 엔에이치엔(주) Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템
JP5789128B2 (ja) * 2011-05-26 2015-10-07 キヤノン株式会社 画像処理装置、画像データの処理方法およびプログラム
JP6033326B2 (ja) * 2011-12-12 2016-11-30 エンパイア テクノロジー ディベロップメント エルエルシー コンテンツベースの自動的な入力プロトコルの選択
US9881354B2 (en) * 2012-03-15 2018-01-30 Microsoft Technology Licensing, Llc Image completion including automatic cropping
US11423206B2 (en) * 2020-11-05 2022-08-23 Adobe Inc. Text style and emphasis suggestions

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0795335B2 (ja) * 1986-10-22 1995-10-11 株式会社リコー 領域分割方法
JPH0719277B2 (ja) * 1986-09-19 1995-03-06 アルプス電気株式会社 画像認識装置
JPH0656624B2 (ja) * 1987-03-24 1994-07-27 沖電気工業株式会社 特徴抽出方式
DE3815869A1 (de) * 1987-05-08 1988-11-17 Ricoh Kk Verfahren zum extrahieren von merkmalsmengen eines zeichens
NL8802078A (nl) * 1988-08-23 1990-03-16 Philips Nv Werkwijze voor het herkennen van een patroon in een veld met een meerwaardige amplitude, inrichting voor het uitvoeren van een dergelijke werkwijze.
US5255342A (en) * 1988-12-20 1993-10-19 Kabushiki Kaisha Toshiba Pattern recognition system and method using neural network
US5293429A (en) * 1991-08-06 1994-03-08 Ricoh Company, Ltd. System and method for automatically classifying heterogeneous business forms
US5315668A (en) * 1991-11-27 1994-05-24 The United States Of America As Represented By The Secretary Of The Air Force Offline text recognition without intraword character segmentation based on two-dimensional low frequency discrete Fourier transforms

Also Published As

Publication number Publication date
KR100242458B1 (ko) 2000-02-01
EP0686933A1 (en) 1995-12-13
WO1995017734A1 (fr) 1995-06-29
KR960701413A (ko) 1996-02-24
US5689584A (en) 1997-11-18
EP0686933A4 (en) 1997-07-02
JPH07182453A (ja) 1995-07-21
CA2156521A1 (en) 1995-06-29

Similar Documents

Publication Publication Date Title
JP2937729B2 (ja) パターン認識方法及び装置及び辞書作成方法
Gader et al. Handwritten word recognition with character and inter-character neural networks
US5438628A (en) Method for matching text images and documents using character shape codes
EP0436819B1 (en) Handwriting recognition employing pairwise discriminant measures
WO2018090011A1 (en) System and method of character recognition using fully convolutional neural networks
Hussien et al. Optical character recognition of arabic handwritten characters using neural network
Shirali-Shahreza et al. Recognition of handwritten Persian/Arabic numerals by shadow coding and an edited probabilistic neural network
JP3083562B2 (ja) 文字認識機構
WO2016181470A1 (ja) 認識装置、認識方法およびプログラム
US6859556B2 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
Cheng et al. Detecting seam-carved image by extreme learning machines using patch analysis method, jury voting, and combinatorial fusion
JPH1063789A (ja) 識別関数学習方法
JP2015170129A (ja) 認識装置、認識方法およびプログラム
JP3815934B2 (ja) 手書き文字認識装置および方法
Cutter et al. Font group identification using reconstructed fonts
JP2903779B2 (ja) 文字列認識方法及びその装置
JP2019159374A (ja) 情報処理装置及びプログラム
De Oliveira et al. Handwritten recognition with multiple classifiers for restricted lexicon
JP2866920B2 (ja) 標準パターン作成方法及び装置並びに文字認識装置及び方法
JP2639314B2 (ja) 文字認識方式
JP3281530B2 (ja) 文字認識装置
JPH10247221A (ja) オンライン文字認識装置
JP2002183668A (ja) 単語認識装置
US20180012111A1 (en) Recognition device, recognition method, and computer program product
JP2001118073A (ja) パターン認識装置及び認識方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees